法律状态公告日
法律状态信息
法律状态
2015-03-11
未缴年费专利权终止 IPC(主分类):G10L13/08 授权公告日:20110202 终止日期:20140109 申请日:20070109
专利权的终止
2011-02-02
授权
授权
2007-09-12
实质审查的生效
实质审查的生效
2007-07-18
公开
公开
(一)技术领域
本发明涉及语音信号处理技术领域,具体涉及语音合成技术中一种基于语调模型的汉语语调基频轮廓生成方法
(二)背景技术
目前,汉语语音合成方法通常采用基于大语料库的时域波形拼接语音合成技术。在这个方法中,合成语句的语音基元是从一个预先录下的、庞大的自然语音的语料库中挑选出来的,系统根据某种规则、或代价函数、或统计方法等,直接从语料库中筛选合成单元或片段来加以拼接。可以想象只要这个语料库足够大,理论上讲有可能拼接出任何语句。由于合成的语音基元都来自于自然的原始发音,或是一个音节,或是一种不定长的语言片段,如多字词或韵律短语,因此,合成后语音的清晰度和自然度都非常高。这种方法避开了对语音基元作韵律调整,基本上不用对信号作时域或频域的变换处理。然而,汉语的韵律是复杂多变的,语调也是多样化的,因此采用上述方法得到的合成语音无法满足人们的要求。与自然语音相比,这些系统合成的句子及篇章的语音自然度和可懂度相对较低,“机器味”较浓,人们听起来感觉并不是很舒服。其原因是:至今在语音合成的韵律控制方法上还没有取得令人满意的成果,从而制约了这项技术大规模地进入市场,而其中的重要问题就是语调的基频曲线无法调整,或是语调模型无法反映汉语的语调规律,等等。
(三)发明内容
本发明的目的在于提供一种从汉语的语音特征、汉语的声调与特点和汉语的语调及模式出发、进一步提高汉语语音合成自然度的基于语调模型的汉语语调基频轮廓生成方法。
本发明的目的是这样实现的:它包括以下计算机可实现的步骤:
输入标注拼音码序列;
短语单元的基频轮廓生成步骤,将输入的标注拼音码序列从头至尾依次提取韵律信息,判断是否为短语信息;如果是,则作为短语命令送入给短语控制机构,同时根据这个短语韵律信息,从韵律模板库中索引出相应的短语单元韵律模板,生成并输出短语单元的基频轮廓曲线,并保留在缓冲区中;否则继续查找短语信息;以此类推,直至将整个标注拼音码序列搜索完毕,输出短语单元的基频轮廓曲线;
音节单元的基频轮廓生成步骤,将输入的标注拼音码序列从头至尾依次提取韵律信息,判断是否为音节信息;如果是,则作为音节命令输入给音节控制机构,同时根据这个音节韵律信息,从韵律模板库中索引出相应的音节单元韵律模板,生成并输出音节单元的基频轮廓曲线,并保留在缓冲区中;否则继续查找音节信息;以此类推,直至将整个标注拼音码序列搜索完毕,输出音节单元的基频轮廓曲线;
语调基频轮廓叠加步骤,将短语控制机构送出的短语单元的基频轮廓、音节控制机构送出的音节单元的基频轮廓和基频最小值Fmin,依照汉语语调模型、按序位、幅度大小和时间长短进行对数叠加;如果判断标注拼音码序列没有处理完毕,则返回继续执行;否则,生成并输出语调基频轮廓曲线给后续的信号处理步骤。
本发明还有这样一些技术特征:
1、所述的基频轮廓曲线,其数学表达式如下: