...
首页> 外文期刊>三菱电机技报 >テキスト音声合成技術
【24h】

テキスト音声合成技術

机译:文本语音合成技术

获取原文
获取原文并翻译 | 示例
           

摘要

任意のテキストを音声に変換するテキスト音声合成技術は,運転中で目が走行方向から離せないカーナビや,ディスプレイが小さい携帯端末向けのインタフェースとして注目されている。 また,障害者や老人をIT社会における情報弱者としないためにも,ますますこの技術への要求が高まっている。 しかし,テキスト音声合成の品質は,最近の研究の蓄積によって向上しているものの,今後の本格的実用化と利用分野拡大には,更に品質向上を果たす必要がある。 このテキスト音声合成の処理の概要を図に示す。処理は言語処理と音響処理に大別される。 言語処理では,入力文から,読みの単位となるアクセント句と,その読み,アクセント位置,文の構造を抽出する。 音響処理では,まず,基本周波数(声の高さ)のパターンを規則によって生成し,個々の音素の音韻継続時間を決める。 次に,音素や音節の音響的な特徴を記憶している合成単位を接続し,合成音声を生成する。 したがって,言語処理の性能は,合成音声の読みやアクセントの正確さを決め,音響処理は,自然性,肉声感,明瞭性を決める。 このうち,音響処理の品質向上では,生成された音声の特徴がある特定の音声データに近いだけではなく,利用者の要求に応じて発話速度や抑揚のパターンなどの制御ができることが必要となる。 本稿では,聴覚特性と言語構造に着目し,自然性が高くかつ制御が容易な音韻継続時間長制御方式を中心に開発方式を説明し,今後の課題と,応用分野についての展望を述べる。
机译:文本语音合成技术用于将任意文本转换为音频的文本是吸引注意力,因为汽车导航系统不会从旅行方向和具有较小显示器的便携式终端离开眼睛。此外,对这种技术的需求正在增加,甚至避免残疾人和老年人在IT社会中弱。然而,尽管最近的研究累积的文本语音合成的质量得到了改善,但有必要进一步提高未来的全面实用性和扩展使用领域的质量。显示了本文语音合成的处理的概述。处理大致分为语言处理和声学处理。在语言过程中,从输入语句中,提取作为读取单元的插值子句,其读取,口音位置和句子的结构。在声学过程中,首先,基本频率(语音高)的模式由规则产生,并且确定单个音素的音声持续时间。接下来,连接一个复合单元,其存储音素和音节的声学特征,以产生合成语音。因此,语言处理的性能决定了合成语音的准备和口径准确性,声学过程决定了自然,肉类感和清晰度。其中,在改善声学处理的质量,不仅需要对所​​生成的音频的特性,而且还需要根据用户的请求来控制语音速度和不规则的模式。。在本文中,我们专注于听觉特性和语言结构,并解释了高度自然且易于控制的音韵持续时间控制方法,并讨论了应用领域的未来问题和前景。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号