...
首页> 外文期刊>電子情報通信学会技術研究報告. 思考と言語. Thought and Language >N-gramモデルを用いたtext-to-speechシステムに応じた入力テキスト合成手法
【24h】

N-gramモデルを用いたtext-to-speechシステムに応じた入力テキスト合成手法

机译:使用N-gram模型根据文本语音转换系统输入文本撰写方法

获取原文
获取原文并翻译 | 示例
           

摘要

TTSにおける音声合成において、自然な発話を得るためには、韻律情報が非常に重要となる。韻律合成では、複数の自立語が接続された場合のアクセント変化は複雑であり、高性能なTTSシステムを実現しようとする努力がなされている一方で、TTSシステムは与えられており、その内部には立ち入ることができない場合もある。この場合にはTTSを高性能化することはできない。そこで、本研究では与えられたTTSシステムを使うことを前提に、自然な発話の実現を目的としている。具体的には、N-gramモデルを用いた入力テキストの解析手法を参考して、入力テキストの合成手法を提案する。どれだけ自然なアクセントを有する発声を実現するかが焦点となるので、日本語の標準語に存在するアクセントルールが性能の低いTTSシステムに果たして存在するか自体が疑わしいことから、明確なルールを扱う手法ではなく、アクセント位置を確率的に扱うN-gram方式が適していると考えられる。
机译:在TTS中的语音合成中,韵律信息对于获得自然语音非常重要。在韵律合成中,连接多个独立单词时的重音变化很复杂,并且在努力实现高性能的TTS系统时,给出了TTS系统并在其内部。可能无法输入。在这种情况下,TTS的性能无法提高。因此,在这项研究中,我们旨在在使用给定的TTS系统的前提下实现自然语音。具体而言,我们参考使用N元语法模型的输入文本分析方法,提出了一种输入文本合成方法。由于关注的重点是可以实现多少自然口音,因此日语标准字词中存在的口音规则确实存在于性能低下的TTS系统中令人怀疑,因此我们将处理明确的规则。可以认为,概率地处理重音位置的N-gram方法比该方法更合适。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号