...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >任意の話者を対象とする統計的声質変換·制御法
【24h】

任意の話者を対象とする統計的声質変換·制御法

机译:任何说话者的统计语音转换和控制方法

获取原文
获取原文并翻译 | 示例
           

摘要

声質変換は,言語情報を保存したまま話者性等の非言語情報を変換する技術である.従来の統計的手法に基づく枠組みでは,入力話者と出力話者が同一内容を発声しているパラレルデータを数十文程度用いて,特定話者対を対象とした変換モデルを事前に学習する必要がある.我々は,この制約を大きく緩和する枠組みとして,任意の話者を対象とした声質変換技術の研究開発に取り組んでいる.多数の異なる話者の音声データを有効利用することで,任意の話者からある特定の話者への変換(多対一声質変換)と,ある特定の話者から任意の話者への変換(一対多声質変換)が可能となる.本報告では,これらの変換を実現する技術について紹介する.
机译:语音质量转换是一种在保留语言信息的同时转换非语言信息(例如说话者特征)的技术。在基于常规统计方法的框架中,预先使用大约数十个并行数据的句子来学习针对特定讲话者对的转换模型,其中输入讲话者和输出讲话者说出相同的内容。有必要。我们正在研究和开发适用于任意扬声器的语音质量转换技术,以此为框架来大大放松这一限制。通过有效地使用许多不同说话者的语音数据,从任何说话者到特定说话者的转换(多对一语音质量转换)以及从特定说话者到任何说话者的转换(一对多语音质量转换)是可能的。在此报告中,我们介绍了实现这些转换的技术。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号