首页> 外文期刊>電子情報通信学会技術研究報告 >パラ言語情報を表現可能な対話吉声合成のための重回帰HSMMの検討
【24h】

パラ言語情報を表現可能な対話吉声合成のための重回帰HSMMの検討

机译:可以表达副语言信息的对话语音合成的多元回归HSMM研究

获取原文
获取原文并翻译 | 示例
           

摘要

In this paper, we aim at the realization of the speech synthesis that can control paralinguistic information using multiple regression HSMM, incorporated a multiple regression model in hidden semi-Markov model(HSMM)-based speech synthesis scheme. In this study, the paralinguistic information is expressed as a coordinate on space comprised of a small number dimension and the dimensions are used as an explanation variable of the multiple regression model. Two dimensions that considered to be a general index to express emotional state for "PLEASANTNESS" and "AROUSAL" are used. When learning model, evaluated values are used subjectively for each dimensions. And when synthesize speech, we synthesize any speech that reflected emotion by giving arbitrary values. We examine the influence that two dimensions give synthesized speech with acoustic features of synthesized speech. Additionally, we have three subjective experiments for synthesized speech. First, the result of a naturally test show that synthesized speech are natural. Next, the result of a reproducibility test show that reproducibility of given emotion. Finally, the result of a emotional expression test show that synthesized speech transmit an aimed emotion.%本稿では,隠れセミマルコフモデル(HSMM)に基づく音声合成方式に重回帰モデルを組み込んだ重回帰HSMM を用いて,対話音声に見られる多様なパラ言語情報を制御可能な音声合成を目指す.本研究では,パラ言語情報を少数の次元から構成される空間上の座標として表現し,この空間を構成する次元を重回帰モデルの説明変数として用いる.次元には感情状態を表す一般的な指標とされている「快-不快」,「覚醒-睡眠」の2つの次元を用いる.モデルの学習時には各発話に対し次元毎に主観的に評価された評価値を用いて学習し,合成時には任意の評価値を与えて任意の感情状態の音声を合成する.合成された音声の音響的特徴量から,2つの次元が合成音声に与える影響について検討する.また,合成された音声に対して3つの主観評価実験を行った.まず,自然性評価を行い,合成された音声の自然性について示した.次に,再現性評価を行い,付与した感情状態の再現性について示した.最後に,感情状態の表出について評価を行い,意図した感情状態が伝達されていることを示した.
机译:在本文中,我们旨在实现能够使用多元回归HSMM控制副语言信息的语音合成,并将多元回归模型纳入基于隐藏半马尔可夫模型(HSMM)的语音合成方案中。在这项研究中,副语言信息被表示为由少量维组成的空间坐标,并且这些维用作多元回归模型的解释变量。使用被认为是表达“愉悦”和“ AROUSAL”的情绪状态的一般指标的两个维度。学习模型时,主观地将评估值用于各个维度。当合成语音时,我们通过给出任意值来合成任何反映情感的语音。我们研究了二维产生具有合成语音的声学特征的合成语音的影响。此外,我们针对合成语音进行了三个主观实验。首先,自然测试的结果表明合成语音是自然的。接下来,再现性测试的结果表明给定情绪的再现性。最后,情感表达测试的结果表明合成语音传输了目标情感。%本稿では,隠れセミマルコフモデル(HSMM)に基づく音声合成方式に重回帰モ帰ルを组を重回帰HSMM本研究では,パラ言语情报を少数の次元から构成される空间上の座标として表现し,この空间を构成する次元を重回帰モデル次元変感情状态を表す一般的な指标とされている「快-不快」,「覚醒-睡眠」の2つの次元を用いる。モデルの学习时には各発话に対し次元毎に主観的に评価された评価値を用いて学习し,合成时には任意の评価値を与えて任意の感情状态の音声を合成する。合成された音声の音响的特徴量から,2つの次元が合成音声また与える影响について検讨する。また,合成された音声に対して3つの主観评価実験を行した。に,自然性评価を行い,合成された音声の自然性について示した。次に,再现性评価最后に,感情状态の表出について评価を行い,意図した感情状态が伝达されていることを示した。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号