...
首页> 外文期刊>電子情報通信学会技術研究報告 >手から声のメディア変換モデルと手のジェスチャーモデルの確率的統合に基づく異メディア空間の対応付けの検討
【24h】

手から声のメディア変換モデルと手のジェスチャーモデルの確率的統合に基づく異メディア空間の対応付けの検討

机译:基于手语音媒体转换模型和手势模型概率集成的不同媒体空间对应性研究

获取原文
获取原文并翻译 | 示例
           

摘要

発声器官の制御に障害を持つ構音障害者が会話をする場合、文字や記号の入力を介して音声を生成する機器を用いることが多い.しかし、リアルタイムに自由な発話をすることが難しく、障害者が会話の主導権を握れない等の問題が指摘されている.そこで本研究では、文字や記号を介きない音声生成として、障害者自身の構苫器官以外の身体運動から直接音声を生成するシステムの構築を検討している.近年、二話者から与えられたパラレルデータに対して、統計的に空間写像を設計する手法が話者変換の分野で用いられている.この手法を応用し、本研究では、身体運動の特徴量空間から吉声の特徴量空間への写像に基づく音声生成系を検討している.これまでに、手姿勢(ジェスチャー)を入力とした日本語五母音の連続音声生成において、本手法が有効であることを報告した.本稿では、母音のみのパラレルデータを用いて音声ージェスチャー変換システムを構築し、それに子吉吉声を入力することにより、子吉に割り当てるジェスチャーを推定する手法を検討した.%When individuals with speaking disabilities, dysarthrics, try to communicate using speech, they often have to use speech synthesizers which require them to type word symbols or sound symbols. This input method often makes realtime operations difficult and dysarthric users fail to control the flow of conversation. In this study, we are developing a new and novel speech synthesizer where not symbol inputs but hand motions are used to generate speech. In recent years, statistical mapping techniques have been proposed for voice conversion. Based on these methods, we developed a system to convert hand motions to vowel transitions by finding the mapping between a hand space and a vowel space. We found that the proposed method was effective to generate utterances of Japanese five vowels. In this paper, we discuss how to extend this system for consonant generation. We develop a Speech-to-Hand conversion system trained from parallel data for vowels only to infer the gestures corresponding to consonants.
机译:当控制了声器官的构音障碍的人进行交谈时,他们经常使用通过输入字母和符号来产生声音的设备。但是,已经指出,很难实时自由地讲话,并且残疾人无法控制对话。因此,在这项研究中,我们正在研究一种系统的构建,该系统可以直接通过身体运动而不是残疾人的骨骼生成语音,因为语音生成不涉及字母和符号。近来,在说话者转换领域中已经使用了一种统计设计由两个说话者给出的并行数据的空间图的方法。通过应用这种方法,在本研究中,我们研究了基于从身体运动特征空间到正语音特征空间的映射的语音生成系统。到目前为止,我们已经报道了这种方法在输入手势(手势)的日语五个元音的连续语音生成中有效。在本文中,我们仅使用元音的并行数据构建了一个语音手势转换系统,并研究了一种通过输入Kokichi的语音来估计分配给Kokichi的手势的方法。 %当有语言障碍,肢体异常的人尝试通过语音进行交流时,他们通常不得不使用语音合成器,要求他们键入单词符号或声音符号。这种输入方法通常使实时操作变得困难,并且肢体异常的用户无法控制语音流。在这项研究中,我们正在开发一种新颖的语音合成器,该合成器不使用符号输入,而是使用手势来生成语音;近年来,已经提出了统计映射技术来进行语音转换;基于这些方法,我们开发了一种语音合成器。通过发现手部空间与元音空间之间的映射关系,将手部运动转换为元音过渡系统,发现所提出的方法对于产生日语五个元音的发音是有效的。我们开发了从手语元数据的并行数据训练的语音到手的转换系统,以仅推断对应于c的手势子音

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号