手から声のメディア変換モデルと手のジェスチャーモデルの確率的統合に基づく異メディア空間の対応付けの検討

國越　晶; 齊藤　大輔; 喬　宇; 峯松　信明; 広瀬　啓吉

首页> 外文期刊>電子情報通信学会技術研究報告 >手から声のメディア変換モデルと手のジェスチャーモデルの確率的統合に基づく異メディア空間の対応付けの検討

【24h】

手から声のメディア変換モデルと手のジェスチャーモデルの確率的統合に基づく異メディア空間の対応付けの検討

机译：基于手语音媒体转换模型和手势模型概率集成的不同媒体空间对应性研究

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

発声器官の制御に障害を持つ構音障害者が会話をする場合、文字や記号の入力を介して音声を生成する機器を用いることが多い．しかし、リアルタイムに自由な発話をすることが難しく、障害者が会話の主導権を握れない等の問題が指摘されている．そこで本研究では、文字や記号を介きない音声生成として、障害者自身の構苫器官以外の身体運動から直接音声を生成するシステムの構築を検討している．近年、二話者から与えられたパラレルデータに対して、統計的に空間写像を設計する手法が話者変換の分野で用いられている．この手法を応用し、本研究では、身体運動の特徴量空間から吉声の特徴量空間への写像に基づく音声生成系を検討している．これまでに、手姿勢（ジェスチャー）を入力とした日本語五母音の連続音声生成において、本手法が有効であることを報告した．本稿では、母音のみのパラレルデータを用いて音声ージェスチャー変換システムを構築し、それに子吉吉声を入力することにより、子吉に割り当てるジェスチャーを推定する手法を検討した．%When individuals with speaking disabilities, dysarthrics, try to communicate using speech, they often have to use speech synthesizers which require them to type word symbols or sound symbols. This input method often makes realtime operations difficult and dysarthric users fail to control the flow of conversation. In this study, we are developing a new and novel speech synthesizer where not symbol inputs but hand motions are used to generate speech. In recent years, statistical mapping techniques have been proposed for voice conversion. Based on these methods, we developed a system to convert hand motions to vowel transitions by finding the mapping between a hand space and a vowel space. We found that the proposed method was effective to generate utterances of Japanese five vowels. In this paper, we discuss how to extend this system for consonant generation. We develop a Speech-to-Hand conversion system trained from parallel data for vowels only to infer the gestures corresponding to consonants.

机译：当控制了声器官的构音障碍的人进行交谈时，他们经常使用通过输入字母和符号来产生声音的设备。但是，已经指出，很难实时自由地讲话，并且残疾人无法控制对话。因此，在这项研究中，我们正在研究一种系统的构建，该系统可以直接通过身体运动而不是残疾人的骨骼生成语音，因为语音生成不涉及字母和符号。近来，在说话者转换领域中已经使用了一种统计设计由两个说话者给出的并行数据的空间图的方法。通过应用这种方法，在本研究中，我们研究了基于从身体运动特征空间到正语音特征空间的映射的语音生成系统。到目前为止，我们已经报道了这种方法在输入手势（手势）的日语五个元音的连续语音生成中有效。在本文中，我们仅使用元音的并行数据构建了一个语音手势转换系统，并研究了一种通过输入Kokichi的语音来估计分配给Kokichi的手势的方法。％当有语言障碍，肢体异常的人尝试通过语音进行交流时，他们通常不得不使用语音合成器，要求他们键入单词符号或声音符号。这种输入方法通常使实时操作变得困难，并且肢体异常的用户无法控制语音流。在这项研究中，我们正在开发一种新颖的语音合成器，该合成器不使用符号输入，而是使用手势来生成语音；近年来，已经提出了统计映射技术来进行语音转换；基于这些方法，我们开发了一种语音合成器。通过发现手部空间与元音空间之间的映射关系，将手部运动转换为元音过渡系统，发现所提出的方法对于产生日语五个元音的发音是有效的。我们开发了从手语元数据的并行数据训练的语音到手的转换系统，以仅推断对应于c的手势子音

著录项

来源
《電子情報通信学会技術研究報告》 |2011年第452期|p.73-78|共6页
作者
國越　晶; 齊藤　大輔; 喬　宇; 峯松　信明; 広瀬　啓吉;
展开▼
作者单位

東京大学大学院工学系研究科　〒113－8656東京都文京区本郷7－3－1;

東京大学大学院工学系研究科　〒113－8656東京都文京区本郷7－3－1;

中国科学院深セン先進技術研究院　中国広東省深セン市南山区西麗区探セン大学城学苑大道1068号;

東京大学大学院情報理工学系研究科　〒113－0033東京都文京区本郷7－3－1;

東京大学大学院情報理工学系研究科　〒113－0033東京都文京区本郷7－3－1;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
構音障害; 音声生成; 手の運動; メディア変換; 母音・手姿勢配置;

机译：发音障碍;发声;手部动作;媒体转换;元音和手势位置;

相似文献

外文文献
中文文献
专利

1. 手から声のメディア変換モデルと手のジェスチャーモデルの確率的統合に基づく異メディア空間の対応付けの検討 [J] . 國越晶, 齋藤大輔, 喬宇, 電子情報通信学会技術研究報告. 音声. Speech . 2010,第452期

机译：基于手语音媒体转换模型和手势模型的概率集成，检查不同媒体空间之间的对应关系
2. 手から声のメディア変換モデルと手のジェスチャーモデルの確率的統合に基づく異メディア空間の対応付けの検討 [J] . 國越晶, 齋藤大輔, 喬宇, 電子情報通信学会技術研究報告. 音声. Speech . 2010,第452期

机译：基于概率模型的概率集成的概率介质转换模型与手势模型的研究
3. ミニ60年目のサプライズMINI 602019年は、ミニにとって誕生60周年を祝うァニバーサリーィャー。そんな特別な年を記念して、早くも特別限定モデルのMINI 60 Years Editionが本国で発表された。今日まで受け継がれるミニの基本的なパッケージングは、すでに60年前に確立されたもの。ミニの生みの親であるサ!ァレック•イシゴニスは、ミニマムなボディサイズと大人4人が快適に乗れる室内空間を両立させるため、エンジンをフロントに横置きして前輪駆動とするアイデァを考案。今日のコンパクトカ-の公式をつくり上げた。さらに走りの素性の良さに着目したジョン•ク-パ-が、ミニにチュ-ニングを施したミニ•ク-パ-を製作。軽量な車体と俊敏なハンドリン [J] . ニューミニ·スタイルマガジン/New Mini Style Magazine . 2019,第JUNa期

机译：Mini 60th Surprise MINI 60 2019是MINI的微型周年庆典。为了纪念这一特殊的年份，特别宣布了限量版MINI 60 Years Edition。传到今天的迷你的基本包装是60年前建立的。 Mini的创造者Sarek•Isigonis设计了一种想法，其中发动机水平放置在前轮上以驱动前轮，以实现最小的车身尺寸和可让四名成年人舒适乘坐的室内空间。创建了当今紧凑型汽车的公式。此外，约翰·库珀（John Cooper）着眼于出色的行驶特性，并制作了带有微调的迷你双座轿跑车。轻巧的机身和敏捷的操控
4. 人間行動データに基づく空間設計手法の提案（その１）: 街路空間の仮設構築物配置とベイジアンネットワークによる人間行動の確率的モデルの確立 [C] . 稲毛　洋也, 喜久里　尚人, 矢口　哲也日本建築学会大会;日本建築学会 . 2020

机译：基于人为人类代码的空间设计方法（第1部分）的建议：贝叶斯网络和贝叶斯网络的人力建筑概率模型
5. メディアデータを対象としたメタデータ抽出作用素とその逆作用素による知識創造サイクルモデル [D] . 岡田龍太郎, /オカダリョウタロウ 2019

机译：媒体数据元数据提取算子及其逆算子的知识创造周期模型
6. アジア・熱帯モンスーン地域における生態史のなかのモノと情報　－時空間軸をベースとするマルチメディア・生態誌アーカイブズの構築を目指して－ [O] . 秋道智彌, 久保正敏, 田口理恵 2016

机译：亚洲/热带季风区生态史中的事物和信息 - 旨在建立基于时空轴的多媒体和生态杂志档案 -

手から声のメディア変換モデルと手のジェスチャーモデルの確率的統合に基づく異メディア空間の対応付けの検討

摘要

著录项

相似文献

相关主题

期刊订阅