単語グラフ統合を用いた種々の雑音環境下での音声認識

倉又　俊輔; 加藤　正治; 小坂　哲夫

首页> 外文期刊>電子情報通信学会技術研究報告 >単語グラフ統合を用いた種々の雑音環境下での音声認識

【24h】

単語グラフ統合を用いた種々の雑音環境下での音声認識

机译：使用单词图集成在各种嘈杂环境下的语音识别

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本論文では，種々の雑音環境下での音声認識の性能向上のため単語グラフ統合を提案する．具体的には，混合連続分布型HMM（CMHMM）と離散混合分布型HMM（DMHMM）の2種類の音響モデルを使用することで単語グラフ統合を行う．DMHMMを用いたシステムが突発性雑音下での認識性能を大きく向上させることが，これまでの研究で確認されている．さらに，CMHMMを用いたシステムが高SNRの環境雑音において良い結果を示すことも確認されている．このようにCMHMMとDMHMMは異なる誤り傾向を持つ．上記のような理由からCMHMMとDMHMMを用いたシステム統合法を利用する．認識実験の結果，提案法はROVERやベースラインの認識結果と比べて良好な結果を得た．特に複合雑音下において認識性能が大きく向上した．%In this paper, we propose a new word graph combination (WGC) approach for speech recognition under various noise conditions. Specifically, we developed a WGC technique in which both continuous-mixture hidden Markov models (CMHMMs) and discrete-mixture hidden Markov models (DMHMMs) are being used as acoustic models. It has been previously verified that a DMHMM-based system can ensure significant improvements in the speech recognition performance under impulsive noise conditions. We also showed that the CMHMM-based system indicated better performance in environmental noise conditions at high SNR. Thus, the CMHMM and the DMHMM exhibit different error trends. On the grounds of the above mentioned findings, we adopted a system combination approach in which both a DMHMM and a CMHMM are used. In the speech recognition experiments we performed, the proposed system showed better performance than the ROVER-based system or the baseline system. In particular, this new system showed comparatively higher performance under mixed noise conditions.

机译：在本文中，我们提出了词图集成来提高各种噪声环境下的语音识别性能。具体而言，通过使用两种类型的声学模型来执行单词图集成：混合连续分布类型HMM（CMHMM）和离散混合分布类型HMM（DMHMM）。先前的研究已经证实，使用DMHMM的系统大大提高了突发噪声下的识别性能。此外，已经证实使用CMHMM的系统在高SNR的环境噪声中显示出良好的结果。因此，CMHMM和DMHMM具有不同的错误倾向。由于上述原因，我们使用使用CMHMM和DMHMM的系统集成方法。作为识别实验的结果，提出的方法获得了比ROVER和基线识别结果更好的结果。特别地，在复杂噪声下，识别性能大大提高。在本文中，我们提出了一种新的词图组合（WGC）方法用于各种噪声条件下的语音识别。具体来说，我们开发了一种WGC技术，该技术同时具有连续混合隐马尔可夫模型（CMHMM）和离散混合隐马尔可夫模型（DMHMM）被用作声学模型。先前已经验证了基于DMHMM的系统可以确保在脉冲噪声条件下的语音识别性能得到显着改善。我们还表明基于CMHMM的系统在环境噪声中表现出更好的性能基于上述发现，我们采用了同时使用DMHMM和CMHMM的系统组合方法，并在语音识别实验中进行了研究。，所提出的系统表现出比基于ROVER的系统或基准系统更好的性能。在混合噪声条件下具有更高的性能。

著录项

来源
《電子情報通信学会技術研究報告》 |2010年第143期|p.37-42|共6页
作者
倉又　俊輔; 加藤　正治; 小坂　哲夫;
展开▼
作者单位

山形大学大学院理工学研究科〒992-8510山形県米沢市城南4-3-16;

山形大学大学院理工学研究科〒992-8510山形県米沢市城南4-3-16;

山形大学大学院理工学研究科〒992-8510山形県米沢市城南4-3-16;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
大語彙連続音声認識; 雑音; 単語グラフ統合; 混合連続分布HMM; 離散混合分布HMM;

机译：大词汇量连续语音识别;噪声;词图集成;混合连续分布HMM;离散混合分布HMM;

相似文献

外文文献
中文文献
专利

1. 単語グラフ統合を用いた種々の雑音環境下での音声認識 [J] . 倉又俊輔, 加藤正治, 小坂哲夫電子情報通信学会技術研究報告. 音声. Speech . 2010,第143期

机译：使用单词图集成在各种嘈杂环境中进行语音识别
2. 単語グラフ統合を用いた種々の雑音環境下での音声認識 [J] . 倉又俊輔, 加藤正治, 小坂哲夫電子情報通信学会技術研究報告. 音声. Speech . 2010,第143期

机译：在使用文字图形整合各种噪声环境下语音识别
3. 認識性能が大きく向上したDNN型音声認識ソフトウェア「SpeechRec」と音声認識統合環境「SpeechRecPlus」クラウドサービスを同時に販売開始——高性能な音声認識の活用がさらに簡単?低コストに [J] . NTT技術ジャーナル . 2015,第1期

机译：DNN型语音识别软件“ SpeechRec”具有大大改善的识别性能，并且语音识别集成环境“ SpeechRecPlus”云服务现已同时发售---易于使用的高性能语音识别吗？
4. 医療用ロボットのための雑音環境下での音声認識 [C] . 佐藤太貴, 渡辺寛望, 小谷信司 Annual Conference of the Robotics Society of Japan . 2015

机译：医疗机器人噪声环境下的语音识别
5. 小胞体Ca[2+]-ATPaseを認識する単クロ-ン抗体の作製と人体組織における分布および骨軟部腫瘍での発現について利用統計を見る [D] . 黒田雅彦 1993

机译：识别内质网Ca [2 +]-ATPase，在人体组织中的分布以及在骨和软组织肿瘤中表达的单克隆抗体的制备
6. 辞書分割法を用いた雑音環境下での単語音声認識 [O] . 中村祐輝 2016

机译：字典分割法在嘈杂环境中的单词语音识别

単語グラフ統合を用いた種々の雑音環境下での音声認識

摘要

著录项

相似文献

相关主题

期刊订阅