首页> 外文期刊>電子情報通信学会技術研究報告 >単語グラフ統合を用いた種々の雑音環境下での音声認識
【24h】

単語グラフ統合を用いた種々の雑音環境下での音声認識

机译:使用单词图集成在各种嘈杂环境下的语音识别

获取原文
获取原文并翻译 | 示例
           

摘要

本論文では,種々の雑音環境下での音声認識の性能向上のため単語グラフ統合を提案する.具体的には,混合連続分布型HMM(CMHMM)と離散混合分布型HMM(DMHMM)の2種類の音響モデルを使用することで単語グラフ統合を行う.DMHMMを用いたシステムが突発性雑音下での認識性能を大きく向上させることが,これまでの研究で確認されている.さらに,CMHMMを用いたシステムが高SNRの環境雑音において良い結果を示すことも確認されている.このようにCMHMMとDMHMMは異なる誤り傾向を持つ.上記のような理由からCMHMMとDMHMMを用いたシステム統合法を利用する.認識実験の結果,提案法はROVERやベースラインの認識結果と比べて良好な結果を得た.特に複合雑音下において認識性能が大きく向上した.%In this paper, we propose a new word graph combination (WGC) approach for speech recognition under various noise conditions. Specifically, we developed a WGC technique in which both continuous-mixture hidden Markov models (CMHMMs) and discrete-mixture hidden Markov models (DMHMMs) are being used as acoustic models. It has been previously verified that a DMHMM-based system can ensure significant improvements in the speech recognition performance under impulsive noise conditions. We also showed that the CMHMM-based system indicated better performance in environmental noise conditions at high SNR. Thus, the CMHMM and the DMHMM exhibit different error trends. On the grounds of the above mentioned findings, we adopted a system combination approach in which both a DMHMM and a CMHMM are used. In the speech recognition experiments we performed, the proposed system showed better performance than the ROVER-based system or the baseline system. In particular, this new system showed comparatively higher performance under mixed noise conditions.
机译:在本文中,我们提出了词图集成来提高各种噪声环境下的语音识别性能。具体而言,通过使用两种类型的声学模型来执行单词图集成:混合连续分布类型HMM(CMHMM)和离散混合分布类型HMM(DMHMM)。先前的研究已经证实,使用DMHMM的系统大大提高了突发噪声下的识别性能。此外,已经证实使用CMHMM的系统在高SNR的环境噪声中显示出良好的结果。因此,CMHMM和DMHMM具有不同的错误倾向。由于上述原因,我们使用使用CMHMM和DMHMM的系统集成方法。作为识别实验的结果,提出的方法获得了比ROVER和基线识别结果更好的结果。特别地,在复杂噪声下,识别性能大大提高。在本文中,我们提出了一种新的词图组合(WGC)方法用于各种噪声条件下的语音识别。具体来说,我们开发了一种WGC技术,该技术同时具有连续混合隐马尔可夫模型(CMHMM)和离散混合隐马尔可夫模型(DMHMM)被用作声学模型。先前已经验证了基于DMHMM的系统可以确保在脉冲噪声条件下的语音识别性能得到显着改善。我们还表明基于CMHMM的系统在环境噪声中表现出更好的性能基于上述发现,我们采用了同时使用DMHMM和CMHMM的系统组合方法,并在语音识别实验中进行了研究。 ,所提出的系统表现出比基于ROVER的系统或基准系统更好的性能。在混合噪声条件下具有更高的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号