首页> 外文期刊>三菱电机技报 >音声認識技術とその応用
【24h】

音声認識技術とその応用

机译:语音识别技术及其应用

获取原文
获取原文并翻译 | 示例
           

摘要

音声は人間にとって最も自然な情報伝達手段であり,音声インタフェースは,直感的で分かりやすく利便性も高いこの音声インタフェースとして実用化されている代表的分野には,CTI(Computer Telephony Integration)サーバ,カーナビ,音声ワープロなどが挙げられる。CTIサーバは公衆向け情報サービスに用いられ,最近,ボイスポータルとしての応用が注目を集めている。このCTIサーバの場合,音声は,電話網を通ることによって帯域制限され,騒音やひずみが加わる。 このような電話特有の劣化に対応するための電話音声認識技術について述べる車の運転中は目と手が拘束されるため,カーナビ操作を音声だけで実現できる音声認識への期待は高い。 しかし,カーナビは,目的地(住所)入力のための大語彙 à搐ぃ─我羯J識,高速走行騒音下の音声認識機能を,演算量やメモリが小さい環境で実現する必要がある。 ここでは,これらの問題を解決する小さな演算リソースで動作する組み込み用途の音声認識技術と騒音下音声認識技術について説明する。 また,音声入力による文書作成への期待は依然として高い。この音声ワープロで不可欠の言語モデル作成のためには大量のコーパス(文例)が必要であり,従来は特定業務用に対応できなかった。本稿では,少量のコーパスから容易に業務専用の言語モデルを作成できる言語確率推定法などのディクテーション技術について述べる。 三菱電機は,IT機器の高機能化に合わせて,今後,更に使いやすい音声インタフェースを提供していく予定である。
机译:语音是人类最自然的信息传输手段,语音界面直观,易于理解且非常方便,这种语音界面已投入实际使用的典型领域包括CTI(计算机电话集成)服务器和汽车导航系统。 ,语音文字处理器等。 CTI服务器用于为公众提供信息服务,最近它作为语音门户的应用引起了人们的关注。在这种CTI服务器的情况下,语音通过电话网络限制了带宽,并增加了噪声和失真。描述用于解决电话特有的这种劣化的电话语音识别技术由于驾驶汽车时眼睛和手都受到约束,因此人们对语音识别寄予厚望,因为语音识别只能通过语音来实现汽车导航操作。然而,汽车导航系统需要在计算和存储量少的环境中实现用于输入目的地(地址)的大词汇量,高速行驶噪声下的语音识别功能。在这里,我们将解释用于嵌入式应用程序的语音识别技术以及在噪声较小的情况下使用少量计算资源来解决这些问题的语音识别技术。另外,对于通过语音输入创建文档的期望仍然很高。创建此语音文字处理器必不可少的语言模型需要大量语料库(句子示例),并且过去无法针对特定任务来处理它。本文介绍了诸如语言概率估计方法之类的口述技术,这些方法可以轻松地从少量语料库中创建特定于业务的语言模型。随着IT设备变得越来越复杂,三菱电机计划在将来提供一个更加易于使用的语音接口。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号