首页> 外文期刊>人工知能: 人工知能学会誌 >音声認識のための深層学習
【24h】

音声認識のための深層学習

机译:深度学习语音识别

获取原文
获取原文并翻译 | 示例
           

摘要

2011年,まだ30%程度のエラーが出てしまうような難しい課題であった電話会話音声の認識において,深層学習技術による音声認識システムが20%以下のエラー率を達成したとして,関連研究者を大いに驚かせた[Seide 11].この連載のほかの解説でも触れられているが,深層学習は層数の大きな多層パーセプトロン(Multilayer Perceptron:MLP)を学習するための手段である.音声認識の研究コミュニティでは,主流とはいえないながらも層数の少ない多層パーセプトロンに関する研究も進められていたが,このように多数の層を用いたパーセプトロンが,最も難しい音声認識問題の一つである電話会話音声で有効に利用可能であるというのは,多くの研究者にとって衝撃的だったのではないかと予想される.音声認識分野における深層学習技術の適用は,2009年に Deng らのグループが"Deep Learning for Speech Recognition and Related Applications”と題したワークショップをNIPSと併催で行っていることから,ほかの応用分野に先駆けていたといえる.しかし,この時点では,音声認識技術の最先端で利用されているような,大語彙で複雑な依存関係を必要とする統計モデルに直接適用できるかどうか疑問が残っていた.
机译:相关研究人员表示,在2011年,电话对话语音的识别是一项艰巨的任务,仍然会导致大约30%的错误,该研究人员表示,深度学习技术的语音识别系统的错误率达到或低于20%。 [第11部分]感到非常惊讶,正如本系列文章的其他评论所述,深度学习是学习具有多层结构的多层感知器(MLP)的一种方法。因此,尽管不是主流,但是对具有少量层的多层感知器的研究已经得到了发展,但是使用如此大量层的感知器是电话交谈语音中最困难的语音识别问题之一。预期有效的可用性将震惊许多研究人员,Deng等人的小组在2009年将深度学习技术在语音识别领域的应用称为“深度学习”。自从与NIPS共同举办了名为“语音识别及相关应用”的研讨会以来,可以说它领先于其他应用领域,但目前看来,它已被用于语音识别技术的最前沿。问题仍然在于,它是否可以直接应用于需要大量词汇和复杂依赖性的统计模型。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号