...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >メルケプストラムを用いた深層ニューラルネットワークによる室内環境音識別の検討
【24h】

メルケプストラムを用いた深層ニューラルネットワークによる室内環境音識別の検討

机译:基于神经网络的深度神经网络检测室内环境声音识别

获取原文
获取原文并翻译 | 示例
           

摘要

社会の高齢化に伴い,一人暮らし高齢者による家庭内事故の増加や孤独死が深刻な問題となっている.そのため,ビデオカメラを用いた高齢者見守りサービスや安否確認システムが提案されている.しかし,このようなシステムでは暗所や死角における異常事態の検出が困難である.この問題を解決する方法として,日常生活で発生する環境音から周囲の状況を特定する環境音識別が注目されている.従来の環境音識別では,音響特徴量にメル周波数ケプストラム係数(MFCC),モデル化に隠れマルコフモデル(HMM)を利用していた.しかし,室内環境下で発生した環境音は残響等の影響を受けて音響的特徴が変化するため,十分な識別性能が得られない問題がある.そのため,表現学習から得られる残響等の外的要因に影響されない本質的な特徴を識別に用いることで,更なる識別精度の改善が見込まれる.そこで本研究では,深層ニューラルネットワーク(DNN)により表現学習を行い,学習済みDNNを音響モデルとして用いる環境音識別法を提案する.評価実験により従来法と提案法の識別性能を比較した結果,提案法の有効性を確認した.
机译:随着社会的老龄化,家庭事故的增加和独居老人的孤独死亡已成为严重的问题。因此,已经提出了老年人观看服务和使用摄像机的安全确认系统。但是,用这种系统很难在暗处和盲点检测异常情况。作为解决该问题的方法,关注环境声识别,其从日常生活中产生的环境声中识别周围的情况。在传统的环境声音识别中,梅尔频率Keptram系数(MFCC)用于声学特征,而隐马尔可夫模型(HMM)用于建模。然而,由于在室内环境中产生的环境声音的声学特性由于混响等的影响而变化,所以存在不能获得足够的判别性能的问题。因此,期望通过使用不受外部因素影响的基本特征(例如从表情学习中获得的混响)来识别,从而进一步提高识别精度。因此,在这项研究中,我们提出了一种环境声音识别方法,该方法通过使用深度神经网络(DNN)进行表情学习,将经过训练的DNN用作声学模型。通过评估实验比较常规方法和提出的方法的鉴别性能的结果,证实了提出的方法的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号