首页> 外文会议>日本音響学会研究発表会 >畳み込みニューラルネットワークを用いた空間特徴抽出に基づく音響シーン識別の検討
【24h】

畳み込みニューラルネットワークを用いた空間特徴抽出に基づく音響シーン識別の検討

机译:基于空间神经网络的空间特征提取的声学场景识别检查

获取原文

摘要

人間の行動や周囲の状況を自動認識しようとする取り組みがなされている.例えば,高齢者の見守りや動画への自動タグ付け,ライフログの収集などの応用システムが考えられている.これらのシステムを実現する要素技術の一つとして,環境音認識が注目されている.環境音認識は大きく二つに分けられる.一つは音響イベント検出,もう一つは音響シーン識別である.音響イベント検出は「いつ,何の音がしたか」を検出するものであり,音の種類としてはドアの開閉音,咳をする音,転倒音などの短い単発的な音が多い.一方,音響シーン識別は数秒から数十秒程度の長い音から録音された場所や状況を識別するものであり,音の種類としてはバスの中,オフィス,家などがある.本研究では音響シーン識別に焦点を当てる.近年,音響シーン識別の研究が盛hに行われている.例えば環境音認識を対象とするDCASE 2017(De-tection and Classi cation of Acoustic Scenes andEvents 2017)Challenge が開催され,そこでは音響シーン識別のタスクが用意された[1].DCASE 2017では畳み込みニューラルネットワーク(ConvolutionalNeural Networks; CNN)を用いた手法がいくつか提案されたが(例えば[2][3]),中でも[3] では空間特徴を抽出することにより高い識別精度を達成した.この手法は,ステレオ入力信号に対して前処理を施し,左チャネル,右チャネルに加えて中央チャネル(左右チャネル加算),サイドチャネル(左右チャネル減算)等のそれぞれに対して独立にCNN を適用して識別を行う.それに対して本稿では,前処理ではなく,CNN を用いて空間特徴を抽出する手法を提案する.これにより,識別に適した空間特徴を学習により獲得することが可能となる.提案手法では,空間特徴を抽出するために,時間?周波数領域に加えて時間?空間(左右チャネル)領域と周波数?空間領域に対してCNN を適用する.DCASE 2017 Challenge[1] における音響シーン識別のタスクを用いて提案手法における空間特徴抽出の有効性を評価する.
机译:试图自动识别人类的行为和周围情况已经努力了。例如,看着老人自动标记视频和响应,如Lifel Log集合考虑系统。这些系统环境声音识别注意力被认为是要实现的元素技术之一它已经完成。环境声音识别大致分为两个。一个声学事件检测,另一个是声学场景其它的办法。声学事件检测“发生了什么事不要检测到?和声音的类型打开和配件声音,咳嗽声,短单射声,如秋季音调许多。同时,声场景识别数为几秒钟到几十秒确定从长声音记录的地方和情况是的,作为声音的类型,在公共汽车,办公室,房子等那里。在这项研究中,我们专注于声学场景识别。近年来,对声学场景识别的研究在草案H.例如,对环境声音识别的DCEAD 2017(DE-)声学场景的曲线和分类事件2017)举办挑战,它的声音场景识别任务已准备好[1]。 DCEAD 2017.卷积神经网络(卷积)使用神经网络的几种方法; CNN)虽然它致力于(例如[2] [3]),但在[3]的空间特征通过提取,实现了高识别精度。孩子该方法是预处理立体声输入信号,主要频道(左右)除了左频道,右声道频添加),侧通道(左和右声道减法)CNN独立应用于每个执行。另一方面,在本文中,CNN代替预处理我们提出了一种用途提取空间特征的方法。对此更多,学习空间特征适合通过学习识别它是可能的。在提出的方法中,提取空间特征除了时间吗?空间(左右)除了时间吗?CNN用于信道)区域和频率?申请。 DCEAD 2017挑战中的声学[1]使用场景识别任务的建议方法中的空间评估特征提取的有效性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号