使用原始音频波形的超深层环境声音识别卷积网络

戴本尧

首页> 中文期刊> 《电脑知识与技术》 >使用原始音频波形的超深层环境声音识别卷积网络

使用原始音频波形的超深层环境声音识别卷积网络

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

直接从音频的原始波形学习声学模型具有挑战性.当前基于音频的原始波形的模型一般使用很少的卷积层,可能不足以构建抽象的可区分性特征.在这项工作中,我们提出了一个非常深的卷积神经网络(VGCNN),这个网络模型直接使用时域波形作为输入.我们的VGCNN有多达34个卷积层,有效从音频原始序列中(例如,大小为32000的音频原始序列)提取了抽象的可区分性特征.我们的网络是全卷积网络,不使用全连接层和下采样层,以最大化的保留原始特征并且降低参数量.我们用一个在第一卷积层中的大的感受野来提取长时时序,随后的各层卷积中的卷积核是非常小的感受野以便控制模型大小.实验证明我们提出的具有18个卷积层的CNN,在环境声音识别任务绝对精度超过目前主流模型15％.

著录项

来源
《电脑知识与技术》 |2019年第8期|130-132|共3页
作者
戴本尧;
展开▼
作者单位

浙江工贸职业技术学院,浙江温州325003;

展开▼
原文格式 PDF
正文语种 chi
中图分类多媒体技术与多媒体计算机;
关键词
原始音频波形; 人工智能; 深度学习;

相似文献

中文文献
外文文献
专利

1. Tektronix以音频、改良型检错和远程连接功能强化多格式波形监视仪系列产品新功能可使用户以一台仪器进行广泛的音频和视频标准验证检测工作 [J] . . 现代电视技术 . 2003,第3期
2. 探寻波表音频文件的奥秘——如何制作波形音频文件 [J] . 刘春艳 . 雷达与对抗 . 1997,第001期
3. 声乐载体从主观感觉转化为客观图像(二)——原始音频转化为数字音频变化后的修复 [J] . 吴迪 . 黄河之声 . 2018,第011期
4. 卡脖深层水包在超白浮法玻璃生产中的使用方式探讨 [J] . 韩广军 . 玻璃 . 2014,第005期
5. 基于小波谱图和深度卷积网络的音频场景识别新框架 [J] . 陈航艇 . 网络新媒体技术 . 2019,第002期
6. 脉冲电场原始波形测量系统 [C] . . 第十四届全国核电子学与核探测技术学术年会 . 2008
7. 基于音频技术的生猪咳嗽声音识别方法研究 [A] . 涂鼎 . 2020

使用原始音频波形的超深层环境声音识别卷积网络

摘要

著录项

相似文献

相关主题

期刊订阅