基于深度自编码网络语音识别噪声鲁棒性研究

黄丽霞; 王亚楠; 张雪英; 王洪翠

首页> 中文期刊> 《计算机工程与应用》 >基于深度自编码网络语音识别噪声鲁棒性研究

基于深度自编码网络语音识别噪声鲁棒性研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

To solve the problem of the center and the radius determined by randomly in the speech recognition tasks based on traditional Radial Basis Function(RBF)neural network, an unsupervised pre-training method which uses a large number of unlabeled data to initialize the network parameters is proposed to replace the traditional random initialization method based on the layered mechanism of human brain on speech recognition. This paper introduces the Deep Auto-Encoder(DAE) neural network as acoustical model and further analyzes robustness of speaker-independent isolated speech recognition on small size vocabulary database. The experimental results show that DAE outperforms RBF with MFCC(Mel Frequency Cepstrum Coefficient)feature extraction. In addition, compared to MFCC, GFCC(Gammatone Frequency Cepstrum Coefficient)gives more attribution on anti-noise property with a relative accuracy improvement of 1.87%in collaborate with DAE network.%为了解决传统径向基(Radial basis function,RBF)神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,使用深度自编码网络作为语音识别的声学模型,分析梅尔频率倒谱系数(Mel Frequen-cy Cepstrum Coefficient,MFCC)和基于Gammatone听觉滤波器频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)下非特定人小词汇量孤立词的抗噪性能.实验结果表明,深度自编码网络在MFCC特征下较径向基神经网络表现出更优越的抗噪性能;而与经典的MFCC特征相比,GFCC特征在深度自编码网络下平均识别率相对提升1.87%.

著录项

来源
《计算机工程与应用》 |2017年第13期|49-54|共6页
作者
黄丽霞; 王亚楠; 张雪英; 王洪翠;
展开▼
作者单位

太原理工大学信息工程学院;

太原 030024;

太原理工大学信息工程学院;

太原 030024;

太原理工大学信息工程学院;

太原 030024;

天津大学计算机科学与技术学院;

天津 300072;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TN391.42;
关键词
语音识别; 鲁棒性; 深度自编码网络; GFCC特征; MFCC特征;

相似文献

中文文献
外文文献
专利

1. 基于卷积盲源分离的噪声鲁棒性语音识别的研究 [J] . 王振力 ,刘志华 ,白志强 . 声学技术 . 2009,第3期
2. 基于神经网络的语音识别鲁棒性研究 [J] . 朱海涛 . 中国科技信息 . 2008,第005期
3. 智能语音识别系统噪声鲁棒性研究 [J] . 宋文林 ,刘斌 . 信息技术与标准化 . 2019,第006期
4. 基于深度自编码网络的舰船辐射噪声分类识别 [J] . 严韶光 ,康春玉 ,夏志军 . 舰船科学技术 . 2019,第002期
5. 基于多带HMM和神经网络融合的语音识别方法的信道鲁棒性 [J] . 姚志强 ,戴蓓倩 ,李辉 . 计算机工程与应用 . 2004,第001期
6. 基于DNN特征融合的噪声鲁棒性语音识别 [C] . Qing Wang ,王青 ,Xia Wu . 第十三届全国人机语音通讯学术会议 . 2015
7. 深度自编码网络特征提取实现基于超声的无声语音识别 [A] . 刘立成 . 2016

基于深度自编码网络语音识别噪声鲁棒性研究

摘要

著录项

相似文献

相关主题

期刊订阅