首页> 中文学位 >噪声环境下语音特征提取前端处理及优化帧算法研究
【6h】

噪声环境下语音特征提取前端处理及优化帧算法研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1语音识别简介

1.1.1语音识别概念

1.1.2语音识别发展历史及现状

1.2语音识别关键技术

1.2.1语音信号的预处理

1.2.2语音识别的特征参数提取

1.2.3语音识别算法

1.3论文所做的工作和文章内容安排

第二章人的听觉机理

2.1概述

2.2语音感知系统和生成系统

2.2.1语音听觉器官的生理结构

2.2.2语音听觉的心理

2.2.3语音发音系统

2.3语音信号生成的数学模型

2.3.1激励模型

2.3.2声道模型

2.3.3辐射模型

2.3.4语音信号的数学模型

第三章小波分析理论与小波滤波器研究

3.1小波分析理论

3.1.1基本理论

3.1.2小波分析的频域特征

3.2组合小波滤波器的研究

3.2.1算法原理

3.2.2具体实验

3.2.3小结

第四章基于高斯小波和组合小波滤波器的语音特征提取方法

4.1 ZCPA特征提取方法

4.2基于高斯小波的滤波器原理

4.2.1临界带宽

4.2.2高斯小波

4.2.3改进算法的实现步骤

4.3 RBF识别网络

4.4试验结果及结论

4.5基于组合小波滤波器的语音特征提取方法

4.5.1基本原理及实验步骤

4.5.2实验结果综合比较

4.6小结

第五章基于优化帧参数的语音特征提取方法

5.1优化帧算法

5.1.1基本原理

5.1.2实验方法描述

5.1.3实验结果综合比较

5.2基于优化帧的差分算法

5.2.1基本原理

5.2.2实验结果综合比较

5.3基于优化帧的加权差分算法

5.3.1基本原理

5.3.2加权方法

5.3.3实验结果综合比较

5.4小结

第六章总结与展望

6.1本文总结

6.2系统的局限性及展望

参考文献

致谢

攻读学位期间发表的学术论文目录

展开▼

摘要

特征提取是语音识别过程中关键的一环。近些年来,基于人耳听觉特性的特征提取方法引起了广泛关注。这是因为,人耳具有很强的识别能力,即使在噪声环境下也是如此。在特征提取的众多方法中过零峰值幅度(ZCPA)方法正是基于人耳的听觉模型建立起来的。该模型采用语音信号的过零率来表示信号的频率特性,采用峰值幅度来表示信号的幅值特性,最后将幅度信息和频率信息进行整合作为输出特征。论文以上述系统为基础,对这种方法进行了多种改进。 文中首先引入了小波变换作为分析工具,讨论了小波变换的原理及其在时域、频域的性质。利用小波的频移特性及单个小波的频谱重叠,提出了构造组合小波滤波器的思想。使用组合小波,通过选择合适的小波参数可以方便地设计出低通、高通、带通滤波器。实验证明,这种滤波器具有算法简单,频域特性良好,易于软件仿真的特点。 论文把小波理论应用于ZCPA特征提取的前端处理中,分别提出了用Gauss小波滤波器和组合小波滤波器代替原ZCPA中的FIR滤波器的语音特征提取方法。通过对人耳听觉特性的研究,按照人耳临界带宽分别设计了Gauss小波带通滤波器及组合小波滤波器。本文详细讨论了Gauss小波滤波器尺度参数的选择方法和使用不同个数小波构造出的组合小波滤波器的特性,后端的训练和识别部分使用RBF网络,仿真实现了使用新特征与原特征的识别结果。证明了新特征具有较高的识别率和优良的抗噪性能。接着本文对ZCPA特征提取的分帧处理过程进行了分析并加以改进。由于在语音信号的特征提取过程中,语音信号通常是按照帧处理的方式进行的,分帧将直接影响到最后识别结果的表现,特别是分帧的长度对识别的结果有着重要的影响,因此,特提出了优化帧的思想。论文详细讨论了基于ZCPA特征提取方法取不同帧长对识别结果产生的影响,仿真实现了改进后的系统。由于原ZCPA方法在计算上升过零率获取频率信息时漏掉了部分高频信息,而且为了使提取出来的密度信息与人耳的感觉特性更相符合。文中将语音信号作差分,通过计算差分信号的上升过零率获得高频信息,同时优化帧算法也弥补了一部分丢失的高频信息;利用加权矩阵对密度信息加权,使之与人耳的听觉感受相吻合,从两方面弥补了ZCPA特征的缺陷。最后试验证明,经过改进后算法的识别率有了很大提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号