首页> 中文学位 >一种噪声环境下的复杂声音识别方法
【6h】

一种噪声环境下的复杂声音识别方法

代理获取

目录

声明

致谢

摘要

第一章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 研究内容与章节安排

1.3.2 研究内容

1.3.3 章节安排

1.4 研究方法与技术路线

第二章 声音识别相关理论概述

2.1 声音特征提取方法

2.1.1 时域特征

2.1.2 频域特征

2.2 样本选择聚类算法

2.2.1 K-Means聚类算法

2.2.2 AP聚类算法

2.3 隐马尔可夫识别模型

2.3.1 Markov链

2.3.2 基本概念及定义

2.3.3 HMM的基本算法

2.4 本章小结

第三章 噪声环境下的复杂声音特征提取

3.1 复杂声音时域特性分析

3.1.1 短时能量分析

3.1.2 短时过零率分析

3.1.3 短时自相关函数分析

3.2 复杂声音频域特性分析

3.2.1 线性预测倒谱系数分析

3.2.2 梅尔频率倒谱系数分析

3.2.3 最小方差无失真响应特征分析

3.3 复杂声音特征提取

3.4 本章小结

第四章 噪声环境下的复杂声音识别方法研究

4.1 噪声环境下的复杂声音样本选择方法

4.1.1 样本选择标准

4.1.2 基于聚类标注的训练样本选择算法

4.2 噪声环境下的复杂声音识别框架

4.3 基于HMM的复杂声音识别模型

4.3.1 HMM模型训练

4.3.2 HMM模型识别

4.4 本章小结

第五章 仿真实验与分析

5.1 列车声音识别实验

5.1.1 实验设置

5.1.2 特征选择分析比较

5.1.3 样本选择算法性能比较

5.2 鸟叫声识别实验

5.2.1 实验设置

5.2.2 实验性能分析比较

5.3 本章小结

第六章 总结与展望

6.1 工作总结

6.2 展望

参考文献

攻读硕士学位期间的学术活动及成果情况

展开▼

摘要

当今社会已进入人工智能的时代,语音识别技术已经相当成熟。而对于实际生活中的复杂声音,由于其声源的复杂性和多样性,加之背景噪声的干扰,目前对于这一领域的识别研究还远远不够成熟,仍然存在许多问题和缺陷。因此对噪声环境下复杂声音的识别研究具有非常重大的实践价值和理论价值。复杂声音是指这样一类包含多种声音类型且这些声音之间的边界难以区分的声音信号。目前对于这类声音的检测方法主要沿用传统的语音识别技术,语音信号发音方式较为固定且能量平稳,而复杂声音种类繁多,发音原理各不相同,瞬间能量也较大,而且还会被环境噪音所干扰,因此仅仅采用传统的语音识别技术不能够较好地应用于复杂声音的识别。
  针对噪声环境下这一类声音识别准确率低的问题,本文主要进行了如下研究工作:(1)首先主要介绍了声音识别中常用的几种时频域特征,通过提取和分析复杂声音样本的特征参数,提出了由时频域特征组合的方式来共同描述复杂声音,并进行了多种混合特征的对比实验。(2)在对噪声环境下的复杂声音识别方法研究过程中,针对人工选择训练样本的困难,提出了一种基于聚类标注的训练样本选择算法,能够更加快速精准地选择出训练样本代表集,并进行了不同聚类方法的对比实验。(3)最后提出了基于隐马尔可夫模型(Hidden Markov Model,HMM)的复杂声音识别框架,并进行了训练和识别。通过对列车声音以及鸟叫声两种不同类型的复杂声音进行仿真实验,结果表明,利用时域特征短时自相关函数以及频域特征梅尔频率倒谱系数组合的混合特征参数表示复杂声音特征,使用本文提出的基于近邻传播聚类标注的训练样本选择算法,以及通过HMM模型识别框架进行建模,可以显著提高噪声环境下复杂声音的识别准确率和效率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号