首页> 中文学位 >噪声环境下鲁棒语音识别技术的研究
【6h】

噪声环境下鲁棒语音识别技术的研究

代理获取

目录

第一个书签之前

Abstract

图目录

表目录

第一章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.2.1 语音识别技术

1.2.2 语音增强算法

1.2.3 语音增强方法在语音识别领域的应用

1.3 语音质量的主客观评价标准

1.3.1 主观评价标准

1.3.2 客观评价标准

1.4 本文章节安排和组织结构

第二章 语音识别和语音增强相关的语音信号处理基础

2.1 语音信号处理的基本知识

2.1.1 语音信号的基本特性

2.1.2 语音信号的数学模型

2.1.3 语音信号的预处理及短时傅里叶变换

2.1.4 噪声特性

2.2 语音识别技术概述

2.2.1 语音识别系统结构

2.2.2 前端处理和解码器

2.2.3 语言模型

2.2.4 声学模型

2.3 常见语音增强算法介绍

2.3.1 谱减法

2.3.2 维纳滤波法

2.3.3 听觉掩蔽法

2.3.4 基于最小均方误差的语音增强算法(MMSE)

2.4 本章小结

第三章 基于听觉掩蔽效应和谐波重构的维纳滤波语音增强算法

3.1 人耳的听觉掩蔽效应

3.1.1 人耳的听觉掩蔽效应介绍

3.1.2 掩蔽效应的阈值计算

3.2 噪声估计算法

3.2.1 最小值统计噪声估计算法

3.2.2 基于最小值约束的递归平均(MCRA)算法

3.3 基于听觉掩蔽效应与谐波重构的维纳滤波语音增强算法

3.4 实验分析及对比

3.5 本章小结

第四章 改进的对数域MMSE幅度谱估计器

4.1 基于最小均方误差(MMSE)的短时频谱幅度谱估计器

4.1.1 基于MMSE短时频谱幅度估计器的基本原理

4.1.2 基于MMSE短时频谱幅度估计器的实现步骤

4.2 对数域基于最小均方误差(LOG-MMSE)的短时频谱幅度谱估计器

4.3 改进的对数域MMSE短时幅度谱分析器

4.3.1 帧信噪比及噪声能量控制和弱频谱下限的平滑适应

4.3.2 实验对比及分析

4.4 本章小结

第五章 基于深度置信网络的语音增强算法

5.1 人工神经网络(Artificial Neural Network,ANN)

5.1.1 神经元

5.1.2 前馈神经网络模型

5.1.3 前向算法

5.1.4 反向传播算法(back propagation,BP)

5.2 深度神经网络的优化问题

5.2.1 随机梯度下降算法(stochastic gradient descent,SGD)

5.2.2 深度神经网络的正则化

5.2.3 Dropout

5.2.4 激活函数(activation function)

5.3 深度置信网络(Deep Belief Network,DBN)

5.3.1 受限玻尔兹曼机(Restricted Boltzmann Machine ,RBM)

5.3.2 深度置信网络的结构和训练方式

5.4 基于深度神经网络的语音增强算法

5.5 深度网络的参数训练与降噪效果

5.5.1 深度网络的参数训练

5.5.2 深度神经网络降噪效果

5.6 深度网络语音增强算法的改进

5.6.1 噪声频率扰动

5.6.2 基于先验信噪比的损失函数权重因子

5.6.3 深度网络模型稀疏化

5.7 主流ASR识别引擎上的提升效果

5.7.1 CMU Sphinx语音识别系统

5.7.2 Kaldi语音识别系统

5.7.3 语音识别实验

5.8 本章小结

第六章 总结与展望

6.1 工作总结

6.2 研究展望

致谢

参考文献

作者简介

展开▼

著录项

  • 作者

    唐於烽;

  • 作者单位

    东南大学;

  • 授予单位 东南大学;
  • 学科 电子与通信工程
  • 授予学位 硕士
  • 导师姓名 邹采荣;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    噪声环境; 鲁棒;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号