声明
第一章 绪论
1.1.1语音增强
1.1.2 语音增强分类
1.2 国内外研究现状
1.2.1 传统方法
1.2.2 有监督学习的语音增强算法
1.2.3 现存语音增强算法存在的问题
1.3 本文结构安排
第二章 单通道语音增强模型
2.1.1 语音信号特性
2.1.2 人耳感知特性
2.1.3 噪声特性
2.1.4 语音信号预处理
2.1.5 带噪语音的信号模型
2.2.1 谱减法
2.2.2 基于统计模型的算法
2.2.3 子空间算法
2.3 基于BP神经网络的语音增强算法
2.3.1浅层神经网络(Shallow NN)
2.3.2 基于深度学习语音增强算法
2.4 语音增强算法性能度量标准
2.4.1 主观质量评估方法
2.4.2 客观质量评估方法
2.5 本章小结
第三章 深度学习的基本理论
3.1 人工智能、机器学习和深度学习
3.2 神经元和神经网络模型
3.2.1 神经元(Neuron)
3.2.2 卷积神经网络
3.3 成本函数
3.4 神经网络的训练
3.4.1 梯度下降算法及其改进
3.4.2 反向传播算法
3.4.3 深度学习中的正则化
3.5 本章小结
第四章 基于深度自动编码器的语音增强
4.1 引言
4.2.1 算法总体设计
4.2.2 激活函数的选择
4.3.3 模型泛化
4.4.1 数据集
4.4.2 实验环境搭建
4.4.3 算法评价标准
4.4.4 实验与结果分析
4.5 本章小结
第五章 基于自动编码生成对抗网络的语音增强
5.1.1 原始GAN
5.1.2 GAN的改进
5.2 基于AE-CGAN的语音增强
5.3 AE-CGAN的网络设计
5.3.1 生成模型的网络设计
5.3.2 判别模型的网络设计
5.4.1 数据集
5.4.2 实验环境搭建
5.4.3 实验配置
5.5 实验结果
5.5.1 算法评价标准
5.5.2 实验与结果分析
5.6 本章小结
第六章 总结与展望
参考文献
致谢
攻读学位期间参与的科研项目和研究成果