首页> 中文学位 >基于深度学习的特定人单声道语音分离研究
【6h】

基于深度学习的特定人单声道语音分离研究

代理获取

目录

第1章 绪论

1.1 课题研究背景及其意义

1.2 语音分离技术研究现状

1.2.1 传统语音分离技术研究现状

1.2.2 基于深度学习的语音分离研究现状

1.3 单声道语音分离的主要问题及解决方案

1.4 本文主要工作内容

1.5 本文各章节组织结构

第2章 语音基础知识和传统单声道语音分离方法

2.1 语音基础知识

2.1.1 语音信号的产生

2.1.2 人耳的听觉感知和掩蔽效应

2.1.3 语音信号的时域分帧

2.1.4 语音信号的短时频域处理技术

2.2 基于CASA的语音分离方法

2.3 基于模型的单声道语音分离方法

2.3.1 基于NMF的单声道语音分离方法

2.3.2 基于浅层神经网络的单声道语音分离

2.4 本章小结

第3章 基于频谱域的深度学习语音分离系统介绍

3.1 引言

3.2 基于频谱域的深度学习语音分离系统

3.3 时频分解

3.4 特征提取

3.5 训练目标

3.6 模型训练

3.6.1 动量梯度下降算法Momentum

3.6.2 Nesterov梯度加速法

3.6.4 RMSprop 算法

3.6.5 Adam算法

3.7 波形重构

3.8 评价指标

3.9 本章小结

第4章 基于循环神经网络的单声道语音分离

4.1 深层神经网络基础

4.2. 网络结构比较

4.2.1 DNN网络结构及其语音分离应用

4.2.2 CNN网络结构及其语音分离应用

4.2.3 循环神经网络结构及其语音分离应用

4.3 基于循环神经网络的语音分离系统

4.4 实验设置

4.4.1 数据设置

4.4.2 网络参数设置

4.5 实验结果及分析

4.6 本章小结

第5章 基于改进的一维卷积U-Net网络的时域语音分离

5.1 传统深度学习语音分离模型存在的问题

5.2 U-Net网络的基本原理

5.2.1 U-Net网络的模型动机

5.2.2 U-Net网络结构原理

5.3 时域语音分离改进的U-Net网络

5.3.1 选择U-Net进行时域语音分离的依据

5.3.2 时域语音分离的改进U-Net网络结构

5.4 实验设置和结果分析

5.4.1 初始基线模型实验设置和结果分析

5.4.2 不同输入语音长度的对比实验

5.4.3 不同深度网络结构对分离性能的影响

5.4.4 1D-UNet时域分离网络和BLSTM网络分离性能比较

5.5 本章小结

第6章 总结与展望

6.1 总结

6.2 展望

参考文献

攻读硕士期间取得的科研成果

致谢

声明

展开▼

著录项

  • 作者

    张一萱;

  • 作者单位

    广西师范大学;

  • 授予单位 广西师范大学;
  • 学科 电子科技与技术
  • 授予学位 硕士
  • 导师姓名 胡维平;
  • 年度 2020
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP3U46;
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号