首页> 中文学位 >高斯混合模型用于语音情感识别研究
【6h】

高斯混合模型用于语音情感识别研究

代理获取

目录

摘要

第一章 绪论

1.1 语音情感识别研究背景及意义

1.2 语音情感识别历史概述

1.3 语音情感识别国内外研究现状

1.4 语音情感识别所面临的问题

1.5 论文的章节安排

第二章 情感理论的基础

2.1 情感的定义

2.2 情感的分类

2.1.1 离散情感模型

2.2.2 维度情感模型

2.2.3 两种情感模型的比较

2.3 情感语料库的建立

2.3.1 代表性的情感语料库介绍

2.3.2 本文选用的语料库

2.4 本章小结

第三章 语音信号的预处理和情感特征参数的提取

3.1 语音信号的预处理

3.1.1 预加重处理

3.1.2 分帧加窗处理

3.1.3 语音信号的端点检测

3.2 语音情感特征的提取

3.2.1 语速

3.2.2 短时能量

3.2.3 基音频率

3.2.4 共振峰

3.2.5 Mel频率倒谱系数

3.3 本章小结

第四章 语音情感的识别模型

4.1 支持向量机

4.1.1 支持向量机理论

4.1.2 支持向量机多分类

4.1.3 实验及结果分析

4.2 层次模型

4.2.1 决策树基本流程

4.2.2 决策树实验及结果分析

4.2.3 分层模型实验及结果分析

4.3 本章小结

第五章 语音基本情感的高斯混合模型

5.1 高斯混合模型的理论基础

5.2 语音基本情感的高斯混合模型的实验

5.2.1 GMM模型参数初始化

5.2.2 GMM模型参数估计

5.2.3 GMM模型的语音基本情感识别

5.3 实验结果分析

5.4 本章小结

第六章 总结和展望

6.1 总结

6.2 展望

参考文献

致谢

声明

展开▼

摘要

语音情感识别技术是人工智能(AI)领域的一个重要分支,该技术是通过对语音信号进行分析处理来识别说话者当时的情感状态。随着计算机科学技术与其他学科如生理学、心理学、统计学等相互交叉和发展,语音情感识别技术获得了显著的进展。情感自身具有主观性和复杂性,对情感进行建模,开展情感计算研究具有重大的理论和实践意义。随着计算机技术和机器智能技术的发展,越来越多的人工智能设备和产品将会被开发出来,并会在社会生活的各个领域中得到广泛的应用,如教育行业、医学界、服务行业和工业等领域。本文采用高斯混合模型,对语音情感识别问题做了较系统的研究。
  首先,基于情感理论基础知识确立了本文的实验语料库,并选取了四种基本情感状态作为本文的研究对象,即生气、高兴、恐惧、悲伤。接着对语音信号进行预处理操作,便于提取更为有效的情感特征。
  其次,鉴于语音情感特征提取的好坏将会直接影响识别的效果,所以本文的特征参数提取兼顾韵律学、音质以及谱等三个方面,这些特征分别是语速、短时能量、基音频率、共振峰参数以及Mel频率倒谱系数(MFCC)五类特征,对这一系列特征进行提取计算和分析研究,最终确定了21种语音情感特征作为高斯混合模型(GMM)的输入参数。
  再次,通过选取不同的情感特征和不同的识别模型进行实验,寻找能区分各种情感的有效情感特征。本文先选用支持向量机(SVM)模型进行识别,通过对比不同的核函数的识别效果决定选用线性核,并且使用网格搜索法确定了用于识别的最优参数;然后采用层次模型决策树、分层模型分别进行识别。
  最后,利用已确定的21种语音情感特征和高斯混合模型在语料库的训练数据集上对四种基本情感建立识别模型。在建模的过程中,使用到了极大似然估计(MLE)和期望最大化(EM)算法对高斯混合模型的参数进行优化。在进行优化训练的过程中,极大似然估计详细推演了期望最大化算法迭代并直到最后收敛的过程。最终确定了最优的高斯混合模型,并使用该模型在测试数据集上进行了识别实验。同时对其他三种识别模型(即支持向量机、决策树和分层模型)的实验结果做了详细的分析,最后通过对比分析四种模型的实验结果说明了使用高斯混合模型在本文选取的四种基本情感进行识别时具有更强的区分能力,同时也验证了期望最大化算法的参数估计对高斯混合模型的识别率具有重大影响。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号