高斯混合模型用于语音情感识别研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

语音情感识别技术是人工智能(AI)领域的一个重要分支，该技术是通过对语音信号进行分析处理来识别说话者当时的情感状态。随着计算机科学技术与其他学科如生理学、心理学、统计学等相互交叉和发展，语音情感识别技术获得了显著的进展。情感自身具有主观性和复杂性，对情感进行建模，开展情感计算研究具有重大的理论和实践意义。随着计算机技术和机器智能技术的发展，越来越多的人工智能设备和产品将会被开发出来，并会在社会生活的各个领域中得到广泛的应用，如教育行业、医学界、服务行业和工业等领域。本文采用高斯混合模型，对语音情感识别问题做了较系统的研究。
　　首先，基于情感理论基础知识确立了本文的实验语料库，并选取了四种基本情感状态作为本文的研究对象，即生气、高兴、恐惧、悲伤。接着对语音信号进行预处理操作，便于提取更为有效的情感特征。
　　其次，鉴于语音情感特征提取的好坏将会直接影响识别的效果，所以本文的特征参数提取兼顾韵律学、音质以及谱等三个方面，这些特征分别是语速、短时能量、基音频率、共振峰参数以及Mel频率倒谱系数(MFCC)五类特征，对这一系列特征进行提取计算和分析研究，最终确定了21种语音情感特征作为高斯混合模型(GMM)的输入参数。
　　再次，通过选取不同的情感特征和不同的识别模型进行实验，寻找能区分各种情感的有效情感特征。本文先选用支持向量机(SVM)模型进行识别，通过对比不同的核函数的识别效果决定选用线性核，并且使用网格搜索法确定了用于识别的最优参数;然后采用层次模型决策树、分层模型分别进行识别。
　　最后，利用已确定的21种语音情感特征和高斯混合模型在语料库的训练数据集上对四种基本情感建立识别模型。在建模的过程中，使用到了极大似然估计(MLE)和期望最大化(EM)算法对高斯混合模型的参数进行优化。在进行优化训练的过程中，极大似然估计详细推演了期望最大化算法迭代并直到最后收敛的过程。最终确定了最优的高斯混合模型，并使用该模型在测试数据集上进行了识别实验。同时对其他三种识别模型（即支持向量机、决策树和分层模型）的实验结果做了详细的分析，最后通过对比分析四种模型的实验结果说明了使用高斯混合模型在本文选取的四种基本情感进行识别时具有更强的区分能力，同时也验证了期望最大化算法的参数估计对高斯混合模型的识别率具有重大影响。

著录项

作者
蔡桂林;
展开▼
作者单位

广西师范大学;

展开▼
授予单位广西师范大学;
学科计算机应用技术
授予学位硕士
导师姓名黄汉明;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
语音情感识别; 特征提取; 高斯混合模型;

相似文献

中文文献
外文文献
专利

1. 用于图像分割的多分类高斯混合模型和基于邻域信息的高斯混合模型 [J] . 柴五一 ,杨丰 ,袁绍锋 . 计算机科学 . 2018,第011期
2. 支持向量机应用于语音情感识别的研究 [J] . 张石清 ,赵知劲 ,戴育良 . 声学技术 . 2008,第1期
3. 用于高斯混合模型参数估计的EM算法及其初始化研究 [J] . 肖维 . 电子测试 . 2011,第006期
4. 用于跨库语音情感识别的DBN特征融合方法 [J] . 张昕然 ,巨晓正 ,宋鹏 . 信号处理 . 2017,第005期
5. 融合模糊认知图用于语音情感识别 [J] . 张卫 ,张雪英 ,孙颖 . 计算机工程与应用 . 2017,第015期
6. 基于自适应高斯混合模型的遥感影像分类方法研究——以武汉地区遥感影像分类为例 [C] . LI Dengchao ,李登朝 ,WU Jian . 2015湖北地质科技论坛 . 2015
7. 基于高斯混合模型的语音情感识别研究与实现 [A] . 顾鸿虹 . 2009

高斯混合模型用于语音情感识别研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅