基于FISHER品质的中文姓名语音识别技术

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

目前广泛使用的语音识别算法包括矢量量化(Vector Quantization,VQ)，高斯混合模型(Gaussian Mixture Model,GMM)，隐马尔可夫模型(Hidden Markov Model,HMM)等。这些经典的语音识别算法是基于模式匹配的方法实现，这使其在语音分类中的性能受到挑战，尤其是在对相近的中文姓名语音的分类中。
　　近年来提出的支持向量机和上述模型有根本的区别，其本质是一种判别式模型，因此对于相近模式有较强的识别性能。经典的语音识别模型能够对不定长语音建模，而支持向量机具有更强的分类能力，因此如果能够将二者结合起来，则可能充分发挥它们的优点。支持向量机中使用的核方法为我们提供了途径。Fisher核的提出首次实现了将概率模型与支持向量机等判别式分类器相结合，并应用于生物同源性检测中。
　　Fisher核中的关键参数，即Fisher品质(Fisher score)，表示了待分类模式通过概率模型提取的特征向量。本文就是试图通过语音识别中的概率生成模型(GMM,HMM)推导Fisher品质，并将其用于语音识别。Fisher品质可以将不定长语音特征序列映射到固定长度的品质空间，作为支持向量机分类的特征空间。
　　本文对语音识别的经典算法(VQ,GMM,HMM)进行了比较深入的考察，并开发了基于PC的姓名语音身份验证系统。算法之间的联系为推导Fisher品质提供了方便，因此本文首先从简单的GMM入手推导Fisher品质，再过渡到通过HMM求取Fisher品质。对于从HMM求取Fisher品质，本文从HMM的训练算法中用到的前向－后向变量入手，利用这些变量表示模型最终输出概率，并且将其转换为矩阵形式，为推导和理解提供了方便。
　　基于对Fisher品质的本质作用的分析，本文对Fisher品质空间做了扩展，在扩展品质空间中引入了新的品质向量。并从泰勒级数展开式的角度论述了各类品质向量的物理意义的不同，最后通过实验验证了扩展品质空间有利于分类性能的改善。
　　本文通过对经典语音识别模型的实验，比较了不同算法的性能，揭示了生成模型在对相近语音，特别是相近中文姓名语音的识别中具有较高的误识率。通过利用线性和非线性支持向量机分类的实验，验证了Fisher品质空间及扩展的品质空间是有效的特征空间，通过将生成模型与支持向量机相结合，可以提高对相近中文姓名语音模式的分类性能。

著录项

作者
高毅;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科检测技术与自动化装置
授予学位硕士
导师姓名雷霖;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
中文姓名; 语音识别; Fisher品质; 分类性能; 支持向量机;

相似文献

中文文献
外文文献
专利

1. 基于中文语音识别技术的舰艇指挥训练系统的研究 [J] . 景春进 ,陈东东 ,周琳琦 . 计算机测量与控制 . 2014,第008期
2. 基于核 Fisher 判别的中文文本情感分类研究 [J] . 邢玉娟 ,李恒杰 ,曹晓丽 . 计算机技术与发展 . 2013,第001期
3. 基于印尼青年华人中文姓名的社会语言学考察 [J] . 张锦玉 . 八桂侨刊 . 2016,第003期
4. 基于姓氏用字驱动与统计的中文姓名识别方法的研究 [J] . 方玉萍 ,罗陈红 ,陈恳 . 计算机与现代化 . 2013,第003期
5. 基于统计的中文四字姓名识别方法 [J] . 刘兴义 ,李成城 . 山东商业职业技术学院学报 . 2012,第004期
6. 基于姓氏优先级的中文姓名自动识别 [C] . 余祖波 ,高庆狮 ,北京科技大学智能语言研究所 . 2005中国计算机大会 . 2005
7. 基于唯一性特征的中文论文作者姓名消歧实证研究 [A] . 于夏薇 . 2017

基于FISHER品质的中文姓名语音识别技术

目录

摘要

著录项

相似文献

相关主题

期刊订阅