文摘
英文文摘
声明
第1章 绪论
1.1.计算机发音评测技术的背景
1.1.1.概述
1.1.2.计算机发音评测研究历史及现状
1.2.计算机发音评测对普通话水平测试的意义
1.3.论文研究目标及内容安排
第2章 计算机发音评测系统简介
2.1.发音评测系统的主要研究内容
2.1.1.语料库及标注数据库的设计和建立
2.1.2.发音评测算法研究
2.1.3.打分映射模型的研究
2 2.基线系统的建立
2.2.1.语料库及标注数据库的设计和建立
2.2.2.发音评测算法的选择
2.2.3.性能评价指标选择
2.2.4.基线系统的实验
2.3.本章小结
第3章 改进的对数后验概率算法
3.1.基于语音学知识的识别网络搭建
3.1.1.普通话水平测试中的语言学知识
3.1.2.实际应用中对数后验概率的计算问题
3.1.3.基于语言学知识的改进
3.2.基于KLD差的识别网络搭建
3.2.1.方言发音错误模式在模型间距离上的反映
3.2.2.基于模型间距离的错误模式生成方法及其不足
3.2.3.基于模型间距离差的错误模式生成思想
3.2.4.如何计算两个HMM之间的KLD
3.2.5.基于KLD差的统计错误模式生成算法
3.3.带音素权重因子的后验概率规整算法
3.3.1.普通话水平测试等级标准中的难点音与等级判定
3.3.2.真实数据上的音素权重分析
3.3.3.带音素权重因子的后验概率规整算法
3.4.实验及实验结果
3.4.1.实验配置
3.4.2.实验结果
3.5.本章小结
第4章 模型自适应在发音评测中的运用
4.1.MLLR原理介绍
4.1.1.MLLR基础
4.1.2.辅助函数的定义
4.1.3.最大化辅助函数
4.1.4.Tied Regression Matrices的估计公式
4.2.MAP原理介绍
4.2.1.MAP自适应简介
4.2.2.语音识别的MAP自适应策略
4.3.选择性自适应策略介绍
4.3.1.语音识别与发音评测对语音模型需求的差异分析
4.3.2.选择性自适应策略
4.3.3.选择性自适应策略的语料选择粒度
4.3.4.不同的数据筛选门限的影响分析
4.4.实验及结果
4.4.1.实验配置
4.4.2.实验结果
4.5.本章小结
第5章 时长和语速特征在发音评测上的应用
5.1. 早期关于语速的研究
5.2. 基于ANGIE的时长模型建模
5.2.1.时长归一化
5.2.2.相对语速
5.3. 时长相关实验及实验结果
5.3.1“绝对语速”——Nelson Morgan定义的语速实验结果
5.3.2“相对语速”——ANGIE模型语速实验结果
5.3.3音素分位置统计时长分布的实验结果
5.4. 时长得分对整体评测系统的改进性能
5.4.1.实验配置
5.4.2.实验结果
5.5. 本章小结
第6章 发音评测中的回归策略研究
6.1.针对普通话水平测试新分差
6.2.常用回归策略分析
6.3.置信区间分段线性回归
6.4.GMM概率加权分段线性回归
6.5.SVM分类分段线性回归
6.6.实验及实验结果
6.6.1.实验配置
6.6.2.基线回归系统性能
6.6.3.置信区间分段线性回归实验结果
6.6.4.GMM概率加权分段线性回归实验结果
6.6.5.SVM分类分段线性回归实验结果
6.1. 本章小结
第7章 论文工作总结及展望
7.1.论文工作总结
7.2.今后改进方向
参考文献
博士期间发表的论文和参与的研究工作
致谢
中国科学技术大学;