首页> 中文学位 >基于ANN/HMM混合模型汉语大词表连续语音识别系统建立
【6h】

基于ANN/HMM混合模型汉语大词表连续语音识别系统建立

代理获取

目录

基于ANN/HMM混合模型汉语大词表连续语音识别系统建立

ESTABLISHMENT OF MANDARIN LARGE VOCABULARY CONTINUOUS SPEECH RECOGNITION BASED ON HYBRID ANN/HMM MODELS

摘 要

ABSTRACT

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状及分析

1.3 主要研究内容

第2章 ANN/HMM混合模型

2.1 人工神经网络模型(ANN)

2.1.1 人工神经网络的结构

2.1.2 人工神经网络隐含层神经元数选择

2.1.3 人工神经网络训练算法

2.2 隐马尔科夫模型(HMM)

2.2.1 HMM概述

2.2.2 HMM种类

2.2.3 HMM基本算法

2.3 ANN/HMM混合模型

2.3.1 ANN/HMM混合模型的优势

2.3.2 ANN与HMM在语音识别中的混合方式

2.3.3 预测型神经网络与隐马尔可夫模型混合模型

2.4 本章小结

第3章 ANN/HMM混合模型系统的建立方法

3.1 概述

3.2 声学模型的建立

3.2.1 模型单元的选取

3.2.2 建立单音素模型

3.2.3 建立三音素模型

3.2.4 建立状态绑定的三音素模型

3.2.5 建立多维高斯混合分布的三音素模型

3.2.6 ANN模型训练算法

3.3 语言模型的建立

3.4 HMM解码

3.4.1 令牌传递算法

3.4.2 令牌解码过程

3.5 本章小结

第4章 系统框架与实验分析

4.1 ANN/HMM混合模型系统框架

4.2 语音信号预处理与特征提取

4.2.1 语音信号预处理

4.2.2 语音特征参数提取

4.3 实验数据

4.4 ANN/HMM混合模型系统性能分析

4.4.1 测试集数据分布

4.4.2 系统识别率分析与多路径技术

4.5 本章小结

结论

参考文献

攻读学位期间发表的学术论文

哈尔滨工业大学硕士学位论文原创性声明

哈尔滨工业大学硕士学位论文使用授权书

致谢

个人简历

展开▼

摘要

语音识别是一门内涵丰富、应用广泛的技术,在一些应用领域中正迅速成为一个关键的具有竞争力的技术,如用于自动口语翻译,实现跨语言交流。本文以汉语大词表连续语音识别为应用背景,主要研究了基于人工神经网络模型(ANN)与隐马尔可夫模型(HMM)相结合的混合模型。
  本文详细分析了ANN和HMM的优点与缺点。深入研究了五种主要的ANN/HMM混合模型:早期模拟HMM算法的尝试;用ANN估计HMM的状态后验概率;基于全局最优训练方法的混合模型;ANN作为离散型HMM的矢量量化器;ANN作为HMM的后处理器。
  本文研究了ANN/HMM混合模型的优势,并提出了一种基于隐马尔可夫模型和人工神经网络混合模型的汉语大词表连续语音识别系统。在混合模型系统中,多种模型协同工作。ANN是状态级模型,负责建模音素发音物理特性;HMM联合语言学模型识别待识语料。这样,混合模型系统能够结合HMM和ANN两种模型的优点:HMM对时间序列结构建模能力强;ANN的非线性预测能力强,建模能力强,鲁棒性,便于硬件实现。最后,考虑到音节发音的发音变化性和神经网络的结构特点,将多路径建模技术引进系统,明显减少了删除错误,增强了系统的建模能力。
  实验结果表明,HMM/ANN混合模型系统有效结合了两种模型的优点,提高了识别率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号