首页> 中文学位 >孤立词语音识别芯片中的量化及Viterbi算法研究与实现
【6h】

孤立词语音识别芯片中的量化及Viterbi算法研究与实现

代理获取

目录

孤立词语音识别芯片中的量化及Viterbi算法研究与实现

RESEARCH AND IMPLEMENTATION OF QUANTIZATION AND VITERBI ALGORITHM IN ISOLATED-WORD SPEECH RECOGNITION CHIP

摘 要

Abstract

第1章 绪论

1.1 课题来源及背景

1.2 语音识别的原理和几种模板匹配方法

1.3 语音识别的研究进展

1.3.1 语音识别的发展史

1.3.2 语音识别技术的研究现状

1.4 语音识别技术的前景和应用

1.5 本文的研究内容

第2章 孤立词语音识别模板匹配方法的研究

2.1 引言

2.2 动态时间规整算法

2.3 矢量量化法

2.3.1 训练过程

2.3.2 识别过程

2.4 隐马尔可夫法

2.4.1 隐马尔可夫模型系统概述

2.4.2 Viterbi算法

2.4.3 改进的Viterbi算法

2.4.4 前向算法

2.5 实验结果与分析

2.5.1 实验环境与平台介绍

2.5.2 实验内容、数据及相应的分析

2.6 本章小结

第3章 矢量量化在语音识别中的应用

3.1 引言

3.2 矢量量化的原理

3.3 矢量量化器的最佳码本设计和失真测度

3.3.1 矢量量化器的最佳码本设计

3.3.2 失真测度

3.4 矢量量化的方法

3.4.1 码本搜索的方法

3.4.2 矢量量化的K均值算法

3.4.3 矢量量化的LGB算法

3.4.4 初始码本的选取

3.4.5 空包腔处理

3.5 实验结果与分析

3.6 码本 容量的选取问题

3.7 本章小结

第4章 矢量量化与Viterbi算法的实现

4.1 引言

4.2 矢量量化模块的设计

4.2.1 功能描述

4.2.2 矢量量化模块的硬件建模

4.3 Viterbi模块的硬件建模

4.3.1 Viterbi算法的计算过程

4.3.2 Viterbi算法模块的硬件建模

4.4 FPGA验证

4.5 本章小结

结 论

参考文献

哈尔滨工业硕士学位论文原创性声明

哈尔滨工业大学硕士学位论文使用授权书

致 谢

展开▼

摘要

近年来,随着语音识别技术的不断研究和发展,许多语音识别算法已经非常成熟,并出现了一些商用语音识别软件,例如IBM中文语音识别系统ViaVoice。但专用语音识别芯片的研究和开发还较少,这极大影响了语音识别技术的使用和推广。
  本文研究内容主要应用于小词汇量、非特定人、孤立词的汉语语音识别芯片。论文研究了矢量量化(VQ)和隐马尔可夫模型(HMM)等语音识别技术的算法和原理,完成了基于离散隐马尔可夫模型(DHMM)的Viterbi算法与矢量量化算法的软件及硬件实现。
  论文首先对32、64孤立词语音识别系统,采用了矢量量化法和离散隐马尔可夫模型法进行了定点和浮点的试验比较。在定点实验中,VQ法得到的识别率分别为82.19%和81.26%,离散隐马尔可夫模型法分别取得了98.75%和98.13%的识别率,从而验证了离散隐马尔可夫模型法的优越性。接着,论文提出了改进Viterbi算法,该算法是在求最大路径的基础上,分别求出第二大和第三大路径,然后对第一、第二、和第三大路径进行加权求和。通过实验比较,采用这种算法得到的识别率要比Viterbi识别算法得到的识别率稍高。然后,通过实验确定了量化码本数。对于32、64词孤立语音识别系统,分别进行了定点和浮点实验。通过研究对比,矢量量化码本数选64最适宜。初始码本的选取采用分裂法得到的识别率比随机法得到的高,可见分裂法优于随机法。分析了空胞腔处理对语音识别性能的影响以及码本容量的选取问题。
  最后,论文采用Verilog语言设计了VQ模块和Viterbi译码模块,并完成了功能仿真和逻辑综合。VQ模块采用嵌入的DSP软核实现,论文完成了嵌入汇编语言编写,及代码联调。
  本文采用离散隐马尔可夫模型,Viterbi算法进行译码,量化码本数为64,初始码本采用分裂法,Viterbi译码模块采用硬件实现,目前已经通过了FPGA验证。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号