首页> 中文学位 >语音自动识别技术及其在电信彩铃业务中的应用研究
【6h】

语音自动识别技术及其在电信彩铃业务中的应用研究

代理获取

目录

声明

摘要

插图索引

符号对照表

缩略语对照表

第一章 语音识别的发展及研究概述

1.1 国际语音识别技术研究历史

1.2 我国国内语音识别研究的历史回顾

1.3 现代语音识别技术的发展

第二章 现代语音识别技术原理及关键技术

2.1 语音识别系统的分类

2.2 语音信号的预处理

2.2.1.语音信号的数字化和预处理

2.2.2.端点检测

2.3 语音信号的特征提取

2.3.1 线性预测倒谱系数LPCC

2.3.2 Mel倒谱系数MFCC

2.3.3 LPCC系数与MFCC系数的对比

2.4 基于DTW的语音识别

2.4.1 动态时间规整算法

2.4.2 基于动态时间规整的孤立词语音识别仿真

2.5 HMM理论下的语音识别

2.5.1 HMM模型

2.5.2 HMM模型的实现方案

2.5.3 Matlab仿真

2.6 语音云

2.7 VoiceXML技术

2.8 小结

第三章 彩铃语音识别平台

3.1 彩铃业务概述

3.1.1 现有定制方式及其局限性

3.1.2 “彩铃语音识别平台”介绍

3.2 总体架构

3.3 软件结构

3.3.1 业务部分逻辑结构

3.3.2 AVP平台

3.4 彩铃语音识别平台组网方案

3.5 关键技术和设计

3.5.1 语音合成技术

3.5.2 语音识别技术

3.5.3 哼唱识别技术

3.5.4 歌词识别等应用技术

3.5.5 VoiceXML

3.5.6 VUI设计创新

3.5.7 回声消除

3.5.8 降噪

3.6 彩铃语音识别平台场景及脚本代码

总结

参考文献

致谢

作者简介

展开▼

摘要

语音识别技术(Automatic Speech Recognition)又称ASR技术,它是一种将人声语音信号转化为可以被计算机程序识别的文字信息,从而识别、了解讲话人所发出指令和意图的技术。语音识别技术的终极目标是实现机器与人之间可通过自然语言进行互动。二十世纪五十年代,美国电话电报公司(ATT)贝尔实验室里建成第一台语音识别系统——Audry系统,它仅能识别十个英文数字。上世纪八十年代末期,数字信息技术、计算机软硬件技术的发展掀起前所未有的高潮,为语音识别的研发带来坚实的技术支撑。语音识别技术在商业领域首先得以应用,并迅速扩展到社会生产和生活的每一领域,自身也受到不断更新的技术的要求。
  本文首先在第一章简要介绍国内外语音识别技术的发展现状。其次,从ASR技术的基本模型方面,介绍了端点检测、预处理、模块生成、模块匹配和模块管理等环节中的模式识别和数字信号处理的原理。本文通过分析和研究语音识别技术的发展历程,分别通过HMM(隐马尔科夫模型)和DTW(动态时间规正法)设计汉语语言的语音识别系统。HMM具有较强的时间序列建模能力,对时间进行特征参数的训练,每个语音对应自己的隐马尔科夫模型,语音与隐马尔科夫模型进行对应匹配,完成识别过程。HMM通常适用在需要识别大词汇量的情况。DTW能够很好的处理语音信号特征参数的时间长短不同性问题,具有识别速度快、系统费用少和有效的小词汇量处理作用。每节结尾都通过Matlab进行仿真,并提供脚本。最后对整个彩铃语音识别平台的系统进行了系统的介绍。彩铃语音识别平台通过运用声动炫铃系统中的IVR架构设计技术,并结合语音识别和语音合成等语音领域的关键技术,采用voice xml标准语言工具研发的一个应用系统。用户通过输入一个特定的号码进入服务器,用语音或者按键选出歌手名或者歌曲的形式传输给系统命令,就能获得自己定制彩铃。通过采用专用的语言界面,方便用户的操作过程,主要使用VXML技术实现电话流程。彩铃语音识别系统还设有彩铃语音识别平台场景及脚本代码。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号