首页> 中文学位 >移动设备平台上英语口语学习中的语音识别技术
【6h】

移动设备平台上英语口语学习中的语音识别技术

代理获取

目录

封面

声明

上海交通大学学位论文答辩决议书

中文摘要

英文摘要

目录

第一章 绪论

1.1 计算机辅助语言学习概述

1.2 语音识别技术概述

1.3 语音识别系统

1.4 英语口语发音学习概述

1.5 技术难点

1.6 本文组织结构

第二章 语音识别概论

2.1 语音识别系统架构

2.2 Mel频率倒谱系数(MFCC)

2.3 隐马尔可夫模型(HMM)

2.4 本章小结

第三章 英语口语学习的语音识别技术

3.1 CAPT系统介绍

3.2 CAPT系统运用ASR技术可行性分析

3.3 评分算法

3.4 错误检测

3.5 本章小结

第四章 嵌入式系统中的技术改进

4.1 声音特征值提取

4.2 HMM模型选择

4.3 改进Viterbi 对齐算法

4.4 识别过程剪支

4.5 模型存储优化

4.6 本章小结

第五章 系统设计与实现

5.1 设计目标

5.2 系统环境

5.3 设计思路及系统架构

5.4 模块设计

5.5 系统性能分析与测试

5.6 本章小结

第六章 总结与展望

6.1 总结

6.2 改进

参考文献

致谢

攻读硕士学位期间发表的学术论文及参与的项目

展开▼

摘要

随着科技进步和经济的飞速发展,全球智能手机终端性能的极大提高,各大手机厂商纷纷加大智能手机平台的软件开发,各种语音手机也纷纷出现。但是一般手机的语音识别都是为用户提供人际交互方式控制手机的功能,针对英语学习需求的应用研究和开发还是比较缺少。在目前利用英语进行口语交流越来越多的环境下,利用智能手机的便携终端,给用户提供不受时间、地点和教师资源限制的智能英语学习系统,将会为用户提供更好、更快的电子学习手段。
  目前已有的基于PC的智能英语学习软件,已经能提供基于计算机辅助学习技术,让学习者及时得到发音质量评分的智能化功能。若要将此类软件移植到手机平台上,将要受到手机运算速度、存储空间量和总线带宽等因素的限制。针对嵌入式系统的软硬件限制,本文研究了一套在手机平台上基于连续语音识别技术的英语学习系统。该系统利用语音识别技术对学习者发音质量进行有效评估,反馈给用户发音信息,系统开发以卡内基梅陇大学的SPHINX为整个系统核心的识别引擎,该引擎在大词汇量、连续读音识别方面具有优势。实验发现,语音识别过程中,高斯计算以及Viterbi路径查找所消耗的时间最多,因此,本文抛弃一般语音识别算法所用的连续型隐马尔可夫模型,而使用半连续型隐马尔可夫模型,使得识别过程减少大量的高斯计算所消耗的计算量。另外根据英语口语发音学习的特殊应用,以学习句子作为先验知识,在识别过程中进行剪支,只识别所读句子,使得搜索空间大大减少,这也使得系统响应时间大大缩短。
  最后本文进行实验对比 PC平台系统模型以及本文提出的系统各自在手机平台上的性能及准确率的表现,得出结论是,运用半连续型隐马尔可夫模型的系统在丧失少量识别精度的前提下,大大提高了运行速度,以适合在手机平台上使用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号