首页> 中文学位 >基于图像识别技术的手机单词听写软件的研究与开发
【6h】

基于图像识别技术的手机单词听写软件的研究与开发

代理获取

目录

声明

摘要

第1章 绪论

1.1 课题研究的意义

1.2 国内外研究现状

1.3 研究内容

1.4 文章组织结构

第2章 相关技术简介和手机光学字符识别分析

2.1 光学字符识别

2.2 神经网络简介

2.3 TTS发声技术

2.4 手机成像特点

2.5 手机光学字符识别技术的分析

2.6 本章小结

第3章 预处理算法研究与设计

3.1 概述

3.2 图片压缩

3.3 灰度化处理

3.4 二值化算法的研究与改进

3.4.1 算法分析与改进

3.4.2 全局阀值算法的选取

3.4.3 Bernsen算法的改进

3.5 倾斜校正

3.6 字符分割

3.7 大小归一

3.8 本章小结

第4章 特征提取算法研究与设计

4.1 特征提取概述

4.2 基于结构特征的提取算法

4.3 基于统计特征的提取算法

4.4 本文的特征提取

4.5 本章小结

第5章 基于BP神经网络的字符识别

5.1 BP神经网络概述

5.2 网络结构设计

5.3 节点数选取方法的改进

5.4 数学模型

5.5 自适应学习速率

5.6 期望误差

5.7 样本采集和训练

5.8 结果与分析

5.9 本章小结

第6章 手机单词听写软件的设计与实现

6.1 概述

6.2 系统环境

6.3 系统设计

6.4 系统实现

6.4.1 图片识别

6.4.2 自定义听写

6.4.3 触屏图片编辑

6.4.4 语音发声

6.5 软件使用演示

6.6 结果分析

6.6.1 识别率分析

6.6.2 单词录入效率对比

6.7 软件特点

6.8 本章小结

结论和展望

致谢

参考文献

攻读硕士学位期间发表的论文

展开▼

摘要

随着全球信息化进程加速,提高信息处理的效率已成为当务之急。伴随Android操作系统的普及和光学字符识别技术(Optical Character Recognition,简称OCR)的研究,如何利用智能移动设备高效地录入文档信息已成为一个的热门问题。
  本文分析了手机成像的特点,研究了光学字符识别技术中的字符预处理、特征提取和分类识别算法。在字符预处理中依次对原图像进行了压缩、灰度处理、二值化处理、方向矫正、字符分割和归一化处理。对原图片使用双线性插值算法成比例压缩;采用OpenCV开放库的灰度权值进行灰度化;在二值化处理中对传统方法进行比较研究,针对不同图像设计了不同的二值化处理方法,并对传统Bemsen算法进行改进,对原图片和高斯滤波后的图片分别用Bemsen算法计算,用求得的两个阀值重新计算新的阀值。采用平滑游程算法和细化处理对倾斜图片进行校正;利用水平投影和垂直投影方法分割图片字符;最后采用双线性插值法将每个字符图片归一为24*36px。对结构特征和统计特征的两类提取方法进行研究,确立了本文的特征提取方案:提取54个粗网格特征向量和20个穿透特征向量,并合并写入特征文件。采用三层BP神经网络算法识别字符。为了提高算法效率,本文对网络节点数的选取办法进行改进。最后在Matlab软件中对神经网络进行仿真实验,读取特征文件并分类识别,通过实验结果验证了该算法的可行性。
  结合对手机光学字符识别的研究和中小学英语单词听写的需求,本文在Android环境下设计实现了中小学生单词听写软件。软件主要分为图像识别、单词听写和系统功能三部分,听写可以选择手机听写和纸张听写。该应用通过OCR技术实现从手机图片到文本的转换,利用语音合成技术实现从文本到语音的转换。单词听写软件能够直接从图片中识别英文单词并朗读听写,使用起来方便快捷,能够达到辅助教学、帮助听写的目的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号