基于扫描表方法和命令串方法的数学公式识别与文本转化的理论研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

数学公式广泛存在于各类文献之中。数学公式的识别就是将科学和工程文献中的数学公式文件转化成可编辑的公式文本的形式。这对于数学资料的高比例压缩和快速利用、建立数字化图书馆以及按照数学公式进行文献检索等都有着极其重要的作用。但足公式的识别远比汉字和英文字符的识别困难的多。1968年，R.H.ANDERSON在其博士论文中首次提出了公式识别问题。经过30多年的研究，在这个领域出现了一些研究型论文，同时也出现了一些数学公式识别系统。本文对于数学公式的识别，提出了基于扫描表方法和命令串方法的理论。通过扫描圈的提取函数，所有的连笔符号，即几何圈都可以迅速转化为数字串，利用扫描表提取函数将数字串转换成扫描链与扫描阵的组合，进而得到命令串。这个过程用于完成符号的识别，属于微观识别。然后，将得到的命令串进行结构调整，实现公式文件的文本化，拟得到的可编辑文本是Latex格式的文本，这个过程属于宏观识别。同时，简要分析了一些复合公式的Latex文本化原理。文中给出了一些C++代码，用于探索建立基于扫描表方法和命令串方法的公式识别系统。

著录项

作者
程值军;
展开▼
作者单位

兰州大学;

展开▼
授予单位兰州大学;
学科应用数学
授予学位硕士
导师姓名张志强;
年度 2007
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
扫描圈,扫描表,命令串,数学公式识别,文本转化;

相似文献

中文文献
外文文献
专利

1. 一种基于互信息的串扫描中文文本分词方法 [J] . 赵秦怡 ,王丽珍 . 情报杂志 . 2010,第007期
2. 基于扩展扫描区域的现场表计指针识别方法 [J] . 黄炎 ,李文胜 ,李英杰 . 电测与仪表 . 2020,第016期
3. 基于命令语法结构特征的IRC僵尸网络控制命令识别方法 [J] . 闫健恩 ,张兆心 ,许海燕 . 高技术通讯 . 2013,第006期
4. 基于公式识别器的PDF图像数学公式定位结果错误校正方法 [J] . 孙静 . 兰州工业学院学报 . 2020,第006期
5. 基于公式识别器的PDF图像数学公式定位结果错误校正方法 [J] . 孙静 . 兰州工业学院学报 . 2020,第006期
6. 一种基于特征串比较的自动眉毛识别方法 [C] . 杨洋 ,杨新武 ,李玉鉴 . 第四届图像图形技术与应用学术会议 . 2009
7. 基于预警文本信息的列车调度命令智能生成方法研究 [A] . 胡雨欣 . 2020

基于扫描表方法和命令串方法的数学公式识别与文本转化的理论研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅