首页> 中文学位 >中文图书目次自动解析研究——以农业图书为例
【6h】

中文图书目次自动解析研究——以农业图书为例

代理获取

目录

声明

摘要

1 绪论

1.1 研究背景

1.2 研究目的及意义

1.2.1 农业图书自动解析的目的

1.2.2 农业图书目次自动解析的意义

1.3 国内外关于图书目次应用及目次分析现状

1.3.1 国内外关于图书目次的研究现状

1.3.2 国内外关于目次分析方法的研究现状

1.4 研究内容及创新点

1.5 组织结构

2 农业图书目次自动解析研究的理论基础

2.1 扎根理论与编码技术

2.2 决策树技术

3 调查研究设计

3.1 抽样调查法的概念

3.2 抽样调查结果的影响因素

3.3 抽样调查对象与次数

3.4 抽样调查项目和调查表

3.5 调查方式

4 调查数据分析

4.1 基于扎根理论的农业图书目次分类表

4.1.1 一级标题的分析

4.1.2 二级标题的分析

4.2 农业图书目次表中数据的分析

4.2.1 不同级别的农业图书的目次特点

4.2.2 不同年代的农业图书的目录特点

4.2.3 计算机无法分析的农业图书目次类别的发展趋势

5 基于决策树的农业图书目次自动解析

5.1 农业图书目次自动解析算法思想

5.2 农业图书目次自动解析系统设计

5.3 利用分支决策树思想进行农业图书目次自动解析

5.4 农业图书目次自动解析结果分析

6 总结与展望

6.1 总结

6.2 展望

参考文献

致谢

附录

展开▼

摘要

农业图书作为促进现代农业产业发展的重要途径,对提高我国农业科学技术水平,促进农业科学研究和开发推广,提高我国农业工作者的素质具有重要的作用。然而迄今为止,关于农业图书内部信息组织与知识组织的研究还相对滞后,使得农业图书的相关信息和知识内容无法彰显,知识组织程度低,严重阻碍了农业人员利用农业图书的速度与效率。
  本论文以实现农业图书目次的自动解析为主要目标,在对农业图书目次进行深入调研与系统梳理的基础上,显性化农业图书目次的编辑规律,并结合人工智能技术,形成一种准确实用的农业图书目次自动解析方法,从而达到快速、准确地对农业图书目次类型进行解析的目的。农业图书目次自动解析技术可以通过对农业图书目次逻辑组织标识的识别和分类,达到进一步解析农业目次的目的,从而提高人们利用农业图书的速度与准确率,提高农业图书资源的利用率。另外,实现计算机对农业图书目次的自动解析还能够细化农业图书信息研究的粒度,促进情报学与农业科学的交叉应用。
  本论文采用定性研究与定量研究相结合的方法,首先阐明利用抽样调查法、扎根理论、决策树算法和编码技术等研究方法进行农业图书目次自动解析的可行性;然后在抽样调查理论的指导下,从校图书馆中抽取1009本农业图书样本,详细记录这些调查样本的出版年代、一级标题、二级标题等调查子目,为后续的数据分析打下扎实良好的基础;之后,根据扎根理论的研究方法,对农业图书目次样本的一级标题、二级标题和三级标题进行开放性译码、主轴译码和选择性译码三个步骤地分析,归纳总结出农业图书目次的分类规律;接着在编码技术和决策树算法思想的指导下,利用该分类规律,构建农业图书目次自动解析模型,并从省图书馆的农业图书中抽取500本农业图书目次样本来检测农业图书目次自动解析模型的准确率,最后对该模型的准确率进行评价。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号