数字图书馆文本自动分类系统的设计与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

互联网的迅速发展,信息爆炸式的增长,为数字图书馆的发展提供了巨大的推动力。数字图书馆是一个新兴的,涉及到因特网、多媒体、数据仓库、数据挖掘和知识产权保护等诸多技术的计算机应用领域,数字图书馆中保存大量的信息和知识,然而面对大量的信息资源,人们很难从中准确、充分、快速地找到有用的信息,如何高效地处理这些文本信息成为信息处理领域的研究热点。基于人工智能技术的文本自动分类成为研究解决这个问题的重要技术。本文是在数字图书馆系统的环境下,对资源库中的保存的网页进行有效分类的研究,主要涉及以下几个方面：网页数据采集、数据预处理、特征约简及文本分类,其中文本分类模型的设计是本文的核心内容。本文先从文本分类的基础理论着手,阐述了文本分类系统的理论及分类的关键技术和主要算法,对各种方法的理论依据、适用条件和范围及优、缺点进行了比较分析；然后详细介绍了人工智能领域两种关键技术-粗糙集和径向基函数神经网络的相关理论；以河北经贸大学图书馆文本数据为背景,针对数字图书馆文本资源以及中文语言的特点,借助粗糙集很好的处理模糊和不确定性问题的能力和RBF神经网络的卓越的函数逼近能力和快速学习能力,建立了基于Rough-RBFNN的数字图书馆文本自动分类模型并对神经网络进行了优化,在此基础上设计、实现了数字图书馆文本自动分类系统。理论研究与实际测试表明,本文采用的基于粗糙集--神经网络相结合的文本分类模型,通过粗糙集的属性约简方法,降低文本维数,简化神经网络的结构,减少网络的训练时间,可以快速准确地得到满意的输出,是一种较为科学的文本分类方法。

著录项

作者
李静;
展开▼
作者单位

北京工业大学;

展开▼
授予单位北京工业大学;
学科软件工程
授予学位硕士
导师姓名张建,张冬雯;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类电子图书馆、数字图书馆;多媒体情报检索系统;
关键词
数字图书馆; 文本; 自动分类;

相似文献

中文文献
外文文献
专利

1. 数字图书馆云存储系统的设计与实现 [J] . 席亚军 . 河南图书馆学刊 . 2015,第010期
2. 基于Hadoop的数字图书馆云检索系统的设计与实现 [J] . 张艳 ,潘吴斌 . 图书馆理论与实践 . 2014,第004期
3. 基于．NET 的数字图书馆系统的设计与实现 [J] . 吴芳 . 山东师范大学学报（自然科学版） . 2014,第001期
4. 基于搜索引擎API的数字图书馆系统设计与实现 [J] . 吴芳 . 山东师范大学学报（自然科学版） . 2014,第003期
5. 云计算环境下数字图书馆身份认证系统的设计与实现 [J] . 鲍劼 . 科技信息 . 2013,第024期
6. 基于特征关联度的汉语文本自动分类系统的设计与实现 [C] . 张云 . 全国第四届计算机语言学联合学术会议 . 1997
7. 基于云计算的文本自动分类系统的设计与实现 [A] . 王恒 . 2014

数字图书馆文本自动分类系统的设计与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅