首页> 中文学位 >数字图书馆文本自动分类系统的设计与实现
【6h】

数字图书馆文本自动分类系统的设计与实现

代理获取

目录

文摘

英文文摘

声明

第1章绪论

1.1选题背景与意义

1.2文本分类基本原理及主要技术

1.3课题来源及主要研究内容

1.4论文组织结构

第2章粗糙集与神经网络理论基础

2.1粗糙集

2.1.1粗糙集理论概述

2.1.2基于粗糙集的特征约简

2.2神经网络

2.2.1神经网络概述

2.2.2径向基函数神经网络

2.3粗糙集与神经网络结合的发展现状

2.4本章小结

第3章 基于Rough-RBFNN的数字图书馆文本自动分类系统的设计

3.1需求分析

3.2系统开发则

3.3系统总体体系框架设计

3.4系统各模块详细设计

3.4.1网页采集模块设计

3.4.2数据预处理模块设计

3.4.3基于粗糙集的特征约简模块

3.4.4基于RBFNN的分类模块设计

3.4.5分类性能评估模块的设计

3.5数据库设计

3.6本章小结

第4章 数字图书馆文本自动分类系统的实现

4.1系统开发环境

4.2系统功能实现

4.2.1网页数据采集的实现

4.2.2数据预处理的实现

4.2.3分类功能的实现

4.2.4性能评估的实现

4.3本章小结

第5章系统性能评估

5.1系统测试用例

5.2数据分析

5.3小结

结论

参考文献

致谢

展开▼

摘要

互联网的迅速发展,信息爆炸式的增长,为数字图书馆的发展提供了巨大的推动力。数字图书馆是一个新兴的,涉及到因特网、多媒体、数据仓库、数据挖掘和知识产权保护等诸多技术的计算机应用领域,数字图书馆中保存大量的信息和知识,然而面对大量的信息资源,人们很难从中准确、充分、快速地找到有用的信息,如何高效地处理这些文本信息成为信息处理领域的研究热点。基于人工智能技术的文本自动分类成为研究解决这个问题的重要技术。 本文是在数字图书馆系统的环境下,对资源库中的保存的网页进行有效分类的研究,主要涉及以下几个方面:网页数据采集、数据预处理、特征约简及文本分类,其中文本分类模型的设计是本文的核心内容。 本文先从文本分类的基础理论着手,阐述了文本分类系统的理论及分类的关键技术和主要算法,对各种方法的理论依据、适用条件和范围及优、缺点进行了比较分析;然后详细介绍了人工智能领域两种关键技术-粗糙集和径向基函数神经网络的相关理论;以河北经贸大学图书馆文本数据为背景,针对数字图书馆文本资源以及中文语言的特点,借助粗糙集很好的处理模糊和不确定性问题的能力和RBF神经网络的卓越的函数逼近能力和快速学习能力,建立了基于Rough-RBFNN的数字图书馆文本自动分类模型并对神经网络进行了优化,在此基础上设计、实现了数字图书馆文本自动分类系统。 理论研究与实际测试表明,本文采用的基于粗糙集--神经网络相结合的文本分类模型,通过粗糙集的属性约简方法,降低文本维数,简化神经网络的结构,减少网络的训练时间,可以快速准确地得到满意的输出,是一种较为科学的文本分类方法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号