首页> 中文学位 >基于粗糙集和模糊聚类的WEB使用挖掘的研究
【6h】

基于粗糙集和模糊聚类的WEB使用挖掘的研究

代理获取

目录

文摘

英文文摘

1.绪论

2.数据挖掘、Web数据挖掘

3.Rough Sets理论和模糊聚类算法

4.基于粗集理论和模糊聚类的Web使用挖掘

5.教务网日志数据实例分析

6.教务网用户页面聚类

论文总结

致 谢

参考文献

攻读学位期间发表的论文和参与项目

展开▼

摘要

数据挖掘是近年来随着数据库技术和人工智能技术的发展而出现的一种新的信息技术,它融合了数据库、人工智能以及统计学等多种学科,试图从数据库中提取出先前未知、有效和实用的知识。Web数据挖掘是传统数据挖掘技术在Web环境下的应用,是从Web上的数据(如Web日志、页面内容等)中发现用户的浏览模式或寻找相关的Web页面等。Web使用挖掘主要是对于Web日志数据进行分析处理。而Web日志数据通常是大量的,冗余的,日志中的页面之间的关系也是模糊的,不确定的。粗糙集理论是有效处理不精确、不确定和含糊信息的软计算工具,模糊聚类分析是依据客观事务间的特征、亲疏程度和相似性,通过建立模糊相似关系对客观事务进行分类的方法。Web使用挖掘可以从网站的日志数据中抽取用户感兴趣的模式,理解用户的浏览兴趣行为,以便进一步改善网站结构,为用户提供个性化服务。所以本文提出的粗糙集理论和聚类算法在Web使用上的挖掘研究是具有一定的理论意义和现实意义的。 论文首先介绍了数据挖掘和Web数据挖掘的基本理论和方法;其次介绍了粗糙集理论和模糊聚类算法;再结合具体Web日志数据提出了Web使用挖掘的方法及Web日志数据模型,并建立了基于模糊聚类算法的页面用户聚类的一般模型。在第五章中进一步利用上述理论对Web日志数据进行预处理,并利用粗集理论对预处理结果中的教务网页面约简,得到在不影响问题分析基础上的有效页面。最后利用模糊等价关系矩阵和图的模糊聚类方法,在上述数据处理的基础上对其进行了进一步的分析研究。论文利用Java语言结合教务网数据源实现了算法编程。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号