首页> 中文学位 >基于邻接网络的Web日志数据挖掘方法研究
【6h】

基于邻接网络的Web日志数据挖掘方法研究

代理获取

目录

文摘

英文文摘

第一章概论

第一节数据挖掘技术的产生和发展

第二节数据挖掘的本质和研究内容

第三节数据挖掘的研究现状和应用领域

第四节数据仓库与数据挖掘

第五节本文的研究背景和主要内容

第二章WEB数据挖掘

第一节引言

第二节WEB数据挖掘综述

第三节Web数据挖掘方法论

第四节WEB文本挖掘技术探讨

第五节Web服务器日志数据挖掘

第三章WEB日志挖掘的数据预处理

第一节Web日志数据预处理的必要性分析

第二节Web日志数据预处理的过程分析和问题解决

第三节Web服务器日志数据的事先处理

第四章Web日志挖掘的频繁项目集发现

第一节引言

第二节关联规则的基本概念

第三节频繁项目集发现的经典算法和优化方法

第四节基于邻接网络的频繁项目集发现算法

第五章Web日志挖掘的关联规则生成

第一节引言

第二节Web日志挖掘的关联规则生成

第三节Web日志挖掘关联规则的解析和应用

第六章微软官方网站(MSN)日志数据挖掘试验

第一节试验背景和内容

第二节MSN网站日志的数据预处理

第三节MSN网站日志的频繁项目集发现

第四节MSN网站日志的关联规则发现

第七章总结与展望

第一节本文研究总结

第二节Web数据挖掘的应用展望

附录1微软官方网站日志文件数据挖掘结果

附录2微软官方网站日志文件页面描述

致谢

参考文献

展开▼

摘要

该文针对WEB日志数据挖掘问题进行了深入的研究和分析,并实地的对微软官方网站日志文件进行了数据挖掘试验,所做的工作主要包括以下几个方面:1.该文分析了数据挖掘技术的产生原因和发展背景.2.对Web数据挖掘的体系结构进行了深入的分析和研究.3.该文分析了Web日志的格式和内容,阐明了Web日志挖掘的数据预处理的必要性和困难.4.该文阐述了关联规则发现的基本概念,阐述和分析了频繁项目集发现经典算法及各种频集优化算法.5.该文在发现的频繁项目集基础上,对关联规则的生成进行了详细的研究和分析,特别针对发现的规则的冗余性问题,给出切实可行的解决方法和核心算法.6.Web日志数据挖掘实验.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号