首页> 中文学位 >垂直数据格式挖掘频繁项集在Web日志挖掘中应用研究
【6h】

垂直数据格式挖掘频繁项集在Web日志挖掘中应用研究

代理获取

目录

声明

1 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.3 本论文研究内容

1.4 本论文内容安排

2 Web日志挖掘相关理论

2.1 Web日志挖掘研究基础

2.2 Web日志挖掘的主要方法

2.3 本章小结

3 关联规则挖掘频繁项集算法研究

3.1 关联规则的基本概念

3.2 基于Apriori挖掘频繁项集算法

3.3 基于FP-Growth挖掘频繁项集算法

3.4 基于垂直数据格式挖掘频繁项集算法

3.5 改进的垂直数据格式挖掘频繁模式的算法

3.6 本章小结

4 改进的挖掘频繁项集算法在Web日志中挖掘中的应用

4.1 开发环境与数据源

4.2 系统设计与实现

4.3 本章小结

5 实验结果分析

5.1 实验环境及数据集

5.2 实验对比分析

5.3 本章小结

结论

参考文献

作 者 简 历

学位论文数据集

展开▼

摘要

关联规则是发现一个事物与其他事物间的互相关联性,主要是从事务集合中挖掘出不小于最低支持度和置信度阈值要求的全部关联规则。针对现有的基于垂直数据格式算法挖掘频繁项集时采用正交的方式消耗大量时间和浪费大量存储空间的问题,而提出一种基于差集和哈希函数的垂直数据格式挖掘频繁项集的改进算法,该算法用差集取代了项集间的求交运算和节省了大量的存储空间,使用哈希函数对存储数据的快速访问,并且相对于水平数据格式挖掘频繁项集的算法减少了对数据库的多次访问和缩减了事务数,并通过实验比较得出改进后的算法在运行效率上有明显的提升。
  将改进的挖掘频繁项集算法应用到Web日志挖掘中,根据设定的支持度和置信度阈值挖掘出用户的频繁访问路径和页面之间的关联性,可以为网站管理员改善网页优化与网站拓扑提供支持与决策。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号