声明
第1章 绪论
1.1 研究背景及意义
1.1.1 Web日志挖掘
1.1.2 云计算和大数据技术
1.2 国内外研究现状
1.2.1 Web挖掘技术
1.2.2 K-均值聚类算法
1.2.3 分布式计算
1.3 本文研究内容
1.4 本文的组织框架
第2章 Web日志挖掘技术的研究
2.1 Web数据挖掘
2.1.1 数据挖掘
2.1.2 Web数据挖掘
2.2 Web日志挖掘概述
2.3 Web日志挖掘数据预处理技术
2.3.1 数据清洗
2.3.2 用户识别
2.3.3 会话识别
2.4 本章小结
第3章 K-均值聚类算法相关研究
3.1 聚类分析
3.1.1 聚类分析简介
3.1.2 聚类分析方法
3.2 基于聚类的Web日志挖掘
3.3 K-均值聚类算法
3.3.1 算法描述
3.3.2 基于K-均值聚类的用户聚类
3.3.3 算法缺陷
3.4 改进的K-均值聚类算法
3.4.1 ICKM算法描述
3.4.2 算法特点
3.5 本章小结
第4章 基于MapReduce的K-均值聚类算法
4.1 云计算
4.2 分布式相关技术
4.2.1 Hadoop运行框架
4.2.2 HDFS分布式文件系统
4.2.3 MapReduce编程模型
4.3 ICKM算法的MapReduce并行化
4.3.1 ICKM并行化可行性分析
4.3.2 ICKM算法的Map阶段
4.3.3 ICKM算法的Reduce阶段
4.4 本章小结
第5章 实验设计与结果分析
5.1 实验环境与实验样本
5.1.1 实验环境
5.1.2 实验样本
5.2 Web日志挖掘系统数据模型建立
5.3 实验结果与分析
5.3.1 实验性能参数
5.3.2 实验结果与分析
5.4 实验性能分析
5.5 本章小结
总结和展望
参考文献
攻读硕士期间发表的学术论文
致谢
江苏科技大学;