声明
摘要
第1章 绪论
1.1 数据挖掘的背景与意义
1.2 数据挖掘的发展及国内外现状
1.3 数据挖掘的步骤
1.4 数据挖掘的任务
1.4.1 聚类分析
1.4.2 预测建模
1.4.3 关联分析
1.4.4 异常检测
1.4.5 时序模式分析
1.5 数据挖掘的主要技术
1.5.1 统计学
1.5.2 机器学习
1.5.3 数据库系统和数据仓库
1.5.4 机器学习信息检索
1.6 论文内容和组织结构
1.7 本章小结
第2章 聚类
2.1 聚类概述
2.2 聚类的定义及基本数学模型
2.3 主要基础聚类算法
2.3.1 基于划分的方法
2.3.2 基于层次的方法
2.3.3 基于密度的方法
2.3.4 基于网格的方法
2.4 混合属性聚类
2.4.1 概述
2.4.2 混合属性聚类分析中的数据类型
2.4.3 数据相似性比较
2.4.4 混合属性的聚类要求
2.5 本章小结
第3章 基于相对密度和熵的混合属性聚类融合算法研究
3.1 聚类融合相关研究
3.1.1 聚类融合概述
3.1.2 聚类融合研究现状
3.2 算法框架
3.3 基于相对密度的快速FastRDBClustering算法
3.3.1 相对密度有关概念
3.3.2 FastRDBClustering算法描述
3.4 基于Distance-熵的分类属性ECCD算法
3.4.1 熵的有关概念
3.4.2 ECCD算法描述
3.5 基于交集的ICEMD最终融合算法
3.6 算法性能分析及仿真实验
3.6.1 算法性能分析
3.6.2 仿真实验结果分析
3.7 本章小结
第4章 基于距离和信息熵的混合属性数据流聚类算法研究
4.1 数据流相关研究
4.1.1 数据流概述
4.1.2 数据流聚类研究现状
4.2 数据流处理技术
4.2.1 基于数据的技术
4.2.2 基于任务的技术
4.3 经典CluStream数据流聚类算法框架
4.4 ADE-stream算法
4.4.1 微簇数据结构MS
4.4.2 在线微聚类过程
4.4.3 离线宏聚类过程
4.5 算法性能分析及仿真实验
4.5.1 算法性能分析
4.5.2 仿真实验结果分析
4.6 本章小结
第5章 总结和展望
5.1 本文主要成果及总结
5.2 课题研究展望
参考文献
致谢
攻读学位期间参加的科研项目和成果
浙江工业大学;