首页> 中文学位 >混合属性聚类融合及数据流聚类算法研究
【6h】

混合属性聚类融合及数据流聚类算法研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 数据挖掘的背景与意义

1.2 数据挖掘的发展及国内外现状

1.3 数据挖掘的步骤

1.4 数据挖掘的任务

1.4.1 聚类分析

1.4.2 预测建模

1.4.3 关联分析

1.4.4 异常检测

1.4.5 时序模式分析

1.5 数据挖掘的主要技术

1.5.1 统计学

1.5.2 机器学习

1.5.3 数据库系统和数据仓库

1.5.4 机器学习信息检索

1.6 论文内容和组织结构

1.7 本章小结

第2章 聚类

2.1 聚类概述

2.2 聚类的定义及基本数学模型

2.3 主要基础聚类算法

2.3.1 基于划分的方法

2.3.2 基于层次的方法

2.3.3 基于密度的方法

2.3.4 基于网格的方法

2.4 混合属性聚类

2.4.1 概述

2.4.2 混合属性聚类分析中的数据类型

2.4.3 数据相似性比较

2.4.4 混合属性的聚类要求

2.5 本章小结

第3章 基于相对密度和熵的混合属性聚类融合算法研究

3.1 聚类融合相关研究

3.1.1 聚类融合概述

3.1.2 聚类融合研究现状

3.2 算法框架

3.3 基于相对密度的快速FastRDBClustering算法

3.3.1 相对密度有关概念

3.3.2 FastRDBClustering算法描述

3.4 基于Distance-熵的分类属性ECCD算法

3.4.1 熵的有关概念

3.4.2 ECCD算法描述

3.5 基于交集的ICEMD最终融合算法

3.6 算法性能分析及仿真实验

3.6.1 算法性能分析

3.6.2 仿真实验结果分析

3.7 本章小结

第4章 基于距离和信息熵的混合属性数据流聚类算法研究

4.1 数据流相关研究

4.1.1 数据流概述

4.1.2 数据流聚类研究现状

4.2 数据流处理技术

4.2.1 基于数据的技术

4.2.2 基于任务的技术

4.3 经典CluStream数据流聚类算法框架

4.4 ADE-stream算法

4.4.1 微簇数据结构MS

4.4.2 在线微聚类过程

4.4.3 离线宏聚类过程

4.5 算法性能分析及仿真实验

4.5.1 算法性能分析

4.5.2 仿真实验结果分析

4.6 本章小结

第5章 总结和展望

5.1 本文主要成果及总结

5.2 课题研究展望

参考文献

致谢

攻读学位期间参加的科研项目和成果

展开▼

摘要

当前,我们所处的时代数据爆炸式增长,是一个名副其实的大数据时代,商业交易记录、社交网络信息等等每天都产生海量数据,而这些数据的利用率相当低,从中发掘出有用的信息指导来生产生活,将会加快推动现代社会的进步。因此对这些数据进行挖掘意义重大。 因为现实世界中的数据并不都是单一型的,往往都是复杂的混合型数据,因此近年来对混合属性数据的研究日益增多,且由于数据的增长是无限的不会停止的,这就导致了数据流的产生,所以又出现了混合属性数据流聚类研究这个新的课题。对混合属性数据和混合属性数据流的研究由于开始比较晚,在混合属性聚类融合和数据流的聚类方面还有研究的空间。 针对上述等方面的问题,本文的主要工作和成果如下: 1.本文首先介绍了数据挖掘的相关概念,对它的任务和一些相关技术做了简要介绍,接着具体介绍了本文的研究重点——聚类。对聚类进行了概述,介绍了聚类的定义、数学模型,以及一些基础的聚类算法,然后引出混合属性聚类的相关介绍。 2.在研究处理混合属性聚类算法时,针对原有混合属性聚类算法,很难同时兼顾数值属性和分类属性,本文采用了聚类融合算法,对数值属性采用改进的相对密度聚类算法;对于分类属性,利用信息熵的客观性,提出了基于Distance-熵的分类属性聚类算法。大多数聚类融合算法的计算复杂度较高,针对这个问题提出了基于交集的聚类融合算法,改进了聚类融合的规则,设置了使交集元素比θ来指导类的合并和修剪,计算简洁有效。 3.最后将聚类融合算法作为初始化算法扩展到数据流,提出了基于距离和信息熵的混合属性数据流聚类算法,在提高聚类准确率和时间复杂度方面具有一定效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号