混合属性聚类融合及数据流聚类算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

当前，我们所处的时代数据爆炸式增长，是一个名副其实的大数据时代，商业交易记录、社交网络信息等等每天都产生海量数据，而这些数据的利用率相当低，从中发掘出有用的信息指导来生产生活，将会加快推动现代社会的进步。因此对这些数据进行挖掘意义重大。因为现实世界中的数据并不都是单一型的，往往都是复杂的混合型数据，因此近年来对混合属性数据的研究日益增多，且由于数据的增长是无限的不会停止的，这就导致了数据流的产生，所以又出现了混合属性数据流聚类研究这个新的课题。对混合属性数据和混合属性数据流的研究由于开始比较晚，在混合属性聚类融合和数据流的聚类方面还有研究的空间。针对上述等方面的问题，本文的主要工作和成果如下: 1.本文首先介绍了数据挖掘的相关概念，对它的任务和一些相关技术做了简要介绍，接着具体介绍了本文的研究重点——聚类。对聚类进行了概述，介绍了聚类的定义、数学模型，以及一些基础的聚类算法，然后引出混合属性聚类的相关介绍。 2.在研究处理混合属性聚类算法时，针对原有混合属性聚类算法，很难同时兼顾数值属性和分类属性，本文采用了聚类融合算法，对数值属性采用改进的相对密度聚类算法;对于分类属性，利用信息熵的客观性，提出了基于Distance-熵的分类属性聚类算法。大多数聚类融合算法的计算复杂度较高，针对这个问题提出了基于交集的聚类融合算法，改进了聚类融合的规则，设置了使交集元素比θ来指导类的合并和修剪，计算简洁有效。 3.最后将聚类融合算法作为初始化算法扩展到数据流，提出了基于距离和信息熵的混合属性数据流聚类算法，在提高聚类准确率和时间复杂度方面具有一定效果。

著录项

作者
余泽;
展开▼
作者单位

浙江工业大学;

展开▼
授予单位浙江工业大学;
学科计算机应用技术
授予学位硕士
导师姓名黄德才;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;中国经济;
关键词
混合属性; 聚类融合; 数据流聚类;

相似文献

中文文献
外文文献
专利

1. 基于密度的聚类中心自动确定的混合属性数据聚类算法研究 [J] . 陈晋音 ,何辉豪 . 自动化学报 . 2015,第010期
2. 一种实现混合属性数据流聚类的算法 [J] . 朱俚治 ,朱梧檟 . 计算技术与自动化 . 2016,第002期
3. 混合属性数据流的二重k近邻聚类算法 [J] . 黄德才 ,沈仙桥 ,陆亿红 . 计算机科学 . 2013,第010期
4. 基于信息熵降维的混合属性数据流聚类算法 [J] . 谭建建 ,郑洪源 ,丁秋林 . 计算机工程 . 2011,第019期
5. 基于相异度矩阵的混合属性数据流聚类算法 [J] . 万仁霞 ,陈镜超 ,王立新 . 计算机工程与应用 . 2008,第025期
6. 基于分治融合的混合属性数据聚类算法研究 [C] . 吴继兵 ,李心科 . 全国第20届计算机技术与应用（CACIS）学术会议 . 2009
7. 混合属性数据流的聚类算法研究及其应用 [A] . 何辉豪 . 2016

混合属性聚类融合及数据流聚类算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅