首页> 中文期刊> 《计算机应用与软件》 >大规模数据集下基于DBSCAN算法的增量并行化快速聚类

大规模数据集下基于DBSCAN算法的增量并行化快速聚类

         

摘要

Spatial temporal trajectory data mining is an important way to discover the behavior patterns of mobile objects.Aimed at the demand of massive trajectory data processing,an incremental parallelization fast clustering algorithm was proposed.Based on the number of data points,the algorithm divided the space grid by dichotomy,and combined the greedy algorithm to restructure the partition rationally to reasonably divide the data.It dealt with local clustering to obtain the merged candidate cluster sets.The candidate clusters of R *-tree indexes were merged to be judged and processed.An undirected acyclic graph model of the merged clusters was established and the data was globally re-labeled.The experimental results show that thealgorithm effectively reduces the elastic partition processing noise data and improves the quality of local clustering.The merging strategy adopting R *-tree index structure effectively improves the time efficiency of clustering,and has good clustering effect and realized the online processing of large-scale data.%时空轨迹数据挖掘是发现移动对象行为模式的重要方式.针对海量轨迹数据处理的需求,提出一种增量并行化快速聚类算法.算法基于数据点的数量采用二分法对空间网格分区,结合贪心算法弹性重组分区,合理进行数据划分;进行本地局部聚类,获得合并簇候选集;采用R*-tree索引候选簇进行合并判断并处理;建立合并簇的无向无环图模型,并进行数据的全局重标签.实验结果表明:算法的弹性分区处理能有效地减少噪点数据,提高局部聚类的质量,采用R *-tree索引结构的合并策略有效提高了聚类的时间效率,聚类效果好,能实现大规模数据的在线处理.

著录项

  • 来源
    《计算机应用与软件》 |2018年第4期|269-275280|共8页
  • 作者单位

    中南大学信息科学与工程学院 湖南长沙410075;

    福建师范大学数学与信息学院 福建福州350108;

    福建师范大学数学与信息学院 福建福州350108;

    中南大学信息科学与工程学院 湖南长沙410075;

    福建工程学院福建省汽车电子与电驱动技术重点实验室 福建福州350108;

    福建工程学院福建省汽车电子与电驱动技术重点实验室 福建福州350108;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 程序设计、软件工程;
  • 关键词

    大数据; DBSCAN; 均衡划分; 增量; 并行化;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号