首页> 中国专利> 基于Spark和ASPSO的并行化K-means的优化方法

基于Spark和ASPSO的并行化K-means的优化方法

摘要

本发明提出了一种基于Spark和ASPSO的并行化K‑means的优化方法,包括以下步骤:S1,通过分割函数粗略的划分数据集,并利用网格划分策略PCCV来计算数据网格的皮尔逊相关系数与相关系数阈值,再对数据网格进行划分,获取网格单元;S2,采用SPFG策略,对数据点进行局部区域覆盖,更新数据集中的样本点,形成区域簇,获取局部聚类的簇数;S3,采用ASPSO策略,计算自适应参数,获取局部簇质心;S4,采用CRNN策略计算每个簇的簇半径,并根据簇的相似性函数进行相似度判断,结合Spark并行计算框架将相似度大的簇进行合并;S5,输出聚类结果。本发明在运行效率和聚类精确度上都有显著的提高,此外通过该方法所挖掘出的知识,能够在生物学,医学,天文地理学上提供巨大的帮助。

著录项

  • 公开/公告号CN113128617A

    专利类型发明专利

  • 公开/公告日2021-07-16

    原文格式PDF

  • 申请/专利权人 江西理工大学;

    申请/专利号CN202110501668.4

  • 发明设计人 廖列法;毛伊敏;甘德瑾;

    申请日2021-05-08

  • 分类号G06K9/62(20060101);G06N3/00(20060101);

  • 代理机构50240 重庆天成卓越专利代理事务所(普通合伙);

  • 代理人王宏松

  • 地址 341000 江西省赣州市章贡区红旗大道86号

  • 入库时间 2023-06-19 11:52:33

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-04-15

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号