首页> 中文期刊> 《软件导刊》 >一种基于地理位置人群分类的非参数聚类方法

一种基于地理位置人群分类的非参数聚类方法

         

摘要

Geographical location as the manifestation of user's life,has a pivotal role in the group classification.Due to geographical location data has high-dimensional sparse,the existing classification method must be select feature and determine the characteristics of number in advance,which exist in practical application more inconvenience.To solve this problem,a non-parametric clustering method based on group classification of geographic location was presented.Firstly,use Hierarchical Dirichlet Process unsupervised learning features of the best number;Secondly,use Latent Dirichlet Allocation to feature selection,at the same time get the feature probability matrix;Finally,use it as a clustering weight vector to calculate the similarity between users,using Affinity Propagation implementation group classification.The experimental results show that the method spends less time and less memory,and at the same time with high F-measure.%地理位置作为用户生活轨迹的具体表现,在人群分类中有着举足轻重的作用.地理位置数据具有高维稀疏性,已有人群分类方法需对位置数据进行特征选择并提前确定特征数,实际应用中存在不便.针对该问题,提出基于地理位置人群分类的一种非参数聚类方法.该方法首先利用分层狄利克雷过程(Hierarchical Dirichlet Process,HDP)无监督学习出最佳特征个数;然后利用潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)对位置数据进行特征选取,同时得到功能特征概率矩阵;最后将其作为聚类权向量计算用户间的相似度,利用亲和力聚类(Affinity Propagation,AP)实现人群分类.实验结果表明,该方法较传统方法消耗时间更少、占用内存更低,且同时具有较高的F-measure.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号