首页> 中文期刊> 《江苏通信》 >基于XGBoost算法的手机用户真实性别识别

基于XGBoost算法的手机用户真实性别识别

         

摘要

用户属性是刻画用户的基础。常见用户属性指标包括:用户的性别、年龄、入网时间、在网状态、省份城市、活跃地等等。然而由于各种山寨、刷机、刷rom的存在以及手机实际使用人不是购机人等,部分数据存在异常或缺失,特别是人口学属性。而性别又是人类差异最大的特征之一,是群体行为、偏好和需求等方面的基本影响因子之一,性别识别的重要性和价值性不言而喻,用户画像产品的构建,基本存在性别标签的识别需求。这部分数据可以通过XGBoost数据挖掘的方法来预测。针对传统男女识别方法效率低等问题,对于互联网用户行为特征,应用梯度增强集成分类器XGBoost算法进行特征选择,建立分类模型识别男女性别,实践表明该方法对于海量用户的真实使用性别的识别准确率可达73%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号