首页> 中文学位 >基于多任务融合模型的用户属性推断
【6h】

基于多任务融合模型的用户属性推断

代理获取

目录

赵宇封皮

赵宇声明

大论文赵宇.pdf

第一章 绪论

展开▼

摘要

用户属性信息是促进各类应用不断推进的重要资源。作为用户属性信息的间接获取方式,用户属性推断通过用户文本及行为等数据推断用户属性,为以用户画像和用户群体画像为基础的用户信息补全、需求分析、个性化推荐、精准营销及侦查工作等领域提供解决方案。随着网络技术的发展和海量用户数据的积累,用户属性推断方式开始向“数据驱动”型转变。如何从繁杂无序、严重碎片化的数据信息中挖掘出有价值的用户信息,成为学术界和产业界广泛关注的问题。 通过国内外相关工作调研,用户属性推断的主要工作集中在探索用户某一属性的特征表示,特征提取方法需要大量的领域知识,忽略了用户整体表征对潜在信息挖掘的重要意义;且用户属性推断通常依靠单一分类器独立完成,单一“视角”观察较易丢失用户信息,单独对任务建模也忽略了任务间的相关性。基于此,本文通过分析用户历史搜索数据特性及用户属性间的关联关系,提出一种基于多任务融合模型的用户属性推断方法。主要贡献有以下三点: (1)针对用户属性推断任务中对特征提取的依赖性问题,本文首先采用无监督的神经网络模型doc2vec训练用户搜索文本,并根据搜索词短小特性修改模型参数,得出用户文档向量,作为用户特征表示取代特征提取环节。然后结合用户属性间存在的关联性,将多任务因素加入用户表征中实现用户属性间的相互制约。在总结用户文档语义的基础上完成用户建模。 (2)用户搜索文本中新词出现频率较高,针对传统分词方式分词后出现的较多新词“错分”现象,本文基于词语共现思想,采用组合词方式增大新词发现概率,提高关键词提取质量,进而提高基于关键词词频的用户表征准确度。 (3)实现语义及词频两个维度的用户表征基础上,本文采用基于Stacking的多任务多模型融合框架,学习跨多任务的共享语义,并通过模型的彼此互补增强用户属性推断准确度。 实验在用户历史搜索词数据集上进行,推断属性为性别、年龄段和受教育程度。经实验证明,本文结果较其他模型结果显示出一定优势。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号