基于改进的用户偏好与物品特征主题的混合协同过滤算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着网络技术的发展，互联网数据呈指数级增长，各式各样的信息充斥着人们的日常生活。虽然与日俱增的数据缓解了人们信息匮乏的困扰，极大方便了人们的生活，但随着数据信息量逐渐增大，如何让人们精准、有效地获取信息成为一个亟待解决的问题。当前大多数人都是通过搜索系统如百度、谷歌来获取信息，但当数据量越来越大，搜索系统要求较强交互的弊端就显现出来，而推荐系统的出现，有效解决了搜索系统的不足。基于大数据的推荐系统不仅减少了用户与系统必要的交互行为，还可以为用户定制个性化方案，有效提高用户获取信息的效率。本文通过分析传统协同过滤算法的原理，认识到传统协同过滤算法在用户评分数据缺失或极度稀疏时所表现出的不足。为了缓解协同过滤算法的数据稀疏性问题，本文对用户评论文本数据进行分析，提取文本数据中的潜在主题，将潜在主题与评分数据相结合，构建基于改进的用户偏好与物品特征主题的混合协同过滤算法。在算法改进方面，本文利用文本挖掘技术对文本进行预处理，利用LDA主题模型提取文本中的潜在主题，并针对LDA主题模型存在的不足进行改进。在将评论文本数据融入协同过滤算法过程中，本文进行了分词、停用词剔除、词形还原、词性标注以及文本向量化等一系列文本数据预处理工作。在词性标注过程中，本文结合现有文献以及自身经验，将文本中无法反映主题的词汇剔除，不仅减少了文本中的噪声数据，还提高了模型的预测准确度。文本数据预处理完成之后，本文利用LDA主题模型分别从用户、物品层面进行主题提取，构建用户偏好主题以及物品特征主题，并将构建的主题用于协同过滤算法中相似度的计算，有效降低相似度计算的复杂程度。在利用主题分布进行相似度计算时，一方面，考虑到LDA主题模型无法区分主题情感倾向的不足，本文根据用户评分数据，构建评论态度指标来衡量用户对物品的喜好程度;另一方面，考虑到协同过滤算法忽视了时间对推荐结果的影响，本文根据评论时间数据构建时间因素指标，针对用户兴趣变化问题，提出用户兴趣变化指标，针对物品热度衰减问题，提出物品热度衰减指标。在构建各类指标之后，本文针对用户构建基于改进的用户偏好主题的协同过滤算法，针对物品构建基于改进的物品特征主题的协同过滤算法。最终根据召回率、提升度等评价指标，通过不断迭代计算的方式，确定两个改进协同过滤算法的组合参数，构建基于改进的用户偏好与物品特征主题的混合协同过滤算法。实证结果表明，与其他传统协同过滤算法相比，本文提出的基于改进的用户偏好与物品特征主题的混合协同过滤算法在一定程度上缓解了数据稀疏性问题，同时能够提高协同过滤算法的推荐准确度。

著录项

作者
赵俊华;
展开▼
作者单位

浙江工商大学;

展开▼
授予单位浙江工商大学;
学科应用统计学
授予学位硕士
导师姓名徐雪琪;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;自动化基础理论;
关键词
改进; 用户偏好; 物品; 特征; 主题; 混合; 协同过滤;

相似文献

中文文献
外文文献
专利

1. 基于页面的用户偏好协同过滤算法研究 [J] . 何智敏 . 贵阳学院学报（自然科学版） . 2012,第003期
2. 基于用户偏好和项目特征的协同过滤推荐算法 [J] . 张应辉 ,司彩霞 . 计算机技术与发展 . 2017,第001期
3. 特征聚类的混合协同过滤算法研究 [J] . 杜民双 ,何灵敏 . 中国计量大学学报 . 2018,第001期
4. 特征聚类的混合协同过滤算法研究 [J] . 杜民双 ,何灵敏 . 中国计量学院学报 . 2018,第001期
5. 基于标签主题的协同过滤推荐算法研究 [J] . 文俊浩 ,袁培雷 ,曾骏 . 计算机工程 . 2017,第001期
6. 基于物品协同过滤的水果推荐算法研究与改进 [C] . ZHAI Hangtian ,翟航天 ,WANG Xueming . 2017年贵州省计算机学会年会 . 2017
7. 基于用户偏好和用户聚类的协同过滤算法研究 [A] . 张艺 . 2018

基于改进的用户偏好与物品特征主题的混合协同过滤算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅