首页> 中文学位 >以用户为中心的观点挖掘研究
【6h】

以用户为中心的观点挖掘研究

代理获取

目录

声明

摘要

图目录

表目录

第1章 绪论

1.1 研究背景及意义

1.2 本文的主要工作

1.3 本文结构组织

第2章 观点挖掘与用户行为概述

2.1 数据挖掘概述

2.1.1 观点提取

2.1.2 观点极性分析

2.1.3 观点总结

2.1.4 基于不同粒度的观点挖掘

2.2 用户行为概述

2.2.1 广义的用户行为

2.2.2 用户行为新趋势

2.3 本章小结

第3章 基于HITS算法的数值观点挖掘改进算法

3.1 HITS算法简介

3.2 问题定义

3.3 基于HITS算法的改进算法

3.4 实验评估

3.4.1 数据集

3.4.2 参数设置

3.4.3 算法思想正确性评估

3.4.4 算法精确度评估

3.5 本章小结

第4章 基于朴素贝叶斯分类法的文本观点挖掘算法

4.1 朴素贝叶斯分类法简介

4.2 朴素贝叶斯分类法的实现

4.2.1 准备阶段

4.2.2 分类训练阶段

4.2.3 实际运用阶段

4.3 实验结果与分析

4.4 本章小结

第5章 总结与展望

5.1 本文的主要工作

5.2 进一步的工作

参考文献

攻读硕士学位期间主要的研究成果

致谢

展开▼

摘要

随着互联网技术的飞速发展,博客、社交网络、微博等平台的出现,使得人们在网络上发表个人观点变得更为方便快捷。如何从海量数据中提取出消费者、商家、政府等群体需要的信息,并对其进行分析、总结,从而形成有有针对性的、可读性强的分析结果,就变得尤为重要。而现阶段研究者们所进行的观点挖掘,绝大多数都忽略了观点的一个本质特性,即评论者的主观性。单纯地针对评论进行观点挖掘,而未能很好地考虑用户的行为,将影响挖掘结果的精确性。
  针对以上问题,本文通过引入用户的行为来对现有的观点挖掘技术进行改进。本文的研究成果主要体现在以下儿个方面:
  (1)针对数值评论部分提出了基于HITS算法的改进挖掘算法;
  (2)针对文本评论部分采用了朴素贝叶斯分类法,将评论内容映射为分值形式;
  (3)将数值部分与文本部分评论相结合,剔除不相匹配的评论,从而为用户提供更高可信度的观点挖掘结果。
  对比实验表明,两种算法均取得了较好的效果,两部分评论的结合有效提高了挖掘结果的准确性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号