首页> 中文学位 >基于情感词网的短文本情感分类方法研究
【6h】

基于情感词网的短文本情感分类方法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1 绪论

1.1 研究背景

1.2 研究意义和内容

2 情感分析相关综述

2.1 情感分析研究情况

2.2 情感词典研究与构建

2.3 情感信息的抽取

2.4 文本情感分类

2.5 短文本情感分类

3 情感词网的构建

3.1 引言

3.2 情感词网的构建

3.3 实验及分析

3.4 本章小结

4 结合情感词网的中文短文本情感分类

4.1 引言

4.2 结合情感词网的短文本情感分类

4.3 实验及结果分析

4.4 本章小结

5 基于情感分析的网络舆情演化分析

5.1 引言

5.2 相关工作

5.3 基于情感分析的网络舆情演化分析

5.4 实验及分析

5.5 本章小结

结论

致谢

参考文献

攻读硕士学位期间发表的学术论文及研究成果

展开▼

摘要

随着微博、博客、论坛等web2.0应用的迅猛发展,网民的参与度越来越高。因此,网络上产生了大量的用户生成文本(User Generated Text)。通过对这些短文本进行全面的分析挖掘,可以了解广大网民对于社会事件、人物、产品的看法以及舆论演化趋势。因此,分析处理这些文本信息变得尤为重要,文本情感分析就是其中主要的核心技术。本文对短文本的特征进行了分析,针对短文本的情感分析开展了一下工作:
  首先,构建情感词网。利用非负矩阵分解方法基于大规模语料库和同义词集合构建可以表示词-词、词-对象之间关系的情感词网。实验证明了情感词网在情感分析领域的有效性。
  接着,提出了结合情感词网的短文本情感分类方法。该方法通过情感词网对短文本的特征在权重和特征集合方面进行扩展,并结合机器学习分类方法进行情感分类。实验表明,该方法具有较高的准确率和召回率,有效地解决了短文本情感分类中的文本度、特征稀疏、信息量不足等问题。
  最后,将情感分析应用在网络舆情演化分析中。本文以微博作为研究对象,针对类似微博这样的短文本数据的特点,从情感的角度出发,将文本的情感值作为特征对微博数据进行时间分片,然后使用DTM模型对分片后的数据进行话题演化分析。实验表明,该方法能较好的划分微博数据,有效地找到舆情变化的时间点。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号