首页> 中文学位 >使用深度学习技术的中文微博情感分析研究
【6h】

使用深度学习技术的中文微博情感分析研究

代理获取

目录

第一个书签之前

展开▼

摘要

微博是目前十分热门的一种社交网络工具。人们越来越倾向于通过微博分享自己的所见所闻以及对热门事件发表评论等,这些评论通常包含了评论者丰富的情感,表明评论者的观点。通过分析这些微博评论的情感倾向,可以获得丰富的信息,有助于用户分析、舆情分析等多方面的应用。 本文研究的对象为中文微博,与英文文本相比,中文文本具有其独特的语言特征和词语构造方法。首先针对中文文本,研究了中文分词算法。中文微博具有新词出现频率高和词语组合语义多样等特点,通过分析对比常用的分词工具,玻森分词通过点互信息解决了新词识别以及组合歧义的问题,本文采用玻森进行中文微博分词处理,获得了更好的分词效果。研究了常用的文本表示方法,选择了使用Google的Word2vec训练得到蕴含上下文语义信息的词向量。 在此基础上,考虑程度副词对情感表达的影响,设计了对词向量进行情感权重调整的方法。根据 HowNet 情感词典的规定,对不同的程度副词赋予不同的权重,突显程度副词对情感的影响。为了验证情感权重调整得到的情感词向量对情感分类的有效性,分别将情感词向量和Word2vec得到的词向量在使用LSTM模型学习特征后,用于微博情感分类,实验结果表明,对词向量进行情感权重调整提高了微博情感分类的准确率。 目前中文微博的情感分析大多数是将微博分为正负两类,但人们的情感表达是多样的。针对微博情感表达丰富的问题,本文在NLPCC2014提供的包含多类情感标签的微博数据上,采用LSTM模型学习特征,并使用Softmax计算多分类的概率,最后实现了中文微博情感的三分类和四分类。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号