首页> 中文学位 >基于话题模型的微博热点话题演化分析
【6h】

基于话题模型的微博热点话题演化分析

代理获取

目录

声明

插图索引

表格索引

符号对照表

缩略语对照表

第一章 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.3 研究目的

1.4 研究内容

第二章 相关理论基础

2.1 话题模型

2.2 话题演化分析

2.3 基于话题模型的话题演化分析方法

2.4 本章小结

第三章 微博热点话题演化分析

3.1 微博热点话题演化分析流程

3.2 微博热点话题的发现

3.3 微博热点话题演化模型构建

3.4 微博热点话题演化过程

3.5 本章小结

第四章 实验与评价

4.1 实验语料

4.2 热点话题发现实验

4.3 热点话题演化分析实验

4.4 社会热点话题演化规律总结

4.5 本章小结

第五章 总结与展望

5.1 研究总结

5.2 展望

参考文献

致谢

作者简介

展开▼

摘要

移动互联时代,新闻传播方式层出不穷,而微博是其中最受人们关注的重要传播媒介。在微博平台上,新闻热点事件层出不穷,媒体相继跟踪报道,实时发布消息,人们在微博平台上各抒己见,由此导致了微博平台产生很多与事件相关的主流观点,这些观点反映了参与讨论的用户对事件的主要观念、思想以及看法。为更好地分析民众的诉求,了解民意解决争端,加强微博热点话题的发现与演化分析,刻不容缓。
  学术界针对微博平台上的博文数据,发现热点话题的研究,集中在三个方面:简单的关键词词频统计、web文本聚类和使用话题模型(Topic Models)。然而,这些方法虽然应用在传统文本上效果较好,但对于一个随时随地出现网络词汇的微博平台来说,往往会忽略掉网络词汇的重要性,因此本文提出了一种微博语义相似度计算方法,通过将百度百科作为微博词汇的语义扩展库,结合《知网》方法,计算微博语义,并将之扩展到微博热点话题发现上,为文本聚类发现热点话题赋予语义信息,提高语义层面的准确率。
  在发现热点话题的基础上,本文提出了话题演化分析流程,首先通过文本聚类发现文档层面上微博热点话题,然后构建适合于微博平台文本特点的话题演化模型,从热点话题的文本内容层面进行话题演化分析。本文提出的话题演化分析方法将时间信息视为离散变量,采取根据时间信息先离散分析的方法,使用时间信息划分文档集合,之后依次对各个时间片文档实现子话题的发现,文中提出了按照一定时间范围阈值,衡量不同子话题之间是否存在关联关系的方法,然后得到话题内容演化分析的结果,除了衡量子话题之间存在的演化关系以外,对热点话题中产生的多种主流观点,进行强度的度量。在实验分析过程中,针对无意义话题,提出了词汇共现的无意义话题过滤策略,提高话题演化分析内容上的准确率。最后,通过收集2016年全年微博平台上社会新闻类别下的微博博文数据,进行了热点话题发现实验和热点话题演化分析实验,分析实验的结果,结合信息生命周期理论得到社会类新闻热点话题演化的规律,基本上可以分为两类:常规社会热点话题演化规律和非常规社会热点话题演化规律,结合实验所得到的演化规律,从事件的全面爆发之初、事件爆发阶段以及事件消亡阶段提出事先预防、事中控制和事后分析的舆情调控方法启示,以供有关机构采纳,为相关部门提供支持。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号