首页> 中文学位 >结合作者兴趣与合作关系的主题模型与主题演化研究
【6h】

结合作者兴趣与合作关系的主题模型与主题演化研究

代理获取

目录

摘要

图目录

表目录

第1章 绪论

1.1 研究背景

1.2 主题模型与主题演化国内外研究现状

1.2.1 主题模型研究现状

1.2.2 主题演化研究现状

1.3 论文主要内容及组织结构

1.3.1 主要内容

1.3.2 组织结构

1.4 本章小结

第2章 主题模型概述

2.1 主题模型相关技术简介

2.1.1 TF-IDF模型

2.1.2 一元混合模型

2.2 pLSA模型

2.2.1 模型简介

2.2.2 基于EM算法的模型求解

2.3 LDA模型

2.3.1 模型简介

2.3.2 Gibbs抽样

2.3.3 模型求解

2.4 本章小结

第3章 主题演化的相关研究

3.1 主题演化概述

3.1.1 主题强度演化分析

3.1.2 主题内容演化分析

3.2 融入时间信息的主题演化模型

3.3 后离散分析的主题演化模型

3.4 基于条件概率的先离散时间方法

3.5 基于非条件概率的先离散时间方法

3.6 本章小结

第4章 考虑作者兴趣的主题模型

4.1 融入结构信息的主题建模方法

4.1.1 网络正则化的pLSA模型

4.1.2 局部一致性的pLSA模型

4.2 考虑作者兴趣的pLSA模型

4.2.1 作者兴趣的定义

4.2.2 主题模型的建立

4.3 模型求解

4.3.1 牛顿迭代法

4.3.2 基于广义EM算法的求解

4.4 实验及分析

4.4.1 数据集说明

4.4.2 实验设计

4.4.3 实验结果与分析

4.5 本章小结

第5章 结合科研网络中合作关系的主题演化

5.1 科研合作网络

5.2 主题演化

5.3 主题演化的分析与建模

5.3.1 合作网络上的主题演化

5.3.2 模型的建立与求解

5.4 实验及分析

5.4.1 数据集说明

5.4.2 实验设计

5.4.3 实验结果与分析

5.5 本章小结

第6章 总结与展望

参考文献

攻读硕士学位期间主要的研究成果

致谢

展开▼

摘要

如何在海量文本环境下提供有效的信息服务,已经成为国内外学术界与工业界关注和研究的重点问题。为了帮助人们从语义层面上快速理解文本内容,各种主题模型被相继提出。同时,文本之中各主题的变化趋势与内容演变过程也越来越受到人们的关注。学术论文作为科学研究发展过程中最重要的知识载体,其主题发现与主题演化分析对于研究人员了解学科研究方向、理清研究思路有着非常重要的意义。
  论文在前人主题模型与主题演化相关研究的基础之上,针对学术论文的特点,着重探讨了结合作者兴趣的主题建模与基于作者合作关系的主题演化等问题。本文的主要工作包括以下三个方面:
  (1)介绍了主题模型与主题演化研究现有的方法与现阶段所面临的问题,并对各方法的切入角度、模型建立以及求解算法进行了论述。为后续的研究与讨论提供了一个比较完善的理论框架。
  (2)将作者信息纳入主题空间,提出了作者对于主题的兴趣这一概念,并给出了数学定义和计算方法。将作者兴趣以正则化项的形式融入主题模型,进行了模型的理论设计与近似求解。在ACM会议论文数据集和CiteSeer数据集上进行了实验,结果表明结合作者兴趣的主题模型能更好地描述文档主题。
  (3)建立科研合作网络,将文档主题之间的演化置于合作网络之上,提出了结合科研合作关系的主题演化分析算法。基于(2)中提出的主题模型,对文档数据集进行主题抽取,再按时间段划分,利用作者的合作关系进行主题之间的转移概率计算。实验表明,本文所提出的方法能够较为准确地反映出主题的演化过程。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号