声明
致谢
摘要
引言
1 面向科技文献的主题演化挖掘概述
1.1 数字图书馆中的知识服务
1.2 国内外主题演化相关领域研究调研
1.2.1 信息检索领域:主题演化挖掘
1.2.2 科学计量学领域:科学地图与知识可视化
1.3 本文研究中的主题演化挖掘相关概念辨析
2 文本挖掘中的概率建模与主题模型
2.1 文本挖掘中的概率建模方法
2.1.1 基于MLE(最大似然)的概率模型方法
2.1.2 基于MAP(最大后验概率)的概率模型
2.1.3 基于Bayesian Network(贝叶鞭网络)的概率模型
2.2 PLSA概率主题模型
2.2.1 PLSA概率主题模型原理
2.2.2 基于EM算法的PLSA模型求解
2.2.3 PLSA模型分析
2.3 LDA 概率主题模型
2.3.1 LDA概率主题模型原理
2.3.2 基于MCMC方法的LDA模型求解
2.3.3 LDA模型分析
2.4 基于LDA概率主题模型的演化分析技术
2.4.1 概率主题强度演化分析
2.4.2 概率主题内容演化分析
2.4.3 典型LDA演化分析模型的比较分析
3 基于RRMF的相关科技文献推荐(相似度计算)模型与实证分析
3.1 科技文献的特点分析
3.2 科技文献中的相关文献关系建模
3.3 关系正则化子空间的构建
3.4 缺失链接数据的正则化空间推荐
3.5 实验设计与评估
3.5.1 数据集及其评估准则
3.5.2 非链接缺失情况实证分析
3.5.3 链接缺失情况实证分析
4 基于RRMF平滑关联的LDA主题挖掘模型与实证分析
4.1 科技主题演化的相关定义与分析
4.1.1 科技主题“动态性”的定义与分析
4.1.2 科技主题“演化”的定义与分析
4.2 基于RRMF平滑关联的LDA主题挖掘模型
4.3 实验设计与实证研究
4.3.1 实验数据处理
4.3.2 强度演化实证分析
4.3.3 内容演化实证分析
结论
参考文献
作者简介
学位论文数据集
中国科学技术信息研究所;