声明
摘要
1 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 文本特征的研究现状
1.2.2 话题模型的研究现状
1.3 本文的研究工作和内容安排
1.4 本文的创新点
2 概率话题模型综述
2.1 基本概念
2.2 一元模型与一元混合模型
2.3 概率潜在语义分析
2.4 潜在狄利克雷分配模型
2.5 关联话题模型
2.6 动态话题模型
2.7 实验及结果分析
2.8 本章小结
3 引入名词短语的话题提取算法
3.1 名词短语提取的流程
3.2 词性标注
3.2.1 基于规则的词性标注方法
3.2.2 基于转换的错误驱动学习方法
3.2.3 基于统计的词性标注方法
3.2.4 基于规则和统计相结合的词性标注方法
3.3 句子语法结构分析
3.3.1 基于上下文无关文法(CFG)规则的分析方法
3.3.2 基于概率上下文无关文法(FCFG)规则的分析方法
3.4 实验及结果分析
3.4.1 实验设计
3.4.2 实验结果及分析
3.5 本章小结
4 基于词条权重的话题提取算法
4.1 基于评估函数的词条权重计算方法
4.2 基于语义网络的词条权重计算方法
4.2.1 基于网络连通性和聚集性的词条权重计算方法
4.2.2 基于概率转移的权重计算方法
4.3 实验结果及分析
4.4 本章小结
5 实验及结果分析
5.1 实验语料库
5.2 实验设计
5.3 实验结果及分析
5.3.1 话题呈现
5.3.2 话题模型性能分析
5.4 话题强度计算
5.4.1 基于话题支持文档数量进行话题强度计算
5.4.2 基于语料库中话题概率的话题强度计算
5.4.3 基于文本话题显著性的话题强度计算
5.5 本章小结
6 总结与展望
6.1 论文工作总结
6.2 未来工作展望
参考文献
攻读学位期间的研究成果
致谢
浙江大学;