声明
摘要
第一章引言
1.1研究背景
1.2发展现状
1.3本文的研究
1.4组织结构
第二章理论基础
2.1 分词原理及去停用词
2.1.1 基于规则的分词方法
2.1.2基于统计的分词方法
2.1.3基于理解的分词方法
2.1.4去停用词
2.2文本相似度
2.2.1基于关键词匹配
2.2.2基于向量空间
第三章数学模型
3.1中文Hash码表示法
3.2概率语言模型
3.2.1 中文词向量化模型
3.2.2短文本向量化模型
3.3模型求解
3.3.1文本预处理
3.3.2概率语言模型求解——中文词向量化
3.3.3 概率语言模型求解——短文本向量化
第四章应用结果分析
4.1 中文词向量模型应用
4.1.1 文本分词结果展示
4.1.2 人物社交网络设计说明
4.1.3人物社交网络结果分析
4.2 舆情短文本模型在文本分类中的应用
4.2.1 数据集
4.2.2预测准确度分析
4.3 舆情短文本在文本聚类中的应用
4.3.1舆情事件——预警
4.3.2舆情事件衡量标准
4.3.3 结果分析
第五章总结与展望
参考文献
致谢
华中师范大学;