首页> 中文学位 >自然语言处理--中文词和短文本向量化的研究
【6h】

自然语言处理--中文词和短文本向量化的研究

代理获取

目录

声明

摘要

第一章引言

1.1研究背景

1.2发展现状

1.3本文的研究

1.4组织结构

第二章理论基础

2.1 分词原理及去停用词

2.1.1 基于规则的分词方法

2.1.2基于统计的分词方法

2.1.3基于理解的分词方法

2.1.4去停用词

2.2文本相似度

2.2.1基于关键词匹配

2.2.2基于向量空间

第三章数学模型

3.1中文Hash码表示法

3.2概率语言模型

3.2.1 中文词向量化模型

3.2.2短文本向量化模型

3.3模型求解

3.3.1文本预处理

3.3.2概率语言模型求解——中文词向量化

3.3.3 概率语言模型求解——短文本向量化

第四章应用结果分析

4.1 中文词向量模型应用

4.1.1 文本分词结果展示

4.1.2 人物社交网络设计说明

4.1.3人物社交网络结果分析

4.2 舆情短文本模型在文本分类中的应用

4.2.1 数据集

4.2.2预测准确度分析

4.3 舆情短文本在文本聚类中的应用

4.3.1舆情事件——预警

4.3.2舆情事件衡量标准

4.3.3 结果分析

第五章总结与展望

参考文献

致谢

展开▼

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号