首页> 中文学位 >基于潜在语义分析的标题党新闻识别技术研究
【6h】

基于潜在语义分析的标题党新闻识别技术研究

代理获取

目录

声明

第1 章引 言

1.1 研究的背景

1.2 研究的现状

1.3 课题研究的目的与意义

1.4 论文研究的主要内容与贡献

1.5 论文的章节组织

第2 章相关知识介绍

2.1 网页去噪工作原理

2.2 向量空间模型

2.3 矩阵的奇异值分解

2.4 本章小结

第3 章系统关键技术研究

3.1 基于HTTP 的新闻网页下载技术

3.1.1 网页下载技术

3.1.2 网页信息抽取技术

3.2 基于行块分布算法的网页正文抽取技术

3.2.1 行块分布算法基本思想

3.2.2 行块分布算法实例分析

3.3 基于正向最大匹配算法的分词技术

3.3.1 正向最大匹配算法基本思想

3.3.2 分词算法实例分析

3.4 向量空间模型的构建

3.4.1 词-段落矩阵构建

3.4.2 向量空间模型构建实例分析

3.5 基于SVD的塌陷矩阵构建技术

3.5.1 塌陷奇异分解基本思想

3.5.2 塌陷矩阵构建实例分析

3.6 基于LSA算法的标题党新闻判定技术

3.6.1 潜在相关度计算

3.6.2 基于LSA的标题党新闻判定

3.7 本章小结

第4 章系统设计与实现

4.1 系统设计

4.1.1 系统工作流程

4.1.2 系统功能结构

4.1.3 系统业务逻辑

4.2 数据库表结构设计

4.3 系统各功能模块设计与实现

4.3.1 目标网址列表信息读取模块

4.3.2 网页下载模块

4.3.3 新闻信息抽取模块

4.3.4 分词处理模块

4.3.5 向量空间模型构建模块

4.3.6 塌陷矩阵构建模块

4.3.7 潜在相关度计算模块

4.3.8 标题党新闻判定模块

4.4 本章小结

第5 章实验结果与分析

5.1 实验环境介绍

5.2 向量空间模型构建实验

5.3 塌陷矩阵构建实验

5.4 潜在相关度计算实验

5.5 标题党新闻识别实验

5.6 实验数据综合分析

5.7 本章小结

第6 章总结与展望

6.1 本文总结

6.2 本文展望

参考文献

致谢

附录

展开▼

著录项

  • 作者

    罗佳;

  • 作者单位

    湖北工业大学;

  • 授予单位 湖北工业大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 邵雄凯;
  • 年度 2015
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP3TP1;
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号