摘要
第一章 绪论
1.1 课题背景与意义
1.1.1 研究现状
1.1.2 课题的实际意义
1.1.3 课题的理论意义
1.2 论文主要工作
1.3 论文组织结构
第二章 不良消息文本检测的相关技术
2.1 消息文本概述
2.2 不良文本检测方法概述
2.3 消息文本中的频繁模式概述
2.3.1 关联规则中频繁模式基本概念
2.3.2 频繁项集挖掘经典算法介绍
2.4 文本分类概述
2.4.1 基于统计学习的文本分类
2.4.2 特征选择和计算
2.4.3 分类计算
第三章 基于频繁模式挖掘的不良消息文本检测方法设计
3.1 设计目标
3.2 总体设计思路
3.3 不良消息文本预处理
3.3.1 中国科学院计算技术研究所汉语词法分析系统
3.3.2 不良消息文本预处理策略研究
3.3.3 不良消息文本预处理中词性和命名实体的处理规则
3.3.4 不良消息文本预处理算法流程
3.4 不良消息文本频繁模式挖掘
3.4.1 消息文本频繁模式的基本概念
3.4.2 不良消息文本频繁模式提取研究
3.4.3 不良消息文本频繁项词集发现
3.4.4 不良消息文本频繁字符串模式提取
3.4.5 不良消息文本模式提取算法
3.5 不良消息文本分类检测
3.5.1 词语相似度计算
3.5.2 基于《同义词词林》词语相似度计算
3.5.3 消息文本与频繁模式字符串之间子串判断
3.5.4 消息文本与频繁模式字符串相似度计算
第四章 基于频繁模式挖掘的不良消息文本检测方法实现
4.1 实验开发和运行环境
4.2 不良消息文本检测方法流程图
4.2.1 不良消息文本预处理流程
4.2.2 不良消息文本频繁模式提取流程
4.2.3 不良消息文本分类流程
4.3 方法中关键数据结构
4.4 实验对比与分析
第五章 总结与展望
参考文献
致谢
声明