声明
摘要
第1章 绪论
1.1 课题研究的目的和意义
1.2 垃圾邮件过滤技术研究现状
1.3 本课题研究的主要内容
1.4 本文的组织结构
第2章 基于在线学习的垃圾邮件过滤概述
2.1 垃圾邮件过滤器系统框架
2.2 基于在线学习的垃圾邮件过滤模式
2.3 机器学习方法
2.3.1 朴素贝叶斯方法
2.3.2 逻辑回归方法
2.3.3 支持向量机方法
2.4 实验数据集及评价指标
2.5 实验结果及讨论
2.6 本章小结
第3章 面向邮件过滤的特征工程研究
3.1 邮件过滤的特征工程研究背景
3.2 邮件的特征提取
3.2.1 基于词的特征提取方法
3.2.2 基于字节级N-grams的特征提取方法
3.3 邮件的特征选择
3.3.1 基于信息增益的特征选择方法
3.3.2 基于贝叶斯统计的特征选择方法
3.4 实验及讨论
3.4.1 邮件特征提取实验
3.4.2 基于信息增益的特征选择方法实验
3.4.3 基于贝叶斯统计的特征选择方法实验
3.4.4 基于信息增益和贝叶斯统计的特征选择方法比较
3.5 本章小结
第4章 基于在线排序逻辑回归学习算法的垃圾邮件过滤技术研究
4.1 排序学习
4.2 1-ROCA与排序学习关系
4.3 基于在线排序的垃圾邮件过滤模型
4.3.1 基于排序策略的垃圾邮件过滤模型
4.3.2 在线顺序逻辑回归学习算法
4.3.3 基于样本的在线排序逻辑回归学习算法
4.3.4 提升在线顺序逻辑回归模型
4.4 实验及讨论
4.5 本章小结
第5章 噪声数据对邮件过滤器的影响研究
5.1 噪声邮件分析
5.2 过滤器模型
5.3 噪声数据对过滤器性能影响
5.4 实验结果及讨论
5.5 本章结论
结论
参考文献
攻读硕士学位期间发表的学术论文
致谢