基于在线学习的垃圾邮件过滤技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

电子邮件给人们的生活和工作带来极大的便利，但大规模的垃圾邮件严重影响了邮件正常使用。垃圾邮件消耗大量网络资源，损害用户利益，还会被一些别有用心的人用来散播虚假消息，危害社会安定。因此，垃圾邮件过滤技术已经成为当前研究普遍关注的热点问题。
　　本文研究了基于机器学习理论的垃圾邮件过滤技术。由于该过滤技术具有正确率高，成本低等特点，已成为解决垃圾邮件过滤问题的主流方法。本文的研究内容主要分为以下几个部分:
　　首先，研究了基于在线学习的垃圾邮件过滤技术的框架和过滤模式，并实现了基于朴素贝时斯、基于逻辑回归和基于在线支持向量机等三种模型的垃圾邮件过滤器，并从过滤器消耗的时间和过滤性能等方面评价三种过滤器的优缺点。
　　其次，研究了面向邮件过滤的特征工程，其中包括两部分内容:邮件的特征提取和特征选择。在特征提取部分，研究了基于词的特征提取方法和基于字节级n-grams的特征提取方法。在特征选择部分，研究特征选择方法，提出基于信息增益的特征选择方法和基于朴素贝叶斯统计的特征选择方法来解决在线支持向量机模型消耗时间过大的问题。同时，本文从过滤器核心评价指标1-ROCA的角度优化过滤器模型，提出了一种基于在线排序逻辑回归学习算法的垃圾邮件过滤器。
　　最后，研究了含有噪声数据集对过滤器性能的影响。在实际系统中，用户给过滤器的反馈邮件不一定是完全正确的，必然存在噪声邮件。本文了创建了噪声邮件数据，分析了含有不同噪声数量的数据对过滤器性能的影响。

著录项

作者
沈跃伍;
展开▼
作者单位

哈尔滨理工大学;

展开▼
授予单位哈尔滨理工大学;
学科计算机应用技术
授予学位硕士
导师姓名孙广路;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP393.098;
关键词
垃圾邮件; 过滤技术; 在线学习; 特征提取; 噪声数据集;

相似文献

中文文献
外文文献
专利

1. 基于IMI-WNB算法的垃圾邮件过滤技术研究 [J] . 刘洁 ,王铮 ,王辉 . 计算机工程 . 2020,第012期
2. 基于贝叶斯算法的垃圾邮件过滤技术研究 [J] . 顾玮 . 办公自动化（办公设备与耗材） . 2018,第001期
3. 基于贝叶斯算法的垃圾邮件过滤技术研究 [J] . 顾玮 . 办公自动化 . 2018,第001期
4. 基于贝叶斯算法的垃圾邮件过滤技术研究 [J] . 顾玮 . 办公自动化 . 2018,第001期
5. 基于兴趣认知的垃圾邮件过滤技术研究 [J] . 曹丽君 . 湖北农机化 . 2017,第005期
6. 在线学习平台学习分析技术研究——以MOODLE平台为例 [C] . 陆灵明 ,方琨 . 2016互联网+智慧教育（西部）高峰论坛、西安教育技术与网络学会金秋学术年会、第四届教育信息化高峰论坛 . 2016
7. 基于集成学习的个性化垃圾邮件过滤技术研究与应用 [A] . 向平常 . 2020

基于在线学习的垃圾邮件过滤技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅