首页> 中文学位 >类别不平衡条件下的小样本加密流量识别
【6h】

类别不平衡条件下的小样本加密流量识别

代理获取

目录

封面

中文摘要

英文摘要

目录

第1章 绪 论

1.1 课题背景及研究的目的和意义

1.2 国内外研究现状

1.3本文的研究内容

1.4 本文的组织结构

第2章 类别不平衡问题及流量识别的研究

2.1类别不平衡问题的研究

2.2 基于机器学习的流量识别技术

2.3本章小结

第3章 小样本加密流量识别系统的设计与实现

3.1 数据预处理

3.2 基于互信息的聚类模型

3.3 基于Neyman-Pearson准则的簇内分类模型

3.4本章小结

第4章 系统性能测试与分析

4.1 系统开发和测试环境

4.2 实验数据集

4.3 基于互信息的聚类结果及分析

4.4 基于Neyman-Pearson准则的分类结果及分析

4.5本章小结

结论

参考文献

攻读学位期间发表的学术论文

声明

致谢

展开▼

摘要

随着应用类型的多样化发展,互联网逐渐成为日常生活中不可或缺的交流平台。人们在享受互联网海量信息带来的便利的同时,也意识到安全与隐私的重要性。加密技术的应用使得网络控管的难度增加,所以从海量数据中识别加密流量是十分重要的。现实网络环境中的加密流量比例很小,传统的识别方法容易造成错误分类,进而对于加密流量的识别度很低。本文针对网络流量的不平衡环境中,加密流量的识别开展研究。
  本文首先对类别不平衡问题进行了相关研究,分析了数据集本身对分类的影响,并对传统分类器性能的评价准则进行讨论。对机器学习方法在流量识别上的应用进行了总结,并从中选取两种方法用于处理类别不平衡数据集。研究了过抽样技术,分析了以互信息为度量准则的可实施性,并根据Neyman-Pearson准则对分类器进行性能优化。
  然后,通过对加密流量的识别和类别不平衡的处理的分析,本文设计并实现了一个静态检测分类系统,达到在一定程度上控制误报率的同时,提高对小样本加密流量的识别。采用过抽样方法对不平衡数据进行预处理。设计了基于互信息最大化的聚类方法,从而实现对于K-Means算法聚类簇数目设定的优化。采用风险函数和代价敏感方法,优化分类器识别小样本的准确率,并构造一个多类别二元分类器序列,实现错误分类的样本数最少,从而提高分类器对小样本的识别。此外,分类器序列能够识别未知应用类型。
  最后,采用公开数据集对系统模型进行测试,分别对聚类模型和簇内分类模型进行研究,并分析了影响性能的因素。实验结果显示,系统对Skype流量的识别率有显著提高,有较好的实用性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号