类别不平衡条件下的小样本加密流量识别

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着应用类型的多样化发展,互联网逐渐成为日常生活中不可或缺的交流平台。人们在享受互联网海量信息带来的便利的同时,也意识到安全与隐私的重要性。加密技术的应用使得网络控管的难度增加,所以从海量数据中识别加密流量是十分重要的。现实网络环境中的加密流量比例很小,传统的识别方法容易造成错误分类,进而对于加密流量的识别度很低。本文针对网络流量的不平衡环境中,加密流量的识别开展研究。
　　本文首先对类别不平衡问题进行了相关研究,分析了数据集本身对分类的影响,并对传统分类器性能的评价准则进行讨论。对机器学习方法在流量识别上的应用进行了总结,并从中选取两种方法用于处理类别不平衡数据集。研究了过抽样技术,分析了以互信息为度量准则的可实施性,并根据Neyman-Pearson准则对分类器进行性能优化。
　　然后,通过对加密流量的识别和类别不平衡的处理的分析,本文设计并实现了一个静态检测分类系统,达到在一定程度上控制误报率的同时,提高对小样本加密流量的识别。采用过抽样方法对不平衡数据进行预处理。设计了基于互信息最大化的聚类方法,从而实现对于K-Means算法聚类簇数目设定的优化。采用风险函数和代价敏感方法,优化分类器识别小样本的准确率,并构造一个多类别二元分类器序列,实现错误分类的样本数最少,从而提高分类器对小样本的识别。此外,分类器序列能够识别未知应用类型。
　　最后,采用公开数据集对系统模型进行测试,分别对聚类模型和簇内分类模型进行研究,并分析了影响性能的因素。实验结果显示,系统对Skype流量的识别率有显著提高,有较好的实用性。

著录项

作者
张梦;
展开▼
作者单位

哈尔滨工业大学;

展开▼
授予单位哈尔滨工业大学;
学科计算机科学与技术
授予学位硕士
导师姓名张宏莉;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类加密与解密;
关键词
类别不平衡; 加密流量识别; Neyman-Pearson准则; 公开数据集;

相似文献

中文文献
外文文献
专利

1. 网络应用流类别不平衡环境下的SSL加密应用流识别关键技术 [J] . 陈雪娇 ,王攀 ,刘世栋 . 电信科学 . 2015,第012期
2. 类别不平衡条件下的雷达信号识别 [J] . 孙艺聪 ,田润澜 ,王晓峰 . 电讯技术 . 2021,第003期
3. 考虑样本类别不平衡的电网故障事件智能识别方法 [J] . 卫志农 ,石东明 ,张明 . 电力自动化设备 . 2021,第011期
4. 基于BalanceCascade-GBDT算法的类别不平衡虚假评论识别方法 [J] . 陶朝杰 ,杨进 . 经济数学 . 2020,第003期
5. 基于类别不平衡分类的超宽带非视距信号识别方法研究 [J] . 宋波 ,李生林 ,刘恩启 . 信息工程大学学报 . 2019,第002期
6. 基于AlexNet的多光照条件下多类别法定货币识别技术 [C] . Liu Si-Yang ,刘思洋 ,Huang Jian . 2018粤港澳大湾区智能检测与协同创新青年论坛 . 2018
7. 基于高维小样本数据和类别不平衡数据的反距离加权支持向量机 [A] . 徐新红 . 2020

类别不平衡条件下的小样本加密流量识别

目录

摘要

著录项

相似文献

相关主题

期刊订阅