基于决策树的P2P流量识别方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

互联网发展初期，网络的连接方式一般为Client-Server模式，由于用户只是向服务器发送少量的请求信息而接收大量感兴趣的内容，因此网络中的上下行数据具有非对称性。二十世纪末，P2P协议出现，为用户提供了将自己的多媒体目录分享到网络上或者直接与其他用户进行交互的机会，实现了用户之间的直接分发和内容分享。自此，用户不再是仅仅充当客户端，还可以充当服务器，成为了新的、有活力的网络角色。用户在服务角色方面的变化使得传统的网络流量带宽具有了双向对称性的特征。另外，由于现在大部分的应用表现为贪婪的性质，尽其可能的去消耗网络带宽，所以网络管理者需要对网络进行适当的干预。因此，P2P系统凭借其自身双重角色的特殊性得到了网络管理者的特别关注。
　　P2P协议在安全性方面和网络服务受限方面也存在着很多问题。由于网络带宽的限制，过度吞噬网络带宽的应用成为运营商和各类单位的隐患。如何有效快速的识别P2P流量进而对其进行管理成为当前研究的热点与重点，本文也将针对这一问题对P2P流量特征的提取以及流量的快速分类进行研究。
　　本文首先介绍了经典网络传输模式与 P2P应用在网络拓扑和运行机制方面的区别，并且对P2P应用的现状进行了描述。然后介绍了 P2P网络的拓扑结构、应用和特征以及目前常用的四类P2P流量识别技术。研究了新兴的机器学习方案，分析其包括的K邻近、支持向量机、贝叶斯和决策树算法在处理数据和算法复杂度等方面优劣。在公开有效的Moore数据集和它的子集上，使用了Weka数据挖掘工具对四种算法进行了对比分析，验证了决策树算法在综合条件下的优势。接下来，在这个基础上重点研究了基于决策树原理的VFDT算法和它的改进算法，并且在Weka中实现了这两种算法，在不同数据集上对这两种算法进行了仿真和对比分析。结果表明，改进算法有效地克服了数据在不同时段、不同区域动态变化引起的流量数据漂移问题。最后，设计了一个 P2P流量识别系统，利用Winpcap捕获数据包，建立初始集，选取包括平均包长度、平均包长度标准差、UDP端口使用率和端口、IP地址的对应性在内的P2P流量特征集，最终得到特征矢量。然后利用此特征矢量联合CVFDT算法，对捕获到的数据包进行特征提取和流量识别。测试结果表明，该算法能够有效地对四种P2P流量进行识别，进而表明了该算法在准确度和稳定性方面的优越性。

著录项

作者
王洁环;
展开▼
作者单位

西安电子科技大学;

展开▼
授予单位西安电子科技大学;
学科电子与通信工程
授予学位硕士
导师姓名权东晓,乾春燕;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类其他通信网;
关键词
实时流量识别; 特征提取; 决策树; P2P网络; 拓扑结构;

相似文献

中文文献
外文文献
专利

1. 基于决策树的P2P流量识别方法研究 [J] . 李晟锴 . 计算机技术与发展 . 2011,第012期
2. 基于K均值与决策树的P2P流量识别研究 [J] . 张治斌 ,谭静 . 计算机工程与设计 . 2014,第003期
3. 基于决策树集成的P2P流量识别研究 [J] . 刘三民 ,孙知信 ,刘余霞 . 计算机科学 . 2011,第011期
4. 基于流特征的P2P流量识别方法研究 [J] . 黄烟波 ,周磊戈 . 计算机技术与发展 . 2009,第009期
5. 基于统计特性的P2P流量识别方法研究 [J] . 李晓歌 ,李娜 ,焦琳 . 内江科技 . 2007,第005期
6. 一种基于流量和payload双重特征识别P2P流量的方法研究 [C] . 李子玉 ,陈希 ,李美玲 . 中国空气动力学会测控专业委员会六届四次空气动力测控技术交流会 . 2013
7. 一种新的基于决策树的P2P流量识别算法研究与实现 [A] . 申伟威 . 2016

基于决策树的P2P流量识别方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅