首页> 中文学位 >基于决策树的P2P流量识别方法研究
【6h】

基于决策树的P2P流量识别方法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

插图索引

表格索引

符号对照表

缩略语对照表

目录

第一章 绪论

1.1研究背景与意义

1.2国内外研究现状

1.3本文的主要工作

1.4本文的组织结构

第二章 P2P的相关概念

2.1网络拓扑结构

2.2 P2P业务特征与应用

2.3 P2P流量识别技术研究

2.4小结

第三章 基于机器学习的流量识别

3.1机器学习方法流量识别

3.2基于机器学习流量的分类算法

3.3搜索评估策略和算法的选择

3.4实验结果与分析

3.5小结

第四章 基于决策树的算法性能分析

4.1算法的基本要求

4.2流量分类的决策树算法

4.3 VFDT(快速决策树)算法

4.4 CVFDT 方法

4.5实验结果与分析

4.6小结

第五章 P2P应用的识别技术

5.1 P2P流量特征分析

5.2 P2P流量特征选取

5.3 P2P流量识别系统

5.4软件测试与分析

5.5小结

第六章 总结与展望

6.1总结

6.2展望

参考文献

致谢

作者简介

展开▼

摘要

互联网发展初期,网络的连接方式一般为Client-Server模式,由于用户只是向服务器发送少量的请求信息而接收大量感兴趣的内容,因此网络中的上下行数据具有非对称性。二十世纪末,P2P协议出现,为用户提供了将自己的多媒体目录分享到网络上或者直接与其他用户进行交互的机会,实现了用户之间的直接分发和内容分享。自此,用户不再是仅仅充当客户端,还可以充当服务器,成为了新的、有活力的网络角色。用户在服务角色方面的变化使得传统的网络流量带宽具有了双向对称性的特征。另外,由于现在大部分的应用表现为贪婪的性质,尽其可能的去消耗网络带宽,所以网络管理者需要对网络进行适当的干预。因此,P2P系统凭借其自身双重角色的特殊性得到了网络管理者的特别关注。
  P2P协议在安全性方面和网络服务受限方面也存在着很多问题。由于网络带宽的限制,过度吞噬网络带宽的应用成为运营商和各类单位的隐患。如何有效快速的识别P2P流量进而对其进行管理成为当前研究的热点与重点,本文也将针对这一问题对P2P流量特征的提取以及流量的快速分类进行研究。
  本文首先介绍了经典网络传输模式与 P2P应用在网络拓扑和运行机制方面的区别,并且对P2P应用的现状进行了描述。然后介绍了 P2P网络的拓扑结构、应用和特征以及目前常用的四类P2P流量识别技术。研究了新兴的机器学习方案,分析其包括的K邻近、支持向量机、贝叶斯和决策树算法在处理数据和算法复杂度等方面优劣。在公开有效的Moore数据集和它的子集上,使用了Weka数据挖掘工具对四种算法进行了对比分析,验证了决策树算法在综合条件下的优势。接下来,在这个基础上重点研究了基于决策树原理的VFDT算法和它的改进算法,并且在Weka中实现了这两种算法,在不同数据集上对这两种算法进行了仿真和对比分析。结果表明,改进算法有效地克服了数据在不同时段、不同区域动态变化引起的流量数据漂移问题。最后,设计了一个 P2P流量识别系统,利用Winpcap捕获数据包,建立初始集,选取包括平均包长度、平均包长度标准差、UDP端口使用率和端口、IP地址的对应性在内的P2P流量特征集,最终得到特征矢量。然后利用此特征矢量联合CVFDT算法,对捕获到的数据包进行特征提取和流量识别。测试结果表明,该算法能够有效地对四种P2P流量进行识别,进而表明了该算法在准确度和稳定性方面的优越性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号