收藏本站
《北京邮电大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

P2P流量识别关键技术研究

彭建芬  
【摘要】:网络流量识别是管理大型网络的一个重要任务,同时也是合法截留方法的主要组成部分。随着网络技术的快速发展与广泛应用,许多新的P2P应用层出不穷。P2P应用技术资源利用率高、信息存储的非中心化等特点使得P2P技术在文件共享、分布式计算、协作系统和电子商务中应用广泛。随着P2P应用的不断增多,P2P流量所占网络流量的比重越来越大,国内P2P流量占总流量的70%以上,准确地识别网络中P2P应用的流量对网络规划设计、QoS保证等都有十分重要的作用。另一方面,P2P应用的网络软件设计缺陷使得攻击者易于发起庞大的拒绝服务攻击,从而使得互联网网站轻易地崩溃。P2P网络分散式的存储结构、方便的共享原理和快速的选路机制,有利于木马、病毒等破坏性程序的传播。为了保证网络的正常运行,需要对P2P流量进行快速、准确地识别。 目前P2P技术采用动态端口技术和载荷加密技术逃避基于端口和基于应用载荷签名的P2P流量识别算法的检测。当今普遍研究的流量识别算法是基于行为特征的流量识别算法和基于机器学习的流量识别算法。本文提出的P2P流量早期快速识别算法和改进的启发式P2P流量识别算法术分别属于基于机器学习的P2P流量识别算法和基于行为的P2P流量识别算法。P2P流量早期快速识别算法利用监督的机器学习算法对流初期几个包提取的特征进行分类,识别正确率高,适合于对P2P流及具体的P2P应用的早期识别。改进的快速启发式P2P流量识别算法利用P2P流与非P2P流之间在传输层表现出的不同,能快速地识别出P2P流以及P2P部分具体流行的应用。最后本文研究了P2P应用主机TCP流的连接特性和自相似性。 本文的主要研究工作包括以下几个方面: (1)为了对P2P的TCP数据流进行及时、快速并准确地识别,起到对P2P流量预警和控制的作用,本文提出了一种基于SVM的TCP流量早期识别算法。该算法根据不同应用流的包到达的实际情况,利用TCP流初期的三个数据包的载荷大小和服务器端口作为流量特征,利用支持向量机的高斯径向基核函数进行一对一多类分类。实验结果比较和分析表明:根据提取的特征,采用无偏训练样本,选择合适的参数能快速而有效地识别WEB、MAIL、P2P中的BitTorrent和eMule流量,这种早期流量识别算法的特征值的得到无需等待流的结束,特征提取简单。由于提取的特征不涉及到协议签名,因此早期流量识别算法对加密流量或伪装特性的业务流量识别同样适用; (2)为了减少建模的时间和提高分类的正确率,在基于SVM的TCP流量早期识别算法的基础上,提出了基于C4.5决策树的P2P流量早期快速识别算法。分类结果比较和分析表明:相对于其它两种分类算法,C4.5决策树进行分类时识别正确率高,分类速度快。因此这种早期快速识别算法利用TCP流初期的三个数据包的载荷大小和服务器端口作为特征能快速有效地识别出WEB、MAIL、P2P中的BitTorrent和eMule流量; (3)为了提高Karagiannis等人提出的P2P流启发式算法的识别正确率,利用端口4662、有效数据流的计数原理、BitTorrent对等协议握手消息数据包的载荷大小固定特点以及Skype流的包载荷特点对其进行改进,提出了一种改进的快速P2P流量启发式识别算法。实验结果比较和分析表明:在识别P2P流和Non-P2P流时,选择合适的对等点阈值,能有效识别出P2P流以及P2P流对应的部分具体应用; (4)为了识别出P2P应用主机,对P2P应用主机TCP流从连接特性和自相似性两个方面进行了研究。P2P系统的主机扮演双重角色:服务器和客户端。非P2P系统的连接模式采用传统的客户/服务器模式,发起连接时以很高的连接成功率进行,与之相反的是,由于P2P系统的动态性,P2P主机不断地向其它在线主机发起连接以保证稳定的下载速度。与系统动态性和连接成功率相关的参数为:传输的SYN包数、传输的SYN+ACK、传输的SYN包不同目的地址数、接收的SYN+ACK包的不同源地址数包数、传输的SYN包不同目的端口数、接收的SYN+ACK包的不同源端口数。实验结果比较和分析表明:在识别P2P和非P2P传统应用主机的TCP流时,利用后四个参数比利用六个参数作为流量特征有效。主机流量的自相似性从时间上和行为上进行了分析,行为上的自相似性研究表明P2P应用主机在收到一定数量的数据包后,其数据包载荷变化很小。
【学位授予单位】:北京邮电大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP393.06

【相似文献】
中国期刊全文数据库 前10条
1 宋雪;蔡一兵;金伟信;王蒙;;基于Winpcap的网络流媒体识别算法研究与实现[J];现代电子技术;2010年11期
2 刘悦;郭拯危;;基于小波支持向量机的P2P网络流量识别算法[J];计算机技术与发展;2010年10期
3 黄烟波;周磊戈;;基于流特征的P2P流量识别方法研究[J];计算机技术与发展;2009年09期
4 乐浩洪;姜汉忠;;用P2P流媒体技术加强电视覆盖[J];广播电视信息;2006年09期
5 胡伟莉;黄华文;丁成忠;;普通高校网络继续教育管理信息化的研究[J];产业与科技论坛;2007年01期
6 赵志升;罗德林;杨志东;;P2P技术与流媒体发展新趋势[J];河北北方学院学报(自然科学版);2007年01期
7 陈天罡;;流媒体与内容分发[J];通信与信息技术;2007年02期
8 陈天罡;;P2P应用及商务模式[J];通信与信息技术;2007年03期
9 陈涛;;P2P-SIP可管理媒体系统信令流程的一些研究[J];中国新通信;2007年17期
10 赵贵昉;李真;张学杰;;P2P网络资源共享中基于信誉的访问控制[J];云南大学学报(自然科学版);2007年S2期
中国重要会议论文全文数据库 前10条
1 袁野;王国仁;张莹;;P2P环境下度量空间中的相似查询处理[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 李钧;王新;;P2P存储网络中的冗余维持[A];第15届全国信息存储技术学术会议论文集[C];2008年
3 徐陈锋;奚宏生;江琦;殷保群;;一类分层非结构化P2P系统的随机优化[A];第二十六届中国控制会议论文集[C];2007年
4 唐晨;孙立峰;杨士强;;基于减小切换延迟的P2P流媒体服务器带宽分配研究[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
5 张建标;张涛;;一种基于流量行为的P2P协议识别方法[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
6 杨艳春;孟祥武;;P2P网络服务环境中的节点相似性度量研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
7 张娜娜;;P2P流量识别方法研究[A];江苏省电子学会2010年学术年会论文集[C];2010年
8 蔡文渊;夏添;徐林昊;钱卫宁;周水庚;周傲英;;P2P环境下的视图选择[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
9 丁婕;古永红;陈冬宇;;交易信任、心理感知与出借意愿——P2P在线借贷平台的出借意愿影响因素分析[A];第五届(2010)中国管理学年会——信息管理分会场论文集[C];2010年
10 苟红玲;孙卫喜;;P2P对等网络信任模型研究[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
中国重要报纸全文数据库 前10条
1 记者 朱周;昆明P2P信贷探秘[N];昆明日报;2011年
2 本报记者 陈嘉颂;P2P:生存还是死亡[N];电脑报;2002年
3 本报记者 李彦赤;国内P2P信贷热潮再探[N];中国城乡金融报;2011年
4 农总行农户金融部 黄迈;P2P小额信贷机制创新及面临问题[N];中国城乡金融报;2009年
5 本报记者 杨庆广;P2P破解移动互联网流量激增难题[N];中国电子报;2009年
6 马莉 撰稿;P2P突破传统网络模式新鲜出炉[N];国际经贸消息;2000年
7 何晶;企业网络应重视P2P流量监控[N];人民邮电;2009年
8 本报记者 王丽娟;P2P信贷试水农村金融“蓝海”[N];中国经济时报;2009年
9 主持人 王汉;P2P网络信贷:如何稳健成长[N];中国城乡金融报;2009年
10 罗军;应对P2P技术挑战需加强版权保护[N];中国知识产权报;2010年
中国博士学位论文全文数据库 前10条
1 彭建芬;P2P流量识别关键技术研究[D];北京邮电大学;2011年
2 杨磊;针对P2P节点不合作行为的信任与激励机制研究[D];电子科技大学;2012年
3 刘佳琦;移动P2P覆盖网拓扑结构及节点合作保障机制研究[D];中南大学;2012年
4 张坤;不完备测点结构损伤与荷载的同步识别算法研究[D];哈尔滨工业大学;2010年
5 高见;基于P2P的僵尸网络及关键技术研究[D];北京邮电大学;2011年
6 陈一帅;P2P流媒体系统能力研究[D];北京交通大学;2010年
7 王广奇;基于P2P框架的数据库网格中若干关键技术的研究[D];东北大学;2008年
8 郑伟平;可控P2P流媒体分发关键技术研究[D];华南理工大学;2010年
9 任祖杰;非合作性环境下的P2P搜索技术研究[D];浙江大学;2010年
10 郭良敏;P2P文件共享系统中的副本技术研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 崔燕;基于行为特征的P2P流识别技术的研究[D];解放军信息工程大学;2009年
2 李宁;基于分布式环境下的P2P信任模型研究[D];电子科技大学;2010年
3 潘雍;基于喷泉码的P2P文件共享系统研究[D];西安电子科技大学;2010年
4 刘红刚;P2P模糊信任模型中的隶属度预测和权重分配研究[D];西安电子科技大学;2009年
5 肖玮;基于混合P2P网络的应用层组播系统研究与实现[D];中南大学;2010年
6 刘倩;基于感知风险的P2P信任模型研究[D];河北大学;2009年
7 雷禹;P2P网络终端系统的设计与实现[D];华中科技大学;2009年
8 田新军;基于P2P技术的视频会议系统[D];电子科技大学;2009年
9 赵凯;基于聚类分析的P2P流量识别算法的研究[D];长沙理工大学;2011年
10 楚永;P2P服务提供者版权侵权责任研究[D];吉林大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026