基于P2P流特征的流量识别技术研究
【摘要】:
有关调查表明,P2P业务已悄然占据了互联网业务总量的60%-80%,成为杀手级宽带互联网应用。P2P业务流量在对互联网业务起巨大推动作用的同时,也带来了因资源过度占用而引起的网络拥塞以及安全隐患等问题,妨碍了正常的网络业务的开展。为了保证网络正常有序的运行,有必要对P2P流量进行控制管理。但随着数据加密技术和动态端口技术的出现,P2P流量识别技术也面临巨大的挑战。
本文对目前主要的几种流量识别技术进行了对比分析,指出了它们的优缺点。着重对基于流量特征的流量识别方法进行了研究,指出了其效率低下的原因即存在类似于P2P应用的非P2P应用的干扰和P2P应用流量特征的不稳定性。在此基础上,给出了相应的解决办法提出了一种基于多重特征的流量识别方法,实验证明该方法能在一定程度上提高检测效率。然后针对几个核心的流量特征与P2P主机识别概率的关系,提出了基于P2P流特征的回归分析方法。通过分析发现P2P主机连接数只有在小于5或者大于20时才有比较好的区分度,而且P2P主机监听端口的连接特点在排除连接数小于5的连接后能有更好的区分度,论文给出了相应的回归方程。最后,本文对P2P流量识别技术进行了展望。