高速网络中实时流量识别系统的研究与设计
【摘要】:
下一代互联网为用户带来了丰富多彩的用户体验,但同时庞大的网络流量也给网络管理人员及服务提供商带来了巨大的挑战。流量监测是保障网络可控性的基础。目前传输速率为10Gbps的设备已经被广泛应用,传输速率为40Gbps的设备也将出现在骨干网上,这给传统的流量监测技术提出了更高的要求。目前业界对流量识别技术的研究还远远无法满足业务发展的步伐,主要体现在目前大多数技术都采用离线分类的手段,无法实现实时监控。本文主要研究高速网络中实时流量识别系统的研究与设计,该系统能对高速网络环境下的业务进行实时精确分类,实现下一代网络流量的有效控制。
本文深入学习和研究了传统流量识别技术以及数据挖掘的流量识别方法,提出了基于数据流挖掘的流量识别技术,并将采样技术应用到数据包采集过程中,以保证在不影响分类准确性的前提下,降低流量识别系统的负担。同时,本文将VFDT (Very Fast Decision Tree)算法应用于实时流量识别中,并详细分析了如何在实时流量识别系统中应用VFDT算法。与此同时,定义了实时属性的重要特性,并制定了适合于本流量识别系统的实时属性集。最后,通过相关的实验以及不同情况下的结果进行了统计分析,说明如何根据实时流量识别系统的要求来使用VFDT算法,通过选择不同的VFDT参数以及不同的分类粒度,全面展示了该流量识别系统的分类精度。