基于流特征的加密流量识别技术研究
【摘要】:近年来,随着网络技术的快速发展,用户个人隐私问题越来越受到人们的重视,因此加密技术得到深入研究并被广泛应用到各种软件和协议中。然而,一些用户却利用加密技术来隐藏自己的恶意操作或非法行为,以达到逃避防火墙检测的目的。因此,从网络加密流量中区分出恶意流量对维护网络环境的安全起着非常重要的作用。
本文通过对加密流量以及流量特征的深入研究,提出了一种基于流特征的加密流量识别方法,并在此基础之上设计和实现了基于流特征的加密流量识别系统。在研究的过程中取得的主要成果如下:
1、分析和总结了常用的流量识别方法,并对基于数据包负载随机性的识别方法、基于机器学习的识别方法、基于有效负载的识别方法、基于数据包大小分布的识别方法等的原理以及实现过程进行了全面的阐述和实现。同时,本文选用了卡方检验方法来解决数据包负载的随机性检测;在基于机器学习识别方法中,本文则选用了C4.5决策树的分类方法来构建分类模型。
2、在上述流量识别方法基础之上,本文提出了一种基于流特征的加密流量识别方法,该方法将上述四种流量识别方法相结合,利用加权因子的方法充分发挥每种识别方法在不同环境下所具有的优势,体现出了非常好的实用性。基于提出的加密流量识别方法,本文设计并最终实现了一个高效的基于流特征的加密流量识别系统。
3、完成了对基于流特征的加密流量识别系统的效率和性能的评估,在评估系统过程中,本文还对加密流量识别模块中使用到的四种流量识别方法的效率进行了评估。实验结果表明,本系统的识别效果明显优于其他常用的流量识别系统,体现出了非常好的准确性和实用性。