基于聚类分析的入侵检测方法研究
【摘要】:
随着网络技术的飞速发展和网络应用范围的不断扩大,对网络的各类攻击与破坏与日俱增。在网络安全问题日益突出的今天,如何迅速有效地发现各种入侵行为,对于保证系统和网络资源的安全显得十分重要。传统的防火墙、数据加密等静态防御方式已很难满足网络安全的需求,而入侵检测系统作为一种积极主动的安全防护技术,它是信息安全保护体系结构中的一个重要组成部分,针对入侵检测方法和技术的研究己经引起人们越来越多的重视。
当前多数入侵检测方法是使用大量的标记数据来训练入侵检测模型,然而很多情况下并没有已准备好的可供使用的标记数据。如果对收集到的数据进行手工标记,由于数据量十分庞大,将会耗费大量的时间和精力。基于聚类的入侵检测方法是一种典型的无监督学习技术,可以在未标记数据集上直接建立入侵检测模型或者发现异常数据,对于提高入侵检测系统的效率有着重大的研究价值。
基于上述的研究背景,本文的主要工作如下:
1.以基于聚类的入侵检测技术研究为核心,首先对入侵检测技术和数据挖掘中的聚类分析方法进行研究和分析,探讨聚类算法在入侵检测中的应用。
2.针对传统的聚类算法在入侵检测中的优势与不足,本文首先在传统K-Means算法的基础上,提出一种基于密度的初始聚类中心选择方法,克服了传统K-Means算法需要人为确定k值的问题。其次在改进的K-Means算法所得到的聚类结果上,提出一种新的聚类合并算法,该算法适用于高维数据集,能发现任意形状聚类,对入侵检测数据能得到很好的聚类效果。
3.建立基于设计算法的入侵检测模型,采用KDD CUP1999数据集中的数据对算法聚类效果进行检测,算法分析与实验结果表明改进后的算法具有较好的检测性能,可以获得较高的检测率和较低的误报率。