基于支持向量机的入侵检测方法研究
【摘要】:
入侵检测(Intrusion Detection,ID)是信息安全不可缺少的技术之一,已成为近年来网络安全技术的新热点。现有ID大多基于规则检测,存在检测速度慢,检测准确率不高,误报、漏报率高等缺点。支持向量机(Support Vector Machine,SVM)是基于统计学理论的机器学习方法,它较好地解决了小样本、非线性过学习、高维数等实际问题。因此,将SVM应用于入侵检测中,可以克服一般入侵检测方法的缺陷,获得较好的检测性能。
基于以上认识,论文对基于SVM的入侵检测方法进行了研究,具体完成以下工作:
(1)对ID基本理论进行了探讨,对SVM理论进行较为深入的分析,总结了基于SVM的ID方法的研究现状;
(2)对通用的基于SVM的入侵检测模型进行分析,指出提高该模型效率的有效途径; (3)提出了一种基于主成分分析(Principal Component Analysis,PCA)和聚类
距离比较(Clustering Distance Comparison,CDC)的入侵检测数据预选取算法PCA-CDC,从而提高了学习速度;
(4)提出一种有效利用PCA-CDC预选取算法中聚类分析的训练结果并结合KKT(Karush-Kuhn-Tucher,KTT)条件判断和无用样本淘汰方法的改进SVM增量学习算法。该算法节省了训练时间,提高了增量学习效果;
(5)将提出的PCA-CDC算法和改进增量学习算法应用于入侵检测数据集KDD CUP 1999,与传统的基于支持向量机的入侵检测方法相比,验证了算法的有效性。最后,作者对所做的工作进行了总结,并对以后的研究工作进行了展望。