收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于SVM的网络流量特征降维与分类方法研究

曹杰  
【摘要】:网络流量特征的分类能够对相应网络流量实现差别化管理,是后续的网络协议设计、网络运营管理、网络流量调度的基础及依据,并且为网络安全中网络攻击的检测及流量清洗提供手段。本文从支持向量机(Support Vector Machines,SVM)的网络流量特征降维与分类方法入手,主要从以下两个方面进行研究:一是针对网络流量特征维度较高或特征冗余导致分类模型性能下降的问题,将过滤式(Filter)与封装式(Wrapper)特征选择方法相结合,对特征选择的评估判据、搜索策略进行改进;同时,基于特征提取样本空间变换理论,研究了嵌入二次特征选择模块的特征提取模型。二是针对SVM分类模型经验风险和泛化能力的平衡问题,运用非线性SVM核函数变换理论,对SVM核函数参数优化方法、寻优算法的搜索能力与收敛能力的增强方法展开研究。主要研究成果如下:1.在特征选择问题研究中,为了选择能代表原始流量数据分布特性的最优特征子集,并能对其进行准确解释和分析,提出了一个Filter-Wrapper混合特征选择模型。采用Filter式特征选择方法,根据原始特征集中每个特征的权重,将小于设定阈值?的特征删除。在生成的新特征子集上采用Wrapper方式,基于SVM并结合相应搜索策略进行二次特征筛选,选择具有强区分能力的组合特征子集。该模型解决了单纯使用Filter式特征选择引起的组合特征被误删,以及特征评价结果与最终分类算法存在偏差的问题。2.针对SVM易受具有高相似依赖性冗余特征影响的问题,提出了一个嵌入二次特征选择模块的主成分分析特征提取模型。该模型在确定关键特征时,自适应选择二次特征选择模块,检查每个特征的相关性,结合相应搜索策略锁定关键特征,加强了特征的最大关联—最小冗余性。模型通过样本空间变换,能够获取最大化某个方向上的特征子空间,且能减少数据输入宽度,有效降低计算复杂度,缩短训练时间。实验结果表明,该特征提取模型降维效果明显,且在较小的无偏训练样本下可以达到与原始样本数据集一致的分类效果,对于网络流量实时分类具有实际意义。3.为了平衡SVM流量分类模型经验风险和泛化能力,提高优化模型分类与泛化能力,针对参数寻优空间范围不同,分别提出了两个改进的参数优化算法。当搜索空间范相对较小时,提出了改进的网格搜索参数优化算法。该算法能够动态调整二次搜索区域,减少二次网格生成密度,提高算法搜索效率,并在优化参数同时防止过拟合现象产生。当搜索空间范围相对较大且遍历搜索节点较困难时,提出了改进的粒子群参数优化算法。该算法采用非线性惯性权重系数以及异步优化的学习因子,自适应地平衡了算法的全局和局部搜索能力,不需要大范围搜索并能在进化的过程中快速收敛到最优解,增强了算法的收敛能力。实验结果表明,本文提出的流量分类模型参数优化算法能够在有限次计算代价内,从参数空间中找到最优参数组合,有效地提高了SVM的分类与泛化能力,并在六个不同的SVM训练模型中均达到了很好的分类效果。4.针对流量分类降维过程中需要减少二次特征选择环节同时能够对原始关键特征组合分量进行准确解释,以及参数寻优过程中搜索空间范围较大且存在精英个体的情况,本文构建了一个基于特征选择和细菌觅食参数优化算法的SVM流量分类模型。在模型特征选择阶段,利用改进的遗传算法对特征选择进行优化,无需二次特征选择就可以筛选出网络流量关键特征,并对原始关键特征进行确定,准确的解释了组合分量特征,兼顾了数据间的相关性。在模型参数优化阶段,采用了改进的细菌觅食算法进行参数优化。改进的核心算子避免了精英个体的丢失,并能快速地收敛到全局最优解。该算法不需要大范围搜索及逐步调节,不易出现早熟现象。通过实验结果表明,本文提出的网络流量分类模型建模时间显著缩短,且流量分类精度显著提高。与其它典型的有监督分类方法相比,该模型在分类精度和学习机器泛化能力方面都有着明显的优势。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 江乃雄;蔡民;;综合距离特征选择问题解的存在性与唯一性[J];计算机应用与软件;1992年01期
2 吉小军,李世中,李霆;相关分析在特征选择中的应用[J];测试技术学报;2001年01期
3 贾沛;桑农;唐红卫;;一种改进的类别依赖型特征选择技术[J];计算机与数子工程;2003年06期
4 靖红芳;王斌;杨雅辉;徐燕;;基于类别分布的特征选择框架[J];计算机研究与发展;2009年09期
5 吴洪丽;朱颢东;周瑞琼;;使用特征分辨率和差别对象对集的特征选择[J];计算机工程与应用;2010年16期
6 杨艺;韩德强;韩崇昭;;基于排序融合的特征选择[J];控制与决策;2011年03期
7 李云;;稳定的特征选择研究[J];微型机与应用;2012年15期
8 钱学双;多重筛选逐步回归特征选择法及其应用[J];信息与控制;1986年05期
9 宣国荣;柴佩琪;;基于巴氏距离的特征选择[J];模式识别与人工智能;1996年04期
10 范劲松,方廷健;特征选择和提取要素的分析及其评价[J];计算机工程与应用;2001年13期
11 王新峰;邱静;刘冠军;;基于特征相关性和冗余性分析的机械故障特征选择研究[J];中国机械工程;2006年04期
12 张葛祥;金炜东;胡来招;;满意特征选择及其应用[J];控制理论与应用;2006年01期
13 刘晓志;黄厚宽;尚文倩;;带专业词库的特征选择[J];北京交通大学学报;2006年02期
14 蒋盛益;王连喜;;基于特征相关性的特征选择[J];计算机工程与应用;2010年20期
15 周瑞琼;朱颢东;吴洪丽;;基于两种特征贡献度的特征选择[J];河南科技大学学报(自然科学版);2010年05期
16 张禹;刘云东;;基于相容粒的特征选择[J];宿州学院学报;2011年02期
17 孙建文;刘三(女牙);杨宗凯;王佩;;采用集成特征选择的网络书写纹识别研究[J];小型微型计算机系统;2012年05期
18 潘湑;顾宏斌;赵芷晴;;术语定义抽取的特征选择框架[J];南京航空航天大学学报;2012年03期
19 魏小敏;;特征选择在蛋白质能量热点预测中的应用[J];电脑知识与技术;2013年04期
20 付涛;;基于特征选择的多示例学习算法研究[J];科技通报;2013年08期
中国重要会议论文全文数据库 前10条
1 靖红芳;王斌;杨雅辉;;基于类别分布的特征选择框架[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 李长升;卢汉清;;排序学习模型中的特征选择[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
3 刘功申;李建华;李生红;;基于类信息的特征选择和加权方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 倪友平;王思臣;马桂珍;陈曾平;;分支界定算法在低分辨雷达飞机架次判别中的应用[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
5 李泽辉;聂生东;陈兆学;;应用多类SVM分割MR脑图像特征选择与优化的实验研究[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
6 蒙新泛;王厚峰;;主客观识别中的上下文因素的研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
7 尚修刚;蒋慰孙;;模糊特征提取新算法[A];1997中国控制与决策学术年会论文集[C];1997年
8 潘荣江;孟祥旭;杨承磊;王锐;;旋转体的几何特征提取方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
9 薛燕;李建良;朱学芳;;人脸识别中特征提取的一种改进方法[A];第十三届全国图象图形学学术会议论文集[C];2006年
10 杜栓平;曹正良;;时间—频率域特征提取及其应用[A];2005年全国水声学学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 曹杰;基于SVM的网络流量特征降维与分类方法研究[D];吉林大学;2017年
2 李静;高维数据交互特征选择和分类研究[D];燕山大学;2015年
3 刘风;基于磁共振成像的多变量模式分析方法学与应用研究[D];电子科技大学;2014年
4 王石平;粗糙拟阵及其在高维数据降维中的应用研究[D];电子科技大学;2014年
5 代琨;基于支持向量机的网络数据特征选择技术研究[D];解放军信息工程大学;2013年
6 王爱国;微阵列基因表达数据的特征分析方法研究[D];合肥工业大学;2015年
7 杨峻山;生物组学数据的集成特征选择研究[D];深圳大学;2017年
8 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
9 张明锦;基于特征选择的多变量数据分析方法及其在谱学研究中的应用[D];华东理工大学;2011年
10 高青斌;蛋白质亚细胞定位预测相关问题研究[D];国防科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 周瑞;基于支持向量机特征选择的移动通信网络问题分析[D];华南理工大学;2015年
2 张金蕾;蛋白质SUMO化修饰位点预测的数据挖掘技术研究[D];西北农林科技大学;2015年
3 陈云风;基于聚类集成技术的高铁信号故障诊断研究[D];西南交通大学;2015年
4 张斌斌;网络股评的倾向性分析[D];中央民族大学;2015年
5 季金胜;高分辨率遥感影像典型地物目标的特征选择及其稳定性研究[D];上海交通大学;2015年
6 袁玉录;基于数据分类的网络通信行为建模方法研究[D];电子科技大学;2015年
7 王虎;基于试验设计的白酒谱图特征选择及支持向量机参数优化研究[D];南京财经大学;2015年
8 王维智;基于特征提取和特征选择的级联深度学习模型研究[D];哈尔滨工业大学;2015年
9 皮阳;基于声音的生物种群识别[D];电子科技大学;2015年
10 刘树龙;特征选择在软件缺陷预测中的应用技术研究[D];南京大学;2015年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978