收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于近邻成分分析的WebShell特征降维方法研究与实现

周爱君  
【摘要】:目前,网络安全已提升到国家战略高度。网页后门(Web Shell)是当前网络安全领域的主要威胁之一。随着高新技术的应用,各种类型的网络后门层出不穷,Web Shell检测已经成为网络安全研究领域的重要研究对象之一。近年来,在源码层和源码编译结果层的Web Shell检测研究均取得了新进展,有效提高了对未知Web Shell的检出能力。在Web Shell文本特征构建过程中,注重尽可能多的保留文本信息。信息完备度越高,不同类型的Web Shell的检出概率就越大。但是,大量的文本数据及其特征会引发信息冗余、结果误判、计算代价高等问题。降维是处理海量数据的有效方法,能从高维特征中躲避噪声数据干扰,挖掘关键信息。因此,有必要研究一种有利于分类的特征降维方法,挖掘有效信息,获得文本表征的关键成分。本文引入度量学习中的近邻成分分析算法(Neighbourhood Components Analysis,NCA),从特征提取和特征选择两个角度研究了近邻成分分析算法在Web Shell特征降维的应用,主要工作和贡献可以归纳为:1)确定以研究PHP语言编写的Web Shell为主,将Web Shell源码编译层的opcode序列特征作为研究对象,构建适用于Web Shell的特征指标模型。其中,针对opcode序列特征上下文考虑不全面的问题,本文提出采用非定长序列片段的方式保留操作码的上下文信息。2)提出基于NCA_Relief F的Web Shell特征提取方法,缓解了opcode序列特征数量爆炸,导致Web Shell检测效果不理想的问题。NCA_Relief F方法具有两个特性:其一,能够有效结合分类器准确率自动化调整投影矩阵,在保证高准确率的同时完成高维特征的约减;其二,能够根据低维空间下近邻样本的特征差异表达,精选出具有类别区分能力的特征。实验表明,基于NCA_Relief F的Web Shell特征提取方法获得的特征成分能有效检测出恶意样本,并在召回率上优于大多数传统特征降维算法。3)提出基于规范化近邻成分分析(Regularized Neighbourhood Component Analysis,RNCA)的Web Shell特征选择方法,方法解决了两个问题。其一,弥补NCA_Relief F方法特征解释性差的缺陷,方法通过迭代学习到的权重向量,从opcode序列特征集合中选择出有利于分类的特征,实现特征降维。其二,解决特征单一化问题造成的Web Shell检测性能受限的问题。方法从统计学角度增加特征完备度,采用静态统计特征和行为序列特征组合的方式,判别待检测样本是否为Web Shell。实验表明基于RNCA的特征选择方法的准确率能达到99%。WebShell检测方法多样,需要根据不同的需求进行选择。倘若需要快速构建模型完成预测,采用NCA_Relief F方法完成特征降维,可找回数量较多Web Shell样本。倘若对样本识别准确度要求较高,可忽略训练时长,采用基于RNCA的特征选择方法可高质量完成检测任务。


知网文化
【相似文献】
中国期刊全文数据库 前17条
1 李可;方滨兴;崔翔;刘奇旭;严志涛;;基于Webshell的僵尸网络研究[J];通信学报;2016年06期
2 胡建康;徐震;马多贺;杨婧;;基于决策树的Webshell检测方法研究[J];网络新媒体技术;2012年06期
3 易楠;方勇;黄诚;刘亮;;基于语义分析的Webshell检测技术研究[J];信息安全研究;2017年02期
4 周颖;胡勇;;基于关联分析的Webshell检测方法研究[J];信息安全研究;2018年03期
5 何树果;张福;朱震;程度;;Webshell检测方案探索与实践[J];信息网络安全;2020年S1期
6 李源;王运鹏;李涛;马宝强;;基于多特征融合的Webshell恶意流量检测方法[J];网络与信息安全学报;2021年06期
7 王跃达;黄潘;荆涛;宋雅稀;;一种基于高速网络的WebShell综合检测溯源技术研究与实现[J];信息网络安全;2021年01期
8 端木怡婷;;Webshell检测方法研究综述[J];软件;2020年11期
9 王亚丽;;webshell查杀逃逸技术研究[J];网络安全技术与应用;2017年09期
10 张涵;薛质;施勇;;基于多层神经网络的Webshell改进检测方法研究[J];通信技术;2019年01期
11 戴桦;李景;卢新岱;孙歆;;智能检测WebShell的机器学习算法[J];网络与信息安全学报;2017年04期
12 管军霖;智鑫;赵森;;基于系统日志等隐蔽方式加载Webshell及其安全防护研究[J];中国高新科技;2020年06期
13 赵志远;;WebShell的“大杀器” 雷火引擎公测赛检验实力[J];网络安全和信息化;2020年06期
14 赵瑞杰;施勇;张涵;龙军;薛质;;基于TF-IDF的Webshell文件检测[J];计算机科学;2020年S2期
15 王宝石;;网络广播电视台网站WebShell防护体系构建[J];广播与电视技术;2019年04期
16 王文清;彭国军;陈震杭;胡岸琪;;基于组合策略的Webshell检测框架[J];计算机工程与设计;2018年04期
17 姜天;;基于卷积神经网络的Webshell检测方法研究[J];信息技术与网络安全;2019年07期
中国重要会议论文全文数据库 前2条
1 石磊;宋昭;;webshell检测的新思路[A];第二届全国信息安全等级保护技术大会会议论文集[C];2013年
2 韩中元;李生;杨沐昀;齐浩亮;;面向信息检索的近邻语言模型[A];第六届全国信息检索学术会议论文集[C];2010年
中国博士学位论文全文数据库 前1条
1 苟建平;模式分类的K-近邻方法[D];电子科技大学;2013年
中国硕士学位论文全文数据库 前20条
1 周爱君;基于近邻成分分析的WebShell特征降维方法研究与实现[D];新疆大学;2021年
2 刘传兴;基于Web知识库的多层次Webshell防御研究[D];浙江大学;2018年
3 史丹丹;集成学习与特征工程在Webshell检测和网络入侵检测中的应用[D];山东科技大学;2020年
4 秦英;基于机器学习的WebShell检测模型研究[D];武汉邮电科学研究院;2019年
5 李婷婷;基于机器学习的Webshell检测研究[D];电子科技大学;2020年
6 肖中正;基于贝叶斯网络的Webshell检测方法研究[D];新疆大学;2020年
7 郭优;基于综合策略的Webshell检测方法研究[D];西安工业大学;2020年
8 张涵;基于机器学习的Webshell检测模型研究[D];上海交通大学;2019年
9 周龙;基于LSTM的Webshell检测方法研究[D];武汉邮电科学研究院;2020年
10 王世通;基于HTTP协议的WebShell检测研究[D];北京邮电大学;2021年
11 马艳发;基于WAF入侵检测和变异WebShell检测算法的Web安全研究[D];天津理工大学;2016年
12 潘杰;基于机器学习的WebShell检测关键技术研究[D];中国民航大学;2015年
13 先正锴;基于机器学习的Webshell检测研究[D];成都信息工程大学;2019年
14 曹玮;基于SSH协议的WebShell系统的设计与实现[D];北京交通大学;2012年
15 于泓凯;基于深度学习的Webshell流量检测技术研究[D];北京邮电大学;2020年
16 韩彤;基于深度学习的WebShell检测方法的研究与实现[D];北京邮电大学;2021年
17 闵嘉军;Conv-BiLSTM:基于Bi-LSTM的新型智能WebShell检测网络[D];兰州大学;2021年
18 宋明璐;基于主动学习的CNN Webshell检测[D];北京交通大学;2021年
19 梁洲;改进的K-近邻模式分类[D];电子科技大学;2015年
20 李洋;空间数据库中的反k近邻查询方法[D];吉林大学;2015年
中国重要报纸全文数据库 前7条
1 本报记者 林瑞琪 通讯员 陈念钦;探索“近邻党建” 拉近邻里距离[N];福州日报;2020年
2 记者 徐超 王炜丽;远村有了“近邻”[N];湖州日报;2021年
3 南方日报记者 陈捷生 通讯员 曾斌戈 实习生 陈婉婷;“远亲不如近邻,近邻不如110”[N];南方日报;2014年
4 记者 吴燕如 通讯员 思组轩;时代呼唤“近邻” “近邻”选择思明[N];厦门日报;2020年
5 实习生 陈静 本报记者 张海涛;远亲不如近邻[N];吉林日报;2006年
6 健康时报特约专家 徐庆;饮食:“远亲”胜“近邻”[N];健康时报;2005年
7 记者 邱夏;中蒙俄放大近邻优势,“家门口”谋共赢[N];新华每日电讯;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978