收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于机器学习的URL安全检测技术的研究

张萌  
【摘要】:随着互联网科技的不断前进,越来越多的网络应用实例发生在我们身边,互联网科技在辅助人们生活变的更好的同时,也为人们带来了新的危险。恶意URL带给人们的损害致使人们开始逐渐意识到,采取行动来对抗恶意URL攻击,降低恶意URL攻击给人们带来危害的可能性是极其重要的。黑名单过滤检测技术也就应运而生,但随着科技的逐渐发展,数据集逐渐变得庞大,简单的黑名单检测技术远远不能满足当前对恶意URL检测技术的需求。机器学习算法逐步的应用于恶意URL的检测技术研究中,但是各个研究者所构建的模型准确率均有差异,且研究者们一般选择使用单一的机器学习算法来构建检测模型,这必然会导致检测模型在某些条件下表现出较为不好的性能。本文主要对基于机器学习的恶意URL检测技术进行了研究,构建了一个多分类器共同作用的检测模型,最后使用构建的多分类器模型设计并实现了一个对实时数据流进行处理的恶意URL检测系统。本文中主要完成的工作内容包括:分多种渠道对所需的正负数据集进行收集,并对收集到的数据进行了数据均衡、疑似恶意单词替换数据清洗等预处理操作。结合恶意URL检测特征提取的现有研究成果,加入自定义的新特征项,构建了一种新的综合特征提取方案,并对TF-IDF特征提取方案与基于word2vec词向量特征提取方案进行了实现。构建多分类器检测模型,检测模型中的三个分类器分别是,基于综合特征提取的逻辑回归模型、基于TF-IDF特征提取的SVM模型、基于word2vec词向量特征提取的CNN网络模型。通过给三种模型分配不同的权重,实验并调整恶意URL判定的阈值,来提高多分类器共同作用检测模型的综合性能。使用所提出的多分类器检测模型构建了一个恶意URL检测系统。设计并实现了一个对实时数据流进行恶意URL检测的系统,并对其进行了测试与结果分析。测试结果中发现,利用所提出的多分类器检测模型方案构建的恶意URL检测系统,在测试集上表现出了较好的分类性能,在正确率、召回率、精确率、F1值、检测耗时上表现出了较好的综合性能。


知网文化
【相似文献】
中国期刊全文数据库 前16条
1 贾蓓;李敬华;肖飞;;基于复杂电磁环境的信号检测模型构建分析[J];信息技术与信息化;2015年09期
2 蔡静;;考虑检测影响的贮存-检测模型及其参数估计[J];湖北民族学院学报(自然科学版);2012年02期
3 董斯维;郭斌;余力;;个性化推荐攻击检测模型研究[J];农业网络信息;2006年12期
4 任涵;李勇;吕天雯;;基于自适应遗传算法的猕猴桃组培检测模型[J];计算机与应用化学;2016年12期
5 李一男;刘永平;王汝琳;;一种矿用红外瓦斯传感器的检测模型[J];工矿自动化;2010年01期
6 张强;;一种利用特征选择改进的行人检测模型[J];微型机与应用;2016年02期
7 杨浩;谢昕;李卓群;章玲玲;;网络中隐蔽信道数据安全检测模型研究与仿真[J];计算机仿真;2016年10期
8 严侃;雷江涛;;基于时频分析的水声目标被动检测模型研究[J];鱼雷技术;2015年01期
9 李世淙;云晓春;张永铮;;一种基于分层聚类方法的木马通信行为检测模型[J];计算机研究与发展;2012年S2期
10 孙飞帆;施勇;薛质;;基于权重分析的网页木马检测模型[J];信息安全与通信保密;2012年12期
11 李月,杨宝俊,郭华;微弱方波信号检测模型混沌解的判定[J];地球物理学进展;2002年01期
12 唐智慧;王志鹏;党珊;朱翠翠;;手机打车软件操作驾驶分心检测模型研究[J];交通运输工程与信息学报;2018年01期
13 赵刚;姚兴仁;;基于用户画像的异常行为检测模型[J];信息网络安全;2017年07期
14 王芳芳;;分布式网络异常攻击检测模型仿真分析[J];计算机测量与控制;2016年10期
15 武为宝;贺年;程金育;邓姿源;赵成;刘文丽;;近红外光谱法建立断血流片快速检测模型[J];中国药事;2012年11期
16 贾慧;高仲合;;基于自相似的异常流量检测模型[J];通信技术;2010年12期
中国重要会议论文全文数据库 前10条
1 刘俊荣;王文槿;刘宝旭;;一种基于网络行为分析的木马检测模型[A];第十六届全国核电子学与核探测技术学术年会论文集(下册)[C];2012年
2 王建平;张自立;魏华;;战术空域冲突检测模型研究[A];Proceedings of 14th Chinese Conference on System Simulation Technology & Application(CCSSTA’2012)[C];2012年
3 李京鹏;杨林;刘世栋;;防火墙状态检测模型研究[A];第十八次全国计算机安全学术交流会论文集[C];2003年
4 孙璐;马兆丰;黄勤龙;;基于权限分析的安卓应用程序风险检测模型[A];第十届中国通信学会学术年会论文集[C];2014年
5 范渊;凌霄;;Android程序安全检测模型[A];第28次全国计算机安全学术交流会论文集[C];2013年
6 武照东;刘英凯;刘春;吴秀峰;;Overlay网络的链路故障检测模型[A];2008通信理论与技术新发展——第十三届全国青年通信学术会议论文集(下)[C];2008年
7 刘赛娥;;基于ARP欺骗的以太网检测模型的设计与实现[A];《教师教学能力发展研究》科研成果集(第六卷)[C];2017年
8 周双娥;熊国平;;基于Petri网的故障检测模型的设计与分析[A];第六届中国测试学术会议论文集[C];2010年
9 廖鹏;;基于异常特征的DDoS检测模型[A];经济发展方式转变与自主创新——第十二届中国科学技术协会年会(第四卷)[C];2010年
10 王心觉;;应用LabVIEW的建筑结构健康检测模型和预警系统实验[A];2015年上海-西安声学学会第四届声学学术交流会论文集[C];2015年
中国博士学位论文全文数据库 前10条
1 李威;复杂场景目标检测理论与方法研究[D];电子科技大学;2019年
2 白清松;基于QCM的液体检测技术研究[D];电子科技大学;2019年
3 周晓飞;基于机器学习的视觉显著性检测研究[D];上海大学;2018年
4 王燕;基于用户感知与业务特征的电信网络性能监控与检测模型研究[D];西安电子科技大学;2018年
5 邓涛;基于视觉注意的驾驶场景显著性检测模型研究[D];电子科技大学;2018年
6 赵静;网络协议异常检测模型的研究与应用[D];北京交通大学;2010年
7 唐赫;基于生物启发和统计分析相结合的图像显著性检测模型研究[D];华中科技大学;2017年
8 蒋鹏;图像内容显著性检测的理论和方法研究[D];山东大学;2016年
9 李涛;基于上下文的目标检测研究[D];电子科技大学;2016年
10 陈林洁;褪黑激素受体MT1活化的信号转导机制研究及内含肽介导的新型GPCR活化检测模型构建[D];浙江大学;2013年
中国硕士学位论文全文数据库 前10条
1 邹四旺;基于深度学习的风暴检测算法分析与研究[D];华南理工大学;2019年
2 李旭;基于应用分类的安卓恶意应用检测模型[D];广州大学;2019年
3 田野;基于多层特征融合预测的实时人脸检测模型研究[D];电子科技大学;2019年
4 严海;基于深度学习的静态图像目标检测研究[D];华北电力大学;2019年
5 黄亚东;蒙古马奶常规营养成分检测与NIR快速检测模型建立[D];内蒙古农业大学;2019年
6 张小强;基于格式塔理论的视觉显著检测模型研究[D];江西财经大学;2019年
7 丁冠群;基于视觉注意力的视频异常检测模型研究[D];江西财经大学;2019年
8 蒋威;基于生成对抗网络的感兴趣区域目标检测方法[D];杭州电子科技大学;2019年
9 陶方舰;基于深度学习的Webshell检测技术研究[D];海南大学;2019年
10 丁一凡;基于卷积神经网络的车辆行人检测模型的研究[D];重庆邮电大学;2019年
中国重要报纸全文数据库 前3条
1 赛迪出版传媒首席记者 郭涛;预见性安全“又快又好”[N];中国计算机报;2018年
2 中联绿盟、李群;IDS的关键:解决好误报和漏报[N];中国计算机报;2002年
3 ;文化力是决定成败的关键因素[N];常州日报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978