收藏本站
《中国矿业大学》 2019年
收藏 | 手机打开
二维码
手机客户端打开本文

基于改进TCD图像检索和分类的钓鱼检测模型的研究

刘博文  
【摘要】:钓鱼网站检测已经形成钓鱼攻击和钓鱼检测相互博弈的局面。钓鱼检测的方向和技术因为钓鱼攻击技术的不断升级,需要寻求新的角度。在特征计算方面,钓鱼网站检测方法计算钓鱼网站与单一疑似目标网页的相似性,这一特点导致判断钓鱼网站的条件过于简单;在网页特征提取方面,钓鱼网站的检测不仅缺乏对网页和网页特征之间独立性的保证,而且特征提取也只是以网页本身为主。这两方面都造成钓鱼检测技术易于被反检测,从而降低了检测的效率和准确率。因此从基于人类视觉行为降低网页和网页特征的相关度的角度和从复杂化特征计算的角度,针对反检测展开对钓鱼网站检测的研究,主要内容如下:(1)提出基于改进TCD特征空间转换的钓鱼网站检测算法。对能够表达网页外部特征的基元相关性算子(Texton Correlation Descriptor,TCD)进行改进,使其更能契合钓鱼检测对特征的要求。首先改进基元相关性算子中底层纹理特征提取方法;其次提出结合基于位置加权的欧式距离和双十字窗口选择邻域的方法,改进特征相关性统计;然后基于空间关系将图像化网页的集合,映射到新的特征空间中,分离网页和网页特征之间的相关度从而达到反检测目的;最后利用大量图像化网页之间的相似关系进一步改进TCD算子。实验表明,将改进的TCD算子应用到钓鱼网站识别中,具有令人满意的稳定性和精确度。(2)提出基于结构化文档模型的钓鱼网站检测算法。利用人类的视觉行为,网页内部代码特征与网页布局的关系,提出基于网页的主视觉区域的结构化文档DMVA(Document Based on Main Visual Area)模型检测钓鱼网站。首先提出子间归并算法(Merge Algorithm Between Child Nodes,MABC)生成网页的视觉分块和分层DOM树;其次结合用户的视觉行为和分层DOM树的分层结构,提取网页的主视觉区域;然后获取网页的分层主视觉区域中的文本信息,进而构造网页的DMVA对网页重构,降低网页和网页特征的相关度;最后提出相关网站集,计算待测网站DMVA和相关网站集中网页的DMVA的相似性,检测钓鱼网站。实验证明,基于DMVA模型的钓鱼网站检测算法具有较好检测准确度。(3)提出基于改进TCD图像检索和分类的钓鱼检测模型。结合TCD算子表达网页外部特征的优势和DMVA文档包含网页内部特征的优势,首先将网页图像化;其次基于DMVA模型构造包含视觉信息的视觉分层TCD算子;然后构造TCD-PLSA四层概率潜在语义模型对网页分类;最终在相应分类中通过网页检索和特征转换,计算网页之间的相似性,判断待检测网站是否是钓鱼网站。TCD-PLSA模型的离线训练部分涉及的数据规模大,采用Map Reduce对其进行并行化设计。实验证明基于改进TCD图像检索与分类的钓鱼检测模型具有良好的稳定性和钓鱼检测准确度。
【学位授予单位】:中国矿业大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.41;TP393.08

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 ;严正声明[J];中国输血杂志;2019年07期
2 郭萍;;钓鱼网站的鉴别方法与防范策略研究[J];湖北水利水电职业技术学院学报;2012年03期
3 郭萍;;钓鱼网站的鉴别方法与防范策略研究[J];学术问题研究;2012年01期
4 郭萍;;钓鱼网站的鉴别方法与防范策略研究[J];石家庄城市职业学院教学与研究;2012年04期
5 陈炜宏;;基于决策树模型的构建方法及预测能力的分析——以钓鱼网站为例[J];通讯世界;2018年12期
6 ;严正声明[J];中国输血杂志;2018年01期
7 ;严正声明[J];中国输血杂志;2018年04期
8 杨云;徐光侠;雷娟;;基于属性降维的钓鱼网站检测方法[J];重庆邮电大学学报(自然科学版);2018年04期
9 李江丰;王玮;;钓鱼网站的识别与分析方法研究[J];通信管理与技术;2018年03期
10 技术宅;;你是这样上钩的? 解密新型钓鱼网站[J];电脑爱好者;2017年11期
中国重要会议论文全文数据库 前4条
1 张丰;;反钓鱼监控体系建设探讨[A];第二届全国信息安全等级保护技术大会会议论文集[C];2013年
2 李晨;陈星霖;;一种多阶段控制方法在对抗钓鱼攻击中的应用[A];第26次全国计算机安全学术交流会论文集[C];2011年
3 方鸣;;互联网钓鱼网站处理系统组网[A];中国通信学会信息通信网络技术委员会2015年年会论文集[C];2015年
4 李增刚;;计算机病毒:寻租视角的分析[A];2011年(第九届)“中国法经济学论坛”论文集[C];2011年
中国重要报纸全文数据库 前10条
1 秦伟;反钓联盟累计处理钓鱼网站72733个[N];科学时报;2011年
2 本报记者 来扬 实习生 郝帅;网购火车票:钓鱼网站骗钱新招术[N];中国青年报;2012年
3 石磊;一亿人次网民遭钓鱼网站侵袭“云攻击”正成为现实[N];科学时报;2011年
4 本报记者 王俊秀 实习生 翟璐;钓鱼网站出没,网购请注意[N];中国青年报;2011年
5 江舟 范通广;钓鱼网站,“钓”了上百万[N];检察日报;2019年
6 本报记者 黄鑫;钓鱼网站成网络诈骗主渠道[N];经济日报;2019年
7 鲁畅;北京重拳打击钓鱼网站[N];中国质量报;2019年
8 实习生 卢义杰 本报记者 陈璐;钓鱼网站与网购狂欢如影随形[N];中国青年报;2012年
9 记者 王晓洁 郭宇靖 卢国强;信息“黑市”为何如此猖獗?[N];经济参考报;2017年
10 北京商报记者 孙麒翔 石飞月;钓鱼网站遭国家急收网[N];北京商报;2017年
中国博士学位论文全文数据库 前1条
1 张健毅;大规模反钓鱼识别引擎关键技术研究[D];北京邮电大学;2012年
中国硕士学位论文全文数据库 前10条
1 黄炎;基于智能算法的钓鱼网站识别研究[D];长春工业大学;2019年
2 刘博文;基于改进TCD图像检索和分类的钓鱼检测模型的研究[D];中国矿业大学;2019年
3 王雨琪;基于URL的钓鱼目标识别的研究[D];中国矿业大学;2019年
4 朱琪;基于页面特征的钓鱼网站层次化检测的研究[D];中国矿业大学;2019年
5 王文腾;基于线性SVM的钓鱼网站检测系统的设计与实现[D];北京建筑大学;2019年
6 叶成成;基于最优特征选择和神经网络的钓鱼网站检测研究[D];安徽大学;2019年
7 潘良敏;基于GIST全局特征的钓鱼网站聚类算法研究[D];中南林业科技大学;2018年
8 赵佳琪;基于数据挖掘分类算法的钓鱼网站检测研究[D];内蒙古财经大学;2018年
9 邓娜;基于QR二维码钓鱼网站的识别系统研究[D];长安大学;2018年
10 韩浩;基于云计算的钓鱼网站检测研究[D];中国矿业大学;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026