收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

垃圾邮件过滤中的敌手分类问题研究

邓蔚  
【摘要】:机器学习作为一种重要的智能信息处理技术,在垃圾邮件过滤系统中得到广泛的应用。然而在实际对抗性网络环境中,垃圾邮件过滤器面临着垃圾邮件发送者无休止恶意攻击的威胁。从而导致在实验环境中高性能的机器学习算法,在实际应用时其性能可能变的很差。敌手分类的提出正是为了应对这种挑战,并成为当前机器学习领域的研究热点,具有重大的理论和实际应用价值。 本文针对垃圾邮件过滤中的敌手分类问题展开了研究,包括对敌手分类中的攻防博弈问题,垃圾邮件过滤的抗中文好词攻击问题,以及基于Kolmogorov复杂性的鲁棒性分类问题这三方面的研究。本文取得了如下五点创新性成果: 1.提出了一个基于Stackelberg延时博弈的敌手分类模型。以往基于Stackelberg博弈的敌手分类模型,不能解释取得纳什均衡后垃圾邮件发送者为何还要继续发动攻击。本模型将实际中跟随者的反应延时引入Stackelberg博弈建模,重点分析了反应延时对领导者和跟随者收益的影响,并利用遗传算法得到纳什均衡,最后通过实验仿真验证了本模型的正确性。本模型表明垃圾邮件发送者具有先发优势,并在数据挖掘者的反应延时中获得超额收益,从而不断发起新的攻击。 2.提出了一个基于Stackelberg不确定性博弈的敌手分类模型。现有敌手分类的Stackelberg博弈模型通常假设跟随者的行动是最优的和理性的,这在实际垃圾邮件过滤中是不合理的。本模型将跟随者的有限理性和有限观察引入敌手分类的Stackelberg博弈建模,并重点分析了不确定性参数对分类器性能的影响,最后通过真实邮件数据集进行了实验,验证了本模型的有效性。 3.提出了一个抗中文垃圾邮件好词攻击的多示例逻辑回归模型。目前对中文好词攻击问题的研究尚不多见。本模型结合中文分词技术和特征选择方法进行预处理,并利用多示例机制和逻辑回归算法进行学习和分类,最后在中文邮件数据集上进行了实验。实验结果表明该模型能够有效对抗中文垃圾邮件的好词攻击,且鲁棒性优于单示例逻辑回归和单示例支持向量机模型。 4.提出了一个基于Kolmogorov复杂性的垃圾图像分类模型。传统的垃圾图像分类算法存在着鲁棒性较差、图像特征对特定数据集敏感等问题。本模型利用数据压缩技术和Kolmogorov分类机制,实现了对垃圾图像的准确分类。通过在垃圾图像数据集上进行实验,验证了本模型能有效对垃圾图像进行分类。同时对该模型的更新机制进行了安全性分析。本模型既不需要提取图像中的文字,也不需要对图像特征进行定义和选择,是一种数据驱动的无参数分类方法。 5.提出了一个基于Kolmogorov复杂性的恶意软件检测框架。垃圾邮件是传播恶意软件的有效方式,传统的基于特征码的方法难于检测新的和变种的恶意软件。本模型提出了一种通用的恶意软件检测方法,并利用动态马尔科夫压缩来对代码样本进行分类,最后的实验结果验证了本框架能对恶意软件进行准确的分类。本框架实现简单,无需提取特征码,并且能够有效识别新的和变种的恶意软件。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 林伟;;一种基于成词概率的贝叶斯垃圾邮件过滤方法[J];计算机技术与发展;2011年09期
2 小文龙;;巧设置,让163邮箱拒收所有垃圾邮件[J];电脑知识与技术(经验技巧);2011年07期
3 金彩琴;裘国永;;对垃圾邮件过滤技术的问题研究[J];计算机技术与发展;2011年09期
4 陈葡;谢晓尧;徐洋;;基于词序列核的垃圾邮件过滤[J];武汉大学学报(理学版);2011年05期
5 李智信;;善用10分钟邮箱 跟垃圾邮件说再见[J];电脑爱好者;2011年10期
6 ;恶意软件空前激增而垃圾邮件大幅减少[J];微电脑世界;2011年07期
7 ;查看信头 找到垃圾邮件真正发件人[J];计算机与网络;2010年02期
8 苏锋;;@[J];微电脑世界;2011年08期
9 李志东;;Linux系统下postfix邮件系统反垃圾技术解析[J];一重技术;2011年03期
10 任贤;;一种多算法协作式垃圾邮件过滤模型[J];科技信息;2011年16期
11 黄胜宇;徐汀荣;王宏瑞;;基于有向赋权图的垃圾邮件社团发现算法[J];微计算机信息;2011年07期
12 徐芳;范文凌;;基于链接信息网络的垃圾邮件检测[J];电脑知识与技术;2011年26期
13 蔡恩泽;;晚年“混迹”网络[J];老同志之友;2011年16期
14 陶永才;薛正元;石磊;;基于MapReduce的贝叶斯垃圾邮件过滤机制[J];计算机应用;2011年09期
15 张迎春;;多重安全机制在电子邮件系统中的应用[J];计算技术与自动化;2011年02期
16 张迎春;;一个支持多域的安全邮件系统设计与实现[J];微型电脑应用;2011年07期
17 陈炯;;基于内容过滤的邮件系统设计[J];电脑编程技巧与维护;2011年16期
18 周鑫;郝志峰;蔡瑞初;温雯;;带噪声的文本聚类及其在反垃圾邮件中的应用[J];广西师范大学学报(自然科学版);2011年02期
19 吴叶科;邬颖捷;宋如顺;陈波;;粗LVQ神经网络的垃圾邮件过滤[J];计算机工程与应用;2011年26期
20 包理群;马宏锋;李祥林;;贝叶斯邮件分类中概念漂移问题研究[J];计算机应用与软件;2011年09期
中国重要会议论文全文数据库 前10条
1 李劲;岳昆;杭菲璐;;一种基于自适应Markov模型的中文垃圾邮件过滤方法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
2 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
3 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年
4 薛亚楠;廖闻剑;彭艳兵;;垃圾邮件行为识别研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
5 张尼;方滨兴;;垃圾邮件过滤技术综述[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
6 赵利;廖闻剑;彭艳兵;;基于中文主题的垃圾邮件过滤方法研究[A];中国通信学会第六届学术年会论文集(上)[C];2009年
7 王振旗;刘静;;一种基于地址与内容过滤的垃圾电子邮件过滤器模型[A];2005中国控制与决策学术年会论文集(下)[C];2005年
8 张相於;陈继东;李玉坤;孟小峰;;TEXEM:一种基于实体的邮件任务提取策略[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
9 孙东红;陈光英;刘勇;段海新;;SpamAssassin中文规则研究及实践[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
10 李婧;张焕国;;应用于贝叶斯过滤器的噪音消除算法研究[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 董建设;协作式垃圾邮件过滤关键技术研究[D];兰州理工大学;2009年
2 邓蔚;垃圾邮件过滤中的敌手分类问题研究[D];电子科技大学;2011年
3 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
4 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
5 陈彬;垃圾邮件的特征选择及检测方法研究[D];华南理工大学;2010年
6 王会珍;文本内容分类和主题追踪关键技术研究[D];东北大学;2008年
7 王美珍;垃圾邮件行为模式识别与过滤方法研究[D];华中科技大学;2009年
8 董大凡;基于度量空间的P2P网络相似搜索技术研究及应用[D];南开大学;2010年
9 程红蓉;垃圾图像特征提取与选择研究[D];电子科技大学;2011年
10 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 杨大伟;基于Sendmail的电子邮件网关系统设计与实现[D];哈尔滨工程大学;2005年
2 徐卫;电子邮件预处理与过滤管理系统的研究与设计[D];苏州大学;2006年
3 肖明;基于SVM的智能邮件过滤系统研究与实现[D];电子科技大学;2005年
4 张青;中文垃圾邮件过滤技术研究[D];武汉理工大学;2011年
5 周俊怡;一种混合垃圾邮件过滤技术研究[D];电子科技大学;2009年
6 罗琴;一种垃圾邮件混合过滤技术研究[D];电子科技大学;2007年
7 杨慧娟;基于语义体与模糊聚类的中文垃圾邮件过滤方法研究[D];兰州理工大学;2011年
8 赵海涛;基于模糊支持向量机的垃圾邮件过滤技术研究[D];重庆师范大学;2010年
9 苏哲;基于Linux透明网桥的反垃圾邮件系统设计与实现[D];电子科技大学;2007年
10 毛岩;基于行为识别的垃圾邮件过滤技术的研究[D];大庆石油学院;2010年
中国重要报纸全文数据库 前10条
1 冷云;垃圾邮件肆虐 危及E-mail生存[N];中国计算机报;2003年
2 ;天融信: 高效应对四类攻击行为[N];计算机世界;2006年
3 合 文;阻止垃圾邮件的蔓延[N];网络世界;2002年
4 Linning;NIS 2004对垃圾邮件说NO[N];中国电脑教育报;2004年
5 于新俊;阻止垃圾邮件蔓延[N];中国计算机报;2002年
6 余世琳;防治垃圾邮件也有商机[N];北京日报;2003年
7 ;狙击垃圾邮件[N];中国电脑教育报;2004年
8 海南省海口市人民检察院 王琳;应对“信骚扰”[N];计算机世界;2003年
9 齐国涛;对垃圾邮件说不[N];中国计算机报;2004年
10 郑惠荣;利用人工智能进行邮件过滤[N];中国计算机报;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978