收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

垃圾邮件行为模式识别与过滤方法研究

王美珍  
【摘要】:电子邮件已经成为现代人际交流的一种最常见的方式。但是,SMTP(SimpleMail Transfer Protocol:简单邮件传输协议)协议的不完善,尤其是对电子邮件发送者没有做任何的身份鉴别和控制,使得垃圾邮件越来越泛滥。 垃圾邮件过滤是个复杂的问题,虽然存在许多相关研究,也获得了很多成果,但是在技术上目前还没有哪一种方法能完美地过滤所有的垃圾邮件。随着伪装技术的发展,垃圾邮件也越来越隐晦,致使基于内容过滤的误判率也很高,而对大量疑似垃圾邮件,基于内容的过滤也耗费了大量的处理时间。因此,必须寻求新的方法和算法。 提出了基于数据挖掘的行为识别垃圾邮件过滤系统框架。对采集的数据提取行为特征,并将行为特征分为会话行为特征、信头行为特征和统计行为特征,采用特征选择算法选择能够有效地预测训练数据类属性的特征,经数据预处理,从数据中挖掘出垃圾邮件行为判定规则的知识。 提出了基于多级结构的垃圾邮件行为模式挖掘模型,针对不同类型的行为特征,采用不同的模式挖掘算法:对MTA(Mail Transport Agent:邮件传输代理)会话阶段的行为特征,提出了基于决策树的垃圾邮件发送行为识别模型。它不需要接收整封邮件,通过挖掘邮件会话过程中所表现出的行为特征,在会话阶段提前过滤掉垃圾邮件。对用户发送行为采用直方图距离法来检测异常用户发送行为。通过计算附件的指纹特征、统计特征,构建附件的特征向量,利用支持向量机模型来对垃圾邮件的附件行为建模。计算URL(uniform Resource Locator:统一资源定位)之间的相似度,构建包含相似URL的群组,通过计算样本与URL群组的最小距离并转换成分类输出的置信度来判别垃圾邮件行为。 由于传统的贝叶斯垃圾邮件过滤在误判和漏判带来的损失方面没有进行关注,提出了一种贝叶斯算法的改进算法,引入了损失因子,在不降低正确率的情况下,使得垃圾邮件误判的风险减到最低。若选择合适的损失因子,正确率和召回率都能达到一个比较理想的效果。利用该算法将各模型判别结果关联起来,通过对联合贝叶斯模型和附件模型、发送发送行为模型、URL模型的性能比较,验证了改进的贝叶斯联合模型相对单个模型来说,能够较大地提高分类性能。 提出了基于模糊决策树的分类方法。由于绝对明确的属性并不总是存在于现实世界中,属性隶属度能更自然和合理地描述行为特征,因此相对于清晰决策树来说,模糊决策树更适合。模糊决策树算法使得决策树学习的应用范围扩大从而能够处理不确定性,它合理地处理了学习和推理过程中的不精确信息,具有更强的分类能力及稳健性,由于能生成不同水平和不同置信度的规则,为决策者提供丰富的决策信息。 设计了基于行为模式识别和其它过滤技术相结合的邮件过滤系统MailGate,并进行了原型实现。实验结果表明MailGate对垃圾邮件过滤的召回率和误判率能够达到较好的效果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 ;邮件安全信息网关SMG[J];信息安全与通信保密;2004年01期
2 ;SMG邮件安全网关显威记——“冲击波”肆虐期间的真实记录[J];信息安全与通信保密;2003年10期
3 沈薇;邮件安全 刻不容缓[J];安防科技;2003年02期
4 ;透过邮件安全商战,谈邮件安全服务器——磐仪工控邮件安全服务器实施方案[J];计算机安全;2003年06期
5 朱丽萍,刘贤梅,郑雷;电子邮件管理系统的实现[J];大庆石油学院学报;2001年04期
6 李雪;;CIPHERTRUST:邮件安全的领先者[J];信息安全与通信保密;2006年01期
7 ;百万吞吐保邮件安全[J];每周电脑报;2003年16期
8 ;Websense隆重推出RiskFilter 6.0 率核心技术领跑邮件安全产业最前沿[J];计算机与网络;2008年11期
9 尚易;;采用SSL加密 保证邮件安全[J];电脑迷;2010年22期
10 ;用流光破解邮件账号[J];电脑迷;2004年05期
11 ;Websense解析2008邮件安全形势市场格局面临破冰[J];计算机与网络;2008年07期
12 曹玖新,张德运,吴瞻,刘伟娜;基于内容的邮件安全审计系统及实现[J];西安交通大学学报;2002年06期
13 石伟丞;谭良;周明天;;可复原WebMail的设计与实现[J];通信技术;2010年05期
14 黄琳琳;;SurfControl发布增强型新产品 邮件安全信息网关-RiskFilter5.2[J];计算机安全;2006年11期
15 常林梅;;网络安全浅谈[J];科技信息(科学教研);2008年21期
16 陈炜;;电子邮件安全技术研究[J];硅谷;2009年22期
17 吕文;;邮件安全的识别之痛[J];软件世界;2006年18期
18 王曦;;浅谈普通计算机用户的网络安全[J];科技信息(学术研究);2008年24期
19 郭凯光;从邮政三项基本制度看邮件安全[J];中国邮政;1994年03期
20 王达伟;利用个体运输力量加速邮件安全传递[J];中国邮政;1994年12期
中国重要会议论文全文数据库 前4条
1 陈建民;张双桥;张健;;电子邮件的安全与病毒防护[A];’2003天津IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2003年
2 喻鋆;何连跃;廖湘科;;SeMail安全电子邮件系统的设计与实现[A];第二十一次全国计算机安全学术交流会论文集[C];2006年
3 陈建民;张双桥;张健;;电子邮件的安全与病毒防护[A];第十八次全国计算机安全学术交流会论文集[C];2003年
4 秦辉;刘正熙;鲁书贤;刘林;;基于XML的邮件处理的仿真与实现[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
中国硕士学位论文全文数据库 前10条
1 钱立毅;企业邮件监管系统的设计与实现[D];南京理工大学;2012年
2 马曦;数据挖掘在邮件反垃圾系统中的应用[D];上海交通大学;2012年
3 朱骏;企业邮件安全过滤网关的研究[D];浙江大学;2003年
4 佟志臣;企业级安全电子邮件系统的设计与实现[D];吉林大学;2004年
5 李桂忠;中小企业安全电子邮件系统的研究与实现[D];电子科技大学;2011年
6 席晓筱;多媒体客户联络中心统一消息管理的设计与实现[D];北京邮电大学;2013年
7 宋晓辉;基于过滤网关技术的电子邮件安全应用研究[D];安徽大学;2006年
8 敖腾河;邮件系统安全机制的研究与设计[D];内蒙古大学;2006年
9 曾旭;全文检索引擎应用于邮件的设计与实现[D];电子科技大学;2010年
10 向旭宇;邮件安全审计和过滤技术研究与实现[D];中国人民解放军国防科学技术大学;2003年
中国重要报纸全文数据库 前10条
1 ;“快、准、稳”打造邮件安全新“净”界[N];国际商报;2006年
2 陈;防毒防垃圾邮件两不误[N];中国计算机报;2004年
3 赵晓涛;2008邮件安全面临挑战[N];网络世界;2008年
4 耳机;如何保证邮件安全[N];中国邮政报;2006年
5 ;道与魔的较量[N];中国计算机报;2004年
6 ;在更新与发展中寻求战略优势[N];计算机世界;2004年
7 陆刚;邮件的安全保密知识[N];中国邮政报;2005年
8 宗和;各地邮政严把邮件安全关[N];中国邮政报;2008年
9 闫会娟苏文正;邮件验视“四多法”[N];中国邮政报;2008年
10 刘;在边缘封堵垃圾邮件[N];中国计算机报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978