收藏本站
《华中科技大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

垃圾邮件行为模式识别与过滤方法研究

王美珍  
【摘要】:电子邮件已经成为现代人际交流的一种最常见的方式。但是,SMTP(SimpleMail Transfer Protocol:简单邮件传输协议)协议的不完善,尤其是对电子邮件发送者没有做任何的身份鉴别和控制,使得垃圾邮件越来越泛滥。 垃圾邮件过滤是个复杂的问题,虽然存在许多相关研究,也获得了很多成果,但是在技术上目前还没有哪一种方法能完美地过滤所有的垃圾邮件。随着伪装技术的发展,垃圾邮件也越来越隐晦,致使基于内容过滤的误判率也很高,而对大量疑似垃圾邮件,基于内容的过滤也耗费了大量的处理时间。因此,必须寻求新的方法和算法。 提出了基于数据挖掘的行为识别垃圾邮件过滤系统框架。对采集的数据提取行为特征,并将行为特征分为会话行为特征、信头行为特征和统计行为特征,采用特征选择算法选择能够有效地预测训练数据类属性的特征,经数据预处理,从数据中挖掘出垃圾邮件行为判定规则的知识。 提出了基于多级结构的垃圾邮件行为模式挖掘模型,针对不同类型的行为特征,采用不同的模式挖掘算法:对MTA(Mail Transport Agent:邮件传输代理)会话阶段的行为特征,提出了基于决策树的垃圾邮件发送行为识别模型。它不需要接收整封邮件,通过挖掘邮件会话过程中所表现出的行为特征,在会话阶段提前过滤掉垃圾邮件。对用户发送行为采用直方图距离法来检测异常用户发送行为。通过计算附件的指纹特征、统计特征,构建附件的特征向量,利用支持向量机模型来对垃圾邮件的附件行为建模。计算URL(uniform Resource Locator:统一资源定位)之间的相似度,构建包含相似URL的群组,通过计算样本与URL群组的最小距离并转换成分类输出的置信度来判别垃圾邮件行为。 由于传统的贝叶斯垃圾邮件过滤在误判和漏判带来的损失方面没有进行关注,提出了一种贝叶斯算法的改进算法,引入了损失因子,在不降低正确率的情况下,使得垃圾邮件误判的风险减到最低。若选择合适的损失因子,正确率和召回率都能达到一个比较理想的效果。利用该算法将各模型判别结果关联起来,通过对联合贝叶斯模型和附件模型、发送发送行为模型、URL模型的性能比较,验证了改进的贝叶斯联合模型相对单个模型来说,能够较大地提高分类性能。 提出了基于模糊决策树的分类方法。由于绝对明确的属性并不总是存在于现实世界中,属性隶属度能更自然和合理地描述行为特征,因此相对于清晰决策树来说,模糊决策树更适合。模糊决策树算法使得决策树学习的应用范围扩大从而能够处理不确定性,它合理地处理了学习和推理过程中的不精确信息,具有更强的分类能力及稳健性,由于能生成不同水平和不同置信度的规则,为决策者提供丰富的决策信息。 设计了基于行为模式识别和其它过滤技术相结合的邮件过滤系统MailGate,并进行了原型实现。实验结果表明MailGate对垃圾邮件过滤的召回率和误判率能够达到较好的效果。
【学位授予单位】:华中科技大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP393.098

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 李智信;;善用10分钟邮箱 跟垃圾邮件说再见[J];电脑爱好者;2011年10期
2 ;恶意软件空前激增而垃圾邮件大幅减少[J];微电脑世界;2011年07期
3 ;查看信头 找到垃圾邮件真正发件人[J];计算机与网络;2010年02期
4 金彩琴;裘国永;;对垃圾邮件过滤技术的问题研究[J];计算机技术与发展;2011年09期
5 苏锋;;@[J];微电脑世界;2011年08期
6 李志东;;Linux系统下postfix邮件系统反垃圾技术解析[J];一重技术;2011年03期
7 林伟;;一种基于成词概率的贝叶斯垃圾邮件过滤方法[J];计算机技术与发展;2011年09期
8 任贤;;一种多算法协作式垃圾邮件过滤模型[J];科技信息;2011年16期
9 黄胜宇;徐汀荣;王宏瑞;;基于有向赋权图的垃圾邮件社团发现算法[J];微计算机信息;2011年07期
10 徐芳;范文凌;;基于链接信息网络的垃圾邮件检测[J];电脑知识与技术;2011年26期
中国重要会议论文全文数据库 前10条
1 薛亚楠;廖闻剑;彭艳兵;;垃圾邮件行为识别研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
2 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
3 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年
4 李劲;岳昆;杭菲璐;;一种基于自适应Markov模型的中文垃圾邮件过滤方法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
5 米淑云;辛阳;罗群;;一种新型垃圾邮件过滤系统的设计和研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
6 刘红翼;;一种垃圾邮件过滤器的设计与实现[A];广西计算机学会2005年学术年会论文集[C];2005年
7 黄紫藤;吴玲达;;监控视频中简单人物行为识别研究[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
8 陈娟;葛辛;罗向阳;刘粉林;;基于反向查询技术和贝叶斯算法的反垃圾邮件方案[A];2006中国控制与决策学术年会论文集[C];2006年
9 张彤;;巧用Foxmail过滤垃圾邮件[A];学报编辑论丛(第十五集)[C];2007年
10 赵利;廖闻剑;彭艳兵;;基于中文主题的垃圾邮件过滤方法研究[A];中国通信学会第六届学术年会论文集(上)[C];2009年
中国重要报纸全文数据库 前10条
1 高洪勇;第三代防垃圾邮件技术“行为识别”诞生[N];中国计算机报;2005年
2 ;垃圾邮件数量反弹治理工作任重道远[N];人民邮电;2006年
3 李刚;反垃圾邮件 刚刚开启的 征程[N];中国计算机报;2004年
4 ;天融信: 高效应对四类攻击行为[N];计算机世界;2006年
5 戴贤聪;治理垃圾邮件卡在哪儿了?[N];北京日报;2003年
6 李国训;垃圾邮件的危机与商机[N];中国电子报;2004年
7 陈庆修;下大力气制止垃圾邮件泛滥[N];光明日报;2005年
8 杨华;垃圾邮件谁来扫[N];经济参考报;2003年
9 程立龙;斩断垃圾邮件的黑手[N];经济日报;2003年
10 陈代寿;抵御垃圾邮件[N];中国计算机报;2003年
中国博士学位论文全文数据库 前10条
1 陈彬;垃圾邮件的特征选择及检测方法研究[D];华南理工大学;2010年
2 王美珍;垃圾邮件行为模式识别与过滤方法研究[D];华中科技大学;2009年
3 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
4 何卫华;人体行为识别关键技术研究[D];重庆大学;2012年
5 王双全;申请上海交通大学工学博士学位论文基于无线传感器网络的行为识别与目标定位研究[D];上海交通大学;2008年
6 黄彬;智能空间中人的行为识别与理解[D];山东大学;2010年
7 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
8 王亮;基于判别模式学习的人体行为识别方法研究[D];哈尔滨工业大学;2011年
9 吴秋霞;复杂场景下的人体行为识别[D];华南理工大学;2012年
10 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 毛岩;基于行为识别的垃圾邮件过滤技术的研究[D];大庆石油学院;2010年
2 杨慧娟;基于语义体与模糊聚类的中文垃圾邮件过滤方法研究[D];兰州理工大学;2011年
3 郭学敏;基于语义的广告图像垃圾邮件过滤技术研究[D];燕山大学;2010年
4 孙吉谭;基于内容的垃圾邮件意图分析方法研究[D];吉林大学;2011年
5 张青;中文垃圾邮件过滤技术研究[D];武汉理工大学;2011年
6 宋文;图像垃圾邮件过滤技术的研究[D];淮北师范大学;2011年
7 王超;基于图像底层特征的图像型垃圾邮件识别研究[D];电子科技大学;2011年
8 高岩;基于行为模式分类的反垃圾邮件技术研究[D];哈尔滨理工大学;2008年
9 杨兴华;基于多模态特征的垃圾邮件过滤技术研究[D];西安电子科技大学;2011年
10 赵海涛;基于模糊支持向量机的垃圾邮件过滤技术研究[D];重庆师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026