收藏本站
《中国海洋大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

无标注自学习反垃圾邮件服务的研究

张丽  
【摘要】:随着计算机网络与通讯技术的发展与应用,电子邮件也得到了广泛的应用。但是,随之而来的垃圾邮件问题日益严重,反垃圾邮件技术的研究和发展越来越受到人们的关注。 目前,设计实现了POP3邮件过滤代理模型,但该模型在其稳定性上不尽如人意,而且在邮件解析过程和分类过程的效率较低。 在基于内容的邮件过滤中,基于规则的过滤方法的优点是可以在无标注样本的情况下实现垃圾邮件的分类,而且已经有现成的规则库可共享;缺点是这种方法需要手工编写规则,规则的形成落后于垃圾邮件特征的出现,因此经常出现垃圾邮件漏检现象。 在邮件过滤系统的自学习方面,基于co-training的邮件过滤方法能够实现利用小规模标注样本和大规模未标注样本来提高分类器的性能,从而满足用户自适应的需要。 基于上述研究背景,对POP3邮件过滤代理模型SAMFUF进行了优化,提出用规则与co-training融合过滤的方法实现无标注自学习反垃圾邮件服务。 本文的主要工作和创新点如下: (1)在设计实现POP3邮件过滤代理模型的基础上,针对该模型在连接过程、邮件解析和分类过程中存在的问题,对邮件解析过程进行了重新设计,优化原POP3邮件过滤代理模型中词典等数据结构,将原模型中各模块对文本文件的操作改为对内存变量的操作,避免了频繁的磁盘I/O操作,并以静态库的形式实现邮件解析过程,简化调用程序。 (2)将分类程序变成lib文件加入到POP3邮件过滤代理模型中,用线程调用分类算法的方法代替启动进程调用分类程序的方法,提高邮件分类的效率。 (3)通过对基于规则的过滤方法的研究,验证了基于规则的过滤方法能够实现零标注下垃圾邮件过滤的要求。通过对基于co-training的过滤方法的研究,验证了基于co-training的过滤方法具有很强的自学习能力,通过自学习能够逐步提高分类器的性能。进而提出将规则和co-training融合的思想实现无标注自学习反垃圾邮件服务的要求。设计固定时间点切换过滤方法的系统实现规则和co-training融合的思想,并加入优化后的POP3邮件过滤代理模型中进行了相关测试。这是本文的创新点。 通过实验表明,优化后的SAMFUF的连接稳定性和效率比优化前的代理模型都有一定提高,而规则与co-training融合的方法能够实现无标注自学习反垃圾邮件服务的要求,并有较好的分类性能。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵静;刘培玉;陈孝礼;;结合特征和非特征信息改进Nave Bayes及其应用[J];计算机应用研究;2011年02期
2 裴亚辉;熊盛武;;垃圾邮件与反垃圾邮件技术[J];电脑知识与技术(学术交流);2007年11期
3 张方一;;邮件安全:“除”患于未然[J];软件世界;2006年15期
4 黄淑华;;反垃圾电子邮件技术综述[J];公安教育;2006年05期
5 孙东红;;反垃圾邮件技术发展分析[J];互联网天地;2004年05期
6 张燕;;北京邮电大学反垃圾邮件系统使用报告[J];中国教育网络;2008年11期
7 卢海燕,郭群;反垃圾邮件技术综述[J];数据通信;2005年03期
8 李云春;;反垃圾邮件技术的措施及主流技术[J];计算机教育;2005年01期
9 ;浅析863智能反垃圾网关技术[J];计算机与网络;2008年07期
10 程立辉 ,高振中;实时反垃圾邮件技术分析[J];河南科技;2005年04期
11 ;垃圾拒门外[J];每周电脑报;2001年70期
12 杨培静;;还邮箱一个清静地——中山大学测试梭子鱼反垃圾邮件系统报告[J];中国教育网络;2008年07期
13 汪曙;反垃圾邮件技术探讨[J];中国数据通信;2004年10期
14 刘晓明;;中国将形成最大的反垃圾邮件市场[J];IT时代周刊;2004年11期
15 ;反垃圾邮件技术决定成果[J];每周电脑报;2006年22期
16 吕文;;邮件安全的识别之痛[J];软件世界;2006年18期
17 庞章彬;;各种邮箱垃圾邮件自动删除方法[J];计算机与网络;2006年12期
18 李琦;;垃圾邮件何时不再蹂躏人们的眼睛[J];IT时代周刊;2008年08期
19 田斌;;反垃圾邮件策略要适时调整——清华大学部署敏讯邮件系统实践[J];中国教育网络;2008年07期
20 王琨月;;向垃圾邮件宣战[J];每周电脑报;2004年04期
中国重要会议论文全文数据库 前10条
1 沈卫超;;反垃圾邮件技术与产品分析[A];第二十次全国计算机安全学术交流会论文集[C];2005年
2 仇小锋;陈鸣;贾永兴;;垃圾邮件及其防范技术[A];第九届全国青年通信学术会议论文集[C];2004年
3 张艳;李毅;顾健;;垃圾邮件与反垃圾邮件新技术追踪[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
4 王岩;;基于内容的垃圾邮件过滤技术[A];中国通信学会第六届学术年会论文集(中)[C];2009年
5 高琰;;Linux下基于postfix的反垃圾邮件系统的构建[A];信息技术在气象领域的开发应用论文集(二)[C];2006年
6 赖均;黄迪明;胡德昆;;反垃圾邮件机的研究与实现[A];四川省通信学会二零零四年学术年会论文集(二)[C];2004年
7 沈卫超;;邮件过滤器系统的设计与实现[A];中国工程物理研究院科技年报(2001)[C];2001年
8 张相於;陈继东;李玉坤;孟小峰;;TEXEM:一种基于实体的邮件任务提取策略[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
9 耿玉波;荆继武;;现有反垃圾邮件技术综述[A];第十九次全国计算机安全学术交流会论文集[C];2004年
10 滕大祝;程明;;基于网格技术的反垃圾邮件系统的设计[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
中国重要报纸全文数据库 前10条
1 张晓兵;剿杀垃圾邮件的利器[N];中国计算机报;2007年
2 张琦;以融合应用围剿垃圾邮件[N];中国计算机报;2008年
3 赵毅;如何选购反垃圾邮件产品[N];中国计算机报;2007年
4 冯迪;雅虎全力应战年终大考[N];北京商报;2006年
5 《计算机世界》评测实验室 李韬;垃圾邮件阻击战[N];计算机世界;2006年
6 朱熹妍 张莉;垃圾邮件治理工作任重而道远[N];中国企业报;2007年
7 言未;我国每年因垃圾邮件损失过百亿[N];中国文化报;2007年
8 毛江华;警惕图片垃圾邮件[N];计算机世界;2006年
9 边歆;图片制造新麻烦[N];网络世界;2007年
10 肖扬;垃圾邮件肆虐 治理工作任重而道远[N];金融时报;2008年
中国博士学位论文全文数据库 前10条
1 邓蔚;垃圾邮件过滤中的敌手分类问题研究[D];电子科技大学;2011年
2 董建设;协作式垃圾邮件过滤关键技术研究[D];兰州理工大学;2009年
3 王会珍;文本内容分类和主题追踪关键技术研究[D];东北大学;2008年
4 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
5 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
6 惠孛;基于即时分类的垃圾邮件过滤关键技术的研究[D];电子科技大学;2009年
7 董大凡;基于度量空间的P2P网络相似搜索技术研究及应用[D];南开大学;2010年
8 程红蓉;垃圾图像特征提取与选择研究[D];电子科技大学;2011年
9 王美珍;垃圾邮件行为模式识别与过滤方法研究[D];华中科技大学;2009年
10 陈伟;通信网内容安全集成系统研究[D];北京邮电大学;2006年
中国硕士学位论文全文数据库 前10条
1 熊志勇;数据挖掘在反垃圾邮件领域中的应用与研究[D];南昌大学;2006年
2 逄仁波;基于用户代理的POP3邮件过滤模型的研究[D];中国海洋大学;2009年
3 张丽;无标注自学习反垃圾邮件服务的研究[D];中国海洋大学;2010年
4 杨盛;电子邮件过滤系统的研究与设计[D];中南大学;2005年
5 李挺;基于信息熵的反垃圾邮件技术研究[D];天津理工大学;2010年
6 杨丽华;基于内容的垃圾邮件过滤技术研究[D];西南交通大学;2006年
7 罗兵;基于协作过滤的反垃圾邮件网关的设计与实现[D];电子科技大学;2011年
8 陆冠中;TGang:两层结构的组合垃圾邮件过滤器的设计与实现[D];浙江大学;2008年
9 黄诠;基于多贝叶斯并行融合模型的邮件过滤算法研究[D];湖南大学;2008年
10 周鹏;基于透明代理的反垃圾邮件模型研究与实现[D];西南交通大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978