收藏本站
《昆明理工大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于内容的垃圾邮件过滤技术的研究

胡磊  
【摘要】:随着计算机、通讯技术的发展,以及人们对信息化社会的需求,电子邮件已经成为现代人之间一个必不可少的,重要的相互通讯的方式。但是,附带出现的垃圾邮件问题也变得越来越严重了。目前,用户受到的垃圾邮件数量已经超过了正常邮件的数量,而且还有进一步增加的趋势。 目前,解决垃圾邮件问题有众多的途径和思路,其中基于内容的垃圾邮件过滤方法是一个较为重要的方面。这个方法就是通过采用经过样本邮件集训练的分类器对电子邮件内容文本进行文本分类、信息过滤,从而获取垃圾邮件的方法。这是当前解决垃圾邮件问题的主流技术之一。它主要包括基于规则的方法和基于概率统计的方法两个方向。 对于基于概率统计的方法,其代表主要有贝叶斯方法和支持向量机方法等。贝叶斯方法计算简便,但召回率和正确率都难以提高到一个更高的层次;而支持向量机方法则可以拥有较高的召回率和正确率。因此本文选择通过支持向量机方法来解决邮件分类问题。文中通过对电子邮件系统、一般垃圾邮件过滤方法的介绍,综述了目前用于垃圾邮件过滤研究的各种语料和评价方法,最后利用支持向量机方法来获得一个解决垃圾邮件问题的途径,并针对支持向量机方法的计算时间复杂度较大的问题,设想通过采用主动学习方法来解决这一问题。 文中通过采用基于主动学习方法和基于被动学习方法两种方式的支持向量机方法进行文本分类对比试验,以及将采用贝叶斯算法和支持向量机算法的垃圾邮件过滤器的效果进行对比。最终得出结论认为:支持向量机方法是一种比贝叶斯算法更有效的垃圾邮件过滤算法,而采用主动学习方法的支持向量机方法能够极大地减少计算时间复杂度。 本文的最后给出了一个基于支持向量机方法的垃圾邮件过滤系统。但是,本文所作的都是基于实验环境下的,要将该方法真正用于实际的电子邮件系统,还有大量的工作需要去做。
【学位授予单位】:昆明理工大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP393.098

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 李智信;;善用10分钟邮箱 跟垃圾邮件说再见[J];电脑爱好者;2011年10期
2 ;恶意软件空前激增而垃圾邮件大幅减少[J];微电脑世界;2011年07期
3 ;查看信头 找到垃圾邮件真正发件人[J];计算机与网络;2010年02期
4 金彩琴;裘国永;;对垃圾邮件过滤技术的问题研究[J];计算机技术与发展;2011年09期
5 苏锋;;@[J];微电脑世界;2011年08期
6 李志东;;Linux系统下postfix邮件系统反垃圾技术解析[J];一重技术;2011年03期
7 林伟;;一种基于成词概率的贝叶斯垃圾邮件过滤方法[J];计算机技术与发展;2011年09期
8 任贤;;一种多算法协作式垃圾邮件过滤模型[J];科技信息;2011年16期
9 黄胜宇;徐汀荣;王宏瑞;;基于有向赋权图的垃圾邮件社团发现算法[J];微计算机信息;2011年07期
10 徐芳;范文凌;;基于链接信息网络的垃圾邮件检测[J];电脑知识与技术;2011年26期
中国重要会议论文全文数据库 前10条
1 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
2 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年
3 李劲;岳昆;杭菲璐;;一种基于自适应Markov模型的中文垃圾邮件过滤方法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
4 李晓霞;唐明;邓旭亮;杨小平;郑钧元;;国产MTA的生物相容性研究[A];全国第三次牙体牙髓病学临床技术研讨会论文汇编[C];2009年
5 张琛;侯本祥;;MTA修补根管穿孔的疗效评价[A];全国第三次牙体牙髓病学临床技术研讨会论文汇编[C];2009年
6 米淑云;辛阳;罗群;;一种新型垃圾邮件过滤系统的设计和研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
7 刘红翼;;一种垃圾邮件过滤器的设计与实现[A];广西计算机学会2005年学术年会论文集[C];2005年
8 侯惠敏;侯本祥;;氢氧化钙和MTA修复比格犬髓室底穿孔的组织病理学观察[A];全国第三次牙体牙髓病学临床技术研讨会论文汇编[C];2009年
9 薛亚楠;廖闻剑;彭艳兵;;垃圾邮件行为识别研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
10 曾莲;张艺凡;吉宁;李洪喜;马红红;徐明;陈华;;年轻恒牙根尖形态对MTA根尖屏障固位力影响的实验研究报告[A];中华口腔医学会全科口腔医学专业委员会第一次学术年会会议论文集[C];2009年
中国重要报纸全文数据库 前10条
1 戴贤聪;治理垃圾邮件卡在哪儿了?[N];北京日报;2003年
2 李国训;垃圾邮件的危机与商机[N];中国电子报;2004年
3 陈庆修;下大力气制止垃圾邮件泛滥[N];光明日报;2005年
4 杨华;垃圾邮件谁来扫[N];经济参考报;2003年
5 程立龙;斩断垃圾邮件的黑手[N];经济日报;2003年
6 陈代寿;抵御垃圾邮件[N];中国计算机报;2003年
7 冷云;垃圾邮件肆虐 危及E-mail生存[N];中国计算机报;2003年
8 山枫;垃圾邮件人人喊打[N];中国计算机报;2004年
9 本报记者 李刚;曝光垃圾邮件“黑”源头[N];中国计算机报;2004年
10 米笑;垃圾邮件挡在边缘[N];中国计算机报;2004年
中国博士学位论文全文数据库 前10条
1 陈彬;垃圾邮件的特征选择及检测方法研究[D];华南理工大学;2010年
2 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
3 赵秀;MTA调控人牙髓干细胞分化的分子机制的研究[D];第四军医大学;2010年
4 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
5 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
6 董建设;协作式垃圾邮件过滤关键技术研究[D];兰州理工大学;2009年
7 刘震;垃圾邮件过滤理论和关键技术研究[D];电子科技大学;2008年
8 王美珍;垃圾邮件行为模式识别与过滤方法研究[D];华中科技大学;2009年
9 王会珍;文本内容分类和主题追踪关键技术研究[D];东北大学;2008年
10 邓蔚;垃圾邮件过滤中的敌手分类问题研究[D];电子科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 杨慧娟;基于语义体与模糊聚类的中文垃圾邮件过滤方法研究[D];兰州理工大学;2011年
2 郭学敏;基于语义的广告图像垃圾邮件过滤技术研究[D];燕山大学;2010年
3 毛岩;基于行为识别的垃圾邮件过滤技术的研究[D];大庆石油学院;2010年
4 孙吉谭;基于内容的垃圾邮件意图分析方法研究[D];吉林大学;2011年
5 张青;中文垃圾邮件过滤技术研究[D];武汉理工大学;2011年
6 宋文;图像垃圾邮件过滤技术的研究[D];淮北师范大学;2011年
7 王超;基于图像底层特征的图像型垃圾邮件识别研究[D];电子科技大学;2011年
8 杨兴华;基于多模态特征的垃圾邮件过滤技术研究[D];西安电子科技大学;2011年
9 赵海涛;基于模糊支持向量机的垃圾邮件过滤技术研究[D];重庆师范大学;2010年
10 郭键;基于Linux下Qmail电子邮局的设计与实现[D];吉林大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026