收藏本站
《武汉理工大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

中文垃圾邮件过滤技术研究

张青  
【摘要】:随着因特网的高速发展,互联网用户不断增加,电子邮件也成为了日常生活中最普遍、最经济的通讯方式之一。由于其快捷、经济的特点,很多大型企业也将其作为内部的主要交流形式。但一些人士为了自己的利益,也利用电子邮件的这个特点来传播垃圾邮件,不但占据带宽、耗费网络资源,浪费用户时间和精力,甚至还可能给用户的计算机造成威胁,泄露用户隐私。因此反垃圾邮件技术就应运而生,从反垃圾邮件技术诞生的那一刻起,国内外的研究者都在探讨切实有效的垃圾邮件的过滤技术。 本文在前人研究的基础上,深入研究了目前国内外主流的反垃圾邮件技术,选取了基于内容的垃圾邮件过滤作为本文的研究重点。分析了常用的几种基于内容的过滤方法,由于贝叶斯算法的分类效果好于其他的分类算法,因此本文着重分析和探讨了贝叶斯分类算法,针对该算法的不足进行了改进:提出了一种基于权重的贝叶斯分类模型,并在传统的权重计算的基础上引入信息增益的概念,优化了权重计算公式;另外本文从实际应用出发,对于垃圾邮件的判断方法进行改进,由单纯地比较概率的大小提升到比较概率的倍数;并考虑了训练邮件样本集中合法邮件和垃圾邮件的比例,根据最近发布的《中国反垃圾邮件状况调查报告》中统计的电子邮箱用户所收到的垃圾邮件占用户邮件的百分比,在训练邮件样本集中尽量模拟真实的邮件比例。并通过实验证明了改进后的贝叶斯算法相较于传统算法的分类精度得到提高。 本文还研究了邮件过滤相关的技术:中文分词技术、文本表示模型、特征项选择等,为分类模块的设计奠定基础。 最后本文设计了一个完整的多层邮件过滤系统的模型,该系统结合了多种邮件过滤技术:黑白名单过滤、基于规则的过滤、贝叶斯过滤;并运用改进的算法实现了贝叶斯分类模块。
【学位授予单位】:武汉理工大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP393.098

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 叶振宇,刘晶;基于模糊模式识别的中文邮件过滤探讨[J];计算机时代;2004年11期
2 李雯;刘培玉;;基于贝叶斯的垃圾邮件过滤算法的研究[J];计算机工程与应用;2007年23期
3 付爱英,徐鹰,段小荣;实时反垃圾邮件系统的应用[J];计算机与现代化;2003年09期
4 林祥,荆涛,李生红;前置式邮件过滤系统的设计与实现[J];计算机工程与应用;2005年02期
5 陆青梅;尹四清;;基于贝叶斯定理的垃圾邮件分类技术研究[J];信息技术;2008年02期
6 尹军,谭晓兰;校园网络中如何防范垃圾邮件[J];衡阳师范学院学报;2005年03期
7 王继克;;立体防御垃圾邮件的技术实战[J];教育信息化;2006年07期
8 肖丹燕;;论析垃圾邮件产生机理及防范技术[J];重庆教育学院学报;2006年06期
9 石艳荣;;反垃圾邮件技术[J];内蒙古石油化工;2006年01期
10 赵治国;谭敏生;李志敏;;基于改进贝叶斯的垃圾邮件过滤算法综述[J];南华大学学报(自然科学版);2006年01期
中国重要会议论文全文数据库 前10条
1 李劲;岳昆;杭菲璐;;一种基于自适应Markov模型的中文垃圾邮件过滤方法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
2 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
3 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年
4 薛亚楠;廖闻剑;彭艳兵;;垃圾邮件行为识别研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
5 张尼;方滨兴;;垃圾邮件过滤技术综述[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
6 赵利;廖闻剑;彭艳兵;;基于中文主题的垃圾邮件过滤方法研究[A];中国通信学会第六届学术年会论文集(上)[C];2009年
7 王振旗;刘静;;一种基于地址与内容过滤的垃圾电子邮件过滤器模型[A];2005中国控制与决策学术年会论文集(下)[C];2005年
8 张相於;陈继东;李玉坤;孟小峰;;TEXEM:一种基于实体的邮件任务提取策略[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
9 孙东红;陈光英;刘勇;段海新;;SpamAssassin中文规则研究及实践[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
10 李婧;张焕国;;应用于贝叶斯过滤器的噪音消除算法研究[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 合 文;阻止垃圾邮件的蔓延[N];网络世界;2002年
2 于新俊;阻止垃圾邮件蔓延[N];中国计算机报;2002年
3 海南省海口市人民检察院 王琳;应对“信骚扰”[N];计算机世界;2003年
4 ;狙击垃圾邮件[N];中国电脑教育报;2004年
5 ;砍断垃圾邮件黑手[N];计算机世界;2003年
6 Linning;NIS 2004对垃圾邮件说NO[N];中国电脑教育报;2004年
7 ;常见垃圾邮件问题的解答[N];中国计算机报;2002年
8 曹;拒绝垃圾邮件[N];中国电脑教育报;2003年
9 ;阻击垃圾邮件[N];通信信息报;2001年
10 ;天融信: 高效应对四类攻击行为[N];计算机世界;2006年
中国博士学位论文全文数据库 前10条
1 董建设;协作式垃圾邮件过滤关键技术研究[D];兰州理工大学;2009年
2 邓蔚;垃圾邮件过滤中的敌手分类问题研究[D];电子科技大学;2011年
3 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
4 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
5 陈彬;垃圾邮件的特征选择及检测方法研究[D];华南理工大学;2010年
6 王会珍;文本内容分类和主题追踪关键技术研究[D];东北大学;2008年
7 王美珍;垃圾邮件行为模式识别与过滤方法研究[D];华中科技大学;2009年
8 董大凡;基于度量空间的P2P网络相似搜索技术研究及应用[D];南开大学;2010年
9 程红蓉;垃圾图像特征提取与选择研究[D];电子科技大学;2011年
10 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 杨大伟;基于Sendmail的电子邮件网关系统设计与实现[D];哈尔滨工程大学;2005年
2 徐卫;电子邮件预处理与过滤管理系统的研究与设计[D];苏州大学;2006年
3 肖明;基于SVM的智能邮件过滤系统研究与实现[D];电子科技大学;2005年
4 张青;中文垃圾邮件过滤技术研究[D];武汉理工大学;2011年
5 周俊怡;一种混合垃圾邮件过滤技术研究[D];电子科技大学;2009年
6 罗琴;一种垃圾邮件混合过滤技术研究[D];电子科技大学;2007年
7 杨慧娟;基于语义体与模糊聚类的中文垃圾邮件过滤方法研究[D];兰州理工大学;2011年
8 赵海涛;基于模糊支持向量机的垃圾邮件过滤技术研究[D];重庆师范大学;2010年
9 苏哲;基于Linux透明网桥的反垃圾邮件系统设计与实现[D];电子科技大学;2007年
10 毛岩;基于行为识别的垃圾邮件过滤技术的研究[D];大庆石油学院;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026