收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于贝叶斯分类的垃圾邮件过滤技术研究

王鹿  
【摘要】:随着互联网技术的飞速发展,电子邮件以方便、快捷、环保等优点成为人们日常生活工作中不可或缺的一部分。但与此同时,垃圾邮件的出现对用户造成了严重的影响,给社会带来了极大的财产损失和安全威胁,因此研究垃圾邮件过滤技术具有重要意义。本文在基于目前现有的理论和研究基础之上,对垃圾邮件过滤方法进行了系统的介绍,针对当前朴素贝叶斯算法过滤垃圾邮件时尚且存在的不足进行了一定的改进。主要研究内容如下:(1)深入研究反垃圾邮件相关技术,包括邮件的预处理、文本表示模型、特征提取等等。着重研究了朴素贝叶斯分类算法的原理及其来源,并分析它在文本分类方面的优缺点。(2)分析随机森林算法的原理以及在特征选择方面的优势,提出使用随机森林结合朴素贝叶斯的分类算法。针对垃圾邮件过滤系统中普遍存在的维数灾难的问题,通过随机森林特征选择过滤掉邮件集中基尼不纯度为0的特征词,由朴素贝叶斯算法计算出特征选择后的测试邮件的后验概率,得出测试邮件所属类别。(3)提出基于树结构的朴素贝叶斯分类算法。针对朴素贝叶斯算法在分类前期的训练阶段大量消耗系统和网络资源,严重影响分类效率的问题,提出使用树结构代替算法中原本使用的数组来维护训练样本中特征词出现的次数;针对朴素贝叶斯算法在邮件样本属性个数较多时,分类效果较差的问题,对特征词条件概率进行开方处理。(4)通过设计的邮件过滤系统对过滤算法进行分类性能测试。实验结果表明,结合了随机森林的朴素贝叶斯算法较原有算法在分类性能上效果更好;基于树结构的朴素贝叶斯算法较原有算法在邮件样本训练过程中耗时明显减少,随着样本的不断增加,训练耗时也只是缓慢增长,通过选取合适的开方次数z值,来降低垃圾邮件的误判率,使得改进后的算法在垃圾邮件过滤方面具有更好的效果。


知网文化
【相似文献】
中国期刊全文数据库 前19条
1 周立兵;柳景超;;贝叶斯理论在垃圾邮件过滤中的应用分析[J];网络安全技术与应用;2006年11期
2 徐梦龙;黄家旺;;朴素贝叶斯算法在垃圾邮件过滤方面的应用[J];网络安全技术与应用;2018年07期
3 翟军昌;秦玉平;车伟伟;;应用特征词分类贡献的垃圾邮件过滤研究[J];计算机工程与应用;2012年34期
4 王鹿;李志伟;朱成德;李永久;;基于朴素贝叶斯算法的垃圾邮件过滤研究[J];传感器与微系统;2020年09期
5 赵坤;马世军;;基于贝叶斯的垃圾邮件过滤技术[J];硅谷;2010年02期
6 尤晶晶;;基于贝叶斯的垃圾邮件过滤优化算法[J];烟台职业学院学报;2008年02期
7 孟兆玲;赵轶群;;基于贝叶斯理论的垃圾邮件过滤技术综述[J];现代计算机(专业版);2007年11期
8 李利杰;;智能垃圾邮件过滤系统研究与实现[J];软件导刊;2010年08期
9 张付志;伍朝辉;姚芳;;基于贝叶斯算法的垃圾邮件过滤技术的研究与改进[J];燕山大学学报;2009年01期
10 石永革;洪艳芬;石峰;;基于网格的垃圾邮件过滤系统[J];计算机工程与设计;2009年07期
11 张志瑛;;基于贝叶斯方法的垃圾邮件过滤技术综述[J];电脑知识与技术;2013年14期
12 刘浩然;丁攀;郭长江;常金凤;崔静闯;;基于贝叶斯算法的中文垃圾邮件过滤系统研究[J];通信学报;2018年12期
13 郭淑敏;朱蓉;王晶晶;胡胜;陈佳辉;;基于贝叶斯算法的垃圾邮件过滤的方法研究[J];电脑知识与技术;2017年13期
14 谷文成;周宏君;韩俊松;崔连河;;基于免疫算法的垃圾邮件过滤技术的研究[J];齐齐哈尔大学学报(自然科学版);2013年03期
15 王红玲;郑纲;;改进的贝叶斯算法在垃圾邮件过滤中的应用[J];信息通信;2013年09期
16 王忠桃;彭鑫;;基于机器学习的垃圾邮件过滤技术[J];中国科技信息;2010年06期
17 王志波;;双层垃圾邮件过滤模型研究[J];郑州轻工业学院学报(自然科学版);2010年03期
18 于溯;;实际环境中垃圾邮件过滤测试方法研究[J];信息安全与通信保密;2009年04期
19 包理群;柴世红;;决策树在垃圾邮件过滤中的应用[J];兰州工业高等专科学校学报;2008年04期
中国重要会议论文全文数据库 前15条
1 周立兵;柳景超;;贝叶斯理论在垃圾邮件过滤中的应用分析[A];中国造船工程学会电子技术学术委员会2006学术年会论文集(上册)[C];2006年
2 刘红翼;;一种垃圾邮件过滤器的设计与实现[A];广西计算机学会2005年学术年会论文集[C];2005年
3 牛明珠;;病毒和垃圾邮件过滤技术浅析[A];二○○九年全国电力企业信息化大会论文集[C];2009年
4 王岩;;基于内容的垃圾邮件过滤技术[A];中国通信学会第六届学术年会论文集(中)[C];2009年
5 张尼;方滨兴;;垃圾邮件过滤技术综述[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
6 米淑云;辛阳;罗群;;一种新型垃圾邮件过滤系统的设计和研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
7 张志斌;施水才;吕学强;;基于贝叶斯方法的中文垃圾邮件过滤技术综述[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
8 赵利;廖闻剑;彭艳兵;;基于中文主题的垃圾邮件过滤方法研究[A];中国通信学会第六届学术年会论文集(上)[C];2009年
9 杨晓光;李宁;吴昊;;基于P2P信誉体系垃圾邮件过滤系统的设计与实现[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
10 潘文锋;王斌;谭松波;;贝叶斯垃圾邮件过滤研究[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
11 苏绥;林鸿飞;叶正;;基于字符语言模型的垃圾邮件过滤[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
12 岑芳明;王明文;王鹏鸣;戴玉娟;;基于核偏最小二乘分类的垃圾邮件过滤[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
13 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年
14 张尼;姜誉;方滨兴;郭莉;;一个基于邮件路径地理属性分析的垃圾邮件过滤算法[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
15 刘伍颖;王挺;;一种多过滤器集成学习垃圾邮件过滤方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前11条
1 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
2 刘震;垃圾邮件过滤理论和关键技术研究[D];电子科技大学;2008年
3 李鹏;图像型垃圾邮件过滤关键技术研究[D];哈尔滨工业大学;2013年
4 董建设;协作式垃圾邮件过滤关键技术研究[D];兰州理工大学;2009年
5 段震;基于构造性学习的覆盖算法的发展及应用[D];安徽大学;2010年
6 惠孛;基于即时分类的垃圾邮件过滤关键技术的研究[D];电子科技大学;2009年
7 王会珍;文本内容分类和主题追踪关键技术研究[D];东北大学;2008年
8 张泽明;人工免疫算法及其应用研究[D];中国科学技术大学;2007年
9 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
10 王星;关系分类模型的学习界限与应用[D];哈尔滨工业大学;2015年
11 华俊豪;分布式变分贝叶斯算法及其应用[D];浙江大学;2018年
中国硕士学位论文全文数据库 前20条
1 王鹿;基于贝叶斯分类的垃圾邮件过滤技术研究[D];上海工程技术大学;2020年
2 赵毅;基于贝叶斯算法的垃圾邮件过滤系统的研究与开发[D];西安理工大学;2010年
3 麻荣誉;贝叶斯算法在垃圾邮件过滤技术中的研究与应用[D];西南石油大学;2011年
4 尹志喜;基于内容的垃圾邮件过滤技术研究[D];中北大学;2007年
5 王园;基于内容检索的垃圾邮件过滤器研究与实现[D];西安科技大学;2011年
6 林炼;基于网络处理器的垃圾邮件过滤系统[D];厦门大学;2008年
7 陈超兰;基于粗糙集的垃圾邮件过滤研究[D];西南大学;2006年
8 严灼;基于内容解析的垃圾邮件过滤技术研究[D];安徽理工大学;2011年
9 卢扬竹;基于内容的垃圾邮件过滤技术研究[D];西南交通大学;2009年
10 曾志中;基于贝叶斯算法的垃圾邮件过滤系统的分析与实现[D];北京邮电大学;2009年
11 徐隽;基于流数据特性的垃圾邮件过滤技术研究[D];复旦大学;2009年
12 陆青梅;基于贝叶斯算法的垃圾邮件过滤研究[D];中北大学;2008年
13 梁婷;基于内容的垃圾邮件过滤技术研究[D];华东师范大学;2013年
14 许建明;基于内容挖掘的中文垃圾邮件过滤技术研究与实现[D];湖南大学;2008年
15 洪艳芬;基于网格的垃圾邮件过滤系统的研究与应用[D];南昌大学;2008年
16 胡磊;基于内容的垃圾邮件过滤技术的研究[D];昆明理工大学;2005年
17 赵利;基于中文主题变形的垃圾邮件过滤方法研究[D];武汉邮电科学研究院;2009年
18 郑春光;基于免疫的垃圾邮件过滤技术研究[D];哈尔滨理工大学;2009年
19 辜桂兵;基于形象特征分析的垃圾邮件过滤方法研究[D];华中科技大学;2007年
20 文娅;基于行为识别的垃圾邮件过滤系统的研究与实现[D];宁夏大学;2019年
中国重要报纸全文数据库 前20条
1 ;不止是垃圾邮件过滤[N];网络世界;2005年
2 华子;图解垃圾邮件过滤方法[N];计算机世界;2004年
3 ;测试垃圾邮件过滤系统[N];网络世界;2003年
4 ;“垃圾邮件过滤系统”几乎没有一个完善的[N];新华每日电讯;2003年
5 陈柄汗;垃圾邮件过滤专家-MailMate[N];中国计算机报;2003年
6 本报记者 宋丽娜;整体大于部分之和[N];网络世界;2004年
7 ;如何选择和使用UTM设备[N];网络世界;2009年
8 本报记者 宋丽娜;整合安全平台的魅力[N];网络世界;2004年
9 John D. Halamka;IT手段的两面性[N];计算机世界;2007年
10 山枫;致力一体化威胁管理[N];中国计算机报;2004年
11 王金元;电邮软件挑战Outlook霸主地位[N];北京科技报;2003年
12 黄梦;ServGate整合安全平台受欢迎[N];电脑商报;2004年
13 《计算机世界》评测实验室 李韬;构建一体化安全方案[N];计算机世界;2006年
14 沈生;多管齐下清理网上垃圾[N];中国计算机报;2004年
15 王宗文;无线设备也有“垃圾”问题[N];计算机世界;2003年
16 ;用户关心的问题:MSN 8值吗?[N];计算机世界;2002年
17 本报记者 宋丽娜;面面俱到的内容安全[N];网络世界;2004年
18 阮征;低价、多功能一个都不少[N];电脑报;2009年
19 宋伟;终结混合威胁攻击[N];中国计算机报;2004年
20 李铁军;企业需对各安全环节分级防御[N];中国电子报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978