邮件信息过滤算法研究与实现
【摘要】:
随着因特网的迅猛发展,在线的可用电子信息也迅速增加,电子邮件作为一
种最快捷、最经济的通信方式,也得到飞速发展。但是同时,许多垃圾邮件也在
网络中蔓延,占据了邮件服务器的大量存储空间,用户往往要花费大量时间去删
除这些垃圾邮件。因此,研究邮件的自动过滤具有重要意义。
邮件的自动过滤主要有基于规则和基于概率两种方式。基于概率的朴素贝叶
斯算法具有方法简单、运算速度快、分类精确度高等优点,在文本分类中得到广
泛应用。但是,在邮件过滤过程中,合法邮件被误判为垃圾邮件将可能给用户带
来巨大的损失。传统的朴素贝叶斯算法在对邮件进行分类与过滤时,没有充分考
虑到合法邮件与垃圾邮件具有的这一不同特性,因此用于邮件过滤时有一定的局
限性。
本文介绍了当前流行文本分类器的工作原理及其优缺点,分析了传统贝叶斯
算法在邮件过滤过程中所存在的局限性,在此基础上,提出了基于最小风险贝叶
斯邮件过滤算法,实验结果表明,该算法能在正确分类邮件的同时,减少合法邮
件的误判率,在对垃圾邮件进行分类与过滤时具有较好的性能。基于上述算法,
本文实现了一个邮件过滤器原型系统。
|
|
|
|
1 |
张昕;马力;王娟;;浅析反垃圾邮件技术[J];网络安全技术与应用;2006年05期 |
2 |
李雯;刘培玉;;基于贝叶斯的垃圾邮件过滤算法的研究[J];计算机工程与应用;2007年23期 |
3 |
张秋余;李建建;余冬梅;董建设;王静;贺洋伟;;基于图像相似性检测的图像垃圾邮件过滤方法[J];兰州理工大学学报;2008年04期 |
4 |
李融,曹小春;浅析反垃圾电子邮件技术[J];科技创业月刊;2004年06期 |
5 |
卓高明;林世平;;邮件过滤中信息增益方法的改进[J];计算机工程与应用;2006年S1期 |
6 |
叶振宇,刘晶;基于模糊模式识别的中文邮件过滤探讨[J];计算机时代;2004年11期 |
7 |
林祥,荆涛,李生红;前置式邮件过滤系统的设计与实现[J];计算机工程与应用;2005年02期 |
8 |
熊忠阳;杜圣东;张玉芳;;一种改进的支持向量机邮件分类器[J];计算机科学;2007年09期 |
9 |
陆青梅;尹四清;;基于贝叶斯定理的垃圾邮件分类技术研究[J];信息技术;2008年02期 |
10 |
尹军,谭晓兰;校园网络中如何防范垃圾邮件[J];衡阳师范学院学报;2005年03期 |
11 |
石艳荣;;反垃圾邮件技术[J];内蒙古石油化工;2006年01期 |
12 |
王继克;;立体防御垃圾邮件的技术实战[J];教育信息化;2006年07期 |
13 |
赵治国;谭敏生;李志敏;;基于改进贝叶斯的垃圾邮件过滤算法综述[J];南华大学学报(自然科学版);2006年01期 |
14 |
肖丹燕;;论析垃圾邮件产生机理及防范技术[J];重庆教育学院学报;2006年06期 |
15 |
孙英娟;蒲东兵;孙英慧;李春宜;周春光;;邮件过滤Agent的设计[J];吉林大学学报(信息科学版);2008年06期 |
16 |
张启峰;;垃圾邮件的长尾现象分析及应用[J];通信技术;2010年05期 |
17 |
岳丽;冯新桓;唐宁九;;基于可追查性检查思想的垃圾邮件控制[J];电脑应用技术;2009年02期 |
18 |
落红卫,刘建毅,王枞,钟义信;智能邮件过滤系统的研究与实现[J];机电产品开发与创新;2003年01期 |
19 |
秦姣华,向旭宇;电子邮件过滤检测系统的设计与实现[J];现代计算机;2004年02期 |
20 |
万波,卢显良;大型邮件系统邮件队列设计[J];福建电脑;2005年02期 |
|