收藏本站
《暨南大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于人工神经网的中文垃圾邮件过滤器的设计与实现

李培国  
【摘要】: 随着互联网络的广泛应用,电子邮件服务已经成为人们必不可少的沟通和联系的工具,收发邮件已经成为网民使用最多的网络服务。然而,与日俱增的垃圾邮件也呈现泛滥的趋势。在每天超过十几亿的邮件之中,超过一半以上是垃圾邮件,这些垃圾邮件耗费了大量的服务器资源,同时也浪费了用户宝贵的时间进行相关的处理。更糟糕的是,在一些垃圾邮件中携带者一些计算机病毒,用户打开就会感染病毒,给网络服务提供商和用户都造成巨大的损失。因此,对于垃圾邮件的治理就显得尤为重要。目前,使用比较广泛的是垃圾邮件的过滤技术,根据邮件内容进行分类,通过文本分类的算法,从而决定该邮件是否为垃圾邮件;对于中文邮件,由于语言的特殊性,词与词之间没有明显的标记,导致中文邮件的过滤更加复杂。 本文参考大量的垃圾邮件过滤方面的文献,对已有的垃圾邮件过滤技术进行分析和总结;根据BP神经网的特点:自学习能力,自组织能力,以及推理意识能力等,提出使用BP神经网作为文本分类的算法;结合ICTCLAS系统作为中文分词的工具,提高分词的精确性和稳定性;并且使用遗传算法来优化BP神经网,可以很好地解决神经网络容易陷入局部最小的问题,并且可以大大提高神经网络的学习能力;最终,通过使用以上的这些工具和算法,设计并实现一个针对中文垃圾邮件的过滤器。 本文首先介绍了电子邮件的概念,以及垃圾邮件的一些相关知识;然后介绍并分析目前已有的垃圾邮件治理的一些技术;接下来介绍了垃圾邮件过滤相关的一些基本理论知识;最后,全面介绍了基于人工神经网的中文垃圾邮件过滤器的设计与实现的方案。
【学位授予单位】:暨南大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP393.098;TP183

【相似文献】
中国期刊全文数据库 前10条
1 李智信;;善用10分钟邮箱 跟垃圾邮件说再见[J];电脑爱好者;2011年10期
2 ;恶意软件空前激增而垃圾邮件大幅减少[J];微电脑世界;2011年07期
3 ;查看信头 找到垃圾邮件真正发件人[J];计算机与网络;2010年02期
4 金彩琴;裘国永;;对垃圾邮件过滤技术的问题研究[J];计算机技术与发展;2011年09期
5 周拴龙;;Lucene.net中文分词算法分析[J];郑州大学学报(理学版);2011年03期
6 张文慧;张冉;;基于中文分词的农业信息检索平台设计[J];安徽农业科学;2011年20期
7 苏锋;;@[J];微电脑世界;2011年08期
8 李志东;;Linux系统下postfix邮件系统反垃圾技术解析[J];一重技术;2011年03期
9 林伟;;一种基于成词概率的贝叶斯垃圾邮件过滤方法[J];计算机技术与发展;2011年09期
10 任贤;;一种多算法协作式垃圾邮件过滤模型[J];科技信息;2011年16期
中国重要会议论文全文数据库 前10条
1 王敏;叶宽余;薛峰;;一种面向网店商品搜索的中文分词系统设计[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
2 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
3 修驰;宋柔;;基于“大词”实例的中文分词研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 张梅山;邓知龙;车万翔;刘挺;;统计与词典相结合的领域自适应中文分词[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 韩冬煦;常宝宝;;基于边界熵和卡方统计量的多领域适应性中文分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年
7 李劲;岳昆;杭菲璐;;一种基于自适应Markov模型的中文垃圾邮件过滤方法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
8 赵海;揭春雨;;基于子串标注的中文分词:寻找更佳的标注单元[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 彭辉;翟翔;;AutoCAD 2008自动翻译软件研发[A];全国冶金自动化信息网2010年年会论文集[C];2010年
10 米淑云;辛阳;罗群;;一种新型垃圾邮件过滤系统的设计和研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
中国重要报纸全文数据库 前10条
1 戴贤聪;治理垃圾邮件卡在哪儿了?[N];北京日报;2003年
2 李国训;垃圾邮件的危机与商机[N];中国电子报;2004年
3 陈庆修;下大力气制止垃圾邮件泛滥[N];光明日报;2005年
4 杨华;垃圾邮件谁来扫[N];经济参考报;2003年
5 程立龙;斩断垃圾邮件的黑手[N];经济日报;2003年
6 陈代寿;抵御垃圾邮件[N];中国计算机报;2003年
7 冷云;垃圾邮件肆虐 危及E-mail生存[N];中国计算机报;2003年
8 山枫;垃圾邮件人人喊打[N];中国计算机报;2004年
9 本报记者 李刚;曝光垃圾邮件“黑”源头[N];中国计算机报;2004年
10 米笑;垃圾邮件挡在边缘[N];中国计算机报;2004年
中国博士学位论文全文数据库 前10条
1 陈彬;垃圾邮件的特征选择及检测方法研究[D];华南理工大学;2010年
2 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
3 董建设;协作式垃圾邮件过滤关键技术研究[D];兰州理工大学;2009年
4 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
5 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
6 何嘉;基于遗传算法优化的中文分词研究[D];电子科技大学;2012年
7 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
8 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
9 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
10 刘震;垃圾邮件过滤理论和关键技术研究[D];电子科技大学;2008年
中国硕士学位论文全文数据库 前10条
1 马莉;基于SVM的垃圾邮件过滤的研究[D];山东大学;2005年
2 李培国;基于人工神经网的中文垃圾邮件过滤器的设计与实现[D];暨南大学;2007年
3 朱军;中文垃圾邮件过滤技术研究及应用[D];合肥工业大学;2005年
4 张启宇;基于贝叶斯算法的垃圾邮件过滤系统的研究与设计[D];曲阜师范大学;2006年
5 欧红星;电子邮件安全过滤与检查技术研究[D];中南大学;2008年
6 赵海涛;基于模糊支持向量机的垃圾邮件过滤技术研究[D];重庆师范大学;2010年
7 杨慧娟;基于语义体与模糊聚类的中文垃圾邮件过滤方法研究[D];兰州理工大学;2011年
8 郭学敏;基于语义的广告图像垃圾邮件过滤技术研究[D];燕山大学;2010年
9 毛岩;基于行为识别的垃圾邮件过滤技术的研究[D];大庆石油学院;2010年
10 孙吉谭;基于内容的垃圾邮件意图分析方法研究[D];吉林大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026