收藏本站
《山东大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

基于SVM的垃圾邮件过滤的研究

马莉  
【摘要】:本文主要介绍了在Windows环境下垃圾邮件过滤系统的设计模型和实现方法。该过滤系统能够对一些典型垃圾邮件进行识别判断过滤,而且也同时能够对其它邮件进行分类。经统计,从2001年开始,垃圾邮件增长的速度非常快,网民每周收到的垃圾邮件数量是非垃圾邮件数量的两倍,针对近几年来垃圾邮件的愈演愈烈,急需一种能有效防范垃圾邮件的方法。基于内容过滤就是其中一种方法。所以本文介绍的Windows下的垃圾邮件过滤系统,专门针对邮件的内容过滤进行了研究,具有较高的研究价值。 开发该系统的主要目的是了解当前垃圾邮件过滤的发展现状,学习有关过滤的技术,能有效的阻止垃圾邮件的泛滥。通过学习和实践,发现垃圾邮件过滤发展中遇到的问题,并结合自己的研究工作提出一些看法和见解。 本文首先介绍了垃圾邮件的现状和现在的反垃圾邮件技术的发展现状,以及邮件过滤的基本概念和原理。介绍了当前有关信息过滤和文本分类的相关研究。然后重点介绍了支持向量机的原理、各个参数对支持向量机的影响以及应用到本系统的方法;嵌入到OUTLOOK的方法;该系统的结构、具体的分词设计和SVM设计与实现。最后,总结了当前反垃圾邮件工作面临的许多问题,探讨了解决这些问题的方法和思路以及反垃圾邮件工作的未来,为以后的研究工作做出了一定的方向性指导。 本文目的是希望能设计一个嵌入到OUTLOOK2000中使用SVM作为分类器的垃圾邮件过滤系统。搜集能建立词库的样本集,以便SVM能够为垃圾邮件或者正常邮件建立一个分类器。该系统分为服务器端和客户端,基于邮件内容过滤主要在客户端,该系统是应用在OUTLOOK上。通过使用支持向量机SVM作为分类算法,对邮件进行过滤。实验证明,该系统对垃圾邮件的过滤有较好的查全率和查准率。
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP393.098

【引证文献】
中国硕士学位论文全文数据库 前4条
1 王燕萍;一种基于向量空间的多语言反垃圾短信系统的设计和实现[D];南京理工大学;2006年
2 张勇;基于SVM的数字水印检测技术研究[D];苏州大学;2007年
3 赵行;SVM分类器置信度的研究[D];北京邮电大学;2010年
4 靳瑞敏;网页关键字过滤研究及改进[D];内蒙古大学;2012年
【参考文献】
中国期刊全文数据库 前1条
1 郑红军,周旭,毕笃彦;统计学习理论及支持向量机概述[J];现代电子技术;2003年04期
【共引文献】
中国期刊全文数据库 前10条
1 谭建奇;廖贤平;黄孝庭;陈振洲;;SVM在临床医学中的应用[J];海南医学;2009年09期
2 哈明虎,王鹏;可能性空间中学习过程一致收敛速度的界[J];河北大学学报(自然科学版);2004年01期
3 哈明虎;田静;周彩丽;李俊华;;受噪声影响的模糊样本学习理论的关键定理[J];河北大学学报(自然科学版);2006年06期
4 翟俊海;张素芳;王熙照;;基于小波变换和支持向量机的图像分类[J];河北大学学报(自然科学版);2007年03期
5 张小奇;朱永利;王芳;;基于支持向量机的变压器油中溶解气体浓度预测[J];华北电力大学学报;2006年06期
6 耿兰芹;王芳;赵文清;;SVM回归与朴素贝叶斯分类相结合的变压器故障诊断[J];华北电力大学学报;2006年06期
7 董泽;李鹏;王学厚;周黎辉;;基于粗糙集和支持向量机的汽轮机组故障诊断[J];华北电力大学学报(自然科学版);2008年02期
8 池越;夏克文;陈国鹰;苏昶;;一种基于QPSO和WLS-SVM的智能方法[J];河北工业大学学报;2009年02期
9 谢正文;孔凡玉;曲方;;灰色支持向量机在疲劳裂纹扩展预测中的应用[J];湖北工业大学学报;2008年04期
10 哈明虎,周彩丽;基于模糊样本的统计学习理论的关键定理[J];华北科技学院学报;2004年01期
中国重要会议论文全文数据库 前10条
1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
3 周绮凤;林成德;罗林开;彭洪;;一种基于黎曼度量的训练样本类不平衡SVM分类方法研究[A];第二十六届中国控制会议论文集[C];2007年
4 顾小军;杨世锡;钱苏翔;;基于支持向量机的旋转机械多类故障识别研究[A];第二十六届中国控制会议论文集[C];2007年
5 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
6 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
7 蒋少华;桂卫华;阳春华;唐朝晖;蒋朝辉;;基于主元分析与支持向量机的方法及其在密闭鼓风炉过程监控诊断中的应用[A];第二十七届中国控制会议论文集[C];2008年
8 康传会;汪晓东;汪轲;常健丽;;基于最小二乘支持向量机的迟滞建模方法[A];第二十九届中国控制会议论文集[C];2010年
9 王海丰;李壮;任洪娥;赵鹏;;基于非下采样Contourlet变换和SVM的纹理图像分割算法[A];第二十九届中国控制会议论文集[C];2010年
10 ;Image Classification with Ant Colony Based Support Vector Machine[A];中国自动化学会控制理论专业委员会A卷[C];2011年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
3 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
4 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
5 李晚龙;六自由度Stewart平台分散智能控制研究[D];哈尔滨工程大学;2010年
6 杨宁;计算机辅助卷烟配方设计关键技术研究[D];中国海洋大学;2010年
7 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
8 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
9 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
10 陈志国;基于群体智能的机器视觉的关键技术研究[D];江南大学;2010年
中国硕士学位论文全文数据库 前10条
1 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
2 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
3 徐芳芳;优化问题的PVD算法研究[D];山东科技大学;2010年
4 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
5 姜成玉;基于支持向量机的时间序列预测[D];辽宁师范大学;2010年
6 李海清;支持向量机在金融市场预测中的应用[D];辽宁师范大学;2010年
7 江达秀;基于HMAX模型的人脸表情识别研究[D];浙江理工大学;2010年
8 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
9 李会臣;基于时频分析的齿轮故障机理及诊断研究[D];郑州大学;2010年
10 刘松;基于OCSVM和主动学习的DDOS攻击分布式检测系统[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 于一;;K-近邻法的文本分类算法分析与改进[J];火力与指挥控制;2008年04期
2 张勇;信息隐藏技术及其在办公网内的实现[J];湖南城市学院学报(自然科学版);2005年03期
3 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期
4 肖健华,吴今培,杨叔子;基于SVM的综合评价方法研究[J];计算机工程;2002年08期
5 段立娟,崔国勤,高文,张洪明;多层次特定类型图像过滤方法[J];计算机辅助设计与图形学学报;2002年05期
6 忻栋,杨莹春,吴朝晖;基于SVM-HMM混合模型的说话人确认[J];计算机辅助设计与图形学学报;2002年11期
7 许斌,王润生;基于小波变换的双水印算法[J];计算机工程与科学;2005年01期
8 姚鸿勋,刘明宝,高文,范旭彤,张洪明,吕雅娟;基于彩色图像的色系坐标变换的面部定位与跟踪法[J];计算机学报;2000年02期
9 付岩,王耀威,王伟强,高文;SVM用于基于内容的自然图像分类和检索[J];计算机学报;2003年10期
10 魏洪涛,李群,王维平;基于Web的管理信息系统的安全模型设计[J];计算机应用;2003年05期
中国博士学位论文全文数据库 前5条
1 宋枫溪;自动文本分类若干基本问题研究[D];南京理工大学;2004年
2 王利民;贝叶斯学习理论中若干问题的研究[D];吉林大学;2005年
3 陈海霞;面向数据挖掘的分类器集成研究[D];吉林大学;2006年
4 古平;基于贝叶斯模型的文档分类及相关技术研究[D];重庆大学;2006年
5 王朝勇;支持向量机若干算法研究及应用[D];吉林大学;2008年
中国硕士学位论文全文数据库 前10条
1 黄俊花;反抄袭检测系统的研究与实现[D];沈阳理工大学;2011年
2 李笠;高速网络实时信息流监控系统[D];昆明理工大学;2002年
3 夏菁;多层前向神经网络推广性研究及其应用[D];西北工业大学;2003年
4 张丽;基于多分类器动态组合的手写体数字识别[D];南京理工大学;2003年
5 王峰;基于移动agent的数字水印检测[D];河海大学;2004年
6 杨亦;设备管理系统的研究与开发[D];东南大学;2004年
7 靳小波;基于机器学习算法的文本分类系统[D];西北工业大学;2005年
8 李威;基于向量空间的文本自动分类系统的研究和实现[D];兰州理工大学;2005年
9 吴志峰;基于概念特征的中文文本分类研究[D];河北大学;2005年
10 唐培丽;基于语义的汉语文本主题词提取算法研究与实现[D];吉林大学;2005年
【二级引证文献】
中国硕士学位论文全文数据库 前3条
1 王海波;垃圾短信的屏蔽机制与应用研究[D];东华大学;2011年
2 李风云;隧道塌方风险预测与控制研究[D];中南大学;2011年
3 乔宏利;基于内容的短信息审计系统研究与实现[D];西安理工大学;2009年
【二级参考文献】
中国期刊全文数据库 前2条
1 崔伟东,周志华,李星;支持向量机研究[J];计算机工程与应用;2001年01期
2 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
【相似文献】
中国期刊全文数据库 前10条
1 王亮申,欧宗瑛,苏铁明,杨鑫华,曾好平;利用SVM和灰度基元共生矩阵进行图像数据库检索[J];大连理工大学学报;2003年04期
2 徐芳;范文凌;;基于链接信息网络的垃圾邮件检测[J];电脑知识与技术;2011年26期
3 常凯;;基于TF*IDF垃圾邮件过滤改进算法的研究[J];电脑知识与技术;2010年25期
4 万华林,Morshed U.Chowdhury;基于支持向量机的图像语义分类(英文)[J];软件学报;2003年11期
5 蒋秋香;叶苗;麦范金;;垃圾邮件过滤技术的发展与现状[J];电脑知识与技术(学术交流);2007年21期
6 马维达;;POPFile[J];程序员;2003年08期
7 YATE;;怎样防范垃圾邮件[J];电脑校园;2001年09期
8 张岩;坐看云起时 CHIP每月评话[J];新电脑;2002年04期
9 沈建苗;多管齐下治“垃圾”[J];微电脑世界;2003年20期
10 ;如何终结垃圾邮件[J];每周电脑报;2003年16期
中国重要会议论文全文数据库 前10条
1 ;A Tool Wear Predictive Model Based on SVM[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
2 ;A CDMA Signal Receiver Based on LS-SVM[A];第二十六届中国控制会议论文集[C];2007年
3 司爱威;冯辅周;江鹏程;饶国强;王建;;基于可变风险SVM模型的故障识别方法研究[A];第十届全国振动理论及应用学术会议论文集(2011)上册[C];2011年
4 王红伟;董慧;;一种提高SVM分类精度的调制信号识别方法[A];2010年西南三省一市自动化与仪器仪表学术年会论文集[C];2010年
5 ;Improved Particle Swarm Optimized SVM for Short-term Traffic Flow Predication[A];第二十六届中国控制会议论文集[C];2007年
6 宋鑫颖;周志逵;;一种基于SVM的主动学习文本分类方法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 邵杰;叶宁;容亦夏;;基于SVM的多波束测深数据滤波[A];第二十九届中国控制会议论文集[C];2010年
8 于湘涛;周峰;张兰;魏超;;基于SVM和田口方法的石英挠性加速度计健壮性设计[A];质量——持续发展的源动力:中国质量学术与创新论坛论文集(下)[C];2010年
9 ;Adaptive Control of Nonlinear System Based on SVM Online Algorithm[A];中国自动化学会控制理论专业委员会D卷[C];2011年
10 张睿;陈雪;马建文;;基于递归SVM的高光谱数据特征选择算法研究[A];第八届成像光谱技术与应用研讨会暨交叉学科论坛文集[C];2010年
中国重要报纸全文数据库 前10条
1 记者 李梅影;电子邮件立法对抗垃圾邮件泛滥[N];国际金融报;2004年
2 ;6个僵尸网络发出85%垃圾邮件[N];人民邮电;2008年
3 本报记者 余世琳;任金强:治理垃圾邮件要立法与自律并行[N];通信信息报;2003年
4 IT Boy;拿什么拯救你我们的电子邮件[N];中国电脑教育报;2004年
5 《周刊》记者 张旭东;中国反垃圾邮件要立法[N];中国计算机报;2004年
6 策划 孙定 林江艳 执笔 王翌;邮件灾祸[N];计算机世界;2004年
7 孟广业;从源头遏制垃圾邮件传播[N];人民邮电;2004年
8 朱杰;当垃圾邮件穿上“图片”马甲[N];中国计算机报;2007年
9 陈翔;垃圾邮件7月忙换招[N];中国计算机报;2007年
10 ;把握特征阻断垃圾邮件[N];中国计算机报;2007年
中国博士学位论文全文数据库 前10条
1 陈彬;垃圾邮件的特征选择及检测方法研究[D];华南理工大学;2010年
2 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
3 申丰山;样例权重估计及在此基础上的SVM[D];西安电子科技大学;2011年
4 宋国明;基于提升小波及SVM优化的模拟电路智能故障诊断方法研究[D];电子科技大学;2010年
5 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
6 张婧;基于SVM的肺结节自动识别方法研究[D];华南理工大学;2011年
7 龙艳花;基于SVM的话者确认关键技术研究[D];中国科学技术大学;2011年
8 许敏强;基于话者统计特征和SVM的文本无关话者确认研究[D];中国科学技术大学;2011年
9 曹志坤;制冷陈列柜性能仿真SVM方法的研究及应用[D];上海交通大学;2010年
10 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 马莉;基于SVM的垃圾邮件过滤的研究[D];山东大学;2005年
2 孙吉谭;基于内容的垃圾邮件意图分析方法研究[D];吉林大学;2011年
3 赵海涛;基于模糊支持向量机的垃圾邮件过滤技术研究[D];重庆师范大学;2010年
4 杨兴华;基于多模态特征的垃圾邮件过滤技术研究[D];西安电子科技大学;2011年
5 杨慧娟;基于语义体与模糊聚类的中文垃圾邮件过滤方法研究[D];兰州理工大学;2011年
6 刘菊新;垃圾图像过滤系统的实现[D];浙江大学;2010年
7 郭学敏;基于语义的广告图像垃圾邮件过滤技术研究[D];燕山大学;2010年
8 毛岩;基于行为识别的垃圾邮件过滤技术的研究[D];大庆石油学院;2010年
9 张青;中文垃圾邮件过滤技术研究[D];武汉理工大学;2011年
10 宋文;图像垃圾邮件过滤技术的研究[D];淮北师范大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026