收藏本站
收藏 | 论文排版

基于语义体与模糊聚类的中文垃圾邮件过滤方法研究

杨慧娟  
【摘要】:目前,基于内容的垃圾邮件过滤方法主要采用统计分析法,此类方法对垃圾邮件内容所表达的思想缺乏精准的定量描述,研究垃圾邮件内容所表达思想的描述形式对垃圾邮件的准确识别有着十分重要的意义。邮件正文部分是一封邮件的主体,其内容是通过大量语义元(即词的语义)所形成的语义体反映出来的,所以在邮件过滤中研究语义体的信息是最权威、最有效的。因此,论文在句子相似度的基础上,利用《知网》在语义元分析中的优势,对邮件正文中包含的语义体进行分析,提出了一种语义体构建的方法及语义体间相似度的计算方法。 由于自然语言的复杂性,以及在描述和理解方面具有高度的不确定性和模糊性,因而基于内容的邮件过滤的识别带有一定的模糊性,对这些具有模糊性的模式借助于模糊理论来刻画显得很自然,论文采用模糊聚类方法来解决,并将语义体与此进行结合,提出了一种基于语义体的模糊聚类方法。该方法与传统方法的不同之处在于在分类时将语义体作为分类对象,将语义体之间的相似度作为构建模糊相似矩阵的相关系数,此方式大大降低了模糊聚类方法在处理文本分类问题时的维度。 最后,将基于语义体的模糊聚类方法应用到垃圾邮件过滤中。经仿真实验证明:论文所提方法与传统的邮件过滤方法相比,在对邮件内容的判断中更具客观性,对内容表意不明的垃圾邮件,其方法在邮件识别的召回率方面体现了较大的优势。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 曹传国;垃圾邮件拒之门外[J];电脑爱好者;2001年01期
2 史兵;企业电子邮件系统的困境和对策[J];计算机安全;2004年05期
3 志杰;垃圾邮件大清除[J];计算机与农业;2002年03期
4 Firefox;;在线狙击垃圾邮件[J];电脑迷;2005年16期
5 叶振宇,刘晶;基于模糊模式识别的中文邮件过滤探讨[J];计算机时代;2004年11期
6 汪曙;反垃圾邮件技术探讨[J];中国数据通信;2004年10期
7 YATE;;怎样防范垃圾邮件[J];电脑校园;2001年09期
8 张岩;坐看云起时 CHIP每月评话[J];新电脑;2002年04期
9 沈建苗;多管齐下治“垃圾”[J];微电脑世界;2003年20期
10 ;如何终结垃圾邮件[J];每周电脑报;2003年16期
11 晓齐;启明星辰推出 天澄防垃圾邮件系统[J];信息网络安全;2004年08期
12 ;启明星辰公司天澄防垃圾邮件系统问世[J];电力信息化;2004年06期
13 ;垃圾邮件杀手[J];电脑知识与技术;2001年Z1期
14 王军;如何应对垃圾邮件[J];家庭电子;2001年01期
15 阿文;;恼人的垃圾邮件[J];大众科技;2001年05期
16 ;周律师话维权[J];电脑爱好者;2002年24期
17 熊伟;且以小人之心[J];新电脑;2003年09期
18 Michael J.Miller;铲除垃圾邮件[J];个人电脑;2003年10期
19 李瑞江;浅谈反垃圾邮件技术的应用[J];新疆师范大学学报(自然科学版);2003年02期
20 ;祭起Sendmail番天印[J];微电脑世界;2003年07期
中国重要会议论文全文数据库 前10条
1 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
2 李军;何晓宁;黄成哲;齐浩亮;雷国华;;基于特征贡献度的垃圾邮件过滤方法[A];第六届全国信息检索学术会议论文集[C];2010年
3 李劲;岳昆;杭菲璐;;一种基于自适应Markov模型的中文垃圾邮件过滤方法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
4 薛亚楠;廖闻剑;彭艳兵;;垃圾邮件行为识别研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
5 赵利;廖闻剑;彭艳兵;;基于中文主题的垃圾邮件过滤方法研究[A];中国通信学会第六届学术年会论文集(上)[C];2009年
6 张尼;方滨兴;;垃圾邮件过滤技术综述[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
7 孙东红;陈光英;刘勇;段海新;;SpamAssassin中文规则研究及实践[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
8 李婧;张焕国;;应用于贝叶斯过滤器的噪音消除算法研究[A];2005通信理论与技术新进展——第十届全国青年通信学术会议论文集[C];2005年
9 王振旗;刘静;;一种基于地址与内容过滤的垃圾电子邮件过滤器模型[A];2005中国控制与决策学术年会论文集(下)[C];2005年
10 米淑云;辛阳;罗群;;一种新型垃圾邮件过滤系统的设计和研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
中国博士学位论文全文数据库 前10条
1 孙晶涛;基于内容的垃圾邮件过滤技术研究[D];兰州理工大学;2010年
2 陈彬;垃圾邮件的特征选择及检测方法研究[D];华南理工大学;2010年
3 董建设;协作式垃圾邮件过滤关键技术研究[D];兰州理工大学;2009年
4 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
5 邓蔚;垃圾邮件过滤中的敌手分类问题研究[D];电子科技大学;2011年
6 王会珍;文本内容分类和主题追踪关键技术研究[D];东北大学;2008年
7 王美珍;垃圾邮件行为模式识别与过滤方法研究[D];华中科技大学;2009年
8 詹川;反垃圾邮件技术的研究[D];电子科技大学;2005年
9 刘震;垃圾邮件过滤理论和关键技术研究[D];电子科技大学;2008年
10 董大凡;基于度量空间的P2P网络相似搜索技术研究及应用[D];南开大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨慧娟;基于语义体与模糊聚类的中文垃圾邮件过滤方法研究[D];兰州理工大学;2011年
2 张青;中文垃圾邮件过滤技术研究[D];武汉理工大学;2011年
3 毛岩;基于行为识别的垃圾邮件过滤技术的研究[D];大庆石油学院;2010年
4 孙吉谭;基于内容的垃圾邮件意图分析方法研究[D];吉林大学;2011年
5 郭学敏;基于语义的广告图像垃圾邮件过滤技术研究[D];燕山大学;2010年
6 宋文;图像垃圾邮件过滤技术的研究[D];淮北师范大学;2011年
7 赵海涛;基于模糊支持向量机的垃圾邮件过滤技术研究[D];重庆师范大学;2010年
8 杨兴华;基于多模态特征的垃圾邮件过滤技术研究[D];西安电子科技大学;2011年
9 刘菊新;垃圾图像过滤系统的实现[D];浙江大学;2010年
10 杨大伟;基于Sendmail的电子邮件网关系统设计与实现[D];哈尔滨工程大学;2005年
中国重要报纸全文数据库 前10条
1 合 文;阻止垃圾邮件的蔓延[N];网络世界;2002年
2 海南省海口市人民检察院 王琳;应对“信骚扰”[N];计算机世界;2003年
3 于新俊;阻止垃圾邮件蔓延[N];中国计算机报;2002年
4 ;砍断垃圾邮件黑手[N];计算机世界;2003年
5 ;狙击垃圾邮件[N];中国电脑教育报;2004年
6 记者 李梅影;电子邮件立法对抗垃圾邮件泛滥[N];国际金融报;2004年
7 ;6个僵尸网络发出85%垃圾邮件[N];人民邮电;2008年
8 ;常见垃圾邮件问题的解答[N];中国计算机报;2002年
9 本报记者 余世琳;任金强:治理垃圾邮件要立法与自律并行[N];通信信息报;2003年
10 Linning;NIS 2004对垃圾邮件说NO[N];中国电脑教育报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978