收藏本站
《郑州大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于Winnow算法和CAPTCHA的垃圾短信过滤研究

张燕丽  
【摘要】: 随着移动通信技术的发展,手机短信已成为人们生活中必不可少的通信方式之一。然而日益增多的垃圾短信给人们的生活带来很多不便。垃圾短信过滤问题已成为全球性的具有重大现实意义的课题。 本文深入研究了基于内容的垃圾短信过滤技术,改进了Winnow算法,并提出一种新的基于CAPTCHA的垃圾短信过滤方法,主要工作包括: 1)Winnow算法是一种可以在线更新的分类算法,它通过改变权重向量进行更新。为了降低算法的复杂度,本文提出在每次更新权值后加入剪枝过程,剪掉那些对分类结果几乎没有影响的特征。 2)利用用户交互式学习思想,根据用户的反馈信息随时更新Winnow分类器。本文提出的方法根据用户判定的误分类短信的信息找出未被判定的误分类短信,然后纠正分类器以前产生的错误,同时更新分类器的分类规则,避免以后的分类过程中产生同样的错误。更新分类器时采用Adaboosting算法提升分类器性能,并对Adaboosting算法进行了两方面的改进:针对退化问题,采用在各样本集内部调整短信样本的权重的方法;针对垃圾短信和正常短信的不对称问题,采用修改分类器加权因子的方法。 3)提出多Winnow分类器模型,根据多个分类器的分类结果对短信分类。利用同样的训练集选择出不同的特征集,根据各个特征集训练出不同的分类器。本文只实现了双Winnow分类器。 4)针对计算机程序经常发送恶意的组垃圾短信的现状,本文提出了基于CAPTCHA (全自动人机识别系统)的过滤方法,并提出一种新的基于图片识别的CAPTCHA方法。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 钟叔河;;抒情的短信[J];出版广角;2000年01期
2 魏洁;;免费给小灵通发短信[J];电脑迷;2003年11期
3 袁琦;;移动搜索技术与业务发展研究[J];电信网技术;2007年04期
4 ;特别测试! 07最重要的是“好打” QWERTY[J];电脑技术-HELLO-IT;2007年04期
5 胡玉贵;殷奎喜;赵华;;基于nRF2401的中文短信收发[J];电子工程师;2007年09期
6 黄家兵;方卫龙;;基于GPRS的短信控制系统软件设计[J];电子技术;2008年05期
7 曾国斌;陈慧;;移动金融服务平台系统[J];计算机与现代化;2008年06期
8 高婷;;从公共权力在新媒体舆论监督中的角色看舆论监督的现状及对策——“志丹县短信案”新闻学研究[J];河北科技师范学院学报(社会科学版);2008年02期
9 陶雪玉;;论短信的基本文化功能[J];东南传播;2008年11期
10 皮佑国;黎永华;邓荣;;基于GSM蜂窝网络的无线定位装置设计[J];现代电子技术;2009年13期
11 ;如何杜绝垃圾短信、骗子电话?手机装个防火墙[J];计算机与网络;2009年06期
12 陈晓奇;漫步云端;;手机实时邮,E-mail让短信下岗[J];电脑爱好者;2010年07期
13 爱青;;90后说明书[J];现代计算机(普及版);2010年04期
14 王志军;;天翼Live使用技巧三则[J];电脑知识与技术(经验技巧);2010年07期
15 夏振华;蔡昌新;王晓爽;;远程故障诊断及报警系统的设计[J];长江大学学报(自然科学版)理工卷;2010年04期
16 马志强;张爱民;周希伟;解佳金;;基于短信自动报警的安全监控系统设计[J];信息技术;2011年06期
17 优煜饭团儿;;酷Q任我行连载之四[J];软件导刊;2003年05期
18 金一;一种多媒体短消息交换平台的解决方案[J];邮电设计技术;2004年01期
19 李树秋,郑万波,夏亮;基于SOAP协议移动终端的实现和应用[J];吉林大学学报(信息科学版);2005年05期
20 刘勇;;成都电信开通短信114有益补充语音模式[J];互联网天地;2005年09期
中国重要会议论文全文数据库 前10条
1 穆明生;;基于特征集的多种分类器模型的在线笔迹认证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
2 朱思俞;石锋;;不定人连续汉语音的四声识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
4 徐蔚然;于武贵;郭军;;基于统计方法的混排文字切分与分类[A];第八届全国汉字识别学术会议论文集[C];2002年
5 雷蕾;吴乃君;刘鹏;刘兰娟;;灵敏度分析:分类器中的缺失数据[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
6 陈颖颖;张雁军;贾鑫;;通信信号调制识别方法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
7 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
8 肖惠玲;曾翎;黄海莹;张琳;王昱清;杨勤;陈华富;;支持向量机探测脑功能活动[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
9 沈钱波;何加铭;;连笔手写识别搜索算法研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
10 刘群英;邓扬;;C网短信首次下发成功率分析优化方法探讨——主要从无线环境和管控上寻找分析优化方法[A];四川省通信学会2011年学术年会论文集[C];2011年
中国重要报纸全文数据库 前10条
1 黄明;精子分类器决定生男生女[N];广东科技报;2000年
2 记者 姜晓凌 见习记者 王毅俊;原来,科技也能如此美丽[N];上海科技报;2007年
3 中国科学院东北地理与农业生态研究所 李建平;保护地球之肾 遥感体检湿地健康[N];中国水利报;2008年
4 CPW 张戈;Aperto PacketMAX系列可同时服务2000个用户[N];电脑商报;2005年
5 中科院院士 戴汝为;开辟人机结合的新天地[N];计算机世界;2004年
6 本版编辑 中国科学院计算技术研究所数字媒体研究中心 山世光 陈熙霖 高文 徐昕 刘洪宇;你的脸,你的身份证明[N];中国计算机报;2006年
7 武德锋 李国辉 林洪文 姚作梁;图像世界任我行[N];计算机世界;2002年
8 清华大学 朱健翔;人脸表情估计与表情合成[N];计算机世界;2006年
9 刘光强;LSI新一代多业务企业网关[N];中国计算机报;2007年
10 清华大学玉泉医院神外 刘伟国;意识如何进行客观评价[N];健康报;2008年
中国博士学位论文全文数据库 前10条
1 王喆;面向模式表示与模式源的分类器设计方法研究[D];南京航空航天大学;2008年
2 谢元澄;分类器集成研究[D];南京理工大学;2009年
3 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
4 杨显飞;数据流集成分类器算法研究[D];哈尔滨工程大学;2011年
5 汪中;面向变化场景的行人分类检测方法研究[D];中国科学技术大学;2011年
6 冯爱民;结构驱动的单类分类器设计及拓展研究[D];南京航空航天大学;2011年
7 宁博;面向行人检测的动态视觉词提取与集成分类方法研究[D];中国科学技术大学;2012年
8 薛晖;分类器设计中的正则化技术研究[D];南京航空航天大学;2008年
9 王彦;基于PDE的模式识别方法[D];吉林大学;2006年
10 欧阳震诤;不平稳数据流的分类技术研究[D];国防科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 张燕丽;基于Winnow算法和CAPTCHA的垃圾短信过滤研究[D];郑州大学;2010年
2 王红;基于内容的中文垃圾短信分类技术的研究[D];安徽大学;2011年
3 王卫;王某诉通讯商短信骚扰案的案例分析[D];兰州大学;2011年
4 刘玲;短信文学述论[D];西北师范大学;2011年
5 付少波;我国手机垃圾短信法律问题研究[D];西南政法大学;2011年
6 吴辉;短信文学的悖论现象研究[D];中南大学;2012年
7 万志勇;A公司短信治理产品营销计划[D];华南理工大学;2011年
8 胡玥;企业信息协作系统短信接入系统的设计与实现[D];北京交通大学;2010年
9 陈淑华;企业短信互动系统设计及实现关键技术研究[D];中南大学;2011年
10 刘云玉;基于云计算的短信内容审计研究[D];西安建筑科技大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978