收藏本站
《哈尔滨工程大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于互联网的不良信息过滤技术的设计与实现

贾美娟  
【摘要】:作为信息时代的重要标志之一,Internet上的万千信息,给人们的工作、学习、生活带来了极大便利。但在信息的海洋中,还夹杂着一些不良内容的浮渣,它们给社会带来相当大的“不良信息冲击”。基于互联网的不良信息过滤技术就是在这种情况下诞生的。互联网信息过滤(Information Filtering)是指从海量的WEB文本中识别出含有不良信息的非法文本,以将其屏蔽。目前它已成为信息过滤的一个新的研究领域。 信息过滤使用的技术主要有基于关键字的过滤、基于过滤法则的过滤和一些基于内容分析的过滤技术。本文首先介绍了课题的研究背景及国内外研究现状,系统地探讨了信息过滤所涉及的各个方面的理论和技术,包括信息过滤系统的分类、主要数学模型及文本分类算法等。 本文在对国内外各种用于信息过滤方法进行分析研究及初步评估的基础上,为提高系统过滤不良信息的整体性能和运行速度,提出二级过滤的策略,即第一级基于关键字和基于禁用IP地址的过滤及第二级基于文本内容的过滤。 本文系统地分析了非法文本的特点,总结了非法文本内容和用词的特征,并详细论述了系统所采用的关键技术,即分词技术及特征提取技术。将最大正向匹配的分词方法、开方拟合检验(CHI)的特征提取方法及基于内容分析的KNN文本分类算法这些技术应用到非法网页过滤中,并基于Windows系统进行了实施。 最后,采用国际上通用的相关评估方法,对本方案的实施进行了测定和评估。评估结果显示,本方案取得了较好的过滤效果。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘伟成;孙吉红;;基于专题文献的信息内容过滤系统研制与实现[J];图书馆理论与实践;2009年07期
2 唐佳;;基于信息过滤技术的移动图书馆服务[J];商品与质量;2010年S5期
3 刘健康;;基于态度的中文BBS信息过滤技术的探讨[J];制造业自动化;2010年10期
4 牛强;王志晓;陈岱;夏士雄;;基于KNN的Web文本分类方法的研究[J];计算机应用与软件;2007年10期
5 王爱军;;数字电视的信息过滤技术分析与应用[J];科技资讯;2010年03期
6 刘春英;;个性化信息过滤技术在数字电视中的应用[J];科技信息;2010年20期
7 延霞;基于信息过滤技术的搜索引擎研究[J];深圳信息职业技术学院学报;2005年Z1期
8 樊康新;邱建林;顾卫江;;基于VSM的自适应信息过滤系统的研究与设计[J];计算机时代;2009年11期
9 石岩;;信息过滤技术在搜索引擎中的应用[J];农业网络信息;2006年12期
10 崔虹燕;;面向主动信息服务的网络安全过滤技术研究[J];科技情报开发与经济;2008年05期
11 焦玉英;王娜;;信息过滤技术在数字图书馆的应用[J];中国图书馆学报;2006年03期
12 郑敏;褚丽娜;臧晓昱;;网络图像信息过滤技术的探讨[J];武警工程学院学报;2007年04期
13 贺毅;浅议基于IF的现代农业信息系统[J];山东省农业管理干部学院学报;2005年04期
14 刘春英;吴德华;宋烨;;一种基于统计的数字电视信息过滤算法[J];电视技术;2010年07期
15 桑书娟;闫怀平;;信息过滤研究概述[J];福建电脑;2010年09期
16 骆万文;高飞;周学广;;抗中文主动干扰关键词过滤研究综述[J];吉首大学学报(自然科学版);2011年03期
17 周斌,杨振山;一个基于Agent的隐私保护信息过滤系统的结构[J];计算机与现代化;2005年04期
18 赵晓静;;Web文本挖掘综述[J];电脑学习;2008年05期
19 符敏慧;;基于文本的信息过滤模型[J];图书馆理论与实践;2006年02期
20 刘红芝;;网络文本信息过滤系统的模型初探[J];图书馆学刊;2009年09期
中国重要会议论文全文数据库 前10条
1 武洪萍;周国祥;;Web文本挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
2 林土胜;赖声礼;;视网膜血管特征提取的拆支跟踪法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
3 钱小聪;郑宝玉;穆明鑫;;神经网络联机手写签名验证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
4 张羽;汪源源;王威琪;余建国;林继耕;;狭窄血管多普勒信号特征提取的实验研究[A];21世纪医学工程学术研讨会论文摘要汇编[C];2001年
5 柳林霞;陈杰;窦丽华;;不变矩理论及其在目标识别中的应用[A];2002中国控制与决策学术年会论文集[C];2002年
6 杨日杰;施建礼;林洪文;;一种雷达视频回波特征提取方法研究[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
7 代克杰;张红梅;盛赛斌;;基于BP网络的故障特征提取方法研究[A];2004中国控制与决策学术年会论文集[C];2004年
8 何新;史迎春;周献中;;一种基于独立分量分析的音频分类方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
9 朱晓霞;孙同景;陈桂友;;基于支持向量机理论的两级指纹分类实现方法[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
10 顾蕊;;利用贝叶斯算法的目标探测前跟踪方法[A];第七届全国信息获取与处理学术会议论文集[C];2009年
中国重要报纸全文数据库 前10条
1 ;天澄信息过滤系统协助短信监控管理[N];人民邮电;2004年
2 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
3 沈占锋;遥感影像信息提取与分析[N];计算机世界;2006年
4 张天宇;中学生手机消费与健康[N];消费日报;2006年
5 王竣;深入开发CAD系统对疾病诊断有重要意义[N];中国医药报;2007年
6 张旭;靠前,靠前,再靠前[N];中国医药报;2003年
7 陆元婕;聪明的搜索引擎[N];中国计算机报;2001年
8 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
9 康乐;漫谈搜索引擎技术[N];中国化工报;2002年
10 本报记者 杨阳;Google中国摘下“光环”[N];经济观察报;2007年
中国博士学位论文全文数据库 前10条
1 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
2 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
3 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
4 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
5 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
6 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
7 孙真真;基于光学区雷达目标二维像的目标散射特征提取的理论及方法研究[D];中国人民解放军国防科学技术大学;2001年
8 武子玉;矿物近红外光谱信息提取及应用研究[D];吉林大学;2005年
9 王承;基于神经网络的模拟电路故障诊断方法研究[D];电子科技大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 贾美娟;基于互联网的不良信息过滤技术的设计与实现[D];哈尔滨工程大学;2006年
2 冯丽娜;个性化信息获取与建模相关技术研究[D];哈尔滨工业大学;2006年
3 曾红梅;情绪图片视觉诱发EEG特征提取与分析[D];天津大学;2012年
4 杨春喜;Web文本内容过滤关键技术的分析与研究[D];暨南大学;2007年
5 雷自力;基于Pro/E的三维零件参数化建模和特征提取研究[D];华中科技大学;2011年
6 林少波;中文文本分类特征提取方法的研究与实现[D];重庆大学;2011年
7 黄健;履带式车辆微多普勒效应与特征提取[D];国防科学技术大学;2009年
8 赵蕾蕾;基于词和基本短语模式的特征提取方法[D];河北大学;2009年
9 关超;网络敏感信息过滤技术研究与实现[D];解放军信息工程大学;2009年
10 栾岚;基于机理模型判据的图像中微弱特征提取方法研究及应用[D];东北大学;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978