收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

文本内容的信息过滤技术研究

董梅  
【摘要】:随着互连网络的迅速发展,人们获得越来越多的网络信息,但同时也存在着很大的负面性,如各种迷信、色情、暴力、反动和其他非法信息的传播,内部网中机密信息的泄漏等,都已成为人们日益关注的焦点问题。传统的过滤技术,如基于关键字或基于IP地址的过滤等,不能有效的解决这些问题。 本文对文本分类和信息过滤技术进行了研究,提出了一种多特征选择方法。将机器学习和信息过滤技术相结合,设计出了自适应信息过滤系统。本文主要工作如下。 (1)概述了信息过滤的发展历史、研究现状和实际意义,以及数据挖掘、文本分类等相关知识。 (2)分析了信息过滤的相关理论。文本分类是信息过滤的基础,文章详细介绍了文本分类过程,文本预处理、特征选择、文本表示模型和分类算法等关键技术。对信息过滤的主要方法、信息过滤系统构成和模型也作了重点介绍。 (3)详细讨论了几种常见的特征选择方法。通过实验,对各种特征选择方法的效果进行比较,分析了影响文本分类器性能的几种因素。在此基础上,我们提出一种新的特征选择方法,即多特征选择法。实验证明,利用多特征选择方法进行文本分类,其精度优于任何一种单一特征选择方法。 (4)本文最后设计并实现了基于向量空间模型的自适应信息过滤系统。本系统对传统的信息过滤系统进行了自适应改进,通过修改过滤模板算法,让系统根据用户的反馈信息,自适应地调整阈值,达到提高过滤质量的效果。实验结果表明,改进后的系统过滤性能有明显提高。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 房敏;;高校数字图书馆个性化服务综述[J];科技创新导报;2010年33期
2 徐义峰;蒋慧新;周浩;;基于Web的信息过滤模型研究[J];商场现代化;2006年31期
3 姚磊岳;熊建英;;一种基于中文分词算法的信息过滤技术[J];科技广场;2007年07期
4 宋媛媛,孙坦;由信息过滤引发的基于知识的过滤机制构想[J];图书情报工作;2005年03期
5 易明;王学东;;基于领域本体的数字图书馆信息过滤模型研究[J];中国图书馆学报;2009年03期
6 周二虎;张水平;谢必昌;;信息过滤技术在智能信息推送系统中的应用[J];软件导刊;2010年01期
7 彭玉容;杨捧;高媛;;农业搜索引擎的发展现状及关键技术研究[J];安徽农业科学;2010年20期
8 林建;张帆;;网络不良信息过滤研究[J];情报理论与实践;2007年04期
9 崔虹燕;;基于安全审计的网络信息过滤研究[J];兰州工业高等专科学校学报;2007年03期
10 姜恩波;搜索引擎的信息过滤技术[J];现代图书情报技术;2001年03期
11 郭琳;基于IF的数字图书馆个性化服务系统[J];图书馆理论与实践;2005年04期
12 贺毅;浅议基于IF的现代农业信息系统[J];山东省农业管理干部学院学报;2005年04期
13 何军,周明天;信息网络中的信息过滤技术[J];系统工程与电子技术;2001年11期
14 张坤;徐安凤;;网络环境下有害信息的识别与过滤技术[J];电脑知识与技术;2009年09期
15 战守义,井新;加入时间因素的个性化信息过滤技术[J];北京理工大学学报;2005年09期
16 马玉春;孙冰;;基于特征选择的自适应信息过滤研究[J];计算机工程;2006年05期
17 陆娟;;浅析当前网络信息检索与过滤技术[J];科技情报开发与经济;2006年23期
18 徐义峰;陈春明;徐云青;;粗糙集理论在Web信息过滤中的应用研究[J];计算机系统应用;2007年03期
19 许光男;;基于可信计算技术的移动信息过滤系统设计与实现[J];电脑与电信;2007年10期
20 刘海峰;刘守生;姚泽清;张学仁;;基于Web的信息过滤技术研究[J];情报科学;2008年12期
中国重要会议论文全文数据库 前6条
1 张小兵;李靖;;试论信息过滤技术的发展趋势[A];第十八次全国计算机安全学术交流会论文集[C];2003年
2 李荣陆;张永奎;牛伟霞;;基于概念的信息过滤技术探讨[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 毛颖;周源远;王继成;;信息过滤技术研究[A];第一届学生计算语言学研讨会论文集[C];2002年
4 孙铁利;邱春艳;杨焱;;基于Agent的个性化信息过滤技术与实现方法[A];2005年全国理论计算机科学学术年会论文集[C];2005年
5 张玉连;张波;张敏;;改进的个性化信息推荐系统的设计与实现[A];2005年全国理论计算机科学学术年会论文集[C];2005年
6 李宝林;兰芸;赵云霞;李玲飞;;基于内容的Internet信息过滤方法研究综述[A];全国计算机安全学术交流会论文集(第二十三卷)[C];2008年
中国博士学位论文全文数据库 前3条
1 李东方;Web 2.0环境下互联网信息过滤理论与方法研究[D];中国科学技术大学;2009年
2 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
3 孙小华;协同过滤系统的稀疏性与冷启动问题研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 丛健;不良信息过滤技术研究[D];北京邮电大学;2012年
2 杨明明;社会网络平台中的垃圾信息过滤技术研究[D];哈尔滨理工大学;2013年
3 关超;网络敏感信息过滤技术研究与实现[D];解放军信息工程大学;2009年
4 张鹏;基于会话的海量短信息过滤技术研究[D];辽宁大学;2011年
5 胡可;基于人工免疫系统的信息过滤技术研究[D];西南交通大学;2006年
6 林建;网络不良信息过滤研究[D];华中师范大学;2007年
7 宋宝亚;基于数据挖掘的信息过滤系统的设计与实现[D];山东师范大学;2006年
8 宗胜;基于情境兴趣和个人兴趣的用户偏好模型研究与设计[D];上海交通大学;2007年
9 胡敏;基于智能代理的个性化元搜索引擎的设计与实现[D];华中科技大学;2007年
10 马英财;社交网络下的垃圾信息过滤技术的研究[D];哈尔滨理工大学;2014年
中国重要报纸全文数据库 前10条
1 ;提供一个纯净的网络空间[N];中国电脑教育报;2002年
2 曾革楠;遏止网络犯罪媒体责无旁贷[N];中国新闻出版报;2007年
3 尹训宁;部分即时通讯软件的特色[N];中国知识产权报;2006年
4 ;视频通信发展走势[N];通信产业报;2003年
5 本报实习记者  李丹;网络监控困境[N];计算机世界;2006年
6 本报记者 赵建国;网络过滤技术护航青少年健康上网[N];中国知识产权报;2009年
7 姜辉 王羽 管永利;视频会议系统迎来第四次浪潮[N];计算机世界;2002年
8 许群;加强和完善档案保密工作之我见[N];中国档案报;2002年
9 翁佳焰;《个人信息保护法》呼声渐起[N];中国改革报;2009年
10 苏明;工业和信息化部加紧制定移动终端过滤软件技术标准[N];中国高新技术产业导报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978