收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

文本内容过滤的关键技术研究

王圆  
【摘要】:21世纪是信息时代,也是网络时代。随着信息科学的进步和因特网的普及,网络信息资源越来越丰富,网上信息呈爆炸式增长。这一方面给用户发现信息、利用信息带来了方便,另一方面,无序、极其庞大的信息世界和成千上万的超级链接,又常常使用户在查找其所需信息时感到力不从心。 网络信息过滤,就是根据用户的信息需求,利用一定的工具从大规模的动态信息流中自动筛选出满足用户需求的信息,同时屏蔽掉无用的信息的过程。信息过滤是实现信息的个性化主动服务的前提。个性化服务的实质是针对性,即针对不同的用户采取不同的服务策略,提供不同的服务内容。主动服务的实质是主动性,即系统自动按照用户的信息需求提供相应的服务。个性化主动服务将使用户通过尽可能小的投入获得尽可能好的服务回报。 本文从基本概念入手,阐述网络信息过滤的基本问题,包括信息过滤基本原理、过滤系统的一般处理流程、过滤系统的分类、相关信息检索模型以及过滤系统的性能评价指标等。然后,着重对文本内容过滤中涉及的关键技术进行深入地分析和探讨。主要包括中文自动分词技术、文本特征抽取技术、用户需求模板的表示和文本分类技术。在此研究基础上,设计一个文本内容过滤原型系统,并对系统总体框架、功能模块以及系统实现的主要方法进行详细阐述。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘淑梅;桑书娟;山岚;;文本过滤研究概述[J];信息技术;2009年09期
2 吕滨;雷国华;于燕飞;杨泽雪;王亚东;;基于语义分析的网络不良信息过滤系统研究[J];计算机应用与软件;2010年02期
3 陈红英,李卫华;智能信息Agent的研究和实现[J];计算机工程与应用;2002年12期
4 胡建国;文登敏;;基于大量文本信息过滤系统的实现[J];成都信息工程学院学报;2008年03期
5 刘杨;陈晖;陈远江;;中文文本信息过滤技术研究[J];船电技术;2010年07期
6 陈红英,李卫华,毛革非;智能过滤Agent在Internet上的应用[J];计算机工程;2002年03期
7 刘永丹,曾海泉,李荣陆,胡运发;基于语义分析的倾向性文本过滤[J];通信学报;2004年07期
8 张霞;;基于文本过滤的Web页面检索研究[J];电脑知识与技术;2008年26期
9 陈红英,李卫华;智能信息Agent的原理和实现方法[J];计算机系统应用;2001年11期
10 江宝林,刘永丹,金峰,葛家翔,胡运发;一个基于语义分析的倾向性文档过滤系统[J];计算机应用与软件;2005年01期
11 方柯;李生红;;面向网络不良文本过滤的概念网技术研究[J];信息安全与通信保密;2008年07期
12 牛洪波;丁华福;;基于文本分类技术的信息过滤方法的研究[J];信息技术;2007年12期
13 王宏生;高岩;;基于本体的信息过滤研究[J];科技信息;2009年29期
14 张晋;李太君;邱钊;;校园网络信息过滤与监控系统的设计与实现[J];现代计算机;2006年11期
15 李世明;赵恒永;;专题搜索引擎研究与实现——信息过滤[J];电子科学技术评论;2005年04期
16 李世明;赵恒永;李世友;;专题搜索引擎中信息过滤的研究与实现[J];计算机工程与设计;2006年08期
17 葛亮;赵建国;;一个中文网络文本过滤系统的设计[J];电脑知识与技术;2008年26期
18 程显毅;杨天明;朱倩;蔡月红;;基于语义倾向性的文本过滤研究[J];计算机应用研究;2009年12期
19 张晋;李太君;冯思玲;;局域网Email信息监控与过滤[J];电脑与信息技术;2009年02期
20 孙铁利;王圆;;一个基于人工神经网络的Web文本过滤系统[J];计算机时代;2006年06期
中国重要会议论文全文数据库 前10条
1 王敏;叶宽余;薛峰;;一种面向网店商品搜索的中文分词系统设计[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
2 韩冬煦;常宝宝;;基于边界熵和卡方统计量的多领域适应性中文分词方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 修驰;宋柔;;基于“大词”实例的中文分词研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 张梅山;邓知龙;车万翔;刘挺;;统计与词典相结合的领域自适应中文分词[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 赵林;夏迎炬;黄萱菁;吴立德;;基于Winnow算法的文本过滤[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
6 李东林;迟呈英;战学刚;;一个改进的中文文本过滤系统的设计与实现[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
7 黄萱菁;夏迎炬;吴立德;;基于向量空间模型的文本过滤系统[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
8 李虎;邹鹏;贾焰;周斌;;一种基于Map Reduce的分布式文本数据过滤模型研究[A];第26次全国计算机安全学术交流会论文集[C];2011年
9 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
10 李振星;徐泽平;;基于兴趣模型的WEB信息预测采集过滤方法[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
2 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
3 刘永丹;文档数据库若干关键技术研究[D];复旦大学;2004年
4 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年
5 何嘉;基于遗传算法优化的中文分词研究[D];电子科技大学;2012年
6 孙越恒;基于统计的NLP技术在中文信息检索中的应用研究[D];天津大学;2005年
7 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
8 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
9 杨传耀;中文信息检索索引模型及相关技术研究[D];复旦大学;2007年
10 杜阿宁;互联网舆情信息挖掘方法研究[D];哈尔滨工业大学;2007年
中国硕士学位论文全文数据库 前10条
1 王圆;文本内容过滤的关键技术研究[D];东北师范大学;2006年
2 马莉;基于SVM的垃圾邮件过滤的研究[D];山东大学;2005年
3 马忠宝;基于支持向量机的中文文本分类系统研究[D];武汉理工大学;2006年
4 杨彦;基于Hash结构的机械统计分词系统[D];中南大学;2005年
5 戚晶;基于RSS的搜索引擎的研究与实现[D];吉林大学;2006年
6 邵建双;基于概念格的文本过滤系统的设计与实现[D];大连海事大学;2010年
7 王新梅;基于内容挖掘的垃圾邮件过滤技术[D];武汉理工大学;2006年
8 李培国;基于人工神经网的中文垃圾邮件过滤器的设计与实现[D];暨南大学;2007年
9 刘琨;搜索引擎的研究与实现[D];西安电子科技大学;2004年
10 李东海;基于Nutch技术的主题搜索引擎实现[D];吉林大学;2008年
中国重要报纸全文数据库 前10条
1 李北陵;谷歌退出无损中国却只贻害自己[N];证券时报;2010年
2 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
3 清华大学IT可用性实验室;2005中文搜索引擎质量对比[N];计算机世界;2005年
4 本报记者 张彤;让计算机说中国话[N];网络世界;2004年
5 彭骏孙小宁;澳大利亚启动网络有害信息过滤工程[N];人民邮电;2007年
6 Naomi Fine;信息过滤护驾知识产权[N];计算机世界;2006年
7 记者 颜维琦;“绿坝”发行将采用赠送安装盘方式[N];光明日报;2009年
8 记者 吴苡婷;用技术挖出网络信息中“金子”[N];上海科技报;2009年
9 卢东祥;校园网防火墙的选购[N];中国电脑教育报;2003年
10 记者 李忠发 王慧慧;中国坚决反对商业问题政治化[N];人民日报海外版;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978