收藏本站
《广东工业大学》 2002年
收藏 | 手机打开
二维码
手机客户端打开本文

Internet信息过滤Agent的研究和实现

陈红英  
【摘要】: 随着Internet的飞速发展,网络上的信息呈指数增长,其内容之丰富,种类之繁多堪称世界上最大的图书馆,如何有效地查询到符合用户兴趣的内容,关系到我们能否充分利用这个巨大的信息资源的问题,也是本文的研究目标。在此我们采用了多种机器学习方法和Agent技术,旨在开发一种具有智能性、主动性、高效的信息过滤Agent。本文主要研究内容为以下两个部分:信息过滤系统和兴趣学习系统。 信息过滤系统分成两个部分:中文分词部分和信息过滤部分。 中文分词部分采用了利用汉字的特点对文档进行预处理的方法和基于词库的最大匹配法和无词库的频度统计法相结合的方法。 信息过滤部分采用了基于关键词向量的信息过滤方法。并作了一些改进:其中文档方面针对Web文档的特点对文档不同标签处的关键字赋予不同的权值。用户方面用户可以直接修改模板关键字串中不同关键字的权值,得到更加精确的用户兴趣,使过滤的结果能准确的反映用户的兴趣,从而提高文档过滤的准确性。 兴趣学习系统中,我们采用了基于向量空间法的用户兴趣学习方法和基于ID3算法的用户兴趣学习法两种方法。并采用了基于用户反馈的学习方法、后台观察用户行为学习用户兴趣的方法和用户兴趣主动服务功能。 本文采用了以下几种机器学习技术:基于用户反馈的机器学习技术、基于观察记忆的机器学习方法、基于ID3算法的归纳推理、启发式学习方法、知识库技术,系统具有较好的自主性和代理性。
【学位授予单位】:广东工业大学
【学位级别】:硕士
【学位授予年份】:2002
【分类号】:TP393.03

【引证文献】
中国硕士学位论文全文数据库 前2条
1 康静;基于多Agent的旅游电子商务系统的研究与实现[D];重庆大学;2004年
2 余静;基于Agent的信息推送系统的研究[D];南昌大学;2007年
【参考文献】
中国期刊全文数据库 前10条
1 汪晓岩,胡庆生,李斌,庄镇泉;面向Internet的个性化智能信息检索[J];计算机研究与发展;1999年09期
2 付国宏,王晓龙;汉语词语边界自动划分的模型与算法[J];计算机研究与发展;1999年09期
3 陈桂林,王永成,韩客松,王刚;一种改进的快速分词算法[J];计算机研究与发展;2000年04期
4 吴胜远;一种汉语分词方法[J];计算机研究与发展;1996年04期
5 张灵玲,周文辉,韩耀伟,李俊,潘金贵,三枝武男,坂上修二,奥山明;基于Internet的课件信息发现和收集Agent的研究[J];计算机研究与发展;1999年04期
6 路海明,卢增祥,徐晋晖,李衍达;基于Agent技术的个性化主动信息服务[J];计算机工程与应用;1999年06期
7 李蕾,王楠,张剑,钟义信,郭祥昊,贾自燕;中文搜索引擎概念检索初探[J];计算机工程与应用;2000年06期
8 林鸿飞,战学刚,姚天顺;文本特征区域与文本过滤的匹配机制[J];计算机工程与应用;2000年07期
9 欧振猛,余顺争;中文分词算法在搜索引擎应用中的研究[J];计算机工程与应用;2000年08期
10 李业丽,林鸿飞,姚天顺;基于示例的用户信息需求模型的获取和表示[J];计算机工程与应用;2000年09期
【共引文献】
中国期刊全文数据库 前10条
1 王正;陆余良;刘金红;施凡;;基于Lucene的互联网文献信息检索系统的研究[J];安徽大学学报(自然科学版);2009年05期
2 董玉德,王志诚,王明保,李道伦;基于WEB课件中动态题库的设计与开发[J];安徽纺织职业技术学院学报;2003年01期
3 时雷;虎晓红;席磊;段其国;;集成学习技术在农业中的应用[J];安徽农业科学;2008年26期
4 时雷;席磊;虎晓红;段其国;;基于支持向量机的农业数据分类研究[J];安徽农业科学;2009年05期
5 时雷;虎晓红;席磊;;基于Naive Bayes算法的大豆病害诊断研究[J];安徽农业科学;2009年11期
6 李春光;周晓红;;面向代理的程序设计[J];白城师范学院学报;2008年06期
7 刘晓志;黄厚宽;尚文倩;;带专业词库的特征选择[J];北京交通大学学报;2006年02期
8 黄晓芳;数据挖掘中决策树算法及其应用[J];兵工自动化;2005年02期
9 高博;朱东华;韩士雄;;一种智能化的信息采集系统的研究与实现[J];兵工学报;2009年S1期
10 柳胜国;;网络信息过滤方法与高校文科读者的信息个性化服务[J];宝鸡文理学院学报(社会科学版);2009年03期
中国重要会议论文全文数据库 前10条
1 胡斌;黎志成;张青敏;;网络环境下企业市场营销智能化决策支持方法[A];计算机模拟与信息技术会议论文集[C];2001年
2 高楚舒;丁于思;;因特网中文文本信息分析[A];计算机模拟与信息技术会议论文集[C];2001年
3 张媛;姜本清;刘文彪;温玮;;一种框架体系结构的舰空对抗智能行为设计研究[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
4 侯松;周斌;贾焰;;分词结果的再搭配对文本分类效果的增强[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
5 孙铁利;杨焱;邱春艳;;基于内容预测的协同过滤推荐[A];2005年全国理论计算机科学学术年会论文集[C];2005年
6 牛强;王志晓;陈岱;夏士雄;;基于支持向量机的Web文本分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
7 朱艳辉;王平;周咏梅;;一种基于Agent的中文Web信息自动检索系统(英文)[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
8 汤志伟;王菁;;面向公众的电子政务个性化信息服务体系的构建[A];中国信息经济学会2007年学术年会论文集[C];2007年
9 柏桂荣;章勇;;基于RSS的用户兴趣模型研究[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
10 梁飞;吕洪波;姚锦峰;;舆情分析中语料库降维[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
中国博士学位论文全文数据库 前10条
1 李炳龙;文档碎片取证关键技术研究[D];解放军信息工程大学;2007年
2 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
3 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
4 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
5 尹学松;半监督聚类分析策略设计及其拓展性研究[D];南京航空航天大学;2009年
6 孙珂;大规模文档标签自动标注技术研究[D];哈尔滨工业大学;2011年
7 梁艳红;基于专利挖掘的创新设计关键技术研究[D];河北工业大学;2011年
8 曾武灵;滨海生态旅游区游客重游意愿形成机制研究[D];大连理工大学;2011年
9 寇月;Deep Web实体搜索的关键技术研究[D];东北大学;2009年
10 王向银;汽车销售物流若干关键技术研究[D];湖南大学;2010年
中国硕士学位论文全文数据库 前10条
1 王丽敬;地理案例的空间相似性计算[D];山东科技大学;2010年
2 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
3 陈晶;基于词片网格的语音文档主题分类[D];哈尔滨工程大学;2010年
4 谢华;基于特征选择和质心构建的文本分类研究[D];大连理工大学;2010年
5 庞中华;微流控芯片注塑成型工艺规范的试验研究与质量预测[D];大连理工大学;2010年
6 桑媛媛;基于非负稀疏表示的文本分类算法研究[D];大连理工大学;2010年
7 熊超;基于潜在语义对偶空间的跨语言文本分类研究[D];江西师范大学;2010年
8 冯晶晶;面向软件测试领域的自动问答系统[D];河南理工大学;2010年
9 孙海虹;基于模糊粗糙集的Web文本分类研究[D];哈尔滨理工大学;2010年
10 喻琦;基于智能代理的路由优化技术研究[D];华南理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 茅燕萍;中国旅游电子商务发展中存在的一些问题及对策思考[J];商业研究;2003年11期
2 夏小玲,朱明;网上商品信息采集Agent系统的结构与实现[J];东华大学学报(自然科学版);2002年01期
3 苏安洋,张江,林华,贺仲雄;电子商务中的Agent虚拟协商与智能决策[J];中国工程科学;2003年10期
4 梁唯溪,黎志成;面向电子商务的产品价格智能决策系统[J];华中科技大学学报(自然科学版);2002年05期
5 周军锋,汤显,郭景峰;一种优化的协同过滤推荐算法[J];计算机研究与发展;2004年10期
6 王长缨,姚莉,张维明;多主体系统的建模技术研究[J];计算机工程与应用;2001年07期
7 陈松;;移动Agent综述[J];计算机科学;2002年07期
8 简峥峰,李凌丰,谭建荣,周伟仪;面向电子商务的应用──基于顾客Agent的虚拟商场系统设计[J];计算机工程;2000年07期
9 余力,刘鲁;电子商务个性化推荐研究[J];计算机集成制造系统;2004年10期
10 余力,刘鲁,李雪峰;用户多兴趣下的个性化推荐算法研究[J];计算机集成制造系统;2004年12期
中国硕士学位论文全文数据库 前7条
1 刘玲;基于ASP的电子商务平台的研究与应用[D];西安建筑科技大学;2001年
2 王峻涛;电子商务领域中的Agent技术研究[D];大连海事大学;2000年
3 张潇元;基于Agent的一种面向资源的自动协商模型[D];华南师范大学;2003年
4 李钰;多Agent系统结构及Agent间交互的研究[D];电子科技大学;2003年
5 王莉红;电子商务环境下协同过滤推荐方法的应用分析与研究[D];上海师范大学;2005年
6 曾庆辉;基于Agent的信息推荐系统研究[D];西南师范大学;2005年
7 吴贤彬;基于J2EE的移动Agent电子商务系统框架研究[D];对外经济贸易大学;2006年
【二级引证文献】
中国期刊全文数据库 前2条
1 周朴雄;秦雷;;基于Agent和LBS的移动信息推送服务研究[J];情报杂志;2012年06期
2 汪元普;;基于多Agent的商务智能系统的研究[J];西南师范大学学报(自然科学版);2008年03期
中国硕士学位论文全文数据库 前1条
1 孙嘉;基于AGENT的旅游电子商务模型研究[D];山东科技大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 张国煊,王小华,周必水;快速书面汉语自动分词系统及其算法设计[J];计算机研究与发展;1993年01期
2 陈桂林,王永成,韩客松,王刚;一种高效的中文电子词表数据结构[J];计算机研究与发展;2000年01期
3 吴胜远;一种汉语分词方法[J];计算机研究与发展;1996年04期
4 孙茂松,黄昌宁,邹嘉彦,陆方,沈达阳;利用汉字二元语法关系解决汉语自动分词中的交集型歧义[J];计算机研究与发展;1997年05期
5 解冲锋,李星;并行式Meta Search系统的设计与实现[J];计算机工程与应用;1999年02期
6 周会平;王挺;史晓东;陈火旺;齐璇;;一个基于中间语言的汉英机器翻译系统[J];计算机科学;1998年05期
7 严威,赵政;开发中文搜索引擎汉语处理的关键技术[J];计算机工程;1999年06期
8 刁倩,张惠惠,王永成;Internet上的英文搜索引擎[J];计算机工程;1999年07期
9 关英春 ,秦蓓;汉语文字自动统计系统CWSS[J];中文信息学报;1986年01期
10 李国臣,刘开瑛,张永奎;汉语自动分词及歧义组合结构的处理[J];中文信息学报;1988年03期
【相似文献】
中国期刊全文数据库 前10条
1 梅海燕;信息过滤问题的研究[J];现代图书情报技术;2002年02期
2 陈红英,李卫华,刘树勋;智能信息过滤Agent的设计与实现技术[J];广东工业大学学报;2001年03期
3 谭汉松,李红;基于信息过滤后的Web内容挖掘[J];计算机工程与应用;2003年30期
4 陈彩云,李治国;一种基于SVD和Rough集的信息过滤方法[J];计算机工程与应用;2003年34期
5 王开选;张永奎;;信息过滤中用户模型的表示方法[J];计算机工程;2006年05期
6 周序生,周咏梅,阳爱民;基于内容的中文网络信息自动过滤及发布系统[J];计算机工程与应用;2003年18期
7 苏贵洋,马颖华,李建华;一种基于内容的信息过滤改进模型[J];上海交通大学学报;2004年12期
8 张美香,陈俊杰,赵栓柱;信息过滤中用户兴趣模型的表示[J];电脑开发与应用;2005年05期
9 丁传奉;;数字图书馆中的个性化服务[J];图书馆杂志;2006年04期
10 杨桂芝;;个性化搜索引擎关键技术初探[J];科技情报开发与经济;2007年03期
中国重要会议论文全文数据库 前10条
1 苏贵洋;王永成;马颖华;;信息自动获取的结构模型[A];第一届学生计算语言学研讨会论文集[C];2002年
2 李荣陆;张永奎;牛伟霞;;基于概念的信息过滤技术探讨[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
3 毛颖;周源远;王继成;;信息过滤技术研究[A];第一届学生计算语言学研讨会论文集[C];2002年
4 白硕;程学旗;郭莉;王斌;余智华;刘群;;大规模内容计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 王岩;;基于内容的垃圾邮件过滤技术[A];中国通信学会第六届学术年会论文集(中)[C];2009年
6 杨忠伟;王轩;姚霖;;基于双拼映射的中文多模式模糊匹配算法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
7 胡熠;郑德权;赵铁军;于浩;王青松;;WWW页面信息中特定内容的过滤研究[A];第一届学生计算语言学研讨会论文集[C];2002年
8 潘文锋;王斌;于满泉;谭松波;;Winnow算法在垃圾邮件过滤中的应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
9 薄晓军;姚珺;刘芳;;产品开发过程中数字化核心模型的研究与应用[A];先进制造技术论坛暨第二届制造业自动化与信息化技术交流会论文集[C];2003年
10 许洪波;王斌;程学旗;白硕;;TREC自适应信息过滤中的目标优化技术研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国重要报纸全文数据库 前10条
1 李北陵;谷歌退出无损中国却只贻害自己[N];证券时报;2010年
2 彭骏孙小宁;澳大利亚启动网络有害信息过滤工程[N];人民邮电;2007年
3 Naomi Fine;信息过滤护驾知识产权[N];计算机世界;2006年
4 记者 颜维琦;“绿坝”发行将采用赠送安装盘方式[N];光明日报;2009年
5 卢东祥;校园网防火墙的选购[N];中国电脑教育报;2003年
6 记者 李忠发 王慧慧;中国坚决反对商业问题政治化[N];人民日报海外版;2010年
7 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
8 王萍;Web文本的知识化管理[N];计算机世界;2006年
9 杨恩荣;管好人生的“U盘”[N];中国国防报;2008年
10 陈蓉霞;人类为何难以挣脱情网?[N];中华读书报;2003年
中国博士学位论文全文数据库 前10条
1 李荣陆;文本分类及其相关技术研究[D];复旦大学;2005年
2 杜阿宁;互联网舆情信息挖掘方法研究[D];哈尔滨工业大学;2007年
3 何军;Internet中多媒体信息过滤技术的研究[D];电子科技大学;2002年
4 辜志强;中小企业产能柔性及其在车间生产控制中的应用研究[D];武汉理工大学;2006年
5 郝秀兰;文本分类技术与应用研究[D];复旦大学;2008年
6 张亮;基于机器学习的信息过滤和信息检索的模型和算法研究[D];天津大学;2007年
7 夏虎;移动社交网络结构和行为研究及其应用[D];电子科技大学;2012年
8 张华平;语言浅层分析与句子级新信息检测研究[D];中国科学院研究生院(计算技术研究所);2005年
9 许洪波;大规模信息过滤技术研究及其在Web问答系统中的应用[D];中国科学院研究生院(计算技术研究所);2003年
10 李辉;移动商务导购系统的研究[D];大连理工大学;2008年
中国硕士学位论文全文数据库 前10条
1 张立伟;网络信息过滤中反馈机制的研究及应用[D];山东师范大学;2010年
2 曲建华;Web上的信息过滤问题研究[D];山东师范大学;2003年
3 陈晋川;基于CoP建模的信息过滤技术研究[D];中国科学院研究生院(软件研究所);2004年
4 陈红莲;面向互联网的信息过滤技术研究[D];浙江大学;2003年
5 许明英;反馈增量学习算法及其在网络信息过滤中的应用研究[D];山东师范大学;2012年
6 赵海雁;基于数据链路层数据捕获与信息过滤[D];华北工学院;2004年
7 张伟;短信监控系统代理的设计[D];南京理工大学;2004年
8 周威成;信息过滤方法的研究与应用[D];华北电力大学(北京);2003年
9 吴福英;面向用户的信息过滤研究与实现[D];江西师范大学;2004年
10 李世明;专业搜索引擎中信息过滤的研究与实现[D];北京化工大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026