收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于KPS的Web信息抽取MAS模型的研究与设计

钱君  
【摘要】: 随着计算机技术、通讯技术的飞速发展和个人计算机的普及,Internet作为一个全球网络,越来越融入到人们的生活、工作、学习、商务活动中。而Web在给我们带来便捷、快速、廉价、丰富的信息的同时,也给我们带来了一个问题。Web上浩大的信息量和用户的需求之间产生了严重的不平衡和矛盾,人们很难在短时间内在海量的信息中找到自己真正感兴趣的数据,于是人们对高效率的信息获取技术的需求越来越迫切。Web信息抽取系统,可以使人们高效地获取真正感兴趣的信息,并可在此基础上进一步完成数据挖掘,信息检索等后续信息处理,为海量的Web信息的再利用提供了可能,因此有着明显的优势和广阔的应用前景,是当今多个领域的研究热点。 Agent系统是目前计算机科学领域中一个非常重要、研究活跃的内容。Agent系统特别适合复杂、难以预测、动态变化的问题的处理。Internet固有的开放、分布、异构、复杂等特性为Agent提供充分的应用基础。多Agent系统(Multi-Agent System)是由多个Agent协调合作所形成的问题求解网络。多Agent系统中的每个Agent都有它自己独立的局部知识库、目标和能力,Agent之间能够协调相互之间的行为,通过协商解决冲突,通过合作达到共同的目标。 在现有相关研究的基础上,本文提出一个基于KPS(Keywords,Patterns,Sample pages)的Web信息抽取的多Agent系统(MAS)模型。基于KPS的Web信息抽取方法集合了分别基于关键字、模式和样本的信息抽取技术的优点,有利于满足抽取高精度、高复杂度和高性能信息的要求。一个多Agent系统(MAS)可以把问题由大化小,由复杂变简单,每个Agent完成一个小目标,Agent间通过协调和合作,共同完成复杂的Web信息处理。而将基于KPS的Web信息抽取方法与多Agent系统进行有机的结合,可以大大降低Web信息抽取的难度,提高信息抽取的精度,从而更大地满足用户的需求。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 蔡虹,叶水生;基于KPS的Web信息抽取[J];计算机与现代化;2005年06期
2 潘惠勇,高丽平,薛惠忠;基于逻辑定义的Web信息抽取与集成[J];中原工学院学报;2005年02期
3 还书国;邱海霞;;WEB信息抽取的研究[J];消费导刊;2008年12期
4 杨文柱,徐林昊,陈少飞,郝亚南,李天柱;基于XPath的Web信息抽取的设计与实现[J];计算机工程;2003年16期
5 李海健;王晓丰;;Web信息抽取的现状及未来展望[J];廊坊师范学院学报(自然科学版);2009年03期
6 詹佳佳;;基于Web-Harvest的Web信息抽取系统的设计与应用[J];现代图书情报技术;2010年03期
7 崔继馨,张鹏,杨文柱;基于DOM的Web信息抽取[J];河北农业大学学报;2005年03期
8 崔继馨,孔维平;Web信息抽取技术的研究[J];信息技术教育;2004年10期
9 李洋;;基于Web的信息抽取研究[J];吉林工程技术师范学院学报;2007年12期
10 俞琰;;基于隐马尔可夫模型的招聘网络信息抽取[J];北京电子科技学院学报;2008年04期
11 杨敬伟;杨文柱;高悦;;基于DOM的Web信息抽取规则的构造与实现[J];河北大学学报(自然科学版);2007年02期
12 俞琰;;基于隐马尔可夫模型的招聘网络信息抽取[J];自动化技术与应用;2008年10期
13 霍滨焱;;最小节点信息树抽取规则及可视化生成方法[J];应用科技;2009年07期
14 邹腊梅;龚向坚;肖芳;马淑萍;;基于模拟退火算法与隐马尔可夫模型的Web信息抽取[J];南华大学学报(自然科学版);2011年01期
15 傅骞;温晓辉;;开放式Web信息抽取系统研究与实现[J];北京师范大学学报(自然科学版);2005年06期
16 王文广;冉春玉;万书振;王伟;曾高阳;;一种基于.NET平台的Web信息提取方法[J];软件导刊;2007年01期
17 高强;张敬之;耿桦;潘金贵;;基于重复模式的Web信息抽取[J];计算机科学;2007年04期
18 李洋;栾吉华;;一种新的Web信息抽取方法研究[J];科技资讯;2007年35期
19 龙丽;庞弘燊;;国外Web信息抽取研究综述[J];图书馆学刊;2008年05期
20 肖建鹏;张来顺;任星;;直推式支持向量机在Web信息抽取中的应用研究[J];计算机工程与应用;2009年02期
中国重要会议论文全文数据库 前4条
1 廉成洋;毛宇光;;一种基于二叉树的HTML到XML的转换方法研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
2 邵辉;李芳;;基于树模型算法的动态网页信息抽取研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 李织宏;刘卫东;赵文强;张群志;;七中区克下组油藏复合驱体系色谱分离实验研究[A];提高油气采收率技术文集[C];2009年
4 李国华;昝红英;;基于语句相似度的网页标题抽取方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前1条
1 李凯;VEGF-C对胰腺癌淋巴结转移的作用机制及其与预后相关性的研究[D];华中科技大学;2007年
中国硕士学位论文全文数据库 前10条
1 钱君;基于KPS的Web信息抽取MAS模型的研究与设计[D];南昌大学;2007年
2 董树明;半结构化Web信息抽取技术及其应用研究[D];东南大学;2004年
3 狄慧;基于Agent的Web信息抽取研究[D];大连理工大学;2004年
4 薛惠忠;WEB信息的抽取与集成[D];东南大学;2004年
5 张绍华;基于实例的Web信息抽取[D];河北大学;2001年
6 李丹;基于序列比对的动态Web信息抽取算法研究[D];吉林大学;2009年
7 孟伟涛;Web中文信息抽取技术研究及其在招聘信息系统中的应用[D];西北大学;2007年
8 肖芳;基于混合遗传退火算法的web信息抽取方法研究与实现[D];电子科技大学;2009年
9 彭黎明;Web数据抽取在商业银行信用风险监控系统中的应用[D];上海交通大学;2008年
10 谭鹏许;基于树自动机技术的Web信息抽取研究[D];解放军信息工程大学;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978