收藏本站
《吉林大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

Deep Web数据集成关键技术研究

王英  
【摘要】: 随着Web信息的激增,越来越多的信息开始由静态网页存储的方式向Web服务器维护的数据库即Deep Web转移,Deep Web包含的信息为Surface Web的400-500倍,与Surface Web相比,Deep Web包含的信息具有更高的质量,同时也是Web上增长速度最快的信息载体,对Deep Web的研究已是Web搜索领域迫在眉睫的任务。 Deep Web数据集成的目的是以尽可能自动的方式实现对Web中在线数据库信息的有效利用。在面向领域的信息搜索中,相关的领域知识往往有助于改善搜索效果。本体作为最强大的网络信息语义描述工具,在信息检索中被广泛应用,因此,本文综合应用本体研究Deep Web数据集成技术,对以下四个关键技术进行了深入研究:Deep Web入口自动发现、Deep Web查询接口模式抽取、Deep Web查询接口集成和Deep Web查询接口自动填充。 本文首先构建领域核心本体,在模式匹配过程中,不断完善核心本体,实现本体的自动扩展,并通过本体描述语言OWL对目标本体进行形式化描述以帮助机器理解和推理;然后,在Deep Web入口的自动发现中,应用主题爬行技术和本体技术,构造网页分类器、表单结构分类器和表单内容分类器,实现特定领域Deep Web入口表单的自动发现;在Deep Web查询接口的模式抽取中,设计了基于网页可视化特征的Deep Web查询接口模式抽取算法,实现对查询接口属性标签和查询控件的获取与分析,并根据标签和控件的逻辑关系将其重组成语义属性;在Deep Web数据库查询接口的集成中,充分利用本体提供的语义实体间的复杂关系,捕获不同查询接口间的语义特征,实现模式匹配,在语义级别上实现对查询接口真正意义上的理解,使得同一领域中多个查询接口的知识规范化、统一化,以方便于对其进行处理;在Deep Web查询接口的自动填充中,利用领域本体建立Deep Web入口表单属性与集成查询接口属性的映射关系,将用户提交的查询计划进行合法性检查后分发至各个Deep Web数据库,经查询处理后,转化为各本地查询接口相适应的查询条件,实现用户透明的集成查询接口向各个Deep Web表单的查询分发与表单重写,最后自动触发提交查询按钮。实验表明本文所提出的方法是可行的。
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP311.13

【引证文献】
中国硕士学位论文全文数据库 前5条
1 王锐;基于本体的深层网络模式匹配研究[D];哈尔滨工程大学;2011年
2 龚桂芬;基于查询接口的Deep Web模式匹配方法研究[D];苏州大学;2011年
3 张春丽;Deep Web集成查询系统预处理关键技术研究[D];大连海事大学;2012年
4 焦倩倩;基于机器学习的深层网络接口模式匹配方法研究[D];哈尔滨工程大学;2012年
5 庄伟;基于本体的构件信息标注方法[D];华中科技大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 闫中敏;李庆忠;曹鲁慧;孔兰菊;董永权;丁艳辉;;Web查询接口集成中基于本体的模式匹配方法(英文)[J];Journal of Southeast University(English Edition);2008年03期
3 唐焕玲,孙建涛,陆玉昌;文本分类中结合评估函数的TEF-WA权值调整技术[J];计算机研究与发展;2005年01期
4 刘伟;孟小峰;孟卫一;;Deep Web数据集成研究综述[J];计算机学报;2007年09期
5 姜芳艽;孟小峰;贾琳琳;;Deep Web集成服务的不确定模式匹配[J];计算机学报;2008年08期
6 周立柱,林玲;聚焦爬虫技术研究综述[J];计算机应用;2005年09期
7 李齐会;;Deep Web查询接口的判定技术研究[J];计算机与数字工程;2009年03期
8 姜芳艽;孟小峰;;Deep Web数据集成中查询处理的研究与进展[J];计算机科学与探索;2009年02期
9 杜小勇;李曼;王珊;;本体学习研究综述[J];软件学报;2006年09期
10 王辉;刘艳威;左万利;;使用分类器自动发现特定领域的深度网入口(英文)[J];软件学报;2008年02期
中国硕士学位论文全文数据库 前1条
1 张伟;基于视觉特征的Web信息抽取技术的研究与实现[D];华东师范大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 梁峰;金莹;;基于Agent技术的语义网服务模型[J];安徽广播电视大学学报;2008年01期
2 陆余良;房珊瑶;刘金红;施凡;;Deep Web站点分类研究进展[J];安徽大学学报(自然科学版);2010年01期
3 陶皖,李平,廖述梅;当前基于本体的语义标注工具的分析[J];安徽工程科技学院学报(自然科学版);2005年02期
4 赵秀芳;;基于本体的农业信息检索[J];安徽农业科学;2006年10期
5 孙素芬;罗长寿;张峻峰;于峰;张树亮;;农业信息资源整合系统研究与应用[J];安徽农业科学;2007年22期
6 蔡曈;徐惠;吴群;;土壤质量聚类分析——以封丘县为例[J];安徽农业科学;2008年25期
7 汪斌;张云伟;刘健;陈晶;;一种面向农业信息主题网络爬虫的设计[J];安徽农业科学;2009年20期
8 薛荟;谭三清;;林业应用系统本体知识模型的构建方法研究[J];现代农业科技;2011年07期
9 赵靖;王侨文;管马周;单传佳;;自动提取布局结构相似网页的结构化信息[J];安徽科技学院学报;2010年06期
10 林正奎;唐焕玲;鲁明羽;王敬东;;基于特征多视图提升Naive Bayesian的Boosting改进算法[J];北京交通大学学报;2009年06期
中国重要会议论文全文数据库 前10条
1 李贵;张兆鑫;李征宇;韩子洋;;WEB环境下基于领域本体的语义匹配技术研究[A];科学发展与社会责任(A卷)——第五届沈阳科学学术年会文集[C];2008年
2 徐立恒;刘洋;来斯惟;刘康;田野;王渝丽;赵军;;基于多特征表示的本体概念挂载[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 张晓莹;张桂平;王裴岩;;领域本体构建中关系辅助判断技术研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 李伟刚;张克亮;王慧兰;;基于航空领域本体知识库的语义检索研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 毕鲁雁;焦宗夏;范圣韬;赵四军;;基于本体的机载机电系统故障诊断研究[A];第五届全国流体传动与控制学术会议暨2008年中国航空学会液压与气动学术会议论文集[C];2008年
6 王建州;李廉;汪映海;;面向Ontology的电力信息系统的研究[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
7 郑笈;李思昆;陆筱霞;;大规模场景绘制的存储数据调度组织研究[A];节能环保 和谐发展——2007中国科协年会论文集(一)[C];2007年
8 杨昆;王军;彭双云;;基于Ontology的空间信息互操作初步研究[A];中国地理信息系统协会第八届年会论文集[C];2004年
9 蔡彪;廖闻剑;彭艳兵;;Deep Web数据集成和关键技术综述[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
10 范志煜;肖兵;沈薇薇;;基于概率本体的态势估计应用研究[A];中国自动化学会中南六省(区)2010年第28届年会·论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 卜志国;海洋生态环境监测系统数据集成与应用研究[D];中国海洋大学;2010年
2 熊晶;海洋生态本体的建模方法研究及应用[D];中国海洋大学;2010年
3 张俐;面向概念设计方案选择的协同决策方法研究[D];华中科技大学;2010年
4 韩赟;高技术虚拟企业(HTVE)知识管理模式研究[D];哈尔滨理工大学;2009年
5 王亚萍;需求驱动的个性化产品配置设计方法研究[D];哈尔滨理工大学;2010年
6 张慧斌;Deep Web查询接口及查询结果抽取研究[D];南开大学;2010年
7 吴羽;面向时间敏感对象的垂直搜索引擎关键技术研究[D];浙江大学;2011年
8 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
9 陈一稀;基于关系数据库的遗留系统向语义Web移植的研究[D];浙江大学;2010年
10 游颖;客车信息集成控制系统配置设计中的分解技术研究[D];武汉理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 樊敬川;Deep Web数据库的选择研究[D];河北大学;2009年
2 厉颖;基于本体的服装领域知识表示的建模研究[D];山东科技大学;2010年
3 商翠珍;数据资源汇聚的可视化建模技术研究与应用[D];山东科技大学;2010年
4 朱静;数据资源汇聚中嵌套表格模型的研究与应用[D];山东科技大学;2010年
5 吕媛媛;基于本体的物流信息集成系统的研究[D];山东科技大学;2010年
6 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年
7 夏怀楠;支持跨域数据汇聚的关系数据访问服务研究[D];山东科技大学;2010年
8 许坤;基于本体的应急信息管理系统的研究与设计[D];郑州大学;2010年
9 王洋;基于潜在语义分析的智能搜索技术研究[D];哈尔滨工程大学;2010年
10 翁岩青;网页抓取策略研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 陈悦;陈运;杨义先;胡迪;;基于遗传算法的聚焦爬虫搜索策略设计与研究[J];成都信息工程学院学报;2011年05期
3 谭骏珊;陈可钦;;聚焦爬行中网页爬行算法的改进[J];电脑知识与技术;2008年35期
4 王彩霞;高明;;Deep Web查询接口及其识别算法[J];电脑知识与技术;2011年22期
5 常继传,李克勤,郭立峰,梅宏,杨芙清;青鸟系统中可复用软件构件的表示与查询[J];电子学报;2000年08期
6 蔡怡峰;彭鑫;钱乐秋;;面向语义构件检索的交互式查询方案生成[J];电子学报;2008年08期
7 宋晖,张岭,叶允明,马范援;基于标记树对象抽取技术的Hidden Web获取研究[J];计算机工程与应用;2002年23期
8 黄烟波,张红宇,李建华,谭立球,李志;本体映射方法研究[J];计算机工程与应用;2005年18期
9 杨芙清;;软件复用及相关技术[J];计算机科学;1999年05期
10 李由;刘东波;张维明;;基于数据实例分布特征的自动模式匹配方法[J];计算机科学;2005年11期
中国博士学位论文全文数据库 前5条
1 张慧斌;Deep Web查询接口及查询结果抽取研究[D];南开大学;2010年
2 唐彬;基于本体的构件检索研究[D];复旦大学;2007年
3 徐和祥;Deep Web集成中若干技术研究[D];复旦大学;2008年
4 董永权;Deep Web数据集成关键问题研究[D];山东大学;2010年
5 梁浩;Deep Web信息集成架构及相关问题研究[D];吉林大学;2010年
中国硕士学位论文全文数据库 前10条
1 刘富江;网络数据源模式识别方法及策略研究[D];哈尔滨工程大学;2010年
2 王鸿;Deep web中基于领域知识的接口集成[D];西南大学;2011年
3 仲华;Deep Web模式获取技术研究与应用[D];苏州大学;2007年
4 袁靓;Deep Web信息集成关键技术的研究[D];中南大学;2008年
5 张云冬;特定领域的Deep Web查询集成及结果抽取[D];复旦大学;2008年
6 陶然;基于分层模型的Deep Web查询接口集成[D];浙江大学;2010年
7 吕越烽;基于本体的Deep Web模式匹配技术研究[D];苏州大学;2010年
8 胡道京;决策树算法研究及在查询接口发现中的应用[D];苏州大学;2010年
9 杨丽华;基于规则的Deep Web接口发现与抽取研究[D];河北大学;2010年
10 刘为;Deep Web环境下数据抽取及模式识别的研究[D];东北大学;2008年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 祝官文;基于表单特性的深层网络数据源分类方法研究[D];哈尔滨工程大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 陈少飞,郝亚南,李天柱,徐林昊,杨文柱;Web信息抽取技术研究进展[J];河北大学学报(自然科学版);2003年01期
3 李凡,林爱武,陈国社;一种基于VSM文本分类系统的设计与实现[J];华中科技大学学报(自然科学版);2005年03期
4 唐焕玲,孙建涛,陆玉昌;文本分类中结合评估函数的TEF-WA权值调整技术[J];计算机研究与发展;2005年01期
5 王茹,宋瀚涛,陆玉昌;网页数据自动抽取系统[J];计算机工程与应用;2004年19期
6 李文奇,张忠能;页面包装器自动生成的改进算法[J];计算机工程与应用;2004年22期
7 于波;唐世渭;张鹏;童云海;;基于实体分类的数据库模式匹配方法[J];计算机科学;2004年10期
8 杜波,田怀凤,王立,陆汝占;基于多策略的专业领域术语抽取器的设计[J];计算机工程;2005年14期
9 郑家恒,卢娇丽;关键词抽取方法的研究[J];计算机工程;2005年18期
10 刘伟;孟小峰;孟卫一;;Deep Web数据集成研究综述[J];计算机学报;2007年09期
中国重要会议论文全文数据库 前1条
1 陈文亮;朱靖波;姚天顺;张宇新;;基于Bootstrapping的领域词汇自动获取[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
【相似文献】
中国期刊全文数据库 前10条
1 张蒲生,苏运霖;基于政务数据仓库的数据集成及关键技术[J];计算机工程;2003年09期
2 吴健鸣;;利用Java实现Lotus Domino和数据库系统的数据集成[J];上海电机学院学报;2006年03期
3 范志勇;肖冬荣;张群;;基于PDM框架下的CAPP与PDM的数据集成[J];微计算机信息;2007年04期
4 武树东;赵全明;索依娜;;物流信息系统中的数据集成技术[J];商场现代化;2007年10期
5 张恩;刘春红;段德全;;基于XML/Web Services的异构数据集成研究[J];广西师范大学学报(自然科学版);2008年03期
6 刘高嵩;龙军;;基于CORBA和Web Services的异构数据源集成研究[J];计算机系统应用;2009年07期
7 刘春玲;;基于虚拟视图的教务管理数据集成方式研究[J];电脑知识与技术;2010年19期
8 连云峰;卢昱;陈立云;马懿;;军械装备保障模拟训练系统数据集成研究[J];信息技术;2011年05期
9 王艳君,王运格,吴丽红;异构数据库间数据集成的方法[J];烟台师范学院学报(自然科学版);1999年04期
10 李军怀,张景,周明全,耿国华;基于XML的企业异构数据集成方法研究[J];计算机工程;2002年09期
中国重要会议论文全文数据库 前10条
1 曹禹;申德荣;于戈;余恩运;周文生;寇月;;数据网格内一种基于本体的数据集成处理机制[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
2 祝晓红;刘炜;李俊丽;;用WPF进行复杂数据集成的方法研究[A];第二十七届中国控制会议论文集[C];2008年
3 王帅;缪嘉嘉;李爱平;韩伟红;贾焰;;一种基于构件技术和消息代理模式的数据集成方法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
4 姜芸;吴学伟;;面向服务的地理数据集成中间件的设计与实现[A];第二届“测绘科学前沿技术论坛”论文精选[C];2010年
5 胥永康;吴志杰;席传裕;岳筱玲;;基于数据拆分的数据集成技术研究[A];2005全国计算机程序设计类课程教学研讨会论文集[C];2005年
6 李明歆;马世龙;许可;;航天器测试数据资源集成的研究[A];2007中国控制与决策学术年会论文集[C];2007年
7 杨军生;;基于GIS的城市规划数据的特征分析及集成方法的研究[A];2007'全国测绘科技信息交流会暨信息网成立30周年庆典论文集[C];2007年
8 杨雪梅;李灿东;周任材;林端宜;;中医症状术语体系库的建立[A];中国中西医结合学会诊断专业委员会2009’年会论文集[C];2009年
9 丁国辉;王国仁;赵宇海;;基于使用信息和聚类方法的多模式集成[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
10 许桂芝;翟秉仁;陈丕富;蔡鸿;张爽;;采油厂生产管理信息系统的数据库集成[A];1996中国控制与决策学术年会论文集[C];1996年
中国重要报纸全文数据库 前10条
1 于翔;谁碾碎了数据?[N];网络世界;2007年
2 ;SaaS需要数据集成[N];网络世界;2007年
3 陈友梅;数据集成 永中Office之本[N];中国计算机报;2002年
4 邹大斌;发挥数据的最大价值[N];计算机世界;2007年
5 姜学军(山东省医药卫生科技信息研究所) 程永(浪潮商用系统公司;山东省地税系统的数据集成[N];电脑商报;2005年
6 李稚;“集成”的困惑[N];计算机世界;2002年
7 于翔 王翔;收复数据孤岛[N];网络世界;2007年
8 刘学纲;互联互通平台的数据集成[N];中国计算机报;2003年
9 朱文;CIO希望攻克数据质量关[N];计算机世界;2008年
10 本报记者 邹大斌;Informatica:从数据中淘金[N];计算机世界;2008年
中国博士学位论文全文数据库 前10条
1 王欣;数据集成技术若干问题的研究[D];上海交通大学;2010年
2 张文江;地质灾害数据集成关键技术研究[D];成都理工大学;2013年
3 蒋永国;面向传感网的海洋观测数据集成关键技术研究[D];中国海洋大学;2010年
4 卜志国;海洋生态环境监测系统数据集成与应用研究[D];中国海洋大学;2010年
5 李鹏;面向地质勘查的多源异构数据集成关键技术研究[D];中国地质大学;2013年
6 周春英;超数据集成挖掘方法与技术研究[D];浙江大学;2012年
7 陈义;面向数据集成的数据复制和查询优化[D];中国科学院研究生院(软件研究所);2004年
8 李雁妮;深网数据集成与挖掘关键问题的建模及算法研究[D];西安电子科技大学;2013年
9 张永新;面向Web数据集成的数据融合问题研究[D];山东大学;2012年
10 殷晓冬;声学测深数据处理与海陆数据集成方法研究[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 张红宇;数据集成中本体映射的研究[D];中南大学;2005年
2 缪建明;集散控制系统的数据集成的研究与应用[D];福州大学;2003年
3 刘军;分布式智能异构数据集成支持系统的原型实现[D];大连海事大学;2003年
4 李凯;面向SCM数据集成的DW解决方案研究[D];大连理工大学;2006年
5 文静;数据集成中数据冲突检测和解决方法研究[D];山东大学;2010年
6 张雪洁;基于XML的数据集成平台框架及关键技术研究[D];河海大学;2004年
7 周艳芳;基于XML的ERP和电子商务数据集成[D];四川大学;2004年
8 袁红;保险公司数据集成关键技术的研究及应用[D];重庆大学;2004年
9 常萍英;基于OPC的机器人焊接生产线监控系统的数据集成及软件开发[D];东南大学;2004年
10 王宇鸽;电子政务中异构数据资源集成技术的应用研究[D];北方工业大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026