收藏本站
《兰州理工大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于结果模式的Deep Web语义标注研究

李秀兰  
【摘要】:随着Internet技术的飞速发展和网络中所含信息规模的不断扩大,存在越来越多以Web查询接口形式进行访问的Deep Web (简称Web数据库或WDB)资源。而信息检索作为互联网应用的重要组成部分,在网络环境下,随着对信息检索研究的不断深入,研究Deep Web数据集成系统受到越来越多的研究者的密切关注。通过最近的研究发现, Deep Web蕴含了大量有价值的数据信息,这些数据资源与市场的需求密切相关,为了能自动的、有效的获取Deep Web背后众多Web数据库信息资源,需要进行大量的WDB数据集成。WDB页面大多是带模板的结构化HTML文档,而HTML语言的特点是在Web上人们可以随意发布内容多种多样,形式不同的内容,这样使得Web上的内容处于杂乱无序的状态,对建立Web数据库集成系统造成了很大的困难。 语义标注作为Deep Web数据集成系统中查询结果处理模块中一个非常重要的组成部分,它的主要工作是指对抽取出的Deep Web查询结果数据添加正确的语义信息,使这些数据具有更高的使用价值,同时能被计算机识别和处理。本文首先介绍了研究Deep Web的研究背景和相关知识;其次,对模式获取技术和Deep Web数据标注技术进行了深入的研究,并提出了相应的方法和模型结构图;最后,使用结果模式信息对WDB数据进行有效标注,其主要研究工作包括: 1.针对Deep Web结果模式结构信息的丢失问题,提出了一种基于启发式信息的Deep Web结果模式获取方法。通过解析Deep Web结果页面数据,利用启发式信息为结果页面数据添加正确的属性名,进而得到对应Deep Web的结果模式,并对其进行规范化处理解决不同数据源结果模式的结构不一致问题。实验验证该方法可以有效地获取Deep Web的结果模式信息。 2.通过对比不同的WDB语义标注方法的优缺点,针对已有的标注方法还不能较好的解决Deep Web查询结果数据的标注问题,提出一种基于结果模式的Deep Web数据标注方法。通过结果页面解析和抽取结构化数据来完成数据预处理的工作,并在集成结果模式和待标注数据之间建立正确的语义映射,进而确定Deep Web数据的标注信息。实验结果表明,该标注方法对查询结果数据具有较好的标注效果。
【学位授予单位】:兰州理工大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP391.1

【相似文献】
中国期刊全文数据库 前10条
1 虎晓红;钱旭;王晓磊;;图像语义标注中的叙词查询方法[J];计算机应用研究;2011年08期
2 王彩霞;高明;;Deep Web查询接口及其识别算法[J];电脑知识与技术;2011年22期
3 辛洁;崔志明;赵朋朋;张广铭;鲜学丰;;基于MapReduce虚拟机的Deep Web数据源发现方法[J];通信学报;2011年07期
4 陈叶旺;李海波;余金山;陈维斌;;一种基于稀疏编码的语义标注方法[J];计算机科学;2011年09期
5 文俊浩;涂丽云;江卓;何盼;;基于功能语义标注的Web服务发现方法[J];计算机应用研究;2011年07期
6 魏墨济;于涛;;基于领域本体的专业文档语义标注方法[J];计算机应用;2011年08期
7 朱嘉贤;白伟华;李吉桂;;Web资源的多粒度语义标注及其应用技术研究[J];计算机科学;2011年08期
8 卓林;杨舟;岳亮;赵朋朋;崔志明;;Deep Web爬虫的一种增量式更新策略[J];苏州大学学报(工科版);2011年04期
9 李明;李秀兰;;基于结果模式的Deep Web数据标注方法[J];计算机应用;2011年07期
10 邵秀丽;孙杰;侯乐彩;;基于整体模式匹配的深度网集成系统的研究[J];计算机工程与设计;2011年08期
中国重要会议论文全文数据库 前10条
1 闫中敏;李庆忠;彭朝晖;董永权;丁艳辉;张永新;徐秀星;;DWDIS:面向分析的Deep Web数据集成系统[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 余伟;李石君;洪辉;田建伟;;基于覆盖关系的Deep Web数据源排名[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
3 王上;于海;王钲旋;;Deep Web垂直搜索引擎设计与实现[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
4 梁浩;左万利;任斐;赫枫龄;;基于启发式信息的Deep Web查询接口属性抽取[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
5 王英;左万利;王鑫;彭涛;;Deep Web查询转换研究[A];第六届全国信息检索学术会议论文集[C];2010年
6 王英;左万利;王鑫;彭涛;;基于多分类器的Deep Web入口发现[A];第六届全国信息检索学术会议论文集[C];2010年
7 王英;左万利;彭涛;赫枫龄;彭钊;;应用领域本体知识库自动填充Deep Web入口表单[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
8 朱命冬;申德荣;寇月;聂铁铮;于戈;;一种应用于Deep Web环境下的重复记录识别模型[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 陶然;江锦华;吴羽;陈刚;;基于树合并的Deep Web查询接口集成[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
10 陈波;姬东鸿;孙程;吕晨;;基于特征结构的汉语主谓谓语句语义标注研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国重要报纸全文数据库 前2条
1 本报驻英国记者 刘海英;未来的网络知你心[N];科技日报;2011年
2 课题承担单位:湖南省博物馆 中国科学院自动化研究所 中国科学院计算机技术研究所 西安交通大学;古代建筑保护技术信息系统研发[N];中国文物报;2010年
中国博士学位论文全文数据库 前10条
1 董永权;Deep Web数据集成关键问题研究[D];山东大学;2010年
2 闫中敏;Deep Web数据获取问题研究[D];山东大学;2010年
3 田建伟;面向领域的高质量Deep Web数据集成技术研究[D];武汉大学;2010年
4 刘海学;基于语义标注的元数据自动构建及其相关技术研究[D];华东师范大学;2010年
5 潘鹏;Deep Web查询中的不确定性问题研究[D];山东大学;2010年
6 王英;Deep Web数据集成关键技术研究[D];吉林大学;2010年
7 黄健斌;基于条件概率图模型的Deep Web数据抽取与集成研究[D];西安电子科技大学;2007年
8 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
9 梁浩;Deep Web信息集成架构及相关问题研究[D];吉林大学;2010年
10 虎晓红;用于图像检索的语义标注技术的研究[D];中国矿业大学(北京);2010年
中国硕士学位论文全文数据库 前10条
1 朱旭东;基于本体学习的Deep Web语义标注关键问题研究[D];苏州大学;2012年
2 黄文;三维模型语义标注系统的设计与实现[D];西北大学;2011年
3 刘斌;基于CPN网络的Deep Web集成系统中结果模式语义标注方法[D];东北大学;2008年
4 李秀兰;基于结果模式的Deep Web语义标注研究[D];兰州理工大学;2011年
5 常建峰;基于模糊支持向量机的图像语义标注[D];太原理工大学;2011年
6 杨舟;特定领域的Deep Web数据抽取与语义标注研究[D];苏州大学;2011年
7 徐利谋;基于语义的Web服务发现研究[D];湖南工业大学;2008年
8 谢莹;Deep Web查询结果抽取及注释[D];吉林大学;2010年
9 罗旋;基于复句领域本体的语义标注方法研究[D];华中师范大学;2006年
10 魏勇刚;Deep Web数据抽取及语义标注研究[D];河北大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026