收藏本站
《重庆大学》 2013年
收藏 | 手机打开
二维码
手机客户端打开本文

基于Hadoop的大规模语义Web本体数据查询与推理关键技术研究

李韧  
【摘要】:语义Web是Tim Berners-Lee提出的下一代互联网远景,通过引入了哲学领域本体的概念,使得计算机能够理解Web上的资源,并能实现计算机之间的语义信息共享。在世界万维网联盟(World Wide Web Consortium, W3C)提出的语义Web体系结构中,基于SPARQL的资源描述框架(Resource Description Framework, RDF)数据查询、基于描述逻辑的Web本体描述语言(Web Ontology Language, OWL)一致性检测推理和基于语义Web规则语言(Semantic Web Rule Language, SWRL)的OWL本体规则推理构成了语义Web领域的研究核心。 然而,随着语义Web技术的不断快速发展,本体数据已呈现出大规模性、高速增长性、多样性等大数据特性。然而,传统的本体数据查询与推理工具由于设计运行于单机环境下,不可避免地存在计算性能和可扩展性不足等问题,影响了语义Web技术的进一步推广应用。 近年来,云计算因其具备高性能、易扩展的海量数据存储和计算能力已经成为产业界和学术界在信息技术领域的最新研究方向之一,其中开源Hadoop云计算工具已成为当前大数据处理的事实标准。目前,国内外研究人员已开始将Hadoop关键技术引入语义Web研究领域,以探寻分布式环境下的高效率本体数据查询与推理方法,并已逐步形成了以语义Web和云计算技术相结合的新研究方向,但其研究仍然处于起步阶段,存在许多关键问题尚待解决。 本文通过结合云计算和语义Web理论和关键技术,研究基于Hadoop的本体数据查询与推理并行化方法,为实现面向大规模语义Web本体的数据管理云服务奠定理论研究基础。主要研究内容和创新性成果包括以下五个方面: (1)以W3C提出的语义Web体系结构为基础,结合云计算Hadoop关键技术特性,提出了一种大规模语义Web本体数据查询与推理云计算框架。首先,对该框架进行了功能层级划分,自底向上分别由物理层、存储层、数据层、逻辑层、接口层、网络层和应用层组成。然后,基于本体查询与推理理论,设计了核心的逻辑层由数据预处理器、数据适配器、查询与推理分析器、查询与推理计划生成器、MapReduce SPARQL查询引擎、MapReduce SWRL规则推理引擎和MapReduceTableau推理引擎构成。该框架的提出为实现高性能、易扩展的语义Web数据管理云服务提供体系结构和数据交互流程支持和借鉴,为进一步研究其中的关键技术理论奠定基础。 (2)基于语义Web中RDF三元组数据特性和基于描述逻辑的OWL本体描述语言形式化语义,结合HBase基于列的数据存储模式特性,提出了由三个HBase数据表T_OS_P、T_PO_S和T_SP_O构成的本体数据分布式存储策略,分析了在进行基于MapReduce的本体查询和推理任务时的数据检索机制,并通过与现有的数据存储策略进行对比和分析,论证了本文提出方法能够在本体数据存储空间开销和检索性能方面实现较好的平衡。 (3)基于SPARQL语法和形式化语义,结合MapReduce键值对的计算特性,提出了SPARQL复杂组图模式在MapReduce环境下的分布式查询方法。首先提出了SPARQL复杂组图模式查询的相关解析模型定义。然后提出了基于MapReduce的SPARQL复杂组图模式查询任务生成算法,实现了查询任务数的优化,并以此为基础,提出了在map和reduce函数中的SPARQL复杂组图模式分布式查询算法。最后,通过使用语义Web研究领域广泛采用的SP2Bench本体测试数据集和标准测试语句,对提出方法与现有的Jena、Sesame和RDF-3X查询引擎进行了对比实验和可扩展性实验。实验结果表明,提出方法在面向大规模RDF数据的SPARQL复杂组图模式进行查询时,其计算性能和可扩展性均优于传统的单机环境下运行的查询引擎。 (4)基于OWL Lite本体所对应的描述逻辑SHIF语义及其Tableau推理算法,结合MapReduce键值对的数据计算特性,提出了基于MapReduce的OWL本体一致性分布式检测推理方法。首先定义了OWL本体一致性检测的相关解析模型。然后提出了基于MapReduce的OWL Lite本体数据划分方法和分布式Tableau推理算法。最后通过使用LUBM本体测试数据集,对提出方法与现有Pellet、RacerPro和HermiT推理引擎进行了对比实验和可扩展性实验,证明了提出方法在进行大规模OWL本体的一致性检测推理时,在计算性能和可扩展性方面均优于传统单机环境下运行的描述逻辑推理引擎。 (5)基于SWRL规则语法和形式化语义,结合MapReduce键值对的数据计算特性,提出了基于MapReduce的SWRL规则分布式推理方法。首先提出了SWRL规则推理的相关解析模型定义。然后提出了基于MapReduce的SWRL规则推理计划生成算法,实现了推理任务数的优化。其次,为保证推理的可判定性,提出了DL-safe限制下SWRL规则在map和reduce函数中的分布式推理算法。最后通过使用LUBM本体数据集和自定义SWRL测试规则,对提出方法与Jess和Pellet推理引擎进行了对比实验和可扩展性实验,证明了在处理大规模OWL本体的SWRL规则推理时,提出方法较传统规则推理引擎具备更好的计算性能和可扩展性。
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:TP391.1

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 陈俊松;罗康健;蒋其斌;;基于ASP的数据录入与数据查询技术[J];石油工业计算机应用;2000年04期
2 陈泽琳,张湘东,黄永成;可扩展的分布式档案信息管理系统的研究与设计[J];计算机工程与应用;2002年17期
3 何源,戴小鹏,张林峰;数据查询优化算法综述[J];计算机与现代化;2005年04期
4 陈姿含;张云生;;昆钢质量信息管理系统棒材站子系统的构建[J];电脑知识与技术(学术交流);2007年01期
5 孙国社;李艳玲;李永峰;;一种基于人工神经网络的数据查询优化方法[J];计算机与信息技术;2010年10期
6 王保中;庄军;刘侃;谢京;王勇敢;;经管数据查询与报表生成系统设计及实现[J];医疗卫生装备;2010年12期
7 李文;洪亲;滕忠坚;石兆英;;一种由B+树实现的倒排索引[J];电脑知识与技术;2011年08期
8 王智钢;客户端数据查询网页设计实例[J];金陵职业大学学报;2003年01期
9 刘卫;SQL在Delphi数据库查询中的应用[J];计算机与现代化;2005年11期
10 孟庆华;段三青;尹旭梅;;数据质量控制在制丝生产线的应用[J];微计算机信息;2006年07期
中国重要会议论文全文数据库 前10条
1 刘建伟;于守健;乐嘉锦;;基于Web服务资源框架的流数据查询处理系统[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 刘雨洋;李建中;王宏志;刘显敏;;基于后裔聚集F&B索引的XML数据查询处理算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
3 曹学成;徐天音;邱林锋;柏文阳;;基于DIM的WSN网内数据查询处理[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
4 张佳宝;周斌;吴泉源;;基于Hadoop的并行化命名实体识别技术研究与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
5 金松昌;方滨兴;杨树强;贾焰;;基于Hadoop的网络安全日志分析系统的设计与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
6 丁辉;张大华;罗志明;;基于Hadoop的海量数据处理平台研究[A];2011电力通信管理暨智能电网通信技术论坛论文集[C];2011年
7 王明红;黄冲;何熙;金哓华;马占鸿;;北京市农作物病虫害远程预警信息系统初步构建[A];中国植物病理学会2005年学术年会暨植物病理学报创刊50周年纪念会论文摘要集[C];2005年
8 宋伟;彭智勇;程芳权;李文海;胡文斌;任毅;;可信数据库环境下面向服务的自适应密文数据查询方法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
9 王明红;黄冲;何熙;金哓华;马占鸿;;北京市农作物病虫害远程预警信息系统初步构建[A];中国植物病理学会2005年学术年会暨植物病理学报创刊50周年纪念会论文集[C];2005年
10 陆泓;;用ASP技术扩展生产MIS的查询功能[A];全国冶金企业计控网络化研讨会论文集[C];2003年
中国重要报纸全文数据库 前10条
1 卫新江;外部数据查询[N];中国保险报;2009年
2 记者 李涛;为全国18个行业提供数据查询[N];中国食品质量报;2004年
3 孙定;云计算、大数据与Hadoop[N];计算机世界;2011年
4 陆志军 高亦兵;“两证”数据查询与管理系统开发成功[N];中国国门时报(中国出入境检验疫报);2002年
5 记者 叶滨;哈市空气质量测试系统升级换代[N];哈尔滨日报;2007年
6 本报记者 贺崇生;宜昌市西陵区建立统计数据查询制度[N];中国信息报;2005年
7 郭继智;丛连青;经营决策 电脑帮忙[N];中国城乡金融报;2003年
8 尚欣;上证所实行上市公司信息披露标准化[N];证券日报;2004年
9 郑伟;部分报刊单据的重打步骤[N];中国邮政报;2007年
10 本报记者 马文方;Hadoop:云中起舞的小象[N];中国计算机报;2010年
中国博士学位论文全文数据库 前10条
1 李韧;基于Hadoop的大规模语义Web本体数据查询与推理关键技术研究[D];重庆大学;2013年
2 陈颖文;无线传感器网络低能耗数据查询关键技术研究[D];国防科学技术大学;2007年
3 韩忠明;基于XML的数据查询和信息检索集成化系统研究[D];东华大学;2006年
4 沈海澜;无线传感器网络数据查询关键技术研究[D];中南大学;2011年
5 秦杰;Web环境中半结构化数据存储与查询技术研究[D];国防科学技术大学;2005年
6 刘波;XML数据智能管理若干关键技术研究[D];中南大学;2008年
7 陈苗;海量地学数据查询优化关键技术的研究[D];吉林大学;2008年
8 刘晓东;面向无线传感器网络数据传输与查询的节能算法与理论研究[D];中国海洋大学;2009年
9 赵文峰;信息提供类Web服务的自动发现和自动组合[D];北京邮电大学;2010年
10 康俊锋;云计算环境下高分辨率遥感影像存储与高效管理技术研究[D];浙江大学;2011年
中国硕士学位论文全文数据库 前10条
1 丁日升;适合于北方地区的非充分灌溉管理信息系统研制与应用[D];西北农林科技大学;2005年
2 谭茹缤;基于能量控制的无线传感器网络分层路由技术研究[D];电子科技大学;2008年
3 王莉娜;基于移动Agent的分布式数据查询研究与应用[D];河海大学;2005年
4 陈波;XML文档数据查询技术研究[D];山东大学;2005年
5 陈冬霞;XML数据查询技术研究[D];南京师范大学;2005年
6 刘畅;分布交互仿真若干问题的研究[D];北京邮电大学;2008年
7 肖长伟;无线传感器网络分布式数据查询处理机制的研究与设计[D];南京航空航天大学;2008年
8 罗先贤;证券内幕交易稽查数据查询分析系统的设计与实现[D];华南理工大学;2012年
9 高鹏;钻探工程项目监管数据查询及其报表生成的应用研究[D];中国地质大学(北京);2012年
10 黄军;TPS运行平台及数据查询模块设计与实现[D];电子科技大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026