收藏本站
《哈尔滨工业大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

XML数据查询处理技术的研究

王宏志  
【摘要】: 由于其良好的可扩展性和灵活性,XML已经成为Web上数据表示和交换的标准,在各种应用中出现大量的XML形式的数据。作为一种半结构化数据,XML数据的高效处理带来了新的挑战。XML数据管理已经成为数据管理中一个重要的研究领域。XML数据管理中一个重要问题是如何对XML数据进行高效的查询处理。 本文以XML数据的高效查询处理为目标,研究了树结构XML文档、图结构XML文档、XML数据流和基于XML的信息集成系统中的查询处理,主要研究成果如下: (1)提出了一整套支持树结构XML文档上路径查询高效处理的方法。具体的,提出树结构XML文档的磁盘存储结构。该存储结构有效地结合了结构索引、基于编码的连接操作以及树的遍历操作,支持复杂路径查询的高效处理。基于这种存储结构,提出了多种查询操作的实现方法。针对带有复杂结构和值约束的路径查询,提出了代价模型和基于代价模型的查询优化策略。实验结果表明这种查询处理方法有着很高的效率和可扩展性,查询优化策略可以快速有效地生成查询计划。 (2)在图结构XML文档的查询处理方面,提出了子图查询和拓扑查询的处理方法。具体的,对DAG上的可达编码进行了扩展,使之能够支持有圈的图,并且提出了有效支持子图查询的编码存储方法。基于这种存储方法,提出了子图查询处理策略。这种策略能够高效地处理形式为一般图、包含可达关系的子图查询,经过简单的扩展,可以用来处理同时包含可达关系和连接关系的子图查询。实验结果表明本文提出策略能够高效地处理子图查询。提出了一种图结构XML文档上的新型查询―拓扑查询,并且给出了拓扑查询的高效处理算法。 (3)在XML数据流的查询处理方面,首次提出了XML数据流上聚集查询的问题,对其给出了精确定义并提出了高效查询处理算法,既支持复杂的XPath表达式,又适用于多种类型的XML聚集,并且可用于基于SAX的XML文档上的聚集查询处理。分析和实验结果表明本文的提出算法具有很高的效率和可扩展性。 (4)在基于XML的信息集成方面,本文对结果传输、返回结果合并与数据源选择这三个关键技术问题进行了研究。具体的,提出了两种对作为结果返回的XML数据片段进行缩减的策略。提出了基于XML的信息集成系统中XML数据片段的连接操作,用来描述多种情况下XML数据片段的连接,对这些连接操作提出了高效的实现算法。提出了用于数据源选择的索引结构,能够同时对数据源中值的信息和结构信息进行概要,从而为具有复杂结构和值约束的查询进行数据源选择。还提出了两种索引缩减策略。基于压缩和非压缩的索引结构,分别提出了有效的数据源选择方法。实验结果表明这种数据源选择方法有很好的精度和效率,索引缩减策略能够在不过多损失数据源选择性能的情况下有效地缩减索引。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 安韶峰,鲁士文;Native XML数据库中文档和数据表现形式的分析与研究[J];计算机应用与软件;2004年08期
2 王鑫;唐建平;;基于HTML页面格式的网站信息集成方案[J];内蒙古农业大学学报(自然科学版);2010年04期
3 黎东华;;XML数据存储模式的研究[J];计算机与现代化;2006年11期
4 李应勇;汪文彬;宋武;;XML信息查询优化研究[J];琼州学院学报;2009年02期
5 骆吉洲;李建中;;XML数据压缩技术的研究进展[J];计算机科学与探索;2008年03期
6 郑羽洁;;SQL 2005处理XML半结构化数据查询[J];大众科技;2009年08期
7 杨勇;一种基于数据绑定的Java平台下XML数据操作新方法[J];陕西师范大学学报(自然科学版);2004年S1期
8 王焕彬;夏靖波;;信息数据库网格技术研究[J];铁路计算机应用;2008年10期
9 王树锋;;XML数据集中挖掘关联规划算法的比较[J];常州工学院学报;2009年06期
10 任家东;马瑞;;M*(k)-index构造算法的改进[J];计算机工程;2008年19期
11 孙丹凤;涂利明;;一种基于层次栈的XML数据小枝查询算法研究[J];计算机时代;2011年06期
12 覃遵跃;蔡国民;黄云;;SQL Server 2005查询XML数据优化研究[J];东莞理工学院学报;2008年05期
13 曹小冲;胡运发;陶晓鹏;葛家翔;;XML数据的数值对象化及其转化算法[J];计算机工程;2010年06期
14 李玉忠;;虚拟现实教学资源库研究[J];广东技术师范学院学报;2005年06期
15 杨治;鞠时光;;基于SAX的XML数据结构聚簇存储方法[J];计算机工程;2008年18期
16 芦大鹏;郭荷清;郑毅强;;数据交换平台中的中介结构研究[J];计算机应用与软件;2008年10期
17 雷向欣;杨智应;邵杨俊;胡运发;;XML数据分页索引技术研究[J];计算机工程;2009年02期
18 牛永洁;;提高自动评分速度的方法研究[J];现代电子技术;2011年08期
19 魏东平;徐瑞敏;贾楠;;基于结构标记树的XML可查询压缩方法[J];计算机工程;2011年15期
20 羊牧;胡艳梅;罗婷;;数字化校园数据交换中心的设计与实现[J];现代教育技术;2006年01期
中国重要会议论文全文数据库 前1条
1 张元平;丁晓明;曾一;林梅;;一种基于第三方的XML数据发布方法[A];2008年计算机应用技术交流会论文集[C];2008年
中国硕士学位论文全文数据库 前5条
1 王丹琛;物流信息系统中XML数据压缩与传输安全性研究[D];西南交通大学;2007年
2 张元平;分布式XML数据并行更新及发布方法的研究[D];重庆大学;2007年
3 马洪波;南阳电网工程数据管理系统的规划与设计[D];南京理工大学;2011年
4 肖明睿;临床医疗病例信息管理系统的设计与实现[D];华中科技大学;2013年
5 赵万青;数据交换与共享系统的设计与实现[D];华中科技大学;2012年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978