XML数据的存储和查询的研究
【摘要】:随着XML(eXtensible Markup Language)数据研究和应用的不断深入,人们迫切需要一种方案来解决如何对XML数据更好地存储和查询的问题。本文针对上述存在问题,对国内外XML数据存储和路径表达式查询的研究现状进行了综合分析,提出了两种XML数据结构聚集存储策略,一种XML路径表达式查询算法和两种XML路径表达式查询优化算法。
本文首先定义了XML数据模型和XML模式模型,为后继的研究打下了基础。
其次给出一个XML数据管理原型系统XMLBase的体系结构。它提供XML数据输入、存储及路径表达式查询的功能。并提出两种XML数据结构聚集存储策略,它们是父子关系聚集存储方法和兄弟关系聚集存储方法,分别适合XML数据深度优先遍历查询算法和XML数据广度优先遍历查询算法。
接着定义了XML外延、XML限定外延等概念,提出一种XML路径表达式查询算法——外延多路连接算法,讲述了该算法中路径查询分解与转换、路径查询优化的过程,并引入四种索引结构。通过实验测试,结果表明该算法提高了XML路径表达式查询的效率,并且具有较好的数据伸缩性,即算法的性能受数据量影响不大。
最后提出两种XML路径表达式查询优化算法,分别为路径剪除策略和路径替换策略。它们利用模式信息减小用户查询路径的复杂度,从而达到查询优化的目的。它们进一步提高XML数据路径表达式查询的效率。
本文取得的成果对XML数据管理问题的研究和Web的发展,将有一定的理论价值和实际意义。