收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

XML小枝模式查询处理技术研究

江锦华  
【摘要】: 随着在电子商务、数字图书馆以及WEB服务等各领域大规模的应用和传播,XML已经成为数据表示和交换的新标准。全世界XML文档的数量正在以惊人的速度增长。与此同时,如何有效的管理和检索日益增长的XML数据,已成为数据库领域的一个热点问题并得到了广泛关注和研究。 本论文聚焦于XML小枝模式查询处理技术研究。XML小枝模式查询是众多XML查询语言的核心子集,其主旨是在XML文档树中搜索以得到所有匹配树状结构查询模式的结果。XML小枝模式查询处理被认为是XML数据查询中的一个核心操作,在XML数据管理中占有非常重要的地位。由于XML半结构化以及小枝模式查询多样性、复杂性等特点,传统的数据库技术已经不能适应高效处理XML小枝模式查询的需求,而现有研究在XML索引、小枝模式查询匹配算法、查询优化等关键技术上都还存在缺陷,并且至今仍缺乏一个通用的模型可以描述各种类型XML小枝模式的查询处理过程。因此,XML小枝模式查询处理仍是XML数据检索领域一个非常重要且极富挑战性的研究课题。 本文着重解决XML小枝模式查询处理中的核心问题,研究XML索引、小枝模式查询重写、小枝模式选择度估计、代价估计模型、多种类型小枝模式查询匹配算法等一系列关键技术,并综合以上研究成果,提出了一个统一的XML小枝模式查询处理框架。本文的主要贡献和创新总结如下: 统一的XML小枝模式查询处理框架 在分析XML数据模型、小枝模式查询结构特征的基础上,本文提出了一个统一的XML小枝模式查询处理框架。该框架基于多层次的索引管理模型,集成多种小枝模式查询匹配算法,并根据一系列启发式优化规则选择最优的算法,提供综合、高效的小枝模式查询处理服务。围绕整个框架,本论文还就基于路径连接的简单小枝模式查询匹配、复杂小枝模式查询处理以及基于索引的空间跳跃等关键技术进行了深入研究,并分析了这些技术在框架中的具体应用: 基于路径连接的简单小枝模式查询处理技术研究 在研究连接算法分解粒度的基础上,提出了基于路径连接的简单小枝模式查询匹配算法TJFGeneric。该算法将小枝模式分解成多条查询路径,通过自低向上的路径连接过程实现简单小枝模式查询的整体匹配,减少了连接操作的数目并且只访问查询叶节点对应的元素。在此基础上,研究了路径连接算法的节点编码方案。为了能支持多种编码方式,采用标准化的接口,提高了算法的通用性。 有序小枝模式查询的整体路径连接技术研究 分析有序小枝模式的结构特征,提出自低向上的有序小枝模式整体路径连接算法OTJFast。算法引入一种新的数据结构——子节点链接堆栈组(CLS),通过构建及检查CLS的内容,在路径连接过程中判断元素间的顺序关系,实现有序小枝模式的高效查询处理。实验结果表明该算法具有I/O访问少、查询速度快等特点,并能有效处理包含各种顺序轴的有序小枝模式查询。 带逻辑或谓词的小枝模式查询整体路径连接技术研究 通过引入或分支扩展概念,提出了处理带逻辑或谓词小枝模式查询的整体路径连接算法ORTJFast。算法自下而上递归的匹配以分支节点为根的查询子树,大大简化了查询处理过程,结合或分支扩展和路径连接思想,实现带逻辑或谓词小枝模式查询的整体处理。大量的实验结果表明,ORTJFast算法在性能上要明显优于已有算法。 基于空间跳跃的查询加速技术研究 结合空间跳跃技术,在上述研究的基础上提出了相应的查询加速算法。通过引入失配优化、空数据流优化和乱序优化等优化规则,加速类算法利用索引跳过那些明显不参与最终结果的元素访问和计算,整体提高小枝模式查询匹配的效率。实验结果证明优化后的算法相比原有算法有非常明显的性能提升。 总的来说,本论文提出了一系列整体路径连接算法以高效处理不同类型的XML小枝模式查询,并在此基础上结合XML索引、查询优化等技术,提出了一个统一、高效的XML小枝模式查询处理框架,为大规模的XML查询应用提供切实可行的解决方案。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吴於茜;在平面设计软件中实现SVG格式文档输出[J];计算机工程与应用;2001年09期
2 张伟都,周海东,钟共鸣,张素伟;面向XML的数据管理系统[J];计算机工程与应用;2001年20期
3 李天庆,张毅,张冰,胡东成;基于XML的体育数据规格化存储技术研究[J];计算机工程与应用;2001年22期
4 张晓林;基于XML的信息组织与处理:1.XML技术体系[J];情报科学;2001年08期
5 李慧,何绍华;XML在图书馆系统中的实现技术[J];现代图书情报技术;2001年04期
6 谈春梅,段卫华,田质斌;标准文献数据库系统的设计与实现[J];现代图书情报技术;2001年06期
7 李景春,武港山,张福炎;基于转换的光盘文档库数据生成和浏览[J];小型微型计算机系统;2001年04期
8 周建洪,吴以群,庞引明,楼荣生;XML文件系统的设计[J];计算机工程与科学;2001年02期
9 袁琳,李秉严;SGML、HTML、XML的比较[J];四川图书馆学报;2001年03期
10 曹向东;基于JSP的数据访问技术[J];中国民航学院学报;2001年04期
11 李效东,顾毓清;基于DOM的Web信息提取[J];计算机学报;2002年05期
12 李军怀,周明全,耿国华,张景西;XML在异构数据集成中的应用研究[J];计算机应用;2002年09期
13 文燕平,周宁;WWW中的XML数据管理研究[J];情报科学;2002年06期
14 尹桂秀;XML搜索引擎探微[J];图书情报工作;2002年03期
15 肖延松,孟波,熊德林,杨子晨;基于XML的数据交换在分布式Web系统中的应用[J];计算机系统应用;2002年03期
16 陈洪军,陈新度,陈新,郑德涛;新一代基于知识的工程系统[J];中国机械工程;2002年17期
17 周文生;基于SVG的WebGIS研究[J];中国图象图形学报;2002年07期
18 梅青;用XML技术实现电子对抗仿真的数据共享[J];舰船电子对抗;2002年06期
19 黄润才;基于XML的消息队列[J];上海工程技术大学学报;2002年03期
20 阎慧,李希民,李彩萍;基于XML的WEB安全模型[J];装备指挥技术学院学报;2002年04期
中国重要会议论文全文数据库 前10条
1 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 何震瀛;李建中;王宏志;;XML数据的关系存储[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 丁峰;王煜;姚延涛;沈钧毅;;从XML模式到数据库模式[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
4 谈子敬;施伯乐;;XML导出数据库表的实现与应用[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 罗道峰;孟小峰;;一种面向XML文档的基于角色的扩展访问控制方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 郑骏;王焱;钱卫宁;周傲英;;XML相似相关结构库的构造及其应用[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 吴刚;于亚新;王国仁;于戈;;并行XML文档数据分片技术研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 王静;孟小峰;王珊;;以目标节点为导向的XML路径查询处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
9 王鹏飞;洪晓光;;基于XML大文档的动态索引[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 肖冰;廖湖声;郑玉明;;数据集成系统中的XML延迟处理技术[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国博士学位论文全文数据库 前10条
1 江锦华;XML小枝模式查询处理技术研究[D];浙江大学;2009年
2 秦杰;Web环境中半结构化数据存储与查询技术研究[D];国防科学技术大学;2005年
3 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
4 叶晓峰;基于XML的冲压模具设计知识重用技术研究[D];华中科技大学;2010年
5 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
6 张晨静;XML关键字过滤技术[D];复旦大学;2011年
7 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
8 汪源;XML事务模型及并发控制研究[D];浙江大学;2006年
9 许建军;对结构化和半结构化数据的关键字搜索研究[D];复旦大学;2007年
10 刘喜平;XML文档搜索中的查询处理技术研究[D];江西财经大学;2010年
中国硕士学位论文全文数据库 前10条
1 朱杰;基于主题和结构的XML网页的数据抽取[D];华侨大学;2005年
2 刘靖超;面向数据采集的信息集成系统设计与实现[D];河北工业大学;2005年
3 王旭磊;基于CBR的电子商务网站智能设计系统的研究[D];青岛大学;2005年
4 李志明;基于Web服务的在线考试系统应用研究与实现[D];广东工业大学;2005年
5 江静;基于XML的公文管理系统设计与应用研究[D];南京理工大学;2005年
6 陈美云;基于XML的柔性信息集成技术研究[D];山东科技大学;2005年
7 朱瑜;工作流引擎研究与实现[D];电子科技大学;2005年
8 谢红;XML技术和B/S模式在职业教育与培训管理信息系统中的应用研究[D];重庆大学;2005年
9 郦金花;基于XML的MARC发布系统的设计与实现[D];苏州大学;2005年
10 沈剑沧;XML查询方法研究[D];华东师范大学;2006年
中国重要报纸全文数据库 前10条
1 秦林;《XML完全探索》[N];中华读书报;2001年
2 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年
3 ;分化并不能阻止XML发展[N];中国计算机报;2000年
4 ;为XML标准定标准[N];中国计算机报;2001年
5 IDG电讯;Microsoft、IBM共同制定XML标准[N];计算机世界;2000年
6 北京邮电大学 张剑;XML与HTML的结合(上)[N];计算机世界;2001年
7 本报记者 陆 杰;XML丛林的新秀[N];中华读书报;2002年
8 侯青;国际电子商务XML/EDI特点及现状[N];国际商报;2001年
9 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年
10 北京邮电大学 张剑;XML与HTML的结合(下)[N];计算机世界;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978