收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于正则路径表达式的XML查询优化技术的研究与实现

陈继明  
【摘要】:近几年来,随着网络技术的飞速发展,XML(Extensible Markup Language)已经成为因特网上数据表示和数据交换的新标准,受到越来越多的关注。XML是一种半结构化数据,和传统数据库在数据模式上有所不同,不能直接使用传统的数据库技术进行处理。因此,随着XML查询语言与存储机制研究的日趋成熟,如何提高查询时的效率,实现查询优化成了一个亟待解决的问题。 本文首先对国内外XML查询及其优化技术的研究现状进行了综述,然后分析了现有的基于正则路径表达式的XML查询技术的特点,指出了该技术研究中存在的一些有待完善的问题。为了解决这些问题,本文以有限状态自动机为研究基础,提出了一种高效的查询重写方法,即利用物化的半结构化视图来重写用户查询的方法,以提高查询效率。最后本文设计并实现了一个XML查询处理原型系统。本文的主要工作包括: (1) 提出了视图索引技术。该技术首先对视图集中的每一个视图提取特征值,然后根据此特征值构建立一个视图索引。当对查询进行重写时,通过对此索引进行检索,可以有效地提高查找用于重写的有效视图的效率。 (2) 提出了局部查询重写技术。针对有效视图不能对查询进行完全重写,只能对某个局部实现重写的情况,本文提出了利用视图对查询局部进行替换的方法,从而能够充分地利用视图中的信息,提高查询效率,实现查询优化。 (3) 基于上述的查询优化技术,设计并实现了一种高效的XML查询处理原型系统。该系统由cache管理与查询处理两个子系统构成,对于用户给出的查询,先利用cache中的视图进行查询优化处理,然后计算查询结果。此外,还设计了两组测试方案对系统进行测试,并通过结果分析,来验证本文提出的XML查询优化技术的可行性和有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 蒋桂梅,宋阳秋;XML查询语言XQuery及其查询优化[J];福建电脑;2005年08期
2 温华菁;陈红娟;;基于XML进行Web数据挖掘浅析[J];商场现代化;2009年04期
3 文必龙;王瑞;姚建蓬;黄俊莲;;一种Excel数据到结构化数据的转换方法[J];佳木斯大学学报(自然科学版);2006年03期
4 王晓东;江元;徐超;;XML技术在Web数据挖掘中的应用[J];中国科技信息;2008年18期
5 庄毅,徐海力;半结构化数据与关系数据的比较研究[J];计算机与现代化;2004年01期
6 韩京宇;徐立臻;董逸生;;Web数据仓库研究综述[J];计算机科学;2004年11期
7 张荣富;;XML在Web数据挖掘技术中的应用相关问题探索[J];现代经济信息;2010年02期
8 严亚兰;基于Web环境的半结构化数据模型研究[J];中国图书馆学报;2003年04期
9 赵威;;XML代数查询优化研究[J];黑龙江科技信息;2008年01期
10 胡少伟;;XML路径表达式的查询优化技术[J];科学之友(B版);2009年08期
11 赵威;闫飞;;XML文件树状路径查询优化研究[J];计算机与信息技术;2007年12期
12 色菲;王佳;潘超;;基于XML描述的WEB信息抽取技术研究[J];科技信息(科学教研);2007年34期
13 王金玲;;XML数据库的数据存储方法分析[J];赤峰学院学报(自然科学版);2008年01期
14 李熙;徐德智;;基于模式的XML查询重写研究[J];中国科技信息;2009年12期
15 许斗,陈恩红;XML的半结构化数据表示方法及其在医学文档处理中的应用[J];计算机工程;2002年01期
16 邹国华;;对XML存取的研究与实现[J];科技广场;2005年12期
17 沈艺;基于XML的信息存储与检索[J];计算机系统应用;2002年08期
18 徐占鹏;杨树杰;;基于前缀编码的模型映射改进方法研究[J];科技风;2008年04期
19 曾桢;;XML在关系数据库中的存储检索研究[J];贵州教育学院学报;2008年09期
20 孙天翔;;基于前缀编码的模型映射改进方法研究[J];硅谷;2009年02期
中国重要会议论文全文数据库 前10条
1 吕建华;王国仁;于戈;;XML数据的存储、索引和查询优化技术及其性能评价[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 杨良怀;唐世渭;王爱华;杨冬青;;XML代数及其查询优化方案[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 ;基于DTD的XML路径表达式查询优化(英文)[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 岳昆;吴益忠;王晓玲;周傲英;;基于转换技术的XML文档规范化及更新[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 郭瑞强;苏仕云;乐嘉锦;;XML数据的存储模式研究[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
6 吴刚;于亚新;王国仁;于戈;;并行XML文档数据分片技术研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 郑骏;王焱;钱卫宁;周傲英;;XML相似相关结构库的构造及其应用[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 傅珊珊;雷庆;吴扬扬;;从XML到关系数据模型的映射[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
9 张晓琳;谭跃生;张军;王国仁;;面向对象XML查询代数研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
10 赵文兵;杨冬青;廖湖声;;关键字在XML模式中的结构特征研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国博士学位论文全文数据库 前10条
1 秦杰;Web环境中半结构化数据存储与查询技术研究[D];国防科学技术大学;2005年
2 许建军;对结构化和半结构化数据的关键字搜索研究[D];复旦大学;2007年
3 江锦华;XML小枝模式查询处理技术研究[D];浙江大学;2009年
4 蒋涛;分段时序查询优化方法研究[D];华中科技大学;2010年
5 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
6 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
7 孙涛;面向半结构化数据的数据模型和数据挖掘方法研究[D];吉林大学;2010年
8 王秉卿;基于机器学习的查询优化研究[D];复旦大学;2012年
9 郑淑丽;Web信息集成系统及查询优化方法研究[D];合肥工业大学;2003年
10 王鑫印;无结构和半结构信息检索相关技术研究[D];复旦大学;2007年
中国硕士学位论文全文数据库 前10条
1 陈继明;基于正则路径表达式的XML查询优化技术的研究与实现[D];江苏大学;2005年
2 赵一雪;基于XML数据库的数据查询优化的研究[D];哈尔滨工程大学;2006年
3 胡鑫;基于关系数据库的XML查询优化技术研究[D];西北师范大学;2006年
4 王慜;基于PAT代数的XML数据查询优化方法研究[D];兰州理工大学;2011年
5 任辉;XML数据到关系数据映射的研究[D];安徽理工大学;2006年
6 张仕;XML数据管理系统的研究与实现[D];南京航空航天大学;2003年
7 王瑞;半结构化数据集成技术研究[D];大庆石油学院;2007年
8 曾庆伟;基于关系数据库的XML查询优化技术研究[D];武汉理工大学;2011年
9 陈龙;基于WEB信息抽取的企业竞争情报系统研究[D];合肥工业大学;2007年
10 李劲秋;基于主机的银行业务系统的实现与查询优化的研究[D];电子科技大学;2010年
中国重要报纸全文数据库 前10条
1 秦林;《XML完全探索》[N];中华读书报;2001年
2 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年
3 ;分化并不能阻止XML发展[N];中国计算机报;2000年
4 ;为XML标准定标准[N];中国计算机报;2001年
5 IDG电讯;Microsoft、IBM共同制定XML标准[N];计算机世界;2000年
6 北京邮电大学 张剑;XML与HTML的结合(上)[N];计算机世界;2001年
7 本报记者 陆 杰;XML丛林的新秀[N];中华读书报;2002年
8 侯青;国际电子商务XML/EDI特点及现状[N];国际商报;2001年
9 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年
10 北京邮电大学 张剑;XML与HTML的结合(下)[N];计算机世界;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978