收藏本站
《郑州大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于路径表达式的XML索引查询技术

白林  
【摘要】: 如何在海量的XML数据中检索到人们需要的信息是当前学者研究的一个热点问题。结构连接是XML查询的核心操作,在对结构连接算法的改进方面有了大量的研究成果。为提高查询效率,研究者引入了索引技术。目前的结构连接算法和索引技术依然存在着一定的问题,还有改进的空间。目前的结构连接算法需要频繁的磁盘O/O操作,XML索引技术存在着存储空间过大的缺点,在实际的应用中,不能完全发挥自身的优势。性能和占用空间大小是一对矛盾,如何采取更好的方式在二者之间达到一个平衡,是值得研究的问题。 本文针对以上问题展开研究,通过建立索引来减少结构连接操作的磁盘访问次数。在查询过程中,针对包含操作过多的情况,减少无用的连接。以提高查询效率。本文工作主要包括以下几点: 首先,本文提出了一种新的索引结构,在标签流的概念上,引入了标签路径,在路径索引中,标签路径和XML路径相结合,在包含操作中,只返回所在标签路径的位置,只经过一次磁盘I/O,就能输出目标节点集合。同时,引入位图,并分析比较了位图更新的代价。该索引需要较少的存储空间,在查询性能上也有良好的表现。 其次,当前的索引大都不能处理包含值谓词的路径表达式,而关键字查询又没有考虑XML的路径信息。本文提出了一种基于实体语义的关键字查询方法,在处理包含谓词的路径表达式时,对相同标签的文本建立索引,采取路径匹配和关键字匹配相结合的方式,提高了查询效率。
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP311.10

【参考文献】
中国期刊全文数据库 前10条
1 曹亮,王茜,卢菁;XML数据在关系数据库中存储和检索的研究和实现[J];东南大学学报(自然科学版);2002年01期
2 刘先锋;朱清华;陈凤英;;支持数据更新的XML编码方案研究[J];计算机工程与应用;2008年33期
3 刘先锋;朱清华;陈凤英;丁继红;;有效支持数据更新的XML索引研究[J];计算机工程与应用;2009年20期
4 蔡飞;贝佳;潘金贵;;一种简单高效的XML与关系数据库信息交换的方法[J];计算机科学;2004年12期
5 万常选,刘云生,徐升华,刘喜平,林大海;基于区间编码的XML索引结构的有效结构连接[J];计算机学报;2005年01期
6 吕建华,王国仁,于戈;XML数据的路径表达式查询优化技术[J];软件学报;2003年09期
7 孔令波;唐世渭;杨冬青;王腾蛟;高军;;XML数据索引技术[J];软件学报;2005年12期
8 孟小峰;王宇;王小锋;;XML查询优化研究[J];软件学报;2006年10期
9 叶飞跃;李霞;张滨;;XML与关系数据库相互转换中的语义约束完整性[J];上海大学学报(自然科学版);2007年05期
10 白治国;徐慧;张霞萍;王楠;郭旺;盛文涛;;基于素数编码Schema的XML索引结构的研究[J];计算机工程与设计;2009年08期
中国博士学位论文全文数据库 前1条
1 王鑫;原生XML数据库存储与索引关键技术研究[D];南开大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 廖湖声;汤林;;基于XQA查询代数的去除相关性方法[J];北京工业大学学报;2009年08期
2 门爱华;;XML数据库模式匹配算法研究[J];赤峰学院学报(自然科学版);2007年05期
3 陈荣鑫;;基于函数式中间语言的XML查询并行化[J];重庆理工大学学报(自然科学);2011年07期
4 兰小机,张书亮,刘德儿,闾国年;GML空间数据库系统研究[J];测绘科学;2005年05期
5 刘文胜,李国和,李洪奇;石油勘探软件集成技术研究[J];测井技术;2005年05期
6 代丽;李晓燕;孙良;;XML与关系型数据库数据转换技术的研究[J];重庆科技学院学报(自然科学版);2010年06期
7 韩旭东;;一种基于非等概率更新的XML区间编码方法[J];电大理工;2008年02期
8 覃遵跃;蔡国民;黄云;;SQL Server 2005查询XML数据优化研究[J];东莞理工学院学报;2008年05期
9 刘荷花;;XML大容量文档查询方法的研究和实验[J];电脑开发与应用;2011年01期
10 向昌成;周相兵;;一种基于Web服务的数据交换组件设计实现[J];电脑知识与技术(学术交流);2007年14期
中国重要会议论文全文数据库 前10条
1 张元平;丁晓明;曾一;林梅;;一种基于第三方的XML数据发布方法[A];2008年计算机应用技术交流会论文集[C];2008年
2 张一鸣;杨喜权;王大勇;;面向XML的搜索引擎及其索引技术[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
3 张怡;肖侬;杨海云;;基于网格的XMLDB共享访问系统[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
4 杜琦;巩政;;基于字符串相似度的自动评分算法实现[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
5 卢佳佳;肖桂荣;;基于地理空间信息元数据的标准符合性测试方案设计[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
6 阎秀美;周亚建;胡正名;;关系型数据库中XML索引技术研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
7 姚美玲;刘贵全;;基于分层的以目标结点为导向的XML枝匹配算法[A];第五届全国信息检索学术会议论文集[C];2009年
8 章悦;高军;王腾蛟;杨冬青;唐世渭;;QBXS:一种基于查询的XML文档存储方法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
9 陆世潮;孟小峰;林灿;王宇;;OrientX中XQuery的导航式实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
10 顾进广;周云;陈莘萌;;基于本体集成的XML查询机制[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国博士学位论文全文数据库 前10条
1 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
2 汪陈应;XML数据编码与存储管理关键技术研究[D];南开大学;2010年
3 蔺旭东;基于语义的XML查询及规范化研究[D];北京交通大学;2010年
4 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
5 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
6 王琦;古代壁画的语义检索技术及应用研究[D];浙江大学;2011年
7 孙宏伟;XML与RDB的多层次双向数据集成技术研究[D];西北工业大学;2003年
8 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
9 左维;基于XML/Web Services的月球探测数据管理与集成技术研究[D];中国科学院研究生院(地球化学研究所);2004年
10 庞引明;基于结构化联接的XML查询模式匹配关键技术研究[D];复旦大学;2004年
中国硕士学位论文全文数据库 前10条
1 吴世汉;面向查询的XML文本摘要技术[D];江西财经大学;2010年
2 张麟;XML数据查询优化技术的研究[D];哈尔滨理工大学;2010年
3 沈春辉;数字图书馆中海量数据存储组织的研究与实现[D];浙江大学;2011年
4 姜浩亮;基于期望信任效益函数的网格作业调度算法的研究与仿真[D];电子科技大学;2010年
5 唐红光;基于XPath路径表达式的选择度估算研究[D];中南林业科技大学;2007年
6 李媛媛;基于XQuery的NXD查询的研究[D];中南林业科技大学;2008年
7 范志起;半结构化数据索引技术的研究[D];吉林大学;2011年
8 黄海峰;基于渠道管理的旅游业系统框架的设计与实现[D];吉林大学;2011年
9 曾庆伟;基于关系数据库的XML查询优化技术研究[D];武汉理工大学;2011年
10 黎军;综合文档语义与用户查询语义的XML关键字查询研究[D];西南大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 路燕;郝忠孝;张亮;;基于编码的XML关系数据库存储[J];计算机研究与发展;2005年11期
2 王鑫;袁晓洁;汪陈应;张海威;;XN-Store:一种原生XML数据库的存储方案[J];计算机研究与发展;2008年07期
3 刘先锋;朱清华;陈凤英;;支持数据更新的XML编码方案研究[J];计算机工程与应用;2008年33期
4 刘振中;董道国;薛向阳;;对XML数据索引的回顾[J];计算机科学;2004年04期
5 蔡飞;贝佳;陶列骏;潘金贵;;基于关系数据库的XQuery查询的实现[J];计算机科学;2004年05期
6 汪陈应;袁晓洁;王鑫;刘众奇;;BSC:一种高效的动态XML树编码方案[J];计算机科学;2008年03期
7 王国仁,于戈,张斌,郑怀远;面向对象数据库系统中的谓词选择率估算[J];计算机学报;1998年S1期
8 万常选,刘云生,徐升华,刘喜平,林大海;基于区间编码的XML索引结构的有效结构连接[J];计算机学报;2005年01期
9 王庆,周俊梅,吴红伟,萧建昌,周傲英;XML文档及其函数依赖到关系的映射(英文)[J];软件学报;2003年07期
10 王静,孟小峰,王珊;基于区域划分的XML结构连接[J];软件学报;2004年05期
【相似文献】
中国期刊全文数据库 前10条
1 马志方;;路径表达式与3型文法之间的等价性[J];计算机研究与发展;1987年06期
2 何炎祥;;实现路径表达式的一种算法[J];计算机科学;1987年05期
3 吉凤岗;;几种路径表达式及其在分布环境下的实现技术[J];计算机工程与应用;1990年Z1期
4 魏东平;张静;刘树涛;;基于匹配的最小化路径表达式的优化方法[J];计算机工程与设计;2008年09期
5 王欣晖;王国仁;于戈;郑怀远;;关于路径表达式的一些问题[J];计算机科学;1999年03期
6 王国仁,于戈,张斌,郑怀远;路径表达式的并行算法研究[J];计算机学报;1999年02期
7 吉凤岗;一种共享资源并发存取控制机制——路径表达式[J];华北电力学院学报;1991年01期
8 曹阳,方强,王国仁,于戈;路径表达式的并行正向指针跟踪算法:设计与性能分析[J];东北大学学报;2000年04期
9 张剑妹;陶世群;段洪秀;;一种基于完整性约束的路径表达式的查询优化策略[J];计算机科学;2006年03期
10 姚全珠;丁晓剑;;处理XML文档查询的高效结构连接方法[J];计算机工程;2006年18期
中国重要会议论文全文数据库 前9条
1 肖艳芹;王宇;黄炜;李天柱;;带量词路径表达式计算的优化[A];第十六届全国数据库学术会议论文集[C];1999年
2 方强;王国仁;于戈;郑怀远;;计算路径表达式的并行级联式半连接算法[A];第十六届全国数据库学术会议论文集[C];1999年
3 陈晓苏;邹园斌;张文珂;;全切分图与路径表达式在分词算法中的应用[A];第三届学生计算语言学研讨会论文集[C];2006年
4 方强;王国仁;于戈;郑怀远;;并行调度路径表达式的代价模型和自适应调度算法[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 王静;孟小峰;王珊;;SUPEX:一种基于模式的XML路径索引[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
6 王宇;孟小峰;王珊;;Orient-X中的复杂路径表达式求解[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
7 姚建中;孙建伶;姜忠鼎;董金祥;;OSCAR路径表达式的查询处理[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
8 何震瀛;李建中;王春宇;;一种XML数据库的存储结构——ASRX[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 万常选;林大海;;基于X-RESTORE有效地处理XPath路径表达式[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
中国博士学位论文全文数据库 前4条
1 朱茂盛;XML路径表达式优化及其查询和过滤计算方法[D];中国科学院研究生院(计算技术研究所);2004年
2 王静;XML路径查询处理关键技术研究[D];中国科学院研究生院(计算技术研究所);2003年
3 宫学庆;基于Bloom Filter的路径表达式查询处理[D];复旦大学;2006年
4 路燕;基于多DTD的XML查询技术研究[D];复旦大学;2003年
中国硕士学位论文全文数据库 前9条
1 曹峰;I-XISS:一种改进的XML文档索引存储方法[D];山西大学;2007年
2 施立晨;基于包含谓词的XML路径表达式的查询处理方法[D];复旦大学;2008年
3 韩新超;XML数据的存储和查询的研究[D];燕山大学;2004年
4 唐红光;基于XPath路径表达式的选择度估算研究[D];中南林业科技大学;2007年
5 吴亚辉;XML数据库面向路径可扩展模型的研究与实现[D];华中科技大学;2004年
6 白林;基于路径表达式的XML索引查询技术[D];郑州大学;2010年
7 沈剑沧;XML查询方法研究[D];华东师范大学;2006年
8 赵九震;XML数据查询的关键技术研究[D];山东大学;2010年
9 张永军;基于路径表达式的多物化视图的增量保持方法的研究[D];山东大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026