收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于二次索引技术的XML查询研究

魏长芳  
【摘要】: XML作为新一代的数据交换标准,在网络上的应用越来越多,由此也产生了大量的XML数据。如何对XML数据进行有效的查询处理成为现在研究的热点。而XML作为半结构化数据具有自定义、可扩展等特性,这些特性对XML数据查询工作造成了一定的困难。 索引作为加速查询处理的一种重要手段,在许多领域中都起着关键性的作用。因此,利用索引来提高数据的查询效率是一种可行的办法,本文在对国内外研究现状进行综合分析的基础上,进一步对XML索引技术进行了深入的研究。 论文对近年来提出的索引方法进行了学习研究,分析了现有索引的特点和优缺点,在此基础上提出了一种根据路径采用不同的索引结构进行查询的方法。该方法根据查询路径有简单路径和分支路径之分,分别采用压缩树索引和哈希编码索引进行处理。 压缩树索引的方法对查询过程中的简单路径表达式进行处理。该方法不仅在组级提供了简洁的路径概要,而且在元素级提供了父子关系的详细连接信息。当元素级映射可以快速的访问一个元素的父节点时,组级可以有效地减少搜索空间。该索引使用基于组的元素引用替换了对元素进行编码,减小了索引所需的空间。同时,引入改进的正排索引和倒排索引加快对元素的判断,更高效的获得索引组中的信息。基于组级的元素作为参考,不仅可以使压缩树根据组聚类成倒排表从而为倒排表和组范围(组一级)的结构索引提供更好的连接,还可以根据组级的元素信息很容易的对不同类型的XML数据进行分类,将相近的元素放在一起以便于索引。基于压缩树的查询处理方法能加速查询分析,并在处理的早期极大地减少搜索空间。 哈希编码索引的主要思想是XML文档中的每一个节点对应索引树中的一个节点,索引树中的非叶子节点存放着该节点在XML文档中的位置,索引树的边存储的是XML文档中父节点到其子节点的路径哈希码。索引树中的叶子节点存放着XML节点的数据。哈希编码路径索引树具有比较好的扩展性,该索引通过存储节点的哈希编码来代替以前索引中存储节点的字符串的方法,从而减少了索引文件所需的存储空间。通过对文档树中节点进行编码,将字符串装换为整数,提高查询速度。该索引引进传统数据库中层次索引的概念,实现了对频繁使用路径的直接存取。 本文提出了一种层次索引的方法,根据路径表达式的具体情况以及表达式使用的频率不同而采用不同的索引方式,通过多级索引提高检索的效率。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 贺玲,吴玲达,蔡益朝;基于内容图像检索中的索引技术[J];计算机应用研究;2005年11期
2 王猛;张明;;基于内容的图像检索中多维索引技术研究[J];现代计算机(专业版);2010年05期
3 卢佳,宋余庆,金华,周成兵;图像数据库索引技术的研究与探讨[J];计算机工程与设计;2005年07期
4 曾倩;金敏;;基于道路分布的移动对象动态组合索引方法[J];计算机应用;2008年12期
5 张延玲;李琪;姜保庆;;移动对象轨迹索引技术研究[J];地理空间信息;2009年01期
6 陈继东;胡志智;孟小峰;王凌;;一种基于城市交通网络的移动对象全时态索引[J];计算机研究与发展;2007年06期
7 谢宇斌;唐启涛;;建立中小型高效快速的模糊查询[J];电脑知识与技术;2011年16期
8 王菲;数据仓库中数据组织和管理的研究[J];情报科学;2002年07期
9 高博;;索引[J];计算机教与学;2002年Z1期
10 胡九龙,赵捧未;数据检索中索引技术研究[J];科技情报开发与经济;2004年01期
11 李新英,韩南;数据检索中索引技术的探讨[J];黄冈师范学院学报;2004年06期
12 胡必鑫,杜友福,肖晓玲;基于直方图小波变换的图像颜色特征索引技术[J];长江大学学报(自然科学版);2004年Z1期
13 周勇,何建农,涂平;自动调配的层次网格空间索引技术[J];计算机应用;2005年06期
14 文学军;高校图书馆全文数据库索引策略[J];湖南城市学院学报;2005年01期
15 杨科华;张伟;;一种基于多层次链的Data Cube维层次编码[J];湖南大学学报(自然科学版);2007年09期
16 唐华姣;何友全;徐小乐;徐澄;;基于Lucene的分布式并行索引[J];计算机技术与发展;2011年02期
17 赵才昌,邓永富;论现代索引方式[J];曲靖师范学院学报;2005年03期
18 梁艳红;宛文红;兰天;;Internet信息检索的现状分析与前景展望[J];冶金信息导刊;2007年03期
19 罗景;涂新辉;;基于概率潜在语义分析的中文信息检索[J];计算机工程;2008年02期
20 陈建斌;马延敏;韩文娟;姬渊;;嵌入式环境下基于PDB的空间数据索引技术[J];海洋测绘;2008年05期
中国重要会议论文全文数据库 前10条
1 冯皓月;周敏子;杨晓明;汪卫;施伯乐;杨根兴;;多层安全数据库上的索引技术[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
2 周项敏;王国仁;于戈;;度量空间中索引方法的研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 吕建华;周巍;孙冰;王国仁;于戈;;XML查询中RPE索引技术研究[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
4 严梅;郭瑞强;贾晓辉;乐嘉锦;;基于S&V索引的XML文档查询[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
5 陶剑文;丁佩芬;赵杰煜;;csgIndex:一种可扩展的对比子图索引模型[A];第二十七届中国控制会议论文集[C];2008年
6 吕建华;王国仁;张斌;于戈;郑怀远;;有序集合上的一种索引技术[A];第十五届全国数据库学术会议论文集[C];1998年
7 黄海;薛永生;林丽;任仲晟;周晓丹;;RD-IL:一种基于XML Twig查询的新索引技术[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
8 汤娜;汤庸;刘小玲;吉永杰;;一种基于扩展时态XML模型的索引技术(英文)[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
9 乔磊;石冰;赵林;;TF&B索引:一种基于结构摘要思想的时态XML索引[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
10 彭峰云;彭智勇;;基于数字指纹的大规模DNA序列索引的永存方法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
中国博士学位论文全文数据库 前10条
1 张硕;图数据库查询处理技术的研究[D];哈尔滨工业大学;2010年
2 张硕;图数据库查询处理技术的研究[D];哈尔滨工业大学;2010年
3 崔江涛;高维索引技术中向量近似方法研究[D];西安电子科技大学;2005年
4 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
5 曹玉东;图像检索中的特征表示和索引方法的研究[D];北京邮电大学;2011年
6 黄健美;高维数据索引及其查询处理技术研究[D];东北大学;2009年
7 曹玉东;图像检索中的特征表示和索引方法的研究[D];北京邮电大学;2011年
8 向桂林;XML引擎研究[D];中国科学院研究生院(文献情报中心);2004年
9 向小岩;闪存数据库若干关键问题研究[D];中国科学技术大学;2009年
10 曲吉林;时间序列挖掘中索引与查询技术的研究[D];天津大学;2006年
中国硕士学位论文全文数据库 前10条
1 魏长芳;基于二次索引技术的XML查询研究[D];中国石油大学;2010年
2 洪佳;OLAP系统的查询性能研究[D];天津工业大学;2007年
3 张河;组态实时数据库索引机制的研究与实现[D];中南大学;2008年
4 曾传军;基于索引技术的情报业务系统的应用研究[D];广东工业大学;2012年
5 马小琴;移动环境中数据广播调度与索引技术研究[D];西南大学;2010年
6 朱暾;基于模式的XML索引技术研究[D];西南交通大学;2011年
7 杨思箫;DWMS中列存储索引技术的研究与改进[D];东华大学;2012年
8 李彬;医学影像资源检索平台中索引技术研究[D];沈阳工业大学;2011年
9 谢谏;基于Lucene的XML索引与检索[D];华南理工大学;2012年
10 黄河;一种移动对象索引的研究与实现技术[D];华中科技大学;2007年
中国重要报纸全文数据库 前10条
1 中国人民大学信息学院 孟小峰 丁治明;让数据跟随你移动[N];计算机世界;2001年
2 张亚斌实习生 张华;南充市民挑战两千年传统汉字索引法[N];南充日报;2008年
3 李凯;中立星助力电信增值服务[N];通信产业报;2006年
4 陈洪康 郭宝群 李雪梅;Sybase海量数据存储浅谈[N];人民邮电;2001年
5 郑杏果;Pocaca:垂直商务搜索异军突起[N];中国计算机报;2006年
6 ;商务智能接触[N];中国计算机报;2004年
7 北京 Mike.Zq;曙光在前方[N];中国电脑教育报;2007年
8 凌曼文;绿色握手[N];中国计算机报;2007年
9 许泳;Sybase倾力打造“三架马车”[N];计算机世界;2008年
10 本报记者 张广彬;Teradata眼中的IA-64和存储[N];计算机世界;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978