收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于XPath路径表达式的选择度估算研究

唐红光  
【摘要】:随着互联网新技术的发展,网络服务和信息交换等应用大规模出现。由于网络数据的异种性和异构性,就急需一套统一的数据表示和数据交换的标准。前扩展标记语言(eXtensible Markup Language, XML)及时解决了这个问题。XML是由万维网协会(World Wide Web Consortium, W3C)制定的用来描述数据信息的一种标准语言。它具有良好的平台无关性和自描述能力,XML逐渐成为网络中表示数据和交换数据的基本格式。近年来,XML数据量指数级的增长,准确、高效地查询XML数据成为目前的一个研究热点问题。路径是XML数据的一个重要属性,在XML查询优化研究中,关于路径表达式选择性代价估计是一个重要的研究领域,如何根据路径表达式,特别是复杂路径表达式来完善XML查询优化,提高查询效率是XML查询优化的核心问题。 本文在分析比较了现有路径表达式的选择度估算方法的基础上,以树型XML为数据模型,XPath为查询语言,结合XML数据结构和XPath路径表达式的特点,研究了一种基于XPath路径表达式的选择度估算方法,主要内容包括以下: 1.分析研究了几种典型的以获得和维护XML统计信息的方法为线索的路径表达式选择度估算方法,并对它们之间的性能进行了综合比较。 2.根据XPath路径表达式中谓词所含条件,结合XML数据结构,从结构和条件两方面对XPath路径表达式进行标记,把XPath路径表达式转换为标记路径表达式,并用算法实现了对XPath路径表达式的标记,处理后的表达式比原来的表达式更加简洁,语义清楚,便于存储。 3.根据XPath查询返回的结果大小和XPath路径表达式所对应的标记路径表达式为XML查询处理器构建统计信息表,根据该统计信息表对XML路径表达式进行选择度估算;最后针对DBLP和Xmark两个数据集,进行了实验测试,并与采用路径树(Path Tree)和马尔科夫表(Markov Table)的路径表达式选择度估算方法进行了估算误差的比较,论证了该方法的可行性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吴恒山,吴亚辉,班鹏新;XML查询优化的面向路径可扩展模型[J];华中科技大学学报(自然科学版);2004年03期
2 鲁明羽,陆玉昌;基于OEM模型的半结构化数据的模式抽取[J];清华大学学报(自然科学版);2004年09期
3 李熙;徐德智;;基于模式的XML查询重写研究[J];中国科技信息;2009年12期
4 胡少伟;;XML路径表达式的查询优化技术[J];科学之友(B版);2009年08期
5 车五一;;基于Xpath的XML安全访问控制方法[J];辽宁石油化工大学学报;2007年02期
6 王静,孟小峰,王珊;基于区域划分的XML结构连接[J];软件学报;2004年05期
7 赵东范;一个求有向图路径表达式的算法NNRA[J];吉林大学学报(信息科学版);1991年01期
8 吉凤岗;一种共享资源并发存取控制机制——路径表达式[J];华北电力大学学报;1991年01期
9 姚全珠;丁晓剑;;处理XML文档查询的高效结构连接方法[J];计算机工程;2006年18期
10 范新灿;杨丽娟;;基于路径表达式的XML查询优化模型研究与设计[J];情报杂志;2008年11期
11 李效东,顾毓清;基于DOM的Web信息提取[J];计算机学报;2002年05期
12 王宁;董国庆;;一种利用前缀编码高效XML查询的策略[J];山东大学学报(理学版);2007年11期
13 黄泽谦;彭智勇;李越;彭煜玮;;一种支持对象代理数据库高效查询处理的索引结构[J];计算机学报;2010年08期
14 路燕,张亮,段起阳,施伯乐;一种基于DTD的XML索引方法[J];计算机研究与发展;2005年01期
15 曹建英;;基于路径表达式的XML查询优化方法[J];陇东学院学报(自然科学版);2005年02期
16 沈剑沧;鲍培明;;XML在图书查询系统中的实现技术[J];现代图书情报技术;2006年10期
17 沈剑沧;鲍培明;;XML查询方法的设计与研究[J];计算机工程;2007年21期
18 范新灿;;XML查询优化模型XQO的研究设计[J];计算机工程与应用;2009年19期
19 张剑妹;陶世群;梁吉业;;XML结构完整性约束下的路径表达式的最小化[J];软件学报;2009年11期
20 任家东;尹晓鹏;郭晓丹;;一种新的基于划分的结构连接算法[J];计算机工程;2007年06期
中国重要会议论文全文数据库 前10条
1 肖艳芹;王宇;黄炜;李天柱;;带量词路径表达式计算的优化[A];第十六届全国数据库学术会议论文集[C];1999年
2 方强;王国仁;于戈;郑怀远;;计算路径表达式的并行级联式半连接算法[A];第十六届全国数据库学术会议论文集[C];1999年
3 鲍培明;;XML的语义结构模型设计[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
4 万常选;林大海;;基于X-RESTORE有效地处理XPath路径表达式[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
5 姚建中;孙建伶;姜忠鼎;董金祥;;OSCAR路径表达式的查询处理[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 陈晓苏;邹园斌;张文珂;;全切分图与路径表达式在分词算法中的应用[A];第三届学生计算语言学研讨会论文集[C];2006年
7 王宇;孟小峰;王珊;;Orient-X中的复杂路径表达式求解[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
8 何震瀛;李建中;王春宇;;一种XML数据库的存储结构——ASRX[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 方强;王国仁;于戈;郑怀远;;并行调度路径表达式的代价模型和自适应调度算法[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
10 严梅;郭瑞强;贾晓辉;乐嘉锦;;基于S&V索引的XML文档查询[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国博士学位论文全文数据库 前8条
1 路燕;基于多DTD的XML查询技术研究[D];复旦大学;2003年
2 宫学庆;基于Bloom Filter的路径表达式查询处理[D];复旦大学;2006年
3 向桂林;XML引擎研究[D];中国科学院研究生院(文献情报中心);2004年
4 王静;XML路径查询处理关键技术研究[D];中国科学院研究生院(计算技术研究所);2003年
5 刘逸敏;基于访问目的的隐私数据访问控制机制研究[D];复旦大学;2012年
6 李效东;自治异构数据源的集成查询处理[D];中国科学院研究生院(软件研究所);2002年
7 吕腾;XML文档的规范化问题研究[D];复旦大学;2003年
8 吴共庆;基于标签路径特征的Web新闻内容抽取研究[D];合肥工业大学;2012年
中国硕士学位论文全文数据库 前10条
1 白林;基于路径表达式的XML索引查询技术[D];郑州大学;2010年
2 唐红光;基于XPath路径表达式的选择度估算研究[D];中南林业科技大学;2007年
3 韩新超;XML数据的存储和查询的研究[D];燕山大学;2004年
4 沈剑沧;XML查询方法研究[D];华东师范大学;2006年
5 冯林;XML查询处理结构中的一种逻辑优化算法[D];西南大学;2008年
6 张静;Native XML数据库的查询优化研究[D];中国石油大学;2008年
7 段洪秀;一种基于关系数据库的XML文档存储和查询的方法[D];山西大学;2006年
8 王宁;基于前缀编码XML查询新策略的研究[D];山东大学;2008年
9 陈波;XML文档数据查询技术研究[D];山东大学;2005年
10 曾时应;面向生物信息数据的XML存储和查询优化[D];国防科学技术大学;2005年
中国重要报纸全文数据库 前1条
1 北京邮电大学 张剑;XML的显示——XSL样式单(下)[N];计算机世界;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978