收藏本站
《复旦大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于Bloom Filter的路径表达式查询处理

宫学庆  
【摘要】: 近年来,XML语言已经成为了互联网上数据表示和交换事实上的标准。随着Web服务和个性化信息订阅等应用的蓬勃发展,越来越多的信息以XML的格式通过网络被发布和交换。在这些应用中,XML数据以数据流的形式不断地快速到达,而针对XML数据的查询是大量的路径表达式,传统的查询处理技术在性能上已经不能够满足应用的需求。在XML数据流上对大量的路径表达式进行查询处理是科研技术人员所面临的一个新的挑战。 本文围绕XML数据流的查询处理问题展开研究工作,分别探讨了针对简单路径表达式和复杂路径表达式的查询处理技术,提出了新的处理方法,并通过实验验证了所提出方法的有效性和高效性。同时,本文就XML数据流处理引擎的设计进行了探讨,并实现了一个原型系统。论文的主要贡献可以总结为如下几点: ·本文首先提出了将Bloom Filter结构应用于解决XML数据流过滤问题的方法,该方法可以有效地支持对简单路径表达式中的通配符“*”号和后代轴“//”的处理。同时本文设计了前缀过滤的方法,用于减少解析过程中所生成候选路径的数量,提高过滤处理的性能。详尽的对比实验表明,本文提出的方法在创建路由表时的性能和所创建路由表的大小两个方面明显优于已有的处理方法。同时,在查询集很大并且XML文档深度相对较小的情况下,本文提出的方法在过滤性能上也要优于已有的方法。 ·本文提出了将包含有分支结构的复杂路径表达式分解成一组简单路径表达式,在对简单路径表达式进行过滤处理的基础上,实现对复杂路径表达式进行查询处理的方法。与已有的方法不同,本文所提出的方法以简单路径过滤引擎输出的查询字符串流作为输入,可以支持对元素内容约束的处理,同时可以以连续查询(Continuous Queries)的方式实现对复杂路径表达式的查询处理。本文通过实验将所提出的处理方法与已有方法进行了对比,证明该方法在对复杂路径表达式的查询处理上具有较好的性能。 ·本文在简单路径表达式和复杂路径表达式查询处理技术的研究基础之上,设计和实现了一个XML数据流处理引擎——XSTR(XML STReamProcessing Engine)原型系统,并对该系统的实现进行了介绍。XSTR系统可以被作为中间件应用于针对XML数据流进行处理的应用系统中。 综上所述,本文就XML数据流的查询处理技术进行了深入的探讨和研究,提出了不同于已有方法的新的技术和方法,并通过实验对所提方法的有效性进行了验证。本文的研究工作,促进了XML查询处理技术的发展,具有现实的应用价值。
【学位授予单位】:复旦大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:TP311.11

【引证文献】
中国期刊全文数据库 前1条
1 张维刚;徐永东;雷小强;何辉;;Web全文检索中间件的设计与应用[J];计算机应用;2011年08期
【共引文献】
中国期刊全文数据库 前10条
1 郭有强;梁玉清;王磊;姚保峰;朱洪浩;;基于语义相关实体片段的XML关键字查询[J];蚌埠学院学报;2012年01期
2 孙东海;张昱;吴晓勇;;XML流上的XQuery前缀共享查询[J];计算机科学;2007年10期
3 覃泳睿;孙未未;张卓瑶;余平;;基于有限自动机的XML过滤技术研究综述[J];计算机科学;2008年12期
4 樊棠怀;肖贤建;;适应性数据分割[J];南昌大学学报(理科版);2006年01期
5 杨卫东;王清明;施伯乐;;XML流数据查询结果的缓存管理[J];软件学报;2008年08期
6 许峰;张雪洁;李凤生;王志坚;;XML数据集成平台的研究与应用[J];计算机工程与设计;2009年13期
7 张昱;吴年;;一种逐层提升缓冲的XML流查询自动机[J];小型微型计算机系统;2007年03期
8 吴晓勇;张昱;孙东海;;带Order子句的XQuery在XML流上的查询实现[J];小型微型计算机系统;2008年03期
9 陈珂;邵峰;陈刚;郑耀;;XML结构化匹配中的位图过滤加速法[J];浙江大学学报(工学版);2009年09期
10 张晓琳;王虎;刘立新;;XML数据流小枝匹配算法[J];郑州大学学报(理学版);2011年01期
中国重要会议论文全文数据库 前5条
1 黄大科;范智华;;查询集成系统中的一致结果集的建构[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
2 张昱;吴年;;XML数据流的过滤与查询技术[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 谢敏;王小锋;张新;孟小峰;周军锋;;XML数据流上的有序XPath查询处理[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
4 王小锋;张新;谢敏;孟小峰;周军锋;;XML数据流上的关键字查询[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
5 周军锋;孟小峰;张新;黄静;;XML数据流上基于关键字的多查询处理[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
中国硕士学位论文全文数据库 前10条
1 王铮;基于Web的中国式报表动态生成模式的探索与研究[D];东北石油大学;2011年
2 张丽丽;XML文档过滤系统的模型构建与优化[D];山东大学;2011年
3 路皓;XML更新流的XQuery查询处理技术研究[D];内蒙古科技大学;2010年
4 陈向阳;基于结构索引的XML数据流的XPath查询技术研究[D];内蒙古科技大学;2010年
5 付林林;采用流水线方式的XML整体小枝查询算法的研究[D];北京工业大学;2011年
6 王虎;一种基于XML数据流查询算法的设计与实现[D];内蒙古科技大学;2011年
7 万洪莉;基于Web服务的EAI在网络化制造中的应用[D];沈阳工业大学;2004年
8 严梅娟;基于XML的数据集成研究与应用[D];中南大学;2004年
9 黄大科;分布式异构数据源查询与优化[D];清华大学;2004年
10 郑文煜;基于XML的数据集成研究[D];西北大学;2006年
【同被引文献】
中国期刊全文数据库 前10条
1 肖明忠;代亚非;;Bloom Filter及其应用综述[J];计算机科学;2004年04期
2 孙东海;张昱;吴晓勇;;XML流上的XQuery前缀共享查询[J];计算机科学;2007年10期
3 吴晓勇;张昱;孙东海;;XQuery在XML流上查询的结构化连接[J];计算机工程;2008年04期
4 郑仕辉,周傲英,张龙;XML文档的相似测度和结构索引研究[J];计算机学报;2003年09期
5 孙承杰,关毅;基于统计的网页正文信息抽取方法的研究[J];中文信息学报;2004年05期
6 李晓明,凤旺森;两种对URL的散列效果很好的函数[J];软件学报;2004年02期
7 高军,杨冬青,唐世渭,王腾蛟;基于树自动机的XPath在XML数据流上的高效执行[J];软件学报;2005年02期
8 杨卫东;王清明;施伯乐;;针对XML流数据的复杂Twig Pattern查询处理[J];软件学报;2007年04期
9 王宏志;李建中;骆吉洲;;XML数据流上的高效聚集算法[J];软件学报;2008年08期
10 杨卫东;王清明;施伯乐;;XML流数据查询结果的缓存管理[J];软件学报;2008年08期
中国硕士学位论文全文数据库 前1条
1 周登朋;搜索引擎搜索结果的聚类研究[D];上海交通大学;2007年
【二级引证文献】
中国硕士学位论文全文数据库 前2条
1 王毅桐;分布式网络爬虫技术研究与实现[D];电子科技大学;2012年
2 朱艳洁;公交业务数据集成及应用集成研究[D];西安电子科技大学;2013年
【相似文献】
中国期刊全文数据库 前10条
1 吴恒山,吴亚辉,班鹏新;XML查询优化的面向路径可扩展模型[J];华中科技大学学报(自然科学版);2004年03期
2 鲁明羽,陆玉昌;基于OEM模型的半结构化数据的模式抽取[J];清华大学学报(自然科学版);2004年09期
3 李熙;徐德智;;基于模式的XML查询重写研究[J];中国科技信息;2009年12期
4 胡少伟;;XML路径表达式的查询优化技术[J];科学之友(B版);2009年08期
5 车五一;;基于Xpath的XML安全访问控制方法[J];辽宁石油化工大学学报;2007年02期
6 王静,孟小峰,王珊;基于区域划分的XML结构连接[J];软件学报;2004年05期
7 赵东范;一个求有向图路径表达式的算法NNRA[J];吉林大学学报(信息科学版);1991年01期
8 吉凤岗;一种共享资源并发存取控制机制——路径表达式[J];华北电力大学学报;1991年01期
9 姚全珠;丁晓剑;;处理XML文档查询的高效结构连接方法[J];计算机工程;2006年18期
10 范新灿;杨丽娟;;基于路径表达式的XML查询优化模型研究与设计[J];情报杂志;2008年11期
中国重要会议论文全文数据库 前10条
1 肖艳芹;王宇;黄炜;李天柱;;带量词路径表达式计算的优化[A];第十六届全国数据库学术会议论文集[C];1999年
2 方强;王国仁;于戈;郑怀远;;计算路径表达式的并行级联式半连接算法[A];第十六届全国数据库学术会议论文集[C];1999年
3 鲍培明;;XML的语义结构模型设计[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
4 万常选;林大海;;基于X-RESTORE有效地处理XPath路径表达式[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
5 姚建中;孙建伶;姜忠鼎;董金祥;;OSCAR路径表达式的查询处理[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 陈晓苏;邹园斌;张文珂;;全切分图与路径表达式在分词算法中的应用[A];第三届学生计算语言学研讨会论文集[C];2006年
7 王宇;孟小峰;王珊;;Orient-X中的复杂路径表达式求解[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
8 何震瀛;李建中;王春宇;;一种XML数据库的存储结构——ASRX[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 方强;王国仁;于戈;郑怀远;;并行调度路径表达式的代价模型和自适应调度算法[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
10 严梅;郭瑞强;贾晓辉;乐嘉锦;;基于S&V索引的XML文档查询[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国重要报纸全文数据库 前1条
1 北京邮电大学 张剑;XML的显示——XSL样式单(下)[N];计算机世界;2001年
中国博士学位论文全文数据库 前8条
1 路燕;基于多DTD的XML查询技术研究[D];复旦大学;2003年
2 宫学庆;基于Bloom Filter的路径表达式查询处理[D];复旦大学;2006年
3 向桂林;XML引擎研究[D];中国科学院研究生院(文献情报中心);2004年
4 王静;XML路径查询处理关键技术研究[D];中国科学院研究生院(计算技术研究所);2003年
5 刘逸敏;基于访问目的的隐私数据访问控制机制研究[D];复旦大学;2012年
6 李效东;自治异构数据源的集成查询处理[D];中国科学院研究生院(软件研究所);2002年
7 吕腾;XML文档的规范化问题研究[D];复旦大学;2003年
8 吴共庆;基于标签路径特征的Web新闻内容抽取研究[D];合肥工业大学;2012年
中国硕士学位论文全文数据库 前10条
1 白林;基于路径表达式的XML索引查询技术[D];郑州大学;2010年
2 唐红光;基于XPath路径表达式的选择度估算研究[D];中南林业科技大学;2007年
3 韩新超;XML数据的存储和查询的研究[D];燕山大学;2004年
4 沈剑沧;XML查询方法研究[D];华东师范大学;2006年
5 冯林;XML查询处理结构中的一种逻辑优化算法[D];西南大学;2008年
6 张静;Native XML数据库的查询优化研究[D];中国石油大学;2008年
7 段洪秀;一种基于关系数据库的XML文档存储和查询的方法[D];山西大学;2006年
8 王宁;基于前缀编码XML查询新策略的研究[D];山东大学;2008年
9 陈波;XML文档数据查询技术研究[D];山东大学;2005年
10 曾时应;面向生物信息数据的XML存储和查询优化[D];国防科学技术大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026