收藏本站
《复旦大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

XML索引和过滤查询若干关键技术研究

雷向欣  
【摘要】:XML(eXtensible Markup Language)作为网络数据交换和信息集成的工具,以其自描述性、跨平台交换性等特点,成为新一代的网络语言。互联网上越来越多的结构化或半结构化的数据采用XML格式存储和交换,对XML数据的索引及过滤查询研究显得日益重要。 本文根据XML数据的自身特点和当前实际应用需求,就索引和过滤查询的一些关键技术进行了研究,具体包括XML文档索引查询技术研究、XML文档树节点编码研究、遵循不同模式XML数据集索引模型、集群式XPath查询优化、XML数据过滤查询技术研究、XML文档索引和过滤查询原型系统的实现等方面,所做的工作和取得的创新成果体现在以下五个方面: 1) 基于互关联后继树的XML文档索引技术研究 基于叶序区间编码方法(LOINS)与互关联后继树模型(IRST)为节点带有名称(标签)的根树建立索引模型。结合IRST的标引性、可压缩性等特点,本文提出了基于IRST的根树索引模型IsBaRTI-Ⅰ,及该模型的空间优化模型IsBaRTI-Ⅱ。IsBaRTI-Ⅰ,Ⅱ采用树节点名称(标签)及其在根树(XML文档树)中的出现计数索引节点间的父子关系和节点叶序区间编码,实现索引结构和节点编码的相互统一。理论和实验证明,在对XML路径表达式的查询处理中,和以往同类索引模型相比,IsBaRTI-Ⅰ,Ⅱ索引建立时间、空间代价小,而且可快速查询满足XPath表达式在XML文档树中的节点序列和路径。 2) XML文档树节点叶序区间动态编码研究 在XML索引上采用树节点编码可快速判断树节点间的前后代关系,树节点编码代价影响着索引的空间代价和驻留内存空间的难易程度。区别于以往同类索引模型研究仅仅注重提高查询效率的片面性,本文针对Web上XML文档特点,就本文索引技术中的树节点叶序区间编码和其它树节点编码方法,如:顺序标识区间编码、前缀编码等进行比较。相比其它树节点编码方法,本文提出的叶序区间编码方法编码长度代价小、编码灵活机动性强(可通过IsBaRTI-Ⅱ在索引结构中动态查找)。我们提出的根树索引模型IsBaRTI-Ⅱ动态查找叶序区间编码的平均时间代价随着S/H(S为根树Tr节点出度;H为Tr高度)递增而递减且趋近于1,而Web上XML文档树普遍具有的SH的特点为基于IsBaRTI-Ⅱ实现的XML索引模型动态查找叶序区间编码提供了实际应用可行性。就树节点叶序区间编码的维护,本文提出了基于XML模式扩展叶序区间编码的方法,降低XML文档树节点插入时的索引中节点编码维护代价,为基于叶序区间编码的XML索引模型提供了编码维护方案。
【学位授予单位】:复旦大学
【学位级别】:博士
【学位授予年份】:2005
【分类号】:TP311.13

【引证文献】
中国期刊全文数据库 前1条
1 王竞原;胡运发;葛家翔;;XPath中的文本查询研究[J];计算机工程;2007年11期
中国博士学位论文全文数据库 前1条
1 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
【参考文献】
中国期刊全文数据库 前2条
1 谈子敬,庞引明,施伯乐;XML上的函数依赖推理[J];软件学报;2003年09期
2 吕建华,王国仁,于戈;XML数据的路径表达式查询优化技术[J];软件学报;2003年09期
【共引文献】
中国期刊全文数据库 前10条
1 兰小机,张书亮,刘德儿,闾国年;GML空间数据库系统研究[J];测绘科学;2005年05期
2 刘文胜,李国和,李洪奇;石油勘探软件集成技术研究[J];测井技术;2005年05期
3 胡小明,陈子阳,高翔,刘国华;基于树元组的函数依赖推理规则[J];燕山大学学报;2005年01期
4 陈子阳;基于DTD路径编码的XML逻辑蕴涵问题研究[J];燕山大学学报;2005年05期
5 荣凌燕;刘国华;沈兵红;;基于树元组的XML文档中的多值依赖[J];燕山大学学报;2006年03期
6 陈子阳;;XML函数依赖集的逻辑蕴含[J];燕山大学学报;2006年05期
7 刘荷花;;XML大容量文档查询方法的研究和实验[J];电脑开发与应用;2011年01期
8 张麟;郝忠孝;;基于XML Schema的Xpath查询优化[J];电脑知识与技术;2009年29期
9 刘世茹;Native XML事务处理机制研究[J];贵州大学学报(自然科学版);2005年03期
10 刘荷花;;WNXD数据库存储策略的研究和实现[J];重庆大学学报;2011年12期
中国重要会议论文全文数据库 前6条
1 杨喜权;张博;;基于规范化结构树的XML文档相似性度量[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
2 荣凌燕;刘国华;沈兵红;李现伟;;基于树元组的XML多值依赖推理[A];2006年全国理论计算机科学学术年会论文集[C];2006年
3 顾进广;周云;陈莘萌;;基于本体集成的XML查询机制[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
4 张忠平;;XML多值依赖蕴涵算法研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 荣凌燕;聂俊岚;刘国华;;XML多值依赖的成员籍问题研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
6 赵相国;王国仁;张恩德;丁大斌;霍欢;;XML函数依赖的定义及分析[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
中国博士学位论文全文数据库 前10条
1 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
2 庞引明;基于结构化联接的XML查询模式匹配关键技术研究[D];复旦大学;2004年
3 张忠平;基于约束的XML数据库模式规范化研究[D];复旦大学;2004年
4 李瑞轩;异构信息集成中的查询处理与优化研究[D];华中科技大学;2004年
5 秦杰;Web环境中半结构化数据存储与查询技术研究[D];国防科学技术大学;2005年
6 孙伟;XML数据库查询优化及相关技术研究[D];哈尔滨工程大学;2006年
7 张晓琳;面向对象的XML数据管理技术研究[D];东北大学;2006年
8 朱茂盛;XML路径表达式优化及其查询和过滤计算方法[D];中国科学院研究生院(计算技术研究所);2004年
9 王桐;XML内容路由关键技术研究[D];哈尔滨工程大学;2006年
10 丘宏俊;基于知识的飞机装配工艺设计关键技术研究[D];西北工业大学;2006年
中国硕士学位论文全文数据库 前10条
1 白林;基于路径表达式的XML索引查询技术[D];郑州大学;2010年
2 张麟;XML数据查询优化技术的研究[D];哈尔滨理工大学;2010年
3 李媛媛;基于XQuery的NXD查询的研究[D];中南林业科技大学;2008年
4 刘洋;Web服务门户服务器的设计与实现[D];吉林大学;2004年
5 杨玲贤;基于Ontology的非结构化信息访问机制研究[D];武汉科技大学;2004年
6 李延东;基于关系数据库的XQuery查询处理研究[D];重庆大学;2004年
7 张辉;基于代理的信息集成框架的研究[D];华中科技大学;2004年
8 王齐;一种基于文本节点的XML文档索引和查询方法[D];山西大学;2005年
9 边爽;智能异构数据集成系统中性能优化方法的研究[D];大连海事大学;2005年
10 丁晓剑;对大信息量XML文档查询方法的研究[D];西安理工大学;2006年
【同被引文献】
中国期刊全文数据库 前10条
1 李新叶;苑津莎;;一种快速的XML语义检索算法[J];电子学报;2007年11期
2 胡勤友,胡运发;基于扩展路径表达式的XML查询[J];计算机研究与发展;2003年05期
3 高军,杨冬青,王腾蛟,唐世渭;一种XML数据流之上持续查询执行器的增量维护方法[J];计算机研究与发展;2005年05期
4 金鑫;金远平;;一种改进的基于约束关系的XML查询重写算法研究[J];计算机研究与发展;2007年05期
5 姚佳丽;张坤龙;王珊;;基于P2P的数据索引与查询[J];计算机科学;2005年03期
6 徐德智,吴敏;XML自动机的构造及实用化研究[J];计算机学报;2003年04期
7 王国仁;于勇前;孙冰;;利用自动机高效处理XML路径表达式查询[J];计算机学报;2007年09期
8 朱茂盛,许英华;一种新的基于有限自动机的XML过滤方法[J];计算机工程;2004年24期
9 高军,杨冬青,唐世渭,王腾蛟;一种基于DTD的XPath逻辑优化方法[J];软件学报;2004年12期
10 高军,杨冬青,唐世渭,王腾蛟;基于树自动机的XPath在XML数据流上的高效执行[J];软件学报;2005年02期
中国博士学位论文全文数据库 前10条
1 张忠平;基于约束的XML数据库模式规范化研究[D];复旦大学;2004年
2 徐德智;XML数据库查询及其模式集成研究[D];中南大学;2004年
3 孙伟;XML数据库查询优化及相关技术研究[D];哈尔滨工程大学;2006年
4 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
5 朱茂盛;XML路径表达式优化及其查询和过滤计算方法[D];中国科学院研究生院(计算技术研究所);2004年
6 王静;XML路径查询处理关键技术研究[D];中国科学院研究生院(计算技术研究所);2003年
7 梁作鹏;面向Web的XML检索关键技术研究[D];东南大学;2005年
8 王桐;XML内容路由关键技术研究[D];哈尔滨工程大学;2006年
9 韩忠明;基于XML的数据查询和信息检索集成化系统研究[D];东华大学;2006年
10 刘洪星;基于XUML的XML模式设计方法[D];华中科技大学;2006年
中国硕士学位论文全文数据库 前1条
1 崔敏;基于lazyDFA的XML数据流查询处理及优化技术研究[D];内蒙古科技大学;2008年
【二级引证文献】
中国期刊全文数据库 前5条
1 李静;周绯菲;;基于XML文档DTD的展开递归节点算法[J];燕山大学学报;2009年02期
2 李静;杨永涛;刘凤奇;;基于递归安全视图的XML查询重写算法[J];广西师范大学学报(自然科学版);2008年04期
3 陆培军;;Xpath注入攻击及其防御技术研究[J];计算机与信息技术;2009年Z1期
4 李静;;基于XPath的XML查询重写算法[J];计算机工程;2009年10期
5 麻风梅;;基于XML的高校信息集成平台的研究[J];现代电子技术;2010年08期
中国硕士学位论文全文数据库 前5条
1 姜仕田;基于Web Service的电子政务集成应用与研究[D];武汉理工大学;2008年
2 贺挺;面向水利应用网格的数据中心设计与开发[D];西安理工大学;2010年
3 皮立才;NAS资源管理系统研究[D];华中科技大学;2009年
4 李义国;基于不完全约束的XML查询处理关键技术研究[D];燕山大学;2010年
5 崔健;基于XML数据的关键字查询算法研究[D];燕山大学;2012年
【二级参考文献】
中国期刊全文数据库 前1条
1 王国仁,于戈,张斌,郑怀远;面向对象数据库系统中的谓词选择率估算[J];计算机学报;1998年S1期
【相似文献】
中国期刊全文数据库 前10条
1 刘辛;王洪峰;;使用SQL Server2000和XML构建松散耦合的系统[J];煤炭技术;2011年07期
2 唐圣潘;周肆清;丁长松;;基于SAAS模式的共享模型的数据扩展技术研究[J];计算机技术与发展;2011年08期
3 梁娟;陈智;;一种基于XML的Web内容挖掘预处理方法[J];计算机时代;2011年06期
4 梅良刚;左保河;李嘉炎;;基于XML交互协议的LED终端及广告发布平台[J];计算机应用与软件;2011年09期
5 何美琦;;医院图书馆模式初探[J];图书馆界;2011年03期
6 友文;;让老本用上SRS音效驱动[J];电脑知识与技术(经验技巧);2011年06期
7 阿龙;;让华硕老本电池焕发活力[J];电脑知识与技术(经验技巧);2011年06期
8 杜志强;董方;;基于XML的网络课程资源元数据共享研究[J];天中学刊;2011年02期
9 王显燕;;基于信息资源共享的图书馆联盟运作模式探析[J];黑河学刊;2011年08期
10 李恒;;元数据管理系统的研究与实现[J];电脑知识与技术;2011年13期
中国重要会议论文全文数据库 前10条
1 贾静;廖鸿志;孙兴平;周华;;ArchDL:基于XML的软件体系结构描述框架与模式[A];2008年计算机应用技术交流会论文集[C];2008年
2 包小源;宋再生;唐世渭;杨冬青;王腾蛟;;SuffIndex——一种基于后缀树的XML索引结构[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 李智;唐常杰;栾江;汪锐;贾晓兵;;基于索引的XML数据流的变化检测[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
4 王鹏飞;洪晓光;;基于XML大文档的动态索引[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 陈波;洪晓光;;基于改进树状结构的XML文档简单路径查询多线程实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
6 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
7 张昱;吴年;;XML数据流的过滤与查询技术[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
8 张龙;周傲英;郑仕辉;梁宇奇;;一种可行的层次型XML仓库索引结构[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
9 宗金良;李玉忱;任磊;;一种基于XN-Tree编码的XML数据库索引技术[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
10 李慧婷;李建中;王宏志;骆吉洲;;XML数据磁盘存储结构LDF&B及其查询处理方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
中国重要报纸全文数据库 前10条
1 单士兵;体彩“自肥模式”当休矣[N];中国经济导报;2005年
2 早报记者 俞佳;中美望效“中欧模式”[N];东方早报;2005年
3 CPW执行总编 关健;“模式样板”时代的终结[N];电脑商报;2005年
4 本报记者 魏红欣 实习生 崔笑愚 ;“中欧模式”,美国会拿来照用吗[N];国际金融报;2005年
5 罗经;剖析普洛斯地产模式[N];国际商报;2005年
6 北京交通大学博士生 胡跃龙;“低价厚报”模式应当反思[N];光明日报;2005年
7 周其仁;农地入市的两种模式[N];经济观察报;2005年
8 经济视点报记者:李浩 □见习记者:司超慧;百货模式“激活”汽车后市场[N];经济视点报;2005年
9 钟久蔚、叶东兴、黄礼春;“5+1”模式破解农村系列难题[N];江西日报;2005年
10 本报记者 黄河;“建银模式”能否救券商[N];南方周末;2005年
中国博士学位论文全文数据库 前10条
1 雷向欣;XML索引和过滤查询若干关键技术研究[D];复旦大学;2005年
2 姜恩来;退耕还林工程管理机制和管理模式研究[D];北京林业大学;2005年
3 盖艳梅;金融控股公司模式论[D];中共中央党校;2005年
4 薛伟;现代远程教育5S学习支持模式研究[D];华东师范大学;2009年
5 李文清;西部产业集群发展因素及模式研究[D];西南交通大学;2007年
6 李平;我国企业智力资本开发研究[D];哈尔滨工程大学;2006年
7 王海勤;中国石油城市可持续发展模式研究[D];哈尔滨工程大学;2006年
8 张小红;智力资本及其管理研究[D];中国农业科学院;2007年
9 王欢苗;企业社区关系管理研究[D];辽宁大学;2007年
10 李涛;矿业权二级市场建设模式与交易机制研究[D];中国地质大学(北京);2008年
中国硕士学位论文全文数据库 前10条
1 谢红;XML技术和B/S模式在职业教育与培训管理信息系统中的应用研究[D];重庆大学;2005年
2 王晨阳;XML数据在关系数据库中存储技术的研究[D];大连海事大学;2007年
3 陈波;XML文档数据查询技术研究[D];山东大学;2005年
4 黄赟炜;RDF-XML文档的索引查询技术研究与实现[D];解放军信息工程大学;2007年
5 陈刚;用Xpath和XSLT查询XML文档[D];四川大学;2005年
6 谢领;面向XML文档的访问控制模型研究与实现[D];浙江大学;2006年
7 夏光磊;关于XML的关系数据库存储查询技术研究[D];山东科技大学;2010年
8 赵一雪;基于XML数据库的数据查询优化的研究[D];哈尔滨工程大学;2006年
9 房东尧;XML型数据库索引的建立与更新[D];吉林大学;2011年
10 何芳;基于模式的XML查询重写及索引技术研究[D];中南大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026