收藏本站
收藏 | 论文排版

XML索引和过滤查询若干关键技术研究

雷向欣  
【摘要】:XML(eXtensible Markup Language)作为网络数据交换和信息集成的工具,以其自描述性、跨平台交换性等特点,成为新一代的网络语言。互联网上越来越多的结构化或半结构化的数据采用XML格式存储和交换,对XML数据的索引及过滤查询研究显得日益重要。 本文根据XML数据的自身特点和当前实际应用需求,就索引和过滤查询的一些关键技术进行了研究,具体包括XML文档索引查询技术研究、XML文档树节点编码研究、遵循不同模式XML数据集索引模型、集群式XPath查询优化、XML数据过滤查询技术研究、XML文档索引和过滤查询原型系统的实现等方面,所做的工作和取得的创新成果体现在以下五个方面: 1) 基于互关联后继树的XML文档索引技术研究 基于叶序区间编码方法(LOINS)与互关联后继树模型(IRST)为节点带有名称(标签)的根树建立索引模型。结合IRST的标引性、可压缩性等特点,本文提出了基于IRST的根树索引模型IsBaRTI-Ⅰ,及该模型的空间优化模型IsBaRTI-Ⅱ。IsBaRTI-Ⅰ,Ⅱ采用树节点名称(标签)及其在根树(XML文档树)中的出现计数索引节点间的父子关系和节点叶序区间编码,实现索引结构和节点编码的相互统一。理论和实验证明,在对XML路径表达式的查询处理中,和以往同类索引模型相比,IsBaRTI-Ⅰ,Ⅱ索引建立时间、空间代价小,而且可快速查询满足XPath表达式在XML文档树中的节点序列和路径。 2) XML文档树节点叶序区间动态编码研究 在XML索引上采用树节点编码可快速判断树节点间的前后代关系,树节点编码代价影响着索引的空间代价和驻留内存空间的难易程度。区别于以往同类索引模型研究仅仅注重提高查询效率的片面性,本文针对Web上XML文档特点,就本文索引技术中的树节点叶序区间编码和其它树节点编码方法,如:顺序标识区间编码、前缀编码等进行比较。相比其它树节点编码方法,本文提出的叶序区间编码方法编码长度代价小、编码灵活机动性强(可通过IsBaRTI-Ⅱ在索引结构中动态查找)。我们提出的根树索引模型IsBaRTI-Ⅱ动态查找叶序区间编码的平均时间代价随着S/H(S为根树Tr节点出度;H为Tr高度)递增而递减且趋近于1,而Web上XML文档树普遍具有的SH的特点为基于IsBaRTI-Ⅱ实现的XML索引模型动态查找叶序区间编码提供了实际应用可行性。就树节点叶序区间编码的维护,本文提出了基于XML模式扩展叶序区间编码的方法,降低XML文档树节点插入时的索引中节点编码维护代价,为基于叶序区间编码的XML索引模型提供了编码维护方案。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘辛;王洪峰;;使用SQL Server2000和XML构建松散耦合的系统[J];煤炭技术;2011年07期
2 唐圣潘;周肆清;丁长松;;基于SAAS模式的共享模型的数据扩展技术研究[J];计算机技术与发展;2011年08期
3 梁娟;陈智;;一种基于XML的Web内容挖掘预处理方法[J];计算机时代;2011年06期
4 梅良刚;左保河;李嘉炎;;基于XML交互协议的LED终端及广告发布平台[J];计算机应用与软件;2011年09期
5 何美琦;;医院图书馆模式初探[J];图书馆界;2011年03期
6 友文;;让老本用上SRS音效驱动[J];电脑知识与技术(经验技巧);2011年06期
7 阿龙;;让华硕老本电池焕发活力[J];电脑知识与技术(经验技巧);2011年06期
8 杜志强;董方;;基于XML的网络课程资源元数据共享研究[J];天中学刊;2011年02期
9 王显燕;;基于信息资源共享的图书馆联盟运作模式探析[J];黑河学刊;2011年08期
10 李恒;;元数据管理系统的研究与实现[J];电脑知识与技术;2011年13期
11 杨晓茹;;网络电影传播模式的构建[J];东南传播;2011年07期
12 顾锦江;;基于AS技术的计算机网络虚拟实验的开发[J];计算机应用与软件;2011年07期
13 马欢;;XML在电子商务中的应用[J];China's Foreign Trade;2011年14期
14 周长敏;唐型基;;XML技术在考试系统中的应用研究[J];电脑知识与技术;2011年23期
15 卢燕;;论高校图书馆知识服务模式[J];河南图书馆学刊;2011年04期
16 王显燕;;信息资源共享的图书馆联盟运作模式[J];长江大学学报(社会科学版);2011年07期
17 曾丽榕;;关于创新医院图书馆管理模式的探索[J];考试周刊;2011年54期
18 牛元梅;;身份认同理论在媒体运用中的三种模式[J];新闻世界;2011年08期
19 陈爱华;;基于XML和Web Service的异构数据库数据交换[J];武汉船舶职业技术学院学报;2011年04期
20 谢峰;;双XML模式在异构数据交换中的应用研究[J];黑龙江科技信息;2011年21期
中国重要会议论文全文数据库 前10条
1 贾静;廖鸿志;孙兴平;周华;;ArchDL:基于XML的软件体系结构描述框架与模式[A];2008年计算机应用技术交流会论文集[C];2008年
2 包小源;宋再生;唐世渭;杨冬青;王腾蛟;;SuffIndex——一种基于后缀树的XML索引结构[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 李智;唐常杰;栾江;汪锐;贾晓兵;;基于索引的XML数据流的变化检测[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
4 王鹏飞;洪晓光;;基于XML大文档的动态索引[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 陈波;洪晓光;;基于改进树状结构的XML文档简单路径查询多线程实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
6 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
7 张昱;吴年;;XML数据流的过滤与查询技术[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
8 张龙;周傲英;郑仕辉;梁宇奇;;一种可行的层次型XML仓库索引结构[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
9 宗金良;李玉忱;任磊;;一种基于XN-Tree编码的XML数据库索引技术[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
10 李慧婷;李建中;王宏志;骆吉洲;;XML数据磁盘存储结构LDF&B及其查询处理方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
中国博士学位论文全文数据库 前10条
1 雷向欣;XML索引和过滤查询若干关键技术研究[D];复旦大学;2005年
2 姜恩来;退耕还林工程管理机制和管理模式研究[D];北京林业大学;2005年
3 盖艳梅;金融控股公司模式论[D];中共中央党校;2005年
4 薛伟;现代远程教育5S学习支持模式研究[D];华东师范大学;2009年
5 李文清;西部产业集群发展因素及模式研究[D];西南交通大学;2007年
6 李平;我国企业智力资本开发研究[D];哈尔滨工程大学;2006年
7 王海勤;中国石油城市可持续发展模式研究[D];哈尔滨工程大学;2006年
8 张小红;智力资本及其管理研究[D];中国农业科学院;2007年
9 王欢苗;企业社区关系管理研究[D];辽宁大学;2007年
10 李涛;矿业权二级市场建设模式与交易机制研究[D];中国地质大学(北京);2008年
中国硕士学位论文全文数据库 前10条
1 谢红;XML技术和B/S模式在职业教育与培训管理信息系统中的应用研究[D];重庆大学;2005年
2 王晨阳;XML数据在关系数据库中存储技术的研究[D];大连海事大学;2007年
3 陈波;XML文档数据查询技术研究[D];山东大学;2005年
4 黄赟炜;RDF-XML文档的索引查询技术研究与实现[D];解放军信息工程大学;2007年
5 陈刚;用Xpath和XSLT查询XML文档[D];四川大学;2005年
6 谢领;面向XML文档的访问控制模型研究与实现[D];浙江大学;2006年
7 夏光磊;关于XML的关系数据库存储查询技术研究[D];山东科技大学;2010年
8 赵一雪;基于XML数据库的数据查询优化的研究[D];哈尔滨工程大学;2006年
9 房东尧;XML型数据库索引的建立与更新[D];吉林大学;2011年
10 何芳;基于模式的XML查询重写及索引技术研究[D];中南大学;2005年
中国重要报纸全文数据库 前10条
1 单士兵;体彩“自肥模式”当休矣[N];中国经济导报;2005年
2 早报记者 俞佳;中美望效“中欧模式”[N];东方早报;2005年
3 CPW执行总编 关健;“模式样板”时代的终结[N];电脑商报;2005年
4 本报记者 魏红欣 实习生 崔笑愚 ;“中欧模式”,美国会拿来照用吗[N];国际金融报;2005年
5 罗经;剖析普洛斯地产模式[N];国际商报;2005年
6 北京交通大学博士生 胡跃龙;“低价厚报”模式应当反思[N];光明日报;2005年
7 周其仁;农地入市的两种模式[N];经济观察报;2005年
8 经济视点报记者:李浩 □见习记者:司超慧;百货模式“激活”汽车后市场[N];经济视点报;2005年
9 钟久蔚、叶东兴、黄礼春;“5+1”模式破解农村系列难题[N];江西日报;2005年
10 本报记者 黄河;“建银模式”能否救券商[N];南方周末;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978