收藏本站
《南开大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

XML数据编码与存储管理关键技术研究

汪陈应  
【摘要】:在过去的十余年里,XML得到了迅速的发展和极其广泛的应用,XML数据凭借其灵活的半结构化特征成为当今各个领域广泛采用的新的数据形式。呈指数级增长的XML数据给数据库研究领域注入了新鲜的血液,半结构化数据管理已成为现代数据库技术的一个重要分支。XML数据管理应以XML数据模型为中心,从XML数据的本质特征出发,探求支持其独特树形结构的高效管理方案,即原生XML数据管理方案是解决问题的关键所在。本文正是对原生XML数据管理中相关的关键技术进行了研究,一方面是设计和实现了一种完全独立的原生XML数据库的物理存储方案,它完整地体现了XML数据逻辑模型,支持各种XML索引结构,并能高效的进行XML查询;另一方面,针对传统基于关系数据库管理XML数据所造成的语义丢失以及性能下降问题,本文设计和实现了一种无缝集成关系数据库系统的原生XML存储方案,该方案最大幅度地重用关系数据库的存储管理器,解决了XML数据逻辑模型与关系模型之间的差异,能够以最自然的方式存储和索引XML数据。 在分析近几年来国内外相关研究成果的基础上,本文对原生XML编码、存储、索引、更新、文档相似性度量等问题进行了系统深入的研究。主要贡献与创新点如下: ●提出了一种基于二进制分数的动态XML节点编码方案BSC。给出了BSC编码方案的基本定义及其扩展定义,设计了BSC的静态和动态编码算法,分析和对比了多种节点编码串行化方法的效率和局限性,最后实验验证了BSC编码方案的高效性。 ●参与设计了一种节点级原生XML存储方案XN-Store。该方案以节点记录为最小单位,直接在分页文件上构建持久化的XML数据逻辑模型,节点记录的文档序存储可以支持快速的XML文档发布和节点的随机访问,能够支持各种XML辅助索引和高效的查询处理。实验证明XN-Store是一种高性能的原生XML存储方案。 ●基于XN-Store存储方案,本文设计了一种高效的XML数据更新策略XN-Store+。在XN-Store的基础上,该方案添加前向链接记录以保持移动记录的虚拟地址不变,进而维护各种索引结构的正确性;添加重定位记录以保持实际节点记录的文档序存储,很好地解决了XML数据高效更新和索引维护困难之间的矛盾。 ●提出了一种基于关系的原生XML存储方案NXRel。基于模型映射的方式,NXRel解决了XML数据逻辑模型和关系模型之间的差异所引起的各种问题,在关系表的基础之上构建了XML数据逻辑模型,能够以自然的方式存储和索引XML文档,支持高效的XML数据更新。实验证明NXRel处理各类XML数据集都具有稳定的表现,各种索引结构能够对XML查询提供强有力的支持。 ●基于双向路径约束模型,本文提出了一种综合考虑各种因素的XML文档相似性的度量方法。提出了双向路径约束模型以精确刻画XML文档结构特征,设计了基于集合和基于N-Gram的路径约束相似性度量方法,综合各种权重代价,给出了基于双向路径约束模型的文档相似性度量方法。通过聚类实验证明,该方法能够提高聚类效果的准确率和召回率。
【学位授予单位】:南开大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP311.13

【相似文献】
中国期刊全文数据库 前10条
1 马欢;;XML在电子商务中的应用[J];China's Foreign Trade;2011年14期
2 李恒;;元数据管理系统的研究与实现[J];电脑知识与技术;2011年13期
3 谢峰;;双XML模式在异构数据交换中的应用研究[J];黑龙江科技信息;2011年21期
4 顾锦江;;基于AS技术的计算机网络虚拟实验的开发[J];计算机应用与软件;2011年07期
5 周强;;XML在动态网页中的应用[J];科技传播;2011年15期
6 周长敏;唐型基;;XML技术在考试系统中的应用研究[J];电脑知识与技术;2011年23期
7 陈爱华;;基于XML和Web Service的异构数据库数据交换[J];武汉船舶职业技术学院学报;2011年04期
8 黎娜;张庆吉;;移动数据库同步技术及其应用[J];现代计算机(专业版);2011年10期
9 刘智琦;徐奕奕;;XML在电子商务中的应用[J];黑龙江科技信息;2011年20期
10 朱兴统;许波;;一种基于粗糙集理论的XML数据挖掘模型[J];科学技术与工程;2011年20期
中国重要会议论文全文数据库 前10条
1 郭志懋;周傲英;;XML数据的在线过滤[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 何震瀛;李建中;王宏志;;XML数据的关系存储[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 丁峰;王煜;姚延涛;沈钧毅;;从XML模式到数据库模式[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
4 谈子敬;施伯乐;;XML导出数据库表的实现与应用[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 罗道峰;孟小峰;;一种面向XML文档的基于角色的扩展访问控制方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 郑骏;王焱;钱卫宁;周傲英;;XML相似相关结构库的构造及其应用[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 吴刚;于亚新;王国仁;于戈;;并行XML文档数据分片技术研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 王静;孟小峰;王珊;;以目标节点为导向的XML路径查询处理[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
9 王鹏飞;洪晓光;;基于XML大文档的动态索引[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 肖冰;廖湖声;郑玉明;;数据集成系统中的XML延迟处理技术[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
中国重要报纸全文数据库 前10条
1 秦林;《XML完全探索》[N];中华读书报;2001年
2 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年
3 ;分化并不能阻止XML发展[N];中国计算机报;2000年
4 ;为XML标准定标准[N];中国计算机报;2001年
5 IDG电讯;Microsoft、IBM共同制定XML标准[N];计算机世界;2000年
6 北京邮电大学 张剑;XML与HTML的结合(上)[N];计算机世界;2001年
7 本报记者 陆 杰;XML丛林的新秀[N];中华读书报;2002年
8 北京邮电大学 张剑;XML与HTML的结合(下)[N];计算机世界;2001年
9 侯青;国际电子商务XML/EDI特点及现状[N];国际商报;2001年
10 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年
中国博士学位论文全文数据库 前10条
1 汪陈应;XML数据编码与存储管理关键技术研究[D];南开大学;2010年
2 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
3 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
4 叶晓峰;基于XML的冲压模具设计知识重用技术研究[D];华中科技大学;2010年
5 张晨静;XML关键字过滤技术[D];复旦大学;2011年
6 汪源;XML事务模型及并发控制研究[D];浙江大学;2006年
7 许建军;对结构化和半结构化数据的关键字搜索研究[D];复旦大学;2007年
8 刘喜平;XML文档搜索中的查询处理技术研究[D];江西财经大学;2010年
9 李荷华;面向智能体的化工过程运行系统信息集成模型研究[D];华南理工大学;2003年
10 朱晓冬;数字博物馆关键技术研究[D];西北大学;2004年
中国硕士学位论文全文数据库 前10条
1 文华南;支持数据更新的XML压缩编码研究[D];湖南师范大学;2010年
2 朱杰;基于主题和结构的XML网页的数据抽取[D];华侨大学;2005年
3 刘靖超;面向数据采集的信息集成系统设计与实现[D];河北工业大学;2005年
4 王旭磊;基于CBR的电子商务网站智能设计系统的研究[D];青岛大学;2005年
5 李志明;基于Web服务的在线考试系统应用研究与实现[D];广东工业大学;2005年
6 江静;基于XML的公文管理系统设计与应用研究[D];南京理工大学;2005年
7 陈美云;基于XML的柔性信息集成技术研究[D];山东科技大学;2005年
8 朱瑜;工作流引擎研究与实现[D];电子科技大学;2005年
9 谢红;XML技术和B/S模式在职业教育与培训管理信息系统中的应用研究[D];重庆大学;2005年
10 郦金花;基于XML的MARC发布系统的设计与实现[D];苏州大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026