收藏本站
《哈尔滨理工大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

不完全信息环境下XML数据库规范化问题的研究

殷丽凤  
【摘要】:可扩展标识语言XML(eXtensible Markup Language)已成为Internet上信息表示和数据交换的标准,在网络服务、电子商务、电子数据交换、科学数据表示、数据建模与分析、智能体和搜索引擎等领域得到了广泛的应用,XML技术也日益受到更广泛的关注,XML数据库的管理技术也不断得到成熟和完善。现实客观世界中常常存在大量不完全信息,能够表示和处理不完全信息的数据库更具有现实应用意义和价值。为了更好地描述现实客观世界,XML文档应该允许出现不完全信息,然而XML文档引入不完全信息后,需要重新定义XML文档的数据约束,也就是说不完全信息环境下的XML数据库规范化理论不能直接应用完全信息环境下的XML数据库的相应理论解决问题。规范化理论是数据库领域研究的一个核心问题,同样地,它对不完全信息环境下XML数据库避免更新异常、保证数据的一致性、减少存储空间以及查询优化等方面具有重要的意义。但是,目前还没有关于不完全信息环境下XML数据库规范化理论的完善理论文献,本文将对不完全信息环境下的XML数据库规范化理论进行系统深入的研究。 基于路径和XML Schema对不完全信息环境下的XML数据库规范化理论进行了研究,本文的主要贡献和创新概括如下: 1、XML强函数依赖推理规则的研究。给出了XML强函数依赖的定义;研究了XML强函数依赖的性质;提出了XML强函数依赖的推理规则集,并对推理规则集的有效性和完备性进行了证明。 2、XML强闭包依赖范式的研究。给出了XML强闭包依赖的定义和性质,在提出XML强闭包依赖推理规则集的基础上,对其有效性和完备性进行了证明。给出了XML强函数依赖和XML强闭包依赖互不影响的定义;提出了XML强函数依赖和非循环XML强闭包依赖互不影响的判定定理, XML强闭包依赖范式以及相应的判定定理;提出了将XML数据库模式转化为XML强闭包依赖范式的规范化算法。 3、存在XML强多值依赖的XML文档规范化的研究。给出了左右部为单个路径的XML强多值依赖的定义;基于层次化的XML强多值依赖,提出了不完全XML文档树满足XML强多值依赖范式的条件;提出了满足该条件的不完全XML文档树无数据冗余的判定定理;提出了不完全XML文档树的规范化算法。 4、存在XML强函数依赖的XML Schema规范化研究。给出了XML Schema、符合XML Schema的不完全XML文档树等概念,提出了XML强函数依赖的定义和相应的推理规则集,路径集强闭包和XML强函数依赖的成员籍问题的算法。给出了XML强函数依赖范式的定义,提出了转换XML Schema为XML强函数依赖范式的规范化算法。 5、存在XML强多值依赖的XML Schema规范化研究。基于XML Schema给出了左右部为路径集合的XML强多值依赖的定义及性质;提出了XML强多值依赖的推理规则集,并对其正确性和完备性进行了证明。给出了弱键路径和XML强多值依赖弱范式的定义,通过实例分析了在XML Schema中XML强多值依赖引起数据冗余的原因,提出了转换规则,给出了规范化算法。 本文的研究是直接对Web世界中的不完全XML文档以及模式进行规范化,从而得到规范化的不完全XML文档以及模式。存储、集成、发布、传输和交换规范化的不完全XML数据,避免了更新异常,保证了数据在互联网上的一致性,提高了数据质量,在存储效率、索引设计和查询优化等方面具有重要的实用价值。
【学位授予单位】:哈尔滨理工大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP311.13

【参考文献】
中国期刊全文数据库 前10条
1 严丽;马宗民;刘健;于戈;;基于XML Schema的模糊数据建模方法[J];东北大学学报(自然科学版);2008年10期
2 路燕;郝忠孝;;新的DTDs一致性判断算法[J];哈尔滨工业大学学报;2006年09期
3 张翔;郝忠孝;;基于Schema标准的XML函数依赖及推理规则[J];哈尔滨理工大学学报;2007年03期
4 张广玲;郝忠孝;;不完全信息下XML树的函数依赖强保持条件[J];哈尔滨理工大学学报;2007年04期
5 赵威;郝忠孝;;基于XML代数的查询优化研究[J];哈尔滨理工大学学报;2008年04期
6 贾福林,王国仁,于戈;基于DOM的XML数据库的索引技术研究[J];计算机研究与发展;2004年01期
7 谈子敬,施伯乐;DTD的规范化[J];计算机研究与发展;2004年04期
8 吕腾,顾宁,施伯乐;XML DTD的一种范式[J];计算机研究与发展;2004年04期
9 吴永辉;消除结构冗余的XML数据库模式规范化设计[J];计算机研究与发展;2004年10期
10 吕腾,闫萍;XML函数依赖及其推理规则[J];计算机研究与发展;2005年05期
中国博士学位论文全文数据库 前3条
1 王庆;XML约束在XML数据存储、发布和转换中的应用[D];复旦大学;2004年
2 汪源;XML事务模型及并发控制研究[D];浙江大学;2006年
3 范颖捷;XML索引与查询的若干关键技术研究[D];复旦大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 张学敏;熊曾刚;陈建新;;XML范式理论及规范化规则[J];北京工商大学学报(自然科学版);2007年03期
2 门爱华;;XML数据库模式匹配算法研究[J];赤峰学院学报(自然科学版);2007年05期
3 兰小机,张书亮,刘德儿,闾国年;GML空间数据库系统研究[J];测绘科学;2005年05期
4 刘文胜,李国和,李洪奇;石油勘探软件集成技术研究[J];测井技术;2005年05期
5 刘力卓,王晶;模糊空值环境下关系数据库的数学运算和关系操作[J];燕山大学学报;2005年01期
6 胡小明,陈子阳,高翔,刘国华;基于树元组的函数依赖推理规则[J];燕山大学学报;2005年01期
7 陈子阳;基于DTD路径编码的XML逻辑蕴涵问题研究[J];燕山大学学报;2005年05期
8 荣凌燕;刘国华;沈兵红;;基于树元组的XML文档中的多值依赖[J];燕山大学学报;2006年03期
9 陈子阳;;XML函数依赖集的逻辑蕴含[J];燕山大学学报;2006年05期
10 韩旭东;;一种基于非等概率更新的XML区间编码方法[J];电大理工;2008年02期
中国重要会议论文全文数据库 前10条
1 张一鸣;杨喜权;王大勇;;面向XML的搜索引擎及其索引技术[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
2 杨喜权;张博;;基于规范化结构树的XML文档相似性度量[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
3 徐智慧;吴宏宇;王珺;;贵阳市涉农信息共享平台的建设研究[A];贵州省气象学会2010年学术年会论文集[C];2010年
4 朱梅梅;周献中;;江苏省省级学会考核指标约简报告[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
5 荣凌燕;刘国华;沈兵红;李现伟;;基于树元组的XML多值依赖推理[A];2006年全国理论计算机科学学术年会论文集[C];2006年
6 张怡;肖侬;杨海云;;基于网格的XMLDB共享访问系统[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
7 黄敏;王震;杨诚;王颖;;XBRL数据在原生XML数据库中存储与检索的研究[A];第九届全国会计信息化年会论文集(上)[C];2010年
8 万常选;林大海;;基于X-RESTORE有效地处理XPath路径表达式[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
9 章悦;高军;王腾蛟;杨冬青;唐世渭;;QBXS:一种基于查询的XML文档存储方法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
10 ;考虑约束的DTD到关系模式的映射(英文)[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 汪陈应;XML数据编码与存储管理关键技术研究[D];南开大学;2010年
2 蔺旭东;基于语义的XML查询及规范化研究[D];北京交通大学;2010年
3 刘振宇;服务网格环境中场景测试的关键技术研究[D];复旦大学;2010年
4 董玺坤;面向服务的自律恢复系统体系结构及其实现技术研究[D];哈尔滨工程大学;2011年
5 宁博;XML查询模式匹配及文档过滤技术研究[D];东北大学;2009年
6 陈根方;中国工尺谱的数字实现研究[D];上海大学;2011年
7 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
8 庞引明;基于结构化联接的XML查询模式匹配关键技术研究[D];复旦大学;2004年
9 张忠平;基于约束的XML数据库模式规范化研究[D];复旦大学;2004年
10 李瑞轩;异构信息集成中的查询处理与优化研究[D];华中科技大学;2004年
中国硕士学位论文全文数据库 前10条
1 夏光磊;关于XML的关系数据库存储查询技术研究[D];山东科技大学;2010年
2 白林;基于路径表达式的XML索引查询技术[D];郑州大学;2010年
3 张志强;数据集成技术及其应用研究[D];哈尔滨工程大学;2010年
4 吴世汉;面向查询的XML文本摘要技术[D];江西财经大学;2010年
5 黄俊;支持高效动态更新的XML数据编码方法研究[D];华东师范大学;2011年
6 刘帆;基于数据包特征的僵尸木马检测技术[D];天津理工大学;2010年
7 张麟;XML数据查询优化技术的研究[D];哈尔滨理工大学;2010年
8 刘涛;基于SOA架构的企业应用平台研究与开发[D];长春工业大学;2010年
9 韩鑫玮;基于订单驱动的纺织业务流程管理系统[D];电子科技大学;2010年
10 唐红光;基于XPath路径表达式的选择度估算研究[D];中南林业科技大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 胡小明,陈子阳,高翔,刘国华;基于树元组的函数依赖推理规则[J];燕山大学学报;2005年01期
2 陈祎;胡运发;;用互关联后继树模型实现一个局部相似性比对算法[J];复旦学报(自然科学版);2006年05期
3 吴永辉,周傲英;对象依赖集合性质的研究[J];计算机研究与发展;2001年12期
4 曾海泉,刘永丹,宋扬,胡运发;基于互关联后继树的多时间序列关联模式挖掘[J];计算机研究与发展;2003年07期
5 曾海泉,宋扬,申展,胡运发;基于互关联后继树的时间序列相似性查询[J];计算机研究与发展;2004年02期
6 庞引明,谈子敬,汪卫;XML的并发加锁协议[J];计算机研究与发展;2004年07期
7 张凯,胡运发,王瑜;基于互关联后继树的概念格构造算法[J];计算机研究与发展;2004年09期
8 吴永辉;消除结构冗余的XML数据库模式规范化设计[J];计算机研究与发展;2004年10期
9 马海兵,张成洪,张锦,胡运发;基于IS~±树模型的频繁模式挖掘[J];计算机研究与发展;2005年04期
10 雷向欣,胡运发,杨智应,刘勇,张凯;基于互关联后继树的XML索引技术[J];计算机研究与发展;2005年07期
中国博士学位论文全文数据库 前7条
1 吕腾;XML文档的规范化问题研究[D];复旦大学;2003年
2 路燕;基于多DTD的XML查询技术研究[D];复旦大学;2003年
3 曲卫民;中文XML信息检索系统的研究[D];中国科学院研究生院(软件研究所);2004年
4 张忠平;基于约束的XML数据库模式规范化研究[D];复旦大学;2004年
5 谈子敬;XML的完整性约束[D];复旦大学;2003年
6 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
7 王鑫印;无结构和半结构信息检索相关技术研究[D];复旦大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 胡立辉;多值依赖模式上Armstrong关系的构造算法[J];系统工程与电子技术;2004年11期
2 朱其亮;关于关系数据库中多值依赖的传递性[J];计算机工程与应用;1983年Z1期
3 玄钟伍,马锦忠;关于嵌入型多值依赖集的蕴涵问题[J];计算机学报;1985年04期
4 刘文远,周国亮;存在多值依赖(MVD)的XML文档的规范化[J];计算机工程;2004年18期
5 胡立辉;不含非平凡函数依赖或多值依赖的关系的势[J];计算技术与自动化;2002年04期
6 杭后俊;关于多值依赖的几点注记[J];安庆师范学院学报(自然科学版);2005年03期
7 国大正,李力,钱钧翘;Smith图合成规范化关系模式的法则与证明[J];小型微型计算机系统;1998年06期
8 蒋天发;含空值关系数据库中函数与多值依赖的研究[J];武汉大学学报(工学版);2001年02期
9 虢莉娟;;数据库中的多值依赖[J];考试周刊;2007年20期
10 张忠平,朱扬勇;多值依赖无分裂覆盖问题的研究[J];复旦学报(自然科学版);2003年02期
中国重要会议论文全文数据库 前10条
1 张忠平;;XML多值依赖蕴涵算法研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
2 孙伟;刘大昕;张万松;;一个基于粗糙集的XML多值依赖发现算法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
3 荣凌燕;聂俊岚;刘国华;;XML多值依赖的成员籍问题研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 丁玲;;模糊空值环境下关系数据库的多值依赖[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
5 张建军;周继鹏;葛玮;;基于逻辑模型的DB模式向关系模式的形式化转换方法[A];第十一届全国数据库学术会议论文集[C];1993年
6 张忠平;陈子阳;;关系数据库理论若干问题的研究[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
7 姚春龙;郝忠孝;迟乐军;;一个新的具有多时间粒度的时态依赖[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
8 郝忠孝;;空值环境下NMVD公理系统存在性研究[A];第九届全国数据库学术会议论文集(上)[C];1990年
9 李晓瑞;刘刚;张小平;张红云;马垣;;关系数据库中的属性约简[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
10 李慧;吉伟萍;楼荣生;;外键分析和对象类引用[A];第十六届全国数据库学术会议论文集[C];1999年
中国博士学位论文全文数据库 前5条
1 万静;全序偏序时态数据库的研究[D];哈尔滨理工大学;2009年
2 孙伟;XML数据库查询优化及相关技术研究[D];哈尔滨工程大学;2006年
3 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
4 张忠平;基于约束的XML数据库模式规范化研究[D];复旦大学;2004年
5 宋金玲;K-匿名隐私保护模型中与匿名数据相关的关键问题研究[D];燕山大学;2012年
中国硕士学位论文全文数据库 前10条
1 夏会杰;基于关系数据库中多值依赖的贝叶斯网络学习[D];吉林大学;2013年
2 刘志晓;基于函数依赖和多值依赖的XML规范化研究[D];燕山大学;2012年
3 荣凌燕;XML多值依赖问题的研究[D];燕山大学;2006年
4 张翔;不完全信息环境下关于XML文档多值依赖及推理规则的研究[D];哈尔滨理工大学;2007年
5 唐远翔;结构化数据到XML半结构化数据的研究与实现[D];西南石油学院;2005年
6 王磊;时态数据库偏序时态模式中多值依赖问题研究[D];哈尔滨理工大学;2010年
7 徐岩;基于通道的推理控制关键技术研究[D];北京信息控制研究所;2007年
8 王梅娟;XML数据的规范化存储[D];南京师范大学;2007年
9 李高仕;XML数据库的规范化理论研究[D];湖南师范大学;2008年
10 肖晖;基于语义约束的XML规范化的研究[D];重庆大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026