不完全信息环境下XML数据库规范化问题的研究
【摘要】:可扩展标识语言XML(eXtensible Markup Language)已成为Internet上信息表示和数据交换的标准,在网络服务、电子商务、电子数据交换、科学数据表示、数据建模与分析、智能体和搜索引擎等领域得到了广泛的应用,XML技术也日益受到更广泛的关注,XML数据库的管理技术也不断得到成熟和完善。现实客观世界中常常存在大量不完全信息,能够表示和处理不完全信息的数据库更具有现实应用意义和价值。为了更好地描述现实客观世界,XML文档应该允许出现不完全信息,然而XML文档引入不完全信息后,需要重新定义XML文档的数据约束,也就是说不完全信息环境下的XML数据库规范化理论不能直接应用完全信息环境下的XML数据库的相应理论解决问题。规范化理论是数据库领域研究的一个核心问题,同样地,它对不完全信息环境下XML数据库避免更新异常、保证数据的一致性、减少存储空间以及查询优化等方面具有重要的意义。但是,目前还没有关于不完全信息环境下XML数据库规范化理论的完善理论文献,本文将对不完全信息环境下的XML数据库规范化理论进行系统深入的研究。
基于路径和XML Schema对不完全信息环境下的XML数据库规范化理论进行了研究,本文的主要贡献和创新概括如下:
1、XML强函数依赖推理规则的研究。给出了XML强函数依赖的定义;研究了XML强函数依赖的性质;提出了XML强函数依赖的推理规则集,并对推理规则集的有效性和完备性进行了证明。
2、XML强闭包依赖范式的研究。给出了XML强闭包依赖的定义和性质,在提出XML强闭包依赖推理规则集的基础上,对其有效性和完备性进行了证明。给出了XML强函数依赖和XML强闭包依赖互不影响的定义;提出了XML强函数依赖和非循环XML强闭包依赖互不影响的判定定理, XML强闭包依赖范式以及相应的判定定理;提出了将XML数据库模式转化为XML强闭包依赖范式的规范化算法。
3、存在XML强多值依赖的XML文档规范化的研究。给出了左右部为单个路径的XML强多值依赖的定义;基于层次化的XML强多值依赖,提出了不完全XML文档树满足XML强多值依赖范式的条件;提出了满足该条件的不完全XML文档树无数据冗余的判定定理;提出了不完全XML文档树的规范化算法。
4、存在XML强函数依赖的XML Schema规范化研究。给出了XML Schema、符合XML Schema的不完全XML文档树等概念,提出了XML强函数依赖的定义和相应的推理规则集,路径集强闭包和XML强函数依赖的成员籍问题的算法。给出了XML强函数依赖范式的定义,提出了转换XML Schema为XML强函数依赖范式的规范化算法。
5、存在XML强多值依赖的XML Schema规范化研究。基于XML Schema给出了左右部为路径集合的XML强多值依赖的定义及性质;提出了XML强多值依赖的推理规则集,并对其正确性和完备性进行了证明。给出了弱键路径和XML强多值依赖弱范式的定义,通过实例分析了在XML Schema中XML强多值依赖引起数据冗余的原因,提出了转换规则,给出了规范化算法。
本文的研究是直接对Web世界中的不完全XML文档以及模式进行规范化,从而得到规范化的不完全XML文档以及模式。存储、集成、发布、传输和交换规范化的不完全XML数据,避免了更新异常,保证了数据在互联网上的一致性,提高了数据质量,在存储效率、索引设计和查询优化等方面具有重要的实用价值。
|
|
|
|
1 |
张伟都,周海东,钟共鸣,张素伟;面向XML的数据管理系统[J];计算机工程与应用;2001年20期 |
2 |
李天庆,张毅,张冰,胡东成;基于XML的体育数据规格化存储技术研究[J];计算机工程与应用;2001年22期 |
3 |
张晓林;基于XML的信息组织与处理:1.XML技术体系[J];情报科学;2001年08期 |
4 |
李慧,何绍华;XML在图书馆系统中的实现技术[J];现代图书情报技术;2001年04期 |
5 |
谈春梅,段卫华,田质斌;标准文献数据库系统的设计与实现[J];现代图书情报技术;2001年06期 |
6 |
李景春,武港山,张福炎;基于转换的光盘文档库数据生成和浏览[J];小型微型计算机系统;2001年04期 |
7 |
周建洪,吴以群,庞引明,楼荣生;XML文件系统的设计[J];计算机工程与科学;2001年02期 |
8 |
袁琳,李秉严;SGML、HTML、XML的比较[J];四川图书馆学报;2001年03期 |
9 |
曹向东;基于JSP的数据访问技术[J];中国民航学院学报;2001年04期 |
10 |
李效东,顾毓清;基于DOM的Web信息提取[J];计算机学报;2002年05期 |
11 |
李军怀,周明全,耿国华,张景西;XML在异构数据集成中的应用研究[J];计算机应用;2002年09期 |
12 |
文燕平,周宁;WWW中的XML数据管理研究[J];情报科学;2002年06期 |
13 |
尹桂秀;XML搜索引擎探微[J];图书情报工作;2002年03期 |
14 |
肖延松,孟波,熊德林,杨子晨;基于XML的数据交换在分布式Web系统中的应用[J];计算机系统应用;2002年03期 |
15 |
陈洪军,陈新度,陈新,郑德涛;新一代基于知识的工程系统[J];中国机械工程;2002年17期 |
16 |
周文生;基于SVG的WebGIS研究[J];中国图象图形学报;2002年07期 |
17 |
梅青;用XML技术实现电子对抗仿真的数据共享[J];舰船电子对抗;2002年06期 |
18 |
黄润才;基于XML的消息队列[J];上海工程技术大学学报;2002年03期 |
19 |
阎慧,李希民,李彩萍;基于XML的WEB安全模型[J];装备指挥技术学院学报;2002年04期 |
20 |
申飞驹,袁红,董建成;XML在数字图书馆中的应用[J];中华医学图书情报杂志;2002年06期 |
|