收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

不一致数据的查询处理

吴爱华  
【摘要】: 违反完整性约束的数据叫不一致数据。虽然完整性约束被用于防止不一致已经很长时间了,但由于各类原因,不一致数据仍然普遍存在于多类现实应用中。这些应用不单单包括数据整合、数据交换、数据挖掘、数据抽取、科学数据管理、传感网络等关系数据应用,还包括XML网络信息交换和集成等。 不一致数据蕴含着错误信息,在这样的数据库上回答用户提出的查询,得到的结果也可能是错误的。本文在保持信息准和全的前提下,从语义层面重新思考了不一致数据上的查询结果的确定性、可信性及其价值,针对关系数据,提出了一种带标记的不一致数据表示模型。根据这个模型,不一致性被看作是数据的一个属性,并能使用标记符号加以说明,也就是说,所有数据库及其查询回答的单元值上都可以附上0到多个标记,如果没附上任何标记,该单元值可信,反之不可信。为了在查询结果中正确地保持标记的语义,本文还定义了该模型上的7种基本查询操作、处理规则及其语义。并证明了整个研究方案的正确性和完备性。本研究方案把不一致的认定细化到属性级别,从而避免了信息丢失。 上述模型及其上的查询操作要能真正在实际中得到应用,需要一个可以兼容一致数据模型及其查询处理的实现方案,以便能在不影响传统数据管理和查询的基础上,实现不一致数据的管理和查询处理。本文采纳了基于查询重写的实现策略。在函数依赖和综合约束两个范围内,对任意类型的查询,提出了其重写算法,并针对不同的应用环境,提出了不同的重写算法优化方法。并在人造数据和TPC-H数据上开展了丰富的实验。实现了其Demo系统。 XML数据模型复杂,语法灵活,缺乏约束方面的严格规范,并常用于数据交换和数据集成,因此XML文档中的不一致问题甚至比关系数据更为严重。本文采用基于修复的数据查询处理方法来计算可信的查询结果,其核心是寻找不一致XML文档的最优修复。但求解最优修复是一个NP完全问题,特别是当XML文档同时违反函数依赖约束和主键约束时。本文提出一个基于代价模型,能同时解决置等和置不等约束,且可以在多项式时间内完成的启发式修复求解算法。该算法首先借助索引表,在一遍扫描原始XML文档的情况下,寻找不一致数据集,然后为每一类约束的不一致数据集构造候选修复,同时计算其修复代价,最后启发式地求解一个代价最小的修复方案。实验证明,该算法的时间复杂度不超过冲突类的3次方,即便是不一致数据大量、噪声比例大、且涉及多类语义约束时,也能较快地完成修复。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王国仁;于戈;石晶;郑怀远;;一个面向对象数据库系统中的查询处理[J];东北大学学报(自然科学版);1996年02期
2 王昱;分布式数据库系统的查询优化策略研究[J];海军工程大学学报;2004年03期
3 张磊;谢强;吴笑凡;丁秋林;黄添强;;基于Ontology映射的异构信息源查询处理[J];计算机工程;2007年13期
4 冯卫兵;李战怀;;流系统的降载技术[J];计算机工程与应用;2008年06期
5 金虎;贾建坤;;MANET移动数据库中的一种自适应递归连接算法[J];黑龙江水专学报;2008年01期
6 陶世群;分布式查询处理中的场地选择[J];电脑开发与应用;1996年03期
7 黄玲,李陶深;基于CORBA的工程数据库查询处理系统体系结构的研究[J];计算机工程;2001年07期
8 陶世群;分布式数据库系统中的设计方法和技术[J];吉首大学学报(自然科学版);2001年03期
9 张志强,邢春晓,周立柱,孙静,钱乾;SESQ系统的一种查询优化策略[J];计算机研究与发展;2004年10期
10 许峰;杨敏;王志坚;;基于遗传算法的多数据源连接查询优化方法[J];计算机工程与应用;2006年13期
11 于秀霞;宋雅娟;;分布式数据库半连接查询优化算法的研究[J];长春理工大学学报(自然科学版);2006年04期
12 单立新;苗卿;戴宗友;;XML数据流主动服务系统的设计与实现[J];电脑知识与技术(学术交流);2007年05期
13 朱华兴;周丽娟;周梦熊;;XML数据查询的并行算法[J];自动化技术与应用;2007年01期
14 武珊珊;谷峪;吕雁飞;于戈;;一种数据流上截止期敏感的滑动窗口处理策略[J];计算机科学;2007年07期
15 彭利;;WSN基于TinyDB数据查询处理技术优化的研究[J];读与写(教师教育);2008年06期
16 张胜;舒坚;包晓玲;;XML文档压缩技术比较研究[J];计算机应用;2008年10期
17 李东;叶友;谢芳勇;;语义缓存查询裁剪优化[J];计算机应用研究;2008年12期
18 赵智超;赵政;;对等数据管理系统中模式映射的备份机制[J];计算机工程;2009年01期
19 郭晓磊;赵利;聂铁铮;;支持全文检索的XQuery查询处理及优化的研究[J];计算机与数字工程;2010年08期
20 王爽;杨广明;朱志良;;基于不确定数据的频繁项查询算法[J];东北大学学报(自然科学版);2011年03期
中国重要会议论文全文数据库 前10条
1 陈红;王珊;;多阶段并行多查询处理框架[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
2 韩璐;王朝坤;邹鹏;徐亚军;;不确定图数据上的不确定查询处理[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
3 夏添;蔡文渊;徐林昊;钱卫宁;周水庚;周傲英;;P2P环境下的查询处理代价估算[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
4 熊蜀光;李建中;王宏志;高宏;;一种基于编码的图模型XML数据的存储与查询处理方法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 朱金清;王伟;周军锋;孟小峰;;基于相关性语义的高效XML Twig查询处理方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
6 姚建中;孙建伶;姜忠鼎;董金祥;;OSCAR路径表达式的查询处理[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
7 肖刚;庄严;郑振楣;石树刚;;SamBase中的对象查询处理[A];数据库研究与进展95——第十三届全国数据库学术会议论文集[C];1995年
8 王潇;卢阳;陈立军;;网内查询处理中的一种基于数据流共享的过滤查询算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 张蕊;高晓东;宫学庆;周傲英;;XML数据流上的树型查询处理[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 黄宇凯;王晓玲;周傲英;;LEO:基于序列化的XML文档高效查询处理方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
中国博士学位论文全文数据库 前10条
1 李瑞轩;异构信息集成中的查询处理与优化研究[D];华中科技大学;2004年
2 吴爱华;不一致数据的查询处理[D];复旦大学;2010年
3 王金宝;云计算系统中索引与查询处理技术研究[D];哈尔滨工业大学;2013年
4 刘喜平;XML文档搜索中的查询处理技术研究[D];江西财经大学;2010年
5 陶春;半结构化数据集成系统中的查询处理研究[D];复旦大学;2004年
6 宫学庆;基于Bloom Filter的路径表达式查询处理[D];复旦大学;2006年
7 熊蜀光;无线传感器网络数据收集和查询处理技术研究[D];哈尔滨工业大学;2011年
8 钱卫宁;对等计算系统中的数据管理[D];复旦大学;2004年
9 蔡建宇;面向海量数据库的中间层语义缓存技术研究[D];国防科学技术大学;2005年
10 闫莺;多数据类型的数据流查询处理及优化[D];复旦大学;2008年
中国硕士学位论文全文数据库 前10条
1 孟清;基于语义缓存的并行查询技术的设计与实现[D];国防科学技术大学;2004年
2 陈庆华;B1级安全数据库安全机制的研究[D];哈尔滨工程大学;2004年
3 姜国伟;数据库电子商务性能测评系统ACID子系统实现和MySQL与PostgreSQL查询处理分析[D];吉林大学;2005年
4 马嘉;数据流管理原型系统的设计与实现[D];西南交通大学;2006年
5 张立杰;数据流中适应性查询处理机制的研究[D];辽宁大学;2006年
6 陈磊松;面向高速网络的数据流处理系统研究与应用[D];厦门大学;2007年
7 袁靓;Deep Web信息集成关键技术的研究[D];中南大学;2008年
8 张晋;传感器网络的数据管理的研究[D];哈尔滨工程大学;2006年
9 李晓荣;分布式数据库在管理信息系统中的研究与探讨[D];吉林大学;2006年
10 黄河;基于嵌入式系统的高效数据库设计与研究[D];西北工业大学;2003年
中国重要报纸全文数据库 前10条
1 奎儒;国际邮件查询处理问答[N];中国邮政报;2002年
2 奎儒;国际邮件查询处理问答[N];中国邮政报;2002年
3 本报记者 刘学习;Sybase ASE15从容面对数据爆炸[N];计算机世界;2005年
4 王泽蕴李琨;IBM院士王云:数据库的下一代技术一点也不炫[N];中国计算机报;2007年
5 ;Sybase新一代数据库ASE15简介(二)[N];计算机世界;2005年
6 哈尔滨工业大学计算机科学与工程学院 李建中 石胜飞;移动计算环境中的数据管理[N];计算机世界;2002年
7 孙金虎 记者 齐宁;全省首家网上信访专用平台在宝塔区开通[N];延安日报;2007年
8 国家邮政局速递局查询中心;什么是拉格比(Rugby)系统?[N];中国邮政报;2003年
9 芮信;芮城推行“三书一卡”告知制[N];中国纪检监察报;2005年
10 中国人民大学信息学院 潘晓;既要服务也要保护隐私[N];中国计算机报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978