收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

异构信息集成中的查询处理与优化研究

李瑞轩  
【摘要】:近年来,计算机和网络技术的发展呈加速态势,但各种应用的核心——数据,仍 以不同形式存储在不同的系统中,分而不聚,聚而不合,呈分布异构状态。随着应用 需求的不断增加,越来越多的用户希望能够透明地获取和处理来自这些海量信息源中 的有用数据,实现多个软硬件系统以及不同信息源之间的互操作。然而,这些信息源 物理上可能分布在异构环境的多个自治域中,有着不同的数据格式、存储方式、访问 控制策略,逻辑上则可能在数据模型、操纵语言和数据语义等方面存在着很大差异。 同时,这些信息源的可共享性、共享方式、共享内容等也可能随时发生变化。设计一 个支持公共数据模型和统一查询语言的异构信息集成系统(HIIS),是实现这种交互 操作的一种较好办法。异构信息集成系统可以屏蔽现在已有的各种异构数据管理系统 不同的访问方法和用户界面,给用户呈现一个访问多种异构数据源的公共接口,提供 一个集成处理多种数据源、整合多个数据查询结果的信息交互处理平台。 数据互操作是异构信息集成领域需要解决的主要问题。联邦数据库系统和多数 据库系统是解决分布式异构环境中多个数据源的集成与互操作的两种方法,但这两 者各有优缺点。在分析联邦数据库系统与多数据库系统差异的基础上,提出了一种 基于多自治域的层次互操作模型(MDHI)。这种框架既满足了局域范围内的信息集 成和处理的效率,又提供了一种集成广域范围内多种异构数据源的方法,更加符合 当前实际应用的需要。 在分析异构信息集成系统基本模式结构的基础上,提出了一种基于 XML 的集成 数据模型(XIDM)作为集成系统的公共数据模型,它将全局模式和输出模式中的数 据模型描述成图的结构,可以集成包括数据库系统、文件系统、Web 信息系统等多种 异构系统中的数据。为了建立集成系统中不同模式层次之间的联系,给出了全局模式 到输出模式之间的全局映射以及输出模式到局部模式的局部映射,解决 XIDM 模型与 关系数据模型、面向对象模型以及 HTML/XML 文档模型之间的映射问题。实例证明 XIDM 模型及其模式映射方法是合理且有效的。 查询处理是异构信息集成系统的关键技术之一,查询分解、查询调度和查询优化 是查询处理的核心内容。通过定义集成系统中查询处理的基本概念,分析 XML 查询 的基本特点和要求,选定 XQuery 作为面向 XIDM 模型的查询语言,给出了查询处理 I WP=4 的基本体系结构。在此基础上,给出了全局查询分解的基本原则和查询分解算法,并 对查询分解算法的语义等价性进行了分析。 查询后处理是根据查询计划进行调度并通过后处理操作完成中间结果组装的过 程,后处理操作主要由全局查询涉及的所有场地间运算来完成。通过对关系代数中的 关系操作进行扩展,定义了面向 XIDM 模型的基于路径的元素簇操作,即 XRA 代数, 用于表达查询后处理中子查询结果的合并处理。给出了查询后处理的转换规则,提出 了一种连接树结构来表达集成系统的查询后处理操作,并对其进行规范化处理。通过 引入连接图的概念,将连接规范树转换为等价的连接图,供查询后处理调度使用,在 此基础上,给出了基于连接图的查询后处理多级并发调度算法,以尽可能提高查询后 处理执行的并发性。 查询优化是异构信息集成系统中非常重要而又十分复杂的问题。针对查询后处理 中的场地间运算代价,分析了影响后处理优化的代价参数,给出了局部数据源代价和 通信代价的估计方法。连接运算往往是查询处理中开销最大的运算,以场地间连接和 外连接运算组成的连接图为基础,给出了一种基于最小生成树的静态优化算法 MST-SO 和一种基于统计推理的动态优化方法 SR-DO,以及结合这两种方法的混合优 化策略,并通过实验仿真的方法对它们的优化性能进行了实验分析和性能比较,实验 证明混合优化的性能更优。 基于上述理论和实验研究成果,研制和开发了一个基于 Web 服务的多自治域异 构信息集成系统 Panorama Web One,它能够提供对 Oracle、Sybase、DB2 等数据库系 统以及 HTML/XML 文档等其他文件类数据源的透明访问,主要功能涵盖了模式集成 与模式信息管理、查询处理和查询优化等方面,并通过与原有系统的对比测试实验, 给出了 Panorama Web One 系统的性能分析与评价。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王国仁;于戈;石晶;郑怀远;;一个面向对象数据库系统中的查询处理[J];东北大学学报(自然科学版);1996年02期
2 王昱;分布式数据库系统的查询优化策略研究[J];海军工程大学学报;2004年03期
3 张磊;谢强;吴笑凡;丁秋林;黄添强;;基于Ontology映射的异构信息源查询处理[J];计算机工程;2007年13期
4 冯卫兵;李战怀;;流系统的降载技术[J];计算机工程与应用;2008年06期
5 金虎;贾建坤;;MANET移动数据库中的一种自适应递归连接算法[J];黑龙江水专学报;2008年01期
6 陶世群;分布式查询处理中的场地选择[J];电脑开发与应用;1996年03期
7 黄玲,李陶深;基于CORBA的工程数据库查询处理系统体系结构的研究[J];计算机工程;2001年07期
8 陶世群;分布式数据库系统中的设计方法和技术[J];吉首大学学报(自然科学版);2001年03期
9 张志强,邢春晓,周立柱,孙静,钱乾;SESQ系统的一种查询优化策略[J];计算机研究与发展;2004年10期
10 许峰;杨敏;王志坚;;基于遗传算法的多数据源连接查询优化方法[J];计算机工程与应用;2006年13期
11 于秀霞;宋雅娟;;分布式数据库半连接查询优化算法的研究[J];长春理工大学学报(自然科学版);2006年04期
12 单立新;苗卿;戴宗友;;XML数据流主动服务系统的设计与实现[J];电脑知识与技术(学术交流);2007年05期
13 朱华兴;周丽娟;周梦熊;;XML数据查询的并行算法[J];自动化技术与应用;2007年01期
14 武珊珊;谷峪;吕雁飞;于戈;;一种数据流上截止期敏感的滑动窗口处理策略[J];计算机科学;2007年07期
15 彭利;;WSN基于TinyDB数据查询处理技术优化的研究[J];读与写(教师教育);2008年06期
16 张胜;舒坚;包晓玲;;XML文档压缩技术比较研究[J];计算机应用;2008年10期
17 李东;叶友;谢芳勇;;语义缓存查询裁剪优化[J];计算机应用研究;2008年12期
18 赵智超;赵政;;对等数据管理系统中模式映射的备份机制[J];计算机工程;2009年01期
19 郭晓磊;赵利;聂铁铮;;支持全文检索的XQuery查询处理及优化的研究[J];计算机与数字工程;2010年08期
20 王爽;杨广明;朱志良;;基于不确定数据的频繁项查询算法[J];东北大学学报(自然科学版);2011年03期
中国重要会议论文全文数据库 前10条
1 陈红;王珊;;多阶段并行多查询处理框架[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
2 韩璐;王朝坤;邹鹏;徐亚军;;不确定图数据上的不确定查询处理[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
3 夏添;蔡文渊;徐林昊;钱卫宁;周水庚;周傲英;;P2P环境下的查询处理代价估算[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
4 熊蜀光;李建中;王宏志;高宏;;一种基于编码的图模型XML数据的存储与查询处理方法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 朱金清;王伟;周军锋;孟小峰;;基于相关性语义的高效XML Twig查询处理方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
6 姚建中;孙建伶;姜忠鼎;董金祥;;OSCAR路径表达式的查询处理[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
7 肖刚;庄严;郑振楣;石树刚;;SamBase中的对象查询处理[A];数据库研究与进展95——第十三届全国数据库学术会议论文集[C];1995年
8 王潇;卢阳;陈立军;;网内查询处理中的一种基于数据流共享的过滤查询算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 张蕊;高晓东;宫学庆;周傲英;;XML数据流上的树型查询处理[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 黄宇凯;王晓玲;周傲英;;LEO:基于序列化的XML文档高效查询处理方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
中国博士学位论文全文数据库 前10条
1 李瑞轩;异构信息集成中的查询处理与优化研究[D];华中科技大学;2004年
2 吴爱华;不一致数据的查询处理[D];复旦大学;2010年
3 王金宝;云计算系统中索引与查询处理技术研究[D];哈尔滨工业大学;2013年
4 刘喜平;XML文档搜索中的查询处理技术研究[D];江西财经大学;2010年
5 陶春;半结构化数据集成系统中的查询处理研究[D];复旦大学;2004年
6 宫学庆;基于Bloom Filter的路径表达式查询处理[D];复旦大学;2006年
7 熊蜀光;无线传感器网络数据收集和查询处理技术研究[D];哈尔滨工业大学;2011年
8 钱卫宁;对等计算系统中的数据管理[D];复旦大学;2004年
9 蔡建宇;面向海量数据库的中间层语义缓存技术研究[D];国防科学技术大学;2005年
10 闫莺;多数据类型的数据流查询处理及优化[D];复旦大学;2008年
中国硕士学位论文全文数据库 前10条
1 孟清;基于语义缓存的并行查询技术的设计与实现[D];国防科学技术大学;2004年
2 陈庆华;B1级安全数据库安全机制的研究[D];哈尔滨工程大学;2004年
3 姜国伟;数据库电子商务性能测评系统ACID子系统实现和MySQL与PostgreSQL查询处理分析[D];吉林大学;2005年
4 马嘉;数据流管理原型系统的设计与实现[D];西南交通大学;2006年
5 张立杰;数据流中适应性查询处理机制的研究[D];辽宁大学;2006年
6 陈磊松;面向高速网络的数据流处理系统研究与应用[D];厦门大学;2007年
7 袁靓;Deep Web信息集成关键技术的研究[D];中南大学;2008年
8 张晋;传感器网络的数据管理的研究[D];哈尔滨工程大学;2006年
9 李晓荣;分布式数据库在管理信息系统中的研究与探讨[D];吉林大学;2006年
10 黄河;基于嵌入式系统的高效数据库设计与研究[D];西北工业大学;2003年
中国重要报纸全文数据库 前10条
1 奎儒;国际邮件查询处理问答[N];中国邮政报;2002年
2 奎儒;国际邮件查询处理问答[N];中国邮政报;2002年
3 本报记者 刘学习;Sybase ASE15从容面对数据爆炸[N];计算机世界;2005年
4 王泽蕴李琨;IBM院士王云:数据库的下一代技术一点也不炫[N];中国计算机报;2007年
5 ;Sybase新一代数据库ASE15简介(二)[N];计算机世界;2005年
6 孙金虎 记者 齐宁;全省首家网上信访专用平台在宝塔区开通[N];延安日报;2007年
7 芮信;芮城推行“三书一卡”告知制[N];中国纪检监察报;2005年
8 中国人民大学信息学院 潘晓;既要服务也要保护隐私[N];中国计算机报;2008年
9 哈尔滨工业大学计算机科学与工程学院 李建中 石胜飞;移动计算环境中的数据管理[N];计算机世界;2002年
10 国家邮政局速递局查询中心;什么是拉格比(Rugby)系统?[N];中国邮政报;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978