收藏本站
《哈尔滨工程大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

数据仓库中实视图的选择与维护技术的研究

周丽娟  
【摘要】:数据仓库是随着企业竞争对于决策信息的需求以及计算机技术的飞速发展而产生的。数据仓库的结构设计是数据仓库研究和开发的核心问题之一。 数据仓库是多个分布的、异质的、自治的数据源的集成信息库,数据仓库中的信息以视图的形式存储,叫实视图。它通过物理上的预先存储,加快了用户的查询响应时间。实视图的使用和研究大大提高了数据仓库的性能。 本文主要研究以下几个方面的内容: (1)实视图的选择是数据仓库开发中的重要问题。数据仓库存储实视图主要为OLAP查询,用户查询响应时间是首要考虑的问题,本文提出查询代价视图选择问题,为解决该问题,给出了视图选择代价图及其构造方法。同时给出了查询代价视图选择问题的代价模型和实视图选择的过程。 (2)基于给出的代价模型,采用贪心算法动态实现实视图的选择。原有的贪心算法解决实视图选择问题时,需要人为的确定实视图的个数k,很难达到满意的结果,从而影响OLAP的分析质量。本文使用贪心算法动态的确定k值,采用满足查询代价给定的限制下,使维护代价最小的选择原则。 (3)本文提出了使用随机算法解决实视图选择问题。首先给出了遗传方法解决查询代价视图选择问题的算法(GA_VSP),提出对查询代价视图选择问题的遗传算法表示方法,针对给定的视图选择代价图,将其转换为遗传算法中的二进制编码,以及对应的遗传操作,同时定义了适应度函数。 在GA_VSP算法中,随着遗传进程的发展,产生合法解会变得越来越困难,很多解都被排除在外了,加长了产生解的时间,增大了产生解的难度。因此,本文提出一种改进算法(SAGA_VSP),将模拟退火思想和遗传算法综合在一起,来解决查询代价视图选择问题。改进的算法中利用遗传规则产生选择实视图的方案,利用模拟退火的思想判断是否接受该方案,这样进一步扩展解的选取空间,保持解的多样性,降低产生解的难度,从而去找到近似最优解。 为了测试实视图选择算法的功能和效率,进行了实验模拟,证明了所采用的方法给出了实视图选择的近似解,同时也表明对查询代价视图选择问题,GA_VSP算法优于贪心算法,SAGA_VSP的算法优于GA_VSP算法。随机算法用于实视图的选择将成为数据仓库开发中有价值的工具。 (4)实视图的维护有重新计算和增量维护两种方法。本文采用增量维护的方法,但在增量计算中,同一个视图采用不同的方法,其增量的计算量是不同的,导致的视图维护代价也不同,因此提出最小增量维护的思想和策略,给出实视图和增量表达式的定义以及最小增量维护的算法。在数据量极大的数据仓库中,这种方法降低了实视图的维护代价,提高了数据仓库的处理效 哈尔滨工程大学博士学位论文 率。 (5)本文利用实视图技术来优化查询。在分析传统优化查询方法的基础 上,对其进行改进和扩展,给出了使用实视图进行优化查询的方法和策略, 以有效提高查询处理速度。 (6)本文通过分析数据仓库体系模型的特点,结合CRGC一CIMS工程, 提出在CIMS环境下数据仓库的体系结构,并给出CRGC一CIMS的数据仓库 的建模及总体结构,以为实视图技术的进一步研究提供一个应用环境。
【学位授予单位】:哈尔滨工程大学
【学位级别】:博士
【学位授予年份】:2004
【分类号】:TP311.13

知网文化
【相似文献】
中国期刊全文数据库 前10条
1 伍小荣,伍庆华;数据仓库技术的研究现状和未来方向[J];现代电子技术;2002年06期
2 赵军,王国胤,吴中福,李华;数据仓库及其实现[J];数字通信;2000年08期
3 徐忠健,袁捷,陆菊康,陈毛狗;超市决策支持系统的数据仓库的设计与实现[J];计算机工程与应用;2003年18期
4 廖飒;;实视图一致性维护ECA算法的改进[J];长春工业大学学报(自然科学版);2008年04期
5 刘玉葆,孟志青;数据仓库中数据查询的一种实现策略[J];零陵师范高等专科学校学报;1999年03期
6 赖明珠;周丽娟;;基于AO View Graph的实视图选择算法的研究[J];哈尔滨理工大学学报;2006年06期
7 蒋文伟,许华虎,唐毅;基于Agent的数据仓库的研究[J];计算机工程;2001年03期
8 柳池,周丽娟,林文卿;实视图选择技术的研究及实现[J];哈尔滨理工大学学报;2005年03期
9 庄冠华,骆斌,陈世福;对象视图模型及其创建和删除算法[J];计算机应用研究;2004年06期
10 葛学彬;周丽娟;王林爽;石倩;;数据仓库中新型动态实视图选择调整算法[J];计算机工程与应用;2010年08期
中国重要会议论文全文数据库 前10条
1 严哲南;楼荣生;;窗口算法问题的解决方案[A];第十六届全国数据库学术会议论文集[C];1999年
2 杨崇联;谢旭升;;基于数据仓库的政府决策支持服务系统研究与实现[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
3 刘刚;付忠广;申鹏飞;郑玲;靳涛;;基于发电厂机组数据仓库的数据挖掘系统的研究[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年
4 姚卿达;屈定春;;联邦数据库互操作方法在数据仓库中的应用[A];数据库研究进展97——第十四届全国数据库学术会议论文集(下)[C];1997年
5 唐蕾;张剡;柏文阳;徐洁磐;;数据仓库工具集NGDW-1的设计与实现[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
6 廖燕玲;卢语丹;阮艳萍;高丽金;;高校教学决策支持系统的数据仓库研究[A];Proceedings of 2010 National Vocational Education of Communications and Information Technology Conference (2010 NVCIC)[C];2010年
7 宋擒豹;沈钧毅;;数据仓库体系结构研究[A];第十六届全国数据库学术会议论文集[C];1999年
8 刘伟宏;李晋晋;何瑷;徐洁磐;;数据仓库及其在OMNIX中的实现[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
9 曹顺良;李荣;张忠平;汪卫;朱扬勇;李亦学;;BioDW:一个整合的生物信息学数据仓库平台[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
10 毛明志;黄春贤;;一种新的数据仓库ETL框架及其应用[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
中国重要报纸全文数据库 前10条
1 段云峰 杨凤年 宋俊德;数据仓库必不可少[N];计算机世界;2002年
2 ;“快钱”的速度[N];网络世界;2005年
3 ;IBM DB2商业智能软件[N];中国计算机报;2007年
4 刘庆;颗粒归“仓”,刀枪入“库”[N];网络世界;2006年
5 本报记者 赵晓涛;中国人保试点数据仓库[N];网络世界;2004年
6 本报记者 潘永花;实时企业的决策引擎[N];网络世界;2005年
7 邹大斌;关注商业智能的性能[N];计算机世界;2007年
8 ;数据仓库向外部用户开放[N];网络世界;2007年
9 本报记者 谌力;心甘情愿的“不归路”[N];网络世界;2005年
10 ;企业范围内部署BI效果更佳[N];网络世界;2010年
中国博士学位论文全文数据库 前10条
1 周丽娟;数据仓库中实视图的选择与维护技术的研究[D];哈尔滨工程大学;2004年
2 孟京辉;经营单位级森林经营数据仓库研建及应用研究[D];中国林业科学研究院;2011年
3 朱传华;三峡库区地质灾害数据仓库与数据挖掘应用研究[D];中国地质大学;2010年
4 陈燕;数据仓库的设计与实现[D];大连理工大学;2000年
5 克里木;自适应数据仓库系统的研究与实现[D];大连理工大学;2003年
6 宋杰;面向多类型数据源的数据仓库构建及ETL关键技术的研究[D];东北大学;2008年
7 曹恒;北京市房山区环境污染突发事件应急决策支持系统研究[D];北京林业大学;2012年
8 陈金玉;数据仓库实体化视图联机—致性维护研究[D];重庆大学;2002年
9 徐小博;客户关系管理系统的安全防护机制[D];吉林大学;2012年
10 麦永浩;数据仓库和数据挖掘方法研究及其在公安信息建设中的应用[D];华东理工大学;2000年
中国硕士学位论文全文数据库 前10条
1 陈思维;基于数据仓库的区域环境质量预测分析系统[D];电子科技大学;2010年
2 张艳;维度建模在电信数据仓库中的应用[D];西安电子科技大学;2010年
3 蒋昙飞;面向社区服务的数据仓库关键技术研究与实现[D];西安电子科技大学;2009年
4 彭辛庚;电信企业数据仓库经营分析系统的设计与实现[D];湖南大学;2009年
5 赵在宽;基于数据仓库的气象干旱指标挖掘研究与实现[D];解放军信息工程大学;2009年
6 李慧;基于数据仓库的图书馆决策支持系统[D];天津大学;2010年
7 袁玮;新疆联通经营分析系统中数据仓库的应用[D];电子科技大学;2009年
8 文宇;点击流数据仓库在电子商务中的应用研究[D];电子科技大学;2009年
9 张静波;基于数据仓库的企业决策支持系统的研究与应用[D];电子科技大学;2009年
10 字锦茗;数据仓库技术在机场管理中的应用[D];昆明理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026