收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于数据立方体和钻取技术的多维关联规则挖掘方法的研究

崔宇  
【摘要】:随着数据库管理系统在各个不同领域的广泛应用,数据库应用技术也不断的迅速发展,人们积累的数据越来越多。关联规则挖掘是数据挖掘技术中一种十分有用的方式。许多的研究人员对关联规则的挖掘问题进行了大量的研究。它们的工作包括对原有的算法进行优化,如引入随即采样、并行的思想等,以提高算法挖掘规则的效率;对关联规则的应用进行推广。 然而,经典单维布尔算法Apriori算法的核心是基于频集理论的递推方法,这是由Apriori性质决定的。为了避免频集方法的一些缺陷,我们需要探索挖掘关联规则的新方法。 随着数据库和数据仓库的发展,如何利用数据仓库中经过加工的数据进行数据挖掘已经成为一个重要的研究问题。 基于数据仓库的联机分析处理(OLAP)技术是根据数据分析的需要,从原始数据中构造各种数据立方体,并对数据立方体进行有关操作,把结果返回给用户的过程。我们知道数据仓库与数据挖掘之间有着非常密切的关系。 数据挖掘是建立在数据仓库上的决策支持技术。数据挖掘是从大量的数据中筛选潜在的有用信息的过程。它分为4个步骤:数据选择、数据转换、数据挖掘和结果分析。 本文之所以引入在数据仓库系统中使用数据挖掘技术的关联规则挖掘方法是由于吸收了联机分析处理技术的钻取操作的长处。与此同时,我们摒弃了由Apriori性质带来的多次扫描数据库和修剪频繁项集的麻烦。避免了在调整维层次时,增加计算机的负担,从而提高了算法的效率。 目前,基于数据立方体的多维关联规则挖掘的研究主要集中在针对不同密度的数据立方体的算法的改进,特别是对稀疏数据立方体有效的算法研究成果很多。在收集的资料中,我发现了把多维数据的关联规则挖掘用OLAP技术的钻取操作是可以实现的;并且希望在不使用Apriori性质的情况下得到有效的 WP=51 挖掘。 第1章主要介绍了基本概念。它包括关联规则和它的种类,多维关联规则及分类,数据立方体和结构,OLAP技术,上钻、下钻和数据仓库的多维数据模型。 第2章介绍了基于数据立方体的多维关联规则挖掘和Apriori_cube算法。它是总结前人的结论。首先,它描述了基于数据立方体的多维关联规则挖掘。其次,它分别说明了每一步并阐述了Apriori算法。最后,它从时间和效率方面进行了算法分析。 第3章介绍了Apriori_cube算法的改进。它描述了算法的核心思想,并定义了Apriori_cube_dimenlevel算法,还进行了算法分析。 第4章是实验环节。我们使用SQL Server 7.0,讨论Apriori_cube_dimen -level算法的优点。 第5章是结论。我们总结了本文的成果和不足。 纵观全文我们知道挖掘多维关联规则不仅需要数据库方面的理论知识,还需要数据仓库的管理实践,特别是OLAP技术的应用。这一算法加强了维层次的调整,更符合用户的需求。通过实验的分析说明Apriori_cube_dimenlevel算法是有意义和可以实现的。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 黄世国;林思祖;;基于数据立方体技术的杉木气候产量分析[J];亚热带农业研究;2006年03期
2 郝善勇,刘玉树;金融投资决策中的模型管理子系统[J];教育信息化;2000年05期
3 李盛恩;张绍兰;巩建国;;ROLAP环境下数据立方体的计算框架[J];计算机科学;2004年10期
4 迟忠先,李艳红,张春涛;OLAP核心技术—数据立方体的研究现状与展望[J];计算机工程;2002年10期
5 师智斌;黄厚宽;;数据立方体聚集范围查询分块方法研究[J];计算机科学;2007年12期
6 师智斌;黄厚宽;靳燕霞;;一种适应于动态环境范围查询的数据立方体[J];北京交通大学学报;2008年02期
7 解飞;唐培丽;魏宁;;基于数据立方体的关联规则挖掘方法研究[J];气象水文海洋仪器;2008年01期
8 向阳,王庆大,张迎春;MS OLAP数据立方自动增量更新的程序实现[J];计算机工程;2005年20期
9 陈基漓;;基于数据立方体的网络教学评价模型[J];电脑知识与技术(学术交流);2006年08期
10 穆云婷;谢文阁;;基于FP-Growth算法的多维关联规则挖掘方法[J];辽宁工业大学学报(自然科学版);2010年02期
11 孙延凡,陈红;GSFC——基于图结构的Free Cube存储方法[J];计算机研究与发展;2004年10期
12 汤海鹏,毛克彪,覃志豪,吴毅;空间数据挖掘工具浅谈[J];测绘与空间地理信息;2005年03期
13 李盛恩;徐进;张绍兰;;基于混合存储结构的数据立方体生成算法[J];计算机应用与软件;2006年01期
14 谭学清;罗琳;周洞汝;;数据立方体上的约束关联规则挖掘[J];情报科学;2007年01期
15 杨科华;;基于数据立方体维层次的OLAP安全性策略[J];应用科学学报;2008年02期
16 唐萍;;分布式空间数据仓库的构建与OLAP服务实现[J];计算机与现代化;2010年05期
17 高学东,王文贤,武森;基于数据立方体的多维关联规则的挖掘方法[J];计算机工程;2003年14期
18 李盛恩,张志军;实例化视图选择算法PBC[J];计算机工程与应用;2005年07期
19 马飞,马彪;一种基于数据立方体的数据挖掘技术的研究[J];中国仪器仪表;2005年10期
20 武晓新;王志蓬;赵宇海;;数据立方体计算研究[J];鞍山师范学院学报;2007年02期
中国重要会议论文全文数据库 前10条
1 钟静华;冯少荣;段江娇;林子雨;薛永生;;数据立方体的带有动态调整的遗传选择算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
2 姜力争;杨冬青;唐世渭;马秀莉;张德辉;;数据立方体切片的核心聚类分析方法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
3 班鹏新;张勇;;OLAP中紧凑数据立方体研究综述[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
4 张德辉;唐世渭;杨冬青;马秀丽;姜力争;;数据立方体上的虚拟视图机制[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
5 裴健;赵畅;柴玮;杨冬青;唐世渭;;联机分析处理的数据立方体代数描述[A];第十六届全国数据库学术会议论文集[C];1999年
6 刘红敏;韩燮;;数据立方体高效计算方法研究与实现[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
7 韩矞;贾焰;甘亮;;一种基于网络安全数据流的混合CUBE模型[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
8 潘玉奇;石冰;周劲;袁宁;;基于多维数据模型的聚类分析的研究[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
9 杨静;;基于数据仓库决策分析的电力系统应用研究[A];安徽省电机工程学会优秀学术论文集(2002-2003)[C];2005年
10 薛永生;黄震华;段江娇;张延松;吕晓华;;一种并行处理多维连接和聚集操作的有效方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 高雅卓;多维联机分析处理中的高效查询关键方法研究[D];合肥工业大学;2012年
2 师智斌;高性能数据立方体及其语义研究[D];北京交通大学;2010年
3 孟辉;基于图表达蛋白质组学质谱模式的癌症诊断可视化方法研究[D];燕山大学;2011年
4 钱路路;计算光谱成像技术研究[D];中国科学技术大学;2013年
5 易文晟;图像语义检索和分类技术研究[D];浙江大学;2007年
6 刘天桢;基于多维数据分析的神经网络与分布式计算研究[D];武汉理工大学;2008年
7 于海鸿;多维数据环境中决策支持相关技术研究及应用[D];吉林大学;2007年
8 刘良云;计算层析成象光谱技术的研究[D];中国科学院西安光学精密机械研究所;2001年
9 刘青宝;模糊、动态多维数据建模理论与方法研究[D];国防科学技术大学;2006年
10 史国栋;腰椎神经根损害的基础与临床研究[D];第二军医大学;2008年
中国硕士学位论文全文数据库 前10条
1 毛明湘;保险数据立方体的设计实现[D];山东大学;2005年
2 张军;基于特征的图像数据挖掘模型的研究[D];山东师范大学;2006年
3 彭志鹏;基于维层次数据立方体存储技术的研究[D];中南大学;2008年
4 徐峰;数据仓库技术在ERP中的应用研究[D];郑州大学;2004年
5 姜晶;基于数据仓库和OLAP技术的电子交警管理系统的研究与实现[D];哈尔滨工程大学;2007年
6 景宝华;数据立方体技术在网络数据流处理中的应用[D];南京理工大学;2011年
7 林海燕;多维查询分析算法研究[D];哈尔滨理工大学;2005年
8 王瑾;基于通用MIS系统数据的OLAP与决策分析[D];重庆大学;2005年
9 陈洪顺;基于数据仓库技术的财政收支查询分析系统的研究与实现[D];青岛大学;2005年
10 刘红敏;数据立方体生成技术研究[D];中北大学;2007年
中国重要报纸全文数据库 前6条
1 dwway 姜海;数据仓库在SCM中的应用[N];中国计算机报;2002年
2 ;视频数据中挖“宝”[N];计算机世界;2002年
3 记者 童铭 曹术华 朴华;金融展网上银行方案多[N];中国计算机报;2000年
4 ;Cognos EBI企业商务智能解决方案[N];中国计算机报;2002年
5 赵骏飞;数据挖掘在金融行业的应用[N];中国保险报;2011年
6 本报记者 许继楠;BI帮助雅戈尔整合供应链 实现零库存[N];中国计算机报;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978