收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于PR-tree的多维关联规则的研究与实现

粟莉萍  
【摘要】:关联规则挖掘是数据挖掘的一个重要研究分支,以从大型数据库中提取知识的主要手段,有效地来解决“数据丰富、知识贫乏”的现状,因此具有较大的理论研究与应用价值。关联规则挖掘主要是发现大量数据库中项集之间的关联关系,通过发现的关联关系来指导相关决策和行动。 目前,关联规则挖掘成果颇为丰富、研究非常活跃且研究分支比较广泛。研究重点从单维关联规则逐渐扩展到多维关联规则挖掘,如何提高挖掘算法的时空效率始终是研究的核心问题。本文针对如何提高挖掘算法效率这一核心问题进行了相关理论研究,并通过实验对相关理论做了验证。 本文的主要研究内容包括: 1.首先对关联规则挖掘的相关概念、基本框架、相关技术和任务作了介绍。接着重点介绍了关联规则的几个经典算法——包括Apriori算法、DHP算法和FP-Growth算法,描述了上述算法的原理和频繁项目集生成过程,分析了算法存在的问题及具有的优势。然后,介绍了基于数据立方体的多维关联规则挖掘算法,描述了该算法的具体步骤、相关技术,分析了算法的特性和适应度。 2.提出了基于前缀存储的关联规则挖掘算法。该算法是在结合原有的关联规则算法(主要有Apriori算法、DHP算法、FP-Growth算法)的基础上,利用数据压缩组合技术提出了一种新的使用前缀树的改进算法。其原理是,将具有相同前缀的项目集压缩为一个子集合作为一个结点,该结点下的所有项目集共同享有同一前缀集。这样,使得用于存储项目集的临时内存空间大大减少,且候选项目集直接根据结点的前缀和后缀产生,省略了项目集能否自连成功的判断时间。另外,算法增加了头链表集,使任意一个含有相同的谓词值的结点在树中通链表链接起来,方便了查找树结点。此外,由于采用分段处理的思想,不仅可以针对大量数据的单维关联规则通过分段处理在可接受的时效范围内得到最终频繁项目集,还可以有效的分步分层挖掘出多维关联规则,使得在资源条件有限的情况挖掘混合多维关联规则成为可能。其中,在挖掘频繁2-项目集时,采用类似于Hash函数的思想单独处理,由数据库直接生成候选2-项目集,提高频繁2-项目集的产生。 3.结合理论研究,通过对上百万条记录实验对算法加以论证。分析实验结果,证实算法的可行性,并对算法的不足做了补充,为后期研究提供方向。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 方旺盛,郑剑,邵利平;基于多维关联规则的算法研究及系统实现[J];计算机与数字工程;2004年04期
2 程琳;夏颖;;使用标准SQL实现多维关联规则的挖掘[J];安徽电气工程职业技术学院学报;2007年01期
3 程琳;王胜和;;道路交通事故中关联规则的应用研究[J];中国人民公安大学学报(自然科学版);2009年01期
4 徐江勇;;多维关联规则技术在进出口贸易分析中的应用[J];计算机应用与软件;2008年12期
5 程琳;;面向目标属性的犯罪行为关联分析[J];计算机时代;2010年02期
6 罗奇;吴彦文;徐鸣生;王强;;网络学习中学习者个性挖掘算法的研究[J];华中师范大学研究生学报;2005年02期
7 高艳霞;;关联规则在高校学生培养中的应用[J];现代计算机(专业版);2009年09期
8 尚威;尚宁;覃明贵;崔中发;崔岩;朱扬勇;;交通事故的多维关联规则分析[J];计算机应用与软件;2006年02期
9 高学东,王文贤,武森;基于数据立方体的多维关联规则的挖掘方法[J];计算机工程;2003年14期
10 钟勇;秦小麟;包磊;;一种基于多维集的关联模式挖掘算法[J];计算机研究与发展;2006年12期
11 曾志勇;余建坤;翟勇;;一种多维时态关联规则数据挖掘算法[J];云南大学学报(自然科学版);2006年S2期
12 唐培丽;解飞;胡明;;基于数据仓库的多维关联规则挖掘在电信系统中的应用[J];情报科学;2007年10期
13 李明;郑波;;基于多维关联规则建立错误数据诊断模式[J];电脑知识与技术;2008年01期
14 王敏;;一种基于位图矩阵技术的多维关联规则改进算法[J];赣南师范学院学报;2010年03期
15 马书刚;崔忠强;;多维关联规则推荐在商务站点中的应用[J];微计算机信息;2007年12期
16 刘燕;陆玉昌;陈海红;;基于关联规则的ICAI系统教学模式优化与调度[J];计算机工程;2008年07期
17 陶振海;谢凯年;;审计数据多维关联规则挖掘算法[J];计算机应用与软件;2008年09期
18 陶多秀;吕跃进;邓春燕;;基于粗糙集的多维关联规则挖掘方法[J];计算机应用;2009年05期
19 陈伟珂;李金玲;;地铁施工事故的多维关联规则分析[J];石家庄铁道大学学报(自然科学版);2010年04期
20 张晗;潘正运;张燕玲;;基于数据立方体的多维关联规则在旅游服务中的应用[J];电子工程师;2006年06期
中国重要会议论文全文数据库 前10条
1 宋国杰;范明;;一种多维关联规则挖掘的模型与算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
2 蔡国强;李川;范明;;一个高效的多维关联规则挖掘算法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 孙艺峻;张宏莉;何慧;;大规模网络安全态势分析中的报警关联规则挖掘[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
4 吉根林;杨明;孙志挥;;分布式数据库中频繁项目集的快速更新[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
5 李国和;马玉书;;基于关系数据库环境的频繁项目集的求解方法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
6 杨明;孙志挥;;一种基于最大加权频繁项目集的数据库相似性判别算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 朱玉全;杨鹤标;陆介平;宋余庆;;一种基于约简模式的频繁项目集挖掘算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
8 刘燕;;一个加权频繁项目集的支持度下界[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
9 李锦泽;叶晓俊;;关联规则挖掘算法研究现状[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
10 沈亚兰;王向东;王晓峰;;基于粒计算和等价类的关联规则挖掘算法[A];2006中国控制与决策学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 董俊;基于KDD的领域本体构建若干关键问题研究[D];南京邮电大学;2011年
2 李川;中医药数据挖掘系统TCMiner设计、实现与核心技术研究[D];四川大学;2006年
3 马超飞;基于关联规则的遥感数据挖掘与应用[D];中国科学院研究生院(遥感应用研究所);2002年
4 王德兴;基于概念格模型关联规则挖掘的关键问题研究[D];合肥工业大学;2007年
5 刘勇;频繁模式挖掘相关技术研究[D];复旦大学;2007年
6 缪裕青;关联规则挖掘及其在基因表达数据中的应用[D];中国科学技术大学;2007年
7 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
8 金胜男;基于多层关联规则的概念分层知识库中知识发现的研究[D];天津大学;2006年
9 陈健美;基于密度聚类和多特征融合的医学图像识别研究[D];江苏大学;2008年
10 周翀;搜索引擎中文档聚类方法研究[D];华中科技大学;2009年
中国硕士学位论文全文数据库 前10条
1 粟莉萍;基于PR-tree的多维关联规则的研究与实现[D];广东工业大学;2011年
2 朱琰;多维关联规则的研究[D];郑州大学;2001年
3 李薇;基于云模型的多维关联规则的研究与应用[D];西安建筑科技大学;2011年
4 余冰;基于Mondrian平台的多维关联规则算法的研究和应用[D];华南理工大学;2011年
5 宋国杰;多维关联规则挖掘研究[D];郑州大学;2001年
6 于利霞;天津市城建服务热线的数据分析系统研究[D];天津大学;2012年
7 牛常勇;多维关联规则挖掘算法[D];郑州大学;2001年
8 张磊;基于高级SQL查询的分布式多维关联规则挖掘算法的研究[D];天津理工大学;2010年
9 成文奇;关联规则算法及其应用研究[D];中南大学;2003年
10 马安胜;多维数据关联规则挖掘研究及系统实现[D];吉林大学;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978