收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于频繁项集的互补替代关系挖掘算法

王春丽  
【摘要】:20世纪80年代以来,随着数据库和信息技术的发展与广泛应用,各个应用领域均累积了海量的数据,且数据呈几何级数增长。而存储在大型数据库中的海量数据包含了大量的、有利于决策者作出英明判断的信息。但是由于缺乏强有力的数据分析工具,这些数据就变成了无人问津的“数据坟墓”。这样,基于直觉和经验的决策者往往不能做出有利于应用领域的决定,使得这些包含有价值的数据无法发挥它们应有的决策指导作用。如何从海量数据集中提取出有利于商务决策的信息成为各个领域的需求,在这种情况下,数据挖掘应运而生,从不同的角度以不同的形式为商务策略、科学等各领域提供依据,推动了信息技术的迅猛发展。 本文研究的两项工作: 首先,频繁项集挖掘作为关联规则产生的首要步骤,其挖掘效率的高低直接影响着关联规则产生的总体效率。而数据集扫描次数和支持数计算效率一直是影响频繁项集挖掘的主要因素。本文以shariq bashir提出的TOP-N闭频繁项挖掘算法为基础,利用位向量映射技术,提出了基于索引的频繁项集挖掘算法。该算法用位向量表示数据集,仅需一次扫描数据集。频繁项集的挖掘过程采用集合枚举树的节点构造过程来表示,在创建节点枚举项的尾项支持数时,利用枚举项集的位索引,计算枚举项合并形成的新项集的支持数,同时引入广度扩展剪枝和区域索引跳过策略,从而快速地挖掘出频繁项,有效地提高了算法的执行效率;实验结果表明,该算法在稀疏数据集上有很高的运行效率。 其次,由于挖掘出的频繁项集可能包含大量的用户不感兴趣的规则,同时如果没有进一步的分析或领域知识,频繁项集并不能直接用于预测。如何消除频繁项集中用户不感兴趣的频繁项是频繁项集用于指导实践的瓶颈。所以,本文在基于索引的频繁项集挖掘算法基础上,本文又提出基于频繁项集的互补替代关系挖掘算法。该算法通过对已挖掘出的各频繁项集中的频繁项进行相关性计算,挖掘出频繁项之间的互补替代关系,去除噪声数据的影响,以图形的方式显式地向决策者展示出各个频繁项之间的互补(或替代)性,更便于决策者做出准确、合理的判断。实验表明,CAG比频繁项集表示的信息更有效,更精确。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 戴娟;邱雁;;数据库扫描的一种快速关联规则挖掘算法[J];考试周刊;2011年04期
2 何中胜,刘宗田;一种无候选集产生的并行关联规则挖掘算法[J];计算机工程与应用;2004年24期
3 李龙澍;王永;魏博诚;;一种基于SFP树的快速关联规则挖掘算法[J];计算机技术与发展;2011年05期
4 谈恒贵;王文杰;李克双;;频繁项集挖掘算法综述[J];计算机仿真;2005年11期
5 黄澍庄;;频繁项集挖掘算法分析与比较[J];德州学院学报;2005年06期
6 阮幼林;李庆华;杨世达;;一种基于事务树的快速频繁项集挖掘与更新算法[J];计算机科学;2005年02期
7 冯洁;陶宏才;;一种频繁项集的快速挖掘算法[J];微计算机信息;2007年18期
8 胡燕;韩瑞雪;;基于Top-K项频繁模式挖掘的研究及实现[J];计算机与数字工程;2009年04期
9 余平;汪继文;;Apriori算法的一种改进研究[J];廊坊师范学院学报(自然科学版);2009年04期
10 仇闽霞;;数据挖掘中关联规则的算法及应用[J];苏州科技学院学报(自然科学版);2009年04期
11 王爱平;王占凤;陶嗣干;燕飞飞;;数据挖掘中常用关联规则挖掘算法[J];计算机技术与发展;2010年04期
12 侯新丽;孟晓伟;于松;;基于矩阵的加权关联规则挖掘算法[J];电脑开发与应用;2010年06期
13 潘怡;杜红燕;;数据流频繁闭项集挖掘研究[J];长沙大学学报;2010年05期
14 王治和;;一种基于关系数据库的频繁项集挖掘算法[J];计算机科学;2006年09期
15 章志明;黄龙军;余敏;黄明和;;一种动态的频繁项集挖掘算法[J];计算机工程;2006年24期
16 王朝辉;王婷婷;;一种快速的频繁项集挖掘算法[J];贵州工业大学学报(自然科学版);2006年06期
17 王柏盛;刘寒冰;靳书和;马丽艳;;基于矩阵的关联规则挖掘算法[J];微计算机信息;2007年15期
18 程杰;;基于二进制的频繁项集挖掘新算法[J];电脑知识与技术;2009年13期
19 汪成亮;罗昌银;;一种基于组合方式改进的频繁项集挖掘算法[J];计算机系统应用;2010年01期
20 刘海蓉;闫仁武;;一种改进的加权关联规则挖掘算法[J];现代电子技术;2011年12期
中国重要会议论文全文数据库 前10条
1 陈晓云;李龙杰;马志新;白伸伸;王磊;;AFP-Miner:一种新高效的频繁项集挖掘算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
2 杨晓明;王晨;汪卫;张守志;施伯乐;;频繁项集的精简表达与还原问题研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 沈向余;李伟华;;几种关联规则挖掘算法的分析[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
4 刘马金;王鹏;汪卫;;一种轮转的数据流频繁项挖掘算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
5 丁艳辉;王洪国;高明;谷建军;;一种基于矩阵的高效关联规则挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
6 李坤;王永炎;王宏安;;一种基于乐观裁剪策略的挖掘数据流滑动窗口上闭合频繁项集的算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
7 柴明亮;李宁宁;宋苏;;平均阈值关联规则挖掘算法[A];2005年中国智能自动化会议论文集[C];2005年
8 谢志军;陈红;;EFIM——数据流上频繁项集挖掘的高性能算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
9 杨子良;陶宏才;;一种基于向量运算的频繁项集快速挖掘算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
10 王晨;朱永泰;汪卫;施伯乐;;高效地挖掘频繁图模式[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 毛伊敏;数据流频繁模式挖掘关键算法及其应用研究[D];中南大学;2011年
2 屠莉;流数据的频繁项挖掘及聚类的关键技术研究[D];南京航空航天大学;2009年
3 王卉;最大频繁项集挖掘算法及应用研究[D];华中科技大学;2004年
4 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年
5 陈耿;面向中观审计的规则发现算法研究[D];东南大学;2005年
6 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
7 叶飞跃;关联规则及其元规则挖掘技术研究[D];南京航空航天大学;2006年
8 李力;数据挖掘方法研究及其在中药复方配伍分析中的应用[D];西南交通大学;2003年
9 王述云;数据流频繁项挖掘与聚类分析的研究[D];复旦大学;2008年
10 李海波;频繁子结构挖掘算法研究与应用[D];华中科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 王春丽;基于频繁项集的互补替代关系挖掘算法[D];郑州大学;2011年
2 徐艳红;基于倾斜时间窗口的频繁项集挖掘算法研究[D];哈尔滨工程大学;2010年
3 王立波;基于滑动窗口的数据流频繁模式挖掘算法研究[D];燕山大学;2010年
4 郭静;最大和最长频繁项集增量更新研究[D];燕山大学;2010年
5 冯沙沙;基于位表的频繁项集挖掘算法研究[D];燕山大学;2012年
6 汪金苗;基于不确定数据的频繁项集挖掘算法的研究[D];山东理工大学;2012年
7 熊金芬;一种高效频繁项集挖掘算法的研究[D];哈尔滨工程大学;2006年
8 张小彬;数据流中频繁项集挖掘算法及其应用研究[D];五邑大学;2009年
9 彭学武;基于位运算的闭频繁项集挖掘算法的研究[D];郑州大学;2010年
10 赵娟;一种基于矩阵的并行频繁项集挖掘算法研究与实现[D];兰州大学;2011年
中国重要报纸全文数据库 前10条
1 李国辉 张军 汤义;挖掘技术直面多媒体[N];计算机世界;2002年
2 记者 王薇杨晴川;奥巴马所获“超级代表”支持数量首超希拉里[N];人民政协报;2008年
3 高愉;新无线MAN支持数百个连接[N];中国计算机报;2004年
4 中国人民大学数据仓库与商务智能工程研究中心 $$  中国人民大学数据与知识工程研究所王珊、谢佳明、陈红、刘中蔚、邵琦洪、张宁;创建数据仓库:要面向三条路线[N];中国计算机报;2002年
5 ;数据挖掘流程[N];人民邮电;2001年
6 梁芳;不间断才安全[N];中国计算机报;2002年
7 孙富春 李磊;电子政务中的数据挖掘[N];计算机世界;2001年
8 武李 林姚;“钻石眼”图像挖掘系统[N];计算机世界;2002年
9 江青;海尔出击智能分析软件[N];计算机世界;2002年
10 黄予辉;选择合适的ETL工具[N];网络世界;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978