收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

最大频繁项集挖掘算法的研究

颜跃进  
【摘要】:随着信息技术尤其是网络技术的快速发展,人们收集、存储和传输数据的能力不断提高,导致数据出现了爆炸性增长。与此形成鲜明对比的是,对人们决策有价值的知识却非常匮乏。知识发现与数据挖掘正是在这一背景下诞生的一门新科学。 关联规则是数据挖掘当前研究的主要模式之一,它用于确定数据集中不同域或属性之间的联系,找出有价值的多个域之间的依赖关系。频繁项集挖掘是生成关联规则的关键步骤,其效率问题是关联规则挖掘中的一大难点和热点。频繁项集挖掘可分为完全频繁项集挖掘、频繁闭项集挖掘和最大频繁项集挖掘三类。论文基于数据集和最大频繁项集的不同表示结构,从剪枝策略、尾项集的项排序策略和超集存在判断方法等角度对最大频繁项集的挖掘问题进行了深入的分析和研究。 位图是—种有效的数据集和项集的表示结构。论文基于位图提出了深度优先挖掘算法DFMfi。算法DFMfi充分利用位图的字节特性,优化了项集的匹配和合并操作,并首次在其中引入了基于局部最大频繁项集的超集存在判断方法。论文证明了算法DFMfi的正确性,并通过实验说明其在运行时间上少于同类算法。 近几年来,数据集的另—种压缩表示结构—FP-Tree结构越来越受到研究者们的青睐,论文第二部分研究基于FP-Tree结构的最大频繁项集挖掘问题,其中使用FP-Tree表示数据集及其投影,并利用MFI-Tree保存已有最大频繁项集。分析和实验说明已有算法中的超集存在判断为耗时操作,针对这种情况,论文在单棵MFI-Tree表示下基于最大频繁项集投影提出一种新的超集存在判断方法,并证明了多棵MFI-Tree表示下存在一种简单的超集存在判断方法,二者均可有效降低超集存在判断的时间开销。相应于两种超集存在判断方法,论文分别提出了算法FPMFI和FIMFI。在算法FIMFI里,论文分析了尾项集的项排序策略对压缩搜索空间的影响,提出了一种高效的、基于FP-Tree和MFI-Tree信息的尾项集项排序策略。通过使用新的前瞻剪枝方法,算法FIMFI拓展了前瞻剪枝的范围,加大了前瞻剪枝成功的可能性,尽可能地压缩了搜索空间。此外,FPMFI算法中的非冗余子树结构是寻求高效数据集压缩结构的一次尝试。实验表明,在稠密数据集上,这两个算法相对于同类算法均具有一定的优越性。其中FIMFI算法比同类算法中性能最优的FPMax~*算法平均快30%-40%。 论文最后提出一种能同时压缩表示数据集和最大频繁项集的新的数据结构—CFP-Tree,基于CFP-Tree结构定义了最大化子集,并提出了CfpMfi算法。通过其与FPMax~*


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张丽;;关联规则挖掘研究[J];赤峰学院学报(自然科学版);2009年05期
2 黄海燕;刘欣;;数据挖掘中的关联规则方法[J];软件导刊;2009年04期
3 黄海燕;刘欣;;数据挖掘中的关联规则方法[J];软件导刊;2009年05期
4 朱慧爽;;数据挖掘在纺织高校科研管理系统中的应用[J];山东纺织经济;2008年03期
5 赵艳丽;张晓华;魏权利;;一种基于改进型遗传算法的关联规则挖掘方法[J];计算机与信息技术;2008年11期
6 沈良忠;;关联规则中Apriori算法的C#实现研究[J];电脑知识与技术;2009年13期
7 张春华;孙国春;;关联规则挖掘算法研究与实现[J];电脑编程技巧与维护;2009年S1期
8 彭慧伶;刘发升;;关联规则挖掘与分类规则挖掘的比较研究[J];计算机与现代化;2006年07期
9 刘松;;一种非频繁关联规则挖掘算法[J];微计算机应用;2006年05期
10 王自力;;关联规则挖掘在网络教学评价中的应用[J];科技资讯;2006年30期
11 彭银香;何小东;朱志勇;;基于免疫算法的多维关联规则挖掘方法[J];微计算机信息;2007年03期
12 朱建荣;宋鸾姣;;基于遗传算法的关联规则挖掘研究[J];科技情报开发与经济;2007年25期
13 解飞;唐培丽;魏宁;;基于数据立方体的关联规则挖掘方法研究[J];气象水文海洋仪器;2008年01期
14 张蕾;钱峰;;一种关联规则增量式更新算法[J];铜陵学院学报;2008年02期
15 赖万钦;雷筱珍;;一种改进的基于关联规则挖掘的遗传算法[J];电脑知识与技术;2008年35期
16 成平广;成金梅;;一种改进的关联规则挖掘算法及其应用[J];重庆教育学院学报;2008年06期
17 刘红梅;;浅谈数据挖掘中的关联分类技术[J];华章;2008年Z2期
18 王曙燕;王晓梅;;关联规则挖掘算法在分类中的应用研究[J];计算机与数字工程;2009年08期
19 余小双;姜明华;;基于遗传算法的关联规则挖掘方法[J];软件导刊;2009年10期
20 董引娣;;数据挖掘中关联规则在零售业中的应用[J];重庆科技学院学报(自然科学版);2010年01期
中国重要会议论文全文数据库 前10条
1 刘晓燕;单晓红;;遗传算法在关联规则挖掘中的应用[A];第六届中国青年运筹与管理学者大会论文集[C];2004年
2 温磊;李敏强;;基于有向项集图的频繁项集增量更新挖掘算法[A];2004中国控制与决策学术年会论文集[C];2004年
3 贺庆;冯海旗;;基于关联规则挖掘的隐私保护方法研究[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
4 温磊;牛东晓;何永贵;;基于权重约束的频繁项集挖掘算法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
5 刘扬;曹惠玲;梁大敏;;关联规则挖掘在航空发动机QAR数据中的应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
6 李锦泽;叶晓俊;;关联规则挖掘算法研究现状[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 陈波;董鹏;邵勇;;基于Apriori算法及其改进算法综述[A];中国通信学会第五届学术年会论文集[C];2008年
8 郭云峰;张集祥;;一种基于位向量的关联规则挖掘算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 方炜炜;杨炳儒;唐志刚;杨君;;基于客观兴趣度的关联规则优化算法研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
10 叶强;李一军;;基于支持度-显著度的关联规则分类方法研究[A];管理科学与系统科学研究新进展——第8届全国青年管理科学与系统科学学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 颜跃进;最大频繁项集挖掘算法的研究[D];国防科学技术大学;2005年
2 王德兴;基于概念格模型关联规则挖掘的关键问题研究[D];合肥工业大学;2007年
3 林晓勇;频繁模式挖掘和动态维护的理论与方法研究[D];北京化工大学;2008年
4 韩颖;新型农村合作医疗数据挖掘研究[D];山西医科大学;2009年
5 齐建东;基于数据挖掘的入侵检测方法及系统研究[D];中国农业大学;2003年
6 张晓辉;云理论和数据挖掘在水上安全分析中的应用[D];大连海事大学;2011年
7 何月顺;关联规则挖掘技术的研究及应用[D];南京航空航天大学;2010年
8 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
9 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
10 刘智;关联规则挖掘方法及其在冠心病中医诊疗中的应用研究[D];大连海事大学;2012年
中国硕士学位论文全文数据库 前10条
1 曾海颖;客户关系管理中的数据挖掘[D];南京航空航天大学;2003年
2 邹丽;分布式系统下关联规则挖掘的研究与实现[D];大连交通大学;2005年
3 徐勇;基于概念格模型的分布式关联规则挖掘研究[D];合肥工业大学;2006年
4 唐文志;蚁群算法在关联规则学习中的研究与应用[D];北京工业大学;2009年
5 黄鹏鹤;关联规则挖掘及其在教务管理中的应用[D];大连交通大学;2005年
6 梁碧珍;目标频繁项集挖掘算法与应用研究[D];广西大学;2007年
7 陈华胜;基于数据挖掘的入侵检测系统的研究[D];武汉理工大学;2004年
8 武建虎;关联规则及其在肝癌病人资料分析中的应用研究[D];第二军医大学;2005年
9 姜晗;关联规则的精简方法研究[D];浙江师范大学;2007年
10 张声雷;基于量化关联规则挖掘的就业分析系统[D];上海海事大学;2005年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978