收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于矩阵的频繁项集挖掘算法研究

王洪波  
【摘要】: 关联规则是数据挖掘领域的一个重要分支,它反映的是大量数据中间内在的关联联系,其目的是找出满足最小支持度和最小置信度要求的强关联规则。频繁项集挖掘是关联规则挖掘的关键步骤,也是数据挖掘的热点和难点问题。可见,频繁项集挖掘是一个具有重要理论意义和广阔应用前景的研究课题。 频繁项集挖掘算法研究。本文在对关联规则挖掘问题简述的基础上,深入地探讨了典型的频繁项集挖掘算法Apriori和FP-Growth,并关注了几种改进的频繁项集挖掘算法,介绍了频繁项集挖掘问题的最新扩展。 基于矩阵改进频繁项集挖掘。本文提出了一种改进的基于矩阵的频繁项集挖掘算法。该算法汲取了经典频繁项集挖掘算法的基本思想,引入了一种新的数据结构:IMoFI。该算法采用类似指针原理的间接寻址方式的索引技术,对位图模式存储的候选项集矩阵进行了内部编码,使矩阵IMoFI的元素不仅仅描述某个特定的频繁项目在某事务中的出现,而且描述频繁项目下次出现时所在事务的序号。结合辅助向量AV的使用,算法避免了候选项集的重复存储,有效地压缩了矩阵IMoFI的存储代价。通过以上改进,该算法为快速搜索频繁项目集合提供了非常有效的方法,从而提高了频繁项集挖掘的效率。 本文在.NET环境下,用C#语言实现了该算法,并令其与经典的频繁项集挖掘算法进行了比较,发现该算法在短模式数据上具有良好的性能,并对该算法提升挖掘性能的原因进行了归纳。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王艳;数据挖掘中关联规则的探讨[J];成都信息工程学院学报;2004年02期
2 龚贞标,陶树平;一种改进的关联规则增量式更新算法[J];福建电脑;2005年07期
3 章志明;黄龙军;余敏;黄明和;;一种动态的频繁项集挖掘算法[J];计算机工程;2006年24期
4 王朝辉;王婷婷;;一种快速的频繁项集挖掘算法[J];贵州工业大学学报(自然科学版);2006年06期
5 郭福亮;左凯伶;;关联规则挖掘中Apriori算法的一种改进[J];计算机与数字工程;2007年05期
6 王伟勤;钟敬堂;;对Apriori算法的一种改进[J];佛山科学技术学院学报(自然科学版);2007年02期
7 郭云峰;张集祥;;对关联规则挖掘中Apriori算法的一种改进[J];杭州电子科技大学学报;2009年02期
8 程杰;;基于二进制的频繁项集挖掘新算法[J];电脑知识与技术;2009年13期
9 沈良忠;;基于简单双矩阵的关联规则算法研究[J];温州大学学报(自然科学版);2009年06期
10 刘洋;王勇;;一种求极大频繁项集的挖掘方法[J];广西民族大学学报(自然科学版);2009年04期
11 汪成亮;罗昌银;;一种基于组合方式改进的频繁项集挖掘算法[J];计算机系统应用;2010年01期
12 才科扎西;黄景廉;;基于前缀树的高效频繁项集挖掘算法[J];计算机工程;2010年04期
13 李成军;杨天奇;;一种改进的加权关联规则挖掘方法[J];计算机工程;2010年07期
14 潘怡;杜红燕;;数据流频繁闭项集挖掘研究[J];长沙大学学报;2010年05期
15 陈建国;宋中山;;一种基于矩阵按位存储的Apriori改进算法[J];软件导刊;2010年10期
16 严菲;杨科华;;基于索引数组的频繁项集增量更新算法[J];微计算机信息;2010年33期
17 戴娟;邱雁;;数据库扫描的一种快速关联规则挖掘算法[J];考试周刊;2011年04期
18 汪金苗;张龙波;邓齐志;王凤英;王勇;;不确定数据频繁项集挖掘方法综述[J];计算机工程与应用;2011年20期
19 刘芝怡;尹飞鸿;;基于FP-矩阵的频繁项集挖掘算法[J];中国制造业信息化;2011年15期
20 牛小飞,石冰,卢军,吴科;挖掘关联规则的高效ABM算法[J];计算机工程;2004年11期
中国重要会议论文全文数据库 前10条
1 杨晓明;王晨;汪卫;张守志;施伯乐;;频繁项集的精简表达与还原问题研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 刘马金;王鹏;汪卫;;一种轮转的数据流频繁项挖掘算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
3 谢志军;陈红;;EFIM——数据流上频繁项集挖掘的高性能算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 李坤;王永炎;王宏安;;一种基于乐观裁剪策略的挖掘数据流滑动窗口上闭合频繁项集的算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
5 邹远娅;周皓峰;王晨;汪卫;施伯乐;;FSC——利用频繁项集挖掘估算视图大小[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
6 陈晓云;李龙杰;马志新;白伸伸;王磊;;AFP-Miner:一种新高效的频繁项集挖掘算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
7 陈建平;侯昌波;王功文;吕鹏;朱鹏飞;荆风;;矿产资源定量评价中文本数据挖掘研究[A];第七届全国数学地质与地学信息学术会议论文摘要汇编[C];2004年
8 栾鸾;李云;盛艳;;多关系频繁项集的并行获取[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
9 温磊;李敏强;;基于有向项集图的频繁项集增量更新挖掘算法[A];2004中国控制与决策学术年会论文集[C];2004年
10 杨子良;陶宏才;;一种基于向量运算的频繁项集快速挖掘算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
中国博士学位论文全文数据库 前10条
1 屠莉;流数据的频繁项挖掘及聚类的关键技术研究[D];南京航空航天大学;2009年
2 毛伊敏;数据流频繁模式挖掘关键算法及其应用研究[D];中南大学;2011年
3 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年
4 李力;数据挖掘方法研究及其在中药复方配伍分析中的应用[D];西南交通大学;2003年
5 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
6 王卉;最大频繁项集挖掘算法及应用研究[D];华中科技大学;2004年
7 陈耿;面向中观审计的规则发现算法研究[D];东南大学;2005年
8 崇志宏;基于屏蔽/汇总技术的数据流处理算法[D];复旦大学;2006年
9 晏华;交易数据的聚类分析[D];电子科技大学;2008年
10 叶飞跃;关联规则及其元规则挖掘技术研究[D];南京航空航天大学;2006年
中国硕士学位论文全文数据库 前10条
1 袁锋;基于数据挖掘的中医医案分析系统的设计与实现[D];山东师范大学;2006年
2 陈力捷;数据流频繁项挖掘系统的研究和实现[D];浙江大学;2007年
3 刘卫;基于剪枝概念格模型的频繁项集表示及挖掘研究[D];合肥工业大学;2007年
4 郭静;最大和最长频繁项集增量更新研究[D];燕山大学;2010年
5 冯沙沙;基于位表的频繁项集挖掘算法研究[D];燕山大学;2012年
6 刘博;云环境下频繁项集挖掘与调度策略的研究[D];扬州大学;2013年
7 朱冀;以概念分层为背景知识的关联规则挖掘算法的分析[D];电子科技大学;2004年
8 陆声链;孤立点挖掘及其内涵知识发现的研究与应用[D];广西师范大学;2005年
9 龚舒;桥吊动态机械性能参数的统计特征分析及关联规则挖掘[D];上海海事大学;2005年
10 李国雁;基于矩阵的人力资源多值关联规则的挖掘[D];河南大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978