收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

最大和最长频繁项集增量更新研究

郭静  
【摘要】: 数据挖掘是目前数据库研究中的一个热门领域,关联规则挖掘又是数据挖掘中最活跃的分支,而其中发现频繁项集则是关联规则挖掘应用中的关键技术和步骤。现有的频繁项集挖掘算法主要针对静态数据进行,但在现实生活中我们面对的数据常常是动态变化的,比如在线提供的实时服务、大型商场的购物清单,此外基于互联网的很多应用所提供的数据,也都是动态变化的。在动态变化的环境下,传统的频繁项集挖掘算法存在两方面问题,一方面,挖掘得到的频繁项集不能正确反映当前数据的状态;另一方面,由于数据量非常大,过多地扫描数据库使得挖掘效率很低。为此,本文在深入了解数据动态变化情况的同时,还对国内外关于频繁项集挖掘的研究现状进行了综合分析比较,然后选择了两种有代表性的频繁项集进行深入研究。 首先,根据支持度阈值变大和变小两种情况,分别提出了两个改进的最大频繁项集增量更新算法。当支持度变大时,Bigger-SMFIU算法采用逆向判断的方法挖掘新的最大频繁项集。而Smaller-SMFIU算法主要针对支持度变小的情况,从高维到低维依次扫描原来的最大频繁项集,将其分为两种情况分别处理,最终得到更新后的最大频繁项集。 其次,提出了改进的FP-tree,并基于此FP-tree结构提出了一种新的最长频繁项集挖掘算法,考虑事务数据库是随时变化的,接着又详细描述了数据库变大和变小时的最长频繁项集增量更新算法。 最后,通过与已有算法进行对比实验,验证了本文所提出的最大和最长频繁项集增量更新算法的可行性和有效性,并对每个算法的执行效率进行分析和比较。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王艳;数据挖掘中关联规则的探讨[J];成都信息工程学院学报;2004年02期
2 龚贞标,陶树平;一种改进的关联规则增量式更新算法[J];福建电脑;2005年07期
3 章志明;黄龙军;余敏;黄明和;;一种动态的频繁项集挖掘算法[J];计算机工程;2006年24期
4 王朝辉;王婷婷;;一种快速的频繁项集挖掘算法[J];贵州工业大学学报(自然科学版);2006年06期
5 郭福亮;左凯伶;;关联规则挖掘中Apriori算法的一种改进[J];计算机与数字工程;2007年05期
6 王伟勤;钟敬堂;;对Apriori算法的一种改进[J];佛山科学技术学院学报(自然科学版);2007年02期
7 郭云峰;张集祥;;对关联规则挖掘中Apriori算法的一种改进[J];杭州电子科技大学学报;2009年02期
8 程杰;;基于二进制的频繁项集挖掘新算法[J];电脑知识与技术;2009年13期
9 沈良忠;;基于简单双矩阵的关联规则算法研究[J];温州大学学报(自然科学版);2009年06期
10 刘洋;王勇;;一种求极大频繁项集的挖掘方法[J];广西民族大学学报(自然科学版);2009年04期
11 汪成亮;罗昌银;;一种基于组合方式改进的频繁项集挖掘算法[J];计算机系统应用;2010年01期
12 才科扎西;黄景廉;;基于前缀树的高效频繁项集挖掘算法[J];计算机工程;2010年04期
13 李成军;杨天奇;;一种改进的加权关联规则挖掘方法[J];计算机工程;2010年07期
14 潘怡;杜红燕;;数据流频繁闭项集挖掘研究[J];长沙大学学报;2010年05期
15 陈建国;宋中山;;一种基于矩阵按位存储的Apriori改进算法[J];软件导刊;2010年10期
16 严菲;杨科华;;基于索引数组的频繁项集增量更新算法[J];微计算机信息;2010年33期
17 戴娟;邱雁;;数据库扫描的一种快速关联规则挖掘算法[J];考试周刊;2011年04期
18 汪金苗;张龙波;邓齐志;王凤英;王勇;;不确定数据频繁项集挖掘方法综述[J];计算机工程与应用;2011年20期
19 刘芝怡;尹飞鸿;;基于FP-矩阵的频繁项集挖掘算法[J];中国制造业信息化;2011年15期
20 牛小飞,石冰,卢军,吴科;挖掘关联规则的高效ABM算法[J];计算机工程;2004年11期
中国重要会议论文全文数据库 前10条
1 杨晓明;王晨;汪卫;张守志;施伯乐;;频繁项集的精简表达与还原问题研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 刘马金;王鹏;汪卫;;一种轮转的数据流频繁项挖掘算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
3 谢志军;陈红;;EFIM——数据流上频繁项集挖掘的高性能算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
4 李坤;王永炎;王宏安;;一种基于乐观裁剪策略的挖掘数据流滑动窗口上闭合频繁项集的算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
5 邹远娅;周皓峰;王晨;汪卫;施伯乐;;FSC——利用频繁项集挖掘估算视图大小[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
6 陈晓云;李龙杰;马志新;白伸伸;王磊;;AFP-Miner:一种新高效的频繁项集挖掘算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
7 陈建平;侯昌波;王功文;吕鹏;朱鹏飞;荆风;;矿产资源定量评价中文本数据挖掘研究[A];第七届全国数学地质与地学信息学术会议论文摘要汇编[C];2004年
8 栾鸾;李云;盛艳;;多关系频繁项集的并行获取[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
9 温磊;李敏强;;基于有向项集图的频繁项集增量更新挖掘算法[A];2004中国控制与决策学术年会论文集[C];2004年
10 杨子良;陶宏才;;一种基于向量运算的频繁项集快速挖掘算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
中国博士学位论文全文数据库 前10条
1 屠莉;流数据的频繁项挖掘及聚类的关键技术研究[D];南京航空航天大学;2009年
2 毛伊敏;数据流频繁模式挖掘关键算法及其应用研究[D];中南大学;2011年
3 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年
4 李力;数据挖掘方法研究及其在中药复方配伍分析中的应用[D];西南交通大学;2003年
5 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
6 王卉;最大频繁项集挖掘算法及应用研究[D];华中科技大学;2004年
7 陈耿;面向中观审计的规则发现算法研究[D];东南大学;2005年
8 崇志宏;基于屏蔽/汇总技术的数据流处理算法[D];复旦大学;2006年
9 晏华;交易数据的聚类分析[D];电子科技大学;2008年
10 叶飞跃;关联规则及其元规则挖掘技术研究[D];南京航空航天大学;2006年
中国硕士学位论文全文数据库 前10条
1 袁锋;基于数据挖掘的中医医案分析系统的设计与实现[D];山东师范大学;2006年
2 陈力捷;数据流频繁项挖掘系统的研究和实现[D];浙江大学;2007年
3 刘卫;基于剪枝概念格模型的频繁项集表示及挖掘研究[D];合肥工业大学;2007年
4 郭静;最大和最长频繁项集增量更新研究[D];燕山大学;2010年
5 朱冀;以概念分层为背景知识的关联规则挖掘算法的分析[D];电子科技大学;2004年
6 陆声链;孤立点挖掘及其内涵知识发现的研究与应用[D];广西师范大学;2005年
7 龚舒;桥吊动态机械性能参数的统计特征分析及关联规则挖掘[D];上海海事大学;2005年
8 李国雁;基于矩阵的人力资源多值关联规则的挖掘[D];河南大学;2008年
9 王灿;含负项目的关联规则挖掘算法研究[D];重庆大学;2008年
10 窦茂生;数据挖掘中关联规则的研究与应用[D];长春理工大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978