收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

挖掘正相关的频繁项集

王春凯  
【摘要】: 数据挖掘的任务是发现大型数据集中隐藏的、预先未知的知识。关联规则的挖掘是数据挖掘研究的重要问题之一。该问题自1993年被R.Agrawal等人提出以来,一直受到广泛关注和重视。通常,关联规则的挖掘分两步:(1)挖掘所有的频繁项集;(2)由频繁项集产生强关联规则。其中第一步的时间复杂度远高于第二步。从频繁项集产生关联规则的方法是简单的,但是可能导致无意义的关联规则的产生。 一些研究者注意到这一问题,提出在产生关联规则时利用提升度判断规则前、后件之间的正相关性,进一步过滤掉一些无意义的规则。但是,这种做法仍然存在两个问题:(1)不能减少挖掘频繁项集的时间开销。(2)不能保证规则前件(后件)中的项是正相关的,当规则的前件或后件内部存在负相关的项时,仍然可能产生无意义的关联规则。 针对以上问题,本文基于数学期望,引进正相关的频繁项集的概念,并给出一种挖掘正相关的频繁项集的算法。本文的算法可以直接在FP-树中挖掘正相关的频繁项集,将正相关性的判断推进到了挖掘频繁项集的过程中。这样,不仅可以大幅度地减少产生频繁项集的数量,显著地提高挖掘频繁项集的效率,而且在由频繁项集产生关联规则时,可以有效地避免产生无意义的关联规则。此外,在挖掘频繁项集时,本文的算法还通过提取公共项,进一步降低了递归地构造条件FP-树的时间开销。在UCI机器学习基准数据集上实验表明,本文算法可以大幅度地减少产生频繁项集的数量,显著地提高挖掘频繁项集的效率,具有很好的性能,对于大型、稠密数据集尤其如此。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 沈良忠;;基于简单双矩阵的关联规则算法研究[J];温州大学学报(自然科学版);2009年06期
2 章志明;黄龙军;余敏;黄明和;;一种动态的频繁项集挖掘算法[J];计算机工程;2006年24期
3 钱光超;贾瑞玉;张然;李龙澍;;Apriori算法的一种优化方法[J];计算机工程;2008年23期
4 全佳妮;伏玉琛;严建峰;;基于关联规则挖掘的商品品类管理[J];江南大学学报(自然科学版);2009年06期
5 冯平;黄名选;;由频繁项集生成关联规则的算法设计和实现[J];广西工学院学报;2007年01期
6 任亚洲;;频繁项集挖掘算法综述[J];电脑知识与技术(学术交流);2007年16期
7 李忠慧;;一种基于散列和事务压缩的Apriori改进算法[J];科技信息;2009年24期
8 李大勇;徐亚娜;;CRM中Apriori算法的应用研究[J];辽宁省交通高等专科学校学报;2007年02期
9 陈建辉;;一种改进的Apriori算法[J];宜春学院学报;2007年04期
10 石铁峰;石月皎;;关联规则数据挖掘应用研究[J];哈尔滨职业技术学院学报;2007年04期
11 黄凤艳;;数据库中关联规则的挖掘[J];赤峰学院学报(自然科学版);2008年07期
12 张月琴;晏清微;;基于粒计算的关联规则挖掘算法[J];计算机工程;2009年20期
13 张广路;雷景生;吴兴惠;;一种改进的Apriori关联规则挖掘算法(英文)[J];计算机技术与发展;2010年06期
14 王艳;骆嘉伟;杨涛;吴君浩;;基于分段与运算的基因表达数据频繁项集挖掘[J];计算机工程与科学;2006年11期
15 胡学钢;刘卫;王德兴;;基于剪枝概念格模型的频繁项集表示及挖掘[J];合肥工业大学学报(自然科学版);2007年09期
16 景永霞;王治和;苟和平;;基于分布式数据库的关联规则挖掘算法[J];湛江师范学院学报;2007年06期
17 何建忠;吕振俊;;基于两个矩阵的关联规则挖掘优化算法[J];计算机工程;2008年17期
18 余平;汪继文;;Apriori算法的一种改进研究[J];廊坊师范学院学报(自然科学版);2009年04期
19 张昀;;数据挖掘中一种改进的Apriori算法[J];软件导刊;2009年11期
20 黄澍庄;;频繁项集挖掘算法分析与比较[J];德州学院学报;2005年06期
中国重要会议论文全文数据库 前10条
1 陈晓云;李泽霞;刘幸辉;彭文静;;关联规则挖掘过程中的模糊化方法研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 王盛;董黎刚;李群;;一种基于逆序编码的关联规则挖掘研究[A];浙江省电子学会2010学术年会论文集[C];2010年
3 方芳;李建中;潘海为;;脑部医学图像中的关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 张鹏;于波;童云海;唐世渭;;基于随机响应的隐私保护关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 谷姗姗;秦首科;胡大斌;周傲英;;面向关联规则挖掘的敏感规则隐藏技术[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
6 杨晓雪;衡红军;;一种对XML数据进行关联规则挖掘的方法研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
7 张宇鹏;王丽珍;周丽华;;基于气象数据的关联规则挖掘[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
8 张仲楠;孙志挥;;关系数据库中限制性关联规则挖掘的优化[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
9 张海威;袁晓洁;窦志成;;基于Web日志的时序关联规则挖掘算法研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 严澄;胡天磊;陈珂;陈刚;;MARSW:一种高效的基于滑动窗口数据流关联规则挖掘方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 毛宇星;关联规则挖掘在分类数据领域的扩展性研究[D];复旦大学;2010年
2 刘智;关联规则挖掘方法及其在冠心病中医诊疗中的应用研究[D];大连海事大学;2012年
3 叶飞跃;关联规则及其元规则挖掘技术研究[D];南京航空航天大学;2006年
4 何月顺;关联规则挖掘技术的研究及应用[D];南京航空航天大学;2010年
5 屠莉;流数据的频繁项挖掘及聚类的关键技术研究[D];南京航空航天大学;2009年
6 毛伊敏;数据流频繁模式挖掘关键算法及其应用研究[D];中南大学;2011年
7 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年
8 陈耿;面向中观审计的规则发现算法研究[D];东南大学;2005年
9 王培崇;基于群智能计算技术的网络入侵检测算法研究[D];中国矿业大学(北京);2010年
10 王玮;基于概念格的关联规则挖掘及变化模式研究[D];山东大学;2012年
中国硕士学位论文全文数据库 前10条
1 王春凯;挖掘正相关的频繁项集[D];郑州大学;2007年
2 刘卫;基于剪枝概念格模型的频繁项集表示及挖掘研究[D];合肥工业大学;2007年
3 窦茂生;数据挖掘中关联规则的研究与应用[D];长春理工大学;2009年
4 龚舒;桥吊动态机械性能参数的统计特征分析及关联规则挖掘[D];上海海事大学;2005年
5 田卓;基于多个关联规则挖掘算法的新算法的研究与应用[D];吉林大学;2009年
6 袁彩虹;基于粒计算与完全图的关联规则算法研究[D];河南大学;2009年
7 王涛;关联规则算法及并行化研究[D];河北大学;2006年
8 熊金芬;一种高效频繁项集挖掘算法的研究[D];哈尔滨工程大学;2006年
9 周翠红;数据挖掘中关联规则的研究及在高校教学质量评估中的应用[D];中南大学;2007年
10 孔芳;数据挖掘技术中关联规则算法的研究[D];江南大学;2008年
中国重要报纸全文数据库 前1条
1 浙江省金华市烟草专卖局 满在明 廖明景;谈卷烟专卖案件信息的挖掘[N];东方烟草报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978