收藏本站
《上海海事大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘中关联规则算法的研究

苏蕊  
【摘要】: 现代科技发展的日新月异,给人们带来了便利的同时也产生了海量的数据,为了更好的理解这些数据并使其为人们所用,KDD和DM技术应运而生。关联规则挖掘是DM中的一个重要的研究方向,而频繁项目集的挖掘又是关联规则算法的核心问题。本文对关联规则和其经典Apriori挖掘算法进行了详细的阐述,研究、总结了经典挖掘算法的特点和局限性,并在此基础上提出了两个改进算法——基于粒计算的关联规则挖掘算法和基于遗传算法的关联规则挖掘算法。 基于粒计算的关联规则挖掘算法引入粒计算的思想,即把事务数据库中每一个项看作一个粒,通过扫描一次数据库得到所有项的位图表示,利用粒的“与”和“或”运算求项集的支持度,采用循环判断的方法,将满足条件的粒直接归入频繁K-项集中,无需生成候选项集Ck。该算法优点在于只需扫描一次数据库,利用粒计算求项集支持度,只需存储频繁集,大大减少了时间耗费和空间占用,从而提高了规则挖掘的效率。同时,针对许多应用由于多维数据空间数据的稀疏性,在低层或原始层数据项间很难找出强关联规则,本文提出了基于粒计算的多维多层关联规则挖掘算法。在对多维属性进行概念分层下,该算法采用基于粒计算的规则挖掘方法来挖掘每一层上的关联规则,并且在计算高层次上项的支持度时应用了粒的层次关系,从而改善整体挖掘效率。 基于遗传算法的关联规则挖掘算法,是在对传统遗传算法进行改进的基础上,将其应用到关联规则挖掘中。该遗传算法提出了一种自适应变异率方法,避免了进化早期出现的高适应度个体的过度复制而陷入局部最优值,并且改进了个体选择方法,具有较强的实用性。最后将其应用到关联规则挖掘中进行了相关实验,验证了在处理大规模项目集时基于遗传算法的关联规则挖掘方法的高效性及可靠性。
【学位授予单位】:上海海事大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP311.13

【引证文献】
中国硕士学位论文全文数据库 前4条
1 张洪;基于遗传算法的ART网络优化及其应用研究[D];华东师范大学;2009年
2 娄迎红;面向电子商务的数据挖掘研究与应用[D];山东师范大学;2009年
3 金豆;数据挖掘技术在资产管理系统中的应用[D];长春理工大学;2010年
4 赵静;关联规则挖掘算法的研究[D];太原理工大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 陆建江,徐宝文,邹晓峰,康达周;模糊关联规则的并行挖掘算法[J];东南大学学报(自然科学版);2005年02期
2 周斌,吴泉源,高洪奎;序列模式挖掘的增量式算法的设计原则[J];计算机研究与发展;2000年10期
3 左万利,刘居红;任意多表间关联规则的并行挖掘[J];吉林大学自然科学学报;1999年04期
4 刘清;黄兆华;姚力文;;Rough集理论:现状与前景[J];计算机科学;1997年04期
5 朱绍文;王泉德;黄浩;彭清涛;胡宏银;陆玉昌;;一种多概念层数值关联规则采掘方法[J];计算机科学;2001年02期
6 李学明;张伟;彭军;刘用国;吴中福;廖晓峰;;源关联规则生成算法[J];计算机科学;2002年04期
7 蔡伟杰,张晓辉,朱建秋,朱扬勇;关联规则挖掘综述[J];计算机工程;2001年05期
8 黄传明;一种基于散列技术和事务压缩的关联规则挖掘算法[J];计算机工程;2003年22期
9 袁红春,熊范纶;元规则指导下的逐步求精多层空间关联规则挖掘算法[J];计算机工程;2004年08期
10 刘清;邻域值信息表上的邻域逻辑及其数据推理[J];计算机学报;2001年04期
【共引文献】
中国期刊全文数据库 前10条
1 吴大宏,赵人达;基于遗传算法与神经网络的桥梁结构健康监测系统研究初探[J];四川建筑科学研究;2002年03期
2 张安勤;数据挖掘与进化算法[J];安徽教育学院学报;2002年03期
3 于海涛;Rough集理论在数据约简中的应用[J];安徽教育学院学报;2004年03期
4 华文立;胡学刚;;平衡决策树分类精度与规则简易性研究[J];安徽电子信息职业技术学院学报;2006年04期
5 程家兴,陈万里;列车控制问题的计算分析及自适应算法[J];安徽大学学报(自然科学版);2002年02期
6 程家兴,钱付兰;粗糙集方法在基于属性分类中的应用[J];安徽大学学报(自然科学版);2005年01期
7 孟庆全;徐文龙;;粗糙集合在中医诊断中的应用研究[J];安徽大学学报(自然科学版);2006年04期
8 梅灿华;孟庆全;祁炯;李明;;分辨矩阵构成与约简同步的方法[J];安徽工程科技学院学报(自然科学版);2008年02期
9 梅俊;郑刚;;一种基于临时表的关联规则增量更新算法[J];安徽工程科技学院学报(自然科学版);2010年01期
10 蒋中;遗传算法在PID参数优化中的应用[J];安徽建筑工业学院学报(自然科学版);2000年01期
中国重要会议论文全文数据库 前10条
1 杨益;方潜生;汪力君;;基于Handel-C的数字芯片的设计方法研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 胡杨林;蒋洁琼;王明煌;曾勤;邱岳峰;邹俊;陈红丽;FDS team;;聚变裂变混合堆长寿命锕系废料嬗变处理的中子学优化分析[A];安徽新能源技术创新与产业发展博士科技论坛论文集[C];2010年
3 孙燕;孙峥;黄鹍;;基于模拟退火机制的隔离小生境混合遗传算法[A];第二十六届中国控制会议论文集[C];2007年
4 李枚毅;游维;蔡自兴;;多样度和适应度引导的遗传算法操作概率计算研究[A];第二十六届中国控制会议论文集[C];2007年
5 孙燕;孙峥;;利用正交遗传算法优化交通检测点分布[A];第二十六届中国控制会议论文集[C];2007年
6 张志华;王莉;刘洪;;最大化网络广告收入的投放决策[A];第二十六届中国控制会议论文集[C];2007年
7 吕思颖;刘载文;王小艺;崔莉凤;;基于Elman神经网络的水华短期预测模型[A];第二十七届中国控制会议论文集[C];2008年
8 郭玉堂;刘路路;;基于佳点集遗传算法的边缘检测[A];第二十七届中国控制会议论文集[C];2008年
9 刘向;邹逢兴;张湘平;高政;;面向节能的混合流水车间调度方法的研究[A];第二十七届中国控制会议论文集[C];2008年
10 龚锦红;杨辉;衷路生;;稀土萃取分离过程的Rough集案例推理方法[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 张杏莉;几何约束求解关键问题研究[D];山东科技大学;2010年
2 樊建聪;分布估计学习算法研究[D];山东科技大学;2010年
3 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
4 戴运桃;粒子群优化算法研究及其在船舶运动参数辨识中的应用[D];哈尔滨工程大学;2010年
5 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
6 曹宇;利用遗传算法对声障板优化设计的研究[D];哈尔滨工程大学;2010年
7 时长江;豆科类杂草种子图像识别系统研究[D];中国海洋大学;2009年
8 段志东;基于广义模块化设计的快锻液压机机架力学特性研究[D];兰州大学;2010年
9 韩艳玲;可能性构造空间理论与计算机作曲思维模型研究[D];华中科技大学;2010年
10 彭北青;第三方物流配送车辆路径问题模型及算法研究[D];华中科技大学;2009年
中国硕士学位论文全文数据库 前10条
1 梅俊;数据挖掘中关联规则算法的研究及应用[D];安徽工程大学;2010年
2 赫英毅;毫米波段基于TE_(21)模差网络设计[D];中国工程物理研究院;2009年
3 万成;动态环境下的元胞遗传算法研究[D];南昌航空大学;2010年
4 李坤;参数参与进化的自适应遗传算法研究[D];南昌航空大学;2010年
5 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
6 王辉;基于改进遗传算法的物流配送路径优化研究[D];山东科技大学;2010年
7 纪二云;基于改进遗传算法的电力系统无功优化的研究[D];山东科技大学;2010年
8 施晓坤;煤炭企业人才结构优化[D];山东科技大学;2010年
9 程慧;基于神经网络的两类问题研究[D];广西师范学院;2010年
10 马宗梅;遗传算法在考试系统组卷中的应用与研究[D];郑州大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 钱言玉;黄浩;;数据挖掘技术在电子商务中的应用[J];合肥师范学院学报;2008年03期
2 邢永强;李金荣;张天义;杨振放;潘涛;;地震预报方法研究[J];安徽农业科学;2008年29期
3 王文清,乔雪峰;带有时态约束的多层次关联规则的挖掘[J];北京理工大学学报;2003年01期
4 段云峰,宋俊德,李剑威,舒华英;基于数量的关联规则挖掘[J];北京邮电大学学报;2002年04期
5 罗灼礼;王伟君;;地震前兆的复杂性及地震预报、预警、预防综合决策问题的讨论——浅释唐山、海城、松潘、丽江等大地震的经验教训[J];地震;2008年01期
6 唐晓萍;数据挖掘与知识发现综述[J];电脑开发与应用;2002年04期
7 龚义;马淑华;叶维丹;;浅论高校资产网络化管理[J];广西广播电视大学学报;2006年03期
8 周祝林;吴妙生;陈秀俊;;关于我国地震预报几点思考的再思考[J];国际地震动态;2006年04期
9 孙加林;;目前我国中期地震预报的困惑与其思考[J];国际地震动态;2008年01期
10 石川有三;卢振恒;;中国地震与地震预报[J];国际地震动态;2008年10期
中国博士学位论文全文数据库 前2条
1 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
2 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
中国硕士学位论文全文数据库 前10条
1 冯志新;基于FP-树的最大频繁模式挖掘算法研究[D];广西大学;2003年
2 周庆华;面向电子商务的数据挖掘研究与实现[D];中国人民解放军国防科学技术大学;2002年
3 王艳;数据挖掘中关联规则算法的研究[D];西南交通大学;2004年
4 李凤慧;面向电子商务的Web数据挖掘的研究[D];山东科技大学;2004年
5 周亮;面向电子商务的数据挖掘系统的研究与设计[D];武汉理工大学;2005年
6 张学斌;数值型多维关联规则挖掘研究[D];西南师范大学;2005年
7 裴蕾;基于Web数据挖掘的电子商务推荐系统研究[D];同济大学;2006年
8 田地;基于电子商务Web的数据挖掘技术研究[D];郑州大学;2006年
9 薛慧君;基于遗传算法的关联规则数据挖掘的应用研究[D];天津大学;2006年
10 李娟;基于矩阵的关联规则挖掘算法研究[D];西南大学;2007年
【二级引证文献】
中国期刊全文数据库 前1条
1 张晓艳;张苏;;浅析数据挖掘在电子商务中的应用[J];电脑知识与技术;2010年35期
中国硕士学位论文全文数据库 前3条
1 李冰岩;数据挖掘在电子商务中的应用与实现[D];成都理工大学;2011年
2 王玥;基于Web使用挖掘的在线报名推荐系统的研究与实现[D];电子科技大学;2010年
3 赵月;基于关联规则和时序分析的房地产客户关系管理的研究[D];东北林业大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 陆建江,钱祖平,宋自林;正态云关联规则在预测中的应用[J];计算机研究与发展;2000年11期
2 陆建江;加权关联规则挖掘算法的研究[J];计算机研究与发展;2002年10期
3 左万利;含有类别属性数据库中联系性规则的挖掘[J];吉林大学自然科学学报;1999年01期
4 周斌,吴泉源;序列模式挖掘的一种渐进算法[J];计算机学报;1999年08期
5 刘清;基于Rough集理论的模态逻辑与Rough逻辑[J];南昌大学学报(理科版);1998年04期
6 李德毅,邸凯昌,李德仁,史雪梅;用语言云模型发掘关联规则(英文)[J];软件学报;2000年02期
7 胡侃,张伟荦,夏绍玮;自适应区间配置在关联规则并行采掘中的作用(英文)[J];软件学报;2000年02期
8 刘清,刘少辉,郑非;Rough逻辑及其在数据约简中的应用[J];软件学报;2001年03期
9 陆建江,宋自林,钱祖平;挖掘语言值关联规则[J];软件学报;2001年04期
10 欧阳为民,郑诚,蔡庆生;数据库中加权关联规则的发现[J];软件学报;2001年04期
【相似文献】
中国期刊全文数据库 前10条
1 赵小龙;张步群;;基于粒计算高效挖掘决策型关系数据库中关联规则[J];巢湖学院学报;2008年03期
2 伍军云,张丽萍,洪胜华;粒计算及其在数据挖掘中的应用[J];科技广场;2005年06期
3 李仁;段隆振;周青;李光辉;;基于二进制Granule计算的关联规则挖掘方法[J];江西科学;2008年02期
4 张月琴;晏清微;;基于粒计算的关联规则挖掘算法[J];计算机工程;2009年20期
5 初永玲;李绍春;;数据挖掘中关联规则挖掘算法的探讨与研究[J];科技信息(科学教研);2008年16期
6 张丽;;关联规则挖掘研究[J];赤峰学院学报(自然科学版);2009年05期
7 黄海燕;刘欣;;数据挖掘中的关联规则方法[J];软件导刊;2009年04期
8 黄海燕;刘欣;;数据挖掘中的关联规则方法[J];软件导刊;2009年05期
9 朱慧爽;;数据挖掘在纺织高校科研管理系统中的应用[J];山东纺织经济;2008年03期
10 赵艳丽;张晓华;魏权利;;一种基于改进型遗传算法的关联规则挖掘方法[J];计算机与信息技术;2008年11期
中国重要会议论文全文数据库 前10条
1 刘晓燕;单晓红;;遗传算法在关联规则挖掘中的应用[A];第六届中国青年运筹与管理学者大会论文集[C];2004年
2 温磊;李敏强;;基于有向项集图的频繁项集增量更新挖掘算法[A];2004中国控制与决策学术年会论文集[C];2004年
3 贺庆;冯海旗;;基于关联规则挖掘的隐私保护方法研究[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
4 温磊;牛东晓;何永贵;;基于权重约束的频繁项集挖掘算法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
5 刘扬;曹惠玲;梁大敏;;关联规则挖掘在航空发动机QAR数据中的应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
6 李锦泽;叶晓俊;;关联规则挖掘算法研究现状[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 陈波;董鹏;邵勇;;基于Apriori算法及其改进算法综述[A];中国通信学会第五届学术年会论文集[C];2008年
8 郭云峰;张集祥;;一种基于位向量的关联规则挖掘算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 方炜炜;杨炳儒;唐志刚;杨君;;基于客观兴趣度的关联规则优化算法研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
10 叶强;李一军;;基于支持度-显著度的关联规则分类方法研究[A];管理科学与系统科学研究新进展——第8届全国青年管理科学与系统科学学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 邱桃荣;面向本体学习的粒计算方法研究[D];北京交通大学;2009年
2 王德兴;基于概念格模型关联规则挖掘的关键问题研究[D];合肥工业大学;2007年
3 林晓勇;频繁模式挖掘和动态维护的理论与方法研究[D];北京化工大学;2008年
4 韩颖;新型农村合作医疗数据挖掘研究[D];山西医科大学;2009年
5 齐建东;基于数据挖掘的入侵检测方法及系统研究[D];中国农业大学;2003年
6 张晓辉;云理论和数据挖掘在水上安全分析中的应用[D];大连海事大学;2011年
7 何月顺;关联规则挖掘技术的研究及应用[D];南京航空航天大学;2010年
8 刘智;关联规则挖掘方法及其在冠心病中医诊疗中的应用研究[D];大连海事大学;2012年
9 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
10 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
中国硕士学位论文全文数据库 前10条
1 沈亚兰;基于粒度计算的数据挖掘方法的研究[D];沈阳工业大学;2006年
2 赵小龙;粒计算在数据挖掘中的应用研究[D];西南交通大学;2007年
3 苏蕊;数据挖掘中关联规则算法的研究[D];上海海事大学;2007年
4 曾海颖;客户关系管理中的数据挖掘[D];南京航空航天大学;2003年
5 邹丽;分布式系统下关联规则挖掘的研究与实现[D];大连交通大学;2005年
6 徐勇;基于概念格模型的分布式关联规则挖掘研究[D];合肥工业大学;2006年
7 唐文志;蚁群算法在关联规则学习中的研究与应用[D];北京工业大学;2009年
8 黄鹏鹤;关联规则挖掘及其在教务管理中的应用[D];大连交通大学;2005年
9 梁碧珍;目标频繁项集挖掘算法与应用研究[D];广西大学;2007年
10 陈华胜;基于数据挖掘的入侵检测系统的研究[D];武汉理工大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026