收藏本站
《上海海事大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘中关联规则算法的研究

苏蕊  
【摘要】: 现代科技发展的日新月异,给人们带来了便利的同时也产生了海量的数据,为了更好的理解这些数据并使其为人们所用,KDD和DM技术应运而生。关联规则挖掘是DM中的一个重要的研究方向,而频繁项目集的挖掘又是关联规则算法的核心问题。本文对关联规则和其经典Apriori挖掘算法进行了详细的阐述,研究、总结了经典挖掘算法的特点和局限性,并在此基础上提出了两个改进算法——基于粒计算的关联规则挖掘算法和基于遗传算法的关联规则挖掘算法。 基于粒计算的关联规则挖掘算法引入粒计算的思想,即把事务数据库中每一个项看作一个粒,通过扫描一次数据库得到所有项的位图表示,利用粒的“与”和“或”运算求项集的支持度,采用循环判断的方法,将满足条件的粒直接归入频繁K-项集中,无需生成候选项集Ck。该算法优点在于只需扫描一次数据库,利用粒计算求项集支持度,只需存储频繁集,大大减少了时间耗费和空间占用,从而提高了规则挖掘的效率。同时,针对许多应用由于多维数据空间数据的稀疏性,在低层或原始层数据项间很难找出强关联规则,本文提出了基于粒计算的多维多层关联规则挖掘算法。在对多维属性进行概念分层下,该算法采用基于粒计算的规则挖掘方法来挖掘每一层上的关联规则,并且在计算高层次上项的支持度时应用了粒的层次关系,从而改善整体挖掘效率。 基于遗传算法的关联规则挖掘算法,是在对传统遗传算法进行改进的基础上,将其应用到关联规则挖掘中。该遗传算法提出了一种自适应变异率方法,避免了进化早期出现的高适应度个体的过度复制而陷入局部最优值,并且改进了个体选择方法,具有较强的实用性。最后将其应用到关联规则挖掘中进行了相关实验,验证了在处理大规模项目集时基于遗传算法的关联规则挖掘方法的高效性及可靠性。
【学位授予单位】:上海海事大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP311.13

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前1条
1 张洪;基于遗传算法的ART网络优化及其应用研究[D];华东师范大学;2009年
【参考文献】
中国期刊全文数据库 前10条
1 陆建江,徐宝文,邹晓峰,康达周;模糊关联规则的并行挖掘算法[J];东南大学学报(自然科学版);2005年02期
2 周斌,吴泉源,高洪奎;序列模式挖掘的增量式算法的设计原则[J];计算机研究与发展;2000年10期
3 左万利,刘居红;任意多表间关联规则的并行挖掘[J];吉林大学自然科学学报;1999年04期
4 刘清;黄兆华;姚力文;;Rough集理论:现状与前景[J];计算机科学;1997年04期
5 朱绍文;王泉德;黄浩;彭清涛;胡宏银;陆玉昌;;一种多概念层数值关联规则采掘方法[J];计算机科学;2001年02期
6 李学明;张伟;彭军;刘用国;吴中福;廖晓峰;;源关联规则生成算法[J];计算机科学;2002年04期
7 蔡伟杰,张晓辉,朱建秋,朱扬勇;关联规则挖掘综述[J];计算机工程;2001年05期
8 黄传明;一种基于散列技术和事务压缩的关联规则挖掘算法[J];计算机工程;2003年22期
9 袁红春,熊范纶;元规则指导下的逐步求精多层空间关联规则挖掘算法[J];计算机工程;2004年08期
10 刘清;邻域值信息表上的邻域逻辑及其数据推理[J];计算机学报;2001年04期
【同被引文献】
中国期刊全文数据库 前10条
1 邢永强;李金荣;张天义;杨振放;潘涛;;地震预报方法研究[J];安徽农业科学;2008年29期
2 罗灼礼;王伟君;;地震前兆的复杂性及地震预报、预警、预防综合决策问题的讨论——浅释唐山、海城、松潘、丽江等大地震的经验教训[J];地震;2008年01期
3 周祝林;吴妙生;陈秀俊;;关于我国地震预报几点思考的再思考[J];国际地震动态;2006年04期
4 孙加林;;目前我国中期地震预报的困惑与其思考[J];国际地震动态;2008年01期
5 石川有三;卢振恒;;中国地震与地震预报[J];国际地震动态;2008年10期
6 王建国;阳建宏;张文兴;徐金梧;;基于神经网络规则抽取的带钢热镀锌质量监控模型[J];过程工程学报;2008年05期
7 刘悦,刘辉,李远,张博锋,吴耿锋;基于冲量权值的ART神经网络及其在地震预报中的应用[J];计算机工程与应用;2005年05期
8 范艳峰;徐朝辉;;基于聚类遗传算法的神经网络规则抽取及应用[J];计算机工程与应用;2006年23期
9 王媛,刘悦,张博锋,王亮,吴耿锋;基于RBF神经网络的属性约简方法[J];计算机工程;2004年10期
10 赵林;杨保安;谢志鸣;;一种新的基于结构的神经网络规则抽取方法[J];计算机应用与软件;2007年06期
中国硕士学位论文全文数据库 前1条
1 薛慧君;基于遗传算法的关联规则数据挖掘的应用研究[D];天津大学;2006年
【二级参考文献】
中国期刊全文数据库 前5条
1 陆建江,钱祖平,宋自林;正态云关联规则在预测中的应用[J];计算机研究与发展;2000年11期
2 陆建江;加权关联规则挖掘算法的研究[J];计算机研究与发展;2002年10期
3 左万利;含有类别属性数据库中联系性规则的挖掘[J];吉林大学自然科学学报;1999年01期
4 周斌,吴泉源;序列模式挖掘的一种渐进算法[J];计算机学报;1999年08期
5 刘清;基于Rough集理论的模态逻辑与Rough逻辑[J];南昌大学学报(理科版);1998年04期
【相似文献】
中国期刊全文数据库 前10条
1 邱桃荣;白小明;张丽萍;;基于粒计算的Apriori算法及其在图书管理系统中的应用[J];微计算机信息;2006年21期
2 伍军云,张丽萍,洪胜华;粒计算及其在数据挖掘中的应用[J];科技广场;2005年06期
3 许学军;;遗传算法在多维多层关联规则挖掘中的应用[J];中国民航飞行学院学报;2007年04期
4 方德洲;李淼;;基于半空间和GA的关联规则快速挖掘算法[J];计算机工程与应用;2007年02期
5 沈国强;覃征;;一种新的多维关联规则挖掘算法[J];小型微型计算机系统;2006年02期
6 沈国强;覃征;沈云斐;;一种高效的多维多层关联规则挖掘算法[J];计算机工程与应用;2006年12期
7 刘长良;赵建英;曲晓平;刘廉隅;;遗传算法在数据挖掘中的应用实例分析[J];仪器仪表学报;2006年S3期
8 陈强,黄国兴;一种适用于关联规则挖掘的优化的选样算法[J];微型电脑应用;2005年03期
9 赵方方;刘万军;陈芳元;;遗传算法在关联规则挖掘中的应用研究[J];沈阳理工大学学报;2006年04期
10 李康顺,李元香,滕冲,王玲玲;遗传算法在数据挖掘中的应用[J];计算机工程与应用;2005年09期
中国重要会议论文全文数据库 前10条
1 刘晓燕;单晓红;;遗传算法在关联规则挖掘中的应用[A];第六届中国青年运筹与管理学者大会论文集[C];2004年
2 曾令明;金虎;;基于遗传算法的双向关联规则挖掘[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
3 沈亚兰;王向东;王晓峰;;基于粒计算和等价类的关联规则挖掘算法[A];2006中国控制与决策学术年会论文集[C];2006年
4 苏冬平;吴少敏;苏异才;;KDD与遗传寻优及在宝钢的应用[A];2001中国钢铁年会论文集(下卷)[C];2001年
5 王文平;刘希玉;;基于遗传算法的关联规则挖掘模型[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
6 毛定祥;;数据挖掘与实证经济学[A];2003中国现场统计研究会第十一届学术年会论文集(上)[C];2003年
7 温磊;李敏强;;基于有向项集图的频繁项集增量更新挖掘算法[A];2004中国控制与决策学术年会论文集[C];2004年
8 韩战钢;;遗传算法及在经济中的应用[A];Optimization Method, Econophysics and Risk Management--Proceedings of CCAST (World Laboratory) Workshop[C];2001年
9 温磊;牛东晓;何永贵;;基于权重约束的频繁项集挖掘算法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
10 贺庆;冯海旗;;基于关联规则挖掘的隐私保护方法研究[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
2 吴勇毅;软件选型:数据挖掘是重点[N];中国冶金报;2009年
3 早报记者 胡孝敏;跨国企业掘金中国“数据挖掘”市场[N];东方早报;2005年
4 赵纪元;数据挖掘在CRM中的应用[N];人民邮电;2001年
5 ;数据挖掘流程[N];人民邮电;2001年
6 吴辅世;打破数据挖掘的5个神话[N];中国计算机报;2003年
7 ;数据挖掘:如何挖出效益?[N];中国计算机报;2004年
8 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
9 聂亚林;承钢数据挖掘系统近日开通运行[N];中国冶金报;2007年
10 北京联通宽带业务中心 杨雪艳;数据挖掘成挽留客户利器[N];通信产业报;2009年
中国博士学位论文全文数据库 前10条
1 王德兴;基于概念格模型关联规则挖掘的关键问题研究[D];合肥工业大学;2007年
2 何洁月;面向蛋白质结构预测的计算生物学技术研究[D];东南大学;2006年
3 颜跃进;最大频繁项集挖掘算法的研究[D];国防科学技术大学;2005年
4 李秋丹;数据挖掘相关算法的研究与平台实现[D];大连理工大学;2004年
5 郝占刚;基于遗传算法等技术的数据与文本聚分类研究[D];天津大学;2006年
6 陆楠;关联规则的挖掘及其算法的研究[D];吉林大学;2007年
7 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
8 崔广才;基于粗糙集的数据挖掘方法研究[D];吉林大学;2004年
9 韩炜;一种全局—局部优化算法及其在桩基承载力反演中的应用[D];中国地震局工程力学研究所;2000年
10 叶飞跃;关联规则及其元规则挖掘技术研究[D];南京航空航天大学;2006年
中国硕士学位论文全文数据库 前10条
1 沈亚兰;基于粒度计算的数据挖掘方法的研究[D];沈阳工业大学;2006年
2 陈玉明;基于信息粒与粒计算理论的数据约简研究[D];南昌大学;2005年
3 姜延丰;基于遗传算法的数据挖掘技术研究[D];东北师范大学;2005年
4 王震;数据挖掘在企业营销中的应用研究[D];重庆大学;2004年
5 汤亚玲;基于遗传算法的Web关联规则挖掘的研究与设计[D];苏州大学;2004年
6 吴文妹;基于改进关联规则和聚类算法在数据挖掘中的应用[D];福州大学;2005年
7 王评;人工免疫算法研究及其在数据挖掘上的应用[D];福州大学;2005年
8 刘凡;基于概念格扩展模型的关联规则挖掘[D];合肥工业大学;2005年
9 刘萍;粒计算及其应用研究[D];厦门大学;2006年
10 窦祥国;关联规则评价方法研究[D];合肥工业大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026