收藏本站
收藏 | 论文排版

数据挖掘中的关联规则算法优化研究及应用

蒋秀英  
【摘要】: 面对信息时代海量数据的出现,如何有效地利用巨量的原始数据分析现状和预测未来,已经成为人类面临的一大挑战。由此数据挖掘技术应运而生并得以迅猛发展。 数据挖掘是指从数据库中抽取隐含的、先前未知的、具有潜在使用价值信息的过程,是从“浩如烟海”的数据中“挖掘知识”的过程,是一种新型的数据分析技术。可广泛应用于银行金融、保险、公共设施、政府、教育、远程通讯、软件开发、运输等各个企事业单位及国防科研上。数据挖掘工程使得各类机构和组织能更好地理解它们的组织结构、业务处理过程和顾客,从而得到很高的投资收益。 目前,数据挖掘的主要研究领域为数据总结、分类、聚类、关联规则等方面。关联规则是R.Agrawal等首先提出的表示数据库中一组对象之间某种关联关系的规则。例如,关联规则可以表示为“购买了项目A的顾客中有95%的人又买了B”。从这些规则可找出顾客购买行为模式,可以应用于商品货架设计、生产安排、针对性的市场营销等。采用关联模型比较典型的例子是“啤酒和尿布”的故事。如何指导实际工作以取得效益是其根本宗旨。关联规则挖掘在商业、教育、科研等领域的成功应用,使它成为数据挖掘中最成熟、最重要、最活跃的一个分支。 关联规则发现的主要研究方向是算法的优化和扩展应用领域。典型的关联规则发现算法是由R.Agrawal等提出的Apriori算法,其核心技术为其它各类布尔关联规则采掘算法所广泛采用。但是,在计算侯选项目集的支持度时,Apriori算法是在每一个循环中都要扫描整个数据库,而随着K的增大,不仅K维项目集的数目减少了,而且能包含这些项目集的事物也是很少的。由于数据规模大且时常更新,使得采掘效率较低,必须设计更有效的算法。并且,为了得到有效、稳定、可靠的关联规则,要不断调整支持度、可信度这两个阀值。所以,如何设计高效的更新、维护算法也是非常重要的研究课题。 基于数据挖掘的研究现状,本文主要进行了以下的研究工作: 1.研究了数据采掘技术中的关联规则算法。对经典的Apriori算法作了全面的分析,指出了采掘中的关键步骤和频集算法的不足。研究了对Apriori算 山东师范大学硕士论文摘要 法的优化算法现状。研究了关联规则的扩展及数值型数据离散化后提取关联规 则的技术,并应用于后面的实例研究。提出了关联规则优化的几个方向,如优 化采掘算法、运用领域知识、增加衡量标准、改进采掘方式等。 2.针对Apri ori算法的不足,提出了一种高效的关联规则挖掘算法EA,利 用L,、Ck中的结果对数据库进行筛选,减少候选项在数据库中查找的记录数, 提高了整个算法的效率。 3.针对数据库置信度、支持度不断调整的需要,分别给出了minsuP和 。inconf增大、减小时关联规则快速的更新算法MinsuPchange和 MinConfChange,并与Aprior算法作了分析比较。 4.将关联规则数据挖掘的方法运用到高校教学问题之中。从教学评价数据 中进行数据挖掘,找到课堂教学效果与教师状态的关系问题;在班级排课时, 注意一个教学班中配备教师的年龄、职称、学历等的合理分配,使学生能够较 好地保持良好的学习状态,从而为教学部门提供了决策支持信息,促使更好地 开展教学工作,提高教学质量。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 邓慧;赖思渝;杨颖;刘雪梅;;关联规则在高校图书馆中的应用研究[J];医学信息;2008年07期
2 任荣;;浅析基于遗传算法的关联规则数据挖掘技术[J];电脑知识与技术;2009年03期
3 倪坚;;对Apriori算法的一个改进[J];大连交通大学学报;2007年02期
4 郭跃斌;翟延富;董祥军;;序列模式的关联规则在彩票分析中的应用研究[J];山东轻工业学院学报(自然科学版);2008年01期
5 马丽生;邓辉文;齐逸;;一种新的最大频繁项目集挖掘算法[J];计算机应用;2006年11期
6 方忠祥;屠航;;基于关联规则的服装销售演示系统设计[J];广西轻工业;2007年05期
7 全智龙;涂婧璐;陈霞芳;;关联规则在贫困学生信息库的应用[J];科技广场;2007年05期
8 宋欣;王志航;廉明欢;;多属性数据挖掘研究中的关联规则应用[J];计算机系统应用;2007年08期
9 阮璐;肖冬荣;周杰;高风;;利用组合支持度进行关联规则的挖掘[J];微计算机信息;2008年09期
10 焦亚冰;;基于关联规则挖掘算法的改进研究[J];太原师范学院学报(自然科学版);2008年02期
11 王宏雁;王琪;;多层多维关联规则在交通事故研究中的应用[J];交通科学与工程;2009年01期
12 戴敏,唐树刚;基于关联规则挖掘的运动员体能指标优化分析[J];天津理工学院学报;2001年03期
13 沈元怿;;一种关联规则挖掘方法在客户分析中的应用[J];现代计算机;2005年12期
14 欧阳利军;龚成;;一种基于关联规则的Web日志数据挖掘的实现方法[J];现代计算机;2006年02期
15 喻金平;齐先锋;罗珊梅;;一种c#实现改进的关联规则挖掘算法[J];科技广场;2006年02期
16 黄春利;石金彦;;关联规则挖掘方法在旋转机械故障诊断中的应用[J];水利电力机械;2007年01期
17 周宇;叶庆卫;;基于SQL查询语言的关联规则提取算法研究与实现[J];科技信息(科学教研);2007年35期
18 肖冬荣;杨磊;;基于遗传算法的关联规则数据挖掘[J];通信技术;2010年01期
19 倪志伟,蔡庆生;用神经网络来进行数据库中的知识发现(英文)[J];安徽大学学报(自然科学版);2000年03期
20 王晓燕;吴应清;;数据挖掘技术分析及其应用评价[J];办公自动化;2007年06期
中国重要会议论文全文数据库 前10条
1 王娜娜;谢炜;李烨;;邳州慢性病与生活习惯等因素的关联规则分析[A];中国生物医学工程学会成立30周年纪念大会暨2010中国生物医学工程学会学术大会壁报展示论文[C];2010年
2 邱勇;兰永杰;刘晓华;;高效FP-TREE创建算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 王寅北;夏庆;孙志挥;;FSETM:一种面向集合关联规则的数据挖掘新算法[A];第十五届全国数据库学术会议论文集[C];1998年
4 李存荣;张开敏;杨明忠;;关联知识规则在产品质量控制中的应用[A];第二届全国信息获取与处理学术会议论文集[C];2004年
5 郭道宁;舒华英;;数据挖掘在电信运营市场决策支持中的应用[A];中国通信发展与经营管理学术研讨会论文集[C];2003年
6 付忠广;田志友;靳涛;戈志华;卞双;;关联规则数据挖掘及其在电厂DCS数据分析中的应用[A];2004电站自动化信息化学术技术交流会议论文集[C];2004年
7 王翠茹;王少华;;关联规则经典算法的一种改进[A];中国通信学会第五届学术年会论文集[C];2008年
8 左万利;刘居红;;包含正负属性的关联规则及其挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
9 杨子良;陶宏才;;一种基于向量运算的频繁项集快速挖掘算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
10 王一飞;章勇;;基于条件模式的最大频繁项目集挖掘算法[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年
中国博士学位论文全文数据库 前10条
1 王曙燕;医学图像智能分类算法研究[D];西北大学;2006年
2 宋世杰;基于序列模式挖掘的误用入侵检测系统及其关键技术研究[D];国防科学技术大学;2005年
3 佘春东;数据挖掘算法分析及其并行模式研究[D];电子科技大学;2004年
4 姜保庆;关于弱比例规则的挖掘及推理研究[D];西南交通大学;2005年
5 李实;中文网络客户评论中的产品特征挖掘方法研究[D];哈尔滨工业大学;2009年
6 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年
7 李强;数据挖掘中关联分析算法研究[D];哈尔滨工程大学;2010年
8 肖波;可信关联规则挖掘算法研究[D];北京邮电大学;2009年
9 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年
10 Vital Delmas MABONZO;大型数据库有效挖掘关联规则新方法研究[D];大连海事大学;2012年
中国硕士学位论文全文数据库 前10条
1 蒋秀英;数据挖掘中的关联规则算法优化研究及应用[D];山东师范大学;2003年
2 王景;基于关联规则数据挖掘的研究[D];广西大学;2003年
3 刘玉锋;数据挖掘中关联规则算法的研究与应用[D];长春理工大学;2010年
4 耿晓中;超市管理系统及数据挖掘技术在其上的应用[D];吉林大学;2004年
5 孙彤;活性炭纤维吸附和解吸中的数据挖掘技术[D];辽宁工程技术大学;2004年
6 吕文志;基于分类和关联规则的数据挖掘研究及应用[D];大连理工大学;2001年
7 浦磊;数据挖掘中关联规则的研究与应用[D];西安理工大学;2005年
8 岳慧颖;含有时空约束的关联规则挖掘方法研究[D];哈尔滨工程大学;2004年
9 谢李兵;基于关联规则的锅炉异常工况数据挖掘[D];华北电力大学(北京);2005年
10 汪洪涛;数据挖掘中关联规则算法研究[D];重庆大学;2003年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 潘总机;数据挖掘:洞察客户需求[N];人民邮电;2005年
3 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
4 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
5 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
6 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
7 张立明;数据挖掘之道[N];网络世界;2003年
8 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
9 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
10 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978