收藏本站
《江西理工大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘技术中的关联规则挖掘算法研究

刘长付  
【摘要】: 数据挖掘是伴随着信息量的迅速增长而诞生的,它是从数据中析取、识别和发现潜在的、有用的、前所未知的、最终可理解的知识(规则或模型)的过程。数据挖掘技术就是要在已有数据中识别数据的模式,以帮助用户理解现有的信息,并在已有信息的基础上,对未来状况做出预测。 关联规则挖掘是数据挖掘中的一个重要研究分支,主要用于发现数据集中项与项之间的相关联系。Apriori算法和FP-Tree算法是关联规则挖掘中的经典算法,它们都是基于事务数据库中的数据量不会发生变化和每个数据项都具有同等的重要性进行挖掘。但在实际的应用中数据库中的数据是在不断发生变化的,并且对于不同的数据项人们的关注程度也不尽相同。如果我们仍然采用传统的挖掘算法进行关联规则的挖掘,挖掘的效率将非常低下,挖掘的结果也不够准确。针对这些问题本文进行了深入研究,主要工作和创新点包括: (1)研究了布尔型关联规则挖掘算法—Apriori算法,对该算法的基本思想和挖掘步骤进行了归纳和总结。详细分析了算法的缺点,针对这些缺点讨论了各种改进措施。并且对其中最具影响力的改进算法—FP-Growth算法进行了详细的分析和研究。 (2)提出了一种改进的增量式更新挖掘算法—AFUP算法,该算法针对现有增量式更新挖掘算法中对新增项目不敏感这一问题,引入了敏感度的概念用来衡量新增项目的敏感程度。解决了传统增量式更新算法中无法发现新增项目集中潜在关联关系的问题,同时算法效率也有所提高。 (3)提出了一种新的加权关联关联规则挖掘算法—FPWAL算法。与以Apriod算法为基础的挖掘算法不同,该算法以FP-Tree算法为基础,减少了数据库扫描次数,大大提高了挖掘的效率。同时引入了水平权值和垂直权值的概念,使得挖掘结果也更加合理。 针对本文提出的两种算法都进行了实验验证,结果证明了算法的有效性、合理性和高效率。同时,本文提出的算法也使挖掘结果更加符合现实需求。
【学位授予单位】:江西理工大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP311.13

【引证文献】
中国硕士学位论文全文数据库 前3条
1 赵鲁麟;负序列模式挖掘技术的研究[D];山东轻工业学院;2011年
2 宋向红;数据挖掘技术在成人高校管理中的应用研究[D];郑州大学;2011年
3 胡天华;Apriori算法在商业决策系统中的应用研究[D];大连交通大学;2011年
【参考文献】
中国期刊全文数据库 前10条
1 夏火松,蔡淑琴;基于数据挖掘技术的客户关系管理[J];商业研究;2003年20期
2 卢露;丁才昌;;关联规则中Apriori算法改进的研究[J];长江大学学报(自然科学版)理工卷;2009年02期
3 王云岚,李增智,屈科文;基于候选项集个数上阶的增量式关联规则更新算法[J];电子学报;2004年05期
4 邹长忠;傅清祥;;一种新的加权关联规则增量更新算法[J];福州大学学报(自然科学版);2008年04期
5 朱红蕾,李明;维护关联规则的算法研究[J];兰州理工大学学报;2004年05期
6 张秋余;曹华;;基于Apriori算法的加权关联规则的挖掘[J];兰州理工大学学报;2007年06期
7 陆建江;加权关联规则挖掘算法的研究[J];计算机研究与发展;2002年10期
8 朱玉全,宋余庆,陈耿;关联规则挖掘中增量式更新算法的研究[J];计算机工程与应用;2005年15期
9 余波;朱东华;刘卓君;;加权关联规则挖掘算法在电子商务中的应用[J];计算机工程与应用;2008年17期
10 庹文利;姚勇;;基于FP_tree的最大频繁项目集增量式更新算法[J];计算机工程与应用;2009年19期
【共引文献】
中国期刊全文数据库 前10条
1 杨明,杨萍;一种基于前缀广义表的快速间接关联挖掘算法[J];安徽工程科技学院学报(自然科学版);2004年04期
2 梅俊;郑刚;;一种基于临时表的关联规则增量更新算法[J];安徽工程科技学院学报(自然科学版);2010年01期
3 张静,马云吉,张继生;超市消费行为分析中的增量挖掘系统原型[J];鞍山科技大学学报;2004年01期
4 宋威;刘宇;李晋宏;;基于数据库垂直表示的高效用项集挖掘算法研究[J];北方工业大学学报;2011年01期
5 白昊;王崑声;胡昌振;张刚;经小川;;基于FP-Growth算法及补偿性入侵证据的攻击意图识别[J];北京理工大学学报;2010年08期
6 刘秀娜;柏建普;;关联规则挖掘在电子病历分析中的应用研究[J];内蒙古科技大学学报;2010年04期
7 杨伟强;;零售企业信息化管理中的数据挖掘[J];商业研究;2006年21期
8 钱锋;徐麟文;;运用CRM提升客户忠诚度的途径探讨[J];商业研究;2007年03期
9 王新军;胡曼;;数据挖掘技术在寿险业交叉销售中的应用[J];保险研究;2009年06期
10 王新军;胡曼;;寿险交叉销售的聚类技术实务分析[J];保险研究;2012年01期
中国重要会议论文全文数据库 前10条
1 丁莉娟;;数据挖掘在财务风险分析中的应用[A];第三届全国软件测试会议与移动计算、栅格、智能化高级论坛论文集[C];2009年
2 习慧丹;;Web日志挖掘探析[A];第三届全国软件测试会议与移动计算、栅格、智能化高级论坛论文集[C];2009年
3 陈震;陈维默;;浅谈数据挖掘技术[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
4 董燕;;Web挖掘对电子商务网站建设的影响[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
5 王伟;;基于IT的决策驱动型会计系统构建原理与信息处理模式研究[A];中国会计学会高等工科院校分会2009年学术会议(第十六届学术年会)论文集[C];2009年
6 单莘;;一种网络告警的增量式情景规则挖掘方法[A];中国通信学会第五届学术年会论文集[C];2008年
7 陈波;董鹏;邵勇;;基于Apriori算法及其改进算法综述[A];中国通信学会第五届学术年会论文集[C];2008年
8 黄名选;;基于正负关联规则挖掘的局部反馈查询扩展[A];第六届全国信息检索学术会议论文集[C];2010年
9 冯玉才;刘玉葆;冯剑琳;;半结构化数据中模式的交互式开采[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
10 杨君锐;赵群礼;杜建;;关于最大频繁项集的增量式挖掘方法研究[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 李强;数据挖掘中关联分析算法研究[D];哈尔滨工程大学;2010年
2 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
3 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
4 张寅;个性化技术及其在数字图书馆中应用的研究[D];浙江大学;2009年
5 程文聪;面向大规模网络安全态势分析的时序数据挖掘关键技术研究[D];国防科学技术大学;2010年
6 马晓普;角色工程中的角色与约束生成方法研究[D];华中科技大学;2011年
7 李燕;“调肺”治疗儿童多发性抽动症医案数据挖掘研究及中药复方对小鼠免疫功能影响的研究[D];北京中医药大学;2011年
8 于宏波;阳痿肾阳虚证症状规律及其转录组特征研究[D];成都中医药大学;2011年
9 鱼亮;蛋白质网络模块结构识别算法研究[D];西安电子科技大学;2011年
10 高雅田;基于MAS的数据挖掘模型自动选择方法研究[D];东北石油大学;2011年
中国硕士学位论文全文数据库 前10条
1 梅俊;数据挖掘中关联规则算法的研究及应用[D];安徽工程大学;2010年
2 刘志强;基于数据挖掘的客户行为分析和预测研究[D];山东科技大学;2010年
3 张琰渝;用户兴趣模型建模方法研究[D];辽宁师范大学;2010年
4 王德才;数据挖掘在校园卡消费行为分析中的研究与应用[D];哈尔滨工程大学;2010年
5 李威;多参数扰动的隐私保护关联规则挖掘算法研究[D];哈尔滨工程大学;2010年
6 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
7 丛强;基于模糊关联规则Web挖掘算法的研究[D];哈尔滨工程大学;2010年
8 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
9 黄晓欣;民生银行统一考核系统研究与实施[D];大连理工大学;2010年
10 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 夏火松,蔡淑琴;基于数据挖掘技术的客户关系管理[J];商业研究;2003年20期
2 潘俊辉;王辉;杨晓刚;;一种高效的关联规则挖掘算法及应用[J];长江大学学报(自然科学版)理工卷;2009年03期
3 曾异平,朱宏,龙文光;趋势分析中的一种增量数据挖掘方法研究[J];电子科技大学学报;2004年04期
4 行小帅,焦李成;数据挖掘的聚类方法[J];电路与系统学报;2003年01期
5 陈娜;;数据挖掘技术的研究现状及发展方向[J];电脑与信息技术;2006年01期
6 文小燕;杜海若;;数据挖掘的发展和应用综述[J];电脑知识与技术(学术交流);2007年18期
7 刘芝怡;崔志明;;数据挖掘技术在教育领域中的作用[J];福建电脑;2006年09期
8 于春香;;数据挖掘技术简介[J];福建信息技术教育;2005年01期
9 李晓毅;徐兆棣;;关联规则挖掘的算法分析[J];辽宁工程技术大学学报;2006年02期
10 吕爽;陈高云;;数据挖掘技术在高校教学评估中的应用[J];广东广播电视大学学报;2006年03期
中国博士学位论文全文数据库 前3条
1 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
2 郭秀娟;基于关联规则数据挖掘算法的研究[D];吉林大学;2004年
3 宋卫林;基于最大频繁项目集的数据挖掘关联规则算法研究[D];北京邮电大学;2006年
中国硕士学位论文全文数据库 前10条
1 蒋秀英;数据挖掘中的关联规则算法优化研究及应用[D];山东师范大学;2003年
2 伊卫国;有效关联规则挖掘方法的研究[D];东北师范大学;2005年
3 关晓蔷;基于决策树的分类算法研究[D];山西大学;2006年
4 刘美玲;基于数据挖掘的决策树算法研究及应用探讨[D];东北林业大学;2006年
5 徐澜;数据仓库和数据挖掘在成人高校决策中的应用[D];上海交通大学;2007年
6 卢东标;基于决策树的数据挖掘算法研究与应用[D];武汉理工大学;2008年
7 李凯;自动化数据挖掘在电信业中的应用[D];北京邮电大学;2008年
8 李妍妍;基于序列模式挖掘的网络告警关联[D];北京邮电大学;2008年
9 陈磊;数据挖掘技术在处理交通流数据中的研究及应用[D];长安大学;2009年
10 魏欣南;关系数据库关联规则挖掘算法研究[D];哈尔滨理工大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 杨明,孙志挥,吉根林;一种基于分布式数据库的全局频繁项目集更新算法[J];东南大学学报(自然科学版);2002年06期
2 王德兴;胡学钢;刘晓平;王浩;;改进购物篮分析的关联规则挖掘算法[J];重庆大学学报(自然科学版);2006年04期
3 吴文妹;;关联规则更新的新算法[J];福州大学学报(自然科学版);2006年05期
4 贾桂霞;张永;陈思睿;;一种基于关联模式的完全决策规则的提取方法[J];兰州理工大学学报;2006年05期
5 蒙韧;苏毅娟;朱晓峰;张继连;;数据挖掘中的增量式关联规则更新算法[J];广西科学院学报;2006年02期
6 陆建江,钱祖平,宋自林;正态云关联规则在预测中的应用[J];计算机研究与发展;2000年11期
7 陆建江;加权关联规则挖掘算法的研究[J];计算机研究与发展;2002年10期
8 朱玉全,孙志挥,赵传申;快速更新频繁项集[J];计算机研究与发展;2003年01期
9 杨明,孙志挥,吉根林;快速挖掘全局频繁项目集[J];计算机研究与发展;2003年04期
10 铁治欣,陈奇,俞瑞钊;采掘关联规则的高效并行算法[J];计算机研究与发展;1999年08期
【相似文献】
中国期刊全文数据库 前10条
1 姜永亮;符传谊;;数据挖掘技术在选课系统中的应用[J];微型电脑应用;2009年08期
2 孙细明;龚成芳;;关联规则在购物篮分析中的应用[J];计算机与数字工程;2008年06期
3 刘林东;曾小宁;;Apriori算法在网上考试系统中的应用[J];广东教育学院学报;2005年05期
4 王冠;王静;;数据挖掘技术在高校招生工作中的应用[J];福建电脑;2008年06期
5 姜红艳;;Apriori关联算法在学生成绩中的应用[J];鞍山师范学院学报;2007年02期
6 张萌;梁正;祝思清;;基于关联规则的数据挖掘在医疗诊断中的应用[J];山东科学;2008年01期
7 曹小峰;;基于数据挖掘的智能网络客户群分析技术的探究[J];科技信息(学术研究);2008年36期
8 袁万莲;郑诚;;数据挖掘技术在高校课堂教学评价中的应用[J];计算机技术与发展;2008年11期
9 杜威;邹先霞;;增量关联规则挖掘算法在犯罪行为中的应用研究[J];中国人民公安大学学报(自然科学版);2011年02期
10 梁丽燕;;关联规则挖掘Apriori算法在数字档案系统中的应用研究[J];现代计算机(专业版);2011年13期
中国重要会议论文全文数据库 前10条
1 邵秀凤;程葳;孟红;;网络论坛中隐含规律挖掘研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
2 王文平;刘希玉;;基于遗传算法的关联规则挖掘模型[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
3 刘惠;邱天爽;;基于模糊集理论和信息增益分析技术的分类算法[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
4 谷斌;靳艳峰;王磊;;关联规则算法在邮政报刊征订中的应用研究[A];第十届中国科协年会信息化与社会发展学术讨论会分会场论文集[C];2008年
5 刘智涛;;数据挖掘中的关联规则浅析[A];甘肃成人教育协会2008年年会论文集[C];2008年
6 杨宗波;宗容;常俊;彭广军;;入侵检测中Apriori算法的研究与改进[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
7 杨纪军;朱培栋;;关联规则挖掘技术在蜜罐系统中的应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
8 陈晓云;李泽霞;刘幸辉;彭文静;;关联规则挖掘过程中的模糊化方法研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
9 李贝贝;乐嘉锦;;分布式环境下的隐私保护关联规则挖掘[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
10 朱攀;陈跃新;;Apriori算法在参保人信用度评价中的应用[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
6 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
9 诺达咨询高级咨询顾问 周连升;数据挖掘拓展3G增值空间[N];通信产业报;2007年
10 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
2 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
3 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
4 何月顺;关联规则挖掘技术的研究及应用[D];南京航空航天大学;2010年
5 刘智;关联规则挖掘方法及其在冠心病中医诊疗中的应用研究[D];大连海事大学;2012年
6 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
7 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
8 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
9 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
10 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 傅莉;数据挖掘在教学评估中的应用[D];南京理工大学;2007年
2 刘新恩;基于关联规则挖掘的钻井地质设计系统研究[D];中国石油大学;2009年
3 周翠红;数据挖掘中关联规则的研究及在高校教学质量评估中的应用[D];中南大学;2007年
4 戴新喜;基于模式矩阵的关联规则挖掘算法的研究与应用[D];南昌大学;2007年
5 孔芳;数据挖掘技术中关联规则算法的研究[D];江南大学;2008年
6 程建星;数据挖掘算法的改进及其在入侵检测中的应用[D];暨南大学;2008年
7 王玉梅;关联规则算法在股票分析预测中的应用研究[D];华北电力大学(河北);2008年
8 王永生;基于数据挖掘的关联规则算法[D];大连交通大学;2007年
9 鲁保华;基于可拓学的数据关联规则挖掘[D];西安电子科技大学;2009年
10 娄迎红;面向电子商务的数据挖掘研究与应用[D];山东师范大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026