收藏本站
《江苏科技大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于矩阵的加权关联规则挖掘算法研究

刘海蓉  
【摘要】:自20世纪60年代以来,数据库技术开始被广泛地应用于国家政府机构、商业部门和科研机构等领域。随着时代的发展,特别是互联网技术的出现,这些领域的数据库的数据呈现近乎几何爆炸式的增长,因此对海量数据集进行信息提取的需求就变得日益迫切。传统的数据库技术的局限性在于只能针对数据库进行查询和检索,而不能从数据库中提取知识,造成数据库中所蕴含的丰富知识不能被有效地发掘和利用,在这样的背景下就诞生了数据挖掘技术。数据挖掘被期望用来从历史积累的大量数据中挖掘出隐藏的规律或关联,从而为决策的制定和执行提供有力的参考和帮助。 作为数据挖掘主要研究的方向之一的关联规则挖掘(Association Rule Mining) ,其主要是用于从数据库中找出数据项之间的关联关系,作为决策参考的依据。迄今为止,最有影响的布尔型挖掘关联规则算法是R. Agrawal等人提出的Apriori算法。但是基于经典Apriori算法的关联规则算法存在两个问题,需要多次扫描数据库和容易忽略出现频率小但是价值高的项目。Apriori算法在处理数据库中的各个项目时,是假设数据库中的每个项目具有相同的重要性,但是这样显然不符合实际情况。为了更合理地进行数据挖掘,人们引入了权重的概念使得挖掘的数据和潜在的模式更具有现实意义,因此需要利用现有的知识,对加权关联规则的研究进行认真细致的研究。 本文对传统加权关联规则挖掘算法进行了改进,该改进算法采用矩阵和加权关联规则算法相结合的方法,并做了改进算法与传统加权关联规则挖掘算法的性能对比实验,得到的实验结果表明本文提出的改进算法在性能上优于原有加权关联规则挖掘算法。该改进算法的创新之处在于引入了矩阵思想,只需要扫描一次数据库来构建矩阵,给出了改进的权值定义,该定义既考虑到了权重大的项目,也没有忽略频繁出现而权重小的项目,并引入K-项支持期望作为减枝的依据,解决了传统加权关联规则挖掘算法中加权频繁项集不存在普通关联规则中频繁项集所具有的反单调性的问题。
【学位授予单位】:江苏科技大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP311.13

【参考文献】
中国期刊全文数据库 前10条
1 王华;江启成;胡学钢;;数据挖掘在医学上的应用[J];安徽医药;2008年08期
2 田苗苗;数据挖掘之决策树方法概述[J];长春大学学报;2004年06期
3 欧阳继红,王仲佳,刘大有;具有动态加权特性的关联规则算法[J];吉林大学学报(理学版);2005年03期
4 缪裕青;;频繁闭合项目集的并行挖掘算法研究[J];计算机科学;2004年05期
5 陆丽娜,杨怡玲,管旭东,魏恒义;Web日志挖掘中的数据预处理的研究[J];计算机工程;2000年04期
6 郑建国,焦李成;偏差检测挖掘方法研究[J];计算机工程;2001年08期
7 李文浩,李劼;数据立方体压缩存储技术研究现状与展望[J];湖南人文科技学院学报;2004年06期
8 刘彤;;数据立方体压缩技术研究[J];农业图书情报学刊;2010年06期
9 郭伟业;赵晓丹;庞英智;奇志;;数据挖掘中SOM神经网络的聚类方法研究[J];情报科学;2009年06期
10 欧阳为民,郑诚,蔡庆生;数据库中加权关联规则的发现[J];软件学报;2001年04期
【共引文献】
中国期刊全文数据库 前10条
1 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
2 王傲胜;李国徽;;具有利润约束的数值型关联规则的发现[J];安徽电气工程职业技术学院学报;2006年03期
3 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
4 范进;;产业结构对产业集群影响力的实证分析[J];安徽广播电视大学学报;2006年04期
5 于立红;杜芸;;数据挖掘中数据预处理方法与技术[J];安徽电子信息职业技术学院学报;2009年04期
6 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期
7 舒坚;郑诚;陈振;;基于关联分类方法的Web使用挖掘研究[J];安徽大学学报(自然科学版);2006年02期
8 梁佩佩,杨丽萍;基于模糊关系数据库的聚类算法研究[J];安徽职业技术学院学报;2004年01期
9 章曙光;耿焕同;;一种改进的基于聚类的范例添加删除维护模型[J];安徽建筑工业学院学报(自然科学版);2006年01期
10 李永森;潘若愚;李传军;;公共设施选址优化研究[J];安徽建筑工业学院学报(自然科学版);2009年06期
中国重要会议论文全文数据库 前10条
1 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
3 查星云;;一种钢铁企业金属损耗平衡分析方法[A];全国冶金自动化信息网2012年年会论文集[C];2012年
4 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
5 汤广富;马春实;刘欢;付强;;模糊聚类快速实用方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
6 郭仁安;;GIS中属性数据质量控制的研究与探讨[A];中国测绘学会2010年学术年会论文集[C];2010年
7 丁莉娟;;数据挖掘在财务风险分析中的应用[A];第三届全国软件测试会议与移动计算、栅格、智能化高级论坛论文集[C];2009年
8 由立真;穆志纯;;基于GHSOM网络预测客户欺诈行为[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
9 杨雯怡;郑康锋;杨义先;;一种自适应的网络安全防护方案[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
10 陈震;陈维默;;浅谈数据挖掘技术[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
3 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
4 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
5 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
6 马志勇;机械对称的概念、作用及其应用知识获取的研究[D];浙江大学;2010年
7 戴小鹏;知识网格及其在农业生物灾害预警中关键技术研究[D];湖南农业大学;2010年
8 管红波;食品连锁经营中的有效客户反应研究[D];东华大学;2010年
9 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
10 陈进杰;城市轨道交通项目广义全寿命周期成本理论与应用研究[D];北京交通大学;2011年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
3 冯为军;基于粗糙集理论的数据挖掘算法的研究[D];哈尔滨工程大学;2010年
4 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年
5 刘洁;基于关联挖掘的深层网络接口模式匹配方法的研究[D];哈尔滨工程大学;2010年
6 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
7 周东海;基于记账凭证的高校教育成本数据挖掘研究[D];哈尔滨工程大学;2010年
8 张进;我国施工劳动生产率管理研究[D];大连理工大学;2010年
9 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年
10 靳小川;模糊聚类算法在大学生心理健康分析中的应用研究[D];辽宁工程技术大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 王华;胡学钢;;基于关联规则的数据挖掘在临床上的应用[J];安徽大学学报(自然科学版);2006年02期
2 屈景辉,廖琪梅,许卫中,陈汉勇;医学信息数据库的建立与数据挖掘[J];第四军医大学学报;2001年01期
3 张旭,董有田;OLAP多维数据分析与应用研究[J];黑龙江科技学院学报;2002年03期
4 胡陈勇,刘大有,刘亚波;一种扩展的关联规则挖掘算法[J];吉林大学学报(理学版);2005年02期
5 欧阳为民;郑诚;蔡庆生;;国际上关联规则发现研究述评[J];计算机科学;1999年03期
6 杨黎刚;苏宏业;张英;褚健;;基于SOM聚类的数据挖掘方法及其应用研究[J];计算机工程与科学;2007年08期
7 王利强,唐常杰,于中华,何雪梅;基于Web的数据采掘[J];计算机应用;1998年10期
8 朱家元,张恒喜,虞健飞;在数据挖掘中基于SOM网络的数据分析可视化设计[J];计算机应用与软件;2003年02期
9 欧阳为民,郑诚,蔡庆生;数据库中加权关联规则的发现[J];软件学报;2001年04期
10 赵晓丹;齐志;;基于SOM神经网络的聚类方法研究[J];吉林省经济管理干部学院学报;2008年02期
【相似文献】
中国期刊全文数据库 前10条
1 杨泽民,陈莉,范全润;加权关联规则的并行挖掘算法[J];计算机工程与应用;2003年08期
2 郭艳军;王忠桃;钱卫;;加权关联规则的改进算法[J];成都信息工程学院学报;2008年03期
3 杨明,孙志挥,赵传申;交易数据库的加权关联规则增量更新算法[J];计算机工程与应用;2002年01期
4 周晓云,孙志挥,倪巍伟;一种基于加权的高效关联规则挖掘算法的设计与实现[J];计算机工程与应用;2004年20期
5 邹力鹍;张其善;;基于多最小支持度的加权关联规则挖掘算法[J];北京航空航天大学学报;2007年05期
6 王斌;丁祥武;;一种基于BUC的水平加权关联规则挖掘算法[J];计算机应用与软件;2008年12期
7 李娟;张明义;汪维清;;快速挖掘加权频繁项集的矩阵位串算法[J];计算机工程与设计;2007年11期
8 刘海蓉;闫仁武;;一种改进的加权关联规则挖掘算法[J];现代电子技术;2011年12期
9 李呈林;陈水利;;基于PSO的加权关联规则挖掘算法[J];集美大学学报(自然科学版);2007年01期
10 侯新丽;孟晓伟;于松;;基于矩阵的加权关联规则挖掘算法[J];电脑开发与应用;2010年06期
中国重要会议论文全文数据库 前10条
1 沈向余;李伟华;;几种关联规则挖掘算法的分析[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
2 丁艳辉;王洪国;高明;谷建军;;一种基于矩阵的高效关联规则挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
3 郭平;陈黎;聂亚可;林勇;;以Apriori为基础的序列挖掘算法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
4 莫晓静;史岚;许光宇;赵宇海;王国仁;乔建忠;;MFCC:一种高效的三维频繁闭项集挖掘算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
5 王晨;朱永泰;汪卫;施伯乐;;高效地挖掘频繁图模式[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
6 朱永泰;王晨;洪铭胜;汪卫;施伯乐;;ESPM——频繁子树挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 蔡国强;李川;范明;;一个高效的多维关联规则挖掘算法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
8 任家东;孙亚非;郭盛;;基于约束的交互式频繁模式挖掘算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
9 陈晓云;李龙杰;马志新;白伸伸;王磊;;AFP-Miner:一种新高效的频繁项集挖掘算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
10 柴明亮;李宁宁;宋苏;;平均阈值关联规则挖掘算法[A];2005年中国智能自动化会议论文集[C];2005年
中国重要报纸全文数据库 前10条
1 孙富春 李磊;电子政务中的数据挖掘[N];计算机世界;2001年
2 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
3 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
4 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
5 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
6 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
7 张立明;数据挖掘之道[N];网络世界;2003年
8 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
9 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
10 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
中国博士学位论文全文数据库 前10条
1 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
2 郭秀娟;基于关联规则数据挖掘算法的研究[D];吉林大学;2004年
3 王卉;最大频繁项集挖掘算法及应用研究[D];华中科技大学;2004年
4 金阳;基于概念格模型的序列模式挖掘算法研究[D];吉林大学;2007年
5 林晓勇;频繁模式挖掘和动态维护的理论与方法研究[D];北京化工大学;2008年
6 宋世杰;基于序列模式挖掘的误用入侵检测系统及其关键技术研究[D];国防科学技术大学;2005年
7 董晓莉;时间序列数据挖掘相似性度量和周期模式挖掘研究[D];天津大学;2007年
8 王德兴;基于概念格模型关联规则挖掘的关键问题研究[D];合肥工业大学;2007年
9 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
10 熊赟;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
中国硕士学位论文全文数据库 前10条
1 刘海蓉;基于矩阵的加权关联规则挖掘算法研究[D];江苏科技大学;2011年
2 张秋凤;加权关联规则挖掘算法研究及应用[D];天津师范大学;2011年
3 李成军;蚁群算法在加权关联规则挖掘中的研究与实现[D];暨南大学;2010年
4 罗芳;基于聚类和压缩矩阵的加权关联规则算法的研究与应用[D];华东师范大学;2010年
5 栗晓聪;加权关联规则在入侵检测中的研究与应用[D];广东工业大学;2012年
6 乔永生;基于数据仓库的关联规则挖掘算法研究[D];中北大学;2006年
7 杨晖;水平加权关联规则挖掘算法的研究[D];福州大学;2006年
8 肖海林;网络告警关联规则挖掘系统的研究与设计[D];电子科技大学;2007年
9 许砺珅;遂宁市政府个性化门户网站系统的设计与实现[D];电子科技大学;2011年
10 陈锹;基于粗糙集的知识发现在客户关系管理(CRM)中的应用[D];广西大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026