收藏本站
《天津大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘中关联规则算法的研究

钱冬云  
【摘要】: 随着信息技术的迅猛地发展,人类可以更快、更方便地获取数据、保存数据;数据的量和复杂程度都是前所未见。并且随着各行各业都开始采用WEB网站作为营销和CRM工具,所获取的数据正在以指数级的速度增长。然而这海量数据中只有部分数据得到利用,升华为知识,即出现了“丰富的数据”而“贫乏的知识”的尴尬局面。然而,“数据挖掘”—即利用计算机技术来分析处理并提取有用、有趣知识的技术的出现,为这一问题的解决提供了可能。 数据挖掘是一个从大量数据中提取有用的、有趣的知识的处理过程。数据挖掘发现的知识模式有多种不同的类型,常见的模式有:关联模式、分类模式、聚类模式、序列模式等。本文着重介绍了关联模式(关联规则)的基本概念、常用的算法和扩展算法,以及研究现状,并指出关联规则挖掘是当前的热门。关联规则挖掘算法中,大部分算法都基于Apriori算法进行计算,其在挖掘过程中会产生大量候选项集,降低了关联规则挖掘的效率;同时关联规则挖掘会得到大量冗余规则,降低了关联规则挖掘的有效性;并且关联规则挖掘之用户交互性能也较差。本文在深入研究现有算法的基础上,为了提高用户数据挖掘的人机交互性能,解决关联规则挖掘产生冗余规则的问题,提出了两种基于用户导向的关联规则挖掘方法—SQL-IIAR算法和Bit-IIAR算法。 SQL-IIAR算法是按照用户设置的规则的前件和后件,将原始事务数据库转化为新的包含规则的前件和后件的新的数据库,通过对数据的预处理,并改进Apriori算法的挖掘过程,压缩事务数据库,提高了关联规则的质量和效率。Bit-IIAR算法改进了事务数据库的存放形式,提高关联规则的效率和交互性,采用新数据预处理和用户导向的关联规则数据挖掘,其效率有明显的提高。
【学位授予单位】:天津大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP311.13

【引证文献】
中国硕士学位论文全文数据库 前10条
1 唐辉;关联挖掘技术在商品销售中的应用研究[D];北方工业大学;2011年
2 李彦钊;基于正负项目及多支持度的关联规则挖掘算法研究[D];西南交通大学;2010年
3 张奇;基于聚类的协同过滤推荐算法的研究[D];河北工业大学;2011年
4 王二锋;数据挖掘在医学诊断规则提取中的应用研究[D];西安理工大学;2008年
5 王灿;含负项目的关联规则挖掘算法研究[D];重庆大学;2008年
6 胡艳翠;基于关联规则的数据挖掘算法研究[D];大连海事大学;2009年
7 汪瑛;数据挖掘在燃气系统中的应用研究[D];南京理工大学;2009年
8 李继腾;最大频繁子图挖掘方法研究[D];国防科学技术大学;2009年
9 耿晓斐;关联规则中ECLAT算法的研究与应用[D];重庆大学;2009年
10 汤晓超;基于数据挖掘技术的审计抽样系统开发和研究[D];江苏大学;2010年
【共引文献】
中国硕士学位论文全文数据库 前10条
1 梅俊;数据挖掘中关联规则算法的研究及应用[D];安徽工程大学;2010年
2 王德才;数据挖掘在校园卡消费行为分析中的研究与应用[D];哈尔滨工程大学;2010年
3 朱彦霞;多关系关联规则及其在HRM中的应用[D];河南工业大学;2010年
4 冯兴祥;关联规则挖掘在高校招生录取中的应用[D];合肥工业大学;2010年
5 张磊;基于高级SQL查询的分布式多维关联规则挖掘算法的研究[D];天津理工大学;2010年
6 朱庆;关联规则挖掘算法的研究[D];新疆农业大学;2010年
7 苏立明;关联规则挖掘在税务系统中的应用与研究[D];长春工业大学;2010年
8 唐松;基于数据挖掘的高校评教系统设计与实现[D];电子科技大学;2010年
9 王秀庭;基于冠心病数据库的关联规则数据挖掘系统的设计与实现[D];电子科技大学;2010年
10 陈凤琴;数据挖掘技术在化工领域应用研究[D];东华大学;2011年
【同被引文献】
中国硕士学位论文全文数据库 前10条
1 彭君舟;审计统计抽样技术方法研究与设计运行[D];湖南大学;2001年
2 郑洪英;数据挖掘聚类算法的分析和应用研究[D];重庆大学;2002年
3 刘振岩;数据挖掘分类算法的研究与应用[D];首都师范大学;2003年
4 郭军华;数据挖掘中聚类分析的研究[D];武汉理工大学;2003年
5 陈安龙;基于兴趣度的关联规则挖掘算法的研究[D];西南交通大学;2003年
6 苏瑛;聚类分析模型在房地产投资决策中的应用研究[D];西安建筑科技大学;2004年
7 陈海燕;基于HIS的数据仓库的建设及数据挖掘[D];新疆大学;2004年
8 邱怀姗;OLAP和数据挖掘技术在高校科技管理决策中的应用[D];北京化工大学;2003年
9 浦磊;数据挖掘中关联规则的研究与应用[D];西安理工大学;2005年
10 王莉红;电子商务环境下协同过滤推荐方法的应用分析与研究[D];上海师范大学;2005年
【二级引证文献】
中国硕士学位论文全文数据库 前10条
1 高希瑞;基于文本挖掘的企业危机预警研究[D];华东师范大学;2011年
2 黄敏凤;数据挖掘技术在高校学生成绩中的应用研究[D];江西师范大学;2011年
3 严的兵;基于数据挖掘的学生成绩分析[D];安徽大学;2011年
4 姚建玉;基于复杂网络理论的水华暴发数值模型研究[D];重庆大学;2011年
5 李涛;基于FP-Growth关联规则的并行算法分析及其应用研究[D];辽宁工程技术大学;2011年
6 梁小鸥;数据挖掘在高职教学管理中的应用[D];华南理工大学;2011年
7 孔令娟;数据挖掘在连锁餐饮业中的研究和应用[D];南京理工大学;2012年
8 王会霞;山西移动增值业务精确营销研究[D];中北大学;2012年
9 尤海磊;荞麦聚类分析及生长模型的研究[D];西北农林科技大学;2010年
10 李松梅;燃气生产运行综合管理信息系统的设计与开发[D];东北石油大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 王立平;黄斌;;基于数据挖掘技术的高校图书馆馆藏优化研究[J];萍乡高等专科学校学报;2009年03期
2 欧凤霞;王宗殿;;基于关联规则的数据挖掘技术在中医诊断中的应用[J];河南工程学院学报(自然科学版);2011年02期
3 杨海涛,刘胜全;基于分布式数据库的挖掘模型[J];现代计算机;2005年11期
4 郭卜铭;吕渭济;;高校科研管理中的数据挖掘技术及应用[J];科技和产业;2007年06期
5 俞燕燕;;基于关联规则的社会性网络行为研究[J];福建电脑;2007年12期
6 杨春建;石锐明;张宏;;数据挖掘在青海大学教学评估中的应用[J];计算机教育;2007年16期
7 潘锋;;关联规则在教学计划制定中的应用[J];重庆科技学院学报(自然科学版);2008年06期
8 陈玮炜;林栋;;关联规则挖掘在经穴诊疗文献整理中的应用[J];福建电脑;2009年05期
9 康艳霞;;数据挖掘在学生成绩分析中的应用[J];信息与电脑(理论版);2009年09期
10 胡春红;;一种基于数据挖掘技术的入侵检测系统模型及应用[J];长江大学学报(自然科学版)理工卷;2010年02期
中国重要会议论文全文数据库 前10条
1 王文平;刘希玉;;基于遗传算法的关联规则挖掘模型[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
2 邵秀凤;程葳;孟红;;网络论坛中隐含规律挖掘研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 刘惠;邱天爽;;基于模糊集理论和信息增益分析技术的分类算法[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
4 刘智涛;;数据挖掘中的关联规则浅析[A];甘肃成人教育协会2008年年会论文集[C];2008年
5 陈晓云;李泽霞;刘幸辉;彭文静;;关联规则挖掘过程中的模糊化方法研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
6 谷姗姗;秦首科;胡大斌;周傲英;;面向关联规则挖掘的敏感规则隐藏技术[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 张宇鹏;王丽珍;周丽华;;基于气象数据的关联规则挖掘[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
8 王盛;董黎刚;李群;;一种基于逆序编码的关联规则挖掘研究[A];浙江省电子学会2010学术年会论文集[C];2010年
9 方芳;李建中;潘海为;;脑部医学图像中的关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 张鹏;于波;童云海;唐世渭;;基于随机响应的隐私保护关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
6 本报记者 木可;微断市场涌现“用户导向”潮流[N];机电商报;2005年
7 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
8 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
9 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
10 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
中国博士学位论文全文数据库 前10条
1 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
2 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
3 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
4 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
5 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
6 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
7 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
8 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
9 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 陈耀东;遗传算法在关联规则挖掘中的应用[D];华东师范大学;2008年
2 高乾;基于遗传算法的关联规则挖掘[D];曲阜师范大学;2008年
3 王志浩;数据挖掘在招生信息处理系统中的应用研究[D];山东师范大学;2006年
4 贺云;数据挖掘在电子商务推荐系统中的应用研究[D];大连交通大学;2010年
5 武坤;快速生成关联规则的算法研究[D];河南大学;2006年
6 王绍锋;关联规则增量式更新算法的研究[D];哈尔滨工程大学;2007年
7 李余琪;遗传算法在数据挖掘中的研究与应用[D];中南大学;2007年
8 曾舸;基于半结构化数据的关联规则挖掘研究[D];湖南师范大学;2007年
9 胡曼;交叉销售在中国保险业的应用分析[D];山东大学;2009年
10 朱晓东;基于支持度变化的关联规则挖掘算法及实现[D];南京航空航天大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026