收藏本站
《河北工程大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘中的关联规则算法研究

刘寒冰  
【摘要】: 目前,关联规则作为数据挖掘领域中一个非常重要的研究课题,己经取得了令人瞩目的成绩,但在实际应用中,随着数据库规模逐渐增大,出现了随着数据量递增而算法挖掘效率下降的问题,具有应用局限性。因此,必须研究和改进现有的算法,使其具有更高的效率和更广阔的应用前景。本文着重对关联规则挖掘算法进行了研究,在现有算法的基础上,提出两个适应性较强的高效挖掘算法。 首先,研究了关联规则中经典的Apriori算法及其改进算法。为了解决这些算法在候选项目集和执行时间方面存在的问题,结合关联规则的性质和布尔向量的关系运算思想,提出了基于布尔矩阵的关联规则挖掘算法(Algorithm Based on Boolean Matrix,简称ABBM)。该算法在挖掘过程中仅扫描数据库一次,而且不产生候选项目集,从而减少了生成频繁项目集的时间开销,提高了算法效率,达到了算法改进的目的。 其次,研究了经典的关联规则增量式更新挖掘算法及其优化算法。针对在最小支持度、最小置信度不变的情况下,新增数据集时关联规则更新效率低的问题,提出了一种高效的关联规则增量式更新挖掘算法(High-Efficient Incremental Updating,简称HIUP)。该算法采用AprioriTidList算法来发现新增数据集中的频繁项目集,并通过有效的优化策略对候选项目集进行分类和剪裁,从而减少了候选项目集的数量和扫描新增数据集的次数,提高了算法的更新效率。 为了验证算法的性能,本文分别采用合成数据库和真实数据库对提出的新算法及其同类算法进行了对比测试。试验结果表明,ABBM、HIUP算法在效率上明显优于同类算法,而且挖掘的数据量越大,算法效率越高,具有较好的可扩展性和较广阔的应用前景。
【学位授予单位】:河北工程大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP311.13

【相似文献】
中国期刊全文数据库 前10条
1 闫晓婷;乔俊玲;;数据挖掘在网络销售系统中的应用[J];科技信息;2011年16期
2 夏惠芬;董卫民;;基于关联规则的Web挖掘技术研究[J];现代电子技术;2011年16期
3 梁竹;谢长勇;罗刚;严中;;基于WEKA的高校学生综合测评数据挖掘[J];电脑知识与技术;2011年16期
4 李小丹;;数据挖掘在农业电子商务中的应用[J];农业与技术;2011年02期
5 梁丽燕;;关联规则挖掘Apriori算法在数字档案系统中的应用研究[J];现代计算机(专业版);2011年13期
6 马伟杰;;数据挖掘在高校学生工作中的应用[J];软件导刊;2011年08期
7 李静;;数据挖掘技术在公安技侦工作中的应用[J];企业科技与发展;2011年15期
8 李昊;周振华;;基于数据挖掘的高校学生成绩预警系统[J];大庆石油学院学报;2011年04期
9 刘江越;;数据挖掘技术在高职学生职业能力发展定位中的应用——以通信技术专业为例[J];网络与信息;2011年08期
10 杨雪霞;;数据挖掘技术在高校图书馆管理系统中的应用研究[J];软件;2011年04期
中国重要会议论文全文数据库 前10条
1 王文平;刘希玉;;基于遗传算法的关联规则挖掘模型[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
2 邵秀凤;程葳;孟红;;网络论坛中隐含规律挖掘研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
3 刘惠;邱天爽;;基于模糊集理论和信息增益分析技术的分类算法[A];第十一届全国信号处理学术年会(CCSP-2003)论文集[C];2003年
4 刘智涛;;数据挖掘中的关联规则浅析[A];甘肃成人教育协会2008年年会论文集[C];2008年
5 陈晓云;李泽霞;刘幸辉;彭文静;;关联规则挖掘过程中的模糊化方法研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
6 谷姗姗;秦首科;胡大斌;周傲英;;面向关联规则挖掘的敏感规则隐藏技术[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 张宇鹏;王丽珍;周丽华;;基于气象数据的关联规则挖掘[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
8 王盛;董黎刚;李群;;一种基于逆序编码的关联规则挖掘研究[A];浙江省电子学会2010学术年会论文集[C];2010年
9 方芳;李建中;潘海为;;脑部医学图像中的关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 张鹏;于波;童云海;唐世渭;;基于随机响应的隐私保护关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
3 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
6 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
9 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
10 ;数据挖掘阻止银行客户流失[N];计算机世界;2007年
中国博士学位论文全文数据库 前10条
1 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
2 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
3 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
4 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
5 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
6 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
7 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
8 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
9 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 陈耀东;遗传算法在关联规则挖掘中的应用[D];华东师范大学;2008年
2 高乾;基于遗传算法的关联规则挖掘[D];曲阜师范大学;2008年
3 王志浩;数据挖掘在招生信息处理系统中的应用研究[D];山东师范大学;2006年
4 贺云;数据挖掘在电子商务推荐系统中的应用研究[D];大连交通大学;2010年
5 武坤;快速生成关联规则的算法研究[D];河南大学;2006年
6 王绍锋;关联规则增量式更新算法的研究[D];哈尔滨工程大学;2007年
7 李余琪;遗传算法在数据挖掘中的研究与应用[D];中南大学;2007年
8 曾舸;基于半结构化数据的关联规则挖掘研究[D];湖南师范大学;2007年
9 胡曼;交叉销售在中国保险业的应用分析[D];山东大学;2009年
10 朱晓东;基于支持度变化的关联规则挖掘算法及实现[D];南京航空航天大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026