收藏本站
《重庆大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

分布式关联规则挖掘的方法研究

王越  
【摘要】: 数据挖掘是当前KDD中的一个重要领域,而关联规则的挖掘是数据挖掘的一个重要组成部分。Internet/Intranet的高速发展促进了数据库技术的深入应用。由于安全及通信成本、效率等多方面的原因,大量的分散数据不可能集中起来处理。分布式关联规则的挖掘就是在这样的背景下提出的。 本文在分析和介绍了关联规则挖掘的基本概念和方法以及分布式关联规则挖掘方法和技术基础上,提出了中心结点结构的分布式关联规则挖掘的算法(C-DMA),分布式多层概念的关联规则挖掘算法,以及分布式元学习可变精度关联规则的挖掘算法;并且,在分析和研究了分布式关联规则挖掘中常见的数量型关联规则、关联规则的兴趣度问题的基础上提出了数量关联规则的聚类划分方法以及兴趣度过滤方法。本文的主要工作和结论如下: (1)对于分布式关联规则挖掘问题,目前的主要算法是CD算法和FDM算法。这些算法都是基于网状结构的分布式关联规则挖掘算法。但是,在实际的网络应用环境中,用户基于成本和管理等方面的需要,使用的网络结构往往是星型结构的,所以CD算法和FDM算法在网络结构和实际的网络结构不相适应,本文在CD算法及FDM算法的基础上提出以中心结点结构的分布式关联规则挖掘算法,并且从算法分析和仿真试验两个方面证明了算法的有效性和可扩展性。 (2)在分布式挖掘过程中,分布式数据库中存在着大量的数量属性,这些数量属性的处理好坏,直接影响着关联规则的挖掘效果和效率。本文在分析了数量型属性划分的基础上,提出了改进的FCM聚类及其利用遗传算法优化FCM聚类来处理数量型关联规则的方法。 (3)在实际的关联规则挖掘应用中,多层概念关联规则是用户经常考虑的问题。本文在设计并分析了单数据库多层关联规则挖掘算法的基础上,提出了在多层概念上进行分布式关联规则挖掘的算法。仿真试验表明,算法是有效的。 (4)由于大量数据的分布,提高分布式关联规则挖掘的效率是十分重要的一个环节。本文在Sampling算法的基础上提出了分布式元学习可变精度关联规则挖掘算法。算法分析表明,该算法是有效的。 (5)在关联规则挖掘中,关联规则结果的评价是关联规则应用的关键。本文在详细分析了目前国内外关联规则兴趣度评价的基础上,提出了利用Klementinen模版理论与相似性理论向结合的关联规则结果的处理算法。
【学位授予单位】:重庆大学
【学位级别】:博士
【学位授予年份】:2003
【分类号】:TP311.13

【引证文献】
中国期刊全文数据库 前3条
1 谈冉;陆正球;严新平;;分布式环境基于相似度的关联规则挖掘模型的研究[J];计算机应用研究;2008年03期
2 张春生;李艳;庄丽艳;图雅;张玉春;;基于局部性原理的分布式关联规则挖掘算法[J];计算机工程与应用;2012年21期
3 李梅;白振兴;;关联规则挖掘在航材保障中的应用[J];微计算机信息;2008年15期
中国博士学位论文全文数据库 前1条
1 林晓勇;频繁模式挖掘和动态维护的理论与方法研究[D];北京化工大学;2008年
中国硕士学位论文全文数据库 前5条
1 张磊;基于高级SQL查询的分布式多维关联规则挖掘算法的研究[D];天津理工大学;2010年
2 谢宏祥;基于Web日志的用户行为研究[D];中山大学;2011年
3 江舞山;基于网格的分布式数据挖掘体系结构的研究[D];重庆大学;2006年
4 张迎春;带补偿的快速分布式关联规则挖掘算法的研究[D];山东科技大学;2006年
5 赵家辉;个性化信息服务中的用户兴趣迁移研究[D];电子科技大学;2009年
【参考文献】
中国期刊全文数据库 前10条
1 黄源,萧嵘,张福炎;神经网络的规则提取研究[J];计算机研究与发展;1999年09期
2 程继华,施鹏飞;概念指导的关联规则的挖掘[J];计算机研究与发展;1999年09期
3 周欣,沙朝锋,朱扬勇,施伯乐;兴趣度——关联规则的又一个阈值[J];计算机研究与发展;2000年05期
4 叶施仁,游湘涛,史忠植,李晓黎;高维数据中有效的相似性计算方法[J];计算机研究与发展;2000年10期
5 何炎祥;KDD技术在超级市场中的应用[J];计算机工程与应用;1999年05期
6 梁意文,曹霞,李欢,董红斌;关联规则的启发式发现方法[J];计算机工程与应用;2000年12期
7 何嵩;田振军;;自上而下的关联规则采掘方法[J];计算机科学;1999年01期
8 欧阳为民;郑诚;蔡庆生;;国际上关联规则发现研究述评[J];计算机科学;1999年03期
9 许国艳,史宇清;遗传算法在关联规则挖掘中的应用[J];计算机工程;2002年07期
10 程继华,郭建生,施鹏飞;挖掘所关注规则的多策略方法研究[J];计算机学报;2000年01期
【共引文献】
中国期刊全文数据库 前10条
1 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
2 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
3 赵群礼;;基于FP-Tree的最大频繁项目集综合更新算法[J];安徽教育学院学报;2006年03期
4 赵群礼;卢朴;;基于T-tree的最大频繁项目集挖掘算法[J];合肥师范学院学报;2009年06期
5 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期
6 程家兴,钱付兰;粗糙集方法在基于属性分类中的应用[J];安徽大学学报(自然科学版);2005年01期
7 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
8 梁佩佩,杨丽萍;基于模糊关系数据库的聚类算法研究[J];安徽职业技术学院学报;2004年01期
9 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
10 章曙光;耿焕同;;一种改进的基于聚类的范例添加删除维护模型[J];安徽建筑工业学院学报(自然科学版);2006年01期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
4 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
5 查星云;;一种钢铁企业金属损耗平衡分析方法[A];全国冶金自动化信息网2012年年会论文集[C];2012年
6 张德政;刘洁卉;;基于图分析的领域知识获取技术[A];着力提高高等教育质量,努力增强高校创新与服务能力——北京市高等教育学会2007年学术年会论文集(上册)[C];2008年
7 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
8 汤广富;马春实;刘欢;付强;;模糊聚类快速实用方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
9 刘海霞;钟晓妮;周燕荣;田考聪;;决策树在居民就诊卫生服务利用影响因素研究中的应用[A];重庆市预防医学会2010年论文集[C];2011年
10 汪云亮;吕久明;刘孝刚;;基于信息熵的辐射源属性分类方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 李强;数据挖掘中关联分析算法研究[D];哈尔滨工程大学;2010年
4 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
5 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
6 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
7 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
8 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
9 戴小鹏;知识网格及其在农业生物灾害预警中关键技术研究[D];湖南农业大学;2010年
10 谢莉青;基于图像处理分析的机织物构成要素的综合识别方法与装置[D];东华大学;2010年
中国硕士学位论文全文数据库 前10条
1 梅俊;数据挖掘中关联规则算法的研究及应用[D];安徽工程大学;2010年
2 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
3 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
4 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
5 蔡宏果;基于基因表达式编程的Web个性化推荐技术研究[D];广西师范学院;2010年
6 冯为军;基于粗糙集理论的数据挖掘算法的研究[D];哈尔滨工程大学;2010年
7 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
8 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
9 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年
10 丛强;基于模糊关联规则Web挖掘算法的研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 张勉;基于隐马尔可夫模型的用户兴趣漂移模式发现方法[J];北京建筑工程学院学报;2005年03期
2 王艳;数据挖掘中关联规则的探讨[J];成都信息工程学院学报;2004年02期
3 伊卫国;卫金茂;王名扬;;关联规则挖掘方法的改进[J];东北师大学报(自然科学版);2006年02期
4 石晶,龚震宇,裘杭萍;基于Web使用挖掘的个性化服务系统[J];电子科技大学学报;2002年04期
5 马瑞,颜宏文;基于判定树的电力市场中发电商竞标能力数据挖掘的新思路[J];电力系统自动化;2002年15期
6 朱六璋,袁林,黄太贵;短期负荷预测的实用数据挖掘模型[J];电力系统自动化;2004年03期
7 张治斌;姜亚南;;基于WEB日志的数据挖掘研究[J];电脑与信息技术;2009年06期
8 董全德;;用户兴趣迁移模式与个性化服务[J];电脑知识与技术(学术交流);2007年17期
9 李立耀;;Web日志挖掘中的数据预处理研究——Frame页面过滤算法改进[J];福建电脑;2007年10期
10 应晓敏,刘明,窦文华;一种面向个性化服务的无需反例集的用户建模方法[J];国防科技大学学报;2002年03期
中国博士学位论文全文数据库 前10条
1 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
2 周皓峰;关联规则挖掘的拓展性研究[D];复旦大学;2003年
3 张小刚;关联规则挖掘及其在复杂工业过程控制中的应用研究[D];湖南大学;2002年
4 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
5 应晓敏;面向Internet个性化服务的用户建模技术研究[D];中国人民解放军国防科学技术大学;2003年
6 李学明;计算机数据的关联规则挖掘理论和算法研究[D];重庆大学;2003年
7 刘君强;海量数据挖掘技术研究[D];浙江大学;2003年
8 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年
9 郭秀娟;基于关联规则数据挖掘算法的研究[D];吉林大学;2004年
10 阮幼林;频繁模式挖掘算法及在入侵检测中的应用研究[D];华中科技大学;2004年
中国硕士学位论文全文数据库 前10条
1 涂庆华;数据挖掘在高校人事管理系统中的应用研究[D];南京理工大学;2004年
2 肖立英;基于INTERNET的用户个性化兴趣模型的研究[D];中南大学;2003年
3 王烁;关联规则数据挖掘中经典频集算法改进的研究[D];天津大学;2003年
4 栾江;数据质量控制:数据预处理研究、设计与实现[D];四川大学;2004年
5 邹丽;分布式系统下关联规则挖掘的研究与实现[D];大连交通大学;2005年
6 张海玉;基于Web使用挖掘的个性化推荐系统[D];西北大学;2006年
7 何永春;移动网络中个性化新闻推荐服务系统的设计和实现[D];北京邮电大学;2006年
8 关大伟;数据挖掘中的数据预处理[D];吉林大学;2006年
9 贺翔;基于政府信息系统的数据挖掘技术的研究[D];天津大学;2006年
10 王荧;并行关联规则算法优化的研究[D];山东科技大学;2007年
【二级引证文献】
中国期刊全文数据库 前10条
1 陈应霞;陈艳;;关联规则中的Apriori挖掘算法改进[J];长江大学学报(自然科学版)理工卷;2008年04期
2 徐广宇;孟繁军;;全局通讯网络模式的数据挖掘方法研究[J];电脑与信息技术;2013年04期
3 吴常辉;左春荣;;关联规则挖掘Apriori算法的研究[J];价值工程;2010年02期
4 王治和;景永霞;杜辉;;分布式关联规则挖掘研究[J];南京师大学报(自然科学版);2010年04期
5 张春生;李艳;庄丽艳;图雅;张玉春;;基于局部性原理的分布式关联规则挖掘算法[J];计算机工程与应用;2012年21期
6 李志浩;聂文汇;成鹏;张宇博;阳智敏;;基于分页缓存模型的用户兴趣跟踪方法[J];计算机工程与科学;2012年10期
7 夏龄;;一种基于动态调度的数据挖掘并行算法[J];科学技术与工程;2012年35期
8 李广水;郑滔;宋丁全;;面向服务数据挖掘的关键技术在.NET下的实现研究[J];计算机工程与设计;2009年20期
9 胡琴;黄林;;基于FP-growth算法的关联规则获取研究[J];微计算机信息;2009年27期
10 郑世明;邵荣明;苗壮;;基于网格的数据挖掘体系结构[J];指挥信息系统与技术;2011年05期
中国博士学位论文全文数据库 前1条
1 李广水;基于服务的森林资源调查数据挖掘系统的研究[D];南京林业大学;2010年
中国硕士学位论文全文数据库 前6条
1 霍祎;基于数据挖掘技术的电信客户信用管理与应用[D];北京邮电大学;2009年
2 林霞;个性化信息检索技术在勘探门户中的应用研究[D];西安石油大学;2011年
3 郭凯;电力客户信用管理系统的研究与设计[D];电子科技大学;2012年
4 李晓慧;基于Web日志的增量序列模式挖掘研究[D];杭州电子科技大学;2013年
5 邓亮;基于OpenFlow的视频流控制原型系统实现[D];电子科技大学;2013年
6 李海磊;垂直划分分布数据的多维关联规则挖掘研究[D];燕山大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 范九伦,裴继红,谢维信;基于可能性分布的聚类有效性[J];电子学报;1998年04期
2 史东辉,蔡庆生,倪志伟,张春阳;基于规则的分类数据离群挖掘方法研究[J];计算机研究与发展;2000年09期
3 陆建江,钱祖平,宋自林;正态云关联规则在预测中的应用[J];计算机研究与发展;2000年11期
4 李德毅,孟海军,史雪梅;隶属云和隶属云发生器[J];计算机研究与发展;1995年06期
5 刘明吉,王秀峰,王治宝,黄亚楼;一种基于遗传算法的知识挖掘算法[J];计算机工程;2000年08期
6 苑森淼,程晓青;数量关联规则发现中的聚类方法研究[J];计算机学报;2000年08期
7 铁治欣,陈奇,俞瑞钊;关联规则采掘综述[J];计算机应用研究;2000年01期
8 吉根林,帅克,孙志挥;数据挖掘技术及其应用[J];南京师大学报(自然科学版);2000年02期
9 周海岩;关联规则的开采与更新[J];软件学报;1999年10期
10 胡侃,夏绍玮;基于大型数据仓库的数据采掘:研究综述[J];软件学报;1998年01期
【相似文献】
中国期刊全文数据库 前10条
1 谢文阁;梅红岩;李欣;周月鹏;;基于兴趣度的关联规则在选课分析中的应用[J];内蒙古大学学报(自然科学版);2009年02期
2 陈永平;刘俞;苏新;;基于兴趣度的Web页面关联规则的研究[J];计算机技术与发展;2008年05期
3 宋爱波,董逸生,赵茂先;稠密数据库有趣规则的快速挖掘[J];小型微型计算机系统;2001年07期
4 董彩云;吕秀荣;;数据挖掘技术在个性化学习指导中的应用[J];山东广播电视大学学报;2010年01期
5 雷亮;汪同庆;杨波;;改进遗传算法在图像挖掘中的应用[J];计算机工程与应用;2009年03期
6 伊卫国,卫金茂,王名扬;基于项目集加权的增量关联规则算法研究[J];计算机工程与应用;2004年34期
7 张璐璐;贾瑞玉;李学俊;;一种基于关联规则的离群数据挖掘算法及其应用[J];计算机技术与发展;2007年08期
8 曾安平;黄永平;阳万安;李广军;唐远翔;;一个基于兴趣度的FP-Growth算法改进[J];宜宾学院学报;2008年12期
9 宋海声;杨鸿武;裴东;;兴趣关联规则的挖掘[J];甘肃科技;2008年22期
10 张哲;薛惠锋;;多因素兴趣度建模与度量研究[J];陕西师范大学学报(自然科学版);2008年03期
中国重要会议论文全文数据库 前10条
1 方艳;别荣芳;;关联规则的有趣性研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 周皓峰;高攀;施伯乐;;一个基于兴趣度包含负属性项的关联规则采掘算法[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
3 李阳;徐锡山;韩伟红;郑黎明;徐镜湖;;网络安全事件关联规则的自动化生成方法研究与实践[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
4 左万利;刘居红;;包含正负属性的关联规则及其挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
5 王宁;董淳;胡运发;陶晓鹏;;面向集合的关联规则挖掘算法[A];第十五届全国数据库学术会议论文集[C];1998年
6 周焕银;张永;;关联规则候选项频度规律研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
7 黄晓燕;许龙飞;;基于关联规则的网络入侵检测技术的应用研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
8 李庆忠;张世栋;董国庆;;在数据多维体中进行关联规则的挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
9 韩涛;张春海;;关系数据库中关联规则的高效挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
10 潘海为;李建中;张炜;;挖掘脑部医学图像中的关联规则[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
中国重要报纸全文数据库 前10条
1 晓京;做分布式呼叫中心[N];中国计算机报;2003年
2 记者 张磊;分布式能源技术研讨会在京召开[N];中国电力报;2004年
3 盖俊飞 林楠;分布式ISA防火墙与服务器的配置[N];电脑报;2003年
4 刘轶轩;IONA:分布式SOA四两拨千斤[N];通信产业报;2007年
5 ;中兴通讯分布式“3G”服务[N];中国计算机报;2002年
6 国家高性能计算机工程技术研究中心 黄华 杨德志 张建刚;分布式文件系统趋向成熟[N];中国计算机报;2005年
7 国防科学技术大学计算机学院软件所 董勇 周恩强;构建分布式文件系统[N];中国计算机报;2005年
8 李芸 星际网络公司;IP分布式呼叫中心 让企业驶离信息孤岛[N];计算机世界;2002年
9 记者邰举;韩分布式超级计算机年底诞生[N];科技日报;2003年
10 国家高性能计算机工程技术研究中心 黄华 杨德志 张建刚;分布式文件系统的历史与现状[N];中国计算机报;2005年
中国博士学位论文全文数据库 前10条
1 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年
2 肖波;可信关联规则挖掘算法研究[D];北京邮电大学;2009年
3 伊卫国;基于关联规则与决策树的预测方法研究及其应用[D];大连海事大学;2012年
4 Vital Delmas MABONZO;大型数据库有效挖掘关联规则新方法研究[D];大连海事大学;2012年
5 叶小飞;基于自发呈报系统与循证医学的药品不良反应信号挖掘[D];第二军医大学;2011年
6 蔡瑞初;基因表达数据挖掘若干关键技术研究[D];华南理工大学;2010年
7 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年
8 楼巍;面向大数据的高维数据挖掘技术研究[D];上海大学;2013年
9 王春雨;刑事案件关联分析与防控警务模式研究[D];大连理工大学;2010年
10 赵春;基于数据挖掘技术的财务风险分析与预警研究[D];北京化工大学;2012年
中国硕士学位论文全文数据库 前10条
1 何兵;关联规则数据挖掘算法的相关研究[D];西南交通大学;2004年
2 靳峰;基于兴趣度的推荐系统研究[D];西安建筑科技大学;2005年
3 涂明;关联规则增量式更新算法研究[D];合肥工业大学;2010年
4 王景;基于关联规则数据挖掘的研究[D];广西大学;2003年
5 张梅凤;挖掘有效关联规则算法的分析与设计[D];郑州大学;2001年
6 王培吉;基于Apriori算法的关联规则挖掘及改进[D];内蒙古大学;2003年
7 岳慧颖;含有时空约束的关联规则挖掘方法研究[D];哈尔滨工程大学;2004年
8 聂倩雯;基于关联规则数据挖掘和扩展贝叶斯网络的电网故障诊断方法研究[D];西南交通大学;2010年
9 赵春胜;基于关联规则的数据挖掘方法在电厂脱硫监测中的应用研究[D];内蒙古大学;2011年
10 蒋秀英;数据挖掘中的关联规则算法优化研究及应用[D];山东师范大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026