收藏本站
《天津大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

基于有向项集图的关联规则挖掘算法研究与应用

温磊  
【摘要】:数据挖掘(Data Mining,简称DM)也叫数据库中的知识发现(Knowledge Discovery in Databases,简称KDD),是指从大型的数据库中发现潜在的、新颖的、有价值的、可用的、能被用户理解的模式和信息的过程。关联规则挖掘是数据挖掘的一个重要的研究领域,主要是发现数据库中属性之间的关联关系。 本文在广泛查阅国内外文献的基础上,针对关联规则挖掘算法的若干问题进行了深入地研究和分析,论文取得的主要成果和创新点如下: 针对目前关联规则挖掘研究缺乏理论基础的问题,将数学中的格论和形式概念分析等理论引入关联规则挖掘研究中,有效地描述了关联规则挖掘的问题空间,并提出了基于形式概念分析理论的关联规则挖掘的一系列定义和性质。 针对传统的频繁项集挖掘方法中存在的生成大量候选集、多次遍历数据库计算项集支持度等问题,本文以图论为基础提出了基于有向项集图的频繁项集挖掘算法。算法将原始数据库中的信息保存在有向项集图中,将数据库中的频繁项集发现问题转化为有向项集图中的搜索问题并保证了问题解的完整性。 本文针对数据库中的最大频繁项集挖掘问题进行了分析和研究,本文提出了基于有向项集图的最大频繁项集挖掘算法。算法利用深度优先的搜索方法,通过计算候选项集的频繁扩展集可以有效地约减问题的搜索空间,提高了算法的效率。 本文针对数据库中的频繁闭项集挖掘问题进行了分析和研究,提出了基于有向项集图的频繁闭项集挖掘算法。算法利用深度优先的搜索方法,利用频繁闭种子集的性质对搜索空间进行剪枝,可以有效地生成所有的频繁闭项集。 针对现实数据库中数据不断更新的问题,本文研究了在最小支持度不变的情况下新增数据集后如何发现更新后的数据集中的频繁项集问题。提出了基于有向项集图的完全频繁项集增量更新挖掘算法、最大频繁项集增量更新挖掘算法和频繁闭项集增量更新挖掘算法。 本文提出和设计的算法针对大规模稠密数据集进行了测试,证明了算法的有效性,并对电力生产的相关数据进行了应用尝试。
【学位授予单位】:天津大学
【学位级别】:博士
【学位授予年份】:2004
【分类号】:TP311.13

【相似文献】
中国期刊全文数据库 前10条
1 汪金苗;张龙波;邓齐志;王凤英;王勇;;不确定数据频繁项集挖掘方法综述[J];计算机工程与应用;2011年20期
2 刘芝怡;尹飞鸿;;基于FP-矩阵的频繁项集挖掘算法[J];中国制造业信息化;2011年15期
3 苏勇;郑昭华;范玉玲;;数据流中的频繁项集挖掘[J];信息技术;2011年06期
4 范黎林;林卫;;矩阵约束下的频繁项集挖掘方法研究[J];计算机工程与应用;2011年21期
5 刘海蓉;闫仁武;;一种改进的加权关联规则挖掘算法[J];现代电子技术;2011年12期
6 黄名选;马瑞兴;兰慧红;;面向查询扩展的特征词频繁项集挖掘算法[J];现代图书情报技术;2011年04期
7 谷小广;李天瑞;陈红梅;刘永文;;集值信息系统中对象更新时近似集的性质研究[J];计算机科学;2011年07期
8 宋威;刘文博;李晋宏;;基于动态裁剪频繁模式树的频繁项集并发挖掘算法[J];山东大学学报(工学版);2011年04期
9 张浩;景凤宣;谢晓尧;;基于数据挖掘关联规则Apriori改进算法的入侵检测系统的研究[J];贵州师范大学学报(自然科学版);2011年03期
10 刘上力;杨清;;基于兴趣度剪枝的Apriori优化算法[J];郑州轻工业学院学报(自然科学版);2011年04期
中国重要会议论文全文数据库 前10条
1 温磊;李敏强;;基于有向项集图的频繁项集增量更新挖掘算法[A];2004中国控制与决策学术年会论文集[C];2004年
2 杨晓明;王晨;汪卫;张守志;施伯乐;;频繁项集的精简表达与还原问题研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 刘马金;王鹏;汪卫;;一种轮转的数据流频繁项挖掘算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
4 谢志军;陈红;;EFIM——数据流上频繁项集挖掘的高性能算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 李坤;王永炎;王宏安;;一种基于乐观裁剪策略的挖掘数据流滑动窗口上闭合频繁项集的算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
6 邹远娅;周皓峰;王晨;汪卫;施伯乐;;FSC——利用频繁项集挖掘估算视图大小[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 夏燕;邓绪斌;李岱;朱扬勇;;生物数据仓库半结构化增量更新技术的研究与实现[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
8 陈晓云;李龙杰;马志新;白伸伸;王磊;;AFP-Miner:一种新高效的频繁项集挖掘算法[A];2006年全国理论计算机科学学术年会论文集[C];2006年
9 陈建平;侯昌波;王功文;吕鹏;朱鹏飞;荆风;;矿产资源定量评价中文本数据挖掘研究[A];第七届全国数学地质与地学信息学术会议论文摘要汇编[C];2004年
10 栾鸾;李云;盛艳;;多关系频繁项集的并行获取[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
中国重要报纸全文数据库 前4条
1 特约作者 李岩;iOS5带来什么[N];电脑报;2011年
2 本报通讯员 戴韫卓 李庭常;与时间赛跑[N];中国国土资源报;2011年
3 记者 王瑜婷;导航电子地图现势性将提高一倍[N];中国测绘报;2009年
4 赛迪顾问半导体产业研究中心咨询师 徐鹏;国内导航电子地图市场将走向集中[N];中国计算机报;2009年
中国博士学位论文全文数据库 前10条
1 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年
2 屠莉;流数据的频繁项挖掘及聚类的关键技术研究[D];南京航空航天大学;2009年
3 毛伊敏;数据流频繁模式挖掘关键算法及其应用研究[D];中南大学;2011年
4 李力;数据挖掘方法研究及其在中药复方配伍分析中的应用[D];西南交通大学;2003年
5 汪健;支持增量更新的多模式城市交通网络时空数据模型研究[D];吉林大学;2009年
6 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
7 王卉;最大频繁项集挖掘算法及应用研究[D];华中科技大学;2004年
8 周晓光;基于拓扑关系的地籍数据库增量更新方法研究[D];中南大学;2005年
9 叶飞跃;关联规则及其元规则挖掘技术研究[D];南京航空航天大学;2006年
10 于宝琴;成套电器企业异构数据整合及其物流系统的研究[D];天津大学;2006年
中国硕士学位论文全文数据库 前10条
1 李娟;基于矩阵的关联规则挖掘算法研究[D];西南大学;2007年
2 郭静;最大和最长频繁项集增量更新研究[D];燕山大学;2010年
3 袁锋;基于数据挖掘的中医医案分析系统的设计与实现[D];山东师范大学;2006年
4 陈力捷;数据流频繁项挖掘系统的研究和实现[D];浙江大学;2007年
5 刘卫;基于剪枝概念格模型的频繁项集表示及挖掘研究[D];合肥工业大学;2007年
6 朱冀;以概念分层为背景知识的关联规则挖掘算法的分析[D];电子科技大学;2004年
7 陆声链;孤立点挖掘及其内涵知识发现的研究与应用[D];广西师范大学;2005年
8 龚舒;桥吊动态机械性能参数的统计特征分析及关联规则挖掘[D];上海海事大学;2005年
9 李国雁;基于矩阵的人力资源多值关联规则的挖掘[D];河南大学;2008年
10 王灿;含负项目的关联规则挖掘算法研究[D];重庆大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026