收藏本站
《郑州大学》 2000年
收藏 | 手机打开
二维码
手机客户端打开本文

基于项-事务关联数据库的相联规则挖掘算法的研究

俞珏民  
【摘要】: 挖掘大型事务数据库中的相联规则是数据挖掘研究的重要问题 之一。该问题自1993年被Agrawal等提出以来,一直受到广泛关 注与重视。由于相联规则挖掘涉及的事务数据库都非常大,提出有 效的挖掘算法成了研究的热点。 传统的相联规则挖掘算法都是直接在事务数据库上进行。尽管 业已提出了一些改进I/O性能的方法,但这些方法大多都需要反复 扫描事务数据库。这就造成了大量I/O开销,从而影响了相联规则 挖掘的效率。 本文提出了一种根本上不同于以往相联规则挖掘算法的新方 法。首先,将事务数据库转换成项-事务关联数据库,之后相联规 则的挖掘就直接在转换后的项-事务关联数据库上进行。由于项-事 务关联数据库以项(集)为索引键,其记录包含涉及该项(集)的 事务代码的集合。这样,只需要对频繁(k-1)-项集的事务代码集 进行交运算,就可以容易地求得频繁k-项集的支持度。此外,在 产生频繁k-项集时,同时产生项-事务关联数据库D_k。D_k中仅包含 频繁k-项集及其关联的事务代码集合。当求频繁(k+1)-项集 时,只需扫描小得多的D_k。这相当于进行大量剪枝,大大降低了 I/O开销。 本文的主要工作如下: 1.给出了将事务数据库转换成项-事务关联数据库的有效算 法。 2.提出了基于项-事务关联数据库的单层相联规则和多层相联 规则挖掘算法。 3.讨论了相联规则的增量式挖掘,并给出相应算法。 4.讨论了当最小支持度改变时,挖掘满足新的兴趣度限制的 相联规则挖掘的有效方法。
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2000
【分类号】:TP311.13

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 赵海,陈燕,张德干,张晓丹;相联规则的粗熵挖掘方法及其在肇事逃逸侦破中的应用[J];东北大学学报(自然科学版);2004年10期
2 黄艳,王延章,苑森淼;一种高效相联规则提取算法[J];吉林大学自然科学学报;1999年02期
3 李雄飞,宋海玉,谢忠时,任岩,苑森淼;图像数据挖掘模型与方法[J];吉林大学学报(工学版);2002年01期
4 崔立新,苑森淼,赵春喜;约束性相联规则发现方法及算法[J];计算机学报;2000年02期
5 王曙光,施小英;一种改进的相联规则提取算法[J];计算机工程与应用;2002年15期
6 李雄飞,刘光远,郭励焕,苑森淼,侯天伦;二次挖掘相联规则算法[J];吉林大学学报(工学版);2002年02期
7 李雄飞,臧雪柏,刘光远,苑森淼;相联规则增量算法研究[J];小型微型计算机系统;2002年11期
8 李雄飞,苑森淼,董立岩;基于相联规则的数据挖掘理论[J];吉林工业大学自然科学学报;2000年02期
9 黄艳,王延章;大型数据库中多层次相联规则的提取[J];大连理工大学学报;1999年06期
10 涂晓红,林江莉;一种基于WEB站点的多媒体数据挖掘方法[J];西南民族大学学报(自然科学版);2005年04期
中国重要会议论文全文数据库 前10条
1 沈向余;李伟华;;几种关联规则挖掘算法的分析[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
2 丁艳辉;王洪国;高明;谷建军;;一种基于矩阵的高效关联规则挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
3 郭平;陈黎;聂亚可;林勇;;以Apriori为基础的序列挖掘算法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
4 曹波伟;薛青;唐志武;任晓明;;面向军事基础数据的数据挖掘研究[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
5 莫晓静;史岚;许光宇;赵宇海;王国仁;乔建忠;;MFCC:一种高效的三维频繁闭项集挖掘算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
6 段军晓;;数据挖掘技术在民航快递市场营销中的应用[A];第六届中国科学家论坛论文汇编[C];2007年
7 王晨;朱永泰;汪卫;施伯乐;;高效地挖掘频繁图模式[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
8 程银波;司菁菁;;带有间隔约束的序列模式挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
9 曹国栋;郭景峰;;一种基于定量更新滑动窗口频繁闭项集挖掘算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 张磊;夏士雄;周勇;牛强;;具有语义最小支持度的关联规则挖掘方法[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
中国重要报纸全文数据库 前10条
1 包;IBM为中小型企业推出Start Now无线解决方案[N];国际商报;2001年
2 李国辉 张军 汤义;挖掘技术直面多媒体[N];计算机世界;2002年
3 刘万军 见习记者 王环威;公安信息化建设提速[N];丹东日报;2009年
4 ;安捷伦NgN分析系统实时监测VoP[N];中国计算机报;2002年
5 中国人民大学数据仓库与商务智能工程研究中心 $$  中国人民大学数据与知识工程研究所王珊、谢佳明、陈红、刘中蔚、邵琦洪、张宁;创建数据仓库:要面向三条路线[N];中国计算机报;2002年
6 武李 林姚;“钻石眼”图像挖掘系统[N];计算机世界;2002年
7 江青;海尔出击智能分析软件[N];计算机世界;2002年
8 ;数据挖掘流程[N];人民邮电;2001年
9 邹统钎;建设旅游目的地营销系统浅议[N];中国旅游报;2005年
10 云南 王兆和;妙用Word的邮件合并功能[N];电脑报;2003年
中国博士学位论文全文数据库 前10条
1 李海波;频繁子结构挖掘算法研究与应用[D];华中科技大学;2011年
2 王卉;最大频繁项集挖掘算法及应用研究[D];华中科技大学;2004年
3 由育阳;数据流容错挖掘算法研究[D];哈尔滨工程大学;2011年
4 阮幼林;频繁模式挖掘算法及在入侵检测中的应用研究[D];华中科技大学;2004年
5 邹晓红;用于图分类的频繁子结构挖掘算法研究[D];燕山大学;2011年
6 董俊;不确定数据中数据挖掘方法的研究[D];燕山大学;2012年
7 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
8 景旭文;基于数据挖掘的动态全息产品概念设计理论与方法研究[D];东南大学;2005年
9 冯博;基于半结构化数据的数据流挖掘算法研究[D];北京邮电大学;2011年
10 徐玉生;频繁模式挖掘算法与剪枝策略研究[D];兰州大学;2008年
中国硕士学位论文全文数据库 前10条
1 俞珏民;基于项-事务关联数据库的相联规则挖掘算法的研究[D];郑州大学;2000年
2 王朝晖;数据挖掘与检索技术在税务系统中的应用[D];吉林大学;2004年
3 李栋;非自由选择结构挖掘算法的研究[D];山东大学;2011年
4 米长超;基于层次提取—局部聚类的社区挖掘算法[D];哈尔滨工程大学;2012年
5 许光宇;三维微阵列频繁闭模式挖掘算法的研究与实现[D];东北大学;2008年
6 刘文艳;基于深度优先策略的频繁导出子图挖掘算法[D];西安电子科技大学;2009年
7 田文诗;基于学习者行为的序列模式挖掘算法研究与实现[D];吉林大学;2011年
8 张洋;一种基于热计量数据的异常点挖掘算法研究[D];燕山大学;2012年
9 莫晓静;基于元素增长搜索策略的频繁闭模式挖掘算法的研究与实现[D];东北大学;2008年
10 赵楠明;网游客户分群与特征挖掘算法研究与应用[D];大连理工大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026