收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于区别度概念格的关联规则挖掘算法设计

王培培  
【摘要】: 关联规则是最常见的知识表示方法之一,频繁项集挖掘是关联规则挖掘中的重要课题,它已经被广泛的应用于各个领域。概念格是一个非常有用的形式分析工具,通过Hasse图它可以生动、简洁的表现这些概念之间的泛化和特化关系。另外,概念格中的每个节点本质上是一个频繁项目集,并且频繁项集和概念格的内涵之间有一种一一对应的关系。因此,利用概念格来挖掘频繁项集和关联规则显得水到渠成。基于概念格的频繁项集与关联规则的挖掘,很多学者对此已经进行了深入的研究并取得了很大的进步,但大部分都是假定由属性组成概念格中内涵的重要性均匀平等、同等重要,而基于这种思想的概念格提取关联规则存在着明显的不足:(1)这将导致组合爆炸和冗余问题;(2)由于建格时没有考虑到属性重要性的差别,形成包含所有属性的概念格的结点,因此建格时间长、效率低。 针对以上不足,本文首先提出一个新的概念——内涵区别度,基于内涵区别度来建造概念格将有力的减少格中的频繁项集的数量,主要原因是区别度低的内涵将不参与格的构造,这在一定的程度上缓和了组合爆炸的问题,使关联规则提取的难度系数也有所降低。其次本文给出了基于内涵区别度的格的构造算法,不再是建造概念格的每一个节点都扫描数据库,而是有条件的扫描数据库并计算和重置区别度的值,这就减少了数据库扫描的次数,从而减少了生成概念格的时间,提高效率。另外,改进了基于概念格的关联规则提取的算法,将置信度剪枝的概念引入基于概念格的关联规则提取中,减少了关联规则提取时置信度计算的时间,从而有效的提高了关联规则提取的效率,最后将本文提出的改进算法应用了基于区别度概念格的关联规则提取中,并给出了相应的提取算法。基于概念格的关联规则的挖掘关键在于概念格的构造,首先将频繁项集和内涵区别度存储在格上,然后在创建好的概念格上根据规则生成关联规则。 本文的主要贡献如下: 1)提出内涵区别度的概念,基于内涵区别度建造概念格将有力的减少频繁项集的数目,缓和组合爆炸的问题; 2)给出了基于区别度概念格的频繁项目集提取算法,在构造概念格时不再每一个节点的生成都扫描数据库,减少了扫描数据库的次数,提高了时间效率; 3)改进了基于概念格的关联规则提取的算法,将置信度剪枝的概念引入基于概念格的关联规则提取中,从而有效的提高了关联规则提取的效率; 4)将本文提出的改进算法应用了基于区别度概念格的关联规则提取中,并给出了相应的提取的算法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 沈良忠;;基于简单双矩阵的关联规则算法研究[J];温州大学学报(自然科学版);2009年06期
2 章志明;黄龙军;余敏;黄明和;;一种动态的频繁项集挖掘算法[J];计算机工程;2006年24期
3 钱光超;贾瑞玉;张然;李龙澍;;Apriori算法的一种优化方法[J];计算机工程;2008年23期
4 全佳妮;伏玉琛;严建峰;;基于关联规则挖掘的商品品类管理[J];江南大学学报(自然科学版);2009年06期
5 冯平;黄名选;;由频繁项集生成关联规则的算法设计和实现[J];广西工学院学报;2007年01期
6 李大勇;徐亚娜;;CRM中Apriori算法的应用研究[J];辽宁省交通高等专科学校学报;2007年02期
7 陈建辉;;一种改进的Apriori算法[J];宜春学院学报;2007年04期
8 石铁峰;石月皎;;关联规则数据挖掘应用研究[J];哈尔滨职业技术学院学报;2007年04期
9 任亚洲;;频繁项集挖掘算法综述[J];电脑知识与技术(学术交流);2007年16期
10 黄凤艳;;数据库中关联规则的挖掘[J];赤峰学院学报(自然科学版);2008年07期
11 张月琴;晏清微;;基于粒计算的关联规则挖掘算法[J];计算机工程;2009年20期
12 李忠慧;;一种基于散列和事务压缩的Apriori改进算法[J];科技信息;2009年24期
13 张广路;雷景生;吴兴惠;;一种改进的Apriori关联规则挖掘算法(英文)[J];计算机技术与发展;2010年06期
14 黄澍庄;;频繁项集挖掘算法分析与比较[J];德州学院学报;2005年06期
15 周焕银;夏洪;葛远香;胡开明;魏雄;王怀平;;关联规则候选项支持频度的研究[J];东华理工学院学报;2006年03期
16 王艳;骆嘉伟;杨涛;吴君浩;;基于分段与运算的基因表达数据频繁项集挖掘[J];计算机工程与科学;2006年11期
17 刘以安;羊斌;;关联规则挖掘中对Apriori算法的一种改进研究[J];计算机应用;2007年02期
18 杜跃;王治和;景永霞;;基于数组的关联规则挖掘算法[J];甘肃联合大学学报(自然科学版);2007年03期
19 郭伟;叶德谦;;改进的基于FP-tree的频繁项集挖掘算法[J];计算机工程与应用;2007年19期
20 何胜文;周绍梅;雷昌瑜;陈丽君;;一种基于矩阵结构的快速关联规则挖掘算法[J];计算机与现代化;2007年07期
中国重要会议论文全文数据库 前10条
1 陈晓云;李泽霞;刘幸辉;彭文静;;关联规则挖掘过程中的模糊化方法研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 王盛;董黎刚;李群;;一种基于逆序编码的关联规则挖掘研究[A];浙江省电子学会2010学术年会论文集[C];2010年
3 方芳;李建中;潘海为;;脑部医学图像中的关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 张鹏;于波;童云海;唐世渭;;基于随机响应的隐私保护关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 谷姗姗;秦首科;胡大斌;周傲英;;面向关联规则挖掘的敏感规则隐藏技术[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
6 张宇鹏;王丽珍;周丽华;;基于气象数据的关联规则挖掘[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
7 杨晓雪;衡红军;;一种对XML数据进行关联规则挖掘的方法研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
8 张仲楠;孙志挥;;关系数据库中限制性关联规则挖掘的优化[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
9 张海威;袁晓洁;窦志成;;基于Web日志的时序关联规则挖掘算法研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 严澄;胡天磊;陈珂;陈刚;;MARSW:一种高效的基于滑动窗口数据流关联规则挖掘方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 刘智;关联规则挖掘方法及其在冠心病中医诊疗中的应用研究[D];大连海事大学;2012年
2 何月顺;关联规则挖掘技术的研究及应用[D];南京航空航天大学;2010年
3 毛宇星;关联规则挖掘在分类数据领域的扩展性研究[D];复旦大学;2010年
4 刘亚波;关联规则挖掘方法的研究及应用[D];吉林大学;2005年
5 王玮;基于概念格的关联规则挖掘及变化模式研究[D];山东大学;2012年
6 叶飞跃;关联规则及其元规则挖掘技术研究[D];南京航空航天大学;2006年
7 陆楠;关联规则的挖掘及其算法的研究[D];吉林大学;2007年
8 王培崇;基于群智能计算技术的网络入侵检测算法研究[D];中国矿业大学(北京);2010年
9 周皓峰;关联规则挖掘的拓展性研究[D];复旦大学;2003年
10 朱飞祥;远洋船舶调度数据挖掘技术研究与应用[D];大连海事大学;2008年
中国硕士学位论文全文数据库 前10条
1 刘卫;基于剪枝概念格模型的频繁项集表示及挖掘研究[D];合肥工业大学;2007年
2 窦茂生;数据挖掘中关联规则的研究与应用[D];长春理工大学;2009年
3 龚舒;桥吊动态机械性能参数的统计特征分析及关联规则挖掘[D];上海海事大学;2005年
4 田卓;基于多个关联规则挖掘算法的新算法的研究与应用[D];吉林大学;2009年
5 袁彩虹;基于粒计算与完全图的关联规则算法研究[D];河南大学;2009年
6 王涛;关联规则算法及并行化研究[D];河北大学;2006年
7 熊金芬;一种高效频繁项集挖掘算法的研究[D];哈尔滨工程大学;2006年
8 周翠红;数据挖掘中关联规则的研究及在高校教学质量评估中的应用[D];中南大学;2007年
9 孔芳;数据挖掘技术中关联规则算法的研究[D];江南大学;2008年
10 余春;频繁闭项集并行挖掘算法的研究与实现[D];重庆大学;2008年
中国重要报纸全文数据库 前1条
1 浙江省金华市烟草专卖局 满在明 廖明景;谈卷烟专卖案件信息的挖掘[N];东方烟草报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978