收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于概念格模型关联规则挖掘的关键问题研究

王德兴  
【摘要】: 关联规则挖掘是数据挖掘领域的一个重要分支,在研究及应用方面已取得了很大的进展。然而,由于现实世界数据的海量、异构和数据类型的多样性、结构的复杂性等特点,对关联规则挖掘的研究提出了新的课题。本文将具有完备特性的概念格模型引入到关联规则挖掘的研究,针对关联规则挖掘的模型、方法以及数据归约等方面开展了研究,主要内容及创新工作如下: 1.在研究概念格模型和频繁项目集关系的基础上,提出了基于概念格模型的项目集表示和求解方法。研究表明,每个项目集一定作为概念格中某个概念的内涵或内涵的子集出现,借助于概念之间的关系可从每个概念导出多个项目集。因此,概念格中概念的数量比事务数据库中项目集的实际数量有显著的减少,在不丢失有效信息的前提下,较利于实现更大规模的数据库中知识发现;通过删除概念格中非频繁项目集对应的概念而得到的剪枝概念格能有效地压缩数据库规模,进而为在大规模数据库中进行关联规则挖掘提供了有利的条件。 2.研究了基于剪枝概念格的关联规则挖掘求解。提出顺序剪枝和同步剪枝概念格的构造算法。顺序剪枝概念格构造算法以插入记录方式的Godin概念格构造算法为基础,通过一遍扫描数据库来构造概念格,在构建完毕后,依据Apriori性质实现剪枝,得到剪枝概念格;同步剪枝概念格构造算法以插入属性方式动态地构造概念格,在插入属性构造概念格的过程中,依据Apriori性质实现剪枝,得到剪枝概念格。两种构造算法各有特点和适用性。基于剪枝概念格挖掘关联规则,减少相应的搜索空间,提高关联规则挖掘的效率。 3.研究了多层、多属性的归纳。实际数据库中的属性值之间的层次差异较大,需要进行必要的数据归约。经典的属性归纳方法存在主观因素制约的问题,可能会影响到有价值模式的发现。为此,将概念格模型引入多层、多属性的归纳,提出了基于概念格的属性归纳,采用概念的爬升进行相应的泛化,并进行多层、多属性的归纳。与面向属性归纳AOI算法相比较,基于概念格的属性归纳不仅可实现AOI的单一属性归纳,也能进行多层、多属性的归纳,属性归纳的路径不惟一,并易于寻找合适的泛化路径和阈值,从而得到用户要求的、合理的属性归纳结果,以便挖掘合适颗粒度的关联规则。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨萍;一种基于F-矩阵的最大频繁项目集快速挖掘算法[J];计算机工程与应用;2003年34期
2 郑涛,张伟;基于动态分组的增量式挖掘关联规则更新算法[J];计算机工程;2003年13期
3 钟勇发,吕红兵;基于FP-growth的关联规则增量更新算法[J];计算机工程与应用;2004年26期
4 陈耿,朱玉全,杨鹤标,陆介平,宋余庆,孙志挥;关联规则挖掘中若干关键技术的研究[J];计算机研究与发展;2005年10期
5 李环宇;杜春玲;李保银;;一种基于关联规则挖掘的改进算法[J];福建电脑;2007年01期
6 严金妹;谢伙生;林森媚;;频繁闭集挖掘技术研究[J];福建电脑;2007年05期
7 吴振光;;一个改进的关联规则的频繁项目集数据挖掘算法[J];计算机科学;2007年09期
8 黄勇;赵靖;;基于分布式系统下的快速关联规则挖掘算法[J];农业网络信息;2009年04期
9 刘芳,路松峰,卢正鼎,胡和平;一种基于限制的关联规则数据开采的算法[J];华中科技大学学报;2001年03期
10 寇育敬,王春花,黄厚宽;约束关联规则的增量式维护算法[J];计算机研究与发展;2001年08期
11 徐章艳,张师超,区玉明,卢景丽,刘美玲;挖掘关联规则中的一种优化的Apriori算法[J];计算机工程;2003年19期
12 李华君,周海岩;基于项目集知识库的关联规则挖掘与更新的高效算法[J];计算机工程与设计;2004年12期
13 朱连春;;关联规则挖掘频繁模式算法——FP-Growth算法及其改进[J];企业家天地;2007年07期
14 张亮;任永功;付玉;;一种新的频繁闭项目集挖掘算法(英文)[J];Journal of Southeast University(English Edition);2008年03期
15 何芬;吴业福;;改进的Apriori算法在教学评价中的应用研究[J];电脑知识与技术;2010年01期
16 霍桂利;;关联规则挖掘相关技术综述[J];山西煤炭管理干部学院学报;2010年03期
17 李铭,蔡庆生;一个高效的关联规则增量式更新算法[J];计算机工程与应用;2000年05期
18 陈丽,孔志洪,陈根才;基于数据挖掘建立动态人事管理决策系统[J];计算机工程与应用;2001年20期
19 陈丽,陈根才;改进的增量式关联规则维护算法[J];计算机工程与设计;2002年01期
20 杨君锐;逆向启发式开采最大频繁项目集[J];计算机工程;2004年14期
中国重要会议论文全文数据库 前10条
1 李国和;马玉书;;基于关系数据库环境的频繁项目集的求解方法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
2 杨明;孙志挥;;一种基于最大加权频繁项目集的数据库相似性判别算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 吉根林;杨明;孙志挥;;分布式数据库中频繁项目集的快速更新[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
4 朱玉全;杨鹤标;陆介平;宋余庆;;一种基于约简模式的频繁项目集挖掘算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 刘燕;;一个加权频繁项目集的支持度下界[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
6 沈亚兰;王向东;王晓峰;;基于粒计算和等价类的关联规则挖掘算法[A];2006中国控制与决策学术年会论文集[C];2006年
7 殷积东;刘博;王少辉;;基于粗糙集理论和关联规则的腐蚀区域纹理特征检测算法研究[A];图像图形技术研究与应用(2010)[C];2010年
8 饶天贵;杨燕;;关联规则中AprioriTid算法的改进[A];2006年全国理论计算机科学学术年会论文集[C];2006年
9 徐伟;张军;;关联规则在犯罪行为分析中的应用研究[A];第十届中国科协年会论文集(三)[C];2008年
10 李慧琪;叶仰明;薛永生;;发现周期性多层序贯模式[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
中国博士学位论文全文数据库 前10条
1 王德兴;基于概念格模型关联规则挖掘的关键问题研究[D];合肥工业大学;2007年
2 刘勇;频繁模式挖掘相关技术研究[D];复旦大学;2007年
3 缪裕青;关联规则挖掘及其在基因表达数据中的应用[D];中国科学技术大学;2007年
4 李彤岩;基于数据挖掘的通信网告警相关性分析研究[D];电子科技大学;2010年
5 金胜男;基于多层关联规则的概念分层知识库中知识发现的研究[D];天津大学;2006年
6 周翀;搜索引擎中文档聚类方法研究[D];华中科技大学;2009年
7 邱桃荣;面向本体学习的粒计算方法研究[D];北京交通大学;2009年
8 王培崇;基于群智能计算技术的网络入侵检测算法研究[D];中国矿业大学(北京);2010年
9 周明;基于数据挖掘的制造业采购DSS理论及方法研究[D];天津大学;2009年
10 何月顺;关联规则挖掘技术的研究及应用[D];南京航空航天大学;2010年
中国硕士学位论文全文数据库 前10条
1 李洋;闭合序列挖掘模型与算法的研究[D];合肥工业大学;2007年
2 周贺来;Web挖掘中关联规则的研究与应用[D];郑州大学;2006年
3 吕朕;约束频繁项目集挖掘算法研究[D];辽宁师范大学;2011年
4 王莉;基于无或言规则集的关联规则挖掘算法研究[D];华中科技大学;2004年
5 郭旭敏;关联规划挖掘算法的研究[D];太原理工大学;2013年
6 李长源;关联规则挖掘算法研究[D];哈尔滨工程大学;2005年
7 邹丽;分布式系统下关联规则挖掘的研究与实现[D];大连交通大学;2005年
8 丁久玲;概念格的动态构造及其在关联规则发现中的应用[D];北京交通大学;2007年
9 林振民;分治策略在关联规则挖掘中的应用[D];厦门大学;2002年
10 曾舸;基于半结构化数据的关联规则挖掘研究[D];湖南师范大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978