收藏本站
《山东大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于概念格的关联规则挖掘及变化模式研究

王玮  
【摘要】:随着信息技术和计算机技术的发展,数据的产生和收集方式越来越多,处理数据的能力越来越强,然而“数据丰富而知识缺乏”却成为信息管理面对的一个窘境。数据挖掘能够从海量数据中提取有用的信息,对海量的数据进行有效地管理和利用。 作为数据挖掘的重要应用之一,关联规则挖掘旨在从大量的、复杂的各类数据入手,将有意义的数据关联和频繁模式以一种简单、直接的方式表达出来,协助用户明确了解属性之间联系的紧密程度。实际数据库中属性值之间的层次差异较大,形式概念分析中的概念格可以反映出数据属性之间的多层、多元联系,符合现实情况,成为提取关联规则的有效方法。从大规模的形式背景中高效地构造概念格并应用到实践中是目前研究的热点问题。 本文沿着建立概念、查找关联、分析变化这条主线,综合地进行了基于概念格的关联规则提取和变化研究,包含了对形式背景的概念层次的构造、到概念格上的关联规则提取、再到对提取出来的关联规则的变化模式研究这三个步骤,并对每个步骤进行了详细的设计和深入的研究。 本文通过对概念格的主要构造方法进行综述,发现以往的分布式构造方法在对形式背景进行拆分的过程中并没有考虑到形式背景的数据分布特点。为了提高概念格的构造效率,给出了基于属性排序的形式背景的横向和纵向两种拆分策略,分析了拆分策略的适用范围,并提出了基于稀疏度对子形式背景构造概念格的方法。针对子概念格合并过程出现的五种情况,提出了相应的处理策略。最后设计了基于稀疏度的分布式构造概念格的算法,并通过实例和对比试验证明了该算法的正确性和有效性。 在对概念格进行关联规则提取时,传统方法都是由人工设置固定的最小支持度min_sup,然而对于数据项集分布差异比较大的情况下,使用单一的min_sup产生的规则并不一定获得可信而适当的关联规则。如何恰当地设置min_sup是我们面对的另一个问题。本文提出了自适应支持度的设置和修正,与传统人工设置方面相比,提高了关联规则的准确性。本文总结了从概念格中提取无冗余关联规则的三种规则,并给出了NARMC算法,实例说明该算法比Apriori算法更为有效和准确。 本文解决的第三个问题是变化数据的挖掘问题。在从概念格中提取出关联规则之后,还需要对不同时期出现的关联规则进行分析,发现变化的趋势。本文以某医疗单位对老年居民健康查体的两期数据为研究对象,通过对变化挖掘的理论研究,根据识别变化模式的三个参数:相似度、意外度和规则匹配阈值来匹配关联规则的变化模式。用相似度来判断新兴模式、增加模式和消退模式,用意外度来判断条件意外模式和结果意外模式。本文提出了用自适应方法来设置规则匹配阈值RMT,能够避免对新增模式和消退模式的误判。
【学位授予单位】:山东大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP311.13

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 杜威;邹先霞;;增量关联规则挖掘算法在犯罪行为中的应用研究[J];中国人民公安大学学报(自然科学版);2011年02期
2 秦亮曦;史忠植;;关联规则研究综述[J];广西大学学报(自然科学版);2005年04期
3 祖巧红;陈定方;胡吉全;;客户分析中的数据挖掘算法比较研究[J];湖北工业大学学报;2006年03期
4 王德兴,胡学钢,王浩;基于量化概念格的关联规则挖掘[J];合肥工业大学学报(自然科学版);2002年05期
5 欧崇阳;曹宏伟;黄小琴;;基于HIS数据挖掘的医疗风险预警建模研究[J];解放军医院管理杂志;2011年07期
6 谢志鹏,刘宗田;概念格与关联规则发现[J];计算机研究与发展;2000年12期
7 范明,李川;在FP-树中挖掘频繁模式而不生成条件FP-树[J];计算机研究与发展;2003年08期
8 梁吉业,王俊红;基于概念格的规则产生集挖掘算法[J];计算机研究与发展;2004年08期
9 余波;朱东华;刘卓君;;加权关联规则挖掘算法在电子商务中的应用[J];计算机工程与应用;2008年17期
10 秦吉胜,宋瀚涛;关联规则挖掘AprioriHybrid算法的研究和改进[J];计算机工程;2004年17期
【共引文献】
中国期刊全文数据库 前10条
1 白雪,马垣,张小平;概念格最简子直接分解概念及算法[J];鞍山科技大学学报;2004年06期
2 王旭;马垣;;基本概念格的关联规则挖掘算法[J];鞍山科技大学学报;2006年01期
3 王西锋;张晓孪;;形式概念分析在基于事例推理中的应用[J];宝鸡文理学院学报(自然科学版);2006年04期
4 薛志远;张清华;;复合粒计算模型研究进展[J];重庆邮电大学学报(自然科学版);2010年05期
5 张华娣;;贝叶斯和SVM在物流客户流失分析中的应用[J];重庆工学院学报(自然科学版);2009年07期
6 张洋;陈培友;;基于粗糙集理论的决策树方法在贷款客户信用评估中的应用[J];科技和产业;2008年01期
7 方元康;;基于Web日志的用户访问模式挖掘[J];池州学院学报;2007年05期
8 姜代红;;基于时间聚类的加权关联规则及其在企业中的应用[J];湘南学院学报;2009年05期
9 廖伟华;;分层递阶近似空间下的GIS属性数据不确定性描述[J];测绘与空间地理信息;2011年02期
10 焦明海;姜慧研;唐加福;;一种基于聚合链的改进FP-Growth算法[J];东北大学学报;2006年02期
中国重要会议论文全文数据库 前10条
1 陈红英;;基于广义表概念树的Web服务匹配[A];第二十七届中国控制会议论文集[C];2008年
2 夏虹;李增智;陈彦萍;;基于概念格的语义Web服务匹配研究[A];2006年全国通信软件学术会议论文集[C];2006年
3 陈江平;李平湘;;基于序半群的空间关联规则挖掘算法[A];湖北省测绘学会2006年度科学技术交流会论文集[C];2006年
4 张帆;夏红霞;袁景凌;沈琦;;入侵检测系统中关联规则的挖掘[A];12省区市机械工程学会2006年学术年会湖北省论文集[C];2006年
5 宁红梅;安志兴;葛亚明;李敬玺;赵坤;钟华;陈俊杰;崔艳红;;数据挖掘技术在兽医学中的应用[A];Proceedings of 2010 National Vocational Education of Communications and Information Technology Conference (2010 NVCIC)[C];2010年
6 黄冬梅;朱慧;;粗糙形式概念分析在海洋本体构建中的应用[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
7 张素兰;张继福;;融合粗集和概念格理论的分类知识挖掘模型研究[A];全国第十五届计算机科学与技术应用学术会议论文集[C];2003年
8 杨海峰;张继福;;一种新的概念格结构:粗糙概念格[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
9 胡立华;张继福;张素兰;;基于概念格的分类规则提取算法及其应用[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
10 王德兴;刘晓平;;基于量化扩展概念格模板优化组合的规则挖掘[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(下册)[C];2006年
中国博士学位论文全文数据库 前10条
1 倪丽萍;基于分形技术的金融数据分析方法研究[D];合肥工业大学;2010年
2 张宇;个性化移动内容服务的模型和支持技术研究[D];华中科技大学;2010年
3 吴少智;时间序列数据挖掘在生物医学中的应用研究[D];电子科技大学;2010年
4 赖芨宇;基于知识挖掘的企业管理集成系统研究[D];东华大学;2011年
5 焦素云;基于概念格的动态策略存取模型[D];吉林大学;2011年
6 杨洁;基于PET-CT技术的循经针刺对偏头痛患者即时镇痛效应的中枢机制研究[D];成都中医药大学;2011年
7 石振国;资源网络的精化学习及应用研究[D];上海大学;2011年
8 梁成军;网球技战术决策支持系统研究与应用[D];上海体育学院;2011年
9 杨霁琳;不完备信息系统知识约简方法及应用研究[D];西南交通大学;2010年
10 毛萌萌;引进粒计算与形式概念分析技术的认知诊断研究[D];江西师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 白喜朋;基于作业的钢铁企业成本分析[D];大连理工大学;2010年
2 赵晓燕;基于多索引的高维时间序列子序列检索研究[D];大连理工大学;2010年
3 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年
4 朱彦霞;多关系关联规则及其在HRM中的应用[D];河南工业大学;2010年
5 罗芳;基于聚类和压缩矩阵的加权关联规则算法的研究与应用[D];华东师范大学;2010年
6 张磊;基于高级SQL查询的分布式多维关联规则挖掘算法的研究[D];天津理工大学;2010年
7 王富强;基于iceberg概念格的最大频繁项集挖掘研究[D];江苏大学;2010年
8 马宝辉;分布式格属性挖掘研究[D];长春工业大学;2010年
9 岂欣;移动网格安全策略存储机制研究[D];长春工业大学;2010年
10 刘雅丽;概念格的属性约简研究[D];昆明理工大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 王华;江启成;胡学钢;;数据挖掘在医学上的应用[J];安徽医药;2008年08期
2 单莹;基于数据仓库的CRM在电信企业中的应用[J];电信技术;2002年01期
3 周水银,陈荣秋;基于Internet的客户关系管理研究[J];工业工程与管理;2002年02期
4 谢志鹏,刘宗田;概念格与关联规则发现[J];计算机研究与发展;2000年12期
5 颜雪松,蔡之华;一种基于Apriori的高效关联规则挖掘算法的研究[J];计算机工程与应用;2002年10期
6 宋凯,张士峰,瞿兆荣;数据仓库及联机分析处理[J];计算机工程;1998年10期
7 黄德才;张良燕;龚卫华;刘端阳;;一种改进的关联规则增量式更新算法[J];计算机工程;2008年10期
8 周水庚;李丰;陶宇飞;肖小奎;;面向数据库应用的隐私保护研究综述[J];计算机学报;2009年05期
9 王志海,胡可云,胡学钢,刘宗田,张奠成;概念格上规则提取的一般算法与渐进式算法[J];计算机学报;1999年01期
10 喻钢,周定康;联机分析处理(OLAP)技术的研究[J];计算机应用;2001年11期
中国博士学位论文全文数据库 前1条
1 曾海泉;时间序列挖掘与相似性查找技术研究[D];复旦大学;2003年
【相似文献】
中国期刊全文数据库 前10条
1 邸书灵;陈娜;马新娜;;回归分析在关联规则挖掘中的应用研究[J];微计算机信息;2008年03期
2 周翠红;;关联规则挖掘研究[J];今日科苑;2010年10期
3 刘培奇;卢麟;廖福燕;宋阳;;基于一次性数据库访问策略的关联规则挖掘算法的研究[J];微电子学与计算机;2010年12期
4 杨治秋;;数据挖掘中关联规则算法在教学评价系统中的研究[J];黑龙江科技信息;2011年12期
5 王瑜;;关联规则挖掘在运动伤病管理系统中的应用[J];宿州学院学报;2011年02期
6 宋中山;吴立锋;;关联规则挖掘在教学评价中的应用[J];中南民族大学学报(自然科学版);2006年01期
7 邹丽;郭发军;王艳娟;;分布式关联规则挖掘算法研究[J];科学技术与工程;2007年08期
8 杨启昉;马广平;;关联规则挖掘Apriori算法的改进[J];计算机应用;2008年S2期
9 刘旭辉;邵世煌;余光柱;;基于激励的关联规则的挖掘[J];计算机应用;2009年01期
10 黄秋勇;唐爱龙;;关联规则在图像数据挖掘中的应用[J];计算机与现代化;2009年10期
中国重要会议论文全文数据库 前10条
1 谷姗姗;秦首科;胡大斌;周傲英;;面向关联规则挖掘的敏感规则隐藏技术[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 王盛;董黎刚;李群;;一种基于逆序编码的关联规则挖掘研究[A];浙江省电子学会2010学术年会论文集[C];2010年
3 张鹏;于波;童云海;唐世渭;;基于随机响应的隐私保护关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 张仲楠;孙志挥;;关系数据库中限制性关联规则挖掘的优化[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
5 陈晓云;李泽霞;刘幸辉;彭文静;;关联规则挖掘过程中的模糊化方法研究[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
6 张宇鹏;王丽珍;周丽华;;基于气象数据的关联规则挖掘[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
7 方芳;李建中;潘海为;;脑部医学图像中的关联规则挖掘[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
8 严澄;胡天磊;陈珂;陈刚;;MARSW:一种高效的基于滑动窗口数据流关联规则挖掘方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 李贝贝;乐嘉锦;;分布式环境下的隐私保护关联规则挖掘[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
10 杨晓雪;衡红军;;一种对XML数据进行关联规则挖掘的方法研究[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
中国重要报纸全文数据库 前10条
1 邱红杰;过去有困难找单位,现在找谁[N];新华每日电讯;2006年
2 记者 曾卫康通讯员 市创卫办;对广州总体卫生状况满意度95% 对创建国家卫生城市支持度98%[N];广州日报;2007年
3 浙江省金华市烟草专卖局 满在明 廖明景;谈卷烟专卖案件信息的挖掘[N];东方烟草报;2011年
4 特约评论员 王尔山;奥巴马高支持度的另面[N];21世纪经济报道;2009年
5 ;台媒:许信良支持度超过预期[N];团结报;2011年
6 何宇;“感谢市民支持,我们会更努力”[N];广州日报;2009年
7 任海鸣;为什么是苏贞昌?[N];人民日报海外版;2007年
8 ;“基地”谈与美媾和条件[N];新华每日电讯;2010年
9 丁丽;“美加净”又成市场宠儿[N];发展导报;2004年
10 连于慧 DigiTimes;NAND Flash产业逢多事之秋 行情诡谲难测[N];电子资讯时报;2006年
中国博士学位论文全文数据库 前10条
1 刘智;关联规则挖掘方法及其在冠心病中医诊疗中的应用研究[D];大连海事大学;2012年
2 何月顺;关联规则挖掘技术的研究及应用[D];南京航空航天大学;2010年
3 刘亚波;关联规则挖掘方法的研究及应用[D];吉林大学;2005年
4 王玮;基于概念格的关联规则挖掘及变化模式研究[D];山东大学;2012年
5 马修强;多水平模型和关联规则联合研究胃食管反流病影响因素[D];第二军医大学;2009年
6 毛宇星;关联规则挖掘在分类数据领域的扩展性研究[D];复旦大学;2010年
7 周皓峰;关联规则挖掘的拓展性研究[D];复旦大学;2003年
8 叶飞跃;关联规则及其元规则挖掘技术研究[D];南京航空航天大学;2006年
9 唐合文;基于国家作物种质资源数据库的知识发现研究[D];中国农业科学院;2007年
10 余光柱;高效用关联规则的挖掘[D];东华大学;2008年
中国硕士学位论文全文数据库 前10条
1 陈斌;条件独立性在关联规则挖掘中的研究和应用[D];河海大学;2004年
2 邹丽霞;基于关联规则挖掘的Web个性化推荐研究[D];郑州大学;2006年
3 张芊茜;数据挖掘中关联规则算法的研究及应用[D];山东师范大学;2004年
4 薛慧君;基于遗传算法的关联规则数据挖掘的应用研究[D];天津大学;2006年
5 王培培;基于区别度概念格的关联规则挖掘算法设计[D];河南大学;2010年
6 陈海珍;关联规则挖掘算法研究及其在CRM中的应用[D];浙江工业大学;2003年
7 曲春锦;Apriori-TIDS算法设计及其在教育决策信息挖掘中的应用[D];上海海事大学;2005年
8 刘萍;粒计算及其应用研究[D];厦门大学;2006年
9 袁祚涌;基于改进关联规则和遗传算法的基因表达调控网络构建方法[D];电子科技大学;2007年
10 彭建光;数据挖掘技术在网站个性化推荐中的应用[D];上海交通大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026