收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于概念格的关联规则挖掘及变化模式研究

王玮  
【摘要】:随着信息技术和计算机技术的发展,数据的产生和收集方式越来越多,处理数据的能力越来越强,然而“数据丰富而知识缺乏”却成为信息管理面对的一个窘境。数据挖掘能够从海量数据中提取有用的信息,对海量的数据进行有效地管理和利用。 作为数据挖掘的重要应用之一,关联规则挖掘旨在从大量的、复杂的各类数据入手,将有意义的数据关联和频繁模式以一种简单、直接的方式表达出来,协助用户明确了解属性之间联系的紧密程度。实际数据库中属性值之间的层次差异较大,形式概念分析中的概念格可以反映出数据属性之间的多层、多元联系,符合现实情况,成为提取关联规则的有效方法。从大规模的形式背景中高效地构造概念格并应用到实践中是目前研究的热点问题。 本文沿着建立概念、查找关联、分析变化这条主线,综合地进行了基于概念格的关联规则提取和变化研究,包含了对形式背景的概念层次的构造、到概念格上的关联规则提取、再到对提取出来的关联规则的变化模式研究这三个步骤,并对每个步骤进行了详细的设计和深入的研究。 本文通过对概念格的主要构造方法进行综述,发现以往的分布式构造方法在对形式背景进行拆分的过程中并没有考虑到形式背景的数据分布特点。为了提高概念格的构造效率,给出了基于属性排序的形式背景的横向和纵向两种拆分策略,分析了拆分策略的适用范围,并提出了基于稀疏度对子形式背景构造概念格的方法。针对子概念格合并过程出现的五种情况,提出了相应的处理策略。最后设计了基于稀疏度的分布式构造概念格的算法,并通过实例和对比试验证明了该算法的正确性和有效性。 在对概念格进行关联规则提取时,传统方法都是由人工设置固定的最小支持度min_sup,然而对于数据项集分布差异比较大的情况下,使用单一的min_sup产生的规则并不一定获得可信而适当的关联规则。如何恰当地设置min_sup是我们面对的另一个问题。本文提出了自适应支持度的设置和修正,与传统人工设置方面相比,提高了关联规则的准确性。本文总结了从概念格中提取无冗余关联规则的三种规则,并给出了NARMC算法,实例说明该算法比Apriori算法更为有效和准确。 本文解决的第三个问题是变化数据的挖掘问题。在从概念格中提取出关联规则之后,还需要对不同时期出现的关联规则进行分析,发现变化的趋势。本文以某医疗单位对老年居民健康查体的两期数据为研究对象,通过对变化挖掘的理论研究,根据识别变化模式的三个参数:相似度、意外度和规则匹配阈值来匹配关联规则的变化模式。用相似度来判断新兴模式、增加模式和消退模式,用意外度来判断条件意外模式和结果意外模式。本文提出了用自适应方法来设置规则匹配阈值RMT,能够避免对新增模式和消退模式的误判。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郭轶尊,顾国昌;水下机器人标图中的传感器关联信息处理方法[J];哈尔滨工程大学学报;2003年01期
2 张涛;高海波;李昕;洪文学;;通信网络关联信息可视化[J];燕山大学学报;2010年02期
3 李卓尔;胡运发;;一种对BBS语料进行话题提取的聚类算法[J];计算机应用与软件;2008年08期
4 伊旭;陈广联;金明;叶小绪;;实时/历史数据库技术在500kV变电所的应用[J];浙江电力;2006年06期
5 韩宗芬;陈羚;袁平鹏;刘英书;;基于关联的科技文献检索方法[J];华中科技大学学报(自然科学版);2007年11期
6 周怡;;泛在网络中基于标签标识的应用与业务需求[J];电信网技术;2010年03期
7 庄哲民,张阿妞;基于关联信息的阵列气体传感器故障诊断研究[J];测试技术学报;2005年03期
8 马丽丽;黄宏斌;邓苏;;包含关联的语义覆盖网构建方法研究[J];计算机工程与应用;2009年21期
9 钱剑飞,陈华,陈奇,俞瑞钊;一种代码与中文文档关联信息的自动提取方法[J];浙江大学学报(工学版);2004年11期
10 才晓峰,齐全跃,刘同明,徐勇;目标参数相关性能的指标分析[J];华东船舶工业学院学报(自然科学版);2002年01期
11 张瑞秋,刘林,张承忠,周述璋;堤防横断面与设计参数关联的方法[J];工程图学学报;2005年05期
12 陈华,钱剑飞,俞瑞钊;一种代码和中文文档关联信息的自动提取方法[J];计算机应用与软件;2005年09期
13 千江有水;王卫华;;用好CUE 掌控你的音乐文件[J];电脑迷;2008年18期
14 曹国钧;关于Windows升级与启动过程中故障的问与答(下)[J];微电脑世界;1996年03期
15 王成良;图形关联信息的数据库查询及其应用[J];重庆大学学报(自然科学版);2002年01期
16 唐明剑;;MD5在银行中文查询中的应用[J];华南金融电脑;2009年05期
17 王丹;;保护你的文件关联[J];电脑应用文萃;2002年08期
18 李慧;李存华;王霞;;一种基于页面内容与关联性的网页排名技术[J];计算机工程与应用;2010年25期
19 沈波;;谁识图片真面目 揭穿缩略图背后的秘密[J];电脑知识与技术(经验技巧);2007年10期
20 杜慧洁;曹庆年;孙玉庆;卞正中;;基于概率松弛的边缘标记[J];模式识别与人工智能;1999年02期
中国重要会议论文全文数据库 前10条
1 王玉华;王铭文;;Fuzzy信息源的信息量及关联信息[A];中国系统工程学会模糊数学与模糊系统委员会第五届年会论文选集[C];1990年
2 王耀;陈醒辉;;网架结构通用计算程序[A];第二届空间结构学术交流会论文集(第一卷)[C];1984年
3 索玮岚;冯博;樊治平;;具有不同偏好形式关联信息的项目合作风险因素识别方法[A];中国企业运筹学学术交流大会论文集[C];2008年
4 刘峭;Egil Pedersen;;关于船舶安全运航上的冲突关联信息可视化的认知学上的研究[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
5 张树武;徐波;黄泰翼;;汉语大词汇/连续语音识别语言建模技术分析[A];第四届全国人机语音通讯学术会议论文集[C];1996年
6 刘君强;彭智勇;杨先娣;李旭晖;;一个基于对象代理模型的生物信息集成系统[A];2005年全国理论计算机科学学术年会论文集[C];2005年
7 张晓艳;王挺;陈火旺;;基于多向量和实体模糊匹配的话题关联识别[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 季浩;李书杰;刘晓平;;规律维的建模与可视化方法研究[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(下册)[C];2008年
9 汤筱贤;;资源管理的转型探讨——系统优化整合资源信息 业务应用推动资源管理[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
10 周立鹤;谭宽;许云琪;;基于GIS的配网线路管理系统应用研究[A];2008年云南电力技术论坛论文集[C];2008年
中国博士学位论文全文数据库 前7条
1 镇璐;基于知识网格的知识供应理论与技术[D];上海交通大学;2008年
2 范霄文;基于粗糙集的定性数据分析方法研究[D];厦门大学;2008年
3 蔡柯柯;基于查询特征上下文的检索模型研究[D];浙江大学;2007年
4 熊焰;运动员竞技能力的参赛变异及其成因与对策[D];北京体育大学;2005年
5 金海松;轿车信息集中控制系统的关键技术研究[D];武汉理工大学;2005年
6 李宏博;高频雷达目标数据处理技术研究[D];哈尔滨工业大学;2009年
7 胡红革;网络化控制系统Petri网建模与分析[D];电子科技大学;2005年
中国硕士学位论文全文数据库 前10条
1 马麟;关联理论对于模糊修辞翻译的诠释[D];广东外语外贸大学;2006年
2 王海燕;顺应—关联模式在跨文化交际中的应用[D];中国石油大学;2007年
3 陈羚;基于语义的文献关联信息浏览系统[D];华中科技大学;2007年
4 梁波;基于本体的概念建模可视化认知支持[D];国防科学技术大学;2008年
5 顾怡坤;基于组件与终端输出关系的诊断求解[D];吉林大学;2010年
6 李永强;基于光子轨道角动量纠缠的压缩关联成像研究[D];南京邮电大学;2013年
7 吴学良;企业级Web报表的研究与实现[D];北京交通大学;2008年
8 刘杰伟;关联理论与大学英语阅读理解教学[D];西南大学;2008年
9 吴晓佳;WLAN频谱导航系统验证帧处理模块和快速关联模块的分析与设计[D];北京邮电大学;2013年
10 宁静;关联理论与大学英语阅读教学[D];广西师范大学;2006年
中国重要报纸全文数据库 前10条
1 本报记者 石磊;进口家电关税急降 影响微乎其微[N];经济观察报;2007年
2 ;应用映射跟踪IT资产[N];网络世界;2006年
3 张梦谦 陆海青 胡海啸;从关联信息中“挖”出稽查案源[N];中国税务报;2006年
4 玫懿;“万码奔腾”何所去?[N];中国经济导报;2004年
5 吉林省邮电工程有限公司 宁雪峰;自动穿越在VLAN之间[N];中国计算机报;2008年
6 鄢晓夫;监控审核体系 防范银行卡犯罪[N];金融时报;2007年
7 高初建;“万码奔腾”何所去?[N];中华工商时报;2004年
8 ;邮政分拣技术实现革命性的突破[N];人民邮电;2006年
9 ;联想服务与科技共舞[N];计算机世界;2002年
10 北京市银监局 喻强;有效防范 关联交易风险[N];上海金融报;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978