收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

计算机数据的关联规则挖掘理论和算法研究

李学明  
【摘要】: 随着计算机应用范围、领域等的日益扩大,特别是Internet的飞速发展,在各种应用系统和Internet上积聚了大量、甚至海量数据,产生了"数据爆炸、知识贫乏"的现象;数据挖掘是解决这种问题的最为有效的手段,它包含关联规则挖掘、预测、分类、聚类、演化分析等多种技术手段。其中关联规则挖掘是一种主要的,也是用途最广的数据挖掘方法。 关联规则概念最早是由在IBM工作的Rakesh Agrawal博士等于1993年提出的,用于刻划事务数据库中各交易项目之间的关系,即频繁关系,其研究已有10余年时间,取得了很多成果,但还有很多问题亟待解决。本论文对此作了详细介绍,并对关联规则挖掘理论特别是关联规则挖掘算法进行了深入研究,取得了一定的研究成果。 作者把关联规则挖掘分为五个阶段,提出了MMAR模型,该模型是对Agrawal两阶段模型的改进与完善,更符合现有的实际,且对未来关联规则挖掘研究也更具指导意义。在该模型中,作者第一次明确提出了把现有的关联规则看成是关联关系及其关联关系表达的统一体,这种分离有助于对关联规则知识的理解,也明确指明关联关系及其表达同关联规则挖掘算法等一样是关联规则挖掘中的一个重要不可缺的方面。 在关联关系研究中,作者提出了扩展型关联关系以及扩展型关联规则。扩展型关联规则涵盖了Rakesh Agrawal提出的基本型关联规则,从语义上看,后者只是前者的一种特殊形式,扩展型关联规则既具有理论意义又有实际应用价值。扩展型关联规则既包含肯定频繁关系又包含否定频繁关系,而基本型关联规则仅包含肯定频繁关系;此外,作者还推导了扩展型关联规则支持度计算的若干定理,并利用这些定理建立了一个有效的扩展型关联规则挖掘算法。 通常,挖掘产生的关联规则都存在数量过大的问题,现有的办法是通过兴趣度、带约束的关联规则挖掘来解决该问题,但效果甚差,为此作者提出了原关联规则。原关联规则具有很强的规则约简能力和生成能力,利用其规则约简能力,在挖掘时可以极大减少关联规则的数量;利用其规则生成能力,在产生原关联规则后,可以得到其它的关联规则,从而不会产生信息知识的丢失;原关联规则可以几倍甚至几十倍地减少关联规则数量。此外,作者针对原关联规则生成,提出了一个有效的两步生成算法,即先从频繁项生成源关联规则(Source Association WP=5 Rules),再从源关联规则生成原关联规则(Atom Association Rules)。 关联规则频繁项的挖掘是关联规则挖掘的中重要研究内容,目前绝大多数的研究都集中在如何提高频繁项挖掘的效率上。现有研究主要从提高串行算法的效率、利用并行和分布式挖掘算法、增量挖掘算法等来提高关联规则挖掘效率,为进一步提高效率,还提出了挖掘部分或特殊关联规则,如提出挖掘极大频繁项、挖掘闭集频繁项的挖掘算法。作者对此进行了深入研究,发现关联规则串行算法是提高关联规则挖掘效率的基础,并行算法和增量算法都是基于某种串行算法的。在对树-投影挖掘串行算法进行的研究中,作者发现了该算法存在冗余投影这一现象,并提出了水平优化策略、垂直优化策略解决方案,论证了这两种优化策略的关系,从理论上详细论证了其优点。实验表明,采用水平优化策略的算法与不采用优化策略的算法相比,算法性能有了很大提高,执行时间能成倍降低,存储空间也极大减少;而且这种两种优化策略是和数据结构无关的,因此它们既可用于现有各种基于树-投影的关联规则挖掘算法的优化,又可用于指导未来的树-投影关联规则挖掘算法的设计;此外,针对关系数据库中多维关联规则的挖掘,作者还提出了一个结合投影树、广度优先搜索、兄弟交集投影、Apriori优化、水平优化、属性项目优化、数据垂直组织等多种优化方法的关联规则挖掘算法,克服了现有挖掘方法的某些不足。 本文最后对研究工作进行了总结,提出了今后进一步的研究方向


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 金育婵;;数据挖掘技术中基于关联规则算法的研究[J];科技传播;2011年12期
2 杨海玲;;浅议数据挖掘在高校图书馆信息服务中的作用[J];农业图书情报学刊;2011年07期
3 辛浩;;基于关联规则的中文姓名识别方法[J];宿州学院学报;2011年05期
4 忻凌;王丽;;可视化关联规则对疾病相关因素的发现[J];医学信息(上旬刊);2011年08期
5 寿先红;;数据挖掘技术在图书借阅分析系统中的应用与研究[J];电脑知识与技术;2011年26期
6 张皓;;数据挖掘技术在构建学生成绩预警系统的应用[J];电脑知识与技术;2011年19期
7 郎振红;;网络化物业管理系统中数据挖掘的应用[J];沈阳教育学院学报;2011年04期
8 张雨真;李伟;张慧慧;颜雪松;;基于XML构建KDD框架的研究[J];武汉船舶职业技术学院学报;2011年04期
9 齐战胜;高峰;腾达;;数据挖掘技术在计算机取证中的应用研究[J];信息网络安全;2011年09期
10 赵晓岚;张招杰;;数字化图书馆个性化推荐研究与实例[J];科技情报开发与经济;2011年23期
11 汪菊琴;;医学数据挖掘综述[J];电脑知识与技术;2011年15期
12 贾丽媛;张弛;周翠红;;数据挖掘在网络教学评价中的应用[J];湖南城市学院学报(自然科学版);2011年02期
13 康彦;;数据挖掘技术在高职教学质量管理中的应用[J];科技创新导报;2011年20期
14 韩树河;李冬梅;;Apriori算法在汽车销售客户分析中的应用[J];南通航运职业技术学院学报;2011年02期
15 陆洲;;关联规则在高校评教系统中的应用研究[J];电脑知识与技术;2011年24期
16 蔡瑞初;王美华;郝志峰;温雯;;基于最大间隔的基因表达规则筛选[J];计算机工程与应用;2011年26期
17 张士玉;郝旭光;;基于关联规则的调查问卷多项选择题分析[J];图书情报工作;2011年10期
18 武丽芬;吴华;;关联规则在学生成绩分析处理中的应用[J];晋中学院学报;2011年03期
19 李艳;;关联规则在吸毒人员动态管控中的应用[J];信息技术;2011年07期
20 程政;雷霞;柏小丽;徐博海;;关联规则在输电网安全性评价中的应用[J];四川电力技术;2011年04期
中国重要会议论文全文数据库 前10条
1 李阳;徐锡山;韩伟红;郑黎明;徐镜湖;;网络安全事件关联规则的自动化生成方法研究与实践[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
2 左万利;刘居红;;包含正负属性的关联规则及其挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
3 王宁;董淳;胡运发;陶晓鹏;;面向集合的关联规则挖掘算法[A];第十五届全国数据库学术会议论文集[C];1998年
4 周焕银;张永;;关联规则候选项频度规律研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
5 方艳;别荣芳;;关联规则的有趣性研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 黄晓燕;许龙飞;;基于关联规则的网络入侵检测技术的应用研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 李庆忠;张世栋;董国庆;;在数据多维体中进行关联规则的挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
8 韩涛;张春海;;关系数据库中关联规则的高效挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 潘海为;李建中;张炜;;挖掘脑部医学图像中的关联规则[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
10 周水庚;胡运发;陶晓鹏;;分布数据库关联规则的递增挖掘[A];第十五届全国数据库学术会议论文集[C];1998年
中国博士学位论文全文数据库 前10条
1 李学明;计算机数据的关联规则挖掘理论和算法研究[D];重庆大学;2003年
2 肖波;可信关联规则挖掘算法研究[D];北京邮电大学;2009年
3 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年
4 叶小飞;基于自发呈报系统与循证医学的药品不良反应信号挖掘[D];第二军医大学;2011年
5 伊卫国;基于关联规则与决策树的预测方法研究及其应用[D];大连海事大学;2012年
6 Vital Delmas MABONZO;大型数据库有效挖掘关联规则新方法研究[D];大连海事大学;2012年
7 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年
8 王春雨;刑事案件关联分析与防控警务模式研究[D];大连理工大学;2010年
9 蔡瑞初;基因表达数据挖掘若干关键技术研究[D];华南理工大学;2010年
10 赵春;基于数据挖掘技术的财务风险分析与预警研究[D];北京化工大学;2012年
中国硕士学位论文全文数据库 前10条
1 涂明;关联规则增量式更新算法研究[D];合肥工业大学;2010年
2 王景;基于关联规则数据挖掘的研究[D];广西大学;2003年
3 岳慧颖;含有时空约束的关联规则挖掘方法研究[D];哈尔滨工程大学;2004年
4 聂倩雯;基于关联规则数据挖掘和扩展贝叶斯网络的电网故障诊断方法研究[D];西南交通大学;2010年
5 赵春胜;基于关联规则的数据挖掘方法在电厂脱硫监测中的应用研究[D];内蒙古大学;2011年
6 蒋秀英;数据挖掘中的关联规则算法优化研究及应用[D];山东师范大学;2003年
7 吴倩;基于关联规则的零售业CRM的设计和实现[D];华东师范大学;2011年
8 孙彤;活性炭纤维吸附和解吸中的数据挖掘技术[D];辽宁工程技术大学;2004年
9 王烁;关联规则数据挖掘中经典频集算法改进的研究[D];天津大学;2003年
10 王玉荣;关联规则挖掘算法在大数据集上的应用研究[D];江南大学;2011年
中国重要报纸全文数据库 前10条
1 严宁;挖掘数据寻保险商机[N];网络世界;2007年
2 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
3 南京市地方税务局信息管理处、计算机中心 明靖 朱岚;数据挖潜让业务说话[N];中国计算机报;2006年
4 本报记者 袁跃;点击七彩人生[N];财会信报;2005年
5 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
6 贵州省移动通信公司 苏思妮;让信息去主动寻找用户[N];通信产业报;2004年
7 ;选择SIM的十大理由[N];中国计算机报;2008年
8 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
9 陈星霖;NIDS:老树发新枝[N];网络世界;2009年
10 中期研究院;数据仓库与数据挖掘在期货行业的应用[N];期货日报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978