收藏本站
《安徽大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

关联挖掘的若干研究

马猛  
【摘要】:快速发展的信息技术和互联网的迅速普及,导致在各个应用领域的数据库中存储了大量数据,这些数据集中包含着很多有用的知识,因此如何从各种大型或密集数据库中发现所隐藏的、预先未知的信息就显得尤为重要,这正是数据挖掘所要完成的任务。关联挖掘作为数据挖掘的一个重要研究分支,其主要研究目的就是从大型数据集中发现隐藏的、有趣的、属性间的规律,即关联规则。由于形式简单、易于理解,且是从大型数据库中提取知识的主要手段,因此,关联规则挖掘的研究和应用已经得到了数据库、人工智能及统计学等领域里学者的极大关注,并取得了不少的研究成果。 随着数据库规模的不断扩大,在密集数据库中进行关联挖掘也遇到了很大的挑战。传统的关联挖掘算法大多是基于Apriori算法,该类算法在挖掘密集数据库时遇到了很大的困难。Apriori算法是一个逐层迭代和候选产生-检测算法。算法扫描数据库次数与最大频繁项集的长度相等,随着数据库规模增大,最大频繁项集长度增加,算法扫描数据库耗时将大大增加;大量候选项集的产生将占用大量CPU计算时间。此外,大量中间结果的产生,也使内存瓶颈问题非常突出。为了解决密集数据库上关联挖掘困难的问题,本文在第三章介绍了一个新颖的数据记录存储格式—异集。异集数据库较传统数据库而言,一方面大大缩减了密集数据库的规模,另一方面,基于异集数据库挖掘频繁项集时,所产生的中间结果也大大缩减,极大的提高了算法的性能。 基于传统算法挖掘密集数据库所得到的关联规则集中存在着大量冗余,这必然不利于用户查找有用信息,合理决策,因此如何去除规则集中的冗余规则,且无信息丢失,就显得尤为重要。特别是随着数据库规模不断扩大,这个问题也越来越突出。频繁闭项集集合是频繁项集集合的一个子集,就数量规模而言,频繁闭项集集合远小于频繁项集集合,并且从频繁闭项集集合能导出所有的频繁项集及其支持度,从而也就导出了所有的关联规则,这说明频繁闭项集没有丢失任何信息,又大大减少了工作量,提高了效率。本文第四章对基于频繁闭项集挖掘最小无冗余关联规则的算法做了较详细的研究。
【学位授予单位】:安徽大学
【学位级别】:硕士
【学位授予年份】:2005
【分类号】:TP311.13

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前3条
1 刘春艳;关联规则及关联规则增量更新研究[D];四川师范大学;2011年
2 孙宝友;负关联规则增量更新技术的研究[D];山东轻工业学院;2009年
3 蔡昱辰;面向零售业商务智能系统的关联规则增量更新算法研究与改进[D];东华大学;2013年
【参考文献】
中国期刊全文数据库 前6条
1 周皓峰,朱扬勇,施伯乐;一个基于兴趣度的关联规则采掘算法[J];计算机研究与发展;2002年04期
2 杨红菊,梁吉业;一种挖掘频繁项集和频繁闭包项集的算法[J];计算机工程与应用;2004年13期
3 李哲,杨兆中,庞炳章;大型数据库中关联规则的向量法挖掘[J];计算机工程;2003年08期
4 刘君强,孙晓莹,庄越挺,潘云鹤;挖掘闭合模式的高性能算法[J];软件学报;2004年01期
5 高峰,谢剑英;一种无冗余的关联规则发现算法[J];上海交通大学学报;2001年02期
6 李力,翟东海,靳蕃;基于图的频繁闭项集挖掘算法[J];西南交通大学学报;2004年03期
【共引文献】
中国期刊全文数据库 前10条
1 胡全胜,徐瑞琳,钱双八,刘尚友;农业专家系统[J];安徽农业科学;1991年01期
2 窦祥国,胡学钢;关联规则的评价方法研究[J];安徽技术师范学院学报;2005年04期
3 耿兆丰,李益明;服装款式智能CAD系统的设计与实现[J];北京服装学院学报;1992年02期
4 李波;;数据仓库与联机分析处理(OLAP)技术[J];北京广播学院学报(自然科学版);2005年04期
5 张德政,石阳,邓一,杨炳儒;基于广义归纳逻辑因果模型的知识发现与算法实现[J];北京科技大学学报;2003年04期
6 孙娟,宁建国;面向agent技术在城轨交通自动监控数字仿真中的应用[J];北京理工大学学报;2004年08期
7 卫萌菡;徐开俊;;知识网格中的格理论[J];毕节学院学报;2011年04期
8 刘志鹏,陈斌龙,张小建,孙德强;产品包装设计方案智能决策系统的设计与实现[J];包装工程;2001年02期
9 孙翔;陈伟健;;物联网的组网技术分析与应用[J];成都信息工程学院学报;2010年04期
10 钱寿宇,周进;论英汉机器翻译─—语言学规则与词典的开放性[J];成都气象学院学报;1995年01期
中国重要会议论文全文数据库 前10条
1 尹松;周永权;;基于联机分析处理的数据仓库分析[A];广西计算机学会2004年学术年会论文集[C];2004年
2 付森;;数据仓库技术在财务综合指标分析中的应用研究[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
3 王忠明;何卫平;;基于Web的协作项目管理系统数据仓库构建[A];先进制造技术论坛暨第二届制造业自动化与信息化技术交流会论文集[C];2003年
4 罗杰荣;;基于Internet的考试系统的设计分析[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
5 韩洁;卢朝霞;;企业MIS开发方法和技术的研究[A];1998中国控制与决策学术年会论文集[C];1998年
6 曲爽;谷文祥;;基于兴趣度和负项集的关联规则挖掘算法的研究[A];2005年全国理论计算机科学学术年会论文集[C];2005年
7 鹿瑾;王青青;肖涛;;煤矿安全生产调度决策支持系统的构建[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
8 梁燕云;肖霞;;C~(13)NMR谱图解析专家系统[A];第七届全国波谱学学术会议论文摘要集[C];1992年
9 胡晓萍;赵红;李之杰;;石油勘探计划决策支持系统[A];面向复杂系统的管理理论与信息系统技术学术会议专辑[C];2000年
10 冯玉才;古豫武;;知识数据库系统的模型研究[A];第九届全国数据库学术会议论文集(下)[C];1990年
中国博士学位论文全文数据库 前10条
1 陶有德;可修复模型的系统分析[D];北京信息控制研究所;2010年
2 韩明华;基于情境分析的集群企业知识转移机理与模型研究[D];浙江工商大学;2011年
3 周明;基于数据挖掘的制造业采购DSS理论及方法研究[D];天津大学;2009年
4 孔令东;基于模糊Petri网的瓦斯突出空间预测模型研究[D];中国矿业大学;2011年
5 徐建平;再生资源回收利用网络研究[D];东华大学;2011年
6 刘智;关联规则挖掘方法及其在冠心病中医诊疗中的应用研究[D];大连海事大学;2012年
7 孟庆武;沉积相综合分析方法研究及软件研制[D];中国科学院软件研究所;2001年
8 苑寅秋;面向机电产品的色彩设计专家系统(MCSES)研究[D];南京航空航天大学;2002年
9 朱建生;基于知识管理的现代办公信息系统的研究[D];铁道部科学研究院;2002年
10 岳建平;大坝安全监控系统可靠性研究[D];河海大学;2002年
中国硕士学位论文全文数据库 前10条
1 梅俊;数据挖掘中关联规则算法的研究及应用[D];安徽工程大学;2010年
2 梁大圣;空间数据仓库的设计与构建[D];山东农业大学;2010年
3 曾祥莉;ETL在经济普查信息发布系统中的应用研究[D];哈尔滨工程大学;2010年
4 崔山;网络会议平台数据分析系统的设计与实现[D];苏州大学;2010年
5 韩成勇;高校学评教决策支持系统设计与实现[D];苏州大学;2010年
6 程火波;商业银行反洗钱系统的设计与实施[D];华东师范大学;2010年
7 王英翔;天津港数据集成处理平台的设计与实现[D];大连海事大学;2010年
8 李强;审计系统中ETL的设计与实现[D];广西民族大学;2010年
9 朱庆;关联规则挖掘算法的研究[D];新疆农业大学;2010年
10 周伟;基于J2EE的新闻发布系统的设计与实现[D];南昌大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 董祥军,王淑静,宋瀚涛,陆玉昌;负关联规则的研究[J];北京理工大学学报;2004年11期
2 夏火松,蔡淑琴;基于数据挖掘技术的客户关系管理[J];商业研究;2003年20期
3 张丽;;关联规则挖掘研究[J];赤峰学院学报(自然科学版);2009年05期
4 李俊斌;;浅析数据挖掘技术在保险业中的应用[J];大众科技;2006年02期
5 卢景丽,徐章艳,刘美玲,区玉明;一种改进的负关联规则挖掘算法[J];广西师范大学学报(自然科学版);2004年02期
6 杜跃;王治和;张旭;;基于概率统计的正负关联规则挖掘算法[J];佳木斯大学学报(自然科学版);2007年03期
7 孟志青;时态关联规则采掘的若干性质[J];计算机工程与应用;2001年10期
8 王娟茹,赵嵩正;基于数据仓库的客户关系管理[J];计算机工程与应用;2003年26期
9 皋军,王建东;关联规则挖掘算法更新与拓展[J];计算机工程与应用;2003年35期
10 董祥军,宋瀚涛,姜合,陆玉昌;基于最小兴趣度的正、负关联规则挖掘[J];计算机工程与应用;2004年27期
中国博士学位论文全文数据库 前1条
1 金胜男;基于多层关联规则的概念分层知识库中知识发现的研究[D];天津大学;2006年
中国硕士学位论文全文数据库 前4条
1 陆晶;关联规则挖掘算法研究[D];山东大学;2005年
2 杨井荣;正负关联规则数据挖掘算法的研究[D];大连海事大学;2006年
3 窦茂生;数据挖掘中关联规则的研究与应用[D];长春理工大学;2009年
4 孙宝友;负关联规则增量更新技术的研究[D];山东轻工业学院;2009年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 蔡昱辰;面向零售业商务智能系统的关联规则增量更新算法研究与改进[D];东华大学;2013年
【二级参考文献】
中国期刊全文数据库 前3条
1 周欣,沙朝锋,朱扬勇,施伯乐;兴趣度——关联规则的又一个阈值[J];计算机研究与发展;2000年05期
2 颜雪松,蔡之华;一种基于Apriori的高效关联规则挖掘算法的研究[J];计算机工程与应用;2002年10期
3 李天瑞,徐扬,潘无名;φ频繁闭项目挖掘问题及其算法[J];西南交通大学学报;2001年03期
【相似文献】
中国期刊全文数据库 前10条
1 姜晗;贾泂;徐峰;;基于频繁项集挖掘最大频繁项集和频繁闭项集[J];计算机工程与应用;2008年28期
2 潘怡;杜红燕;;数据流频繁闭项集挖掘研究[J];长沙大学学报;2010年05期
3 战立强;刘大昕;;基于概念格的频繁闭项集增量挖掘算法研究[J];哈尔滨工程大学学报;2007年02期
4 贾泂;刘群;姜晗;;分布式数据库的精简频繁模式集及其挖掘算法[J];浙江师范大学学报(自然科学版);2010年02期
5 杜永生;;关联规则的精简方法研究[J];赤峰学院学报(自然科学版);2011年10期
6 马莉;任学军;韩崇;刘亚雷;;极大布尔关联规则的挖掘算法[J];郑州大学学报(理学版);2008年04期
7 陈凯,冯全源;一个频繁闭项集高效挖掘算法[J];计算机与数字工程;2005年09期
8 刘旭;毛国君;孙岳;刘椿年;;数据流中频繁闭项集的近似挖掘算法[J];电子学报;2007年05期
9 李晋宏;杨炳儒;宋威;侯伟;;基于包含索引的频繁闭序列模式挖掘的新算法[J];系统工程与电子技术;2009年10期
10 陶克;王意洁;;数据流上的频繁闭项集挖掘算法[J];计算机工程;2010年18期
中国重要会议论文全文数据库 前1条
1 吴春旭;陈家耀;刘博文;;一种改进CLOSET算法[A];第十届中国管理科学学术年会论文集[C];2008年
中国博士学位论文全文数据库 前1条
1 敖富江;数据流频繁模式挖掘关键算法及其仿真应用研究[D];国防科学技术大学;2008年
中国硕士学位论文全文数据库 前10条
1 姜晗;关联规则的精简方法研究[D];浙江师范大学;2007年
2 陈凯;关联规则挖掘算法研究[D];西南交通大学;2005年
3 宋晶晶;基于单向FP-树的最大频繁项集挖掘[D];河南大学;2007年
4 马莉;极大布尔关联规则生成算法的研究[D];河南大学;2008年
5 李俊;基于滑动窗口的数据流频繁闭合项集挖掘研究[D];暨南大学;2008年
6 秦东霞;基于频繁闭项集的关联分类算法研究[D];重庆大学;2009年
7 王国光;基于关联规则的数据挖掘算法研究[D];内蒙古大学;2006年
8 马丽伟;关联规则算法研究及其在中医药数据挖掘中的应用[D];南京理工大学;2009年
9 霍聪;数据流中基于FP-Tree的频繁项集挖掘算法研究[D];燕山大学;2009年
10 马猛;关联挖掘的若干研究[D];安徽大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026