收藏本站
《广西大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

基于FP-树的最大频繁模式挖掘算法研究

冯志新  
【摘要】: 从大型数据库中挖掘关联规则是数据挖掘领域中非常重要的研究课题。其中,最大频繁模式挖掘问题在关联规则挖掘任务中扮演着重要的角色,具有广泛的应用前景。 FP-树是算法FP-growth中提出的新的数据结构。借助于FP-树结构,算法FP-growth采用不同于Apriori系列算法的候选产生测试方法而采取模式增长方法挖掘频繁模式,取得了很好效果。 本文主要在以下几个方面对基于FP-树的最大频繁模式挖掘问题进行研究:第一是提出了基于FP-树的最大频繁模式挖掘算法FP-Max。在该算法中,我们首先介绍了FP-树的定义和构造过程,并分析了基于FP-树进行挖掘的可行性和完整性;然后我们提出基于FP-树的最大频繁模式挖掘算法FP-Max,试验表明算法FP-Max在挖掘密集型、频繁模式较长的大数据集时是有效的。第二是提出FP-树驻留磁盘的最大频繁模式挖掘算法FP-Max-Disk。算法FP-Max运行的前提是构造的FP-树能够驻留内存,但是当事务数据库TDB很大或者设置的最小支持度阀值min_sup很小时,那么构造驻留内存的FP-树将是不现实的。为此,我们首先将原事务数据库TDB划分为一系列投影数据库,然后将每个投影数据库构造为能够装入内存的条件FP-树,最后基于这些条件FP-树挖掘最大频繁模式。第三是研究探讨了 基于FP一树的最大频繁模式并行挖掘问题。借助于多局部频繁模式树 和并行投影技术,本文提出了两种基于共享内存计算模型的最大频繁 模式并行挖掘算法。根据理论分析,这两种并行算法在采用了新的数 据结构和简单的动态负载平衡技术后,可以实现各处理器独立异步运 行、较小的1/O开销以及良好的负载平衡。
【学位授予单位】:广西大学
【学位级别】:硕士
【学位授予年份】:2003
【分类号】:TP311.13

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 叶福兰;施忠兴;;最大频繁模式挖掘算法在图书馆个性化信息服务中的应用[J];长春工程学院学报(自然科学版);2012年03期
中国硕士学位论文全文数据库 前2条
1 朱叶茁;一种基于图的Apriori改进算法研究及其系统实现[D];华中科技大学;2011年
2 赵静;关联规则挖掘算法的研究[D];太原理工大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 周欣,沙朝锋,朱扬勇,施伯乐;兴趣度——关联规则的又一个阈值[J];计算机研究与发展;2000年05期
2 游湘涛,叶施仁,史忠植;多策略通用数据采掘工具MSMiner[J];计算机研究与发展;2001年05期
3 铁治欣,陈奇,俞瑞钊;采掘关联规则的高效并行算法[J];计算机研究与发展;1999年08期
4 杨明,孙志挥,赵传申;交易数据库的加权关联规则增量更新算法[J];计算机工程与应用;2002年01期
5 李立羽,施鹏飞;OLAP关联规则挖掘[J];计算机工程与应用;2002年03期
6 江卓军,谢康林,张文杰;一种新的关联规则挖掘思想[J];计算机工程;2002年04期
7 周斌,吴泉源;序列模式挖掘的一种渐进算法[J];计算机学报;1999年08期
8 李永敏,朱善君,陈湘晖,张岱崎,韩曾晋;基于粗糙集理论的数据挖掘模型[J];清华大学学报(自然科学版);1999年01期
9 肖利,金远平,徐宏炳,王能斌;基于多维标度的快速挖掘关联规则算法[J];软件学报;1999年07期
10 程继华,施鹏飞;多层次关联规则的有效挖掘算法[J];软件学报;1998年12期
【共引文献】
中国期刊全文数据库 前10条
1 程球;几种并行计算模型的分析[J];安徽电气工程职业技术学院学报;2005年01期
2 杨萍,宋振超;FP-growth算法的一种改进[J];安徽工程科技学院学报;2002年03期
3 窦祥国,胡学钢;关联规则的评价方法研究[J];安徽技术师范学院学报;2005年04期
4 王丽菊;面向属性归纳的特征规则挖掘方法的改进[J];鞍山科技大学学报;2004年06期
5 韩建保;罗小江;;基于数据挖掘的坦克传动装置故障征兆识别展望[J];车辆与动力技术;2005年04期
6 许子君;杜秋;栾超;;Apriori改进算法在军队院校干部考核中的应用[J];兵工自动化;2012年03期
7 马帅,唐世渭,杨冬青,王腾蛟,高军;移动环境中的最大移动序列模式挖掘(英文)[J];北京大学学报(自然科学版);2004年03期
8 屈婉玲,袁崇义;一个图增广问题的NC算法[J];北京大学学报(自然科学版);1998年05期
9 刘长河,寿玉亭,童明生;加总线超立方网络上的容错寻径算法[J];北京工业大学学报;2000年01期
10 刘长河,黄忠臣;不完全超立方网络上加总线的方法[J];北京建筑工程学院学报;1999年Z1期
中国重要会议论文全文数据库 前10条
1 周静;周海芳;唐玉华;;多模遥感图像高精度配准并行算法研究与实现[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
2 姚伟力;王锡禄;宋俊德;;基于序列模式挖掘的告警相关性分析算法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
3 黄毅;李剑;祁金才;张锦雄;;线性阵列上的奇偶归拆排序并行算法的MPI实现[A];广西计算机学会2004年学术年会论文集[C];2004年
4 邢敬宏;张明新;李向伟;;基于粗糙集的分类模型预处理研究[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
5 朱传军;常治斌;;制造车间不确定信息研究现状与趋势[A];2006年湖北省博士论坛——先进制造技术与制造装备论文集[C];2006年
6 王波;张斌;;一种基于云模型的时间序列特征表示方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
7 曲爽;谷文祥;;基于兴趣度和负项集的关联规则挖掘算法的研究[A];2005年全国理论计算机科学学术年会论文集[C];2005年
8 周颖;;数据库中知识发现(KDD)的规则新颖性的研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
9 马玉良;赵光宙;;粗糙集理论及其在工程中的应用研究[A];第11届全国电气自动化电控系统学术年会论文集[C];2002年
10 黄文涛;王伟杰;赵学增;代礼周;;基于不一致信息的故障诊断决策规则挖掘的粗糙集模型[A];设备监测与诊断技术及其应用——第十二届全国设备监测与诊断学术会议论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 张琦;多核系统中的程序性能优化研究[D];中国科学技术大学;2010年
2 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
3 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年
4 罗永红;无缝运输信息网格的若干关键技术研究[D];中南大学;2011年
5 朱辉生;基于情节规则匹配的数据流预测研究[D];复旦大学;2011年
6 林冠洲;网络流量识别关键技术研究[D];北京邮电大学;2011年
7 朱小栋;基于扩展预测模型标记语言的数据流挖掘系统建模研究[D];南京航空航天大学;2009年
8 何月顺;关联规则挖掘技术的研究及应用[D];南京航空航天大学;2010年
9 刘维;生物序列模式挖掘与识别算法的研究[D];南京航空航天大学;2010年
10 杨钤雯;序列模式挖掘方法及Web使用挖掘研究[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 任芳;时间序列数据挖掘研究[D];辽宁师范大学;2010年
2 陈晶;基于序列模式挖掘算法的入侵检测研究[D];华东师范大学;2011年
3 丁大伟;电子交易中软件运行时行为分析与预测[D];湖南工业大学;2010年
4 费洪刚;个性化网站的研究与应用[D];长春工业大学;2010年
5 白霜;DNA序列的最大频繁模式挖掘[D];南昌大学;2010年
6 孟宜成;粗集理论在机器学习中的应用与研究[D];昆明理工大学;2008年
7 徐海兰;Web日志挖掘技术在个性化信息推荐中的应用[D];延边大学;2009年
8 朱小云;关联规则挖掘算法在高校专业建设中的应用—Apriori算法用于国防职院课程改革研究[D];云南大学;2010年
9 严兆斌;序列模式挖掘在公路隧道交通中的应用研究[D];西安电子科技大学;2009年
10 李瑞华;数据挖掘在煤矿安全监测中的应用[D];西安电子科技大学;2010年
【同被引文献】
中国期刊全文数据库 前5条
1 周文云;;数据挖掘在数字图书馆个性化服务中的研究与应用[J];军民两用技术与产品;2012年01期
2 曾万聃;周绪波;戴勃;常桂然;李春平;;关联规则挖掘的矩阵算法[J];计算机工程;2006年02期
3 吴绍函;余昭平;;基于矩阵的关联规则挖掘算法[J];计算机工程;2008年23期
4 黄龙军;段隆振;章志明;;一种基于上三角项集矩阵的频繁项集挖掘算法[J];计算机应用研究;2006年11期
5 方炜炜;杨炳儒;宋威;侯伟;;基于布尔矩阵的关联规则算法研究[J];计算机应用研究;2008年07期
中国博士学位论文全文数据库 前1条
1 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
中国硕士学位论文全文数据库 前10条
1 徐海波;高校图书馆个性化信息服务系统的设计与实现[D];河北科技大学;2010年
2 刘静;数据挖掘算法在书目推荐系统中的应用研究[D];郑州大学;2011年
3 赵家刚;数据挖掘的关联规则研究[D];云南师范大学;2001年
4 张梅凤;挖掘有效关联规则算法的分析与设计[D];郑州大学;2001年
5 王秉政;基于FP-树的频繁模式和长模式挖掘[D];郑州大学;2003年
6 庄代波;一种Apriori的改进算法[D];浙江大学;2003年
7 王艳;数据挖掘中关联规则算法的研究[D];西南交通大学;2004年
8 张学斌;数值型多维关联规则挖掘研究[D];西南师范大学;2005年
9 康艳荣;基于图结构挖掘算法的研究与应用[D];重庆大学;2005年
10 李娟;基于矩阵的关联规则挖掘算法研究[D];西南大学;2007年
【二级引证文献】
中国硕士学位论文全文数据库 前2条
1 王琼;基于树的关联规则挖掘算法研究[D];河南大学;2013年
2 张伟;官兵培训辅助决策系统的设计与实现[D];兰州大学;2014年
【二级参考文献】
中国期刊全文数据库 前3条
1 马元元,孙志挥,高红梅;时态数据库中增量关联规则的挖掘[J];计算机研究与发展;2000年12期
2 欧阳为民,郑诚,蔡庆生;数据库中加权关联规则的发现[J];软件学报;2001年04期
3 冯玉才,冯剑琳;关联规则的增量式更新算法[J];软件学报;1998年04期
【相似文献】
中国期刊全文数据库 前10条
1 申展,江宝林,唐磊,胡运发;基于互关联后继树的频繁模式挖掘研究[J];计算机工程;2004年21期
2 战立强;刘大昕;;小波滤波在时间序列频繁模式挖掘中的应用[J];哈尔滨工程大学学报;2008年01期
3 何海涛;张世玲;;基于矩阵的频繁模式挖掘及更新算法[J];计算机科学;2008年03期
4 高琳;覃桂敏;周晓峰;;图数据中频繁模式挖掘算法研究综述[J];电子学报;2008年08期
5 孟彩霞;;频繁模式挖掘的约束算法[J];智能系统学报;2009年02期
6 潘怡;杜红燕;;概念格在频繁模式挖掘中的应用研究[J];湖南科技大学学报(自然科学版);2010年02期
7 梁碧珍;陆月然;耿立中;秦亮曦;;目标频繁模式挖掘算法研究[J];计算机工程与科学;2010年10期
8 张艳芳;过仕明;;基于分类频繁模式挖掘的书目推荐策略与算法[J];情报科学;2012年12期
9 寇晨艳;;一种改进的频繁模式挖掘算法[J];电脑与电信;2013年03期
10 刘君强,潘云鹤;基于混合投影的频繁模式挖掘算法[J];计算机研究与发展;2003年10期
中国重要会议论文全文数据库 前8条
1 侯俊杰;李春平;;一种基于内存索引的频繁模式挖掘算法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
2 任家东;孙亚非;郭盛;;基于约束的交互式频繁模式挖掘算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
3 袁晴晴;楼宇波;周皓峰;汪卫;施伯乐;;基于图论的频繁模式挖掘[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
4 韩蒙;张炜;李建中;;RAKING:一种高效的不确定图K-极大频繁模式挖掘算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
5 曾涛;向勇;包小源;刘胤田;蒋永光;;中医古方挖掘:一种频繁药组发现与功效标注算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
6 杨慧;刘红岩;何军;杜小勇;;一种面向高速度数据流的频繁模式挖掘算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
7 王闻;谢伙生;;基于FP树和对称矩阵的最大频繁模式挖掘算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
8 马秀莉;刘健;童云海;唐世渭;杨冬青;;基于模式索引树的增量挖掘[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
中国博士学位论文全文数据库 前10条
1 刘勇;频繁模式挖掘相关技术研究[D];复旦大学;2007年
2 战立强;频繁模式挖掘算法研究[D];哈尔滨工程大学;2007年
3 林晓勇;频繁模式挖掘和动态维护的理论与方法研究[D];北京化工大学;2008年
4 郑晓艳;频繁模式挖掘技术研究及其在供应链管理中的应用[D];天津大学;2010年
5 马海兵;频繁模式挖掘相关技术研究[D];复旦大学;2005年
6 张磊;基于约束的频繁模式挖掘方法以及应用研究[D];中国科学技术大学;2014年
7 阮幼林;频繁模式挖掘算法及在入侵检测中的应用研究[D];华中科技大学;2004年
8 耿汝年;加权频繁模式挖掘算法研究[D];江南大学;2008年
9 杨厚群;半结构化数据频繁模式挖掘相关技术研究[D];重庆大学;2010年
10 徐玉生;频繁模式挖掘算法与剪枝策略研究[D];兰州大学;2008年
中国硕士学位论文全文数据库 前10条
1 王阳;频繁模式挖掘技术及其在电信收入保障系统中的应用研究[D];湖南大学;2010年
2 张健;基于频繁模式挖掘的不良消息文本检测方法研究与实现[D];复旦大学;2012年
3 张李一;不确定性数据频繁模式挖掘算法的研究[D];复旦大学;2011年
4 屈松;图数据库频繁模式挖掘关键技术研究[D];黑龙江大学;2012年
5 易娟;基于位序列的频繁模式挖掘算法研究[D];燕山大学;2012年
6 原继东;基于阵列的频繁模式挖掘算法研究[D];北京交通大学;2012年
7 陈艳;数据流的最大频繁模式挖掘研究[D];西安科技大学;2010年
8 尹敬涛;基于大步回退剪枝最大频繁模式挖掘的入侵检测系统研究[D];燕山大学;2006年
9 程贤亮;基于用户移动模式的位置预测研究[D];杭州电子科技大学;2013年
10 杨琳琳;基于频繁模式挖掘的双植入位点查找算法研究[D];北京交通大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026