收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

数据流上的频繁项集挖掘算法研究

李辉  
【摘要】: 数据流是目前的一个新兴的热门领域,国内外学者都纷纷提出各种数据流处理的技术、算法和各种具体应用项目。数据流是一个按时间到来的有序的项集。和传统静态数据库中的数据不同的是,数据流是连续的、无限的、通常以很高的速度到来的并且数据分布随着时间而改变。数据流频繁模式挖掘是数据流挖掘基本问题之一,已经引起国内外研究者的广泛关注,提出了许多有效的数据流频繁模式挖掘算法。 针对数据流的特点,论文对数据流处理技术和数据流挖掘中的关键问题进行了研究和总结。论文对一些关键问题的解决技术进行了研究。论文对经典的频繁项集挖掘算法进行了介绍和分析。分析可以看出数据流的无限性、高速性使得经典的频繁项集挖掘算法难以适用到数据流中。此外,论文对于当前现存的一些数据流中频繁项集挖掘算法进行了介绍,比较分析和总结,并且设计实现了数据流中挖掘频繁项集的算法FP-stream和Time-Sensitive Sliding Window。 本文在上述工作的基础上提出了FP-FT算法,用户通过它可以快速获取最近一个时期内的频繁项集。该算法采用了嵌入了时间窗口的前缀树的结构来存储频繁项集,方便了对数据块中数据项的操作,节约了一定的空间。分析和实验表明,与传统算法相比该算法具有较好的空间和时间效率,适合数据流中频繁项集的挖掘。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 宋威;刘文博;李晋宏;;基于动态裁剪频繁模式树的频繁项集并发挖掘算法[J];山东大学学报(工学版);2011年04期
2 吴小波;徐维祥;;利用FP-树挖掘有约束的频繁模式[J];北京交通大学学报;2005年06期
3 佘俊胜;黄战;李亚丹;;基于FP树的多最小支持度广义关联规则挖掘算法[J];小型微型计算机系统;2007年12期
4 秦亮曦;苏永秀;刘永彬;梁碧珍;;基于压缩FP-树和数组技术的频繁模式挖掘算法[J];计算机研究与发展;2008年S1期
5 朱彦霞;张雪萍;王家耀;;改进的频繁项集挖掘算法[J];计算机工程与应用;2009年04期
6 唐辉;吴明礼;贺玉明;;一种改进的多层关联规则挖掘算法[J];计算机工程;2011年16期
7 陈志强;;对FP-增长算法的一种优化改进[J];科技资讯;2006年10期
8 张忠平;李岩;林志杰;王爱杰;;基于索引数组的频繁项集挖掘算法[J];计算机应用研究;2009年01期
9 潘雷;优化关联规则算法的方法研究[J];南京晓庄学院学报;2005年05期
10 秦亮曦;李谦;史忠植;;基于排序FP-树的频繁模式高效挖掘算法[J];计算机科学;2005年04期
11 史旻昱;马辉民;唐述科;;基于FS-tree的频繁模式挖掘算法[J];计算机工程与应用;2008年30期
12 邓丰义,刘震宇;基于模式矩阵的FP-growth改进算法[J];厦门大学学报(自然科学版);2005年05期
13 朱玉全;孙蕾;杨鹤标;宋余庆;;基于频繁模式树的负关联规则挖掘算法[J];计算机工程;2006年22期
14 曾致中;;对于基于最长频繁闭项集的聚类算法的探讨[J];农业网络信息;2007年06期
15 陈玉婷;王斌;刘博;宋斌;李颉;;关联规则挖掘算法介绍[J];计算机技术与发展;2006年05期
16 郭福亮;左凯伶;;关联规则挖掘中Apriori算法的一种改进[J];计算机与数字工程;2007年05期
17 王伟勤;钟敬堂;;对Apriori算法的一种改进[J];佛山科学技术学院学报(自然科学版);2007年02期
18 谢志强;朱孟杰;杨静;;基于FP-Tree的敏感性关联规则隐藏的研究[J];哈尔滨工程大学学报;2009年10期
19 章志明;黄龙军;余敏;黄明和;;一种动态的频繁项集挖掘算法[J];计算机工程;2006年24期
20 王朝辉;王婷婷;;一种快速的频繁项集挖掘算法[J];贵州工业大学学报(自然科学版);2006年06期
中国重要会议论文全文数据库 前10条
1 温磊;李敏强;;基于有向项集图的频繁项集增量更新挖掘算法[A];2004中国控制与决策学术年会论文集[C];2004年
2 李忠哗;何丕廉;;一种分布环境中最大频繁项目集挖掘算法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
3 杨子良;陶宏才;;一种基于向量运算的频繁项集快速挖掘算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
4 楚红涛;寒枫;张燕;王婷;;基于数据流的挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
5 李佳;芙蓉薇;;基于FP-tree算法的图书推荐服务[A];低碳经济与科学发展——吉林省第六届科学技术学术年会论文集[C];2010年
6 温磊;牛东晓;何永贵;;基于权重约束的频繁项集挖掘算法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
7 包勇;卢加元;吴慧中;;基于频繁项集的降维在数据挖掘中的应用[A];2005中国控制与决策学术年会论文集(下)[C];2005年
8 郭云峰;张集祥;;一种基于位向量的关联规则挖掘算法[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
9 杨仕博;贺彦琨;马志新;;一种基于极大完全子图的最大频繁项集并行挖掘算法[A];2007年全国开放式分布与并行计算机学术会议论文集(下册)[C];2007年
10 方炜炜;杨炳儒;唐志刚;杨君;;基于客观兴趣度的关联规则优化算法研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
中国博士学位论文全文数据库 前10条
1 屠莉;流数据的频繁项挖掘及聚类的关键技术研究[D];南京航空航天大学;2009年
2 郭立超;数据流挖掘若干技术研究及其在电信行业的应用[D];浙江大学;2011年
3 林晓勇;频繁模式挖掘和动态维护的理论与方法研究[D];北京化工大学;2008年
4 由育阳;数据流容错挖掘算法研究[D];哈尔滨工程大学;2011年
5 马海兵;频繁模式挖掘相关技术研究[D];复旦大学;2005年
6 李实;中文网络客户评论中的产品特征挖掘方法研究[D];哈尔滨工业大学;2009年
7 李广水;基于服务的森林资源调查数据挖掘系统的研究[D];南京林业大学;2010年
8 毛伊敏;数据流频繁模式挖掘关键算法及其应用研究[D];中南大学;2011年
9 冯博;基于半结构化数据的数据流挖掘算法研究[D];北京邮电大学;2011年
10 朱小栋;基于扩展预测模型标记语言的数据流挖掘系统建模研究[D];南京航空航天大学;2009年
中国硕士学位论文全文数据库 前10条
1 李辉;数据流上的频繁项集挖掘算法研究[D];北京交通大学;2007年
2 陈力捷;数据流频繁项挖掘系统的研究和实现[D];浙江大学;2007年
3 梁小鸥;数据挖掘在高职教学管理中的应用[D];华南理工大学;2011年
4 李桥;数据挖掘在教学质量评价中的应用研究[D];中南大学;2010年
5 刘卫;基于剪枝概念格模型的频繁项集表示及挖掘研究[D];合肥工业大学;2007年
6 李瑞华;数据挖掘在煤矿安全监测中的应用[D];西安电子科技大学;2010年
7 龚舒;桥吊动态机械性能参数的统计特征分析及关联规则挖掘[D];上海海事大学;2005年
8 叶小旺;面向社区服务的数据挖掘关键技术研究与实现[D];西安电子科技大学;2009年
9 张煜辉;数据挖掘和SPC在生产过程质量控制中应用研究[D];上海交通大学;2009年
10 王涛;关联规则算法及并行化研究[D];河北大学;2006年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978