收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于滑动窗口的数据流频繁模式挖掘算法研究

王立波  
【摘要】: 频繁项集挖掘是数据流挖掘中重要的研究领域,目前国内外数据流频繁项集挖掘算法还存在诸多问题。例如模式产生延迟比较严重;挖掘出的频繁项集相当庞大;简单的挖掘算法没有面向应用,不能满足用户的需求。针对这些问题,本文主要研究基于FP-Tree概要数据结构上的数据流频繁项集挖掘算法,其研究成果对顾客购物模式、网络通信的错误分析、电子商务、商业智能以及市场决策等领域具有重要的意义。 首先,本文提出一种在数据流中基于滑动窗口的挖掘频繁闭项集的算法MFCI-SW。该算法在滑动窗口所对应的FCIL中记录频繁闭项集数据项的支持度计数和窗口序列号,随着新窗口的到来,删除K值最小的数据项同时插入新窗口频繁闭项集的数据项,在模式树中通过指针剪除K值最小的数据项所对应的节点,同时插入新节点,最后完成模式树的更新。该算法能提高频繁项集挖掘的执行效率。 其次,本文提出一种在数据流中基于时间衰减模型的挖掘最大频繁项集的算法MFI-TD,该算法首先构建一种新的数据结构来存储当前窗口中的事务,并用DP指针指向最大频繁项集;并在此基础上,通过时间衰减模型来对PW-tree进行剪枝,输出当前所有的最大频繁项集。该算法与已有的DSM-MFI算法相比有较好的时间效率。 最后,本文提出一种用于获取故障知识的序列模式挖掘新算法SPM-LM,该算法为每一个事件建立一个位置矩阵记录它们在序列中的位置信息,通过两个指针对位置矩阵操作运算生成频繁K序列,提高了模式发现的效率。 本文使用现实数据集进行挖掘,通过实验对本文所提出的MFCI-SW算法、MFI-TD算法以及SPM-LM算法进行验证。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 闫莺,金澈清,曹锋,汪恒杰,周傲英;多数据流上共享窗口连接查询的降载策略[J];计算机研究与发展;2004年10期
2 王伟平;李建中;张冬冬;郭龙江;;基于滑动窗口的数据流连续J-A查询的处理方法[J];软件学报;2006年04期
3 赵峰;李庆华;;基于可信推断的流数据序列模式分析算法[J];小型微型计算机系统;2006年07期
4 曲吉林;寇纪淞;李敏强;;基于滑动窗口的数据流反向查询方法[J];计算机工程与应用;2006年30期
5 刘必雄;;基于滑动窗口查询的直方图改进[J];计算机时代;2006年09期
6 林锦贤;林钦仙;;数据流上的轮廓查询算法[J];福州大学学报(自然科学版);2007年04期
7 武珊珊;谷峪;吕雁飞;于戈;;一种数据流上截止期敏感的滑动窗口处理策略[J];计算机科学;2007年07期
8 刘文;罗守山;陈萍;;基于滑动窗口和交换加密函数解决SMP的新方案[J];计算机工程;2007年22期
9 李俊奎;王元珍;;可重写循环滑动窗口:面向高效的在线数据流处理[J];计算机科学;2007年12期
10 荣文亮;杨燕;;基于数据流频繁闭合模式的挖掘[J];计算机应用;2008年06期
11 夏英;刘婉蓉;;基于滑动窗口的关联规则增量式更新算法[J];计算机应用;2008年12期
12 宋宝燕;张衡;于洋;奚丽娜;王大玲;;基于滑动窗口的支持泛在应用的流聚类挖掘算法[J];小型微型计算机系统;2008年12期
13 张震;汪斌强;陈庶樵;周粳迪;;基于滑动窗口的资源可控流量测量算法[J];计算机工程;2010年03期
14 姚文集;高明霞;毛国君;李广奎;;基于滑动窗口的XML数据流聚类算法[J];计算机工程;2010年13期
15 李眩;;基于网络流量的实时入侵检测[J];信息安全与通信保密;2010年07期
16 云端漫步;;购物小助手,轻松帮你货比货[J];电脑爱好者;2010年22期
17 琚春华;许翀寰;;基于有序复合策略的数据流最大频繁项集挖掘[J];情报学报;2010年05期
18 付强;车文刚;;基于滑动窗口的奇异点数据挖掘算法研究[J];江西科学;2011年02期
19 抚远大将军;;自由修改,Win7窗口预览功能更好用[J];电脑迷;2011年16期
20 李龙镇,任正权;高速网络下链路层的流量控制分析[J];延边大学学报(自然科学版);2004年02期
中国重要会议论文全文数据库 前10条
1 汪罕;赵加奎;陈立军;;流和滑动窗口模型下的直径计算(英文)[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
2 杨宜东;孙志挥;周晓云;;滑动窗口中的变化检测[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
3 张龙波;李战怀;余敏;王勇;蒋芸;;面向数据流滑动窗口的随机抽样算法研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
4 沙瀛;谭建龙;;一种采用拟合曲线计算滑动窗口下数据流的最大值/最小值的方法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
5 杨兴华;于亚新;于戈;欧征宇;武珊珊;;一种数据流滑动窗口上的索引连接策略[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
6 王伟平;李建中;张冬冬;郭龙江;;数据流上基于时间滑动窗口的连接算法研究[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
7 王栩;李建中;王伟平;;基于滑动窗口的数据流压缩技术及连续查询处理方法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
8 郭兵洁;张天成;李景银;于戈;;基于时标的滑动窗口模型在数据流查询中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
9 刘鹤丹;信俊昌;王国仁;;无线传感器网络中基于比例映射过滤的滑动窗口轮廓算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
10 闫朝升;李建中;李金宝;;数据流上滑动窗口技术的研究与实现[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 魏建生;高性能重复数据检测与删除技术研究[D];华中科技大学;2012年
2 杨蓓;数据流top-K频繁模式挖掘算法研究[D];北京交通大学;2009年
3 邹先霞;事务数据流处理的若干关键技术问题研究[D];中南大学;2012年
4 孙焕良;基于空间划分的优化聚类算法及相关技术研究[D];东北大学;2005年
5 汤克明;不确定数据流中频繁数据挖掘研究[D];南京航空航天大学;2012年
6 曾剑平;基于模糊集的自适应伪装入侵检测算法及其在ASP服务安全中的应用研究[D];厦门大学;2006年
7 石荣;数字视频运动分析、对象分割与压缩传输应用技术研究[D];电子科技大学;2004年
8 秦首科;数据流上的异常检测[D];复旦大学;2006年
9 王修君;高效数据流和海量文本处理算法研究[D];中国科学技术大学;2011年
10 刘学军;数据流聚集查询和频繁模式挖掘的研究[D];东南大学;2006年
中国硕士学位论文全文数据库 前10条
1 蔡春丽;数据流挖掘中聚类算法的研究与实现[D];哈尔滨工程大学;2007年
2 施鸿喜;基于密度单元覆盖的聚类数据流算法研究[D];郑州大学;2007年
3 姜军晓;一种流数据频繁模式挖掘算法的研究与实现[D];大连理工大学;2007年
4 吕晓;一种改进的数据流突变检测算法的研究[D];哈尔滨工程大学;2009年
5 郑琼冬;数据流查询处理算法的研究[D];暨南大学;2008年
6 李俊;基于滑动窗口的数据流频繁闭合项集挖掘研究[D];暨南大学;2008年
7 贺春亮;基于数据流滑动窗口的降载技术研究[D];燕山大学;2009年
8 闫朝升;数据流联机分析处理技术的研究[D];黑龙江大学;2004年
9 刘方;基带自适应编码调制系统的设计与FPGA实现[D];华中科技大学;2008年
10 王尤慧;Online-HHT方法在时间序列数据流预测中的应用研究[D];大连理工大学;2009年
中国重要报纸全文数据库 前2条
1 李晓东;TCP整型,QoS的阳光大道?[N];计算机世界;2004年
2 中国传媒大学计算机学院 朱立谷;重复数据删除技术解析[N];中国计算机报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978