收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

流数据聚类挖掘算法研究

周东滨  
【摘要】:流数据是一组顺序、大量、快速、连续到达的数据序列,一般情况下,数据流可被视为一个随时间延续而无限增长的动态数据集合。流数据分析在数据挖掘领域中的重要性日益凸显,其中流数据聚类已经逐渐发展成为一个重要的研究热点。 本文针对双层流数据聚类算法框架进行了深入的研究,主要包括以下内容: 1,深入地研究了在线层算法对数据的表达方式。提出新的数据结构“格簇”来解决在线层算法中数据仅能根据临时分布状态确定所属聚类,从而导致算法精度受损的问题。提出新的数据结构“N-维球簇”,能够有效地解决流数据基于密度聚类的问题。 2,提出一种基于Agent方法的双层流数据聚类算法,在较低的时间开销下能够得到质量较高的聚类结果。算法对初始化数据不敏感,不需要切割数据流,保持了全局信息的完整性。算法同时支持数据流上的时间窗口分析。 3,提出一种基于密度的流数据聚类算法,能够有效地解决数据空间中存在不规则分布密集区域的聚类问题,实验结果表明该算法能够有效地标识空间中的不规则形状簇。 4,开发出一套聚类挖掘工具软件,集数据生成,数据分布可视化,可重用聚类算法模块为一体,应用设计良好的开放式架构,用于缩短新算法的研发周期。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 方义秋;杨曦;;基于滑动窗口的车辆计数和位置预测[J];微计算机信息;2008年18期
2 单劲松;;一种基于层次聚类的流数据挖掘方法[J];太原师范学院学报(自然科学版);2008年04期
3 刘云生;邓华锋;代一尘;马抄武;;存储特定流数据的通用框架[J];华中科技大学学报(自然科学版);2005年S1期
4 聂国梁;卢正鼎;;流数据实时近似求和的算法研究[J];小型微型计算机系统;2005年10期
5 葛君伟;刘婷;袁正午;;基于中间件的RTK移动定位[J];测绘通报;2007年12期
6 袁正午;程宇翔;梁均军;李林;;基于流立方体的数据流频繁模式挖掘算法[J];计算机工程;2010年22期
7 杨颖;陈德华;;基于小波神经网络的时间序列流数据的研究[J];计算机技术与发展;2006年06期
8 刘威;;基于流数据的分布式主动入侵检测算法[J];武汉理工大学学报;2009年05期
9 高自娟;朱玉全;陈耿;;基于变尺度滑动窗口的流数据聚类算法[J];计算机应用研究;2011年02期
10 刘丽;一个在数据流上快速建立决策树的算法[J];连云港职业技术学院学报;2005年02期
11 刘赏;黄亚楼;倪维健;;流数据聚类模型变化检测策略[J];计算机工程与应用;2006年05期
12 李子杰;郑诚;;流数据和传统数据存储及管理方法比较研究[J];计算机技术与发展;2009年04期
13 蔡妮明;王翰虎;陈梅;;一种基于滑动窗口的流数据聚类算法[J];计算机技术与发展;2011年01期
14 金澈清,钱卫宁,周傲英;流数据分析与管理综述[J];软件学报;2004年08期
15 黄树成,刘丽;数据流上挖掘决策树的关键技术研究[J];常州工学院学报;2005年05期
16 富春岩;葛茂松;刘艳玲;;小波方法在数据流中的应用[J];佳木斯大学学报(自然科学版);2006年03期
17 刘佳;张芳;刘国华;刘琳;;基于流数据技术的信息监测系统的研究与设计[J];计算机工程;2007年05期
18 冯卫兵;李战怀;;流数据的连续查询优化技术[J];计算机应用研究;2008年01期
19 杨颖;杨磊;;分布式流数据频繁项发现算法的研究[J];计算机应用;2008年01期
20 夏英;甘红梅;;基于空间数据与流数据集成管理的交通实时监控系统设计与实现[J];数字通信;2009年01期
中国重要会议论文全文数据库 前1条
1 何星星;谢伙生;;流数据中一种高效剪枝的频繁序列挖掘算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 刘建伟;流数据查询系统结构及模式查询算法的研究[D];东华大学;2005年
2 秦首科;数据流上的异常检测[D];复旦大学;2006年
3 陈筠翰;车载网络的若干关键技术研究[D];吉林大学;2014年
4 王喆;商务数据中的关联和聚类算法研究[D];吉林大学;2005年
5 李卫民;流数据查询算法若干关键技术研究[D];东华大学;2008年
6 聂国梁;流数据统计算法研究[D];华中科技大学;2006年
7 尚璇;面向发布的序列类数据隐私保护技术研究[D];浙江大学;2012年
8 贾彩燕;关联规则挖掘的取样复杂性分析[D];中国科学院研究生院(计算技术研究所);2004年
9 屠莉;流数据的频繁项挖掘及聚类的关键技术研究[D];南京航空航天大学;2009年
10 倪萍;流数据挖掘关键技术研究[D];北京邮电大学;2010年
中国硕士学位论文全文数据库 前10条
1 贾立峰;流数据中频繁模式挖掘算法的研究[D];吉林大学;2006年
2 周东滨;流数据聚类挖掘算法研究[D];吉林大学;2006年
3 马兰云;流数据异常挖掘算法研究[D];北京交通大学;2007年
4 贾嘉;基于频繁模式的数据挖掘算法分析与改进[D];太原理工大学;2007年
5 楚红涛;基于数据流双层结构聚类挖掘的研究[D];华北电力大学(河北);2008年
6 徐隽;基于流数据特性的垃圾邮件过滤技术研究[D];复旦大学;2009年
7 王立锟;基于滑动窗口的流数据聚类挖掘研究[D];西南交通大学;2009年
8 袁福宇;流数据环境下不确定性入侵检测框架[D];吉林大学;2007年
9 刘杨;基于.Net的装备管理系统的设计和实现[D];北京交通大学;2007年
10 刘秋兰;基于流数据挖掘的网络行为分析及其应用研究[D];苏州大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978