收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于PDStream的增量聚类算法研究

舒月  
【摘要】:聚类分析是数据流挖掘中非常活跃的研究领域,它根据最大化类内相似性和最小化类间相似性的原则,把相似的对象聚在一起而把相异的对象分离。目前已经提出许多聚类算法来发现不同领域中的聚类模式,但很多聚类算法在聚类请求到来时,都是重新开始对整个数据空间的进行聚类,这就提高了算法的时间复杂度,不能很好的适应实时数据流的高速流动和实时响应用户要求的特点。在实时数据流中,数据流的高速流动及其数据量巨大等特点,要求数据流挖掘算法具有比较快的处理速度和实时响应用户的需求。 为了利用已有聚类结果加快聚类速度,提高聚类效率,本文在基于衰减窗口与维度树的实时数据流聚类算法(PDStream)的基础上,提出了一种基于网格和密度维度树的增量式聚类算法(IGDStream)。该算法能够利用前一次聚类的结果,结合当前到达的数据流进行聚类。这种增量聚类是利用密度维度树存储的聚类结果,通过网格的密度更新密度维度树来实现的。该方法避免重新对整个数据流进行处理,以提高挖掘算法的效率。 通过多个数据集的实验表明,本研究所提出的实时数据流增量聚类算法算法能够在噪声干扰下发现数据流中任意形状的聚类,并改善了算法的聚类能力。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孙小林,卢正鼎;基于反洗钱应用的一种有效的增量聚类算法[J];华中科技大学学报(自然科学版);2004年11期
2 牟廉明,黄国兴;一种基于自适应膨胀因子的聚类新方法[J];计算机工程;2003年09期
3 张锡琴;;多数据流的增量聚类实现与应用[J];计算机工程;2009年14期
4 王春才;杨华民;张彩虹;郭威;韩贵东;;一种适用于数据仓库环境的增量聚类方法[J];河北大学学报(自然科学版);2010年02期
5 黄永平,邹力鹍;数据仓库中基于密度的批量增量聚类算法[J];计算机工程与应用;2004年29期
6 徐新华;谢永红;;增量聚类综述及增量DBSCAN聚类算法研究[J];北华航天工业学院学报;2006年02期
7 夏胜平;吕小军;刘建军;袁振涛;郁文贤;;基于集群的并行分布式聚类及其应用(英文)[J];郑州大学学报(理学版);2006年04期
8 孟海东;王淑玲;郝永宽;;动态增量聚类的设计与实现[J];计算机工程与应用;2009年24期
9 郝晓青;;一种基于启发式的密度和网格的增量聚类算法[J];机电信息;2009年36期
10 丁一;付弦;;基于核心树的增量聚类算法研究[J];湖北师范学院学报(自然科学版);2011年02期
11 吴琪,左万利;一种基于距离的增量聚类算法[J];湖南工程学院学报(自然科学版);2005年03期
12 吴琪;高滢;王晓涛;左万利;;一种基于距离的增量聚类算法[J];解放军理工大学学报(自然科学版);2005年06期
13 滕明贵;熊范纶;吴正龙;;一种对二维空间对象进行聚类的算法[J];模式识别与人工智能;2005年03期
14 吴楠;;通过增量聚类预处理分区的一种序列模式挖掘方法[J];宿州学院学报;2008年02期
15 易宝林;伍仪强;丰大洋;张小莉;;基于DBSCAN的批量更新聚类算法[J];计算机工程;2009年02期
16 李桃迎;陈燕;秦胜君;李楠;;增量聚类算法综述[J];科学技术与工程;2010年35期
17 王丹;张兆心;宋颖慧;;基于高权重词集的增量聚类算法研究[J];微计算机信息;2011年02期
18 朱红灿;唐毅;;一种基于动态SOM的增量中文文本聚类方法[J];图书情报工作;2007年06期
19 钟灵;章云;郑日荣;曾启杰;;光学检测窗口布置的增量式聚类算法的研究[J];计算机应用;2009年01期
20 谢静;苏一丹;;基于人工免疫增量的聚类算法[J];大众科技;2010年12期
中国重要会议论文全文数据库 前10条
1 龚海军;何婷婷;瞿国忠;张勇;胡文敏;;热点事件发现[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
2 陈克平;周丽华;王丽珍;陈涛;;一种带障碍的网格弥散聚类算法DCellO[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
3 谢静;苏一丹;;基于人工免疫的增量聚类算法[A];广西计算机学会2009年年会论文集[C];2009年
4 彭楠赟;王厚峰;凌晨添;;基于层次聚类的网络新闻热点发现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 吴祥应;季飞;赖声礼;;FDTD法局部网格细化技术边界场源等效模型及实现[A];1997年全国微波会议论文集(上册)[C];1997年
6 祝西里;王长清;;近场对人体作用的计算问题[A];1993年全国微波会议论文集(下册)[C];1993年
7 陈田国;李平辉;;一种节省内存的总场边界条件及其在散射计算中的应用[A];全国电磁兼容学术会议论文集[C];2006年
8 陈明;柯涛;丁大志;樊振宏;陈如山;;电磁散射问题中的等级基二重网格法[A];2007年全国微波毫米波会议论文集(上册)[C];2007年
9 王东东;林振庭;;薄梁板问题HRK和RK无网格法的频散特性比较分析[A];中国计算力学大会'2010(CCCM2010)暨第八届南方计算力学学术会议(SCCM8)论文集[C];2010年
10 陈田国;李平辉;;电波反射和折射的动态呈现及在CAE中的应用[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 张强;聚类算法的维度分析[D];天津大学;2007年
2 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
3 谢宏威;印刷电路板焊点智能检测算法的研究[D];华南理工大学;2011年
4 吕宗磊;对聚类及聚类评价若干问题的研究[D];南京航空航天大学;2009年
5 刘铭;大规模文档聚类中若干关键问题的研究[D];哈尔滨工业大学;2010年
6 阮启明;面向区域目标的成像侦察卫星调度问题研究[D];国防科学技术大学;2006年
7 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
8 张剑;宽带接入网流量识别关键技术研究[D];北京邮电大学;2011年
9 屠莉;流数据的频繁项挖掘及聚类的关键技术研究[D];南京航空航天大学;2009年
10 强彦;数据库负载自适应技术研究[D];太原理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 舒月;一种基于PDStream的增量聚类算法研究[D];武汉科技大学;2013年
2 童忆莹;基于增量聚类和ReliefF的特征选择方法[D];西南大学;2011年
3 董银松;基于监测信号加权特征的批量钻削工步质量增量聚类研究[D];湘潭大学;2011年
4 阳建平;聚类算法在入侵检测中的应用[D];电子科技大学;2009年
5 刘强;基于Web使用挖掘的个性化推荐系统研究与设计[D];燕山大学;2006年
6 张园园;基于聚类的入侵检测算法研究与实现[D];吉林大学;2009年
7 崔静燕;基于不规则网格及子空间降维的聚类算法研究[D];燕山大学;2012年
8 孟德;基于增量聚类的手机病毒挖掘技术的研究与实现[D];北京邮电大学;2013年
9 盛江涛;网络论坛话题发现与跟踪技术研究[D];哈尔滨工业大学;2010年
10 李子文;滑动窗口内基于密度网格的数据流聚类算法研究[D];辽宁工程技术大学;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978