收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

数据流挖掘中聚类算法的研究与实现

蔡春丽  
【摘要】: 聚类分析是数据挖掘领域一项重要的研究课题。近年来,由于计算机及应用技术的高速发展,人们获取数据的能力得到了极大的提高。数据流(dataStream)作为一种重要的数据来源,也得到了人们越来越多的关注。如WEB点击流、气象观测信息流、电话记录信息流等。与传统的待处理数据相比,这些数据是高速的、连续的、动态的、变化的、无限的,对它们的访问只能是顺序的、一次或有限次的,对它们的存储也只能是动态的、概要的。数据流的这些特性,给数据流的挖掘带来了极大的困难,也给数据流的聚类算法提出了更高的要求。 近年来人们提出了很多聚类算法来处理数据流,并取得了一定的成果。本文首先介绍了数据挖掘的相关算法及技术,然后给出了数据流挖掘的特点,并对已有的数据流聚类成果进行了详细的研究分析,找出了各自的优点和不足。针对这些不足,本文提出了一种新的基于密度的聚类算法-Sdstream算法,来处理进化数据流。Sdstream算法引入了滑动窗口技术,采取了动态剪枝策略,不仅能发现任意形状任意数目的聚类,而且能处理噪声,减少内存开销,并能对数据流历史信息进行查询分析,是一种高效的聚类算法。 基于真实数据集和仿真数据集的实验表明,算法具有良好的实用性、有效性和可扩展性,适合处理和分析大规模的进化数据流。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王少娟;郑丽英;祁凤林;;数据流挖掘研究[J];科技信息(科学教研);2008年21期
2 吴应清;;浅论数据流挖掘[J];办公自动化;2011年08期
3 孙晓华;;数据流挖掘技术研究[J];应用能源技术;2007年03期
4 高爱华;陈静;刘正林;;基于数据流的数据挖掘研究[J];商场现代化;2008年14期
5 孟彩霞;;一种面向数据流的频繁项集挖掘算法[J];昆明理工大学学报(理工版);2009年05期
6 孟彩霞;;面向数据流的频繁项集挖掘研究[J];计算机工程与应用;2010年24期
7 倪志伟,黄玲,李锋刚,忻凌;数据流管理与挖掘研究[J];合肥工业大学学报(自然科学版);2005年09期
8 陆亿红;;基于聚类的数据流挖掘技术的分析与研究[J];浙江工业大学学报;2007年03期
9 王秀坤;王铁存;周国能;冯维;;挖掘数据流近似频繁项的改进算法[J];计算机工程与应用;2008年13期
10 庄波;刘希玉;隆坤;;TWCT-Stream:数据流上的频繁模式挖掘算法[J];计算机工程与应用;2009年20期
11 史金成;胡学钢;;数据流挖掘研究[J];计算机技术与发展;2007年11期
12 王大将;孙洁;;数据流挖掘技术研究[J];统计与决策;2010年07期
13 马瑞民;王小龙;;数据流管理和挖掘技术探析[J];计算机应用研究;2006年08期
14 罗莎;朱威;王培源;邹彤;郭唐永;;网络数据流分析方法[J];大地测量与地球动力学;2011年S1期
15 黄崇争;李海峰;陈红;;数据流上近似非可导项集的挖掘算法[J];计算机学报;2010年08期
16 王春霞;;基于Web数据挖掘的资源服务系统[J];郑州轻工业学院学报(自然科学版);2010年06期
17 孟彩霞;;面向数据流的频繁模式挖掘研究[J];计算机应用研究;2009年11期
18 王树广;;分布式数据流上的连续异常检测[J];微电子学与计算机;2008年09期
19 仵雪婷;周明建;;数据流挖掘方法研究[J];计算机与现代化;2010年04期
20 王春霞;;基于Web数据流挖掘的资源服务实现[J];工矿自动化;2010年10期
中国重要会议论文全文数据库 前2条
1 史金成;胡学钢;;基于约束的数据流聚类研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
2 王树广;;分布式数据流上的连续异常检测[A];2008年全国开放式分布与并行计算机学术会议论文集(上册)[C];2008年
中国博士学位论文全文数据库 前7条
1 崇志宏;基于屏蔽/汇总技术的数据流处理算法[D];复旦大学;2006年
2 孔英会;数据流技术及其在电力信息处理中的应用研究[D];华北电力大学(河北);2009年
3 袁志坚;数据流突发检测若干关键技术研究[D];国防科学技术大学;2008年
4 尹志武;数据流挖掘若干问题的研究[D];上海交通大学;2007年
5 敖富江;数据流频繁模式挖掘关键算法及其仿真应用研究[D];国防科学技术大学;2008年
6 孙焕良;基于空间划分的优化聚类算法及相关技术研究[D];东北大学;2005年
7 毛伊敏;数据流频繁模式挖掘关键算法及其应用研究[D];中南大学;2011年
中国硕士学位论文全文数据库 前10条
1 郑学双;数据流中频繁项集挖掘研究[D];北京交通大学;2007年
2 史金成;基于相关性的数据流聚类及其应用研究[D];合肥工业大学;2007年
3 王磊;数据流频繁项集挖掘研究[D];南京航空航天大学;2008年
4 安静;数据流挖掘技术及应用研究[D];华北电力大学(河北);2008年
5 郑盈盈;移动网络聚类分析及其在数据流管理中的应用研究[D];合肥工业大学;2009年
6 张小彬;数据流中频繁项集挖掘算法及其应用研究[D];五邑大学;2009年
7 李俊;基于滑动窗口的数据流频繁闭合项集挖掘研究[D];暨南大学;2008年
8 陈崇超;基于EP的数据流分类算法研究[D];郑州大学;2007年
9 段跃兰;数据流闭合频繁模式挖掘算法的研究[D];哈尔滨工程大学;2009年
10 曾伟;基于衰减窗口与剪枝维度树的实时数据流聚类研究[D];武汉科技大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978