收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于聚类的增量数据挖掘研究

陈峰  
【摘要】:聚类分析向来是数据挖掘研究的重要方面,基于聚类的各种数据挖掘算法的研究历来也是研究重点。但是,目前大多数的聚类分析算法只是针对于静态数据集的操作,对于动态数据集却只能采取对整个数据集重新进行聚类的方式,因此随着数据量的不断增大以及对数据集实时数据挖掘的需求不断加大,增量式数据挖掘技术正越来越引人关注。 基于聚类的增量式数据挖掘继承了已有聚类的执行成果,通过对新增数据的逐个或者批量考查,可在很大程度上避免大量的重复计算,减少了计算量,节省了系统开支,提高了效率,尤其数据量越大时,增量式的数据挖掘技术就越能体现出其优越性,也更能为有数据挖掘需求的用户提供及时、快捷、有价值的信息内容。 本文首先主要总结、探讨了关于数据挖掘以及聚类算法等方面取得的已有主要研究成果,并详细阐释了基于密度的聚类算法DBSCAN的主要思想、算法流程,并给出了实例以演示算法。在此基础上,提出了基于DBSCAN的增量式聚类算法Incremental DBSCAN,由于Incremental DBSCAN采用了逐个考察新增数据的处理方式,为了达到更好的运行效率,进一步提出了Incremental DBSCAN的批量处理算法。 最后,通过实验验证了DBSCAN与Incremental DBSCAN在聚类效果上的一致性,以及Incremental DBSCAN在大数据量环境下更加卓越的性能。


知网文化
【相似文献】
中国重要会议论文全文数据库 前5条
1 张德辉;唐世渭;杨冬青;马秀莉;姜力争;;一种在OLAP中保持聚类挖掘结果的有效方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 方运涛;董显威;;基于灰关联度的Gry-K-Means算法研究及其应用[A];中国计量协会冶金分会2009年年会论文集[C];2009年
3 李国徽;黄蕾;;数据流环境下的基于加权网格的聚类算法研究[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
4 冯变玲;杨世民;尤海生;蓝夏璐;魏芬;;基于数据挖掘技术的心脑血管用药不良反应与药品品种间聚类分析[A];2010年中国药学大会暨第十届中国药师周论文集[C];2010年
5 魏顺平;;教育数据挖掘:现状与趋势[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
中国博士学位论文全文数据库 前6条
1 熊文;基于群智的特征选择、分类与聚类挖掘的研究[D];北京邮电大学;2010年
2 刘兵;时间序列与聚类挖掘相关技术研究[D];复旦大学;2006年
3 李锋;面向数据挖掘的隐私保护方法研究[D];上海交通大学;2008年
4 张红亮;氧化铝回转窑火焰图像识别、检索与聚类研究[D];中南大学;2008年
5 曹锋;数据流聚类分析算法[D];复旦大学;2006年
6 徐雪琪;基于统计视角的数据挖掘研究[D];浙江工商大学;2007年
中国硕士学位论文全文数据库 前10条
1 陈峰;基于聚类的增量数据挖掘研究[D];大连海事大学;2007年
2 刘章雄;异构数据源集成及聚类挖掘的研究与应用[D];重庆邮电大学;2010年
3 宋爱琪;GML时空聚类挖掘研究[D];江西理工大学;2011年
4 徐一凤;隐私保护聚类挖掘方法的研究[D];哈尔滨工程大学;2010年
5 姜东明;基于聚类挖掘的视频摘要生成研究[D];浙江大学;2010年
6 葛继科;偏差抽样技术在聚类挖掘中的应用[D];西南农业大学;2005年
7 周东滨;流数据聚类挖掘算法研究[D];吉林大学;2006年
8 夏勇;聚类分析和离群点识别技术研究及其应用[D];哈尔滨工程大学;2008年
9 莫乐群;基于聚类和协议分析的入侵检测系统的研究与设计[D];暨南大学;2006年
10 王瑞杰;基于数据挖掘的自适应入侵检测[D];浙江大学;2006年
中国重要报纸全文数据库 前1条
1 本报记者 蒋水林;细分与整合[N];人民邮电;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978