收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

一种基于延伸网格密度的数据流聚类算法

王娇  
【摘要】:随着时代的发展,信息量也在剧增。在金融服务、电子商务、股票交易、入侵检测、卫星、气象、电信通讯等具体运用中,出现大量的数据,这些数据有别于传统数据,海量而快速达到的数据,形成了数据流。在信息量丰富的同时,如何处理这些数据流并从中查询或分析出所需的有用知识,成为研究领域关注的难点和热点,由此产生了数据挖掘技术,并成为热点技术之一。聚类分析则是数据挖掘技术的重点研究方向之一,而数据流聚类方法也是基于传统聚类方法研究改进得到的。 本文将网格和密度方法相结合提出一种基于延伸网格密度的数据流聚类算法。由于基于密度的聚类算法虽可以得到各种形状的聚类结果,但是其对数据进行处理时,计算比较复杂。而基于网格的聚类算法虽然聚类质量不如基于密度的算法,但是能用简单的划分与合并网格的方法,计算方便,能对数据进行快速聚类。所以,将两者相结合可以达到较好的聚类效果。本文算法在划分网格单元时,对原始网格单元进行延伸,提出延伸网格的概念,在计算网格单元密度时,加入延伸区域的点对网格的影响度,避免了直接把网格内的数据点个数作为网格密度时所导致的数据空间中有效信息的丢失情况,从而实现对边界点的有效聚类。同时,由于人工设置密度阈值对用户要求较高,需要用户具有相关领域的背景知识,本文提出自适应的密度阈值计算方法,能够适应数据流的动态变化,从而减少用户的负担。接着本文运用滑动窗口机制,基于网格密度的连通度概念分析优化合并规则,提出改进的基于延伸网格结构的聚类初始化算法和聚类更新算法框架并加以实现。 本文针对算法更新时滑动窗口滑动步数的设置,网格划分数目,聚类质量和效率等进行了多次比较实验,实验结果表明本算法具有较好的聚类质量和较高的实时聚类效率。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵以强;张龙波;;数据流管理系统研究现状分析[J];科技信息;2010年28期
2 王金栋;张磊;丁秋林;黄添强;;一种支持分布式数据流处理的双层重叠网络模型[J];应用科学学报;2006年04期
3 安红,孟建;基于数据流处理的雷达对抗仿真框架研究[J];电子对抗技术;2004年06期
4 谢应科,张涛,韩承德;实时SAR成像系统中矩阵转置的设计和实现[J];计算机研究与发展;2003年01期
5 杜威,邹先霞;基于数据流的滑动窗口机制的研究[J];计算机工程与设计;2005年11期
6 李浪;李仁发;;基于数据流异常挖掘的入侵检测系统设计[J];科学技术与工程;2008年13期
7 羌晨晨;;数据流关键技术研究概论[J];装备制造技术;2009年11期
8 孟军;张航黎;张建英;郭禾;;分布式数据流的渐增式聚集维护算法[J];微电子学与计算机;2006年10期
9 陈磊松;;数据流处理系统的负载控制策略研究[J];漳州师范学院学报(自然科学版);2009年03期
10 魏定国;吴时霖;;数据流复杂查询处理的研究[J];计算机科学;2004年02期
11 安红;;基于数据流处理的雷达对抗仿真系统[J];现代雷达;2006年05期
12 蒋建军;王以群;;农村社会保障体系数据流关联规则挖掘[J];计算机工程;2009年17期
13 王金栋;周良;张磊;丁秋林;;基于分枝路径分析的连续查询降载算法[J];应用科学学报;2007年01期
14 胡彧;王顺平;;事务型滑动窗口下的数据流频繁模式挖掘[J];计算机工程与应用;2010年22期
15 闵思鹤,王甲池,江太辉;DS/CDMA扩频通信接收机数据流处理方案[J];通信技术;2003年06期
16 王爽;杨广明;王国仁;;分布式数据流系统通信有效性研究综述[J];微型机与应用;2007年S1期
17 李岩;王惠文;叶明;;数据流分析与技术研究[J];计算机工程与应用;2008年15期
18 张龙波,李战怀,闫剑锋;一种面向数据流处理的直方图增量维护算法[J];计算机工程;2005年14期
19 安红;王春丽;杨莉;;数字仿真技术在电子战装备性能评估中的应用[J];中国电子科学研究院学报;2006年04期
20 闫朝升;张承江;马英;;基于滑动窗口的时间序列数据流分析与预测技术研究[J];黑龙江大学自然科学学报;2006年06期
中国重要会议论文全文数据库 前10条
1 张冬冬;李建中;王伟平;郭龙江;;分布式复式数据流的处理[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 魏永超;陈立军;;数据流上复杂事件处理系统Eagle的设计与实现[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
3 蔡致远;熊方;钱卫宁;周傲英;;核合并分析及其在数据流密度估计上的应用[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
4 尹婷;李红燕;;窗口模型下数据流查询流水化执行的研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 宋宝燕;陆岩;张俊宁;;数据流上的一种适应性查询优化及调度策略[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
6 吕雁飞;武珊珊;谷峪;许嘉;于戈;;一种数据流上统计性查询QoS的保证方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
7 周锐;肖川;王国仁;韩东红;霍欢;;数据流滑动窗口连接上的卸载技术的研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
8 霍欢;王国仁;陈庆奎;彭敦陆;;基于Hole-Filler模型的XML数据流上的SLCA算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
9 武珊珊;宋宝燕;袁锋;于亚新;于戈;;数据流模型研究[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
10 陈克平;周丽华;王丽珍;陈涛;;一种带障碍的网格弥散聚类算法DCellO[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 朱小栋;基于扩展预测模型标记语言的数据流挖掘系统建模研究[D];南京航空航天大学;2009年
2 吴枫;数据流挖掘若干关键技术研究[D];国防科学技术大学;2009年
3 郭立超;数据流挖掘若干技术研究及其在电信行业的应用[D];浙江大学;2011年
4 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
5 李军;基于用户行为挖掘的数据流管理技术研究[D];北京邮电大学;2012年
6 由育阳;数据流容错挖掘算法研究[D];哈尔滨工程大学;2011年
7 王修君;高效数据流和海量文本处理算法研究[D];中国科学技术大学;2011年
8 张剑;宽带接入网流量识别关键技术研究[D];北京邮电大学;2011年
9 欧阳震诤;不平稳数据流的分类技术研究[D];国防科学技术大学;2009年
10 冯博;基于半结构化数据的数据流挖掘算法研究[D];北京邮电大学;2011年
中国硕士学位论文全文数据库 前10条
1 王娇;一种基于延伸网格密度的数据流聚类算法[D];哈尔滨工程大学;2012年
2 祝文新;一种基于活跃网格密度的数据流聚类算法[D];哈尔滨工程大学;2011年
3 王海东;基于网格方法的数据流聚类算法研究[D];西安科技大学;2012年
4 李子文;滑动窗口内基于密度网格的数据流聚类算法研究[D];辽宁工程技术大学;2010年
5 许虎寅;基于密度和网格的数据流聚类算法研究[D];西北师范大学;2012年
6 何登成;数据流上复杂序查询的研究与实现[D];浙江大学;2010年
7 周驰;数据流上概念漂移的检测和分类[D];郑州大学;2010年
8 李有生;一种改进的数据流处理算法的研究与实现[D];吉林大学;2010年
9 何江燕;基于数据流的聚类分析算法研究[D];兰州交通大学;2010年
10 李燕;面向含噪数据流的概念漂移集成分类研究[D];合肥工业大学;2011年
中国重要报纸全文数据库 前10条
1 本报记者 李涛;建气象设施让预报更准确[N];伊犁日报(汉);2008年
2 计算机世界实验室 吴挺;Intel的专业“核动力”[N];计算机世界;2007年
3 王瑾;率先实现“四个一流”[N];中国气象报;2005年
4 北京 冬梅;P4时代真的来了吗[N];中国电脑教育报;2001年
5 realrocking;精彩CG广告之网格特效揭秘[N];中国电脑教育报;2003年
6 ;需求是超前的[N];计算机世界;2003年
7 ;立体防护“中枢神经系统”[N];网络世界;2003年
8 ;NetScreen-IDP 500 高端入侵检测与防护设备[N];计算机世界;2003年
9 甘久斌;如何有效管理宽带用户[N];通信产业报;2002年
10 李勇;降低投资70%[N];中国计算机报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978