收藏本站
《兰州大学》 2015年
收藏 | 手机打开
二维码
手机客户端打开本文

基于密度和约束的数据流聚类算法研究

陈坚  
【摘要】:作为数据挖掘的一个新领域,数据流聚类有着很重要的研究意义。已有的数据流聚类算法大都是无监督的学习方法。但是很多数据流都蕴涵先验知识。这些先验知识对聚类的结果提出了要求,使其必须满足某种条件或者不能违背某种规则。这种要求就是所谓的约束条件。如果能利用好这些约束条件,就能构造出性能优异的半监督数据流聚类算法。本文在详细分析数据流特征和约束条件性质的基础上,开展了数据流上的约束聚类的研究。文章结构如下:首先,深入学习了现有的数据流聚类算法,分析了其核心理论和技术,总结了各种算法的优缺点。其次,对基于约束条件的传统聚类算法进行了阐述,包括这些算法的思想和具体执行过程,分析如何用约束条件改进已有的聚类算法。然后,提出了一种可以处理实例级约束条件的数据流聚类算法——C-DDStream.该算法属于基于密度的数据流聚类算法,使用数据流聚类两阶段框架,将聚类过程分为在线和离线两个部分。在线部分使用衰减窗口模型,借鉴约束条件将数据流中海量的数据对象生成微蔟,并将实例级的约束扩展到微蔟级;离线部分利用微蔟级约束指导聚类过程,以微蔟为聚类单位,寻找密度连通区域以产生聚类结果。最后在开源机器学习框架MOA上实现了C.DDStream算法,并通过实验测试,验证算法的正确性和有效性。结果表明,C.DDStream通过约束关系的使用,提升了数据流聚类的质量。
【学位授予单位】:兰州大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13

【参考文献】
中国期刊全文数据库 前1条
1 沈越泓,益晓新,徐发强,李兴国;模糊聚类和模糊模式识别技术在通信设备抗干扰性能评估系统中的应用[J];电子科学学刊;2000年02期
【共引文献】
中国期刊全文数据库 前10条
1 姜园,张朝阳,仇佩亮,周东方;用于数据挖掘的聚类算法[J];电子与信息学报;2005年04期
2 张栒;游中胜;汤兴华;孙凡;;对计算机实验环节不规范描述的识别与编改[J];编辑学报;2013年03期
3 丘威;;大规模分布数据的分阶段非线性聚类方法应用研究[J];电脑知识与技术;2013年34期
4 廖国琼;吴凌琴;万常选;;基于概率衰减窗口模型的不确定数据流频繁模式挖掘[J];计算机研究与发展;2012年05期
5 肖丹萍;叶东毅;;基于免疫原理的不确定数据流聚类算法[J];模式识别与人工智能;2012年05期
6 潘丽娜;王治和;党辉;;基于关联函数的数据流聚类算法[J];计算机应用;2013年01期
7 于翔;印桂生;许宪东;王建伟;;一种基于区域划分的数据流子空间聚类方法[J];计算机研究与发展;2014年01期
8 朱娟芳;霍欢;徐亚;奚金金;彭敦陆;高丽萍;;一种基于滑动窗口的不确定数据流聚类算法[J];信息技术;2013年04期
9 陈爱东;刘国华;费凡;周宇;万小妹;貟慧;;满足均匀分布的不确定数据关联规则挖掘算法[J];计算机研究与发展;2013年S1期
10 胡德敏;余星;;一种不确定数据流子空间聚类算法[J];计算机应用研究;2014年09期
中国博士学位论文全文数据库 前9条
1 陈红梅;不确定性数据的分类研究[D];云南大学;2012年
2 曾华;随机顾客和需求的配送优化[D];山东大学;2012年
3 姚远;海量动态数据流分类方法研究[D];大连理工大学;2013年
4 周勇;基于并行计算的数据流处理方法研究[D];大连理工大学;2013年
5 陈伟;基于物联网的热计量关键技术研究[D];燕山大学;2013年
6 吴迪;基于加权相似度的序列聚类算法研究[D];燕山大学;2014年
7 李春山;面向社会化媒体内容的若干聚类算法研究[D];哈尔滨工业大学;2014年
8 梁春泉;不确定数据流分类算法研究[D];西北农林科技大学;2014年
9 曹振丽;面向养殖环境监测的数据流处理方法研究[D];中国农业大学;2015年
【二级参考文献】
中国期刊全文数据库 前6条
1 傅崇伦;利用WSEIAC模型进行通信系统效能评估[J];电子科技大学学报;1996年01期
2 陈守煜,姜冶;水资源系统多目标规划分层模糊优选原理[J];大连理工大学学报;1991年01期
3 郝国才,冯珊;社会发展现状综合评价决策支持系统研究[J];决策与决策支持系统;1996年03期
4 田建国,朱孔来,黄赐玺,李琳;企业活力测试与评价的数学模型[J];决策与决策支持系统;1996年03期
5 徐穆洵;通信抗人为有意干扰性能评估[J];军事通信技术;1996年04期
6 王战军,赵瑜,林梦泉,王战军;中国普通高等学校研究生院评估指标体系的研究[J];学位与研究生教育;1996年04期
【相似文献】
中国期刊全文数据库 前10条
1 葛磊;武芳;王鹏波;张冬林;;3维建筑综合中基于最小特征的面平移算法[J];测绘科学技术学报;2009年02期
2 骆雯,孙延明,陈振威,陈锦昌;判断点与封闭多边形相对关系的改进算法[J];机械;1999年03期
3 李林;卢显良;;一种基于切割映射的规则冲突消除算法[J];电子学报;2008年02期
4 刘巧玲;张红英;林茂松;;一种简单快速的图像去雾算法[J];计算机应用与软件;2013年07期
5 林亚平,杨小林;快速概率分析进化算法及其性能研究[J];电子学报;2001年02期
6 章郡锋;吴晓红;黄晓强;何小海;;基于暗原色先验去雾的改进算法[J];电视技术;2013年23期
7 杨铁军;靳婷;;一种动态整周模糊值求解算法及其仿真分析[J];系统工程与电子技术;2007年01期
8 周秀玲;郭平;陈宝维;王静;;几种计算超体积算法的比较研究[J];计算机工程;2011年03期
9 吴一戎,胡东辉,彭海良;Chirp Scaling SAR成象算法及其实现[J];电子科学学刊;1995年03期
10 王贵竹;一种产生单向分解值的算法[J];安徽大学学报(自然科学版);2001年03期
中国重要会议论文全文数据库 前10条
1 尹冀锋;;一种新的图象自适应增强算法[A];四川省通信学会一九九二年学术年会论文集[C];1992年
2 宁春平;田家玮;郭延辉;王影;张英涛;郑桂霞;刘研;;计算机辅助增强、分割算法在鉴别乳腺良、恶性肿块中的应用价值[A];中华医学会第十次全国超声医学学术会议论文汇编[C];2009年
3 谢丽聪;;SVB查询改写算法的改进[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
4 郑存红;;复杂背景下相关跟踪算法研究及DSP实现[A];中国光学学会2010年光学大会论文集[C];2010年
5 杨文杰;吴军;;RFID抗冲突算法研究[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年
6 高山;毕笃彦;魏娜;;一种基于UPF的小目标TBD算法[A];第十四届全国图象图形学学术会议论文集[C];2008年
7 周磊;张卫华;王晓奇;张军;;基于流水算法的智能路障机器人设计[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
8 潘巍;李战怀;陈群;索博;李卫榜;;面向MapReduce的非对称分片复制连接算法优化技术研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
9 李伟伟;蔡康颖;郑新;王文成;;3D模型中重复结构的多尺度快速检测算法[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
10 杨任尔;陈恳;励金祥;;基于棱边方向检测的运动自适应去隔行算法[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
中国重要报纸全文数据库 前1条
1 国泰君安资产管理部;“算法交易”是道指暴跌罪魁祸首?[N];上海证券报;2010年
中国博士学位论文全文数据库 前10条
1 冯辉;网络化的并行与分布式优化算法研究及应用[D];复旦大学;2013年
2 许玉杰;云计算环境下海量数据的并行聚类算法研究[D];大连海事大学;2014年
3 李琰;基于猫群算法的高光谱遥感森林类型识别研究[D];东北林业大学;2015年
4 陈加顺;海洋环境下聚类算法的研究[D];南京航空航天大学;2014年
5 张冬丽;人工蜂群算法的改进及相关应用研究[D];燕山大学;2014年
6 徐悦竹;机会发现算法及其应用研究[D];哈尔滨工程大学;2010年
7 王征;分布式互斥算法的研究与实现[D];电子科技大学;2007年
8 王艳娇;人工蜂群算法的研究与应用[D];哈尔滨工程大学;2013年
9 杨世品;P系统优化算法及应用研究[D];浙江大学;2013年
10 张毅;群智能算法的改进及其在相关领域中的应用[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 姚鑫宇;EMD去噪与MUSIC算法在DOA估计中的联合应用[D];昆明理工大学;2015年
2 陆进;面向含噪数据聚类相关算法的研究[D];复旦大学;2014年
3 李家昌;基于能量约束的超声图像自动分割算法[D];华南理工大学;2015年
4 陈坚;基于密度和约束的数据流聚类算法研究[D];兰州大学;2015年
5 高健;基于Zynq7000平台的去雾算法研究及实现[D];南京理工大学;2015年
6 顾磊;基于Hadoop的聚类算法的数据优化及其应用研究[D];南京信息工程大学;2015年
7 杨燕霞;基于Hadoop平台的并行关联规则挖掘算法研究[D];四川师范大学;2015年
8 王羽;基于MapReduce的社区发现算法的设计与实现[D];南京理工大学;2015年
9 许振佳;流式数据的并行聚类算法研究[D];曲阜师范大学;2015年
10 董琴;人工蜂群算法的改进与应用[D];大连海事大学;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026