收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于有效维选择的子空间聚类算法研究

刘之岗  
【摘要】:在数据挖掘领域中,子空间聚类是一个重要的研究方向,它在众多领域有着广泛的应用。传统的聚类算法直接在原始数据空间进行聚类,但是由于原始空间数据的稀疏性,直接进行聚类不能获得理想的聚类结果。针对上述问题,本文重点研究基于有效空间寻找的子空间聚类算法和基于临界网格检测的数据流子空间聚类算法。 首先,分析了子空间聚类算法的要求,接下来分析了数据降维的方法,最后分析了经典的子空间聚类算法,包括自顶向下的聚类方法和自底向上的聚类方法,并指出算法的优缺点。 其次,针对基于网格的算法在识别簇的过程中,把簇的边界网格当作稀疏网格舍弃的问题,提出了基于有效空间寻找的子空间聚类算法。算法首先根据相对熵来得到有效维;然后采用自底向上的方法来寻找有效空间,在这个过程中除了使用簇标准的单调性剪枝以外,还使用了基于无向连通图的剪枝方法;最后在有效空间上使用基于密度的聚类算法来识别簇。 再次,针对网格划分不当导致多个簇被误识别为一个簇的问题,提出基于临界网格检测的数据流子空间聚类算法。算法由在线阶段和离线阶段组成。在线阶段,算法首先根据相对熵得到有效维;然后根据有效维之间的相关性和位向量来生成子空间;最后将数据投影到网格并更新网格特征向量。离线阶段,当有聚类请求的时候,自适应地计算网格密集阈值,并通过计算中心度和吸引度来对临界网格进行识别,生成聚类结果。 最后,对本文提出的算法采用java语言编程实现,采用真实数据集和合成数据集对算法的聚类质量和可伸缩性进行验证,并对实验结果进行了分析和比较。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈慧萍;王煜;王建东;;子空间聚类算法的研究新进展[J];计算机仿真;2007年03期
2 刘书香,卢才武,张志霞;数据挖掘中的客户聚类分析及其算法实现[J];信息技术;2004年01期
3 李霞;徐树维;;子空间聚类改进算法研究综述[J];计算机仿真;2010年05期
4 刘建晔;李芳;;一种基于密度的高性能增量聚类算法[J];计算机工程;2006年21期
5 何虎翼;姚莉秀;沈红斌;杨杰;;一种新的子空间聚类算法[J];上海交通大学学报;2007年05期
6 付淇;李正凡;;基于CLIQUE的聚类算法研究[J];华东交通大学学报;2006年05期
7 邓庚盛;刘承启;熊艳;;基于网格和密度的CLIQUE聚类算法的研究与实现[J];计算机与现代化;2008年12期
8 张强;吴腾飞;杨颖;;基于候选对象裁剪的密度子空间聚类[J];天津大学学报;2010年07期
9 沈立新;陈燕;崔春雷;王军;李玖晖;;基于网格的聚类算法的虚拟物流企业伙伴选择方法研究[J];计算机科学;2005年08期
10 张强;赵政;;基于概率分布和形态学的快速聚类算法[J];天津大学学报;2006年09期
11 曹晓莉;江朝元;甘思源;;基于聚类支持向量机的船用污水处理装置故障诊断[J];计算机应用;2008年10期
12 周炎涛;易兴东;吴正国;;基于网格的带有参考参数的聚类算法[J];计算机工程;2008年09期
13 赖建章;倪志伟;刘志伟;;一种基于密度树的网格快速聚类算法的研究[J];计算机工程;2006年17期
14 周炎涛;吴正国;易兴东;;基于网格带有参考参数的扩展聚类算法[J];湖南大学学报(自然科学版);2009年02期
15 郑吉;苗夺谦;王睿智;钟才明;;一种基于粗糙集理论的谱聚类算法[J];计算机科学;2009年05期
16 施培蓓;郭玉堂;胡玉娟;俞骏;;初始化独立的谱聚类算法[J];计算机工程与应用;2010年25期
17 曲建华;马英红;;改进的蚂蚁聚类算法[J];计算机应用研究;2010年09期
18 许剑峰,林嘉宜,黎绍发;一种基于中心对称性的聚类算法[J];计算机工程与设计;2003年05期
19 李晓莉,陈雪;基于模式识别聚类思想的PON ODN规划设计[J];光通信技术;2003年12期
20 张彩虹,王春才,颜雁;医保决策支持系统中的聚类算法[J];长春理工大学学报;2004年04期
中国重要会议论文全文数据库 前10条
1 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
3 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
4 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
5 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
6 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 邓敏;刘启亮;李光强;程涛;;一种基于场模型的空间聚类算法[A];现代测量技术与地理信息系统科技创新及产业发展研讨会论文集[C];2009年
8 庄传志;张道强;;多视角判别聚类算法[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
9 逯波;王国仁;;一种有效的半监督视频镜头聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
10 刘强;林世平;;基于蚁群聚类算法的中文本体学习[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
中国博士学位论文全文数据库 前10条
1 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
2 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
3 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
4 郭军;典型群的几何学在组合与设计理论中的应用[D];大连理工大学;2010年
5 金文梁;三维复子空间中的量子搜索和多相位匹配研究[D];西南交通大学;2011年
6 叶镇清;自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用[D];浙江大学;2008年
7 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
8 钟红恩;复杂大系统的分散控制理论与应用研究[D];西北工业大学;2003年
9 黄磊;快速子空间估计方法研究及其在阵列信号处理中的应用[D];西安电子科技大学;2005年
10 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘之岗;基于有效维选择的子空间聚类算法研究[D];燕山大学;2012年
2 卜德云;自适应谱聚类算法的研究与应用[D];南京航空航天大学;2010年
3 石洪竺;量子进化聚类算法研究[D];西安电子科技大学;2010年
4 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
5 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
6 叶冲轶;高维海量数据联合聚类算法的研究与应用[D];浙江工商大学;2010年
7 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
8 王帆;基于优化目标可调控的免疫聚类算法的研究[D];太原理工大学;2010年
9 李长进;基于蚁群算法的混合聚类算法研究[D];中国石油大学;2010年
10 武彩丽;基于规范切和分水岭的聚类算法研究[D];西安电子科技大学;2010年
中国重要报纸全文数据库 前10条
1 刘洁 李艳燕 郭韦钰 丁连红 时鹏;中国知识网格[N];中国计算机报;2004年
2 李乐永;家居时尚引领新潮[N];商务时报;2008年
3 本报记者 刘虎;构建青少年的“心灵氧吧”[N];保定日报;2005年
4 ;视频数据中挖“宝”[N];计算机世界;2002年
5 王文郁 周金丹;沈阳:春节“饱餐”精神盛宴[N];中国消费者报;2003年
6 本报记者 毕武英;艺术北京2007的忧喜四日[N];中国证券报;2007年
7 刘小萍;广东油画何日走出“熊市”[N];中国文化报;2008年
8 本报记者  赖歆;求职慎防“黑中介”[N];自贡日报;2006年
9 褚瑶;“空中别墅”受宠[N];浙江日报;2006年
10 本报记者 任良春;南京保险业开始勒经销商皮带[N];中国汽车报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978