收藏本站
《厦门大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于网格密度和空间划分树的聚类算法研究

曾东海  
【摘要】: 在数据挖掘领域中,聚类分析是一项重要的研究课题。它既可以作为一个单独的工具用以发现数据库中数据分布的深层信息,也可以作为其他数据挖掘分析算法的一个预处理步骤,因此研究如何提高聚类算法的性能具有重要的意义。 本文在分析现有聚类算法特别是基于密度的聚类算法优缺点的基础上,结合空间索引技术,提出了一种新的基于格网密度和空间划分树的聚类算法(CGDSPT);在聚类实验系统上,通过对多个样本数据集的实验结果的分析和算法的实际应用,验证了CGDSPT算法的有效性。本文的主要工作包括: 1、将现有聚类方法按照五大类进行了系统的评述,并对基于密度的几种经典算法做了详细的介绍。 2、通过对空间索引结构的综述,结合空间划分的特性,提出了一种基于空间划分的索引结构SP-Tree。SP-Tree有效地保存了数据的空间位置信息,为空间区域的邻域查询提供了极大的方便;同时它只索引非空单元格,不仅节省了存储空间还降低了算法的时间复杂性。 3、结合基于格网密度聚类算法的特性和空间索引的优点,文章提出一种基于格网密度和空间划分树的聚类算法。算法充分借助了网格和空间索引的优势,使算法的时间复杂度与数据规模近似呈现线性关系。同时该算法具有能发现任意形状的簇、对噪声数据和数据输入顺序不敏感等优良特性。 4、针对算法的参数设置问题,本文提出了一种根据样本数据的统计特性自行调整参数的方法,能有效地降低参数设置的难度,获得了较好的聚类效果。 5、针对聚类有效性评价问题,本文提出了一种基于簇密度的适合任意形状簇的聚类有效性指数,实验表明其能有效地指导用户调整参数以获得满意结果。 6、建立了一个聚类实验系统。在此系统上,利用多个样本集对本文提出的聚类算法进行详细的性能分析;将算法应用到中国分区域人口多维综合死亡模式的聚类中,并对聚类结果的区域性等特征进行了详尽分析。
【学位授予单位】:厦门大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP18;TP311.13

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 贾佳;;基于网格密度的带有层次因子的聚类算法[J];计算机技术与发展;2012年06期
中国硕士学位论文全文数据库 前6条
1 杨建红;基于密度的聚类算法研究[D];长春工业大学;2010年
2 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
3 康海源;基于密度和网格相结合的聚类算法及其在图像分割中的应用[D];中北大学;2011年
4 张艳丽;基于综合度量的划分聚类研究[D];安徽大学;2011年
5 陈毅;基于网格的并行聚类算法及数据流聚类算法研究[D];兰州大学;2010年
6 赵卓真;一种基于密度与网格的聚类方法[D];中山大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 高新波,裴继红,谢维信;模糊c-均值聚类算法中加权指数m的研究[J];电子学报;2000年04期
2 陈金山,韦岗;遗传+模糊C-均值混合聚类算法[J];电子与信息学报;2002年02期
3 周水庚,周傲英,曹晶,胡运发;一种基于密度的快速聚类算法[J];计算机研究与发展;2000年11期
4 刘勘,周晓峥,周洞汝;一种基于排序子空间的高维聚类算法及其可视化研究[J];计算机研究与发展;2003年10期
5 张明波,陆锋,申排伟,程昌秀;R树家族的演变和发展[J];计算机学报;2005年03期
6 陈宁,陈安,周龙骧;数值型和分类型混合数据的模糊K-Prototypes聚类算法(英文)[J];软件学报;2001年08期
7 陈宁,陈安,周龙骧;基于密度的增量式网格聚类算法(英文)[J];软件学报;2002年01期
8 苏中,马少平,杨强,张宏江;基于Web-Log Mining的Web文档聚类[J];软件学报;2002年01期
9 马帅,王腾蛟,唐世渭,杨冬青,高军;一种基于参考点和密度的快速聚类算法[J];软件学报;2003年06期
10 周水庚,范晔,周傲英;基于数据取样的DBSCAN算法[J];小型微型计算机系统;2000年12期
【共引文献】
中国期刊全文数据库 前10条
1 焦誉;赖建章;柯佳;;一种基于密度的网格动态聚类算法的研究[J];安徽大学学报(自然科学版);2007年01期
2 张振伟;马建琴;程瑶;;基于模糊对向传播神经网络的水库径流预报[J];安徽农业科学;2010年01期
3 郇正军;赵国富;;基于土地利用的空间数据挖掘系统的设计与实现[J];安徽农业科学;2011年07期
4 苏瑞;;基于层次的模糊K均值聚类算法研究[J];安阳师范学院学报;2010年02期
5 李玉鑑;;基于最小树切割的自适应聚类方法[J];北京工业大学学报;2007年03期
6 刘润涛;郝忠孝;;一种极小化交叠的空间索引结构——MOSI-树[J];北京工业大学学报;2010年10期
7 刘敬伟;徐美芝;;Bezdek型模糊属性C均值聚类算法[J];北京航空航天大学学报;2007年09期
8 孙殿柱;朱昌志;李延瑞;;三角网格曲面模型快速分层算法[J];北京航空航天大学学报;2010年03期
9 卢宏建;高永涛;吴顺川;潘贵豪;;石人沟铁矿露天转地下开采生产规模优化[J];北京科技大学学报;2008年09期
10 关超华;陈泳丹;陈慧岩;龚建伟;;基于改进DBSCAN算法的激光雷达车辆探测方法[J];北京理工大学学报;2010年06期
中国重要会议论文全文数据库 前10条
1 ;A Hybrid Clustering Algorithm Based on Grid Density and Rough Sets[A];第二十七届中国控制会议论文集[C];2008年
2 ;Incremental Clustering for Categorical Data Using Clustering Ensemble[A];第二十九届中国控制会议论文集[C];2010年
3 周芹;钟耳顺;黄耀欢;郭会;;大型空间数据库的并发索引策略CQR_树[A];中国测绘学会九届四次理事会暨2008年学术年会论文集[C];2008年
4 杨晓霞;朱庆;李海峰;;知识导航的遥感信息处理服务分类选择方法[A];中国测绘学会第九次全国会员代表大会暨学会成立50周年纪念大会论文集[C];2009年
5 周芹;李绍俊;李云锦;马柳青;;空间数据库引擎的关键技术及发展[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年
6 李绍俊;周芹;王尔琪;;SuperMap高性能海量空间数据管理策略[A];2009`中国地理信息产业论坛暨第二届教育论坛就业洽谈会论文集[C];2009年
7 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
8 余琳;邓玲;;常见聚类算法的比较以及DSS系统中的应用[A];湖北省通信学会、武汉通信学会2009年学术年会论文集[C];2009年
9 黄良辉;陈常青;赵婷;;一种基于模糊聚类思想的评价结果组合模型[A];2006中国控制与决策学术年会论文集[C];2006年
10 ;A Semi-supervised Clustering Algorithm Based on Rough Reduction[A];2009中国控制与决策会议论文集(3)[C];2009年
中国博士学位论文全文数据库 前10条
1 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
2 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
3 冯光升;面向认知网络的自适应QoS感知与配置方法[D];哈尔滨工程大学;2009年
4 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
5 马纯永;城域景观VRGIS一体化仿真平台研究与实现[D];中国海洋大学;2010年
6 徐红波;基于空间填充曲线高维空间查询算法研究[D];哈尔滨理工大学;2010年
7 刘润涛;基于序的空间数据索引及查询算法研究[D];哈尔滨理工大学;2009年
8 魏建香;学科交叉知识发现及其可视化研究[D];南京大学;2010年
9 李懿;面向虚拟手交互的校正技术研究[D];浙江大学;2010年
10 王强;空间信息服务聚合的关键技术研究[D];解放军信息工程大学;2010年
中国硕士学位论文全文数据库 前10条
1 范丹;Web检索中的查询扩展及结果聚类技术研究[D];辽宁师范大学;2010年
2 李振;网络舆情预测关键技术研究[D];郑州大学;2010年
3 丁金凤;基于网格与密度的数据流聚类算法研究[D];哈尔滨工程大学;2010年
4 赵慧杰;面向论坛的话题发现、跟踪及传播技术研究[D];哈尔滨工程大学;2010年
5 路瑞强;基于均值和标准差的空间索引方法研究[D];哈尔滨工程大学;2010年
6 刘振广;一种改进的k_means聚类算法研究[D];哈尔滨工程大学;2010年
7 孙丽萍;流形学习算法ISOMAP的改进与实现[D];大连理工大学;2010年
8 张进;我国施工劳动生产率管理研究[D];大连理工大学;2010年
9 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年
10 王丹丹;基于数据挖掘的煤矿瓦斯事故预测方法研究[D];辽宁工程技术大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 赵姝,张燕平,张铃,张媛,陈传明;覆盖聚类算法[J];安徽大学学报(自然科学版);2005年02期
2 李翠霞,于剑;一种模糊聚类算法归类的研究[J];北京交通大学学报;2005年02期
3 蔡颖琨,谢昆青,马修军;屏蔽了输入参数敏感性的DBSCAN改进算法[J];北京大学学报(自然科学版);2004年03期
4 邵锐,巫兆聪,钟世明;基于粗糙集的K-均值聚类算法在图像分割中的应用[J];测绘信息与工程;2005年05期
5 王宇,杨莉;模糊k-prototypes聚类算法的一种改进算法[J];大连理工大学学报;2003年06期
6 刘健庄;基于二维直方图的图象模糊聚类分割方法[J];电子学报;1992年09期
7 高新波,裴继红,谢维信;模糊c-均值聚类算法中加权指数m的研究[J];电子学报;2000年04期
8 高新波,李洁,姬红兵;基于加权模糊c均值聚类与统计检验指导的多阈值图像自动分割算法[J];电子学报;2004年04期
9 何明;冯博琴;马兆丰;傅向华;;一种基于高斯混合模型的无监督粗糙聚类方法[J];哈尔滨工业大学学报;2006年02期
10 杨彦明;陈卓;魏振钢;;基于粗糙集的群体智能文本挖掘聚类算法[J];海军航空工程学院学报;2005年02期
中国博士学位论文全文数据库 前5条
1 王莉;数据挖掘中聚类方法的研究[D];天津大学;2004年
2 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
3 孙玉芬;基于网格方法的聚类算法研究[D];华中科技大学;2006年
4 王述云;数据流频繁项挖掘与聚类分析的研究[D];复旦大学;2008年
5 何春梅;模糊神经网络的性能及其学习算法研究[D];南京理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 郭军华;数据挖掘中聚类分析的研究[D];武汉理工大学;2003年
2 赵恒;数据挖掘中分类属性数据聚类研究[D];西安电子科技大学;2003年
3 栾丽华;聚类算法研究[D];南京师范大学;2004年
4 林培俊;适用于类属性和混合属性数据的模糊聚类研究[D];汕头大学;2004年
5 严骏;模糊聚类算法应用研究[D];浙江大学;2006年
6 曾蒙福;基于自适应网格的聚类算法及在信息提取中的应用研究[D];福州大学;2006年
7 张西芝;网格聚类算法的研究[D];郑州大学;2006年
8 付渊;运用神经网络聚类方法推进构建本体的自动化[D];太原理工大学;2006年
9 王晟;模糊聚类算法的研究与实现[D];南京理工大学;2006年
10 方匡南;基于数据挖掘的分类和聚类算法研究及R语言实现[D];暨南大学;2007年
【二级引证文献】
中国期刊全文数据库 前1条
1 李力沛;;一种改进的聚类簇数目自动计算算法[J];现代计算机(专业版);2012年29期
中国博士学位论文全文数据库 前1条
1 陈伟;基于物联网的热计量关键技术研究[D];燕山大学;2013年
中国硕士学位论文全文数据库 前5条
1 任巍英;基于属性扩展图的K-means聚类算法的研究[D];中北大学;2012年
2 王丹丹;多层次序列模式挖掘及在抽油机井状态诊断中的应用研究[D];东北石油大学;2012年
3 李鑫鑫;聚类算法在电子商务客户细分中的应用研究[D];中国海洋大学;2012年
4 殷君伟;K-均值聚类算法改进及在服装生产的应用研究[D];苏州大学;2013年
5 张磊;基于云计算的网格化均值聚类算法的并行化研究[D];合肥工业大学;2013年
【二级参考文献】
中国期刊全文数据库 前4条
1 贺前华,韦岗,陆以勤;基因算法研究进展[J];电子学报;1998年10期
2 陆锋,周成虎;一种基于Hilbert排列码的GIS空间索引方法[J];计算机辅助设计与图形学学报;2001年05期
3 李强,周济;连续解空间的复合遗传算法[J];科学通报;1998年24期
4 高新波,谢维信;模糊聚类理论发展及应用的研究进展[J];科学通报;1999年21期
【相似文献】
中国期刊全文数据库 前10条
1 谢娟英;马箐;谢维信;;一种确定最佳聚类数的新算法[J];陕西师范大学学报(自然科学版);2012年01期
2 孙吉贵;刘杰;赵连宇;;聚类算法研究[J];软件学报;2008年01期
3 于慧娟;崔军;毋晓志;李伟;;一种改进的凝聚图聚类方法[J];山西煤炭管理干部学院学报;2010年03期
4 于剑,程乾生;模糊聚类方法中的最佳聚类数的搜索范围[J];中国科学E辑:技术科学;2002年02期
5 崔军;郭春艳;贾宗维;;一种连通非加权图的快速聚类方法[J];计算机工程与应用;2008年07期
6 岳清华;郑刚;;一种动态心电图波形聚类策略的研究[J];天津理工大学学报;2008年01期
7 王士同;陈晓峰;曹苏群;钟富礼;;基于力的类同传播聚类方法[J];江南大学学报(自然科学版);2009年04期
8 张逸清;刘文才;;聚类数的确定[J];计算机与数字工程;2007年02期
9 程慈;柴瑞敏;;聚类数的自动确定[J];科技信息(科学教研);2008年14期
10 刘燕驰;;基于密度的最佳聚类数确定方法[J];中国管理信息化;2011年09期
中国重要会议论文全文数据库 前9条
1 高翠芳;吴小俊;;基于二阶差分的聚类数自动确定方法[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
2 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 李浪波;傅彦;刘红;;基于范例推理的网格和密度聚类算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
4 娄冬梅;陈明;朱有娜;;一种基于密度的无参数聚类算法[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
5 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
6 程尊平;周鼎;王晨;周皓峰;汪卫;施伯乐;;SDPHC——基于密度的分割和分层的自校聚类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 张晓峰;王丽珍;陆叶;;一种基于属性加权的不确定K-means聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
8 蔡军;袁华鹏;陈金海;施伯乐;;一种基于相似性分析的聚类新算法:PDS算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
9 胡仲义;郭超;王永炎;刘胜航;王宏安;;基于时间衰减和特征变量的数据流聚类算法[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
中国博士学位论文全文数据库 前10条
1 胡雅婷;可能性聚类方法研究及应用[D];吉林大学;2012年
2 王纵虎;聚类分析优化关键技术研究[D];西安电子科技大学;2012年
3 周世兵;聚类分析中的最佳聚类数确定方法研究及应用[D];江南大学;2011年
4 冯永;基于计算智能的聚类技术及其应用研究[D];重庆大学;2006年
5 杨燕;基于计算智能的聚类组合算法研究[D];西南交通大学;2006年
6 刘晨;高伸缩性聚类分析方法研究[D];哈尔滨工程大学;2013年
7 王强;局部叠加基因表达模式聚类分析方法研究[D];哈尔滨工业大学;2012年
8 尹学松;半监督聚类分析策略设计及其拓展性研究[D];南京航空航天大学;2009年
9 白亮;聚类学习的理论分析与高效算法研究[D];山西大学;2012年
10 刘丽敏;选择性聚类融合算法研究[D];中南大学;2013年
中国硕士学位论文全文数据库 前10条
1 陈奇明;基于投票策略聚类融合算法的研究和实现[D];安徽工业大学;2010年
2 高昇;基于密度聚类算法的改进方法研究[D];大连理工大学;2007年
3 吴书;类属型数据的聚类算法研究[D];厦门大学;2007年
4 谢信喜;符号聚类新方法的研究及应用[D];江南大学;2008年
5 黄海超;基于领域知识的半监督聚类算法研究[D];北京化工大学;2009年
6 朱国红;基于特征点选择的聚类算法研究与应用[D];山东大学;2010年
7 晏寒冰;结构聚类分析方法及应用研究[D];江南大学;2014年
8 张斌;基于模糊核聚类的基因芯片数据的研究[D];燕山大学;2010年
9 盛荣芬;聚类融合算法及其在移动渠道管理中的应用[D];中南大学;2011年
10 何堃;基于聚类的用户特征分析[D];扬州大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026