收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于空间分区的空间聚类研究

黄明  
【摘要】:空间聚类方法是空间数据挖掘技术的一个重要组成部分,空间聚类是将空间数据集中的空间对象按照一定的规则和方法聚合成多个数据簇(类)的过程。空间聚类在空间数据库分析领域中有广泛地应用。空间聚类算法作为一种重要的空间数据挖掘方法在地理信息系统、遥感影像处理等领域有着广泛的应用。常被用以图像识别、模式获取、统计趋势分析等方面。 传统的空间聚类方法在处理大规模空间数据集时,由于无法将数据集一次性装入内存,在以数据对象之间距离计算的邻域查询方式下,算法需要重复扫描存储于磁盘中的数据对象,这必将导致大量的I/O开销,严重地影响了算法的效率。若要有效地提高算法的执行效率,需要采取合适的方法降低聚类算法所处理空间数据集的规模,以最小的I/O代价获得正确的聚类结果。数据分区是一种行之有效的方法,采用数据分区技术,使得算法可以将数据分区读入内存进行聚类运算,大大提升了算法的效率。由于数据分区的目的是为了将数据装入内存进行运算,所以采用数据分区的聚类算法需要确定分区的数据量、大小和位置,并且需要对各分区聚类结果进行精确的合并。 格网划分结构是一种使用平行于各数据轴的若干条分割线对数据空间进行划分而得到的划分结构,格网划分结构可以将数据空间划分成多个均匀或者不均匀的子数据空间,并且能够方便地表征这些子数据空间的大小和位置。通过这种划分结构,可以使数据分区聚类的处理更加方便和直接。本文结合空间分区技术,针对大数据量空间数据集的空间聚类运算,提出了一种基于格网划分的动态数据分区的方法,结合本文提出的一种基于数据邻域关系等价可逆原理的邻域单向查询计算方法,以基于密度的空间聚类思想为基础,设计并实现了基于动态数据分区聚类的空间聚类算法,该算法以格网技术对数据空间进行划分,并且通过逐级读取网格单元集合的方式实现动态数据分区聚类。实验证明,该算法能够适应大数据量空间数据集中的聚类运算,具有可靠的聚类质量和高效的运算性能。 针对在高维空间数据集以及过小粒度的数据空间格网划分所产生大量的空数据网格单元,从而导致网格单元查询效率的低下的问题,本文结合四叉树分区技术,提出一种以提高网格单元搜索性能为目标的网格搜索索引树QG-Tree,该索引结构以四叉树分区的方式将格网空间划分成一棵层次树,其中包含根节点、中间结点和叶子结点等结点类型。索引树中每个结点都对应一个分区中非空单元的最小包含范围,这种索引方式能够有效地降低格网的存储消耗,并且能够极大地提高网格单元的查询性能。文中给出了QG-Tree的定义以及构建和网格查询算法。 在研究基于密度的聚类算法和基于网格的聚类算法的优缺点的基础上,本文结合数据分区聚类思想,提出一种基于网格密度的聚类算法,该算法的重点是通过计算得到密集网格单元,本文以包含至少一个核心聚类对象的网格来定义密集网格单元,采用基于密度聚类的思想,通过不完全的数据邻域查询方法获取全部密集网格单元,并在数据邻域查询运算的同时合并密集网格单元并扩展聚类。由于这种方法只需对部分数据执行邻域查询运算而得到聚类结果,因而可以有效减少算法的计算量,达到提高算法效率的目的,算法同时采用QG-Tree建立格网索引结构,提高了网格单元的查询性能。实验证明,该算法具有较高的空间聚类性能。 论文中对空间聚类技术在地理信息系统中的应用进行了研究和分析,并以集成空间聚类模块的土地利用分析系统进行了实证分析。 最后,本文对研究内容做出总结,并对后续研究进行了探讨和展望。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孔娟;周长伦;姜家轩;王春梅;许自国;;空间聚类算法在数字化城市管理中的应用[J];信息技术与信息化;2008年02期
2 马程;;空间聚类研究[J];计算机技术与发展;2009年04期
3 柳盛;吉根林;;空间聚类技术研究综述[J];南京师范大学学报(工程技术版);2010年02期
4 刘庆清;邓羽;张文婷;;基于模糊推理的空间聚类方法研究[J];测绘信息与工程;2010年04期
5 殷俊华;李光强;陈翼;邓敏;;基于概念格的空间聚类方法[J];计算机系统应用;2011年06期
6 郑燕玲;;一种基于信息熵的空间聚类算法[J];微电子学与计算机;2011年08期
7 孙宇清;赵锐;姚青;史斌;刘佳;;一种基于网格的障碍约束下空间聚类算法[J];山东大学学报(工学版);2006年03期
8 孟妮娜,周校东;固定格网划分的空间索引的实现技术[J];北京测绘;2003年01期
9 黄添强;王金栋;张磊;;空间数据挖掘研究的进展[J];莆田学院学报;2006年05期
10 武文波;张自宾;金卓;;空间数据挖掘技术及应用[J];水资源与水工程学报;2008年06期
11 赵波,边馥苓,潘蜀健,陈琳,陈德豪;人工神经元网络在空间数据挖掘与知识发现中的应用研究[J];系统工程;2004年09期
12 史玉峰;王艳;;基于自组织神经网络的城市功能分区研究[J];计算机工程;2006年18期
13 张瑞菊,陶华学;基于模糊神经网络的空间数据挖掘方法研究[J];山东科技大学学报(自然科学版);2003年04期
14 杨树亮;毕硕本;Nkunzimana A;黄铜;万蕾;;一种出租车载客轨迹空间聚类方法[J];计算机工程与应用;2018年14期
15 王生生,刘大有,曹斌,刘杰;一种高维空间数据的子空间聚类算法[J];计算机应用;2005年11期
16 刘宇,曲波,朱仲英,施颂椒;空间数据挖掘理论与方法的研究[J];微型电脑应用;2000年08期
17 陈裕雄;;大数据下的空间数据挖掘及应用分析[J];通讯世界;2017年21期
18 邱云飞;费博雯;刘大千;;基于概率模型的重叠子空间聚类算法[J];模式识别与人工智能;2017年07期
19 马黎;;基于大数据的空间数据挖掘探究[J];襄阳职业技术学院学报;2017年06期
20 李雪;;基于大数据的空间数据挖掘研究[J];数字技术与应用;2016年12期
中国重要会议论文全文数据库 前10条
1 彭冶红;王军;熊辉;;地球空间数据挖掘与知识发现[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(上册)[C];2004年
2 罗欣;;全球等面积四叉树离散格网建模与网边变形分析[A];中国地质学会2013年学术年会论文摘要汇编——S07第六届全国地质制图与地理信息学术交流会分会场[C];2013年
3 肖予钦;张巨;陈荦;景宁;;空间数据挖掘的索引和数据访问方法研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
4 邢丽平;左维;;全球离散格网在月球三维可视化中的应用[A];第十届全国月球科学与比较行星学陨石学与天体化学学术研讨会会议论文集[C];2012年
5 范林峰;胡瑞林;周顺江;王珊珊;张小艳;;地质灾害危险性评价因子对格网大小的敏感性与误差分析[A];中国科学院地质与地球物理研究所2012年度(第12届)学术论文汇编——工程地质与水资源研究室[C];2013年
6 刘启亮;邓敏;彭东亮;徐震;;基于场论的空间聚类有效性评价方法研究[A];2009`中国地理信息产业论坛暨第二届教育论坛就业洽谈会论文集[C];2009年
7 王涛;雷蓉;;规则高程格网中完整性谷地线的提取[A];第四届海峡两岸GIS发展研讨会暨中国GIS协会第十届年会论文集[C];2006年
8 孙艳青;张海燕;王颖;;基于GIS的城市空间数据挖掘系统设计与实现[A];2012中国环境科学学会学术年会论文集(第二卷)[C];2012年
9 王涛;;从规则高程格网中基于索引提取等高线[A];中国地理信息系统协会第九届年会论文集[C];2005年
10 冯钧;陆佳民;朱跃龙;卢阳;;面向城市路网管理的空间索引结构研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
中国博士学位论文全文数据库 前10条
1 黄明;基于空间分区的空间聚类研究[D];武汉大学;2010年
2 傅明;基于Web的空间数据挖掘研究[D];中南大学;2004年
3 李新运;城市空间数据挖掘方法与应用研究[D];山东科技大学;2004年
4 张志兵;空间数据挖掘关键技术研究[D];华中科技大学;2004年
5 王占全;基于地理信息系统空间数据挖掘若干关键技术的研究[D];浙江大学;2005年
6 孙海滨;定性空间推理及其应用技术研究[D];吉林大学;2006年
7 樊明辉;空间数据挖掘及其可视化系统若干关键技术研究[D];中国科学院研究生院(遥感应用研究所);2006年
8 叶蔚冬;基于适应性的城市格网设计研究[D];东南大学;2015年
9 王剑亭;面向量子密钥分发安全性分析的子空间聚类算法研究[D];中国科学技术大学;2015年
10 方兆宝;基于空间数据挖掘的MCSs时空演变规律研究[D];中国矿业大学(北京);2004年
中国硕士学位论文全文数据库 前10条
1 刘勇;基于空间数据挖掘的热门景点及线路推荐研究[D];华中师范大学;2017年
2 束传伶;基于空间聚类的数据挖掘技术在公共设施选址中的应用研究[D];合肥工业大学;2010年
3 李志建;空间数据挖掘原型系统开发及其应用研究[D];中国地质大学(北京);2009年
4 王艳;城市空间数据挖掘方法与应用研究[D];山东师范大学;2004年
5 崔莹;多源地质空间数据挖掘方法及应用[D];电子科技大学;2011年
6 胡红光;空间数据挖掘中的聚类分析研究[D];西安建筑科技大学;2015年
7 钟宇;面向网络自媒体的空间数据挖掘研究[D];江西理工大学;2018年
8 刘林;基于云理论的空间数据挖掘技术研究[D];西安电子科技大学;2008年
9 边磊;空间数据挖掘及其不确定性研究[D];辽宁工程技术大学;2010年
10 杨杨;基于约束的空间聚类的研究[D];天津大学;2007年
中国重要报纸全文数据库 前10条
1 中国出版传媒商报记者 山鹿;科学社推出空间数据挖掘里程碑著作[N];中国出版传媒商报;2015年
2 王锐 白玲 龙波 马德涛;何为空间数据挖掘[N];中国测绘报;2007年
3 中国科学院计算技术研究所 刘毅勇 何雄 李金山 廖浩均 孟亮 邓柱中;空间数据挖掘:变数据为知识[N];计算机世界;2005年
4 文嘉;智能数字格网成为未来生态系统的基础[N];人民邮电;2017年
5 记者 过国忠 实习生 章涛 通讯员 李传根;我自主生态格网技术给力环太湖路大堤[N];科技日报;2010年
6 记者 张梦然;最大规模婴儿微生物组数据集建立[N];科技日报;2018年
7 记者 张梦然;癌症学研究公布最新数据集[N];科技日报;2018年
8 记者 王莉英;行政审批网上全流程办理率年底超80%[N];深圳特区报;2017年
9 记者 金昶 通讯员 陈斯音;我国发布首款全球海洋Argo网格数据集产品[N];中国海洋报;2017年
10 中国青年报·中青在线记者 谢宛霏;为AI领域“造血”[N];中国青年报;2017年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978