深度学习在遥感影像目标检测和地表覆盖分类中的应用研究
【摘要】:随着航空航天技术和传感器技术的发展,遥感技术正在进入一个能够快速准确地提供多种对地观测海量数据及广泛应用研究的新阶段,人们对高分辨率遥感影像的需求日益增加,并且对高分辨率遥感影像的应用的广度和数据处理的精度提出了更高的要求。目标检测和地表覆盖分类作为遥感数据信息提取的两大关键任务,是遥感应用的基础。然而,遥感数据源的多样化和遥感应用的深入化和综合化发展给这两项任务带来了空前的挑战,现有技术理论需要有一个大的突破才能满足发展的需求。目前的高分辨率遥感影像目标检测和地表覆盖分类方法存在精度不高、效率偏低等问题。传统的目标检测方法面对复杂环境和多源数据时,不能提出好的解决方法。常见的地表覆盖分类方法针对高分辨率影像综合型地类分类问题提出了面向对象的分类方法,但技术还不成熟,分类结果无法满足高精度的需要。这些问题导致高分辨率遥感影像的应用进程受阻,其优势不能充分体现。为了提高高分辨率遥感影像的应用价值,本文展开了基于深度学习的目标检测和地表覆盖分类的相关研究。影响目标检测精度和效率的关键因素在于对目标的特征提取和检测模型的构建,即对目标特征的学习深度和特征匹配的准确度。为了提高目标检测的精度和效率,文本采用深度学习方法,构建了两级级联卷积深度网络的目标检测架构,首级过滤场景,次级目标检测。采用迁移学习方法,有效缩短训练时间,利用目标在遥感影像上稳定的几何特征形态,在提高检测效率的基础上有效降低误检率。高分辨率遥感影像分类的难点在于需要考虑面向对象的分类方法,而非像素级别的分类。针对高分辨率遥感影像分类中综合型地类分类结果零碎、错分和漏分现象严重等问题,本文构建了基于深度学习的面向对象的语义级分类方法。构建了基于全卷积神经网络的分类框架,采用迁移学习方法用少量样本优化分类模型,实现高精度的面向对象的分类。另外,针对单极化合成孔径雷达(Synthetic Aperture Radar,SAR)影像分类精度低的问题,采用图像融合的方法增加光谱信息,提高地类信息量,从而提高分类精度。同时引入了条件随机场方法,对分类后的地类边界进行优化,取得了较好的分类结果。论文的主要工作可以概括为以下几点:(1)对遥感影像目标检测和地表覆盖分类方法的研究现状和发展趋势进行了研究,结合传统研究方法中存在的问题和深度学习在图像理解领域的强大动力,提出了使用深度学习方法进行高分辨率遥感影像目标检测和地表覆盖分类的方案。(2)详细阐述了深度学习的理论基础,对深度学习的原理、方法、模型等做了研究,为遥感影像目标检测、光学遥感影像地表覆盖分类、SAR影像分类提供了理解基础和技术依据。其中重点研究了卷积神经网络(Convolutional Neural Network,CNN)网络的图像分类功能,区域卷积神经网络(Regions with Convolutional Neural Network,R-CNN),Fast R-CNN和Faster R-CNN的目标检测功能,以及全卷积神经网络(Fully Convolutional Neural Network,FCN)的图像分割功能。(3)研究了现有目标检测方法存在的问题,提出了使用既有深度学习模型进行目标检测的弊端。针对这些问题,设计了一套基于深度学习的快速大面积遥感影像飞机检测方法。利用迁移学习原理,建立了高分辨率光学遥感影像飞机样本库,用少量样本数据训练出高精度的遥感影像目标检测模型。充分考虑遥感影像上飞机的几何特征,提出了一种基于几何特征约束的候选框生成算法,有效提高了候选框处理效率。最后,提出基于二级级联卷积神经网络的快速遥感影像目标检测方法。该方法克服了现有深度学习方法在遥感影像目标检测中的缺点,而且解决了弱监督学习用少量样本不能提取目标充分特征的问题,提高了检测效率和精度。(4)围绕高空间分辨率光学遥感影像的分类问题提出了基于深度学习框架下的FCN分类方法。首先,介绍了常用的遥感影像监督分类方法,指出了各种方法存在的缺点,针对高分辨率影像面向对象分类方法中存在的问题,提出了基于FCN的高分辨率遥感影像分类方法。其次,构建了基于FCN分类方法的整体架构,详细介绍了该方法的分类流程,重点研究了样本的制作、模型的训练以及网络参数的设置等。最后,选取了 ZY-3、Worldview2和Google Earth三组高分辨率遥感影像进行了分类实验。并使用了 SVM分类方法和最大似然分类方法做了对比。(5)针对SAR影像在成像机理和影像特性等方面和光学遥感影像有着完全不同的表现形式和理解方式等问题,从信息融合的角度出发,提出了基于Shearlet变换和脉冲耦合神经网络(Pulse Coupled Neural Network,PCNN)的SAR与多光谱影像融合方法,有效提高融合影像的空间信息和光谱信息保有量。设计了基于FCN的SAR融合后影像分类框架和分类方法。通过对少量训练样本学习,提取丰富的深层次影像特征图,提高了单极化SAR影像的分类精度。使用条件随机场模型对分类结果调整,有效优化了地类边界。使用TerraSAR-X 3米分辨率的HH单极化影像与Landsat5-TM多光谱影像和Worldview2多光谱影像进行融合和分类实验。