基于深度学习和三维Gabor的高光谱图像分类方法研究
【摘要】:高光谱图像属于一种三维立方体结构,这个多维结构包含了地物光谱波段特征和地物空间分布信息。高光谱图像通过高分辨率传感器可以获取数百个波段的光谱信息,这些光谱信息对地物的分类起着非常重要的作用。高光谱图像经常用于环境监测、农业和气象预测等领域。随着高光谱图像分析技术的发展,对物体的空间和光谱像素的要求也越来越高,因此也带来了新的挑战。一方面光谱维度高容易导致“Hughes”现象;另一方面非线性的数据特征使得基于光谱信息的分类算法效果不好。为了解决这些问题,本文同时考虑空间信息和光谱信息,具体研究如下:首先,从高光谱图像的纹理信息考虑,研究如何利用纹理信息和光谱信息,有效提高地物样本分类精度。与其它滤波方法相比,Gabor滤波器在提取纹理信息方面显示出优越性能,可以同时在方向和尺度两个维度进行滤波,获取纹理特征。三维Gabor滤波器(3DGabor)是一种无监督特征提取方法,能够提取高光谱图像纹理信息同时还能较好的保留光谱信息。三维卷积神经网络(3DCNN)能够直接处理三维立方体数据,同时对图像的光谱和空间维度进行卷积,实现特征提取,从而得到深层空谱特征,相比二维卷积神经网络(2DCNN)无法兼顾光谱信息,3DCNN对特征的提取更加完善。然而随着网络层的加深会产生网络梯度扩散或者梯度爆炸的问题,因此利用残差思想对三维卷积神经网络模型进行改进,提出一种基于3DGabor的残差3DCNN的高光谱图像分类方法。使用三维Gabor滤波器对原始图像进行滤波,得到新的三维立方体,新的三维立方体数据包含图像的纹理信息以及丰富的光谱信息。把新三维立方体数据输入到加入了残差的3DCNN网络模型中,提取深层光谱-纹理特征。然后使用Softmax进行分类。本文提出的基于残差3DCNN和三维Gabor滤波器的高光谱图像分类。从分类精度上来看,本文方法和其他方法相比,无论从整体分类精度还是平均分类精度上都至少提高了2%左右。第二,单一的卷积核和固定的滑动窗口难以提取细节特征,多个不同的滑动窗口更能够完善的提取多个层次的信息,得到更丰富的特征。此外,残差学习虽然可以缓解由于网络结构过于复杂从而引起的网络退化问题,提升网络整体的训练效果。但残差模块增加了网络结构的复杂度,在提升分类精度的同时,大幅度增加了网络的训练时间,从而降低了分类的整体效率。而且残差学习需要多个池化层,会导致信息的丢失,并且网络训练所需要的参数过多,存储开销大,滑动窗口较大,每个窗口都需要存储空间来保存特征和判别类别,全连接层的参数是以指数级别递增,而全卷积网络省去池化和全连接层,减少了网络参数,从而提高运算效率。本文提出一种基于3DGabor的多尺度三维全卷积高光谱图像分类方法。首先使用3DGabor滤波器对原始数据进行处理,然后使用两种不同大小的三维卷积核对处理后的数据进行特征提取,经过不断地卷积提取出抽象特征。最后使用Softmax进行分类。实验结果表明,在分类精度上,比本文之前提出的方法相比略有提升。尤其在效率上,相比本文之前的方法在训练时间上提升了至少6%,测试上至少提升了16%,因此基于3DGabor的多尺度三维全卷积高光谱图像分类方法在保障了分类精度的同时提高了算法的运行效率。