基于多分类器组合的高光谱遥感数据分类技术研究
【摘要】:
遥感技术产生于20世纪后半叶,经过几十年的发展,无论在理论、技术上均取得重大进展。高光谱遥感技术的出现是遥感领域的一项重大突破。高光谱影像在保留较高空间分辨率同时,光谱分辨率有极大的提高,这使得无论在描述同类地物的细节方面,还是识别不同类别地物的能力等方面都有大幅提高。高光谱数据最早应用于地质领域,1988年以后成功应用于生态、大气科学、农林业等领域。高光谱遥感数据有更多的波段,更高的波谱分辨率,使高光谱数据有更广泛的应用前景。
从高光谱遥感影像中提取信息的方法一般可分为两类:基于特征空间和基于光谱空间。基于特征空间的分类方法不需要对影像做精确的大气校正,但由于高光谱遥感数据波段数多,在分类过程中会导致维数灾难和Hughes现象,常用的解决方法是增大训练区样本数量或对高维数据进行降维处理,前者需要大量的训练区样本数据,这就需要投入更多的人力物力,因而在使用中受到一定限制;后者会造成部分信息丢失;且基于特征空间的分类方法难以解决混合像元分解的问题,使高光谱遥感数据不能得到充分的利用。基于光谱空间的分类方法在高光谱遥感数据中得到较成功的应用。光谱匹配技术是高光谱遥感影像分类方法中较为成熟的一类,它通过比较像元光谱与参考光谱的相似度对影像进行分类,不需要大量训练区样本数据,但需要影像做精确的大气校正。这类方法的研究基础是进行匹配的光谱都定标到表观反射率,辐射仪的暗电流和程辐射的影响都已经去除。但这只是理想情况,实际研究中要完全去除暗电流和程辐射的影响是非常困难的,尤其当目标物反射率较低时,用光谱匹配技术来提取低反射率地物时会产生较大误差。文中针对两类方法的优缺点,进行了提高高光谱遥感影像分类精度的研究,一是提高单分类器的分类精度,这方面所做的工作是对影像进行较精确的大气校正和对端元光谱提取方法进行改进;二是对多分类器进行组合提高分类精确度,主要研究成果如下:
1、定量遥感需要对遥感影像进行大气校正,在大气校正过程中,去除邻近效应的影响是一个比较重要的环节。对邻近效应的移除依赖于对影响邻近效应的主要因子及影响机制的认识。文中利用MODTRAN模型对不同对比度目标物在不同条件下的邻近效应进行模拟,得出能见度对邻近效应的影响最大,其次是卫星天顶角,太阳高度角对邻近效应的影响最小;在能见度较高时,辐射率变化百分率曲线形状接近背景反射率曲线,但这种情况在能见度较低时并没有出现。在能见度较高时,随着波长增加,辐射率变化百分率逐渐减小,但在能见度较低时,这种关系没有出现。表明随着能见度减小,其对邻近效应的影响也呈现复杂化。文中研究了影响邻近效应的主要因子及影响机制,为消除邻近效应的影响提供了理论依据。
2、文中对高光谱遥感影像的大气校正方法进行了综述,用ATCOR2、ATCOR3和FLAASH大气校正模块对高光谱遥感影像进行大气校正,并对校正效果进行了比较,得出三种方法校正后光谱基本一致,FLAASH模块对光谱进行平滑处理,校正效果略好。由于研究区地形复杂,地面高程差值较大,ATCOR3模块未取得较好的校正效果。
3、较成熟的基于光谱空间的分类方法有SAM、SFF、MTMF等。基于光谱匹配的方法首先需要采集端元光谱,而后将端元光谱与像元光谱匹配进行信息提取。端元光谱通常通过三类方法获取:实验室光谱、野外采集光谱、从影像上直接获取。从影像上直接获取端元光谱简单易行,又可避免实验室与野外采集光谱与像元光谱匹配时存在的大气及尺度效应的影响,使用较为广泛,PPI方法是一种较常用的从影像上获取端元光谱方法。
4、文中对高维数据的空间特征进行了详细的阐述,随着维数增加,超立方体的体积集中在拐角和表壳,对角线几乎与所有坐标轴正交。随着维数增加,会出现维数灾难和Hughes现象,使分类所需样本数急剧增加。然而,随着维数增加,低维线性投影有正态分布或混合正态分布的趋势,这说明,高维数据进行降维处理后,用基于空间特征方法进行分类是可行的。
5、遥感可以快速有效地监测大面积植被的种类、特性、长势等各类信息。高光谱遥感数据因其特有的高光谱分辨率特性使其在植被生态环境领域具有极大的应用潜力。植被信息作为生态环境评价的重要参数对区域生态环境的监测和建设具有重要的意义。文中基于云南省鹤庆县北衙的高光谱遥感数据用SAM方法对植被信息进行提取,参考光谱使用ASD光谱辐射仪在当地采集的植被光谱曲线。研究中对影响光谱辐射仪采集的主要因素采取了相应的措施,并对光谱曲线分类及参考光谱曲线的选取进行了研究。将选取出的参考光谱曲线与大气校正后的遥感影像进行SAM匹配提取出植被信息,经过与实地调查资料比较并计算总体精度和kappa系数,计算结果达到预期精度。
6、植被光谱中可见光部分的吸收谷主要由叶绿素强烈吸收引起,不同植被覆盖度下光谱吸收谷的深度和形状不同,因而可以通过比较光谱吸收谷的深度和形状来提取植被覆盖度。文中采用基于光谱吸收特征匹配的光谱特征拟合SFF方法从高光谱遥感影像中提取植被覆盖度,参考光谱采用ASD光谱仪在影像覆盖地区采集的植被光谱,通过将参考光谱与像元光谱连续统去除处理后进行SFF匹配,完成植被覆盖度的提取,最后生成植被覆盖度图。研究结果与植被指数、光谱夹角映射方法及实际调查资料之间存在较高一致性。
7、光谱匹配方法已成功应用于高光谱影像分类,但由于大气影响,这种方法从高光谱影像上提取低反射率地物信息较为困难。文中提出一种基于光谱聚类的低反射率地物信息提取方法,首先用PPI技术从影像中采集端元光谱,并计算影像像元光谱与所有端元光谱的光谱夹角,将像元归属于与端元光谱夹角最小的一类;然后用K-Mean对端元光谱进行聚类;最后根据聚类结果将同类端元光谱对应的类进行合并处理并将分类结果投影输出。将结果与原始影像及实地调查资料进行比较,二者基本一致。这种方法人工干预少,提取结果较为客观,可以作为一种高光谱遥感影像非监督分类方法。
8、在模式识别分类系统中,最终的目标是得到尽可能好的分类识别性能。为了实现这一目标,传统的做法是对于目标问题分别采用不同的分类方法处理,然后选择一个最好的分类器为最终的解决方案。但随着目标复杂度的增加以及新的算法的开发,人们发现尽管各分类器性能有所差异,但被不同分类器错分的样本并不完全重合。即对于某个分类器错分的样本,用其它分类器有可能得到正确的类别标签,即不同分类器对于分类的模式有着互补信息。如果只选择性能最优的分类器作为最终的解决方案,那么其它分类器中一些有价值的信息就被丢弃了。伴随着分类模式识别问题日益复杂,人们开始尝试研究不同分类器的分类互补信息是否能被充分利用,进而提出了组合分类的思想。针对各种高光谱影像分类方法的优缺点,文中提出了一种基于决策树的多分类器组合方法,并将这种方法应用于高光谱遥感影像岩体信息提取。研究区为云南省中甸县格咱乡普朗斑岩型铜金矿区,该区含矿岩性多为闪长玢岩,研究中利用高光谱遥感影像对该区闪长玢岩体进行提取。首先用SAM、SFF和MTMF三种匹配滤波方法进行信息提取,为提高单个分类器的分类精度,研究中对影像进行了较精确的大气校正并提出一种利用多尺度切割与地质图结合的端元光谱提取方法,首先将多尺度切割区域与地质图相交,而后对相交的区域用PPI方法提取端元光谱,这种方法提取出的端元光谱较纯;然后用基于决策树的多分类器组合方案对三种方法提取的结果进行组合,并生成组合分类器提取结果;最后,将多分类器组合方法及单个分类器提取结果与地质图进行比较,得出多分类器组合结果明显优于单个分类器。SAM、SFF和MTMF三种匹配滤波方法对比,SFF对混合像元的分解能力较好。
针对现有的高光谱影像分类方法,为提高分类精度,研究中进行了两方面的尝试,一方面提高单分类器方法的分类精度,另一方面是对多分类器进行组合提高分类精确度。前者研究中采用的方法是对影像进行较精确的大气校正和采集较纯的端元光谱,文中对多种大气校正的方法进行了综述,并对几种常见的大气校正模块进行了对比,并提出一种用多尺度切割与地质图结合的端元光谱提取方法,这种方法可以得到较纯的端元光谱。后者研究中尝试了基于光谱聚类的低反射率地物信息提取方法和基于决策树的多个分类器组合方法,结果与实地调查及地质资料比较,得出这种两种多分类器组合方法是有效的。