1. 引言
随着目前高光谱成像系统技术的发展,成像光谱仪采集到的数据越来越精细丰富。一方面HSI的空间分辨率和光谱分辨率越来越高,与普通的遥感图像如多光谱图像相比,HSI波段更多,光谱波段覆盖的范围更加广,蕴含的信息量更丰富,其形成的三维数据有效的结合了地物目标的空间信息和光谱信息,能够有效反映地物目标的信息,因此HSI被越来越广泛地应用在各个领域,如农业 [1]、矿物鉴定 [2]、景观分类 [3] 等领域。然而,HSI的分类常常遇到光谱变异性问题,给地物 [4] [5] 的识别带来很大困难。有几种方法被提出来解决这个问题,如光谱解混 [6] 和特征变换 [7]。几何结构是 [8] 目标识别的另一个重要因素。但实际上,HSI几乎无法检索高大物体(例如树木) [9] 下方的光谱信息。虽然不同高度的邻域对象通常会产生阴影,从而使相邻像素 [10] 的光谱特征变得模糊,但这种效果还因与给定物体相关的光谱可变性而变得更加复杂。此外,由于反射光谱主要来自地物表面,因此HSI检测垂直结构的能力受到限制。并且随着高光谱成像系统技术的进一步发展,HSI所含有的光谱信息会越来越多,越来越高维的高光谱数据也对高光谱遥感对地观测技术提出了更加复杂的要求。
激光成像探测和测距(LiDAR)数据可以提供精确的三维空间信息。激光成像技术能够实现地形高程信息的实时获取,尤其对阴影问题的求解具有重要的参考价值。与HSI相比,激光雷达获取的点云数据往往缺乏丰富的光谱信息。因此,LiDAR与高光谱遥感数据的融合可以有效地进行 [11] 互补。激光雷达和HSI融合在森林监测 [12] [13] 和城市景观分类 [11] 中得到了有效的研究。这种多源遥感数据融合不仅可以利用HSI的丰富的光谱信息,还协助解决了在HSI分类中由于利用高程信息,如点云数据生成的数字高程模型(DEM)所带来的光谱变化和阴影效应的问题。
充分利用丰富的光谱特征和空间特征是HSI和激光雷达数据融合的重要内容。好的分类通常需要有效的分类器进行特征提取或者特征挖掘来获得代表性特征。深度学习网络将特征提取和分类器训练过程嵌入到一起,在典型特征学习中被证明具有很大的潜力。许多论文已经证明了深度学习网络在高光谱遥感图像处理方面有很好的表现 [14] [15] [16]。特别是卷积神经网络(CNN)及其扩展网络可以从HSI中学习光谱信息和空间信息 [17] [18] [19]。深度学习网络可能会遇到退化问题。例如,当网络深度增加时,精度可能出现饱和,甚至降低 [16],这已经被证明既不是过拟合问题,也不是梯度消失或梯度爆炸问题。因此,何凯明在2015年提出了通过残差连接来解决退化问题。实验结果表明,深度残差网络(Deep residual network, ResNet)能够很好地解决网络退化问题。与CNN相比,光谱空间残差网络被证明能够带来更好的效果 [20] (spatial-spatial residual network, SSRN),它利用了光谱残差和空间残差两个模块,从光谱残差块和空间残差块中学习特征。由于它的残差连接,从高维光谱数据中学习多层网络特征可以很好地解决网络退化现象。因此,当有更多的激光雷达数据特征可以用于辅助HSI分类时,SSRN就能够从丰富的信息中学习到更多的高级特征。
综上所述,为了缓解HSI中阴影效应和光谱变异性问题的影响,本文利用3D-SSRN对基于HSI和激光雷达数据融合的分类进行了探索。为了降低光谱变异性的影响,本文对HSI的数据进行预处理,并在与激光雷达数据进行特征融合前进行降维。与常用的降维方法不同,本文使用了原型分析 [21] 的特征估计模型对数据进行降维处理。
2. 方法描述
为了解决HSI分类中的光谱变异性和阴影效应问题,本文利用激光雷达数据对HSI进行辅助分类。鉴于HSI的光谱波段众多,激光雷达数据回波数据多,本文使用了特征降维、不同特征融合、深度学习分类等方法。因此,下面将对这些方法按过程顺序进行介绍。
2.1. 对HSI进行基于原型分析的降维处理
针对高光谱图像数据中存在的数据冗余和光谱变异性问题,本文通过特征变换和特征选择来缓解。具体来说采用基于原型分析的特征挖掘模型(Archetypal Analysis, AA)对HSI数据进行特征选择 [22]。AA算法目标是找到原始数据
中最能描述原始数据组成部分的K个凸包 [23] [24],凸包是包含数据
的最小凸集。AA的目标函数如公式1是为了得到最优的
和
(1)
在这个公式中,约束
和约束
使特征矩阵
为观测数据的加权和,同时约束
,
要求用特征向量
的加权和逼近
。其中,M为数据样本的数量,K为N个原始特征生成的新特征的数量。
特征矩阵
代表特征转换的过程,具体来说,矩阵A中每个生成的新特征,都可以和矩阵C中的非负元素一一对应。因此,利用AA算法对高光谱数据进行特征变换后选择具有代表性的特征来实现降维。假设
为N个波段的高光谱数据,A中的K个原型特征为AA算法生成,则可以对目标函数(1)进行优化,得到最优矩阵C。生成不同数量的原型特征会保存不同百分比的信息。 可以通过分析AA算法得到的不同百分比的变化来评估K个原型特征保存了多少原始数据信息。如果当前模型保留的数据信息在可接受范围内,通过AA算法的多端元选择规则,根据索引集Ω从索引矩阵C中选取光谱,可以得到原始数据的目标波段,如公式2
(2)
2.2. HSI和激光雷达数据的预处理和特征融合
当图像中存在阴影效应时,HSI的光谱特征比较稀疏,对不同类别地物的表达能力不足,因此模型的识别分类效果有限。例如,HSI通常不能很好的对树的阴影部分和建筑物的阴影部分中的地物进行分类。此外,仅用HSI也很难将树与草、建筑物与道路的连接点分开。在这种情况下,激光雷达数据可以为反射率数据提供额外的仰角信息。因此,对HSI进行反射率特征和高程特征的融合是提高分类性能的关键。
一般情况下,激光雷达通过对同一地物目标进行多次扫描提供回波数据,回波数据提供了目标的垂直结构信息。充足的垂直结构信息被认为能够对HSI分类提供有效的帮助。在构成点云数据的多次回波数据中,第一次回波数据和最后一次回波数据对于生成目标垂直结构信息的数字高程模型具有重要作用。因此,本文利用第一次和最后一次回波产生的DEM光栅图像作为激光雷达数据的一部分特征,将其与降维后的HSI融合进行进一步识别。
2.3. 利用三维残差网络进行分类
虽然卷积神经网络可以直接从HSI和激光雷达数据融合的三维数据中提取出光谱–空间特征,但是随着网络层数的增多,卷积神经网络模型的分类精度可能会降低。ResNet有助于解决这一问题,因此本文利用了融合了卷积神经网络和三维残差结构的三维卷积光谱空间残差网络SSRN [20] 进行分类。整个三维剩余网络如图1所示。该框架采用了带有连续有监督光谱空间残差块的网络。光谱残差块和空间残差块从融合后的图像立方体中分别提取出可学习的光谱特征和空间特征,SSRN可以看作是卷积神经网络卷积层的扩展。与三维卷积神经网络相比,SSRN具有残差连接,网络结构也更深。一方面,可以通过残差连接来减少精度下降,提高分类精度。另一方面,两个连续的残差块分别学习了光谱特征和空间表示,通过它们可以提取出更多的可识别特征。
![](//html.hanspub.org/file/17-1541968x24_hanspub.png)
Figure 1. The flow chart of 3D residual network for hyperspectral image classification aided by LiDAR data
图1. 激光雷达数据协助下的高光谱图像三维残差网络分类流程图
3. 实验与分析
本文在MUUFL数据集 [25] 上进行了实验,MUUFL数据集的数据采集地点是南密西西比海湾公园校园,高度为3500英尺,空间分辨率为1米,数据大小为220 × 325像元,64个光谱波段,波长单元为2纳米,地物一共有12个类别,如表1所示。
同时,本文分析了影响训练过程时间和分类性能的多个因素,包括批量大小,空间尺寸大小,学习率。本论文还与SSRN模型进行了比较。为了验证本文激光雷达的有效性,本文测试了只包含光谱特征学习部分的数据、只包含空间特征学习部分的数据和只包含LiDAR特征学习部分的数据。
![](Images/Table_Tmp.jpg)
Table 1. The categories, quantities, and proportions of each label
表1. 各标签的类别、数量和比例
3.1. 参数设置
为了寻找最适合该模型的参数设置,我们分析对比了影响训练时间和分类性能的三个主要参数。这三个参数分别是训练数据的批量大小、卷积滤波器的空间尺寸大小和学习率。通过对不同的参数值进行测试,以找出效果最好的参数。在分析比较每个参数的过程中,保留具有最高分类性能的模型参数数值,并以此参数的数值为基础进行对下一个参数的分析。
训练数据的批量大小直接影响模型的优化程度和优化速度。因此,首先对批量大小对分类精度的影响进行分析总结,见表2。从实验结果可以看出,当批量大小由2增加到4时,分类性能出现显著增长,然后逐渐上升,在达到128时分类性能最好,当批量大小达到256的时候开始下降。当批量大小为128时,模型在MUUFL数据集上可以得到最好的分类精度。
学习率控制着每次迭代的特征学习进度,学习率设置不当会导致收敛速度变慢。实验中,本文的学
![](Images/Table_Tmp.jpg)
Table 2. Classification accuracy with different batch sizes
表2. 不同批量大小的分类精度
习率设置从0.01到0.000001来测试不同学习率对实验结果的影响,如表3所示。根据表中的结果,当学习率为0.0003时,模型在MUUFL数据集上会得到最好的分类精度。
![](Images/Table_Tmp.jpg)
Table 3. Classification accuracy with different learning rates
表3. 不同学习率的分类精度
由于深度神经网络具有卷积结构,卷积核对其在特征学习过程中的空间信息学习能力起着重要作用。因此,卷积核的大小显著影响特征学习性能。在实验中,我们将卷积滤波器的大小从3 × 3逐渐增加到11 × 11来研究卷积核大小对特征学习性能的影响。表4给出了随卷积核大小变化而变化的分类精度。根据实验结果可以总结出,与7 × 7相比,卷积核的过小和过大都会导致分类性能的变差。因此,在最终对MUUFL数据集进行分类实验时,我们将大小设为7 × 7作为卷积滤波器大小参数值,图2为图像在批处理大小为128,学习率为0.0003,卷积滤波器大小为7×7时的分类结果图。
![](Images/Table_Tmp.jpg)
Table 4. Classification accuracy with different convolution filter sizes
表4. 不同卷积核大小的分类精度
![](//html.hanspub.org/file/17-1541968x25_hanspub.png)
Figure 2. The classification result diagram of the image
图2. 分类结果图
3.2. 数据降维
从HSI中得到的光谱特征和从激光雷达数据中得到的高程特征包含着不同的特征信息。预处理使得这些不同的特征信息能够被融合。首先使用AA [21] 对原64维HSI进行波段选择从而降低数据的维度。分别保留不同数量的选择波段结果进行分类的性能如表5所示。可以看出,降维后数据的维数与分类准确率和训练时间成正比。但当数量达到40时,分类精度并没有得到明显提高。因此,根据实验的数据,本文选择了40个光谱波段,用于与激光雷达数据进行特征融合和分类。
![](Images/Table_Tmp.jpg)
Table 5. Classification performance derived by using different dimension of spectral data
表5. 利用不同维数的光谱数据得出的分类性能
3.3. 特征融合
MUUFL数据集提供了激光雷达点云数据第一次和最后一次回波的光栅图像数据(如图3(a),图4(b))。这两幅图像包含了地面的地物高程信息,通过不同的特征融合方式辅助光谱图像数据进行分类。除了将图3(a)第一次回波数据和图3(b)最后一次回波数据与40个光谱波段进行特征融合外,还对第一次回波和最后一次回波的高程信息差图像(如图3(c)所示)与40个光谱波段的特征融合进行了分类验证。如表6所示,任何激光雷达信息辅助HSI分类都有助于提高精度和降低标准差。其中,同时融合首次回波和末次回波能够获得最佳的分类精度。同时,单独的光谱数据和融合数据得到的分类图分别如图4(b),图4(c)所示,图5为有HSI生成的RGB图像和最终得到的分类图。
![](//html.hanspub.org/file/17-1541968x26_hanspub.png)
Figure 3. (a) The first return image; (b) The last return image (c) The elevation information difference image between the first return and the last return
图3. (a) 第一次回波图像;(b) 最后一次回波图像;(c) 第一次回波和最后一次回波的高程信息差图像
![](//html.hanspub.org/file/17-1541968x27_hanspub.png)
Figure 4. A classification map derived from spectral data (b) and hyperspectral fusion LiDAR data (c)
图4. 由高光谱数据(b)和高光谱融合激光雷达数据(c)得到的分类图
![](Images/Table_Tmp.jpg)
Table 6. Classification accuracy under feature fusion of 40 spectral bands and different elevation feature from LiDAR data
表6. 40个光谱波段与不同高程特征融合的激光雷达数据分类精度
![](//html.hanspub.org/file/17-1541968x28_hanspub.png)
Figure 5. (a) Display of RGB images generated by HSI; (b) Classification maps
图5. (a) 显示由HSI生成的RGB图像;(b) 分类地图
4. 结语
本文通过三维残差网络探索了利用激光雷达数据辅助HSI进行分类。同时通过对HSI进行AA降维,缓解了在HSI分类中由于光谱变异性和阴影效应可能造成的误分类。在MUUFL高光谱和激光雷达数据集上进行了分类实验。
本文是首次使用AA模型进行光谱波段选择。从实验结果可以看出,利用AA模型进行降维可以使三维残差网络对HSI的分类更加有效和精确。在此过程中去除了冗余的数据和噪声。将激光雷达数据与高光谱数据在特征层次上进一步融合后,分类结果相比较于单独的HSI再次得到提高。这意味着,在识别高光谱图像中的地物时,激光雷达数据包含的高程信息与高光谱中包含的光谱信息是互补的。结果还显示,在提供多种回波数据的情况下,使用来自第一次回波数据和最后一次回波数据比只使用单独一层回波数据能够得到更好的分类效果。在整体分类精度提高的同时,标准差也从0.3降低到0.15。这意味着可能是由于激光雷达数据有助于缓解光谱变异性问题,减少了分类精度误差的波动。虽然HSI中的一些相同地物具有不同的光谱信息,但它们的高度信息往往是相同的。同样,对于具有相同光谱的不同物体,只要它们的高程信息不同,我们就可以通过激光雷达数据进行区分。
我们所有的实验都是使用有监督光谱空间残差网络SSRN进行的。事实上,它已被证明在 [20] HSI分类中有着良好的性能。通过对HSI和激光雷达数据融合数据进行光谱空间特征学习的连续残差块,保证了该网络在处理多源遥感数据融合任务时具有更强的分类能力。
基金项目
广东省信息物理融合重点实验室(2016B030301008);国家自然科学基金(61701123);国家高分地球观测主要项目(83-Y40G33-9001-18/20);广东省农业科学与技术创新团队项目(2019KJ147);广东省科技计划项目,水资源大数据项目(2016B010127005);广东省自然科学基金项目(2018A030313195);广州市科技计划项目(201804010262)。