1. 引言
多光谱遥感影像 [1] 记录了地物对电磁波的响应信息,由于不同地物反射率 [2] 不同,使得不同地物在影像中的特征存在差异,因此可以从包含多种地物遥感信息的影像中提取探测地物。目前遥感图像地物提取方法主要是依据地物的光谱特征差异构建,包括单波段阈值法、多波段谱间关系法和指数模型法等。在提取对象上,指数模型法主要应用于特定地物的专题信息提取,包括水体 [3] [4] 、居民点、植被 [5] 、耕地等典型地物,以及特殊区域中的典型地物,包括湿地 [6] 、海岸、冰雪等。然而该方法 [7] 在实际应用中对确定特征参数和光谱模型有一定局限性,因此只有与其他方法 [8] 进行互补融合提取,其识别精度和量化能力才会进一步提高。地物波谱特征 [9] 是遥感识别地物的重要依据。因此开展各种地物波谱特征测定和研究不仅是遥感的基础性工作,同时也是遥感应用研究的重要内容。
2. 数据获取及预处理
从地理空间数据云网站分别下载秋季青海湖影像和夏季洞庭湖Landsat 8遥感影像,如下图所示。
![](//html.hanspub.org/file/26-1252049x7_hanspub.png?20230927103921953)
Figure 1. Remote sensing images of Qinghai Lake and their sample schematic diagram
图1. 青海湖遥感影像及其样本示意图
![](//html.hanspub.org/file/26-1252049x8_hanspub.png?20230927103921953)
Figure 2. Remote sensing images of Dongting Lake and their sample schematic diagram
图2. 洞庭湖遥感影像及其样本示意图
对多光谱遥感影像进行辐射定标和大气校正,得到反射率数据。对于图1青海湖的遥感影像,选取水,阴影,云,植被,陆地和建筑6种目标地物的样本,使用ROI剪裁出10,000个样本点作为样本1 (以四边形标识)的元素,6种目标地物所有的样本点就构成了样本1的整体,其中水为蓝色,陆地为黄色,云为紫色,植被为绿色,阴影为黑色,建筑为红色。为了对比分析,在青海湖影像不同区域的相同目标地物选取第二个样本集合,记为样本2 (以圆形标识),样本3则选取洞庭湖遥感影像中6种目标地物。样本选取结果及其标识如图1和图2所示。
3. 实验结果与对比分析
3.1. 分类方法简介
为了对比不同方法对目标地物的分类识别效果,采用余弦相似度、欧氏距离和曼哈顿距离三种方法对影像进行分类识别和目标提取。余弦相似度的度量方式 [9] 定义如下:
,
给定两个属性向量,A和B,其余弦相似性θ由点积和向量长度给出,定义如下所示:
,
这里的
、
分别代表向量A和B的各分量。相似性范围从−1到1:−1意味着两个向量指向的方向正好相反,1表示它们的指向完全相同,0通常表示它们之间是独立的。
假设两个n维数据点
和
,欧式距离为:
.
曼哈顿距离通常称为城市街区距离,两个n维向量
和
之间的曼哈顿距离定义为:
.
3.2. 结果分析
对于经过辐射定标和大气校正后的青海湖与洞庭湖遥感图像,采用ROI剪裁出水,阴影,云,植被,陆地,建筑6种目标地物构建样本,选择这6种地物反射率中的蓝,绿,红,近红外波段,短波近红外1,短波近红外2共6个波段构建6 × 6分类识别样本矩阵如下。其中
代表样本i的反射率平均值矩阵,
代表第i类地物,第j个波段反射率值。
为了对比相同地物在同一遥感影像不同区域以及不同遥感影像不同区域的分类识别效果,本研究选取同一地区(同一遥感影像)不同样本,即图1中的样本1和样本2;以及不同地区(分别为青海湖和洞庭湖对应的遥感影像)不同样本(即样本1和样本3)的6种目标地物展开分类识别对比实验,并分析其性能,总结其中规律并指出存在的问题。
3.2.1. 同一地区不同样本的分类识别结果分析
据图1所示,选取青海湖地区6种地物的两组不同样本集,并以样本集中像素反射率平均值构建6种目标地物的反射率曲线图,如下图3和图4所示。基于样本的反射率曲线,三种不同分类方法的分类识别效果如表1所示。
![](//html.hanspub.org/file/26-1252049x22_hanspub.png?20230927103921953)
Figure 3. Spectral curves of six target features in Sample 1
图3. 样本1的6种目标地物的波谱曲线
实验1结果表明:对于同一地区不同区域的样本1和样本2,以样本自身目标地物的反射率平均值来作为参照光谱曲线,余弦相似度,欧氏距离,曼哈顿距离都有很好的分类结果。其中曼哈顿距离的分类结果较优于余弦相似度和欧氏距离。
![](//html.hanspub.org/file/26-1252049x23_hanspub.png?20230927103921953)
Figure 4. Spectral curves of six target features in Sample 2
图4. 样本2的6种目标地物的波谱曲线
![](Images/Table_Tmp.jpg)
Table 1. Classification accuracy of samples from different regions in the same region (unit: %)
表1. 同一地区不同区域样本的分类精度(单位:%)
3.2.2. 不同地区不同样本的分类识别结果分析
同一地区不同区域目标地物的反射率有微小扰动,因此导致表1的目标地物分类存在误差;例如以实验1样本2的阴影反射率平均值作为参照光谱曲线,对比以实验1样本1阴影本身的反射率为参照光谱曲线的分类结果,分类精度在三种分类方式上均存在微小误差。那么对于不同地区的目标地物来说,是否也存在目标地物反射率的扰动对分类结果有一定的误差?为了探究这种情况,进行实验2。
据图2所示,选取洞庭湖湖地区6种地物的样本集,并以样本集中像素反射率平均值构建6种目标地物的反射率曲线图,如图5所示。基于样本的反射率曲线,三种不同分类方法的分类识别效果如表2所示。
从表2的实验结果来看,对于不同地区,以目标地物样本反射率的平均值作为参考波谱曲线,样本1的反射率平均值分类样本3与样本3的反射率平均值分类样本1在三种分类方法上分类结果均存在无法识别的情况。特别是表2中阴影和陆地的分类存在明显的识别不明。
![](//html.hanspub.org/file/26-1252049x24_hanspub.png?20230927103921953)
Figure 5. Spectral curves of six target features in Sample 3
图5. 样本3的6种目标地物的波谱曲线
![](Images/Table_Tmp.jpg)
Table 2. Classification accuracy of samples from different regions (unit: %)
表2. 不同地区样本的分类精度(单位:%)
4. 结论
如何才能取到最优的反射率平均值使得对于所有的样本点判断精度最高是分类识别的关键问题之一。基于上述实验结果,得到以下结论。
1) 首先在获取采样样本时存在取点误差。原因是在制作样本标签时,可能存在对目标地物的标识错误,导致最终的分类判断错误。例如在上述实验1表1中植被的样本1和样本2本身的反射率平均值对自身的判别精度较低。对于该误差,可以通过多次取样使其降低甚至消除。
2) 数据精度误差。对于本文采用的三种判别方法,由于所取的目标地物反射率值在0~1之间,数据值较小,且余弦相似度和欧式距离都存在数值乘法运算,这就使得数据值更小,因此可能导致分类错误。加上程序实现时存在存储精度限制,也可能造成分类结果受数据精度误差影响。
3) 相较于实验1,实验2中阴影和陆地的分类错误现象说明:即使是同种地物,不同地区存在的反射率微小差异,将对分类结果产生不可忽视的影响。如若简单以某个反射率为标准,分类结果可能会出现重大错误。例如实验2中,以青海湖样本1阴影的反射率平均值作为参照光谱曲线验证洞庭湖样本3阴影的实验正确率为零和以洞庭湖样本3阴影的反射率平均值作为参照光谱曲线测试青海湖样本1阴影的实验正确率为零。针对这种现象,可以从指数法中得到启发,通过增大地物反射率之间的差距来突出某种地物使其达到想要的分类效果。