1. 引言
地球大气中的各类降水过程在地球系统中水、能量和物质等循环中扮演着重要的角色,不同尺度和强度的降水活动也会对人类活动以及社会经济发展有着一定程度的影响。我国华南地区属于东亚季风区,具有显著降水季节性差异,且在近年来气候变化影响下极端降水灾害频发,对当地气象综合防灾减灾提出了严峻的挑战。因此不断发展的降水观测和预报技术在农林业、交通运输和海洋监测等社会公共服务领域始终是不可或缺的需求 [1] [2] 。对于降雨活动频繁的华南地区,尤其是人口密集的城市地区,及时准确的对降水活动的发生、发展和消停进行即时监测有着非常重要的社会经济价值。对于降水观测和预报技术的相关研究,一方面关乎社会秩序和人民生命财产的安全,另一方面也对研究地区乃至全球气候变化具有重要意义。
目前,已有许多研究基于各类降水观测数据对于我国季风区部分降水活动的季节和年际变化等特征进行长期的统计和分析 [3] [4] [5] 。传统的降水观测以地基观测为主,其针对降水过程的水平范围十分有限,存在一定的观测系统盲区,难以反映出水平尺度较大的降水活动,其获取的数据资料也存在着时空分辨率较低等问题。其中地面雨量计和地基天气雷达是目前主要的针对降水过程的地基观测手段,但是两者收集的降水观测数据的时间分辨率均较低,对降水的发展演变过程缺乏准确的描述 [6] 。此外,地基天气雷达在资料反演过程中雨径衰减、反射因子与降水关系不稳定和地形影响等存在显著不确定性 [7] 。
近年来,随着空间遥感技术和卫星通信技术的迅速发展,基于气象卫星的遥感降水观测技术和相应的反演技术也随之兴起。卫星观测能够为我们提供直观的遥感图像信息,在一定程度上弥补传统地面观测手段的不足 [8] 。相较于地基观测,卫星以“自上而下”的观测方式使得受观测的目标区域在水平范围和分辨率等方面更加优秀。尤其在缺乏地基观测的无人区、海域等区域,卫星观测的存在可以对现有地基观测提供很好的补充。目前,卫星云图在实际业务应用中也已经成为了获取高质量、高分辨率卫星降水资料的重要手段,并且在监测暴雨和台风等气象灾害中发挥着十分重要的作用 [9] [10] 。研究表明获取高精度高时间分辨率的卫星数据并进行降水过程相关的数据反演,对更进一步提高降水预报的准确度有着重大意义 [12] 。
新一代地球静止气象卫星都搭载了可见光、红外和水汽传感器,此类卫星有风云四号(FT-4)、MSG (Meteosat Second Generation)、葵花8号卫星(Himawari-8)以及GOES (Geostationary Operational Environmental Satellite)等。这些静止卫星上的可见光、红外遥感技术能够提供的各类云层和降水活动相关的红外遥感信息,并且具有更高的时间和空间分辨率,对于短时间内迅速变化的天气现象可以很好的捕捉。而此数据反演的卫星降水资料具有较好的连续性,其时空范围和分辨率上也存在独特的优势 [11] ,因此目前基于地球同步卫星的多通道反演算法是反演大范围的高分辨率降水数据的热门方向之一 [12] [13] 。
上述多传感器联合反演类降水产品克服了以往地面观测的许多缺点,有效扩展了数据集的时空覆盖度,已经成为在全球范围内被广泛应用的高质量降水数据资料,其中常用的数据产品有TRMM (Tropical Rainfall Measuring Mission satellite)卫星降水产品、PERSIANN (Precipitation Estimation from Remotely Sensed Information using Artificial Neural Networks)以及CMORPH (Climate Prediction Center Morphing Method)。薛鹏飞等 [14] 针对雅鲁藏布江流域的降水过程,对TRMM等卫星降水产品进行误差分析与精度评估,其结果表明TRMM在整体上对降水发生反演产品具有较好效果。张天宇等 [15] 针对三峡水库区域,研究了多源降水产品的时空上的适用性,发现在年际时间尺度上TRMM和CMORPH产品都具有极大潜力。杨娜等 [16] 利用PERSIANN-CDR产品识别淮河流域干旱事件以及反演该区域降水时空分布特征,并验证了PERSIANN-CDR的降水反演效果和精度。
针对降水观测较为先进的天基平台则是全球降水测量卫星GPM (Global Precipitation Measurement),该卫星搭载了更先进的GMI被动微波辐射计和双频雷达传感器DPR,加强了对微量降水和固态降水的识别能力,为多卫星降水估计提供了精确的校准参考。近年来,该产品已被广泛应用在气候变化、干旱识别和洪水预报等多个方面 [17] [18] [19] 。此外,GPM产品在时空上与高分辨率的红外格点数据有着较好的对应关系,具备相互耦合的可对比和可数据分析的特性,这为红外反演降水算法的发展提供了较好的基础,并且可以为相应的机器学习技术提供可靠的模型目标变量。因此,获取更高精度高时间分辨率的静止卫星数据的反演结果对更进一步提高降水预报的准确度有着重大意义 [20] 。
2. 资料介绍
2.1. Himawari-8资料
![](Images/Table_Tmp.jpg)
Table 1. Himawari-8 satellite AHI sensor channel information
表1. 葵花8卫星AHI传感器通道信息
本研究采用葵花8号静止卫星资料(Himawari-8,下简称葵花8)作为模型输入数据。葵花8由日本气象厅于2014年10月发射,并于2015年7月正式启用,探测范围覆盖了包括中国在内的东亚和西太平洋区域(60˚N~60˚S,80˚W~160˚W)。葵花8定位于东经140.7˚的轨道上,其时间分辨率为10分钟,水平分辨率为0.05˚ × 0.05˚,最低可达0.5~2 km,共拥有16个通道,包含3个可见光通道,3个近红外通道和10个红外通道。卫星数据由日本宇宙航空研究机构(JAXA)发布,注册后在其官方网站上即可获得实时更新的数据。
本研究使用的葵花8号的各红外通道的信息(见表1)。
2.2. 降水资料
GPM (全球卫星降水计划)是利用多传感器多卫星多算法结合卫星网络和雨量计反演得到更高精度的降水数据。GPM IMERG的数据产品主要分为:Level-1,Level-2和Level-3。Level-3的数据基于IMERG (Integrated Multi-satellite Retrievals for GPM)算法生成,该算法结合来自GPM IMERG中所有无源微波仪器的数据提供降水估计,在精细时间和空间分辨率上对所有卫星微波降水估计值以及微波校准红外(IR)卫星估计值、降水量分析以及可能的其他降水估计量进行相互校准、合并和插值,Level-3的最终产品较为完整且一致性高,本研究将其作为降水基准值,并作为模型训练中的目标变量。该数据单位为mm/h,水平分辨率为0.1˚ × 0.1˚,时间分辨率为30分钟。
本研究聚焦华南地区,将研究区域定义为东经108˚至东经118˚和北纬18˚至北纬26˚区域,主要包含广东省、海南省及其近海一部分海域。该区域属于东亚季风区,是中国年降水量最多的区域之一。
为了筛选有效的降水降本,本研究将数据样本中降水数值大于2 mm/h的格点数大于400个(总格点数的1/20)作为有效样本从而保证每个样本训练都包含有雨的格点对应,且降水强度不至于过小。此外,由于Himawari-8资料存在通道数据缺失的情况,对应样本需删除。最终根据筛选条件一共获得8920个样本。将数据样本按照时间顺序存储,按6:2:2的比例划分训练集、验证集和测试集。
2.3. 模型介绍
U-Net模型(见图1)是FCN的改进和延伸,它沿用了FCN中编解码的思想,并融合了跳跃网络的特点多次进行长连接操作,在模型结构上更加优雅且巧妙,主要体现在以下两点:
1) 采用编解码结构。编码器逐级提取输入的高维抽象特征,解码器逐步将抽象的特征图放大到输入大小,并还原影像的位置信息,且U-Net模型的每一个隐藏层都有较多的特征维数,这有利于模型学习更加多样、全面的特征。
2) 多次使用长连接结构。一般而言,编解码模型中,编码器提取的特征越抽象,解码器的解码效果在宏观上越好,但是更容易丢失细节特征。而长连接结构能够实现编码器中各级抽象特征在输出前的融合,使得模型能够从上下文信息和细节信息由组合得到更加精确的输出特征图。
Convmixer模型是Google Brain团队在2021年提出的全卷积神经网络模型,主要用于图像分类任务(见图2)。Convmixer模型受Vision Transformer (ViT)启发,将输入的图片划分为多个块,并对每个块应用卷积操作,然后利用1 × 1卷积实现块间的信息交互,从而利用各个块的特征信息。此外,模型还使用类似于Transformer的MLP模块来增强模型的非线性表示能力。该模型由于采用了分块的方法,在处理较大输出时表现良好。
pix2pixGAN是一种基于生成对抗网络(GAN)的图像翻译模型(见图3),不同于以上介绍的两种模型,pix2pixGAN是一种条件生成模型,可以根据给定的条件生成具有所需特征的图像或数据,被广泛应用于图像翻译、图像超分辨率、图像风格迁移等领域,为各项任务提供了高效的解决方案。此外,pix2pixGAN具有强大的风格迁移能力,与反演问题具有高度适配性。
![](//html.hanspub.org/file/29-1700653x7_hanspub.png?20230619103459886)
Figure 1. U-Net model structure diagram
图1. U-Net模型结构图
![](//html.hanspub.org/file/29-1700653x8_hanspub.png?20230619103459886)
Figure 2. Structure diagram of ConvMixer model
图2. ConvMixer模型的结构图
![](//html.hanspub.org/file/29-1700653x9_hanspub.png?20230619103459886)
Figure 3. Structure diagram of pix2pixGAN model
图3. pix2pixGAN模型的结构图
2.4. 评估方法
本研究对模型反演结果和GPM IMERG数据进行定量对比和检验。因此这里我们引入了多个降水常用的验证指标,其中主要包含采用命中率(POD)、虚警率(FAR)、临界成功指数(CSI)、HSS评分、ETS评分和偏差Bias。所采用的指标计算方法如表2所示(表2)。
![](Images/Table_Tmp.jpg)
Table 2. Specific meaning of precipitation index score
表2. 降水指标评分具体含义
其中,a表示模型反演有雨,观测有雨;b表示模型反演晴空,观测有雨;c为模型反演有雨,观测晴空;d为模型反演晴空,观测晴空。
3. 实验结果分析
3.1. 通道实验
本章节中,主要利用不同通道以及多通道组合的方式,对葵花8卫星进行降水反演。首先指出,葵花8卫星的各红外亮温通道对应着不同大气成分的观测信息(表1),如通道8、通道9、通道10是观测水汽的通道,这三个通道分别观测对流层上层水汽、对流层中层水汽和对流层中低层水汽,通道12主要用于观测臭氧,而通道16得到的主要是云顶高度的信息。然而并非所有通道信息都对降水反演有益,部分通道由于含有有益信息较少,在深度学习模型中会成为“噪声”,从而干扰模型反演效果。因此,本章将分别测试单通道与多通道对模型反演结果的影响,并选出最优输入通道,试验均采用U-Net模型作为基准模型。
而对比表3中各个单通道和多通道的反演结果的评价指标(表3),我们可以发现一致的结论,多通道在阈值为1.4 mm/h (小、中雨分界线)的各项指标均比单通道的反演结果更优。可以看出,多通道的反演结果并没有优于单通道13的反演结果,虽然也同样减少了降水区误报,但是对于中大雨区的反演精度没有通道13反演效果好。其中通道13的Bias偏差和CSI等指均为多通道更加优秀。
![](Images/Table_Tmp.jpg)
Table 3. Precipitation index results retrieved from Himawari-8 single channel (Threshold: 1.4 mm/h)
表3. 葵花8单通道的反演降水指标结果(阈值为1.4 mm/h)
3.2. 时刻实验
GPM IMERG降水资料的时间分辨率为30分钟,而葵花8资料的时间分辨率为10分钟,这意味着每个GPM IMERG降水样本对应的时间段内存在4个时刻的葵花8数据,本文以t0、t10、t20、t30表示这4个时刻。其中t0代表GPM IMERG数据中30分钟时间中的初始时刻,t10和t20为初始时刻后的10分钟和20分钟,t30为最终时刻(30分钟)。本章将评估基于不同单时刻及多时刻的亮温的反演结果,并选择模型最优时刻。本章试验采用与第三章相同的模型及模型超参数,并选择通道13作为模型输入的亮温通道。
由表4可以看出(表4),基于多时刻输入的反演不如基于t0时刻的反演结果,在相对由于其他单时刻的反演结果。这说明模型基于多时刻的输入能够融合了不同单时刻的信息,但并没有充分利用各个时刻的有用信息实现取长补短的效果,这可能是因为模型自身辨别干扰信息的能力不足。总体而言,t0时刻的反演效果优于其他单时刻。
![](Images/Table_Tmp.jpg)
Table 4. Index results of precipitation retrieval with single time and multiple time inputs
表4. 单时刻和多时刻输入的降水反演的指标结果
3.3. 模型实验
本章节主要分析和讨论不同深度学习模型对于降水过程的反演效果。主要针对三个模型结构分别进行模型反演实验并且对相应的结果进行检验,使用模型包括U-Net、ConvMixer、pix2pixGAN。将葵花8卫星红外资料的9个红外通道作为模型输入,其对应时刻为GPM IMERG降水数据的起始时间。本章的测试数据集仍然选择2019年5月1日至2019年9月31日中被筛选为有效样本的部分。为了保持实验环境的一致性,三模型选用的参数均一致:设置的模型学习率(lr):0.001;batch_size (训练批次大小):128;训练轮次(epoch):100;早停法耐心值:20;耐心值指标:MSE。以下选取三个典型案例进行具体分析。
图4为2019年5月6日5时30分的华南地区一次降雨过程的三种模型反演结果以及GPM数据(图4)。其中图4(a)为GPM IMERG的半小时的降水强度分布,图4(b)~(d)分别表示各模型降水反演的结果。此次降水过程中,东南方出现大到暴雨,中部地区出现南北走向的带状降水区。总体而言,对于大雨区和暴雨区的位置,三个模型均能够反演达到中雨以上的降水强度。其中,pix2pixGAN反演的降水强度更为接近GPM数据,尤其对于东经116˚附近的大雨、暴雨;ConvMixer的降水强度的轮廓划分更合理,尽管部分区域降水强度的等级没有达到目标集水平。对于东经112˚的两块大雨区,pix2pixGAN有较好的反演结果,降水强度和降水区域均相对更为合理;U-Net在这个区域将部分大雨区高估成暴雨区;而ConvMixer也高估出零散的暴雨区,且ConvMixer存在大面积的小雨区的误报,且存在较大范围的高估。因此,总体情况来说pix2pixGAN的模型表现效果最好。
![](//html.hanspub.org/file/29-1700653x17_hanspub.png?20230619103459886)
Figure 4. Retrieval results of different models for a rainfall process in south China at 5:30 on May 6, 2019: (a) GPM IMERG Rainfall Data; (b)~(d) Inversion results of three deep learning models
图4. 2019年5月6日5时30分华南地区一次降雨过程的不同模型反演结果:(a) GPM IMERG降雨资料;(b)~(d)三个深度学习模型的反演结果
综合表5中的各项评价指标(表5),总体而言,可以发现pix2pixGAN模型对于研究区域的降水过程反演的效果相比其他两个模型更好,其POD达到了0.75,Bias达到了1.16。而ConvMixer模型反演的指标评价最低,主要是由于本身ConvMixer是作为图像语义分割模型,和U-Net是同一种模型且适用于小数据集,但是ConvMixer的整体结果表现较差。U-Net模型的表现优势在于U-Net更好的保存了特征信息,虽然ConvMixer也有残差连接来保存特征信息,但是不如U-Net的特征保存信息完整。pix2pixGAN的生成器是U-Net模型结构,整体上评价优于U-Net模型也是合理的,对于小雨区的误报处理上pix2pixGAN的判别器能够很好地甄别误报的小雨区,虽然也同时漏报了一些小雨区。pix2pixGAN在BIAS指标的反应上是高估情况降低,接近真实的降雨状况,命中率(POD)、关键成功指数(CSI)、公平性评分(ETS)等都是比U-Net、ConvMixer模型要好。在漏报率方面低于U-Net的原因在于是阈值设置为1.4 mm/h,所以显示漏报率(FAR)表现pix2pixGAN也是比U-Net要好。
![](Images/Table_Tmp.jpg)
Table 5. Inversion index evaluation of different models
表5. 不同模型的反演指标评价
4. 结论与展望
本研究基于Himawari-8静止卫星资料和U-Net模型分析了不同红外通道亮温观测和不同时刻红外亮温观测对降水反演的影响,结果表明,当采用Himawari-8静止卫星通道13红外亮温作为模型输入反演降水时效果最优和GPM IMERG降水资料的起始时刻对应的Himawari-8红外亮温观测作为模型输入要优于其他单时刻和多时刻作为模型输入的降水反演精度。
本文构建了基于两步预报法和pix2pixGAN模型改进预报模型(即B-pix2pixGAN),并加入雨强掩膜控制,有效地改进了无雨区误报为小雨区的问题,并提高了中、大雨区的降水反演精度。
本研究未来可以考虑加入天气雷达和更多卫星通道观测作为输入,未来加入研究前后时刻卫星观测对降水反演的影响,探讨是否能进一步改进降水反演精度。
致谢
感谢提供数据集的JAXA (Japan Aerospace Exploration Agency)和NASA (National Aeronautics and Space Administration)。