1. 引言
降水量是气象要素中最为重要的因子之一,其时空分布是气象、气候、水文、生态以及经济、农业和其他相关学科研究的基础和必要支撑 [1]。近几十年来,随着气象卫星技术的发展,利用卫星红外、被动微博和可见光等信息可以对降水进行监测、反演和融合。目前已发展出了很多高时空分辨率卫星降水估计产品,并在气候监测分析、数值天气预报和水文研究等领域得到了广泛的应用。卫星降水产品的出现,可以弥补台站稀疏和无雷达覆盖地区降水资料的不足,更好地帮助我们了解降水的空间和时间上的分布特征,对天气形势的分析也具有重要意义。由于各种卫星降水估计产品所采用的卫星资料和反演算法不尽相同,他们的精度也有一定的差异,近年来国内外对不同的卫星降水产品开展了一些检验和评估研究。成璐等 [2]利用年中国个站点的逐小时降水观测数据对同期和卫星降水估计产品进行了检验和评估。结果表明,CMORPH和TRMM卫星降水资料与地面台站资料的日平均降水量空间分布具有较好的相似性。
三种高分辨率卫星反演降水数据(CMORPH, TRMM, PERSIANN)在全球应用广泛,但是该类数据在四川省的降水探测是否能达到应用的要求还有待研究,因此,本文利用2013~2015年四川省内814个地面台站的降水资料对CMORPH、TRMM 3B42V6和PERSIANN三种卫星降水产品进行检验评估,将在三种不同时间尺度上进行,分别为3小时、逐日、逐月,可以探究卫星反演降水产品对短时间和长时间降水的探测情况,并在一定程度上了解三种产品对四川省降水反演的准确性。检验评估这些卫星降水产品在四川省的精度可以为产品的开发者提供依据,以便找到误差产生的原因,进而提高卫星降水产品的精度,同时为产品的使用者提供借鉴,从而更好地应用和研究。
2. 资料与分析方法
2.1. 台站资料介绍
本文研究所使用的地面台站降水资料包括2013~2015年四川省内814个自动站逐小时雨量计数据。此套降水量数据经过了气候学界限值、区域界限值、时间一致性、空间一致性等质量控制和检查后,国家级自动站资料可用率达98.9%,区域自动站的可用率也达到81.6% [3],足以满足对基本气象要素的探测。图1是四川省地面站的分布情况。
2.2. 卫星降水产品
CMORPH是一种仅提供空间降水信息的数据,该数据的来源主要是两个方向,其一是高时空分辨率的红外数据,另一种是低空间分辨率、高探测精度的微波降水数据,红外数据主要为CMORPH提供的云移动矢量数据,而微波数据则根据云移动矢量数据补充该空间矢量位置的降水信息,这个过程称为“变形融合”(Morphing) [4]。
为了研究观测热带及亚热带地区的降水和能量交换过程,美国航空航天局(NASA)和日本空间开发局(JAXA)在1997年底共同发射了一颗近赤道太阳同步轨道卫星TRMM。本文中将用到的是TRMM 3B42V6降水数据,它利用包括TRMM本身降水数据加上其他非TRMM卫星所搭载的传感器数据(包括微波和红外数据)生成的 [5]。PERSIANN是由加州大学Irvine分校研发的一种实时降水数据,开始时期只有热红外和可见光两种数据,所用的红外数据与CMORPH和TRMM所用的红外数据大同小异,而可见光数据主要来自于TRMM的VIRS数据 [6]。
![](//html.hanspub.org/file/1-2320367x9_hanspub.png)
Figure1. The distribution of reference station in Sichuan Province
图1. 四川省自动站分布情况
2.3. 精度验证方法及参数介绍
卫星反演的降水数据精度会受到多种因素的影响,反演数据本身的算法是不同的,因此性能和精度也会有差距。不同来源的卫星反演降水数据在同一地点会有差异,同一卫星反演降水数据在不同地区的反演效果也会有所差异,因此对数据进行全方面的验证就是卫星反演降水研究中的必行工作。本章将利用四川省2013~2015年的814个自动站降水数据,采集数据的时间间隔为1小时。由于三种卫星反演降水数据的最小时间分辨率为3小时,所以首先将站点数据“加工”成3小时数据,再与卫星数据进行对比。此外三种卫星反演降水数据代表的是降水率(单位:mm/h),因此为生成降水量数据,都做了乘以3小时的处理。三种卫星数据的分辨率为0.25˚ × 0.25˚,可视为格点数据,在一个格点中,存在一个或者多个站点数据,如图2所示,将每个格点中的站点数据做平均处理以作为与地面站数据的对比值,这种对比方法的有效性在研究中已得到印证 [7]。此外,在某些对卫星反演降水的验证中,有将雨量计插值成与卫星相同的空间分辨率再进行评价的方法 [8],但这种方法只适合于小范围内的验证,如只是一个市的精度验证,并不适用于如一个省的验证分析 [9]。
为了定量评估卫星反演降水产品的精度,本文选择六个参数对反演降水进行定量分析,分别是评价降水产品与雨量计相关性,反应其与雨量计同步效果的相关参数CC (Correlation Coefficient),CC若为正,代表卫星反演降水数据与雨量计数据正相关,否则为负相关;反应两者降水总量差别和卫星反演降水产品系统误差的偏差参数(BIAS),偏差如果越接近1,越能说明降水产品精度越高;第三个是均方根误差RMSE (Root Mean Square Error),其作用是评估降水产品与雨量计的偏差,其中CC和BIAS是无量纲参数,CC一般用百分数表示,RMSE的单位在本文中为毫米(mm),这三个参数是为说明卫星反演数据的误差而设定。为对卫星反演降水所反应的事件可能性做定量评估,引入Heidke指数(Heidke’s Skill Score, HSS)、漏演率指数PD (Probability of Detection)和空报率参数FH (Frequency of Hit),其中HSS是一项综合描述降水事件是否发生的相对指标,PD值越高,卫星反演降水的漏演程度越低,FH值越高,卫星反演降水的空报率越低。六个参数的表达式如公式(1)~(6),HSS、PD及HSS各项所表达意义见表1。
![](Images/Table_Tmp.jpg)
Table 1. Definition of four rainfall issues
表1. 四类降水事件定义表
(1)
(2)
(3)
(4)
(5)
(6)
式(1)、(2)、(3)中,n代表某时刻数据的总量,i代表第几个数据,Gi代表雨量计的第i个观测值,Si代表第i个卫星反演降水产品的降水值,
与
分别代表雨量计和卫星反演降水产品在某时刻的平均值。
3. 不同时间尺度的卫星反演降水数据的精度评估
3.1. 三小时尺度的卫星反演降水数据的精度评估
图3~图5是3小时时间尺度上的CMORPH、TRMM和PERSIANN降水与站点降水数据的散点图。散点图的意义在于对比反演降水数据与实测数据的相似性,如果散点越集中在从坐标原点到右上角的直线周围,就说明反演降水数据的探测结果越精确。为定量描述两类数据的差异,计算了两类数据的偏差(BIAS),均方根误差(RMSE)以及相关系数(CC)。
在图3中,CMORPH所反演的降水与站点所记录的降水在3小时时间尺度上差别显著,相关系数都特别低,2013~2015年分别为0.144%、0.14%和0.2%,说明两者相关性较差;同样,TRMM与实测数据的相关系数也很低,在图4中,散点图多集中在X与Y轴上,相关系数分别为1.6%、−1.7%和0.8%,在2014年相关系数为负数,说明雨量计数据和TRMM数据的相关关系为负相关;PERSIANN与实测数据的相关系数是三种卫星反演降水数据中最低的(图5),分别为0.091%、0.069%和0.085%。
![](//html.hanspub.org/file/1-2320367x19_hanspub.png)
Figure 3. Scatter points of CMORPH and gauge data of 3 h
图3. 站点降水量与CMORPH反演降水量3小时散点图
![](//html.hanspub.org/file/1-2320367x20_hanspub.png)
Figure 4. Scatter points of TRMM and gauge data of 3 h
图4. 站点降水量与TRMM反演降水量3小时散点图
![](//html.hanspub.org/file/1-2320367x21_hanspub.png)
Figure 5. Scatter points of PERSIANN and gauge data of 3 h
图5. 站点降水量与PERSIANN反演降水量3小时散点图
三种数据在3小时上的相关系数较低的原因与数据本身的系统误差有关,这一点将在后文中做出解释。
CMORPH与站点降水的均方根误差在2013~2015年分别为5.25 mm、4.39 mm和4.59 mm;TRMM为10.38 mm、10.13 mm和10.51 mm;PERSIANN为12.99 mm、10.87 mm和13.78 mm。从数据的大小上可知,CMORPH与雨量计的误差是三种数据中最低的,均方根误差均比其余两种反演产品低50%左右,也说明CMORPH反演降水的系统误差低于其余两种数据。
三种卫星反演降水数据的偏差结果中,CMORPH的值最小,三年分别为1.07、1.16和1.18,说明CMORPH在3小时的降水反演上,与总降水量最接近;TRMM所反演的降水与地面站数据的偏差分别为3.34、5.04和7.21,而PERSIANN与地面站的偏差为2.82、2.64、3.36。从公式(2)中可知,TRMM和PERSIANN反演的降水量高于地面站的降水量,且高估的量都在2倍以上。基于对三种参数的分析可知,3小时时间尺度上,CMORPH所反演的降水量精度明显高于另外两种数据,这与CMORPH反演降水数据的方法和所采用的数据是分不开的。但CMORPH与地面站数据的相关系数却也很低,造成两者相关系数偏低的原因有三个:第一,CMORPH是建立在多种数据的融合基础上的,每种数据均有其各自的缺陷,融合后的CMROPH并没有消除所存在的误差,误差被继续保留在数据中,造成了误差的累积;其次,融合生成CMORPH的红外数据在反演降水时利用了云顶亮度温度来估算可降水量,但对于卷云或者高层云,其云顶亮度温度虽然低,却基本不会形成降水事件,而卫星在记录时,将这一部分也当作真实的降水进行记录,因此带来误差;第三,在合成CMORPH数据时用到了地球同步轨道卫星的数据,同步轨道卫星在探测过程中会出现探测区域的东偏或西偏现象,这是一个非常复杂的过程,与恒星日的计算方法有着一定的联系,当同步卫星出现向东偏移现象时,所探测的降水区域实际是在地面区域的东边,如果西偏,所探测的位置又会向西偏移。这三个原因是造成CMORPH在3小时尺度上误差的主要原因,与CMORPH类似的是,TRMM出现误差的原因也有上述原因中的第三点。
从3B42V6的获取方式上可知,其在自身TRMM卫星所探测的数据的基础上添加了其他非自身数据作为辅助,这些数据可能存在的误差也保留在了3B42V6中 [10]。同时,对于所有的通过卫星反演的降水数据,短时间内所探测的降水存在误差是很正常的 [11]。由于卫星的探测方式是“一扫而过”,只能得到星下点的瞬时降水信息,若要生成全球范围内某个时段的全部降水信息,就需要结合多个同时段的其他卫星的降水信息,这些信息都属于瞬时信息,但地面站的降水数据却是一个连续的降水数据,瞬时与连续的不对称性也是造成降水误差的原因。
前文对PERSIANN数据的生成方式做了介绍,PERSIANN的数据源主要来自可见光和热红外数据,热红外数据的缺点是过分依赖经验公式,并对夏季的暖云降水探测效果很差,这是PERSIANN在某些区域降水探测精度较低的原因之一;同时,PERSIANN的后期处理所用到的方法是人工神经网络,人工神经网络方法存在一些固有缺陷:它是一个高度非线性的动态或静态系统,这也导致了神经网络方法往往偏复杂,不能准确分析与降水有关的每项影响因子,从而造成误差;第二,人工神经网络本身不适用于求解必须得到正确答案的问题,原因在于神经网络的原理是“自发的集体行为”,需要对其中的每一个“节点”进行有效操作和控制,需要投入大量的精力,并对高性能计算机的依靠程度较重,因此人工神经网络方法只是在不断地获得近似值,而降水所需要的却是一个需要精准测量的准确数值,这也导致了数据最后的误差;其三是目前被人们所利用的几套人工神经网络结构,只适用于解决一类或者几类问题,加州大学欧文分校所研发的这一套数据的依据方法本身存在着系统误差,若要获得更准确的降水信息,还需要进一步改进本身方法 [12]。
3.2. 逐日尺度的卫星反演降水数据的精度评估
图6~图8是2013~2015年逐日时间尺度的三种卫星反演降水数据与地面站数据的散点图。CMORPH与站点的相关系数随时间的增加而提高,三年的相关系数分别为34%、28%和26%,从CMORPH数据融合过程可知,由于时间的增加,融合生成CMORPH降水产品所用到的数据量也随之增加,多种微波和红外数据被采用,相关系数自然随之提高;而3B42V6却未因为时间尺度的增加而提高其相关系数,2013年~2015年的相关系数为−1.34%、−0.1%和7.6%,前两年皆为负相关,也体现了该数据与地面站数据同步性差的特点;PERSIANN与地面站的相关系数也很低,分别为0.01%、0.016%和0.014%。三者相互对比,CMORPH与地面站的同步性是最佳的。
CMORH反演降水数据的偏差在2013~2015年分别为1.06、1.12和1.15,虽然对数据存在一定的高估,但与站点所测的降水量非常接近,2014和2015年偏差的量比2013年大,这一点从图中散点更加偏向X轴也可说明;TRMM 3B42V6的偏差在三年中分别为2.18、2.86和3.95,从数值上分析,其高估了降水的总量,并且所高估的量均在2倍以上;从PERSIANN和站点降水量的散点图明显偏向X轴可知,其必然高估了降水量,而三年间的偏差数据分别为2.6、2.41和2.79,也证明了这一点。因此在逐日时间
![](//html.hanspub.org/file/1-2320367x22_hanspub.png)
Figure 6. Scatter points of CMORPH and gauge data of day
图6. 站点降水量与CMORPH反演降水量逐日散点图
![](//html.hanspub.org/file/1-2320367x23_hanspub.png)
Figure 7. Scatter points of TRMM 3B42V6 and gauge data of day
图7. 站点降水量与TRMM 3B42V6反演降水量逐日散点图
![](//html.hanspub.org/file/1-2320367x24_hanspub.png)
Figure 8. Scatter points of PERSIANN and gauge data of day
图8. 站点降水量与PERSIANN反演降水量逐日散点图
尺度上,CMORPH的偏差量是最低的,与真实的站点降水总量也非常接近。
均方根误差(单位:mm)在2013年最大,为16.49,在2014和2015年都在10以内,分别为9.02和9.9,这也从定量的角度说明了CMORPH的逐日降水数据和站点平均降水量偏差非常小;而3B42V6的均方根误差在三年分别为26.1、25.08和25.38;PERSIANN所反演的降水均方根误差分别为32.63、24.69和30.28,从数值上可知,3B42V6与PERSIANN的均方根误差比CMORPH大许多,而PERSIANN也高于3B42V6,定量说明了CMORPH的逐日降水量和站点降水量的偏差是三种数据中最小的,其原因如上文中所叙述的一样,由于时间尺度的增加,用于融合产生CMORPH的数据增多,更多精度更高的数据被利用,故CMORPH的降水与站点的差异最低,而3B42V6数据虽然也有类似CMORPH的“开放性”,但其更依赖TRMM卫星本身,PERSIANN的误差原因在其3小时尺度分析中已经说明,其本身所利用数据和生成方法有待改进。
3.3. 逐月尺度的卫星反演降水数据的精度评估
图9~图11是CMORPH、TRMM 3B42V6与PERSIANN在逐月时间尺度上与站点降水的散点图,CMORPH所反演的降水与站点降水的相关系数达到85%、87%和87%,3B42V6与站点的相关系数也随着时间尺度的增加而上升,三年的相关系数分别为25%、18%和15%,PERSIANN的相关系数也增加明显,为28%、24%和18%。
依据Huffman G J等人的研究 [13],随着降水量的增加,相关系数与降水量的大小成正比,同时也与误差成正比。因此三种数据的均方根误差也在增加,CMORPH三年的均方根误差分别为113.92、82.48和63.1 (单位:mm),3B42V6的均方根误差在2014年是最大的,为184.4,2013和2015年的均方根误差分别为125.38和150.9;而PERSIANN的均方根误差分别为245.048、169.938和183.702,考虑到四川
![](//html.hanspub.org/file/1-2320367x25_hanspub.png)
Figure 9. Scatter points of CMORPH and gauge data of month
图9. 站点降水量与CMORPH反演降水量逐月散点图
![](//html.hanspub.org/file/1-2320367x26_hanspub.png)
Figure 10. Scatter points of TRMM and gauge data of month
图10. 站点降水量与TRMM 3B42V6反演降水量逐月散点图
![](//html.hanspub.org/file/1-2320367x27_hanspub.png)
Figure 11. Scatter points of PERSIANN and gauge data of month
图11. 站点降水量与PERSIANN反演降水量逐月散点图
省每月平均降水量在160 mm左右,3B42V6、PERSIANN与地面站的误差就非常明显,而PERSIANN的误差也比另外两种反演降水数据大。偏差数据也能证明这一问题,CMORPH 2013~2015年的偏差分别为1.44、1.45和1.5,在月时间尺度上,这个数值是非常低的;而3B42V6的偏差为3.95、2.19和2.16,相对于站点的降水量,其所反演的降水量是站点降水量的2倍以上;PERSIANN的偏差为2.38、2.17和2.36,从图10和图11中散点都偏向X轴的现象也可知,3B42V6和PERSIANN数据对降水量存在高估现象。
4. 卫星反演降水数据对降水事件记录的验证
根据公式(4)~(6)中计算Heidke技巧参数、漏演率PD与空报率FH的表达式,可以验证卫星反演降水数据对降水事件记录的准确性。图12~图14是2013~2015年三种验证参数的变化趋势图。
![](//html.hanspub.org/file/1-2320367x28_hanspub.png)
![](//html.hanspub.org/file/1-2320367x29_hanspub.png)
![](//html.hanspub.org/file/1-2320367x30_hanspub.png)
Figure 12. Probability of detection from 2013 to 2015
图12. 2013~2015年漏演率参数PD的变化趋势
![](//html.hanspub.org/file/1-2320367x31_hanspub.png)
![](//html.hanspub.org/file/1-2320367x32_hanspub.png)
![](//html.hanspub.org/file/1-2320367x33_hanspub.png)
Figure 13. Frequency of hit from 2013 to 2015
图13. 2013~2015年空报率参数FH的变化趋势
![](//html.hanspub.org/file/1-2320367x34_hanspub.png)
![](//html.hanspub.org/file/1-2320367x35_hanspub.png)
![](//html.hanspub.org/file/1-2320367x36_hanspub.png)
Figure 14. Heidke’s skill score from 2013 to 2015
图14. 2013~2015年Heidke技巧参数HSS
CMORPH的PD、FH和HSS在三年中都有着先升高后降低的变化趋势。CMORPH呈现这样变化特征与每年的降水多集中在年中有关,这个时段的降水量多,CMORPH对降水的记录也更准确,这与前文中所提到的降水量越大,卫星反演数据误差越低的结果一致。图12中,3B42V6的PD值在三年中变化波动较大,特别是在年初和年尾,由于这个时间段的降水量少,且强度不大,也反映了3B42V6在探测小降水事件上存在着不稳定的特点。PERSIANN的PD值在全年中的波动都较大,说明了PESIANN数据的漏报率在全年的变化波动较大,这也说明了为何PERSIANN所反演的降水在全年的变化与站点差异较大的原因。
图13是三种卫星反演降水数据的空报率参数FH在三年中的变化,三种反演数据都有着类似先上升后下降的特点,空报率公式的分母是由“站点有探测事件卫星有探测事件、站点无探测事件卫星有探测事件”组成。CMORPH的FH所呈现出的变化与PD类似,原因和所反映的结果也类似。3B42V6的FH在年初和年末明显比PD的值低,而两个数据的唯一差异就在于分母的区别,由于FH的值低,因此在年初和年末反演数据所不能记录到而站点能记录到的降水事件比卫星能记录到而站点不能记录到的降水事件多,同样的情况也适用于PERSIANN的结果,这也证实了两种数据对降水量存在高估的现象。
图14是Heidke技巧参数随时间的变化情况,且CMORPH的变化情况与该数据PD和FH的变化相似,且HSS大于0的情况多出现在年中,说明了在年中n11 * n00大于n10 * n01,前者代表了数据的稳定性,后者代表了数据对降水事件探测结果的误差,这种情况和PD和FH一样,都说明了CMORPH在降水量大的情况下漏报和空报的情况较少。3B42V6与PESIANN的技巧参数在全年波动变化大,即数据的不稳定性明显,与前文中所计算的偏差及降水逐日变化情况相互说明,进一步说明了两种数据探测结果与真实降水有着一定差异。
5. 结论
结合四川省2013~2015年的地面雨量计数据,对比验证了CMOPRH、TRMM和PERSIANN三种目前应用较广的高分辨率卫星反演降水数据在四川省的探测精度,分别在3小时、逐日和逐月的时间尺度上对三种数据进行了精度研究。主要内容与结论可总结如下:
1) 当时间尺度为3小时,三种卫星反演降水产品的探测精度都不高,误差明显,这与短时间降水的特点有关,短时间降水有着太多不确定因素,如卫星探测到了降水,但如果是小降水又加之下垫面影响,那么降水在到达地面之前蒸发的可能性就会存在,又比如暖云降水,降水产品非常容易高估此类降水,但随着研究的时间尺度增加,三种降水产品与雨量计数据的吻合度也随之升高。
2) 虽然三种数据都对降水有着一定的探测能力,但CMORPH在各个时间尺度上对降水的探测都是最准确的,并且CMORPH所记录的每日降水量与地面雨量计的值变化趋势一致,特别是在逐月尺度上,CMORPH与雨量计数据相关性很高,说明该数据具有良好的探测四川省降水情况的能力。
3) TRMM对三种时间尺度降水的记录不如CMORPH准确,但仍有着一定的探测能力,例如TRMM的日降水变化趋势就与雨量计所记录的情况类似。
4) PERSIANN数据是三种降水产品中,探测效果是最差的,在三种时间尺度上均高估降水量,而且在每日降水变化趋势上也和真实情况相差甚远。
基金项目
受到国家重点研发计划(2017YFC0803900)及中国交通通信信息中心储备项目(2017CB05)的资助。
参考文献