神经网络在气象领域中的应用
Application of Neural Network in Meteorology
摘要: 神经网络一直是气象领域重要的研究方法之一,但是,由于数据的缺乏及相关理论不完善等因素,在实际应用中有诸多局限。近年来,随着数据资料质量的提升及深度学习研究的兴起,研究者们尝试在气象领域应用神经网络的相关方法,提高天气预报的准确性,更加深入地研究天气现象背后的物理规律。本文介绍了应用于气象领域的几种常见的神经网络模型,回顾了近些年来神经网络模型在数值模式后处理、图像特征提取及天气预报三个方面的应用,并提出在以后研究中的几点期望。以目前的研究成果而言,神经网络模型可以在一定程度上弥补数值预报模式的缺陷,但是不能完全取代数值预报模式。因此,需要更加深入地尝试将数值预报模式及神经网络模型相结合,发挥两种方法的优势,共同推动气象行业的发展。
Abstract: Neutral network has always been one of the most important methods in the field of meteorology. However, many limitations will be found when it used in practical applications due to the lack of data and its imperfect theory. In recent years, the researchers have tried to apply the neutral network models in the field of meteorology in many ways with the improvement of data quality and the appearance of deep learning theory, to improve the weather forecast accuracy and find the physical laws behind the weather phenomena. This paper introduce several neutral network models that most used in the field of meteorology, review the application of neutral network models in the field of numerical forecast post-processing, image feature extraction and weather forecast, Then give some expectations in future research. According to the current research, the neutral network model can make up for some defects of weather numerical forecast to some extent instead, but cannot completely replace it. Therefore, it is necessary to combine them in a deeper degree and take advantage of them, to promote the development of meteorological industry.
文章引用:张珂珺, 金旭峰, 牛海林, 吕艺影, 陈丹丹, 熊雪清. 神经网络在气象领域中的应用[J]. 自然科学, 2024, 12(3): 624-634. https://doi.org/10.12677/ojns.2024.123073

1. 引言

机器学习一直是人工智能领域中的一个研究重点。它能够从已知数据中学习内部的规律,对未知的事件进行判断,从而在图像识别、自然语言处理等领域有十分重要的应用。20世纪80年代,Rumelhart、Hinton和Williams等 [1] 提出了神经网络的反向传播算法,为机器学习领域打开一扇新的大门。随后,在20世纪90年代,研究者们相继提出并发展各种浅层机器学习模型,如支持向量机 [2] ,决策树 [3] 等。此时虽然有多层神经网络的相关理论提出,但由于理论研究不足,计算能力有限等原因,并未有进一步的发展。

2006年,Hinton教授及其学生Salakhutdinov发表深度学习概念及深度网络,引发了深度学习的研究浪潮,相关研究者们开始探索深度学习在各个领域的应用。2012年,ImageNet图像分类竞赛中第一次出现深度学习算法,使图像识别错误率较上一年下降41.1%;随着深度学习理论的不断发展,2016年图像识别错误率降至2.991%,低于人类主观识别错误率 [4] (张军阳等,2018)。2022年11月,由美国人工智能实验室OpenAI开发的智能聊天机器人ChatGPT (Chat Generative Pre-trained Transformer)上线,该应用基于Transformer神经网络架构,拥有语言理解和文本生成的能力,被认为是继互联网、智能手机之后的第三次革命性产品 [5] 。人工智能在成为研究热点的同时,也成为提升国家竞争力的重要举措之一,各国纷纷将人工智能纳为下一阶段发展领域的重点。2016年,美国白宫科技政策办公室发布《为人工智能的未来做好准备》和《国家人工智能研发战略规划》两份重要报告;2017年,中国国务院发布了《新一代人工智能发展规划》。

机器学习理论的发展,给气象领域带来新的机遇和挑战,广大研究学者们尝试采用机器学习理论的相关方法,探索各种天气现象背后的规律。Bartok等 [6] 将气象预测方法和统计学方法相结合,利用数据挖掘技术处理模型的参数化,对重大气象变化进行研究;智协飞等 [7] 采用贝叶斯模式集合平均和多元高斯集合核拟合法,对地面气温进行概率预报;陈浩等 [8] 利用k最邻近方法(K-Nearest Neighbor, KNN)对青藏高原地区降水预报进行订正。基于相关理论的发展,机器学习的相关算法开始逐步应用于实际的天气预报中。美国Earth Risk公司于2013年研发基于深度学习方法的概率预报模式,用于进行40天延伸期的气温预报。国内“彩云天气”等公司,利用机器学习算法,对天气系统进行智能外推,使1小时内降水预报的准确性达到90%。

近年来,机器学习方面的研究者们开始将研究中心集中于神经网络模型。研究者们以传统的神经网络模型为基础,结合深度学习理论,不断改善神经网络结构,提高其性能。随着神经网络模型的进步与完善,基于神经网络模型的气象领域相关研究也得到进一步的发展。

2. 神经网络模型

神经网络是自20世纪80年代以来机器学习研究的一个热点。它能够模拟人类大脑对信息的存储、学习、训练及泛化能力,具有并行计算和处理高度非线性问题的特点。神经网络模型可以从训练期的数据中,建立自适应性和灵活性都较高的函数,构建输入数据与输出数据之间的关系模型,从而对新的数据进行分类、预测等处理。它通常由输入层,隐藏层和输出层构成,可分为前馈网络和反馈网络。前者每层的神经元只接收前一层神经元的输入,后者每层神经元除接收前一层神经元的输入外,也可能接收其它层神经元的输入 [9] 。

自深度学习兴起以来,深度神经网络(Deep Neural Network, DNN)也得到更加广泛的研究和应用。深度神经网络通常指隐藏层数目大于1的神经网络。它较过去的神经网络而言,能够更加主动地从原始数据中提取多个不同层次的抽象特征,从而在输入数据和输出数据之间,建立更加稳健的映射。但深度神经网络的结构,如隐藏层层数的多少和各层神经元的数量,对模型性能有明显的影响。如果网络结构过于简单,会使得它难以学习到数据之间较为复杂的非线性关系,限制它的学习能力;如果结构过于复杂,则可能会出现过拟合现象,影响模型的泛化能力。在气象领域中,以卷积神经网络(Convolutional Neural Network, CNN)和循环神经网络(Recurrent Neural Network, RNN)的应用最为广泛。

2.1. 前馈式神经网络

前馈式神经网络通常只含有一个隐藏层,是所有神经网络最基础的模型。它一般为全连接神经网络,即前一层神经元的输出全部作为当前层神经元的输入 [10] 。输入层的神经元连接输入的变量,经过连接权重加权求和后输入至隐藏层;隐藏层经过激活函数的计算,将输入的值整合后输出至下一层;输出层通过激活函数计算上一层加权求和后得到的值,得到整个网络的最终输出值,其整体结构如图1所示。

Figure 1. The structure of three-layer feed-forward neural network

图1. 三层前馈式神经网络结构

损失函数代表神经网络的输出值与目标值之间的距离。通过训练期样本的学习,不断调整和改进网络各层的连接权重,使得损失函数达到最小值,从而获得输入值和输出值之间的最佳映射。

2.2. 卷积神经网络

卷积神经网络由输入层、卷积层、池化层、全连接层和输出层组成。卷积层通过对子区域内的格点变量进行卷积操作,能够更好地挖掘相邻格点变量间的关系和区域内变量的二维特征;池化层通常采用最大值池化,提取子区域内某一变量的最大值和最大值的位置,增强网络对于系统伸缩,平移和旋转的鲁棒性 [4] 。卷积层和池化层通常相连接,交替设置 [11] ,能够在一定程度上减少网络的参数,增加训练大规模网络的可行性。其基本结构如图2所示。

Figure 2. The structure of convolutional neural network [12]

图2. 卷积神经网络结构 [12]

卷积神经网络由于隐藏层数目在实际应用中远大于前馈式神经网络,更加容易发生梯度消失的问题,即由于后部隐藏层参数更新较前部隐藏层慢,导致的模型准确率随隐藏层数目的增加而下降。因此,卷积神经网络往往会根据不同的情况,设置不同的激活函数和损失函数。

2.3. 循环神经网络

循环神经网络是在前馈式神经网络的基础上,提取过去变量的相关信息,存储在网络内部,从而实现对变量动态特征的提取。Elman网络是循环神经网络中使用最普遍的网络之一,也是其他循环神经网络最基础的结构 [13] ,其基本结构如图3所示。它在前馈式神经网络的基本结构上,在网络结构中添加一个承接层,用来记录隐藏层之前时刻的输出,同时承接层的输出也作为一个变量输入到模型中,从而在模型中构成一个内部的循环。

Figure 3. The structure of Elman neural network

图3. Elman神经网络结构

相比于其他神经网络,循环神经网络拥有记忆性,可以对变量时间序列的变化进行建模。但是,传统的循环神经网络模型梯度无法在较长的时间序列中传递,而无法检测到较长序列的影响 [14] 。由此,在传统的循环神经网络基础上,添加输入门、遗忘门和输出门来控制变量信息的传递,构成长短期记忆模型(Long-Short Term Memory, LSTM),用于处理一些长时依赖问题。

3. 在气象领域的应用

3.1. 模式后处理

数值预报模式通过模拟大气,陆地和海洋间的物质、能量交换的物理过程,从而对未来的状况做出预测。在处理大气–陆地–海洋系统中包含的高度非线性作用及系统间复杂的相互作用时,模式往往通过假设、近似、参数化等方法对这些作用进行简化,以便于计算。但这些操作同时会使模拟结果产生误差。神经网络由于其能对复杂的非线性结构建立模型,并具有较高的稳健性,容错性及并行结构带来的较快的计算速度,成为订正模式误差的方法之一。

神经网络模型自20世纪90年代以来,一直被认为是改进气象分析及预报的重要方法 [15] 。通过神经网络对模式预报结果的订正主要基于模式的预报数据,得到确定性预报或概率预报。

3.1.1. 确定性预报

在确定性预报方面,神经网络模型通常是利用数值预报的输入,结合其他气象要素数据,在训练期内建立输入值和实际观测值的关系模型,从而减少数值预报值与实际值之间的误差,提高预报准确率。Moghim等 [16] 通过建立三层前馈式神经网络,结合相对湿度及长波净辐射等天气要素,对南美洲北部CCSM3气温及降水预报的数据值进行订正,发现经前馈式神经网络订正后的数据,不仅提高其与实测数据间的相关系数,同时也改进了它概率分布的结构。朱延和等 [17] 采用U-net网络对2 m气温和10 m风进行订正并分析误差,发现U-net网络能够显著改善序列误差项,从而提高预报技巧。但同时研究也指出,利用神经网络对模式预报结果进行订正,一方面需要保证有足够的训练样本,从而能够包含各种情况。另一方面需要保证其预测期和训练期的气候态没有发生变化。因为神经网络对于数据的订正仅仅是基于其统计关系,并未考虑到其中的物理过程。一旦气候态发生变化,则其模式产生的偏差会有系统性的变化,之前训练的神经网络也不再适用。

3.1.2. 概率预报

在概率预报方面,神经网络模型主要基于模式计算得到的各类气象要素预测值,结合实际观测数据,从而得到某一情况发生的概率。概率预报通常分为二分类预报及多分类预报。前者预测的目标只是某种单一类别情况发生的概率大小,如应用在定量降水概率预报上,针对某一阈值,计算降水超过该阈值的可能性:Yuan等 [18] 通过建立三层前馈式神经网络,根据美国西南部的四个区域冬季12 h降水预报,设立15个降水阈值,分别计算降水超过各个阈值的概率。研究结合了11个降水预报值及临近的7个降水阈值概率。结果发现,订正后的预报技巧有一定程度的提升,但订正效果随地理环境及降水阈值的改变有较大区别。后者则神经网络的输出对应多个类别,输出值为各类别情况发生的可能性。如Roebber等 [19] 对降雪深度划分3个等级,利用月太阳辐射,温度等相关数据,对美国陆地区域降雪深度的等级进行评估,结果较以往分类预报正确率提高近20%;Kretzschmar等 [20] 利用实测风资料及模式预报的相关输出变量对风进行分类预报,准确率和误报率都有较好的进步。

除此之外,国内外学者也尝试通过神经网络方法,制作各气象要素的概率密度曲线,从而提高预报概率的准确性。Rasp等 [21] 针对德国地区2 m气温48 h预报值,建立单层前馈式神经网络,得出其概率分布的均值及方差,从而求得其气温的概率分布,所得结果的CRPS评分低于EMOS方法。随后,Peng等 [22] 尝试将该方法应用于中国地区气温的延伸期预报上,也获得较为理想的预报效果。

3.2. 图像特征提取

在气象领域中,对图像加以利用的传统方式有两种:一为通过相关研究者的经验分析,从中提取相关信息;二为利用图片中一些相关的特征值,对图像中的信息加以利用。但是,研究人员的主观经验较计算机而言,工作效率较低,且受各方面因素影响较大;而在图像中提取相关的特征值,无法全面地挖掘图像所包含的所有信息。而神经网络特征提取方面具有强大功能,能够全面且有效地提取图像特征,并且在一定程度上减少噪声对图像信息的影响 [23] ,对于气象领域图像信息的挖掘有所帮助。

神经网络在气象领域中对于图像信息的应用主要分为两个方面,一为对图像中现象的识别;二为挖掘图片中蕴含的信息,从而对其他气象要素进行估计。

3.2.1. 图像识别

在图像识别方面,主要是利用神经网络的分类功能,通过设定不同的类别,计算图像中包含对应现象的概率大小。目前的主要应用是对极端天气现象的识别和对云的识别。

对于极端天气的侦测,传统方法主要依靠经验,对相关变量在时间和空间上设定阈值来判断,如,热带气旋的鉴别主要在于中心低压,暖核结构及其附近的强风场,但是目前没有全球范围内的统一标准,其低压和暖核的标准对于各人也有所差异 [24] 。基于神经网络的系统,能够从复杂的多变量气候数据中进行学习,从而避免设定一个固定的阈值。同时,随着神经网络隐藏层数目和神经元的增多,能够灵活而深入地学习图像的特征,从而对其进行正确的分类。Liu [25] 利用卷积神经网络,对热带气旋、大气流、和锋面现象进行识别。该研究输入数据为由气候模拟和再分析数据的相关变量组合形成的图片,分别对三种天气现象建立卷积神经网络,分析在图片中是否存在对应的天气现象。在测试期对这三种极端天气的侦测,热带气旋、大气流和锋面侦测的正确率分别达到99%、90%和89.4%。但是在该研究中,为方便训练,对输入的图片预。先进行裁剪,使得天气现象位于对应图片的中心,并且未考虑极端天气现象随时间的变化。随后,Racah等 [26] 在此基础上,对于极端天气的识别又进行了进一步的研究。与之前的研究相比,该研究通过建立三维卷积神经网络,考虑极端天气现象随时间的变化情况;同时通过建立单独的卷积神经网络,实现对多种类别极端天气现象的识别;并且对输入的图片未进行裁剪,提高了网络的适用性。

目前对云的分类主要依靠卫星及地面观测。虽然气象卫星等观测手段为研究者们提供了大量时空分辨率较高的云图,也让众多算法(如局部二值模式法 [27] 、二元决策树 [28] 等)开始用于云的分类,但分类结果的准确性较低,参与分类的云的种类也较少。由于云的特征随时空变化较大,传统的算法难以捕捉到它的特征从而进行分类,而深度神经网络拥有良好的自适应性,能够捕捉云的各种类别中深层的特征,从而成为一种准确性更高的分类方法。Zhang等 [29] 对包含轨迹云在内的11种云类别建立数据库,并基于卷积神经网络,构建专门用于云分类的CloudNet。CloudNet的综合分类准确性达到88%,较其他方法有较大提升。Zhang等 [30] 构建卷积神经网络,对葵花8号卫星数据进行训练,成功识别了对流云。但是,由于不同卫星数据具有不兼容的特点,针对单一数据来源建立的深度神经网络泛化能力不足,孔祥宇等 [31] 将卷积神经网络和域迁移技术结合,实现了不同卫星数据的融合,有效提高云分类模型的泛化性能。

3.2.2. 遥感图像信息提取

基于遥感的降水产品主要是根据遥感不同波长光谱反馈的信息,建立相关关系,间接对降水进行估计。传统的一些方法,在算法中引入一些假设,从而导致误差的产生,如在气温较高时会对降水估计值偏高 [32] ;也常常会忽略低云降水 [33] 。神经网络较其他方法,能够更加深入地挖掘遥感光谱图像包含的信息,从而建立其与降水之间的关系模型,从而减少降水预报产品的偏差。

Hsu等 [34] 于1997年构建PERSIANN算法,利用卫星所得的临近云顶亮温数据,建立四层前馈式神经网络,对降水进行估计。此后,相关学者利用PERSIANN算法对于美国中部 [35] 、伊朗 [36] 等地区的降水进行估计,均取得较好的成果。但是,PERSIANN算法的输入值为子领域中格点要素值的均值和平方差,无法完全挖掘相关图像蕴含的所有信息。Tao等 [37] 通过建立四层深度神经网络,以GOES提供的原始红外光谱图像数据作为输入,从原始数据中提取全面且有价值的信息,从而有效地减少卫星降水产品的偏差。该研究自美国中部地区12年及13年冬季和夏季的数据随机抽取,作为训练集及验证集,对两个季节分别建立网络,网络的每个隐藏层设置1000个节点。估计结果与同样以GOES为源数据的PERSIANN-CCS算法相比,平均偏差由0.091 mm/d (夏),0.054 mm/d (冬)降为0.002 mm/d (夏),0.012 mm/d (冬)。但是研究也指出,深度神经网络的方法对卫星降水估计漏报的现象改进不明显,且由于深层神经网络的训练需要大量数据,对数据较少的地区应用效果不是很好。

3.3. 天气预报

对于天气要素的预报,目前以数值模式预报为主。最新数值预报技术有以下三个研究重点:1) 分析多个对象和预报变量间的统计学关系,进行多元统计分析;2) 基于数值模式的预报结果和统计学规律,定量预报未来某一天气现象发生的概率;3) 通过提取时间序列变量的相关统计特征及其他特征,进行时间序列分析 [38] 。近年来,随着计算能力的进步,数值模式预报的时空分辨率得到进一步的提升 [39] ,而高分辨率的数值预报模式也促进了对流等系统预报技巧的提升 [40] 。神经网络可以在数值预报模式发展的同时,在模式预报仍有局限的领域,为模式提供辅助作用,从而扩大预报时效范围,进一步提高预报的精度和准确性。

3.3.1. 台风预报

虽然在近10年中,对台风路径的预报误差逐步减小至50 km,但对于台风强度的预报仍是一个重大的挑战 [41] 。Jiang等 [42] 改变传统模式预报中设定海表温度为固定值 [43] 或实时观测值 [44] 的方法,尝试将神经网络和台风预报模式相结合,用于提高台风强度预报的准确性。研究通过前馈式神经网络,深层神经网络及深层旋转神经网络对海表温度进行预报,并将预报值作为WRF模式海表边界参数预测台风强度。结果表明,与神经网络相结合的WRF模式预报结果与原模式相比,修正了原模式中由于忽视SSTC效应所导致的预报强度偏高现象;深层神经网络较浅层神经网络预报结果更为准确。主要原因在于深层神经网络将大气变量与海洋变量分别由不同的神经元进行处理,并且浅层神经网络结构较为简单,对于输入变量的扰动更为敏感。

3.3.2. 短时临近预报

虽然数值预报模式的分辨率和性能都有很大的提升,但面对短时临近预报时,仍有较大的局限性。数值预报模式的初始动力调整需要一定时间,因此在处理预见期较短的预报时,需要更有效的同化方法及高质量、高分辨率的资料来减少Spin-up时间,使预报时模式的动力关系达到稳定 [45] 。为了弥补模式预报的局限性,实际情况中通常采用外推法进行短时临近预报。外推法是基于统计的方法,利用当前及过去的情况进行外推,预报未来时刻的情况。较模式预报而言,外推法预报结果在前几小时内准确性更高,且计算成本较低 [46] 。神经网络模型在外推法预报中有广泛的应用。

Kuligowski等 [47] 构建三层前馈神经网络,利用700 hpa风向及周边地区的降水情况进行6 h区域降水预报,其结果较传统模式预报有所改进。张乐坚等 [48] 对比前馈式神经网络、支持向量机(Support Vector Machine, SVM)和交叉相关法对1 h和3 h降水的预报能力,得出前馈式神经网络的预报结果优于SVM和交叉相关法。但是,前馈式神经网络由于其提取特征的能力有限,只适用于较小的区域内,并且无法得到变量随时间变化的特征。

为从变量的时间序列中提取特征,从而更加准确地对未来情况进行预测,研究者们尝试构建循环神经网络模型。Asanjan等 [49] 通过构建Elman循环神经网络模型及长短期记忆模型,对0~6 h云顶亮温进行预测,并利用PERSIANN算法估计降水。结果表明,与RAPv1.0数值预报模式相比,Elman网络及长短期记忆模型在前期预测准确性较高;后随时间增加,两者准确性差距逐渐减小,但长短期记忆模型预测的各统计值(RMSE, POD等)均一直优于RAPv1.0。同时,长短期记忆模型较Elman模型预测结果更为准确,且误差随预报时效的延长,增加速度更慢。主要原因在于,Elman网络随着时间的延长会存在梯度爆炸或消失的现象,难以储存较长时间前的信息;而长短期记忆模型由于“门”的设计,能够更加有效的利用数据信息并更新内存,从而处理长期依赖问题。虽然长短期记忆模型能够提取时间序列特征从而进行预测,但是,它模型的输入值是各个格点的一维变量时间序列,不包含空间信息,从而带来一定程度的误差。

研究学者们尝试将长短期记忆模型与卷积神经网络模型相结合,从而能够充分提取变量时间、空间上的特征。Shi等 [50] 尝试在长短期记忆模型中加入卷积操作,组成ConvLSTM模型。该模型先对输入的变量数据进行卷积操作,提取空间信息,再输入至长短期记忆模型中。利用ConvLSTM模型对香港地区进行临近降水预报,预报结果与利用光流失量的ROVER相比,MSE由1.68降至1.42,相关系数由0.85上升至0.9。郭瀚阳等 [51] 受此启发,将ConvLSTM模型中的长短期记忆单元改为其的简化版本——GRU,构成多层卷积GRU模块,并嵌入自编码模型,使得输出序列长度可以和输入序列长度不等。利用该模型预报的未来1 h内逐6 min雷达回波演变特征,较传统外推法,对强对流的预报准确性有明显提升。韩丰等 [52] 将长短期记忆单元扩展的ST-LSTM模型的承接层和隐藏层的输出,由前馈式计算改为卷积操作,对北京及广州30 min,60 min的雷达反射率因子进行预报,其结果较基于交叉相关法的雷达外推预报,准确率同样有较大提升。之后,相关研究团队先后提出PredRNN++ [53] 、PredRNNv2 [54] 等模型,用于处理雷达图像外推过程中存在的梯度消失问题,使得预测结果有了进一步地提升。

3.3.3. 神经网络预报的局限性

虽然神经网络在短时临近预报方面,可以一定程度上弥补数值预报模式的缺陷,但是,就目前研究而言,神经网络不能完全取代数值模式预报。Dueben等 [55] 通过对比数值预报模式和神经网络模型对500 hPa高度场在不同预见期内的预报误差发现,随着预见期的增加,神经网络模型误差增长的速度远快于数值预报模式。主要原因在于,根据训练期数据确定的神经网络模型,其内部的物理结构不会再发生变化,而真实的大气是一个时刻变化、包含许多不确定性的系统,因此难以对气象要素变量进行长期稳定的预报。另一方面,处理预见期较长的预报问题时,神经网络模型通常会采用迭代的方式进行预报。为保证预报的准确性,用迭代的方式进行神经网络预报时,其预报的分辨率往往会降低或要求预测变量的变化较慢,从而导致了神经网络模型在中长期预报方面的预报能力难以和数值预报模式相比。

4. 总结与展望

本文系统地回顾了近些年来神经网络模型在图像信息提取、数值模式后处理及天气预报方面的应用,并分析了目前神经网络应用的局限性。综合来看:

1) 与传统的气象学方法相比,基于神经网络的方法能够有效减小数值预报中的误差,从而得到更为准确的确定性预报或概率预报结果,也能够在短时临近预报、台风预报等方面有所改进。

2) 在中长期的预报中,神经网络模型的预报准确性低于数值模式的预报结果。因此,目前的神经网络不能完全取代数值预报模式,只能在一定程度上弥补数值预报模式的缺陷。

3) 目前的神经网络模型,尤其是深度神经网络模型仍处于起步阶段,在气象领域中的应用也只是初步的尝试,离用于实际业务中还有很长的距离。

通过回顾,本文对气象领域中神经网络模型的应用提出如下几点期望:

首先,在气象领域尝试应用更多先进的神经网络模型。目前应用于气象领域的神经网络模型种类较少,仍以卷积神经网络模型及长短期记忆模型为主。随着深度学习的不断发展,各类用于处理不同情况的神经网络模型相继出现,可以尝试将最新发展的神经网络模型应用于气象领域。

其次,在多方面将神经网络模型和数值预报模式相结合。从目前研究来看,神经网络模型主要用于为数值模式提供参数化方案、订正预报结果方面。研究者们可以尝试从多方面进行探索,发挥两种方法的优势,进一步提高预报的精度和准确性。

最后,为神经网络模型的应用提供更多高质量的数据资料。神经网络模型性能在一定程度上依赖于训练期的数据质量,充足且高质量的数据是建立稳健的神经网络的前提。虽然目前观测技术的提升带来了大量精度、质量较高的观测数据,但在某些方面(如龙卷、冰雹等)的数据仍十分缺乏,这也成为神经网络应用的一个障碍。

综上所述,通过对以上各方面的研究,能够将神经网络模型与传统气象方法进一步结合,提高气象预报的质量和精度,更加深入地研究各现象背后的规律,推动气象领域的进一步发展。

基金项目

本文获2023年宁波市气象局科技青年项目(NBQX2023007C)支持。

参考文献

[1] Rumelhart, D.E., Hinton, G.E. and Williams, R.J. (1986) Learning Representations by Back-Propagating Errors. Nature, 323, 533-536.
https://doi.org/10.1038/323533a0
[2] Cortes, C. and Vapnik, V. (1995) Support-Vector Networks. Machine Learning, 20, 273-297.
https://doi.org/10.1007/BF00994018
[3] Breiman, L. (1996) Bagging Preditors. Machine Learning, 24, 123-140.
https://doi.org/10.1007/BF00058655
[4] 张军阳, 王慧丽, 郭阳, 等. 深度学习相关研究综述[J]. 计算机应用研究, 2018, 35(7): 1-12.
[5] 朱光辉, 王喜文. ChatGPT的运行模式、关键技术及未来图景[J]. 新疆师范大学学报(哲学社会科学版), 2023, 44(4): 113-122.
[6] Bartok, J., Habala, O., Bednar, P., et al. (2010) Data Mining and Integration for Predicting Significant Meteorological Phenomena. Procedia Computer Science, 1, 37-46.
https://doi.org/10.1016/j.procs.2010.04.006
[7] 智协飞, 彭婷, 李刚, 等. 多模式集成的概率天气预报和气候预测研究进展[J]. 大气科学学报, 2014, 37(2): 248-256.
[8] 陈浩, 宁忱, 南卓铜, 等. 基于机器学习模型的青藏高原日降水数据的订正研究[J]. 冰川冻土, 2017(3): 133-142.
[9] 韩旭明. Elman神经网络的应用研究[D]: [硕士学位论文]. 天津: 天津大学, 2006.
[10] 夏瑜潞. 人工神经网络的发展综述[J]. 电脑知识与技术, 2019, 15(20): 227-229.
[11] 周飞燕, 金林鹏, 董军. 卷积神经网络研究综述[J]. 计算机学报, 2017, 40(6): 1229-1251.
[12] 贺丰收, 何友, 刘准钆, 等. 卷积神经网络在雷达自动目标识别中的研究进展[J]. 电子与信息学报, 2020, 42(1): 119-131.
[13] Mao, J. and Xu, W. (2014) Explain Images with Multimodal Recurrent Neural Networks.
[14] 夏瑜潞. 循环神经网络的发展综述[J]. 电脑知识与技术, 2019, 15(21): 182-184.
[15] Hsieh, W.W. and Tang, B. (1998) Applying Neural Network Models to Prediction and Data Analysis in Meteorology and Oceanography. Bulletin of the American Meteorological Society, 79, 1855-1870.
https://doi.org/10.1175/1520-0477(1998)079<1855:ANNMTP>2.0.CO;2
[16] Moghim, S. and Bras, R.L. (2017) Bias Correction of Climate Modeled Temperature and Precipitation Using Artificial Neural Networks. Journal of Hydrometeorology, 18, 1867-1884.
https://doi.org/10.1175/JHM-D-16-0247.1
[17] 朱延和. 基于U-Net神经网络的新疆地面气温和风的预报订正研究[D]: [硕士学位论文]. 南京: 南京信息工程大学, 2023.
[18] Yuan, H., Gao, X., Mullen, S.L., et al. (2007) Calibration of Probabilistic Quantitative Precipitation Forecasts with an Artificial Neural Network. Weather and Forecasting, 22, 1287-1303.
https://doi.org/10.1175/2007WAF2006114.1
[19] Roebber, P.J., Bruening, S.L., Schultz, D.M., et al. (2003) Improving Snowfall Forecasting by Diagnosing Snow Density. Weather and Forecasting, 18, 264-287.
https://doi.org/10.1175/1520-0434(2003)018<0264:ISFBDS>2.0.CO;2
[20] Kretzschmar, R., Eckert, P., Cattani, D., et al. (2004) Neural Network Classifiers for Local Wind Prediction. Journal of Applied Meteorology, 43, 727-738.
https://doi.org/10.1175/2057.1
[21] Rasp, S. and Lerch, S. (2018) Neural Networks for Post-Processing Ensemble Weather Forecasts. Monthly Weather Review, 146, 3885-3900.
https://doi.org/10.1175/MWR-D-18-0187.1
[22] Peng, T., Zhi, X.F., Ji, Y., et al. (2020) Prediction Skill of Extended Range 2-M Maximum Air Temperature Probabilistic Forecasts Using Machine Learning Post-Processing Methods. Atmosphere, 11, 823-835.
https://doi.org/10.3390/atmos11080823
[23] 许锋, 卢建刚, 孙优贤. 神经网络在图像处理中的应用[J]. 信息与控制, 2003, 32(4): 344-351.
[24] Nolan, D.S. and Mcgauley, M.G. (2012) Tropical Cyclogenesis in Wind Shear: Climatological Relationships and Physical Processes. In: Oouchi, K. and Fudeyasu, H., Eds., Cyclones: Formation, Triggers, and Control, Nova Science Publishers, Hauppauge, 1-36.
[25] Liu, Y., Racah, E., Prabhat, et al. (2016) Application of Deep Convolutional Neural Networks for Detecting Extreme Weather in Climate Datasets.
[26] Racah, E., Beckham, C., Maharaj, T., et al. (2016) Semi-Supervised Detection of Extreme Weather Events in Large Climate Datasets.
[27] Ojala, T., Pietikäinen, M. and Mäenpää, T. (2000) Gray Scale and Rotation Invariant Texture Classification with Local Binary Patterns. Computer Vision-ECCV 2000, 6th European Conference on Computer Vision, Dublin, 26 June-1 July 2000, 404-420.
[28] Buch, K.A. and Sun, C.H. (1995) Cloud Classification Using Whole-Sky Imager Data. 9th Symposium on Meteorological Observations & Instrumentation, Vol. 16, 353-358.
[29] Zhang, J.L., Liu, P., Zhang, F., et al. (2018) CloudNet: Ground-Based Cloud Classification with Deep Convolutional Neural Network. Geophysical Research Letters, 45, 8665-8672.
https://doi.org/10.1029/2018GL077787
[30] Zhang, X., Wang, T., Chen, G., et al. (2019) Convective Clouds Extraction from Himawari-8 Satellite Images Based on Double-Stream Fully Convolutional Networks. IEEE Geoscience and Remote Sensing Letters, 17, 553-557.
https://doi.org/10.1109/LGRS.2019.2926402
[31] 孔祥羽. 基于域迁移的气象卫星图像云分类技术研究[D]: [硕士学位论文]. 北京: 北京邮电大学, 2023.
[32] Sapiano, M.R.P. and Arkin, P.A. (2009) An Intercomparison and Validation of High-Resolution Satellite Precipitation Estimates with 3-Hourly Gauge Data. Journal of Hydrometeorology, 10, 149-166.
https://doi.org/10.1175/2008JHM1052.1
[33] Behrangi, A., Hsu, K.L., Imam, B., et al. (2009) PERSIANN-MSA: A Precipitation Estimation Method from Satellite-Based Multispectral Analysis. Journal of Hydrometeorology, 10, 1414-1429.
https://doi.org/10.1175/2009JHM1139.1
[34] Hsu, K.L., Gao, X., Sorooshian, S., et al. (1997) Precipitation Estimation from Remotely Sensed Information Using Artificial Neural Networks. Journal of Applied Meteorology, 36, 1176-1190.
https://doi.org/10.1175/1520-0450(1997)036<1176:PEFRSI>2.0.CO;2
[35] Aghakouchak, A., Behrangi, A., Sorooshian, S., et al. (2011) Evaluation of Satellite-Retrieved Extreme Precipitation Rates across the Central United States. Journal of Geophysical Research Atmospheres, 116, D02115.
https://doi.org/10.1029/2010JD014741
[36] Katiraie-Boroujerdy, P.S., Nasrollahi, N., Hsu, K.L., et al. (2013) Evaluation of Satellite-Based Precipitation Estimation Over Iran. Journal of Arid Environments, 97, 205-219.
https://doi.org/10.1016/j.jaridenv.2013.05.013
[37] Tao, Y., Gao, X., Hsu, K., et al. (2016) A Deep Neural Network Modeling Framework to Reduce Bias in Satellite Precipitation Products. Journal of Hydrometeorology, 17, 931-945.
https://doi.org/10.1175/JHM-D-15-0075.1
[38] 杨函. 基于深度学习的气象预测研究[D]: [硕士学位论文]. 哈尔滨: 哈尔滨工业大学, 2017.
[39] Vojtěch, B., Zbyněk, S. and Petr, Z. (2017) Nowcasting of Deep Convective Clouds and Heavy Precipitation: Comparison Study between NWP Model Simulation and Extrapolation. Atmospheric Research, 184, 24-34.
https://doi.org/10.1016/j.atmosres.2016.10.003
[40] Sun, J., Xue, M., Wilson, J.W., et al. (2014) Use of NWP for Nowcasting Convective Precipitation: Recent Progress and Challenges. Bulletin of the American Meteorological Society, 95, 409-426.
https://doi.org/10.1175/BAMS-D-11-00263.1
[41] Gall, R., Franklin, J., Marks, F., et al. (2013) The Hurricane Forecast Improvement Project. Bulletin of the American Meteorological Society, 94, 329-343.
https://doi.org/10.1175/BAMS-D-12-00071.1
[42] Jiang, G.Q., Xu, J. and Wei, J. (2018) A Deep Learning Algorithm of Neural Network for the Parameterization of Typhoon-Ocean Feedback in Typhoon Forecast Models. Geophysical Research Letters, 45, 3706-3716.
https://doi.org/10.1002/2018GL077004
[43] Chen, H., Zhang, D.L., Carton, J., et al. (2011) On the Rapid Intensification of Hurricane Wilma. Part I: Model Prediction and Structural Changes. Weather and Forecasting, 26, 885-901.
https://doi.org/10.1175/WAF-D-11-00001.1
[44] Zhu, T. and Zhang, D.L. (2006) The Impact of the Storm-Induced SST Cooling on Hurricane Intensity. Advances in Atmospheric Sciences, 23, 14-22.
https://doi.org/10.1007/s00376-006-0002-9
[45] Wang, G., Yang, J., Wang, D., et al. (2016) A Quantitative Comparison of Precipitation Forecasts between the Storm-Scale Numerical Weather Prediction Model and Auto-Nowcast System in Jiangsu, China. Atmospheric Research, 181, 1-11.
https://doi.org/10.1016/j.atmosres.2016.06.004
[46] Zahraei, A., Hsu, K.L., Sorooshian, S., et al. (2012) Quantitative Precipitation Nowcasting: A Lagrangian Pixel-Based Approach. Atmospheric Research, 118, 418-434.
https://doi.org/10.1016/j.atmosres.2012.07.001
[47] Kuligowski, R.J. and Barros, A.P. (1998) Experiments in Short-Term Precipitation Forecasting Using Artificial Neural Networks. Monthly Weather Review, 126, 470-482.
https://doi.org/10.1175/1520-0493(1998)126<0470:EISTPF>2.0.CO;2
[48] 张乐坚, 程明虎, 田付友, 等. 人工神经网络及支持向量机在降雨量预报中的应用[J]. 高原气象, 2010, 29(4): 982-991.
[49] Asanjan, A.A., Yang, T.T., Hsu, K.L., et al. (2018) Short-Term Precipitation Forecast Based on the PERSIANN System and the Long Short-Term Memory (LSTM) Deep Learning Algorithm. Journal of Geophysical Research Atmospheres, 123, 12543-12563.
https://doi.org/10.1029/2018JD028375
[50] Shi, X.J., Chen, Z., Wang, H., et al. (2015) Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting.
[51] 郭瀚阳, 陈明轩, 韩雷, 等. 基于深度学习的强对流高分辨率临近预报试验[J]. 气象学报, 2019, 77(4): 715-727.
[52] 韩丰, 龙明盛, 李月安, 等. 循环神经网络在雷达临近预报中的应用[J]. 应用气象学报, 2019, 30(1): 63-71.
[53] Wang, Y.B., Gao, Z.F., Long, M.S., et al. (2018) PredRNN : Towards a Resolution of the Deep-in-Time Dilemma in Spatiotemporal Predictive Learning. International Conference on Machine Learning, Stockholm, 10-15 July 2018, 5110-5119.
[54] Wang, Y.B., Wu, H.X., Zhang, J.J., et al. (2023) PredRNN: A Recurrent Neural Network for Spatiotemporal Predictive Learning. IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 45, 2208-2225.
https://doi.org/10.1109/TPAMI.2022.3165153
[55] Dueben, P.D. and Bauer, P. (2018) Challenges and Design Choices for Global Weather and Climate Models Based on Machine Learning. Geoscientific Model Development, 11, 3999-4009.
https://doi.org/10.5194/gmd-11-3999-2018