1. 引言
在全球气候变暖的大背景下,全球水分循环发生了明显变化,干旱和洪涝等极端天气事件频发,对全球和区域水资源、生态系统和社会经济发展等产生了深刻影响 [1] [2]。水分是影响作物生长发育及其最终产量的重要因素之一,因此学者们对水分因素与作物产量之间的关系进行了大量研究,并根据不同的研究目的和生产要求建立了一些作物产量和水分之间的函数关系式,即作物水分生产函数,该函数是优化作物灌溉机制和水分时空合理配置的理论基础 [3]。
水分生产函数主要有全生育期水分生产函数和阶段性水分生产函数两大类,目前学者们对冬小麦水分生产函数展开了大量研究。田丰 [4] 对冬小麦水分生产函数及水肥耦合关系进行试验研究,建立了冬小麦水分生产函数的Jensen模型和人工神经网络模型;杨路华 [5] 分析了河北平原冬小麦耗水量与产量的关系,对比分析结果表明Jensen模型是最适模型。彭致功 [6] 基于北京市大兴区冬小麦遥感监测耗水与产量数据,研究发现冬小麦全生育期水分生产函数模型宜采用抛物线模型,冬小麦分生育阶段的水分生产函数宜选用Stewart模型。吴训 [7] 基于根系加权土壤水分有效性的植物水分亏缺指数与基于归一化热单元指数的S型累积水分敏感指数,结果表明根系加权PWDI与S型水分敏感指数累积函数融合可用于合理构建冬小麦水分生产函数。曹秀清 [8] 根据肥东八斗灌溉试验重点站冬小麦灌溉试验资料,利用多元回归分析方法得出江淮丘陵区冬小麦水分生产函数模型宜选用Jensen模型。汪顺生 [9] 研究了宽垄沟灌种植条件下冬小麦的水分生产函数,结果显示冬小麦产量与生育期内总耗水量呈二次抛物线关系,两者相关系数达到0.97。上述作物水分函数的计算相对比较简便、所需数据量小,但是模型具有很强的区域性,且不能跨作物品种推广 [10]。
四川省是我国冬小麦主产区之一,较准确地估算冬小麦产量对于国家粮食安全和农业规划布局具有重要意义。在作物水分生产函数中如何准确估算作物蒸散量始终是研究难点。近年来随着计算机技术的进步,人工智能模型因计算能力独特,纠错力、自组织和自适应能力,被广泛应用于估算参考作物蒸散量 [11] [12] [13] [14]。本文以四川省东北区域冬小麦为研究对象,首先基于逐步线性回归模型、回归树模型、支持向量机和广义神经网络算法4种人工智能算法,模拟比较得出适合该区域的最优参考作物蒸散量模型;接着将基于最优模型计算所得的作物蒸散量作为水分生产函数的输入量,比较线性和抛物线模型的拟合效果,通过实际数据验证明确最适合模拟本区冬小麦产量的模型。
2. 材料与方法
2.1. 研究区概况
四川盆地属于中亚热带湿润气候特征,表现为四季分明,无酷暑和严寒,日照少,潮气重。气温东高西低,南高北低,盆底高而边缘低,等温线分布呈现同心圆状。盆地边缘山地气温具有垂直分布特点。盆地东北部为冬小麦主产区,该区全年温暖湿润,年均温16℃~18℃,日温 ≥ 10℃的天数持续期可达到240~280天,积温达到4000℃~6000℃,气温日较差小,年较差大,冬暖而夏热无霜期可达230~340天。盆地云量较多,晴天较少,降水较丰富,年降水量达1000~1200 mm。
2.2. 数据来源
本文数据来源于国家气象中心编制的1978~2016年中国地面气象数据集(V3.0)气象数据,在数据采集过程中,选取了广元站、绵阳站、巴中站、达川站、遂宁站5个代表性站的逐日气象数据,包括最高温度(Tmax)、最低温度(Tmin)、平均湿度(Rmean)、日照时数(n)、风速(u2)等6个气象因子,缺失数据采用线性插值法补足。冬小麦产量数据来自2000~2016年《四川年鉴统计》。
2.3. 研究方法
2.3.1. 参考作物蒸散量ET0计算方法
Penman-Monteith模型是国际粮农组织FAO推荐的参考作物蒸散量(ET0)标准计算方法 [15],该公式以辐射项和空气动力学项为基本原理,综合考虑了各种气象条件,故公式计算精度较高。但由于该公式所需气象要素比较多,在很多地区都很难获得,因此如何基于缺失气象条件估算ET0始终是研究热点。本文以Penman-Monteith模型计算的ET0为标准值,评估逐步线性回归模型(SLR)、回归树模型(RT)、支持向量机(SVM)和广义神经网络算法(GRNN) 4种人工智能模型对ET0的模拟精度,从中选择最优模型作为该区域ET0的模型。SLR、RT、SVM和GRNN4种模型的基本原理分别参阅文献 [15] [16] [17] [18],具体模拟过程利用MATLAB软件进行。
2.3.2. 作物水分生产函数
本文选取2007~2016年观测资料比较齐全的巴中、绵阳、遂宁3个站点数据和年鉴统计所得的冬小麦产量数据,基于全生育期水分生产函数模型,评估线性和抛物线模型在本区的适用性。为避免作物品种变化和农田管理方法引起的误差,本研究将奇数年数据作为训练组,偶数年数据作为测试组。线性和抛物线水分生产函数模型具体形式如下:
线性模型:
(1)
抛物线模型:
(2)
式中a1、b1、a2、b2、c2均为经验系数;ET为作物全育期实际蒸散量,与参考作物蒸散量ET0的关系如下 [19]:
(3)
Kc为作物系数,受当地作物品种、农田管理方式、土壤类型和气候特征等因子影响,具有明显的区域性。本文在不同地区、不同月份选用了不同的冬小麦作物系数Kc,如表1所示。
![](Images/Table_Tmp.jpg)
Table 1. Crop coefficient of winter wheat in northeast Sichuan
表1. 四川东北区域冬小麦作物系数
出自《四川省农田水分盈亏与农业干旱评估研究》(四川省水利电力研究所1999年5月)。
2.3.3. 模型验证方法
模型精度评估选择均方根误差(RMSE)、平均绝对误差(MAE)、纳什效率系数(NSE) [20]、决定系数(R2) 4个评估因子,评估每个模型的计算结果和标准值的误差以及一致性,计算公式如下:
(4)
(5)
(6)
(7)
式中:n为收据样本数量,Ci为观测的第i个值,Pi为模型计算的第i个标准值,
为Ci的平均值,
为Pi的平均值,Xi和Yi分别为模型模拟值及实测值,
为Xi的平均值。RMSE用以衡量拟合值与标准值之间的偏差,该值越小说明偏差越小。MAE是绝对误差的平均数,能够更好地反应预测值与标准值的偏差情况。NSE值越接近1,说明模型精度越高,模型的适用性越强。R2是两个变量之间线性关系的度量,其越接近1说明该模型更适用。
3. 结果与分析
3.1. 不同算法的日值对比
为了检验4种智能模型在四川盆地东北区域ET0计算中的适用性,分别训练了1978~2006年不同气象要素组合条件下的4种人工智能蒸散,然后以2007~2016年的逐日气象数据作为测试组模拟ET0,并以Penman-Monteith模型计算的结果为标准,基于RMSE、MAE、NSE和R2统计指标来评估各个人工智能模型的模拟精度。
如表2所示,同一模型在不同气象因子输入条件下其模拟精度存在明显差异。在组合1时(输入气象因子为Tmax, Tmin, Rmean, n, u2),SLR、RT、SVM、GRNN模型的统计指标均达到其最优状态,即RMSE和MAE最接近于0,NSE和R2最接近于1,例如SLR模型的RMSE仅为0.272 mm/d、MAE仅为0.215 mm/d,NSE和达R2分别达到了0.966和0.968。
当相对湿度Rmean、日照时数n和风速u2这3个气象因子缺少任何一个时,各个模型对ET0的模拟精度略有下降,体现为RMSE和MAE小幅增加,同时NSE和R2小幅下降。例如在SLR模型中,当缺乏Rmean因子时(即组合2),RMSE由组合1条件下的0.272 mm/d增加到0.337 mm/d,MAE由组合1条件下的0.215 mm/d增加到0.265 mm/d,与此同时,R2由原来的0.968下降到0.948,NSE由原来的0.966下降到0.946;当没有u2因子时(即组合3),RMSE由组合1条件下的0.272 mm/d增加到0.353 mm/d,MAE由组合1条件下的0.215 mm/d增加到0.273 mm/d,与此同时R2由原来的0.968下降到0.944,NSE由原来的0.966下降到0.941;当没有n因子时(即组合4),RMSE由组合1条件下的0.272 mm/d增加到0.472 mm/d,MAE由组合1条件下的0.215 mm/d增加到0.361 mm/d,R2由原来的0.968下降到0.904,NSE由原来的0.966下降到0.891。
在输入的气象因子中,当没有Tmax和Tmin时,各模型模拟精度显著下降。例如在SLR模型中,RMSE和MAE分别由组合1条件下的0.272 mm/d和0.215 mm/d增加到0.879 mm/d和0.725 mm/d,与此同时R2和NSE由组合1条件下的0.968和0.966分别下降到0.654和0.452;
通过以上分析可见,在组合1条件下各模型的模拟精度均比较高,说明Tmax、Tmin、Rmean、n、u2都直接影响ET0,在构建人工智能模型时如果能够获得这些因子,那么模型的模拟效果最优。当没有Rmean、u2和n这些因子之一时,模型的模拟精度略有下降。但是当没有Tmax和Tmin时,各模型模拟精度均显著下降,这说明温度是影响水分蒸散的重要因子,在选择模型输入参数时是必须要考虑的因子。
其次从不同模型模拟的精度来看,当输入气象因子相同时,不同人工智能模型的模拟效果亦明显不同,但比较发现GRNN模型的模拟效果始终是最好的。例如当输入气象因子为Tmax、Tmin、Rmean、n、u2时,在所有模型中GRNN模型的RMSE、MAE和MSE值最小,分别为0.225 mm/d和0.193 mm/d,同时NSE和R2值最大,都达到了0.970;当输入气象因子为Tmax、Tmin、Rmean和n时,GRNN模型的RMSE、和MAE为4个模型中最小的,分别为0.336 mm/d和0.253 mm/d,同时NSE和R2最大为0.948和0.947。总之,在4个人工智能模型中,GRNN模型对四川地区冬小麦产区的蒸散量模拟效果最优,且当输入气象因子组合为Tmax、Tmin、Rmean、n、u2时模拟精度最高。
![](Images/Table_Tmp.jpg)
Table 2. Day-by-day ET0 simulation accuracy of four artificial intelligence models
表2. 四种人工智能模型逐日ET0模拟精度
注:SLR-1表示SLR算法在气象因子组合1下的模型,其它模型名同理。
3.2. 作物水分生产模型参数确定
由于受气候条件、土壤类型、灌溉措施、作物种类及品种等因素的影响,作物水分生产函数的系数在不同地区差异较大,必须基于实际数据经回归分析确定 [21]。本文以奇数年(2007, 2009, 2011, 2013, 2015年)数据为训练组,建立5种气象条件组合下GRNN模型计算的ET0,然后根据表1所示的作物系数和公式(3)计算出冬小麦发育期实际蒸散量,进而建立与冬小麦产量之间的散点图。
如图1所示,在不同地区不同输入气象因子条件下,各模型对冬小麦产量的模拟精度存在明显差异。遂宁地区在组合1、组合4和组合5条件下,抛物线模型的R2为0.39~0.73,模拟效果明显优于线性模型的R2 (0.02~0.19),相反地在组合2条件下,线性模型的模拟效果(R2为0.38)明显优于抛物线模型的模拟效果(R2为0.07);而在组合3条件下,线性模型和抛物线模型模拟效果基本相同,R2分别为0.16和0.17。对于绵阳地区,无论在哪一种组合条件下,冬小麦产量随着蒸散量的增加呈下降趋势,例如线性模型的斜率均为负值。尽管抛物型模型有时的决定系数R2高于线性模型,但是抛物线开口向上,不符合蒸散量对产量影响的一般规律——抛物线开口向下,即在水源充足和灌区管理水平较好地区,产量初始时随着蒸散量的增大而增大,直至蒸散量达到某一值时产量达到最大,随后产量随蒸散量不增反降 [22]。对于巴中地区而言,蒸散量对产量的影响非常符合抛物线模型,且其模拟可靠性明显优于线性模型,抛物线模型的R2变化范围为0.11~0.73,而线性模型的R2变化范围仅为0.0003~0.02。巴中地区抛物型模型对产量的模拟的效果是由于在巴中地区冬小麦生育期内降水比较充沛,其平均降水达到了389.9 mm,在此条件下,蒸散量对产量影响符合开口向下的抛物线形态。相比之下绵阳地区在冬小麦发育期内降水量最小,其降水量较巴中地区减小了40%,仅为232.1 mm。
3.3. 作物水分生产模型精度验证
依据图1建立的线性和抛物线型作物水分生产函数和偶数年份(2008, 2010, 2012, 2014年)的实际蒸散量,对遂宁、绵阳和巴中的冬小麦产量进行了估算,并与实际产量进行了对比,从而评估线性和抛物线型两种作物水分生产函数在四川省东北区域冬小麦主产区的适用性,结果如图2所示。对遂宁地区而言,组合1条件下,线性模型模拟的产量,其与实际产量构成的散点位于1:1之下,说明模拟值偏小,而抛物线模型模拟的产量,其与实际产量构成的散点位于1:1线之上,说明模拟值偏大;在其他组合条件下,线性模型模拟的产量都偏小。对绵阳地区而言,线性模型和抛物线模型整体而言模拟的产量都偏小,除了抛物线模型在组合1和组合4条件下。对巴中地区而言,线性模型对产量的模型精度较差,其R2变化范围为0.167~0.329;相比之下,抛物型模型对产量的模拟精度明显较好,其散点比较均匀地分布在1:1线附近,其R2变化范围为0.565~0.802。总之,不同地区线性模型和抛物线模型对冬小麦产量的模拟存在很大差异,这可能与当地降水量多少、农田管理措施等因素有关。
![](//html.hanspub.org/file/21-2181926x17_hanspub.png?20221201092354390)
Figure 1. Scatterplot between actual evapotranspiration and yield of winter wheat under different combination of meteorological factors
图1. 不同气象因子输入条件下冬小麦实际蒸散量与产量散点图
![](//html.hanspub.org/file/21-2181926x18_hanspub.png?20221201092354390)
Figure 2. Scatterplot between actual yield and simulated yield by linear and parabolic models
图2. 线性和抛物线模型模拟的冬小麦产量与实际产量的散点图
4. 结论
1) 同一模型当输入气象因子为Tmax、Tmin、Rmean、n、u2时模型模拟精度最高,当Rmean、n和u2这3个气象因子缺少任何一个时模拟精度略有下降,当缺少Tmax和Tmin时,各模型模拟精度显著下降。从不同模型模拟精度来看,当输入气象因子相同时,GRNN模型的模拟效果始终是最好的。
2) 在不同地区不同输入气象因子条件下,GRNN模型计算的蒸散量与冬小麦产量关系的拟合精度存在明显差异。遂宁地区不同气象因子组合条件下,适用的模型是不同的。对于绵阳地区,无论在哪一种气象因子组合条件下,冬小麦产量随着蒸散量的增加呈下降趋势,而在巴中地区蒸散量对产量的影响非常符合抛物线模型。
3) 对水分生产函数精度的验证表明在遂宁地区线性模型模拟的产量大部分偏小,而抛物线模型模拟的产量偏大;绵阳地区线性模型和抛物线模型整体而言模拟的产量都偏小;抛物线模型适宜巴中地区。
基金项目
成都信息工程大学2021年大学生创新创业训练计划项目(202110621023)支持。