1. 引言
旱灾是某区域内的降水量不足引起的该区域内的缺水现象[1] [2]。在全球气候发生变化的环境下,旱灾造成的影响受到了越来越多的关注,由于我国气候变化明显,我国旱灾风险也在不断增加。本文掌握河西走廊的农业发展概况,利用基于多维面板数据的灰色关联识别模型找出与旱灾相关度最高的危险性因素和农业生产要素,分析这些因素对农业旱灾的影响,为农业旱灾灾情防控提出建议。有关农业旱灾影响因素的多维量化识别方法前人也有相关研究,如张强等[3]利用相关系数法分析了南方地区五十年来农业旱灾的综合损失率和致灾因子,罗党等[4] [5]基于灰色关联方法对农业旱灾影响因素进行了识别。
河西走廊位于甘肃西北部,东西方向与塔里木盆地和黄土高原相接,南北方向与青藏高原和蒙古高原接壤,是一条狭长地带。河西走廊的绿洲灌溉农业历史久远,农业基础扎实,耕地面积占了甘肃省的18%,却生产出了甘肃省17%的粮食、26%的水果、81%的甜菜、95%的棉花以及30%的油料[6]。自然条件方面,河西走廊属于温带大陆性气候,年日照时数在2600~3250 h左右[7],年平均气温在5.4℃~9.9℃左右[8],年平均风速一般都在2~2.4 m/s。农业生产方面,河西走廊绿洲农业的面积自2010年一直呈扩张趋势[9],由于长期缺水、绿洲农田面积的扩大等原因,河西走廊目前仍需要开采地下水以补充地表水,结构性缺水仍然是制约河西走廊发展的重要原因[10]。
由于喜马拉雅山地壳板块的运动带动了祁连山脉的隆起,水汽更难进入大西北,从而形成了大范围的干旱,而河西走廊就在干旱范围内。河西走廊自东向西,蒸发量在逐渐增加,降水量是逐渐减少的,且不具备雨养农业的发展条件,所以河西走廊发展的是绿洲灌溉农业。以2021年为例,夏季出现高温少雨的现象,多地发生严重旱灾,五月底庆阳北部地区出现旱灾,六月定西等地也出现旱灾,七月中下旬各地旱情明显加重,八月中旬到达干旱最高峰,庆阳、定西等地出现严重旱灾。所以,为河西走廊农业旱灾灾情防控提出建议是必要的。旱灾在我国发生的几率不断增加,利用多维面板数据的灰色关联识别模型对河西走廊的旱灾影响因素进行识别,找出影响程度最大的因素。
2. 资料与方法
2.1. 危险性因素的多维矩阵关联识别
本节以气象因素中的日照时数、降水量、平均风速、气温、平均相对湿度、水资源总量六个因素作为与农业旱灾相关的危险性因素,即自变量,小麦产量作为因变量,利用多维矩阵的灰色关联识别模型对农业相关的危险性因素进行识别。
2.1.1. 数据来源及处理
河西走廊以绿洲灌溉农业为主,东部相较于西部降水较多。搜集河西走廊的武威市、张掖市、酒泉市、金昌市、嘉峪关市五个地区2012~2021年的降水量F1、气温F2、日照时数F3、平均相对湿度F4、平均风速F5、水资源总量F6 (数据来源:甘肃省水资源公报,各地区的统计年鉴)以及这五个地区的小麦产量(数据来源:甘肃省统计年鉴)的数据。
因为各个因素的单位不相同,利用SPSSAU对所获得的降水量、气温、日照时数等六个因素以及小
麦产量进行区间化的无量纲处理得到标准化数据。对于原始指标序列
,若z为序列的算子,有:
,则z称为区间化算子[11]。其中,原始指标序列
表示
的是2012~2021年河西走廊五个地区的各个气象因素以及小麦产量的数值序列,k表示地区,t表示年份。
2.1.2. 计算差异度
在利用面板数据进行灰色模型的分析时,不仅要体现出各个气象因素在某一时刻的空间特性,还要体现出某一时期内的动态特性。本节利用MATLAB计算各气象因素的发展水平、发展速度以及增速水平来体现小麦产量与各气象因素间的变化关系。
发展水平,表示某一时期指标发展的绝对水平,即:
(2.1)
其中,
表示小麦产量与各个气象因素间的绝对距离,
表示为各个气象因素的数值序列,
表示为小麦产量的数值序列。
发展速度,表示某一时期指标发展的相对水平,即:
(2.2)
其中
表示小麦产量与各个气象因素间的相对变化速度。
增速水平,反映指标之间的变化速度的差异程度,即指标在t点的加速度:
(2.3)
其中,
表示小麦产量以及各个气象因素变化量的差异程度,
表示各个气象因素的相对变化速度,
表示小麦产量的相对变化速度,都用来衡量动态速度变化情况[12]。
根据上述分析,可建立关于六个气象因素的发展水平矩阵、发展速度矩阵以及增速水平矩阵,然后依据矩阵的均方根距离公式,可以得出六个因素的发展水平距离
、发展速度距离
以及增速水平距离
。
2.1.3. 计算关联度
计算出六个气象因素的三个矩阵距离之后,则定义
,
,
为六个气象因素的矩阵与小麦产量的灰色关联度,由此可得六个气象因素的矩阵间的综合关联度:
(2.4)
其中
。
2.2. 农业生产要素的多元序列关联识别
粮食产量与农业旱灾的影响因素之间存在密切的多元函数关系,所以本节利用多元序列灰色关联模型对与粮食产量相关的农业生产要素进行识别分析。以河西走廊五个地区的小麦产量作为因变量,分析河西走廊五个地区的小麦产量与农业生产要素间的关系,通过计算其关联度,找出与粮食产量密切相关的生产要素。
2.2.1. 数据选取与处理
我们选取小麦产量作为因变量,选取以下九个农业生产要素作为自变量:农业机械总动力P1、农村用电量P2 (包括农村生产用电和农村生活用电量)、农用化肥使用量P3 (包括氮肥、磷肥、钾肥、复合肥)、农用塑料薄膜P4、农用柴油使用量P5、农药使用量P6、有效灌溉面积P7、农业从业人员P8、小麦播种面积P9。根据选择的指标因素,我们以河西走廊五个地区为研究对象,搜集河西走廊五个地区2021~2021年的小麦产量以及上述九个指标因素的数据(数据来源:甘肃省统计年鉴)。
因为各个因素的单位不相同,利用SPSSAU对所获得的农业机械总动力、农村用电量等九个因素进行初值化的无量纲处理得到标准化数据。对于原始指标序列
,若z为序列的算
子,有:
,则称z为初值化算子[11]。其中,原始指标序列
表示的是2012~2021年河西走
廊五个地区的各个农业生产要素以及小麦产量的数值序列,k表示地区,t表示年份,
不为0且表示每个数值序列的第一个数值。
2.2.2. 计算最优参数a、相似性关联度以及贡献率
首先要将多元序列降维成与一元序列结构相同的序列,才能实现一元序列与多元序列的关联分析。农业生产要素序列
是通过最优参数a进行降维的,所以为了算出参数a,本节利用MATLAB基于最优化理论计算出关联度的最大系数值,即最优参数a。
已知农业生产要素序列
以及小麦产量序列Y,其中以农业生产要素与小麦产量的灰色相似关联度函数
最大值为目标函数,降维系数a为决策变量,有如下规划:
(2.5)
其中,
表示农业生产要素序列相邻两个数值之差,
表示小麦产量序列相邻两个数值之差,
表示农业生产要素的降维序列,
表示农业生产要素的降维序列与小麦产量序列的相似性向量。
若非线性规划的最优解为
,则称a*为以农业生产要素序列
以及小麦产量序列Y为目标的多元灰色相似关联最优权重,称
(2.6)
为农业生产要素序列
以及小麦产量序列Y的多元灰色相似关联度,称
(2.7)
为农业生产要素序列
的贡献率[13],其中,
,表示各个农业生产要素与小麦产量的数值序列之差。
根据多元序列关联识别模型计算步骤,我们计算出了小麦产量与农业生产要素的相似性关联度,利用贡献率公式计算各个地区的农业生产要素的贡献率,并根据小麦产量利用熵值法构建权重[14] [15],计算出农业生产要素整体的贡献率。
2.2.3. 计算邓氏灰色关联度及综合关联度
从上述文章中可知在求解最佳参数时,已经计算出了相似性关联度,模型中还需要计算邓氏关联度。已知农业生产要素序列
以及小麦产量序列Y,对于分辨系数
,取值为0.5,则
(2.8)
称为农业生产要素与小麦产量的灰色关联系数。其中,
表示小麦产量的数值序列,
表示农业生产要素的数值序列,
表示两个序列的两级最小极差,
表示两个序列的两级最大极差。
(2.9)
称
为
的邓氏灰色关联度[16]-[21]。在知道邓氏灰色关联度和相似性关联度之后,在等权的情况下计算综合关联度。
3. 结果与分析
3.1. 关于危险性因素的分析
根据上述步骤,计算的小麦产量与危险性因素关联度,结果见表1。
Table 1. Correlation degree between wheat yield and risk factors
表1. 小麦产量与危险性因素间的关联度
地区 |
气象因素 |
发展水平
|
发展速度
|
增速水平
|
关联度
|
武威市 |
降水量F1 |
0.853 |
0.663 |
0.854 |
0.778 |
气温F2 |
0.867 |
0.707 |
0.888 |
0.808 |
日照时数F3 |
0.827 |
0.655 |
0.866 |
0.763 |
平均相对湿度F4 |
0.846 |
0.662 |
0.891 |
0.781 |
平均风速F5 |
0.843 |
0.683 |
0.858 |
0.780 |
水资源总量F6 |
0.867 |
0.670 |
0.871 |
0.789 |
张掖市 |
降水量F1 |
0.834 |
0.714 |
0.880 |
0.792 |
气温F2 |
0.846 |
0.716 |
0.839 |
0.787 |
日照时数F3 |
0.845 |
0.681 |
0.836 |
0.775 |
平均相对湿度F4 |
0.842 |
0.675 |
0.925 |
0.808 |
平均风速F5 |
0.838 |
0.707 |
0.879 |
0.794 |
水资源总量F6 |
0.852 |
0.695 |
0.860 |
0.783 |
酒泉市 |
降水量F1 |
0.833 |
0.701 |
0.848 |
0.771 |
气温F2 |
0.837 |
0.665 |
0.859 |
0.775 |
日照时数F3 |
0.832 |
0.682 |
0.840 |
0.763 |
平均相对湿度F4 |
0.871 |
0.698 |
0.843 |
0.797 |
平均风速F5 |
0.828 |
0.715 |
0.818 |
0.780 |
水资源总量F6 |
0.807 |
0.667 |
0.885 |
0.766 |
金昌市 |
降水量F1 |
0.853 |
0.696 |
0.868 |
0.637 |
气温F2 |
0.851 |
0.700 |
0.862 |
0.650 |
日照时数F3 |
0.828 |
0.678 |
0.878 |
0.635 |
平均相对湿度F4 |
0.841 |
0.694 |
0.843 |
0.625 |
平均风速F5 |
0.855 |
0.723 |
0.821 |
0.660 |
水资源总量F6 |
0.860 |
0.707 |
0.858 |
0.661 |
嘉峪关市 |
降水量F1 |
0.847 |
0.685 |
0.875 |
0.7817 |
气温F2 |
0.822 |
0.648 |
0.877 |
0.7646 |
日照时数F3 |
0.825 |
0.659 |
0.843 |
0.7654 |
平均相对湿度F4 |
0.851 |
0.651 |
0.910 |
0.7916 |
平均风速F5 |
0.840 |
0.667 |
0.881 |
0.7822 |
水资源总量F6 |
0.861 |
0.701 |
0.843 |
0.7906 |
从表1的关联度中看出,小麦产量其实与危险性因素的关系很密切,关联度都很高,选取的降水量、气温、日照时数、平均相对湿度、平均风速、水资源总量六个指标的关联度都超过了0.6,其中关联度较高的是平均相对湿度、平均风速以及水资源总量,数值都达到了0.75以上。指标中的降水量、平均相对湿度和水资源总量三个指标都与该地区的水分有关系,可以表示该地区的农业含水量;气温、日照时数和平均风速三个指标都与作物的水分蒸发相关,且都与小麦产量的关联度比较接近,都可以用来表示农作物的水分损失。
通过计算差异度和关联度找出了与小麦产量关联度较大的因素,结果见表2。
Table 2. Ranking of correlation degree of factors
表2. 因素关联度排序
地区 |
因素关联度排序 |
关键影响因素 |
武威市 |
F2 > F6 > F4 > F5 > F1 > F3 |
气温 > 水资源总量 > 平均相对湿度 |
张掖市 |
F4 > F5 > F1 > F2 > F6 > F3 |
平均相对湿度 > 平均风速 > 降水量 |
酒泉市 |
F4 > F5 > F2 > F1 > F6 > F3 |
平均相对湿度 > 平均风速 > 气温 |
金昌市 |
F6 > F5 > F2 > F1 > F3 > F4 |
水资源总量 > 平均风速 > 气温 |
嘉峪关市 |
F4 > F6 > F5 > F1 > F3 > F2 |
平均相对湿度 > 水资源总量 > 平均风速 |
可得出:在河西走廊地区,与小麦产量关联度最高的危险性因素是平均相对湿度、平均风速以及水资源总量。
3.2. 关于农业生产要素的分析
根据上述步骤,整理其计算出的相似性贡献率,结果见表3。
Table 3. Contribution rates of wheat yield and production factors in five cities of Hexi Corridor
表3. 河西走廊五市小麦产量与生产要素的贡献率
地区 |
权重 |
P1 |
P2 |
P3 |
P4 |
P5 |
P6 |
P7 |
P8 |
P9 |
武威 |
0.000 |
2.191 |
0.000 |
0.000 |
0.000 |
4.650 |
20.643 |
0.000 |
72.516 |
0.000 |
张掖 |
0.000 |
0.000 |
0.000 |
0.000 |
0.000 |
14.737 |
5.380 |
0.000 |
79.883 |
0.000 |
酒泉 |
0.000 |
0.000 |
0.000 |
0.000 |
0.000 |
0.000 |
0.000 |
0.000 |
100.000 |
0.000 |
金昌 |
14.633 |
0.000 |
0.826 |
0.000 |
0.000 |
0.000 |
6.295 |
0.000 |
78.247 |
14.633 |
嘉峪关 |
0.000 |
29.086 |
0.000 |
44.446 |
0.000 |
0.000 |
0.000 |
0.000 |
55.554 |
0.000 |
综合占比 |
0.036 |
0.018 |
0.002 |
0.006 |
0.000 |
0.037 |
0.154 |
0.000 |
0.751 |
由表3的贡献率可知,因素的相似性贡献率按从大到小排序为:小麦播种面积 > 有效灌溉面积 > 农药使用量 > 农业机械总动力 > 农村用电量 > 农用塑料薄膜使用量 > 农用化肥使用量 > 农业从业人员数 = 农用柴油使用量,其中,小麦播种面积的贡献率为75.1%、有效灌溉面积的贡献率为15.4%,两个要素的贡献率之和已经达到90%以上。由此可知,通过多元序列灰色关联识别模型进行要素降维,用其中两个农业生产要素即表示对小麦产量影响程度大的农业生产要素。
根据上述步骤,整理其计算出的邓氏关联度、相似性关联度以及综合关联度,结果见表4。
Table 4. Correlation degree between wheat yield and production factors in five cities of Hexi Corridor
表4. 河西走廊五市小麦产量与生产要素的关联度
|
邓氏关联度 |
相似关联度 |
综合关联度 |
武威市 |
0.7036 |
0.9024 |
0.807 |
张掖市 |
0.8719 |
0.9064 |
0.901 |
酒泉市 |
0.8168 |
0.8610 |
0.854 |
金昌市 |
0.8716 |
0.8827 |
0.891 |
嘉峪关市 |
0.7614 |
0.8997 |
0.833 |
从计算结果中可以得出,张掖市的邓氏关联度、相似关联度以及综合关联度都是最高的,数值分别为0.8719、0.9064、0.901。综合关联度中,只有张掖市的关联度高于0.9,除此之外的其他四个地区的关联度都高于0.8。
4. 结论与讨论
基于多维矩阵的危险性因素关联识别,可以看出嘉峪关市、酒泉市以及张掖市都位于河西走廊的中西部,相比其他的东部地区来说,降水量偏少且蒸发量较大,所以在关联结果中其首要的影响因素就是与水资源相关的平均相对湿度;武威市在河西走廊的最东边,水资源相比其他地区要丰富一些,对水资源的依赖相对较小,所以关联结果中显示其首要的影响因素是与作物的水分蒸发相关的气温;而金昌市在河西走廊偏东的位置上,每年大风天气的持续时间偏短,所以其首要影响因素不是平均相对湿度、相对风速等这一类与大风天气有直接关系的因素而是水资源总量。河西走廊的地理位置导致该地区风大沙多,除了常见的水资源总量和平均相对湿度两个高关联度的危险性因素外,还有一个高关联度的危险性因素是平均风速。综上所述,关联度最高的危险性因素是平均相对湿度、水资源总量以及平均风速三个危险性因素,说明农业旱灾相关的关键危险性因素与该地区的水分有密不可分的关系。
基于多元序列的农业生产要素关联识别,计算结果中可以看出,通过要素降维用小麦播种面积和有效灌溉面积两个要素即表示对小麦产量影响程度大的农业生产要素,此外,农业机械总动力、农村用电量、农用化肥使用量、农用塑料薄膜、农药使用量五个农业生产要素的贡献率之和为10%,农用柴油使用量以及农业从业人员数的贡献率几乎为零。如果要求模型精度更高,那么选择小麦播种面积、有效灌溉面积、农药使用量、农业机械总动力、农村用电量、农用塑料薄膜使用量、农用化肥使用量七个农业生产要素足够了,贡献率之和接近百分之百,即利用最少数量的因素达到最好的分析效果。河西走廊相较其他地区农业机械化程度不够高,所以农村用电量这一常见农业生产要素贡献率不高,其次粮食产量的确与本文选出的农业生产要素关系密切,计算出贡献率与关联度的高数值都说明选取这九个因素是合理的。若在计算的过程中出现了综合关联度低于0.8的地区,说明该因素的选取可能不合理,那就要进一步掌握该地区的农业发展概况,对该地区影响粮食产量的农业生产要素进行深入分析,对其进行改进,即重新选取因素,提高科学性和准确性。
利用多维矩阵灰色关联模型分析危险性因素时,本文将原模型中的增量水平改为发展速度,目的是更好的体现各个因素在某一时刻的空间特性,不再将重点放在因素某一时期的动态特性上。利用多元序列灰色关联模型分析农业生产要素时,原模型根据最优参数a计算了接近性关联度、相似性关联度和综合关联度。相似性关联模型有很多种,不同的模型计算相似关联度的方法不同,无法确定更细节的相似性关联度该如何计算,但接近性关联模型种类不多,经典模型是邓氏关联度模型。将接近性关联度改为计算邓氏关联度,因邓氏关联度有更细致的计算方法和步骤,能够更加准确的计算接近性的关联程度,然后根据等权权重计算出综合关联度,最后根据贡献率和综合关联度确定关键的农业生产要素。
灰色关联识别方法本身存在局限性,在因素的选择上具有一定主观性,一定程度上制约了数据分析的客观性,所以在以后的数据分析中可通过增加因素数量等方法提高数据分析的准确性[22]。
NOTES
*第一作者。
#通讯作者。