1. 研究背景及意义
习近平总书记在党的二十大报告中明确提出,全面推进乡村振兴,加快建设农业强国,是党中央着眼全面建成社会主义现代化强国作出的战略部署。第一产业指农民和农业、林业、牧业、渔业等。农业是立国之本,强国之基,强国必先强农,农强方能国强。第一产业经济发展自然能为中国农业未来的发展趋势起到了指引作用,大力推进第一产业经济发展也是实现乡村振兴战略的必经之路。广西是农业大省(区),以糖料蔗、蚕茧、木材、水果、秋冬菜、茉莉花等产量在全国基于领先地位。2022年,为全力打好农业稳产增收硬仗,使农业经济运行保持向好态势,广西大力实施乡村振兴战略,推动全区强一产促增长,壮乡乡村振兴事业实现高点开局。2022年,广西壮族自治区政府印发《广西科技强农八大工程实施方案》,旨在促进农业高质量发展。广西从农业大省转变为农业强省势在必行,在农业增产处持续发力,则需要科学预测分析第一产业经济值及未来发展趋势。
灰色预测是一种在样本量较小的情况下,可以确保精度较高的预测方法,它可以利用已知信息和未知信息来对系统进行预测。中国学者邓聚龙教授 [1] 在1982年创立灰色系统理论,该系统理论的基本思想上是对样本量较少、信息量不丰富的不确定系统进行研究;1992年李云贵等 [2] 对GM(1,1)预测模型做出了一定的改进,目前灰色系统理论的应用受到越来越多的关注,甚至在农业和灾害预测方面已展现出比传统预测方法的更大优越性。目前,许多国内外学者通过时间序列分析的方法来预测第一产业的总产值,例如吴晓明等 [3] 建立ARMAV模型对国内第一产业总产值进行预测,预测误差达3.05%;王妍 [4] 等运用GM(1,1)模型对山东省农业,总产值未来5年的发展情况并进行预测,李勇等 [5] 使用灰色关联度分析来研究农业、林业、牧业和渔业对河南省第一产业增加值的影响程度。凌立文等 [6] 利用层级预测及其修正方法呈现了我国个别省份第一产业总产值未来两年的变动趋势;张仕清等 [7] 针对第一产业总产值及各部门子产值进行独立预测,提出模型结构的优化方案。然而,大部分学者研究中仅利用年度数据进行建模,也没有对GM(1,1)模型做出改进 [8] [9] [10] ,可能导致数据跨度过大导致误差率较高的问题;而且没有针对广西区的第一产业经济展开独立预测,对于广西区来说预测结果的可参考性及现实指导意义不是很强。因此,此研究方法与模型适用于产业产值分析。科学预测第一产业经济的发展态势,对于进一步推进“三农”工作稳步争先,推动农业农村高质量发展,优化农业经济活力有着重要意义。本文选取2022年广西第一产业经济前三个季度数据,用二次插值法扩充广西第一产业经济月度数据,再利用扩充的数据预测未来3个月的经济值,为广西省制定未来第一产业发展策略提供一定的理论依据,推动全区强一产促增长。
2. 二次插值法原理
2.1. 二次插值法介绍
拉格朗日二次插值法的原理为在被插值函数曲线上任取相邻三个点作为插值节点,以这三个点作一条二次曲线来近似地拟合原曲线,此时该曲线又称为插值多项式。假设存在n个点
,给定
个插值节点
且
,以及每个节点所对应的函数值
且
。构造插值多项式
,设计基函数
,使得
能够拟合
。即对
时都满足
则n次插值多项式可以表示为
(1)
利用待定系数法求得基函数
(2)
的特点是,当
时,
,当
时,
。这样一来,
就能穿过
个
,当
时,即为二次插值公式。
2.2. 基于二次插值法的2022年广西第一产业经济计算
本文思路是,已知2022年广西第一产业经济前三季度值,记为
,
,
,且
,过此三点进行二次插值。2022年广西第一产业经济值的插值多项式
为:
(3)
(4)
将式(3)按照变量x进行降幂排列,可以得到以下二次多项式:
(5)
根据二次插值基函数构造法可得:
此时基函数为
数据来源于广西壮族自治区统计局网站,以2022年广西第一产业前三季度经济值数据为训练集构建模型,以第四季度数据为测试集。具体数据如表1所示:
![](Images/Table_Tmp.jpg)
Table 1. The total value of Guangxi primary industry economy in the first three quarters of 2022
表1. 2022年前三季度广西第一产业经济总值
则
,
,
分别为
,
,
,解得2022年广西第一产业经济值的插值多项式
为:
可知
将第一季度的第一产业经济值除以4,得到5个插值点,再除去前后端点,将剩余的3个插值节点由小到大代入多项式
中,得到对应函数值,即为2022年广西第一产业1月、2月和3月的经济值。第二季度、第三季度以此类推。
利用二次插值法得到的具体数据如表2所示:
![](Images/Table_Tmp.jpg)
Table 2. The total value of Guangxi primary industry economy from January to September 2022
表2. 2022年1月至9月广西第一产业经济总值
3. 建立模型
3.1. 改进灰色预测模型
灰色系统即包含已知信息又包含未知信息的系统,它在一定范围内变化,并与与时间有关,系统内各因素间的关系具有不确定性,灰色预测就是对该系统进行预测。例如,在我国的整个宏观经济就是一个灰色体统,并且经济变量的增长隐含一定的指数变化趋势,它即受到确定性因素的影响,如国家宏观经济政策,又受到不确定因素的影响,如市场经济政策,因此符合灰色预测的建模条件。灰色预测通过将原始序列转换为可以发现系统变化规律的生成序列,产生具有较强规律性的数据序列,建立微分方程模型,以预测未来某一时刻的特征量,以及达到某一特征量的时间,最后进行关联分析,以识别系统各因素发展趋势之间的相异程度。根据灰色理论建立的模型为GM(1,1)模型。因原始时间序列具有随机性,为了弱化这一性质,可以使用累加的方式对原始序列进行处理,从而得到一组增长趋势明显的时间序列,然后基于此时间序列建立灰色预测模型,生成累加预测值,最后利用累减的方法进行反向计算,恢复原始时间序列,获得最终的原始预测值。GM(1,1)建模过程如下。
为了弱化原始时间序列的不稳定性,需要向灰色模型提供信息,因此在建立预测模型之前首先对原始时间序列进行预处理,经过预处理后的时间序列即被称为生成列。本文采用累积的方法进行数据处理。累加的原则是:将原始序列的第一个数据作为生成列的第一个数据,将原始序列的第二个数据与前一个数据相加,作为生成列的第二个数据,同样原始序列第三个数据与前一个数据相加,作为生成列的第三个数据,依次类推,将原始序列的最后一个数据与之前的所有数据相加,最终得到生成列,也称为累加列。
记原始时间序列为
记累加列为
式中的
其中
。
根据GM(1,1)的理论定义,GM(1,1)的一阶线性微分方程如下:
式中,
称为发展灰度,
称为内生控制灰数。
对GM(1,1)线性微分方程求解
将上式离散化得
其中k为时间。为求解未知量
和
,记累加列
的紧邻生成列为
设
为代估向量,
,利用最小二乘法求解,可得:
其中:
利用最小二乘法求解方程,解得未知数
与
。为解出常数C,需给定条件,令
,当
时,
。
则
这是我们熟悉的GM(1,1)的预测值
的表达式。得到这样的预测曲线
在坐标平面上必然经过原始序列第一点,然而从最小二乘法原理来看,预测曲线并不一定需要通过第一个数据点。所以将
作为已知条件的理论依据并不可靠。另外应考虑到
是一个最旧的数据,蕴含的信息量较小,并且不是通过累加生成得到的,规律性不强。因此,为了改进这个问题,我们有必要更新传统的以
为已知条件的建模方法,考虑选用其他数据。以第m个数据点作为已知条件,然后再进行预测,这种方法有可能提供更准确的预测结果。例如以
作为已知条件,从而解得新的预测公式。
所以,更新的公式为
其中
,
,这里的m可以根据实际情况从
中选择,形成新公式,作为原预测公式的优化,如果取
时,与原预测公式相同。
3.2. 模型检验
本文中,检验灰色预测模型的方法有残差检验、关联度检验和后验差检验。
3.2.1. 残差检验
首先按预测模型计算
,并将
累减生成
,然后计算原始序列
与
的绝对误差序列
及相对误差序列
。若相对误差小于0.5%,代表模型精确度较高。
3.2.2. 关联度检验
在客观世界中,因素之间存在许多联系,有关系密切的因素,关系不密切的因素,还有许多因素之间的关系时灰色的。要找到主要矛盾,发现主要特征和主要关系,就利用到关联度分析方法。关联度分析是计算系统中各因素关系密切度的方法,在得出计算关联度之前,还需要获知关联系数。本文中关联系数
是反映原始预测值
与原始值
在第k点的关联程度,计算公式如下。
设:
关联系数定义为:
其中
1)
是第k点预测值与原始值的绝对误差;
2)
是两级最小差;
3)
是两级最大差;
4) p称为分辨率,一般取
;
关联度是参考原始预测值与各原始值在各个时刻的关联系数的平均值,计算公式如下:
当
时,关联度
便满意了。关联度越接近1,关联系数越强。
3.2.3. 后验差检验
1) 计算原始序列的标准差:
2) 计算绝对误差序列的标准差:
3) 计算方差比:
4) 计算小误差概率:
若
,则
。
后验差精度检验等级参照表如表3:
![](Images/Table_Tmp.jpg)
Table 3. Precision inspection level reference table
表3. 精度检验等级参照表
文中,以上检验的n为序列长度,即数据个数。若残差检验、关联度检验和后验差检验都能通过,则说明所建模型精度较好,可以用其进行预测。
4. 广西第一产业经济发展预测和分析
4.1. 模型预测
首先,用二次插值法求出的2022年1月至9月广西第一产业经济总值数据,利用R软件编程对数据进行计算,求得模型的系统发展系数
,内生控制灰数
。经过计算发现,在预测公式中,当
、
时模型精度最高,此时预测模型为:
再递减还原得2022年广西第一产业经济预测值:
利用上述表达式预测广西第一产业经济,得预测收入及相对误差,如表4所示。在模型所得指标中,数值的相对误差最为关键,具有较强的参考意义。就第一产业经济自身特性而言,经济预测值相对误差小于5%时,可视为高精度预测,相对误差为5%至10%时,可视为较好预测,由表4可以看出相对误差较小的是7月、8月和9月,分别为1.21%、1.45%和3.24,因为这三个月在第三季度,数据较新所以误差较小;较相对误差较大的为2月、5月和3月,分别为20.37%、5.68%和4.99%,其中2月数据为异常值。
![](Images/Table_Tmp.jpg)
Table 4. Model fitting results table
表4. 模型拟合结果表
![](Images/Table_Tmp.jpg)
Table 5. The results of correlation degree test and posterior difference test
表5. 关联度检验、后验差检验结果
由拟合结果表5可知,模型精度为94.58%,模型关联度为0.68 > 0.6,模型的精确度较高。模型的精度检验等级参照表如表3所示,后验差检验中,D值为0.0049 < 0.35且小误差概率G值为1 > 0.95,可知该模型为优模型,可用于预测未来广西第一产业经济总值数据。
4.2. 模型分析
本文对2022年10月至12月广西第一产业经济总值进行预测,结果如表6所示;利用改进后的GM(1,1)预测模型对实际值和预测值进行拟合,结果如图1。预测结果显示,2022年10月广西第一产业经济预测值为576.66亿元,11月预测值为699.68亿元,12月预测值为838.641亿元。模型测算的广西第一产业第四季度经济总值为2125.29亿元,测试集中的真实值为1946.78亿元,整体走势符合实际。
![](Images/Table_Tmp.jpg)
Table 6. Forecast of Guangxi primary industry economic value from October to December 2022
表6. 2022年10月至12月广西第一产业经济总值预测
![](//html.hanspub.org/file/30-1251918x127_hanspub.png?20230703104333399)
Figure 1. Improved GM(1,1) prediction model fitting diagram
图1. 改进的GM(1,1)预测模型拟合图
从模型拟合图可以看出,预测数据呈指数增长,在2月份有所回落,广西第一产业经济总体增长趋势显著,这可为地方政府制定发展农林牧渔业相关政策提供科学有效的模型支撑。新冠肺炎疫情发生以来,对于农业经济也产生较大的冲击,对广西第一产业经济的影响也不可避免,导致预测的数据会有一定的偏差,如2月份的数据误差较大。
4.3. 模型适用性
改进的灰色GM(1,1)模型具有广泛的适用性,能够应对各种预测和分析场景,特别是在数据不足、信息不完全、变化规律不明显的情况下,这种模型显得尤为重要。在经济预测方面,该模型可以帮助预测和分析多种重要经济指标,如GDP、就业率、通货膨胀率和财政收入等,为经济决策提供可靠的参考依据。在农业预测方面,无论是预测农产品的产量、种植面积还是农业机械化水平,该模型都能提供准确的趋势预测,对于指导农业生产和政策制定具有重要作用。此外,该模型在环保、交通、能源、公共卫生和教育等领域的预测和分析任务中也能发挥出色的效果。无论是预测空气质量、交通流量、能源需求,还是疾病的发展趋势和学生入学率,改进的灰色GM(1,1)模型都能提供相对准确的预测结果。此模型的主要优势在于其能够揭示系统的发展趋势,从而为决策提供科学的参考。这使得它在数据量较少、不容易收集到完整数据或者数据变化趋势不明显的情况下,都能发挥其独特的价值。总的来说,改进的灰色GM(1,1)模型的适用范围广泛,为不同领域的预测分析提供了一种简单且高效的工具,其在未来的各种预测任务中的应用前景十分广阔。
4.4. 模型对比及优缺点
未改进的GM(1,1)预测模型对实际值和预测值进行拟合,结果如图2。虽然前期拟合效果较好,但后期逐渐产生误差,不能较为精确的把握数据未来的发展趋势。
改进的灰色GM(1,1)模型主要优势有适用范围非常广泛,适用于预测和分析数据不足、信息不完全、变化规律不明显的系统,并且允许模型有数据量较少、不容易收集到完整数据或者数据变化趋势不明显的情况;其次是趋势预测力强,这种模型注重的是发展趋势,而非精确数值,使其在长期趋势预测中展现出强大的实力;还有改进后的模型提高了预测精度,通过使用其他数据点作为已知条件,改进的GM(1,1)模型能够提供更精确的预测,显著提升了预测的精度和效果。
虽然经过检验表明改进后的模型精度也有所提高,但仍存在局限性。如第一是数据波动较大或变化趋势不明显的情况下,预测精度可能仍然受限;第二是此类模型主要适用于处理线性或近线性问题,对于非线性问题,其预测效果可能不理想;第三是模型需要对数据进行适当的预处理,如数据频率的转换,这可能增加了数据处理的复杂性。
![](//html.hanspub.org/file/30-1251918x128_hanspub.png?20230703104333399)
Figure 2. Unimproved GM(1,1) prediction model fitting diagram
图2. 未改进的GM(1,1)预测模型拟合图
5. 结论
广西是传统农业大区,第一产业经济总值则是经济基本盘的具体表现。党中央对三农工作的高度重视,表现在举全党之力全面推进乡村振兴,加快农业农村现代化,加快建设农业强国,建设宜居宜业的美丽乡村。第一产业经济作为和农业息息相关的数值,是推进农业现代化和增加农民收入的聚焦关键点。在深刻把握习总书记“稳字当先”工作要求的基础上,通过计算可知广西第一产业经济总值整体呈上升态势。因此,本文深入研究广西第一产业经济总值变化态势,利用2022年前三季度已知数据,建立广西第一产业经济总值的灰色预测GM(1,1)模型,该模型通过了残差检验、关联度检验与后验差检验,模型精度较高,对广西农村人均可支配收入预测研究中有实际意义。综上所述,虽然新冠肺炎疫情发生以来,广西第一产业经济发展受到了某些方面的影响,导致预测的数据存在不稳定性;但通过把农业大数据与预测结果结合,可为相关部门提供农业方面的信息和资源,为广大农户进行农业生产提供重要参考和借鉴。广西政府应以实现建设农业强省为目标,采取有利于农业增收的有效措施,再要结合广西农业特色,立足当地农耕情况,在提高一产经济值的同时,持续优化升级农业发展品质量,为推动农业经济可持续发展奠定坚实的基础。