1. 引言
国内生产总值(GDP)是指一定时期内,一个国家或者地区所有常住单位生产活动的最终成果,其是衡量国家或地区经济发展状况和发展水平的重要指标。农林牧渔业增加值 [1] 是指农、林、牧、渔及农林牧渔专业及辅助性活动生产货物或提供服务活动而增加的价值,为该产业现价总产值扣除现价中间投入后的余额,它能够反映一定时期内农林牧渔业的生产总规模以及总成果,在国内生产总值中占有重要地位 [2],是计算国内生产总值的基础,而且其变化对地方经济发展调控具有重要的参考价值。“十四五”时期是我国全面建设社会主义现代化强国的第一个五年,意义非凡。《陕西省国民经济和社会发展第十四个五年规划和二零三五年远景目标纲要》提出到2035年陕西省经济综合实力大幅提升,人均生产总值较2020年翻一番。党的十八大以来,陕西省持续坚持农业农村优先发展战略,扎实开展脱贫攻坚、乡村振兴工作,稳步推进现代农业建设、乡村环境治理等工程,农业农村经济发展稳中有进,粮食产能稳步提升,全省目前处于创新驱动和投资拉动并重阶段,合理预测农林牧渔业增加值对于陕西省进一步采取措施促进农业现代化发展、提升农民收入、改善人居环境至关重要。
杨智凯 [3] 等选取广西统计年鉴中1995~2019年GDP数据,通过SAS统计软件分析拟合,建立了ARIMA (1, 2, 1)模型,并且通过对比预测值和真实值,发现模型拟合效果良好。张梓 [4] 以贵州省1978~2020年GDP数据为基础,通过Python处理、检验,建立最优ARIMA (0, 1, 1)模型,并且对未来5年贵州省GDP进行预测,结果显示模型相对误差在7%以内,预测效果较好。李志超 [5] 等选取上海市月度居民消费价格指数数据,通过分析分别建立ARIMA (3, 1, 7)模型,GM (1, 1)模型以及一元23阶多项式回归模型对CPI指数进行短期预测,结果显示ARIMA (3, 1, 7)模型和灰色预测模型GM (1, 1)预测精度相近且较高。ARIMA模型应用较为广泛,但针对陕西省的相关经济指标研究缺较少,本文将通过应用ARIMA模型,分析预测未来5年陕西省农林牧渔业的变化,为陕西省经济发展以及宏观调控提供一定的参考意义。
2. ARIMA模型
ARIMA模型,全称为Autoregressive Integrated Moving Average Model,即差分自回归移动平均模型,由Box和Jenkins于上世纪七十年代提出,是一种著名的时间序列预测方法。ARIMA (p, d, q)模型由三部分组成,分别是自回归过程AR (p),单整I (d)以及移动平均过程MA (q),其中p表示自回归阶数,d为将原始非平稳时间序列转化为平稳时间序列所进行的差分次数,q为移动平均阶数 [6]。其原理是首先将原始非平稳时间序列通过差分转化为平稳时间序列,然后将因变量仅对它滞后值(阶数)以及随机误差项的现值和滞后值进行回归,从而完成模型建立,再对模型进行识别和检验,通过后模型便可用于相关指标预测。模型表达式如下:
(1)
ARMA模型主要针对平稳时间序列,因此针对一组原始时间序列数据首先需要进行平稳性检验,通常有两种方法,一是做出原始数据时间序列图直接观察判断,二是通过数学方法计算得到。前者由于需要人为去观察判断,对判断者的经验要求较高,因而平稳性检验通常采用数学方法计算完成,主要有ADF检验、KPSS检验等。通过检验如果原始时间序列不平稳,那么需要对其进行差分,然后再进行平稳性检验,如此反复,直至数据平稳。处理后的数据通过平稳性检验后,需要确定模型ARIMA中的参数p、d、q,其中d已知,自回归阶数p和移动平均阶数q通常通过自相关检验ACF图和偏自相关检验PACF图进行判断。
3. 实例分析
3.1. 数据来源
为较好研究陕西省未来五年农林牧渔业增加值发展趋势,同时确保数据的真实性和准确性,本文选取数据来源于国家统计局官网(https://data.stats.gov.cn/easyquery.htm?cn=E0103),以陕西省1992年至2021年生产总值数据(如表1)为基础,通过应用时间序列分析方法建立ARIMA模型,分析预测其变化趋势。
Table 1. The value-added data of agriculture, forestry, animal husbandry and fishery in Shaanxi Province from 1992 to 2021 (unit: 100 million yuan)
表1. 陕西省1992~2021年农林牧渔业增加值数据(单位:亿元)
数据来源:国家统计局官网(1992~2021年)。
3.2. 平稳性检验及处理
通过绘制陕西省1992~2021年农林牧渔业增加值及其差分时间序列图(图1),可以判定该时间序列及其一阶差分序列是非平稳的,而二阶差分相对平稳,为了进一步证实直观判断,我们选择对原始时间序列及其不同阶数的差分序列同时进行ADF检验和KPSS检验。对于ADF检验,原始时间序列的结果返回值均为0,表示拒绝原假设,序列不平稳,相应的KPSS检验的返回值为1,同样表明序列不平稳。其一阶差分序列ADF检验显示不平稳而KPSS检验显示平稳,其二阶差分序列的ADF检验返回值为1,KPSS检验的返回值0,均表明序列平稳。
Figure 1. The added value of agriculture, forestry, animal husbandry and fishery in Shaanxi Province and its differential time series
图1. 陕西省农林牧渔业增加值及其差分时间序列图
3.3. ARIMA (p, d, q)模型的建立与检验
原始时间序列经过二阶差分后的序列通过了平稳性检验,则阶数d = 2,因此模型ARIMA (p, d, q)剩余仅需确定p、q值。通过绘制陕西省农林牧渔业增加值二阶差分数据的自相关检验ACF和偏自相关检验PACF图(图2),发现自相关函数从0阶后衰减趋于零,而偏自相关函数在1阶以及15阶之后衰减趋于零。为进一步确定模型阶数,应用AIC信息准则,对多个备选模型进行建模对比。
Figure 2. Autocorrelation and partial autocorrelation plots
图2. 自相关和偏自相关图
表2为ARIMA模型参数表,主要包含三方面内容,分别是模型参数、Q统计量、信息准则。首先ARIMA模型在应用前原始时间序列的二阶差分序列需要通过白噪声检验,其检验采用Q统计量进行,通常采用Q6来分析,如果其对应的p值大于0.1,则表明通过白噪声检验。最后对不同的备选模型进行比较,选择AIC和BIC值较小的模型,最终确定最优模型为:ARIMA (0, 2, 1),其公式为:
。
Table 2. ARIMA model parameter table
表2. ARIMA模型参数表
3.4. 未来5年农林牧渔业增加值预测
图3为采用ARIMA (0, 2, 1)模型后,陕西省农林牧渔业增加值的模型拟合以及未来5年变化的预测图,由图3的拟合部分可以看出模型的拟合值曲线与真实值曲线吻合度高,说明模型拟合效果好,可以较为真实的预测未来五年陕西省农林牧渔业增加值。由预测部分可以看出,随着预测时间的延长,预测值的误差范围程喇叭口型扩大,表明ARIMA模型适合短期预测分析。
Figure 3. Model fitting and prediction of the added value of agriculture, forestry, animal husbandry and fishery in Shaanxi Province
图3. 陕西省农林牧渔业增加值模型拟合和预测
Table 3. The five-year forecast table of the added value of agriculture, forestry, animal husbandry and fishery in Shaanxi Province
表3. 陕西省农林牧渔业增加值五年预测表
由表3可知,2021年陕西省农林牧渔业增加值的预测值为2594.5亿元,与实际值2532.2亿元相比,相对误差为2.46%,小于5%,预测精度为97.54%。未来五年(2022~2026年)陕西省农林牧渔业增加值在没有自然灾害、大的突发公共事件以及政策等因素影响下,会持续稳步增长,五年平均增长率为6.89%。
4. 结论
本文根据陕西省1992~2021年农林牧渔业增加值数据,开展2022~2026年预测研究,通过绘制并分析时间序列图,发现原始时间序列不平稳,而平稳性是ARMA模型预测的基础,所以应用ADF检验和KPSS检验发现,原始时间序列的二阶差分序列是平稳的,可以进行模型建立,最后应用AIC信息准则,确定模型ARIMA (0, 2, 1)。应用该模型预测发现,2022~2026年农林牧渔业增加值平均年净增长值为200.3亿元,平均增长率为6.89%,陕西省农林牧渔业增加值将持续稳步增长。