1. 引言
1.1. 研究现状分析
在国内经济分析与预测研究领域,ARIMA模型因其独特的时间序列分析能力而受到广泛关注。多项研究借助该模型对不同地区的GDP进行深入分析与未来走势预测,揭示了区域经济发展的多样性和复杂性。肖丹在 [1] 中的研究针对四川省,采用ARIMA(2, 1, 0)模型对1978~2022年的数据进行分析,成功预测了2023~2027年的GDP走势。该研究不仅验证了模型在长期数据序列上的有效性,还为四川省未来的经济增长提出了具体建议,如明确重点产业和区域、注重协调发展等。杨忠裕和薛紫玥将视角转向甘肃省,利用ARIMA(0, 2, 1)模型对1992~2021年的GDP数据进行了拟合,预测未来两年的GDP增长趋势 [2] 。该模型的简单实用性和高预测精度为甘肃省的短期经济预测提供了有力工具。李振亮和乐昕雨则关注北京市的经济状况,利用ARIMA(2, 2, 1)模型对1978~2020年的数据进行分析,预测了2021~2025年的GDP增长趋势 [3] 。该研究的准确性在于其相对误差控制在7%以内,为北京市的经济规划提供了科学依据。田美雪的研究则聚焦于山东省,通过构建ARIMA(1, 1, 0)模型,分析了1990~2020年的GDP数据,并对未来的经济发展进行了预测 [4] 。该研究不仅展示了山东省GDP的稳步提升,还对比了实际值与预测值之间的差异,为疫情后经济恢复提供了实证分析。张梓对贵州省的GDP进行了类似的研究,建立了ARIMA(0, 1, 1)模型,并预测了2021~2025年的经济增长趋势 [5] 。该研究的预测误差同样控制在7%以内,证实了模型在贵州省的适用性。夏如玉和王梓桥则以重庆市为研究对象,利用ARIMA(0, 1, 0)模型对2009~2020年的GDP数据进行了深入分析 [6] 。该研究的拟合效果令人满意,为重庆市未来12年的经济发展提供了预测。
因此,ARIMA模型在国内的应用已经覆盖了东西部多个省份,其在不同地区GDP分析和预测中的有效性得到了广泛验证。这些研究不仅为地方政府的经济决策提供了科学依据,也为学术界提供了丰富的研究案例。通过对不同地区经济特征的深入挖掘,ARIMA模型展现了其在经济预测领域的强大潜力。
1.2. 研究目标和意义
在对现有文献进行细致梳理的基础上,本章节旨在对基于ARIMA模型的GDP分析与预测研究进行总结。通过对比各研究者采用的具体方法及其得出的结论,我们可以发现,ARIMA模型因其独特的时间序列分析能力,被广泛应用于不同地区的经济预测中,其预测结果相对精准,能够为地区经济发展战略部署提供重要参考依据。
多数研究采用了历史GDP数据作为基础,运用Python或R等软件进行数据分析,通过差分、模型识别与检验等步骤,确立了各自研究的最优ARIMA模型。例如,在四川省的研究中,肖丹通过选取长达45年的GDP数据,创建了ARIMA(2, 1, 0)模型,并对未来五年的GDP进行了预测。这些研究不仅揭示了ARIMA模型在处理长期数据序列时的适应性和准确性,也展现了其在短期预测中的优势。
值得注意的是,尽管ARIMA模型在众多研究中得到应用,但每个研究在模型的选择上存在差异,如杨忠裕和薛紫玥在甘肃省GDP预测中采用的是ARIMA(0, 2, 1)模型,而李振亮和乐昕雨在北京市GDP分析中则选择了ARIMA(2, 2, 1)模型。这种差异反映了不同地区经济发展特征的独特性,以及研究者在模型选择上的个性化考量。此外,对于模型预测效果的评价,大多数研究均显示出较高的精确度,相对误差控制在较小范围内。这不仅说明了ARIMA模型在经济预测中的有效性,也为江门市GDP的分析与预测提供了有力的方法论支持。
在当前全球经济波动与国内经济结构调整的背景下,城市经济发展情况的预测与分析显得尤为重要。江门市作为中国广东省的一个重要城市,其GDP走势不仅关系到地方经济的健康发展,也对周边地区乃至全省的经济布局产生影响。然而,面对复杂多变的经济环境和政策调整,传统的预测方法往往难以准确捕捉到经济增长的细微变化,进而影响到决策的有效性。本文旨在通过自回归差分移动平均模型,对江门市GDP进行深入的分析与预测。ARIMA模型因其独特的时间序列分析能力,能够有效地识别和模拟数据中的长期趋势、周期性波动以及随机干扰等因素,从而为经济预测提供了一个强有力的工具。研究首先对江门市历年GDP数据进行预处理,以确保模型构建的准确性。然后,利用差分和对数变换等技巧,把非稳态数据转换成稳定数据,从而为预测模型提供了条件。随后,利用自相关函数(ACF)和偏自相关函数(PACF)来确定ARIMA模型的阶数,并通过最小化信息准则如AIC和BIC来选择最优模型。最后,运用所建立的ARIMA模型对江门市未来几年的GDP进行预测,并结合实际情况对可能的经济发展趋势进行分析。
综上所述,本文通过ARIMA模型对江门市GDP进行预测与分析,不仅提高了预测的准确性,而且为地方政府和投资者提供了科学的决策依据,具有重要的理论与实践意义。
2. ARIMA模型的基本原理
2.1. ARIMA模型的定义
ARIMA模型(Autoregressive Integrated Moving Average Model),全称自回归差分移动平均模型,是一种用于时间序列分析和预测的统计方法。ARIMA模型主要由三个部分构成,分别为自回归模型(AR)、差分过程(I)和移动平均模型(MA)。这个模型包含了三个参数,分别记为p,d,q,其中p是自回归模型的阶数(时间滞后数),d是差分程度(数据减去过去值的次数),q是模型的阶数。这三个参数都是主观设置非负数,多用于非季节性的ARIMA模型,因此通常表示为ARIMA(p, d, q)。
2.2. ARIMA模型的结构
ARMA模型的结构本质是将差分操作和ARMA建模相结合,其结构如下所示 [7] :
其中,
,
为自回归系数多项式;
为移动平均系数多项式;
为零均值白噪声序列。
3. ARIMA模型的构建方法
从ARIMA模型的构造可以看出,对于任意具有一定阶差分的非稳态数据,都可以用ARMA(p, q)来进行拟合。下面给出ARIMA模型的详细建模步骤。
3.1. 数据的平稳化处理和检验
首先,根据序列的散点图(或折线图)、自相关系数(ACF)图和ADF单位根检验,判断序列的平稳性。对于出现一定的增长或下降趋势的序列,通常要对其进行取对数或做差分处理,再判定其是否平稳。反复进行上述步骤,直到得到一个平稳的序列。此时差分的次数称为ARIMA(p, d, q)的阶数d。同时还要对平稳序列进行纯随机性的测试,也就是检验序列是否为白噪声序列。白噪声序列没有分析的意义,基于ARMA(p, q)模型来拟合具有平稳的非白噪声序列。白噪声检验一般采用LB统计量(也称作QLB统计量)对序列进行卡方检验 [8] 。
原假设:H0:
,
(
为序列的自相关系数
);
备择假设:H1:至少存在某个
,
,
;
检验统计量:
,
其中,
为序列的自相关系数。
3.2. 差分后序列的ARMA(p, q)拟合
为了简单起见,差分后的平稳序列仍记为
。对时间序列
进行ARMA(p, q)模型拟合,首先是要计算时间序列样本的自相关系数和偏自相关系数的值。
自相关系数:
,
偏自相关系数:
,
其中
,
在此基础上,利用自回归方程的相关特性,对自回归方程的相关阶p及移动均值q进行估算,从而选取合适的ARMA(p, q)预测模型。
然而,在实际情况中,由于样本的随机性,样本的相关系数并不会呈现理论截尾的完美情形,本应截尾的自相关系数或偏自相关系数仍会呈现出小值波动。同时,因为平稳时间序列一般都存在短期的相关性,随着延迟阶数
,
或
都会衰减至零值附近作小值波动。所以,当样本自相关系数或偏自相关系数在延迟若干阶之后衰减为小值波动时,什么情况下该看作相关系数截尾,什么情况下该看作相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动?由Barlett公式及Quenouille定理可知,在样本量n足够大的情况下,样本自相关系数近似服从正态分布:
,
;
,
根据正态分布的性质有:
所以,如果样本自相关系数或偏自相关系数在最初的d阶明显超过2倍标准差范围,而后几乎95%的自相关系数都落在2倍标准差范围以内,而且由非零自相关系数衰减为小值波动的过程非常突然,在这种情况下,一般视为自相关系数截尾,截尾阶数为d。如果有超过5%的样本自相关系数落入2倍标准差范围之外,或者由显著非零的自相关系数衰减为小值波动的过程比较缓慢或者非常连续,在这种情况下,通常视为自相关系数不截尾。
3.3. 参数估计和检验
参数估计即确定模型的“口径”:利用序列的观测值估计模型
中未知参数的值。待
估参数有p + q + 2个:
,
,
,
,其中参数
是序列均值,通常取样本均值,原本p + q + 2个待估参数减少为p + q + 1个。
估计方法有三类:矩估计、极大似然估计和最小二乘估计,在SAS中默认使用最小二乘估计法。
在ARMA(p, q)模型场合,记
残差项为:
,残差平方和为:
使残差平方和达到最小的那组参数值即
的最小二乘估计值:
参数的显著性检验主要是为了检查各参数是否显著非零,若其中一个参数非显著非零,则说明其相应的自变量不会对因变量产生显著影响,因此可以将该参数从拟合模型中排除。最后,我们将用一组参数显著非零的自变量来组成模型。
检验假设:
对于线性拟合模型,记
为
的最小二乘估计,
在正态分布假定下,第j个未知参数的最小二乘估计值
服从正态分布:
.
由于
不可观测,使用最小残差平方和估计
:
.
由正态分布的性质得到
,
其中n为序列的长度,m为待估参数的个数。
建立检验未知参数显著性的t检验统计量
,
当该检验统计量绝对值不小于自由度为n−m的t分布的
分位点,即
.
如果该统计量的P值小于
时,拒绝原假设,认为该统计量是显著非零的。当参数显著性检验无法拒绝原假设时,需去除不显著参数对应的自变量,对模型进行重新拟合,构建更为精细的新模型结构。
3.4. 模型检验和优化
模型检测指的是验证一个模型的有效性,也就是检测整个模型是否充分的提取了信息,核心在于检测残差序列是不是一个白噪声序列。当残差序列被列为非白噪声序列时,则表示残差序列中仍有大量的有关信息没有被抽取出来,此时拟合的效果并不理想,必须另寻其它的模型进行拟合。若残差序列为白噪声序列,则说明该模型具有一定的有效性。
如果某一个拟合模型通过检验,则表示此模型在某一置信度下可较好地拟合观测值序列的波动性,但其具有非唯一性。为选取一个比较最佳的模型,应在全面地考察各种可能的模型后,再重复上述过程。使用Akaike的AIC准则与Schwartz基于Bayes理论获得的SBC准则来判断各拟合模型的优劣。AIC函数值和SBC函数值最小的模型为相对最优模型。本文定义的中心化AIC函数为
,非中心化AIC函数为
,中心化SBC函数为
,非中心化SBC函数为
。
3.5. 模型预测
利用拟合模型,预测序列未来趋势。
在ARMA(p, q)模型场合
其中
预测方差为:
其中
为预测误差,
为Green函数。
3.6. 建模工具:SAS/ETS软件——ARIMA过程
ARIMA模型是一种集成了模型辨识、参数估计、模型选择和短期预报功能于一身的方法。ARIMA模型包括三个指令:识别(identify)、估计(estimate)和预测(forecast)。这三个指令覆盖了静态顺序模型中的每一步,他们可以单独或结合起来使用。ARIMA过程的语法格式如下(“[]”内的代码视情况选择性输入):
Procarimadata=<时间序列数据集>;
Identifyvar=<分析变量>nlag=k [stationarity=(adf)] [minic];
Estimate [method=参数估计方法] p=n q=m [noint];
Forecast lead=u id=<时间变量>out=result;
Run;
4. 江门市GDP分析与预测
4.1. 对数据进行平稳化处理与检验
选取江门市1978年至2021年国民生产总值数据 [9] ,在SAS中使用Gplot过程作出GDP序列的线图如图1(a)。
(a)
(b)
Figure 1. GDP and its difference series diagram
图1. GDP及其差分序列线图
曲线图1表明,国内生产总值呈现出显著上升的态势,表明该时间序列具有非稳定性。将序列作一阶差分后绘出线图,线图表明序列的增长趋势已被基本抹去(见图1(b)),无明显的趋势或周期特征 [10] 。在此基础上,利用ARIMA模型中的识别指令,对得到的数据进行了纯随机性和平稳性检验,结果见表1。
白噪声检验的P值在0.0001以下,研究发现:在显著度为0.05时,经过差分处理的GDP序列可以被看作是一个非白噪声的序列,这就意味着这个序列中还有一些重要的信息需要我们去挖掘。单位根检验结果显示Trend项的Tau统计量滞后1阶的P值显著小于0.05,因此在一定程度上可以认为检验结果显著,差分后的GDP序列为平稳序列。自相关图和偏自相关图如图2所示。
![](Images/Table_Tmp.jpg)
Table 1. Pure randomness and stationarity test of GDP series after difference
表1. 差分后GDP序列的纯随机性与平稳性检验
(a)
(b)
Figure 2. Autocorrelation and partial autocorrelation of the differential data
图2. 差分后数据的自相关图和偏自相关图
从图2左的自相关图中可以看到,自相关系数是不截尾的,从图2右中可以看到,偏自相关系数是1阶截尾的。因此,拟合的模型是一个AR(1)模型。
4.2. 检验模型定阶、参数估计与检验
在此基础上,利用已有的统计数据,结合自相关、偏自相关图,利用识别指令中的minic词组,实现了相对最优模型定阶,如表2所示。从表2可以看出,BIC函数在p = 1和q = 1处是最小的。用ARIMA方法进行参数检验,并用最小二乘法对AR(1)进行参数检验,得到了相应的检验结果和参数。
![](Images/Table_Tmp.jpg)
Table 2. Order relative to the optimal model
表2. 相对最优模型定阶
在参数估计(见表3)中,均值MU不显著(t检验统计量的P值是0.3265, 0.0182),其余的参数都显著非零,因此,我们通过增加一个noint选项来除去常数项,然后对未知的参数进行重新估算,得到了如表4所示的一些参数估计结果。参数估计表明,所有参数都是非零的,且ARMA(1, 1)模型(见表4(a))和ARMA(1, 0)模型(见表4(b))都是有效的,但是其AIC、BIC都小于ARMA(1, 0)模型,因此,ARMA(1, 1)模型具有更高的有效性,因此本项目拟采用ARMA(1, 1)模型作为预测模型。对ARMA(1, 1)模型下的残差数据进行了白噪声试验(见表5),结果表明各个阶段LB检验统计量的P都明显超过0.05,因此可以将残差序列看作是一个白噪声的序列,也就是该拟合模型显著成立。
![](Images/Table_Tmp.jpg)
Table 3. Parameters and model tests of ARMA(1, 1) and ARMA(1, 0) models after difference (including constant terms)
表3. 差分后的ARMA(1, 1)和ARMA(1, 0)模型的参数和模型试验(包含常数项)
![](Images/Table_Tmp.jpg)
Table 4. Parameters and model tests of ARMA(1, 1) and ARMA(1, 0) models after difference
表4. 差分后的ARMA(1, 1)和ARMA(1, 0)模型参数检验与模型检验结果(不包含常数项)
![](Images/Table_Tmp.jpg)
Table 5. Autocorrelation test of residuals
表5. 残差的自相关检验
残差的相关性检验结果如图3所示。从自相关图(见图3(a))和偏自相关图(见图3(b))可知,两者均处于2倍标准差范围之内,表明相关信息提取很充分,残差中残留的相关性不显著
(a)
(b)
Figure 3. Correlation test of residuals
图3. 残差的相关性检验
4.3. 拟合ARIMA(p, d, q)模型的具体形式
执行Estimate p = 1 q = 1 noint命令,得到ARIMA(1, 1, 1)模型拟合结果如表6所示。
![](Images/Table_Tmp.jpg)
Table 6. Fit ARIMA(1, 1, 1) model
表6. 拟合ARIMA (1, 1, 1)模型
GDP序列模型的口径为:
,其中,
表示GDP序列,模型可写为:
.
4.4. 分析与预测
利用ARIMA模型的预测指令,对国内生产总值进行预测,得出2022~2023年国内生产总值的测值,并将其与现实情况进行比较。预测值与实际值的对比情况如表7所示。由表7可知,ARIMA(1, 1, 1)模型在2022年GDP预报中的相对偏差为1.64%,在2023年为1.22%,表明其与现实情况较为吻合。进一步对2024~2026年GDP进行预测,其结果如表8所示。
![](Images/Table_Tmp.jpg)
Table 7. GDP projections for 2022 and 2023 compared to actual statistics
表7. 2022年和2023年GDP预测值与实际统计数据对比
![](Images/Table_Tmp.jpg)
Table 8. GDP forecast and growth rate for 2024~2026
表8. 2024~2026年GDP预测值与增长率
5. 模型验证——珠海市GDP分析
为验证模型在不同数据下是否依旧成立,选取同为珠三角城市的珠海市1979年至2022年国民生产总值数据 [11] 进行分析,以确保模型的可行性。在SAS中使用Gplot过程作出GDP序列的线图如图4(a)所示。图4(a)表明,国内生产总值呈现出显著上升的态势,表明该时间序列具有非稳定性。将序列作二阶差分(一阶差分的序列不能完全消除其增长趋势,故作二阶差分)后绘出线图如图4(b)所示,该图表明序列的增长趋势已被基本抹去。
(a)
(b)
Figure 4. GDP and its difference series diagram
图4. GDP及其差分序列线图
![](Images/Table_Tmp.jpg)
Table 9. Pure randomness and stationarity test of GDP series after difference
表9. 差分后GDP序列的纯随机性与平稳性检验
对数据进行纯随机性与平稳性检验,得到的结果如表9所示。表9这,白噪声检验的P值为0.0002,说明经过二阶差分处理的GDP序列可以被看作是一个非白噪声的序列。单位根检验结果显示各项的Tau统计量滞后0阶的P值均显著小于0.05,因此在一定程度上可以认为检验结果显著,差分后的GDP序列为平稳序列。
得到的自相关图和偏自相关图如图5所示。从图5(a)中可以看出自相关系数不截尾,从图5(b)中可以看出偏自相关系数3阶截尾,因此拟合模型为AR(3)模型。
(a)
(b)
Figure 5. Autocorrelation and partial autocorrelation of the differential data
图5. 差分后数据的自相关图和偏自相关图
![](Images/Table_Tmp.jpg)
Table 10. Order relative to the optimal model
表10. 相对最优模型定阶
利用minic词组实现相对模型最优定阶,结果如表10所示。此时BIC函数在p = 5,q = 4处最小。用ARIMA方法进行参数检验,并用最小二乘法对AR(3)模型进行参数检验,得到结果如表11所示。由表11可知,在包含常数项与不包含常数项情况下,各参数都不显著非零,故ARMA(5, 4)模型不成立。下面,再对ARMA(3, 0)模型进行检验。
![](Images/Table_Tmp.jpg)
Table 11. Parameters and model tests of ARMA(5, 4) models after difference
表11. 差分后的ARMA(5, 4)模型的参数和模型试验
差分后的ARMA(3, 0)模型的参数和模型试验结果如表12所示。由表12上可知均值MU不显著(t检验统计量的P值为0.1188),其余参数显著非零,因此利用noint选项去除常数项,得到表12下的结果,所有参数都是非零的,所以ARMA(3, 0)模型是有效的。因此,采用ARMA(3, 0)模型并对其的残差数据进行白噪声试验,得到结果如表13所示。表13表明各个阶段LB检验统计量的P都明显超过0.05,因此可以将残差序列看作是一个白噪声的序列,也就是该拟合模型显著成立。
![](Images/Table_Tmp.jpg)
Table 12. Parameters and model tests of ARMA(3, 0) models after difference
表12. 差分后的ARMA(3, 0)模型的参数和模型试验
![](Images/Table_Tmp.jpg)
Table 13. Autocorrelation test of residuals
表13. 残差的自相关检验
(a)
(b)
Figure 6. Correlation test of residuals
图6. 残差的相关性检验
从自相关图(见图6(a))和偏自相关图(见图6(b))可知,两者均处于2倍标准差范围之内,表明相关信息提取很充分,残差中残留的相关性不显著。
执行Estimatep = 3q = 0noint命令,得到ARIMA(3, 2, 0)模型拟合结果如表14所示。
![](Images/Table_Tmp.jpg)
Table 14. Fit ARIMA(3, 2, 0) model
表14. 拟合ARIMA(3, 2, 0)模型
通过对珠海市GDP的分析可以进一步验证,利用ARIMA模型对江门市GDP的分析与预测是可行的,也就是说,该模型对于某一地区某一时间段的GDP数据,在经过模型检验并通过后,是可以用于GDP分析并进行短期预测的。
6. 结论及建议
对江门市GDP数据的分析与预测结果表明,江门市的经济呈现稳定增长的趋势,并在未来3年江门市GDP仍将保持稳定高速增长的态势,助推珠三角经济高速发展,为粤港澳大湾区建设注入强大动力。为保持经济的稳定增长,江门市政府应积极发挥政府经济职能,重点在以下方面采取有效措施:
稳住经济大盘,推动经济稳中向好
全面提升政策效能,加强加密经济运行调度。强化有效投资支撑,完善项目推进机制,发挥市重大工程建设项目指挥部作用。释放商贸消费潜能,推动消费持续扩大。
延伸拓展产业链条,构建现代化产业体系
塑造制造业当家优势,大力发展先进制造业以链促群抓产业,牢牢把握新型工业化关键任务,做强链条、做大集群,加快形成以先进制造业为重要支撑的产业结构。
推动改革创新,激发创造活力
强化区域战略科技力量,加快构建创新生态链。加强关键技术攻关能力,推进产业技术协同攻关。强化教育人才支撑,教育、科技、人才一体推进,持续激发创新创造活力。
NOTES
*通讯作者。