中国经济区域GDP特征结构分析与建模
Analysis and Modeling of the Characteristic Structure of China’s Economic Regional GDP
DOI: 10.12677/SA.2023.126156, PDF, HTML, XML, 下载: 148  浏览: 333  科研立项经费支持
作者: 许嘉峻, 卢天棋, 侯欣然, 谢京京, 赵文丽, 刘 博, 白晓东:大连民族大学,理学院、预科教育学院,辽宁 大连
关键词: 六大经济区ARIMAGDP增速Six Economic Zones ARIMA GDP Growth Rate
摘要: 本文借用GDP增速这一指标研究了中国各区域经济的发展以及受疫情影响的程度。从2013年第三季度至2020年第四季度的六大经济区GDP增速及国家GDP增速的数据出发,建立了ARIMA模型,并由此对中国各区域的经济增速情况进行了分析,有助于掌握疫情防控背景下不同地区的经济恢复情况。
Abstract: This paper uses the index of GDP growth rate to study the economic development of each region and the extent affected by the epidemic. The ARIMA model was established based on the data of the GDP growth rate of the six major economic zones and the national GDP growth rate from the third quar-ter of 2013 to the fourth quarter of 2020 to analyze the economic growth rate of various regions in China, and understand the economic recovery of different regions under the background of epi-demic prevention and control.
文章引用:许嘉峻, 卢天棋, 侯欣然, 谢京京, 赵文丽, 刘博, 白晓东. 中国经济区域GDP特征结构分析与建模[J]. 统计学与应用, 2023, 12(6): 1522-1534. https://doi.org/10.12677/SA.2023.126156

1. 引言

近年来,国内区域经济研究的学者学科背景横跨经济学、金融学、地理学、城市规划等学科 [1] [2] [3] 。但应用ARIMA模型对区域GDP进行研究的还很少。2020年疫情对我国各经济区造成了一定的冲击,对各经济区的具体影响程度也不尽相同。刘帅(2021) [4] 、孙久文(2020) [5] 对疫情影响进行了理论描述,从GDP增速角度进行ARIMA预测,得到疫情对经济造成的影响程度及疫情得到控制后各经济区域的恢复情况。

2. 研究内容和方法

根据2013~2019年季度数据,本文查阅了陈国艳(2003) [6] 、陈璐(2019) [7] 关于经济的研究,将全国共分为六大经济区,基于R语言画出各经济区以及国家GDP增速的时序图,对其建立ARIMA模型进行预测,并尝试分析近年来我国经济区域GDP的特征结构、各经济区受疫情影响以及后疫情时代各经济区恢复情况等问题。如表1所示。

Table 1. List of economic zones

表1. 各经济区名单

3. ARIMA模型相关定义及步骤

本文构造ARIMA模型,实质上是差分运算与ARMA模型(自回归移动平均模型)的结合,意在于将序列通过一阶或多阶差分后能够达到平稳,方能使用ARMA模型进行拟合、预测。

{ x t , t T } 是一个时间序列,称满足如下结构的模型为自回归移动平均模型,即为ARMA(p, q):

x t = ϕ 0 + ϕ 1 x t 1 + + ϕ p x t p + ε t θ 1 ε t 1 θ 2 ε t 2 θ q ε t q (3.1)

其中, ϕ p 0 , θ q 0 ,εt为均值为零的白噪声序列,且εt x t j ( j = 1 , 2 , ) 无关,即 s < t , E ( x s ε t ) = 0

借助延迟算子,ARMA模型可简记为:

Φ ( B ) x t = Θ ( B ) ε t (3.2)

构的模型称为ARIMA(p, d, q)模型:

{ Φ ( B ) d x t = Θ ( B ) ε t E ( ε t ) = 0 , V a r ( ε t ) = σ ε 2 , E ( ε t ε s ) = 0 , s t E x t ε t = 0 s < t (3.3)

其中,非负整数d为求和阶数, Φ ( B ) = 1 Φ 1 B Φ p B p ,为平稳可逆ARMA(p, q)模型的自回归系数多项式; Φ ( B ) = 1 θ 1 B θ q B q 为平稳可逆ARMA模型的移动平均系数多项式。d阶差分算子:

d = ( 1 B ) d = k = 0 d C d k ( B ) k (3.4)

通过参考建立时间序列相关书籍得到了ARIMA的建模步骤 [8] :

1) 判断观察值序列的平稳性;

2) 对数据进行差分;

3) 对数据进行白噪声检验;

4) 模型识别,如表2所示;

Table 2. Model order determination principles

表2. 模型定阶原则

5) 模型有效性检验及模型的优化;

6) 预测序列未来走势。

4. 六大经济区GDP增速发展现状

收集六大经济区2013年第一季度至2020年第四季度的GDP增速数据并画出相应的时序图,得到六大经济区GDP增速的曲线图。

图1沿海及发达经济区GDP增速时序图整体来看,这一经济区GDP增速较为平稳,但从2019年第一季度开始GDP增速呈现下降的趋势,在2020年第一季度时达到了最低点,从2020年第一季度开始呈现上升的趋势。

Figure 1. Time sequence chart of GDP growth rate in coastal and developed economic zones

图1. 沿海及发达经济区GDP增速时序图

Figure 2. Time sequence chart of GDP growth rate of the economic zone in the middle reaches of the Yangtze River

图2. 长江中游经济区GDP增速时序图

Figure 3. Time sequence chart of GDP growth rate in northeast economic zone

图3. 东北经济区GDP增速时序图

Figure 4. Time sequence chart of GDP growth rate of the economic zone in the middle reaches of the Yellow River

图4. 黄河中游经济区GDP增速时序图

Figure 5. Time sequence chart of GDP growth rate in northwest economic zone

图5. 西北经济区GDP增速时序图

Figure 6. Time sequence chart of GDP growth rate in southwest economic zone

图6. 西南经济区GDP增速时序图

Figure 7. National GDP growth rate time sequence chart and difference time sequence chart

图7. 国家GDP增速时序图及差分时序图

Figure 8. National GDP growth rate difference autocorrelation chart and partial autocorrelation chart

图8. 国家GDP增速差分自相关图及偏自相关图

图2长江中游经济区GDP增速时序图可知,在2019年前,这四省GDP增速均呈现平稳的趋势且增速略高于国家增速,在2019年第一季度开始,这一经济区GDP增速呈现下降的趋势。由图3东北经济区GDP增速时序图可知,从总体来看,黑龙江、吉林、辽宁GDP增速均低于国家GDP的增速且GDP增速呈现不稳定的趋势。由图4可知,在2019年前除山西外黄河中游经济区各省份GDP增速均高于国家GDP增速。由图5可知,西北经济区内各省份GDP增速均高于国家GDP增速。由图6可知,西南经济区内各省份GDP增速发展水平均高于国家发展水平。

4.1. 数据预处理及平稳化

对六大经济区以及国家GDP增速共32组数据建立ARIMA模型,对数据进行差分后画出经差分后的数据得到图7,由差分图可知,差分后的时序图呈现平稳的趋势。将差分后的数据画出自相关图和偏自相关图,如图8所示。

图8可知,国家GDP增速差分后的自相关图呈现二阶拖尾性,偏自相关呈现一阶拖尾性。

4.2. 模型识别、检验及优化

根据国家差分自相关图和偏自相关图,可得到式(4.1)。

根据表3以及信息准则法可知,ARIMA(2, 2, 1)为国家GDP增速进行预测时的最优模型。其余各省市拟合模型结果如表4所示。

Table 3. National GDP growth rate prediction model and corresponding AIC values

表3. 国家GDP增速预测模型及相应AIC值

Table 4. ARIMA model of the provinces and cities in six major economic zones

表4. 六大经济区各省市ARIMA模型

4.3. 模型预测

通过模型的识别、检验和优化可以得到基于ARIMA的国家GDP增速预测模型为:

x t = 0 .0986 x t 1 + 0 .1195 x t 2 + ε t ε t 1 ε t ~ N ( 0 , 0 .01848 ) (4.1)

根据模型对数据进行预测得到国家2020年四个季度的GDP增速分别为:5.932%、5.869%、5.798%、5.727%。其余各省市GDP增速预测结果见表5

4.4. 模型精度检验

依据现有模型,利用2013年第三季度至2019年第二季度的数据预测2019年第三、四季度的数据,通过|真实值 − 预测值|/真实值来检验模型的精度得到表6

Table 5. Forecast values for the four quarters of 2020 for the six major economic zones

表5. 六大经济区2020年四个季度的预测值

Figure 9. Time sequence chart of GDP growth rate forecast comparison in coastal and developed economic zones

图9. 沿海及发达经济区GDP增速预测对比时序图

Table 6. Average relative error of ARIMA model in the provinces and cities of the six major economic zones

表6. 六大经济区各省市ARIMA模型平均相对误差

根据表6可知,模型平均误差均在0.2以内,模型精度较高。

Figure 10. Bar chart of GDP growth rate forecast comparison in the fourth quarter of coastal and developed economic zones

图10. 沿海及发达经济区GDP增速第四季度预测对比柱形图

5. 六大经济区预测数据与实际数据对比分析

通过用实际GDP增速的数据减去预测得到的全国各省市GDP增速的数据得到了六大经济区受疫情影响的GDP增速的数据。根据得到的数据是正是负来判断疫情对各省市GDP增速影响的大小。

图9图10可知,沿海及发达地区受疫情影响情况以及恢复情况与国家发展相近。可以看出,疫情后山东江苏和天津基本已经恢复到了疫情前的GDP增速,经济恢复水平高于国家经济恢复水平。其中,天津在疫情之经济活动受影响较大,但根据柱形图显示,天津经济恢复水平要高于国家总体水平,恢复情况较好。

Figure 11. Time sequence chart of GDP growth forecast comparison of the economic zone in the middle reaches of the Yangtze River

图11. 长江中游经济区GDP增速预测对比时序图

Figure 12. Bar chart of GDP growth rate forecast comparison in the fourth quarter of the economic zone in the middle reaches of the Yangtze River

图12. 长江中游经济区第四季度GDP增速预测对比柱形图

Figure 13. Time sequence chart of GDP growth forecast comparison in northeast economic zone

图13. 东北经济区GDP增速预测对比时序图

Figure 14. Time sequence chart of GDP growth forecast comparison of the economic zone in the middle reaches of the Yellow River

图14. 黄河中游经济区GDP增速预测对比时序图

Figure 15. Time sequence chart of GDP growth forecast comparison in northwest economic zone

图15. 西北经济区GDP增速预测对比时序图

Figure 16. Time sequence chart of GDP growth forecast comparison in southwest economic zone

图16. 西南经济区GDP增速预测对比时序图

在长江中游经济区中由图11可以看出,在疫情之初,湖北受疫情影响最严重,几乎比预期GDP增速低了50%,但经济恢复情况较好。由图12可知,除湖北外,长江中游经济区各省份受疫情影响情况与国家总体受疫情影响情况相似,除安徽外,其余三个省份2020年第四季度GDP增速低于国家总体恢复水平,长江中游经济区经济恢复水平低于国家总体水平。

图13可知,在疫情之初,东北经济区受疫情影响较大。经过调整恢复,东北经济区恢复情况还是略高于国家总体水平。由图14可知,在疫情之初,黄河中游经济区总体来看受疫情影响较小,但黄河中游经济恢复情况要低于国家总体水平。

图15西北经济区GDP增速预测对比时序图可知,从总体来看,西北经济区各省份GDP增速受影响水平要低于国家总体水平,根据2020年第四季度的数据表明,除青海外,西北经济区各省份GDP增速基本恢复正常,均高于国家总体水平。由图16发现,西南经济区受疫情影响较小,经全面复工复产,经济恢复水平要高于国家总体水平。

6. 结论

总体来看,六大经济区中沿海及发达经济区与国家GDP增速发展水平相似,而长江中游经济区等其他区GDP增速均高于国家GDP增速,只有东北经济区GDP增速略低于国家GDP增速。在疫情之初,沿海及发达经济区与国家总体情况相似,而黄河中游经济区、西北经济区、西南经济区受疫情影响较小,长江中游经济区受疫情影响较为严重。另外,东北经济区受疫情影响较大。在疫情防控下,西北经济区、东北经济区经济恢复情况略高于国家总体恢复情况,沿海及发达经济区、西南经济区与国家总体恢复水平相近,黄河中游经济区、长江中游经济区经济恢复情况低于国家总体恢复水平。西南经济中的重庆和沿海及发达地区中的天津经济恢复较快,恢复水平较好。在面对新冠疫情这类不利的冲击时,可借鉴重庆和天津这两座城市的相关政策。

研究的不足:首先,建立ARIMA模型的过程中具有主观性,只能对短期内的数据进行预测。其次,由于知识储备量的有限,对各经济区发展水平等相关问题描述以及分析得不到位。

基金项目

国家级大创项目资助(项目编号:202312026043);校级大创项目资助(项目编号:202312026457)。

参考文献

[1] 骆达荣, 黄灏然, 郭开仲. 基于SVR的RAR区域经济预测模型[J]. 数学的实践与认识, 2013, 43(19): 36-42.
[2] 刘艳春, 孙亮. 人口因素与区域经济的多重协整关系研究——基于沈阳市时间序列数据的分析[J]. 数理统计与管理, 2016, 35(2): 309-318.
[3] 胡晶. 数据分类及其在中国经济区域划分问题上的应用[D]: [硕士学位论文]. 长春: 东北师范大学, 2003.
[4] 刘帅. 新冠肺炎疫情对中国区域经济的影响[J]. 地理研究, 2021, 40(2): 310-325.
[5] 孙久文. 新冠肺炎疫情对中国区域经济发展的影响初探[J]. 区域经济评论, 2020, 36(2): 8-11.
[6] 陈国艳. 基于中国各省GDP的经济区域划分统计方法的研究[D]: [硕士学位论文]. 长春: 东北师范大学, 2003.
[7] 陈璐. 环境保护税费的异质性影响研究: 基于我国六大经济区面板数据的实证分析[D]: [硕士学位论文]. 成都: 西南财经大学, 2019.
[8] 白晓东. 应用时间序列分析[M]. 北京: 清华大学出版社, 2017.