1. 引言
国内生产总值(Gross Domestic Product, GDP)是指一个国家或地区在一定时期内全部经济活动所创造的总价值,是衡量国家或地区经济发展规模的重要经济指标。一方面,它代表着整个国家或地区的发展和人民生活状况;另一方面,又代表着国民经济的增长、市场价格的变动和社会发展的步伐。因此,分析与预测GDP未来趋势既有利于人们全面了解宏观经济运行状况和国民福利水平,同时也为国家制定和检验经济政策提供了重要依据 [1] 。上海市作为全国性的经济、金融、贸易中心,经济总量持续保持第一,对全国经济发展有着引领带动作用。近年来,上海已成为全球金融业的重要中心之一,同时依托长江三角洲的产业链和地理位置优势,其在国家现代化建设大局和全方位开放格局中具有举足轻重的战略地位。但是自2019年以来,受新冠肺炎疫情影响,经济发展的外部挑战性上升,上海市GDP增速也受到一定影响。此外,上海领先第2位城市北京的优势也越来越小,2022年上半年还曾一度被北京超越。2023年是全面贯彻落实党的二十大的开局之年,实施“十四五”规划承上启下的关键一年,新一届政府开展各项工作的新起点,做好上海市经济发展工作意义重大。本文通过选取上海市1991~2022年GDP年度数据进行分析和建模,并基于ARIMA模型对未来三年上海市GDP进行预测,为上海市未来经济发展规划提供科学的参考依据。
2. 文献综述
对GDP的分析与预测是众多学者持续关注的重点问题,国内已有诸多研究使用ARIMA模型对GDP进行分析与预测并表示具有良好的预测效果。其中,李振亮和乐昕雨 [2] 通过选取北京市1978~2020年的GDP年度统计数据,运用R软件构建ARIMA(2,2,1)模型对北京市2021~2025年GDP进行预测,相对误差在7%以内。杨忠裕和薛紫玥 [3] 选取甘肃省1992~2021年GDP数据建立ARIMA(0,2,1)模型,对未来两年甘肃省GDP做出短期预测。张梓 [4] 通过选取贵州省1978~2020年GDP数据,运用Python构建ARIMA(0,1,1)模型来对贵州省2021~2025年GDP进行预测,相对误差控制在7%以下。夏如玉和王梓桥 [5] 选取重庆市2009~2020年GDP数据建立ARIMA(0,1,0)模型,对重庆市未来12年的GDP指数进行了预测。潘典雅 [6] 根据吉林省1993~2017年的GDP数据建立最优模型ARIMA(2,1,1)对2018~2019年内的GDP做出短期预测,并对吉林省制定经济决策提出建议。王芳芳和王倩 [7] 通过分析陕西省2000~2018年GDP历史数据,利用SPSS软件建立ARIMA(5,2,1)模型,对2019~2021年的GDP值进行预测,拟合度较好。郑梦琪和朱家明 [8] 根据浙江省1978~2018年GDP数据建立ARIMA(5,1,5)模型对浙江省未来三年的GDP指数进行预测。严彦文 [9] 根据山东省1975~2015年GDP数据,运用统计学原理,建立ARIMA(1,1,1)模型对2016~2020年GDP进行了预测。
3. ARIMA模型介绍
ARIMA模型全称为差分自回归移动平均(Auto Regressive Integrated Moving Average Model)模型,是由自回归模型(Auto Regression, AR)、移动平均模型(Moving Average, MA)和差分法结合而来的时间序列预测模型,常用于非平稳时间序列的分析和预测。其中,AR部分用于处理时间序列的自回归部分,它考虑了过去若干时期的观测值对当前值的影响;MA部分用于处理时间序列的移动平均部分,它考虑了过去的预测误差对当前值的影响。ARIMA模型表达式为ARIMA(p,d,q),其中p是自回归项数,q是移动平均项数,d是差分次数。当d = q = 0时,ARIMA模型即为AR模型;当p = d = 0时,ARIMA模型即为MA模型。本文中ARIMA模型的建模步骤包括:① 平稳性检验。对选取的上海市1991~2022年GDP时间序列数据进行绘图和单位根检验,结果表明为非平稳序列。因此,对原序列进行取对数和一阶差分处理,使其符合平稳时间序列特征。② 选定参数p,d,q并拟合模型。通过绘制自相关ACF图和偏自相关PACF图,初步判断p = 1,q = 0。为了提高精度,进一步建立多个ARIMA模型进行拟合并根据AIC和BIC准则确定最优模型为ARIMA(1,1,2)。③ 模型检验。通过绘制残差序列Q-Q图和白噪声检验,保证模型的残差满足独立正态分布,不具有序列相关性。④ 模型预测。通过最优模型ARIMA(1,1,2)对上海市2023~2025年GDP进行预测分析,作为政策建议的理论依据。
4. 基于ARIMA模型的实证分析
4.1. 数据来源与初步分析
为保证数据分析的准确性,从《上海统计年鉴》中选取上海市1990~2022年GDP年度统计数据作为原始时间序列,使用R软件对数据进行预处理,画出时间序列图。由图1可以看出,1991~2022年上海市GDP呈现指数型增长趋势,其中2019~2020年受疫情影响,经济增长速度减缓,2020~2021年经济形势快速反弹,持续恢复。2022年上海市GDP总值为44652.8亿元,是1991年的50倍左右,经济总量实现了巨大飞跃。
Figure 1. Timing chart of GDP in Shanghai from 1991 to 2022
图1. 1991~2022年上海市GDP时间序列图
4.2. 平稳性检验
上海市GDP值呈现指数型增长,未出现周期性和季节性的波动,可以初步判断为非平稳时间序列。而ARIMA模型要求时间序列是平稳的,所以进一步对原始序列进行ADF单位根检验,结果如表1所示。P = 0.99,p > 0.05,因此可以判断原始序列为非平稳时间序列。
Table 1. ADF unit root test results
表1. ADF单位根检验结果
针对呈现指数型增长趋势的非平稳时间序列,首先利用R软件中log函数取对数得到lnGDP以消除指数趋势,然后利用diff函数对lnGDP进行一阶差分处理,得到差分后的lnGDP折线图(见图2),可以看出差分后的时间序列围绕固定值上下波动。同时,单位根检验结果显示p = 0.0368 < 0.05,有充分理由拒绝原假设,表明一阶差分后的序列符合平稳时间序列特征。
Figure 2. Line chart for stage I differential lnGDP
图2. 一阶差分lnGDP折线图
4.3. ARIMA模型定阶
考虑到原始数据通过取对数和一阶差分处理后变为平稳序列,故选择ARIMA(p,d,q)模型进行分析与预测,其中d = 1。
利用R软件中acf和pacf函数绘制出一阶差分后的平稳序列的自相关ACF图(如图3)和偏自相关PACF图(如图4),通过观察图形变化初步确定p值和q值。
通过自相关ACF图可知,自相关系数显示拖尾;通过偏自相关PACF图可知,偏自相关系数在一阶后迅速减小,呈现截尾状态,所以可以初步判断p = 1,q = 0。为了保证p,q的选择更加准确合理,同时建立多个ARIMA模型进行拟合,结果如表2所示。根据AIC准则和BIC准则(越低越好)可以发现,模型ARIMA(1,1,2)的两项指标均出现最低值,因此可选作最优模型。
Figure 3. Autocorrelation graph after stage I difference
图3. 一阶差分后的自相关图
Figure 4. Self-autocorrelation graph after stage I difference
图4. 一阶差分后的偏自相关图
Table 2. Comparison of ARIMA models
表2. ARIMA模型比较
4.4. ARIMA模型检验
4.4.1. 拟合优度
利用forecast包里的accuracy()函数对模型进行拟合优度的度量(见表3),结果显示该模型拟合较为准确。
Table 3. Measurement results of GFI
表3. 拟合优度度量结果
4.4.2. 残差白噪声检验
一般来说,合适的模型的残差应该满足均值为0的正态分布,并且对于任意的滞后阶数,残差自相关都应该为0。本文通过绘制残差序列的Q-Q图(见图5)可以观察到残差近似的落在一条直线上,可以初步判断该序列是随机的正态分布。
Figure 5. Q-Q Graph of residual sequences
图5. 残差序列的Q-Q图
为了得出更准确的结论,利用R软件中Box.test函数进一步开展白噪声检验,如果统计量的P值大于给定的显著性水平,则模型的残差没有通过显著性检验,即我们认为残差的自相关系数为零。检验结果如表4显示:p = 0.5164,p > 0.05,说明ARIMA(1,1,2)模型的残差序列为白噪声序列。因此可以判定ARIMA(1,1,2)合理有效,几乎可以反映所有有用的信息,无需对模型进行优化,可以作为理想的预测模型。
Table 4. Test results of white noise
表4. 白噪声检验结果
4.5. ARIMA模型结果分析
经过上述分析,对上海市GDP时间序列数据建立的ARIMA(1,1,2)模型通过了各项检验,能较好地拟合数据,最终模型如表5所示。
Table 5. ARIMA(1,1,2) model
表5. ARIMA(1,1,2)模型
4.6. ARIMA模型预测
经过上述分析,对上海市GDP时间序列数据建立的ARIMA(1,1,2)模型通过了各项检验,能较好地拟合数据,最终模型如表5所示。利用R软件中forecast函数对上海市2023~2025年GDP进行预测,并绘制95%置信水平下的预测图形,结果如表6所示。
Table 6. Shanghai’s GDP forecast for 2023~2025 and its 95% confidence interval
表6. 上海市2023~2025年GDP预测值及其95%置信区间
从预测结果来看,模型短期预测效果良好,预测结果显示上海市未来3年的GDP依次为4.97万亿元、5.44万亿元、5.94万亿元。由此可见,上海市GDP在未来将持续呈现稳步增长的态势和较高的增长速度,且有望在2024年突破5万亿元。上海市经济回稳向好态势不断巩固,有助于提振社会预期和发展信心,未来上海市也将继续发挥引领带动作用推动我国经济持续向好发展。
4.7. 模型评价
1) ARIMA模型中的参数可以反映时间序列的特定性质。因此,可以通过对模型参数的解释,更好地了解时间序列数据的特征。
2) ARIMA模型只需要考虑序列自身内在规律,而不需要借助于其他外生变量。
3) 模型构建的基础是时间序列数据通过平稳性检验,若不满足要求,则需要使用取对数和差分等方法对数据进行处理使之通过检验。
4) ARIMA模型只能针对线性时间序列数据进行建模,并不能捕捉非线性关系。若ARIMA模型序列变量的未来取值并不符合先前观察值和随机误差间的线性函数关系,则就不可以构建该模型,需要采用其他更合适的方法。
5) 因为采用了数学模型的限制条件,所以ARIMA模型对于噪声的影响比较敏感,容易造成较大误差。
6) 模型的预测结果无法考虑未来重大突发事件对GDP发展的影响,可能会导致预测值出现较大偏差,影响模型预测效果。
5. 结论与建议
本研究通过选取上海市1991~2022年GDP年度统计数据,利用R软件构建出ARIMA(1,1,2)模型,并对未来3年上海市的GDP值做出预测。研究结果表明,2023~2025年上海市GDP呈现出稳步增长的趋势,其中2023年上海市GDP预测值为49702.47亿元,增速约11%,并预计上海市GDP将于2024年突破五万亿元大关。
2023年以来,疫情对企业经营的影响明显减弱甚至基本消除,但是未来上海经济发展依然面临重大挑战。为实现“十四五”规划、市第十二次党代会和新一届政府提出的目标,现基于预测模型所展示出的经济发展态势,对上海市经济建设工作提出以下政策建议:
一是落实国家重大战略任务,提升经济首位度和引领带动效应。上海作为我国经济实力最强的城市,应当全面深化浦东引领区建设,持续深入实施“三大任务”,着力提升“五个中心”能级,加快打造双向开放“三大平台”,加快建设具有世界影响力的社会主义现代化国际大都市,打造具有世界影响力的核心功能,在新征程上继续当好发展的先行者 [10] 。
二是推动城市数字化转型,打造国际数字之都。面对数字化转型新机遇,上海市应当加快发展数字经济核心产业和基础设施建设,打造高端数字产业集群和数字赋能体系,推进5G网络建设和深度覆盖。推动构建精准、普惠的数字生活服务体系,从医疗、教育、交通等角度丰富生活数字化场景应用。聚焦“高效办成一件事”,完善城市运行数字体征系统,提高治理数字化应用时效。
三是实施创新驱动发展战略,建设现代化产业体系。通过推进在沪国家实验室高水平运行,加快高能级创新平台和新型研发机构建设布局,进一步改善创新创业环境,来更大程度的提升科技创新策源能力。同时,着力打造高端制造业增长极,促进服务业高质量发展,加快培育新兴产业集群,推进高水平人才高地建设。
四是鼓励绿色低碳转型,树立美丽上海新风貌。在推进落实碳达峰碳中和的背景下,上海应当积极相应国家号召,打造上海碳中和产业园,坚决遏制高耗能、高排放、低水平项目盲目发展,建立和完善碳普惠体系,倡导绿色低碳生活新风尚。
五是优化疫情防控工作,打造安全韧性城市。准确把握疫情防控新阶段新任务,持续加强医疗资源储备,保障群众及时的就医用药。加大科技投入,加快创新药研发转化,为重大公共卫生事件提供科技支撑。此外,切实保障能源和粮食安全,防范化解金融风险,做好各项安全保障工作,为经济发展提供坚实基础。