1. 研究背景
社会的主要矛盾已经转化为人民日益增长的美好生活需求和不平衡不充分发展之间的矛盾。第十四个五年规划纲要指出,中国已进入高质量发展阶段,但发展不平衡的问题依然突出。而城乡收入差距大,会导致城乡发展的急剧失衡,打击农村居民的生产积极性,进而加剧社会矛盾,抑制经济的高质量发展。只有清楚认识城乡收入差距问题,才能切实有效地提出缩小城乡差距的对策。我国城镇化率在1978年到2020年由17.92%上升到64.72%,城乡收入差距指数近10年来一直在下降,2011年为3.23:1,2021年为2.50:1。未来我国城乡收入差距走势仍是关系中国经济发展的重点。
2. 研究现状
学者往往根据研究视角和研究目的的需要,选择合适的城乡收入差距的衡量指标。袁航(2014)认为城乡收入差距应该考虑消除通货膨胀等因素的影响,提出了城乡居民相对收入差距,公式为:(城镇居民人均可支配收入 − 农村居民人均纯收入)/城镇居民人均可支配收入 [1]。李焕焕等(2017)提出了中国城乡人均收入的差异速率:(城镇居民人均可支配收入 − 农村居民人均纯收入)/农村居民人均纯收入,从速度上反映城乡差异变化的 [2]。蔡武等(2018)以城镇居民人均可支配收入与农村居民人均纯收入相减得到城乡收入绝对差距 [3]。张延群等(2019)将城乡居民收入差距定义为城镇居民人均实际可支配收入与农村居民人均实际现金收入的比值 [4]。王雨晨(2020)认为城乡差距均等指标可以表示成:
,
其中
代表城镇居民收入占总收入的比例,
代表农村居民可支配收入占总收入的比例 [5]。
学者们倾向使用ARIMA模型进行分析与预测,如李焕焕等(2017)对1978~2016年中国城乡人均收入的差异速率进行一阶差分,建立了AR(1)模型 [2];蔡武(2018年)对1978~2014年的取对数和一阶差分后的中国城乡收入差距序列建立合适的ARMA(1,1)模型 [3];王雨晨(2020年)对2000~2019年的城乡差距均等指标序列建立了ARIMA(1,2,1)模型 [5];廖龙静等(2019)年对1998~2017年安徽省城乡收入差距取对数一阶差分后拟合了ARIMA(1,1,0)模型 [6]。
综上所述,城乡收入差距的分析与预测多是从城镇居民人均可支配收入和农村居民人均纯收入的视角出发,应用ARIMA模型进行拟合,没有考虑城镇和农村人口结构的变化,所以本文将采取泰尔指数测量城乡收入差距,并建立相应的ARIMA模型加以研究。
3. ARIMA模型
3.1. ARIMA模型
ARIMA模型具有如下结构 [7],简记为ARIMA(p,d,q)模型:
(1)
式中,
;
为平稳可逆ARMA(p,q)模型的自回归系数多项式;
为平稳可逆ARMA(p,q)模型的移动平均系数多项式 [7]。
3.2. 参数估计与模型检验
在选择了需要拟合的模型之后,使用序列的观察值来确定该模型的口径,即估计模型中未知参数的值。实际运用中最常用的是条件最小二乘估计方法,残差序列的有限项式、残差平方和如下:
(2)
(3)
参数
的条件最小二乘估计是通过迭代法将表达式(3)设为最小值的估计值。在R语言中,参数估计是通过调用arima函数来进行的。
模型检验包括模型的显著性检验和参数的显著性检验。模型的显著性检验就相当于残差序列的白噪声检验,原假设是残差是白噪声序列(模型显著),检验统计量为LB (Ljung-Box) [7]:
(4)
检验结果可以通过伴随概率p值来判断模型是否显著。如果LB统计量的p值大于显著性水平,则认为残差序列属于白噪声序列,拟合模型显著有效。
参数的显著性检验就是要验证每个未知参数是否显著为零,其目的是为了让模型更精简。用t检验来确认未知参数显著性,参数的t统计量为参数估计值除以参数标准差:
(5)
式中,
。参数的t统计量的p值小于显著性水平时,该参数被视为显著非零 [7]。
3.3. 建模步骤
1) 对原始序列进行平稳性检验,非平稳时间序列经过适当差分使其变成平稳序列;
2) 根据自相关系数和偏自相关系数确定模型阶数,初步识别模型的可能形式,然后根据AIC、BIC信息准则,从中选择一个最佳模型;
3) 参数估计与模型检验,模型检验指模型和参数的显著性检验,如果模型通过检验,则模型设定基本正确,否则,必须重新确定模型形式;
4) 用建立的ARIMA模型进行预测。
4. 数据来源
本文所收集的1978~2021年中国城镇居民人均可支配收入、农村居民人均纯收入、城镇常住人口和农村常住人口的数据,来自国家统计局。参考相关学者的研究,本文用泰尔指数来测度我国的城乡收入差距,其计算公式为:
(6)
式中,j = u,r表示城镇和农村地区,Nj表示该地区城镇或农村人口数,N表示总人口,Ij表示该地区城镇或农村的总收入,I表示该地区的总收入。
5. 城乡收入差距模型的建立与预测
利用泰尔指数的公式和收集到的数据,计算出的泰尔指数如表1所示。
Table 1. Theil index table from 1978 to 2021
表1. 1978~2021年泰尔指数表
对泰尔指数进行描述性统计分析,具体结果如表2所示。1978-2021年泰尔指数最大为0.162 (2003年),最小为0.037 (1983年),平均值为0.107。可以发现若以近20年为考察期,2016年则为转折点,即从2016年开始泰尔指数一直低于平均值,由此表明近几年城乡收入差距明显缩小。
Table 2. Descriptive statistics of Theil index
表2. 泰尔指数描述性统计
5.1. 原始序列的平稳性检验
对泰尔指数序列(将其命名为序列T)作时序图和自相关图,如图1、图2所示。
从时序图可以看出,中国城乡收入差距在1980年改革开放初期出现骤减,之后持续上升,90年代有所改善,但进入21世纪之后持续恶化,城镇和农村的收入差距的泰尔指数在2007年达到最大值,2007年以后有持续减少的倾向。自相关图中的自相关系数延迟到7阶之后,减小到2倍标准差之内,延迟到16阶之后,又落在了2倍标准差之外,意味着该序列非平稳,并且具有长期趋势。对序列T进行ADF检验,ADF统计量 = −0.8296,对应p值为0.9511,大于显著性水平(
),因此不能拒绝原假设,即序列T是非平稳的。
Figure 2. Sequence T autocorrelation diagram
图2. 序列T自相关图
5.2. 非平稳数据的处理与检验
对序列T进行一阶差分,并记为T_dif,图3即为其序列时序图。同时,对T_dif进行单位根检验,ADF检验结果为:ADF统计量 = −4.2751,对应的p值为<0.01,小于显著性水平(
),因此一阶差分后序列平稳。进一步,对T_dif进行纯随机性检验,选择LB统计量,其检验结果如表3所示,一阶差分序列不是白噪声序列,因此可以根据序列T建立ARIMA模型。
5.3. 模型识别
根据ARMA模型识别基本原则,如表4所示,对模型识别与定阶。如图4所示,结合自相关图和偏自相关图,分别对ARIMA(1,1,0),ARIMA(1,1,1)和ARIMA(0,1,1)三个模型进行拟合。根据AIC和BIC信息准则,ARIMA(1,1,0)的AIC值和BIC值最小,具体结果见表5,从而确定最终拟合的模型为ARIMA(1,1,0)。
Figure 3. Sequence diagram of Theil index first order difference sequence T_dif
图3. 泰尔指数一阶差分序列T_dif的时序图
Table 3. Results of Box-Ljung test for first-order difference sequence of Theil index
表3. 泰尔指数一阶差分序列Box-Ljung检验结果
Table 4. Basic principles of ARMA model recognition
表4. ARMA模型识别基本原则
Figure 4. Autocorrelator and partial autocorrelator of Theil index sequence after first order difference
图4. 一阶差分后泰尔指数序列的自相关图、偏自相关图
5.4. 模型参数估计与检验
对序列T的拟合模型ARIMA(1,1,0),通过条件最小二乘估计得到该模型拟合口径为:
(7)
其中
为残差。
首先对拟合模型进行检验,得到残差序列的白噪声检验结果如表6所示,各阶延迟下LB统计量的p值都明显大于0.05,则该拟合模型的残差序列为白噪声序列,该拟合模型有效。对参数进行显著性检验,参数的t统计量为参数估计值除以参数标准差即为3.4225 (0.4723/0.1380),其p值为0.0007,小于显著性水平(
),拒绝原假设,即该参数显著。
Table 6. White noise test results of residual sequence of fitting model
表6. 拟合模型残差序列的白噪声检验结果
综合以上结果,对泰尔指数序列T创建ARIMA(1,1,0)模型是可取的。
5.5. 模型的预测
对2019~2025年我国城乡收入差距泰尔指数进行短期预测,预测结果如表7所示:
预测图如图5所示,虚线为实际值,实线为拟合值,深色和浅色阴影部分分别是置信水平为80%、95%的预测值置信区间。
从表8可以看出,2019~2021年的预测值都比实际值大,但只有2019年的相对误差小于5%,这可能是由于受新冠疫情负面影响,2020年和2021年国内经济及城乡居民的人均可支配收入的增幅均放缓,但平均绝对误差值为0.0106,平均相对误差值为13.835%,相对来说比较小,因此大体上可以预测2021~2025年的城乡收入差距泰尔指数。另外,从表中可以看出中国城乡收入差距呈现逐渐缩小的态势。
Table 8. Comparison of predicted value with actual value
表8. 预测值与实际值的比较
6. 结论及建议
综合以上分析结果,本文得出了以下结论:中国城乡收入差距在今后几年具有下降的趋势,这表明中国在平衡城乡收入的治理方面和相关政策的实施是有效的,但从图5也可看出下降幅度较为缓慢,未来几年城乡收入差距泰尔指数维持在0.08左右。
为了进一步缩小城乡收入差距,本文提出以下建议:第一,增加农民收入,出台更具针对性的增收政策,聚焦低收入人群和欠发达地区;第二,集中财力和物力,调整产业结构、财政支出、信贷投放及收入分配结构等;第三,持续推进欠发达地区农村基础设施建设和公共服务,为农民增收营造良好环境;第四,致力于城乡融合发展,构建新型城乡关系;第五,推进农村劳动人口高质量充分就业。
参考文献