1. 引言
随着我国各方面综合国力的迅速发展,我国经济发展水平也有了很大程度的提升,人民的收入水平有了显著的提高。与此同时,由于地域的差异,经济发展水平的不平衡,人均收入的差距也逐渐拉大,日益呈两极分化态势,表明我国经济发展中在收入分配领域出现矛盾,这是改革日益深入的新形势下不得不引起重视的新问题。如何正确认识和掌握区域之间的收入差异及其变动趋势,如何正确认识区域收入之间的相关性,最终减轻或消除收入差异是社会各界认识共同探讨的话题 [1]。景跃军和李雪 [2] 考察收入变化对城乡收入差距时空差距的影响,对区域差异进行了分析。Bahmani-Oskooee等 [3] 和Yang等 [4] 分别利用ARDL时间序列模型和回归模型分别研究了收入波动性对各州的收入不平等的影响程度和金融发展与城乡收入差距关系的区域差异。Ma等 [5] 研究根据城乡流量和累计收入基尼系数,并研究通过分解基尼系数比较了城市化和城乡平均收入比例对这些基尼系数趋势的总体变化。然而,目前大多数报道都只是对于区域之间收入的差距的比较,忽略了区域之间经济发展与收入的相互影响 [6] [7],区域之间的经济往来等一些相互之间的交往会导致区域之间的收入会具有一定的相关性,导致区域之间出现收入联动现象的发生。因此,如何从统计学的角度挖掘相邻地区收入的互相关性将有助于我们更好地寻找解决问题的突破口。
在两个时间序列的多重分形和相互关系的研究中,Podobnik和Stanley [8] 提出了基于去趋势波动分析(DXA);Zebende等 [9] 基于DXA构建了相应的相关系数,该相关系数成为检测两个非平稳时序交叉相关的重要指标。Zhou [10] 将DXA推广为多重分形的情形,得到了基于多重分形去趋势波动互相关分析(MF-DXA)的广义Hurst指数估计方法。Kalamaras等 [11] 用去趋势波动分析(DFA)检测非平稳时间序列中的长期相关性。Yin等 [12] 用多尺度多重分形去趋势互相关分析(MM-DCCA)的方法分析了序列之间的互相关性,通过扫描所有范围的尺度,获得序列之间的互相关性的不同分形特性的新见解。为了定量研究两个序列互相关性的程度,Wang等在2013年 [13] 和2016年 [14] 分别提出了仿多重分形互相关分析(AMF-XA)和仿多重分形高度互相关分析(AMF-HXA)。进一步,Wang等还提出了基于AMF-HXA的q阶互相关系数
[15],能从时间尺度和波动区间两个维度定量刻画两个序列之间的互相关程度。
本文以2005~2016年湖南省14个市州的数据作为研究对象,对不同城市之间及城乡之间的居民收入的差异进行分析,并对其进行预测建模。首先利用仿多重分形高度互相关分析(AMF-HXA)及q阶互相关系数进行互相关性检测,再利用灰色预测理论对这些城市未来5年的城乡人均收入进行预测。
2. 研究方法与数据来源
2.1. 基于AMF-HXA的q阶互相关系数 [15]
设两个时间序列
和
,
。首先计算它们的累积离差:
(1)
这里
和
分别表示序列
和
在整个时间区间上的平均值。然后定义在时滞为L下的两个累积离差序列的互增量如下:
(2)
接着,利用引入符号算子的q阶协方差函数,对于每个L得到q阶协方差:
(3)
这里
表示
的符号函数。加入了此符号算子的
不但能提供波动信息,也能提供与q阶依赖的波动函数的符号信息,如此便能得到两个给定序列的真实互相关性,避免伪相关。
最后,考虑如下的尺度关系并得到尺度指数
,如下式所示:
(4)
这里L一般取1到一个大的整数N1,使得上述关系能在双对数图上得以较好的呈现。尺度指数
能有效描述两个分形序列的互相关特性。
注意,(4)式所示的尺度关系仅对于q > 0时成立。根据q取不同的值,
可以描述两个分形序列在不同波动区间的长程互相关性。一般地,q > 1时,
主要体现了大波动区间的互相关性,而q < 1则是小波动区间的相关性占主导地位。类似于一元Hurst指数,
反映的互持久性从统计意义上意味着正(负)的
更可能出现在正(负)的
后。相反地,
则表示正(负)的
更可能出现在负(正)的
后,此时称这两个序列具有交互持久性。如果
,则该方法就退化成了经典的多重仿射分析 [16],它将产生能描述单个序列长程自相关的广义Hurst指数
,可通过如下幂律关系得到:
(5)
这里
。
能通过不同阶的q值来表征原始序列
不同的波动信息,较小的q对应较小的波动,较大的q表征较大的波动。一般地,q < 2扩大了小波动区间对
的贡献,而q > 2扩大了大波动区间对其的贡献。为了定量刻画两个不同序列{xt}和{yt}的波动程度的差异,我们提出了一个新的量:
(6)
AMF-HXA方法能够准确检测两个时间序列的互相关性,然而,它不能定量地刻画这种互相关性。为了定量描述互相关的程度,基于AHXA (即取q = 2时),利用公式(3)得到的两个序列的协方差函数又与公式(5)得到的两个序列的方差函数求比值,得到了一种所谓的基于AHXA的相关系数,如下所示:
(7)
是一个无量纲量,且满足
。为了刻画不同大小的波动区间对
的影响,我们对上述公式进行如下调整:
(8)
即认为
是一个同时受变量q和L影响的互相关系数。
2.2. 灰色预测模型
灰色系统的实质是通过对原始数据进行累加,得到规律性较强的曲线后,用指数曲线拟合得到模型 [17] [18]。本文运用基于累加生成数列的GM(1,1)模型,建模步骤如下:
第1步:原始数据的累加
设原始数据为非负序列
,对其进行一次累加,得
,其中
。累加数列克服了原始数列的波动
性和随机性,转化为了有良好规律性的递增数列,为建立微分方程形式的预测模型打下了基础。
第2步:建立GM(1,1)模型
微分方程
(9)
就是灰色预测模型GM(1,1),其中
为常数,通过最小二乘法拟合可得到:
(10)
其中
,
。
微分方程(9)的解为
(11)
上式就是数列的预测公式。上式是对一次累加生成数列的预测值,可通过下式求得原始数列的还原预测值。
(12)
第三步:模型检验
当预测数列与原始数列拟合的精度较高则可用于外推预测,否则不能直接用于预测,预测数列经过残差修正后便可用于外推预测。预测数列与原始数列的拟合检验指标有平均相对误差、精度等。本文通过构建如下模型来检验拟合精度:
首先计算出残差:
(13)
其中是原始序列值,
是预测序列的值。
然后求出相对误差:
(14)
接下来求出平均相对误差:
(15)
最后得出精度p0:
(16)
检验模型时,p0越大越好,当
时,预测模型精度为优秀;当
时,预测模型精度为良好;当p0值小于0.8时,则需要通过残差修正来调整。
2.3. 数据来源
为考察湖南省的城乡居民收入现状并对居民收入区域差距进行探讨,本文选取的长沙、株洲等城市的城乡人均收入数据来源于湖南省统计年鉴(http://tjj.hunan.gov.cn/tjsj/tjnj/)。选取自2005年~2016年的长沙、株洲、岳阳等湖南省14个城市的城镇和农村人均收入(根据湖南省统计年鉴的统计口径,城镇人均收入为人均可支配收入,农村人均收入为人均纯收入)作为研究对象。我们将这14个市州划分为五个城市群:湘北(包括岳阳、常德、张家界和益阳)、湘南(包括郴州和永州)、湘西(包括湘西自治州和怀化)、湘东(包括株洲、湘潭和长沙)、湘中(包括娄底、邵阳和衡阳)。其基本统计情况如表1所示。从表1可以看出,同一地区的城镇人均收入均值大于农村,且各地区的城镇人均收入排名与农村人均收入排名一致,均为湘东>湘南>湘北>湘中>湘西;湘东地区在城镇和农村的标准差均最大,而湘西地区均最小;除此,可以看出极差最大的为湘东地区,最小的为湘西地区,由上可以得出湘东地区的城乡人均收入的波动差异最大,湘西地区的城乡人均收入的波动差异最小。
3. 互相关性检测与分析
3.1. 互相关波动函数幂律关系检测
首先检测14个市州城镇与农村之间的人均收入的分形标度行为。一般地,如果两个时间序列具有互相关性,则它们的q阶互相关波动函数
与时滞L具有幂律关系,这表现为
与L在双对数图中呈现较好的线性关系 [19]。经分析,我们发现14个市州的q阶互相关波动函数
与时滞L均具有良好的幂律关系。以长沙市和湘西自治州为例,如图1所示,在不同的波动区间(q值从0.4~2,以0.4的步长)城镇与农村的人均收入的q阶互相关波动函数
与时间间隔L具有幂律关系,表示长沙市和湘西自治州的城镇与农村的人均收入具有较好的线性关系。
![](Images/Table_Tmp.jpg)
Table 1. Basic statistics of per capita disposable income in various regions of Hunan Province
表1. 湖南省各区域人均收入基本统计情况
![](//html.hanspub.org/file/4-2580564x70_hanspub.png)
Figure 1. Double-log plot of
and L of Changsha (a) and Xiangxi (b)
图1. 长沙(a)、湘西自治州(b)的
与L的双对数图
3.2. 波动差异与时滞的关系
在本节中,我们关注每个城市的城镇和农村人均收入之间的波动趋势的差异,为此,我们利用(6)式定义的
来定量描述各个城市的城镇和农村人均收入的q阶波动函数的差异。我们选取了两个q值(q = 0.4和q = 2)来分别考察小波动区间和大波动区间的情况。作为例子,图2(a)为长沙、岳阳、娄底、湘西自治州的小波动区间的
,图2(b)为大波动区间的情形。
从图2可以看出,图中长沙市与岳阳市不论在小波动区间还是大波动区间其波动函数的差距均小于0.5,说明长沙市与岳阳市的城镇与农村的人均收入的波动变化差异较小,并且长沙不论在小波动区间还是在大波动区间中,其波动函数的差距均低于岳阳市的,说明长沙市的城镇与农村的人均收入的波动变化差异较岳阳市要平稳。娄底市在小波动区间中,波动函数差距有部分超出0.5,但在大波动区间中,波动函数的差距均大于0.5,说明娄底市的城镇与农村的人均收入的波动变化规律在大波动区间内有着较大差异,在小波动区间差异不是特别大。湘西自治州的波动函数不论是在小波动区间还是在大波动区间中,其波动函数均大于0.6,说明湘西自治州的城镇与农村之间的波动差异是较大的,并且在小波动区间的低阶时滞以及大波动区间下,波动函数的差距均大于0.9。由此可以看出越不发达的地区城镇与农村之间的波动差异越大。
![](//html.hanspub.org/file/4-2580564x75_hanspub.png)
Figure 2.
of small and large fluctuation intervals in Changsha, Xiangxi, Loudi and Zhuzhou
图2. 长沙、岳阳、娄底、湘西自治州的小波动区间及大波动区间的
3.3. 各市州及区域人均收入差异的相关分析
本节我们分别考区域之间城镇人均收入和农村人均纯收入的相关性。为此,我们先构建一个统计量来检验两个序列之间是否存在显著的交叉相关。
建立零假设:H0:两个序列阶不存在互相关性;
备择假设:H1:两个序列阶存在互相关性。
计算
,再计算得到95%置信度下的临界值
,再考察
与
的大小关系。若
则拒绝原假设,认为两个时间序列之间存在显著的交叉相关性。具体地,为了获取不同时间尺度L下的95%置信度的临界值
,首先生成10,000对独立的零均值单位方差的高斯分布随机变量,使得概率分布的概率函数位于
之间的积分结果等于0.95,并记录此时的
。
最后,分别对于不同区域之间的序列,利用(7)式计算得到区域内部或区域之间的
与临界值进行比较。如果
则说明区域内部或区域之间农村或城市的互相关是统计不显著的,反之,其间的互相关是统计显著的。
3.3.1. 各市州农村与城镇人均收入的相关性
依据上述理论,根据(7)式计算出各市州农村与城镇之间的
,由于图形过多,此处不一一画出,选择长沙市、湘西自治州、娄底市、株洲市作出其农村与城镇相关性及其显著性,如图3所示,空心曲面表示临界值,在该曲面上方表示具有显著的互相关性。
从图3可以看出,长沙市和株洲市的城镇和农村的人均收入不论在小波动区间还是在大波动区间中均具有高度互相关性,湘西自治州和娄底市在大波动区间范围内,农村与城镇的人均收入具有高度互相关性,在小波动范围中,当处于小时滞时,农村与城镇的人均收入具有高度互相关性,处于较大时滞时,农村与城镇的人均收入的互相关性不明显。作出其余各市州在小波动范围及大波动范围的
值,如表2、表3所示。
![](//html.hanspub.org/file/4-2580564x90_hanspub.png)
Figure 3. Cross-correlated coefficient between urban and rural income in Changsha, Loudi, Zhuzhou and Xiangxi. Hollow surface denotes critical values
图3. 长沙、娄底、株洲、湘西的城镇与农村收入的互相关系数,空心曲面表示临界值
注:表中标*表示ρ0.2(L)小于临界值,即为不显著。
在大波动范围内,14个市州的
均大于
,说明各个市州农村与城镇的人均收入具有高度互相关性,在小波动范围内,当时滞L = 5时,大部分城市的农村与城镇的人均收入不具有显著相关性,时滞L为其他值时还是具有较高显著的互相关性的。
![](Images/Table_Tmp.jpg)
Table 3. ρq(L) (q = 2) values of large fluctuation intervals in 14 cities
表3. 14个市州在大波动范围中的ρq(L)值
注:表中标*表示ρ2(L)小于临界值,即为不显著。
3.3.2. 各城市群之间人均收入的相关性
通过表1可以看出,湘中、湘南、湘北具有相近的趋势,为此,我们将湘东划分为I区,将湘中、湘南、湘北划分为II区,将湘西划分为III区,然后根据(7)式计算出III个区域农村与城镇之间的
,然后,比较
与临界值
的大小。3个区域间每两个区域之间农村和城镇的相关性及其显著性如图4和图5所示,其中空心曲面表示临界值,在该曲面上方表示具有显著的互相关性。
从图4和图5可以看出,不论是农村还是城镇,任意两个区域之间的互相关系数
均明显的大于临界值
。由于14个市州均隶属湖南省,其政策对各个市州的影响大体相同,故其发展方向也会趋同,不难解释区域之间具有显著的互相关性。
4. 灰色预测结果
利用GM(1,1)灰色预测模型进行拟合,分别可得到2005~2016年湖南省各市州的城乡人均收入的拟合数据,据此可计算出14个市州的平均相对误差,城市的预测误差在2%~4%之间,农村的平均相对误差基本小于6%,效果较好。如表4所示。
![](Images/Table_Tmp.jpg)
Table 4. The average relative error between the predicted and observed values of per capita income in each cities of Hunan Province
表4. 湖南省各市州人均收入预测与实际值的平均相对误差
![](//html.hanspub.org/file/4-2580564x98_hanspub.png)
Figure 4. Cross-correlated coefficient of urban income between Region I and Region II, Region I and Region III, Region II and Region III, respectively. Hollow surface denotes critical values
图4. I区与II区、I区与III区、II区与III区的城镇间的互相关系数,空心曲面表示临界值
![](//html.hanspub.org/file/4-2580564x99_hanspub.png)
Figure 5. Cross-correlated coefficient of rural income between Region I and Region II, Region I and Region III, Region II and Region III, respectively. Hollow surface denotes critical values
图5. I区与II区、I区与III区、II区与III区的农村间的互相关系数,空心曲面表示临界值
出于篇幅考虑,此处我们选取四个城市(长沙、岳阳、娄底和湘西自治州)的城镇(图6)和农村(图7)作为代表展示模型的预测效果。从图像来看,真实值与预测值基本吻合,表明该模型具备较好的效果。
利用以上模型预测湖南省各市州2017~2021年城乡居民可支配收入,并由此可计算出各个市州未来五年的城乡居民预测收入差距,如图8所示。
预测可知,未来5年湖南省长沙、岳阳、娄底、湘西自治州的城乡人均收入倍差依次递增。进一步分析14个市州的城乡人均收入倍差,由此可推断出贫困地区发展速度高于发达地区的发展速度,由此趋势可初步推断湖南省的区域贫富差距将实现逐步缩小。城乡差距的缩小会提升农村居民的满意度,有利于省份的发展 [20]。
![](//html.hanspub.org/file/4-2580564x100_hanspub.png)
Figure 6. The forecast effect of urban per capita income in Changsha, Yueyang, Loudi, and Xiangxi, respectively
图6. 长沙、岳阳、娄底、湘西四个城市的城镇人均收入预测效果
![](//html.hanspub.org/file/4-2580564x101_hanspub.png)
Figure 7. The forecast effect of rural per capita income in Changsha, Yueyang, Loudi, and Xiangxi, respectively
图7. 长沙、岳阳、娄底、湘西四个城市的农村人均收入预测效果
![](//html.hanspub.org/file/4-2580564x103_hanspub.png)
![](//html.hanspub.org/file/4-2580564x105_hanspub.png)
Figure 8. Urban and rural disposable per capita income of Changsha, Loudi and Xiangxi in the years of 2017-2021
图8. 长沙、岳阳、娄底、湘西2017~2021年城乡居民人均收入
5. 结语
为了研究湖南省14个市州的居民人均可支配,本文将湖南省划分了三个区域,对区域间的人均收入差异、每个市州城镇与农村的人均收入、不同市州的城镇人均收入与农村人均收入之间的差异进行了分析。运用仿多重分形高度互相关分析了上述几组序列的人均收入的标度性与幂律关系,得到了以下结果:
1) 14个市州的城乡人均收入的q阶互相关波动函数
与时间间隔L均具有良好的幂律关系,说明城镇与乡村之间的人均收入具有显著的互相关;2) 通过对波动差距函数的研究发现,经济水平越高的地区其城镇与农村的波动函数差距都越小;3) 通过对14个市州的城乡人均收入的
在不同波动范围内的研究发现:大波动范围内各个市州农村与城镇的人均收入具有高度互相关性;4) 通过对所划分城市群的研究发现,湖南省各个城市群间具有显著的互相关性。5) 运用GM(1,1)灰色预测模型对过去12年人均收入数据进行拟合建模,模型精度为优秀,并预测未来5年的湖南省各市州的人均收入,城乡差距逐年缩小。
通过以上分析可以发现,在我省良好的政策环境背景下,贫困地区的发展速度较快,各区域间的贫富差距将逐步缩小,湖南省的人均居民收入都将迎来新的提升与发展。
基金项目
本文由湖南农业大学大学生创新基金(XCX18007)和湖南省研究生科研创新项目(CX20190527)资助。
NOTES
*通讯作者。