我国人口老龄化的非参数统计分析
Variation Analysis of the Population Aging in China Based on Nonparametric Statistics
DOI: 10.12677/aam.2024.134139, PDF, HTML, XML, 下载: 98  浏览: 191 
作者: 闫文璐, 沈思连*, 张英杰:河南科技大学数学与统计学院,河南 洛阳
关键词: 人口老龄化Kruscal-Wallis检验Friedman检验Wilcoxon秩和检验Population Aging Kruscal-Wallis Test Friedman Test Wilcoxon Rank Sum Test
摘要: 人口老龄化已成为全国一个极为严峻的社会问题,区域经济发展的不平衡导致人口老龄化存在差异。基于全国2003~2017年31个省的老年人口相关数据,利用非参数假设检验方法,分别考查了人口老龄化水平在东、中、西部地区及各地区省际间的空间差异。具体来说,首先利用Kruscal-Wallis方法分析得出:东、中、西部地区的人口老龄化差异呈现03~08年较为显著,09~12年逐渐减弱,13~17年又慢慢提高的趋势,18~21年趋于稳定。其次将Friedman检验用以探索人口老龄化水平在各地区省际间也存在显著差异,得出东部地区人口老龄化程度辽宁省最为严重,中部地区湖南、安徽和湖北省较重,山西省最轻,西部地区重庆市最重,西藏最轻。最后基于Wilcoxon秩和方法发现全国女性人口老龄化程度显著高于男性人口老龄化程度。
Abstract: Currently, the population aging has become an extremely serious social problem in China and the imbalance of regional economic development leads to the difference of population aging. Based on the older coefficient data of 31 provinces in China, this paper firstly focuses on the spatial variation of the population aging in the eastern, middle and western regions and among their provinces in each region. Specifically, the Kruscal-Wallis method is used to analyze that the difference of population aging in the eastern, central and western regions is more significant in 03-08 years, gradually weakens in 09-12 years, slowly increases in 13-17 years, and tends to be stable in 18-21 years. Secondly, the Friedman test is used to explore that there are significant differences in the level of population aging among different regions and provinces, and it is concluded that the degree of population aging is the most serious in Liaoning Province in the eastern region, the heavier in Hunan, Anhui and Hubei provinces in the central region, the lightest in Shanxi Province, the heaviest in Chongqing Municipality in the western region, and the lightest in Xizang. Finally, based on the Wilcoxon rank-sum method, it is found that the aging degree of the female population is significantly higher than that of the male population.
文章引用:闫文璐, 沈思连, 张英杰. 我国人口老龄化的非参数统计分析[J]. 应用数学进展, 2024, 13(4): 1486-1493. https://doi.org/10.12677/aam.2024.134139

1. 引言

当今社会,人口老龄化问题是世界各国公认的难题之一。人口老龄化是指当一个国家或地区60岁及以上人口占总人口的10%或65岁及以上人口占总人口的7%,这就代表了这个国家或地区迈入了老龄化社会。

我国人口占世界总人口的20%,人口老龄化问题日益突显。根据中国统计年鉴发布的数据,2000年我国老年人口比重已达到了7%,2017年已增长到11.4%,这意味着我国即将迎来人口老龄化的高峰,并将在2024年至2026年前后进入老龄社会。这严重影响我国社会、经济的发展。另一方面,我国区域经济发展的不平衡导致人口老龄化水平存在着空间差异,因此有必要研究人口老龄化及其区域差异,以便为国家和政府有针对性地调整各地区的人口政策提供统计依据。

2. 文献综述

关于人口老龄化问题的研究,目前已有丰富的研究成果。国外学者的研究多侧重于其发展趋势、影响因素和应对措施。例如,Anderson [1] 对工业化国家老龄化数据进行分析,认为预期寿命延长、出生率下降以及人口迁移是影响人口老龄化的主要因素。Shrestha [2] 侧重于研究发展中国家的人口老龄化问题,分析得出发展中国家的人口老龄化增长速度远远快于发达国家。国内学者对于人口老龄化问题的研究多倾向于现状、特点、后果、对策、变化趋势等方面。如高秀文、孙鹃娟 [3] 考查了中国人口老龄化现状特点及与世界各国的不同之处。武勇 [4] 立足于解决养老问题,提出健康养老、快乐养老的重要建议。

近年来,一些统计学者开始关注人口老龄化的地区差异及影响因素。如李乐乐 [5] 基于泰尔指数分析,发现我国各地区人口老龄化发展不均衡,并考查其影响因素。张晓萌 [6] 于2018年分析了我国人口老龄化的区域差异。黄明远 [7] 基于聚类分析考查了我国31个省的人口老龄化水平,并进行分类。李秀丽,王良健 [8] 运用方差分析方法对我国人口老龄化差异进行研究。赵儒煜、刘畅、张锋 [9] 运用空间计量经济学理论对我国人口老龄化进行分析。杨雪、王淇田 [10] 基于2000~2007年我国31个省的人口老龄化相关数据,运用SPSS软件进行Q型聚类分析。王培勋 [11] 和林国旗 [12] 分别研究了陕西省和绍兴市人口老龄化的发展趋势。王雪辉 [13] 则研究了我国老年人口的群体特征及老龄化的变动趋势。

总之,国内外学者研究的侧重点不同,相应的研究方法也大不相同。由于国外与我国在地理和政治上都存在着巨大差别,故而在借鉴国外学者对人口老龄化研究的经验之上需要进行适当调整以适应我国的人口老龄化发展状况。

我国人口老龄化问题的研究多采用因子分析、聚类分析和方差分析等方法。所搜集的数据亦多为2010年以前的数据,对于近年来人口老龄化发展差异的研究尚为数不多。另一方面,与上述参数统计方法相比,非参数方法更多的是依靠数据本身的信息,更能体现出“让数据自身说话”的探索性回归的特点。因此,本文搜集2003~2021年我国31个省的人口老龄化数据,采用非参数理论方法研究人口老龄化及其区域差异。

3. 研究方法

3.1. Kruskal-Wallis检验

设有k个连续型随机变量总体 X 1 , X 2 , , X k X i 1 , X i 2 , , X i n i 是来自第i个总体 X i 的简单随机样本, i = 1 , 2 , , k ,且k个总体及来自各总体的样本相互独立。容量为 N = i = 1 k n i ,设第i个总体 X i 的分布函数为 F ( x θ i ) , i = 1 , 2 , , k ,考虑如下假设:

H0 θ 1 = = θ k H1 θ 1 , , θ k 不全等。

将来自于这k个总体的样本合在一起,按从小到大排序,记第i个总体样本 ( X i 1 , X i 2 , , X i n i ) 的秩为: ( R i 1 , R i 2 , , R i n i ) i = 1 , 2 , , k 。记 N = i = 1 k n i R ¯ i = 1 n i i = 1 n i R i j ,构造Kruskal-Wallis统计量

K = 12 N ( N + 1 ) i = 1 k n i ( R ¯ i N + 1 2 ) 2

且有

p = P H 0 ( k k 0 ) = P ( x 2 ( k 1 ) k 0 )

其中 k 0 为基于样本数据求得的统计量k的观测值(具体可见参考文献 [14] )。

3.2. 完全区组设计下的Friedman检验

设有k个处理b个区组的完全区组设计中,记第j个区组中,接受第i种处理的个体的处理效果度量值为 X i j ( i = 1 , 2 , , k j = 1 , 2 , , b ),且 x i j ~ F j ( x θ i ) ,考虑假设:

H0 θ 1 = θ 2 = = θ k H1:至少有两个不等。

记第j个区组的k个样本的秩: R 1 j , R 2 j , , R k j ( j = 1 , , b ),构造Friedman统计量为

θ = 12 b k ( k + 1 ) i = 1 k ( R ¯ i R ¯ ) 2

其中 R ¯ i 为接受第种处理方法的b个个体秩的平均值, R ¯ 为全体个体秩的平均值。同样可以证明(见文献 [11] ): p = P H 0 ( θ θ 0 ) P H 0 ( x 2 ( k 1 ) θ 0 )

3.3. Wilcoxon秩和检验

( X 1 , X 2 , , X m ) 在混合样本中的秩为 ( R 1 , R 2 , , R m ) ( Y 1 , Y 2 , , Y n ) 在混合样本中的秩为 ( S 1 , , S n ) 。构造统计量

W X = i = 1 m R i

P H 0 ( W X = k ) = # { k ; m ; n } c N M ,其中 # { k ; m ; n } 为满足{( ( R 1 R m ) = ( r 1 , r 2 , , r m ) i = 1 m r i = k )}的情况数(不考虑顺序)。

4. 实证结果分析

按照学术界标准,本节将我国31个省分为三大地区:东部、中部和西部地区,其中东部地区包含北京市、天津市、海南省、上海市、江苏省、浙江省、辽宁省、福建省、山东省、广东省和河北省共11个省市。中部地区包含山西省、吉林省、黑龙江省、安徽省、江西省、河南省、湖北省和湖南省共8个省市。西部地区包含内蒙古自治区、广西壮族自治区、重庆市、四川省、贵州省、云南省、西藏自治区、陕西省、甘肃省、青海省、宁夏回族自治区和新疆维吾尔自治区共12个省市。

按照上述分区我们根据2003年~2021年我国各省市年末总人口数和65岁及以上人口数整理得出:1) 2003年~2021年我国东部、中部和西部地区的年末总人口数;2) 2003年~2021年我国东部、中部和西部地区的65岁及以上人口数,进而我们计算出2003年~2021年我国东部、中部和西部地区的老年人口比重数据。

4.1. 人口老龄化的地区差异分析

为了考查我国东、中、西部地区的人口老龄化程度是否存在显著差异,考虑如下假设:

H0:东、中、西部老龄化程度无显著差异↔H1:东、中、西部老龄化程度有差异。

基于上述整理求得的2003~2021年东、中、西部地区的老年人口系数数据,利用Minitab软件做Kruskal-Wallis检验,检验p-值如表1所示。

Table 1. p-value of Kruskal-Wallis test results from 2003 to 2017

表1. 2003年~2017年Kruskal-Wallis检验结果的p-值

Table 2. The mean rank of each region of the Kruskal-Wallis test results from 2003 to 2017

表2. 2003年~2017年Kruskal-Wallis检验结果的各地区秩均值

表1中结果,我们可以看出:首先,2003~2021年的p值均小于0.3。在这19年的数据里,p值较小的年份为2003年~2008年,均小于0.05,即可以认为在这六年我国东部、中部、西部三个地区人口老龄化的差异较为显著,远远大于其他年份。其次,2009~2012年,检验p值由0.068逐年增加到0.269,这说明在这四年里我国东部、中部、西部三个地区人口老龄化程度的差异在慢慢减弱。再次,2013~2017年的p值呈现出递减趋势,这说明近五年我国各地区人口老龄化程度的差异又在慢慢提高。最后,2018~2021年这几年的p值相差不大,说明这几年我国各地区人口老龄化程度的差异性逐渐稳定。

为分析造成我国各地区人口老龄化差异的原因,我们对Kruskal-Wallis检验的秩均值进行整理,相关结果如表2所示。

为了更直观地展示2003~2017年我国各地区老年人口比重的秩均值变化,我们将表2中的数据可视化,如图1所示。

Figure 1. Chart of rank mean in Kruskal-Wallis test in the eastern, central, and western regions from 2003 to 2017

图1. 2003~2017年东部、中部和西部地区Kruskal-Wallis检验中秩均值变化图

图1我们可以看出:

1) 东部地区的秩均值在2003~2010年是呈现逐年下降趋势的,中部和西部地区的秩均值在2003~2010年是呈现增长趋势的,并且在此期间东部地区的秩均值始终远远高于中部、西部地区的秩均值,中部地区的秩均值次之,西部地区的秩均最低。说明2003~2010年东部、中部和西部地区的人口老龄化程度是有显著差异的,并且东部地区的人口老龄化程度最高,中部地区次之,西部地区最低。

2) 这种情况在2010年之后有所改变,特别是从2010~2014年,东部地区和中部地区的秩均值几乎保持一致,与此同时西部地区的秩均值仍然位于这三者中的最低,这源于东部和中部地区的人口老龄化程度有所下降,与此同时西部地区的人口老龄化程度有所提高,并且各地区人口老龄化的差异有所减弱。

3) 从2014~2017年,东部地区和中部地区的秩均值呈现出增长趋势,西部地区的秩均值呈现出下降趋势,并且东部地区秩均值的增长速度快于中部地区秩均值的增长速度,因此在时间上三者的差距越拉越大。观察这四年的数据我们发现东部、中部和西部地区的人口老龄化程度差异有所提高,并且东部地区人口老龄化程度较高,中部次之,西部最低。

4) 从2018~2021年,东、中、西部地区的秩均值均呈现稳定态势,同时中部地区的秩均值是这三者中最低的,这说明近几年中部地区的人口老龄化程度高于东、西部地区的人口老龄化程度。

通过上述分析,本文详细地描述了我国各地区人口老龄化程度的差异,这使得国家和政府可以更加有针对性地调整各地区应对人口老龄化问题的对策。

4.2. 人口老龄化各地区省际间的差异分析

为了进一步分析2003~2021年这19年来我国各地区省际间的差异,本文利用Minitab软件对2003~2021年我国各地区省市的老年人口比重做Friedman检验。在接下来的Friedman检验中,共有19个年份的数据,东部地区包含11个省市,中部地区包含8个省市,西部地区包含12个省市,所以假设年份为区组,各地区包含的省市的数目为处理对象的个数,那么本文针对东部、中部和西部地区分别做Friedman检验,处理对象分别为11、8和12,区组均为19,检验的原假设依次为:1) H 0 1 :东部地区各省市间无显著性差异;2) H 0 2 :中部地区各省市间无显著性差异;3) H 0 3 :西部地区各省市间无显著性差异,相关检验结果如表3表4表5所示。

Table 3. Results of the Friedman test in the provinces of the eastern region

表3. 东部地区各省份的Friedman检验结果

Table 4. Results of the Friedman test in the provinces of the central region

表4. 中部地区各省份的Friedman检验结果

Table 5. Results of the Friedman test in the provinces of the western region

表5. 西部地区各省份的Friedman检验结果

表3中的计算结果可以看出,Friedman检验统计量的值为138.22,所得p值近似为0,远远小于显著性水平 α = 0.05 ,拒绝 H 0 1 ,即认为东部地区各省市的人口老龄化存在显著性差异。并且我们不难发现,在东部地区包含的11个省市中,上海市和辽宁省人口老龄化程度最为严重,人口老龄化程度较重的为江苏省、天津市和浙江省,人口老龄化程度一般的为山东省和北京市,人口老龄化程度较轻的为河北省、福建省以及海南省,人口老龄化程度特别轻的为广东省。

观察表4可知,Friedman检验统计量的值为72.58,所得p值约为0.000,小于显著性水平 α ,拒绝 H 0 3 ,即认为中部地区各省市的人口老龄化存在显著性差异。且在中部地区包含的8个省市中,人口老龄化程度较重的是湖南省、安徽省和湖北省,人口老龄化程度较轻的为吉林省、黑龙江、河南省和江西省,人口老龄化程度最轻的为山西省。

表5中的结果告诉我们,相应统计量的值为190,检验p值远小于显著性水平 α ,拒绝 H 0 3 ,说明西部地区各省市的人口老龄化存在显著性差异。并且在西部地区包含的12个省市中,人口老龄化程度最重的是重庆市,人口老龄化程度较重的是陕西省和广西,人口老龄化程度一般的为贵州省、内蒙古、甘肃省和云南省,人口老龄化程度较轻的为青海省、新疆和宁夏,人口老龄化程度最轻的为西藏。

4.3. 人口老龄化的性别差异分析

通过上述分析可知,我国人口老龄化存在显著的地区差异,那其是否存在性别差异呢?假如存在性别差异,那这个差异又是如何体现的?带着这两个问题本节搜集到了2003~2021年全国男女老年人口比重数据。

从原始数据我们发现,从2003~2010年,我国男性老年人口比重大于女性老年人口比重,而2011~2021年,我国男性老年人口比重小于女性老年人口比重。为此,我们利用Minitab软件分别对2003~2010年我国男女老年人口比重、2011~2021年男女性老年人口比重和2003~2021年男女老年人口比重做Wilcoxon秩和检验,检验的原假设分别为:1) H 0 1 :2003~2010年我国男性老年人口比重和女性老年人口比重无显著差异;2) H 0 2 :2011~2021年我国男性老年人口比重和女性老年人口比重无显著差异;3) H 0 3 :2003~2021年我国男性老年人口比重和女性老年人口比重无显著差异,相关检验结果如表6所示。

Table 6. Triple Wilcoxon rank-sum test results

表6. 三次Wilcoxon秩和检验结果

表6中的结果可以看出,检验p值均小于显著性水平 α = 0.05 ,拒绝三个原假设,即认为2003~2010年和2011~2021年我国男女人口老龄化程度以及2003~2021年我国男女老年人口老龄化程度均存在显著差异。

由于2003~2010年的p值相较于其他两个p值大,故可以认为2003~2010年我国男女人口老龄化程度差异最大。

通过上述分析,检验了我国人口老龄化问题的性别差异,分析结果得这个差异是显著存在的,并且我国人口老龄化问题中女性人口老龄化程度要重于男性人口老龄化程度,这为国家和政府解决人口老龄化提供了重要思路。

5. 结论

随着社会和经济的发展,我国的人口老龄化问题日益突出。为了考查人口老龄化的地区差异和性别差异,本文搜集2003~2021年我国31个省的人口老龄化数据,采用非参数理论方法进行相关的假设检验。具体来说,首先利用Kruscal-Wallis检验方法考查了人口老龄化水平在东、中、西部地区的差异。其次利用Friedman检验方法研究了人口老龄化在东、中、西部各省份间的差异。最后将Wilcoxon秩和方法应用于探索人口老龄化水平的性别差异。以上关于人口老龄化区域差异和性别差异的研究可为国家和政府有针对性地调整各地区应对人口老龄化问题的对策提供统计依据和重要思路。

NOTES

*通讯作者。

参考文献

[1] Anderson, G.F. and Hussey, P.S. (2000) Population Aging: A Comparison among Industrialized Countries. Health Affairs, 19, 191-203.
https://doi.org/10.1377/hlthaff.19.3.191
[2] Shrestha, L.B. (2000) Population Aging in Developing Countries. Health Affairs, 19, 204-212.
https://doi.org/10.1377/hlthaff.19.3.204
[3] 孙鹃娟, 高秀文. 国际比较中的中国人口老龄化: 趋势、特点及建议[J]. 教学与研究, 2018(5): 59-66.
[4] 武勇. 满足老年人的需求和破解人口老龄化的对策[J]. 大庆社会科学, 2019(2): 100-101.
[5] 李乐乐. 我国人口老龄化地区差异及影响因素分析[J]. 华中农业大学学报(社会科学版), 2017(6): 94-102-151.
[6] 陈明华, 仲崇阳, 张晓萌. 中国人口老龄化的区域差异与极化趋势: 1995-2014 [J]. 数量经济技术经济研究, 2018, 35(10): 111-125.
[7] 黄明远. 对我国各省人口老龄化差异的聚类分析[J]. 劳动保障世界, 2018(35): 26-27.
[8] 李秀丽, 王良健. 我国人口老龄化水平的区域差异及其分解研究[J]. 西北人口, 2008(6): 104-107, 111.
[9] 赵儒煜, 刘畅, 张锋. 中国人口老龄化区域溢出与分布差异的空间计量经济学研究[J]. 人口研究, 2012, 36(2): 71-81.
[10] 杨雪, 王淇田. 中国人口老龄化趋势地区性差异的量化分析[J]. 吉林大学社会科学学报, 2012, 52(1): 148-153.
[11] 王培勋. 陕西省人口老龄化发展趋势的数学模型与统计预测[J]. 统计与信息论坛, 2004(4): 63-68.
[12] 林国旗, 李才红. “十三五”规划背景下绍兴市人口老龄化现状及对策研究[J]. 统计与管理, 2020(7): 47-50.
[13] 王雪辉, 彭聪. 我国老年人口群体特征的变动趋势研究[J]. 人口与社会, 2020(4): 29-45.
[14] 王静龙. 梁小筠. 非参数统计分析[M]. 北京: 高等教育出版社, 2006: 4.