基于Leslie模型不同生育政策下的人口预测
Population Prediction under Different Fertility Policies Based on the Leslie Model
摘要: 人口对中国经济发展影响巨大,而生育政策直接影响着人口的发展趋势。本文通过建立Leslie人口预测模型,研究了在计划生育政策下总和生育率取1.4和全面二孩政策下总和生育率取1.6我国中长期的人口总量变化趋势以及老龄化发展趋势。结果表明,在全面二孩政策下,至2088年,我国人口将稳定在13.5亿左右,短期内依旧面临着巨大的人口压力;同时,全面二孩政策有助于减缓人口老龄化的程度,但是短期内无法做到避免老龄化程度加剧。进一步地,为了更好地研究影响人口变化的因素,本文针对总和生育率,选取了生育政策、经济发展水平、城镇化水平这三个因素建立了总和生育率的线性回归模型,显著性检验表明三个因素的影响是显著的,并预测了至2053年的总和生育率。
Abstract: Population has a huge impact on China’s economic development, and the fertility policy directly affects the development trend of this population. By establishing Leslie population forecasting model, this paper studies the medium and long term population change trend and aging development trend of China under the family planning policy with the total fertility rate of 1.4 and the universal two-child policy with the total fertility rate of 1.6. The results show that under the universal two-child policy, China’s population will stabilize at about 1.35 billion by 2088, but it still faces huge population pressure in the short term. At the same time, the universal two-child policy can help slow down the degree of population aging, but it can not avoid the aging degree in the short term. Further, in order to better study the factors affecting population change, this paper selects three factors, namely fertility policy, economic development level and urbanization level, to establish a linear regression model of total fertility rate. The significance test shows that the effect of the three factors is significant and predicts the total fertility rate up to 2053.
文章引用:朱晨宇. 基于Leslie模型不同生育政策下的人口预测[J]. 理论数学, 2024, 14(6): 43-53. https://doi.org/10.12677/pm.2024.146226

1. 引言

中国是世界上人口最多的国家,截至2023年,中国总人口已达到14.1亿。我国作为一个人口大国,人口问题一直是政策制定和发展规划的核心,人口环境对我国经济、社会、资源、环境等方面都有着不可忽视的重要影响[1]。为解决人口快速增长所带来的就业、资源、教育等问题,1978年起,计划生育被列入为一项基本国策。计划生育政策对人口的快速增长起到了减缓作用,但随之而来也出现了人口老龄化,男女比例失衡等问题。人口的数量,年龄结构始终是影响中国未来发展的关键因素之一。近年来,我国的人口政策已经做出了重大的调整。2011年11月,出台双独二孩政策;2013年12月,开始实施单独二孩政策;2016年1月1日起,全面实施二孩政策。随着全球化的加快,人口的变化已经成为一个全球关注的焦点。2023年,我国全年出生人口902万人,总和生育率跌破1.1,全球倒数,人口老龄化严重,深入研究和掌握人口变化规律已经刻不容缓,这可以为政策制定提供思路,为国家提供有限的政治、文化、经济、教育等多方面的指导,从而实施科学的管理。因此准确地预测未来人口的发展趋势,对制定合理的人口规划和人口布局方案具有重大的意义。

国内外许多学者都致力于人口预测方法的研究。1798年,马尔萨斯[2]提出了马尔萨斯模型,它使用几何级数的原则来推断出一个时期的总体人口。1838年,荷兰的罗吉斯蒂克[3]提出的Logistic生物种群模式,进一步地描述出人口变化的总体趋势,即以S字形的趋势逐渐上升。澳大利亚的Leslie [4]于1945年创建了Leslie模型,它利用当时的年龄分布情况来建立Leslie矩阵,可以准确地估算未来时期种群的数量和年龄结构。上世纪80年代,著名学者宋健[5]利用概率理论构建了一个全新的宋健人口发展模型,它将出生率、死亡率等指标纳入其中,从而构建一个偏微分方程,用以预测中国的人口数量。巩永丽[6]利用非参数自回归模型,成功地预测了人口的增长率,克服了传统模型无法反映人口非线性特征的缺陷。闫佩玉[7]通过使用BP神经网络,说明了新一代独生子女的实施将会带来许多好处,中国的人口结构会有所改善。

在人口预测方面,李菲雅[8]等人通过使用支持向量机模型和主成分分析模型,并结合MATLAB和SPSS软件,对我国未来人口总量进行了预测。郑健松[9]基于我国未来人口总量和省际人口规模数据,通过队列要素法对其进行预测,研究结果表明,随着全面二孩政策的推出,未来中国的人口数量和地区间的差异性显著缩小。姚文华[10]等以吉林长春市为例,整理了1998~2021年的市人口数据并运用灰色系统GM(1,1)模型预测和分析2022~2050年长春市人口发展趋势。在预测的基础上对长春市今后实现人口可持续发展提出相应的建议。杨爽[11]等基于改进的Logistic阻滞增长模型,采用了3种参数估计方法进行求解,包括向后差分线性最小二乘参数估计、向前差分线性最小二乘参数估计、非线性最小二乘参数估计,并指出基于非线性最小二乘参数估计法采用改进后的Logistic阻滞增长模型求解的拟合优度与平均相对误差更优,更适合进行中国人口数量的预测。然而经典的Logistic阻滞增长模型和灰色系统GM(1,1)模型更适用于短期的人口预测,并且他们对于影响人口发展的因素研究较少,比如不同生育政策导致的总和生育率不同,因此,在不同的生育政策下,总和生育率取值也要不同。并且总和生育率受到许多因素的影响,如经济发展水平、生育政策、出生率、受教育程度、城镇化水平等因素。

本文通过建立Leslie模型进行中长期的人口预测。根据生育率的分布,我们建立了对数正态分布密度函数以及 χ 2 分布密度函数,并选取 χ 2 分布密度函数进行计算。考虑到在不同的生育政策下,总和生育率取值是不同的,本文分别在计划生育政策下和全面二孩政策取不同的总和生育率,并对生育率进行修正,得到年龄别生育率。通过计算女性人口的数量,再根据男女性别比,对比了两种政策下的人口发展趋势以及人口老龄化发展趋势,并给出了相关建议。针对总和生育率的影响因素,本文选取生育政策、经济发展水平、城镇化水平进行多元线性回归,并预测未来总和生育率的发展趋势,为政策制定提供更科学的依据。

2. Leslie人口预测模型

2.1. 按年龄别人口预测模型

Leslie人口预测模型是一种具体的矩阵机理的离散化随机模型,它在预测人口总量的同时也可以在一定程度上反映人口结构的发展趋势。模型主要方法为按性别分组,以女性某一初始时期的分年龄别人口数作为一个列向量,通过利用年龄别生育率和年龄别死亡率来构建Leslie矩阵,左乘分年龄别人口数的列向量,得到新的列向量即为预测的女性人口,再通过分析男女性别比例去推算总人口规模。

将人口按年龄大小等间距地分成n个年龄组时间离散化为 t=0,1,2,,n 。模型要研究的是女性的人口分布随时间变化规律,从而进一步研究总人口数等指标的变化规律。这里假设生育率和死亡率不随时间改变。同时假设我国是一个封闭的人口系统,不考虑人口的迁入与迁出;在预测时间内,不考虑战争、自然灾害等对人口发展的影响。

记时段tk年龄组的女性数量为 x k ( t ) t=0,1,2, k=0,1,2,,n 。第k年龄组的生育率为 b k ,第k年龄组的女性死亡率为 d k ,生存率为 s k s k =1 d k x k ( t ) 的变化规律由以下的基本事实得到:时段t + 1第一年龄组人口数量是时段t各年龄组生育数量之和,即

x k ( t+1 )= k=1 n b k x k ( t ). (2.1)

时段t + 1第k + 1年龄组的人口数量是时段tk年龄组生存下来的数量,即

x k+1 ( t+1 )= s k x k ( t ), k=1,2,,n1. (2.2)

由生育率 b k 和生存率 s k 构成的矩阵:

L=[ b 1 b 2 b n1 b n s 1 0 0 0 0 s 2 0 0 0 0 s n1 0 ].

于是可以得到女性人口任意时间按年龄组的分布:

x k ( t ) L t x( 0 ). (2.3)

其中, x( 0 ) 是初始年份女性人口按年龄组的分布。

根据男女性别比,可以求出中国总人口按年龄组分布的人口预测模型,这里不妨假设女性性别占比为稳定值0.49,最终得到中国总人口按年龄组分布的人口预测模型:

N( t )= L t x( 0 ) 0.49 . (2.4)

但由于模型并不知道年龄别生育率 b k 的值,因此我们还需建立年龄别生育率模型。

2.2. 年龄别生育率模型

根据总和生育率与年龄别生育率的关系,女性的年龄别生育率的数学表达式可设为

b k =β h k , (2.5)

其中, β 为总和生育率, h k 为特定的生育模式,k为生育年龄。

生育模式可以由两种方法进行描述:

(1) 对数正态分布模型

首先,从中国统计年鉴获取2012~2015年各年年龄别生育率数据,并绘制如下图1所示:

Figure 1. Age specific fertility rate from 2012 to 2015

1. 2012~2015年年龄别生育率

从图中可以看出生育模式服从偏正态分布,在概率分布函数中,选用属于偏正态分布的对数正态分布。用对数正态分布的数学形式表示生育模式为:

b k = 1 σ 2π ( k k 0 ) exp{ ln( k k 0 ) μ 2 2 σ 2 }. (2.6)

于是年龄别生育率为:

b k = β σ 2π ( k k 0 ) exp{ ln( k k 0 ) μ 2 2 σ 2 }. (2.7)

其中, k 0 为初始生育年龄,参数 μ σ 决定了生育模式的形状。

(2) χ 2 分布模型

通常情况下,生育模式概率密度函数 h k 也可采用 χ 2 分布密度函数[12]

h k = ( k k 0 ) α1 e k k 0 θ θ α Γ( α ) , k> k 0 . (2.8)

并取 θ=2 α= n 2 ,且有 k c = k 0 +n2 ,它表示生育率最高值时的年龄, k 0 表示初始生育年龄,n

是反映育龄女性生育年龄的指标。由此看出,提高 k 0 的数值意味着初始生育年龄的提高,增加n值则意味着晚育。本文中我们不妨取以下数值进行分析:

h k = ( k14 ) 6 e k14 2 2 7 ×6! , k> k 0 . (2.9)

那么,我们可以得到生育模式概率密度函数图2

Figure 2. Probability density function diagram of fertility patterns

2. 生育模式概率密度函数图

本文采用第二个模型进行年龄别生育率的计算。

2.3. 不同生育政策下的人口预测与人口老龄化分析

2.3.1. 不同生育政策对中国总人口的影响

根据本文建立的Leslie人口预测模型,利用MATLAB编程求解。考虑在计划生育政策下和全面二孩政策下,总和生育率分别取1.4 (图3左)和1.6 (图3右),预测出到2090年的人口数据,结果如下图3所示。

Figure 3. Population forecast values for different fertility policies

3. 不同生育政策的人口预测值

并每隔5年给出了具体数值,如表1所示。

Table 1. Population forecast values for different fertility policies

1. 不同生育政策的人口预测值


计划生育(单位:亿)

全面二孩(单位:亿)

2025

14.37

14.76

2030

14.31

14.78

2035

14.15

14.73

2040

14.03

14.80

2045

13.84

14.82

2050

13.48

14.68

2055

13.00

14.37

2060

12.48

14.04

2065

12.05

13.85

2070

11.70

13.78

由模型的结果可知,生育政策对社会的长期稳定起着很关键的作用。分析图3可知,在计划生育政策下,我国总人口将在2025年达到顶峰,人口为14.38亿,2025年之后,人口将呈下降趋势,并在2070年人口将降至11.7亿。假如继续计划生育政策,那在将来人口将不断减少,国家将面临人口过少、劳动力不足的情况,陷入计划生育的“陷阱”当中。

在全面二孩政策下,中国总人口在2018~2028年这十年内呈上升趋势,到2028年总人口为14.79亿;在2028~2035年,人口呈下降趋势,但是幅度变化很小,到2035年总人口为14.73亿;在2035~2044年这十年内,人口又开始上升,到2044年总人口为14.84亿;2044年之后,人口开始明显下降,并于2080年之后逐步开始稳定,至2088年,人口稳定在13.5亿左右。

2.3.2. 不同生育政策对人口老龄化的影响

人口老龄化是指人口生育率降低和人均寿命延长导致的总人口中因年轻人口数量减少、年长人口数量增加而导致的老年人口比例相应增长的动态。根据1956年联合国《人口老龄化及其社会经济后果》确定的划分标准,当一个国家或地区65岁及以上老年人口数量占总人口比例超过7%时,则意味着这个国家或地区进入老龄化。1982年维也纳老龄问题世界大会,确定60岁及以上老年人口占总人口比例超过10%,意味着这个国家或地区进入严重老龄化。为了控制人口数量和提高人口质量,1982年9月把计划生育纳为我国的基本国策,在一定程度上抑制了我国人口快速增长的趋势。但随着经济发展水平和城镇化水平以及教育的普及,近年来陷入了低生育率陷阱,并出现了一系列诸如“人口红利不断降低乃至消失”、“未富先老”等问题和挑战。本文在计划生育政策下和全面二孩政策下,预测出到2070年的人口老龄化数据,结果如下图4所示。

Figure 4. Population Aging trends under different fertility policies

4. 不同生育政策下的人口老龄化趋势

分析图4可知,“全面二孩”政策有助于减缓人口老龄化的程度,但是短期内无法做到避免老龄化程度加剧,与计划生育政策下的人口老龄化的趋势一样,只是最高值有所降低。因此,在未来三四十年内,我国劳动人口所要背负的压力不断攀升,这会造成整个社会的疲累和青壮年来自社会、家庭的层层压力,会对他们的心理和生理造成一定的伤害,这对劳动人口个人的发展乃至家庭和整个社会的和谐稳定发展都是十分不利的。因此,国家应该建立奖励机制,根据经济水平的不同制定差异化政策。下面给出了2050年不同生育政策下的人口结构预测图,如图5所示。

Figure 5. Population structure under different fertility policies in 2050

5. 2050年不同生育政策下的人口结构

3. 总和生育率模型

考虑到人口的变化一个重要影响因素是总和生育率,研究中国人口数量未来走势,重点是研究总和生育率的未来走势。对总和生育率的准确预判,有利于国家制定合理的生育政策。

总和生育率时衡量国家生育发展水平状况的总体指标。控制人口增长的生育政策最直接的是对女性生育的控制,因而生育政策的直接作用便是生育率水平的降低。从新中国成立后到1972年之前,中国的总和生育率一直处于较高水平,基本保持在5.0~6.5。而自20世纪70年代初开始,中国实行计划生育政策后,总和生育率迅速下降,由1971年的5.44下降到90年代的1.7左右。

一般来说,在经济水平较低的国家和地区,提高经济水平对生育水平的影响较弱。只有当经济水平提高到一定的程度后,才会对生育水平有较为明显的制约作用,因而经济水平对于中等收入国家的生育水平影响较大。如经济发达能够促进社会现代化的转变,带来城镇化率的普遍提高,影响人口生活方式,从而改变生育观念和生育行为。相较于中间收入群体,高收入和低收入人群的收入增长能够更有效的提高生育水平[13]

因此本文选取生育政策 P F 、经济发展水平 P GD 、城镇化水平 R U 这三个因素进行回归分析。首先建立总和生育率的线性回归模型:

β( t )= β 0 + β 1 P F + β 2 log( P GD )+ β 3 R U , (2.10)

其中 β 0 β 1 β 2 β 3 为回归系数。

3.1. 模型中变量的取值

(1) t年份生育政策 P F ( t )

实行计划生育政策取值为1,没有计划生育限制时取值为0,在单独二孩政策下, P F 的值可取为0.7158 [14]

(2) t年份经济发展水平 P GD ( t )

首先查找出1978~2017年国内生产总值(见附录),分析数据发现1978年之后其增长模式类似于阻滞增长模型Logistic模型。文章利用Yule算法对Logistic方程的参数进行估计。

Logistic方程定义如下:

x t = 1 c+a e bt . (2.11)

Step 1根据Logistic方程,有

x t+1 x t x t+1 =1 c+a e b( t+1 ) c+a e bt =( 1 e b )c( 1 e b ) x t . (2.12)

Step 2 z t = x t+1 x t x t+1 γ=1 e b β=c( 1 e b ) ,则式(2.11)变形为线性方程 z t =γ+β x t 。利用普通最小二乘法得到这个方程参数的估计值,bc的估计值 b ^ c ^ 也将进一步得到。

Step 3将式(1)变形为:

ln( 1 x t c ^ )=ln a ^ + b ^ t, (2.13)

左右分别对t求和,

t=1 n ln( 1 x t c ^ ) =nln a ^ + n( n+1 ) 2 b ^ , (2.14)

求得a的估计值为:

a ^ =exp{ 1 n [ t=1 n ln( 1 x t c ^ ) ] n( n+1 ) 2 b ^ }. (2.15)

通过查阅1978~2017年国内生产总值,利用MATLAB编程求解,得到以下方程:

P GD ( t )= 1 5.4375× 10 7 +3.2210× 10 4 e 0.1525( t1978 ) . (2.16)

结果如图6所示:

Figure 6. GDP forecast and actual value curve chart

6. GDP预测值和实际值曲线图

分析图可知,在2008年之后,预测值与上一年的实际值较为接近,于是可以将方程优化为:

P GD ( t )={ 1 5.4375× 10 7 +3.2210× 10 4 e 0.1525( t1978 ) , t2007 1 5.4375× 10 7 +3.2210× 10 4 e 0.1525( t1977 ) , t2008 (2.17)

(3) t年份经济发展水平 R U ( t )

t年份经济发展水平 R U ( t ) 的取值可直接用以下公式进行估计[15]

R U ( t )=0.8( 1 1 1+ e 128.0673+0.063948t ). (2.18)

3.2. 总和生育率的回归分析与预测

采用2000~2017年的各项数据进行多元回归分析,得到回归方程式:

β( t )=1.3933+0.0637 P F ( t )+0.0513log( P GD ( t ) )+0.0085 R U ( t ). (2.19)

显著性如表2所示:

Table 2. Significance test

2. 显著性检验

R2

F

P

0.964

125.17

0

结果表明,当置信水平为 1α 时, α<0.05 ,拟合程度良好,回归方程成立。

本文预测了到2053年的总和生育率,如图7所示。

Figure 7. Total fertility rate prediction chart

7. 总和生育率预测图

图7可知,总和生育率在接下来的几十年内将不断升高,但是升高趋势变得越来越平缓,将在1.66~1.67之间波动。因此,未来我国应该不断放松生育政策,鼓励生育,全国各地应积极健全生育配套服务,从生育补贴、生育保险、个税减免、延长育儿假、提供托育服务、住房优先保障等方面降低生育养育教育成本,缓解日益严重的低生育率问题和人口老龄化问题。

4. 结语

本文建立了Leslie人口预测模型,通过计算女性人口的数量,再根据男女性别比,预测未来中国总人口数量。根据本文构造的Leslie模型,分析了在不同生育政策下的人口发展趋势以及老龄化发展趋势。结果表明假如继续计划生育政策,那在将来人口将不断减少,国家将面临人口过少、劳动力不足的情况,陷入计划生育的“陷阱”当中。如果取消计划生育,那么至2088年,人口将稳定在13.5亿左右。同时,放宽生育政策有助于减缓人口老龄化的程度,但是短期内无法做到避免老龄化程度加剧,与计划生育政策下的人口老龄化的趋势一样,只是最高值有所降低。因此,我们应该采取更多其他的措施,比如可以从生育激励措施、教育、社会保障、银发经济、人口素质等方面入手来改善人口问题所带来的一些社会问题。同时建立回归模型研究影响人口的变化一个重要因素——总和生育率,建议未来我国应该不断放松生育政策,鼓励生育,提高总和生育率。由于本文建立的Leslie人口预测模型是假设性别比不变的,但是这显然会带来误差。若预测未来某一年的性别比例,则Leslie模型整个建模的过程用来两次预测,两次预测均引入误差,这样预测出的总人口数误差较大,具有局限性。因此未来可以考虑研究双性别人口Leslie人口矩阵,并考虑生育水平,出生人口性别比及人口流动的影响,完成对传统Leslie人口预测模型的改进工作。

参考文献

[1] 赵英辰. 全面二孩政策下我国人口结构预测研究[D]: [硕士学位论文]. 长春: 吉林财经大学, 2018.
[2] 托马斯, 罗伯特. 马尔萨斯人口原理[M]. 陈小白, 译. 北京: 华夏出版社, 2013.
[3] Vogels, M., Zoeckler, R., Stasiw, D.M., et al. (1975) P.F. Verhulst’s “notice sur la loi que la populations suitdans son accroissement” from correspondence mathematique et physique. Ghent, vol. X, 1838. Journal of Biological Physics, 3, 183-192.
https://doi.org/10.1007/BF02309004
[4] Leslie, P.H. (1945) On the Use of Matrices in Certain Population Mathematics. Biometrika, 33, 183-212.
https://doi.org/10.1093/biomet/33.3.183
[5] 宋健, 田雪原, 于愿元. 人口预测和人口控制[M]. 北京: 人民出版社, 1982.
[6] 巩永丽. 中国人口增长率的非参数自回归模型[D]: [硕士学位论文]. 西安: 西安理工大学, 2007.
[7] 闫佩玉. 基于BP神经网络研究二孩政策对我国人口结构的影响[D]: [硕士学位论文]. 青岛: 青岛大学, 2018.
[8] 李菲雅, 蒋若凡. 基于主成分和支持向量机模型在人口预测中的应用[J]. 西北人口, 2012, 33(1): 29-32.
[9] 龙晓君, 郑健松, 陈慕华. “全面二孩”背景下我国省际人口分布时空演变[J]. 经济地理, 2018, 38(1): 28-35.
[10] 姚文华, 温馨. 基于灰色系统模型的人口预测分析[J]. 牡丹江教育学院学报, 2023(3): 107-110.
[11] 杨爽, 陈宏武, 刘明阳, 等. 基于改进的Logistic阻滞增长模型的人口预测研究[J]. 内蒙古科技与经济, 2024(2): 29-33+50.
[12] 宋健, 于景元, 李广元. 人口发展过程的预测[J]. 中国科学, 1980(9): 920-932.
[13] 刘卓. 中国人口生育水平变动及影响因素研究[D]: [硕士学位论文]. 成都: 西南财经大学, 2020.
[14] 赵广宇, 卢昱欣, 高斌, 赵鹏飞. 计划生育政策调整对人口数量和结构影响的研究[J]. 长春理工大学学报(自然科学版), 2016, 39(5): 131-135, 143.
[15] 刘雨婷, 刘艳琪, 邓智年, 程子明. “全面二孩”政策下的人口数量与结构预测[J]. 湖南文理学院学报(自然科学版), 2018, 30(4): 17-21.