基于开放三孩背景下人口增长模型的构建与研究
Construction and Research of Population Growth Model Based on the Background of Open Three-Child
摘要: 人口的数量和结构是影响社会经济发展的重要因素。本文构建分年龄别生育率模型对年龄别生育率进行拟合,基于对数正态分布和泊松分布的生育率组合模型对开放三孩后的分年龄别生育率进行预测。根据预测到的分年龄别生育率,通过Leslie矩阵结合人口的年龄结构对未来10年人口状况进行预测。采用灰色关联度分析法,对新出生人口的影响因素进行分析,使用多项式改进的线性回归模型,将支出的比例与新出生人口的关系量化,得出结论:双减政策落地后能够增加新出生人口数量。依照以往中国在提高生育水平方面和克服人口老龄化方面的成功经验,结合中国的实际情况,从教育角度进行剖析,给出促进生育意愿的有效方案。
Abstract: The number and the structure of the population are the important factors affecting the social and economic development. In this paper, the age-specific fertility model was constructed to fit the age-specific fertility rate, and the combined model-based fertility model based on the lognormal distribution and the Poisson distribution predicted the age-specific fertility after the opening of three children. According to the predicted age-specific fertility rate, the population status in the next 10 years is predicted by combining the Leslie matrix with the age structure of the population. The gray correlation degree analysis was used to analyze the influencing factors of the new births, and the polynomial improved linear regression model was used to quantify the relationship be-tween the proportion of expenditure and the new born population. It was concluded that the double reduction policy can increase the number of new births. According to the previous successful expe-rience of China in improving fertility level and overcoming population aging, combined with the ac-tual situation of China, analyze from the perspective of education, to give effective plans to promote fertility intention.
文章引用:周慧敏, 陆海华. 基于开放三孩背景下人口增长模型的构建与研究[J]. 应用数学进展, 2023, 12(6): 2924-2935. https://doi.org/10.12677/AAM.2023.126294

1. 问题背景

我国是一个人口大国,人口问题始终是关系着我国发展的关键问题,人口的数量和结构是影响社会经济发展的重要因素。目前我国人口的发展逐渐出现老龄化严重、男女比例失调等不良现象。针对此,我国对人口发展变化趋势进行调整,先后实施了“计划生育”到“全面二孩”,再到“放开三孩”的政策。

2021年5月31日,中共中央政治局召开会议,审议《关于优化生育政策促进人口长期均衡发展的决定》并指出,为进一步优化生育政策,实施一对夫妻可以生育三个子女政策及配套支持措施,有利于改善我国人口结构、落实积极应对人口老龄化国家战略、保持我国人力资源禀赋优势。2021年8月20日,全国人大常委会会议通过了关于修改人口与计划生育法的决定,该会议规定,国家提倡适龄婚育、优生优育,一对夫妻可以生育三个子女。2022年3月5日,国务院总理李克强代表国务院向十三届全国人大五次会议作政府工作报告,报告提出,完善三孩生育政策配套措施,将3岁以下婴幼儿照护费用纳入个人所得税专项附加扣除,发展普惠托育服务,减轻家庭养育负担 [1] 。

人口预测是指以现有人口现状为基础,并对未来人口的发展趋势提出合理的控制要求和假定条件即参数条件,获得对未来人口数据提出预报的技术或方法。通过采集资料、确定预测参数,建立预测模型来进行,包括人口数量、人口性别和年龄构成等。人口预测的方法有很多,如:人口年增长法、马尔萨斯人口模型、Logistic增长模型、GM(1,1)灰色模型法、时间序列法、回归分析预测法等 [2] 。Leslie模型是在凯菲茨矩阵预测模型的基础上改进而提出的一种具有年龄结构的种群增长模型,特别考虑年龄结构,所以比Logistic增长模型或者其它人口预测模型更具优越性。

开放三孩政策的实施将影响育龄期妇女的生育率,进而影响出生人口数和总人口数,为研究开放三孩政策对年龄别生育率的影响,本研究将使用基于对数正态分布和泊松分布的组合模型进行分年龄别生育率的预测,结合Leslie矩阵对每个育龄段妇女的生育数与每个年龄段的人口变化情况进行分析,基于此,对未来10年的人口状况进行预测,旨在为政府制定社会经济发展战略计划时提供参考依据。

2. 基于开放三孩政策背景下分年龄别生育率模型

2.1. 分年龄别生育率模型的构建

分年龄别生育率,以一定的年龄段进行划分,描述了不同年龄段的育龄期妇女在生育力上的差异 [3] 。由于人口年龄结构也是以一定的年龄段进行划分,因此分年龄别生育率在人口年龄结构变化趋势分析方面是一个重要的数据指标。

2.1.1. 基于对数正态分布函数的生育率模型

f ( x ) = k 1 1 σ 2 π exp { [ ln ( x x 0 ) μ ] 2 2 σ 2 } . (1)

其中: k 1 为尺度变换因子, x 0 表示起始生育年龄,由于育龄期一般指15~49岁,故 x 0 取14岁。参数 μ σ 共同决定分年龄别生育率曲线所呈现的形状,在 μ 相同的条件下, σ 越小,到达期望生育年龄的时间就越短;在 σ 相同的条件下, μ 越小,期望生育年龄周围生育率越高。

2.1.2. 基于泊松分布函数的生育率模型

f ( x ) = k p λ x x 0 e λ ( x x 0 ) ! . (2)

其中: x 0 表示起始生育年龄,取14岁,参数 λ k p 分别表示从起始生育年龄 x 0 至平均生育年龄的时间长度和尺度变换因子。

2.1.3. 基于对数正态分布和泊松分布的生育率组合模型

f ( x ) = k p { α 1 σ 2 π exp [ ( ln ( x x 0 ) μ ) 2 2 σ 2 ] + ( 1 α ) λ x x 0 e λ ( x x 0 ) ! } . (3)

对组合模型而言,参数初始值的设置十分重要,该值与真实值越接近,计算结果误差越小,拟合效果越好。设置生育率组合模型参数初始值时,应充分考虑各参数所表示妇女分年龄别生育率的意义。其中,参数 μ σ λ 的初值将通过妇女期望生育年龄进行推算。由2000~2015年的妇女生育统计数据表明,期望生育年龄一般为24~27岁,且根据期望生育年龄为 exp ( μ + σ 2 2 ) = λ + 14 ,则 λ 的初值范围为10~13, σ 一般为0~1, μ 初值范围为1.5~2.5。

尺度变换因子 k c 极大程度上反映了生育水平的高低,而总和生育率与 k c 所体现的含义最为贴近,因此本研究选用总和生育率(TFR)作为 k c 的初值。 α 的变动,对于组合生育率模型的精度影响极大,通过实验确定其范围在0~1范围内,得到的其他参数估计值才有意义。

2.2. 分年龄别生育率模型的精度对比

根据对各参数的假设和初始设定,分别利用三种模型对2000~2015年分年龄别生育率数据进行曲线拟合,各模型的拟合精度如表1所示。

以2015年为例,展示了基于对数正态分布的生育率模型、基于泊松分布的生育率模型和组合生育率模型得到的分年龄别生育率数据拟合值与实际值的比较,从拟合效果来看,与实际数据吻合程度最高的是组合模型。对比发现,相比于对数正态分布模型和泊松分布模型,组合生育率模型的RSME最小,精度最高,拟合效果最好,如图1所示。

Table 1. Statistical results of different model accuracies

表1. 不同模型精度的统计结果

Figure 1. Prediction of different models on age-specific sub-fertility data in 2015

图1. 不同模型对2015年分年龄别分孩次生育率数据的预测

2.3. 分年龄别生育率模型的参数确定

研究发现,不同的 k c α 初值的设定对模型的收敛影响最大,多次试验结果表明不同的 α 对精度影响很大。通过调整 α 权值,最终得到2000~2015年组合模型的参数估计值,如表2所示。

Table 2. Parameter estimates for the combined model

表2. 组合模型的参数估计值

k c 的估计值符合总和生育率的设定将根据不同的总和生育率来对分年龄别生育率进行预测。由于 α 的估计值始终在0.2附近波动,后续 α 参数初始值设置为0.2,以此类推, σ 初始值设为0.8, μ 的初始值设为1.6, λ 初始值设为12。

2.4. 分年龄别生育率模型的预测

利用组合生育率模型及上一步设置的各参数初始值,对不同的总和生育率设定下的分年龄别生育率进行预测,预测结果如表3所示。本研究将其作为研究三孩政策对人口年龄结构影响的重要参数。

Table 3. Predicted value of age-specific fertility rates under each total fertility rate

表3. 各总和生育率下分年龄别生育率预测值

3. 基于Leslie矩阵的人口状况预测模型

3.1. Leslie矩阵的人口状况预测模型的建立

Leslie模型是一种由莱斯利所推导出的模型,该模型是在凯菲茨矩阵预测模型的基础上改进而提出的一种具有年龄结构的种群增长模型 [4] 。Leslie模型特别考虑年龄结构,所以比其它人口预测模型更具优越性。

首先把人类群体按年龄不同间隔分为n个组,讨论其在不同时间年龄的分布,按年龄大小以五岁为间隔,把所有年龄段的女性划分成96个年龄组,具体为0岁为第1个年龄组,1岁为第2个年龄组,……,94岁为第95个年龄组,95岁以上为第96个年龄组。

t = 1 , 2 , , h i = 1 , 2 , , n 分别表示预测年序号和年龄组序号, [ i 1 , i 2 ] 为育龄区间,定义 x i ( t ) 为第t年第i组女性人口数; b i ( t ) 为第t年第i组女性生育率,满足 i [ i 1 , i 2 ] 时, b i = 0 d i ( t ) s i ( t ) = 1 d i ( t ) 分别表示第t年第i组女性人口的死亡率和存活率, w i ( t ) 为第t年出生人口中女性新生儿所占比例。

根据以上描述,第 t + 1 年第1组的女性人口数为

x 1 ( t + 1 ) = j = i 1 i 2 b j ( t ) w j ( t ) x j ( t ) (4)

而第 t + 1 年第 i + 1 组的女性人口便是从t年第i组存活下来的人数

x i + 1 ( t + 1 ) = s i ( t ) x i ( t ) (5)

根据递推关系,构成Leslie矩阵:

L t = [ w 1 b 1 w 2 b 2 w m 1 b m 1 w m b m s 1 0 0 0 0 s 2 0 0 0 0 s m 1 0 ] (6)

根据Leslie矩阵,利用 X ( t ) 表示第t年各组人口分布的列向量,可以得到人口年龄结构预测的Leslie递推公式:

X ( t + 1 ) = L t X ( t ) (7)

逐步推演该公式可以得到

X ( t ) = L X ( 0 ) (8)

其中 L = j = 0 t L j ,若已知 L t X ( 0 ) ,便可以推测出第t年人口分布数量,根据年龄划分以及男女比例等计算得到人口年龄结构的各个指标。

3.2. Leslie矩阵的人口状况预测模型的参数确定

Leslie矩阵 L t 由生育率、死亡率和性别比构成 [5] 。其中生育率和死亡率分别使用年龄组中每1000名妇女的全年活产婴儿数和死亡人数来表示,而性别比通常描述为每100名女性所对应的男性数目,此处则表现为女性人口在新生人口中的比率。

3.2.1. 生育率测算

生育率决定了新生人口的数量,其在Leslie模型中通过迭代呈现为指数倍的影响,对模型精度至关重要。鉴于目前中国“开放三孩”政策的实施背景,我国的人口增长情况会与“联合国中方案”设定较为接近,因此分年龄别生育率的预测会根据“联合国中方案”下所对应的总和生育率值设置,即总和生育率在2022~2032年为1.63,如表4所示。

Table 4. The fertility rate of three children

表4. 开放三孩政策的生育率

3.2.2. 死亡率测算

死亡率主要由生存环境,医疗条件等决定,并不受“开放三孩”政策的较多影响,因此本研究将2020年分年龄别死亡率用于Leslie模型预测。

3.2.3. 性别比测算

性别比随年龄随机变化但又不符合任何概率分布模型且容易收到传统生育文化的影响,因此在缺乏历史数据的情况下,只能选择2020年的性别比用于模型预测。

3.3. 基于Leslie矩阵的未来十年人口状况预测

本研究对未来10年的总人口数、按性别分的男性和女性人数,以及按年龄分的少年(0~14岁)、青年和中年(15~64岁)、老年(65岁以上)人口数和其所占比重进行预测,如表5所示。总体来说,“开放三孩”政策下由于新出生人口的增加,人口数量会稳步提升,但我国步入老龄化社会的趋势暂未得到改变。

Table 5. Table of population projections for the next 10 years under the three-child policy

表5. 三孩政策下未来10年人口状况预测表

注:人数(万人)、比重(%)

Figure 2. Trend chart of the number of people in each age group

图2. 各年龄段人口数量变化趋势图

Figure 3. Trend chart of total national population

图3. 全国总人口走势图

图1图2所示,三孩政策下未来总人口数持续创新高,但是人口增速持续放缓,根据预测结果,到2030年达到顶峰,之后可能会逐渐下降。对于各年龄段人口,少年、青年和中年人口仍呈缓慢下降趋势,老年人口仍逐渐增加,但是增加趋势稍有放缓。

联合国国际人口协会编辑的《人口学词典》对人口老龄化的定义是:当一个国家或者地区超过65岁(或60岁)以上老年人口占总人口的比重,这个比重也称作老龄化系数,超过7%,则称该国家或者地区为老年性社会,若比重超过14%,则称为老龄社会 [6] 。老龄化系数提现人口老龄化的程度。

表5可得未来10年人口老龄化系数趋势,如图3所示,在三孩政策下我国未来老龄化指数仍呈持续上升趋势,社会老龄化程度不断加剧,全国逐渐步入深度老龄化社会。如图4所示。

Figure 4. Predicted values of the aging coefficient over the next 10 years

图4. 未来10年老龄化系数预测值

4. 双减政策对人口数量的影响分析

“双减”是指要有效减轻义务教育阶段学生过重作业负担和校外培训负担。2021年7月24日,中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》。要求各地区各部门结合实际认真贯彻落实 [7] 。10月,全国人大表示:双减拟明确入法,避免加重义务教育阶段学生负担。

本文将针对双减政策对于新出生人口数目带来的影响进行分析,经由分析可知,教育娱乐支出占整体支出的比重较大,将教育娱乐支出因素与其他支出因素进行结合后,对新出生人口作灰色关联度分析,依照相关性大小得出结果,根据灰色关联系数的大小,对各因素进行排序,可知教育娱乐支出的灰色关联系数分数较高,因此,本文认为“双减”政策的落地有利于促进新出生人口数目的增加。

4.1. 灰色关联度模型

灰色关联分析是指对一个系统发展变化态势的定量描述和比较的方法,其基本思想是通过确定参考数据列和若干个比较数据列的几何形状相似程度来判断其联系是否紧密,它反映了曲线间的关联程度 [8] 。通常可以运用此方法来分析各个因素对于结果的影响程度,也可以运用此方法解决随时间变化的综合评价类问题,其核心是按照一定规则确立随时间变化的母序列,把各个评估对象随时间的变化作为子序列,求各个子序列与母序列的相关程度,依照相关性大小得出结论。具体步骤如下:

1) 确定双减政策下的比较对象(各影响因素)和参考数列(新出生人口的数量)。设比较对象有m个,参考数列有n个,参考数列为 x 0 = { x 0 ( k ) | k = 1 , 2 , , n } ,比较数列为 x i = { x i ( k ) | k = 1 , 2 , , n } , i = 1 , 2 , , m 。在本模型中,比较对象为各个影响因素,参考数列为新出生人口的数量,如表6所示。

Table 6. Table of the newborn population and its influencing factors

表6. 新出生人口及其影响因素表

2) 确定各指标系数的权重。利用层次分析法确定各指标对应的权重 w = [ w 1 , w 2 , , w n ] ,其中 w k ( k = 1 , 2 , , n ) 为第k个评价指标对应的权重。

3) 计算双减政策下各影响因素灰色关联系数:

ξ i ( k ) = min s min t | x 0 ( t ) x s ( t ) | + ρ max s max t | x 0 ( t ) x s ( t ) | | x 0 ( k ) x i ( k ) | + ρ max s max t | x 0 ( t ) x s ( t ) | (9)

为比较数列 x i 对参考数列 x 0 在第k个指标上的关联系数,其中 ρ [ 0 , 1 ] 为分辨系数。其中,称 min s min t | x 0 ( t ) x s ( t ) | max s max t | x 0 ( t ) x s ( t ) | 分别为两级最小差与两级最大差。一般来讲,分辨系数 ρ 越大,分辨率越大; ρ 越小,分辨率越小。

4) 计算灰色加权关联度。灰色加权关联度的计算公式为

r i = k = 1 n w i ξ i ( k ) (10)

其中: r i 为第i个评价对象对理想对象的灰色加权关联度。

5) 评价分析。根据灰色加权关联度的大小,对各评价对象进行排序,可建立评价对象的关联序,关联度越大,其评价结果越好。对新出生人口数进行灰色关联度分析,可得教育支出占比因素所得到的关联度系数分数较高,故本文认为双减政策对新出生人口数目会产生一定的影响,如表7所示。

Table 7. Gray correlation score of each influencing factor

表7. 各影响因素的灰色关联度分数

由分析可知,双减政策背景下,教育支出占家庭支出的比例会对新出生人口数会产生影响,为增强可信度,本文将使用基于多项式回归改进的线性回归模型对该因素对新出生人口的影响作量化分析。

4.2. 基于多项式回归改进的线性回归模型

解决“线性回归只能处理线性数据问题”的手段,就是使用多项式回归对线性回归进行改进。该方法是由支持向量机中获得:通过升维可以将非线性可分数据转化为线性可分,使用核函数在低维空间中进行计算,这是一种“高维呈现,低维解释”的思维。本文将基于该思想,将数据由非线性转换为线性,赋予线性回归处理非线性数据的能力。多项式回归能够较好地拟合非线性数据,还不容易发生过拟合,保留了线性回归作为线性模型所带的“不容易过拟合”和“计算快速”的性质,同时又可实现拟合非线性数据。因此,本文将利用改进后的模型对数据进行拟合,基于最新一年的数据,降低教育与娱乐支出的百分比,以便用来模拟双减政策的影响。

将2019年的教育与娱乐支出所占百分比分别降低1%、2%、3%、4%、5%,其保持不变,观察新出生人口的数量与双减政策实施前新出生的人口数量,二者进行对比后可知,实施双减政策后,新出生人口数目出现不同幅度的增长,如表8所示。

Table 8. Number of new births after the percentage change in education expenditure table

表8. 教育支出百分比变化后新出生人口数量表

本文利用灰色关联分析和基于多项式回归改进的线性回归模型可以找出双减政策对新出生人口数目的影响,并针对该影响因素进行量化分析,模型真实可靠,具有说服力。针对该影响因素进行量化分析,得出结论:实施双减政策后,新出生人口数目会出现不同幅度的增长。

5. 教育领域的应对措施

我国少子化和人口老龄化趋势明显,如果不采取相应的措施加以改善,将严重影响我国经济健康稳定的发展。依照以往中国在提高生育水平方面和克服人口老龄化方面的成功经验,结合中国的实际情况,本文将针对老龄化日趋严重的趋势,从教育医疗、住房、用人单位减负、个税专项附加扣除、延长男性育儿假等多方面综合考虑,并针对老龄化日趋严重的趋势,给出促进生育意愿的有效方案。

人口的发展状况决定着教育发展的速度,人口的密度决定着学校教育的规模,人口出生的高峰与低谷影响到学校不同时期对学额与班级的调整。因此,学龄人口是影响教育需求的基本因素。据调查结果显示,在“单独二孩”政策实施后出生的孩子成长为适龄人口以前,义务教育学龄人口迅速增加,但是,人口扩张期不会持续太长时间,适龄人口很快会回落,“三孩政策”亦将会是如此。在开放三孩背景下,使用Leslie矩阵及基于对数正态分布和泊松分布的组合模型,对开放三孩政策下的未来10年里我国人口状况进行预测后发现,2023年将会是入园的高峰期,这对于我国学前教育资源的供给规模产生重大影响。

学前教育可从以下方面应对三孩政策。第一,加强宣传力度,重构教育观念。长期以来,我国实行独生子女的政策,而独生子女的教育方式不能很好地促进孩子的全面发展。开放三孩之后,家庭结构会出现一定的变化。针对这一状况,不仅需要进行物质上的准备,还需加强宣传力度,改变以往的教育理念,促进教育的发展。第二,加大政策的扶持力度,加强教育投入力度。在放开三孩政策之后,会出现一波生育的高峰,政府部门需要加强教育的投入力度,加大政策的扶持力度,支持教育事业的进步。第三,制定教师准入制度,加强教师队伍建设。资金和政策的投入是硬措施,教师的培训是软措施。在给予更多的教师培训时,需制定教师的准入制度,使得教师具有良好的职业素质,促进教育的有效发展。第四,推进人工智能的应用,建设高质量教育体系。“双减”政策对建设高质量教育体系,促进学生全面发展、健康成长提出了更高的要求。将人工智能技术与学校教育、家庭教育场景深度融合,将进一步减轻家长的教育压力,在“双减”背景下落实减负增效,减轻家长用于子女教育的时间和经济负担。

6. 模型的评价与推广

本文通过建立合理、科学的预测模型,结合实际情况对模型进行求解,通用性、推广性较强。首先,选用Leslie矩阵人口预测模型较为全面地考虑影响人口总量与人口年龄结构的主要因素,提高人口预测的准确性和可信度,并得到较为理想的预测结果。其次,基于对数正态分布模型和泊松分布的组合模型对分年龄别生育率进行预测,该组合模型的精度比其他生育模型的精度更高,适用范围更大。再次,灰色关联度分析模型可以较好地衡量一个项目受其他因素影响的相对强弱,能够合理分析“双减”政策落地后对新出生人口所产生的影响。最后,基于多项式改进的线性回归模型可以克服普通的线性回归模型欠拟合的缺点,拟合更广泛的数据,对教育与娱乐支出占比和新出生人口关系进行量化,取得较好的效果。

不足之处在于未尝试更多方法对模型进行寻优,基于灰色关联度分析的模型考虑相对全面,结果合理性较强,但由于考虑的影响因素较少,在处理问题时可能会存在一些误差,在今后的研究中将进一步改进和优化。

基金项目

国家自然科学基金项目(11501309);2023年江苏省研究生实践创新项目“单元教学促进高中数学深度学习的实践研究”(SJCX23_1773)。

参考文献

[1] 原新. 论优化生育政策与促进人口长期均衡发展[J]. 广州大学学报(社会科学版), 2022, 21(4): 105-120.
[2] 杨丽霞, 杨桂山, 苑韶峰. 数学模型在人口预测中的应用——以江苏省为例[J]. 长江流域资源与环境, 2006(3): 287-291.
[3] 赵佳音, 孙骁. 基于生育率组合模型的分年龄别生育率预测[J]. 统计与决策, 2015(13): 102-105.
[4] 解保华, 陈光辉, 孙嘉琳. 基于Leslie矩阵模型的中国人口总量与年龄结构预测[J]. 广东商学院学报, 2010, 25(3): 15-21.
[5] 任强, 侯大道. 人预测的随机方法: 基于Leslie矩阵和ARMA模型[J]. 人口研究, 2011, 35(2): 28-42.
[6] 吕盛鸽, 宣丹萍. 北京市人口老龄化系数预测[J]. 统计研究, 2012, 29(3): 27-31.
[7] 进一步减轻义务教育阶段学生作业负担和校外培训负担[N]. 人民日报, 2021-07-25(001).
[8] 司守奎, 孙兆亮. 数学建模算法与应用[M]. 北京: 国防工业出版社, 2015: 384-385.