基于熵权TOPSIS的深圳未来医疗和养老保障问题的评价及对策
Evaluation and Countermeasures of Future Medical and Pension Security Problems in Shenzhen Based on Entropy Weight and TOPSIS
DOI: 10.12677/AAM.2021.102066, PDF, HTML, XML, 下载: 524  浏览: 1,399 
作者: 范卓然*, 徐纪隆, 李宇宸:中国海洋大学数学科学学院,山东 青岛
关键词: 指标聚类熵权法TOPSIS方法残差分析多元线性回归Index Clustering Entropy Weight Method TOPSIS Method Residual Analysis Multiple Linear Regression
摘要: 本文从人口数量与结构、经济收入与消费水平、医疗资源与水平、社会保障制度与能力五个方面出发,建立未来深圳市医疗和养老资源合理配置的评价体系。首先对原始数据标准化,借助于Matlab软件编程对16个指标进行R-型聚类,根据聚类图可以分为7类,进而选取7个指标构建评价体系。然后通过分析深圳市近十几年的各项数据,采用熵权法确定医疗和养老资源评价体系的系数。通过TOPSIS法确定评价系统的正、负理想,从而计算评价系统与理想解之间的欧氏距离,进而确定人口数量与结构、经济收入与消费水平、医疗资源与水平、社会保障制度与能力以及综合能力的排序。最后利用多元线性回归模型对人均预期寿命进行预测,进而得到人均预期寿命的回归方程。
Abstract: In this paper, from the population and structure, economic income and consumption level, medical resources and level, social security system and ability of five aspects, we established the future rational allocation of medical and pension resources in Shenzhen evaluation system. Firstly, the original data were standardized, and the R-type clustering was carried out on the 16 indicators with the help of MATLAB software programming. According to the clustering diagram, the indicators could be divided into 7 categories. Then 7 indexes were selected to construct the evaluation system. Then, by analyzing the data of Shenzhen in recent ten years, the entropy weight method was adopted to determine the coefficient of the medical and pension resource evaluation system. The positive and negative ideals of the evaluation system were determined by TOPSIS method, so as to calculate the Euclidean distance between the evaluation system and the ideal solution, and then determine the order of population size and structure, economic income and consumption level, medical resources and level, social security system and ability and comprehensive ability. Finally, multiple linear regression model was used to predict the average life expectancy, and the regression equation of the average life expectancy was obtained.
文章引用:范卓然, 徐纪隆, 李宇宸. 基于熵权TOPSIS的深圳未来医疗和养老保障问题的评价及对策[J]. 应用数学进展, 2021, 10(2): 603-616. https://doi.org/10.12677/AAM.2021.102066

1. 引言

十九大报告提出中国特色社会主义进入新时代,我国社会主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分发展之间的矛盾。深圳是中国改革开放的前沿阵地,是中国经济建设和对外开放的“试验场”。借助于历史数据如何根据深圳的人口状况,经济地位,历史特点,社会环境,发展趋势,人民的期待来构建深圳市医疗和养老保障评价指标,根据评价的结果找出影响未来5年、10年和15年深圳市医疗和养老保障目标实现的主要因素,并进一步分析原因,找出实现目标的方案,合理配置深圳市城市资源,建设“民生幸福标杆”和“可持续发展先锋”城市。未来深圳如何利用好政策红利,建立可持续发展的医疗和养老保障体系,来实现建设国家“先行示范区”成为人们关注的热点之一 [1]。

2. 评价指标体系的建立

借助于健康中国2030年建设主要指标及参考国际上先进标准,根据中国国情和深圳市经济发展现状给出未来5年、10年和15年深圳医疗和养老保障需要实现的目标的量化描述。以国际、国内权威机构经典观点的高频指标为重点,结合文献梳理和调查研究进行指标的海选。根据可观测性原则将数据无法获得的海选指标删除,保证初步筛选后的指标体系可以量化。

本文采用了深圳市、广东省和国家有关政府部门发布的医疗、养老资源以及健康发展的定量数据,包括2000~2019年《中国卫生统计年鉴》、2000~2019年《中国卫生和计划生育统计年鉴》、2019年《中国卫生健康统计年鉴》、2000~2019年《深圳市统计年鉴》、2000~2019年《广东省卫生年鉴》数据,以及各年的卫生统计公报或者政府工作报告等 [2]。

为了量化描述深圳医疗和养老保障我们选取了每千人口床位数、每千人口卫生工作人员数、每千人口卫生技术人员数、每千人口医师数、城乡居民达到《国民体质测定标准》合格以上的人数比例、居民年末常住人口、基本养老保险人数、养老保险覆盖率、人均地区生产总值(人均GDP)、人均可支配收入、人均消费支出、恩格尔系数等16个指标 [3],建立深圳市未来5年、10年和15年合理配置医疗和养老资源评价指标体系,见表1

这些指标数量较大,且这种大系统的指标体系中的各指标之间往往存在着联系,若直接使用这些指标来分析其与医疗和养老保障之间的关系工作难度较大,下面采用聚类方法对指标进行R型聚类。

2.1. 原始数据的标准化处理

深圳市合理配置医疗和养老资源评价指标体系中有两类指标。一类是人均地区生产总值(人均GDP)等指标值越大表示医疗和养老资源合理配置越好的指标。另一类是居民恩格尔系数等指标值越小表示医疗和养老资源合理配置越好的指标。

Table 1. Rational allocation of medical and old-age resources evaluation index system

表1. 合理配置医疗和养老资源评价指标体系

为了消除量纲和指标正负向不同的影响。本文利用模糊隶属度方法对指标进行标准化。设 y i j 为第j个评价对象第i个指标标准化后的值; w i j 为第j个评价对象第i个指标值;n为被评价的对象数。则可通过正向指标标准化公式(1),负向指标标准化公式(2)对指标进行标准化。

y t j = w t j min 1 j n w t j max 1 j n w t j min 1 j n w t j (1)

y t j = max 1 j n w t j w t j max 1 j n w t j min 1 j n w t j (2)

下面用R-型聚类方法对指标进行分类,借助于Matlab软件编程 [4] [5],利用公式(1)和(2)标准化方法将前面收集到的16个数据作标准化处理,得到原始数据的标准化矩阵,见表2

Table 2. Standardization of raw data

表2. 原始数据的标准化

2.2. 医疗和养老资源合理配置评价指标的选取

对上述16个评价指标进行聚类分析,利用MATLAB软件编程将指标分类,分类情况如图1所示。

从聚类图可以看出深圳市医疗卫生事业费和人均医疗事业费两者有较强的相关性,都是涉及到医疗事业费的指标,最先聚为一类。深圳市每千人口卫生工作人员数、卫生技术人员数、医师数三者之间相关性较强,三者均涉及到医疗资源与水平的问题,聚为一类。每千人口床位数、养老保险覆盖率、人均DGP、基本养老保险人数、城镇居民可支配收入、居民人居消费支出和年末居民常住人口这7个指标相

Figure 1. Clustering pedigree of sixteen indexes

图1. 十六个指标的聚类谱系图

关性较强,都涉及到经济发展和养老保障问题,聚为一类也很正常。这样就从16个指标中选出7个指标对医疗和养老资源合理配置进行评价。这七个评价指标分别为:

x 14 每千人口医师数;

x 22 达到国民体质标准合格以上的人数比例;

x 31 人均GDP;

x 41 恩格尔系数;

x 43 非户籍人口;

x 51 医疗卫生事业费;

x 53 地方财政支出。

这七个指标的标准化数据,见表3

Table 3. Standardization of evaluation index data

表3. 评价指标数据的标准化

3. 医疗和养老资源合理配置的熵权TOPSIS评价方法

下面用熵权TOPSIS法对医疗和养老资源合理配置进行评价 [6] [7]。一是用熵权法确定医疗和养老资源评价体系的系数。二是通过TOPSIS法,即逼近理想解的技术,确定被评价对象的排序。TOPSIS法的核心思想是定义决策问题的理想解和负理想解,然后比较评价方案与理想解和负理想解的距离,最后计算各方案与理想解的相对贴近度,进行方案的优劣排序。

3.1. 利用熵权法求指标的客观权重

w i j 为第i个系统中的第j项指标的观测值;这里 i = 2009 , 2010 , , 2019 j = 1 , 2 , , 7 。对给定的指标j, w i j 的差异越大,该项指标对系统的比较作用就越大,亦即该指标包含和传输的信息越多。熵权法确定指标权重的具体步骤如下:

1) 计算深圳市每千人口医师数等7个指标的熵值。

e j 为第j个指标的熵值,求解过程如下

p i j = w i j i = 1 11 w i j e j = 1 l n n i = 1 11 p i j ln p i j (3)

其中 p i j 为第i个系统中的第j项指标的特征比重;这里 i = 1 2009 , i = 2 2010 , , i = 11 2019 j = 1 , 2 , , 7 i = 1 11 w i j 为第j项指标的所有系统观测数据之和。

2) 指标j的差异系数 g j 的计算:

g j = 1 e j (4)

3) 确定7项指标的权重系数:

s j = g j i = 1 7 g j (5)

按照上述步骤,采用表3中的数据,借助于Matlab编程 [8] [9],可求得特征比重 p i j 、熵值 e j 、差异系数 g j 和权重系数 s j 值,具体结果见表4

Table 4. Entropy value, difference coefficient and weight coefficient data

表4. 熵值、差异系数和权重系数数据

3.2. 标准化数据的加权

y i j 为第i年第j个指标标准化数据的加权值, w i j 为第i年中的第j项指标观测值规范化处理后的值, s j 为权重系数,根据加权方法可知:

y i j = w i j s j (6)

利用公式(6)以及表3中的数据可计算评价指标加权后的数据矩阵,见表5

Table 5. The weighted data matrix of evaluation indicators

表5. 评价指标加权后的数据矩阵

3.3. 确定评价系统的正、负理想

y j + 为第j个指标观测数据的最大值, y j 为第j个指标观测数据的最小值, j = 1 , 2 , , 7

y j + = max 2009 k 2019 y k j y j = min 2009 k 2019 y k j (7)

易知评价系统的正理想解为

y j + = ( y 1 + , y 2 + , , y 7 + ) = ( 0.1414 , 0.1472 , 0.1431 , 0.1426 , 0.1453 , 0.1385 , 0.1421 ) ;

负理想解为 y j = ( y 1 , y 2 , , y 7 ) = ( 0 , 0 , 0 , 0 , 0 , 0 , 0 )

3.4. 计算评价系统与理想解之间的欧式距离

d ( i , t ) + 为第i年第t个准则与相应分量正理想解的欧式距离, d ( i , t ) 为第i年第t个准则与相应分量负理想解的欧式距离, t = 1 , 2 , , 5 。例如准则层:社会保障制度与能力含有二级指标2个, x 51 医疗卫生事业费和 x 53 地方财政支出。则

d ( 2009 , 5 ) + = ( y 6 + y ( 2009 , 6 ) ) 2 + ( y 7 + y ( 2009 , 7 ) ) 2 (8)

d ( 2009 , 5 ) = ( y 6 y ( 2009 , 6 ) ) 2 + ( y 7 y ( 2009 , 7 ) ) 2 (9)

d i + 为第 年与正理想解的欧式距离, d i 为第i年指标与负理想解的欧式距离,则

d i + = ( y 1 + y i 1 ) 2 + ( y 2 + y i 2 ) 2 + + ( y 7 + y i 7 ) 2 ; (10)

d i = ( y 1 y i 1 ) 2 + ( y 2 y i 2 ) 2 + + ( y 7 y i 7 ) 2 . (11)

3.5. 计算相对贴近度评价结果

f i j 为第i年第t个准则下的指标与理想解的相对贴近度, f i 为第i年所有指标与理想解的相对贴近度,则

f i t = d ( i , t ) d ( i , t ) + d ( i , t ) + (12)

f i = d i d i + d i + (13)

其中 t = 1 , 2 , , 5 i = 2009 , 2010 , , 2019

通过计算贴近度来确定被评价指标的发展状况。相对贴近度 f i j 越大表示被评价指标与理想解越接近,发展状况越好。

利用表5中的数据以及公式(7)~(13),借助于Matlab软件编程计算相对贴进度 f i j f i ,具体数值见表6

Table 6. Evaluation results and rankings for each criterion layer from 2009 to 2019

表6. 2009~2019年间各准则层的评价结果和排名

4. 2009~2019年间医疗和养老资源合理配置的评价分析

以2009~2019年的年份为横坐标,以表6中6个评价准则和11年间医疗和养老资源综合评价的相对贴近度得分为纵坐标画图,借助于Matlab编程得出11年间深圳市医疗和养老资源情况图,见图2

图2可以看出,随着11年来深圳市经济的快速发展,深圳市的医疗资源水平、经济收入与消费水平、人口数量与结构、社会保障制度和能力以及各方面的综合能力基本上呈现出逐年递增趋势,这也表现出经济发展的确能带给老百姓物资方面实实在在的好处。从综合能力来看,2017年的状况好于2018年。主要原因是2018年深圳市居民健康水平有所下降,比2017年度下降了2.3个百分点。设置这个指标的主要目的,就是增强市民健身意识,引导市民科学健身,推动深圳全民健身运动发展。

但居民健康水平波动性较大,这说明了经济的高速发展,并没有给人民的生活带来满足感,人民生活水平的发展远远落后于经济发展的速度。恩格尔系数虽逐年下降,但仍高于29%,老百姓的民生问题,尤其是医疗问题还需要进一步的完善和改进。

Figure 2. Line chart of comprehensive evaluation of medical and pension resources from 2009 to 2019

图2. 2009~2019年间医疗和养老资源综合评价折线图

5. 利用多元线性回归模型对人均预期寿命进行预测

图2的分析可以看出,居民健康水平波动性较大,不稳定,而居民健康水平与 x 21 人均预期寿命、 x 22 达到国民体质标准合格以上的人数比例、 x 23 基本保险养老人数和 x 24 养老保险覆盖率相关,其中人均预期寿命是老百姓最为关心的指标。根据前面指标的相关性分析人均预期寿命主要受到人均医疗卫生事业费;每千人口医师数;每千人口床位数;达到国民体质标准合格以上的人数比例以及恩格尔系数有关。下面借助于未来5年、10年和15年深圳医疗和养老保障需要实现的目标量化指标数据以及2014~2019年间数据用多元线性回归分析方法来研究人均预期寿命与上面5个指标的联系。

5.1. 多元线性回归分析预测

为方便期间下面用 表示因变量人均预期寿命;用 y 1 表示自变量人均医疗卫生事业费(元); y 2 表示自变量每千人口医师数; y 3 表示自变量每千人口床位数; y 4 表示自变量达到国民体质标准合格以上的人数比例; y 5 表示自变量恩格尔系数。

基于表2中的数据,假设五个因素 y i ( i = 1 , 2 , , 5 ) 和人居预期寿命z值满足多元线性回归模型 [10] [11]。则采用多元线性回归分析的模型为:

z = β 0 + β 1 y 1 + β 2 y 2 + + β 5 y 5 + ε ε N ( 0 , σ 2 ) (14)

式中 β 0 , β 1 , , β 5 , σ 2 都是与 y i ( i = 1 , 2 , , 5 ) 无关的未知参数,这里 β 0 , β 1 , , β 5 称为回归系数。

借助于已有数据,通过灰色系统预测方法得到10组独立观测数据 ( z i , y i 1 , y i 2 , , y i 5 ) ,见表7

由(14)得

z i = β 0 + β 1 y i 1 + β 2 y i 2 + + β 5 y i 5 + ε i ε i ~ N ( 0 , δ 2 ) , ( i = 1 , 2 , , 10 ) (15)

Y = 1 1 y 11 y 21 y 15 y 25 1 y 101 y 105 , Z = z 1 z 2 z 10 (16)

ε = [ ε 1 ε 10 ] T , β = [ β 0 β 1 β 10 ] T

公式(15)用矩阵形式可以表示为:

Z = Y β + ε , ε i ~ N ( 0 , δ 2 E n ) , ( i = 1 , 2 , , 10 )

其中 E n n 阶单位矩阵。

Table 7. Next 5, 10 and 15 years and known relevant data

表7. 未来5年、10年和15年和已知相关数据

数据来源:深圳市卫生健康委网站、《深圳统计年鉴2019》、中国统计信息网。

5.2. 参数估计

模型(15)中的参数 β 0 , β 1 , , β 5 用最小二乘法估计,即应选取估计值 β ^ j ,使当 β j = β ^ j j = 1 , 2 , , 5 时,误差平方和

Q = i = 1 n ε i 2 = i = 1 10 ( z i β 0 β 1 y i 1 β 2 y i 2 β 5 y i 5 ) 2 (17)

达到最小。

Figure 3. Residual diagram of original data

图3. 原始数据残差图

Figure 4. Residual diagram after removing outliers

图4. 去掉异常点后的残差图

运用MATLAB软件运行程序,残差图3可以看出,除第一个和第六个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点。去除第六个点后再次运行程序,从残差图4可以看出,数据的残差离零点均较近,且残差的置信区间均包含零点,可以认为第六个数据为异常点。

Table 8. Parameter values of multiple regression coefficients

表8. 多元回归系数参数值

图4表8可以看出,残差图十分正常,该模型完全可用。

对应的回归方程为:

z = 161.0511 1.8413 y 2 2.8335 y 3 25.3407 y 4 142.4757 y 5 (18)

从公式(18)可以看出,指标恩格尔系数前的绝对值系数最大,可以看出人居预期寿命受恩格尔系数的影响最大。一般来说,在其他条件相同的情况下,恩格尔系数较高,作为家庭来说则表明收入较低,作为国家来说则表明该国较穷。反之,恩格尔系数较低,作为家庭来说则表明收入较高,作为国家来说则表明该国较富裕。因此加快经济发展,增加广大城镇居民收入水平,是降低恩格尔系数的最重要手段。影响人居预期寿命第二大的指标就是达到国民体质标准合格以上的人数比例。要想提高人均预期寿命还需要更好的加强体育锻炼,并且要长久坚持。

借助于原始数据表中恩格尔系数的数据,利用Matlab软件编程,以年份为自变量,对恩格尔系数进行拟合,拟合图如图5所示。

Figure 5. Fitting diagram of Engel’s coefficient

图5. 恩格尔系数拟合图

同时可得出残差为0.0146;相关系数0.9758;误差平方和SSE 0.0002135。

效果较好,可以用该函数进行预测。拟合得到的函数关系为:

y 5 = 0.0004 x 3 0.0079 x 2 + 0.0364 x + 0.3178 (19)

由公式(1)、公式(2)、公式(3)、公式(18)以及公式(19)可得联立方程组:

{ y 2 = 0.0002 x 3 0.0005 x 2 + 0.0629 x + 2.0152 y 3 = 0.0024 x 3 + 0.0416 x 2 0.0135 x + 2.0988 y 4 = 0.9025 + 0.003698 cos ( 0.6542 x ) + 0.00542 sin ( 0.6542 x ) + 0.0007838 cos ( 1.3084 x ) 0.004582 sin ( 1.3084 x ) 0.00251 cos ( 1.9626 x ) 0.01157 sin ( 1.9626 x ) y 5 = 0.0004 x 3 0.0079 x 2 + 0.0364 x + 0.3178 z = 161.0511 1.8413 y 2 2.8335 y 3 25.3407 y 4 142.4757 y 5 (20)

此方程组都是以“年份”作为自变量的, x = 1 对应2009年, x = 2 对应2010年,依此类推, x = 12 对应2020年, x = 17 对应2025年, x = 22 对应2030年。

方程组对x求导可得每个指标的年增长率。

{ d y 2 d x = 0.006 x 2 0.001 x + 0.0629 d y 3 d x = 0.0072 x 2 + 0.0832 x 0.0135 d y 4 d x = 0.0036 cos ( 0.6542 x ) 0.0024 sin ( 0.6542 x ) 0.006 cos ( 1.3084 x ) 0.001 sin ( 1.3084 x ) 0.023 cos ( 1.9626 x ) + 0.005 sin ( 1.9626 x ) d y 5 d x = 0.0012 x 2 0.0158 x + 0.0364 d z d x = 1.8413 d y 2 d x 2.8335 d y 3 d x 25.3407 d y 4 d x 142.4757 d y 5 d x

合并同类项后可得,

{ d y 4 d x = 0.0036 cos ( 0.6542 x ) 0.0024 sin ( 0.6542 x ) 0.006 cos ( 1.3084 x ) 0.001 sin ( 1.3084 x ) 0.023 cos ( 1.9626 x ) + 0.005 sin ( 1.9626 x ) d z d x = 0.1616 x 2 + 1.917 x 5.26367 25.3407 d y 4 d x

由上述方程组可知,要想求出表7中未来5年、10年和15年深圳医疗和养老保障需要实现的目标量化指标——人均预期寿命每年的增长率,只需要把相应的 值带进去即可。例如求人居预期寿命2023年的增长率,只需把 x = 15 (2023年对应的x为15)带入上述方程组即可。通过Mathematica软件计算函数值,可得人均预期寿命2023年的年增长率为0.0058。

6. 总结

为了对未来5年、10年和15年深圳医疗和养老保障需要实现目标进行量化描述,本文首先以国际、国内主流观点的高频指标为重点,结合深圳市经济发展的实际情况,选取了人均预期寿命、恩格尔系数、每千人口医师数等指标,构建深圳市医疗和养老资源合理配置的评价体系。然后通过分析深圳市近十几年的各项数据,借助于熵权TOPSIS法对医疗和养老资源合理配置评价得分进行排序,并对目标实现过程中遇到的困难给出合理的对策。通过分析可知深圳市建设“民生幸福标杆”和“可持续发展先锋”城市主要体现在两个方面:1) 大力发展经济,提高居民收入。2) 大力开展体育运动,加强体育锻炼,提高人均预期寿命。

熵权法是通过指标数据的变化大小确定指标权重的客观赋权方法。TOPSIS方法主要是通过定义决策问题的正理想解和负理想解,然后计算决策变量与正负理想解的距离,再进一步计算各方案与理想解的相对贴近度,进行方案的优劣排序。熵权TOPSIS方法在评价问题建模中会有广泛的应用。利用该方法也可以评价深圳各区市医疗和养老保障的合理配置问题。

参考文献

[1] 2020年“深圳杯”数学建模挑战赛A题——关于国家“先行示范区”建设中的医疗和养老保障问题[EB/OL]. http://www.m2ct.org/
[2] 中国统计信息网[EB/OL]. http://www.tjcn.org/
[3] 迟国泰, 曹婷婷, 张昆. 基于相关–主成分分析的人的全面发展评价指标体系构建[J]. 系统工程理论与实践, 2012, 32(1): 111-119.
[4] 卓金武. MATLAB在数学建模中的应用[M]. 北京: 北京航空航天大学出版社, 2010.
[5] 周建兴. MATLAB从入门到精通[M]. 北京: 人民邮电出版社, 2008.
[6] 杨惠敏, 付萍. 基于熵权的多级模糊综合评价的应用[J]. 华北电力大学学报, 2005, 32(5): 104-107.
[7] 李刚, 迟国泰, 程砚秋. 基于熵权TOPSIS的人的全面发展评价模型及实证[J]. 系统工程学报, 2011, 26(3): 400-407.
[8] 龚纯, 王正林. MATLAB语言常用算法程序集[M]. 北京: 电子工业出版社, 2010.
[9] 司守奎, 孙玺菁. 数学建模算法与应用[M]. 北京: 国防工业出版社, 2011.
[10] 汪应洛. 系统工程[M]. 北京: 机械工业出版社, 2008.
[11] 董大校. 基于MATLAB的多元非线性回归模型[J]. 云南师范大学学报, 2009, 29(2): 45-48.