因子分析法在我国居民美好生活水平综合评价中的应用

doi:10.12677/SA.2019.83059

期刊菜单

因子分析法在我国居民美好生活水平综合评价中的应用
Application of Factor Analysis Method in Comprehensive Evaluation of the Level of Chinese Residents’ Better Life

DOI: 10.12677/SA.2019.83059, PDF, HTML, XML,
作者: 罗四维^*：山东科技大学，山东青岛；韩玥^*：山东财经大学，山东济南
关键词: 美好生活；生活水平；因子分析； Good Life； Living Standard； Factor Analysis

摘要: 美好生活基于高质量的居民生活水平。人民日益增长的对美好生活的需要重点体现在良好教育、就业、医疗、社会保障、居住条件等基础方面。现在自《中国统计年鉴——2016》采集到了2016年我国31个省市、自治区的居民生活水平状况的指标及数据，共有十个指标，分别为：职工人均工资、人均用水量、人均电力消费量、人均铁路营业里程、人均内河航道里程、人均公路里程、人均受教育经费、卫生技术人员配比、人均森林面积和人均消费支出。基于采集到的数据，本文先将数据标准化以消除量纲的影响，再应用因子分析法以提取出综合指标，最终建立了居民综合生活水平评价指标，分别为：生活保障水平、道路基建水平和城市能源水平。分析结果后，本文针对提升我国居民生活水平提出了相应建议：政府部门可以着重提高人均职工工资、人均受教育经费和卫生技术人员配比来提高生活保障水平得分；着重提高人均公路里程和人均森林面积来提高道路基建水平得分；着重提高水资源电力资源供应来提高城市能源水平得分。

Abstract: The good life is based on a high quality of living standard for its residents. People’s growing need for a better life is mainly reflected in good education, employment, medical care, social security and living conditions, etc. With data collected by “China Statistical Yearbook—2016”, here we have ten indicators that represent residents’ living standard of 31 provinces and municipalities throughout our country; they are the average worker wage, per capita water consumption, per capita electricity consumption, per capita railway mileage, per capita inland waterway mileage, per capita highway mileage, per capita educational funds, medical technical personnel, per capita area of afforested land and per capita consumer spending. Based on the collected data, firstly we standardized them to eliminate the influence of the dimension, and then use factor analysis to extract the comprehensive indexes which reflect comprehensive evaluation of residents’ living standards, they are: life safeguard, road infrastructure and urban energy. Suggestions of improving residents’ living standard can be concluded after results analysis: the government departments could work on increasing average worker wage, per capita educational funds and medical technical personnel to improve the level of life safeguard; work on increasing per capita highway mileage and per capita area of afforested land to improve the level of road infrastructure; work on improving water and electricity supply to improve the level of urban energy.

文章引用：罗四维, 韩玥. 因子分析法在我国居民美好生活水平综合评价中的应用[J]. 统计学与应用, 2019, 8(3): 520-529. https://doi.org/10.12677/SA.2019.83059

1. 背景及问题

1.1. 居民美好生活水平概述

十九大报告明确提出，我国现阶段的主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。由于不断提升生活水平和个性解放是社会发展的核心内容，故研究机构对人民生活水平的维度逐渐由单一转向丰富。传统的发展观将“福利”等同于物质的富裕程度，从而只以GDP水平来衡量人民生活水平，并认为“经济增长率”是评价社会进步和生活水平提高的主要标准 [1] 。自70年代以来，人们对生活水平的研究重点逐渐转移到诸如贫困、收入分配、卫生与健康、教育、资源环境等问题上来，如阿特金森在1970年提出的着重考虑了收入不平等对人民生活水平的影响的“不平等指数”。十九大报告中的美好生活需要是一个多层面、多维度的结构体系，其中重点体现在良好教育、就业、医疗、社会保障、居住条件等与实际生活息息相关的基础方面，以下将以“美好生活水平”概括 [2] 。提高人民美好生活水平已成为现阶段各地政府重要工作目标，但是受到各地区生产力水平不均衡的影响，我国各地区居民生活水平表现不均衡。因此，对我国居民生活水平问题的研究不仅仅是社会经济发展的要求，也是我国全面建设小康社会、满足人民美好生活需要的要求。

1.2. 研究问题

目前根据文献资料获取了反应我国2016年31个省、自治区、直辖市的居民生活水平状况的指标及数据。利用因子分析法，建立了居民美好生活水平评价模型，对我国居民美好生活水平状况进行评价分析，并为我国提升居民生活水平质量提出了建议。

2. 居民美好生活水平综合评价模型

2.1. 指标的选取

影响居民生活水平的指标种类繁多，若将所有指标考虑在内则会导致维数灾难，故在选取建立居民美好生活水平综合评价模型的指标时，应兼顾科学性和可操作性，选取少而兼顾面较广的指标进行分析。本文从人口、消费、交通、环境、医疗五个方面选取了与居民美好生活密切相关的11个指标，见表1。

Table 1. Evaluation index of residents’ better living standard

表1. 居民美好生活水平评价指标

2.2. 数据来源与处理

本文选取的指标与数据来自2016年《中国统计年鉴》。因各指标的单位以及量纲不统一，故先将非人均指标除以31个省、自治区、直辖市的人口数，得到人均指标，再对所有指标数据利用Z-score标准化方法进行标准化处理以消除量纲不同对因子分析的影响。

Z-score标准化公式：

$z = \frac{(x - μ)}{s}$

其中， $μ = \frac{1}{n} \sum_{i = 1}^{n} x_{i}$ ， $s = \sqrt{\frac{1}{n - 1} \sum_{i = 1}^{n} {(x_{i} - μ)}^{2}}$ ，z为数据标准化后的值。

对指标进行标准化步骤：

1) 求出各指标的数学期望，记为 $μ_{1}, μ_{2}, \dots, μ_{11}$ ；

2) 求出各指标的标准差，记为 $s_{1}, s_{2}, \dots, s_{11}$ ；

3) 利用Z-score标准化公式对数据进行标准化处理。

3. 因子分析方法简述

因子分析是多元统计分析中的一种重要方法，该方法将多个实际测得的变量转换为少数几个互不相关的综合指标，其主要特点在于能够探索不易观测或不能观察到的潜在因素，转换后的综合指标为原变量的线性组合 [3] 。

因子分析的步骤如下：

1) 变量相关性分析。因子分析是找寻变量间的内部相关性及潜在的共同因素，因此需要各变量间存在一定的相关性，若各个变量间相互独立则无法对变量提取公因子。

2) 建立因子载荷矩阵，提取公因子。因子载荷矩阵 $A_{i j}$ 的统计意义为第i个变量与第j个公因子的相关系数，反映了第i个变量在第j个公因子上的相对重要性。

3) 给出公共因子的合理解释及命名。

4) 若有必要(一时难以找到合理解释的公共因子)，则进一步做因子旋转。

4. 人民美好生活基础水平评价

4.1. 数据预处理

求出人均指标，并将 $x_{1}, x_{2}, \dots, x_{p}$ 标准化，得到标准化指标向量x^*，此步骤在R语言编程环境完成。

各人均指标计算公式如下：

1) 人均电力消费量 = 地区电力消费量 * 10000/人口数；

2) 人均铁路营业里程 = 铁路营业里程 * 1000/(人口数 * 10,000)；

3) 人均内河航道里程 = 内河航道里程 * 1000/(人口数 * 10,000)；

4) 人均公路里程 = 公路里程 * 1000/(人口数 * 10,000)；

5) 人均受益教育经费 = 教育经费/人口数；

6) 人均森林面积 = (森林用地面积/人口数) * 10,000。

4.2. 因子分析适应性检测

首先考察收集到的原有变量之间是否存在一定的线性关系，是否适合进行因子分析。这里，借助变量的相关系数矩阵、巴特利特球度检验和KMO (Kaiser-Meyer-Olkin)检验方法进行分析。

表2是原有变量的相关系数矩阵，可以看到职工人均工资与人均收益教育经费、卫生技术人员配比和人均消费支出有较强的相关性；人均电力消费量与人均铁路营业里程有较强相关性；人均公路里程与人均铁路营业里程和人均森林面积有较强相关性，能够从中提取出因子进行因子分析。

Table 2. Correlation coefficient moments of original variables

表2. 原有变量的相关系数矩阵

由表3可知，巴特利特球度检验的统计量的观测值是265.153相应的P-值接近0。如果显著性水平α为0.05，由于概率P-值小于显著性水平α，则应拒绝原假设，认为相关系数矩阵与单位阵有显著性差异，同时，由于KMO的值为0.638，根据Kaiser给出的KMO度量标准可知原有变量适合进行因子分析。

Table 3. Bartlett sphericity test and KMO test

表3. 巴特利特球度检验和KMO检验

4.3. 建立因子载荷阵，提取公因子

由表4可知，如果对原有10个变量采用主成分分析法提取10个因子，那么原有变量的所有方差都可以被解释，变量的共同度都为1。事实上，因子个数少于原有变量的个数才是最终要达到的目标，所以不可以全部提取。第二列数据是在按指定提取条件提取因子时的变量共同度。可以看到，除人均用水量和人均内河航道里程的部分信息不能得到很好解释外，其他的八个变量的绝大部分信息(大于70%)可被因子解释，这些变量的信息丢失较少。因此，因子提取的效果较为理想。

Table 4. Variable commonality of factor analysis

表4. 因子分析中的变量共同度

表5中，第一列是因子编号，以后三列成一组，每组中数据项的含义依次是特征值(方差贡献)、方差贡献率和累计方差贡献率。第一组数据项描述了因子分析初始解的情况，可以看到第一个因子的方差为3.213，解释原有10个变量的32.135%，累计32.135%；第二个因子的方差贡献为2.951，累计方差贡献率为61.644%，第三个因子的方差为1.575，累计方差贡献率为77.398%。故提取3个因子效果较好。从第二组数据项可以看出建议提取前三个因子进行分析。从第三组数据项描述了最终因子解的情况。可见，因子旋转后，总的累计方差贡献率没有改变，也就是没有影响原有变量的共同度，但却重新分配了各个因子解释原有变量的方差，改变了各因子的方差贡献，使因子更易于解释。

Table 5. Factors explain the total variance of the original variables

表5. 因子解释原有变量总方差的情况

绘制因子分析碎石图，选择因子：

在图1中，横坐标为因子编号，纵坐标为特征值。可以看到：第一个因子的特征值(方差贡献)很高，对解释原有变量的贡献最大；第四个及以后的因子特征值都较小，对解释原有变量的贡献很小，已经成为可忽略的“高山脚下的碎石”，因此提取三个因子是合适的。

Figure 1. Gravel plot of factor analysis

图1. 因子分析的碎石图

计算因子载荷矩阵：

表6显示了因子载荷矩阵，是因子分析的核心计算结果。根据该表可以写出本应用的案例的因子分析模型：

Table 6. Factor loading matrix

表6. 因子载荷矩阵

^a3 components extracted.

$人均公路里程 = 0.906 f_{1} - 0.279 f_{2} - 0.235 f_{3}$

$人均森林面积 = 0.893 f_{1} - 0.162 f_{2} - 0.360 f_{3}$

$人均铁路营业里程 = 0.719 f_{1} - 0.245 f_{2} + 0.465 f_{3}$

$人均收益教育经费 = 0.676 f_{1} + 0.661 f_{2} - 0.260 f_{3}$

$人均用水量 = 0.511 f_{1} - 0.141 f_{2} + 0.499 f_{3}$

$人均内河航道里程 = - 0.302 f_{1} - 0.050 f_{2} + 0.49 f_{3}$

$人均消费支出 = - 0.183 f_{1} + 0.933 f_{2} + 0.038 f_{3}$

$职工人均工资 = 0.352 f_{1} + 0.852 f_{2} - 0.319 f_{3}$

$卫生技术人员配比 = - 0.044 f_{1} + 0.812 f_{2} + 0.311 f_{3}$

$人均电力消费量 = 0.331 f_{1} + 0.269 f_{2} + 0.810 f_{3}$

由表6可知，10个变量在第一个因子上有5个解释性很高，意味着这五个变量与第一个因子的相关程度很高；4个因子在第二个变量上有较高的解释性；1个变量在第三个因子上有较高的解释性。可见三个因子对原有变量的解释作用不显著。另外可以看到，这三个因子的实际含义比较模糊。

4.4. 因子命名及解释

采用方差极大法对因子载荷矩阵实行正交旋转以使因子具有命名解释性，结果如表7所示，人均消费支出、职工人均工资、卫生技术人员配比在第一个因子上有较高解释性，均为正相关；人均森林面积、人均公路里程、人均内河航道里程在第二个因子上有较高的解释性，人均森林面积、人均公路里程为正相关，人均内河航道里程为负相关；人均电力消费量、人均铁路营业里程和人均用水量在第三个因子上有较高的解释性，均为正相关。所以可以将第一个因子命名为生活保障水平，第二个因子命名为道路基建水平，第三个因子命名为城市能源水平。

Table 7. Factor load matrix after rotation

表7. 旋转后的因子载荷矩阵

^aRotation converged in 5 iterations.

故旋转后的因子分析模型为：

$人均消费支出 = 0.920 f_{1} - 0.227 f_{2} - 0.088 f_{3}$

$职工人均工资 = 0.868 f_{1} + 0.416 f_{2} - 0.161 f_{3}$

$卫生技术人员配比 = 0.812 f_{1} - 0.220 f_{2} + 0.223 f_{3}$

$人均收益教育经费 = 0.699 f_{1} + 0.687 f_{2} + 0.046 f_{3}$

$人均森林面积 = - 0.110 f_{1} + 0.966 f_{2} + 0.089 f_{3}$

$人均公路里程 = - 0.225 f_{1} + 0.926 f_{2} + 0.212 f_{3}$

$人均内河航道里程 = - 0.068 f_{1} - 0.289 f_{2} - 0.090 f_{3}$

$人均电力消费量 = 0.302 f_{1} - 0.086 f_{2} + 0.860 f_{3}$

$人均铁路营业里程 = - 0.192 f_{1} + 0.442 f_{2} + 0.749 f_{3}$

$人均用水量 = - 0.100 f_{1} + 0.236 f_{2} + 0.681 f_{3}$

观察图2旋转后的因子载荷图，各个变量均在三个因子上有了较好的解释性。最后计算因子得分，表8为因子得分系数矩阵。

Figure 2. Factor load diagram after rotation

图2. 旋转后的因子载荷图

Table 8. Factor scoring coefficient matrix

表8. 因子得分系数矩阵

根据因子得分系数矩阵，得出三个因子的表达式：

$\begin{matrix} F 1 = 0.292 * Z 1 - 0.033 * Z 2 + 0.105 * Z 3 - 0.064 * Z 4 - 0.022 * Z 5 \\ - 0.079 * Z 6 + 0.234 * Z 7 + 0.277 * Z 8 - 0.040 * Z 9 + 0.312 * Z 10 \end{matrix}$

$\begin{matrix} F 2 = 0.175 * Z 1 - 0.146 * Z 3 + 0.070 * Z 4 - 0.097 * Z 5 + 0.323 * Z 6 \\ + 0.251 * Z 7 - 0.115 * Z 8 + 0.354 * Z 9 - 0.078 * Z 10 \end{matrix}$

$\begin{matrix} F 3 = - 0.143 * Z 1 + 0.356 * Z 2 + 0.501 * Z 3 + 0.367 * Z 4 - 0.014 * Z 5 \\ - 0.002 * Z 6 - 0.061 * Z 7 + 0.158 * Z 8 - 0.076 * Z 9 - 0.017 * Z 10 \end{matrix}$

注：F1，F2，F3分别为生活保障水平因子、道路基建水平因子和城市能源水平因子。Z1~Z10分别为：职工人均工资、人均用水量、人均电力消费量、人均铁路营业里程、人均内河航道里程、人均公路里程、人均受教育经费、卫生技术人员配比、人均森林面积和人均消费支出。

4.5. 结果分析

本文根据文献资料获取了反映我国31个省、自治区、直辖市的居民生活水平状况的指标及数据，运用了因子分析法提取出了三个因子，并对因子进行旋转，使因子在各个分量上有更好的解释性，得到的三个因子分别为生活保障水平因子、道路基建水平因子和城市能源水平因子。计算了因子得分系数矩阵，从而得到最终评价模型。三个因子基于十个变量反映了人民生活水平，由于篇幅原因，因子表达式不再列出。根据因子综合得分，可得到以下结论：

1) 人均职工工资、人均受教育经费和卫生技术人员配比的提高最能够提高生活保障水平得分。工资是一般家庭的主要经济来源，也是影响人民幸福感的最重要因素。2016年我国人均收入在全球排名72位，仍有较高的提升空间。教育与医疗能够分别提升人民的知识水平和健康水平，但我国在教育以及卫生方面的财政支出与其他发达国家相比仍有差距。工资、教育和卫生三项自始至终都是改善民生的重点工作，在以后的中仍需着力发展，攻坚克难。

2) 人均公路里程和人均森林面积对道路基建水平得分最重要。我国公路交通的总量较高，但因幅员辽阔所以密度、人均水平较低，基建投资的空间仍然很大。森林面积与人民生活环境息息相关，2018年我国森林覆盖率达到21.66%，成为同期全球森林资源增长最多的国家，与非洲、拉丁美洲急剧减少的森林面积形成鲜明对比，需要继续保持。

3) 水资源、电力资源供应是城市能源水平的最显著体现。水、电是人民生活的根本，这两大资源在城市能源水平中起到的作用占到了85%以上。目前，有关水资源开发、循环与利用，清洁能源发电等研究均位列国家重点研究课题，足以见这两大资源对于国家发展与人民幸福的重要性。

今年是2020年全面建成小康社会的决胜期。现阶段社会的主要矛盾仍然存在并将在一定时期内持续存在，与人民切身利益相关的生活水平也将继续影响人们对美好生活的评判。保持经济社会稳定发展的同时，继续保持以人民的利益为出发点，抓住工作重点进一步攻坚克难，才能真正做到提高人民生活水平，满足对美好生活的需要。

参考文献

[1]	彭念一, 李丽. 我国居民生活水平评价指标与综合评价研究[J]. 湖南大学学报, 2003, 17(5): 21-25.
[2]	何蜜月. 我国居民主观幸福感及其影响因素研究[D]. 贵阳: 贵州民族大学, 2018.
[3]	朱建平. 应用多元统计分析[M]. 北京: 科学出版社, 2016

为你推荐

友情链接