1. 引言
我国自改革开放之后,工业化与城镇化迅速发展。工业化与城镇化是国家现代化的重要组成部分。准确分析我国工业化与城镇化指向的关系对我国的现代化进程至关重要。城镇化与工业化是联系密切的,高城镇化与低工业化是不适合长久发展的,工业化的发展也依赖于城镇化的发展。本文选取了1999年至2015年的数据,对人均GDP与二三产业增加值比重、人口城镇化率等变量之间的相互关系作典型相关分析,通过提取综合变量的方式,并且测算综合变量相关关系的大小来表示两组指标之间的相关性强弱。
2. 典型相关分析理论介绍
典型相关分析是为了研究两组变量之间的相关性,反映两组变量之间的相互线性依赖关系的一种统计方法。一般的,为了便于研究两组变量
和
之间的相关关系,通常找出第一组变量的某个线性组合
和第二组变量的某个线性组合
,把研究两组变量之间相关的问题转化为研究两个典型变量U与V之间的相关问题,希望使U与V的相关达到最大 [1] 。我们把基于这种原则的分析方法称为典型相关分析。
3. 我国工业化与城镇化关系的典型相关实证分析
3.1. 研究变量的确定
3.1.1. 工业化指标
本文选取以下6个指标来反映工业化水平和程度,原始数据见表1。
1) 人均GDP (X1)。人均GDP可以用来表示一个国家或地区的经济发展水平,也可以用于评价其工业化发展阶段的重要指标。
2) 二三产业增加值比重(X2)。二三产业增加值比重又叫产业非农化率或广义工业化率,是指第二和第三产业增加值占GDP的比率。在工业化进程中,农业增加值的绝对值会变大,但在GDP中所占的比重会逐步缩减,与此对应的是第二产业和第三产业增加值所占比率会逐步提高。因此二三产业增加值比重是度量工业化程度高低的核心指标 [2] 。
3) 第三产业增加值比重(X3)。即第三产业增加值在GDP中所占的比率。
4) 人均用电量(X4)。
5) 综合能耗GDP产出系数(X5)。综合能耗GDP产出系数是一定时期内的GDP与综合能源消费量的比值,即单位综合能耗创造的GDP,其倒数则为单位GDP的综合能耗。该指标可反映单位综合能耗的GDP产出水平的高低,综合能耗的GDP产出系数越高,能在一定程度上说明工业化的质量越高 [3] 。
6) 恩格尔系数(X6)。恩格尔系数越大,工业化程度越低。
3.1.2. 城镇化指标
为了反映城镇化水平和程度,本文也选取的6个指标分别为,原始数据见表2。
1) 人口城镇化率(Y1)。人口城镇化率表示城镇人口占总人口的比率,该指标是反映一个国家或地区的农村人口在空间上转换为城镇人口比率高低的重要指标,是度量城镇化程度高低的核心指标 [4] 。
2) 就业非农化率(Y2)。就业非农化率是指第二产业以及第三产业的就业人数占总就业人数的比率。一般而言,随着城镇化程度的逐步提高,就业非农化率亦具有逐步提高的趋势。
3) 人均城市道路面积(Y3)。人均城市道路面积指的是城市中每一居民平均占有的道路面积。
4) 人均公园绿地面积(Y4)。人均公园绿地面积能过很好的反映城市的整体环境以及居民生活质量的好坏。
![](Images/Table_Tmp.jpg)
Table 1. Raw data of various indicators of industrialization
表1. 工业化各指标原始数据
数据来源:来自1995~2016年《国家统计年鉴》。
![](Images/Table_Tmp.jpg)
Table 2. Raw data of various indicators of urbanization
表2. 城镇化各指标原始数据
数据来源:来自1995~2016年《国家统计年鉴》。
5) 每万人拥有公共交通车辆(Y5)。每万人公共交通车辆是指每万人平均拥有公共交通车辆标台数,用于表示城市公共交通发展水平以及交通结构状况 [5] 。
6) 每万人汽车拥有量(Y6)。
3.2. 各变量之间的关系分析
3.2.1. 组内相关分析
由表3和表4可知,反映工业化和城镇化的指标和组内的指标都为中高度的相关关系,可见选取的工业化和城镇化的指标合适。由表5可知,我国工业化和城镇化的两组变量的相关程度较高,因此构建综合指标表示它们之间的相关性是切实可行的。也就是说,对于这两组变量,运用典型相关分析是具有科学性的。
3.2.2. 组间相关性检验
通过SAS软件分析两组变量之间相关性,如表6所示:
检验两组变量之间是否存在相关性 [6] 。
从表6检验结果可以看出,上表中的四种检验方法的结果都显示为拒绝原假设,即认为
,两组变量之间存在相关性。
![](Images/Table_Tmp.jpg)
Table 3. Industrialization internal index correlation coefficient matrix
表3. 工业化内部指标相关系数矩阵
![](Images/Table_Tmp.jpg)
Table 4. Urbanization internal indicator correlation coefficient matrix
表4. 城镇化内部指标相关系数矩阵
![](Images/Table_Tmp.jpg)
Table 5. Matrix of correlation coefficient between industrialization and urbanization groups
表5. 工业化和城镇化组间指标相关系数矩阵
![](Images/Table_Tmp.jpg)
Table 6. Correlation test between industrialization and urbanization variables
表6. 工业化与城镇化变量相关性检验
再计算出我国工业化和城镇化指标的前三对典型相关变量系数呈高度相关关系,相关系数分别为0.999931、0.990550和0.973883。如表7所示。
为了判断我国工业化与城镇化这两组指标的典型变量相关性是否显著,于是对所有典型相关变量的系数进行显著性检验。如表8所示。
检验第一对典型相关变量是否有相关关系。
检验第二对典型相关变量是否有相关关系。
检验第三对典型相关变量是否有相关关系。
由检验结果可知在0.01的显著性水平下前三对典型相关变量系数都是显著的,所以我国工业化与城镇化两组相关性的研究可以用研究3对典型变量相关性来代表。
3.3. 对典型相关变量做出解释
为了消除变量的单位和量纲的不同,利用标准后的典型相关系数进行分析。
我们综合典型相关分析中我国工业化指标的标准化典型相关系数和城镇化指标的标准化典型相关系数以及典型结构中工业化指标和他们的典型变量之间的相关系数和城镇化指标和他们的典型变量之间的相关系数这几个表来给两对典型相关变量命名。如表9~12所示。
综合工业化指标标准化典型相关系数表和典型结构分析中的工业化指标和他们的典型变量表来看,人均GDP (X1)和人均用电量(X4)、综合能耗GDP产出系数(X6)与第一典型变量的标准化典型相关系数最高,第二典型变量与二三产业增加值比重(X2)、第三产业增加值比重(X3)和恩格尔系数(X6)标准化典型相
![](Images/Table_Tmp.jpg)
Table 7. Typical correlation variable coefficients of industrialization and urbanization
表7. 工业化与城镇化的典型相关变量系数
![](Images/Table_Tmp.jpg)
Table 8. Typical correlation variable coefficient test of industrialization and urbanization
表8. 工业化与城镇化的典型相关变量系数检验
![](Images/Table_Tmp.jpg)
Table 9. Typical correlation coefficient of industrialization index standardization
表9. 工业化指标标准化典型相关系数
![](Images/Table_Tmp.jpg)
Table 10. Typical correlation coefficient of urbanization index standardization
表10. 城镇化指标标准化典型相关系数
![](Images/Table_Tmp.jpg)
Table 11. Correlation coefficients between industrialization indicators and their typical variables
表11. 工业化指标和他们的典型变量之间的相关系数
![](Images/Table_Tmp.jpg)
Table 12. Correlation coefficients between urbanization indicators and their typical variables
表12. 城镇化指标和他们的典型变量之间的相关系数
关系数较高。所以,U1命名为工业化质量,U2命名为工业化结构水平,U3命名为其余不能被解释的部分。
综合城镇化指标标准化典型相关系数表和典型结构分析中的城镇化指标和他们的典型变量表来看,人口城镇化率(Y1)和就业非农化率(Y2)、每万人汽车拥有量(Y6)与第一典型变量的标准化典型相关系数最高,第二典型变量与每万人拥有公共交通车辆(Y5)、人均城市道路面积(Y3)和人均公园绿地面积(Y4)标准化典型相关系数较高。。而典型结构分析中的城镇化指标和他们的典型变量之间的相关系数也验证了这一相关关系。所以,V1命名为城镇化率,V2命名为城市发展水平,V3命名为其余不能被解释的部分。
用表13和表14来验证上述三对典型相关变量的命名是否正确。
城镇化指标的第一对典型相关变量V1与工业化指标中的人均GDP (X1)和人均用电量(X4)、综合能耗GDP产出系数(X6)相关系数最高,而城镇化指标的第二对典型相关变量V2与工业化指标中的二三产业增加值比重(X2)、第三产业增加值比重(X3)和恩格尔系数(X6)相关性最高。
工业化指标的第一对典型相关变量U1与城镇化指标中的人口城镇化率(Y1)和就业非农化率(Y2)、每万人汽车拥有量(Y6)相关系数最高,而工业化指标的第二对典型相关变量U2与万人拥有公共交通车辆(Y5)、人均城市道路面积(Y3)和人均公园绿地面积(Y4)相关性最高。
说明我们在对典型相关变量的命名是正确的。命名结果如下:
U1命名为工业化质量,U2命名为工业化结构水平,U3命名为其余不能被解释的部分。
V1命名为城镇化率,V2命名为城市发展水平,V3命名为其余不能被解释的部分。
3.4. 典型冗余分析
我们选择用标准后的工业化指标被自身典型变量以及对应典型变量解释的标准方差和城镇化指标被自身典型变量以及对应典型变量解释的标准方差来进行分析 [6] 。由表15、表16可知,两组变量的前三组典型变量被自身所解释的累计贡献率分别达到了98.60%和98.87%,而被对方典型变量所解释的累计贡献率分别达到了98.28%和98.73%,说明我国工业化和城镇化不仅能被自身的典型变量解释,而且能够被其对应的典型变量解释。
表17和表18表示原始两组指标中的每一项被对应组前M个典型变量的解释程度。分析得出我国工
![](Images/Table_Tmp.jpg)
Table 13. Correlation coefficient between typical variables of industrialization indicators and urbanization indicators
表13. 工业化指标和城市化指标的典型变量之间的相关系数
![](Images/Table_Tmp.jpg)
Table 14. Correlation coefficient between typical variables of urbanization indicators and industrialization indicators
表14. 城市化指标和工业化指标的典型变量之间的相关系数
![](Images/Table_Tmp.jpg)
Table 15. Standard deviation of industrialization indicators interpreted by their typical variables and corresponding typical variables
表15. 工业化指标被自身典型变量和对应典型变量解释的标准方差
![](Images/Table_Tmp.jpg)
Table 16. Standard deviation of urbanization indicators interpreted by their typical variables and corresponding typical variables
表16. 城市化指标被自身典型变量和对应典型变量解释的标准方差
![](Images/Table_Tmp.jpg)
Table 17. Multiple correlation squared between the top M typical variables of industrialization indicators and urbanization indicators
表17. 工业化指标和城镇化指标的前M个典型变量间的多重相关平方
![](Images/Table_Tmp.jpg)
Table 18. Multiple correlation squared between the top M typical variables of urbanization indicators and industrialization indicators
表18. 城镇化指标和工业化指标的前M个典型变量间的多重相关平方
业化和城镇化指标中的每个变量被对应组前3个典型变量解释的程度均在90%以上,说明我国工业化和城镇化被其对应组的典型变量解释的程度非常高。
4. 结论
本文选取了1999年至2015年的数据,分别对工业化和城镇化选取了六个指标,对两组变量之间的相互关系作典型相关分析,在两组变量中提取综合变量并计算综合变量的相关关系代表两组指标之间的相关性。得出如下结论:
1) 我国城镇化与工业化之间存在着显著的相关关系。工业化和城镇化之间是相互促进、互相交叉以及共同发展的。
2) 我国城镇化率与工业化质量之间存在密切关系,并且提高综合能耗GDP产出系数有助于人口城镇化率和就业城镇化率的提高。
3) 我国二三产业增加值比重以及第三产业增加值比重与城市发展水平存在一定相关关系。第二三产业增加值比重上升有助于人均城市道路面积、人均公园绿地面积、每万人拥有公共交通车辆数量的增加,提高我国的城市发展水平以及居民生活质量。
4) 由于城镇化与工业化高度相关,故协同发展工业化与城镇化对我国现代化进程的稳健具有重大意义,发展工业化的同时兼顾城镇化的提高。