基于相关性–主成分分析的国际陆港竞争力评价体系的构建
Construction of an International Dry Port Competitiveness Evaluation System Based on Correlation and Principal Component
DOI: 10.12677/mse.2024.133058, PDF, HTML, XML, 下载: 57  浏览: 136  科研立项经费支持
作者: 龙凌曦:吉首大学数学与统计学院,湖南 吉首;舒晓惠, 李洋阔:怀化学院商学院,湖南 怀化
关键词: 相关性主成分分析国际陆港指标评价体系Correlation Principal Component Analysis International Dry Port Indicator Evaluation System
摘要: 本文从反映国际陆港竞争力的内涵出发,在企业竞争力和陆港管理部门的出现高频指标的基础上,结合相关的文献,从陆港内部基础设施,物流发展水平,商贸发展水平及外部的区域经济发展水平一起四个方面海选了评价国际陆港竞争力的相应指标。根据可观测性的原则初步筛选指标,通过相关性和主成分分析相结合的方法定量筛选指标,构建出国际陆港竞争力的评价体系。
Abstract: This paper starts from the connotation of international dry port competitiveness, and based on high-frequency indicators in corporate competitiveness and dry port management, combined with relevant literature, it selects corresponding indicators to evaluate the competitiveness of international dry ports from four aspects: internal infrastructure of the dry port, level of logistics development, level of commercial and trade development, and the external level of regional economic development. The indicators are initially screened based on the principle of observability, and then quantitatively selected through a combination of correlation and principal component analysis, thus constructing an evaluation system for the competitiveness of international dry ports.
文章引用:龙凌曦, 舒晓惠, 李洋阔. 基于相关性–主成分分析的国际陆港竞争力评价体系的构建[J]. 管理科学与工程, 2024, 13(3): 554-567. https://doi.org/10.12677/mse.2024.133058

1. 引言

国际陆港是指在内部地区建立的类似于沿海地区的港口,它承担着“一带一路”和“西部陆海新通道”等重大国家战略的任务,故如何科学地评价其竞争力显得至关重要,而建立一套相应的指标体系是国际陆港竞争力评价的关键。如果指标体系不合理,则无论采用什么评价方法,评价结果都无任何意义。

目前国际陆港竞争力评价体系研究的现状如下:由于国际陆港是近些年来的新型事物,相关的研究非常少。在知网总库主题中搜索“国际陆港竞争力”仅显示67篇。整理相关文献得出以下国际陆港评价指标体系:Siyuan Tang et al. (2020) [1] 从文献资料中选取基础设施、生产能力和发展环境三个方面构建了内河港口竞争力评价模型和指标体系;陈菊红(2011) [2] 通过文献搜集和专家询问从基础设施建设水平、服务提供能力、品牌构建水平、产业集聚水平、辐射带动水平、地区经济发展水平和政府政策六个方面构建国际陆港竞争力评价体系;姜健乐(2023) [3] 通过问卷调查从基础设施设备水平、经营水平、主要运行平台状况、腹地经济发展水平、交通基础设施,陆港发展潜力六个方面构建国际陆港竞争力评价体系;蒋明羽(2020) [4] 通过相关数据结合专家打分从内部条件、外部条件、经营水平和软实力四个方面构建陆港综合评价体系;闫茹(2021) [5] 通过专家询问从基础物流,纵向一体化,横向一体化构建西安国际陆港综合竞争力体系;贺博雅(2018) [6] 从陆港内部基础设施发展水平、物流业发展水平、交通环境发展水平及政策环境发展水平四个方面构建了国际陆港竞争力评价指标体系;魏晓雪(2016) [7] 通过文献资料构建了内陆设备服务条件在内的7个一级指标并选取了17个二级指标构建内陆港评价综合体系;车文(2015) [8] 从物流业务角度、基础建设角度、区域经济角度、顾客角度、社会发展角度五个方面,用平衡积分卡建立国际陆港物流评价指标体系。针对以上的评价指标体系,有以下问题存在着:一是指标体系庞杂,有些同一信息由多个指标反映,二是根据专家筛选法,单纯依靠指标的含义和个人经验,主观性过强。

2. 指标体系的构建原理

针对以上问题,本文根据企业竞争力的内涵和陆港管理部门的规章,结合学术文献对国际陆港竞争力的有关指标先进行海选。先通过可观测性的原则进行筛选,再通过相关性–主成分分析进行定量筛选。

2.1. 海选思路

1) 准则层的设置:通过设置国际陆港内部基础设施发展水平Y1、国际陆港物流发展水平Y2和国际陆港商贸发展水平Y3来反应国际陆港内部的竞争力;通过设置区域经济发展水平Y4来反应国际陆港所在区域的外部竞争力。

2) 指标层的选取:通过选取投资金额,保税物流中心(B型)个数等15个指标来反应Y1;通过选取全市邮政业务收入,固定资产投资额等16个指标拉锯反应Y2;通过选取自贸区的面积等12个指标来反应Y3;通过选取市辖区地区生产总值等13个指标来反应Y4。即通过海选56个指标来反应国际陆港竞争力。

2.2. 根据可观测性的原则进行删除

1) 样本数据的删除:本文样本数据为中国2021年182个国际陆港的相应数据。2021年中国有204个国际陆港 [9] ,在此删除了地方州,盟所对应的15个国际陆港,保留地级市所对应的189个国际陆港,在此基础上进一步删除了缺少投资金额数据的7个国际陆港,由此形成182个国际陆港数据。

2) 指标的删除:对于一些不可获取的数据的指标或定性指标进行删除。

2.3. 相关性–主成分分析进行筛选

1) 相关性的筛选:删除同一准则层内相关系数较大的指标,保证筛选后的指标反映信息不重复。

2) 主成分分析的筛选:删除同一准则层内因子载荷较小的指标,保证筛选后的指标对评价结果有显著性影响。

基于相关性–主成分分析的国际陆港竞争力评价体系的构建的原理如图1所示。

Figure 1. Process flowchart for constructing the international dry port competitiveness indicator system

图1. 国际陆港竞争力指标体系构建的流程图

3. 研究方法

3.1. 指标数据的标准化

针对已经海选完的指标,对每个指标做标准化处理。本文选取max-min标准化处理方式,以消除量纲对评价结果的影响,使各个指标之间具有统一的标准。

1) 正向指标的标准化

正向指标是数值越大反映评价结果越好的指标。设 u i j 表示第i个评价对象下的第j项指标标准化后的值, x i j 表示为第i个评价对象下的第j项指标的观测值;n为评价对象的数量,m为评价指标的数量。则计算公式为:

u i j = x i j min { x 1 j , x 2 j , , x n j } max { x 1 j , x 2 j , , x n j } min { x 1 j , x 2 j , , x n j } (1)

其中 i = 1 , 2 , , n j = 1 , 2 , , m

2) 负向指标的标准化

同理有关负向指标的公式为:

u i j = max { x 1 j , x 2 j , , x n j } x i j max { x 1 j , x 2 j , , x n j } min { x 1 j , x 2 j , , x n j } (2)

其中 i = 1 , 2 , , n ,, j = 1 , 2 , , m

3.2. 指标筛选的相关性分析

两个指标的相关系数,反映了两个指标的相关性。通过计算同一准则层中各个评价指标的相关系数,删除相关系数较大的评价指标,避免评价评价指标的信息重复。

1) 计算指标之间的相关系数

r i j 为第i个指标和第j个指标的相关系数,n为评价对象的个数, z i k 为第i个指标度k个评价对象的值, z i ¯ 为第i个指标的平均值。则相关系数的计算公式 [10] 为:

r i j = cov ( i , j ) D ( i ) D ( j ) = k = 1 n ( z i k z i ¯ ) ( z j k z j ¯ ) k = 1 n ( z i k z i ¯ ) 2 ( z j k z j ¯ ) 2 (3)

2) 规定一个临界值M ( 0 < M < 1 ),当 | r i j | > M ,删除其中一个评价指标;当 | r i j | < M ,两个评价指标同时保留。

3.3. 指标筛选的主成分分析

1) 主成分分析筛选指标的原理

通过对剩余的海选指标进行主成分分析,得到每个指标的因子载荷,因子载荷反应对评价结果的的影响程度,因子载荷的绝对值越大的指标表示该指标越重要,应该予以保留,反之,应予以删除。

2) 相关模型

F i 为第i个主成分( i = 1 , 2 , 3 , , k ), a i j 为第i个特征值所对应的特征向量的第j个分量, X i j 为第i个指标的观测值,k为主成分的个数,m为指标的个数。则第i个主成分 F i 为:

F i = a i 1 X 1 + a i 2 X 2 + + a i m X m (4)

其中 i = 1 , 2 , , k 。即第i个主成分表示为评价指标 X i 的线性组合,反应了部分原有海选指标的信息。

3) 主成分分析的具体步骤为 [11] :

① 对原始数据进行标准化处理,可参照max-min标准化处理方式。

② 求标准化数据的相关系数并建立相关系数矩阵 R m × m 。相关系数 r i j 由公式(3)求出来,从而组成一个m × m,主对角线为1的对称矩阵。

R m × m = ( 1 r m 1 r m 1 1 ) (5)

③ 计算相关系数矩阵R的特征值和特征向量。设相关系数矩阵的特征值为 λ i 和特征向量 U i ( i = 1 , 2 , , m ),对每一个特征向量可以组成m个新的指标变量有 U j = ( u 1 j , u 2 j , , u n j ) T 。求解公式(6)特征向量,可进一步得到所对应的特征值。

{ F 1 = u 11 x 1 ˜ + u 21 x 2 ˜ + + u n 1 x p ˜ F 2 = u 12 x 1 ˜ + u 22 x 2 ˜ + + u n 2 x p ˜ F m = u 1 m x 1 ˜ + u 2 m x 2 ˜ + + u n m x p ˜ (6)

④ 计算特征值 λ i 对应的方差贡献率 ω i 。特征值 λ i 反应了第i主成分 F i 的信息贡献量,则其信息贡献率为:

ω i = λ i i = 1 k λ i (7)

ω i 表示第i个主成分 F i 所占原始信息含量的 λ i 占主成分所表示全部原始信息含量的比例。

⑤ 将所求出的特征值从小到大排列,选取特征值大于1所对应的主成分,当前p个大于1的特征值 λ p 的累积方差贡献率大于85%时,再次选取前P个特征值所对应的主成分。其中第i个指标在第j个主成分上的因子载荷 b i j 为:

b i j = a i j λ i (8)

⑥ 根据 | b i j | 的大小进行筛选。

3.4. 指标体系构建构建的合理性标准

根据前文用数据的方差来表示指标信息含量的思路,可用海选前的指标所含数据信息和筛选后的指标数据所含信息的比较值来判定指标体构建是否合理 [10] 。

设S为指标数据的协方差矩阵;trS为协方差的迹,表示为协方差矩阵的主对角线上各个指标的方差之和;A为筛选后的指标个数,B为筛选前(海选)的指标个数。则筛选后的指标对海选指标的信息贡献率H为:

H = t r S A t r S B (9)

4. 国际陆港竞争力指标体系的构建

4.1. 指标的海选

本文选取了中国2021年182个国际陆港作为评价对象,由相关文献,企业及港口管理部门得到58个海选指标。国际陆港及其所对应的地级市见表1,海选评价指标体系见表2

第一次筛选:根据可观测性原则,对海选指标数据进行初选,将不可获取的数据和有缺失值的对应的指标进行删除,以保证建立的评价体系切实可行。删除的相关的指标有:港务区/陆港区规划面积,集装箱中心站占地面积,物流园产业规划面积等20个评价指标,对于定性指标本文全部据删除。

Table 1. International dry ports and their corresponding prefecture-level cities

表1. 国际陆港及其所对应的地级市

Table 2. Preliminary evaluation indicator system for international dry port competitiveness

表2. 国际陆港竞争力海选评价指标体系

第一次筛选后,国际陆港内部基础设施发展水平指标剩余6个,国际陆港物流发展水平剩余8个,国际陆港商贸发展水平剩余9个,区域经济发展水平没有删除,有13个,一起剩余36个指标。第一次筛选后的指标体系见表3

Table 3. International dry port competitiveness indicator system after the first screening

表3. 国际陆港竞争力第一次筛选后的指标体系

4.2. 数据来源与标准化处理

1) 数据来源

本文数据x1~x6,x18来自各地区国际陆港官网,国际陆港协会,《国际陆港白皮书2020》,及各地政府官网;本文的其他数据来自各地级市政府统计年鉴。本文的原始数据和标准化处理结果见表4

第1列为ID,代表182个国际陆港的名称;第二列为城市,代表182个国际陆港所在的地级市;第3列到第38列为原始指标数据;第39列到第74列为标准化处理后的数据。

2) 标准化处理

本文可观测的指标均为正向指标。根据公式(1)进行正向标准化处理。下面以徐州淮海国际陆港中的投资金额x1的数据为例进行说明。所选的原始数据为425,按列求出最大值和最小值分别为900和0.05。则求原始数据 u 34 , 1 标准化后为:

x 1 , 1 = 425 0.05 900 0.05 = 0.4722

其他指标数据同理可得。

Table 4. Original data of international dry ports and results after data standardization

表4. 国际陆港原始数据及数据标准化后的结果

4.3. 基于相关性分析的指标筛选

1) 计算相关系数

表4第39列~74列的数据按照国际陆港内部基础设施发展水平Y1,国际陆港物流发展水平Y2,国际陆港商贸发展水平Y3,区域经济发展水平Y4计算每个准则层内各个指标层的两两相关系数 r i j

规定一个临界值M = 0.9,当 r i j > 0.9 时,则删去一个指标,反之则同时保留。

相关系数大于0.9的指标筛选结果如表4所示,通过相关性删除5个指标。筛选后的指标评价体系如表5所示。

Table 5. Screening results of indicators with correlation coefficients greater than 0.9

表5. 相关系数大于0.9的指标筛选结果

Table 6. International dry port competitiveness evaluation indicator system after correlation screening

表6. 相关性筛选后的国际陆港竞争力评价指标体系

4.4. 基于主成分分析的指标筛选

通过主成分分析法对剩余指标进行第二次筛选。当提取主成分方差累计贡献率超过85%时候,保留各个主成分因子载荷绝对值大的指标。本研究中选取指标的原则:准则层的第一主成分的因子载荷大于0.7的指标,剩余主成分提取因子载荷绝对值最大的指标。

下面以区域经济发展水平Y4为例进行说明。将表6准则层中的区域经济发展水平的相关数据代入公式(4)~(9)中,结果如表7第一行和表8所示。

当提取3个主成分时,方差的累计贡献率为0.4449 + 0.2121 + 0.1454 = 0.8024 < 0.85。当提取4个主成分时,方差的累计贡献率0.8024 + 0.0897 = 0.8921 > 0.85。故应提取4个主成分。

在第一主成分因子载荷系数中,大于0.7的指标有x24,x29,x30,x34,x36保留;第二、第三、第四主成分因子载荷系数中,最大绝对值的对应因子的指标依次为x27,x33,x25保留。其他的因子删除。其余准则层类似。

故在准则层Y4中通过主成分分析保留指标有x24,x25,x27,x29,x30,x33,x34,x36.从而删除的指标有x26,x28。类似地,在准则层Y1中,没有删除的指标;在准则层Y2中,删除x13;在准则层Y3中,没有删除的指标。通过主成分分析删除3个指标。

最后构建的国际陆港竞争力指标体系共有28个指标,见表9

Table 7. Variance contribution rate of principal components

表7. 主成分方差贡献率

Table 8. Principal component factor loadings for criterion layer Y4

表8. 准则层Y4主成分因子载荷系数

Table 9. Final evaluation indicator system for international dry port competitiveness

表9. 最终的国际陆港竞争力评价指标体系

4.5. 指标体系构建的合理性判定

表4的第39到74列的数据结合表8相关指标代入公式(10)中,得到筛选指标的信息贡献率为:

H = t r S B t r S A = 0.8299 0.9564 = 82.38 %

即用50% (28/56)的指标反映了82.38%的信息,可以认为本研究构建的指标体系是合理的。

5. 研究结论

1) 通过相关分析的思路,删除反应信息冗余的指标,保证指标体系的简洁性;通过主成分分析的思路,筛选出对国际陆港物流评价结果有重要影响的指标。这种方法能保证保留的指标对评估结果至关重要。

2) 最终建立了包含国际陆港内部基础设施发展水平、国际陆港物流发展水平、国际陆港商贸发展水平和区域经济发展水平一起四个方面的、28个指标的国际陆港物流评价指标体系,即用50%的海选指标反映了82.38%的原始信息。这样的指标体系不仅结构清晰、简洁,而且对评价结果有显著影响,能够有效地衡量国际陆港的竞争力。

3) 最终建立的国际陆港竞争力评价体系可以为国际陆港管理部门的决策提供科学依据,有助于促进国际陆港的自身发展和政府部门的有效管理。这套体系提供了一个全面评价和改进国际陆港竞争力的工具,使所需评估的国际陆港能够在复杂的交通运输网络中更为有效地定位自身,并制定出更具前瞻性的发展战略。

基金项目

RCEP框架下湖南怀化国际陆港竞争力测度、提升路径与可视化关键技术研究(2023JJ50459)。

参考文献

[1] Tang, S., et al. (2020) Research on Competitiveness Evaluation of Major Inland Ports in China. IOP Conference Series: Earth and Environmental Science, 526, Article ID: 012174.
https://doi.org/10.1088/1755-1315/526/1/012174
[2] 陈菊红, 黄鹏. 基于Fuzzy-ANP的国际陆港竞争力评价[J]. 系统工程, 2011, 29(12): 88-95.
[3] 姜健乐. 青岛国际陆港竞争力评价及提升策略研究[D]: [硕士学位论文]. 济南: 山东财经大学, 2023.
[4] 蒋明羽. 甘肃(兰州)国际陆港竞争力评价及对策研究[D]: [硕士学位论文]. 兰州: 兰州交通大学, 2022.
[5] 闫茹. 基于云模型的国际陆港综合竞争力提升路径研究[D]: [硕士学位论文]. 杭州: 长安大学, 2022.
[6] 贺博雅. 集成场视角下西安国际陆港竞争力评价及提升对策研究[D]: [硕士学位论文]. 杭州: 长安大学, 2019.
[7] 魏晓雪. 西安国际陆港发展水平评价及对策研究[D]: [硕士学位论文]. 西安: 西安建筑科技大学, 2017.
[8] 车文. 昆明国际陆港物流绩效评价及动力学仿真研究[D]: [硕士学位论文]. 昆明: 昆明理工大学, 2015.
[9] 中国开发区协会陆港分会. 中国陆港发展报告2020[M]. 北京: 中国财富出版社, 2021.
[10] 迟国泰, 曹婷婷, 张昆. 基于相关-主成分分析的人的全面发展评价指标体系构建[J]. 系统工程理论与实践, 2012, 32(1): 111-119.
[11] 陈思云, 彭俊. 基于PCA和DEA分析法的港口物流绩效评价[J]. 物流工程与管理, 2012, 34(2): 40-42.