1. 研究背景与国内外研究现状
1.1. 疫情对中国及“一带一路”沿线国家外贸的宏观影响
新冠病毒在世界的迅速蔓延,不仅增加了“一带一路”倡议建设的不确定性,使其面临严峻的挑战,同时也增加了国际市场环境的波动性。
新冠肺炎对中国及沿线国家贸易的影响,可以从下面几个方面分别进行讨论。对于沿线国家,新冠疫情对“一带一路”项目的实施主要有以下两点影响:一是当地项目的劳动力不足。由于项目劳动力一部分来源于当地,另一部分来源于中国,出于防控需要,不得不限制人员流动,使得无法向当地提供充足的劳动力。二是境外供应链断裂,由于部分原材料和一些机械设备来自中国,工厂停工,港口关闭,航班取消,道路阻塞导致补给品和设备无法到达现场。由于各级政府加强了预防和控制措施,给“一带一路”项目带来一定影响,原料和设备送不出去,对外供应跟不上。这些干扰可能造成项目延误,增加成本,严重可能导致当地承包商破产。
对于中国内部,承受与COVID-19作战的压力,其背后所要承担的财政预算也是巨大的。为了应对COVID-19带来的经济影响以及支撑中国医疗基础设施并恢复受损的中小企业部门所需的巨额投资,部分“一带一路”项目资源转移国内。此外中美经贸摩擦不断加剧和国内严格的防疫隔离措施,使部分企业生产侧受到严重影响,将生产从中国外迁。最后,全球生产和消费的放缓和医疗物资生产本土化,使中国丢失一批海外订单,给处于全球供应链的中国企业带来了冲击。
1.2. 贸易潜力研究综述
目前有关贸易潜力的研究方法主要有基于引力模型,CGE模型,GTAP模型,差分GMM模型和系统GMM模型。最早是Tinbergen和Pouhonen将引力模型应用到国际贸易领域 [1] [2],随后Nilsson和Egger将传统引力模型回归估计值作为贸易潜力,真实贸易值与贸易潜力的比值作为贸易效率 [3] [4]。Huang等基于贸易引力模型,选择中国的GDP、贸易伙伴的GDP、双边距离、国界、铁路货运量、人口增长率和WTO作为解释变量,构建了中国对五个中亚国家出口的计量方程,预测中国未来的出口增长潜力 [5]。Akaev等使用回归方程式和引力模型描述了欧盟以及俄罗斯与中国的进出口,建立了对中国与欧盟和俄罗斯经济发展的长期预测模型 [6]。Lee运用引力模型揭示了“一带一路”倡议对中国与中亚国家之间贸易的影响,实证结果表明贸易的增长归因于“一带一路”倡议下修建的石油和天然气管道以及中国制造业产品出口的增长 [7]。传统贸易引力模型本身存在很多改进之处,例如贸易无摩擦的苛刻假设和引入少量客观阻力因素而忽略人为阻力因素,导致模型的估计误差偏高。为了解决这些问题,随机前沿技术被引入到引力模型中,称为随机前沿引力模型,将不可观测的因素作为限制贸易因素单独被处理而不是归于传统引力模型中的随机扰动项 [8]。陈敏等使用随机前沿引力模型实证检验贸易非效率对中国及沿线国家贸易的影响。分析得出,中国与“一带一路”沿线国家的贸易效率整体水平偏低,贸易潜力有待进一步提升 [9]。佟家栋使用CGE模型研究减少腐败,提高透明度来降低贸易成本对经济产生的影响,结果表明透明度的提供和腐败程度的降低使全球各国获得显著的贸易增长 [10]。陈虹等运用CGE模型发现自由贸易区的建立使沿线国家的GDP、贸易总值均有不同程度的提高 [11]。杨军等运用GTAP模型发现通关时间的缩短显著促进贸易便利化的提升和经济的增长 [12]。刘宇等利用GTAP模型分析了关税减少和贸易便利化程度提升对经济的影响,且贸易便利化对经济的促进作用要大于关税减少 [13]。周岩等运用GTAP模型模拟了贸易便利化和贸易自由度对沿线国家外贸的影响,并发现随着中国贸易规模的显著提升,贸易顺差总额也随之增大 [14]。孙林运用差分GMM模型,实证分析了中国与东盟国家贸易便利化程度对谷物进口流量的影响。并发现港口、铁路等基础设施质量的提升和海关程序负担的减弱,对区域谷物进口额有显著的正向作用 [15]。
1.3. 研究内容及方法
本文研究了中国与沿线国家贸易的影响因素及出口值预测。引入沿线国家的GDP、人口、贸易关税、贸易便利化得分、双边距离、卫生保健、医疗质量和可及性、防控指数、是否上合组织成员国、是否与中国地理毗邻共10个指标作为预测变量,构造基于核函数的高斯过程模型,对2020年中国与沿线国家出口金额进行预测,得到各沿线国家的贸易潜力。
2. 贸易影响因素
2.1. 自变量的设定
新冠肺炎疫情的爆发使全世界意识到医疗体系质量的重要性。通过对先前学者关于贸易潜力影响因素研究的总结,在此基础上加入卫生保健、医疗质量和可及性、防控指数这三个指标,因此结合沿线国家的国民生产总值、与中国的双边距离、人口、贸易关税、卫生保健指数、医疗质量和可及性、贸易便利化、防控指数、是否为上合组织成员国和地理位置是否与中国毗邻共10个因素作为自变量,构造贸易影响因素体系,研究其对因变量出口贸易的影响是否显著。本文将对贸易潜力的影响因素分析做一个新的尝试,本文所研究的具体影响因素见表1。
![](Images/Table_Tmp.jpg)
Table 1. Influencing factors of trade potential
表1. 贸易潜力影响因素
2.2. 数据预处理
由于国民生产总值、双边距离、人口、贸易关税、卫生保健指数、医疗质量和可及性、贸易便利化、防控指数及2020年贸易出口值数据取值较大,在数据的整个值域中有巨大差异,因此将上述变量的原始数据做对数变换,缩小了数据的取值范围,且不会改变数据的性质和相关关系。
在回归类模型时,当自变量相关时,会发生多重共线性。如果变量之间的相关程度足够高,则在拟合模型并解释结果时可能会引起一系列的问题。多重共线性的诊断有多种方法,本文利用方差膨胀因子来检验自变量多重共线性,计算每个自变量的VIF值,VIF值大于10,表示存在多重共线性;否则不存在。下面对贸易潜力的影响因素进行检验,从表2中可以看出,所有变量的VIF值均小于10,不存在多重共线性。
![](Images/Table_Tmp.jpg)
Table 2. Variance expansion factor of each variable
表2. 各变量方差膨胀因子
3. 贸易潜力预测与分析
3.1. 高斯过程回归理论基本介绍
高斯过程回归对高维数据和小样本数据有良好的适应性。假设训练
。
其中
为输入变量,
是
维矩阵,y为输出变量。高斯过程回归的两个核心问题就是均值和协方差函数,即
其中
为任意随机变量,
表示各个维度的均值,
表示各维度之间的协方差矩阵。则高斯过程被定义为
为了计算方便,通常将数据进行转换,使其均值为0。在回归问题中y受到噪声污染,因此进一步假设噪声服从正态分布,即
则因变量y的分布为
以及y与其预测值
的联合先验分布为
其中
表示
和
之间的相关性,K表示协方差矩阵。则
的条件分布为
和
分别为预测点
的均值和方差
高斯过程回归常采用的核函数为Radial Basis kernel function。为了方便计算,将协方差函数和
写成如下形式
下面建立对数似然函数
,并使用极大似然估计法求超参数,来训练样条条件概率,对
关于
求偏导得:
,
对C求关于
,
,
的偏导得:
其中
,
表示相同结构矩阵对应元素相乘,最后利用优化方法对偏导数进行最小化来得到超参数的最优解。下面使用梯度下降法求最优超参数,迭代公式为:
根据上述公式,直到算法收敛为止 [16] [17]。
本文采用的核函数除Radial Basis kernel function外,还有Linear kernel function:
,
Polynomial kernel function:
,
Laplacian kernel function:
.
3.2. 高斯过程回归模型的建立与对比
GP允许样本各特征之间存在相关关系,并通过核函数模拟一个协方差矩阵来体现这种相关关系,决定GP先验和后验的形状。下面分别利用Linear kernel、Polynomial kernel、Radial Basis kernel和Laplacian kernel对中国2020年与43个“一带一路”沿线国家贸易出口金额进行拟合,选择最优超参数。带有Linear kernel、Polynomial kernel、Radial Basis kernel和Laplacian kernel的高斯过程分别如下图1~3。其中,图1中横坐标表示Polynomial kernel的特征长度尺度scale的对数,图2中横坐标表示Radial Basis kernel function中的sigma,图3中横坐标表示Laplacian kernel function中的sigma,图1~3中的纵坐标均为均方根误差RMSE。
训练模型过程种采用10折交叉验证来确定最优参数组合。对于多项式核函数高斯过程回归,为了防止过拟合现象,当degree = 1,scale = 1e+06时,RMSE达到最小,决定系数为0.944;对于径向基核函数高斯过程回归,sigma取值为0到2之间的任意实数,比较各模型的RMSE,当sigma = 0.138时,RMSE达到最小,此时决定系数为0.901。
对于拉普拉斯核函数高斯过程回归,sigma取值为0到1之间的任意实数,比较各模型的RMSE,当sigma = 0.388时,RMSE达到最小,此时决定系数为0.942。将基于不同核函数的高斯过程回归模型与广义相加模型进行对比,具体模型评价指标得分见下表3,可以看出多项式核函数高斯过程回归的拟合效果最佳。
![](//html.hanspub.org/file/46-2623037x50_hanspub.png?20221227102252727)
Figure 1. Gaussian process with Polynomial kernel
图1. 带有Polynomial kernel的高斯过程
![](//html.hanspub.org/file/46-2623037x51_hanspub.png?20221227102252727)
Figure 2. Gaussian process with RBF kernel
图2. 带有RBF kernel的高斯过程
3.3. 出口潜力与贸易效率分析
利用构造的多项式核函数高斯过程回归对出口潜力进行估算,将外贸出口额的估计与其真实值进行对比,若出口真实值小于其估计值,说明贸易往来存在不足,具有进一步发展双方贸易的潜力;若出口真实值大于估计值,说明双方贸易出口金额超出预期,贸易潜力相对较小。对43个沿线国家计算结果如表4。
![](//html.hanspub.org/file/46-2623037x52_hanspub.png?20221227102252727)
Figure 3. Gaussian process with Laplacian kernel
图3. 带有Laplacian kernel的高斯过程
![](Images/Table_Tmp.jpg)
Table 3. Comparison of model fitting effects
表3. 模型拟合效果对比
![](Images/Table_Tmp.jpg)
Table 4. Estimated and true export values of each country
表4. 各国家出口估计值与真实值
由表4可以看出,中国对上述43个“一带一路”沿线国家的贸易出口中有近一半国家属于过度贸易状态,例如新加坡、马来西亚、越南、印度尼西亚等,但排名最高的是斯洛文尼亚,其次是斯里兰卡;贸易不足的国家中排名最高的是印度、其次是黎巴嫩和卡塔尔,说明中国与贸易不足的国家还有巨大的贸易潜力。中国与泰国、俄罗斯、塞尔维亚等国家的出口潜力接近于1,说明模拟较好,估计值与真实值较接近。
4. 结论
将医疗体系质量相关指标引入到贸易影响因素中,在GDP、人口和贸易关税等指标的基础上,添加卫生保健、医疗质量和可及性、防控指数3个指标,总共10个指标。利用上述10个指标构造基于Linear kernel、Polynomial kernel、Radial Basis kernel和Laplacian kernel函数的高斯过程回归。根据RMSE,基于多项式核函数的高斯过程回归效果最佳,用其对2020年出口值进行预测,对出口潜力进行分析,中国与新加坡、马来西亚、越南等国家属于出口过度;对印度出口不足,两国间的贸易存在较大发展空间。
NOTES
*通讯作者。