1. 引言
邮电业是国民经济中办理通信业务的社会生产部门,是国民经济的基础设施和社会发展的必要条件 [1]。随着我国电子信息技术的蓬勃发展,邮电业从人们的工作、生活及消费等方面对国民经济产生日益深刻的影响。因此,要在我国当前的经济状况下更好地发展邮电业,提高人民的生活质量和水平,充分了解我国邮电业和国民经济状况之间的关系是不可或缺的。
本文以2007~2019年我国邮电业及国民经济状况为例,以函件、包裹、移动电话用户和固定电话用户四个指标来衡量我国各年份的邮电业,采用第一产业产值、工业产值、建筑业产值以及第三产业产值四个指标衡量我国各年份的经济状况 [2]。利用多元统计中的典型相关分析方法进行数据分析,从而客观、科学地认知我国邮电业指标和国民经济指标之间的相关性及组内的相关性。
2. 思想方法
针对我国邮电通讯业与经济发展的关系,已有不少学者进行了相关研究与分析,并取得了研究成果。康国栋等(2008)以1985~2005年我国31个省(市、自治区)的人均邮电业务量为例,将时间序列和空间差异方法相结合,分析得出了人均邮电业务量与人均GDP呈正相关关系 [3];李再扬与杨少华(2010)基于2003-2008年我国31个省(市、自治区)的电信业技术效率,采用DEA方法进行度量,并建立计量经济模型得到了其影响因素 [4];薛声家与王清(2010)基于DEA超效率模型,分析了我国31个省(市、自治区)电信业的效率及影响因素 [5];韩磊与窦彩兰(2010)同样运用DEA方法分析得到了我国电信业区域运营效率的排名顺序和层次结构,并利用Tobit回归得出了我国电信业发展的影响因素 [6];郭艳春与刘斐(2012)基于2000~2011年深圳、广州、东莞以及佛山四个城市的邮电业务情况,采用面板数据模型分析其影响因素,结果表明对邮电业的推动作用最大的因素是第三产业发展状况和区域开放度 [7];李清清与李厚彪(2018)构建了多元回归分析模型,并通过统计检验得出了移动电话年末用户数、总人口数量、公路里程、居民消费水平以及对外贸易总额5个对邮电业发展影响显著的因素 [8];刘珉慧等(2020)基于1990-2019年邮电业务数据,利用Johansen协整检验及误差修正模型检验了邮政业务量、电信业务量和人均GDP三个指标之间的关系,结果表明电信业务量与邮政业务量存在着长期均衡关系 [9]。综合上述文献可以发现,典型相关分析方法鲜有研究者使用。因此本文采用典型相关分析法,对我国邮电业与经济发展之间的关系进行分析。
2.1. 数据的来源及说明
本文以函件(单位:亿件)、包裹(单位:万件)、移动电话用户(单位:万户)和固定电话用户(单位:万户)作为衡量我国各年份的邮电业的指标,以第一产业产值(单位:亿元)、工业产值(单位:亿元)、建筑业产值(单位:亿元)以及第三产业产值(单位:亿元)作为衡量我国各年份的经济状况的指标。本文选取了2007~2019年以上各指标的数据,数据均来源于2021年中国统计年鉴 [10],见表1。
![](Images/Table_Tmp.jpg)
Table 1. Output value of post and telecommunication industry and that of primary industry, industry, construction industry and tertiary industry
表1. 邮电业与第一产业、工业、建筑业及第三产业产值情况
2.2. 典型相关分析的思想
典型相关分析研究两组变量间整体的线性相关关系,它是将每一组变量作为一个整体来进行研究 [11]。典型相关分析借助主成分分析的思想,对每组变量以其线性组合的形式分别构造综合变量,而后考察两个综合变量的相关程度,这种相关程度用典型相关系数来进行描述。
设
和
,是两个具有相关性的随机向量,分别对两组变量构造综合变量
,
,并且每一个综合变量都为原变量的线性组合,即
考虑方差为1的
,
的线性函数
和
,考察它们的相关系数。如果存在常向量
,
,使得
换言之
,
是相关程度最大的一对典型相关变量,则称
,
为
,
的第一对典型相关变量,以类似的方法可以求得第二对、第三对……使得各对典型相关变量之间是互不相关的。
3. 实证分析
我们使用R软件,对邮电业和国民经济数据进行多元统计分析。
3.1. 原始变量的相关系数与典型相关系数
首先,我们求样本系数矩阵,结果见表2。结果显示,邮电业与国民经济指标间的相关系数有正有负,并且任意两个指标间的相关系数的绝对值都接近1,这说明邮电业指标和国民经济指标有很强的相关性,同组内指标的相关性也很强。
![](Images/Table_Tmp.jpg)
Table 2. The sample correlation coefficient matrix
表2. 样本相关系数矩阵
求得原始变量的相关系数之后,我们再进行典型相关分析。由于变量的单位不一致,我们用标准化之后的数据进行分析。得到第一典型相关系数为0.99921968,它比邮电业指标和国民经济指标间的任一其他对的相关系数都要大,这充分体现了典型相关分析对两组变量间高维关系的有效浓缩。
3.2. 典型相关系数的显著性检验
为了确定要保留几对典型相关变量,我们有必要对典型相关系数进行显著性检验,考察典型相关系数是否显著不为0。检验结果见表3。
![](Images/Table_Tmp.jpg)
Table 3. Significance test for the canonical correlation coefficient
表3. 典型相关系数的显著性检验
给定显著性水平
,第一对、第二对典型相关变量的相关系数对应的相伴概率P值分别为1.048196e−10和1.538818e−04,均远小于显著性水平
,因此拒绝典型相关系数为0的原假设,认为第一对、第二对典型相关是显著的;而第三对、第四对典型相关变量的相关系数对应的P值分别为6.449506e−01和8.523187e−01,均大于显著性水平
,因此接受原假设,认为第三对、第四对典型相关是不显著的。综上所述,只有第一对和第二对典型相关是显著的。
3.3. 典型载荷
检验完成后,我们来求典型相关载荷 [12],邮电业指标x和国民经济指标y的典型载荷分别见表4和表5。
![](Images/Table_Tmp.jpg)
Table 4. The canonical loadings of x
表4. x的典型载荷
![](Images/Table_Tmp.jpg)
Table 5. The canonical loadings of y
表5. y的典型载荷
根据典型相关载荷的结果可以得出,邮电业指标的第一典型变量
为:
它为邮电业各指标的线性组合,在移动电话用户上的权数最大,其次为固定电话用户。说明移动电话用户和固定电话用户为影响邮电业发展的主要指标,它们在邮电业中占据了主导地位。
邮电业指标的第二典型变量
为:
它近似地是函件和移动电话用户的加权求和,仍然在移动电话用户上的权数最大。移动电话用户与固定电话用户的权数符号相反,说明两变量之间存在一定的相互抑制作用。
来自国民经济指标的第一典型变量
为:
它为国民经济各指标的线性组合,在第三产业产值上的权数最大,且其权数远高于第一产业、工业以及建筑业产值的权数。这表明第三产业产值相较于其他产业的产值对国民经济的影响更大,是与国民经济相关联的主要指标。
来自国民经济指标的第二典型变量
为:
它在第三产业产值上的权数最大,其次是建筑业产值。
综合两对典型变量可知,对邮电业产生最大影响的指标是移动电话用户,对国民经济产生最大影响的指标是第三产业产值。
3.4. 典型变量解释原始变量方差的比例
下面我们计算两组典型变量解释两组原始变量方差的比例,汇总计算结果可得表6。
第一对典型相关变量能够比较全面地预测对应的那组原始变量,来自邮电业指标的标准方差被第一个典型变量u1的解释的方差比例为0.92620846,第一个典型变量v1解释国民经济指标的比例为0.950306675;而来自邮电业指标的标准方差被对方组的第一个典型变量v1解释的比例为9.247635e−01,国民经济指标的标准方差被对方组的第一个典型变量u1解释的比例为9.488242e−01,这表明国民经济水平与邮电业发展有很强的关联性。
第二对典型相关变量的预测效果远次于第一对典型相关变量,来自邮电业指标的标准方差被第二个典型变量u2的解释的方差比例为0.04522376,第二个典型变量v2解释国民经济指标的比例为0.045275384;而来自邮电业指标的标准方差被对方组的第二个典型变量v2解释的比例为4.441160e−02,国民经济指标的标准方差被对方组的第一个典型变量u2解释的比例为4.446230e−02。第二对典型变量解释本组和对方组原始变量的方差比例均小于第一对典型相关变量,解释性较第一对典型相关变量存在较大差距。
![](Images/Table_Tmp.jpg)
Table 6. The proportion of the variance of the original variable explained by the canonical variable
表6. 典型变量解释原始变量方差的比例
3.5. 典型变量之间的关系
计算邮电业指标与国民经济指标的典型变量得分(表7和表8),并绘制得分等值平面图(图1)。
从得分情况来看,随着年份的变化,邮电业指标的第一个典型变量u1的得分和国民经济指标的第一个典型变量v1的得分均呈现逐年增长的趋势,这说明邮电业指标和国民经济指标有强正相关关系。
从得分等值平面图中可以看出,第一对典型相关变量u1和v1的散点近似在一条直线上,两者之间呈现高度线性正相关关系,散点图中没有离群点出现。这表明我国邮电业和国民经济发展之间的关系很稳定,整体的变化趋势是非常平稳的。
![](Images/Table_Tmp.jpg)
Table 7. Canonical variable scores for post and telecommunication
表7. 邮电业指标的典型变量得分
![](Images/Table_Tmp.jpg)
Table 8. Canonical variable scores for national economy
表8. 国民经济指标的典型变量得分
![](//html.hanspub.org/file/99-2622611x54_hanspub.png?20140102013548219)
Figure 1. Diagram of the scores of the first pair of canonical correlation variables for the post and telecommunication industry and national economic data
图1. 邮电业和国民经济数据第一对典型相关变量得分等值平面图
4. 结论
本文基于典型相关分析法,依据2007~2019年的数据,对我国的邮电业和国民经济的关系进行了统计分析。首先得到了原始变量之间的相关系数及典型相关系数,邮电业指标和国民经济指标之间有很强的相关性,同组内指标的相关性也很强。而后进行了典型相关系数的检验,检验结果表明,只有第一对和第二对典型相关变量是显著的。随后计算得出了邮电业指标和国民经济指标的典型相关载荷,并分析得出对邮电业产生最大影响的指标是移动电话用户,对国民经济产生最大影响的指标是第三产业产值。最后,计算了典型变量得分并绘制了典型相关变量得分等值平面图。结果表明,我国邮电业和国民经济发展呈高度的线性相关关系。因此,邮电业的发展对我国国民经济水平的提高具有深刻的影响,发挥着积极的推动作用。除此之外,经济社会的发展对邮电业的高速成长起着重要的支撑作用 [7]。不同的国民经济水平会对邮电业的发展产生不同程度的影响。所以,我国应采取适合我国国情的更加有效的措施以促进邮电业的发展,从而推动国民经济水平的提升;此外,国民经济的增长也应更好地推动邮电业的持续发展。