1. 引言
民航业的快速发展,使我国空域日趋拥挤、机场更加繁忙。近年来航班延误现象愈演愈烈,严重影响了机场、航空公司和旅客的利益,全国范围内整体的延误程度究竟如何,不同航空公司、不同机场在不同时段和不同地理位置的延误情况需要定量的数据进行刻画,以便了解我国机场和航空公司的延误情况。
目前,国内外对航班延误的文献有很多,基本上是利用不同的模型和方法对航班延误进行分析,例如航班延误波及分析模型,当某事件被延误时,该模型可以对该事件引起的后续波及进行分析 [1];还有通过静态贝叶斯网络分析模型,仿真航班延误影响因素所带来的影响,同时还指出影响航班延误的多种因素的重要意义 [2];还有对不正常航班进行预警,并将预警级别分为五个等级,选取延误人员数量、延误率及可用资源等指标建立预警评价指标体系 [3]。前三种模型及方法,仅仅从导致航班延误的因素,或者通过对航班延误的预警来分析,没有从数据本身出发进行研究分析;还有基于动态贝叶斯网络的航班运行风险预测模型,该模型主要针对单个航班的进近、着陆阶段的风险预测,且预测精度仅为80.4% [4]。因此本文基于机场及航空公司的数据,进行时间和空间上的延误特征分析,得到相关结论,并基于ARIMA模型进预测,根据预测结果与理想准点率比较,从多个方面提出提高准点率的策略。
2. 研究方法
本文对收集到的数据进行整理,并基于准点率和延误时长进行研究,准点率是指航空旅客运输部门在执行运输计划时,航班实际出发时间与计划出发时间的较为一致的航班数量(即正常航班)与全部航班数量的比率 [5],通过100%-延误率得到,此外,本文还涉及延误时长,延误时长即航班发生延误的时间长度,虽然准点率与延误时长存在一定的关系,即准点率低(高)对应于延误时长长(短),但是这不是完全的关系,这种关系仅适应于部分机场和航空公司,仍有机场和航空公司不满足这种关系,因此同时研究准点率和延误时长,可以了解各机场和航空公司延误情况的复杂性。
首先从时间尺度,将我国主要机场和航空公司的延误时长和准点率通过统计图呈现,使得数据更加清晰易懂,并计算我国主要机场和航空公司的延误时长和准点率的平均值、方差 [6] [7]、极差,通过这些参数,可以挖掘延误的规律,从而为决策做参考;再从空间尺度,也计算出对应的平均值、方差、极差进行研究,除此之外,还将数据可视化,使得数据更加直观;将时间特征和空间特征耦合,并从数据本身出发,研究时空特征;最后利用ARIMA模型 [8] [9] 对数据进行分析。
使用ARIMA模型时,为避免针对某一时间序列有多种模型符合,需要对时间序列进行AIC和BIC信息准则(最小信息量准则)选择模型,最后基于ARIMA模型,对航班准点率与平均延误时间预测。ARIMA模型为自回归移动平均模型。ARIMA模型可把任意时间序列看作随机过程,选择合适的数学模型将其表达并进行模拟预测 [10]。使用ARIMA模型时,为避免针对某一时间序列有多种模型符合,需要对时间序列进行AIC和BIC信息准则选择模型。AIC值最小的模型为最有效模拟模型,SBC准则是在AIC基础上进行调整。选择模型时,应选择AIC与SBC函数值最小进行模拟预测。本文选取北京首都机场作为样本进行拟合分析,分别选取2018年与2019年每月准点率与平均延误时间作为样本数据进行预测。
3. 我国主要机场和航空公司准点率及延误时长的时间特征
3.1. 航空公司准点率及延误时长的的时间特征
本次共收集了20家航空公司近五年的延误时长,准点率的具体数据。各航空公司的平均延误时长和准点率从2015到2019年的年变化如下图1、图2所示,各个航空公司的延误情况随着年份的增加而逐渐好转,中间亦有一些波动,如2017年,延误情况却在恶化,2019年延误情况比较复杂,每个航空公司的延误情况都不一样;2016年南航、成都航空、春秋航空,吉祥航空,川航的平均延误时长和准点率都在增加,这说明这些公司的长延误时间的航班占比较大;2017年春秋航空,上海航空的延误时长和准点率都在减少,说明这些公司的短延误时间航班占比较大。
![](//html.hanspub.org/file/1-2760560x10_hanspub.png)
Figure 1. Annual changes in the average delay time of airlines
图1. 航空公司平均延误时长的年变化
![](//html.hanspub.org/file/1-2760560x11_hanspub.png)
Figure 2. Annual changes of airlines’ punctuality rate
图2. 航空公司准点率的年变化
通过分析以上航空公司五年间的延误时长和准点率的方差,平均值,极差可以看出,延误时长和准点率的相对情况是一致的,春秋航空和中联航方差最高,二者间的平均值也处于较高的水平,但是准点率相对较高,说明该航空公司一直都是长时间延误的航班较多,并且各年间波动很大。总的来说大部分航空公司的延误时长,准点率平均值都基本处于同一水平,但是方差的区别却比较明显,即反映出各航空公司五年间的稳定性不相同,方差小(大)的五年间变化幅度小(大),各个航空公司的发展情况不尽相同。
为了分析一年间1到12月航空公司延误时长和准点率的变化情况,本次统计了20家航空公司2019年12个月的延误情况,各航空公司的平均延误时长和准点率从1月到12月的月变化如图3、图4所示以及各航空公司的极差、方差和平均值。延误时长和准点率具有一定的联系,当延误时长增加时,准点率通常是降低。2月、4月、6月、7月的延误相较于前一个都是在恶化,尤其是6、7、8三个月,延误情况很糟糕,但是2月祥鹏航空和上航的延误时长减少,4月,天航的延误时长减少,这说明这些航司短延误时长的占比较大,此外,7月祥鹏航空的准点率有所增加,说明该航司能在大范围延误的情况下控制自己的延误情况。3月、5月、8月、9月为各航空公司延误状况的恢复期,8月虽然准点率再增加但延误时长变化不大,说明该月长时间延误还是存在且有一定的比例,5月昆明航空、华夏、国航、首都航空和9月的祥鹏航空变化特征相似。
![](//html.hanspub.org/file/1-2760560x12_hanspub.png)
Figure 3. Monthly changes in the average delay time of airlines
图3. 航空公司平均延误时长的月变化
![](//html.hanspub.org/file/1-2760560x13_hanspub.png)
Figure 4. Monthly changes of airlines’ punctuality rate
图4. 航空公司准点率的月变化
3.2. 机场准点率及延误时长的时间特征
本次共收集了22个千万级的机场近五年的延误时长和准点率。
各机场的延误时长和准点率从2016年到2020年6月的变化情况如下图5、图6所示,各机场的延误时长和准点率基本上都是负相关,2016到2020年的延误情况总体上呈向好趋势,除了上海浦东和虹桥机场外,其余机场的变化趋势具有高度一致性。2016至2017年大部分机场延误情况在恶化,但上海虹桥和上海浦东的延误情况是在变好,2018年至2019年延误情况较复杂,不同机场延误情况不尽相同。
通过统计计算各机场的延误五年间的延误时间和准点率的平均值,方差以及极差。可以得到如下结果:1) 五年间所有机场延误时间和准点率的平均值差别不大,说明大多数机场延误情况差别很小,但是仍有少部分机场差别偏大。2) 各机场的方差各不相同,即各机场的波动情况各不相同,其中波动最大的为上海虹桥,波动最小的为西安咸阳3) 西安咸阳机场的延误时长和准点率平均数,方差,极差基本上都最小的,说明该机场的延误时间很短,并且在五年间保持的很好。而结合具体的数据可知,上海虹桥机场虽然方差很大,但是一直是下降趋势,延误情况一直在变好。4) 在2017年的延误情况是最严重的;而在2016年各机场之间的差距最大,同时2020年不仅延误时长最短,各机场间差距也很小。
![](//html.hanspub.org/file/1-2760560x14_hanspub.png)
Figure 5. Annual changes in the length of airport delays
图5. 机场延误时长的年变化
![](//html.hanspub.org/file/1-2760560x15_hanspub.png)
Figure 6. Annual change of airport punctuality rate
图6. 机场准点率的年变化
此外,为了分析一年中不同时期机场的延误情况,本次共分析了22个机场2019年12个月的延误情况,各月的平均延误时长和准点率如图7、图8所示,大部分机场不同月份的延误时长和准点率呈负相关,但仍有不同机场不同月份不满足这种关系,因此延误特征具有多样性。全年变化波动明显,所有机场都在6,7,8月份达到延误的峰值,而10至12月份是延误情况的最好。2,4,6月延误情况都是明显的恶化,到9月明显变好之后一直保持良好,仅有微弱的波动。
![](//html.hanspub.org/file/1-2760560x16_hanspub.png)
Figure 7. Monthly changes in the length of airport delays
图7. 机场延误时长的月变化
![](//html.hanspub.org/file/1-2760560x17_hanspub.png)
Figure 8. Monthly changes in the average delay time of airports
图8. 各机场平均延误时长的月变化
3.3. 驻场航空公司与机场延误特征的关系
通过对比机场与主要驻场航空公司从15年到19年延误特征的变化情况,可以发现机场的平均延误时长和准点率的变化和主要驻场航空公公司的相应数据有很大关系,即机场与驻场航空公司的延误情况具有一定的正比关系。由图9可以看出,在16到19年期间,北京首都机场和中国国际航空公司的年平均延误时长和准点率的曲线基本是平行的,说明二者的延误时长和准点率是呈正相关的,这体现了机场的延误特征是很大程度上受到主要驻场航空公司的影响的,不过由于一个机场的驻场航空公司很多,因此数据具有相同的变化趋势,并不是完全相同。此外,如图10、图11,通过分析天津滨海机场和天航,广州白云机场和南航有相同的结果。
![](//html.hanspub.org/file/1-2760560x18_hanspub.png)
Figure 9. Annual delay characteristics of Capital Airport and Air China
图9. 首都机场和国航的年延误特征
![](//html.hanspub.org/file/1-2760560x19_hanspub.png)
Figure 10. The annual delay characteristics of Tianjin Airport and its resident airlines
图10. 天津机场与其驻场航司的年延误特征
![](//html.hanspub.org/file/1-2760560x20_hanspub.png)
Figure 11. The annual delay characteristics of Guangzhou Airport and its resident airlines
图11. 广州机场与其驻场航司的年延误特征
在一年间,机场和航空公司的延误特征也有一定的相关性,如下图12,首都机场在19年各个月份的延误时长和准点率的曲线和国航的相应曲线也是基本保持平行的,说明在各个月份机场主要驻场航空公司的延误特征也很大程度上影响机场的延误特征的。同样,如图13、图14,分析天津滨海机场和天航,广州白云机场和南航都有相同的规律。
![](//html.hanspub.org/file/1-2760560x21_hanspub.png)
Figure 12. Monthly delay characteristics of Capital Airport and Air China
图12. 首都机场和国航的月延误特征
4. 我国区域准点率的空间特征
以2019年我国主要机场准点率和区域准点率(各空管局管辖区域内主要机场准点航班数所占总航班数的比例)进行分析,并利用该数据通过ArcGIS进行可视化,区域准点率高低通过区域块颜色的深浅表示,机场准点率高低通过黑点大小表示,得到如图15。全国准点率的平均值为75.57%,平均数是反映数据集中趋势的一项指标,即反映出全国准点率的集中趋势是75.57%,其中准点率最低的为南京禄口国际机场,比全国平均水平低了10.77%,准点率最高的为西安咸阳国际机场,比全国平均水平高了9.2%。地区平均准点率比全国平均准点率低仅有华东、华北两个地区,最低的为华北地区,比全国平均水平低了3.57%,最高的为西北地区,比全国平均水平高了8.05%,且新疆地区的准点率也较高,其值也大于80%。方差来度量随机变量和其数学期望(即平均值)之间的偏离程度,通过比较各地区的方差,可以反映出各地区内各机场的偏离程度和一致性,方差最大的为华东地区,其值为0.43%,其余地区方差差别不大且最小为东北地区(由于新疆地区只选取了一个机场,故方差为0且不与其他地区进行比较),其值为0.004%。由此可见,延误状况最严重的地区是华东和华北地区,并且华东地区内各机场的延误情况没有表现出一致性且具有较大的差别性,延误情况较好的地区是中南、西南、西北和新疆地区,东北地区的延误情况与全国平均水平相差不大,并且除华东地区,各地区内各个机场的延误情况差别不大,表现出各地区延误情况的一致性。导致这种地域差异现象,与空域、气象和技术等一系列因素有关,华北和华东地区的机场分布密集,且大型机场较多,导致空域紧张,且气象条件不稳定,华北地区常出现梅雨天气,华北地区则常出现雾霾天气,这些原因都是导致准点率低于全国平均水平的几个原因之一。
![](//html.hanspub.org/file/1-2760560x22_hanspub.png)
Figure 13. Monthly delay characteristics of Tianjin Airport and its resident airlines
图13. 天津机场与其驻场航司的月延误特征
![](//html.hanspub.org/file/1-2760560x23_hanspub.png)
Figure 14. Monthly delay characteristics of Guangzhou Airport and its resident airlines
图14. 广州机场与其驻场航司的月延误特征
![](//html.hanspub.org/file/1-2760560x24_hanspub.png)
Figure 15. Visualization of the on-time rate of regions and airports
图15. 区域及机场准点率可视化图
5. 我国区域准点率的时空特征
以2019年的数据进行分析,将2019年分为4个季度,并根据各机场所在的空管局所划分的地区,得到各机场和各地区在各季度的准点率及平均值,全国准点率的平均值为75.57%,其中准点率最高的为第四季度的广州白云国际机场,其值为89.47%,准点率最低的是第三季度的天津滨海国际机场,其值为58.02%。各地区中准点率最高的为第二季度的新疆地区,其值为87.77%,此外第四季度的西北地区和中南地区准点率与最高值相差不大于2%,准点率最低的是第三季度的华北地区,其值为65.20%,此外第二季度的华北地区和华北地区的准点率与最小值相差不大于2%。各机场和各地区准点率的情况基本上能够相互对应,虽然第四季度的中南地区准点率不是最高,但是与最高准点率相差不大。根据前文结论,将时间特征和空间特征耦合可得,准点率最高的为10、11、12月的西北地区,同时期新疆地区的准点率也较高,准点率最低的为6、7、8月的华北地区,同时期华东地区的准点率也较低,这与根据数据所得的时空特征略有些区别,由于新疆地区范围内的机场仅有一个,数据单一,误差较大,且经过耦合得到的结论是根据多个数据得到的,可信度更高。而准点率最低的时间及地区的结论基本上没有差别,只是第三季度指的是7、8、9月份,与耦合中的6、7、8月份不相符,这说明,其他季度中6月份,准点率也低,但第三季度中9月份准点率并没有很低,所以,准点率低的特征是跨季度的。因此,全年全国范围内,准点率较高的且延误情况较好的为第三季的西北地区和第二季度的新疆地区,准点率较低且延误情况较差为第三季度以及6月的华北地区。
6. 基于ARIMA模型的航班准点率与平均延误时间预测
6.1. 原因分析
航班准点率与平均延误时间受多方面影响,其中与天气状况尤为密切,天气较为晴朗的日子飞机准点率就较高,大风大雨或雾霾严重的天气,航班很可能会延误。而对于一些商务人员或有联程航班旅客,准点率十分重要,一旦一段航程发生长时间延误就有可能赶不上后面航班,因为带来诸多麻烦,因此很多旅客将飞机准点率放在重要位置 [11]。航班延误率居高不下不仅会对航空旅客与公司造成巨额经济损失,也不利于民航业秩序维护 [12]。
民航局目前统一界定的影响航班延误因素涉及20种原因,将其分为正常航班与不正常航班分析 [13]。
航班延误预测可帮助空中交通管理部门预知可能发生的延误状况,提前做好相应应对措施与航班调整 [14] 为提高航班准点率,必须考虑可能会造成航班延误的原因,尽早发现解决问题,将损失尽可能降到最小 [15]。
由于机场延误的原因众多,很难通过建立数学模型进行定量预测,现有研究大都根据以往准点率和延误时间数据,建立时间序列数据,通过数据挖掘方法预测未来延误情况 [16],本研究采用ARIMA模型进行机场准点率和平均延误时间的预测。
6.2. 机场准点率分析
根据北京首都机场的数据,利用ARIMA模型分析,最终分析结果如表1所示。
![](Images/Table_Tmp.jpg)
Table 1. ARIMA model analysis results of Beijing Capital Airport
表1. 北京首都机场ARIMA模型分析结果
*p < 0.05, **p < 0.01.
针对准点率,结合AIC信息准则(该值越低越好),对多个潜在备选模型进行建模和对比选择,最终找出最优模型为:ARMA(2,2),其模型公式为:
.
从Q统计量结果看,Q6的p值大于0.1,则在0.1的显著性水平下不能拒绝原假设,模型的残差是白噪声,模型基本满足要求。预测效果如图16所示,后12期准点率预测值如表2,将预测值与2019年1至12月实际值进行对比,折线图如图17。
![](//html.hanspub.org/file/1-2760560x26_hanspub.png)
Figure 16. Beijing Capital Airport on-time rate fitting and prediction
图16. 北京首都机场准点率拟合和预测
![](Images/Table_Tmp.jpg)
Table 2. Predicted values of on-time rate in the next 12 phases of Beijing Capital Airport
表2. 北京首都机场后12期准点率预测值
![](//html.hanspub.org/file/1-2760560x27_hanspub.png)
Figure 17. Comparison of predicted and actual values of Beijing Capital Airport's punctuality rate
图17. 北京首都机场准点率预测值与实际值对比图
6.3. 机场平均延误时间分析
根据北京首都机场的数据,利用ARIMA模型分析,最终分析结果如下表所示。
*p < 0.05, **p < 0.01.
针对平均延误时间(min),结合AIC信息准则(该值越低越好),对多个潜在备选模型进行建模和对比选择,最终找出最优模型为:AR(1),其模型公式为:
。
从Q统计量结果看,Q6的p值大于0.1,则在0.1的显著性水平下不能拒绝原假设,模型的残差是白噪声,模型基本满足要求。预测效果如图18所示,后12期准点率预测值如表3,将预测值与2019年1至12月实际值进行对比,折线图如图19。
![](Images/Table_Tmp.jpg)
Table 3. Predicted value of average delay time in the next 12 phases of Beijing Capital Airport
表3. 北京首都机场后12期平均延误时间预测值
![](//html.hanspub.org/file/1-2760560x29_hanspub.png)
Figure 18. Fitting and prediction of average delay time of Beijing Capital Airport
图18. 北京首都机场平均延误时间拟合和预测
![](//html.hanspub.org/file/1-2760560x30_hanspub.png)
Figure 19. Comparison of predicted and actual values of Beijing Capital Airport’s punctuality rate
图19. 北京首都机场准点率预测值与实际值对比图
6.4. 误差分析
误差分析如表4所示。
根据分析预测值与实际值误差最小为0.12%,最大为59.32%。平均误差为17.82%,说明大部分预测结果可靠。
本文使用ARIMA模型进行研究分析,另外使用SPSSAU分析软件,使分析结果更具逻辑性与准确性,预测的结果与实际结果误差较小,说明ARIMA模型可有效进行准点率与平均延误时间分析。
![](Images/Table_Tmp.jpg)
Table 4. Error analysis of Beijing Capital Airport
表4. 北京首都机场误差分析
7. 结论
1) 本次统计分析了20家空公司以及22个千万级的机场的延误、准点率五年间的变化情况,以及2019年各个月份间的变化情况。可以看出,机场和航空公司延误情况具有时间特征:逐年向好,夏季最差,节假日下滑。此外,还得到航空公司和机场延误特征的关系,即机场的延误特征是很大程度上受到主要驻场航空公司的影响的。
2) 我国机场的延误情况具有空间特征,延误状况最严重的地区是华东和华北地区,除这两个地区之外,各地区的准点率都比平均值要高,延误情况最好的是西北地区和新疆地区,此外华东地区内各机场的延误情况没有表现出一致性且具有较大的差别性,其他地区内各个机场的延误情况差别不大,表现出各地区延误情况的一致性。全国范围内,还存在机场与所属地区延误情况不同的情况,例如处于华东地区的上海虹桥国际机场,延误情况却比全国平均水平要高,而处于华南地区的三亚凤凰国际机场和深圳宝安国际机场,延误情况却比全国平均水平要低。
3) 我国航班延误具有时空特征,由根据数据得到的结论和将时间特征和空间特征耦合得到的结论综合可得,全年全国范围内,准点率较高的且延误情况较好的为第三季的西北地区和第二季度的新疆地区,准点率较低且延误情况较差为第三季度以及6月的华北地区。
4) 本文通过选用ARIMA模型对北京首都机场的准点率与平均延误时间进行分析与预测,预测结果与实际结果对比,该模型预测准点率与平均延误时间与基本情况基本相符,误差较小,故ARIMA模型可预测机场准点率与平均延误时间。
基金项目
中国民航大学大学生创新创业训练计划项目校级项目IECAUC2020020。
参考文献
NOTES
*通讯作者。