1. 引言
随着经济社会的不断发展,我国人民日益提高的生活水平以及不断扩大的出行范围都促使汽车成为了不可或缺的“家庭成员”。然而,随之而来的汽车保有量的增长也带来了一系列负面影响,除了交通拥堵和车位紧缺外,环境与能源问题也日益严峻。为了贯彻新发展理念,实现经济又好又快的发展,协调人与自然和谐发展,发展新能源汽车已成为大势所趋。无论是在环境友好性方面,还是在动力性、舒适性等方面,新能源汽车都凭借绝对的优势向我们证明,大力发展和支持新能源汽车是正确可行的。相信在全球政策以及需求的共振下,新能源汽车将在发展的赛道上高速前进。
如今,对反映经济活动各方面情况的变量进行合理的预测已成为经济活动参与者进行更好地管理或最大化其利益的重要法宝。预测的结果能够很好地辅助相关经济主体制定有效的战略计划。同样地,对新能源汽车销量的预测也具有重要意义。对于企业而言,预测新能源汽车的销量有利于把握市场的发展动态,为生产、库存、销售等环节制定合理战略,识别其竞争优势。对于政府而言,把握销量的发展情况有利于更好地制定相关政策以及建设基础设施。对于消费者而言,销量数据是了解新能源汽车行业发展状况的重要信息,向消费者提供新能源汽车行业的前景预测有利于新能源汽车市场的推广。因此,对于各方而言,对新能源汽车销量的预测都具有重要的意义。
目前,绝大多数的研究都是在某一个特定的时间尺度(月度、季度或者年度)下进行的,而本文将结合长期和短期不同的时间尺度进行研究。
2. 新能源汽车销量预测的研究现状与总结
相较于预测新能源汽车销量的研究,对传统燃油车销量进行预测的研究更加成熟。早在20世纪50年代,Nerlove [1] 就基于汽车新增需求、上期报废数量和保有量之间的关系构建回归模型,来对美国汽车的保有量进行短期预测。陈道平 [2] 收集了2001年1月到2011年6月的我国汽车销量月度数据,构建ARIMA模型对我国汽车整体销量进行了预测分析。胡彦君 [3] 通过预测汽车销量帮助政府及相关部门制定交通布局、停车位增设和城市绿化等方面的政策。章旭 [4] 提出基于网络大数据和传统时间序列分析的汽车销量预测BOAR模型,将汽车销量的预测细化至单一汽车品牌的粒度,并开创性地提出一种基于MARS变量选择过程和BP神经网络的MISF模型。有关传统燃油汽车销量预测的研究成果为新能源汽车销量的预测研究提供了丰富的研究思路与研究方法。
对于预测新能源汽车销量的研究,目前大多数的研究都是从固定周期的角度进行的。常用到的预测模型包括自回归移动平均模型、线性回归模型、灰色理论模型和BP神经网络模型等。周彦福 [5] 等根据销量影响因素的影响能力构建基于果蝇算法优化的灰色神经网络模型进行月度预测。刘颖琦 [6] 等以丰田普锐斯混合动力汽车的历史全球销量数据作为基础数据,由Bass模型预测中国新能源汽车产业的总体走势、典型新能源车型的未来市场表现。
Andrawis [7] 等指出短期预测与长期预测相结合是提高预测准确性的有效方法,月度数据、季度数据和年度数据等不同时间尺度的数据体现出不同的动态特征,其研究证实长短期预测相结合的方法优于单一模型的预测。刘媛 [8] 收集了2014年至2019年6年24个季度72个月的新能源汽车销量数据,通过构建SARMA模型和奇异谱分析模型两个模型,对新能源汽车销量进行了短期月度预测,由ARMA模型和基于数据分组方法的灰色预测模型预测长期季度销量。通过比较不同预测周期下,不同模型的预测效果,刘媛指出,由于新能源汽车的销量数据有限,相比ARMA模型与SARMA模型,灰色系统预测模型和奇异谱分析模型等小样本预测模型对新能源汽车销量的预测更加准确。白一凡 [9] 的研究结果表明SARIMA模型与BP神经网络的组合模型对新能源汽车月度销量的预测结果在多方面都优于单一的SARIMA模型。不过,不可否认的是,随着我国新能源汽车销量样本数据的增加,ARIMA模型等时间序列分析模型的预测效果依然会是理想的。
经过对国内外相关研究的分析,可以看出大部分研究的预测对象都是我国新能源汽车的整体销售量,而对某一特定品牌的新能源汽车销量或是某一特定新能源汽车车型的销量的预测研究仍较少。此外,大多数的研究局限于应用单一类型的模型进行预测,而且很少有研究结合长期和短期两个不同的视角进行研究。
3. 相关理论及方法
3.1. ARIMA模型
非平稳序列在差分后往往会显示平稳序列的特征,ARIMA模型可拟合差分平稳序列的发展。
3.1.1. ARIMA模型的结构
求和自回归移动平均(autoregressive integrated moving average)模型,简记为ARIMA (p,d,q)模型:
(1)
其中,
。
,
分别为平稳可逆ARMA(p,q)模型的自回归系数多项式和移动平均系数多项式。
d阶差分后的序列可用下式表示:
(2)
其中,
。ARIMA模型实质就是差分运算与ARMA模型的组合 [10] 。
3.1.2. ARIMA模型建模
对于一个非平稳序列,若其能在适当阶数的差分后实现平稳,那么可由ARMA模型拟合该差分平稳非白噪声序列。ARMA模型的建模步骤见图1。
3.2. SARIMA模型
在现实生活中,很多的时间序列都带有季节效应,从而呈现出周期性波动的规律。ARIMA模型也可对这些具有季节效应的时间序列进行建模,相应地,可将这类考虑季节效应的ARIMA模型称为SARIMA (Seasonal Autoregressive Integrated Moving Average)模型。根据季节效应的提取方式不同,考虑序列季节效应的ARIMA模型可分为ARIMA加法模型与ARIMA乘法模型。
对于新能源汽车月度销量的预测,本文采用了ARIMA加法模型。
ARIMA加法模型是指序列的季节效应与其他效应之间是加法关系,这意味着序列中的季节信息可由周期步长差分提取,趋势信息可由低阶差分提取。
ARIMA加法模型的结构如下:
(3)
其中,S表示周期步长。d为提取趋势信息所用的差分阶数。
为白噪声序列,且
,
。
是p阶自回归系数多项式。
是q阶移动平均系数多项式。ARIMA加法模型简记为ARIMA (p,(d,S),q)或ARIMA (p,d,q) × (0,1,0)S。
3.3. 灰色预测模型GM (1,1)
灰色预测模型具备小样本建模的突出优点,利用微分方程充分挖掘系统本质,可将无规律的原始数据进行生成得到规律性较强的生成序列 [11] 。GM (1,1)表示模型是一阶微分方程,且只含1个变量的灰色模型。运用GM (1,1)模型进行预测的步骤如下。
3.3.1. 数据的检验与处理
首先对原始序列
的级比进行计算,以确保建模方法的可行性,级比计算公式如下:
(4)
只有在所有的级比都位于可容覆盖内
时,序列才可作为GM (1,1)模型的数据,否则需通过平移变换使新序列的级比落在可容覆盖内。平移变换公式如下:
(5)
3.3.2. 模型的建立
如果序列
通过了级比检验,则可进一步建立灰色模型。首先,对原始序列进行1次累加操作:
(6)
再对原始序列
的1次累加生成序列
进行均值生成操作:
(7)
(8)
进一步可建立灰微分方程:
(9)
相应的白化微分方程为:
(10)
记
,
,
。由最小二乘法求得使
取最小值的u的估计值为:
(11)
最后可得到预测值为:
(12)
(13)
3.3.3. 预测值的检验
对模型预测结果的检验主要有残差检验与级比偏差值检验。其中,残差检验的公式如下:
(14)
注意
。如果
,则可认为达到一般要求;而
,则意味着预测达到较高的要求。
级比偏差计算公式如下:
(15)
若
,则可认为达到较高的要求。
3.3.4. 预测预报
根据实际问题的需要,由GM (1,1)预测模型给出相应的预测值。
4. 新能源汽车年度销量预测研究
4.1. 数据采集
本文使用2011~2020年共10年的新能源汽车年度销量数据进行预测模型的搭建,数据来源于中国汽车工业协会。原始数据时序图如图2所示。
![](//html.hanspub.org/file/65-2623324x46_hanspub.png?20230505092315056)
Figure 2. Time series diagram of the annual sales of new energy vehicles in China
图2. 我国新能源汽车年度销量序列时序图
4.2. 时间序列数据的预处理
原始序列的时序图呈现显著的上升趋势,这是典型的非平稳序列特征。本文用差分方法充分提取确定性信息,原始序列差分运算后的序列时序图见图3。
![](//html.hanspub.org/file/65-2623324x47_hanspub.png?20230505092315056)
Figure 3. Sequence diagram after difference operation
图3. 差分运算后序列的时序图
1阶差分后的序列仍呈现长期递增的趋势,而且ADF检验结果表明1阶差分序列是非平稳的。通过对原始序列进行二阶差分运算,对应时序图显示二阶差分运算较充分地提取了原序列所蕴含的长期趋势。进一步地,图4的ADF检验结果表明二阶差分后的序列是平稳的。
![](//html.hanspub.org/file/65-2623324x49_hanspub.png?20230505092315056)
Figure 4. Results of ADF unit root test
图4. ADF单位根检验结果
纯随机性检验结果见图5。
![](//html.hanspub.org/file/65-2623324x50_hanspub.png?20230505092315056)
Figure 5. Results of pure randomness test for stationary sequence
图5. 平稳序列纯随机性检验结果
纯随机性检验结果表明二阶差分后的序列为白噪声序列,故可停止相关统计分析。基于上述时间序列预处理的结果,本文采用GM (1,1)预测模型分析未来新能源汽车年度销量的发展趋势。
4.3. 灰色预测模型GM (1,1)的建立
4.3.1. 数据的检验与处理
由于这10个年度的销量数据的级比并未全部处于可容覆盖(0.8338,1.1814)内,故本文选取常数C = 165对原始数据进行平移变换。
4.3.2. 模型建立与检验
利用变换后的数据建立预测模型,可得到预测值见图6和图7,预测模型中两个灰参数a、b的值分别为:−0.08723151,134.6529。
![](//html.hanspub.org/file/65-2623324x51_hanspub.png?20230505092315056)
Figure 6. Prediction and test results of the GM (1, 1) model
图6. GM (1,1)模型的预测及检验结果
![](//html.hanspub.org/file/65-2623324x52_hanspub.png?20230505092315056)
Figure 7. Comparison between the prediction of GM (1, 1) model with the actual values
图7. GM (1,1)模型的预测结果与实际值的比较
图6中的相对误差与级比偏差两个检验值均是由平移变换后的数据计算得到的,相对误差值都小于0.1,则可认为预测达到较高的要求。同样地,由级比偏差值也可验证该模型的精度较高,可进一步进行预测。
4.3.3. 模型预测
结合GM (1,1)模型对2021年新能源汽车年度销量的预测值(176.63万辆)以及当前新能源汽车发展的良好势头,本文认为新能源汽车在2021年度一定会取得不错的销量成绩。
5. 新能源汽车季度销量预测研究
5.1. 数据采集
本文使用2016年第一季度至2021年第三季度共23个季度的新能源汽车季度销量数据进行预测模型的搭建(其中,前22个季度的数据用作训练集而第23个季度的数据用作测试),数据来源于中国汽车工业协会。原始数据时序图如图8所示。
![](//html.hanspub.org/file/65-2623324x53_hanspub.png?20230505092315056)
Figure 8. Time series diagram of the quarterly sales of new energy vehicles in China
图8. 新能源汽车季度销量序列时序图
5.2. 时间序列数据的预处理
原始序列的时序图显示该序列呈现上升趋势且蕴含固定的周期,可认为原始序列是非平稳的。本文考虑用差分运算充分提取原始序列中的确定性信息,原始序列一阶差分后的序列时序图如图9所示。
![](//html.hanspub.org/file/65-2623324x54_hanspub.png?20230505092315056)
Figure 9. Sequence diagram of Chinese new energy vehicles quarterly sales after first-order difference operation
图9. 我国新能源汽车季度销量1阶差分序列的时序图
1阶差分有效地提取了原序列中递增的趋势,进一步地,图10的ADF检验结果表明了1阶差分后的序列是平稳的。
对1阶差分后的序列进行纯随机性检验:
![](//html.hanspub.org/file/65-2623324x56_hanspub.png?20230505092315056)
Figure 11. Results of pure randomness test for the quarterly sales after first-order difference operation
图11. 季度销量序列1阶差分后序列的纯随机性检验
如图11所示,纯随机性检验结果表明,6阶和12阶延迟的LB统计量的P值都远小于0.05的显著性水平,故可采用ARMA模型拟合该1阶差分序列的发展。
5.3. 平稳序列的拟合与预测
1 阶差分后序列的自相关图和偏自相关图见图12。自相关系数图显示1阶、3阶、4阶、5阶和8阶的自相关系数都显著大于2倍标准差,可认为自相关系数具有拖尾特征。偏自相关系数图表明1阶、3阶与4阶偏自相关系数显著大于2倍标准差,也可认为偏自相关系数具有拖尾特征。综上所述,可考虑拟合以下ARIMA模型:
![](//html.hanspub.org/file/65-2623324x57_hanspub.png?20230505092315056)
Figure 12. Autocorrelation and partial autocorrelation coefficients
图12. 自相关与偏自相关系数图
1) ARIMA (4,1,8);
2) ARIMA ((4),1,0)。
根据AIC信息准则,进行模型优化,最终选择ARIMA ((4),1,0)模型进行新能源汽车季度销量的预测,该ARIMA模型的估计结果及显著性检验结果详见附录。
新能源汽车季度销量的ARIMA预测模型对原始序列的拟合情况见图13,而对2021年第三季度销量数据的预测结果与实际值的比较见表1。
![](//html.hanspub.org/file/65-2623324x58_hanspub.png?20230505092315056)
Figure 13. Predictions of the quarterly sales of new energy vehicles by ARIMA ((4), 1, 0) model
图13. ARIMA ((4),1,0)模型对新能源汽车季度销量的拟合预测
![](Images/Table_Tmp.jpg)
Table 1. The predictions of the ARIMA quarterly sales forecast model
表1. ARIMA季度销量预测模型的预测情况
6. 新能源汽车月度销量预测研究
6.1. 数据采集
本文使用2016年1月至2021年10月共70个月的新能源汽车月度销量数据进行预测模型的搭建(其中,2016年1月至2021年6月共66个月的数据用作训练集而2021年7月至2021年10月这四个月的数据用作测试),数据来源于中国汽车工业协会。原始数据时序图如图14所示。
![](//html.hanspub.org/file/65-2623324x59_hanspub.png?20230505092315056)
Figure 14. Time series diagram of the monthly sales of new energy vehicles in China
图14. 我国新能源汽车月度销量序列时序图
6.2. 时间序列数据的预处理
原始序列的时序图显示该序列有着显著的上升趋势且蕴含固定的周期,这是典型的非平稳序列特征。本文考虑用差分运算充分提取序列中的确定性信息,原始序列差分处理后的时序图如图15所示。
![](//html.hanspub.org/file/65-2623324x60_hanspub.png?20230505092315056)
Figure 15. Sequence diagram of the monthly sales of Chinese new energy vehicles after difference operation
图15. 我国新能源汽车月度销量差分处理后的时序图
1阶差分有效提取了原序列中的递增趋势,但仍残留季节变动和随机波动。对比1阶差分序列时序图,1阶12步差分很好地提取了周期信息。进一步地,ADF检验结果表明1阶12步差分后的序列是平稳的,见图16。
纯随机性检验如图17所示,纯随机性检验结果表明,12阶延迟的LB统计量的P值小于0.05的显著性水平,故1阶12步差分后的序列为平稳非白噪声序列,可用ARMA模型拟合该序列的发展。
此外,考虑到异方差问题对模型拟合精度的影响,对上述1阶12步差分后的序列进行方差齐性检验。如图18所示,LM检验结果表明不存在异方差问题。
![](//html.hanspub.org/file/65-2623324x63_hanspub.png?20230505092315056)
Figure 18. Results of the LM test for heteroscedasticity
图18. 异方差的LM检验结果
6.3. 平稳序列的拟合与预测
1阶12步差分后序列的自相关与偏自相关图见图19。自相关系数图显示仅1阶和12阶的自相关系数显著大于2倍标准差。偏自相关系数图表明仅1阶与12阶偏自相关系数显著大于2倍标准差。可考虑拟合以下疏系数的季节加法模型:
1) ARIMA ((1,12),1,(1,12)) × (0,1,0)12;
2) ARIMA (0,1,(1,12)) × (0,1,0)12;
3) ARIMA ((1,12),1,0) × (0,1,0)12。
根据AIC信息准则,进行模型优化,最终选择ARIMA ((1,12),1,0) × (0,1,0)12模型进行新能源汽车月度销量的预测,该模型的估计结果及显著性检验结果详见附录。
新能源汽车月度销量的SARIMA预测模型对原始序列的拟合情况见图20,对2021年7月至10月的月销量数据的预测结果与实际值的比较见表2。
![](//html.hanspub.org/file/65-2623324x64_hanspub.png?20230505092315056)
Figure 19. Autocorrelation and partial autocorrelation coefficients
图19. 自相关与偏自相关系数图
![](//html.hanspub.org/file/65-2623324x65_hanspub.png?20230505092315056)
Figure 20. Predictions of the monthly sales of new energy vehicles by SARIMA model
图20. SARIMA模型对新能源汽车月度销量的拟合预测
![](Images/Table_Tmp.jpg)
Table 2. The predictions of the SARIMA monthly sales forecast model
表2. SARIMA月度销量预测模型的预测结果
此外,本文的月度销量预测模型预测2021年11月的新能源汽车月销量为28.53万辆,12月预计销售34.58万辆,而到2022年的1月,销售量预计下降为24.91万辆,2月的销售量预计为20.6万辆,3月和4月的新能源汽车销售量分别为27.55万辆和28.89万辆。
7. 新能源汽车销量的长短期预测比较及分析
新能源汽车季度销量的ARIMA预测模型与新能源汽车月度销量的SARIMA预测模型对2021年第三和第四季度与2022年第一季度的销量的预测结果见表3。
![](Images/Table_Tmp.jpg)
Table 3. Comparison of the results of different models in predicting the quarterly sales of new energy vehicles
表3. 不同模型对新能源汽车季度销量预测的结果比较
由表3中的结果可见,对于新能源汽车季度销量的预测,由月度销量预测数据转换得到的季度销量预测值相比于季度销量预测模型的直接预测结果更加低估了新能源汽车市场的发展。尽管如此,本文构建的长短期预测模型都能很好地反映出新能源汽车销量序列的变化趋势。每年的12月都是创造该年月度销量记录的时候,因为考虑到来年上市的新款车型将带来冲击,商家在每年底都会给予消费者最大额度的购车优惠,故大部分消费者都会选择在12月购入新车。
8. 结论与展望
本文对新能源汽车的整体销量进行了长期预测与短期预测。长短期预测模型均表明新能源汽车正以越来越快的速度成为汽车行业的主要角色。如今,人工智能、云计算和大数据等关键前沿技术的发展为新能源汽车领域的诸多挑战与难题提供了有效的解决路径,广大消费者们所关心的电池质量、车辆续航里程、充电效率、用车安全性、车辆智能化配置以及售后服务等问题得到逐步的解决,我们有理由相信新能源汽车行业面临的发展机遇是前所未有的。
考虑到本研究在数据采集、模型方法及分析手段等方面存在的不足,后续研究可从以下方面进行改进:
1) 考虑到汽车在设计与技术特性方面的不同而确定的用途分类:乘用车与商用车,后续研究可分别对新能源乘用车与新能源商用车的销量进行预测,也可更进一步地比较两种预测方法(方法一:基于新能源汽车整体的销量数据建立单一模型,直接预测新能源汽车整体销量即本文的预测方法;方法二:由新能源乘用车的销量数据建立一个乘用车销量预测模型,再由新能源商用车的销量数据建立一个商用车销量预测模型,基于这两个模型的预测结果加总得到新能源汽车的整体销量预测)的效果差异。
2) 如今,小鹏汽车、蔚来汽车及理想汽车等自主品牌已在新能源汽车领域取得了显著的成绩,并不断地扩大各自的品牌影响力,后续研究可关注特定品牌的新能源车型的产销发展状况。
附录
![](Images/Table_Tmp.jpg)
Table A1. Monthly sales data of Chinese new energy vehicles from January 2016 to October 2021 (Unit: 10,000)
表A1. 2016年1月至2021年10月我国新能源汽车月度销量统计(单位:万辆)
![](//html.hanspub.org/file/65-2623324x66_hanspub.png?20230505092315056)
Figure A1. Results of the parameter estimation and model significance test of the ARIMA ((4), 1, 0) model
图A1. ARIMA ((4),1,0)模型的参数估计结果与模型显著性检验结果
![](//html.hanspub.org/file/65-2623324x67_hanspub.png?20230505092315056)
Figure A2. Results of the parameter estimation and model significance test of the ARIMA ((1, 12), 1, 0) × (0, 1, 0) 12 model
图A2. ARIMA ((1,12),1,0) × (0,1,0) 12模型的参数估计结果与模型显著性检验结果
NOTES
*通讯作者。