1. 引言
现在风力发电越来越受到世界的关注。然而,风能利用的关键问题是,当大量风能穿透电网时,间歇性风能会导致电力不稳定和显著波动 [1] [2] [3] 。因此可靠准确的风速预测对风力发电系统至关重要。
为了进一步提高风速预测的精准度,目前常用的几种方法包括:物理模型、传统统计模型和人工智能模型 [1] [3] [4] [5] [6] 。物理模型使用基于大气物理过程的当前气象和地理数据进行预测,但在短期风速模拟方面较差。相比之下,传统的统计模型如ARMA (autoregressive moving average, ARMA)、ARIMA (auto regressive integrated moving average, ARIMA)模型 [7] [8] ,依靠于大量的历史数据,实现相较于物理模型更准确的短期风速预测。随着人工智能技术的出现,统计模型的发展,包括人工神经网络(artificial neural nets, ANN)和其他混合方法在内的人工智能模型已经被提出,并广泛应用于风速预测领域 [1] [2] [3] 。例如,由于风时间序列的随机性,Arezoo Barijasteh等人 [9] 提出了一种离散小波变换(discrete wavelet transform, DWT)和双向递归神经网络的预测方法。Mehdi等人 [10] 提出了一种新型的混合神经网络的日前风速预测,评估了五种网络神经算法该,还分析了单特征和多特征对风速预测精度的影响。Wang等人 [11] 成功地将基于反向传播(BP)神经网络和小波分析理论的小波神经网络(wavelet neural network, WNN)用于风速预测,取得了良好的性能。
由于风速时间序列具有很高的噪声和不稳定性;使用原始风速序列直接进行预测会产生很大的误差 [12] 。为了减小这一误差,必须考虑原始风速数据集的特征从而建立有效的模型。例如,Qin Qiong等人 [13] 为了提高预测精度,提出了一种基于EEMD-FuzzyEn-LSTM (longshort-term memory, LSTM)的组合预测模型,先使用EEMD将原始数据序列分解为一系列分量,然后使用计算熵值结合LSTM进行预测。Li等人 [14] 提出了一种基于EEMD的混合方法,使用EEMD算法对历史数据中的问题进行分解。然后使用LS-SVM (least squares-support vector machines, LS-SVM)模型进行风速序列预测。Chen等人 [15] 还提出了一种基于EEMD和遗传算法(geneticalgorithm, GA)优化长短时记忆网络的混合预测方法。尽管EEMD提供了改进,并在许多领域得到了广泛应用,但添加的噪声不能完全消除,这是一个缺陷。魏炘等人 [16] 提出了基于CEEMDAN-SE-SVR的模型预测。Gao等人 [17] 提出了基于CEEMDAN-SVR模型,同时也对EMD-SVR进行了比较。实验结果表明,CEEMDAN-SVR优于EMD-SVR。
故本文采用基于VMD-SE-CEEMDAN-PSO-SVR的混合多步分解短期风速预测方法。其中引入了样本熵的方法判断VMD中K的值,避免了中心频率确定K值所存在的偶然性。样本熵确定K值更加方便、直观;CEEMDAN对复杂性较高的子序列进行第二次分解,使预测误差变小,预测效果更好。此外,针对SVR参数选取问题,本文采用粒子群优化算法PSO对SVR参数进行寻优。进一步提高预测精度。
2. 理论背景
2.1. VMD原理
VMD是一种创新的时频分析方法。与传统的EMD方法相比,VMD采用一种完全非递归的自适应模态变分和信号处理策略,该方法能够有效降低对于复杂度高且具有强烈非线性特征的时间序列非平稳性的处理难度 [18] 。
2.2. 样本熵SE
样本熵是一种度量单位,表示时间序列的复杂度。与近似熵相比,样本熵实质上是对近似熵原理的改进。它降低了近似熵的误差,展现出卓越的一致性,但不受数据长度限制。因此,在复杂时间序列分析中,样本熵已经得到了广泛应用。其计算过程大致如下:设
是一个包含N个数据点的时间序列,即
(1)
1) 从序列
中截取一段维度为m的序列
,满足
(2)
2) 令
为
和
两点间距离最大差值的绝对值
即
(3)
3) 设阈值
,令
为
和
差值绝对值中小于等于
的向量个数
(4)
即
(5)
4) 当向量维度为
,令
为
和
的差值的绝对值小于等于
的向量的个数
(6)
即
(7)
5) 从而得到序列
的样本熵
的表达示如下
(8)
显然,原始序列
样本熵值的大小会受到m、r取值大小的影响。SE越大表示信号的复杂度越高 [19] 。
2.3. CEEMDAN原理
针对EMD算法在信号分解中存在模态混叠的问题,EEMD和CEEMD算法提出了向信号中加入高斯白噪声的方法,减轻了EMD分解中的模态混叠现象。但是,在分解得到的本征模态分量中仍然可能存在一定程度的残余白噪声,这可能对后续信号分析和处理造成一定的影响。为了在提高解决这一问题的计算效率,Torres等人 [20] 提出了一种新的分解方法,该方法可以自适应添加噪声,称为CEEMDAN。与CEEMD算法相比,该方法的筛选迭代的次数显著减小,从而大大提高了算法的效果。该方法的主要过程如下:
1) 在原始序列
中添加𝐼次白噪声序列,记为
:
(9)
2) 把第一个IMF从元数据中分离,得到第一个残差;
(10)
3) 令
为EMD分解后第k个IMF分量。添加噪声
到
中:
(11)
4) 重复(2)~(3)的操作,直到达到要求为止,最后得到:
(12)
2.4. PSO算法
粒子群算法由Eberhart和Kennedy于1995年提出自鸟群觅食行为相关研究。通过模拟群体中个体之间的合作和信息共享,粒子群算法(PSO)被成功应用于解决优化问题。用一种粒子来模拟上述的鸟类个体,粒子仅具有两个属性:速度和位置。更新速度和位置的公式:
(13)
(14)
其中,
为非负惯性因子,若
取较大值,则粒子群算法的全局寻优能力较强,但局部寻优能力较弱,反之亦然。通过调整
的大小,可以灵活地平衡算法在全局和局部寻优之间的权衡关系。
和
为学习因子。random (0, 1)为零到一之间的随机数,
在粒子群算法中用于指导粒子的搜索方向。PSO的计算流程如图1所示:
2.5. 支持向量回归
支持向量机(SVM)利用训练样本数据在高维空间中构建最优超平面,以解决最优非线性问题。SVR就是在SVM的基础上做了一定的改进。
训练样本,其中
为输入样本,
为输出样本。建模,使
拟合
,并引入映射后特征向量
,和需求解的两参数
。则
表述为
(15)
尽管当输入值
与实际输出
完全重合时模型效果最佳,但通常在SVR中有一个最大偏差
。在这种情况下,可以将
、
求解问题转化成一个求最小值问题
(16)
在公式(21)中
和
分别表示松弛变量,
代表
与
之间的偏差,此外,C是正则化项,用于平衡模型的复杂度与对训练数据的拟合程度。引入拉格朗日算子
和
,从而能够重新表述
的定义。因此,表达式可以改写为:
(17)
通过核函数
进行映射解决非线性问题,则SVR可以表述如下
(18)
3. 风速模型预测
3.1. 本文预测流程
对风速不平稳性这一问题,建立VMD-SE-CEEMDAN-PSO-SVR模型,以便对风速进行精准预测。流程如图2所示,具体详解如下:
1) 由样本熵值确定VMD子序列个数K,将原始序列分解为K个子序列。
2) 计算子序列的样本熵,分解熵值大的序列。
3) 用PSO算法优化处理SVR模型。
4) 将上述全部序列作为原始数据,分别建立PSO-SVR预测模型。
5) 将各分量预测结果叠加得到最终的多步预测。
3.2. 评价指标
为对比不同模型的预测结果,本文用均方根误差(RMSE)、对称平均绝对百分比误差(SMAPE)、平均绝对百分比误差(MAPE)和平均绝对误差(MAE)为对比。计算公式如下:
(19)
(20)
(21)
(22)
![](//html.hanspub.org/file/37-1701510x84_hanspub.png?20240417093713507)
Figure 2. VMD-SE-CEEMDAN-PSO-SVR model flow
图2. VMD-SE-CEEMDAN-PSO-SVR模型流程
4. 算例分析
本文所分析的原始数据来自美国魁北克风电场2020年1月1日至10月31日的实时风速数据。该数据采集密度为1 h/次,时长为10个月,共有7279个样本。原始风速序列如图3 (为简洁直观的展现数据结构,仅展示部分数据)。
首先,以VMD算法分解原始风速序列,并使用SE法确定分解层数。具体而言,对于时间序列而言,其复杂性越高,SE的计算值就越大,反之亦然。因此,在此过程中,需选择合适的K值。将SE达到平稳的点作为VMD的分解次数,就可以达到最好的分解状态 [21] 。
由图4可以明显看出在K = 9之后样本熵趋于稳定,所以由此确定K的取值。数据经VMD进行分解,结果如图5。
经计算所得各个模态分量的样本熵如下表1所示:
通过表1样本熵的值可以看出IMF9偏大,表明该分量的复杂度偏高,故对该分量使用CEEMDAN进行二次分解,降低其复杂程度。最后得到经过二次分解后的子序列如图6所示:
原始风速序列共包含有7279个样本,本文以前6979个样本为训练集,其余300个样本为测试集,用于对模型进行评估。利用PSO-SVR进行风速预测。
为验证模型预测性能,下面建立了5个模型进行对比:
模型1 (SVR):将风速序列直接用SVR模型进行预测。
![](//html.hanspub.org/file/37-1701510x86_hanspub.png?20240417093713507)
Figure 4. Sample entropy for K values
图4. K值所对应的样本熵
![](//html.hanspub.org/file/37-1701510x87_hanspub.png?20240417093713507)
Figure 5. The subsequence after the VMD is decomposed
图5. VMD分解后的子序列
![](Images/Table_Tmp.jpg)
Table 1. The entropy of each modal component sample decomposed for the first time
表1. 首次分解的各模态分量样本熵
模型2 (PSO-SVR):先用PSO优化算法对SVR模型进行优化,然后再预测风速序列。
模型3 (VMD-SVR):用VMD算法分解风速序列,并将其子序列分别以SVR模型预测。
模型4 (VMD-PSO-SVR [22] ):用VMD算法分解风速序列,并将其子序列作为原始数据,分别以PSO-SVR模型预测。
模型5 (本文模型):将风速序列用VMD算法进行分解,然后对每个序列计算样本熵值,对复杂程度比较高的进行二次分解,用PSO-SVR模型预测。
![](//html.hanspub.org/file/37-1701510x88_hanspub.png?20240417093713507)
Figure 6. The sequence obtained after secondary decomposition
图6. 经过二次分解后得到的序列
![](//html.hanspub.org/file/37-1701510x89_hanspub.png?20240417093713507)
Figure 7. Comparison of the results of the five models
图7. 五种模型结果对比
![](Images/Table_Tmp.jpg)
Table 2. Comparison of prediction errors
表2. 预测结果误差对比
将预测结果与实际值对比,其风速预测结果如图7所示。5种模型评价指标结果如表2所示。
由图6可知,对比SVR与VMD-SVR、PSO-SVR、VMD-PSO-SVR以及本文模型,组合模型所得结果均优于SVR,所以对非线性时间序列进行分解选择组合模型效果相对单一模型要好,在组合模型的比较中,可以明显看出本文提出的模型优于其他三种模型。通过表2的结果,可以直接观察到在二次分解下,本文模型的预测效果明显优于一次分解下的效果。石柱等人 [22] 采用了VMD-PSO-SVR模型的预测方法进行了相似研究,在他们研究中预测结果的MAPE与RMSE得到明显改善,优于EMD和EEMD,提高了负荷预测的准确率。根据该文章的模型得到的MAE、RMSE、MAPE、SMAPE四个指标分别为2.63615 m/s、3.62138 m/s、50.3620%、32.6804%。对比VMD-PSO-SVR模型和VMD-SVR模型,发现在MAE、RMSE、MAPE、SMAPE四个指标上,优化后的模型相比之下分别减少了0.23498%、0.36914%、9.2844%、2.1994%;对比本文模型和VMD-PSO-SVR模型,发现在MAE、RMSE、MAPE、SMAPE四个指标上,本文模型相比之下分别减少了0.12528 m/s、0.31553/s、23.5757%、5.2497%。因此,本文提出的分解方法能够有效提高风速预测的精准度。
这一比较结果表明,采用本文提出的分解方法可以在风速预测方面获得更为准确的结果,相较于文献 [22] 和其他模型表现更为优越。这为在实际应用中选择适当的风速预测模型提供了有力的支持,尤其是在需要更高预测精度的应用场景中。
5. 结论
由于风能具有很强的随机性,风速组合模型预测已成为一个广泛研究的课题。本文研究提出了一种新型的二次分解复合预测模型VMD-SE-CEEMDAN-PSO-SVR。首先利用VMD对数据分解的到子序列,随后用SE计算序列的复杂性,对复杂程度较高的序列用CEEMDAN进行二次分解,然后将这两次分解的子序列采用优化后的PSO-SVR模型进行预测,最后用评价指标分析模型的精确度。本文完成了如下工作:
1) 针对强波动、预测难度大的问题,提出基于SE大小来决定二次分解的序列。这一方法很大程度上降低数据的随机程度,提高预测结果的精准性,与VMD分解和PSO-SVR相结合的模型比较,平均绝对误差减少了4.8%。
2) 用样本熵的方法判断VMD中K的值,避免了中心频率确定K值所存在的偶然性。样本熵确定K值更加方便、直观。
3) 通过这几种模型与本文模型相对比,结果表明本文所提的预测模型更加具有可行性,很大程度上减小误差,提高预测精准度。
综上所述,这次研究显示了本文模型的优势,在接下来的研究中还可以从:通过MSOPSO来优化SVR参数,或者利用季节性气候数据来入手,进行更加深入的研究。
基金项目
大学生创新创业项目22Z071;国家自然科学基金项目资助(51877161)。
NOTES
*通讯作者。