1. 引言
风,作为一种荷载,同时也是一种能量的载体。当它出现在工程结构(尤其是超高层建筑)时,就对结构物的抗风设计提出了要求。在强风的作用下,结构物如果抗风设计不合理,就会产生较大变形甚至破坏。而当风出现在风电场时,就对风电场的电力系统提出要求。如果风速过大,风电穿透功率超过一定比例之后,会严重影响电能质量和电力系统的运行。对于风速如果我们能有一个较好的预测,在未来,对于超高层建筑我们将有更为安全可靠,经济合理的设计,对于电力系统也可以使电力调度部门必要时提前调整调度计划,有效地减轻风电对电网的影响,而且还有其他诸多方面的意义。比如当风演变成为自然灾害时,对风速的预测将使我们提前做好面对灾害的准备,以将人员伤亡经济损失降到最低。因此,风速的预测应用前景广阔,研究收益极大,是值得我们不断努力,不断深入的研究方向。
2. 风速预测基本理论方法的发展历史与特点
目前的风速预测大多数是基于较高频率出现的风的观测数据进行模拟,大部分研究是为风电场服务,因此针对台风风速预测的研究较少。又因为台风引起的建筑上的风速以及一些阵风锋面上的瞬态阵风风速扣除常量平均风速后而得到的脉动风速基本不符合高斯分布 [1] ,这也给预测模型的建立带来一定的困难。台风场脉动风具有较强的非高斯特性,使得台风场阵风因子偏离了基于高斯过程假定的规范建议值 [2] 。现在对台风风速预测已有的研究大多数都是基于Monte Carlo模拟的极值风速预测 [3] 。由于是对台风极值的预测,因此在台风脉动风作用下引起的结构疲劳就无法验算。因此通过少数点的实测记录来进行条件模拟或预测,以此建立结构全尺度的实测风荷载信息也尤为重要。
目前针对风速预测主要有两大基本理论方法:神经网络(Neural Network, NN)与支持向量机(Support Vector Machine, SVM)。
2.1. 神经网络发展历史
神经元的数学模型是在1943年心理学家Mcculloch和数理逻辑学家Pitts在分析、总结神经元基本特性的基础上首先提出来的,一直沿用至今,并且直接响着这一领域研究的进展。冯·诺依曼在1948年提出了以简单神经元构成的再自动机网络结构,成为人工神经网络研究的先驱之一。50年代末,Rosenblatt设计制作了“感知机”,一种多层的神经网络,首次把人工神经网络的研究从理论探讨付诸到工程实践。而60年代末期,计算机飞速发展,神经网络的局限性随着人工智能的发展而凸显出来,因此神经网络的研究进入了低潮。随着人们对感知机兴趣的衰退,神经网络的研究沉寂了相当长的时间。80年代初期,模拟与数字混合的超大规模集成电路制作技术提高到新的水平,完全付诸实用化,这使得人工神经网络的研究出现了新的转折点。美国的物理学家Hopfield于1982年和1984年在美国科学院院刊上发表了两篇关于人工神经网络研究的论文,引起了巨大的反响,人们重新认识到神经网络的威力以及付诸应用的现实性。
2.2. 支持向量机发展历史
支持向量机的先父Vapnik在20世纪60年代完成了统计学习的基本理论结果,他于1971年和A.Chervonenkis提出了VC维理论——支持向量机的一个重要理论基础。而后的1982年,他又进一步提出了结构风险最小化原理——具有时代意义的支持向量机算法基石。1992年,Boser,Guyon和他又提出了最优边界分类器理论,这是首次使用核函数,不仅得到的解具有稀疏性,而且还没有局部最极小点的问题。统计学习理论不断地发展和成熟起来,最终,在1995年,Vapnik完整地提出了支持向量机的理论方法,并且在模式识别等人工智能领域内取得了成功的应用,因此,受到了广泛的关注。
2.3. 两者特点与区别
神经网络与支持向量机在形式上有几分相似,但实际上有很大不同。
简而言之,神经网络是个“黑匣子”,优化目标是基于经验风险最小化,易陷入局部最优,训练结果不太稳定,一般需要大样本;而支持向量机有严格的理论和数学基础,基于结构风险最小化原则,泛化能力优于前者,算法具有全局最优性,是针对小样本统计的理论。目前来看,虽然二者均为机器学习领域非常流行的方法,但后者在很多方面的应用一般都优于前者。
神经网络是基于传统统计学的基础上的。传统统计学研究的内容是样本无穷大时的渐进理论,即当样本数据趋于无穷多时的统计性质,而实际问题中样本数据往往是有限的。因此,假设样本数据无穷多,并以此推导出的各种算法很难在样本数据有限时取得理想的应用效果。
而支持向量机则是基于统计学理论的基础上的,可以克服神经网络难以避免的问题,通过支持向量机在逼近能力方面与BP网络仿真结果的比较表明 [1] ,支持向量机具有较强的逼近能力和泛化能力。支持向量机因其特有的优越性在将越来越受到各领域的重视,具有很好的应用前景。
3. 风速预测理论方法的发展
3.1. 神经网络改进与优化
神经网络经过发展,现在主要有误差反传神经网络(Error Back Propagation Neural Network, BPNN),极限学习机(the Extreme Learning Machines, ELM)两种理论方法。
BPNN具有多输出与多输入的特点,能更容易的利用于多变量非线性函数的逼近,而且,与其他网络相比,还具有结构简单、易于实现编程、学习速度可以接受以及泛化外推能力也较好的特点。
ELM的优点是为输入层权值和隐层神经元偏置随机赋值,再通过最小二乘法得到输出层权值,整个算法运行过程中不需要调整参数,只需要设定合理的隐含层节点数。因此,具有较高的学习训练速度和精度。有研究者 [4] 用ELM对训练集进行学习训练,建立回归模型,从而实现对测试集风速的泛化预测。经与基于粒子群优化的混合核函数最小二乘支持向量和误差反传神经网络对比,验证了ELM模型的有效性,无论在预测精度还是计算速度上,ELM模型都具有显著的优势。
为了改善风速时间序列的预测精度和预测时间,还有研究 [5] 提出了一种基于迟滞ELM模型的风速预测方法。通过改变神经元激励函数的方式将迟滞特性引入神经网络中,模拟的结果显示,与ELM模型相比,利用迟滞ELM模型进行短期风速预测的预测精度更高,预测时间更短,并且有效地减小风速时间序列的预测误差,提高了预测精度以及减少了预测时间,从效率上来说学习系统具有更好的误差和泛化能力。
3.2. 最小二乘支持向量机与各种智能算法
支持向量机经过发展,现在已发展出最小二乘支持向量机(Least Squares Support Vector Machine, LSSVM)。LSSVM是在SVM的基础上,采用误差的二次平方项代替SVM中的不敏感损失函数,将不等式约束改成等式约束,把二次规划问题转化为求解线性方程组问题,以提高求解速度和收敛精度,并成功地应用于函数逼近、分类以及时间序列预测等方面。
在风速预测时,最小二乘支持向量机(LSSVM)中最关键的是选取合适的核函数并对核函数中的参数进行优化,为此有许多研究者将不同的算法与LSSVM相结合,以改进并优化参数。现目前最为常用的优化算法主要有粒子群优化(Particle Swarm Optimization, PSO),蚁群优化(Ant Colony Optimization, ACO),人工鱼群优化(Artificial Fish Swarm Algorithm, AFS),遗传算法 [6] [7] (Genetic Algorithm, GA)等等,还有一种新兴的萤火虫算法(Firefly Algorithm, FA)。这些算法之间相互组合或多个组合,取长补短,以不断优化改进算法。
有研究 [8] 对LSSVM核函数进行改进,将常用的具有代表性的径向基(RBF)核函数和多项式(Poly)核函数构建出局部性和全局性相结合的线性组合核函数,并结合Morlet小波核函数,通过PSO算法优化,结果显示该核函数能大大提高脉动风速的预测精度。
PSO算法收敛速度快、参数设置少、实现简单。有研究表明 [1] ,PSO-LSSVM 的模拟值吻合程度要比BPNN预测结果高。但PSO算法易于过早收敛,搜索精度较低。
ACO算法具有较强的鲁棒性,是一种正反馈算法,的参数数目少,设置简单,易于蚁群算法应用到其它组合优化问题的求解,但基本ACO算法计算量大,求解时间长,在给定一定循环数的条件下有较大概率无法最优。
AFS算法对初值和参数选择不敏感、鲁棒性强、能克服局部极值,但后期搜索的盲目性较大,寻优精度较低。
GA算法具有良好的全局搜索能力,可以快速地将求解空间中的全体解搜索出,而不会陷入局部最优;并且利用它的内在并行性,可以方便地进行分布式计算,加快求解速度。但是其局部搜索能力较差,导致单纯的GA算法比较费时,在进化后期搜索效率较低。在实际应用中,遗传算法容易产生过早收敛的问题。
4. 人工萤火虫算法
4.1. 基本人工萤火虫算法
萤火虫算法(Firefly Algorithm, FA)是由剑桥大学Yang [9] 在2008年提出的一种新颖的仿生智能优化算法,通过模拟萤火虫觅食、择偶等习性而产生的相互因发光吸引而移动的行为来解决最优问题。萤火虫算法是基于以下三个理想化特征提出的:1) 萤火虫不分性别,即萤火虫之间的相互吸引力只考虑个体发光的亮度;2) 吸引力与发光亮度成正比,与个体之间的距离成反比;3) 萤火虫的亮度由待优化的目标函数值决定,即
。
在FA中,萤火虫彼此吸引的原因取决于两个要素,即自身亮度和吸引度。亮度小的萤火虫被亮度大的萤火虫吸引而向其移动,并更新自身位置。萤火虫的发光亮度取决于自身所处位置的目标值,亮度越高所表示的目标值越好,吸引其他萤火虫的能力也越强。若发光亮度相同,则萤火虫各自随机移动。算法的数学描述与分析如下:
定义1 萤火虫的相对荧光亮度:
(1)
式中:
为萤火虫的最大荧光亮度,即
处荧光亮度,与目标函数值有关,目标函数值约优自身亮度越高;
为光强吸收系数,因为荧光会随着距离的增加和传播媒介的吸收逐渐减弱,所以设置光强吸收系数以体现此特性,可设为常数;
为萤火虫
和
之间的空间距离,表达式为:
,
、
为萤火虫
和
所处位置,
为待优化参数的个数。
定义2 萤火虫的吸引度:
(2)
式中:
为最大吸引度,即
处吸引度。
定义3 萤火虫
被吸引向萤火虫
移动的位置更新公式:
(3)
式中:
为步长因子,是
上的常数;
为
上服从均匀分布的随机数。
萤火虫算法操作方便,实现简单,参数较少,而且参数设置对算法的影响较小。由于其特殊性,萤火虫算法不仅可以优化单峰函数和多峰函数,而且该算法具有较强的局部搜索能力,可以在一个较小的区域寻找到该区域的最优解。
但是基本萤火虫算法的缺点也很明显,算法要求在感知范围内有优秀个体提供信息,否则个体将停止搜索,降低收敛速度。当个体距离峰值非常近的时候,由于步长可能大于该距离,将导致个体在峰值附近发生震荡现象;如果步长设置较小,会导致算法迭代初期搜索能力较弱,收敛速度降低,浪费时间,同时算法也容易出现陷入局部最优的危险。
4.2. 人工萤火虫算法改进
因此,针对基本萤火虫算法存在的问题,有许多学者提出了不同的改进方法。改进的思路主要集中在如何跳出局部最优,如何提高求解精度的同时保证求解能快速收敛(如何改进步长)。
1) 张树群 [10] 在原有改进方法下,提出一种新的位置移动策略和自适应搜索步长:
原有进化模式的改进:
在算法中增加了种群最优个体的牵引作用,位置更新公式如下:
(4)
式中:
为随迭代次数增加而线性减小的吸引权重,
为当前最优萤火虫个体。
再次进行改进时,引入全局最优个体的前提下赋予它们自适应的调整因子
、
和
,改进后位置移动公式如下所示:
(5)
式(5)中:
(6)
(7)
(8)
式(6),(7),(8)中:iter为当前迭代次数,maxgen为最大迭代次数,
是调整因子的最小值,
是调整因子的最大值,在测试中取常数,
、
和
各代表着萤火虫新位置向原始位置、最优个体位置和邻域位置靠近的速度。
为平衡进化过程的收敛速度和精度,在寻优过程中采用自适应步长因子机制,调整后的
为:
(9)
式中:
初始步长因子,取
;
为第
只萤火虫与当前最优萤火虫的空间距离;
为最优萤火虫与领域萤火虫的距离最大值。
并在计算后约束 的上下限,防止超出搜索空间。
2) 刘畅等 [11] 在标准萤火虫算法的位置移动公式中,利用指数分布和韦伯分布对吸引力项进行改进,增强了算法的全局探测能力;同时利用步长单调递减模式对随机项进行改进,以增强算法后期的局部挖掘能力。
位置移动公式改进:
(10)
式中:
可取指数分布和韦伯分布。
对随机项系数
进行递减操作:
(11)
式中:
初始随机步长,
为冷却系数,
为待优化问题的问题域。
3) 刘丹等 [12] 提出为提高萤火虫算法参数寻优的能力,在训练过程中自适应调节光强吸收系数 ,并通过高斯变异提高萤火虫的个体活性。其高斯变异公式如下:
(12)
式中:
为当前最优萤火虫,
为变异后最优萤火虫,
为均值0,方差1的高斯分布随机变量。最后比较变异前后萤火虫适应度值,取两者中适应度值较佳的个体为本次迭代的
。
4) 潘晓英等 [13] 发现步长是决定算法运行速度和精度的重要因素之一,于是提出通过萤火虫种群的聚合程度动态调整步长。随着迭代进行,萤火虫之间的距离变小,步长也随之呈减小趋势。其自适应步长公式如下:
(13)
式中:
为每一代萤火虫自适应步长因子。
为萤火虫种群移动后的簇间距离和,对于一个类簇来说,它的簇间距离的和反映了该簇的聚合程度,定义如下:
(14)
式中:
由聚类中心点转换为萤火虫种群中相对亮度最大的萤火虫。
同时提出新的吸引度公式:
(15)
式中:
为
处最大吸引度,
为最小吸引度。
两者结合有利于扩大搜索范围和算法收敛速度的提高。
5) 陈海东等 [14] 将混沌搜索策略和全局思想融入到萤火虫算法中,提出一种有利于跳出局部最优的改进位置公式:
(16)
(17)
(18)
式中:
,
为混沌系数。
同时还引入全局最优思想,使用笛卡尔距离计算:
(19)
(20)
式中:
为全局最优值;
为当前萤火虫与全局最优值萤火虫之间距离。
6) 白永珍 [15] 提出参数方差调节萤火虫算法的思想:计算种群亮度的方差评估种群的敛散性,根据进程调节参数,进而达到改进萤火虫算法的目的。
7) 方必武 [16] 提出一种基于小波分解和改进的萤火虫算法优化最小二乘支持向量机超参数的风速预测模型中使用到萤火虫算法。首先利用小波变换将风速时序分解为近似序列和细节序列,然后对各序列分别利用一种新颖的混沌萤火虫算法优化LSSVM进行预测,最后将各序列预测值叠加得到最终风速预测值。在两种时间尺度的实测数据上进行仿真计算。结果表明,该算法较交叉验证的LSSVM,IPSO-LSSVM,WD-DE-LSSVM及BP神经网络等多种经典算法预测精度更高,表明了该算法的有效性和优越性。
5. 应用前景
台风引起的建筑上的风速以及一些阵风锋面上的瞬态阵风风速扣除常量平均风速后而得到的脉动风速基本不符合高斯分布。相于高斯风荷载,在非高斯风荷载的作用下,结构更容易发生疲劳破坏,因此,非高斯过程的模拟具有极为重要的研究价值和应用前景。
支持向量机与神经网络相比,应用更为广泛,可以结合的优化算法更多,选择性更强。但是神经网络也有其独特的优势,也是一个可以不断改进发展的方法。作为一种具有理论基础的算法,支持向量机有着非常大的使用范围,在风速预测中不断改进一定会有更为精确的结果。
关于支持向量机中的核函数,目前通用的核函数主要有线性核函数、多项式核函数和径向基核函数,针对不同的情况构造自己所需要的核函数会创造出更加优越的预测模型。
萤火虫算法作为新兴的智能优化算法,现在在风速模拟的领域应用还较少,就目前的研究而言,萤火虫优化算法对于提高模型精度有较好的作用一定会有比较好的研究前景。而智能优化算法与日俱增,也都在不断地改进和完善中,在风速预测中可以结合多种优化算法的优势,采取混合算法,取长补短,以达到更好的预测精度。
6. 结语
正如一开始所提及台风风速模拟的困难,当前研究模拟的脉动风速作为高斯平稳随机过程作用在超高层建筑上,这往往是理想化的风荷载,而实际上并不一定符合。具有理论基础的最小二乘支持向量机有着非常大的应用范围,而萤火虫算法虽然是新兴的智能优化算法,但经过不断的改进,其优势也不断体现出来,相信基于萤火虫算法的风速预测会有极大的应用空间。
基金项目
同济大学科研项目资助:土木工程风智能预测研究(20163617)。