基于改进麻雀搜索算法优化LSTM网络的城市轨道交通短时客流预测
Optimization of Short-Term Passenger Flow Forecast Based on Improved Sparrow Search Algorithm in LSTM Network
摘要: 准确预测城市轨道交通短时客流,对于制定客流组织方案、合理分配运输资源等具有重要意义。针对短时客流预测精度问题,提出一种基于改进麻雀搜索算法(ISSA)优化长短时记忆神经网络(LSTM)的短时客流预测方法。首先,在麻雀搜索算法的基础上,引入混沌映射与柯西变异,提出ISSA算法,用于提升麻雀搜索算法的全局搜索与局部寻优能力,克服标准麻雀算法易陷入局部最优值的问题。其次,利用ISSA算法对LSTM神经网络的学习率、迭代次数、第一隐层节点数和第二隐层节点数这四个关键参数进行寻优。最后,以寻优结果重构LSTM神经网。利用广州某地铁站自动检票系统(AFC)采集的客流数据,对ISSA-LSTM模型的有效性进行验证。实验结果表明:该模型的均方根误差、平均绝对误差,平均绝对百分比误差和决定系数分别为4.8306、5.1435、1.5445%、99.1117%。ISSA-LSTM模型的预测效果均优于MLP模型、LSTM模型和SSA-LSTM模型。本文提出的ISSA-LSTM模型可有效降低神经网络参数对于预测精度的影响,提高预测精度,同时也对城市轨道交通运营管理服务精度进行提升。
Abstract: Accurately predicting short-term passenger flow in urban rail transit is of great significance for formulating passenger flow organization plans and reasonably allocating transportation resources. A short-term passenger flow prediction method based on improved Sparrow Search Algorithm (ISSA) optimized Long Short Term Memory Neural Network (LSTM) is proposed to address the accuracy issue of short-term passenger flow prediction. Firstly, based on the sparrow search algorithm, chaotic mapping and Cauchy mutation are introduced to propose the ISSA algorithm, which is used to improve the global search and local optimization capabilities of the sparrow search algorithm and overcome the problem of standard sparrow algorithms easily falling into local optima. Secondly, the ISSA algorithm is used to optimize the four key parameters of the LSTM neural network: learning rate, number of iterations, number of nodes in the first hidden layer, and number of nodes in the second hidden layer. Finally, the LSTM neural network is reconstructed based on the optimization results. This paper verifies the effectiveness of the ISSA-LSTM model using passenger flow data collected by the Automatic Fare Collection System (AFC) of a subway station in Guangzhou. The experimental results show that the root mean square error, average absolute error, average absolute percentage error, and determination coefficient of the model are 4.8306, 5.1435, 1.5445% and 99.1117%, respectively. The prediction performance of ISSA-LSTM model is superior to MLP model, LSTM model, and SSA-LSTM model. The ISSA-LSTM model proposed in this article can effectively reduce the impact of neural network parameters on prediction accuracy, improve prediction accuracy, and also improve the accuracy of urban rail transit operation and management services.
文章引用:陈俊杰, 颜树成, 王昌友. 基于改进麻雀搜索算法优化LSTM网络的城市轨道交通短时客流预测[J]. 传感器技术与应用, 2024, 12(3): 380-390. https://doi.org/10.12677/jsta.2024.123041

1. 引言

城市轨道交通作为现代通勤的首选方式,具有时效性高、便利性强和运量大的特点,已成为解决城市交通问题的新方式,截止2022年,我国内地共计新增城轨交通运营线路长度1085.17 km,新增运营线路25条 [1] 。随着城市轨道交通运营里程的增加,准确的客流预测能让城市轨道交通管理者掌握线路客流情况、合理调整列车运行方案,对运力资源进行合理分配,同时给居民出行提供参考。由于客流环境受多种因素的影响,中长期客流预测没法精确地把控城市轨道交通客流的动态转变趋向。因此需要短时客流预测来对客流变化规律进行把控,更好地管理城市轨道交通相关工作,协调路网线路关系。

目前,国内外学者对于短时客流预测方法的研究主要分为三类:线性模型 [2] [3] [4] 、非线性预测模型 [5] 和神经网络模型 [6] [7] [8] 。单一预测方法不足以应对当下复杂客流情况,基于当下庞大的客流数据与影响客流因素复杂多样化的特点,组合神经网络模型 [9] [10] [11] 逐渐成为学者们在短时客流预测领域研究的焦点。许心越等提出了一种结合时空修正的短时客流预测方法,它融合了动态因子模型(DFM)和支持向量机(SVM),不仅更为全面考虑到客流数量和客流趋势的变化,还能准确地对多个车站的异常时段进行识别 [12] 。段中兴等提出了一种短时客流预测模型IBA-LSTM,该模型通过改进蝙蝠算法(IBA)来优化长短期记忆(LSTM)神经网络,有效降低了模型参数对于预测精度的影响 [13] 。蒲悦逸等使用CNN-ResNet-LSTM模型在传统模型的基础上实现了更高的准确率,同时减少模型使用的参数 [14] 。HE等提出了一种地理加权套索(Ada-GWL)框架来建模预测地铁客流量,该框架涉及回归协同收缩和局部模型选择 [15] 。它考虑了地铁网络的布局,采用了基于网络的距离度量,考虑多站点之间存在的协同影响。岂常禄等构建混合地理加权回归(MGWR)模型,考虑对客流量影响因素的类型划分,得出MGWR模型相对于OLS模型预测精度更高 [16] 。

综上所述,本文提出一种基于改进麻雀搜索算法与长短期记忆神经网络相结合的ISSA-LSTM模型对城市轨道交通短时客流数据进行预测。针对麻雀搜索算法在寻优过程中易陷入局部最优解的问题,通过引入混沌映射和柯西变异对麻雀搜索算法进行优化,使得SSA算法在陷入局部最优空间后能及时跳出,避免陷入局部最优。同时为防止单隐层的LSTM网络进行预测时易出现过拟合的现象,本文增加了一层LSTM神经网络隐层。利用改进麻雀搜索算法在参数寻优时的优点,对LSTM神经网络的学习率、迭代次数、第一隐层节点数、第二隐层节点数这四个参数进行优化寻参,得到LSTM神经网络的最佳参数。本文提出的改进算法能够降低参数给预测模型精度带来的影响,并减小预测误差、提高预测精度。

2. 预测算法

2.1. LSTM网络

长短期记忆神经网络(Long Short-Term Memory neural network, LSTM)是一种改进递归神经网络(Recurrent neural network, RNN),用于解决处理长序列数据时出现梯度爆炸问题,LSTM神经网络是通过引入“时序”概念对递归神经网络进行改进的。它在处理时间序列数据时,通过利用之前的输出来影响当前的输入,能够有效地捕捉时间序列中的长期依赖关系,使得模型能够更好地理解和预测时间顺序上的数据变化。

LSTM由输入层、多个LSTM层和输出层构成。每个LSTM层包含一个“记忆单元”,是LSTM的核心。记忆单元由输入门、输出门、遗忘门和记忆细胞四部分组成。图1为LSTM基本结构。

Figure 1. LSTM basic structure

图1. LSTM基本结构

2.2. 改进麻雀搜索算法

2.2.1. SSA算法

麻雀搜索算法是一种新型群智能优化算法,由XUE等 [17] 提出。该算法灵感源于麻雀的捕食行为和反捕食行为。在算法中,麻雀种群被分为发现者和加入者两类。在自然状态下,不同个体相互监视,并且加入者会争夺资源较高的同伴的食物保有资源,以提高自身的捕食率。同时,所有个体都对周围环境保持警惕,防止天敌的到来。麻雀搜索算法通过适应度函数计算麻雀种群的适应度值,从而实现角色和位置的变换,避免传统优化算法陷入局部最优解的问题。

X = [ x 1 1 x 1 2 x 1 d x 2 1 x 2 2 x 2 d x n 1 x n 2 x n d ] (1)

G X = [ g ( [ x 1 1 x 1 2 x 1 d ] ) g ( [ x 2 1 x 2 2 x 2 d ] ) g ( [ x n 1 x n 2 x n d ] ) ] (2)

X i , j i t e r + 1 = { X i , j exp ( i α i t e r max ) R 2 < S T X i , j + Q L R 2 > S T (3)

X i , j i t e r + 1 = { Q exp ( X w o r s t X i , j i t e r i 2 ) i > n 2 X p i t e r + 1 + | X i . j X p i t e r + 1 | A + L (4)

X i , j i t e r + 1 = { X b e s t i t e r + β | X i , j i t e r X b e s t i t e r | f i < f g X i , j i t e r + K [ X i , j i t e r X w o r s t i t e r ( f i f w ) + ε ] f i = f g (5)

式(1)中,X为混沌映射初始化的麻雀种群;x表示种群内个体;n表示种群内个体数;d表示空间的维度大小,与LSTM神经网络待优化参数个数相同。式(2)中,Gx麻雀种群适应度矩阵;g为适应度值。(3)中,iter表示当前迭代次数;itermax为最大迭代次数; X i , j 为第i个麻雀在第j维上的位置信息,R2和ST表示预警值和安全值,Q为按照正态分布生成的随机数。式(4)中, X P 是当前迭代中的最优解位置, X w o r s t 与之相反;A为随机矩阵,每个元素赋值为1或−1。式(5)中, X b e s t 是当前全局最优位置; β 为步长控制参数; f i 为第i只麻雀的适应度值; f g 为全局最优适应值, f w 与之相反; ε 为随机非零常数。

根据公式(1)至(5)可知,麻雀种群中不断更新发现者和加入者的位置,直到达到设定的迭代阈值,找到适应度最高的麻雀,即为全局最优解。

2.2.2. SSA改进策略

从麻雀算法的迭代寻优过程可以看出,麻雀算法的寻优能力与个体质量密切相关,在觅食过程中,加入者总是能够搜索到拥有最丰富食物资源的发现者,然后从该发现者搜索到的食物资源中获取食物或者在该发现者周围进行觅食,在没有外围麻雀警戒出现天敌情况下,该位置也即是当前最佳觅食地点。即陷入局部最优空间。另外,加入者位置主要根据发现者最佳位置和最差位置进行更新,没有充分考虑种群中其他发现者所拥有的食物资源,并且由于初始位置随机情况,发现者和加入者的比例始终保持不变,所以可能在当前搜索区域内,初始位置分布不均,两方面的因素都降低了算法在全局范围内的搜索能力。

为了增强麻雀搜索算法的全局搜索能力,防止陷入局部最优空间。本文采用多策略联合改进:首先采用混沌映射对麻雀种群进行初始化,使每个麻雀均匀分布在搜索区域内,避免因分布不均造成的局部搜索最优。其次在觅食过程中,加入者总是能够搜索到拥有最丰富食物资源的发现者,加入者会在附近觅食甚至发生争夺,使得双方的身份发生改变,为避免算法陷入局部最优空间,引入柯西变异策略,在加入者中进行扰动,提升全局寻优能力,扩大搜索范围,提升全局搜索能力。

混沌映射:混沌系统指的是在确定性系统中存在着可能随机的不规则运动,是非线性动力系统固有的特性,并广泛存在于非线性系统中。混沌映射频数分布直方图用于描述混沌映射输出值的频率分布情况,如图2所示。同时混沌映射的散点图可以展示混沌序列中相邻两个值之间的关系,有助于观察混沌序列的随机性和规律性,如图3所示。

Figure 2. Random frequency histogram

图2. 频数分布直方图

Figure 3. Scatter plot

图3. 散点图

Logistic-tent混沌映射,映射过程如下:

X n + 1 = { [ r x n ( 1 x n ) + 4 r 2 x n ] mod 1 , x n < 0.5 [ r x n ( 1 x n ) + ( 4 r ) ( 1 x n ) 2 ] mod 1 , x n 0.5 (6)

对式(6)进行编码,可以看出Logistic-tent混沌映射值分布在[0,1]之间十分均匀,映射效果良好。

柯西变异:柯西分布类似于正态分布,是一种连续的概率分布,但柯西分布比正态分布引入扰动更大。采用柯西变异,在更新麻雀个体的当前最优位置时,可以生成更大范围的扰动。更容易跳出局部最优空间。从而使得麻雀算法能够更快速的收敛。

X newbest = X best + X best × Cauchy ( 0 , 1 ) (7)

改进后得到的ISSA流程如图4所示:

Figure 4. ISSA flowchart

图4. ISSA流程图

2.3. 评估指标

本文采用均方根误差(Root Mean Square Error, RMSE)、平均绝对误差(Mean Absolute Error, MAE)、平均绝对百分比误差(Mean Absolute Percentage Error, MAPE)、相关系数R四个评估指标进行误差检验,在进行误差检验时,RMSE、MAE和MAPE三个指标表示的是样本的离散程度,值越小越好;R值越大且越接近于1,则拟合回归效果越好,说明预测值与观测值之间的线性相关程度越高。

在进行模型评估时,单一评估指标结果不够全面,选取上述四种评估指标相互补充,使得对于模型评估更准确。相关数学表达式如下:

RMSE = 1 N t = 1 N ( y ^ ( t ) y ( t ) ) 2 (8)

MAE = 1 N t = 1 N | y ^ ( t ) y ( t ) | (9)

MAPE = 1 N t = 1 N | y ^ ( t ) y ( t ) y ( t ) | (10)

R ( y ^ ( t ) , y ( t ) ) = C o v ( y ^ ( t ) , y ( t ) ) V a r [ y ^ ( t ) ] V a r [ y ( t ) ] (11)

本文使用评价指标对MLP、LSTM、SSA-LSTM和ISSA-LSTM等四个模型进行对比评估,验证本文所提出模型的先进性。

3. 预测模型搭建

初始化:以LSTM网络的学习率、迭代次数、第一隐层节点数和第二隐层节点数作为优化对象。确定麻雀的种群大小、捕食空间、初始最佳捕食位置和最坏捕食位置,混沌映射使得麻雀种群中的麻雀尽量均匀分布在捕食区域内。

适应值:给LSTM算法随机赋初始变量值,确定麻雀的适应值。

Figure 5. Overall flowchart of the prediction model

图5. 预测模型整体流程图

位置变化:在更新麻雀个体位置后,计算种群中每个个体的适应度值,并保存当前种群中的最优和最差个体位置,同时边缘麻雀进行警戒,注意天敌是否出现。

扰动:引入柯西变异,对加入者位置进行扰动,判断是否陷入局部最优。在多次扰动后,最优位置不改变,即为全局最优解,否则跳转回步骤3。

优化结果输出:以ISSA算法得出的最优网络参量作为LSTM的学习率、迭代次数、第一隐层节点数和第二隐层节点数。

以最优参数重构的LSTM网络,再对数据进行预测,处理预测结果并进行误差分析。

基于ISSA-LSTM的短时客流预测模型如图5所示。

4. 算例分析

4.1. ISSA优化LSTM网络参数

图6(a)为学习率曲线,图6(b)为迭代次数曲线,图6(c)为第一隐层节点数,图6(d)为第二隐层节点数,合适的学习率能够有效提高预测精度,初始学习率取[0,0.01]之间的随机值。迭代次数设置应当适当,过少会使得预测结果精度较低,过多又会出现过拟合现象。隐层节点设置,过多会增加计算量,过少达不

(a)(b) (c) (d)

Figure 6. Optimization parameter curve; (a) Learning rate; (b) Iterations; (c) Number of nodes in the first hidden layer; (d) Number of nodes in the second hidden layer

图6. 优化参数曲线;(a) 学习率;(b) 迭代次数;(c) 第一隐层节点数;(d) 第二隐层节点数

到预测所需精度,所以这四个值在改进麻雀算法下进行寻优找到最佳值。同时,从(a)图可以看出在麻雀搜索算法的50次迭代中,学习率由于陷入局部最优,SSA无法跳出当前局部最优空间,而ISSA能在多次扰动之后,跳出最优空间,最后找寻到全局最优。表1为SSA与ISSA优化后的参数值。

Table 1. Control mode switch principles

表1. 优化网络参数结果

4.2. 预测结果

选取广州地铁历史AFC数据为研究对象,数据截取时间为7.6~7.30,每15分钟数据记为一组,每天从早上6:15开始记录数据,每天数据共68组,选择了前20天共1360组数据作为测试集,并选取了接下来的5天共340组数据作为验证集,对比四个模型预测结果。同时也单独进行了工作日(周一到周五)与双休日客流情况的预测,数据一共25天,7天为双休日,18天为工作日,均以最后一天作为验证集。图7为客流情况预测结果图,实验截取平峰数据进行局部放大。图8为工作日与双休日的预测结果图,表2为各模型的评估指标。

4.3. 结果分析

图6可以看出,改进后的ISSA在陷入局部最优空间之后,能够及时跳出当前最优空间,避免算法出现误差,同时也能看出改进后的ISSA多次跳出局部最优空间。从表1可以看出,ISSA优化的四个网络参数,相比较于传统SSA优化的四个网络参数。学习率和第二隐层节点数相差较大,从而导致了最终结果的误差。因为柯西变异的引入,ISSA的运行时间为3156秒左右,SSA运行时间为3092秒左右,时间上增加了60秒左右,增加时间用于算法扰动,但收敛速度加快。

图7可以看出,基于ISSA-LSTM的模型对于客流的预测情况与真实值拟合度更高,从任意节点看,都比其他三种算法效果更好。从图8能看出,ISSA-LSTM针对工作日与双休日进行的预测准确度都比较高,工作日客流数据会出现早晚高峰期,客流人数变化较大;双休日的客流数据总体比较平缓,呈现的是一个总体平峰,下午出现了一次小高峰现象,但总体一天客流情况总体平缓。

Figure 7. Prediction result chart

图7. 预测结果图

(a) (b)

Figure 8. Forecast results for weekend and working days; (a) Forecast results chart for weekend; (b) Workday forecast results chart

图8. 双休日与工作日预测结果图;(a) 双休日预测结果图;(b) 工作日预测结果图

Table 2. Evaluation indicators for each model

表2. 各模型评估指标

综合看来,ISSA-LSTM模型相较于其他三种模型预测精度更高,能更加准确的把握客流信息数据,对于未来客流情况能做出更准确的预测。

5. 结论

本文充分考虑相关影响因素对客流预测的影响,选择了节假日和工作日类型,并结合历史客流数据来构建输入序列,选用双隐层神经网络模型进行训练,有效地提高了预测精度。

本文通过引入混沌映射以及柯西变异对SSA进行优化,加快了麻雀算法的收敛速度,增强了算法的全局搜索能力,有效避免陷入算法陷入局部最优解。有效解决了人工调参复杂费时且预测精度不高的问题。

参考文献

[1] 侯秀芳, 冯晨, 左超, 等. 2022年中国内地城市轨道交通线路概况[J]. 都市快轨交通, 2023, 36(1): 9-13.
[2] 陈文华, 边浩毅, 王怡民, 等. 基于ARIMA模型的公路客运量预测[J]. 重庆工商大学学报: 西部论坛, 2006(5): 95-97.
[3] Ghosh, B., Basu, B. and O’Mahony, M. (2007) Bayesian Time-Series Model for Short-Term Traffic Flow Forecasting. Journal of Transportation Engineering, 133, 180-189.
https://doi.org/10.1061/(ASCE)0733-947X(2007)133:3(180)
[4] 赵鹏, 李璐. 基于ARIMA模型的城市轨道交通进站量预测研究[J]. 重庆交通大学学报(自然科学版), 2020, 39(1): 40-44.
[5] 顾青, 白国星, 孟宇, 甘鑫, 等. 基于非线性模型预测控制的自动泊车路径跟踪[J]. 工程科学学报, 2019(41): 947-954.
[6] 何必胜, 朱永俊, 陈路锋, 等. 基于时空图神经网络的高速铁路车站短期客流预测方法[J]. 铁道学报, 2022, 44(9): 1-8.
[7] 王秋雯, 陈彦如, 刘媛春. 基于卷积长短时记忆神经网络的城市轨道交通短时客流预测[J]. 控制与决策, 2021, 36(11): 2760-2770.
[8] 张亚伟, 陈瑞凤, 刘小燕. 基于门控循环神经网络的客运站客流预测[J]. 铁道运输与经济, 2022, 44(9): 96-102.
[9] 赵阳阳, 夏亮, 江欣国. 基于经验模态分解与长短时记忆神经网络的短时地铁客流预测模型[J]. 交通运输工程学报, 2020(20): 194-204.
[10] Huang, H., Mao, J.N., Lu, W.K., et al. (2023) DEASeq2Seq: An Attention Based Sequence to Sequence Model for Short-Term Metro Passenger Flow Prediction within Decomposition-Ensemble Strategy. Transportation Research Part C: Emerging Technologies, 146, 103965.
https://doi.org/10.1016/j.trc.2022.103965
[11] 孙晓黎, 朱才华, 李美妮, 等. 时间序列聚类下的城市轨道交通客流预测研究[J]. 铁道运输与经济, 2023, 45(3): 149-157.
[12] 许心越, 吴宇航, 张英男, 等. 考虑时空修正的轨道交通封站短时客流预测方法[J]. 交通运输工程学报, 2021, 21(5): 251-264.
[13] 段中兴, 温倩, 周孟, 等. 基于改进蝙蝠算法优化LSTM网络的短时客流预测[J]. 铁道科学与工程学报, 2021, 18(11): 2833-2840.
[14] 蒲悦逸, 王文涵, 朱强, 等. 基于CNN-ResNet-LSTM模型的城市短时交通流量预测算法[J]. 北京邮电大学学报, 2020(43): 9-14.
[15] He, Y.X., Zhao, Y., Tsui, K.L. (2021) An Adapted Geographically Weighted LASSO (Ada-GWL) Model for Predicting Subway Ridership. Transportation, 48, 1185-1216.
https://doi.org/10.1007/s11116-020-10091-2
[16] 岂常禄, 胡昊. 基于混合地理加权回归的城市轨道交通站点客流预测研究[J]. 铁道科学与工程学报, 2021, 18(7): 1903-1909.
[17] Xue, J.K. and Shen, B. (2020) A Novel Swarm Intelligence Optimization Approach: Sparrow Search Algorithm. Systems Science & Control Engineering, 8, 22-34.
https://doi.org/10.1080/21642583.2019.1708830