基于机理与数据驱动建模的自适应控制
Adaptive Control Based on Mechanism and Data-Driven Modeling
DOI: 10.12677/ojtt.2025.141007, PDF, HTML, XML,   
作者: 赵钰钰:山东交通学院轨道交通学院,山东 济南
关键词: 路径跟踪模型预测自适应控制Path Tracking Model Prediction Adaptive Control
摘要: 针对无人驾驶观光车在路径跟踪过程中难以精确控制的问题,提出了一种基于机理与数据驱动的车辆运动模型的路径跟踪自适应控制算法。首先,提出一种基于机理模型与数据驱动的车辆运动模型。其次,使用改进了的ARX模型的参数辨识方法对误差进行了补偿。然后,设计了自适应路径跟踪控制方案,即求解目标函数准则函数,得到当前系统的最优控制律。最后,仿真结果表明设计路径跟踪自适应控制方案响应速度较快,且稳定性强。
Abstract: Aiming at the difficulty of precise control in the course of path tracking of unmanned sightseeing vehicles, a path tracking adaptive control algorithm based on mechanism and data-driven vehicle motion model was proposed. Firstly, a vehicle motion model based on mechanism model and data drive is proposed. Secondly, the error is compensated by the improved parameter identification method of ARX model. Then, the adaptive path tracking control scheme is designed, that is, the objective function criterion function is solved, and the optimal control law of the current system is obtained. Finally, the simulation results show that the adaptive control scheme designed for path tracking has fast response speed and strong stability.
文章引用:赵钰钰. 基于机理与数据驱动建模的自适应控制[J]. 交通技术, 2025, 14(1): 50-58. https://doi.org/10.12677/ojtt.2025.141007

1. 引言

随着无人驾驶技术的快速发展,一些无人驾驶控制系统在许多领域逐渐发展为主力,无人驾驶观光车在市场需求方面表现出极大的潜力,已成为许多公司研发和生产的领域。路径跟踪是无人驾驶汽车运动控制模块的基本组成部分,其控制算法直接影响着路径跟踪效果。无人观光车的路径跟踪控制技术可大致分为三类:基于经典控制理论的控制方法、基于智能控制理论的控制方法和基于现代控制理论的控制方法[1]。文献[2]中分析了不同工况下路径跟踪算法的原理、优缺点、应用及目前的研究进展。

基于动力学模型的控制方法能够更准确地表征车辆系统的实际特性,提升控制的精度和稳定性,主要有LQR控制方法[3]和MPC控制方法[4]。MPC在轮式机器人的路径跟踪控制中得到了积极的研究,参见[5]进行全面综述。Awad等[6]基于具有模糊逻辑切换系统的多输入多输出线性模型预测控制(LMPC),提出了一种用于自动驾驶车辆的集成路径跟踪控制策略。文献[7]中采用tube-based MPC的控制方法,以保证存在干扰和模型偏差的情况下满足状态和输入约束,提高跟踪控制精度,但该类方法求取多维集合的时间复杂度成本较高难以满足实时性要求。文献[8]中设计鲁棒控制律并构建上层多目标约束RMPC控制器,提高了跟踪精度。Jie Wang等[9]将基于高斯过程(GP)的学习和反馈线性化(FBL)与模型预测控制(MPC)相结合(GP-FBLMPC),可泛化地减少不同路径的路径跟踪误差。Carlucho等[10]提出一种基于强化学习的自适应MIMO-PID控制算法,对控制系统的参数进行补偿和估计。文献[11]中提出了一种自适应学习MPC控制方法,利用递归最小二乘方法估计未知系统参数,提高预测精度,但文中并未考虑车辆系统本身存在执行偏差、定位误差等因素对实际控制的影响。王文娟等[12]人则提出了一种结合径向基神经网络(RBF)和滑模控制的自适应控制律,通过降低切换增益来提高移动机器人和车辆平台路径跟踪控制的稳定性。文献[13]设计了一种自适应滑模控制器,减少了传统滑模控制的高频振荡现象,提高了控制器的平滑性和稳定性。考虑到机器人模型不确定会对跟踪精度产生影响,文献[14]将移动机器人实际运行中不可避免因素考虑在内,自适应调整运动学模型,提高了跟踪精度。文献[15]设计了一种自适应控制器,将路径评价函数的结果作为BP神经网络的输入,控制增益作为BP神经网络的输出,实现了控制器的自适应控制,显著提升了轨迹跟踪精度。

本文针对无人驾驶观光车跟踪过程中存在误差且数据驱动建模会受采集数据波动影响,首先利用过往输入输出建立有源自回归(Auto-Regressive with Extra Inputs, ARX)误差补偿模型,并改进了递推最小二乘遗忘因子法,设计了基于数据驱动误差补偿的后的机理模型。基于上述模型设计了路径跟踪自适应控制方案,最后通过仿真验证了所设计的路径跟踪自适应控制方案有效性。

2. 基于机理与数据驱动的车辆运动模型

由于园区内无人驾驶观光车的运动速度较低,且后轮为非转向轮,不易出现侧滑现象,因此选取后轴中点的运动轨迹来代替汽车的运动轨迹,建立如图所示的两驱车模型示意图。

Figure 1. Schematic diagram of two-wheel drive mechanism model

1. 两驱车机理模型示意图

图1中,xy分别表示车辆后轴中点的横坐标和纵坐标,v表示车辆速度, ψ 表示车身角, δ f 表示汽车前轮转角,L表示前后轮之间的轴距。上图所示车辆运动学模型离散化处理后方程可表示为:

x( k+1 )=x( k )+vcos( ψ( k ) )T y( k+1 )=y( k )+vsin( ψ( k ) )T ψ( k+1 )=ψ( k )+ v( tan( δ f ( k ) ) )T L (1)

式中:T表示控制周期。

由于车辆机理模型与实车之间存在误差,本文采用车辆机理模型与数据驱动建模相结合的方式,采用数据驱动的方法对该误差进行补偿。

Y ^ ( k ) k时刻基于机理与数据驱动的运动车辆模型输出, U( k ) k时刻运动车辆模型输入, E ^ ( k+1 ) k + 1时刻模型估测误差。则机理模型为与 Y ^ ( k ) U( k ) 相关的函数,表示为 F( Y ^ ( k ),U( k ) ) ;误差补偿模型为与 E ^ ( k ) U( k ) 相关的函数,表示为 f( E ^ ( k ),U( k ) ) ,因此基于机理与数据驱动的运动车辆模型可如下表示:

Y ^ ( k+1 )=F( Y ^ ( k ),U( k ) )+f( E ^ ( k ),U( k ) ) (2)

模型结构如图2所示:

Figure 2. Mechanism and error compensation model structure diagram

2. 机理 + 误差补偿模型结构图

其中, Y ^ ( k+1 ) 为基于机理与数据驱动的运动车辆模型的预测输出。误差补偿模型如下所示:

E ^ ( k+1 )= i=1 n a A i ( k+1 ) E ^ ( k+1i ) + j=1 n b B j ( k+1 )U( k+1j ) (3)

其中 E ^ ( k+1 )= [ e ^ x ( k+1 ), e ^ y ( k+1 ), e ^ ψ ( k+1 ) ] T ,为k时刻采用ARX模型对车辆运动学模型进行误差补偿预测的车辆运动学模型的输出误差。 U( k )= [ v( k ), δ f ( k ) ] T ,为k时刻的输入。 n a n b 分别对应输出输入对应的阶次,采用AIC (Akaike Information Criterion)确定该模型的阶次。 A i ( k+1 ) B j ( k+1 ) 为时变未知参数。

由上述可得,基于机理与数据驱动的运动车辆模型可如下表示:

Y ^ ( k+1 )=F( Y ^ ( k ),U( k ) )+ i=1 n a A i ( k+1 ) E ^ ( k+1i ) + j=1 n b B j ( k+1 )U( k+1j ) (4)

为学习误差补偿模型参数,基于遗忘因子法,提出了如下性能指标:

J=[ i=1 k β ki ( E( i ) ϕ T ( i ) θ ^ k ) 2 ]+η ( θ ^ ( k )θ( k1 ) ) 2 (5)

其中, η>0 ,是一个权重因子,用来限制估计参数的变化。

基于上述指标可得参数在线学习规则,即

{ θ ^ ( k )= θ ^ ( k1 )+ K 1 ( k )( E( k ) ϕ k T θ ^ ( k1 ) )+ K 2 ( k )( θ ^ ( k1 ) θ ^ ( k2 ) ) P k = ( ημη+μ P k1 1 +ϕ( k ) ϕ T ( k ) ) 1 K 1 ( k )= P k ϕ k K 2 ( k )= P k μη (6)

由于实际中所处理的信号都是数字信号,所以将模型(1)的非线性项进行线性化处理。模型线性形式可表示为:

Y( k+1 )=Y( k )+ B ˜ ( k )U( k )+C( k ) (7)

B ˜ ( k ) C( k ) 分别为模型线性化后的参数矩阵与时变常数项矩阵,如下表示。

B ˜ ( k )=[ Tcos( ψ( k ) ) 0 Tsin( ψ( k ) ) 0 Ttan( δ f ( k1 ) ) L v( k1 )T( 1 tan 2 ( δ f ( k1 ) ) ) L ] (8)

C( k )=[ 0 0 δ f ( k1 ) v( k1 )T( 1 tan 2 ( δ f ( k1 ) ) ) L ] (9)

车辆线性系统离散模型可以表示为:

Y ^ ( k+1 )= Y ^ ( k )+ B ˜ ( k+1 )U( k )+C( k )+ i=1 n a A i ( k+1 ) E ^ ( k+1i ) + j=1 n b B i ( k+1 )U( k+1i ) (10)

3. 自适应控制器设计

根据上述模型,采用车辆实时状态与模型输出构建基于机理与数据驱动的车辆在线学习模型,并基于该模型设计车辆的自适应控制系统,如下图3所示:

Figure 3. Adaptive path tracking control system block diagram

3. 自适应路径跟踪控制系统框图

对于离散时间系统,对一步向前预报误差准则函数进行最小化后推理得到的控制算法存在使得控制输入过大的可能,进而使得控制器对系统本身无法控制或者系统本身的稳定性遭到破坏,而由对一步向前预报误差准则函数进行最小化加权处理得到的算法则又存在使得系统产生无法调节的稳态误差,从而影响系统的性能。因此为解决上述问题,设计如下控制器优化指标:

J( U( k ) )= Y * ( k+1 )Y( k+1 ) 2 +λ U( k )U( k1 ) 2 s.t. U < U MAX (11)

其中, λ>0 是一个权重因子,用来限制控制输入量的变化; Y * ( k+1 ) 为目标轨迹点以及期望航向角, U MAX =[ v MAX , δ f MAX ] 为最大车辆速度和前轮转向角。通过求解目标函数准则函数,得到当前系统的最优控制律。该设计以最小化车辆位置与参考路径点偏差为控制目标,通过控制车速v与前轮转角 δ f 实现路径跟踪的控制,其中位置误差包括车辆与参考轨迹的横纵坐标误差和航向角误差。

基于上述优化指标可得如下控制律:

U( k )= [ ( B ˜ ( k ) B 1 ( k+1 ) ) T ( B ˜ ( k ) B 1 ( k+1 ) )+λI ] 1 { [ ( B ˜ ( k ) B 1 ( k+1 ) ) T B 2 ( k+1 )+λI ]U( k1 ) + ( B ˜ ( k )+ B 1 ( k+1 ) ) T [ Y * ( k+1 ) Y( k )C( k ) A 1 ( k+1 ) E ^ ( k ) A 2 ( k+1 ) E ^ ( k1 ) ] } (12)

4. 仿真验证

4.1. 基于机理与数据驱动的运动车辆模型的建立

依据AIC信息准则,通过仿真对比实验确定了模型的输入输出阶次 n a =2 n b =2

从上文可知递推最小二乘遗忘因子法辨识ARX模型需要设置的参数为 μ μ 为损失乘以一个权重,当新数据到来时,更新模型。本设计改进了递推最小二乘遗忘因子法辨识ARX模型,在递推最小二乘遗忘因子法的参数估算性能指标中加入了限制参数变化的权重项,因此需要调节参数 μ ,一个权重因子 η>0 。根据经验确定遗忘因子范围为 μ=0.95~1 。将 μ 从1以0.1为补偿逐步递减到0.95,然后观察不同遗忘因子对建模的影响,即观察模型输出平均绝对误差。

此时模型输出平均绝对误差对比数据如表1所示:

Table 1. Different forgetting factors correspond to the average absolute error of model output

1. 不同遗忘因子对应模型输出平均绝对误差

遗忘因子

MAE( x ^ ,x ) (m)

MAE( y ^ ,y ) (m)

MAE( ψ ^ ,ψ ) (m)

求和

1

0.1357

0.8813

0.0697

1.0866

0.99

0.1372

0.0814

0.0198

0.2384

0.98

0.1372

0.0455

0.0158

0.1986

0.97

0.1376

0.0351

0.0131

0.1858

0.96

462.9658

83.3772

141.0809

687.4238

0.95

9223.2

12,617

204.2373

22,044

由表中数据可得遗忘因子 μ=0.97 时模型平均绝对误差最小,遗忘因子选取值的大小,直接关系到参数辨识的稳定性,遗忘因子越大参数越稳定,但是响应速度越慢来慢,实时性差,遗忘因子小,参数辨识结果波动大,但是响应速度快,模型精度高。

综合上所述,取模型输出平均绝对误差最小对应参数,最小二乘遗忘因子法参数设置 μ=0.97 ,改进的最小二乘遗忘因子法参数设置为 μ=0.95 η=0.00000000001 。下文将及此参数作对比仿真实验。

4.2. 跟踪控制效果

考虑到园区内观光车低速行驶,因此本节规划两条目标速度为10 km/h的曲线和直线参考路径。参考路径起点设置为 ( x * ( 1 ), y * ( 1 ) )=( 0,0 ) ,曲线参考路径起始航向角为 ψ * ( k )= 1.8 ,直线参考路径 ψ * ( k )= 0 。为考察控制器的性能,仿真中将跟踪初始条件设为 ( x( 1 ),y( 1 ) )=( 0,1 ) ,跟踪曲线参考路径时车辆起始航向角为 ψ( 1 )= 1.8 ,跟踪直线参考路径时 ψ( 1 )= 0 。初始控制输入为 U( k )= [ 10,0 ] T N同样设为1073。使用控制输入准则函数,输入准则函数参数为 λ=0.5 ρ=1 ,估算准则参数为 μ=0.95 η=0.00000001

为验证基于机理与数据驱动的车辆运动模型的自适应控制方案的可行性,针对无人驾驶观光车路径跟踪控制问题,与基于坐标补偿的MFAC方案[16]作对比,控制参数采用PDD算法估算未知参数,估算准则参数为权重因子 ς=1 ,步长因子 ϑ=1 τ= 10 5 ,坐标补偿参数为 ζ=0.01 。控制方案在园区内低速场景下的仿真对比实验,并给出路径跟踪效果。路径跟踪效果如下图所示:

图4(a)图4(c)可以看出本文设计的自适应路径跟踪控制器不存在稳态误差问题,均从偏差1 m处跟踪直线和曲线路径,且跟踪结果均在纵向位移40 m左右就到达参考路径附近,在60 m左右时便无明显波动。图4(b)图4(d)可以看出,基于坐标补偿的MFAC路径跟踪控制同样也在偏差1 m处跟踪直线路径和曲线路径,均在纵向位移180 m左右才到达参考路径附近。通过对比可得,本文所设计自适应路径跟踪控制算法相较于MFAC控制算法而言响应更加快速。

(a) (b)

(c) (d)

Figure 4. Curve track tracking effect diagram

4. 曲线轨迹跟踪效果图

综合分析可知,本文设计的自适应跟踪控制方案比基于坐标补偿的MFAC路径跟踪控制方案的曲线路径跟踪效果更好。

4.3. 跟踪控制抗干扰实验

该实验将车辆运动学模型输出的模拟实车数据不定时加入当前数据噪声,以此模拟实际控制中由于信号较差、电磁干扰等因素造成的传感器数据波动情况。在上述模拟条件基础上,更改车辆跟踪初始条件设为 ( x( 1 ),y( 1 ) )=( 0,0 ) ,对比本文所提基于机理与数据驱动的车辆运动模型的自适应控制方案与基于坐标补偿的MFAC方案作的路径跟踪效果,进而分析两种算法的抗干扰性能。

图5(a)所示车辆的跟踪偏差,可知所提自适应路径跟踪控制加入噪音前后对横纵坐标偏差影响不明显,造成横向角的波动在0.0015 rad左右。由图5(b),可知基于坐标补偿的MFAC路径跟踪控制加入噪音前后对横纵坐标偏差影响较为明显,造成横向角的波动在0.002 rad左右。对比图5(c)图5(d)可得,加入噪音后本设计的自适应路径跟踪控制输出波动更小,且对噪音造成的扰动本文设计自适应路径跟踪控制器可以更快地重新收敛。综上所述,该自适应路径跟踪控制方案抗干扰能力更强。

(a) (b)

(c) (d)

Figure 5. Trajectory tracking controls front wheel Angle and speed

5. 轨迹跟踪控制前轮转角和速度

5. 结论

针对无人驾驶车的路径跟踪过程中存在车辆参数复杂,且传感器数据会有波动的问题,设计了路径跟踪自适应控制方案。首先,对观光车的机理模型进行了ARX误差补偿建模。在模型参数估计上改进了递推最小二乘遗忘因子法,以提高模型的准确性和稳定性。其次,设计了路径跟踪自适应控制方案,通过求解目标函数准则函数,得到当前系统的最优控制序列。最后,通过仿真实验对比路径跟踪效果,该设计补偿模型响应速度快,精度高,跟踪效果更好,抗干扰能力更强,验证了本文所设计的路径跟踪自适应控制方案的有效性。

参考文献

[1] 《中国公路学报》编辑部. 中国汽车工程学术研究综述∙2017[J]. 中国公路学报, 2017, 30(6): 1-197.
[2] 陈耀庭, 郑燕萍. 无人驾驶汽车路径跟踪算法研究综述[J]. 林业机械与木工设备, 2023, 51(6): 21-26+35.
[3] Yang, T., Bai, Z., Li, Z., Feng, N. and Chen, L. (2021) Intelligent Vehicle Lateral Control Method Based on Feedforward + Predictive LQR Algorithm. Actuators, 10, Article No. 228.
https://doi.org/10.3390/act10090228
[4] Choi, Y., Lee, W., Kim, J. and Yoo, J. (2021) A Variable-Sampling Time Model Predictive Control Algorithm for Improving Path-Tracking Performance of a Vehicle. Sensors, 21, Article No. 6845.
https://doi.org/10.3390/s21206845
[5] Yu, S., Hirche, M., Huang, Y., Chen, H. and Allgöwer, F. (2021) Model Predictive Control for Autonomous Ground Vehicles: A Review. Autonomous Intelligent Systems, 1, Article No. 4.
https://doi.org/10.1007/s43684-021-00005-z
[6] Awad, N., Lasheen, A., Elnaggar, M. and Kamel, A. (2022) Model Predictive Control with Fuzzy Logic Switching for Path Tracking of Autonomous Vehicles. ISA Transactions, 129, 193-205.
https://doi.org/10.1016/j.isatra.2021.12.022
[7] Mata, S., Zubizarreta, A. and Pinto, C. (2019) Robust Tube-Based Model Predictive Control for Lateral Path Tracking. IEEE Transactions on Intelligent Vehicles, 4, 569-577.
https://doi.org/10.1109/tiv.2019.2938102
[8] 胡杰, 陈锐鹏, 张志豪, 等. 基于RMPC的自动驾驶货车路径跟踪控制[J]. 汽车工程, 2023, 45(11): 2092-2103.
[9] Wang, J., Fader, M.T.H. and Marshall, J.A. (2023) Learning‐Based Model Predictive Control for Improved Mobile Robot Path Following Using Gaussian Processes and Feedback Linearization. Journal of Field Robotics, 40, 1014-1033.
https://doi.org/10.1002/rob.22165
[10] Carlucho, I., De Paula, M. and Acosta, G.G. (2020) An Adaptive Deep Reinforcement Learning Approach for MIMO PID Control of Mobile Robots. ISA Transactions, 102, 280-294.
https://doi.org/10.1016/j.isatra.2020.02.017
[11] Zhang, K., Sun, Q. and Shi, Y. (2021) Trajectory Tracking Control of Autonomous Ground Vehicles Using Adaptive Learning Mpc. IEEE Transactions on Neural Networks and Learning Systems, 32, 5554-5564.
https://doi.org/10.1109/tnnls.2020.3048305
[12] 王文娟, 李俊. 一种RBF神经网络的直接自适应滑模轨迹跟踪控制设计[J]. 机械设计与制造, 2020(11): 183-187.
[13] Yang, Q., Ma, X., Wang, W. and Peng, D. (2022) Adaptive Non-Singular Fast Terminal Sliding Mode Trajectory Tracking Control for Robot Manipulators. Electronics, 11, Article No. 3672.
https://doi.org/10.3390/electronics11223672
[14] Mirzaeinejad, H. (2019) Optimization-Based Nonlinear Control Laws with Increased Robustness for Trajectory Tracking of Non-Holonomic Wheeled Mobile Robots. Transportation Research Part C: Emerging Technologies, 101, 1-17.
https://doi.org/10.1016/j.trc.2019.02.003
[15] 许万, 周航. 基于路径评价模型的自适应轨迹跟踪控制[J]. 计算机工程与应用, 2023, 59(24): 336-344.
[16] 侯忠生, 董航瑞, 金尚泰. 基于坐标补偿的自动泊车系统无模型自适应控制[J]. 自动化学报, 2015, 41(4): 823-831.