1. 引言
Markov跳变系统(MJSs) [1] [2] 作为一类典型的混杂系统,已广泛应用于遇到如传感器或执行器故障、环境差异和子系统互连变化等突变的对象。近年来,由于具有广泛的应用前景,Markov跳变系统的稳定性分析、状态估计和控制问题得到了广泛的研究和讨论。同时,控制问题作为一个基础研究课题,目前的主要控制方法有模型预测控制(MPC) [3] [4] 、滑动模式控制 [5] [6] 、自适应控制 [7] 、模糊控制 [8] [9] 、最优控制 [10] 等。模型预测控制(MPC) [11] [12] 作为一种典型的数字控制策略,具有一定的控制优势,在处理多变量和硬约束控制问题方面具有显著的优势。因此,设计一种更适合Markov跳变系统的MPC策略,具有重要的理论意义和应用价值。
到目前为止,关于MPC问题 [13] [14] [15] [16] 的研究成果较多。具体来说,在线MPC策略需要在每个时刻解决一个优化问题才能获得良好的性能,但由于计算量大,初始可行域小,其应用存在一定的局限性。相反,对于离线MPC [17] ,虽然控制律是由离线优化问题决定的,可以有效减少在线计算负担,但保证系统性能的能力较弱,可能在不确定性和环境变化的情况下导致系统不稳定。对于具有多模态之间跳变特征的Markov跳变系统,在线MPC和离线MPC的上述缺点将进一步加剧。因此,对于Markov跳变系统,减少在线计算负担,扩大初始的可行域,获得更好的控制性能是我们急需解决的问题。
为了解决这一问题,提出了一种有效模型预测控制(EMPC) [18] [19] [20] [21] 策略。其主要思想是设计一个满足约束并能离线稳定系统的固定反馈控制律 [22] 。然后,引入额外的控制自由度来离线求解一个增广系统的不变集,并使该不变集在原始状态空间中的投影最大化。更准确地说,该预测控制器的设计方法通过引入额外的摄动量来提高自由度,一方面通过扩大状态空间可以扩大初始可行区域;另一方面,通过增加自由度来优化控制性能;此外,还可以采用“离线到在线”综合来降低在线计算的复杂度。有效地解决了初始可行域、在线计算和控制性能之间的矛盾。
EMPC问题已经引起了特别的关注,学者们对这个研究课题做出了很多努力,更多的细节可以参考 [23] [24] [25] [26] 。其中所采用的反馈策略主要是状态反馈。可以看出,状态反馈在各种综合问题中具有优势。但是,由于状态不易直接测量,或测量设备在经济和实践上受到限制,因此无法实现状态反馈。为了解决这一问题,可以通过重建系统的状态,用重建的状态替换真实的系统来实现所需的状态反馈。因此,设计基于观测器的EMPC算法 [27] [28] [29] [30] 是非常有意义的。然而,基于观测器的EMPC问题尚未得到充分的研究,这主要是由于在保证算法的可行性方面存在数学上的困难,以及系统重构带来的计算复杂度挑战。因此,这自然导致我们为Markov跳变系统开发一个基于观测器的EMPC策略。
2. 问题描述
2.1. 系统模型
考虑以下系统矩阵中具有多面体不确定性的离散Markov跳变系统:
(1)
其中,
和
分别是在k时刻的系统状态,控制输入,测量输出和系统模态。
和
分别是初始的系统状态和初始系统模态。
带有参数不确定的系统矩阵
和
是属于带有L个顶点的多面体集合
,可描述为
(2)
也就是说,对于任意的
和
,我们有
(3)
设
是一个概率空间,
代表样本空间,
是一个标准的σ-域,
是定义在
上的概率测度。假设参数
表示在有限状态空间
上的一个齐次Markov链,并定义以下的转移概率:
(4)
其中,
表示从
到
的转移概率并满足
和
。另外,记
为Markov链
的转移概率矩阵。因此,为了便于表示,我们定义的第i个模态
的系统矩阵为
和
。
为了更好地反映工程实际,本章考虑了以下对输入和状态的硬约束:
(5)
(6)
其中,
和
表示已知的向量,
代表矩阵的第a行(第b行)或者向量的第a个(第b个)分量。
状态观测器构造为如下形式:
(7)
其中,
和
分别是给定初始值
的估计系统状态和估计输出。
为观测器的增益,并且将在主要结论中进行求解。
2.2. 预测控制方案
针对离散时间MJS(1),在MPC框架下构造了一个模态依赖的双模控制器,构造如下:
(8)
其中,
(对应于终端约束集)是离线设计的控制器增益,
是在线设计的摄动变量,用于微调由
确定的控制输入,从而扩大初始可行域。注意到,只要系统状态进入终端约束集,则仅由
确定的容许控制就可以将系统状态作用到平衡点。
2.3. 关注的问题
在证明之前,首先提供一些必要的定义,以取得以后的结论。
定义1 [31] :如果对于任何初始条件
和初始模态
有
成立,那么在控制律(8)作用下的MJSs(1)是均方稳定的。
定义2 [1] :如果系统状态
属于
,并且任何时刻
的系统状态在容许控制输入
下也属于
,则该集合
称为控制不变集。
本文的主要目的是针对受多面体不确定性和硬约束影响的MJSs(1),设计一种模态依赖的双模控制器。具体来说,我们感兴趣的是找到反馈增益
和摄动变量,以便使得系统(1)在EMPC框架下均方稳定。
3. 主要结论
在本节中,我们的目的是根据MJSs(1)的EMPC策略设计一组理想的控制器。首先,建立目标函数及其相应的优化,得到反馈增益
和摄动变量
。然后,给出了保证系统是均方稳定的充分条件。通过较小的计算量可以得到足够大的初始可行域。
3.1. 求解终端约束集
在终端约束集中,构造了一个无摄动变量的模态依赖控制器如下:
(9)
记(1),(7),(9),定义估计误差为
和令
,该增广的预测模型可以构造为
(10)
其中,
针对受多面体不确定性影响的预测模型(10),在每次时刻
时,制定了以下无穷时域上的“最坏情况”代价函数的最小化问题来设计控制器:
(11)
其中,
;
和R是对称正定加权矩阵;
表示基于k时刻的已知的值对将来
时刻的预测值,特殊地,
。
提出了一个具有硬约束的离线优化问题来确定控制器参数:
(12)
其中,
,
是一个类Lyapunov的函数。
为了处理在系统(1)的终端约束集中起重心作用的终端代价函数条件(12),我们引入了以下引理,这是推导主要结果所必需的。
接下来,我们将尝试寻找保证终端约束集的充分条件。在进行之前,我们将引入一个辅助矩阵和一个自由矩阵,用于后续的分析。具体来说,将辅助矩阵
定义为
(13)
其中,
与(1)中定义的相同,而
代表
的零空间的正交基。引入的自由矩阵为
(14)
其中,
和
分别为对角矩阵和具有适当维数的任意矩阵。
引理1:给定对称矩阵Q和R。如果对于任意的
和
,存在正定矩阵
,正数
和实矩阵
和
,满足以下不等式:
(15)
其中,
和S的定义分别在(13)和(14),并且
那么对于任意的
和
,(12)式成立。此外,模态依赖的控制增益(9)和观测器增益(7)为
(16)
证明:选择一个类Lyapunov函数,如下:
(17)
其中,
是需要确定的对称正定矩阵。
根据(4)和
,计算预测系统模型(10)的(17)式的差分,并对结果进行取期望,我们可以得到
(18)
我们可以很容易地得到以下等式:
(19)
和
(20)
根据矩阵
,可以得到以下不等式:
(21)
(22)
将(21)和(22)代入(15),得到
(23)
其中,
根据(16),定义
,对(23)式左乘右乘
和其转置,我们可以得到
(24)
其中,
。
由于增广的预测模型(10)是多面体不确定的,i.e.不等式(24)是映射
在中的,(24)是成立的当且仅当
(25)
利用Schur补引理,很容易得到不等式(25)成立,当且仅当以下不等式成立
(26)
定义
,将(26)的两边都乘以
,我们有
(27)
将(27)的左乘右乘
及其转置,得到
(28)
因此,在(18)、(28)和
的帮助下,我们有
(29)
这意味着(12)成立。这个证明现在已经完成了。
在本小节中,由于目标函数是在无穷时域上考虑的,因此直接解决“最小–最大”问题OP1在技术上仍然是很困难。因此,有必要提出一个可解性的辅助问题。
考虑到最小化问题的性质,目标函数
应该是有界的,我们必须有
,因此必须有
。对(12)的两边从
到
取和,并利用
,我们有
(30)
定义一个集合如下:
(31)
根据(12),可以证明
是一个控制不变集。如果满足
,则我们有
(32)
这为OP1提供了性能目标的一个上界。
根据Schur补技术并令
,控制不变集条件,i.e.,
成立当且仅当
(33)
到目前为止,如果终端代价函数条件(15)、控制不变集条件(33)和硬约束(5)~(6)同时得到满足,则由(31)定义的
是一个终端约束集。特别是,如果系统状态在
内,则只需要满足条件(15),(5)和(6)。
在接下来的内容中,让我们来处理输入(5)和状态(6)的硬约束。
引理2:给定向量
和
。对于带有硬约束的闭环系统(10),如果对于
,存在对称正定矩阵
,实矩阵
,使得下面的条件成立:
(34)
(35)
(36)
(37)
其中,在引理1中定义了
和
,表示矩阵“
”的第a个(第b个)对角元素,那么硬约束(5)和(6)被满足。
证明:根据Schur补引理和不等式
和
,从(34)式可以得到
(38)
其中,
。
借助(16)和(24)中定义的
,可以从(38)中得到
(39)
根据(35),(39)和Cauchy-Schwarz不等式,它可以从(5)推导出
(40)
其中,
是
阶单位矩阵的第a行。
同理,在(36)~(37)的帮助下,解决(6)所描述的状态约束
(41)
其中,
是
阶单位矩阵的第b行。这就完成了证明。
现在,我们准备提出一个辅助优化问题来解决关于终端约束的观测器增益
,控制器增益
,如下
s.t.(15),(34)~(37)。
3.2. 求解初始可行域
在本节中,我们将通过一个“离线”到“在线”的综合方法,提供一个摄动变量的设计方案。
接下来,我们首先构造一个合适的优化问题来得到足够大的初始可行域。令
并且记
,带有控制器(8)的增广预测系统表述如下:
(42)
其中,
因此,为了保证递推的可行性,增广系统(42)的初始可行域需要是一个控制不变集。
定义一个集合如下:
(43)
其中,
是对称正定矩阵。为方便后续的表示,以一种符合
分区的方式来对
进行分块,i.e.,
和
。那么,下面提供了保证
为正不变集的充分条件。
引理3:给定由OP2得出的模态依赖的矩阵
和
,对于带有硬约束的增广系统(42),集合
是正定不变集,如果对于任意的
和
,存在矩阵
满足下列条件
(44)
(45)
(46)
其中,
证明:对(42)式左乘右乘
和它的转置,得到
(47)
根据凸多面体集的性质和Schur补引理,从(47)式可以得出
(48)
根据定义2,如果不等式(48)成立,则集合
是一个不变集。此外,不等式(45)和(46)保证了对输入和状态的硬约束。
根据(45)和Cauchy Schwarz不等式,可以从(5)推导出
(49)
其中,
是
阶单位矩阵的第a行。
类似地,在(46)的帮助下,解决(6)所描述的状态硬约束
(50)
其中,
是
阶单位矩阵的第b行。这就完成了证明。
为了表示扩大的
-不变集的一般形式,
-不变集在
-空间上的投影为
。令
,我们有
。不等式(43)可计算为
(51)
定义一个集合如下:
(52)
根据(51)式,当对于预测模型(42)的集合
是的控制不变集时,对于模型(10)的集合
是控制不变集。通过以下优化问题,得到了一个相当大的初始可行域
。
s.t.(44)~(46)。
3.3. 求解摄动量
本小节提出了一种有效的MPC算法。利用
中的自由度来优化系统的性能。给定了OP2中设计的
的最优性,
可以被认为是对控制律
的一个摄动。因此,建立了以下与
相关的优化问题:1) 保证
;2) 确保(10)式的预测轨迹达到但不超过约束所施加的限制;3) 利用可用的设计自由度来获得最优的预测性能。
根据Schur补,约束条件
可以表示为
(53)
很容易发现,由于
是不可测量的,条件(53)是不可解的。在接下来的内容中,我们将尝试找到具有可解性的充分条件来保证(53)。
引理4:假设初始状态属于一个已知的椭球集,i.e.,
,其中
是一个已知的矩阵,
是一个已知的正数。如果满足条件(44)、(45)、(46),同时对于任意的
,存在对称正定矩阵
和正数
,使得
(54)
(55)
(56)
(57)
(58)
其中,
的定义在引理3中,那么条件(53)总能被保证。
证明:让我们分两个步骤进行证明。
1) 在时刻
。基于
的假设,我们有
。
根据Schur补引理,从(54)式可以得到
(59)
根据
,我们有
(60)
在(54)和(55)的帮助下,对(60)左乘右乘
和它的转置,得出
(61)
其中
,是通过
得到的。
我们可以很容易地得到以下不等式:
(62)
根据(62),我们可以得到
(63)
并且根据Schur补引理,从(56)式可以得到
(64)
结合(54)、(59)、(61)、(62)、(64),可以明显得到
(65)
根据(65),我们可以得到
(66)
因此,保证在
时条件(53)成立。
2) 在
时刻。利用Schur补引理,我们可以从(57)式得出
(67)
对(67)式左乘右乘
和它的转置,得到
(68)
(68)式意味着
。从条件(55),我们可以根据
,得到
。因此,有
成立。
同样地,可以从(58)中得到
(69)
对(69)左乘右乘
和它的转置,得到
(70)
(70)式意味着
。从条件(55),我们有
,因此,
成立,也就是说,在
时刻保证条件(54)成立。
这个过程可以递推到无穷。因此,(53)的初始和递推的可行性可以通过(54)~(58)来保证。这样就完成了证明。
s.t.(54)~(58)。
这样,通过求解OP4,得到了最优的
。然后,将第一个元素
代入到(8),得到当前的控制输入
并作用于系统。随后,进入下一个采样时刻。
3.4. 可行性与稳定性
在本节中,在
时刻优化问题是可解的前提条件下,以下定理保证了EMPC算法在
时刻的可解性,并建立了闭环系统的均方稳定性。
定理1:对于给定的
和
,如果初始状态
和初始模态
的OP4在k时刻有可行解,则在任意
时刻也存在可行解,EMPC控制器在均方意义上使闭环系统稳定。
证明:证明过程将从以下两个方面进行。
1) 递推可行性:
对于OP4,值得注意的是,只有条件(53)依赖于当前的系统状态。从这个意义上说,为了确保OP4的可行性,我们只需要证明如果OP4在
时刻是可行的,那么
式在未来的任何
时刻都是可行的,这意味着存在
,使得
。从(42)中可以很容易地得到以下关系:
(71)
(72)
因此,对于某个
,我们有
(73)
根据控制不变集的性质,我们可以很容易地得到
(74)
通过利用(72)~(73)和
,从(74)中很容易获得以下条件:
(75)
因此,(53)在
时刻是可行的。我们可以将这个过程递推到未来任何时刻
。那么,优化问题OP4是可以递推求解的。证明完成。
2) 均方稳定性:
选择二次函数
,其中
是通过求解OP2得到的。首先,定义
和
分别是k和
时刻的最优解。根据可行性的性质,我们一定有
(76)
其中,没有带着角标“*”的
表示可行解。
接下来,根据最优解的性质,我们有
(77)
由于在
时刻的状态,即,对某个
,
。此外,结合(76)和(77),我们可以得到
(78)
因此,
的期望是一个严格递减的二次函数。因此,我们可以得出结论,当
时,在均方意义上
。这个证明完成了。
4. 仿真算例
为了处理优化问题中的耦合,我们提出了在给定初始模态下的EMPC的离线部分和在线部分算法(表1)。
在本节中,提出了在经济动态系统的实际应用,以证明我们提出的EMPC算法的有效性。考虑以下乘数加速器宏观经济体系 [32] :
(79)
其中,
和
是消费支出,国民收入,私人工资和政府支出。
是边际储蓄倾向,
为加速系数。由于经济周期的存在,Markov链
将当前经济状况分为两个阶段:快速增长阶段
和缓慢增长阶段
[32] 。根据加速度原理,在模态
,有
,
,而在模态
,有
,
。类似于文献中方法 [32] ,我们通过令
和
,将系统动力学(79)转化为状态空间模型(1)。
在现实中,政府不仅需要通过政府购买来调控国民经济,还需要通过其他无形的手段进行宏观调控。从本质上讲,它是调整经济周期的持续时间,所以这个问题可以在所提出的协同设计策略下得到解决。所研究系统的参数见表2。为了实现算法的目标,给出了初始值
。加权矩阵是
。状态和控制输入的上界设计为
。
![](Images/Table_Tmp.jpg)
Table 2. Parameters of the macroeconomic system
表2. 宏观经济体系的参数
转移概率矩阵的定义如下:
应用引理1和引理2,通过求解OP2可以得到模态依赖的控制器增益和观测器增益:
为了确保
,我们设定了
。通过求解OP3,我们可以使初始可行域
最大化。由图1可知,初始可行域明显扩大了。
![](//html.hanspub.org/file/58-2570735x358_hanspub.png?20230320093129516)
Figure 1. Comparison of the feasible region
图1. 初始可行域比较
在在线部分,通过与完全在线的MPC策略仿真结果比较,证明了所提出的EMPC的优点。算法可以在MATLAB R2017a平台上运行的yalmip.master工具箱得到有效地解决。从表3中可以看出,与完全在线的MPC策略相比,EMPC的在线计算时间成本显著降低。
![](Images/Table_Tmp.jpg)
Table 3. System resulting data of standard experiment
表3. 标准试验系统结果数据
由于MJSs中的随机跳变,这里使用了80次不同实验的结果的平均性能。图2绘制了没有控制作用的经济系统的
的状态轨迹。图3描述了通过EMPC算法得到的系统控制输入
的运动轨迹。图4和图5分别绘制了基于在线MPC控制和基于EMPC的控制下的经济系统的
的状态轨迹,看出在线MPC和EMPC下的状态收敛速度符合实际理论情况(EMPC算法在终端集内采用的是固定的反馈控制律,而在线MPC算法是每一个时刻都求一次优化问题,因此在线MPC算法较EMPC算法的控制效果更好),并且都可以将系统状态收敛到平衡点。图6分别绘制了
没有控制作用和有EMPC策略下
在二维平面上的状态的动态轨迹。由于Markov跳变系统会每一时刻发生模态跳变,一个可能出现的系统模态序列如图7所示。可以清楚地看出,在所设计的EMPC控制器下,该Markov系统可以保证是均方稳定的。
![](//html.hanspub.org/file/58-2570735x364_hanspub.png?20230320093129516)
Figure 2. State
without control trajectories
图2. 无控制输入的系统状态
轨迹
![](//html.hanspub.org/file/58-2570735x367_hanspub.png?20230320093129516)
Figure 3. The evolution of control inputs
图3. 控制输入的轨迹
![](//html.hanspub.org/file/58-2570735x368_hanspub.png?20230320093129516)
Figure 4. The system state evolution
with online MPC and EMPC strategy
图4. 基于在线MPC和EMPC策略的系统状态
轨迹
![](//html.hanspub.org/file/58-2570735x371_hanspub.png?20230320093129516)
Figure 5. The system state evolution
with online MPC and EMPC strategy
图5. 基于在线MPC和EMPC策略的系统状态
轨迹
![](//html.hanspub.org/file/58-2570735x374_hanspub.png?20230320093129516)
Figure 6. State
without control and with MPC strategy trajectories
图6. 没有控制和有MPC策略的系统状态
轨迹
![](//html.hanspub.org/file/58-2570735x377_hanspub.png?20230320093129516)
Figure 7. A possible sequence of system modes
图7. 可能出现的系统模态变化
5. 结论
我们解决了一类受到多面体不确定性和硬约束影响的MJSs的基于观测器的EMPC问题。利用类Lyapunov方法,并通过引入自由加权矩阵,解决了非凸问题。利用基于观测器状态的双模估计状态反馈控制策略,极大地扩大了初始可行域,有效地降低了在线计算负担,促进了该算法的实际应用。通过离线到在线综合确定了设计方法,并为分析算法的可行性和研究系统的均方稳定性建立总体框架。最后,通过仿真实验验证了EMPC的适用性。
基金项目
本研究获得国家自然科学基金面上项目资助,项目编号为62073223;上海市自然科学基金资助,项目编号为22ZR1443400。
NOTES
*通讯作者。