1. 引言
离散时间Markov跳变线性系统在通信工程、机器人技术等领域应用广泛 [1] [2] 。1960年,Kalnan [3] 在控制理论中基于可控制性与可观测性研究,发现矩阵Riccati方程存在全局解。1969年,Sworde D D [4] 将随机最大值原理引入到具有Markov跳变参数混合系统的最优控制问题中,为研究具有Markov跳变参数混合系统的最大值解的相关问题奠定了基础。文献 [5] 首次研究了Markov跳变线性系统的线性二次调节器(linear quadratic regulator, LQR)问题,也就是使得二次耗散函数最小化的最优控制问题,将具有无限马尔可夫切换的离散时间随机系统解的问题转化为相应的Riccati方程解的问题。1969年到1980年期间,2014年Meng Q [6] 和Mahmoud M S [7] 等人在对有限时间LQR问题进行研究时应用了较为有名的最大值原理。2012年Ungureanu 与Dragan [8] 在研究Markov跳变线性系统时介绍了具有无限离散时间Markov切换线性系统的可观测与随机可探测的相关概念以及该系统相关的稳定性研究,为本文的写作奠定了坚实的理论基础。文献 [9] [10] [11] 中,Damm在相关随机控制中通过对偶方程给出了离散时间Riccati方程的一些相关性质。随后,Wonham [12] [13] 将这一结果推广到随机控制框架中,并且引入了随机控制的Riccati方程,使得具有无限马尔可夫切换的离散时间随机系统的解的相关研究转化为对应的广义Riccati方程解的研究。文献 [14] 考虑了一类定义在序Hilbert空间上的离散时间正向线性方程与后向线性方程,提供了所考虑方程具有特殊解的充要条件,涉及到该方程的最大值解,稳定解与最小半正定解。文献 [15] 研究具有无限马尔可夫切换的离散时间随机系统的稳定解最大值解与最小值解的相关问题,本文就是在文献 [15] 的相关研究中又进行更深层次的研究,使得系统的稳定解、最大值解与最小半正定解之间建立联系,使得系统的最大值解与最小半正定解更加逼近系统的稳定解,为研究系统的稳定性开辟了新的方向。
文献 [16] 系统的研究了具有有限马尔可夫切换的离散时间随机系统的稳定解等相关问题,使得稳定性的研究成为当下研究的热点问题。本文正是在文献 [16] 的启发下进行具有无限马尔可夫切换的离散时间随机系统的稳定解等问题的研究。文献 [17] [18] 研究了Riccati方程的半正定解。本文也在文献 [17] [18] 的基础上引入了系统的随机可检测性,基于系统的随机可检测性条件,能够使得系统的半正定解为该系统的一个稳定解。文献 [19] [20] [21] [22] [23] [24] 中V. Dragan和T. Morozan在研究中强调随机线性系统解的唯一性,在相关条件的限制下使得系统具有唯一稳定解;在添加系统随机可检测性条件下,离散时间随机线性微分方程最多只有一个半正定解。
本文主要分为五个部分,第一部分时引言部分,主要介绍了相关的研究成果与研究现状;第二部分为符号说明部分,对文章中应用到的符号进行说明,使得读者更加容易理解文章中的理论部分;第三部分为系统描述部分,对文章中所要研究的系统进行详细的描述,并且介绍相关的概念与定义;第四部分为主要结果部分,定理1与定理2进行了详细的证明过程,定理1应用Lyapunov算子将系统(1)是随机稳定与线性正算子序列
的稳定联系起来,为定理2的成立奠定了基础。定理2进行简单的计算可以得出若集合
是非空的,则若Riccati方程有稳定解,则必定存在最大值解。以上定理的成立使得引理2的结论成立。第五部分为数值举例,通过数值举例来验证结果的正确性。
2. 符号说明
代表所有
阶实矩阵空间,且该空间的内积定义如下:
对于任意的
,
代表矩阵M的迹;
;对于一个固定的整数
,
。因此若
,则当且仅当
,其中
,
。当
时,一般用
来代替
。显然
。
是一个Hilbert空间,且该Hilbert空间上的内积满足:
对于所有
,
,其中
,
,
,
;若
,则
,且
,所以
,
定义一个线性算子集
;
代表有界序列
。
3. 系统描述
考虑系统:
(1)
上述具有马尔可夫切换的离散时间线性系统相关的耦合离散时间Riccati方程如:
(2)
定义1 [17] 耦合离散时间Riccati方程(2)与系统(1)所描述的优化问题有关,对应的二次耗散函数为:
(3)
定义一个线性算子:
,其中:
,
(4)
显然,对于任意t,
是
上正的线性算子。
取定方程(2)中
,
,
,且有:
(5)
在上述(5)式的定义下,(2)式可化为:
(6)
对于任意的
,记
,
,
,
,
,
,
都是线性算子,其中
都是固定的正整数。
取
,
。
为了后续研究,我们做出如下假设:
假设1:1) 序列
与序列
都是有界序列;
2) 对于任意的
,
是一个正算子,即:
,若
。
取定下列两个集合:
(7)
(8)
其中,对于任意的
,
注记1:对于任意的一个序列
,
等价于
对于任意的
,这样的序列被称为一致正的。
注记2:根据舒尔补方法可知,
包含方程(6)的所有全局有界解
,且满足:
。
注记3:由(7)式和(8)式显然可得:
。
定义2 [15] :我们称
是方程(6)的一个最大解,若
,对于任意的
。
定义3 [15] :我们称
是方程(6)的一个稳定解,若离散时间线性方程
是指数稳定的,其中:
(9)
(10)
定义4 [15] :我们称线性正算子序列
是稳定的,若存在有界序列
使得离散时间线性方程
的零态平衡是指数稳定的。
定义5 [22] :我们称离散时间系统广义Riccati方程(6)的解
是其半正定解中最小的,若
,对于离散时间系统广义Riccati方程(6)的任意解
。
定义6 [22] :我们称系统(1)是随机稳定的,若存在一个有界序列
使得闭环系统
(11)
的零态稳定是强指数均方稳定的(Strongly exponentially stable in the mean square)。
显然,根据定义3和定义4可知,若线性正算子序列
是稳定的,则方程(6)有一个稳定解
。
定义7 [22] :离散时间无限马尔可夫跳跃系统(1)中,取
,我们称系统是随机可探测的,若存在序列
使得系统
是随机稳定的。
4. 主要成果
定理1 系统(1)是随机稳定的等价于线性正算子序列
是稳定的。
证明:根据定义5可知,若系统(1)是随机稳定的,则闭环系统(11)的零态稳定是强指数均方稳定的,即对应的Lyapunov型算子
(12)
能够产生一个指数稳定演化。若线性正算子序列
是稳定的,则存在有界序列
使得离散时间线性方程
的零态平衡是指数稳定的,即
能够产生一个指数稳定演化。又由于
(13)
经过简单的计算可得:
。根据定理2.5 [15] 可知,若
能够产生一个指数稳定演化,则
能够产生一个指数稳定演化。综上可知:系统(1)是随机稳定的等价于线性正算子序列
是稳定的。
引理1 [8] :假设正算子序列
是稳定的且
,在此条件下由
定义的离散时间系统广义Riccati方程(6)有两个全局有界解
和
具有以下性质:
对于方程(6)任意的有界解
且
。
引理2 [8] :若
是非空的,则方程(6)至少还有一个稳定解。
定理2:若集合
是非空的,则若Riccati方程有稳定解,则必定存在最大值解。
证明:令
是集合
中的任意一个序列,即
是方程(6)的任意一个解,根据文献 [15] 中的引理5.1可知,若取定
,则方程(6)可以通过简单的计算可以转化为:
(14)
其中
设方程(6)有一个稳定解,取该稳定解为
,则离散时间线性方程
是指数稳定的,其中
和
如(9)和(10)式所示。由于
也是方程(6)的一个解,故当
时,通过简单的计算可得:
(15)
用(15)式减去(14)式可得:
(16)
根据文献 [15] 中引理1可知,
,由于
,则有
,故
。又由于
是一个稳定解,则离散时间线性方程
是指数稳定的,再根据定理2.5 [15] 可知,
能产生一个指数稳定演化,且
,其中
,故方程(16)有唯一有界一致正解,即
,由于
是方程(6)的任意一个解,且
,根据定义2可知,
即为方程(6)的一个最大值解。故定理得证。
推论1:在系统随机可探测条件下,离散时间系统广义Riccati差分方程(1)~(2)的所有半正定解都是它的稳定解。若该稳定解是唯一的,则方程(1)~(2)的最多只有一个半正定解
,且有
。
5. 数值举例
该数值举例说明,在系统不可随机可测的情况下,离散时间系统广义Riccati差分方程(2)的最大值解与最小值解不一致。
考虑方程(2)的特殊情形,
,则方程化为:
(17)
其中:
通过简单的计算可知,系统不是随机可测的。取
,
显然
是(17)式的一个解。接下来证明
是(17)式的一个稳定解。
根据定理3.7 [15] 可知,若
是(17)式的一个稳定解,当且仅当存在
,使得
,其中:
则上述不等式等价于
,其中
,通过著名的离散时间Lyapunov定理并且进行简单地计算可知其等价于
,因此可以推断出
是(17)式的一个稳定解。又因为
,则根据定理1可知若
非空,若方程有稳定解则必有最大值解,且其稳定值与最大值一致。即
。通过直接的计算,可知(17)式具有两个半正定解,即
和
,其中
因为
,则
是(17)式的最小解。因此在在系统不是随机可测时,离散时间系统广义Riccati方程(2)的最大值解与最小值解不一致。
6. 结论
本文主要应用Lyapunov算子将系统 随机稳定与线性正算子序列
的稳定联系起来,并且对其进行了明确的证明,为定理2的成立奠定了基础。定理2进行直接的计算可以得出若集合
是非空的,则若Riccati方程有稳定解,则必定存在最大值解。
基金项目
重庆理工大学研究生教育高质量发展项目,项目编号:gzlcx20223309,项目类型:校级联合资助项目。