在事件触发协议下多智能体系统的集员包含控制
The Set-Membership Containment Control of Multi-Agent Systems under the Event-Triggered Protocol
DOI: 10.12677/pm.2024.145180, PDF, HTML, XML, 下载: 52  浏览: 97 
作者: 李志力:上海理工大学,光电信息与计算机工程学院,上海
关键词: 多智能体系统集员方法包含控制事件触发协议Multi-Agent Systems Set-Membership Approach Containment Control Event-Triggered Protocol
摘要: 本文研究了基于事件触发协议的多智能体系统的集员包含控制问题。在集合成员包含控制中,所有追随者的状态需要进入由领导者状态组成的凸包。首先,提出了一个局部观测器来估计每个智能体的状态。其次,采用基于事件的协议来缓和数据交换的压力。第三,提出了多领导者的集员包含概念。在集员滤波结构下,给出了集合估计和集员包含的结构,以实现期望的包含性。观测器和控制器的增益以及椭球的参数通过递推凸优化算法得到。最后,通过算例验证了该方法的有效性。
Abstract: This paper addresses the problem of set-membership containment control of multi-agent systems (MASs). In set-membership containment control, states of all followers need to go into a convex hull consisting of states of leaders. Firstly, a local observer is proposed to estimate the state of each agent. Secondly, the event-triggered protocol is used to moderate the pressure of data exchange. Thirdly, the concept of a new set-membership containment for MASs with multileader is proposed. In the structure of set-membership filtering, the structure of set-membership estimate and set-membership containment is afforded to carry out the desired containment. The gain of observer and controller and the ellipsoid parameters got by a recursive convex optimization algorithm. Finally, the effectiveness of the proposed method are demonstrated by an illustrated example.
文章引用:李志力. 在事件触发协议下多智能体系统的集员包含控制[J]. 理论数学, 2024, 14(5): 226-236. https://doi.org/10.12677/pm.2024.145180

1. 引言

近几十年来,多智能体系统的集体行为问题由于在机器人系统、无人潜航器、航空母舰舰队等诸多领域的广泛应用而受到了广泛的关注 [1] [2] 。共识是一种具有特征的集体行为,它描述了每个智能体根据来自邻居和自身的信息更新自己的状态,从而对感兴趣的状态达成一致。已发表的文献中有许多关于质量的典型研究成果,如 [3] 研究了具有一般线性动力学的非均质质量在无向连通图下的输出一致性问题。

包含控制作为一种集体行为引起了更多的研究兴趣,并产生了一系列重要的研究成果。包含控制的主要特点是群体性是由多导体组成的。其核心目标是通过跟随者和领导者的相邻信息,为每个跟随者设计一个分布式控制器,使所有跟随者收敛于多个领导者交叉的凸包。在某些行业中,通常使用多领导者来完成协同任务,例如在引导一组车辆(跟随者)不冒险进入危险区域的原因中,可以使用多领导者来引导跟随者进入由它们组成的安全区域 [4] [5] 。因此,研究具有多领导者的多智能体系统的包含控制问题具有重要意义。然而,在实际应用中,由于噪声大多是未知的,上述方法已不再适用于这种情况。虽然噪声是未知的,但只要能将噪声置于有上界和下界的椭球中,就可以采用集员滤波的方法。

此外,到目前为止,集员滤波的文献已经很多,在故障诊断中应用最为广泛 [6] [7] [8] 。通过椭球的交点来判断是否存在网络攻击。例如,文献 [8] 提出了一种新的网络攻击检测方法,包括预测步骤和测量更新步骤。这两步分别得到一个椭球集。在网络攻击下,椭球的中心会产生偏差,所以用这两步生成的椭球来检测是否存在网络攻击。此外,也有少量文献使用集合隶属度滤波器来估计状态 [9] 。到目前为止,关于使用集员滤波对多智能体系统包含控制的文献很少。

受上述讨论的启发,本文主要解决基于事件触发协议的多智能体系统的集员包含问题。本文的主要创新点为:(1) 针对存在事件触发通信协议的多智能体系统,提出了集员包含的新概念;(2) 给出集员包含的协同设计结构,实现期望的包含一致性;(3) 设计了递推凸优化算法,用于计算观测器和控制器增益以及椭球参数。

2. 问题描述

本文考虑由A个跟随者和B个领导者构成的多智能体系统,其中跟随者和领导者 s B 的系统方程为

{ x k + 1 l = A k x k l + B k u k l + D k ω k l x k + 1 s = A k x k s + D k ω k s y k i = C k x k i + E k v k i , i A B (1)

其中 x k l x k s 分别表示跟随者和领导者的系统状态, u k l 是跟随者l的控制输入, y k i 为测量输出。 A k B k C k D k E k 均为已知的时变矩阵。 ω k l ω k s 均为过程噪声, v k i 为测量噪声,均为未知但有界的,并且满足下列条件:

{ ( ω k l ) T W l 1 ω k l 1 ( ω k s ) T W s 1 ω k s 1 ( v k i ) T V i 1 v k i 1 (2)

其中 W l = W l T > 0 , W s = W s T > 0 , V l = V l T > 0 均为已知的矩阵。

接着,采用局部状态观测器来观测智能体的状态:

x ^ k + 1 l = A k x ^ k l + B k u k l + G k ( y k l C k x ^ k l ) (3)

x ^ k + 1 s = A k x ^ k s + G k ( y k s C k x ^ k s ) (4)

其中 x ^ k l x ^ k s 分别表示第l个和第s个观测器的状态, G k 为未知的状态观测器增益。

为了解决多领导者多跟随者的跟踪包含问题,理想的控制协议为

u k l = K k j E l | a l j | ( x ^ k l x ^ k j ) (5)

其中 E l 为跟随者l的邻居集, K k 为未知的控制器增益矩阵。

由于网络带宽是有限的,但需要传输的数据是巨大的,因此为了提高通讯效率,本文引入了事件触发协议,其设计原理如下所示:

首先,假设观测状态 x k h 的传输时间为 0 = k 0 h < k 1 h < k 2 h < < k t h < ,并定义事件触发函数

f h ( e k h , δ h ) = e k h T Τ k h e k h δ h (6)

其中 e k h = x k h x ^ k h Τ k h 为未知的权重矩阵。事件触发阈值 δ h 是一个已知的正标量。状态传输的条件为:

f h ( e k h , δ h ) 0 (7)

因此,下一触发时刻可表示为

k t + 1 h = inf { k N | k > k t h , f h ( e k h , δ h ) 0 }

定义1:若存在矩阵 G k ,跟随者l和领导者s满足集员估计条件,则其对应的状态 x k + 1 l x k + 1 s 分别属于估计椭球 Q l , k + 1 R s , k + 1 ,其中

Q l , k + 1 = { ( x k + 1 l x ^ k + 1 l ) T M l , k + 1 1 ( x k + 1 l x ^ k + 1 l ) 1 } R s , k + 1 = { ( x k + 1 s x ^ k + 1 s ) T N s , k + 1 1 ( x k + 1 s x ^ k + 1 s ) 1 } (8)

其中 M l , k + 1 = M l , k + 1 T > 0 N s , k + 1 = N s , k + 1 T > 0 均为时变的矩阵。

定义2:若存在矩阵 G k K k ,跟随者l实现集员包含条件,则跟随者l的状态 x k + 1 l 和始终属于椭球 X l , k + 1 内,其中

X l , k + 1 = { ( x k + 1 l x k + 1 j ) T P l , k + 1 1 ( x k + 1 l x k + 1 j ) 1 } (9)

其中 P l , k + 1 = P l , k + 1 T > 0 是时变矩阵。

假设1:跟随者l和领导者s的初始状态 x 0 l x 0 s 满足下列条件:

Q l , 0 = { ( x 0 l x ^ 0 l ) T M l , 0 1 ( x 0 l x ^ 0 l ) 1 } R s , 0 = { ( x 0 s x ^ 0 s ) T N s , 0 1 ( x 0 s x ^ 0 s ) 1 } X l , 0 = { ( x 0 l x 0 j ) T P l , 0 1 ( x 0 l x 0 j ) 1 }

其中 M l , 0 = M l , 0 T > 0 N s , 0 = N s , 0 T > 0 P l , 0 = P l , 0 T > 0 均为已知矩阵。

由定义1和2,本文的目标是设计合适的控制协议,并且找到合适的矩阵 M l , k N s , k X l , k ,使得(8)和(9)成立。

3. 最终结果

在本节中,给出事件触发机制下多智能体系统的集员包含一致性成立的条件。

定理1:对于多智能体系统(1),假设噪声 ω k l ω k s v k i 都是未知但有界的,且在k时,有 ( x k l x ^ k l ) T M l , k 1 ( x k l x ^ k l ) 1 ( x k s x ^ k s ) T N s , k 1 ( x k s x ^ k s ) 1 成立。如果存在正定矩阵 M l , k + 1 N s , k + 1 ,估计增益 G k 以及正标量 η t ( t = 1 , 2 , , 6 ) ,使得

[ M l , k + 1 0 Δ 1 D k G k E k Ω 1 0 0 0 Ω 2 0 0 Ω 3 0 Ω 4 ] 0 (10)

[ N s , k + 1 0 Δ 2 D k G k E k Ω 5 0 0 0 Ω 6 0 0 Ω 7 0 Ω 8 ] 0 (11)

则状态 x k + 1 l 和状态 x k + 1 s 始终包含在相应的估计椭球 Q l , k + 1 R s , k + 1 内,其中

Δ 1 = A k H l , k G k C k H l , k Ω 1 = 1 + η 1 + η 2 + η 3 , Ω 2 = η 3 I Ω 3 = η 1 W l 1 Ω 4 = η 2 V l 1 Δ 2 = A k H s , k G k C k H s , k Ω 5 = 1 + η 4 + η 5 + η 6 , Ω 6 = η 6 I Ω 7 = η 4 W s 1 Ω 4 = η 5 V s 1

证明:在 时刻,有 ( x k l x ^ k l ) T M l , k 1 ( x k l x ^ k l ) 1 成立,故存在向量 α l , k 使得

( α l , k ) T ( α l , k ) = ( x k l x ^ k l ) T M l , k 1 ( x k l x ^ k l ) 1 (12)

此外,若 M l , k = ( H l , k ) T ( H l , k ) ,则 x k l = x ^ k l + H l , k α l , k 。因此,不难发现跟随者l在 k + 1 时刻的状态观测误差为

x k + 1 l x ^ k + 1 l = Ξ 1 Γ 1 (13)

其中 Ξ 1 = [ 0 Δ 1 D k G k E k ] Γ 1 T = [ 1 α l , k T ω k l , T v k l , T ] 。因此,我们有

Γ 1 T ( diag { 1 , 0 , 0 , 0 } + Ξ 1 T M l , k + 1 1 Ξ 1 ) Γ 1 0 (14)

另一方面,由(2)和(12)可知

{ ( ω k l ) T W l 1 ( ω k l ) 1 ( v k l ) T V l 1 ( v k l ) 1 ( α l , k ) T ( α l , k ) 1

上式可重新写为

{ Γ 1 T Ψ 1 Γ 1 0 Γ 1 T Ψ 2 Γ 1 0 Γ 1 T Ψ 3 Γ 1 0 (15)

其中 Ψ 1 = diag { 1 , 0 , W l 1 , 0 } Ψ 2 = diag { 1 , 0 , 0 , V l 1 } Ψ 3 = diag { 1 , I , 0 , 0 }

从(14)和(15)可知,若(14)成立,则存在正标量 η t ( t = 1 , 2 , 3 ) 使得

diag { 1 , 0 , 0 , 0 } + Γ 1 T M l , k + 1 1 Γ 1 + η 1 Ψ 1 + η 2 Ψ 2 + η 3 Ψ 3 0 (16)

最后根据schur补引理可得(10)成立。

同理可证(11)成立,便不在此展开。

定理2:对于多智能体系统(1),假设噪声 ω k i v k s 均为未知但有界的,且在k时,有 ( x k l x k j ) T P l , k 1 ( x k l x k j ) 1 成立。若存在正定矩阵 P l , k + 1 ,估计增益 G k 和控制增益 K k 以及正标量 η t ( t = 7 , 8 , 9 , 10 ) ,使得

[ P l , k + 1 Δ 3 A k O l , k D k D k D k 0 0 Ω 9 0 0 0 0 0 0 Ω 10 0 0 0 0 0 Ω 11 0 0 0 0 Ω 12 0 0 0 Ω 13 0 0 Λ 1 ( 66 ) 0 Λ 2 ( 77 ) ] 0 (17)

则状态 x k + 1 l 一直在椭球 X l , k + 1 内,此外

Δ 3 = u k l u k b Ω 9 = 1 + η 7 + η 8 + η 9 + η 10 δ m δ b Ω 10 = η 10 I Ω 11 = η 7 W l 1 Λ 1 ( 66 ) = ( H b , k ) T Τ k b , T H b , k Ω 12 = η 8 W b 1 Ω 11 = η 9 W s 1 Λ 1 ( 77 ) = ( H s , k ) T Τ k m , T H s , k

证明:在k时刻,有 ( x k l x k j ) T P l , k 1 ( x k l x k j ) 1 。因此,存在向量 γ l , k 使得

( γ l , k ) T ( γ l , k ) = ( x k l x k j ) T P l , k 1 ( x k l x k j ) 1 (18)

此外,若令 P l , k = ( O l , k ) T ( O l , k ) ,则 x k l = x k j + O l , k γ l , k

Ξ 3 = [ Δ 3 A k O l , k D k D k D k 0 0 ] Γ 3 T = [ Δ 3 γ l , k T ω k l , T ω k b , T ω k s , T α b , k T α s , k T ]

则跟随者l在 k + 1 时的状态轨迹误差为

x k + 1 l x k + 1 j = Ξ 3 Γ 3 (19)

此外,由定义2可得

Γ 3 T ( diag { 1 , 0 , 0 , 0 , 0 , 0 } + Ξ 3 T P l , k + 1 1 Ξ 3 ) Γ 3 0 (20)

另一方面,由(12)和(18),不难推导出

{ Γ 3 T Ψ 7 Γ 3 0 Γ 3 T Ψ 8 Γ 3 0 Γ 3 T Ψ 9 Γ 3 0 Γ 3 T Ψ 10 Γ 3 0 (21)

其中

Ψ 7 = diag { 1 , 0 , W l 1 , 0 , 0 , 0 } Ψ 8 = diag { 1 , 0 , 0 , W b 1 , 0 , 0 } Ψ 9 = diag { 1 , 0 , 0 , 0 , W s 1 , 0 } Ψ 10 = diag { 1 , I , 0 , 0 , 0 , 0 }

注意对于事件触发协议,若 f h ( e k h , δ h ) < 0 ,则无传输的信息,即

e k h T Τ k h e k h < δ h

由于跟随者l的邻居包含跟随者b和领导者s两类,则

{ Γ 3 T Λ 1 Γ 3 0 Γ 3 T Λ 2 Γ 3 0 (22)

其中 Λ 1 = [ Λ 1 ( u v ) ] 6 × 6 Λ 2 = [ Λ 2 ( u v ) ] 7 × 7 都为对称块矩阵, Λ 1 ( 11 ) = δ b Λ 2 ( 11 ) = δ s Λ 1 ( 66 ) = ( H b , k ) T Τ k b , T H b , k

Λ 1 ( 77 ) = ( H s , k ) T Τ k s , T H s , k ,其余为零矩阵。若(20)成立,则存在正标量 η t ( t = 7 , 8 , 9 , 10 ) ,使得

diag { 1 , 0 , 0 , 0 , 0 , 0 } + Ξ 3 T P l , k + 1 1 Ξ 3 + η 7 θ 7 + η 8 Ψ 8 + η 9 Ψ 9 + η 10 Ψ 10 + Λ 1 + Λ 2 0 (23)

最后利用schur补引理,可知(17)成立。

注意定理1和2给出了所求椭球的设计规则,但是没给出寻求最优椭球的方法。因此,考虑如下的优化问题,以寻找最优的椭球参数:

min M l , k + 1 , N s , k + 1 , P l , k + 1 , G k , K k Tr ( Ζ l , k + 1 ) (24)

其中 Ζ l , k + 1 = diag { M l , k + 1 , N s , k + 1 , P l , k + 1 }

本文所设计的凸优化算法见表1所示:

Table 1. Recursive convex optimization algorithm

表1. 递归的凸优化算法

4. 数值仿真实例

在本节中,利用一个仿真例子来验证所提方法的有效性。考虑由3个跟随者和3个领导者构成的多智能体系统,其通信拓扑见图1,其中智能体2,4,6为领导者,其余为跟随者:

Figure 1. Communication topology

图1. 通讯拓扑图

其拉普拉斯矩阵为

[ 3 1 0 2 0 0 0 0 0 0 0 0 0 3 5 0 0 2 0 0 0 0 0 0 0 0 0 1 2 1 0 0 0 0 0 0 ]

此外,选取的参数为:

A k = [ 1 + 0.14 sin ( k ) 0.6 0.2 0.75 + 0.1 cos ( 0.1 k ) ] , C k = [ 1.2 0.8 ] B k = [ 0.8 + 0.2 sin ( 0.4 k ) 0.5 ] D k = [ 0.06 + 0.05 sin ( 0.3 k ) 0.8 ] E k = 1 ω k 1 = 3.95 sin ( 0.2 k ) e 0.32 k ω k 2 = 3.06 sin ( 0.3 k ) e 0.31 k ω k 3 = 3.4 sin ( 0.4 k ) e 0.35 k ω k 4 = 3.9 sin ( 0.6 k ) e 0.32 k ω k 5 = 3.2 sin ( 0.6 k ) e 0.26 k ω k 6 = 3.88 sin ( 0.12 k ) e 0.33 k v k 1 = 3.12 sin ( 1.4 k ) v k 2 = 3.82 sin ( 1.2 k ) v k 3 = 3.52 sin ( 1.1 k ) v k 1 = 3.66 sin ( 1.65 k ) v k 5 = 3.74 sin ( 1.3 k ) v k 6 = 3.11 sin ( 1.2 k )

在仿真中,智能体的初始条件 x 0 1 = [ 5 3 ] T , x 0 2 = [ 4 2.3 ] T , x 0 3 = [ 3.7 3 ] T , x 0 4 = [ 4 2.4 ] T x 0 5 = [ 3 3 ] T , x 0 6 = [ 4 2 ] T , W l = W s = V i = 8 。事件触发的阈值为 δ s = 1.252 + 0.216 sin ( 0.12 k ) 。矩阵 M l , 0 = diag { 100 , 100 } , N s , 0 = diag { 200 , 200 } , P l , 0 = diag { 4000 , 4000 } 。此外,在局部观测器下各状态的初始观测值为 x ^ 0 1 = [ 3 3 ] T , x ^ 0 2 = [ 2 2.2 ] T , x ^ 0 3 = [ 1 3.1 ] T , x ^ 0 4 = [ 2 2 ] T , x ^ 0 5 = [ 1 3.2 ] T , x ^ 0 6 = [ 2 2.2 ] T

仿真结果如图2~6所示,其中,图2图3为智能体的状态轨迹。此外,图4图5分别为跟随者和领导者的真实状态和估计状态,说明所设计的观测器具有良好的性能。图6是事件触发时刻。

Figure 2. The states trajectories of x k i ( 1 )

图2. 智能体的状态轨迹 x k i ( 1 )

Figure 3. The states trajectories of x k i ( 2 )

图3. 智能体的状态轨迹 x k i ( 2 )

Figure 4. The true states x k l , and the states estimation x ^ k l

图4. 真实状态 x k l 和观测状态 x ^ k l

Figure 5. The true states x k s , and the states estimation x ^ k s

图5. 真实状态 x k s 和观测状态 x ^ k s

Figure 6. Event-triggered time

图6. 事件触发时刻

5. 总结

本文研究了基于事件触发协议的多智能体系统的集员包含问题。首先,利用局部观测器来观察每个智能体的状态。接着,为了减轻通信资源的压力,引入了事件触发协议。此外,在集员滤波结构下,利用集员包含来实现期望的包含控制。利用凸优化算法获得观测器、控制器和椭球体的增益。最后,利用算例验证了该方法的有效性。

参考文献

[1] Liu, Q. and Wang, J. (2015) A Second-Order Multi-Agent Network for Bound Constrained Distributed Optimization. IEEE Transactions on Automatic Control, 12, 3310-3315.
https://doi.org/10.1109/TAC.2015.2416927
[2] Yang, S., Liu, Q. and Wang, J. (2017) A Multi-Agent System with a Proportionalintegral Protocol for Distributed Constrained Optimization. IEEE Transactions on Automatic Control, 60, 3461-3467.
https://doi.org/10.1109/TAC.2016.2610945
[3] Liu, X., Liu, H., Lu, P. and Guo, S. (2017) Distributed Event-Triggered Output Consensus Control for Heterogeneous Multiagent System with Generallinear Dynamics. International Journal of Systems Science, 48, 2415-2417.
https://doi.org/10.1080/00207721.2017.1322639
[4] Li, Z., Ren, W., Liu, X. and Fu, M. (2013) Distributed Containment Control of Multi-Agent Systems with General Linear Dynamics in the Presence of Multiple Leaders. International Journal of Robust and Nonlinear Control, 23, 534-547.
https://doi.org/10.1002/rnc.1847
[5] Liu, K., Xi, G. and Wang, L. (2014) Containment Control for Second-Order Multi-Agent Systems with Time-Varying Delays. Systems & Control Letters, 67, 24-31.
https://doi.org/10.1016/j.sysconle.2013.12.013
[6] Liu, L., Esmalifalak, M. Ding, Q., Emesih, V.A. and Han, Z. (2014) Detecting False Data Injection Attacks on Power Grid by Sparse Optimization. IEEE Transactions on Smart Grid, 5, 612-621.
https://doi.org/10.1109/TSG.2013.2284438
[7] Gu, C.J., Jirutitijaroen, P. and Motani, M. (2015) Detecting False Data Injection Attacks in AC State Estimation. IEEE Transactions on Smart Grid, 5, 2476-2483.
https://doi.org/10.1109/TSG.2015.2388545
[8] Mousavinejad, E., Yang, F., Han, Q. and Vlacic, L. (2018) A Novel Cyber Attack Detection Method in Networked Control Systems. IEEE Transactions on Cybernetics, 48, 3254-3264.
https://doi.org/10.1109/TCYB.2018.2843358
[9] Zheng, S., Zhang, X. and Lu, Q. (2018) Distributed Set-Membership Observer Based Consensus of Nonlinear Delayed Multi-Agent Systems under Roundrobin Protocols. Chinese Control and Decision Conference (CCDC), Shenyang, 9-11 June 2018, 118-123.
https://doi.org/10.1109/CCDC.2018.8407116