1. 引言
多智能体系统一致控制问题在计算机科学中的应用具有较长的历史 [1] [2],从时间优化的角度,若能在有限时间内使得多智能体状态达到一致,则是时间最优的控制算法。而智能体的收敛速度是衡量所设计算法的一个重要指数,因此,如何使智能体在有限时间达到稳定状态或预期状态越来越成为近年来的研究热点。
Olfati-Saber等人 [3] 给出了保证线性一致性收敛的协议,并且研究了智能体系统拉普拉斯图代数连通度(智能体系统拉普拉斯矩阵的第二最小特征根)对一致性算法收敛速度的影响。Xiao和Boyd [4] 通过使用半限定凸集解决了权值设计的问题,以便使多智能体系统的代数连通度是增加的。虽然通过最大化多智能体系统拉普拉斯矩阵第二最小特征根的方法,可以使控制协议的收敛速度提高,但不能确保系统在有限时间内状态一致。Wang等人 [5] 探讨了不同网络结构对群体收敛速度的影响。在控制协议相同的情况下,考虑了线型网络和环型网络这两种不同的网络对群体收敛速度的影响。进一步,从节点的位置和数量两方面来讨论上述两种网络对群体收敛速度的影响。在很多实际情况中,需要多智能体系统状态在有限时间达到一致状态。针对一阶多智能体的同步问题,Xiao等人 [6] 利用有限时间Lyapunov稳定性判据,设计了有限时间控制器。Wang等人 [7] 考虑了带有时延的一阶多智能体有限时间控制问题,利用坐标变换,将时延控制问题转化为不含时延的控制问题,然后设计有限时间控制器。上述结果都是关于一阶多智能体的一致性有限时间控制问题。结合工程实际,二阶及多阶多智能体的有限时间控制问题同样具有研究意义 [8],Huang等人 [9] 针对具有非均匀时滞的二阶多智能体系统,设计了有限时间一致性算法使得所有智能体趋于一致。Zou等人 [10] 考虑了二阶异构切换非线性多智能体系统,设计了自适应有限时间一致性算法并且给出了任意切换条件下系统的充分条件。Shi等人 [11] 针对高阶异构多智能体系统,采用积分滑模控制技术构造了有限时间一致性算法,同时克服了抖振现象。另外还有一些研究成果讨论了固定时间及初始条件的影响 [12] [13] [14] [15]。
另外在实际系统中,由于内在、外在的原因 [16],会出现所有智能体状态最终按组收敛到多于一个状态值的情况,即分组一致。关于多智能体系统分组一致控制的研究,Yu等人 [17] 研究了拓扑结构为强连通平衡图的多智能体系统分组一致控制协议的设计,并基于图论与矩阵理论的知识分析得到了系统分组一致的收敛判据。Xia等人 [18] 提出在切换拓扑和时变时滞情况下,一阶多智能体分组一致性的充分条件。Ji等人 [19] 针对一阶/二阶混合多智能体系统,提出分组一致控制律,并通过频域分析及矩阵理论给出了系统收敛条件。Li等人 [20] 考虑输入限幅及速度不可测,提出基于牵制控制的分组一致控制算法,实现了系统渐近分群一致。
基于以上研究成果,我们希望结合现实系统中的更多情况,如时延、分组、切换拓扑等因素开展多智能群体的有限时间一致性研究。在本文中,对所提多智能体系统进行了有限时间分组一致性协议的设计同时开展了仿真研究工作,并发现了控制算法中参数变化所引起的建立时间变化的关系。
本文剩余部分的结构安排如下。第二节中我们介绍了多智能体系统的模型及使用到的引理;第三节中我们介绍了所设计的有限时间分组一致算法,并对算法的有效性和稳定性进行了理论推导证明;为了验证所设计的算法,在接下来的第四节中我们开展了仿真验证,智能体的通信拓扑分为静态拓扑和动态拓扑,同时智能体的分组情况也可以是动态变化的。最后,我们对所完成的工作进行了总结和展望。
2. 问题描述
可以先假设多智能体系统中有n个智能体,标记为从1到n。
,所有智能体的状态空间为R。
表示群组j中智能体i的状态,
,
,智能体i的状态公式如下:
(1)
其中
是状态反馈,称为控制协议。控制协议是根据智能体i的邻居接收到的状态信息设计的,并且满足以下公式:
。
2.1. 图论概念
在多智能体系统中,每个智能体都可以与其邻居进行通信。这里分别用有向图和无向加权图来表示邻居之间的通信拓扑,其中
和
是半正定矩阵,而且我们假设所有
都是
和
。A和
称为权重矩阵,其中A和
分别是有向加权图和无向加权图。
为顶点集,E为边集。顶点
相当于智能体i。
的一条边用(
,
)表示,表示从智能体j到智能体i的通信,边的权重用
表示,
表示智能体j可以向智能体i传输其状态信息。
的一条边用(
,
)表示,表示智能体j和智能体i之间的通信,边的权重用
表示,
表示智能体j和智能体i可以相互通。顶点
的邻域集合由
表示。
2.2. 符号和定义
为了构建我们的控制协议设计,需要给出以下符号和定义:
通常,
是系统(1)的解,它的初始状态是
,
用来平衡系统(1),
在
(
)和
中是连续的。
稳定性和渐近稳定性的定义是:
(1) 对于任意
,存在
,使得
且对于所有
,
,则称系统(1)为稳定系统。
(2) 如果系统(1)是稳定的,并且有
,那么系统称为渐近稳定的。
附注:
(1)
是状态空间中从
到
的连续函数,其中
。
(2)
,其中
。
对于给定的协议
,
,任何给定的初始状态和任何
,如果
,
时,那么多智能体系统可以被认为有解决一致性问题的能力。对于任意
,如果存在满足
的时间
和实值k,那么它可以在有限时间内解决一个一致性问题。如果最终状态是初始状态的平均值,即
对于所有
,作为
,那么它可以解决平均一致性问题。
2.3. 一些引理
为了表明我们的主要结论,需要下列引理。
引理1 [7]:如果
且
,则
引理2 [7]:
表示
的拉普拉斯图,由下式表示:
具有以下属性:
(1) 0是
的一个特征值,它的特征值是1,其中
;
(2)
,
的所有特征值不小于零;
(3) 如果
是连通的,则由
表示的
的第二小特征值,称为
的代数连通度,并且大于零;
(4)
的代数连通性等于
如果
,则
;
引理3 [7]:以下系统:
(2)
其中
,
,
是一个
矩阵,
是一些
矩阵,
是一些正的常数。
如果
和
,
则
(3)
如果系统(3)可通过反馈控制
在有限时间内是能稳定的,并且
有界且f连续的,那么系统(2)就可以通过反馈控制在有限时间内稳定。
3. 主要结果
现在系统(1)可以表示为:
(4)
我们提出了解决具有两个群组的多智能体系统在有限时间内的一致性问题的一致性协议,这两个群组被标记为群组一和群组二。等式(5)和等式(7)可以解决两组中的一致性问题,并且相应的通信拓扑是静态的。等式(6)和等式(8)可以解决两组中的一致性问题,并且相应的通信拓扑是动态切换。
(5)
(6)
(7)
(8)
定理1:等式(5)和等式(7)可以解决两组多智能体系统的一致性问题,并且对应的通信拓扑是静态的。
(9)
证明:利用引理3,很明显如果系统在有限时间内是稳定的,则定理1被证明。要证明系统(9)在有限时间内是稳定的,则选择
(10)
从引理1中取半正定函数
如果
如果A是方程(5)的矩阵,它的特征值是
按递增顺序排列。
所以有
。
让
,
。
初始状态是
,如果
,根据微分比较原理,
并且
。
所以,方程(5)在有限时间内是稳定的。
被称为等式(5)的建立时间。
当
时,系统(4)的建立时间增加了
达到平衡点的时间加上
达到平衡点的时间,并且
因此,
。
类似地,我们可以证明方程(7)在有限时间内是稳定的。
考虑到已有通信链接的失败,由于超出通信范围的智能体之间可能存在障碍,因此我们也采用交换通信拓扑。
定理2:等式(6)和等式(8)可以解决两组中的一致性问题,并且相应的通信拓扑是动态切换。
证明:利用引理3,很明显,如果具有交换拓扑的系统(9)在有限时间内是稳定的,则定理2被证明。
为了证明具有交换拓扑的系统(9)在有限时间内是稳定的,我们选择
取李雅普诺夫函数
,其中
称为群组不一致向量。群组不一致函数不依赖于网络拓扑。因此,
沿着交换系统的解是不增加的。
的这一性质使它成为交换系统稳定性分析的一个合适的李雅普诺夫函数。
然后,
其中
是
的代数连通性。因此,在无限时间
内
将等于零。
基于定理1的证明,我们有:
4. 模拟结果
在这一部分,仿真结果说明了理论结果的正确性和有效性。多智能体系统由十个智能体组成,十个智能体的初始状态是随机的。在这项研究中,我们将十个智能体分为两组。在没有特殊声明的情况下,我们认为标记为{1,2,3,8,9,10}的是第一组智能体,用红线表示该组智能体的轨迹,而{4,5,6,7}是第二组,用蓝线表示该组的轨迹。参数α为0.9,β为0.7。
智能体之间的通信拓扑如图1所示,它显示了四个不同的无向连通图和四个不同的有向图,每个边的权重为1。
图1(a)的代数连通度为0.3820,图1(b)的代数连通度为0.3820,图1(c)的代数连通度为0.4158,图1(d)的代数连通度为0.4679,图1(e)的代数连通度为0.3820,图1(f)的代数连通度为0.3916~0.4698 I,图1(g)的代数连通度为0.2190~0.4925 I,图1(h)的代数连通度为0。
为了证明我们提出的控制算法能够达成一致性,我们首先设置了无向图1(d)和有向图1(h)的拓扑。与之对应,图2和图3是在时间延迟τ = 0.18的控制算法(5)下两组中的智能体的状态轨迹。
第一组的估计建立时间为10.3904和9.4633,第二组的估计建立时间为10.4588和7.8966。从图2和图3可以看出,两组智能体可以在有限的时间内在自己的组中达成一致性。
为了使算法更加通用,我们考虑了多智能体系统的拓扑结构是动态的。同样,我们也考虑通信拓扑由无向图和有向图组成。然后系统从通信图1(a) (图1(e))、到图1(b) (图1(f))、到图1(c) (图1(g))、到图1(d) (图1(h))、回到图1(a) (图1(e)),每一秒切换到下一个拓扑。(括号内的内容代表有向图的切换顺序)。
如图4和图5表示控制算法(6)下智能体的状态轨迹。
![](//html.hanspub.org/file/21-1251573x138_hanspub.png?20220601094637114)
Figure 1. Communication topology of the system
图1. 系统的通信拓扑图
![](//html.hanspub.org/file/21-1251573x139_hanspub.png?20220601094637114)
Figure 2. State trajectory of agents in undirected communication topology (d)
图2. 无向通信拓扑(d)下智能体的状态轨迹
通信拓扑也用无向图和有向图划分。第一组的估计建立时间为22.700和22.600,第二组的估计建立时间为24.800和22.400。从图4和图5中,我们可以看到两组智能体的状态可以在他们自己的组中达成一致。这些数据还表明,动态拓扑比静态的拓扑更长,以达成一致。
![](//html.hanspub.org/file/21-1251573x140_hanspub.png?20220601094637114)
Figure 3. State trajectory of agents in directed communication topology (h)
图3. 有向通信拓扑(h)下智能体的状态轨迹
![](//html.hanspub.org/file/21-1251573x141_hanspub.png?20220601094637114)
Figure 4. State trajectories of agents in switching topology
图4. 交换拓扑下智能体的状态轨迹
![](//html.hanspub.org/file/21-1251573x142_hanspub.png?20220601094637114)
Figure 5. State trajectories of agents in switching topology
图5. 交换拓扑下智能体的状态轨迹
除了考虑通信拓扑是动态的,我们还考虑了群组是动态变化的。我们设置图1(d)所示的通信拓扑,初始组为{1, 2, 3, 8, 9, 10}和{4, 5, 6, 7},当时间为2秒时,组将变为{1, 2, 3, 4, 5}和{6, 7, 8, 9, 10},第一组的估计建立时间为10.2058,第二组的估计建立时间为11.1258。两组群组的状态轨迹如图6所示。
![](//html.hanspub.org/file/21-1251573x143_hanspub.png?20220601094637114)
Figure 6. The state trajectory of an agent in the communication topology (d) when the group changes
图6. 当群组改变时,通信拓扑(d)下智能体的状态轨迹
由此可以看出,当群组发生变化时,两个群组中的智能体在新的群组中仍然可以达成共识。
在研究中,我们还发现控制算法中的α和β越大,估计的建立时间越短。如图7(a)和图7(b)所示。
![](//html.hanspub.org/file/21-1251573x144_hanspub.png?20220601094637114)
Figure 7. State trajectory of agent in communication topology (d): (a) α= 0.25, β = 0.05; (b) α = 0.95, β = 0.75
图7. 通信拓扑(d)下智能体的状态轨迹:(a) α = 0.25,β = 0.05;(b) α = 0.95,β = 0.75
我们设置由图1(d)表示的通信拓扑,智能体的初始状态由x0 = [8, 12, 0, 14, 5, 20, 25, 30, 35, 40]设置。在图7(a)中,α等于0.25,β等于0.05;在图7(b)中,α等于0.95,β等于0.75。图7(b)中的估计建立时间比图7(a)中的短。
从以上仿真结果可以看出,基于我们所设计的控制算法,智能体均能实现有效时间分组一致并可以精确计算出建立时间;否则智能体将处于发散无法收敛的情况,针对该情况在此不予详细描述。
5. 结论
提出并分析了有限时间内具有通信延迟的多智能体系统的不同群组的分组和不同群组的一致性问题,给出了控制模型并进行了稳定性分析。为了验证理论结果的正确性和方法的有效性,进一步进行了相关的仿真工作。在进行仿真工作时,我们主要考虑了通信拓扑分为无向图和有向图、静态拓扑和动态拓扑以及静态分组和动态分组。同时,我们还发现控制算法中的α和β越高,所估计的建立时间就越短。同时在我们的研究中,多智能体系统动态拓扑的切换是有限的,在未来的工作中,可以进一步针对时变系统开展有限时间分组一致性研究。
基金项目
国家大学生创新项目(20190060024)、天津市131第二层次创新人才计划项目。
NOTES
*通讯作者。