1. 引言
“Pendubot”由“Pendulum”与“Robot”组合而成,其融合了倒立摆与机器人的结构,具有多自由度、非线性、强耦合、欠驱动的特性。Pendubot是由连接在直流力矩电机转轴上的驱动臂和能自由旋转的摆杆构成,如图1所示。
Pendubot属于串联多节链式结构,不同摆杆之间通过头尾节点相互连接,并且可以绕着节点自由转动,类似锁链。该结构的特点是系统自由度数量就是结构基本环节的数量。Pendubot只有电机驱动一个输入,因此不和电机直接相连的摆杆都是欠驱动的。
根据控制领域研究Pendubot系统所得的规律,系统欠驱动的自由度的数量愈大,系统的可控程度越低。然而,目前控制领域的研究成果中并没有直观的数据或计算公式去量化描述Pendubot的可控度与欠驱动自由度数量的关系。因此本文提出使用可控度指标量化描述该关系。
目前控制领域在获取被控系统的可控度指标方面有两种主要方案:
第一是将研究对象的特性与推导过程相结合,这些指标的准确率更高,但泛用性不强,目前研究领域多采用该种方式,例如晏加元 [1] 等人在双线性系统中融入了图论思想进行模型推导,Anand [2] 的团队则依据神经网络动力系统的离散特性,将推导重心放在了系统在不同模态下的能量需求上。
第二是先推导几个常用的可控度指标,用不同指标计算研究对象的可控度,然后使用仿真实验进行验证,通过分析对比的方式挑选准确度最高的指标。该方法获取的指标虽然描述可控度的准确率相对较低,但是可以推广应用在与研究对象具有相似结构的系统上,泛用性更强。大多数倒立摆系统的欠驱动部件也属于多节链式结构。因此,本文以Pendubot为研究对象,推导并归纳能够量化描述具有多节链式结构的倒立摆系统的可控度的指标。
2. Pendubot建模与可控度推导
本文推导了三种可控度指标,分别是基于格莱姆矩阵的可控度、模态可控度、状态范数可控度。基于格莱姆矩阵的有三种计算方法。三种指标的计算出来的系统可控度数值越大,代表系统可控程度越高。
首先对N节Pendubot进行数学建模。
2.1. Pendubot数学建模
假设Pendubot系统部件均为刚体,设驱动电机的轴心为原点,摆杆所位于的竖直平面为坐标面,建立图2所示的笛卡尔坐标系。
变量定义见表1。
![](Images/Table_Tmp.jpg)
Table 1. Pendubot variable definition
表1. Pendubot变量定义表
那么系统的运动学关系满足公式组1。
(1)
由于本次主要研究系统稳定控制情况下的可控度,因此可以利用平衡位置状态对上述系数矩阵进行线性化处理 [3] 。在平衡位置有
,那么令:
(2)
可以得到公式组3 [4] :
(3)
选取状态变量
,状态
,N节Pendubot的数学模型为公式4所示。其中
为N阶单位阵,
。
(4)
2.2. 基于格莱姆矩阵的可控度
该指标的原理是,对于给定的初始状态,如果将系统控制回原点所需的能力越小,说明系统越容易控制,可控程度越高。
对于一般的线性时变系统,其状态方程如下。
(5)
系统的第二类可控矩阵为:
(6)
设系统初始状态
。若系统在时域
内完全可控,将系统从初始状态
控制到目标状态
所需要的最小能量为:
(7)
上述公式若想计算具体数值需要获取系统的初始状态与时域区间,因此需要进行一般化处理。本文采用初始状态球面
来代替系统的初始状态 [5] 。在初始状态球面任意取一点,可以计算该点控制到初始状态所需的最小能量,那么对于整个球面,可以计算出系统在不同初始状态下的达成稳定所需最小能量的集合,使用该集合元素的平均值或最大值可以间接描述系统的控制难度。同时使用系统的第二类可控矩阵,能够将公式改为与时域无关的形式。
基于上述理论,我们可以得到指标的三种计算方法,见公式组8:
(8)
其中
代表所需最小能量集合的最大值;
代表最小能量集合的平均值;
代表限定最大控制能量
的前提下,能够达成稳定控制的初始状态球面的最大体积。
基于格拉姆矩阵的可控度指标计算步骤少,物理意义明确,限制条件少,适用于绝大多数控制系统。
2.3. 模型模态可控度
模态可控度的核心原理是PBH检验,即,若系数矩阵B的任意一列与矩阵A的转置关于第i个模态的特征向量
不垂直,那么系统的第i个模态可控。该指标仅适用于系统矩阵没有重复特征根的情况 [6] ,同时若系统可控度最小的模态对系统输出的影响占比极小,那么这个指标将没有实际参考意义。
系统系数矩阵A的转置与特征向量的关系可以见公式9。
(9)
其中
为
的第i个特征根。
若系统不存在重根情况,矩阵
的所有特征向量的方向
都是唯一的 [7] ,那么系统第i个模
态的可控度可以由公式10表示。
(10)
其中有
(11)
如此便能够得到系统的模态可控度序列,此时可以用该序列的最小值描述系统的可控度,因此模态可控度的计算方法如公式12所示。
(12)
模态可控度的计算相对简单,可以有效反映系统在不同模态下的可控程度,能在实际研究中更好地制定针对性的控制策略。
2.4. 状态范数可控度
状态范数可控度基于时间最优控制问题提出 [8] ,需要获得系统的精确恢复域,然而在实际中很难得到精确结果,因此需要通过特殊方法进行结果估计。该指标主要针对一些特殊系统。
状态范数可控度需要计算系统输入受限情况下,在恢复时间T内度量系统可恢复的状态集合。设线性时不变系统的输入为
。那么以最常见的能量控制器为例,给定能量约束E,此时系统在时间T内的恢复域的定义为:
(13)
对应的状态范数可控度同公式14,为:
(14)
该公式的基本原理与基于格拉姆矩阵的可控度一致,只不过两者度量的具体指标不同。
3. 可控度验证计算
本节对推导指标在Pendubot上应用的准确率进行验证,假设Pendubot的每节摆杆为均质长方体金属杆,且每节摆杆的物理参数一致,摆杆节点摩擦系数不是本次研究重点,使用固定数值。本节研究计算中每节摆杆宽0.015 m,高0.01 m,密度为3583.34 Kg/m3,节点摩擦系数为0.0002 N/m·s。
改变系统的摆杆数量,即欠驱动的自由度数量,利用指标计算不同节次Pendubot的可控度,观察可控度计算结果随节次大小的变化趋势是否与事实相符合。之后保持Pendubot摆杆数量不变,改变Pendubot每节摆杆的长度,使用同样的计算方法进行进一步的验证。
3.1. 节次变化的计算验证
取1~5节Pendubot,令每节摆杆的长度为0.3 m,计算其状态方程,使用上一节的可控度指标对每个系统进行可控度估计。可控度计算结果如表2所示。
![](Images/Table_Tmp.jpg)
Table 2. Result of change number of Pendubot link
表2. 节次变化可控度计算结果
指标
,所有结果都显示,随着系统节次增加,系统的可控程度不断减小。
接下来使用Simulink仿真进行验证。验证思路为,利用LQR控制器进行收敛控制,计算出的矩阵Q中分配给角度状态的权重大小代表了系统的控制难度,也间接描述了系统的稳定控制可控程度。Simulink电路图见图3。
![](//html.hanspub.org/file/1-2740375x61_hanspub.png?20231025090741790)
Figure 3.Simulink simulation experiment diagram
图3. Simulink仿真实验图
取反馈输入阈值为1.07,控制结果见图4。
![](//html.hanspub.org/file/1-2740375x62_hanspub.png?20231025090741790)
Figure 4. Q matrix result of the change Pendubot Link
图4. 节次变化实验Q矩阵权重结果
从图中看出,随着系统欠驱动自由度数量不断增加,Q矩阵分配给角度状态的权重呈指数级增加,
说明系统控制难度不断增加,可控程度不断减小,与除指标
外的计算结果一致。
3.2. 摆杆长度变化的计算验证
取三节Pendubot,令一至三节摆杆的长度相同,从0.2 m到1 m之间以0.2 m的差距取5组数据进行计算,其结果见表3。
![](Images/Table_Tmp.jpg)
Table 3. Result of change length of pendulum bar
表3. 摆杆长度变化可控度计算结果
除指标
,所有结果都显示,对于每节摆杆参数相同的Pendubot,随着每节摆杆长度的增加,系统的可控程度越低。
同样使用基于LQR控制器进行收敛控制,令输入最大幅值为1.2,结果见图5。
![](//html.hanspub.org/file/1-2740375x70_hanspub.png?20231025090741790)
Figure 5. Q matrix result of the changelength of pendulum bar
图5. 摆杆长度变化实验Q矩阵权重结果
由图得,理想条件下,Pendubot系统稳定控制难度随着单节摆杆长度的增加而增大。与上述部分指标计算结果一致。
3.3. 结论总结与指标选取
经两次验证可得,指
、
、
的计算与事实有出入,经深入探究,误差存在的原因分别为:系
统系数矩阵维度过高、不同状态的参数数值过于接近、无法精确测定系统恢复时间。
结合多节链式结构多阶次、参数可调节、恢复域难以界定的特性,对Pendubot以及同样具有多节链
式结构的系统,使用指标
、
来计算可控度更加合适。
4. Pendubot系统的可控度研究
获得合适的可控度指标后,可以通过数学计算去研究Pendubot欠驱动的自由度的数量变化对系统整体可控度的影响。
4.1. 欠驱动的自由度
对于一个控制系统的自由度,可以由是否被输入直接控制划分为驱动自由度与欠驱动的自由度。以本文研究的Pendubot为例,系统只有电机驱动一个输入,因此除了电机直接驱动的摆杆以外的摆杆都是欠驱动的。若Pendubot的自由度数量为N,那么系统欠驱动的自由度的数量就是(N − 1)。
4.2. 欠驱动自由度对系统可控度衰减度的影响
通过上一节研究可知,随着欠驱动自由度数量的增加,系统可控程度不断减小。这一小节主要研究系统可控程度的衰减速度与系统所含欠驱动自由度数量的关系,而描述衰减速度的数据选用的是当前Pendubot的可控度和与当前系统参数相同的、比当前系统少一个欠驱动自由度的Pendubot的可控度的比值。
取2~6节Pendubot,令所有系统每节摆杆长度0.3 m,计算每个系统与小一个节次的系统的可控度的比值,计算结果如图6所示。
![](//html.hanspub.org/file/1-2740375x76_hanspub.png?20231025090741790)
Figure 6. Result of Pendubot controllability attenuation degree
图6. Pendubot可控度衰减程度计算结果
图中显示,不断增加Pendubot的摆杆数量,即不断提高系统欠驱动的自由度数量,系统可控度的衰减幅度在不断增加,这反映了随着欠驱动自由度数量的提升,系统的可控程度不仅在不断减小,其减小的速度也在不断提升。这一数据结果反映出,随着Pendubot系统的摆杆数量增加,实现系统稳定控制的控制难度在不断向着难度更高的状态变化,同时这一变化的幅度也随着系统欠驱动自由度的数量增加而增大。因此对于实际的Pendubot或其它倒立摆系统控制课题中,摆杆数量的提升会极大地提高控制成本,从而进一步证明了成本估计在该类课题中地重要性;同时对于同样具有类似多节链式结构的系统,若链式环节的数量过多,那么实现系统的收敛控制在硬件环境下将失去研究意义。
4.3. 不同自由度的欠驱动环节对系统可控度的影响
同样令每节摆杆长度为0.3 m,计算2~6节Pendubot与无欠驱动环节的、只有一节驱动臂的Pendubot的可控度比值。结果如图7所示。
![](//html.hanspub.org/file/1-2740375x77_hanspub.png?20231025090741790)
Figure 7. Influence of underactuated link
图7. 欠驱动环节影响程度
图中显示,若多节链式结构的欠驱动部件自由度数量越多,那么系统整体的可控度更小。该现象反映出,被控系统的欠驱动环节对系统的可控度存在着负面作用,同时作用程度与欠驱动环节的自由度数量呈显著正相关关系。那么此处可以作一个初步定义,即对于多节链式结构的欠驱动环节,其自由度数量越多,系统的“欠驱动的程度”也更高。综上所述,对于欠驱动环节可解耦的系统,可以用该环节的自由度数量来间接描述系统的欠驱动程度。
5. 结论
本文推导了多个可控度指标,并以Pendubot系统为例,分析比较了不同指标描述含有多节链式结构的控制系统的可控度的准确度,进而归纳选取了最能准确量化描述该类系统可控度的指标。同时通过数据计算,从数值角度证明了,随着多节链式Pendubot欠驱动的自由度数量不断增加,其可控度衰减速度越来越快,同时欠驱动环节对系统整体的负面作用也更大。最后使用该指标对控制系统的“欠驱动度”进行了初步的数值描述。
基金项目
此项工作得到北京航空航天大学“双一流”课程建设资助。