一类无穷时域上布尔网络最优控制问题的求解方法

doi:10.12677/AAM.2019.82035

期刊菜单

一类无穷时域上布尔网络最优控制问题的求解方法
A Method for Solving a Class of Optimal Control Problem of Boolean Networks on Infinite Horizon

DOI: 10.12677/AAM.2019.82035, PDF, HTML, XML, 下载: 1,125 浏览: 1,448 国家自然科学基金支持
作者: 周荧：贵州大学，数学与统计学院，贵州贵阳；韦维, 符繁强, 钱柳：贵州民族大学，数据科学与信息工程学院，贵州贵阳
关键词: 无穷时域；布尔网络；最优控制；Infinite Horizon； Boolean Network； Optimal Control

摘要: 布尔网络是描述基因调控、细胞分化等系统生物学的有力工具。布尔网络系统的最优控制问题已经成为当前控制领域的研究热点问题之一。本文主要研究布尔网络系统取目标泛函最大化的最优控制问题。首先，给出有限时域上问题的求解方法；其次，在该方法的基础上，对无穷时域上的问题进行研究，给出无穷时域上目标泛函最大化的布尔网络最优控制问题的可解性和求解方法；最后，将方法应用到一个具体的实例上。

Abstract: Boolean network is a powerful tool for describing biological system, such as gene regulation and cell differentiation. The optimal control problem of Boolean networks system has become one of the hot research issues in the field of control on the current. In this paper, we mainly study the optimal control problem of the Boolean network system to maximize the target functional. Firstly, we give the solution method of the problem in finite horizon; secondly, based on the method, the problem in infinite horizon is studied, as well as we give the solvability and solution method of the problem in infinite horizon; in the end, we apply our method to a concrete example.

文章引用：周荧, 韦维, 符繁强, 钱柳. 一类无穷时域上布尔网络最优控制问题的求解方法[J]. 应用数学进展, 2019, 8(2): 309-319. https://doi.org/10.12677/AAM.2019.82035

1. 引言

上世纪六十年代，Jacob和Monod两位教授发现在任何细胞中都包含着几个类似开关一样的调节基因，它们能够打开或者关闭其他的基因 [1] 。1969年，美国学者Kauffman在文献 [1] 的研究基础上，首次提出用布尔网络来刻画细胞和基因调控网络的理论，将基因的表达与不表达用“1”和“0”来表示 [2] 。随后，布尔网络被广泛应用于描述人工智能、神经网络、基因调控等系统，成为系统生物学家、物理学家和系统科学家们共同关心的热点问题。

动态布尔网络系统各节点状态的变化可描述为布尔状态变量的离散时间系统，每一个节点在下一时刻的状态由它及其相邻节点的当前状态确定，数学上可以用布尔函数来描述。为了使用控制论和最优控制理论解决布尔控制系统问题，其关键是如何将逻辑运算表示为相应的代数运算，矩阵半张量积的引入较好地解决了这个瓶颈问题。

矩阵半张量积是中国科学院程代展教授在1998年首次提出的，并在此后多年逐步发展和不断完善。早期的结果被收录在文献 [3] [4] 中，主要结果出版在专著 [5] [6] 中。矩阵半张量积的方法可以将复杂的逻辑推理过程转变为简单的代数形式，该方法激发了国内外众多学者在布尔网络方面的大量研究工作。

关于布尔网络的最优控制问题，2011年，Laschov和Margaliot教授基于矩阵半张量积方法，研究单输入和多输入布尔控制网络Mayer型最优控制问题 [7] [8] ，导出了这一最优控制问题的Pontryagin极大值原理。同年，赵寅等在文献 [9] 中研究了无穷时域上的动态布尔网络控制系统，以及如何寻找最大化序列使其在平均支付条件下目标泛函最大化的问题，运用不动点及极限环等拓扑性质，证明了最优控制可以在乘积空间的一个环上得到，并且具备周期性。李海涛等在文献 [10] 中运用输入–状态关联矩阵研究布尔控制网络Mayer型最优控制问题的求解方法，给出了该问题的最优控制策略。2014年，Fornasini和Elena教授提出求解目标泛函取最小值的逻辑动态网络系统最优控制的一种新的求解方法。在此基础上研究了无穷时域上最优控制问题可解的充分必要条件，并说明可选择一种输入，使其状态经过有限步后，状态–控制对呈现周期性和目标泛函效用为零，因而将无穷时域的最小控制问题转换为有限时域的最优控制问题，从而导出了无穷时域目标泛函最小化问题求解的一种新方法 [11] 。但该方法不能直接用于布尔控制网络目标泛函极大化问题的求解，因其是居于目标泛函非负而设计的算法，不能直接套用经典的最优控制问题中目标泛函的最大化和最小化通过乘以−1相互转化的办法得到。因此，本文主要研究布尔控制网络目标泛函最大化的最优控制问题。本文在给出有限时域上布尔网络控制系统目标泛函最大化求解方法的基础上，给出无穷时域上布尔网络控制最大化问题的可解性和求解方法，最后给出一个具体的算例。

2. 预备知识

2.1. 符号说明

· $ℝ^{n}$ 是实数域上的n维向量空间。

· $M_{m \times n}$ 是 $m \times n$ 维实矩阵集合。

· $I_{n}$ 是n维单位矩阵。

· $Δ_{n} = {δ_{n}^{i} | i = 1, 2, \dots, n}$ ，其中 $δ_{n}^{i}$ 为单位矩阵 $I_{n}$ 的第i列，特别地 $Δ_{2} = Δ$ 。

· 矩阵 $L = [δ_{n}^{i_{1}}, δ_{n}^{i_{2}}, \dots, δ_{n}^{i_{m}}] \in L_{n \times m}$ ，记为 $L = δ_{n} [i_{1}, i_{2}, \dots, i_{m}]$ 。

· 逻辑变量 $x \in D = {0, 1}$ 。

· $\otimes$ 是矩阵的Kronecker积。

2.2. 矩阵半张量积的定义及性质

定义2.2.1 [5] ：给定矩阵 $A \in M_{m \times n}, B \in M_{p \times q}$ 。A与B的半张量积记成

$A ⋉ B = (A \otimes I_{t / n}) (B \otimes I_{t / p})$

其中 $t = l c m (n, p)$ 是 ${n, p}$ 的最小公倍数。

命题2.2.1 [5] ：矩阵半张量积满足

1) 分配律：

$(A + B) ⋉ C = A ⋉ C + B ⋉ C$

$C ⋉ (A + B) = C ⋉ A + C ⋉ B$

2) 结合律

$(A ⋉ B) ⋉ C = A ⋉ (B ⋉ C)$

3) 转置

${(A ⋉ B)}^{T} = B^{T} ⋉ A^{T}$

为进一步实现交换运算，定义如下换位矩阵。

定义2.2.2 [5] ：换位矩阵 $W_{[m, n]}$ 是一个 $m n \times m n$ 维矩阵，它的行由双指标 $(I, J)$ 依次标注并按索引 $I d (I, J; m, n)$ 排列，列由双指标 $(i, j)$ 依次标注并按索引 $I d (i, j; n, m)$ 排列，位于 $(I, J)$ 行 $(i, j)$ 列的元素为

$W_{(I, J), (i, j)} = {\begin{cases} 1, I = i 且 J = j \\ 0, 其他 \end{cases}$

特别地，当 $m = n$ 时，记 $W_{[n]} = W_{[n, n]}$ 。

通过换位矩阵，可以实现矩阵的伪交换性质。

命题2.2.2 [5] ：给定矩阵 $A \in M_{m \times n}$ 。

1) 设 $X \in ℝ^{n}$ ， $Y \in ℝ^{m}$ 为列向量，则

$W_{[n, m]} ⋉ X ⋉ Y = Y ⋉ X, W_{[m, n]} ⋉ Y ⋉ X = X ⋉ Y$

2) 设 $X \in ℝ^{n}$ 为列向量, $Y \in ℝ^{m}$ 为行向量，则

$X ⋉ Y = Y ⋉ W_{[n, m]} ⋉ X$

3) 设 $Z \in ℝ^{t}$ 为列向量，则

$Z ⋉ A = W_{[m, t]} ⋉ A ⋉ W_{[t, n]} ⋉ Z = (I_{t} \otimes A) ⋉ Z$

4) 设 $Z \in ℝ^{t}$ 为行向量，则

$A ⋉ Z = Z ⋉ W_{[m, t]} ⋉ A ⋉ W_{[t, n]} = Z ⋉ (I_{t} \otimes A)$

命题2.2.3 [6] ：

哑矩阵 $E_{d} = δ_{2} [1 2 1 2]$ ，具有如下性质：对于任意矩阵 $X, Y \in Δ_{2}$

$E_{d} X Y = Y, E_{d} W_{[2]} X Y = X$

命题2.2.3 [6] ：

降阶矩阵 $M_{r} = [\begin{array}{l} \begin{matrix} δ_{2}^{1} & 0_{2} \end{matrix} \\ \begin{matrix} 0_{2} & δ_{2}^{2} \end{matrix} \end{array}]$ ，具有如下性质：对于任意 $X \in Δ_{2}$ ，

$X^{2} = M_{r} X$

命题2.2.6 [6] ：

常用逻辑算子：非( $\neg$ )，合取( $\land$ )，析取( $\lor$ )，等值( $\leftrightarrow$ )，异或( $\bar{\lor}$ )的结构矩阵为

$\begin{array}{l} M_{n} = δ_{2} [2, 1], M_{c} = δ_{2} [1, 2, 2, 2], M_{d} = δ_{2} [1, 1, 1, 2], \\ M_{e} = δ_{2} [1, 2, 2, 1], M_{m} = δ_{2} [2, 1, 1, 2] \end{array}$

3. 问题描述

3.1. 问题的提出

考虑布尔网络控制系统

${\begin{cases} x_{1} (k + 1) = f_{1} (x_{1} (k), x_{2} (k), \dots, x_{n} (k), u_{1} (k), u_{2} (k), \dots, u_{m} (k)), \\ x_{2} (k + 1) = f_{2} (x_{1} (k), x_{2} (k), \dots, x_{n} (k), u_{1} (k), u_{2} (k), \dots, u_{m} (k)), \\ ⋮ \\ x_{n} (k + 1) = f_{n} (x_{1} (k), x_{2} (k), \dots, x_{n} (k), u_{1} (k), u_{2} (k), \dots, u_{m} (k)), \end{cases}$ (1)

其中 $x_{i} (k) \in D, i = 0, 1, 2, \dots, n$ 为系统的状态变量， $u_{i} (k) \in D, i = 0, 1, 2, \dots, m$ 为系统的控制变量， $f_{i} : D^{n + m} \to D$ 为布尔函数。设初始状态 $x (0)$ ，终端状态 $x (K)$ 给定。

容许控制集： $u_{a d} = {u : N \to D^{m}, u_{i} (k) \in D, k = 0, 1, 2, \dots, K - 1}$

目标泛函：

$J = λ^{K} Φ_{f} (x (K)) + \sum_{k = 0}^{K - 1} λ^{k} Φ (u (k), x (k))$ (2)

其中 $0 < λ < 1, K > 0$ 给定， $Φ_{f} (\cdot) : D^{n} \to D, Φ (\cdot, \cdot) : D^{n + m} \to D$ 上的有界效用函数。

问题(P)：寻找 $u^{*} \in u_{a d}, s . t, J (u^{*}) \geq J (u), \forall u \in u_{a d}$ 。

3.2. 问题(P)的半张量表达形式

引理3.2.1 [6] ：设任意n元布尔函数 $f (x_{1}, x_{2}, \dots, x_{n}) : D^{n} \to D$ ，存在唯一的逻辑矩阵 $M_{f} \in L_{2 \times 2^{n}}$ 。

使在向量形式下

$f (x_{1}, x_{2}, \dots, x_{n}) = M_{f} ⋉_{i}^{n} {\hat{x}}_{i}$ (3)

其中 ${\hat{x}}_{i} \in Δ$ ， $M_{f}$ 称为函数f的结构矩阵，(3)式称为布尔函数f的代数形式。

对于受控系统(1)，令 $\hat{x} (k) = ⋉_{i}^{n} {\hat{x}}_{i} (k), \hat{u} (k) = ⋉_{i}^{m} {\hat{u}}_{i} (k)$ ，由引理3.2.1，对于每一个布尔函数 $f_{i}$ ，可以找到与之相对应的结构矩阵 $M_{i}$ ，使得

${\hat{x}}_{i} (k + 1) = M_{i} ⋉ \hat{u} (k) ⋉ \hat{x} (k), i = 1, 2, \dots, n$ (4)

把(4)中n个方程相乘，应用矩阵半张量的性质，得到系统(1)的代数表达式

$\hat{x} (k + 1) = L ⋉ \hat{u} (k) ⋉ \hat{x} (k)$ (5)

其中 $\hat{x} (k) = ⋉_{i}^{n} {\hat{x}}_{i} (k) \in Δ_{2^{n}}$ 是系统的状态变量， $\hat{u} (k) = ⋉_{i}^{n} {\hat{u}}_{i} (k) \in Δ_{2^{m}}$ 是系统的控制变量， $L \in L_{2^{n} \times 2^{n + m}}$ ，称为受控系统(1)的状态转移矩阵。

引理3.2.2 [6] ：设任意n元伪布尔函数 $f ({\hat{x}}_{1}, {\hat{x}}_{2}, \dots, {\hat{x}}_{n}) : D^{n} \to ℝ$ ，存在唯一的行向量 $V_{f} \in ℝ^{2^{n}}$ 。

使在向量形式下

$f ({\hat{x}}_{1}, {\hat{x}}_{2}, \dots, {\hat{x}}_{n}) = V_{f} ⋉_{i}^{n} {\hat{x}}_{i}$ (6)

其中 ${\hat{x}}_{i} \in Δ$ ， $V_{f}$ 称为伪布尔函数f的结构向量。

对于受控系统(1)的目标泛函(2)，令 $\hat{x} (k) = ⋉_{i}^{n} {\hat{x}}_{i} (k), \hat{u} (k) = ⋉_{i}^{m} {\hat{u}}_{i} (k)$ ，由引理3.2.2，目标泛函可转化为如下形式

$\begin{matrix} J (\hat{u}) = λ^{K} Φ_{f} (\hat{x} (K)) + \sum_{k = 0}^{K - 1} λ^{k} Φ (\hat{u} (k), \hat{x} (k)) \\ = λ^{K} Φ_{f}^{T} ⋉ \hat{x} (K) + \sum_{k = 0}^{K - 1} λ^{k} Φ^{T} ⋉ \hat{u} (k) ⋉ \hat{x} (k) \end{matrix}$ (7)

其中 $0 < λ < 1, K > 0$ 给定， $Φ_{f} (\cdot) : D^{n} \to ℝ, Φ (\cdot, \cdot) : D^{n + m} \to M_{2^{m} \times 2^{n}}$ 的有界效用函数， $Φ_{f}^{T}, Φ^{T}$ 可按如下方式选取：

$\begin{array}{l} Φ_{^{f}}^{T} = α^{T} \hat{x} (K) \\ = [α^{T} ⋉ δ_{2^{n}}^{1} α^{T} ⋉ δ_{2^{n}}^{2} \dots α^{T} ⋉ δ_{2^{n}}^{2^{n}}] \\ = [Φ_{f} (δ_{2^{n}}^{1}) Φ_{f} (δ_{2^{n}}^{2}) \dots Φ_{f} (δ_{2^{n}}^{2^{n}})] \in ℝ \end{array}$

其中 $α \in ℝ^{2^{n}}, {a_{i} \in α | a_{i} = i, i = 1, \dots, 2^{n}}$

$\begin{array}{l} Φ^{T} = \hat{u} {(k)}^{T} ⋉ A ⋉ \hat{x} (k) \\ = [Φ (δ_{2^{m}}^{1}, δ_{2^{n}}^{1}) \dots (δ_{2^{m}}^{1}, δ_{2^{n}}^{2^{n}}) | \dots | Φ (δ_{2^{m}}^{2^{m}}, δ_{2^{n}}^{1}) \dots Φ (δ_{2^{m}}^{2^{m}}, δ_{2^{n}}^{2^{n}})] \\ = [Φ_{1}^{T} | \dots | Φ_{2^{m}}^{T}] \in M_{2^{m} \times 2^{n}} \end{array}$

其中 $A \in M_{2^{m} \times 2^{n}}, {a_{i j} \in A | a_{i j} = i + j, i = 1, \dots, 2^{m}, j = 1, \dots, 2^{n}}$ 。

进而可以得到如下半张量形式的布尔网络最优控制问题：

受控系统： $\hat{x} (k + 1) = L ⋉ \hat{u} (k) ⋉ \hat{x} (k)$

初始状态 $\hat{x} (0) \in Δ$ ，终端状态 $\hat{x} (K) \in Δ$ 给定。

容许控制集： ${\hat{u}}_{a d} = {\hat{u} (k) : = ⋉_{i}^{m} {\hat{u}}_{i} (k), {\hat{u}}_{i} (k) \in Δ, k = 0, 1, 2, \dots, K - 1}$

目标泛函：

$J (\hat{u}) = λ^{K} Φ_{f}^{T} ⋉ \hat{x} (K) + \sum_{k = 0}^{K - 1} λ^{k} Φ^{T} ⋉ \hat{u} (k) ⋉ \hat{x} (k)$ (8)

问题( $\hat{P}$ )：寻找 ${\hat{u}}^{*} \in {\hat{u}}_{a d}, s . t ., J ({\hat{u}}^{*}) \geq J (\hat{u}), \forall \hat{u} \in {\hat{u}}_{a d}$ 。

4. 问题求解

4.1. 有限时域上布尔网络最优控制问题的求解方法

我们注意到对任意时刻的控制输入 $\hat{u} (k) = δ_{2^{m}}^{i}$ ，令 $L ⋉ \hat{u} (k) = L_{i} \in L_{2^{n} \times 2^{n}}$ ，则可把布尔控制网络系统(5)看成一个布尔切换系统 [12] [13] [14] [15] ，自然地，布尔切换系统的第i个子系统是一个布尔系统。从而得到

$\hat{x} (k + 1) = L_{i} \hat{x} (k), i \in [1, 2^{m}]$ (9)

系统(5)的状态转移矩阵L可以表示为

$L = [L_{1} L_{2} \dots L_{2^{m}}]$ (10)

下面考虑有限时域 $(K = N < \infty)$ 时布尔网络最优控制问题的求解方法。

因对任意n维非正向量 $ω (k), k \in [0, K]$ 和状态 $\hat{x} (k), k \in [0, K]$ ，成立下列恒等式：

$0 = ω {(0)}^{T} ⋉ \hat{x} (0) + \sum_{k = 0}^{K - 1} [ω {(k + 1)}^{T} ⋉ \hat{x} (k + 1) - ω {(k)}^{T} ⋉ \hat{x} (k)] - ω {(K)}^{T} ⋉ \hat{x} (K)$ (11)

因此，由(8)式-(11)式可得

$\begin{array}{l} J (\hat{u}) = - ω {(0)}^{T} ⋉ \hat{x} (0) + (λ^{K} Φ_{f}^{T} + ω {(K)}^{T}) ⋉ \hat{x} (K) \\ + \sum_{k = 0}^{K - 1} λ^{k} Φ^{T} ⋉ \hat{u} (k) ⋉ \hat{x} (k) - \sum_{k = 0}^{K - 1} [ω {(k + 1)}^{T} ⋉ \hat{x} (k + 1) - ω {(k)}^{T} \hat{x} (k)] \end{array}$ (12)

又因为 $\hat{u} (k) = δ_{2^{m}}^{i}, i \in [1, 2^{m}]$ ，故对任意状态 $\hat{x} (k), k \in [0, K]$ ，成立

$ω {(k)}^{T} \hat{x} (k) = [ω {(k)}^{T} ω {(k)}^{T} \dots ω {(k)}^{T}] ⋉ \hat{u} (k) ⋉ \hat{x} (k)$ (13)

将(13)式代入(12)式得

$\begin{array}{l} J (\hat{u}) = - ω {(0)}^{T} ⋉ \hat{x} (0) + (λ^{K} Φ_{f}^{T} + ω {(K)}^{T}) ⋉ \hat{x} (K) \\ + \sum_{k = 0}^{K - 1} (λ^{k} Φ^{T} - ω {(k + 1)}^{T} L + [ω {(k)}^{T} \dots ω {(k)}^{T}]) ⋉ \hat{u} (k) ⋉ \hat{x} (k) \end{array}$ (14)

令

$\begin{matrix} ψ {(k)}^{T} = [ψ_{1} {(k)}^{T} ψ_{2} {(k)}^{T} \dots ψ_{2^{m}} {(k)}^{T}] \\ = [λ^{k} Φ_{1}^{T} λ^{k} Φ_{2}^{T} | \dots | λ^{k} Φ_{2^{m}}^{T}] - ω {(k + 1)}^{T} [L_{1} L_{2} \dots L_{2^{m}}] + [ω {(k)}^{T} ω {(k)}^{T} \dots ω {(k)}^{T}] \end{matrix}$ (15)

即(14)式可等价表示为

$\begin{array}{l} J (\hat{u}) = - ω {(0)}^{T} ⋉ \hat{x} (0) + (λ^{K} Φ_{f}^{T} + ω {(K)}^{T}) ⋉ \hat{x} (K) \\ + \sum_{k = 0}^{K - 1} {[ψ_{1} {(k)}^{T} ψ_{2} {(k)}^{T} \dots ψ_{2^{m}} (k)]}^{T} ⋉ \hat{u} (k) ⋉ \hat{x} (k) \end{array}$ (16)

为使目标泛函(16)式达到最大，根据贝尔曼动态规划方法的最优性原理，我们希望每一步的取值达到最大，即取 $ω (K)$ 为零向量时使终端达到最大，对 $\forall k \in [0, K - 1], j \in [1, 2^{n}]$ ，存在 $i \in [1, 2^{m}]$ 使得向量 ${[ψ_{i} (k)]}_{j} = 0$ ，否则 ${[ψ_{i} (k)]}_{j} \leq 0$ 。

因此，我们设计如下算法，使目标泛函(16)式达到最大：

Step 1：设向量 $ω (K) = 0_{2^{n}}^{T}$ ；

Step 2：当 $k = K - 1, K - 2, \dots, 1, 0$ ，向量 $ω (k)$ 的第j项为

$- {[ω (k)]}_{j} = \max_{i \in [1, 2^{m}]} (λ^{k} {[Φ_{i}]}_{j} - {[ω {(k + 1)}^{T} L_{i}]}_{j}), \forall j \in [1, 2^{n}];$

Step 3：使目标泛函(16)式达到最大值的控制输入序列 $\hat{u} (k), k \in [0, K - 1]$ 可选择如下：

对 $\forall \hat{x} (k) = δ_{2^{n}}^{j}$ ，可得 $\hat{u} (k) = δ_{2^{m}}^{i^{*} (j, k)}$ 。

其中

$i^{*} (j, k) = \arg \max_{i \in [1, 2^{m}]} (λ^{k} {[Φ_{i}]}_{j} - {[ω {(k + 1)}^{T} L_{i}]}_{j}), j \in [1, 2^{n}]$

注1：事实上，根据算法的设计，最优控制序列 $\hat{u} (k)$ 实际上是一个反馈控制，即

$\hat{u} (k) = Η (k) \hat{x} (k)$

其中

$Η (k) = [δ_{2^{m}}^{i^{*} (1, k)} δ_{2^{m}}^{i^{*} (2, k)} \dots δ_{2^{m}}^{i^{*} (2^{n}, k)}]$

注2：根据贝尔曼动态规划方法，令值函数为

${\begin{cases} J_{K} (\hat{x} (K)) = \max_{\hat{u} (K - 1) \in Δ_{2^{m}}} λ^{K} Φ_{f}^{T} ⋉ δ_{2^{n}}^{j} \\ J_{[0, K - 1]} (\hat{x} (k), \hat{u} (\cdot)) = J_{[0, K - 1]} (δ_{2^{n}}^{j}, \hat{u} (\cdot)) = \max_{\hat{u} (\cdot) \in Δ_{2^{m}}} {λ^{K} Φ_{f}^{T} ⋉ δ_{2^{n}}^{j} + J_{k + 1} (δ_{2^{n}}^{j}, \hat{u} (\cdot))} \end{cases}$

由本文设计的算法可知

$- {[ω (k)]}_{j} = \max_{\hat{u} (k) \in Δ_{2^{m}}} J (δ_{2^{n}}^{j}, \hat{u} (\cdot))$

$- {[ω (k)]}_{j} = \max_{\hat{u} (k) \in Δ_{2^{m}}} {λ^{K} Φ_{f}^{T} ⋉ δ_{2^{n}}^{j} + J_{k + 1} (δ_{2^{n}}^{j}, \hat{u} (\cdot))}$

$- {[ω (k)]}_{j} = \max_{\hat{u} (k) \in Δ_{2^{m}}} {λ^{K} Φ_{f}^{T} ⋉ δ_{2^{n}}^{j}} + \max_{\hat{u} (k) \in Δ_{2^{m}}} {J_{k + 1} (δ_{2^{n}}^{j}, \hat{u} (k))}$

从中我们得到，本文给出的方法与动态规划算法的求解结果相一致。

综上，我们得到了有限时域上布尔网络最优控制问题的求解方法。

4.2. 无穷时域上布尔网络最优控制的求解方法

下面我们考虑受控系统(5)支配下，无穷时域 $(K \to \infty)$ 上的布尔网络最优控制问题。设目标泛函为

$J (\hat{u}) = \sum_{k = 0}^{\infty} λ^{k} Φ (\hat{u} (k), \hat{x} (k))$ (17)

其中 $0 < λ < 1$ ， $Φ (\cdot, \cdot) : D^{n + m} \to M_{2^{n} \times 2^{m}}$ 上的有界效用函数。

对于无穷时域上的最优控制问题，其最优控制问题的可解性等价于目标泛函中无穷级数的收敛性。如下定理给出无穷时域上布尔网络最优控制问题的求解方法。

定理4.2.1：对布尔控制系统(5)以及目标泛函(17)，总存在最优控制 ${\hat{u}}^{*} (k)$ ，且当有限时域中终端步K取得充分大时，从有限时域上求得的最优控制序列 ${\hat{u} {(1)}^{*}, \hat{u} {(2)}^{*}, \dots, \hat{u} {(K)}^{*}}$ 与无穷时域上的最优控制序列的前K个值一致。

证明：令 $M = \max_{\hat{u} (k), \hat{x} (k) \in Δ} | Φ (\hat{u} (k), \hat{x} (k)) |$ ，则由 $\hat{u} (k), \hat{x} (k)$ 都是有限维向量， $Φ (\cdot, \cdot) : D^{n + m} \to M_{2^{m} \times 2^{n}}$

上有界函数，可知 $M < + \infty$ ，所以无穷级数 $\sum_{k = 0}^{\infty} λ^{k} Φ (\hat{u} (k), \hat{x} (k))$ 的优级数为 $M \sum_{k = 0}^{\infty} λ^{k}$ 是收敛的。

即无穷级数 $\sum_{k = 0}^{\infty} λ^{k} Φ (\hat{u} (k), \hat{x} (k))$ 一致收敛。故对任意给定的 $ε > 0$ ，存在足够大的p，使得

$| \sum_{k = p}^{\infty} λ^{k} Φ (\hat{u} (k), \hat{x} (k)) | \leq \sum_{k = p}^{\infty} λ^{p} M = \frac{λ^{p + 1}}{1 - λ} M < \frac{ε}{2}$

不妨设 $K = p$ ，考虑受控系统如下求解有限时域最优控制问题

$J_{K} ({\hat{x}}_{0}, \hat{u}) = \sum_{k = 0}^{K} λ^{k} Φ (\hat{u} (k), \hat{x} (k))$

若 ${\hat{u} {(1)}^{*}, \hat{u} {(2)}^{*}, \dots, \hat{u} {(K)}^{*}}$ 为 $J_{K} ({\hat{x}}_{0}, \hat{u})$ 的最优控制，若 ${{\hat{u}}^{\infty} {(1)}^{*}, {\hat{u}}^{\infty} {(2)}^{*}, \dots, {\hat{u}}^{\infty} {(K)}^{*}, \dots}$ 为 $J_{\infty} ({\hat{x}}_{0}, \hat{u})$ 的最优控制，则有

$J_{K} ({\hat{x}}_{0}; \hat{u} {(1)}^{*}, \hat{u} {(2)}^{*}, \dots, \hat{u} {(K)}^{*}) - J_{\infty} ({\hat{x}}_{0}; {\hat{u}}^{\infty} {(1)}^{*}, {\hat{u}}^{\infty} {(2)}^{*}, \dots, {\hat{u}}^{\infty} {(K)}^{*}, \dots) \leq ε$

否则

$\begin{array}{l} J ({\hat{x}}_{0}; \hat{u} {(1)}^{*}, \hat{u} {(2)}^{*}, \dots, \hat{u} {(K)}^{*}, {\hat{u}}^{\infty} {(K + 1)}^{*}, \dots) - J ({\hat{x}}_{0}; {\hat{u}}^{\infty} {(1)}^{*}, {\hat{u}}^{\infty} {(2)}^{*}, \dots, {\hat{u}}^{\infty} {(K)}^{*}, \dots) \\ = \sum_{k = 0}^{K} λ^{k} [Φ (\hat{u} {(k)}^{*}, \hat{x} {(k)}^{*}) - Φ ({\hat{u}}^{\infty} {(k)}^{*}, {\hat{x}}^{\infty} {(k)}^{*})] \\ + \sum_{k = K}^{\infty} λ^{k} [Φ (\hat{u} {(k)}^{*}, \hat{x} {(k)}^{*}) - Φ ({\hat{u}}^{\infty} {(k)}^{*}, {\hat{x}}^{\infty} {(k)}^{*})] \\ > ε - 2 \cdot \frac{ε}{2} = 0 \end{array}$

这与 ${\hat{u}}^{\infty} {(k)}^{*}$ 为最优控制相矛盾，即无穷时域上的最优控制存在。 $□$

注3：当K取得足够大时，无穷时域上的最优控制序列 ${{\hat{u}}^{\infty} {(1)}^{*}, {\hat{u}}^{\infty} {(2)}^{*}, \dots, {\hat{u}}^{\infty} {(K)}^{*}, \dots}$ 可从有限时域得到的最优控制序列 ${\hat{u} {(1)}^{*}, \hat{u} {(2)}^{*}, \dots, \hat{u} {(K)}^{*}}$ 逐次逼近得到。

5. 应用实例

上述方法为我们求解布尔网络最优控制问题提供了一种思路清晰，行之有效的求解方法，下面将给出实例具体验证方法的可行性。

考虑如下布尔网络最优控制问题

${\begin{cases} x_{1} (k + 1) = \neg (x_{1} (k) \leftrightarrow x_{2} (k)), \\ x_{2} (k + 1) = \neg (x_{2} (k) \leftrightarrow x_{3} (k)), \\ x_{3} (k + 1) = u (k) \land x_{1} (k), \end{cases}$ (18)

其中 $x_{i} (k) \in D, i = 1, 2, 3$ 为系统状态变量， $u (k) \in D$ 为系统控制变量， $f_{i} : D^{3+ 1} \to D$ 为布尔函数。设初值 $x_{1} (0) = 1, x_{2} (0) = 0, x_{3} (0) = 1$ ,终端 $x_{1} (4) = 0, x_{2} (4) = 0, x_{3} (4) = 0$ ,目标泛函为

$J = {(0.9)}^{4} Φ_{f} (x (4)) + \sum_{k = 0}^{3} {(0.9)}^{k} Φ (u (k), x (k))$ (19)

其中上的有界效用函数。

问题(Q)求使目标泛函(19)式达到最大的控制序列 ${u^{*} (0), u^{*} (1), u^{*} (2), u^{*} (3)}$ 。

解：首先，将布尔网络系统的最优控制问题转化代数形式的最优控制问题；

①将上述布尔控制网络系统(18)转化为代数形式

令 $\hat{x} (k) = {\hat{x}}_{1} (k) ⋉ {\hat{x}}_{2} (k) ⋉ {\hat{x}}_{3} (k) \in Δ$ 为系统状态变量， $\hat{u} (k) \in Δ$ 为系统控制变量

${\begin{cases} {\hat{x}}_{1} (k + 1) = M_{m} ⋉ {\hat{x}}_{1} (k) ⋉ {\hat{x}}_{2} (k), \\ {\hat{x}}_{2} (k + 1) = M_{m} ⋉ {\hat{x}}_{2} (k) ⋉ {\hat{x}}_{3} (k), \\ {\hat{x}}_{3} (k + 1) = M_{c} ⋉ \hat{u} (k) ⋉ {\hat{x}}_{1} (k), \end{cases}$ (20)

$\begin{array}{l} \hat{x} (k + 1) = M_{m} ⋉ {\hat{x}}_{1} (k) ⋉ {\hat{x}}_{2} (k) ⋉ M_{m} ⋉ {\hat{x}}_{2} (k) ⋉ {\hat{x}}_{3} (k) ⋉ M_{c} ⋉ \hat{u} (k) ⋉ {\hat{x}}_{1} (k) \\ = M_{m} ⋉ (I_{4} \otimes M_{m}) ⋉ (I_{2} \otimes M_{r}) ⋉ (I_{8} \otimes M_{c}) ⋉ W_{[4, 8]} ⋉ (I_{2} \otimes M_{r}) ⋉ \hat{u} (k) ⋉ \hat{x} (k) \\ = L ⋉ \hat{u} (k) ⋉ \hat{x} (k) \end{array}$

此时，布尔控制网络系统的状态转移矩阵为

$L = δ_{8} [7 5 1 3 4 2 6 8 8 6 2 4 4 2 6 8] \in L_{2^{3} \times 2^{3 + 1}}$

②将目标泛函(19)式中的伪布尔函数转化为半张量形式

$J = {(0.9)}^{4} Φ_{f}^{T} ⋉ \hat{x} (4) + \sum_{k = 0}^{3} {(0.9)}^{k} Φ^{T} ⋉ \hat{u} (k) ⋉ \hat{x} (k)$ (21)

其中

$\begin{array}{l} Φ_{^{f}}^{T} = α^{T} \hat{x} (K) \\ = [α^{T} ⋉ δ_{8}^{1} α^{T} ⋉ δ_{8}^{2} \dots α^{T} ⋉ δ_{8}^{8}] \\ = [1 2 3 4 5 6 7 8] \end{array}$

其中 $α \in ℝ^{8}, {a_{i} \in α | a_{i} = i, i = 1, 2, \dots, 8}$ 。

$\begin{array}{l} Φ^{T} = \hat{u} {(k)}^{T} ⋉ A ⋉ \hat{x} (k) \\ = [Φ (δ_{2}^{1}, δ_{8}^{1}) \dots Φ (δ_{2}^{1}, δ_{8}^{8}) Φ (δ_{2}^{2}, δ_{8}^{1}) \dots Φ (δ_{2}^{2}, δ_{8}^{8})] \\ = [Φ_{1}^{T} Φ_{2}^{T}] \\ = [\begin{array}{l} 2 3 4 5 6 7 8 9 \\ 3 4 5 6 7 8 9 10 \end{array}] \end{array}$

其中 $A \in M_{2 \times 8}, {a_{i j} \in A | a_{i j} = i + j, i = 1, 2, j = 1, 2, \dots, 8}$ 。

③求解问题( $\hat{Q}$ )给定初值状态 $\hat{x} (0) = δ_{8}^{3}$ ，终端状态 $\hat{x} (4) = δ_{8}^{8}$ ，求使受控系统在半张量形式下的目标泛函(21)式达到最大的最优控制序列 ${{\hat{u}}^{*} (0), {\hat{u}}^{*} (1), {\hat{u}}^{*} (2), {\hat{u}}^{*} (3)}$ 。

其次，求解问题( $\hat{Q}$ )；

应用4.1.中有限时域上布尔网络最优控制的求解方法。

①将布尔控制系统转化为切换布尔系统

$\hat{x} (k + 1) = L \hat{u} (k) \hat{x} (k)$

$\hat{x} (k + 1) = L_{i} \hat{x} (k), i \in [1, 2]$

$\begin{array}{l} L_{1} = L ⋉ δ_{2}^{1} = δ_{8} [7 5 1 3 4 2 6 8] \\ L_{2} = L ⋉ δ_{2}^{2} = δ_{8} [8 6 2 4 4 2 6 8] \end{array}$

②根据递归算法，可得

$ω (4) = 0_{2^{3}}^{T} = [0 0 0 0 0 0 0 0 0]$

$- ω (3) = \max_{i \in [1, 2], j \in [1, 8]} (λ^{3} {[Φ_{i}]}_{j} - {[ω {(4)}^{T} L_{i}]}_{j}) = [2.19 2.92 3.65 4.37 5.10 5.83 6.56 7.29]$

$\Rightarrow {\hat{x}}^{*} (3) = δ_{8}^{8}$

$Η (3) = [δ_{2}^{i^{*} (1, 3)} δ_{2}^{i^{*} (2, 3)} \dots δ_{2}^{i^{*} (8, 3)}] = [δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2}]$

$\Rightarrow {\hat{u}}^{*} (3) = δ_{2}^{2}$

$- ω (2) = \max_{i \in [1, 2], j \in [1, 8]} (λ^{2} {[Φ_{i}]}_{j} - {[ω {(3)}^{T} L_{i}]}_{j}) = [9.72 9.07 6.97 9.23 10.04 9.40 13.12 15.39]$

$\Rightarrow {\hat{x}}^{*} (2) = δ_{8}^{8}$

$Η (2) = [δ_{2}^{i^{*} (1, 2)} δ_{2}^{i^{*} (2, 2)} \dots δ_{2}^{i^{*} (8, 2)}] = [δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2}]$

$\Rightarrow {\hat{u}}^{*} (2) = δ_{2}^{2}$

$- ω (1) = \max_{i \in [1, 2], j \in [1, 8]} (λ {[Φ_{i}]}_{j} - {[ω {(2)}^{T} L_{i}]}_{j}) = [18.09 13.00 13.57 14.63 15.53 16.27 17.50 24.39]$

$\Rightarrow {\hat{x}}^{*} (1) = δ_{8}^{8}$

$Η (1) = [δ_{2}^{i^{*} (1, 1)} δ_{2}^{i^{*} (2, 1)} \dots δ_{2}^{i^{*} (8, 1)}] = [δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2}]$

$\Rightarrow {\hat{u}}^{*} (1) = δ_{2}^{2}$

$- ω (0) = \max_{i \in [1, 2], j \in [1, 8]} ({[Φ_{i}]}_{j} - {[ω {(1)}^{T} L_{i}]}_{j}) = [27.39 20.27 22.09 20.63 21.63 21.00 25.27 34.39]$

${\hat{x}}^{*} (0) = δ_{8}^{3}$ 给定

$Η (0) = [δ_{2}^{i^{*} (1, 0)} δ_{2}^{i^{*} (2, 0)} \dots δ_{2}^{i^{*} (8, 0)}] = [δ_{2}^{2} δ_{2}^{2} δ_{2}^{1} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2} δ_{2}^{2}]$

$\Rightarrow {\hat{u}}^{*} (0) = δ_{2}^{1}$

$\begin{matrix} J ({\hat{u}}^{*}) = {(0.9)}^{4} Φ_{f}^{T} ⋉ \hat{x} (4) + \sum_{k = 0}^{3} {(0.9)}^{k} Φ^{T} ⋉ \hat{u} (k) ⋉ \hat{x} (k) \\ = 0.66 \times [1 2 3 4 5 6 7 8] ⋉ δ_{8}^{8} + \max_{{\hat{u}}^{*} (\cdot)} J (δ_{8}^{3}, \hat{u} (\cdot)) \\ = 5.25 - ω (0) ⋉ δ_{8}^{3} \\ = 27.34 \end{matrix}$

最优控制序列为 ${\hat{u}}^{*} (0) = δ_{2}^{1}, {\hat{u}}^{*} (1) = {\hat{u}}^{*} (2) = {\hat{u}}^{*} (3) = δ_{2}^{2}$ 。

状态轨迹为 ${\hat{x}}^{*} (0) = {\hat{x}}^{*} (1) = {\hat{x}}^{*} (2) = {\hat{x}}^{*} (3) = {\hat{x}}^{*} (4) = δ_{8}^{8}$ 。

最后，将问题( $\hat{Q}$ )代数形式的求解结果返回问题(Q)的逻辑形式，得到

最优控制序列为 ${u^{*} (0) \to u^{*} (1) \to u^{*} (2) \to u^{*} (3)} = {1 \to 0 \to 0 \to 0}$ 。

状态轨迹为 $\begin{array}{l} {x^{*} (0) \to x^{*} (1) \to x^{*} (2) \to x^{*} (3) \to x^{*} (4)} \\ = {{(1 0 1)}^{T} \to {(0 0 0)}^{T} \to {(0 0 0)}^{T} \to {(0 0 0)}^{T} \to {(0 0 0)}^{T}} \end{array}$ 。

6. 总结

本文运用矩阵半张量积的方法，将布尔控制系统转化为代数离散时间系统，从而考虑经典的布尔网络最优控制问题，在找到有限时域上使目标泛函达到最大值时的最优控制及状态轨迹方法的基础上，重点研究无穷时域上的最优控制问题，给出无穷时域上布尔网络控制最大化目标泛函问题的可解性和求解方法，并应用到具体的实例，说明该方法可行。

基金项目

本文获得国家自然科学基金项目(11761021)资助。

参考文献

[1]	Waldrop, M.M. (1997) Complexity. Chen, L., Trans. San Lian Bookstore, Beijing.
[2]	Kauffman, S.A. (1969) Meta-bolic Stability and Epigenesis in Randomly Constructed Genetic Nets. Journal of Theoretical Biology, 22, 437-467. https://doi.org/10.1016/0022-5193(69)90015-0
[3]	Daizhan, C. (2001) Semi-Tensor Product of Matrices and Its Application to Morgen’s Problem. Science in China Series F: Information Sciences, 44, 195-212.
[4]	Cheng, D. (2002) Matrix and Polynomial Approach to Dynamic Control Systems. Science Press, Beijing.
[5]	程代展, 齐洪胜. 矩阵的半张量—理论与应用[M]. 北京: 科学出版社, 2010.
[6]	程代展, 夏元清, 马宏宾, 等. 矩阵代数、控制与博弈[M]. 北京: 北京理工大学出版社, 2016.
[7]	Laschov, D. and Margaliot, M. (2011) A Maximum Principle for Single-Input Boolean Control Networks. IEEE Transactions on Automatic Control, 56, 913-917. https://doi.org/10.1109/TAC.2010.2101430
[8]	Laschov, D. and Margaliot, M. (2013) A Pontryagin Maximum Principle for Multi-Input Boolean Control Networks. http://citeseerx.ist.psu.edu/viewdoc/summary?cid=19245596
[9]	Zhao, Y., Li, Z., Cheng, D., et al. (2011) Optimal Control of Logical Control Networks. IEEE Transactions on Automatic Control, 56, 1766-1776. https://doi.org/10.1109/TAC.2010.2092290
[10]	Li, H., Wang, Y., Liu, Z., et al. (2014) A Semi-Tensor Product Approach to Pseudo-Boolean Functions with Application to Boolean Control Networks. Asian Journal of Control, 16, 1073-1081. https://doi.org/10.1002/asjc.767
[11]	Fornasini, E. and Valcher, M.E. (2014) Optimal Control of Boolean Control Networks. IEEE Transactions on Automatic Control, 59, 1258-1270. https://doi.org/10.1109/TAC.2013.2294821
[12]	Li, H. (2012) Global Stability and Controllability of Switched Boolean Networks. Proceedings of the 31st Chinese Control Conference, Hefei, 25-27 July 2012, 82-88.
[13]	Li, H. and Wang, Y. (2012) Brief Paper: Boolean Derivative Calculation with Application to Fault Detection of Combinational Circuits via the Semi-Tensor Product Method. Automatica, 48, 688-693. https://doi.org/10.1016/j.automatica.2012.01.021
[14]	Li, H. and Wang, Y. (2012) On Reachability and Control-lability of Switched Boolean Control Networks. Automatica, 48, 2917-2922. https://doi.org/10.1016/j.automatica.2012.08.029
[15]	Li, H. and Wang, Y. (2013) Neural Networks Letter: Con-sistent Stabilizability of Switched Boolean Networks. Neural Networks, 46, 183-189. https://doi.org/10.1016/j.neunet.2013.05.012

为你推荐

友情链接