一种基于对角化的抛物型最优控制问题的预处理子

doi:10.12677/aam.2024.135241

期刊菜单

一种基于对角化的抛物型最优控制问题的预处理子
A Preconditioner for Parabolic Optimal Control Problems Based on Diagonalization

DOI: 10.12677/aam.2024.135241, PDF, HTML, XML, 下载: 58 浏览: 120
作者: 高广：中国地质大学(武汉)，数学与物理学院，湖北武汉
关键词: 预处理子；最优控制；抛物方程；对角化；Preconditioner； Optimal Control； Parabolic Equations； Diagonalization

摘要: 本文研究了求解抛物型偏微分方程约束的最优控制问题，利用对角化技巧，提出了一个新的基于对角化的预处理子，用于快速求解大型稀疏方程组。数值实验说明了预处理子的良好加速效果和稳定性。

Abstract: In this paper, we study the solution of the optimal control problem constrained by parabolic partial differential equations. By using the diagonalization technique, we propose a new preconditioner based on diagonalization to quickly calculate the large sparse equation system. Numerical experiments demonstrate the good acceleration effect and stability of the preconditioner.

文章引用：高广. 一种基于对角化的抛物型最优控制问题的预处理子[J]. 应用数学进展, 2024, 13(5): 2530-2540. https://doi.org/10.12677/aam.2024.135241

1. 引言

最优控制是指在给定的约束条件下，寻求一个控制，使给定的系统性能指标达到极大值(或极小值)。这类问题广泛存在于社会问题或技术领域中。由于在绝大多数情况下，不能通过解析的方式求解最优控制问题，因此构造有效的数值计算方法成为必要。通常有两种不同的方法来处理偏微分方程约束的最优控制问题。一种是先优化后离散法，另一种是先离散后优化法，参见 [1] [2] [3] [4] 。本文选择先优化后离散的方法，来求解偏微分方程最优控制问题。

对于包含时间项的偏微分方程最优控制问题，状态方程随时间正向发展，伴随方程随时间反向发展。这意味着需要一次性求解正倒向两个方程耦合的大型代数方程组，因此导致计算成本很高。求解这类问题经常用到的方法是一种所谓的ParaDiag算法。该算法的核心步骤通常是将时间离散矩阵近似对角化，得到预处理子，然后进行分解，使得系统可以被一次性求解，以达到提高计算效率的目的，近年来该领域有许多相关的文献。这些文献中，ParaDiag算法大致被分为两类：① ParaDiag-I：使用直接法进行求解。这类方法最早由Maday [5] 等人提出，为了保证得到时间离散化矩阵可以很好地对角化，该方法会采取变化的时间步长或是使用混合的时间离散格式 [6] 。② ParaDiag-II：使用迭代法进行求解。该类方法允许通过强制修改系数矩阵来使得它可以对角化，近年来被许多文献所研究 [7] [8] [9] [10] 。

本文结构如下：第2节引入研究的抛物型方程约束的最优控制问题，对该问题进行时空间方向的离散。然后提出一种预处理子，用于加速计算大型稀疏线性方程组；第3节是数值实验，说明提出的预处理子的良好性能；第4节为全文的总结。

2. 离散格式与预处理

2.1. 全离散格式

考虑如下跟踪型分布式控制问题：

$\min J (y, u) : = \frac{1}{2} {‖ y - g ‖}_{L^{2} (Ω \times (0, T))}^{2} + \frac{γ}{2} {‖ u ‖}_{L^{2} (Ω \times (0, T))}^{2},$ (1)

使得

${\begin{cases} y_{t} - L y = u + f, (x, t) \in Ω \times [0, T] \\ y (x, t) = 0, (x, t) \in \partial Ω \times [0, T] \\ y (x, 0) = y_{0}, x \in Ω \end{cases}$ (2)

其中L为空间算子，一般由拉普拉斯算子给出。y是状态变量，g为目标函数，u为控制变量， $γ > 0$ 为正则化参数。

利用一阶最优性条件，消去控制变量u，得到如下简化的KKT系统 [11]

$[\begin{matrix} L_{1} & - γ^{- 1} I \\ I & L_{2} \end{matrix}] [\begin{matrix} y \\ p \end{matrix}] = [\begin{matrix} f \\ g \end{matrix}] .$ (3)

其中

${\begin{cases} L_{1} y : = (\partial_{t} - L) y, y (x, 0) = y_{0}, \\ L_{2} p : = (- \partial_{t} - L) p, p (x, T) = 0. \end{cases}$ (4)

为了求解系统(3)，对于空间离散化，采用有限差分格式(或有限元法，有限体积法等)。本文更加关注对时间方向离散化后的矩阵进行预处理，因此不论使用上述的何种方法对空间进行离散化，都可以利用空间离散矩阵 $L_{h}$ 代替具体的格式。即

${\begin{cases} y_{t} = f + L_{h} y - γ^{- 1} p, \\ - p_{t} = g + L_{h} p - y . \end{cases}$

时间上采用二阶精度的Crank-Nicolson离散格式，于是得到离散KKT系统

$[\begin{matrix} B_{1} \otimes I_{x} - \frac{Δ t}{2} (B_{2} \otimes L_{h}) & - \frac{Δ t}{2 \sqrt{γ}} (B_{2}^{Τ} \otimes I_{x}) \\ \frac{Δ t}{2 \sqrt{γ}} (B_{2} \otimes I_{x}) & B_{1}^{Τ} \otimes I_{x} - \frac{Δ t}{2} (B_{2}^{Τ} \otimes L_{h}) \end{matrix}] [\begin{matrix} \hat{Y} \\ P \end{matrix}] = [\begin{matrix} \hat{F} \\ G \end{matrix}],$ (5)

其中

$Y = [\begin{matrix} y_{1} \\ y_{2} \\ ⋮ \\ y_{N_{t}} \end{matrix}], P = [\begin{matrix} p_{0} \\ p_{1} \\ ⋮ \\ p_{N_{t} - 1} \end{matrix}], B_{1} = [\begin{matrix} 1 \\ - 1 & 1 \\ - 1 & 1 \\ ⋱ & ⋱ \\ - 1 & 1 \end{matrix}], B_{2} = [\begin{matrix} 1 \\ 1 & 1 \\ 1 & 1 \\ ⋱ & ⋱ \\ 1 & 1 \end{matrix}],$

$F = \frac{Δ t}{2} [\begin{matrix} 2 y_{0} / Δ t + L_{h} y_{0} + (f_{0} + f_{1}) \\ f_{1} + f_{2} \\ ⋮ \\ f_{N_{t} - 1} + f_{N_{t}} \end{matrix}], G = \frac{Δ t}{2} [\begin{matrix} - 2 y_{0} / Δ t + (g_{0} + g_{1}) \\ g_{1} + g_{2} \\ ⋮ \\ g_{N_{t} - 1} + g_{N_{t}} \end{matrix}] .$

其中 $I_{t}$ 是 $N_{t} \times N_{t}$ 的单位矩阵， $I_{x}$ 为 $N_{x} \times N_{x}$ 的单位矩阵， $N_{x}$ 表示空间离散剖分的网格数。“ $\otimes$ ”表示克罗内克积，是张量积的特殊形式。

2.2. 预处理

本节使用ParaDiag-II方法处理大型代数系统(5)，通过对矩阵 $B_{1}, B_{2}$ 进行修改，使得它们成为 $α$ -循环矩阵。众所周知，循环矩阵都可以进行相似对角化，具体步骤参见 [12] ，因此在这一类方法中，基于对角化的预处理子被引入，以达到加速计算的目的。 $α$ -循环矩阵结构如下：

$C_{1} = [\begin{matrix} 1 & - α \\ - 1 & 1 \\ - 1 & 1 \\ ⋱ & ⋱ \\ - 1 & 1 \end{matrix}], C_{2} = [\begin{matrix} 1 & α \\ 1 & 1 \\ 1 & 1 \\ ⋱ & ⋱ \\ 1 & 1 \end{matrix}],$ (6)

$α \in [- 1, 1]$ 是一个常数。有关 $α$ -循环矩阵的介绍可以参见 [8] ， $α$ -循环矩阵可以进行对角化分解

$\begin{array}{l} C_{1} = Λ^{- 1} F^{*} D_{1} F Λ, D_{1} = d i a g (λ_{1, 1}, λ_{1, 2}, \dots, λ_{1, N_{t}}), \\ C_{2} = Λ^{- 1} F^{*} D_{2} F Λ, D_{2} = d i a g (λ_{2, 1}, λ_{2, 2}, \dots, λ_{2, N_{t}}), \end{array}$

其中 $Λ = d i a g (1, α^{\frac{1}{N_{t}}}, α^{\frac{2}{N_{t}}}, \dots, α^{\frac{N_{t} - 1}{N_{t}}})$ ， $F$ 为离散傅立叶变换矩阵，两个对角矩阵 $D_{1}, D_{2}$ 的特征值分别为

$λ_{1, n} = 1 - α^{\frac{1}{N_{t}}} ω^{n - 1}, λ_{2, n} = 1 + α^{\frac{1}{N_{t}}} ω^{n - 1}, n = 1, 2, \dots, N_{t} .$ (7)

其中 $ω = e^{- 2 π i / N_{t}}$ ，容易知道 $F$ 是一个酉矩阵，即 $F^{*} F = I$ ，这意味着 $F$ 的逆矩阵与其共轭转置矩阵是相等的，观察(7)可知 ${\bar{λ}}_{1, n} = λ_{2, n}$ 。利用 [7] 的结论，可以得到 $\tilde{P}$ 的分解

$\tilde{P} = (V \otimes I_{x}) (D_{3} \otimes I_{x} - \frac{Δ t}{2} [\begin{matrix} I_{t} \\ I_{t} \end{matrix}] \otimes L_{h}) (V^{- 1} \otimes I_{x}) .$ (8)

其中

$V = [\begin{matrix} Λ_{}^{- 1} F^{*} \\ Λ_{}^{- 1} F^{*} \end{matrix}] [\begin{matrix} I_{t} & S_{2} \\ S_{1} & I_{t} \end{matrix}], S = [\begin{matrix} I_{t} & S_{2} \\ S_{1} & I_{t} \end{matrix}],$

$D_{3} = [\begin{matrix} D_{2}^{- 1} D_{1} - \frac{Δ t}{2 \sqrt{γ}} I_{t} S_{1} \\ D_{2}^{} D_{1}^{- 1} + \frac{Δ t}{2 \sqrt{γ}} I_{t} S_{2} \end{matrix}] .$

$\begin{array}{l} S_{1} = - \frac{\sqrt{γ}}{Δ t} I_{t} (D_{2}^{} D_{1}^{- 1} - D_{2}^{- 1} D_{1} + \sqrt{{(D_{2}^{} D_{1}^{- 1} - D_{2}^{- 1} D_{1})}^{2} - \frac{Δ t^{2}}{γ} I_{t}}), \\ S_{2} = - \frac{\sqrt{γ}}{Δ t} I_{t} (D_{2}^{} D_{1}^{- 1} - D_{2}^{- 1} D_{1} + \sqrt{{(D_{2}^{} D_{1}^{- 1} - D_{2}^{- 1} D_{1})}^{2} + \frac{Δ t^{2}}{γ} I_{t}}) . \end{array}$

由 [13] 的分析可以知道，要成功地执行类似 [9] 的对角化分解，矩阵 $C_{1, 2}, C_{1, 2}^{*}$ 必须同时都可以对角化，即

$Λ_{}^{- 1} = Λ_{}^{*} .$

该等式和 $| α | = 1$ 是等价的，这个限制条件使得 $\tilde{P}$ 的形式有很大的局限性。和 [13] 中的选择类似，在本文后续的讨论中，取 $α = - 1$ ，此时 $C_{1, 2}$ 又被称为负循环矩阵。

下面的步骤(1)~(3)给出了求解式(8)的方法。

为计算 $X_{2} = {\tilde{P}}^{- 1} r$ ，有

$\begin{array}{l} \begin{matrix} (a) \end{matrix} X_{1} = (V^{- 1} \otimes I_{x}) r, \\ \begin{matrix} (b) \end{matrix} (d_{n} I_{x} - \frac{Δ t}{2} L_{h}) w_{n} = X_{1, n}, n = 1, 2, \dots, 2 N_{t}, \\ \begin{matrix} (c) \end{matrix} (V \otimes I_{x}) w = X_{2} . \end{array}$ (9)

其中r表示任意的输入向量，

$X_{1} = {[X_{1, 1}^{Τ}, X_{1, 2}^{Τ}, \dots, X_{1, 2 N_{t}}^{Τ}]}^{Τ}, w = {[w_{1}^{Τ}, w_{2}^{Τ}, \dots, w_{2 N_{t}}^{Τ}]}^{Τ} .$

$d_{n}$ 表示对角矩阵 $D_{3}$ 的第n行元素。式(9)一般被称为三步对角化技巧 [6] 。该方法的好处在于：得益于矩阵V的特殊结构，步骤(a)和步骤(c)可以通过快速傅立叶变换进行高效计算；步骤(b)由2N个独立的线性系统构成，可以用高度并行的方式求解 [14] 。

根据 [15] 的分析，对角化步骤(a)和(c)会产生较大的舍入误差，定理2.1给出了适用于本文研究问题的舍入误差分析。

定理2.1令 $λ \in σ (L_{h})$ 为空间离散矩阵 $L_{h}$ 的任意特征值，假设(8)的步骤(b)是通过直接法求解的(例如，LU分解法)。设机器精度为 $ε$ ，那么舍入误差为

$\frac{{‖ {\hat{η}}_{λ} - {\tilde{η}}_{λ} ‖}_{2}}{{‖ {\hat{η}}_{λ} ‖}_{2}} \leq ε (4 N_{t} + 1) {Cond}_{2} (\sum (λ)) {({Cond}_{2} (S))}^{2} + O (ε^{2}) .$ (10)

其中 ${\hat{η}}_{λ}$ 为如下方程(11)中对任一输入向量 ${\hat{r}}_{λ}$ 的精确解， ${\tilde{η}}_{λ}$ 为方程(11)的数值近似解。

${\tilde{P}}_{λ} {\hat{η}}_{λ} : = ([\begin{matrix} C_{2}^{- 1} C_{1} & - \frac{Δ t}{2 \sqrt{γ}} \\ \frac{Δ t}{2 \sqrt{γ}} & {(C_{2}^{- 1} C_{1})}^{Τ} \end{matrix}] - \frac{Δ t}{2} [\begin{matrix} I_{t} \\ I_{t} \end{matrix}]) {\hat{η}}_{λ} = {\hat{r}}_{λ},$ (11)

证明：对于方程(11)，根据 [7] 的向后误差分析，通过对角化技巧(2.4)得到的解满足如下的扰动系统：

$(V + δ V_{1}) g_{λ} = {\hat{r}}_{λ}, (Σ (λ) + δ Σ) w_{λ} = g_{λ}, (V^{- 1} + δ V_{2}) {\tilde{η}}_{λ} = w_{λ},$

其中 $δ V_{1}$ ， $δ Σ$ 和 $δ V_{2}$ 表示矩阵V， $D_{3}$ 和 $V^{- 1}$ 的微小扰动。由 [7] ，可得

$\begin{array}{l} {‖ δ V_{1} ‖}_{2} \leq 2 ε N {‖ V ‖}_{2} + O (ε^{2}), \\ {‖ δ V_{2} ‖}_{2} \leq 2 ε N {‖ V^{- 1} ‖}_{2} + O (ε^{2}), \\ {‖ δ \sum (λ) ‖}_{2} \leq ε {‖ \sum (λ) ‖}_{2} + O (ε^{2}) . \end{array}$ (12)

最后一个不等式成立的原因是 $\sum (λ)$ 是一个对角矩阵。注意到通过对角化解方程(11)等价于精确求解 $({\tilde{P}}_{λ} + δ {\tilde{P}}_{λ}) {\tilde{η}}_{λ} = {\hat{r}}_{λ}$ ，这里 $δ {\tilde{P}}_{λ}$ 表示一个合适的扰动。实际上，有

$(V + δ V_{1}) (\sum (λ) + δ \sum (λ)) (V^{- 1} + δ V_{2}) {\tilde{η}}_{λ} = {\hat{r}}_{λ},$ (13)

结合(12)式和(13)可以对 $δ {\tilde{P}}_{λ}$ 做出如下的估计：

${‖ δ {\tilde{P}}_{λ} ‖}_{2} \leq ε (4 N_{t} + 1) {‖ V ‖}_{2} {‖ V^{- 1} ‖}_{2} {‖ \sum (λ) ‖}_{2} + O (ε^{2}) .$ (14)

根据 [16] ，下列不等式成立

$\frac{{‖ {\hat{η}}_{λ} - {\tilde{η}}_{λ} ‖}_{2}}{{‖ {\hat{η}}_{λ} ‖}_{2}} \leq {Cond}_{2} ({\tilde{P}}_{λ}) \frac{{‖ δ {\tilde{P}}_{λ} ‖}_{2}}{{‖ {\tilde{P}}_{λ} ‖}_{2}},$

结合(14)可以得到：

$\begin{matrix} \frac{{‖ {\hat{η}}_{λ} - {\tilde{η}}_{λ} ‖}_{2}}{{‖ {\hat{η}}_{λ} ‖}_{2}} \leq ε (4 N_{t} + 1) {‖ V ‖}_{2} {‖ V^{- 1} ‖}_{2} {‖ {\tilde{P}}^{- 1}_{λ} ‖}_{2} {‖ \sum (λ) ‖}_{2} + O (ε^{2}) \\ = ε (4 N_{t} + 1) {Cond}_{2} (V) {‖ {\tilde{P}}^{- 1}_{λ} ‖}_{2} {‖ \sum (λ) ‖}_{2} + O (ε^{2}) . \end{matrix}$

由于 $V = [\begin{matrix} Λ_{α}^{- 1} F^{*} \\ Λ_{α}^{- 1} F^{*} \end{matrix}] S$ ，且 ${\tilde{P}}_{λ} = V \sum (λ) V^{- 1}$ ，结合 $F$ 是酉矩阵，可以得到

${‖ V ‖}_{2} \leq {‖ Λ_{α}^{- 1} ‖}_{2} {‖ F^{*} ‖}_{2} {‖ S ‖}_{2} \leq \max {1, {| α |}^{\frac{N_{t} - 1}{N_{t}}}} \frac{1}{\sqrt{N_{t}}} {‖ S ‖}_{2},$

同样地，有

${‖ V^{- 1} ‖}_{2} \leq {‖ Λ_{α} ‖}_{2} {‖ F ‖}_{2} {‖ S^{- 1} ‖}_{2} \leq \max {1, {| α |}^{- \frac{N_{t} - 1}{N_{t}}}} \frac{1}{\sqrt{N_{t}}} {‖ S^{- 1} ‖}_{2},$

于是

${Cond}_{2} (V) \leq {Cond}_{2} (S),$

以及

${‖ {\tilde{P}}^{- 1}_{λ} ‖}_{2} \leq {‖ S \sum^{- 1} (λ) S^{- 1} ‖}_{2} \leq {Cond}_{2} (S) {‖ \sum^{- 1} (λ) ‖}_{2} .$

综合上述讨论，便得到了不等式(10)。 ∎

上述定理表明，由(9)带来的舍入误差主要与三个因素有关，即时间离散的节点数 $N_{t}$ ，矩阵S的条件数以及不可避免的，对角矩阵 $\sum (λ)$ 的条件数。而(10)中 $\sum (λ)$ 的条件数这一因素无法进一步改进。于是本文考虑对 $\tilde{P}$ 进行修改，以使得矩阵S的条件数尽可能接近于或是等于一个网格无关的常数。

容易知道，消除 ${Cond}_{2} (S)$ 等价于令下列矩阵为零，

$D_{2}^{- 1} D_{1} - D_{1}^{- 1} D_{2} .$

用特征值来表征矩阵 $D_{2}^{- 1} D_{1}$ 和 $D_{1}^{- 1} D_{2}$ ，即

${\begin{cases} λ (D_{2}^{- 1} D_{1}) = \frac{λ_{1, n}}{λ_{2, n}} = \frac{1 - α^{\frac{1}{N_{t}}} ω^{n - 1}}{1 + α^{\frac{1}{N_{t}}} ω^{n - 1}}, \\ λ (D_{1}^{- 1} D_{2}) = \frac{λ_{2, n}}{λ_{1, n}} = \frac{1 + α^{\frac{1}{N_{t}}} ω^{n - 1}}{1 - α^{\frac{1}{N_{t}}} ω^{n - 1}}, \end{cases} \begin{matrix} n = 1, 2, \dots, N_{t} . \end{matrix}$ (15)

取

$ρ_{n} = \frac{- 2 α^{\frac{1}{N_{t}}}}{ω^{- (n - 1)} - α^{\frac{2}{N_{t}}} ω^{n - 1}}, ρ = d i a g (ρ_{1}, ρ_{2}, \dots, ρ_{N_{t}}),$

于是有

$(D_{2}^{- 1} D_{1} - ρ I_{t}) - (D_{1}^{- 1} D_{2} + ρ I_{t}) = O$ . (16)

因此，可以用矩阵 $(D_{2}^{- 1} D_{1} - ρ I_{t})$ 代替 $D_{2}^{- 1} D_{1}$ ，类似地，用矩阵 $(D_{1}^{- 1} D_{2} + ρ I_{t})$ 代替 $D_{1}^{- 1} D_{2}$ 。如此一来，就可以得到

${\begin{cases} {\tilde{S}}_{1} = \frac{1}{2} \cdot \frac{- 2 \sqrt{γ}}{Δ t} \cdot \frac{2 i Δ t}{2 \sqrt{γ}} I_{t} = - i I_{t}, \\ {\tilde{S}}_{2} = - \frac{1}{2} \cdot \frac{2 \sqrt{γ}}{Δ t} \cdot \frac{2 i Δ t}{2 \sqrt{γ}} I_{t} = - i I_{t}, \end{cases}$ (17)

于是

$\tilde{S} {\tilde{S}}^{*} = [\begin{matrix} I_{t} & {\tilde{S}}_{2} \\ {\tilde{S}}_{1} & I_{t} \end{matrix}] [\begin{matrix} I_{t} & {\tilde{S}}_{1}^{*} \\ {\tilde{S}}_{2}^{*} & I_{t} \end{matrix}] = 2 [\begin{matrix} I_{t} \\ I_{t} \end{matrix}] .$

矩阵 $\tilde{S}$ 的条件数为

${Cond}_{2} (\tilde{S}) : = {‖ S ‖}_{2} {‖ S^{- 1} ‖}_{2} = \sqrt{2} {‖ \frac{1}{\sqrt{2}} \tilde{S} ‖}_{2} \frac{1}{\sqrt{2}} {‖ \frac{1}{\sqrt{2}} {\tilde{S}}^{*} ‖}_{2} = {‖ \frac{1}{\sqrt{2}} \tilde{S} ‖}_{2} {‖ \frac{1}{\sqrt{2}} {\tilde{S}}^{*} ‖}_{2} = 1.$

这样一来，便消除了和舍入误差有关的 ${Cond}_{2} (S)$ 这一因素，导出了预处理子 $\hat{P}$ ：

令

${\tilde{D}}_{3} = [\begin{matrix} D_{2}^{- 1} D_{1} - ρ I_{t} - \frac{Δ t}{2 \sqrt{γ}} I_{t} {\tilde{S}}_{1} \\ D_{2}^{} D_{1}^{- 1} + ρ I_{t} + \frac{Δ t}{2 \sqrt{γ}} I_{t} {\tilde{S}}_{2} \end{matrix}],$

预处理子 $\hat{P}$ 可以表示为

$\hat{P} = (V \otimes I_{x}) ({\tilde{D}}_{3} \otimes I_{x} - \frac{Δ t}{2} [\begin{matrix} I_{t} \\ I_{t} \end{matrix}] \otimes L_{h}) (V^{- 1} \otimes I_{x}) .$ (18)

值得注意的是，在消去舍入误差中 ${Cond}_{2} (S)$ 这一项时， ${Cond}_{2} (\sum (λ))$ 同样会受到一定的影响。令

$\sum^{˜} (λ) = {\tilde{D}}_{3} - \frac{λ Δ t}{2} [\begin{matrix} I_{t} \\ I_{t} \end{matrix}],$

因为 $λ \in σ (L_{h})$ 是实对称矩阵的特征值，故 $λ = \bar{λ}$ ，可以使用矩阵的奇异值来估计 $\sum^{˜} (λ)$ 以及 $\sum (λ)$ 的条件数，即

${Cond}_{2} (\sum (λ)) = \frac{σ_{\max} (\sum (λ))}{σ_{\min} (\sum (λ))} = \sqrt{| \frac{λ_{\max} (\sum (λ) \sum^{*} (λ))}{λ_{\min} (\sum (λ) \sum^{*} (λ))} |,}$

同样有

${Cond}_{2} (\sum^{˜} (λ)) = \frac{σ_{\max} (\sum^{˜} (λ))}{σ_{\min} (\sum^{˜} (λ))} = \sqrt{| \frac{λ_{\max} (\sum^{˜} (λ) {\sum^{˜}}^{*} (λ))}{λ_{\min} (\sum^{˜} (λ) {\sum^{˜}}^{*} (λ))} | .}$

其中 $σ_{\max} (\cdot), σ_{\min} (\cdot)$ 分别表示最大奇异值和最小奇异值。

观察 $\sum (λ)$ 可知，它也是一个对角矩阵，因此特征值可以被对角线元素表征。考虑矩阵 $\sum (λ), \sum^{˜} (λ)$ 的前 $N_{t}$ 行，有

$\begin{array}{l} λ_{n} (\sum (λ) \sum^{*} (λ)) = (λ_{n} (D_{2}^{- 1} D_{1}) - \frac{Δ t}{2 \sqrt{γ}} λ_{n} (S_{1}) - \frac{λ Δ t}{2}) (λ_{n} (D_{1}^{- 1} D_{2}) - \frac{Δ t}{2 \sqrt{γ}} λ_{n}^{*} (S_{1}) - \frac{λ Δ t}{2}), \\ λ_{n} (\sum^{˜} (λ) {\sum^{˜}}^{*} (λ)) = (λ_{n} (D_{2}^{- 1} D_{1}) + \frac{i Δ t}{2 \sqrt{γ}} - \frac{λ Δ t}{2} - ρ_{n}) (λ_{n} (D_{1}^{- 1} D_{2}) - \frac{i Δ t}{2 \sqrt{γ}} - \frac{λ Δ t}{2} - ρ_{n}^{*}), \end{array}$

$λ_{n} (\cdot)$ 表示第n个特征值， $n = 1, 2, \dots, N_{t}$ 。

令

$Δ κ = {Cond}_{2}^{2} (\sum^{˜} (λ)) - {Cond}_{2}^{2} (\sum (λ)),$

若

$\frac{λ_{\min} (\sum (λ) \sum^{*} (λ))}{λ_{\min} (\sum^{˜} (λ) {\sum^{˜}}^{*} (λ))} < \sqrt{\frac{λ_{\max} (\sum^{˜} (λ) {\sum^{˜}}^{*} (λ))}{λ_{\max} (\sum (λ) \sum^{*} (λ))}},$

则有如下的不等式估计

$\begin{matrix} Δ κ = | \frac{λ_{\max} (\sum^{˜} (λ) {\sum^{˜}}^{*} (λ))}{λ_{\min} (\sum^{˜} (λ) {\sum^{˜}}^{*} (λ))} | - | \frac{λ_{\max} (\sum (λ) \sum^{*} (λ))}{λ_{\min} (\sum (λ) \sum^{*} (λ))} | \\ < \frac{| λ_{\max} (\sum^{˜} (λ) {\sum^{˜}}^{*} (λ)) | - | λ_{\max} (\sum (λ) \sum^{*} (λ)) |}{| λ_{\min} (\sum^{˜} (λ) {\sum^{˜}}^{*} (λ)) | - | λ_{\min} (\sum (λ) \sum^{*} (λ)) |}, \end{matrix}$

经过一系列冗杂但简单的运算可以得到

$\begin{matrix} Δ κ < | \frac{1 + α^{\frac{2}{N_{t}}} ω^{2 (n - 1)}}{1 - α^{\frac{2}{N_{t}}} ω^{2 (n - 1)}} - i \frac{Δ t}{\sqrt{γ}} + \frac{Δ t^{2}}{4 γ} | \\ < \frac{Δ t^{2}}{4 γ} + c (α, \frac{Δ t}{\sqrt{γ}}) . \end{matrix}$ (19)

其中 $c (α, \frac{Δ t}{\sqrt{γ}})$ 是一个与 $α$ 和 $\frac{Δ t}{\sqrt{γ}}$ 有关的正数。于是可以知道，修改 $\tilde{P}$ 确实会增加 ${Cond}_{2} (\sum (λ))$ ，但当时间方向的网格步长的平方 $Δ t^{2}$ 和正则化参数 $γ$ 保持在同一数量级时， $Δ κ$ 会有一个比较稳定的上界。

3. 数值算例

本节将使用带预处理子的GMRES方法来求解给定的抛物型方程最优控制问题。设置停机标准为 $ε = 10^{- 6}$ ，采用的是右预处理GMRES方法，迭代的最大步数设置为IterMax = 400。空间离散算子 $L_{h}$ 由二阶中心差分格式导出，它是一个实对称矩阵。本节的实验目的是，针对具体的问题，在不同的正则化参数 $γ$ 以及时空间网格大小的选取下，获得程序输出的结果。输出的结果包括了GMRES求解器完成计算所需要的迭代次数，记为Iter、求解过程中计算机耗费的时间(单位为s)，记为CPU、状态变量的误差估计范数 $e_{y}$ 。此外，作为对比，将直接使用GMRES求解器而非使用预处理子来计算同样的算例。

例1给出了一维情况下抛物型PDE最优控制问题，数值结果如表1 所示。 $N_{t} = 64, N_{x} = 64, γ = 10^{- 4}$ 时真解和数值解的对比图如图1和图2所示。

例1令空间域 $Ω = (0, 1)$ ，时间域 $T = (0, 1)$ ，方程组的解析解等已知条件如下：

${\begin{matrix} y = \sin (π x) \cos (π t), \\ p = {(t - 1)}^{2} \sin (π x), \\ f = - π \sin (π x) \sin (π t) - π^{2} \sin (π x) \cos (π t) - {(t - 1)}^{2} \sin (π x) / γ, \\ g = 2 (t - 1) \sin (π x) + π^{2} \sin (π x) {(t - 1)}^{2} + \sin (π x) \cos (π t) . \end{matrix}$ (20)

通过表1，可以看到，对于GMRES方法所需的迭代次数，无论正则化参数 $γ$ 取到何值，预处理过程都会大大减少迭代次数，使得GMRES求解过程的迭代次数保持在一个很少的范围。对于计算时间，如果正则化参数 $γ$ 的取值不过分的小，即 $γ \geq 10^{- 4}$ 时，不使用预处理方法的GMRES求解器所耗费的计算成本都远远大于经过预处理后的GMRES求解器，而在 $γ = 10^{- 6}$ 以及 $γ = 10^{- 8}$ 的情况下，使用预处理子与否对计算耗费的时间影响并没有显著差异，甚至网格较粗的情况下不使用预处理的GMRES方法在时间成本上稍显优势。对于此现象的解释是，正则化参数 $γ$ 与时空间网格步长的比 $Δ t / Δ x^{2}$ 之间的数量级有差异。如果增加网格大小，以使得 $\sqrt{γ}$ 和 $Δ t / Δ x^{2}$ 尽量接近，那么上述现象便不会再发生。为尝试验证这一解释，在 $γ = 10^{- 6}$ 和 $γ = 10^{- 8}$ 的情况下使用了更加细化的网格，大小为500 × 500，作为追加的实验。如表1中Add1和Add2的两行数据所示，当 $\sqrt{γ}$ 和 $Δ t / Δ x^{2}$ 比较接近时，施加了预处理过程的GMRES方法的数值表现明显更为优秀，即Add1中的结果；而 $\sqrt{γ}$ 和 $Δ t / Δ x^{2}$ 不那么接近时，两者在计算时间上的差异变得较小，即Add2中的结果。由此可以得到实验结果一定程度上与上述解释相符合。

Table 1. The number of iterations of the GMRES method in Example 1, the CPU time, and the error before and after using the preconditioner

表1. 使用预处理子前后，例1的GMRES方法迭代所需的次数、CPU耗费时间以及误差

Figure 1. Comparison of the real solution (left) and the numerical solution (right) of y

图1. y的真实解(左)和数值解(右)对比图

Figure 2. Comparison of the real solution (left) and the numerical solution (right) of p

图2. p的真实解(左)和数值解(右)对比图

4. 总结

本文研究了一种应用于初值型抛物型方程最优控制问题的预处理子，用于快速求解给定的模型问题。首先，给出了受抛物型方程约束的控制问题及初值条件，得到KKT系统；然后在时间方向上采用Crank-Nicolson格式，空间方向上使用离散拉普拉斯算子表示空间离散后的格式，得到了一个大型线性方程组。对离散后得到的大型稀疏代数系统，利用三步对角化技巧快速求解。为了消除对角化步骤中矩阵S的条件数这一因素，提出了一个新的预处理子。本文采用ParaDiag-II方案时，使用了广义极小残量法(GMRES)来作为迭代求解器，并分析了应用预处理子时，GMRES方法的收敛性。最后的数值实验，给出了一维的具体数值算例，数值结果表明提出的新的预处理子确实有较为优秀的加速效果和稳定性。

致谢

作者非常感谢各位老师们给出的宝贵意见和建议。

参考文献

[1]	Kunisch, K. and Rund, A. (2015) Time Optimal Control of the Monodomain Model in Cardiac Electrophysiology. IMA Journal of Applied Mathematics, 80, 1664-1683. https://doi.org/10.1093/imamat/hxv010
[2]	Bryson, A.E. (1996) Optimal control-1950 to 1985. IEEE Control Systems Magazine, 16, 26-33. https://doi.org/10.1109/37.506395
[3]	Sargent, R.W.H. (2000) Optimal Control. Journal of Computational and Applied Mathematics, 124, 361-371. https://doi.org/10.1016/S0377-0427(00)00418-0
[4]	Liu, J. and Wang, Z. (2019) Non-Commutative Discretize-Then-Optimize Algorithms for Elliptic PDE-Constrained Optimal Control Problems. Journal of Computational and Applied Mathematics, 362, 596-613. https://doi.org/10.1016/j.cam.2018.07.028
[5]	Maday, Y. and Rønquist, E.M. (2008) Parallelization in Time through Tensor-Product Space-Time Solvers. Comptes Rendus. Mathématique, 346, 113-118. https://doi.org/10.1016/j.crma.2007.09.012
[6]	Gander, M.J., Liu, J., Wu, S.L., et al. (2020) Paradiag: Parallel-in-Time Algorithms Based on the Diagonalization Technique. arXiv: 2005.09158.
[7]	Golub, G.H., Van Loan, C.F. (2013) Matrix Computations. JHU Press, Baltimore. https://doi.org/10.56021/9781421407944
[8]	Saad. Y. (2003) Iterative Methods for Sparse Linear Systems. Society for Industrial and Applied Mathematics, Philadelphia. https://doi.org/10.1137/1.9780898718003
[9]	Wu, S.L. and Zhou, T. (2020) Diagonalization-Based Parallel-in-Time Algorithms for Parabolic PDE-Constrained Optimization Problems. ESAIM: Control, Optimisation and Calculus of Variations, 26, 88. https://doi.org/10.1051/cocv/2020012
[10]	Liu, J., Wu, S.L. (2020) A Fast Block α-Circulant Preconditoner for All-at-Once Systems from Wave Equations. SIAM Journal on Matrix Analysis and Applications, 41, 1912-1943. https://doi.org/10.1137/19M1309869
[11]	Lin, X.L. and Wu, S.L. (2021) A Parallel-in-Time Preconditioner for Crank-Nicolson Discretization of a Parabolic Optimal Control Problem. arXiv: 2109.12524.
[12]	Gander, M.J. and Palitta, D. (2024) A New Paradiag Time-Parallel Time Integration Method. SIAM Journal on Scientific Computing, 46, A697-A718. https://doi.org/10.1137/23M1568028
[13]	Bouillon, A., Samaey, G. and Meerbergen, K. (2023) On Generalized Preconditioners for Time-Parallel Parabolic Optimal Control. arXiv: 2302.06406.
[14]	McDonald, E., Pestana, J. and Wathen, A. (2018) Preconditioning and Iterative Solution of All-at-Once Systems for Evolutionary Partial Differential Equations. SIAM Journal on Scientific Computing, 40, A1012-A1033. https://doi.org/10.1137/16M1062016
[15]	Wu, S.L., Zhou, T. and Zhou, Z. (2022) A Uniform Spectral Analysis for a Preconditioned All-at-Once System from First-Order and Second-Order Evolutionary Problems. SIAM Journal on Matrix Analysis and Applications, 43, 1331-1353. https://doi.org/10.1137/21M145358X
[16]	Liu, J., Wang, X.S., Wu, S.L., et al. (2022) A Well-Conditioned Direct PinT Algorithm for First-and Second-Order Evolutionary Equations. Advances in Computational Mathematics, 48, 16. https://doi.org/10.1007/s10444-022-09928-4

为你推荐

友情链接