基于混合截断范数的张量鲁棒主成分分析

doi:10.12677/AAM.2022.1110783

期刊菜单

基于混合截断范数的张量鲁棒主成分分析
Tensor Robust Principal Component Analysis Based on Hybrid Truncation Norm

DOI: 10.12677/AAM.2022.1110783, PDF, HTML, XML, 下载: 355 浏览: 515 科研立项经费支持
作者: 栾育洁^*：辽宁师范大学，辽宁大连；姜伟：辽宁师范大学，辽宁大连；温州大学，浙江温州
关键词: 张量鲁棒主成分分析；混合截断；交替方向乘子法；Tensor Robust Principal Component Analysis (TRPCA)； Hybrid Truncation Norm； Alternating Direction Multiplier Method (ADMM)

摘要: 本文将截断核范数正则化的思想推广到张量鲁棒主成分分析。为提高模型的稳定性，新定义了张量截断Frobenius范数，并给出同时考虑张量截断核范数和截断Frobenius范数的混合截断模型。这种方法只会最小化min(m,n)-r个奇异值。此外，本文还给出一种确定收缩算子的有效方法，并为此方法开发了一种基于交替方向的有效迭代算法来解决这个优化问题。实验结果表明，该方法可以有效并准确地实现图像去噪。

Abstract: In this paper, the idea of truncated nuclear norm regularization is extended to tensor robust prin-cipal component analysis. In order to improve the stability of the model, the tensor truncated Fro-benius norm is defined, and a mixed truncated model considering both tensor truncated nuclear norm and truncated Frobenius norm is given. This method minimizes min(m,n)-r singular val-ues. In addition, this paper also gives an effective method to determine the contraction operator, and develops an effective iterative algorithm based on alternate directions to solve this optimiza-tion problem. The experimental results show that this method can effectively and accurately realize image denoising.

文章引用：栾育洁, 姜伟. 基于混合截断范数的张量鲁棒主成分分析[J]. 应用数学进展, 2022, 11(10): 7373-7379. https://doi.org/10.12677/AAM.2022.1110783

1. 引言

张量是矩阵的高阶推广，是一种重要的数据形式，可以表达更复杂的高阶数据的内部结构。事实上，张量也是高维真实世界数据的自然形式。例如，在图像处理领域，彩色图像是三阶张量，多光谱图像是三阶张量。因此，张量分析在机器学习 [1] [2]、计算机视觉 [2]、数据挖掘 [3] 等领域具有重要的现实意义和应用价值。而经典的主成分分析(PCA)是用于数据分析和降维的最广泛的方法，对于受小噪声轻微损坏的数据，它具有计算效率高、功能强大的特点。然而，主成分分析的一个主要问题是，它很容易受严重损坏或离奇的观测值影响，而这些观测值在现实世界的数据中无处不在。到目前为止，已经提出了许多主成分分析模型，但几乎都具有很高的计算成本。

最近提出的RPCA是第一个具有强大性能保证的多项式时间算法。假设有一个数据矩阵 $X \in ℝ^{m \times n}$ 可以被分解为： $X = L_{0} + E_{0}$ ，其中 $L_{0}$ 是低秩分量， $E_{0}$ 是稀疏分量。文献 [1] 表明，如果 $L_{0}$ 的奇异向量满足某些非相干条件，例如， $L_{0}$ 是低秩的，并且 $E_{0}$ 足够稀疏，则可以通过求解凸问题

$\begin{array}{l} \min_{L, E} {‖ L ‖}_{*} + λ {‖ E ‖}_{1} \\ s .t . X = L + E \end{array}$ ，

以高概率精确的恢复 $L_{0}$ 和 $E_{0}$ 。其中 ${‖ L ‖}_{*}$ 表示 $L$ 的核范数， ${‖ E ‖}_{1}$ 表示 $E$ 的 $l_{1}$ 范数，且 $λ$ 通常设置为 $1 / \sqrt{\max (n_{1}, n_{2})}$ 。在算法上，可以通过高效的算法求解，成本不会比PCA高太多。该方法已成功应用于背景建模、子空间聚类、视频压缩感知等领域。

将RPCA推广到张量并不容易，本文研究了张量鲁棒主成分分析(TRPCA) [4]，旨在准确恢复被稀疏噪声损坏的低秩张量，提出一种新的张量鲁棒主成分分析方法，试图建立一个更稳定、更理想的模型。本文提出了两个新的正则化项，张量截断核范数(T-TNN)和张量截断Frobenius范数(T-TFN)。基于这两个新定义，提出了张量混合截断范数模型(T-HTN)，该模型利用(T-TNN)和(T-TFN)的组合来实现张量鲁棒主成分分析，该模型不仅提高了稳定性，而且有效地提高了恢复精度。

2. 预备知识

在这一部分，我们主要介绍新定义的张量截断核范数和张量截断Frobenius范数，在此基础上提出一种混合截断范数模型来提高张量鲁棒主成分分析算法的有效性和模型的稳定性并给出该模型的迭代求解方法。

定义1 (张量奇异值分解)：张量 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 可被分解为： $A = U * {}_{L}S * {}_{L}V^{T}$ ，其中 $U \in ℝ^{n_{1} \times n_{1} \times n_{3}}$ ， $V \in ℝ^{n_{2} \times n_{2} \times n_{3}}$ 是正交张量， $S \in ℝ^{n_{2} \times n_{2} \times n_{3}}$ 是F对角张量。

定义2 (张量核范数)：对于张量 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ ，它的奇异值分解为： $A = U * {}_{L}S * {}_{L}V^{T}$ ，则张量 $A$ 的核范数定义为 $S$ 的所有正面切片的奇异值之和，即：

${‖ A ‖}_{*} = \sum_{i = 1}^{r} S (i, i, 1) = \frac{1}{n_{3}} {‖ \bar{A} ‖}_{*}$

定义3 (张量奇异值阈值算子(T-SVT))：对于张量 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ ，它的奇异值分解为： $A = U * S * V^{T}$ ，对任意的 $τ > 0$ ，张量 $A$ 的奇异值阈值算子记作： $D_{τ} (A)$ ，应用在 $\bar{S}$ 的每个正面切片上，即：

$D_{τ} (A) = U * {}_{L}S_{τ} * {}_{L}V^{T}$

定义4 (张量截断核范数(T-TNN))：给定张量 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ ，截断核范数 ${‖ A ‖}_{r, *}$ 定义为 $\bar{A}$ 的每一个正面切片的后min $(m, n) - r$ 个奇异值的和，即：

${‖ A ‖}_{r, *} = {‖ A ‖}_{*} - \frac{1}{n_{3}} \sum_{i = 1}^{n_{3}} \sum_{j = 1}^{r} σ_{j} ({\bar{A}}^{( i )})$

其中 $σ_{j} ({\bar{A}}^{(i)})$ 为 ${\bar{A}}^{(i)} \in ℝ^{n_{1} \times n_{2}}$ 的第j个奇异值。

定义5 (张量截断Frobenius范数(T-TFN))：给定张量 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ ，其截断Frobenius范数定义为 $\bar{A}$ 的每一个正面切片的后min $(m, n) - r$ 个奇异值的平方和的平方根，即：

${‖ A ‖}_{r, F} = \frac{1}{\sqrt{n_{3}}} \sum_{i = 1}^{n_{3}} \sqrt{\sum_{j = 1}^{\min (n_{1}, n_{2})} {(σ_{j} ({\bar{A}}^{(1)}))}^{2} - \sum_{j = 1}^{r} {(σ_{j} ({\bar{A}}^{(1)}))}^{2}}$

因此， ${‖ A ‖}_{r, F}^{2}$ 为

${‖ A ‖}_{r, F}^{2} = {‖ A ‖}_{F}^{2} - \frac{1}{n_{3}} \sum_{i = 1}^{n_{3}} \sum_{j = 1}^{r} {(σ_{j} ({\bar{A}}^{(1)}))}^{2}$

定义6 (张量管秩)张量 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 的奇异值分解为 $A = U * {}_{L}S * {}_{L}V^{T}$ ，则张量 $A$ 的管秩 $r a n k_{t} (A)$ 定义为 $S$ 的非零奇异管的个数，即：

$r a n k_{t} (A) = # {i, S (i, i, :) \neq 0} = # {i, S (i, i, 1) \neq 0} = \max (r_{1}, \dots, r_{n_{3}})$ .

3. 混合截断范数张量鲁棒主成分分析

3.1. 模型建立

由定义4，和定义5易知，T-TNN和T-TFN均只考虑了每一个正面切片的后min $(m, n) - r$ 个奇异值，故可将二者结合，建立更加有效的混合截断张量鲁棒主成分分模型(T-HTN-RPCA)：

$\begin{array}{l} \min_{X} : {‖ L ‖}_{r, *} + γ {‖ L ‖}_{r, F}^{2} + λ {‖ E ‖}_{1} \\ s .t . X = L + E \end{array}$ (1)

由 [5] 知， ${‖ L ‖}_{r, *} = {‖ L ‖}_{*} - \max_{\begin{array}{l} A^{T} A = I \\ B^{T} B = I \end{array}} T r (A * L * B^{T})$ ， ${‖ L ‖}_{r, F}^{2} = {‖ L ‖}_{F}^{2} - \max_{A^{T} A = I} {‖ A * L ‖}_{F}^{2}$ 。因此T-HTN—RPCA模型可表示为：

$\begin{array}{l} \min_{L, E} : {‖ L ‖}_{*} - \max_{\begin{array}{l} A^{T} A = I \\ B^{T} B = I \end{array}} T r (A * L * B^{T}) + γ ({‖ L ‖}_{F}^{2} - \max_{A^{T} A = I} {‖ A * L ‖}_{F}^{2}) + λ {‖ E ‖}_{1} \\ s .t . X = L + E \end{array}$ (2)

3.2. 模型求解

为了求解优化问题(2)，本节提出一种有效的迭代方法，可以分为以下两个步骤：

第一步，令 $L_{0} = O$ 作为 $L$ 的初始值，在第l次迭代中，固定 $L_{l}$ ，将 $L_{l}$ 奇异值分解为 $L_{l} = U * Q * V^{T}$ ，其中 $U \in ℝ^{n_{1} \times r \times n_{3}}$ ， $V \in ℝ^{n_{2} \times r \times n_{3}}$ ， $Q \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ ，记 $A_{l} = U {(:, 1 : r, :)}^{T} \in ℝ^{r \times n_{1} \times n_{3}}$ ， $B_{l} = V {(:, 1 : r, :)}^{T} \in ℝ^{r \times n_{2} \times n_{3}}$ 。

第二步，固定 $A_{l}$ ， $B_{l}$ ，通过求解下述最小化问题来更新 $L_{l + 1}$ ， $E_{l + 1}$ ：

$\begin{array}{l} \min_{L, E} : {‖ L ‖}_{*} - T r (A_{l} * L * B_{l}^{T}) + γ ({‖ L ‖}_{F}^{2} - {‖ A_{l} * L ‖}_{F}^{2}) + λ {‖ E ‖}_{1} \\ s .t . X = L + E \end{array}$ (3)

简言之，本节实现了这两个步骤，且在它们之间交替进行，直至满足迭代误差限。现在的关键问题是如何求解模型(3)，这会在下一小节中讨论。

3.3. 优化方法

对于模型(3)，本节给出了一个有效的优化方法。增广的拉格朗日乘子法综合了拉格朗日乘子法和二次惩罚法各自的优点，不仅推广了拉格朗日乘子法的适用范围，同时又避免了二次惩罚带来的病态性。根据增广拉格朗日乘子法，常用的策略是利用交替迭代来近似最小增广拉格朗日函数，本文继续延用此策略进行求解。为使变量可分，首先引入辅助变量 $Z$ ，此时(3)等价于

$\begin{array}{l} \min_{L, E} : {‖ L ‖}_{*} - T r (A_{l} * Z * B_{l}^{T}) + γ ({‖ L ‖}_{F}^{2} - {‖ A_{l} * L ‖}_{F}^{2}) + λ {‖ E ‖}_{1} \\ s .t . L = Z X = L + E \end{array}$ (4)

(4)式的增广拉格朗日函数为：

(5)

其中 $Y, W$ 是拉格朗日乘子， $α, β > 0$ 是惩罚参数。故可以采用交替迭代方法：通过固定一些变量来求解剩余的那个变量。具体优化过程如下：

步骤一：保持不变，通过更新 $E_{k + 1}$ ：

(6)

步骤二：保持不变，通过更新 $L_{k + 1}$ ：

(7)

步骤三：保持不变，通过更新 $Z_{k + 1}$ ：

(8)

显然，(8)式是一个二次函数，因此通过简单的求导可以得到：

$- A_{l}^{T} * B_{l} - W_{k} - α L_{k + 1} + α Z = 0$ .

于是有：

$Z_{k + 1} = L_{k + 1} + α^{- 1} (A_{l}^{T} * B_{l} + W_{k})$ . (9)

步骤四：更新拉格朗日乘子 $Y_{k + 1}$ ， $W_{k + 1}$ ：

$\begin{array}{l} Y_{k + 1} = Y_{k} + β (X_{k + 1} - L_{k + 1} - E_{k + 1}) \\ W_{k + 1} = W_{k} + α (L_{k + 1} - Z_{k + 1}) \end{array}$ (10)

综上所述，完整程序如表1所示。

Table 1. Solve (3) by ADMM

表1. 基于ADMM对(3)式的求解

4. 实验

我们将进行数值实验以确认我们的主要结果。我们研究了T-HTN从各种稀疏噪声中恢复各种管状秩张量的能力，并将T-HTN应用于图像去噪。

数值实验

在本节，我们评估了本文提出的T-HTN在实际数据集上的效率，并将其与TRPCA进行了比较。具体来说，我们对彩色图像数据进行张量恢复实验。目的是从损坏的观察中恢复原始图像。对于基本张量 $L^{*}$ 的估计，我们选择相对平方误差(RSE)和峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)作为评估指标，分别定义为

$RSE (\hat{L}, L^{*}) : = \frac{{‖ \hat{L} - L^{*} ‖}_{F}}{{‖ L^{*} ‖}_{F}}$

$PSNR = 10 \log_{10} (\frac{n_{1} n_{2} n_{3} {‖ L^{*} ‖}_{\infty}^{2}}{{‖ \hat{L} - L^{*} ‖}_{F}^{2}})$ .

我们比较了T-HTN和TRPCA [1] 在数值实验上的恢复精度和运行速度，选取图片大小为 $300 \times 300 \times 3$ ，椒盐噪声为30%的彩色图片。通过与原始图片进行对比，得到张量去噪模型的恢复效果。下面给出在单张彩色图片上两种模型恢复效果的比较，如图1所示。同时，为了准确比较两种算法的恢复效果，采用PSNR来衡量两种模型在相同噪声下的恢复情况。其中，PSNR值越高，噪声数据恢复的效果越好，具体数据如表2所示。

Figure 1. Comparison of denoising effects between T-HTN and TRPCA

图1. T-HTN和TRPCA去噪效果对比

Table 2. T-HTN and TRPCA recover the PSNR values and running time data of the picture

表2. T-HTN和TRPCA恢复图片的PSNR值和运行时间数据

通过图1可以看出，本文提出的T-HTN模型在对被噪声污染的图片进行恢复时更接近与原始彩色图片，这也就说明了，截断核范数和截断Frobenius范数的方法可以有效的去除较大的奇异值对图像恢复的影响。表2的数据结果显示，在相同的噪声情况下，T-HTN模型恢复彩色图片时的PENR值普遍高于TRPCA，并且在迭代时间上要优于TRPCA模型。经过总体比较，T-HTN模型可以较准确地恢复彩色图片。

5. 结论

在本文，我们提出了混合张量截断核范数和截断张量Frobenius范数的张量鲁棒主成分分析模型，用一种简单的增广拉格朗日乘子法对模型进行求解。并用Matlab软件进行数值实验，经实验验证，本文提出的T-HTN模型可以有效恢复噪声图片，且恢复具有稳定性。

基金项目

该文的得到了辽宁省高等学校创新人才支持计划的资助。

NOTES

^*通讯作者。

参考文献

[1]	Lu, C., Feng, J., Chen, Y., et al. (2016) Tensor Robust Principal Component Analysis: Exact Recovery of Corrupted Low-Rank Ten-sors via Convex Optimization. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Las Vegas, 27-30 June 2016, 5249-5257. https://doi.org/10.1109/CVPR.2016.567
[2]	De Lathauwer, L. and Vandewalle, J. (2004) Dimensionality Reduction in Higher-Order Signal Processing and Rank- (R1,R2, …,RN) Reduction in Multilinear Algebra. Linear Algebra and Its Ap-plications, 391, 31-55. https://doi.org/10.1016/j.laa.2004.01.016
[3]	Vasilescu, M. and Terzopoulos, D. (2003) Multilinear Subspace Analysis of Image Ensembles. 2003 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, Madison, 18-20 June 2003, II-93. https://doi.org/10.1109/CVPR.2003.1211457
[4]	Cyganek, B. (2015) Visual Pattern Recognition Framework Based on the Best Rank Tensor Decomposition. Springer International Publishing, Berlin.
[5]	兰小红. 低秩矩阵和张量填充算法研究及应用[D]: [硕士学位论文]. 成都: 电子科技大学, 2020.

为你推荐

友情链接