基于截断核范数的张量去噪

doi:10.12677/AAM.2019.810186

期刊菜单

基于截断核范数的张量去噪
Tensor Denoising Based on Truncated Nuclear Norm

DOI: 10.12677/AAM.2019.810186, PDF, HTML, XML,
作者: 冯晓亭, 马婷婷：辽宁师范大学数学学院，辽宁大连
关键词: 截断核范数；增广拉格朗日乘子法；张量奇异值分解；图像去噪；Truncated Nuclear Norm； Augmented Lagrange Multipliers； Tensor Singular Value Decomposition； Image Denoising

摘要: 基于张量核范数问题，用截断核范数代替核范数，建立一个新的截断核范数鲁棒主成分分析(Truncated Nuclear Norm Robust Principal Component Analysis, TNNRPCA)模型，并使用增广拉格朗日乘子法对这个凸优化问题求解。在图像去噪的实验过程中，截断核范数的鲁棒主成分分析模型去噪效果好。

Abstract: Based on the problem of tensor nuclear norm, a new robust principal component analysis model is established by substituting truncated nuclear norm for nuclear norm, and the convex optimization problem is solved by augmented Lagrange multiplier method. In the experiment of image denoising, the robust principal component analysis model with truncated unclear norm has good denosing effect.

文章引用：冯晓亭, 马婷婷. 基于截断核范数的张量去噪[J]. 应用数学进展, 2019, 8(10): 1592-1596. https://doi.org/10.12677/AAM.2019.810186

1. 引言

随着稀疏与低秩知识的深入，主成分分析模型 [1] 对于低秩矩阵恢复潜力巨大，但由于主成分分析模型中的特征值分解有一些局限性，并且在非高斯分布情况下，主成分分析模型得出结果可能并不是最优的。Candès等 [2] 将主成分分析推广到了鲁棒主成分分析(Robust Principal Component Analysis, RPCA) [3] 模型。

由于矩阵的秩非凸，且函数不连续，RPCA构建的模型为一个NP-Hard的优化问题，不易求解。所以引入核范数鲁棒主成分分析 [4] ，该算法对矩阵中的不同奇异值求和，优化时有相同的惩罚力度。但在不同大小的奇异值中，前 $r$ 个较大的奇异值在核范数中起了主要作用，所以核范数在图像去噪方面效果仍不是特别理想，导致实际问题中求出的模型的次优解。为更精确刻画低秩的部分，Hu [5] 等人提出截断核范数的概念，构建截断核范数优化模型，弥补了核范数的不足，使求解后的张量数据恢复的更好。在现有文献基础上，将矩阵鲁棒主成分分析方法运用于高维数据去噪，这种基于矩阵鲁棒主成分分析模型的方法对于结构简单的高维数据，具有较好的去噪效果。因此我们在张量中的模型是基于张量奇异值分解(Tensor Singular Value Decomposition, t-SVD) [6] 和张量截断核范数的鲁棒主成分分析，它的目的是通过求解一个目标为张量截断核范数与 $l_{1}$ 范数加权组合的模型，可以精确地恢复一个被稀疏误差损坏的低秩张量。

2. 预备知识

定义1 [7] 张量 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 的核范数记为 ${‖ A ‖}_{*}$ ，表示 $\bar{A}$ 所有正面切片核范数的平均值，即：

${‖ A ‖}_{*} : = \frac{1}{n_{3}} \sum_{i = 1}^{n_{3}} {‖ {\bar{A}}^{(i)} ‖}_{*}$ (1)

定义2 [8] 张量 $X \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 的截断核范数记为 ${‖ X ‖}_{r}$ ，被定义为：

${‖ X ‖}_{r} = {‖ X ‖}_{*} - \max_{\begin{array}{l} A * A^{T} = I \\ B * B^{T} = I \end{array}} t r (A * X * B)$ (2)

其中 $A \in ℝ^{n_{1} \times r \times n_{3}}$ ， $B \in ℝ^{n_{2} \times r \times n_{3}}$ 是由t-SVD生成的，其中 $A$ 和 $B$ 分别为t-SVD中的 $U$ 和 $V$ 在第二维度中的前r列。

定义3 [7] 已知 $A_{0} \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 可以进行t-SVD，要使得 $A_{0}$ 满足带有参数 $μ$ 的张量非相干条件，则需满足：

$\max_{i = 1, \dots, n_{1}} {‖ U^{*} * \overset{\circ}{e_{i}} ‖}_{F} \leq \sqrt{\frac{μ r}{n_{1} n_{3}}}$ (3)

$\max_{j = 1, \dots, n_{2}} {‖ V^{*} * \overset{\circ}{e_{j}} ‖}_{F} \leq \sqrt{\frac{μ r}{n_{2} n_{3}}}$ (4)

和

${‖ U * V^{*} ‖}_{\infty} \leq \sqrt{\frac{μ r}{n_{1} n_{2} n_{2}^{3}}}$ (5)

定理1 [1] 设 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 的t-SVD为：

$A = U * S * V^{*}$ (6)

$U \in ℝ^{n_{1} \times n_{1} \times n_{3}}, V \in ℝ^{n_{2} \times n_{2} \times n_{3}}$ 是正交的， $S \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 是f-对角张量。

引理1 [8] 已知张量 $A \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 的t-SVD为 $U * S * V^{*}$ ，奇异阈值算子定义为：

(7)

3. 截断核范数的鲁棒主成分分析

3.1. 模型的建立

已知一个数据张量 $X \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ ，假设张量可以通过t-SVD分解成低秩分量 $L_{0} \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ 和稀疏分量 $E_{0} \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ ，核范数鲁棒主成分分析模型如下式所示：

(8)

其中 $λ = 1 / \sqrt{\max (n_{1}, n_{2}) n_{3}}$ 。

式(8)中， ${‖ L ‖}_{*}$ 为张量 $L$ 的核范数，根据张量的奇异值分解，在核范数最小化问题中，所有的奇异值同时被最小化，这样不能对原始张量进行很好地秩估计。为了保证数据不被过多丢失，增强模型鲁棒性，用截断式核范数代替核范数，构建了基于张量截断核范数与 $l_{1}$ 范数的鲁棒主成分分析模型，如式(9)所示：

(9)

3.2. 模型的求解

根据定义2且引入辅助变量 $W \in ℝ^{n_{1} \times n_{2} \times n_{3}}$ ，得到优化问题(9)的如下形式：

$\min_{X} {‖ X ‖}_{*} - T r (A_{l} W B_{l}^{T}) + λ {‖ E ‖}_{1} s .t . L = W, X = L + E$ (10)

对式(10)构建增广拉格朗日函数：

$\begin{matrix} L (L, E, W, Y_{1}, Y_{2}) = {‖ L ‖}_{*} - T r (A_{l} W B_{l}^{T}) + λ {‖ E ‖}_{1} + 〈 Y_{1}, L + E - X 〉 \\ + 〈 Y_{2}, L - W 〉 + \frac{μ}{2} ({‖ L + E - X ‖}_{F}^{2} + {‖ L - W ‖}_{F}^{2}) \end{matrix}$ (11)

其中张量 $Y_{1}, Y_{2}$ 为拉格朗日乘子，惩罚系数 $μ > 0$ 。

使用交替方向法迭代更新张量 $L, E, W, Y_{1}, Y_{2}$ 和惩罚系数 $μ$ 。求解目标函数的详细流程如下：

固定 $E_{k}, W_{k}, Y_{1, k}, Y_{2, k}$ ，更新 $L_{k + 1}$ ：

$\begin{matrix} L_{k + 1} = \arg \min_{L} {‖ L ‖}_{*} + 〈 Y_{1, k}, L + E_{k} - X 〉 + 〈 Y_{2, k}, L - W_{k} 〉 + \frac{μ}{2} ({‖ L + E_{k} - X ‖}_{F}^{2} + {‖ L - W_{k} ‖}_{F}^{2}) \\ = \arg \min_{L} {‖ L ‖}_{*} + μ {‖ L + \frac{1}{2} (E_{k} - X - W_{k} + \frac{1}{μ} (Y_{1 k} + Y_{2 k})) ‖}_{F}^{2} \end{matrix}$ (12)

根据引理1，(12)式可以化简为：

(13)

固定 $L_{k + 1}, W_{k}, Y_{1, k}, Y_{2, k}$ ，更新 $E_{k + 1}$ ：

$\begin{matrix} E_{k + 1} = \arg \min_{E} λ {‖ E ‖}_{1} + 〈 Y_{1 k}, L_{k + 1} + E - X 〉 + \frac{μ}{2} {‖ L_{k + 1} + E - X ‖}_{F}^{2} \\ = \arg \min_{E} λ {‖ E ‖}_{1} + \frac{μ}{2} {‖ E + (L_{k + 1} - X + \frac{1}{μ} Y_{1, k}) ‖}_{F}^{2} \end{matrix}$ (14)

通过软阈值收缩算子，可以转化为：

$E_{k + 1} = S_{\frac{λ}{μ_{k}}} (X - L_{k + 1} - \frac{1}{μ} Y_{1, k})$ (15)

固定 $L_{k + 1}, E_{k + 1}, Y_{1, k}, Y_{2, k}$ ，更新 $W_{k + 1}$ ：

$W_{k + 1} = \arg \min_{W} - T r (A_{l} W B_{l}^{T}) + 〈 Y_{2 k}, L_{k + 1} - W 〉 + \frac{μ}{2} {‖ L_{k + 1} - W ‖}_{F}^{2}$ (16)

(16)式为关于 $W$ 的二次项，令其导数为0，可得到闭式解。去掉无关项得：

$W_{k + 1} = \arg \min_{W} - T r (A_{l} W B_{l}^{T}) + \frac{μ}{2} {‖ W ‖}_{F}^{2} + 〈 - Y_{2 k}, W 〉 + μ 〈 - L_{k + 1}, W 〉$ (17)

求导：

$- A_{l} B_{l}^{T} + μ W - Y_{2 k} - μ L_{k + 1} = 0$ (18)

$W = L_{k + 1} + \frac{1}{μ} (A_{l} B_{l}^{T} + Y_{2 k})$ (19)

更新 $Y_{1 k + 1}$ ， $Y_{2 k + 1}$ ：

$\begin{array}{l} Y_{1 k + 1} = Y_{1 k} + μ (L_{k + 1} + E_{k + 1} - X) \\ Y_{2 k + 1} = Y_{2 k} + μ (L_{k + 1} - W_{k + 1}) \end{array}$ (20)

4. 实验

实验将本文模型与TRPCA、TNNR、SNN这 3个模型作比较，选取图片大小 $321 \times 481 \times 3$ ，椒盐噪声为20%的彩色图片。通过对比彩色图片的恢复情况，得到张量去噪模型的恢复效果。下面列出在单张彩色图片上这四种模型恢复上的效果，如图1所示。同时为了准确评估算法之间恢复的效果，采用峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)来衡量四种模型在相同噪声情况下数据的高低，其中PSNR越高，噪声数据恢复的效果越好，数据如表1所示。

原始图片噪声图片 TRPCA TNNR SNN TNNRPCA

Figure 1. Comparison of denoising effects of different methods

图1. 不同方法去噪效果对比

Table 1. Data denoised by each algorithm

表1. 各算法去噪后的数据

5. 结论

当初始条件相同时，通过图1得出，TRPCA、TNNR、SNN模型恢复出来的彩色图片与原始彩色图片有一定区别。而本文模型对张量数据的恢复更接近于原始彩色图片，即说明使用截断核范数的方法可以有效去除较大奇异值对于噪声产生的不良影响。通过表1数据显示，在相同噪声情况下，本模型PSNR要高于其他模型，同时在迭代次数以及迭代时间上都优于其他模型，实验结果证明本文所建模型的有效性和可行性。总体上来说，TNNRPCA能够比较准确地恢复出彩色图片。

参考文献

[1]	Jolliffe, I. (2002) Principal Component Analysis. Wiley Online Library, New York.
[2]	Bouwmans, T. and Zahzah, E.H. (2014) Robust PCA via Principal Component Pursuit: A Review for a Comparative Evaluation in Video Surveillance. Computer Vision and Image Understanding, 122, 22-34.
[3]	Candès, E.J., Li, X., Ma, Y. and Wright, J. (2011) Robust Principal Component Analysis? Journal of the ACM (JACM), 58, 11. [Google Scholar] [CrossRef]
[4]	Xie, Y., Gu, S., Liu, Y., Zuo, W., Zhang, W. and Zhang, L. (2016) Weighted Schatten $ p $-Norm Minimization for Image Denoising and Background Subtraction. IEEE Transactions on Image Processing, 25, 4842-4857. [Google Scholar] [CrossRef]
[5]	Hu, Y., Zhang, D., Ye, J., Li, X. and He, X. (2012) Fast and Accurate Matrix Completion via Truncated Nuclear Norm Regularization. IEEE Transactions on Pattern Analysis and Machine Intelligence, 35, 2117-2130. [Google Scholar] [CrossRef] [PubMed]
[6]	Kilmer, M.E. and Martin, C.D. (2011) Factorization Strategies for Third-Order Tensors. Linear Algebra and Its Applications, 435, 641-658. [Google Scholar] [CrossRef]
[7]	Lu, C., Feng, J., Chen, Y., Liu, W., Lin, Z. and Yan, S. (2016) Tensor Robust Principal Component Analysis: Exact Recovery of Corrupted Low-Rank Tensors via Convex Optimization. 2016 Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Las Vegas, NV, 27-30 June 2016, 5249-5257. [Google Scholar] [CrossRef]
[8]	Xue, S., Qiu, W., Liu, F. and Jin, X. (2017) Low-Rank Tensor Completion by Truncated Nuclear Norm Regularization. arXiv preprint arXiv:1712.00704 [Google Scholar] [CrossRef]

为你推荐

友情链接