1. 引言
随着当前人工智能、大数据、云计算等现代信息技术的快速发展,在计算机视觉、生物医学等诸多应用领域中产生了多种多样的张量数据。其中图像因其在信息传达上具有直观、形象的特点,在信息传播中该数据存在形式占据了大部分。然而,这些图像在采集和捕捉过程中,由于受到传输物质、成像设备等自身的局限,甚至被外部环境干扰,导致图像总是会存在明显的退化,比如受到不同程度的各种噪声的污染或者缺失等。这些退化会严重降低图像的质量,进而影响后续处理的准确性。因此,如何修复这些图像成为了改善后续任务(如目标检测 [1] 、图像分类 [2] 和图像分割 [3] 等)性能的关键预处理步骤。
上述退化问题实际上产生了张量恢复研究中的两个经典逆问题,即张量鲁棒主成分分析(TRPCA) [4] 和张量修补(TC) [5] 。解决这两个问题的关键在于如何表征张量的内部先验结构,并将其编码为相应的正则化项,然后基于该正则化项进行相关建模。近年来,以低秩假设为前提的低秩张量恢复(LRTR) [6] 为上述问题提供了有效的解决办法。然而,LRTR的研究也是面临着巨大的挑战。一方面,张量秩的定义并不像矩阵那样唯一,其定义依赖于张量分解的方式,目前张量分解中CP、Tucker、HOSVD最具代表性。另一方面,张量秩函数的凸替代和非凸替代的选择或者构造对于恢复底层图像数据的效果也起到了至关重要的作用。这种低秩先验实际上代表了图像全局范围内的信息相关性,即图像处于低维子空间中。除了低秩先验之外,以全变分(TV) [7] 为代表的局部平滑先验也普遍应用于图像修复。局部平滑先验反映了图像中相邻像素之间像素值的连续变化,它对于恢复图像的局部细节十分重要。因此,大多数工作集中于对全局低秩和局部平滑这两个先验进行联合建模,并将这两个先验编码为恢复模型中两个独立正则化项的和,然后调整相应的正则化参数以提升模型的性能。
然而,由于这两个先验在现实世界中通常是相互耦合的,即它们并不像传统模型中所暗示的那样独立发生,而且在实际场景中构建微调这两个独立正则化项对应的权衡参数的一般准则具有挑战性。鉴于上述情况,最近的工作 [8] [9] 基于梯度域将全局低秩和局部平滑这两个先验融合为一个独特的正则化项,该正则化项不仅使全局低秩和局部平滑先验更加紧密地联系在一起,更符合这两个先验本质上相互耦合的事实,而且还减少了传统模型中需要调整的权衡参数。不幸的是,这两项工作都使用核范数来描述梯度图的结构特性,即平等地对待梯度矩阵/张量的每个奇异值,因此其模型的性能仍有进一步改进的空间。因为在实际应用中,图像的各个奇异值由于其特定的物理意义而存在明显的差异。
为了解决上述问题,我们引入了改进的张量相关全变分(ITCTV)范数,其中使用的改进策略有助于进一步表征梯度张量的低秩性和固有稀疏性。我们的主要动机是梯度张量中那些较大的奇异值应该受到较少的惩罚,这是相当合理的。因此,我们对梯度张量采用重加权策略,以利用上述存在的先验信息。对于重加权策略的选择,我们采用了相关文献 [10] [11] 中使用的重加权策略,它近似地还原了
的Schatten-p范数最小化问题。正确地说,不同于矩阵
的传统加权核范数中所使用的加权策略
,由重加权核范数指定的重加权策略
可以更全面地表征真实图像中奇异值的先验分布信息。我们基于所提出的ITCTV正则化器构建了相应的鲁棒张量修补模型,并将其应用到不同类型的视觉张量数据中,结果表明我们的方法较于其他方法在数值和视觉上都有优越的竞争力。
2. 基于改进的张量相关全变分的鲁棒张量修补算法
2.1. ITCTV正则化器
为了充分利用梯度域下梯度张量的奇异值的先验分布信息,以此提高TCTV范数 [9] 的灵活性,我们提出了改进的张量相关全变分(ITCTV)范数,并将其定义如下:
(1)
其中
代表可逆线性变换,它可以是离散傅里叶变换(DFT)或离散余弦变换(DCT),或其他一些可逆线性变换,只要可逆线性变换所对应的变换矩阵满足
。
为了方便起见,我们忽略下标,将上面梯度张量的重加权核范数定义为:
(2)
其中
且
,本文统一设
;c为常数,本文实验中默认设置
;
是一个足够小的正数,以避免在对应的奇异值为零时被零除,在本文的实验中设置为
。已经证明,当给矩阵的重加权核范数赋予这样的权重时,它可以逼近其对应的Schatten-p范数 [11] 。请注意,上述权重满足小阈值以收缩大奇异值和大阈值以收缩小奇异值的功能。
2.2. t-WSVT阈值算子
本小节我们给出矩阵加权奇异值阈值算子的相关引理,并基于此给出张量加权奇异值阈值算子的相关定理及其证明。
引理(WSVT) [12] :对于给定的矩阵
,将其SVD分解表示为
,那么对于任何
和满足
和
的权重向量
,对于每个
,矩阵加权奇异值阈值(WSVT)算子定义如下:
(3)
其中
。对于任意
且
,WSVT算子满足:
(4)
定理(t-WSVT):对于给定的张量
,将其t-SVD表示为
。然后,对于任何
且具有非降序权重
,对于每个
,我们定义张量加权奇异值阈值(t-WSVT)算子如下:
(5)
其中
。注意
表示t的正数部分,即
;而
是f-对角张量,其第i个正面切片的对角线元素等于权重矩阵
的第i列。特别地,当可逆线性变换
为DFT时,
。对于任意
且
,t-WSVT算子满足:
(6)
证明:式(6)等价于
(7)
注意变量
是独立的。那么,上述问题可以分解为
个独立的子问题。该定理表明t-WSVT算子
给出了具有特定线性变换的张量重加权核范数的阈值收缩解。
3. 基于ADMM框架的优化求解算法
基于所提出的ITCTV正则化器,我们构建如下的鲁棒张量修补模型:
(8)
通过引入辅助变量
,使得
,那么上述模型(8)可以重新表述为:
(9)
根据ADMM框架 [13] 对上述模型(9)进行求解,我们写出它的增广拉格朗日函数如下:
(10)
其中
和
是拉格朗日乘子,
是惩罚参数。那么基于ADMM的框架,第(t + 1)次迭代中模型(9)中所涉及变量的更新方式具体如下:
更新
:通过增广拉格朗日函数(10)式,可以得到关于
的优化子问题:
(11)
对(11)中的
求导,我们可以得到更新
的方程为:
(12)
其中
表示
的转置结果运算符。那么我们可以在傅里叶域中,考虑将
对应的差分张量
对角化,并利用卷积定理得到式(12)的最优解来更新
:
(13)
其中
,
为所有元素均为1的张量,
是逐元素乘法。
更新
:通过增广拉格朗日函数(10)式,可以得到关于
的优化子问题:
(14)
因此,我们可以通过之前定义的t-WSVT阈值算子来更新
,即
(15)
更新
:通过增广拉格朗日函数(10)式,可以得到关于
的优化子问题:
(16)
通过使用下面定义的张量软阈值算子,我们可以得到以下阈值收缩等式来更新
,即
(17)
其中
是关于阈值为
的张量软阈值算子,满足:
(18)
更新
:
(19)
更新乘子
和
:
(20)
我们将上述基于ITCTV的鲁棒张量修补算法总结在算法1中。
4. 实验及讨论分析
在本节中,为了证明所提出的ITCTV方法在图像修复方面的有效性,我们将其应用到彩色图像、HSI以及灰度视频中。我们选择几种流行的鲁棒补全方法与我们的方法进行比较,即SNN [14] 、TNN [4] 、TTNN [15] 、TNTV [16] 、TCTV [9] 。至于对比方法的参数设置,我们的设置基于作者的代码或者他们文章中的建议。我们使用峰值信噪比(PSNR)或者峰值信噪比平均值(MPSNR)指标来衡量所有方法的恢复性能。对于实验数据,彩色图像是从Berkeley分割数据集中随机选取了10张图片,HSI选取了广泛使用的Pavia,Pavia university (Pavia U),KSC,DCMall,Urban以及Moffettfield,灰度视频则是从YUV数据集中挑选了10个。
4.1. 实验与模型参数设置
在进行模拟实验中,我们主要考虑不同采样率
与噪声比例
组合的几种图像的退化情况。对于所提出的鲁棒张量修补模型中的参数,我们将其中的
默认设置为
,而用于控制梯度张量
的奇异值收缩的权重参数q,可以从一定范围内进行选择,如
,我们根据经验在实验中默认设置
,针对不同的视觉张量数据,也可以进行微调。
4.2. 视觉张量数据修复
本节我们将所提出的方法应用于彩色图像、HSI以及灰度视频的恢复中,其中每个彩色图片的大小为
,HSI裁剪过后的大小为
,灰度视频的大小为
。我们将所提出的方法与上述提到的5种方法进行比较,PSNR或MPSNR数值结果如表1~3所示,其中的数值是各类型所有挑选图像实验指标的平均值,最优结果通过粗体突出显示。可以看出,在不同采样率和噪声水平下,我们所提出的方法均达到了最优的恢复效果。同TCTV方法相比,由于进一步充分利用了梯度张量的奇异值的先验分布信息,因此恢复效果也有了显著提升。除此之外,HSI相比彩色图片等图像低秩性更强,我们的方法在梯度域下利用梯度张量的先验信息也更加充分,因此在HSI这种波段更多、低秩性更强的视觉张量数据上更有竞争力。
![](Images/Table_Tmp.jpg)
Table 1. Performance evaluation of color images under different degradation conditions by different methods
表1. 不同退化情况下彩色图片在不同方法上的性能评估
![](Images/Table_Tmp.jpg)
Table 2. Performance evaluation of HSI under different degradation conditions by different methods
表2. 不同退化情况下HSI在不同方法上的性能评估
![](Images/Table_Tmp.jpg)
Table 3. Performance evaluation of grayscale videos under different degradation conditions by different methods
表3. 不同退化情况下灰度视频在不同方法上的性能评估
为了从视觉上展示更加直观的恢复效果,我们展示了所有竞争方法在部分图像上的视觉恢复结果。图1~3分别展示了彩色图片、HSI和灰度视频在不同采样率下的恢复结果。可以看出,我们的方法同TCTV一样,在梯度域下进行建模不仅刻画了低秩性,同时编码了局部平滑先验,因此在局部细节以及边缘上的恢复更好。综上所述,我们所提出的方法在数值和视觉上都具有更加优越的恢复性能。
4.3. 可逆线性变换分析
考虑到t-SVD框架依赖于方向和特定变换(例如DFT、DCT、酉变换和小波变换等),我们探讨了所提出的模型使用的ITCTV范数在不同变换下的恢复结果。表4显示了TCTV方法和我们提出的ITCTV方法在基于DFT的t-SVD框架、基于DCT的t-SVD框架和基于酉变换的t-SVD框架下不同视觉张量数据恢复的定量比较。结果表明,与DFT相比,基于DCT的t-SVD框架下的恢复性能可以进一步提高。通过将可逆线性变换改为基于数据的酉变换,还可以进一步提高恢复性能。这与 [17] 中的结果一致,特别是对于彩色图像,这表明对于不同的数据类型,仍然需要考虑使用哪种可逆线性变换来达到最佳的恢复结果。
![](Images/Table_Tmp.jpg)
Table 4. Performance comparison of TCTV and ITCTV methods under different invertible linear transforms
表4. TCTV和ITCTV方法在不同可逆线性变换下的性能比较
5. 总结与展望
在本文中,我们通过重加权策略引入了一种改进的张量相关全变分(ITCTV)范数,并将其应用于图像修复。所提出的ITCTV范数不仅同时表征了全局低秩和局部平滑两个先验,减少了两个先验正则化项对应的参数,而且还进一步提高了区分控制梯度张量不同奇异值的灵活性。所提出的方法在不同类型的视觉张量数据上的实验结果证明了该方法在图像修复上的有效性。在未来的工作中,我们将考虑双线性分解对模型算法进行加速,以及将ITCTV正则化器推广至更一般的非线性变换框架。