1. 引言
随着信息技术的迅速发展和应用,数据填充已经成为了计算机视觉、人工智能和优化领域研究的热点问题。数据可以用矩阵来表示,而张量是矩阵向更高维度的推广,可以更大程度上保留数据结构的完整性。在实际场景中,由于传感器的故障,不当的人类操作和遮挡等,计算机视觉应用中遇到的张量数据很少是完整的。由此,恢复高质量的张量数据对于一些实际应用是必不可少的。为了弥合现实与需求之间的差异,需要从受损或不完整的张量数据中恢复完整的信息。以张量为代表的多媒体数据,如彩色图像和视频,由于空间相关性、全局对称性和局部相似性等原因,通常表现出低秩性。低秩张量恢复的一个典型问题是低秩张量填充问题,即估计张量中的缺失值。这是计算机科学和数学领域的一个持续的研究挑战。广泛应用于许多现实问题,如视觉数据 [1] [2]、EEG数据 [3] [4]、高光谱数据分析 [5]、链接预测 [6]。但秩的极小化问题很难求解,根据张量定义的秩的不同,张量分解方式也有不同,如基于CP分解 [7] 的CANDECOMP/PARAFAC秩,基于Tucker分解 [8] 的Tucker秩,基于TT分解 [9] 的Tensor Train秩,以及基于张量奇异值分解 [10] 的tubal秩。因此张量秩的替代有很多种,但是很多方法有其局限性,寻找复杂度低的张量填充模型极其重要。
本文主要研究张量奇异值框架下的三阶张量填充问题,在过去的几年中,我们见证了许多方法的发展,秩最小化方法可分为两类。一种是低秩张量因子分解方法,另一种是张量核范数最小化方法。低秩张量因子分解方法旨在将给定张量分解成两个较小的张量,可以在某些损失函数下重建张量,但是却忽略了目标函数中谱正则化的使用。张量核范数最小化方法代表了研究的另一个主要分支,它的一个限制是过度惩罚奇异值的大条目,大规模张量的奇异值分解导致了较高的计算成本,研究人员试图用一些非凸范数来代替核范数。最近研究表明,利用非凸的
范数来松弛
范数(向量的非零条目数) [11] [12] 和Schatten-p范数,以近似秩函数有最佳的性能 [13] [14],而不是
范数和核范数作为压缩感知和矩阵恢复问题的替代。对于张量数据,Liu等人 [15] 基于张量奇异值分解定义了张量p收缩核范数,这对于矩阵情况下的高维大规模数据来说是昂贵的。为了解决Schatten-p范数最小化的高计算成本,Kong等人 [16] 定义了低秩张量补全的张量Schatten-p拟范数(
),并提供了一个multi-tensor-Schatten-p拟范数替代项,以转换一个非凸和非光滑的大型张量Schatten-p范数,对于
的多个小尺度因子张量的总和,Schatten-p可以是凸的和光滑的。该方法在一定程度上降低了算法的时间复杂度。然而这些形式的一个主要缺点是,需要计算多个小尺度因子张量的奇异值,会在大数据设置中限制计算。Fan [17] 等人和Jia [18] 采用矩阵因子分解的方式将Schatten-p范数分解为
范数和
范数加权和的形式,此方法不需要奇异值分解,降低了复杂度。
2. 预备知识
定义1 [19] 张量Frobenius范数:张量
,
表示张量进行傅里叶变换的块对角矩阵,张量Frobenius范数为:
定义2张量
范数:设
,则张量
范数的q次幂为:
定义3 [20] 张量奇异值分解:设
,则
的奇异值分解为
,其中
,
,
是对角张量。
定义4 [16] 张量Schatten-p范数:设
,张量
的奇异值分解为
,如果
,则具有p次幂的t-Schatten-p范数定义为:
定理1
,
,让
,则以下情况成立:
1)
。
2)
和
互相等价。
3. 双因子张量范数的正则化低秩张量填充
3.1. 模型确立
在本节中,为提高低秩张量模型对受损图像和视频的恢复效果,引入了一种基于tubal秩的新的张量补全的方法,将张量Schatten-p范数的形式引入传统张量补全模型。
设
,观察元素的位置由
决定,其中如果观察到
,则
,否则为0。假设部分观察的数量足够大。则低tubal秩张量补全问题如下表示:
(1)
为了解决大规模张量Schatten-p范数最小化的高计算成本,提出了张量Schatten-p范数的因子分解形式。
定理2张量
分解为张量积形式
,
,
,
,
,所以有
(2)
应用定理2张量最优化问题模型如下:
(3)
其中
,
,
,
和
。
接下来我们用ADMM法进行求解,首先我们写出上式的拉格朗日函数。
(4)
其中是
拉格朗日乘子,
是拉格朗日惩罚参数,
表示张量内积算子。
3.2. 模型求解
我们用交替方向乘子法对
进行模型求解。求解之前,我们先给出以下引理。
引理1对于问题
(5)
的解为
,
,其中W是对角矩阵,它的对角元素
,
。
引理2
为给定矩阵,
是正标量,下列问题
(6)
的解为W,W的第i行为
。
在第
次迭代时,更新
:
(7)
然后,我们可以直接得到
的最优解
(8)
其中
是
的互补算子。
在第
次迭代时,更新
,我们将最小化与
的有关的
,同时保持所有其他变量不变。最小化问题变成
(9)
通过应用离散傅里叶变换并利用定理1的性质,(9)的解可以等价于在变换域中求解以下问题
(10)
其中
,
。
根据引理1可求解。
在第
次迭代时,更新
,们将最小化与
的有关的
,同时保持所有其他变量不变。最小化问题变成
(11)
其中
,
。
根据引理2可求解。
在第
次迭代时,更新
和
(12)
(13)
其中
为常数参数,
为默认最大值,可防止
变得过大。
4. 实验
在本节中选取了大小为300 × 300 × 3的图片进行了实验,当自然图像转换为矩阵时,可以被视为低秩结构,张量数据也是如此。该图显示采样率为0.4,本文的方法与其他方法对比进行图像恢复的结果,以验证本文所提出算法的有效性和效率。将本文模型取p = 1/2和p = 2/3时的算法与张量的TNN和TCTF进行比较,并选择所有方法的参数,以确保它们尽可能好地执行。将结果和原始图片进行了比较。通过各种方法恢复的视觉结果如图1所示。并选择时间(TIME)、峰值信噪比(PSNR)和结构化相似性指数(SSIM)作为评估指标的结果如表1所示。PSNR和SSIM的数值越大,实验效果越好。
Table 1. Comparison of PSNR, SSIM and computation time for image inpainting
表1. 图像修复的PSNR、SSIM和计算时间的比较
5. 结论
本文中提出了双因子张量范数正则化低秩张量填充模型,并给出了求解低秩张量补全的有效算法。在这个优化过程中,避免了大规模张量的奇异值分解。此外,我们选取p = 1/2和p = 2/3的算法模型,通过真实数据的实验,从精度和时间消耗两个方面验证了该算法的优越性。
基金项目
该文得到了辽宁省高等学校创新人才支持计划的资助。
NOTES
*通讯作者。