1. 引言
在许多实际应用中,信号的相位往往会受到噪声、失真或其他干扰的影响,导致相位信息被破坏或模糊化。这可能导致信号在传输、存储或处理过程中的失真,影响到后续的信号分析和处理。相位恢复 [1] 旨在通过各种信号处理技术来还原或修复受损的相位信息 [2] [3] 。其背后的基本原理是利用已知的信号特性或先验知识来推测缺失或损坏的相位 [4] 。相位恢复的方法通常基于信号的统计特性、周期性特征或其他可用的信息 [5] 。相位恢复在许多领域都有广泛的应用,包括通信系统、雷达信号处理、图像处理、音频处理等。通过恢复受损的相位信息 [6] ,可以提高信号的质量和可靠性,从而实现更准确的信号分析、恢复和提取 [7] 。
相位恢复问题是指从线性系统输出的振幅或强度中恢复输入的信号,所以相位恢复问题是一种逆问题 [8] [9] 。一般的逆问题表示成下面的优化问题的形式:
(1)
其中
表示对输入信号的估计,即优化变量,
是观测到的系统输出的值。
表示数据保真项,即保证
,
表示
的先验信息,作为目标函数的正则项有助于求解优化问题,
表示对
的惩罚程度。
对于具体的相位恢复问题,可以把它写成下面的形式:
(2)
相位恢复算法可以追溯到1970s,1972年Gerchberg提出了最早的相位恢复算法 [10] ,然后在1978年Fienup对其进行了改进,即HIO算法(混合输入输出算法) [11] 。相位恢复算法一直不断地发展,而且与很多领域相交叉 [12] [13] 。随着优化算法的不断发展,它们为解决相位恢复问题提供了不同角度的帮助。比如随着压缩感知的发展,很多学者将压缩感知应用到相位恢复算法,进而提高相位恢复效果 [14] [15] 。但是在目标信号是密集信号的时候这种方法不能提高恢复效果。
随着去噪领域算法的成熟,即插即用框架被提出来了,很多学者考虑将去噪算法广泛应用到众多逆问题中。基于拉格朗日增广和变量分裂思想的ADMM算法(Alternating Direction Method of Multipliers) [16] 在相位恢复问题上展现了良好的表现,但是基于ADMM算法的相位恢复具有多个参数选择的困难。RED(Regularization by Denoising) [17] 提出了去噪正则化框架,并表现出了极大的灵活性和适用性。在prDeep [18] 提出了将去噪正则化框架应用到含有噪声的相位恢复问题,并且表现了很好的效果。但是prDeep在含有高噪声的频谱信息时的恢复效果较差。
随着深度学习 [19] 的发展,深度神经网络广泛应用到图像处理的各个方面,论文 [20] 将相位恢复问题看作一般的逆问题,应用神经网络训练一个观测信号到期望恢复信号的映射。它考虑先打破相位恢复中的对称性,然后使用深度学习训练一个深度神经网络,进而从信号的振幅信息求解出信号的相位信息,但是这种方法的一个局限是它只适用于与训练数据集相关的图像。prDeep是一种基于去噪正则和DnCNN [21] 求解带有噪声的相位恢复的方法,它提升了恢复效果,但是仍存在对复杂噪声鲁棒性较差的问题。因为在prDeep中使用的去噪器是去噪卷积神经网络(DnCNN),我们分析是单个的去噪器先验不能包含图像的全部先验信息。所以我们考虑使用两个不同的去噪正则化解决相位恢复问题,即多尺度的去噪正则化。在FFDNet (Fast and Flexible Denoising Network) [22] 中介绍了对于图像去噪,在高斯噪声的参数即标准差
时DnCNN的去噪效果比FFDNet的去噪效果好,而在
时FFDNet的去噪效果比DnCNN的去噪效果好。所以我们考虑在相位恢复的过程中分情况使用DnCNN和FFDNet这两种去噪器,即在
时使用DnCNN作为去噪器,而在
时使用FFDNet作为去噪器。然后在测试图像为Set12数据集下考虑在不同的Poisson噪声水平时图像的恢复情况,并比较它们的视觉效果和量化数值。
在我们的工作中,我们做出了三个贡献。第一个贡献是使用多尺度的去噪正则化求解带有噪声的相位恢复问题,它基于去噪正则化框架,我们通过数值实验表明了这种改进的优点。第二个贡献是我们将RED和FFDNet一起考虑求解带有噪声的相位恢复问题。第三个贡献是我们在相位恢复的过程中分情况使用DnCNN和FFDNet这两种去噪器。最后我们通过数值实验比较了我们的改进策略在视觉效果和量化数值上都有更加优异的表现。
在第一章我们介绍相位恢复的研究背景和动机,以及我们的论文贡献和论文结构。在第二章我们介绍图像去噪引擎和FBS (前向后向分裂)算法 [23] 及其改进版本的相关知识。在第三章介绍我们本文的工作,包括使用多尺度去噪正则化求解含噪声相位恢复问题和分情况使用DnCNN和FFDNet这两种去噪器求解含噪声相位恢复问题。在第四章展示了我们的数值实验结果,包括实验的一些设置、实验的数据和可视化比较以及实验结果分析。第五章是我们的总结和对未来的展望。
2. 预备知识
2.1. 图像去噪引擎
图像去噪 [24] 是数字图像处理中的一项重要任务,它旨在从图像中消除或减少噪声的存在,以提高图像的质量和清晰度。噪声是由于图像获取、传输、存储或处理过程中的各种因素引起的不希望的干扰或失真。常见的噪声类型包括泊松噪声 [25] 、高斯噪声 [26] 、椒盐噪声等。图像去噪在很多领域中都有它的应用,比如计算机视觉、生物医学和半导体制造等。图像去噪的目标是从一个带有噪声的观测图像
中恢复出干净的图像
,它的模型为:
。其中
一般是加性白高斯噪声或者泊松噪声。从这个模型中可以看出图像去噪是一种逆问题。
图像去噪的发展历史可以追溯到早期的数字图像处理领域。在20世纪60年代和70年代,早期的图像去噪方法主要基于统计滤波理论。这些方法通过应用统计模型和滤波技术来减少图像中的噪声。在70年代和80年代,线性滤波方法被广泛研究和应用。这些方法包括均值滤波 [27] 、高斯滤波和中值滤波 [28] 等。线性滤波方法在简单噪声模型下表现良好,但对于复杂噪声和图像细节保护的要求有限。在80年代末和90年代初,小波去噪方法 [29] 的出现引起了广泛关注。小波去噪通过对小波系数进行阈值处理来去除噪声,并在不同尺度上分别处理图像的细节和噪声。小波去噪方法在保留图像边缘和细节方面表现出色,成为图像去噪领域的重要方法。2000年以后,基于偏微分方程的图像去噪方法引起了广泛关注。这些方法基于偏微分方程的演化过程,利用图像的局部特征来去除噪声。著名的方法有非局部均值去噪(Non-local Means Denoising) [30] 等方法。近年来,深度学习方法在图像去噪领域取得了重大突破。通过使用深度神经网络,特别是自编码器、生成对抗网络(GAN)等模型,可以学习从含噪图像到无噪图像之间的映射关系,实现高质量的图像去噪。
去噪正则化框架是一种常用的图像去噪方法,它通过在优化问题中引入正则化项来约束解的平滑性或稀疏性,从而实现去除图像中的噪声。该框架的基本思想是在最小化数据保真项和正则化项之间取得平衡,以获得最佳的去噪结果。与其他即插即用算法一样,去噪正则化算法可以使用任意去噪器来正则化任意一个图像逆问题 [31] [32] ,不同之处在于别的方法使用去噪器来最小化隐式损失函数,但是去噪正则化框架使用去噪器最小化显式损失函数,并保证收敛到全局最优解。它通过将正则化问题转化为一个去噪问题,并利用强大的去噪算法来恢复干净的信号。这使得RED方法在处理受噪声干扰的数据时表现出很强的鲁棒性。RED方法可以适用于各种线性逆问题,包括图像恢复、信号恢复、压缩感知等。它不依赖于特定的问题设置,因此可以广泛应用于多个领域和任务。相对于传统的正则化方法,RED方法不需要先验信息或者对噪声进行严格的建模。
去噪正则化框架定义的正则项为
(3)
其中D是去噪器。
那么我们的优化模型为
(4)
2.2. FBS算法及其改进版本的介绍
FBS算法考虑这样的优化问题
(5)
其中
属于
,f是凸的和可微的函数,g是任意的凸函数。
在很多情况下,函数g既不是可微的也不是有限值,在这种情况下,上面的优化问题不能使用一般的梯度下降法求解,但是我们可以使用FBS (Forward-Backward Splitting)方法,又叫作近端梯度下降法。然后我们求函数g的近端算子,其中
是步长。
(6)
FBS算法通过将整体问题分解为前向和后向子问题,使得问题的求解更加可行。这种分解方式可以帮助降低问题的复杂性,使得问题更易于理解和处理。FBS算法是一种迭代算法,每次迭代都通过前向和后向步骤逐渐改进变量的值。这种迭代的方式可以帮助算法逐步逼近最优解,并在每次迭代中提供一个改进的解。FBS适用于具有分离可加结构的问题,这种结构在许多应用领域中都很常见。因此,该算法可以用于解决各种优化问题,包括信号处理、机器学习和图像处理等领域。通过交替进行前向和后向步骤,FBS算法可以逐渐逼近优化问题的最优解。这个算法的优点是能够有效地处理目标函数中可微和非光滑或不可微部分的组合,并在每个步骤中针对不同的部分进行优化。而且FBS算法在处理凸优化问题时可以收敛到全局最小点。具体的FBS算法过程见算法1。
由于FBS算法的优秀思想,有很多学者对其提出了不同的改进版本,比如FISTA (Fast Iterative Shrinkage-Thresholding Algorithm)对FBS算法进行加速。FISTA算法相对于FBS算法的改进主要体现在更新迭代点的步骤上。FISTA引入了额外的加速参数
和使用预测校正方法,使得算法能够更快地收敛。在每次迭代中,FISTA根据前一次迭代的结果和当前的估计值来更新迭代点,并利用步长参数
来加速收敛过程。具体的过程见算法2。
在算法2中,
是
的Lipschitz常数,即需要满足
(7)
当步长
时这个算法是收敛的。算法2的第三步就是最原始的FBS算法,算法第四步是加速参数
的更新过程,这里的
随着迭代过程不断增大,当目标函数增大时采取重启方法,即令
。算法2的第五步是一个预测过程,当前迭代在上一次迭代的前进方向更近一步。这种方法可以加快算法的收敛速度。
当
时可以保证FBS收敛,但是实际上我们可能不知道
的性质,从而我们不知道步长应该取多少。因此我们可以使用回溯线搜索方法保证收敛性,即使不知道步长约束条件。这种方法在每次FBS的迭代之后检查线搜索条件,当条件不成立时进行回溯,即减小步长然后重新执行FBS迭代过程直到满足线搜索条件。线搜索方法使目标函数单调下降,但是很多学者认为它太过于保守,所以提出了非单调线搜索。单调线搜索坚持在每次迭代之后让目标函数减小,但是非单调线搜索允许目标函数在一定范围内增加。因为非单调线搜索条件比单调线搜索宽松,所以非单调线搜索条件更不容易被违背,这意味着更少的回溯步骤,那么运行时间也会相应地减少。
设M是一个线搜索参数,M是一个正整数,然后定义
(8)
(9)
如果违反了回溯条件(9),那么减小步长直到它成立,非单调线搜索的过程在算法3中。而且,使用了非单调线搜索的FBS算法是收敛的。
在本文中我们使用更加方便和完善的FASTA (Fast Adaptive Shrinkage-Thresholding Algorithm)求解器。FASTA求解器包含了FBS的优点,而且使用了自适应步长加速求解过程,可以让我们的问题快速收敛。
3. 我们的工作
一个去噪正则项中只是使用了单个去噪器,那么这时可能不能够涵盖图像的全部先验信息,所以我们考虑使用多尺度的去噪正则项,即使用两个去噪正则项:
(10)
(11)
其中
和
分别是是两个不同的去噪器。那么这时优化模型为:
(12)
其中
是高斯噪声的标准差。
对于这个优化问题,我们使用FASTA算法进行求解,那么令
(13)
(14)
首先对
进行梯度下降,取步长为
,即
(15)
因为这里的
是不可微的,我们令
,所以我们取它的一个次梯度
(16)
其中
表示对应元素相乘。
然后再求
的近端算子,即
(17)
根据prDeep,我们发现对它只进行一次迭代就能有很好的效果,所以我们可以得到
(18)
另一方面,我们考虑在相位恢复的过程中分情况使用DnCNN和FFDNet这两种去噪器。因为我们用四种从大到小的高斯噪声标准差的去噪器先去除高水平的噪声,再去除低水平的噪声,所以在
时使用DnCNN作为去噪器,而在
时使用FFDNet作为去噪器。
4. 数值实验
在这一章我们展示数值实验结果,介绍实验的一些设置并展示不同方法的恢复效果,包括视觉效果和量化数值。
4.1. 实验设置
4.1.1. 测量和噪声模型
在本文中我们考虑傅里叶测量。傅里叶测量是一个非常著名的测量,它基于傅里叶变换的原理,将信号从时间域转换为频率域。傅里叶测量在很多领域都有广泛的应用 [33] ,包括光谱学、光学显微镜、遥感、化学分析等。它能够提供关于物质的光学性质、化学成分、结构信息等方面的重要数据 [34] 。
在本文中,我们考虑泊松噪声。泊松噪声在许多领域中都有应用,包括通信、成像、物理实验和统计分析等。我们考虑模型
(19)
其中
是
的对角元素的对角矩阵。由代数学知识可知
,其中
是泊松噪声的参数,
是加入了泊松噪声之后的值。
4.1.2. 参数选择和初始化
我们使用采样率为4的傅里叶测量,测试图像为Set12数据集,使用的是128 × 128的灰度图像。对于正则项参数我们选取
,其中
表示样本噪声的方差。因为傅里叶测量方法对初值的选取是敏感的,所以我们使用HIO算法作为选取初始值的方法。我们的算法迭代200次,
的近端迭代1次。其他的实验细节我们参考prDeep。在多尺度去噪正则项里使用的两个去噪器分别是DnCNN和BM3D [35] ,其中DnCNN是基于机器学习的去噪器,BM3D是传统的去噪器,它们的去噪效果都很好。所有的数值实验均在配备了Ryzen7 5800H CPU和Nvidia Geforce RTX 3070 GPU的笔记本电脑上使用Matlab 2022a进行测试。
4.2. 实验结果与分析
我们进行了五种算法在Set12数据集上的数值实验,我们分别实验了它们在不同泊松噪声的噪声水平和不同测试图像上的相位恢复效果,下面展示它们的PSNR(峰值信噪比)、MSSIM(平均结构相似性)、运行时间和视觉比较图。其中运行时间的单位是秒,当像素值的范围是
时,
(20)
单位是dB。
表1记录了五种算法在Set12数据集的六幅图像上的PSNR,表2记录了它们的MSSIM,表3记录了五种算法的运行时间,我们分别考虑了和的泊松噪声。从表1中我们可以看到HIO算法的恢复效果最差,这是因为HIO算法不能去除频谱中的噪声。我们发现使用多尺度去噪正则化的相位恢复算法(RED-(DnCNN-
![](Images/Table_Tmp.jpg)
Table 1. PSNR of five algorithms on six images
表1. 五种算法在六幅图像上的PSNR
BM3D))和使用DnCNN和FFDNet分情况去噪的相位恢复算法(RED-(DnCNN-FFDNet))的PSNR和MSSIM都比使用FFDNet去噪的相位恢复算法(RED-FFDNet)高。不论是在还是时,(RED-(DnCNN-BM3D))和(RED-(DnCNN-FFDNet))在六幅图像上大部分情况的PSNR和MSSIM都比prDeep高。从表3中我们可以看到(RED-(DnCNN-BM3D))的运行时间最高,在100秒左右,这是因为BM3D是传统的去噪算法,它需要进行块匹配、聚类和三维滤波等多个步骤,而每个步骤都涉及到大量的计算操作,所以运行时间较高。
![](Images/Table_Tmp.jpg)
Table 2. MSSIM of five algorithms on six images
表2. 五种算法在六幅图像上的MSSIM
![](Images/Table_Tmp.jpg)
Table 3. Runtime of five algorithms on six images
表3. 五种算法在六幅图像上的运行时间
图1展示了Set12数据集中的七幅图像在时的不同算法的视觉比较;图2展示了Set12数据集中的七幅图像在时的不同算法的视觉比较。图1和图2中的每列从左到右分别表示原图像、HIO算法恢复图、(RED-FFDNet)恢复图、(RED-(DnCNN-BM3D))恢复图和(RED-(DnCNN-FFDNet))恢复图。从图像的视觉比较中我们发现HIO算法恢复的图像中还存在大量的噪声,而(RED-FFDNet)算法恢复的图像过于光滑,导致很多细节部分缺失了。(RED-(DnCNN-BM3D))和(RED-(DnCNN-FFDNet))恢复的图像比较清晰。表4记录了图像House在五种不同噪声水平下的相位恢复结果。从表4中我们发现(RED-(DnCNN-BM3D))在时的PSNR比prDeep稍低,但是在其他四种噪声水平情况下(RED-(DnCNN-BM3D))的PSNR都比prDeep高。(RED-(DnCNN-FFDNet))也是如此。
表5记录了Set12数据集中七幅图像的PSNR、MSSIM和运行时间的均值比较,从表5中可以看到在时(RED-(DnCNN-FFDNet))的PSNR和MSSIM都最高,在时(RED-(DnCNN-FFDNet))的PSNR和MSSIM也都是最高的。在时(RED-(DnCNN-BM3D))的PSNR比prDeep稍低,但是(RED-(DnCNN-BM3D))的MSSIM比prDeep高。在时(RED-(DnCNN-BM3D))的PSNR和MSSIM都比prDeep高。表6记录了Set12数据集中七幅图像的PSNR、MSSIM和运行时间的方差比较,从表6中可以看到在时(RED-(DnCNN-FFDNet))的PSNR的方差最小,在时(RED-(DnCNN-BM3D))的PSNR的方差最小。在和时(RED-(DnCNN-BM3D))的MSSIM的方差都是最小的。
![](//html.hanspub.org/file/38-2623916x116_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x115_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x114_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x113_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x112_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x111_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x122_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x121_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x120_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x119_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x118_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x117_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x160_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x159_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x158_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x157_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x156_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x155_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x166_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x165_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x164_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x163_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x162_hanspub.png?20240606090359616)
![](//html.hanspub.org/file/38-2623916x161_hanspub.png?20240606090359616)
![](Images/Table_Tmp.jpg)
Table 4. Phase retrieval comparison of image House under different noise levels
表4. 图像house在不同噪声水平下的相位恢复比较
![](Images/Table_Tmp.jpg)
Table 5. Comparison of the average values of PSNR, MSSIM and runtime of seven images
表5. 七幅图像的PSNR、MSSIM和运行时间的均值比较
![](Images/Table_Tmp.jpg)
Table 6. Comparison of the variance of PSNR, MSSIM and runtime of seven images
表6. 七幅图像的PSNR、MSSIM和运行时间的方差比较
![](//html.hanspub.org/file/38-2623916x213_hanspub.png?20240606090359616)
Figure 3. Phase retrieval comparison of image House in
图3. 图像House在
时的相位恢复比较
![](//html.hanspub.org/file/38-2623916x221_hanspub.png?20240606090359616)
Figure 4. Phase retrieval comparison of image House in
图4. 图像House在
时的相位恢复比较
![](//html.hanspub.org/file/38-2623916x229_hanspub.png?20240606090359616)
Figure 5. Phase retrieval comparison of image House in
图5. 图像House在
时的相位恢复比较
图3、图4和图5分别展示了图像House在其他三种泊松噪声水平下的视觉比较,即
、
和
。我们发现HIO算法的恢复效果最差,而(RED-FFDNet)恢复的图像过于光滑。在高噪声水平如
和
时,我们发现prDeep恢复的图像还存在大量的噪声,而在使用了多尺度的去噪正则项即(RED-(DnCNN-BM3D))之后在高噪声水平时恢复出的图像很清晰,在结合DnCNN和FFDNet进行分情况选择去噪即(RED-(DnCNN-FFDNet))时恢复出的图像也很清晰。这表明了我们的方法的进步之处。
5. 总结和展望
在本文中,我们基于去噪正则化框架和不同的去噪器求解带有噪声的相位恢复问题。将成熟多样去噪算法作为正则项解决带有噪声的相位恢复问题展现出了优秀的表现,基于神经网络的去噪器的强大去噪能力体现了卷积神经网络的强大性能。我们使用多尺度的去噪正则化求解带有噪声的相位恢复问题,它基于去噪正则化框架,我们通过数值实验表明了这种改进的优点。我们在相位恢复的过程中分情况使用DnCNN和FFDNet这两种去噪器。最后我们通过数值实验比较了我们的改进策略在视觉效果和量化数值上都有更加优异的表现。
我们的想法不只局限于相位恢复问题,我们同样可以把本文的思想应用于其他的逆问题中,比如图像去模糊,超分辨率等。而且我们在未来的工作中可以结合其他形式的去噪正则项和其他的去噪器,并会考虑复值信号的相位恢复问题。