DOST在声呐图像滤波中的应用
The Application of the DOST in Sonar Image Filtering
DOI: 10.12677/jisp.2024.132020, PDF, HTML, XML, 下载: 45  浏览: 77  科研立项经费支持
作者: 田原嫄*, 王玉聪:东北电力大学机械工程学院,吉林 吉林;郭海涛:海南热带海洋学院海洋科学技术学院,海南 三亚
关键词: 声呐图像滤波DOST自适应阈值图像评价指标Sonar Image Filtering DOST Adaptive Threshold Image Evaluation Indicators
摘要: 声呐图像的滤波作为图像预处理的首要环节极其重要。但声呐图像具有存在对比度低、灰度值范围小且有用信息不明显的缺陷,传统滤波方法在声呐图像滤波中不能得到良好的效果。故本文将DOST应用于声呐图像的滤波中。通过小波阈值方法确定阈值,再用硬阈值函数去除高频DOST系数,最后进行逆变换,得到滤波后的图像。文中还用多种评价指标对比了多种滤波方法,并用真实声呐图像进行了分析,证明了其的实用性。
Abstract: The filtering of sonar images is extremely important as the primary step in image preprocessing. However, sonar images have the drawbacks of low contrast, small grayscale range, and unclear useful information. Traditional filtering methods cannot achieve good results in sonar image filtering. Therefore, this article applies the Discrete Orthogonal S-Transform (DOST) to the filtering of sonar images. Determine the threshold using wavelet thresholding method, remove high-frequency DOST coefficients using a hard thresholding function, and finally perform inverse transformation to obtain the filtered image. The article also compared multiple filtering methods using various evaluation indicators and analyzed them using real sonar images, proving their practicality.
文章引用:田原嫄, 王玉聪, 郭海涛. DOST在声呐图像滤波中的应用[J]. 图像与信号处理, 2024, 13(2): 238-246. https://doi.org/10.12677/jisp.2024.132020

1. 引言

海底小目标探测己被广泛应用于海洋资源开发利用和海洋国防军事、民事等活动中。水下成像探测技术包括光学成像和声呐成像,光学成像作用距离较近,一般在十米至几十米之间,而且在浑水区域基本失效。声呐图像具有作用距离远、穿透能力强等优点,特别适合用于浑水区域,因此被广泛用于海洋调查勘测、水下目标探测、港口航道疏通等领域。但由于水声信道的水介质及其边界具有复杂多变的特性,因而成像声呐采集得到的图像往往具有噪声强、分辨率低等特点,严重影响了水下探测和作业 [1] 。因此图像滤波作为图像预处理的一种方式,对后续图像分割及边缘检测等有着很大的影响。

声呐图像的滤波方法有两种。一种是空间域滤波 [2] (调整图像像素点的灰度值,对图像直接进行处理),包括线性滤波和非线性滤波两类,另一种是变换域滤波 [3] (将信号转换到另一空间,再间接滤波,最后进行逆变换将其还原)。变换域滤波方法包括傅里叶变换、小波变换及以它们为基础的众多改进方法 [4] ,这些方法在图像处理领域有很多的应用。其中,1996年由R. G. Stockwell提出的S变换(S-Transform, ST)在信号处理方面有很好的应用前景 [5] ,S变换融合了短时傅里叶变换(Short Time Fourier Transform, STFT)与小波变换的优势,是一种具有多分辨率的分析方法,S变换改善了STFT 时频分辨率不高的缺点,且在多分辨率结构下可以被视为小波变换理论的特例。S变换继承和发展了短时傅里叶变换以及小波变换在时频域的局部性概念,具有良好的时频聚焦性且含有相位因子,适用于非平稳信号的时频分析。1997年,R.G. Stockwell又提出了利用S变换处理二维数据的方法,在图像处理领域有很强的适用性 [6] 。针对S变换系数矩阵高度冗余不便于实际应用的缺点,R.G. Stockwell在2006年提出了非冗余的离散正交S变换(Discrete Orthonormal S-Transform, DOST) [7] 。且在2009年对DOST的图像的纹理特征进行了详细解释 [8] 。同年Y. Wang和J. Orchard在其计算过程中借鉴快速傅里叶变换(Fast Fourier Transform, FFT)提高运算效率的思想,提出了快速离散正交S变换(Fast Discrete Orthonormal S-Transform, FDOST) [9] ,并将其应用于图像压缩领域。目前,在声呐图像滤波方面,S变换的应用还很少。但其具有多分辨率和位移不变性等优点,又使其可以更好地满足声呐图像的滤波要求。

常用的图像滤波的方法有很多,但是在变换域滤波中,阈值处理方法是应用最广泛且最便捷的方法。本文尝试将小波的自适应阈值应用于处理DOST系数中,并在下文阐述该方法的原理,并以实际的声呐图像为例给出本文方法的实验结果,同时将本文方法与其他常用方法的实验结果进行对比。

2. 声呐图像噪声及分布模型

声呐图像是水声信道中接收声回波能量的二维平面分布,受噪声影响严重,对比度较低。受声基阵性能的限制,声纳图像的分辨率往往不高。主要考虑的噪声源有海洋环境噪声和舰船自噪声。海洋环境噪声常常遵循瑞利分布 [10] 。图1为一幅大小为198 (列) × 185 (行)的方位——距离二维图像,图中较大的亮区对应回波较强的区域,被称作目标亮区。目标亮区周围的较暗的部分为目标暗区,是海底小目标或者海底各类物体的声学阴影或者声波无法穿透小目标导致没有回波形成的。除了目标亮区和目标暗区以外,剩余部分为海底混响区。这部分形成的混响信号是一个按照一定的规律随时间衰减的非平稳的随机信号,通过对其相位和振幅的研究,其统计特性也按照一定的规律分布。假设声呐系统的各类散射分布均匀、声波的发出和接收位于同一位置并且混响噪声主要由海底各类物质的散射所引起,可得声呐图像中的散斑噪声统计模型与医学中常见的超声图像噪声以及SAR图像的统计模型相似,即

I ( i , j ) = v ( i , j ) g ( i , j ) (1)

式中,ij分别是声呐图像的行和列, v ( i , j ) 表示无噪声的声呐图像, g ( i , j ) 表示图像的散斑噪声。由于乘性的散斑噪声是导致声呐图像质量下降的主要原因,所以去除声呐图像中的散斑噪声对于声呐图像的分析与判别至关重要。

Figure 1. The original image of sonar images

图1. 声呐图像的原始图像

3. DOST应用于声呐图像的滤波

3.1. DOST与逆变换

S变换是一种能够提供信号的频率和相位信息的时频变换方法。给定一维连续信号h(t),其相应的S变换的如下所示。

S ( τ , f ) = | f | 2 π h ( t ) e [ 1 2 ( τ t ) 2 f 2 ] e ( i 2 π f t ) d t (2)

式中,f为信号的频率,t为信号的时间变量,τ为高斯窗函数的位移。变换中的高斯窗函数定义为

w ( t , f ) = | f | 2 π e t 2 f 2 2 (3)

由一维S变换的定义公式可知,高频处较窄的时窗和低频处较宽的时窗来分别获得较高的时间与频率分辨率,这使得S变换能更细致地描述信号特征。

DOST解决了原有S变换的冗余性,其提供了类似于离散小波变换的空间频率表示且DOST具有ST (和FT)的相位特性,保留准确变换回到傅立叶域的能力 [7] 。Stockwell给出了DOST的二维图像在频域中使用的二进采样方案。对于大小为M × N的图像 I ( x , y ) ,其二维DOST如下所示

D O S T [ x , y , ν x , ν y ] = 1 2 p x + p y 2 m = 2 p x 2 2 p x 2 1 n = 2 p y 2 2 p y 2 1 ( I f [ m + ν x , n + ν y ] e 2 π i ( m x 2 p x 1 + n y 2 p y 1 ) ) (4)

其中 p x = 2 , , log 2 ( M ) 1 p y = 2 , , log 2 ( N ) 1 ,式中 ν x ν y 由式(5)定义, I f [ m , n ] 为图像 I ( x , y ) 的二维FT且由式(6)定义

v x = 2 p x 1 + 2 p x 2 v y = 2 p y 1 + 2 p y 2 (5)

I f [ m , n ] = 2 p x + p y 2 m = 2 p x 2 2 p x 2 1 n = 2 p y 2 2 p y 2 1 D O S T [ m ν x , n ν y ] e 2 π i ( m x 2 p x 1 + m y 2 p y 1 ) (6)

其逆变换为

I [ x , y ] = 1 M N m = M / 2 M / 2 1 n = N / 2 N / 2 1 I f [ m , n ] e 2 π i ( m x / M + n y / N ) (7)

3.2. 阈值选取与滤波器函数设计

阈值的选取直接影响本文算法的滤波效果。人为设定的经验阈值可能会带来误差,将图像部分视为噪声去除。因此需要构建自适应阈值减小随机性带来的误差。本文采用的阈值为Donoho等人 [11] 提出的小波的通用阈值。Mitiche [12] 和侯云海 [13] 等人将其应用在图像处理中得到了良好的效果。阈值函数如下所示。

T = σ 2 ln ( M × N ) (8)

其中,M × N表示图像大小,T为阈值, σ 表示估计的噪声标准差,计算公式如式(9)所示。

σ = Median ( X ) 0.6745 (9)

式中, Median ( X ) 表示高频DOST系数幅值的的中值函数。

虽然硬阈值去噪的图像不是很平滑,有时会出现伪Gibbs现象、振铃现象等 [14] 。但是DOST经过软阈值函数处理会改变其的系数值,使逆变换出现误差,因此本文使用硬阈值处理DOST系数。滤波器函数如下。

F [ x , y , ν x , ν y ] = { 0 , | D O S T [ x , y , ν x , ν y ] | T D O S T [ x , y , ν x , ν y ] , other (10)

其中 F [ x , y , ν x , ν y ] 为滤波后的DOST系数。

滤波后的图像 H ( x , y ) 由下式得出。

H f [ m , n ] = 2 p x + p y 2 m = 2 p x 2 2 p x 2 1 n = 2 p y 2 2 p y 2 1 F [ m ν x , n ν y ] e 2 π i ( m x 2 p x 1 + m n 2 p y 1 ) (11)

I [ x , y ] = 1 M N m = M / 2 M / 2 1 n = N / 2 N / 2 1 H f [ m , n ] e 2 π i ( m x / M + n y / N )

4. 实验结果与质量评估

4.1. 图像评价指标

由于人眼的分辨率有限,而且人为主观观察存在偏差,而且人眼观察常常依赖于评价者的经验及主观判断,所以本文也选择了几种常用的性能指标判断滤波效果的优劣。包括峰值信噪比(PSNR) [15] ,结构相似性(SSIM) [16] ,等效视数(ENL) [17] 和边缘保持系数(EPI) [18] 。计算SSIM时,C1 = (0.01 × 255)2,C2 (0.03 × 255)2,C3 = C2/2, α = β = γ = 1 (各参数的含义详见文献 [16] )。

本文使用PSNR评估图像滤波的含噪量,MSE表达的是两幅图在每一个位置上的像素值的差异的平均。数值越大,表示噪声的数量越少。PSNR是衡量滤波效果最常用的参数之一,其将MSE进行改进,值越大表示有用信息所占比例越大,滤波效果也就越好。

PSNR = 10 log 10 L M A X 2 MSE (13)

其中,

MSE = i = 1 M j = 1 N ( k i , j f i , j ) 2 M × N (14)

另一种工具是结构相似性(SSIM)。SSIM是一种衡量两幅图片相似度的指标。与PSNR一样,SSIM也经常被用来评估图像的去噪程度。SSIM的输入就是两张图像,假设我们输入的两张图像分别是x和y,SSIM可以定义为。

SSIM ( x , y ) = ( 2 μ x μ y + c 1 ) ( σ x y + c 2 ) ( μ x 2 + μ y 2 + c 1 ) ( σ x 2 + σ y 2 + c 2 ) (15)

其中,μxμy分别代表x,y的平均值,σxσy分别代表x,y的标准差。σxy代表x和y的协方差。而C1,C2,C3分别为常数,避免分母为0带来的系统错误。SSIM是一个0到1之间的数,越大表示输出图像和无失真图像的差距越小,即图像质量越好。当两幅图像一模一样时,SSIM = 1。

等效视数(ENL),这是一种衡量均匀区域的光滑性的指标。ENL是文献中广泛用于评估均匀区域滤波结果的标准参数。ENL定义为

ENL = μ z 2 σ z 2 (16)

其中μzσz是原始或滤波声呐图像的估计平均值和标准差。ENL越大,噪声抑制能力越强。

图像滤波去除噪声的同时还要保证图像边缘不会丢失,所以文中选用边缘保持系数(EPI)来衡量图像边缘的保持能力。EPI定义为。

EPI = i , j ( I f ( i , j ) I f ( i + 1 , j ) ) 2 + ( I f ( i , j ) I f ( i , j + 1 ) ) 2 i , j ( I o ( i , j ) I o ( i + 1 , j ) ) 2 + ( I o ( i , j ) I o ( i , j + 1 ) ) 2 (17)

其中,其中IfIo分别表示滤波的声呐图像和原始声呐图像,ij是像素的坐标。EPI数值越接近1,边缘保持能力就越强。

4.2. 实验结果与分析

本文对两幅真实声呐图像进行了滤波实验。且与经典去除散斑噪声的滤波器进行了比较,如LEE滤波器、KUAN滤波器和FROST滤波器。下面给出了三幅不同大小的声呐图像滤波的实验结果和滤波效果的定量分析。其中LEE滤波器 [19] 、KUAN滤波器 [20] 和FROST滤波器 [21] 均为3 × 3的卷积模板。

图2所示为两幅真实声呐图像的原始图像,大小分别为185 × 198像素和188 × 134像素。图3图4分别为图2(a)和图2(b)的多种方法下的实验结果。

(a) 185 × 198像素的声呐图像 (b) 188 × 134像素的声呐图像

Figure 2. The original image of sonar images

图2. 声呐图像的原始图像

(a) 本文方法 (b) LEE滤波器(c) KUAN滤波器 (d) FROST滤波器

Figure 3. Experimental results of Figure 2(a)

图3. 图2(a)的实验结果

(a) 本文方法 (b) LEE滤波器(c) KUAN滤波器 (d) FROST滤波器

Figure 4. Experimental results of Figure 2(b)

图4. 图2(b)的实验结果

表1给出了本文滤波方法与其他三种滤波方法对图2(a)的声呐图像滤波后的含噪量、平滑程度和边缘保持能力定量度量。其中,本文滤波方法在PSNR中表现最好,数值最大,含噪量最少。对比LEE滤波器,本文滤波方法性能提高2.0206,且远优于另外两种方法。而且本文滤波方法的SSIM数值最接近1,含噪量最小。其他三种方法中LEE滤波器表现最好。对比图像的ENL值,FROST滤波器表现最好,且与其他三种方法相差很多。与本文方法相比,其他方法的ENL表现要优于本文方法。这是因为受频率收缩范围和低通截止频率的影响 [22] ,平滑和细节保持也是矛盾的。对于EPI,本文滤波方法的数值最接近1,边缘保持能力最强。本文方法比LEE滤波器的EPI高14%,比另外两种法高大约18%。本文方法在滤波过程中不仅有效去除噪声,还保留了细节,但在平滑程度上相对其他方法略有欠缺。

Table 1. Quantitative measurement of different filtering methods for sonar images in Figure 2(a)

表1. 图2(a)的声呐图像不同滤波方法的定量度量

表2给出了本文滤波方法与其他三种滤波方法对图2(b)的声呐图像滤波后的含噪量、平滑程度和边缘保持能力定量度量。对于四种评价指标,图像的定量度量与图2(a)的实验得到的结论一致。

Table 2. Quantitative measurement of different filtering methods for sonar images in Figure 2(b)

表2. 图2(b)的声呐图像不同滤波方法的定量度量

经过试验,在本文的方法中含噪量,平滑程度与细节保持能力同大多数方法一样也是矛盾的。但本文的方法比几种常用的滤波器做的更好。

5. 结论

本文将DOST用于声呐图像中,并用小波自适应阈值处理,实现了声呐图像的滤波。通过对真实声呐图像的滤波分析了该方法的优势和局限性。实验证明了该方法在噪声抑制和细节保持方面都有很好的效果,减弱了滤波时图像失真的现象,也将图像边缘进行了保留。但在平滑程度上还有所欠缺。在一般情况下,本文的方法可以对声呐图像可以得到较好的滤波效果。同时与大多数滤波方法一样,由于频率收缩范围和低通截止频率的影响,平滑和细节保持也是矛盾的。之后也会进一步研究使其实用化。

基金项目

本文受到海南省自然科学基金项目(420CXTD439)、三亚市科技创新专项(2022KJCX83)、国家自然科学基金项目(61661038) 资助。

NOTES

*通讯作者。

参考文献

[1] 郭海涛, 赵红叶, 徐雷. 基于循环平移和DTCWT的声呐图像滤波方法[J]. 仪器仪表学报, 2015, 36(6): 1350-1355.
[2] Wildberger, J.E., Mahnken, A.H., Thomas, F., Raupach, R., Weiss, C., Günther, R.W and Schaller, S. (2003) Spatial Domain Image Filtering in Computed Tomography: Feasibility Study in Pulmonary Embolism. European Radiology, 13, 717-723.
https://doi.org/10.1007/s00330-002-1700-z
[3] Rajput, M.A. and Khan, U.A. (2014) Frequency Domain Image Filtering Using Cuda. Mehran University Research Journal of Engineering and Technology, 33, 423-431.
[4] Mallat, S.G. (1989) A Theory for Multiresolution Signal Decomposition: The Wavelet Representation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 11, 674-693.
https://doi.org/10.1109/34.192463
[5] Stockwell, R.G., Mansinha, L. and Lowe, R.P. (1996) Localization of the Complex Spectrum: The S Transform. IEEE Transactions on Signal Processing, 44, 998-1001.
https://doi.org/10.1109/78.492555
[6] Stockwell, R.G., Mansinha, L., Lowe, R.P., Eramian, M. and Schincariol, R.A. (1997) Local S Spectrum Analysis of 1-D and 2-D Data. Physics of the Earth and Planetary Interiors, 103, 329-336.
https://doi.org/10.1016/S0031-9201(97)00047-2
[7] Stockwell, R.G. (2007) A Basis for Efficient Representation of the S-Transform. Digital Signal Processing, 17, 371-393.
https://doi.org/10.1016/j.dsp.2006.04.006
[8] Drabycz, S., Stockwell, R.G. and Mitchell, J.R. (2009) Image Texture Characterization Using the Discrete Orthonormal S-Transform. Journal of Digital Imaging, 22, 696-708.
https://doi.org/10.1007/s10278-008-9138-8
[9] Wang, Y. and Orchard, J. (2009) Fast Discrete Orthonormal Stockwell Transform. SIAM Journal on Scientific Computing, 31, 4000-4012.
https://doi.org/10.1137/080737113
[10] 张晓娟, 刘颉, 杨逍. 声纳海底管道图像去噪方法研究[J]. 海洋技术学报, 2017, 36(6): 82-85.
[11] Donoho, D.L. (1995) De-Noising by Soft-Thresholding. IEEE Transactions on Information Theory, 41, 613-627.
https://doi.org/10.1109/18.382009
[12] Mitiche, L., Adamou-Mitiche, A.B.H. and Naimi, H. (2013) Medical Image Denoising Using Dual Tree Complex Thresholding Wavelet Transform. 2013 IEEE Jordan Conference on Applied Electrical Engineering and Computing Technologies (AEECT), Amman, 3-5 December 2013, 1-5.
https://doi.org/10.1109/AEECT.2013.6716477
[13] 侯云海, 任钰. 一种改进的小波阈值去噪算法[J]. 长春工业大学学报, 2023, 44(4): 345-352.
[14] 王小兵, 孙久运, 汤海燕. 基于小波变换的图像混合噪声自适应滤波算法[J]. 微电子学与计算机, 2012, 29(6): 91-95.
[15] Hu, H., Li, B. and Liu, Q. (2016) Removing Mixture of Gaussian and Impulse Noise by Patch-Based Weighted Means. Journal of Scientific Computing, 67, 103-129.
https://doi.org/10.1007/s10915-015-0073-9
[16] Wang, Z., Bovik, A.C., Sheikh, H.R. and Simoncelli, E.P. (2004) Image Quality Assessment: From Error Visibility to Structural Similarity. IEEE Transactions on Image Processing, 13, 600-612.
https://doi.org/10.1109/TIP.2003.819861
[17] Moreira, A. (1990) An Improved Multi-Look Technique to Produce SAR Imagery. IEEE International Conference on Radar, Arlington, 7-10 May 1990, 57-63.
https://doi.org/10.1109/RADAR.1990.201137
[18] Liu, G., Yang, W., Xia, G.S. and Liao, M.S. (2013) Structure Preserving SAR Image Despeckling via L0-Minimization. Progress in Electromagnetics Research, 141, 347-367.
https://doi.org/10.2528/PIER13041503
[19] Lee, J.S. (1980) Digital Image Enhancement and Noise Filtering by Use of Local Statistics. IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-2, 165-168.
https://doi.org/10.1109/TPAMI.1980.4766994
[20] Kuan, D., Sawchuk, A., Strand, T. and Chavel, P. (1982) Nonstationary 2-D Recursive Filter for Speckle Reduction. Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing, Paris, 3-5 May 1982, 1561-1564.
https://doi.org/10.1109/ICASSP.1982.1171482
[21] Frost, V.S., Stiles, J.A., Shanmugan, K.S. and Holtzman, J.C. (1982) A Model for Radar Images and Its Application to Adaptive Digital Filtering of Multiplicative Noise. IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-4, 157-166.
https://doi.org/10.1109/TPAMI.1982.4767223
[22] Gao, F., Xue, X., Sun, J., Wang, J. and Zhang, Y. (2016) A SAR Image Despeckling Method Based on Two-Dimensional S Transform Shrinkage. IEEE Transactions on Geoscience and Remote Sensing, 54, 3025-3034.
https://doi.org/10.1109/TGRS.2015.2510161