基于动态规划的Seam Carving裁剪算法
Seam Carving Algorithm Based on Dynamic Programming
DOI: 10.12677/sea.2024.133045, PDF, HTML, XML, 下载: 44  浏览: 80 
作者: 杨科林*:陇南通途公路养护工程有限公司,甘肃 陇南;杨 斌:陇南通途公路养护工程有限公司,甘肃 陇南;中国电信股份有限公司兰州分公司,甘肃 兰州;秦崇良, 雷荣军, 张永超, 屈睿涛:中国电信股份有限公司兰州分公司,甘肃 兰州
关键词: 动态规划多尺度处理梯度能量函数Seam Carving裁剪算法Dynamic Programming Multi-Scale Processing Gradient Energy Function Seam Carving Algorithm
摘要: 随着科技的发展,图像应用和分享越来越普遍。图像尺寸调整在不同设备和屏幕上的显示非常重要。传统的方法只是简单地复制或计算像素值,而不考虑图像内容的重要性。然而,基于动态规划的Seam Carving裁剪算法提出了一种更优化的方法。该算法采用多尺度处理,对不同尺度的图像进行Seam Carving操作,并将处理结果整合起来,以实现更全面、更精细的图像调整。
Abstract: With the development of technology, image applications and sharing are becoming increasingly common. Image resizing is crucial for displaying on different devices and screens. Traditional methods simply copy or calculate pixel values without considering the importance of image content. However, the Seam Carving algorithm based on dynamic programming proposes a more optimized approach. This algorithm adopts multi-scale processing, performs Seam Carving operations on images of different scales, and integrates the processing results to achieve more comprehensive and refined image adjustments.
文章引用:杨科林, 杨斌, 秦崇良, 雷荣军, 张永超, 屈睿涛. 基于动态规划的Seam Carving裁剪算法[J]. 软件工程与应用, 2024, 13(3): 439-445. https://doi.org/10.12677/sea.2024.133045

1. 引言

随着数字摄影和图像处理技术的飞速发展,图像应用和分享变得更加普遍。为了在不同设备和屏幕上展示图像,图像尺寸调整成为了一个关键问题。然而,传统方法往往依赖于简单的像素复制或插值,缺乏对图像内容重要性的考虑,导致缩放过程中可能出现失真。Seam Carving算法作为新型图像尺寸调整技术,通过智能识别和保留图像中的重要内容,实现了缩放过程中避免图像失真的效果[1] [2]。本文将详细介绍基于动态规划的Seam Carving算法的实现步骤,并通过实验结果分析该算法的优越性和适用性。本文的研究内容对图像处理领域具有重要意义,为提高图像质量和适应性提供了新的思路和方法。

2. 基本原理

2.1. 图像放缩

图像放缩通常包括以下基本步骤:

插值:根据目标尺寸,使用插值算法计算新图像中的像素值,其中插值法有最近邻插值法、双线性插值法以及样条插值法等。选择合适的插值算法,可以根据目标尺寸计算出新图像中的每个像素值,从而实现图像的缩放。不同的插值算法适用于不同的应用场景,需要根据具体需求进行选择。

采样:将插值后的像素值量化为整数值,通常使用四舍五入、向下取整、向上取整等方式。通过采样,将插值后的浮点数像素值转换为整数值,从而得到最终的放缩图像。

边界处理:处理图像边界的像素是图像放缩过程中至关重要的步骤,它直接影响着放缩后图像的质量,常见的方法有复制边界像素、镜像边界像素、周期性边界、边缘拓展等。通过合理选择边界处理方法,可以有效地处理图像边界的像素,从而提高图像放缩后的整体质量。

2.2. Seam Carving与动态规划算法原理

2.2.1. 算法介绍

动态规划通常用于求解具有某种最优性质的问题,这些问题可能有很多可行解,但只有一个最优解。动态规划算法的设计通常分为四个步骤:描述最优解的结构、递归定义最优解的值、按自下而上的方式计算最优解的值,以及由计算出的结果创造一个最优解。

Seam Carving算法是一种能够尽可能保留图像中视觉关注度高的对象和区域的图像缩放技术[3]。Carving算法能计算出图像上的“关键部分”和“不重要区域”,从而使得随意改变一个图像的高宽比但“不会让图像内容变得扭曲变形”。用这个技术我们可以在缩放时固定图片中特定区域的大小,或者可以在缩小时让特定的区块被周围图像缝合消除,并且因为“seam carving”的缝补算法,可让图片缩放后仍然维持整体的完整性。

算法流程[4]:第一步计算图像的能量图,第二步通过能量图计算代价图以及路径图,第三步通过代价图以及路径图寻找能量最低的seam,最后重复上述步骤。在接缝裁(seam carving)算法中,缝隙(seam)就是指从左到右或从上到下的连续像素,它们横向或纵向穿过整个图像。为了执行缝隙拼接,我们需要两个重要的输入:原始图片:需调整大小图片;能量图:从原始图像导出能量图。能量图代表图像的最显著的区域,通常使用梯度幅度、熵图或显著图表示。

此算法的关键思想是利用动态规划计算代价最小的缝隙路径。动态规划的优势在于它可以有效地避免重复计算,并找到全局最优解。在寻找缝隙时,需要考虑缝隙两侧像素的能量差异,以保留图像的关键内容。Seam Carving的核心创新之处在于通过智能选择缝隙路径,实现了在不破坏图像内容的情况下改变图像尺寸的目标。这使得Seam Carving成为一种非常灵活且智能的图像缩放技术。

2.2.2. 能量函数

在图像处理中,能量函数用于度量图像中每个像素点的重要性或者突出特征。在Seam Carving算法中,能量函数用来为图像中的每个像素赋予一个能量值,该值表示像素的重要性。能量函数的设计是Seam Carving算法中的关键步骤,因为它直接影响算法选择哪些缝隙进行删除或插入。以下是一些常用的能量函数计算方法:

1) 梯度能量(Gradient Energy)

梯度能量是Seam Carving中最常用的能量函数。对于灰度图像,可以使用Sobel算子等边缘检测算子来计算像素的梯度。梯度能量的计算方法通常是将像素在水平方向和垂直方向上的梯度的平方和开方,其中, G x ( x,y ) G y ( x,y ) 分别表示像素在水平和垂直方向上的梯度。表示为:

E( x,y )= G x ( x,y ) 2 + G y ( x,y ) 2 (1)

2) 颜色梯度能量(Color Gradient Energy)

对于彩色图像,可以在每个通道(红、绿、蓝)上分别计算梯度,并将各通道的梯度能量进行累加,得到颜色梯度能量。

E( x,y )= G r 2 ( x,y )+ G g 2 ( x,y )+ G b 2 ( x,y ) (2)

3) 亮度梯度能量(Luminance Gradient Energy)

对于彩色图像,也可以将颜色转换为亮度(灰度)后再计算梯度能量,以保留亮度信息。其中, G( x,y ) 表示像素 ( x,y ) 的亮度值。

E( x,y )= G ( x,y ) 2 (3)

4) 其他能量函数

除了梯度能量外,还可以根据特定需求设计其他能量函数。例如,基于纹理、对比度等特性来度量像素的重要性。能量函数的选择取决于应用场景,选择合适的能量函数可以使得Seam Carving算法在特定任务中更加有效。

2.2.3. Seam的定义与计算

为了阐述计算代价的意义,首先解释seam的概念。seam是指像素从上到下(或从左到右)的连接路径。通过从每一行选择一个像素,形成一条seam。第一个式子表示从上到下的seam,第二个式子表示从左到右的seam。seam在图像缩放中的作用是什么呢?举个例子,对于一个200 × 200的图像,删除一条从上到下的seam,图像尺寸变为200 × 199。因此,通过删除seam,实现图像缩放。但是应该删除哪些seam呢?能量定义了像素在图像中的重要程度。为了保留图像的主要内容,删除总能量较低的seam,保留关键内容。那么如何计算代价呢?对于从上到下的seam,如果像素的横坐标是x,那么上一行组成seam的像素的横坐标只能是 x1,x+1 。为了使能量最小,选择上一行这三个像素中能量最小的像素与当前像素组成seam。通过该点时的总能量等于该点的能量加上上一行像素总能量的最小值。因此,可以利用以下递推公式(从上到下)计算代价:

M( i,j )=E( i,j )+min( M( i1,j1 ),M( i1,j ),M( i1,j+1 ) ) (4)

计算能量图时,使用path记录路径以便回溯找到seam。对于path [ i,j ] ,如果 ( i,j ) 的能量来自上一行左边则为−1,中间为0,右边为1。注意,寻找从左到右的seam只需将图像翻转90˚,寻找从上到下的seam。在能量图计算完成后,使用动态规划算法从图像的顶部到底部(或从左侧到右侧)寻找一条最佳缝隙路径,即连接图像顶部和底部(或左侧和右侧)的路径,使路径上的像素总能量最小。动态规划算法的目标是找到路径,使路径上像素的累积能量最小。路径计算通常从底部(或右侧)开始,逐行向上(或逐列向左)选择路径三、Seam Carving改进方法。

2.2.4. Seam的删除和插入

一旦找到了最佳缝隙,可以选择将该缝隙上的像素删除,即将缝隙上的像素从图像中去除,从而减小图像的宽度(或高度)。如果需要放大图像,可以选择在缝隙上插入像素,即在缝隙上选择合适的像素进行复制或插值操作,从而增加图像的宽度(或高度)。通过这种方式,Seam Carving算法能够智能地调整图像的尺寸,保持图像中重要内容的完整性,避免了传统的缩放和裁剪可能引起的内容失真问题。算法的精髓在于能够找到一条最不重要的路径,即最佳缝隙,以最小的代价来调整图像的尺寸[5]

2.3. 多尺度Seam Carving

多尺度Seam Carving是Seam Carving算法的改进版,可以更灵活地满足不同应用场景下的图像调整需求。传统Seam Carving算法只适用于单一尺度的图像缩放,而多尺度Seam Carving则运用多层次尺度进行处理,以实现更全面、更精细的图像调整。多尺度Seam Carving的主要思想是在不同图像尺度上进行Seam Carving操作,并将各尺度下的处理结果综合起来,得到更细致和平滑的调整效果。这种方法能够保持图像主要结构的同时,对不同层次的细节进行处理,提供更全面的图像调整能力。多尺度Seam Carving的基本步骤如下:

1) 尺度金字塔构建

首先,原始图像被缩小为不同尺度的版本,通常使用图像金字塔(Image Pyramid)的方法,得到一系列不同分辨率的图像。这些图像包含了原始图像的多个尺度版本。

2) 在每个尺度上进行Seam Carving

对于每个尺度的图像,分别应用Seam Carving算法,得到在该尺度下的调整结果。由于图像分辨率的不同,每个尺度上的Seam Carving操作可能产生不同数量的Seam (缝隙)。

3) 融合调整结果

将不同尺度下得到的调整结果进行融合,通常采用插值或者融合算法,将各个尺度的调整结果整合成最终的调整结果。融合的过程可以使得图像在多个尺度上都保持主要结构的同时,对各个尺度下的细节进行更加平滑的调整。

4) 缺陷与改进Forward energy

在使用Seam Carving算法时,我们移除最低的能量像素并保留最高的能量像素。因此,平均图像能量增加,可能导致伪影和锯齿边缘。这里的解决方法为:考虑由于移除seam后,产生的新的邻接像素之间的差。我们在原递推公式加上约束项,让邻接像素的差尽可能小,这样我们就可以尽可能消除伪影和锯齿边缘。 C( i,j ) 表示像素 ( i,j ) 处的累积代价, M( i,j ) 表示像素 ( i,j ) 处的能量值,能量值表示像素的重要程度。公式左侧表示计算像素 ( i,j ) 处的累积代价时,需要考虑三个相邻的像素 ( i1,j1 ) ( i1,j ) ( i1,j+1 ) 。其中,min表示选择这三个相邻像素中累积代价最小的那个,即选择上一行三个相邻像素中累积代价最小的那个与当前像素 ( i,j ) 连接成seam。公式右侧表示对这三个相邻像素与当前像素 ( i,j ) 之间的能量差异进行惩罚,选择其中能量差异最小的那个。这是为了使seam更平滑,减少伪影。 λ 表示惩罚系数,用于平衡能量和能量差异在代价计算中的影响[4] λ 越大,表示对能量差异的惩罚越重,生成的seam越平滑。整个公式通过递归计算,从图像底部开始,逐行向上计算每个像素的累积代价,直到计算出图像顶部像素的累积代价。最终找到一条从图像顶部到底部的seam,其累积代价最小。通过动态规划计算累积代价,并找到最优seam,是Seam Carving算法的核心步骤。这种方法可以有效地保留图像中的重要内容,避免传统缩放方法可能引起的失真。

递推公式如下:

M( i,j )=P( i,j )+min{ M( i1,j1 )+ C L ( i,j ) M( i1,j )+ C U ( i,j ) M( i1,j+1 )+ C R ( i,j ) (5)

C L ( i,j )=| I( i1,j )I( i,j1 ) |+| I( i,j1 )I( i,j+1 ) | C U ( i,j )=| I( i,j1 )I( i,j+1 ) | C R ( i,j )=| I( i,j1 )I( i,j+1 ) |+| I( i,j+1 )I( i1,j ) | (6)

递推图如图1所示。

Figure 1. Plus constraint diagram

1. 加上约束项图

3. 实验结果

实验结果图2显示,在缩小图像宽度时,效果并不理想。这主要是由于目标宽度设置得过小,导致需要删除的Seam过多,从而影响整体效果。图3展示了Seam Carving算法处理后的实验图。经过Seam Carving算法处理,图像的宽度明显缩小,同时图像中的重要内容得到保留,如马、建筑物等。这表明Seam Carving算法能够在调整图像尺寸的同时,很好地保留了图像中的重要内容,避免了传统缩放方法可能引起的失真问题。Seam Carving算法基于动态规划计算能量最小的Seam路径,通过删除或插入Seam实现图像尺寸的调整。与传统的图像插值缩放方法相比,Seam Carving算法可以更好地保留图像的重要内容,实现更智能的图像缩放。综上所述,实验结果验证了基于动态规划的Seam Carving算法相比传统方法,在图像尺寸调整方面具有更好的效果,尤其是在保留图像重要内容方面。多尺度处理也进一步提升了算法的性能。

Figure 2. Experimental diagram

2. 实验图

Figure 3. Experimental diagram after Seam Carving algorithm processing

3. Seam Carving算法处理后的实验图

4. 结论

本文的主要目的是研究基于动态规划的Seam Carving裁剪算法,解决传统方法在图像尺寸调整过程中存在的问题。通过理论分析和实验验证,本文提出了一种新的算法,能够在不同尺度上对图像进行裁剪,并实现了更优的视觉效果。首先介绍了动态规划的基本概念和理论,包括状态转移方程、最优剪枝策略等。然后详细介绍了基于动态规划的Seam Carving算法,包括算法的实现步骤、性能评估等。通过实验结果的分析,提出的新算法在不同尺度和不同应用场景下均具有较好的性能表现,同时与其他剪枝算法的比较也证明了其优越性。本文的结论是,基于动态规划的Seam Carving裁剪算法相比传统方法具有更好的适应性和视觉效果。未来研究方向可以是进一步完善算法的性能和扩展其应用领域。

NOTES

*通讯作者。

参考文献

[1] 翟胜楠, 孟凡佳, 刘金华. 一种改进的Seam Carving图像重定向算法[J]. 湖北民族学院学报(自然科学版), 2018, 36(2): 194-198.
[2] 施美玲, 徐丹. 内容感知图像缩放技术综述[J]. 中国图象图形学报, 2012, 17(2): 157-168.
[3] 杨剑炉. 结合边缘检测的Seam Carving图像缩放算法[J]. 宜春学院学报, 2019, 41(3): 35-38.
[4] 陈加玲, 叶少珍. 基于Seam Carving的双向接缝裁剪图像重定向[J]. 福州大学学报(自然科学版), 2021, 49(2): 163-169.
[5] Garg, A. and Singh, A.K. (2023) Analysis of Seam Carving Technique: Limitations, Improvements and Possible Solutions. The Visual Computer, 39, 2683-2709.
https://doi.org/10.1007/s00371-022-02486-2