1. 引言
图像分割作为图像处理研究中的热点之一,对于计算机视觉和模式识别起着重要的作用。图像分割已广泛应用于医学图像处理 [1] 、自动驾驶 [2] 、目标检测和跟踪、地质勘探 [3] 和环境监测等多个领域。图像分割的目的是根据图像中的不同特征或属性,将其划分为具有相似纹理、颜色、亮度、对比度、形状和大小的均匀部分或类,从而为后续的图像处理和分析提供基础。图像分割作为图像处理领域的基础任务,其质量直接影响到后续的图像分析和应用。因此,图像分割一直是图像处理的研究热点之一。
K均值聚类算法 [4] 图像分割是一种常用的图像分割方法。它基于聚类的思想,将一幅图像中的像素分为不同的类别或者聚类簇,使得同一类别内的像素具有相似的特征,而不同类别之间的特征差异最大化。Kmeans聚类算法图像分割的优点在于简单、高效,且易于理解和实现。然而,该算法需要事先随机初始化聚类中心,可能会受到初始聚类中心选择的影响,导致结果不稳定且易于陷入局部最优解。因此,为了克服这些问题许多学者将Kmeans聚类算法跟智能优化算法相结合,提出了改进的图像分割算法。在文献 [5] 中用改进的正余弦算法来优化传统Kmeans聚类算法,以改善图像分割效果。在文献 [6] 中动态粒子群优化和Kmeans聚类算法相结合提出了DPSOK算法,该算法既保留了聚类算法收敛速度快的优点,又克服了其易陷入局部最优的缺点。在文献 [7] 中利用改进的蝠鲼觅食优化算法优化Kmeans聚类算法,优化后的图像分割方法提高了分割质量及泛化能力。
灰狼优化算法 [8] (Grey Wolf Optimizer, GWO)是一种元启发式优化算法,基于自然界中灰狼的领导等级和群体狩猎机制提出。GWO算法原理简单、参数少、编程方便、支持分布式并行计算、全局搜索能力强等优点,在工程问题、机器学习、医学和生物信息学等许多领域中得到广泛应用。然而,与其他智能算法类似,灰狼优化算法也存在收敛速度慢、收敛精度低、容易陷入局部最优的缺点。出于这个原因,许多研究人员改进了灰狼优化算法。在文献 [9] 中将生物进化和自然生物更新的“适者生存”原则引入到灰狼算法中,提出了一种具有演化和消除机制的改进灰狼优化器,进一步加速了灰狼优化算法的收敛速度,提高了优化精度。在文献 [10] 为提高灰狼的搜索能力,基于随机游走的思想,通过引入随机性来增加灰狼搜索空间的多样性,进而改善算法的性能。在文献 [11] 中为解决基于群体的元启发式优化算法中参数调整和停止标准缺乏系统性的问题,基于候选解决方案的适应度历史来自适应调整探索/开发参数,提出了自适应灰狼优化算法,来提高了算法的性能和效率。在文献 [12] 中灰狼优化算法中引入了迁移操作,并根据灰狼的适应度函数值动态修改迁移概率,并将其应用于露天矿的低碳运输调度。
受以上文献的启发,基于GWO的特点和优势,本文提出了一种基于改进灰狼优化算法的Kmeans图像分割方法,旨在提高K-means算法在图像分割中的性能。
2. 多融合策略改进的灰狼算法
2.1. 灰狼优化算法
Mirjalili [8] 等学者分析灰狼的社会行为,对灰狼的社会行为和狩猎过程进行数学建模,设计了灰狼优化算法。灰狼算法的数学模型由以下几部分组成:
灰狼的包围猎物的数学模型如下 [8] :
(1)
其中t为当前迭代次数;
与
分别为猎物与灰狼当前位置,
为下一个位置;A为系数矩阵;D为系数向量。它们是控制勘探与开发衔接与转换的重要参数。D由食饵的位置决定,可以根据下面的公式计算:
(2)
(3)
式中:
为区间
随机生成的向量。
(4)
(5)
式中:
为最大迭代次数;t为当前迭代次数;a随着迭代次数的增加从2线性递减到0;
是从区间
随机生成的向量,使得矩阵A中的数值被限制在一个区间
内。其他狼只需要更新自己的位置,计算公式如下 [8] :
(6)
其中
和
的计算公式如下:
(7)
(8)
2.2. Tent混沌映射优化初始种群策略
在GWO中,初始种群的选择对算法的性能和收敛速度有一定的影响。标准的GWO种群初始化方法通常使用随机生成的数值,但这种方法可能会导致初始种群的分布较为均匀,以及种群中个体之间的相似度较高,从而降低了搜索的多样性和探索能力。然而,混沌映射是一种具有混沌行为的非线性动力系统,具有高度敏感性和随机性,可以生成一系列具有较高随机性和多样性的数值。利用混沌映射初始化GWO的初始种群能提高GWO的全局搜索能力。因此,本文采用Tent混沌映射来生成初始种群,目的是提高灰狼的多样性。Tent混沌映射 [13] 的数学定义如下:
(9)
式中,
。本文取
。
对采用的Tent混沌映射初始化的GWO_1算法与随机初始化的GWO算法进行实验对比以验证改部分改进的有效性,如表1所示:
从表1中可知,在相同的测试环境下除了f5和f6的值略差于GWO,其他测试函数上GWO_1的求解精度高于GWO的求解精度。
2.3. 收敛因子非线性调整策略
GWO算法通过参数a和A的自适应值来探索和利用。较大的a值有助于进行全局搜索,而较小的a值则有助于进行局部搜索。适当选择a参数可以在全局和局部探索能力之间提供平衡。然而,根据等式(5),收敛因子a随着迭代次数从2到0线性下降,但灰狼个体在搜索猎物的过程中并不是线性变化的,是非线性的、高度复杂的过程。因此,收敛因子a的线性下降并不能完全反映实际的优化搜索过程。因此,为了平衡GWO算法的探索能力和开发能力,许多学者提出了控制参数a随迭代次数非线性变化 [14] [15] 。本文中应用的非线性控制参数 [15] ,如下式所示:
(10)
式中:t为当前迭代次数,
为最大迭代次数。
从图1中可以看出,改进后的
更能反映实际的优化搜索过程。
对采用改进非线性收敛因子的GWO_2算法与标准的GWO算法进行实验对比以验证改部分改进的有效性,如表2所示:
Figure 1. The convergence curve of parameter a
图1. 参数a的收敛曲线
从表2 中可知,在相同的测试环境下除了f5的值逊于GWO,GWO_2的求解精度明显高于GWO的求解精度。说明采用非线性收敛因子,与线性收敛因子相比会有很好的效果,这也说明了非线性收敛因子的有效性。
2.4. 透镜成像反向学习策略
透镜反向学习是一种新颖的策略,它将反向学习机制与透镜成像原理相结合,其基本思想是同时计算和比较候选解和对应的反向解,通过与相反解的比较,选择最佳候选解开始迭代计算。在文献 [16] 中在GWO中引入透镜反向学习策略能够扩大了算法群体搜索的有效范围,从而降低了算法陷入局部最优的概率,助算法跳出局部最优。具体过程如下 [16] :
(11)
式中:
和
分别为
和
的第j维分量,
和
分别为决策变量的上下界的第j维分量。
对采用透镜反向学习策略的GWO_3算法与标准的GWO算法进行实验对比以验证改部分改进的有效性,如表3所示:
从表3中可知,在相同的测试环境下,f2和f5上没有得到理论最优解外,但是求解精度高于GWO,在其他函数上GWO_3达到理论最优解。说明与传统GWO算法相比,GWO_3算法能够更好地克服局部最优解问题,提高搜索精度和收敛速度。
2.5. 位置更新策略
由式(6)的位置更新方程可以判断,WOA考虑了个体位置和最优种群位置,以及个体与种群之间的信息交换,但忽略了个体经验对信息交换的影响。因此,在位置更新调整策略中 [17] 引入PSO中的个体速度和位置更新,以便个体保存其最优位置信息。灰狼追踪猎物位置的数学模型可以修改为 [17] :
(12)
(13)
式中:
分别为社会学习因子和认知学习因子(本文中取
)。它们分别代表个体最优值和群体最优值的影响;
表示灰狼个体本身经历过最优的位置;
为惯性权重系数。
对采用新的位置更新GWO_4算法与标准的GWO算法进行实验对比以验证改部分改进的有效性,如表4所示:
Table 4. Position update strategy comparative Experiment
表4. 位置更新策略的对比实验
从表4中可知,在相同的测试环境下,GWO_4算法能精确求出f5,f6的理论最优解,在其他测试函数上的求解精度均高于GWO。说明与标准的GWO相比GWO_4的求解精度明显提升。
2.6. 改进灰狼优化算法的测试
综合上述改进思想,改进灰狼优化算法(IGWO)算法的实现步骤如下:
Step1输入灰狼种群N;最大迭代次数
;空间维度D;搜索范围
;
Step2利用Tent混沌映射(9)初始化灰狼种群;
Step3根据寻优函数计算每个灰狼个体的适应度
,并按照适应度值进行排序,选择前三个最好的狼,记录其位置
和
;
Step4利用式(11)对
进行透镜成像反向学习策略,产生反向解
并计算
的适应度
;
Step5判断
若满足,将反向解
替换为
加入种群参与迭代;
Step6根据式(10)计算衰减因子;
Step7根据式(3) (4)计算参数A,C;
Step8根据式(12)更新每个灰狼的位置;
Step9判断是否满足终止条件,若满足,则运算结束,输出最优解;否则,令
,返回Step5挑至步骤5直到计算达到最大迭代次数。
为了验证IGWO算法的性能,本文选取了6个基准测试函数来验证所提出算法的寻优性能。测试函数如表5所示,其中f1~f3是单峰值函数,f4~f6是多峰值函数。提出的IGWO算法与其他四种算法进行比较,即原始的GWO算法 [8] ,鲸鱼优化算法 [18] (Whale optimization algorithm, WOA),麻雀优化算法 [19] (Sparrow Search Algorithm, SSA)和粒子群优化算法 [20] (Particle Swarm Optimization, PSO)。为了进行公平比较,5种算法在相同的种群规模和迭代次数下进行实验,即种群规模为30,迭代次数为500。
所有测试均独立运行30次。实验中结果包括最佳值(Best)、最差值(Worst)、平均值(Mean)和标准差(Std)。实验结果如表6,表7所示。
Table 6. Comparison of test results on Single-peak function
表6. 单峰函数上的测试结果对比
Table 7. Comparative analysis of test results on multimodal functions
表7. 多峰函数上的测试结果对比
根据表6可以得出IGWO算法在单峰值函数上的优化性能较其他算法更强,IGWO算法能够找到理论最优解。从表7中可以看出IGWO算法在多峰值测试函数上表现出较好地寻优性,除了f6,其他函数上均能找到理论最优值。一般来说,平均适应度越接近理论最小值,算法的收敛精度越高;而标准差越小,算法的稳定性和鲁棒性越好。IGWO算法在平均适应度和标准差方面的结果优于其他优化算法。这些结果表明,综合使用四种改进策略的IGWO对算法寻优性能提升最为显著。
图2展示了不同算法在6个代表性基准函数上的收敛曲线。从图2中可以明显看出IGWO的收敛速度是所有算法中最快的。特别是对于多峰值函数,IGWO算法表现出了更快的收敛速度,在不到50次迭代的情况下收敛了。
3. 改进灰狼优化算法的图像分割
3.1. IGWO-Kmeans图像分割
Kmeans聚类算法是一种常用的基于距离的无监督学习方法,广泛应用于图像分割领域 [21] 。该算法的原理是将图像中的像素根据它们的特征(如颜色或灰度)聚类成k个类别,从而实现图像分割。
初始聚类中心的选取对于Kmeans算法的聚类效果具有重要影响,而随机选择聚类中心的方式可能会导致聚类结果不理想,甚至无法收敛。同时,Kmeans算法在图像分割应用中聚类中心的选取直接影响图像分割的效果。而GWO具有良好的寻优能力,帮助确定良好的初始聚类中心,从而提升图像分割的效果。因此,本文结合改进的GWO算法和Kmeans算法,通过IGWO来最小化聚类中心和数据点之间距离的目标函数(14),可以获得“最佳”聚类中心,改善Kmeans算法的稳定性和性能,从而提高图像分割的质量。即(14)作为IGWO的目标函数:
(14)
式中:
为图像的第i个的灰度值,
为第j个聚类中心。
Figure 2. Function curve convergence diagram
图2. 函数曲线收敛图
IGWO-Kmeans聚类算法的步骤如下:
Step1定义初始化参数,确定分类数k和IGWO的基本参数;
Step2通过IGWO的全局搜索能力对初始聚类中心进行优化,找到最佳的初始聚类中心;
Step3将IGWO找到的聚类中心作为Kmeans聚类算法的初始聚类中心;
Step4计算聚类平方误差和;
Step5更新聚类中心;
Step6对图像像素值进行聚类;
Step7判断是否达到终止条件,如果没有则重复Step4,Step5;
Step8输出聚类中心以及分割图。
3.2. 评价指标
单纯从主观视觉有时无法判断图像分割的细节差异,为了评估所提出的方法在图像分割中的性能,避免结果的随机性,利用 PSNR、SSIM和FSIM三个指标来分析分割后的图像。
PSNR:衡量分割图像的质量,具体算式如下 [22] :
(15)
(16)
式中:RMSE为均方误差;
分别为原始图与分割图;
为图像大小。
SSIM:原始图像和分割图像之间的相似性度量,它考虑了亮度、对比度和结构相似性等多种因素,具体算式如下 [23] :
(17)
式中:
与
分别为I与Seg的平均值;
与
分别为I与Seg的方差;
为I与Seg的协方差;c1与c2为维持稳定的常数,在实验里取
。SSIM的最高值意味着更好的性能。
FSIM:评价原始图像和分割图像之间的特征相似性来衡量图像质量,具体算式如下 [23] :
(18)
其中
(19)
(20)
(21)
(22)
(23)
式中:Ω表示图像的整个区域;
表示相似得分,
表示图像的相位一致性;
表示;G表示图像的梯度幅值;
是尺度n上的局部振幅;
是尺度n上位置x的响应矢量幅度;
为常数,实验中选择
,
。FSIM值越高,预测性能越好。
3.3. 主观测评
选择了4幅MIR图像进行图像分割实验,以评估IGWO对Kmeans算法的优化效果。同时选择原始的GWO和WOA对Kmeans算法进行优化(即GWO-Kmeans,WOA-Kmeans),并进行图像分割。此外,将以上优化算法得到的图像分割结果与传统的Kmeans算法进行比较,以评估不同方法对图像分割的性能提升程度。
聚类数目设置为2,最大迭代次数设置为100,进行图像分割。分割结果如图3所示:
Figure 3. Comparison of Segmentation Results from Different Algorithms
图3. 各算法分割结果对比
从图中可以看出,传统的Kmeans算法在图像分割任务中表现最差,GWO-Kmeans和SSA-Kmeans的分割效果相对接近。与之相比,IGWO-Kmeans算法取得了更好的分割效果。这表明采用不同的优化算法能够显著改善Kmeans算法在图像分割中的性能。
3.4. 客观评测
表8给出了各算法的PSNR,SSIM和FSIM值。从表8中可知:
Table 8. Comparison of objective evaluation indicators for various algorithms
表8. 各算法客观评价指标对比
针对Image1,IGWO-Kmeans算法显示出了最佳的性能,其PSNR值为54.8024,远超其他算法;同时,IGWO-Kmeans算法在SSIM和FSIM评价指标上也取得了最高分,分别为0.9710和0.9661。相比之下,传统的Kmeans算法在所有指标上表现最差;对于Image2,IGWO-Kmeans算法在PSNR指标上与GWO-Kmeans算法表现相近,但在SSIM和FSIM上明显优于其他算法;在Image3上,IGWO-Kmeans在PSNR和SSIM上优于其他算法,而在FSIM上与GWO-Kmeans并列第一;针对Image4,IGWO-Kmeans算法在所有指标上均表现出色,特别是在FSIM指标上取得了最高分。
综上所述,IGWO-Kmeans算法在所有图像和所有评价指标下均表现出色,特别是在SSIM和FSIM指标下取得显著优势。传统的Kmeans算法的性能明显落后于优化算法。
4. 结论
针对传统灰狼优化算法的不足,为了进一步提升灰狼优化算法的寻优能力,本文提出了一种多融合策略改进的灰狼优化算法(IGWO)。首先,采用Tent混沌映射初始化种群,从而增加种群多样性;将线性收敛因子改为非线性收敛因子,从而平衡GWO算法的探索能力和开发能力。其次,利用透镜成像学习策略有效抑制GWO的过早收敛,帮助种群跳出局部最优。最后,引入PSO的思想改进GWO的位置更新方程,增强灰狼个体优势,避免陷入局部最优解。通过不同基准测试函数验证了改进算法IGWO的有效性。其次,利用IGWO来获取初始最佳聚类中心,并将其应用于Kmeans图像分割任务。对比传统的图像分割方法和其他优化算法的图像分割任务,该方法在多个评价指标下表现出色,获得最佳的图像分割效果。
基金项目
国家自然科学基金应急项目(61751316)和自治区自然科学特培项目(2022D03029)。
参考文献
NOTES
*通讯作者。