1. 引言
鲍鱼富含蛋白质、脂肪和矿物质,是东亚地区最受欢迎的水产养殖产品之一 [1]。据报道,中国和其他东亚国家(日本和韩国)的鲍鱼产量为155,935吨,占世界鲍鱼产量的95% [2]。目前,鲍鱼产品作为一种具有商业价值和营养价值的健康食品,其品质的监测与控制已经引起了人们的广泛关注。水分作为鲍鱼肌肉的重要组成,其含量占到鲍鱼肌肉的80%以上 [3]。热加工过程的含水量是鲍鱼制品的重要质量参数,对色泽、质地和口感有很重要的影响 [4]。
目前,鲍鱼含水量的测量方法主要有红外水分分析法、冷冻干燥法、微波干燥法和烘箱干燥法等 [5] [6] [7],这些方法耗时、繁琐且具有破坏性,不适合短时大批加工过程无损检测。高光谱成像技术将光谱和数字成像集成在一个系统中,可提供丰富的光谱和空间信息 [8],在食品质量的快速无损检测方面受到了广泛关注。Yang等 [9] 使用高光谱成像技术结合图像纹理信息实现了熟牛肉水分含量及储存时间的预测,并采用最佳融合的反向传播人工神经网络(BP-ANN)对熟牛肉的含水量分布进行了可视化。Liu等 [10] 使用高光谱成像技术(1000~2500 nm)对腌制猪肉的含水量进行了预测,确定了反射率光谱(RS)数据结合多元线性回归(MLR)建立的RS-MLR模型为最佳预测模型,并对猪肉片中的水分进行了可视化。He等 [11] 使用高光谱成像技术(400~1700 nm)对三文鱼干燥过程中水分损失进行检测分析,建立了偏最小二乘回归(PLSR)预测模型,并对干燥过程中的水分进行了可视化。为本研究方法的开发提供了思路和理论基础。
本研究的主要目的是采用高光谱成像技术对不同热处理加工下的鲍鱼含水量进行检测,并实现含水量和分布的可视化。主要内容包括:获取不同热加工处理(水煮、微波和烤制)下鲍鱼样品的高光谱图像;使用光谱预处理算法对获取的全波段光谱数据进行预处理;采用两种数据降维方法对预处理后的光谱数据进行降维;建立鲍鱼含水量预测模型,实现不同热加工下鲍鱼含水量的可视化。
2. 材料与方法
2.1. 鲍鱼样品制备
实验用鲍鱼购买于中国大连长兴水产市场,平均重量为72 ± 3 g。将购买的鲜活鲍鱼放入便携式带冰保温箱并迅速运回实验室。新鲜鲍鱼去壳去内脏后用去离子水清洗,然后在60℃水浴锅中加热20分钟。采用圆柱形采样器将鲍鱼制成直径25 ± 2 mm,厚度10 ± 0.2 mm的待测样品。共获得396个圆柱形样品,将样品分成三组,分别采用100℃水煮、80℃微波和170℃烤制三种热加工方法对样品进行20分钟加热处理。每5分钟进行一次重量测定和高光谱数据采集。
2.2. 含水量测量
按照国家标准GB/T 9695.15-2008 [12] 测定不同热加工处理下鲍鱼样品的含水量。将热加工最终样品置于鼓风干燥箱中,设置温度为105℃进行干燥6 h后,待其冷却到室温,利用电子天平称重。复烘至恒重即干燥前后质量不超过2 mg时视为完全干燥,并记录其重量,并按公式(1)计算含水量。
(1)
式中,M为含水量;Gi为鲍鱼样品初始重量;Gf为鲍鱼样品干燥完全后的质量。
2.3. 高光谱成像系统
采用GaiaSorter-Dual全波段高光谱分选系统(四川双利合谱科技有限公司)对三种热加工处理下的鲍鱼样品进行数据采集。系统的主要组成如图1所示,系统主要包括:光谱范围在380~1024 nm的成像光谱仪(V10E,芬兰奥卢光谱成像有限公司,芬兰)、分辨率为1344 × 1024 pixel2的CCD相机(Lt365R,加拿大卢梅内拉公司,加拿大)、镜头(OLES23,光谱成像有限公司,芬兰)、卤素灯光源(150 w,卓立汉光仪器有限公司,中国)、步进电机驱动的移动载物台(PSA200-11-X,卓力汉光仪器有限公司,中国)和计算机。为了获得清晰、无失真的光谱图像,设置物距为270 mm,载物台前进速度为9.5 mm/s,后退速度为20 mm/s,设置曝光时间为15 ms。
![](//html.hanspub.org/file/20-2960217x11_hanspub.png?20220421100136722)
Figure 1. Main components of hyperspectral sorting system
图1. 高光谱分类系统的主要组成
2.4. 光谱数据校正
高光谱在采集过程中会受到光照强度和暗电流的影响,导致获取的光谱数据中混合了大量的噪声,进而影响图像质量。需要对采集到的光谱图像进行黑白校正 [13]。其中,黑色的高光谱标定图像(反射率约为0%)采集是将相机的镜头用镜头盖盖住进行采集;白色的高光谱标定图像(反射率约为100%)采集是将均匀的白色校正板移动到与镜头相垂直的位置进行采集。光谱的校正公式如式(2)所示。
(2)
式中,Iw为白色参考图像;IR为原始光谱图像;D为黑色参考图像;Rc为校正后的图像。
2.5. ROI提取与光谱数据预处理
光谱图像校正后,使用ENVI (ENVI 5.0 Research Systems Inc., Boulder, CO, 美国)软件选取样品中心半径为10 mm的圆形区域作为图像的感兴趣区域(Regionofinterest, ROI),并提取ROI内的平均光谱值。由于样本位置差异、光源散射、基线偏移、系统硬件等因素影响,高光谱数据中含有系统噪声和散射信号 [14]。为减少外界因素的干扰并提高预测模型的精度,采用卷积平滑(Savitzky-Golay smoothing, SG)和多元散射校正(Multiplicative Scatter Correction, MSC)两种方法来去除光谱数据中的噪声和散射信号的影响。SG是一种广泛使用的平滑算法,能够有效消除光谱图像中的噪声。该平滑算法是在平滑点前后取若干个点进行平均或拟合处理,计算出平滑最佳估计值来消除高频噪声信号,并通过数据与多项式进行最小二乘拟合,保留光谱数据中有用的低频信息 [15]。计算公式如式(3)、(4)、(5)所示。
(3)
(4)
(5)
式中,H为归一化因子;hi为最小二乘拟合得到的平滑系数;w为窗口大小决定因子。本研究将多项式阶数设为3,窗口大小设为7。MSC可以有效消除由于样品表面颗粒分布不均造成不同程度散射水平的光谱差异。在MSC处理过程中,建立了样品的“理想光谱”与原始光谱之间近似的线性关系,然后对原始光谱进行校正 [16]。本文选取鲍鱼样品的平均光谱数据作为理想光谱。MSC的校正过程如式(6)、(7)、(8)所示。
(6)
(7)
(8)
式中,
为平均光谱矩阵;n为样本数量;si为第i个样品的光谱矩阵;ai和bi分别为第i个样品光谱矩阵si与平均光谱矩阵
之间线性相关得到的相对回归系数和相对回归常数。
2.6. 特征波长选择
高光谱系统获取的光谱图像包含大量冗余信息。为了简化计算,加快数据分析速度,需要对原始光谱数据进行降维处理。本研究采用连续投影算法(Successive Projections Algorithm, SPA)和回归系数法(Regression Coefficient, RC)分别对全波段光谱数据进行降维。SPA是一种前向特征变量选择方法,利用向量的投影选择冗余信息最少、共性最小的变量进行组合。在SPA处理过程中,它将某一波长投影到其它波长上,然后将计算出的投影向量进行比较,选择出最大投影向量的波长 [17]。RC法从全波段数据建立的PLSR模型中提取RC值(β-系数),选取绝对值最高峰或最低谷作为最佳波长。
2.7. PLSR预测模型
偏最小二乘回归(Partial Least Squares Regression, PLSR)是一种常用的多变量数据分析方法,是多变量数据建模最稳健可靠的分析工具之一,已广泛应用于肉类制品质量的定量分析 [18]。PLSR能从高维数据中找到影响因变量的主控因子,使建立的模型更具有鲁棒性。与传统的多元回归方法相比,PLSR结合了主成分分析和多元线性回归的方法,在解决多变量之间存在多重相关性或样本个数小于变量的回归问题上具有更大的优势 [19]。本研究基于SG和MSC两种预处理方法,结合SPA和RC两种数据降维方法建立鲍鱼含水量PLSR预测模型。利用前述396个样本数据进行建模,其中280个样本(水煮样品80个、微波样品100个、烤制样品100个)用于模型的训练,116个样本(水煮样品36个、微波样品40个、烤制样品40个)用于模型的预测。模型的输入为预处理后的平均光谱数据和经降维后的平均光谱数据,建立的鲍鱼含水量PLSR预测模型分别定义为RW-SG-PLSR、RW-MSC-PLSR、RW-SG-SPA-PLSR、RW-SG-RC-PLSR、RW-MSC-SPA-PLSR和RW-MSC-RC-PLSR。通过校准系数(
)、交叉验证系数(
)、预测系数(
)、校准均方根误差(RMSEC)、交叉验证均方根误差(RMSECV)、和预测均方根误差(RMSEP)、相对百分比偏差(RPD)等参数评估PLSR的预测能力。当
、
、
值较高,而RMSEC、RMSECV、RMSEP低时,PLSR具有较高的预测性能。当RPD值小于1.5时,说明模型的预测性能较差,模型无法应用;当RPD值在1.5~2之间时,说明模型的预测性能一般;当RPD值大于2时,说明模型的预测性能优秀 [20]。本研究PLSR模型的建立及分析均通过Unscrambler (V9.7. Camo Process AS,挪威)软件进行实现。
2.8. 含水量可视化
不同的热加工过程中,鲍鱼样品中的含水量会发生不同程度的迁移和变化,这会使样品图像中出现不同的像素的差异。本研究利用优选的PLSR预测模型,将鲍鱼样品高光谱图像中的每个像素点的含水量进行计算,实现水分可视化。在生成可视化图像中,每种颜色代表样品中预测的含水量值。本文中水分可视化的实现基于Matlab 2017a (The Mathworks Inc.,Natick,MA,美国)来完成。
3. 结果与讨论
3.1. 光谱特征
图2所示为三种热加工处理的鲍鱼样品ROI区域内的平均光谱反射率曲线(387.1~1024.7 nm)。在不同的热加工时间(5分钟、10分钟、15分钟和20分钟)下,三种热加工处理样品的平均光谱反射率曲线具有相同的趋势。图中可以观察到三个显著的吸收峰,分别集中在480、670和960 nm处。在可见光区域(400~700 nm)内,480 nm处的峰值对应于肌肉色素对光的吸收,这与样品的颜色有关 [21];可见光区域的另一个吸收峰在670 nm处,位于血红蛋白的吸收带附近,可能与鲍鱼肌肉中富含蛋白质有关 [22]。在近红外光谱区域,960 nm处的吸收峰与水分具有较强的关联关系 [10]。鲍鱼样品的光谱反射曲线特点与含水量以及水分迁移有密切的联系,光谱反射率越高表明其含水量越低,从图2中可以看出,水煮处理的鲍鱼样品光谱反射率均低于微波和烤制处理,而微波和烤制两种干加热比水煮处理这种湿加热处理方式有更多的水分损失。图中960 nm处的主要为水分的吸收峰,微波处理的鲍鱼样品光谱反射率变化均匀,而在烤制初期(5分钟~10分钟)样品光谱反射率变化差异较大,烤制后期(15~20分钟)样品光谱反射率变化差异较小,说明此时含水量变化不大,这主要由不同热处理下水分迁移变化方式不同导致的。
![](//html.hanspub.org/file/20-2960217x27_hanspub.png?20220421100136722)
Figure 2. Average spectral reflectance curves: Bl represents boiling, Mw represents microwaving, Bk represents baking, 5~20 represents heating times
图2. 平均光谱反射率曲线:Bl水煮,Mw微波,Bk烤制,5~20加热时间
3.2. 含水量的全波段预测
通过鲍鱼样品的全波段平均光谱数据及相应的实测含水量,建立基于原始光谱数据的鲍鱼含水量PLSR预测模型(RW-PLSR)、基于SG预处理的鲍鱼含水量PLSR预测模型(RW-SG-PLSR)和基于MSC预处理的鲍鱼含水量PLSR预测模型(RW-MSC-PLSR)。模型表现如表1所示。基于全波段的预测模型在校准和交叉验证阶段具有较高性能,三个模型的
与
的绝对差值分别为0.0019、0.0064和0.0003;而RMSEC与RMSEP的绝对差值分别为0.15%、0.05%和0.03%,此外,模型的RPD分别为3.48、3.53和3.13。以上结果表明,采用全波段光谱数据建立的鲍鱼含水量PLSR预测模型具有较高的预测精度。将原始全波段光谱数据建立的预测模型分别与SG和MSC预处理后的全波段光谱数据建立的预测模型进行比较,经SG预处理后建立的预测模型
和RPD值均有所提高,可能与SG算法能够消除高光谱数据中的噪声、提高了信噪比有关;MSC预处理后的预测模型的
和RPD值均有所下降,可能与MSC消除高光谱数据散射干扰的同时减小了光谱数据之间的差异有关。全波段数据的预测模型结果证明了利用高光谱技术预测不同热加工方式下鲍鱼含水量的可行性。
![](Images/Table_Tmp.jpg)
Table 1. Evaluation index of PLSR prediction model for abalone moisture content based on full-band data
表1. 基于全波段数据的鲍鱼含水量PLSR预测模型评价指标
3.3. 使用特征波长对含水量预测
虽然基于全波段光谱数据的预测模型性能良好,但全光谱数据包含大量的冗余或无效的信息,严重影响计算效率和检测时间。本研究分别采用SPA和RC对预处理后的全波段光谱数据进行降维,提取特征波长进行建模。
针对SG和MSC预处理后的光谱数据,利用SPA降维后的结果如图3所示。图3(a)和图3(c)为使用SPA对SG预处理后的光谱数据提取的16个特征波长,图3(b)和图3(d)为使用SPA对MSC预处理后的光谱数据提取的14个特征波长。结果表明使用SPA降维后的波段分布在392.2~1019.1 nm,其中范围在902.6~956.0 nm附近的波长可能与水分的吸收有关;710.0~750.0 nm和430.0~574.0 nm范围内的波长主要与蛋白质和水分变化导致的颜色变化有关 [23]。说明上述波长对应的光谱信息均与热加工引起的物质含量变化有着复杂的关联关系。
![](//html.hanspub.org/file/20-2960217x35_hanspub.png?20220421100136722)
Figure 3. The number of characteristic wavelengths extracted using SPA. (a) SG-SPA, (b) MSC-SPA and specific wavelength values extracted, (c) SG-SPA, (d) MSC-SPA
图3. 使用SPA提取的特征波长数量。(a) SG-SPA,(b) MSC-SPA和提取特征波长,(c) SG-SPA,(d) MSC-SPA
RC降维结果如图4所示,面向不同的预处理方法,经RC降维后的波长数均为10,与SPA相比获得了更少的特征数据。RC法选择的特征波长主要分布在426.0~956.0 nm范围内,主要对应于色素、血红蛋白和水分,能够代表鲍鱼热加工处理过程化学成分和含水量的变化信息。
利用上述特征波长建立鲍鱼含水量PLSR预测模型分别为RW-SG-SPA-PLSR、RW-SG-RC、RW-MSC-SPA-PLSR和RW-MSC-RC-PLSR,各模型表现如表2所示。使用特征波长建立的预测模型的
大于0.90,RPD值均大于2,表明利用特征波长建立的预测模型具有较好的预测性能,且与使用全波段数据的预测模型的性能相似。其中RW-SG-SPA-PLSR的
(0.9356)、
(0.9269)、
(0.9376)和RPD (3.85)均为最高;RMSEC (4.50%)、RMSECV (4.81%)和RMSEP (4.63%)差值最小,因此确定RW-SG-SPA-PLSR为最优模型。图5显示为鲍鱼样品含水量预测值与实测值之间的定量关系,从图中可以看出,预测的含水量与实测含水量的相关性较高,数据点较聚集、偏差较小。此外,当波长数从354个减少到16个时,模型的精度也得到了提高,说明SPA降维在鲍鱼含水量预测中可有效提高模型精度和效率。
![](//html.hanspub.org/file/20-2960217x40_hanspub.png?20220421100136722)
Figure 4. Selection of characteristic wavelengths using RC. (a) SG-RC, (b) MSC-RC
图4. 使用RC对特征波长的选择。(a) SG-RC,(b) MSC-RC
![](Images/Table_Tmp.jpg)
Table 2. Evaluation index of PLSR prediction model for abalone moisture content based on characteristic wavelengths
表2. 基于特征波长的鲍鱼含水量PLSR预测模型评价指标
![](//html.hanspub.org/file/20-2960217x44_hanspub.png?20220421100136722)
Figure 5. Measured moisture content vs predicted moisture content
图5. 测量的含水量与预测的含水量
3.4. 水分可视化分布
利用最优预测模型(RW-SG-SPA-PLSR)计算图像的每个像素点对应的含水量,可实现不同热加工下鲍鱼样品含水量分布和变化的可视化。图6为三种热加工条件下鲍鱼样品含水量可视化图像。含水量由高到低的下降表现为颜色从蓝色到红色的转换,图中深蓝色表示含水率为100%、深红色表示含水量为0%。从图6可以看出,三种热处理下鲍鱼样品ROI的水分迁移变化差异较大。随着热处理时间的增加,水煮处理下鲍鱼样品的含水量变化不明显,而微波和烤制处理下的鲍鱼样品的含水量变化较明显,可能与鲍鱼样品加热介质的不同有关,干加热处理方式比湿加热处理方式造成更多的水分损失。此外,当加热时间达到20分钟后,微波处理的鲍鱼样品的水分分布均匀,可能与上述微波加热原理有关;烤制处理的鲍鱼样品中水分流失速度较快,可能是烤制温度较高,样品中肌肉纤维在烤制过程中遭到明显破坏并收缩,导致其持水力下降水分流失较为严重。
![](//html.hanspub.org/file/20-2960217x45_hanspub.png?20220421100136722)
Figure 6. Visualization distribution maps of moisture
图6. 水分可视化分布图
4. 结论
本研究利用高光谱成像技术对热加工过程中的鲍鱼含水量进行无损检测。通过对比不同光谱预处理后的模型效果,优选出经过SG预处理后的光谱数据进行后续数据处理。对预处理后的光谱采用SPA算法优选出16个特征波长,利用特征波长建立的偏最小二乘回归模型(RW-SG-SPA-PLSR)的
、RMSEP值和RPD值分别为0.9376、4.63%和3.85,优于全波段建立的模型。利用最优模型RW-SG-SPA-PLAR对三种热加工下鲍鱼含水量进行可视化,为鲍鱼在不同热加工处理过程中的水分变化与迁移提供了更详细、更直观的信息。因此,高光谱成像技术作为一种高效、快速、无损的检测技术对鲍鱼在不同热加工过程中的含水量测定是可行的。
基金项目
本项目受大连市科技创新基金项目(2021JJ13SN85);辽宁省自然科学基金(2020-MS-273)和辽宁省教育厅项目(LJKZ0511、LJKZ0542)联合资助。
NOTES
*通讯作者。