基于近红外光谱的掺伪乳制品鉴别模型优化

doi:10.12677/OJNS.2019.73015

期刊菜单

基于近红外光谱的掺伪乳制品鉴别模型优化
Optimization of Identification Model of Adulterated Dairy Products Based on Near Infrared Spectroscopy

DOI: 10.12677/OJNS.2019.73015, PDF, HTML, XML, 国家自然科学基金支持
作者: 卞中悦, 贾若玉, 郭倩倩, 陈蕊, 李天骄：德州学院食品质量与安全，山东聊城
关键词: 掺伪乳制品；近红外光谱；快速鉴别；模型优化；Adulterated Dairy Products； Near Infrared Spectroscopy； Rapid Identification； Model Optimization

摘要: 为实现掺伪乳制品的快速鉴别，基于近红外光谱技术，采用偏最小二乘法(PLS法)建立掺伪乳制品的鉴别模型，并利用剔除异常点等方法对模型进行优化。结果表明：掺水乳制品在透射方式下，因子数为5，采用原始光谱、S-G平滑、附加散射矫正方式时定量模型最为理想，其预测集相关系数为0.9975，决定系数为0.9943；掺淀粉乳制品在透射方式下，因子数为4，采用一阶导数谱、Norris平滑、不矫正时定量模型最为理想，其预测集相关系数为0.9913，决定系数为0.9827。

Abstract: Near infrared spectroscopy (NIR) combined with partial least squares (PLS) was used to identify rapidly adulterated dairy products. Eliminating abnormal points and other methods were em-ployed to optimize the model. The results showed that for the identification of dairy products adulterated with water, the ideal model established by PLS was under transmission mode, using Spectrum, S-G smoothing method and additional scattering correction light path method, and the factor was 5, in which the correlation coefficient of prediction set (RP) was 0.9975 and the coeffi-cient of determination (R²) was 0.9943. For the identification of dairy products adulterated with starch, the best model was under transmission condition, first-order derivative spectrum, Norris smoothing method and no correction of optical path, and the factor was 4, in which the RP was 0.9913 and the R² was 0.9827.

文章引用：卞中悦, 贾若玉, 郭倩倩, 陈蕊, 李天骄. 基于近红外光谱的掺伪乳制品鉴别模型优化[J]. 自然科学, 2019, 7(3): 96-105. https://doi.org/10.12677/OJNS.2019.73015

1. 引言

近年来，乳制品的销售量逐渐增加，但由于经济利益的驱使，乳制品掺伪事件频发。例如：“三聚氰胺毒奶粉事件”、“阜阳奶粉事件”，这些事件严重影响了消费者的身体健康和生命安全。因此，快速准确地对乳制品品质进行检测具有十分重要的意义。NY/T 802-2004《乳与乳制品中淀粉的测定酶–比色法》等国标文件中规定了有关乳制品掺伪检测的传统方法。传统的检测方法操作方法虽然简单，但是过程较繁琐 [1] [2]、耗时长、使用的化学试剂易导致环境污染 [3]，不利于大规模检测 [4]。为了实现对掺伪乳制品的高通量快速检测，本文基于近红外光谱技术对乳制品的品质进行全面分析，解决了传统方法的不足。近红外光谱技术是光谱测量技术和化学计量学学科的有机结合，被誉为“分析巨人” [5]，在20世纪90年代后期逐渐应用到石油 [6] [7]、农业 [8]、制药 [9] 和食品 [10] [11] 等领域。该技术具有分析速度快、分析效率高、使用范围广、低消耗、可实现多组分指标同时检测及远程在线分析等突出优点，适用于对各种乳制品的质量检测，例如：李凯歌等 [12] 考察了近红外结合马氏距离判别分析和仿生模式识别在还原奶检测中的适用性。程文宇等 [13] 利用近红外结合支持向量机法对液态奶中是否含有三聚氰胺进行了定性研究。韩东海等 [14] 利用近红外对还原奶掺假进行了鉴别分析，同时快速测定了原料奶的新鲜度。

2. 材料和方法

2.1. 仪器和材料

Antaris II型傅里叶近红外光谱分析仪、RESULT-Integration 光谱采集软件、TQ Analyst建模软件(美国Thermo Fisher Scientific公司)，纯牛奶(购自德州市大型超市，主要成分如下：蛋白质3.0 g/100 mL、脂肪3.8 g/100 mL)，纯净水，淀粉(天津市致远化学试剂有限公司–太阳牌，ar级–分析纯)。

2.2. 试验方法

2.2.1. 样品制备

向品牌纯牛奶样品中不断掺入水或淀粉乳，通过外观观察和气味鉴别的感官试验得出所掺入物质质量的上限值。按照此方法，得出纯牛奶中掺入水的质量百分比为55.00%、掺入淀粉的上限含量为84.21 g/L。按照掺伪质量比为0.10%~70.00%制得73个掺水样品，掺伪含量为0.16~84.21 g/L制得53个掺淀粉样品，见表1。

Table 1. Adulterated dairy products system

表1. 掺伪乳制品体系

2.2.2. 光谱的采集和平均光谱的建立

采集光谱前将仪器开机预热1小时，掺伪样品在实验室提前放置1~2小时。在室温(20℃~25℃)、室内湿度为50%~60%下进行透射和漫反射方式下的光谱采集。光程设置为2 mm，扫描范围为10,000~4000 cm⁻¹，分辨率8 cm⁻¹，采集次数32次，每个样品均扫描3次，将所得光谱数据导入TQ-Analyst软件中建立其平均光谱。

2.2.3. 模型的建立、优化及验证

基于TQ Analyst软件，采用PLS法，从每组样品中随机选取三分之二个样品用于建模，三分之一个样品用于预测，其中预测集的掺伪质量分数在建模集的掺伪质量分数范围内。剔除异常点，选取合适的光谱波段建立乳制品掺伪鉴别模型，将原始光谱先后采用不处理、一阶导数谱、二阶导数谱加上无平滑、S-G平滑、Norris平滑三种方法的顺序进行预处理，确立模型因子数，并通过不矫正、附加散射矫正、标准正则变换三种矫正方式对模型进行优化。基于Excel软件对单个样品的预测值与真实值进行比较分析得出相关性以验证建立模型的准确性。

2.2.4. 定量模型参数

在定量模型中相关系数(Corr. Coeff.)和误差均方根(RMSE)是反映模型预测性和适用性的重要参数，相关系数越接近1，相关性就越高；误差均方根结果越接近0，误差性就越小；此时定量模型的预测性和适用性最为理想。

3. 结果与分析

3.1. 光谱结果分析

近红外光谱区与有机分子中含氢基团X-H (O, N, C)振动的合频和分子中单个化学键的基频振动倍频的吸收区一致，通过扫描样品的近红外光谱，可以得到样品中有机分子含氢基团的特征信息，因为乳制品中的有机成分的组成、化学键等比较相近 [15]，所以不同的掺伪乳制品的光谱图比较相近，无法从原始光谱图上得到掺伪程度，因此需要结合化学计量学进一步分析。通过分析可知，样品之间的差异在全谱的范围中均较明显，所以试验建立模型时选择的光谱波长范围均为10,000~4000 cm⁻¹。漫反射、透射方式下掺水乳制品体系的光谱图见图1、图2所示，漫反射、透射方式下掺淀粉乳制品体系的光谱图见图3、图4所示。

3.2. 异常样本的剔除

本试验采用马氏距离法进行异常点的剔除，见图5~8所示。在漫反射方式下，掺水乳制品存在3个异常样品，为样品34、64、65；掺淀粉乳制品存在4个异常样品，为样品4、8、23、34。在透射方式下，掺水乳制品不存在异常点；掺淀粉乳制品存在2个异常样品，为样品24和31。

3.3. 漫反射方式下的建模结果分析

见表2分析得：

Figure 1. Spectrogram region of 10,000 - 4000 cm⁻¹ of dairy product adulterated with water under diffuse reflectionmode

图1. 漫反射方式掺水乳制品体系10,000~4000 cm⁻¹的光谱图

Figure 2. Spectrogram region of 10,000 - 4000 cm⁻¹ of dairy product adulterated with water under transmission mode

图2. 透射方式掺水乳制品体系10,000~4000 cm⁻¹光谱图

Figure 3. Spectrogram region of 10,000 - 4000 cm⁻¹ of dairy product adulterated with starch under diffuse reflection mode

图3. 漫反射方式掺淀粉乳制品体系10,000~4000 cm⁻¹光谱图

Figure 4. Spectrogram region of 10,000 - 4000 cm⁻¹ of dairy product adulterated with starch under transmission mode

图4. 透射方式掺淀粉乳制品体系10,000~4000 cm⁻¹光谱图

Figure 5. Analyzing abnormal points of dairy products adulterated with water under diffuse reflection mode

图5. 漫反射方式下掺水异常样品分析

Figure 6. Analyzing abnormal points of dairy products adulterated with water under transmission mode

图6. 透射方式下掺水异常样品分析

Figure 7. Analyzing abnormal points of dairy products adulterated with starch under diffuse reflection mode

图7. 漫反射方式下掺淀粉异常样品分析

Figure 8. Analyzing abnormal points of dairy products adulterated with starch under transmission mode

图8. 透射方式下掺淀粉异常样品分析

Table 2. Statistical analysis of the modeling results of the adulterated dairy products system under diffuse reflection mode

表2. 漫反射方式下掺伪乳制品体系的建模结果统计

掺水样品无论采用哪种光谱格式以及平滑方法，预测集对应的误差均方根都较小(均没有超过0.0680)，相关系数都很大(均超过0.9530)。对比可知，掺水样品在二阶导数谱格式下采用Norris平滑方法得到的模型最理想，适用性和预测性最好，其预测集相关系数和误差均方根分别为0.9855和0.0410。

掺淀粉样品在一阶导数谱格式下，无论采用哪种平滑方法，对应的误差均方根都较大(均大于10.00)，相关系数都很小(均没有超过0.9000)，所以掺淀粉样品不适合在此光谱格式下建模；该组样品在原始光谱-S-G平滑方法和二阶导数谱–无平滑方法得到的模型均较为理想，其中适用性和预测性能更高的模型是在二阶导数谱格式下–无平滑方法，其预测集相关系数和误差均方根分别为0.9588和8.25。

3.4. 透射方式下的建模结果分析

见表3分析得：

Table 3. Statistical analysis of the modeling results of the adulterated dairy products system under transmission mode

表3. 透射方式下掺伪乳制品体系的建模结果统计

掺水样品无论采用哪种光谱格式及平滑方法，预测集对应的误差均方根都较小(均没有超过0.0400)，相关系数均接近于1。对比可知，掺水样品在原始光谱下采用S-G平滑方法得到的模型适用性和预测性最高，其预测集相关系数和误差均方根分别为0.9969和0.0172。

掺淀粉样品无论使用何种预处理方法，预测集的相关系数均在0.9900左右，模型的预测性能较高。在一阶导数谱格式下采用Norris平滑的预处理方法，掺淀粉样品定量模型最理想，适用性最好，其预测集相关系数和误差均方根分别为0.9913和3.60。

3.5. 两种采集方式下的最优建模结果对比分析

将漫反射和透射采集方式下的最优建模结果进行统计，掺水样品的理想模型是在透射方式下，采用原始光谱-S-G平滑的预处理方法，其模型的预测集相关系数和误差均差根分别为0.9969，0.0172；掺淀粉样品的理想模型是在透射方式下，采用一阶导数谱-Norris平滑的预处理方法，其预测集相关系数和误差均差根分别为0.9913，3.60。

3.6. 定量模型因子数确定

试验在进行定量回归时，模型因子数是影响PLS模型效果的因素之一：当因子数过小时，会导致模型的误差较大；当因子数过多时，可造成定量模型的过度拟合，即影响模型预测新样品。优化模型时，一般第一个极小值点出现时的因子数为模型最适的因子数。通过分析，可确定A组的因子数为5，B组的因子数为4，见图9、图10所示。

Figure 9. RMSECV changed with change of factor in dairy products adulterated with water

图9. 掺水样品RMSECV随因子数的变化图

Figure 10. RMSECV changed with change of factor in dairy products adulterated with starch

图10. 掺淀粉样品RMSECV随因子数的变化图

3.7. 不同光程矫正的模型优化

在定量模型设置好因子数后，试验进一步研究了不同光程矫正方式对模型建立的影响，得到的结果见表4所示。掺水样品在原始光谱、S-G平滑方法的预处理下采用附加散射矫正方式时，模型的适用性和预测性更为理想，其预测集的相关系数和误差均方根分别为0.9975，0.0155；掺淀粉样品在一阶导数谱、Norris平滑方法的预处理下采用光程不矫正时模型最理想，其预测集的相关系数和误差均方根分别为0.9913，3.6000。

Table 4. Modeling results of different optical path corrections under transmission mode

表4. 透射方式下不同光程矫正方式建模结果

3.8. 掺伪乳制品定量模型的验证

基于Excel软件对两组掺伪乳制品定量分析模型进行了验证，见图11、图12所示，两组模型图的R²均较高，说明两组掺伪乳制品是可以用此模型来测定的，模型的预测准确性和适用性较高。

Figure 11. The verification result of quantitative model of dairy products adulterated with water

图11. 掺水样品定量模型的验证结果图

Figure 12. The verification result of quantitative model of dairy products adulterated with starch

图12. 掺淀粉样品定量模型的验证结果图

4. 结论

基于PLS法通过剔除异常点并利用不同的光谱预处理方法建立了掺伪乳制品鉴别模型。通过确定因子数、不同的光程矫正方式对模型进行优化后，针对掺水乳制品，在透射方式下，因子数为5，采用原始光谱、S-G平滑、附加散射矫正方式时定量分析模型最为理想，其预测集相关系数为0.9975，相关性可达到0.9949；针对掺淀粉乳制品，在透射方式下，因子数为4，采用一阶导数谱、Norris平滑、光程不矫正时模型最为理想，其预测集相关系数为0.9913，相关性可达到0.9827。以上研究不仅可为掺伪乳制品体系的快速鉴别提供理论依据，而且可为乳制品品质的监控提供一定的参考。

基金项目

国家自然科学基金(201701021)；大学生创新创业计划训练项目(201710448081)。山东省教科所BYGI2017003创新创业教育与专业教育融合研究。

参考文献

[1]	明双喜, 张然. 几种常见食品掺伪及其检测技术介绍[J]. 食品研究与开发, 2014, 35(20): 17-22.
[2]	谢昕. 几类食品掺伪的化学检验[J]. 化学教育(中英文), 2014, 35(22): 30-32.
[3]	魏晓敏. 乳与乳制品掺伪鉴别和检验技术[J]. 科学技术创新, 2016(6): 124-124.
[4]	彭珊珊, 张俊艳. 食品掺伪鉴别检验[M]. 北京: 中国轻工业出版社, 2014.
[5]	宋志强, 张恒, 郑晓, 等. 近红外光谱技术在食用植物油脂检测中的应用[J]. 武汉工业学院学报, 2013, 32(2): 1-5.
[6]	徐喆. 近红外光谱技术在油品检测中的应用[J]. 中国石油和化工标准与质量, 2015(24): 13-15.
[7]	陆婉珍, 袁洪福, 徐广通, 等. 现代近红外光谱技术在石油产品分析中的应用[C]//中国分析测试协会科学技术奖发展回顾. 2015.
[8]	李桂峰. 近红外光谱技术及其在农业和食品检测中的应用[J]. 农业与技术, 2007, 27(5): 91-94.
[9]	饶毅, 魏惠珍, 方少敏, 等. 近红外光谱技术在中药制药过程质控中的应用[J]. 中成药, 2011, 33(1): 126-130.
[10]	王莉, 李增芳, 何勇, 等. 应用近红外光谱技术快速检测果醋糖度[J]. 光谱学与光谱分析, 2008, 28(8): 1810-1813.
[11]	张萍, 闫继红, 朱志华, 等. 近红外光谱技术在食品品质鉴别中的应用研究[J]. 现代科学仪器, 2006(1): 60-62.
[12]	李凯歌, 韩东润, 孙明. 纯牛奶中还原奶的近红外检测判别分析[J]. 农机化研究, 2008, 8: 145-147.
[13]	程文宇, 管骁, 刘静. 近红外光谱技术检测液态奶中微量三聚氰胺的可行性研究[J]. 食品与机械, 2015(1): 71-74+81.
[14]	Han, D., Lu, C. and Liu, Y. (2006) Nondestructive Detection of Brown Core in the Chinese Pear Yali by Transmission Visible-NIR Spectroscopy. Dairy Guide, 4, 39-41.
[15]	李振庆, 黄梅珍, 倪一, 等. 改进偏最小二乘法在近红外牛奶成分测量中的应用[J]. 光学技术, 2009, 35(1): 70-73.

为你推荐

友情链接