技术领域
本发明属于奶品分析技术领域,具体涉及高温灭菌牛奶、巴氏杀菌奶牛鲜奶及奶粉复原牛奶的快速鉴定方法。
背景技术
在市场上,常见的牛奶类型有高温灭菌的纯牛奶、巴氏杀菌的鲜牛奶以及奶粉。高温灭菌牛奶采用的加工工艺有高温瞬时灭菌法(UHT):灭菌温度为130~150℃,灭菌时间为0.5s~4s;保持式灭菌法:灭菌温度为115~120℃,灭菌时间为15~20min。巴氏杀菌的鲜牛奶采用的加工工艺有低温长时间杀菌法(LTLT):灭菌温度为62~65℃,灭菌时间为30min;高温短时杀菌法(HTST):灭菌温度为72~75℃,灭菌时间为15s。奶粉在加工时先在60℃环境下先用均质机均质,而后采用高温短时灭菌法,灭菌温度可达120℃,最后以100℃以下进行干燥
中红外光谱分析是近年来快速发展起来的一种快速、无损、无公害、可多组分同时分析的现代技术,且广泛应用于乳用动物的乳品质检测和牧场管理。用于建立分类模型的机器学习算法有决策树、朴素贝叶斯、人工神经网络、自举汇聚、K最近邻、随机森林和支持向量机等,在实践中,随机森林和支持向量机具有更好的表现,错判率低,准确率、灵敏度和特异性高
发明内容
本发明的目的是针对高温灭菌牛奶、巴氏杀菌奶牛鲜奶及奶粉复原牛奶的鉴定方法存在的缺陷,确定高温灭菌牛奶、巴氏杀菌奶牛鲜奶及奶粉复原牛奶的快速鉴定的最佳预处理和建模算法组合,提高上述三类牛奶的鉴别速度和准确率。
本发明的技术方案如下所述:
一种高温灭菌牛奶、巴氏杀菌奶牛鲜牛奶及奶粉复原牛奶的快速鉴别方法,包括以下步骤:
1)奶样的选取
分别采集高温灭菌牛奶、巴氏杀菌奶牛鲜牛奶及和奶粉复原牛奶;
2)采集中红外光谱(简称MIR)
采用乳成分检测仪对牛奶样品进行扫描,通过相连的计算机输出每个样本对应的透光率;
3)数据预处理
将原始光谱数据由透光率(T)转化为吸光度(A),去除异常值;
4)划分数据集
将数据集按照分层抽样的原则划分为训练集和测试集,两者分别占数据集的80%和20%;
5)确定建模光谱波段
筛选高温灭菌牛奶、巴氏杀菌奶牛鲜牛奶及奶粉复原牛奶的差异波段,并去除水的吸收区域;
6)建立模型与筛选最优模型
以训练集样本的中红外光谱为输入值,以高温灭菌牛奶、巴氏杀菌奶牛鲜牛奶和奶粉复原牛奶的类别为输出值,使用不同光谱预处理方法和不同建模算法组合建立模型,使用准确率和Kappa系数指标对模型进行评估和筛选,筛选出最优模型;
7)最优模型的验证与应用
另取高温灭菌牛奶、巴氏杀菌奶牛鲜牛奶和奶粉复原牛奶样本,使用筛选出的最优模型对样本进行鉴别,评估其应用性能;
其中:
步骤2)中采集中红外光谱时,将牛奶样本分别倒入直径3.5cm,高9cm的圆柱形采样管中,保证液面高度大于6cm,然后将其在42℃水浴锅中水浴15-20min,再将固体光纤探头伸到液体中吸样检测;
步骤3)中根据A=log
步骤5)中使用的筛选差异波段的方法为Pearson相关性检验和相关性的显著性检验,最终选择用于建模的优选光谱波段为972.216-1481.472cm
步骤6)中使用的光谱预处理方法为一阶微分(Diff)、标准正态变量变换(SNV)、多元散射校正(MCS)和Savitzky-Golag卷积平滑(简称SG卷积平滑),使用的建模算法为随机森林(RF)和支持向量机(SVM)。
步骤7)中选择的最优模型为无预处理和支持向量机算法组合,最优模型在训练集、测试集和验证集中的准确率均为1,且验证过程不超过5分钟,即本发明选择的最优模型可以实现对高温灭菌牛奶、巴氏杀菌奶牛鲜牛奶及奶粉复原牛奶的快速、精准鉴别。
与现有技术相比,本发明的有益效果在于:
(1)本发明的发明点在于使用Pearson相关性检验和相关性的显著性检验筛选出差异波段,筛选出最终用于建模的优选光谱波段为972.216-1481.472cm
(2)本发明的最优模型的预处理和建模算法组合为不处理和支持向量机算法,准确率可达到1。
(3)本发明可在5分钟内实现对样本的精准、快速鉴别,实现了对高温灭菌牛奶、巴氏杀菌奶牛鲜牛奶及奶粉复原牛奶的快速检测。
附图说明
图1:本发明建模波段的光谱图。即三类牛奶在建模波段的吸光值图。附图标记说明:图1中横坐标为光谱波数,纵坐标为吸光度,建模波段为972.216-1481.472cm
图2:本发明测试集的ROC曲线。附图标记说明:ROC曲线可以衡量模型在测试集的性能。图2中的横坐标为假阳性率,纵坐标为真阳性率,AUC为ROC曲线下与坐标轴围成的面积,取值范围在0.5和1之间,AUC越接近1.0,表明方法的真实性越高,图2中AUC为1,表明本发明的模型真实性高。
图3:本发明测试集的分类概率图。附图标记说明:图3中的横坐标为预测概率,纵坐标为预测的类别,例如图3中左上方的圆点表示所述的样品被分为0类的概率为0.704,且为正确分类;图3中表明测试集中的样本均被正确分类,且0类即高温灭菌牛奶被正确分类的概率为0.967-1,1类即巴氏杀菌奶牛鲜奶被正确分类的概率为0.929-0.999,2类即奶粉复原牛奶被正确分类的概率为0.704-1。表明本发明的模型能够对样本实现高概率的正确分类。
具体实施方式
本发明所述技术方案,如未特别说明,均为本领域的常规技术方案。所述试剂或材料,如未特别说明,均来源于商业渠道。
本发明技术方案中一些技术参数,如一阶微分(Diff)、标准正态变量变换(SNV)、多元散射校正(MSC)和SG卷积平滑等技术参数,本领域技术人员可以根据研究对象进行的常规调整。
在本发明实施例中,中红外光谱数据预处理、模型构建及验证等均通过Python3.8.3实现。
实施例1:高温灭菌牛奶、巴氏杀菌奶牛鲜奶及奶粉复原牛奶的快速鉴定方法的建立
仪器与设备:选用FOSS公司生产的MilkoScan
具体操作步骤如下:
(1)采集奶样
分别在超市购买销售量较大的五个商业品牌不同批次的高温灭菌牛奶样本共643份,四个品牌多批次的巴氏杀菌奶牛鲜奶样本127份和冲调后的奶粉样本共223份。
(2)测定中红外光谱
将奶样分别倒入直径3.5cm,高9cm的圆柱形样品管中,保证液面高度大于6cm,然后将其在42℃水浴锅中水浴15-20min,再将固体光纤探头伸到液体中吸样检测,通过软件得到样本的透光率。
(3)数据预处理
依据A=log
(4)划分数据集
将数据集按分层抽样法分为训练集(n=801:高温灭菌牛奶528个、巴氏杀菌奶牛鲜奶101个、奶粉172个)和测试集(n=201:高温灭菌牛奶132个、巴氏杀菌奶牛鲜奶26个、奶粉43个)。
在建模过程中,数值0表示高温灭菌牛奶类,1表示巴氏杀菌奶牛鲜奶类,2表示奶粉类。表2为3类奶常规乳成分的描述性统计,由表2可知,这3类产品的常规乳成分存在极显著差异(P<0.01)。
表1剔除异常值时的样本量变化
表2常规乳成分的描述性统计
注:同行数据肩标不同字母表示差异显著(P<0.05),有相同字母表示差异不显著(P>0.05)。
(5)确定建模光谱波段
对光谱数据进行Pearson相关性检验,并对相关性进行显著性分析,且去除水的吸收区域,最终优选972.216-1481.472cm
(6)建立模型与筛选最优模型
分别采用一阶微分(Diff)、标准正态变量变换(SNV)、多元散射校正(MSC)和SG卷积平滑对光谱数据进行预处理,同时也与不使用预处理的数据进行比较。
使用随机森林(RF)和支持向量机(SVM)算法利用训练集数据建立分类模型,并对测试集中的样本进行预测。在不同预处理下,RF和SVM算法的建模结果如表3示。
表3不同预处理下RF和SVM的建模结果
在上述多分类判别模型中,以准确率和Kappa系数评价模型的性能,其中,准确率为正确判断占所有判断的概率,其值越接近1越好。Kappa系数常用于一致性检验,也可用于衡量分类的精度,其值越接近1越好。由表3中结果可知,SVM算法在此分类任务中比RF算法表现出强的学习能力,SVM模型取得优秀的结果,说明此5个模型均能准确鉴别训练集和测试集的两类目标。在RF模型中,可以看到一阶微分(Diff)和SG平滑均相对于不处理表现出更优秀的性能,说明适宜的数据预处理会提高模型准确率。但对数据进行不同预处理会不同程度地增加运算难度,增加运算时长。因此,在具有相同效果的5个模型中选择无处理与支持向量机的组合建立的模型为最优模型。
利用选择的最优分类模型,预测测试集的201个样本。以混淆矩阵衡量模型在测试集的性能,如图2所示。由图2可知,本实施例中测试集没有出现错分类情况,说明模型在测试集上具有良好的分类效果。
图3为测试集中类别分类的概率,例如图中左上方的圆点表示此样品被分为0类的概率为0.704,且为正确分类。由图可知,测试集中的所有样本均被正确分类,且大部分样本被正确分类的概率>0.95。
实施例2:高温灭菌牛奶、巴氏杀菌奶牛鲜奶及奶粉复原牛奶的快速鉴定方法的应用
取145份高温灭菌牛奶、巴氏杀菌奶牛鲜奶和奶粉复原牛奶样本(其中,高温灭菌牛奶85份,巴氏杀菌奶牛鲜奶23份,奶粉复原牛奶37份)对模型进行验证,将预测结果与真实结果对比。其中,该145个样本的类型已提前记录。
具体步骤:采用实施例1的测定光谱、数据预处理等方法,对145个样品进行测定和处理,使用筛选出的最优模型(不处理+SVM)进行鉴定。
输出结果如表4所示。
表4模型应用结果
鉴定的结果与真实情况完全相同,85个高温灭菌牛奶,23个巴氏杀菌奶牛鲜奶和37个奶粉复原牛奶样本,准确率达到100%。
本发明的最优模型使用的光谱波段为972.216-1481.472cm
参考文献
[1]曲春礼等,浅谈高温灭菌牛奶与巴氏杀菌奶[J].中国乳业,2006(05):61-63;
[2]汪六三等,.基于近红外光谱和机器学习的大豆种皮裂纹识别研究[J/OL].农业机械学报:1-15[2021-04-27];
[3]C.C.Fagan,C.Everard,C.P.O’Donnell,G.Downey,E.M.Sheehan,C.M.Delahunty,D.J.O’Callaghan.Evaluating Mid-infrared Spectroscopy as a NewTechnique for Predicting Sensory Texture Attributes of Processed Cheese[J].Journal of Dairy Science,2007,90(3);
[4]Soyeurt H.,Grelet C.,McParland S.,Calmels M.,Coffey M.,Tedde A.,Delhez P.,Dehareng F.,Gengler N..A comparison of 4different machine learningalgorithms to predict lactoferrin content in bovine milk from mid-infraredspectra[J].Journal of Dairy Science,2020,103(12);
[5]Xu W,Knegsel A,Vervoort J,et al.Prediction of metabolic status ofdairy cows in early lactation with on-farm cow data and machine learningalgorithms[J].Journal of Dairy Science,2019,102(11)。
机译: 鲜奶牛奶的方法和设备
机译: 用牛奶粉和鲜奶油制备面包和果酱材料的方法
机译: 从诸如牛奶之类的液体产品开始经过诸如巴氏灭菌法或巴氏杀菌的热处理的粉末状诸如奶粉的产品的制造方法