首页> 中国专利> 特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的光谱分级方法

特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的光谱分级方法

摘要

本发明属于奶品分析技术领域,具体涉及特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的光谱分级方法。与中红外光谱分析领域相关。本发明的发明点在于:优选建模波段为925‑1597cm‑1和1712‑3024cm‑1的波段;发明步骤为:(1)以待测的牛奶样品作为检测样本;(2)采集中红外光谱数据;(3)选择光谱波段;(4)对原始中红外光谱数据进行预处理;(5)提取中红外光谱特征波长;(6)利用模型对测试集中的样本进行预测;(7)对模型进行比较和评价;(8)经过对比分析,选择最佳分级模型。本发明利用特征变量组合建立模型,简化了模型,提高了模型精度和检测速度。

著录项

说明书

技术领域

本发明属于奶品检测技术领域,具体涉及特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的光谱鉴别方法。本发明的领域与中红外光谱分析领域相关。

背景技术

市场上普遍出现“高蛋白”,“高乳脂”等特色牛奶。此外,牛奶中的体细胞数对乳蛋白和乳脂含量有着重要影响

乳蛋白、乳脂肪和体细胞数的传统化学分析方法耗时长且污染环境。若使用仪器测定则需要使用乳成分分析仪和体细胞检测仪分开测定乳蛋白、乳脂肪和体细胞数,其中体细胞数测定过程中用到的吖啶橙为世界卫生组织国际癌症研究机构公布的3类致癌物。中红外光谱法具有快速无损,操作简单的优点。在国内,中红外光谱技术主要用于参假研究

此外,这些研究尚存在光谱的冗余信息较多,光谱特征波长不明确等问题。

发明内容

本发明的目的在于克服传统技术的缺陷,以弥补现有技术的不足,本发明基于中红外光谱分析,找到牛奶品质的中红外光谱特征波长,提供一种鉴别特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的光谱分级方法,所述的方法具有鉴别速度快,精度高,成本低,且操作简单的特点,可批量进行牛奶品质的检测。

本发明通过以下技术方案实现:

本发明挑选牛奶品质的特征波长,且特征波长数量少,运用特征波长建立牛奶品质的中红外模型的方法,在相同预测精度的情况下,本发明的预测速度快。

四种牛奶样本的光谱分级方法,所述的四种牛奶为商品特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的,所述的方法包括以下步骤:

(1)获取待测的4种牛奶样本,即特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶;

(2)采集中红外光谱数据:利用利用乳成分分析仪(傅里叶变换中红外光谱仪)在925-4000cm

(3)选择光谱波段:去除噪声多、有效信息少的波段;

(4)将原始中红外光谱数据划分为训练集和测试集,并进行预处理;

(5)提取中红外光谱特征波长;

(6)建立模型:采用朴素贝叶斯(Naive bayes,NB)模型在训练集上构建分级模型,利用建立的模型对测试集中的样本进行预测;

(7)筛选和确定模型:根据训练集准确率和测试集准确率,对模型进行比较和评价;

(8)经过对比分析,选择最佳分级模型。

本发明所述牛奶样本来河北地区10个不同牧场。

所述傅里叶变换中红外光谱仪为FOSS公司的MilkoScan

采集中红外光谱时,先将样本倒入直径3.5cm,高9cm的圆柱形样品管中,在42℃水浴锅中水浴15-20min,然后将固体光纤探头伸到液体中。

光谱波段的选择为去除噪声较多的1597-1712cm

采用随机算法将样本按7:3随机划分为训练集和测试集,数据预处理采用的是标准正态变量校正(SNV)、多元散射校正(MSC)、一阶导数、二阶导数、一阶差分和二阶差分共6种预处理方法。

采用无信息变量消除法(UVE)、竞争性自适应重加权法(CARS)、稳定性竞争性自适应重加权采样算法(SCARS)提取中红外光谱特征波长。

三种算法提取的特征波长分别如下:

(1)UVE(229个):3.858cm

(2)CARS(37个):73.302cm

(3)SCARS(20个):73.302cm

通过美国MathWorks公司出品的商业数学软件matlab2016b对中红外光谱数据预处理、模型构建及验证。

本发明优点在于:

(1)选择了最佳建模波段,根据图2和实施例1可知优选的建模波段为925-1597cm

(2)节约了仪器成本,避免了人体危害。在应用模型时,只需将通过乳成分分析仪获得的牛奶中红外光谱数据输入模型即可输出预测类别。而以往的仪器测定方法需要使用乳成分分析仪和体细胞检测仪两台仪器,且吖啶橙为世界卫生组织国际癌症研究机构公布的3类致癌物。

(3)确定了特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的特征波长,利用特征波长建立模型,简化了模型,提高了模型精度。

(4)实现了特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的批量检测,每份牛奶的检测只需要2-3毫秒。具有鉴别速度快、精度高、成本低、操作简单和实用性强等的特点。

附图说明

图1:实施例1中4种高等级牛奶(特优优质奶、高蛋白特色奶、高乳脂特色奶)和普通奶的平均光谱图。

图2:实施例1中选择的建模波段925-1597cm

图3:实施例1中的二阶差分预处理后的全光谱图。

图4:实施例1中本发明UVE特征波长筛选图。

附图标记说明:本发明UVE提取特征波长的过程,设定噪声矩阵处最大稳定性绝对值的90%作为剔除阈值,图像左侧曲线代表牛奶光谱变量,右侧曲线代表添加的与牛奶样本数量一致的随机噪声变量,两水平虚线为变量的选择阈值,虚线内部为被消除的无用信息,外部为有用信息,被用于后续建模,通过UVE共选择229个特征波长。

图5:实施例1的的CARS特征波长筛选图。

附图标记说明:由于CARS算法和SCARS算法的运行过程相似,本发明以CARS算法为例对特征变量提取的过程进行阐述。本发明设定蒙特卡罗采样为100次,采用5折交叉验证法计算。由图5中的A图可知,RMSECV值随着取样运行次数增加先减小后增大:当RMSECV值逐渐减小时,表明光谱数据中部分无用的信息被剔除;当RMSECV值逐渐增大时,表明光谱数据中有用的重要信息被剔除。因此,取采样100次所建立的PLSR模型中所对应的最小RMSECV作为最优结果。由图5中的B图可知,当RMSECV值达到最小值时,各变量的回归系数位于图5中的C图中的竖直线位置(采样运行48次)。

具体实施方式

本发明所述技术方案,如未特别说明,均为本领域的常规方案。所述试剂或材料,如未特别说明,均来源于商业渠道。

实施例1:特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的光谱快速分级方法的建立

(1)试验材料与方法

选取中国河北省10个不同牧场的牛奶样本5121份,并编号。将样本倒入直径3.5cm,高9cm的圆柱形样品管中,在42℃水浴锅中水浴15-20min,使用FOSS公司的MilkoScan

表1牛奶成分差别

(2)建模波段的选择

中红外光谱的采集范围为925-4000cm

(3)中红外光谱预处理

采用标准正态变量校正(SNV)、多元散射校正(MSC)

由附图3可知,经过二阶差分预处理后的光谱曲线较全光谱曲线有效信息得到了增强。

(4)筛选中红外光谱特征波长

采用无信息变量消除法(UVE)

(5)不同模型的对比

分别将无信息变量消除法(UVE)、竞争性自适应重加权法(CARS)和稳定性竞争性自适应重加权采样算法(SCARS)提取的中红外光谱特征波长带入NB模型中,对比模型的准确率,结果见表2A和表2B。最终得到的最佳分级模型为二阶差分-SCARS-NB模型。

表2A不同模型的训练集精度对比

表2B不同模型的训练集精度对比

实施例2:波数对模型精度的影响

牛奶的中红外光谱采集,方法同实施例1,再去除1597-1712cm

表3波数对模型精度的影响

实施例3:导数处理对模型精度的影响

牛奶的中红外光谱采集,方法同实施例1,分别运用一阶导数和二阶导数对牛奶的中红外光谱值进行预处理。平滑点数分别设为7,9,11,将预处理后的光谱带入NB模型,结果见表4。表4可知,9点平滑的导数预处理后建立的NB模型效果最佳,一阶导数的训练集准确率与测试集准确率分别为90.6886%和88.8527%,二阶导数的训练集准确率与测试集准确率分别为93.7552%和92.0469%。因此,选择9作为最佳的平滑点数,并将9点平滑的一阶导数和二阶导数作为最佳的导数预处理方法。

表4导数处理对模型精度的影响

实施例4:预处理对模型精度的影响

牛奶的中红外光谱采集,方法同实施例1,分别运用采用标准正态变量校正(SNV)、多元散射校正(MSC)、一阶导数、二阶导数、一阶差分和二阶差分对牛奶的中红外光谱值进行预处理,将预处理后的光谱带入NB模型。

表5可知,未处理的全光谱数据建立的NB模型的训练集准确率与测试集准确率仅为84.4996%和84.2243%,与全光谱相比,所有预处理后的全光谱数据建立的NB模型的训练集准确率与测试集准确率均有明显提高,表明预处理可以提高NB模型的预测性能。其中,二阶差分预处理后建立的NB模型效果最佳,训练集准确率与测试集准确率分别为94.3128%和92.1121%。因此,选择二阶差分预处理作为最佳的预处理方法,并用于后续的建模分析。

表5预处理对模型精度的影响

实施例5:UVE阈值对模型精度的影响

牛奶的中红外光谱采集,方法同实施例1,利用二阶差分对牛奶的中红外光谱值进行预处理后,利用UVE提取特征波长。将UVE的阈值分别设为0.8,0.9,0.99,将提取的特征波长分别带入NB模型。表6可知,阈值为0.9时获得的229个特征波长建立的NB模型效果最佳,训练集准确率与测试集准确率分别为94.1734%和92.6988%。

表6 UVE阈值对模型精度的影响

实施例6:CARS和SCARS的采样次数对模型精度的影响

牛奶的中红外光谱采集,方法同实施例1,利用二阶差分对牛奶的中红外光谱值进行预处理后,利用CARS和SCARS提取特征波长,将CARS和SCARS的采样次数分别设为50、100、150和200,其他方法同实施例1,不同采样次数确定的特征波长数量见表7。

将提取的特征波长分别带入NB模型。表7可知,采样次数为100时分别获得的37个和20个特征波长建立的NB模型效果最佳,CARS模型的训练集准确率与测试集准确率分别为93.7273%和92.5033%,SCARS模型的训练集准确率与测试集准确率分别为94.4522%和93.9374%。

表7 CARS和SCARS的采样次数对模型精度的影响

实施例7:特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的光谱快速分级方法的应用

取80份牛奶样本对模型进行预测。将预测类别与真实类别进行对比。目的是验证模型的实际应用效果和确定模型的可靠性。

具体步骤:按照实施例1的方法采集样本的光谱,将光谱数据直接代入实施例1构建的二阶差分-UVE-NB模型中,即可输出预测结果,预测结果见表8A和表8B。

模型的总体准确率为92.5%,其中,A级、B级、C级、D级牛奶的预测准确率分别为100%、95%、90%和85%。此外,80份牛奶样本的预测时间为0.17秒。每份牛奶样本的预测用时仅为2.125毫秒。

结合表3A和表3B可以看出,二阶差分-UVE-NB模型的训练集准确率、测试集准确率和外部验证准确率均大于92%,因此该模型具有良好的实际应用效果和高可靠性,可以满足生产需求。

表8A模型的外部验证结果

表8B模型的外部验证结果

说明:A级:特优优质奶B级:高蛋白特色奶C级:高乳脂特色奶D级:普通奶本发明最终选择二阶差分-UVE-NB模型最为牛奶品质分级的最佳模型,具有以下优点:

(1)实现了特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的批量检测,每份牛奶的检测只需要2-3毫秒。具有鉴别速度快、精度高、成本低、操作简单和实用性强等的特点。

(2)选择了最佳建模波段,根据图2和实施例1可知优选的建模波段为925-1597cm

(3)确定了特优优质奶、高蛋白特色奶、高乳脂特色奶和普通奶的特征波长,利用特征波长建立模型,简化了模型,提高了模型精度。模型的训练集准确率、测试集准确率和外部验证准确率均大于92%

(4)节约了仪器成本,避免了人体危害。在应用模型时,只需将通过乳成分分析仪获得的牛奶中红外光谱数据输入模型即可输出预测类别。而以往的仪器测定方法需要使用乳成分分析仪和体细胞检测仪两台仪器,且吖啶橙为世界卫生组织国际癌症研究机构公布的3类致癌物。

主要参考文献

1.李春艳,奶牛隐性乳房炎对牛奶品质的影响[J].畜牧兽医科学(电子版),2019(03):16-17.doi:10.3969/j.issn.2096-3637.2019.03.008;

2.李庆波等,.牛奶主要成分含量近红外光谱快速测量法[J].食品科学,2002(06):121-124;

3.李双红等,不同胎次奶牛乳中乳蛋白含量的近红外光谱定量分析[J].食品工业科技,2014,35(04):60-65.DOI:10.13386/j.issn1002-0306.2014.04.024;

4.杨晋辉等.近红外透反射光谱法测定牛奶成分[J].食品科学,2013,34(20):153-156.doi:10.7506/spkx.1002-6630-201320031;

5.Massimo De Marchi,Valentina Bonfatti,Alessio Cecchinato,etal.Prediction of protein composition of individual cow milk using mid-infrared spectroscopy[J].Italian Journal of Animal Science,2010,8(2s);

6.A.Fleming,F.S.Schenkel,J.Chen,et al.Prediction of milk fatty acidcontent with mid-infrared spectroscopy in Canadian dairy cattle usingdifferently distributed model development sets[J].Journal of Dairy Science,2017,100(6).https://doi.org/10.3168/jds.2016-12102;

7.H.Soyeurt,F.Dehareng,N.Gengler,et al.Mid-infrared prediction ofbovine milk fatty acids across multiple breeds,production systems,andcountries[J].Journal of Dairy;

8.高升等,.基于高光谱图像信息融合的红提糖度无损检测[J].发光学报,2019,40(12):1574-1584.

9.付丹丹等,鸡蛋新鲜度、pH值及黏度的高光谱检测模型[J].食品科学,2016,37(22):173-179.

10.王伟等,冬小麦叶绿素含量高光谱检测技术[J].农业机械学报,2010,41(05):172-177.

11.付萍杰等,光谱二阶差分Gabor展开法土壤铜铅污染鉴别[J].光谱学与光谱析,2018,38(10):3245-3253.

12.高升等,红提糖度和硬度的高光谱成像无损检测[J].光学学报,2019,39(10):355-364.

13.高升等,基于近红外光谱的红提维生素C含量、糖度及总酸含量无损检测方法[J].分析化.学,2019,47(06):941-949。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号