首页> 中国专利> 基于PSO‑RICAELM的近红外光谱分析鉴别翠冠梨成熟度的方法

基于PSO‑RICAELM的近红外光谱分析鉴别翠冠梨成熟度的方法

摘要

本发明公开了一种基于PSO‑RICAELM的近红外光谱分析鉴别翠冠梨成熟度的方法,包括以下步骤:(1)收集样品,采集样品光谱,得到样品近红外漫反射光谱数据,对光谱数据进行二阶导数处理,并使用离散小波变换压缩原始近红外光谱数据;(2)将压缩后的光谱数据用稳健性独立分量分析对其进行分解,提取基本成分光谱矩阵和相应的近似浓度矩阵;(3)将近似浓度矩阵作为模型输入,对应的成熟度作为输出,用粒子群算法寻优,建立PSO‑RICAELM模型;(4)模型的质量评价,鉴别样品的成熟度。本发明能够快速鉴别翠冠梨成熟度,丰富了化学计量学方法,具有良好的应用前景。

著录项

  • 公开/公告号CN107121407A

    专利类型发明专利

  • 公开/公告日2017-09-01

    原文格式PDF

  • 申请/专利权人 中国计量大学;

    申请/专利号CN201710408868.9

  • 发明设计人 黄咏梅;张瑜;林敏;刘辉军;

    申请日2017-06-02

  • 分类号

  • 代理机构杭州求是专利事务所有限公司;

  • 代理人邱启旺

  • 地址 310018 浙江省杭州市江干经济开发区学源街258号

  • 入库时间 2023-06-19 03:14:54

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-06-09

    未缴年费专利权终止 IPC(主分类):G01N21/359 专利号:ZL2017104088689 申请日:20170602 授权公告日:20190723

    专利权的终止

  • 2019-07-23

    授权

    授权

  • 2017-09-29

    实质审查的生效 IPC(主分类):G01N21/359 申请日:20170602

    实质审查的生效

  • 2017-09-01

    公开

    公开

说明书

技术领域

本发明涉及红外无损检测技术领域,尤其涉及一种PSO-RICAELM的近红外光谱分析鉴别翠冠梨成熟度的方法。

背景技术

现代近红外光谱分析法是一种快速无损的检测方法,其原理为对有机物中的含氢基团X-H的倍频合频产生吸收,通过化学计量方法测得有机物的理化指标,用有效的数学算法将理化指标与光谱建立函数关系,与传统的方法相比更加快速方便,节约时间,已经被广泛应用于多个方面的分析中。但是目前存在的基于近红外光谱分析的水果成熟度鉴别方法中,例如BP神经网络,在训练过程中会出现收敛速度慢,进入局部最小值而训练失败等情况;由于支持向量机(SVM)对大规模训练难以实施,所以,解决多分类有很大的困难,具有鲁棒性小等缺点。因此为解决建模所需样品基数大、训练时间久,不稳定等问题,急需一种普适性较强的模型,能有效的鉴别翠冠梨的成熟度。

传统的分解降维方法如PCA、SVD等,只能分解出不相关的各分量,并不能保证这些分量互相独立,这就缺少实际意义,降低了所提取特征的典型性。

极限学习机(ELM)是一种新型的神经网络,随机给予输入层权值和隐含层偏差,但是这样容易造成模型泛化能力差,精度不够高。

发明内容

本发明的目的在于针对现有技术的不足,提供一种基于PSO-RICAELM的近红外光谱分析鉴别翠冠梨成熟度的方法。ICA输出的是非高斯信号,提高了模型的准确率,本文所提出的稳健性独立分量分析算法是ICA的一种,减少了迭代次数并且有更快的收敛速度,可以提取出所有不为0的基本成分光谱矩阵。将经过稳健性独立分量分析算法处理的光谱作为输入到极限学习机网络中,得到RICAELM模型。本发明提出了粒子群算法优化RICAELM网络的输入层权值和隐含层偏差来提高模型的精度。

本发明是通过以下技术方案实现的:一种基于PSO-RICAELM的近红外光谱分析鉴别翠冠梨成熟度的方法,包括以下步骤:

(1)收集样品;在样品成熟期前一周开始采摘样品,每隔n(4<n<10)天采摘一次样品,至少采摘三次;用近红外光谱仪对样品进行多次扫描,多次扫描后取平均值,得到不同成熟度的样品近红外光谱;并对近红外光谱进行二阶导数和离散小波变换处理,得到压缩后的近红外光谱数据矩阵;

(2)将步骤(1)得到的压缩后的近红外光谱数据矩阵运用稳健性独立分量分析分解,得到近似浓度矩阵;建立校正集模型,将实际已知成熟度及近似浓度矩阵作为初始模型输入,得到RICAELM模型;用粒子群算法寻优RICAELM模型,得到最佳翠冠梨成熟度鉴别模型;

(3)将预测集样品的近似浓度矩阵输入最佳翠冠梨成熟度鉴别模型,得到预测集样品的成熟度。

进一步的,所述步骤(1)具体实现如下:

在样品成熟期前一周开始采摘样品,每隔n(4<n<10)天采摘一次样品,至少采摘三次;使用近红外光谱仪对不同成熟度的样品进行扫描,得到样品的近红外光谱,将不同成熟度的样品随机分为校正集样品和预测集样品,其中,校正集样品用于模型训练,预测集样品用于模型的质量评价;将样品的近红外光谱进行二阶导数和离散小波变换处理,离散小波变换选择小波母函数为dbn,n为消失矩,得到压缩后的近红外光谱数据矩阵。

进一步的,所述步骤(2)具体实现如下:将处理后的数据作为输入进行稳健性独立分量分析运算,在光谱成分独立性的前提下,将光谱分解成不同的成分,输出是近似浓度矩阵。稳健性独立分量分析算法以峭度为对照函数,通过最优步长的寻找方法对峭度进行优化,得到所有峭度不为0的基本成分光谱矩阵和对应的近似浓度矩阵。将输出的非高斯型、包含绝大部分光谱特征的近似浓度矩阵输入到极限学习机网络中,得到RICAELM模型。

进一步的,所述步骤(3)具体实现如下:将翠冠梨成熟度鉴别模型输入层与隐含层之间的连接权值和隐含层节点的偏置值作为粒子群搜索空间中的一个粒子,采用粒子群优化算法对粒子进行迭代寻优,设定粒子数m,产生种群,初始化PSO的粒子速度v、惯性权值w、学习因子c1和c2、最大迭代次数k,按照适应度函数计算粒子的适应度值,然后更新粒子的位置和速度,具体更新公式如下:

vi(a+1)=vi(a)+c1r1[pbesti-xi(a)]+c2r2[gbest-xi(a)]

xi(a+1)=xi(a)+vi(a+1)

其中,i是粒子(i=1、2…),xi(a+1)、vi(a+1)是第i个粒子的第a+1次迭代时的位置和速度,c1和c2学习因子,r1和r2是在[0,1]区间内均匀分布的随机数,vi、xi是第i个粒子第a次迭代速度和位置,pbesti是第i个粒子的个体最优位置,gbest是全局最优位置。

当寻优满足寻优达到最大迭代次数k或评价值小于指定的精度b(b>0)时,搜索就结束,得到最优的输入权值和隐含层偏置,并赋值给RICAELM网络,得到最佳翠冠梨成熟度鉴别模型。

进一步的,所述步骤(3)中,极限学习机ELM隐含层激活函数选择Sigmoidal函数。

本发明的有益效果是:利用二阶导数,消除光谱的基线漂移和背景光干扰,提高光谱分辨率。利用离散小波变换,能压缩数据,节约成本空间,提高建模的效率和精度。利用稳健性独立分量分析算法,选取最优独立分量数建立校正模型;采用PSO-RICAELM算法建立模型,是一种分类精度更高、更稳定、泛化能力更好的模型,所建模型更具实际意义。整个测量过程不消耗化学试剂,测试快速,节省人力物力,批量测试时结果准确,大大提高检测效率。本方法可以在采摘、贮藏、运输、销售等环节推广使用。

附图说明

图1为本发明成熟度方法流程图;

图2为本发明四种不同成熟度的样品原始光谱图;

具体实施方式

由于近红外光谱可以视作多种主要成分光谱的组合,近些年,有学者将“盲源分离(BBS)”问题引入近红外光谱分析方法中,将主要成分的光谱从复杂的混合光谱中分离出来。稳健性独立分量分析算法是一种基于峭度和最优步长的算法,为信号盲源分离提供了一种高效率的方法,主要优点在于可以选取最佳步长以及任何不为零的独立分量,适用于光谱的分解,可以提取光谱的典型特征。同时,ELM属于前馈神经网络,学习训练速度快,设置参数少,可以较大程度的减少人为误差。将经过稳健性独立分量分析算法处理后的光谱作为输入到ELM网络中,得到精度更高、更稳定的RICAELM模型。经过采用PSO寻优,RICAELM输入层权值和隐含层偏差选择最优输入,得到分类精度更高、更稳定、泛化能力更好的模型。

本发明采用了PSO-RICAELM结合的方法,使近红外光谱分析法可以有效的鉴别翠冠梨成熟度,丰富了化学计量方法并为近红外光谱分析领域中农作物成熟度鉴别提供了理论前提和技术支持。

本发明提供了一种翠冠梨成熟度准确鉴别的近红外光谱分析法。下面结合附图1、附图2以及实施例对本发明进一步说明。实施例为本发明举例,并非对该发明限定。

本发明的技术方案为,收集样品和采谱,对原始光谱预处理,首先用二阶导数对近红外光谱数据进行处理,其次用离散小波变换对近红外光谱数据进行有效压缩,得到数据量合适的矩阵,对该矩阵使用稳健性独立分量分析算法分解,提取基本成分光谱矩阵和相应的近似浓度矩阵,将近似浓度矩阵作为模型输入,通过粒子群寻优RICAELM建模。整个方案流程图如附图1所示。

附图2是近红外光谱仪直接获取的原始光谱,不同成熟度翠冠梨的光谱存在差异,部分谱区交叠严重,这是因为翠冠梨的糖、酸等含量发生了变化,从而在近红外光谱的吸收上出现了区别,这是鉴别成熟度的基础,也说明鉴别翠冠梨成熟度是有意义的。利用二阶导数,能有效的消除基线漂移和其他干扰的影响。利用离散小波变换方法,压缩光谱数据,并去除光谱噪声,保留了光谱的主要信息且大大减小了数据量,此步骤需选择合理的小波函数及小波分解层数。

稳健性独立分量分析算法用于分解小波压缩后数据。稳健性独立分量分析算法是盲源分离算法的一种,为信号盲源分离提供了一种高效率的方法,目的是将混合信号中的独立成分分离出来,该类算法的主要优点在于可以选取最佳步长以及任何不为零的独立分量,解决了盲源分离信号排序问题,提升了鲁棒性。用于光谱数据矩阵分解时,可以得到独立成分矩阵和相应的近似浓度矩阵。独立成分矩阵的每一行相当于一种统计独立成分的光谱信息,及混合物样品中的纯物质信息,是光谱的基本成分矩阵。与其对应的近似浓度矩阵反映了该物质在原始数据中所占比重,即该独立分量对整个样品近红外光谱的贡献。

PSO-RICAELM是粒子群寻优极限学习机网络。ELM属于前馈神经网络,学习训练速度快,设置参数少,可以较大程度的减少人为误差。将经过稳健性独立分量分析算法处理后的光谱作为输入到ELM网络中,得到精度更高、更稳定的RICAELM模型。RICAELM输入层权值和隐含层偏差随机输入,采用PSO寻优,得到分类精度更高、更稳定、泛化能力更好的模型。实施中,应用PSO-RICAELM算法,将隐含层神经元个数初始设定为10,并以d=2为步长依次增加至24,在各隐含神经元取值下重复训练15次,得到最佳模型的模型参数,从而获得最佳PSO-RICAELM模型。

实施例:

1.样品收集与光谱采集

试验样品来自某标准化果业园,在样品正常成熟期前一周开始采摘样品,挑选中等大小,色泽相近且无病虫害和机械损伤的翠冠梨36个,每隔6天采摘一次样品,共采摘四次样品;采摘的样品在当天内完成实验,用光谱仪对样品扫描三次取平均值;采谱完成后,得到四种不同成熟度的样品光谱共144条光谱数据,将所有数据用K/S算法按3:1数量比划分为校正集样品和预测集样品。光谱采集仪器是型号为MCS600的德国蔡司光谱仪。谱区采集范围:800nm-1700nm,实验均在室温下进行。实验中对每个样品3次不同位置的扫描,取其平均光谱。模型建立软件基于Matlab2015a进行。

2.光谱数据处理

对采集到的光谱进行二阶导数处理,消除基线漂移和背景光的干扰。

对处理过的光谱进行离散小波变换,压缩数据。小波基函数选择db2,分解至4层,压缩后数据约占原数据量的7%,且压缩后数据包含了原始数据的大部分信息。

用稳健性独立分量分析算法分解压缩后的矩阵。稳健性独立分量分析算法中需设置独立分量数,将独立分量数的初始值设为5,为找到最佳独立分量数,以1为步长依次将独立分量数增加至20,并进行分析,得到独立分量最优值为12。根据独立分量值,使用稳健性独立分量分析算法分解压缩后矩阵得到了基本成分光谱矩阵和对应的近似浓度矩阵

3.建立PSO-RICAELM模型

将四种翠冠梨的实际成熟度以及它们的近似浓度矩阵作为分析模型,使用PSO-RICAELM方法建立分析模型;在建立模型过程中,PSO的各参数如下:设定粒子数m=20,学习因子c1=1.5和c2=1.5、最大迭代次数k=200,最小精度b为0.01。应用PSO-RICAELM算法,将隐含层神经元个数初始设定为10,并以d=2为步长依次增加至24,在各隐含神经元取值下重复训练15次,得到最佳模型的模型参数,从而获得最佳PSO-RICAELM分析模型。

4.结果与分析

采用正确识别率(CAR)为所建定性模型的评价指标:

正确识别率=正确识别的样本个数/应当被识别的总个数。

经验证,经粒子寻优后,模型预测能力增加,准确率从88.9%增加到94.4%,从而验证了PSO-RICAELM模型的正确性。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号