公开/公告号CN105806803A
专利类型发明专利
公开/公告日2016-07-27
原文格式PDF
申请/专利权人 潘涛;广州讯动网络科技有限公司;
申请/专利号CN201610149509.1
申请日2016-03-15
分类号
代理机构北京市盈科律师事务所;
代理人马丽丽
地址 510000 广东省广州市天河区中山大道西89号B栋806-812房
入库时间 2023-06-19 00:11:02
法律状态公告日
法律状态信息
法律状态
2023-07-28
专利权的转移 IPC(主分类):G01N21/359 专利号:ZL2016101495091 登记生效日:20230714 变更事项:专利权人 变更前权利人:潘涛 变更后权利人:广东中塔讯科技有限公司 变更事项:地址 变更前权利人:510000 广东省广州市天河区中山大道西89号B栋806-812房 变更后权利人:510000 广东省广州市天河区岑村红花岗西街66号A95室 变更事项:专利权人 变更前权利人:广州讯动网络科技有限公司 变更后权利人:
专利申请权、专利权的转移
2019-07-02
授权
授权
2016-08-24
实质审查的生效 IPC(主分类):G01N21/359 申请日:20160315
实质审查的生效
2016-07-27
公开
公开
技术领域
本发明涉及近红外光谱技术领域,具体涉及近红外光谱仪器设计与分析建 模中多指标协同分析波长组合及其选择方法。
背景技术
近红外光是介于可见光与中红外光之间的电磁波。随着化学计量学和计算 机技术的发展,现代近红外光谱分析技术以其简便、快速和易于实现在线分析 等优点,在农业、食品、环境、生物医学等领域得到广泛应用。
全波段通用型近红外仪器的技术已经比较成熟、但仪器体积大、价格昂贵, 主要适用于实验室检测,不利于近红外光谱技术的规模化应用。适用于某一特 定领域或任务的小型专用近红外仪器的研发是目前的重要发展方向,其中,信 息波长的优选是关键技术。
发明内容
有鉴于此,有必要针对上述的问题,提供一种多指标协同分析波长组合及 其选择方法。
一种多指标协同分析波长组合的选择方法,包括以下步骤:
S1、信息的采集
利用近红外光谱仪采集样品的光谱数据,并采用标准分析方法测定样品的 各指标理化值。
S2、主特征波长组合的选择
采用有效的多变量分析方法建立每个指标的定标模型。在建模过程中将样 品随机划分为定标样品集、预测样品集。
定标集用于建立近红外定量分析模型,预测集用于评估模型的预测效果; 采用预测均方根误差(RootMeanSquareErrorforPrediction,RMSEP)评价近红 外预测值与实测的理化值之间的误差,其公式如下:
其中,Ci分别为第i个预测样品的预测值和实测值;M为预测样品的个 数;RMSEP值越小说明模型的精度越高。
现以等间隔组合偏最小二乘法(EquidistantCombinationPartialLeastSquares, EC-PLS)为例进行说明。EC-PLS方法对所有等间隔波长组合建立PLS模型, 按照最小RMSEP优选适当的等间隔波长组合。它包括四个参数:起始波长 (InitialWavelength,I)、波长个数(NumberofWavelengths,N)、波长间隔个数 (NumberofWavelengthGaps,G)及PLS因子个数(NumberofPLSFactors,F)。 根据实际情况,分别设置对每一参数组合(I,N,G,F)分 别建立PLS定标预测模型,确定全局最优模型如下:
基于统计学的考虑,最优RMSEP值容许上浮一定的比例(如α,可根据实 际情况设定),对应得到满足条件的s个模型,其参数集合(有效模型)可表示 如下:
Ωα={(I,N,G,F)|RMSEP(I,N,G,F)≤RMSEP*(1+α)},(3)
对应的s个波长组合(有效方案)如下:
其中Nj为第j个波长组合的波长个数。汇总全部s个有效方案的波长(共p个), 并按照它在全部s个有效方案中出现的概率大小排序为:λ1,λ2,…,λp。排在前面 概率大的波长对应了分析指标的特征,其中,前d个波长称为主特征波长。
S3、协同特征波长的选择
设共有K个需要分析的指标,按照步骤S2,基于EC-PLS方法,对应每个 指标的全局最优模型的RMSEP分别为RMSEP*,k,k=1,2,…,K,其参数集合(有效 模型)如下:
在此基础上,得到K个指标协同分析的有效模型如下:
对应的t个波长组合(方案)如下:
其中Ni为第i个波长组合的波长个数。汇总全部t个有效方案的波长(共q个), 并按照它在全部t个有效方案中出现的概率大小排序为:μ1,μ2,…,μq。排在前 面概率大的波长对应了协同分析的特征,其中,前e个波长称为协同特征波长。
S4、多指标协同分析波长组合的确定
设根据步骤S2得到的对应第k个指标的主特征波长组合如下:
设根据步骤S3得到的对应K个指标协同分析的协同特征波长组合如下:
Δ={μ1,μ2,…,μe},(9)
则本发明中多指标协同分析波长组合如下:
采用式(10)的波长组合对每个指标建立PLS定标预测模型,多指标综合RMSEP 值最小的模型对应的波长组合为多指标协同分析波长组合。
优选地,EC-PLS方法的参数设置为
I∈I={400,402,...,2498},N∈N={1,2,...,1050},G∈G={1,2,...,50},F∈F={1,2,...,30}, 并可根据实际情况进行调整。
优选地,参数αk设置为0.01≤αk≤3,并可根据实际情况进行调整。
优选地,步骤S2中每个指标的主特征波长的个数dk设置为1≤dk≤10,并可 根据实际情况进行调整。
优选地,步骤S3中协同特征波长的个数e设置为1≤e≤100,并可根据实际 情况进行调整。
优选地,本发明中指标个数为1~6个。
优选地,本发明中样品的种类为一种或两种以上。
优选地,步骤S1中采集的光谱数据为全波段光谱数据。
优选地,收集的样品数量为50~1000个。
多指标协同分析波长组合,包括主特征波长组合和协同特征波长组合;所 述主特征波长组合由每个指标的主特征波长组成,每个指标的主特征波长为出 现概率最高的数个波长;所述协同特征波长组合为多个指标中都出现的大于一 定概率的满足一定条件的多个协同特征波长的组合。
与现有技术相比,本发明具有以下的优点:
(1)本发明是针对一类样品的多个指标同时进行近红外检测的最优协同分 析波长组合的筛选方法,例如可筛选同时满足饲料原料中粗蛋白、水分、粗脂 肪近红外检测的最优协同波长组合,较现有只能针对单个指标进行筛选的技术 应用范围更加广泛并节省成本。
(2)本发明方法能够大大减少波长个数和模型复杂度,筛选得到的波长组 合所建模型和全波段波长所建模型的性能指标相近,筛选得到的波长组合完全 可以胜任多指标的近红外检测,为近红外光谱仪的小型化和专用化奠定了基础。
附图说明
图1为本发明实施例1中100个玉米粉的样品近红外光谱图。
图2为本发明实施例2中1000个豆粕的样品近红外光谱图。
图3为本发明实施例2中320个玉米粉的样品近红外光谱图。
具体实施方式
下面结合实施例和附图对本发明作进一步详细的描述,但本发明的实施方 式不限于此。
实施例1
本实施例以玉米粉的粗蛋白、水分和粗脂肪的近红外透射光谱分析为例, 说明本发明所提出的一种多指标协同分析的协同波长组合及其选择方法。光谱 采集仪器为Nexus870傅里叶变换近红外光谱仪(Nicolet公司),其近红外波段 为:9997~3996cm-1,扫描次数为32,室内温度为25±1℃,湿度为46±1RH。
S1、对100个玉米粉样品进行测试,得到光谱数据和样品粗蛋白、水分和 粗脂肪指标的理化值。粗蛋白测定方法参考国家标准GB/T6432-94;水分测定方 法参考国家标准GB/T6435-2006;粗脂肪测定方法参考国家标准GB/T14772-93。 表1和图1分别为100个玉米样品的理化值统计分析和光谱图。
表1玉米样品化学值统计分析
从100个样品中随机挑选出50个样品为定标样品集,余下50个样品为预 测样品集。定标样品集用于建立近红外光谱分析模型;预测样品集用于评估模 型的定量预测效果。以RMSEP(RootMeanSquareErrorofPrediction,预测均方 根误差)为评价指标,RMSEP为近红外光谱检测技术预测值与常规方法检测的 理化值之间的误差,RMSEP值越小说明模型的精度越高。RMSEP的公式如下:
其中,为第i个样品的预测值;Ci为第i个样品的实测值;M为总样品的 个数。
S2、采用EC-PLS方法分别建立每个指标的分析模型,按照最小RMSEP优 选适当的等间隔波长组合。其中, I∈I={3996,4011,...,9997},N∈N={1,2,...,200},G∈G={1,2,...,30},F∈F={1,2,...,30}, 建模过程中,从100个样品中随机挑选出50个样品为定标集,余下样品为预测 集,最优EC-PLS模型的结果汇总如表2。
表2外部EC-PLS结果汇总
基于统计学的考虑,将玉米粗蛋白、水分、粗脂肪的最优RMSEP值上浮, 其α同时设为0.379,对应得到满足条件的62188个模型及波长组合(有效方案); 汇总全部62188个有效方案的波长(共390个),并按照它在全部62188个有效 方案中出现的概率大小排序为:λ1,λ2,…,λ390。排在前面概率大的波长对应了分 析指标的特征,其中,前9个波长称为主特征波长。具体波长如下:5307、5477、 5539、5662、5755、5863、5955、6048和6279(cm-1),其中粗蛋白的主特征波 长为:5477、5662和5755(cm-1);水分的主特征波长为:5307、6048和6279 (cm-1);粗脂肪的主特征波长为:5539、5863和5955(cm-1)。
S3、共有3个需要分析的指标,按照步骤S2,基于EC-PLS方法,对应每 个指标的全局最优模型的RMSEP分别为RMSEP*,k,k=1,2,3,其中α1=0.593、 α2=1.00、α3=1.586;其中α1为玉米粗蛋白指标,α2为玉米水分指标,α3为玉米 粗脂肪指标;参数集合(有效模型)如下:
在此基础上,得到3个指标协同分析的有效模型如下:
对应的53425个波长组合(有效方案)如下:
汇总全部53425个有效方案的波长(共390个),并按照它在全部53425个有效 方案中出现的概率大小排序为:μ1,μ2,…,μ390。排在前面概率大的波长对应了 协同分析的特征,其中,前91个波长称为协同特征波长,组成协同特征波长集。
根据备选条件和式(10)从协同特征波长集中挑选出协同特征波长组合与主 特征波长组合组成协同分析波长组合,列出所有满足条件的协同分析波长组合, 备选条件设置为:总波长个数N’:17<N’<50,协同波长的间隔数G’:G’≥2。在 此条件下,得到4816组协同特征波长组合,也即具有4816组协同分析波长组 合。
S4、对玉米粉的3个指标分别计算这4816种协同分析波长组合的外部直接 PLS结果。根据三个指标的综合RMSEP值,挑选出RMSEP最小的模型,该模 型的协同分析波长组合有18个波长点,这18个波长点组合为:4582、4752、 4798、4891、5076、5122、5199、5246、5276、5307、5477、5539、5662、5755、 5863、5955、6048和6279(cm-1)。
为了验证本实施例中所选的波长组合的建模效果,发明人进行了以下对比 试验。采用外部直接PLS建模方法,分别利用全波段波长、步骤S4选出的协同 分析波长组合建立近红外预测模型,以RMSEP为模型的性能指标考察优选的波 长组合的建模效果,结果见表3-4。
表3全谱外部直接PLS结果汇总
表4各指标协同波长组合外部直接PLS结果汇总
由表3和表4可见,由本发明方法优选出的18个波长点针对玉米粉中粗蛋 白、水分和粗脂肪三个指标直接PLS所建立的预测模型,其RMSEP分别为: 0.316、0.240、0.241(%);与全波段直接PLS所建模型的性能指标相近;通过 此方法优选的波长个数下降了95.4%{(390-18)/390×100%}。因此该方法所选 取的18个波长点完全可胜任玉米粉3个指标的近红外检测,大大减少的波长个 数和模型复杂度,为小型、专用型近红外光谱检测设备研制提供依据。
实施例2
本实施例以豆粕和玉米粉的粗蛋白、水分的近红外漫反射光谱分析为例, 说明本发明所提出的一种多样品多指标协同分析的波长选择方法具体步骤。
光谱采集仪器为SupNIR2700近红外光谱仪,其近红外波段为1000~ 1799nm,扫描次数为30,室内温度为25±1℃,湿度为46±1RH。
S1、对1000个豆粕和320个玉米粉两种样品进行测试,得到光谱数据和样 品的粗蛋白、水分的化学值。粗蛋白测定方法参考国家标准GB/T6432-94;水分 测定方法参考国家标准GB/T6435-2006;图2为1000个豆粕样品的光谱图,图 3为320个玉米样品的光谱图。
S2、采用EC-PLS方法分别建立每个指标的分析模型,按照最小RMSEP优 选适当的等间隔波长组合。其中, I∈I={1000,1001,...,1799},N∈N={1,2,...,200},G∈G={1,2,...,30},F∈F={1,2,...,30}, 建模过程中,定标集和预测集的划分见下表5;豆粕玉米样品化学值统计分析见 表6;最优EC-PLS模型的汇总表如表7。
基于统计学的考虑,将豆粕粗蛋白、豆粕水分、玉米粗蛋白和玉米水分的 最优RMSEP值上浮,其α同时设为0.119,对应得到满足条件的60387个模型 及波长组合(有效方案);汇总全部60387个有效方案的波长(共800个),并 按照它在全部60387个有效方案中出现的概率大小排序为:λ1,λ2,…,λ800。排在 前面概率大的波长对应了分析指标的特征,其中,前8个波长称为主特征波长, 具体波长如下:1369、1391、1447、1549、1598、1607、1672和1677(nm), 其中豆粕粗蛋白的主特征波长为:1369和1607(nm);豆粕水分的主特征波长 为:1447和1677(nm);玉米粗蛋白的主特征波长为:1391和1598(nm);玉 米水分的主特征波长为:1549和1672(nm)。
表5样品集划分表
表6豆粕玉米样品化学值统计分析
表7外部EC-PLS结果汇总
S3、共有4个需要分析的指标,按照步骤S2,基于EC-PLS方法,对应每 个指标的全局最优模型的RMSEP分别为RMSEP*,k,k=1,2,...4,,其中α1=0.865、 α2=1.77、α3=1.50、α4=0.33;其中α1为豆粕粗蛋白指标,α2为豆粕水分指标,α3为玉米粗蛋白指标,α4为玉米水分指标;参数集合(有效模型)如下:
在此基础上,得到4个指标协同分析的有效模型如下:
对应的54070个波长组合(方案)如下:
汇总全部54070个有效方案的波长(共800个),并按照它在全部54070个有效 方案中出现的概率大小排序为:μ1,μ2,…,μ800。排在前面概率大的波长对应了 协同分析的特征,其中,前90个波长称为协同特征波长,组成协同特征波长集。
根据备选条件和式(10)从协同特征波长集中挑选出协同特征波长组合与主 特征波长组合组成协同分析波长组合,列出所有满足条件的协同分析波长组合, 备选条件设置为:总波长个数N’:9<N’<50,协同波长的间隔数G’:G’≥20。在 此条件下,得到20774组协同分析波长组合,即具有20774组协同分析波长组 合。
S4、对豆粕粗蛋白、豆粕水分、玉米粗蛋白和玉米水分4个指标分别计算 20774种组合的外部直接PLS结果。根据4个指标的综合RMSEP值,挑选出 RMSEP最小的模型,该模型的协同波长组合有15个波长点,这15个波长点组 合为:1369、1391、1414、1447、1471、1495、1524、1549、1573、1598、1607、 1631、1651、1672和1677(nm)。
为了验证本实施例中所选的波长组合的建模效果,发明人进行了以下对比 试验。采用直接PLS建模方法,分别利用全波段波长、步骤S4选出的协同波长 组合建立近红外预测模型,以RMSEP为模型的性能指标考察优选的协同波长组 合的建模效果,结果见表8、表9。
表8全谱外部直接PLS模型性能指标
表9各指标协同波长外部直接PLS模型性能指标
由表8和表9可见,由该方法优选出的15个波长点针对豆粕、玉米粉中粗 蛋白、水分4个指标直接PLS所建立的预测模型,与全波段直接PLS所建模型 的性能指标相近;通过此方法优选的波长个数下降了98.1%{(800-15) /800×100%}。因此该方法所选取的15个波长点完全可胜任豆粕和玉米粉4个指 标的近红外检测,大大减少的波长个数和模型复杂度,为小型、专用型近红外 光谱检测设备研制提供依据。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细, 但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域 的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和 改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附 权利要求为准。
机译: 样品(变体)中一种或多种分析物的特异性检测方法,样品中至少一种细胞类型或有机物的鉴定或价值的方法,样品中至少一种分析物的存在或价值的检测方法,方法跟踪细胞或有机体的方法,用于识别或评估潜在药物制剂的指标
机译: 一种用于一种或多种药物引起的针对CYP 450生物活化介导的肝毒性的协同治疗的协同组合物
机译: 用于蛋白质二级结构分析的计算波长范围选择方法