首页> 中国专利> 一种近红外光谱鉴别平利绞股蓝的方法

一种近红外光谱鉴别平利绞股蓝的方法

摘要

本发明提供一种近红外光谱鉴别平利绞股蓝的方法,包括如下步骤:A、建立平利绞股蓝的近红外光谱鉴别模型:A-1、选择光谱范围4000-12500cm-1,扫描平利绞股蓝近红外光谱图;A-2、对光谱范围4000-9500cm-1的数据进行预处理;A-3、提取主成分;A-4、建立人工神经网络模型:采取人工神经网络算法,根据输入输出数据特点确定神经网络的结构,再利用训练数据训练此神经网络;运用MATLAB软件建立输入层节点10-隐含层节点5-输出层节点2的BP人工神经网络模型;B、未知样品的鉴别:未知样品在相同条件下扫描近红外光谱图,选取主成分数目,依据训练好的神经网络模型来判断未知样品的真伪,输出节点分别用二进制代码表示,10代表是平利绞股蓝,01代表是非平利绞股蓝。

著录项

  • 公开/公告号CN103776797A

    专利类型发明专利

  • 公开/公告日2014-05-07

    原文格式PDF

  • 申请/专利权人 河北大学;

    申请/专利号CN201410065240.X

  • 申请日2014-02-25

  • 分类号G01N21/359(20140101);

  • 代理机构13115 石家庄汇科专利商标事务所;

  • 代理人王琪

  • 地址 071002 河北省保定市五四东路180号

  • 入库时间 2024-02-19 23:36:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-02-15

    未缴年费专利权终止 IPC(主分类):G01N21/359 授权公告日:20160921 终止日期:20180225 申请日:20140225

    专利权的终止

  • 2016-09-21

    授权

    授权

  • 2014-06-04

    实质审查的生效 IPC(主分类):G01N21/359 申请日:20140225

    实质审查的生效

  • 2014-05-07

    公开

    公开

说明书

技术领域

本发明涉及一种近红外光谱鉴别平利绞股蓝的方法,尤其涉及一种用近红外光谱技术结合人工神经网络算法鉴别平利绞股蓝的方法,属于近红外光谱检测分析领域。 

背景技术

绞股蓝,又称七叶胆和七叶参等,具有降血压,降血脂,降血糖,护心保肝,调脂减肥,有“不老长寿药草”的称谓。自2004国家质检总局对陕西平利绞股蓝实施原产地地域保护以来,平利绞股蓝的身价倍增,市场上以次充好、假冒伪劣现象时有发生,为有效识别不同产地的平利绞股蓝,保护消费者的权益,建立高效绞股蓝产地识别技术势在必行。 

近红外光谱具有反应速度快、信息量丰富、预处理少、不污染环境等优点,已在很多领域得到广泛应用,成为目前研究最热门的光谱分析技术之一。近红外光谱包含了样品的大量信息,因此,将近红外分析技术与模式识别方法相结合,将能更有效地对样品进行等级和类属的判别。近红外模式识别技术是应用化学模式识别的方法从物质的近红外数据推知物质归属的技术。化学模式识别的所有方法都可用于 近红外模式识别的研究。目前,基于近红外的模式识别技术已被广泛应用于农业、医药、食品、石油等领域,在真假判别、等级分类、原产地鉴定等方面发挥了重要的作用。但模式识别建立的识别模型都是针对特定产品,特异性较强。申请人已采用采用近红外光谱法结合马氏距离算法,及合格性测试有效鉴别了响水大米;利用fisher判别算法成功鉴别初榨橄榄油及油橄榄果渣油。本发明基于近红外光谱技术结合人工神经网络算法鉴别平利绞股蓝。目前,国内外学者对绞股蓝的研究主要集中在化学成分和其药理作用上进行研究。其主要含有皂苷[1]、多糖[2]和氨基酸[4]、黄酮类[3]、有机酸和微量元素[4]等多种化学成分。这些报道证实不同产地绞股蓝的成分是存在差异的,因此这些方法对于鉴别不同产地的绞股蓝真伪有一定参考价值,但目前未见利用其成分差异进行平利绞股蓝的鉴别真伪的报道。 

发明内容

本发明的目的在于提供一种本发明的目的在于提供一种快速、准确的用近红外光谱技术结合人工神经网络算法鉴别平利绞股蓝真伪的方法。 

本发明的技术方案是:这种近红外光谱鉴别平利绞股蓝的方法,包括如下步骤: 

A、建立平利绞股蓝的近红外光谱鉴别模型 

A-1、选择光谱范围4000-12500cm-1,扫描平利绞股蓝近红外光谱 图; 

A-2、对光谱范围4000-12500cm-1的数据进行预处理; 

A-3、提取主成分; 

A-4、建立人工神经网络模型:采取人工神经网络算法,根据输入输出数据特点确定神经网络的结构,再利用训练数据训练此神经网络,得到平利绞股蓝的鉴别模型; 

B、未知样品的鉴别 

未知样品在相同条件下扫描近红外光谱图,选取主成分数目,依据训练好的神经网络模型来判断未知样品的真伪,输出节点分别用二进制代码表示,10代表是平利绞股蓝,01代表是非平利绞股蓝。 

所述的近红外光谱鉴别平利绞股蓝的方法,步骤A-1所述的扫描平利绞股蓝近红外光谱图包括:将有效量的平利绞股蓝样品干燥粉碎后均匀置于石英样品池中,使用傅立叶近红外光谱仪进行吸收光谱扫描;扫描模式为旋转漫反射,分辨率为8cm-1,每个样本扫描多次,取平均光谱为样本最终的分析光谱; 

所述的近红外光谱鉴别平利绞股蓝的方法,步骤A-2所述的平利绞股蓝近红外光谱图数据预处理包括:对绞股蓝样本光谱进行多元散射校正+适量归一化的预处理,通过该处理消除样品不均匀、光散射及仪器噪声等干扰因素的影响,提高模型的预测精度和稳定性。 

所述的近红外光谱鉴别平利绞股蓝的方法,步骤A-3所述的提取 主要成分是通过主成分分析方法对光谱图信息进行降维,取前10个主成分累计贡献率为99.99%,有限量的输入减少模型的计算复杂度,提高模型的预测精度。 

所述的近红外光谱鉴别平利绞股蓝的方法,步骤A-4所述的平利绞股蓝建立人工神经网络模型包括运用MATLAB软件建立输入层节点10-隐含层节点5-输出层节点2的BP人工神经网络模型: 

A-4-1、输入层节点数的确定:取10个主成分得分为参数,确定网络的输入层节点为10; 

A-4-2、隐层节点数的确定:用下公式求出: 

L=0.43mn+0.12n2+2.54m+0.77n+0.35+0.51

其中m、n分别为输入节点与输出节点数目,隐层节点数目可以由公式得到一个初始值,然后利用逐步增长法修正,得到经验值5; 

A-4-3、输出层节点数的确定:按照判断绞股蓝样品是属于平利产地还是属于非平利产地两种结果,确定神经网络的输出节点为2个。 

所述的近红外光谱鉴别平利绞股蓝的方法,所述样本的主成分由如下方法确定: 

设x1,x2,…,xn为取自总体x的样本,其中xi=(xi1,xi2,…,xip)′(i=1,2,…n); 

记样本观测值矩阵为: 

X=x11x12...x1px21x22...x2p.........xn1xn2...xnp

x的每一行对应一个样品,每一列对应一个变量; 

记样本协方差矩阵和样本相关系数矩阵分别为: 

S=1n-1Σi=1n(xi-x)(xi-x)=(sij)

R^=(rij),rij=sijsiisjj

其中,为样本平均值; 

将S作为Σ的估计,作为R的估计,从S或出发可求得样本的主成分。 

所述的近红外光谱鉴别平利绞股蓝的方法,其特征在于:所述样本的主成分由从样本相关系数矩阵出发求解: 

设为的p个特征值,为相应的正交单位特征向量,则样本的p个主成分为 

y^*=t^i*x*,i=1,2,...,p

将样品xi标准化后的观测值代入第j个主成分,即可得到样品xi的第j主成分得分 

y^ij*=t^j*xi*(i=1,2,...,n;j=1,2,...,p).

本发明选择光谱范围4000-9500cm-1,根据原始光谱分析,该区间的包含了绞股蓝样品主要近红外吸收的特征峰,对绞股蓝样本光谱 进行多元散射校正+矢量归一化的预处理,消除样品不均匀、光散射及仪器噪声等干扰因素的影响,提高神经网络模型的预测精度和稳定性;本发明提取前10个主成分的主成分得分作为新变量输入,有限量的输入减少模型的计算复杂度,提高了模型的预测精度;能够快速实现鉴别平利绞股蓝的真伪,模型训练集和预测集判别正确率为100%。据此建立的判别模型对于实现平利绞股蓝的真伪判别意义重大。 

附图说明

图1神经网络结构图 

图中各字母表示: 

xj表示输入层第j个节点的输入,j=1,…,M;ij 

wij表示隐含层第i个节点到输入层第j个节点之间的权值; 

θi表示隐含层第i个节点的阈值; 

Φx表示隐含层的激励函数; 

wkj表示输出层第k个节点到隐含层第i个节点之间的权值,i=1,…,q;ka表 

ak表示输出层第k个节点的阈值,k=1,…,L; 

Ψx表示输出层的激励函数; 

0k表示输出层第k个节点的输出。 

图2平利绞股蓝近红外光谱图 

图3前十个主成分得分的累积贡献率 

图4是神经网络计算实现的程序图 

具体实施方式

下面结合附图和具体实施方式对本发明作进一步详细的说明。 

1、仪器及试剂:使用德国布鲁克公司的MPA近红外光谱仪及漫反射附件采集样品光谱,仪器自带分析软件及MATLAB软件。 

1-1、仪器噪声 

配置稳压电源,开机预热至仪器充分稳定,保证合适的测试环境温度15-25℃; 

1-2、波长准确度和重现性 

用低压汞灯和质量分数为0.005%的亚甲基蓝溶液校正波长的准确性,防止漂移。 

2、样品制备及光谱扫描:绞股蓝样品均在产地购买。 

表1 绞股蓝样品信息表 

3、建立地理标志绞股蓝的近红外光谱鉴别模型 

3-1、扫描绞股蓝近红外光谱图 

平利绞股蓝样本在60℃下烘干4小时,粉碎,过60目筛,取约50g样品均匀置于样品池中,使用德国布鲁克公司的MPA近红外光谱仪及漫反射附件采集样品的旋转漫反射光谱,如图2所示。仪器光源为20W钨卤灯,光谱范围为4000-12500cm-1。使用的光谱采集软件为布鲁克公司的OPUS6.5,扫描次数64,分辨率为8cm-1,以仪器的内置背景作为参比。每个样本扫描3次,取3次的平均光谱为样本光谱。 

3-2、对光谱数据进行预处理 

在波段4000-9500cm-1上进行判别模型的建立,用MATLAB软件对样品光谱进行处理,使用多元散射校正+矢量归一化预处理方法处理光谱并使用主成分分析方法对绞股蓝样品光谱进行降维。 

3-3、提取主成分; 

所述的近红外光谱鉴别平利绞股蓝的方法,所述样本的主成分由如下方法确定: 

设x1,x2,…,xn为取自总体x的样本,其中xi=(xi1,xi2,…,xip)′(i=1,2,…n); 

记样本观测值矩阵为: 

X=x11x12...x1px21x22...x2p.........xn1xn2...xnp

x的每一行对应一个样品,每一列对应一个变量; 

记样本协方差矩阵和样本相关系数矩阵分别为: 

S=1n-1Σi=1n(xi-x)(xi-x)=(sij)

R^=(rij),rij=sijsiisjj

其中,为样本平均值; 

将S作为Σ的估计,作为R的估计,从S或出发可求得样本的主成分。 

所述的近红外光谱鉴别平利绞股蓝的方法,其特征在于:所述样本的主成分由从样本相关系数矩阵出发求解: 

设为的p个特征值,为相应的正交单位特征向量,则样本的p个主成分为 

y^*=t^i*x*,i=1,2,...,p

将样品xi标准化后的观测值代入第j个主成分,即可得到样品xi的第j主成分得分 

y^ij*=t^j*xi*(i=1,2,...,n;j=1,2,...,p).

使用MATLAB软件取前10个主成分得分作为网络的输入层节点,图3中前十个主成分累积贡献率达到99.99%,如表2所示。可以代表绞股蓝的绝大部分有效信息,所以采用前十个主成分的得分作为输入层节点参数。 

表2 前十个主成分累积贡献率 

网络的输出点则采用二进制码表示产地的输出,如表3所示把八个产地的样本只分成两大类,一是原产地平利绞股蓝,它用二进制代码10表示;另一类是非原产地绞股蓝,用二进制代码01表示。 

表3 输出节点产地代码 

3-4、人工神经网络模型的建立 

3-4-1、输入层节点数的确定:取10个主成分得分为参数,确定网络的输入层节点为10,样本又分为训练集和预测集,训练集是用来训练神经网络,建立本发明的人工神经网络模型。预测集用来验证本发明网络模型的正确率,如果发现这种方法的准确率达不到要求,就再回头去训练模型,也就是再优化那些参数,直到建立准确的神经网络模型。 

本实施例共采集405个样本,平利产地采集90个样本,其他产地各采集45个样本,将405个样本随机分为训练集和预测集两部分,其中训练集样本数为270个,预测集样本数为135个。 

3-4-2、隐层节点数的确定:用下公式求出: 

L=0.43mn+0.12n2+2.54m+0.77n+0.35+0.51

其中m、n分别为输入节点与输出节点数目,隐层节点数目可以由公式得到一个初始值,然后利用逐步增长法修正,得到经验值5; 

3-4-3、输出层节点数的确定:按照判断绞股蓝样品是属于平利产地还是属于非平利产地两种结果,确定神经网络的输出节点为2个。 

按照图4所示计算程序,确定网络输入层和隐含层的传递函数tansig,输出层传递函数为traingdx函数,训练目标设为1x10-6,网络的学习速率为0.05,设定的训练迭代次数为1000次,隐层节点数为5个。运用MATLAB软件建立输入层节点10-隐含层节点5-输出层节点2的BP人工神经网络模型。 

4、未知样品鉴别 

4-1、样品处理:取约50g未知样品在60℃下烘干4小时,粉碎,过60目筛,均匀置于样品池中,采集样品的旋转漫反射光谱。光谱范围为4000-12500cm-1,扫描次数64,分辨率为8cm-1,以仪器的内置背景作为参比。每个样本扫描3次,取3次的平均光谱为样本光谱。 

4-2、神经网络识别模型 

选取未知样品光谱范围4000-9500cm-1内近红外光谱图,采用多元散射校正+矢量归一化预处理方法处理,使用MATLAB软件提取前10个主成分的得分输入判别模型,所得模型输出结果若为10则判断为平利绞股蓝,若输出为01则判断为非平利绞股蓝。结果表明,270个训练样品的识别正确率为100%,135个预测样品的识别正确率为100%,具体的验证结果如表4所示。 

表4 人工神经网络对平利绞股蓝识别可行性的判断结果 

上述描述仅作为本发明近红外光谱鉴别平利绞股蓝的方法可实施的技术方案提出,不作为对其技术方案本身的单一限制条件。 

参考文献: 

[1]竹本长松,葫芦科植物的成分研究—绞股蓝的皂甙成分.国外医学中医中药分册第7卷第5期1985年4月 

[2]王昭晶,罗巅辉.碱提绞股蓝水溶性多糖的研究.食品研究与开发第27卷第5期2006年5月 

[3]王青豪、张熊禄.大孔吸附树脂对绞股蓝黄酮类化合物的精制 工艺研究[J]林产化工通讯第39卷第6期2005年6月 

[4]邓世林,周晓娟.绞股蓝中氨基酸、维生素及多种化学元素的分析[J].湖南医科大学学报第19卷第6期1994年6月。 

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号