公开/公告号CN112861411A
专利类型发明专利
公开/公告日2021-05-28
原文格式PDF
申请/专利权人 国能生物发电集团有限公司;华北电力大学;
申请/专利号CN201911181178.X
申请日2019-11-27
分类号G06F30/27(20200101);G06N3/04(20060101);G06K9/62(20060101);G01N21/359(20140101);G06F111/10(20200101);
代理机构
代理人
地址 100083 北京市朝阳区北沙滩1号院37号楼
入库时间 2023-06-19 11:08:20
技术领域
本发明属于生物质大数据分析领域,涉及到一种对生物质原料中的钠进行快速准确的测量方法。
背景技术
生物质的利用属于废物利用并且不限制在一个方面,生物质燃料的钠对锅炉的运行起着至关重要的影响,对生物质钠含量的检测一般采用原子吸收法,按照国家标准(GB/T30725-2014)对样品进行灰化处理,灰样经氢氟酸、高氯酸分解,处于盐酸介质中,采用空气-乙炔火焰进行原子吸收测定。此法虽然准确,但是须破坏生物质样品,所需时间较长,工艺复杂,难以实现实时在线测量。
专利CN 102095702 A中使用二阶导数对数据进行预处理,利用偏最小二乘法进行数据建模,该方法没有考虑实时测量时环境的影响作用。本发明则采用Chauvenet检验法是一个以正态分布为中心的范围的检验法,去量钢化,对于生物质的高斯形态的元素分布特性,采用支持向量机模型进行预测,相对来说比较科学实用。
专利CN 105954228 A中提供了一种基于近红外光光谱对黄瓜表皮农药残留的鉴别方法,采用主成分分析来对数据进行预处理,采用偏最小二乘法建立模型进行预测,该方法没有考虑实时测量时环境的影响作用。支持向量机模型计算量相对较小,运行迅速,模型准确。
发明内容
本发明提出的基于近红外光谱主成分和神经网络的生物质钠含量测量与建模方法提供了一种可以实现在线实时测量、充分考虑测量环境影响、非接触式快速测量方法。
为实现所述发明目的,本发明包含以下特征:
基于近红外光谱主成分和神经网络的生物质钠含量测量与建模主要包括红外光谱的测量、生物质钠含量测量、状态参数测量、主成分分析及支持向量机建模方法。
主要包含以下几个步骤:
(1)生物质原始数据采集:依据标准(如:国家标准GB/T 30725-2014)对生物质钠含量进行测量;利用近红外光谱仪器(波长范围为:1200~3000nm)对生物质样本测量,获得样本的红外光谱数据;测量红外数据采集时的环境温度、压力、红外传感器探头距离样品的距离、环境光强等状态参数。
(2)样本集的划分:采用随机分类的方法,选取30%~70%的样本作为训练样本集,其余数据作为验证样本集。训练样本集用来训练神经网络模型,验证样本集则用来检测所建立的神经网络模型是否准确。
(3)异常数据去除:本发明中采用Chauvenet检验法对数据进行异常数据处理,将异常数据从数据集中移除,剔除数据的粗大误差,增强后来数据建模的精确性。
(4)红外光谱数据预处理:本发明采用主成分分析方法,将红外数据各波长的测量数据进行主成分分析,获得主成分表达式和主成分数值。利用主成分对预处理后的数据进行降维后,选取贡献率大于80%的成分作为主成分,去除数据的重复性和共线性,减少数据计算量并且保证数据原始特征。
(5)建立神经网络模型:将经预处理后的红外光谱的主成分数据,以及状态参数数据作为支持向量机神经网络的输入参数,将生物质钠含量测量值作为神经网络输出参数,采用训练样本集对建立的神经网络进行训练,当误差小于0.1%时,完成优化训练过程,获得最优的网络结构和参数。
(6)验证模型准确性:采用验证样本集中的红外光谱数据和状态参数数据作为步骤(5)已训练收敛的支持向量机神经网络的输入,将神经网络的输出值与验证样本集中生物质钠的测量值进行对比,验证模型的准确性。
本发明的有益效果包括:对不同状态下的生物质燃料进行了钠测量,对生物质燃料的种类也不限制,使用PCA-SVM的方法对近红外光谱进行建模得到对钠精确、快速、方便快捷的检测方法。
附图说明
图1为本发明的流程图。
具体实施方案
下面对上述步骤进行具体实施方案的详细描述,本发明中的案例包括,但是不限于本案例。
(1)生物质原始数据测量:选取100组生物质样本,对不同状态的生物质原料进行红外数据测量,获取40000组红外数据,将数据进行平滑去噪处理,记录近红外光谱数据采集时的环境温度、压力、红外传感器距离样品的距离,环境光强等状态参数数据,依据标准(如:国家标准GB/T 30725-2014)对生物质钠含量进行测量。
(2)样本集的划分:将采集的40000组红外数据和对应的状态参数随机分类,分为训练样本集和验证样本集,其中20000组作为训练样本集数据,20000组作为验证样本集数据,训练样本集用来训练神经网络模型,验证样本集则用来检测所建立的神经网络模型是否准确。
(3)异常数据去除:采用Chauvenet检验法去除异常数据,将异常数据从数据集中移除,剔除数据的粗大误差,得到剔除异常数据的训练样本集S增强后来数据建模的精确性。
(4)红外光谱数据预处理:将S作为主成分分析的输入数据进行分析,求取S的相关矩阵C,求得相关矩阵C的特征值,贡献率等于成分特征值与特征值之和的商,得到累计贡献率,选取累计贡献率大于80%的成分作为主成分,得到主成分矩阵F,对数据进行降维,去除数据的重复性和共线性,防止拟合过度等情况,减少数据计算量并且保证数据原始特征。
(5)建立神经网络模型:将经预处理后的红外光谱的主成分矩阵F,以及状态参数数据作为支持向量机神经网络的输入参数,将生物质钠含量测量值Y作为神经网络输出参数,采用训练样本集对建立的神经网络进行训练,当误差小于0.1%时,完成优化训练过程,获得最优的网络结构和参数。
(6)验证模型准确性:用验证集对神经网络模型进行验证,获得钠计算值Y将钠含量测量值与神经网络的预测值Y进行对比,求得预测值和真实值之间的相关系数和均方根误差,来对整体模型快速检测的准确度进行评价。
本发明中的方法,包括但不限于生物质燃料组分的分析测量。
机译: 基于神经网络的近红外光谱层析成像重建方法
机译: 基于神经网络的近红外光谱断层重建方法
机译: 用于区分检测对象的区分装置和方法,电阻率测量装置和电阻率测量方法,成分含量估计装置和成分含量估计方法以及板厚估计装置和板厚估计方法