首页> 中国专利> 一种燃油中芳烃含量快速、准确测定的新方法

一种燃油中芳烃含量快速、准确测定的新方法

摘要

一种燃油中芳烃含量快速、准确测定的新方法,具体过程如下:首先扫描一定数量燃油样本的紫外光谱,并用常规方法测试目标值的含量,作为训练集。然后对训练集的光谱信号依次进行经验模态分解,得到一定数目的本征模态函数(IMF)以及残差项。再将前面高频的IMF加和为高频信号,剩余的IMF以及残差项加和为低频信号。高频信号和低频信号在变量方向展开成一个扩展矩阵,在扩展矩阵与目标检测值之间建立偏最小二乘回归模型。对预测集的紫外光谱进行同样的分解、加和与扩展,代入模型即可预测未知组分的含量。本发明的优势在于引进了自适应的希尔伯特-黄变换方法,同时借鉴展开策略,不仅全面利用的数据信息,还避免了模型参数的选择。

著录项

  • 公开/公告号CN105136682A

    专利类型发明专利

  • 公开/公告日2015-12-09

    原文格式PDF

  • 申请/专利权人 天津工业大学;

    申请/专利号CN201510393882.7

  • 申请日2015-07-06

  • 分类号G01N21/25(20060101);

  • 代理机构

  • 代理人

  • 地址 300387 天津市西青区宾水西道399号

  • 入库时间 2023-12-18 12:40:40

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-11-03

    授权

    授权

  • 2017-10-20

    著录事项变更 IPC(主分类):G01N21/25 变更前: 变更后: 申请日:20150706

    著录事项变更

  • 2016-01-06

    实质审查的生效 IPC(主分类):G01N21/25 申请日:20150706

    实质审查的生效

  • 2015-12-09

    公开

    公开

说明书

技术领域

本方法发明属于质量检测领域,具体涉及燃油(汽油/柴油)中芳烃类化合物含量的测 定方法。

背景技术

随着工业化进程的加快,空气的质量不断恶化,尤其是近年来雾霾现象随来越多,严 重影响了人类身体健康与生命安全。其中机动车的尾气排放是造成雾霾的重要原因,如使 用柴油的大型车是排放细颗粒物的“重犯”,使用汽油的小型车虽然排放的是气态污染物, 但碰上雾天,也很容易转化为二次颗粒污染物,加重雾霾。各国相继发布了有关空气清洁 的环保法规,其中对燃油中易造成大气污染的烯烃、芳烃、苯含量以及添加剂限制越来越 严格。芳烃作为汽油中的高辛烷值组分之一,燃烧会导致尾气中有毒物质的排放,增加发 动机燃烧室的沉积,并使尾气排放增加。根据国家2010年发布GB17930-2011《车用汽油》 技术要求的强制性标准规定,车用汽油中芳烃含量不能超过40%。

芳烃标准检测方法是荧光指示剂法和气相色谱法。其中荧光指示剂法易受硅胶质量、 脱附过程气压、汽油中氧含量、操作人员因素等的影响,测量周期长,测试成本高,结果 重复性较差。气相色谱法虽然测量结果精确,但测试前需要对样品进行预处理,且测量时 间较长(约30分钟),对载气、吸附柱等检测设备和检测环境要求也较高。总之,无论是 检测速度还是检测成本,这两种标准检测方法都难以满足燃油生产企业和用户的需求。光 谱分析技术是近年来发展迅猛的一种检测技术,具有快速、无损、低成本、安全可靠、易 于在线等优势,目前已广泛应用于石化、烟草、医药、食品、环境检测等领域。因此我们 将采用光谱分析技术对燃油中芳烃含量进行快速测定。

然而燃油是各种烃类化合物的混合物,成分复杂,其光谱重叠严重,因此,采用传统 的单变量校正方法无法实现某种烃类化合物含量的测定,需采用多元校正方法对其光谱进 行建模。多元校正方法,尤其是偏最小二乘回归(Partialleastsquaresregression,PLSR)技 术(S.Wold,A.Ruhe,H.Wold,W.J.IIIDunn,Thecollinearityprobleminlinearregression.The partialleastsquares(PLS)approachtogeneralizeinverses,SIAMJ.Sci.Stat.Comput.1984,5: 735-743),已经广泛用于多组分光谱数据分析。但是传统的多元校正方法只通过建立一个 模型就完成对未知样本的预测。这种单一的建模方法所得模型的预测能力、稳定性以及稳 键性在样品数量较少或奇异样本、噪声等存在时得不到满意的预测结果(X.G.Shao,X.H. Bian,W.S.Cai,Animprovedboostingpartialleastsquaresmethodfornear-infrared spectroscopicquantitativeanalysis,Anal.Chim.Acta,2010,666(1-2):32-37)。因此发展了多模 型建模方法,即对每个不同来源的子数据单独建立子模型,再将多个子模型的预测结果融 合得到一个最终结果。多模型建模可以最大限度地利用数据的信息,有效地减少单个模型 中随机因素的影响,因而可以达到更好的预测精度、稳定性与稳健性。

多模型建模方法关键问题之一是子模型产生。目前已经有很多方法从样本方向或者变 量方向产生子模型,前者有Bagging、Subagging和Boosting等方法,后者有Random Subspace、VariableClustering、stacked和Multi-block等方法,但是不论样本方向还是变量 方向都是基于原始数据产生多个子模型。由于样品信号的复杂性,数据中包含了不同的信 息,如果采用数据变换手段把数据序列按照某种方式分解为不同项,再建立模型,可能会 得到更好的预测结果。权重多尺度回归(Z.C.Liu,W.S.Cai,X.G.Shao,Aweightedmultiscale regressionformultivariatecalibrationofnearinfraredspectra,Analyst,2009,134:261-266)就 是这样一类方法,该方法利用小波变换技术将烟草样品的NIR数据分解成一个低频序列以 及多个高频序列,然后这些序列分别建立PLSR模型,不同模型结果加权集成得到最终结 果。然而光谱信号具有非稳态、非线性的特点,小波变换虽然在理论上能处理非线性非平 稳信号,然而实际算法实现中却只能处理线性非平稳信号。小波变换存在的另一个问题是 需要预先选定小波基以及分解尺度等参数,选择不同的小波基或分解尺度可能产生不同的 处理结果,对一组数据最优的参数换一组数据还需要重新优化参数,因此,参数的选择是 难点。希尔伯特-黄变换(Hilbert-HuangTransform,HHT)是Huang等(N.E.Huang,Z.Shen, S.R.Long,M.C.Wu,H.H.Shih,Q.Zheng,TheempiricalmodedecompositionandtheHilbert spectrumfornonlinearandnon-stationarytimeseriesanalysis.P.Roy.Soc.A-Math.Phy., SeriesA,1998,454:903-995)于1998年在经典的Hilbert变换的基础上提出的一种全新的 信号分析理论,具有能够分析非线性非平稳信号,完全自适应(即无需预先选择基函数) 等优点。该方法将原始信号用经验模态分解法(EmpiricalModeDecomposition,EMD)分 解成有限个本征模态函数(IntrinsicModeFunction,IMF)和残差函数,每个IMF经希尔伯 特变换后得到解析信号,从而求得瞬时振幅和瞬时频率,在时间-频率-振幅三维空间中形 成希尔伯特谱。虽然HHT逐步应用到地震信号分析(黄捍东,董月霞,一种时频分解地震 流体识别方法,中国发明专利,2013,ZL201310120561)、机械故障诊断(徐振,李雪云,谢 友龙,许明,孙达山,王祥,郭宁明,一种基于单端故障信息的配电网混合线路组合式测距 方法,中国发明专利,2014,ZL201410147023)、医学信号处理(宋潇鹏,张毅,刘一军,血 样水平依赖性功能磁共振信号震荡频率聚类分析方法,中国发明专利,2014,ZL 201410053308)、语音信号处理(刘洪运,王卫东,用于电子耳蜗的语音处理方法,中国发 明专利,2013,ZL201310328827)等领域,但是在光谱信号建模方面的应用很少,本发明拟 引进HHT对复杂样品的光谱信号进行EMD分解的方式来产生子模型。

多模型建模另一个重要问题是模型预测结果的集成。目前有直接简单平均、加权平均 等方法。直接简单平均有时结果不好,加权平均虽然效果较好,但是权重的选择是个难点, 经过优化的权重对该组数据好,换组数据效果可能就会变差。展开偏最小二乘(参见R.Bro, MultiwaycalibrationmultilinearPLS,J.Chemometr.,1996,10:47-61)的方法是将多组数据构 造成一阶增广矩阵,然后再用一阶算法来计算。如果我们引入展开策略,不是建立多个模 型后在对每个模型赋予权重,而是将光谱利用EMD变成扩展矩阵后,与浓度直接建立模 型,这样,偏最小二乘回归模型计算得到的回归系数相当于给每个模型下的所有变量都赋 予了不同的权重,而不需要对每个子模型外部调整权重。本研究拟将展开策略引入到多模 型建模中,避免了子模型集成时权重选择的难题。

综上,结合希尔伯特黄变换的优势并借鉴展开策略的思路,提出了一种新型的集成建 模方法,即基于经验模态分解的高低频展开的偏最小二乘回归(highandlowfrequency unfoldedpartialleastsquaresregression,HLFUPLSR)方法,结合光谱分析技术,拟建立燃 油中芳烃组分的准确、快速定量分析的方法。

发明内容

本发明的目的是针对上述存在问题,提供一种用于燃油中芳烃含量准确、快速的定量 分析方法,过程如图1所示。该方法通过基于经验模态分解的高低频展开的偏最小二乘回 归方法来提高分析的准确性,通过光谱分析技术来提高分析的速率。具体步骤如下:

(1)收集m个待测燃油样品。设定光谱参数,采集样本的紫外光谱,得到样本的光 谱矩阵Xm×p。用常规方法测定样本的被测成分含量,得到浓度向量ym×l。采用一定分组方 式将数据分为训练集和预测集,其中训练集光谱用X1m1×p,训练集浓度用y1ml×l表示,预 测集光谱用X2m2×p,预测集浓度用y2m2×l表示。其中训练集样本用来建立模型并优化参数, 预测集样本用来检验模型的预测能力。

(2)对训练集中每个样品的光谱向量依次进行经验模态分解(EMD),每个光谱得到 n个IMF1×p以及1个残差向量r1×p,m1个训练集的光谱数据可以得到n个IMFm1×p矩阵以 及1个残差矩阵rm1×p,具体分解步骤如下:

①对光谱向量x,首先确定其所有的极大值点和所有的极小值点,然后对于所有的极 大值点和所有的极小值点进行插值,即得到信号的上包络线U和下包络线L,计算出它们 的平均包络线:

m1=L+U2---(2.1)

②计算初始模式函数:

h1=x-m1(2.2)

③判断h1是否满足IMF,不满足则将h1作为原始信号函数,重复步骤①-③求出

m11=L1+U12---(2.3)

重复②步骤计算求出

h11=h1-m11(2.4)

判断h11是否满足IMF,经过k次判断后

h1k=h1(k-1)-m1k(2.5)

满足IMF,记

c1=h1k(2.6)

则c1为的第一个IMF分量记作IMF1。

④计算残余分量

r1=x-c1(2.7)

⑤r1作为原始信号函数,重复①-④步骤得到第二个IMF分量c2记作IMF2,残余分 量r2

⑥计算:

r2=r1-c2(2.8)

⑦同样可以得到第三个、第四个……IMF分量,则残余分量有:

r3=r2-c3(2.9)

r4=r3-c4(2.10)

……

rn=r(n-1)-cn(剩余函数曲线)(2.11)

直到残余分量rn为单调函数不能再提出IMF分量为止,此时EMD分解结束。rn为残 余函数,表示信号的整体趋势。

(3)根据分解得到的n个IMF分量以及残差r的频率特点,把前i个IMF矩阵加和 为高频矩阵,记为HFX1m1×p,后面i+1到n个IMF矩阵以及残差矩阵加和为低频矩阵,记 为LFX2m1×p

(4)将高频矩阵HFX1m1×p和低频矩阵LFX1m1×p沿变量方向扩展为训练集扩展矩阵 HLFX1m1×2*p=[HFX1LFX1]。

(5)在HLFX1m1×2*p与训练集浓度y1ml×l之间建立偏最小二乘回归(PLSR)模型, 得到回归系数b。其中PLSR的因子数通过蒙特卡罗交叉验证得到的RMSECV随着因子数 的变化图确定,选取RMSECV最小值对应的因子数为最佳因子数。

(6)对预测集光谱进行(2)-(4)步骤同样的处理,得到预测集扩展矩阵HLFX2m2×2*p

(7)将预测集扩展矩阵代入到(5)所确定的模型中预测未知样本中芳烃的含量。

附图说明

图1:光谱分析结合高低频展开偏最小二乘回归建模的流程图。

图2:训练集的样本1进行EMD分解得到的6个IMF以及残差图。

图3:预测集样本测量值与预测值的关系图。其中a)、b)、c)、d)分别对应PLSR、HFPLSR、 LFPLSR以及HLFPLSR方法的建模结果。

具体实施方式:

为更好理解本发明,下面结合实施例对本发明做进一步地详细说明,但是本发明要求 保护的范围并不局限于实施例表示的范围。

实施例:

(1)收集115个汽油/柴油样品,其中汽油的沸程为195-343℃,柴油的沸程为 177-343℃。使用仪器型号为VarianCary3的紫外吸收光谱仪器测试样品的光谱。(P.D. Wentzell,D.T.Andrews,J.M.Walsh,J.M.Cooley,P.Spencer,Estimationofhydrocarbontypes inlightgasoilsanddieselfuelsbyultravioletabsorptionspectroscopyandmultivariate calibration,Can.J.Chem.,1999,77:391-400)。样品池的厚度为1cm,狭缝宽度为0.5nm, 积分时间为0.1S,采样间隔为0.35nm,光谱范围为200-400nm,每条紫外光谱包含572个 数据点。双芳香族化合物含量采用型号为HPG1205A的超临界流体色谱进行测定,二氧化 碳作为载气,流速为2mL.min-1,炉温为35℃,出口压力为150bar,检测器为火焰离子检 测器。前70个样品作为训练集,71-114为预测集,第115个样品为奇异样本,没有使用。

(2)对训练集中70个样品的光谱向量依次进行经验模态分解(EMD),具体分解步 骤如下:

①对光谱向量x,首先确定其所有的极大值点和所有的极小值点,然后对于所有的极 大值点和所有的极小值点进行三次样条插值,即得到信号的上包络线U和下包络线L,计 算出它们的平均包络线:

m1=L+U2---(3.1)

②计算初始模式函数:

h1=x-m1(3.2)

③判断h1是否满足IMF,不满足则将h1作为原始信号函数,重复步骤①-③求出

m11=L1+U12---(3.3)

重复②步骤计算求出

h11=h1-m11(3.4)

判断h11是否满足IMF,经过k次判断后

h1k=h1(k-1)-m1k(3.5)

满足IMF,记

c1=h1k(3.6)

则c1为的第一个IMF分量记作IMF1

④计算残余分量

r1=x-c1(3.7)

⑤r1作为原始信号函数,重复①-④步骤得到第二个IMF分量c2记作IMF2,残余分量 r2

⑥计算:

r2=r1-c2(3.8)

⑦同样可以得到第三个、第四个......IMF分量,则残余分量有:

r3=r2-c3(3.9)

r4=r3-c4(3.10)

……

r7=r6-c7(剩余函数曲线)(3.11)

残余分量r7不能再提出IMF分量,此时EMD分解结束。r7为残余函数,表示信号的整体 趋势。训练集中的样本1分解得到的6个IMF和1个残差r7,如图2所示。从图中可以看 出,这些IMF分量是从高频到低频依次分布的,其它样本分解结果与样本1类似。

(3)根据分解得到的6个IMF分量以及1个残差r的频率特点,把前3个IMF矩阵 加和为高频矩阵,记为HFX170×572,后3个IMF矩阵以及残差矩阵加和为低频矩阵,记为 LFX270×572

(4)将高频矩阵HFX170×572和低频矩阵LFX170×572沿变量方向扩展为训练集扩展矩阵 HLFX170×1144=[HFX1LFX1]。

(5)在HLFX170×1144与训练集浓度y17o×1之间建立偏最小二乘回归(PLSR)模型, 得到b系数。其中PLSR的因子数通过蒙特卡罗交叉验证得到的RMSECV随着因子数的 变化图确定,因为RMSECV最小值对应的因子数为11,因此确定11为最佳因子数。

(6)对预测集光谱进行(2)、(3)、(4)步骤同样的处理,得到预测集扩展矩阵 HLFX244×1144

(7)将预测集扩展矩阵代入到(5)所确定的模型中预测未知样本中芳烃的含量。

预测集样本测量值与预测值的关系如图3所示,其中a)、b)、c)、d)分别对应PLSR、 HFPLSR、LFPLSR以及HLFPLSR方法的建模结果。从图中可以看出,单独使用高频成分 (图3b所示)或者低频成分(图3c所示)建立PLSR模型,其结果不如直接使用原始数 据建立PLSR模型(图3a所示),其中高频信号建立的模型的预测值与测量值的相关系数 为0.3258,几乎没有相关性。但是如果将高低频成分扩展成一个矩阵后再建立PLSR模型 (图3d所示),相关系数达到0.9933,得到比PLSR更好的预测结果。高频成分虽然本身 预测效果较差,但是加入高频成分后总体预测结果更好,说明高频成分对预测能力也有一 定贡献。我们可以看出:基于经验模态分解的高低频展开的偏最小二乘回归方法可以使模 型预测精度明显提高。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号