首页> 中国专利> 一种基于局部相似性匹配的色谱特征峰波段提取与分析方法

一种基于局部相似性匹配的色谱特征峰波段提取与分析方法

摘要

本发明涉及的一种基于局部相似性匹配的色谱特征提取与分析方法,其特征在于:首先对采集的标准样本的色谱信号进行人工特征波段的选取,然后用选取的特征波段对待分析样本色谱信号进行自适应特征波段匹配、解决色谱峰的非一致漂移,最后利用匹配到的特征峰波段进行相关性分析。对同一种样本色谱信号只需要进行一次人工特征波段选择,对该种样本的待分析色谱特征波段由计算机自适应匹配。该方法匹配速度快、提取的特征为包含特征峰的波段,有较高的鲁棒性,可直接用特征进行统计分析,建模;正确率高。

著录项

  • 公开/公告号CN104007212A

    专利类型发明专利

  • 公开/公告日2014-08-27

    原文格式PDF

  • 申请/专利权人 华中科技大学;

    申请/专利号CN201410282683.4

  • 申请日2014-06-23

  • 分类号G01N30/86;

  • 代理机构上海硕力知识产权代理事务所;

  • 代理人王法男

  • 地址 430074 湖北省武汉市洪山区珞喻路1037号

  • 入库时间 2023-12-17 00:40:32

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-07-06

    授权

    授权

  • 2014-09-24

    实质审查的生效 IPC(主分类):G01N30/86 申请日:20140623

    实质审查的生效

  • 2014-08-27

    公开

    公开

说明书

技术领域

本发明属于色谱信号处理与分析方法,具体地说是一种基于局部相似性 匹配的色谱特征峰波段提取与分析方法。

背景技术

色谱仪在石油、化工、生物化学、医药卫生、食品工业、环保等方面应 用很广。色谱分析主要是定性和定量两个方面。定性分析就是通过色谱分析 样本含有的成分。定量分析需要配置不同浓度的标准溶液,通过建立浓度和 物质峰面积之间的线性关系模型对物质的浓度进行检测。但是由于温度,湿 度,操作不当或者色谱柱的更换等原因使得采集到的色谱信号常常会出现峰 的非一致漂移,即有的物质出峰时间提前有的物质出峰时间滞后,为后续分 析造成困难。

因此,寻找一种能消除色谱特征波段的非一致性漂移的影响的色谱信号 特征波段匹配及分析方法就成为相关技术领域技术人员的一种期望。

发明内容

本发明的目的旨在:提供一种色谱信号特征波段匹配及分析方法,消除 色谱特征波段的非一致性漂移的影响。

本发明的目的是这样实现的:

这种基于局部相似性匹配的色谱特征提取与分析方法,其特征在于:对 采集的标准样本的色谱信号进行人工特征波段的选取,然后用选取的特征波 段对待分析样本色谱信号进行自适应特征波段匹配、解决色谱峰的非一致漂 移,最后利用匹配到的特征峰波段进行相关性分析;具体方法为:

(a)选用液相色谱,气相色谱或气质联用色谱中的任意一种色谱分析作 为分析方法;

(b)按照已确定的色谱测试条件,测定标准样本的色谱得到色谱信号;

(c)对标准样本的色谱信号进行人工特征波段的选取;

(d)测定待分析样本的色谱得到待分析样本色谱信号;

(e)利用在标准样本色谱中选取的特征峰波段对待分析样本进行自适应 特征峰波段匹配;

(f)利用匹配到的特征峰波段进行相关性分析。

具体的操作步骤为:

一、进行标准样本与待测样本色谱数据的采集:

(1)选用美国Agilent公司GC-MSD7890-5975c气质联用仪作为检测分 析仪器;

(2)GC条件:配有Dean Switch装置,利用中心切割技术,使用HP-FFAP 为一维色谱柱、HP-5为二维色谱柱,进样量1μL,分流比30:1;进样口温 度250℃;中心切割范围:7.0-9.6min,将乙醇切入二维色谱柱中;载气为 高纯N2;柱流速1mL/min;升温程序:初始温度为40℃,保持4min后,以4℃ /min程序升温至240℃,保持25min。

MS条件:电子轰击离子源;电子能量70eV;离子源温度250℃;传输线 温度280℃;四极杆温度为150℃;质量扫描范围m/z29-400。

二.标准样本特征波段选择:

对采集到的标准样本色谱信号,人工选取色谱信号中较明显的特征峰波 段,记录各特征波段的起始位置。

三.待分析样本色谱自适应特征匹配;

假设色谱信号长度为M,标准样本色谱信号共选取N个不同的特征波段, 对于第i(0<i≤N)个特征峰波段,假设其起始位置为Bi(0<Bi<M),结束位 置为Ei(Bi<Ei≤M),则特征峰波段长度为Li=Ei-Bi+1;对第i个特征峰波段的 匹配过程如下:

(1)确定匹配范围,对于第i个起始位置为Bi,结束位置为Ei,长度为Li的特征波段,若Bi>Li,则匹配的起始位置MBi=Bi-Li,若Bi≤Li,则MBi=1, 若Ei+Li≤M匹配的结束位置为MEi=Ei+Li,否则若Ei+Li>M,则MEi=M

(2)对于待分析色谱信号,从MBi出发,以Li为窗宽度,结束位置为MEi, 步长为1,移动并计算每一个窗内的色谱波段与标准色谱信号相应的特征峰 波段的曲线相似度,得到曲线相似度最大的窗以及相应的起始位置MBiMax和结 束位置MEiMax,这样就得到了在待分析色谱信号上与标准色谱信号相匹配的特 征峰波段;曲线相似度的计算采用曲线相关系数,其计算方法如下:

对于长度为m曲线i和曲线j,其相关系数计算公式如下:

Sij=Σk=1m(xik-xi)(xjk-xj)Σk=1m(xik-xi)2Σk=1m(xjk-xj)2

式中:

xik表示曲线i中第k个点的值;

xjk表示曲线j中第k个点的值;

表示曲线i的均值;

表示曲线j的均值;

Sij表示曲线i与曲线j的相关系数。

四.用匹配到的特征进行相似性分析。

将标准样本色谱信号中选取的所有特征峰波段组成一个向量,将待分析 样本色谱信号中匹配到的特征峰波段组成一个向量,计算它们之间的相关系 数,进行分析判定;将相关系数作为一种曲线整体相似性测度的标准,其绝 对值在0到1之间,对于两条曲线,它们的相关系数绝对值越大,则说明这两 条曲线越相似。如果两条曲线完全相同,它们的相关系数为1,否则相关系数 一般都小于1。

本发明与国内外现有技术的不同点在于:

1.采用添加移动窗口的进行局部相似性匹配的方法自适应地匹配特征 峰波段;

2.通过特征峰波段匹配消除了色谱峰漂移的影响;

3.利用提取的特征对样本进行分析,不需要工作曲线;

本发明的优点是:

1.对同一种样本色谱信号只需要进行一次人工特征波段选择,对该种样 本的待分析色谱特征波段由计算机自适应匹配;

2.匹配速度快;

3.提取的特征为包含特征峰的波段,有较高的鲁棒性;

5.可直接用特征进行统计分析,建模;

6.正确率高。

附图说明

图1为色谱峰波段的漂移状态示意图;

图2为采集到的标准样本色谱信号展示图;

图3为标准样本人工选取的特征峰波段展示示意图;

图4为待测样本与标准样本色谱在同一坐标系中的展示示意图;

图5为待鉴定样本匹配到的4个特征峰波段;

图6则为标准样本的特征峰波段与待鉴定样本中相对应的匹配到的特征 峰波段的对比。

具体实施方式

下面通过具体实施方式对本发明做进一步说明。

这种基于局部相似性匹配的色谱特征提取与分析方法,其特征在于:首 先对采集的标准样本的色谱信号进行人工特征波段的选取,然后用选取的特 征波段对待分析样本色谱信号进行自适应特征波段匹配、解决色谱峰的非一 致漂移,最后利用匹配到的特征峰波段进行相关性分析;其方法为:

(a)选用液相色谱,气相色谱或气质联用色谱中的任意一种色谱分析作 为分析方法;

(b)按照已确定的色谱测试条件,测定标准样本的色谱得到色谱信号;

(c)对标准样本的色谱信号进行人工特征波段的选取;

(d)测定待分析样本的色谱得到待分析样本色谱信号;

(e)利用在标准样本色谱中选取的特征峰波段对待分析样本进行自适应 特征峰波段匹配;

(f)利用匹配到的特征峰波段进行相关性分析。

具体的操作步骤为:

一、进行标准样本与待测样本色谱数据的采集:

(1)选用美国Agilent公司GC-MSD7890-5975c气质联用仪作为检测分 析仪器;

(2)GC条件:配有Dean Switch装置,利用中心切割技术,使用HP-FFAP 为一维色谱柱、HP-5为二维色谱柱,进样量1μL,分流比30:1;进样口温 度250℃;中心切割范围:7.0-9.6min,将乙醇切入二维色谱柱中;载气为 高纯N2;柱流速1mL/min;升温程序:初始温度为40℃,保持4min后,以4℃ /min程序升温至240℃,保持25min;

MS条件:电子轰击离子源;电子能量70eV;离子源温度250℃;传输线 温度280℃;四极杆温度为150℃;质量扫描范围m/z29-400;

二.标准样本特征波段选择:

对采集到的标准样本色谱信号,人工选取色谱信号中较明显的特征峰波 段,记录并确认各特征波段的起始位置;

三.进行待分析样本色谱自适应特征匹配;

假设色谱信号长度为M,标准样本色谱信号共选取N个不同的特征波段, 对于第i个特征峰波段,其中0<i≤N,假设其起始位置为Bi,,其中0<Bi≤M,结束位置为Ei,其中Bi<Ei≤M,则特征峰波段长度为Li=Ei-Bi+1; 对第i个特征峰波段的匹配过程如下:

(1)确定匹配范围,对于第i个起始位置为Bi,结束位置为Ei,长度为Li的特征波段,若Bi>Li,则匹配的起始位置MBi=Bi-Li,若Bi≤Li,则MBi=1, 若Ei+Li≤M,匹配的结束位置为MEi=Ei+Li,否则若Ei+Li>M,则MEi=M;

(2)对于待分析色谱信号,从MBi出发,以Li为窗宽度,结束位置为MEi, 步长为1,移动并计算每一个窗内的色谱波段与标准色谱信号相应的特征峰 波段的曲线相似度,得到曲线相似度最大的窗以及相应的起始位置MBiMax和结 束位置MEiMax,这样就得到了在待分析色谱信号上与标准色谱信号相匹配的特 征峰波段;曲线相似度的计算采用曲线相关系数,其计算方法如下:

对于长度为m曲线i和曲线j,其相关系数计算公式如下:

Sij=Σk=1m(xik-xi)(xjk-xj)Σk=1m(xik-xi)2Σk=1m(xjk-xj)2

式中:

xik表示曲线i中第k个点的值;

xjk表示曲线j中第k个点的值;

表示曲线i的均值;

表示曲线j的均值;

Sij表示曲线i与曲线j的相关系数;

四.用匹配到的特征进行相似性分析

将标准样本色谱信号中选取的所有特征峰波段组成一个向量,将待分析 样本色谱信号中匹配到的特征峰波段组成一个向量,计算它们之间的相关系 数,进行分析判定;将相关系数作为一种曲线整体相似性测度的标准,其绝 对值在0到1之间,对于两条曲线,它们的相关系数绝对值越大,则说明这两 条曲线越相似。如果两条曲线完全相同,它们的相关系数为1,否则相关系数 一般都小于1。

实例1:白酒鉴别

本实例标准样本为白云边5年,待分析样本同样为白云边5年。

表1 实例样本说明

样本类型 样本名称 色谱信号数 标准样本 白云边5年 1 待鉴定样本 白云边5年 1

第一步:标准样本色谱信号采集

色谱信号为长度为4675的向量。

第二步:特征峰波段选取

如图3所示,一共选取了130-300,540-570,868-968,1285-1340这4 个特征峰波段。

第三步:待鉴定样本色谱信号采集。

可以看出,待鉴定样本与标准样本存在严重的特征峰以及波段的飘移。

四.自适应特征峰波段匹配

表2 待鉴定样本匹配到的特征峰波段范围

表3 待鉴定样本匹配到的特征峰波段与标准样本特征峰波段的匹配度

图5为待鉴定样本匹配到的4个特征峰波段,图6则为标准样本的特征 峰波段与待鉴定样本中相对应的匹配到的特征峰波段的对比,可以看出,在 图4中严重偏移的特征峰波段能够很好地对应。表2为待鉴定样本根据标准 样本中所选取的特征峰波段自适应的匹配到的特征峰波段,表3为匹配到的 待鉴定样本特征峰波段与标准样本中相应的特征峰波段的匹配度,也就是相 关系数。

五.分析

表4 待鉴定样本与标准样本各方面的匹配度

表4中的匹配度由计算曲线的相关系数获得,由表4可以看出,待鉴定 样本和标准样本尽管是同一种酒,但由于两次测定的色谱信号存在色谱峰以 及波形上的平移,导致这两条色谱信号的匹配度只有0.0041,而通过特征峰 波段的自适应匹配与提取,得到综合特征的匹配度达到了0.9752,两者的相 关系数几乎接近1,因此可以确定待鉴定样本与标准样本为同一种酒。

上述仅为本发明的部分优选实施例,本发明并不仅限于实施例的内容。 对于本领域中的技术人员来说,在本发明方法范围内可以有各种变化和更改, 所作的任何变化和更改,均在本发明保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号