法律状态公告日
法律状态信息
法律状态
2015-07-08
授权
授权
2014-07-16
实质审查的生效 IPC(主分类):G01N30/00 申请日:20140402
实质审查的生效
2014-06-18
公开
公开
技术领域
本发明属于色谱分析方法,具体涉及一种利用色谱特征提取对样本 进行鉴定的方法。
背景技术
色谱仪在石油、化工、生物化学、医药卫生、食品工业、环保等方 面应用很广。色谱分析主要是定性和定量两个方面。定性分析就是通过 色谱分析样本含有的成分。定量分析需要配置不同浓度的标准溶液,通 过建立浓度和物质峰面积之间的线性关系模型然后对物质的浓度进行检 测。但是采集色谱信号的过程中由于温度、湿度、操作不当或者色谱柱 更换等原因,使得采集到的色谱信号常常会出现峰的非一致漂移,即有 的物质出峰时间提前有的物质出峰时间滞后,给后续的色谱信号分析造 成困难。
发明内容
本发明的目的在于,提供一种利用色谱特征提取对样本进行鉴定的 方法。主要解决现有技术中色谱峰的非一致漂移使得色谱信号分析困难 的技术问题。
本发明为解决上述技术问题所采用的技术方案如下:
一种利用色谱特征提取对样本进行鉴定的方法,包括如下步骤:
步骤1,利用色谱仪采集样本的色谱信号;
步骤2,采用去噪函数对前述采集的色谱信号进行去噪;
步骤3,对前述去噪后的色谱信号提取色谱特征,所述提取的色谱特征包 括曲线盒子特征、峰高、峰宽、峰面积、峰曲率;
步骤4,利用前述提取的色谱特征对样本进行分析鉴定。
优选地,所述步骤2中,采用Matlab软件提供的去噪函数wden对信号 进行去噪。
优选地,所述步骤3中的曲线盒子特征,其计算方法如下:
将色谱信号峰看作是二维空间中的曲线,用方程表示为:y=f(x),其中 x和y分别对应曲线上的点的位置和峰值;假设曲线长度为M,将曲线分成r 段,每一段对应一叠r×r的盒子;设定在第i段曲线中,曲线峰值的最大值 位于第l个盒子内,最小值位于第k个盒子内;则在第i段曲线中,覆盖曲线 的盒子数为:nx(i)=l-k+1,盒子总数为:对得到的序列 (lnr,lnNr),在无标度区用最小二乘计算(lnr,lnNr)的斜率,得到的斜率取负号 就是所述曲线盒子特征。
与现有技术相比,本发明的有益效果如下:
(1)提出一种通过色谱特征提取对样本进行分析鉴定的方法,在对 样本进行分析时,不再需要工作曲线,并且消除了色谱峰漂移的影响。
(2)所述通过色谱特征提取对样本进行鉴定的方法中,提取的特征 数据量小、运算速度快、正确率高、特征稳定,可直接采用提取的色谱特征 进行统计分析和建模。
说明书附图
图1为本发明实施例中待测样本在改变外界条件前后的色谱信号 图;
图2为本发明实施例中待测样本去噪后的色谱信号图;
图3为本发明实施例中色谱信号峰值检测的示意图;
图4为本发明实施例中酒样本在不同外界条件下的色谱信号图;
图5为本发明实施例中酒样本去噪后的色谱信号图;
图6为本发明实施例中酒样本色谱信号峰值的示意图;
图7为本发明实施例中同一种酒在不同条件下的色谱信号图。
具体实施方式
以下通过具体实施例来说明本发明的技术方案。
本发明的核心思想是:对采集的色谱信号进行去噪,对去噪后的色 谱信号提取峰高、峰面积、峰宽、峰曲率以及曲线盒子特征。最后对提 取的特征进行匹配实现对样本的分析鉴定,避免了因为色谱峰的非一致 漂移造成的分析困难。
本发明中对色谱特征进行提取的详细过程如下:
一.色谱数据的采集
(1)选用仪器:美国Agilent公司GC-MSD7890-5975c气质联用仪;
(2)GC条件:配有Dean Switch装置,利用中心切割技术,使用 HP-FFAP(30m×0.25mm,0.25μm,美国J&W公司)为一维色谱柱、HP-5 (30m×0.25mm,0.25μm,美国J&W公司)为二维色谱柱,进样量1μL, 分流比30:1;进样口温度250℃;中心切割范围:7.0-9.6min,将乙醇 切入二维色谱柱中;载气为高纯N2;柱流速1mL/min;升温程序:初始 温度为40℃,保持4min后,以4℃/min程序升温至240℃,保持25min。
MS条件:电子轰击(electron ionization,EI)离子源;电子能量70eV; 离子源温度250℃;传输线温度280℃;四极杆温度为150℃;质量扫描 范围m/z29-400。
二.色谱信号的去噪:采用Matlab软件提供的去噪函数wden对信号 进行去噪。
三.峰值检测:采用Matlab软件提供的函数findpeaks求色谱信号的 极值(即峰高)。
四.色谱特征提取:色谱特征包括盒子特征、峰高特征、峰宽特征、 峰面积特征、峰曲率特征。
曲线盒子特征,其计算方法是将色谱峰看做是二维空间中的曲线, 用方程表示为:y=f(x),其中x和y分别对应曲线上的点的位置和函数 取值,假设曲线长度为M,将曲线分成r段,每一段对应一叠r×r的盒 子,设在第i段曲线中,曲线幅值的最大值位于第l个盒子内,最小值位 于第k个盒子内,则在第i段曲线中,覆盖曲线的盒子数为:nr(i)=l-k+1; 盒子总数为:对得到的序列(lnr,lnNr),在无标度区用最 小二乘计算(lnr,lnNr)的斜率,得到的斜率取负号就是所述曲线盒子特征, ln表示取工程常数e=2.7183为底的自然对数。
所述峰高为:色谱峰最高点与基线之间的距离;所述峰宽为:谱峰 拐点所作的切线在基线上截距的距离;所述峰面积为:峰围成的区域的 面积;所述峰曲率特征为:计算色谱峰拐点范围内的点的曲率,求其均 值和方差。
下面通过具体例子介绍利用色谱特征提取对样本进行鉴定的详细过 程。
实例1,样本色谱峰漂移的分析
第一步:色谱信号采集
利用色谱仪采集待测样本的色谱信号峰;然后,改变色谱信号采集 的外界条件(如温度、湿度或更换色谱柱等),第二次采集所述待测样本 的色谱信号峰。参见图1,展示了待测样本在改变外界条件前后的色谱 信号图。如图所示,第一次采集的色谱信号中出现三个信号峰,分别命 名为A1,B1,C1。第二次采集的色谱信号中同样出现三个信号峰,分 别命名为A2,B2,C2。从图中可以看出,由于采集过程中外界条件改 变,待测样本的色谱信号峰出现漂移。
第二步:色谱信号的去噪
采用Matlab软件提供的去噪函数wden对信号进行去噪。参见图2, 展示了待测样本去噪后的色谱信号图。
第三步:峰值检测
采用Matlab软件提供的函数findpeaks检测色谱信号的极值。参见 图3,展示了色谱信号峰值检测的示意图。
第四步:色谱特征提取
所述提取的色谱特征包括盒子特征、峰高、峰宽、峰面积、峰曲率。 对上述待测样本的色谱信号提取特征后,获得的特征值列于表1。
表1,色谱峰的特征值
对于上述信号峰A1和A2、B1和B2、C1和C2,当两者的特征值 小于指定的阈值(0.5)时,可以认为虽然存在色谱峰的漂移,实际上属 于同一种样本。
实例2,酒类样本的分析
在不同色谱柱条件下采集同一种白酒的色谱信号,各10个。采集酒 样本的色谱信号,由于采集过程中外界条件变化,采集的色谱峰出现漂 移。参见图4,展示了酒样本在不同外界条件下的色谱信号图。采用Matlab 软件提供的去噪函数wden对采集的色谱信号进行去噪。参见图5,展示 了酒样本去噪后的色谱信号图。采用Matlab软件提供的函数findpeaks 检测色谱信号的峰值。参见图6,展示了酒样本色谱信号峰值的示意图。
获取所述酒样本色谱信号的特征,包括盒子特征、峰高、峰宽、峰 面积、峰曲率。
计算原始色谱信号之间的距离(这里的距离是指原始信号的欧式距 离);计算提取的特征之间的距离(这里的距离是指提取的特征之间的欧 氏距离)。现将信号强度归一化,即每一个信号除以该信号的最大值。
表2是原始信号两两之间的距离,表3是提取的特征两两之间的距 离,从图中可以看到,原始色谱信号两两之间的距离远远大于特征提取 的特征之间的距离。表明这是一种能够抵抗色谱峰漂移的特征。
实例3,酒类鉴别
参见图7,展示了同一种酒在不同条件下的色谱信号图。如图所示, (a)和(b)是同一种酒在不同条件下获得的色谱信号,存在色谱峰漂移;(c) 和(d)是同一种酒在不同条件下获得的色谱信号,同样存在色谱峰漂移 (这里的c、d和a、b是两种不同种类的酒)。对每种酒样本各采集20 个信号,共采集80个色谱信号数据。其它步骤和实例1、2相同,这里 不再赘述。
取(a)和(c)对应的20个色谱信号,分别求色谱信号平均值,分别计 算(b)和(d)对应的20个色谱信号到这两个平均值之间的距离;若距离小 于5,则判定为某一类型酒,其判定结果的正确率为30%。取(a)和(c)对 应的20个色谱信号,提取盒子特征、峰高特征、峰宽特征、峰面积特征、 峰曲率特征,分别求特征的平均值,分别提取(b)和(d)对应的20个色谱 信号的盒子特征、峰高特征、峰宽特征、峰面积特征、峰曲率特征,计 算提取的特征到这两个平均值之间的距离;若距离小于5,则判定为某 一类型酒,其判定结果的正确率为98%。
上述仅为本发明的部分优选实施例,本发明并不仅限于实施例的内容。 对于本领域中的技术人员来说,在本发明方法范围内可以有各种变化和更改, 所作的任何变化和更改,均在本发明保护范围之内。
表2原始色谱信号两两之间的距离
表3提取的特征两两之间的距离
机译: 用磁性工具装置处理样本接收部分的实验室设备,磁性工具装置,与磁性工具装置一起使用的样本接收装置以及利用磁场对至少一种流体样本进行工作步骤的方法
机译: 基因组谱分析是一种从图像中提取特征点的方法,也是利用该过程中获得的特征点按基因类型进行物种鉴定和亲和力鉴定的方法
机译: 将要分析的样本归类为分类变量的方法,使用一种方法,方法在多个样本设备中进行分析,在样本池分析设备中分组以对多个样本进行分组,并编写用于补偿的程序产品。乌塔多。