首页> 中国专利> 一种通用的气相色谱-质谱全组分定量分析方法

一种通用的气相色谱-质谱全组分定量分析方法

摘要

本发明公开了一种基于气相色谱-质谱的化合物全组分定量分析方法,首先采用气相色谱-质谱全扫描方法获得待分析样品的数据信息,采用质谱自动去卷积和峰识别系统对所获得的全扫描数据信息进行质谱去卷积和峰识别。根据峰识别结果,从原始数据文件中提取质谱信息,计算化合物离子的特征值,筛选化合物特征离子,最终利用特征离子建立选择性离子扫描定量分析方法。本发明的核心在于通过化合物离子的特征值对化合物特征离子进行筛选。本方法可给出多个特征离子及其特征性评价指标-特征值。给出的多个特征离子可以分别作为定量离子和定量候选离子。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-10-22

    授权

    授权

  • 2013-01-23

    实质审查的生效 IPC(主分类):G01N30/72 申请日:20110521

    实质审查的生效

  • 2012-11-28

    公开

    公开

说明书

技术领域

本发明涉及分析化学和代谢组学领域,是一种基于气相色谱-质谱对复 杂混合体系中所有被识别化合物进行定量分析的方法。

背景技术

气相色谱-质谱联用(GC-MS)将色谱的分离能力与质谱的定性功能结 合起来,可实现对复杂混合物的定性和定量分析。在用色谱质谱定量分析 复杂混合物时,常常需要确定特征离子。GC-MS全扫描模式下的化合物特 征离子,是指某个目标化合物的质谱碎片离子,该离子只存在于该化合物, 而不存在于与其共流出的(即色谱保留时间上有重叠的)其它化合物。如果某 个化合物不存在共流出化合物,则可认为该化合物的每一个碎片离子都是 特征离子。如果化合物存在多个共流出化合物(色谱峰重叠严重)或者存 在共流出的结构异构体,则该化合物可能不存在特征离子。

特征离子对基于GC-MS的化合物定性定量有很大的作用。在化合物定 性方面,人们可以将与特征离子保留时间完全相同的碎片离子从重叠的色 谱峰中剥离出来,进行质谱谱图库的检索,从而实现化合物定性。在化合 物定量分析方面,特征离子可以作为全扫描模式下的定量离子。特征离子 是共流出化合物中某个化合物所特有,因此使用特征离子定量积分,可避 免重叠峰对定量的干扰。特征离子还可以在选择离子扫描(SIM)模式下作 为定量数据采集离子。由于采用选择离子检测模式获得的数据比全扫描模 式有更高的灵敏度,因此特征离子作为SIM离子的作用更加受到关注。

近年来,在代谢组学和中药指纹图谱等的研究中,系统全面分析样品 组成的化学指纹方法得到了快速的发展和广泛的应用。这些方法通常要对 所有被分析的化合物(全组分)进行定性和定量分析。而特征离子的选择 对基于GC-MS的全组分化学成分分析十分重要。GC-MS分析中化合物电 离最通用的模式为电子轰击电离(EI)模式。在这种模式下,每个化合物 得到的碎片离子数有几十个,甚至几百个,用手动的方式查找化学指纹中 重叠峰的特征离子几乎不可能。

商品化软件LECO ChromaTOF色谱质谱工作站给出了其分析数据中重叠 峰的特征离子。但该软件并未对其特征性进行描述。实际情况下部分共流出 峰是不存在特征离子的,但该软件却会给所有被识别峰一个特征离子。另外, 通常情况下该软件不能用来分析其它工作站产生的GC-MS原始数据。

本发明为通用性方法,适用于不同GC-MS仪器采集的数据。通过计算 色谱流出化合物离子碎片的特征值,比较共流出离子的特征性,筛选出化 合物的特征离子。同时本方法也给出被筛选出特征离子的特征值,用于评 价该离子的特征性。这些特征离子被最终用于以GC-MS为基础的全组分分 析的定量离子选定,或是用于基于GC-MS选择离子检测的“全组分分析”方 法的建立。

发明内容

本发明的目的在于建立一种基于气相色谱-质谱的全组分定量分析方 法。该方法的核心技术为化合物特征定量离子的选取。相对于目前的商品 化软件LECO ChromaTOF,该方法具有通用性强(凡是能转换成CDF格式 的GC-MS原始数据都能使用该方法),特征离子特征性明确(以特征值衡 量),能同时给出几个特征离子及其特征值等特点。

本发明采用的技术方案如下:

一种基于气相色谱-质谱的全组分定量分析方法,采用GC-MS全扫描 方式采集全扫描原始数据,利用AMDIS软件对分析样本进行峰识别,然后 对所提取的色谱峰进行分组和特征离子选定,最后使用特征离子建立 GC-MS选择离子扫描全组分分析方法。

具体步骤如下,

1)GC-MS化学指纹数据的获取:针对进行全组分分析样品(本专利 实施例中为人血清样品和烟草样品)的特点,对待分析样本进行相应的样 品处理,并进行气相色谱-质谱的全扫描分离分析。

2)全扫描色谱图峰识别:将获得的分析样本原始数据文件(CDF格式) 导入AMDIS软件(v.2.62或其它版本均可),进行峰识别。去卷积和峰识 别参数为:component width设定值为20,adjacent peak subtraction,resolution, sensitivity,shape requirement等参数分别设置为two,high,low,medium等。 对峰识别结果进行检查,去除重复识别结果。

3)分组:从AMDIS分析结果文件中提取所识别色谱峰的保留信息(包 括峰顶时间,起始、峰顶、结束点的扫描点信息),并利用该信息进行分组。 分组原则为将彼此相邻并重叠的化合物(共流出化合物)分为一组。分组 的具体操作如下:寻找两个相邻色谱峰之间前一色谱峰结束时间和后一色 谱峰起始时间相差大于0.1min(可以根据实际情况修改)的时间窗口。分 组节点定义为:

Ti+1=Tend x+(Tini x+1-Tend x)×0.5

式中,Ti+1为第i+1组的起始时间(也即第i组的结束时间),Tend x 为第x个色谱峰的结束时间,Tini x+1为第x+1个色谱峰的起始时间。

4)特征离子的选择:根据被识别化合物的保留信息(包括峰顶时间, 起始、峰顶、结束点的扫描点信息),从CDF原始数据中提取出所有色谱 峰峰顶的质谱图定量信息。如果某化合物没有共流出峰,则选取绝对值小 于阈值(Agilent 5975仪器通常选100000)的3个丰度最大的质谱离子作为 定量离子。对于存在共流出的某个色谱峰,比较其峰顶和前后相邻共流出 色谱峰峰顶的质谱定量信息,计算离子的特征值(即能代表该离子特征性 的值),找出其相应的特征质谱离子。特征值的具体算法如下:

第一步:将待计算的色谱峰峰顶质谱碎片强度信息进行排序,筛选出 强度排序最前的10%的质谱碎片,作为候选的特征值计算离子。较弱的碎 片离子因为本身测量误差较大,不计入特征值计算范围。

第二步:计算特征值。

准确的计算特征值是进行特征离子筛选的前提。对于某离子通道m的 质量色谱图,有重叠峰b干扰的色谱峰a的特征值表示为:

Sam=Iam-IbmIam=1-IbmIam---(1)

式中为在离子通道m中色谱峰a的特征值,为峰a在其保留时间时的质谱响应强度,为干扰峰b在其保留时间时的质谱响应强度。 可通过公式(2-3)计算:

Iam=ItRam-IbtRam-Ibaselinem---(2)

Ibm=ItRbm-IatRbm-Ibaselinem---(3)

将公式2、3代入公式1,得到

Sam=ItRam-IbtRam-ItRbm+IatRbmItRam-IbtRam-Ibaselinem---(4)

式中为峰b在保留时间tRa时的质谱响应强度,为峰a在保留时 间tRb时的质谱响应强度。和这两个变量不能从GC-MS原始数据中 直接获取,可通过对色谱峰的模拟计算获得。为基线的质谱响应强度。

理想情况下,色谱流出峰可用高斯分布函数表示(附图1),可用数学 式表示如下:

I(t)=ItR×e-0.5(t-tRo)2---(5)

上式中I(t)为在时间t时的化合物质谱响应强度,为化合物在其保留 时间tR的质谱响应强度,tR为色谱保留时间,σ为色谱峰的标准偏差。由于 实际情况下,色谱峰峰型并非完全对称,色谱峰的前端可以模拟为:

I(t)=ItR×e-4.5(t-tRtRi-tR)2---(6)

式中为色谱峰的起始时间。色谱峰的后端可以模拟为:

I(t)=ItR×e-4.5(t-tRtRt-tR)2---(7)

式中为色谱峰的结束时间。在离子通道m,对于重叠的色谱峰a和b, 则可近似计算为:

IatRbmItRam×e-4.5(tRb-tRatRat-tRa)2---(8)(tRa<tRb)

IatRbmItRam×e-4.5(tRa-tRbtRai-tRa)2---(9)(tRa>tRb)

同理,可近似计算为:

IbtRamItRam×e-4.5(tRb-tRatRbi-tRb)2---(10)(tRa<tRb)

IbtRamItRam×e-4.5(tRa-tRbtRbt-tRb)2---(11)(tRa>tRb)

对于某离子通道m的质量色谱图,根据干扰峰与考察峰保留时间关系, 的计算可以分为干扰峰在考察峰之前、干扰峰在考察峰之后、干扰峰同 时存在于考察峰的前端和后端、不存在干扰峰等四种情况。

第一种情况:干扰峰在考察峰之前(见附图2)。根据考察峰 a与干扰峰b之间的峰起始点、顶点、结束点等的重叠情况,将公式8、10 代入公式4,得峰a在峰首一侧的特征值为:

Saim1-ItRbm-ItRam×e-4.5(tRb-tRatRai-tRa)2ItRam-ItRbm×e-4.5(tRb-tRatRbt-tRb)2---(12)

由于公式8~11为近似计算公式,同时公式12还进行了基线值忽略的 近似,这些近似计算会在或者值较小时带来较大误差。此时,公式12 的第二项分子的计算值可能出现小于0的时候,这是由于基线对的影响 和峰a不完全符合高斯峰模型,使得的计算值比实际值稍大,而该离子 通道下,峰b在刚好没有响应,即等于0,该离子为峰a相对峰b的特征 离子。因此,此时给第二项分子赋值为0,计算值为1,m为a相对b的 特征值。

同理,当较小时,也可能会出现第二项中分母小于0的情况,此时远大于峰b对峰a有严重干扰。因此去掉分母中第二项,计算值小 于0,m不是峰a相对峰b的特征离子。

第二种情况:干扰峰在考察峰之后(见附图3)。根据考察 峰a与干扰峰b之间的峰起始点、顶点、结束点等的重叠情况,将公式9、 11代入公式4,得峰a在峰尾一侧的特征值为:

Satm1-ItRbm-ItRam×e-4.5(tRb-tRatRat-tRa)2ItRam-ItRbm×e-4.5(tRb-tRatRbi-tRb)2---(13)

对公式13同样做公式12的规定,即第二项分子计算值小于0时,赋 值为0。分母计算值小于0时,略去分母第二项。

第三种情况:干扰峰同时存在于考察峰的前端和后端。同时计算和值。

第四种情况:不存在干扰峰。特征离子定义为绝对值小于阈值的最大 响应离子。限定阈值的目的是防止高浓度(响应值大)的离子在检测器上 过载。对于Agilent5975 GC-MS仪器,该值可设为100000。

第三步,特征值排序和特征离子确定。将计算得到的特征值进行排序, 筛选并列出特征值大于0.8(特征值越接近1,则该离子特征性越好,该值 可视具体情况改变。当同时存在和时,按照两者的均值排序)的离子 及其在质谱上的响应强度和特征值。选取特征值排序靠前的离子作为特征 离子。

5)将选定的特征离子编入气相色谱-质谱选择性离子扫描方法中,进行 定量数据采集和定量分析。

本发明具有的效果是:提供了一种基于气相色谱-质谱的全组分定量分 析方法。

由于该方法基于通用型数据格式(CDF),该方法不依赖于不同的 GC-MS仪器工作站,可以处理所有能转换成CDF格式的GC-MS数据。例 如Agilent 5975、Shimadzu 2010、LECO Pegasus 4D等仪器的工作站数据都 可以转换成CDF格式。

由于该方法同时给定特征离子及其特征值,相对于商品化软件LECO ChromaTOF工作站所给出的特征离子,该方法所获得的特征离子特征性明 显。因为LECO ChromaTOF工作站只是给出了所有被识别化合物的特征离 子。而实际上有些具有相同质谱图且色谱上部分重叠的同分异构体化合物 根本就不存在特征离子。这种情况下本方法则不会给出特征离子。对于给 出的特征离子,本方法同时给出其特征值,方便操作者判断特征性的好坏。

由于本方法按照特征值和响应强度排序,同时给出所有的特征离子及 其特征值,该方法获得的特征离子可以用于基于选择离子检测的复杂样品 多个化合物同时测定或全组分分析的定量离子和辅助定量离子。

附图说明

图1色谱峰的高斯分布模拟示意图;

图2共流出峰b的保留时间小于峰a保留时间的示意图;

图3共流出峰b的保留时间大于峰a的峰保留时间的示意图;

图4人血清样品的GC-MS全扫描指纹图谱;

图5烤烟样品的GC-MS全扫描指纹图谱;

图6实际样品中具有相似质谱图的色谱共流出峰。

具体实施方式

实施例1

1.样品

本例以人体血清为样品。血清样品由大连市第六人民医院提供。

2.分析方法

2.1样本总离子流色谱图的采集

(1)样品预处理:将100μL血清于室温解冻后,先后加入400μL 甲醇和20μL内标溶液(山梨酸、十三酸和十九酸的甲醇溶液,均为50μ g/mL),涡旋30s,于4℃下离心(15000g)15min,取370μL上清液 冻干。于冻干样品中加入50μL吡啶和100μL BSTFA(1%TMCS),80℃ 水浴下衍生30min。衍生样品于24h内进样分析。

(2)GC-MS分析条件:色谱柱:DB-5(30m×250μm×0.25μm,J & W Scientific,Folsom,CA),载气:氦气(99.9995%),恒流模式,流速1.2 mL/min。进样体积:2μL,进样口温度:290℃,传输线:280℃。升温 程序:初始温度70℃(保持3min),以10℃/min的速度升至320℃(保 持5min)。离子源温度230℃,检测器电压:1600V。溶剂切割时间430s, 质谱扫描范围:33-600,扫描速率:5Hz

实验样品色谱图见附图4。

2.2峰识别

将获得的分析样本原始数据文件(CDF格式)导入AMDIS软件(v.2. 62或其它版本均可),进行峰识别。去卷积参数为:component width设定 值为20,adjacent peak subtraction,resolution,sensitivity,shape requirement 等参数分别设置为two,high,low,medium等。运行AMDIS,得到峰识 别结果。删除重复识别结果,最终确定识别出275个化合物。

2.3重叠峰确定(分组)

从AMDIS分析结果文件中提取所识别色谱峰的保留信息(包括峰顶时 间,起始、峰顶、结束点的扫描点信息),并利用该信息进行分组。分组原 则为将彼此相邻并重叠的化合物(共流出化合物)分为一组。分组的具体 操作如下:寻找两个相邻色谱峰之间前一色谱峰结束时间和后一色谱峰起 始时间相差大于0.1min(可以根据实际情况修改)的时间窗口。分组节点 定义为:

Ti+1=Tend x+(Tini x+1-Tend x)×0.5

式中,Ti+1为第i+1组的起始时间(也即第i组的结束时间),Tend x 为第x个色谱峰的结束时间,Tini x+1为第x+1个色谱峰的起始时间。

分组的目的是指定共流出色谱峰,用于特征离子查找。本例共提取出 109个化合物存在共流出现象。

2.4特征值的计算和特征离子提取

确定分组后,根据被识别化合物的保留信息(包括峰顶时间,起始、 峰顶、结束点的扫描点信息),从CDF原始数据中提取组内色谱峰的质谱 强度信息。对于某个特定色谱峰,比较其峰顶和前后相邻色谱峰峰顶的质 谱强度信息,计算质谱碎片的特征值,并通过特征值筛选出特征离子,作 为定量分析的定量离子。如果某化合物没有共流出峰,则选取绝对值小于 阈值(通常选100000)的3个丰度最大的质谱离子作为定量离子。对于存 在共流出现象的色谱峰,其碎片离子的特征值采用如下公式进行计算:

Saim1-ItRbm-ItRam×e-4.5(tRb-tRatRai-tRa)2ItRam-ItRbm×e-4.5(tRb-tRatRbt-tRb)2(tRa>tRb)---(1)

Satm1-ItRbm-ItRam×e-4.5(tRb-tRatRat-tRa)2ItRam-ItRbm×e-4.5(tRb-tRatRbi-tRb)2(tRa<tRb)---(2)

式中,和分别为离子通道m中色谱峰a在峰首和峰尾侧的特征值, 和代表离子通道m中峰a和峰b的峰顶质谱响应强度。分别为峰a和峰b起始、顶点和结束保留时间。将特征值大于 0.8的离子输出,作为特征离子。每个化合物选取两个特征离子(一个备用)。

2.5与商品化软件LECO ChromaTOF的特征离子计算结果比较

将实验所获得的GC-TOFMS数据分别用LECO工作站软件ChromaTOF 和本专利方法进行特征离子计算和结果输出,并对所计算的结果进行比较。 结果发现,在被考察的109个存在重叠的化合物中,采用ChromaTOF软件 和本方法获得的特征离子均有106个是正确的。两种方法中,特征离子判 断错误的化合物各不相同。但均为响应弱(绝对强度小于2000),基线干扰 强的离子。

实施例2

1.样品采集:

本例以烤烟样品为例。采集烤烟中部烟叶样本,40℃烘烤至恒重。将 烟叶分别去梗、粉碎,过四十目筛,以自封塑料袋封存,存于4℃冰箱。

2.分析方法

2.1样本总离子流色谱图的采集

(1)萃取和浓缩:准确称量4.00g烟末(过40目筛),加入到11mL 不锈钢萃取池,加入200μL内标溶液(2-甲基萘,2mg/mL)。将萃取池和 接收瓶装上加速溶剂萃取池。萃取溶剂,二氯甲烷。萃取温度100℃,萃 取压力1500psi,萃取循环次数3次,静态萃取时间5分钟,萃取池体积11 mL。萃取液常压下浓缩至1mL。

(2)色谱条件:色谱柱为DB-5MS(30m×0.25mm×0.25μm)。程序 升温条件:50℃(停留1min),8℃/min升至220℃(停留7min),10℃ /min升至280℃(停留20min)。载气,氦气。流速,1.2mL/min。进样量, 1μL。

(3)质谱条件:电子轰击电离(EI);离子源温度,230℃;检测器 电压:1047V。质谱扫描范围:33-500

实验样品色谱图见附图5。

2.2峰识别

将获得的分析样本原始数据文件(CDF格式)导入AMDIS软件(v.2. 62或其它版本均可),进行峰识别。去卷积参数为:component width设定 值为20,adjacent peak subtraction,resolution,sensitivity,shape requirement 等参数分别设置为two,high,low,medium等。运行AMDIS,得到峰识 别结果。删除重复识别结果,最终确定识别出331个化合物。

2.3重叠峰确定(分组)

从AMDIS分析结果文件中提取所识别色谱峰的保留信息(包括峰顶时 间,起始、峰顶、结束点的扫描点信息),并利用该信息进行分组。分组原 则为将彼此相邻并重叠的化合物(共流出化合物)分为一组。分组的具体 操作如下:寻找两个相邻色谱峰之间前一色谱峰结束时间和后一色谱峰起 始时间相差大于0.1min(可以根据实际情况修改)的时间窗口。分组节点 定义为:

Ti+1=Tend x+(Tini x+1-Tend x)×0.5

式中,Ti+1为第i+1组的起始时间(也即第i组的结束时间),Tend x 为第x个色谱峰的结束时间,Tini x+1为第x+1个色谱峰的起始时间。

对重叠峰进行统计,本例共提取出151个化合物存在共流出现象。

2.4特征值的计算和特征离子提取

确定分组后,根据被识别化合物的保留信息(包括峰顶时间,起始、 峰顶、结束点的扫描点信息),从CDF原始数据中提取组内色谱峰的质谱 强度信息。对于某个特定色谱峰,比较其峰顶和前后相邻色谱峰峰顶的质 谱强度信息,计算质谱碎片的特征值,并通过特征值筛选出特征离子,作 为定量分析的定量离子。如果某化合物没有共流出峰,则选取绝对值小于 阈值(通常选100000)的3个丰度最大的质谱离子作为定量离子。对于存 在共流出现象的色谱峰,其碎片离子的特征值采用如下公式进行计算:

Saim1-ItRbm-ItRam×e-4.5(tRb-tRatRai-tRa)2ItRam-ItRbm×e-4.5(tRb-tRatRbt-tRb)2(tRa>tRb)---(1)

Satm1-ItRbm-ItRam×e-4.5(tRb-tRatRat-tRa)2ItRam-ItRbm×e-4.5(tRb-tRatRbi-tRb)2(tRa<tRb)---(2)

式中,和分别为离子通道m中色谱峰a在峰首和峰尾侧的特征值, 和代表离子通道m中峰a和峰b的峰顶质谱响应强度。分别为峰a和峰b起始、顶点和结束保留时间。将特征值大于 0.8的离子输出,作为特征离子。每个化合物选取两个特征离子(一个备用)。

2.5与商品化软件LECO ChromaTOF的特征离子计算结果比较

与实施例1类似。将实验所获得的GC-TOFMS数据分别用LECO工作 站软件ChromaTOF和本专利方法进行特征离子计算和结果输出,并对所计 算的结果进行比较。结果发现,在被考察的151个存在重叠的色谱峰中, 采用ChromaTOF软件获得的特征离子有107个特征离子是正确的(即与共 流出峰没有重叠),另外有44个误判的特征离子。采用本专利所使用的方 法有125个特征离子是正确的(包括26个化合物正确的判断为不存在特征 离子),有13个误判的特征离子,13个错误地判断为没有特征离子。最终, ChromaTOF软件特征离子判断的准确率为70.9%,本方法判断的准确率为 82.8%。ChromaTOF软件准确率较低的原因在于其给不存在特征离子的化 合物(本例为26个,附图6)也赋予了特征离子。而本专利采用的方法则 直接判断出某些化合物不存在特征离子,虽然这个判断的过程中也会存在 一些错误(本例有13个化合物)。

总之,本发明给出了一种通用的气相色谱-质谱的全组分定量分析方法。 该方法适用于复杂混合物的定量分析。对于分析对象的组成相对简单样本 (如实施例1),该方法选取的特征离子与目前仅有的商品化软件 ChromaTOF的效果相当;对于组成相对更复杂的分析对象(如实施例2) 该方法选取的特征离子优于目前商品化软件的结果。此外,与商品化软件 相比,该方法具有通用性,适用于来自不同GC-MS分析仪器的数据。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号