首页> 中国专利> 基于UPLC‑QTOF快速表征样品中化学成分的方法

基于UPLC‑QTOF快速表征样品中化学成分的方法

摘要

一种基于UPLC‑QTOF快速表征样品中化学成分的方法,针对样品UPLC‑QTOF非靶标代谢轮廓解析获得样品中化学成分的信息,具体步骤包括色谱峰提取、高精度质谱表征、属于同一个物质的离子碎片的聚类;首先将UPLC‑QTOF中的高分辨质谱数据转化为低分辨质谱,提取各m/z下的色谱信号;利用局部极小值迭代优化校正色谱信号中的基线漂移问题;待基线校正后,利用高斯平滑脊线寻优获得各色谱信号中的色谱峰位置;根据色谱峰位置,提取对应的高精度质谱表征该色谱峰,每一个色谱峰均可能对应于一个化合物在质谱离子源内的碎片离子信号;最后将对应于同一个物质的源内裂解碎片进行聚类,最终实现样品中化学成分的快速表征。

著录项

  • 公开/公告号CN106950315A

    专利类型发明专利

  • 公开/公告日2017-07-14

    原文格式PDF

  • 申请/专利权人 宁夏医科大学;

    申请/专利号CN201710249829.9

  • 发明设计人 于永杰;付海燕;佘远斌;

    申请日2017-04-17

  • 分类号

  • 代理机构宁夏合天律师事务所;

  • 代理人杨丽坤

  • 地址 750003 宁夏回族自治区银川市兴庆区胜利街1160号

  • 入库时间 2023-06-19 02:48:20

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-03-26

    授权

    授权

  • 2017-08-08

    实质审查的生效 IPC(主分类):G01N30/02 申请日:20170417

    实质审查的生效

  • 2017-07-14

    公开

    公开

说明书

技术领域

本发明涉及一种分析样品中所含有的化学成分的方法,尤其涉及一种基于UPLC-QTOF快速表征样品中化学成分的方法。

背景技术

近年来,非靶标代谢轮廓分析技术因强调从全成分的角度表征研究对象,在植物研究领域受到了广泛的关注。样品中化学成分复杂的特点恰能充分发挥基于UPLC-QTOF(超高效液相色谱-四级杆飞行时间质谱仪)非靶标代谢轮廓技术的优势,对其中的化学成分能够较为全面地予以分析。然而,UPLC-QTOF非靶标技术分析每一个样本,都能获得包含上千种的化学成分的数据信息,如何能够将这些成分信息快速提取出来,进而用于样品中化学成分的快速表征,是一个具有挑战性的难题。

在世界范围内,UPLC-QTOF非靶标代谢轮廓数据中化学物质信息提取法方法发展严重滞后。当前最为著名的信息一些物质信息提取方法包括XCMS、各仪器厂商自带的数据分析工具包。虽然这些工具所采用的物质信息提取、分析原理不同,但这些方法本身存在着诸多问题,其中较为典型的是假阳性和假阴性色谱峰问题。假阳性色谱峰会导致出现大量的错误物质信息,增加额外的工作量,假阴性问题则是物质信息提取不全,导致丢失重要的化学物质信息,为了尽量避免假阳性和假阴性问题,分析人员需要进行人为干预,增加了大量的工作量,降低了分析效率。

发明内容

针对现有技术的不足,本发明所要解决的技术问题是提供一种基于UPLC-QTOF快速表征样品中化学成分的方法。针对当前UPLC-QTOF非靶标代谢轮廓解析方法中存在的问题和困难,提出了一种新的能够快速解析样品UPLC-QTOF非靶标代谢轮廓数据中化学物质方法,能够有效解决假阳性和假阴性的问题。

本发明解决其技术问题所采用的技术方案是:

一种基于UPLC-QTOF快速表征样品中化学成分的方法,包括以下步骤:

获得低分辨质谱数据:将UPLC-QTOF中得到的高分辨质谱数据转化为低分辨质谱数据;即每一个样本获得一个Time×m/z的色谱信号矩阵,一个m/z下收集一个色谱信号;

一个m/z下色谱信号中基线的校正:将一个m/z色谱信号中的局部极小值设定为该m/z色谱信号的初始背景噪声的极小值,使用迭代优化算法剔除该初始背景噪声中属于色谱信号中色谱峰的部分,得到该色谱信号真正的背景噪声的极小值,根据该色谱信号真正的背景噪声的极小值在色谱信号中的原始位置,利用线性插值估算出基线漂移,扣除基线漂移后,获得一个m/z下基线校正后色谱信号;

每个样本中所有m/z下色谱信号基线校正:将每一个m/z下的色谱信号都做上述一个m/z色谱信号中基线的校正的处理,得到基线校正后的m/z色谱信号;

色谱信号中有效色谱峰的提取:使用不同尺度高斯平滑卷积运算进行色谱信号平滑,提取每一次平滑后色谱信号中所有的局部极大值,且将所有的局部极大值的位置标记,通过脊线寻优的方法,分别获得每个色谱峰在色谱信号中的原始位置,接着使用色谱信号中非色谱峰部分的仪器噪声波动,计算出仪器噪声水平,剔除色谱信号与仪器噪声之比小于3的色谱峰,剩下的色谱峰为能够准确定量的有效色谱峰,即完成色谱信号中有效色谱峰的提取;

一个色谱峰的高精度质谱表征:根据一个有效色谱峰所位于的低分辨色谱信号的m/z值,查找高分辨率质谱信号中在该m/z±0.5Da范围内的最大的离子,并使用该离子的高精度质谱值标记该有效色谱峰,从而获得一个色谱峰的高精度质谱值;

所有色谱峰的高精度质谱表征:将每一个有效色谱峰均使用上述一个色谱峰的高精度质谱表征的方法处理,最终得到所有色谱峰的高精度质谱表征。

最优的,还包括以下步骤:

离子碎片的聚类:一个分子质量为M的物质在正离子模式下会产生[M+H]+、[M+2H]+、[M+3H]+、[M+H-H2O]+、[M+H-2H2O]+、[M+NH3]+、[M+Na]+、[M-H+Na]+、[M+H+Na]+、[M-H+2Na]+、[M+H+2Na]+或[M+K]+中的至少一个碎片离子峰,将得到的所有色谱峰的高精度质谱表征中时间窗口为0.05min,质谱精度设置为100ppm中属于同一物质的分子离子峰和碎片离子峰进行聚类。

最优的,所述获得低分辨质谱数据步骤具体中,将UPLC-QTOF中得到的高分辨质谱数据转化为精度为1Da步长的低分辨质谱数据。

最优的,所述一个m/z下色谱信号中基线的校正步骤中,使用迭代优化算法的迭代收敛标准为10-6

最优的,所述色谱信号中有效色谱峰的提取步骤中,其中使用不同尺度高斯平滑卷积运算进行色谱信号平滑,所使用高斯函数标准偏差范围是1~13,且步长0.1。

最优的,还包括以下步骤:

UPLC-QTOF分析:

进行UPLC-QTOF分析的色谱条件为:色谱柱为Agilent C18柱,色谱柱的长度为100mm,色谱柱的直径为4.6mm,色谱柱的粒径为1.7μm,柱温为35℃;流动相A为0.1%甲酸水溶液,流动相B为0.1%甲酸乙腈溶液,色谱分析时,流动相梯度为,初始时流动相A占流动相总体积的95%,流动相B占流动相总体积的5%,接下来的20min内流动相A占流动相总体积的份数降至5%,流动相B占流动相总体积的份数升至95%;

进行UPLC-QTOF分析的质谱条件为:干燥气温度为350℃;干燥气流速为12L/min;喷雾气压力为40psi;保护气温度为350℃;保护气流速为10L/min;电离电压为3500V;质谱扫描范围为50–1500;正离子模式;

UPLC-QTOF分析结束后得到高分辨质谱数据。

最优的,还包括以下步骤:

样品的制备过程:将新鲜收集的样本放入液氮中速冻,在液氮条件下将样品研磨粉碎,将粉碎的样品中加入提取液,涡旋混匀后室温超声处理,然后离心,且取上清液转移至色谱瓶中,待UPLC-QTOF分析。

最优的,所述样品的制备过程步骤中,提取液包括3体积份的乙腈、3体积份的异丙醇和2体积份的水;涡旋1~4分钟,室温超声处理50~80分钟,离心条件为12000r/min离心5min。

由上述技术方案可知,本发明提供了的基于UPLC-QTOF快速表征样品中化学成分的方法,先将UPLC-QTOF中的高分辨质谱数据转化为低分辨质谱,提取各m/z(质子数/电荷数的比值)下的色谱信号;利用局部极小值迭代优化校正色谱信号中的基线漂移问题;待基线校正后,利用高斯平滑脊线寻优获得各色谱信号中的色谱峰位置;根据色谱峰位置,提取对应的高精度质谱表征该色谱峰,每一个色谱峰均可能应于一个化合物在质谱离子源内的碎片离子信号;最后将对应于同一个物质的源内裂解碎片进行聚类,最终实现样品中化学成分的快速表征。

同经典方法相比,本方法的优势在于经过基线校正,结合高斯平滑脊线提取优化方法,并利用噪声估计剔除信噪比低的色谱峰,能够有效避免假阳性和假阴性的色谱峰提取结果。能够实现样品UPLC-QTOF非靶标代谢轮廓数据的快速解析,适合大批量数据的快速分析。

附图说明

图1:UPLC-QTOF高分辨质谱中m/z范围286.5-287.5下质谱碎片离子分布特点。插图a)是本发明所述的低分辨质谱数据的色谱信号。插图b)和插图c)分别给出了UPLC-QTOF高分辨质谱中两个离子碎片簇下的色谱信号。插图d)给出了放大后UPLC-QTOF高分辨质谱中m/z从287.2331到287.2395下的离子分布特点。可以看出插图a)给出的色谱信号提取基本是b)和c)的加合。

图2:本发明给出的色谱峰提取示例以及同经典方法的对比。左侧一列(A)-(D)为本发明进行色谱分提取原理示意图。右侧一列(E)-(H)是经典基于墨西哥帽小波函数峰提取方法(MassSpecWavelet)示意图。(A)原始色谱信号。图中标注了人为判断出来的5个色谱峰。图(B)不同尺度高斯平滑卷积运算进行色谱信号平滑后的色谱信号。(C)标记出不同平滑尺度下的局部极大值位置,以及通过脊线寻优确定22条脊线(每一个脊线对应一个潜在的色谱峰)。(D)剔除色谱信号与仪器噪声之比小于3的色谱峰后,本发明最终确定的5个有效色谱峰。(E)不同尺度墨西哥小帽小波函数中的系数。(F)不同尺度小波函数下的小波脊线。(G)经典MassSpecWavelet方法筛选出来的潜在的色谱峰。(H)MassSpecWavelet最终提取出来的色谱峰。

图3:本发明色谱峰的高精度质谱表征的标记示例。图A给出了m/z为287下低分辨色谱信号中一个色谱峰的高精度质谱表征(方块标出),根据色谱峰的位置,获得该时间点下采集的质谱信号,然后提取出高分辨率质谱信号m/z从286.5到287.5范围内的质谱分布,图A左上角给出的是高分辨率质谱信号m/z从286.5到287.5范围内的质谱分布,最后把287.0558这一最大信号强度的碎片离子标记为该有效色谱峰,图A右上角给出了最后有效色谱峰提取和质谱标记后的结果。图B给出了m/z下287色谱信号中的所有色谱峰的高精度质谱表征。本发明最终提出了20个色谱峰,并获得了相应的高精度质谱信号(见图2中表)。

图4:根据UPLC-QTOF源内裂解特点,本发明成功搜索出芦丁(Rutin)在离子源内产生几个碎片离子,以及每个离子碎片下的色谱峰。其中M表示芦丁分子,图B到图E给出了本发明检测到芦丁的[M+H]+、[M+2H]+、[M+3H]+和[M+K]+源内裂解碎片。

图5.本发明与目前最著名方法XCMS和商业化仪器Agilent的MassHunter色谱峰提取对比结果。图A是本发明色谱峰提取结果,图B和图C分别是XCMS和MassHunter提取结果。其中XCMS出现了假阴性提取结果,MassHunter则出现了大量的假阳性色谱峰提取结果。三个方法的比较中,本发明有效避免了假阳性和假阴性问题,所得结果最优。

图6.根据本发明的结果与XCMS提取后的结果放入到物质库中进行搜索的匹配比较图,就是在物质库中选择59个茶叶样本进行对比,结果表明本发明匹配到的化合物数据在所比较的样本中均优于XCMS。

具体实施方式

结合本发明的附图,对发明实施例的技术方案做进一步的详细阐述。

茶叶品质是自身其所含有的化学成分整体作用所呈现出来宏观上的感官结果,而目前针对茶叶品质的研究中多集中于一类或少数几类物质的定量分析以表征茶叶品质,如果能够较为全面地表征茶叶中的尽可能多的化学成分,对于茶叶品质鉴定、产地溯源、精细化开发等具有重要意义。重要的是由于茶叶这一植物样本的复杂性,其UPCL-QTOF非靶标代谢轮廓中物质信息提取非常具有挑战性,使用茶叶作为分析样品更具有说服力。

基于UPLC-QTOF快速表征样品中化学成分的方法,包括以下步骤:

S1:样品的制备过程:将新鲜收集的茶叶样本放入液氮中速冻,在液氮条件下将样品研磨粉碎,将20mg粉碎的样品中加入2ml提取液,提取液包括3体积份的乙腈、3体积份的异丙醇和2体积份的水,涡旋2分钟后,室温超声处理60分钟,然后12000r/min离心5min,且取1ml上清液转移至色谱瓶中,待UPLC-QTOF分析。

S2:UPLC-QTOF分析:

进行UPLC-QTOF分析的色谱条件为:色谱柱为Agilent C18柱,色谱柱的长度为100mm,色谱柱的直径为4.6mm,色谱柱的粒径为1.7μm,柱温为35℃;流动相A为0.1%甲酸水溶液,流动相B为0.1%甲酸乙腈溶液,色谱分析时,流动相梯度为,初始时流动相A占流动相总体积的95%,流动相B占流动相总体积的5%,接下来的20min内流动相A占流动相总体积的份数降至5%,流动相B占流动相总体积的份数升至95%;

进行UPLC-QTOF分析的质谱条件为:干燥气温度为350℃;干燥气流速为12L/min;喷雾气压力为40psi;保护气温度为350℃;保护气流速为10L/min;电离电压为3500V;质谱扫描范围为50–1500;正离子模式。

S3:获得低分辨质谱数据:将原始数据转化为mzData格式。进入MATLAB环境进行分析。将UPLC-QTOF中得到的高分辨质谱数据转化为精度为1Da步长的低分辨质谱数据;即每一个样本获得一个Time×m/z的色谱信号矩阵,一个m/z下收集一个色谱信号。

S4:一个m/z下色谱信号中基线的校正:将一个m/z色谱信号中的局部极小值设定为该m/z色谱信号的初始背景噪声的极小值,使用迭代优化算法剔除该初始背景噪声中属于色谱信号中色谱峰的部分,且迭代收敛标准为10-6,得到该色谱信号真正的背景噪声的极小值,根据该色谱信号真正的背景噪声的极小值在色谱信号中的原始位置,利用线性插值估算出基线漂移,扣除基线漂移后,获得一个m/z下基线校正后色谱信号。

S5:每个样本中所有m/z下色谱信号基线校正:将每一个m/z下的色谱信号都做上述一个m/z色谱信号中基线的校正的处理,得到基线校正后的m/z色谱信号。

S6:色谱信号中有效色谱峰的提取:使用不同尺度高斯平滑卷积运算进行色谱信号平滑,所使用高斯函数标准偏差范围是1~13,且步长0.1,提取每一次平滑后色谱信号中所有的局部极大值,且将所有的局部极大值的位置标记,通过脊线寻优的方法,分别获得每个色谱峰在色谱信号中的原始位置,接着使用色谱信号中非色谱峰部分的仪器噪声波动,计算出仪器噪声水平,剔除色谱信号与仪器噪声之比小于3的色谱峰,剩下的色谱峰为能够准确定量的有效色谱峰,即完成色谱信号中有效色谱峰的提取。

S7:一个色谱峰的高精度质谱表征:根据一个有效色谱峰所位于的低分辨色谱信号的m/z值,查找高分辨率质谱信号中在该m/z±0.5Da范围内的最大的离子,并使用该离子的高精度质谱值标记该有效色谱峰,从而获得一个色谱峰的高精度质谱值。

S8:所有色谱峰的高精度质谱表征:将每一个有效色谱峰均使用上述一个色谱峰的高精度质谱表征的方法处理,最终得到所有色谱峰的高精度质谱表征。

S9:离子碎片的聚类:一个分子质量为M的物质在正离子模式下会产生[M+H]+、[M+2H]+、[M+3H]+、[M+H-H2O]+、[M+H-2H2O]+、[M+NH3]+、[M+Na]+、[M-H+Na]+、[M+H+Na]+、[M-H+2Na]+、[M+H+2Na]+或[M+K]+中的至少一个碎片离子峰,将得到的所有色谱峰的高精度质谱表征中时间窗口为0.05min,质谱精度设置为100ppm中属于同一物质的分子离子峰和碎片离子峰进行聚类。

本发明的部分分析数据结果如下:

进一步说明本发明的工作原理。如附图1所述,UPLC-QTOF高分辨质谱中m/z范围286.5-287.5下质谱碎片离子分布特点。插图a)是本发明所述的低分辨质谱数据的色谱信号。插图b)和插图c)分别给出了UPLC-QTOF高分辨质谱中两个离子碎片簇下的色谱信号。插图d)给出了放大后UPLC-QTOF高分辨质谱中m/z从287.2331到287.2395下的离子分布特点。可以看出插图a)给出的色谱信号提取基本是b)和c)的加合,也就是使用低分辨质谱数据并没有遗漏离子碎片簇,而是基本和高分辨率质谱的数据相近。

如附图2所示,本发明给出的色谱峰提取示例以及同经典方法的对比。左侧一列(A)-(D)为本发明进行色谱分提取原理示意图。右侧一列(E)-(H)是经典基于墨西哥帽小波函数峰提取方法(MassSpecWavelet)示意图。(A)原始色谱信号。图中标注了人为判断出来的5个色谱峰。图(B)不同尺度高斯平滑卷积运算进行色谱信号平滑后的色谱信号。(C)标记出不同平滑尺度下的局部极大值位置,以及通过脊线寻优确定22条脊线(每一个脊线对应一个潜在的色谱峰)。(D)剔除色谱信号与仪器噪声之比小于3的色谱峰后,本发明最终确定的5个有效色谱峰。(E)不同尺度墨西哥小帽小波函数中的系数。(F)不同尺度小波函数下的小波脊线。(G)经典MassSpecWavelet方法筛选出来的潜在的色谱峰。(H)MassSpecWavelet最终提取出来的色谱峰。可以明显看出,使用分发明的方法得到的色谱峰更接近实际情况,而常用的基于墨西哥帽小波函数峰提取方法得到的色谱峰明显少于实际情况,也就是会有很多有用数据被剔除了。

为了进一步证明本发明进行色谱信号中效色谱峰的提取和高精度质谱表征的合理性,如附图3所示,本发明色谱峰的高精度质谱表征的标记示例。图A给出了m/z为287下低分辨色谱信号中一个色谱峰的高精度质谱表征(方块标出),根据色谱峰的位置,获得该时间点下采集的质谱信号,然后提取出高分辨率质谱信号m/z从286.5到287.5范围内的质谱分布,图A左上角给出的是高分辨率质谱信号m/z从286.5到287.5范围内的质谱分布,最后把287.0558这一最大信号强度的碎片离子标记为该有效色谱峰,图A右上角给出了最后有效色谱峰提取和质谱标记后的结果。图B给出了m/z下287色谱信号中的所有色谱峰的高精度质谱表征。本发明最终提出了20个色谱峰,并获得了相应的高精度质谱信号(见图2中表)。

在色谱峰提取和高进度质谱标记的基础上,本发明将属于同一个物质的碎片离子进行聚类。如附图4所示,根据UPLC-QTOF源内裂解特点,本发明成功搜索出芦丁(Rutin)在离子源内产生几个碎片离子,以及每个离子碎片下的色谱峰。其中M表示芦丁分子,图B到图E给出了本发明检测到芦丁的[M+H]+、[M+2H]+、[M+3H]+和[M+K]+源内裂解碎片。

为了证明本发明同经典方法相比具有的色谱峰提取准确的优势,如附图5所示,本发明与目前最著名方法XCMS和商业化仪器Agilent的MassHunter色谱峰提取对比结果。图A是本发明色谱峰提取结果,图B和图C分别是XCMS和MassHunter提取结果。其中XCMS出现了假阴性提取结果,MassHunter则出现了大量的假阳性色谱峰提取结果。三个方法的比较中,本发明有效避免了假阳性和假阴性问题,所得结果最优。

最后,通过对比59个茶叶物质解析结果,证明了本发明的结果优于目前最著名的XCMS方法。如附图6所示,根据本发明(英文简称为AntDAS)的结果与XCMS提取后的结果放入到物质库中进行搜索的匹配比较图,选择59个茶叶样本进行对比,结果表明本发明匹配到的化合物数据在所比较的样本中均优于XCMS。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号