首页> 中国专利> 基于代谢组学预测培美曲塞化疗疗效及不良反应的方法

基于代谢组学预测培美曲塞化疗疗效及不良反应的方法

摘要

本发明公开了基于代谢组学预测培美曲塞化疗疗效的方法,包括如下步骤:S1:病患的入选以及排除;S2:样本采集;S3:样本检测;S4:疗效评价;基于代谢组学预测培美曲塞化疗不良反应的方法,包括如下步骤:S1:筛选最佳代谢物组合;S2:建立预测模型,本发明检测并确认了代谢产物,同时以此建立一种预测化疗后的疗效模型,能够预测培美曲塞铂类双药治疗非小细胞肺癌的疗效,同时建立了血液不良反应预测模型以及肝脏不良反应预测模型,能够有效确定培美曲塞铂类双药治疗产生的不良反应以及副作用,进而达到疗效的最优化以及不良反应以及副作用的最小化。

著录项

说明书

技术领域

本发明属于非小细胞肺癌化疗效果的生物标志物技术领域,具体涉及基于代谢组学预测培美曲塞化疗疗效及不良反应的方法。

背景技术

肺癌是临床常见的呼吸系统恶性肿瘤,约80%为非小细胞肺癌(NSCLC),若能及早诊断并对早期局限NSCLC行手术切除治疗有治愈可能。但该疾病早期无特异性症状,半数以上NSCLC患者就诊时已为中晚期,部分甚至伴胸腔积液、心包积液,出现血行播散及远处转移,此类患者不仅对放疗不敏感,并易对化疗产生耐受性,治疗效果差,5年生存率甚至未达5%。

培美曲塞是经美国食品和药物管理局批准用于治疗NSCLC的抗叶酸代谢抗肿瘤药物,对于NSCLC有着很好的疗效且毒性较低。当前晚期肺癌的主要化疗方案仍为双药联合化疗,其中培美曲塞联合铂类药物是临床应用广泛的联合化疗方案,但是其治疗有效率不高。

如授权公告号为CN108107134B的发明所公开的预测培美曲塞联合铂类治疗非小细胞肺癌的疗效的新标志物及其应用,所述标志物为亚牛磺酸、尿苷、十二烷酰肉毒碱、胆碱、二甲基甘氨酸、尼克酰胺和十六烷酰肉毒碱,但是其无法对治疗后的疗效以及不良反应以及副作用进行评定,为此我们提出基于代谢组学预测培美曲塞化疗疗效及不良反应的方法。

发明内容

本发明的目的在于提供基于代谢组学预测培美曲塞化疗疗效及不良反应的方法,以解决上述背景技术中提出的无法对治疗后的疗效以及不良反应以及副作用进行评定的问题。

为实现上述目的,本发明提供如下技术方案:基于代谢组学预测培美曲塞化疗疗效的方法,其特征在于包括如下步骤:

S1:病患的入选以及排除;

S2:样本采集;

S3:样本检测;

S4:疗效评价:依据两组化疗前、化疗结束后的胸部计算机断层扫描(CT)所测得的肿瘤大小,参照实体瘤疗效评价标准[6]将临床疗效分为4个等级:CR,目标病灶消失,病变淋巴结短轴缩小≤10mm;PR,基线病灶长径之和缩小﹥30%;疾病稳定(stabledisease,SD),基线病灶长径之和缩小≤30%,或基线病灶长径之和增加≤20%;疾病进展(progressivedisease,PD),基线病灶长径之和增加﹥20%或出现新病灶。

优选的,所述S1步骤包括病患入选标准以及病患排除标准,所述病患入选标准具体为:

1)III-IV期非小细胞肺癌患者,接受培美曲塞联合铂类化疗;

2)年龄大于18周岁的男性和非妊娠非哺乳期女性;

3)组织学和细胞学意义上确诊的肿瘤患者,预计存活时间大于等于12周,体力状况ECOG评级0-2级;

4)可清晰确定肿瘤边界;

所述病患排除标准具体为:

1)症状或活跃的脑转移患者;

2)严重的系统性疾病不能参与研究的患者;

3)严重的胸膜或腹膜积液;

4)血浆蛋白<2.0g/dL,体表面积>3m2;

5)需要肾透析的患者。

优选的,所述S2具体为:在患者第一个周期化疗开始前采血3mL。

基于代谢组学预测培美曲塞化疗不良反应的方法,其特征在于包括如下步骤:

S1:筛选最佳代谢物组合:选择的代谢物能否有效的预测疾病患者,需要运用逻辑回归模型进行评估。线性回归用于描述自变量和因变量之间的关系,但是因变量的取值范围很广,无法用于分类问题。逻辑回归是在线性回归的基础上,套用了Sigmoid函数,将因变量的值限定在[0,1]区间内,可用于二分类和多分类问题,常用于数据挖掘、疾病自动诊断、经济预测等领域。逻辑回归模型使用R语言包stats的glm函数实现。

1)glm的参数设置

glm是stats包的广义线性模型拟合函数,将家族参数设置为二分类的逻辑回归即可用于建立逻辑回归模型。其他参数使用默认设置。

2)最佳代谢物组合

将候选代谢物的全子集使用训练集样本建立逻辑回归模型,并使用赤池信息量准则(AkaikeInformationCriterion,AIC)(Akaike,1974)筛选最佳代谢物组合。AIC值越低,模型效果越好。最佳逻辑回归模型的残差是9.247E-09,AIC值是28.00,模型的参数如下表所示。

3)最佳生物标志物及ROC曲线

逻辑回归模型的效果使ROC曲线(Receiver Operating Characteristic Curve,受试者工作特征曲线,简称ROC曲线)评估。ROC曲线是对于可能或将会存在混淆的两种条件或自然状态,需要试验者、专业诊断学工作者以及预测工作者作出精细判别,或者准确决策的一种定量方法。ROC曲线已经在医学领域广泛应用于临床诊疗、人群筛检等研究。

ROC曲线的横坐标是假阳性率或1-特异性,纵坐标是真阳性率或灵敏度,两个坐标轴的取值范围都是[0,1]。ROC曲线与横坐标之间的面积就是曲线下面积(AreaUnderCurve,AUC),是ROC曲线的定量评估指标。AUC的取值范围是(0.5,1],越接近1,模型的预测效果越好。最优临界值使用约登J统计(Youden’sJstatistic)(Youden,1950)计算得到,计算公式为max(sensitivities+specificities)。最优临界值显示在ROC曲线上,格式为A(B,C),其中A是逻辑回归模型预测值的阈值,B和C分别表示特异性和敏感性。AUC和最佳临界值使用“DeLong”方法计算了95%的置信区间(Confidenceinterval,CI)。该方法由DeLongetal.(1988)定义,相应的算法由SunandXu(2014)建立。AUC的置信区间显示在AUC值之后的括号内,最优临界值的置信区间以水平、垂直方向的两条线段表示。ROC曲线的绘制和AUC的计算使用R语言包pROC完成;

S2:建立预测模型。

优选的,所述S2具体为:

1)建立疗效预测模型:此处分析了总共108例具有RECIST化疗评估结果的患者,以寻找具有预测作用的代谢物,其中24例被评估为PR,其余84例为SD或PD。首先,筛选出p值<0.05的157种差异表达的代谢产物;其次,建立了p值最小的15种代谢物的logistic回归模型,所有这些均归类为脂质。通过ROC诊断分析(Table 2)评估了它们的预测效果,结果表明,它们在接受者工作特征曲线下的面积(AUROC)在0.6918至0.7386之间。为了建立更可靠的模型来预测化学疗法的反应,根据Akaike信息准则(AIC)测试了这15种候选代谢物的不同组合。较低的AIC值表示较好的模型效果。最后,包含磷脂酰丝氨酸(PS)(20:4/20:1),鞘磷脂(SM)(d18:1/18:0)和磷脂酸(PA)(18:1/20:0)的模型组合显示最佳功效,AUROC为0.7986。

疗效预测模型公式:

Panel A=-0.000011*a-(9.9014E-08)*b-0.000042*c+7.086

a:磷脂酰丝氨酸(PS)(20:4/20:1)

b:鞘磷脂(SM)(d18:1/18:0)

c:磷脂酸(PA)(18:1/20:0);

2)血液不良反应预测模型:根据电子病历系统的记录,将113纳入分析,有76例有血液不良反应的患者(Group Blood ADR)和37例无血液不良反应的患者(Group BloodNormal)。使用学生t检验比较了两组中所有检测到的1141种内源性代谢物,并筛选出76种差异表达的代谢物(p<0.05)。此外,选择了p值最小的15种代谢物,其中大多数被归类为AUROC为0.6600至0.7092的脂质,用于后续分析。建立了针对这15种代谢物的不同种类组合的逻辑回归模型。根据AIC选择标准,包含甘油三酸酯(TG)(14:0/22:3/22:5),3-(3-羟基苯基)丙酸和肉碱C18:0的专家组在AUROC为0.7954。

血液不良反应预测模型公式:

Panel B=3.522-0.00003*d-1170+0.000012*e-0.000002*f

d:甘油三酸酯(TG)(14:0/22:3/22:5)

e:3-(3-羟基苯基)丙酸

f:肉碱C18:0;

3)肝脏不良反应预测模型:有23例有肝不良反应(肝毒性组)和90例无肝不良反应(肝正常组)。同样,使用学生t检验比较了两组中所有1141种检测到的内源性代谢物,并筛选出54种差异表达的代谢物(p<0.05)。此外,还根据p值选择了15种候选代谢物。如表4所示,它们的AUROC范围为0.6800至0.7550。随后基于AIC筛选标准使用候选化合物的不同组合进行的logistic回归分析发现,包含硬脂酸,血栓烷B3(TxB3),L-高瓜氨酸和磷酸肌醇(PI)(20:3/18:0)的模型显示出最好的效果预测能力,AUROC为0.8168。

肝脏不良反应预测模型公式:

Panel C=15.801-0.000102*g-0.000016*h-0.000051*i+0.000013*j

g:硬脂酸

h:血栓烷B3(TxB3)

i:L-高瓜氨酸

j:磷酸肌醇(PI)(20:3/18:0)。

与现有技术相比,本发明的有益效果是:

本发明检测并确认了代谢产物,同时以此建立一种预测化疗后的疗效模型,能够预测培美曲塞铂类双药治疗非小细胞肺癌的疗效,同时建立了血液不良反应预测模型以及肝脏不良反应预测模型,能够有效确定培美曲塞铂类双药治疗产生的不良反应以及副作用,进而达到疗效的最优化以及不良反应以及副作用的最小化。

附图说明

图1为本发明的疗效预测模型示意图;

图2为本发明的血液不良反应预测模型示意图;

图3为本发明中的肝脏不良反应预测模型示意图;

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1-图3,实验方法如下:

1.入组人数:疗效评价108人,不良反应113人。

2.病患的入选以及排除包括病患入选标准以及病患排除标准,病患入选标准具体为:

1)III-IV期非小细胞肺癌患者,接受培美曲塞联合铂类化疗;

2)年龄大于18周岁的男性和非妊娠非哺乳期女性;

3)组织学和细胞学意义上确诊的肿瘤患者,预计存活时间大于等于12周,体力状况ECOG评级0-2级;

4)可清晰确定肿瘤边界;

病患排除标准具体为:

1)症状或活跃的脑转移患者;

2)严重的系统性疾病不能参与研究的患者;

3)严重的胸膜或腹膜积液;

4)血浆蛋白<2.0g/dL,体表面积>3m2;

5)需要肾透析的患者。

3.样本采集

在患者第一个周期化疗开始前采血3mL

4.样本检测

血浆/血清样本

亲水性物质提取方法

1)样本从-80℃冰箱中取出,冰上解冻,解冻后,涡旋10s混匀。

2)取样本50uL于EP管中,加入150uL预冷的冰甲醇(含1ug/mL的2-氯苯丙氨酸作为内标)。

3)涡旋3min,12000r/min,4℃条件下离心10min。

4)离心完后吸取上清液到另一个新的EP管中。

5)上清液12000r/min,4℃条件下再离心5min,取上清液到进样瓶内衬管中,用于LC-MS/MS分析。

疏水性物质提取方法

1)从-80℃冰箱中取出样品放在装有冰的离心管盒里解冻;

2)样本解冻后,涡旋混匀10s左右,离心5min,4℃,3000r/min;

3)取样本50uL加入到对应的已编号的离心管中,加入1mL脂质提取液(含内标混合液);

4)涡旋2min,超声5min,加入500uL水;

5)涡旋1min,12000r/min、4℃条件下离心10min;

6)离心完后吸取上清液500uL到编号好的离心管中,浓缩;

7)用100uL流动相B复溶,用于LC-MS/MS分析。

5.色谱质谱采集条件

数据采集仪器系统主要包括超高效液相色谱(Ultra Performance LiquidChromatography,UPLC)(Shim-pack UFLC SHIMADZU CBM30A,https://www.shimadzu.com/)和串联质谱(Tandem mass spectrometry,MS/MS)(AppliedBiosystems QTRAP,https://sciex.com/)。

亲水性物质液相条件

1)色谱柱:Waters ACQUITY UPLC HSS T3 C181.8μm,2.1mm*100mm;

2)流动相:A相为超纯水(0.1%的甲酸),B相为乙腈(0.1%的甲酸);

3)洗脱梯度:0min水/乙腈(95:5V/V),11.0min为10:90V/V,12.0min为10:90V/V,12.1min为95:5V/V,14.0min为95:5V/V;

4)流速0.4ml/min;柱温40℃;进样量5uL。

疏水性物质液相条件

1)色谱柱:Waters ACQUITY UPLC HSS T3 C181.8μm,2.1mm*100mm;

2)流动相:A相为超纯水(0.04%的乙酸),B相为乙腈(0.04%的乙酸);

3)洗脱梯度:0min水/乙腈(95:5V/V),11.0min为5:95V/V,12.0min为5:95V/V,12.1min为95:5V/V,14.0min为95:5V/V;

4)流速0.4ml/min;柱温40℃;进样量5uL。

亲水性物质质谱条件

电喷雾离子源(electrospray ionization,ESI)温度550℃,质谱电压5500V-4500V,离子源气体I(GS I)55psi,气体II(GS II)60psi,气帘气(curtain gas,CUR)25psi碰撞诱导电离(collision-activated dissociation,CAD)参数设置为高。在三重四极杆(Qtrap)中,每个离子对是根据优化的去簇电压(declustering potential,DP)和碰撞能(collision energy,CE)进行扫描检测。

疏水性物质质谱条件

电喷雾离子源(electrospray ionization,ESI)温度550℃,质谱电压5500V-4500V,离子源气体I(GS I)55psi,气体II(GS II)60psi,气帘气(curtain gas,CUR)25psi,碰撞诱导电离(collision-activated dissociation,CAD)参数设置为高。在三重四极杆(Qtrap)中,每个离子对是根据优化的去簇电压(declustering potential,DP)和碰撞能(collision energy,CE)进行扫描检测。

代谢物定性与定量原理

基于靶向标品数据库MWDB(metware database),根据检测物质的保留时间RT(Retention time)、子母离子对信息及二级谱数据进行定性分析。

代谢物定量是利用三重四极杆质谱的多反应监测模式(multiple reactionmonitoring,MRM)分析完成。MRM模式中,第一重四极杆首先筛选目标物质的前体离子(母离子),排除掉其他物质对应的前体离子以初步排除干扰;前体离子在第二重四极杆中经碰撞诱导电离后被打碎,并依据物质自身的结构特征断裂形成一系列该物质特有的碎片离子,碎片离子再通过第三重四极杆过滤选择出一个典型的特征碎片离子,排除非目标离子的干扰,使定量更为精确,重复性更好。在获得不同样本的液质下机数据后,对所有代谢物的提取离子色谱峰分别进行峰下面积积分,并对其中同一代谢物在不同标本中的色谱峰进行积分校正。

6.疗效评价(RECIST标准)

依据两组化疗前、化疗结束后的胸部计算机断层扫描(CT)所测得的肿瘤大小,参照实体瘤疗效评价标准[6]将临床疗效分为4个等级:CR,目标病灶消失,病变淋巴结短轴缩小≤10mm;PR,基线病灶长径之和缩小﹥30%;疾病稳定(stable disease,SD),基线病灶长径之和缩小≤30%,或基线病灶长径之和增加≤20%;疾病进展(progressive disease,PD),基线病灶长径之和增加﹥20%或出现新病灶。

筛选最佳代谢物组合

选择的代谢物能否有效的预测疾病患者,需要运用逻辑回归模型进行评估。线性回归用于描述自变量和因变量之间的关系,但是因变量的取值范围很广,无法用于分类问题。逻辑回归是在线性回归的基础上,套用了Sigmoid函数,将因变量的值限定在[0,1]区间内,可用于二分类和多分类问题,常用于数据挖掘、疾病自动诊断、经济预测等领域。逻辑回归模型使用R语言包stats的glm函数实现。

glm的参数设置

glm是stats包的广义线性模型拟合函数,将家族参数设置为二分类的逻辑回归即可用于建立逻辑回归模型。其他参数使用默认设置。

最佳代谢物组合

将候选代谢物的全子集使用训练集样本建立逻辑回归模型,并使用赤池信息量准则(Akaike Information Criterion,AIC)(Akaike,1974)筛选最佳代谢物组合。AIC值越低,模型效果越好。最佳逻辑回归模型的残差是9.247E-09,AIC值是28.00,模型的参数如下表所示。

最佳生物标志物及ROC曲线

逻辑回归模型的效果使用ROC曲线(Receiver Operating CharacteristicCurve,受试者工作特征曲线,简称ROC曲线)评估。ROC曲线是对于可能或将会存在混淆的两种条件或自然状态,需要试验者、专业诊断学工作者以及预测工作者作出精细判别,或者准确决策的一种定量方法。ROC曲线已经在医学领域广泛应用于临床诊疗、人群筛检等研究。

ROC曲线的横坐标是假阳性率或1-特异性,纵坐标是真阳性率或灵敏度,两个坐标轴的取值范围都是[0,1]。ROC曲线与横坐标之间的面积就是曲线下面积(Area UnderCurve,AUC),是ROC曲线的定量评估指标。AUC的取值范围是(0.5,1],越接近1,模型的预测效果越好。最优临界值使用约登J统计(Youden’s J statistic)(Youden,1950)计算得到,计算公式为max(sensitivities+specificities)。最优临界值显示在ROC曲线上,格式为A(B,C),其中A是逻辑回归模型预测值的阈值,B和C分别表示特异性和敏感性。AUC和最佳临界值使用“DeLong”方法计算了95%的置信区间(Confidence interval,CI)。该方法由DeLong et al(1988)定义,相应的算法由Sun and Xu(2014)建立。AUC的置信区间显示在AUC值之后的括号内,最优临界值的置信区间以水平、垂直方向的两条线段表示。ROC曲线的绘制和AUC的计算使用R语言包pROC完成。

预测模型

疗效预测模型

此处分析了总共108例具有RECIST化疗评估结果的患者,以寻找具有预测作用的代谢物,其中24例被评估为PR,其余84例为SD或PD。首先,筛选出p值<0.05的157种差异表达的代谢产物;其次,建立了p值最小的15种代谢物的logistic回归模型,所有这些均归类为脂质。通过ROC诊断分析(Table 2)评估了它们的预测效果,结果表明,它们在接受者工作特征曲线下的面积(AUROC)在0.6918至0.7386之间。为了建立更可靠的模型来预测化学疗法的反应,根据Akaike信息准则(AIC)测试了这15种候选代谢物的不同组合。较低的AIC值表示较好的模型效果。最后,包含磷脂酰丝氨酸(PS)(20:4/20:1),鞘磷脂(SM)(d18:1/18:0)和磷脂酸(PA)(18:1/20:0)的模型组合显示最佳功效,AUROC为0.7986,参见图1以及表1。

疗效预测模型:

PanelA=-0.000011*a-(9.9014E-08)*b-0.000042*c+7.086

a:磷脂酰丝氨酸(PS)(20:4/20:1)

b:鞘磷脂(SM)(d18:1/18:0)

c:磷脂酸(PA)(18:1/20:0)

Table 2.Diagnostic ability of plasma endogenous compounds onchemotherapeutic efficacy of pemetrexed.

Footnote:FC,fold change of group(PD+SD)/group PR,phosphatidylserine(PS),sphingomyelin(SM),phosphatidylethanolamine(PE),phosphatidylcholine(PC),ceramide(Cer),sphingomyelin(SM),lysophatidylethanolamine(LPE),phosphatidicacid(PA)。

表1

逻辑回归模型PanelA的cutoff(截断值)为1.150,将代谢物检测到的峰面积带入公式,若计算值大于1.150则预测化疗无效(疾病进展),若计算值小于1.150则预测化疗有效(疾病缓解)。

血液不良反应预测模型

根据电子病历系统的记录,将113纳入分析,有76例有血液不良反应的患者(GroupBlood ADR)和37例无血液不良反应的患者(Group Blood Normal)。使用学生t检验比较了两组中所有检测到的1141种内源性代谢物,并筛选出76种差异表达的代谢物(p<0.05)。此外,选择了p值最小的15种代谢物,其中大多数被归类为AUROC为0.6600至0.7092的脂质,用于后续分析。建立了针对这15种代谢物的不同种类组合的逻辑回归模型。根据AIC选择标准,包含甘油三酸酯(TG)(14:0/22:3/22:5),3-(3-羟基苯基)丙酸和肉碱C18:0的专家组在AUROC为0.7954参见图2与表2。

血液不良反应预测模型:

PanelB=3.522-0.00003*d-1170+0.000012*e-0.000002*f

d:甘油三酸酯(TG)(14:0/22:3/22:5)

e:3-(3-羟基苯基)丙酸

f:肉碱C18:0。

Table 3.Diagnostic ability of plasma endogenous compounds on theoccurrence of blood ADR after pemetrexed treatment。

Footnote:FC,fold change of group(Blood ADR)/group(Blood Normal),triglyceride(TG),phosphatidylethanolamine(PE),lysophosphatidylcholine(LysoPC)。

表2

逻辑回归模型PanelB的cutoff(截断值)为0.7499,将代谢物检测到的峰面积带入公式,若计算值大于0.7499则预测发生血液不良反应,若计算值小于0.7499则预测不发生血液不良反应。

肝脏不良反应预测模型

有23例有肝不良反应(肝毒性组)和90例无肝不良反应(肝正常组)。同样,使用学生t检验比较了两组中所有1141种检测到的内源性代谢物,并筛选出54种差异表达的代谢物(p<0.05)。此外,还根据p值选择了15种候选代谢物。如表4所示,它们的AUROC范围为0.6800至0.7550。随后基于AIC筛选标准使用候选化合物的不同组合进行的logistic回归分析发现,包含硬脂酸,血栓烷B3(TxB3),L-高瓜氨酸和磷酸肌醇(PI)(20:3/18:0)的模型显示出最好的效果预测能力,AUROC为0.8168,参见图3与表3。

肝脏不良反应预测模型:

PanelC=15.801-0.000102*g-0.000016*h-0.000051*i+0.000013*j

g:硬脂酸

h:血栓烷B3(TxB3)

i:L-高瓜氨酸

j:磷酸肌醇(PI)(20:3/18:0)。

Footnote:FC,fold change of group(Hepatotoxicity)/group(Liver Normal),thromboxane B3(TxB3),diglyceride(DG),phosphoinositide(PI)。

表3

逻辑回归模型PanelC的cutoff(截断值)为-6.865,将代谢物检测到的峰面积带入公式,若计算值大于-6.865则预测发生肝脏不良反应,若计算值小于-6.865则预测不发生肝脏不良反应。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号