首页> 中国专利> 一种用于肺癌早期诊断的预测模型及其相关产品和应用

一种用于肺癌早期诊断的预测模型及其相关产品和应用

摘要

本发明公开了一种用于肺癌早期诊断的预测模型及其相关产品和应用,所述预测模型中包括如下因素:年龄、性别、精氨酸、天冬氨酸、丝氨酸、戊二酰基肉碱、异戊酰基肉碱、二十碳酰基肉碱,本发明还提供了基于该预测模型的系统、装置、计算机可读存储介质,本发明可以实现肺癌早期的快速有效预测,具有十分优异的应用前景。

著录项

  • 公开/公告号CN113871008A

    专利类型发明专利

  • 公开/公告日2021-12-31

    原文格式PDF

  • 申请/专利权人 大连医科大学附属第二医院;

    申请/专利号CN202111136564.4

  • 申请日2021-09-27

  • 分类号G16H50/30(20180101);G01N30/02(20060101);

  • 代理机构11736 北京预立生科知识产权代理有限公司;

  • 代理人孟祥斌;李红伟

  • 地址 116023 辽宁省大连市沙河口区中山路467号

  • 入库时间 2023-06-19 13:29:16

说明书

技术领域

本发明属于生物医药技术领域,具体地,本发明涉及一种用于肺癌早期诊断的预测模型,更具体地,本发明涉及一种用于肺癌早期诊断的预测模型及其相关产品和应用。

背景技术

肺癌(Lung cancer)是目前全球发病率及死亡率均最高的恶性肿瘤之一,且近年来肺癌的发病率及死亡率呈逐年上升的趋势。肺癌的5年生存率仅为16.8%(Hance K W,Anderson W F,Devesa S S,et al.Trends in inflammatory breast carcinomaincidence and survival:the surveillance,epidemiology,and end results programat the National Cancer Institute[J].Journal of the National Cancer Institute,2005,97(13):966-975.)。非小细胞肺癌(Non-small cell lung cancer,NSCLC)约占所有肺癌病理类型的85%,NSCLC分为腺癌(Adenocarcinoma,AC)、鳞状细胞癌(Squamous cellcarcinoma,SCC)和大细胞癌(Large cell carcinoma),其中,AC、SCC是NSCLC最常见的两种类型,AC和SCC约占NSCLC的70%。大多数NSCLC患者在确诊时已处于肺癌晚期,传统治疗方法的效果不佳。目前,肺癌的病因尚未完全清楚,其可能原因除与机体内在因素有关外,社会环境因素亦是一个不可忽视的问题,一般认为肺癌与下列因素有关:吸烟、职业和环境接触、既往肺部慢性感染、遗传因素、大气污染。

近年来,基于与肿瘤发生、发展相关的驱动基因为靶点研发的新药、针对性的个体化分子靶向治疗,成为晚期肺癌的研究热点并取得了显著的临床进展。然而,尽管肺癌的治疗方法取得了进展,但其十年生存率仍然非常低且仅为10%以下,其原因在于,大多数肺癌患者在发现时已经处于晚期。因此,肺癌的早期诊断对于提高患者的生存时间和生活质量而言至关重要。肺癌具有如下的典型特征:在肺癌早期完全没有症状,发展到某一程度之后也停留在类似普通感冒的咳嗽、喀痰程度的症状,从而导致其诊断非常困难,无法通过普通门诊发现,即便是相同的肺癌,根据其发生位置的不同显示出不同的症状。作为肺癌的一般症状,具有咳嗽、带血痰或咳血、呼吸困难、胸部疼痛、沙哑声音、上腔静脉综合征、骨头疼痛和骨折、头痛、恶心、呕吐等,当患者自己意识到这种症状的表现开始严重时,应视为肺癌已经发展到不小的程度的状态。因此,目前肺癌早期诊断为提高患者的生存可能性的最佳方法。

肺癌目前的诊断技术包括影像学、病理学、外周血肿瘤标志物等。低剂量计算机断层扫描(LDCT)被推荐为筛查肺癌的有效工具,得益于此,肺结节的发现率逐年升高,但它也因假阳性率较高而引起争议。病理学检查如支气管镜、手术、CT引导下肺穿刺等都是有创操作,对患者的身心造成严重伤害,且成本较高。传统的外周血肿瘤标志物灵敏性及特异性不理想,在临床工作中指导意义较低。因此,如何精准识别肺结节人群中早期肺癌的发生率显得至关重要。本发明旨在构建一种简捷、有效的新型诊断模型,用于评估肺结节患者中,早期肺癌的发生风险。近年来,肿瘤代谢重编程被视为肿瘤的十大特征之一,既往多篇文章发现小分子代谢物氨基酸及肉碱在肺癌中表达存在差异性,并构建了肺癌诊治的模型。液相色谱质谱联用(LC-MS/MS)技术是最常用的代谢组学检测技术之一,可对人体内小分子代谢物(氨基酸和肉碱)进行精准定性定量分析。Ni等人曾开发出一种基于氨基酸和肉碱代谢变化的肺癌诊断模型(公式=0.2523×甘氨酸浓度+0.6087×缬氨酸浓度+0.6351×蛋氨酸浓度+0.0341×精氨酸浓度+0.3084×瓜氨酸浓度+0.3033×棕榈酰基肉碱浓度)(Ni J,Xu L,Li W,et al.Targeted metabolomics for serum amino acids and acylcarnitines inpatients with lung cancer[J].Experimental and therapeutic medicine,2019,18(1):188-198.)。

发明内容

鉴于此,本发明的目的在于克服本领域存在的技术缺陷,提高肺癌诊断的准确性,提供一种简捷、有效的新型肺癌诊断模型,用于评估肺结节患者中,早期肺癌的发生风险。

本发明的上述目的通过以下技术方案得以实现:

本发明的第一方面提供了一组用于肺癌早期风险预测的指标组合。

进一步,所述指标组合包括:年龄、性别、精氨酸、天冬氨酸、丝氨酸、戊二酰基肉碱、异戊酰基肉碱、二十碳酰基肉碱;

优选地,所述指标组合包括年龄、性别、精氨酸、天冬氨酸、丝氨酸、戊二酰基肉碱、异戊酰基肉碱、二十碳酰基肉碱、NSE、CYFRA21-1。

进一步,本发明中所述的NSE为神经特异性烯醇化酶(Neuron specific enolase,NSE),本发明中所述的CYFRA21-1为细胞角蛋白19片段(Cytokeratin19fragment,CYFRA21-1)。

本发明的第二方面提供了一种肺癌早期风险预测模型。

进一步,所述模型包括如下指标组合:年龄、性别、精氨酸、天冬氨酸、丝氨酸、戊二酰基肉碱、异戊酰基肉碱、二十碳酰基肉碱;

优选地,所述模型包括列线图;

更优选地,所述列线图中,第一行为分值标尺,分值范围为0-100,第二行为年龄,第三行为性别,第四行为精氨酸的浓度,第五行为天冬氨酸的浓度,第六行为丝氨酸的浓度,第七行为戊二酰基肉碱的浓度,第八行为异戊酰基肉碱的浓度,第九行为二十碳酰基肉碱的浓度,第十行为总风险分值,范围为0-350,第十一行为肺癌发生的风险,范围为0.05-0.95;

最优选地,所述精氨酸的浓度、天冬氨酸的浓度、丝氨酸的浓度的单位为μmol/L;

最优选地,所述戊二酰基肉碱的浓度、异戊酰基肉碱的浓度、二十碳酰基肉碱的浓度的单位为μmol/L。

本发明的第三方面提供了一种肺癌早期风险预测系统。

进一步,所述系统包括输入模块、计算模块和输出模块;

(1)输入模块:用于向计算模块传递受试者的如下信息:年龄、性别、血液中精氨酸的浓度、血液中天冬氨酸的浓度、血液中丝氨酸的浓度、血液中戊二酰基肉碱的浓度、血液中异戊酰基肉碱的浓度、血液中二十碳酰基肉碱的浓度;

(2)计算模块:内置了肺癌早期风险预测模型,所述模型具体如下:

肺癌风险概率值Y=-2.86105+0.07010×年龄+0.79981×性别+0.02306×精氨酸的浓度-0.02030×天冬氨酸的浓度-0.01952×丝氨酸的浓度-5.86318×戊二酰基肉碱的浓度+2.30088×异戊酰基肉碱的浓度-20.09123×二十碳酰基肉碱的浓度;

其中,性别为男性时,性别=1,性别为女性时,性别=2;

(3)输出模块:用于输出计算模块得到的肺癌风险概率值Y;

优选地,所述输入模块和所述计算模块之间通过有线方式和/或无线方式连接;

优选地,所述计算模块和所述输出模块之间通过有线方式和/或无线方式连接;

优选地,所述计算模块包括电脑主机、中央处理器、网络服务器;

优选地,所述输出模块为显示器、打印机、音频输出装置。

进一步,无线连接方式可以为无线局域网、蓝牙、红外线等;有线连接方式可以为固话网络等。采用前述连接方式可以大大方便使用者对预测系统/装置的使用,同时可以借助日益发展的信息技术和日益普及的网络资源为受试者是否患有肺癌或患肺癌的风险概率准确预测。

进一步,所述输入模块包括八个输入子模块,分别为年龄输入子模块、性别输入子模块、血液中精氨酸的浓度输入子模块、血液中天冬氨酸的浓度输入子模块、血液中丝氨酸的浓度输入子模块、血液中戊二酰基肉碱的浓度输入子模块、血液中异戊酰基肉碱的浓度输入子模块、血液中二十碳酰基肉碱的浓度输入子模块。

进一步,所述计算模块还包括基于所述输入模块输入的信息建立肺癌早期风险预测列线图、计算总风险分值、根据总风险分值计算肺癌发生的风险;

优选地,所述总风险分值为年龄、性别、血液中精氨酸的浓度、血液中天冬氨酸的浓度、血液中丝氨酸的浓度、血液中戊二酰基肉碱的浓度、血液中异戊酰基肉碱的浓度、血液中二十碳酰基肉碱的浓度所对应的分值的累加和;

优选地,基于所述输入模块输入的信息建立肺癌早期风险预测列线图的方法为应用R语言RMS运算包完成Logistic回归模型的列线图可视化。

进一步,当输出模块输出的肺癌风险概率值Y>0.59585时,为高危;当输出模块输出的肺癌风险概率值Y≤0.59585时,为低危。

本发明的第四方面提供了一种肺癌早期风险预测装置。

进一步,所述装置包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时运行如下所述的回归方程:

肺癌风险概率值Y=-2.86105+0.07010×年龄+0.79981×性别+0.02306×精氨酸的浓度-0.02030×天冬氨酸的浓度-0.01952×丝氨酸的浓度-5.86318×戊二酰基肉碱的浓度+2.30088×异戊酰基肉碱的浓度-20.09123×二十碳酰基肉碱的浓度;

其中,性别为男性时,性别=1,性别为女性时,性别=2;

当肺癌风险概率值Y>0.59585时,为高危;当肺癌风险概率值Y≤0.59585时,为低危。

本发明的第五方面提供了一种计算机可读存储介质。

进一步,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在装置执行如下所述的回归方程:

肺癌风险概率值Y=-2.86105+0.07010×年龄+0.79981×性别+0.02306×精氨酸的浓度-0.02030×天冬氨酸的浓度-0.01952×丝氨酸的浓度-5.86318×戊二酰基肉碱的浓度+2.30088×异戊酰基肉碱的浓度-20.09123×二十碳酰基肉碱的浓度;

其中,性别为男性时,性别=1,性别为女性时,性别=2;

当肺癌风险概率值Y>0.59585时,为高危;当肺癌风险概率值Y≤0.59585时,为低危。

本发明的第六方面提供了一种组合物在制备预测肺癌早期风险的试剂盒中的应用。

进一步,所述组合物包括测定以下六种生物标志物水平的试剂:精氨酸、天冬氨酸、丝氨酸、戊二酰基肉碱、异戊酰基肉碱、二十碳酰基肉碱;

优选地,评判模型和评判方法为:肺癌风险概率值Y=-2.86105+0.07010×年龄+0.79981×性别+0.02306×精氨酸的浓度-0.02030×天冬氨酸的浓度-0.01952×丝氨酸的浓度-5.86318×戊二酰基肉碱的浓度+2.30088×异戊酰基肉碱的浓度-20.09123×二十碳酰基肉碱的浓度;

其中,性别为男性时,性别=1,性别为女性时,性别=2;

当肺癌风险概率值Y>0.59585时,为高危;当肺癌风险概率值Y≤0.59585时,为低危;

优选地,所述组合物包括如下试剂:所述六种生物标志物的标准品、所述六种生物标志物的质控品、衍生化试剂、流动相调节液、正常人血液、阳性对照血液。

本发明的第七方面提供了一种用于预测肺癌早期风险的试剂盒。

进一步,所述试剂盒包括测定精氨酸、天冬氨酸、丝氨酸、戊二酰基肉碱、异戊酰基肉碱、二十碳酰基肉碱水平的试剂。

相对于现有技术,本发明具有的优点和有益效果:

本发明首次利用氨基酸、肉碱靶向代谢指标(精氨酸、天冬氨酸、丝氨酸、戊二酰基肉碱、异戊酰基肉碱、二十碳酰基肉碱)用于构建评估肺结节恶性风险的列线图,值得注意的是,本模型通过采集极少量的外周血,通过LC-MS/MS分析,对特定的氨基酸和肉碱进行定性定量,即可对受试者是否患有肺癌或患肺癌的风险概率值进行评估,且准确性显著优于现有的预测模型和常用的肺癌血清学生物标志物,具有无创、经济、有效、客观等优点,临床应用前景较好。

附图说明

以下,结合附图来详细说明本发明的实施方案,其中:

图1显示本发明构建得到的肺癌发生风险预测的列线图模型的结果图;

图2显示本发明所述的列线图模型预测肺癌发生风险的校准曲线结果图,其中,a图:训练集,b图:验证集;

图3显示本发明所述的列线图模型与各个协变量进行比较的ROC曲线结果图,其中,a图:训练集,b图:验证集;

图4显示本发明所述的列线图模型(Nomogram)、列线图(Nomogram)和NSE、CYFRA21-1三者联合模型与已发表模型Model 1、已发表模型Model 2进行比较的ROC曲线结果图。

具体实施方式

下面结合具体实施例,进一步阐述本发明,仅用于解释本发明,而不能理解为对本发明的限制。本领域的普通技术人员可以理解为:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。下列实施例中未注明具体条件的实验方法,通常按照常规条件或按照厂商所建议的条件实施检测。

实施例 肺癌早期诊断的模型的构建及其诊断效能的验证

1、实验仪器

API3200型液相色谱-串联质谱仪(美国Applied Biosystem公司),配有电喷雾离子源(ESI)和Chemo View 1.4.2。

2、实验试剂

氨基酸(丙氨酸、精氨酸、天冬酰胺、天门冬氨酸、瓜氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、亮氨酸、赖氨酸、甲硫氨酸、鸟氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸)和酰基肉碱(游离肉碱、乙酰基肉碱、丙酰基肉碱、丁酰基肉碱、羟丁酰基肉碱、丁二酰基肉碱、异戊酰基肉碱、羟异戊酰基肉碱、戊二酰基肉碱、戊烯酰基肉碱、已酰基肉碱、已二酰基肉碱、辛酰基肉碱、葵酰基肉碱、月桂酰基肉碱、肉豆蔻酰基肉碱、羟肉豆蔻酰基肉碱、肉豆蔻二酰基肉碱、肉豆蔻烯酰基肉碱、棕榈酰基肉碱、羟棕榈酰基肉碱、羟棕榈烯酰基肉碱、十八碳酰基肉碱、二十碳酰基肉碱、二十二碳酰基肉碱、二十四碳酰基肉碱、二十六碳酰基肉碱)的混合标准品均购自于Chromsystems公司。

3、实验方法

本发明提供了一种可区分早期肺癌和良性肺结节的模型构建的方法,具体步骤如下:

(1)样本来源:2018年5月—2020年12月于大连医科大学附属第二医院胸外科和呼吸内科经病理诊断为肺癌和肺良性病变的住院患者,肺癌患者诊断标准及分期依照国际肺癌研究学会制定第八版TNM分期标准,所有患者年龄>18岁,本研究获得了大连医科大学附属第二医院伦理委员会的支持;

(2)对收集得到的848例样本进行分组,分别分为训练集和验证集,具体分组和样本量如下:

训练集:肺癌组239例,肺良性病变组185例;

验证集:肺癌组239例,肺良性病变组185例;

(3)纳入标准:

a.根据第八版美国癌症联合委员会肿瘤-淋巴结-转移(TNM)分期系统,所有入组的肺癌患者均处于I-II期;

b.所有的肺癌患者均未经过抗肿瘤治疗,包括放疗、化疗、免疫治疗、手术等;

(4)排除标准:排除数据缺失较多、自身免疫性疾病、严重的心、肝、肾脏疾病、代谢综合征、合并其他肿瘤;

(5)数据统计:连续变量用均值±标准差表示,分类变量用频数和比例表示。连续变量比较采用t检验,分类变量比较采用卡方检验。对训练集进行后退法的多元Logistic逐步回归分析。基于赤池信息准则(AIC)值和Wald检验建立Logistic回归模型(LRM)。通过使用R语言的“rms”包,在LRM系数的基础上建立了列线图。计算列线图的曲线下面积(AUC)和95%置信区间(95%CI),并与列线图中包含的各变量进行比较;

(6)模型验证:

a.利用验证集的数据对列线图进行验证,计算AUC和95%CI,并与列线图中包含的各变量进行比较;

b.在训练集和验证集中,分别应用校准曲线评估列线图的预测能力;

(7)与已发表模型进行比较:

a.将本发明构建得到的列线图模型、列线图和NSE、CYFRA21-1三者联合模型与传统肿瘤标志物NSE的AUC进行比较,上述用于肺癌诊断的传统肿瘤标志物NSE为已发表模型Model 1;

b.将本发明构建得到的列线图模型、列线图和NSE、CYFRA21-1三者联合模型与现有的基于氨基酸和肉碱构建的肺癌诊断模型(Ni-模型)的AUC进行对比,所述Ni-模型=0.2523×浓度(Gly)+0.6087×浓度(Val)+0.6351×浓度(Met)+0.0341×浓度(Arg)+0.3084×浓度(Cit)+0.3033×浓度(C16),上述已发表文章中的Ni-模型为已发表模型Model 2;

(8)统计学分析方法

所有检验在P<0.05时具有统计学意义。采用SAS 9.4软件、GraphPad Prism7.0软件和R 4.0.3软件进行统计学分析。

4、实验结果

(1)在训练集中,通过逐步回归,共有8个变量(年龄、性别、精氨酸(Arg)、天冬氨酸(Asp)、丝氨酸(Ser)、戊二酰基肉碱(C5DC)、异戊酰基肉碱(C5)、二十碳酰基肉碱(C20))被纳入到本发明所述的肺癌早期诊断模型中,并呈现为效能最好的列线图(AIC=449.24,Wald=89.4),所述列线图见图1,在列线图中,每个变量都被分配了从0到100的分值。通过计算各协变量的总分,进而计算总分,可以有效地估计肺癌发生的风险;

(2)利用验证集的数据对列线图进行验证,预测肺癌的列线图的校准曲线显示训练集和验证集之间具有良好的一致性(见图2a和图2b)。校准曲线越接近对角线,模型的预测精度越高。分别计算列线图在训练集和验证集的AUC和95%CI,并与列线图中包含的各变量进行比较。在训练集中,与年龄(AUC:0.69,95%CI:0.64-0.74)、性别(AUC:0.58,95%CI:0.53-0.62)、Arg(AUC:0.53,95%CI:0.47-0.59)、Asp(AUC:0.58,95%CI:0.52-0.63)、Ser(AUC:0.59,95%CI:0.53-0.64)、C5DC(AUC:0.61,95%CI:0.61-0.63)、C5(AUC:0.50,95%CI:0.45-0.56)和C20(AUC:0.57,95%CI:0.52-0.63)相比,列线图的AUC为0.764,95%CI为0.72-0.81,优于各个协变量,其灵敏度和特异度分别为86.19%和58.38%,截断值为0.471(见图3a和表1)。在验证集中,列线图的AUC同样显示了良好的诊断效能,AUC为0.786,95%CI为0.74-0.83,其敏感性和特异性分别为74.25%和82.96%,截断值为0.635(见图3b和表2);

表1训练集中预测肺癌的列线图及各变量的效能评估

表2验证集中预测肺癌的列线图及各变量的效能评估

(3)将列线图模型、列线图和NSE、CYFRA21-1三者联合模型、已发表模型Model 1、已发表模型Model 2进行比较,进一步评价列线图模型的诊断效能。分别计算列线图模型、列线图和NSE、CYFRA21-1三者联合模型、已发表模型Model 1、已发表模型Model 2的AUC值,结果显示列线图模型的AUC值为0.786,(95%CI:0.74-0.83),列线图和NSE、CYFRA21-1三者联合模型的AUC值为0.833(95%CI:0.79-0.87),已发表模型Model 1的AUC值为0.608(95%CI:0.55-0.66),已发表模型Model 2的AUC值为0.592(95%CI:0.54-0.65)(见图4和表3),进一步证实了本发明所述的列线图模型、列线图和NSE、CYFRA21-1三者联合模型对肺癌的预测能力较好。

表3本发明所述的早期肺癌诊断的模型和与已发表模型比较的结果统计

上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号