首页> 中国专利> 一种基于遗传因素的肺癌预后分期检测试剂、系统及应用

一种基于遗传因素的肺癌预后分期检测试剂、系统及应用

摘要

本发明公开了一种基于遗传因素的肺癌预后分期检测试剂、系统及应用。本发明提供的肺癌预后分期检测试剂,包括SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因表达水平检测试剂一种或多种的组合。本发明提供的检测系统,包括基因表达水平获取模块、判断模块,所述基因表达水平获取模块用于获取SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因中一个或多个基因表达水平,并提交给判断模块;所述判断模块,以SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因一个或多个基因表达水平为分类器的输入,判断样本是否来自肺癌预后高风险患者。本发明可作为独立候选诊断生物标志物发挥作用,对于肺癌具有明显的特异性,对肺癌准确预后有重大意义。

著录项

  • 公开/公告号CN113817834A

    专利类型发明专利

  • 公开/公告日2021-12-21

    原文格式PDF

  • 申请/专利权人 谱度众合(武汉)生命科技有限公司;

    申请/专利号CN202111285733.0

  • 申请日2021-11-02

  • 分类号C12Q1/6886(20180101);

  • 代理机构42233 武汉臻诚专利代理事务所(普通合伙);

  • 代理人胡星驰

  • 地址 430070 湖北省武汉市洪山区高新大道666号光谷生物园B5栋

  • 入库时间 2023-06-19 13:48:08

说明书

技术领域

本发明属于癌症预后领域,更具体地,涉及一种基于遗传因素的肺癌预后分类系统。

背景技术

为改善肺癌预后是目前的一个主要研究焦点,因为肺癌患者晚期生存的比例明显降低。作为世界上发病率和死亡率最高的癌症,其5年生存率仅为19%。虽然在治疗策略上取得了进展,但由于晚期诊断,肺癌患者的高死亡率并没有急剧下降。非小细胞肺癌(NSCLC)患者的治疗在过去几年中随着靶向治疗和免疫治疗的引入而不断发展,这些变化增加了预后和预测性生物标志物的重要性,使临床医生能够为NSCLC患者做出最合适的治疗决定。然而,在具有相似临床和病理特征的患者中发现了不同的疾病结局,提示目前使用的临床预后因素可能不足以一致预测个体临床结局。因此,寻找新的、敏感、可靠的治疗和预后生物学标志物,使肿瘤患者受益一直是肿瘤学家关注的焦点。

传统的预后指标目前无法准确预测。目前癌症进展预测主要基于疾病表现和美国癌症联合委员会(AJCC)的肿瘤-淋巴结-转移分期系统。然而,这两种方法对临床病理因素的静态表征都不能解释癌症的遗传异质性,限制了它们的预测价值。最近的研究表明,基因突变和表达紊乱与肺癌的疾病进展和治疗反应有关。然而,这些目前的生物标志物,如表皮生长因子受体(epidermal growth factor receptor,EGFR)和Kirsten rat sarcomavirus(Kirsten rat sarcoma virus,KRAS)癌基因同源物,并不能完全代表肺癌进展的复杂机制。

肺癌的早期诊断和预后判断,对于肺癌的治疗方案的制定、治疗效果有着决定性影响。而遗传因素的肺癌预后指标,相比生化指标对肺癌的早期诊断意义更大。然而现有的基于遗传因素的肺癌预后指标,特异性不高,难以开发出准确肺癌预后分期系统,无法为早期诊断和治疗方案制定提供更准确的决策参考。

发明内容

针对现有技术的以上缺陷或改进需求,本发明提供了一种肺癌预后分期检测试剂、系统及应用,其目的在于通过检测特定肺癌预后相关的基因在血液中的表达量,作为肺癌预后高风险可量化的特异性指标,由此解决现有技术肺癌预后指标特异性不高、难以准确预测肺癌预后分期的技术问题。

为实现上述目的,按照本发明的一个方面,提供了一种肺癌预后分期检测试剂,其包括SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因表达水平检测试剂一种或多种的组合。

优选地,所述肺癌预后分期检测试剂,其包括SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因表达水平检测试剂。

优选地,所述肺癌预后分期检测试剂,其所述基因表达检测试剂为基因mRNA表达水平检测试剂。

优选地,所述肺癌预后分期检测试剂,其所述基因mRNA表达水平检测试剂包括GSE30219、GSE37745和GSE50081芯片。

按照本发明的另一方面,提供了一种肺癌预后分期检测系统,其包括基因表达水平获取模块和判断模块。

所述基因表达水平获取模块用于获取SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因中一个或多个基因的表达水平,并提供给判断模块。

所述判断模块以SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因中一个或多个基因的表达水平为分类器的输入,判断样本是否来自于肺癌预后高风险患者。

优选地,所述肺癌预后分期检测系统,所述基因表达水平获取模块用于获取SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因的表达水平。

按照本发明的另一方面,提供了一种应用:SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因表达水平检测试剂一种及多种组合应用于制备肺癌早期预测定量检测试剂。

总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:

本发明提供了一种肺癌预后分期检测试剂,包括肺癌预后相关基因的表达量检测试剂:SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因表达量的检测试剂具有较高的诊断效率和特异性,可作为独立候选诊断生物标志物发挥作用,可通过血液样本中使用GSE30219、GSE37745和GSE50081芯片无创、高通量的检测其表达量。其各自作为筛查指标准确性达到0.5至0.8,达到中等强度筛查指标的标准,其联合表达量指标作为筛查指标的AUC达到0.7以上。尤其值得注意的是,本发明提供肺癌预后分期检测试剂及系统,对于肺癌具有明显的特异性,对肺癌准确预后有重大意义。

附图说明

图1是实施例1对GSE30219、GSE37745和GSE50081全血检测结果数据集进行分析,不同基因在肺癌预后高风险患者和肺癌预后低风险患者之间的表达差异;

图2是实施例1的GSE30219、GSE37745和GSE50081全血检测结果对SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因表达差异小提琴图;

图3是实施例2对SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因通过多变量Cox回归估计的8个基因的回归系数结果;

图4是实施例3对SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因联合指标对肺癌患者1年、3年、5年生存预测的感受性曲线;

图5时实施例3对SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因高风险人群和低风险人群分类结果;

图6是实施例4肺癌预后分期检测系统特异性测试结果。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

最近的研究表明,基因突变和表达紊乱与肺癌的疾病进展和治疗反应有关,我们发现肺癌预后相关的8个基因,其基因表达水平在肺癌预后高风险中差异表达明显(P值<0.05),且在肝癌(TCGA-LIHC)、结肠癌(TCGA-COAD)、胃癌(TCGA-STAD)和乳腺浸润性癌(TCGA-BRCA)患者中其表达量没有差异,可以将该8个基因表达量作为肺癌预后分期的遗传因素检测指标,尤其是肺癌早期预后检测指标,其表达量作为肺癌预后高风险的生物标记物。实验证实,本发明提供的肺癌预后分期检测系统其预测性能优异并且特异性高。

本发明提供的基于遗传因素的肺癌预后分期检测试剂,包括SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因表达水平检测试剂一种或多种的组合;优选包括SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因表达水平检测试剂。

所述基因表达水平检测试剂,优选为基因mRNA表达水平检测试剂,包括GSE30219、GSE37745和GSE50081芯片。

本发明提供的基于遗传因素的肺癌预后分期检测系统,包括基因表达水平获取模块、判断模块;

所述基因表达水平获取模块用于获取SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因中一个或多个基因的表达水平,并提供给判断模块;优选获取包括SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因的表达水平。

所述判断模块以获取SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因中一个或多个基因的表达水平为分类器的输入,判断样本是否来自于肺癌预后高风险患者;所述判断模块,优选以获取SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因的表达水平为分类器的输入;更优选,所述分类器以PRS值与预设阈值的比较结果来判断样本是否来自于肺癌预后高风险患者。

具体的:PRS值大于或等于预设阈值,则患者是肺癌预后不良高风险,即患者预后分期为高风险;PRS值小于预设阈值,则患者不是来自肺癌预后高风险,即患者预后分期为低风险。所述预设阈值优选PRS值的中位数,其中PRS值按照如下方法计算:

PRS=0.1223*Exp(SPP1)+0.1862*EXp(SLC20A1)-0-0909*Exp(TRIM68)-0.1693*Exp(CYB5D2)+0.1954*Exp(CENPH)-0.2869*Exp(MAGEE1)-0.1069*Exp(C16ORF54);

其中,Exp()为表达量函数。

采用SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因的表达水平作为分类依据,AUC达到0.7以上,可作为临床肺癌早期预测的参考依据。

以下为实施例:

实施例1统计分析肺癌预后高风险和肺癌预后低风险患者基因表达量差异分析

数据来源:验证肺癌预后不良高风险患者与肺癌预后不良低风险患者的基因表达差异数据来源于GEO数据库中微阵列数据集GSE30219,GSE37745和GSE50081,采用GPL570平台,进行血样分析。

其中高风险组324例,低风险组325例,包含三个批次的数据。采用RMA算法进行归一化,再使用替代变量分析(SVA)包中的联合关联检验(COMBAT)经验贝叶斯方法去除批次效应,并排除总生存期(OS)小于30天或生存状态模糊或缺失的患者。

统计:采用R语言中的limma工具包对SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因进行表达差异分析。结果如图1所示,显示上述基因在肺癌预后高风险患者中的表达量差异明显(P值<0.05且log2FC>1.2),其小提琴图如图2所示。

实施例2逻辑回归分析肺癌预后不良高风险和肺癌预后不良低风险表达量差异分析

数据来源:同实施例1。

多变量逻辑回归分析:采用逐步向后法进行多变量逻辑回归分析,结果如图3所示:SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、CYB5D2基因之间的影响相互独立,适合作为肺癌患者的生化检测指标,与患者临床信息共同提供肺癌预后分期依据。

实施例3肺癌预后分期检测系统

以SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、以及CYB5D2基因在血液中的表达量作为检测指标;计算其作为肺癌预后高风险诊断标记物的效力。

验证数据:验证肺癌预后高风险和肺癌预后低风险的数据来源于GEO数据库中GSE30219,GSE37745和GSE50081数据集,采用GPL570平台,进行血样分析。

其中高风险组324例,低风险组325例,包含三个批次的数据。采用RMA算法进行归一化,再使用替代变量分析(SVA)包中的联合关联检验(COMBAT)经验贝叶斯方法去除批次效应,并排除总生存期(OS)小于30天或生存状态模糊或缺失的患者。

结果显示SPP1、SLC20A1、CENPH、MAGEE1、C16ORF54、KCNS3、TRIM68、CYB5D2基因的表达水平检测准确性依次分别为0.52、0.61、0.61、0.63、0.55、0.61、0.62、0.63,均达到中等强度筛查指标的准确性要求(AUC在0.5至0.8),多基因联合指标检测准确性为0.75,高于任一单一基因检测准确性。

通过多变量Cox回归分析,最佳PRS为

PRS=0.1223*Exp(SPP1)+0.1862*EXp(SLC20A1)-0-0909*Exp(TRIM68)-0.1693*Exp(CYB5D2)+0.1954*Exp(CENPH)-0.2869*Exp(MAGEE1)-0.1069*Exp(C16ORF54)其中,Exp()为表达量函数。

多基因联合指标对肺癌患者1年、3年、5年生存预测的准确性AUC分别为0.72、0.75、0.71,感受性曲线见图4。

上述肺癌预后分期检测系统,通过Kaplan-Meier生存分析验证,结果表明,肺癌预后不良高风险相比于低风险更差(风险比HR=2.72,95%CI2.26--3.27,P<0.0001),预测生存PRS的c指数为0.67(95%CI,0.65-0.70)。

通过GEO数据库中其他肺癌相关数据集进行验证,结果如图5所示,表明验证集Ⅰ的HR为2.38(95%CI[1.61-3.53]),独立验证集II的HR为1.35(95%CI[1.06-1.71]),验证集III的HR为2.7195%CI[1.77-4.18]),说明本发明提供的肺癌预后分期检测系统预测准确性较高;

其中验证集Ⅰ包含GSE29013和GSE31210的259名肺癌患者,肺癌预后高风险129例,肺癌预后低风险130例;独立验证集Ⅱ包含GSE41271和GSE42127的441名肺癌患者,肺癌预后高风险220例,肺癌预后低风险221例;验证集Ⅲ包含TCGA数据库中494例肺腺癌(LUAD)和480例肺鳞癌(LUSC)患者的FPKM标准化RNA-seq数据。

实施例4肺癌预后分期检测系统特异性测试

数据集获取:

数据来源于TCGA数据库中肺腺癌(LUAD)、肺鳞癌(LUSC)、肝癌(TCGA-LIHC)、结肠癌(TCGA-COAD)、胃癌(TCGA-STAD)和乳腺浸润性癌(TCGA-BRCA)患者的FPKM标准化RNA-seq数据集(V23.0)。

性能评价方法,同实施例3。

通过TCGA数据库中肺腺癌(LUAD)、肺鳞癌(LUSC)、肝癌(TCGA-LIHC)、结肠癌(TCGA-COAD)、胃癌(TCGA-STAD)和乳腺浸润性癌(TCGA-BRCA)患者的FPKM标准化RNA-seq数据集分别进行验证,测试结果如图6。结果表明:采用上述8个基因联合检测指标对患者1年、3年、5年生存预测的准确性AUC均低于0.7,部分AUC低于0.5,表明上述基因PRS特征与肝癌、肠癌、胃癌和乳腺癌预后无关,说明本发明提供的基于遗传因素的肺癌预后指标具有明显特异性,可与其他类型的癌症区分开。

本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号