首页> 中国专利> 一种针对肝细胞癌的缺氧相关基因标记物组合及其应用

一种针对肝细胞癌的缺氧相关基因标记物组合及其应用

摘要

本发明提供了一种针对肝细胞癌的缺氧相关基因标记物组合及其应用。利用所述缺氧相关基因标记物组合得到的缺氧分值能够较好地反映肝细胞癌组织的缺氧暴露情况,并对肝细胞癌进行分型和预后分析。同时,本发明利用所述缺氧相关基因标记物组合从基因组学、表观基因组学、转录组学和蛋白质组学等多组学角度全面探索了肝细胞癌中缺氧相关的分子标志物的变化,描绘了一个更加完整的肝细胞癌缺氧相关的分子景观,同时分析了肝癌的免疫微环境变化,为肝细胞癌的诊断和治疗提供了更多有价值的信息。

著录项

  • 公开/公告号CN113046436A

    专利类型发明专利

  • 公开/公告日2021-06-29

    原文格式PDF

  • 申请/专利权人 深圳市人民医院;

    申请/专利号CN202110178925.5

  • 申请日2021-02-09

  • 分类号C12Q1/6886(20180101);G16B20/20(20190101);G16B25/00(20190101);

  • 代理机构11332 北京品源专利代理有限公司;

  • 代理人巩克栋

  • 地址 518000 广东省深圳市罗湖区东门北路1017号

  • 入库时间 2023-06-19 11:40:48

说明书

技术领域

本发明属于生物医药技术领域,涉及肿瘤预后标志物,尤其涉及一种针对肝细胞癌的缺氧相关基因标记物组合及其应用。

背景技术

肝细胞癌(hepatocellular carcinoma,HCC)是肝癌的主要组织学亚型,占原发性肝癌的85~95%,肝细胞癌起病隐匿,临床表现异质性高。大部分患者在确诊时已经处于中晚期,因而丧失了手术机会,中晚期患者的死亡率高达80%,中位生存期不足1年,5年生存率不足20%。尽管近年来HCC靶向治疗药物、免疫治疗的发展给中晚期HCC患者的治疗带来了新希望,但是不可否认的是这些治疗手段仍然存在局限,总体来讲,中晚期HCC的疗效仍然不够理想。HCC的起始和发展终伴随着与微环境的交互,揭示微环境带来的肿瘤分子特征的多样性,将有利于HCC的早期诊断、治疗靶点的寻找、患者的个性化治疗及预后判断。

缺氧是实体肿瘤最重要的微环境特征,与肿瘤的多种特征相关,包括引起肿瘤的侵袭性增加、血管生成增加、细胞干性增加、代谢重编程、免疫反应改变、放化疗抵抗等。由于评估患者体内或离体癌组织的缺氧暴露情况并不是很便捷,目前,肿瘤领域大部分关于缺氧的研究几乎都是基于体外细胞试验和动物模型试验。然而,患者体内实际发生的事件与体外研究观察到的现象终究是有差别的。

对于缺氧来说,体外试验中持续性短期缺氧和肿瘤组织中的间歇性持续缺氧肯定是不同的。组织中的间歇性持续缺氧具有压力筛选作用,可以促发不同于体外的独特的分子结构(distinctive molecular profile)。在体内水平,缺氧不仅影响肿瘤细胞,还会影响其他肿瘤微环境,这些微环境往往与肿瘤细胞存在交互作用。因此很有必要在体内及组织水平探讨缺氧在肿瘤中扮演的角色。

由于缺氧暴露可以引起多种基因的表达水平变化,研究者试图使用缺氧相关的基因标志物(gene signature)反应肿瘤的缺氧状态,并尝试与临床应用相结合。一些研究取得了良好的结果,例如Malenstein等人开发了一个与慢性缺氧暴露有关的7-gene set,其可以反映HCC患者的预后。但是既往研究大多只调查了缺氧相关标志物与患者预后的关系,没能揭示缺氧在组织水平、特别是在大队列中的分子变化全景。

近年来随着高通量技术的发展和普及,特别是TCGA项目(TCGA project)的逐渐完成,基因组学、表观基因组学、转录组学和蛋白质组学等为在体内组织水平深入探讨缺氧提供了前所未有的机会。近期有研究利用一些缺氧相关的标志物进行了泛癌(pan-cancer)的综合研究,在组织水平揭示了一些不同癌症类型肿瘤缺氧的分子标志物,其中包括一些关于HCC的相关数据。但是这些研究采用的标志物并不是特异性针对HCC的,而且因为是泛癌研究,研究内容在HCC领域的覆盖度和深度是有限的。

发明内容

针对现有技术存在的不足,本发明的目的在于提供一种针对肝细胞癌的缺氧相关基因标记物组合,并利用所述缺氧相关基因标记物组合构建肝细胞癌预后评分系统和肝细胞癌分型系统。

为达此目的,本发明采用以下技术方案:

第一方面,本发明提供一种针对肝细胞癌的缺氧相关基因标记物组合,包括基因CA9,PFKFB4,HILPDA,BNIP3L,SLC2A3,PLIN2,KDM3A,INSIG2,EGLN3,GDF15,PTPRH,HCAR3,SPAG4,WSB1,TMEM45A,ADM,BNIP3,JUN,SMAD3,HK2,GYS1共计21个基因。

缺氧可以改变肿瘤细胞的基因表达水平,因此检测特定的一组基因就能间接反应肿瘤细胞或者组织的缺氧暴露情况。本发明利用芯片(microarray)分析了不同肝癌细胞系中缺氧相关基因,得到了一个针对肝细胞癌、具有较高稳定性的由21个基因组成的标记物组合,也可称作基因集或hypoxia signature,该标记物组合中的基因数目适中,且能够共同表明缺氧相关的表型偏好,且与肝癌患者的临床特征密切相关,并能够评估患者的预后。

第二方面,本发明提供一种如第一方面所述的缺氧相关基因标记物组合的筛选方法,包括:

缺氧处理至少两种肝癌细胞系,并得到所述至少两种肝癌细胞系中的差异表达基因,利用RRA(Robust rank aggregation)算法对所述差异表达基因进行筛选及整合,结合生物学过程(biological process)和路径(pathway)富集分析,选取得到所述缺氧相关基因标记物组合。

优选地,所述至少两种肝癌细胞系包括HUH7细胞、SNU-182细胞、HLF细胞、HepG2或HEP3B中的任意两种或至少三种的组合。

第三方面,本发明提供一种肝细胞癌预后评分系统,其输入变量为第一方面所述的缺氧相关基因标记物组合中各基因标记物的表达量,输出变量为缺氧分值(hypoxiascore);所述肝细胞癌预后评分系统根据所述缺氧分值评估整体生存率(overallsurvival)和/或无病生存率(Disease-free survival)。

本发明中,依据所述缺氧分值将结果分为高分值组(大于上四分位数)和低分值组(小于下四分位数),这样可能获得更多具有差异的变化,也更符合临床实际情况,因为肿瘤组织中的缺氧情况与分子变化并非线性关系,温和的缺氧暴露也许不会引起过多的响应事件。所得高分值组和低分值的HCC组织在基因组学、表观基因组学、转录组学和蛋白质组学方面均有明显差异。

优选地,所述肝细胞癌预后评分系统中,所述各基因标记物的表达量通过基因集变异分析(Gene set variation analysis,GSVA)后得到的缺氧分值。

本发明中所述hypoxia score的计算方式为:

在R统计学软件中,将21个基因作为input输入The Gene Set VariationAnalysis程序包(Sonja Hanzelmann等人开发),程序包中的gsva函数计算出gene setenrichment score,这个分数即为缺氧分值hypoxia score。

优选地,所述肝细胞癌预后评分系统中还包括:结合单因素Cox回归分析和/或多因素Cox回归分析评估缺氧分值与整体生存率和/或无病生存率的相关性。

优选地,所述肝细胞癌预后评分系统中还包括:基于TCGA数据集,利用所述缺氧分值和TNM分期系统构建的LASSO-COX(least absolute shrinkage and selectionoperator-COX)生存模型。

第四方面,本发明还提供一种肝细胞癌分型系统。所述肝细胞癌分型系统基于第一方面所述的缺氧相关基因标记物组合中各基因标记物的表达量,使用非监督层次结构(Unsupervised hierarchical)聚类分析对肝细胞癌进行分型。

本发明所述的缺氧相关基因标记物组合还能够对肝细胞癌进行分型,将肝细胞癌分为不同的亚型(subtype),可以判断所述肝细胞癌是否与缺氧相关,若是与缺氧相关,说明其可能对缺氧治疗存在响应,则需要进行缺氧相关治疗,若是没有存在过多的缺氧暴露,则无需进行缺氧治疗。所述肝细胞癌分型系统能够对患者进行有效分型,获得亚型之间在分期等多种临床特征及预后上存在差异,实现对患者的精准治疗,对判断预后、制定个性化治疗方案具有主要的临床意义。

第五方面,本发明提供如第一方面所述的缺氧相关基因标记物组合、第二方面所述的肝细胞癌预后评分系统或第三方面所述的肝细胞癌分型系统在制备肝细胞癌预后监测产品中的应用。

优选地,所述肝细胞癌预后监测产品包括肝细胞癌预后监测试剂盒和/或肝细胞癌预后监测医疗器械。

与现有技术相比,本发明的有益效果为:

(1)本发明开发了一个全新的、具有稳定性和特异性的针对HCC的缺氧相关标记基因组合,能够较好的反映HCC组织的缺氧暴露情况;还使用该基因标志物对HCC进行分型,探讨了该基因标志物组合与患者预后的关系;同时,本发明中从基因组学、表观基因组学、转录组学和蛋白质组学等多组学角度全面探索了HCC中缺氧相关的分子标志物的变化,描绘一个更加完整的HCC缺氧相关的分子景观(molecular landscape),表明缺氧在HCC发展中扮演的角色可能远比想象的重要,为HCC的诊断和治疗提供更多有价值的信息。

(2)经过综合分析,与低分值组相比,高分值组的患者在在转录组学、基因组学、表观基因组学、蛋白质组学方面存在不少差异。一些差异事件与患者的预后密切相关,能够作为解释去缺氧促癌作用的分子机制,这些差异能够为HCC诊疗靶点的筛选提供帮助。此外,需要强调的是,本发明中还发现在10个数据集中,HIF-1A的mRNA水平在高分值组显著上升并与缺氧分值呈现明显的正相关。而既往研究大多重视HIF-1A在蛋白水平的翻译后调控,忽视了HIF-1A的mRNA变化。本发明中提供的标记物组合显示HIF-1A的mRNA水平调控在缺氧暴露中是不可忽视的,这也意味着在研究以HIF-1A为靶点的治疗方案时,不仅要针对HIF-1A的蛋白,而且要针对其mRNA。另外数据显示,在hypoxia暴露中可能存在一个多层次的正向反馈网络调控HIF-1A的水平,而mRNA/lncRNA网络及甲基化调控可能是这个网络的一部分。

(3)在体内,缺氧影响的不只是肿瘤细胞,本发明还探讨了缺氧对HCC组织中免疫细胞浸润模式的影响,可以发现缺氧可以诱导免疫细胞在HCC中的浸润,其中一些特定的免疫细胞比例出现了变化,目前的证据很难推测这些变化的免疫细胞究竟发挥什么作用,但是相信它们参与缺氧诱发的免疫逃避,并且这部分数据也提示缺氧可能与免疫治疗的效果相关。

附图说明

图1(a)为缺氧暴露后6个HCC细胞中21个缺氧基因相关标记物的表达变化图。

图1(b)为缺氧分值在缺氧处理的HCC细胞和空白对照组中的对比图。

图1(c)为利用21个缺氧基因相关标记物计算11个HCC队列中癌组织的缺氧评分数据图。

图1(d)为缺氧分值与根据其他已发表的缺氧基因标记物计算出的缺氧得分之间的相关性数据图。

图2(a)为基于21个缺氧相关基因标记物的无监督聚类对TCGA-LIHC患者进行分型的数据图。

图2(b)为TCGA-LIHC中2个亚型间整体生存率(OS)曲线图。

图2(c)为TCGA-LIHC中2个亚型间无病生存率(DFS)曲线图。

图2(d)为TCGA-LIHC中2个亚型的缺氧评分差异对比图。

图2(e)为基于21个缺氧相关基因标记物的无监督聚类对GSE14520患者进行分型的数据图。

图2(f)为GSE14520中3个亚型间整体生存率曲线图。

图2(g)为GSE14520中3个亚型间无病生存率曲线图。

图2(h)为GSE14520中3个亚型间缺氧评分差异对比图。

图3(a)为通过缺氧评分评估TCGA-LIHC患者OS的时间依赖性受试者工作特征(ROC)曲线图。

图3(b)为通过缺氧评分评估GSE14520患者OS的时间依赖性受试者工作特征(ROC)曲线图。

图3(c)为TCGA-LIHC高、低缺氧评分患者以及不同TNM分期对患者进行分层后再次比较的OS差异;其中,I图为总体高、低缺氧评分患者评分比较,II图为TNM早期患者高、低缺氧评分患者评分比较,III图为TNM晚期患者高、低缺氧评分患者评分比较。

图3(d)为GSE14520高、低缺氧评分患者以及不同TNM分期对患者进行分层后再次比较的OS差异;其中,I图为总体高、低缺氧评分患者评分比较,II图为TNM早期患者高、低缺氧评分患者评分比较,III图为TNM晚期患者高、低缺氧评分患者评分比较。

图3(e)为TCGA-LIHC和GSE14520高、低缺氧评分患者的DFS差异;其中I图为TCGA-LIHC,II图为GSE14520。

图3(f)为LASSO-cox回归模型的列线图。

图3(g)为GSE76427中低、高缺氧评分患者的OS差异。

图4(a)为不同数据集所有mRNA中差异表达DE-mRNA的百分比与缺氧评分的四分位数范围(IQR)的关系图。

图4(b)为129个HF/DE-mRNA与HCC患者生存相关的热图与森林图。

图4(c)为数据集中所有DE-mRNA在数据集中具有差异表达的缺氧诱导因子HIF-1A的转录靶标的百分比对比图。

图4(d)为高缺氧组和低缺氧组36个mRNA表达量热图与森林图。

图4(e)为在10个HCC数据集中高缺氧组和低缺氧组HIF-1AmRNA表达水平的差异对比图。

图4(f)为10个HCC数据集中HIF-1A mRNA表达水平与缺氧评分之间的相关性对比图。

图5(a)为高缺氧评分组显著上调或下调的DE-miRNA的热图与森林图。

图5(b)为高缺氧评分组中出现显著上调或下调的前50位(按P值调整排序)DE–lncRNA的热图与森林图。

图5(c)为精炼的DE-lncRNA-DE-miRNA-HF/DE-mRNA ceRNA网络图。

图6(a)为高缺氧组和低缺氧组71个肿瘤基因拷贝数畸变(CNAs)发生率的差异图。

图6(b)为4个基因中单核苷酸变异(SNVs)的比例在高缺氧评分组和低缺氧评分组的差异对比图。

图6(c)为在高缺氧评分组中30个基因甲基化水平与相应mRNA水平的关系图。

图6(d)为基因染色体不稳定性评分(CIN70评分)用于评估10个HCC数据集的肿瘤组织的染色体不稳定性后得到的数据图。

图6(e)为高缺氧组和低缺氧组713个AS事件的发生率差异比较图。

图6(f)为30个剪接因子在高缺氧评分组和低缺氧评分组中的表达量与不同的AS事件形成的网络图。

图7(a)为高缺氧评分和低缺氧评分的HCC患者中50个蛋白的丰度比较图。

图7(b)为AKT/mTOR通路中丰度差异显著的蛋白示意图。

图7(c)为TCGA-LIHC中AKT、AKT-pt308和AKT_pS473蛋白丰度与总生存率之间的关系曲线图;其中,I图为AKT,II图为AKT-pT308,III图为AKT_pS473。

图8(a)为在11个数据集中高缺氧评分和低缺氧评分的HCC患者之间的肿瘤组织间质评分的差异对比图。

图8(b)为在11个数据集中高缺氧评分和低缺氧评分的HCC患者之间的免疫评分的差异对比图。

图8(c)为在11个数据集中高缺氧评分和低缺氧评分的HCC患者中程序性死亡配体-1(PD-L1)表达水平的差异对比图。

图8(d)为在11个数据集中高缺氧评分和低缺氧评分的HCC患者中程序性死亡1(PD-1)表达水平的差异对比图。

图8(e)为在11个数据集中高缺氧评分和低缺氧评分的HCC患者中细胞毒性t淋巴细胞抗原4(CTLA4)表达水平的差异对比图。

具体实施方式

为进一步阐述本发明所采取的技术手段及其效果,以下结合实施例和附图对本发明作进一步地说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明,而非对本发明的限定。

实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。

实施例1

本实施例中提供了一种针对肝细胞癌的缺氧相关基因标记物组合及其筛选方法。

(1)首先通过芯片分析,获取了缺氧处理24h后HUH7,SNU-182及HLF细胞中的差异表达基因(log FC>0.58或log FC<-0.58,且P<0.05,FC:fold change;通过取交集(overlap)后获取了在三个细胞系间共同存在的差异表达基因748个,其中上调基因321个,下调基因427个。

为了进一步了解这些缺氧处理后的差异表达基因可能扮演的生物学角色,本实施例中对这些差异基因进行了生物学过程(biological process)以及pathway富集分析,所得差异表达基因在缺氧相关反应中存在富集,且pathway富集分析提示差异表达基因在HIF-1信号通路中存在富集,同时差异基因在一些代谢相关的通路上存在富集,表明差异基因可能由缺氧引起。

(2)基于上述的差异表达数据建立新的缺氧相关的标记物组合,利用Robust rankaggregation(RRA)算法对3种HCC细胞系在缺氧处理后的差异表达基因进行了筛选及整合,结合现有文献,最终选取了表达差异较为稳健(Robust)且FC在2倍以上的21个基因构建标记物组合。

如图1(a)所示,这21个基因在缺氧处理后的HUH7、SNU-182及HLF中均表达显著增高。

(3)为了进一步验证这些基因对缺氧的反应,本实施例中在GEO数据库中找到了3个缺氧相关的数据集,包含HepG2(GSE18494)、HUH7(GSE55214)及HEP3B(GSE57613)在缺氧处理后的mRNA表达情况。

根据21个缺氧基因相关标记物通过基因集变异分析(GSVA)计算出缺氧评分,在这三种HCC细胞中,筛选得到的21个基因也明显上调,因此其在HCC细胞中是缺氧响应性基因。

实施例2

本实施例中验证所述缺氧相关基因标记物组合评估HCC细胞的缺氧状态的准确性和稳定性。

(1)准确性:

为了评估这21个基因组成的标记物组合能否用于估计HCC细胞的缺氧状态,本实施例中利用基因集变异分析(Gene set variation analysis,GSVA)进行了缺氧分值(hypoxia score)的计算。

如图1(b)所示,相比对照组,缺氧处理后的HUH7,SNU-182及HLF细胞拥有明显增高的缺氧分值。

类似的结果在GSE18494、GSE55214及GSE57613数据集中得到了验证,如图1(c)所示,P<0.05。因此,基于这21个基因的缺氧相关基因标记物组合计算出的缺氧分值可以反映HCC细胞的缺氧情况。

(2)稳定性:

为了进一步证明标记物组合评估缺氧的稳定性,本实施例选取了其他6个已经公开的且高被引用的标志物组合,具体如表1所示:

表1

前5个在最近的泛癌综合研究中,在评估不同缺氧信号时具有较好的稳定性;而Malenstein's signature是一个肝脏特异性且与HCC预后相关的缺氧signature。

选择TCGA-LIHC、GSE14520、GSE22058、GSE25097、GSE36376、GSE45436、GSE64041、GSE76297及GSE76427等9个HCC数据集,再次利用GSVA方法基于6个标记物组合计算上述数据集中HCC组织中的缺氧分值,并与本发明中提供的21个基因组成的标记物组合(21-genehypoxia signature)计算出的缺氧分值进行相关性分析。

在HCC组织中,基于21个基因组成的标记物组合计算出的缺氧分值与通过另外6个组合计算出的缺氧分值之间有显著的相关性(如图1(d)所示)),特别是与Sorensen'ssignature的相关性最强,这是因为本发明提供的标记物组合和Sorensen's signature有5个基因的重复(分别为BNIP3L,EGLN3,ADM,ANKRD37及BNIP3)。Hypoxia score在肝癌组织中明显分为两个cluster:positive和negative,这提示不同患者的肝癌组织的缺氧暴露是不同的。因此,本发明提供的基于21个基因组成的标记物组合在评估缺氧暴露方面具备较好的准确性和稳定性。

实施例3

本实施例中采用21个基因组成的标记物组合对HCC(TCGA-LIHC和GSE14520数据集)进行分型及预后分析。

(1)使用非监督层次结构(unsupervised hierarchical)聚类分析,基于21个基因组成的标记物组合对TCGA-LIHC数据集中的患者(n=374)进行分型,如图2(a)所示,利用21-gene signature可将所有患者分为两个亚型:

LIHC-B型患者的总体生存率显著低于LIHC-A型的患者(图2(b),HR=2.15,Log-rank P<0.01),同时无病生存率(Disease-free survival)也较低(图2(c),HR=2.17,Log-rank P<0.01)。

LIHC-A型(n=315)及LIHC-B型(n=59),LIHC-A型和LIHC-B型患者的TNM分期和AFP水平存在显著差异。其中,LIHC-B型患者的预后不佳:LIHC-B型中TNMⅢ-Ⅳ期的患者比例较高(卡方=11.35,P<0.01),且AFP水平较高(卡方=4.44,P<0.05)。

LIHC-B型的患者缺氧分值显著高于LIHC-A型的患者(图2(d)),因此LIHC-B型患者的较差预后可能是过多的缺氧暴露引起的。

(2)使用非监督层次结构聚类分析将GSE14520中的患者分为了三个亚型(图2(e)):

GSE14520-A型(n=41),GSE14520-B型(n=35)及GSE14520-C型(n=172)。

GSE14520-A型的患者与其他两个亚型的患者相比,TNM的分期高的患者比例明显较高(卡方=15.07,P<0.01),同时AFP水平较高(卡方=7.54,P<0.05)。GSE14520-clusterA中肿瘤直径>5cm的例数也较高(卡方=9.91,P=0.01)。GSE14520-A型的患者总体生存率(图2(f)),HRA:B=1.31,HRA:C=2.71,Log-rank P<0.01)及无病生存率均低于其它亚型(图2(g),HRA:B=1.81,HRA:C=1.94,Log-rank P<0.01)。

与TCGA-LIHC的结果类似,拥有较差预后的GSE14520-A型具有较高的缺氧分值(图2(h))。因此,非监督层次聚类分析的结果提示21个基因组成的标记物组合与HCC患者的预后具有相关。

实施例4

本实施例中用于验证基于21个基因组成的标记物组合计算的缺氧分值可作为HCC患者的预后标志物并且能够反应HCC的相关进程。

(1)首先,使用单因素和多因素Cox回归分析来评估缺氧分值与患者(TCGA-LIHC及GSE14520)整体生存率的关系,结果显示,缺氧分值是HCC患者低生存率的独立风险因素,在TCGA-LIHC中HR=1.82,P<0.05,在GESE14520中HR=2.71,P<0.05。

(2)在TCGA数据集中,缺氧分值评估1年、3年及5年生存率的ROC曲线及AUC如图3(a)和图3(b)所示。

(3)利用X-tile软件计算最优cut-off值,将患者分为高分值组和低分值组,高分值组患者的总体生存率低于低分值组(见图3(c)中I图)。

(4)利用TNM分期将患者分层后,高分值仍然暗示着较差的总体生存(见图3(c)中II图和III图)。

本实施例中,在GSE14520数据集中进行了相似的分析,并得到了类似的结果(如图3(d),其中I图为总体高、低缺氧评分患者评分比较,II图为TNM早期患者高、低缺氧评分患者评分比较,III图为TNM晚期患者高、低缺氧评分患者评分比较)。

且如图3(e)所示,在TCGA-LIHC(I图)及GSE14520(II图)中高分值组的患者无病生存率较低。

此外,基于TCGA-LIHC的数据,本实施例中还利用TNM分期和分值作为因素构建LASSO-COX生存模型(least absolute shrinkage and selection operator)(c-index=0.73),得到了一个预测列线图(predictive nomogram)(图3(f)),这个列线图的效果在GSE14520中得到了验证。在另一HCC数据集中(GSE76427),高分值组的患者也具有较低的总体生存率(图3(g))。

因此,基于这21个基因组成的标记物组合计算的缺氧分值有作为HCC患者预后标志物的潜力。在GSE14520中,高分值与低分值组患者在AFP水平、肝硬化情况、肿瘤大小、TNM分期、BCLC分期、CLIP分期、多结节方面具有显著的差异,高分值是一种肝癌患者的不利因素,且能表示肿瘤的发展阶段。

实施例5

本实施例用于分析高分值组(大于上四分位数)及低分值组(小于下四分位数)HCC患者的转录组学(mRNA、miRNA和lncRNA)的表达差异。

(1)将log2 FC>0.58或<-0.58且P<0.05的mRNA定义为差异表达的mRNA(DE-mRNA)。

将TCGA-LIHC及GSE14520的DE-mRNA合并取交集,得到DE-mRNA list,并对其进行了功能富集分析和COX生存分析,这些DE-mRNA与代谢功能和通路相关,一些是HCC患者生存的独立影响因素。当然,仅关注TCGA-LIHC及GSE14520的mRNA变化是不够的,因此,本实施例还尝试在11个HCC数据集中寻找比较有一致性的结果。

由于在11个HCC数据集中,发现差异基因占总被测基因的比例与该队列肝癌组织的缺氧分值的四分位范围(IQR)呈正比(图4(a)),提示差异基因在一定程度上是缺氧差异的差异造成的。其中,GSE10141数据集中探针数量过少,后续研究将排除此数据集。

本实施例中,对每个mRNA作为DE-mRNA在数据集中被鉴定到的频次做了统计,将出现频次≥5的DE-mRNA放入high frequency/DE-mRNA(HF/DE-mRNA)list,可以认为该集合中的mRNA变化在10个数据集中的一致性相对较高,共有371个mRNA被选择,其中有192个上调的DE-mRNA以及179个下调的DE-mRNA。

基于TCGA-LIHC和GSE14520的生存数据,对371个HF/DE-mRNA进行了生存分析(表达水平的中位值作为cut-off值,log-rank test),通过Venny分析,整合了TCGA-LIHC和GSE14520的数据,获得了129个与HCC生存有关的HF/DE-mRNA(LogRank PTCGA-LIHC和LogRank PGSE14520<0.05),其中危险因素59个(HR TCGA-LIHC和HRGE14520>1),保护因素70个(HRTCGA-LIHC和HRGE14520<1)。

有51个HF/DE-mRNA在TCGA-LIHC和GSE14520中同时满足Log Rank P<0.01,HR<0.7或>1.3的条件。这52个DE-mRNA中,所有的危险因素几乎均为在高分值组中显著上调的mRNA,而保护因素则刚好相反,这个结果在各队列中的比较有一致性(图4(b))。例如ANXA5及SPP1作为在TCGA-LIHC和GSE14520中均为患者生存的危险因子,且在9个数据集中都显著高表达于高分值组。这些DE-mRNA也许在HCC的发生发展中扮演重要角色,并与缺氧微环境存在交互,可以解释高分值组与低分值组间的预后差异,值得进一步研究。

(2)HIF-1A在缺氧中扮演最为重要的角色,这里本实施例分析了DE-mRNA和HIF-1A有关的数据。

各队列中可能作为HIF-1A潜在转录靶点的上调DE-mRNA比例非常相似地分布在10%-15%之间(图4(c))。本实施例中计数了HIF-1A潜在转录靶点作为上调的DE-mRNA在各队列中出现的频次,频次高于5的DE-mRNA显示在图4(d)中,这些HIF-1A潜在转录靶点大部分均为患者生存的危险因素。

另外,尽管HIF-1A被认为在hypoxia主要接受翻译后的蛋白水平调控,但是在10个HCC数据集中发现HIF-1A的mRNA水平在高hypoxia score组显著上升并与hypoxia score呈现明显的正相关(图4(e)和图4(f))。这提示hypoxia暴露下HIF-1A不仅接受蛋白水平的调控,其mRNA变化也需要受到重视。(3)将高hypoxia score及低hypoxia score患者HCC组织中的microRNAs(miRs)差异log2 FC>0.58或<-0.58,且P<0.05的miRs定义为差异表达的miR(DE-miRs)。

本实施例中发现了63个DE-miR,其中39个上调,24个下调;生存分析显示部分DE-miRs与患者的总体生存率(log rank test,cut-off=表达中位数)有关(图5(a))。

(4)在高分值及低分值患者HCC组织中发现了719个差异表达的lncRNA(DE-lncRNA),其中上调499个,下调220个。

Top 50(按adjusted P排序)的DE-lncRNA及先关的生存分析结果在图5(b)中展示。基于竞争性内源ceRNA理论和表达变化,本实施例中构建了一个DE-lncRNA/DE-microRNA/DE-mRNA网络(图5(c)),其中标识了各节点的与患者生存率的关系,也能够反映节点间的负相关性。

总之,高分值和低分值组间的确存在mRNA、microRNA及LncRNA的表达差异,很多具有促癌作用的RNA分子在高分值组上调,而具有抑癌作用的RNA分子出现降低。部分DE-mRNA或/和DE-LncRNA与DE-mRNA可能构成调控网络并参与HCC的发展并影响患者预后。

实施例6

本实施例中利用TCGA-LIHC的数据揭示不同缺氧分值的HCC患者的基因组学差异,包括体细胞拷贝数畸变(CNAs)和体细胞单核苷酸变异(SNVs)。

(1)本实施例中比较了高分值(大于上四分位数)及低分值(小于下四分位数)患者基因水平中CNAs的总体差异。

约有13.7%的基因(3396/24769)在高分值组出现了CNA比例的显著升高。71个肿瘤基因(根据OncoKB肿瘤基因的定义)存在显著的CAN差异,如图6(a)所示,大部分基因的拷贝数增加和拷贝数减少的比例均同时在高分值组显著升高,由图可知,这71个基因的角色和CAN趋势(根据纯合缺失、单拷贝缺失、低水平拷贝数扩增和高水平拷贝数扩增的比例)。例如癌基因CDK4,其在高分值组的CAN倾向于拷贝数增加,IRF1为肿瘤抑制基因,其在高分值组的CAN倾向于拷贝数减少。

此外,一些肿瘤的CAN在TCGA-LIHC患者中的出现频率并不低,这些数据提示,HCC患者的基因组不稳定性可能与缺氧暴露有关。

(2)分析两组患者基因水平中SNV差异

本实施例中并未发现SNV和缺氧分值之间具有较强的联系,仅有4个基因的SNV发生比例在两组间存在显著差异(图6(b))。其中,只有ADAMTS19的非沉默突变比例在高分值组中增多;

另外,172个基因的SNV突变的发生有在高分值组或低分值组中集中的趋势,但是由于这些基因的整体突变频率不高,因此在两组间的比例差异不存在统计学差异。

因此,本实施例中,倾向于认为缺氧对SNV的诱导能力是有限的,SNV对肿瘤的发生发展至关重要,很可能重要的SNV在缺氧出现前就发生了。

实施例7

本实施例中用于比较不同缺氧分值HCC患者之间的表观遗传变化情况。

(1)不同缺氧分值HCC患者之间的DNA甲基化程度差异比较小,仅有464个位点的甲基化程度在两组间存在显著的差异,其中大部分位点在高分值组中的甲基化程度显著降低,仅有少部分位点的甲基化程度在高分值组升高。

将甲基化差异的结果和mRNA在两组间的表达情况结合起来,发现有30个基因的mRNA在高分值组显著升高(来自TCGA-LIHC的数据),同时伴有甲基化水平的降低(图6(c)),这些基因mRNA表达水平与其甲基化水平呈现显著的负相关性,大部分基因的高表达为HCC患者生存的危险因素。

需要注意的是,HIF1A的甲基化程度也在高分值组降低,这为HIF1A mRNA水平在高分值组的升高提供了另外的解释。

30个基因的DNA在正常组织中的甲基化程度被用来比较,可以发现一些基因的甲基化在正常组织和低分值HCC组织中无差别,但是在高分值组降低(如RGS2),另一些基因的甲基化水平显示出从正常组织、低分值组HCC组织到高分值组HCC组织逐渐降低的趋势(如CLIC1)。

该结果提示缺氧暴露可能会促进一些与HCC发生发展相关的基因发生低甲基化,而一些基因低甲基化的发生可能是缺氧暴露特有的。

(2)染色质不稳定性(chromosome instability)是贯穿肿瘤发生发展的特征,染色质不稳定性的增加会导致HCC的生长并提高其侵袭性。

比较高分值组和低分值组患者之间的CIN70 score,数据显示在9个数据集中,CIN70 score均在高分值组显著提高(图6(d)),这提示缺氧暴露可能引起HCC细胞的染色质不稳定性。

(3)RNA可变剪切(Alternative mRNA splicing,AS)是在肿瘤发生发展中扮演重要角色的表观遗传学特征。

基于TCGA-LIHC的数据,本实施例中分析了不同分值组患者间的15533个mRNA剪接变异体事件的差异,一共发现了713个AS事件(涉及681个mRNA)在两组间存在的统计学差异,其中大量差异事件集中在Alternate Terminators(AT),Exon Skip(ES),AP(AlternatePromoters)(图6(e))。高分值组与低分值组相比,Percent Spliced In(PSI)值降低程度最大的是EPHB2 mRNA的保留内含子(adjusted P value<0.001),PSI升高程度最大的是GULP1mRNA的AT(adjusted P value<0.01)。Cox分析的结果提示,两组间存在差异的AS事件与HCC患者的生存有关。

另外,本实施例中还分析了404个splicing_factor(SF)在高分值组与低分值组之间的表达差异,一共找到30个SF在10个数据集中的结果比较有一致性(在5个或以上的数据集中呈现adusted P<0.05)。

(4)本实施例中还分析了这些SF与上述713个AS事件的相关性。

在构建相关性网络时,本实施例中仅设置了|Person r|>0.6且P<0.05的阈值,并未对节点做其他筛选,但是在得到的相关性网络中,各节点在变化趋势及预后价值上达到了逻辑上的和谐(图6(f))。例如,KHDRBS1是在高分值组表达增高的SF,同时也是HCC患者生存的危险因素。与其呈负相关性的7个AS事件在高分值组减少,而这7个AS事件为生存的保护性因素。

相反,与KHDRBS1呈正比的5个AS事件在高分值组增多,而这些AS事件为生存的危险因素。基于上述结果,本实施例中认为AS事件有可能也是HCC细胞响应缺氧的一种形式,缺氧引起的一些细胞功能及行为上的变化可能是通过SF-AS网络实现的。缺氧分值组间存在AS差异也许可以用来解释两组间的预后差异。

实施例8

本实施例中用于比较不同缺氧分值HCC患者之间的功能蛋白质组学变化。

基于TCGA-LIHC队列的Reverse phase protein array(RPPA)数据,本实施例中分析了218种蛋白在高分值组与低分值组间的丰度差异,一共发现50种蛋白的丰度在两组间存在差异(图7(a))。

LKB1的升高及mTOR的活性抑制是缺氧暴露的标志性事件,再一次验证了21-genesignature指示缺氧暴露的效能。约有一半的蛋白变化与其mRNA水平的变化不相符,提示缺氧对翻译后水平的调控作用不容忽视。存在差异的蛋白主要集中在AKT/mTOR及其相关通路中。大部分蛋白的变化趋势上符合缺氧暴露后的AKT/mTOR信号通路变化,AKT水平及其磷酸化水平的降低似乎是一个核心事件。但是一些蛋白的变化趋势和文献报道相反(图7(b)),这提示除AKT的调控之外,可能存在一个复杂的调控网络尚未被发现。

生存分析显示(cut-off=中位数,图7(c)),较低的AKT(如图7(c)中I图),AKT-pT308(如图7(c)中II图)及AKT_pS473(如图7(c)中III图)丰度反映了较差的生存率(除AKT_pS473外,log Rank P<0.05)。因此缺氧在HCC中的作用很可能部分是通过AKT实现的。

总体上来讲,两组间蛋白的变化从一定程度上体现了细胞自噬/凋亡的动态平衡以及对低氧应激的反应,这些蛋白可能影响细胞缺氧下的生存能力和对缺氧的耐受能力。

更重要的是,两组间改变的蛋白丰度可能与患者对药物的敏感度有关。例如AKT_pS473的降低可能引起细胞对Sorafenib(索拉非尼)的敏感性降低。因此在制定治疗方案时,也许需要评估患者病灶的缺氧情况。

实施例9

本实施例中用于比较不同hypoxia score HCC患者的免疫微环境特征。

因为缺氧可以影响肿瘤的免疫微环境,本实施例中利用所述标志物组合揭示HCC患者的免疫微环境差异。

(1)首先利用ESTIMATE algorithm算法计算了11个HCC数据集中患者的基质和免疫评分。这两个分数分别代表肿瘤组织中的基质细胞和免疫细胞的浸润情况。

为了得到更明显的差异,本实施例中利用标志物组合计算的缺氧分值的上四分位数和下四分位数将患者分为了高分值组和低分值组组。除了在GSE76297、GSE76427及GSE9843中,高分值组患者的基质评分显著增高外,其他数据集中,两组患者的基质评分浸润情况无显著性差异(图8(a))。

在GSEGSE76297、GSE7642、GSE9843、GSE25097、GSE36376及TCGA-LIHC中,高分值组患者的免疫评分显著增高(图8(b))。实际上在其他数据集中(除了GSE10141),高分值组患者的免疫评分也都是略微增高的,但是没有统计学意义。

(2)另一方面,分析了所述标记物组合与HCC组织中免疫浸润细胞类型的关系。

利用CIBERSORT算法,评估了11个数据集中HCC组织的22种免疫浸润细胞类型的分布情况。在GSE14520、GSE22058、GSE25097、GSE36376,GSE9843及TCGA-LIHC中,发现高分值组织中浸润的CD4.memory.resting细胞比例显著降低,同时伴有CD4.memory.activated细胞比例的显著增高。

在GSE14520、GSE22058、GSE25097、GSE45436及TCGA-LIHC中,高分值组织中浸润的Mast.resting细胞比例显著降低,同时伴有Mast.activated细胞比例的增高。

粗略地看,在所有的数据集中高分值组织中浸润的macrophage M0比例均出现了不同程度的上升,但仅在GSE14520、GSE22058、GSE25097、GSE36376及TCGA-LIHC中的差异具有统计学意义。

另外,NK.activated细胞几乎在所有数据集中的高分值组织中表现出比例降低,但只在GSE10141,GSE14520及GSE25097存在统计学差异。

这些数据提示缺氧似乎能够改变HCC患者肿瘤组织中的免疫细胞浸润情况,而利用所述标记物组合能够分辨这种差异。

最后,本实施例还分析了不同缺氧分值组织中热门免疫检查点PD-1、PD-L1、CTLA4的表达情况(图8(c)、图8(d)和图8(e))。大多数数据集中高分值组织与低分值组织的PD-L1水平无显著差异。但在GSE22052、GSE25097、GSE9843及TCGA-LIHC中,高分值组织中的PD-L1表达一致性地增高,且差异具有统计学意义。高分值组织与低分值组织的PD-1和CTLA-4的水平变化呈现出多样,有趣的是在多个数据中,PD-1和CTLA-4的水平变化呈现出相反的趋势。比如在GSE22058中,高hypoxia score组织具有较高的PD-1表达,但CTLA-4的表达较低。这些数据提示所述标记物组合可能有助于HCC患者免疫治疗反应的评估。

总之,本研究开发出的标记物组合可以有效的估计HCC组织的缺氧暴露情况。利用这个组合可以帮助评估患者的预后。同时,利用这个标记物组合在组织层面描绘了一个缺氧相关的分子景观。缺氧对HCC的作用是复杂的、多层次且网络化的,不同患者的缺氧暴露程度是不同的,而不同缺氧暴露程度的患者的分子特征大不相同,因此对治疗的反应也是不同的。HCC患者的个体化医疗过程中应当重视对缺氧程度的评估,这将使特定的患者群受益。

申请人声明,以上所述仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,所属技术领域的技术人员应该明了,任何属于本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,均落在本发明的保护范围和公开范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号