首页> 中国专利> 宫颈癌甲基化相关长链非编码RNA预后及免疫治疗疗效预测模型的构建方法和用途

宫颈癌甲基化相关长链非编码RNA预后及免疫治疗疗效预测模型的构建方法和用途

摘要

本发明开发并公开宫颈癌甲基化相关长链非编码RNA预后及免疫治疗疗效预测模型的构建方法和用途。采用Pearson相关性算法筛选RNA甲基化相关lncRNAs。单因素及多因素回归分析构建宫颈癌RNA甲基化相关IncRNA的预后模型。绘制ROC及Kaplan‑Meier生存曲线、构建Nomo模型及绘制Calibration图、进行独立预后分析来评估模型的准确性。评估风险模型与临床特征、免疫细胞浸润、肿瘤突变负荷(TMB)、免疫功能、免疫治疗相关分子间的相关性。最后,采用在线数据库评估甲基化关键lncRNAs的预后及免疫治疗价值,计算IC50来预测基于目标风险模型的新型药物的有效性。总之,该预后及免疫治疗疗效预测模型可用于指导预后及制定个体化的治疗策略,并可根据预后模型中的关键分子进一步开发宫颈癌诊治和预后相关的产品。

著录项

  • 公开/公告号CN116013403A

    专利类型发明专利

  • 公开/公告日2023-04-25

    原文格式PDF

  • 申请/专利权人 西安交通大学医学院第二附属医院;

    申请/专利号CN202211516235.7

  • 发明设计人 郭亚;杨彭涛;王中卫;何赟;

    申请日2022-11-29

  • 分类号G16B5/00(2019.01);G16B50/30(2019.01);G16H70/40(2018.01);

  • 代理机构陕西铭源专利代理事务所(普通合伙) 61235;

  • 代理人周沛臣

  • 地址 710004 陕西省西安市新城区西五路157号

  • 入库时间 2023-06-19 19:23:34

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-05-12

    实质审查的生效 IPC(主分类):G16B 5/00 专利申请号:2022115162357 申请日:20221129

    实质审查的生效

  • 2023-04-25

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及生物医学技术领域,尤其涉及宫颈癌甲基化相关长链非编码RNA预后及免疫治疗疗效预测模型的构建方法。

背景技术

宫颈癌(CC)是女性第四大最常见的癌症,最新研究报告指出每年约有57万个新发病例和31万个死亡病例。目前,手术或者放化疗是宫颈癌最初的治疗模式。近年来,结合综合的治疗方法(包括手术、化放疗和免疫疗法),晚期宫颈癌患者的临床预后虽明显改善,但仍不乐观。晚期宫颈癌患者的5年生存率仅有17%。鉴于宫颈癌对妇女的健康和生命构成严重威胁,确定有用的预测性生物标志物和治疗目标似乎势在必行。

晚期或转移性宫颈癌的预后很差。以前的研究发现,在宫颈癌的癌前病变和鳞状细胞癌中存在高危HPV感染和PD-L1表达升高有关。PD-L1高表达的患者预后较差。一些临床研究证明了PD-1/PD-L1抑制剂的初步安全性和有效性。目前正在进行的单药治疗和联合治疗试验,使用不同的免疫检查点抑制剂、聚腺苷二磷酸核糖聚合酶抑制剂、肿瘤血管生成抑制剂(即贝伐珠单抗)、抗体药物结合物、治疗性疫苗和肿瘤浸润性T淋巴细胞(采用免疫疗法)。这些新模式中的一些也正在与标准的铂类化疗方案进行联合评估。目前,pembrolizumab被批准用于治疗一线化疗后复发或转移的程序性死亡配体1(PD-L1)阳性宫颈癌。总之,免疫疗法,特别是免疫检查点抑制剂(ICI)在晚期实体瘤中取得了初步成功,而在晚期或转移性宫颈癌中的疗效和安全性仍有待探索。探索一种能够预测宫颈癌患者免疫治疗疗效的分子标志物,对应提高免疫治疗效果及安全性具有重要的意义。

N6-甲基腺苷(m6A)、N1-甲基腺苷(m1A)和5-甲基胞嘧啶(m5C)及N7-甲基鸟苷(m7G)是RNA甲基化最常见的类型。RNA甲基化的改变通过与lncRNAs相互作用对特定的生物过程产生影响。另一方面,lncRNAs也可以影响参与RNA甲基化修饰的基因的功能。RNA修饰在癌症进展中具有重要的调节功能,这些改变可能为癌症诊断和治疗提供新的生物标志物近期研究表明:RNA甲基化与促进癌细胞增殖、侵袭性和转移有关。研究发现m6A与肿瘤的增殖、迁移和耐药性有关,并被确定为肿瘤的预后标志物。在HCC组织中,总的m6A及其调节因子水平的异常变化与不利的生存状况密切相关。m6A及其调节因子在恶性肿瘤中起着致癌基因或抗癌基因的作用。研究发现m5C修饰在肿瘤进展中起重要作用,可作为癌症治疗的有效生物标志物。m1A甲基化修饰加速肿瘤进展及影响预后。目前,上述RNA甲基化相关的长非编码RNA(lncRNAs)对治疗宫颈癌的预后价值和免疫疗法的有效性的影响仍是未知的。因此,研究RNA甲基化在宫颈癌中的作用并初步探讨其在宫颈癌中的预后价值至关重要。

长链非编码RNA(IncRNA)被定义为非编码长度≥200个核苷酸的RNA。研究表明lncRNAs很有希望成为癌症的新型生物标志物和治疗靶点。然而,目前还没有研究探索宫颈癌与RNA甲基化修饰相关的lncRNAs之间的相关性。其次,RNA甲基化相关的长非编码RNAs(lncRNAs)对宫颈癌的预后价值和免疫疗法的有效性的影响仍是未知的。因此,临床上迫切需要构建宫颈癌风险分层的关键相关lncRNAs模型,以期这些关键的RNA甲基化lncRNAs模型能够预测宫颈癌患者的预后、对免疫治疗的反应性和药物敏感性,协助制定更精确和个性化的治疗策略。

发明内容

拟解决的技术问题

基于上述问题,本发明提供一种宫颈癌RNA甲基化相关的长链非编码RNA预后及免疫治疗疗效预测模型的构建方法。拟解决RNA甲基化相关的IncRNA对于预测宫颈啊癌患者的预后及免疫治疗疗效没有准确可靠的分子指标问题。此项发明的开展为宫颈癌患者的预后及免疫治疗疗效的评估提供可靠的生物标志物,从而有助于提高宫颈癌患者预后及免疫治疗疗效的评测能力、实现早期干预和个体化治疗策略的制定。

为了达到如上目的,本发明采取如下技术方案:

一种宫颈癌(CervicalCancer,CC)RNA甲基化相关的长链非编码RNA(IncRNA)预后及免疫治疗疗效预测的模型。本发明首先从TCGA数据库收集宫颈癌患者的转录组数据、肿瘤突变数据及相关的临床资料。进一步从已发表研究中获取55个RNA甲基化关键分子,采用皮尔逊相关性算法筛选RNA甲基化相关IncRNAs。

采用单因素回归分析及多因素回归方法构建宫颈癌RNA甲基化相关IncRNA的预后模型。采用ROC曲线和绘制Kaplan-Meier生存曲线评估预后模型的准确性。构建关键RNA甲基化IncRNAs与甲基化分子共表达网络。分析评估风险模型与临床特征、免疫细胞浸润、肿瘤突变负荷(TMB)、免疫功能、免疫治疗相关分子间的相关性。TIDE数据库评价高低风险组患者免疫治疗疗效差异。最后,采用GEPIA,Lnc2Cancer3.0,GEPIA2,GEPIA2021及TIGER在线数据库验证筛选出的RNA甲基化关键lncRNAs的预后及免疫治疗价值。进一步通过计算IC50来预测基于目标风险模型的新型药物的有效性。本发明的预后及免疫治疗预测模型可用于指导预后及制定个体化的治疗策略,并可根据预后模型中的关键分子进一步开发宫颈癌诊治和预后相关的产品。

采用如上技术方案的本发明,相对于现有技术有如下有益效果:本发明上述技术方案具有以下特点:

1)本发明在TCGA数据库中提取宫颈癌患者的转录组数据、肿瘤突变数据及相关的临床资料。从已发表研究中获取55个RNA甲基化关键分子。进一步采用皮尔逊相关性算法筛选RNA甲基化相关IncRNAs。采用单因素回归分析及多因素回归方法构建宫颈癌RNA甲基化相关IncRNA的预后模型。采用ROC曲线、绘制Kaplan-Meier生存曲线及计算一致性指数(C-index)以评估预后模型的准确性。

构建关键RNA甲基化IncRNAs与甲基化分子共表达网络。分析评估风险模型与临床特征、免疫细胞浸润、肿瘤突变负荷(TMB)、免疫功能、免疫治疗相关分子间的相关性。TIDE数据库评价高低风险组患者免疫治疗疗效差异。通过计算IC50来预测基于目标风险模型的新型药物的有效性。最后,采用GEPIA和Lnc2Cancer3.0在线数据库验证关键RNA甲基化相关lncRNAs的预后价值。本发明的开展,可以合理、可靠地筛选出RNA甲基化相关IncRNAs分子标志物,构建RNA甲基化相关lncRNAs的风险评分模型,此风险评分模型对于预测CC患者的预后、对免疫疗法的反应性和药物敏感性、协助制定更精确和个性化的治疗策略具有重要的意义。

2)本发明构建的RNA甲基化相关lncRNAs预后风险模型能独立于其他临床因素(年龄、性别、分期、分级、T分期及N分期等)准确的预测1年、3年和5年宫颈癌患者的预后。

3)与现有技术相比,本发明考虑到RNA甲基化和lncRNAs在宫颈癌生物学中的重要意义,确定了一个与RNA甲基化相关的lncRNAs风险模型来预测CC患者的预后、对免疫疗法的反应性和药物敏感性。

能够对CC样本的预后进行较为精准的判定;通过更加准确地提取对RNA甲基化相关的lncRNAs,使所选择出的与RNA甲基化相关的lncRNAs可以反应大部分宫颈癌患者样本的情况,从而使得最终的预后模型具有普适性,使得更多的宫颈癌患者受益。

附图说明

为了进一步说明本发明,下面结合附图进一步进行说明:

图1为本发明实施流程;

图2A到图2F为宫颈癌患者中RNA甲基化相关lncRNAs的筛选

图3A到图3E为为KM曲线评估5个关键RNA甲基化lncRNAs预后价值;

图3F到图3I为ROC曲线验证模型准确性;

图3J到图3K单因素及多因素回归分析风险评分独立预后特征;

图3L到图3M构建Nomogram模型及绘制Calibration图进一步验证模型准确性;

图4A到图4O为风险评分与临床特征的相关性分析;

图5A到图5I为风险评分与免疫细胞浸润、肿瘤突变负荷及免疫特征间相关性;

图6A到图6I为RNA甲基化关键lncRNAs的预后及免疫治疗的疗效评估;

图7A到图7K为预测基于目标风险模型的新型药物的有效性及验证RNA甲基化相关的关键lncRNAs的预后价值;

图8表1RNA甲基化相关基因;

图9表2单因素回归分析筛选出8个与RNA甲基化相关的IncRNAs;

图10表3多因素回归分析筛选出5个与RNA甲基化相关的IncRNAs;

图11表4FAM27E3和SOX21-AS1与CC患者免疫治疗疗效有关。

具体实施方式

1)数据收集与准备

TCGA数据库(https://portal.gdc.cancer.gov/)下载宫颈癌患者的转录组数据、TMB数据和对应的临床数据。包306个宫颈癌样本和3个正常人的基因表达谱。数据后处理和临床信息提取使用编程语言(strawberry-perl-5.32.0.1-64bit.msi,http://www.perl.org)。蛋白质编码基因和IncRNA使用Ensembl人类基因组进行注释和分类浏览器GRCh38.p13(http://asia.ensembl.org/index.html)。

2)RNA甲基化IncRNAs筛选

已发表文献获取55个与RNA甲基化相关分子(表1)。通过计算Pearson相关系数获得RNA甲基化相关IncRNAs,筛选标准为相关系数>0.4且P值<0.001。本发明筛选出了208个RNA甲基化相关IncRNAs。RNA甲基化相关基因与208个IncRNAs间相互作用共表达网络见图2A。

3)RNA甲基化IncRNAs预后模型构建

运行R语言中的Survival包,甲基化相关IncRNAs进行单变量Cox回归分析,初步筛选预后甲基化相关IncRNAs,P<0.05具有统计学意义。进行多元Cox回归分析并计算每位患者风险评分。将CC患者分为高风险组和低风险组。计算风险得分=N1×coef1+N2×coef2+……Nn×coefn;其中,Nn代表相关差异基因的表达量,coefn代表相关差异基因所对应的回归系数。

本发明中经过单因素回归分析发现8个与宫颈癌预后相关的甲基化IncRNAs(表2)。多因素回归分析发现:FAM27E3,AC024270.3,AC096992.2,SOX21-AS1和AC012306.2与宫颈癌患者预后相关。其中,FAM27E3,AC024270.3,AC096992.2,SOX21-AS1与宫颈癌患者良好预后相关,AC012306.2是宫颈癌患者的不良预后因素(表3)。

图2B显示筛选出5个RNA甲基化相关IncRNA与RNA甲基化基因间存在相互作用。图2C-E显示风险水平、病例生存状态和模型lncRNA表达水平。KM生存分析发现高风险组较低风险组预后差(图2F)。

4)评估模型的准确性

绘制五个RNA甲基化关键的IncRNAs的Kaplan-Meier生存曲线。采用timeROC软件包,绘制1年、3年和5年ROC曲线、计算曲线下面积(AUC)和C-index指数评估模型的预测能力。AUC值范围从0.5到1.0。AUC=0.5,表示没有任何预测价值,AUC在0.5-0.7之间代表预测的准确度低,AUC在0.7-0.9之间表示预测的准确度中等,AUC>0.9代表越策准确度高。

C-index值的范围为0.5-1.0之间。单因素和多因素Cox回归分析用于确定风险评分是否能够独立于其他临床因素(年龄、性别、分期、分级等)准确的预测3年和5年CC患者的预后。HR>1且P值小于0.05代表预后不良因素。HR<1且P值小于0.05表示预后有利因素。构建Nomo模型预测患者1、3、5年预后及绘制提名图评估Nomo模型准确性。

本发明提示:Kaplan-Meier生存曲线进一步证实FAM27E3,AC024270.3,AC096992.2,SOX21-AS1与宫颈癌患者良好预后相关,AC012306.2是宫颈癌患者的不良预后因素(图3A-E)。ROC曲线结果表明:1年、3年、5年的AUC分别是0.782和0.717和0.763(图3F)。ROC曲线分析发现risk-score能独立于其他临床因素预测宫颈癌患者的1、3、5年预后(图3G-I)。单因素和多因素独立预后分析提示:本发明构建的预后风险模型能独立于其他预后因素准确的评估患者预后(图3J-K)。基于riskscore构建的Nomo模型及绘制Calibration图发现风险模型能够准确预测患者1、3、5年预后(图3L-M)。

5)Riskscore和临床相关性分析

本研究基于R语言中limma和ggpubr包分析了不同年龄、分级、分期、T和N分期之间风险评分差异。进一步分析了不同年龄、分级、分期、T和N分期宫颈癌患者的预后差异。结果表明:不同年龄、分级、分期、T和N分期之间风险评分未见明显差异,但是StageIII-IV较StageI-II,T3-4较T1-2风险评分高的趋势(图4A-E)。在GradeII-IV和T1-2的CC患者中高风险CC患者较低风险CC患者的预后差,而在不同年龄、GradeI-II,T3-4和N分期之间高低风险组患者的生存无差异(图4F-O)。这些结果进一步表明高风险评分的CC患者预后较低风险的CC患者预后差。6)风险评分与免疫细胞浸润、肿瘤突变负荷及免疫特征间相关性

采用CIBERSORT算法比较高风险和低风险患者的中免疫细胞浸润差异。进一步使用"ggplot2"、"ggpubr"和"ggExtra"R软件包分析了免疫细胞浸润和确定的关键RNA甲基化lncRNAs之间的相关性。通过GEPIA2021(http://gepia2021.cancer-pku.cn/)在线数据库,分析浸润的免疫细胞在高低风险组的生存差异。TMB是用肿瘤特异性基因突变计算的。使用R语言中的"maftools"程序包计算突变数据。所有样本被分为高TMB组和低TMB组,利用这些数据和病人的生存率统计来检查每组病人的生存率。接下来使用四个亚组(高TMB+高风险、高TMB+低风险、低TMB+低风险评分、低TMB+高风险)的生存率来研究风险评分与患者生存率之间的关系。通过使用R软件包"Limma"、"GSVA"、"GSEABase"、"pheatmap"和"reshape2"[22],比较高风险组和低风险组之间免疫相关功能的差异。RNA甲基化相关lncRNAs和典型的免疫检查点分子(包括CD70、TNFSF9、FGL1、CD276、NT5E、HHLA2、VTCN1、TNFRSF18、CD274。PDCDL1LG2、IDO1、CTLA4、ICOS、HAVCR、PDCD1、LAG3、SIGLEC15、TNFSF4、TNFRSF9、ENTPD1、VSIR、ICOSLG、TNFSF14、TMIGD2、CD27、NCR3、BTLA、CD40LG、CD40和TNFRSF4)之间的关系。运用TIDE算法来计算免疫治疗有效的可能性。利用肿瘤免疫治疗基因表达资源的相关矩阵(TIGER,http://tiger.canceromics.org/#/)来检查确定的RNA甲基化相关的lncRNAs是否与已知的免疫治疗反应特征相关。我们进一步使用GEPIA2(http://gepia2.cancer-pku.cn/)来估计我们确定的RNA甲基化相关的lncRNAs与免疫治疗反应特征之间的相关性。

免疫微环境分析显示,幼稚B细胞和CD4+记忆型静止T细胞主要富集在低风险得分组,而活化的NK细胞主要集中在高风险组(图5A)。此外,免疫功能分析发现活性细胞溶解、促炎反应、T细胞相关刺激、免疫检查点、T细胞相关抑制、CCR、MCH-I型、副炎症反应、IFN-I型反应在高低风险中存在差异(图5B)。筛选出的5个RNA甲基化关键IncRNAs与免疫检查点抑制剂存在相关性(图5C)。

TMB是对免疫疗法反应的预测性生物标志物。因此,我们比较了高风险得分组和低风险得分组的TMB差异,并显示了突变率最大的前20个基因(图5D-E)。然而,高风险评分组和低风险评分组之间的TMB没有明显的差异(图5F)。高TMB与CC患者良好的OS有关(图5G),高TMB与低风险评分相结合的CC患者的OS最长(图5H)。低风险组免疫治疗效果更好(图5I)。7)RNA甲基化关键lncRNAs的预后及免疫治疗的疗效评估

采用GEPIA2021(GeneExpressionProfilingInteractiveAnalysis2021,http://gepia2021.cancer-pku.cn/)分析免疫细胞浸润与筛选的RNA甲基化相关的关键IncRNAs之间的相关性,并根据浸润的免疫细胞比例比较两组的生存差异。进一步使用基因表达分析互动分析2(GEPIA2,http://gepia2.cancer-pku.cn/)来估计我们确定的关键RNA甲基化相关lncRNAs和免疫疗法反应特征之间的相关性。肿瘤免疫治疗基因表达资源的相关矩阵(TIGER,http://tiger.canceromics.org/#/)通过将已发表的基因签名应用于我们提供的宫颈鳞癌和宫颈内膜腺癌(CESC)的lncRNAs,预测患者对免疫治疗的反应,并利用基因表达数据与免疫治疗的临床信息比较我们提供的lncRNAs与已知免疫治疗反应签名的性能。

本发明专利表明:AC024270.3、FAM27E3和SOX21-AS1与幼稚B细胞呈正相关。幼稚B细胞与患者的良好的总生存相关,进一步说明高表达AC024270.3、FAM27E3和SOX21-AS1的患者预后好(图6A-D)。我们评估了关键lncRNAs(FAM27E3和SOX21-AS1)对CC患者免疫治疗反应的影响。结果表明:通过应用已发表的基因签名,FAM27E3和SOX21-AS1与CC患者的免疫治疗反应相关(表4)。根据TIGER数据库分析表明在黑色素瘤-GSE91061_anti-PD-1中,FAM27E3的表达在无反应者中高于反应者,FAM27E3的过度表达与总生存期有关(图6E-F)。根据GEPIA2的分析结果:FAM27E3与衰竭的T细胞相关特征呈负相关,影响Treg细胞和静止的Treg细胞特征(图6G-I)。本发明进一步表明:低分组对免疫治疗更敏感,FAM27E3和SOX21-AS1与CC患者免疫治疗的反应明显相关。

8)IC50来预测基于目标风险模型的新型药物的有效性

本专利使用R软件中"pRRophetic"包计算化疗药物的IC50,以评估化疗对宫颈癌患者的影响,该结果可用于指导具体的治疗。IC50分析发现:低风险组的患者对ABT.263、AKT抑制剂VIII及ATRA更敏感(图7B、C、F)。高风险评分的患者对A.770041、AP.24534、AS601245、AUY922、AZ628、和AZD.0530的IC50值小,表明这些患者对这五种药物更敏感(图7A,D,E,G,H,I)。

9)验证关键RNA甲基化相关lncRNAs的预后价值

采用在线分析数据库GEPIA(http://gepia.cancer-pku.cn/)和Lnc2Cancer3.0(http://bio-bigdata.hrbmu.edu.cn/lnc2cancer)来确认RNA甲基化相关lncRNAs在CC患者中的预后价值。结果进一步证实,FAM27E3和SOX21-AS1高表达与CC患者良好的预后有关(图7J,K)。

本发明有益效果

本发明上述技术方案具有以下特点:

1)本发明在TCGA数据库中提取宫颈癌患者的转录组数据、肿瘤突变数据及相关的临床资料。从已发表研究中获取55个RNA甲基化关键分子。进一步采用皮尔逊相关性算法筛选RNA甲基化相关IncRNAs。采用单因素回归分析及多因素回归方法构建宫颈癌RNA

甲基化相关IncRNA的预后模型。采用ROC曲线、绘制Kaplan-Meier生存曲线及计算一致性指数(C-index)以评估预后模型的准确性。

构建关键RNA甲基化IncRNAs与甲基化分子共表达网络。分析评估风险模型与临床特征、免疫细胞浸润、肿瘤突变负荷(TMB)、免疫功能、免疫治疗相关分子间的相关性。TIDE数据库评价高低风险组患者免疫治疗疗效差异。通过计算IC50来预测基于目标风险模型的新型药物的有效性。最后,采用GEPIA和Lnc2Cancer3.0在线数据库验证关键RNA甲基化相关lncRNAs的预后价值。本发明的开展,可以合理、可靠地筛选出RNA甲基化相关IncRNAs分子标志物,构建RNA甲基化相关lncRNAs的风险评分模型,此风险评分模型对于预测CC患者的预后、对免疫疗法的反应性和药物敏感性、协助制定更精确和个性化的治疗策略具有重要的意义。

2)本发明构建的RNA甲基化相关lncRNAs预后风险模型能独立于其他临床因素(年龄、性别、分期、分级、T分期及N分期等)准确的预测1年、3年和5年宫颈癌患者的预后。

3)与现有技术相比,本发明考虑到RNA甲基化和lncRNAs在宫颈癌生物学中的重要意义,确定了一个与RNA甲基化相关的lncRNAs风险模型来预测CC患者的预后、对免疫疗法的反应性和药物敏感性。

能够对CC样本的预后进行较为精准的判定;通过更加准确地提取对RNA甲基化相关的lncRNAs,使所选择出的与RNA甲基化相关的lncRNAs可以反应大部分宫颈癌患者样本的情况,从而使得最终的预后模型具有普适性,使得更多的宫颈癌患者受益。

以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本领域的技术人员应该了解本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号