首页> 中国专利> 一种用于区分非侵袭性和侵袭性无功能垂体腺瘤的基因组合

一种用于区分非侵袭性和侵袭性无功能垂体腺瘤的基因组合

摘要

本发明公开了一种用于区分非侵袭性和侵袭性无功能垂体腺瘤的基因组合,所述基因组合由以下基因组成:INSM1、Jun、JunB、RHOU、RHOB、EZR、LLGL2、SNX33、SPIRE2、MLF1、HSPA2、CDKN1A、ERN1、NR2F2、GAS2、CDK6、SFRP1、EMILIN2、CD9、SEMA7A。通过检测本发明的基因组合的表达水平,可以区分非侵袭性和侵袭性无功能垂体腺瘤。

著录项

说明书

技术领域

本发明属于生物医学领域,涉及一种用于区分非侵袭性和侵袭性无功能垂体腺瘤的基因组合。

背景技术

垂体腺瘤(Pituitary Tumours,PA)是一组起源于垂体前叶细胞的异质性疾病,约占颅内肿瘤的10%-15%,是常见的单克隆起源的腺瘤。人群发病率为1/10万,也有的报告可高达7/10万。随着分子生物学、细胞生物学、遗传学、免疫学等学科和新技术的飞速发展,很多学者从细胞、分子水平来阐明与其发病相关等方面的因素进行研究,以期对其发生机理及侵袭、复发相关性作出预测并指导临床治疗,取得了一定的进展。目前认为,包括无功能垂体腺瘤在内的大部分垂体腺瘤都是单克隆肿瘤,由一系列基因突变导致原癌基因的激活、抑癌基因的灭活,加上激素、生长因子、转录因子的刺激、细胞受体和信号通路异常等各种因素共同作用,通过复杂机制导致单个细胞转化为肿瘤细胞,肿瘤细胞的过度增殖和分泌功能失常,最终发生垂体腺瘤。然而,垂体腺瘤确切的机理尚待阐明。

根据肿瘤细胞有无合成和分泌有生物活性激素的功能将垂体肿瘤分为功能性垂体肿瘤和无功能肿瘤。不具备激素分泌功能的垂体腺瘤称为无功能垂体腺瘤(Non-functioning Pituitary Adenoma,NF-PA),占30%-40%。无功能垂体腺瘤的诊断要点为存在垂体腺瘤的影像学证据。由于无功能垂体腺瘤缺乏特异的血清激素标志,故确诊有时需依赖手术标本的病理检查及免疫细胞化学检查。2017年最新的WHO指南根据垂体前叶激素和转录因子的免疫组化染色结果将无功能垂体腺瘤分为零细胞腺瘤(激素和转录因子的免疫组化染色均为阴性)和静默型腺瘤(激素和转录因子的免疫组化染色结果与某一种具有分泌生物活性激素功能的垂体腺瘤一致)两大类。其中,绝大多数促性腺激素腺瘤和约20%的促肾上腺皮质激素瘤为静默型,是最主要的两类静默型无功能腺瘤。这种新的分型标准提示无功能垂体腺瘤患者之间存在较大的异质性。

虽然垂体腺瘤大多数是良性的,但仍有约35%的垂体腺瘤具有侵袭性,甚至有0.1%-0.2%的垂体腺瘤能够发展为癌,其恶性程度常与预后直接相关。侵袭性腺瘤难以通过常规手术完全切除,术后为了防止肿瘤复发,需要辅助放化疗。对于部分侵袭性腺瘤,单一的辅助治疗并不足以阻止肿瘤复发,从而造成肿瘤恶化及患者死亡。另一方面,手术方式选择不当将伤及正常腺体组织,影响垂体分泌功能,造成内分泌紊乱,副作用较多。因此,准确诊断肿瘤的侵袭性将有助于指导手术方式及后续治疗方法的选择,从早期阶段预防肿瘤的复发。近期研究发现无功能垂体腺瘤的侵袭性与上述细胞谱系来源、影像学特征等均存在一定相关性;也有研究报道了与无功能垂体腺瘤侵袭性相关的分子表达变化,但是目前尚无能够准确诊断无功能垂体腺瘤侵袭性的方法。

以高密度基因芯片和高通量测序为核心的基因组学技术迅速发展,已广泛应用到生物医学的各个领域并取得突出进展,使我们对于疾病的分子与遗传学基础的认识达到了一个新的水平。这些研究成果对于阐明疾病的病因、解析疾病发生的分子机制、寻找疾病特异的生物标志物和药物靶点,进而提升疾病的预防、诊断和治疗水平具有重要意义。

发明内容

为了弥补现有技术的不足,本发明的目的在于提供区分非侵袭性和侵袭性无功能垂体腺瘤的分子标志物。

为了实现上述目的,本发明采用如下技术方案:

一种用于区分非侵袭性和侵袭性无功能垂体腺瘤的分子标志物,所述分子标志物包括以下基因组合:INSM1、Jun、JunB、RHOU、RHOB、EZR、LLGL2、SNX33、SPIRE2、MLF1、HSPA2、CDKN1A、ERN1、NR2F2、GAS2、CDK6、SFRP1、EMILIN2、CD9、SEMA7A。

根据本发明的一个方面,本发明提供了检测前面所述的分子标志物表达的产品在制备区分非侵袭性和侵袭性无功能垂体腺瘤的工具中的应用。

进一步,上面所提到的检测前面所述的分子标志物表达的产品包括:通过反转录PCR、实时定量PCR、免疫检测、原位杂交、芯片或高通量测序平台检测前面所述的分子标志物表达水平以区分非侵袭性和侵袭性无功能垂体腺瘤的产品。

进一步,通过反转录PCR检测前面所述的分子标志物表达水平以区分非侵袭性和侵袭性无功能垂体腺瘤的产品包括特异扩增前面所述的分子标志物的引物;通过实时定量PCR检测前面所述的分子标志物表达水平以区分非侵袭性和侵袭性无功能垂体腺瘤的产品包括特异扩增前面所述的分子标志物的引物和/或探针;通过免疫检测检测前面所述的分子标志物表达水平以区分非侵袭性和侵袭性无功能垂体腺瘤的产品包括:与前面所述的分子标志物特异性结合的抗体;通过原位杂交检测前面所述的分子标志物表达水平以区分非侵袭性和侵袭性无功能垂体腺瘤的产品包括:与前面所述的分子标志物的核酸序列杂交的探针;通过芯片检测前面所述的分子标志物表达水平以区分非侵袭性和侵袭性无功能垂体腺瘤的产品包括:蛋白芯片和基因芯片;其中,蛋白芯片包括与前面所述的分子标志物特异性结合的抗体,基因芯片包括与前面所述的分子标志物的核酸序列杂交的探针。

在本发明的具体实施方案中,通过实时定量PCR检测前面所述的分子标志物表达水平以区分非侵袭性和侵袭性无功能垂体腺瘤的产品中包含的引物包括以下至少一对引物对:

SEQ ID NO.1和SEQ ID NO.2所示的引物对;

SEQ ID NO.4和SEQ ID NO.5所示的引物对;

SEQ ID NO.7和SEQ ID NO.8所示的引物对;

SEQ ID NO.10和SEQ ID NO.11所示的引物对;

SEQ ID NO.13和SEQ ID NO.14所示的引物对;

SEQ ID NO.16和SEQ ID NO.17所示的引物对;

SEQ ID NO.19和SEQ ID NO.20所示的引物对;

SEQ ID NO.22和SEQ ID NO.23所示的引物对;

SEQ ID NO.25和SEQ ID NO.26所示的引物对;

SEQ ID NO.28和SEQ ID NO.29所示的引物对;

SEQ ID NO.31和SEQ ID NO.32所示的引物对;

SEQ ID NO.34和SEQ ID NO.35所示的引物对;

SEQ ID NO.37和SEQ ID NO.38所示的引物对;

SEQ ID NO.40和SEQ ID NO.41所示的引物对;

SEQ ID NO.43和SEQ ID NO.44所示的引物对;

SEQ ID NO.46和SEQ ID NO.47所示的引物对;

SEQ ID NO.52和SEQ ID NO.53所示的引物对;

SEQ ID NO.55和SEQ ID NO.56所示的引物对;

SEQ ID NO.58和SEQ ID NO.59所示的引物对;

SEQ ID NO.61和SEQ ID NO.62所示的引物对。

通过实时定量PCR检测前面所述的分子标志物表达水平以区分非侵袭性和侵袭性无功能垂体腺瘤的产品中包含的探针包括以下探针序列中的至少一个:

SEQ ID NO.3所示的探针,与SEQ ID NO.1和SEQ ID NO.2所示的引物对配合使用;

SEQ ID NO.6所示的探针,与SEQ ID NO.4和SEQ ID NO.5所示的引物对配合使用;

SEQ ID NO.9所示的探针,与SEQ ID NO.7和SEQ ID NO.8所示的引物对配合使用;

SEQ ID NO.12所示的探针,与SEQ ID NO.10和SEQ ID NO.11所示的引物对配合使用;

SEQ ID NO.15所示的探针,与SEQ ID NO.13和SEQ ID NO.14所示的引物对配合使用;

SEQ ID NO.18所示的探针,与SEQ ID NO.16和SEQ ID NO.17所示的引物对配合使用;

SEQ ID NO.21所示的探针,与SEQ ID NO.19和SEQ ID NO.20所示的引物对配合使用;

SEQ ID NO.24所示的探针,与SEQ ID NO.22和SEQ ID NO.23所示的引物对配合使用;

SEQ ID NO.27所示的探针,与SEQ ID NO.25和SEQ ID NO.26所示的引物对配合使用;

SEQ ID NO.30所示的探针,与SEQ ID NO.28和SEQ ID NO.29所示的引物对配合使用;

SEQ ID NO.33所示的探针,与SEQ ID NO.31和SEQ ID NO.32所示的引物对配合使用;

SEQ ID NO.36所示的探针,与SEQ ID NO.34和SEQ ID NO.35所示的引物对配合使用;

SEQ ID NO.39所示的探针,与SEQ ID NO.37和SEQ ID NO.38所示的引物对配合使用;

SEQ ID NO.42所示的探针,与SEQ ID NO.40和SEQ ID NO.41所示的引物对配合使用;

SEQ ID NO.45所示的探针,与SEQ ID NO.43和SEQ ID NO.44所示的引物对配合使用;

SEQ ID NO.48所示的探针,与SEQ ID NO.46和SEQ ID NO.47所示的引物对配合使用;

SEQ ID NO.54所示的探针,与SEQ ID NO.52和SEQ ID NO.53所示的引物对配合使用;

SEQ ID NO.57所示的探针,与SEQ ID NO.55和SEQ ID NO.56所示的引物对配合使用;

SEQ ID NO.60所示的探针,与SEQ ID NO.58和SEQ ID NO.59所示的引物对配合使用;

SEQ ID NO.63所示的探针,与SEQ ID NO.61和SEQ ID NO.62所示的引物对配合使用。

根据本发明的另一个方面,本发明提供了一种区分非侵袭性和侵袭性无功能垂体腺瘤的工具,所述工具包括检测样本中前面所述的分子标志物的表达水平的试剂。

进一步,所述试剂包括能够结合前面所述的分子标志物的核酸或者能够结合前面所述的分子标志物编码蛋白的物质。所述核酸能够检测前面所述的分子标志物的mRNA表达水平;所述物质能够检测前面所述的分子标志物编码蛋白的表达水平。

更进一步,所述核酸包括扩增前面所述的分子标志物的引物,引物可以通过化学合成来制备,通过使用本领域技术人员知道的方法参考已知信息来适当地设计,并通过化学合成来制备。

在本发明的具体实施方案中,所述核酸为QPCR实验中使用的扩增引物,所述引物的序列如前面所述。

上面所述的核酸还可包括探针,所述探针可以通过化学合成来制备,通过使用本领域技术人员知道的方法参考已知信息来恰当设计,并通过化学合成来制备,或者可以通过从生物材料制备含有期望核酸序列的基因,并使用设计用于扩增期望核酸序列的引物扩增它来制备。

探针序列如前面所述的相同。

更进一步,所述物质包括针对前面所述的分子标志物编码蛋白的抗体。

进一步,所述诊断工具包括芯片、试剂盒、试纸、或高通量测序平台。

其中,所述芯片包括基因芯片、蛋白质芯片;所述基因芯片包括固相载体以及固定在固相载体的寡核苷酸探针,所述寡核苷酸探针包括用于检测前面所述的分子标志物转录水平的针对前面所述的分子标志物的寡核苷酸探针;所述蛋白质芯片包括固相载体以及固定在固相载体的前面所述的分子标志物编码蛋白的特异性抗体;所述基因芯片可用于检测前面所述的分子标志物的表达水平。所述蛋白质芯片可用于检测前面所述的分子标志物编码蛋白的表达水平。

其中,所述试剂盒包括基因检测试剂盒和蛋白免疫检测试剂盒;所述基因检测试剂盒包括用于检测前面所述的分子标志物转录水平的试剂;所述蛋白免疫检测试剂盒包括前面所述的分子标志物编码蛋白的特异性抗体。进一步,所述试剂包括使用反转录PCR、实时定量PCR、免疫检测、原位杂交或芯片方法检测前面所述的分子标志物表达水平过程中所需的试剂。优选地,所述试剂包括针对前面所述的分子标志物的引物和/或探针。根据前面所述的分子标志物的核苷酸序列信息容易设计出可以用于检测前面所述的分子标志物表达水平的引物和探针。

与前面所述的分子标志物的核酸序列杂交的探针可以是DNA、RNA、DNA-RNA嵌合体、PNA或其它衍生物。所述探针的长度没有限制,只要完成特异性杂交、与目的核苷酸序列特异性结合,任何长度都可以。所述探针的长度可短至25、20、15、13或10个碱基长度。同样,所述探针的长度可长至60、80、100、150、300个碱基对或更长,甚至整个基因。由于不同的探针长度对杂交效率、信号特异性有不同的影响,所述探针的长度通常至少是14个碱基对,最长一般不超过30个碱基对,与目的核苷酸序列互补的长度以15-25个碱基对最佳。所述探针自身互补序列最好少于4个碱基对,以免影响杂交效率。

所述高通量测序平台包括检测前面所述的分子标志物表达水平的试剂。

所述试纸包括试纸载体和固定在试纸载体上的寡核苷酸,所述寡核苷酸能够检测前面所述的分子标志物的转录水平。

进一步,前面所述的分子标志物编码蛋白的抗体包括单克隆抗体、多克隆抗体。前面所述的分子标志物编码蛋白的抗体包括完整的抗体分子、抗体的任何片段或修饰(例如,,嵌合抗体、scFv、Fab、F(ab’)2、Fv等。只要所述片段能够保留与前面所述的分子标志物编码蛋白的结合能力即可。用于蛋白质水平的抗体的制备时本领域技术人员公知的,并且本发明可以使用任何方法来制备所述抗体。

在本发明的具体实施方案中,所述针对前面所述的分子标志物的引物序列如前面所述。

进一步,本发明提到的样本包括组织、体液,体液包括但不限于血液、组织液、尿液、唾液、脊髓液等可以获得RNA的体液。在本发明的具体实施方案中,所述样本来源于组织。

根据本发明的又一个方面,本发明还提供了一种区分非侵袭性和侵袭性无功能垂体腺瘤的方法,所述方法包括如下步骤:

(1)获取待试者含有基因组DNA的样本;

(2)检测样本中前面所述的分子标志物的表达水平;

(3)将测得的前面所述的分子标志物的表达水平与无功能垂体腺瘤的亚型关联起来。

(4)与非侵袭性亚型参考值相比,如果INSM1、Jun、JunB、RHOU、RHOB、EZR、LLGL2、SNX33、SPIRE2、MLF1、HSPA2、CDKN1A、ERN1、NR2F2、GAS2、CDK6表达显著上调、SFRP1、EMILIN2、CD9、SEMA7A表达显著下调,则代表该待试者属于侵袭性无功能垂体腺瘤患者。

本发明上面所述的待试者可以是不知是否患有垂体腺瘤的人,也可以是已经确诊为垂体腺瘤但不能确定是属于垂体腺瘤哪种亚型的人,也可以是已经确诊为无功能垂体腺瘤的人。

本发明的优点和有益效果:

本发明首次发现了INSM1、Jun、JunB、RHOU、RHOB、EZR、LLGL2、SNX33、SPIRE2、MLF1、HSPA2、CDKN1A、ERN1、NR2F2、GAS2、CDK6、SFRP1、EMILIN2、CD9、SEMA7A表达与侵袭性无功能垂体腺瘤相关,通过检测上述基因表达,可以判断待试者是否为侵袭性无功能垂体腺瘤,从而指导临床医师给受试者提供治疗方案。

本发明发现了一种新的分子标记物-INSM1、Jun、JunB、RHOU、RHOB、EZR、LLGL2、SNX33、SPIRE2、MLF1、HSPA2、CDKN1A、ERN1、NR2F2、GAS2、CDK6、SFRP1、EMILIN2、CD9、SEMA7A,相比传统的检测手段,基因诊断更及时、更特异、更灵敏,能够实现侵袭性无功能垂体腺瘤亚型快速诊断。

附图说明

图1显示MRI结果图;

图2显示免疫组化结果图;

图3显示RNA-seq结果图;

图4显示本发明的20个差异表达基因的表达水平统计图;

图5显示利用qRT-PCR检测20个差异表达基因的表达水平统计图;

图6显示qRT-PCR和RNA-seq一致性的结果图;

图7显示ROC曲线图;

图8显示qRT-PCR中基因扩增的标准曲线在Cq值和样品浓度的对数之间的线性关系图。

具体实施方式

下面结合附图和实施例对本发明作进一步详细的说明。以下实施例仅用于说明本发明而不用于限制本发明的范围。实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring HarborLaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。

实施例1侵袭性无功能垂体腺瘤相关基因筛选与验证

1、样品采集(临床诊断)和研究监督

从该研究所有个体参与者那里获取知情同意书。研究招募过程和方案经北京协和医院伦理审查委员会批准(编号S-551)。收集2012年5月至2017年7月间在北京协和医院进行经蝶窦手术的患者,取其垂体腺瘤。61例NF-PA进行RNA-seq,143例NF-PA进行TaqMan定量RT-PCR和组织微阵列。根据临床表现、激素测试和磁共振成像(MRI)检查确诊NF-PAs。另外,对所有垂体前叶激素和转录因子进行免疫组织化学染色以区分NF-PA亚型(表1)。在本研究中,所有NF-PA的最大直径均大于20毫米。根据Knosp分类诊断非侵袭性PA(NNF-PA)和侵袭性PA(INF-PA),并在术中予以确认。非侵袭性PA为Knosp 0、1或2级,未侵入海绵窦。所有侵袭性PA均选取Knosp 4级,且侵入了海绵窦的病例。记录每个患者的临床特征,手术结果,术后并发症,病理结果和随访数据。

表1用于RNA-seq实验的NF-PAs亚型区分

2、组织微阵列(TMA)(包括免疫组织化学和评分)

使用以下抗体对人垂体腺瘤组织微阵列进行免疫组织化学研究:T-PIT(ZM-0318,稀释度1:100;ZSJQ Corp.);SF-1(ZM-0089,稀释度1:100;ZSJQ Corp.);和PIT-1(ZM-0208,稀释度1:100;ZSJQ Corp.),根据文献报道的方法在连续切割的组织阵列切片中染色[Wallace TJ,Qian J,Avital I,Bay C,Man Y-G,Wellman LL,et al.TechnicalFeasibility of Tissue Microarray(TMA)Analysis of Tumor-Associated ImmuneResponse in Prostate Cancer.J Cancer.2018;9:2191-202]。TMA在二甲苯中脱蜡,并在乙醇中水合,然后水中冲洗。用3%H

3、RNA提取和测序

从PA组织中提取总RNA,并使用NanoDrop 2000/2000c(Thermo FisherScientific Inc.,Waltham,MA,USA)检查RNA完整性。根据制造商说明,使用

4、差异基因表达

使用DESeq2分析差异基因表达(DGE)。DGE分析之前检查技术协变量和批次效应。FDR<0.05,│fold change│>2代表差异显著。

5、实时定量PCR(qRT-PCR)

使用基于TaqMan探针的基因表达分析(Thermo Fisher,Foster City,CA)评估mRNA表达。引物和探针序列列于表2中,使用UBC和GAPDH进行目的基因表达量的标准化。每个样品的相对表达水平记录为基因表达与两个参考基因(GAPDH和UBC)表达的几何平均值之比。每个样品进行三次重复。GAPDH,UBC和其他mRNA的标准曲线在Cq值和样品浓度的对数之间显示出良好的线性关系(图8)。

表2引物和探针序列

6、支持向量机分类器

本研究使用由R软件包e1071运行的支持向量机(SVM)算法对INF-PA和NNF-PA进行分类。实验验证基因表达量均一化后用于构建SVM算法。在训练集上对SVM算法进行训练以构建模型,并在验证集中预测样本(训练:验证=2:1)。在训练集上进行留一法交叉验证(LOOCV)以评估模型的质量。通过R包pROC进行受试者工作曲线(ROC)分析评估预测强度。

7、统计分析

数据显示为平均值±标准偏差。根据理论频率,使用卡方检验或费舍尔精确检验对垂体腺瘤患者的分类临床特征进行统计学检验。通过F检验确认方差相等之后,将Mann-Whitney U检验或t检验用于连续变量。

8、结果

8.1NF-PA患者的临床特征

收集61例无任何内分泌过度分泌综合征的临床NF-PA患者,并检查肿瘤的病理特征。为了确定浸润海绵窦的状态,采用Knosp等[Knosp E,Steiner E,Kitz K,MatulaC.Pituitary adenomas with invasion of the cavernous sinus space:a magneticresonance imaging classification compared with surgicalfindings.Neurosurgery.1993;33]描述的分类标准通过MRI确定放射学特征,并在手术过程中得到确认(图1)。其中,39例是0、1或2级(非侵袭性NF,NNF),而其他22例是4级(侵袭性NF,INF)。两组之间的苏木精和曙红染色,p53阳性率和Ki-67检测的特征无显著性差异(表3和图2)。

NNF-PA患者和INF-PA患者的手术结果,术后并发症和预后明显不同。所有NNF-PA患者进行了全切除(74.4%)或次全切除(25.6%),而超过一半(54.5%)的INF-PA患者仅进行了部分切除。结果,更多INF-PA患者接受了后续治疗,包括放射治疗,药物治疗和手术治疗。在随访期间,22例INF-PA患者中有14例残留稳定,而8例肿瘤生长,其中2例在平均60.4个月后死亡。相反,在平均58.2个月的随访中,NNF组没有肿瘤生长或死亡。此外,除8.6%的NNF-PA患者外,所有INF-PA患者均出现术后症状,如头痛,视力障碍,单眼失明,垂体功能减退,脑神经麻痹等(表3)。

表3患者的临床特征

8.2RNA-seq区分INF-PA和NNF-PA

RNA-seq结果显示,与NNF-PA相比,INF-PA中843个基因表达上调,1435个基因表达下调(FDR<0.05,且│fold change│>2,图3)。

8.3候选基因验证

经过信号通路分析,在差异表达基因中选择17个上调的和4个下调的候选基因(图4),在另一组NF-PA样本(临床特征见表4)中进行qRT-PCR分析以验证其表达,这些候选基因包括INSM1、Jun、JunB、RHOU、RHOB、EZR、LLGL2、SNX33、SPIRE2、MLF1、HSPA2、CDKN1A、ID2、ERN1、NR2F2、GAS2、CDK6、SFRP1、EMILIN2、CD9、SEMA7A。结果显示,与NNF-PA相比,INSM1、Jun、JunB、RHOU、RHOB、EZR、LLGL2、SNX33、SPIRE2、MLF1、HSPA2、CDKN1A、ERN1、NR2F2、GAS2、CDK6、SFRP1、EMILIN2、CD9、SEMA7A基因这20个基因在INF-PA中差异表达,结果同RNA-seq(图5)。本研究证实独立队列中的RNA-seq和qRT-PCR存在一致性(图6)。

表4用于验证的NF-PA患者临床特征

8.4诊断效能检测

利用基于留一交叉验证(LOOCV)的支持向量机(SVM)算法,结合肿瘤亚型,检测NNF-PAs和INF-PAs之间经验证的20个差异表达基因的预测潜力。简言之,本研究从n-1训练分类器,其中N表示受试者的数量,并且预测了第N个受试者的侵袭性。整个方法重复N次,以预测队列中每个样本的侵袭性。RNA-seq分析中的61例样本选择其中N=41例样本作为训练集,训练集中20个差异表达基因的预测准确率为90.24%(表5)。随后在其他20例样本(验证集)中进行验证,20个差异表达基因的预测准确率为80%(表6)。ROC曲线分析显示:训练集中,利用20个差异表达基因区分INFs和NNFs的AUC为0.977,验证集中;利用20个差异表达基因区分INFs和NNFs的AUC为0.843,当cutoff值为0.705时,敏感性为0.805,特异性为0.760(图7)。上述结果表明,本发明的20个差异表达基因可作为临床诊断侵袭性无功能垂体腺瘤的分子标志物。

表5训练集诊断效能

表6验证集诊断效能

上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。

序列表

<110> 中国医学科学院北京协和医院

中国医学科学院基础医学研究所

<120> 一种用于区分非侵袭性和侵袭性无功能垂体腺瘤的基因组合

<141> 2020-10-12

<150> 2020107727493

<151> 2020-08-04

<160> 69

<170> SIPOSequenceListing 1.0

<210> 1

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

gaggaggttt gcctgtgatt t 21

<210> 2

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

tcccaggact ctatccagaa tg 22

<210> 3

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

aattatcgct agggccaagg tggg 24

<210> 4

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

cagcagcagt gtgatgacta t 21

<210> 5

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

cgggctcgga ggttatttat t 21

<210> 6

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

tctatcactc ccaggtagct gctcc 25

<210> 7

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

cggcttcctc ttggtgatat t 21

<210> 8

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

gcttgttgta ggtgtccttg ta 22

<210> 9

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

atggccgcag ctatttcaat ggc 23

<210> 10

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

ttccgtacct cctcactcaa 20

<210> 11

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 11

tggaaggtct ctgtgggtat 20

<210> 12

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 12

ctaccactca agccttccca accc 24

<210> 13

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 13

cacagagaga cagacttgag aac 23

<210> 14

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 14

acttggatac ccttggcttt ag 22

<210> 15

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 15

cttgacaagt tgcgacggag agaaa 25

<210> 16

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 16

ccatcaacat ggaagaccaa ga 22

<210> 17

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 17

cttgagcgtc ttcaccttgt 20

<210> 18

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 18

catcaaagtg gagcgcaagc ggc 23

<210> 19

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 19

gcagggaggt gaatactctt g 21

<210> 20

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 20

gaagtacatc ttggccgact ta 22

<210> 21

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 21

aaggccaaca gcaagtgttt gtggga 26

<210> 22

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 22

gtatgtagcg tacgggttgt t 21

<210> 23

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 23

cagcagttca caagccataa taaa 24

<210> 24

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 24

aggctgtaaa ttgaacttcc cacacgat 28

<210> 25

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 25

ttcggagcta agatggtgtt at 22

<210> 26

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 26

ggaaagatgg tcaagtcctg t 21

<210> 27

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 27

taagggtggt gatgggtgag cgc 23

<210> 28

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 28

gatcgaggat actcaccaga aa 22

<210> 29

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 29

ccagttgtat ttggctggat tg 22

<210> 30

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 30

caccatggat gcagagctgg agttt 25

<210> 31

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 31

tgatctcacc ctcggagttt 20

<210> 32

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 32

gcggtggttc ttggtttct 19

<210> 33

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 33

cacttggtgg agagagagaa gcgc 24

<210> 34

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 34

ccgtaacctc aaccgtttct 20

<210> 35

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 35

ggagtatgtc tcagcgatct tg 22

<210> 36

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 36

atgctttgtg cgttctggag tgga 24

<210> 37

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 37

gtctgcactt cctgtagcat aa 22

<210> 38

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 38

gataccctct gaggactctc aa 22

<210> 39

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 39

cacatccctg tctacacact gggc 24

<210> 40

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 40

ctggctcccg agaacttaaa 20

<210> 41

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 41

gcctttgatg tggagtttgt c 21

<210> 42

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 42

agggagaaac ctcaacaaag tccagc 26

<210> 43

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 43

ccctggagtc ctatacctac aa 22

<210> 44

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 44

gacacttgtc gaggatcttg tt 22

<210> 45

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 45

aagcagacgg tggaagacga gaaa 24

<210> 46

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 46

cggaacaagg agtcagacat t 21

<210> 47

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 47

agtgccagga aagacaacta c 21

<210> 48

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 48

agatggtggc agtagaggct atgga 25

<210> 49

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 49

caagaaggtg agcaagatgg a 21

<210> 50

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 50

ggtgatgcag gctgacaata 20

<210> 51

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 51

tgcagcacgt catcgactac atcttg 26

<210> 52

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 52

cccatcaacc tctcttctgt atc 23

<210> 53

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 53

aggccgcata gtcaaagtag 20

<210> 54

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 54

tggtgatggt gtattctgtt cgccc 25

<210> 55

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 55

cgtctcctcc tcagtcatag a 21

<210> 56

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 56

tgccatatac ggccagttaa a 21

<210> 57

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 57

tgctgccgga cagtaacata tccc 24

<210> 58

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 58

gattgcagcc aggtatggt 19

<210> 59

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 59

gaaggagaag gtgaaggaga ag 22

<210> 60

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 60

tggagcctcc tggtttgata aagctg 26

<210> 61

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 61

ctagcaacca tccctccatt ac 22

<210> 62

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 62

ctcagagcat tctgaagaca gtag 24

<210> 63

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 63

acacagaaag ccctcttgaa gcaa 24

<210> 64

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 64

ggtgtgaacc atgagaagta tga 23

<210> 65

<211> 22

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 65

gagtccttcc acgataccaa ag 22

<210> 66

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 66

agatcatcag caatgcctcc tgca 24

<210> 67

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 67

gtaccctgtc tgactacaac atc 23

<210> 68

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 68

gtcttgccag tgagtgtctt 20

<210> 69

<211> 24

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 69

agaaagagtc caccttgcac ctgg 24

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号