首页> 中国专利> FABP4基因的SNP位点rs1054135与三阴型乳腺癌预后的相关性

FABP4基因的SNP位点rs1054135与三阴型乳腺癌预后的相关性

摘要

本发明涉及三阴型乳腺癌的预后,尤其涉及SNP位点与三阴型乳腺癌预后的相关性,特别涉及FABP4基因的SNP位点rs1054135与三阴型乳腺癌预后的相关性。本发明具体涉及FABP4基因的SNP位点rs1054135的核酸亲和配体在制备用于三阴型乳腺癌预后的试剂盒中的应用,以及包含相应核酸亲和配体的用于三阴型乳腺癌预后的试剂盒。

著录项

  • 公开/公告号CN106337081A

    专利类型发明专利

  • 公开/公告日2017-01-18

    原文格式PDF

  • 申请/专利权人 中国医学科学院肿瘤医院;

    申请/专利号CN201610072847.X

  • 发明设计人 袁芃;王雯邈;

    申请日2016-02-02

  • 分类号C12Q1/68;G01N33/68;G01N33/574;

  • 代理机构北京永新同创知识产权代理有限公司;

  • 代理人栾星明

  • 地址 100021 北京市朝阳区潘家园南里17号

  • 入库时间 2023-06-19 01:22:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-01-21

    授权

    授权

  • 2017-02-15

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20160202

    实质审查的生效

  • 2017-01-18

    公开

    公开

说明书

技术领域

本发明涉及三阴型乳腺癌(Triple-negative breast cancer,TNBC)的预后,尤其涉及单核苷酸多态性(single-nucleotide polymorphisms,SNP)位点与三阴型乳腺癌预后的相关性,特别涉及FABP4(脂肪酸结合蛋白4)基因的SNP位点rs1054135与三阴型乳腺癌预后的相关性。

背景技术

乳腺癌是一种严重威胁人类健康的常见肿瘤,近年来在世界范围内其发病率、死亡率均持续快速增长。2008年,全球约有120万乳腺癌新发病例,40万乳腺癌死亡病例。在我国,乳腺癌的发病率和死亡率均呈明显上升趋势,其发病率已跃居女性恶性肿瘤的第1位。2011年我国肿瘤登记地区乳腺癌发病率为47.64/10万,人口标化率为25.26/10万,增长速度较五年前上升了3倍。在上海、北京、广州等城市,乳腺癌发病率已与西方国家持平,成为危害妇女健康的最大原因。

乳腺癌是公认的高度异质性的肿瘤,表现在临床分期和病理类型相同的乳腺癌患者,生物学行为和预后常有很大差异。临床上根据免疫组化指标--雌激素受体(ER)、孕激素受体(PR)、表皮生长因子受体2(HER-2)及Ki-67的水平将乳腺癌分为管腔A型、管腔B型、HER2/neu型及三阴型。其中,三阴型乳腺癌是指ER、PR及HER-2均为阴性的亚型,占全部乳腺癌患者的15-20%。既往研究显示三阴型乳腺癌侵袭性强,预后较差,且是异质性最强的一类亚型,部分患者易于在早期,特别是头三年中发生复发转移。随着分子分型技术的发展,乳腺癌按照内在基因表达的情况进一步分为5种亚型:管腔A型、管腔B型、HER2/neu型、基底细胞样型及正常乳腺样型。

传统的研究方法将各型乳腺癌作为整体研究对象,其结论往往受多种混杂因素影响,可重复性差。乳腺癌的治疗已进入分子分型时代,不同分型间的肿瘤生物学特性及基因谱差异显著,因此,在基因水平上探索可用于预测三阴型 乳腺癌复发转移的遗传变异对于临床有重要意义。而鉴定三阴型乳腺癌临床预后相关的亚群将有助于个性化治疗方案的设计和实施。

基因的结构和表达的改变(即基因的差异表达)与乳腺癌的生物学行为存在千丝万缕的联系。这其中包括了雌激素受体相关基因、乳腺癌家族易感基因(BRCA1、BRCA2)、细胞生物学行为相关基因(bcl-2、PCNA、CYCD1等)、原癌基因(ras、myc、muc1等)、细胞增殖相关基因(CDKN3、CRIP1、TPX2等)、细胞黏附相关基因(FN1、LPXN、TSPAN1等)、细胞凋亡相关基因(PYCARD、BAX、CXCR4)等。上述基因与乳腺肿瘤的发生、生长、转化和转移密切相关。例如,在一项对比乳腺癌与正常乳腺组织mRNA水平的研究发现,近90%浸润癌和原位癌中CRIP1基因表达上调8-10倍。而根据乳腺癌的基因微阵列分析挑选出的差异表达基因组成的21基因表达谱(Oncotype DX)已证实对于受体阳性的患者预测化疗疗效和评估复发风险具有指导意义,并被美国食品药品管理局(FDA)批准应用于临床。

MicroRNA (miRNA)是一类进化上高度保守的单链RNA,作为一类转录后水平调控分子,在癌基因和/或抑癌基因的表达失调中可能发挥着重要作用。研究表明,miRNA参与了肿瘤细胞免疫逃逸、无限增殖、肿瘤的血管生成和肿瘤转移等过程。miRNA通过与靶基因mRNA的3′UTR(非翻译区)特异性结合,引起靶mRNA的翻译抑制或切割降解,调控基因的表达,从而在细胞的生长、分化和凋亡过程中发挥重要作用。因此靶基因的mRNA的3′UTR的遗传变异可能通过影响与miRNA的相互作用而影响miRNA的调控作用,进而影响基因的表达,从而与不同个体的肿瘤预后相关。

人类基因组计划(Human Genome Project,HGP)研究成果表明,不同个体的基因都是一样的,但在DNA序列上有遗传差异,其中最主要的是单核苷酸多态(SNP)。SNP在恶性肿瘤包括乳腺癌的遗传易感性中的作用已有广泛研究,位于编码区的SNP可能引发氨基酸序列的改变,从而影响蛋白质的功能;而位于非编码区的SNP也可能通过调控临近基因的转录、翻译或剪切等功能而影响蛋白质的表达,正是这些功能性的SNP构成了不同个体或亚群体间肿瘤易感性和对放、化疗疗效差异的遗传学基础。同时,SNP是一种方便易行的临床检测标记;因此,如果能筛查到与乳腺癌预后相关的SNP作为预测指标,将对乳腺癌个体化治疗产生重要指导意义。

然而,以往基于候选基因法的关联研究结果往往难以重复,并且疾病候选基因或候选区域的选择需要依赖于对该目标基因功能的了解,不易用于发现新的易感基因或致病区域。随着国际单体型图计划的进一步完善,相邻单核苷酸多态之间的连锁不平衡关系日益清晰,其结果直接导致了肿瘤遗传学研究进入全基因组范畴内的关联分析(Genome-wideassociation study,GWAS)。虽然GWAS研究带来了令人惊喜的进展,但花费巨大,且大多数现已发现的肿瘤相关SNP位于基因荒漠区,且只能解释肿瘤预后个体差异中的一小部分,因此,发现并揭示真正的“致病”SNP、弥补GWAS研究的“缺失的遗传性”(missingheritability)对包括乳腺癌在内的肿瘤遗传学领域极为重要。

随着高通量芯片技术的发展,目前几乎所有癌种肿瘤组织与正常组织的差异表达的基因图谱已绘制完成,Nextbio数据库将已发表的大多数肿瘤表达谱数据进行了汇总和评分,按照评分高低列出了基因表达的差异强度,其中乳腺癌中表达差异最显著的基因包括BRCA1、BACH1、KRAS和RAD51等,这些基因在乳腺癌发生发展中的作用机制已有报道。如BRCA1是乳腺癌及卵巢癌特异性抑癌基因,是第一个被鉴别出来的人类乳腺癌易感基因。BRCA1在调节细胞进程、DNA损伤修复、细胞生长与凋亡及转录活化与抑制等多种生物学途径中发挥重要作用。大量研究表明三阴型乳腺癌和BRCA1通路有关。BACH1属于CNC-bZip转录抑制因子家族的一员,其蛋白含有BTB/POZ结构域,可以与MafK结合成异二聚体,从而抑制Maf识别元件介导的转录过程。多年来的研究表明,BACH1的靶基因产物在氧化应激反应、免疫应答机制及细胞周期调控中发挥重要作用。

miRNA是影响基因表达的重要表观遗传调控机制,对细胞的生长发育、凋亡及增殖等产生重要影响。近年来研究发现,在miRNA结合位点存在着一些功能性SNP,这些多态可能通过影响miRNA与靶序列的识别,逐渐改变miRNA调节的细胞功能网络,并进而影响肿瘤的发生发展。三阴型乳腺癌复发起源于肿瘤干细胞,miRNA在对肿瘤干细胞的调控中发挥重要作用。为了减少混杂因素影响,提高研究的科学性和靶向性,本研究拟从肿瘤的表达谱汇总数据中挑选出差异表达基因,探讨其miRNA结合位点的功能性多态在肿瘤发生发展中的作用机制,并系统分析这些变异的联合作用机制,以期找到与肿瘤预后相关的“预测”SNP,为三阴型乳腺癌患者判断预后、筛选高危复发风险人群、选择个 体化治疗方案提供理论依据。

本发明利用多个公共数据库中的信息,获得汉族人口乳腺癌中失调基因的3′UTR的SNP,并与中国汉族人群最小等位基因频率(minor allele frequency,MAF)≥5%的SNP位点相整合,确定最终的目标SNP。筛选得到的FABP4基因的SNP位点rs1054135经证实与三阴型乳腺癌的复发转移具有极高的相关性,可以作为三阴型乳腺癌有效的临床标志物。此外,本发明还发现rs1054135基因型可以调控FABP4蛋白表达,从而影响三阴型乳腺癌预后。相应地,FABP4蛋白表达水平或其与FABP4基因的SNP位点rs1054135的组合可用于三阴型乳腺癌预后。

发明内容

本发明具体技术方案如下:

第一方面,本发明提供了FABP4基因的SNP位点rs1054135的核酸亲和配体在制备用于三阴型乳腺癌预后的试剂盒中的应用,其中所述试剂盒任选包括辅助成分,所述辅助成分选自PCR缓冲液、dNTP、聚合酶、离子、杂交溶液。

第二方面,本发明提供了用于三阴型乳腺癌预后的试剂盒,其包含针对FABP4基因的SNP位点rs1054135的核酸亲和配体,以及任选包括辅助成分,所述辅助成分选自PCR缓冲液、dNTP、聚合酶、离子、杂交溶液。

在一个实施方案中,所述核酸亲和配体是特异于所述FABP4基因的SNP位点rs1054135的引物或探针。

在另一个实施方案中,所述引物序列如5’-ACGTTGGATGGGTTTCTGAGATACACCTAC-3’(SEQ ID NO:22)和5’-ACGTTGGATGCAAGGTAAAAAGGGATATCT-3’(SEQ ID NO:23)所示。

在另一个实施方案中,所述探针具有与所述FABP4基因的SNP位点rs1054135或其附近的核苷酸互补的序列,优选所述探针的序列如5’-GGATTTCCCTAGGTAGGA-3’(SEQ IDNO:234)所示,优选所述探针是被标记的。

在另一个实施方案中,所述预后包括以下步骤:

(1)使来自对象样品的核酸与所述核酸亲和配体接触;

(2)确定rs1054135的基因型;并且

(3)基于所述基因型确定对象的三阴型乳腺癌预后。

在另一个实施方案中,rs1054135为GG基因型的对象三阴型乳腺癌预后较好,rs1054135为AA或AG基因型的对象三阴型乳腺癌预后较差。

在另一个实施方案中,所述rs1054135的基因型的确定选自以下方法:直接测序、单碱基延伸、等位基因特异性探针杂交、等位基因特异性引物延伸、等位基因特异性扩增、等位基因特异性核苷酸掺入、5'核酸酶消化、分子信标测定、寡核苷酸连接测定、大小分析和单链构象多态性。

在另一个实施方案中,所述样品选自脑脊液、血液、血清、痰、唾液、黏膜刮除物、组织活检、泪分泌物、精液和汗水。

第三方面,本发明提供了FABP4蛋白的结合配偶体在制备用于三阴型乳腺癌预后的试剂盒中的应用,其中所述试剂盒任选包括其他亲和配体、检测染料或者进行蛋白检测所需的其他试剂。

第四方面,本发明提供了用于三阴型乳腺癌预后的试剂盒,其包含针对FABP4蛋白的结合配偶体,以及任选包括其他亲和配体、检测染料或者进行蛋白检测所需的其他试剂。

在一个实施方案中,所述结合配偶体是特异于所述FABP4蛋白的抗体。

在另一个实施方案中,所述预后包括以下步骤:

(1)使来自对象样品的蛋白与所述结合配偶体接触;

(2)确定FABP4蛋白表达水平;并且

(3)基于所述FABP4蛋白表达水平确定对象的三阴型乳腺癌预后。

在另一个实施方案中,FABP4蛋白表达水平较低的对象三阴型乳腺癌预后较好,FABP4蛋白表达水平较高的对象三阴型乳腺癌预后较差。

在另一个实施方案中,所述样品选自脂肪细胞、脑脊液、血液、血清、痰、唾液、黏膜刮除物、组织活检、泪分泌物、精液和汗水。

第五方面,本发明提供了FABP4基因的SNP位点rs1054135的核酸亲和配体和FABP4蛋白的结合配偶体在制备用于三阴型乳腺癌预后的试剂盒中的应用。

第六方面,本发明提供了用于三阴型乳腺癌预后的试剂盒,其包含针对FABP4基因的SNP位点rs1054135的核酸亲和配体和针对FABP4蛋白的结合配偶体。

在一个实施方案中,所述核酸亲和配体是特异于所述FABP4基因的SNP位点rs1054135的引物或探针。

在另一个实施方案中,所述引物序列如5’-ACGTTGGATGGGTTTCTGAGATACACCTAC-3’(SEQ ID NO:22)和5’-ACGTTGGATGCAAGGTAAAAAGGGATATCT-3’(SEQ ID NO:23)所示。

在另一个实施方案中,所述探针具有与所述FABP4基因的SNP位点rs1054135的核苷酸互补的序列,优选所述探针的序列如5’-GGATTTCCCTAGGTAGGA-3’(SEQ ID NO:234)所示,优选所述探针是被标记的。

在另一个实施方案中,所述rs1054135的基因型的确定选自以下方法:直接测序、单碱基延伸、等位基因特异性探针杂交、等位基因特异性引物延伸、等位基因特异性扩增、等位基因特异性核苷酸掺入、5'核酸酶消化、分子信标测定、寡核苷酸连接测定、大小分析和单链构象多态性。

在另一个实施方案中,所述样品选自脑脊液、血液、血清、痰、唾液、黏膜刮除物、组织活检、泪分泌物、精液和汗水。

在另一个实施方案中,所述结合配偶体是特异于所述FABP4蛋白的抗体。

在另一个实施方案中,所述预后包括以下步骤:

(1)使来自对象样品的核酸与所述核酸亲和配体接触;

(2)确定rs1054135的基因型;。

(3)使来自对象样品的蛋白与所述结合配偶体接触;

(4)确定FABP4蛋白表达水平;并且

(5)基于所述rs1054135的基因型和所述FABP4蛋白表达水平确定对象的三阴型乳腺癌预后。

在另一个实施方案中,rs1054135为GG基因型,且FABP4蛋白表达水平较低的对象三阴型乳腺癌预后较好,rs1054135为AA或AG基因型,且FABP4蛋白表达水平较高的对象三阴型乳腺癌预后较差。

第七方面,本发明提供了用于三阴型乳腺癌预后的方法,包括以下步骤:

(1)使来自对象样品的核酸与针对FABP4基因的SNP位点rs1054135的核酸亲和配体接触;

(2)确定rs1054135的基因型;并且

(3)基于所述基因型确定对象的三阴型乳腺癌预后。

在一个实施方案中,rs1054135为GG基因型的对象三阴型乳腺癌预后较好,rs1054135为AA或AG基因型的对象三阴型乳腺癌预后较差。

第八方面,本发明提供了用于三阴型乳腺癌预后的方法,包括以下步骤:

(1)使来自对象样品的蛋白与FABP4蛋白的结合配偶体接触;

(2)确定FABP4蛋白表达水平;并且

(3)基于所述FABP4蛋白表达水平确定对象的三阴型乳腺癌预后。

在一个实施方案中,FABP4蛋白表达水平较低的对象三阴型乳腺癌预后较好,FABP4蛋白表达水平较高的对象三阴型乳腺癌预后较差。

第九方面,本发明提供了用于三阴型乳腺癌预后的方法,包括以下步骤:

(1)使来自对象样品的核酸与针对FABP4基因的SNP位点rs1054135的核酸亲和配体接触;

(2)确定rs1054135的基因型;。

(3)使来自对象样品的蛋白与FABP4蛋白的结合配偶体接触;

(4)确定FABP4蛋白表达水平;并且

(5)基于所述rs1054135的基因型和所述FABP4蛋白表达水平确定对象的三阴型乳腺癌预后。

在一个实施方案中,rs1054135为GG基因型,且FABP4蛋白表达水平较低的对象三阴型乳腺癌预后较好,rs1054135为AA或AG基因型,且FABP4蛋白表达水平较高的对象三阴型乳腺癌预后较差。

第十方面,本发明提供了针对FABP4基因的SNP位点rs1054135的核酸亲和配体,其用于三阴型乳腺癌预后。

第十一方面,本发明提供了FABP4蛋白的结合配偶体,其用于三阴型乳腺癌预后。

之前的研究发现,FGFR2基因的rs1047057(TT)基因型、THSD4基因的rs1054260(TC或TT)基因型是三阴性乳腺癌发生复发转移的保护因素,而KRAS基因的rs7973450(GA或GG)基因型和ZNF365基因的rs11819488(GA或GG)基因型是是三阴性乳腺癌复发转移的危险因素。

本发明采用较多的样本量,首次通过发现组和验证组样品的两个独立阶段分析,同时结合多重检验,检测了三阴型乳腺癌预后与定位于靶基因3′-UTR的 miRNA互补结合位点的SNP的相关性,大大降低了假阳性结果的可能性。由于胚系突变比体细胞突变更稳定,胚系突变SNP预后标记可以提供关于个体易发肿瘤转移的更可靠信息,并更不可能受到肿瘤内异质性的影响。

在此基础上,本发明首次鉴定了FABP4基因的SNP位点rs1054135与三阴型乳腺癌的复发风险和无病生存期(Disease free survival,DFS)相关。本发明还首次发现了rs1054135、FABP4表达和三阴型乳腺癌预后三者之间两两相关,rs1054135的A等位基因能够上调三阴型乳腺癌患者中的FABP4表达,而rs1054135基因型及FABP4蛋白表达均与三阴型乳腺癌预后相关。由于FABP4是肿瘤生长营养供应的重要介质,定位于FABP4的3′-UTR的rs1054135SNP可能是通过转录后调控FABP4表达,影响三阴型乳腺癌患者的复发风险。

另外,本发明的重要性还在于三阴型乳腺癌患者的即时治疗选择较少,并且这些患者倾向于具有更严重的疾病。本发明不仅证实了三阴型乳腺癌复发过程中脂代谢的显著作用,还发现了定位于FABP4的3′-UTR中的新的SNP与BMI相互作用,并显示与无病生存期的强相关性。因此,对于具有rs1054135-AA/AG基因型的患者,强烈推荐低脂饮食干预和体重管理。更重要的是,这些结果表明,切断“燃料供应”可能是缺少治疗靶标的肿瘤例如三阴型乳腺癌的有希望的方法。

附图说明

图1. TNBC患者中FABP4 SNP rs1054135与DFS之间的关系。通过FABP4 rs1054135基因型分层的Kaplan–Meier生存概率图。A.发现组(discovery cohort)。B.验证组(validation cohort)。C.整体样本。删失数据包括失访、观察结束时患者尚未发生复发转移的数据。

图2.通过BMI分层的Kaplan–Meier生存概率图。A.发现组(风险比(Hazard ratio,HR),0.615;95%可信区间(Confidence interval,CI),0.308–1.227)。B.验证组(HR,1.185;95%CI,0.665–2.113)。

图3.与rs1054135基因型相关的TNBC患者BMI。不同基因型患者的BMI没有显著差异。A.发现组。B.验证组。

图4.rs1054135与其互补miRNA结合示意图(引自网络数据库)。

图5.用FABP4(A,100x量级)和相同组织在400x量级(B)染色的免疫组化 的实例。通过电脑使用这些图片的400x量级进行IOD计数。

图6.FABP4表达的散点图。A.通过曼-惠特尼U检验进行具有不同预后的患者中FABP4表达的组间差异评估。B.通过曼-惠特尼U检验进行与不同的rs1054135基因型相关的FABP4表达的组间差异评估。

具体实施方式

本发明并不限于本文所述的具体方法、方案、试剂等,因为这些可以变化。本文所用的术语仅用于描述具体实施方案的目的而不是为了限制本发明的范围。除非另有定义,本文所用的所有技术和科学术语均具有与本领域技术人员通常理解的相同的含义。

在详细描述本发明的示例性实施方案之前,对理解本发明很重要的术语给出定义。

如本文所用,“单核苷酸多态性”或“SNP”是指DNA中的单个碱基位置,在该单个碱基位置上存在一个群体的不同的等位基因或替代的核苷酸。该SNP位置通常前接和后接所述等位基因的高度保守序列(例如,在种群中小于1/100或1/1000的成员中不同的序列)。对于在每个SNP位置的等位基因,个体可以是纯合的或杂合的。本发明的SNP位点以“rs-”方式命名,本领域技术人员能够根据上文的rs-命名,从适合的数据库和相关的信息系统如单核苷酸多态性数据库(dbSNP)(其援引加入本文)中确定其确切的位置、核苷酸序列。

如本文所用,术语“等位基因”是指在染色体的给定基因座存在的一对或一系列形式的基因或非基因区。在正常的二倍体细胞中,存在任一种基因的两个等位基因(每个亲本一个),其占据同源染色体上相同的相对位置(基因座)。在一个群体中,一种基因可能存在多于两个的等位基因。SNPs也具有等位基因,即,表征所述SNP的两个(或更多个)核苷酸。

如本文所用,术语“最小等位基因频率”表示在给定人群中的不常见的等位基因发生频率。

如本文所用,术语“确定在SNP位点的核苷酸序列”指任何合适的方法或技术。这种方法可以主要是测序技术或者基于互补核酸结合的技术。所述确定核苷酸序列可以通过例如直接测序、单碱基延伸、等位基因特异性探针杂交、等位基因特异性引物延伸、等位基因特异性扩增、等位基因特异性核苷酸掺入、 5'核酸酶消化、分子信标测定、寡核苷酸连接测定、大小分析、单链构象多态性、等位基因特异性寡核苷酸(ASO)-斑点印迹分析、iPLEX SNP基因型分型、动态等位基因特异性杂交(DASH)基因型分型、四引物ARMS PCR、游离内切核酸酶侵入测定、寡核苷酸连接酶测定、PCR-单链构象多态性(SSCP)分析、定量实时PCR测定、基于SNP微阵列的分析、限制性酶片段长度多态性(RFLP)分析、靶向重新测序分析和/或全基因组测序分析来进行。

如本文所用,术语“SNP位点的核酸亲和配体”指能够结合如上文定义的SNP位点或其附近序列的核酸分子。优选地,所述SNP位点的核酸亲和配体能够结合FABP4基因上rs1054135位点或其附近序列。优选地,所述SNP位点的核酸亲和配体能够结合5’-TATCTATGGATTTCCCTAGGTAGGA[A/G]ATAACAAGTATGTACCATTACTGAA-3’(SEQ ID NO:1)的序列或其片段,所述片段包含如上文定义的SNP位点。在本发明的其他实施方案中,SNP位点的核酸亲和配体还能够特异性地结合与SEQ ID NO:1的序列或其片段(包含如上文定义的SNP位点)至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或99.5%或99.6%、99.7%、99.8%或99.9%相同的DNA序列。

在其他具体实施方案中,所述SNP位点的核酸亲和配体可以是能够特异性地结合SEQ ID NO:1中如上文所示的SNP位点或其附近序列的短核酸分子,例如RNA、DNA、PNA、CAN、HNA、LNA或ANA分子或者本领域技术人员已知的任何其他合适的核酸形式。

在其他具体实施方案中,所述核酸亲和配体可以包含技术人员已知的任何合适的功能组分,例如标签、荧光标记、放射性标记、染料、蛋白或抗体或肽的结合或识别位点、可用于PCR方法的另一段DNA、可用作限制性酶的识别位点的一段DNA等。核酸亲和配体还可以以催化RNA的形式提供,所述催化RNA特异性地结合并切割包含本发明的SNP的序列。

本发明的试剂盒可以额外地包含检测所必需或可用的其他辅助成分,例如缓冲液、dNTP、聚合酶、离子、杂交溶液等。本发明的试剂盒还可以包括从商业和使用者立场来看可能需要的物质,例如稀释剂、填充剂、针、注射器;载体、包装、容器、列出内含物和/或使用说明的小瓶和/或管标签,含有使用说明的说明书。

在其他实施方案中,本发明还涉及特异性地结合SEQ ID NO:1中如上文所 示的SNP位点附近的寡核苷酸分子。这些寡核苷酸可以设计为一对引物的形式,允许扩增例如长度为50bp、75bp、100bp、150bp、200bp、250bp、300bp、400bp、500bp、750bp、1000bp或更多且包括本发明的SNP的多态位点的DNA段。

如本文所用,“探针”是指用于检测所关注的核酸(“靶”核酸)中的互补核酸序列。在一些检测形式中,寡核苷酸探针被束缚在固体支撑物(即通过共价连接)上,固定于固体支撑物上的寡核苷酸探针阵列用于检测靶核酸中特定的核酸序列。

“探针”可以衍生自天然形成的或重组的单链或双链核酸,或者可以是化学合成的。它们可以用于检测相同或相似的序列的存在情况。用于实施本公开的方法的核酸探针可以基于编码已知蛋白质的基因序列来设计。本领域的技术人员可以使用本领域已知的计算机比对方法和序列分析方法基于已知的序列而容易地设计此类探针(例如"MolecularCloning:A Laboratory Manual",第二版,edited by Sambrook,Fritsch,&Maniatis,ColdSpring Harbor Laboratory,1989;Ausubel,等,Short Protocols in MolecularBiology,第三版.1995)。

本发明的核酸探针包括RNA和DNA探针,以及在糖、磷酸或者甚至碱基部分改性的核酸,只要该探针在本文公开的条件下保持特异性杂交的能力即可。此类探针是使用本领域已知的技术而产生的。

本发明中的“探针”优选为DNA片段。在一个实施方案中,本发明的探针能够特异性地结合本发明的SNP位点。例如,所述探针可以这样设计,从而其仅结合包含SNP位点等位基因核苷酸的序列。例如,可以在杂交实验中通过改变盐的浓度、修改反应温度、向反应加入其他合适的化合物等来进一步调整探针的特异性。从而其结合SNP位点外部,例如在SEQ IDNO:1的序列内,或者其互补序列。

在其他实施方案中,本发明的探针可以是单碱基延伸引物,其与本发明的SNP位点附近的核苷酸特异性结合。通过单碱基延伸反应,根据单碱基序列延伸一个碱基后的分子量差别判断基因型。

在其他实施方案中,本发明的探针可以与SEQ ID NO:1的序列或其片段(包含如上文定义的SNP位点)、与所述序列的任何片段、或者与这些序列的互补序列至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或99.5% 或99.6%、99.7%、99.8%或99.9%相同,其中所述SEQ ID NO:1的序列包含如上文所述的SNP位点等位基因核苷酸。

本发明的探针可以具有任何合适的长度,例如15、20、30、40、50、100、150、200、300、500、1000或超过1000个核苷酸的长度。但是优选的是长度不少于10个核苷酸,并且优选的是长度不超过大约80个核苷酸;在一些实施方案中,探针的长度为大约20至60个核苷酸;在其他的实施方案中,探针的长度为大约20至40个核苷酸。

探针还可以是适当修饰的,例如通过加入标记,如荧光标记、染料、放射性标记等。可以根据本领域技术人员已知的方法,通过标准的标记技术来标记本发明的探针,例如放射性标记、酶标记、荧光标记、生物素-亲和素标记、化学发光标记等。在杂交后,可以使用已知的方法来检测探针。

术语“结合配偶体”在本文中以其最广泛的意义使用,包括天然和合成的结合结构域,其中包括配体和抗体或其结合片段。因此,所述结合配偶体可以是一种抗体或其片段(如Fab、Fv、单链Fv)、一种肽或一种肽模拟物,肽模拟物即一种类似肽的分子,它能够结合所述受体、所述细胞的胞外成分的标记。

如本文所用,术语“抗体”以最宽泛的意思来使用,特别涵盖单克隆抗体(包括全长单克隆抗体)、多克隆抗体、多特异性抗体(例如,双特异性抗体)和抗体片段。可以通过常规方法和/或遗传工程制备根据本发明的方法有用的抗体。例如,根据本发明的抗体包括结合FABP4的那些抗体。“抗体片段”包括全长抗体的一部分,通常是其抗原结合或可变区。抗体片段的实例包括Fab、Fab′、F(ab′)2和Fγ片段;双价抗体;线性抗体;单链抗体分子;生物特异性抗体;以及从抗体片段形成的多特异性抗体。

本发明的试剂盒还可以包含其他亲和配体(例如二抗)、检测染料或者进行蛋白检测所需的其他试剂。这类成分以及进一步的细节是本领域技术人员已知的,并且可以根据所进行的检测方法而变化。所述检测方法可以是本领域已知的针对蛋白水平的检测方法,例如,但不限于Western印迹、免疫组化、免疫荧光、ELISA等。

如本文所用,术语“表达水平较低”或“表达水平较高”表示以可检测的更低或更高水平翻译的蛋白质。例如以未发生癌变的正常脂肪细胞为检测对象,所述FABP4蛋白的表达水平在rs1054135的不同基因型之间,或无病生存组与 复发组之间存在显著差异。

例如“表达水平较低”或“表达水平较高”是指来自对象的样品中FABP4蛋白的表达水平低于或高于某一参考值,该参考值是本领域技术人员通过常规技术手段从特定群体,例如三阴性乳腺癌预后较好的群体中获得的具有统计学意义的平均值或中位值。

例如,本发明所述FABP4蛋白表达水平较低是指通过免疫组化的方法测量来自对象的样品中的FABP4蛋白表达水平低于0.1240的中位IOD,FABP4蛋白表达水平较高是指通过免疫组化的方法测量的FABP4蛋白表达水平高于0.1240的中位IOD。

此外,所述试剂盒可以包含说明书和/或可以提供所获得的结果的相关性的信息。

如本文所用,术语“预后”表示提供对三阴型乳腺癌可能的进程和结果的预测。它既包括判断疾病的特定后果(如康复,某种症状、体征和并发症等其它异常的出现或消失及死亡),也包括提供时间线索,如预测某段时间内发生某种结局的可能性。预后可包括癌症并发症、转移、扩散的可能性,癌症的可能的结果,恢复的可能性,总存活率和/或总死亡率。优选地,预后是患者恢复或具有癌症的复发/再发的概率。例如“预后较好”是指癌症不易发生复发转移,“预后较差”是指癌症更易发生复发转移。这个信息不仅对于患者有用,对于医生确定最有效的疗程也有用。确定癌症复发的可能性或转移的可能性能帮助医生确定是否应采取更保守或更激进的治疗方法。预后供用于对预测为可从给定治疗方案获益的患者进行选择和分类。预后还可用于设计三阴型乳腺癌治疗的合适疗法,例如通过显示三阴型乳腺癌是否仍处于良性阶段或者三阴型乳腺癌是否已发展到需要介入性治疗的阶段来实现。

如本文所用,术语“转移”表示癌或肿瘤从起源器官扩散至患者体内的其它器官/远端部位。

如本文所用,术语“复发”指癌细胞或症状在之前经过治疗而获得癌症缓解的患者中的回复。

如本文所用,“样品”可以是来源于对象身体的任何合适的部分的任何样品。在一实施方案中,样品可以来源于纯组织或器官或细胞类型,例如脂肪细胞。在本发明的其他实施方案中,样品可以来源于体液,例如来源于脑脊液、 血液、血清、痰、唾液、黏膜刮除物、组织活检、泪分泌物、精液和汗水等。特别优选采用血液样品,其包含含有DNA的细胞,例如非成熟的红细胞、红细胞前体细胞、白细胞等。在本发明的上下文中使用的样品应当优选以临床可接受的方式采集,更优选以保留核酸或蛋白的方式采集。在本发明的检测步骤中,最终作为检测对象的是核酸(优选DNA)或蛋白。

如本文所用,术语“风险比”或“HR”指假定存活至时间t并针对特定预后性变量值时在时间t的事件(例如中风)可能性。如果HR大于1,则对象具有事件的风险增加,如果HR小于1,则对象具有事件的风险降低。

如本文所用,术语“无病生存期”表示从随机化开始至疾病复发或由于疾病进展导致患者死亡的时间。在本文中特别用于指到三阴型乳腺癌复发或任何原因的死亡的时间年数。

为使本发明的技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。应当理解实施例和图不应理解为限制性的。本领域技术人员能够清楚地设想本文列出的原理的进一步的修改。

实施例1:研究对象和临床资料

1.研究对象

中国医学科学院肿瘤医院内科自1998至今收集初治乳腺癌标本及患者外周血液标本,目前已收集血液样本13240例。本研究回顾分析了其中全部三阴型乳腺癌病例(n=430),排除患第二原发肿瘤(n=4)、无病生存者原发肿瘤确诊至今随访时间不足3年者(n=80)、血液样本量不足者(n=23),最终纳入研究的病例共计323例,并截至诊断日期(2008年1月1日前后)分为发现组(n=161)和验证组(n=162)。所有患者均具有完整人口学及临床病理资料。分期按照2002年美国肿瘤研究联合委员会(AJCC)乳腺癌分期标准(第6版)进行。

2.病理及临床资料

所有研究对象均有可供病理组织学或细胞学诊断的标本,并经中国医学科学院肿瘤医院病理会诊。ER、PR状态通过免疫组化的方法判定,阴性标准于2009年前后有所不同:2009年前为小于10%的肿瘤细胞核染色阳性;2009年后阴性标准调整为小于1%。HER-2阴性的定义为荧光原位杂交HER-2基因无扩增或者免疫组化染色(-)或(+)。如ER、PR、HER-2均阴性即定义为三阴型乳腺 癌。然而,不断有证据表明,HR染色较低的肿瘤(1%-10%)在临床病理上更类似HR阴性肿瘤,而非HR阳性肿瘤。因此,具有较低和/或局灶PR染色的肿瘤被纳入我们的研究。使用抗ER和抗PR抗体进行免疫组化。为了确定HER2状态,通过荧光原位杂交(FISH)进行IHC或基因扩增。所有患者均具有完整人口学及临床病理资料。分期按照2002年美国肿瘤研究联合委员会(AJCC)乳腺癌分期标准(第6版)进行。

3.患者随访

全部患者采用门诊或电话随访的形式,详细记录患者肿瘤的复发、转移情况及生存信息。末次随访截止至2014年4月1日。复发转移患者的无病生存期(Disease freesurvival,DFS)计算方法为自原发肿瘤病理确诊至复发或转移灶的影像和(或)确诊间期。

4.患者特征

12份样品因检测率低于90%而被排除在发现组的最终分析之外。发现组和验证组整体平均随访时间分别为89.8和47.3个月。表1示出研究人群的特征。令人惊讶的是,两组之间的某些临床特征的分布存在差异。然而一致的是,复发组中存在更高的淋巴结转移发生率。

表1.发现组和验证组治疗前特征

a.双侧χ2检验

实施例2.候选基因及候选SNP位点的选择

本发明充分整合并利用现有生物信息学数据库。首先,利用Nextbio数据库(www.nextbio.com),关键词为“breast cancer”,筛选出乳腺癌中表达失调的基因,共计100个,作为候选基因(见表2)。

表2.乳腺癌差异表达基因及评分

a.2013/12/16版

-代表综合现有结果,尚不能完全定性表达是上调还是下降。

其次,利用Ensemble(http://www.ensembl.org/index.html)数据库寻找定位在上述差异表达基因的3′UTR、可能作为miRNA靶基因的SNP位点,并在国际人类基因组单体型图计划提供的SNP公共数据库(http://hapmap.ncbi.nlm.nih.gov/)中检索这些SNP位点,选取已知汉族人群中MAF≥5%的SNP(n=204)。

最后,面向公众的在线数据库MirSNP(http://cmbi.bjmu.edu.cn/mirsnp)用于最后的筛选。MirSNP包含在预测的miRNA-mRNA结合位点中的人SNP的集合,通过miRNA靶标预测算法miRanda,已鉴定了414,510个影响miRNA-mRNA结合的SNP。本发明仅挑选出已知的位于3′UTR、可能影响miRNA-mRNA结合的SNP位点(n=140)。

在用软件(MassARRAY Typer 4.0)设计基因分型所需引物时,排除因干扰引物结合的29个SNP位点,其余位点按照利于集中检测的原则进行引物设计,最终进行检测的SNP位点共111个(见表2)。本实施例中使用的探针的非限制性实例是单碱基延伸引物,本领域技术人员应当知晓,任何其他适合对SNP位点进行鉴定和基因分型的探针均可适用于本发明。

表2.候选基因SNP位点及其PCR引物和单碱基延伸引物序列

实施例3.基因分型及发现组中SNP与TNBC预后的关联性分析

1.基因组DNA提取

1.1酚-氯仿提取法:

a)所有研究对象均用真空抗凝采血管采集外周静脉血2ml,冻存待检;

b)将收集的冻存血标本取出置于室温,融化后将标本转入干净离心管中,50,000*g离心15min,去除上清,向沉淀加入适量裂解缓冲液(含10mM pH 8.0的Tris-HCl、0.1MEDTA、20ug/ml胰RNA酶、0.5%SDS),混匀,于37℃温浴1h,加蛋白酶K(100ug/ml)混匀后37℃消化过夜;

c)温浴结束后加入等体积经Tris-HCl饱和过的平衡酚(pH 7.4),充分混匀,8000*g离心15min;

d)汲取上清并加入等体积酚:氯仿(1:1),充分震荡混匀后8,000*g离心15min;

e)将上层水相移入另一离心管中,加入10%体积的乙酸铵溶液(10M),混匀后加入2倍体积的冰冷无水乙醇,摇匀至出现白色絮状沉淀;

f)将沉淀出的DNA经75%乙醇洗涤两次,溶于适量TE缓冲液中冷冻保存。

1.2提取DNA的质量检测

提取完成的DNA使用分光光度法、凝胶电泳法进行质量检测。测定样品在260nm/280nm的光密度值,以确保达到Sequenom技术要求的OD260/280=1.8~2.0;浓度在10ng/ul以上标准。

2.基因型检测

2.1基因分型方法

简言之,根据基因序列,设计相应的PCR引物和单碱基延伸引物序列,采用高通量的MassARRAY时间飞行质谱生物芯片系统(Sequenom,美国)以发现组 样品为分析对象,分析候选SNP位点的基因型,结果如表3“等位基因”一栏所示。分型检测由祥燕生物科技(北京)有限公司协助完成。以下实验中所用试剂若无特别说明,均为常规的商业化试剂,可通过商业化渠道购买。

2.2基因分型试验操作步骤

2.2.1引物设计

根据SNP位点通过Sequenom公司的Assay Design 3.1软件,设计并合成PCR引物和单碱基延伸引物序列,引物信息见表2。

2.2.2 PCR反应

总反应体系如下:

PCR扩增反应:按照下述的程序对PCR仪进行设置:

2.2.3 SAP酶消化反应

按照下述顺序配制SAP酶Mix:

在PCR仪中进行SAP酶消化:

37℃ 40min

85℃ 5min

25℃ ∞

2.2.4单碱基延伸反应

按照下述顺序配制单碱基延伸反应Mix:

在PCR仪中进行单碱基延伸反应:

2.2.5上机检测

将反应产物的384孔板中加入16μl三蒸水,在离心机中2000转离心3min;加入树脂,在反转摇匀仪上做树脂纯化反应35min,脱盐;反应完成后在离心机中2000转离心3min。将脱盐处理后的样品点在样品靶上,自然结晶。

2.3实验室质量控制

在基因分型检测时,为了质量控制,设立平行重复样品孔作为阳性对照,不含DNA的空白孔作为阴性对照,平行样品分析结果的重现率为100%。此外,分型操作的检测采用盲法进行,检测者无法获知样品是病例还是对照的分组状态。

3.发现组中SNP与TNBC预后的关联分析

关联研究是病因及预后研究中的常用方法,通过病例-对照研究比较预后不同的两组患者(无病生存vs复发)基因型的分布,筛选出与预后可能相关的基因。表3中最后一列示出不同的遗传模型,DOM(dominant)代表显性遗传、REC (recessive)代表隐性遗传、ADD(additive)代表相加模式。

如果一个位点有2个等位基因,会有3种基因型,例如AA,Aa,aa,如果把a看作危险等位基因,在显性遗传模型中,基因型中只要有a就计算频数,而不分多少,类似定性,对应AA,Aa,aa的频数就是0,1,1;在隐性遗传模型中,基因型中只有2个均为a才计算频数,对应AA,Aa,aa的频数就是0,0,1。在相加模式中,基因型中只要有1个a就计一个频数,对应AA,Aa,aa的频数分别为0,1,2,相当于显性和隐性遗传模型相应基因型频数的累加,即0+0=0,1+0=1,1+1=2(0,1,2)。

表3中P值代表无病生存与复发患者中各基因型分布的统计学意义。由于不同的遗传模型结果不同,表3结果选取的均是P值最小的遗传模型。

为了鉴定具有潜在预后价值的SNP,首先对发现组中的149份样品进行测试。16个SNP不满足哈迪-温伯格平衡(数据未示)。111个SNP的关联分析结果及疾病进展风险示于表3。关联研究结果表明,其中14个SNP(rs12467225、rs712、rs7816、rs12050562、rs3748960、rs3654、rs11819488、rs10780691、rs7213430、rs3771286、rs4977544、rs7896、rs7854673、rs3780634)的基因型在无病生存及复发的患者中分布显著不同(P<0.05),表明这些SNP与三阴型乳腺癌的复发和转移风险相关。

表3.差异表达基因中的SNP与疾病进展风险之间的关联性

a. SNP与复发/转移风险之间关联性的HR值及95%可信区间(CI)经年龄、肿瘤大小(≤2cm和>2cm)、淋巴结受累(无和有)、组织学分型、绝经状况(无和有)、血管侵犯(无和有)、乳腺癌或卵巢癌家族史(无或有)、基于紫杉烷/蒽环类的化疗(有或无)及放疗(无和有)等进行校正。

实施例4.验证组中SNP与TNBC预后的关联的验证

在独立的验证组中对上述14个SNP进行独立验证,关联研究分析方法同实施例3。该验证组包括162例TNBC,其中无病生存114例,复发48例。结果显示,其中3个SNP与TNBC复发显著相关(见表4,P<0.05),包括FABP4的rs1054135、KRAS的rs712和NTRK2的rs7816。

表4.SNP rs12467225、rs712、rs7816、rs12050562、rs3748960、rs3654、rs11819488、rs10780691、rs7213430、rs3771286、rs4977544、rs7896、rs7854673、rs3780634与疾病进展风险的关联性

a.SNP与复发/转移风险之间关联性的HR值及95%可信区间(CI)经年龄、肿瘤大小(≤2cm和>2cm)、淋巴结受累(无和有)、组织学分型、绝经状况(无和有)、血管侵犯(无和有)、乳腺癌或卵巢癌家族史(无或有)、基于紫杉烷/蒽环类的化疗(有或无)及放疗(无和有)等进行校正。

FDR(False Discovery Rate):一种常规统计学方法,用以进行多重检验,从而降低因一次性检验大量位点造成的假阳性率。

未经多重检验的结果出现假阳性的可能性很大。为了降低结果的假阳性,对上述SNP位点进行多重检验。结果显示,仅FABP4的rs1054135保留统计显著性(见表4,FDR<0.05)。rs1054135的G等位基因与疾病发展风险降低相关,在隐性模型中风险比为0.14(0.03-0.66)(见表5)。

表5. rs1054135基因型与TNBC复发风险之间的关联性(验证组)

a. SNP与复发/转移风险之间关联性的HR值及95%可信区间(CI)经年龄、肿瘤大小(≤2cm和>2cm)、淋巴结受累(无和有)、组织学分型、绝经状况(无和有)、血管侵犯(无和有)、乳腺癌或卵巢癌家族史(无或有)、基于紫杉烷/蒽环类的化疗(有或无)及放疗(无和有)等进行校正。

无病生存(%)和复发(%)分别代表在无病生存组及复发组中不同基因型的比例。

使用Kaplan–Meier方法观察到了rs1054135基因型与DFS之间关联性的相似结果(图1)。随后将发现和验证设置组合进行分析,证实具有rs1054135-GG 基因型的个体与DFS延长相关,HR为0.269(95%CI=0.098-0.735;P=0.010)。

实施例5. TNBC患者中BMI与FABP4 SNP rs1054135及DFS之间的关系

在我们的研究中,不论是在发现组(P=0.164)还是在验证组(P=0.565),BMI都不是独立的TNBC预后因子(图2)。

我们还比较了相对于rs1054135基因型的BMI水平的组间差异,并未发现BMI与rs1054135基因型的的相关性(图3)。

然而在SNP与预后的关联研究中以BMI作为协变量时,发现在具有AA/AG基因型的患者中,超重患者(BMI≥25kg/m2)肿瘤复发风险增加的量级显著提高(HR,2.53;95%CI,1.06–6.03),表明BMI对TNBC复发具有协变作用,在rs1054135-AA/AG亚群,肥胖和高复发风险之间存在正相关性。这提供了额外证据表明,体脂含量与FABP4(作为脂代谢的重要底物和酶)协同作用促进肿瘤快速生长和转移。因此,BMI和肿瘤预后之间的相关性可能与不同人群中FABP4基因型的分布有关。

实施例6. FABP4表达、rs1054135基因型和TNBC预后之间的相关性

rs1054135位于靶基因FABP4的3`UTR端,已有大量研究显示该位点的SNP可能通过影响与互补miRNA的结合影响靶基因的表达(参见图4)。而FABP4是乳腺癌中差异表达的基因,推测rs1054135基因型可能通过调控FABP4表达,从而有利于肿瘤转移。

为了验证该假设,通过免疫组化在52个具有相关基因型数据的TNBC组织(无病生存组,n=34;复发组,n=18)中分析其蛋白表达。

免疫组化按如下步骤进行:

FABP4的免疫组化染色在福尔马林固定、石蜡包埋的组织切片上进行。由于FABP4主要在成熟脂肪细胞的细胞溶质中表达,我们选取与肿瘤组织相邻的脂肪细胞。简言之,用切片机切出4μm厚的切片,转移至粘附性玻片,于62℃干燥15min。所有玻片均以一抗(FABP4,1:100,ab92501,Abcam,Cambridge,UK)孵育。之后,将其在封闭液中于37℃孵育1h。随后使用商业化的链霉亲合素-生物素试剂盒,根据制造商的说明书进行免疫检测,包括与生物素化的抗鼠或抗兔免疫球蛋白孵育,然后与过氧化物酶标记的链霉亲合素和3,3′-二氨基 联苯胺生色底物孵育。阴性对照省略一抗孵育步骤。最后用哈里斯苏木精染剂对玻片进行复染。

引人注目的是,与距离乳腺组织较远的脂肪细胞相比,与乳腺组织相邻的脂肪细胞呈现更高的FABP4蛋白水平(图5)。

进一步通过积分光密度(IOD)定量测定进行验证。IOD按如下步骤进行:

使用Moticcam4tablet(麦克奥迪公司,中国),从数字化免疫组化图像中随机选取与乳腺组织相邻的脂肪细胞细胞膜,并用Intuos笔使用ImageJ软件(image-proplus 6.0)中提供的选择工具精确绘制其轮廓。将细胞膜轮廓转化成矢量图并存储为TIFF格式的文件。后者提交至ImageJ算法,计算FABP4染色的单个膜区域和相关IOD。

IOD结果证实,具有rs1054135-AA/AG基因型的脂肪组织中FABP4蛋白水平显著更高(P<0.01)。rs1054135-AA/AG组的中位IOD为0.149,而具有rs1054135-GG基因型的患者中半数以上不表达FABP4(IOD=0)。无病生存组和复发组之间也观察到了FABP4蛋白水平的显著差异(中位IOD分别为0.1240和0.1498)(图6),这与我们的设想一致。

统计学方法

以χ2检验评估入选患者特征的差异,所有p值均代表双侧统计检测。正态分布的持续可变的BMI以平均值给出,各组间差别用非配对t检验进行比较。不同基因型患者之间BMI的组间差异用单因子变异数分析进行测试。对于IOD,使用Shapiro–Wilk分析以验证分布特征,并相应选择t检验或曼-惠特尼U检验进行组间差异评估。p<0.05被认为具有显著性。使用Kaplan-Meier和Cox法评估基于BMI和被研基因的基因型分层的生存函数。使用对数秩检验检查存活曲线的差异。

对于单个SNP分析,我们测试了三种遗传模型以评估SNP的显著性,并通过最小的p值选择每个SNP的最适模式。表示SNP的关联性和复发转移的相对风险比(HR)及95%可信区间(CI)针对年龄、肿瘤大小(≤2cm和>2cm)、淋巴结受累(无和有)、组织学分型、绝经状况(无和有)、基于紫杉烷/蒽环类的化疗(有或无)及放疗(无和有)等因素校正。考虑到被研SNP的数量,使用Benjamini-Hochberg错误发现率(FDR)法在多重比较修正后评估统计显著性。我 们将FDR<0.05作为具有显著性。进行哈迪-温伯格平衡测试。所有统计学分析均采用统计学软件SPSS19.0和GraphPad Prism5进行。

以上所述仅为本发明的较佳实施例,并不用以限制本发明的保护范围,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

参考文献

1.赫捷,赵平,陈万青.中国肿瘤登记年报[R]北京,军事医学科学出版社,2011:68-69.

2. Carey LA,Perou CM,Livasy CA,et al.Race,breast cancer subtypes,andsurvival in the Carolina Breast Cancer Study.JAMA.2006;295:2492-502.

3. Telli ML,Kurian AW,Chang ET,et al.Asian ethnicity and breastcancer subtypes:A study from the California Cancer Registry.Breast Cancer ResTreat.2011;127:471-8.

4. SorlieT,PerouCM,Tibshirani R,et al.Gene expression patterns ofbreast carcinomas distinguish tumor subclasses with clinicalimplications.Proc Natl Acad Sci USA.2001;98:10869-74.

5. Perou,C.M.Molecular Stratification of Triple-Negative BreastCancers.The Oncologist.2010;15(suppl5):39-48.

6. Ma XJ,Salunga R,Tuggle JT,et al.Gene expression profiles of humanbreast cancer progression.Proc Natl Acad Sci U S A.2003;100(10):5974-9.

7. Hicks C,Asfour R,Pannuti A,et al.An integrative genomics approachto biomarker discovery in breast cancer.Cancer Inform.2011;10:185-204.

8. Spencer C,Hechter E,Vukcevic D,et al.Quantifying theunderestimation of relative risks from genome-wide association studies.PLoSGenet.2011;7(3):e1001337.

9. Milne RL,Antoniou AC.Genetic modifiers of cancer risk for BRCA1andBRCA2mutation carriers.Ann Oncol.2011;22Suppl 1:i11-7.

10. Wellcome Trust Case Control Consortium.Genome-wide associationstudy of 14,000cases of seven common diseases and 3,000sharedcontrols.Nature.2007;447(7145):661-78.

11. Manolio TA,Brooks LD,Collins FS.A HapMap harvest of insights intothe genetics of common disease.J Clin Invest.2008;118(5):1590-605.

12. Landi MT,Chatterjee N,Yu K,et al.A genome-wide association studyof lung cancer identifies a region of chromosome 5p15 associated with riskfor adenocarcinoma.Am J Hum Genet.2009;85(5):679-91.

13. Walsh T,King MC.Ten genes for inherited breast cancer.CancerCell.2007;11(2):103-5.

14. Pharoah P,Antoniou A,Berchuck A,et al.Association between KRASrs61764370 and triple-negative breast cancer--a false positive?LancetOncol.2011;12(8):723-4.

15. Stevens KN,Fredericksen Z,Vachon CM,et al.19p13.1 is a triplenegative-specific breast cancer susceptibility locus.Cancer Res.2012 Feb 13.

16. Harusato A,Naito Y,Takagi T,et al.Suppression of indomethacin-induced apoptosis in the small intestine due to Bach1 deficiency.Free RadicRes.2011;45(6):717-27.

17. Kanno H,Ozawa H,Dohi Y,et al.Genetic ablation of transcriptionrepressor Bach1 reduces neural tissue damage and improves locomotor functionafter spinal cord injury in mice.J Neurotrauma.2009;26(1):31-9.

18. Suzuki HI,Yamagata K,Sugimoto K,et al.Modulation of microRNAprocessing by p53.Nature.2009 Jul 23;460(7254):529-33.

19. Bethke A,Fielenbach N,Wang Z,et al.Nuclear hormone receptorregulation of microRNAs controls developmental progression.Science.2009;324(5923):95-8.

20. Yu Z,Li Z,Jolicoeur N,et al.Aberrant allele frequencies of theSNPs located in microRNA target sites are potentially associated with humancancers.Nucleic Acids Res.2007;35(13):4535-41.

21. Sethupathy P,Borel C,Gagnebin M,et al.Human microRNA-155 onchromosome 21 differentially interacts with its polymorphic target in theAGTR13'untranslated region:a mechanism for functional single-nucleotidepolymorphisms related to phenotypes.Am J Hum Genet.2007;81(2):405-13.

22. Xiong F,Wu C,Chang J,et al.Genetic variation in an miRNA-1827binding site in MYCL1 alters susceptibility to small-cell lung cancer.CancerRes.2011;71(15):5175-81。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号