首页> 中国专利> 用于结肠直肠癌预后的基因表达标志物

用于结肠直肠癌预后的基因表达标志物

摘要

一种预测诊断有结肠直肠癌的受试者中临床结果的方法,包括确定获得自该受试者的癌细胞的生物学样品中一种或多种预测性RNA转录物或它们的表达产物的表达证据。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-03-26

    授权

    授权

  • 2009-05-27

    实质审查的生效

    实质审查的生效

  • 2009-04-01

    公开

    公开

说明书

相关申请交叉引用

这是依据37C.F.R.1.53(b)提交的非临时申请,依据35U.S.C.§119(e)要求 2006年1月11日提交的临时申请流水号60/758,392、2006年5月12日提交的临 时申请流水号60/800,277、和2006年5月31日提交的临时申请流水号 60/810,077的优先权,所有优先权文件都以其全文在此引入作为参考。

发明领域

本发明提供了其表达水平可用于预测结肠直肠癌结果的基因和基因集 合。

发明背景

在美国和欧盟结肠直肠癌是排名第二位的癌症相关死因,占所有癌症相 关死亡的10%。尽管结肠癌和直肠癌在分子水平上可代表相同或相似的疾 病,但是由于解剖学的问题针对直肠癌的手术非常复杂。可能是因为这个原 因,直肠癌的局部复发率明显高于结肠癌,因此治疗方法明显不同。在美国 每年新诊断大约100,000例结肠癌,其中约65%被诊断为如下文所讨论的II/III 期结肠直肠癌。

结肠直肠癌诊断的改进涉及利用标准分类标准来评价癌症的进展状态。 两种分类系统已广泛用于结肠直肠癌:改良的杜克氏(Duck)或Astler-Coller 分期系统(A-D期)(Astler VB,Coller FA.,Ann Surg 1954;139:846-52),以及 新近由美国癌症联合委员会所开发的TNM分期系统(I-IV期)(AJCC Cancer Staging Manual,第6版,Springer-Verlag,New York,2002)。这两种系统都将原 发性肿瘤穿过结肠或直肠壁层到达邻近器官、淋巴结和远端部位扩散的测量 应用于评价肿瘤进展。结肠癌的复发风险和治疗决策的评价目前主要基于肿 瘤期。

在美国每年有大约33,000例新诊断的II期结肠直肠癌。几乎所有这些患 者都是通过手术切除肿瘤来治疗的,此外,约40%的患者目前采用基于5-氟 尿嘧啶(5-FU)的化学治疗来治疗。是否给予辅助化学治疗的决策并不直截了 当。对于单独使用手术治疗的II期结肠癌患者,五年生存率为大约80%。在 这类人群中采用5-FU+甲酰四氢叶酸(亚叶酸)的标准辅助治疗证实仅有 2-4%的绝对受益,并且显示有严重的毒性,包括高达1%的化学治疗中毒死 亡率。如此,在大量接受毒物治疗的患者中仅有少数受益。

在II期结肠直肠癌患者手术后能预后的测试应当非常有益于指导对这些 患者的治疗决策。

与II期相比,在III期结肠癌中化学治疗的益处更加明显。每年诊断有III 期结肠癌的31,000例患者中有很大比例接受基于5-FU的辅助化学治疗,取决 于所采用的具体用药方案,在该背景下5-FU+甲酰四氢叶酸的绝对受益为 18-24%左右。III期结肠癌患者的当前标准医护化学治疗处理(5-FU+甲酰 四氢叶酸或5-FU+甲酰四氢叶酸+奥沙利铂)是适中有效的,实现了五年 生存率从约50%(仅进行手术)到约65%(5-FU+甲酰四氢叶酸)或70%(5-FU +甲酰四氢叶酸+奥沙利铂)的改善。单独使用5-FU+甲酰四氢叶酸或与 奥沙利铂联合治疗伴有一些不利的副作用,包括大约1%的治疗患者中毒死 亡。此外,对于单独使用手术进行治疗的III期结肠癌患者,三年生存率为约 47%,而且无法确定III期患者亚组是否存在类似于对II期患者所观察到的复 发风险。

基于分子标志物而非单独使用肿瘤期能定量复发风险的测试可用于鉴 定无需辅助治疗就可获得可接受的结果的III期患者亚组。

虽然存在着一些例如由于引流淋巴结的排列差异所引起的差异,但直肠 肿瘤分期仍基于与结肠肿瘤分期类似的标准进行。作为结果,关于它们的进 展状况,II/III期直肠肿瘤与II/III期结肠肿瘤具有适度的相关。如上所述,在 直肠癌和结肠癌之间存在局部复发率以及其他预后方面的差异,这些差异可 能源于难以实现直肠肿瘤全切除。尽管如此,仍然没有关于相应肿瘤分子特 征的结肠癌和直肠癌之间差异的引人注目的证据。对直肠癌的预后测试应当 具有本质上类似于对结肠癌的预后测试所描述的效用,而且相同的预后标志 物有可能同样适用于这两种癌症类型。

此外,无疑需要更安全且更有效的药物用于结肠癌治疗。目前用于结肠 癌的化学治疗是基于施用通常干扰分裂细胞增殖的药物的相对粗略的方法。 近来临床研究已证实开发基于特定癌症类型和亚型的详细分子理解的改良 药物的可行性。例如,在乳腺癌亚组中HER2(ERBB2)基因被扩增且HER2蛋 白被过表达;(Genentech,Inc.)(一种开发用于靶向HER2的药 物)仅标示用于那些通过荧光原位杂交(FISH)所证实的具有高于正常的 HER2拷贝数或通过免疫组织化学所证实的具有高水平HER2表达的患者。其 表达与人癌症患者中临床结果相关的基因是用于药物化合物筛选以及进一 步的药物开发活动的靶物选择的有价值来源。

分子靶向药物诸如HERCEPTIN(Genentech,Inc.)可与能鉴定可能受益 于该药物的患者的诊断性测试一起被开发并商业化;这种测试的一个方面是 鉴定那些除手术外不采取任何治疗可能具有阳性结果的患者。例如,当单独 进行手术治疗时,80%的II期结肠癌患者生存五年或更久。鉴定更可能属于 不采取额外的治疗其癌症将复发的20%人群之中的患者的基因标志物在药 物开发中是有用的,例如可用于筛选包含于临床试验中的患者。

发明概述

在一个方面中,本发明涉及一种预测诊断有结肠直肠癌的受试者在所述 癌症的手术切除后临床结果的方法,包括确定获得自所述受试者的包含癌细 胞的生物学样品中一种或多种列于表1A-B、2A-B、3A-B、4A-B、5A-B、6 和/或7中的预测性RNA转录物或它们的表达产物的表达水平,其中:(a)一 种或多种列于表1A、2A、3A、4A和/或5A中的基因或相应的表达产物的表 达升高的证据,指示阳性临床结果的可能性降低;和(b)一种或多种列于表 1B、2B、3B、4B和/或5B中的基因或相应的表达产物的表达升高的证据,指 示阳性临床结果的可能性升高。涵盖如果阳性临床结果的可能性被预测会减 少,则在所述手术切除后对所述患者进行进一步的治疗。进一步涵盖该治疗 为化学治疗和/或放射治疗。

可例如依据无复发间期(Recurrence-Free Interval,RFI)、总生存期(Overall Survival,OS)、无病生存期(Disease-Free Survival,DFS)或无远距复发间期 (Distant Recurrence-Free Interval,DRFI)表示本发明方法的临床结果。

在一个实施方案中,癌症为杜克氏B(II期)或杜克氏C(III期)结肠直 肠癌。

在另一个方面中,本发明涉及一种预测诊断有杜克氏B(II期)或杜克 氏C(III期)结肠直肠癌的受试者在所述癌症的手术切除后无复发间期(RFI) 持续时间的方法,包括确定获得自所述受试者的包含癌细胞的生物学样品中 一种或多种列于表1A、5A、1B和/或5B中的预测性RNA转录物或它们的表达 产物的表达水平,其中:(a)一种或多种列于表1A或5A中的基因或相应的表 达产物的表达升高的证据,指示所述RFI被预测会更短;和(b)一种或多种列 于表1B或5B中的基因或相应的表达产物的表达升高的证据,指示所述RFI被 预测会更长。

在另一个方面中,本发明涉及一种预测诊断有杜克氏B(II期)或杜克 氏C(III期)结肠癌的受试者在所述癌症的手术切除后总生存期(OS)的方法, 包括确定获得自所述受试者的包含癌细胞的生物学样品中一种或多种列于 表2A和/或2B中的预测性RNA转录物或它们的表达产物的表达水平,其中: (a)一种或多种列于表2A中的基因或相应的表达产物的表达升高的证据,指 示所述OS被预测会更短;和(b)一种或多种列于表2B中的基因或相应的表达 产物的表达升高的证据,指示所述OS被预测会更长。

在另一个方面中,本发明涉及一种预测诊断有杜克氏B(II期)或杜克 氏C(III期)结肠癌的受试者在所述癌症的手术切除后无病生存期(DFS)的方 法,包括确定获得自所述受试者的包含癌细胞的生物学样品中一种或多种列 于表3A和/或3B中的预测性RNA转录物或它们的表达产物的表达水平,其中: (a)一种或多种列于表3A中的基因或相应的表达产物的表达升高的证据,指 示所述DFS被预测会更短;和(b)一种或多种列于表3B中的基因或相应的表 达产物的表达升高的证据,指示所述DFS被预测会更长。

在另一个方面中,本发明涉及一种预测诊断有杜克氏B(II期)或杜克 氏C(III期)结肠癌的受试者在所述癌症的手术切除后无远距复发间期(DRFI) 持续时间的方法,包括确定获得自所述受试者的包含癌细胞的生物学样品中 一种或多种列于表4A和/或4B中的预测性RNA转录物或它们的表达产物的表 达水平,其中:(a)一种或多种列于表4A中的基因或相应的表达产物的表达 升高的证据,指示所述DRFI被预测会更短;和(b)一种或多种列于表4B中的 基因或相应的表达产物的表达升高的证据,指示所述DRFI被预测会更长。

在另一个方面中,本发明涉及一种预测诊断有结肠直肠癌的受试者在所 述癌症的手术切除后临床结果的方法,包括确定获得自所述受试者的包含癌 细胞的生物学样品中一种或多种列于表1.2A-B、2.2A-B、3.2A-B、4.2A-B、 5.2A-B、6.2和/或7.2中的预测性RNA转录物或它们的表达产物的表达水平的 证据,其中:(a)一种或多种列于表1.2A、2.2A、3.2A、4.2A和/或5.2A中的 基因或相应的表达产物的表达升高的证据,指示阳性临床结果的可能性降 低;和(b)一种或多种列于表1.2B、2.2B、3.2B、4.2B和/或5.2B中的基因或 相应的表达产物的表达升高的证据,指示阳性临床结果的可能性升高。

在另一个方面中,本发明涉及一种预测诊断有杜克氏B(II期)或杜克 氏C(III期)结肠直肠癌的受试者在所述癌症的手术切除后无复发间期(RFI) 持续时间的方法,包括确定获得自所述受试者的包含癌细胞的生物学样品中 一种或多种列于表1.2A、1.2B、5.2A和/或5.2B中的预测性RNA转录物或它们 的表达产物的表达水平,其中:(a)一种或多种列于表1.2A或5.2A中的基因 或相应的表达产物的表达升高的证据,指示所述RFI被预测会更短;和(b)一 种或多种列于表1.2B或5.2B中的基因或相应的表达产物的表达升高的证据, 指示所述RFI被预测会更长。

在另一个方面中,本发明涉及一种预测诊断有杜克氏B(II期)或杜克 氏C(III期)结肠癌的受试者在所述癌症的手术切除后总生存期(OS)的方法, 包括确定获得自所述受试者的包含癌细胞的生物学样品中一种或多种列于 表2.2A和/或2.2B中的预测性RNA转录物或它们的表达产物的表达水平,其 中:(a)一种或多种列于表2.2A中的基因或相应的表达产物的表达升高的证 据,指示所述OS被预测会更短;和(b)一种或多种列于表2.2B中的基因或相 应的表达产物的表达升高的证据,指示所述OS被预测会更长。

在另一个方面中,本发明涉及一种预测诊断有杜克氏B(II期)或杜克 氏C(III期)结肠癌的受试者在所述癌症的手术切除后无病生存期(DFS)的方 法,包括确定获得自所述受试者的包含癌细胞的生物学样品中一种或多种列 于表3.2A和/或3.2B中的预测性RNA转录物或它们的表达产物的表达水平,其 中:(a)一种或多种列于表3.2A中的基因或相应的表达产物的表达升高的证 据,指示所述DFS被预测会更短;和(b)一种或多种列于表3.2B中的基因或 相应的表达产物的表达升高的证据,指示所述DFS被预测会更长。

在另一个方面中,本发明涉及一种预测诊断有杜克氏B(II期)或杜克 氏C(III期)结肠癌的受试者在所述癌症的手术切除后无远距复发间期(DRFI) 持续时间的方法,包括确定获得自所述受试者的包含癌细胞的生物学样品中 一种或多种列于表4.2A和/或4.2B中的预测性RNA转录物或它们的表达产物 的表达水平,其中:(a)一种或多种列于表4.2A中的基因或相应的表达产物 的表达升高的证据,指示所述DRFI被预测会更短;和(b)一种或多种列于表 4.2B中的基因或相应的表达产物的表达升高的证据,指示所述DRFI被预测会 更长。

在另一个方面中,本发明涉及一种预测诊断有结肠直肠癌的受试者在所 述癌症的手术切除后临床结果的方法,包括确定获得自所述受试者的包含癌 细胞的生物学样品中一种或多种列于表1A-B、1.2A-B、2A-B、2.2A-B、3A-B、 3.2A-B、4A-B、4.2A-B、5A-B、5.2A-B、6、6.2、7和/或7.2中的预测性RNA 转录物或它们的表达产物的表达水平的证据,其中:(a)一种或多种列于表 1A、1.2A、2A、2.2A、3A、3.2A、4A、4.2A、5A和/或5.2A中的基因或相应 的表达产物的表达升高的证据,指示阳性临床结果的可能性降低;和(b)一 种或多种列于表1B、1.2B、2B、2.2B、3B、3.2B、4B、4.2B、5B和/或5.2B 中的基因或相应的表达产物的表达升高的证据,指示阳性临床结果的可能性 升高。

在另一个方面中,本发明涉及一种预测诊断有杜克氏B(II期)或杜克 氏C(III期)结肠直肠癌的受试者在所述癌症的手术切除后无复发间期(RFI) 持续时间的方法,包括确定获得自所述受试者的包含癌细胞的生物学样品中 一种或多种列于表1A、1.2A、1B、1.2B、5A、5.2A、5B和/或5.2B中的预测 性RNA转录物或它们的表达产物的表达水平,其中:(a)一种或多种列于表 1A、1.2A、5A和/或5.2A中的基因或相应的表达产物的表达升高的证据,指 示所述RFI被预测会更短;和(b)一种或多种列于表1B、1.2B、5B和/或5.2B 中的基因或相应的表达产物的表达升高的证据,指示所述RFI被预测会更长。

在另一个方面中,本发明涉及一种预测诊断有杜克氏B(II期)或杜克 氏C(III期)结肠癌的受试者在所述癌症的手术切除后总生存期(OS)的方法, 包括确定获得自所述受试者的包含癌细胞的生物学样品中一种或多种列于 表2A、2.2A、2B和/或2.2B中的预测性RNA转录物或它们的表达产物的表达 水平,其中:(a)一种或多种列于表2A和/或2.2A中的基因或相应的表达产物 的表达升高的证据,指示所述OS被预测会更短;和(b)一种或多种列于表2B 和/或2.2B中的基因或相应的表达产物的表达升高的证据,指示所述OS被预 测会更长。

在另一个方面中,本发明涉及一种预测诊断有杜克氏B(II期)或杜克 氏C(III期)结肠癌的受试者在所述癌症的手术切除后无病生存期(DFS)的方 法,包括确定获得自所述受试者的包含癌细胞的生物学样品中一种或多种列 于表3A、3.2A、3B和/或3.2B中的预测性RNA转录物或它们的表达产物的表 达水平,其中:(a)一种或多种列于表3A和/或3.2A中的基因或相应的表达产 物的表达升高的证据,指示所述DFS被预测会更短;和(b)一种或多种列于 表3B和/或3.2B中的基因或相应的表达产物的表达升高的证据,指示所述DFS 被预测会更长。

在另一个方面中,本发明涉及一种预测诊断有杜克氏B(II期)或杜克 氏C(III期)结肠癌的受试者在所述癌症的手术切除后无远距复发间期(DRFI) 持续时间的方法,包括确定获得自所述受试者的包含癌细胞的生物学样品中 一种或多种列于表4A、4.2A、4B和/或4.2B中的预测性RNA转录物或它们的 表达产物的表达水平,其中:(a)一种或多种列于表4A和/或4.2A中的基因或 相应的表达产物的表达升高的证据,指示所述DRFI被预测会更短;和(b)一 种或多种列于表4B和/或4.2B中的基因或相应的表达产物的表达升高的证 据,指示所述DRFI被预测会更长。

在另一个方面中,本发明涉及一种预测诊断有杜克氏B(II期)结肠直 肠癌的受试者在所述癌症的手术切除后临床结果的方法,包括确定获得自所 述受试者的包含癌细胞的生物学样品中一种或多种选自ALCAM、CD24、 CDH11、CENPE、CLTC、CYR61、EMR3、ICAM2、LOX、MADH2、MGAT5、 MT3、NUFIP1、PRDX6、SIR2、SOS1、STAT5B、TFF3、TMSB4X、TP53BP1、 WIF、CAPG、CD28、CDC20、CKS1B、DKK1、HSD17B2和MMP7的预测 性RNA转录物或它们的表达产物的表达水平,其中:(a)一种或多种选自 ALCAM、CD24、CDH11、CENPE、CLTC、CYR61、EMR3、ICAM2、LOX、 MADH2、MGAT5、MT3、NUFIP1、PRDX6、SIR2、SOS1、STAT5B、TFF3、 TMSB4X、TP53BP1和WIF的基因或相应的表达产物的表达升高的证据,指 示阳性临床结果的可能性降低;和(b)一种或多种选自CAPG、CD28、CDC20、 CKS1B、DKK1、HSD17B2和MMP7的基因或相应的表达产物的表达升高的 证据,指示阳性临床结果的可能性升高。

在另一个方面中,本发明涉及一种预测诊断有杜克氏C(III期)结肠直 肠癌的受试者在所述癌症的手术切除后临床结果的方法,包括确定获得自所 述受试者的包含癌细胞的生物学样品中一种或多种选自CAPG、CD28、 CKS1B、CYR61、DKK1、HSD17B2、LOX、MMP7、SIR2、ALCAM、CD24、 CDC20、CDH11、CENPE、CLTC、EMR3、ICAM2、MADH2、MGAT5、 MT3、NUFIP1、PRDX6、SOS1、STAT5B、TFF3、TMSB4X、TP53BP1和 WIF的预测性RNA转录物或它们的表达产物的表达水平,其中:(a)一种或 多种选自CAPG、CD28、CKS1B、CYR61、DKK1、HSD17B2、LOX、MMP7 和SIR2的基因或相应的表达产物的表达升高的证据,指示阳性临床结果的可 能性降低;和(b)一种或多种选自ALCAM、CD24、CDC20、CDH11、CENPE、 CLTC、EMR3、ICAM2、MADH2、MGAT5、MT3、NUFIP1、PRDX6、SOS1、 STAT5B、TFF3、TMSB4X、TP53BP1和WIF的基因或相应的表达产物的表 达升高的证据,指示阳性临床结果的可能性升高。

对于本发明方法的所有方面,可例如通过基因表达序型分析(gene expression profiling)的方法获得一种或多种基因的表达水平的确定。该基因 表达序型分析的方法可以是例如基于PCR的方法。

对于本发明的所有方面,基因的表达水平可相对于一种或多种参考基因 (reference gene)或它们的表达产物的表达水平被标准化(normalize)。

对于本发明的所有方面,受试者优选为人患者。

对于本发明的所有方面,该方法可进一步包括确定至少两种所述基因或 它们的表达产物的表达水平的证据。进一步涵盖本发明的方法可进一步包括 确定至少三种所述基因或它们的表达产物的表达水平的证据。还涵盖本发明 的方法可进一步包括确定至少四种所述基因或它们的表达产物的表达水平 的证据。还涵盖本发明的方法可进一步包括确定至少五种所述基因或它们的 表达产物的表达水平的证据。

对于本发明的所有方面,该方法可进一步包括生成汇总所述预测的报告 的步骤。

对于本发明的所有方面,涵盖对于一种或多种预测性RNA转录物或它们 的表达产物水平的每一增量增加,患者就被鉴定为显示临床结果的增量增 加。

对于本发明的所有方面,表达水平的确定可发生一次以上。对于本发明 的所有方面,表达水平的确定可发生于患者在手术切除后进行任何治疗之 前。

在一个不同的方面中,本发明涉及一份包含诊断有结肠直肠癌的受试者 在所述癌症的手术切除后的预测临床结果的报告,包括基于下述信息的临床 结果的预测,所述信息包含在获得自所述受试者的包含癌细胞的生物学样品 中一种或多种列于表1A-B、2A-B、3A-B、4A-B、5A-B、6和/或7中的预测 性RNA转录物或它们的表达产物的表达水平,其中:(a)一种或多种列于表 1A、2A、3A、4A和/或5A中的基因或相应的表达产物的表达升高的证据, 指示阳性临床结果的可能性降低;和(b)一种或多种列于表1B、2B、3B、4B 和/或5B中的基因或相应的表达产物的表达升高的证据,指示阳性临床结果 的可能性升高。可例如依据无复发间期(RFI)、总生存期(OS)、无病生存期 (DFS)或无远距复发间期(DRFI)表示本发明的报告的临床结果。在一个实施 方案中,癌症为杜克氏B(II期)或杜克氏C(III期)结肠直肠癌。临床结果 的预测可包含对受试者特定临床结果可能性的估计或可包含基于所述估计 将受试者分类入风险组(risk group)。

在另一个方面中,本发明涉及一份预测诊断有结肠直肠癌的受试者在所 述癌症的手术切除后临床结果的报告,包括基于包含在获得自所述受试者的 包含癌细胞的生物学样品中一种或多种列于表1.2A-B、2.2A-B、3.2A-B、 4.2A-B、5.2A-B、6.2和/或7.2中的预测性RNA转录物或它们的表达产物的表 达水平的信息的临床结果的预测,其中:(a)一种或多种列于表1.2A、2.2A、 3.2A、4.2A和/或5.2A中的基因或相应的表达产物的表达升高的证据,指示阳 性临床结果的可能性降低;和(b)一种或多种列于表1.2B、2.2B、3.2B、4.2B 和/或5.2B中的基因或相应的表达产物的表达升高的证据,指示阳性临床结果 的可能性升高。可例如依据无复发间期(RFI)、总生存期(OS)、无病生存期 (DFS)或无远距复发间期(DRFI)表示本发明的报告的临床结果。在一个实施 方案中,癌症为杜克氏B(II期)或杜克氏C(III期)结肠直肠癌。临床结果 的预测可包含对受试者特定临床结果可能性的估计或可包含基于所述估计 将受试者分类入风险组。

在另一个方面中,本发明涉及一份预测诊断有结肠直肠癌的受试者在所 述癌症的手术切除后临床结果的报告,包括基于包含在获得自所述受试者的 包含癌细胞的生物学样品中一种或多种列于表1A-B、1.2A-B、2A-B、2.2A-B、 3A-B、3.2A-B、4A-B、4.2A-B、5A-B、5.2A-B、6、6.2、7和/或7.2中的预 测性RNA转录物或它们的表达产物的表达水平的信息的临床结果的预测,其 中:(a)一种或多种列于表1A、1.2A、2A、2.2A、3A、3.2A、4A、4.2A、 5A和/或5.2A中的基因或相应的表达产物的表达升高的证据,指示阳性临床 结果的可能性降低;和(b)一种或多种列于表1B、1.2B、2B、2.2B、3B、3.2B、 4B、4.2B、5B和/或5.2B中的基因或相应的表达产物的表达升高的证据,指 示阳性临床结果的可能性升高。临床结果的预测可包含对受试者特定临床结 果可能性的估计或可包含基于所述估计将受试者分类入风险组。

在另一个方面中,本发明涉及一份预测诊断有杜克氏B(II期)结肠直 肠癌的受试者在所述癌症的手术切除后临床结果的报告,包括基于包含在获 得自所述受试者的包含癌细胞的生物学样品中一种或多种选自ALCAM、 CD24、CDH11、CENPE、CLTC、CYR61、EMR3、ICAM2、LOX、MADH2、 MGAT5、MT3、NUFIP1、PRDX6、SIR2、SOS1、STAT5B、TFF3、TMSB4X、 TP53BP1、WIF、CAPG、CD28、CDC20、CKS1B、DKK1、HSD17B2和MMP7 的预测性RNA转录物或它们的表达产物的表达水平的信息的临床结果的预 测,其中:(a)一种或多种选自ALCAM、CD24、CDH11、CENPE、CLTC、 CYR61、EMR3、ICAM2、LOX、MADH2、MGAT5、MT3、NUFIP1、PRDX6、 SIR2、SOS1、STAT5B、TFF3、TMSB4X、TP53BP1和WIF的基因或相应的 表达产物的表达升高的证据,指示阳性临床结果的可能性降低;和(b)一种 或多种选自CAPG、CD28、CDC20、CKS1B、DKK1、HSD17B2和MMP7的 基因或相应的表达产物的表达升高的证据,指示阳性临床结果的可能性升 高。临床结果的预测可包含对受试者特定临床结果可能性的估计或可包含基 于所述估计将受试者分类入风险组。

在另一个方面中,本发明涉及一份预测诊断有杜克氏C(III期)结肠直 肠癌的受试者在所述癌症的手术切除后临床结果的报告,包括基于包含在获 得自所述受试者的包含癌细胞的生物学样品中一种或多种选自CAPG、 CD28、CKS1B、CYR61、DKK1、HSD17B2、LOX、MMP7、SIR2、ALCAM、 CD24、CDC20、CDH11、CENPE、CLTC、EMR3、ICAM2、MADH2、MGAT5、 MT3、NUFIP1、PRDX6、SOS1、STAT5B、TFF3、TMSB4X、TP53BP1和 WIF的预测性RNA转录物或它们的表达产物的表达水平的信息的临床结果 的预测,其中:(a)一种或多种选自CAPG、CD28、CKS1B、CYR61、DKK1、 HSD17B2、LOX、MMP7和SIR2的基因或相应的表达产物的表达升高的证据, 指示阳性临床结果的可能性降低;和(b)一种或多种选自ALCAM、CD24、 CDC20、CDH11、CENPE、CLTC、EMR3、ICAM2、MADH2、MGAT5、 MT3、NUFIP1、PRDX6、SOS1、STAT5B、TFF3、TMSB4X、TP53BP1和 WIF的基因或相应的表达产物的表达升高的证据,指示阳性临床结果的可能 性升高。临床结果的预测可包含对受试者特定临床结果可能性的估计或可包 含基于所述估计将受试者分类入风险组。

在一个不同的方面中,本发明涉及一种试剂盒,包含适合于执行本发明 方法的以下一项或多项:(1)提取缓冲液/试剂和实验方案;(2)逆转录缓冲 液/试剂和实验方案;和(3)qPCR缓冲液/试剂和实验方案。该试剂盒可包含 数据检索(retrieval)和分析软件。

附图简述

图1所显示的树状图展示了在单变量Cox比例风险分析(univariate Cox proportional hazards analysis)中与无复发间期统计学显著相关的142种基因 (表1.2A和1.2B)的表达聚类(clustering)。该聚类分析使用了未加权的对群 平均数合并法(unweighted pair-group average amalgamation method)并将1皮 尔逊(Pearson)r作为距离计量定位(measure)。所关心的聚类中特定基因的身 份沿x轴标示。

发明详述

A.定义

除非另有规定,本文中所使用的技术和科学术语具有与本发明所属领域 的普通技术人员的通常理解相同的含义。Singleton等的《Dictionary of Microbiology and Molecular Biology》第2版(J.Wiley & Sons,New York,NY 1994)和March的《Advanced Organic Chemistry Reactions,Mechanisms and Structure》第4版(John Wiley & Sons,New York,NY 1992)提供给本领域技 术人员本申请中所使用的许多术语的一般指导。

本领域技术人员应当认识到许多类似于或等效于本文中所描述的那些 的方法和材料可用于本发明的实施。事实上,本发明绝非局限于所描述的方 法和材料。为了本发明的目的,下列术语定义如下。

当在本文中使用时,术语“肿瘤”指无论是恶性还是良性的所有赘生性 细胞生长和增殖,以及所有的癌前性及癌性细胞和组织。

术语“癌症”和“癌性的”指出或描述哺乳动物中通常以不受调节的细 胞生长为特征的生理状态。癌症的例子包括但不限于乳腺癌、卵巢癌、结肠 癌、肺癌、前列腺癌、肝细胞癌、胃癌、胰腺癌、子宫颈癌、肝癌、膀胱癌、 泌尿道癌、甲状腺癌、肾癌、癌瘤、黑素瘤和脑癌。

癌症的“病理”包括所有危害患者健康的现象。这包括但不限于异常或 不受控制的细胞生长、转移、干扰邻近细胞正常发挥功能、以异常水平释放 细胞因子或其它分泌性产物、抑制或加重炎症或免疫学应答、瘤形成 (neoplasia)、前期癌(premalignancy)、恶性肿瘤(malignancy)、侵入周围或远 端组织或器官(诸如淋巴结)等。

术语“结肠直肠癌”以最广义使用并指(1)由大肠和/或直肠上皮细胞引 起的所有病期和所有类型的癌症和/或(2)侵袭大肠和/或直肠内层(lining)的 所有病期和所有类型的癌症。在用于结肠直肠癌分类的疾病分期系统中,结 肠和直肠作为一个器官来对待。

根据美国癌症联合委员会(AJCC)的肿瘤、结节、转移(TNM)分期系统 (Greene等编的《AJCC Cancer Staging Manual》第6版,New York,NY: Springer;2002),结肠直肠癌的各个病期定义如下:

肿瘤:T1:肿瘤侵入粘膜下层(submucosa);T2:肿瘤侵入固有肌层 (muscularis propria);T3:肿瘤穿过固有肌层侵入浆膜下层(subserose),或侵 入结肠周组织或直肠周组织;T4:肿瘤直接侵入其他器官或结构、和/或穿 孔。

结节:N0:无区域性淋巴结转移;N1:1-3个区域性淋巴结中有转移; N2:4个或更多个区域性淋巴结中有转移。

转移:M0:无远端转移;M1:有远端转移。

病期分组:I期:T1 N0 M0;T2 N0 M0;II期:T3 N0 M0;T4 N0 M0; III期:任何T,N1-2;M0;IV期:任何T,任何N,M1。

根据改良的杜克分期系统,结肠直肠癌的各个病期定义如下:

A期:肿瘤透入肠壁粘膜但不进一步穿透;B期:肿瘤透入并贯穿肠壁 的固有肌层;C期:肿瘤透入但不贯穿肠壁的固有肌层,在淋巴结中存在结 肠直肠癌的病理学证据;或肿瘤透入并贯穿肠壁的固有肌层,在淋巴结中存 在癌症的病理学证据;D期:肿瘤已扩散出淋巴结进入其他器官,诸如肝、 肺或骨。

预后因素是那些与结肠直肠癌的自然病程(natural history)相关的、一旦 它们发展为结肠直肠癌就影响患者的复发率和结果的变量。已与更差的预后 关联的临床参数包括例如淋巴结受累和高级肿瘤。预后因素常常用于将患者 分类为具有不同的基线复发风险的亚组。

术语“预后”在本文中用于指可归于癌症的死亡或进展的可能性的预测, 包括肿瘤性疾病(诸如结肠癌)的复发、转移扩散和抗药性。

术语“预测”在本文中用于指在原发性肿瘤的手术切除后患者将具有特 定临床结果(无论是阳性还是阴性)的可能性。通过为任何特定患者选择最 适合的治疗程式,本发明的预测方法可在临床上用于作出治疗决策。本发明 的预测方法在预测患者是否可能有利地应答治疗方案(诸如手术干预)中是 有价值的工具。该预测可包括预后因素。

术语“阳性临床结果”指在患者状况的任何量度上有改善,包括本领域 中所通常使用的那些量度,诸如无复发间期(RFI)持续时间增加、总生存期 (OS)时间增加、无病生存期(DFS)时间增加、无远距复发间期(DRFI)持续时 间增加等等。阳性临床结果可能性的升高相应于癌症复发可能性的降低。

术语“风险分类”指受试者会经历特定临床结果的风险水平或预测。受 试者可基于本发明的预测方法分入风险组或在风险水平上分类。“风险组” 是一组对于特定临床结果具有类似的风险水平的受试者或个体。

术语“长期”生存在本文中用于指至少3年、更优选至少5年的生存。

术语“无复发间期(RFI)”在本文中用于指到第一次结肠癌复发(经检查 作为最初事件的第二次原发性癌)或无复发证据的死亡的时间年数。

术语“总生存期(OS)”在本文中用于指从手术到任何原因的死亡的时间 年数。

术语“无病生存期(DFS)”在本文中用于指到结肠癌复发或任何原因的 死亡的时间年数。

术语“无远距复发间期(DRFI)”在本文中用于指从手术到第一次在解剖 学上远距癌症复发的时间(年数)。

取决于所要审查或不考虑的事件的定义,在实践中上文所列测量值的计 算可随研究有所不同。

术语“微阵列”指能杂交的阵列元件,优选多核苷酸探针位于基质上的 有序排列。

术语“多核苷酸”当以单数或复数使用时,通常指任何多聚核糖核苷酸 或多聚脱氧核糖核苷酸,其可以是未修饰的RNA或DNA,或者是修饰的RNA 或DNA。如此,举例来说,如本文中所定义的多核苷酸包括但不限于单链和 双链DNA、包括单链和双链区的DNA、单链和双链RNA、及包括单链和双 链区的RNA、以及包含DNA和RNA的杂合分子,其中的DNA和RNA可以是 单链或更通常地是双链或包括单链和双链区。此外,当在本文中使用时,术 语“多核苷酸”指包含RNA或DNA或同时包含RNA和DNA的三链区。这种 区域中的链可来自相同的分子或不同的分子。该区域可以包括一个或多个所 述分子的整个,但更典型地仅是一些所述分子的一个区域。三股螺旋区的分 子之一通常是寡核苷酸。术语“多核苷酸”明确包括cDNA。该术语包括含 有一个或多个修饰的碱基的DNA(包括cDNA)和RNA。如此,具有因稳定 性或其他原因而被修饰的主链的DNA或RNA是本文中该术语所意指的“多核 苷酸”。此外,包含稀有碱基(诸如肌苷)或修饰的碱基(诸如氚化的碱基) 的DNA或RNA包括在如本文中所定义的术语“多核苷酸”的范围内。一般而 言,术语“多核苷酸”涵盖未修饰的多核苷酸的所有化学、酶和/或代谢修饰 形式,以及病毒和细胞(包括简单细胞和复杂细胞)特有的DNA和RNA的化 学形式。

术语“寡核苷酸”指相对短的多核苷酸,包括但不限于单链脱氧核糖核 苷酸、单链或双链核糖核苷酸、RNA:DNA杂合物、和双链DNA。寡核苷酸 (诸如单链DNA探针寡核苷酸)通常通过化学方法合成,例如使用市售自动 化寡核苷酸合成仪。然而,可通过多种其他方法来制备寡核苷酸,包括体外 重组DNA介导的技术以及通过在细胞和生物体中表达DNA。

术语“差异表达的基因”、“差异的基因表达”和它们的同义词可互换使 用,指相对于其在正常或对照受试者中的表达,其在患病(特别是癌症,诸 如结肠癌)受试者中的表达被激活至更高或更低水平的基因。该术语还包括 其在同一疾病的不同阶段的表达被激活至更高或更低水平的基因。还应当理 解的是差异表达的基因可在核酸水平或蛋白质水平上被激活或抑制,或可进 行可变剪接以产生不同的多肽产物。这样的差异可通过例如mRNA水平、多 肽的表面表达、分泌或其他分配(partitioning)的改变而得以证实。差异的基 因表达可包括比较两种或更多种基因或它们的基因产物之间的表达,或比较 两种或更多种基因或它们的基因产物之间的表达比率,或甚至比较同一基因 的两种不同加工产物,其在正常受试者和患病(特别是癌症)受试者之间或 在同一疾病的不同阶段之间是不同的。差异表达包括在例如正常和患病细胞 间或在经历了不同疾病事件或疾病阶段的细胞间,基因或其表达产物在时间 或细胞表达图式中有定量的以及定性的差异。为了本发明的目的,当在正常 和患病受试者中给定基因的表达之间或在患病受试者的不同疾病发展阶段 中存在至少约2倍、优选至少约4倍、更优选至少约6倍、最优选至少约10倍 差异时,就认为存在“差异的基因表达”。

关于RNA转录物的术语“过表达”用于指通过对参考mRNA水平标准化 所测定的转录物水平,参考mRNA可以是标本中所有被测量的转录物或是特 定的mRNA参考集合。

短语“基因扩增”指在特定细胞或细胞系中形成多拷贝的基因或基因片 段的过程。复制区(扩增的DNA的区段)通常称为“扩增子”。一般而言, 所产生的信使RNA(mRNA)的量,即基因表达的水平,也按由所表达特定基 因形成的拷贝数的比例增加。

杂交反应的“严格性”容易为本领域普通技术人员所确定,并且通常取 决于探针长度、洗涤温度和盐浓度凭经验计算。一般而言,较长的探针需要 较高的温度用于正确的退火,而较短的探针则需要较低的温度。当互补链存 在于低于它们解链温度的环境中时,杂交通常取决于变性DNA重新退火的能 力。探针和能杂交的序列之间的期望同源性程度越高,就可使用越高的相对 温度。作为结果,推出,更高的相对温度趋向于使反应条件更加严格,而更 低的温度则更不严格。对于杂交反应的严格性的补充细节及解释参见 Ausubel等的《Current Protocols in Molecular Biology》,Wiley Interscience Publishers,(1995)。

如本文中所定义的,“严格条件”或“高严格条件”通常为:(1)对于洗 涤使用低离子强度和高温,例如0.015M氯化钠/0.0015M柠檬酸钠/0.1%十 二烷基硫酸钠,50℃;(2)在杂交期间使用变性剂,诸如甲酰胺,例如,50% (v/v)甲酰胺及0.1%牛血清清蛋白/0.1% Ficoll/0.1%聚乙烯吡咯烷酮/具有 750mM氯化钠,75mM柠檬酸钠的50mM磷酸钠缓冲液pH6.5,42℃,或(3)使 用50%甲酰胺,5x SSC(0.75M NaCl,0.075M柠檬酸钠),50mM磷酸钠 (pH6.8),0.1%焦磷酸钠,5x Denhardt氏溶液,超声处理的鲑精DNA (50μg/ml),0.1%SDS和10%硫酸右旋糖苷,42℃,在42℃于0.2x SSC(氯化 钠/柠檬酸钠)和50%甲酰胺中洗涤,然后在55℃由含有EDTA的0.1x SSC组 成的高严格洗涤。

“中等严格条件”可规定为如Sambrook等的《Molecular Cloning:A Laboratory Manual》(New York:Cold Spring Harbor Press,1989)所描述的, 而且包括使用与上文所述那些相比较不严格的洗涤溶液和杂交条件(例如温 度、离子强度和%SDS)。中等严格条件的一个例子是在含:20%甲酰胺、 5x SSC(150mM NaCl,15mM柠檬酸三钠)、50mM磷酸钠(pH7.6)、5x Denhardt氏溶液、10%硫酸右旋糖苷和20mg/ml变性的剪切的鲑精DNA的 溶液中于37℃温育过夜,然后于约37-50℃在1x SSC中洗涤滤膜。本领域熟 练技术人员应当认识到如何根据适应诸如探针长度等因素的需要来调节温 度、离子强度等。

在本发明的上下文中,列于任何特定基因集合中的“至少一种”、“至少 两种”、“至少五种”等基因的含义意指所列基因的任何一种或者任何及所有 的组合。

术语“结节阴性”癌症,诸如“结节阴性”结肠癌,在本文中用于指没 有扩散到淋巴结的癌症。

术语“剪接”和“RNA剪接”可互换使用,指除去内含子并连接外显子 以产生成熟mRNA的RNA加工,其中成熟mRNA具有连续编码序列且移入真 核细胞的细胞质。

理论上,术语“外显子”指体现在成熟RNA产物中的任何断裂基因区段 (B.Lewin.Genes IV,Cell Press,Cambridge Mass.1990)。理论上,术语“内含 子”指被转录但通过将位于其任一侧的外显子剪接到一起而被从转录物中除 去的任何DNA区段。在操作上,外显子序列出现在基因的mRNA序列中,基 因通过参见SEQ ID编号来限定。在操作上,内含子序列是位于基因的基因组 DNA中的间插序列,其两侧为外显子序列且在它们的5’和3’边界具有GT和 AG剪接共有序列。

术语“表达聚类”在本文中用于指当在来自规定患者组的样品中研究时 显示类似表达图式的一组基因。当在本文中使用时,当在来自II期和/或III期 结肠和/或直肠癌患者的样品中研究时同一表达聚类中的基因显示类似的表 达图式。

B.1一般描述

除非另有陈述,本发明的实施将采用常规的分子生物学技术(包括重组 技术)、微生物学技术、细胞生物学技术和生物化学技术,这些技术都处于 本领域技术范围之内。这样的技术在下述文献中得到充分的解释,诸如 “Molecular Cloning:A Laboratory Manual”,第2版(Sambrook等,1989); “Oligonucleotide Synthesis”(M.J.Gait,编,1984);“Animal Cell Culture”(R.I. Freshney,编,1987);“Methods in Enzymology”(Academic Press,Inc.); “Handbook of Experimental Immunology”,第4版(D.M.Weir & C.C. Blackwell,编,Blackwell Science Inc.,1987);“Gene Transfer Vectors for Mammalian Cells”(J.M.Miller & M.P.Calos,编,1987);“Current Protocols in Molecular Biology”(F.M.Ausubel等,编,1987);及“PCR:The Polymerase Chain Reaction”,(Mullis等,编,1994)。

基于RNA转录物在正常细胞和癌细胞中差异表达的证据,本发明提供了 用于结肠直肠癌的预后基因标志物。因此,在一个特定的方面中,本发明提 供了II期和/或III期结肠直肠癌的预后基因标志物,包括特异性预后II期或III 期疾病结果的标志物以及在这两期中具有预后价值、在这两期中和/或在肿瘤 进展程度中反映肿瘤细胞中根本差异的标志物。本发明所提供的预后标志物 及相关信息使得医师作出更明智的治疗结论以及针对患者个体需要定制结 肠直肠癌治疗得以可能,由此使治疗益处达到最大化并使患者暴露于不必要 的治疗减至最小,该不必要的治疗并不提供任何重大益处且由于毒副作用通 常携带有严重的危险性。

包括增殖、凋亡、血管发生以及侵入在内的各种生理过程之正常功能的 破坏涉及到癌症的病理。在特定生理过程中机能障碍对特定癌症类型的病理 的相对贡献未得到充分的表征。任何生理过程均综合了涉及该过程的多种细 胞所表达的多种基因产物的贡献。例如,肿瘤细胞侵入相邻的正常组织以及 肿瘤细胞内渗入循环系统均受到一批介导不同细胞特征的蛋白质的影响,所 述细胞特征包括肿瘤细胞间的粘聚、肿瘤细胞与正常细胞及结缔组织的粘 附、肿瘤细胞首先改变其形态接着迁移穿过周围组织的能力、以及肿瘤细胞 降解周围结缔组织结构的能力。

多分析物基因表达测试可测量数个重要生理过程或构成细胞特征中每 一个所牵涉的一种或多种基因的表达水平。在有些情况中,该测试的预测功 效以及因此的其效用可通过使用对个别基因获得的表达值来计算如下得分 得以改善,该得分比个别基因的表达值与结果更加高度相关。例如,在雌激 素受体阳性、结节阴性乳腺癌中计算预测复发可能性的定量得分(复发得分) 记载于共同未决的美国专利申请(公开号20050048542)。用于计算这样的复 发得分的方程式可将基因分组以便使复发得分的预测值达到最大。可至少部 分基于对它们对生理功能或构成细胞特征(诸如上文所讨论的)的贡献的认 识进行基因分组。此外,分组信息可利于数学加权各种表达值对复发得分的 贡献。代表生理过程或构成细胞特征的基因群的加权可反映该过程或特征对 癌症病理和临床结果的贡献。因而,在一个重要的方面中,本发明还提供了 本文中所鉴定的预后基因的具体分组,与该所鉴定的基因的个别基因或随机 组合相比,上述分组为更可靠且更有效的结果预测器。

此外,基于复发得分的测定,可选择将患者划分入具有任何特定复发得 分值的亚组,其中所有具有给定范围值的患者可分类属于特定的风险组。如 此,所选择的值会限定分别具有更大或更小风险的患者亚组。

基因标志物在预测结肠癌结果中的效用可能并非只有该标志物才有。具 有与特定测试标志物密切相似的表达图式的可选标志物可代替该测试标志 物,或可在该测试标志物之外使用并且对该测试的总体预测效用影响甚小。 两种基因的密切相似的表达图式可来源于两种基因在结肠肿瘤细胞中牵涉 同一特定过程和/或处于共同调节控制下。本发明明确包括并涵盖这样的替代 基因或基因集在本发明的方法中的用途。

能预测II期和/或III期结肠和/或直肠癌临床结果的、本发明所提供的预后 标志物及相关信息可用于开发用于治疗II期和/或III期结肠和/或直肠癌的药 物。

能预测II期和/或III期结肠和/或直肠癌临床结果的、本发明所提供的预后 标志物及相关信息还可用于筛选包含于测试药物化合物对II期和/或III期结 肠和/或直肠癌患者治疗的功效的临床试验中的患者。特别是,该预后标志物 可用在收集自临床试验中患者的样品上,并且将测试结果与患者结果一起使 用以便确定与整个患者组或其他亚组相比,哪一患者亚组更有可能或更不可 能显示出对药物的响应。

能预测II期和/或III期结肠和/或直肠癌临床结果的、本发明所提供的预后 标志物及相关信息可用作临床试验的包括标准。例如,如果测试结果指出若 仅进行手术患者会具有不良临床结果的可能性更高,则患者更有可能包括在 临床试验中,以及如果测试结果指出若仅进行手术患者会具有不良临床结果 的可能性更低,则患者较不可能包括在临床试验中。

在一个特定的实施方案中,预后标志物及相关信息用于设计或产生调控 基因转录物或其表达产物水平或活性的试剂。所述试剂可包括但不限于反义 RNA、小抑制性RNA、核酶、单克隆或多克隆抗体。

在一个进一步的实施方案中,所述基因或其转录物,或更具体地,所述 转录物的表达产物用于(筛选)测定法以鉴定药物化合物,其中所述药物化 合物用于开发治疗II期和/或III期结肠和/或直肠癌的药物。

在本发明的各个实施方案中,可利用各种技术方法来测定所披露的基因 的表达水平,包括但不限RT-PCR、微阵列、基因表达系列分析(Serial Analysis of Gene Expression,SAGE)和通过大规模平行签名测序(Massively Parallel Signature Sequencing,MPSS)的基因表达分析,其将详细讨论于下文。在特定 的实施方案中,可相对于基因表达产物的不同特征(包括外显子、内含子、 蛋白质表位和蛋白质活性)测定每种基因的表达水平。在其他实施方案中, 基因的表达水平可推断自基因结构分析,例如推断自基因启动子的甲基化样 式分析。

B.2基因表达序型分析

基因表达序型分析的方法包括基于多核苷酸杂交分析的方法、基于多核 苷酸测序的方法、及基于蛋白组学的方法。本领域中已知用于样品中mRNA 表达定量的最常使用的方法包括Northern印迹和原位杂交(Parker & Barnes, Methods in Molecular Biology 106:247-283(1999));RNA酶保护测定法(Hod, Biotechniques 13:852-854(1992));及基于PCR的方法,诸如逆转录聚合酶链 反应(RT-PCR)(Weis等,Trends in Genetics 8:263-264(1992))。或者,可采用能 识别序列特异性双链体(包括DNA双链体、RNA双链体、及DNA-RNA杂合 双链体或DNA-蛋白质双链体)的抗体。基于测序的基因表达分析的代表性 方法包括基因表达系列分析(SAGE)和通过大规模平行签名测序(MPSS)的基 因表达分析。

a.逆转录酶PCR(RT-PCR)

在上文所列的技术中,最灵敏且最灵活的定量方法是RT-PCR,其可用 于测定各种样品中的mRNA水平。结果可用于比较样品集合之间(例如在正 常组织与肿瘤组织之间以及在进行药物治疗的患者或不进行药物治疗的患 者之间)的基因表达图式。

第一步是从靶样品分离mRNA。起始材料典型的是分别从人肿瘤或肿瘤 细胞系及相应的正常组织或细胞系分离的总RNA。如此,可以从多种原发性 肿瘤中分离RNA,包括乳腺、肺、结肠、前列腺、脑、肝、肾、胰腺、脾、 胸腺、睾丸、卵巢、子宫等肿瘤或肿瘤细胞系,及来自健康供体的合并DNA。 如果mRNA的来源是原发性肿瘤,那么mRNA可以从例如冷冻的或归档的石 蜡包埋且固定(例如福尔马林固定)的组织样品提取。

用于提取mRNA的通用方法是本领域众所周知的,公开于分子生物学的 标准教科书中,包括Ausubel等人,《Current Protocols of Molecular Biology》, John Wiley and Sons,1997。用于从石蜡包埋组织提取RNA的方法公开于例 如Rupp and Locker,Lab Invest.56:A67(1987);De Andrés et al.,Bio Techniques 18:42044(1995)。具体而言,RNA分离可使用来自商业制造商诸如Qiagen的 纯化试剂盒、缓冲液组和蛋白酶依照制造商的说明书进行。例如,来自培养 细胞的总RNA可使用Qiagen RNeasy微型柱分离。其它商品化RNA分离试剂 盒包括MasterPure完整DNA和RNA纯化试剂盒(EPICENTRE,Madison, WI)和石蜡块RNA分离试剂盒(Ambion,Inc.)。来自组织样品的总RNA可使用 RNA Stat-60(Tel-Test)分离。从肿瘤制备的RNA可通过例如氯化铯密度梯度 离心来分离。

由于RNA不能充当PCR的模板,通过RT-PCR进行基因表达序型分析的 第一步是将RNA模板逆转录成cDNA,接着是它在PCR反应中的指数式扩增。 最常用的两种逆转录酶是禽类成髓细胞白血病病毒逆转录酶(AMV-RT)和莫 洛尼(Moloney)鼠白血病病毒逆转录酶(MMLV-RT)。逆转录步骤典型的使用 特异性引物、随机六聚物或oligo-dT引物引发,取决于表达序型分析的境况 和目标。例如,提取的RNA可使用GeneAmp RNA PCR试剂盒(Perkin Elmer, CA,USA)遵循制造商的说明书逆转录。然后可将衍生的cDNA作为模板用于 后续PCR反应。

尽管PCR步骤可使用多种热稳定的DNA依赖性DNA聚合酶,典型的采用 Taq DNA聚合酶,它具有5′-3′核酸酶活性但缺乏3′-5′校正内切核酸酶活性。如 此,TaqManPCR典型的利用Taq或Tth聚合酶的5′-核酸酶活性来水解与其靶 扩增子结合的杂交探针,但是可使用具有等效5′核酸酶活性的的任何酶。使 用两种寡核苷酸引物来生成扩增子,典型的是PCR反应的。第三种寡核苷酸 或探针设计用于检测位于前两种PCR引物之间的核苷酸序列。探针是Taq DNA聚合酶不可延伸的且用报道荧光染料和淬灭荧光染料标记。在两种染料 正如它们在探针上的那样位置靠近时,任何激光诱发的来自报道染料的发射 受到淬灭染料的淬灭。在扩增反应期间,Taq DNA聚合酶以模板依赖性方式 切割探针。所得探针片段在溶液中解离,来自所释放报道染料的信号不再受 到第二荧光团的淬灭效应的作用。每合成一个新的分子就释放一个分子的报 道染料,未淬灭报道染料的检测提供了数据定量阐述的基础。

TaqMan RT-PCR可使用商品化设备进行,诸如例如ABI PRISM 7700序列检测系统TM(Perkin-Elmer-Applied Biosystems,Foster City,CA,USA)或 Lightcycler(Roche Molecular Biochemicals,Mannheim,Germany)。在一个优选 的实施方案中,在实时定量PCR装置上运行5′核酸酶规程,诸如ABI PRISM 7700序列检测系统TM。该系统由热循环仪、激光(器)、电荷耦合装置(CCD)、 照相机和计算机组成。该系统在热循环仪上以96孔形式扩增样品。在扩增过 程中,通过光纤电缆实时收集所有96个孔的激光诱发的荧光信号,并在CCD 处检测。该系统包括用于运行设备和分析数据的软件。

5′-核酸酶测定法数据最初表述为Ct,或循环阈值(threshold cycle)。正如 上文所讨论的,在每个循环期间记录荧光值并代表至扩增反应中该点时扩增 的产物的量。首次记录到有统计学意义的荧光信号的点即循环阈值(Ct)。

为了将错误和样品间变异的影响降至最低,通常使用内部标准物进行 RT-PCR。理想的内部标准物在不同组织间以恒定水平表达,不受实验处理 的影响。最频繁的用于基因表达样式标准化的RNA是持家基因甘油醛-3-磷酸 脱氢酶(GAPDH)和P-肌动蛋白的mRNA。

RT-PCR技术的一种最新变异是实时定量PCR,它通过双重标记的荧光生 成探针(即TaqMan探针)测量PCR产物积累。实时PCR与定量竞争性PCR (其中使用每种靶序列的内部竞争物来进行标准化)和定量比较性PCR(使 用样品内包含的标准化基因或持家基因供RT-PCR之用)都兼容。更多详情 参阅例如Held et al.,Genome Research 6:986-994(1996)。

多份发表的期刊论文给出了使用固定的、石蜡包埋的组织作为RNA来源 用于基因表达序型分析的代表性方案的步骤,包括mRNA分离、纯化、引物 延伸和扩增(例如T.E.Godfrey et al.,J.Molec.Diagnostics 2:84-91(2000); K.Specht et al.,Am.J.Pathol.158:419-29(2001))。简言之,一种代表性方法 由切出石蜡包埋的肿瘤组织样品的约10微米厚切片开始。然后,提取RNA, 并除去蛋白质和DNA。分析RNA浓度后,在必要时可包括RNA修复和/或扩 增步骤,并使用基因特异性启动子逆转录RNA,随后是RT-PCR。

b.MassARRAY系统

在Sequenom,Inc.(San Diego,CA)开发的基于MassARRAY的基因表达序 型分析方法中,在分离RNA并逆转录之后,在所获得的cDNA中掺入合成的 DNA分子(竞争物),其在除单个碱基之外的所有位置与靶向的cDNA区匹配, 并充当内部标准物。对该cDNA/竞争物混合物进行PCR扩增并进行PCR后虾 碱性磷酸酶(SAP)处理,其导致剩余核苷酸的脱磷酸化。在碱性磷酸酶灭活 后,对来自竞争物和cDNA的PCR产物进行引物延伸,其产生对于竞争物-和 cDNA-衍生的PCR产物截然不同的大量信号(mass signal)。纯化后,将这些产 物分配到芯片阵列上,该芯片阵列预先加载有使用基质辅助的激光解吸电离 飞行时间质谱(MALDI-TOF MS)分析所需要的成分。然后通过分析所产生的 质谱中峰面积的比率对反应中存在的cDNA定量。更多详情参见例如Ding and Cantor,Proc.Natl.Acad.Sci.USA 100:3059-3064(2003)。

c.其它基于PCR的方法

更多基于PCR的技术包括例如差异展示(Liang and Pardee,Science 257:967-971(1992));扩增片段长度多态性(iAFLP)(Kawamoto et al.,Genome Res.12:1305-1312(1999));BeadArrayTM技术(Illumina,San Diego,CA; Oliphant et al,,Discovery of Markers for Disease(Biotechniques增刊),2002年6 月;Ferguson et al.,Analytical Chemistry 72:5618(2000));用于检测基因表达的 珠阵列(BADGE),在基因表达快速测定法中使用商品化Luminex 100 LabMAP 系统和多色编码的微球(Luminex Corp.,Austin,TX)(Yang et al.,Genome Res. 11:1888-1898(2001));以及高覆盖表达序型分析(HiCEP)(Fukumura et al., Nucl.Acids.Res.31(16)e94(2003))。

d.微阵列

差异基因表达也可使用微阵列技术来鉴定或验证。如此,可使用微阵列 技术在新鲜的或石蜡包埋的肿瘤组织中测量结肠癌相关基因的表达序型。在 这种方法中,在微芯片基片上涂布(plate)或排列(array)感兴趣多核苷酸序列 (包括cDNA和寡核苷酸)。然后使排列的序列与来自感兴趣细胞或组织的特 异性DNA探针杂交。正如在RT-PCR方法中一样,mRNA的来源典型的是从 人肿瘤或肿瘤细胞系及相应的正常组织或细胞系分离的总RNA。如此,RNA 可以从多种原发性肿瘤或肿瘤细胞系分离。如果mRNA的来源是原发性肿 瘤,那么mRNA可以从例如冷冻的或归档的石蜡包埋且固定(例如福尔马林 固定)的组织样品提取,所述组织样品是日常临床实践中常规制备和保存的。

在微阵列技术的一个具体实施方案中,将PCR扩增的cDNA克隆的插入 物以密集阵列应用至基片。优选的是,将至少10,000种核苷酸序列应用至基 片。以每种10,000个成分固定在微芯片上的微阵列基因适于在严格条件下杂 交。荧光标记的cDNA探针可通过从感兴趣组织提取的RNA的逆转录中掺入 荧光核苷酸来生成。应用至芯片的经标记cDNA探针与阵列上的每个DNA斑 点以特异性发生杂交。严格清洗以除去非特异性结合的探针后,通过共聚焦 激光显微镜检术或通过其它检测方法诸如CCD照相机扫描芯片。每种阵列成 分的杂交的定量容许评估相应mRNA的丰度。凭借双重有色荧光,将从两种 RNA来源生成的分开标记的cDNA探针与阵列成对杂交。如此同时测定来自 对应于每种指定基因的两种来源的转录物的相对丰度。小型化规模的杂交提 供了大量基因表达样式的便利且快速评估。此类方法已经显示出检测以每个 细胞少数拷贝表达的罕见转录物所要求的灵敏度及可再现的检测表达水平 的至少约2倍差异(Schena et al.,Proc.Natl.Acad.Sci.USA 93(2):106-149 (1996))。微阵列分析可使用商品化设备遵循制造商的方案进行,诸如使用 Affymetrix GENCHIP技术或Incyte的微阵列技术。

为大规模分析基因表达而开发的微阵列方法使得有可能系统搜索多种 肿瘤类型中的癌症分类和结果预测的分子标志物。

e.基因表达连续分析(SAGE)

基因表达连续分析(SAGE)是容许同时且定量分析大量基因转录物且不 需要为每种转录物提供个别杂交探针的一种方法。首先,生成包含足以唯一 鉴定一种转录物的信息的一种短序列标签(约10-14bp),倘若该标签是从每 种转录物内的一个唯一位置得到的。然后,将许多转录物连接起来以形成长、 连续分子,它们可测序,以同时揭示多种标签的身份(identity)。任何转录物 群的表达样式可通过测定个别标签的丰度并鉴定与每种标签对应的基因来 定量评估。更多详情参见例如Velculescu et al.,Science 270:484-487(1995); Velculescu et al.,Cell 88:243-51(1997)。

f.通过大量平行签名测序(MPSS)进行的基因表达分析

由Brenner et al.,Nature Biotechnology 18:630-634(2000)记载的这种方法 是将不基于凝胶的签名测序与数以百万计的模板在分开的5微米直径微珠上 的体外克隆联合起来的一种测序方法。首先,通过体外克隆构建DNA模板的 微珠库。接着,在流动槽中以高密度(典型的是大于3 x 106微珠/cm2)装配含 模板微珠的平面阵列。使用不要求将DNA片段分开的基于荧光的签名测序方 法,同时分析每个微珠上克隆的模板的游离末端。这种方法已经显示出在单 次操作中同时且精确的提供来自酵母cDNA文库的数以十万计的基因签名序 列。

g.免疫组化

免疫组化方法也适用于检测本发明的预后标志物的表达水平。如此,使 用对每种标志物特异性的抗体或抗血清,优选多克隆抗血清,最优选单克隆 抗体来检测表达。抗体可通过直接标记抗体自身来检测,例如用放射性标记 物、荧光标记物、半抗原标记物诸如生物素、或酶诸如辣根过氧化物酶或碱 性磷酸酶。或者,未标记一抗与经标记二抗联合使用,包括对一抗特异性的 抗血清、多克隆抗血清或单克隆抗体。免疫组化方案和试剂盒是本领域众所 周知的,而且可通过商业途径获得。

h.蛋白质组学

术语“蛋白质组”定义为某一时间点样品(例如组织、生物体或细胞培 养物)中存在的蛋白质的全体。蛋白质组学包括研究样品中蛋白质表达的全 局变化(也称为“表达蛋白质组学”)等。蛋白质组学典型的包括下列步骤: (1)通过二维凝胶电泳(2-D PAGE)将样品中的各种蛋白质分开;(2)鉴定从凝 胶中回收的各种蛋白质,例如通过质谱或N-末端测序;及(3)使用生物信息学 分析数据。蛋白质组学方法是其它基因表达序型分析方法的有用补充,可以 单独使用或联合其它方法,用于检测本发明的预后标志物的产物。

i.启动子甲基化分析

在本文中讨论了多种用于对RNA转录物(基因表达分析)或它们的蛋白 质翻译产物定量的方法。还可根据关于染色质结构的信息来推断基因的表达 水平,诸如例如基因启动子和其它调节元件的甲基化状态以及组蛋白的乙酰 化状态。

具体而言,启动子的甲基化状态影响受该启动子调节的基因的表达水 平。特定基因启动子的异常甲基化涉及表达调节,诸如例如肿瘤抑制基因的 沉默。如此,对基因启动子甲基化状态的检查可用作RNA水平直接量化的替 代物。

已设计出数种用于测量特定DNA元件的甲基化状态的方法,包括甲基化 特异性PCR(Herman J.G.et al.(1996)Methylation-specific PCR:a novel PCR assay for methylation status of CpG islands.Proc.Natl Acad.Sci.USA.93, 9821-9826)和亚硫酸氢盐DNA测序(Frommer M.et al.(1992)A genomic sequencing protocol that yields a positive display of 5-methylcytosine residues in individual DNA strands.Proc.Natl Acad.Sci.USA.89,1827-1831)。新近,基 于微阵列的技术已用于表征启动子甲基化状态(Chen C.M.(2003) Methylation target array for rapid analysis of CpG island hypermethylation in multiple tissue genomes.Am.J.Pathol.163,37-45)。

j.基因的共表达

本发明的另一个方面是鉴定基因表达聚类。使用本领域已知的统计学分 析来分析表达数据,由此可鉴定基因表达聚类,包括基于皮尔逊相关系数的 相关性成对分析(Pearson K.and Lee A.(1902)Biometrika 2,357)。

在一个实施方案中,本文中鉴定的表达聚类包括BGN、CALD1、 COL1A1、COL1A2、SPARC、VIM和其它已知为基质细胞所主要合成并涉 及重塑胞外基质的基因。该表达聚类在本文中称为胞外基质重塑/基质聚类。

在另一个实施方案中,本文中鉴定的表达聚类包括ANXA2、KLK6、 KLK10、LAMA3、LAMC2、MASPIN、SLPI和其它编码上皮细胞分泌产物 的基因,其中大多数主要为上皮细胞所分泌,但亦可为其它细胞类型所分泌。 该表达聚类在本文中称为上皮/分泌聚类。

在又一个实施方案中,本文中鉴定的表达聚类包括DUSP1、EGR1、 EGR3、FOS、NR4A1、RHOB和其它在细胞暴露于某些刺激之后其转录早期 上调的基因。多种刺激触发早期应答基因的转录,例如暴露于生长因子,其 能使细胞快速增加它们的运动性及它们转运养分诸如葡萄糖的能力。该表达 聚类在本文中称为早期应答聚类。

在又一个实施方案中,本文中鉴定的表达聚类包括MCP1、CD68、CTSB、 OPN和其它编码通常与免疫系统的细胞相关的蛋白质的基因。该表达聚类在 本文中称为免疫聚类。

在又一个实施方案中,本文中鉴定的表达聚类包括CCNE2、CDC20、 SKP2、CHK1、BRCA1、CSEL1和其它牵涉细胞增殖和细胞周期调节的基因。 该表达聚类在本文中称为增殖/细胞周期聚类。

k.mRNA分离、纯化和扩增的一般性描述

多份发表的期刊论文给出了使用固定的、石蜡包埋的组织作为RNA来源 用于基因表达序型分析的代表性方案的步骤,包括mRNA分离、纯化、引物 延伸和扩增(例如T.E.Godfrey et al.,J.Molec.Diagnostics 2:84-91(2000); K.Specht et al.,Am.J.Pathol.158:419-29(2001))。简言之,一种代表性方法 由切出石蜡包埋的肿瘤组织样品的约10微米厚切片开始。然后,提取RNA, 并除去蛋白质和DNA。分析RNA浓度后,在必要时可包括RNA修复和/或扩 增步骤,并使用基因特异启动子逆转录RNA,随后是RT-PCR。最后,基于 在所检验肿瘤样品中鉴定的特征性基因表达样式,根据癌症复发的预测可能 性,分析数据以鉴定对患者有用的最佳处理选项。

l.结肠癌基因集合、所测定的基因子序列、及基因表达数据的临床应 用

本发明的一个重要方面是利用结肠癌组织某些基因所测定的表达来提 供预后信息。为了该目的,必须校正(标准化)所测定的RNA的量及所使用 的RNA的品质变异性的差异。因此,该测定法通常测量并掺入某些标准化用 基因,包括众所周知的持家基因,诸如GAPDH和Cyp1的表达。或者,可基 于所有被测定的基因或其大型亚集的信号均值或中值(Ct)来标准化(全局标 准化方法)。对于各基因,挨个的将所测量的标准化的患者肿瘤mRNA的量 与结肠癌组织参考集合中所存在的量进行比较。该参考集合中结肠癌组织的 数目(N)应当足够高以确保不同的参考集合(总体上)行为表现基本上一致。 如果符合该条件,那么存在于特定集合中的单个结肠癌组织的身份就不会显 著影响所测定的基因的相对量。一般而言,结肠癌组织参考集合由至少约30 个、优选至少约40个不同的FPE结肠癌组织标本组成。除非另有指示,每一 mRNA/测试的肿瘤/患者的标准化表达水平应表示为在参考集合中测得的表 达水平的百分数。更具体地说,肿瘤数目足够高(例如40个)的参考集合产 生了每一mRNA种类标准化水平的分布。在待分析的特定肿瘤样品中所测量 的水平落在该范围内的某一百分位上,其可通过本领域众所周知的方法来测 定。以下,除非另有指示,提到基因的表达水平时,尽管并不总是明确地规 定,但假定是相对于参考集合的标准化表达。

m.基于内含子的PCR引物和探针的设计

依照本发明的一个方面,PCR引物和探针是基于待扩增基因中存在的内 含子序列设计的。因而,引物/探针设计的第一步是描绘基因内的内含子序列。 这可通过公众可得到的软件来进行,诸如由Kent,W.J.,Genome Res.12(4): 656-64(2002)开发的DNA BLAT软件或BLAST软件,包括其变异。后续步骤 遵循完全建立的PCR引物和探针设计方法。

为了避免非特异性信号,重要的是在设计引物和探针时掩盖(mask)内含 子内的重复序列。这可容易的通过使用Repeat Masker程序来实现,该程序可 通过贝勒医学院(Baylor College of Medicine)在线获得,它针对重复元件文库 筛选DNA序列并返回其中掩盖了重复元件的查询序列。然后可使用任何商品 化或通过其它途径公众可获得的引物/探针设计包将掩盖后的内含子序列用 于设计引物和探针序列,诸如Primer Express(Applied Biosystems);MGB assay-by-design(Applied Biosystems);Primer3(Steve Rozen and Helen J. Skaletsky(2000)Primer3在万维网上供一般用户和生物学家编程员使用。在 Krawetz S,Misener S编的《Bioinformatics Methods and Protocols:Methods in Molecular Biology》中,Humana Press,Totowa,N.J.,第365-386页)。

PCR引物设计中考虑的最重要因素包括引物长度、解链温度(melting temperature,Tm)、G/C含量、特异性、互补引物序列、和3′-末端序列。一般 而言,最佳的PCR引物通常长17-30个碱基,包含约20-80%诸如例如约50-60% G+C碱基。典型的优选Tm在50和80℃之间,例如约50-70℃。

关于PCR引物和探针设计的进一步指导参见例如Dieffenbach C.W.et al.,“General Concepts for PCR Primer Design”(PCR引物设计的一般概念), 在《PCR Primer,A Laboratory Manual》中,Cold Spring Harbor Laboratory Press,New York,1995,第133-155页;Innis and Gelfand,“Optimization of PCRs”(PCR的优化),在《PCR Protocols,A Guide to Methods and Applications》 中,CRC Press,London,1994,第5-11页;及Plasterer,T.N.,Primerselect:Primer and probe design.Methods Mol.Biol.70:520-527(1997),将其完整公开内容 明确收入本文作为参考。

n.本发明的试剂盒

用于本发明的方法中的材料适合于制备根据众所周知的规程所产生的 试剂盒。如此,本发明提供了包含试剂的试剂盒,所述试剂可包括用于对用 于预测预后结果或治疗响应的所披露基因的表达定量的基因特异性或基因 选择性探针和/或引物。此类试剂盒可任选地包含用于从肿瘤样品(特别是固 定的、石蜡包埋的组织样品)提取RNA的试剂和/或用于RNA扩增的试剂。 此外,试剂盒可任选地包含试剂及鉴别描述或标签或使用说明,关于它们在 本发明的方法中的应用。试剂盒可包含容器(包括适用于自动化执行本发明 方法的微量滴定板),每一容器装有一种或多种用于本发明方法的各种试剂 (通常以浓缩的形式存在),包括例如预制的微阵列、缓冲液、适宜的核苷 酸三磷酸(例如dATP、dCTP、dGTP和dTTP;或rATP、rCTP、rGTP和UTP)、 逆转录酶、DNA聚合酶、RNA聚合酶、以及一种或多种本发明的探针和引物 (例如适宜长度的连接至RNA聚合酶起反应的启动子的poly(T)或随机引 物)。用于评价或定量预后或预测信息的数学算法也适当地是试剂盒的可能 成分。

o.本发明的报告

当被实施用于商业化诊断目的时,本发明的方法通常产生一份关于一种 或多种选定基因的标准化表达水平的报告或概要。本发明的方法将产生一份 包含诊断有结肠直肠癌的受试者在所述癌症的手术切除后临床结果的预测 的报告。本发明的方法和报告可进一步包括将报告存储于数据库中。或者, 该方法可进一步在受试者的数据库中生成一份记录并在该记录中填充数据。 在一个实施方案中,报告为纸件报告,在另一个实施方案中,报告为听觉 (auditory)报告,在另一个实施方案中,报告为电子记录。涵盖该报告被提供 给医师和/或患者。该报告的接收可进一步包括与包含数据和报告的服务器建 立网络连接并从该服务器上请求数据和报告。

本发明提供的方法还可在整体上或部分地自动化进行。

还可实施本发明的所有方面,使得在所披露的基因之外和/或代替所披露 的基因,在预后或预测试验中包括与所披露的基因共表达的有限数目的别的 基因,例如通过高皮尔逊(Pearson)相关系数所证实的基因。

已描述了本发明,通过参考下列实施例将会更容易地理解本发明,所述 实施例作为示例提供,部分意图以任何方式限制本发明。

实施例

一项探索基因组肿瘤表达序型与用结肠切除术治疗的杜克氏B和杜克氏 C患者的复发可能性之间相关性的研究

该研究的主要目的在于测定在表B中鉴定的757种扩增子每一种的表达 与接受结肠切除术(手术)但不进行化学治疗的II期和III期结肠癌患者的临 床结果之间是否存在显著的相关性。

研究设计

这是一项探索性研究,利用来自在多达400位仅接受结肠切除术(手术) 或接受手术和手术后卡介苗(BCG)的杜克氏B(II期)和杜克氏C(III期)患 者中的美国乳腺和肠道手术辅助治疗计划(National Surgical Adjuvant Breast and Bowel Project,NSABP)研究C-01和C-02的组织和结果数据。

包含标准

患者加入NSABP研究C-01:“在可切除的结肠癌管理中评价术后免疫治 疗和术后全身化学治疗的临床试验(A Clinical Trial To Evaluate Postoperative Immunotherapy And Postoperative Systemic Chemotherapy In The Management Of Resectable Colon Cancer)”或NSABP研究C-02:“在结肠腺癌中评价术后 5-氟尿嘧啶和肝素门静脉输注的方案(A Protocol To Evaluate The Postoperative Portal Vein Infusion Of 5-Flourouracil And Heparin In Adenocarcinoma Of The Colon)”。C-01和C-02的详情可见位于下列URL的 NSABP站点:

http://www.nsabp.pitt.edu/NSABP_Protocols.htm#treatment%20closed

将来自NSABP C01的仅进行手术和手术+术后BCG组以及来自NSABP C02的仅进行手术组的组织样品合并成一个样品组。

排除标准

如果适用下列一项或多项,则将加入NSABP研究C-01或NSABP研究 C-02的患者排除在本发明的研究之外:

在NSABP档案中没有初期诊断的肿瘤块。

·当通过苏木精和曙红(H&E)载玻片检查评价时,区域中肿瘤不足。

·自组织切片回收的、用于RT-PCR分析的RNA不足(<700ng)。

在1943位加入NSABP研究C-01或NSABP研究C-02的患者中,在应用排 除标准后有270位患者样品是可获得的并用于本文所披露的基因表达研究 中。这270份包含样品的总体人口统计和临床特征类似于最初的NSABP结合 群组。

基因集合(Gene Panel)

选择761种基因用于表达分析,包括7种参考基因。这些基因与用于 qRT-PCR以测定表达水平的引物和探针的序列一起列于表A。

实验材料和方法

使用TaqMan RT-PCR对每位患者定量评价750种癌症相关基因和7种指 定用作为参考基因的基因的表达,该TaqMan RT-PCR单线程进行,每次反 应输入1ng RNA。

数据分析方法

参考标准化

为了标准化外来影响,相对于6种参考基因的集合的表达均值标准化通 过RT-PCR获得的循环阈值(CT)测量值。所得参考标准化的表达测量值通常在 0-15的范围内,其中1个单位的增加通常反映了RNA数量的2倍增加。

研究组与最初的NSABP研究人群的比较

对于当前可评价的组织块的研究组与最初的NSABP C-01和C-02研究人 群,我们比较了临床和人口统计变量的分布。在该分布中无临床上有意义的 差异。

单变量分析

对于研究中的757种扩增子中的每一种,我们使用Cox比例风险模型来检 验基因表达与无复发间期(RFI)之间的相关性。将似然比用作统计学显著性的 检验项。应用Benjamini和Hochberg的方法(Benjamini,Y.and Hochberg,Y. (1995).Controlling the false discovery rate:a practical and powerful approach to multiple testing.J.R.Statist.Soc.B57,289-300)及基于再抽样和排列的方法 (Tusher VG,Tibshirani R,Chu G(2001)Significance analysis of microarrays applied to the ionizing radiation response.Proc Natl Acad Sci USA, 98:5116-5121;Storey JD,Tibshirani R(2001)Estimating false discovery rates under dependence,with applications to DNA microarrays.Stanford:Stanford University,Department of Statistics;报告编号:技术报告2001-28;Korn EL, Troendle J,McShane L,Simon R(2001)Controlling the number of false discoveries:Application to high-dimensional genomic data.技术报告003.2001. National Cancer Institute)于所得p值集合以评价错误发现率(false discovery rate)。对于每一可选择的终点:无远距复发间期(DRFI)、总生存期(OS)和无 病生存期(DFS)重复所有的分析。

多变量分析

对于研究中的757种扩增子中的每一种,我们使用Cox比例风险模型来检 验基因表达与RFI之间的相关性,同时控制其它标准临床协变量(包括肿瘤 定位、手术类型、肿瘤分级、检出的淋巴节数目、及阳性淋巴节的数目)的 影响。将仅包括标准临床协变量的(简化)模型与包括标准临床协变量加基 因表达的(完整)模型的对数似然的差异用作统计学显著性的检验项。

非线性分析

对于研究中的757种扩增子中的每一种,我们使用数种不同方法研究基 因表达与复发之间的其它函数关系。对于每一种扩增子,我们使用2自由度 (DF)自然样条将RFI的Cox比例风险模型拟合为基因表达的函数(Stone C, Koo C.(1985)In Proceedings of the Statistical Computing Section ASA. Washington,DC,45-48)。通过对模型进行2DF似然比检验来评价统计学显著 性。还通过检查作为基因表达的严格线性函数的RFI的单变量Cox比例风险模 型导出的(平滑的)鞅残差(Martingale residuals)的样式来研究函数关系(Gray RJ(1992)Flexible methods for analyzing survival data using splines,with applications to breast cancer prognosis.Journal of the American Statistical Asssociation,87:942-951;Gray RJ(1994)Spline-based tests in survival analysis. Biometrics,50:640-652;Gray RJ(1990)Some diagnostic methods for Cox regression models through hazard smoothing.Biometrics,46:93-102)。此外,将 来自每一相同Cox比例风险模型的鞅残差的累积和用于检测距线性的偏离 (Lin D,Wei L,Ying Z.(1993)Checking the Cox Model with Cumulative Sums of Martingale-Based Residuals.Vol.80,No.3,557-572)。

与分期的相互作用

我们确定了在II期和III期患者中在基因表达与RFI之间是否存在显著差 异关系。对于757种扩增子中的每一种,我们检验了在用于基因表达与肿瘤 期的(简化)比例风险模型与基于基因表达、肿瘤期、及它们的相互作用的 (完整)比例风险模型之间存在显著差异的假设。将简化和完整模型的对数 似然的差异用作统计学显著性的检验项。

表A显示了包括在实施例所述研究中的所有基因的qRT-PCR探针和引物 序列。

表B显示了包括在实施例所述研究中的所有基因的靶扩增子。

一阶分析研究结果

用于一阶分析的参考基因集合为CLTC、FZD6、NEDD8、RPLPO、RPS13、 UBB、UBC。

表1A显示了基于单变量比例风险分析,对于那些其表达升高预测了更短 的无复发间期(RFI)的基因的关联。

表1B显示了基于单变量比例风险分析,对于那些其表达升高预测了更长 的无复发间期(RFI)的基因的关联。

表2A显示了基于单变量比例风险分析,对于那些其表达升高预测了降低 的总生存率(OS)的基因的关联。

表2B显示了基于单变量比例风险分析,对于那些其表达升高预测了升高 的总生存率(OS)的基因的关联。

表3A显示了基于单变量比例风险分析,对于那些其表达升高预测了降低 的无病生存率(DFS)的基因的关联。

表3B显示了基于单变量比例风险分析,对于那些其表达升高预测了升高 的无病生存率(DFS)的基因的关联。

表4A显示了基于单变量比例风险分析,对于那些其表达升高预测了更短 的无远距复发间期(DRFI)的基因的关联。

表4B显示了基于单变量比例风险分析,对于那些其表达升高预测了更长 的无远距复发间期(DRFI)的基因的关联。

表5A显示了基于控制包括在该分析中的患者的特定人口统计和临床特 征的多变量分析,对于那些其表达升高预测了更短的无复发间期(RFI)的基 因,在基因表达与RFI之间的关联。

表5B显示了基于控制包括在该分析中的患者的特定人口统计和临床特 征的多变量分析,对于那些其表达升高预测了更长的无复发间期(RFI)的基 因,在基因表达与RFI之间的关联。

表6显示了基于使用2自由度自然样条的非线性比例风险分析,在基因表 达与临床结果之间鉴定到关联的基因。

表7显示了所有展示与肿瘤分期相互作用(p值<0.05)的基因。

表1A显示了对于那些证实了风险比>1.0且p<0.1的基因,在临床结果与 基因表达之间的关联。使用RFI作为临床结果的度量,将单变量Cox比例风险 回归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表1A

表1B显示了对于那些证实了风险比<1.0且p<0.1的基因,在临床结果与基 因表达之间的关联。使用RFI作为临床结果的度量,将单变量Cox比例风险回 归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表1B

表2A显示了对于那些证实了风险比>1.0且p<0.1的基因,在临床结果与 基因表达之间的关联。使用OS作为临床结果的度量,将单变量Cox比例风险 回归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表2A

表2B显示了对于那些证实了风险比<1.0且p<0.1的基因,在临床结果与基 因表达之间的关联。使用OS作为临床结果的度量,将单变量Cox比例风险回 归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表2B

表3A显示了对于那些证实了风险比>1.0且p<0.1的基因,在临床结果与 基因表达之间的关联。使用DFS作为临床结果的度量,将单变量Cox比例风 险回归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表3A

表3B显示了对于那些证实了风险比<1.0且p<0.1的基因,在临床结果与基 因表达之间的关联。使用DFS作为临床结果的度量,将单变量Cox比例风险 回归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表3B

表4A显示了对于那些证实了风险比>1.0且p<0.1的基因,在临床结果与 基因表达之间的关联。使用DRFI作为临床结果的度量,将单变量Cox比例风 险回归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表4A

表4B显示了对于那些证实了风险比<1.0且p<0.1的基因,在临床结果与基 因表达之间的关联。使用DRFI作为临床结果的度量,将单变量Cox比例风险 回归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表4B

表5A显示了控制包括在该分析中的患者的特定人口统计和临床特征,在 基因表达与RFI之间的关联。列出了其表达与RFI相关(p<0.1)并在包括下列变 量的多变量分析中展示出风险比>1的所有基因:肿瘤定位、手术、肿瘤分级、 检验的结节、及阳性结节的数目。

表5A

表5B显示了控制包括在该分析中的患者的特定人口统计和临床特征,在 基因表达与RFI之间的关联。列出了其表达与RFI相关(p<0.1)并在包括下列变 量的多变量分析中展示出风险比<1的所有基因:肿瘤定位、手术、肿瘤分级、 检验的结节、及阳性结节的数目。

表5B

表6显示了基于使用2自由度自然样条的非线性比例风险分析,在基因表 达与临床结果之间的关联。列出了所有展示出在组合的II期(杜克氏B)和III 期(杜克氏C)患者中偏离了与RFI的严格线性关系(p<0.05)的基因。在该研 究中整个表达值观察范围内,基因表达与RFI之间的关系并不恒定,例如在 一部分的观察范围内基因表达升高可能与RIF持续时间延长有关,而在不同 部分的观察范围内则与RFI持续时间缩短有关。

表6

表7显示了所有展示出与肿瘤分期相互作用(p值<0.05)的基因。使用RFI 的比例风险模型对数据建模,以基因表达、肿瘤分期、及它们的相互作用作 为预测因子。

表7

二阶分析研究结果

用于二阶分析的参考基因集合为ATP5E、CLTC、GPX1、NEDD8、PGK1、 UBB。

表1.2A显示了基于单变量比例风险分析,对于那些其表达升高预测了更 短的无复发间期(RFI)的基因的关联。

表1.2B显示了基于单变量比例风险分析,对于那些其表达升高预测了更 长的无复发间期(RFI)的基因的关联。

表2.2A显示了基于单变量比例风险分析,对于那些其表达升高预测了降 低的总生存率(OS)的基因的关联。

表2.2B显示了基于单变量比例风险分析,对于那些其表达升高预测了升 高的总生存率(OS)的基因的关联。

表3.2A显示了基于单变量比例风险分析,对于那些其表达升高预测了降 低的无病生存率(DFS)的基因的关联。

表3.2B显示了基于单变量比例风险分析,对于那些其表达升高预测了升 高的无病生存率(DFS)的基因的关联。

表4.2A显示了基于单变量比例风险分析,对于那些其表达升高预测了更 短的无远距复发间期(DRFI)的基因的关联。

表4.2B显示了基于单变量比例风险分析,对于那些其表达升高预测了更 长的无远距复发间期(DRFI)的基因的关联。

表5.2A显示了基于控制包括在该分析中的患者的特定人口统计和临床 特征的多变量分析,对于那些其表达升高预测了更短的无复发间期(RFI)的基 因,在基因表达与RFI之间的关联。

表5.2B显示了基于控制包括在该分析中的患者的特定人口统计和临床 特征的多变量分析,对于那些其表达升高预测了更长的无复发间期(RFI)的基 因,在基因表达与RFI之间的关联。

表6.2显示了基于使用2自由度自然样条的非线性比例风险分析,在基因 表达与临床结果之间鉴定到关联的基因。

表7.2显示了所有展示与肿瘤分期相互作用(p值<0.05)的基因。

表1.2A显示了对于那些证实了风险比>1.0且p<0.1的基因,在临床结果与 基因表达之间的关联。使用RFI作为临床结果的度量,将单变量Cox比例风险 回归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表1.2B显示了对于那些证实了风险比<1.0且p<0.1的基因,在临床结果与 基因表达之间的关联。使用RFI作为临床结果的度量,将单变量Cox比例风险 回归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表2.2A显示了对于那些证实了风险比>1.0且p<0.1的基因,在临床结果与 基因表达之间的关联。使用OS作为临床结果的度量,将单变量Cox比例风险 回归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表2.2B显示了对于那些证实了风险比<1.0且p<0.1的基因,在临床结果与 基因表达之间的关联。使用OS作为临床结果的度量,将单变量Cox比例风险 回归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表3.2A显示了对于那些证实了风险比>1.0且p<0.1的基因,在临床结果与 基因表达之间的关联。使用DFS作为临床结果的度量,将单变量Cox比例风 险回归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表3.2B显示了对于那些证实了风险比<1.0且p<0.1的基因,在临床结果与 基因表达之间的关联。使用DFS作为临床结果的度量,将单变量Cox比例风 险回归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表4.2A显示了对于那些证实了风险比>1.0且p<0.1的基因,在临床结果与 基因表达之间的关联。使用DRFI作为临床结果的度量,将单变量Cox比例风 险回归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表4.2B显示了对于那些证实了风险比<1.0且p<0.1的基因,在临床结果与 基因表达之间的关联。使用DRFI作为临床结果的度量,将单变量Cox比例风 险回归分析应用于组合的II期(杜克氏B)和III期(杜克氏C)患者。

表5.2A显示了控制包括在该分析中的患者的特定人口统计和临床特征, 在基因表达与RFI之间的关联。列出了其表达与RFI相关(p<0.1)并在包括下列 变量的多变量分析中展示出风险比>1的所有基因:肿瘤定位、手术年份、肿 瘤分级、治疗方案(C-01或C-02)、BCG治疗(是或否)、及如下根据淋巴结 状况的患者分类:0个阳性结节和<12个检验的结节、0个阳性结节和≥12个检 验的结节、1-3个阳性结节、和≥4个阳性结节。

表5.2B显示了控制包括在该分析中的患者的特定人口统计和临床特征, 在基因表达与RFI之间的关联。列出了其表达与RFI相关(p<0.1)并在包括下列 变量的多变量分析中展示出风险比<1的所有基因:肿瘤部位、手术年份、肿 瘤分级、治疗方案(C-01或C-02)、BCG治疗(是或否)、及如下根据淋巴结 状况的患者分类:0个阳性结节和<12个检验的结节、0个阳性结节和≥12个检 验的结节、1-3个阳性结节、和≥4个阳性结节。

表6.2显示了基于使用2自由度自然样条的非线性比例风险分析,在基因 表达与临床结果之间的关联。列出了所有展示出在组合的II期(杜克氏B) 和III期(杜克氏C)患者中偏离了与RFI的严格线性关系(p<0.05)的基因。在 该研究中整个表达值观察范围内,基因表达与RFI之间的关系并不恒定,例 如在一部分的观察范围内基因表达升高可能与RIF持续时间延长有关,而在 不同部分的观察范围内则与RFI持续时间缩短有关。

表7.2显示了所有展示与肿瘤分期相互作用(p值<0.1)的基因。使用RFI的 比例风险模型对数据建模,以基因表达、肿瘤分期、及它们的相互作用作为 预测因子。将具有0个阳性结节但<12个检验的结节的患者从这些分析中排 除。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号