首页> 中国专利> 用于鉴别原发起源不明癌的起源的方法和材料

用于鉴别原发起源不明癌的起源的方法和材料

摘要

本发明提供了如下鉴别起源不明转移灶的起源的方法:获得含有转移细胞的样品;测量与至少2种不同癌有关的生物标记;将来自生物标记的数据组合进算法中,其中所述算法:相对参照标准化所述生物标记;和采用截止值,其最优化每种生物标记的灵敏度和特异性,使癌的患病率加权和选择起源组织;基于通过算法测定的最高概率,确定起源,或确定该癌不是源自特定癌集合;和任选地测量对一种或多种其它不同癌特异性的生物标记,并为其它生物标记重复所述步骤。

著录项

  • 公开/公告号CN101365950A

    专利类型发明专利

  • 公开/公告日2009-02-11

    原文格式PDF

  • 申请/专利权人 维里德克斯有限责任公司;

    申请/专利号CN200680043073.2

  • 申请日2006-09-19

  • 分类号G01N33/574(20060101);G01N33/48(20060101);

  • 代理机构72001 中国专利代理(香港)有限公司;

  • 代理人权陆军;黄可峻

  • 地址 美国新泽西州

  • 入库时间 2023-12-17 21:32:13

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-11-25

    授权

    授权

  • 2009-04-15

    实质审查的生效

    实质审查的生效

  • 2009-02-11

    公开

    公开

说明书

发明领域

本发明提供了用于鉴别原发起源不明癌的起源的材料、方法、算法、试剂盒等。

发明背景

原发不明癌(CUP)是一组异质的、活组织检查证实的恶性肿瘤,其中存在转移性疾病,其没有可鉴别的原发肿瘤部位或起源组织(ToO)。该问题代表所有癌症的约3-5%,使它成为第七种最常见的恶性肿瘤。Ghosh等(2005);和Mintzer等(2004)。患者的预后和治疗方案依赖于原发肿瘤的起源,这强调了对鉴别原发肿瘤部位的需要。Greco等(2004);Lembersky等(1996);和Schlag等(1994)。

目前,许多种方法用于解决该问题。下面的几种方法图示在图1-2中。血清肿瘤标记可以用于鉴别诊断。尽管它们缺少足够的特异性,但它们可以与病理学和临床信息组合使用。Ghosh等(2005)。免疫组织化学(IHC)方法可以用于鉴别肿瘤谱系,但是非常少的IHC标记是100%特异性的。因此,病理学家经常使用一组IHC标记。几项研究已经使用4-14种IHC标记证实了66-88%的准确度。Brown等(1997);DeYoung等(2000);和Dennis等(2005a)。更昂贵的诊断检查包括成像方法,例如胸部x-射线,计算机体层摄影(CT)扫描,和正电子发射体层摄影(PET)扫描。每种这样的方法可以鉴别30-50%病例中的原发。Ghosh等(2005);和Pavlidis等(2003)。尽管有这些复杂的技术,在死前(ante mortem)分辨CUP病例的能力仅仅是20-30%。Pavlidis等(2003);和Varadhachary等(2004)。

一种有前途的新方法在于分析全基因组的基因表达概况来鉴别肿瘤起源的能力。Ma等(2006);Dennis等(2005b);Su等(2001);Ramaswamy等(2001);Bloom等(2004);Giordano等(2001);和20060094035。这些研究证实了基于基因表达概况来鉴别起源组织的可行性。为了将这些表达概况分析技术用于临床场合,必须克服2大障碍。首先,由于基因表达概况分析完全在原发组织上进行,所以必须在转移组织上验证基因标记候选物,以证实在转移灶中维持它们的组织特异性表达。其次,基因表达概况分析技术必须能利用福尔马林固定的、石蜡包埋的(FFPE)组织,因为固定化的组织样品是当前实践中的标准材料。福尔马林固定导致RNA的降解(Lewis等(2001);和Masuda等(1999)),所以现有的微阵列规程不能可靠地进行。Bibikova等(2004)。另外,所述概况分析技术必须是有力的、可再现的和可容易接近的。

已经表明,定量RTPCR(qRTPCR)从FFPE组织产生可靠的结果。Abrahamsen等(2003);Specht等(2001);Godfrey等(2000);和Cronin等(2004)。因此,一项更实用的方法是使用全基因组的方法作为发现工具,并开发基于更有力的技术的诊断测定。Ramaswamy(2004)。但是,该范例需要开发更小的基因集合。Oien及其同事使用基因表达的系列分析(SAGE)来鉴别61种肿瘤标记,它们从中开发了基于5个肿瘤类型的11个基因的RTPCR方法。Dennis等(2002)。将SAGE和qRTPCR结合到一起的另一项研究,开发了4个肿瘤类型的5个基因的组,并达到81%的准确度。Buckhaults等(2003)。最近的研究将微阵列概况分析与qRTPCR结合,但是使用了79种标记。Tothill等(2005)。

发明概述

本发明提供了如下鉴别起源不明转移灶的起源的方法:获得含有转移细胞的样品;测量与至少2种不同癌有关的生物标记;将来自生物标记的数据组合进算法中,其中所述算法:相对参照标准化所述生物标记;和采用截止值,其最优化每种生物标记的灵敏度和特异性,使癌的患病率加权和选择起源组织;基于通过算法测定的最高概率,确定起源,或确定该癌不是源自特定癌集合;和任选地测量对一种或多种其它不同癌特异性的生物标记,并为其它生物标记重复所述步骤。

附图简述

图1-2描述了鉴别起源不明转移灶的起源的现有技术方法。

图3描述了现有的CUP诊断算法。

图4描述了显示一组组织中的2个基因的强度的微阵列数据。(A)前列腺干细胞抗原(PSCA)。(B)凝固因子V(F5)。条线图在y-轴上显示了强度,且在x-轴上显示了组织。Panc Ca,胰癌;Panc N,正常胰。

图5描述了从Agilent生物分析仪得到的电泳图谱。使用3小时(A)或16小时(B)蛋白酶K消化,从FFPE组织分离RNA。样品C22(红色)是1年龄块,而样品C23(蓝色)是5年龄块。大小梯显示为绿色。

图6描述了从3种不同qRTPCR方法得到的Ct值的对比:在反转录中的随机六聚体引发,随后用得到的cDNA进行qPCR(RH 2步骤),在反转录中基因-特异性的(反向引物)引发,随后用得到的cDNA进行qPCR(GSP 2步骤),或在单步反应中基因-特异性的引发和qRTPCR(GSP1步骤)。将来自11个样品的RNA分入3种方法中,并测量3个基因的RNA水平:β-肌动蛋白(A),HUMSPB(B),和TTF(C)。用实线指示用每种方法得到的中值Ct值。

图7描述了CUP测定板图。

图8中的一系列图描述了一定RNA浓度范围的测定性能。

图9是一幅实验工作流程图:标记候选物指定和验证(9A);和测定最优化和预测算法建立和测试(9B)。

图10描述了10种选择的组织特异性的基因标记候选物在FFPE转移癌和前列腺原发腺癌中的表达。对于每幅图,X轴代表标准化的标记表达值。

图11描述了测定最优化。(A和B)从Agilent生物分析仪得到的电泳图谱。使用3小时(A)或16小时(B)蛋白酶K消化,从FFPE组织分离RNA。样品C22(红色)是1年龄块,而样品C23(蓝色)是5年龄块。大小梯显示为绿色。(C和D)从3种不同qRTPCR方法得到的Ct值的对比:在反转录中的随机六聚体引发,随后用得到的cDNA进行qPCR(RH 2步骤),在反转录中基因-特异性的(反向引物)引发,随后用得到的cDNA进行qPCR(GSP 2步骤),或在单步反应中基因-特异性的引发和qRTPCR(GSP1步骤)。将来自11个样品的RNA分入3种方法中,且测量2个基因的RNA水平:β-肌动蛋白(C),HUMSPB(D)。用实线指示用每种方法得到的中值Ct值。

图12是显示10个标记组在239个样品之间的相对表达水平的热图(heatmap)。红色指示更高的表达。

详细描述

鉴别原发起源不明(CUP)转移癌患者中的原发部位,可以实现特定治疗方案的应用,并可以延长存活。然后通过反转录酶聚合酶链反应(RT-PCR),在源自这6种组织的205 FFPE转移癌上以及源自其它癌症类型的转移灶上,验证了标记候选物,以测定特异性。选择10-基因标记,其可以预测这6种癌症类型的转移癌起源组织。接着,为这10个标记最优化RNA分离和qRTPCR方法,并将qRTPCR测定应用于一组260转移肿瘤,从而产生78%的总准确度。最后,测试了48个转移样品的独立集合。重要的是,该集合中的37个样品具有已知的原发癌,或最初表现为CUP、但是随后被鉴别,且该测定表现出78%的准确度。

生物标记是指示的标记基因的表达水平的任何标记。该标记可以是直接的或间接的,且可以测量在给定生理参数下,且与内部对照、正常组织或另一种癌相比,该基因的超表达或表达不足。生物标记包括但不限于,核酸(超表达和表达不足,且直接的和间接的)。使用核酸作为生物标记,可以包括本领域已知的任何方法,包括但不限于,测量DNA扩增、RNA、微RNA、杂合性丢失(LOH)、单核苷酸多态性(SNPs,Brookes(1999))、微卫星DNA、DNA甲基化不足或过度甲基化。使用蛋白作为生物标记包括本领域已知的任何方法,包括但不限于,测量量,活性,修饰如糖基化、磷酸化、ADP-核糖基化、遍在蛋白化等,或免疫组织化学(IHC)。其它生物标记包括成像、细胞计数和细胞凋亡标记。

本文提供的指示的基因是与特定肿瘤或组织类型相关的那些基因。标记基因可以与许多癌症类型相关,但是前提是,该基因的表达与使用本文所述算法鉴定为对特定起源是特异性的一种肿瘤或组织类型充分相关,该基因可以用于要求保护的发明中,以确定原发起源不明癌(CUP)的起源组织。本领域已知许多与一种或多种癌症相关的基因。本发明提供了优选的标记基因和甚至更优选的标记基因组合。它们在本文中予以详述。

如在“起源组织”中提及的“起源”是指组织类型(肺、结肠等)或组织学类型(腺癌、鳞状细胞癌等),这取决于特定医学环境,且将被本领域技术人员所理解。

当标记基因含有SEQ ID NO指定的序列时,它与该序列相对应。当基因区段或片段含有足以辨别它是该基因的序列的参照序列或它的互补体的部分时,它与这样的基因的序列相对应。当它的RNA、mRNA或cDNA与具有这样的序列(例如探针)的组合物杂交时,或者,在肽或蛋白的情况下,它由这样的mRNA编码时,基因表达产物与这样的序列相对应。当它含有足以辨别它是该基因或基因表达产物的序列的参照基因表达产物或它的互补体的部分时,基因表达产物的区段或片段与这样的基因或基因表达产物的序列相对应。

本说明书中所述的和要求保护的本发明的方法、组合物、物品和试剂盒,包括一个或多个标记基因。“标记”或“标记基因”在贯穿本说明书中用于指与任何基因相对应的基因和基因表达产物,且其超表达或表达不足与肿瘤或组织类型相关。在表1中更详细地描述了优选的标记基因。

表1

CUP组

 

SEQ IDNO:名称芯片名称序列1SP-B209810_atgaaaaaccagccactgctttacaggacagggggttgaagctgagccccgcctcacacccacccccatgcactcaaagattggattttacagctacttgcaattcaaaattcagaagaataaaaaatgggaacatacagaactctaaaagatagacatcagaaattgttaagttaagctttttcaaaaaatcagcaattccccagcgtagtcaagggtggacactgcacgctctggcatgatgggatggcgaccgggcaagctttcttcctcgagatgctctgctgcttgagagctattgctttgttaagatataaaaaggggtttctttttgtctttctgtaaggtggacttccagattttgattgaaagtcctagggtgattctatttctgctgtgatttatctgctgaaagctcagctggggttgtgcaagctagggacccattcctgtgtaatacaatgtctgcaccaatgct2TTFI211024_s_atgtgattcaaatgggttttccacgctagggcggggcacagattggagagggctctgtgctgacatggctctggactctaaagaccaaacttcactctgggcacactctgccagcaaagaggactcgcttgtaaataccaggatttttttttttttttgaagggaggacgggagctggggagaggaaagagtcttcaacataacccacttgtcactgacacaaaggaagtgccccctccccggcaccctctggccgcctaggctcagcggcgaccgccctccgcgaaaatagtttgtttaatgtgaacttgtagctgtaaaacgctgtcaaaagttggactaaatgcctagtttttagtaatctgtacattttgttgtaaaaagaaaaaccactcccagtccccagcccttcacattttttatgggcattgacaaatctgtgtatattatttggcagtttggtatttgcggcgtcagtctttttctgttgtaact3DSG3205595_atccatcccatagaagtccagcagacaggatttgttaagtgccagactttgtcaggaagtcaaggagcttctgctttgtccgcctctgggtctgtccagccagctgtttccatccctgaccctctgcagcatggtaactatttagtaacggagacttactcggcttctggttccctcgtgcaaccttccactgcaggctttgatccacttctcacacaaaatgtgatagtgacagaaagggtgatctgtcccatttccagtgttcctggcaacctagctggcccaacgcagctacgagggtcacatactatgctctgtacagaggatccttgctcccgtctaatatgaccagaatgagctggaataccacactgaccaaatctggatctttggactaaagtattcaaaatagcatagcaaagctcactgtattgggctaataatttggcacttattagcttctctcataaactgatcacgattataaattaaatgtttgggttcataccccaaaagcaatatgttgtcactcctaattctcaagtac4HPT1209847_atctgcacccacctacttagatatttcatgtgctatagacattagagagatttttcatttttccatgacatttttcctctctgcaaatggcttagctacttgtgtttttcccttttggggcaagacagactcattaaatattctgtacattttttctttatcaaggagatatatcagtgttgtctcatagaactgcctggattccatttatgttttttctgattccatcctgtgtccccttcatccttgactcctttggtatttcactgaatttcaaacatttgtc5PSCA205319_atttcctgaggcacatcctaacgcaagtttgaccatgtatgtttgcaccccttttccccnaaccctgaccttcccatgggccttttccaggattccnaccnggcagatcagttttagtganacanatccgcntgcagatggcccctccaaccntttntgttgntgtttccatggcccagcattttccacccttaaccctgtgttcaggcacttnttcccccaggaagccttccctgcccaccccatttatgaattgagccaggtttggtccgtggtgtcccccgcacccagcaggggacaggcaatcaggagggcccagtaaaggctgagatgaagtggactgagtagaactggaggacaagagttgacgtgagttcctgggagtttccagagatg

 

6F5204713_s_atatcctctacagccagatgtcacagggatacgtctactttcacttggtgctggagaattcanaagtcaagaacatgctaagcntaagggacccaaggtagaaagagatcaagcagcaaagcacaggttctcctggatgaaattactagcacataaagttgggagacacctaagccaagacactggttctccttccggaatgaggccctgggaggaccttcctagccaagacactggttctccttccagaatgaggccctggaaggaccctcctagtgatctgttactcttaaaacaaagtaactcatctaagattttggttgggagatggcatttggcttctgagaaaggtagctatgaaataatccaagatactgatgaagacacagctgttaacaattggctgatcagcccccagaatgcctcacgtgcttggggagaaagcacccctcttgccaacaagcctggaaag7MGB1206378_atgcagcagcctcaccatgaagttgctgatggtcctcatgctggcggccctctcccagcactgctacgcaggctctggctgccccttattggagaatgtgatttccaagacaatcaatccacaagtgtctaagactgaatacaaagaacttcttcaagagttcatagacgacaatgccactacaaatgccatagatgaattgaaggaatgttttcttaaccaaacggatgaaactctgagcaatgttgaggtgtttatgcaattaatatatgacagcagtctttgtgatttattttaactttctgcaagacctttggctcacagaactgcagggtatggtgagaaaccaactacggattgctgcaaaccacaccttctctttcttatgtctttttact8PDEF220192_x_atgagtggggcccttaaactggattcaaaaaatgctctaaacataggaatggttgaagaggtcttgcagtcttcagatgaaactaaatctctagaagaggcacaagaatggctaaagcaattcatccaagggccaccggaagtaattagagctttgaaaaaatctgtttgttcaggcagagagctatatttggaggaagcattacagaacgaaagagatcttttaggaacagtttggggtgggcctgcaaatttagaggctattgctaagaaaggaaaatttaataaataattggtttttcgtgtggatgtactccaagtaaagctccagtgactaatatgtataaatgttaaatgatattaaatatgaacatcagttaaaaaaaaaattctttaaggctactattaatatgcagacttacttttaatcatttgaaatctgaactcatttacctcatttcttgccaattactcccttgggtatttactgcgta9PSA204582_s_attggtgtaattttgtcctctctgtgtcctggggaatactggccatgcctggagacatatcactcaatttctctgaggacacagataggatggggtgtctgtgttatttgtggggtacagagatgaaagaggggtgggatccacactgagagagtggagagtgacatgtgctggacactgtccatgaagcactgagcagaagctggaggcacaacgcaccagacactcacagcaaggatggagctgaaaacataacccactctgtcc10WT1206067_s_atatagatgtacatacctccttgcacaaatggaggggaattcattttcatcactgggagtgtccttagtgtataaaaaccatgctggtatatggcttcaagttgtaaaaatgaaagtgactttaaaagaaaataggggatggtccaggatctccactgataagactgtttttaagtaacttaaggacctttgggtctacaagtatatgtgaaaaaaatgagacttactgggtgaggaaatccattgtttaaagatggtcgtgtgtgtgtgtgtgtgtgtgtgtgtgttgtgttgtgttttgttttttaagggagggaatttattatttaccgttgcttgaaattactgtgtaaatatatgtctgataatgatttgctctttgacaactaaaattaggactgtataagtactagatgcatcactgggtgttgatcttacaagat

本发明提供了如下鉴别起源不明转移灶的起源的方法:测量含有转移细胞的样品中与至少2种不同癌有关的生物标记;将来自生物标记的数据组合进算法中,其中所述算法:相对参照标准化所述生物标记;和采用截止值,其最优化每种生物标记的灵敏度和特异性,使癌的患病率加权和选择起源组织;基于通过算法测定的最高概率,确定起源,或确定该癌不是源自特定癌集合;和任选地测量对一种或多种其它不同癌特异性的生物标记,并为其它生物标记重复所述步骤。

本发明提供了如下鉴别起源不明转移灶的起源的方法:获得含有转移细胞的样品;测量与至少2种不同癌有关的生物标记;将来自生物标记的数据组合进算法中,其中所述算法i)相对参照标准化所述生物标记;和ii)采用截止值,其最优化每种生物标记的灵敏度和特异性,使癌的患病率加权和选择起源组织;基于通过算法测定的最高概率,确定起源,或确定该癌不是源自特定癌集合;和任选地测量对一种或多种其它不同癌特异性的生物标记,和为其它生物标记重复步骤c)和d)。

在一个实施方案中,所述标记基因选自:i)SP-B、TTF、DSG3、KRT6F、p73H或SFTPC;ii)F5、PSCA、ITGB6、KLK10、CLDN18、TR10或FKBP10;和/或iii)CDH17、CDX1或FABP1。优选地,所述标记基因是SP-B、TTF、DSG3、KRT6F、p73H和/或SFTPC。更优选地,所述标记基因是SP-B、TTF和/或DSG3。所述标记基因还可以包括或替换为KRT6F、p73H和/或SFTPC。

在一个实施方案中,所述标记基因是F5、PSCA、ITGB6、KLK10、CLDN18、TR10和/或FKBP10。更优选地,所述标记基因是F5和/或PSCA。优选地,所述标记基因可以包括或替换为ITGB6、KLK10、CLDN18、TR10和/或FKBP10。

在另一个实施方案中,所述标记基因是CDH17、CDX1和/或FABP1,优选CDH17。所述标记基因还可以包括或替换为CDX1和/或FABP1。

在一个实施方案中,使用SEQ ID NO:11-58中的至少一个,测量基因表达。

本发明也包括如下测量基因表达的方法:得到和测量扩增子SEQID NO:14、18、22、26、30、34、38、42、46、50、54和/或58中的至少一个的形成。

在一个实施方案中,所述标记基因可以选自从下述至少一个中选择的性别特异性标记:i)在男性患者情况下,KLK3、KLK2、NGEP或NPY;或ii)在女性患者情况下,PDEF、MGB、PIP、B305D、B726或GABA-Pi;和/或WT1、PAX8、STAR或EMX2。优选地,所述标记基因是KLK2或KLK3。在该实施方案中,所述标记基因可以包括或替换为NGEP和/或NPY。在一个实施方案中,所述标记基因是PDEF、MGB、PIP、B305D、B726或GABA-Pi,优选PDEF和MGB。在该实施方案中,所述标记基因可以包括或替换为PIP、B305D、B726或GABA-Pi。在一个实施方案中,所述标记基因是WT1、PAX8、STAR或EMX2,优选WT1。在该实施方案中,所述标记基因可以包括或替换为PAX8、STAR或EMX2。

本发明提供了下述方法,获取附加临床信息,包括转移部位,以确定癌的起源;得到对于癌最佳的生物标记集合,其包含下述步骤:使用已知起源的转移灶,测定其生物标记,并对比所述生物标记与起源不明转移灶的生物标记;通过确定起源不明转移灶的起源和鉴别其适当治疗,提供治疗方向;并通过测定起源不明转移灶的起源和鉴别其对应预后,提供预后。

本发明另外提供了下述发现生物标记的方法:测定特定转移灶中标记基因的表达水平,测量标记基因的生物标记,以确定其表达,根据本文提供或本领域已知的任一种方法,分析标记基因的表达,并确定所述标记基因是否对起源肿瘤是有效特异性的。

本发明另外提供了组合物,其含有选自SEQ ID NO:11-58的至少一个分离的序列。本发明另外提供了试剂盒,其用于进行根据本文提供的方法的测定,且另外含有生物标记检测试剂。

本发明另外提供了用于进行本文所述方法的微阵列或基因芯片。

本发明另外提供了诊断/预后组合(portfolio),其包含本文所述基因组合的分离的核酸序列、它们的互补体、或其部分,其中所述组合足以测量或表征生物样品中的基因表达,与来自不同癌或正常组织的细胞相比,所述生物样品具有转移细胞。

本发明所述的任意方法还可以包括,测量在样品中组成型表达的至少一个基因的表达。

优选地,胰癌的标记是凝固因子V(F5)、前列腺干细胞抗原(PSCA)、整联蛋白、β6(ITGB6)、激肽释放酶10(KLK10)、密蛋白18(CLDN18)、三件套蛋白同工型(trio isoform)(TR10)和类似于FK506结合蛋白的推定蛋白FLJ22041(FKBP10)。优选地,一起测量F5和PSCA的生物标记。除了F5和/或PSCA之外,或作为替代,可以测量ITGB6、KLK10、CLDN18、TR10和FKBP10的生物标记。F5描述在例如20040076955;20040005563;和WO2004031412中。PSCA描述在例如WO1998040403;20030232350;和WO2004063355中。ITGB6描述在例如WO2004018999;和6339148中。KLK10描述在例如WO2004077060;和20030235820中。CLDN18描述在例如WO2004063355;和WO2005005601中。TR10描述在例如20020055627中。FKBP10描述在例如WO2000055320中。

优选地,结肠癌的标记基因是肠肽-相关转运蛋白HPT-1(CDH17)、尾型同源框转录因子1(CDX1)和脂肪酸结合蛋白1(FABP1)。优选地,单独测量CDH17的生物标记。除了CDH17的生物标记之外,或作为替代,可以测量CDX1和FABP1的生物标记。CDH17描述在例如Takamura等(2004);和WO2004063355中。CDX1描述在例如Pilozzi等(2004);20050059008;和20010029020中。FABP1描述在例如Borchers等(1997);Chan等(1985);Chen等(1986);和Lowe等(1985)中。

优选地,肺癌的标记基因是表面活性剂蛋白-B(SP-B)、甲状腺转录因子(TTF)、桥粒芯糖蛋白3(DSG3)、角蛋白6同工型6F(KRT6F)、p53-相关基因(p73H)和表面活性剂蛋白C(SFTPC)。优选地,一起测量SP-B、TTF和DSG3的生物标记。除了SP-B、TTF和/或DSG3的生物标记中的任一种之外,或作为替代,可以测量KRT6F、p73H和SFTPC的生物标记。SP-B描述在例如Pilot-Mathias等(1989);20030219760;和20030232350中。TTF描述在例如Jones等(2005);US20040219575;WO1998056953;WO2002073204;20030138793;和WO2004063355中。DSG3描述在例如Wan等(2003);20030232350;WO2004030615;和WO2002101357中。KRT6F描述在例如Takahashi等(1995);20040146862;和20040219572中。p73H描述在例如Senoo等(1998);和20030138793中。SFTPC描述在例如Glasser等(1988)中。

所述标记基因可以进一步选自性别特异性标记,例如,在男性患者的情况下,KLK3、KLK2、NGEP或NPY;或在女性患者的情况下,PDEF、MGB、PIP、B305D、B726或GABA-Pi;和/或WT1、PAX8、STAR或EMX2。

优选地,乳腺癌的标记基因是前列腺衍生的上皮因子(PDEF)、乳腺珠蛋白(mammaglobin)(MG)、催乳素-诱导型蛋白(PIP)、B305D、B726和GABA-π。优选地,一起测量PDEF和MG的生物标记。除了PDEF和/或MG的生物标记之外,或作为替代,可以测量PIP、B305D、B726和GABA-Pi的生物标记。PDEF描述在例如WO2004030615;WO2000006589;WO2001073032;Wallace等(2005);Feldman等(2003);和Oettgen等(2000)中。MG描述在例如WO2004030615;20030124128;Fleming等(2000);Watson等(1996和1998);和5668267中。PIP描述在例如Autiero等(2002);Clark等(1999);Myal等(1991)和Murphy等(1987)中。B305D、B726和GABA-Pi描述在Reinholz等(2005)中。NGEP描述在例如Bera等(2004)中。

优选地,卵巢癌的标记是Wilm氏瘤1(WT1)、PAX8、类固醇生成急性调节蛋白(STAR)和EMX2。优选地,测量WT1的生物标记。除了WT1的生物标记之外,或作为替代,可以测量STAR和EMX2的生物标记。WTl描述在例如5350840;6232073;6225051;20040005563;和Bentov等(2003)中。PAX8描述在例如20050037010;Poleev等(1992);Di Palma等(2003);Marques等(2002);Cheung等(2003);Goldstein等(2002);Oji等(2003);Rauscher等(1993);Zapata-Benavides等(2002);和Dwight等(2003)中。STAR描述在例如Gradi等(1995);和Kim等(2003)中。EMX2描述在例如Noonan等(2001)中。

优选地,前列腺癌的标记是KLK3、KLK2、NGEP和NPY。优选地,测量KLK3的生物标记。除了KLK3之外,或作为替代,可以测量KLK2、NGEP和NPY的生物标记。KLK2和KLK3描述在例如Magklara等(2002)中。KLK2描述在例如20030215835;和5786148中。KLK3描述在例如6261766中。

所述方法也可以包括,获取附加临床信息,包括转移部位,以确定癌的起源。在图3中提供了流程图。

本发明另外提供了如下得到对于癌最佳的生物标记集合的方法:使用已知起源的转移灶,测定其生物标记,并对比所述生物标记与起源不明转移灶的生物标记。

本发明另外提供了如下提供治疗方向的方法:根据本文所述方法确定起源不明转移灶的起源,和鉴别其适当治疗。

本发明另外提供了如下提供预后的方法:根据本文所述方法测定起源不明转移灶的起源,和鉴别其对应预后。

本发明另外提供了发现生物标记的方法,其包含,测定特定转移灶中标记基因的表达水平,测量标记基因的生物标记,以确定其表达,根据本文所述方法分析标记基因的表达,并确定所述标记基因是否对起源肿瘤是有效特异性的。

本发明另外提供了组合物,其包含选自SEQ ID NO:11-58的至少一个分离的序列。

本发明另外提供了用于进行本文所述测定的试剂盒、物品、微阵列或基因芯片、诊断/预后组合,和报告通过本发明方法得到的结果的患者报告。

已仅仅罕见地发现,仅仅特定核酸序列在组织样品中的存在或不存在,就具有诊断或预后价值。另一方面,关于各种蛋白、肽或mRNA的表达的信息,日益显得重要。仅仅具有表达蛋白、肽或mRNA的潜力的核酸序列(这样的序列称作“基因”)在基因组中的存在本身,不能确定蛋白、肽或mRNA是否在给定细胞中表达。能表达蛋白、肽或mRNA的给定基因是否表达,且在什么程度发生这样的表达,如果发生的话,由许多复杂因素决定。不考虑理解和评价这些因素的困难,测定基因表达可以提供关于重要事件的发生的有用信息,所述重要事件例如肿瘤发生、转移、细胞凋亡和其它临床上相关的现象。在基因表达概况中,可以发现关于基因有活性或无活性程度的相关指示。本发明的基因表达概况用于为CUP提供诊断和治疗患者。

样品制备需要收集患者样品。在本发明的方法中使用的患者样品是被怀疑含有患病细胞的样品,所述患病细胞例如在组织细针抽吸(FNA)中从小结获得的细胞。从活组织检查或外科手术样品和激光捕获显微解剖得到的大组织制剂也适用。激光捕获显微解剖(LCM)技术是一种选择要研究的细胞的方式,它使由细胞类型不均匀性造成的变异性最小化。结果,可以容易地检测出正常或良性和癌性细胞之间的标记基因表达的中等或小变化。样品也可以包含从外周血提取的循环上皮细胞。这些可以根据许多方法得到,但是最优选的方法是,6136182所述的磁分离技术。一旦已得到含有目标细胞的样品,就使用适当组合中的基因的生物标记获取基因表达概况。

确立基因表达概况的优选方法包括,测定由可以编码蛋白或肽的基因产生的RNA的量。这可以通过下述方法实现:反转录酶PCR(RT-PCR)、竞争RT-PCR、实时RT-PCR、差示RT-PCR、RNA印迹分析和其它相关试验。尽管可能使用单个的PCR反应进行这些技术,但最好扩增从mRNA产生的互补DNA(cDNA)或互补RNA(cRNA),并通过微阵列分析它。许多不同的阵列构型和它们的生产方法是本领域技术人员已知的,且记载在例如5445934;5532128;5556752;5242974;5384261;5405783;5412087;5424186;5429807;5436327;5472672;5527681;5529756;5545531;5554501;5561071;5571639;5593839;5599695;5624711;5658734;和5700637中。

微阵列技术允许同时测量数千个基因的稳态mRNA水平,从而为鉴定如不受控制的细胞增殖的开始、停滞或调节的作用提供强有力的工具。目前广泛使用两种微阵列技术。cDNA阵列和寡核苷酸阵列。虽然这些芯片存在构造差异,但是基本上所有的下游数据分析和输出是相同的。这些分析的结果,一般是从用于检测与微阵列中已知位置的核酸序列杂交的样品中的cDNA序列的标记探针接收的信号强度的测量值。通常,信号强度与在样品细胞中表达的cDNA以及因此mRNA的量成比例。大量的这种技术是可以获得和有用的。确定基因表达的优选的方法可参见,6271002;6218122;6218114;和6004755。

可以通过比较所述信号强度来分析表达水平。这最好通过生成试验样品与对照样品中基因表达强度的比率矩阵来进行。例如,可以把患病组织的基因表达强度,与从相同类型的良性或正常组织中产生的表达强度进行比较。这些表达强度的比率显示了试验样品与对照样品之间在基因表达中的倍数改变。

选择可以基于统计学检验,所述统计学检验产生与肿瘤原始起源部位相关因子之间的每个基因的差别表达的显著性证据有关的排序表。这样的检验的实例包括ANOVA和Kruskal-Wallis。排序可以用作模型中的权重,所述模型设计用于将这些加权的总和、最高达截止值解释为有利于一类的证据胜过另一类。文献所述的以前证据也可以用于调节权重。

在本发明中,选择了10个标记,它们表现出在6个肿瘤类型中显著的差别表达证据。选择过程包括,统计学检验的特别收集,均值方差最优化,和专家知识。在一个替代实施方案中,可以使特征提取方法自动化,以通过监督的学习方法选择和测试标记。随着数据库的产生,可以重复标记的选择,以产生在任意给定数据库状态可能的最高诊断准确度。

优选实施方案是,通过鉴别稳定的对照集合,和将该集合换算至所有样品间零方差,标准化每个测量值。该对照集合定义为任意单个内源转录物,或内源转录物的集合,其受测定中的系统误差影响,且不清楚其独立于该误差而变化。用样品特异性的因子调节所有标记,所述因子对于对照集合(例如平均值或中值)的任意描述性统计或对于直接测量产生零方差。或者,如果仅与系统误差有关的对照变化的前提不成立,然而进行标准化时产生的分类误差更小,对照集合将仍然按照所述使用。非内源峰值(spike)对照也是有用的,但不是优选的。

在标记选择后,将这些选择的变量用于分类器(classifier)中,所述分类器设计用于产生尽可能高的分类准确度。可以使用监督的学习算法,其设计用于关联输入测量值集合和预测值(predictor)的输出集合,以从10个输入值建立模型来预测起源组织。问题可以描述为:给定的训练数据{(x1,y),...,(xn,y)}产生分类器h:x→y,它将样品x∈x映射成它的起源组织标记y∈y。所述预测是基于以前分析的包含在数据库中的实例,因而组成训练集合。

基于输入变量与已知输出值的关系,监督的学习算法应发现使预期的分类误差最小化的参数。这些参数然后可以用于从新样品输入值预测起源组织。这些算法的实例包括线性分类模型、二次分类器、基于树的方法、神经网络和原型方法例如k-最近邻分类器或学习向量量化算法。

建造10个标准化标记的模型的一个具体实施方案是LDA方法,其中使用缺省参数,如Venables和Ripley(2002)所述。该方法基于Fisher线性判别分析,其中给出了y类标记0和1的平均值>μy=0,μy=1>和协方差Σy=0,Σy=1,我们寻找的线性组合,它将具有平均值>ω·μy=i>和方差>ωTΣy=iω,>它们将使类别之间的方差与类别内的方差的比率最大化:

可以将LDA概括成多类判别分析,其中y具有N种可能状态,而不是仅2种。从选定标记的数据库中包含的值,估计类平均值和方差。在优选实施方案中,用进行下述处理的每种肿瘤类型的相等先验概率,加权协方差矩阵。通过模型预测男性患者,在该模型中,每个女性生殖器官肿瘤组的先验概率(prior)是0。类似地,通过模型预测女性患者,在该模型中,男性生殖器官的先验概率是0。在本发明中,对于女性的前列腺检验,先验概率是0,且对于男性的乳房和卵巢检验,先验概率是0。此外,通过模型检验具有与类别标记相同背景的样品,其中对于该特定类别标记,先验概率是0。

上述问题可以视作作为广义本征值问题处理的Rayleigh系数的最大化。通过计算每个样品与选定子空间的矩心的距离,将减小的子空间用于分类中。通过最大似然可以拟合该模型,且使用Bayes氏定理计算后验概率。

一种替代方法可以包括,发现n-维特征空间(其中n是使用的变量的数目)向一组分类标记的映像,将涉及将所述特征空间分隔成区域,然后将分类指定到每个区域。这些最近邻类型算法的评分与决定边界之间的距离有关,且不必需翻译成类别概率。

如果有太多备选变量,且其中的许多是随机噪音,则变量选择和模型冒过适合(over-fit)该问题的危险。因此,在各种截止值的排序表经常用作输入值,以限制变量的数目。搜索算法例如遗传算法也可以用于选择变量子集,因为它们检验成本函数。可以尝试模拟的退火来限制在局部极小值捕获成本函数的风险。尽管如此,必须用独立于选择和建模过程的样品验证这些程序。

也可以使用潜在变量方法。从高维空间估计低维拓扑空间(manifold)的任意非监督的学习算法,可以用于发现输入变量之间的关联和它们可有多好地拟合更小的潜在变量集合。尽管减小的有效性的估计是主观的,但可以将监督的算法应用于减小的变量集合上,以估计分类准确度。因而,可以从潜在变量构建的分类器,也可以从与潜在变量显著相关的一组变量构建。一个实例可包括,使用来自本质组分分析的与本质组分相关的变量,作为任意监督的分类模型的输入值。

这些算法可以在任意软件代码中实施,所述软件代码具有下述方法:输入变量,用函数训练样品,基于该模型测试样品,和将结果输出到控制台。R,Octave,C,C++,Fortran,Java,Perl和Python都具有在开放源许可下可得到的文库,以用于实现许多上面列出的函数。商业包例如S+和Matlab也与许多这样的方法一起包装。

所述代码按照下述次序执行下述步骤,使用安装了MASS(Venables等(2002))文库的R版2.2.1(http://www.r-project.org)。术语LDA指在MASS名字空间(name space)中的lda函数。

1)对于所有可用的训练集合样品将10个标记基因和2个对照的CT值保存在硬驱动器上。

2)对于每个样品,从每个标记减去对照的样品特异性的平均值,标准化10个标记基因值。

3)训练数据集由已知起源部位的转移灶组成,其中每个样品具有至少一个对标记的起源组织特异性的靶标记,其具有小于5的标准化CT值。

4)LDA从(3)中的训练数据构建4个2LDA模型集合。在每个集合中,一个模型是男性特异性的,且具有设定为0的乳房和卵巢先验可能性(odds),以及设定为其它类别标记的等价先验可能性的前列腺先验可能性。每对中的另一个模型是女性特异性的,具有设定为0的前列腺先验可能性,以及设定为其它类别标记中发现的等价先验可能性的乳房和卵巢先验可能性。

a.第一个集合用于测试在结肠中发现的CUP样品,结肠的先验可能性设定为0,且所有其它非生殖类别标记设定为等价先验可能性。

b.第二个模型集合对在卵巢中发现的CUP是特异性的,卵巢的先验可能性设定为0,且所有其它非生殖类别标记设定为等价先验可能性。

c.第三个集合用于在肺中发现的CUP,肺的先验可能性设定为0。所有其它非生殖类别标记设定为等价先验可能性。

d.该一般模型用于所有其它背景组织。等价地设定所有先验可能性,例外是,在4中所设定的生殖特异性的类别标记。

为了测试样品,我们运行R程序,它执行下述内容。

1)读入试验数据集。

2)产生2个对照的样品特异性的平均值。

3)对于每个样品,从每个标记减去样品特异性的平均值。

4)用12替换从40个粗CT产生的任意标准化的CT。

5)对于试验集合中的每个样品,测试下述内容。

a.如果2个对照的平均值大于34,则将该样品标记为具有0后验概率的‘CTR_FAILURE’。

b.检查结肠、卵巢或肺的背景。如果发现匹配,则还检查性别。背景和性别特异性的模型然后用于评价样品。

c.如果发现乳房、胰、肺SCC或前列腺作为背景标记,则为该样品给出‘FAILURE_ineligible_样品’的标记,且后验概率都设定为0。

d.男性或女性的一般模型用于所有其它样品。

将结果格式化,并写入到文件。

本发明包括通过该方法得到的基因表达组合。

基因表达概况也可用很多方式展示。最常用的是将原始荧光强度或比率矩阵排列为树形图,其中的列表示试验样品,且行表示基因。这样排列数据,以便具有相似表达概况的基因彼此接近。每个基因的表达比用颜色显示。例如,小于1的比率(下调)出现在谱的蓝色部分,而大于1的比率(上调)出现在谱的红色部分。商业化可得的计算机软件程序可用于展示这种数据,包括“GeneSpring”(SiliconGenetics,Inc.)和“Discovery”以及“Infer”(Partek,Inc.)。

从原发性肿瘤或已知起源的原发肿瘤的转移性肿瘤,收集独特RNA物种的丰度的测量。这些读数以及临床记录,包括但不限于,患者的年龄、性别、原发性肿瘤的起始部位、和转移部位(如果适用),用于产生关系数据库。所述数据库用于选择RNA转录物和临床因子,它们可以用作预测转移肿瘤的原发起源的标记变量。

在测量蛋白水平以确定基因表达的情况下,本领域已知的任何方法都是适用的,前提是它导致充分的特异性和灵敏性。例如,通过结合对蛋白特异性的抗体或抗体片段,并测量抗体-结合的蛋白的量,可以测量蛋白水平。可以用放射性的、荧光的或其它可检测的试剂标记抗体,以促进检测。检测的方法包括但不限于,酶联免疫吸附测定(ELISA)和免疫印迹技术。

在实施例中描述了在本发明的方法中使用的受调节的基因。与具有不同起源癌的那些患者相比,差别表达的基因在具有特定起源癌的患者中受到上调或下调。上调和下调是相对的术语,指发现的基因表达量相对于一些基线的可检测的差异(超过用于测量它的系统中的噪音的影响)。在该情况下,基于算法来确定基线。然后,使用相同的测量方法,相对于基线水平上调或下调患病细胞中的目标基因。在本上下文中,患病的指身体状态的改变,其中断或扰乱身体功能的正确性能,或具有扰乱身体功能的正确性能的潜力,如细胞的不受控制的增殖所发生的。当一个人的基因型或表型的一些方面与疾病的存在相一致时,即可诊断他患有疾病。但是,进行诊断或预后的行为,可以包括确定疾病/状态问题,例如确定复发的可能性,治疗的类型和治疗监控。在治疗监控中,通过对比随时间推移的基因表达,来确定基因表达概况是否已经变化,或正在变化成与正常组织更相一致的模式,来作出关于给定治疗过程效果的临床判断。

可以将基因分组,从而使得得到的关于组中基因集合的信息提供作出临床上相关判断(例如诊断、预后或治疗选择)的可靠基础。这些基因集合构成本发明的组合。与大多数诊断标记一样,经常需要使用足以作出正确的医学判断的最少数目的标记。这可以防止在进一步分析期间的治疗的延迟,以及时间和资源的无价值的利用。

确立基因表达组合的一个方法是通过使用最优化算法,如广泛用于确立股票组合的均值方差算法。这种方法详细描述于20030194734。实质上,这种方法要求确立一组输入值(金融应用中的股票,这里指通过强度测量的表达),该输入值将最优化人们使用其接受的返回值(例如形成的信号),同时使返回值的变异性最小化。很多商业软件程序可以用来进行这种操作。在整个说明书中称为“Wagner软件”的“Wagner联合均值-方差最优化应用(Wagner Associates Mean-VarianceOptimization Application)”是优选的。这个软件使用“Wagner联合均值-方差最优化文库(Wagner Associates Mean-Variance OptimizationLibrary)”的功能来测定有效的边界,且在Markowitz意义上的最佳组合是优选的。Markowitz(1952)。使用这种类型的软件要求转换微阵列数据,以便当该软件用于其预期的金融分析目的时,数据能以使用股票返回值和风险测量值的方式作为输入值而处理。

选择组合的方法也包括启发式规则的应用。优选地,这些规则是基于生物学和用于产生临床结果的技术的理解而制定的。更优选地,它们可用于从最优化方法中输出。例如,组合选择的均值方差方法可用于癌症受试者中大量差异表达的基因的微阵列数据。从该方法中得到的输出值将是一组最优化的基因,其可包括一些在外周血液中和患病组织中表达的基因。如果用于测试方法中的样品是获自外周血液的,而且在癌中差异表达的某些基因也能在外周血中差异表达,那么就可以应用启发式规则,其中从排除了在外周血中差异表达的那些的有效边界选择组合。当然,通过例如在数据预选择过程中运用该规则,可以在形成有效边界前应用该规则。

也可以应用与所讨论的生物学不必然相关的其它启发式规则。例如,人们可以应用只有规定百分比的组合可被特定的基因或基因的组所代表的规则。商业化可得的软件,如Wagner软件,容易提供这些类型的启发式法。这也是有用的,例如,当准确度和精确度以外的因素(如预期的许可费),对包括一个或多个基因的希求有影响时。

本发明的基因表达概况也可以与在癌症诊断、预后或治疗监控中有用的其它非遗传诊断方法联合使用。例如,在一些情况下,有益地是把上述的基于基因表达的方法的诊断能力与来自常规标记如血清蛋白标记(例如,癌抗原27.29(“CA 27.29”))的数据结合起来。存在一系列这种标记,包括分析物,如CA27.29。在一种这样的方法中,从被治疗的患者中周期性采血,然后对其进行酶免疫测定,以测定上述血清标记之一。当标记的浓度提示肿瘤复发或治疗失败时,取得可进行基因表达分析的样品源。当存在可疑块时,可以进行细针抽吸(FNA),然后如上所述对从块采集的细胞的基因表达概况进行分析。或者,可以从与先前取出肿瘤的组织相邻的区域采集组织样品。当其它测试所得结果不明确时,这种方法是特别有用的。

根据本发明制备的试剂盒,包括用于确定基因表达概况的格式化测定。这些可以包括进行测定所需的所有或一些材料,如试剂和说明书和测定生物标记的介质。

本发明的物品包括用于治疗、诊断、预后和以另外方式评价疾病的基因表达概况的表示法(representation)。这些概况表示法处理至一种可被机器自动读取的介质,如计算机可读介质(磁性的、光学的等)。物品也可包括在这种介质中评价基因表达概况的指令。例如,物品可包括CD ROM,它具有用于对比上述基因组合的基因表达概况的计算机指令。物品也可包括数字化地记录在其中的基因表达概况,以便其可以用于与患者样品的基因表达数据进行比较。或者,概况可以不同的表示形式记录。图形记录就是这样一种格式。例如上面提到的Partek,Inc.的“DISCOVERY”和“INFER”软件中整合的聚类算法,能最好的协助这些数据的显现。

本发明的制品的不同类型,是用于揭示基因表达概况的介质或格式化的测定。这些可以包括,例如,微阵列,其中序列互补体或探针固定于基质上,指示目标基因的序列与之结合,从而产生关于其存在的可读测定。或者,本发明的物品可被制作成试剂盒,以用于进行指示用于检测癌症的目标基因表达水平的杂交、扩增和信号产生。

提供下面的实施例用于解释而不是限制本发明。本文引用的所有参考文献都在本文中引作参考。

实施例1

材料和方法

胰癌标记基因发现。

使用Trizol,从胰肿瘤、正常胰、肺、结肠、乳房和卵巢组织分离RNA。然后,将RNA用于产生扩增的、标记的RNA(Lipshutz等(1999)),其随后在Affymetrix U133A阵列上杂交。然后以2种方式分析数据。

在第一种方法中,过滤该数据集,以仅保留在整个数据集间具有至少2次存在信号(present calls)的那些基因。该过滤剩下14,547个基因。测得2,736个基因与正常胰相对在胰癌中超表达,p值小于0.05。2,736个基因中的45个基因,也比在肺和结肠组织中发现的最大强度超表达至少2倍。最后,发现了6个探针集合,其比在肺、结肠、乳房和卵巢组织中发现的最大强度超表达至少2倍。

在第二种方法中,过滤该数据集,以仅保留在乳房、结肠、肺、和卵巢组织中具有仅仅2次存在信号的那些基因。该过滤剩下4,654个基因。发现4,654个基因中的160个基因,在胰组织(正常和癌症)中具有至少2次存在信号。最后,选择了8个探针集合,它们在胰癌和正常组织之间表现出最大差别表达。

组织样品。

从许多商业卖主,获取共260 FFPE转移和原发组织。测试的样品包括:30乳房转移、30结肠直肠转移、56肺转移、49卵巢转移43胰转移、18前列腺原发和2前列腺转移和32其它起源(6胃、6肾、3喉、2肝、1食管、1咽、1胆管、1胸膜、3膀胱、5黑素瘤、3淋巴瘤)。

RNA提取。

基于高纯RNA石蜡试剂盒手册(Roche)所述的方法和试剂,经下述改进,从石蜡组织切片分离RNA。根据包埋的转移灶的大小(2-5mm=9X10μm,6-8mm=6X10μm,8-≥10mm=3X10μm),将石蜡包埋的组织样品切片,且置于RNA酶/DNA酶1.5ml Eppendorf管中。如下将切片脱蜡:涡旋10-20秒后,在室温在1ml二甲苯中温育2-5分钟。然后离心管,取出上清液,且重复脱蜡步骤。取出上清液后,加入1ml乙醇,将样品涡旋1分钟,离心,且取出上清液。将该过程重复另外一次。取出剩余的乙醇,在55℃烘箱中干燥沉淀5-10分钟,且重新悬浮于100μl组织裂解缓冲液、16μl 10% SDS和80μl蛋白酶K。涡旋样品,且在设定为400rpm的热混合仪(thermomixer)中在55℃温育2小时。向每个样品加入325μl结合缓冲液和325μl乙醇,然后混合,离心,且将上清液加到过滤器柱上。将过滤器柱和收集管一起在8000rpm离心1分钟,且抛弃流过物(flow through)。进行一系列连续洗涤(500μl洗涤缓冲液I→500μl洗涤缓冲液II→300μl洗涤缓冲液II),其中将每种溶液加到柱中,离心并抛弃流过物。然后将柱在最大速度离心2分钟,置于新鲜的1.5ml管中,且加入90μl洗脱缓冲液。在室温温育1分钟,随后在8000rpm离心1分钟后得到RNA。通过加入10μl DNA酶温育缓冲液、2μl DNA酶I,并在37℃温育30分钟,DNA酶处理样品。在加入20μl组织裂解缓冲液、18μl 10% SDS和40μl蛋白酶K后,灭活DNA酶。再次,将325μl结合缓冲液和325μl乙醇加入每个样品中,然后混合,离心,且将上清液加到过滤器柱上。如上所述进行RNA的连续洗涤和洗脱,例外是,使用50μl洗脱缓冲液洗脱RNA。为了消除从柱携带的玻璃纤维污染,将RNA全速离心2分钟,且将上清液移入新鲜的1.5ml Eppendorf管。通过从分光光度计得到的OD260/280读数,定量样品,且将样品稀释至50ng/μl。将分离的RNA在-80℃保藏在无RNA酶的水中备用。

TaqMan引物和探针设计。

适当mRNA参照序列登记号以及Oligo6.0用于开发CUP测定(肺标记:人表面活性剂、肺-相关蛋白B(HUMPSPBA)、甲状腺转录因子1(TTF1)、桥粒芯糖蛋白3(DSG3),结肠直肠标记:钙粘着蛋白17(CDH17),乳房标记:乳腺珠蛋白(MG)、前列腺-衍生的ets转录因子(PDEF),卵巢标记:wilms瘤1(WT1),胰标记:前列腺干细胞抗原(PSCA)、凝固因子V(F5),前列腺标记激肽释放酶3(KLK3))和持家测定β肌动蛋白,羟甲基胆色烷合酶(PBGD)。在表2中列出了每个测定的引物和水解探针。通过设计外显子-内含子剪接位点周围的测定,排除基因组DNA扩增。在5′核苷酸处用FAM作为报道染料、且在3′核苷酸处用BHQ1-TT作为内部猝灭染料,标记水解探针。

定量实时聚合酶链反应。

在ABI Prism 7900HT序列检测系统(Applied Biosystems)上,在384孔板中进行基因-特异性的RNA的定量。对于每个热循环仪运行,放大校准器和标准曲线。每个标记的校准器由在来自大鼠肾的载体RNA中以1X105拷贝稀释的靶基因体外转录物组成。持家标记的标准曲线由在来自大鼠肾的载体RNA中以1X107、1X105和1X103拷贝系列稀释的靶基因体外转录物组成。在每个测定运行中也包括无靶对照,以确保没有环境污染。所有样品和对照都一式两份运行。使用一般实验室用试剂,在10μl反应物中进行qRTPCR,所述反应物含有:RT-PCR缓冲液(50nM N-二(羟乙基)甘氨酸/KOH pH 8.2,115nM KAc,8%甘油,2.5mM MgCl2,3.5mM MnSO4,0.5mM每种dCTP、dATP、dGTP和dTTP),添加剂(2mM Tris-Cl pH 8,0.2mM牛清蛋白,150mM海藻糖,0.002% Tween 20),酶混合物(2U Tth(Roche),0.4mg/μl Ab TP6-25),引物和探针混合物(0.2μM探针,0.5μM引物)。遵从下述循环参数:1个在95℃1分钟的循环;1个在55℃2分钟的循环;斜升(Ramp)5%;1个在70℃ 2分钟的循环;和40个在95℃ 15秒、58℃ 30秒的循环。完成PCR反应后,在ABI 7900HT Prism软件中设定基线和阈值,且将计算的Ct值输出到Microsoft Excel中。

一步对两步反应。

每个反应使用100ng随机六聚体或基因特异性的引物,进行第一链合成。在第一步中,将11.5μl混合物-1(引物和1ug总RNA)加热至65℃ 5分钟,然后在冰上冷却。将8.5μl混合物-2(1x缓冲液,0.01mMDTT,0.5mM每种dNTP’s,0.25U/μl 10U/μl Superscript III)加入混合物-1,在50℃温育60分钟,然后在95℃温育5分钟。将cDNA保藏在-20℃备用。如上所述进行两步反应的第二步的qRTPCR,循环参数如下:1个在95℃1分钟的循环;40个在95℃ 15秒、58℃ 30秒的循环。精确如前段所述,进行一步反应的qRTPCR。一步和两步反应二者都在100ng模板(RNA/cDNA)上进行。完成PCR反应后,在ABI 7900HT Prism软件中设定基线和阈值,且将计算的Ct值输出到Microsoft Excel中。

热图的产生。

对于每个样品,通过取每个CUP标记的平均Ct,且从平均Ct减去持家标记的平均值,计算ΔCt(ΔCt=Ct(CUP标记)-Ct(Ave.HK标记))。测定每个样品的每个起源组织标记集合(肺、乳房、前列腺、结肠、卵巢和胰)的最小ΔCt。将具有总最小ΔCt的起源组织评分为1,且所有其它起源组织评分为0。根据病理学诊断,分选数据。用修饰的可行性数据计算Partek Pro,且产生强度图。

结果。

新胰起源肿瘤和癌症状态标记的发现。

首先,分析了5个胰标记候选物:前列腺干细胞抗原(PSCA)、丝氨酸蛋白酶抑制剂,进化枝A成员1(SERPINA1)、细胞角蛋白7(KRT7)、基质金属蛋白酶11(MMP11)和粘蛋白4(MUC4)(Varadhachary等(2004);Fukushima等(2004);Argani等(2001);Jones等(2004);Prasad等(2005);和Moniaux等(2004)),其中使用DNA微阵列和一组13个胰管腺癌,5个正常胰组织,和98个来自乳房、结肠直肠、肺和卵巢肿瘤的样品。仅PSCA表现出在高特异性(91/98或93%被正确地鉴别为非胰起源)的中等灵敏度(检测了6/13或46%的胰肿瘤)(图4A)。相反,KRT7、SERPINA1、MMP11和MUC4分别表现出在特异性分别为66%、91%、82%和81%的38%、31%、85%和31%的灵敏度。这些数据与在27个胰起源转移和39个非胰起源转移上为所有标记进行的qRTPCR十分一致,例外是MMP11,它在qRTPCR和转移中表现出更差的灵敏度和特异性。总之,在骤冻的、原发组织上的微阵列数据可以用作标记使用qRTPCR鉴别FFPE转移为胰起源的能力的良好指示物,但是其它标记可能对最佳性能有用。

因为胰管腺癌从管上皮细胞发展而来,所述管上皮细胞仅占所有胰细胞的小百分比(其中腺泡细胞和胰岛细胞占大多数),且因为胰腺癌组织含有显著量的邻近正常组织(Prasad等(2005);和Ishikawa等(2005)),所以已经难以鉴别也能将该器官从器官中区分开的胰癌标记(即,在癌症中上调的)。对于在CUP组中的用途,这样的区分是必需的。第一种查询方法(见材料和方法)返回6个探针集合:凝固因子V(F5)、类似于FK506结合蛋白的推定蛋白FLJ22041(FKBP10)、β6整联蛋白(ITGB6)、转谷氨酰胺酶2(TGM2)、异质核内核糖核蛋白A0(HNRP0)和BAXδ(BAX)。第二种查询方法(见材料和方法)返回8个探针集合:F5、TGM2、配对-样同源域转录因子1(PITX1)、三件套蛋白同工型mRNA(TRIO)、p73H的mRNA(p73)、MGC:10264的一种未知蛋白(SCD)和密蛋白18的2个探针集合。F5和TGM2存在于2种查询结果中,且在二者中,F5似乎最有前途(图4B)。

使用FFPE组织最优化样品制备和qRTPCR。

接着,在检查标记组性能之前,使用固定的组织最优化RNA分离和qRTPCR方法。首先,分析了将蛋白酶K温育时间从16小时减小至3小时的作用。对产量没有作用。但是,当使用更短的蛋白酶K步骤时,有些样品表现出更长的RNA片段(图5)。例如,当RNA是从1年龄块(C22)中分离时,在电泳图谱中没有观察到差异。但是,当RNA是从5年龄块(C23)中分离时,如通过肩上的峰评估的,当使用更短的蛋白酶K消化时,观察到更大部分的更高分子量RNA。当加工其它样品时,该趋势通常会保持,无论FFPE转移的起源器官。总之,缩短蛋白酶K消化时间不牺牲RNA产量,且可能辅助分离更长的、更低降解的RNA。

接着,对比了3种不同的反转录方法:使用随机六聚体的反转录、随后用qPCR(2步),使用基因-特异性的引物的反转录、随后用qPCR(2步),和使用基因-特异性的引物的一步qRTPCR。从11个转移分离RNA,并横过3种方法对比β-肌动蛋白、人表面活性剂蛋白B(HUMSPB)、和甲状腺转录因子(TTF)的Ct值(图6)。所有对比都存在统计学显著的差异(p<0.001)。对于所有3个基因,使用随机六聚体的反转录、随后用qPCR(2步反应)产生最高的Ct值,而使用基因-特异性的引物的反转录、随后用qPCR(2步反应)产生比对应的1步骤反应略微(但是统计学显著的)更低的Ct值。但是,使用基因-特异性的引物的2步骤RTPCR具有更长的反转录步骤。当将每个样品的HUMSPB和TTF Ct值对对应的β-肌动蛋白值标准化时,3种方法之间的标准化的Ct值没有差异。总之,最优化RTPCR反应条件可以产生更低的Ct值,这可以辅助分析更老的石蜡块(Cronin等(2004)),且使用基因-特异性的引物的一步RTPCR反应可以产生与在对应的2步反应中产生的Ct值可比较的Ct值。

CUP qRTPCR测定的诊断性能。

接着,在239 FFPE转移上进行12qRTPCR反应(10标记和2个持家基因)。在表2中显示了测定所用的标记。肺标记是人表面活性剂肺-相关蛋白B(HUMPSPB)、甲状腺转录因子1(TTF1)和桥粒芯糖蛋白3(DSG3)。结肠直肠标记是钙粘着蛋白17(CDH17)。乳房标记是乳腺珠蛋白(MG)和前列腺-衍生的Ets转录因子(PDEF)。卵巢标记是Wilms瘤1(WT1)。胰标记是前列腺干细胞抗原(PSCA)和凝固因子V(F5),且前列腺标记是激肽释放酶3(KLK3)。关于基因描述,见表31。

表2.引物和探针序列、登记号和扩增子长度

 

SEQIDNO序列(5′-3′)描述SEQIDNOSP-B59cacagccccgacctttgatga正向引物11ggtcccagagcccgtctca反向引物12agctgtccagctgcaaaggaaaagcc探针*13cacagccccgacctttgatgagaactcagctgtccagctgcaaaggaaaagccaagtgagacgggctctgggacc扩增子14TTF160ccaacccagacccgcgc正向引物15cgcccatgccgctcatgttca反向引物16cccgccatctcccgcttcatg探针*17ccaacccagacccgcgcttccccgccatctcccgcttcatgggcccggcgagcggcatgaacatgagcggcatgggcg扩增子18DSG361gcagagaaggagaagataactcaa正向引物19actccagagattcggtaggtga反向引物20attgccaagattacttcagattacca探针*21gcagagaaggagaagataactcaaaaagaaacccaattgccaagattacttcagattaccaagcaacccagaaaatcacctaccgaatctctggagt扩增子22CDH1762tccctcggcagtggaagctta正向引物23tcctcaaactctgtgtgcctggta反向引物24ccaaaatcaatggtactcatgcccgactg探针*25tccctcggcagtggaagcttacaaaacgactgggaagtttccaaaatcaatggtactcatgcccgactgtctaccaggcacacagagtttgagga扩增子26MG63agttgctgatggtcctcatgc正向引物27cacttgtggattgattgtcttgga反向引物28ccctctcccagcactgctacgca探针*28agttgctgatggtcctcatgctggcggccctctcccagcactgctacgcaggctctggctgccccttattggagaatgtgatttccaagacaatcaatccacaagtg扩增子30PDEF64cgcccacctggacatctgga正向引物31cactggtcgaggcacagtagtga反向引物32gtcagcggcctggatgaaagagcgg探针*33cgcccacctggacatctggaagtcagcggcctggatgaaagagcggacttcacctggggcgattcactactgtgcctcgaccagtg扩增子34WT165gcggagcccaatacagaatacac正向引物35cggggctactccaggcaca反向引物36tcagaggcattcaggatgtgcgacg探针*37gcggagcccaatacagaatacacacgcacggtgtcttcagaggcattcaggatgtgcgacgtgtgcctggagtagccccg扩增子38PSCA66ctgttgatggcaggcttggc正向引物39ttgctcacctgggctttgca反向引物40gcagccaggcactgccctgct探针*41ctgttgatggcaggcttggccctgcagccaggcactgccctgctgtgctactcctgcaaagcccaggtgagcaa扩增子42F567tgaagaaatatcctgggattattca正向引物43tatgtggtatcttctggaatatcatca反向引物44acaaagggaaacagatattgaagactc探针*45tgaagaaatatcctgggattattcagaatttgtacaaagggaaacagatattgaagactctgatgatattccagaagataccacata扩增子46KLK368cccccagtgggtcctcaca正向引物47aggatgaaacaagctgtgccga反向引物48caggaacaaaagcgtgatcttgctgg探针*49cccccagtgggtcctcacagctgcccactgcatcaggaacaaaagcgtgatct扩增子50

 

tgctgggtcggcacagcttgtttcatcctβ肌动蛋白69gccctgaggcactcttcca正向引物51cggatgtccacgtcacacttca反向引物52cttccttcctgggcatggagtcctg探针*53gccctgaggcactcttccagccttccttcctgggcatggagtcctgtggcatccacgaaactaccttcaactccatcatgaagtgtgacgtggacatccg扩增子54PBGD70ccacacacagcctactttccaa正向引物55tacccacgcgaatcactctca反向引物56aacggcaatgcggctgcaacggcggaa探针*57ccacacacagcctactttccaagcggagccatgtctggtaacggcaatgcggctgcaacggcggaagaaaacagcccaaagatgagagtgattcgcgtgggta扩增子58

*探针是5′FAM-3′BHQ1-TT

分析热图中的标准化的Ct值,揭示了乳房和前列腺标记的高特异性,结肠、肺和卵巢的中等特异性,和胰标记的稍微更低的特异性。组合标准化的qRTPCR数据和计算精制,提高了标记组的性能。从组合的标准化的qRTPCR数据与算法得到结果,并确定qRTPCR测定的准确度。

讨论。

在该实施例中,在原发性肿瘤上使用基于微阵列的表达概况分析,以鉴别用于转移的候选标记。原发性肿瘤可以用于发现转移的起源肿瘤标记的事实,与最近的几项发现相一致。例如,Weigelt及同事已经表明,原发乳房肿瘤的基因表达概况在远距离转移中保持。Weigelt等(2003)。Italiano及同事发现,通过IHC评估的EGFR状态在80原发结肠直肠肿瘤和80相关转移中类似。Italiano等(2005)。80个中仅5个表现出EGFR状态的不一致性。Italiano等(2005)。Backus及同事鉴别出了用于检测乳腺癌转移的推定标记,其中使用乳房和其它组织的全基因组的基因表达分析,并证实乳腺珠蛋白和CK 19以90%灵敏度和94%特异性检测乳房警戒淋巴结中临床上起作用的转移。Backus等(2005)。

使用原发组织进行的基于微阵列的研究证实了已知标记的特异性和灵敏度。结果,除了F5以外,使用的所有标记都对这里研究的组织具有高特异性。Argani等(2001;Backus等(2005);Cunha等(2005);Borgono等(2004);McCarthy等(2003);Hwang等(2004);Fleming等(2000);Nakamura等(2002);和Khoor等(1997)。最近的研究使用IHC确定,PSCA在前列腺癌转移中超表达。Lam等(2005)。Dennis等(2002)也证实,PSCA可以用作胰和前列腺的起源肿瘤标记。如本文所显示的,在RNA水平发现有些前列腺组织中PSCA的强表达,但是由于在测定中包含PSA,所以现在可以分离前列腺和胰癌。该研究的一项新发现是,使用F5作为胰起源组织的互补(与PSCA互补)标记。在微阵列数据集(含有原发组织)和qRTPCR数据集(含有FFPE转移)中,F5与PSCA互补(图4和表3)。

表3可行性数据

以前的研究人员已经使用IHC或微阵列生成了CUP测定。Su等(2001);Ramaswamy等(2001);和Bloom等(2004)。最近,已经将SAGE与小qRTPCR标记组相结合。Dennis(2002);和Buckhaults等(2003)。该研究首次组合了基于微阵列的表达概况分析和小组qRTPCR测定。使用原发组织的微阵列研究鉴别出了一些、但不是所有与以前通过SAGE研究鉴别出的标记相同的起源组织标记。一些研究已经证实,基于SAGE和DNA微阵列的概况分析数据之间存在中等一致性,且该相关性对于具有更高表达水平的基因提高。van Ruissen等(2005);和Kim(2003)。例如,Dennis及同事鉴别出了PSA、MG、PSCA和HUMSPB,而Buckhaults及同事(Dennis等(2002))鉴别出了PDEF。使用qRTPCR执行CUP测定是优选的,因为它是有力的技术,且可能具有胜过IHC的性能优点。Al-Mulla等(2005);和Haas等(2005)。如本文所示,通过在一步反应中使用基因-特异性的引物,改进了qRTPCR规程。这首次证实了基因-特异性的引物在含有FFPE组织的一步qRTPCR反应中的应用。其它研究人员已经进行了2步qRTPCR(在一个反应中合成cDNA,随后qPCR),或已经使用随机六聚体或截短的基因-特异性的引物。Abrahamsen等(2003);Specht等(2001);Godfrey等(2000);Cronin等(2004);和Mikhitarian等(2004)。

实施例2

CUP FFPE总RNA分离规程

(高纯试剂盒目录号3270289)

目的:

从FFPE组织分离总RNA

程序:

工作溶液的制备

1.试剂盒中的蛋白酶K(PK)

将冻干物溶于4.5ml洗脱缓冲液。等分试样且保藏于-20℃,稳定12个月。

PK-4x250mg(目录号3115852)

将冻干物溶于12.5ml洗脱缓冲液(1x TE缓冲液(pH7.4-7)。等分试样且保藏于-20℃。

2.洗涤缓冲液I

将60ml无水乙醇加入洗涤缓冲液I,在室温保藏。

3.洗涤缓冲液II

将200ml无水乙醇加入洗涤缓冲液II,在室温保藏。

4.DNA酶I

将冻干物溶于400μl洗脱缓冲液。等分试样且保藏于-20℃,稳定12个月。

将石蜡块切片约30-45分钟,12块(12块x2管=24管)

从块上切下的切片应当立即为RNA提取进行处理

1.在切片机上使用干净的锋利刀片从修剪过的组织块切割6X10微米厚切片(大小3-4x5-10mm)。

注:新块-抛弃蜡切片,直到得到组织切片。使用的块-抛弃前3个组织切片

2.立即将切割的组织置于1.5mL微量离心管(microfuge tube)中,且盖紧盖子,以使水分最小化。

3.推荐基于表4所示的肿瘤大小,取切片的数目。

表4

脱蜡约30-45分钟

1.将1.0ml二甲苯加入每个样品中,剧烈涡旋10-20秒,且在室温温育2-5分钟。全速离心2分钟。小心地取出上清液。

注:如果组织表现得漂浮,则额外离心2分钟。

2.重复步骤1。

3.全速离心2分钟。取出上清液。

4.加入1ml无水乙醇,且剧烈涡旋1分钟。全速离心2分钟。取出上清液。

5.重复步骤4。

6.在纸巾上简短地吸干管,以去除乙醇残余物。

7.在55℃烘箱中干燥组织沉淀5-10分钟。

注:关键的是,完全去除乙醇,并彻底干燥沉淀,残余的乙醇会抑制PK消化。

注:如果PK是在-20C,则在室温加温20-30分钟。

RNA提取约2.5-3小时

1.向一个组织沉淀中加入100μl组织裂解缓冲液、16μl10%SDS和80μl蛋白酶K工作溶液,简短地涡旋几次,且在400rpm摇动下,在55℃温育2小时。

2.加入325μl结合缓冲液和325μl无水乙醇。通过上下移液,轻轻混合。

3.将裂解物全速离心2分钟。

4.组合过滤器管和收集管(12个管),将裂解物上清液移进过滤器中。

5.在8000rpm离心30秒,并抛弃流过物。

注:如果需要用另外2种组织沉淀制剂合并RNA,则可以重复步骤4-5。

6.重复在8000rpm离心30秒,以干燥过滤器。

7.向柱加入500μl洗涤缓冲液I工作溶液,且在8000rpm离心15-30秒,抛弃流过物。

8.加入500μl洗涤缓冲液II工作溶液。在8000rpm离心15-30秒,抛弃流过物。

9.加入300μl洗涤缓冲液II工作溶液,在8000rpm离心15-30秒,抛弃流过物。

10.在最大速度离心高纯过滤器2分钟。

11.将高纯过滤器管置于新鲜的1.5ml管中,且加入90μl洗脱缓冲液。在室温温育1-2分钟。在8000rpm离心1分钟。

DNA酶I处理约1.5小时

12.向洗脱物中加入10μl 10x DNA酶温育缓冲液和1.0μl DNA酶I工作溶液,且混合。在37℃温育45分钟(或2.0μl DNA酶I30分钟)。

13.加入20μl组织裂解缓冲液,18μl 10% SDS和40μl蛋白酶K工作溶液。简短涡旋。在55℃温育30分钟(30-60分钟.)。

14.加入325μl结合缓冲液和325μl无水乙醇。混合,并移液入新鲜的带有收集管的高纯过滤器管(12个管)。

15.在8000rpm离心30秒,并抛弃流过物。

16.重复在8000rpm离心30秒,以干燥过滤器。

17.向柱加入500μl洗涤缓冲液I工作溶液,在8000rpm离心15秒,抛弃流过物。

18.加入500μl洗涤缓冲液II工作溶液。在8000rpm离心15秒,抛弃流过物。

19.加入300μl洗涤缓冲液II工作溶液,在8000rpm离心15秒,抛弃流过物。

20.在最大速度离心高纯过滤器2分钟。

21.将高纯过滤器管置于新鲜的1.5ml管中,加入50μl洗脱缓冲液;在室温温育1-2分钟。在8000rpm离心1分钟,以收集洗脱的RNA。

22.全速离心洗脱物2分钟,并将上清液转移至新管,不扰动在底部的玻璃纤维。

23.取260/280 OD读数,且稀释至50ng/μl。保藏在-80℃。

CUP ASR测定规程(ABI 7900)

目的:使用qRTPCR来确定CUP样品的起源组织

对照设置:

1.阳性对照(参考表5和图7板设置中的板C)

表5 IVT的系列稀释-将5μl 1X108稀释入470μl H2O+25μl10000 rRNA

 

IVT对照CE/μl样品Bkgd rRNAB肌动蛋白100E+055042525CDH17100E+055042525DSG3100E+055042525F5100E+055042525Hump100E+055042525MG100E+055042525PBGD100E+055042525PDEF100E+055042525PSCA100E+055042525TTF1100E+055042525WT1100E+055042525

1E6.表5.将50,000CE/μl rRNA稀释至500CE/μl-5μl50,000CE/μl+495μl H2O

每个strip管等分试样10μl(2个板);将混合物置于-80℃备用。

2.标准曲线(参考表6和图7板设置中的板C)

步骤1:标准曲线完全如表6所示设置。

 

IVT对照CE/μl样品BkgdrRNAB肌动蛋白-1100E+075042525B肌动蛋白-2100E+065042525B肌动蛋白-3100E+055042525B肌动蛋白-4100E+045042525B肌动蛋白-5100E+035042525PBGD-1100E+075042525PBGD-2100E+065042525PBGD-3100E+055042525PBGD-4100E+045042525PBGD-5100E+035042525

表7.储备溶液-1X108IVT。将50,000CE/μl rRNA稀释至500CE/μl-5μl 50,000 CE/μl+495μl H2O

每个strip管等分试样10μl(2个板);将混合物置于-80℃备用。

酶混合物:

1.主混合物:酶(Tth)/抗体(TP6-25),见表7。

表7

 

试剂2x酶Tth(5U/μl)600.00抗体:TP6-25(1mg/ml)600.00300.00总计1500.00

等分试样500μl/管,且在-20℃冷冻。

CUP主混合物:

1.2.5X CUP主混合物(表8-11):

表8

 

ml5x添加剂2.5x浓度0.501M Tris-Cl pH 85mM1.2540mg/ml牛清蛋白500μg/ml37.501M海藻糖原液375mM2.520%v Tween 200.50%7.00ddH2O48.75

允许试剂完全混合>15分钟

表9

 

ml5x添加剂2.5x浓度12.501M N-二(羟乙基)甘氨酸/氢氧化钾pH8.2125mM5.755M乙酸钾287.5mM20.00甘油(V x D=M->19.6x1.26=24.6g)20%1.25500mM氯化镁6.25mM1.75500mM氯化锰8.75mM5.00ddH2O46.25

允许试剂完全混合>15分钟;合并上述混合物至无菌容器中-加入下述

表10

 

ml5x添加剂2.5x浓度1.25100mM dATP1.25mM1.25100mM dCTP1.25mM1.25100mM dTTP1.25mM1.25100mM dGTP1.25mM100.00

允许试剂完全混合>15分钟;等分试样1.8ml/管,且在-20℃冷冻

表11

 

引物/探针原液(μM)FC(μM)μl正向引物10010100.0反向引物10010100.0探针(5′FAM/3′BHQ1-TT)100440.0DI水760.0总计1000.0

引物和探针混合物:

等分试样250μl/管,且在-20℃冷冻

反应混合物:

1.CUP主混合物(CMM):(参考表12-14和图7板设置中的板A)

表12

 

试剂FCX1(10μl)4502.5x CUP主混合物1X4.001800ROX1x0.20902x TthAb混合物2U1.004502.31035总计7.503375

优选地,每个板每次运行具有仅仅356个反应:12个样品使用12个标记(288个反应,每个标记一式两份)+10标准曲线对照一式两份(20)+每个标记的2个阳性和2个阴性对照(4x12=48)

用水调节样品体积-4.3μl样品MAx;充分混合

表13

 

试剂FCX1(10μl)34引物10μM/探针4μM0.5μM/0.2μM0.5017CMM1x7.50255总计8.00272

2.ToO标记:充分混合

表14

 

试剂FCX1(10μl)44引物10μM/探针4μM0.5μM/0.2μM0.5022CMM1x7.50330总计8.00352

3.β-肌动蛋白和PBGD标记:充分混合

样品方案:

表15

 

样品样品ID浓度加入的水=50ng/μlA1A2A3A4A5A6A7A8A9A10A11A12

1.CUP样品:12个样品在96孔板中:A1-A12(参考表16和图7板设置中的板B);等分试样50μl 50ng/μl(2μl/rxn)

装载板:

1.384孔板设置:(参考图7板设置中的板D)

将2μl样品和8μl CMM装载上板(样品=50ng/μl)

将4μl样品和6μl CMM装载上板(样品=25ng/μl)

密封板,并标记。在2000rpm离心1分钟。

ABI 7900HT设置:置于ABI 7900中。选择程序“CUP 384”,且点击开始。

表16

 

热循环条件95C x 60s55C x 2m斜升5%70C x 2m40个下述循环95C x 15s58C x 30s

ROX开启

分析数据,提取Ct,并插入算法。

实施例3

CUP算法

基于最初选择的起源组织,将HPT、MGB、PDEF、PSA、SP-B、TFF、DSG、WT1、PSCA和F5的肌动蛋白标准化的ΔCt值置入6个集合。分别从每个ΔCt减去常数9.00、11.00、7.50、5.00、10.00、9.50、6.50、8.00、9.00和8.00。然后,对于每个样品,选择来自6个集合(HPT、(MGB或PDEF)中最小者、PSA、(SP-B、TFF或DSG)中最小者、WT1和(PSCA或F5)中最小者)中的每一个的最小CT值,作为该组的代表变量。

使用线性判别,将这些变量和转移部位用于分类样品。应使用MASS库函数‘1da’(Venables等(2002)in R(2.0.1版),从训练数据构建2个不同模型,一个是男性的,且一个是女性的。然后使用男性或女性模型的′预测′函数,计算每个ToO的后验概率。

在男性模型中使用的变量是HPT、PSA、(′SP-B′、′TFF′、′DSG3′)中最小者、(′PSCA′、′F5′)中最小者和转移部位。转移部位类别具有与结肠、肺、卵巢和所有其它组织相对应的4个水平。就女性模型而言,变量是HPT、(′MGB′、′PDEF′)中最小者、(′SP-B′、′TFF′、′DSG3′)中最小者、WT1、(′PSCA′、′F5′)中最小者和转移部位。

实例R代码:

#Training the male model

dat.m<-CUP2.MIN.NORM[,c

(′HPT′,′PSA′,′SP.B.TTF.DSG3′,′PSCA.F5′,′Class′,′background′)]

CUP.lda.m<-lda(Class-.,dat.m,prior=c(0,0.09,0,23,0.43,0,0.16,0.02)/sum(c(0,0.09,0.23,0.43,0,0.16,0.02)))

#Training the female model

dat.f<-CUP2.MIN.NORM[,c

(′HPT′,′MFB.PDEF′,′SP.B.TTF.DSG3′,′WT1′,′PSCA.F5′,′Class′,′background′)]CUP.lda.f<-1da(Class~.,dat.f,prior=c(D.03,0.09,0.23,0.43,0.04,0.16,0)/sum(c(0.03,0.09,0.23,0.43,0.04,0.16,0)))

#if unknownsample(i)is_male

predict(CUP.lda.m,CUP2.MIN.NORM.TEST[i,J)

#if unknown sample(i)is female

predict(CUP.lda.f,CUP2.MIN.NORM.TEST[i,l)

为了运行该代码,称作CUP2.MIN.NORM的数据帧需要含有训练数据,其具有对如上所述的每个起源组织集合计算的最小值。

类别对应着起源组织,且背景对应着上述转移部位。

试验数据可以包含在CUP2.MIN.NORM.TEST中,且使用预测函数,可以测试在行i处的特定样品。另外,试验数据必需是与训练集合相同的格式,并具有也应用于它的最小值调节。

实施例4

CUP分辨的样品

对比48个CUP分辨的和未分辨的样品,以确定与真实CUP样品的相关性。使用的方法是在实施例1-3中所述的那些方法。得到的结果如表17所示。测试了未分辨的CUP的11个样品,对8个样品进行诊断,3个属于其它类别。

表17

实施例5

CUP测定界限

图8描述了使用实施例1-3所述方法得到的结果,以确定CUP测定的界限。测试了一定RNA浓度范围的测定性能,且发现CUP测定在100-12.5ng RNA范围内是有效的。

实施例6

qRTPCR测定

材料和方法。用于微阵列分析的冷冻组织样品。共700个冷冻的原发人组织用于基因表达微阵列概况分析。从许多学术机构得到样品,包括华盛顿大学(St.Louis,MO),Erasmus医学中心(Rotterdam,荷兰),和商业组织库公司,包括Genomics Collaborative,Inc(Cambridge,MA),Asterand(Detroit,MI),Oncomatrix(LaJolla,CA)和ClinomicsBiosciences(Pittsfield,MA)。对于每个样品,还收集患者人口统计、临床和病理学信息。评论每个样品的组织病理学特征,以证实诊断,和估计样品保藏和肿瘤含量。

RNA提取和Affymetrix GeneChip杂交。将含有大于70%肿瘤细胞的冷冻癌样品、良性和正常样品解剖,且用机械匀浆器(UltraTurrex T8,德国)在Trizol试剂(Invitrogen,Carlsbad,CA)中匀浆。通过下述从冷冻组织分离RNA的标准Trizol规程(Invitrogen,Carlsbad,CA),在Trizol试剂中匀浆化组织。离心后,收集顶层液相,且用-20℃的异丙醇沉淀总RNA。用75%乙醇洗涤RNA沉淀,溶于水,且保藏在-80℃备用。

用Agilent 2100生物分析仪RNA 6000 Nano Assay(AgilentTechnologies,Palo Alto,CA),检查RNA的质量。根据标准的生产商规程,制备标记的cRNA,且与含有共计22,000探针集合的高密度寡核苷酸阵列Hu133A基因芯片(Affymetrix,Santa Clara,CA)杂交。使用Affymetrix规程和扫描仪,扫描阵列。对于随后的分析,每个探针集合视作分开的基因。使用Affymetrix基因芯片分析软件MAS 5.0,计算每个基因的表达值。所有芯片满足3个质量控制标准:阵列的百分比“存在”信号大于35%,当换算到600的总靶强度时换算因子小于12,且平均背景水平小于150。

标记候选物选择。关于肺、结肠、乳房、卵巢和前列腺组织的起源组织(ToO)标记候选物的选择,在覆盖共682个来自乳房、结肠、肺、卵巢、前列腺的正常、良性和癌性组织的RNA样品中,测量探针集合的表达水平。基于统计学查询的数目,选择组织特异性的标记候选物。

为了产生胰候选物,使用13个原发胰管腺癌、5个正常胰和98个肺、结肠、乳房和卵巢癌样品的基因表达概况来选择胰腺癌标记。进行2种查询。在第一种查询中,生成含有14547个基因的数据集,所述基因在胰样品中有至少2次“存在”信号。鉴别出通过T-检验(p<0.05)鉴定为与正常相比在胰癌中超表达的共2736个基因。选择在11百分位的胰癌中的最低表达是在结肠和肺癌中的最高值的至少2倍的基因,从而产生45个探针集合。作为最后一步,选择最高表达是在结肠、肺、乳房和卵巢癌中的最高表达的至少2倍的6个基因。在第二种查询中,生成含有4654个探针集合的数据集,所述探针集合在所有乳房、结肠、肺和卵巢样品中有最多2次“存在”信号。选择在胰正常和癌样品中具有至少2次“存在”信号的共160个基因。在160个基因中,在对比它们在胰和正常组织之间的表达水平后,选择10个基因。合并2次胰查询的结果。

除了基因表达概况分析外,从文献中选择少数标记。合并所有查询的结果,以产生每种组织类型的ToO标记候选物的短列表。估计每种标记的灵敏度和特异性。将表现出最好的通过它们的起源区分组织的能力的标记,被推荐用于基于标记冗余和互补性的RT-PCR检验,

已知起源和CUP组织的FFPE转移癌。从许多商业卖主获得已知起源的共386 FFPE转移癌(III-IV期)和24FFPE前列腺原发腺癌,包括Proteogenex(Los Angeles,CA),Genomics Collaborative,Inc.(Cambridge,MA),Asterand(Detroit,MI),Ardais(Lexington,MA)和Oncomatrix(La Jolla,CA)。从Albany医学院(Albany,NY)得到已知原发和CUP组织的48个转移癌的独立集合。对于每个样品,收集患者人口统计、临床和病理学信息。评论每个样品的组织病理学特征,以证实诊断,和估计样品保存和肿瘤含量。就转移样品而言,基于患者的临床历史和转移癌与对应原发癌相比的组织学评价,明确地确立转移癌的诊断和ToO。

从FFPE样品分离RNA。从石蜡组织切片分离RNA如描述在高纯RNA石蜡试剂盒手册(Roche)中的那样,具有下述改进。根据包埋的转移灶的大小,将石蜡包埋的组织样品切片(2-5mm=9X10μm,6-8mm=6X10μm,8-≥10mm=3X10μm)。如试剂盒手册所述,将切片脱蜡,在55℃烘箱中干燥组织沉淀5-10分钟,且重新悬浮于100μl组织裂解缓冲液,16μl10%SDS和80μl蛋白酶K。涡旋样品,且在设定为400rpm的热混合仪中在55℃温育2小时。根据高纯RNA石蜡试剂盒手册,进行随后的样品加工。通过从分光光度计得到的OD 260/280读数,定量样品,且将样品稀释至50ng/μl。将分离的RNA在-80℃保藏在无RNA酶的水中备用。

用于标记候选物预筛选的qRTPCR。根据生产商的说明书(Invitrogen,Carlsbad,CA),使用Superscript II反转录酶,用随机六聚体反转录来自每个样品的1μg总RNA。使用Primer Express软件(Applied Biosystems,Foster City,CA),设计测试的基因标记候选物和对照基因ACTB的引物和MGB-探针,或者使用ABI Assay-on-Demand(Applied Biosystems,Foster City,CA)。测试所有内部(in house)设计的引物和探针的大于90%的最佳扩增效率。在20ml反应混合物中进行RT-PCR扩增,所述反应混合物含有200ng模板cDNA,2x通用PCR主混合物(10ml)(Applied Biosystems,FosterCity,CA),500nM正向和反向引物,和250nM探针。在ABI PRISM7900HT序列检测系统(Applied Biosystems,Foster City,CA)上进行反应。循环条件是:AmpErase UNG激活在50℃2分钟,聚合酶激活在95℃ 10分钟和50个在95℃15秒和退火温度(60℃)60秒的循环。在每个测定中,为目标基因和对照基因一式两份地包括“无模板”对照和模板cDNA。将每个靶基因的相对表达表示为ΔCt,它等于靶基因Ct减去对照基因(ACTB)的Ct。

最优化的一步qRTPCR。适当mRNA参照序列登记号结合Oligo6.0用于开发CUP测定(肺标记:人表面活性剂、肺-相关蛋白B(HUMPSPBA)、甲状腺转录因子1(TTF1)、桥粒芯糖蛋白3(DSG3),结肠直肠标记:钙粘着蛋白17(CDH17),乳房标记:乳腺珠蛋白(MG)、前列腺-衍生的ets转录因子(PDEF),卵巢标记:wilms瘤1(WT1),胰标记:前列腺干细胞抗原(PSCA)、凝固因子V(F5)、前列腺标记激肽释放酶3(KLK3))和持家测定β肌动蛋白(β-肌动蛋白),羟甲基胆色烷合酶(PBGD)。在表2中列出了最优化的一步qRT-PCR测定的基因特异性的引物和水解探针(SEQ ID NO:11-58)。通过设计外显子-内含子剪接位点周围的测定,排除基因组DNA扩增。在5′核苷酸处用FAM作为报道染料、且在3′核苷酸处用BHQ1-TT作为内部猝灭染料,标记水解探针。

在ABI Prism 7900HT序列检测系统(Applied Biosystems)上,在384孔板中进行基因-特异性的RNA的定量。对于每个热循环仪运行,放大校准器和标准曲线。每个标记的校准器由在来自大鼠肾的载体RNA中以1X105拷贝稀释的靶基因体外转录物组成。持家标记的标准曲线由在来自大鼠肾的载体RNA中以1X107、1X105和1X103拷贝系列稀释的靶基因体外转录物组成。在每个测定运行中也包括无靶对照,以确保没有环境污染。所有样品和对照都一式两份运行。使用一般实验室用试剂,在10μl反应物中进行qRTPCR,所述反应物含有:RT-PCR缓冲液(50nM N-二(羟乙基)甘氨酸/KOH pH8.2,115nM KAc,8%甘油,2.5mM MgCl2,3.5mM MnSO4,0.5mM每种dCTP、dATP、dGTP和dTTP),添加剂(2mM Tris-Cl pH 8,0.2mM牛清蛋白,150mM海藻糖,0.002%Tween20),酶混合物(2U Tth(Roche),0.4mg/μl Ab TP6-25),引物和探针混合物(0.2μM探针,0.5μM引物)。遵从下述循环参数:1个在95℃1分钟的循环;1个在55℃ 2分钟的循环;斜升5%;1个在70℃2分钟的循环;和40个在95℃ 15秒、58℃ 30秒的循环。完成PCR反应后,在ABI 7900HT Prism软件中设定基线和阈值,且将计算的Ct值输出到Microsoft Excel中。

一步对两步反应。为了对比两步和一步RT-PCR反应,每个反应使用100ng随机六聚体或基因特异性的引物,进行两步反应的第一链合成。在第一步中,将11.5μl混合物-1(引物和1ug总RNA)加热至65℃ 5分钟,然后在冰上冷却。将8.5μl混合物-2(1x缓冲液,0.01mMDTT,0.5mM每种dNTP’s,0.25U/μl 10U/μl Superscript III)加入混合物-1,在50℃温育60分钟,然后在95℃温育5分钟。将cDNA保藏在-20℃备用。如上所述进行两步反应的第二步的qRTPCR,循环参数如下:1个在95℃ 1分钟的循环;40个在95℃ 15秒、58℃ 30秒的循环。完全如前段所述,进行一步反应的qRTPCR。一步和两步反应二者都在100ng模板(RNA/cDNA)上进行。完成PCR反应后,在ABI 7900HT Prism软件中设定基线和阈值,且将计算的Ct值输出到Microsoft Excel中。

算法开发。使用R语言(2.1.1版)中的MASS(Venables和Ripley)库函数‘lda’,构建线性辨别式函数。使用的模型依赖于提取转移灶的组织、以及患者的性别。当遇到肺、结肠或卵巢转移部位时,对于与转移部位等价的类别,将类别先验可能性设定为0。此外,在男性患者中的乳房和卵巢类别的先验可能性设定为0,而在女性患者中,前列腺类别的先验可能性设定为0。在模型中使用的所有其它先验可能性是等价的。此外,每个样品的分类基于通过每个类别的模型确定的最高后验概率。为了估计模型性能,进行leave-one-out交叉验证。除此以外,将数据集随机地分成两半,分成训练和试验集合,同时保持每个类别之间的比例关系。重复该随机分离3次。

结果。这个研究的目的是,开发用于预测转移癌起源组织的qRTPCR测定。实验工作由2大部分组成。第一个部分包括组织-特异性的标记候选物推荐,它们在FFPE转移癌组织上的验证,和测定的10个标记的选择(图9A)。第二个部分包括qRTPCR测定最优化,随后在另一组FFPE转移癌上进行测定,建立预测算法,它的交叉验证和在独立样品集合上的验证(图9B)。

样品特征。来自共700个冷冻原发组织样品的RNA用于基因表达概况分析和组织类型特异性基因鉴别。样品包括545个原发癌(29 肺、13 胰、315 乳房、128 结肠直肠、38 前列腺、22 卵巢)、37个良性病变(1 肺、4 结肠直肠、6 乳房、26 前列腺)和118个(36 肺、5 胰、36 结肠直肠、14 乳房、3 前列腺、24 卵巢)正常组织。

在研究中共使用了375个已知起源转移癌(III-IV期)和26个前列腺原发腺癌样品。转移癌源自肺、胰、结肠直肠、卵巢、前列腺以及其它癌症。“其它”样品类别由源自肺、胰、结肠、乳房、卵巢和前列腺以外的组织的转移灶组成。患者的特征总结在表18中。

表18

                                                 转移CUP               样品集合

总数                                             401                   48

平均年龄                                         57.8±11*             62.13±11.7

性别     女性                                    241                   20

         男性                                    160                   28

起源组织

    肺                                           65                    9

    胰                                           63                    2

    结肠直肠                                     61                    4

    乳房                                         63                    5

    卵巢                                         82                    2

    前列腺                                       27                    2

    肾                                           8                     8

    胃                                           7                     0

    其它**                                       25                    5

    未知原发癌                                                         11

组织病理学诊断

    腺癌,中等/良好分化                          306                   27

    腺癌,不良分化                               49                    4

    鳞状细胞癌                                   16                    5

    不良分化的癌                                 16                    10

    小细胞癌                                     3

    黑素瘤                                       5

    淋巴瘤                                       3

    肝细胞癌                                     2

    间皮瘤                                       1

    其它***                                      14                    2

转移部位

    淋巴结                                         73          1

    脑                                             17          14

    肺                                             20          7

    肝                                             75          11

    骨盆区(卵巢、膀胱、输卵管)                      53          2

    腹部(网膜(网膜、肠系膜、结肠、腹膜)             91          5

    其它(皮肤、甲状腺、胸壁、脐)                    44          8

    未知                                           2

    原发(前列腺)                                   26

*26位患者的年龄未知

**食管、膀胱、胸膜、肝胆囊、胆管、喉、咽、非何杰金淋巴瘤

***小细胞、间皮瘤、肝细胞、黑素瘤、淋巴瘤

将样品分成2个集合:用于验证标记候选物的组织-特异性差别表达的验证集合(205样品),和用于检验最优化的一步qRTPCR程序和训练预测算法的训练集合(260样品)。第一个205个样品的集合包括25肺、41胰、31结肠直肠、33乳房、33卵巢、1前列腺、23其它癌转移和18前列腺原发癌。第二个集合由260个样品组成,包括56肺、43胰、30结肠直肠、30乳房、49卵巢、32其它癌转移和20原发前列腺癌。2个集合中的64个样品,包括16肺、21胰、15其它转移和12前列腺原发癌,来自相同患者。

从Albany医学院得到的独立样品集合包含33 CUP样品,其中的22个被提议是原发的,且15个是已知起源转移癌。对于被提议原发的的CUP,基于形态特征和/或用一组IHC标记检验的结果给出诊断。在表18中显示了患者人口统计、临床和病理学特征。

标记候选物选择。分析5种原发组织类型(肺、结肠、乳房、卵巢、前列腺)的基因表达概况,导致用于qRTPCR检验的13个组织特异性标记候选物的推荐。在以前的原位癌研究中,已经鉴别出了最好的候选物。Argani等(2001);Backus等(2005);Cunha等(2005);Borgono等(2004);McCarthy等(2003);Hwang等(2004);Fleming等(2000);Nakamura等(2002);和Khoor等(1997)。除了分析微阵列数据外,从文献中选择2个标记,包括互补的肺鳞状细胞癌标记DSG3和乳房标记PDEF。Backus等(2005)。微阵列数据证实了这些标记的高灵敏度和特异性。

一个特殊的方法用于鉴别胰特异性的标记。首先,分析了5个胰标记候选物:前列腺干细胞抗原(PSCA)、丝氨酸蛋白酶抑制剂,进化枝A成员1(SERPINA1)、细胞角蛋白7(KRT7)、基质金属蛋白酶11(MMP11)和粘蛋白4(MUC4)(Varadhachary等(2004);Argani等(2001);Jones等(2004);Prasad等(2005);和Moniaux等(2004)),其中使用DNA微阵列和一组13个胰管腺癌,5个正常胰组织,和98个来自乳房、结肠直肠、肺和卵巢肿瘤的样品。仅PSCA表现出在高特异性(91/98或93%被正确地鉴别为非胰起源)的中等灵敏度(检测了6/13或46%的胰肿瘤)。相反,KRT7、SERPINA1、MMP11和MUC4分别表现出在特异性分别为66%、91%、82%和81%的38%、31%、85%和31%的灵敏度。这些数据与在27个胰起源转移和39个非胰起源转移上为所有标记进行的qRTPCR十分一致,例外是MMP11,它在qRTPCR和转移中表现出更差的灵敏度和特异性。总之,在骤冻的、原发组织上的微阵列数据可以用作标记使用qRTPCR鉴别FFPE转移为胰起源的能力的良好指示物,但是其它标记可能对最佳性能有用。

胰管腺癌从管上皮细胞发展而来,所述管上皮细胞在正常胰中仅占所有胰细胞的小百分比(其中腺泡细胞和胰岛细胞占大多数)。此外,胰腺癌组织含有显著量的邻近正常组织。Prasad等(2005);和Ishikawa等(2005)。因此,为在胰腺癌中比在正常胰细胞中升高的基因,富集候选胰标记。第一种查询方法返回6个探针集合:凝固因子V(F5)、类似于FK506结合蛋白的推定蛋白FLJ22041(FKBP10)、β 6整联蛋白(ITGB6)、转谷氨酰胺酶2(TGM2)、异质核内核糖核蛋白A0(HNRP0)和BAX δ(BAX)。第二种查询方法(细节见材料和方法部分)返回8个探针集合:F5、TGM2、配对-样同源域转录因子1(PITX1)、三件套蛋白同工型mRNA(TRIO)、p73H的mRNA(p73)、MGC:10264的一种未知蛋白(SCD)和密蛋白18的2个探针集合。

选择共23个组织特异性的标记候选物,用于进一步通过qRT-PCR在转移癌FFPE组织上进行RT-PCR验证。标记候选物在来自肺、胰、结肠、乳房、卵巢、前列腺和前列腺原发癌的205 FFPE转移癌上测试。

表19  提供了为RT-PCR验证选择的组织特异性标记的基因符号,并也总结了用这些标记进行的检验的结果。

表19

基于它们的交叉反应性、在对应转移组织中的低表达水平或冗余,在23个测试的标记中排除13个。选择10个标记用于最后的测定形式。肺标记是人表面活性剂肺-相关蛋白B(HUMPSPB)、甲状腺转录因子1(TTF1)和桥粒芯糖蛋白3(DSG3)。胰标记是前列腺干细胞抗原(PSCA)和凝固因子V(F5),且前列腺标记是激肽释放酶3(KLK3)。结肠直肠标记是钙粘着蛋白17(CDH17)。乳房标记是乳腺珠蛋白(MG)和前列腺-衍生的Ets转录因子(PDEF)。卵巢标记是Wilms瘤1(WT1)。在图10中显示了选择的标记在不同转移组织中中的平均标准化相对表达值。

使用FFPE组织最优化样品制备和qRT-PCR。接着,在检查标记组性能之前,使用固定的组织最优化RNA分离和qRTPCR方法。首先,分析了将蛋白酶K温育时间从16小时减小至3小时的作用。对产量没有作用。但是,当使用更短的蛋白酶K步骤时,有些样品表现出更长的RNA片段(图11A,B)。例如,当RNA是从1年龄块(C22)中分离时,在电泳图谱中没有观察到差异。但是,当RNA是从5年龄块(C23)中分离时,如通过肩上的峰评估的,当使用更短的蛋白酶K消化时,观察到更大部分的更高分子量RNA。当加工其它样品时,该趋势通常会保持,无论FFPE转移的起源器官。总之,缩短蛋白酶K消化时间不牺牲RNA产量,且可能辅助分离更长的、更低降解的RNA。

接着,对比了3种不同的反转录方法:使用随机六聚体的反转录、随后用qPCR(2步),使用基因-特异性的引物的反转录、随后用qPCR(2步),和使用基因-特异性的引物的一步qRTPCR。从11个转移分离RNA,并横过3种方法对比β-肌动蛋白、HUMSPB(图11C,D)和TTF的Ct值。所有对比的结果都显示统计学显著的差异(p<0.001)。对于2个基因,使用随机六聚体的反转录、随后用qPCR(2步反应)产生最高的Ct值,而使用基因-特异性的引物的反转录、随后用qPCR(2步反应)产生比对应的1步骤反应略微(但是统计学显著的)更低的Ct值。但是,使用基因-特异性的引物的2步骤RTPCR具有更长的反转录步骤。当将每个样品的HUMSPB Ct值对对应的β-肌动蛋白值标准化时,3种方法之间的标准化的Ct值没有差异。总之,最优化RTPCR反应条件可以产生更低的Ct值,这可以辅助分析更老的石蜡块(Cronin等(2004)),且使用基因-特异性的引物的一步RTPCR反应可以产生与在对应的2步反应中产生的Ct值可比较的Ct值。

最优化的qRTPCR测定的诊断性能。在260FFPE转移灶的新集合上进行12qRTPCR反应(10标记和2个持家基因)。21个样品产生持家基因的高Ct值,所以在热图分析中使用了仅239个样品。分析热图中的标准化的Ct值,揭示了乳房和前列腺标记的高特异性,结肠、肺和卵巢的中等特异性,和胰标记的稍微更低的特异性(图12)。组合标准化的qRTPCR数据和计算精制,提高了标记组的性能。

使用对2个持家基因的表达的平均值标准化的表达值,通过组合标准化的qRTPCR数据和算法,开发了预测转移起源组织的算法,并通过进行leave-one-out交叉验证检验(LOOCV),测定qRTPCR测定的准确度。对于测定中包括的6个组织类型,分别估计出假阳性信号的数目(当将样品错误预测为在测定中包括的其它肿瘤类型时(例如,将胰预测为结肠))和没有将样品预测为在测定组织类型中包括的那些类型(其它)的次数。LOOCV的结果在表20示出。

表20

为260个测试的样品中的204个,以78%的总准确度正确预测了起源组织。相当大比例的假阳性信号是由于组织学上类似的组织中的标记交叉反应性。例如,源自咽、喉和食管的3种鳞状细胞转移癌被错误预测为肺,这是由于这些组织中的DSG3表达。CDH17在结肠GI癌以外(包括胃和胰)的阳性表达,造成6个测试的胃中的4个和43个测试的胰癌转移中的3个错误分类成结肠。

除了LOOCV检验以外,将数据随机分成3独立对的训练和试验集合。每个分离含有约50%的每类样品。在50/50分离时,在3独立对的训练和试验集合中,测定总分类准确度是77%、71%和75%,从而证实了测定性能稳定性。

最后,测试了48FFPE转移癌的另一个独立集合,其包括已知原发的转移癌、含有通过病理学评价(包括IHC)提供的起源组织诊断的CUP样品、和在测试IHC测试后保持CUP的CUP样品。为每类样品分别估计起源组织预测准确度。表21总结了测定结果。

表21

 

测试的正确准确度已知转移151173.3分析的CUP221777.3未分析的CUP11

除了仅小量例外以外,起源组织预测与通过临床/病理学评价(包括IHC)评估的已知原发或起源组织诊断相一致。类似于训练集合,测定不能区分源自不同来源的鳞状细胞癌,且将它们错误预测为肺。

测定也为在标准诊断试验后保持CUP的11个样品中的8个作出推定的起源组织诊断。CUP病例中的一个是特别令人感兴趣的。具有前列腺癌历史的男性患者被诊断出在肺和胸膜中的转移癌。在转移组织上进行的血清PSA试验和使用PSA抗体的IHC是阴性的,所以病理学家的诊断是倾向于胃肠肿瘤的CUP。所述测定强烈(后验概率0.99)预测起源组织是结肠。

讨论。在该研究中,原发性肿瘤上的基于微阵列的表达概况分析用于鉴别为转移灶使用的候选标记。原发性肿瘤可以用于发现转移的起源肿瘤标记的事实,与最近的几项发现相一致。例如,Weigelt及同事已经表明,原发乳房肿瘤的基因表达概况在远距离转移中保持。Weigelt等(2003)。Backus及同事鉴别出了用于检测乳腺癌转移的推定标记,其中使用乳房和其它组织的全基因组的基因表达分析,并证实乳腺珠蛋白和CK19以90%灵敏度和94%特异性检测乳房警戒淋巴结中临床上起作用的转移。Backus等(2005)。

在测定开发过程中,选择集中于6个癌症类型,包括在CUP中最普遍的肺、胰和结肠(Ghosh等(2005);和Pavlidis等(2005))和治疗可能对患者最有益的乳房、卵巢和前列腺。Ghosh等(2005)。但是,其它组织类型和标记也可以加入组中,只要不损害测定的总准确度即可,且如果适用,不妨碍RTPCR反应的逻辑(logistics)。

基于微阵列的使用原发组织的研究证实了已知标记的特异性和灵敏度。结果,大多数组织特异性的标记对这里研究的组织具有高度特异性。最近的使用IHC的研究发现,PSCA在前列腺癌转移中超表达。Lam等(2005)。Dennis等(2002)也证实,PSCA可以用作胰和前列腺的起源肿瘤标记。在RNA水平,在有些前列腺组织中存在PSCA的强表达,但是,由于在测定中包括PSA,现在可以分离前列腺和胰癌。该研究的新发现是,使用F5作为胰起源组织的互补(与PSCA互补)标记。在微阵列数据集(含有原发组织)和qRTPCR数据集(含有FFPE转移)中,发现F5与PSCA互补。

以前的研究人员已经使用IHC(Brown等(1997);DeYoung等(2000);和Dennis等(2005a))或微阵列产生了CUP测定。Su等(2001);Ramaswamy等(2001);和Bloom等(2004)。最近,已经将SAGE与小qRTPCR标记组相结合。Dennis(2002);和Buckhaults等(2003)。该研究首次组合了基于微阵列的表达概况分析和小组qRTPCR测定。使用原发组织的微阵列研究鉴别出了一些、但不是所有与以前通过SAGE研究鉴别出的标记相同的起源组织标记。该发现不是令人奇怪的,因为研究已经证实,基于SAGE和DNA微阵列的概况分析数据之间存在中等一致性,且该相关性对于具有更高表达水平的基因提高。van Ruissen等(2005);和Kim(2003)。例如,Dennis及同事鉴别出了PSA、MG、PSCA和HUMSPB,而Buckhaults及同事(Buckhaults等(2003))鉴别出了PDEF。

使用qRTPCR执行CUP测定是优选的,因为它是有力的技术,且可能具有胜过IHC的性能优点。Al-Mulla等(2005);和Haas等(2005)。此外,如本文所示,已通过在一步反应中使用基因-特异性的引物,改进了qRTPCR规程。这首次证实了基因-特异性的引物在含有FFPE组织的一步qRTPCR反应中的应用。其它研究人员已经进行了2步qRTPCR(在一个反应中合成cDNA,随后qPCR),或已经使用随机六聚体或截短的基因-特异性的引物。Abrahamsen等(2003);Specht等(2001);Godfrey等(2000);Cronin等(2004);和Mikhitarian等(2004)。

总之,6个组织类型的测定的78%总准确度有利地与其它研究匹敌。Brown等(1997);DeYoung等(2000);Dennis等(2005a);Su等(2001);Ramaswamy等(2001);和Bloom等(2004)。

实施例7

在该研究中,通过从MVO中选择,并使用分类器来预测5种主要癌症类型(包括乳房、结肠、肺、卵巢和前列腺)的组织起源和癌症状态,建立了使用基因标记组合的分类器。使用Affymetrix人U133AGeneChip,分析了378原发癌、23良性增生性上皮病变和103正常骤冻人组织样品。还分析了白细胞样品,以减去被白细胞背景细胞中的共表达潜在遮盖的基因表达。开发了新的基于MVO的生物信息学方法,来选择起源组织和癌症状态的基因标记组合。数据证实,26基因的组可以用作在5种癌症类型中准确预测起源组织和癌症状态的分类器。因而,通过测定适度小数目的基因标记的基因表达概况,可以得到多癌症分类方法。

表22显示了为指定的组织起源鉴别的标记。关于基因描述,见表31。

表22

 

组织SEQ ID NO:名称59SP-B60TTF161DSG366PSCA67F571ITGB672TGM284HNRPA0结肠85HPT177FABP178CDX179GUCY2C前列腺86PSA80hKLK2乳房63MGB181PIP64PDEF卵巢82HE483PAX865WT1

样品集合包括共计299个转移结肠、乳房、胰、卵巢、前列腺、肺和其它癌和原发前列腺癌样品。执行基于组织学评价、RNA得率和对照基因β-肌动蛋白的表达的QC。其它样品类别包括源自胃(5)、肾(6)、胆管/胆囊(4)、肝(2)、头和颈(4)、回肠(1)癌和一种间皮瘤的转移。表23总结了结果。

表23

 

组织类型收集的组织学QCRNA分离QCACTB截止QC4137362563574941结肠45424231乳房40353534卵巢37363533前列腺27272519其它46342923总计299268251205

测试上述样品,导致将标记集合缩小至表24中的那些,结果见表25。

表24

表25

 

癌症样品#标记正确灵敏度%错误特异性%25/180SP-B13/25520/180100TTF12/25481/18099DSG35/25200/18010041/164PSCA24/41596/16496F56/41154/16498结肠31/174HPT122/31712/17499乳房33/172MGB23/33703/17298PDEF16/33481/17299前列腺19/186PSA19/191000/186100PDEF19/191002/18699卵巢33/172WT124/33711/17299总计205

结果表明,在205个石蜡包埋的转移肿瘤中,166个样品(81%)具有决定性的测定结果,表26。

表26

 

候选物正确错误No准确度(%)SP-B+TFF+DSG3190676PSCA+F52711366结肠HPT1242578前列腺PSA1900100乳房MGB+PDEF233770卵巢WT1232870其它20387总计155113976

在假阳性结果中,许多错误源自组织学和胚胎学类似的组织,表27。

表27

 

样品ID诊断预测的OV_26卵巢乳房Br_24乳房结肠Br_37乳房结肠CRC_25结肠卵巢Pn_59结肠Cont_27Cont_34结肠Cont_35结肠Cont_43胆管Cont_44胆管Cong_25

为模型开发考虑下述参数:

分离女性和男性集合的标记,并分别为男性和女性患者计算CUP概率。男性集合包括:SP_B、TTF1、DSG3、PSCA、F5、PSA、HPT1;女性集合包括:SP_B、TTF1、DSG3、PSCA、F5、HPT1、MGB、PDEF、WT1。从测定结果排除背景表达:肺:SP_B、TTF1、DSG3;卵巢:WT1;和结肠:HPT1。

将CUP模型调节至CUP患病率(%):肺23、胰16、结肠直肠9、乳房3、卵巢4、前列腺2、其它43。将男性患者的乳房和卵巢患病率调节至0%,且将女性患者的前列腺患病率调节至0%。

采取下述步骤:将标记置于类似的标尺上;通过从每个组织特异性集合选择最小值,将变量的数目从12减至8;省去(leave out)1个样品;从剩余的样品建立模型;测试省去的样品;重复到测试了100%样品,随机省去约50%的样品(每个组织约50%);从剩余的样品建立模型;测试约50%的样品;和对3个不同随机分离进行重复。

将分类准确度调节至癌症类型患病率,以产生表28总结的结果,原始数据如表29所示。

表28

 

乳房结肠其它卵巢前列腺总计调节的正确23292219243519171未测试32223012错误701473022患病率0.030.090.230.430.040.160.02测试的/总计%91949210094931009495正确/总计%7094888373851008989未测试%968n/a67065正确23251920202419150未测试%7651015043错误301332012患病率0.030/090.230.430.040.160.02测试的/总计%79818010070631007983正确/总计%7081768761591007376正确/测试的%88100958787921009391未测试%211920n/a303702117

实施例8

用干预测起源组织的原发部位不明转移癌CUP的有前途的基因标记研究

本研究的具体目的是,测定10-基因标记预测原发不明癌(CUP)患者中转移癌的起源组织的能力。

基本目的:证实在CUP连续患者中进行来自核心活组织检查样品的基因分析的可行性。

第二目的:将10-基因标记RT-PCR测定的结果与在M.D.Anderson癌症中心(MDACC)进行的诊断检查相关联。

第三目的:将通过测定预测的6种癌症类型的患病率与从文献和MDACC经验衍生的患病率相关联。

本文所述方法用于进行700个冷冻原发癌和良性和正常样品的微阵列基因表达分析,且鉴别出对肺、胰、结肠、乳房、前列腺和卵巢癌特异性的基因标记候选物。在源自肺、胰、结肠、乳房、卵巢和前列腺的转移癌(III-IV期)以及源自用于特异性对照的其它癌症类型的转移的205个福尔马林固定的、石蜡包埋的(FFPE)样品上,通过RT-PCR测试基因标记候选物。其它转移癌类型包括胃、肾细胞、肝细胞、胆管/胆囊和头和颈癌。结果允许选择10-基因标记,其预测转移癌的起源组织,并产生76%的总准确度。RT-PCR实验的重复测量的平均CV是1.5%,这基于4个重复数据点计算而得。将β-肌动蛋白(ACTB)用作持家基因,且它的中值表达类似于在不同起源的转移样品中的表达(CV=5.6%)。

本研究的具体目的是,验证10-基因标记与全面诊断检查相比预测CUP患者中转移癌起源组织的能力。

患者适当性

患者必须是至少18岁,ECOG表现状态为0-2。接受诊断出腺癌或不良分化癌的患者。腺癌患者组包括良好、中等和不良分化的肿瘤。

患者已经满足CUP的标准:完全评价后没有检测出原发,所述完全评价定义为完全的历史和身体检查、详细的实验室检查、成像研究和症状或病征指导的侵入研究。仅允许未经治疗的患者用于研究。

如果患者已经用化疗或放射治疗过,则若在10年时间段内可得到作为记录的块的以前(治疗前)组织,则允许参与研究。

患者提供参与本研究的书面知情同意书/授权书。

研究设计

在研究中允许已经诊断出CUP的患者,他们已经经历最易接近的转移病灶的芯针或切除活组织检查。仅进行FNA活组织检查的患者是不合适的。登记满足包含标准和同意研究的前60个连续出现的患者。如果为了他们的治疗的诊断目的,需要在MDACC重复的活组织检查,如果患者同意,则得到其它组织用于研究。所有参与者都登记在institutional Protocol Data Management System(PDMS)的规程中。

根据MDACC标准,对所有登记的患者进行完全诊断检查,包括临床和病理学评估。诊断检查的病理学部分可能已经包括使用标记的免疫组织化学(IHC)测定,所述标记包括CK-7、CK-20、TTF-1和病理学家所认为的指定的其它标记。这是呈现CUP的所有患者的常规检查的部分。

组织样品收集

研究包括福尔马林固定的、石蜡包埋的从CUP患者收集的转移癌样品。

6个10μm切片用于RNA分离,更小的组织样品将需要9个10μm切片。在用苏木精和伊红(HE)染色的另一个切片上,证实用于RNA分离的每个样品的组织病理学诊断和肿瘤含量。肿瘤样品应当在HE切片中具有大于30%的肿瘤含量。

将临床数据匿名地提供给Veridex,且包括患者年龄、性别、通过光学显微镜术检查的肿瘤组织学、肿瘤等级(分化)、转移部位、样品收集日期、关于单个患者进行的诊断检查的描述。

组织加工和RT-PCR试验

使用上述规程,从每个组织样品提取总RNA。仅将在标准量的组织中产生超过1μm总RNA的样品用于随后的RT-PCR试验。具有更低RNA得率的样品视作降解的,且在随后的实验中排除掉。根据标准的Veridex程序,执行基于持家表达的RNA完整性对照,以排除具有降解的RNA的样品。

包括10个基因和1-2个对照基因的组的RT-PCR测定,用于分析RNA样品。使用上述规程,完成反转录和PCR测定。

计算表示为ΔCt的每个测试的基因的相对表达值,并用于起源组织预测,所述ΔCt等于靶基因的Ct减去对照基因的Ct。

样品大小和数据解释

由于探索研究的探察性质,研究了60位患者的有限样品大小。迄今为止,已经测试了22位患者。1个患者样品没有产生足够RT-PCR试验的RNA,且3个没有通过使用对照基因的RT-PCR评估的QC对照。共18位患者用于测定患者的转移病变的概率。

将统计学模型用于测定下述7类转移癌起源组织的概率:肺、胰、结肠、乳房、前列腺、卵巢和未测试(其它)。对于每个样品,从线性分类模型计算每类的概率。在表30中总结了测定结果。

从这6个部位(结肠、胰、肺、前列腺、卵巢、乳房)中的一个得到的患者转移病变(具有已知原发)的概率是约76%。该数字源自给出各种癌症的发病率和传播潜力的文献和在来自肿瘤登记的M.D.Anderson的未公开数据。对于测试的样品,6个部位的患病率是67%(12/18的试验样品),这与以前的观察非常一致。

表30

尽管已经通过用于理解清楚的目的的说明和实施例比较详细地描述了前述发明,但所述描述和实施例不应当理解为对本发明范围的限制。

表31

 

名称SEQ IDNO登记号描述CDH1762NM_004063钙粘着蛋白17CDX178NM_001804同源框转录因子1DSG361/3NM_001944桥粒芯糖蛋白3F567/6NM_000130凝固因子VFABP171NM_001443脂肪酸结合蛋白1,肝GUCY2C79NM_004963鸟苷酸环化酶2CHE482NM_006103推定的卵巢癌标记KLK280BC005196激肽释放酶2,前列腺的HNRPA084NM_006805异质核内核糖核蛋白A0HPT185/4U07969肠肽-相关转运蛋白ITGB671NM_000888整联蛋白,β6KLK368NM_001648激肽释放酶3MGB163/7NM_002411乳腺珠蛋白1PAX883BC001060配对框基因8PBGD70NM_000190羟甲基胆色烷合酶PDEF64/8NM_012391含有Ets转录因子的结构域PIP81NM_002652催乳素-诱导的蛋白PSA86/9U17040前列腺特异性的抗原前体PSCA66/5NM_005672前列腺干细胞抗原SP-B59/1NM_198843肺表面活性剂-相关蛋白BTGM272NM_004613转谷氨酰胺酶2TTF160/2NM_003317类似于甲状腺转录因子1WT165/10NM_024426Wilms瘤1

 

β-肌动蛋白69NM_001101β-肌动蛋白KRT6F87L42612角蛋白6同工型K6fp73H88AB010153p53-相关蛋白SFTPC89NM_003018表面活性剂,肺-相关蛋白CKLK1090NM_002776激肽释放酶10CLDN1891NM_016369密蛋白18TR1092BD280579肿瘤坏死因子受体B305D93B72694GABA-pi95BC109105γ-氨基丁酸A受体,piStAR96NM_01007243类固醇生成急性调节蛋白EMX297NM_004098空气门同源物2(果蝇(Drosophila))NGEP98AY617079NGEP长变体NPY99NM_000905神经肽YSERPINA1100NM_000295丝氨酸蛋白酶抑制剂肽酶抑制剂,进化枝A成员1KRT7101NM_005556角蛋白7MMP11102NM_005940基质金属肽酶11(溶基质蛋白酶3)MUC4103NM_018406粘蛋白4细胞-表面相关的FLJ22041104AK025694BAX105NM_138763BCL2-相关的X蛋白转录物变体ΔPITX1106NM_002653配对-样同源域转录因子1MGC:10264107BC005807硬脂酰辅酶A去饱和酶(Δ-9-去饱和酶)

参考文献

美国专利申请公开和专利

5242974                 5700637             20030194733

5350840                 5786148             20030198970

5384261                 6004755             20030215803

5405783                 6136182             20030215835

5412087                 6218114             20030219760

5424186                 6218122             20030219767

5429807                 6225051             20030232350

5436327                 6232073             20030235820

5445934                 6261766             20040005563

5472672                 6271002             20040009154

5527681                 6339148             20040009489

5529756                 20010029020         20040018969

5532128                 20020055627         20040029114

5545531                 20020068288         20040076955

5554501                 20020168647         20040126808

5556752                 20030044859         20040146862

5561071                 20030087818         20040219572

5571639                 20030104448         20040219575

5593839                 20030124128         20050037010

5599695                 20030124579         20050059008

5624711                 20030138793         20060094035

5658734                 20030190656

外国专利公开和专利

WO1998040403            WO2001073032        WO2004030615

WO1998056953            WO2002046467        WO2004031412′

WO2000006589            WO2002073204        WO2004063355

WO2000055320            WO2002101357        WO2004077060

WO2001031342            WO2004018999        WO2005005601

期刊

Abrahamsen et al.(2003)Towards quantitative mRNA analysis in paraffin-embeddedtissues using real-time reverse transcriptase-polymerase chain reaction J MolDiag 5:34-41

Al-Mulla et al.(2005)BRCA1 gene expression in breast cancer:a correlative studybetween real-time RT-PCR and immunohistochemistry J Histochem Cytochem53:621-629

Argani et al.(2001)Discovery of new Markers of cancer through serial analysis ofgene expression:prostate stem cell antigenis overexpressed in pancreaticadenocarcinoma Cancer Res 61:4320-4324

Autiero et al.(2002)Intragenic amplification and formation of extrachromosomal smallcircular DNA molecules from the PIP gene on chromosome 7 in primary breastcarcinomas Int J Cancer 99:370-377

Backus et al.(2005)Identification and characte rization of optimal gene expressionMarkers for detection of breast cancer metastasis J Mol Diagn 7:327-336

Bentov et al.(2003)The WT1 Wilms′tumor suppressor gene:a novel target forinsulin-like growth factor-l action Endoc rinol 144:4276-4279

Bera et al.(2004)NGEP,a gene encoding a membrane protein detected only inprostate cancer and normal prostate Proc Natl Acad Sci USA 101:3059-3064

Bibikova et al(2004)Quantitative gene expression profiling in formalin-fixed,paraffin-embedded tissues using universal bead arrays Am j Pathol165:1799-1807

Bloom et al.(2004)Multi-platform,multi-site,microarray-based human tumorclassification Am J Pathol 164:9-16

Borchers et al.(1997)Heart-type fatty acid binding protein-involvement in growthinhibition and differentiation Prostaglandins Leukot Essent Fatty Acids 57:77-84

Borgono et al.(2004)Human tissue kallikreins:physiologic roles and applications incancer Mol Cancer Res 2:257-280

Brookes(1999)The essence of SNPs Gene 23:177-186

Brown et al.(1997)Immunohistochemicalidentification of tumor Markers in metastaticadenocarcinoma.A diagnostic adjunct in the determination of primary site Am JClin Pathol 107:12-19

Buckhaults et al.(2003)Identifying tumor origin using a gene expression-basedclassification map Cancer Res 63:4144-4149

Chan et al.(1985)Human liver fatty acid binding protein cDNA and amino acidseq uence.Functional and evolutionaryimplications J Biol Chem260:2629-2632

Chen et al.(1986)Human liver fatty acid binding protein gene is located onchromosome 2 Somat CellMol Genet 12:303-306

Cheung et al.(2003)Detection of the PAX8-PPAR gamma fusion oncogene in bothfollicular thyroid carcinomas and adenomas J Clin Endoc rinol Metab 88:354-357

Clark et al.(1999)The potential role for prolactin-inducible protein(PIP)as a Markerof human breast cancer micrometastasis Br J Cancer 81:1002-1008

Cronin et al.(2004)Measurement of gene expression in archlval paraffin-embeddedtissue Am J Pathol 164:35-42

Cunha et al.(2006)Tissue-specificity of prostate specific antigens:Comparativeanalysis of transc ript levels in prostate and non-prostatic tissues Cancer Lett236:229-238

Dennis et al.(2002)Identification from public data of molecular Markers ofadenocarcinoma characteristic of the site of origin Can Res 62:5999-6005

Dennis et al.(2005a)Hunting the primary:novel strategies for defining the origin oftumors J Pathol 205:236-247

Dennis et al.(2005b)Markers of adenocarcinoma characteristic of the site of origin:development of a diagnostic algo rithm Clin Can Res 11:3766-3772

DeYoung et al.(2000)Immunohistologic evaluation of metastatic carcinomas ofunknown origin:an algorithmic approach Semin Diagn Pathol 17:184-193

Di Palma et al.(2003)The paired domain-containin9 factor Pax8 and thehomeodomain-containing factor TTF-1 directly interact and synergistically activatetranscri ption Biol Chem 278:3395-3402

Dwight et al.(2003)Involvement of the PAX8peroxisome proliferator-activatedreceptor gamma rearrangement in follicular thyroid tumors J Clin Endoc rinolMetab 88:4440-4445

Feldman et al.(2003)PDEF expression in human breast cancer is correiated withinvasive potential and altered gene expression Cancer Res 63:4626-4631

Fleming et al.(2000)Mammaglobin,a breast-specific gene,and its utility as a Markerfor breast cancer Ann N Y Acad Sci 923:78-89

Fukushima et al.(2004)Characterization of gene expression in mucinous cysticneoplasms of the pancreas using oligonucleotide microarrays Oncogene 23:9042-9051

Ghosh et al(2005)Management of patients with metastatic cancer of unknownprimary Curr Probl Surg 42:12-66

Giordano et al.(2001)Organ-specific molecular classification of primary lung,colon,and ovarian adenocarcinomas using gene expression profiles Am JPathol.159:1231-1238

Glasser et al(1988)cDNA,deduced polypeptide structure and chromosomalassignment of human pulmonary surfactant proteolipid,SPL(pVal)J Biol Chem263:9-12

Godfrey et al.(2000)Quantitative mRNA expression analysis from formalin-fixed,paraffin-embedded tissues using 5′nuclease quantitative reversetranscription-polymerase chain reaction J Mol Diag 2:84-91

Goldstein et al.(2002)WT1 Immunoreactivity in uterine papillary serous carcinomasis different from ovarian serous carcinomas Am J Clin Pathol 117:541-545

Gradi et al.(1995)The human steroldogenic acute regulatory(StAR)gene isexpressed in the urogenital system and encodes a mitochondrial polypeptideBiochim Biophys Acta 1258:228-233

Greco et al.(2004)Carcinoma of unknown primary site:sequential treatment withpaclitaxel/carboplatin/etoposide and gemcitabine/irinotecan:A Minnie Pearlcancer research network phase ll trial The Oncologist 9:644-652

Haas et al.(2005)Combined application of RT-PCR and immunohistochemistry onparaffin embedded sentinel lymph nodes of prostate cancer patients Pathol ResPract 200:763-770

Hwang et al.(2004)Wilms tumor gene product:sensitive and contextually specificMarker of serous carcinomas of ovarlan surface epithelial origln ApplImmunohistochem Mol Morphol 12:122-126

lshikawa et al.(2005)Expe rimental trial for diagnosis of pancreatic ductal carcinomabased on gene expression profiles of pancreatic ductal cells Cancer Sci 96:387-393

ltaliano et al.(2005)Epidermal growth factor receptor(EGFR)status in primarycolorectaltumors correlates with EGFR expression in related metastatic sites:biological and clinical implications Ann Oncol 16:1503-1507

Jones et al;(2004)Comprehensive analysis of matrix metalloproteinase and tissueinhibitor expression in pancreatic cancer:increased expression of matrixmetalloproteinase-7 predicts poor survival Clin Cancer Res 10:2832-2845

Jones et al.(2005)Thyroid transc ription factor 1 expression in small cell carcinoma ofthe urinary bladder:an immunohistochemical profile of 44 cases Hum Pathol36:718-723

Khoor et al.(1997)Expression of surfactant protein B precursor and surfactant proteinB mRNA in adenocarclnoma of the lung Mod Pathol 10:62-67

Kim(2003)Comparison of oligonucleotide-microarray and serial analysis of geneexpression(SAGE)in transcript profiling analysis of megakaryocytes derived fromCD34+cells Exp Mol Med 35:460-466

Kim et al.(2003)Steroidogenic acute regulatoryprotein expression in the normalhuman brain and intracranial tumors Brain Res 978:245-249

Lam et al.(2005)Prostate stem cellantigen is overexpressed in prostate cancermetastases Clin Can Res 11:2591-2596

Lembersky et al.(1996)Metastases of unknown primary site Med Clin North Am.80:153-171

Lewis et al.(2001)Unlocking the archive-gene expression in paraffin-embeddedtissue J Pathol 195:66-71

Lipshutz et al.(1999)High density synthetic oligonucleotide arrays Nature Genetics21:S20-24

Lowe et al.(1985)Human liver fattyacid binding protein.Isolation of a fulllengthcDNA and comparative sequence analyses of orthologous and paralogousproteins J Biol Chem 260:3413-3417

Ma et al.(2006)Molecular classification of human cancers using a 92-gene real-timequantitative polymerase chain reaction assay Arch Pathol Lab med 130:465-473

Magklara et al.(2002)Characterization of androgenreceptor and nuclear receptorco-regulator expression in human breast cancer celll ines exhibiting differentialregulation of kallikreins 2 and 3 Int J Cancer 100:507-514

Markowitz(1952)Portfolio Selection J Finance 7:77-91

Marques et al.(2002)Expression of PAX8-PPAR gamma 1 rearrangements in bothfollicular thyroid carcinomas and adenomas J Clin Endocrinol Metab87:3947-3952

Masuda et al.(1999)Analysis of chemical modification of RNA from formalin-fixedsamples and optimization of molecular biology applications for such samples NuclAcids Res 27:4436-4443

McCarthy et al.(2003)Novel Markers of pancreatic adenocarcinoma in fine-needleaspiration:mesothelin and prostate:stem cell antigen labeling increases accuracyin cytologically borde rline cases Appl Immunohistochem Mol Morphol 11:238-243

Mikhita rian et al.(2004)Enhanced detection of RNA from paraffin-embedded tissueusing a panel of truncated gene-specific primers for reverse transcriptionBioTechniques 36:1-4

Mintzer et al.(2004)Cancer of unknown primary:changing approaches,amultidis ciplinary case presentation from the Joan Karnell Cancer Center ofPennsylvania Hospital The Oncologist 9:330-338

Moniaux et al.(2004)Multiple roles of mucins in pancreatic cancer,a lethal andchallenging malignancy Br J Cancer 91:1633-1638

Murphy et al.(1987)lsolation and sequencing of a cDNA clone for a prolactin-inducible protein(PIP).Regulation of PIP gene expression in the human breastcancer cellline,T-47D J Biol Chem 262:15236-15241

Myal et al.(1991)The prolactin-inducible protein(PIPGCDFP-15)gene:cloning,structure and regulation JMol Cell Endocrinol 80:165-175

Nakamura et al.(2002)Expression of thyroid transcription factor-1in normal andneoplastic lung tissues Mod Pathol 15:1058-1067

Noonan et al.(2001)Characterization of the homeodomain gene EMX2:sequenceconservation,expression analysis,and a search for mutations in endomet rialcancers Genomics 76:37-44

Oettgen et al.(2000)PDEF,a novel prostate epithelium-specific Ets transc riptionfactor,interacts with the androgen receptor and activates prostate-specific antigengene expression J Biol Chem 275:1216-1225

Oji et al.(2003)Overexpression of the Wilms′tumor gene WT1 in head and necksquamous cell carcinoma Cancer Sci 94:523-529

Pavlidis et al.(2003)Diagnostic and therapeutic management of cancer of anunknown primary Eur J Can 39:990-2005

Pilot-Mathias et al.(1989)Structure and organization of the gene encoding humanpulmonary surfactant proteolipid SP-B DNA 8:75-86

Pilozzi et al.(2004)CDX1 expression is reduced in colorectal carcinoma and isassociated with promoter hypermethylation J Pathol 204:289-295

Poleev et al.(1992)PAX8,a human paired boxgene:isolation and expression indeveloping thyroid,kidney and Wilms′tumors Development 116:611-623

Prasad et al.(2005)Gene expression profiles in pancreatic intraepithelial neoplasiareflect the effects of Hedgehog signaling on pancreatic ductal epithelial cellsCancer Res 65:1619-1626

Ramaswamy(2004)Translating cancer genomics into clinical oncology N Engl J Med350:1814-1816

Ramaswamy et al.(2001)Multiclass cancer diagnosis using tumor gene expressionsignatures Proc Natl Acad Sci USA 98:15149-15154

Rauscher(1993)The WT1 Wilms tumor gene product:a developmentally regulatedtranscription factor in the kidney that functions as a tumor suppressor FASEB J7:896-903

Reinholz et al.(2005)Evaluation of a panel of tumorMarkers for molecular detectionof circulating cancer cells in women with suspected breast cancer Clin CancerRes 11:3722

Schlag et al.(1994)Cancer of unknown p rimary site Ann Chir Gynaecol 83:8-12

Senoo et al.(1998)A second p53-related protein,p73L,with high homology to p73Biochem Biophys Res Comm 248:603-607

Specht et al.(2001)Quantitative gene expression analysis in microdissected archivalformalin-fixed and paraffin-embedded tumor tissue Amer J Pathol 158:419-429

Su et al.(2001)Molecular classification of human carcinomas by use of geneexpression signatures Cancer Res 61:7388-7393

Takahashi et al.(1995)Cloning and characte rization of multiple human genes andcDNAs encoding highly related typell keratin 6 isoforms J Biol Chem 270:18581-18592

Takamura et al.(2004)Reduced expression of liver-intestine cadherin is associatedwith progression and lymph node metastasis of human colorectal carcinomaCancer Lett 212:253-259

Tothill et al.(2005)An expression-based site of origin diagnostic method designed forclinical application to cancer of unknown origin Can Res 65:4031-4040

van Ruissen et al.(2005)Evaluation of the simila rity of gene expression dataestimated with SAGE and Affymetrix GeneChips BMC Genomics 6:91

Varadhachary et al.(2004)Diagnostic strategies for unknown primary cancer Cancer100:1776-1785

Venables et al.(2002)Modem Applied Statistics with S.Fourth edition.Springer

Wallace et al.(2005)Accurate Molecular detection of non-small cell lung cancermetastases in mediastinal lymph nodes sampled by endoscopicultrasound-guided needle aspiration Cest 127:430-437

Wan et al.(2003)Desmosomal proteins,including desmoglein 3,serve as novelnegative Markers for epidermal stem cell-containing population of keratinocytes JCell Sci 116:4239-4248

Watson et al.(1996)Mammaglobin,a mammary-specific member of the uteroglobingene family,is overexpressed in human breast cancer Cancer Res 56:860-865

Watson et al.(1998)Structure and transc riptional regulation of the humanmammaglobin gene,a breast cancer associated member of the uteroglobin genefamily localized to chromosome 11q13 Oncogene 16:817-824

Weigelt et al.(2003)Gene expression profiles of primary breasttumors maintained indistant metastases Proc Natl Acad Sci USA 100:15901-15905

Zapata-Benavides et al.(2002)Downregulation of Wilms′tumor 1 protein inhibitsbreast cancer proliferation Biochem Biophys Res Commun 295:784-790

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号