首页> 中国专利> 用于经荧光原位杂交检测肿瘤抑制基因缺失的方法、探针组和试剂盒

用于经荧光原位杂交检测肿瘤抑制基因缺失的方法、探针组和试剂盒

摘要

本发明公开了用于基因缺失分析的方法、探针组、试剂盒和组合物。在某些实施方案中,方法涉及制备缺失分析使用的探针、进行缺失分析或者优化缺失分析。在某些实施方案中,方法和探针组可以提供下降的人为缺失发生率,例如分析经过人为截断的样品时。在某些实施方案中,方法和探针组可以区分小的和大的缺失。

著录项

  • 公开/公告号CN102892934A

    专利类型发明专利

  • 公开/公告日2013-01-23

    原文格式PDF

  • 申请/专利权人 金斯顿女王大学;金斯顿总医院;

    申请/专利号CN201180024255.6

  • 发明设计人 J.A.斯奎尔;M.约希默托;

    申请日2011-03-15

  • 分类号C40B40/06(20060101);C07H21/00(20060101);C12Q1/68(20060101);C40B30/04(20060101);C40B50/00(20060101);

  • 代理机构11105 北京市柳沈律师事务所;

  • 代理人闵丹

  • 地址 加拿大安大略省

  • 入库时间 2024-02-19 17:13:29

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-07-20

    授权

    授权

  • 2013-04-03

    实质审查的生效 IPC(主分类):C40B40/06 申请日:20110315

    实质审查的生效

  • 2013-01-23

    公开

    公开

说明书

本申请要求2010年3月15日提交的美国临时专利申请61/313,916和 2010年3月15日提交的加拿大专利申请2,696,545的权益,两份申请的全部 内容均通过引用并入本文。

本发明涉及在检测肿瘤抑制基因的缺失的分析中使用的方法、探针组和 试剂盒,以及制备所述探针组和优化所述分析的方法。本发明的实施方案还 包括检测样品中的染色体事件,比如缺失、扩增、转位和其它染色体事件的 方法,其中所述样品是比如血液或实体瘤以及甲醛固定石蜡包埋(FFPE)薄切 片、细针抽吸活检(FNA)、抹片等。在某些实施方案中,染色体事件涉及诸 如肿瘤抑制、癌基因相关的和/或原癌基因的基因。

了解癌细胞或原癌细胞是否发生率肿瘤抑制基因的缺失对于提高诊断 和/或预后准确性或者治疗方法的选择一般来说很有用。被怀疑是癌细胞或原 癌细胞的样品,比如来自怀疑是癌或原癌生长(包括肿瘤(cancer、neoplasms)、 增生等)的样品经常以例如固定的保存样品(比如甲醛固定石蜡包埋(FFPE)样 品)的形式供实验室分析。显然,这类样品的保存也使得可以进行追溯性研 究,给未来预后和治疗选择提供信息。肿瘤抑制基因的缺失可以通过荧光原 位杂交(FISH)在FFPE样品中检测分析,所述技术中样品与目标基因的探针 以及通常还有至少一个对照探针和/或核复染进行接触。肿瘤抑制基因的例子 包括PTEN、p53、p16(又称为CDKN2A)、RB1、DCC、BRCA1、BRCA2 和APC。可以利用荧光使探针可见,并且分析产生的FISH信号来确定是否 存在缺失。

来自实体生长物的样品以固定的保存样品提供时,通常是采取几个微米 厚的切片。因此,在样品切片过程中有可能切掉了含有肿瘤抑制基因的那部 分细胞核。这种现象经常造成核截断现象,导致实际上不带有肿瘤抑制基因 缺失的细胞看上去至少失去了一个拷贝的肿瘤抑制基因。截断现象可能发生 在间期细胞,这时染色体凝集并分布在构成常规病理学组织切片的球形核的 三维空间内。在分裂中期细胞中,~46条染色体处于扁平、杆状的线性结构, 一般可以在不被截断的情况下沉积到显微镜载片的表面。在临床样品(包括 来自疑似癌或原癌实体生长的样品,比如实体瘤)中,多数细胞的确通常处 于间期。代表性的分裂中期细胞样品很难或者不可能从用于追溯性分析的样 品,或者从患者中获得,固定、保存并送到异地实验室进行分析。

因此核截断现象负面影响基于FISH的肿瘤抑制基因缺失分析的表现。 为了防止假阳性(即发生了肿瘤抑制缺失的不正确结论)的可能性,可以给表 观缺失发生率设置一个最低阈值,其中当表观缺失发生率不超过该阈值时, 结果被认为是阴性或最多不确定的。所述阈值可以基于利用对照细胞估计的 人为缺失发生率;观察到的缺失水平要被认为是显著的,可能需要超过人为 缺失发生率例如人为缺失发生率的三个标准差。但是使用这种最小阈值要以 灵敏度为代价,因为例如当样品中含有缺失的细胞的数量较低或者当样品中 细胞是遗传型异质的时,很难或者不可能确定缺失。

同源性磷酸酶-张力蛋白(phosphatase and tensin homolog,PTEN)是人体 中由PTEN基因编码的一种蛋白质。许多癌症类型(Cristofano AD et al., PTEN is essential for embryonic development and tumour suppression,Nature Genetics 1998;19:348-355)和被称为考登综合征(Cowden syndrome)的遗传 学发育缺陷(Marsh DJ et al.,Germline PTEN mutations in Cowden syndrome-like families,J.Med.Genet.1998;35:881-885)中观察到过该肿瘤抑 制基因的失活。近年来,利用与PTEN杂交的368kb探针发现PTEN基因 座周围368kb或以上的基因组缺失在前列腺癌中很常见(Yoshimoto et al., Cancer Genetics and Cytogenetics 2006;169:128-137),并且它们的存在带来不 利的预后(Yoshimoto et al.,British Journal of Cancer 2007;97:678-685; Yoshimoto et al.,Modern Pathology 2008;21:1451-1460)。因此,准确的肿瘤 抑制基因(比如PTEN)缺失的分析法在临床上有重要意义。

此外,需要更高的通过大小来区分缺失的检测能力。有纯合PTEN缺失 的前列腺肿瘤,其中至少一个缺失事件删除了超过PTEN及其直接的周边的 染色体区域,更有可能是转移性肿瘤或者发生转移的可能性增加。因此,用 于这类检测的探针组和方法对预后和做出治疗方面的决定,以及对前列腺癌 的进展和分类进行进一步研究是有用的。

因此,需要用于检测肿瘤抑制基因(比如,例如PTEN)缺失分析的方法、 探针组和试剂盒,所述分析能够减少核截断现象的发生率;以及制备这类探 针组和优化所述分析的方法。

本发明的方法和组合物部分基于这样的发现,即通过提供能够减少误差 (比如截断现象)来源的探针组可以使基于FISH的肿瘤抑制缺失分析的性能 (特异性、灵敏度和/或统计学显著性)得以优化。所述探针组包含至少第一侧 翼探针、目标探针和第二侧翼探针,它们分别与位于肿瘤抑制基因的着丝粒 方向、肿瘤抑制基因或者附近,以及端粒方向的位点杂交。肿瘤抑制基因在 某些类型的癌或原癌细胞中易于发生缺失;例如至少在前列腺肿瘤中PTEN 很容易发生缺失。第一或第二侧翼探针和目标探针之间的距离在细胞遗传学 尺度来说可能较短,例如,500kb-10或20Mb的距离。

在某些实施方案中,第一和第二侧翼探针的杂交位点与目标探针的杂交 位点分别被第一和任选的第二边界区隔开(例如,靠近这些部位的基因组结 构特征,比如节段性重复和拷贝数差异;详细讨论见下文)。第一和第二侧 翼探针的杂交位点可以分别位于第一和第二(如果有的话)边界区或者与所述 区域从细胞遗传学角度来说邻近。

所述探针组由于它们的杂交位点的位置,可以使基于FISH的基因变异 分析的表现得以优化。将侧翼探针定位在目标探针的杂交位点附近和/或与边 界区相邻,但相对边界区在分析目标的远端,可以起到减少不确定结果和/ 或包括由核截断造成的假阳性的人为观察结果的作用。

因此,本公开提供了进行基于FISH的分析的方法,制备用于基于FISH 的肿瘤抑制因子缺失分析的探针的方法,和测量核截断在基于FISH的肿瘤 抑制因子分析中的影响的方法。本公开还提供了可以在基于FISH的肿瘤抑 制因子缺失分析中使用的探针组和组合物以及包含所述探针的试剂盒。

发明的一个实施方案是基于FISH的肿瘤抑制因子缺失分析中使用的探 针组的制备方法,所述方法包括:

(a)识别染色体上的至少一个边界区,所述染色体包含肿瘤抑制基因, 其中所述至少一个边界区包含位于肿瘤抑制基因着丝粒方向的第一边界区;

(b)提供至少一个第一侧翼探针,所述探针与第一边界区内的核酸序列 杂交;或者与相对第一边界区而言位于肿瘤抑制基因远端的核酸序列杂交;

(c)提供至少一个第二侧翼探针,所述探针与位于肿瘤抑制基因端粒方 向的核酸序列杂交;和

(d)提供至少一个目标探针,所述探针与边界区之间的肿瘤抑制基因中 的核酸序列杂交。

发明的另一个实施方案是进行基于FISH的肿瘤抑制基因缺失分析的方 法,所述方法包括:

(a)用探针组在包含复数个细胞的细胞样品上进行FISH,

其中所述探针组包含至少第一侧翼探针,其与位于肿瘤抑制基因着丝粒 方向的位点杂交;至少第二侧翼探针,其与位于肿瘤抑制基因端粒方向的位 点杂交;和至少一个与肿瘤抑制基因杂交的目标探针;

(b)计数所述复数个细胞中由至少第一和至少第二侧翼探针以及至少一 个目标探针产生的FISH信号;

(c)提供从(i)人为半合缺失发生率和(ii)人为纯合缺失发生率选出的至少 一个人为缺失发生率;

(d)根据步骤(b)计数的FISH信号确定至少一个表观缺失发生率,所述 表观缺失发生率从(i)表观半合缺失发生率和(ii)表观纯合缺失发生率选出,其 中如果步骤(c)未提供人为纯合缺失发生率,所述至少一个表观缺失发生率包 含表观半合缺失发生率;如果步骤(c)未提供人为半合缺失发生率,所述至少 一个表观缺失发生率包含表观纯合缺失发生率;和

(e)根据表观半合缺失发生率是否显著高于人为半合缺失发生率,确定 样品是否包含带有肿瘤抑制基因半合缺失的细胞;或者根据表观纯合缺失发 生率是否显著高于人为纯合缺失发生率,确定样品是否包含带有肿瘤抑制基 因纯合缺失的细胞。

发明的另一个实施方案是进行基于FISH的分析的方法,以区别性地检 测肿瘤抑制基因的小缺失和大缺失,所述方法包括:

(a)用探针组对包含复数个细胞的细胞样品进行FISH;或者用所述探 针组中包含的第一探针子集对含有复数个细胞的第一细胞样品进行FISH, 和用所述探针组中包含的第二探针子集对与所述第一细胞样品来自相同个 体的含有复数个细胞的第二细胞样品进行FISH,

其中所述探针组包含与肿瘤抑制基因杂交的至少一个目标探针,与位于 肿瘤抑制基因着丝粒方向的位点杂交的至少第一侧翼探针,与位于肿瘤抑制 基因端粒方向的位点杂交的至少第二侧翼探针,和下述中的至少一个:与位 于第一侧翼探针杂交位点着丝粒方向的位点杂交的至少第三侧翼探针,和与 位于第二侧翼探针杂交位点端粒方向的位点杂交的至少第四侧翼探针;

(b)计数复数个或复数组细胞中由至少一个目标探针和至少第一、至少 第二以及由至少第三和至少第四侧翼探针中选出的至少一个探针产生的 FISH信号;

(c)给肿瘤抑制基因缺失提供至少一个第一人为缺失发生率,其中缺失 端点在至少第一和至少第二侧翼探针之间;

(d)给肿瘤抑制基因缺失提供至少一个第二人为缺失发生率,其中至少 一个缺失端点不在至少第一和至少第二侧翼探针之间;

(e)根据步骤(b)计数的FISH信号,给肿瘤抑制基因缺失确定至少一个 第一表观缺失发生率,其中至少一个缺失端点在至少第一和至少第二侧翼探 针之间;

(f)根据步骤(b)计数的FISH信号,给肿瘤抑制基因缺失确定至少一个 第二表观缺失发生率,其中至少一个缺失端点不在至少第一和至少第二侧翼 探针之间;和

(g)根据至少一个第一表观缺失发生率是否显著高于至少一个第一人为 缺失发生率,确定样品是否包含带有肿瘤抑制基因小缺失的细胞;和根据至 少一个第二表观缺失发生率是否显著高于至少一个第二人为纯合缺失发生 率,确定样品是否包含带有肿瘤抑制基因大缺失的细胞。

发明另一个实施方案是优化基于FISH的肿瘤抑制基因分析法的方法, 所述方法包括:

(a)提供复数个候选探针组,其中每个候选探针组包含与处于肿瘤抑制 基因着丝粒方向的位点杂交的至少第一侧翼探针,与处于肿瘤抑制基因端粒 方向的位点杂交的至少第二侧翼探针,和与肿瘤抑制基因杂交的至少一个目 标探针;

(b)对于每个候选探针组,

(i)用候选探针组对至少一个细胞样品进行FISH,所述细胞样品包含复 数个含有整倍体数量肿瘤抑制基因完整拷贝的细胞;

(ii)计数至少一个样品的复数个细胞中由候选探针组的至少第一和至少 第二侧翼探针,以及至少一个目标探针产生的FISH信号;和

(iii)根据步骤(ii)计数的FISH信号确定人为缺失发生率;和

(c)从候选探针组中选出用于优化基于FISH的肿瘤抑制基因缺失分析 法的探针组,其中选定的探针组经确定在步骤(iii)中具有良好的人为缺失发 生率。

发明的另一个实施方案是对21号染色体带21q22.13-21q22.3中的缺失 进行基于FISH的分析的方法,所述方法包括:

(a)用探针组对包含复数个细胞的细胞样品进行FISH,

其中所述探针组包含:

与位于TMPRSS2和ERG之间的,或者替代地位于被TMPRSS2和ERG 基因覆盖的区域内的至少一个目标基因杂交的至少一个目标探针,

与位于至少一个目标基因的着丝粒方向的位点杂交的至少第一侧翼探 针,和

与位于至少一个目标基因的端粒方向的位点杂交的至少第二侧翼探针;

(b)计数复数个细胞中至少第一和至少第二侧翼探针以及至少一个目标 探针产生的FISH信号;

(c)提供从(i)人为半合缺失发生率和(ii)人为纯合缺失发生率选出的至少 一个人为缺失发生率;

(d)根据步骤(b)计数的FISH信号确定至少一个表观缺失发生率,所述 表观缺失发生率从(i)表观半合缺失发生率和(ii)表观纯合缺失发生率选出,其 中如果步骤(c)未提供人为纯合缺失发生率,所述至少一个表观缺失发生率包 含表观半合缺失发生率;如果步骤(c)未提供人为半合缺失发生率,所述至少 一个表观缺失发生率包含表观纯合缺失发生率;和

(e)根据表观半合缺失发生率是否显著高于人为半合缺失发生率,确定 样品是否包含带有至少一个目标基因半合缺失的细胞;或者根据表观纯合缺 失发生率是否显著高于人为纯合缺失发生率,确定样品是否包含带有至少一 个目标基因纯合缺失的细胞。

发明的另一个实施方案是进行基于FISH的分析的方法,以区别性地检 测21号染色体中带21q22.13-21q22.3的小缺失和大缺失,所述方法包括:

(a)用探针组对包含复数个细胞的细胞样品进行FISH;或者用所述探 针组中包含的第一探针子集对含有复数个细胞的第一细胞样品进行FISH, 和用所述探针组中包含的第二探针子集对与所述第一细胞样品来自相同个 体的含有复数个细胞的第二细胞样品进行FISH,

其中所述探针组包含

与位于TMPRSS2和ERG之间的至少两个目标基因杂交的至少两个目 标探针,

与位于至少两个目标基因着丝粒方向的位点杂交的至少第一侧翼探针;

与位于至少两个目标基因端粒方向的位点杂交的至少第二侧翼探针;

和任选地,下述中的至少一个:与位于第一侧翼探针杂交位点着丝粒方 向的位点杂交的至少第三侧翼探针,和与位于第二侧翼探针杂交位点端粒方 向的位点杂交的至少第四侧翼探针;

(b)计数复数个或复数组细胞中由至少两个目标探针和至少第一、至少 第二以及如果有的话,至少第三和至少第四侧翼探针中的至少一个产生的 FISH信号;

(c)给至少一个目标基因缺失提供至少一个第一人为缺失发生率,其中 缺失端点在至少第一和至少第二侧翼探针之间,其中一个缺失端点在两个目 标基因之间;

(d)给至少一个目标基因缺失提供至少一个第二人为缺失发生率,其中 (i)任何一个缺失端点都不在两个目标基因之间,或者(ii)如果使用了至少第三 和至少第四侧翼探针中的至少一个,则至少一个缺失端点不在至少第一和至 少第二侧翼探针之间;

(e)根据步骤(b)计数的FISH信号,给至少一个目标基因缺失确定至少 一个第一表观缺失发生率,其中缺失端点在至少第一和至少第二侧翼探针之 间,其中一个缺失端点在两个目标基因之间;

(f)根据步骤(b)计数的FISH信号,给至少一个目标基因缺失确定至少 一个第二表观缺失发生率,其中(i)任何一个缺失端点都不在两个目标基因之 间,或者(ii)如果使用了至少第三和至少第四侧翼探针中的至少一个,则至少 一个缺失端点不在至少第一和至少第二侧翼探针之间;和

(g)根据至少一个第一表观缺失发生率是否显著高于至少一个第一人为 缺失发生率,确定细胞样品是否包含,或者第一和第二细胞样品是否包含, 带有至少一个目标基因的小缺失的细胞;和根据至少一个第二表观缺失发生 率是否显著高于至少一个第二人为纯合缺失发生率,确定细胞样品是否包 含,或者第一和第二细胞样品是否包含,带有至少一个目标基因的大缺失的 细胞。

发明的另一个实施方案是探针组,所述探针组包含至少一个与PTEN杂 交的探针,至少一个与FAS或SUFU杂交的探针,和至少一个与TSPAN15 杂交的探针。

发明的另一个实施方案是探针组,所述探针组包含至少一个与位于 TMPRSS2和ERG之间的至少一个目标基因杂交的探针,至少一个与 DYRK1A或ERG杂交的探针,和至少一个与TMPRSS2或U2AF1杂交的探 针。

应当理解,以上的概述和下面对实施方案的描述都仅仅是示范性和解释 性的,不对权利要求请求保护的发明范围构成限制。

实施方案的描述

A.概述

发明的实施方案包括进行基于FISH的分析的方法;基于FISH的肿瘤 抑制基因缺失分析中使用的探针的制备方法;基于FISH的肿瘤抑制基因缺 失分析的优化方法;以及探针组、组合物和试剂盒,所述试剂盒包含可用于 基于FISH的肿瘤抑制基因缺失分析的探针。

在某些实施方案中,肿瘤抑制因子选自PTEN、p53、p16(又称为 CDKN2A)、RB1、DCC、BRCA1、BRCA2和APC。在例如Chang H et al.,Multiple myeloma involving central nervous system:high frequency of chromosome 17p13.1(p53)deletions,British Journal of Haematology 2004,127:280-284; Kohno T and Yokota J,Molecular processes of chromosome 9p21 deletions causing inactivation of the p16 tumor suppressor gene in human cancer: Deduction from structural analysis of breakpoints for deletions,DNA Repair 2006;5:1273-1281;Friend SH et al.,A human DNA segment with properties of the gene that predisposes to retinoblastoma and osteosarcoma,Nature 1986, 323:643-6;Popat S and Houlston RS,A systematic review and meta-analysis of the relationship between chromosome 18q genotype,DCC status and colorectal cancer prognosis,European Journal of Cancer 2005,41:2060-2070;Becker K et al.,Deletions of BRCA1/2and p53 R248W gain-of-function mutation suggest impaired homologous recombination repair in fragile histidine triad negative sebaceous gland carcinomas,British Journal of Dermatology 2008, 159:1282-1289;和CastellsaguéE et al.,Detection of APC gene deletions using quantitative multiplex PCR of short fluorescent fragments,Clin.Chem.2008, 54:1132-40中讨论过这些肿瘤抑制因子。

在某些实施方案中,肿瘤抑制因子选自位于人染色体上选自10q23、 17p13、13q14、9q24和9p21的染色体带的肿瘤抑制因子。在某些实施方案 中,肿瘤抑制因子选自位于人染色体上选自10q、17p、13q、9p、1p、5q、 19q、20q、8p、12p和16q的染色体臂的肿瘤抑制因子。在例如Kolomietz E et al.,Quantitative PCR identifies a minimal deleted region of 120kb extending from the Philadelphia chromosome ABL translocation breakpoint in chronic myeloid leukemia with poor outcome,Leukemia 2003,17:1313-1323,2003; Haase D,Cytogenetic features in myelodysplastic syndromes,Ann.Hematol. 2008,87:515-526;Reifenberger J et al.,Molecular genetic analysis of oligodendroglial tumors shows preferential allelic deletions on 19q and 1p,Am.J. Pathol.1994,145:1175-1190;Chang B et al.,Integration of Somatic Deletion Analysis of Prostate Cancers and Germline Linkage Analysis of Prostate Cancer Families Reveals Two Small Consensus Regions for Prostate Cancer Genes at 8p, Cancer Research 2007,67:4098-4103;和Reiner M et al.,Microarray comparative genomic hybridization analysis of tubular breast carcinoma shows recurrent loss of the CDH13locus on 16q,Human Pathology 2008,39:1621-1629 中讨论了上述染色体带和染色体臂中存在的肿瘤抑制因子。

人染色体臂和染色体带如ISCN 2009.An International System for Human Cytogenetics Nomenclature,Editors:Shaffer LG,Slovak ML,Campbell LJ., 2009;Chapter 2,S.Karger Publishers Inc.中的定义。

以下定义是有助于理解发明实施方案的名称和概念的定义,其后是对实 施方案的详细讨论以及这些实施方案的例子。虽然实施方案的讨论按照节和 子节组织,应当理解一个子节中讨论的许多方面与其它节中的实施方案有关 联;例如,关于探针类型的讨论与使用所述探针的方法相关。

B.定义

本文中,“边界区”是染色体中出现缺失端点的频率增加的区域。通过测 量多个样品的缺失端点,然后识别其中聚集了许多端点的区域可以确定肿瘤 抑制基因附近的边界区在染色体上的位置。一群样品中的缺失端点可以通过 诸如FISH或者利用阵列进行的比较基因组杂交(CGH)的技术来测量,这在 以下0节中有进一步讨论。在某些实施方案中,边界区的大小大于或者等于 50kb、100kb、200kb、300kb、400kb、500kb或1Mb,和/或小于或等于 1.5Mb、2Mb、3Mb、4Mb或5Mb。边界区包括通过CGH鉴定的脆性区 域。

对于给定的肿瘤抑制基因、区域大小和感兴趣的状况(例如前列腺癌), 包含肿瘤抑制基因的染色体在某些实施方案中可能包含“主要边界区”。主要 边界区是处于肿瘤抑制基因着丝粒或者端粒方向的缺失端点发生率最大的 区域。可以有两个主要边界区,在肿瘤抑制基因一边一个。

术语“缺失”用于本文是从细胞遗传学角度对染色体的结构变异的描述, 其中染色体臂的一部分丢失。因此,缺失是被定位在失去的特定基因组区域 上的染色体物质和基因的丢失。概括地说,将FISH探针(比如通过将来自细 菌人工染色体(BACs)的DNA标记而制备的探针)与细胞样品杂交,利用是否 存在FISH信号可以确定是否存在缺失。临床上遇到的最简单的缺失类型是 中间缺失(见图1)。某些缺失被认为是微小缺失,即低于传统细胞遗传学分 析的分辨率(~5Mb DNA)的缺失。这类亚显微的DNA中间缺失发生在染色 体内部,并且可能发生在一个染色体区段(cytoband)以内。它们可能只有几 百个kb DNA,通常通过FISH方法来检测。

本文中,“探针组”是一群被区别标记或者能够区别标记从而用于多色 FISH分析的DNA序列。染色体组中的探针可以通过本领域技术人员已知的 各种程序来制备,包括但不限于通过从宿主菌株中分离BAC或粘粒DNA; 基因组或克隆DNA的扩增(例如,聚合酶链式反应或滚环扩增);或者人工 合成例如一组寡核苷酸,所述探针覆盖目标基因组中足够大的一个区域(例 如至少50kb或至少100kb)从而生成能够通过荧光显微镜可见的信号。应 当指出,给定区域的探针可以来源于复数个细菌人工染色体(BACs)、粘粒、 扩增产物、寡核苷酸等。某些情况中,可能要设计探针不含会与基因组其它 区域也发生杂交的重复序列。应当理解,“包含”“来源于”特定BAC的探针 的探针组对于所用的其它BAC来说都是开放式的,无论是针对书面描述的 探针或者提供或针对其它探针而言都如此。相反,由“来源于”特定BAC的 探针“组成”的探针组对于所用的其它BAC来说是封闭式的。与特定基因“杂 交”的探针具有与该特定基因至少部分重叠的结合位点。所述探针可能或者 不能还与相邻基因的一部分杂交。术语“基因通常用于指代基因组DNA中被 染色体坐标限定的一个区域,所述染色体坐标是比如数据库, v3.05,Feb.13,2011(参见,例如http://www.genecards.org)中给特定基因提供 的。

本文中,“FISH信号”是在FISH分析检测中观察到的由探针及其靶分子 杂交产生的荧光点。FISH信号常常呈现点状,但根据被观察细胞中染色质 的凝聚状态,看上去并不总是完全紧密的。

当讨论包含复数个具有给定特性的细胞的细胞样品时,应当注意不一定 细胞样品中所有细胞都具有所述给定特性。

本文中,“人为缺失发生率”是指缺失分析中观察到由于误差来源而造成 的缺乏FISH信号情况的发生率,所述误差来源是比如样品制备过程中细胞 核发生截断或者与样品中细胞的基因型无关的任何其它原因。利用不含有 FISH分析中的目标基因的缺失的阴性对照样品可以确定人为缺失发生率。

本文中,“表观缺失发生率”是指缺失分析中观察到缺乏FISH信号情况 的发生率;因此表观缺失发生率是人为缺失发生率(通常对于测试样品是未 知的,但可以象以上讨论的由对照样品估计得到)和样品中实际缺失发生率 的组合。表观缺失发生率可以指缺少特定的一或多个FISH信号的发生率、 目标探针丢失一个FISH信号的总体发生率、目标探针丢失两个FISH信号 的总体发生率,或者目标探针丢失至少一个FISH信号的总体发生率。

本文中,“整倍体数”是指对给定类型的细胞来说正常的基因的拷贝数。 对于体细胞中常染色体基因座典型的整倍体数是2,除了在复制后分裂前整 倍体数是4。本领域技术人员还知道整倍体数不同的其它一些情况,例如在 已经发生了减数分裂的生殖系细胞中,和雄性细胞的X染色体基因座整倍体 数减少一半。Y染色体基因座的整倍体数在雌性细胞中是0,在雄性细胞中 是1(或者在复制后分裂前是2)。

“染色体计数探针”是指用于确定细胞核中特定染色体的数量的探针; 常见的染色体计数探针的类型包括能够与着丝粒或近着丝粒基因座杂交的 探针。

在提到候选探针组给出的人为缺失发生率和/或灵敏度的数值时使用的 “良好的”意味着所述数值至少优于接受检测的候选探针组的平均数值。当然 还可以通过采用更严格的标准来选择候选探针组,比如人为缺失发生率和/ 或敏感度数值在至少60th、70th、80th、90th或95th百分位数(百分位数越高表 明表现越好,即灵敏度越高或者人为缺失发生率越低)。

如果第一基因座比第二基因座更靠近着丝粒,第一基因座是位于第二基 因座的“着丝粒方向”。

如果第一基因座比第二基因座更靠近第一基因座所处的臂的端粒,第一 基因座是位于第二基因座的“端粒方向”。

当相对第三基因座,第一基因座位于第二基因座的“远端”(比如杂交位点 相对边界区位于肿瘤抑制因子的远端)意味着第一基因座离第二基因座比它 离第三基因座更远;因此,如果杂交位点相对边界区位于肿瘤抑制因子的远 端,其中所述边界区处于肿瘤抑制因子的着丝粒方向,则杂交位点一定处于 肿瘤抑制因子的着丝粒方向。同样地,如果杂交位点相对边界区位于肿瘤 抑制因子的远端,其中所述边界区处于肿瘤抑制因子的端粒方向,则杂交位 点一定处于肿瘤抑制因子的端粒方向。

C.制备探针的方法

发明部分涉及探针的制备,所述探针可用于为了缺失检测进行的三色或 更多色FISH分析。探针经设计,其杂交位点位于在人癌症中常常发生缺失 的例如0.5-10兆碱基(mb)DNA的基因组间隔(genomic interval)内或者在基 因组间隔的末端或者末端附近。制备了与肿瘤抑制基因杂交的目标探针,并 且提供了杂交位点处于肿瘤抑制基因端粒和着丝粒方向的侧翼探针(图 2A)。

根据发明所述方法制备的侧翼探针的杂交位点可以位于鉴定到的边界 区之内,和/或相对边界区位于肿瘤抑制基因的远端。在某些实施方案中,侧 翼探针具有的杂交位点相对边界区位于肿瘤抑制基因的远端,其中杂交位点 的中心靠近边界区的近边,例如距离边界区的近边低于或等于2Mb、1.5Mb、 1Mb、500kb、200kb或100kb。

1.边界区的鉴定

边界区的鉴定可以利用来源于公共领域数据集的比较基因组杂交数据, 比如[http://www.broadinstitute.org/tumorscape/pages/portalHome.jsf]提供的, 在Beroukhim R et al.,The landscape of somatic copy-number alteration across human cancers,Nature 2010,463:899-905中有描述;还可参见Liu W et al., Copy number analysis indicates monoclonal origin of lethal metastatic prostate cancer,Nat Med 2009,15:559-65和Ferreira BI et al.,Array CGH and gene-expression profiling reveals distinct genomic instability patterns associated with DNA repair and cell-cycle checkpoint pathways in Ewing's sarcoma, Oncogene 2008;27:2084-2090。一般来说,这些数据集是通过用经过标记的 来自复数个癌变性样品(例如肿瘤样品)的可能包含目标肿瘤抑制因子缺失 的DNA与区别标记的来自正常细胞的不包含缺失的参照DNA一起和高分 辨率基因组微阵列进行比较杂交实验获得的。来自复数个样品的基因组DNA 一经被确认包含频繁发生目标肿瘤抑制因子缺失的子集,则可以将其中有一 簇缺失断点的区域鉴定为边界区,所述缺失断点定位为各个样品中拷贝数的 明显变更。这可以由癌变性样品群体中位点的平均丰度来鉴定,作为随着位 点逐渐向目标肿瘤抑制因子靠近,拷贝数随位点的明显下降。例如,相对参 照,平均拷贝数在诸如500kb、750kb、1Mb、1.5Mb或2Mb的长度上会 减少比如15%、20%或25%的量。

当进行大量阵列比较基因组杂交分析(例如50、75、100或以上)以便各 个地检验复数个样品时,也可以通过确定每个样品中哪里发生拷贝数变更, 将这些位置分级(binning)(例如,分选至对应诸如50kb、100kb、200kb、300 kb、400kb、500kb、1Mb、1.5Mb或2Mb大小的DNA片段的级别中), 并且鉴定出拷贝数变更明显富集的级别从而确认边界区。各个样品中的拷贝 数变更可以按照例如Ferreira BI et al.,Array CGH and gene-expression profiling reveals distinct genomic instability patterns associated with DNA repair and cell-cycle checkpoint pathways in Ewing's sarcoma,Oncogene 2008, 27:2084-2090中的描述来鉴定。可以利用排序分段(rank segmentation)来鉴定 有增加和丢失的段,这一过程在例如商业软件Nexus Copy Number版本4 或5(February 2010)(BioDiscovery,El Segundo,CA)中采用了,如用户手册中 所述。

除了以上边界区确定模式,在如上所述鉴定的拷贝数变更附近可能存在 被称为“节段性重复”的微同源性序列类型和被称为“拷贝数变异”(CNVs)的 其它类型。在某些实施方案中,当拷贝数变更的邻接处或者附近(例如25、 50、75或100kb以内)存在这两种类型序列中的至少一种或者两种时,该区 域即被选中用于如下所述的FISH探针分析。节段性重复的位点可以从 Segmental Duplication Database(She X et al.,Shotgun sequence assembly and recent segmental duplications within the human genome,Nature 2004; 431:927-930)获得。CNV数据可以从Sanger Institute’s CNV Project (http://www.sanger.ac.uk/humgen/cnv/)获得;参见例如Redon R et al.,Global variation in copy number in the human genome,Nature 2006,444:444-454和 Komura D et al.,Genome-wide detection of human copy number variations using high-density DNA oligonucleotide arrays,Genome Res.2006,16:1575-84。

Stankiewicz P,Lupski JR,Genome architecture,rearrangements and genomic disorders,Trends Genet.2002,18:74-82;Beroukhim R et al.,The landscape of somatic copy-number alteration across human cancers,Nature 2010,463:899-905 和Casci T,Genome evolution:CNV evolution revisited,Nature Reviews Genetics 2008;9:814-815中也讨论了CNVs和节段性重复。

某些实施方案中,确定了拷贝数转换(transition)附近是否存在一簇节段 性重复。一个簇在500kb、1Mb或2Mb的区域内可以包含至少3、4、5、6 或更多个节段性重复。

除了以上的边界区确定模式,替代地或者附加地,可以利用FISH,通 过用一系列探针对大量可能包含目标肿瘤抑制因子缺失的样品(例如300或 更多样品)进行分析检测来鉴定边界区,其中所述探针的杂交位点沿染色体 正常序列分布。系列中的探针如果没有其它探针结合在它们之间,则被认为 是相邻的。如果两个相邻探针中,距离目标肿瘤抑制因子较远的探针在包含 缺失的样品生成的FISH信号比距离目标肿瘤抑制因子较近的那个生成的更 频繁,则可以确认这两个探针之间存在边界区。下文中讨论了显著性阈值。

2.杂交位点

如果探针与位点能够稳定地形成可以在低严紧条件(比如45°C,在含有 50%甲酰胺的2X SSC中)下通过FISH检测的碱基对,所述探针被认为与位 点杂交。通常,较低的严紧度与低温和高盐浓度关联(Bayani J,Squire JA, Fluorescence in situ Hybridization(FISH),Curr Protoc Cell Biol.2004;Chapter 22:Unit 22.4)。

根据本发明方法制备的探针的杂交位点可以有多种方式定位,包括下述 中的一或多种:

(a)相对目标和其它杂交位点定位

本发明中制备探针组的方法一般包括提供至少一个与肿瘤抑制基因中 的核酸序列杂交的目标探针,和至少两个侧翼探针,其中的一个与位于肿瘤 抑制基因着丝粒方向的位点杂交,一个与肿瘤抑制基因端粒方向杂交。

(b)相对第一和第二边界区定位

侧翼探针可以相对边界区进行定位。一个侧翼探针可以与第一边界区内 的核酸序列杂交,或者与相对第一边界区处于肿瘤抑制基因远端的核酸序列 杂交;另一个侧翼探针可以与第二边界区内的核酸序列杂交,或者与相对第 二边界区处于肿瘤抑制基因远端的核酸序列杂交。在某些实施方案中,这些 序列相对第一或第二边界区位于肿瘤抑制基因的远端。

(c)相对其它边界区定位

所述方法还可以包括鉴定其它边界区(比如第三、第四或第五边界区), 并且给每个额外的边界区提供探针,所述探针与所述额外边界区内的核酸序 列杂交或者与相对所述额外边界区处于肿瘤抑制基因远端的核酸序列杂交; 杂交位点可能靠近边界区。当鉴定了两个以上边界区时,可以预期样品之间 的缺失大小各异。可以利用探针组,根据离目标探针较近的一或多个侧翼探 针产生的FISH信号是否丢失以及目标探针本身产生的FISH信号,来获取 关于缺失大小的信息。

3.探针大小和来源

除了鉴定边界区,探针组的制备方法还包括提供探针。作为探针使用的 DNA可以通过下述途径获得:从一或多个已经存在的宿主菌株或BAC/粘粒 文库分离BAC或粘粒DNA;或者构建一或多个新的BACs或粘粒;扩增(例 如聚合酶链式反应或滚环复制)基因组或克隆DNA;或者人工合成DNA,例 如覆盖目标基因组中足够长区域(例如至少50kb或至少100kb)的一组寡核 苷酸从而能够生成荧光显微镜可见的信号。被探针杂交的区域的大小可以大 于或者等于50kb或100kb,和/或小于或等于150kb、200kb、300kb、400 kb或500kb。

4.探针功能

在某些实施方案中,根据发明方法制备的所述至少一个目标探针和至少 第一和第二侧翼探针可以用于基于FISH的肿瘤抑制因子缺失分析,其中所 述分析具有的显著性阈值是低于20%、25%、30%或35%的人为缺失发生率 加上三个标准差,是在5μm厚,平均核直径小于5μm的甲醛固定石蜡包埋 细胞样品上确定的。来自诸如癌变性样品的样品的FFPE切片中的完整细胞 核可能不呈现完美的球形,而是在切片制备过程中被略微压缩为椭圆形。

D.探针组和试剂盒

发明涉及根据以上描述的方法制备的探针组。

发明还涉及这样的探针组,所述探针组包含至少一个与PTEN杂交的探 针,至少一个与FAS或SUFU杂交的探针,和至少一个与TSPAN15杂交的 探针。在这类实施方案中,所述至少一个与PTEN杂交的探针作为目标探针, 所述至少一个与FAS或SUFU杂交的探针和至少一个与TSPAN15杂交的探 针作为侧翼探针。在某些实施方案中,探针组包含至少一个额外的与 BMPR1A杂交的侧翼探针。在某些实施方案中,探针组包含至少一个额外的 与WAPAL杂交的侧翼探针。

在某些实施方案中,所述至少一个与PTEN杂交的探针包含来源于BAC RP11-846G17的探针。在某些实施方案中,探针组包含的与FAS杂交的至 少一个探针来源于BACs RP11-399O19和RP11-360H20中的至少一个。在某 些实施方案中,探针组包含的与TSPAN15杂交的至少一个探针来源于BACs RP11-404C6和RP11-6P16中的至少一个。在某些实施方案中,探针组包含 的与BMPR1A杂交的至少一个探针来源于RP11-141D8和RP11-52G13中的 至少一个。在某些实施方案中,探针组包含的与WAPAL和/或BMPR1A杂 交的至少一个探针来源于RP11-351D13、RP11-661D10、RP11-141D8和 RP11-52G13中的至少一个。在某些实施方案中,探针组包含的与WAPAL杂 交的至少一个探针来源于RP11-141D8和RP11-661D10中的至少一个。在某 些实施方案中,探针组包含的与SUFU杂交的至少一个探针来源于 RP11-18I14和RP11-2F13中的至少一个。这些和所有其它本文提及的BACs 可以从Roswell Park Cancer Institute,Buffalo,New York和BACPAC Resources Center at Children's Hospital and Research Center at Oakland, California获得。例如NCBI Clone Registry (http://www.ncbi.nlm.nih.gov/ projects/genome/clone/)提供了序列的有关信息。

下表提供的信息是对于可以在本公开所述探针组中使用的选中的BACs 在10号染色体上的杂交位点(定位按照版本NCBI36/hg18,March 2006)。

  开始 结束

着丝粒方向(10q11.21)     RP11-89J23 43,432,326 43,596,132 RP11-1044H3 43,572,030 43,801,357 RP11-80C16 43,723,472 43,889,995       TSPAN15(10q21.3)     RP11-404C6 70,784,881 70,979,123 RP11-6P16 70,824,041 71,006,065       BMPR1A/WAPAL(10q23.2)     RP11-351D13 87,894,018 88,064,908 RP11-661D10 88,057,057 88,255,780 RP11-141D8 88,280,060 88,465,884 RP11-52G13 88,441,801 88,565,254       PTEN(10q23.31)     RP11-846G17 89,666,216 89,843,092       FAS(10q23.31)     RP11-399O19 90,596,403 90,783,731 RP11-360H20 90,679,956 90,860,541       SUFU(10q24.32)     RP11-18I14 104,104,382 104,271,861 RP11-2F13 104,232,698 104,414,392

在某些实施方案中,探针组包含与PTEN、FAS和TSPAN15杂交的探 针,其中所述至少一个与PTEN杂交的探针包含来源于BAC RP11-846G17 的探针,所述至少一个与FAS杂交的探针包含来源于BACs RP11-399O19 和RP11-360H20的探针,所述至少一个与TSPAN15杂交的探针包含来源于 BACs RP11-404C6和RP11-6P16的探针。

在某些实施方案中,探针组包含至少一个着丝粒探针或近着丝粒探针。 这些探针可以用于染色体计数。近着丝粒探针的例子包括来源于BACs RP11-89J23、RP11-1044H3和/或RP11-80C16的探针。

在某些实施方案中,探针组由来源于RP11-846G17;RP11-399O19和 RP11-360H20中的至少一个;以及RP11-404C6和RP11-6P16中的至少一个 的探针组成。

在某些实施方案中,探针组由来源于RP11-846G17;RP11-399O19和 RP11-360H20中的至少一个;以及RP11-141D8和RP11-52G13中的至少一 个的探针组成。

通常,探针可以由BAC通过标记反应,比如缺口平移产生探针。但是, 对于提供未标记形式的探针的情况,这种衍生可能只是简单的培养和分离 BAC;换句话说,BACs的衍生物包括BACs本身。

1.探针标记

可以将本发明的探针组标记。也可以将探针组提供为未标记的形式,但 能够通过某种方式(例如作为单独的溶液或者冻干剂)在杂交前将探针区别标 记。

标记可以是直接荧光标记。这可以在有被直接标记的核苷酸类似物的情 况下,通过已知方法,比如缺口平移或随机引物引导来实现。也有可能进行 间接标记,这种情况中给标记反应,比如缺口平移或随机引物引导反应中提 供的核苷酸类似物本身不带有荧光团,但它所含的某部分能够在之后共价或 非共价地附着荧光团。参见例如Bayani J,Squire JA.Fluorescence in situ Hybridization(FISH),Curr Protoc Cell Biol.2004;Chapter 22:Unit 22.4。例如, 带有氨基烯丙基(aminoallyl)部分的核苷酸类似物可以与荧光团共价偶联;带 有生物素或者地高辛部分的核苷酸类似物可以与结合伙伴(比如分别与亲和 素或抗地高辛)非共价地结合,其中所述结合伙伴带有荧光标签。也有可能 通过提供多级结合伙伴来放大信号,比如识别第一结合伙伴并且经过标记的 第二结合伙伴(例如抗体),可能还有识别第二结合伙伴并且经过标记的第三 结合伙伴等等。

可以在本文描述的探针和方法中使用的荧光团的例子是: SpectrumGreen、SpectrumOrange、SpectrumRed和SpectrumAqua (all from Abbott Molecular,Inter Medico,Markham,ON,Canada);7-氨基-4-甲基香豆素 -3-乙酸(AMCA);Texas Red(TM)(Molecular Probes,Inc.,Eugene,Oreg.); 5-(和-6)-羧基-X-罗丹明;丽丝胺(lissamine)罗丹明B;5-(和-6)-羧基荧光素; 异硫氰酸荧光素(FITC);7-二乙胺基香豆素-3-羧酸;四甲基罗丹明-5-(和-6)- 异硫氰酸酯;5-(和-6)-羧基四甲基罗丹明;7-羟基香豆素-3-羧酸;6-[荧光素 5-(和-6)-甲酰胺]己酸;N-(4,4-二氟-5,7-二甲基-4-硼-3a,4a偶氮 -3-indacenepropionic acid;伊红-5-异硫氰酸;赤藓红-5-异硫氰酸;5-(和-6)- 羧基罗丹明6G和Cascade(TM)蓝乙酰叠氮化物(Molecular Probes,Inc., Eugene,Oreg.)。在LAVysion探针组中,使用了不同颜色的荧光团从而探针 组中的每个染色体探针能够区别显现。这些荧光团中的许多有偶联核苷酸形 式的商品,例如偶联了dCTP和/或dUTP。

与探针组中每个探针一起使用的荧光团一般应当选择能够通过荧光显 微镜区分的。例如,四种可以互相区分开的荧光团是SpectrumGreen、 SpectrumOrange、SpectrumRed和SpectrumAqua。通过使用混合的第五探针, 例如SpectrumAqua+SpectrumOrange可以进行五色FISH。

2.染色体计数探针

在某些实施方案中,发明的探针组包含如以上定义的染色体计数探针。 在某些实施方案中,所述染色体计数探针在10号染色体上有杂交位点,例 如CEP 10探针(Vysis Abbott Molecular,Des Plaines,IL,USA)。

3.试剂盒

发明涉及包含以上描述的探针组的试剂盒。所述试剂盒还包含进行FISH 分析检测的其它有用试剂,比如蛋白酶(例如,蛋白酶K或胰蛋白酶)、缓冲 液(例如,柠檬酸钠),和/或用于样品预处理的化学剂,比如硫氰酸钠。

4.组合物

发明提供了包含以上描述的探针组的组合物,其中探针组的探针进行了 区别标记。所述组合物可以是水性组合物,并且可以包含其它物质,比如缓 冲液(例如Tris、碳酸氢钠、MOPS、HEPES)、盐和/或螯合剂(例如EDTA、 EGTA)。

E.分析方法

发明提供了通过FISH分析检测肿瘤抑制因子缺失情况的方法。可以在 这类方法中使用的探针组包括按照以上C小节制备的探针组和D小节的探 针组。在某些实施方案中,探针组的杂交位点相对边界区的定位如0和0 小节中讨论的。

一般来说,通过FISH检测分析肿瘤抑制因子缺失的方法包括用探针组 进行FISH的步骤。所述探针组包含与位于肿瘤抑制基因着丝粒方向的位点 杂交的至少第一侧翼探针;与位于肿瘤抑制基因端粒方向的位点杂交的至少 第二侧翼探针;和至少一个与肿瘤抑制基因杂交的目标探针。计数来自侧翼 探针和目标探针的FISH信号。至少提供一个人为缺失发生率作为阴性对照。 人为缺失发生率可以是之前用不含肿瘤抑制基因缺失的对照样品确定的,并 且人为缺失发生率可以在多次分析中重复使用。根据计数的FISH信号,至 少确定一个表观缺失发生率。样品是否包含带有肿瘤抑制基因缺失的细胞取 决于表观缺失发生率是否显著超过比人为缺失发生率。人为缺失发生率和与 它进行比较的表观缺失发生率在缺失发生率是半合缺失发生率还是纯合缺 失发生率,缺失是否影响探针位点这方面是匹配的。

1.样品

通过FISH分析肿瘤抑制因子缺失的方法中使用的样品是细胞样品。在 某些实施方案中,样品用保存剂进行了化学固定,所述保存剂是比如福尔马 林、乙醇、甲醛、多聚甲醛-戊二醛,或者甲胂酸钠、福尔马林和戊二醛的 组合;并包埋在惰性固体物质中,比如石蜡或者冰冻组织基质,例如最佳切 割温度(OCT)混合物中。在某些实施方案中,样品包含的细胞中有至少50%、 60%、70%、80%或90%不是中期(例如是间期)细胞。参见例如Wick MR, Mills NC,Brix WK.Tissue Procurement,Processing,and Staining Techniques. Chapter 1.p.1-10.Diagnostic Histochemistry edited by Wick MR.Cambridge University Press 2008)。

通常,提供的样品带有固体支持物(例如,包埋着样品的石蜡基质,和/ 或玻片或者微量滴定孔的壁)。

2.进行FISH

发明的缺失分析法涉及荧光原位杂交(FISH)。术语“原位杂交”通常是指 核酸探针与作为细胞制品或者组织制品一部分的目标核酸的杂交。一般来 说,FISH法包括以下步骤:(a)提供如以上讨论的固定在固体支持物上的样 品;(b)通过例如化学物或蛋白酶处理(例如含有8%异硫氰酸钠的10mM柠 檬酸盐缓冲液pH 6.0;0.2N HCl或者25μg/ml蛋白酶K或750U/ml胰蛋白 酶)样品来增加探针DNA与目标DNA的接触;(c)将含有目标DNA的组织 或材料与探针组中的标记探针接触,从而形成特异杂交复合体;(d)杂交后 洗涤复合体以便选择性地除去非特异性与目标DNA杂交的探针,和(e)检测 由和目标DNA分子形成杂交复合体的探针产生的FISH信号。描述过这类 方法的多种资源包括:Gall and Pardue,Methods of Enzymology 1981; 21:470-480;Henderson,International Review of Cytology,1982,76:1-46; Angerer,et al.,in Genetic Engineering:Principles and Methods(Setlow and Hollaender,Eds.)1985,vol.7,pp.43-65,Plenum Press,New York和 Varella-Garcia M et al.,EGFR fluorescence in situ hybridisation assay: guidelines for application to non-small-cell lung cancer,J.Clin.Pathol.2009, 62:970-977。

在某些实施方案中,用诸如蛋白酶K或胰蛋白酶的蛋白水解酶处理细胞 核可以减轻标记DNA与被完整固定的细胞核中的蛋白质的非特异性结合。 同样利用诸如CCD(Charge Coupled Device)相机进行的图像获取可以与用 图像处理软件进行的图像加工偶联从而减少由非特异性杂交产生的背景荧 光。此外,探针中的重复序列与基因组中的重复序列的交叉杂交会导致复杂 的荧光信号。可以在杂交方案中包括Cot-1DNA抑制步骤来缓解这一问题。 由于Cot-I fraction中的核酸具有含高度重复序列(例如Alu序列、α-卫星和β- 卫星序列)的特征,这些核酸与基因组中的重复序列结合,从而阻断探针与 这类序列的结合(参见例如Benjamin Lewin,Genes V,1994,Oxford University Press)。此外,可以通过物理去除或直接合成来制备被除掉重复序 列的探针;参见例如Rogan et al.,Sequence-Based Design of Single-Copy Genomic DNA Probes for Fluorescence In Situ Hybridization,Genome Res. 2001,11:1086-1094;Navin et al.,PROBER:oligonucleotide FISH probe design software,Bioinformatics 2006,22:2437-2438和美国专利申请公开 2003/0022166(Collins et al.)。

以下的例子是制备样品和进行FISH的过程。可以用固定剂将组织固定, 然后包埋在石蜡中。然后用切片机切片,放置到载片上。根据待分析的癌变 性或癌前期细胞的类型,可以由活检切片或其它来源制备样品;例如,来源 可以选自前列腺、乳腺、黑素瘤和其它固体瘤:针刺活检样品、细针吸取活 检、根治性前列腺切除术、转移性样品(例如来自骨或淋巴结的)、细胞学制 品(来自体液,比如尿液或腹水)和分离自外周血的循环肿瘤细胞。在某些实 施方案中,可以通过将细胞在乙醇或甲醇中固定来制备标本:乙酸结合细胞 离心、薄层沉积(例如ThinPrep,Cytyc Corp.)、抹片或者滴定到显微镜载片 上。

可以使用任何合适的原位杂交方法。在原位杂交前,将每个细胞内含有 的染色体DNA变性。变性一般是在有高pH、加热(例如,70°C-95°C的温 度,例如83°C)、有机溶剂(比如甲酰胺和四丁基卤化铵,或者它们的组合) 的情况下温育进行。例如,可以联合使用70°C以上的温度(例如73°C或 83°C,温育大约5分钟)和含有70%甲酰胺和2X SSC(0.3M氯化钠和0.03M 柠檬酸钠)的变性缓冲液将染色体DNA变性。建立的变性条件通常要能够保 存细胞的形态。例如,染色体探针可以通过加热来变性,例如通过将探针加 热到大约73°C或83°C大约5分钟。

下表显示了一例玻片FFPE样品的处理过程。

某些实施方案中,比如提供的探针组中的探针是双链形式时,探针组中 的探针也可以在原位杂交前变性。可以使用以上描述的变性条件。

去除变性化学物或条件后,将探针在杂交条件下与染色体DNA退火。 “杂交条件”是能够促进探针与目标染色体DNA之间的退火的条件。杂交条 件根据探针的浓度、碱基组成、复杂度和长度,以及盐浓度、温度和温育持 续时间而不同。例如,原位杂交可以在杂交缓冲液中进行,所述杂交缓冲液 含有1X-2X SSC、50-55%甲酰胺、杂交加速剂(例如10%硫酸葡聚糖)和用 于抑制非特异性杂交的未标记的阻断DNA。通常如上所述的杂交条件包括 25°C-55°C的温度和0.5小时-96小时的温育时长。在某些实施方案中,杂 交可以在32°C-大约45°C的温度下进行2-16小时。

染色体探针与目标区域之外的DNA的非特异性结合可以通过一系列用 盐溶液进行的洗涤来去除。每次洗涤的温度和盐浓度取决于所希望的严紧 度。例如,对于高严紧度条件,洗涤可以在大约65°C-大约80°C,使用0.2X -2X SSC和0.1%-1%非离子型去污剂(比如NP-40)进行。通过降低洗涤温度 或者提高洗涤中的盐浓度可以降低严紧度。探针与组织样品的杂交可以人工 进行,或者借助仪器,比如ThermoBrite杂交炉、VP 2000Processor或者 XMatrix(TM)加工仪器(均可从Abbott Molecular,Inc.购买)。

检测经过杂交和洗涤的样品的FISH信号使得可以实时进行后续分析, 比如由操作人员直接在显微镜上观察荧光,或者通过记录图像以待之后分 析。检测通常包括使用对分析中所用每个荧光团来说合适的激发光光源(例 如,光线穿过合适的滤镜,或者来自合适波长激光的光线);然后荧光发射 光穿过合适的滤镜,由操作人员直接观察和/或使用可以与电脑相连的相机 (比如基于胶片的相机或者数码相机)拍摄。

3.计数

计数样品中复数个细胞核的FISH信号。在某些实施方案中,所述复数 个细胞核包含至少50、75或100个细胞核。计数的进行可以通过例如制作 一个列表,所述列表含有每个被检测的细胞核和它含有多少各种FISH信号 的录入项;和/或通过数每个观察到组合FISH信号量的细胞核的数量。在某 些实施方案中,这样的列表还可以含有可能存在但没有观察到的FISH信号 量组合。可以通过给每个观察到的FISH信号量组合设立录入项,以及相伴 的它们的发生率将列表重新组织(参见例如以下表2)。正如下文讨论的,通 过计数FISH信号获得的信息应当在参考至少一个人为缺失发生率的情况下 进行解释。

4.人为缺失发生率

缺失分析方法包括提供至少一个人为缺失发生率。除了缺失,细胞核缺 少来自目标探针的FISH信号可能还有其它原因;例如,对于切片样品的情 况,包括甲醛固定石蜡包埋样品,样品中的一些细胞核可能被截断了。也可 能是在FISH程序的杂交步骤中,细胞核部分里的目标杂交位点的可接触性 不够。此外,观察到的FISH信号发生率可能受到被研究的组织制品的质量 和老化效应的影响。因此,并非每个缺少来自目标探针的FISH信号的细胞 核都说明真的存在基因缺失。

因此,为了减少假阳性(错误地识别为缺失)的可能,提供至少一个人为 缺失发生率以便将表明细胞含有分析目标的缺失的结果与那些可能是由于 内在基因型之外的原因(比如以上讨论过的误差的技术来源)造成缺少目标探 针信号的结果区分开。

人为缺失发生率可以利用已知不含目标基因缺失的细胞样品,在对照分 析的基础上进行确定。利用与测试细胞样品在样品制备方法方面非常匹配的 对照样品,可以相对测试样品优化由对照样品确定的人为缺失发生率的准确 性。例如,可以使用非肿瘤组织样品,比如与肿瘤抑制基因丢失测试使用的 癌前期/癌变性/潜在的癌变性样品类型相同的组织的良性增生作为对照。在 针对前列腺癌进行的分析的情况中,可以从只是因为良性前列腺增生(BPH) 进行手术的未患癌症患者中获得非肿瘤组织样品用于对照。人为缺失发生率 还受到其它生物变量的影响,所述生物变量既会影响FISH信号,也影响肿 瘤切片中的相对胞核体积。DNA的凝集程度、细胞核的大小和几何形状、 样品切片的厚度、分析的设计(3或4色FISH分析中的信号距离部分取决于 探针的基因组距离)以及生长速率和倍性状态(倍性水平越高的可能性越大 暗含细胞核体积越大的信息)。除了这些核变量,与基因组的凝聚区域(例如 被抑制基因的DNA)相比,实际的FISH信号自身(“点大小”)在去凝聚的核 染色质(发生表达的基因的典型开放DNA包装)中可能占据更多三维空间。 而且,如果已经发生了DNA复制,由于细胞DNA的重复造成了G2细胞核 呈现“双联体doublet”或成对点计数,个体FISH信号可能更难于解释。这些 双联体是物理相连(即通过线接触或连接)的成对点,或者是相邻的(存在小于 最大信号或点的直径的缺口)。在某些实施方案中,可以调节打分标准以保 证这一效应不会歪曲分析结果(参见Varella-Garcia M et al.,EGFR fluorescence in situ hybridisation assay:guidelines for application to non-small-cell lung cancer,J Clin Pathol.2009,62:970-977)。这包括将物理相连 的一对点和/或相邻点只算做一个信号。相邻的但相距至少最大信号的直径的 点可以算做单独的信号。另一方面,在DNA复制之前,每个信号显示为单 一点状杂交信号(“单态体singlet”),这些也只算一个信号。这些变量中诸 如倍性、胞核大小和染色质凝聚程度的几个可能在正常对照样品和肿瘤标本 之间不同。因此,对于间期FISH分析检测人为缺失发生率建立所使用的阴 性对照可能很难完全考虑这些因素;这对于肿瘤细胞含量低或含有其它亚克 隆基因变化的样品尤其重要。因此,如下文进一步讨论的,建议对缺失识别 使用相对严格的统计阈值。

在某些实施方案中,提供至少两个或更多个人为缺失发生率。例如,可 以提供半合缺失和纯合缺失的人为缺失发生率。还可以给不同探针组合提供 造成失去FISH信号的缺失的单独人为缺失发生率,所述缺失是例如只影响 目标探针的缺失;影响目标探针和最靠近目标探针的着丝粒方向侧翼探针的 缺失;影响目标探针和最靠近目标探针的端粒方向侧翼探针的缺失;以及影 响目标探针、最靠近目标探针的着丝粒方向侧翼探针和最靠近目标探针的端 粒方向侧翼探针的缺失。在使用了两个以上侧翼探针的探针组实施方案中, 可以给指定探针组中的每个探针提供人为缺失发生率,从而还可以考虑影响 到离目标探针更远的侧翼探针的缺失。

提供分开的人为缺失发生率的优点是胞核与胞核之间由于误差来源(比 如截断事件)造成的FISH信号丢失比克隆群体的基因型变化性更大,因此对 于给定类型的缺失(例如,影响目标探针和最靠近目标探针的端粒方向侧翼 探针的缺失),人为缺失发生率比如果分析中至少有一个着丝粒方向侧翼探 针没有使用的情况的人为缺失发生率低,因为有些误差来源,比如截断事件 可能也影响到至少一个着丝粒方向侧翼探针。

人为缺失发生率的减少根据被分析的细胞类型可以非常有帮助,因为某 些细胞类型特别容易产生截断现象。例如,在近期一项关于5微米组织切片 中截断造成的间期FISH信号损失的研究中,发现大约20%正常骨髓细胞核 表现出由于截断造成的信号损失。与之相较,正常肝切片中~60%的细胞核 表现出截断损失(Wilkens L et al.2005.Standardised fluorescence in situ hybridisation in cytological and histological specimens.Virchows Arch 2005; 447:586–592)。对于检测损失中假阳性率的这一差别被认为是由于截断的切 割后果,在制备5微米切片的过程中大得多的形状不规则的肝细胞核更常被 截断,因此影响更大。

5.确定至少一个表观缺失发生率

通过计数FISH信号获得的信息经过分析确定至少一个表观缺失发生 率。表观缺失发生率是观察到的样品中丢失目标探针的频率。应当指出,相 对提供至少一个人为缺失发生率的步骤,这一步骤可以在任何时机进行。与 人为缺失发生率类似,在某些实施方案中,确定至少两个或更多个表观缺失 发生率。为了效率考虑,通常建议将确定表观缺失发生率和提供人为缺失发 生率按照易于比较的一对进行(例如,影响目标探针和最靠近目标探针的端 粒方向侧翼探针的半合缺失的人为和表观缺失发生率)。无论如何,为了进 行下一个步骤,至少一个表观缺失发生率是和至少一个人为缺失发生率属于 同样类型的缺失事件。

6.肿瘤抑制基因缺失的检测

根据是否有至少一个表观缺失发生率显著大于至少一个人为缺失发生 率,确定样品是否包含带有缺失的细胞。显著性阈值可以根据希望的特异性 相对灵敏度的水平来选择;常见数值包括根据统计学检验(比如一或二尾的 t-检验)小于或等于0.05的p-值,或者与人为缺失发生率有至少三倍标准差 的差异。在某些实施方案中,使用了比如人为缺失发生率加上至少2.5、3 或3.5标准差的显著性阈值来确定是否有至少一个表观缺失发生率显著大于 至少一个人为缺失发生率。

正如以上讨论的,可以提供多个人为缺失发生率,并确定多个表观缺失 发生率。因此,这个步骤可以包括确定是否存在多种类型的缺失。例如,有 来自侧翼和目标探针的两组FISH信号表明细胞核不含目标肿瘤抑制因子的 缺失(如图2B示意,左侧的简图)。缺少目标探针FISH信号中的一个或者两 个分别表明表观半合(图2B,中间的)或纯合(图2B,右侧的)缺失。由是否 还缺少一或多个侧翼探针可以获得关于表观缺失的大小的信息。图2B右侧 和中间简图的例子表明发生的是较小的缺失,其中只有目标探针受到了影 响。

因此,在某些实施方案中,方法包括确定样品是否包含带有选自这样的 缺失的细胞,所述缺失是只影响目标探针的缺失;影响目标探针和最靠近目 标探针的着丝粒方向侧翼探针的缺失;影响目标探针和最靠近目标探针的端 粒方向侧翼探针的缺失;以及影响目标探针、最靠近目标探针的着丝粒方向 侧翼探针和最靠近目标探针的端粒方向侧翼探针的缺失。

除了图2B显示的简单缺失形式,由于含有侧翼对照探针的区域附近的 其它重排,还可能看到更复杂的包括信号增加或损失的模式。例如,在晚期 前列腺癌中观察到的某些PTEN基因丢失似乎含有涉及与PTEN紧密相连 的基因的复杂丢失(讨论如下)。此外,由于不均衡易位、染色体多体 (polysomies)或者多倍体(polyploidy)造成的复杂的染色体增加也可能造成带 有额外点的其它复杂信号模式。和在正常细胞核内观察到的简单模式不同的 任何形式如果在相当大比例的细胞中出现,通常也被认为是异常的。对异常 模式中信号的数量和位置的仔细评估可以提供关于内在的染色体变化的宝 贵信息。

7.边界区

分析中使用的一或多个侧翼探针可以具有位于边界区或者相对边界区 位于肿瘤抑制基因远端的杂交位点。在某些实施方案中,所述至少一个第一 侧翼探针与位于肿瘤抑制基因着丝粒方向的第一边界区之内的或者其着丝 粒方向的位点杂交,和/或所述至少一个第二侧翼探针与位于肿瘤抑制基因端 粒方向的第二边界区之内的或者其端粒方向的位点杂交。使用杂交位点这样 定位的侧翼探针是有用的,因为和如果相对边界区是位于肿瘤抑制基因近端 相比,这样定位的侧翼探针杂交位点被缺失的可能性更低。使用这样的探针 组可以提高出现图2B中间和右侧模式的缺失的发生率。这些模式含有来自 杂交到(假定部分或完全被缺失的)肿瘤抑制基因着丝粒方向和端粒方向的 侧翼探针的信号,而且这些模式较不可能在截断制品(其中细胞核的部分体 积被切除)中反复出现,因为这样染色体必须排列成一种方式,即含有肿瘤 抑制基因但不含任何侧翼探针杂交位点的染色质环要延伸到被切除的核体 积中。以上C.2小节中更详细地讨论了边界区和与它相对的杂交位点的定位, 那部分讨论与这里也有关。

F.区别检测小缺失和大缺失的分析方法

在两个拷贝肿瘤抑制基因都发生缺失的细胞中有可能发生的是两个独 立的大小不同的缺失事件。发明涉及区别检测发生大小不同的缺失事件的方 法。

1.探针组

在这些方法中,使用了含有至少四个探针的探针组。所述探针组包含与 肿瘤抑制基因杂交的至少一个目标探针,与位于肿瘤抑制基因着丝粒方向的 位点杂交的至少第一侧翼探针,与位于肿瘤抑制基因端粒方向的位点杂交的 至少第二侧翼探针,和下述中的至少一个:与位于第一侧翼探针杂交位点着 丝粒方向的位点杂交的至少第三侧翼探针,和与位于第二侧翼探针杂交位点 端粒方向的位点杂交的至少第四侧翼探针。探针组还可以包含着丝粒探针或 近着丝粒探针。

在某些实施方案中,探针组包含两个含有部分重叠的探针的探针子集。 所述两个子集可以用于分两部分进行的分析,其中在分析的第二部分或者反 向部分(reflex part)使用了至少一个定位不同的侧翼探针。例如,图17提供 了用于小和大PTEN缺失的两部分分析法的一个可能探针组合,其中分析第 一部分使用了着丝粒探针、TSPAN15探针、PTEN探针和FAS探针,第二 部分使用了着丝粒探针、BMPR1A探针、PTEN探针和SUFU探针。如果 缺失超出了图17中垂直虚线隔出的区域,会影响到一或多个侧翼探针;当 TSPAN15或SUFU探针受到影响时表明发生了非常大的缺失。例如,缺失 有可能造成从PTEN到端粒的整个区域的丢失,这就会影响到PTEN、FAS 和SUFU探针。更一般地说,探针组可以包含至少两个含有部分重叠的探 针的探针子集,其中所述第一子集包含至少一个目标探针,至少一个着丝粒 方向侧翼探针,至少一个端粒方向侧翼探针,和任选的至少一个具有着丝粒 或近着丝粒杂交位点的探针;所述第二子集包含至少一个目标探针,至少一 个着丝粒方向侧翼探针,至少一个端粒方向侧翼探针,和任选的至少一个具 有着丝粒或近着丝粒杂交位点的探针,并且第二子集中所述至少一个着丝粒 方向侧翼探针和至少一个端粒方向侧翼探针中的至少一个与其在第一子集 中的对应探针不同。

2.计数;人为或表观缺失发生率

计数FISH信号、提供人为缺失发生率和确定表观缺失发生率的步骤与 以上0-0小节中讨论的类似,除了有更多探针用于计数,并且分别提供和确 定更多类型缺失的人为和表观缺失发生率。例如,可以给端点位于至少第一 和至少第二侧翼探针(即最靠近目标探针的着丝粒方向和端粒方向的侧翼探 针)之间的肿瘤抑制基因缺失提供至少一个第一人为缺失发生率;可以给端 点位于两个最远端侧翼探针之间的肿瘤抑制基因缺失提供至少一个第二人 为缺失发生率,其中所述端点中的至少一个不在至少第一和至少第二侧翼探 针之间。无论所述至少三个侧翼探针一起与样品进行杂交还是在分成两部分 的分析中进行,以上讨论均适用。

同样,可以给端点位于至少第一和至少第二侧翼探针之间的肿瘤抑制基 因缺失确定至少一个第一表观缺失发生率;可以给端点位于两个最远端侧翼 探针之间的肿瘤抑制基因缺失确定至少一个第二表观缺失发生率,其中所述 端点中的至少一个不在至少第一和至少第二侧翼探针之间。

3.确定样品是否包含带有小缺失或大缺失的细胞

如以上E.6小节的描述,根据相关表观缺失发生率是否显著大于相关人 为缺失发生率,可以确定样品是否包含带有肿瘤抑制基因缺失的细胞,所述 缺失影响着任何所用侧翼探针的杂交位点。

对于这样的样品,所述样品中的目标探针的表观半合或纯合缺失发生率 显著高于相当的人为缺失发生率,如果侧翼探针的表观缺失发生率都没有显 著高于相当的人为缺失发生率,可以确定样品仅仅包含小的缺失(不影响任 何侧翼探针)。

如果目标探针和至少一个侧翼探针具有的表观缺失发生率显著高于相 当的人为缺失发生率,则可能存在大的缺失。

应当指出,基于来自同一染色体的FISH信号倾向于靠在一起,一般可 以排除这样的不寻常小缺失对的可能性,所述小缺失对是10号染色体一个 拷贝上只有侧翼探针的杂交位点发生缺失,10号染色体另一个拷贝上只有目 标探针的杂交位点发生缺失;因此,对于半合大缺失的情况,来自未被影响 的染色体的FISH信号应当相距很近。

有可能同时存在小缺失和大缺失;在这种情况中,目标探针的表观纯合 缺失发生率显著高于相应的人为纯合缺失发生率,并且至少一个侧翼探针的 表观半合缺失发生率显著高于相应的人为半合缺失发生率。在大的缺失造成 两个侧翼探针杂交位点的丢失(例如从肿瘤抑制因子到端粒之间整个区域的 丢失,影响到具有位于肿瘤抑制因子端粒方向的杂交位点的两个侧翼探针) 的情况中,则应当有两个侧翼探针的表观半合缺失发生率显著高于相应的人 为半合缺失发生率。

在某些实施方案中,对于其中至少有一个是大缺失的肿瘤抑制基因纯合 缺失,表明是可转移或转移肿瘤;可转移肿瘤能够在身体的另一个部位形成 至少第二个肿瘤,而第二个肿瘤即是转移肿瘤。在一些这类实施方案中,肿 瘤抑制基因的一个拷贝因为小缺失而丢失,一个拷贝因为大缺失而丢失。在 某些实施方案中,肿瘤抑制基因的两个拷贝均因为大缺失而丢失。在某些实 施方案中,至少有一个大的缺失影响到位于肿瘤抑制因子端粒方向的至少两 个侧翼探针杂交位点。在某些实施方案中,所述至少两个侧翼探针杂交位点 (相对肿瘤抑制基因)更远是距离肿瘤抑制基因至少5、7.5、10或12.5Mb。

在某些实施方案中,检测小缺失和大缺失的方法包括:用探针组中包含 的第一探针子集对包含复数个细胞的第一细胞样品进行FISH,和用探针组 中包含的第二探针子集对来自和第一细胞样品相同个体的包含复数个细胞 的第二细胞样品进行FISH;肿瘤抑制基因是PTEN;所述第一探针子集包含 与TSPAN15杂交的侧翼探针和与FAS杂交的侧翼探针;并且所述第二探 针子集包含与BMPR1A或WAPAL (应当明白,与BMPR1A或WAPAL中的 一个杂交的探针可能也杂交到另一个,因为它们是相邻基因)杂交的侧翼探 针和与SUFU杂交的侧翼探针。该方法中检测到PTEN缺失时,可以利用 分析是否有至少一个侧翼探针杂交位点与PTEN一起被缺失来确定缺失是 否是大的缺失。

4.边界区

正如E小节的方法,在某些实施方案中,所述至少一个第一侧翼探针可 以与位于肿瘤抑制基因着丝粒方向的第一边界区之内的或者其着丝粒方向 的位点杂交;和/或所述至少一个第二侧翼探针可以与位于肿瘤抑制基因端粒 方向的第二边界区之内的或者其端粒方向的位点杂交。

也可能使第三和/或第四侧翼探针定位在边界区之内或者在肿瘤抑制基 因相对边界区的远端。这就是说,在某些实施方案中,所述至少一个第三侧 翼探针与位于第一远端边界区着丝粒方向的位点杂交,其中所述第一远端边 界区处于所述至少一个第一侧翼探针杂交位点的着丝粒方向;和/或所述至少 一个第四侧翼探针与位于第二远端边界区端粒方向的位点杂交,其中所述第 二远端边界区处于所述至少一个第二侧翼探针杂交位点的端粒方向。

边界区和杂交位点相对边界区的位置在以上C.2小节有更详细讨论;那 部分讨论与这里也相关。

G.对分析进行优化的方法

发明涉及对基于FISH的肿瘤抑制基因缺失分析进行优化的方法。在这 些方法中提供了复数个候选探针组,并且利用每个探针组在至少一个包含复 数个细胞的样品上进行FISH,其中所述细胞含有整倍数的肿瘤抑制基因完 整拷贝。计数FISH信号并确定人为缺失发生率。从候选探针组中选择具有 良好的人为缺失发生率的探针组用于优化的基于FISH的肿瘤抑制基因缺失 分析法中。

1.候选探针组

某些实施方案中提供了至少两个、至少三个、至少四个、至少五个或者 更多个候选探针组。所述候选探针组可以有某些共同的探针;例如至少两个 候选探针组可以包含至少一个相同的目标探针,和/或至少一个相同的侧翼探 针。当然,各个候选探针组之间应当有至少一个探针不同。在某些实施方案 中,至少一个、至少两个、至少三个或至少四个侧翼探针位于边界区之内或 者相对边界区位于肿瘤抑制基因的远端,其中探针离边界区近。

2.人为缺失发生率的确定

通过在至少一个样品上进行FISH给每个候选探针组确定人为缺失发生 率,所述样品包含的复数个细胞含有整倍数的肿瘤抑制基因完整拷贝。人为 缺失发生率的确定是按照以上描述通过计数FISH信号进行的。某些实施方 案中,FISH是用每个探针组在复数个样品上进行的,比如至少两个、至少 三个、至少四个或至少五个样品,以便能够对测量到的人为缺失发生率进行 统计学上更严谨的比较。

3.具有良好的人为缺失发生率的探针组的选择

选择能够给出良好的人为缺失发生率的探针组用于经过优化的分析法 中。在某些实施方案中,选中的探针组的人为缺失发生率在至少60th、70th、 80th、90th或95th百分位数,可以理解百分位数越高表明表现越好(即,越低 的人为缺失发生率)。

4.含有缺失的样品的使用

在某些实施方案中,还用每个被发现具有良好人为缺失发生率的候选探 针组或者候选探针组的子集在复数个细胞样品上进行了FISH,其中所述细 胞样品包含的复数个细胞含有肿瘤抑制基因的纯合或半合缺失。如上所述, 计数FISH信号,并确定表观缺失发生率。

(a)灵敏度

因为已知样品包含的细胞含有肿瘤抑制基因的纯合或半合缺失,根据复 数个样品中有多少经确定具有比给候选探针组确定的人为缺失发生率显著 高的表观缺失发生率,可以确定灵敏度值。如果确定了至少三个样品的人为 缺失发生率,候选探针组的人为缺失发生率的标准差可以按照以上描述的常 规方式来确定,其中所述样品包含的复数个细胞含有整倍数肿瘤抑制基因完 整拷贝。替代地,可以估计人为缺失发生率的标准差(例如,基于候选探针 组总的人为缺失发生率,或者基于其它探针组的已知标准差)以用于确定显 著性,从而评估灵敏度。用于确定显著性的可选阈值如上文的讨论。

(b)根据灵敏度值和人为缺失发生率对探针组进行选择

当至少某些候选探针组的灵敏度得到确定时,可以选择具有良好的灵敏 度值和良好的人为缺失发生率的候选探针组用于经优化的分析。某些实施方 案中,人为缺失发生率和/或灵敏度值在至少60th、70th、80th、90th或95th百 分位,可以理解百分位越高表明表现越好(即,灵敏度越高或者人为缺失发 生率越低)。

H.用于原癌和癌变基因座表征的分析方法

肿瘤抑制基因(比如PTEN)是编码能够以一种或者其它种方式抑制细胞 增殖的蛋白的基因。丢失一或多个这种“细胞制动器”会通过开放细胞周期导 致发生许多癌症,使丢失事件成为“癌变性”。许多蛋白被认为是由肿瘤抑制 基因编码的,包括胞内蛋白,比如p16细胞周期蛋白-激酶抑制剂;分泌型 激素的受体(例如,肿瘤衍生型生长因子β);如果DNA遭到破坏或者染色 体出现异常时阻滞细胞周期的检查控制蛋白;促进细胞凋亡的蛋白;和甚至 参与DNA修复的酶(失去修复DNA中的错误、缺口或者断裂末端能力的细 胞会在许多基因中积累突变,所述基因包括对控制细胞生长和增殖很重要的 那些)。

因为一个拷贝的肿瘤抑制基因可能就足够控制细胞增殖,所以通常必须 是肿瘤抑制基因的两个等位基因都发生丢失或灭活才会促进肿瘤的发展。因 此,肿瘤抑制基因中癌变性功能丧失型突变倾向于是隐性的。在许多癌症中, 有一或多个肿瘤抑制基因中发生缺失或点突变,造成由突变的肿瘤抑制基因 不产生蛋白或者仅产生没有功能的蛋白。然而,即使只失去一个拷贝的肿瘤 抑制因子也可能使细胞更易于发生第二次癌变事件。例如,在TMPRSS2-ERG 和PTEN丢失,以及与AKT的进一步关联中似乎就存在这种关系。参见 Squire,JA,TMPRSS-ERG and PTEN loss in prostate cancer,Nat Genetics(2009) 41,509-510。异常ERG表达在小鼠中被鉴定为与PTEN丢失关联的癌变事 件。参见Carver,BS,Tran J,Gopalan A,Chen Z,et al.,Aberrant ERG expression cooperates with loss of PTEN to promote cancer progression in prostate.Nat Genetics(2009)41,619-624。Carver等建议虽然失去一个拷贝的PTEN可能 促进了细胞增殖,但只有ERG被过表达的情况下细胞才会进展为浸润性疾 病。参见上文。同样地,仅带有人ERG过表达构建体的小鼠似乎不会发展 出前列腺肿瘤,但与带有PTEN缺失的小鼠交配的后代的确会发生肿瘤。参 见King JC,et al.Nat Genetics(2009)41,524-526。

即便是有这些近期的发现,对于前列腺癌发生中的这类癌变事件仍然所 知甚少,虽然前列腺癌是北美男性中最常见的肿瘤和第二大癌症死亡原因。 参见Carver,BS,Tran J,Gopalan A,Chen Z,et al.,Aberrant ERG expression cooperates with loss of PTEN to promote cancer progression in prostate.Nat Genetics(2009)41,619-624。就与PTEN相关的癌变事件来说,在前列腺癌 (CaP)转录组中观察到了ERG1,这与它在恶性前列腺组织中是过表达的前癌 基因的角色一致。参见Jemal A,et al.,Cancer statistics,2005.CA Cancer J Clin. 2005;55:10–30。Tomlins等(Recurrent fusion of TMPRSS2 and ETS transcription factor genes in prostate cancer,Science,2005;310:644-648)首次描述了前列腺 癌中的再发性基因重排,所述重排导致ERG易位到TMPRSS2的启动子区 域。此外,还有其它基因显示能够易位到雄激素应答型或其它的强启动子, 目前认为这构成了ERG1过表达的机制。见上文。到目前为止描述过的基因 融合涉及雄激素-敏感性TMPRSS2基因和以上提到的ETS转录因子家族中 的三个成员(ERG、ETV1和ETV4)。以上研究从检测表达情况开始,后来发 现了经由缺失或其它重排导致过表达的这些重排。

因此,能够在前列腺癌中确认那些会导致肿瘤抑制因子缺失或者后续的 原癌基因(例如,ERG)过表达的染色体重排提供了新的了解上皮癌的机会, 而之前这类癌症只能通过非特定的染色体异常来表征。

近期的一项研究中,位于染色体21q22.2-3中的大约2Mb的常见缺失被 描述为造成以上讨论的TMPRSS2:ERG重排,并且与疾病进展有关。参见 Yoshimoto M,et al.,Three-Color FISH Analysis of TMPRSS2/ERG Fusions in Prostate Cancer Indicates That Genomic Microdeletion of Chromosome 21 Is Associated with Rearrangement.Neoplasia(2006)8,465–469。此外,利用三色 分离FISH证实21号染色体上TMPRSS2和ERG之间的缺失与基因融合事 件相关。

因此,一个大约2Mb的区域发生缺失导致ERG被过表达。这个常见缺 失造成有效地形成符号读框的融合基因。但是,几乎没有关于丢失TMPRSS2 和ERG之间的13个基因对前列腺癌进展的影响的信息。

实际上对于导致21号染色体重排产生TMPRSS2-ERG融合以及随之发 生的过表达的事件,或者融合或过表达是否与基因缺失造成PTEN表达下降 有关都所知甚少。几乎所有的关注都在融合和随之发生的ERG过表达上。 因此,本发明还可以用于确定与PTEN状态有关的后续事件的性质。

在某些实施方案中,发明提供了通过FISH分析检测肿瘤抑制因子、癌 基因、原癌基因或者其它目标基因的缺失或其它重排的方法。其中包括对形 成TMPRSS2-ERG融合基因时通常发生缺失的染色体区域中的特定目标基 因进行分析的方法,所述缺失会导致丢失含有13个基因的~2Mb的DNA(例 如,含有ERG、ETS2、FSMG1、B3GALT5、HMGN1、DSCAM、BACE2和 TMPRSS2的21q22.2区域)。可用于这些方法的探针组包括如以上C或E小 节中制备的探针组和D小节中的探针组。在某些实施方案中,探针组的杂交 位点相对边界区的定位与C.2(b)和C.2(c)小节中讨论的一致。

总的来说,通过FISH分析至少一个目的基因缺失情况的方法包括利用 探针组进行FISH的步骤。所述探针组包含与处于目的基因着丝粒方向的位 点杂交的至少第一侧翼探针,与处于目的基因端粒方向的位点杂交的至少第 二侧翼探针,以及与目的基因杂交的至少目标探针。计数来自侧翼探针和目 标探针的FISH信号。提供至少一个由细胞核截断导致的人为缺失发生率作 为阴性对照。有可能用对照样品在之前确定人为缺失发生率,所述样品不包 含带有目的基因缺失或重排的细胞,并且人为缺失发生率可以在多个分析检 测中重复使用。根据计数的FISH信号,确定至少一个表观缺失发生率。样 品是否包含带有目的基因缺失的细胞根据所述表观缺失发生率是否显著高 于人为缺失发生率来确定。与表观缺失发生率进行比较的人为缺失发生率应 当在缺失发生率是半合还是纯合缺失发生率,以及哪些探针杂交位点受到缺 失的影响这些方面是相配的。

1.样品

通过FISH分析至少一个目的基因的缺失的方法中使用的样品是细胞样 品。在某些实施方案中,样品用保存剂进行了化学固定,所述保存剂是比如 福尔马林、乙醇、甲醛、多聚甲醛-戊二醛,或者甲胂酸钠、福尔马林和戊 二醛的组合;并包埋在惰性固体物质中,比如石蜡或者冰冻组织基质中,例 如最佳切割温度(OCT)混合物。某些实施方案中,样品包含的细胞中至少有 50%、60%、70%、80%或90%不是中期(例如是间期)细胞。参见例如Wick MR, Mills NC,Brix WK.Tissue Procurement,Processing,and Staining Techniques. Chapter 1.p.1-10.Diagnostic Histochemistry edited by Wick MR.Cambridge University Press 2008。

通常,提供的样品带有固体支持物(例如,包埋着样品的石蜡基质,和/ 或玻片或者微量滴定孔的壁)。

2.进行FISH

本发明的缺失分析方法涉及荧光原位杂交(FISH)。术语“原位杂交”通常 是指核酸探针与作为细胞或者组织制品一部分的目标核酸的杂交。以上F.2 小节中讨论了典型的FISH方法。

制备样品和进行FISH的过程的例子是本领域已知的,并在F小节中讨 论过。正如讨论过的,根据待分析的癌变性或癌前期细胞的类型,可以由许 多来源制备样品;例如,来源可以选自前列腺、乳腺、黑素瘤和其它固体瘤。 可以由针刺活检、细针吸取活检、根治性前列腺切除术、转移性样品(例如 来自骨或淋巴结的)、细胞学制品(来自体液,比如尿液或腹水)和分离自外 周血的循环肿瘤细胞,利用在乙醇或甲醇中固定细胞的标准制备方法获得样 品:乙酸结合细胞离心、薄层沉积(例如ThinPrep,Cytyc Corp.)、抹片或者 滴定到显微镜载片上。

可以采用E2小节中讨论过的合适的原位杂交方法。在原位杂交之前, 将细胞内含有的染色体DNA变性。变性一般是在有高pH、加热(例如,70°C- 95°C的温度)、有机溶剂(比如甲酰胺和四丁基卤化铵,或者它们的组合)的 情况下温育进行。建立的变性条件通常要能够保存细胞的形态。例如,可以 联合使用70°C以上的温度(例如73°C)和含有70%甲酰胺和2X SSC(0.3M 氯化钠和0.03M柠檬酸钠)的变性缓冲液将染色体DNA变性。替代地,例 如由细针吸取活检样品获得的染色体DNA可以通过在83°C加热5分钟来 变性。

某些实施方案中,比如提供的探针组中的探针是双链形式时,探针组中 的探针也可以在原位杂交前变性。可以使用以上描述的变性条件。

去除变性化学物或条件后,将探针在杂交条件下与染色体DNA退火。 “杂交条件”是能够促进探针与目标染色体DNA之间的退火的条件。杂交条 件根据探针的浓度、碱基组成、复杂度和长度,以及盐浓度、温度和温育持 续时间而不同。例如,原位杂交可以在杂交缓冲液中进行,所述杂交缓冲液 含有1X-2X SSC、50-55%甲酰胺、杂交加速剂(例如10%硫酸葡聚糖)和用 于抑制非特异性杂交的未标记的阻断DNA。通常如上所述的杂交条件包括 25°C-55°C的温度和0.5小时-96小时的温育时长。在某些实施方案中,杂 交可以在32°C-大约45°C的温度下进行2-16小时

染色体探针与目标区域之外的DNA的非特异性结合可以通过一系列用 盐溶液进行的洗涤来去除。每次洗涤的温度和盐浓度取决于所希望的严紧 度。例如,对于高严紧度条件,洗涤可以在大约65°C-大约80°C,使用0.2X -2X SSC和0.1%-1%非离子型去污剂(比如NP-40)进行。通过降低洗涤温度 或者提高洗涤中的盐浓度可以降低严紧度。探针与组织样品的杂交可以人工 进行,或者借助仪器,比如ThermoBrite杂交炉、VP 2000Processor或者 XMatrix(TM)加工仪器(均可从Abbott Molecular,Inc.购买)。

检测经过杂交和洗涤的样品的FISH信号使得可以实时进行后续分析, 比如由操作人员直接在显微镜上观察荧光,或者能够通过记录图像以待之后 分析。检测通常包括使用对分析中所用每个荧光团来说合适的激发光光源 (例如,光线穿过合适的滤镜,或者来自合适波长激光的光线);然后荧光发 射光穿过合适的滤镜,由操作人员直接观察和/或使用可以与电脑相连的相机 (比如基于胶片的相机或者数码相机)拍摄。

3.计数

计数样品中复数个细胞核的FISH信号。在某些实施方案中,所述复数 个细胞核包含至少50、75或100个细胞核。计数的进行可以通过例如制作 一个列表,所述列表含有每个被检测的细胞核和它含有多少各种FISH信号 的录入项;和/或通过数每个观察到组合FISH信号量的细胞核的数量。在某 些实施方案中,这样的列表还可以含有可能存在但没有观察到的FISH信号 量组合。可以通过给每个观察到的FISH信号量组合设立录入项,以及相伴 的它们的发生率将列表重新组织(参见例如以下表2)。正如下文讨论的,通 过计数FISH信号获得的信息应当在参考至少一个人为缺失发生率的情况下 进行解释。

4.人为缺失发生率

缺失分析方法包括提供至少一个人为缺失发生率。正如以上F.4小节讨 论过的,除了缺失或重排,任何样品的细胞核缺少来自一或多个目标探针的 FISH信号可能还有其它原因;例如,对于细针吸取活检样品的情况,包括 甲醛固定石蜡包埋样品,样品中的一些细胞核可能被截断了。也可能是FISH 程序的杂交步骤中,由于细胞挤压或其它细针活检技术造成的人为结果使得 细胞核部分里的目标杂交位点的可接触性不够。此外,观察到的FISH信号 发生率可能受到被研究的组织制品的质量和老化效应的影响。因此,并非每 个缺少来自目标探针的FISH信号的细胞核都说明真的存在基因缺失。

因此,为了减少假阳性(错误地识别为缺失)的可能,提供至少一个人为 缺失发生率以便将表明细胞含有分析目标的缺失的结果与那些可能是由于 内在基因型之外的原因(比如以上讨论过的误差的技术来源)造成缺少目标探 针信号的结果区分开。

人为缺失发生率可以利用已知不含目标基因缺失的细胞样品,在对照分 析的基础上进行确定。利用与测试细胞样品在样品制备方法方面非常匹配的 对照样品,可以相对测试样品优化由对照样品确定的人为缺失发生率的准确 性。

例如,可以使用与肿瘤抑制基因缺失测试使用的癌前期/癌变性/潜在的 癌变性样品组织类型相同的非肿瘤组织样品作为对照。在针对前列腺癌进行 的分析的情况中,可以从只是因为良性前列腺增生(BPH)进行手术的未患癌 症患者中获得非肿瘤组织样品用于对照。对于乳腺癌,样品可以来自只是 为了预防或缩小目的进行手术的患者。

正如以上讨论过的,特别是B和E.4小节,人为缺失发生率还受到其它 既会影响FISH信号,也影响到肿瘤切片中的相对胞核体积的生物变量的影 响,所述生物变量是比如DNA的凝集程度、细胞核的大小和几何形状、样 品切片的厚度、分析的设计(3或4色FISH分析中的信号距离部分取决于探 针的基因组距离)以及生长速率和倍性状态(倍性水平越高的可能性越大暗 含细胞核体积越大的信息)。除了这些核变量,与基因组的凝聚区域(例如被 抑制基因的DNA)相比,实际的FISH信号自身(“点大小”)在去凝聚的核染 色质(发生表达的基因的典型开放性DNA包装)中可能占据更多三维空间。 而且,如果已经发生了DNA复制,由于细胞DNA的重复造成G2细胞核呈 现“双联体doublet”或成对点计数,个体FISH信号可能更难于解释。这些双 联体是物理相连(即通过线接触或连接)的成对点,或者是相邻的(存在小于最 大信号或点的直径的缺口)。在某些实施方案中,可以调节打分标准以保证 这一效应不会歪曲分析结果(参见Varella-Garcia M et al.,EGFR fluorescence in situ hybridisation assay:guidelines for application to non-small-cell lung cancer,J Clin Pathol.2009,62:970-977)。这包括将物理相连的一对点和/或相 邻点只算做一个信号。相邻的但相距至少最大信号的直径的点可以算做单独 的信号。另一方面,在DNA复制前,每个信号显示为单一点状杂交信号(“单 态体singlet”),这些也只算作一个信号。这些变量中诸如倍性、胞核大小和 染色质凝聚程度的那几个可能在正常对照样品和肿瘤标本之间不同。因此, 给间期FISH分析检测建立人为缺失发生率所使用的阴性对照可能很难完全 考虑到这些因素;这对于肿瘤细胞含量低或含有其它亚克隆基因变化的样品 尤其重要。因此,如下文进一步讨论的,建议对缺失识别使用相对严格的统 计阈值。

在某些实施方案中,提供至少两个或更多个人为缺失发生率。例如,可 以提供半合缺失和纯合缺失的人为缺失发生率。还可以给不同探针组合提供 造成失去FISH信号的缺失的单独人为缺失发生率,所述缺失是例如只影响 目标探针的缺失;影响目标探针和最靠近目标探针的着丝粒方向侧翼探针的 缺失;影响目标探针和最靠近目标探针的端粒方向侧翼探针的缺失;以及影 响目标探针、最靠近目标探针的着丝粒方向侧翼探针和最靠近目标探针的端 粒方向侧翼探针的缺失。在使用了两个以上侧翼探针的探针组实施方案中, 可以给指定探针组中的每个探针提供人为缺失发生率,从而还可以考虑影响 到离目标探针更远的侧翼探针的缺失。

提供单独的人为缺失发生率的优点是胞核与胞核之间由于误差来源(比 如截断事件)造成的FISH信号丢失比克隆群体的基因型变化性更大,因此对 于任何给定类型的缺失(例如,影响目标探针和最靠近目标探针的端粒方向 侧翼探针的半合缺失),人为缺失发生率比如果分析中没有使用至少一个着 丝粒方向侧翼探针的情况的人为缺失发生率低,因为有些误差来源,比如截 断事件可能也影响到至少一个着丝粒方向侧翼探针。

人为缺失发生率的减少根据被分析的细胞类型可以非常有帮助,因为某 些细胞类型特别容易产生截断现象。例如,在近期一项关于5微米组织切片 中截断造成的间期FISH信号损失的研究中,发现大约20%正常骨髓细胞核 表现出由于截断造成的信号损失。与之相较,正常肝切片中~60%的细胞核 表现出截断损失(Wilkens L et al.2005.Standardised fluorescence in situ hybridisation in cytological and histological specimens.Virchows Arch 2005; 447:586–592)。对于检测损失中假阳性率的这一差别被认为是由于截断的切 割后果,在制备5微米切片的过程中大得多的形状不规则的肝细胞核更常被 截断,因此影响更大。

5.确定至少一个表观缺失发生率

通过计数FISH信号获得的信息经过分析确定至少一个表观缺失发生 率。表观缺失发生率是观察到的样品中丢失目标探针的频率。应当指出,相 对提供至少一个人为缺失发生率的步骤,这一步骤可以在任何时机进行。还 有的情况是诸如倒位的其它重排方式导致了缺失。与人为缺失发生率类似, 在某些实施方案中,确定至少两个或更多个表观缺失发生率。为了效率考虑, 通常建议将确定表观缺失发生率和提供人为缺失发生率按照易于比较的一 对进行(例如,影响目标探针和最靠近目标探针的端粒方向侧翼探针的半合 缺失的人为和表观缺失发生率)。无论如何,为了进行下一个步骤,至少一 个表观缺失发生率和至少一个人为缺失发生率属于同样类型的缺失事件。

6.检测目的基因的缺失或重排

根据是否有至少一个表观缺失发生率显著大于至少一个人为缺失发生 率,确定样品是否包含带有缺失或(导致缺失的)重排的细胞。正如以上讨论 过的,可以利用多种统计方法,根据希望的特异性对灵敏度的水平来选择显 著性阈值。因此可以提供多个人为缺失发生率,并确定多个表观缺失发生率。 这个步骤还可以包括确定是否存在多种类型的缺失。例如,有来自侧翼探针 和目标探针的两组完整FISH信号(对于单个目标基因的情况,是两组3个信 号)表明细胞核不含目标肿瘤抑制因子的缺失(如图2B示意,左侧的简图)。 对于单个目标,缺少一个或者两个目标探针FISH信号分别表明表观半合(图 2B,中间的)或纯合(图2B,右侧的)缺失。由是否还缺少一或多个侧翼探针 可以获得关于表观缺失大小的信息。图2B右侧和中间简图的例子表明发生 的是较小的缺失,其中只有目标探针受到了影响。

在另一个例子中,存在来自侧翼和目标探针的两组FISH信号(对于由第 一和第二目标基因的情况,是2组4个信号)表明细胞核不含有目标肿瘤抑 制因子、癌基因或其它目标基因的缺失。在这个例子中,缺少一个或两个目 标探针FISH信号分别表明表观半合或纯合缺失。根据还缺少哪个侧翼探针 或基因目标可以获得关于表观缺失的大小的信息。

因此在某些实施方案中,方法包括确定样品是否包含带有选自下述缺失 的细胞,所述缺失是只影响目标探针的缺失;影响一个或两个目标探针和最 靠近第一目标探针的着丝粒方向侧翼探针的缺失;影响一个或两个目标探针 和最靠近第二目标探针的端粒方向侧翼探针的缺失;以及影响目标探针、最 靠近第一目标探针的着丝粒方向侧翼探针和最靠近第二目标探针的端粒方 向侧翼探针的缺失。

除了图2B显示的简单缺失形式,由于含有侧翼对照探针的区域附近的 其它重排,还可能看到更复杂的涉及信号增加或损失的模式。例如,象在21 号染色体中那样,由于不均衡易位、染色体多体(polysomies)或者多倍体 (polyploidy)造成的复杂的染色体增加也可能造成带有额外点的其它复杂信 号模式。和在正常细胞核内观察到的简单模式不同的任何形式如果在相当大 比例的细胞中出现,通常也被认为是异常的。与PTEN和其它基因一样,对 异常模式中信号的数量和位置的仔细评估可以提供关于内在的染色体变化 的宝贵信息。

7.边界区

有一个以上目标基因的分析中使用的一或多个侧翼探针可以具有位于 边界区或者相对边界区位于目的基因远端的杂交位点。在某些实施方案中, 所述至少一个第一侧翼探针与位于目的基因着丝粒方向的第一边界区之内 的或者其着丝粒方向的位点杂交,和/或所述至少一个第二侧翼探针与位于相 同或不同目的基因端粒方向的第二边界区之内的或者其端粒方向的位点杂 交。对于有两个目标基因的情况,一个目标基因被称为第一目标基因,另一 个称为第二目标基因。对于PTEN的例子,使用杂交位点这样定位的侧翼探 针是有用的,因为和如果相对边界区是位于肿瘤抑制基因近端相比,这样定 位的侧翼探针杂交位点发生缺失的可能性更低。使用这样的探针组可以提高 出现图2B中间和右侧模式的缺失的发生率。这些模式含有来自杂交到(假定 部分或完全被缺失的)目的基因着丝粒方向和端粒方向的侧翼探针的信号, 而且这些模式较不可能在截断制品(其中细胞核的部分体积被切除)中反复出 现,因为这样染色体必须排列成一种方式,即含有目的基因但不含任何侧翼 探针杂交位点的染色质环要延伸到被切除的核体积中。上文中更详细地讨论 了边界区和与它相对的杂交位点的定位,那部分讨论与这里也有关。

I.区别检测小缺失和大缺失的分析方法

在至少两个目的基因的两个拷贝均发生缺失的细胞中有可能发生的是 一或多个独立的大小不同的缺失事件。发明涉及区别检测发生了大小不同的 缺失事件的方法。

1.探针组

在涉及到更复杂重排情况(比如21q22-2中~2MB染色体区域存在的情 形,该区域根据目前的人类基因组序列图,含有不少于13个基因)的方法中, 使用了含有至少四个探针的探针组,从而可以进行更精确的缺失检测。探针 组包含与目的基因(例如,HMGN1基因和DSCAM基因)杂交的至少两个目 标探针,与位于目的基因(例如,ERG)着丝粒方向的位点杂交的至少第一侧 翼探针,与位于目的基因(例如,TMPRSS2)端粒方向的位点杂交的至少第二 侧翼探针,和任选的下述中的至少一个:与位于第一侧翼探针杂交位点(例 如,DYRK1A)着丝粒方向的位点杂交的至少第三侧翼探针,或者与位于第二 侧翼探针杂交位点(例如,U2AF1)端粒方向的位点杂交的至少第四侧翼探针。 参见Amono,K,et al.“Association study between the Down syndrome cell adhesion molecule(DSCAM)gene and bipolar disorder”(2008)Psychiatric Genetics 18(1)1-10;Cuddapah,S,et al.“Genomic profiling of HMGN1 Reveals and Association with Chromatin at Regulatory Regions”(2011)Molecular and Cellular Biology 31,700-709。在某些实施方案中,探针组可能额外包含着丝 粒探针或近着丝粒探针。

在某些实施方案中,探针组包含两个含有部分重叠的探针的探针子集。 所述两个子集可以用于分两部分进行的分析,其中在分析的第二部分或者反 向部分使用了至少一个定位不同的侧翼探针。例如,图22提供了用于小的 和大的DSCAM缺失的如上所述的两部分分析法的一个可能探针组合,其中 分析第一部分使用了着丝粒探针、TMPRSS2探针、DSCAM探针和ERG探 针,第二部分使用了着丝粒探针、DYRK1A探针、DSCAM探针和U2AF1探 针。如果缺失超出了图22中垂直虚线隔出的区域,就会影响到一或多个侧 翼探针;当TMPRSS2或ERG探针受到影响时表明发生了非常大的缺失。 例如,缺失有可能造成从DSCAM到端粒的整个区域的丢失,这就会影响到 DSCAM、TMPRSS2和U2AF1探针。

2.计数;人为和表观缺失发生率

对于上述例子,计数FISH信号、提供人为缺失发生率和确定表观缺失 发生率的步骤相对复杂,因为有多个探针用于计数,并且要分别提供和确定 多个类型缺失的人为和表观缺失发生率。

例如,可以给端点位于至少第一和至少第二侧翼探针(即最靠近目标探 针的着丝粒方向和端粒方向的侧翼探针)之间的DSCAM或HMGN1缺失提 供至少一个第一人为缺失发生率;可以给端点位于两个最远端侧翼探针之间 的目的基因缺失提供至少一个第二人为缺失发生率,其中所述端点中的至少 一个不在所述至少第一和至少第二侧翼探针之间。这就是说,第一人为缺失 发生率对应的缺失覆盖DSCAM或HMGN1中的一个或两者但不包括第一 和第二侧翼探针结合位点;第二人为缺失发生率对应的是更大的确实包含侧 翼探针结合位点的缺失。

替代地或者附加地,可以给端点位于至少第一和至少第二侧翼探针之间 的DSCAM或HMGN1缺失提供至少一个第一人为缺失发生率,其中一个端 点位于DSCAM和HMGN1之间;可以给端点不在DSCAM和HMGN1之 间的目的基因缺失提供至少一个第二人为缺失发生率。这就是说,第一人为 缺失发生率对应的缺失覆盖DSCAM或HMGN1中的一个但不包括另一个; 第二人为缺失发生率对应的是包含这两者的缺失(因为没有端点在基因之 间)。

无论所述侧翼探针一起与样品进行杂交还是在分成两部分的分析中进 行,以上讨论均适用。

3.确定样品是否包含带有小缺失或大缺失的细胞

样品是否包含带有目的基因缺失的细胞,且所述缺失是影响所用任一种 侧翼探针的杂交位点的缺失,这可以根据相关表观缺失发生率是否显著大于 相关人为缺失发生率来确定,如上文的描述。

对于目标探针的表观半合或纯合缺失发生率显著高于相当的人为缺失 发生率的那些样品,如果侧翼探针的表观缺失发生率都没有显著高于相当的 人为缺失发生率,可以确定样品仅仅包含小的缺失(不影响任何侧翼探针)。

如果目标探针和至少一个侧翼探针具有的表观缺失发生率显著高于相 当的人为缺失发生率,则可能存在大的缺失。

应当指出,基于来自同一染色体的FISH信号倾向于靠在一起,一般可 以排除不寻常小缺失对的可能性,所述不寻常小缺失是例如在20号染色体 一个拷贝上只有侧翼探针的杂交位点发生缺失,20号染色体另一个拷贝上只 有目标探针的杂交位点发生缺失;因此,对于半合大缺失的情况,来自未被 影响的染色体的FISH信号应当相距很近。

有可能同时存在小缺失和大缺失;在这种情况中,目标探针的表观纯合 缺失发生率显著高于相应的人为纯合缺失发生率,并且至少一个侧翼探针的 表观半合缺失发生率显著高于相应的人为半合缺失发生率。在大的缺失造成 两个侧翼探针杂交位点的丢失(例如从目的基因到端粒之间整个区域的丢 失,影响到具有位于目的基因端粒方向的杂交位点的两个侧翼探针)的情况 中,则应当有两个侧翼探针的表观半合缺失发生率显著高于相应的人为半合 缺失发生率。

在某些实施方案中,对于其中至少有一个是大缺失的目的基因纯合缺 失,表明是可转移或转移肿瘤;可转移肿瘤能够在身体的另一个部位形成至 少第二个肿瘤,而第二个肿瘤即是转移肿瘤。在一些这类实施方案中,目的 基因的一个拷贝因为小缺失而丢失,一个拷贝因为大缺失而丢失。在某些实 施方案中,目的基因的两个拷贝均因为大缺失而丢失。在某些实施方案中, 至少有一个大的缺失影响到位于目的基因端粒方向的至少两个侧翼探针杂 交位点。在某些实施方案中,所述至少两个侧翼探针杂交位点更远(相对目 的基因)是距离目的基因至少5、7.5、10或12.5Mb。

在某些实施方案中,检测小缺失和大缺失的方法包括:用探针组中包含 的第一探针子集对包含复数个细胞的第一细胞样品进行FISH,和用探针组 中包含的第二探针子集对来自和第一细胞样品相同个体的包含复数个细胞 的第二细胞样品进行FISH;目的基因是DSCAM和HMGN1;所述第一探针 子集包含与TMPRSS2杂交的侧翼探针和与ERG杂交的侧翼探针;并且所 述第二探针子集包含与DYRK1A杂交的侧翼探针和与U2AF1杂交的侧翼探 针。该方法中检测到DSCAM和/或HMGN1缺失时,可以利用分析是否有 至少一个侧翼探针杂交位点与DSCAM和/或HMGN1一起被缺失来确定缺 失是否是大的缺失。

4.边界区

正如H小节的方法,在某些实施方案中,所述至少一个第一侧翼探针可 以与位于目的基因着丝粒方向的第一边界区之内的或者其着丝粒方向的位 点杂交;和/或所述至少一个第二侧翼探针可以与位于目的基因端粒方向的第 二边界区之内的或者其端粒方向的位点杂交。

也可能使第三和/或第四侧翼探针定位在边界区之内或者在目的基因相 对边界区的远端。这就是说,在某些实施方案中,所述至少一个第三侧翼探 针与位于第一远端边界区着丝粒方向的位点杂交,其中所述第一远端边界区 处于所述至少一个第一侧翼探针杂交位点的着丝粒方向;和/或所述至少一个 第四侧翼探针与位于第二远端边界区端粒方向的位点杂交,其中所述第二远 端边界区处于所述至少一个第二侧翼探针杂交位点的端粒方向。

边界区和杂交位点相对边界区的位置在前面的部分中有更详细讨论;那 部分讨论与这里也相关。

J.探针组和试剂盒

发明涉及根据以上描述的方法制备的探针组。

发明还涉及这样的探针组,所述探针组包含至少一个与DSCAM或 HMGN1杂交的探针,至少一个与TMPRSS2或U2AF1杂交的探针,和至少 一个与ERG杂交的探针。在这类实施方案中,所述至少一个与DSCAM或 HMGN1杂交的探针作为目标探针,所述至少一个与TMPRSS2或U2AF1杂 交的探针和至少一个与ERG杂交的探针作为侧翼探针。在某些实施方案中, 探针组包含至少一个额外的与DYRK1A杂交的侧翼探针。

在某些实施方案中,探针组包含的与DSCAM杂交的至少一个探针来源 于BACs RP11-139D12、RP11-907P24、RP11-280O17、RP11-183I12、 RP11-281F3、RP11-1113M13和RP11-123A7中的至少一个。在某些实施方 案中,探针组包含的与HMGN1杂交的至少一个探针是来源于BACs RP11-137J13和RP11-348C15中的至少一个。在某些实施方案中,探针组包 含的与TMPRSS2杂交的至少一个探针来源于BACs RP11-35C4、 CTD-3095D11和RP11-671L10中的至少一个。在某些实施方案中,探针组 包含的与ERG杂交的至少一个探针来源于BACs RP11-476D17和 RP11-951I21中的至少一个。在某些实施方案中,探针组包含的与DYRK1A 杂交的至少一个探针来源于RP11-105O24、RP11-777J19和CTD-3140L2中 的至少一个。在某些实施方案中,探针组包含的与U2AF1杂交的至少一个 探针来源于RP11-446L19和CTD-2601A22中的至少一个。这些和所有其它 本文提及的BACs可以从Roswell Park Cancer Institute,Buffalo,New York和 BACPAC Resources Center at Children′s Hospital and Research Center at Oakland,California获得。例如NCBI Clone Registry (http://www.ncbi.nlm.nih.gov/projects/genome/clone/)提供了序列信息。

下表提供的信息是关于可以在本公开所述探针组中使用的选中的BACs 在21号染色体上的杂交位点(定位按照版本GRCh37/h19,2009年2月)。

  开始 结束 HMGN1(21q22.2)     RP11-137J13 40705310 40858474 RP11-348C15 40598841 40764635       DSCAM(21q22.2)     RP11-139D12 41318920 41468615 RP11-907P24 41464872 41657742 RP11-280O17 41558372 41699925 RP11-183I12 41671029 41831863 RP11-281F3 41782687 41975589 RP11-1113M13 41860823 42000124 RP11-123A7 42002863 42168411       ERG(21q22.2)     RP11-476D17 39682968 39863671 RP11-951I21 39899621 40089103       TMPRSS2(21q22.3)    

RP11-35C4 43254164 43420344 CTD-3095D11 43051013 43079214 RP11-671L10 42787192 42954776       U2AF1     RP11-446L19 44237045 44550450 CTD-2601A22 44456262 44606970       DYRK1A(21q22.13)     RP11-105O24 38795458 38951057 RP11-777J19 38719389 38887895 CTD-3140L2 38881424 38942365

在某些实施方案中,探针组包含与DSCAM、HMGN1、TMPRSS2和ERG 杂交的探针,其中与DSCAM is杂交的探针来源于BACs RP11-846G17、 RP11-907P24、RP11-280O17或者它们的组合;与HMGN1杂交的探针来源 于BACs RP11-8137J13、RP11-348C15或者这两者;与TMPRSS2杂交的探 针来源于BACs RP11-35C4、CTD-3095D11或者这两者;与ERG杂交的探 针来源于BACs RP11-476D17、RP11-951I21或者这两者。

在某些实施方案中,探针组包含至少一个着丝粒探针或近着丝粒探针。 这些探针可以用于染色体计数。近着丝粒探针的例子包括来源于BACs CTD-2251K12、RP11-47B13、CTD-2314J10或者它们的组合的探针。

在某些实施方案中,探针组由来源于RP11-139D12;RP11-476D17和 RP11-951I21中的至少一个;以及RP11-35C4和CTD-3095D11中的至少一 个的探针组成。

K.附图简述

包含在本说明书并构成说明书一部分的附图阐述了发明的几个实施方 案,与描述部分一起用于解释发明的原理。

图1.染色体臂部分的大的中间缺失的示意图。这个例子中,缺失发生 后丢失多个染色体区带(cytobands)。

图2.探针组结构的示意图(小图A)和使用对细胞核的三颜色、间期 FISH分析的典型解释(小图B)。小图A显示了示意性染色体上的探针杂交位 点的结构。探针A标记有第一种颜色,以加影线表示(在荧光显微镜中,该 颜色可以是例如红色);目标探针(“Tum Sup”)标记有第二种颜色,以白色表 示(在荧光显微镜中,该颜色可以是例如绿色);探针B标记有第三种颜色, 以黑色表示(在荧光显微镜中,该颜色可以是例如蓝色)。在小图B中,正常 细胞核(左图)有三对每种颜色的信号。对于简单的Tum Sup基因半合缺失(中 间的细胞核),丢失了一个“白色”FISH信号(即只有一个“白色”的信号),但 肿瘤抑制基因的侧翼探针A和B仍有两份。对于纯合缺失(右侧细胞核),两 个“白色”FISH信号都消失了,而侧翼探针保留。

图3.来自发生了复杂重排的细胞的可能FISH信号。该示意图中的 FISH信号是由图2中的相同探针组产生的。可产生左侧的模式的细胞中, 包含侧翼探针A杂交位点的区域有两份重复、且包含侧翼探针B杂交位点 的区域有一份重复。可产生右侧的模式的细胞中,肿瘤抑制因子发生半合缺 失,并且,复制事件导致包含探针B杂交位点的区域有三个额外的拷贝。

图4.阐述了利用对照正常前列腺细胞来确定给缺失打分用的阈值,和 利用双色探针组(Vysis Inc.)进行的PTEN缺失检测,其中一个探针与PTEN 杂交,另一个探针是含有着丝粒杂交位点的10号染色体的染色体计数探针。

图5.利用与TSPAN15、PTEN和FAS杂交的探针进行的FISH分析设 计。小图A阐述了可用于检测PTEN缺失事件的探针的杂交位点。这三个 探针组包含红色的PTEN探针,其着丝粒方向邻接紫罗兰色TSPAN15,端 粒方向邻接绿色FAS基因。小图B是利用正常细胞进行的四色间期FISH 的三维示意图,预期每个细胞核会有两个红色(PTEN;以白色表示)、绿色 (FAS;以斜影线表示)、蓝色(10号染色体计数探针;交叉影线)和紫罗兰色 (TSPAN15;以黑色表示)点。蓝色着丝粒探针用于确定是否存在单体10号染 色体。因为侧翼探针和目标探针的杂交位点距离很近,截断倾向于同时影响 侧翼探针和目标探针;可以设计缺失的打分算法使它更好地区分没有影响侧 翼探针和目标探针的真实缺失事件和由切片导致的截断。在检测法中,可以 利用对正常细胞核(比如这里显示的示意性切片中)的分析,给每个探针因切 片期间的截断排除所致的人为缺失发生率提供阈值水平。

图6.利用半合缺失PTEN的细胞进行的四色间期FISH的三维示意 图,预期每个细胞核含有一个红色(PTEN;以白色表示)、两个绿色(FAS; 以斜影线表示)、两个蓝色(10号染色体计数探针;交叉影线)和两个紫罗兰色 (TSPAN15;以黑色表示)点。

图7.利用含PTEN和FAS的区域半合缺失的细胞进行的四色间期 FISH的三维示意图,预期每个细胞核含有一个红色(PTEN;以白色表示)、 一个绿色(FAS;以斜影线表示)、两个蓝色(10号染色体计数探针;交叉影线) 和两个紫罗兰色(TSPAN15;以黑色表示)点。

图8.用三个探针对染色体进行的中期FISH,所述染色体来自带有小 的纯合PTEN缺失的细胞。图8A.来自着丝粒方向侧翼探针的FISH信号, 所述侧翼探针来源于RP11-420K10,其杂交位点位于10q23.2。对该探针观 察到两个双联体FISH信号。图8B.来自端粒方向侧翼探针的FISH信号, 所述侧翼探针来源于RP11-246B13,其杂交位点位于10q25.1。对该探针也 观察到两个双联体FISH信号。图8C.没有来自RP11-846G17的FISH信号, 该探针会与PTEN杂交(如果存在的话)。只能看到从DAPI通道渗透的一些 非特异性DNA染色。图8D.小图A-C中显示的三个通道与DAPI通道的 叠加。

图9显示的两个细胞核包含来自BMPR1A、PTEN、FAS和10号染色体 中心粒探针的多重FISH信号。上方的细胞核显示出两个着丝粒信号(C)和两 簇BMPR1A/PTEN/FAS (B/P/F)信号。下面的细胞核似乎是复制后细胞核,其 中有两簇BMPR1A/PTEN/FAS信号加上着丝粒信号(B/P/F/C),和两个B/P/F 簇,其中一个靠近着丝粒信号。有可能是两个着丝粒信号没有分辨开,或者 一个由于截断事件而丢失。

图10.由CGH数据得到的前列腺癌样品相比正常参照DNA的拷贝数 图谱。左边谱图表明癌症样品中DNA损失的程度,右边谱图表明DNA增 加的程度。箭头表明损失谱图中对应PTEN位点的峰。更多讨论见实施例1。

图11.带有半合PTEN缺失的82个前列腺癌样品的FISH结果。丢失 1个FISH信号的探针以阴影表示;因此仅丢失1个PTEN信号的样品只在 PTEN栏中有阴影,而同时丢失了两个侧翼探针的样品在三个栏中均有阴 影。更多讨论见实施例3。

图12.带有纯合PTEN缺失的50个前列腺癌样品的FISH结果。做图 与图11一样,除了阴影表示的是纯合损失,斜影线表示半合损失。更多讨 论见实施例3。

图13.不同PTEN缺失状态的代表性FISH显微镜图像。白色箭头表 示PTEN FISH信号。除了PTEN,使用的探针与图9中相同。小图A中的 细胞每种FISH信号有两个(正常)。小图B中的细胞常常缺少一个PTEN FISH 信号(小的半合PTEN缺失)。小图C中的细胞常常缺少一个PTEN FISH信 号和一个探针A FISH信号(大的半合PTEN缺失)。小图D中的细胞常常缺 少PTEN以及探针B的FISH信号(大的纯合缺失)。小图E中的细胞常常缺 少两个PTENFISH信号(小的纯合缺失)。

图14.染色体10q的环形示意图,其中节段性重复由环内的曲线连接。 环外的三个箭头从上到下分别表示探针A、PTEN探针和探针B的杂交位点。

图15显示了10号染色体,其中圈出了PTEN的位置。染色体示意图 下显示了由实施例1的CGH拷贝数数据得到的表示DNA损失和增加的图。 底部的两行是CNV和节段性重复位点。

图16显示了图15中PTEN周围的数据的放大图。指出了来自图13等 的探针A和探针B的位置。CNV和节段性重复显示在CGH数据下的第3 和第5行。它下方的图显现了各个前列腺癌样品中发生缺失的区域(粗线表 示缺失)。

图17.用于区分小的和大的PTEN缺失的两部分方法中的探针子集。 在方法的第一部分,可以用与TSPAN15杂交的侧翼探针、与PTEN杂交的 目标探针和与FAS杂交的侧翼探针进行FISH。还可以使用着丝粒探针。似 乎最经常发生小缺失的断裂点的边界区由虚线表示。还指出了节段性重复簇 (SD)的位置。在第二部分(“反向分析”),侧翼探针与BMPR1A和SUFU杂交。 所述分析的每一部分都在询问有一侧相对较靠近PTEN的区域是否受到大 缺失的影响,并在另一侧提供会受更大的缺失影响的更远端探针;SUFU的 情况中,丢失可以是从PTEN一直延伸到端粒的缺失引起的。

图18.用于区分小的和大的PTEN缺失的两部分分析中,来自结合在 完整染色体上的与图17一样的探针的FISH信号。

图19.如图17的两部分分析中的探针在10号染色体上的探针杂交位 点和探针所来源的BAC的示意图。小图A显示了第一子集的探针,小图B 显示了第二子集的探针(用于反向分析)。

图20.PTEN、BMPR1A、SUFU、TSPAN15和FAS附近的CNV和节 段性重复基因座的相对位置。

图21.用于从blast文件提取95%同一性和长度>10000bp的检索结果 的Python脚本语言源代码。

图22.利用四色FISH检测小的和大的缺失的探针组组合示意图。该 图显示了21q22.2区域中一个放大区段上的探针杂交位点。用竖线表示的目 标探针(DSCAM)标记有第一种颜色(例如Aqua水绿色)。用横条表示的目标 探针B(HMGN1)标记有第二种颜色(例如Gold)。方格表示的侧翼探针C (ERG)标记有第三种颜色(例如橙色)。纯色表示的侧翼探针D(5’TMPRSS2) 标记有第四种颜色(例如绿色)。示意图还显示了以点表示的着丝粒方向侧翼 探针E(DYRK1A,标记了例如绿色荧光)和交叉影线表示的端粒方向侧翼探 针F(U2AF1,标记了例如金色荧光),所述探针都用在第一组四个探针丢失 3个信号、且一个较大的缺失边界在产生影响的情况。在四色检验中,如果 探针A和B丢失,则探针C和D(橙色和绿色荧光)会保存下来。如果丢失了 探针A、B和C,而探针D(绿色荧光)仍存在,可以利用进一步的侧翼探针 进行后续3色检验以确定缺失边界。

图23.21q22.13-21q22.3区域显示基因和示范性探针位置的图,指示 了可发生缺失的区域。

实施例

现将详细论述本发明的实施方案,附图中阐述了它们的各方面和结果。

实施例1.10号染色体的拷贝数变异、节段性重复和比较基因组杂交 数据的分析;探针位点选择

经由电脑分析Liu等(Nat.Med.2009;15:559-65)的CGH数据。对来自 14名患者的58个转移CaP样品的染色体10q区进行了经由电脑的拷贝数分 析(Liu W et al.Copy number analysis indicates monoclonal origin of lethal metastatic prostate cancer,Nat.Med.2009;15:559-65),该分析运用了排序分段 (rank segmentation),显著性阈值为1.0×10-6,每节段最少5个探针(Nexus Copy Number v.4;BioDiscovery,El Segundo,CA)。将基因组不均衡指定为增 加[log(3/2)或阈值为0.2]或者损失[log(1/2)或阈值为-0.3],各通过两个由 Ferreira BI等(Array CGH and gene-expression profiling reveals distinct genomic instability patterns associated with DNA repair and cell-cycle checkpoint pathways in Ewing's sarcoma,Oncogene 2008;27:2084-2090)定义的拷贝数转 换(Copy Number Transitions,CNTs)来确定。

表明PTEN附近缺失区的数据见图16。还确定并绘制了转移性CaP样 品群体中基因座相对参照的平均丰度(图15和16;还可参见图10)。经确定 从81.5Mb到89.67Mb区域(即,PTEN着丝粒方向的~8Mb)中的丰度下降 了20%以上,表明群体中存在拷贝数转换。

从Sanger Institute’s CNV Project(http://www.sanger.ac.uk/humgen/cnv/)获得处于ASCII文本格式的拷贝数变异(Copy Number Variation,CNV)数据。 提供的数据对应国际HapMap项目(http://hapmap.ncbi.nlm.nih.gov/)采集的269个独立样品。然后将下载的文件过滤,只有与10号染色体相关的区域被 转移到电子表格。在Microsoft Excel中人工选择重叠区域。将组装的10号 染色体作为参照数据库,通过采用Blast(Altschul SF et al.,J.Mol.Biol.1990; 215:403-410)序列比对获得节段性重复数据。

然后将从Segmental Duplication Database(She X et al.,Shotgun sequence assembly and recent segmental duplications within the human genome,Nature 2004;431:927-930,http://humanparalogy.gs.washington.edu/)获得的各个节段 性重复与染色体以自动化方式进行序列比对,并给数据库中每个节段得到的 检索结果制表。过滤了Segmental Duplication Database中的9000个以上序列 的表,只有同源性大于95%并且长度超过10kb的检索结果(序列比对)被计 算机脚本自动选中(图21)。然后以和CNV节段相同的方式人工选择相连区。 认为可以将相连比对(检索结果)归为一组的临界值是50kb的距离。为了将 得到的簇分组采用的另一个临界值是100kb。

经确定表1列出的10号染色体区域中含有节段性重复(SDs)和CNVs簇。

表1.10号染色体节段性重复和CNVs

高密度区 起始(bp) 结束(bp) 长度(bp) CNV1 42,004,899 42,760,575 755,676 CNV2 45,341,719 49,121,538 3,779,819 CNV3 50,641,980 51,595,172 953,192 CNV4 76,904,943 77,440,455 535,512 CNV5 80,945,468 81,722,592 777,124 CNV6 88,505,038 89,299,742 794,704 CNV7 90,825,044 91,007,466 182,422 CNV8 98,779,953 98,952,462 172,509 CNV9 102,141,840 102,555,726 413,886 CNV10 107,519,652 107,743,529 223,877 CNV11 110,448,977 110,633,486 184,509

CNV12 122,625,702 122,891,863 266,161 CNV13 124,253,065 124,444,805 191,740 CNV14 125,047,207 125,259,149 211,942 CNV15 127,443,890 127,776,692 332,802 CNV16 134,076,220 135,240,498 1,164,278 高密度区 起始(bp) 结束(bp) 长度(bp) SD1 41,991,393 42,173,845 182,452 SD2 42,531,265 42,689,258 157,993 SD3 45,492,329 46,843,228 1,350,899 SD4 47,023,808 47,533,536 509,728 SD5 47,731,989 47,900,982 168,993 SD6 48,376,799 48,697,638 320,839 SD7 48,865,543 49,055,736 190,193 SD8 50,735,042 51,157,549 422,507 SD9 51,275,627 51,628,828 353,201 SD10 52,104,752 52,214,149 109,397 SD11 57,043,647 57,055,423 11,776 SD12 75,091,834 75,143,840 52,006 SD13 80,936,173 80,980,415 44,242 SD14 81,081,817 81,275,000 193,183 SD15 81,379,701 81,625,517 245,816 SD16 81,959,635 82,002,788 43,153 SD17 88,743,560 88,770,949 27,389 SD18 88,890,157 89,250,617 360,460 SD19 127,598,385 127,609,227 10,842 SD20 135,233,079 135,363,669 130,590

表1中的坐标是指在人类基因组UCSC版本NCBI36/hg18(Mar.2006) 的10号染色体中的位点。

基于节段性重复、CNV和群体拷贝数转换的位置,选择TSPAN15和 BMPR1A基因座作为着丝粒方向侧翼探针的杂交位点。选择FAS和SUFU 基因座作为端粒方向侧翼探针的杂交位点。

实施例2.用含有纯合PTEN缺失的样品进行的三色FISH

将来自PC3细胞系(Beheshti B et al.,Evidence of chromosomal instability in prostate cancer determined by spectral karyotyping(SKY)and interphase fish analysis,Neoplasia 2001,3:62-9)细胞的中期染色体固定,并与三个区别标记 的探针进行杂交,所述探针的制备分别使用了RP11-420K10BAC,杂交位 点在10q23.2(标记为绿色);RP11-246B13BAC,杂交位点在10q25.1(标记为 红色)和RP11-846G17,杂交位点在PTEN(标记为水绿色)。染色体还用DAPI (蓝色)进行了复染。通过荧光显微镜获取红色、绿色、水绿色和蓝色通道中 的图像。代表性染色体图像如图8所示,其中在绿色和红色通道中可以看到 四个FISH信号(小图A和B)。有4个FISH信号是因为二倍体基因组已经复 制但在中期还没有分裂。没有观察到PTEN探针的水绿色FISH信号(小图 C),虽然该通道中可以略微看到DAPI荧光。小图D显示了小图A-C三个 图像和蓝色通道DAPI荧光的叠加。

实施例3.通过四色间期FISH进行的缺失做图

在缺失至少一个拷贝PTEN的132个癌变性前列腺组织样品中进行了四 色间期FISH。这132个样品是在McGill University和University of Toronto 采集的330个癌变性前列腺临床组织样品的一个子集。以下表格提供了关于 这些样品的细节。

全部330名患者的分类

根治性前列腺切除术 134(41%) 激素抵抗性/转移肿瘤 196(59%) 总计 330

带有半合或纯合PTEN缺失的132个样品的分类

根治性前列腺切除术 86 激素抵抗性/转移肿瘤 46 总计 132

使用的探针是来源于BACs RP11-141D8和RP11-52G13(“探针A”;杂 交位点位于PTEN着丝粒方向)的探针;来源于BAC RP11-846G17的PTEN 探针;和来源于BACs RP11-399O19和RP11-360H20(“探针B”;杂交位点 位于PTEN端粒方向)的探针。所述探针通过缺口平移标记上可以区分的荧 光团。关于BAC克隆的位点信息可以从Human March 2006assembly of the UCSC Genome Browser 1获得。还使用了10号染色体着丝粒探针 SpectrumAqua标记的CEP10(Vysis Abbott Molecular,Des Plaines,IL,USA)。

对132个样品的分析表明,82个含有半合PTEN缺失,50个含有纯 合PTEN缺失,这是基于至少30%细胞中只有1或0个PTEN探针FISH信 号。此外,计数探针A和B的存在与否来确定缺失是否还覆盖了这些探针 的杂交位点。结果如以下表2所列并示于图11-13。

表2.缺失程度

在纯合PTEN缺失栏中,括号里的数字表示存在几个来自给定探针的 FISH信号;因此例如“探针A(1)”、PTEN(0)、“探针B(1)”表明或者一个染 色体只缺失了PTEN,另一个染色体缺失了从探针A到探针B的整个区域; 或者一个染色体缺失了PTEN和探针B,另一个染色体缺失了探针A和 PTEN。

只对PTEN有影响的最小缺失大小估计是176kb。影响到探针A、PTEN 和探针B的最大缺失大小范围据估计至少2.5Mb。

实施例4.难以通过双色FISH解释的样品中PTEN状态的分解 (resolution)

来自根治性前列腺切除术的一组91个福尔马林固定石蜡包埋样品在进 行本研究时临床结果未知,利用购自Abbott Inc.的PTEN和着丝粒探针进行 双色间期FISH分析;并且利用探针组经四色FISH进行分析,其中探针A 由BACs RP11-141D8和RP11-52G13制备,PTEN探针和探针B如实施例3 所述。鉴定到6个样品在这两种分析方法中的结果不同。下表3列出来这些 结果。

双色检测的分析标准是:至少70%的细胞核带有2个PTEN信号和两 个10号染色体着丝粒探针:无拷贝变化。25%-30%的细胞核丢失一个PTEN 信号,但同时存在两个着丝粒探针:不确定。超过30%的细胞核丢失一个 PTEN信号,但保留两个着丝粒探针:半合缺失。30%-100%的细胞核丢失 两个PTEN信号,保留着丝粒探针:纯合缺失。

在为指定组中每一探针建立人为截断(truncation artffacts)后,确立四色检 测的分析标准。所述标准是:至少80%的细胞核带有2个PTEN信号并保 留侧翼探针:无拷贝变化。18%-20%的细胞核丢失一个PTEN信号,但同时 保留两个侧翼探针:不确定。超过20%丢失一个PTEN信号,但同时保留两 个侧翼探针:半合缺失。20%-100%的细胞核缺失两个PTEN信号,伴随同 时丢失一个、两个或者不丢失侧翼探针:纯合缺失。

这些标准基于一个要求,即要认定为缺失,表观发生率必须大于人为缺 失发生率加上三倍标准差;这些值对双色分析是30%,对四色分析是20%; 见下表中双色和四色探针组的对照结果。人为缺失发生率是利用来自非癌变 性前列腺样品的对照样品测量到的,所述非癌变性前列腺样品来自对良性前 列腺增生患者进行的活检和/或根治性前列腺切除术。Ventura et al.,J.Mol. Diagn.2006;8:141-151中讨论了使用三倍标准差来建立FISH分析中的显著 性阈值。

表3.对照结果–四色探针组的人为缺失发生率

前列腺样品 2CEP10/2BMPR1A/1PTEN/2FAS 对照1 12 对照2 5 对照3 4 对照4 10 对照5 12 对照6 8 对照7 2 对照8 8 对照9 4 对照10 13 均值 7.8 标准差 3.9 3倍标准差 11.7 均值+3倍标准差 19.5

表4.对照结果-双色探针组的人为缺失发生率

前列腺样品 2CEP10/1PTEN(Vysis) 对照1 18 对照2 17 对照3 14 对照4 20 对照5 15 对照6 10 对照7 5 对照8 16 对照9 18 对照10 6 均值 13.9 标准差 5.2 3倍标准差 15.6 均值+3倍标准差 29.5

表5.利用双色和四色PTEN探针组对PTEN缺失的检测

样品 双色分析 用实施例3探针进行的四色分析 CaP-1 无拷贝变化 半合缺失 CaP-2 半合缺失 无拷贝变化 CaP-3 无拷贝变化 半合缺失 CaP-4 无拷贝变化 纯合缺失 CaP-5 半合缺失 无拷贝变化 CaP-6 半合缺失 无拷贝变化 CaP-7 半合缺失 无拷贝变化 CaP-8 半合缺失 无拷贝变化 CaP-9 不确定 半合和纯合缺失 CaP-10 不确定 半合缺失 CaP-11 不确定 半合缺失 CaP-12 不确定 无拷贝变化 CaP-13 不确定 无拷贝变化 CaP-14 不确定 无拷贝变化 CaP-15 不确定 无拷贝变化 CaP-16 不确定 无拷贝变化 CaP-17 不确定 无拷贝变化 CaP-18 纯合缺失 无拷贝变化 CaP-19 不确定 半合缺失 CaP-20 半合缺失 无拷贝变化

“半合-纯合缺失”表明带有两种类型的缺失的细胞数量都相当高,与开 始发生一个拷贝PTEN的缺失,然后发生克隆扩增,第二次缺失事件产生纯 合缺失的亚群一致。

因此,四色分析能够将双色分析认为是不确定的样品9-17和19分辨开。 此外,似乎有几个样品在双色分析中给出了假阳性结果(预计是由于发生了 超过平均数的截断效应),样品1、3和4似乎给出了假阳性结果。最后,在 样品9中,双色分析显然没有检测到发生半合缺失的细胞群。

四探针分析法所具有的提高的特异性和灵敏度被认为得益于较低的人 为缺失发生率,而较低的人为缺失发生率是由于侧翼探针A和B的位置更 靠近分析目标(PTEN),但仍然位于多个缺失都不影响侧翼探针的FISH信号 的位置。

实施例5.对p16而言的边界区鉴定和FISH探针制备

比较黑素瘤细胞样品与参照细胞的平均基因组拷贝数的CGH数据从 [http://www.broadinstitute.org/tumorscape/pages/portalHome.jsf]获得,在 [Beroukhim R et al.,The landscape of somatic copy-number alteration across human cancers,Nature 2010;463:899-905]中有描述。在9p21的p16基因(又称 为CDKN2A)的着丝粒方向鉴定到最近的拷贝数转换区,其中111个黑素瘤 样品群中的基因座平均相对拷贝数在最多15Mb的区间下降了至少20%。

拷贝数转换区及其附近区域内的拷贝数变异多态基因座(CNVs)[Casci T.Genome evolution:CNV evolution revisited,Nature Reviews Genetics 2008; 9:814-815]的基因组注释(genome annotation)从Wellcome Trust Sanger Institute[http://www.sanger.ac.uk/humgen/cnv/]获得,节段性重复[Rudd MK et al.,Segmental duplications mediate novel,clinically relevant chromosome rearrangements,Hum.Mol.Genet.2009;18:2957-62]的基因组注释从 Department of Genome Sciences,University of Washington [http://humanparalogy.gs.washington.edu/]获得。

在拷贝数转换区或者其着丝粒方向5Mb以内鉴定到至少一个CNV。所 述至少一个CNV中离p16最近的注释端点在下文中以远端和近端CNV端点 (相对与p16的接近程度)指代。

在拷贝数转换区中有注释的节段性重复的1Mb范围内或者转换区的着 丝粒方向5Mb以内鉴定到至少一簇含有至少四个有注释的节段性重复。最 靠近p16的节段性重复簇的端点是通过Segmental Duplication Database(She X et al.,Shotgun sequence assembly and recent segmental duplications within the human genome,Nature 2004;431:927-930, http://humanparalogy.gs.washington.edu/)中的有注释的高密度节段性重复区 的端点来限定,或者通过p16最近端和远端1Mb范围内两个节段性重复基 因座的位置来限定。

由(1)CNV和节段性重复簇的远端端点中距离p16更远的那个和(2)CNV 和节段性重复簇的近端端点中距离p16更近的那个限定的区域被认定为边界 区。

制备了着丝粒方向侧翼探针,所述探针的杂交位点的中心位于从p16远 端边界区边缘向着丝粒方向延伸的1Mb以内。

在p16的端粒一侧,于p16基因座端粒方向末端的2Mb以内鉴定到至 少一个CNV和/或至少一个节段性重复簇。制备了端粒方向侧翼探针,所述 探针的杂交位点的中心位于从CNV或者节段性重复簇的端粒末端向端粒方 向延伸的1Mb以内。

制备了目标探针,所述探针的杂交位点的中心位于p16基因座以内或者 p16基因座任意一个末端的100kb以内。

利用包含着丝粒方向侧翼探针、端粒方向侧翼探针和目标探针的FISH 探针组可以经由间期FISH检测p16缺失。所述检测对于福尔马林固定石蜡 包埋样品有很高的准确度,因为很容易将影响着丝粒方向侧翼探针、端粒方 向侧翼探针和目标探针的FISH信号的人为截断与具有至少一个位于端粒和 着丝粒方向侧翼探针之间的端点的基因缺失区分开。

实施例6.通过四色间期FISH对21q22.13-21q22.3区进行缺失做图

利用以上描述的方法在前列腺组织上进行四色间期FISH(FFPE-FNA):

1.正常细胞

2.半合PTEN缺失,和

3.纯合PTEN缺失

21q22.13-21q22.3(特别是21q22.2)区域包含多个基因,包括TMPRSS2、 HMGN1、DSCAM和ERG1。所用的探针是,来源于BACs RP11-476D17(探 针A:HMGN1着丝粒方向);来源于BACs RP11-137J13和RP11-348C15的 HMGN1探针;来源于BACs RP11-139D12、RP11-907P24、RP11-280O17、 RP11-183I12、RP11-281F3、RP11-1113M13和RP11-123A7的DSCAM探针; 以及来源于RP11-35C4(探针B;位于DSCAM端粒方向)的探针。所述探针 通过缺口平移区别标记(例如,用红色、绿色、水绿色和金色荧光团)。BACs 的位点信息可以从Human (February 2009)assemblies of the UCSC Genome Browser获得。还可以使用21号染色体的着丝粒或近着丝粒探针。

对样品的分析表明带有半合PTEN缺失的细胞子集也带有HMGN1缺 失或DSCAM缺失,或者两种缺失都有,因此显示有来自探针A和探针B 的杂交信号而没有HMGN1和DSCAM探针中的一个或两个的信号。另一个 表明是纯合PTEN缺失的细胞子集显示出额外的或者单个缺失。正常细胞显 示存在所有基因。

本说明书中的实施方案提供了对发明实施方案的阐述,不应当被理解为 对发明范围的限制。本领域技术人员很容易认识到发明还涵盖许多其它实施 方案。本公开中提及的所有出版物和专利通过引用全部并入本文。通过引用 并入的材料如果与本说明书冲突或者不一致,本说明书优于任何这类材料。 本文引用的任何参考文献不构成对这些参考文献是本发明的现有技术的承 认。

除非另有相反说明,包括权利要求在内的说明书中使用的所有表示成分 用量、反应条件等的数字是大约值,根据本发明想要达到的预期特性可以有 所不同。虽然并不是试图限制对权利要求的范围应用等同原则,但是至少每 个数字参数应当根据有效位数并采用常规的舍入方法来解释。

除非另有说明,在一系列元素之前的术语“至少”应理解为是指系列中的 每个元素。本领域技术人员能够在仅利用常规试验的情况下识别,或者确认 本文描述的具体实施方案的许多等同体。所述等同体同样意图被以下权利要 求涵盖。

提到方法步骤时,包括带有诸如(a)或(i)的标签时,应当明白权利要求 中的步骤顺序不一定是唯一可能的顺序,例如,在那些后面列举的步骤不需 要前面列举的步骤的产品或结果的情况中。

示范性实施方案:

1.基于FISH的肿瘤抑制因子缺失分析中使用的探针组的制备方法,所 述方法包括:

(a)识别染色体上的至少一个边界区,所述染色体包含肿瘤抑制基因,其 中所述至少一个边界区包含位于肿瘤抑制基因着丝粒方向的第一边界区;

(b)提供至少第一侧翼探针,所述探针与第一边界区内的核酸序列杂交; 或者与相对第一边界区位于肿瘤抑制基因远端的核酸序列杂交;

(c)提供至少第二侧翼探针,所述探针与位于肿瘤抑制基因端粒方向的核 酸序列杂交;和

(d)提供至少一个目标探针,所述探针与边界区之间的肿瘤抑制基因中的 核酸序列杂交。

2.实施方案1所述的方法,其中所述至少一个目标探针和所述至少第一 和第二侧翼探针来源于细菌人工染色体(BACs)、粘粒或复制产物,或者是 以合成寡核苷酸组提供的。

3.实施方案1-2中任一项所述的方法,其中所述第一边界区是主要边界 区。

4.实施方案1-3中任一项所述的方法,其中所述肿瘤抑制基因是PTEN。

5.实施方案1-3中任一项所述的方法,其中所述肿瘤抑制基因选自p16、 RB1和p53。

6.实施方案1-5中任一项所述的方法,其中所述鉴定至少一个边界区包 括鉴定这样的区域,所述区域中(1)在已知含有肿瘤抑制基因缺失的样品群 中发生拷贝数转换,和(2)发生至少一个拷贝数转换(CNV)和节段性重复 簇。

7.实施方案1-6中任一项所述的方法,还包括鉴定至少第二边界区,其 中所述第二边界区位于肿瘤抑制基因的端粒方向,并且第二侧翼探针与第二 边界区内的核酸序列杂交,或者与相对第二边界区位于肿瘤抑制基因远端的 核酸序列杂交。

8.实施方案7的方法,还包括鉴定第三边界区并提供探针,所述探针与 第三边界区内的核酸序列杂交或者与相对第三边界区位于肿瘤抑制基因远 端的核酸序列杂交。

9.实施方案1-8中任一项所述的方法,还包括提供至少一个染色体计数 探针。

10.实施方案1-9中任一项所述的方法,其中所述至少一个目标探针和 至少第一和第二侧翼探针可以用于在5μm厚的平均核直径小于5μm的福尔 马林固定石蜡包埋细胞样品上进行的基于FISH的肿瘤抑制因子缺失分析, 其中所述分析具有的显著性阈值计数为低于或等于30%的人为缺失发生率 加上三倍标准差。

11.实施方案1-10中任一项所述的方法,其中所述至少一个目标探针 和至少第一和第二侧翼探针的杂交位点大小在50-200kb范围。

12.实施方案1-11中任一项所述的方法,其中所述至少一个目标探针 的杂交位点与至少第一和第二侧翼探针的杂交位点相隔500kb-20Mb的距 离。

13.实施方案1-12中任一项所述的方法,其中所述至少第一和第二侧 翼探针的杂交位点分别位于至少第一和第二边界区中。

14.实施方案1-13中任一项所述的方法,其中所述至少第一和第二边 界区的大小在300kb-2Mb范围。

15.实施方案1-14中任一项所述的方法,其中所述至少第一和第二边 界区中的至少一个是根据癌变细胞或前癌细胞的比较基因座杂交数据中的 拷贝数转换鉴定的。

16.实施方案1-15中任一项所述的方法,其中所述至少第一和第二边 界区中的至少一个是根据对已知含有肿瘤抑制基因缺失的复数个细胞样品 进行FISH分析鉴定的。

17.用于检测肿瘤抑制基因缺失的试剂盒,所述试剂盒包含通过实施方 案1-16中任一项所述的方法制备的探针组。

18.进行基于FISH的肿瘤抑制基因缺失分析的方法,所述方法包括:

(a)用探针组在包含复数个细胞的细胞样品上进行FISH,

其中所述探针组包含至少第一侧翼探针,其与位于肿瘤抑制基因着丝粒 方向的位点杂交;至少第二侧翼探针,其与位于肿瘤抑制基因端粒方向的位 点杂交;和至少一个与肿瘤抑制基因杂交的目标探针;

(b)计数所述复数个细胞中由至少第一和至少第二侧翼探针以及至少一 个目标探针产生的FISH信号;

(c)提供从(i)人为半合缺失发生率和(ii)人为纯合缺失发生率选出的至少 一个人为缺失发生率;

(d)根据步骤(b)计数的FISH信号确定至少一个表观缺失发生率,所述 表观缺失发生率从(i)表观半合缺失发生率和(ii)表观纯合缺失发生率选出,其 中如果步骤(c)未提供人为纯合缺失发生率,所述至少一个表观缺失发生率包 含表观半合缺失发生率;如果步骤(c)未提供人为半合缺失发生率,所述至少 一个表观缺失发生率包含表观纯合缺失发生率;和(e)根据表观半合缺失 发生率是否显著高于人为半合缺失发生率,确定样品是否包含带有肿瘤抑制 基因半合缺失的细胞;或者根据表观纯合缺失发生率是否显著高于人为纯合 缺失发生率,确定样品是否包含带有肿瘤抑制基因纯合缺失的细胞。

19.实施方案18所述的方法,其中如果根据t检验,p小于或等于0.05, 所述表观发生率显著高于人为发生率。

20.实施方案18所述的方法,如果表观发生率超过人为发生率3倍标准 差,表观发生率显著高于人为发生率。

21.实施方案0-20中任一项所述的方法,其中所述至少一个第一侧翼 探针与处于肿瘤抑制基因着丝粒方向的边界区之内的或者其着丝粒方向的 位点杂交。

22.实施方案0-21中任一项所述的方法,其中所述至少第二侧翼探针 与处于肿瘤抑制基因端粒方向的边界区之内或者其端粒方向的位点杂交。

23.实施方案0-22中任一项所述的方法,其中所述方法包括在步骤(c) 提供人为半合缺失发生率和人为纯合缺失发生率;在步骤(d)确定表观半合 缺失发生率和表观纯合缺失发生率;和在步骤(e)确定样品是否包含带有肿 瘤抑制基因半合缺失的细胞,以及样品是否包含带有肿瘤抑制基因纯合缺失 的细胞。

24.实施方案0-23中任一项所述的方法,其中探针组还包含至少一个 对包含肿瘤抑制基因的染色体特异的染色体计数探针;方法还包括计数来自 至少一个染色体计数探针的FISH信号,和根据表观非整倍体发生率是否显 著高于人为非整倍体发生率确定样品中的细胞对于该染色体是否是非整倍 体。

25.实施方案0-24中任一项所述的方法,其中所述细胞样品经过固定和 保存。

26.实施方案25所述的方法,其中所述细胞样品是福尔马林固定石蜡包 埋的样品,厚度在3-6μm的范围。

27.实施方案0-26中任一项所述的方法,其中所述肿瘤抑制基因是 PTEN。

28.实施方案0所述的方法,其中所述至少一个第一侧翼探针包含与 TSPAN15杂交的探针,所述至少一个第二侧翼探针包含与FAS杂交的探针。

29.实施方案0或28所述的方法,其中所述至少一个第一侧翼探针包含 与BMPR1A或WAPAL杂交的探针,所述至少一个第二侧翼探针包含与FAS 杂交的探针。

30.实施方案0-26中任一项所述的方法,其中肿瘤抑制基因选自p16、 RB1和p53。

31.实施方案0-30中任一项所述的方法,其中所述至少一个目标探针和 至少第一和第二侧翼探针的杂交位点的大小在50-200kb的范围。

32.实施方案0-31中任一项所述的方法,其中所述至少一个目标探针的 杂交位点与至少第一和第二侧翼探针的杂交位点相距500kb-20Mb。

33.进行基于FISH的分析的方法,以区别性地检测肿瘤抑制基因的小缺 失和大缺失,所述方法包括:

(a)用探针组对包含复数个细胞的细胞样品进行FISH;或者用所述探 针组中包含的第一探针子集对含有复数个细胞的第一细胞样品进行FISH, 和用所述探针组中包含的第二探针子集对与所述第一细胞样品来自相同个 体的含有复数个细胞的第二细胞样品进行FISH,

其中所述探针组包含与肿瘤抑制基因杂交的至少一个目标探针,与位于 肿瘤抑制基因着丝粒方向的位点杂交的至少第一侧翼探针,与位于肿瘤抑制 基因端粒方向的位点杂交的至少第二侧翼探针,和下述中的至少一个:与位 于第一侧翼探针杂交位点着丝粒方向的位点杂交的至少第三侧翼探针,和与 位于第二侧翼探针杂交位点端粒方向的位点杂交的至少第四侧翼探针;

(b)计数复数个或复数组细胞中由至少一个目标探针和至少第一、至少 第二以及至少第三和至少第四侧翼探针中的至少一个产生的FISH信号;

(c)给肿瘤抑制基因缺失提供至少一个第一人为缺失发生率,其中缺失 端点在至少第一和至少第二侧翼探针之间;

(d)给肿瘤抑制基因缺失提供至少一个第二人为缺失发生率,其中至少 一个缺失端点不在至少第一和至少第二侧翼探针之间;

(e)根据步骤(b)计数的FISH信号,给肿瘤抑制基因中缺失端点位于至 少第一和至少第二侧翼探针之间的那些缺失确定至少一个第一表观缺失发 生率;

(f)根据步骤(b)计数的FISH信号,给肿瘤抑制基因缺失确定至少一个 第二表观缺失发生率,其中至少一个缺失端点不在至少第一和至少第二侧翼 探针之间;和

(g)根据至少一个第一表观缺失发生率是否显著高于至少一个第一人为 缺失发生率,确定样品是否包含带有肿瘤抑制基因小缺失的细胞;和根据至 少一个第二表观缺失发生率是否显著高于至少一个第二人为纯合缺失发生 率,确定样品是否包含带有肿瘤抑制基因大缺失的细胞。

34.实施方案0所述的方法,其中方法包括用探针组中包含的第一探针子 集对包含复数个细胞的第一细胞样品进行FISH,和用探针组中包含的第二 探针子集对来自和第一细胞样品相同个体的包含复数个细胞的第二细胞样 品进行FISH;肿瘤抑制基因是PTEN;所述第一探针子集包含与TSPAN15 杂交的侧翼探针和与FAS杂交的侧翼探针;并且所述第二探针子集包含与 BMPR1A或WAPAL杂交的侧翼探针和与SUFU杂交的侧翼探针。

35.实施方案0-34中任一项所述的方法,其中所述至少一个第一侧翼探 针可以与位于肿瘤抑制基因着丝粒方向的第一边界区之内的或者其着丝粒 方向的位点杂交;并且所述至少一个第二侧翼探针可以与位于肿瘤抑制基因 端粒方向的第二边界区之内的或者其端粒方向的位点杂交。

36.实施方案0-35中任一项所述的方法,其中所述至少一个第三侧翼探 针与位于第一远端边界区着丝粒方向的位点杂交,其中所述第一远端边界区 处于所述至少一个第一侧翼探针杂交位点的着丝粒方向;或者所述至少一个 第四侧翼探针与位于第二远端边界区端粒方向的位点杂交,其中所述第二远 端边界区处于所述至少一个第二侧翼探针杂交位点的端粒方向。

37.实施方案36所述的方法,其中所述至少一个第一侧翼探针与位于肿 瘤抑制基因着丝粒方向的第一边界区着丝粒方向的位点杂交;并且所述至少 一个第二侧翼探针与位于肿瘤抑制基因端粒方向的第二边界区端粒方向的 位点杂交。

38.实施方案0-37中任一项所述的方法,其中确定细胞包含肿瘤抑制基 因的两个缺失,至少一个是大的缺失,表明是可转移或转移肿瘤。

39.实施方案0-38中任一项所述的方法,其中所述细胞样品经过固定和 保存。

40.实施方案0所述的方法,其中所述细胞样品是福尔马林固定石蜡包 埋的样品,厚度在3-6μm的范围。

41.实施方案0和35-40中任一项所述的方法,其中肿瘤抑制基因是 PTEN。

42.实施方案41所述的方法,其中所述至少一个第一侧翼探针包含与 BMPR1A或WAPAL杂交的探针,所述至少一个第二侧翼探针包含与FAS 杂交的探针。

43.实施方案0-42中任一项所述的方法,其中方法提供了与TSPAN15 杂交的至少一个第三侧翼探针。

44.实施方案0-43中任一项所述的方法,其中方法提供了与SUFU杂交 的至少一个第四侧翼探针。

45.实施方案0和35-40中任一项所述的方法,其中肿瘤抑制基因选自 p16、RB1和p53。

46.实施方案0-45中任一项所述的方法,其中所述至少一个目标探针和 至少第一和第二侧翼探针的杂交位点的大小在50-200kb的范围。

47.实施方案0-46中任一项所述的方法,其中所述至少一个目标探针的 杂交位点与至少第一和第二侧翼探针的杂交位点相距500kb-20Mb。

48.优化基于FISH的肿瘤抑制基因分析法的方法,所述方法包括:

(a)提供复数个候选探针组,其中每个候选探针组包含与处于肿瘤抑制 基因着丝粒方向的位点杂交的至少第一侧翼探针,与处于肿瘤抑制基因端粒 方向的位点杂交的至少第二侧翼探针,和与肿瘤抑制基因杂交的至少一个目 标探针;

(b)对于每个候选探针组,

(i)用候选探针组对至少一个细胞样品进行FISH,所述细胞样品包含复 数个含有整倍体数量肿瘤抑制基因完整拷贝的细胞;

(ii)计数至少一个样品的复数个细胞中由候选探针组的至少第一和至少 第二侧翼探针,以及至少一个目标探针产生的FISH信号;和

(iii)根据步骤(ii)计数的FISH信号确定人为缺失发生率;和

(c)从候选探针组中选择探针组用于优化基于FISH的肿瘤抑制基因缺 失分析法,其中选定的探针组在步骤(iii)中经确定具有良好的人为缺失发生 率。

49.实施方案48所述的方法,还包括给每个候选探针组在步骤(b)之前、 之后或者与它平行

(iv)用候选探针组对包含复数个细胞的复数个细胞样品进行FISH,所述 细胞含有肿瘤抑制基因的纯合或半合缺失;

(v)计数复数个细胞中来自候选探针组中至少第一和第二侧翼探针和至 少一个目标探针的FISH信号;

(vi)根据步骤(v)计数的FISH信号给复数个样品中的每一个确定表观缺 失发生率;

(vii)在步骤(vi)和步骤(iii)之后,根据复数个样品中有多少经确定具有比 步骤(iii)的人为缺失发生率显著高的表观缺失发生率,可以确定灵敏度值; 其中步骤(c)中的选定探针组在步骤(vii)经确定具有良好的灵敏度值。

50.实施方案0-49中任一项所述的方法,其中所述细胞样品经过固定和 保存。

51.实施方案50所述的方法,其中所述细胞样品是福尔马林固定石蜡包 埋的样品,厚度在3-6μm的范围。

52.探针组,所述探针组包含至少一个与PTEN杂交的探针,至少一个与 FAS或SUFFU,杂交的探针,和至少一个与TSPAN15杂交的探针。

53.检测PTEN基因缺失的试剂盒,其包含实施方案52所述的探针组。

54.实施方案52所述的探针组,其中所述至少一个与PTEN杂交的探针, 至少一个与FAS或SUFU杂交的探针,和至少一个与TSPAN15杂交的探针被 区别标记。

55.实施方案0和54中任一项所述的探针组,还包含至少一个与 BMPR1A或WAPAL结合的探针。

56.实施方案0和54-55中任一项所述的探针组,其中探针组包含与FAS 结合的探针。

57.实施方案0和54-0中任一项所述的探针组,还包含与SUFU结合的 探针。

58.实施方案0和54-57中任一项所述的探针组,还包含至少一个染色 体计数探针。

59.实施方案0和54-58中任一项所述的探针组,其中探针组包含来源 于细节人工染色体的至少一个与PTEN杂交的探针,至少一个与FAS或 SUFU杂交的探针,和至少一个与TSPAN15杂交的探针。

60.实施方案59所述的探针组,其中所述至少一个与PTEN杂交的探针 包含来源于RP11-846G17的探针,至少一个与FAS杂交的探针来源于 RP11-399019和RP11-360H20中的至少一个的探针,至少一个与TSPAN15杂 交的探针包含来源于RP11-168B4和RP11-124L5中至少一个的探针。

61.实施方案60所述的探针组,其中探针组由来源于RP11-846617、 RP11-399019和RP11-360H20中的至少一个,以及RP11-168B4和 RP11-124L5中的至少一个的探针构成。

62.包含实施方案0和54-61中任一项所述的探针组的组合物,其中所 述至少一个与PTEN杂交的探针,至少一个与FAS或SUFU杂交的探针, 和至少一个与TSPAN15杂交的探针被区别标记。

63.行基于FISH的分析的方法,所述分析可以检测21号染色体中 21q22.13-21q22.3分带的缺失,所述方法包括:

(a)用探针组对包含复数个细胞的细胞样品进行FISH;

其中所述探针组包含

与位于TMPRSS2和ERG之间的至少一个目标基因杂交的至少一个目 标探针,

与位于至少一个目标基因着丝粒方向的位点杂交的至少第一侧翼探;

与位于至少一个目标基因端粒方向的位点杂交的至少第二侧翼探针;

(b)计数复数个细胞中由第一和至少第二侧翼探针以及至少一个目标探 针产生的FISH信号;

(c)提供从(i)人为半合缺失发生率和(ii)人为纯合缺失发生率中选出的至 少一个人为缺失发生率;

(d)确定从(i)表观半合缺失发生率和(ii)表观纯合缺失发生率中选出的 至少一个表观缺失发生率,其中如果步骤(c)未提供人为纯合缺失发生率,所 述至少一个表观缺失发生率包含表观半合缺失发生率;如果步骤(c)未提供人 为半合缺失发生率,所述至少一个表观缺失发生率包含表观纯合缺失发生 率;和

(e)根据表观半合缺失发生率是否显著高于人为半合缺失发生率,确定 样品是否包含带有至少一个目标基因半合缺失的细胞;和根据表观纯合缺失 发生率是否显著高于人为纯合缺失发生率,确定细胞样品是否包含带有至少 一个目标基因纯合缺失的细胞。

64.实施方案63所述的方法,其中所述至少一个目标基因选自ETS2、 FSMG1、B3GALT5、HMGN1、DSCAM和BACE2。

65.实施方案错误!未找到引用源。-64中任一项所述的方法,其中如 果根据t检验,p小于或等于0.05,所述表观发生率显著高于人为发生率。

66.实施方案错误!未找到引用源。-64中任一项所述的方法,其中如 果表观发生率超过人为发生率3倍标准差,表观发生率显著高于人为发生率。

67.实施方案错误!未找到引用源。-66中任一项所述的方法,其中所 述至少一个第一侧翼探针与位于至少一个目标基因着丝粒方向的边界区之 内的或者其着丝粒方向的位点杂交。

68.实施方案错误!未找到引用源。-67中任一项所述的方法,其中所 述至少一个第二侧翼探针与位于至少一个目标基因端粒方向的边界区之内 的或者其端粒方向的位点杂交。

69.实施方案错误!未找到引用源。-68中任一项所述的方法,其中所 述方法包括在步骤(c)中提供人为半合缺失发生率和人为纯合缺失发生率;在 步骤(d)中确定表观半合缺失发生率和表观纯合缺失发生率;以及在步骤(e) 中确定样品是否包含带有至少一个目标基因的半合缺失的细胞和确定样品 是否包含带有至少一个目标基因纯合缺失的细胞。

70.实施方案错误!未找到引用源。-69中任一项所述的方法,其中探 针组还包含至少一个对21号染色体特异的染色体计数探针;方法还包括计 数来自至少一个染色体计数探针的FISH信号,和根据表观非整倍体发生率 是否显著高于人为非整倍体发生率来确定样品中的细胞对于该染色体是否 是非整倍体。

71.实施方案错误!未找到引用源。-70中任一项所述的方法,其中所 述细胞样品经过固定和保存。

72.实施方案71所述的方法,其中所述细胞样品是福尔马林固定石蜡包埋 的样品,厚度在3-6μm的范围。

73.实施方案错误!未找到引用源。-72中任一项所述的方法,其中所 述至少一个目标基因包含HMGN1。

74.实施方案错误!未找到引用源。-73中任一项所述的方法,其中所 述至少一个目标基因包含DSCAM。

75.实施方案错误!未找到引用源。-74中任一项所述的方法,其中探 针组包含与至少两个目标基因杂交的至少两个靶探针。

76.实施方案75所述的方法,其中所述至少两个目标基因包含HMGN1和 DSCAM。

77.实施方案错误!未找到引用源。-76中任一项所述的方法,其中所 述至少一个第一侧翼探针包含与ERG杂交的探针。

78.实施方案错误!未找到引用源。-77中任一项所述的方法,其中所 述至少一个第二侧翼探针半合与TMPRSS2杂交的探针。

79.实施方案错误!未找到引用源。-78中任一项所述的方法,其中所 述至少一个目标探针和至少第一和第二侧翼探针的杂交位点的大小在50- 200kb的范围。

80.实施方案错误!未找到引用源。-79中任一项所述的方法,其中所 述至少一个目标探针的杂交位点与至少第一和第二侧翼探针的杂交位点相 距500kb-20Mb。

81.进行基于FISH的分析的方法,以区别性地检测21号染色体中带 21q22.13-21q22.3的小缺失和大缺失,所述方法包括:

(a)用探针组对包含复数个细胞的细胞样品进行FISH;或者用所述探 针组中包含的第一探针子集对含有复数个细胞的第一细胞样品进行FISH, 和用所述探针组中包含的第二探针子集对与所述第一细胞样品来自相同个 体的含有复数个细胞的第二细胞样品进行FISH,

其中所述探针组包含

与位于TMPRSS2和ERG之间的至少两个目标基因杂交的至少两个目 标探针,

与位于至少两个目标基因着丝粒方向的位点杂交的至少第一侧翼探针;

与位于至少两个目标基因端粒方向的位点杂交的至少第二侧翼探针;

和任选地,下述中的至少一个:与位于第一侧翼探针杂交位点着丝粒方 向的位点杂交的至少第三侧翼探针,和与位于第二侧翼探针杂交位点端粒方 向的位点杂交的至少第四侧翼探针;

(b)计数复数个或复数组细胞中由至少两个目标探针和至少第一、至少 第二以及如果有的话,至少第三和至少第四侧翼探针中的至少一个产生的 FISH信号;

(c)给至少一个目标基因缺失提供至少一个第一人为缺失发生率,其中 端点在至少第一和至少第二侧翼探针之间,其中一个端点在两个目标基因之 间;

(d)给至少一个目标基因缺失提供至少一个第二人为缺失发生率,其中 (i)任何一个端点都不在两个目标基因之间,或者(ii)如果使用了至少第三和至 少第四侧翼探针中的至少一个,至少一个端点不在至少第一和至少第二侧翼 探针之间;

(e)根据步骤(b)计数的FISH信号,给至少一个目标基因缺失确定至少 一个第一表观缺失发生率,其中端点在至少第一和至少第二侧翼探针之间, 其中一个端点在两个目标基因之间;

(f)根据步骤(b)计数的FISH信号,给至少一个目标基因缺失确定至少 一个第二表观缺失发生率,其中(i)任何一个端点都不在两个目标基因之间, 或者(ii)如果使用了至少第三和至少第四侧翼探针中的至少一个,至少一个端 点不在至少第一和至少第二侧翼探针之间;和

(g)根据至少一个第一表观缺失发生率是否显著高于至少一个第一人为 缺失发生率,确定细胞样品是否包含,或者第一和第二细胞样品是否包含带 有至少一个目标基因小缺失的细胞;和根据至少一个第二表观缺失发生率是 否显著高于至少一个第二人为纯合缺失发生率,确定细胞样品是否包含,或 者第一和第二细胞样品是否包含带有至少一个目标基因大缺失的细胞。

82.实施方案81所述的方法,其中所述至少两个目标基因选自ETS2、 FSMG1、B3GALT5、HMGN1、DSCAM和BACE2。

83.实施方案0-82中任一项所述的方法,其中探针组包含至少第三侧翼 探针,与位于第一侧翼探针杂交位点的着丝粒方向的位点杂交;和至少第四 侧翼探针,与位于第二侧翼探针杂交位点的端粒方向的位点杂交。

84.实施方案0-83中任一项所述的方法,其中方法包括用探针组中包含 的第一探针子集对包含复数个细胞的第一细胞样品进行FISH,和用探针组 中包含的第二探针子集对来自和第一细胞样品相同个体的包含复数个细胞 的第二细胞样品进行FISH;所述至少两个目标基因包含HMGN1和 DSCAM;所述第一探针子集包含与DYRK1A杂交的侧翼探针和与TMPRSS2 杂交的侧翼探针;并且所述第二探针子集包含与ERG杂交的侧翼探针和与 U2AF1杂交的侧翼探针。

85.实施方案0-84中任一项所述的方法,其中所述至少一个第一侧翼探 针与位于至少两个目标基因着丝粒方向的第一边界区着丝粒方向的位点杂 交;并且所述至少一个第二侧翼探针与位于至少两个目标基因端粒方向的第 二边界区端粒方向的位点杂交。

86.实施方案0-85中任一项所述的方法,其中(i)存在至少一个第三侧翼 探针,并且与位于第一远端边界区着丝粒方向的位点杂交,其中所述第一远 端边界区处于所述至少一个第一侧翼探针杂交位点的着丝粒方向;或者(ii) 存在至少一个第四侧翼探针,并且与位于第二远端边界区端粒方向的位点杂 交,其中所述第二远端边界区处于所述至少一个第二侧翼探针杂交位点的端 粒方向。

87.实施方案86所述的方法,其中所述至少一个第一侧翼探针与位于至 少两个目标基因着丝粒方向的第一边界区着丝粒方向的位点杂交;并且所述 至少一个第二侧翼探针与位于至少两个目标基因端粒方向的第二边界区端 粒方向的位点杂交。

88.实施方案0-87中任一项所述的方法,其中其所述细胞样品经过固定 和保存。

89.实施方案88任一项所述的方法,其中所述细胞样品是福尔马林固定 石蜡包埋的样品,厚度在3-6μm的范围。

90.实施方案0-83和85-89中任一项所述的方法,其中所述至少两个目 标探针包含HMGN1和DSCAM。

91.实施方案90所述的方法,其中所述至少一个第一侧翼探针包含与 ERG杂交的探针,所述至少一个第二侧翼探针包含与TMPRSS2杂交的探针。

92.实施方案0-83和85-91中任一项所述的方法,其中所述方法包括提 供与DYRK1A杂交的至少一个第三侧翼探针。

93.实施方案0-83和85-92中任一项所述的方法,其中所述方法包括提 供与U2AF1杂交的至少一个第四侧翼探针。

94.实施方案0-93中任一项所述的方法,其中所述至少两个目标探针和 至少第一和第二侧翼探针的杂交位点的大小在50-200kb的范围。

95.实施方案0-94中任一项所述的方法,其中所述至少两个目标探针的 杂交位点与至少第一和第二侧翼探针的杂交位点相距500kb-20Mb。

96.探针组,其包含至少一个与位于TMPRSS2和ERG之间的至少一个 目标基因杂交的探针,至少一个与DYRK1A或ERG杂交的探针,以及至少 一个与TMPRSS2或U2AF1杂交的探针。

97.实施方案96所述的探针组,其中所述至少一个与至少一个目标基因 杂交的探针,至少一个与DYRK1A或ERG杂交的探针,和至少一个与 TMPRSS2或U2AF1杂交的探针被区别标记。

98.实施方案0-97中任一项所述的探针组,其中所述至少一个目标基因 选自ETS2、FSMG1、B3GALT5、HMGN1、DSCAM和BACE2。

99.实施方案0-98中任一项所述的探针组,其中探针组包含与HMGN1 结合的探针。

100.实施方案0-99中任一项所述的探针组,其中探针组包含与DSCAM 结合的探针。

101.实施方案0-100中任一项所述的探针组,其中探针组包含与 DYRK1A结合的探针。

102.实施方案0-101中任一项所述的探针组,其中探针组包含与U2AF1 结合的探针。

103.实施方案0-102中任一项所述的探针组,其中探针组包含与 TMPRSS2结合的探针。

104.实施方案0-103中任一项所述的探针组,其中探针组包含与ERG结 合的探针。

105.实施方案0-104中任一项所述的探针组,还包含至少一个染色体计 数探针。

106.实施方案0-105中任一项所述的探针组,其中探针组中的至少三个 探针来源于细菌人工染色体。

107.实施方案106所述的探针组,其中探针组包含至少一个与HMGN1 杂交的来源于RP11-137J13和RP11-348C15中的至少一个的探针;至少一个 与ERG杂交的来源于RP11-476D17和RP11-951I21中的至少一个的探针; 以及至少一个与TMPRSS2杂交的来源于RP11-35C4、CTD-3095D11和 RP11-671L10中的至少一个的探针。

108.实施方案106所述的探针组,其中探针组包含至少一个与DSCAM 杂交的来源于RP11-139D12、RP11-907P24、RP11-280O17、RP11-183I12、 RP11-281F3、RP11-1113M13和RP11-123A7中的至少一个的探针;至少一 个与ERG杂交的来源于RP11-476D17和RP11-951I21中的至少一个的探针; 以及至少一个与TMPRSS2杂交的来源于RP11-35C4、CTD-3095D11和 RP11-671L10中的至少一个的探针。

109.实施方案106所述的探针组,其中探针组包含至少一个与HMGN1杂 交的来源于RP11-137J13和RP11-348C15中的至少一个的探针;至少一个与 DSCAM杂交的来源于RP11-139D12、RP11-907P24、RP11-280O17、 RP11-183I12、RP11-281F3、RP11-1113M13和RP11-123A7中的至少一个的探 针;至少一个与ERG杂交的来源于RP11-476D17和RP11-951I21中的至少一个 的探针;以及至少一个与TMPRSS2杂交的来源于RP11-35C4、CTD-3095D11 和RP11-671L10中的至少一个的探针。

110.实施方案106所述的探针组,还包含下述中的至少一个(i)与 U2AF1杂交的来源于RP11-446L19和CTD-2601A22中的至少一个的探针, 或者(ii)与DYRK1A杂交的来源于RP11-105O24、RP11-777J19和 CTD-3140L2中的至少一个的探针。

111.实施方案96所述的探针组,其中探针组由来源于下述的探针组成:

(i)与HMGN1或DSCAM杂交的来源于RP11-137J13、RP11-348C15、 RP11-139D12、RP11-907P24、RP11-280O17、RP11-183I12、RP11-281F3、 RP11-1113M13和RP11-123A7中的至少一个的探针;

(ii)与ERG杂交的来源于RP11-476D17和RP11-951I21中的至少一个 的探针;

(iii)与TMPRSS2杂交的来源于RP11-35C4、CTD-3095D11和 RP11-671L10中的至少一个的探针,和

(iv)任选的下述中的至少一个:(a)与U2AF1杂交的来源于 RP11-446L19和CTD-2601A22中的至少一个的探针,或者(b)与DYRK1A杂 交的来源于RP11-105O24、RP11-777J19和CTD-3140L2中的至少一个的探 针。

112.实施方案96所述的探针组,其中探针组由以下探针组成:

(i)与HMGN1杂交的来源于RP11-137J13和RP11-348C15中的至少一 个的探针;

(ii)与DSCAM杂交的来源于RP11-139D12、RP11-907P24、 RP11-280O17、RP11-183I12、RP11-281F3、RP11-1113M13和RP11-123A7 中的至少一个的探针;

(iii)与ERG杂交的来源于RP11-476D17和RP11-951I21中的至少一个 的探针;

(iv)与TMPRSS2杂交的来源于RP11-35C4、CTD-3095D11和 RP11-671L10中的至少一个的探针,

(v)与U2AF1杂交的来源于RP11-446L19和CTD-2601A22中的至少一 个的探针,和

(vi)与DYRK1A杂交的来源于RP11-105O24、RP11-777J19和 CTD-3140L2中的至少一个的探针。

113.实施方案96所述的探针组,其中探针组由来源于RP11-139D12; RP11-476D17和RP11-951I21中的至少一个;以及RP11-35C4和 CTD-3095D11中的至少一个的探针构成。

114.探针组,所述探针组包含至少一个与PTEN杂交的探针,至少一个 与FAS或SUFU杂交的探针,和至少一个与WAPAL杂交的探针。

115.用于检测21号染色体21q22.13-21q22.3分带缺失的试剂盒,所述试 剂盒包含实施方案96-114中任一项所述的探针组。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号