首页> 中国专利> 区分乳腺癌与良性乳腺疾病的方法和试剂盒

区分乳腺癌与良性乳腺疾病的方法和试剂盒

摘要

本发明涉及区分乳腺癌和良性乳腺疾病的方法和试剂盒,通过确定包含选自SEQ ID NO:1、2或3、4和5或6所示核酸序列的至少一个靶基因的表达水平以获得患者的表达谱,将此患者的表达谱与来自先前经临床分类为乳腺癌患者的靶基因的表达谱及与来自先前经临床分类为良性乳腺疾病的患者的靶基因的表达谱进行对比而进行。

著录项

  • 公开/公告号CN102918164A

    专利类型发明专利

  • 公开/公告日2013-02-06

    原文格式PDF

  • 申请/专利权人 生物梅里埃公司;

    申请/专利号CN201080067058.8

  • 发明设计人 叶迅;吴非;徐清华;孟夏;B·穆然;

    申请日2010-05-28

  • 分类号C12Q1/68;

  • 代理机构永新专利商标代理有限公司;

  • 代理人王健

  • 地址 法国迈合西-兰托阿嘞

  • 入库时间 2024-02-19 17:47:45

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-01-27

    授权

    授权

  • 2013-04-24

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20100528

    实质审查的生效

  • 2013-02-06

    公开

    公开

说明书

发明领域

本发明涉及区分乳腺癌与良性乳腺疾病的领域。特别地,本发明涉及 区分乳腺癌与良性乳腺疾病的方法和试剂盒。

发明背景

乳腺癌在世界上是女性最常见的癌症。由于还未足够了解乳腺癌的发 病机理,因此早期诊断更有意义。目前乳房X光照相检查是最常用的乳腺 癌检测方法。其可用于使年龄在40-69岁之间女性的乳腺癌发病率降低 20-40%,这已经通过一些大规模随机试验证实。乳房X光照相术目前是早 期乳腺癌检测的金标准,但是据报道整体灵敏性在一些女性亚型中显著降 低,特别是在具有放射性致密型乳腺的女性及在乳腺癌危险增加的那些女 性中。具有极密集乳腺的女性中胶片乳腺X光照相术灵敏性的估计值为 48-63%。乳腺X照相术的缺点是低灵敏性和特异性,特别是在年轻群体中, 及在照相期间的压痛。此外,由于乳房的小体积及高密度的原因,许多病 例不能获得筛选的乳腺X光照相术的明确结果,在乳腺X光照相诊断中其 通常被分类为BI-RADS 0(BI-RADS:乳腺成像报告和数据系统)。

BI-RADS在1993年由美国放射学学会(ACR)开发,以标准化乳腺X光 照相报告、改善通讯、降低乳腺X光照相发现的混乱、帮助研究及便于结 果监测。根据1997年的Mammography Quality Standards Act(MQSA)[Final Rule 62(208):55988],美国的所有乳腺X光照片必须使用这些评估类别之 一报告。每项乳腺X光照相术研究应基于大多数相关发现而属于一个单一 评估。分类分为不完全评估(category 0)和完全评估(categories 1、2、3、4、 5、6)。BI-RADS Category 0被定义为不完全评估,其意味着需要额外成像。 通常推荐定期复查,基于超声诊断或磁共振成像(MRI)或者甚至活组织检查 而要求长期、昂贵的及产生焦虑的过程。超声诊断,即使与乳腺X光照相 术组合,仍具有高比率的假阳性结果,导致不必要的侵入性步骤。MRI的 长期保持对患者有害。MRI也带来高比率的假阳性结果,同时花费高。由 于这样的多种因素,需要易于实施的新检测,其将改善乳腺癌检测及证实 患者的危险性,特别是当乳腺X光照相术不能鉴别时是非常重要的。

血清生物标记如CEA、CA15-3在癌症筛选中未示出良好性能[1]。近 年来,有一些文献描述了使用外周血细胞中基因表达模式早期诊断乳腺癌 的可能性[2]。这些前期研究的结果表明癌症将导致血液生物化学环境中的 特征性改变,由此一些鉴别了的基因的表达模式可用于高精确性地区分癌 症与对照组。然而,基于血液生物标记还未成功在BI-RADS 0患者中区分 乳腺癌(BC)与良性乳腺疾病(BBD)。

发明概述

本发明提供了一种在来自患者的生物学样品中区分乳腺癌与良性乳腺 疾病的方法,所述方法包括如下步骤:a)获得包含来自患者的生物学材料 的生物学样品;b)将来自所述生物学样品的生物学材料与至少一个靶基因 的至少一种特异性试剂及包含SEQ ID NO:1-44所示核酸序列的28个靶基 因的不超过28种特异性试剂接触,其中所述至少一种试剂特异于包含选自 SEQ ID NO:1、2或3、4和5或6所示核酸序列的核酸序列的至少一个靶 基因;以及c)确定包含选自SEQ ID NO:1、2或3、4和5或6所示核酸序 列的至少一个靶基因的表达水平以获得患者的表达谱;和d)分析所述患者 的表达谱与来自先前经临床分类为乳腺癌的患者的靶基因的表达谱及先前 经临床分类为良性乳腺疾病的患者的靶基因的表达谱,其中:如果所述患 者的表达谱与先前经临床分类为乳腺癌的患者的表达谱归为一类 (clustered),则预示该患者患有乳腺癌;如果所述患者的表达谱与先前经临 床分类为良性乳腺疾病的患者的表达谱归为一类,则预示该患者患有良性 乳腺疾病。

在一个实施方案中,在步骤b)中,将所述生物学材料与特异于至少4 个及不超过28个靶基因的组合的试剂接触,其中所述试剂包括至少特异于 分别包含SEQ ID NO:1、2或3、4和5或6所示核酸序列的靶基因的试剂, 至少所述4个基因的表达水平在步骤c)中确定以获得该患者的表达谱。

在另一个实施方案中,在步骤b)中,将所述生物学材料与特异于28个 基因的组合的试剂接触,其中所述试剂包括特异于分别包含SEQ ID NO: 1-44所示核酸序列的靶基因的试剂,所述28个基因的表达水平在步骤c) 中确定以获得该患者的表达谱。

特别地,取自患者的生物学样品是血液样品。更特别地,所述生物学 材料包含核酸。

在一个实施方案中,步骤b)中至少一种特异性试剂包含至少一种杂交 探针。在另一个实施方案中,步骤b)中特异性试剂包含至少一种杂交探针 和至少一种引物。在进一步的实施方案中,步骤b)中特异性试剂包含一种 杂交探针和两种引物。

本发明还提供了在取自患者的生物学样品中区分乳腺癌与良性乳腺疾 病的试剂盒,其包含对于至少一个靶基因的至少一种特异性试剂及对于包 含SEQ ID NO:1-44所示核酸序列的28个靶基因的不超过28种特异性试 剂,其中所述至少一种试剂特异于包含选自SEQ ID NO:1、2或3、4和5 或6所示核酸序列的核酸序列的至少一个靶基因。

在一个实施方案中,本发明的试剂盒包含特异于至少4个及不超过28 个靶基因的组合的试剂,其中所述试剂包括至少特异于分别包含SEQ ID NO:1、2或3、4和5或6所示核酸序列的靶基因的试剂。

在另一个实施方案中,本发明的试剂盒包含特异于28个靶基因的组合 的试剂,其中所述试剂包括特异于包含SEQ ID NO:1-44所示核酸序列的靶 基因的试剂。

本发明还涉及至少一个靶基因的至少一种特异性试剂及包含SEQ ID NO:1-44所示核酸序列的28个靶基因的不超过28种特异性试剂在生产用 于在患者的生物学样品中区分乳腺癌与良性乳腺疾病的组合物中的应用, 其中所述至少一种试剂特异于包含选自SEQ ID NO:1、2或3、4和5或6 所示核酸序列的核酸序列的至少一个靶基因。

在一个实施方案中,本发明涉及特异于至少4个及不超过28个靶基因 的组合的试剂在生产在患者生物学样品中区分乳腺癌与良性乳腺疾病的组 合物中的应用,其中所述试剂包括至少特异于分别包含SEQ ID NO:1、2 或3、4和5或6所示核酸序列的靶基因的试剂。

在另一个实施方案中,本发明涉及28个靶基因的组合在生产在患者生 物学样品中区分乳腺癌与良性乳腺疾病的组合物中的应用,其中所述试剂 包括特异于包含SEQ ID NO:1-44所示核酸序列的靶基因的试剂。

发明详述

本发明提出了通过提供在BI-RADS 0患者内区分BC与BBD的诊断工 具以解决现有技术领域中所有缺点的建议。鉴于其乳腺X光照相术分类为 BI-RADS 0的大多数患者均具有乳腺损害,因此本研究针对于区分BC与 BBD。这与先前聚焦于乳腺癌患者及无这种疾病迹象的患者的表达模式的 研究非常不同。其排除了一些非癌症特异性因素以进行癌症的检测,如一 些炎症应答调节。

令人惊奇地,本发明人证实分析选自CHI3、CLEC4C、LILRA3和 TUBB2A的至少一个靶基因的表达提供了这样的信息,其足以区分BBD患 者与BC。当然,组合分析上述靶基因的表达,改善了结果的灵敏性和特异 性,同样也分析28个靶基因的表达模式,如下表1所示,包括CHI3、 CLEC4C、LILRA3和TUBB2A。

表1

如表1所示,对于相同的靶基因有时存在一些变体。在本发明中,所 有变体均是相关的及一般地(indifferently)分析。应理解如果这些基因存在多 种同种型,则所有同种型均为本发明相关。

本发明人已经鉴别了外周血mRNA特征(signature),其可帮助区分乳 腺癌与良性乳腺疾病,在具有非确定性乳腺X光照相结果的患者中特别有 意义。

因此,本发明涉及在患者生物学样品中区分乳腺癌与良性乳腺疾病的 方法,所述方法包括如下步骤:

a)获得包含来自患者的生物学材料的生物学样品,

b)将来自所述生物学样品的生物学材料与至少一个靶基因的至少一 种特异性试剂及包含SEQ ID NO:1-44所示核酸序列的28个靶基因的不超 过28种特异性试剂接触,其中所述至少一种试剂特异于包含选自SEQ ID NO:1、2或3、4和5或6所示核酸序列的核酸序列的至少一个靶基因,及

c)确定包含选自SEQ ID NO:1、2或3、4和5或6所示核酸序列的核 酸序列的至少一个靶基因的表达水平以获得患者的表达谱,及

d)分析所述患者的表达谱与来自先前经临床分类为乳腺癌的患者的 靶基因的表达谱及先前经临床分类为良性乳腺疾病的患者的靶基因的表达 谱,其中:

如果所述患者的表达谱与先前经临床分类为乳腺癌的患者的表达谱归 为一类,则预示该患者患有乳腺癌,

如果所述患者的表达谱与先前经临床分类为良性乳腺疾病的患者的表 达谱归为一类,则预示该患者患有良性乳腺疾病。

在一或多个实施方案中,在步骤b)中可以将所述生物学材料与特异于 至少2个、或者至少3个或者至少4个靶基因并且不超过28个靶基因的组 合的试剂接触,其中所述试剂包括至少特异于分别包含SEQ ID NO:1、2 或3、4和5或6任一所示核酸序列的靶基因的试剂,至少2、3或4个基 因的表达水平在步骤c)中确定。

举例的靶基因组合如下所述:

SEQ ID NO:1与SEQ ID NO:2或3

SEQ ID NO:1与SEQ ID NO:4

SEQ ID NO:1与SEQ ID NO:5或6

SEQ ID NO:2或3与SEQ ID NO:4

SEQ ID NO:2或3与SEQ ID NO:5或6

SEQ ID NO:4与SEQ ID NO:5或6

SEQ ID NO:1、SEQ ID NO:2或3与SEQ ID NO:4

SEQ ID NO:1、SEQ ID NO:2或3与SEQ ID NO:5或6

SEQ ID NO:1、SEQ ID NO:4与SEQ ID NO:5或6

SEQ ID NO:2或3、SEQ ID NO:4与SEQ ID NO:5或6

SEQ ID NO:4、SEQ ID NO:5或6与SEQ ID NO:2或3,以及

SEQ ID NO:1、SEQ ID NO:2或3,SEQ ID NO:4与SEQ ID NO:5或 6;如下靶基因组合是优选的:SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO: 4与SEQ ID NO:5以及SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:4与SEQ ID NO:6。

因此,在本发明方法的一个实施方案中,在步骤b)中,将所述生物学 材料与特异于至少4个并且不超过28个靶基因的组合的试剂接触,其中所 述试剂包括至少特异于分别包含SEQ ID NO:1、2或3、4和5或6所示核 酸序列的靶基因的试剂,至少所述4个基因的表达水平在步骤c)中确定以 获得患者的表达谱。

在所述方法的另一实施方案中,在步骤b)中,将所述生物学材料与特 异于28个基因的组合的试剂接触,其中所述试剂包括特异于分别包含SEQ ID NO:1-44所示核酸序列的靶基因的试剂,所述28个基因的表达水平在步 骤c)中确定以获得患者的表达谱。

取自患者的生物学样品是含有如后文定义的生物学材料的任何样品, 特别是血液、血浆、血清、组织、循环细胞样品,优选血液样品。所述生 物学样品以本领域技术人员已知的任何取样类型提供。

在本发明方法的一个实施方案中,所述生物学材料可以通过本领域技 术人员熟知的任何核酸提取和纯化方案自生物学样品提取。在本发明的另 一实施方案中,所述靶生物学材料不是提取自生物学样品,是在样品中直 接进行分析。

术语“生物学材料”是指可以检测靶基因表达的任何材料。所述生物 学材料可以特别包含蛋白质或者核酸,特别如脱氧核糖核酸(DNA)或核糖 核酸(RNA)。所述核酸可以特别是RNA(核糖核酸)。

根据本发明的一个优选实施方案,所述生物学材料是同步(in step)提取 的,包含核酸,优选RNA,甚至更优选总RNA。总RNA包含转运RNA (tRNA)、信使RNA(mRNA),如从靶基因转录的mRNA,但是也包括从任 何其它基因转录的,以及核糖体RNA。这种生物学材料包含特异于靶基因 的材料,特别如从靶基因转录的mRNA或者从这些mRNA衍生的蛋白质。

例如,核酸提取可以通过如下步骤进行:裂解所述生物学样品中存在 的细胞以释放患者细胞中含有的核酸。例如,使用在如下专利申请中描述 的裂解方法进行:WO 00/05338是关于混合磁性和机械性裂解,WO 99/53304是关于电学裂解,WO 99/15321是关于机械裂解。本领域技术人 员可使用其它熟知的裂解方法,如热休克或渗透休克或化学裂解法,使用 离液剂如胍盐进行(美国专利5,234,809);纯化步骤,以分离核酸与裂解步 骤中释放的其它细胞成分。这通常使得可以浓缩核酸,及可适合DNA或 RNA的纯化。例如,可以使用磁性颗粒进行,所述颗粒任选用寡核苷酸通 过吸附或共价包被(关于这方面见美国专利4,672,040和美国专利5,750,338 所述),与这些磁性颗粒结合的核酸可因此通过洗涤步骤纯化。如果希望随 后扩增所述核酸,则这个核酸纯化步骤是特别有利的。这些磁性颗粒的特 别有利的实施方案在专利申请WO-A-97/45202和WO-A-99/35500中描述。

术语“特异性试剂”是指这样的试剂,当将其与如上述生物学材料接 触时,其与特异于所述靶基因的材料结合。例如,当所述特异性试剂和生 物学材料源于核酸时,所述特异性试剂与生物学材料接触允许所述特异性 试剂与特异于所述靶基因的材料杂交。术语“杂交”是指这样的过程,在 此期间在合适条件下两个核苷酸片段以稳定和特异性氢键结合,形成双链 复合体。这些氢键在互补的腺嘌呤(A)与胸腺嘧啶(T)(或尿嘧啶(U))碱基之 间形成(称作A-T键)或者在互补的鸟嘌呤(G)与胞嘧啶(C)碱基之间形成(称 作G-C键)。两个核苷酸片段的杂交可以是完全的(指由互补的核苷酸片段 或序列形成),即在这个杂交期间获得的双链复合体仅包含A-T键和C-G键。 这种杂交可以是部分的(指由足够互补的核苷酸片段或序列形成),即获得的 双链复合体包含可以形成双链复合体的A-T键和C-G键,但是也包含与互 补碱基未结合的碱基。两个核苷酸片段之间的杂交依赖于使用的运行条件, 特别依赖于严格性。所述严格性特别定义为两个核苷酸片段的碱基组成以 及两个核苷酸片段之间的错配程度的函数。所述严格性也可依赖于反应参 数,如杂交溶液中存在的离子的浓度和类型,变性剂的性质和浓度和/或杂 交温度。本领域技术人员熟知所有这些数据且可确定合适条件。通常,根 据指定用于杂交的核苷酸片段的长度,杂交温度介于大约20-70℃之间,特 别是在35-65℃之间,在浓度为大约0.5-1M的盐水溶液中进行。序列或核 苷酸片段或寡核苷酸或多核苷酸,是通过磷酯键装配在一起的一系列核苷 酸基序,特征在于天然核酸的信息序列,能与核苷酸片段杂交,可以含有 具有不同结构的单体及得自天然核酸分子和/或通过遗传重组和/或通过化 学合成获得。基序是单体(其可以是核酸的天然核苷酸)的衍生物,其组 成元件是糖、磷酸酯基团和含氮碱基;在DNA中,所述糖是脱氧-2-核糖, 在RNA中,所述糖是核糖;根据包含的是DNA还是RNA,所述含氮碱基 选自腺嘌呤、鸟嘌呤、尿嘧啶、胞嘧啶和胸腺嘧啶;或者,所述单体是其 中三种组成元件的至少一种被修饰的核苷酸;例如,所述修饰可以发生在 碱基水平,修饰的碱基如肌苷、甲基-5-脱氧胞苷、脱氧尿苷、二甲基氨基 -5-脱氧尿苷、二氨基-2,6-嘌呤、溴-5-脱氧尿苷或者任何其它修饰的能杂交 的碱基,或者所述修饰在糖水平,例如用聚酰胺置换至少一个脱氧核糖(P.E. Nielsen et al,Science,254,1497-1500(1991)[3]),或者所述修饰在磷酸酯基 团水平,例如用酯置换,特别选自二磷酸酯、烷基-及芳基膦酸酯以及硫代 磷酸酯。

根据本发明的一个特定实施方案,所述特异性试剂包含至少一种杂交 探针或者至少一种杂交探针和特异于靶基因的至少一种引物或者至少一种 杂交探针和特异于所述靶基因的两种引物。

对于本发明,术语“扩增引物”是指使得酶聚合作用如酶扩增反应起 始的核苷酸片段,其包含5-100个核苷酸,优选15-30个核苷酸。术语“酶 扩增反应”是指这样的过程,其通过至少一种酶的作用而产生核苷酸片段 的多个拷贝。这种扩增反应为本领域技术人员熟知,可以特别提及的是如 下技术:PCR(聚合酶链反应),如美国专利4,683,195、美国专利4,683,202 和美国专利4,800,159所述;LCR (连接酶链反应),如在专利申请EP 0201 184中揭示;RCR(修复链反应),在专利申请WO 90/01069中描述;3SR(自 动维持序列扩增),在专利申请WO 90/06995中描述;NASBA(基于核酸序 列的扩增),在专利申请WO 91/02818中描述;TMA(转录介导的扩增),在 美国专利5,399,491中描述;以及RT-PCR。

当酶扩增反应是PCR时,所述特异性试剂包含特异于靶基因的至少两 种扩增引物,其使得特异于所述靶基因的材料扩增。然后特异于所述靶基 因的材料优选包含互补DNA或互补RNA,所述互补DNA通过衍生自所述 靶基因的信使RNA的逆转录获得(称作靶基因特异性cDNA),所述互补 RNA通过特异于靶基因的cDNA的转录获得(称作靶基因特异性cRNA)。 当所述酶扩增反应是在逆转录反应之后进行的PCR时,称作RT-PCR。

术语“杂交探针”是指在指定条件下具有杂交特异性的核苷酸片段, 以与特异于靶基因的材料形成杂交复合物,所述核苷酸片段包含至少5个 核苷酸,如5-100个核苷酸,特别是10-75个核苷酸,如15-35个核苷酸及 60-70个核苷酸。在本发明中,特异于靶基因的材料可以是衍生自靶基因的 信使RNA(称作靶基因特异性mRNA)中包含的核苷酸序列,通过逆转录所 述信使RNA获得的互补DNA(称作靶基因特异性cDNA)中包含的核苷酸序 列,或者通过上述cDNA转录获得的互补RNA(称作靶基因特异性cRNA) 中包含的核苷酸序列。所述杂交探针可包含其检测标记。术语“检测”是 指直接检测如计数法,或者通过使用标记的检测方法间接检测。有许多检 测核酸的检测方法(见例如Kricka et al.,Clinical Chemistry,1999,no 45(4),p. 453-458[4]或者Keller G. H.et al.,DNA Probes,2nd Ed.,Stockton Press,1993, sections 5and 6,p.173-249[5])。术语“标记”是指能产生可被检测的信号 的追踪剂。这些追踪剂的非限制性实例包括酶,其产生可以例如通过比色、 荧光或发光法检测的信号,如辣根过氧化物酶、碱性磷酸酶、β-半乳糖苷 酶、葡萄糖-6-磷酸脱氢酶;生色团,如荧光、发光或染料化合物;可通过 电子显微镜或借助于其电学性质如传导性、通过电流分析或伏安法或者通 过阻抗测量检测的电子致密基团;可以通过光学方法如衍射、表面等离子 共振或者接触角变化或者通过物理方法如原子力光谱、隧道效应等检测的 基团;放射性分子如32P、35S或125I。

对于本发明,杂交探针可以是“检测”探针。在这种情况中,“检测” 探针利用标记进行标记。所述检测探针可特别是“分子信标”检测探针, 如Tyagi & Kramer(Nature biotech,1996,14:303-308[6])所述。这些“分子信 标”在杂交期间变为荧光的。其具有茎-环型结构,含有荧光团和“猝灭剂” 基团。所述特异性环序列与其互补的靶核酸序列的结合导致所述茎展开, 在适当波长激发期间发射荧光信号。所述检测探针可特别是“报道探针”, 其包含“颜色编码条码(color-coded barecode)”,如NanoStringTM技术所述。

对于杂交反应的检测,可以使用已经直接(特别是在靶序列内掺入标记) 或间接(特别是使用如上述检测探针)标记的靶序列。在杂交步骤之前,可特 别进行标记和/或裂解靶序列的步骤,例如在酶扩增反应期间使用标记的三 磷酸脱氧核糖核苷酸进行。所述裂解可以特别通过咪唑或者氯化锰的作用 进行。所述靶序列也可以在扩增步骤之后标记,例如根据WO 91/19812所 述夹心杂交技术通过杂交检测探针进行。另一特别优选的标记核酸的方法 在专利申请FR 2780059中描述。

根据本发明的一个优选实施方案,所述检测探针包含荧光团和猝灭剂。 根据本发明的另一更优选的实施方案,所述杂交探针在其5’末端包含FAM (6-羧基-荧光素)或ROX(6-羧基-X-罗丹明)荧光团及在其3’末端包含猝灭剂 (Dabsyl)。

所述杂交探针也可以是“捕获”探针。在这种情况中,“捕获”探针是 固定的或者可以固定在固体基质上,通过任何合适方式即直接或间接固定, 例如通过共价或吸附进行。作为固体基质,可以使用合成材料或天然材料, 任选是化学修饰的,特别是多糖如基于纤维素的材料,例如纸,纤维素衍 生物如纤维素乙酸酯和硝化纤维会或葡聚糖,聚合物,共聚物,特别是基 于苯乙烯型单体,天然纤维如棉花,以及合成纤维如尼龙;无机材料如二 氧化硅、石英、玻璃或陶瓷;胶乳;磁性颗粒;金属衍生物,凝胶等。所 述固体基质可以是微滴定平板形式,专利申请WO-A-94/12670所述膜形式 或者颗粒形式。也可以在所述基质上固定一些不同的捕获探针,每个探针 均特异于靶基因。特别地,其上可固定大量探针的生物芯片可用作基质。 术语“生物芯片”是指小规格的固体基质,其上在预定位置附着大量捕获 探针。所述生物芯片或DNA芯片观念始于从二十世纪九十年代。其基于整 合了微电子学、核酸化学、成像分析及信息技术的多学科技术。工作原理 基于分子生物学基础:杂交现象,即两个DNA和/或RNA序列的碱基通过 互补配对。所述生物芯片法基于使用附着于固体基质的捕获探针,在该探 针上直接或间接用荧光团标记靶核苷酸片段样品。所述捕获探针特异定位 于所述基质或芯片上,每一杂交提供关于靶核苷酸片段的特定信息。累积 获得的信息,使其可以例如量化一或多个靶基因的表达水平。为了分析靶 基因的表达,可以制备包含大量探针的基质,所述探针相应于所有或部分 被转录为mRNA的靶基因。对于本发明,术语“低密度基质”是指包含少 于50个探针的基质。对于本发明,术语“中等密度基质”是指包含50-10,000 个探针的基质。对于本发明,术语“高密度基质”是指包含10,000个探针 以上的基质。

然后将特异于希望分析的靶基因的cDNA或cRNA与例如特异性捕获 探针杂交。在杂交后洗涤所述基质或芯片并通过如与荧光团型标记结合的 高亲和性配体揭示标记的cDNA或cRNA/捕获探针复合物。例如用扫描仪 读取荧光并通过信息技术进行荧光分析。例如可以提及的是由Affymetrix 公司开发的DNA芯片(″Accessing Genetic Information with High-Density DNA arrays",M.Chee et al.,Science,1996,274,610-614[7]."Light-generated oligonucleotide arrays for rapid DNA sequence analysis",A.Caviani Pease et al.,Proc.Natl.Acad.Sci.USA,1994,91,5022-5026[8]),以进行分子诊断。 在这项技术中,捕获探针通常是小规格,为大约25个核苷酸。生物芯片的 其他实例在G. Ramsay,Nature Biotechnology,1998,No.16,p.40-44[9]、F. Ginot,Human Mutation,1997,No.10,p.1-10[10]、J.Cheng et al,Molecular diagnosis,1996,No.1(3),p.183-200[11]、T.Livache et al,Nucleic Acids Research,1994,No.22(15),p.2915-2921[12]、J.Cheng et al,Nature Biotechnology,1998,No.16,p.541-546[13]或者在美国专利4,981,783、美国 专利5,700,637、美国专利5,445,934、美国专利5,744,305及美国专利 5,807,522中揭示。所述固体基质的主要特点应是保持捕获探针对于靶核苷 酸片段的杂交特性,同时对于检测方法产生最小的背景噪音。三种主要类 型的制造方法可以区分性地将探针固定在基质上。

首先,第一种技术是沉积预先合成的探针。探针的附着利用微量吸管 或者利用微点(microdot)或者通过喷墨(inkjet)装置通过直接转移进行。这种 技术使得大小在几个碱基(5-10个)直至相对大规格的60个碱基(印刷)至几 百个碱基(微沉积)范围的探针附着。

印刷是通过使用喷墨打印机的一种改编方法。其基于非常小(体积<1nl) 的液体球以可达到4000滴/秒的速度的推进。所述印刷不包括释放液体的 系统与其沉积之上的表面之间的任何接触。

微沉积是将几十至几百个碱基的长探针附着于载玻片表面。这些探针 通常从数据库中提取,是扩增和纯化产物形式。这种技术使得可以产生称 作微阵列的芯片,其在小于4cm2的表面积上携带大约一万个DNA斑点, 称作识别区。然而不应忘记使用尼龙膜,称作“巨阵列”,其携带通常通过 PCR扩增的产物,直径为0.5-1mm,最大密度为25个斑点/cm2。这种非常 灵活的技术由许多实验室使用。在本发明中,后一技术被认为包含在生物 芯片中。然而,可以将一定体积的样品沉积在微滴定平板每个孔中的底部, 如专利申请WO-A-00/71750和FR 00/14896的情况,或者可以根据另一专 利申请FR 00/14691所述,将彼此分离的一定数目的点滴沉积在相同培养皿 的底部。

将探针附着于基质或芯片的第二种技术称作原位合成技术。这种技术 导致在芯片的表面直接产生短探针。其基于原位寡核苷酸合成技术(特别见 专利申请WO 89/10977和WO 90/03382所述)及基于寡核苷酸合成仪方法。 所述技术包括沿着玻璃表面移动其中发生寡核苷酸延伸反应的反应室。

最后,第三种技术称作光刻技术(photolithography),这是用于由 Affymetrix开发的生物芯片的方法。其也是原位合成法。光刻技术衍生自微 处理器技术。所述芯片的表面通过附着可被光激活的光不稳定化学基团而 修饰。一旦光照,这些基团能与寡核苷酸的3’末端反应。通过用指定形状 的掩饰物保护这个表面,可以选择性光照及因此激活芯片的希望附着四种 核苷酸中之一或其他核苷酸的区域。不同掩饰物的连续使用使得可以交替 保护/反应循环,因此在大约几十平方微米(μm2)的斑点上产生寡核苷酸探 针。这个方案使得可以在几平方厘米(cm2)的表面上产生直至几十万个斑点。 光刻技术具有如下优势:同时大批量进行,使得可以在仅4×N次循环中产 生N聚体的芯片。所有这些技术可均用于本发明。根据本发明的一个优选 实施方案,上述步骤b)的至少一种特异性试剂包含至少一种杂交探针,其 优选固定在基质上。这种基质优选是如上述的低密度、高密度或中等密度 基质。

在包含大量探针的基质上的这些杂交步骤可以在如上述酶扩增反应步 骤之后进行,以增加靶遗传材料的量。

在步骤c)中,靶基因表达水平的确定可以通过本领域技术人员已知的 任何方案进行。通常,靶基因的表达可以通过在指定时间检测从靶基因转 录的mRNA(信使RNA)进行分析,或者通过检测衍生自这些mRNA的蛋白 质进行分析。

本发明优选涉及根据本领域技术人员熟知的任何方案通过检测衍生自 靶基因的mRNA而确定靶基因的表达水平。根据本发明的一个特定实施方 案,通过检测一些不同的mRNA同时确定一些靶基因的表达水平,每个 mRNA均衍生自靶基因。

当所述特异性试剂包含至少一种扩增引物时,可以通过如下方式确定 靶基因的表达水平:1)在从如上述生物学样品中提取作为生物学材料的总 RNA(包含转运RNA(tRNA)、核糖体RNA(rRNA)和信使RNA(mRNA))之 后,进行逆转录步骤以获得所述mRNA的互补DNA(或cDNA)。例如,这 个逆转录反应可以使用逆转录酶进行,其使得可以从RNA片段获得互补 DNA片段。可特别使用来自AMV (Avian Myoblastosis Virus)或来自MMLV (Moloney鼠白血病病毒)的逆转录酶。当更特别希望仅获得mRNA的cDNA 时,在存在仅包含胸腺嘧啶碱基(polyT)的核苷酸片段的条件下进行这个逆 转录步骤,其通过互补性与mRNA的polyA序列杂交形成polyT-polyA复 合物,然后其作为通过逆转录酶进行的逆转录反应的起始点。然后获得与 衍生自靶基因的mRNA互补的cDNA(靶基因特异性cDNA)和与衍生自除 了靶基因之外的其它基因的mRNA互补的cDNA(非特异于靶基因的 cDNA)。2)将特异于靶基因的扩增引物与靶基因特异性cDNA和靶基因非 特异性cDNA接触。特异于靶基因的扩增引物与靶基因特异性cDNA杂交, 源自衍生自靶基因的mRNA的cDNA的已知长度的一预定区域被特异扩 增。非特异于靶基因的cDNA不被扩增,而获得大量靶基因特异性cDNA。 对于本发明,“靶基因特异性cDNA”与“源自衍生自靶基因的mRNA的 cDNA”含义相同。这个步骤可以特别通过PCR型扩增反应或者通过上述 任何其它扩增技术进行。通过PCR,可以同时扩增特异于不同靶基因的一 些不同的cDNA,通过使用特异于靶基因的一些不同的扩增引物对进行, 这指的是多元扩增。3)靶基因的表达通过检测和量化在上述步骤2)中获得 的靶基因特异性cDNA而确定。这种检测可以在靶基因特异性cDNA根据 其大小电泳迁移之后进行。所述用于迁移的凝胶和介质可包含溴化乙锭, 当在指定迁移期之后将凝胶置于UV(紫外线)测光台上时,通过光信号的发 射可以直接检测靶基因特异性cDNA。靶基因特异性cDNA的量越大,则 这个光信号越强。这些电泳技术为本领域技术人员熟知。所述靶基因特异 性cDNA也可以通过使用通过进行直至饱和的扩增反应获得的量化范围检 测和量化。为了考虑到在各个步骤(逆转录,PCR等)期间可观测的酶效力 的变化,可以通过同时确定“管家”基因的表达而将各组患者的靶基因表 达标准化,所述管家基因的表达在各组患者中是相似的。通过确定靶基因 的表达与管家基因的表达的比率,即通过确定靶基因特异性cDNA的量与 管家基因特异性cDNA的量的比率,由此校正各个实验之间的变化。本领 域技术人员可特别参考如下出版物:Bustin S A,J Mol Endocrinol,2002,29: 23-39,GiuliettiAMethods,2001,25:386-401。

当所述特异性试剂包含至少一种杂交探针时,靶基因的表达可以通过 如下方式确定:1)在从如上述生物学样品中提取作为生物学材料的总RNA 之后,进行如上述逆转录步骤以获得与衍生自靶基因的mRNA互补的 cDNA(靶基因特异性cDNA)及与衍生自除了靶基因之外的基因的mRNA 互补的cDNA(非特异于靶基因的cDNA)。2)将所有cDNA与基质接触,所 述基质上固定了特异于希望分析其表达的靶基因的捕获探针,以在靶基因 特异性cDNA与捕获探针之间进行杂交反应,非特异于靶基因的cDNA与 捕获探针不杂交。所述杂交反应可以在固体基质上进行,所述固体基质包 括如上述所有材料。根据一个优选的实施方案,所述杂交探针被固定在基 质上。优选地,所述基质是如上述低密度、高密度或中等密度的基质。所 述杂交反应可以在如上述靶基因特异性cDNA经酶扩增步骤之后进行,以 获得大量靶基因特异性cDNA及增加靶基因特异性cDNA与特异于靶基因 的捕获探针杂交的可能性。所述杂交反应也可以在如上述标记和/或裂解所 述靶基因特异性cDNA的步骤之后进行,例如使用标记的三磷酸脱氧核糖 核苷酸以进行扩增反应。所述裂解可以特别通过咪唑和氯化锰的作用进行。 所述靶基因特异性cDNA也可以在扩增步骤之后标记,例如根据 WO-A-91/19812中所述夹心杂交技术通过与标记的探针杂交而进行。其它 优选的标记和/或裂解核酸的特异方法在专利申请WO 99/65926、WO 01/44507、WO 01/44506、WO 02/090584、WO 02/090319中描述。3)随后 进行检测杂交反应的步骤。所述检测可以通过将其上特异于靶基因的捕获 探针与靶基因特异性cDNA杂交的基质与用标记进行标记的“检测”探针 接触,及检测由所述标记发射的信号。当所述靶基因特异性cDNA预先已 经用标记进行标记时,直接检测所述标记发射的信号。

当所述至少一种特异性试剂在步骤b)中与至少一种杂交探针接触时, 靶基因的表达也可以通过如下方式确定:1)在从上述生物学样品中提取作 为生物学材料的总RNA之后,如上述进行逆转录步骤以获得所述生物学材 料的mRNA的cDNA。随后使用T7聚合酶进行所述cDNA的互补RNA的 聚合,其在启动子控制下起作用,可以从DNA模板中获得互补RNA。然 后获得特异于靶基因的mRNA的cDNA的cRNA(称作靶基因特异性cRNA) 及非特异于靶基因的mRNA的cDNA的cRNA。2)将所有cRNA与其上固 定了特异于希望分析其表达的靶基因的捕获探针的基质接触,以进行所述 靶基因特异性cRNA与捕获探针之间的杂交反应,非特异于靶基因的cRNA 与所述捕获探针不杂交。当希望同时分析几个靶基因的表达时,可以将几 个不同的捕获探针固定在基质上,每个探针均特异于靶基因。所述杂交反 应也可以在如上述标记和/或裂解所述靶基因特异性cRNA的步骤之后进 行。3)随后进行杂交反应检测步骤。所述检测可以通过将在其上特异于靶 基因的捕获探针与靶基因特异性cRNA杂交的基质与用标记进行标记的 “检测”探针接触,并检测所述标记发射的信号而进行。当所述靶基因特 异性cRNA预先已经用标记进行标记时,直接检测由所述标记发射的信号。 当使用在其上杂交大量探针的生物芯片型基质时,使用cRNA是特别有益 的。

本发明还涉及基质,其包含至少4种杂交探针,选自特异于具有SEQ ID NO:1-44任一所示核酸序列的靶基因的探针,及特别是特异于具有SEQ ID NO:1、2或3、4和5或6任一所示核酸序列的靶基因的4种杂交探针。

本发明进一步涉及如上述基质在区分BC与BBD中的应用。

本发明还涉及在患者生物学样品中区分乳腺癌与良性乳腺疾病的试剂 盒,所述试剂盒包含至少一个靶基因的至少一种特异性试剂及包含SEQ ID NO:1-44所示核酸序列的28个靶基因的不超过28种特异性试剂,其中所 述至少一种试剂特异于包含选自SEQ ID NO:1、2或3、4和5或6所示核 酸序列的核酸序列的至少一个靶基因。

所述特异性试剂可针对上述至少2个、3个或4个但更具体不超过28 个基因的组合,在一个实施方案中,所述试剂盒包含特异于至少4个且不 超过28个靶基因的组合的试剂,其中所述试剂包括至少特异于分别包含 SEQ ID NO:1、2或3、4和5或6所示核酸序列的靶基因的试剂。在另一 实施方案中,所述试剂盒包含特异于28个靶基因组合的试剂,其中所述试 剂包括特异于包含SEQ ID NO:1-28所示核酸序列的靶基因的试剂。

实施例

I)材料和方法

1.患者和样品特性

在这项研究中,从患有乳腺癌的84名患者及患有良性乳腺疾病的94 名患者中收集血液样品。所有患者均是由复旦大学肿瘤医院胸外科(中国, 上海)在2007年7月至2008年12月之间怀疑患有乳腺癌的患者。每一患 者均在医院中通过乳腺X光照相术筛查,同时由三名专业放射学家确定患 者的所有BI-RADS类别。从每一患有BC的84名女性及患有BBD的94 名女性患者收集大约2.5ml外周血,置于含有RNA稳定溶液的PaxgeneTM Blood RNA试管(PreAnalytix)中。所有血液样品均在对怀疑的乳腺损害进行 细针抽吸操作或者用于细胞学研究的任何介入步骤之前收集。乳腺癌的诊 断基于在粗针活组织检查或者外科手术样品的癌细胞鉴别。良性疾病的诊 断基于在开放性活检中无癌细胞存在。所述方案由当地临床研究伦理委员 会许可,从该研究招募的所有患者获取书面知情同意书。最终的病理学肿 瘤分期使用TNM分期系统确定,并使用Nottingham系统分级。除了肿瘤 类型和肿瘤分级之外,在每个肿瘤中评估雌激素受体(ER)、孕酮受体(PR) 和人表皮生长因子受体2(HER2)状况及淋巴结状况。

2.RNA提取和微阵列分析

使用PAXGene Blood试剂盒(PreAnalytix)根据厂商指导提取总 RNA。总RNA的量通过分光光度计在光密度(OD)260nm测量,使用RNA 6000Nano LabChip在2100Bioanalyzer(Agilent Technologies)上评定质量。 仅分析RNA完整指数(RIN)在7-10之间的样品。然后使用具有WT-Ovation RNA扩增系统(NuGen Technologies)的Ribo-SPIA Ovation技术根据厂商的 标准方案,将50ng总RNA逆转录及线性扩增为单链cDNA,产物用 QIAquick PCR纯化试剂盒(Qiagen GmbH)纯化。随后将2μg扩增及纯化的 cDNA用RQ1 RNase-Free DNase (Promega corporation)片段化,通过 Terminal Transferase(Roche Diagnostics GmbH)和DNA标记试剂(Affymetrix) 用生物素酰化三磷酸脱氧核苷标记。将标记的cDNA在Hybridization Oven 640(Affymetrix)中在60rpm、50℃、18小时而杂交到HG U133plus 2.0Array (Affymetrix)上。所述HG U133plus 2.0Array含有54,675个探针组,代表 大约39,000个最佳鉴定的人基因。在杂交后,根据Affymetrix方案 EukGE-WS2v4使用Affymetrix流体站FS450洗涤该阵列并染色。使用 Affymetrix扫描仪3000扫描该阵列。

3.微阵列数据分析

质量控制与预处理。根据标准Affymetrix质量控制参数的建议进行质 量控制分析。基于评估标准,所有血液样品测量均满足最低质量要求。将 所述Affymetrix表达系统由RMA(Robust Multi-chip Average)[10]预处理背 景校准、分位数标准化及中位数平滑概括(median polish summarization)。滤 除极端信号强度(低于50或高于214)的探针组(Probeset)。然后,根据Entrez 基因数据库信息进行基于序列信息的过滤。除去无Entrez Gene ID注释的 探针组。对于作图为相同Entrez Gene ID的多个探针组,仅保留四分位差 最大值的探针组,除去其它探针组。总之,为了降低批次的可能性,应用 标准化算法ComBat[11]。所述ComBat方法(http://statistics.byu.edu/johnson/ComBat/)应用参数或非参数经验性Bayes构架调节已知数据组中的批次效 应。

4.分子特征鉴别

在适当的预处理以减少冗余探针组和表达数据的批次变化之后,基于 预处理的表达数据进行分子特征鉴别。将具有乳腺X光照相结果和确认的 病理学信息的84个BC样品和94个BBD样品分为两组:具有BI-RADS 1-5 的79个BC+73个BBD组,及具有BI-RADS 0的5个BC+21个BBD组。 具有BI-RADS 1-5的79个BC+73个BBD组用作实验组(train set)以通过 Recursive Feature Elimination (RFE)程序鉴别感兴趣基因,并通过Support Vector Machine(SVM)[12-13]建造分类模型。在实验组内,进行5重交叉验 证法(5-fold cross validation process)以确定最佳基因组。通过RFE基于第 五实验组的四个鉴别前100个基因。分类模型基于前100基因产生,使用 第五实验组的另一个检测该模型。将这个方法重复1000次,因此产生1000 个前100个基因组。最后,在全部1000个前100个基因列表中出现的基因 被鉴别为最强大(robust)的基因,使用全部实验组产生最终模型。然后将该 模型用于完全未确定的具有BI-RADS 0的5个BC+21个BBD。

使用R-environment with Bioconductor libraries[14-18]执行预处理和统 计学步骤。

II)结果

1.患者特性

本项研究是对来自具有乳腺X照相结果和确认的病理学信息的84名 BC患者和94名BBD患者的178个样品进行的,然后将样品分为两组:具 有BI-RADS 1-5的79个BC+73个BBD组及具有BI-RADS 0的5个BC+ 21个BBD组。表2概括了这些BC和BBD患者群的临床特性。简言之,92% 的癌症患者呈现T0-T2肿瘤;70%和32%的肿瘤分别是激素受体阳性和Her2 阳性。良性发现分别包括51.1%的乳腺疾病、27.7%的乳腺纤维腺瘤及21.2% 的管内乳头状瘤。

表2:群特性

*P值

2.模型的构建和性能

通过使用Recursive Feature Elimination(RFE)方法及Support Vector Machine(SVM)分类,产生一组28-个基因(表1),以区分具有BI-RADS 1-5 的BC与BBD患者,然后在BI-RADS 0组中检测这组28个基因。

在这28个预定基因中,其中15个基因的表达在BC中与在BBD中相 比是表达降低的,13个基因在BC中与在BBD中相比是表达升高的,如表 3所示。

表3:

4-基因特征

在第一个实验组中,一组4个基因CHI3L1、CLEC4C、LILRA3和 TUBB2A分类恶性与良性的估计精确性为71%(76%灵敏性和66%特异性)。

在79个乳腺癌样品中,60个样品被正确分类,73个良性样品中的48 个样品被归属为正确类别(表4a)。

表4a:鉴别的特征对于实验数据组的分类值

精确性=71%,灵敏性=76%,特异性=66%

所述模型在单独的BI-RADS 0测试组的测量性能在表4b中报道。5个 癌症样品中的3个样品被正确分类,21个良性患者中的8个样品被精确分 类,灵敏性为60%及特异性为38%。所述模型在BI-RADS 0检测组中的精 确性为42%。

表4b:鉴别的特征对于单独的检测数据组的分类值

精确性=42%,灵敏性=60%,特异性=38%

28-基因特征

在实验组中,一组28个基因分类恶性与良性的估计精确性为88%(94% 灵敏性和84%特异性)。

在79个癌症样品中,74个被正确分类,73个良性样品中的61个被归 属于正确类别(表5a)。

表5a:鉴别的特征对于实验数据组的分类值

精确性=88%,灵敏性=94%,特异性=84%

所述模型在单独的BI-RADS 0测试组的测量性能在表5b中报道。5个 癌症样品中的4个被正确分类,21个良性患者中的15个被精确分类,灵敏 性为80%及特异性为71%。所述模型在BI-RADS 0检测组中的精确性为 73%。

表5b:鉴别的特征对于单独的检测数据组的分类值

精确性=73%,灵敏性=80%,特异性=71%

本发明人还分析了在错误预测的对象中是否任何临床特性均是显著过 度表现的。发现在测试组中唯一的假阴性病例是46岁女性,其患有Paget's 病和DCIS。

参考文献

1.Margaret M.Eberl,MPH,Chester H.Fox,Stephen B.Edge,Cathleen A. Carter,and Martin C.Mahone y.BI-RADS Classification for Management of Abnormal Mammograms,The Journal of the American Board of Family Medicine 19:161-1

2.Whitney AR,Diehn M,Popper SJ,Alizadeh AA,Boldrick JC,Relman DA,Brown PO.Individuality and variation in gene expression patterns in human blood.Proc Natl Acad Sci U S A.2003,18;100(4):1896-901.

3.P.E.Nielsen et al,Science,254,1497-1500(1991).

4.Kricka et al.,Clinical Chemistry,1999,no 45(4),p.453-458.

5.Keller G. H.et al.,DNA Probes,2nd Ed.,Stockton Press,1993, sections 5and 6,p.173-249.

6.Tyagi & Kramer,Nature Biotech,1996,14:303-308.

7.M.Chee et al.,Science,1996,274,610-614].

8.A.Caviani Pease et al.,Proc.Natl.Acad.Sci.USA,1994,91, 5022-5026.

9.G. Ramsay,Nature Biotechnology,1998,No.16,p.40-44.

10.F.Ginot,Human Mutation,1997,No.10,p.1-10.

11.J.Cheng et al,Molecular diagnosis,1996,No.1(3),p.183-200.

12.T.Livache et al,Nucleic Acids Research,1994,No.22(15),p. 2915-2921.

13.J.Cheng et al,Nature Biotechnology,1998,No.16,p.541-546.

14.Harris Drucker,Chris J.C.Burges,Linda Kaufman,Alex Smola and Vladimir Vapnik(1997)."Support Vector Regression Machines".Advances in Neural Information Processing Systems 9,NIPS 1996,155-161,MIT Press.

15.R Development Core Team(2009).R:A language and environment for statistical computing.R Foundation for Statistical Computing,Vienna,Austria. ISBN 3-900051-07-0,URL http://www.R-project.org

16.Gentleman RC,Carey VJ,Bates DM,Bolstad B,Dettling M,Dudoit S, Ellis B,Gautier L,Ge Y,Gentry J,et al.:Bioconductor:open software development for computational biology and bioinformatics.

17.Crispin J Mille r.simpleaffy(2009):Very simple high level analysis of Affymetrix data.R package version 2.22.0.http://www.bioconductor.org, http://bioinformatics.pier.man.ac.uk/simpleaffy/

18.R.Gentleman,V.Carey,W.Huber and F.Hahne(2009).genefilter: genefilter:methods for filtering genes from microarray experiments.R package version 1.28.0.

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号