首页> 中国专利> 基因组变异的快速分析

基因组变异的快速分析

摘要

本发明提供用子测定一个或多个染色体上大量感兴趣基因座的序列的方法。所述方法使用包含限制酶的识别位点的寡核苷酸引物,使得用限制酶消化可以产生包含感兴趣的基因座的5’突出端。5’突出端用作掺入核苷酸的模板,其中所述核苷酸能被检测。该方法特别适合分析大量序列,例如来自一个核酸样品的单核苷酸多态性。

著录项

  • 公开/公告号CN1650031A

    专利类型发明专利

  • 公开/公告日2005-08-03

    原文格式PDF

  • 申请/专利权人 拉瓦格恩公司;

    申请/专利号CN03809619.6

  • 发明设计人 R·达拉安;

    申请日2003-02-28

  • 分类号C12Q1/68;C07H21/02;C07H21/04;

  • 代理机构北京市中咨律师事务所;

  • 代理人黄革生

  • 地址 美国马里兰

  • 入库时间 2023-12-17 16:21:02

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2012-05-02

    未缴年费专利权终止 IPC(主分类):C12Q1/68 授权公告日:20090729 终止日期:20110228 申请日:20030228

    专利权的终止

  • 2009-07-29

    授权

    授权

  • 2005-09-28

    实质审查的生效

    实质审查的生效

  • 2005-08-03

    公开

    公开

说明书

本申请要求2002年3月11日申请的美国专利申请No.10/093,618,和分别于2002年3月1日及2002年5月8日申请的临时美国专利申请Nos.60/360,232和60/378,354的优先权。这些申请的内容全文在此引作参考。

发明背景

技术领域

本发明涉及快速检测核酸序列的方法。该方法特别可以用于基因型确定,和用于检测单一或多个染色体上一个至几十个至几百个至几千个单核苷酸多态性(SNP)或突变,和用于检测染色体异常,例如截短,颠换,三体性,和单体性。

背景技术

个体序列变异包括从有害的疾病突变至中性多态性的连续变异。目前已知三千种以上的遗传病,包括迪谢纳肌营养不良,阿尔茨海默氏病,囊性纤维化,和亨廷顿舞蹈症(D.N.Cooper和M.Krawczak,“HumanGenome Mutations”,BIOS Scientific Publishers,Oxford(1993))。还有,特定DNA序列可以使得个体对多种疾病易感,例如肥胖,动脉硬化,和各种类型的癌症,包括乳房癌,前列腺癌,和结肠癌。另外,染色体异常,例如21三体性(其导致唐氏综合征),18三体性(其导致爱德华兹综合征),13三体性(其导致巴多综合征),X单体性(其导致特纳综合征)和其他性别非整倍体性,是相当大部分活产人遗传性缺陷的原因。有关基因突变,染色体异常,和基因序列中的变异的知识,例如单核苷酸多态性(SNP)将有助于理解,诊断,预防和治疗疾病。

最经常地,序列变异表现为重复序列元件例如小卫星和微卫星长度的差异,小的插入或缺失,和单碱基替代。单核苷酸多态性(SNP)代表最常见的序列变异形式;估计人基因组中存在群体概率超过5%的三百万常见SNP。基因组DNA平均每12000个碱基出现一次通常引起移码突变的小的缺失或插入(Wang,D.G.等,Science 280:1077-1082(1998))。利用这些多态性作为指引物正在开发遗传图谱(http://research.marshfieldclinic.org/genetics/;2002年1月10日起网址)。

2001年2月公开了人类基因组的核酸序列,并且提供了先前未有解析度的含有几十万SNP标记的遗传图谱,以及有关人类疾病的潜在信息财富(Venter等,Science 291:1304-1351(2001);International HumanGenome Sequencing Consortium,Nature 409:860-921(2001))。但是,人类染色体中所包含的DNA长度总共超过30亿个碱基对,因此对每个人的基因组测序是不实际的。因此,急需开发高通量方法,以快速测定导致疾病表型出现或易于出现的SNP和点突变等位基因变异的存在。也需要表征影响个体生理,心理,听力,视力,神经,对药物的反应,药物代谢,和药物相互作用的功能多态性的有效方法。

几种技术被广泛用于分析和检测基因变异,例如DNA测序,限制性片段长度多态性(RFLP),DNA杂交分析,包括DNA微阵列和肽核酸分析,及蛋白质截短试验(PTT),但所有的这些技术都有局限性。虽然DNA测序是最明确的方法,但是它也最费时和最昂贵。经常地,虽然只有编码序列的一小部分是令人感兴趣的,但是却要分析基因的整个编码序列。在大多数情况下,特定基因中有限数目的突变是大多数疾病表型的原因。

例如,囊性纤维化跨膜传导调节蛋白(CFTR)基因由跨越250000碱基对的24个外显子组成(Rommens等,Science 245:1059-1065(1989);Riordan等,Science 245:1066-73(1989))。最近发现CFTR基因中大约200个突变与囊性纤维化病态有关。因此,只需要分析非常小的百分比的CFTR基因读框。此外,总共10个突变构成所有已知病例的75.1%。在高加索人所有囊性纤维化病例中66%由单一苯丙氨酸残基,F508,的缺失引起。

杂交技术,包括Southern印迹,狭线印迹,斑点印迹,和DNA微阵列,通常用于检测遗传变异(分子克隆,实验手册,冷泉港实验出版社,第三版(2001))。在典型的杂交分析中以一种未知的核苷酸序列(“靶物”)对于具有已知的核苷序列的另一个片段(“探针”)的亲和性为基础,分析它的核苷酸序列。如果两个片段在“严紧条件下”杂交,则认为序列是互补的,可以从“探针”序列推断靶物片段的序列。

然而,从典型杂交分析得到的结果经常难以解释。存在或不存在杂交信号取决于“严紧条件”的定义。很多变量可以用来提高或降低严紧条件,例如盐浓度,存在或不存在竞争核苷酸片段,去除非特异性结合进行的洗涤的次数,以及进行杂交的时间和温度。一般情况下,杂交条件必须针对每个“靶物”核苷酸片段进行优化,这不仅耗时,并且与高通量方法不相吻合。杂交分析中经常可见高度可变性,以及高比例的假阳性。典型地,杂交分析起到筛选可能的候选物的功能,但是阳性证明要求DNA测序分析。

以杂交分析原理为基础已经开发出了检测突变的几种技术。例如,在引物延伸分析中,通过PCR或者任何其他合适的扩增技术来扩增包含令人感兴趣的核苷酸的DNA区域。扩增之后,引物与靶核酸序列杂交,其中引物的3’端的最后核苷酸在要分析的靶序列核苷酸位置的紧5’退火。退火的引物通过单一的标记的核苷三磷酸而延长。然后检测掺入的核苷酸。

引物延伸分析有几种局限性。首先,一定在引物延伸之前扩增感兴趣的区,这延长了分析时间并且提高了成本。其次,在引物延伸之前一定完全去除PCR引物和dNTPs,残留的污染物能干扰结果的正确分析。第三,最限制该项分析的方面是,引物与DNA模板的杂交,这要求对于每一种引物,和对于每一个分析的序列优化条件。杂交分析具有低度可重复性,和高度非特异性。

肽核酸(PNA)亲和性分析是传统杂交分析的发展(Nielsen等,Science254:1497-1500(1991);Egholm等,J.Am.Chem.Soc.114:1895-1897(1992);James等,Protein Science 3:1347-1350(1994))。PNAs是遵循Watson-Crick碱基配对规则的结构DNA模拟物,其可以在标准DNA杂交分析中使用。PNAs在杂交分析中显示更大的特异性,因为PNA/DNA错配比DNA/DNA错配更不稳定,并且互补PNA/DNA链形成比互补DNA/DNA链更强的键。但是,使用PNAs的遗传分析仍然要求繁琐的杂交步骤,因此,受到高度非特异性和重复难的影响。

最近,开发出DNA微阵列来检测遗传变异和多态性(Taton等,Science289:1757-60,2000;Lockhart等,Nature 405:827-836(2000);Gerhold等,Trends in Biochemical Sciences 24:168-73(1999);Wallace,R.W.,Molecular Medicine Today 3:384-89(1997);Blanchard和Hood,Nature Biotechnology 149:1649(1996))。DNA微阵列在玻璃或尼龙基底上由高速自动系统制造,并且包含具有已知鉴定身份的DNA片段(“探针”)。微阵列用于根据传统碱基配对原则使已知的和未知的DNA片段(“靶”)配对。DNA微阵列的好处是一个DNA芯片可以同时对上千个基因提供信息。然而,DNA微阵列仍然是以杂交原理为基础,因此,有着上述缺点。

蛋白质截短试验(PTT)通常也用来检测遗传多态性(Roest等,HumanMolecular Genetics 2:1719-1721(1993);Van Der Luit等,Genomics 20:1-4(1994);Hogervorst等,Nature Genetics 10:208-212(1995))。典型地,在PTT中,将感兴趣的基因进行PCR扩增,体外转录/翻译,纯化,并且通过聚丙烯酰胺凝胶电泳分析。PTT可用于筛选大部分的编码序列并且检测导致显著减小预期蛋白质大小的终止密码子突变。然而,没有设计PTT来检测不显著改变蛋白质大小的突变。

因此,仍然需要用于分析DNA,特别是怀疑具有一个或多个单核苷酸多态性或突变的基因组DNA的快速方法。

发明概述

本发明涉及一种确定感兴趣的基因座的序列的方法,该方法包括(a)使用第一和第二引物扩增模板DNA上感兴趣的基因座,其中第二引物包含限制酶的识别位点,使得用限制酶消化可以产生包含感兴趣的基因座的5′突出端;(b)用识别第二引物上的所述识别位点的限制酶消化扩增的DNA;(c)使用包含感兴趣的基因座的5′突出端作为模板将核苷酸掺入到(b)的消化的DNA中;和(d)通过测定(c)的DNA序列确定感兴趣的基因座的序列。

本发明还涉及一种确定感兴趣的基因座的序列的方法,所述方法包括(a)使用第一和第二引物扩增模板DNA上感兴趣的基因座,其中第二引物包含限制酶的识别位点的一部分,其中模板DNA扩增后产生限制酶的全识别位点,使得用限制酶消化可以产生包含感兴趣的基因座的5′突出端;(b)用识别通过第二引物和模板DNA产生的全识别位点的限制酶消化扩增的DNA;(c)使用包含感兴趣的基因座的5′突出端作为模板将核苷酸掺入到(b)的消化的DNA中;和通过测定(c)的DNA序列确定感兴趣的基因座的序列。

本发明还涉及一种确定感兴趣的基因座的序列的方法,所述方法包括(a)使用第一和第二引物从模板多核苷酸复制包括感兴趣的基因座的DNA区域,其中第二引物包含产生限制酶的识别位点的序列,使得用限制酶消化可以产生包含感兴趣的基因座的5′突出端;(b)用识别由第二引物产生的识别位点的限制酶消化DNA,产生DNA片段;(c)使用包含感兴趣的基因座的5′突出端作为模板将核苷酸掺入到(b)的消化的DNA中;和(d)通过测定(c)的DNA的序列确定感兴趣的基因座的序列。

本发明还涉及包含要测序的感兴趣的基因座和限制酶的识别位点的DNA片段,其中用限制酶消化在DNA片段上产生5′突出端,并且其中感兴趣的基因座和限制酶识别位点的相互关系使得用限制酶消化可以产生包含感兴趣的基因座的5′突出端。

模板DNA能从任何来源(包括合成的核苷酸)获得,优选来自细菌,真菌,病毒,植物,原生动物或人。在一个实施方案中,从人类来源获得模板DNA。在另一个实施方案中,从细胞,组织,血液样品,血清样品,血浆样品,尿样,脊髓液,淋巴液,精液,阴道分泌物,腹水,唾液,粘膜分泌物,腹膜液,粪便,或身体溢沁物获得模板DNA。

第一和/或第二引物的3’区可包含与模板DNA的错配。在3’端的最后1,2或3个碱基处可发生错配,但是不局限于此。

本发明中使用的限制酶可以在限制位点切割DNA。限制酶可以是但不限于PflF I,Sau96 I,ScrF I,BsaJ I,Bssk I,Dde I,EcoN I,Fnu4H I,Hinf I,或Tth111 I。或者本发明中使用的限制酶可在距识别位点一定距离的位置切割DNA。

在另一个实施方案中,第一引物包含限制酶的识别位点。在优选的实施方案中,此限制酶识别位点不同于第二引物上的限制酶识别位点。本发明包括用识别第一引物上的识别位点的限制酶消化扩增的DNA。

优选地,第二引物上的识别位点对应于自其识别位点一定距离切割DNA产生包含感兴趣的基因座的5′突出端的限制酶。在优选的实施方案中,第二引物上的识别位点是IIS型限制酶的识别位点。IIS型限制酶选自例如Alw I,Alw26 I,Bbs I,Bbv I,BceA I,Bmr I,Bsa I,Bst71I,BsmA I,BsmB I,BsmF I,BspM I,Ear I,Fau I,Fok I,HgaI,Ple I,Sap I,SSfaN I,和Sthi32 I,并且更优选BceA I和BsmF I。

在一个实施方案中,第二引物的5’区不退火到模板DNA上和/或第一引物的5’区不退火到模板DNA上。第一或第二引物的3’区退火长度可以是25-20,20-15,15,14,13,12,11,10,9,8,7,6,5,4个碱基或少于4个碱基。

在一个实施方案中,扩增包括聚合酶链式反应(PCR)。在另一个实施方案中,第一轮PCR的退火温度可以大约是退火到模板DNA上的第二引物的3’区的解链温度。在另一个实施方案中,第二轮PCR的退火温度可以大约是退火到模板DNA上的第一引物的3’区的解链温度。在另一个实施方案中,剩余循环的退火温度可以大约是第二引物整个序列的解链温度。

在一个实施方案中,第二引物的3’端邻近感兴趣的基因座。

第一和/或第二引物在5’末端可以包含标签。优选地,第一引物在5’末端包含标签。该标签能用来将模板DNA与扩增的DNA分开。该标签能用来将不包含标记的核苷酸的扩增的DNA与包含标记的核苷酸的扩增的DNA分开。标签可以是但不限于放射性同位素,荧光报道分子,化学发光报道分子,抗体,抗体片段,半抗原,生物素,生物素衍生物,光生物素,亚氨基生物素,洋地黄毒苷,抗生物素蛋白,酶,吖啶鎓,糖,酶,脱辅酶,均聚寡核苷酸,激素,铁磁性部分,顺磁性部分,抗磁性部分,发磷光部分,发光部分,电化学发光部分,有色部分(chromatic moiety),具有可检测的电子自旋共振、电容(electric capacitance)、介电常数或导电性的部分,或者它们的组合。优选地,标签是生物素。生物素标签可以用来使用链霉抗生物素蛋白基质从模板DNA中分离出扩增的DNA。链霉抗生物素蛋白基质可以包被在微量滴定板的孔上。

本发明方法中核苷酸的掺入是通过DNA聚合酶实现的,包括但不限于大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶I的Klenow片段,T5DNA聚合酶,T7 DNA聚合酶,T4 DNA聚合酶,Taq聚合酶,Pfu DNA聚合酶,Vent DNA聚合酶,噬菌体29,REDTaqTM基因组DNA聚合酶,和测序酶。

核苷酸的掺入可进一步包括使用标记的和未标记的核苷酸的混合物进行。可以掺入一个核苷酸,两个核苷酸,三个核苷酸,四个核苷酸,五个核苷酸,或者五个以上核苷酸。可以掺入标记的和未标记的核苷酸的组合。标记的核苷酸可以是但不限于双脱氧核苷酸三磷酸和脱氧核苷酸三磷酸。未标记的核苷酸选自但不限于双脱氧核苷酸三磷酸和脱氧核苷酸三磷酸。标记的核苷酸用例如但不限于下面的分子标记:放射性分子,荧光分子,抗体,抗体片段,半抗原,糖,生物素,和生物素衍生物,发磷光部分,发光部分,电化学发光部分,易染部分,或具有可检测的电子自旋共振、电容、介电常数或导电性的部分。优选地,标记的核苷酸为用荧光分子标记的。荧光标记的核苷酸的掺入可以进一步包括使用荧光的和未标记的核苷酸的混合物。

在一个实施方案中,感兴趣的基因座序列的测定包括检测掺入的核苷酸。在一个实施方案中,通过例如但不限于下面的方法检测:凝胶电泳,毛细管电泳,microchannel electrophoresis,聚丙烯酰胺凝胶电泳,荧光检测,测序,ELISA,质谱,飞行时间质谱,四极质谱,扇形磁场质谱,电性扇形(electric sector)质谱,荧光测定,红外光谱测定,紫外光谱测定,palentiostatic电流分析法,杂交,例如Southern印迹,或微阵列。在优选的实施方案中,通过荧光检测进行所述测定。

在优选的实施方案中,感兴趣的基因座被怀疑包含单核苷酸多态性或突变。该方法可用来同时测定多个感兴趣的基因座的序列。模板DNA可包括来自单一染色体的多个基因座。模板DNA可包括来自不同染色体的多个基因座。模板DNA上感兴趣的基因座可以在一个反应中被扩增。或者,  模板DNA上每个感兴趣的基因座可以在分开的反应中被扩增。在消化扩增的DNA之前可将扩增的DNA合并在一起。在测定感兴趣的基因座的序列之前可以将每个包含感兴趣的基因座的标记DNA分开。在一个实施方案中,感兴趣的基因座中至少一个被怀疑包含单核苷酸多态性或突变。

在另一个实施方案中,本发明的方法可用于测定来自一个个体或多个个体的多个感兴趣的基因座的序列。还有,本发明的方法可用于测定来自多个个体的单个感兴趣的基因座的序列。

附图的简要说明

图1A.描述双链DNA分子的示意图。引物对用弯曲箭头表示,位于感兴趣的基因座(在碱基N14处用三角符号表示)的侧翼。感兴趣的基因座可以是单核苷酸多态性,点突变,插入,缺失,易位等。各个引物包含从5′末端起大约10bp的限制酶识别位点,在第一引物中表示为″a″区,在第二引物中表示为″d″区。限制识别位点″a″可以是任何类型的限制酶的识别位点,但是识别位点″d″的对应限制酶将在其识别位点以外″n″个核苷酸处进行切割,并且留下5′突出端和3′凹端。这样的酶的例子包括但不限于BceA I和BsmF I。5′突出端用作将核苷酸掺入到3′凹端中的模板。

显示的第一引物在5′端用生物素修饰以有助于纯化。这些引物3′端的序列使得引物可以在距感兴趣的基因座期望距离的上游和下游位置退火。第二引物紧靠感兴趣的基因座退火;退火位点(其以″c″区表示)的设计使得第二引物的3′端可以在距感兴趣的基因座一个碱基的位置退火。第二引物也可以在距感兴趣的基因座任何距离的位置退火,条件是用识别该引物上的″d″区的限制酶消化可以产生包含感兴趣的基因座的5′突出端。

第一引物的退火位点,以″b″区表示,为大约20个碱基。

图1B为说明第一轮PCR扩增的退火和延伸步骤的示意图。大约在退火到模板DNA上的第二引物的3′区的解链温度下进行第一轮扩增,该区以″c″区表示并且在本实施例中是13个碱基对。在该温度下,第一和第二引物均退火到它们各自的互补链上并且开始延伸,以虚线表示。在这第一个循环中,第二引物延伸并且复制b区,其中第一引物可以在下一轮循环中退火到b区。

图1C.说明第二轮PCR扩增中变性之后退火和延伸步骤的示意图。第二轮扩增在较高退火温度(TM2)下进行,TM2大约是退火到模板DNA(表示为″b″区)上的第一引物的3′区的20bp的解链温度。因此,在TM2,第一引物(其与b区互补)能与在第一轮反应中拷贝的DNA结合,然而,在TM2,第二引物不能退火到原始模板DNA上或退火到在第一轮反应中拷贝的DNA上,因为退火温度太高。尽管第二引物能与原模板DNA中的13个碱基退火,但是TM2被计算为大约20个碱基的解链温度。

图1D.说明第三轮扩增中变性之后退火和延伸反应的示意图。在该循环中,退火温度TM3大约是包括″c″和″d″区的整个第二引物的解链温度。″c″+″d″区的长度为大约27-33 bp长,因此TM3显著高于TM1和TM2。在此较高TM下,包含″c″和″d″区的第二引物退火到第二轮产生的DNA拷贝上。

图1E.说明剩余扩增循环的退火和延伸反应的示意图。剩余循环的退火温度是TM3,其大约是整个第二引物的解链温度。TM3下,第二引物与包含c′和d′区的模板结合,而第一引物与包含a′和b区的模板结合。通过在头三轮的每一轮中相继地提高退火温度,即从TM1到TM2到TM3,显著减少了非特异性扩增。

图1F为说明与固相基质结合的扩增的感兴趣基因座的示意图。

图1G为说明用识别″d″的限制酶消化之后结合的扩增DNA的示意图。“下游”端释放到上清液中,并且可以通过用任何合适的缓冲液洗涤而去除。包含感兴趣的基因座的上游端保持与固相基质结合。

图1H为用标记的ddNTP实施“填补”(补平,fill-in)之后结合的扩增DNA的示意图。DNA聚合酶被用来“填补”与感兴趣的基因座(N14)互补的碱基(N′14)。在本实施例中,该反应中只存在ddNTPs,这样只补平感兴趣的基因座或感兴趣的SNP。

图1I为说明用限制酶″a″消化之后结合的标记DNA的示意图。标记的DNA被释放到上清液中,可以将其收集起来鉴定掺入的碱基。

图2示意了有“N”个感兴趣的基因座的双链DNA模板和“n”个引物对x1,y1至xn,yn,所述引物对特异地退火,从而使得引物位于各感兴趣的基因座的侧翼。第一引物在5′端生物素化(用·表示)并且包含限制酶识别位点“a”(其可以是任何类型的限制酶的识别位点)。第二引物包含限制酶识别位点″d″,其中″d″是在距其识别位点一定距离切割DNA并且产生包含感兴趣的基因座的5′突出端和3′凹端的限制酶的识别位点。第二引物邻接各相应感兴趣的基因座退火。设计第二引物中限制酶位点″d″的精确位置,使得用限制酶″d″消化各个感兴趣的基因座的PCR产物后可以产生包含感兴趣的基因座的5′突出端和3′凹端。第一引物的退火位点大约20个碱基长,并且经选择每一个第一引物与其各自的第二引物的距离相继地增加。例如,如果在基因座1,第一和第二引物的3′端相距Z碱基对,则在基因座2,第一和第二引物的3′端相距Z+K碱基对,其中K=1,2,3或者三个以上碱基。对于基因座N,引物相距ZN-1+K碱基对。使每一第一引物相继地进一步远离它们各自的第二引物的目的在于,使得″填补后″的限制片段(根据图1B-1I所述扩增,纯化,消化和标记之后产生的)大小不同并且可以例如通过电泳解析,从而允许检测每个感兴趣的基因座。

图3为利用多个退火温度对包含SNP的DNA片断的PCR扩增。对含有来自36名人类自愿者的基因组DNA模板的样品分析下面四种SNP:位于染色体21上的SNP HC21S00340(1道)(人类染色体21 cSNP数据库中给出的标识号);位于染色体1上的SNP TSC 0095512(2道);位于染色体1上的SNP TSC 0214366(3道);和位于染色体1上的SNP TSC 0087315(4道)。利用三个不同的退火温度方案(这里称作低严紧性退火温度;中严紧性退火温度;和高严紧性退火温度),通过PCR扩增包含SNP的每个DNA片段。无论哪一退火温度方案,均将包含SNP的各个DNA片段进行40轮PCR扩增。每一PCR反应的变性步骤为在95℃进行30秒。

图3A:显示利用低严紧性退火温度方案对包含不同SNP的4个DNA片段的PCR扩增结果的凝胶照片。

图3B:显示利用中严紧性退火温度方案对包含不同SNP的4个DNA片段的PCR扩增结果的凝胶照片。

图3C:显示利用高严紧性退火温度方案对包含不同SNP的4个DNA片段的PCR扩增结果的凝胶照片。

图4A:说明位于染色体21上(由人染色体21 cSNP数据库中给出标识号)的SNP HC21S00027的DNA序列(SEQ ID NO:27&28)。第一引物(SEQ ID NO:17)和第二引物(SEQ ID NO:18)分别在HC21S00027序列的上面和下面指明。将第一引物生物素化并且其包含EcoRI的限制酶识别位点。第二引物包含BsmF I的限制酶识别位点并且包含与DNA序列退火的13个碱基。由R(A/G)和r(T/C;与R互补)指示SNP。

图4B:说明位于染色体21上(由人染色体21 cSNP数据库给出标识号)的SNP HC21S00027的DNA序列(SEQ ID NO:27&28)。第一引物(SEQ ID NO:17)和第二引物(SEQ ID NO:19)分别在HC21S00027的序列的上面和下面指明。将第一引物生物素化并且其包含EcoRI的限制酶识别位点。第二引物包含BceA I的限制酶识别位点并且具有与DNA序列退火的13个碱基。由R(A/G)和r(T/C;(与R互补)指示SNP。

图4C:说明染色体1的SNP TSC0095512的DNA序列(SEQ ID NO:29&30)。第一引物(SEQ ID NO:11)和第二引物(SEQ ID NO:20)分别在TSC0095512的序列的上面和下面指明。第一引物被生物素化并且包含EcoRI的限制酶识别位点。第二引物包含BsmF I的限制酶识别位点并且具有与DNA序列退火的13个碱基。由S(G/C)和s(C/G;与S互补)指示SNP。

图4D:说明染色体1的SNP TSC0095512的DNA序列(SEQ ID NO:29&30)。第一引物(SEQ ID NO:11)和第二引物(SEQ ID NO:12)分别在TSC0095512的序列的上面和下面指明。第一引物被生物素化并且包含EcoRI的限制酶识别位点。第二引物包含BceA I的限制酶识别位点并且具有与DNA序列退火的13个碱基。由S(G/C)和s(C/G;与S互补)指示SNP。

图5A-5D:说明用图4A-4D中描述的引物扩增之后SNP HC21S00027(图5A(SEQ ID NO:31&32)和图5B(SEQ ID NO:31&33))和SNPTSC0095512(图5C(SEQ ID NO:34&35)和图5D(SEQ ID NO:34&36))的核苷酸序列的图示。用粗体表示引物序列中的限制位点。

图6A-6D:说明用合适的IIS型限制酶消化之后包含SNP的每一扩增的DNA片段的核苷酸序列的图示。图6A(SEQ ID NO:31&32)和图6B(SEQ ID NO:31&33)显示了分别用IIS型限制酶BsmF I和BceA I消化后含有SNP HC21S00027的DNA序列的片段。图6C(SEQ ID NO:34&35)和图6D(SEQ ID NO:34&36)显示了分别用IIS型限制酶BsmFI和BceA I消化后含有SNP TSC0095512的DNA序列的片段。

图7A-7D:显示使用消化后具有SNP位点的5′突出端为模板″补平″3′凹端时荧光标记的核苷酸的掺入。图7A(SEQ ID NO:31,37&41)和7B(SEQ ID NO:31,37&39)显示带有掺入的标记ddNTP(*R-dd=荧光双脱氧核苷酸)的消化的SNP HC21 S00027基因座。图7C(SEQ ID NO:34&38)和7D(SEQ ID NO:34)显示带有掺入的标记ddNTP(*S-dd=荧光双脱氧核苷酸)的消化的SNP TSC0095512基因座。使用ddNTP保证3′凹端延伸一个核苷酸,该核苷酸与5′突出端中存在的感兴趣的核苷酸或SNP位点互补。

图7E:显示将dNTP和ddNTP掺入到包含SNP位点的5′突出端的示意图。用BsmF I消化包含SNP HC21S00007的DNA片段,产生四个碱基的5′突出端。使用dNTPs和ddNTPs的混合物使得3′凹端延伸一个核苷酸(首先掺入ddNTP)(SEQ ID NO:31,37&41);两个核苷酸(在掺入一个dNTP后掺入ddNTP)(SEQ ID NO:31,39&41);三个核苷酸(掺入两个dNTPs,接着掺入ddNTP)(SEQ ID NO:31,40&41);或者四个核苷酸(掺入三个dNTPs,接着掺入ddNTP)(SEQ ID NO:31&41)。通过大小能分开所有的这四种产物,之后检测掺入的核苷酸(*R-dd=荧光双脱氧核苷酸)。检测第一个核苷酸(其相应于SNP或基因座位点)和接下来的三个核苷酸可以提供附加水平的质量保证。R(A/G)和r(T/C)(与R互补)指示SNP。

图8A-8D:″填补的″SNP从固相载体基质(即链霉抗生物素蛋白包被的孔)释放。图8A(SEQ ID NO:31,37&41)和图8B(SEQ ID NO:31,37&39)显示了SNP HC21S00027,而图8C(SEQ ID NO:34&38)和图8D(SEQ ID NO:34)显示了SNP TSC0095512。″填补的″SNP游离在溶液中,并且能被检测。

图9A:用BceAI消化的包含SNP HC21S00027的DNA片段的序列分析。给出四个″补平″反应;每个反应包含一种荧光标记的核苷酸(ddGTP,ddATP,ddTTP或ddCTP)和未标记的ddNTPs。图中指出了用BceA I消化产生的5′突出端和在这个SNP位点的预期核苷酸。

图9B:SNP TSC0095512的序列分析。用包含BceA I的识别位点的第二引物及在另一个反应中使用包含BsmF I的识别位点的第二引物扩增SNP TSC0095512。对于每一个PCR产物给出4个补平反应;每个反应包含一种荧光标记的核苷酸(ddGTP,ddATP,ddTTP或ddCTP)和未标记的ddNTPs。图中指出了用BceA I和用BsmF I消化产生的5′突出端和预期的核苷酸。

图9C:用包含BsmF I的识别位点的第二引物扩增之后对SNPTSC0264580的序列分析。给出四个“补平”反应;每一个反应包含一种荧光标记的核苷酸(其是ddGTP,ddATP,ddTTP,或ddCTP)和未标记的ddNTPs。图中指出了两个不同的5′突出端:一个代表在有义链上相距11个核苷酸处而在反义链上相距15个核苷酸处切割的DNA分子,另一个代表在有义链上相距10个核苷酸处而在反义链上相距14个核苷酸处切割的DNA分子。还指明了预期的核苷酸。

图9D:用包含BsmF I的识别位点的第二引物扩增的SNP HC21S00027的序列分析。使用标记的ddNTPs和未标记的dNTPs的混合物补平用BsmF I消化产生的5′突出端。给出两个不同的5′突出端:一个代表在有义链上相距11个核苷酸处而在反义链上相距15个核苷酸处切割的DNA分子,另一个代表在有义链上相距10个核苷酸处而在反义链上相距14个核苷酸处切割的DNA分子。图中指明了SNP上游的核苷酸、SNP位点处的核苷酸(样品含有来自36个个体的DNA模板;预期样品中同时存在两种核苷酸)和SNP下游的三个核苷酸。

图10:多个SNP的序列分析。用包含BsmF I的识别位点的第二引物在分开的PCR反应中扩增SNP HC21S00131和HC21 S00027(它们位于染色体21上)及SNP TSC0087315、SNP TSC0214366、SNPTSC0413944和SNP TSC0095512(它们位于染色体1上)。设计引物使得各个扩增的感兴趣的基因座大小不同。扩增之后将反应合并为一个样品,并且对该样品进行本发明方法的所有接下来的步骤(如图lF-lI所述)。图中指明了各个SNP及在各个SNP处发现的核苷酸。

图11:使用一种荧光标记的核苷酸对SNP TSC0837969,TSC0034767,TSC1130902,TSC0597888,TSC0195492,TSC0607185的两个等位基因的序列确定。在未标记的dATP,dCTP,dTTP的存在下使用标记的ddGTP填补用BsmF I消化产生的突出端。在填补的这条链上可变位点前面的核苷酸不是鸟嘌呤,在填补的这条链上可变位点后面的核苷酸也不是鸟嘌呤。在填补的这条链上可变位点后面两个碱基的核苷酸是鸟嘌呤。用标记的ddGTP填补可变位点处包含鸟嘌呤的等位基因。用未标记的dATP,dCTP,或dTTP填补不含鸟嘌呤的等位基因,这样聚合酶将继续掺入核苷酸直到在与突出端互补的位置3填入标记的ddGTP。

发明详述

本发明提供一种快速测定DNA序列,特别是在一个感兴趣的基因座或多个感兴趣的基因座处的DNA序列的新方法。该方法能有效地,准确地和经济地测定任何模板DNA或者核酸样品中任何数目的DNA靶物(一个至几百个或几千个或更多的感兴趣的基因座)的序列。该方法特别可以用于单一染色体或多个染色体上1个至几万个或更多个基因,基因区域,基因片段,单核苷酸多态性和突变的快速测序。

本发明涉及一种测定感兴趣的基因座的序列的方法,该方法包括:(a)使用第一和第二引物扩增模板DNA上感兴趣的基因座,其中第二引物包含限制酶的识别位点,使得用此限制酶消化可以产生包含感兴趣的基因座的5′突出端;(b)用识别由第二引物上的识别位点的限制酶消化扩增的DNA;(c)使用包含感兴趣的基因座的5′突出端作为模板将核苷酸掺入到(b)的消化的DNA中;和(d)通过测定(c)的DNA的序列确定感兴趣的基因座的序列。

本发明还涉及一种测定感兴趣的基因座的序列的方法,所述方法包括:(a)使用第一和第二引物扩增模板DNA上感兴趣的基因座,其中第一和/或第二引物包含限制酶的识别位点的一部分,其中模板DNA扩增后产生限制酶的全识别位点,使得用该限制酶消化可以产生包含感兴趣的基因座的5′突出端;(b)用识别由第二引物和模板DNA产生的全识别位点的限制酶消化扩增的DNA;(c)使用包含感兴趣的基因座的5′突出端作为模板将核苷酸掺入到(b)的消化的DNA中;和通过测定(c)的DNA的序列确定感兴趣的基因座的序列。

DNA模板

所谓″感兴趣的基因座″意思是较大核酸区域中的选定核酸区域。感兴趣的基因座可包括但不限于1-100,1-50,1-20,或1-10个核苷酸,优选1-6,1-5,1-4,1-3,1-2,或1个核苷酸。

如这里使用的,″等位基因″是占据染色体相同位置的基因或DNA非编码区的几种替代形式中的一种。术语等位基因可以用来描述来自任何生物体的DNA,包括但不限于细菌,病毒,真菌,原生动物,霉,酵母,植物,人,非人动物,和古细菌。

这里涉及个体时所使用的“突变等位基因”指与疾病状态有关的变体等位基因。例如,细菌一般具有一个大的DNA链。就细菌DNA来说,等位基因指与相同物种的不同细菌细胞中相同基因的形式相比,在一个细胞中发现的基因形式。

等位基因可以具有相同的序列,或者可以有单核苷酸不同或者一个以上核苷酸不同。对于各染色体有两个拷贝的生物体,如果两个染色体具有相同的等位基因,则该情况称作纯合的。如果两个染色体上的等位基因是不同的,  则该情况称作杂合的。例如,如果感兴趣的基因座是染色体1上的SNP X,并且母源染色体在SNP X处包含腺嘌呤(A等位基因)并且父源染色体在SNP X处包含鸟嘌呤(G等位基因),则该个体在SNP X是杂合的。

如这里使用的,“序列/测序”意指多核苷酸中一个核苷酸或者一个以上连续的核苷酸的身份或者对其身份的确定(这取决于该术语是用作名词还是动词)。在单核苷酸,例如“SNP”的情况下,″序列″作为名词和″身份″在这里可以互换使用,“测序”作为动词和“鉴定”在这里可以互换使用。

术语″模板″指可以在本发明中用于扩增的任何核酸分子。天然不是双链的RNA或DNA能被制成双链DNA,以便用作模板DNA。任何双链DNA或者包含多个不同的双链DNA分子的制品均能被用作模板DNA来扩增模板DNA中包含的(一个或多个)感兴趣的基因座。

用于获得模板DNA的核酸来源,可以利用本领域的成熟方案来自任何合适的来源,包括但不限于来自任何生物体,例如人或非人,例如细菌、病毒、酵母、真菌、植物、原生动物、动物,含有核酸的组织、体液(例如,血液,血清,血浆,唾液,尿液,泪液,精液,阴道分泌物,淋巴液,脑脊髓液或粘膜分泌物)及粪便样品,个体细胞或者这些来源的含有核酸的提取物,和亚细胞结构,例如线粒体或叶绿体。也可以从其上沉积有核酸的法医学、食品、考古学或无机样品获得或提取核酸。在优选的实施方案中,从有待甄别是否存在一个或多个如下遗传序列的人或动物获得核酸,其中所述序列能用于个体诊断或者可以使个体易患医学症状或疾病。

要分析的核酸可以是任何核酸,例如,基因组,质粒,粘粒,酵母人工染色体,人工或人造DNA,包括单一DNA序列,还可以是从RNA样品逆转录的DNA,例如cDNA。如果RNA序列能制成用作模板DNA的双链DNA形式,则可以根据本发明测定该RNA的序列。

当用来讨论与模板退火并且能用来引发此模板的拷贝合成的寡核苷酸时,术语″引物″和″寡核苷酸引物″可互换。

″扩增的″DNA是例如通过聚合酶链式反应已被″拷贝″一次或多次的DNA。当可获得大量DNA用于试验以致在待测样品中已经存在足够多拷贝数目的感兴趣的基因座时,则不需要将感兴趣的基因座的DNA“扩增”至甚至更大数目的复制拷贝。相反地,使用一套合适的引物(例如包含允许限制酶识别位点形成双链的发夹结构的引物)简单地″拷贝″模板DNA一次就可以满足需要。

″拷贝的DNA″中的″拷贝″指已经被拷贝过一次的DNA,或者已经扩增成一个以上拷贝的DNA。

在一个实施方案中,在含有核酸源的原样品中直接扩增核酸。核酸不必须是提取的,纯化的或分离的;其只需要以能扩增的形式提供即可。在扩增之前,不要求核酸与引物的杂交步骤。例如,可以应用本领域公知的标准方案在细胞或样品裂解物中进行扩增。存在于固相载体上的、固定的生物制品中的或者含有非-DNA物质的组合物中的DNA,如果能够无需首先从固相载体或固定的制品或组合物的非-DNA物质中提取出来就能被扩增,则可以直接使用而无需进一步纯化,条件是该DNA能根据这里所述的方式与合适的引物退火,并能被拷贝,特别是扩增,并且拷贝或扩增的产物能被回收并且使用。

在优选的实施方案中,在扩增之前,使用本领域公知的方法,从原样品的非核酸材料中提取,纯化或分离出核酸。

在另一个实施方案中,从含有核酸来源的原样品提取,纯化或分离核酸,并且在扩增之前,使用各种本领域公知的方法,包括但不限于酶学消化,人工剪切和超声,将核酸片段化。例如,可以用具有感兴趣的基因座中不存在的识别位点,特别是8碱基或6碱基对识别位点的一种或几种限制酶消化DNA。典型地,可以将DNA片段化成任何期望的长度,包括50、100、250、500、1,000、5,000、10,000、50,000和100,000碱基对长。在另一个实施方案中,将DNA片段化为大约1000至2000碱基对的平均长度。然而,将DNA片段化不是必须的。

在扩增之前,可以从不含有感兴趣的基因座的DNA片段中纯化出含有感兴趣的基因座的DNA片段。使用在扩增中(参见下文″引物设计″部分)应用的引物作为“鱼钩”,根据引物退火到感兴趣的基因座的能力,找到含有感兴趣的基因座的片段,从而达到纯化目的。在优选的实施方案中,使用标签-修饰的引物,例如生物素化的引物。关于其它的标签,也可以参见“扩增的DNA的纯化”一节。

通过纯化包含感兴趣的基因座的DNA片段,能提高扩增反应的特异性。这使得模板DNA的非特异性区域的扩增最小化。DNA片段的纯化还能允许以提高的特异性进行多个感兴趣的基因座的多重PCR(聚合酶链式反应)或扩增。

在一个实施方案中,为了期望的目的获取核酸样品,所述目的为例如使用本发明的方法测定预定基因座或感兴趣的基因座的序列。例如,为了鉴定一种或几种个体可能易患或需要治疗的症状或疾病,或为了鉴定某些单核苷酸多态性存在与否,而获取核酸。在另一个实施方案中,获取样品,以便对其筛选以确定是否存在一或多个DNA序列标记物,其中,这些标记物的存在可以将此DNA鉴定为来自特定细菌或真菌微生物或者个体的DNA。

可以只根据序列选择要测序的感兴趣的基因座。对于人,已经描述过超过1.42百万个单核苷酸多态性(SNP)(Nature 409:928-933(2001);TheSNP Consortium LTD)。平均来说,每1.9kb人类基因组就有一个SNP。然而,当根据本发明选择要测序的感兴趣的基因座时,不需要考虑感兴趣的基因座之间的距离。如果要分析基因组DNA上一个以上的感兴趣的基因座,所选择的感兴趣的基因座可以在相同的或不同的染色体上。

在优选的实施方案中,对于每个感兴趣的基因座,扩增的序列的长度优选是不同的,以便可以通过大小分开这些感兴趣的基因座。

事实上,本发明的一个优点在于不需要使用用于拷贝整个基因序列的引物。相反地,拷贝的感兴趣的基因座优选只是全基因的一小部分。对全基因进行测序并没有好处,因为这会提高成本并且延迟结果的产生。只对基因中期望的碱基或者感兴趣的基因座测序将使方法的总效率最大化,因为这使得可以以最快的时间以最低的成本测定最大数目的感兴趣的基因座。

因为大量的序列能一起分析,本发明的方法特别适于用来大规模筛选大量的个体样品。

使用本发明的方法,能分析和处理(特别是在同时)任何数目的感兴趣的基因座。能同时对样品分析,确定一个感兴趣的基因座或多个感兴趣的基因座的序列。例如,可以对疾病相关基因中最常出现的10或20个突变位点测序,从而检测大多数的疾病携带者。

或者,当期望实施全球遗传筛选时,可以同时分析2、3、4、5、6、7、8、9、10-20、20-25、25-30、30-35、35-40、40-45、45-50、50-100、100-250、250-500、50-1,000、1,000-2,000、2,000-3,000、3,000-5,000、5,000-10,000、10,000-50,000个或50,000个以上的感兴趣的基因座。当本发明的方法被用来提供可以鉴定某微生物或个体的遗传指纹或者用于SNP基因型分型时,这样的全球遗传筛选可能是期望的。

这多个感兴趣的基因座可以是来自不同生物体的靶物。例如,需要治疗的植物,动物或人受试者可以有被一种或几种病原体感染的症状。通过测定感兴趣的基因座的序列,可以对从这样的植物,动物或人受试者取得的核酸样品进行分析,以同时确定多种可能的或可疑的病原体的存在,其中所述感兴趣的基因座如果存在,则可以作为那种病原体的诊断标志。在受试者中找到这样的诊断性序列不仅能快速确认疾病的原因,而且还能排除没有检测的其他病原体。这样的筛选能用来评价病原体在生物体或环境中扩散的程度。以相似方法,对于怀疑患有因遗传异常所致的疾病的个体,可以在来自该个体的核酸上分析已知能导致此疾病的部分或所有的突变、或者一个或多个更常见的突变。

本发明的方法可以用来监测生物体遗传性质的完整性。例如,在酿酒工艺中,可以在不同的时间从不同的批次取酵母样品,通过这里提供的方法对它们的基因组序列进行快速分析,以便与期望的菌株比较它们的存在或身份。

要拷贝的感兴趣的基因座可以在编码序列之内或编码序列之外。优选地,要拷贝的一个或多个感兴趣的基因座在一个基因内。在优选的实施方案中,拷贝的模板DNA是基因组编码序列(或者内含子或者外显子)中的一个或多个感兴趣的基因座。在高度优选的实施方案中,拷贝外显子DNA序列。感兴趣的基因座可以是已知其突变会引起疾病或疾病状态易感性的位点。感兴趣的基因座可以是单核苷酸多态性位点。或者,要拷贝的感兴趣的基因座在编码序列之外,例如,在转录调节区中,特别是启动子,增强子,或阻抑物序列中。

引物设计

公开的序列,包括共有序列,可以被用来设计或选择在模板DNA的扩增中使用的引物。可以通过检查感兴趣的基因座的序列或者其紧邻序列,选择位于感兴趣的基因座两侧用于构建引物的序列。最近公开的人类基因组序列提供了有用的共有序列信息来源,从这些信息可以设计期望的感兴趣的人类基因基因座两侧的引物。

所谓位于感兴趣的基因座的″侧翼″意指这样的引物序列,其中一个引物的3′区的至少一部分与模板DNA的反义链互补并且在感兴趣的基因座的上游(正向引物),而另一个引物的3′区的至少一部分与模板DNA的有义链互补并且在感兴趣的基因座的下游(反向引物)。″引物对″意指一对正向和反向引物。引物对的两个引物的退火将允许引物延伸,且这种延伸导致模板DNA在感兴趣的基因座的区域中被扩增。

通过各种各样的方法能制备引物,包括但不限于利用本领域公知的方法克隆合适的序列和直接化学合成(Narang等,Methods Enzymol.68:90(1979);Brown等,Methods Enzymol.68:109(1979))。也能从商业来源,例如Operon Technologies,Amersham Pharmacia Biotech,Sigma和LifeTechnologies,获得引物。引物对的引物可以具有相同的长度。或者,引物对的一个引物可以比引物对的另一个引物长。两引物可以具有相同的解链温度。引物的长度可以在5′端或3′端延伸或缩短,以产生具有期望的解链温度的引物。在优选的实施方案中,引物对中两引物的3′退火长度不同。此外,可以设计各引物对的退火位置使得引物对的序列和长度得到期望的解链温度。用于确定小于25个碱基对的引物的解链温度的最简单的公式是Wallace规则(Td=2(A+T)+4(G+C))。也能利用计算机程序设计引物,包括但不限于Array Designer软件(Arrayit Inc.),用于遗传分析的寡核苷酸探针序列设计软件(Olympus Optical Co.),Hitachi Software Engineering提供的NetPrimer和DNAsis。可以利用软件程序计算各个引物的TM(解链温度或退火温度),例如Net Primer(http://premierbiosoft.com/netprimer/netprlaunch/netprlaunch.html免费网络程序;自2002年2月13日的网址)。

在另一个实施方案中,可以在任意扩增循环(包括但不限于1,2,3,4,5次循环,6-10次循环,10-15次循环,15-20次循环,20-25次循环,25-30次循环,30-35次循环,或35-40次循环)之后再次计算并提高引物的退火温度。起始的扩增循环之后,引物的5′半部分掺入到来自各个感兴趣的基因座的产物中,因而可以根据各个引物的5′部分加上3′部分的序列再次计算TM。

例如,在图1B中,大约在与模板DNA退火的13个碱基的第二引物的3′区(″c″区)的解链温度进行第一轮扩增。第一轮之后,退火温度可以升至TM2,  其大约是退火到模板DNA上的第一引物的3′区(″b″区)的解链温度。第二引物不能结合原模板DNA,因为它只与原DNA模板中的13个碱基退火,而TM2是大约20个碱基的第一引物的3′退火区的解链温度(图1C)。然而,第一引物能与第一轮反应中拷贝的DNA结合。在第三轮中,退火温度升至TM3,其大约是第二引物的全序列(“c”和“d”)的解链温度。从第二轮PCR产生的DNA模板包含c′和d′区,因此,第二引物能在TM3下退火并且延伸(图1D)。其余循环在TM3下进行。第一引物的全序列(a+b′)能退火到来自第三轮PCR的模板上并且延伸(图1E)。提高退火温度将减小非特异性结合,并且提高反应的特异性,这对于从包含大约3×109碱基对的人类基因组DNA中扩增感兴趣的基因座是特别有用的。

如这里使用的,关于退火温度的术语″大约″旨在包括所述温度的上下10摄氏度之内的温度。

在一个实施方案中,针对各感兴趣的基因座,使用一个引物对。但是,也可以针对各感兴趣的基因座,使用多个引物对。

在一个实施方案中,设计引物,使得引物对的一个或两个引物在5’区中包含用于一个或多个限制内切酶(限制酶)的序列。

如这里使用的,关于限制酶消化DNA的位置,″有义″链是按限制酶切割的方向从5′至3′阅读的链。例如,BsmF I识别下面的序列:

5′GGGAC(N)10↓3′(SEQ ID NO:1)

3′CCCTG(N)14↑5’或者

5′↓(N)14GTCCC3′(SEQ ID NO:2)

3′↑(N)10CAGGG5′

因此,有义链是包含″GGGAC″序列的链,因为其按限制酶切割的方向从5′至3′阅读。

如这里使用的,关于限制酶消化DNA的位置,″反义″链是按限制酶切割的方向从3′至5′阅读的链。因此反义链是3′至5′阅读的包含“ccctg”序列的链。

在本发明中,可以设计引物对中的一个引物,使得其包含用于限制酶的限制酶识别位点,以便当用限制酶消化时产生3’凹端和包含感兴趣的基因座的5′突出端(这里称作″第二引物″)。例如,引物对的第二引物可以包含在识别位点不切割DNA而是在识别位点外″n″个核苷酸处切割DNA的限制酶的识别位点。″N″是限制酶识别位点与切割位点的距离。如果识别序列针对限制酶BceA I,该酶将在有义链上在距识别位点10个(10)核苷酸处进行切割,并且在反义链上在距识别位点12个(12)核苷酸处进行切割。

设计引物的3′区,优选引物的3′半部分,使之与感兴趣的基因座的侧翼序列退火(图1A)。第二引物可以在距感兴趣的基因座任何距离的位置退火,条件是用识别该引物上的限制酶识别位点的限制酶消化后可以产生包含感兴趣的基因座的5′突出端。该5′突出端可以是任意大小,包括但不限于1,2,3,4,5,6,7,8,和多于8个碱基。

在优选的实施方案中,第二引物的3′末端可以距感兴趣的基因座1,2,3,4,5,6,7,8,9,10,11,12,13,14,或多于14个碱基退火或者在感兴趣的基因座处退火。

在优选的实施方案中,设计第二引物,使之比引物对的另一个引物(该另一个引物在这里称作″第一引物″)更接近于感兴趣的基因座发生退火。第二引物可以是正向或反向引物,而第一引物可以相应是反向或正向引物。可以基于提供更好的测序结果的目的,设计并确定第一和第二引物应该是正向还是反向引物。

例如,更接近感兴趣的基因座退火的引物可以包含限制酶BsmF I的识别位点,该酶在有义链上距识别位点10个(10)核苷酸处进行切割,并且在反义链上距识别位点14个(14)核苷酸处进行切割。在这种情况下,可以设计引物,使得限制酶识别位点距离感兴趣的基因座13个碱基,12个碱基,10个碱基,或11个碱基。如果识别位点与感兴趣的基因座相距13个碱基,则用BsmF I消化将产生5′突出端(RXXX),其中感兴趣的基因座(R)是突出端中的第一个核苷酸(3′至5′阅读),而X是任何核苷酸。如果识别位点与感兴趣的基因座相距12个碱基,则用BsmF I消化将产生5′突出端(XRXX),其中感兴趣的基因座(R)是突出端中的第二个核苷酸(3′至5′阅读)。如果识别位点与感兴趣的基因座相距11个碱基,则用BsmFI消化将产生5′突出端(XXRX),其中感兴趣的基因座(R)是突出端中的第三个核苷酸(3′至5′阅读)。对于限制酶识别位点和感兴趣的基因座之间的距离进行的设计,应使得用限制酶消化后产生包含感兴趣的基因座的5′突出端。识别位点和感兴趣的基因座之间的有效距离将随着限制酶的选择而不同。

在另一个实施方案中,可以设计相对于第一引物更接近感兴趣的基因座退火的第二引物,使得产生包含感兴趣的基因座的5′突出端的限制酶总在切割位点见到相同的序列,而与感兴趣的基因座处的核苷酸无关。例如,如果设计更接近感兴趣的基因座退火的引物,使得针对限制酶BsmF I的识别位点(5′GGGAC 3′)与感兴趣的基因座相距13个碱基,则限制酶将在感兴趣的基因座上游一个碱基处切割反义链。感兴趣的基因座处的核苷酸紧邻切割位点,并且可随DNA分子的不同而不同。如果期望与切割位点相邻的核苷酸是相同的,则可以设计引物,使得BsmF I的限制酶识别位点离开感兴趣的基因座12个碱基。用BsmF I消化将产生5′突出端,其中感兴趣的基因座在突出端的第二个位置(3′至5′阅读)并且不再与切割位点邻接。这样,设计引物使得限制酶识别位点距感兴趣的基因座12个(12)碱基,将允许与切割位点邻接的核苷酸总是相同的,而不论感兴趣的基因座处的核苷酸如何。此外,使得限制酶识别位点与感兴趣的基因座相距11个(11)或10个(10)碱基的引物设计,也将允许与切割位点邻接的核苷酸不随感兴趣的基因座处的核苷酸发生变化。

可设计第一引物(或者正向或者反向)的3′端以便在距离感兴趣的基因座选定的距离退火。优选地,例如,这个距离是距感兴趣的基因座10-25,25-50,50-75,75-100,100-150,150-200,200-250,250-300,300-350,350-400,400-450,450-500,500-550,550-600,600-650,650-700,700-750,750-800,800-850,850-900,900-950,950-1000个碱基或大于1000个碱基。选择第一引物的退火位点使得各上游引物相继地越来越远离其相应的下游引物。

例如,如果在感兴趣的基因座1,第一和第二引物的3′端相距Z个碱基,则在感兴趣的基因座2,上游和下游引物的3′端相距Z+K个碱基,其中K=1,2,3,4,5-10,10-20,20-30,30-40,40-50,50-60,60-70,70-80,80-90,90-100,100-200,200-300,300-400,400-500,500-600,600-700,700-800,800-900,900-1000,或大于1000个碱基(图2)。使上游引物越来越远离其各自的下游引物的目的是为了使所有感兴趣的基因座的PCR产物大小不同并且能够分离,例如,在测序凝胶上分离。这将允许在后面的步骤中通过合并PCR产物实施多重反应。

在一个实施方案中,第一引物的5′区可以具有任何类型的限制酶的识别位点。在优选的实施方案中,第一引物具有至少一个与第二引物中的限制酶识别位点不同的限制酶识别位点。在另一个优选的实施方案中,第一引物比第二引物更远离感兴趣的基因座退火。

在优选的实施方案中,第二引物包含IIS型限制酶(包括但不限于BceA I和BsmF I)的限制酶识别序列,其中BceA I和BsmF I分别产生两个碱基的5′突出端和四个碱基的5′突出端。IIS型的限制酶是优选的,因为它们识别不对称碱基序列(不象正统的II型酶识别回文序列)。IIS型限制酶在识别位点之外,典型地识别位点之外多达20个碱基对的特定位置处断裂DNA。这些性质使得IIS型限制酶及其识别位点在本发明的方法中特别有用。优选地,本发明中使用的IIS型限制酶留下5′突出端和3′凹端。

很多种IIS型限制酶是已知的,并且这样的酶已从细菌,噬菌体,古细菌和真核藻类病毒分离并且是商业上可得到的(Promega,Madison WI;New England Biolabs,Beverly,MA;Szybalski W.等,Gene 100:13-16,1991)。本发明的方法中可以使用的IIS型限制酶的例子包括但不限于例如表I中列出的那些。

表I:

产生5′突出端和3′凹端的IIS型限制酶

                   酶来源  识别/切割位点    供应商A1w I-鲁氏不动杆菌(Acinetobacter lwoffii)    GGATC(4/5)    NE BiolabsA1w26 I-鲁氏不动杆菌    GTCTC(1/5)    PromegaBbs I-侧孢芽孢杆菌(Bacillus laterosporus)    GAAGAC(2/6)    NE BiolabsBbv I-短芽孢杆菌(Bacillus brevis)    GCAGC(8/12)    NE BiolabsBceA I-蜡状芽孢杆菌(Bacillus cereus)1315    ACGGC(12/14)    NE BiolabsBmr I-巨大芽孢杆菌(Bacillus megaterium)    ACTGGG(5/4)    NE BiolabsBsa I-嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)6-55    GGTCTC(1/5)    NE BiolabsBst71 I-嗜热脂肪芽孢杆菌71    GCAGC(8/12)    PromegaBsmA I-嗜热脂肪芽孢杆菌A664    GTCTC(1/5)    NE BiolabsBsmB I-嗜热脂肪芽孢杆菌B61    CGTCTC(1/5)    NE BiolabsBsmF I-嗜热脂肪芽孢杆菌F    GGGAC(10/14)    NE BiolabsBspM I-芽孢杆菌属种M    ACCTGC(4/8)    NE BiolabsEar I-产气肠杆菌(Enterobacter aerogenes)    CTCTTC(1/4)    NE BiolabsFau I-水生黄杆菌(Flavobacterium aquatile)    CCCGC(4/6)    NE BiolabsFok I-海床黄杆菌(Flavobacterium okeonokoites)    GGATG(9/13)    NE BiolabsHga I-鸡嗜血杆菌(Haemophilus gallinarum)    GACGC(5/10)    NE BiolabsPle I-勒氏假单孢菌(Pseudomonas lemoignei)    GAGTC(4/5)    NE BiolabsSap I-糖多孢菌属(saccharopolyspora)    GCTCTTC(1/4)    NE BiolabsSfaN I-粪链球菌(streptococcus faecalis)ND547    GCATC(5/9)    NE BiolabsSth132 I-嗜热链球菌(Streptococcus thermophilus)ST132    CCCG(4/8)    没有商业供应商    (Gene    195:201-206(1997)

在一个实施方案中,引物对的各个引物的5′区具有唯一针对一种限制酶的限制酶识别位点序列。

在另一个实施方案中,引物对的各个引物的5′区具有可以被一种以上限制酶(特别是一种以上IIS型限制酶)识别的限制位点序列。例如,一些共有序列可以被一种以上的酶识别。例如,BsgI,Eco57I和BpmI都识别共有5′(G/C)TgnAG3′,并且在反义链上16个碱基对外和在有义链上14个碱基对外进行切割。提供这样的共有序列的引物将导致产物具有可以被限制酶BsgI,Eco57I和BpmI之任一识别的位点。

距限制位点一定距离切割DNA并且产生3′凹端和5′突出端的其他限制酶包括III型限制酶。例如,限制酶EcoP15I识别序列5′CAGCAG 3′,并且在有义链上于下游25个碱基处和反义链上27个碱基处实施断裂。本领域技术人员还明白新的限制酶正在继续被发现并且它们可以容易地被采纳用在本发明中。

在另一个实施方案中,第二引物可以包含限制酶识别序列的一部分,其中模板DNA扩增后产生针对该限制酶的全识别位点,使得用限制酶消化可以产生包含感兴趣的基因座的5′突出端。例如,BsmF I的识别位点是5′GGGACN10↓3′。退火到模板DNA上的第二引物的3′区可以以核苷酸″GGG″结尾,其不必与模板DNA互补。如果3′退火区是大约10-20个碱基,即使最后三个碱基不退火,引物也可以延伸并产生BsmF I位点。第二引物:5′GGAAATTCCATGATGCGTGGG→(SEQ ID NO:3)模板DNA:3′CCTTTAAGGTACTACGCAN1’N2’N3’TG 5′

     5′GGAAATTCCATGATGCGTN1N2N3AC 3′(SEQ ID NO:4)

可设计第二引物以便与模板DNA退火,其中模板DNA的下两个碱基是胸苷和鸟嘌呤,这样腺苷和胞嘧啶可以掺入到引物中,形成BsmF I的识别位点,5′GGGACN10↓3′。可设计第二引物的退火方式,使得用BsmF I消化可以产生包含感兴趣的基因座的5′突出端。

在另一个实施方案中,第二引物可包含限制酶的识别位点的整体或全部或识别位点的一部分,当模板DNA扩增后其产生全识别位点,使得用在识别位点进行切割的限制酶消化后产生包含感兴趣的基因座的5′突出端。例如,限制酶BsaJ I结合下面的识别位点:5′C↓CN1N2GG 3′。可设计第二引物使得引物的3′区末端是″CC″。″N1’″代表感兴趣的SNP,并且该SNP下游的模板序列是″N2’CC″。第二引物:5′GGAAATTCCATGATGCGTACC→(SEQ ID NO:5)模板DNA:3′CCTTTAAGGTACTACGCATGGN1’N2’CC 5′

     5′GGAAATTCCATGATGCGTACCN1N2GG 3′(SEQ ID NO:6)

用BsaJ I消化之后,会产生下面序列的5′突出端:

5′C           3′

3′GGN1’N2’C 5′

如果在感兴趣的基因座处没有报道核苷酸鸟嘌呤,则3′凹端可填入未标记的胞嘧啶,它与突出端的第一个核苷酸互补。去除过量的胞嘧啶之后,可使用标记的ddNTPs补平下面的核苷酸N1’,其代表感兴趣的基因座。或者,如果据报道鸟嘌呤是感兴趣的基因座处的可能的核苷酸,则可以使用标记的核苷酸检测感兴趣的基因座的3’核苷酸。使用未标记的dCTP“填补”之后用胞嘧啶之外的标记的核苷酸实施补平反应。掺入胞嘧啶直到它达到不互补的碱基。如果感兴趣的基因座包含鸟嘌呤,则可以用dCTP补平,这将允许掺入标记的核苷酸。然而,如果感兴趣的基因座不包含鸟嘌呤,则不会掺入标记的核苷酸。可使用的其他限制酶包括但不限于BssK I(5′↓CCNGG 3′),Dde I(5′C↓TNAG 3′),EcoN I(5′CCTNN↓NNNAGG 3′)(SEQ ID NO:7),Fnu4H I(5′GC↓NGC 3′),Hinf I(5′G↓ANTC 3′),PflF I(5′GACN ↓NNGTC 3′),Sau96 I(5′G↓GNCC 3′),ScrF I(5′CC↓NGG 3′),和Tthl 11 I(5′GACN↓NNGTC 3′)。

退火到模板DNA上的第二引物的3′区不必须与模板DNA 100%互补。例如, 第二引物的3′末端的最后1,2,或3个核苷酸可以与模板DNA错配。与模板DNA退火的引物区域将引导引物,并且让引物延伸。即使,例如,最后两个核苷酸与模板DNA不互补,引物也将延伸并且产生限制酶识别位点。

第二引物:5′GGAAATTCCATGATGCGTACC→(SEQ ID NO:5)

模板DNA:3′CCTTTAAGGTACTACGCATNa’Nb’N1’N2’CC 5′

         5′GGAAATTCCATGATGCGTANaNbN1N2GG 3′(SEQID NO:8)

用BsaJ I消化之后,会产生下面序列的5′突出端:

5′C           3′

3′GGN1’N2’C 5′

如果在感兴趣的基因座处没有报道核苷酸胞嘧啶,则用未标记的胞嘧啶补平5′突出端。可以将过量的胞嘧啶洗出,之后用标记的ddNTPs进行补平反应。掺入的第一个核苷酸(N1)相应于感兴趣的基因座。

或者,可以使用第一和第二引物产生限制酶全识别序列。可以产生用于任何限制酶的识别位点,只要识别位点包含至少一个可变核苷酸即可。识别包含至少一个可变核苷酸的位点的限制酶包括但不限于BssK I(5′↓CCNGG 3′),Dde I(5′C↓TNAG 3′),Econ I(5′CCTNN↓NNNAGG 3′)(SEQ ID NO:7),Fnu4H I(5′GC↓NGC 3′),Hinf I(5′G↓ANTC 3′),PflF I(5′GACN↓NNGTC 3′),Sau96 I(5′G↓GNCC 3′),ScrF I(5′CC↓NGG 3′),和Tthl11 I(5′GACN↓NNGTC 3′)。在该实施方案中,第一或第二引物可以更接近感兴趣的基因座退火,或者第一或第二引物可以在距感兴趣的基因座相同的距离处退火。可以设计第一和第二引物使其在3’区包含与模板DNA的错配;这些错配产生限制酶识别位点。3’端能耐受的错配数目取决于引物的长度,包括但不限于1,2或2个以上的错配。例如,如果N1’代表感兴趣的基因座,则可以设计第一引物与模板DNA互补(下面以″a″区表示)。第一引物的3′区以″CC″结尾,其不与模板DNA互补。设计第二引物与模板DNA互补(下面以″b″区表示)。第二引物的3′区以″CC″结尾,其不与模板DNA互补。

第一引物     5′      a      CC→

模板DNA      3′      a′    AAN1′N2′TT    b′  5′

             5′      a      TTN1  N2  AA    b    3′

                                       ←CC    b′  5′第二引物

第一轮扩增之后产生下面的产物

                   5′      a       CCN1  N2  AA  b    3′

                   5′      b′     CCN2′N1′AA  a′  3′。

在第二轮扩增中,引物能退火到从第一轮PCR产生的模板上:

                   5′      a       CCN1  N2  AA  b    3′

                                              ←CC  b′  5′

                                              ←CC  a    5′

                   5′      b′     CCN2′N1’AA  a′  3′

第二轮PCR后,产生下面的产物:

                   5′      a       CCN1  N2  GG  b    3′

                   3′      a′     GGN1′N2′CC  b′  5′

产生针对BsaJ I的限制酶识别位点,用BsaJ I消化之后,产生包含感兴趣的基因座的5′突出端。根据下面的详细描述能检测感兴趣的基因座。或者第一和第二引物的3’区可以包含1,2,3或3个以上的错配,接着是与模板DNA互补的核苷酸。例如,可以使用第一和第二引物产生限制酶EcoN I的识别位点,EcoNI结合下面的DNA序列:5′CCTNN↓NNNAGG3′。每个引物的最后的核苷酸可以是“CCTN1或CCTN1N2”。核苷酸“CCT”可以与模板DNA互补也可以不互补;然而,N1和N2是与模板DNA互补的核苷酸。这使得引物可以在这些潜在的错配之后与模板DNA退火,其中这些错配被用来产生限制酶识别位点。

在另一个实施方案中,引物对在各个引物的5′区具有提供两个或多个限制酶识别的两个或多个限制位点的序列。

在最优选的实施方案中,引物对在5′区,特别是5′末端,具有不同的限制酶识别位点,这样就要求不同的限制酶来切除所有的不期望的序列。例如,对于感兴趣的基因座″A″,第一引物可以包含限制酶″X″识别的序列,“X”可以是任何类型的限制酶,而更接近感兴趣的基因座退火的针对感兴趣的基因座″A″的第二引物可以包含用于限制酶″Y″的序列,“Y”是在″n″个核苷酸外实施切割并且留下5′突出端和3′凹端的IIS型限制酶。5′突出端包含感兴趣的基因座。扩增的DNA与链霉抗生物素蛋白包被的孔结合之后,可以用″Y″酶消化,洗涤,然后填入标记的核苷酸并且洗涤,然后用限制酶″X″消化,从固相基质释放包含感兴趣的基因座的DNA片段。通过测定在感兴趣的基因座(如SNP位点)处“填入的”标记的核苷酸能分析出感兴趣的基因座。

在另一个实施方案中,对于根据本发明扩增不同的感兴趣的基因座,第二引物在5′区包含用于相同的限制酶的识别序列,同样,所有的第一引物也包含相同的限制酶识别位点,但识别第一引物的酶与识别第二引物的酶为不同的酶。更接近感兴趣的基因座退火的引物(或者正向或者反向引物)包含针对例如IIs型限制酶的识别位点。

在另一个实施方案中,用于根据本发明扩增多个感兴趣的基因座的第二引物在5′区包含针对不同限制酶的限制酶识别序列。

在另一个实施方案中,用于根据本发明扩增多个感兴趣的基因座的第一引物在5′区包含针对不同限制酶的限制酶识别序列。

多种限制酶识别序列的使用使得可以影响合并的感兴趣的基因座从固相载体释放的顺序。例如,如果扩增50个感兴趣的基因座,第一引物可以在5′最末端具有有助于纯化的标签和限制酶识别位点,第二引物可以包含用于IIS限制酶的识别位点。例如,几个第一引物可以带有EcoR I的限制酶识别位点,其他第一引物可以具有Pst I的识别位点,再其他第一引物可以具有BamH I的识别位点。扩增之后,感兴趣的基因座借助于第一引物上的标签与固相载体结合。通过一次使用一种限制酶进行限制消化,能顺次释放扩增的感兴趣的基因座。如果第一次消化用EcoR I进行,则可以释放并收集用包含EcoR I的识别位点的第一引物扩增的感兴趣的基因座,同时其它的感兴趣的基因座保持与固相载体结合。通过在一个时间用一种限制酶消化可从固相载体选择性释放扩增的感兴趣的基因座。第一引物中不同限制酶识别位点的使用使得在一个反应试管中可以扩增更大数目的感兴趣的基因座。

在优选的实施方案中,可以用有助于片段操作、加工、鉴定和/或纯化的官能团来修饰各个引物的限制酶消化位点5′的任何区域。这样的官能团或标签的例子包括但不限于生物素,生物素衍生物,糖,半抗原,染料,放射性分子,抗体和抗体的片段,肽,和免疫原性分子。

在另一个实施方案中,模板DNA可以复制一次,在一个复制循环后不再进行扩增。当有大量DNA可用于分析以致样品中已经存在大数量的感兴趣的基因座的拷贝而不需要进一步拷贝时,这是有用的。在这个实施方案中,优选将引物设计成在5′区包含″发夹″结构,这样序列可以对折并且以互补方式与自身的内部序列退火。当模板DNA只复制一次时,如果没有用于″发夹″结构的序列,则包括识别位点的DNA序列将是单链的。然而,在发夹结构存在下,此区域可以有效成为双链,由此提供限制酶活性的双链底物。

只要反应条件相容,分析DNA的一个或多个感兴趣的基因座的所有引物对可以混合在一起在本发明的方法中使用。在优选的实施方案中,在一个反应容器中将所有的引物对和模板DNA混合。这样的反应容器可以是例如反应试管,或者微量滴定板的孔。

或者,为了避免核苷酸竞争和使引物二聚体形成最小化以及使引物退火温度方面的困难最小化,可以在分开的反应试管或孔中扩增各个感兴趣的基因座或感兴趣的基因座小组,如果需要,随后可以合并产物。例如,将分开的反应物合并在一个反应容器中,然后用限制酶消化,产生包含感兴趣的基因座或SNP位点的5′突出端和3′凹端。优选地,每个引物对的引物以等摩尔量提供。此外,特别优选地,各个不同的引物对以相对于使用的其他引物对以等摩尔量提供。

在另一个实施方案中,使用引物对的组合,其中各引物对可以有效扩增其相应的感兴趣的基因座(参见例如图2)。可以在用于本发明的方法之前确定这样的组合。可以使用多孔板和PCR来选择可以彼此有效地一起工作的引物对。例如,梯度PCR仪,例如Eppendorf Mastercycler梯度PCR仪可以用来选择对应于各个引物对的最佳退火温度。具有相似性质的引物对可在一个反应试管中一起使用。

在另一个实施方案中,可以使用多样品容器,包括但不限于96-孔或更多孔板,从多个模板DNA样品,以对于感兴趣的基因座而言最佳的PCR条件,应用相同的引物对扩增单一感兴趣的基因座。或者对于各个感兴趣的基因座的扩增,可以使用分开的多样品容器进行,随后针对各模板DNA样品合并产物。例如,可以在微量滴定板1中自96个不同DNA样品扩增基因A,在微量滴定板2中自96个不同DNA样品扩增基因B,等等,然后合并扩增产物。

扩增多个感兴趣的基因座的结果是制品包含具有各个感兴趣的基因座的序列的代表性PCR产物。例如,如果使用来自仅一个个体的DNA作为模板DNA,并且从模板DNA扩增几百个与疾病相关的感兴趣的基因座,则扩增的DNA将是来自各个感兴趣的基因座的小的PCR产物的混合物。那时可以进一步分析这样的制品来确定每个感兴趣的基因座处的序列或者仅一些感兴趣的基因座处的序列。另外,可以以保存DNA的方式贮存制品并且在随后的时间进行分析。扩增的DNA中包含的信息可以通过任何合适的方法来揭示,包括但不限于荧光检测,测序,凝胶电泳,和质谱(参见下面的″掺入的核苷酸的检测″章节)。

感兴趣的基因座的扩增

应用本领域公知的任何合适的方法均可以扩增模板DNA,这些方法包括但不限于PCR(聚合酶链式反应),3SR(自动维持序列扩增反应),LCR(连接酶链式反应),RACE-PCR(cDNA末端的快速扩增),PLCR(聚合酶链式反应和连接酶链式反应的组合),Q-β噬菌体扩增(Shah等,J.Medical Micro.33:1435-41(1995)),SDA(链置换扩增),SOE-PCR(剪接重叠延伸PCR(splice overlap extension PCR)),等。这些方法能用来设计本申请中详细描述的由可释放的引物介导的循环扩增反应的变通方案。在最优选的实施方式中,利用PCR扩增模板DNA(PCR:A PracticalApproach,M.J.McPherson,等,IRL Press(1991);PCR Protocols:AGuide to Methods and Applications,Innis,等,Academic Press(1990);和PCR Technology:Principals and Applications of DNA Amplification,H.A.Erlich,Stockton Press(1989))。在很多美国专利中也描述了PCR,包括美国专利Nos.4,683,195;4,683,202;4,800,159;4,965,188;4,889,818;5,075,216;5,079,352;5,104,792、5,023,171;5,091,310;和5,066,584。

典型PCR反应的成分包括但不限于模板DNA,引物,反应缓冲液(取决于聚合酶的选择),dNTPs(dATP,dTTP,dGTP,和dCTP)和DNA聚合酶。可根据如上所述设计并制备合适的PCR引物(参见上文″引物设计″章节)。简要地说,将反应加热至95℃反应2分钟,以分开模板DNA双链,将反应冷却至合适的温度(通过计算所设计的引物的退火温度来确定)让引物退火到模板DNA上,之后加热至72℃反应2分钟以实现延伸。

在优选的实施方案中,在头三轮扩增的每一个循环中提高退火温度以减少非特异性扩增。也可以参见下面的实施例1。第一轮PCR的TM1大约是与模板DNA退火的第二引物的3′区的解链温度。可以在第2-10个循环中,优选在第二个循环中,将退火温度升至TM2,其大约是退火到模板DNA上的第一引物的3′区的解链温度。如果在第二轮提高退火温度,则在下一次提高退火温度之前退火温度保持大约相同。最后,可以在退火温度升至TM2的循环之后的任何循环中,优选在第三轮中,将退火温度升至TM3,其大约是整个第二引物的解链温度。第三轮之后,剩余循环的退火温度可以是大约TM3或者可以进一步提高。在这个实例中,在第二和第三轮中提高退火温度。然而,退火温度可以从第一轮的低退火温度升至第二轮的高退火温度而不再进一步提高温度,或者退火温度可以以任何数目的递增步骤逐渐地从低退火温度变成高退火温度。例如,退火温度可以在第2,3,4,5,6个循环等中变化。

退火之后,在每个循环中温度升至″延伸″温度以让引物″延伸″,然后在延伸之后每个循环中的温度升至变性温度。对于小于500个碱基对的PCR产物,可以去除每个循环中的延伸步骤,而只有变性和退火步骤。典型的PCR反应由25-45个如上所述的变性、退火和延伸循环构成。然而,如上文指出的,对于实施本发明,甚至一个扩增循环也可以满足要求(一次拷贝)。

可以使用能催化引物延伸的任何DNA聚合酶,包括但不限于大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶I的Klenow片段,T7 DNA聚合酶,T4 DNA聚合酶,Taq聚合酶,Pfu DNA聚合酶,Vent DNA聚合酶,噬菌体29,和REDTaqTM基因组DNA聚合酶,或者测序酶。优选地,使用热稳定DNA聚合酶。也可以进行″热启动″PCR,其中加入聚合酶前反应加热至95℃反应2分钟或者聚合酶在第一轮第一个加热步骤之前保持失活。可以利用″热启动″PCR使非特异性扩增最小化。可以使用任何数目的PCR循环来扩增DNA,包括但不限于2,5,10,15,20,25,30,35,40,或45个循环。在最优选的实施方案中,实施的PCR循环数目将使得可以产生等摩尔量的各个感兴趣的基因座。

扩增的DNA的纯化

实施本发明不必须进行扩增的DNA的纯化。然而,在一个实施方案中,如果纯化是优选的,则用有利于PCR产物纯化的标签修饰引物(第一或第二引物)的5′末端。在优选的实施方案中,用有利于PCR产物纯化的标签修饰第一引物。修饰作用优选对于所有的引物是相同的,但是如果期望将PCR产物分成不同的组,则可以使用不同的修饰。

标签可以是放射性同位素,荧光报道分子,化学发光报道分子,抗体,抗体片段,半抗原,生物素,生物素衍生物,光生物素,亚氨基生物素,洋地黄毒苷,抗生物素蛋白,酶,吖啶鎓,糖,酶,脱辅酶,均聚寡核苷酸,激素,铁磁性部分,顺磁性部分,抗磁性部分,发磷光部分,发光部分,电化学发光部分,有色部分,具有可检测与电子自旋共振、电容、介电常数或导电性的部分,或者它们的组合。

在优选的实施方案中,引物的5′末端被生物素化(Kandpal等,Nucleic Acids Res.18:1789-1795(1990);Kaneoka等,Biotechniques 10:30-34(1991);Green等,Nucleic Acids Res.18:6163-6164(1990))。生物素提供亲和性标签,其能被用来从基因组DNA或者任何其他不感兴趣的DNA分子中纯化出拷贝的DNA。如图1F所示,使用链霉抗生物素蛋白包被的基质能纯化生物素化分子,包括但不限于从Roche MolecularBiochemicals获得的透明的Streptawell高度-结合板(商品目录号1 645692,见Roche Molecular Biochemicals,2001化学品目录)。

将各个感兴趣的基因座的PCR产物放到链霉抗生物素蛋白包被的板的分开的孔中。或者,可将感兴趣的基因座的PCR产物合并并且放到链霉抗生物素蛋白包被的基质中,这种基质包括但不限于从RocheMolecular Biochemicals获得的透明的Streptawell高度-结合板(商品目录号1 645 692,如在Roche Molecular Biochemicals,2001化学品目录中列出的)。

利用本领域公知的非亲和性方法也能从模板DNA分离扩增的DNA,例如,通过应用标准方案进行聚丙烯酰胺凝胶电泳。

扩增的DNA的消化

可以应用本领域公知的标准方案,用识别第一或第二引物上已经提供的序列的限制酶消化扩增的DNA(图6A-6D)。根据用第一或第二引物产生的限制识别位点,使用不同的酶。有关引物产生的限制识别位点的详细信息参见上文的″引物设计″章节。

IIS型限制酶特别有用,因为它们在识别位点之外大约10-20个碱基对处进行切割。优选地,使用的IIS型限制酶是产生5′突出端和3′凹端的那些,包括但不限于BceA I和BsmF I(参见,例如,表I)。在最优选的实施方案中,接近于感兴趣的基因座退火的第二引物(或者正向或者反向)包含BsmF I或BceA I的限制酶识别位点。IIS型限制酶BsmF I识别核酸序列GGGAC,并且在反义链上于识别位点外14个核苷酸处切割并在有义链上于识别位点外10个核苷酸处切割。用BsmF I消化产生四个(4)碱基的5′突出端。

例如,如果设计第二引物,使得扩增之后限制酶识别位点与感兴趣的基因座相距13个碱基,那么消化之后,感兴趣的基因座是5′突出端中的第一个碱基(3′至5′阅读),并且3′凹端位于感兴趣的基因座上游一个碱基处。可以使用与感兴趣的基因座互补的核苷酸填补3′凹端。可以使用双脱氧核苷酸补平突出端的一个碱基。然而,也可以使用脱氧核苷酸或者双脱氧核苷酸和脱氧核苷酸的混合物补平突出端的1,2,3,或所有4个碱基。

限制酶BsmF I在有义链上于识别位点外10个(10)核苷酸切割DNA并在反义链上于识别位点外14个(14)核苷酸切割DNA。然而,限制酶BsmFI还以序列依赖方式在有义链上于识别位点外11个(11)核苷酸处切割且在反义链上于识别位点外15个(15)核苷酸处切割。因此,消化之后存在两种DNA分子群体:在10/14处切割的DNA分子和在11/15处切割的DNA分子。如果BsmF I的识别位点在扩增的产物中距离感兴趣的基因座13个碱基,则在11/15位置处切割的DNA分子产生在突出端的第二个位置(3′至5′阅读)包含感兴趣的基因座的5′突出端。可以使用标记的核苷酸填补DNA分子的3′凹端。例如,如果使用标记的双脱氧核苷酸,则在11/15处切割的DNA分子的3′凹端将填入一个碱基,其相应于感兴趣的基因座上游的碱基;而在10/14处切割的DNA分子的3′凹端将填入一个碱基,其相应于感兴趣的基因座。通过大小能分离在10/14处切割的DNA分子和在11/15处切割的DNA分子,并且可以检测掺入的核苷酸。这使得既可以检测感兴趣的基因座之前的核苷酸,也可以检测感兴趣的基因座和潜在地感兴趣的基因座之后的三个碱基对。

或者,如果感兴趣的基因座上游的碱基与感兴趣的基因座是不同的核苷酸,则在11/15处切割的分子的3′凹端可以用与此上游碱基互补的脱氧核苷酸填补。将剩余的脱氧核苷酸洗去,感兴趣位点的基因座可以用标记的脱氧核苷酸、未标记的脱氧核苷酸、标记的双脱氧核苷酸或者未标记的双脱氧核苷酸填补。补平反应之后可以通过任何合适的方法检测此核苷酸。这样,用dNTP进行第一个补平反应之后,在10/14和11/15处切割的分子的3′凹端位于感兴趣的基因座上游。现在3′凹端可以填入一个碱基(其相应于感兴趣的基因座),两个碱基,三个碱基或四个碱基。

或者,如果据报道感兴趣的基因座上游的碱基和感兴趣的基因座下游的碱基是相同的,则在11/15处切割的分子的3′凹端可以“填入”未标记的脱氧核苷酸,接着“填入”标记的双脱氧核苷酸。例如,如果感兴趣的基因座上游的核苷酸是胞嘧啶,并且胞嘧啶是感兴趣的基因座处的可能核苷酸,并且腺苷是感兴趣的基因座3’的第一个核苷酸,则可以用未标记的脱氧鸟嘌呤三磷酸(d GTP)进行“补平”反应,接着填入标记的双脱氧胸苷三磷酸。如果感兴趣的基因座包含胞嘧啶,则掺入并且检测到ddTTP。然而,如果感兴趣的基因座不包含胞嘧啶,则不掺入d GTP,这就防止ddTTP的掺入。

限制酶BceA I识别核酸序列ACGGC,并且在有义链上于识别位点外12(12)个核苷酸切割并在反义链上于识别位点外14(14)个核苷酸切割。如果第二引物上的BceA I识别位点与感兴趣的基因座的距离被设计为13(13)个碱基(参见图4A-4D),则用BceA I消化将产生两个碱基的5′突出端(其包含感兴趣的基因座)和位于感兴趣的基因座上游的3′凹端。感兴趣的基因座是5′突出端中的第一个核苷酸(3′至5′阅读)。

使用限制酶BceA I也可以见到另一种切割,但是比使用BsmF I时见到的频率低得多。限制酶BceA I能在有义链上距识别位点13(13)个核苷酸处进行切割并在反义链上距识别位点15(15)个核苷酸处进行切割。因此,存在两种DNA分子群体:在12/14处切割的DNA分子和在13/15处切割的DNA分子。如果限制酶识别位点在扩增的产物中与感兴趣的基因座相距13个碱基,则在13/15位置处切割的DNA分子产生在突出端的第二个位置(3′至5′阅读)包含感兴趣的基因座的5′突出端。可以使用标记的双脱氧核苷酸填补DNA分子的3′凹端。对于在13/15处切割的DNA分子,位于感兴趣的基因座上游的碱基被补平,而在12/14处切割的DNA分子将具有补平的感兴趣的基因座。通过大小能分离在13/15处切割的DNA分子和在12/14处切割的DNA分子。因此,能利用此可变切割来获得另外的序列信息。

或者,如果5′突出端中的两个碱基是不同的,则在13/15处切割的DNA分子的3′凹端可以用与该突出端中第一个碱基互补的脱氧核苷酸填补,之后将多余的脱氧核苷酸洗去。填补之后在12/14处切割的DNA分子和在13/15处切割的DNA分子的3′凹端是感兴趣的基因座的上游。3′凹端可以填入标记的双脱氧核苷酸、未标记的双脱氧核苷酸、标记的脱氧核苷酸,或者未标记的脱氧核苷酸。

如果引物为拷贝的一些感兴趣的基因座提供了不同的限制位点,则可以一起加入所有的必需的限制酶,同时消化拷贝的DNA。或者,可以顺序进行不同的限制消化,例如一次使用一种限制酶,这样只消化对于那种限制酶特异的产物。

标记的核苷酸的掺入

用识别第二引物上的序列的限制酶消化产生3′凹端和包含感兴趣的基因座的5′突出端(图1G)。可以在未标记的或标记的核苷酸或者未标记的和标记的核苷酸的混合物存在下,使用5′突出端作为模板填补3′凹端。可以使用允许进行检测的任何类型的化学基团或部分标记核苷酸,包括但不限于放射性分子,荧光分子,抗体,抗体片段,半抗原,糖,生物素,生物素衍生物,发磷光部分,发光部分,电化学发光部分,有色部分,和具有可检测的电子自旋共振、电容、介电常数或导电性的部分。可以用一种或多种类型的化学基团或部分标记核苷酸。可以用相同的化学基团或部分标记各个核苷酸。或者,可以用不同的化学基团或部分标记各不同的核苷酸。标记的核苷酸可以是dNTPs,ddNTPs,或dNTPs和ddNTPs的混合物。未标记的核苷酸可以是dNTPs,ddNTPs,或dNTPs和ddNTPs的混合物。

可以使用核苷酸的任何组合来掺入核苷酸,包括但不限于未标记的脱氧核苷酸,标记的脱氧核苷酸,未标记的双脱氧核苷酸,标记的双脱氧核苷酸,标记的和未标记的脱氧核苷酸的混合物,标记的和未标记的双脱氧核苷酸的混合物,标记的脱氧核苷酸和标记的双脱氧核苷酸的混合物,标记的脱氧核苷酸和未标记的双脱氧核苷酸的混合物,未标记的脱氧核苷酸和未标记的双脱氧核苷酸的混合物,未标记的脱氧核苷酸和标记的双脱氧核苷酸的混合物,双脱氧核苷酸类似物,脱氧核苷酸类似物,双脱氧核苷酸类似物和脱氧核苷酸类似物的混合物,磷酸化核苷类似物,2-脱氧核苷-5′-三磷酸,和修饰的2′-脱氧核苷三磷酸。

例如,如图1H所示,可以在聚合酶存在下,使用5′突出端作为模板用荧光ddNTP填补3′凹端。可以使用任何合适的方法检测掺入的ddNTP,包括但不限于荧光检测。

可以用不同的荧光基团标记所有四种核苷酸,这样一个反应可以在所有四种标记的核苷酸存在下进行。或者,可以针对每一个感兴趣的基因座进行五个独立的″补平″反应;四个反应的每一个各含有不同的标记的核苷酸(例如ddATP*,ddTTP*,ddUTP*,ddGTP*,或ddCTP*,其中*指示标记的核苷酸)。每个核苷酸可以用不同的化学基团或相同的化学基团标记。标记的核苷酸可以是双脱氧核苷酸或脱氧核苷酸。

在另一个实施方案中,用荧光染料标记核苷酸,包括但不限于荧光素,芘,7-甲氧基香豆素,Cascade Blue.TM.,Alexa Flur 350,Alexa Flur430,Alexa Flur 488,Alexa Flur 532,Alexa Flur 546,Alexa Flur 568,Alexa Flur 594,Alexa Flur 633,Alexa Flur 647,Alexa Flur 660,AlexaFlur 680,AMCA-X,二烷基氨基香豆素,Pacific Blue,Marina Blue,BODIPY 493/503,BODIPY Fl-X,DTAF,Oregon Green 500,Dansyl-X,6-FAM,Oregon Green 488,Oregon Green 514,罗丹明绿-X,Rhodol Green,钙黄绿素,曙红,溴化乙锭,NBD,TET,2′,4′,5′,7′-四溴砜荧光素,BODIPY-R6G,BODIPY-F1 BR2,BODIPY530/550,HEX,BODIPY 558/568,BODIPY-TMR-X.,PyMPO,BODIPY 564/570,TAMRA,BODIPY 576/589,Cy3,罗丹明红-x,BODIPY 581/591,carboxyXrhodamine,Texas Red-X,BODIPY-TR-X.,Cy5,SpectrumAqua,SpectrumGreen #1,SpectrumGreen #2,SpectrumOrange,SpectrumRed,或者萘基荧光素(naphthofluorescein)。

在另一个实施方案中,使用荧光标记的dNTPs进行″补平″反应,其中核苷酸用不同的荧光基团标记。可以通过任何合适的方法检测掺入的核苷酸,包括但不限于荧光共振能量转移(FRET)。

在另一个实施方案中,使用标记的ddNTPs和未标记的dNTPs的混合物填补包含SNP或感兴趣的基因座的DNA序列的3′凹端。优选地,5′突出端由一个以上碱基构成,包括但不限于2,3,4,5,6或多于6个碱基。例如,如果5′突出端由序列″XGAA″构成,其中X是感兴趣的基因座(例如SNP),则用标记的ddNTPs和未标记的dNTPs的混合物进行填补将产生几种不同的DNA片段。如果在位置″X″掺入标记的ddNTP,则反应终止并且掺入单一的标记的碱基。然而,如果掺入未标记的dNTP,则聚合酶将继续掺入其他碱基,直到掺入标记的ddNTP为止。如果掺入的头两个核苷酸是dNTPs,第三个是ddNTP,则3′凹端延伸三个碱基。通过大小能从延伸了1,2,或4个碱基的其他DNA片段分离这种DNA片段。标记的ddNTPs和未标记的dNTPs的混合物将允许突出端的所有碱基都被补平,并且提供有关感兴趣的基因座,例如SNP的另外的序列信息(参见图7E和9D)。

掺入标记的核苷酸之后,用识别第一引物提供的序列的限制酶消化扩增的DNA。例如,在图1I中,用与″a″区结合的限制酶消化扩增的DNA,从链霉抗生物素蛋白基质释放包含掺入的核苷酸的DNA片段。

或者,各个感兴趣的基因座的引物对的一个引物可以与固相载体基质附着,包括但不限于微量滴定板的孔。例如,可以在链霉抗生物素蛋白包被的微量滴定板上使用引物对进行扩增反应,其中一个引物被生物素化。首先,生物素化的引物与链霉抗生物素蛋白包被的微量滴定板结合。然后,板被用作感兴趣的基因座的PCR扩增反应容器。扩增反应完成之后,通过洗涤将过量的引物,盐,和模板DNA去除。扩增的DNA保持与微量滴定板附着。扩增的DNA用识别第二引物上的序列的限制酶消化,产生包含感兴趣的基因座的5′突出端。通过洗涤去除消化的片段。消化之后,在5′突出端中暴露出SNP位点或感兴趣的基因座。在聚合酶存在下使用标记的核苷酸(包括但不限于荧光ddNTP)填补3′凹端。通过用识别第一引物的5′区中的序列的限制酶消化,能将标记的DNA释放到微量滴定板中的上清液中。

感兴趣的基因座的分析

能通过各种各样的方法分析感兴趣的基因座,包括但不限于荧光检测,DNA测序凝胶,在自动DNA测序仪上的毛细管电泳,microchannelelectrophoresis,和其他测序方法,质谱,飞行时间质谱,四极质谱,扇形磁场质谱,扇形电场质谱,红外光谱测定,紫外光谱测定,palentiostatic电流分析法或者DNA杂交技术,包括Southern印迹,狭线印迹,点印迹,和DNA微阵列(其中DNA片段用作″探针″和″靶物″),ELISA,荧光测定,和荧光共振能量转移(FRET)。

利用凝胶电泳接着通过掺入的核苷酸的荧光检测能分析感兴趣的基因座。分析或阅读感兴趣的基因座的另一个方法是直接在96-孔链霉抗生物素蛋白包被的板上使用荧光板读数器或者荧光计。板可以放置到荧光板读数器或扫描仪,例如Pharmacia 9200 Typhoon上,以读取各个感兴趣的基因座。

或者,可以将感兴趣的基因座的PCR产物合并,并且在″填补″之后(图10),利用任何合适的方法通过大小分离产物,然后利用各种各样的技术进行分析,所述技术包括但不限于荧光检测,DNA测序凝胶,在自动DNA测序仪上的毛细管电泳,microchannel electrophoresis,其他测序方法,DNA杂交技术,包括Southern印迹,狭线印迹,点印迹,和DNA微阵列质谱,飞行时间质谱,四极质谱,扇形磁场质谱,扇形电场质谱,红外光谱测定,紫外光谱测定,palentiostatic电流分析法。例如,聚丙烯酰胺电泳能用来通过大小分离DNA,并且可以对凝胶进行扫描以确定各条泳带中的荧光颜色(使用例如,ABI 377 DNA测序仪或Pharmacia Typhoon 9200)。

在另一个实施方案中,使用一种核苷酸来测定基因的多个等位基因的序列。能利用终止延伸反应的核苷酸测定基因的多个等位基因的序列。在一个等位基因处,终止核苷酸与所述等位基因的5′突出端中的感兴趣的基因座互补。掺入此核苷酸并且终止反应。在不同的等位基因处,终止核苷酸与感兴趣的基因座不互补,这使得在不同的等位基因的感兴趣的基因座处掺入非终止核苷酸。然而,终止核苷酸与所述不同的等位基因的5′突出端中感兴趣的基因座下游的核苷酸互补。通过分析终止核苷酸的掺入模式能测定等位基因的序列。终止核苷酸可以是标记的或未标记的。

在另一个实施方案中,终止核苷酸是终止或阻碍延伸反应的核苷酸,包括但不限于双脱氧核苷酸,双脱氧核苷酸衍生物,双脱氧核苷酸类似物,双脱氧核苷酸同系物,带有硫化学基团的双脱氧核苷酸,脱氧核苷酸,脱氧核苷酸衍生物,脱氧核苷酸类似物,脱氧核苷酸同系物,带有硫化学基团的脱氧核苷酸,阿拉伯糖苷三磷酸,阿拉伯糖苷三磷酸类似物,阿拉伯糖苷三磷酸同系物,或阿拉伯糖苷衍生物。

在另一个实施方案中,使用以一个产生信号的标签部分(包括但不限于荧光染料)标记的终止核苷酸,测定感兴趣的基因座的等位基因的序列。使用标记有一个产生信号的标签部分的单核苷酸,可以消除当使用不同的荧光部分时带来的任何困难。另外,使用标记有一个产生信号的标签部分的单核苷酸测定感兴趣的基因座的等位基因的序列,还可以减少反应次数,并且消除移液误差。

例如,如果第二引物包含BsmFI的限制酶识别位点,则消化产生4个碱基的5′突出端。设计第二引物,使得感兴趣的基因座位于突出端的第一个位置。下面描述代表性突出端,其中R代表感兴趣的基因座:

5′CAC

3′GTG      R  T  G  G

突出端位置  1  2  3  4

可以使用带有一个信号产生标签部分的单核苷酸来测定可变位点是还是纯合的还是杂合的。例如,如果可变位点是腺嘌呤(A)或鸟嘌呤(G),则可以使用腺嘌呤或鸟嘌呤来测定感兴趣的基因座的等位基因的序列,前提是在突出端中在位置2,3,或4有腺嘌呤或鸟嘌呤。

例如,如果突出端的位置2是胸苷,其与腺嘌呤互补,则可以使用标记的ddATP、未标记的dCTP、dGTP和dTTP来测定感兴趣的基因座的等位基因的序列。ddATP可以用任何产生信号的部分标记,包括但不限于荧光染料。如果模板DNA是腺嘌呤纯合的,则在等位基因处与突出端互补的位置1将掺入标记的ddATP*,在与突出端互补的位置2,3和4将见不到核苷酸掺入。

等位基因1    5′CCC    A*

             3′GGG    T  T   G   G

突出端位置             1  2   3   4

等位基因2    5′CCC    A*

             3′GGG    T  T   G   G

突出端位置             1  2   3   4

可以见到相应于在与突出端互补的位置1处掺入标记的ddATP的一个信号,它指示个体在该位置处是腺嘌呤纯合的。这种标记方法消除了使用具有不同量子系数的不同染料可能产生的任何困难。

纯合的鸟嘌呤:

如果模板DNA对于鸟嘌呤是纯合的,则在与突出端互补的位置1不掺入ddATP,但是ddATP在第一个可行的位置掺入,在此情况下为与突出端互补的位置2。例如,如果突出端的第二个位置相应于胸苷,则:

等位基因1       5′CCC    G  A*

                3′GGG    C  T  G  G

突出端位置                1  2  3  4

等位基因2       5′CCC    G  A*

                3′GGG    C  T  G  G

突出端位置                1  2  3  4

可以见到相应于在与突出端互补的位置2处掺入的ddATP的一个信号,它指示个体是鸟嘌呤纯合的。在与突出端互补的位置2处补平的分子和在与突出端互补的位置1处补平的分子具有不同的分子量。

杂合条件:

等位基因1       5′CCC    A*

                3′GGG    T  T  G  G

突出端位置                1  2  3  4

等位基因2      5′CCC    G   A*

               3′GGG    C   T   G  G

突出端位置               1   2   3  4

可见到两个信号;第一个信号相应于在与突出端互补的位置1处填入的ddATP,而第二个信号相应于在与突出端互补的位置2处填入的ddATP。根据分子量能分离两个信号;等位基因1和等位基因2分开一个碱基对,这使得容易检测并定量信号。利用根据分子量进行区分的任何方法能将在位置1补平的分子与在位置2补平的分子区别开,所述方法包括但不限于凝胶电泳,毛细管凝胶电泳,DNA  序,和质谱。不必将核苷酸用化学部分标记;相应于不同等位基因的DNA分子可根据分子量进行分离。

如果突出端的位置2不与腺嘌呤互补,则位置3或4可以与腺嘌呤互补。例如,突出端的位置3可能与核苷酸腺嘌呤互补,在这种情况下,可以使用标记的ddATP测定两个等位基因的序列。

对于腺嘌呤是纯合的:

等位基因1    5′CCC    A*

             3′GGG    T  G  T  G

突出端位置             1  2  3 4

等位基因2    5′CCC    A*

             3′GGG    T  G  T  G

突出端位置             1  2  3  4

对于鸟嘌呤是纯合的:

等位基因1    5′CCC    G  C  A*

             3′GGG    C  G  T  G

突出端位置             1  2  3  4

等位基因2    5′CCC    G  C  A*

             3′GGG    C  G  T  G

突出端位置             1  2  3  4

杂合的:

等位基因1    5′CCC    A*

             3′GGG    T  G  T  G

突出端位置             1  2  3  4

等位基因2    5′CCC    G  C  A*

             3′GGG    C  G  T  G

突出端位置             1  2  3  4

可见到两个信号;第一个信号相应于在与突出端互补的位置1处填入的ddATP,而第二个信号相应于在与突出端互补的位置3处填入的ddATP。根据分子量能分离两个信号;等位基因1和等位基因2分开两个碱基,这可以利用根据分子量进行区分的任何方法来检测。

或者,如果位置2和3不与腺嘌呤互补(即突出端的位置2和3相应于鸟嘌呤,胞嘧啶,或腺嘌呤),但是位置4与腺嘌呤互补,则也能使用标记的ddATP测定两个等位基因的序列。

对于腺嘌呤是纯合的:

等位基因1    5′CCC    A*

             3′GGG    T  G  G  T

突出端位置             1  2  3  4

等位基因2    5′CCC    A*

             3′GGG    T  G  G  T

突出端位置             1  2  3  4

可见到一个信号,其相应于在位置1处填入与突出端互补的ddATP的分子的分子量,这表明个体在可变位点处为腺嘌呤纯合的。

对于鸟嘌呤是纯合的:

等位基因1    5′CCC    G  C  C  A*

             3′GGG    C  G  G  T

突出端位置             1  2  3  4

等位基因2    5′CCC    G  C  C  A*

             3′GGG    C  G  G  T

突出端位置             1  2  3  4

可见到一个信号,其相应于在与突出端互补的位置4处补平的分子的分子量,这表明个体是鸟嘌呤纯合的。

杂合的:

等位基因1    5′CCC  A*

             3′GGG  T  G  G T

突出端位置           1  2  3 4

等位基因2    5′CCC  G  C  C A*

             3′GGG  C  G  G T

突出端位置           1  2  3 4

可见到两个信号;第一个信号相应于在与突出端互补的位置1处填入的ddATP,而第二个信号相应于在与突出端互补的位置4处填入的ddATP。根据分子量能分离两个信号;等位基因1和等位基因2分开三个碱基,这使得可以检测和定量这些信号。根据分子量能区分在位置1补平的分子和在位置4补平的分子。

如上文所讨论的,如果可变位点包含腺嘌呤或鸟嘌呤,则能使用标记的腺嘌呤或标记的鸟嘌呤来测定两个等位基因的序列。如果突出端的位置2,3,或4不与腺嘌呤互补但是其中一个位置与鸟嘌呤互补,则可以使用标记的ddGTP测定模板DNA对于腺嘌呤或鸟嘌呤而言是纯合的还是杂合的。例如,如果突出端的位置3相应于胞嘧啶,那么当模板DNA对于鸟嘌呤是纯合的,对于腺嘌呤是纯合的,或者是杂合的时,则预期有下面的信号:

对于鸟嘌呤是纯合的:

等位基因1    5′CCC    G*

             3′GGG    C  T  C  T

突出端位置             1  2  3  4

等位基因2    5′CCC    G*

             3′GGG    C  T  C  T

突出端位置             1  2  3  4

可见到一个信号,其相应于在与突出端互补的位置1处用ddGTP补平的分子的分子量,这表明个体为鸟嘌呤纯合的。

对于腺嘌呤是纯合的:

等位基因1    5′CCC  A  A  G*

             3′GGG  T  T  C  T

突出端位置           1  2  3  4

等位基因2    5′CCC  A  A  G*

             3′GGG  T  T  C  T

突出端位置           1  2  3  4

可见到一个信号,其相应于在与突出端互补的位置3处补平的分子的分子量,这表明个体在可变位点处为腺嘌呤纯合的。

杂合的:

等位基因1    5′CCC  G*

             3′GGG  C T  C  T

突出端位置           1 2  3  4

等位基因2    5′CCC  A A  G*

             3′GGG  T T  C  T

突出端位置           1 2  3  4

可见到两个信号;第一个信号相应于在与突出端互补的位置1处填入的ddGTP,而第二个信号相应于在与突出端互补的位置3处填入的ddGTP。根据分子量能分离这两个信号;等位基因1和等位基因2通过两个碱基分开,这使得容易检测和定量这些信号。

如上文所讨论的,一些IIS型限制酶还表现出可变切割。例如,BsmFI在距识别位点10/14和11/15处切割。然而,这些切割模式并不相互排斥;如果在特定序列见到11/15切割模式,则也可以见到10/14切割。如果限制酶BsmF I在距识别位点10/14处切割,则5′突出端将是X1 X2X3X4。如果BsmF I在距识别位点11/15处切割,则5′突出端将是X0X1X2X3。如果突出端的位置X0与标记的核苷酸互补,则标记的核苷酸将在位置X0处被掺入并且提供附加水平的质量保证。它提供额外序列信息。

例如,如果可变位点是腺嘌呤或鸟嘌呤,并且突出端的位置3与腺嘌呤互补,则能使用标记的ddATP来测定可变位点处的基因型。如果11/15突出端的位置0包含与腺嘌呤互补的核苷酸,则将填入ddATP,并且可见到另外的信号。

杂合的:

10/14等位基因1    5′CCA     A*

                  3′GGT     T  G  T  G

突出端位置                   1  2  3  4

10/14等位基因2    5′CCA     G  C  A*

                  3′GGT     C  G  T  G

突出端位置                   1  2  3  4

11/15等位基因1    5′CC      A*

                  3′GG      T  T  G  T

突出端位置                   0  1  2  3

11/15等位基因2    5′CC      A*

                  3′GG      T  C  G  T

突出端位置                   0  1  2  3

可见到三个信号;一个相应于在与突出端互补的位置0处掺入的ddATP,一个相应于在与突出端互补的位置1处掺入的ddATP,和一个相应于在与突出端互补的位置3处掺入的ddATP。在与突出端互补的位置0,1和3处补平的分子具有不同分子量,可以利用根据分子量进行区分的任何技术来分离,这些技术包括但不限于凝胶电泳,和质谱。

对于定量一个等位基因与另一个等位基因的比率或者测定野生型DNA序列存在时突变体DNA序列的相对量,必须使用精确而高灵敏的检测方法。IIS型限制酶表现出的可变切割可能提高测定一个等位基因与另一个等位基因之比的难度,因为限制酶可能对两个等位基因并不等同表现出可变切割(11/15)模式。例如,等位基因1在80%的时候在10/14处切割,在20%的时候在11/15处切割。然而,  因为两个等位基因可能序列不同,等位基因2可能在90%的时候在10/14处切割,在20%的时候在11/15处切割。

对于定量目的,当突出端的位置0处的核苷酸与标记的核苷酸不互补时能排除可变切割问题。例如,如果可变位点相应于腺嘌呤或鸟嘌呤,并且突出端的位置3与腺嘌呤互补(即,胸苷位于突出端的位置3),则能使用标记的ddATP来测定可变位点的基因型。如果由11/15切割性质产生的突出端的位置0不与腺嘌呤互补(即,突出端的位置0相应于胞嘧啶,或腺嘌呤),则从距识别位点11/15处切割的片段见不到另外的信号。与突出端互补的位置0可以填入未标记的核苷酸,消除由限制酶的可变切割模式导致的任何可见复杂性。这种方法为定量可变位点(包括但不限于突变,或单核苷酸多态性)比率提供了高度准确的方法。

例如,如果SNP X是腺嘌呤或鸟嘌呤,这种标记方法使得可以定量相应于腺嘌呤的等位基因和相应于鸟嘌呤的等位基因,而不用测定就可变切割模式来说限制酶是否在等位基因之间表现出任何差异。

杂合的:

10/14等位基因1    5′CCG    A*

                  3′GGC    T  G  T  G

突出端位置                  1  2  3  4

10/14等位基因2    5′CCG    G  C  A*

                  3′GGC    C  G  T  G

突出端位置                  1  2  3  4

下面表示由BsmF I的另一种切割性质产生的突出端:

11/15等位基因1    5′CC

                  3′GG     C  T  G  T

突出端位置                  0  1  2  3

11/15等位基因2    5′CC

                  3′GG     C  C  G  T

突出端位置                  0  1  2  3

用标记的ddATP和未标记的dGTP,dCTP,dTTP填补之后,将产生下面的分子:

11/15等位基因1      5′CC   G  A*

                    3′GG   C  T  G  T

突出端位置                  0  1  2  3

11/15等位基因2      5′CC   G  G  C  A*

                    3′GG   C  C  G  T

突出端位置                  0  1  2  3

可见到两个信号;一个相应于在与突出端互补的位置1处用ddATP补平的分子,一个相应于在与突出端互补的位置3处用ddATP补平的分子。11/15突出端的位置0由未标记的核苷酸补平,这消除了在定量测定等位基因1可变位点处的核苷酸和等位基因2可变位点处的核苷酸的比率时的困难。

可以使用的核苷酸包括腺嘌呤、腺嘌呤衍生物、腺嘌呤同系物、鸟嘌呤、鸟嘌呤衍生物、鸟嘌呤同系物、胞嘧啶、胞嘧啶衍生物、胞嘧啶同系物、胸苷、胸苷衍生物、或胸苷同系物、或者腺嘌呤、腺嘌呤衍生物、腺嘌呤同系物、鸟嘌呤、鸟嘌呤衍生物、鸟嘌呤同系物、胞嘧啶、胞嘧啶衍生物、胞嘧啶同系物、胸苷、胸苷衍生物或胸苷同系物的任何组合。

可以用任何化学基团或部分标记核苷酸,包括但不限于放射性同位素,荧光报道分子,抗体,抗体片段,半抗原,糖,生物素,生物素衍生物,发磷光部分,发光部分,电化学发光部分,有色部分,具有可检测的电子自旋共振、电容、介电常数或导电性的部分。可以用一种或一种以上类型的化学基团或部分标记核苷酸。

在另一个实施方案中,能使用标记的和未标记的核苷酸。可以使用脱氧核苷酸和双脱氧核苷酸的任意组合,包括但不限于标记的双脱氧核苷酸和标记的脱氧核苷酸;标记的双脱氧核苷酸和未标记的脱氧核苷酸;未标记的双脱氧核苷酸和未标记的脱氧核苷酸;和未标记的双脱氧核苷酸和标记的脱氧核苷酸。

在另一个实施方案中,在PCR反应中使用用化学部分标记的核苷酸。然后使用未标记的核苷酸补平用限制酶消化之后产生的5′突出端。可以使用未标记的终止核苷酸在未标记的核苷酸的存在下测定感兴趣的基因座的等位基因的序列。

例如,如果在PCR反应中使用标记的dTTP,用BsmF I消化之后产生下面的5′突出端:

10/14等位基因1     5′CT*G  A

                   3′GAC    T  G  T  G

突出端位点                   1  2  3  4

10/14等位基因2     5′CT*G G  G  C  A

                   3′GAC   C  G  T  G

突出端位点                  1  2  3  4

可以使用未标记的ddATP,未标记的dCTP,未标记的dGTP,和未标记的dTTP补平5′突出端。产生两个信号;一个信号相应于在与突出端互补的位置1处用未标记的ddATP填补的DNA分子,第二个信号相应于在与突出端互补的位置3处用未标记的ddATP填补的DNA分子。根据分子量能分离这些DNA分子,并且通过在PCR反应中掺入的dTTP的荧光可以检测这些DNA分子。

可以通过各种各样的方法分析感兴趣位点的标记的DNA基因座,包括但不限于荧光检测,DNA测序凝胶,在自动DNA测序仪上的毛细管电泳,microchannel electrophoresis和其他测序方法,质谱,飞行时间质谱,四极质谱,扇形磁场质谱,扇形电场质谱,红外光谱测定,紫外光谱测定,palentiostatic电流分析法或者DNA杂交技术,包括Southern印迹,狭线印迹、点印迹和DNA微阵列(其中DNA片段用作″探针″和″靶物″),ELISA,荧光测定,和荧光共振能量转移(FRET)。

这种标记方法极为灵敏并且允许检测各种比例的感兴趣的基因座的等位基因,所述比例包括但不限于1∶1,1∶2,1∶3,1∶4,1∶5,1∶6-1∶10,1∶11-1∶20,1∶21-1∶30,1∶31-1∶40,1∶41-1∶50,1∶51-1∶60,1∶61-1∶70,1∶71-1∶80,1∶81-1∶90,1∶91-1∶100,1∶101-1∶200,1∶250,1∶251-1∶300,1∶301-1∶400,1∶401-1∶500,1∶501-1∶600,1∶601-1∶700,1∶701-1∶800,1∶801-1∶900,1∶901-1∶1000,1∶1001-1∶2000,1∶2001-1∶3000,1∶3001-1∶4000,1∶4001-1∶5000,1∶5001-1∶6000,1∶6001-1∶7000,1∶7001-1∶8000,1∶8001-1∶9000,1∶9001-1∶10,000,1∶10,001-1∶20,000,1∶20,001∶1∶30,000,1∶30,001-1∶40,000,1∶40,001-1∶50,000,和大于1∶50,000。

例如,这种标记方法允许使用以一个产生信号的部分标记的单核苷酸来测定SNP基因座的等位基因序列,或者检测正常等位基因群体中的突变等位基因,或者从来自抗生素敏感细菌的等位基因中检测出编码来自细菌细胞的抗生素抗性的等位基因,或者从来自药物敏感性病毒的等位基因中检测出来自抗药性病毒的等位基因,或者从来自病原性细菌株的等位基因中检测出来自非病原性细菌株的等位基因。

如上所示,能使用单一核苷酸测定特定的感兴趣的基因座处等位基因的序列。该方法特别可以用来确定对于特定突变而言个体是否是纯合的或杂合的,或者测定特定SNP位点处的等位基因的序列。这种标记方法消除了由各种染料的量子系数引起的任何误差。其还使得可以在单一的反应容器中进行反应,包括但不限于微量滴定板的孔,或者单一eppendorf试管。

这种标记方法特别可以用于相同样品中多个遗传信号的检测。例如,这种方法可以用于检测含有母体DNA和胎儿DNA的妊娠女性血液,血清,或血浆中的胎儿DNA。母体DNA和胎儿DNA可以以例如97∶3的比例存在于此血液,血清,或血浆中;然而,上述方法能用于检测胎儿DNA。这种标记方法能用来检测样品群中两个,三个或四个不同的遗传信号。

这种标记方法特别可用于大的野生型等位基因群体中突变等位基因的检测。此外,这种标记方法允许检测大的野生型细胞群体中的单一突变细胞。例如,这种标记方法能用于检测大的正常细胞群体中的单一癌细胞。典型地,癌细胞DNA序列中有突变。即使有大量背景野生型DNA序列也能鉴定到突变DNA序列。这种标记方法能用于筛选,检测,或诊断任何类型的癌,包括但不限于结肠癌,肾脏癌,乳房癌,膀胱癌,肝癌,肾癌,脑癌,肺癌,前列腺癌,和血液癌症包括白血病。

这种标记方法还能用于检测致病生物体,包括但不限于细菌,真菌,病毒,原生动物,和分枝杆菌。也能用来区分致病微生物株和非致病微生物株,包括但不限于细菌,真菌,病毒,原生动物,和分枝杆菌。

例如,存在数种大肠杆菌(E.coli)菌株,大多数是非致病的。然而,几种菌株,例如大肠杆菌O157是致病的。非致病大肠杆菌和致病大肠杆菌之间有遗传差异。上述标记方法能用于在大的非致病生物群体(有时其与个体的正常菌群有关)中检测致病微生物。

在另一个实施方案中,通过检测感兴趣的基因座3′的核苷酸的掺入,测定感兴趣的基因座的序列,其中所述核苷酸是与感兴趣的基因座处的可能核苷酸不同的核苷酸。这个实施方案特别可以用于SNP的测序和检测。DNA聚合酶掺入核苷酸的效率和速度对于每一个核苷酸都是不同的。

根据从人类基因组计划获得的数据,全部SNPs中99%是二元的,人类基因组序列能被用来确定感兴趣的SNP3′的核苷酸。当SNP位点3′的核苷酸与该SNP处可能的核苷酸不同时,可以使用SNP3′的一个或一个以上核苷酸碱基来测定SNP位点的身份。

例如,假设要测定染色体13上SNP X的身份。人类基因组序列表明SNP X可以是腺嘌呤或鸟嘌呤,并且感兴趣的基因座的3′核苷酸是胸苷。使用含有BsmF I限制酶识别位点(经设计在扩增之后距感兴趣的基因座13个碱基)的引物来扩增包含SNP X的DNA片段。用限制酶BsmF I消化,产生包含感兴趣的基因座(其是腺嘌呤或鸟嘌呤)的5′突出端。消化产物可以被分成两个″补平″反应:一个包含dTTP,另一个反应包含dCTP。如果感兴趣的基因座为鸟嘌呤纯合的,则只有与dCTP混合的DNA分子被填补。如果感兴趣的基因座为腺嘌呤纯合的,则只有与dTTP混合的DNA分子被填补。如果感兴趣的基因座是杂合的,则与dCTP混合的DNA分子还有与dTTP混合的DNA分子均被填补。洗涤去除过量的dNTP之后,用与感兴趣的基因座3′的核苷酸(胸苷)互补的标记的ddATP补平样品。通过前面的反应填补的DNA分子可以填入标记的ddATP。如果个体为腺嘌呤纯合的,则接着可以用标记的ddATP填补之前与dTTP混合的DNA分子。然而,与dCTP混合的DNA分子将不掺入此核苷酸,因此,也不能掺入ddATP。只在与dTTP混合的分子中检测到标记的ddATP,这表明染色体13上SNP X核苷酸是腺嘌呤。

在另一个实施方案中,可进行单核苷酸突变存在与否的大规模筛选。用如上文在″引物设计″章节中所述的引物能扩增一个染色体或多个染色体上一个至几十个至几百个至几千个感兴趣的基因座。可设计引物,使得各个扩增的感兴趣的基因座大小不同(图2)。将根据公开的野生型序列推断在感兴趣的基因座处具有相同核苷酸的扩增的感兴趣的基因座合并在一起,与固相载体结合,所述载体包括用链霉抗生物素蛋白包被的微量滴定板孔,之后用结合第二引物上的识别位点的限制酶消化。消化之后,用标记的ddATP,ddTTP,ddGTP,ddCTP的混合物填补3’凹端,这里用不同的基团标记各个核苷酸。洗涤去除过量的核苷酸之后,直接在链霉抗生物素蛋白包被的板上使用板读数器或者荧光计能检测荧光谱。如果所有50个感兴趣的基因座均包含野生型核苷酸,则只能见到一个荧光谱。然而,如果50个感兴趣的基因座中有一个或一个以上包含突变,则将掺入不同的核苷酸并且见到其他荧光模式。核苷酸能从固相基质释放出来,并且在测序凝胶上分析,以确定包含突变的感兴趣的基因座。因为50个感兴趣的基因座各自大小不同,因此在测序凝胶上可以将它们分开。

多个感兴趣的基因座可以来自一个个体的DNA样品,代表一个染色体上,多个染色体上,多个基因上,单个基因上的多个感兴趣的基因座,或者其任何组合。多个感兴趣的基因座还可以是来自多个个体的相同的感兴趣的基因座。例如可以将来自50个不同个体的50个DNA样品合并并且分析以测定基因“X”处的特定感兴趣的核苷酸。

当分析人类数据时,已知的序列可以是从一个个体(包括例如目前正在分析其DNA的个体)测定的特定序列,或者其可以是共有序列,例如作为人类基因组的一部分公开的那些。

试剂盒

通过以试剂盒形式提供在本方法中使用的试剂可以最方便地实施本发明的方法。试剂盒优选包括下面成分的一个或多个:关于试剂盒使用的书写说明书,合适的缓冲液,盐,DNA提取去污剂,引物,核苷酸,标记的核苷酸,5′末端修饰材料,和如果需要,合适纯度的水,这些成分放在独立容器或包装中,允许试剂盒的使用者提取合适的核酸样品,并且根据本发明的方法分析样品。试剂盒提供的引物根据试剂盒的目的和期望使用该试剂盒分析的DNA而不同。在优选的实施方案中,试剂盒含有这样的引物,该引物使得可以产生限制酶的识别位点,从而在用限制酶消化后可以在本发明测序方法产生的DNA片段中形成包含感兴趣的基因座的5’突出端。

还可以设计试剂盒来检测期望的或各种各样的单核苷酸多态性,特别是与不期望的症状或疾病相关的那些。例如,一个试剂盒中除了其他成分外可以包括一套或多套用来扩增与乳房癌相关的一个或多个感兴趣的基因座的引物。另一种试剂盒中除了其他成分外可以包括一套或多套引物针对与I型或II型糖尿病发生倾向相关的基因。再者,另一种试剂盒除了其他成分外可以包括一套或多套引物针对与心脏病发生倾向相关的基因。下面的“实用性”章节提供这样的试剂盒的应用详细说明。

实用性

当期望知道某种核酸或其中的一个感兴趣的基因座或多个感兴趣的基因座的序列时均能使用本发明的方法。当对基因组DNA应用时本发明的方法特别有用。当从生物体特异的或物种特异的一个或多个感兴趣的基因座扩增DNA时,本发明方法可用于基因型分型鉴定DNA来源,并由此证明或提供DNA样品的来源生物体或物种的身份。生物体可以是任何含有核酸的生物体,例如病毒,细菌,酵母,植物,动物或人。

在任何生物群体中,均可以使用本发明的方法鉴定样品核酸序列和已知的核酸序列之间的不同。这样的不同包括,例如等位基因变异,突变,多态性,特别是单核苷酸多态性。

在优选的实施方案中,本发明方法提供鉴定单核苷酸多态性的手段。

在优选的实施方案中,本发明方法提供了疾病存在与否的鉴定方法(特别是由基因组序列引起的遗传病),或者对期望在个体中鉴定的其他生物学状况实施鉴定的方法。可以基于基因组序列对受试者中的序列进行鉴定,例如,以确定受试者是否是携带者或者评价是否受试者有出现某些遗传性状,状况或疾病的倾向。本发明的方法在父母和孩子的出生前遗传分析中是特别有用的。表II中列出了通过本发明能诊断的一些疾病的例子。

表II

  软骨发育不全  肾上腺脑白质营养不良,X-连锁  血丙种球蛋白缺乏,X-连锁  阿拉日耶综合征  α-地中海贫血X-连锁精神发育迟缓综合征  阿尔茨海默氏病  早发家族性阿尔茨海默氏病  肌萎缩侧索硬化综合(overiew)  雄激素不敏感综合征  安格尔曼综合征  遗传性共济失调综合(overiew)  共济失调-毛细管扩张  贝克肌营养不良(也称作Dystrophinopathies)  贝-威综合征  β-地中海贫血  生物素酶不足  Branchiootorenal综合征  BRCA1和BRCA2遗传性乳房癌/卵巢癌
    乳房癌    CADASIL    卡纳万病    癌症    Charcot-Marie-Tooth遗传性神经病    1型Charcot-Marie-Tooth神经病    2型Charcot-Marie-Tooth神经病    4型Charcot-Marie-Tooth神经病    X型Charcot-Marie-Tooth神经病    科凯恩综合征    结肠癌    先天性挛缩性细长指    颅缝早闭综合征(FGFR-相关的)    囊性纤维化    胱氨酸贮积症    耳聋和遗传性听力丧失    DRPLA(Dentatorubral-Pallidoluysian萎缩症)    迪乔治综合征(也称作22q11缺失综合征)    扩张型心肌病,X-连锁    唐氏综合征(21三体性)    迪谢纳肌营养不良(也称作Dystrophinopathies)    肌张力障碍,早发原发型(DYT1)    Dystrophinopathies    埃-当综合征,脊柱后侧凸形式    埃-当综合征,血管型    单纯大疱性表皮松解症    遗传性多发性外生骨疣
    面-肩-肱型肌营养不良    因子V Leiden血栓形成倾向    家族性腺瘤样息肉病(FAP)    家族性地中海热    脆性X综合征    弗里德赖希共济失调    额颞叶型痴呆症伴随帕金森氏病-17    半乳糖血症    戈谢病    遗传性血色素沉着症    血友病A    血友病B    遗传性出血性毛细血管扩张症    听觉丧失和耳聋,非综合征,DFNA3(连接蛋白26)    听觉丧失和耳聋,非综合征,DFNB1(连接蛋白26)    遗传性痉挛性截瘫    赫-普综合征    己糖胺A缺乏(也称作泰-萨病)    亨廷顿舞蹈症    软骨发育不良    先天性常染色体隐性鱼鳞病    色素失禁症    肯尼迪病(也称作脊髓和延髓性肌萎缩)    克拉伯氏病    莱伯遗传性视神经病    莱-尼综合征    白血病
    利弗综合征    肢带型肌营养不良    脂蛋白脂酶缺乏,家族性    无脑回畸形    马方氏综合征    MELAS(线粒体脑肌病,乳酸酸中毒,和中风样综合征)    单体性    2型多发性内分泌腺瘤形成    遗传性多发性外生骨疣    肌营养不良,先天性    强直性肌营养不良    肾源性尿崩症    神经纤维瘤病1    神经纤维瘤病2    伴压迫性麻痹倾向的神经病,遗传性    C型尼曼病    Nijmegen Breakage综合征    诺里病    1型眼皮肤白化病    眼咽型肌营养不良    卵巢癌    Pallister-Hall综合征    Parkin型少年帕金森氏病    佩-梅二氏病    佩珀综合征    波杰综合征    苯丙氨酸羟化酶缺乏
  普-威综合征  PROP 1-相关的联合垂体激素缺乏症(CPHD)  前列腺癌  色素性视网膜炎  视网膜神经母细胞瘤  罗汤综合征  史-莱-奥综合征  遗传性痉挛性截瘫  脊髓和延髓性肌萎缩(也称作肯尼迪病)  脊髓性肌萎缩  1型脊髓小脑性共济失调  2型脊髓小脑性共济失调  3型脊髓小脑性共济失调  6型脊髓小脑性共济失调  7型脊髓小脑性共济失调  Stickler综合征(遗传性关节眼病)  泰-萨病(也称作GM2神经节苷脂沉积症)  三体性  结节状硬化综合征  I型厄舍尔综合征  II型厄舍尔综合征  腭-心-面综合征(也称作22ql 1缺失综合征)  Von Hippel-Lindau综合征  威廉斯综合征  威尔逊病  X-连锁的肾上腺脑白质营养不良  X-连锁的血丙种球蛋白缺乏
    X-连锁的扩张型心肌病(也称作Dystrophinopathies)    X-连锁的hypotonic facies精神发育迟缓综合征

本发明的方法可以通过对与性状或疾病状态相关的感兴趣的基因座,特别是与这样的性状或状态最频繁相关的那些基因座进行测序,用于筛选个体的多个感兴趣的基因座,例如与遗传性状或遗传病相关的数十个,数百个,甚至数千个感兴趣的基因座。本发明可以用于分析一组特定的疾病,包括但不限于心脏病,癌症,内分泌失调,免疫失调,神经失调,肌与骨胳病症,眼科疾病,遗传异常,三体性,单体性,碱基颠换,易位,皮肤病,和家族性疾病。

本发明的方法能用于微生物的基因型分型,以快速鉴定物质例如食品物质中特定微生物的存在。在此方面,本发明的方法提供了对食品,液体或空气样品分析不期望的生物污染物例如微生物,真菌或动物废物的存在的快速途径。本发明可以用于检测各种各样的生物体,包括但不限于细菌,病毒,真菌,原生动物,霉菌,酵母,植物,动物和古细菌。本发明可以用于检测从各种来源收集的生物体,包括但不限于水,空气,旅馆,会议室,游泳池,浴池,飞机,空间飞行器,火车,公共汽车,轿车,办公室,家,生意场所,教堂,公园,海滨,运动场所,娱乐公园,剧场,和用于公共聚会的任何其他设施。

本发明的方法能用来分析在来自人或动物血样的血液培养物中多种类型的细菌或病毒的存在。

本发明的方法还能用来证明或鉴定发酵产品例如酒,啤酒和其他酒精类饮料中期望的或不期望的酵母菌株或者其某些性状的存在或者不存在。

本发明的方法还能用来证明或鉴定未知序列的DNA与已知来源或序列的DNA的关系,例如,用于犯罪学,法医学,母子或父子鉴定,考古分析等等。

本发明的方法还能用来确定植物、树木和灌本,和杂种植物、树木和灌木的基因型,包括产生果实的植物、树木和灌木及蔬菜和其他农作物,包括但不限于小麦,大麦,玉米,烟草,苜蓿,苹果,杏,香蕉,橙子,梨,油桃,无花果,海枣,葡萄干,李,桃,杏,蓝莓,草莓,越桔,浆果,樱桃,猕猴桃,酸橙,柠檬,甜瓜,菠萝,大蕉,番石榴,洋李,西番莲果,柑桔,葡萄柚,葡萄,西瓜,香瓜,蜜瓜,石榴,柿子,坚果,洋蓟,豆芽,甜菜,刺菜蓟,佛手瓜,菊苣,韭菜,秋葵,青葱,洋葱,冬葱,欧洲萝卜,甘薯,薯蓣,芦笋,鳄梨,苤蓝,芫菁甘蓝,茄子,西葫芦,芫菁,南瓜,番茄,马铃薯,黄瓜,胡萝卜,卷心菜,芹菜,球花甘蓝,花椰菜,萝卜,胡椒,菠菜,蘑菇,绿皮西葫芦,洋葱,豌豆,豆,和其他豆类植物。

特别地,本发明的方法可以用于筛选含有许多不同的感兴趣的基因座的核酸样品混合物和/或来自待对感兴趣的基因座进行分析的不同来源的核酸样品的混合物。大规模筛选的例子包括从农畜群或食物植物作物例如玉米或小麦采集核酸样品,合并,随后分析合并的样品是否存在不期望的遗传标记,如果合并的样品显示存在这样的不期望的遗传序列,则之后只对个体样品进行分析。不期望的遗传序列的例子是在从农畜获得的核酸样品中检测到病毒或细菌核酸序列,例如分枝杆菌或口蹄疫病毒序列或植物的真菌或细菌病原体。

对于可以使用合并的核酸的情况,另一个例子是分析来自动物或人受试者活体或尸体的一种或几种组织的样品中是否存在病原体或基因突变,所述受试者特别是在检测到病原体或突变后可能需要治疗的受试者。例如,可以从待进行筛选以确定是否存在病原体或者其它不期望的遗传突变的动物或人受试者采取多个样品,自各个生物样品单独扩增感兴趣的基因座,然后合并扩增的DNA样品用于限制消化,“补平”,以及检测。这可以用作分析可指示病原体或突变存在的诊断性核酸序列存在与否的初步筛选。然后,如果检测到病原体或突变的不期望的核酸序列,则对个体样品分开分析以确定不期望的序列的分布。当有大量样品要分析时,这样的分析特别划算。病原体的例子包括分枝杆菌,特别是引起结核病或副结核病的那些,细菌,特别是生物战中使用的细菌病原体,包括炭疽杆菌(Bacillusanthracis),和能引起食物中毒的致病性强的细菌,病毒,特别是流感和AIDS病毒,和已知与恶性细胞相关的突变。这样的分析对于大规模筛查食物产品是否存在致病菌也是有利的。

另一方面,本发明的方法可以例如通过筛选混合的样品接着根据需要筛选个体样品,用来检测植物,动物或人受试者或者受试者群中各种位置处期望的遗传序列的存在和分布。

本发明的方法可以用于分析在药物代谢、药物相互作用及一种药物或多种药物的应答性方面产生影响的个体的遗传变异。本发明的方法在药物基因组学中是特别有用的。

现在已一般性地描述了本发明,以下通过参考这里给出的一些具体的实施例可以更好地理解本发明,除非另有说明,这些实施例包括在此只是用于举例说明的目的而不是限制性的。

实施例

下面的实施例只是举例说明性质而不是要限制权利要求定义的本发明的范围。

实施例1

通过PCR扩增DNA序列,其中在特定温度下进行第一轮的退火步骤,然后在第二轮中提高温度,在第三轮进一步提高温度,目的在于减少非特异性扩增。通过计算退火到模板DNA上的第二引物的3′区的解链温度来确定第一轮PCR的TM1。例如,在图1B中,TM1可以大约是″c″区的解链温度。退火温度在第二轮循环中升至TM2,其大约是退火到模板DNA上的第一引物的3′区的解链温度。例如,在图1C中,退火温度(TM2)相应于″b″区的解链温度。在第三轮,退火温度升至TM3,其大约是第二引物的整个序列的解链温度。例如,在图1D中,退火温度(TM3)相应于″c″区+″d″区的解链温度。剩余扩增循环在TM3下进行。

模板DNA的制备

通过静脉穿刺术从知情同意的人类自愿者获得5毫升血样,由此制备模板DNA。从36名自愿者收集血样。使用QIAGEN供应的QIAamp DNABlood Midi试剂盒(目录号51183)从各个血样分离模板DNA。分离之后,将来自36名自愿者的各个模板DNA合并,用于进一步分析。

引物设计

分析下面四个单核苷酸多态性:SNP HC21S00340(由人染色体21cSNP数据库给出的标识号)(图3,1道)位于染色体21上;SNP TSC0095512(图3,2道)位于染色体1上,SNP TSC 0214366(图3,3道)位于染色体1上;和SNP TSC 0087315(图3,4道)位于染色体1上。SNP Consortium Ltd数据库可以在2002年2月14日起有效网址http://snp.cshl.org/访问。

使用下面的引物扩增SNP HC21S00340:

第一引物:5′TAGAATAGCACTGAATTCAGGAATACAATCATTGTCAC 3′(SEQ ID NO:9)

第二引物:5′ATCACGATAAACGGCCAAACTCAGGTTA3′(SEQID NO:10)

使用下面的引物扩增SNP TSC0095512:

第一引物:

5′AAGTTTAGATCAGAATTCGTGAAAGCAGAAGTTGTCTG3′(SEQ ID NO:11)

第二引物:5′TCTCCAACTAACGGCTCATCGAGTAAAG3′(SEQID NO:12)

使用下面的引物扩增SNP TSC0214366:

第一引物:5′ATGACTAGCTATGAATTCGTTCAAGGTAGAAAATGGAA 3′(SEQ ID NO:13)

第二引物:5′GAGAATTAGAACGGCCCAAATCCCACTC3′(SEQID NO:14)

使用下面的引物扩增SNP TSC 0087315:

第一引物:

5′TTACAATGCATGAATTCATCTTGGTCTCTCAAAGTGC3′(SEQ ID NO:15)

第二引物:5′TGGACCATAAACGGCCAAAAACTGTAAG 3′(SEQID NO:16)。

所有的引物的设计使得3′区与各感兴趣的基因座侧翼的上游或下游序列互补并且5′区包含限制酶识别位点。第一引物在5′端包含生物素标记和限制酶EcoRI的识别位点。第二引物包含限制酶BceA I的识别位点。

PCR反应

利用PCR从模板基因组DNA扩增感兴趣的所有四个基因座(美国专利4,683,195和4,683,202)。PCR反应的成分如下:40ng模板DNA,5μM第一引物,5μM第二引物,从QIAGEN获得的1X HotStarTaq Master混合物(商品目录号No.203443)。HotStarTaq Master混合物含有DNA聚合酶,PCR缓冲液,200μM各种dNTP,和1.5mM MgCl2

利用三个不同的退火温度系列(这里也称作低严紧性退火温度,中严紧性退火温度,和高严紧性退火温度),扩增含有感兴趣的SNP的各种模板DNA。不管退火温度方案如何,各个PCR反应均由40个扩增循环组成。使用QIAGEN供应的HotStarTaq Master混合物试剂盒进行PCR反应。根据生产商的说明,在第一轮PCR之前将反应物在95℃温育15分钟。各个延伸步骤之后的变性步骤在95℃下进行30秒。在不对温度作任何提高而允许有效延伸的温度下进行退火反应。

低严紧性退火反应包括在头三个循环中分别使用三个不同的退火温度。第一个循环的退火温度是37℃30秒;第二个的退火温度是57℃30秒;第三个的退火温度是64℃30秒。在接下来的循环中在64℃进行退火直到反应完成。

如凝胶照片所示(图3A),包含SNP TSC 0087315的DNA模板扩增之后观察到多条泳带(4道)。包含SNP HC21S00340(1道),SNPTSC0095512(2道),和SNP TSC0214366(3道)的DNA模板的扩增产生一条高强度的泳带和一条较高分子量的弱强度的泳带。当使用低退火温度条件时,产生正确大小的产物并且这是各个反应中的主要产物。

中严紧性退火反应包括在头三个循环中分别使用三个不同的退火温度。第一个循环的退火温度是40℃30秒;第二个的退火温度是60℃30秒;第三个的退火温度是67℃30秒。在接下来的循环中在67℃进行退火直到反应完成。和低严紧性退火条件下观察到的相似,包含SNPTSC0087315的DNA模板的扩增(图3B,4道)在中严紧性条件下产生多条泳带。包含其他三种SNP的DNA片段的扩增(1-3道)产生一条泳带。这些结果证明,可以使用变化的退火温度从基因组DNA,应用具有13个碱基的退火长度的引物干净地扩增感兴趣的基因座。

高严紧性退火反应为头三个循环中分别使用三个不同的退火温度。第一个循环的退火温度是46℃30秒;第二个的退火温度是65℃30秒;第三个的退火温度是72℃30秒。在接下来的循环中在72℃进行退火直到反应完成。如凝胶照片所示(图3C),使用高严紧性退火温度,包含SNPTSC 0087315的DNA模板(4道)的扩增产生一条正确分子量的泳带。通过提高用于头三个循环之每一个的退火温度,消除了非特异性扩增。包含SNP TSC0095512的DNA片段的扩增(2道)产生一条泳带。包含SNPHC21S00340(1道)和TSC0214366(3道)的DNA片段在高严紧性退火温度下未能扩增,然而,在中严紧性退火温度下,这些包含SNP的DNA片段扩增为一条泳带。这些结果证明,可以使用变化的退火温度来减少非特异性PCR产物,就象用包含SNP TSC0087315的DNA片段所证明的那样(图3,4道)。

实施例2

分析染色体1(TSC0095512),13(TSC0264580),和21(HC21S00027)上的SNP。使用两套不同的引物分析SNP TSC0095512,并且使用两种类型的核苷酸掺入反应分析SNP HC21S00027。

模板DNA的制备

通过静脉穿刺术从知情同意的人类自愿者获得5毫升血样,由此制备模板DNA。使用QIAGEN供应的QIAamp DNA Blood Midi试剂盒(目录号51183)分离模板DNA。根据试剂盒中包括的说明书分离模板DNA。分离之后,将来自36名人类自愿者的模板DNA合并,用限制酶EcoRI酶切。根据生产商说明进行限制酶消化。

引物的设计

使用下面的引物组通过PCR扩增SNP HC21S00027:

第一引物:5′ATAACCGTATGCGAATTCTATAATTTTCCTGATAAAGG 3′(SEQ ID NO:17)

第二引物:5′CTTAAATCAGGGGACTAGGTAAACTTCA 3′(SEQID NO:18)。

第一引物在最5′末端包含生物素标签,并包含针对限制酶EcoRI的核苷酸序列。第二引物包含针对限制酶BsmF I的核苷酸序列(图4A)。

还有,使用相同的第一引物但是具有下面序列的不同的第二引物通过PCR扩增SNP HC21 S00027:

第二引物:

5′CTTAAATCAGACGGCTAGGTAAACTTCA 3′(SEQ ID NO:19)。

该第二引物包含针对限制酶BceA I的识别位点(图4B)。

使用下面的引物通过PCR扩增SNP TSC0095512:

第一引物:

5′AAGTTTAGATCAGAATTCGTGAAAGCAGAAGTTGTCTG  3′(SEQ ID NO:11)

第二引物:5′TCTCCAACTAGGGACTCATCGAGTAAAG 3′(SEQID NO:20)。

第一引物在5′末端处具有生物素标签,并且包含针对EcoRI的限制酶识别位点。第二引物包含针对BsmF I的限制酶识别位点(图4C)。

还有,使用相同的第一引物和具有下面的序列的不同的第二引物扩增SNP TSC0095512:

第二引物:5′TCTCCAACTAACGGCTCATCGAGTAAAG3 ′(SEQID NO:12)。

该第二引物包含针对限制酶BceA I的识别位点(图4D)。

用下面的引物扩增位于染色体13上的SNP TSC0264580:

第一引物:5′AACGCCGGGCGAGAATTCAGTTTTTCAACTTGCAAGG 3′(SEQ ID NO:21)

第二引物:5′CTACACATATCTGGGACGTTGGCCATCC 3 ′(SEQID NO:22)。

第一引物包含位于5′最末端处的生物素标签,并且具有针对EcoRI的限制酶识别位点。第二引物包含针对BsmF I的限制酶识别位点。

PCR反应

利用聚合酶链式反应从模板基因组DNA扩增所有感兴趣的基因座(PCR,美国专利Nos.4,683,195和4,683,202,这里引作参考)。在该实施例中,在分开的反应试管中扩增各感兴趣的基因座,但是它们也可以在一个PCR反应中一起扩增。为了增强特异性,使用″热-启动″PCR。使用QIAGEN提供的HotStarTaq Master混合物试剂盒进行PCR反应(产品目录号203443)。可以针对每一个感兴趣的基因座,优化每一个反应的模板DNA和引物的量,但是在本实施例中,使用40ng模板人基因组DNA和5μM的各种引物。进行40个循环的PCR。使用下面的PCR条件:

(1)95℃,15分钟15秒;

(2)37℃,30秒;

(3)95℃,30秒;

(4)57℃,30秒;

(5)95℃,30秒;

(6)64℃,30秒;

(7)95℃,30秒;

(8)将步骤6和7重复39(39)次;

(9)72℃,5分钟。

在第一轮PCR中,退火温度大约是第二引物的3′退火区的解链温度。为37℃。第二轮PCR中的退火温度大约是第一引物中与模板DNA退火的3′区的解链温度,为57℃。第三轮PCR中的退火温度大约是第二引物的整个序列的解链温度,为64℃。剩余循环的退火温度是64℃。在头三轮PCR中将退火温度逐步从TM1升至TM2升至TM3,大大提高了特异性。这些退火温度是代表性的,本领域技术人员明白各个循环的退火温度取决于使用的具体引物。

可以通过尝试各种设置和使用可以得到最佳结果的参数优化变性、退火和延伸的温度和时间。图5A-5D中给出SNP HC21 S00027和SNPTSC095512的PCR产物的图示。

包含感兴趣的基因座的片段的纯化

从基因组模板DNA分离PCR产物。将每一个PCR产物分到从RocheDiagnostics GmbH获得的透明Streptawell高度-结合板(商品目录号1 645692,如在Roche Molecular Biochemicals,2001生物化学品目录中列出的)的四个分开的反应孔中。第一引物包含5′生物素标签,这样PCR产物与链霉抗生物素蛋白包被的孔结合,而基因组模板DNA则不结合。使用Thermomixer(Eppendort)以1000rpm在37℃下进行链霉抗生物素结合反应20分钟。对每个孔抽吸去除没有结合的材料,并且在温和混合下用1XPBS清洗三次(Kandpal等,Nucl.Acids Res.18:1789-1795(1990);Kaneoka等,Biotechniques 10:30-34(1991);Green等,Nucl.Acids Res.18:6163-6164(1990))。

包含感兴趣的基因座的分离的片段的限制酶消化

用与识别位点(自第二引物掺入到PCR产物中)结合的限制酶消化纯化的PCR产物。使用两个不同的第二引物在分开的反应中扩增了包含SNP HC21S00027(图6A和6B)和SNP TSC0095512(图6C和6D)的DNA模板。图6A(SNP HC21 S00027)和图6C(SNP TSC0095512)描述用限制酶BsmF I(New England Biolabs商品目录号R0572S)消化之后的PCR产物。图6B(SNP HC21S00027)和图6D(SNP TSC0095512)描述用限制酶BceA I(New England Biolabs,商品目录号R0623 S)消化之后的PCR产物。根据与限制酶一起提供的说明书在Streptawells中进行消化。用BsmF I消化包含SNP TSC0264580的DNA片段。用合适的限制酶消化之后,用PBS将孔清洗三次以去除裂解的片段。

掺入标记的核苷酸

如上所述进行限制酶消化后得到具有5′突出端和3′凹端的DNA片段,该5’突出端包含SNP位点或感兴趣的基因座。5′突出端作为模板起作用,使得可以在DNA聚合酶的存在下掺入一个或多个核苷酸。

对于每个SNP,进行四个独立的补平反应;这四个反应的每一个各含有不同的荧光标记的ddNTP(ddATP,ddTTP,ddGTP,或ddCTP)。向各补平反应加入下面的成分:1微升荧光标记的ddNTP,0.5微升未标记的ddNTPs(40μM)(其含有除了荧光标记的核苷酸之外的其余所有的核苷酸),2微升的10X测序酶缓冲液,0.25微升的测序酶,和20微升反应需要的水。所有的补平反应在40℃下进行10分钟。非荧光标记的ddNTP从Fermentas Inc.(Hanover,MD)购得。所有的其他标记试剂从Amersham(Thermo Sequenase Dye Terminator Cycle Sequencing CoreKit,US 79565)获得。在荧光标记的ddNTPs的存在下,3′凹端延伸一个碱基,其相应于SNP或感兴趣的基因座(图7A-7D)。

对于SNP HC21S00027,″补平″反应还使用了标记的ddNTPs和未标记的dNTPs的混合物。″补平″反应条件如上所述,除了使用含有40μM未标记的dNTPs、1微升荧光标记的ddATP、1微升荧光标记的ddTTP、1微升荧光标记的ddCTP、和1微升ddGTP的混合物。从Amersham获得荧光ddNTPs(Thermo Sequenase Dye Terminator Cycle SequencingCore试剂盒,US 79565;Amersham没有公开该荧光核苷酸的浓度)。用限制酶BsmF I消化包含SNP HC21S00027的DNA片段,产生四个碱基的5′突出端。如图7E所示,如果掺入的第一个核苷酸是标记的ddNTP,则3′凹端填入一个碱基,从而可以检测SNP或感兴趣的基因座。然而,如果掺入的第一个核苷酸是dNTP,聚合酶继续掺入核苷酸直到填入ddNTP。例如,头两个核苷酸可以填入dNTPs,第三个核苷酸填入ddNTP,从而使得可以检测突出端的第三个核苷酸。由此,能测定整个5′突出端的序列,这增加了从各个SNP或感兴趣的基因座获得的信息。

标记之后,用1X PBS(100微升)将各个Streptawell洗三次。然后根据酶供应商的说明通过用限制酶EcoRI消化,从Streptawells释放“经填补后的”DNA片段(图8A-8D)。以120rpm振荡下在37℃下消化1小时。

感兴趣的基因座的检测

从链霉抗生物素蛋白基质释放之后,在48孔膜板(The Gel Company,商品目录号TAM48-01)中加载10微升样品中的2-3微升。板中的样品用48 Flow Membrane Comb(The Gel Company,商品目录号AM48)吸附,并且插入到36cm 5%丙烯酰胺(尿素)凝胶(BioWhittaker MolecularApplications,Long Ranger Run Gel Packs,商品目录号50691)中。

以3000伏进行3分钟电泳使样品进入凝胶。去除膜片梳(membranecomb),在ABI 377自动测序仪上进行凝胶电泳3小时。通过荧光检测掺入的标记的核苷酸。

如图9A所示,对来自36名个体的样品,在SNP HC21S00027检测到两个核苷酸中的一个,或者腺嘌呤或者鸟嘌呤。这两个核苷酸据报道在SNP HC21S00027处存在(www.snp.schl.org/snpsearch.shtml)。在SNPTSC0095512处检测到两个核苷酸中的一个,或者鸟嘌呤或者胞嘧啶(图9B)。不管是用包含针对BceA I的识别位点的第二引物或者包含针对BsmF I的识别位点的第二引物进行扩增都获得相同的结果。

如图9C所示,在SNP TSC0264580处检测到两个核苷酸中的一个,其是腺嘌呤或胞嘧啶。这些是据报道在该SNP位点的两个核苷酸(www.snp.schl.org/snpsearch.shtml)。另外,在感兴趣的基因座上游一个碱基检测到胸苷。以序列依赖方式,BsmF I在10/14位置切割一些DNA分子并在11/15位置切割具有相同序列的其他DNA分子。当限制酶BsmF I在有义链上于11个核苷酸外切割并且在反义链上于15个核苷酸外切割时,3′凹端是SNP位点上游的一个碱基。SNP TSC0264580的序列表明SNP位点紧前面的碱基是胸苷。在该位置掺入标记的ddNTP产生比在10/14位置切割的片段小一个碱基的片段。因此,在11/15位置切割的DNA分子提供了关于SNP位点紧前面的碱基的身份信息,在10/14位置切下的DNA分子提供了关于SNP位点的身份信息。

使用包含针对BsmF I的识别位点的第二引物扩增SNPHC21S00027。使用标记的ddNTPs和未标记的dNTPs的混合物补平BsmF I消化产生的5′突出端。如果掺入dNTP,聚合酶继续掺入核苷酸直到掺入ddNTP为止。产生多个DNA片段,每个相差一个碱基,这使得可以测定突出端的全序列。

从图9D可见,检测到腺苷,其与SNP或感兴趣的基因座紧前面的核苷酸(胸苷)互补。该核苷酸是由于BsmF I的11/15酶切性质而被检测到的,详情如上所述。在SNP位点检测到鸟苷和腺苷,它们是报道的这个SNP位点的两个核苷酸(图9A)。在SNP位点检测到这两个核苷酸是因为染料的分子量不同使得可以分离这两种核苷酸。下一个检测到的核苷酸是胸苷,其与SNP位点紧下游的核苷酸互补。接下来检测到的核苷酸是鸟嘌呤,其与SNP位点下游两个碱基的核苷酸互补。最后,检测到腺苷,其与SNP位点下游第三个核苷酸互补。由此不仅获得SNP位点的序列信息而且还获得SNP紧前面的核苷酸和SNP之后接下来的三个核苷酸的序列信息。

这些感兴趣的基因座未包含突变。然而,如果一个感兴趣的基因座带有突变,包括但不限于点突变,插入,缺失,易位或者所述突变的任何组合,则通过与共有序列或公开的序列相比较可以鉴定之。将归于各感兴趣的基因座的序列与各感兴趣的基因座处的天然的非病态相关的基因序列进行比较,可以确定序列中突变的存在或不存在。然后可以将序列中突变的发现解释为个体是否存在所指的疾病,或者,如果合适,是否有发生这种疾病的倾向。可以评价突变的与正常的或非突变的序列的相对量来确定受试者是否带有一个或两个具突变序列的等位基因,从而确定受试者是否是一个携带者,或者所述突变是否导致显性或隐性病症。

实施例3

在分开的PCR反应中扩增来自染色体1的四个感兴趣的基因座和来自染色体21的两个感兴趣的基因座,之后合并在一起,并且进行分析。设计引物,使得各个扩增的感兴趣的基因座大小不同,从而可以检测感兴趣的基因座。

模板DNA的制备

通过静脉穿刺术从知情同意的人类自愿者获取5毫升血样,由此制备模板DNA。使用QIAGEN供应的QIAamp DNA Blood Midi试剂盒(目录号51183)分离模板DNA。根据试剂盒中包括的说明书分离模板DNA。从36名人类自愿者分离模板DNA之后合并成一个样品,用于进一步分析。

引物设计

使用下面的引物扩增SNP TSC 0087315:

第一引物:5′TTACAATGCATGAATTCATCTTGGTCTCTCAAAGTGC 3′(SEQ ID NO:15)

第二引物:5′TGGACCATAAACGGCCAAAAACTGTAAG3′(SEQID NO:16)。

使用下面的引物扩增SNP TSC0214366:

第一引物:5 ′ATGACTAGCTATGAATTCGTTCAAGGTAGAAAATGGAA 3′(SEQ ID NO:13)

第二引物:5′GAGAATTAGAACGGCCCAAATCCCACTC 3′(SEQ ID NO:14)。

使用下面的引物扩增SNP TSC 0413944:

第一引物:5′TACCTTTTGATCGAATTCAAGGCCAAAAATATTAAGTT3′(SEQ ID NO:23)

第二引物:5′TCGAACTTTAACGGCCTTAGAGTAGAGA 3′(SEQID NO:24)。

使用下面的引物扩增SNP TSC0095512:

第一引物:5′AAGTTTAGATCAGAATTCGTGAAAGCAGAAGTTGTCTG 3′(SEQ ID NO:11)

第二引物:5′TCTCCAACTAACGGCTCATCGAGTAAAG 3′(SEQID NO:12)。

使用下面的引物扩增SNP HC21S00131:

第一引物:5′CGATTTCGATAAGAATTCAAAAGCAGTTCTTAGTTCAG3′(SEQ ID NO:25)

第二引物:5′TGCGAATCTTACGGCTGCATCACATTCA 3′(SEQID NO:26)。

使用下面的引物扩增SNP HC21S00027:

第一引物:

5′ATAACCGTATGCGAATTCTATAATTTTCCTGATAAAGG 3′(SEQ ID NO:17)

第二引物:5′CTTAAATCAGACGGCTAGGTAAACTTCA 3′(SEQ ID NO:19)。

对于各个SNP,第一引物包含限制酶EcoRI的识别位点并且在最5′末端带有生物素标签。用来扩增各个SNP的第二引物包含限制酶BceA I的识别位点。

PCR反应

除了使用下面的退火温度,根据实施例2所述进行PCR反应:第一轮PCR的退火温度是37℃30秒;第二轮PCR的退火温度是57℃30秒;第三轮PCR的退火温度是64℃30秒。在所有接下来的循环中退火温度是64℃30秒。进行37(37)个PCR循环。PCR之后,从每个反应取1/4体积,并且合并在一个试管中。

包含感兴趣的基因座的片段的纯化

除了使样品与Streptawell微量滴定板的一个孔结合外,根据实施例2所述从基因组模板DNA分离PCR产物(现在合并成一个样品,并且称作“样品”)。

包含感兴趣的基因座的分离的片段的限制酶消化

用与第二引物中的识别位点结合的限制酶BceA I消化样品。根据与限制酶一起提供的说明书进行限制酶消化。限制酶消化之后,用1XPBS将孔清洗三次。

掺入核苷酸

如上所述进行限制酶消化后得到具有5′突出端和3′凹端的DNA分子,所述5’突出端包含SNP位点或感兴趣的基因座。5′突出端的功能是作为模板,使得在DNA聚合酶的存在下可以掺入核苷酸。

对于此补平反应使用下面的成分:1微升荧光标记的ddATP,1微升荧光标记的ddTTP,1微升荧光标记的ddGTP,1微升荧光标记的ddCTP,2微升10X测序酶缓冲液,0.25微升测序酶,和20微升反应需要的水。此补平反应在40℃下进行10分钟。所有的标记试剂从Amersham(Thermo Sequenase Dye Terminator Cycle Sequencing Core试剂盒(US79565);试剂盒中提供的ddNTPs的浓度是有专利权的,并且Amersham没有公开该浓度)获得。在荧光标记的ddNTPs的存在下,3′凹端填入一个碱基,其相应于SNP或感兴趣的基因座。

掺入核苷酸之后,用1X PBS(100微升)将Streptawell洗三次。然后根据酶供应商的说明书用限制酶EcoRI消化,从Streptawell释放“经过填补的”DNA片段。以120rpm振荡下在37℃消化1小时。

感兴趣的基因座的检测

从链霉抗生物素蛋白基质释放之后,在48孔膜板(The Gel Company,商品目录号TAM48-01)中加载10微升样品中的2-3微升。板中的样品用48 Flow Membrane Comb(The Gel Company,商品目录号AM48)吸附,并且插入到36cm 5%丙烯酰胺(尿素)凝胶(BioWhittaker MolecularApplications,Long Ranger Run Gel Packs,商品目录号50691)中。

以3000伏电泳3分钟,使样品进入凝胶。去除膜片梳,在ABI 377自动测序仪上进行凝胶电脉3小时。通过荧光检测掺入的核苷酸。

引物的设计使得各个扩增的感兴趣的基因座大小不同。如图10所示,各扩增的感兴趣的基因座相差大约5-10个核苷酸,这使得通过凝胶电泳可以将感兴趣的基因座彼此分离。对于SNP TSC0087315检测到两个核苷酸,它们是鸟嘌呤和胞嘧啶。这是据报道在SNP TSC0087315处存在的两个核苷酸(www.snp.schl.org/snpsearch.shtml)。该样品包含来自36名个体的模板DNA,并且因为掺入鸟嘌呤的DNA分子的分子量与掺入胞嘧啶的DNA分子的分子量不同,所以对于每个核苷酸见到不同的泳带。

对于SNP HC21S00027检测到两个核苷酸,它们是鸟嘌呤和腺苷(图10)。对于这个SNP位点,已报道的两个核苷酸是鸟嘌呤和腺苷(www.snp.schl.org/snpsearch.shtml)。如上文所讨论的,该样品包含来自36名个体的模板DNA,并且预计样品中同时存在两种核苷酸。掺入鸟嘌呤的DNA片段的分子量与掺入腺苷的DNA片段的分子量不同,使得可检测这两个核苷酸。

在SNP TSC0214366处检测到核苷酸胞嘧啶(图10)。据报道在该SNP位置存在的两个核苷酸是胸苷和胞嘧啶。

在SNP TSC0413944处检测到核苷酸鸟嘌呤(图10)。据报道在该SNP位置存在的两个核苷酸是鸟嘌呤和胞嘧啶。(http://snp.cshl.org/snpsearch.shtml)。

在SNP TSC0095512处检测到核苷酸胞嘧啶(图10)。据报道在该SNP位置存在的两个核苷酸是鸟嘌呤和胞嘧啶。(http://snp.schl.org/snpsearch.shtml)。

在SNP HC21S00131处检测到的核苷酸是鸟嘌呤。据报道在该SNP位置存在的两个核苷酸是鸟嘌呤和腺苷。(http://snp.schl.org/snpsearch.shtml)。

如上文所讨论的,样品由来自36名个体的模板DNA组成,并且预计SNP位点处存在两种核苷酸。对于SNP TSC0413944,TSC0095512,TSC0214366和HC21S00131,检测到两种核苷酸中的一种。有可能是样品中存在这些SNP位点的已报道的两种核苷酸,但是一个的荧光染料淹没了另一个的。掺入一个核苷酸的DNA分子的分子量不能有效地与掺入其它核苷酸的DNA分子分离。然而,这些SNP彼此容易分开,并且对于每个SNP,均掺入正确的核苷酸。因此,对于自PCR之后作为单一样品被处理的来自多条染色体的多个感兴趣的基因座,其序列可以得以确定。

用包含多个感兴趣的基因座的样品进行含有荧光标记的ddNTPs的单一反应。或者,进行四个独立的补平反应,其中每个反应含有一种荧光标记的核苷酸(ddATP,ddTTP,ddGTP,或ddCTP)和未标记的ddNTPs(参见实施例2,图7A-7D和图9A-C)。四个独立的“补平”反应使得可检测感兴趣的基因座处存在的任何核苷酸。例如,如果分析含有来自单一个体的多个感兴趣的基因座的样品,并且所述个体在一个或一个以上感兴趣的基因座处是杂合的,则可以利用四个独立的″补平″反应来测定感兴趣的杂合基因座处的核苷酸。

此外,当分析包含来自多个个体的模板的样品时,四个独立的″补平″反应也使得可检测样品中存在的核苷酸,而与感兴趣的基因座处核苷酸的出现频率无关。例如,如果样品包含来自50个个体的DNA模板,并且49个个体在感兴趣的基因座处为胸苷,而一个个体为鸟嘌呤,则进行四个独立的″补平″反应,其中各个″补平″反应物在不同的凝胶泳道中电泳(例如在图9A-9C中),这使得可以检测到鸟嘌呤。当分析由多种DNA模板组成的样品时,多个″补平″反应将减轻通过质量的差异区别单一感兴趣的位点处多种核苷酸的需要。

在本实施例中,分析多个单核苷酸多态性。还可以测定多个感兴趣的基因座处突变的存在或不存在,包括点突变,转换,颠换,易位,插入,和缺失。多个感兴趣的基因座可以来自单一染色体或多个染色体。多个感兴趣的基因座可以来自一个基因或来自多个基因。

可以测定引起疾病表型或者引起疾病表型倾向的多个感兴趣的基因座的序列。例如,可以扩增癌症或者任何其他疾病中涉及的一个至几十个至几百个至几千个基因。设计引物使得各个扩增的感兴趣的基因座大小不同。PCR之后,扩增的感兴趣的基因座可以被合并并且作为一个样品进行处理。或者,可以在一个PCR反应中扩增多个感兴趣的基因座,或者可以按感兴趣的基因座的总数(例如100个),分成数个样品,例如每个PCR反应10个感兴趣的基因座,然后合并。如这里所证明的,能测定多个感兴趣的基因座的序列。因此,在一个反应中,能测定引起疾病表型或者疾病表型倾向的一个至几十个至几百个至几千个基因的序列。

实施例4

获得知情同意之后,从四名个体获取基因组DNA。使用此模板DNA分析染色体13上的六个SNP(TSC0837969,TSC0034767,TSC1130902,TSC0597888,TSC0195492,TSC0607185)。在下面的网址能获得有关这些SNP的信息(www.snp.schl.org/snpsearch.shtml;2003年2月11日起有效网址)。

使用一种荧光染料标记的单核苷酸确定六个选择的SNP位点的个体基因型。设计引物使得在一个反应中可以分析六个SNP。

模板DNA的制备

通过静脉穿刺术从知情同意的人类自愿者获取9毫升血样,由此制备模板DNA。使用QIAGEN供应的QIAmp DNA Blood Midi试剂盒(目录号51183)分离模板DNA。根据试剂盒中包括的说明书分离模板DNA。

引物设计

使用下面这组引物扩增SNP TSC0837969:

第一引物:5′GGGCTAGTCTCCGAATTCCACCTATCCTACCAAATGTC 3′

第二引物:5′TAGCTGTAGTTAGGGACTGTTCTGAGCAC 3′

第一引物在5′末端带有生物素标签并且包含针对EcoRI的限制酶识别位点。设计第一引物使之在距感兴趣的基因座44个碱基处退火。第二引物包含针对BsmF I的限制酶识别位点。

使用下面这组引物扩增SNP TSC0034767:

第一引物:5′CGAATGCAAGGCGAATTCGTTAGTAATAACACAGTGCA 3′

第二引物:5′AAGACTGGATCCGGGACCATGTAGAATAC 3′

第一引物在5′末端带有生物素标签并且包含针对EcoRI的限制酶识别位点。第一引物的设计使其在距感兴趣的基因座50个碱基的位置退火。第二引物包含针对BsmF I的限制酶识别位点。

使用下面这组引物扩增SNP TSC1130902:

第一引物:5′TCTAACCATTGCGAATTCAGGGCAAGGGGGGTGAGATC 3′

第二引物:5′TGACTTGGATCCGGGACAACGACTCATCC 3′

第一引物在5′末端带有生物素标签并且包含针对EcoRI的限制酶识别位点。第一引物的设计使其距感兴趣的基因座60个碱基退火。第二引物包含针对BsmF I的限制酶识别位点。

使用下面这组引物扩增SNP TSC0597888:

第一引物:

5′ACCCAGGCGCCAGAATTCTTTAGATAAAGCTGAAGGGA3′

第二引物:5′GTTACGGGATCCGGGACTCCATATTGATC3′

第一引物在5′末端带有生物素标签并且包含针对EcoRI的限制酶识别位点。设计的第一引物距感兴趣的基因座70个碱基退火。第二引物包含针对BsmF I的限制酶识别位点。

使用下面这组引物扩增SNP TSC0195492:

第一引物:

5′CGTTGGCTTGAGGAATTCGACCAAAAGAGCCAAGAGAA

第二引物:5′AAAAAGGGATCCGGGACCTTGACTAGGAC3′

第一引物在5′末端带有生物素标签并且包含针对EcoRI的限制酶识别位点。设计的第一引物距感兴趣的基因座80个碱基退火。第二引物包含针对BsmF I的限制酶识别位点。

使用下面这组引物扩增SNP TSC0607185:

第一引物:5′ACTTGATTCCGTGAATTCGTTATCAATAAATCTTACAT 3′

第二引物:5′CAAGTTGGATCCGGGACCCAGGGCTAACC 3′

第一引物在5′末端带有生物素标签并且包含针对EcoRI的限制酶识别位点。设计的第一引物距感兴趣的基因座90个碱基退火。第二引物包含针对BsmF I的限制酶识别位点。

利用聚合酶链式反应从模板基因组DNA扩增所有感兴趣的基因座(PCR,美国专利Nos.4,683,195和4,683,202,这里引作参考)。在本实施例中,在分开的反应试管中扩增感兴趣的基因座,但是也可以在一个PCR反应中一起扩增。为了提高特异性,使用″热-启动″PCR。使用QIAGEN提供的HotStarTaq Master混合物试剂盒(产品目录号203443)进行PCR反应。对于每一个感兴趣的基因座可以针对每一个反应优化模板DNA和引物的量,但是在本实施例中,使用40ng模板人基因组DNA和5μM的各种引物。进行40个循环的PCR。使用下面的PCR条件:

(1)95℃,15分钟15秒;

(2)37℃,30秒;

(3)95℃,30秒;

(4)57℃,30秒;

(5)95℃,30秒;

(6)64℃,30秒;

(7)95℃,30秒;

(8)将步骤6和7重复39(39)次;

(9)72℃,5分钟。

在第一轮PCR中,退火温度大约是第二引物的3′退火区的解链温度,是37℃。第二轮PCR中的退火温度大约是第一引物的退火到模板DNA上的3′区的解链温度,是57℃。第三轮PCR中的退火温度大约是第二引物的整个序列的解链温度,是64℃。其余循环的退火温度是64℃。在头三轮PCR中将退火温度逐步从TM1升至TM2升至TM3,大大提高了特异性。这些退火温度是代表性的,本领域技术人员明白各个循环的退火温度取决于使用的具体引物。

可以通过尝试各种设置并且使用产生最佳结果的参数,优化变性、退火和延伸的温度和时间。在本实施例中,设计的第一引物在距感兴趣的基因座不同的距离退火。本领域技术人员明白第一引物的退火位置可以距感兴趣的基因座5-10,11-15,16-20,21-25,26-30,31-35,36-40,41-45,46-50,51-55,56-60,61-65,66-70,71-75,76-80,81-85,86-90,91-95,96-100,101-105,106-110,111-115,116-120,121-125,126-130,131-140,141-160,161-180,181-200,201-220,221-240,241-260,.261-280,.281-300,301-350,351-400,401-450,451-500,或大于500个碱基。

包含感兴趣的基因座的片段的纯化

从基因组模板DNA分离PCR产物。PCR反应之后,将来自一个个体的每个PCR反应产物的1/4体积一起混合到从Roche Diagnostics GmbH获得的透明Streptawell高度-结合板的孔中(商品目录号1 645 692,如在Roche Molecular Biochemicals,2001生物化学品目录中列出的)。第一引物包含5′生物素标签,这样PCR产物与链霉抗生物素蛋白包被的孔结合,而基因组模板DNA则不结合。使用Thermomixer(Eppendorf)以1000rpm在37℃下进行链霉抗生物素结合反应20分钟。对每个孔抽吸去除没有结合的材料,并且在温和混合下用1X PBS清洗三次(Kandpal等,Nucl.Acids Res.18:1789-1795(1990);Kaneoka等,Biotechniques 10:30-34(1991);Green等,Nucl.Acids Res.18:6163-6164(1990))。

包含感兴趣的基因座的分离的片段的限制酶消化

用限制酶BsmF I消化纯化的PCR产物,该酶与通过第二引物掺入到PCR产物中的识别位点结合。根据与限制酶一起提供的说明书在Streptawells中进行消化。消化之后,用PBS将孔清洗三次以去除裂解的片段。

掺入标记的核苷酸

使用BsmF I限制酶消化后得到带有5′突出端和3′凹端的DNA片段,该5’突出端包含SNP位点或感兴趣的基因座。5′突出端的功能是作为模板,使得在DNA聚合酶的存在下可以掺入一个或多个核苷酸。

下面,给出SNP TSC0837969的5′突出端的示意图。没有复制整个DNA序列,而只是给出说明突出端的部分(其中R表示可变位点)。

5′TTAA

3′AATT    R  A  C  A

突出端位置 1  2  3  4

对于TSC0837969,5′有义链(这里描述为上面的链)上发现的核苷酸是腺嘌呤和鸟嘌呤。反义链上突出端中的第三个位置相应于胞嘧啶,它与鸟嘌呤互补。因为这个可变位点可以是腺嘌呤或鸟嘌呤,所以在未标记的dCTP,dTTP,和dATP存在下使用荧光标记的ddGTP来测定两个等位基因的序列。下面图示说明对于鸟嘌呤纯合的个体,腺嘌呤纯合的个体或者杂合的个体的补平反应。

在TSC 0837969为鸟嘌呤纯合的:

等位基因1    5′TTAA    G*

             3′AATT    C  A  C  A

突出端位置              1  2  3  4

等位基因2    5′TTAA    G*

             3′AATT    C  A  C  A

突出端位置              1  2  3  4

标记的ddGTP掺入到突出端的第一个位置。只见到一个信号,它相应于在突出端的第一个位置填入标记的ddGTP的分子。

在TSC 0837969为腺嘌呤纯合的:

等位基因1    5′TTAA    A  T  G*

             3′AATT    T  A  C  A

突出端位置              1  2  3  4

等位基因2    5′TTAA    A  T  G*

             3′AATT    T  A  C  A

突出端位置              1  2  3  4

在突出端的位置1掺入未标记的dATP,并且在突出端的位置2掺入未标记的dTTP。在突出端的位置3掺入标记的ddGTP。只见到一个信号;在位置3填ddGTP的分子与在位置1填ddGTP的分子具有不同的分子量,这使得容易鉴定个体是腺嘌呤或鸟嘌呤纯合的。

在TSC0837969杂合:

等位基因1        5′TTAA    G*

                 3′AATT    C  A  C  A

突出端位置                  1  2  3  4

等位基因2        5′TTAA    A  T  G*

                 3′AATT    T  A  C  A

突出端位置                  1  2  3  4

可见到两个信号;一个信号相应于在位置1填入ddGTP的DNA分子,第二个信号相应于在突出端的位置3填入ddGTP的分子。利用根据分子量进行分子分离的任何技术(包括但不限于凝胶电泳),能分离两个信号。

下面,给出SNP TSC0034767的5′突出端的示意图。没有复制全DNA序列,只是给出说明突出端的部分(其中R指示可变位点)。

A  C  A  R       GTGT 3′

                 CACA 5′

4  3  2  1       突出端位置

对于TSC0034767,5′有义链(这里描述为上面的链)上发现核苷酸是胞嘧啶和鸟嘌呤。突出端的第二个位置相应于腺嘌呤,其与胸苷互补。突出端的第三个位置相应于胞嘧啶,其与鸟嘌呤互补。在未标记的dCTP,dTTP,和dATP的存在下用荧光标记的ddGTP  定两个等位基因的序列。

在这种情况下,第二引物在感兴趣的基因座上游退火,因此在反义链(这里描述为下面的链)上发生补平反应。根据包含IIS限制酶识别位点的第二引物是在感兴趣的基因座上游还是下游退火,补平反应可以在有义链或反义链上发生。

下面,给出SNP TSC 1130902的5′突出端的示意图。没有复制全DNA序列,只是给出说明突出端的部分(其中R指示可变位点)。

5′TTCAT

3′AAGTA      R  T  C  C

突出端位置    1  2  3  4

对于TSC1130902,5′有义链上发现的核苷酸是腺嘌呤和鸟嘌呤。突出端的第二个位置相应于胸苷。突出端的第三个位置相应于胞嘧啶,其与鸟嘌呤互补。

在未标记的dCTP,dTTP,和dATP的存在下用荧光标记的ddGTP测定两个等位基因的序列。

下面,给出SNP TSC0597888的5′突出端的示意图。没有复制全DNA序列,只是给出说明突出端的部分(其中R指示可变位点)。

T  C T  R    ATTC 3′

             TAAG 5′

4  3 2  1    突出端位置

对于TSC0597888,5′有义链(这里描述为上面的链)上发现的核苷酸是胞嘧啶和鸟嘌呤。突出端的第三个位置相应于胞嘧啶,其与鸟嘌呤互补。在未标记的dCTP,dTTP,和dATP的存在下用荧光标记的ddGTP测定两个等位基因的序列。

下面,给出SNP TSC0607185的5′突出端的示意图。没有复制全DNA序列,只是给出说明突出端的部分(其中R指示可变位点)。

C  C  T  R    TGTC 3′

              ACAG 5′

4  3  2  1    突出端位置

对于TSC0607185,5′有义链(这里描述为上面的链)上发现的核苷酸是胞嘧啶和胸苷。在这种情况下,第二引物在感兴趣的基因座上游退火,这使得反义链被填补。反义链(这里描述为下面的链)将填入鸟嘌呤或腺嘌呤。

5′突出端的第二个位置是胸苷,其与腺嘌呤互补,并且突出端的第三个位置相应于胞嘧啶,其与鸟嘌呤互补。在未标记的dCTP,dTTP,和dATP的存在下用荧光标记的ddGTP测定两个等位基因的序列。

下面,给出SNP TSC0195492的5′突出端的示意图。没有复制全DNA序列,只是给出说明突出端的部分。

5′ATCT

3′TAGA    R  A  C  A

突出端     1  2  3  4

在该位点发现的核苷酸在有义链上是胞嘧啶和鸟嘌呤(这里描述为上面的链)。5′突出端中第二个位置是腺嘌呤,其与胸苷互补,突出端的第三个位置相应于胞嘧啶,其与鸟嘌呤互补。在未标记的dCTP,dTTP,和dATP的存在下用荧光标记的ddGTP测定两个等位基因的序列。

正如上面证明的,通过在未标记的dATP,dTTP,和dCTP的存在下用ddGTP标记能测定六个SNP的两个等位基因的序列。向各个补平反应加入下面的成分:1微升荧光标记的ddGTP,0.5微升未标记的ddNTPs(40μM)(其含有除了鸟嘌呤以外的所有的核苷酸),2微升的10X测序酶缓冲液,0.25微升的测序酶,和20微升反应需要的水。此补平反应在40℃下进行10分钟。没有荧光标记的ddNTP从Fermentas Inc.(Hanover,MD)购得。所有其他标记试剂从Amersham(ThermoSequenase Dye Terminator Cycle Sequencing Core Kit,US 79565)购得。

标记之后,用1X PBS(100微升)将各个Streptawell清洗三次。然后根据与酶一起提供的供应商的说明书,用限制酶EcoRI消化而从Streptawells释放″经过填补″的DNA片段。消化在120rpm振荡下在37℃下进行1小时。

感兴趣的基因座的检测

从链霉抗生物素蛋白基质释放之后,将样品加载到36厘米5%丙烯酰胺(尿素)凝胶(BioWhittaker Molecular Applications,Long Ranger RunGel Packs,目录号50691)的泳道中。以3000伏电泳3分钟使样品进入凝胶。在测序仪(Hoefer SQ3测序仪)上进行3小时的凝胶电泳。从仪器上取出凝胶并且在Typhoon 9400 Variable Mode Imager上扫描。通过荧光检测掺入的标记的核苷酸。

如图11所示,对于SNP TSC0837969,在1和2道中的模板DNA为腺嘌呤纯合的。如果个体为腺嘌呤纯合的,则预期发生下面的补平反应:

在TSC 0837969为腺嘌呤纯合的:

5′TTAA       A  T  G*

3′AATT       T  A  C  A

突出端位置    1  2  3  4

在与突出端互补的第一位置掺入未标记的dATP。在与突出端互补的第二位置掺入未标记的dTTP。在与突出端互补的第三位置掺入标记的ddGTP。只见到一条泳带,其在丙烯酰胺凝胶中的迁移位置大约是46。这表明腺嘌呤是在位置1填入的核苷酸。如果填入核苷酸鸟嘌呤,则预期在位置44出现一条泳带。

然而,对于SNP TSC0837969,3和4道中的模板DNA是杂合的。如果个体是杂合的,则预期下面的补平反应:

在TSC0837969处是杂合的:

等位基因1    5′TTAA    G*

             3′AATT    C  A  C  A

突出端位置              1  2  3  4

等位基因2    5′TTAA    A  T  G*

             3′AATT    T  A  C  A

突出端位置              1  2  3  4

见到两个不同的泳带;一条泳带相应于在与突出端互补的位置1填入ddGTP的分子(G等位基因),第二条泳带相应于在与突出端互补的位置3填ddGTP的分子(A等位基因)。利用凝胶电泳根据分子量的不同分离两条泳带。利用一种荧光标记的核苷酸ddGTP确定了个体在SNP位点是杂合的。这是第一次应用单核苷酸有效地检测到两个不同等位基因的存在。

对于SNP TSC0034767,1和3道中的模板DNA为胞嘧啶和鸟嘌呤

杂合的,这通过两条不同的泳带证实。较低的泳带相应于在与突出端互补的位置1填入的ddGTP。第二个稍高分子量的泳带相应于在位置3填入的ddGTP,表明突出端的第一个位置填入了未标记的dCTP,这就使得聚合酶继续掺入核苷酸,直到在与突出端互补的位置3掺入ddGTP。2和4道中的模板DNA为鸟嘌呤纯合的,这一点通过比在与突出端互补的第一位置填入ddGTP的分子更高分子量的单一泳带证实。

对于SNP TSC1130902,1,2和4道中的模板DNA在可变位点处为腺嘌呤纯合的,这一点通过在凝胶上大约62位置处迁移的单一较高分子量泳带证实。3道中的模板DNA在可变位点处是杂合的,这通过存在两个不同的泳带而表明。较低的泳带相应于在与突出端互补的位置1填入ddGTP的分子(鸟嘌呤等位基因)。较高分子量泳带相应于在与突出端互补的位置3填入ddGTP的分子(腺嘌呤等位基因)。

对于SNP TSC0597888,1和4道中的模板DNA在可变位点处为胞嘧啶纯合的;2道中的模板DNA在可变位点处是杂合的,而3道中的模板DNA为鸟嘌呤纯合的。下面图示了预期的补平反应:

对于胞嘧啶是纯合的:

等位基因1       T  C  T  G    ATTC 3′

                   G*A  C    TAAG 5′

                4  3  2  1    突出端位置

等位基因2       T  C  T  G    ATTC 3′

                   G*A  C    TAAG 5′

                4  3  2  1    突出端位置

对于鸟嘌呤是纯合的:

等位基因l       T  C  T  C    ATTC3′

                         G*  TAAG 5′

                4  3  2  1    突出端位置

等位基因2       T  C  T  C    ATTC 3′

                         G*  TAAG 5′

                4  3  2  1    突出端位置

鸟嘌呤/胞嘧啶杂合的:

等位基因1    T  C  T  G    ATTC 3′

                G* A  C    TAAG 5′

             4  3  2  1    突出端位置

等位基因2    T  C  T  C    ATTC 3′

                      G*   TAAG 5′

             4  3  2  1    突出端位置

在可变位点处为鸟嘌呤纯合的模板DNA显示单一泳带,其相应于在与突出端互补的位置1填入ddGTP的DNA分子。这些DNA分子比在突出端位置3填入ddGTP的DNA分子有较低的分子量(参见对于SNPTSC0597888的3道)。两个DNA分子在分子量上相差2个碱基。

在可变位点处为胞嘧啶纯合的模板DNA显示单一泳带,其相应于在与突出端互补的位置3填入ddGTP的DNA分子。这些DNA分子比位置1填入ddGTP的DNA分子以更高的分子量迁移(参见对于SNPTSC0597888的1和4道)。

在可变位点处杂合的模板DNA显示两条泳带;一条泳带相应于在与突出端互补的位置1填入ddGTP的DNA分子并且具有较低分子量,第二条泳带相应于在与突出端互补的位置3填入ddGTP的DNA分子并且具有较高分子量(参见对于SNP TSC0597888的3道)。

对于SNP TSC0195492,1和3道中的模板DNA在可变位点处是杂合的,这由存在两条不同的泳带证实。2道中的模板DNA在可变位点处为鸟嘌呤纯合的。4道中的模板DNA为胞嘧啶纯合的。对于这个SNP在4道只见到一条泳带,并且其分子量比在与突出端互补的位置1填入ddGTP的DNA分子的分子量高(比较2,3和4道)。

对于SNP TSC0607185,已观察到的等位基因据报道是胞嘧啶或胸苷。为了一致,SNP协会以有义链上出现的等位基因表示发现的等位基因(www.snp.schl.org/snpsearch.shtml;2003年2月11日起有效网址)。对于这个SNP,第二引物在感兴趣的基因座上游退火,这使得用BsmF I消化之后在反义链上发生补平反应。

1和3道的模板DNA是杂合的;2道中的模板DNA为胸苷纯合的,4道中的模板DNA为胞嘧啶纯合的。反义链填入ddGTP,这样有义链上的核苷酸相应于胞嘧啶。

分子量标记物能用来鉴定预期泳带的位置。或者,对于分析的每个SNP,可以使用已知的杂合样品,其将精确鉴定两个预期泳带的位置。

如图11所证明的,可以使用标记有一种荧光染料的单核苷酸确定可变位点的身份,包括但不限于SNP和单核苷酸突变。典型地,为了确定个体在SNP位点是纯合的还是杂合的,使用标记有一种染料的一个核苷酸和标记了第二染料标记的第二核苷酸进行多个反应。然而,这在比较结果时带来问题,因为两种染料具有不同的量子系数。即使用相同的染料标记不同的核苷酸,量子系数也是不同的。而应用以一种染料标记的单核苷酸可以消除由不同染料量子系数带来的任何误差。

在本实施例中,使用荧光标记的ddGTP。然而,本方法可适用于以任何信号产生部分标记的核苷酸,所述部分包括但不限于放射性分子,荧光分子,抗体,抗体片段,半抗原,糖,生物素,生物素衍生物,发磷光部分,发光部分,电化学发光部分,有色部分,具有可检测的电子自旋共振、电容、介电常数或导电性的部分。另外,可以使用标记的ddATP,ddTTP,或ddCTP。

上面的实施例使用与突出端互补的第三位置作为第二等位基因的指示剂。然而,也可以使用突出端的第二或第四位置(参见掺入核苷酸的章节)。此外,用IIS型酶BsmF I产生了突出端;然而自其结合位点一定距离切割DNA的任何酶均可以使用,包括但不限于表I中列出的酶。

还有,在上面的实施例中,在被填补的链上SNP位点紧前面的核苷酸不是鸟嘌呤。这消除了有待去除的由IIS型限制酶的可变切割性质造成的任何影响。例如,在SNP TSC0837969,有义链上SNP位点上游的核苷酸是腺嘌呤。如果BsmF I显示可变切割性质,则对于腺嘌呤等位基因和鸟嘌呤等位基因将产生下面的突出端:

G等位基因-11/15切割        5′TTA

                           3′AAT  T  C  A  C

突出端位置                         0  1  2  3

填入后的G等位基因          5′TTA  A  G*

                           3′AAT  T  C  A  C

突出端位置                         0  1  2  3

A等位基因11/15切割         5′TTA

                           3′AAT  T  T  A  C

突出端位置                         0  1  2  3

填入之后的A等位基因        5′TTA  A  A  T  G*

                           3′AAT  T  T  A  C

突出端位置                         0  1  2  3

对于鸟嘌呤等位基因,突出端的第一个位置将填入dATP,这将使得聚合酶在与突出端互补的位置2掺入ddGTP。在10/14位置切割的分子和在11/15位置切割的分子之间没有可检测得到的差异。

对于腺嘌呤等位基因,与突出端互补的第一位置将填入dATP,第二位置将填入dATP,第三位置将填入dTTP,第四位置将填入ddGTP。在10/14位置切割的分子和在11/15位置切割的分子之间分子量没有差异。唯一的差异相应于DNA分子在可变位点包含腺嘌呤还是在可变位点包含鸟嘌呤。

如在图11中所示,第一引物的退火区的定位将使得可以在一个凝胶道上分析多个SNP。还有,当使用带有相同染料的相同核苷酸时,也能进行单一的补平反应。在本实施例中,在一个泳道中分析6个SNP。然而,在一个反应中可以分析任何数目的SNP,包括但不限于1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,30-40,41-50,51-60,61-70,71-80,81-100,101-120,121-140,141-160,161-180,181-200,和大于200。

此外,用来检测两个等位基因的一种标记的核苷酸能与用来检测一组不同的SNP的第二标记的核苷酸混合,前提是标记的核苷酸都不在可变位点紧前面出现(与11/15切割的位置0处的核苷酸互补)。例如,假设SNPX在可变位点处为鸟嘌呤或胸苷,并且在用BsmF I消化之后产生下面的5′突出端:

SNP X 10/14       5′TTGAC

G等位基因         3′AACTG    C  A  C  T

                  突出端位置  1  2  3  4

SNPX1 1/15        5′TTGA

G等位基因         3′AACT     G  C  A  C

                  突出端位置  0  1  2  3

SNP X 10/14       5′TTGAC

T等位基因         3′AACTG    A  A  C  T

                  突出端位置  1  2  3  4

SNP X 11/15       5′TTGA

T等位基因         3′AACT     G  A  A  C

                  突出端位置  0  1  2  3

用标记的ddGTP、未标记的dATP,dCTP,和dTTP进行补平反应之后,将产生下面的分子:

SNP X 10/14       5′TTGAC    G*

G等位基因         3′AACTG    C  A  C  T

                  突出端位置  1  2  3  4

SNP X 11/15       5′TTGA     C  G*

G等位基因         3′AACT     G  C  A  C

                  突出端位置  0  1  2  3

SNP X 10/14       5′TTGAC    T  T  G*

T等位基因         3′AACTG    A  A  C  T

                  突出端位置  1  2  3  4

SNP X 11/15       5′TTGA     C  T  T  G*

T等位基因         3′AACT     G  A  A  C

                  突出端位置  0  1  2  3

现在假设SNP Y是腺嘌呤或胸苷,在用BsmF I消化之后产生下面的5′突出端。

SNP Y 10/14       5′GTTT

A等位基因         3′CAAA     T  G  T  A

                  突出端位置  1  2  3  4

SNPY 11/15        5′GTT

A等位基因         3′CAA      A  T  G  T

                  突出端位置  0  1  2  3

SNP Y 10/14       5′GTTT

T等位基因         3′CAAA     A  G  T  A

                  突出端位置  1  2  3  4

SNPY 11/15        5′GTT

T等位基因         3′CAA      A  A  G  T

                  突出端位置  0  1  2  3

用标记的ddATP和未标记的dCTP,dGTP,和dTTP填补之后,产生下面的分子:

SNP Y 10/14       5′GTTT     A*

A等位基因         3′CAAA     T  G  T  A

                  突出端位置  1  2  3  4

SNPY 11/15        5′GTT      T  A*

A等位基因         3′CAA      A  T  G  T

                  突出端位置  0  1  2  3

SNPY 10/14    5′GTTT    T  C  A*

T等位基因     3′CAAA    A  G  T  A

              突出端位置 1  2  3  4

SNPY 11/15    5′GTT     T  T  C  A*

T等位基因     3′CAA     A  A  G  T

              突出端位置 0  1  2  3

在本实施例中,使用标记的ddGTP和标记的ddATP分别确定SNP X和SNP Y两个等位基因的身份。位于11/15切割SNP X形成的突出端紧前面的核苷酸(与位置0互补的核苷酸)在填补链上不是鸟嘌呤或腺嘌呤。同样,SNPY紧前面的核苷酸在填补的链上也不是鸟嘌呤或腺嘌呤。这使得用标记的ddGTP,标记的ddATP,和未标记的dCTP和dTTP可以在单一反应中针对两个SNP实施补平反应。这减少了需要进行的反应次数并且增加了能在一个反应中分析的SNP的数目。

可以设计用于各个SNP的第一引物,使之在距感兴趣的基因座不同的距离退火,这样SNP在凝胶上迁移至不同的位置。例如,用来扩增SNP X的第一引物可以在距感兴趣的基因座30个碱基处退火,而用来扩增SNP Y的第一引物可以在距感兴趣的基因座35个碱基处退火。还有,可以用发射光谱不重叠的荧光染料标记核苷酸。进行凝胶电泳之后,使用对一种染料特异的波长扫描凝胶。只有用那种染料标记的分子才发出信号。然后可以再用对第二种染料特异的波长扫描凝胶,只有用那种染料标记的那些分子才发出信号。该方法使得可以最大地压缩能在单一的反应中分析的SNP的数目。

在本实施例中,在被填补的链上位于可变位点前面的核苷酸不是腺嘌呤或鸟嘌呤。这种方法可以利用标记的核苷酸的任何组合来进行,本领域技术人员明白哪些标记反应可以混合而那些则不能。例如,如果用胸苷标记一个SNP并且用胞嘧啶标记第二SNP,那么当各个可变位点紧前面的核苷酸在有义链上不是胸苷或胞嘧啶并且可变位点紧后面的核苷酸在有义链上也不是胸苷或胞嘧啶时,能在单一反应中标记这些SNP。

这种方法使得来自一个等位基因的信号可以与来自第二等位基因的信号相比较,而无需复杂地额外测定可变切割的程度,或者必须校正染料的量子系数。当试图定量测定一个等位基因与另一个的比例时,这个方法是特别有用的。例如,这种方法可以用于检测染色体异常。预期杂合位点处等位基因的比例是大约1∶1(一个A等位基因和一个G等位基因)。然而,如果存在额外的染色体,则该比例预期是大约1∶2(一个A等位基因和2个G等位基因或者2个A等位基因和1个G等位基因)。当试图在母本DNA存在下检测胎儿DNA时,该方法是特别有用的。

另外,该方法可以用于检测一个样品中的两个遗传信号。例如,该方法能在野生型细胞的存在下检测突变细胞(参见实施例5)。如果突变细胞在特定基因的DNA序列中包含突变,则该方法能用来检测突变信号和野生型信号。该方法能在野生型DNA序列的存在下检测突变DNA序列。通过使用标记有一个信号产生部分的单核苷酸,突变DNA与野生型DNA的比例能被定量测定。

实施例5

用于检测各种类型癌症的非侵入式方法具有减小疾病发生率和死亡率的可能性。已经开发出结肠直肠癌早期诊断的几种技术,包括结肠镜检查,钡灌肠法,和乙状结肠镜检查,但是在使用中这些技术有局限性,因为这些技术是侵入式的,这引起低比例的患者顺从性。在早期结肠直肠癌鉴定中非侵入式遗传分析是有用的。

在1991,研究人员鉴定了腺瘤样结肠息肉病基因(AdenomatousPolyposis Coli,APC),它在结肠直肠癌的形成中起着关键作用(Kinzler等,Science 253:661-665,1991)。该APC基因位于染色体5q21-22上并且总共15个外显子编码8529个核苷酸的RNA分子,产生300 Kd APC蛋白质。这种蛋白质在多种细胞类型中表达并且对于细胞粘附是必需的。

APC基因中的突变一般引发结肠直肠瘤形成(Tsao,J.等,Am,J.Pathol.145:531-534,1994)。APC基因中大约95%的突变导致无义/移码突变。最常见的突变在密码子1061和1309处发生;这些密码子处的突变占全部种系突变的1/3。关于体细胞突变,60%发生在密码子1286-1513中,其是编码序列的大约10%。这个区称作突变聚簇区(MCR)。APC基因中已经鉴定出多种类型的突变,包括核苷酸替代(见表III),剪接错误(见表IV),小的缺失(见表V),小的插入(见表VI),小的插入/缺失(见表VII),较大的缺失(见表VIII),较大的插入(见表IX),和复杂重排(见表X)。

研究人员尝试过鉴定粪便样品中带有APC基因突变的细胞(Traverso,G.等,New England Journal of Medicine,Vol 346:311-320,2002)。尽管几乎在全部肿瘤中都发现APC突变,但粪便样品中250细胞中大约1个在APC基因中有突变;排泄到粪便中的大多数细胞是正常细胞。此外,人DNA占粪便样品中发现的总的DNA的大约十亿分之一;大多数DNA是细菌的。Traverso等使用的技术只检测产生截短的蛋白质的突变。

如上文所讨论的,结肠直肠肿瘤形成中涉及APC基因的多种突变。因此,仍然需要高度灵敏的非侵入式检测结肠直肠肿瘤的技术。下面,描述了检测APC基因中两个突变的方法。然而,使用这里描述的方法能分析任何数目的突变。

模板DNA的制备

从含有结肠细胞的样品(包括但不限于粪便样品)纯化模板DNA。应用Ahlquist等描述的方法纯化模板DNA(Gastroenterology,119:1219-1227,2000)。如果粪便样品是冷冻的,则在室温下解冻样品,并且用Exactor粪便摇动器(Exact Laboratories,Maynard,Mass.)匀浆。匀浆之后,将等价于4克粪便的每份样品在2536xg下离心5分钟。样品在16,500xg下第二次离心10分钟。上清液与20微升的RNase酶(0.5mg/ml)在37℃下温育1小时。对于每升用1/10体积的3摩尔乙酸钠和等体积的异丙醇沉淀DNA。在每升5ml的TRIS-EDTA(0.01摩尔Tris/升(pH7.4)和0.001摩尔的EDTA/升)中溶解DNA。

引物设计

为了测定密码子1370处是否存在突变,使用下面的引物:

第一引物:

5′GTGCAAAGGCCTGAATTCCCAGGCACAAAGCTGTTGAA 3′

第二引物:5′TGAAGCGAACTAGGGACTCAGGTGGACTT

第一引物包含5′最末端的生物素标签,和针对限制酶EcoRI的核苷酸序列。第二引物包含针对限制酶BsmF I的核苷酸序列。

为了测定密码子1302处是否存在小的缺失,使用下面的引物:

第一引物:5′GATTCCGTAAACGAATTCAGTTCATTATCATCTTTGTC3′

第二引物:5′CCATTGTTAAGCGGGACTTCTGCTATTTG 3′

第一引物包含5′末端的生物素标签,并且包含针对EcoRI的限制酶识别位点。第二引物包含针对BsmF I的限制酶识别位点。

PCR反应

利用聚合酶链式反应从模板基因组DNA扩增感兴趣的基因座(PCR,美国专利Nos.4,683,195和4,683,202,这里引作参考)。在分开的反应试管中扩增感兴趣的基因座,但是它们也可以在一个PCR反应中一起扩增。为了增强特异性,使用″热-启动″PCR反应,例如使用QIAGEN提供的HotStarTaq Master混合物试剂盒(产品目录号203443)。对于每一个感兴趣的基因座,可以针对每一个反应优化模板DNA和引物的量,但是在本实施例中,使用40ng模板人基因组DNA和5μM的各种引物。进行40个循环的PCR。使用下面的PCR条件:

(1)95℃,15分钟15秒;

(2)37℃,30秒;

(3)95℃,30秒;

(4)57℃,30秒;

(5)95℃,30秒;

(6)64℃,30秒;

(7)95℃,30秒;

(8)将步骤6和7重复39(39)次;

(9)72℃,5分钟。

在第一轮PCR中,退火温度大约是第二引物的3′退火区的解链温度,是37℃。第二轮PCR中的退火温度大约是第一引物的退火到模板DNA上的3′区的解链温度,是57℃。第三轮PCR中的退火温度大约是第二引物的整个序列的解链温度,是64℃。其余循环的退火温度是64℃。在头三轮PCR中将退火温度逐步从TM1升至TM2升至TM3大大提高了特异性。这些退火温度是代表性的,本领域技术人员明白各个循环的退火温度取决于使用的具体引物。

通过尝试各种设置和使用得到最佳结果的参数能优化变性,退火,和延伸的温度和时间。

包含感兴趣的基因座的片段的纯化

从基因组模板DNA分离PCR产物。将每个PCR产物分到从RocheDiagnostics GmbH获得的透明的Streptawell高度-结合板(商品目录号1645 692,如在Roche Molecular Biochemicals,2001生物化学品目录中列出的)的四个分开的反应孔中。第一引物包含5′生物素标签,这样PCR产物与链霉抗生物素蛋白包被的孔结合,而基因组模板DNA则不结合。使用Thermomixer(Eppendorf)以1000rpm在37℃下进行链霉抗生物素结合反应20分钟。对每个孔抽吸去除没有结合的材料,并且在温和混合下用1X PBS清洗三次(Kandpal等,Nucl.Acids Res.18:1789-1795(1990);Kaneoka等,Biotechniques 10:30-34(1991);Green等,Nucl.Acids Res.18:6163-6164(1990))。

或者将PCR产物放到链霉抗生物素板的单一孔中以便在单一孔中进行核苷酸掺入反应。

包含感兴趣的基因座的分离的片段的限制酶消化

用限制酶BsmF I(New England Biolabs商品目录号R0572S)消化纯化的PCR产物,该酶与通过第二引物掺入到PCR产物中的识别位点结合。根据与限制酶一起提供的说明书在Streptawells中进行消化。用合适的限制酶消化之后,用PBS将孔清洗三次以去除裂解的片段。

掺入标记的核苷酸

上述限制酶消化后得到具有5′突出端(其包含感兴趣的基因座)和3′凹端的DNA片段。5′突出端的功能是作为模板,使得在DNA聚合酶的存在下可以掺入一个或多个核苷酸。

对于每个感兴趣的基因座,进行四个独立的补平反应;这四个反应的每一个含有不同的荧光标记的ddNTP(ddATP,ddTTP,ddGTP,或ddCTP)。向各个补平反应加入下面的成分:1微升荧光标记的ddNTP,0.5微升未标记的ddNTPs(40μM)(其含有除了荧光标记的核苷酸之外的所有核苷酸),2微升的10X测序酶缓冲液,0.25微升的测序酶,和20微升反应需要的水。补平反应在40℃下进行10分钟。未荧光标记的ddNTP从Fermentas Inc.(Hanover,MD)购得。所有的其他标记试剂从Amersham(Thermo Sequenase Dye Terminator Cycle Sequencing CoreKit,US 79565)获得。在荧光标记的ddNTPs的存在下,3′凹端延伸一个碱基,其相应于感兴趣的基因座。

对于此补平反应也可以使用标记的ddNTPs和未标记的dNTPs的混合物。″补平反应″条件如上所述,除了使用含有40μM未标记的dNTPs,1微升荧光标记的ddATP,1微升荧光标记的ddTTP,1微升荧光标记的ddCTP,和1微升ddGTP的混合物。从Amersham获得荧光ddNTPs(Thermo Sequenase Dye Terminator Cycle Sequencing Core试剂盒,US79565;Amersham没有公开该荧光核苷酸的浓度)。用限制酶BsmF I消化感兴趣的基因座,产生四个碱基的5′突出端。如果掺入的第一个核苷酸是标记的ddNTP,则3′凹端填入一个碱基,从而可以检测感兴趣的基因座。然而,如果掺入的第一个核苷酸是dNTP,聚合酶继续掺入核苷酸直到填入ddNTP。例如,头两个核苷酸可以填入dNTPs,第三个核苷酸填入ddNTP,这样可以检测到突出端的第三个核苷酸。因此,可以测定整个5′突出端的序列,这增加了从各个SNP或感兴趣的基因座获得的信息。当检测插入,缺失,插入和缺失,重排,和易位时,这种类型的补平反应是特别有用的。

或者,可以使用标记有一种染料的一种核苷酸测定感兴趣的基因座的存在。参见实施例4。这种方法消除了使用具有不同量子系数的不同染料时的任何可能的误差。

标记之后,用1X PBS(100微升)将各个Streptawell洗三次。然后根据与酶一起提供的供应商的说明书通过用限制酶EcoRI消化,从Streptawells释放“经过填补”的DNA片段。以120rpm振荡下在37℃下消化1小时。

感兴趣的基因座的检测

从链霉抗生物素蛋白基质释放之后,将样品加载到36cm 5%丙烯酰胺(尿素)凝胶(BioWhittaker Molecular Applications,Long Ranger Run GelPacks,商品目录号50691)的泳道中。以3000伏电泳3分钟,使样品进入凝胶。使用测序仪(Hoefer SQ3 Sequencer)进行凝胶电泳3小时。通过荧光检测掺入的标记的核苷酸。

当进行分开的补平反应时,为了确定是否有细胞在APC基因的密码子1370处包含突变,分析相应于使用ddATP和ddTTP的补平反应的凝胶泳道。如果只存在正常细胞,则相应于使用ddATP的补平反应的道给出明亮信号。对于使用ddTTP的“补平”反应则检测不到信号。然而,如果患者样品包含在APC基因的密码子1370处带有突变的细胞,则相应于使用ddATP的补平反应的泳道给出明亮信号,并且从相应于使用ddTTP的补平反应的泳道也检测到信号。来自相应于使用ddTTP的补平反应的泳道的信号强度指示了样品中突变细胞的数目。

或者可以使用一种标记的核苷酸测定APC基因的密码子1370处的等位基因序列。在密码子1370处,正常序列是AAA,其编码氨基酸赖氨酸。然而在密码子1370处已经鉴定到核苷酸替代,其与结肠直肠肿瘤相关。具体地说,典型地在密码子1370处发现A变化成T(AAA-TAA),其导致终止密码子。使用标记的ddATP,和未标记的dTTP,dCTP,和dGTP进行单一的补平反应。利用标记有一种荧光染料的单核苷酸来确定编码密码子1370的正常和突变DNA序列的存在。下面描述相关的DNA序列,相应于密码子1370的序列是粗体:

5′CCCAAAAGTCCACCTGA

3′GGGTTTTCAGGTGGACT

用BsmF I消化之后,产生下面的突出端:

5′CCC

3′GGG        T  T  T  T

突出端位置    1  2  3  4

如果患者样品中不存在于密码子1370处带有突变的细胞,则见到相应于掺入标记的ddATP的一个信号。

5′CCC        A*

3′GGG        T  T  T  T

突出端位置    1  2  3  4

然而,如果患者样品中存在APC基因的密码子1370处带有突变的细胞,则将见到相应于在密码子1370处为正常序列的一个信号,和见到相应于在密码子1370处为突变序列的第二信号。由于分子量差异,这些信号可以清楚地得以鉴别。

正常DNA序列的突出端:   CCC

                        GGG  T  T  T  T

突出端位置                   1  2  3  4

填补后正常DNA序列:     CCC  A*

                        GGG  T  T  T  T

突出端位置                   1  2  3  4

突变DNA序列的突出端:   CCC

                        GGG  A  T  T  T

突出端位置                   1  2  3  4

填补后突变的DNA序列:   CCC  T  A*

                        GGG  A  T  T  T

突出端位置                   1  2  3  4

当存在突变等位基因时可见到两个信号。突变的DNA分子在野生型DNA分子之后填入一个碱基。利用以分子量为基础进行分子区别的任何方法可以分离这两个信号。使用一种标记的核苷酸(ddATP)可以检测野生型DNA序列和突变的DNA序列两者的存在。这种标记方法减少了需要进行的反应次数并且使得可以精确定量测定患者样品中突变细胞的数量。利用样品中突变细胞的数目可以确定患者的疾病预后、程度和严重性。这种标记方法排除了使用具有不同的量子系数的不同染料时的复杂情况。这种标记方法还消除了与使用吸液反应相关的误差。

当进行分开的补平反应时,为了测定是否有细胞在APC基因的密码子1302处包含突变,可以分析相应于使用ddTTP和ddCTP的补平反应的凝胶泳道。下面描述正常的DNA序列,密码子1302的编码序列是粗体字。

正常序列:5′ACCCTGCAAATAGCAGAA

          3′TGGGACGTTTATCGTCTT

消化之后,产生下面的5′突出端:

5′ACCC

3′TGGG     A  C  G  T

突出端位置  1  2  3  4

补平反应之后,掺入标记的ddTTP。

5′ACCC     T*

3′TGGG     A  C  G  T

突出端位置  1  2  3  4

典型地编码密码子1302的APC序列的单碱基缺失与结肠直肠癌相关。下面描述突变DNA序列,相关序列是粗体:

突变序列:5′ACCCGCAAATAGCAGAA

          3′TGGGCGTTTATCGTCTT

消化之后:

              5′ACC

              3′TGG      G  C  G  T

              突出端位置  1  2  3  4

填补之后:    5′ACC      C*

              3′TGG      G  C  G  T

              突出端位置  1  2  3  4

如果APC基因中没有突变,对于用ddCTP*的补平反应检测不到信号,但是对于用ddTTP*的补平反应检测到一个明亮信号。然而,如果患者样品中存在APC基因中有突变的细胞,则对于用ddCTP*和ddTTP*的补平反应均可见到信号。

或者,可以使用含有未标记的dNTPs,荧光标记的ddATP,荧光标记的ddTTP,荧光标记的ddCTP,和荧光标记的ddGTP的混合物进行单一补平反应。如果没有缺失,则掺入标记的ddTTP。

5′ACCC     T*

3′TGGG     A  C  G  T

突出端位置  1  2  3  4

然而,如果缺失T,则掺入标记的ddCTP*

5′ACC      C*

3′TGG      G  C  G  T

突出端位置  1  2  3  4

由于缺失胸苷核苷酸故可以通过分子量分开这两个信号。如果存在突变细胞,在相同泳道中产生两个信号,但是两者分开一个碱基对(这个原理在图9D中证明)。缺失引起DNA片段的分子量变化,这使得利用单一补平反应可以检测正常和突变细胞两者的存在。

在上面的实施例中,描述了检测核苷酸替代和小的缺失的方法。然而,该方法可以用于检测任何类型的突变,包括但不限于核苷酸替代(见表III),剪接错误(见表IV),小的缺失(见表V),小的插入(见表VI),小的插入/缺失(见表VII),较大的缺失(见表VIII),较大的插入(见表IX),和复杂重排(见表X)。

另外,上述方法可以用于检测任何类型的疾病,包括但不限于表II中列出的那些。此外,利用这里描述的本发明可以检测任何类型的突变基因,包括但不限于与表II中列出的疾病相关的基因,BRCA1,BRCA2,MSH6,MSH2,MLH1,RET,PTEN,ATM,H-RAS,p53,ELAC2,CDH1,APC,AR,PMS2,MLH3,CYP1A1,GSTP1,GSTM1,AXIN2,CYP19,MET,NAT1,CDKN2A,NQ01,trc8,RAD51,PMS1,TGFBR2,VHL,MC4R,POMC,NROB2,UCP2,PCSK1,PPARG,ADRB2,UCP3,glur1,cart,SORBS1,LEP,LEPR,SIM1,TNF,IL-6,IL-1,IL-2,IL-3,IL1A,TAP2,THPO,THRB,NBS1,RBM15,LIF,MPL,RUNX1,Her-2,糖皮质激素受体,雌激素受体,甲状腺受体,p21,p27,K-RAS,N-RAS,成视网膜细胞瘤蛋白,Wiskott-Aldrich(WAS)基因,因子V Leiden,因子II(凝血酶原),亚甲基四氢叶酸还原酶,囊性纤维化(cystic fibrosis),LDL受体,HDL受体,超氧化物歧化酶基因,SHOX基因,一氧化氮调节中涉及的基因,细胞周期调节中涉及的基因,肿瘤抑制基因,致癌基因,与神经变性相关的基因,与肥胖相关的基因。缩写相应于人类基因突变数据库中列出的蛋白质,这里引作参考(www.archive.uwcm.ac.uk/uwcm;2003年2月12日起有效网址)。

上面的实施例证明从粪便样品可以检测到突变细胞和突变等位基因。然而,这里描述的方法可以用于检测任何生物样品中的突变细胞,包括但不限于血液样品,血清样品,血浆样品,尿样,脊髓液,淋巴液,精液,阴道分泌物,腹水,唾液,粘膜分泌物,腹膜液,粪便样品,身体溢泌物,乳液,肺呼出物,细胞,组织,来自这些来源的含有其核酸的单细胞或提取物,和亚细胞结构例如线粒体或叶绿体。另外,这里描述的方法可以用于检测含有任何数量的核酸的来源中的突变细胞和突变DNA,所述来源包括但不限于法医、食品、考古学、农业或无机样品。

上述实施例涉及检测APC基因中的突变。然而,这里描述的本发明可用于检测与疾病有关或者与疾病易感性有关的任何基因中的突变(见表XI)。

例如,谷胱甘肽S-转移酶P1(GSTP1)启动子的过甲基化作用是前列腺癌中最常见的DNA改变,使用亚硫酸氢钠和这里描述的方法可以测定启动子的甲基化状态。

使用亚硫酸氢钠处理将没有甲基化的胞嘧啶残基转化为尿嘧啶,并且留下甲基化的胞嘧啶不发生改变。利用这里描述的方法,设计第一和第二引物扩增经常被甲基化的GSTP1启动子的区域。下面,给出用亚硫酸氢钠处理之前的GSTP1启动子的区域。

亚硫酸氢钠处理之前:

5′ACCGCTACA

3′TGGCGATCA

下面,给出亚硫酸氢钠处理、PCR扩增和用IIS限制酶BsmF I消化之后的GSTP1启动子区域:

没有甲基化的

5′ACC

3′TGG      U  G  A  T

突出端位置  1  2  3  4

甲基化的

5′ACC

3’TGG      C  G  A  T

突出端位置  1  2  3  4

使用标记的ddATP,未标记的dCTP,dGTP,和dTTP补平5′突出端。产生下面的分子:

没有甲基化的

5′ACC      A*

3′TGG      U  G  A  T

突出端位置  1  2  3  4

甲基化的

5′ACC      G  C  T  A*

3′TGG      C  G  A  T

突出端位置  1  2  3  4

见到两个信号;一个相应于在与突出端互补的位置1填入ddATP的DNA分子(没有甲基化的),另一个相应于在与突出端互补的位置4填入ddATP的DNA分子(甲基化的)。根据分子量分开两个信号。或者,可以在一个反应中使用标记的ddGTP并且在另一个反应中使用标记的ddATP,在分开的反应中进行此补平反应。

这里描述的方法可以用来筛选前列腺癌,还可以用来监测疾病的进程和严重程度。使用单核苷酸检测甲基化的和没有甲基化的序列,不仅允许精确进行定量测定,并且对于甲基化的序列具有高度灵敏性,这对于早期检测疾病是一个有用的工具。

从人类基因突变数据库获得表III-X中的信息。用其中提供的信息,本领域技术人员将明白怎样应用这些方法测定任何基因的等位基因的序列。在下面的网址能发现大量基因和相关的突变:www.archive.uwcm.ac.uk./uwcm。

表III:核苷酸替代

密码子  核苷酸  氨基酸    表型99 CGG-TGG Arg-Trp腺瘤样结肠息肉病121 AGA-TGA Arg-Term腺瘤样结肠息肉病157 TGG-TAG Trp-Term腺瘤样结肠息肉病159 TAC-TAG Tyr-Term腺瘤样结肠息肉病163 CAG-TAG Gln-Term腺瘤样结肠息肉病168 AGA-TGA Arg-Term腺瘤样结肠息肉病171 AGT-ATT Ser-Ile腺瘤样结肠息肉病181 CAA-TAA Gln-Term腺瘤样结肠息肉病190 GAA-TAA Glu-Term腺瘤样结肠息肉病
202 GAA-TAA Glu-Term腺瘤样结肠息肉病208 CAG-CGG Gln-Arg腺瘤样结肠息肉病208 CAG-TAG Gln-Term腺瘤样结肠息肉病213 CGA-TGA Arg-Term腺瘤样结肠息肉病215 CAG-TAG Gln-Term腺瘤样结肠息肉病216 CGA-TGA Arg-Term腺瘤样结肠息肉病232 CGA-TGA Arg-Term腺瘤样结肠息肉病233 CAG-TAG Gln-Term腺瘤样结肠息肉病247 CAG-TAG Gln-Term腺瘤样结肠息肉病267 GGA-TGA Gly-Term腺瘤样结肠息肉病278 CAG-TAG Gln-Term腺瘤样结肠息肉病280 TCA-TGA Ser-Term腺瘤样结肠息肉病280 TCA-TAA Ser-Term腺瘤样结肠息肉病283 CGA-TGA Arg-Term腺瘤样结肠息肉病302 CGA-TGA Arg-Term腺瘤样结肠息肉病332 CGA-TGA Arg-Term腺瘤样结肠息肉病358 CAG-TAG Gln-Term腺瘤样结肠息肉病405 CGA-TGA Arg-Term腺瘤样结肠息肉病414 CGC-TGC Arg-Cys腺瘤样结肠息肉病422 GAG-TAG Glu-Term腺瘤样结肠息肉病423 TGG-TAG Trp-Term腺瘤样结肠息肉病424 CAG-TAG Gln-Term腺瘤样结肠息肉病433 CAG-TAG Gln-Term腺瘤样结肠息肉病443 GAA-TAA Glu-Term腺瘤样结肠息肉病457 TCA-TAA Ser-Term腺瘤样结肠息肉病473 CAG-TAG Gln-Term腺瘤样结肠息肉病486 TAC-TAG Tyr-Term腺瘤样结肠息肉病499 CGA-TGA Arg-Term腺瘤样结肠息肉病500 TAT-TAG Tyr-Term腺瘤样结肠息肉病541 CAG-TAG Gln-Term腺瘤样结肠息肉病553 TGG-TAG Trp-Term腺瘤样结肠息肉病554 CGA-TGA Arg-Term腺瘤样结肠息肉病564 CGA-TGA Arg-Term腺瘤样结肠息肉病577 TTA-TAA Leu-Term腺瘤样结肠息肉病586 AAA-TAA Lys-Term腺瘤样结肠息肉病592 TIA-TGA Leu-Term腺瘤样结肠息肉病593 TGG-TAG Trp-Term腺瘤样结肠息肉病593 TGG-TGA Trp-Term腺瘤样结肠息肉病622 TAC-TAA Tyr-Term腺瘤样结肠息肉病625 CAG-TAG Gln-Term腺瘤样结肠息肉病629 TTA-TAA Leu-Term腺瘤样结肠息肉病650 GAG-TAG Glu-Term腺瘤样结肠息肉病684 TTG-TAG Leu-Term腺瘤样结肠息肉病685 TGG-TGA Trp-Term腺瘤样结肠息肉病
695 CAG-TAG Gln-Term腺瘤样结肠息肉病699 TGG-TGA Trp-Term腺瘤样结肠息肉病699 TGG-TAG Trp-Term腺瘤样结肠息肉病713 TCA-TGA Ser-Term腺瘤样结肠息肉病722 AGT-GGT Ser-Gly腺瘤样结肠息肉病747 TCA-TGA Ser-Term腺瘤样结肠息肉病764 TTA-TAA Leu-Term腺瘤样结肠息肉病784 TCT-ACT Ser-Thr腺瘤样结肠息肉病805 CGA-TGA Arg-Term腺瘤样结肠息肉病811 TCA-TGA Ser-Term腺瘤样结肠息肉病848 AAA-TAA Lys-Term腺瘤样结肠息肉病876 CGA-TGA Arg-Term腺瘤样结肠息肉病879 CAG-TAG Gln-Term腺瘤样结肠息肉病893 GAA-TAA Glu-Term腺瘤样结肠息肉病932 TCA-TAA Ser-Term腺瘤样结肠息肉病932 TCA-TGA Ser-Term腺瘤样结肠息肉病935 TAC-TAG Tyr-Term腺瘤样结肠息肉病935 TAC-TAA Tyr-Term腺瘤样结肠息肉病995 TGC-TGA Cys-Term腺瘤样结肠息肉病997 TAT-TAG Tyr-Term腺瘤样结肠息肉病999 CAA-TAA Gln-Term腺瘤样结肠息肉病1000 TAC-TAA Tyr-Term腺瘤样结肠息肉病1020 GAA-TAA Glu-Term腺瘤样结肠息肉病1032 TCA-TAA Ser-Term腺瘤样结肠息肉病1041 CAA-TAA Gln-Term腺瘤样结肠息肉病1044 TCA-TAA Ser-Term腺瘤样结肠息肉病1045 CAG-TAG Gln-Term腺瘤样结肠息肉病1049 TGG-TGA Trp-Term腺瘤样结肠息肉病1067 CAA-TAA Gln-Term腺瘤样结肠息肉病1071 CAA-TAA Gln-Term腺瘤样结肠息肉病1075 TAT-TAA Tyr-Term腺瘤样结肠息肉病1075 TAT-TAG Tyr-Term腺瘤样结肠息肉病1102 TAC-TAG Tyr-Term腺瘤样结肠息肉病1110 TCA-TGA Ser-Term腺瘤样结肠息肉病1114 CGA-TGA Arg-Term腺瘤样结肠息肉病1123 CAA-TAA Gln-Term腺瘤样结肠息肉病1135 TAT-TAG Tyr-Term腺瘤样结肠息肉病1152 CAG-TAG Gln-Term腺瘤样结肠息肉病1155 GAA-TAA Glu-Term腺瘤样结肠息肉病1168 GAA-TAA Glu-Term腺瘤样结肠息肉病1175 CAG-TAG Gln-Term腺瘤样结肠息肉病1176 CCT-CTT Pro-Leu腺瘤样结肠息肉病1184 GCC-CCC Ala-Pro腺瘤样结肠息肉病1193 CAG-TAG Gln-Term腺瘤样结肠息肉病
1194 TCA-TGA Ser-Term腺瘤样结肠息肉病1198 TCA-TGA Ser-Term腺瘤样结肠息肉病1201 TCA-TGA Ser-Term腺瘤样结肠息肉病1228 CAG-TAG Gln-Term腺瘤样结肠息肉病1230 CAG-TAG Gln-Term腺瘤样结肠息肉病1244 CAA-TAA Gln-Term腺瘤样结肠息肉病1249 TGC-TGA Cys-Term腺瘤样结肠息肉病1256 CAA-TAA Gln-Term腺瘤样结肠息肉病1262 TAT-TAA Tyr-Term腺瘤样结肠息肉病1270 TGT-TGA Cys-Term腺瘤样结肠息肉病1276 TCA-TGA Ser-Term腺瘤样结肠息肉病1278 TCA-TAA Ser-Term腺瘤样结肠息肉病1286 GAA-TAA Glu-Term腺瘤样结肠息肉病1289 TGT-TGA Cys-Term腺瘤样结肠息肉病1294 CAG-TAG Gln-Term腺瘤样结肠息肉病1307 ATA-AAA Ile-Lys结肠直肠癌,易感性相关1309 GAA-TAA Glu-Term腺瘤样结肠息肉病1317 GAA-CAA Glu-Gln结肠直肠癌,易感性1328 CAG-TAG Gln-Term腺瘤样结肠息肉病1338 CAG-TAG Gln-Term腺瘤样结肠息肉病1342 TTA-TAA Leu-Term腺瘤样结肠息肉病1342 TTA-TGA Leu-Term腺瘤样结肠息肉病1348 AGG-TGG Arg-Trp腺瘤样结肠息肉病1357 GGA-TGA Gly-Term腺瘤样结肠息肉病1367 CAG-TAG Gln-Term腺瘤样结肠息肉病1370 AAA-TAA Lys-Term腺瘤样结肠息肉病1392 TCA-TAA Ser-Term腺瘤样结肠息肉病1392 TCA-TGA Ser-Term腺瘤样结肠息肉病1397 GAG-TAG Glu-Term腺瘤样结肠息肉病1449 AAG-TAG Lys-Term腺瘤样结肠息肉病1450 CGA-TGA Arg-Term腺瘤样结肠息肉病1451 GAA-TAA Glu-Term腺瘤样结肠息肉病1503 TCA-TAA Ser-Term腺瘤样结肠息肉病1517 CAG-TAG Gln-Term腺瘤样结肠息肉病1529 CAG-TAG Gln-Term腺瘤样结肠息肉病1539 TCA-TAA Ser-Term腺瘤样结肠息肉病1541 CAG-TAG Gln-Term腺瘤样结肠息肉病1564 TTA-TAA Leu-Term腺瘤样结肠息肉病1567 TCA-TGA Ser-Term腺瘤样结肠息肉病1640 CGG-TGG Arg-Trp腺瘤样结肠息肉病1693 GAA-TAA Glu-Term腺瘤样结肠息肉病1822 GAC-GTC Asp-Val腺瘤样结肠息肉病,相关?2038 CTG-GTG Leu-Val腺瘤样结肠息肉病2040 CAG-TAG Gln-Term腺瘤样结肠息肉病
2566 AGA-AAA Arg-Lys腺瘤样结肠息肉病2621 TCT-TGT Ser-Cys腺瘤样结肠息肉病2839 CTT-TTT Leu-Phe腺瘤样结肠息肉病

            表IV

         核苷酸替代

供体/受体相对位置替代    表型ds-1G-C腺瘤样结肠息肉病as-1G-A腺瘤样结肠息肉病as-1G-C腺瘤样结肠息肉病ds+2T-A腺瘤样结肠息肉病as-1G-C腺瘤样结肠息肉病as-1G-T腺瘤样结肠息肉病as-1G-A腺瘤样结肠息肉病as-2A-C腺瘤样结肠息肉病as-5A-G腺瘤样结肠息肉病ds+3A-C腺瘤样结肠息肉病as-1G-A腺瘤样结肠息肉病ds+1G-A腺瘤样结肠息肉病as-1G-T腺瘤样结肠息肉病ds+1G-A腺瘤样结肠息肉病as-1G-A腺瘤样结肠息肉病ds+1G-A腺瘤样结肠息肉病ds+3A-G腺瘤样结肠息肉病ds+5G-T腺瘤样结肠息肉病as-1G-A腺瘤样结肠息肉病as-6A-G腺瘤样结肠息肉病as-5A-G腺瘤样结肠息肉病as-2A-G腺瘤样结肠息肉病ds+2T-C腺瘤样结肠息肉病as-2A-G腺瘤样结肠息肉病ds+1G-A腺瘤样结肠息肉病ds+1G-T腺瘤样结肠息肉病ds+2T-G腺瘤样结肠息肉病

                    表V:

                 APC的小缺失

粗体指示密码子。小写字母代表缺失。在缺失延伸越过编码区的地方,提供其它位置信息。例如,缩写5’UTR代表5’非翻译区,缩写E6I6指外显子6/内含子6边界。

位置/密码子      缺失    表型77 TTAgataGCAGTAATTT  腺瘤样结肠息肉病97 GGAAGccgggaagGATCTGTATC  腺瘤样结肠息肉病138 GAGAaAGAGAG_E3I3_GTAA  腺瘤样结肠息肉病139 AAAGAgag_E3I3_Gtaacttttct甲状腺癌139 AAAGagag_E3I3_GTAACTTTTC  腺瘤样结肠息肉病142 TTTTAAAAAAaAAAAATAG_I3E4_GTCA  腺瘤样结肠息肉病144 AAAATAG_I3E4_GTCatTGCTTCTTGC  腺瘤样结肠息肉病149 GACAaaGAAGAAAAGG  腺瘤样结肠息肉病149 GACAAagaaGAAAAGGAAA  腺瘤样结肠息肉病155 AGGAA^AAAGActggtATTACGCTCA  腺瘤样结肠息肉病169 AAAAGA^ATAGatagTCTTCCTTTA  腺瘤样结肠息肉病172 AGATAGT^CTTcCTTTAACTGA  腺瘤样结肠息肉病179 TCCTTacaaACAGATATGA  腺瘤样结肠息肉病185 ACCaGAAGGCAATT  腺瘤样结肠息肉病196 ATCAGagTTGCGATGGA  腺瘤样结肠息肉病213 CGAGCaCAG_E5I5_GTAAGTT  腺瘤样结肠息肉病298 CACtcTGCACCTCGA  腺瘤样结肠息肉病329 GATaTGTCGCGAAC  腺瘤样  结肠息肉病365 AAAGActCTGTATTGTT  腺瘤样结肠息肉病397 GACaaGAGAGGCAGG  腺瘤样结肠息肉病427 CATGAacCAGGCATGGA  腺瘤样

  结肠息肉病428 GAACCaGGCATGGACC    腺瘤样  结肠息肉病436 AATCCaa_E9I9_gTATGTTCTCT    腺瘤样  结肠息肉病440 GCTCCtGTTGAACATC    腺瘤样  结肠息肉病455 AAACTtTCATTTGATG    腺瘤样  结肠息肉病455 AAACtttcaTTTGATGAAG    腺瘤样  结肠息肉病472 CTAcAGGCCATTGC    腺瘤样  结肠息肉病472 TAAATTAG_I10E11_GGgGACTACAGGC    腺瘤样  结肠息肉病478 TTATtGCAAGTGGAC    腺瘤样  结肠息肉病486 TACGgGCTTACTAAT    腺瘤样  结肠息肉病494 AGTATtACACTAAGAC    腺瘤样  结肠息肉病495 ATTACacTAAGACGATA    腺瘤样  结肠息肉病497 CTAaGACGATATGC    腺瘤样  结肠息肉病520 TGCTCtaTGAAAGGCTG    腺瘤样  结肠息肉病526 ATGAGagcacttgtgGCCCAACTAA    腺瘤样  结肠息肉病539 GACTTaCAGCAG_E12I12_GTAC    腺瘤样  结肠息肉病560 AAAAAgaCGTTGCGAGA    腺瘤样  结肠息肉病566 GTTGgaagtGTGAAAGCAT    腺瘤样  结肠息肉病570 AAAGCaTTGATGGAAT    腺瘤样  结肠息肉病577 TTAGaagtTAAAAAG_E13I13_GTA    腺瘤样  结肠息肉病584 ACCCTcAAAAGCGTAT    腺瘤样  结肠息肉病591 GCCTtATGGAATTTG    腺瘤样  结肠息肉病608 GCTgTAGATGGTGC    腺瘤样

  结肠息肉病617 GTTggcactcttacttaccGGAGCCAGAC    腺瘤样  结肠息肉病620 CTTACttacCGGAGCCAGA    腺瘤样  结肠息肉病621 ACTTaCCGGAGCCAG    腺瘤样  结肠息肉病624 AGCcaGACAAACACT    腺瘤样  结肠息肉病624 AGCCagacAAACACTTTA    腺瘤样  结肠息肉病626 ACAaacaCTTTAGCCAT    腺瘤样  结肠息肉病629 TTAGCcATTATTGAAA    腺瘤样  结肠息肉病635 GGAGgTGGGATATTA    腺瘤样  结肠息肉病638 ATATtACGGAATGTG    腺瘤样  结肠息肉病639 TTACGgAATGTGTCCA    腺瘤样  结肠息肉病657 AGAgaGAACAACTGT    腺瘤样  结肠息肉病659 TATTTCAG_I14E15_GCaaatcctaagagagAACA ACTGTC    腺瘤样  结肠息肉病660 AACTgtCTACAAACTT    腺瘤样  结肠息肉病665 TTAttACAACACTTA    腺瘤样  结肠息肉病668 CACttAAAATCTCAT    腺瘤样  结肠息肉病673 AGTttgacaatagtCAGTAATGCA    腺瘤样  结肠息肉病768 CACTTaTCAGAAACTT    腺瘤样  结肠息肉病769 TTATcAGAAACTTTT    腺瘤样  结肠息肉病770 TCAGAaACTTTTGACA    腺瘤样  结肠息肉病780 AGTCcCAAGGCATCT    腺瘤样  结肠息肉病792 AAGCaAAGTCTCTAT    腺瘤样  结肠息肉病792 AAGCAaaGTCTCTATGG    腺瘤样

  结肠息肉病793 CAAAgTCTCTATGGT    腺瘤样  结肠息肉病798 GATTatGTTTTTGACA    腺瘤样  结肠息肉病802 GACACcaatcgacatGATGATAATA    腺瘤样  结肠息肉病805 CGACatGATGATAATA    腺瘤样  结肠息肉病811 TCAGacaaTTTTAATACT    腺瘤样  结肠息肉病825 TATtTGAATACTAC    腺瘤样  结肠息肉病827 AATAcTACAGTGTTA    腺瘤样  结肠息肉病830 GTGTTacccagctcctctTCATCAAGAG    腺瘤样  结肠息肉病833 AGCTCcTCTTCATCAA    腺瘤样  结肠息肉病836 TCATcAAGAGGAAGC    腺瘤样  结肠息肉病848 AAAGAtaGAAGTTTGGA    腺瘤样  结肠息肉病848 AAAGatagaagTTTGGAGAGA    腺瘤样  结肠息肉病855 GAACgCGGAATTGGT    腺瘤样  结肠息肉病856 CGCGgaattGGTCTAGGCA    腺瘤样  结肠息肉病856 CGCGgAATTGGTCTA    腺瘤样  结肠息肉病879 CAGaTCTCCACCAC    腺瘤样  结肠息肉病902 GAAGAcagaAGTTCTGGGT    腺瘤样  结肠息肉病907 GGGTcTACCACTGAA    腺瘤样  结肠息肉病915 GTGACaGATGAGAGAA    腺瘤样  结肠息肉病929 CATACacatTCAAACACTT    腺瘤样  结肠息肉病930 ACACAttcaAACACTTACA    腺瘤样  结肠息肉病931 CATtCAAACACTTA    腺瘤样

  结肠息肉病931 CATTcAAACACTTAC    腺瘤样  结肠息肉病933 AACacttACAATTTCAC    腺瘤样  结肠息肉病935 TACAatttcactAAGTCGGAAA    腺瘤样  结肠息肉病937 TTCActaaGTCGGAAAAT    腺瘤样  结肠息肉病939 AAGtcggAAAATTCAAA    腺瘤样  结肠息肉病946 ACATgTTCTATGCCT    腺瘤样  结肠息肉病954 TTAGaaTACAAGAGAT    腺瘤样  结肠息肉病961 AATgATAGTTTAAA    腺瘤样  结肠息肉病963 AGTTTaAATAGTGTCA    腺瘤样  结肠息肉病964 TTAaataGTGTCAGTAG    腺瘤样  结肠息肉病973 TATGgTAAAGAGGT    腺瘤样  结肠息肉病974 GGTAAaAGAGGTCAAA    腺瘤样  结肠息肉病975 AAAAgaGGTCAAATGA  甲状腺癌992 AGTAAgTTTTGCAGTT  甲状腺癌993 AAGttttgcagttaTGGTCAATAC    腺瘤样  结肠息肉病999 CAAtacccagCCGACCTAGC    腺瘤样  结肠息肉病1023 ACACcAATAAATTAT    腺瘤样  结肠息肉病1030 AAAtATTCAGATGA    腺瘤样  结肠息肉病1032 TCAGatgagCAGTTGAACT    腺瘤样  结肠息肉病1033 GATGaGCAGTTGAAC    腺瘤样  结肠息肉病1049 TGGGcAAGACCCAAA    腺瘤样  结肠息肉病1054 CACAtaataGAAGATGAAA    腺瘤样  结肠息肉病1055 ATAAtagaaGATGAAATAA    腺瘤样

结肠息肉病1056 ATAGAaGATGAAATAA    腺瘤样  结肠息肉病1060 ATAAAacaaaGTGAGCAAAG    腺瘤样  结肠息肉病1061 AAAcaaaGTGAGCAAAG    腺瘤样  结肠息肉病1061 AAACaaAGTGAGCAAA    腺瘤样  结肠息肉病1062 CAAAgtgaGCAAAGACAA    腺瘤样  结肠息肉病1065 CAAAGacAATCAAGGAA    腺瘤样  结肠息肉病1067 CAAtcaaGGAATCAAAG    腺瘤样  结肠息肉病1071 CAAAgtACAACTTATC    腺瘤样  结肠息肉病1079 ACTGagAGCACTGATG    腺瘤样  结肠息肉病1082 ACTGAtgATAAACACCT    腺瘤样  结肠息肉病1084 GATaaacACCTCAAGTT    腺瘤样  结肠息肉病1086 CACCtcAAGTTCCAAC    腺瘤样  结肠息肉病1093 TTTGgACAGCAGGAA    腺瘤样  结肠息肉病1098 TGTgtTTCTCCATAC    腺瘤样  结肠息肉病1105 CGGgGAGCCAATGG  甲状腺癌1110 TCAGAaACAAATCGAG    腺瘤样  结肠息肉病1121 ATTAAtcaaAATGTAAGCC    腺瘤样  结肠息肉病1131 CAAgAAGATGACTA    腺瘤样  结肠息肉病1134 GACTAtGAAGATGATA    腺瘤样  结肠息肉病1137 GATgataaGCCTACCAAT    腺瘤样  结肠息肉病1146 CGTTAcTCTGAAGAAG    腺瘤样  结肠息肉病1154 GAAGaagaaGAGAGACCAA    腺瘤样  结肠息肉病

1155 GAAGaagaGAGACCAACA  腺瘤样结肠息肉病1156 GAAgagaGACCAACAAA  腺瘤样结肠息肉病1168 GAAgagaaACGTCATGTG  腺瘤样结肠息肉病1178 GATTAtagtttaAAATATGCCA  腺瘤样结肠息肉病1181 TTAAaATATGCCACA  腺瘤样结肠息肉病1184 GCCacagaTATTCCTTCA  腺瘤样结肠息肉病1185 ACAgaTATTCCTTCA  腺瘤样结肠息肉病1190 TCACAgAAACAGTCAT  腺瘤样结肠息肉病1192 AAAcaGTCATTTTCA  腺瘤样结肠息肉病1198 TCAaaGAGTTCATCT  腺瘤样结肠息肉病1207 AAAAcCGAACATATG  腺瘤样结肠息肉病1208 ACCgaacATATGTCTTC  腺瘤样结肠息肉病1210 CATatGTCTTCAAGC  腺瘤样结肠息肉病1233 CCAAGtTCTGCACAGA  腺瘤样结肠息肉病1249 TGCAaaGTTTCTTCTA  腺瘤样结肠息肉病1259 ATAcaGACTTATTGT  腺瘤样结肠息肉病1260 CAGACttATTGTGTAGA  腺瘤样结肠息肉病1268 CCAaTATGTTTTTC  腺瘤样结肠息肉病1275 AGTtCATTATCATC  腺瘤样结肠息肉病1294 CAGGAaGCAGATTCTG  腺瘤样结肠息肉病1301 ACCCtGCAAATAGCA  腺瘤样结肠息肉病1306 GAAAtaaaAGAAAAGATT  腺瘤样结肠息肉病

1307 ATAaAAGAAAAGAT  腺瘤样结肠息肉病1308 AAAgaaaAGATTGGAAC  腺瘤样结肠息肉病1308 AAAGAaaagaTTGGAACTAG  腺瘤样结肠息肉病1318 GATCcTGTGAGCGAA  腺瘤样结肠息肉病1320 GTGAGcGAAGTTCCAG  腺瘤样结肠息肉病1323 GTTCcAGCAGTGTCA  腺瘤样结肠息肉病1329 CACCctagaaccAAATCCAGCA  腺瘤样结肠息肉病1336 AGACtgCAGGGTTCTA  腺瘤样结肠息肉病1338 CAGgGTTCTAGTTT  腺瘤样结肠息肉病1340 TCTAgTTTATCTTCA  腺瘤样结肠息肉病1342 TTATcTTCAGAATCA  腺瘤样结肠息肉病1352 GTTgAATTTTCTTC  腺瘤样结肠息肉病1361 CCCTcCAAAAGTGGT  腺瘤样结肠息肉病1364 AGTggtgCTCAGACACC  腺瘤样结肠息肉病1371 AGTCCacCTGAACACTA  腺瘤样结肠息肉病1372 CCACCtGAACACTATG  腺瘤样结肠息肉病1376 TATGttCAGGAGACCC  腺瘤样结肠息肉病1394 GATAgtTTTGAGAGTC  腺瘤样结肠息肉病1401 ATTGCcAGCTCCGTTC  腺瘤样结肠息肉病1415 AGTGGcATTATAAGCC  腺瘤样结肠息肉病1426 AGCCcTGGACAAACC  腺瘤样结肠息肉病1427 CCTGGaCAAACCATGC  腺瘤样结肠息肉病

1431 ATGCcACCAAGCAGA  腺瘤样结肠息肉病1454 AAAAAtAAAGCACCTA  腺瘤样结肠息肉病1461 GAAaAGAGAGAGAG  腺瘤样结肠息肉病1463 AGAgagaGTGGACCTAA  腺瘤样结肠息肉病1464 GAGAgTGGACCTAAG  腺瘤样结肠息肉病1464 GAGAgtGGACCTAAGC  腺瘤样结肠息肉病1464 GAGagTGGACCTAAG  腺瘤样结肠息肉病1492 GCCaCGGAAAGTAC  腺瘤样结肠息肉病1493 ACGGAaAGTACTCCAG  腺瘤样结肠息肉病1497 CCAgATGGATTTTC  腺瘤样结肠息肉病1503 TCAtccaGCCTGAGTGC  腺瘤样结肠息肉病1522 TTAagaataaTGCCTCCAGT  腺瘤样结肠息肉病1536 GAAACagAATCAGAGCA  腺瘤样结肠息肉病1545 TCAAAtgaaaACCAAGAGAA  腺瘤样结肠息肉病1547 GAAaACCAAGAGAA  腺瘤样结肠息肉病1550 GAGAaagaGGCAGAAAAA  腺瘤样结肠息肉病1577 GAATgtATTATTTCTG  腺瘤样结肠息肉病1594 CCAGCcCAGACTGCTT  腺瘤样结肠息肉病1596 CAGACtGCTTCAAAAT  腺瘤样结肠息肉病1823 TTCAaTGATAAGCTC  腺瘤样结肠息肉病1859 AATGAttctTTGAGTTCTC  腺瘤样结肠息肉病1941 CCAGAcagaGGGGCAGCAA带形纤维瘤1957 GAAaATACTCCAGT  腺瘤样

结肠息肉病1980 AACaATAAAGAAAA  腺瘤样结肠息肉病1985 GAACCtATCAAAGAGA  腺瘤样结肠息肉病1986 CCTaTCAAAGAGAC  腺瘤样结肠息肉病1998 GAACcAAGTAAACCT  腺瘤样结肠息肉病2044 AGCTCcGCAATGCCAA  腺瘤样结肠息肉病2556 TCATCccttcctcGAGTAAGCAC  腺瘤样结肠息肉病2643 CTAATttatCAAATGGCAC  腺瘤样结肠息肉病

           表VI:

         小的插入

密码子插入  表型157T腺瘤样结肠息肉病170AGAT腺瘤样结肠息肉病172T腺瘤样结肠息肉病199G腺瘤样结肠息肉病243AG腺瘤样结肠息肉病266T腺瘤样结肠息肉病357A腺瘤样结肠息肉病405C腺瘤样结肠息肉病413T腺瘤样结肠息肉病416A腺瘤样结肠息肉病457G腺瘤样结肠息肉病473A腺瘤样结肠息肉病503ATTC腺瘤样结肠息肉病519C腺瘤样结肠息肉病528A腺瘤样结肠息肉病561A腺瘤样结肠息肉病608A腺瘤样结肠息肉病620CT腺瘤样结肠息肉病621A腺瘤样结肠息肉病623TTAC腺瘤样结肠息肉病627A腺瘤样结肠息肉病629A腺瘤样结肠息肉病636GT腺瘤样结肠息肉病639A腺瘤样结肠息肉病
704T腺瘤样结肠息肉病740ATGC腺瘤样结肠息肉病764T腺瘤样结肠息肉病779TT腺瘤样结肠息肉病807AT腺瘤样结肠息肉病827AT腺瘤样结肠息肉病831A腺瘤样结肠息肉病841CTTA腺瘤样结肠息肉病865CT腺瘤样结肠息肉病865AT腺瘤样结肠息肉病900TG腺瘤样结肠息肉病921G腺瘤样结肠息肉病927A腺瘤样结肠息肉病935A腺瘤样结肠息肉病936C腺瘤样结肠息肉病975A腺瘤样结肠息肉病985T腺瘤样结肠息肉病997A腺瘤样结肠息肉病1010TA腺瘤样结肠息肉病1085C腺瘤样结肠息肉病1085AT腺瘤样结肠息肉病1095A腺瘤样结肠息肉病1100GTTT腺瘤样结肠息肉病1107GGAG腺瘤样结肠息肉病1120G腺瘤样结肠息肉病1166A腺瘤样结肠息肉病1179T腺瘤样结肠息肉病1187A腺瘤样结肠息肉病1211T腺瘤样结肠息肉病1256A腺瘤样结肠息肉病1265T腺瘤样结肠息肉病1267GATA腺瘤样结肠息肉病1268T腺瘤样结肠息肉病1301A腺瘤样结肠息肉病1301C腺瘤样结肠息肉病1323A腺瘤样结肠息肉病1342T腺瘤样结肠息肉病1382T腺瘤样结肠息肉病1458GTAG腺瘤样结肠息肉病1463AG腺瘤样结肠息肉病1488T腺瘤样结肠息肉病1531A腺瘤样结肠息肉病1533T腺瘤样结肠息肉病1554A腺瘤样结肠息肉病
1555A腺瘤样结肠息肉病1556T腺瘤样结肠息肉病1563GACCT腺瘤样结肠息肉病1924AA带形纤维瘤

表VII:小的插入/缺失

位置/密码子    缺失  插入    表型538 GAAGAcTTACAGCAGG gaa腺瘤样结肠息肉病620 CTTACttaCCGGAGCCAG ct腺瘤样结肠息肉病728 AATctcatGGCAAATAGG Ttgcagctttaa腺瘤样结肠息肉病971 GATGgtTATGGTAAAA taa腺瘤样结肠息肉病

                                表VIII:

                               较大的缺失

2kb,包括外显子11腺瘤样结肠息肉病3kb I10E11-1.5kb至I12E13-170bp腺瘤样结肠息肉病335bp nt.1409-1743ex.11-13腺瘤样结肠息肉病6kb,包括ex.14腺瘤样结肠息肉病817bp I13E14-679至I13E14+138腺瘤样结肠息肉病ex.11-15M腺瘤样结肠息肉病ex.11-3′UTR腺瘤样结肠息肉病ex.15A-ex.15F腺瘤样结肠息肉病ex.4腺瘤样结肠息肉病ex.7,8和9腺瘤样结肠息肉病ex.8至超出ex.15F腺瘤样结肠息肉病ex.8-ex.15F腺瘤样结肠息肉病ex.9腺瘤样结肠息肉病>10mb(del 5q22)腺瘤样结肠息肉病

            表IX:

    较大的插入和复制

描述    表型插入14bp nt.3816腺瘤样结肠息肉病
    插入22bp nt.4022腺瘤样结肠息肉病    复制43bp cd.1295腺瘤样结肠息肉病    插入337bp的Alu I序列.cd.1526带状纤维瘤

                                表X:

                        复杂重排(包括倒位)

A-T nt.4893 Q1625H,Del C nt.4897 cd.1627腺瘤样结肠息肉病Del 1099bp I13E14-728至E14I14+156,ins 126bp腺瘤样结肠息肉病Del 1601bp E14I14+27至E14I14+1627,ins 180bp腺瘤样结肠息肉病Del 310bp,ins.15 bp nt.4394,cd 1464腺瘤样结肠息肉病Del A和T cd.1395腺瘤样结肠息肉病Del TC nt.4145,Del TGT nt.4148腺瘤样结肠息肉病Del.T,nt.983,Del.70 bp,nt.985腺瘤样结肠息肉病Del.nt.3892-3903,ins ATTT腺瘤样结肠息肉病

   表XI:

 诊断应用

癌症类型标记应用参考乳房Her2/Neu检测-密码子655处的多态性(GTC/缬氨酸至ATC/异亮氨酸[Val(655)Ile])利用这里描述的方法,设计第二引物,使得PCR及用限制酶消化之后,产生包含针对Her2/Neu的密码子655的DNA序列的5′突出端。Her2/Neu作为乳房癌症的可能标记物能被检测并定量测定。即使在突变等位基因占总DNA的一小部分时,这里描述的方法也能检测突变等位基因和正常等位基因两者。对于乳房癌的Herceptin治疗以对Her2的筛选为基础。能越早检测到突变等位基因,即可以提供越快的治疗。D.Xie等,J.Natl.CancerInstitute,92,412(2000)K.S.Wilson等,Am.J.Pathol.,161,1171(2002)L.Newman,Cancer Control,9,473(2002)乳房/卵巢BRCA1的过甲基化这里描述的方法能用来区别由遗传BRCA1突变产生的肿瘤和由非遗传的基因异常甲基化作用产生的肿瘤M.Esteller等,New England JnlMed.,344,539(2001)
膀胱尿,血清和血浆中游离肿瘤DNA的微卫星分析这里描述的方法能用于检测膀胱癌的微卫星分析和FGFR3突变分析。这里描述的方法提供检测膀胱癌的非侵入式方法  W.G.Bas等,  Clinical Cancer  Res.,9,257  (2003)  M.Utting等,  Clinical Cancer  Res.,  8,35(2002)  L.Mao,  D.Sidransky等  Science,271,  669(1996)来自痰的DNA的微卫星分析这里描述的方法可以用来检测痰样品中的突变,并且能大大增强临床前肺癌筛选的准确性  T.Liloglou等,  Cancer  Research,61,  1624,(2001)  M.Tockman等,  Cancer Control,  7,19(2000)  Field等Cancer  Research,59,  2690,(1999)子宫颈HPV基因型分析这里描述的方法能用于从子宫颈涂布标本检测HPV基因型  N.Munoz等,  New England Jnl  Med.,  348,518(2003)头和颈脱落的口腔粘膜细胞中肿瘤特异性改变(微卫星标记)这里描述的方法能用来检测与头颈鳞状细胞癌(HNSCC)相关的23个微卫星标记物之任一  M.Spafford等,  Clinical Cancer  Research,17,607  (2001)  A.El-Naggar等,  J.Mol.Diag,3,  164(2001)结肠直肠筛选K-ras2和APC基因中的突变这里描述的方法能用来检测K-ras2突变,其能用作结肠直肠癌的预后指标APC(见实施例5)  B.Ryan等,Gut,  52,101(2003)
前列腺GSTP1过甲基化作用这里描述的方法能用来检测前列腺癌患者尿液中的GSTP1过甲基化;这可能比PSA是更准确的指标P.Cairns等,Clin.Can.Res.7,2727(2001)

 HIV

抗逆转录病毒抗性对个体筛选HIV病毒中的突变-例如154V突变或CCR5Δ32等位基因这里描述的方法能用来检测HIV病毒中的突变。在以抗性筛选为基础接受抗逆转录病毒治疗的个体中治疗结果将得以改善J Durant等,TheLancet,353,2195(1999)

心脏病学

充血性心力衰竭β1和α2c肾上腺素能受体的协同多态性这里描述的方法能用来对这些基因座进行基因型分型,并且可以帮助鉴定有较高心力衰竭危险的人K.Small等,New Eng.Jnl.Med.,347,1135(2002)

现在完全描述了本发明,本领域技术人员明白可使用宽范围的等价条件,参数等实施本发明,而不影响本发明及其任何实施方案的精神和范围。

这里引述的所有的文献,例如,科学出版物,专利和专利申请在这里全文引作参考,就如同单独具体指明各个文献全文引作参考一样。当引述的文献只提供了文献的第一页的情况下,整个文献意在包括文献的其余页。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号