首页> 中国专利> 应用同源重组定向克隆和亚克隆的方法和组合物

应用同源重组定向克隆和亚克隆的方法和组合物

摘要

本发明涉及应用细菌重组酶介导的同源重组技术进行DNA亚克隆的方法和组合物。本发明涉及克隆的方法,含有用作克隆载体的多核苷酸的组合物,含有所述多核苷酸组合物的细胞,以及由细菌重组酶介导的克隆试剂盒,所述重组酶如RecE/T和Redα/β。

著录项

  • 公开/公告号CN1373803A

    专利类型发明专利

  • 公开/公告日2002-10-09

    原文格式PDF

  • 申请/专利权人 欧洲分子生物学实验室;

    申请/专利号CN00812739.5

  • 申请日2000-07-10

  • 分类号C12N15/10;C12N15/90;

  • 代理机构72001 中国专利代理(香港)有限公司;

  • 代理人张广育;姜建成

  • 地址 德国海德堡

  • 入库时间 2023-12-17 14:23:40

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-23

    未缴年费专利权终止 IPC(主分类):C12N15/10 授权公告日:20090318 终止日期:20190710 申请日:20000710

    专利权的终止

  • 2009-03-18

    授权

    授权

  • 2002-12-25

    实质审查的生效

    实质审查的生效

  • 2002-10-09

    公开

    公开

  • 2002-09-18

    实质审查的生效

    实质审查的生效

说明书

                   1.概述

本发明涉及应用细菌重组酶介导的同源重组技术进行DNA克隆和亚克隆的方法和组合物。在一个具体实施方案中,应用RecE/T或Redα/β重组酶,或任何功能等价系统启动细菌同源重组,如来自噬菌体P22的erf。具体地说,本发明涉及克隆方法,诊断方法,含有用作克隆载体的多核苷酸的组合物,含有所述多核苷酸组合物的细胞,以及由RecE/T和Redα/β介导的克隆试剂盒。

                   2.发明背景

在大肠杆菌中进行DNA克隆和亚克隆是分子生物学的基础。DNA克隆是指一个过程,其中一个复制起点操作性连接于双链DNA片段,并在大肠杆菌或其他适宜宿主中扩增。DNA亚克隆也是指一个过程,其中双链DNA片段取自一个业已扩增的DNA分子,所述扩增可以在体外进行,如通过PCR,也可在体内进行,如在大肠杆菌或其他适宜宿主中扩增,然后将该DNA片段操作性连接于复制起点。在大肠杆菌中进行的典型克隆和亚克隆是将DNA片段的末端与线性化载体末端连接,所述载体包括大肠杆菌的复制起点和可选择标记。载体包括的可选择标记可以确保新克隆的产物、含有插入片段的质粒在导入其宿主细胞大肠杆菌时,可以保留并扩增。

传统的克隆方法具有某些局限性。例如,因为传统的克隆方法需要应用限制性酶,因此DNA片段的选择就受到一定限制,即目标DNA区域内必须有限制性酶的识别位点。限制性位点必须使酶切位于所需DNA片段之外,而不能存在其中。由于绝大多数有用的限制性酶发挥作用相当频繁,因此所得线性DNA片段的大小也受到限制。

应用聚合酶链反应(PCR)产生DNA片段是传统亚克隆的第二个主要缺陷。PCR产物的末端不能用于连接反应,因为耐热聚合酶在扩增的PCR产物3’末端添加了非模板核苷酸。而且,应用PCR还具有突变的高风险。因此,分子生物学家正在寻求新的更加有效的克隆DNA片段的方法,特别是当这些片段比通过传统的限制性酶或PCR方法所能获得的片段长时。

同源重组是克隆和亚克隆DNA片段的另一种替代方法。在含有宿主同源重组系统的大肠杆菌中亚克隆PCR产物的方法业已有述(Olineret al.,1993,Nucleic Acids Res.21:5192-97;Bubeck et al.,1993,Nucl.Acids.Res.21:3601-3602)。在这些方法中,用于扩增目标DNA片段的PCR引物,被设计为含有的末端序列与线性化的载体末端序列同源。然后将PCR产物和线性化载体导入大肠杆菌。在大肠杆菌宿主细胞中进行的同源重组使PCR产物序列插入到质粒载体中。尽管这些方法业已显示可以用于亚克隆PCR片段,但它们还没有用于亚克隆较长的DNA片段,或者克隆任何大小的DNA片段。

另一种描述的体内亚克隆方法是应用两个线性DNA分子转化大肠杆菌sbcBC宿主细胞,这两个DNA分子中的一个具有复制起点,两个分子在其末端都有较长的同源区域。同源重组在体内发生,导致新形成的质粒的环化和增殖(Degryse,1996,Gene 170:45)。然后,大肠杆菌sbcBC宿主细胞介导同源重组的这种能力,又用于亚克隆来自腺病毒和疱疹病毒基因组DNAs的大型DNA片段(Chartier et al.,1996,J.Virol.70:4805;Messerle,et al.,1997,Proc.Natl.Acad.Sci.USA 94,14759-14763;He,1998,Proc.Natl.Acad.Sci.USA 95:2509-2514)。如其所述,通过在大肠杆菌sbcBC宿主细胞中进行同源重组需要至少两个预先准备的亚克隆步骤,使较长的同源区域位于大肠杆菌复制起点的两侧。而且,还没有文献表明可以在大肠杆菌sbcBC菌株中进行DNA克隆。

最近,由RecE/RecT(RecE/T)或Redα/Redβ(Redα/β)介导的同源重组业已显示可以用于在大肠杆菌中制备DNA分子(Zhang et al.,1998,Nature Genetics,20,123-128;Muyrers et al.,1999,Nucleic AcidsRes.27:1555-1557)。这些文献显示,在大肠杆菌中,任何完整独立的复制,环状DNA分子都可通过RecE/T或Redα/β介导的重组来改变,该重组应用线性DNA,该线性DNA分子的侧翼短区域序列与环状分子的对应区域一致。通过同源重组技术将线性DNA分子整合到环状分子中,使其侧翼序列间的序列置换环状DNA分子的相应序列。

本文引用的文献不应理解为这就是本发明的现有技术。

                    3.发明概述

本发明提供应用细菌重组酶介导的同源重组进行DNA克隆和亚克隆的方法和组合物。细菌重组酶优选RecE/T和/或Redα/β。这些方法可以用来克隆、亚克隆、增殖和扩增目标多核苷酸或多核苷酸混合物,使用包括与目标指定靶DNA序列侧翼序列同源的DNA短区域和一个复制起点的载体。

在一个实施方案中,本发明提供了一种将双链靶DNA导入载体的方法,包括培养表达功能性重组酶的细菌,所述细菌包括(a)靶DNA,含有第一个双链末端和第二个双链末端,以及(b)载体DNA,在载体DNA链上以下述顺序含有:(i)第一个双链同源臂(ii)复制起点,以及(iii)第二个双链同源臂,这样,载体DNA链的第一个同源臂序列与靶DNA链的第一个末端序列同源,载体DNA链的第二个同源臂序列与靶DNA链的第二个末端序列同源,这样,靶DNA可以在同源臂之间插入载体DNA中。

在另一个实施方案中,提供了制备同源DNA分子的方法,包括:a)将双链载体导入细胞,所述细胞含有双链靶DNA,并表达细菌重组酶,所述载体含有一个复制起点和两个同源臂,在载体DNA链上,从5’到3’,以下述顺序存在:第一个同源臂,复制起点的一条链,以及第二个同源臂;所述靶DNA含有一个靶DNA序列和两个末端,在靶DNA链上,从3’到5’,以下述顺序存在:第一个末端,靶DNA序列,以及第二个末端,这样载体DNA链上的第一个同源臂序列与靶DNA链上的第一个末端序列同源,载体DNA链上的第二个同源臂序列与靶DNA链上的第二个末端序列同源;以及b)将细胞置于可以发生细胞内同源重组的条件下。

在另一个实施方案中,提供了制备同源DNA分子的方法,包括:a)将双链载体以及第一个、第二个双链寡核苷酸导入细胞,所述细胞含有双链靶DNA,并表达细菌重组酶,所述载体含有一个复制起点和两个同源臂,在载体DNA链上,从5’到3’,以下述顺序存在:第一个同源臂,复制起点,以及第二个同源臂;所述靶DNA含有一个靶DNA序列和两个末端,在靶DNA链上,从3’到5’:第一个末端,靶DNA序列,以及第二个末端;所述第一个寡核苷酸含有第一个寡核苷酸DNA链,该链以下述顺序,从3’到5’含有:第一个核苷酸序列和第二个核苷酸序列,所述第一个核苷酸序列与载体DNA链上的第一个同源臂的核苷酸序列同源,第二个核苷酸序列与靶DNA链的第一个末端核苷酸序列同源;所述第二个寡核苷酸含有第二个寡核苷酸链,该链以下述顺序,从3’到5’含有:第三个核苷酸序列和第四个核苷酸序列,所述第三个核苷酸序列与载体DNA链上的第二个同源臂的核苷酸序列同源,第四个核苷酸序列与靶DNA链的第二个末端核苷酸序列同源;以及b)将细胞置于可以发生细胞内同源重组的条件下。

在另一个实施方案中,提供了制备同源DNA分子的方法,包括:a)将双链靶DNA分子导入细胞,所述细胞含有一个载体,并表达细菌重组酶,所述靶DNA含有一个靶DNA序列和两个双链末端,在靶DNA链上,从3’到5’,以下述顺序存在:第一个末端,靶DNA序列,以及第二个末端;所述载体含有一个复制起点和两个同源臂,在载体DNA链上,从5’到3’,以下述顺序存在:第一个同源臂,复制起点,以及第二个同源臂;这样载体DNA链上的第一个同源臂序列与靶DNA链上的第一个末端序列同源,载体DNA链上的第二个同源臂序列与靶DNA链上的第二个末端序列同源;以及b)将细胞置于可以发生细胞内同源重组的条件下。

在另一个实施方案中,提供了制备同源DNA分子的方法,包括:a)将双链靶DNA分子以及第一个、第二个双链寡核苷酸导入细胞,所述细胞含有一个载体,并表达细菌重组酶,所述靶DNA含有一个靶DNA序列和两个末端,在靶DNA链上,从3’到5’,以下述顺序存在:第一个末端,靶DNA序列,以及第二个末端;所述第一个寡核苷酸含有第一个寡核苷酸DNA链,该链以下述顺序,从3’到5’含有:第一个核苷酸序列和第二个核苷酸序列,所述第一个核苷酸序列与载体DNA链上的第一个同源臂的核苷酸序列同源,第二个核苷酸序列与靶DNA链的第一个末端核苷酸序列同源;所述第二个寡核苷酸含有第二个寡核苷酸链,该链以下述顺序,从3’到5’含有:第三个核苷酸序列和第四个核苷酸序列,所述第三个核苷酸序列与载体DNA链上的第二个同源臂的核苷酸序列同源,第四个核苷酸序列与靶DNA链的第二个末端核苷酸序列同源;所述载体含有一个复制起点和两个同源臂,在载体DNA链上,从5’到3’,以下述顺序存在:第一个同源臂,复制起点,以及第二个同源臂;以及b)将细胞置于可以发生细胞内同源重组的条件下。

在另一个实施方案中,提供了制备同源DNA分子的方法,包括:a)将双链载体和双链靶DNA导入表达细菌重组酶的细胞,所述载体含有一个复制起点和两个同源臂,在载体DNA链上,从5’到3’,以下述顺序存在:第一个同源臂,复制起点,以及第二个同源臂;所述靶DNA含有一个靶DNA序列和两个末端,在靶DNA链上,从3’到5’,以下述顺序存在:第一个末端,靶DNA序列,以及第二个末端;这样载体DNA链上的第一个同源臂序列与靶DNA链上的第一个末端序列同源,载体DNA链上的第二个同源臂序列与靶DNA链上的第二个末端序列同源;以及b)将细胞置于可以发生细胞内同源重组的条件下。

在该方法的一个特定实施方案中,宿主细胞还包括一个核苷酸序列,该序列编码一个与启动子操作性相连的位点特异性重组酶,载体还包括位点特异性重组酶识别的第一个、第二个识别位点,第一个识别位点位于第一个和第二个同源臂外部,第二个位点特异性重组酶识别位点位于第一个和第二个同源臂内部;在步骤b)进行期间或之后,诱导位点特异性重组酶的表达。

在该方法的另一个特定实施方案中,宿主细胞还包括一个核苷酸序列,该序列编码一个与启动子操作性相连的位点特异性重组酶,载体还包括一个位点特异性重组酶识别位点,该位点位于第一个和第二个同源臂内部;在步骤b)进行期间或之后,诱导位点特异性重组酶的表达。

在另一个实施方案中,提供了制备同源DNA分子的方法,包括:a)将双链载体,双链靶DNA分子,以及第一个、第二个双链寡核苷酸导入表达细菌重组酶的细胞,所述载体含有一个复制起点和两个双链同源臂,在载体DNA链上,从5’到3’,以下述顺序存在:第一个同源臂,复制起点,以及第二个同源臂;所述靶DNA含有一个靶DNA序列和两个双链末端,在靶DNA链上,从3’到5’,以下述顺序存在:第一个末端,靶DNA序列,以及第二个末端;所述第一个寡核苷酸含有第一个寡核苷酸DNA链,该链以下述顺序,从3’到5’含有:第一个核苷酸序列和第二个核苷酸序列,所述第一个核苷酸序列与载体DNA链上的第一个同源臂的核苷酸序列同源,第二个核苷酸序列与靶DNA链的第一个末端核苷酸序列同源;所述第二个寡核苷酸含有第二个寡核苷酸链,该链以下述顺序,从3’到5’含有:第三个核苷酸序列和第四个核苷酸序列,所述第三个核苷酸序列与载体DNA链上的第二个同源臂的核苷酸序列同源,第四个核苷酸序列与靶DNA链的第二个末端核苷酸序列同源;以及b)将细胞置于可以发生细胞内同源重组的条件下。

在该方法的一个特定实施方案中,宿主细胞还包括一个核苷酸序列,该序列编码一个与启动子操作性相连的位点特异性重组酶,载体还包括位点特异性重组酶识别的第一个、第二个识别位点,第一个识别位点位于第一个和第二个同源臂外部,第二个位点特异性重组酶识别位点位于第一个和第二个同源臂内部;在步骤b)进行期间或之后,诱导位点特异性重组酶的表达。

在该方法的另一个特定实施方案中,其中,宿主细胞还包括一个核苷酸序列,该序列编码一个与启动子操作性相连的位点特异性重组酶,载体还包括一个位点特异性重组酶识别位点,该位点位于第一个和第二个同源臂内部;在步骤b)进行期间或之后,诱导位点特异性重组酶的表达。

在特定实施方案中,载体还包括一个位于同源臂外部的可选择标记,这样,在载体DNA链上,从5’到3’,载体可以下述两种顺序含有:i)第一个同源臂,可选择标记,复制起点和第二个同源臂,或ii)第一个同源臂,复制起点,可选择标记和第二个同源臂。在一个特定实施方案中,可选择标记使含有该载体的细胞呈现抗生素耐药性。

在多个特定实施方案中,细菌重组酶是RecE/T或Redα/β重组酶,或者同时应用RecE/T和Redα/β。在另一些特定实施方案中,细胞是细菌细胞。在另一些特定实施方案中,细胞是大肠杆菌细胞。在另一些特定实施方案中,细胞是真核细胞,并重组表达RecE/T和/或Redα/β蛋白。在另一些特定实施方案中,该方法还包括分离重组DNA分子,该分子含有插入到载体中的靶DNA。

在另一个实施方案中,本发明还提供了用于定向克隆或亚克隆目标靶DNA分子的双链DNA载体,该载体包括一个复制起点和两个同源臂,在载体DNA链上,从5’到3’,以下述顺序存在:第一个同源臂,复制起点,以及第二个同源臂;这样,第一条载体DNA链上的第一个同源臂的核苷酸序列与第一条靶DNA链上的第一个末端序列同源,第一条载体DNA链上的第二个同源臂的核苷酸序列与第一条靶DNA链上的第二个末端核苷酸序列同源。在有关载体的一个特定实施方案中,复制起点是细菌复制起点。在另一个特定实施方案中,复制起点在大肠杆菌中发挥作用。在另一个特定实施方案中,复制起点在哺乳动物细胞中发挥作用。

本发明还提供了含有双链DNA载体的细胞,该载体可用于定向克隆或亚克隆目标靶DNA分子,包括一个复制起点和两个同源臂,在载体DNA链上,从5’到3’,以下述顺序存在:第一个同源臂,复制起点,以及第二个同源臂;这样,第一条载体DNA链上的第一个同源臂的核苷酸序列与第一条靶DNA链上的第一个末端序列同源,第一条载体DNA链上的第二个同源臂的核苷酸序列与第一条靶DNA链上的第二个末端核苷酸序列同源。在一个特定实施方案中,细胞是细菌细胞。

本发明还提供了可用于定向克隆或亚克隆靶DNA分子的试剂盒,该试剂盒包括一个或多个容器:a)用于定向克隆或亚克隆目标靶DNA分子的双链DNA载体,该载体包括一个复制起点和两个同源臂,在载体DNA链上,从5’到3’,以下述顺序存在:第一个同源臂,复制起点,以及第二个同源臂;这样,第一条载体DNA链上的第一个同源臂的核苷酸序列与第一条靶DNA链上的第一个末端序列同源,第一条载体DNA链上的第二个同源臂的核苷酸序列与第一条靶DNA链上的第二个末端核苷酸序列同源;以及b)含有细菌重组酶的细胞。在一个有关试剂盒的特定实施方案中,同源臂的序列与基于BAC,PAC,λ,质粒或YAC的克隆载体同源。在另一个有关试剂盒的特定实施方案中,第一个和第二个双链寡核苷酸具有的核苷酸序列与基于BAC,PAC,λ,质粒或YAC的克隆载体同源。

在另一个实施方案中,提供了用于定向克隆或亚克隆靶DNA分子的试剂盒,该试剂盒包括一个或多个容器:a)用于定向克隆或亚克隆目标靶DNA分子的双链DNA载体,该载体包括一个复制起点和两个同源臂,在载体DNA链上,从5’到3’,以下述顺序存在:第一个同源臂,复制起点,以及第二个同源臂;b)第一个双链寡核苷酸,含有第一个寡核苷酸DNA链,该链以下述顺序,从3’到5’含有:第一个核苷酸序列和第二个核苷酸序列,所述第一个核苷酸序列与载体DNA链上的第一个同源臂的核苷酸序列同源,第二个核苷酸序列与靶DNA链的第一个末端核苷酸序列同源;c)第二个寡核苷酸,含有第二个寡核苷酸链,该链以下述顺序,从3’到5’含有:第三个核苷酸序列和第四个核苷酸序列,所述第三个核苷酸序列与载体DNA链上的第二个同源臂的核苷酸序列同源,第四个核苷酸序列与靶DNA链的第二个末端核苷酸序列同源;以及d)含有细菌重组酶的细胞。在一个有关试剂盒的特定实施方案中,细胞是大肠杆菌细胞。在另一个有关试剂盒的特定实施方案中,细胞是具有摄取DNA能力的冻存细胞。

在另一个实施方案中,本发明提供了用于定向克隆或亚克隆靶DNA分子的试剂盒,该试剂盒包括一个或多个容器:a)用于定向克隆或亚克隆目标靶DNA分子的双链DNA载体,该载体包括一个复制起点和两个同源臂,在载体DNA链上,从5’到3’,以下述顺序存在:第一个同源臂,复制起点,以及第二个同源臂;b)第一个双链寡核苷酸,含有第一个寡核苷酸DNA链,该链以下述顺序,从3’到5’含有:第一个核苷酸序列和第二个核苷酸序列,所述第一个核苷酸序列与载体DNA链上的第一个同源臂的核苷酸序列同源,第二个核苷酸序列与靶DNA链的第一个末端核苷酸序列同源;以及c)第二个寡核苷酸,含有第二个寡核苷酸链,该链以下述顺序,从3’到5’含有:第三个核苷酸序列和第四个核苷酸序列,所述第三个核苷酸序列与载体DNA链上的第二个同源臂的核苷酸序列同源,第四个核苷酸序列与靶DNA链的第二个末端核苷酸序列同源。在一个有关试剂盒的特定实施方案中,DNA载体经纯化处理。在另一个有关试剂盒的特定实施方案中,DNA载体、第一个双链寡核苷酸和第二个双链寡核苷酸均经纯化处理。

在本发明提供的另一个有关试剂盒的特定实施方案中,靶DNA分子包括细菌、病毒、寄生虫或原生动物DNA。在另一个特定实施方案中,靶DNA分子包括已知或怀疑与某种功能紊乱或疾病相关的基因突变或多态性。在另一个特定实施方案中,细菌重组酶是RecE/T或Redα/β重组酶,或者是RecE/T和Redα/β两种重组酶。

本发明的方法还可用于诊断。例如,可以将质粒或线性DNA片段设计成能够俘获特异性靶DNA,以检测该DNA是否存在于受试者样本中,如,病毒DNA存在于患者样本中。在一个实施方案中,本发明提供了检测当发生基因突变时,已知或疑与功能紊乱或疾病相关的靶DNA的方法。在特定实施方案中,该靶DNA是细菌、病毒、寄生虫或原生动物DNA。在一个特定实施方案中,提供了一种方法,该方法进一步包括探测含有插入到载体中的靶DNA的重组DNA分子。在另一个实施方案中,该方法还包括探测含有插入到载体中的靶DNA的重组DNA分子。

在另一个实施方案中,本发明还提供了一种探测感染性物质存在的方法,其中,靶DNA源自怀疑患有感染性疾病的患者,而且,第一个和第二个同源臂与感染性物质中存在的DNA序列同源。在一个特定实施方案中,靶DNA源自怀疑患有感染性疾病的患者,而且,所述第二个和第四个核苷酸序列与感染性物质中存在的DNA序列同源。在另一个特定实施方案中,感染性物质是病毒、细菌、原生动物、真菌或寄生虫。

在另一个实施方案中,本发明还提供了一种探测遗传性病况、疾病、功能紊乱或多态性特征存在的方法,其中,靶DNA源自怀疑患有遗传性病况、疾病、功能紊乱或多态性特征的患者,而且,第一个同源臂的序列与已知或怀疑与所述遗传性病况、疾病、功能紊乱或多态性特征相关的位点上游序列同源,第二个同源臂的序列与已知或怀疑与所述遗传性病况、疾病、功能紊乱或多态性特征相关的位点下游序列同源。在一个特定实施方案中,提供了一种探测遗传性病况、遗传性疾病、遗传性功能紊乱或多态性特征存在的方法,其中,靶DNA源自怀疑患有遗传性病况、遗传性疾病、遗传性功能紊乱或多态性特征的患者,而且,第一个双链寡核苷酸序列与已知或怀疑与所述遗传性病况、遗传性疾病、遗传性功能紊乱或多态性特征相关的位点上游序列同源,第二个双链寡核苷酸序列与已知或怀疑与所述遗传性病况、遗传性疾病、遗传性功能紊乱或多态性特征相关的位点下游序列同源。在一个特定实施方案中,遗传性病况、遗传性疾病、遗传性功能紊乱或多态性特征使患者患有或易感肿瘤,哮喘,关节炎,耐药,药物毒性,或神经系统、神经精神、代谢、肌肉、心血管或皮肤病况、疾病或功能紊乱。

                    4.附图简述

图1A-C。同源重组克隆和亚克隆方法的构成。

A.载体,包括一个复制起点(起点),一个可选择标记(Sm),

  和两个同源臂(以A和B代表)。

B.备选双链寡核苷酸衔接子(adaptor)。每个衔接子包括与同源臂

  (分别为A和B)同源的区域(以A’和B’代表);与靶DNA

  末端(分别以C和D代表)同源的第二个区域(以C’和D’代表)。

C.靶DNA。靶DNA末端核苷酸序列(C和D)可以与载体的一个

  同源臂(分别为A和B)的核苷酸序列同源,也可以与备选衔

  接子寡核苷酸(分别以C’和D’代表)的核苷酸序列同源。

图2。方法1的实验要点。通过同源重组技术进行亚克隆的载体可以,例如通过转化,导入大肠杆菌宿主,该宿主中已经存在靶DNA以及RecE/T或Redα/β蛋白。该图示意了携带大肠杆菌复制起点和可选择标记基因(Sm)的线性DNA分子,并有“同源臂”侧翼,所述Sm优选其产物具有抗生素耐药性的基因。图中所示的同源臂是位于线性DNA分子两端的灰色方框,同源臂是与靶DNA中位于亚克隆DNA区侧翼的两个区域同源的短区域,该亚克隆DNA区侧翼又称为靶DNA末端,在图中是被同源臂侧翼包绕的粗线。转化后,Sm基因的选择性表达可用来鉴定含有同源重组产物的细胞,所述同源重组位于线性DNA分子的同源臂与靶DNA之间。

图3。以绘图的方式代表方法2。该方法与用于图1的方法类似,不同点在于在该方法中,靶DNA分子没有事先存在于大肠杆菌宿主中,而是与线性DNA载体分子一起,共同导入。靶DNA可以是任何来源的,也可以是一种混合物,源自需要克隆的目标DNA区域,或者是富含DNA的分子,源自需要亚克隆的DNA区域。如图1所示,同源臂以灰色方框代表。

图4。以绘图的方式代表方法3。克隆或亚克隆载体包括一个大肠杆菌复制起点和一个可选择标记基因(Sm),其侧翼是两个同源短臂,以灰色方框显示。此外,载体还包括两个重组靶位点(SSRTs),其中一个位于起点和可选择标记基因之间。最为简单的是,首先将载体构建为如图所示的线性DNA片段。在环化基础上,使第二个SSRT位于两个同源臂之间,定向成为相对于第一个SSRT的直接重复,这样,在两个SSRTs之间的位点特异性重组就会产生两个不同的环状分子,从而将起点和可选择标记基因分开。将环化载体转化到表达RecE/T或Redα/β蛋白或可以表达RecE/T或Redα/β蛋白的大肠杆菌菌株中。大肠杆菌菌株还携带一个可诱导位点特异性重组酶(SSR)基因,该基因产物可以识别载体中的SSRTs,这样,除非位点特异性重组酶基因被诱导或表达,SSRTs间的位点特异性重组才会发生。制备携带载体和调控位点特异性重组酶基因的大肠杆菌细胞,使它们携带RecE/T或Redα/β蛋白,并可用于转化。然后将含有预克隆区域的DNA分子导入宿主细胞。在同源臂间进行同源重组后,诱导位点特异性重组酶蛋白的表达,并筛选可选择标记基因的表达。在位点特异性重组前,细胞或者包括携带两个SSRTs的未重组载体,或者包括所需同源重组产物,该产物仅携带一个SSRT,因为同源重组将去除位于两个同源臂之间的SSRT。位点特异性重组酶诱导表达后,筛选可选择标记的表达,这样,包括同源重组产物的细胞将获得生存能力,因为该产物不再是位点特异性重组的底物。

图5。通过RecE/T或Redα/β同源重组,应用衔接子寡核苷酸克隆或亚克隆。本图图示了上图3所示方法2的变异。两个衔接子寡核苷酸,每个都包括两个同源区,其中一个同源区与载体的一个同源臂同源,第二个同源区与目标靶DNA区域两个末端的一个同源。载体的环化和目标DNA区域的克隆可通过载体和衔接子之间、以及衔接子和靶DNA之间的同源重组完成。在该实施方案中,载体和靶DNA之间没有序列同源性。因此,通过应用相对于每个靶DNA的靶特异性衔接子寡核苷酸,可以应用相同的载体克隆或亚克隆不同的靶DNA。衔接子寡核苷酸还可用于方法1和3,如上图1和3所示。

图6。溴化乙啶染色的琼脂糖凝胶,显示应用EcoRI消化DNA后的结果。消化的DNA来自mAF4 BAC实验的9个独立克隆(泳道1-9)。泳道M是1kb DNA标准物(BRL,Bethesda,MD)。泳道10,EcoRI消化的起始载体。该实验在部分6的实施例中将有详细描述。

图7A-B。从总酵母基因组DNA中克隆DNA区。

A.图示了一个扩增了p15A起点的PCR片段,其侧翼是两个98

  或102bp的同源臂,其任一侧整合了98或102bp的酵母菌株

  MGD 353-13D中的氨苄青霉素耐药基因。将PCR产物(0.5mg)

  和总酵母基因组DNA(4.0mg)混和,电转化到JC5519大肠杆

  菌中,该菌株含有来自pBADαβγ的Redα/β表达。通过筛选氨

  苄青霉素耐药来鉴定克隆。

B.溴化乙啶染色的凝胶,确认10个备选克隆中的正确克隆。

图8A-C。在ET亚克隆中,线性载体末端出现的重复序列或5’磷酸的作用。

A.显示了用于PCR扩增线性载体的寡核苷酸序列。斜体序列表示

  PCR扩增线性载体所必需的寡核苷酸部分,其他核苷酸构成大  肠杆菌lacZ基因的同源臂。黑体序列在线性载体的两端都有出现,这样可以形成末端重复。线性载体构建物a-x具有不同长度的重复序列。该线性载体包括p15A复制起点,加上氯霉素耐药基因Cm’,侧翼是两个同源臂,以及图示的末端重复序列。B.图示了用于检测载体构建物在ET亚克隆大肠杆菌lacZ基因效率的策略,所示载体构建物含有A中所示的不同重复序列。C.列表显示了重复序列长度和磷酸化对ET亚克隆效率的作用。应用含有A中所示重复序列的载体得到的测试结果如表所示。图9A-B。应用pBAD-αβγ(tet)进行ET重组亚克隆。A.图示pR6K/BADαβγ质粒,包括R6K起点,pir-116复制子,来自pBR322(tet’)的四环素耐药基因,以及阿拉伯糖抑制子(araC)。B.比较应用pBAD-αβγ(tet)(ColE1 ori)和pR6K/BADαβγ进行ET重组亚克隆。图10A-B。在BAC上亚克隆AF-4基因的19kb片段。A.质粒构建物和亚克隆策略,tet’,四环素耐药基因。AraC,阿拉伯糖抑制子。B.分析5个独立克隆。溴化乙啶染色HindIII消化DNA凝胶,该DNA来自5个独立正确克隆和线性载体。胶质亚克隆经DNA序列分析确认。M,1kb DNA阶梯。图11A-B。应用基因组DNA作为靶DNA源进行ET亚克隆。A.来自大肠杆菌的基因组DNA通过XhoI消化预线性化。该线性载体包括ColE1起点和卡那霉素耐药基因kan,其侧翼为同源臂,可以将重组定位于大肠杆菌染色体的lacI/lacZ位点。B.对16个独立克隆的限制性分析。泳道17代表线性载体。M,1kb DNA阶梯。图12A-B。亚克隆来自鼠ES细胞基因组DNA的新霉素基因neo。A.亚克隆策略图。B.卡那霉素耐药克隆的限制性分析。图13。ET克隆和亚克隆的组合。

                   5.发明详述

本发明涉及应用细菌重组酶介导的同源重组技术进行DNA克隆和亚克隆的方法和组合物。本发明发明人发现,细菌重组酶可以某种特定方式,用来获得高效靶克隆或亚克隆。

细菌重组酶优选应用RecE/T和/或Redα/β。在大肠杆菌中,RecE/T途径以前业已有所描述,其组分也已被部分认识(Hall and Kolodner,1994,Proc.Natl.Acad.Sci.U.S.A.91:3205-3209;Gillen et al.,1981,J.Bacteriol.145:521-532)。通过RecE/T途径的重组需要两个基因的表达,rec E和rec T,其DNA序列已经公开(Hall et al.,1993,J.Bacteriol.175:277-278)。Rec E蛋白的功能与λ外显子相似,后者又被称为Redα,Rec T蛋白的功能与Redβ以及噬菌体P22的erf相似(Gillen et al.,1977,J.Mol.Biol.113:27-41;Little,1967,J.Biol.Chem.242:679-686;Radding and Carter,1971,J.Biol.Chem.246:2513-2518;Joseph andKolodner,1983,Biol.Chem.258:10411-17;Joseph and Kolodner,1983,Biol.Chem.258:10418-24;Muniyappa and Radding,1986,J.Biol. Chem.261:7472-7478;Kmiec and Hollomon,198l,J.Biol.Chem.256:12636-12639;Poteete and Fenton,1983,J.Mol.Biol.163:257-275;Passy et al.,1999,Proc.Natl.Acad.Sci.USA 96:4279-4284,以及这些文献引用的参考文献)。

本文描述的是涉及应用细菌重组酶指导DNA克隆和亚克隆的方法和组合物。本文应用的术语“DNA克隆”是指将任何来源的DNA插入到自治复制载体的过程,这样,该DNA可以在宿主细胞中增殖。术语“DNA亚克隆”是指将业已存在于自治复制载体的DNA片段穿梭于另一自治复制载体的过程,或者将来自富含DNA分子如纯化病毒基因组的DNA片段或经PCR扩增的DNA片段穿梭于另一自治复制载体的过程。术语“定向”或“靶”克隆和亚克隆是指应用同源臂以及(在很多实施方案中是)衔接子寡核苷酸来选择靶DNA,并通过同源臂的选择和定向作用,指导或定向靶DNA的插入。应该指出,本发明所有申请方法适用于克隆和亚克隆DNA。

本发明组合物和方法的构建将在这里给予详尽阐述。具体地说,部分5.1描述了本发明应用同源重组技术靶向克隆DNA片段的介导重组克隆方法。下面的部分5.2描述了本发明组合物,包括设计用来定位、俘获和克隆目标靶DNA片段的DNA构建物。该部分还描述了编码细菌重组酶如RecE/T和/或Redα/β蛋白的核酸分子,含有这些组合物的细胞,以及构建这些核酸和细胞的方法。下面的部分5.3描述了细菌重组酶靶向克隆方法的应用,以及探测基因表达和诊断疾病状态的试剂盒。

5.1 通过同源重组技术克隆和亚克隆的方法

通过细菌重组酶介导的同源重组技术,可以应用本文描述的不同方法,高效靶向克隆任何目标DNA。本文描述的3种方法所需的常见组分是一种表达细菌重组酶重组蛋白的细胞,和一个载体。该载体的一个示例见图1A。载体包括3个必需元素:一个复制起点和两个双链DNA短区,本文又称为“同源臂”。

同源臂被特意设计成可以通过同源重组技术,允许载体在两个同源臂之间“俘获”目标靶DNA。同源臂的序列、位置和定向性对于靶DNA在两臂之间的正确插入至关重要。在一个实施方案中,同源臂序列与靶DNA的末端同源,两个同源臂的DNA序列位于目标靶DNA的侧翼,其中一个臂(在图1中以A代表)对应于靶DNA(在图1中以C代表)的上游DNA序列,第二个臂(在图1中以B代表)对应于靶DNA(在图1中以D代表)的下游序列。两个臂相对于所需插入的定向性必须与同源序列相对于靶DNA的定向性相同(见图1),这样,同源臂与靶DNA之间的重组才会导致靶DNA被插入到两个同源臂之间或“内部”(见图1)。在这里,一个位置被定义为同源臂“内部”是指,如果该位置位于两个同源臂之间,这样,在一个方向上,第一个同源臂位于复制起点和其本身之间,在另一个方向上,第二个同源臂位于复制起点和其本身之间。反之,一个位置被定义为同源臂“外部”是指,如果在一个方向上,没有同源臂可以将其本身与复制起点分开。因此,通过该定义,复制起点和可选择标记位于载体同源臂的“外部”(见图1),这样,靶序列的插入不会影响质粒上的复制起点和可选择标记。相反,通过该定义,靶DNA是插入到同源臂的“内部”。图1A形象地描绘出同源臂的“内部”和“外部”。

在另一个实施方案中,同源臂序列与一套双链衔接子寡核苷酸同源。这些衔接子寡核苷酸如图1B所示。每个衔接子寡核苷酸序列都包括载体一个同源臂的序列,以及与目标靶基因侧翼序列同源的序列(见图1C)。因此,一个衔接子寡核苷酸包括一个与同源臂DNA序列同源的序列(在图1中以A’代表),以及靶DNA的上游核苷酸序列(在图1中以C’代表)。第二个衔接子寡核苷酸包括一个与同源臂DNA序列同源的序列(在图1中以B’代表),以及位于靶DNA下游的核苷酸序列(在图1中以D’代表)。以这种方式,衔接子寡核苷酸可以通过改变其序列,用来使普通的同源克隆载体适应目标特异靶基因序列(见图5)。可以用来进行本发明多种实施方案的方法和组合物将在这里给予详尽描述。

下面描述的方法包括三种不同方法,通过同源重组技术进行定向克隆。如下详述,这三种方法的每一种都具有它们自己的优势,可以优选用来进行具体的克隆应用。这些方法和应用将在下面给予详述。在一个方法中,如图2所示,克隆载体被导入含有目标靶DNA的细胞。该方法可用来将插入方便地从一个复制子穿梭于另一个复制子,而无需进行累人的限制性分析和体外操作。该方法可用于靶DNA业已存在于大肠杆菌复制子的情况,它的进一步应用需要对选择部分进行亚克隆。例如,分离自粘粒、噬菌体或BAC库的DNA克隆可以通过将所选部分亚克隆到新载体中而方便地应用,所述亚克隆是为了对插入序列进行序列分析或表达基因编码的蛋白。在第二种方法中,如图3所示,先制备克隆载体和目标靶DNA,然后一起导入细胞。此外,如图4所示,目标DNA被加入到已经包括克隆载体的细胞中。后两种方法可用于靶DNA来自外源的情况,例如,DNA来自肿瘤细胞。

5.1.1  方法1:将载体导入含有靶DNA的宿主细胞

在一个实施方案中,如图2所示,靶DNA业已存在于表达细菌重组酶的宿主细胞中。例如,靶DNA可能位于独立复制的DNA分子上,例如但不限于质粒、噬菌体、细菌人工染色体(BAC)或大肠杆菌宿主细胞中的大肠杆菌染色体。构建表达细菌重组酶的宿主细胞的方法在部分5.2.2中将给予详述,所示细菌重组酶如RecE/T或Redα/β。

将载体DNA导入宿主细胞。所示载体DNA包括一个复制起点和两个同源臂,这两个同源臂可以位于起点和标记的任一侧。优选地,载体是线性分子,同源臂位于线性分子的两端,尽管它们可以在内部。进入细胞后,发生在载体DNA同源臂和靶序列之间的同源重组使靶DNA插入到同源臂之间,并形成环状游离体。然后将细胞转移到选择性培养基中,筛选载体上存在选择标记的细胞。由于只有环状分子才能够复制,并在宿主细胞中被选择,在选择培养基中能够生长的很多细胞都含有包括靶DNA的重组分子。

在一个实施方案中,线性载体DNA片段的末端通过修饰核苷酸进行阻断,以降低除了同源重组之外的其他方法导致的线性片段末端的连接事件数量,即非法重组。这些修饰核苷酸,如磷酸硫代核苷酸,可以整合到同源臂的5’末端核苷酸中。修饰核苷酸可以在用于构建载体的寡核苷酸引物合成过程中(见以下部分5.2.1)导入,或者,也可以在合成后,对线性载体DNA的寡核苷酸进行酶或化学修饰来添加。对寡核苷酸和线性DNA片段进行这些修饰的方法是本领域众所周知的,并在以下部分5.2.2中有详述。

5.1.2  方法2:将载体和靶DNA共同导入宿主细胞

在另一个实施方案中,如图3所示,体外混和载体DNA和靶DNA,然后共同导入含有RecE/T或Redα/β重组酶的细胞中。靶DNA可以是任意来源的。例如,靶DNA可以来自生物样本,例如但不限于全血,血浆,血清,皮肤,唾液,尿液,淋巴液,活检细胞,组织培养细胞,培养基,也可以来自非生物样本,如食物,水,或其他材料。从这些材料中制备DNA的方法是本领域技术人员熟知的(见,如CurrentProtocols in Molecular Biology series of laboratory technique manuals,1987-1994 Current Protocols,1994-1997 John Wiley and Sons,Inc.)。

体外制备并混和载体和靶DNA,然后共同导入表达细菌重组酶蛋白的细胞中,优选通过共同电转化转化大肠杆菌。载体DNA可以是线性DNA形式,也可以是环状质粒DNA的形式。在一个优选实施方案中,载体是线性DNA分子。靶DNA来源在重量上超过或多于,相对于载体DNA,这样导入细胞中的目标靶DNA区域的拷贝数可以尽量多,从而使重组产物的产量最大化。使细胞在选择培养基中生长,以筛选环状产物。在一个优选实施方案中,载体包括一个抗生素耐药标记,细胞生长于含有这种抗生素的培养基中。在这种选择培养基中能够生长的集落含有环化、重组形式的线性片段。

在一个实施方案中,如以下部分5.2.1所述,线性载体DNA片段的末端应用修饰核苷酸阻断。这些修饰寡核苷酸的方法是本领域众所周知的,如以下部分5.2.2所述。

这种方法对于靶DNA不是源于大肠杆菌的情况特别有用,例如,靶DNA来源于酵母或真核细胞。在一个实施方案中,该方法可以用于诊断目的,探测在任意生物样本中特定DNA的存在。例如,该方法可用来探测乳腺癌患者活检样本中特异性雌激素受体或BRCA1等位基因的存在。

在另一个实施方案中,该方法可以作为聚合酶链反应(PCR)技术扩增的替代方法,用来扩增DNA区域。通过同源重组、克隆和在大肠杆菌中增殖的扩增方法,相对于基于PCR的技术,存在一些优势。首先,PCR误差对于很多应用目的来说是本质障碍。联合应用PCR引物对可能产生一些假反应产物。而且,在一个误差引入DNA样本后,该误差在最终反应产物中的数量随着PCR扩增的每一轮,以指数级上升。相反,通过同源重组克隆技术扩增在大肠杆菌中具有细胞阅读前机制的优势,这样,至少更可靠1000倍。第二,应用本方法,对待扩增DNA区域的大小限制较少。应用PCR技术,扩增长度超过几千碱基对(超过5-10kb)的DNA区域就相当困难。而本方法适用于克隆更大的区域,至少大约10万碱基对。目前,克隆基因组包括创建大型随机库的冗长过程,随后还要进行每个克隆的分类和排序。应用本方法,可以设计同源臂,构建载体,将基因组定向克隆到大型、非冗余、邻近克隆中,即所谓的“contigs”。第三,通过PCR技术制备DNA后,甚至还需要额外的过程,进行PCR产物的克隆。同源重组克隆技术则避免了进行额外亚克隆步骤的需要。只需要将待扩增的DNA区域插入到同源臂之间,然后与载体DNA一起转化大肠杆菌宿主。

在该实施方案中的同源重组在将DNA加入细胞之前,可以体外进行。例如,分离的RecE和RecT,或者含有RecE/T的细胞提取物可以加入DNAs混合物中。当重组在体外发生时,DNA分子的筛选可以通过应用重组混合物转化适宜宿主细胞并如前所述筛选阳性克隆来实现。

5.1.3  方法3:将靶DNA导入含有载体DNA的宿主细胞

在另一个实施方案中,靶DNA被导入已经含有载体DNA的细胞中。靶DNA可以是任意来源的,如上5.1.2所述,其形式可以是线性,也可以是环状。如上所述,靶DNA一旦进入细胞,在同源臂和靶DNA之间进行的同源重组就会使靶DNA插入到同源臂之间。但是,在这种情况下,用来选择未重组载体的反选择是必需进行的,因为所需产物和未重组载体都表达可选择标记基因。本文将详细描述多种进行该反选择过程的实施方案。例如,在一个实施方案中,应用了位点特异性重组和切除反应的方法。该方法在图5给予了描述。在另一个实施方案中,可诱导核酸酶被诱导,裂解未重组载体。在两个实施方案中,不含重组产物的载体均被消除。

载体首先被构建成质粒,然后导入宿主细胞,并在宿主细胞中增殖。如图5所示,载体含有(i)复制起点(任意起点);(ii)可选择标记(Sm);(iii)两个同源臂;以及(iv)可选择的反标记,例如但不限于一对位点特异性重组酶的识别位点,第一个识别位点位于同源臂外部,第二个识别位点位于同源臂之内,或者核酸内切酶的识别位点,该酶可用于筛选起始质粒载体。在这里,一个位置被定义为同源臂“内部”是指,如果该位置位于两个同源臂之间,这样,在一个方向上,第一个同源臂位于复制起点和其本身之间,在另一个方向上,第二个同源臂位于复制起点和其本身之间。反之,一个位置被定义为同源臂“外部”是指,如果在一个方向上,没有同源臂可以将其本身与复制起点分开。(见图1,图示了同源臂“内部”和“外部”含意)。复制起点和可选择标记必须位于同源臂的外部,如上部分5.1所述,这样,靶序列的插入才不会影响质粒上的复制起点和可选择标记。可选择反标记、核酸内切酶位点或两个位点特异性重组酶靶位点的其中一个优选位于同源臂的“内部”(见图5),在复制起点和可选择标记的另一侧。

可以应用任何本领域已知的方法进行反选择非重组载体。例如,在一个实施方案中,反选择可以通过一个可诱导位点特异性重组酶(SSR)来实现。位点特异性重组酶是可以识别两个靶位点的酶,这两个靶位点又称为位点特异性重组酶靶位点(SSRTs),该酶通过这两个位点发挥作用,介导DNA链的交换和切除反应(Hallet et al.,FEMSMicrobiol.Rev.,1997,21:157-78;Sauer,1994,Curr.Opin.Biotechnol.5:521-7;Stark et al.,1992,Trends Genet.,8:432-9)。位点特异性重组酶的示例是本领域众所周知的,包括但不限于Cre,Flp,Kw或R重组酶(Nunes-Duby et al.,1998,Nucleic Acids Res.26:391-406;Ringrose et al.,1997,Eur.J.Biochem.248:903-912;Utatsu et al.,1987,J.Bacteriol.169:5537-5545)。当两个直接重复SSRTs位于环状质粒上时,两个SSRTs之间的位点特异性重组就会形成两个环状质粒。只有含有复制起点的产物保留在细胞中。因此,位于环状质粒两个直接重复SSRTs之间的位点特异性重组,可以去除位于两个SSRTs之间、不包括复制起点的DNA序列。

DNA载体可以构建包括两个SSRTs,定向如直接重复,其中一个位于同源臂的内部,第二个位于同源臂的外部,在可选择标记(SM)和复制起点之间。以这种方式定位的SSRTs间发生的重组,可以导致复制起点与可选择标记的分离(见图5)。因此,SSR可以作用于含有两个SSRTs的非重组DNA载体,导致该质粒在宿主细胞中的消失。

然后通过标准方法,应用载体DNA转化宿主细胞。在该实施方案中,宿主细胞必须包括:1)RecE/T和/或Redα/β基因,以及2)编码SSR的基因。优选地,RecE/T和/或Redα/β基因的表达是可以诱导的,但固定表达也是可以的。编码能够识别SSRTs的位点特异性重组酶(SSR)的基因必须是可诱导的。可诱导和固定启动子在本领域是众所周知的;它们在重组基因构建和表达过程中的应用方法将在以下部分5.2.3中给予描述。如果RecE/T和/或Redα/β基因需要诱导表达,在制备功能细胞之前,含有载体的细胞必须在可以诱导表达的条件下生长。含有载体DNA的宿主细胞可以通过接种、生长于选择培养基来筛选、维持。

然后从含有载体的宿主细胞中制备功能细胞。应用靶DNA转化细胞,所述靶DNA可以是任意来源的,如从任何细胞中制备的总基因组DNA。细胞短暂培养,使同源重组可以发生。同源重组可以去除含有一个SSRT的同源臂之间的序列,并插入靶基因序列。然后诱导SSR的表达。SSR会作用于未重组载体的直接重复SSRTs,使可选择标记与质粒复制起点分开。含有插入靶序列的质粒只有一个SSRT,因此会保持完整。在进行该步骤时,可以进行筛选,也可以不进行筛选,但在SSR诱导后,即在位点特异性重组发生后,必须很快进行筛选步骤。以这种方式,SSR的诱导可以筛选含有插入靶基因的质粒。

在另一个实施方案中,可以在同源重组发生之前、期间或之后,体内应用核酸内切酶在两个同源臂之间使载体线性化。在重组之前进行载体线性化可以选择正确重组产物,因为除非线性质粒发生环化,否则在细胞中不能存活。重组后,核酸内切酶的持续活性将有助于筛选含有插入序列的质粒,因为在重组期间,SSR去除了核酸内切酶识别位点,并在该位置插入靶DNA。因为核酸内切酶只裂解非重组载体,而使含有插入靶序列的质粒保持完整,因此重组后核酸内切酶的持续活性可以筛选非重组产物。在该实施方案中,必须应用识别位点非常少见的核酸内切酶,这样,在宿主细胞DNA中没有其他识别位点存在。这些“少见切割者”的示例在本领域是众所周知的,包括但不限于λcos,酵母HO或内含子编码的核酸内切酶如PI-Scel。核酸内切酶的识别位点应该克隆在两个同源臂之间,这样,核酸内切酶的酶切消化就会在同源臂之间形成线性化载体。核酸内切酶基因的表达必须是可诱导的。可诱导蛋白表达的构建和方法将在下面部分5.2.3加以探讨。

在另一个实施方案中,可以应用SSR,例如Cre重组酶来代替核酸内切酶,体内线性化未重组载体(见Mullins et al.,1997,Nucleic AcidsRes.25:2539-40)。在这种情况下,构建的载体只有一个位于同源臂内部的SSRT位点。含有相同SSRT拷贝的超量寡核苷酸与靶DNA混和,并与靶DNA一起,共转化宿主。优选地,寡核苷酸是双链短DNA分子。当一个重组分子含有位于短寡核苷酸上的SSRT时,位点特异性重组酶将在SSRT位点线性化载体(Mullins et al.,1997,supra)。

在另一个实施方案中,可以将上述位点特异性重组和核酸内切酶方法联合应用。在这种情况下,未重组载体在同源臂内部含有SSRT和核酸内切酶位点。在该方法的一个实施方案中,SSR和核酸内切酶可以在一个单独的可诱导启动子控制下共同调节。这些蛋白质共同调节、可诱导表达的构建和方法将在以下部分5.2.3中加以探讨。

在另一个实施方案中,可以联合采用这些位点特异性重组技术进行反筛选。在该实施方案中,采用两对SSR/SSRTs,例如Cre/lox和Flp/FRT。载体包括针对第一个SSR,SSR1的两个位点,一个位于同源臂内部,第二个位于同源臂外部,复制起点与可选择标记之间。此外,该载体还包括针对第二个SSR,SSR2的一个位点,位于同源臂内部。SSR2的另一个位点位于双链短寡核苷酸上,并在细胞转化期间,以超过靶DNA的量,与靶DNA一起添加。在一个特定实施方案中,例如,线性化步骤的一个SSR/SSRT对是Cre/loxP,去除步骤的第二对是Flp/FRT。

在另一个实施方案中,可以直接应用细胞反筛选。在这种情况下,质粒复制起点在大肠杆菌中只有单一拷贝(或者拷贝数量非常低)。这种类型的复制起点包括iteron型起点,如噬菌体P1起点,以及基于大肠杆菌染色体的质粒起点,oriC。选择适宜的复制起点,见Helinski,D.R.,Toukdarian,A.E.,Novick,R.P.Chapter 122,pp 2295-2324 in“Escherichiacoli and Salmonella,Cellular and Molecular Biology”2nd edition FrederickC.Niedhardt,Ed.ASM Press,Washington,1996,ISBN 1-55581-084-5。在这种情况下,构建的载体可以没有任何SSRTs,但在同源臂之间不能不包括反筛选基因。这些反筛选标记基因是本领域众所周知的,例如,可应用sacB,ccdB或四环素耐药基因(适宜的反筛选基因和方法列表还见,Reyrat et al.,1998,Infect.Immun.66:4011-7)。预期的同源重组反应将去除反筛选基因,这样,携带预期重组产物的细胞将在反筛选压力下存活,而携带未重组载体的细胞将死亡。

5.2  通过同源重组技术进行克隆和亚克隆的组合物

本文描述了在多种实施方案中,通过同源重组技术进行克隆的组合物。在以下部分5.2描述的每一种克隆方法,在一个单一细胞中都必须同时存在以下三种组分:第一,携带两个DNA短区域(本文称为“同源臂”)的载体,该DNA短区域的序列与靶序列同源;第二,RecE/T和/或Redα/β蛋白对,或其他细菌重组酶;第三,靶DNA序列。由细菌重组酶介导的,在同源臂与靶基因侧翼区域存在的同源序列间发生的重组,可以将靶DNA插入或“俘获”到两个同源臂之间。这里将详细描述它们构建的组合物和方法。

5.2.1  同源克隆载体

同源克隆载体可以是线性或环状DNA载体,包括一个复制起点,一个可选择标记和两个被设计成可以俘获目标靶DNA的DNA短区域。可以根据所用手段或方法,选择数种形式的克隆载体。它们构建的优选形式和方法如图1-5所示,并将在这里给予详细描述。

5.2.1.1  复制起点

载体需要一个复制起点,使质粒复制、增殖。如果在大肠杆菌中克隆和增殖,可以应用任何大肠杆菌复制起点,这些复制起点的示例是本领域众所周知的(见Miller,1992,A Short Course in Bacterial Genetics,Cold Spring Harbor Laboratory Press,NY,及其引用参考文献)。目前可以获得的非限制性质粒复制起点的示例是ColE1衍生性复制起点(Bolivar et al.,1977,Gene 2:95-113;见Sambrook et al.,1989,supra),在如pACYCl84质粒上存在的p15A起点(Chang and Cohen,1978,J.Bacteriol.134:1141-56;还见Miller,1992,p.10.4-10.11),以及适用于低拷贝质粒表达的pSC101起点,它们都是本领域众所周知的。

例如,在一个实施方案中,应用了从高拷贝质粒中获得的复制起点,如含有ColE1衍生性复制起点的质粒,这些质粒的示例是本领域众所周知的(见Sambrook et al.,1989,supra;还见Miller,1992,A ShortCourse in Bacterial Genetics,Cold Spring Harbor Laboratory Press,NY,及其引用参考文献)。一个示例是来自pUC19的起点及其衍生物(Yanisch-Perron et al.,1985,Gene 33:103-119)。pUC载体的存在水平是每个细胞300-500拷贝,并具有插入异源基因的便利克隆位点。为了极高水平表达,可以应用λ载体,如λgt11(Huynh et al.,1984,in“DNACloning Techniques:Vol I:A Practical Approach”,D.Glover,ed.,pp 49-78,IRL Press,Oxfbrd),或在含有T7和Sp6聚合酶表达系统的细胞中应用T7或SP6噬菌体启动子(Srudier et al.,1990,Methods Enzymol.185:60-89)。

在需要低水平表达时,可以应用中等或低拷贝的复制起点。中等拷贝质粒在本领域是众所周知的,如pBR322,具有ColE1衍生性复制起点,每个细胞中有20-100拷贝(Bolivar et al.,1977,Gene 2:95-113;见Sambrook et al.,1989,supra),或pACYC100质粒系列中的pACYC184质粒,具有p15A起点,每个细胞中有10-12拷贝(Chang and Cohen,1978,J.Bacteriol.134:1141-56;还见Miller,1992,p.10.4-10.11)。低拷贝质粒在本领域也是众所周知的,例如,pSC101,具有pSC101起点,每个细胞中大约有5个拷贝。与pBR和pUC质粒一样,pACYC和pSC101质粒载体都具有便利的克隆位点,并可在同一细胞中共同存在,因为它们具有可兼容的复制起点和独特的选择性抗生素标记。其他适宜的质粒复制起点包括基于质粒的λ或噬菌体P1复制子,例如Lorist系列(Gibson et al.,1987,Gene 53:283-286)。

当所需表达水平更低时,可以应用来自细菌染色体的复制起点(见Miller,1992,supra;Niedhardt,F.C.,ed.,1987,Escherichia coli andSalmonella typhimurium,American Society for Microbiology,WashingtonD.C.;Yarmolinsky,M.B.and Sternberg,N.,1988,pp.291-438,in Vol.1 ofThe Bacteriophages,R.Calendar,ed.,Plenum Press,New York)。此外,还可应用合成复制起点。

5.2.1.2  可选择标记

为了在细胞中维持质粒载体,典型的载体还包括一个可选择标记。可以应用任何本领域已知的可选择标记。在构建大肠杆菌载体时,可以应用任何使大肠杆菌有效产生抗生素耐药的基因,以及任何使大肠杆菌产生稳定的可鉴别或可筛选表型变化的基因。优选应用抗生素耐药标记,如来自TN903的卡那霉素耐药基因(Friedrich and Soriano,1991,Genes.Dev.5:1513-1523),或其他氨基糖甙类抗生素耐药基因(所述其他氨基糖甙类抗生素包括但不限于双氢链霉素,庆大霉素,新霉素,巴龙霉素和链霉素),来自IS1的β-内酰胺酶,使大肠杆菌产生青霉素类耐药(包括但不限于氨苄青霉素,羧苄青霉素,甲氧西林,青霉素N,青霉素O和青霉素V)。其他可选择基因序列包括但不限于编码多肽的基因序列,该多肽可以产生zeocin耐药(Hegedus et al.,1998,Gene 207:241-249)。其他可以应用的抗生素是可以产生amphenicols如chloramphenicol耐药的基因,例如,可以应用chloramphenicol转酰酶(CAT)的编码序列(Eikmanns et al.,1991,Gene 102:93-98)。对于本领域技术人员,应该指出,也可应用其他非抗生素方法,用来筛选质粒在细胞中的维持,例如,可以应用多种营养缺陷性标记(见Sambrook etal.,1989,supra;Ausubel et al.,supra)。

5.2.1.3  同源臂

载体的一个必需组分是两个双链DNA短区,这里又称为“同源臂”。在一个实施方案中,如图1所示,两个同源臂(以“A”和“B”代表)与目标靶DNA的侧翼DNA序列(以“A’”和“B’”代表)同源,其中一个臂与靶DNA上游DNA序列同源,第二个臂与位于靶DNA下游的序列同源。如这里所用,如果两个双链DNA分子具有相同的恒定区,可以任选插入一个或多个差异碱基对,并能够作为同源重组的底物,那么它们是“同源的”。在一个优选实施方案中,同源臂包括大约22-100个碱基对或更多的连续碱基对,与目标靶DNA的双链侧翼区相同。同源区还可以插入一个或多个不同残基,只要同源臂仍然能够成为同源重组的有效底物。在一个优选实施方案中,为了使重组效率最优化,同源臂的长度大约为50个核苷酸,其中20-30(如25)个连续碱基对序列相同,没有插入。尽管连续相同的区域可以更短(如,至少6,8或10个碱基对),但应用这种较短的连续相同区域,可以预见,重组效率可能较低。例如,在一个实施方案中,连续相同区域的长度是6bp(Keim and Lark,1990,J.Structural Biology 104:97-106)。同源臂的长度或其与靶DNA侧翼序列连续相同的长度没有上限。

靶DNA侧翼核苷酸序列在这里又称为靶DNA“末端”。因此,一个靶DNA有两个末端,第一个末端和第二个末端。两个同源臂相对于所需插入序列的定向性必须与同源序列相对于靶DNA的定向性一致(见图1),这样,在同源臂和第一个、第二个靶DNA末端之间的重组,可以将靶DNA插入到两个同源臂之间。

两个同源臂的序列可以根据实验设计来选择。在选择同源臂时的唯一限制是,该序列不应在靶DNA内出现超过一次,而且在同源重组反应期间,不应在宿主细胞的其他地方出现。在这种情况下,在其他同源重组事件的背景中,仍然可以获得所需同源重组产物。在一个实施方案中,同源臂序列是常用克隆载体的多接头侧翼序列,所述常用克隆载体如BAC,PAC,YAC(酵母人工染色体),噬菌体克隆载体如λEMBL或λGT序列,phagemid,粘粒,pBR322,pGEM,pGEX,pET,杆状病毒载体,病毒载体如腺病毒载体和腺病毒相关病毒载体。因此,可以应用单一载体亚克隆任何在这些载体中克隆的插入序列。含有这些同源臂的载体对于亚克隆插入序列特别有用,所述插入序列来自DNA文库的阳性克隆,该DNA文库如BAC,PAC,YAC,粘粒或λ库。

在多个实施方案中,如下所述,同源臂位于线性DNA分子的末端,或者位于线性DNA分子之内,或者位于环状DNA质粒载体内。

同源臂的定向性相对于它们与靶核苷酸序列的定向性一致。换句话说,同源臂的方向,使所需DNA序列在重组发生后,插入到同源臂之间。当同源臂位于线性DNA末端时,插入DNA序列俘获或插入到两个同源臂之间,并进而形成一个环状可复制质粒。

5.2.1.4  衔接子寡核苷酸同源臂

在另一个实施方案中,同源臂的核苷酸序列与衔接子寡核苷酸的核苷酸序列同源。两个衔接子寡核苷酸的每一个都包括一个与一个同源臂核苷酸序列同源的核苷酸序列,以及第二个与靶DNA两个末端中的一个同源的同源区域。衔接子寡核苷酸如图1所示。载体的同源臂以“A”和“B”代表,与这些序列同源的衔接子寡核苷酸区域以“A’”和“B’”代表。靶DNA的两个末端以“C”和“D”代表,在衔接子寡核苷酸上与之相应的同源序列以“C’”和“D’”代表。在该实施方案中,由RecE/T或Redα/β介导的在载体同源臂、衔接子寡核苷酸同源区与靶基因侧翼末端之间发生的重组,使靶DNA插入或“俘获”到载体同源臂之间。

5.2.1.5  构建载体

可以应用本领域已知的标准方法构建线性片段或环状载体(见Sambrook et al.,1989,supra;Ausubel et al.,supra)。例如,可以应用合成或重组DNA技术。在一个实施方案中,线性片段是通过PCR扩增技术制备的。在该方法中,合成的寡核苷酸在它们的5’端包括同源臂序列,在它们的3’端包括PCR引物序列。然后应用这些寡核苷酸作为PCR扩增反应的引物,扩增包括复制起点和可选择基因标记的DNA区域。在另一个实施方案中,可以通过标准重组DNA技术构建质粒,使之包括两个适宜定向的同源臂,侧翼包围一个复制起点和一个可选择基因标记(见,例如Methods in Enzymology,1987,Volume 154,Academic Press;Sambrook et al.,1989,Molecular Cloning-A Laboratory Manual,2ndEdition,Cold Spring Harbor Press,New York;and Ausubel et al.,CurrentProtocols in Molecular Biology,Greene Publishing Associates and WileyInterscience,New York)。然后,例如,通过限制性核酸内切酶消化,使质粒线性化。

在另一个实施方案中,例如,可以应用下述方法构建用于上面部分5.1.3的载体DNA。合成两个寡核苷酸,其中一个包括,从5’到3’,一个载体特异性限制性位点,一个左侧同源臂和一个PCR引物。另一个寡核苷酸包括,从5’到3’,相同的载体特异性限制性位点,一个SSRT,一个右侧同源臂和一个PCR引物。选择两个同源臂侧翼包围靶DNA。SSRT是可以被任何位点特异性重组酶(SSR)如Cre,Flp,Kw或R重组酶识别的位点。设计的合成寡核苷酸必须使两个SSRTs在载体中定向为直接重复序列。两个PCR引物被用来扩增DNA模板,该模板包括一个质粒起点,一个可选择基因和在起点和可选择基因间的相同SSRT。然后应用限制性酶酶切PCR反应产物,并通过连接有效环化,所述限制性酶可以识别寡核苷酸5’末端包括的位点。然后应用环状产物转化大肠杆菌,以扩增、产生大量载体。

在另一个实施方案中,线性片段可以通过采用具有可选择标记、起点和两个克隆位点的质粒来构建,然后将寡核苷酸同源臂克隆到每个克隆位点中。然后应用限制性酶酶切质粒DNA,以产生由同源臂限定的线性片段。该方法优选用于构建更复杂的质粒——例如,为了包括真核表达元件,含有真核增强子和启动子元件的质粒。此外,其他序列元件也可亚克隆到载体上。

载体还可以包括蛋白表达、操作或维持插入靶DNA所需的其他目标核苷酸序列。例如,在载体的适宜位置,还可以包括启动子序列,增强子序列,翻译序列如Shine和Dalgarno序列,转录因子识别位点,Kozak共识序列,以及终止信号。在非细菌细胞,如在植物、昆虫、酵母或哺乳动物细胞中重组克隆,必须有其他序列元件,如种特异性复制起点,转录、过程和翻译信号。这些元件包括但不限于真核复制起点,增强子,转录因子识别位点,CAT盒,或Pribnow盒。

在一个实施方案中,RecE/T和/或Redα/β或其他细菌重组酶是从细胞的表达质粒中重组制备的,所选载体必须与下面部分5.2.3中所述的细菌重组酶表达质粒兼容。本领域技术人员非常清楚,在单一细胞中多个质粒表达所必须的兼容性需求。在原核细胞中增殖两个或多个构建物的方法是本领域技术人员众所周知的。例如,含有多个复制子的细胞,可以应用含有适宜兼容复制起点的载体和独立筛选系统来选择并维持(见Miller et al.,1992,supra;Sambrook et al.,1989,supra)。

5.2.2  细菌重组酶

本发明主要描述了关于RecE/T和/或Redα/β的应用。但是,经验丰富的技术人员应该很清楚,本发明同样适用于其他细菌重组酶的应用,采用一对同源双链DNA分子作为底物,所述其他细菌重组酶具有介导同源重组的能力。这里应用的细菌重组酶是一种在细菌、或噬菌体或细菌起点中内源表达的重组酶,并具有介导同源重组的能力。在多个实施方案中,细菌重组酶是RecE/T和/或Redα/β重组酶。在另一个特定实施方案中,启动同源重组的功能等价系统包括来自噬菌体P22的erf蛋白。而且,在本发明的应用中,细菌重组酶的各别蛋白组分可以由其他功能组分来取代。

这里应用的“RecE”和“RecT”首先指大肠杆菌,如大肠杆菌K12,中的RecE或RecT。大肠杆菌RecE和RecT的核苷酸和氨基酸序列是众所周知的(RecE,GenBank Accession No.M24905和SWISS-PROTAccession No.P15033;RecT,GenBank Accession No.L23927和SWISS-PROT Accession No.P33228)。“Redα”和“Redβ”指噬菌体λ编码蛋白。Redα具有与RecE 5’到3’核酸外切酶相似的5’到3’核酸外切酶活性,Redβ具有与RecT相似的DNA退火活性。这两种λ蛋白的核苷酸和氨基酸序列也是众所周知的(见GenBank Accession Nos.J02459;M17233)。

经验丰富的技术人员应该很清楚,涉及RecE/T和/或Redα/β的参考文献也适用于RecE/T和Redα/β联合应用的情况,除非有特别说明或有上下文指示。在一个特定实施方案中,联合应用两种酶复合物对于重组效率具有协同作用。

可以应用的重组酶还包括重组酶组分的等位基因变异体。例如,在本发明RecE/T和Redα/β重组系统中应用的氨基酸序列还可以包括由RecE,RecT,Redα或Redβ的任何等位基因变异体编码的氨基酸序列,只要这些等位基因变异体是功能变异体,并至少在一定程度上具有同源重组活性。这些等位基因变异体可以应用标准重组DNA技术(见,例如Methods in Enzymology,1987,volume 154,Academic Press;Sambrooket al.,1989,Molecular Cloning-A Laboratory Manual,2nd Edition,ColdSpring Harbor Press,New York;and Ausubel et al.,Current Protocols inMolecular Biology,Greene Publishing Associates and Wiley Interscience,New York)或蛋白进化方法(Jermutus et al.,1998,Curr.Opin.Biotechnol.9:534-548)进行常规鉴定、制备。

通常情况下,编码这些等位基因变异体的核苷酸应该可以在中度严格条件下(应用,例如标准Southem印迹杂交条件,最后在42℃用0.2×SSC/0.1%SDS清洗;Ausubel et al.,Current Protocols in MolecularBiology,Vol.I,Green Publishing Associates,Inc.,and John Wiley & sons,Inc.,New York,at p.2.10.3)或高度严格条件下(应用,例如标准Southern印迹杂交条件,最后在68℃用0.1×SSC/0.1%SDS清洗;Ausubel et al.,supra),与编码RecE,RecT,Redα或Redβ的互补序列杂交。

这里应用的RecE,RecT,Redα或Redβ还包括从噬菌体或细胞中衍生的RecE,RecT,Redα或Redβ的同系化合物,所述噬菌体的宿主和所述细胞均是肠杆菌科的原核细胞。肠杆菌科的家族成员包括但不限于埃希氏菌属,沙门氏菌属,柠檬酸细菌属,克雷白杆菌属以及变性菌属。这些RecE,RecT,Redα或Redβ的同系化合物通常由噬菌体基因组中的基因编码,该基因产物参与噬菌体生命周期中重组酶介导的过程,如在λ噬菌体生命周期中的Redα和Redβ。

RecE/T同系化合物可以应用标准原核基因和重组DNA技术进行常规鉴定、制备(见如,Sambrook et al.,supra,and Ausubel et al.,supra)。重组DNA可以通过克隆基因组或cDNA文库,或通过PCR扩增技术获得。例如,基因组文库可以通过标准分子生物学技术获得,也可通过商业渠道或非商业渠道获得。然后应用能够与大肠杆菌recE或recT探针杂交的核酸进行筛检(Grunstein and Hogness,1975,Proc.Natl.Acad.Sci U.S.A.72:3961),分离阳性克隆,并进行序列分析。

在一个特定实施例中,RecE或RecT的同系化合物在鼠沙门氏伤寒杆菌中常规鉴定。RecE和recT基因在大肠杆菌K-12中的性质已经非常清楚,RecE(GenBank Accession No.M24905和SWISS-PROTAccession No.P15033)和RecT(GenBank Accession No.L23927和SWISS-PROT Accession No.P33228)的核苷酸和蛋白序列也已知(还见Bachmann,1990,Microbiol.Rev.54:130-197;Rudd,1992,in Miller,1992,supra,pp.2.3-2.43)。可以应用鼠沙门氏伤寒杆菌的完整基因组粘粒或λ文库。然后在如上所述的杂交条件下,通过与大肠杆菌RecE或RecT探针杂交来筛检鼠沙门氏伤寒杆菌文库。例如,由于两个基因的同源性预期非常高,因此优选标准中等严格的杂交条件。

在一个实施方案中,这样的条件包括:含有DNA的滤器在含有6XSSC,5X Denhart’s溶液,0.5%SDS和100ug/ml变性鲑鱼精子DNA的溶液中,55℃预处理6小时。杂交在相同溶液中进行,应用的探针是5-20×106cpm32P标记的。滤器在55℃的杂交混合物中孵育18-20小时,然后用含有1X SSC和0.1% SDS的溶液,60℃清洗2次,30分钟。然后将滤器印迹干燥,暴露于X线片,放射自显影。可以应用的其他中等严格条件是本领域众所周知的。滤器的清洗是在37℃,应用含有2X SSC,0.1% SDS的溶液,进行1小时。随后进行的含有鼠沙门氏伤寒杆菌克隆的分离、纯化和特征分析可以按照本领域众所周知的方法进行(见Ausubel et al.,supra)。这些序列可以用来构建本发明鼠沙门氏伤寒杆菌RecE/Ts。

此外,鼠沙门氏伤寒杆菌基因还可从鼠沙门氏伤寒杆菌mRNA中分离。mRNA可以从表达RecE或RecT蛋白的细胞中分离。通过逆转录mRNA可以制备cDNA,然后应用本领域已知的方法进行筛检,如上述筛检基因组文库的方法(见Ausubel et al.,supra)。此外,recE或recT cDNA还可应用PCR技术进行鉴定,如RACE(cDNA末端的快速扩增,Ausubel et al.,supra),在该技术中,应用两个根据大肠杆菌recE或recT序列设计的引物:“前导”引物的序列与大肠杆菌recE或recTmRNA的5’端相同,“反向”引物与其3’端互补。PCR产物可以通过序列分析进行校正,然后亚克隆,用于构建本发明的RecE/T。这些cDNA序列也可应用本领域众所周知的方法,用于分离鼠沙门氏伤寒杆菌基因组recE或recT序列(Sambrook et al.,1989,supra;Ausubel et al.,supra)。

编码本发明RecE/T重组酶的核酸分子还可根据本领域技术人员众所周知的重组和合成方法,进行合成和/或构建(见如,Sambrook et al.,supra and Ausubel et al.,supra)。

如下所述,控制序列表达的能力对于应用本发明方法是非常有益的,这种序列表达的控制可以使表达能够调节(如可诱导),并使表达水平范围非常宽。

核酸分子可以,例如在染色体外维持,如在质粒、粘粒或噬菌体上。此外,核酸分子还可以应用,例如噬菌体转导或转位,整合到染色体上,如大肠杆菌染色体上。这样,RecE/T编码序列就可以通过标准技术,经工程学手段以高拷贝、低拷贝或单一拷贝存在于每个细胞中。也可应用多种不同的调控序列来驱动重组蛋白的表达。表达/菌株构建的每一方面都可操作,用以制备重组蛋白表达水平各异的细胞。应该指出,重组蛋白编码序列在染色体上的单一拷贝还有其他优势,即这样的配制使菌株的构建更加容易。

5.2.2.1  蛋白表达

细菌重组酶在细菌、酵母、昆虫或哺乳动物细胞中的表达或者是固定的,或者是可诱导的。在一个优选实施方案中,重组蛋白在细菌中表达,最优选在大肠杆菌中表达。例如,宿主细胞可以在其染色体上包括recE和recT基因。内源性表达RecE/T的大肠杆菌示例是已知的,例如大肠杆菌sbcA菌株(Zhang et al.,1998,supra)。此外,RecE/T还可从非染色体DNA中重组表达,优选在质粒载体上,如pBADETγ(Zhanget al.,1998,supra)或pGETrec(Narayanan et al.,1999,Gene Ther.6:442-447)。同样,Redα/β对于整合了λ前噬菌体的菌株可以是内源性的,也可以由质粒表达,如pBADαβγ(Muyrers et al.,1999,supra)。可以根据标准重组DNA技术构建RecE/T和/或Redα/β表达构建物(见,例如Methods in Enzymology,1987,volume 154,Academic Press;Sambrook et al.,1989,Molecular Cloning-A Laboratory Manual,2ndEdition,Cold Spring Harbor Press,New York;and Ausubel et al.,CurrentProtocols in Molecular Biology,Greene Publishing Associates and WileyInterscience,New York,每部文献在此全文引入,作为参考)。

在一个实施方案中,RecE/T和/或Redα/β在大肠杆菌中由高拷贝质粒表达,所述高拷贝质粒如含有ColE1衍生性复制起点的质粒,其示例是本领域众所周知的(见Sambrook et al.,1989,supra;还见Miller,1992,A Short Course in Bacterial Genetics,Cold Spring HarborLaboratory Press,NY,及其引用的参考文献),如pUC19及其衍生物(Yanisch-Perron et al.,1985,Gene 33:103-119)。

关于在不同表达水平进行表达(调节的或固定的)调控的问题,本领域技术人员知道很多这样的调控序列。如下所述,产生宽范围表达水平的能力对于应用本发明方法是有益的。这种表达可以通过固定以及调控或诱导的形式实现。

通过应用多种可诱导调控序列,可以实现不同表达水平的诱导表达。在一个实施方案中,例如,这些多肽的编码序列通过lacOP调控序列转录时,应用lacI基因及其诱导子IPTG可以产生RecE/T的可诱导、高水平表达。

RecE和RecT可以通过不同启动子表达,或者,recE和recT基因可以在多顺反子mRNA中通过单一启动子表达。这些异源启动子可以是可诱导的,也可以是固定的。该表达优选通过可诱导启动子调控。不同表达水平的可诱导表达可以通过多种可诱导调控序列实现。在一个实施方案中,例如,这些多肽的编码序列通过lacOP调控序列转录时,应用lacI基因及其诱导子IPTG可以产生RecE/T的可诱导、高水平表达。大量其他可诱导启动子系统也可应用,它们对于本领域技术人员来说是众所周知的。通过应用不同强度的启动子,RecE/T或Redα/β构建物的表达水平也可不同。

其他可以应用的表达调控系统包括但不限于可通过阿拉伯糖(AraC)诱导的araC启动子,TET系统(Geissendorfer and Hillen,1990,Appl.Microbiol.Biotechnol.33:657-663),噬菌体λ温度的PL启动子和可诱导λ抑制子CI857(Pirrotta,1975,Nature 254:114-117;Petrenko et al.,1989,Gene 78:85-91),trp启动子和trp抑制子系统(Bennett et al.,1976,Proc.Natl.Acad.Sci USA 73:2351-55;Wame et al.,1986,Gene 46:103-112),lacUV5启动子(Gilbert and Maxam,1973,Proc.Natl.Acad.SciUSA 70:1559-63),lpp(Nokamura et al.,1982,J.Mol.Appl.Gen.1:289-299),T7基因-10启动子,phoA(碱性磷酸酶),recA(Horii et al.,1980)以及tac启动子,可以通过色氨酸诱导的trp-lac融合启动子(Amann et al.,1983,Gene 25:167-78),例如,都是常用的强启动子,每种启动子控制的蛋白水平,都可累积达到细胞总蛋白的大约1-10%。如果需要更强的启动子,tac启动子的强度大约比lacUV5强10倍,但会导致高水平基线表达,因此,应只用于需要过量表达的情况。如果需要更弱的启动子,其他细菌启动子是本领域众所周知的,例如,麦芽糖、半乳糖或其他所需启动子(这些启动子的序列可以通过Genbank获得,(Burks et al.,1991,Nucl.Acids Res.19:2227-2230)

用于本文描述方法的细胞可以是含有RecE/T和/或Redα/β重组酶的任何细胞。优选地,宿主细胞是革兰阴性细菌细胞。更优选,宿主细胞是肠细菌属细胞。肠杆菌科的家族成员包括但不限于埃希氏菌属,沙门氏菌属,柠檬酸细菌属,克雷白杆菌属以及变性菌属。最优选的宿主细胞是大肠杆菌细胞。细胞可以来自任何生物体,包括但不限于酵母、蝇类、鼠或人类细胞,只要这些细胞能够经工程学修饰表达适宜的重组酶。重组酶优选来自大肠杆菌的RecE/T重组酶,或者来自噬菌体λ的Redα/β重组酶,或者是来自肠杆菌属或肠杆菌属噬菌体的RecE/T或Redα/β重组酶系统的功能等价物,这些系统可以介导同源序列区域之间的重组。

表达RecE/T和/或Redα/β蛋白的细胞可以通过事先电赋能制备,并储存于-70℃。

此外,本发明方法还可在其他任何能够表达RecE/T和/或Redα/β的细胞中进行。例如,多种宿主载体系统可以用来表达蛋白编码序列。这些包括但不限于病毒(如牛痘表达,腺病毒等)感染的哺乳动物细胞系统,病毒(如杆状病毒)感染的昆虫细胞系统,微生物,例如含有酵母载体的酵母,或者噬菌体、DNA、质粒DNA或粘粒DNA转化的细菌。载体的表达元件在其强度和特异性方面各不相同。根据应用的宿主载体系统,可以选择应用任何一种适宜的转录、翻译元件。在特定实施方案中,表达RecE/T和/或Redα/β基因,或者编码RecE/T和/或Redα/β功能活性部分的序列。在另一个实施方案中,表达含有RecE/T和/或Redα/β蛋白功能区的RecE/T和/或Redα/β片段。

将DNA片段插入载体的任一种上述方法都可用于构建含有嵌合基因的表达载体,所述嵌合基因包括适宜的转录/翻译调控信号和蛋白编码序列。这些方法包括体外重组DNA和合成技术,以及体内重组技术(基因重组)。编码RecE/T或Redα/β蛋白或多肽片段的核酸序列的表达,可以通过第二个核酸序列调控,这样,RecE/T或Redα/β蛋白或多肽可以在转化了重组DNA分子的宿主细胞中表达。例如,RecE/T或Redα/β蛋白的表达可以通过任何本领域已知的启动子/增强子元件来调控。可用于调控RecE/T或Redα/β表达的启动子包括但不限于SV40早启动子区域(Bernoist and Chambon,1981,Nature 290:304-310),Rous肉瘤病毒3’端长末端重复序列包括的启动子(Yamamoto et al.,1980,Cell 22:787-797),疱疹病毒胸腺嘧啶脱氧核苷激酶启动子(Wagner etal.,1981,Proc.Natl.Acad.Sci.USA 78:1441-1445),金属硫因基因调控序列(Brinster et al.,1982,Nature 296:39-42);植物表达载体包括nopaline合成酶启动子区域(Herrera-Estrella et al.,1984,Nature 303:209-213)或花椰菜嵌合病毒35S RNA启动子(Gardner et al.,1981,Nucl.Acids Res.9:2871),以及光合成酶二磷酸核酮糖羧化酶启动子(Herrera-Estrella et al.,1984,Nature 310:115-120);来自酵母或其他真菌的启动子元件,如Gal 4启动子,ADC(乙醇脱氢酶)启动子,PGK(磷酸甘油激酶)启动子,碱性磷酸酶启动子,以及下述具有组织特异性并已用于转基因动物的动物转录调控区域:在胰腺腺泡细胞中具有活性的弹性蛋白酶I基因调控区域(Swift et al.,1984,Cell 38:639-646;Ornitz et al.,1986,Cold Spring Harbor Symp.Quant.Biol.50:399-409;MacDonald,1987,Hepatology 7:425-515);在胰腺β细胞中具有活性的胰岛素基因调控区域(Hanahan,1985,Nature 315:115-122),在淋巴细胞中具有活性的免疫球蛋白基因调控区域(Grosschedl et al.,1984,Cell38:647-658;Adames et al.,1985,Nature 318:533-538;Alexander et al.,1987,Mol.Cell.Biol.7:1436-1444),在睾丸、乳腺、淋巴和肥大细胞中具有活性的鼠哺乳动物肿瘤病毒调控区域(Leder et al.,1986,Cell 45:485-495),在肝脏细胞中具有活性的白蛋白基因调控区域(Pinkert et al.,1987,Genes and Devel.1:268-276),在肝脏细胞中具有活性的甲胎蛋白基因调控区域(Krumlauf et al.,1985,Mol.Cell.Biol.5:1639-1648;Hammer et al.,1987,Science 235:53-58);在肝脏细胞中具有活性的α1-抗胰蛋白酶基因调控区域(Kelsey et al.,1987,Genes and Devel.1:161-171),在髓细胞中具有活性的β球蛋白基因调控区域(Mogram et al.,1985,Nature 315:338-340;Kollias et al.,1986,Cell 46:89-94);在脑少突细胞中具有活性的髓磷脂碱性蛋白基因调控区域(Readhead et al.,1987,Cell 48:703-712);在骨骼肌中具有活性的肌球蛋白轻链-2基因调控区域(Sani,1985,Nature 314:283-286),以及在下丘脑具有活性的促性腺激素释放激素基因调控区域(Mason et al.,1986,Science 234:1372-1378)。

在一个特定实施方案中,应用的载体包括一个与细菌重组酶(如RecE或RecT)编码核酸操作性相连的启动子,一个或多个复制起点,并可任选一个或多个可选择标记(如抗生素耐药基因)。

所选载体必须与上面部分5.2.1所述的载体质粒兼容。本领域技术人员非常清楚,在单一细胞中维持多个质粒所必须的兼容性需求。在原核细胞中增殖两个或多个构建物的方法是本领域技术人员众所周知的。例如,含有多个复制子的细胞,可以应用含有适宜兼容复制起点的载体和独立筛选系统来常规选择并维持(见Miller et al.,1992,supra;Sambrook et al.,1989,supra)。

5.2.3  宿主细胞

用于本发明的克隆方法和克隆DNA增殖的宿主细胞可以是表达recE和recT和/或redα和redβ基因产物的任何细胞,也可以是这些基因能够异源表达的任何细胞。可以应用的可能细胞类型示例包括但不限于原核真核细胞,如细菌、酵母、植物、啮齿类动物、鼠、人类、昆虫或哺乳动物细胞。在一个优选实施方案中,宿主细胞是细菌细胞。在最优选实施方案中,宿主细胞是大肠杆菌细胞。可以应用的特定大肠杆菌菌株示例是JC 8679和JC 9604。JC 8679和JC 9604的基因型是Sex(Hfr,F+,F-,或F):F-JC 8679包括的变异:recBC 21,recC 22,sbcA 23,thr-1,ara-14,leu B6,DE(gpt-proA)62,lacYl,tsx-33,gluV44(AS),galK2(Oc),LAM-his-60,relA 1,rps L 31(strR),xyl A5,mtl-1,argE3(Oc)和thi-1。JC 9604包括相同的变异,以及recA 56变异。

在另一个实施方案中,应用真核细胞作为本文描述的克隆和亚克隆方法的宿主细胞。可以应用任何表达或经工程学修饰可以表达细菌重组酶或其功能等价物的细胞。可以应用来自人类、鼠、猴子或其他任何生物体的细胞系。例如,用于本发明方法的非限制性细胞系示例包括CHO,VERO,BHK,HeLa,COS,MDCK,293,3T3以及WI38细胞。

多种宿主载体系统都可用于导入或表达RecE/T,Redα/β或其功能等价系统的蛋白编码序列。这些方法是本领域众所周知的(见Ausubelet al.,Current Protocols in Molecular Biology,Greene PublishingAssociates and Wiley Interscience,New York)。这些包括但不限于病毒(如牛痘表达,腺病毒等)感染的哺乳动物细胞系统,病毒(如杆状病毒)感染的昆虫细胞系统,微生物,例如含有酵母载体的酵母,或者噬菌体、DNA、质粒DNA或粘粒DNA转化的细菌。蛋白表达的方法也在上面部分5.2.2中给予探讨。

5.2.4  靶DNA

应根据实验设计选择靶DNA,靶DNA可以是任意双链DNA,其长度可以只有1个碱基对,也可以超过10万个碱基对。在一个特定实施方案中,靶DNA长度高达100,125,200或300kb。在另一个特定实施方案中,靶DNA含有25-100千碱基对,例如,与BAC载体中存在的相似。靶DNAs的其他特定实施方案将在部分6的实施例中给予说明。靶DNA可以存在于任何独立复制的DNA分子上,例如但不限于质粒,BAC或大肠杆菌染色体。靶DNA还可位于任意来源的DNA分子是,包括但不限于来源于原核细胞、古细菌或真核细胞的DNA,或者来源于病毒、噬菌体或合成体的DNA。例如,可以从下述来源获得核酸序列:人类,猪,牛,猫,禽类,马,犬,昆虫(如果蝇),无脊椎动物(如C.elegans),植物等。DNA可以通过本领域已知的标准方法来制备(见,例如Sambrook,et al,1989,Molecular Cloning,ALaboratory Manual,2d Ed.,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,New York;Glover(ed.),1985,DNA Cloning:A PracticalApproach,MRL Press,Ltd.,Oxford,U.K.Vol.I,II)。

5.3  本发明的应用方法

5.3.1  将DNA导入宿主细胞

任何已知将含有靶DNA的DNA制剂导入宿主细胞的方法,均适用于上述方法。这些方法在本领域已知,包括但不限于细胞的电转化,应用氯化钙或铷制备功能细胞,应用包裹于病毒颗粒中的靶DNA转化DNA。对于真核细胞,方法包括但不限于电转化、转染磷酸钙沉淀的DNA和病毒包裹。在一个优选实施方案中,应用电转化。处理含有RecE/T或Redα/β蛋白的细胞,使之适用于标准方法的电转化(见Ausubel et al.,Current Protocols in Molecular Biology,Greene PublishingAssociates and Wiley Interscience,New York)。优选地,大约50ul标准电转化功能细胞制剂用于标准方法的电转化。在需要转化线性或环状载体的实验中,优选应用≥0.3ug的载体。在需要转化含有靶DNA的DNA制剂的实验中,优选应用≥0.3ug。对于共转化实验,优选在电转化前混和DNAs。电转化后,优选将细胞在培养基中稀释,并在条件培养前孵育大约1.5小时,作为复苏期,所述条件能够鉴别由可选择标记基因导致的表型改变。

在应用位点特异性重组或核酸内切酶酶切载体的实验中,在制备电转化功能细胞之前,或者在电转化后的复苏期间,或者在鉴定可选择标记的培养期间,可以诱导SSR或核酸内切酶的表达,或者诱导SSR和核酸内切酶的联合表达,或者诱导两个SSR的联合表达。

任选的表型改变是对一种抗生素的耐药性,将细胞培养于含有相应抗生素的平板上。在这种情况下,过夜培养后显示抗生素耐药性的集落主要含有所需亚克隆产物。

在另一个实施方案中,DNA通过转导导入宿主细胞,转导的DNA业已包装在噬菌体颗粒中。本领域已知P1或λ噬菌体的转导和包装过程。λ包装提取物可以通过商业渠道购买(例如,通过Promega,Madison,WI)。

5.3.2  寡核苷酸

与本发明方法联合应用的寡核苷酸同源臂、引物和衔接子寡核苷酸通常长度大约为10-100个核苷酸。在某些特定方面,寡核苷酸长度是10个核苷酸,15个核苷酸,20个核苷酸,50个核苷酸,或者100个核苷酸,或者高达200个核苷酸。在优选实施方案中,寡核苷酸长度大约为90个核苷酸。

寡核苷酸可以通过本领域已知的任何方法进行合成(例如,在Applied Biosystems 392/394 DNA合成仪上进行标准亚磷酸胺化学合成)。而且,合成试剂可以通过任一家供应商获得。

与本发明方法联合应用的寡核苷酸或其衍生物可以通过本领域已知的任何方法合成,例如,应用自动DNA合成仪(如可以通过商业渠道从Biosearch,Applied Biosystems等购买)。作为示例,硫代磷酸寡核苷酸可以通过Stein等的方法合成(1988,Nucl.Acids Res.16,3209),甲基磷酸化寡核苷酸可以通过应用控制孔玻璃多聚体支持物来制备(Sarin et al.,1988,Proc.Natl.Acad.Sci.USA 85,7448-7451)等。

一个寡核苷酸可以包括至少一个修饰碱基,只要这种修饰不会干扰同源重组。例如,这些修饰包括但不限于5-氟尿嘧啶,5-溴尿嘧啶,5-氯尿嘧啶,5-碘尿嘧啶,次黄嘌呤,黄嘌呤,4-乙酰胞嘧啶,5-(羧羟甲基)尿嘧啶,5-羧甲氨甲基-2-硫尿嘧啶核苷,5-羧甲氨甲基尿嘧啶,双氢尿嘧啶,β-D-galactosylqueosine,次黄嘌呤核苷,N6-异戊烯腺嘌呤,1-甲基鸟嘌呤,1-甲基次黄嘌呤核苷,2,2-二甲基鸟嘌呤,2-甲基腺嘌呤,2-甲基鸟嘌呤,3-甲基胞嘧啶,5-甲基胞嘧啶,N6-腺嘌呤,7-甲基鸟嘌呤,5-甲氨甲基尿嘧啶,5-甲氧氨甲基-2-硫尿嘧啶,β-D-mannosylqueosine,5’-甲氧羧甲基尿嘧啶,5-甲氧尿嘧啶,2-甲硫-N6-异戊烯腺嘌呤,尿嘧啶-5-氧乙酸(v),甲尿嘧啶,queosine,2-硫胞嘧啶,5-甲基-2-硫尿嘧啶,2-硫尿嘧啶,4-硫尿嘧啶,5-甲基尿嘧啶,尿嘧啶-5-氧乙酸甲酯,尿嘧啶-5-氧乙酸(v),5-甲基-2-硫尿嘧啶,3-(3-氨-3-N-2-羧丙基)尿嘧啶,以及2,6-二氨基嘌呤。

寡核苷酸包括至少一个修饰的磷酸主干,只要这种修饰不会干扰同源重组。这些修饰包括但不限于硫代磷酸酯,二硫代磷酸酯,硫代亚磷酰胺,亚磷酰胺,亚磷酰二胺,甲基碳磷酸化合物,烷基磷酸三酯,以及甲缩醛或其类似物。

5.3.3 DNA扩增

可以应用聚合酶链反应(PCR)连同本发明,从某一来源(如,组织样本,基因组或cDNA文库)扩增所需序列。代表已知序列的寡核苷酸引物可以用作PCR引物。进行典型的PCR需要应用热循环仪(如来自Perkin-Elmer Cetus)和热稳定聚合酶(如Gene AmpTM牌的Taq聚合酶)。待扩增核酸模板包括但不限于任何物种的mRNA,cDNA或基因组DNA。PCR扩增方法是本领域众所周知的(见,例如美国专利号4,683,202,4,683,195和4.889.818;Gyllenstein et al.,1988,Proc.Natl.Acad.Sci.USA 85,7652-7656;Ochman et al.,1988,Genetics 120,621-623;Loh,et al.,1989,Science 243,217-220)。

5.4  诊断应用的方法

本发明方法可用于探测、预后、诊断或监测多种与异源或变异DNA相关的感染、病况、疾病和功能紊乱,或监测其治疗情况。例如,如下部分5.4.1所述,这些方法可以用于探测、预后、诊断或监测多种感染和疾病,如与病毒感染、细菌感染或原生动物、寄生虫或其他已知病原体感染有关的疾病。如下部分5.4.2所述,这些方法可以用于探测、预后、诊断或监测多种与变异DNA存在相关的感染、病况、疾病和功能紊乱,如基因突变或单核苷酸多态性(SNP)。以诊断为目的的方法将在这里给予详尽阐述。

5.4.1  探测异源DNA

上面描述的本发明方法还可用于探测异源DNA,如在暴露于病原体的患者中,探测源于病原体暴露而产生的病毒或细菌DNA。患者可能出现也可能没出现病原体感染症状,或与病原体存在相关的疾病或功能紊乱。例如,在一个实施方案中,靶DNA样本可以从患有或怀疑患有这种疾病或感染的患者DNA中制备。设计并制备具有与异源靶DNA同源序列的同源臂。然后应用上面部分5.1所述任一方法,将样本DNA导入表达细菌重组酶并含有载体DNA的大肠杆菌宿主细胞中。在另一个实施方案中,衔接子寡核苷酸可以设计包括与载体序列同源的第一个序列,以及与异源靶DNA同源的第二个序列,其定向性细节如上面部分5.1所述。这些衔接子寡核苷酸可以与样本DNA和载体DNA一起,共同转染表达RecE/T或Redα/β的大肠杆菌宿主细胞,也可以直接转染已经包括载体DNA和样本DNA的细胞。然后如上面部分5.1所述,将细胞在选择培养基中培养,呈现选择抗性的细胞可以用来分析适宜大小插入序列的存在。

靶DNA可以从患者或受试者的生物样本中分离,例如但不限于全血,血浆,血清,皮肤,唾液,尿液,淋巴液,活检细胞,组织培养细胞,培养基,也可以从非生物样本中分离,如食物,水或其他材料。从这些材料中制备DNA的方法是本领域技术人员熟知的(见,如CurrentProtocols in Molecular Biology series of laboratory technique manuals,1987-1994 Current Protocols,1994-1997 John Wiley and Sons,Inc.)。

例如,在一个实施方案中,需要探测或诊断一种病毒感染或疾病,同源臂包括与已知病毒DNA的DNA序列同源的DNA序列。这些方法可以用来探测、分离病毒DNA,其形式可以是病毒DNA链,也可以是DNA或RNA病毒的DNA复制中间产物。

例如,在一个实施方案中,可以应用同源臂直接确定DNA基因组或DNA病毒的复制中间产物,所述同源臂序列被设计成与病毒序列同源,这些DNA病毒包括但不限于乙型肝炎病毒,细小病毒如腺相关病毒和巨细胞病毒,Papova病毒如乳头状瘤病毒、多瘤病毒和SV40,腺病毒,疱疹病毒如I型单纯疱疹病毒(HSV-I)、II型单纯疱疹病毒(HSV-II)和EB病毒,以及痘病毒如痘症(天花)和牛痘病毒。在另一个实施方案中,可以应用同源臂直接确定从DNA中间产物复制获得的逆病毒RNA病毒的复制中间产物,所述同源臂序列被设计成与病毒序列同源,这些RNA病毒包括但不限于I型人类免疫缺陷病毒(HIV-I),II型人类免疫缺陷病毒(HIV-II),I型嗜人类T淋巴细胞病毒(HTLV-I),II型嗜人类T淋巴细胞病毒(HTLV-II)。在另一个实施方案中,为了探测、分离从RNA中间产物复制获得的RNA病毒的基因组或复制中间产物,可以根据本领域众所周知的方法,分离RNA,并应用逆转录酶将其转录成RNA的cDNA拷贝。这些cDNA拷贝就可作为靶DNA来探测RNA病毒的存在,所述RNA病毒如流感病毒,麻疹病毒,狂犬病病毒,Sendai病毒,细小核糖核酸病毒如脊髓灰质炎病毒,柯萨奇病毒,鼻病毒,呼肠病毒,披膜病毒如风疹病毒(德国麻疹)和Semliki森林病毒,虫媒病毒,以及甲型肝炎病毒。

在另一个优选实施方案中,需要诊断或探测细菌感染,同源臂包括与已知细菌DNA序列同源的DNA序列。例如,在一个实施方案中,同源臂DNA序列可以与病原细菌的cDNA或基因组DNA同源,所述细菌包括但不限于酿脓链球菌,肺炎链球菌,淋病奈瑟球菌,脑膜炎奈瑟球菌,白喉棒状杆菌,肉毒梭状芽胞杆菌,产气荚膜梭状芽胞杆菌,破伤风梭状芽胞杆菌,流感嗜血杆菌,肺炎克雷白杆菌,臭鼻克雷白杆菌,鼻硬结克雷白杆菌,金黄色葡萄球菌,霍乱弧菌,大肠杆菌,绿脓杆菌,胚胎弯曲杆菌,空肠弯曲杆菌,嗜水气单胞菌,cereus杆菌,迟钝爱德华菌,小肠结肠炎耶尔森氏菌,鼠疫耶尔森氏菌,假结核耶尔森氏菌,志贺痢疾杆菌,弗氏志贺菌,宋内志贺菌,鼠伤寒沙门氏菌,梅毒螺旋体,极细密螺旋体,品他病密螺旋体,奋森氏疏螺旋体,出血性黄疽钩端螺旋体,结核分支杆菌,鼠弓形体,卡氏肺囊虫,土拉弗朗西斯菌,流产布鲁氏菌,猪布鲁氏菌,马尔他布鲁氏菌,Mycoplasma spp.,恙虫热立克次体,Chlamydia spp.,以及幽门螺旋杆菌。

在另一个实施方案中,同源臂DNA序列可以与病原性真菌的cDNA或基因组DNA同源,所述真菌包括但不限于Coccidioidesimmitis,烟曲霉,白色念珠菌,皮炎芽生菌,新型隐球菌,以及荚膜组织胞浆菌。

在另一个优选实施方案中,需要诊断或探测原生动物感染,同源臂可以包括与已知原生动物DNA序列同源的DNA序列。例如,这些同源臂DNA序列可以与任何已知原生动物的cDNA或基因组DNA同源。特别感兴趣的病原性原生动物如Entomoeba histolytica,口腔毛滴虫,人毛滴虫,阴道毛滴虫,冈比亚锥虫,罗德西亚锥虫,克氏锥虫,热带利什曼原虫,巴西利什曼原虫,肺炎肺囊虫,间日疟原虫,恶性疟原虫,以及三日疟原虫。

在另一个优选实施方案中,需要诊断或探测寄生虫感染,同源臂可以包括与已知寄生虫DNA序列同源的DNA序列。例如,这些同源臂DNA序列可以与任何已知寄生虫的cDNA或基因组DNA同源,这些寄生虫包括,例如蠕虫,包括蛲虫,毛首鞭虫,蛔虫,旋毛虫,粪类圆线虫,  日本血吸虫,曼氏血吸虫,埃及血吸虫以及钩虫。

5.4.2  在细胞DNA中诊断突变和多态性

本发明方法还可用于在患者样本中分离、探测遗传紊乱,并预后、诊断或监测与变异DNA相关的多种病况、疾病和功能紊乱,所述变异DNA如基因突变或单核苷酸多态性(SNP),以及探测罹患某种疾病或功能紊乱的遗传倾向性。

例如,在一个实施方案中,靶DNA样本可以从患有或怀疑患有某种遗传性疾病或功能紊乱的患者样本DNA中分离制备。在一个优选实施方案中,设计并制备含有同源臂的载体,并导入表达细菌重组酶如RecE/T和/或Redα/β的大肠杆菌宿主细胞中,所述同源臂的序列与特定目标基因或目标基因组区域同源。然后将样本DNA导入宿主细胞。在另一个实施方案中,设计的衔接子寡核苷酸包括与载体序列同源的第一个序列,以及与目标靶基因DNA同源的第二个序列,其定向性细节如上面部分5.1所述。在一个优选实施方案中,这些衔接子寡核苷酸可以与样本DNA一起,共同转染表达RecE/T和/或Redα/β并含有载体DNA的大肠杆菌宿主细胞。此外,还可应用上面部分5.1详细描述的任何其他用于同源重组克隆的方法。然后如上面部分5.1所述,在选择培养基中培养细胞,分析抗选择细胞中适宜大小插入序列的存在。然后通过本领域众所周知的限制性分析或序列分析技术,分析DNA中目标突变或DNA变异体的存在(见,例如Current Protocols in Molecular Biologyseries of laboratory technique manuals,1987-1994 Current Protocols,1994-1997 John Wiley and Sons,Inc.)。

在另一个实施方案中,同源臂或衔接子寡核苷酸可以包括目标基因突变或DNA多态性序列。在该实施方案中,只有样本DNA包括该突变时,重组才会发生。该方法可用于诊断性筛检大规模样本中的特定突变或DNA多态性,因为只有包括这一特定突变的细胞才会对选择具有抗性。

靶DNA可以从任何DNA样本中获得,如基因组DNA,cDNA或线粒体DNA。例如,在一个实施方案中,靶DNA可以是人类染色体的一个区域。在另一个实施方案中,靶DNA是混和形式,例如从众多目标受试者中获得的基因组DNA混和物,所述目标受试者如罹患某一特定功能紊乱的患者。这样的靶DNA可以从生物样本中分离,例如但不限于全血,血浆,血清,皮肤,唾液,尿液,淋巴液,活检细胞,组织培养细胞,培养基,也可以从非生物样本中分离,如食物,水或其他材料。从这些材料中制备DNA的方法是本领域技术人员熟知的(见,如Current Protocols in Molecular Biology series of laboratory techniquemanuals,1987-1994 Current Protocols,1994-1997 John Wiley and Sons,Inc.)。

可以应用该方法检测的遗传性功能紊乱的非限制性示例包括与遗传性疾病相关的突变和SNPs,如与乳腺癌相关的Brca-1,与囊性纤维化、Tay-Sachs病、镰状细胞性贫血、血友病、动脉硬化、糖尿病、白血病、前列腺癌及其他肿瘤、以及肥胖相关的突变。这些遗传性疾病还包括退行性、非退行性神经系统疾病如阿尔茨海默病,帕金森氏病,肌萎缩性脊髓侧索硬化,Huntington’s病,Wilson’s病,脊髓小脑性共济失调,Friedreich’s共济失调和其他共济失调,(月元)病毒性疾病包括Creutzfeldt-Jakob病,齿状核红核pallidoluysian萎缩,海绵脑病,肌强直性萎缩,抑郁,精神分裂以及癫痫。遗传性疾病还可能包括代谢性疾病,例如,低血糖或苯丙酮尿症。还包括心血管疾病和病况,这些疾病的非限制性示例包括动脉硬化,心肌梗塞和高血压。本发明还可用来探测、诊断莱姆病,结核和性传播疾病。

在另一个实施方案中,本发明同源重组克隆方法可用于检测一种疾病或功能紊乱的遗传学基础。例如,靶DNA可以从罹患某种功能紊乱的患者样本中分离,所述功能紊乱的遗传学基础尚不知晓。在另一个实施方案中,该克隆方法可用于在一群已知或怀疑患有某种功能紊乱的患者中,分离已知或怀疑与该疾病或功能紊乱相关的染色体区域。然后,应用本领域众所周知的变异DNA绘图技术,如限制性片段长度多态性或其他SNP探测技术,可以进一步分离、分析获得的DNA,探测基因突变或多态性的存在(见如,Nikiforov et al.,1997年10月21日授予的美国专利号5,679,524;McIntosh et al.,1998年12月30日备案的PCTpublication WO 98/59066;Goelet et al.,1995年5月11日备案的PCTpublication WO 95/12607;Wang et al.,1998,Science 280:1077-1082;Tyagi et al.,1998,Nature Biotechnol.16:49-53;Chen et al.,1998,Genome Res.8:549-556;Pastinen et al.,1996,Clin.Chem.42:1391-1397;Chen et al.,1997,Proc.Natl.Acad.Sci.94:10756-10761;Shuber et al.,l997,Hum.Mol.Gen.6:337-347;Liu et al.,1997,Genome Res.7:389-398;Livak et al.,1995,Nature Genet.9:341-342;Day and Humphries,1994,Annal.Biochem.222:389-395)。

目标化学物质相关性靶功能紊乱的非限制性示例包括哮喘,关节炎,银屑病,excema,过敏,耐药,药物毒性以及肿瘤,例如但不限于人类肉瘤和癌症,如纤维肉瘤,粘液肉瘤,脂肪肉瘤,软骨肉瘤,骨肉瘤,脊索瘤,血管肉瘤,内皮肉瘤,淋巴血管肉瘤,淋巴血管内皮肉瘤,滑膜瘤,间皮瘤,Ewing’s肿瘤,平滑肌肉瘤,横纹肌肉瘤,结肠癌,胰腺癌,乳腺癌,卵巢癌,前列腺癌,鳞状上皮细胞癌,基底细胞癌,腺癌,汗腺癌,脂肪腺癌,乳头癌,乳头腺癌,囊腺癌,髓样癌,支气管癌,肾癌,肝细胞瘤,胆管癌,绒毛膜癌,精原细胞瘤,胚胎性癌,Wilm’s肿瘤,宫颈癌,睾丸肿瘤,肺癌,小细胞肺癌,膀胱癌,表皮癌,神经胶质瘤,星型细胞瘤,成神经管细胞瘤,颅咽管瘤,室鼓膜瘤,松果体瘤,成血管细胞瘤,听神经瘤,少突神经胶质细胞瘤,脑膜瘤,黑色素瘤,成神经细胞瘤,视网膜母细胞瘤;白血病,如急性淋巴细胞白血病和急性髓细胞白血病(成髓细胞白血病,前髓细胞白血病,髓单核细胞白血病,单核细胞白血病和红白血病)、慢性白血病(慢性髓细胞(粒细胞)白血病和慢性淋巴细胞白血病),多发性骨髓瘤,Waldenstrom’s巨球蛋白血症,以及重链病。该同源重组克隆方法还可进一步用于诊断、探测异常差异,以及诊断罹患自身免疫性疾病的患者,所述自身免疫性疾病包括但不限于胰岛素依赖性糖尿病,多发性硬化,系统性红斑狼疮,Siogren’s综合征,硬皮病,多肌炎,慢性活动性肝炎,混和性结缔组织病,原发性胆汁性肝硬化,有害的贫血,自身免疫性甲状腺炎,特发性Addison’s病,白癜风,麸质敏感性肠病,Graves病,重症肌无力,自身免疫性中性粒细胞减少症,特发性血小板减少性紫癜,类风湿关节炎,肝硬化,寻常性天疱疮,自身免疫性不育,Goodpasture’s病,大疱性类天疱疮,盘状狼疮,溃疡性结肠炎,以及dense deposit病。

同源重组克隆方法还可用于分离、诊断、探测与疾病无关的DNA突变、改变、变异和SNPs。非限制性示例包括在非编码基因组序列中出现的DNA突变、改变、变异和SNPs,或者与人类不同血型相关的DNA突变、改变、变异和SNPs。

在本发明一个优选方面中,本发明方法可以具体用于分离、探测、诊断、预后或监测人类DNA突变、改变、变异和SNPs。但是,应该理解,这里描述的方法还可用于分离、探测、诊断、预后或监测其他哺乳动物疾病,例如,农用动物包括牛、马、羊、山羊和猪,居家宠物包括猫和狗,以及植物包括农作物和园艺植物。

5.5  试剂盒

本发明还提供了可以使本文描述的同源重组克隆和亚克隆方法更易于应用的试剂盒。在一个实施方案中,提供的试剂盒包括一个或多个容器:a)用于定向克隆或亚克隆目标靶DNA分子的双链DNA载体,该载体包括一个复制起点和两个同源臂,在载体DNA链上,从5’到3’,以下述顺序存在:第一个同源臂,复制起点,以及第二个同源臂;这样,第一条载体DNA链上的第一个同源臂的核苷酸序列与第一条靶DNA链上的第一个末端序列同源,第一条载体DNA链上的第二个同源臂的核苷酸序列与第一条靶DNA链上的第二个末端核苷酸序列同源;以及b)含有细菌重组酶的细胞。该细胞可以内源性表达该重组酶,也可以重组表达该重组酶。

在另一个实施方案中,提供了用于定向克隆或亚克隆靶DNA分子的试剂盒,该试剂盒包括一个或多个容器:a)用于定向克隆或亚克隆目标靶DNA分子的双链DNA载体,该载体包括一个复制起点和两个同源臂,在载体DNA链上,从5’到3’,以下述顺序存在:第一个同源臂,复制起点,以及第二个同源臂,这样,第一条载体DNA链上的第一个同源臂的核苷酸序列与第一条靶DNA链上的第一个末端序列同源,第一条载体DNA链上的第二个同源臂的核苷酸序列与第一条靶DNA链上的第二个末端核苷酸序列同源;b)第一个双链寡核苷酸,含有第一个寡核苷酸DNA链,该链以下述顺序,从3’到5’含有:第一个序列和第二个序列,所述第一个核苷酸序列与载体DNA链上的第一个同源臂的核苷酸序列同源,第二个核苷酸序列与靶DNA链的第一个末端核苷酸序列同源;c)第二个寡核苷酸,含有第二个寡核苷酸链,该链以下述顺序,从3’到5’含有:第三个核苷酸序列和第四个核苷酸序列,所述第三个核苷酸序列与载体DNA链上的第二个同源臂的核苷酸序列同源,第四个核苷酸序列与靶DNA链的第二个末端核苷酸序列同源;以及d)含有细菌重组酶蛋白,如RecE/T和/或Redα/β蛋白的细胞。在一个特定实施方案中,细胞是大肠杆菌细胞。

在另一个实施方案中,本发明提供的试剂盒包括一个或多个容器:a)用于定向克隆或亚克隆目标靶DNA分子的双链DNA载体,该载体包括一个复制起点和两个同源臂,在载体DNA链上,从5’到3’,以下述顺序存在:第一个同源臂,复制起点,以及第二个同源臂,这样,第一条载体DNA链上的第一个同源臂的核苷酸序列与第一条靶DNA链上的第一个末端序列同源,第一条载体DNA链上的第二个同源臂的核苷酸序列与第一条靶DNA链上的第二个末端核苷酸序列同源;b)第一个双链寡核苷酸,含有第一个寡核苷酸DNA链,该链以下述顺序,从3’到5’含有:第一个核苷酸序列和第二个核苷酸序列,所述第一个核苷酸序列与载体DNA链上的第一个同源臂的核苷酸序列同源,第二个核苷酸序列与靶DNA链的第一个末端核苷酸序列同源;以及c)第二个寡核苷酸,含有第二个寡核苷酸链,该链以下述顺序,从3’到5’含有:第三个核苷酸序列和第四个核苷酸序列,所述第三个核苷酸序列与载体DNA链上的第二个同源臂的核苷酸序列同源,第四个核苷酸序列与靶DNA链的第二个末端核苷酸序列同源。

在多个特定实施方案中,试剂盒的靶DNA可以是细菌、病毒、寄生虫、原生动物或病原DNA。在其他特定实施方案中,试剂盒靶DNA可以包括已知或怀疑与某一功能紊乱或疾病相关的基因突变或多态性。在另一个特定实施方案中,衔接子寡核苷酸序列或载体同源臂序列与基于BAC,PAC,λ,质粒或YAC的克隆载体同源。

        6.实施例:克隆和亚克隆RecE/T和Redα/β

在本部分给出的实施例描述了应用本发明同源重组方法,成功克隆、亚克隆的多个实验。还显示了亚克隆方法的不同手段。特别需要指出的是,一个实施例成功克隆了比前述任何插入片段都大的片段——从大约150kb的BAC载体中定向亚克隆了25kb的DNA片段。

6.1.方法和材料

制备线性片段

应用标准PCR反应条件扩增线性DNA片段。从pACYCl77扩增1972bp的p15A起点和卡那霉素耐药基因(来自Tn903)。p15A起点允许该质粒或重组体可以在细胞中与携带ColE1兼容组起点的质粒共同存在。从pACYC184扩增1934bp的氯霉素(来自Tn9)耐药基因和p15A起点。

用于PCR反应的寡核苷酸包括,在其3’端,作为pACYC质粒引物的18-30核苷酸序列,以及5’端,与靶DNA侧翼区同源的50-60个核苷酸延伸序列。对于较长的寡核苷酸,应用的PCR反应退火温度是62℃。通过应用QIAGEN PCR纯化试剂盒(QIAGEN)纯化PCR产物,并用dH2O洗脱。通过应用Dpn I消化PCR产物,去除模板DNA。消化后,应用乙醇沉淀PCR产物,然后再次悬浮于dH2O中,浓度为0.5ug/ul。制备功能细胞

通过标准方法制备电转化功能细胞。简而言之,过夜培养的细胞应用含有适宜抗生素的LB培养基稀释100倍。生长到最佳密度,OD600=0.25-0.4的大肠杆菌细胞在冰上冷冻15分钟。然后在-5℃以7,000rpm离心细菌细胞10分钟。用10%的冰冻甘油再悬沉淀的细菌细胞,然后在-5℃以7,000rpm离心10分钟,以产生沉淀。以冰冻10%甘油清洗、再离心3次后,以等细胞体积的冰冻10%甘油悬浮细胞沉淀。将功能细胞以50ul等分存于eppendorf管,放入液氮冷冻,存于-70℃。

应用质粒pBAD-ETγ或pBAD-αβγ的实验包括应用标准方法将这些质粒转化到大肠杆菌宿主中,然后在添加了0.2%葡萄糖、50ug/ml氨苄青霉素的LB培养基中培养过夜,直至生长到饱和,然后应用添加了50ug/ml氨苄青霉素的LB培养基稀释培养物100倍,并继续生长到OD600为0.15。然后添加L-阿拉伯糖至终浓度为0.1%。在细胞生长到OD600为0.25-0.4后,在冰上冷冻15分钟。电转化

将1ul的DNA溶液(包括大约≥0.5ug的共转化DNA,或者大约≥0.3ug的载体DNA,为细胞提供锚定靶,或者大约≥0.5ug的DNA,含有细胞锚定载体的靶基因)与功能细胞混和。将细胞、DNA混合物转移到冰冻小杯中。应用Bio-Rad基因脉冲仪进行电转化,设置为25uFD,2.3kV,脉冲对照设置为200ohms。电转化后,加入LB培养基(1ml)。细胞在37℃摇动孵育1-1.5小时,然后接种到含有与载体可选择标记基因相应的抗生素平板上。6.2 结果

表1总结了6个实验的结果,在这6个实验中,应用不同来源的RecE/T或Redα/β表达亚克隆了不同目标靶DNA区域。第一列以“ET”表达开头,是指RecE/T或Redα/β来源,如表所示,其来源可以是大肠杆菌宿主JC8679或JC9604的内源性RecE/T,也可以是源于质粒pBADαβγ的pBAD-recE/T。第二列指示所用大肠杆菌宿主。第三列指示靶基因。

在第一个实验中,大肠杆菌染色体上的recE/T基因在大肠杆菌菌株JC8679中亚克隆,该菌株中RecE/T的表达是固定的。这可以通过图2概括的策略实现。设计、合成的寡核苷酸具有以下序列:5’-TTCCTCTGTATTAACCGGGGAATACAGTGTAATCGATAATTCAGAGGAATAGCTCGAGTTAATAAGATGATCTTCTTGAGATCG-3’(序列1)和5’-CAGCAATGTCATCGAGCTGAGACTTACTGATACCGGGACCCGCGTGGTAATTCTCGAGTGATTAGAAAAACTCATCGAGCATC-3’(序列2)来扩增pACYC177上的p15A复制起点和Tn903卡那霉素耐药基因。该实验结果概括于表1的第一行。

                       表1.ET表达      大肠杆菌宿主   靶基因         集落总数  正确%(18)内源性      JC8679         大肠杆菌染色   540       89recE/T                     体上的recE/T内源性      JC8679         大肠杆菌染色   760       94recE/T                     体上的lacZ内源性      JC9604         大肠杆菌染色   290       100recE/T                     体上的lacZpBAD-       JC5519         高拷贝质粒上   >3,000   100recE/T                     的庆大霉素pBAD-αβγ HB101              大肠杆菌染色   370       94

                         体上的lacZpBAD-αβγ HS996              BAC中mAF4      160       83

                         的内含子3在第二个实验中,大肠杆菌染色体上的lacZ基因在大肠杆菌菌株JC8679中亚克隆,该菌株中RecE/T的表达是固定的。这可以通过图2概括的策略实现。载体通过PCR技术进行制备,PCR中所用寡核苷酸具有如下序列:5’-TCAACATTAAATGTGAGCGAGTAACAACCCGTCGGATTCTCCGTGGGAACAAACGGGAATTCTGATTAGAAAAACTCATCGAGCATCAAAGT-3’(序列3)和5’-TCAGGGGAAAACCTTATTTATCAGCCGGAAAACCTACCGGATTGATGGTAGGGATCCTTAATAAGATGATCTTCTTGAGATCG-3’(序列4)来扩增pACYC177上的p15A复制起点和Tn903卡那霉素耐药基因。该实验结果概括于表1的第二行。

在第三个实验中,大肠杆菌染色体上的lacZ基因在大肠杆菌菌株JC9604中亚克隆,该菌株中RecE/T的表达是固定的。这可以通过图2概括的策略实现。载体通过PCR技术进行制备,PCR中所用寡核苷酸具有如下序列:5’-TCAACATTAAATGTGAGCGAGTAACAACCCGTCGGATTCTCCGTGGGAACAAACGGGAATTCTGATTAGAAAAACTCATCGAGCATCAAATG-3’(序列5)和5’-TCAGGGGAAAACCTTATTTATCAGCCGGAAAACCTACCGGATTGATGGTAGGGATCCTTAATAAGATGATCTTCTTGAGATCG-3’(序列6)来扩增pACYC177上的p15A复制起点和Tn903卡那霉素耐药基因。该实验结果概括于表1的第三行。

在第四个实验中,位于高拷贝质粒pFastBAC1(Gibco)上的庆大霉素基因通过图3概括的策略,在大肠杆菌菌株JC5519中亚克隆。在pBAD-recE/T质粒转化JC5519后,通过该质粒表达RecE/T,并在制备功能细胞前,应用阿拉伯糖诱导。载体通过PCR技术进行制备,PCR中所用寡核苷酸具有如下序列:5’-TGCACTTTGATATCGACCCAAGTACCGCCACCTAACAATTCGTTCAAGCCGAGGATCCTTAATAAGATCATCTTCTGAGATCGTTTTGG-3’(序列7)和5’-TGCATTACAGTTTACGAACCGAACAGGCTTATGTCAACTGGGTTCGTGCCTTCAGAATTCTGATTAGAAAAACTCATCGAGCATCAAATG-3’(序列8)来扩增pACYC177上的p15A复制起点和Tn903卡那霉素耐药基因,将PCR产物与BamHI消化的pFastBAC1混和,共转化,并接种于含有庆大霉素和卡那霉素的平板上。

在第五个实验中,位于大肠杆菌染色体上的lacZ基因通过图2概括的策略,在大肠杆菌菌株HB101中亚克隆。在pBAD-recE/T质粒转化HB101后,通过该质粒表达RecE/T,并在制备功能细胞前,应用阿拉伯糖诱导。载体通过PCR技术进行制备,PCR中所用寡核苷酸具有如下序列:5’-TCAACATTAAATGTGAGCGAGTAACAACCCGTCTTATTCTCCGTGGGAACAAACGGGAATTCTGATTAGAAAAACTCATCGAGCATCAAATG-3’(序列9)和5’-TCAGGGGAAAACCTTATTTATCAGCCGGAAAACCTACCGGATTGATGGTAGGGATCCTTAATAAGATGATCTTCTTGAGATCG-3’(序列10)来扩增pACYC177上的p15A复制起点和Tn903卡那霉素耐药基因。该实验结果概括于表1的第五行。

在第六个实验中,携带鼠AF4基因的大约150kb BAC克隆的25kb区域通过图3概括的策略,在大肠杆菌菌株HS996中亚克隆。在pBAD-recE/T质粒转化HS996后,通过该质粒表达RecE/T,并在制备功能细胞前,应用阿拉伯糖诱导。载体通过PCR技术进行制备,PCR中所用寡核苷酸具有如下序列:5’-TGTAGCTGAGCCCAGGGGCAAGGCTGCTTTGTACCAGCCTGCTGTCTGCGGGGGCATCACCTGGAATTCTTAATAAGATGATCTTCTTGAGATCGTTTTGG-3’(序列11)和5’-TGGGTGTCAACCTCAGGCTTTCTCACACGCAATACAGGTAGGGACTTGCACCCCTACACACCGAATTCTGATTAGAAAAACTCATCGAGCATCAAATG-3’(序列12)来扩增pACYC177上的p15A复制起点和Tn903卡那霉素耐药基因。PCR产物与0.5ug纯化BAC DNA混和,然后共转化。该实验结果概括于表1的第六行。图6显示的是溴化乙啶染色的琼脂糖凝胶,显示了应用EcoRI消化的DNA,该DNA分离自9个来自mAF4 BAC实验的独立集落(泳道1-9),对照是应用EcoRI消化的起始载体(泳道10)。

在第七个实验中,应用图7概括的策略,克隆了含有来自酵母菌株MGD 353-13D的氨苄青霉素耐药基因的基因组DNA区域。如图A所示,含有p15A复制起点的DNA片段,其侧翼是98或102bp的同源臂,所述同源臂指向酵母菌株MGD 353-13D中的氨苄青霉素耐药基因侧翼区域的98或102bps。应用大肠杆菌菌株JC5519,Redα/β的表达由质粒pBADαβγ-TET提供,然后,在制备功能细胞前,应用阿拉伯糖诱导。pBADαβγ-TET是pBADαβγ的衍生物,其中,氨苄青霉素耐药基因被四环素耐药基因所取代。克隆载体通过PCR技术进行制备,PCR中所用寡核苷酸具有如下序列:5’-TCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATAACACCCCTTGTATTACTGTTTATGTAAGCAGACAG-3’(序列13)和5’-TCCCGTATCGTAGTTATCTACACGACGGGGAGTCAGGCAACTATGGATGAACGAAATAGACAGATCGCTGAGATAGGTGCCTCACTGATTAAGCATTGGTAATTAATAAGATGATCTTCTTGAGATCGTTTTGG-3’(序列14)来扩增pACYC177上的p15A复制起点。PCR产物与4ug NcoI消化的MGD 353-13D酵母基因组DNA混和,然后共转化包括Redα/β表达的JC5519,Redα/β表达来自pBADαβγ,在37℃、L-肉汤中培养90分钟复苏期后,接种于含有氨苄青霉素的平板。通过氨苄青霉素耐药选择鉴定克隆。共有18个克隆进行了DNA分析。图7B显示了10个正确克隆的溴化乙啶染色凝胶。

这里描述的实施例说明,RecE/T和Redα/β同源重组克隆方法可以将多种环状靶基因成功克隆到大肠杆菌染色体上,所述环状靶基因从高拷贝质粒到低拷贝较大靶基因(BAC)。

        7.载体重复序列和磷酸化对克隆效率的影响

本部分给予的实施例描述了应用RecE/T或Redα/β介导的同源重组(“ET克隆”)技术进行高效克隆和亚克隆的最佳条件。特别是如图8所示,去除载体中的重复序列可以改善克隆效率。相反,在线性载体末端出现的5’磷酸化对ET克隆的效率影响却很小。

首先,在下述实验中检测了重复序列对克隆效率的影响。如图8所示,作为克隆载体的线性载体包括p15A复制起点,氯霉素耐药基因(Cm’),PCR扩增线性载体所需的核苷酸序列(图8中以斜体代表),大肠杆菌lacZ基因的侧翼同源臂,以及在线性载体两端存在的不同长度的末端重复序列(以黑体代表)。将线性载体转化到表达pBADRedα/β(Zhang et al.,1998,Nat.Genet.20:123-128)的JC8679(内源性ET;Clark,1974,Genetics,78,259-271)或JC5519(Willetts and Clark,1969,J.Bacteril.100:231-239)中。图8表中显示了应用指示寡核苷酸PCR扩增线性载体后,在ET亚克隆后,LB平板(含有50ug/ml的氯霉素)上含有的集落数量。其中18个集落进行了限制性消化。用正确重组体数量除以总集落数量得出重组效率。因此,末端重复>6个核苷酸可以显著降低ET亚克隆效率。所有背景集落都含有再连接的线性载体。

还检测了磷酸化对重组效率的影响,结果如图8所示。应用T4 DNA激酶和γ-ATP使线性载体末端磷酸化。如图8最后一列所示,没有观察到对ET亚克隆或载体再连接的影响。

该实施例显示,在线性载体末端或在同源臂与载体必需元件之间存在的重复序列,导致的重组可以显著降低ET克隆和亚克隆效率,所示必需元件即复制起点和可选择标记。因此,在一个优选实施方案中,同源克隆载体序列在编码复制起点和可选择标记序列的外部,不包括任何≥5个碱基的直接重复序列。

     8.RecE/T和Redα/β克隆和亚克隆的其他实施例

本部分给出的实施例描述了其他实验,这些实验显示应用RecE/T或Redα/β介导的同源重组技术,成功进行克隆和亚克隆的方法。大肠杆菌宿主

如上所述,“ET功能宿主”是指能够表达RecE/T和/或Redα/β的任何大肠杆菌细胞。这可以通过多种途经实现,如(i)内源性表达RecE/T或Redα/β的菌株,或者(ii)通过外源导入质粒表达RecE/T或Redα/β的菌株。该实施例描述了基于JC9604和JC8679及其衍生物(主要是YZ2000和YZ2001)的质粒表达载体的构建。ET功能宿主的其他变异体和示例见Murphy et al.,2000,Gene 246:321-330;Yu et al.,2000,Proc.Natl.Acad.Sci.97:5978-5983;and Datsenko and Wanner,2000,Proc.Natl.Acad.Sci.97:6640-6645。

在第一类中,应用的两个菌株携带sbcA突变,因此在RecA-(JC9604;Gillen et al.,1981,J.Bacteriology 145:521-532)或RecA+(JC8679;Gillen et al.,supra)背景下内源性表达RecE/RecT。应用这些菌株的优势在于,它们可以直接应用,不必为使该菌株具有ET克隆功能而首先导入一个质粒。缺点在于RecE和RecT在克隆全过程中始终固定表达,特别是在RecA+背景下,增加了分子内不欲重组的风险。第二个缺点在于,这些JC菌株未经修饰用于克隆和增殖宿主。它们包括完整的活性限制/修饰系统,因此大大降低了大分子如BACs导入这些宿主的效率。

选择内源性表达RecE/T或Redα/β的宿主菌株,还是导入质粒表达RecE/T或Redα/β的宿主菌株,有赖于环状靶序列的性质。无论选择哪种策略,制备品质优良的功能细胞都是至关重要的。如果宿主菌株缺乏内源性ET克隆潜能,该菌株必须首先转化pBAD-αβγ或pBAD-ETγ。获得的菌株必须应用终浓度为0.1%的L-阿拉伯糖诱导生长,然后准备电转化。依据经验,细胞的最佳收获点是OD600大约为0.35,特别是当靶序列是大DNA底物时。如果细胞的OD600大于0.5,就不应该应用了。最佳导入时间大约为1小时。必须应用电转化,因为没有发现其他DNA导入方法能发挥作用。制备品质良好的电转化细胞对于获得ET重组体是至关重要的。在制备电转化功能细胞期间,所有步骤均需在冰上或预冷的小桶、转子上进行。将电转化功能细胞高度浓缩:对于OD600=0.35时收获的250ml培养物,我们常规制备成不超过10等分的功能细胞,每等分50ul。获得的转化效率大大依赖于所用宿主菌株,但典型的变异大约为109cfu/ug。关于如何制备电转化功能细胞和如何进行电转化的详细实验流程可以从以下网址获得:http://WWW.embl-heidelberg.de/ExternalInfo/stewart/index.html。

如图9A所示,构建质粒pR6K/BAD-αβγ(tet),使BAC宿主菌株HS996(Invitrogen)具有进行ET重组的能力。该质粒基于pBAD24骨架(Guzman et al.,1995,J Bacteriol 177:4121-4130)。Redα(或RecE)由L-阿拉伯糖可诱导pBAD启动子诱导表达,Redβ(或RecT)由固定EM-7启动子诱导表达。RecT相对于RecE,或Redβ相对于Redα的过量表达,可以增加ET克隆的效率(以选择平板上的集落数量为标准)。最后,该质粒固定表达Redγ蛋白,在这种情况下,该蛋白的表达由固定Tn5启动子诱导,所述启动子对于抑制最常应用的宿主菌株中存在的RecBCD酶活性是必须的(Murphy,1991,J.Bacteriology 173:5808-5821)。如果不使其失活,RecBAD会完全抑制ET克隆,其原因可能是该酶的核酸外切酶活性使线性DNA在有机会重组前就被降解。因此,pBAD-αβγ(tet)组成了一个移动系统,可以将可调节ET克隆特性通过转化传递到接受宿主菌株中。假设RecE或Redα的表达具有诱导性,为使重组发生,RecE/T和Redo/β系统中两个组分同时表达的绝对需求也得到满足,重组窗的限制就是阿拉伯糖诱导时间和最不稳定组分的半衰期。将这些因素综合考虑,并结合最常用的宿主是recA,当然宿主也可以是recBC或recBC-的拟表型(取决于Redγ的表达),这意味着不欲分子内重组发生的风险显著降低。pBAD-αβγ(tet)的另一个有用特征是当这些质粒在培养期间没有被选择时,它们倾向于迅速消失。这可能是由于Redγ的固定表达,也会依赖宿主细胞的其他因素发生变化,例如RecBCD的存在。

pR6K/BAD-αβγ的复制需要R6K起点和Pir-116蛋白(Metcalf et al.,1994,Gene 138,1-7)。pR6K/BAD/αβγ携带来自pJP5603的R6K起点(Penfold and Pemberton,1992,Gene 118:145-6),在细菌中控制R6K ori质粒复制的pir-116复制子基因,以及来自pBR322的四环素耐药基因tet。Pir-116是一个拷贝突变体,允许含有R6K起点的质粒在大肠杆菌菌株中以超过每细胞200拷贝的量存在。pir-116基因来从大肠杆菌菌株BW3647,通过PCR扩增,并在lacZ启动子后克隆。

为了制备pR6K/BAD/αβγ,将R6K起点、pir-116和tet通过ET重组导入pBAD-αβγ(Muyrers et al.,1999,Nucleic Acids Research,27:1555-1557),置换原来存在于pBAD-αβγ上的ColE1起点和氨苄青霉素耐药基因。同样制备pR6K/BAD/ETγ和pR6K/BAD/recT。基于R6K的任何质粒相较于基于ColE1的亲本质粒,拷贝数大约高2倍。在标准BAC亚克隆练习中并行比较pR6K/BAD/αβγ和pBAD-αβγ,结果发现基于R6K的质粒工作效率更高(见图9B)。在这些pR6K质粒中存在的R6K复制系统不含任何与其他复制起点显著同源的序列,所述其他复制起点包括p15a和ColE1。而且,基于R6K的质粒与其他任何复制起点兼容。因此,如ColE1和p15A的复制起点可以包括在用于ET亚克隆的线性载体中。ET亚克隆

图10显示了亚克隆一个19kb的片段,该片段包括BAC上AF-4基因的外显子2和3。首先,将pR6K/BAD-αβγ转化到携带BAC的菌株中。随后,在含有15ug/ml四环素和12.5ug/ml氯霉素的LB培养基中培养这些转化菌株。应用L-阿拉伯糖诱导生长细胞1小时,然后制备电转化功能细胞。这些细胞通过电转化导入线性载体,所示载体包括p15A复制起点和氨苄青霉素耐药基因,β-内酰胺酶(bla),其侧翼为两个长度为50个核苷酸的同源臂,可以指导AF-4 BAC上的靶DNA同源重组。在含有50ug/ml氨苄青霉素的LB平板上生长后,收获重组体。

如图10B所示,选择5个独立集落进行分析。从5个独立集落中制备DNA,然后应用HindII消化,并在溴化乙啶染色凝胶上进行分析。HindIII消化的正确集落和线性载体以及1kb DNA阶梯(Gibco BRL)作为标记。正确亚克隆通过DNA序列分析进行确认。ET克隆

如图11实验所示,基因组DNA还可作为靶DNA的直接来源。在该实验中,线性载体包括ColE1起点和卡那霉素耐药基因(kan),其侧翼为同源臂,可以指导发生于大肠杆菌染色体上lacI/lacZ位点的重组(见图11A)。基因组DNA分离自大肠杆菌,并经XhoI消化,预先线性化。混和线性载体和预线性化的基因组DNA,共同电转化导入内源性表达RecE/RecT的YZ2000。通过在含有50ug/ml卡那霉素的LB平板上选择,获得含有lacI和lacZ基因、ColE1起点和kan的所需亚克隆。如图11B所示,16个独立集落的限制性分析发现,含有正确产物(泳道1-16)。泳道17为线性载体,泳道M是作为标记的1kb DNA阶梯(Gibco BRL)。

另一个成功ET重组克隆示例如图12所示。在该实验中,通过应用同源臂克隆载体,在鼠ES细胞基因组DNA中直接克隆片段。如概括了克隆策略的图12A所示,来自鼠ES细胞基因组DNA的新霉素耐药基因(neo)作为靶DNA。线性载体包括ColE1复制起点和氯霉素耐药基因Cm’,其侧翼为两个臂,与Tn5-neo基因同源。所需鼠ES细胞系可以通过转染包括Tn5-neo的片段制备,所述片段在PGK启动子控制下,并加polyA尾。从G418耐药集落中分离基因组DNA,并用针剪切,通过苯酚/氯仿抽提,创建大约20-40kb的线性片段。

通过共同电转化线性载体和剪切的基因组DNA,将其导入JC8679的衍生物YZ2000(Clark,supra),进行ET克隆,在YZ2000中,降解异源甲基化DNA的限制性系统由于去除了mcrA,mcrBC,hsdRMS和mrr基因而部分削弱。由于过量表达RecT可以显著增加整体ET重组效率,因此应用pR6K/BAD/recT质粒转化YZ2000。携带pR6K/BAD/recT的YZ2000,在收获前1小时应用L-阿拉伯糖诱导,然后应用0.5ug线性载体和5.0ug剪切鼠ES细胞基因组DNA共同电转化。在含有50ug/ml氯霉素的LB平板上平均收获25-35个集落。在含有50ug/ml卡那霉素的平板上再次增殖这些集落,通过Tn5-neo表达法测试的30个集落中发现有6个生长。在图12部分B中,对卡那霉素耐药集落的限制性分析显示,所有6个测试集落都是正确的(泳道2-7)。假阳性限制性图谱如泳道1所示,该集落在有氯霉素的情况下可以生长,但在卡那霉素存在的情况下无法生长。所有这些假阳性集落都包括再连接的载体。

图13显示了一个联合ET亚克隆和克隆的实验。线性载体包括ColE1复制起点和卡那霉素耐药基因Km’。线性载体的每个末端都包括BstZl7I位点和2个同源臂。在线性载体末端存在的同源臂(在图13中以小方框表示)与λ噬菌体靶DNA同源。第二套同源臂(在图13中以大方框表示)与大肠杆菌染色体上的lacI-lacZ基因同源。

在第一步亚克隆中,线性载体与线性化λ噬菌体靶DNA共同电转化到具有ET特性的大肠杆菌菌株JC8679ΔlacZ中。该步骤导致6.7kb的λDNA片段亚克隆到线性载体上,该片段包括exo,bet,gam,rexA和cI857基因,进而产生pYZN/λ-PR。下一步ET重组应用一个新的线性载体,该载体包括由突变laxP位点(laxP*,Araki et al.,1997,NucleicAcids Research,25:868-872)侧翼包绕的氯霉素耐药基因cat,以及与pYZN/λ-PR上λDNA同源的末端臂。该线性载体与pYZN/λ-PR一起,共同电转化到具有ET特性的大肠杆菌菌株JC8679ΔlacZ中,导致pYZN/λ-PR/Cm的形成。通过BstZl7I消化,该质粒释放含有cat的λDNA片段,该片段由与lacI-lacZ同源的两个末端臂侧翼包绕。该片段用于定位大肠杆菌菌株JC5519(Willetts and Clark,1969,J Bacteriol,100:231-239)的染色体,该菌株表达来自pBADRecE/T的RecE和RecT(Zhang et al.,1998,Nature Genetics 20:123-128)。ET重组后,在存在20ug/ml氯霉素的情况下选择生长,产生YZ2001/Cm菌株。通过应用706-Cre质粒,去除cat基因,产生YZ2001,所述质粒与705-Cre不同的是,它携带四环素耐药基因(tet)而非氯霉素耐药基因,如文献所述(Buchholz et al.,1996,Nucleic Acids Research,24:3118-3119)。因此,YZ2001携带6.7kb的λDNA片段(exo----cI857),以及染色体上的突变laxP位点。由于YZ2001/Cm允许λ基因exo,bet和gam的热诱导表达,因此具有条件ET特性。例如,可以应用相似的策略制备敲除构建物或进行BAC修饰。

因此,上面给予的实施例显示了几种应用RecE/T和Redα/β介导的同源重组技术成功克隆和亚克隆的方法。

这里公开的特定实施方案不应限制本发明和权利要求的范围,因为这些实施方案是为了举例说明本发明的几个方面。任何等价实施方案都应该属于本发明范畴。实际上,通过前面的描述,除了本文已经显示或描述的修饰,本领域技术人员可以轻而易举地对本发明进行多种其他修饰。这些修饰也应该属于后面权利要求的范畴。在本申请文件中,引用了很多参考文献,每篇文献的内容均在此全文引入,作为本申请文件的参考。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号