首页> 中国专利> 具有经修饰的特异性的I-CreI大范围核酸酶变体、其制备方法及应用

具有经修饰的特异性的I-CreI大范围核酸酶变体、其制备方法及应用

摘要

制备具有经修饰的切割特异性的1-CreI大范围核酸酶变体的方法,通过所述方法可获得的变体及其或者用于切割新DNA靶标或者用于非治疗目的的遗传工程和基因组工程的应用。编码所述变体的核酸、包含所述核酸的表达盒、包含所述表达盒的载体、被所述载体转化的细胞或生物,植物或非人动物。

著录项

  • 公开/公告号CN101198694A

    专利类型发明专利

  • 公开/公告日2008-06-11

    原文格式PDF

  • 申请/专利权人 赛莱克蒂斯公司;

    申请/专利号CN200680012709.7

  • 申请日2006-03-15

  • 分类号C12N9/22;C12N15/55;C12N15/10;C12N15/64;C12N15/79;C12N15/90;

  • 代理机构北京集佳知识产权代理有限公司;

  • 代理人刘晓东

  • 地址 法国罗曼维尔

  • 入库时间 2023-12-17 20:15:19

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-04-10

    授权

    授权

  • 2008-08-06

    实质审查的生效

    实质审查的生效

  • 2008-06-11

    公开

    公开

说明书

本发明涉及一种制备具有经修饰的切割特异性的I-CreI大范围核酸 酶(meganuclease)变体的方法。本发明还涉及通过所述方法可获得的 I-CreI大范围核酸酶变体以及它们或者用于切割新DNA靶标或者用于 非治疗目的的遗传工程和基因组工程的应用。

本发明还涉及编码所述变体的核酸、包含所述核酸的表达盒、包含所 述表达盒的载体、被所述载体转化的细胞或生物,植物或非人动物。

大范围核酸酶是识别大(>12bp;通常14-40bp)DNA切割位点的 序列特异性内切核酸酶(Thierry and Dujon,1992)。野生型的大范围核 酸酶基本上以归巢内切核酸酶为代表,通常由可移动遗传元件如内含肽 和I型内含子编码(Belfort and Roberts,1997;Chevalier and Stoddard, 2001)。归巢指由所述大范围的内切核酸酶活性启动的这些元件的动员, 这依赖于DNA双链断裂(DSB)修复。早期对HO(Haber,1998;Klar et al.,1984;Kostriken et al.,1983)、I-SceI(Colleaux et al.,1988; Jacquier and Dujon,1985;Perrin et al.,1993;Plessis et al.,1992)和 I-TevI(Bell-Pedersen et al.,1990;Bell-Pedersen et al.,1989; Bell-Pedersen et al.,1991;Mueller et al.,1996)蛋白的研究已经阐明了 归巢过程的生物学特性。另一方面,这些研究也已经提供了在活细胞中 研究DSB修复的范例。

归巢核酸内切酶的靶序列通常是不对称的,这与大多数限制性酶识 别位点为典型的二分对称是不同的。已经表明,某些由内含子ORF或 内含肽编码的归巢核酸内切酶促进它们各自的遗传元件归巢至等位基 因的无内含子或无内含肽位点。通过在无内含子或无内含肽等位基因中 引入位点特异性的双链断裂,这些核酸酶产生引起重组的末端,其参与 复制编码序列并导致在DNA水平插入内含子或间插序列的基因转换过 程。

归巢核酸内切酶基于非常保守的氨基酸基序分为4个独立的家族 [综述参见Chevalier and Stoddard(Nucleic Acids Research,2001,29, 3757-3774)]。其中之一是十二肽家族(十二聚体, DOD,D1-D2,LAGLIDADG,P1-P2)。这是通过其最通用的保守序列基序划分的 最大的蛋白质家族,所述保守序列基序为:一个或两个拷贝(绝大多数) 的十二残基序列,即十二肽(dodecapeptide)。具有一个十二肽(D) 的归巢核酸内切酶的分子量约为20kDa并以同源二聚体起作用。那些 具有两个拷贝(DD)的范围从25kDa(230个氨基酸)到50kDa(HO, 545个氨基酸)并且在每个基序之间有70至150个残基,并以单体起作 用。切割在识别位点内部,交错切割保留4nt的3’OH突出端。含有单 拷贝LAGLIDADG基序的酶,如I-CeuI和I-CreI作为同源二聚体发挥 作用并识别近乎回文的归巢位点。

归巢核酸内切酶I-CreI(pdb登记码1g9y)的序列和结构已经确定 (Rochaix J D et al.,NAR,1985,13,975-984;Heath PJ et al.,Nat.Struct.Biol.,1997,4, 468-476;Wang et al.,NAR,1997,25,3767-3776;Jurica et al.Mol.Cell,1998,2,469-476) 并且已使用X-射线结晶学产生了结构模型(Heath et al.,1997)。

I-CreI包含163个氨基酸(pdb登记码1g9y);所述内切核酸酶作 为二聚体进行切割。LAGLIDADG基序对应于残基13至21;在 LAGLIDADG α-螺旋的任意一侧,四个β-片层(21-29位;37-48位; 66-70位和73-78位)提供了DNA结合界面,该界面驱使该蛋白质与靶 DNA序列的半位点相互作用。该二聚化界面包括两个LAGLIDADG螺 旋以及其它残基。

I-CreI识别和切割的归巢位点的长度为22-24bp,并且是简并的回 文序列(参见Jurica MS et al,1998的图2以及SEQ ID NO:65)。更精 确地说,所述I-CreI归巢位点是22bp的半回文序列,在每个半位点中 的11bp中有7bp是一致的(Seligman LM et al.,NAR,2002,30, 3870-3879)。

也已经描述了该内切核酸酶-DNA界面(参见Jurica MS et al,1998 的图4),并导致关于特异性蛋白质-DNA接触的诸多预测 (Seligman LM et al.,Genetics,1997,147,1653-1664;Jurica MS et al.,1998;Chevalier B.et al., Biochemistry,2004,43,14015-14026)。

从所述的文献可以看出:

-残基G19、D20、Q47、R51、K98和D137是I-CreI的内切核酸 位点的一部分;

-归巢位点序列必须具有至少20bp从而获得0.2nM的最大结合亲 和力;

-序列特异性接触分布于归巢位点的全部长度上;

-在许多不同的归巢位点位置碱基对替换可以被耐受,而没有严重 地破坏归巢位点的结合或切割;

-R51和K98位于酶活性位点中并且在酶切反应中作为Lewis酸或 激活质子供体的候选者;已观察到这些残基中每一个的突变会急 剧地降低I-CreI内切核酸活性(R51G,K98Q)。

-5个额外的残基,其被突变时完全破坏I-CreI内切核酸酶活性, 位于酶活性位点中或附近(R70A、L39R、L91R、D75G、Q47H)。

这些研究已经为大范围核酸酶普遍用于基因组工程铺平了道路。同 源基因打靶是稳定修饰活细胞中染色体基因座位的最精确方法,但是其 低效率成为主要的阻碍。因为大范围核酸酶诱导的DSB刺激同源重组 高达10000倍,所以大范围核酸酶当前是提高哺乳动物细胞中基因打靶 效率(Choulika et al.,1995;Cohen-Tannoudji et al.,1998;Donoho et al., 1998;Elliott et al.,1998;Rouet et al.,1994)以及在诸如植物(Puchta et al.,1993;Puchta et al.,1996)和昆虫(Rong and Golic,2000;Rong and Golic,2001;Rong et al.,2002)等生物体中提供可行效率的最好方式。

大范围核酸酶已被用于诱导多种类型的同源重组事件,如哺乳动物 细胞(Liang et al.,1998)、植物(Siebert and Puchta,2002)、昆虫(Rong et al.,2002)和细菌(Posfai et al.,1999)中的直接重复重组,或染色体 间重组(Moynahan and Jasin,1997;Puchta,1999;Richardson et al., 1998)。

然而,该技术仍受限于大范围核酸酶的潜在天然靶位点的数目低: 虽然已鉴定了几百种天然归巢内切核酸酶(Belfort and Roberts,1997; Chevalier and Stoddard,2001),但是存在切割目的基因的天然大范围核 酸酶的可能性还极低。制造具有指定特异性的人工大范围核酸酶将避开 这种限制。

基于内切核酸酶结构域与锌指DNA结合结构域相融合,已经制备 出具有新特异性的人工核酸内切酶(Bibikova et al.,2003;Bibikova et al.,2001;Bibikova et al.,2002;Porteus and Baltimore,2003)。

归巢核酸内切酶还已用作骨架来制备新的内切核酸酶,或者通过不 同蛋白质结构域的融合(Chevalier et al.,2002;Epinat et al.,2003),或 者通过单个特异性氨基酸残基的突变(Seligman et al.,1997,2002; Sussman et al.,2004;国际PCT申请WO2004/067736)。

国际PCT申请WO2004/067736描述了用于从初始的大范围核酸酶 定制生产大范围核酸酶的一般方法,所述大范围核酸酶变体能够切割与 初始大范围核酸酶的识别和切割位点不同的DNA靶序列。该一般性方 法包括以下步骤:制备在与DNA靶序列接触或者直接或间接与所述 DNA靶标相互作用的位置具有突变的大范围核酸酶变体文库,和选择 能够切割所述DNA靶序列的的变体。当初始大范围核酸酶是I-CreI N75 蛋白时,建立其中残基44、68和70被突变的文库,并针对接近I-CreI 天然靶位点的一系列6个靶标进行筛选;与I-CreI N75骨架蛋白相比, 筛选出的突变体具有经修饰的结合特性;然而,它们切割I-CreI天然靶 位点。

Seligman et al.,2002描述了改变I-CreI的切割特异性的突变。更具 体地,他们已研究了I-CreI的预测直接与DNA靶标接触的9个氨基酸 (Q26、K28、N30、S32、Y33、Q38、Q44、R68和R70)的作用。在 这9个氨基酸中,7个被认为在对称位置与核苷酸相互作用(S32、Y33、 N30、Q38、R68、Q44和R70)。构建含有所述9个氨基酸中每一个以 及预测参与水介导相互作用的转换为丙氨酸的第10个(T140)的突变 体,并在基于大肠杆菌(E.coli)的分析中进行检测。

得到的I-CreI突变体与野生型归巢位点相比较分为四类独特的表 型:

-S32A和T140A的接触似乎对于归巢位点识别最不重要,

-N30A、Q38A和Q44A在每个分析中表现出中等水平的活性,

-Q26A、R68A和Y33A无活性,

-K28A和R70A是无活性的并且无毒性。

从所述结果得出,I-CreI的第30、38、44、26、68、33、28和70 位突变体与野生型I-CreI的归巢位点相比较具有行为变化。

关于改变I-CreI归巢位点中7个对称位置的突变体,从得到的结果 得出,在每个半位点7个对称位置中的5个似乎对野生型I-CreI在体内 进行有效的位点识别是关键的:2/21、3/20、7/16、8/15和9/14(对应 于SEQ ID NO:65中的-10/+10、-9/+9、-5/+5、-4/+4和-3/+3位)。在这 些位置发生改变的所有突变体对野生型I-CreI的体内切割具有抗性;然 而,使用大肠杆菌的体外分析似乎比体内试验更加敏感,并且允许比体 内实验更高效地检测野生型I-CreI的归巢位点;因此体外检测显示野生 型I-CreI的DNA靶标可能如下:参照SEQ ID NO:65在-5至-3位的gtc (在所有引用文献中均被认为是归巢位点)、gcc或gtt三联体。

Seligman et al.还研究了在I-CreI的33位和归巢位点碱基2和21 (±10)之间或者在I-CreI的32位和归巢位点碱基1和22(±11)之间 的相互作用;发现Y33C、Y33H、Y33R、Y33L、Y33S和Y33T突变 体切割在±10位已修饰并且不被I-CreI切割的归巢位点(表3)。另一方 面,发现S32K和S32R切割在±11位已修饰并且仍被I-CreI切割的归 巢位点(表3)。

Sussman et al.,2004,报道了他们的研究,其中同源二聚体 LAGLIDADG归巢核酸内切酶I-CreI在26位、并最终在66、或在33 位被改变,分别在±6和±10位接触归巢位点碱基。得到的酶构建体 (Q26A、Q26C、Y66R、Q26C/Y66R、Y33C、Y33H)驱使选定DNA 靶标在体内特异性消除并在体外表现出DNA结合和切割的特异性改 变。

选择和表征针对单个靶位点变体的酶点突变的总体结果是结合特 异性以及底物切割的动力学都有变化和扩展。

与野生型酶相比,每种突变体针对原始的野生型靶位点表现出更高 的解离常数(更低的亲和力);并且与野生型酶相比,每种突变体针对 其新的靶标表现出更低的解离常数(更高的亲和力)。

所述酶突变体表现出底物切割的相似动力学特点,与针对结合亲和 力所描述的那些相似,它们的底物优先性也有变化和扩展。

为了得到更大数目的DNA靶序列,极其有价值的是产生具有新特 异性的新I-CreI变体,即其能够切割不被I-CreI或至今已分离的少数 变体所切割的DNA靶标。

这些变体将对遗传或基因组工程尤其有意义。

在此,发明人已发现在I-CreI的44、68和70位的突变,由其得到 的变体能够切割至少一个在±3至5位改变的归巢位点。

因此,本发明的主题是一种制备具有经修饰的切割特异性的I-CreI 大范围核酸酶变体的方法,所述方法包括:

(a)用选自A、D、E、G、H、K、N、P、Q、R、S、T和Y的氨 基酸替换参照I-CreI pdb登记码1g9y的氨基酸Q44、R68和/或R70;

(b)参照双链DNA靶标中-5至-3位,选择步骤(a)中获得的具有 至少一个下列R3三联体切割特征的I-CreI大范围核酸酶变体,所述-5 至-3位对应于下式I的R3

5’-R1CAAAR2R3R4R’4R’3R’2TTTGR’1-3’,

其中:

R1不存在或存在;并且当存在时代表包含1至9个核苷酸的核酸片 段,所述核酸片段对应于随机核酸序列或对应于位于从-20至-12位(从 5’向3’)的I-CreI大范围核酸酶归巢位点的片段,R1至少对应于所述归 巢位点的-12位,

R2代表核酸双联体ac或ct并且对应于所述归巢位点的-7至-6位,

R3代表对应于所述-5至-3位的核酸三联体,选自g、t、c和a,并 排除以下的三联体:gtc、gcc、gtg、gtt和gct;因此所述核酸三联体优 选地选自以下三联体:

ggg,gga,ggt,ggc,gag,gaa,gat,gac,gta,gcg,gca,tgg,tga,tgt,tgc,tag,taa,

tat,tac,ttg,tta,ttt,ttc,tcg,tca,tct,tcc,agg,aga,agt,agc,aag,aaa,aat,aac,atg,ata,

att,atc,acg,aca,act,acc,cgg,cga,cgt,cgc,cag,caa,cat,cac,ctg,cta,ctt,ctc,ccg,

cca,cct and ccc and more preferably among the following triplets:ggg,ggt,ggc,gag,

gat,gac,gta,gcg,gca,tag,taa,tat,tac,ttg,ttt,ttc,tcg,tct,tcc,agg,aag,aat,aac,att,

atc,act,acc,cag,cat,cac,ctt,ctc,ccg,cct和ccc,

R4代表核酸双联体gt或tc并且对应于所述归巢位点的-2至-1位,

R’1不存在或存在;并且当存在时代表包含1至9个核苷酸的核酸片 段,所述核酸片段对应于随机核酸序列或对应于位于从+12至+20位(从 5’向3’)的I-CreI大范围核酸酶归巢位点的片段,R’1至少对应于所述 归巢位点的+12位,

R’2代表核酸双联体ag或gt并且对应于所述归巢位点的+6至+7位,

R’3代表对应于所述+3至+5位的核酸三联体,选自g、t、c和a;当 R3和R’3是非回文序列时,R’3不同于gac、ggc、cac、aac和agc,

R’4代表核酸双联体ga或ac并对应于所述归巢位点的+1至+2位。

定义

-多肽序列中的氨基酸残基在本文中依据单字母编码指定,其中, 例如,Q表示Gln或谷氨酰胺残基,R表示Arg或精氨酸残基以及D 表示Asp或天冬氨酸残基。

-在本发明中,除非另外提及,所述残基编号参考I-CreI序列 SWISSPROT P05725或pdb登记码1g9y的氨基酸编号方式。依据该定 义,名为“ADR”的变体是氨基酸残基Q44和R68已分别被替换为丙 氨酸和天冬氨酸、而R70未被替换的I-CreI大范围核酸酶。其它不改 变所述变体的切割活性的突变不被注明,并且本文采用的命名不限制突 变仅在44、68和70三个位置。

-核苷酸以如下方式表示:单字母编码用于指代核苷的碱基:a是 腺嘌呤,t是胸腺嘧啶,c是胞嘧啶,以及g是鸟嘌呤。对于简并核苷 酸,r代表g或a(嘌呤核苷酸),k代表g或t,s代表g或c,w代表 a或t,m代表a或c,y代表t或c(嘧啶核苷酸),d代表g、a或t,v 代表g、a或c,b代表g、t或c,h代表a、t或c,以及n代表g、a、 t或c。

-在本申请中,当给出序列用于举例说明识别或归巢位点时,应该 明白它代表双链多核苷酸从5’向3’的仅一条链。

-所述术语“部分回文序列”、“部分对称序列”、“简并回文序列”、 “假回文序列”均不加区分地用于表示具有不完全对称性的回文序列。 例如22bp序列:c-11a-10a-9a-8a-7c-6g-5t-4c-3g-2t-1g+1a+2g+3a+4c+5a+6g+7t+8t+9t+10g+11(SEQ ID NO:71)是部分回文序列,其中对称性在碱基对+/-1、2、6和7 处被破坏。依据另一种规则,+/-8至11位以及+/-3至5位的核苷酸序 列是回文序列。对称轴位于-1和+1位碱基对之间。使用另一种编号方 式,从5’末端到3’末端,回文序列在1至4位和19至22位,以及7 至9位和14至16位,对称性在碱基对5、6、10、11、12、13、17和 18处被破坏,并且对称轴位于11和12位碱基对之间。

-如本文中使用的,术语“野生型I-CreI”表示具有序列 SWISSPROT P05725或pdb登记码1g9y的I-CreI大范围核酸酶。

-术语“识别位点”、“识别序列”、“靶标”、“靶序列”、“DNA靶标”、 “归巢识别位点”、“归巢位点”、“切割位点”均不加区分地用于表示14 至40bp的双链、回文、非回文或部分回文的大范围核酸酶识别并切割 的多核苷酸序列。这些术语指大范围核酸酶诱导双链断裂(切割)的独 特DNA位置,优选染色体位置。

例如,野生型I-CreI的已知归巢识别位点表示为22bp序列 5’-caaaacgtcgtgagacagtttg-3’(SEQ ID NO:71)或者图2A所示的24bp序列 5’-tcaaaacgtcgtgagacagtttgg-3’(此处命名为C1234,SEQ ID NO:65;gtc位于 -5至-3位并且gac位于+3至+5位)。此特定位点在之后还被称为“I-CreI 天然靶位点”。来自于天然靶标可以通过在+1、+2、+6和+7位或者-1、 -2、-6和-7位核苷酸进行突变而得到两个回文序列:C1221(SEQ ID NO: 12)和C4334(SEQ ID NO:66),见图2A所示。二者均在-5至-3位具 有gtc,以及在+3至+5位具有gac,并且在体外和在酵母中被I-CreI所 切割。

-术语“变化特异性”涉及能够切割在相同条件下不被其来源的初 始大范围核酸酶(骨架蛋白)所切割的归巢位点的大范围核酸酶变体; 所述的初始或骨架蛋白可能是野生型大范围核酸酶或其突变体。

实际上,当在酵母菌株中使用体内分析时,发明人发现野生型I-CreI 不仅切割在-5至-3位的回文序列为gtc(与C1234、C1221或C4334中 一样)的归巢位点,而且切割gcc、gac、ggc、atc、ctc和ttc(图9a)。

所述I-CreID75N突变体(I-CreI N75),其也可以用作骨架蛋白,用 于制备具有新特异性的变体,其不仅切割在-5至-3位的回文序列是gtc 的归巢位点,而且切割所述在-5至-3位的回文序列是gcc、gtt、gtg或 gct的归巢位点(图8和9a)。

-异源二聚体形式例如可以通过将两个单体进行融合处理而获得。 得到的异源二聚大范围核酸酶能够切割至少一个不被同源形式切割的 靶位点。因此,当大范围核酸酶变体以异源聚合体形式使用时仍是本发 明的一部分。另一种选作形成异源二聚体大范围核酸酶的单体可以是另 一种变体单体,但是它也可以是野生型单体,例如I-CreI单体或I-DmoI 单体。

因此,发明人从I-CreI骨架蛋白(I-CreI D75N)构建了I-CreI变 体文库,其中每一个在44、68和/或70位(pdb编码1g9y)的氨基酸 残基中呈现出至少一个突变,并且其中每一个能够切割至少一个不被 I-CreI骨架蛋白所切割的靶位点。

在这种特定方法中,所述突变由将至少一个位于44、68和/或70的 氨基酸残基替换为另一个选自包括A、D、E、G、H、K、N、P、Q、 R、S、T和Y的组中的残基组成。独立于其他残基改变每个突变的氨 基酸残基,并且所选的氨基酸残基可以相同于或可以不同于44、68和/ 或70位的其它氨基酸残基。在该方法中,除了在-5至-3位的三联体序 列(对应于式I中R3)和/或在+3至+5位的三联体序列(对应于式I中 R’3)与被I-CreI骨架蛋白切割的归巢位点中相同位置的三联体序列不 同以外,被依据本发明的I-CreI大范围核酸酶变体切割但不被I-CreI 骨架蛋白所切割的归巢位点与前述相同并示例于图2中。

出乎意料地发现,通过上述方法可获得的、即具有“经修饰的特异 性”的所述I-CreI大范围核酸酶变体能够切割至少一个与-5至-3位和/ 或+3至+5位I-CreI骨架蛋白靶标不同的靶标。必须注意的是所述DNA 靶标在+/-3至5位不必然是回文序列。同源二聚体形式的I-CreI有活性, 但是异源二聚体形式也可能有活性。因此,依据本发明的I-CreI变体不 仅以同源二聚体形式、而且以异源二聚体形式、以及在两种情况下均可 以是有活性的,它们可以识别在+/-3至5位具有回文或非回文序列的靶 标,前提是当I-CreI N75蛋白用作骨架蛋白时,在-5至-3位和/或+3至 +5位的三联体分别不同于gtc、gcc、gtg、gtt和gct、以及不同于gac、 ggc、cac、aac和agc。因为I-CreI变体的每个单体结合归巢位点的一 半,所以能够切割多种靶标的变体也可以切割在+/-3至5位序列不是回 文序列的靶标。另外,变体以同源二聚体形式和异源二聚体形式都可以 工作。I-CreI变体可以形成异源二聚体大范围核酸酶,其中另一种变体 可以是野生型I-CreI单体、另一种野生型大范围核酸酶单体如I-DmoI, 另一种I-CreI变体单体,或者非I-CreI之外另一种大范围核酸酶的变体 的单体。

依据所述方法的一个有利的实施方案,由步骤(b)获得的I-CreI 大范围核酸酶变体选自:

A44/A68/A70,A44/A68/G70,A44/A68/H70,A44/A68/K70,A44/A68/N70, A44/A68/Q70,A44/A68/R70,A44/A68/S70,A44/A68/T70,A44/D68/H70, A44/D68/K70,A44/D68/R70,A44/G68/H70,A44/G68/K70,A44/G68/N70, A44/G68/P70,A44/G68/R70,A44/H68/A70,A44/H68/G70,A44/H68/H70, A44/H68/K70,A44/H68/N70,A44/H68/Q70,A44/H68/R70,A44/H68/S70, A44/H68/T70,A44/K68/A70,A44/K68/G70,A44/K68/H70,A44/K68/K70, A44/K68/N70,A44/K68/Q70,A44/K68/R70,A44/K68/S70,A44/K68/T70, A44/N68/A70,A44/N68/E70,A44/N68/G70,A44/N68/H70,A44/N68/K70, A44/N68/N70,A44/N68/Q70,A44/N68/R70,A44/N68/S70,A44/N68/T70, A44/Q68/A70,A44/Q68/D70,A44/Q68/G70,A44/Q68/H70,A44/Q68/N70, A44/Q68/R70,A44/Q68/S70,A44/R68/A70,A44/R68/D70,A44/R68/E70, A44/R68/G70,A44/R68/H70,A44/R68/K70,A44/R68/L70,A44/R68/N70, A44/R68/R70,A44/R68/S70,A44/R68/T70,A44/S68/A70,A44/S68/G70, A44/S68/K70,A44/S68/N70,A44/S68/Q70,A44/S68/R70,A44/S68/S70, A44/S68/T70,A44/T68/A70,A44/T68/G70,A44/T68/H70,A44/T68/K70, A44/T68/N70,A44/T68/Q70,A44/T68/R70,A44/T68/S70,A44/T68/T70, D44/D68/H70,D44/N68/S70,D44/R68/A70,D44/R68/K70,D44/R68/N70, D44/R68/Q70,D44/R68/R70,D44/R68/S70,D44/R68/T70,E44/H68/H70, E44/R68/A70,E44/R68/H70,E44/R68/N70,E44/R68/S70,E44/R68/T70, E44/S68/T70,G44/H68/K70,G44/Q68/H70,G44/R68/Q70,G44/R68/R70, G44/T68/D70,G44/T68/P70,G44/T68/R70,H44/A68/S70,H44/A68/T70, H44/R68/A70,H44/R68/D70,H44/R68/E70,H44/R68/G70,H44/R68/N70, H44/R68/R70,H44/R68/S70,H44/R68/T70,H44/S68/G70,H44/S68/S70, H44/S68/T70,H44/T68/S70,H44/T68/T70,K44/A68/A70,K44/A68/D70, K44/A68/E70,K44/A68/G70,K44/A68/H70,K44/A68/N70,K44/A68/Q70, K44/A68/S70,K44/A68/T70,K44/D68/A70,K44/D68/T70,K44/E68/G70, K44/E68/N70,K44/E68/S70,K44/G68/A70,K44/G68/G70,K44/G68/N70, K44/G68/S70,K44/G68/T70,K44/H68/D70,K44/H68/E70,K44/H68/G70, K44/H68/N70,K44/H68/S70,K44/H68/T70,K44/K68/A70,K44/K68/D70, K44/K68/H70,K44/K68/T70,K44/N68/A70,K44/N68/D70,K44/N68/E70, K44/N68/G70,K44/N68/H70,K44/N68/N70,K44/N68/Q70,K44/N68/S70, K44/N68/T70,K44/P68/H70,K44/Q68/A70,K44/Q68/D70,K44/Q68/E70, K44/Q68/S70,K44/Q68/T70,K44/R68/A70,K44/R68/D70,K44/R68/E70, K44/R68/G70,K44/R68/H70,K44/R68/N70,K44/R68/Q70,K44/R68/S70, K44/R68/T70,K44/S68/A70,K44/S68/D70,K44/S68/H70,K44/S68/N70, K44/S68/S70,K44/S68/T70,K44/T68/A70,K44/T68/D70,K44/T68/E70, K44/T68/G70,K44/T68/H70,K44/T68/N70,K44/T68/Q70,K44/T68/S70, K44/T68/T70,N44/A68/H70,N44/A68/R70,N44/H68/N70,N44/H68/R70, N44/K68/G70,N44/K68/H70,N44/K68/R70,N44/K68/S70,N44/N68/R70, N44/P68/D70,N44/Q68/H70,N44/Q68/R70,N44/R68/A70,N44/R68/D70, N44/R68/E70,N44/R68/G70,N44/R68/H70,N44/R68/K70,N44/R68/N70, N44/R68/R70,N44/R68/S70,N44/R68/T70,N44/S68/G70,N44/S68/H70, N44/S68/K70,N44/S68/R70,N44/T68/H70,N44/T68/K70,N44/T68/Q70, N44/T68/R70,N44/T68/S70,P44/N68/D70,P44/T68/T70,Q44/A68/A70, Q44/A68/H70,Q44/A68/R70,Q44/G68/K70,Q44/G68/R70,Q44/K68/G70, Q44/N68/A70,Q44/N68/H70,Q44/N68/S70,Q44/P68/P70,Q44/Q68/G70, Q44/R68/A70,Q44/R68/D70,Q44/R68/E70,Q44/R68/G70,Q44/R68/H70, Q44/R68/N70,Q44/R68/Q70,Q44/R68/S70,Q44/S68/H70,Q44/S68/R70, Q44/S68/S70,Q44/T68/A70,Q44/T68/G70,Q44/T68/H70,Q44/T68/R70, R44/A68/G70,R44/A68/T70,R44/G68/T70,R44/H68/D70,R44/H68/T70, R44/N68/T70,R44/R68/A70,R44/R68/D70,R44/R68/E70,R44/R68/G70, R44/R68/N70,R44/R68/Q70,R44/R68/S70,R44/R68/T70,R44/S68/G70, R44/S68/N70,R44/S68/S70,R44/S68/T70,S44/D68/K70,S44/H68/R70, S44/R68/G70,S44/R68/N70,S44/R68/R70,S44/R68/S70,T44/A68/K70, T44/A68/R70,T44/H68/R70,T44/K68/R70,T44/N68/P70,T44/N68/R70, T44/Q68/K70,T44/Q68/R70,T44/R68/A70,T44/R68/D70,T44/R68/E70, T44/R68/G70,T44/R68/H70,T44/R68/K70,T44/R68/N70,T44/R68/Q70, T44/R68/R70,T44/R68/S70,T44/R68/T70,T44/S68/K70,T44/S68/R70, T44/T68/K70和T44/T68/R70。

依据所述方法的另一个有利的实施方案,选择所述I-CreI大范围核 酸酶变体的步骤(b)在酵母细胞中活体内进行。

本发明的主题还有本文如上定义、即通过如上所述方法可获得的 I-CreI大范围核酸酶变体,在体外或体内为非治疗性目的,用于切割包 含至少20-24bp部分回文序列的双链核酸靶标的用途,其中在+/-8至11 位的序列至少为回文序列,并且在-5至-3位的核苷酸三联体和/或在+3 至+5位的核苷酸三联体分别不同于gtc、gcc、gtg、gtt和gct、以及不 同于gac、ggc、cac、aac和agc。式I描述了这样的DNA靶标。

依据所述用途的一个有利的实施方案,所述I-CreI大范围核酸酶变 体选自:A44/A68/A70, A44/A68/G70,A44/A68/H70,A44/A68/K70,A44/A68/N70,A44/A68/Q70, A44/A68/R70,A44/A68/S70,A44/A68/T70,A44/D68/H70,A44/D68/K70, A44/D68/R70,A44/G68/H70,A44/G68/K70,A44/G68/N70,A44/G68/P70, A44/G68/R70,A44/H68/A70,A44/H68/G70,A44/H68/H70,A44/H68/K70, A44/H68/N70,A44/H68/Q70,A44/H68/R70,A44/H68/S70,A44/H68/T70, A44/K68/A70,A44/K68/G70,A44/K68/H70,A44/K68/K70,A44/K68/N70, A44/K68/Q70,A44/K68/R70,A44/K68/S70,A44/K68/T70,A44/N68/A70, A44/N68/E70,A44/N68/G70,A44/N68/H70,A44/N68/K70,A44/N68/N70, A44/N68/Q70,A44/N68/R70,A44/N68/S70,A44/N68/T70,A44/Q68/A70, A44/Q68/D70,A44/Q68/G70,A44/Q68/H70,A44/Q68/N70,A44/Q68/R70, A44/Q68/S70,A44/R68/A70,A44/R68/D70,A44/R68/E70,A44/R68/G70, A44/R68/H70,A44/R68/K70,A44/R68/L70,A44/R68/N70,A44/R68/R70, A44/R68/S70,A44/R68/T70,A44/S68/A70,A44/S68/G70,A44/S68/K70, A44/S68/N70,A44/S68/Q70,A44/S68/R70,A44/S68/S70,A44/S68/T70, A44/T68/A70,A44/T68/G70,A44/T68/H70,A44/T68/K70,A44/T68/N70, A44/T68/Q70,A44/T68/R70,A44/T68/S70,A44/T68/T70,D44/D68/H70, D44/N68/S70,D44/R68/A70,D44/R68/K70,D44/R68/N70,D44/R68/Q70, D44/R68/R70,D44/R68/S70,D44/R68/T70,E44/H68/H70,E44/R68/A70, E44/R68/H70,E44/R68/N70,E44/R68/S70,E44/R68/T70,E44/S68/T70, G44/H68/K70,G44/Q68/H70,G44/R68/Q70,G44/R68/R70,G44/T68/D70, G44/T68/P70,G44/T68/R70,H44/A68/S70,H44/A68/T70,H44/R68/A70, H44/R68/D70,H44/R68/E70,H44/R68/G70,H44/R68/N70,H44/R68/R70, H44/R68/S70,H44/R68/T70,H44/S68/G70,H44/S68/S70,H44/S68/T70, H44/T68/S70,H44/T68/T70,K44/A68/A70,K44/A68/D70,K44/A68/E70, K44/A68/G70,K44/A68/H70,K44/A68/N70,K44/A68/Q70,K44/A68/S70, K44/A68/T70,K44/D68/A70,K44/D68/T70,K44/E68/G70,K44/E68/N70, K44/E68/S70,K44/G68/A70,K44/G68/G70,K44/G68/N70,K44/G68/S70, K44/G68/T70,K44/H68/D70,K44/H68/E70,K44/H68/G70,K44/H68/N70, K44/H68/S70,K44/H68/T70,K44/K68/A70,K44/K68/D70,K44/K68/H70, K44/K68/T70,K44/N68/A70,K44/N68/D70,K44/N68/E70,K44/N68/G70, K44/N68/H70,K44/N68/N70,K44/N68/Q70,K44/N68/S70,K44/N68/T70, K44/P68/H70,K44/Q68/A70,K44/Q68/D70,K44/Q68/E70,K44/Q68/S70, K44/Q68/T70,K44/R68/A70,K44/R68/D70,K44/R68/E70,K44/R68/G70, K44/R68/H70,K44/R68/N70,K44/R68/Q70,K44/R68/S70,K44/R68/T70, K44/S68/A70,K44/S68/D70,K44/S68/H70,K44/S68/N70,K44/S68/S70, K44/S68/T70,K44/T68/A70,K44/T68/D70,K44/T68/E70,K44/T68/G70, K44/T68/H70,K44/T68/N70,K44/T68/Q70,K44/T68/S70,K44/T68/T70, N44/A68/H70,N44/A68/R70,N44/H68/N70,N44/H68/R70,N44/K68/G70, N44/K68/H70,N44/K68/R70,N44/K68/S70,N44/N68/R70,N44/P68/D70, N44/Q68/H70,N44/Q68/R70,N44/R68/A70,N44/R68/D70,N44/R68/E70, N44/R68/G70,N44/R68/H70,N44/R68/K70,N44/R68/N70,N44/R68/R70, N44/R68/S70,N44/R68/T70,N44/S68/G70,N44/S68/H70,N44/S68/K70, N44/S68/R70,N44/T68/H70,N44/T68/K70,N44/T68/Q70,N44/T68/R70, N44/T68/S70,P44/N68/D70,P44/T68/T70,Q44/A68/A70,Q44/A68/H70, Q44/A68/R70,Q44/G68/K70,Q44/G68/R70,Q44/K68/G70,Q44/N68/A70, Q44/N68/H70,Q44/N68/S70,Q44/P68/P70,Q44/Q68/G70,Q44/R68/A70, Q44/R68/D70,Q44/R68/E70,Q44/R68/G70,Q44/R68/H70,Q44/R68/N70, Q44/R68/Q70,Q44/R68/S70,Q44/S68/H70,Q44/S68/R70,Q44/S68/S70, Q44/T68/A70,Q44/T68/G70,Q44/T68/H70,Q44/T68/R70,R44/A68/G70, R44/A68/T70,R44/G68/T70,R44/H68/D70,R44/H68/T70,R44/N68/T70, R44/R68/A70,R44/R68/D70,R44/R68/E70,R44/R68/G70,R44/R68/N70, R44/R68/Q70,R44/R68/S70,R44/R68/T70,R44/S68/G70,R44/S68/N70, R44/S68/S70,R44/S68/T70,S44/D68/K70,S44/H68/R70,S44/R68/G70, S44/R68/N70,S44/R68/R70,S44/R68/S 70,T44/A68/K70,T44/A68/R70, T44/H68/R70,T44/K68/R70,T44/N68/P70,T44/N68/R70,T44/Q68/K70, T44/Q68/R70,T44/R68/A70,T44/R68/D70,T44/R68/E70,T44/R68/G70, T44/R68/H70,T44/R68/K70,T44/R68/N70,T44/R68/Q70,T44/R68/R70, T44/R68/S70,T44/R68/T70,T44/S68/K70,T44/S68/R70,T44/T68/K70,和 T44/T68/R70.

依据所述用途的另一个有利的实施方案,所述I-CreI大范围核酸酶 变体是同源二聚体。

依据所述用途的另一个有利的实施方案,所述I-CreI大范围核酸酶 变体是异源二聚体。

所述异源二聚体可以是由本发明中定义的两种不同I-CreI变体融合 或者I-CreI骨架蛋白与本发明中定义的I-CreI变体融合而组成的单链嵌 合分子。或者,所述异源二聚体可以由选自本发明中定义的两种不同 I-CreI变体或I-CreI骨架蛋白以及本发明中定义的I-CreI变体的两种分 离单体组成。

依据所述用途:

-或者所述I-CreI大范围核酸酶变体能够切割在其+/-3至5位序列 为回文序列的DNA靶标,

-或者所述I-CreI大范围核酸酶变体能够切割在其+/-3至5位序列 为非回文序列的DNA靶标,

依据所述用途的另一个有利的实施方案,被切割的核酸靶标是在-11 至-8位和+8至+11位的回文序列分别为caaa和tttg的DNA靶标。

依据所述用途的另一个有利的实施方案,所述的I-CreI大范围核酸 酶变体还包含75位的突变,优选地为不带电荷的氨基酸突变,更优选 地为天冬酰胺或缬氨酸(D75N或D75V)。

依据所述用途的另一个有利的实施方案,所述的I-CreI大范围核酸 酶变体在44位具有丙氨酸(A)或天冬酰胺(N),用于切割在-4位包 含核苷酸a和/或在+4位包含t的DNA靶标。

依据所述用途的另一个有利的实施方案,所述的I-CreI大范围核酸 酶变体在44位具有谷胺酰胺(Q),用于切割在-4位包含核苷酸t和/ 或在+4位包含a的DNA靶标。

依据所述用途的另一个有利的实施方案,所述的I-CreI大范围核酸 酶变体在44位具有赖氨酸(K),用于切割在-4位包含核苷酸c和/或在 +4位包含g的靶标。

本发明的主题还有I-CreI大范围核酸酶变体:

-通过以上定义的制备方法可以获得;

-在I-CreI的44、68和70位中至少一个氨基酸残基处具有一个突 变;所述的突变可以是在与DNA靶标直接接触的氨基酸中仅有 的一个;并且

-在±3至5位具有经修饰的切割特异性。

这种新的I-CreI大范围核酸酶可以作为体外消化中非常特异的内切 核酸酶用于限制性酶切或作图,或者在体内或者离体用作基因组工程的 工具。另外,每种可以作为新的骨架用于第二轮的突变和选择/筛选, 目的是制备新的、第二代归巢核酸内切酶。

依据本发明的I-CreI大范围核酸酶仅在DNA结合结构域的44、68 和/或70位进行突变。然而,本发明还包括能够形成异源二聚体的不同 蛋白质:来自以上列表两种不同蛋白质的异二聚化还导致非回文序列的 切割,这种非回文序列由来自被亲本蛋白单独切割之位点的两半构成。 这可以通过体外在反应缓冲液中加入两种不同的I-CreI变体而获得,以 及体内或离体过表达而获得。另一种可能性是构建如Epinat et al. (Epinat et al.,2003)所述的单链分子。该单链分子是两种不同I-CreI 变体的融合体,并且还应该导致嵌合的非回文序列的切割。

依据所述I-CreI大范围核酸酶变体的一个有利的实施方案,选用于 替换44、68和/或70位氨基酸的氨基酸残基选自包含A、D、E、G、H、 K、N、P、Q、R、S、T和Y的组。

依据另一个有利的实施方案,所述的I-CreI大范围核酸酶变体选自: A44/A68/A70, A44/A68/G70,A44/A68/H70,A44/A68/K70,A44/A68/N70,A44/A68/Q70, A44/A68/S70,A44/A68/T70,A44/D68/H70,A44/D68/K70,A44/D68/R70, A44/G68/H70,A44/G68/K70,A44/G68/N70,A44/G68/P70,A44/H68/A70, A44/H68/G70,A44/H68/H70,A44/H68/K70,A44/H68/N70,A44/H68/Q70, A44/H68/S70,A44/H68/T70,A44/K68/A70,A44/K68/G70,A44/K68/H70, A44/K68/N70,A44/K68/Q70,A44/K68/R70,A44/K68/S70,A44/K68/T70, A44/N68/A70,A44/N68/E70,A44/N68/G70,A44/N68/H70,A44/N68/K70, A44/N68/N70,A44/N68/Q70,A44/N68/R70,A44/N68/S70,A44/N68/T70, A44/Q68/A70,A44/Q68/D70,A44/Q68/G70,A44/Q68/H70,A44/Q68/N70, A44/Q68/S70,A44/R68/E70,A44/R68/K70,A44/R68/L70,A44/S68/A70, A44/S68/G70,A44/S68/N70,A44/S68/Q70,A44/S68/R70,A44/S68/S70, A44/S68/T70,A44/T68/A70,A44/T68/G70,A44/T68/H70,A44/T68/N70, A44/T68/Q70,A44/T68/S70,A44/T68/T70,D44/D68/H70,D44/N68/S70, D44/R68/A70,D44/R68/N70,D44/R68/Q70,D44/R68/R70,D44/R68/S70, D44/R68/T70,E44/H68/H70,E44/R68/A70,E44/R68/H70,E44/R68/N70, E44/R68/S70,E44/R68/T70,E44/S68/T70,G44/H68/K70,G44/Q68/H70, G44/R68/Q70,G44/T68/D70,G44/T68/P70,G44/T68/R70,H44/A68/S70, H44/A68/T70,H44/R68/D70,H44/R68/E70,H44/R68/G70,H44/R68/N70, H44/R68/R70,H44/R68/S70,H44/S68/G70,H44/S68/S70,H44/S68/T70, H44/T68/S70,H44/T68/T70,K44/A68/A70,K44/A68/D70,K44/A68/E70, K44/A68/G70,K44/A68/H70,K44/A68/N70,K44/A68/Q70,K44/D68/A70, K44/D68/T70,K44/E68/G70,K44/E68/S70,K44/G68/A70,K44/G68/G70, K44/G68/N70,K44/G68/S70,K44/G68/T70,K44/H68/D70,K44/H68/E70, K44/H68/G70,K44/H68/N70,K44/H68/S70,K44/H68/T70,K44/K68/A70, K44/K68/D70,K44/K68/H70,K44/K68/T70,K44/N68/A70,K44/N68/D70, K44/N68/E70,K44/N68/G70,K44/N68/H70,K44/N68/N70,K44/N68/Q70, K44/N68/S70,K44/N68/T70,K4/P68/H70,K44/Q68/A70,K44/Q68/D70, K44/Q68/E70,K44/Q68/S70,K44/Q68/T70,K44/R68/A70,K44/R68/D70, K44/R68/E70,K44/R68/G70,K44/R68/H70,K44/R68/N70,K44/R68/S70, K44/S68/A70,K44/S68/D70,K44/S68/H70,K44/S68/N70,K44/S68/S70, K44/S68/T70,K44/T68/A70,K44/T68/D70,K44/T68/E70,K44/T68/G70, K44/T68/H70,K44/T68/N70,K44/T68/Q70,K44/T68/S70,K44/T68/T70, N44/A68/H70,N44/H68/N70,N44/H68/R70,N44/K68/G70,N44/K68/H70, N44/K68/R70,N44/K68/S70,N44/P68/D70,N44/Q68/H70,N44/R68/A70, N44/R68/D70,N44/R68/E70,N44/R68/K70,N44/S68/G70,N44/S68/H70, N44/S68/K70,N44/S68/R70,N44/T68/H70,N44/T68/K70,N44/T68/Q70, N44/T68/S70,P44/N68/D70,P44/T68/T70,Q44/G68/K70,Q44/G68/R70, Q44/K68/G70,Q44/N68/A70,Q44/N68/H0,Q44/N68/S70,Q44/P68/P70, Q44/Q68/G70,Q44/R68/D70,Q44/R68/E70,Q44/R68/G70,Q44/R68/Q70, Q44/S68/S70,Q44/T68/A70,Q44/T68/G70,Q44/T68/H70,R44/A68/G70, R44/A68/T70,R44/G68/T70,R44/H68/D70,R44/H68/T70,R44/N68/T70, R44/R68/A70,R44/R68/D70,R44/R68/E70,R44/R68/G70,R44/R68/Q70, R44/R68/S70,R44/R68/T70,R44/S68/G70,R44/S68/N70,R44/S68/S70, R44/S68/T70,S44/D68/K70,S44/R68/R70,S44/R68/S70,T44/A68/K70, T44/N68/P70,T4/N68/R70,T44/R68/E70,T44/R68/Q70和T44/S68/K70;所述I-CreI大范 围核酸酶变体能够切割至少一个如前定义的不被I-CreI N75骨架蛋白 所切割的靶标。

依据另一个有利的实施方案,所述I-CreI大范围核酸酶变体在44 位具有丙氨酸(A)或天冬酰胺(N),并切割在-4位包含核苷酸a和/ 或在+4位包含t的靶标,但排除国际PCT申请WO 2004/067736的表4 和表5中所示的变体,优选所述变体具有丙氨酸或天冬酰胺。

依据另一个有利的实施方案,所述I-CreI大范围核酸酶变体在44 位具有谷胺酰胺(Q)并切割在-4位包含核苷酸t和/或在+4位包含a 的靶标,但排除国际PCT申请WO 2004/067736的表3、表4和表5中 所示的变体。

依据另一个有利的实施方案,本发明的I-CreI大范围核酸酶变体在 44位具有赖氨酸(K),并切割在-4位包含核苷酸c和/或在+4位包含g 的靶标,但排除国际PCT申请WO 2004/067736的表5中所示的变体。

如前所具体描述的,在本应用申请中I-CreI大范围核酸酶变体的定 义范围内,所述I-CreI大范围核酸酶变体可以是同源二聚体或异源二聚 体。它可能能够切割回文或非回文DNA靶标。它还可以包含75位突变, 如前面所具体描述的。

本发明的主题也是多核苷酸,其特征在于它编码依据本发明的 I-CreI大范围核酸酶变体。

另外,本发明的主题也是包含所述多核苷酸和调节序列如启动子的 表达盒,以及包含所述表达盒的表达载体。当所述变体是由两个不同单 体组成的异源二聚体时,每个单体可以从单一载体(双重表达载体)或 从两个不同载体中表达。

本发明的主题也是如前所述的进一步包含靶向DNA构建体的表达 载体。

术语“载体”指能够运送与其连接的另一核酸的核酸分子。优选的 载体类型之一为附加体,即能够在染色体外复制的核酸。优选的载体能 够自主复制和/或表达与其连接的核酸。能够指导与其操作性连接的基 因表达的载体在本文称为“表达载体”。依据本发明的载体包含但不限 于,YAC(酵母人工染色体)、BAC(细菌人工染色体)、杆状病毒载体、 噬菌体、噬菌粒、粘粒、病毒载体、质粒、RNA载体或者线性或环状 DNA或RNA分子,其可以由染色体的、非染色体的、半合成的或合成 的DNA组成。通常,用于重组DNA技术的表达载体常常是“质粒”形 式,其通常表示其载体形式不与染色体结合的环状双链DNA环。大量 的合适载体已为本领域技术人员所知并且有市售,比如以下细菌载体: pQE7O,pQE6O,pQE-9(Qiagen),pbs,pDIO,phagescript,psiXl74.pbluescript SK, pbsks,pNH8A,pNH16A,pNH18A,pNH46A(Stratagene);ptrc99a,pKK223-3, pKK233-3,pDR540,pRlT5(Pharmacia);pWLNEO,pSV2CAT,pOG44,pXTI,pSG (Stratagene);pSVK3,pBPV,pMSG,pSVL(Pharmacia);pQE-30(QlAexpress),pET (Novagen)。

病毒载体包括逆转录病毒、腺病毒、细小病毒(例如,腺伴随病毒)、 冠状病毒、负链RNA病毒如正黏病毒(例如,流感病毒)、弹状病毒(例 如,狂犬病和疱疹性口炎病毒)、副黏病毒(例如,麻疹和仙台)、正链 RNA病毒如小RNA病毒和甲病毒、以及双链DNA病毒包括腺病毒、 疱疹病毒(例如,1型和2型单纯疱疹病毒、Epstein-Barr病毒、巨细 胞病毒)和痘病毒(例如,痘苗、禽痘和金丝雀痘)。其它病毒包括, 例如,Norwalk病毒、披膜病毒、黄热病毒、呼肠孤病毒、乳多空病毒、 嗜肝DNA病毒以及肝炎病毒。

载体可以包含选择标记,例如:用于真核细胞培养的新霉素磷酸转 移酶、组氨醇脱氢酶、二氢叶酸还原酶、潮霉素磷酸转移酶、单纯疱疹 病毒胸苷激酶、腺苷脱氨酶、谷胺酰胺合成酶、和次黄嘌呤鸟嘌呤磷酸 核糖基转移酶;用于酿酒酵母(S.cerevisiae)的TRP1;大肠杆菌中的 四环素、利福平或氨苄青霉素抗性。

优选地所述载体为表达载体,其中编码本发明多肽的序列被置于适 当的转录和翻译控制元件的控制之下,从而允许所述多肽的产生或合 成。因此,所述多核苷酸包含在表达盒中。更具体地,所述载体包含复 制起点、与所述编码多核苷酸操作性连接的启动子、核糖体结合位点、 RNA剪接位点(当使用基因组DNA时)、多聚腺苷化位点和转录终止 位点。它还可以包含增强子。启动子的选择将依赖于在其中表达多肽的 细胞。

依据所述表达载体的一个有利的实施方案,所述靶向DNA构建体 包含与本发明I-CreI大范围核酸酶变体的切割位点附近区域具有同源 性的序列。

依据所述表达载体的另一个有利的实施方案,所述靶向DNA构建 体包含:

a)与依据要求保护的I-CreI大范围核酸酶变体的切割位点附近区 域具有同源性的序列,以及

b)其侧翼为a)中序列的待引入序列。

本发明的主题还是细胞,其特征在于它被如前定义的多核苷酸或被 如前定义的载体修饰。

本发明的主题还是转基因植物,其特征在于它包含如前定义的多核 苷酸,或如前定义的载体。

本发明的主题还是非人的转基因哺乳动物,其特征在于它包含如前 定义的多核苷酸或如前定义的载体。

编码如本发明所定义多肽的多核苷酸序列可以通过本领域技术人 员已知的任何方法来制备。例如,它们利用聚合酶链式反应使用特异性 引物从cDNA模板进行扩增。优选地,选择所述cDNA的密码子以有利 于所述蛋白质在期望表达系统中表达。

包含所述多核苷酸的重组载体可以通过众所周知的重组DNA和遗 传工程技术而获得并引入到宿主细胞中。

本发明的异源二聚体大范围核酸酶通过表达两种如前定义的多肽 而产生;优选地所述多肽在适于所述多肽共表达的条件下在宿主细胞中 共表达,所述宿主细胞被两种表达载体修饰,其中每种表达载体包含编 码如前定义不同多肽的多核苷酸片段,或者所述宿主细胞被包含如前定 义两种多核苷酸片段的双重表达载体修饰,并且从宿主细胞培养物中回 收所述异源二聚体大范围核酸酶。

本发明的主题还有如前定义的I-CreI大范围核酸酶变体、一种或两 种多核苷酸(优选都包括在一个表达载体中(双重表达载体)或分别包 括在不同表达载体中)、细胞、转基因植物、非人转基因哺乳动物在分 子生物学、体内或体外遗传工程以及体内或体外基因组工程中用于非治 疗性目的的用途。

非治疗性目的包括例如(i)在包装细胞系中进行特异基因座位的基 因打靶,用于生产蛋白质,(ii)在农作物植物中进行特异基因座位的基 因打靶,用于品系改良和代谢工程,(iii)靶向重组,用于去除遗传修 饰农作物中的标记物,(iv)靶向重组,用于去除遗传修饰微生物菌株 中的标记物(例如用于抗生素生产)。

依据所述用途的一个有利的实施方案,它用于在包含DNA靶序列 的目的位点引入双链断裂,从而诱导DNA重组事件,DNA丢失或细胞 死亡。

依据本发明,所述双链断裂用于:修复特定序列,修饰特定序列, 恢复突变基因位置处的功能基因,削弱或激活目的内源基因,在目的位 点引入突变,引入外源基因或其一部分,失活或删除内源基因或其一部 分,使染色体臂易位或者使DNA不被修复以及降解。

依据所述用途的另一个有利的实施方案,所述I-CreI大范围核酸酶、 多核苷酸、载体、细胞、转基因植物或非人类转基因哺乳动物与如前定 义的靶向DNA构建物相结合。

本发明的主题还是遗传工程方法,其特征在于它包括以下步骤:在 位于载体上的目的位点断裂双链核酸,所述载体包含如前定义的I-CreI 大范围核酸酶变体的DNA靶标,这是通过将所述载体与如前定义的 I-CreI大范围核酸酶变体接触,从而诱导与表现出与所述I-CreI大范围 核酸酶变体切割位点附近序列具有同源性的另一种载体的同源重组。

本发明的主题还有基因组工程的方法,其特征在于它包括以下步 骤:1)通过将所述切割位点与所述I-CreI大范围核酸酶变体接触,从 而双链断裂基因组基因座位,该基因座位包含如前定义的I-CreI大范围 核酸酶变体的至少一个识别和切割位点;2)在适于与靶向DNA构建体 同源重组的条件下维持所述断裂基因组基因座位,所述靶向DNA构建 体包含待引入所述基因座位的序列,该基因座侧翼为有与靶基因座位具 有同源性的序列。

本发明的主题还是基因组工程的方法,其特征在于它包含以下步 骤:1)通过将所述切割位点与所述I-CreI大范围核酸酶变体接触,双 链断裂基因组基因座位,该基因座位包含如前定义的I-CreI大范围核酸 酶变体的至少一个识别和切割位点;2)在适于与染色体DNA同源重 组的条件下维持所述断裂基因组基因座位,所述染色体DNA与切割位 点附近区域具有同源性。

本发明的主题还是组合物,其特征在于它包含至少一种如前定义的 I-CreI大范围核酸酶变体、多核苷酸或载体。

在所述组合物的一种优选实施方案中,它包含靶向DNA构建体, 该靶向DNA构建体包含修复目的位点的序列,所述目的位点侧翼是与 靶基因座位具有同源性的序列。

本发明的主题还是至少一种如前定义的I-CreI大范围核酸酶变体、 多核苷酸或载体用于制备药物的用途,所述药物用于预防、改善或治疗 有此需要的个体中的遗传性疾病,所述药物通过任意方式施用给所述个 体。

本发明的主题还是至少一种如前定义的I-CreI大范围核酸酶变体、 多核苷酸或载体用于制备药物的用途,所述药物用于预防、改善或治疗 有此需要的个体中由提呈DNA中间体的传染因子引起的疾病,所述药 物通过任意方式施用给所述个体。

本发明的主题还是至少一种如前定义的I-CreI大范围核酸酶变体、 多核苷酸或载体的用途,体外用于在生物来源产品或者意在生物应用的 产品中抑制增殖、失活或消除提呈DNA中间体的传染因子,或者用于 消毒目标对象。

在一个具体实施方案中,所述传染因子为病毒。

除了前述的特征,本发明还包含从以下说明以及附图中得出的其它 特征,说明书包括举例说明本发明的I-CreI大范围核酸酶变体及其应用 的实施例,其中附图中:

-图1举例说明试验的基本原理。(a)与其DNA靶标结合的I-CreI 的结构。(b)显示选用于随机化的残基44、68、70以及D75与相互作 用碱基对的结构的放大。(c)文库和靶标的设计。标明了I-CreI的残基 Q44、R68和R70与DNA靶标的相互作用(上方)。与所述DNA靶标 直接或间接相互作用的其它氨基酸残基未示出。I-CreI单体的44位精 氨酸残基(R)与靶序列的-5位鸟嘌呤直接相互作用,而44位谷氨酰 胺(Q)残基和70位精氨酸(R)残基分别与互补链的+4位腺嘌呤和 +3位鸟嘌呤直接相互作用。本文所描述的靶标(C1221,SEQ ID NO:12) 是源自I-CreI天然靶标(C1234,SEQ ID NO:65)的回文序列,并被I-CreI 所切割(Chevalier et al.,2003,预先引用)。切割位置用箭头注明。在 文库中,残基44、68和70用ADEGHKNPQRST替换。因为I-CreI是 同源二聚体,所以所述文库用回文靶标进行筛选。产生了64个源自±3、 ±4和±5位替换的回文靶标。显示了这些靶标的一些实例(下方;SEQ ID NO:1至7)。

-图2举例说明研究中使用的靶标。A.两个源自天然I-CreI靶标 (本文称为C1234,SEQ ID NO:65)的回文靶标。所述I-CreI天然靶标 含有两个回文序列,用灰色框显示:一方面为-8至-12和+8至+12位核 苷酸,另一方面为-5至-3和+3至+5位核苷酸。垂直虚线,从此编码核 苷酸碱基,其代表回文序列的对称轴。可以从天然靶标衍生两个回文序 列,即C1221(SEQ ID NO:12)和C4334(SEQ ID NO:66)。二者均 在体外和在酵母中被I-CreI所切割。仅显示每个靶位点的一条链。B.64 个靶标。这64个靶标(SEQ ID NO:1至64)源自C1221(SEQ ID NO: 12),并被I-CreI所切割(C1234,SEQ ID NO:65)(Chevalier et al.,2003, 预先引用),所述C1221是源自I-CreI天然靶标的回文序列。它们对应 于得自在-5、-4、-3、+3、+4和+5位进行替换的所有24bp回文序列。

-图3举例说明变体的筛选。(a)用表达大范围核酸酶的以LEU2 基因作为标记的载体转化酵母,并单独地与转化有报告质粒的以TRP1 基因作为标记的酵母进行接合。在所述报告质粒中,LacZ报告基因被 含有目的位点的插入片段打断,其侧翼是两个直接重复。在二倍体 (LEU2 TRP1)中,大范围核酸酶(白色椭圆)切割靶位点诱导两个 LacZ重复之间发生同源重组,得到有功能的β-半乳糖苷酶基因(灰色 椭圆),这可用X-Gal染色监测。(b)试验流程。使用PCR构建I-CreI 变体的文库,将其克隆到复制型酵母表达载体中并转化入酿酒酵母菌株 FYC2-6A(MATα,trp1Δ63,leu2Δ1,his3Δ200)。所述64个回文靶标被克隆到 基于LacZ的酵母报告载体中,并且所得克隆转化入菌株FYBL2-7B (MATa,ura3Δ851,trp1Δ63,leu2Δ1,lys2Δ202)。使用机器人辅助在滤膜上划网格 进行表达大范围核酸酶变体的单个克隆与携带报告质粒的单个克隆之 间的接合。在初步高通量筛选后,阳性克隆的ORF通过PCR进行扩增 并测序。从2100个阳性克隆中鉴定出410种不同变体,并以低密度进 行检测,以建立完整的模式,并且验证了350个克隆。同时,294个突 变体被再次克隆入酵母载体,并在二次筛选中进行检测,结果证实了那 些获得的未再次克隆的突变体。然后,在类似的基于CHO的分析中并 最终在体外分析所选克隆的切割活性。

-图4表示编码I-CreI N75骨架蛋白的cDNA序列以及用于Ulib2 文库构建的简并引物。A.所述骨架蛋白(SEQ ID NO:69)的编码序列 (CDS)从第一个碱基对至第501个碱基对,并且“终止”密码子TGA (未示出)在第501个碱基对后。除了D75N突变以外,该蛋白还包含 不改变其活性的突变;在该蛋白质序列(SEQ ID NO:70)中,N末端 前两个残基是甲硫氨酸和丙氨酸(MA),并且C末端三个残基为丙氨 酸、丙氨酸和天冬氨酸(AAD)。B.简并引物(SEQ ID NO:67、68)。

-图5表示pCLS0542大范围核酸酶表达载体图。该大范围核酸 酶表达载体以LEU2作为标记。编码I-CreI大范围核酸酶变体的cDNA 克隆到已用NcoI和EagI消化的该载体中,以便被诱导型Gal10启动子 驱动表达所述变体。

-图6表示pCLS0042报告载体图。该报告载体以TRP1和URA3 作为标记。LacZ串联重复具有800bp的同源性,并且被1,3kb的DNA 分离开。它们被ADH启动子和终止子序列所包围。靶位点被克隆到SmaI 位点。

-图7举例说明292个具有经修饰特异性的I-CreI大范围核酸酶 变体的切割特征。所述变体来源于I-CreI N75骨架蛋白。通过存在于第 44、68和70位的氨基酸(前三列)来定义蛋白质。氨基酸的编号依据 pdb登记码1g9y。通过在-5至-3位的核苷酸来定义靶标。对于每种蛋 白质,显示出64个靶标中每一个的观察到切割(1)或未观察到切割(0)。

-图8举例说明I-CreI变体切割模式的8个实例。所述大范围核 酸酶针对图2B中描述的64个靶标各检测4次。不同靶标的位置在左上 部框中标出。来源于I-CreI N75骨架蛋白的变体根据第44、68和70位 氨基酸来识别(例如:KSS是K44、S68、S70和N75,或者K44/S68/S70)。 所述氨基酸的编码方式依据pdb码1g9y。QRR对应于I-CreI N75。被 切割的靶标在框旁边注明。

-图9举例说明变体的切割模式。突变体用三个字母表示,对应 于第44、68和70位的残基。针对来自I-CreI天然靶标的64个靶标以 及一系列对照靶标检测每个突变体。靶标图标注在右上部框内。(a)野 生型I-CreI(I-CreI)和I-CreI N75(QRR)蛋白以及7种I-CreI N75 蛋白的衍生物在酵母中(左侧)和哺乳动物细胞中(右侧)的切割模式。 对于酵母而言,显示最初的原始数据(filter)。对于CHO细胞而言, 显示定量的原始数据(ONPG测量),高于0.25的值用方框框住,高于 0.5的值用中灰色高亮显示,高于1的值用深灰。LacZ:阳性对照。0: 无靶标。U1、U2和U3:3个不同的未切割对照。(b)体外切割。针对 一组2或4个靶标检测I-CreI和4个突变体,所述靶标包括在酵母和 CHO中产生最强信号的靶标。如方法部分所述,与2nM线性化底物在 37℃消化1小时。显示I-CreI与两个不同靶标的原始数据。带有ggg和 cct的靶标,没有检测到I-CreI对其的切割。

-图10表示统计分析。(a)被切割的靶标:被I-CreI变体切割 的靶标用灰色表示。切割每个靶标的蛋白质的数目显示在下方,并且灰 色着色程度与在酵母中这些切割蛋白得到的平均信号强度成比例。(b) 对7个聚类中3个的分析。对于每个突变体聚类(聚类1、3和7),计 算每个靶标的累计强度,并且柱形图(左侧柱图)以降序显示经标准化 的强度。对于每个聚类,每种类型在每个位置(44、68和70)的氨基 酸的数目在右栏中显示为带编码柱状图。氨基酸颜色代码的图注在图底 部。(b)酵母中突变体和靶标数据的层级聚类。使用Euclidean距离和 Ward’s方法(Ward,J.H.,American statist.Assoc.,1963,58,236-244) 用层级聚类分析将突变体和靶标进行聚类。使用R软件包中的hclust 命令进行聚类分析。重新排序突变体和靶标的系统树状图以优化聚类的 位置,并且所述突变体的系统树状图以推导出的聚类在高度为8处切割。 QRR突变体和GTC靶标用箭头标注。灰阶反映了信号的强度。

-图11举例说明杂合或嵌合位点的实例:gtt(SEQ ID NO:79) 和ctt(SEQ ID NO:77)是两个源自I-CreI位点的回文位点。该gtt/ctt 杂合位点(SEQ ID NO:80)显示了顶部链上-5、-4、-3位的gtt序列以 及底部链上5、4、3位的cct序列。

-图12举例说明异源二聚体变体的切割活性。用KTG和QAN 变体共转化酵母。靶标结构显示于顶部的框中:具有单个gtt、cct或gcc 半位点的靶标用粗体显示;具有两个这些半位点的靶标用粗体并且灰色 高亮显示,该靶标预期会被同源和/或异源二聚体切割;0:无靶标。结 果显示于下面的三个框上。仅对于分别被KTG和QAN切割的gtc/cct 和gtt/gtc观察到意料之外的微弱信号。

-图13表示异源二聚体变体的切割活性的定量分析。(a)选定突 变体共同转化酵母。为了更清楚,只显示了相关的杂合靶标的结果。 aac/acc靶标总是作为不相关靶标的实例而显示。对于KTG×AGR杂 交,回文的tac和tct靶标序列(虽然未示出)分别被AGR和KTG切 割。RRN突变体对cat靶标的切割非常低,并且在酵母中不能定量。(b) CHO细胞中的瞬时共转染。对于(a)和(b),黑色柱:单独第一个突 变体的信号;灰色柱:单独第二个突变体的信号;条纹柱:通过共表达 或共转染得到的信号。

-图14举例说明组装的异源二聚体ARS-KRE在所选小鼠染色体 17的DNA靶标上的活性。用等摩尔的靶标LagoZ质粒、ARS和KRE表 达质粒共转染CHO-K1细胞系,并测量β-半乳糖苷酶活性。用所述LagoZ 质粒和I-SceI、I-CreI、ARS或KRE重组质粒或空质粒共转染的细胞作为 对照。

本文以下的实施例仅举例说明本发明,并不限制其范围。其它使 用适当引物由序列不同于SEQ ID NO:69的cDNA获得的变体仍是本发 明的一部分。

实施例1:筛选新的功能性内切核酸酶

所述用于生产大范围核酸酶变体的方法以及哺乳动物或酵母细胞 中基于切割诱导重组的分析在国际PCT申请WO 2004/067736中已描 述,它们被用于筛选具有改变特异性的变体。这些分析得到功能性LacZ 报告基因,该报告基因可以通过标准方法监测(图3a)。

A)材料和方法

a)突变体文库的构建

如前所述(Epinat et al.,N.A.R.,2003,31,2952-2962),合成I-CreI wt和I-CreI D75N(或I-CreI N75)的开放读码框(SEQ ID NO:69,图 4A)。通过将第75位密码子替换为aac而引入突变D75N。通过使用来 自Sigma的简并引物以及所述I-CreI D75N基因作为DNA模板进行 PCR来产生大范围核酸酶文库的多样性,其中简并引物在第44、68和 70位带有密码子VVK(18个密码子,氨基酸ADEGHKNPQRST),这些 位置与位于3至5位的碱基直接相互作用。这些引物使得44、68和70 位残基可发生理论多样性为12的突变。简要地说,使用正向引物 (5’-gtttaaacatcagctaagcttgacctttvvkgtgacttcaaaagacccag-3’,SEQ ID NO:67)和反向引物 (5’-gatgtagttggaaacggatccmbbatcmbbtacgtaaccaacgcc-3’,SEQID NO:68)在50μl PCR 反应中扩增PCR片段:合并PCR产物,用乙醇沉淀然后重悬于50μl 10mM Tris。将PCR产物克隆入含有I-CreI D75N基因的pET表达载 体中,该表达载体已用适当的限制性酶进行消化。载体和插入片段DNA 的消化分两步进行(单酶消化),在其间DNA样品被提取出来(使用经 典的基于苯酚∶氯仿∶异戊醇的方法)并用乙醇沉淀。10μg消化后载 体DNA用于连接反应,其中插入片段DNA为5∶1过量。用所得载体通 过电穿孔转化大肠杆菌TG1细胞。为了得到超过文库的理论多样性的 许多细胞克隆,产生了6×104个克隆。从平板刮下细菌克隆,并且提取 和纯化对应的质粒载体。

通过亚克隆含有完整I-CreI D75N ORF的NcoI-EagI DNA片段, 该文库被再次克隆入酵母pCLS0542载体(图5)。在该基于2μ的可复 制并以LEU2基因为标记的载体中,I-CreI变体在半乳糖诱导型启动子 (Epinat et al.,先前引用)的控制下。在向大肠杆菌电穿孔后,获得7 ×104个克隆,其代表了DNA水平理论多样性(183=5832)的12倍。 将DNA提取出来并转化入酿酒酵母菌株FYC2-6A(MATα、trp1Δ63、 leu2Δ1、his3Δ200)。使用菌落挑取工具(QpixII,GENETIX)挑取出 13824个菌落,并生长在144个微量滴定板中。

b)靶标克隆的构建

C122124bp回文序列(tcaaaacgtcgtacgacgttttga,SEQ ID NO:12)是 近乎回文的天然I-CreI靶标(tcaaaacgtcgtgagacagtttgg,SEQ ID NO:65)的半位 点的重复。C1221在酵母和哺乳动物细胞中体外和离体都如I-CreI天然 靶标一样被高效切割。如下产生64个回文靶标:64对寡核苷酸 (ggcatacaagtttcaaaacnnngtacnnngttttgacaatcgtctgtca(SEQ ID NO:72)以及反向互补序 列)对应于64个DNA靶标的两条链,在所述寡核苷酸每侧具有12bp 非回文的额外序列,从Sigma定购所述寡核苷酸,退火并克隆入 PGEM-T Easy(PROMEGA)。然后,从64个pGEM-T衍生载体的每 个中切出400bp的PvuII片段,并克隆入前述酵母载体 pFL39-ADH-LACURAZ(Epinat et al.,先前引用)中,该载体也叫 pCLS0042(图6),得到了64个酵母报告载体。使用本领域技术人员已 知的经典方法进行切除、消化和连接的步骤。在pCLS0042的SmaI位 点插入靶序列。该64个回文靶标描述于图2B中(-5至-3位和+3至+5 位,SEQ ID NO:1至SEQ ID NO:64)。

c)酵母菌株和转化

将大范围核酸酶表达变体的文库和A44/R68/L70变体转化入 FYC2-6A(MATα、trp1Δ63、leu2Δ1、his3Δ200)菌株中。

将所述靶质粒转化入酵母菌株FYBL2-7B:(MATα、ura3Δ851、 trp1Δ63、leu2Δ1、lys2Δ202)。

对于转化,可以使用经典的化学/热激方案,常规地每μgDNA产 生106个独立转化体;在亮氨酸缺乏的合成培养基上筛选转化体(Gietz and Woods,2002)。

d)酵母中大范围核酸酶表达克隆的接合和筛选

I-CreI变体克隆以及酵母报告菌株贮存在甘油(20%)储备液中, 并在新微板中进行复制。突变体以网格方式培养在覆盖有尼龙滤膜的 YPD培养板上,并使用高网格密度(大约20个点/cm2)。在同样的滤膜 上进行第二次网格培养,针对每个变体点样由64或75个不同的带报告 基因的酵母菌株组成的第二层。简要地说,每个报告菌株在尼龙膜上点 样13824次,并且在每一个该点上被点样13824个表达变体大范围核酸 酶酵母克隆中的一个。将膜放在固体琼脂YPD丰富培养基上,并在30℃ 孵育过夜,使之发生接合。然后,将滤膜转移至缺乏亮氨酸和色氨酸并 以半乳糖(1%)为碳源(并以G418用于共表达实验)的合成培养基, 在37℃孵育5天,以选择携带表达和靶标载体的二倍体。5天后,将滤 膜放在固体琼脂糖培养基上,该培养基在0.5M磷酸钠缓冲液(pH 7.0)、 0.1%SDS、6%二甲基甲酰胺(DMF)、7mM β-巯基乙醇、1%琼脂糖中 含有0.02%的X-Gal,并在37℃孵育,以检测β-半乳糖苷酶活性。在孵 育2天后依据染色情况鉴定阳性克隆。通过扫描对结果进行分析,并使 用专用软件进行定量。对第二次筛选来说,对292个所选阳性克隆使用 同样的步骤,但是在同样的膜上对每个突变体进行4次检测(参见图8 和9a)。

d)初步筛选结果的序列以及再克隆

在酵母中初步筛选所鉴定的阳性克隆的开放读码框(ORF)通过 PCR进行扩增并测序。然后使用Gateway方案(Invitrogen)将ORF 再次克隆。通过对酵母菌落进行PCR来扩增ORF(Akada et al., Biotechniques,28,668-670,672-674),使用以下引物:来自PROLIGO 的ggggacaagtttgtacaaaaaagcaggcttcgaaggagatagaaccatggccaataccaaatataacaaagagttcc(SEQ ID NO:73)和 ggggaccactttgtacaagaaagctgggtttagtcggccgccggggaggatttcttcttctcgc(SEQ ID NO:74)。PCR产物克隆 入:(i)携带半乳糖诱导型启动子、作为选择标记的LEU2或KanR以 及2μ复制起点的酵母gateway表达载体,以及(ii)来自NOVAGEN 的pET 24d(+)载体。所得克隆通过测序(MILLEGEN)来验证。

B)结果

I-CreI是二聚体归巢内切酶,其切割22bp的假回文靶标。分析与 其天然靶标相结合的I-CreI的结构已显示出,在每个单体中8个残基与 7个碱基建立了直接相互作用(Jurica et al.,1998,先前引用)。残基 Q44、R68、R70与3至5位(以及-3至-5位,图1)的三个连续碱基 对相接触。使用穷举蛋白质文库对比靶标文库方法以局部地改造DNA 结合界面的该部分。首先,将所述I-CreI骨架从D75突变为N,从而降 低文库中由碱性残基R68和R70的替换引起的可能的能量限制,以满 足I-CreI结构中被包埋的D75的氢受体潜能。D75N突变体的同源二聚 体(从大肠杆菌细胞中纯化,其中使用pET表达载体使之过表达)显 示出切割I-CreI归巢位点。该D75N突变不影响蛋白结构,但是降低了 在过表达实验中的I-CreI的毒性。接着,第44、68和70位被随机改变, 并且如图1和2B所述,并产生通过由I-CreI所切割的回文靶标中±3、 ±4和±5位的替换而得到的64个回文靶标(Chevalier et al.,2003,先 前引用)。最后,蛋白质文库中的突变体对应于在三个残基位置由vvk 密码子编码的12种氨基酸的任意一种独立组合。结果,蛋白质文库的 最大(理论)多样性为123或1728。然而,对核酸而言,该多样性为183或5832。

所得文库被克隆入携带LEU2营养缺陷型标记基因的酵母复制型 表达载体,并转化入leu2突变体单倍体酵母菌株(FYC2-6A)中。所 述64个靶标被克隆入适当的酵母报告载体中并转化入单倍体菌株 (FYBL2-7B)中,得到64个检测株。

使用机器人辅助的接合方案以从我们的文库中筛选大量的大范围 核酸酶。通用的筛选策略描述于图3b中。13,8247个大范围核酸酶表达 克隆(大约2.3倍于理论多样性)以高密度(20个点/cm2)被点样在尼 龙滤膜上,并针对64个靶标菌株中每一种单独进行检验(884,608个点)。 2100个显示出针对至少一个靶标有活性的克隆被分离出来(图3b),并 且PCR扩增编码大范围核酸酶的ORF并测序。410个不同的序列被鉴 定出来,并且相似数目的对应克隆被选作进一步分析。将点样密度降低 至4个点/cm2,并且对每个克隆针对64个报告菌株进行一式四份地检 测,从而创造出完整的特征谱(如图8和9a)。350个阳性克隆可以被 证实。然后,为了避免含有多于一个克隆的菌株的可能性,突变体的 ORF通过PCR进行扩增,并再次克隆入酵母载体中。得到的质粒被单 个转化回到酵母中。得到294个这样的克隆,并以低密度进行检测(4 个点/cm2)。观察到与初步筛选的差异主要是弱信号,28个弱的切割酶 现在显示为阴性。只有一个阳性克隆显示出与在初步筛选中观察到的不 同特征谱。

实施例2:具有不同切割模式的I-CreI大范围核酸酶变体

来自实施例1的验证的克隆显示了非常不同的基序。这些新基序 中的某些与最初的骨架蛋白具有一些相似性,而许多其它的则完全不 同。各种模式的实例,包括野生型I-CreI和I-CreI N75,示于图8和9a。 整体结果(仅针对292个具有经修饰特异性的变体)总结于图7。

归巢核酸内切酶通常可以在它们的靶序列中存在一些简并性,我 们的第一个发现之一就是初始的I-CreI自身切割酵母中7种不同靶标。 我们得到的突变体中有许多也遵循这样的规则,切割序列的数目范围从 1至21个,平均为5.0个切割序列(标准偏差=3.6)。有趣的是,在50 个突变体中(14%),特异性被改变以致它们只切割一个靶标。37个(11 %)切割两个靶标,61个(17%)切割3个靶标以及58个(17%)切 割4个靶标。对于5个靶标和以上的,百分率低于10%。总计,38个 靶标被突变体所切割(图10a)。值得注意的是,在±3位为A的靶标上 几乎没有观察到被切割,并且在±5、±4、±3位为tgn和cgn的靶标 从不被切割。

这些结果不限制本发明的范围,因为图7仅显示从292个变体(291 个来自从完整文库中可获得的1728(或123)个I-CreI大范围核酸酶变 体)获得的结果。

实施例3:新的大范围核酸酶可以切割新的靶标,同时保持高活性和窄 特异性。

A)材料和方法

a)构建靶克隆

如实施例1所述,将所述64个回文靶标克隆入pGEM-T Easy (PROMEGA)。然后,如前所述(Epinat et al.,先前引用),切除400bp 的PvuII片段,并克隆入哺乳动物载体pcDNA3.1-LACURAZ-ΔURA。 参照以下克隆75个杂合靶序列:设计寡核苷酸使之含有两个不同的每 种突变体回文序列的半位点(PROLIGO)。

b)初始筛选结果的再次克隆

在酵母中初步筛选所鉴定的阳性克隆的开放读码框(ORF)被再 次克隆入(i)CHO gateway表达载体pCDNA6.2,参照供应商 (INVITROGEN)的说明书,以及(ii)来自NOVAGEN的pET 24d(+) 载体。得到的克隆通过测序(MILLEGEN)来验证。

c)哺乳动物细胞分析

将来自American Type Culture Collection(ATC C)的CHO-K1 细胞系培养在补充有10%胎牛血清的Ham’s F12K培养基中。对于瞬时 “单链退火(SSA,Single Strand Annealing)”分析而言,在转染前一天 将细胞以每孔13.103个细胞接种于12孔板中。在第二天用400ng DNA 使用EFFECTENE转染试剂盒(QIAGEN)进行共转染。使用等摩尔 量的靶LagoZ质粒和表达质粒。第二天,更换培养基并且将细胞再孵 育72小时。用PBS漂洗CHO-K1单层细胞一次。然后用150μl加入用 于β-半乳糖苷酶液体分析的裂解/暴露(revelation)缓冲液(100ml裂 解缓冲液(Tris-HCl 10mM pH7.5、NaCl 150mM、Triton X1000.1%、 BSA 0.1mg/ml、蛋白酶抑制剂)和900ml暴露缓冲液(10ml的Mg 100X 缓冲液(MgCl2 100mM、β-巯基乙醇35%)、110ml ONPG(8mg/ml) 以及780ml的磷酸钠0.1M pH7.5))在冰上裂解所述细胞30分钟。β- 半乳糖苷酶活性通过测定415nm处光密度进行分析。整个过程在自动 Velocity11 BioCel平台上进行。β-半乳糖苷酶活性被计算成以蛋白质浓 度、孵育时间和转染效率进行标准化的相对单位。

d)蛋白质表达和纯化

在大肠杆菌BL21(DE3)pLysS细胞中使用pET-24d(+)载体 (NOVAGEN)过表达带His标签的蛋白质。用IPTG(0.3mM)在25℃ 进行诱导。在含有蛋白酶抑制剂(Complete EDTA-free片,Roche)和 5%(v/v)甘油的50mM磷酸钠(pH8)、300mM氯化钠溶液中将细胞 进行超声处理。细胞裂解物以100000g离心60分钟。然后使用负载钴 的5ml Hi-Trap螯合HP柱(Amersham Biosciences)对His标签蛋白 质进行亲和纯化。在用线性梯度的咪唑(高至0.25M咪唑,然后为0.5M 咪唑、0.3M NaCl和50mM磷酸钠(pH8)的平台期)进行洗脱期间收 集几个级分。富含蛋白质的级分(通过SDS-PAGE测定)施加到第二 个柱。该粗纯化样品调整至pH6,并施加到用20mM磷酸钠(pH6.0) 平衡的5ml HiTrap Heparin HP柱(Amersham Biosciences)。结合蛋白 质用20mM磷酸钠以及1M氯化钠的氯化钠连续梯度进行洗脱。纯化级 分进行SDS-PAGE并浓缩(10kDa截留分子量centriprep Amicon Ultra 系统),冷冻在液氮中并贮存在-80℃。纯化蛋白质在PBS或10mM Tris-HCl(pH 8)缓冲液中使用PD10柱(Sephadex G-25M,Amersham Biosciences)进行脱盐处理。

e)体外切割分析

带有单个大范围核酸酶DNA靶切割位点的pGEM质粒首先用 XmnI进行线性化处理。于37℃在10mM Tris-HCl(pH 8)、50mM NaCl、 10mM MgCl2、1mM DTT和50μg/ml BSA中进行切割分析。2nM用作 靶标底物浓度。在25μl终体积反应中,用于每种蛋白质的稀释范围在0 和85nM之间。1小时后通过加入5μl的45%甘油、95mM EDTA(pH 8)、1.5%(w/v)SDS、1.5mg/ml蛋白酶K和0.048%(w/v)溴酚蓝(6X Buffer Stop)并在37℃孵育30分钟从而终止反应。消化物在琼脂糖电 泳凝胶上跑胶,并在溴化乙锭染色后将片段定量,以计算切割的百分比。

B)结果

选择8个代表性突变体(属于6个不同的聚类,参见以下)用于 进一步表征(图9)。首先,通过使用如先前报道中所述的基于将表达大 范围核酸酶的载体和靶标载体瞬时共转染的分析将酵母中的数据在哺 乳动物细胞中验证。该8个突变体ORF和64个靶标被克隆入适当的载 体中,并使用机器人辅助的基于微量滴定板的方案将每种所选变体与64 个不同报告质粒的每一种共转染入CHO细胞。大范围核酸酶诱导的重 组通过标准定量ONPG分析进行测量,该ONPG分析测定功能性β-半 乳糖苷酶基因的恢复。在5个独立实验中发现特征模式可以定性及定量 重复。如图9a所示,在酵母和CHO细胞中几乎总是观察到强的和中等 的信号(ADK除外),因此验证了酵母HTS方法的关联性。然而,在 酵母中观察到的弱信号在CHO细胞中常常检测不到,可能因为检测水 平的不同(参见QRR和靶标gtg、gct和ttc)。也在大肠杆菌中产生4 种突变体并且通过金属亲和层析进行纯化。对它们针对野生型位点及其 同类位点的相对体外切割效率进行测定。在宽范围突变体浓度下在标准 条件下估计切割程度(图9b)。类似地,分析了I-CreI野生型(wt)针 对这些靶标的活性。在许多情况下,不能实现对底物100%切割,可能 反映出这些蛋白质可能有很少或没有转换的事实(Perrin et al.,EMBO J.,1993,12,2939-2947;Wang et al.,Nucleic Acids Res.,1997,25, 3767-3776)。通常,体外分析证实了从酵母和CHO细胞中获得的数据, 但是令人惊奇地,gtt靶标被I-CreI高效地切割。

从酵母和CHO中获得的特征模式明显看出特异性转移:I-CreI 偏好的gtc靶标不被切割或几乎不被切割,而新的靶标则观察到信号。 这种特异性转换通过对QAN、DRK、RAT和KTG的体外分析得到证 实,如图9b所示。另外,这四个在酵母和CHO中展示不同水平活性 (图9a)的突变体显示出在体外切割17-60%的其偏好靶标(图9b), 这与I-CreI的动力学(13-25nM达到最大切割的一半)相似。因此,通 过改造,活性大部分被保留。第三,切割靶标的数目在突变体之间有所 不同:强的切割酶如QRR、QAN、ARL和KTG具有在I-CreI所观察 范围的切割谱(酵母中为5-8个可检测信号,CHO中为3-6个)。与切 割较弱的突变体比较特异性比较困难。例如,DRK中观察到单个弱信 号,但是这可能代表从更加复杂模式中减弱而得的仅有的可检测信号。 然而,强切割变体的表现显示出改造保留了非常窄的特异性。

实施例4:层级聚类定义7个I-CreI变体家族。

A)材料和方法

使用来自R软件包的hclust进行聚类分析。我们使用从初始、低 密度筛选得到的定量数据。变体和靶标均使用Euclidean距离和Ward’s 方法(Ward,J.H.,American Stat.Assoc.,1963,58,236-244)的标准层 级聚类分析法进行聚类分析。突变体和靶标的系统树图被重新排序以优 化聚类的位置,并且在高度为8时切割突变体系统树状图来定义聚类。

B)结果

然后,使用层级聚类分析来确定是否可以在变体的众多且多样的 切割模式中定义家族。因为初步和二次筛选给出合适的结果,所以来自 第一轮的酵母低密度筛选的定量数据用于分析以允许较大的样品大小。 变体和靶标均使用Euclidean距离和Ward’s方法(Ward,J.H.,先前引 用)的标准层级聚类分析法进行聚类分析,并定义了7个聚类(图10b)。 显示了对其中3个的详细分析(图10c),并且结果总结于表I中。

表I:聚类分析

1依据切割指数的频率,如图10c所述

2在每个位置,标明在该聚类的多于1/3中存在的残基

对于每个聚类而言,可以基于信号的频率和强度而鉴定一组优选 的靶标(图10c)。所述每个聚类的三个优选靶标标于表1中,以及它们 的切割频率。这些频率的总计为该聚类之特异性的量度。例如,在聚类 1中,三个优选靶标(gtt/c/g),占所观察切割的78.1%,其中gtt单独 占46.2%,显示出非常窄的特异性。实际上,该聚类包括几种蛋白质, 如QAN其大多切割gtt(图9a)。相反地,在聚类2中三个优选靶标仅 代表所有观察信号的36.6%。依据在该聚类中观察到的相对较广且多样 的模式,QRR切割5种靶标(图9a),而其它聚类成员的活性不限于这 5种靶标。

在每个聚类中所发现残基的分析显示出对第44位:Q的强烈偏好 在聚类1和2中占绝对优势,但是A和N在聚类3和4中更常出现, 并且在聚类6和7中更偏好K。同时,这些偏好性与±4位DNA的强 碱基优先性相关联,在聚类1和2中大多数为t:a碱基对,在聚类3、4 和5中为a:t,以及在聚类6和7中为c:g(参见表I)。与其靶标结合的 I-CreI的结构显示出Q44残基与底部链的-4位(以及顶部链的+4位, 参见图1b和1c)相互作用。这些结果提示该相互作用在我们的突变体 中很大程度上是保守的,并且显示出“编码”,其中Q44会建立与腺嘌 呤的接触,A44(或更少出现的N44)与胸腺嘧啶的接触,以及K44与 鸟嘌呤的接触。这样的相关性在68位和70位没有观察到。

实施例5:变体可以组装成功能性异源二聚体从而切割新DNA靶序列

A)材料和方法

所述75个杂合靶序列如下进行克隆:设计寡核苷酸使之含有两个 每个突变体回文序列的不同的半位点(PROLIGO)。通过PCR扩增单 链寡核苷酸获得的双链靶DNA使用Gateway方案(INVITROGEN) 克隆到酵母和哺乳动物报告载体中。将酵母报告载体转化到酿酒酵母菌 株FYBL2-7B(MATα、ura3Δ851、trp1Δ63、leu2Δ1、lys2Δ202)中。

B)结果

变体是能够切割回文位点的同源二聚体。为了检测可切割靶标列 表是否可以通过产生可以切割杂合切割位点(如图11所述)的异源二 聚体而得以扩展,选择具有独特特征模式的I-CreI变体的亚组并将其克 隆到两个不同的以LEU2或KAN基因为标记的酵母载体中。然后,将 在44、68和/或70位具有突变以及75位为N的突变体的组合与一组回 文和非回文的嵌合DNA靶标共表达在酵母中。一个例子显示在图12中: 将K44、T68、G70、N75(KTG)和Q44、A68、N70、N75(QAN) 突变体共表达,导致两个嵌合靶标gtt/gcc和gtt/cct的切割,所述嵌合 靶标不被单独任一突变体所切割。回文序列gtt、cct和gcc靶标(以及 KTG和QAN的其它靶标)也被切割,可能由于同源二聚体的形成所导 致,但是不相关的靶标则不被切割。另外,gtt、cct或gcc半位点不足 以发生切割,因为这些靶标是完全抗性的(参见图12中ggg/gcc、gat/gcc、 gcc/tac,以及许多其它)。意料之外的切割仅在gtc/cct和gtt/gtc中分别 对于KTG和QAN同源二聚体观察到,但是信号非常弱。因此,有效 的切割需要两个突变体单体的协同结合。这些结果表明异源二聚体种类 的良好特异性水平。

总之,14个不同蛋白质的总共112种组合在酵母中进行了检测, 并且37.5%的组合(42/112)显示出对其预期的嵌合靶标的阳性信号。 在图13a中显示了6个实例的定量数据,并且对于相同的6种组合,用 一组相关靶标在CHO细胞的瞬时共转染实验中证实了结果(图13b)。 作为一般规则,当两个表达蛋白之一作为同源二聚体表现出强的信号时 总是获得功能性异源二聚体。例如,两种低活性突变体DRN和RRN, 与强的切割酶如KTG或QRR形成功能性异源二聚体(图13a和13b), 而将同样的弱突变体共表达则不能检测到嵌合靶标的切割。

实施例6:组装的异源二聚体对天然DNA靶标的切割

A)材料与方法

a)基因组搜索

被I-CreI变体潜在切割的天然靶标通过扫描公共数据库而被识 别,对于匹配caaaacnnnnnnnnnngttttg模式的基因组序列,其中n为a、t、c 或g(SEQ ID NO:78)。在小鼠17号染色体中鉴定到天然DNA靶序列 caaaactatgtagaggggttttg(SEQ ID NO:75)。

该DNA序列被分别切割tcaaaactatgtgaatagttttga(SEQ ID NO:76)和 tcaaaacccctgtgaagggttttga(SEQ ID NO:77)序列的两种I-CreI变体的组合潜在切割。

b)大范围核酸酶变体的分离

如实施例1所述,使用序列tcaaaactatgtgaatagttttga(SEQ ID NO:76)或序列 tcaaaaccctgtgaagggttttga(SEQ ID NO:77)作为靶标,通过酵母中切割诱导的重组 分析来选择变体。

c)靶标质粒的构建

设计寡核苷酸使之含有各自突变体回文序列的两个不同半位点 (PROLIGO)。使用Gateway方案(INVITROGEN),将通过PCR扩 增单链寡核苷酸得到的双链靶标DNA克隆到哺乳动物报告载体 pcDNA3.1-LACURAZ-ΔURA中,如前所述(Epinat et al.,先前引用), 从而得到靶LagoZ质粒。

d)大范围核酸酶表达载体的构建

如实施例1所述,在酵母中进行筛选时所鉴定克隆的开放阅读框 (ORF)通过对酵母菌落PCR而扩增,并分别克隆到CHO表达载体 pCDNA6.2(INVITROGEN)中。在CMV启动子的控制下表达I-CreI 变体。

e)哺乳动物细胞分析

用等摩尔量的靶LagoZ质粒和表达质粒瞬时共转染CHO-K1细 胞系,并且如实施例3和5所述测量β-半乳糖苷酶活性。

B)结果

被I-CreI变体潜在切割的天然DNA靶标通过进行基因组搜索与 模式caaaacnnnnnnnnnngttttg(SEQ ID NO:78)匹配的序列来鉴定。将随机选择的 在小鼠17号染色体中鉴定的DNA序列(SEQ ID NO:78)克隆到报告 质粒中。该DNA靶标被I-CreI变体A44,R68,S70,N75(ARS)和 K44,R68,E70,N75(KRE)的组合潜在地切割。

这两种变体在CHO细胞中的共表达导致如图14所显示的功能性 异源二聚体蛋白质的形成。实际上,当I-CreI变体单独表达时,虽然 KRE蛋白显示了残余活性,但是对小鼠DNA靶标的切割活性几乎不能 检测到。相反地,当这两种变体与带有潜在靶标的质粒一起共表达时, 可以测量到强的β-半乳糖苷酶活性。所有这些数据表明异源二聚化发生 在CHO细胞中,并且异源二聚体是有功能的。

这些数据表明通过组装同源二聚体变体而形成的异源二聚体蛋白 质将天然存在的DNA靶序列的列表扩展至所有潜在的杂合可切割靶 标,这些靶标从所有可能的变体组合得到。

而且,这些数据表明,了解其同源二聚体各自的DNA靶标,则可以 预测可被变体组合切割的DNA序列。另外,靶标的1和2(以及-1和-2) 位核苷酸可以不同于gtac,表明它们在DNA/蛋白质相互作用中起较小作 用。

参考文献

Belfort,M.and Roberts,R.J.(1997)Homing endonucleases: keeping the house in order.Nucleic Acids Res,25,3379-3388.

Bell-Pedersen,D.,Quirk,S.,Clyman,J.and Belfort,M.(1990) Intron mobility in phage T4 is dependent upon a distinctive class of endonucleases and independent of DNA sequences encoding the intron core:mechanistic and evolutionary implications.Nucleic Acids Res,18,3763-3770.

Bell-Pedersen,D.,Quirk,S.M.,Aubrey,M.and Belfort,M.(1989) A site-specific endonuclease and co-conversion of flanking exons associated with the mobile td intron of phage T4.Gene,82,119-126.

Bell-Pedersen,D.,Quirk,S.M.,Bryk,M.and Belfort,M.(1991)I- TevI,the endonuclease encoded by the mobile td intron,recognizes binding and cleavage domains on its DNA target.Proc Natl Acad Sci U S A,88,7719-7723.

Bibikova,M.,Beumer,K.,Trautman,J.K.and Carroll,D.(2003) Enhancing gene targeting with designed zinc finger nucleases.Science,300,764.

Bibikova,M.,Carroll,D.,Segal,D.J.,Trautman,J.K.,Smith,J., Kim,Y.G.and Chandrasegaran,S.(2001)Stimulation of homologous recombination through targeted cleavage by chimeric nucleases.Mol Cell Biol,21,289-297.

Bibikova,M.,Golic,M.,Golic,K.G.and Carroll,D.(2002) Targeted chromosomal cleavage and mutagenesis in Drosophila using zinc-finger nucleases.Genetics,161,1169-1175.

Chevalier,B.,Sussman,D.,Otis,C., A.J.,Turmel,M., Lemieux,C.,Stephens,K.,Monnat,R.Jr.,Stoddard,B.L.,(2004)Metal-Dependant DNA cleavage mechanism of the I-CreI LAGLIDADG homing endonuclease. Biochemistry,43,14015-14026.

Chevalier,B.S.,Kortemme,T.,Chadsey,M.S.,Baker,D.,Monnat, R.J.and Stoddard,B.L.(2002)Design,activity,and structure of a highly specific artificial endonuclease.Mol Cell,10,895-905.

Chevalier,B.S.and Stoddard,B.L.(2001)Homing endonucleases: structural and functional insight into the catalysts of intron/intein mobility.Nucleic Acids Res,29,3757-3774.

Choulika,A.,Perrin,A.,Dujon,B.and Nicolas,J.F.(1995) Induction of homologous recombination in mammalian chromosomes by using the I- SceI system of Saccharomyces cerevisiae.Mol Cell Biol,15,1968-1973.

Cohen-Tannoudji,M.,Robine,S.,Choulika,A.,Pinto,D.,El Marjou,F.,Babinet,C.,Louvard,D.and Jaisser,F.(1998)I-SceI-induced gene replacement at a natural locus in embryonic stem cells.Mol Cell Biol,18,1444-1448.

Colleaux,L.,D′Auriol,L.,Galibert,F.and Dujon,B.(1988) Recognition and cleavage site of the intron-encoded omega transposase.Proc Natl Acad Sci U S A,85,6022-6026.

Donoho,G.,Jasin,M.and Berg,P.(1998)Analysis of gene targeting and intrachromosomal homologous recombination stimulated by genomic double-strand breaks in mouse embryonic stem cells.Mol Cell Biol,18,4070-4078.

Elliott,B.,Richardson,C.,Winderbaum,J.,Nickoloff,J.A.and Jasin,M.(1998)Gene conversion tracts from double-strand break repair in mammalian cells.Mol Cell Biol,18,93-101.

Epinat,J.C.,Arnould,S.,Chames,P.,Rochaix,P.,Desfontaines,D., Puzin,C.,Patin,A.,Zanghellini,A.,Paques,F.and Lacroix,E.(2003)A novel engineered  meganuclease induces homologous recombination in yeast and mammalian cell s.Nucleic Acids Res,31,2952-2962.

Gietz,R.D.and Woods,R.A.(2002)Transformation of yeast by lithium acetate/single-stranded carrier DNA/polyethylene glycol method.Methods Enzymol,350,87-96.

Haber,J.E.(1998)Mating-type gene switching in Saccharomyces cerevisiae.Annu Rev Genet,32,561-599.

Jacquier,A.and Dujon,B.(1985)An intron-encoded protein is active in a gene conversion process that spreads an intron into a mitochondrial gene. Cell,41,383-394.

Jurica,M.S.,Monnat,R.J.,Jr.and Stoddard,B.L.(1998)DNA recognition and cleavage by the LAGLIDADG homing endonuclease I-CreI.Mol Cell,2,469-476.

Klar,A.J.,Strathern,J.N.and Abraham,J.A.(1984)Involvement of double-strand chromosomal breaks for mating-type switching in Saccharomyces cerevisiae.Cold Spring Harb Symp Quant Biol,49,77-88.

Kostriken,R.,Strathern,J.N.,Klar,A.J.,Hicks,J.B.and Heffron,F. (1983)A site-specific endonuclease essential for mating-type switching in Saccharomyces cerevisiae.Cell,35,167-174.

Liang,F.,Han,M.,Romanienko,P.J.and Jasin,M.(1998) Homology-directed repair is a major double-strand break repair pathway in mammalian cells.Proc Natl Acad Sci U S A,95,5172-5177.

Moynahan,M.E.and Jasin,M.(1997)Loss of heterozygosity induced by a chromosomal double-strand break.Proc Natl Acad Sci U S A,94,8988- 8993.

Mueller,J.E.,Smith,D.and Belfort,M.(1996)Exon coconversion biases accompanying intron homing:battle of the nucleases.Genes Dev,10,2158- 2166.

Perrin,A.,Buckle,M.and Dujon,B.(1993)Asymmetrical recognition and activity of the I-SceI endonuclease on its site and on intron-exon junctions.Embo J,12,2939-2947.

Plessis,A.,Perrin,A.,Haber,J.E.and Dujon,B.(1992)Site-specific recombination  determined  by  I-SceI,a  mitochondrial group I intron-encoded endonuclease expressed in the yeast nucleus.Genetics,130,451-460.

Porteus,M.H.and Ba1timore,D.(2003)Chimeric nucleases stimulate gene targeting in human cells.Science,300,763.

Posfai,G.,Kolisnychenko,V.,Bereczki,Z.and Blattner,F.R. (1999)Markerless gene replacement in Escherichia coli stimulated by a double-strand break in the chromosome.Nucleic Acids Res,27,4409-4415.

Puchta,H.(1999)Double-strand break-induced recombination between ectopic homologous sequences in somatic plant cells.Genetics,152,1173- 1181.

Puchta,H.,Dujon,B.and Hohn,B.(1993)Homologous recombination in plant cells is enhanced by in vivo induction of double strand breaks into DNA by a site-specific endonuclease.Nucleic Acids Res,21,5034-5040.

Puchta,H.,Dujon,B.and Hohn,B.(1996)Two different but related mechanisms are used in plants for the repair of genomic double-strand breaks by homologous recombination.Proc Natl Acad Sci U S A,93,5055-5060.

Richardson,C.,Moynahan,M.E.and Jasin,M.(1998)Double- strand break repair by interchromosomal recombination:suppression of chromosomal translocations.Genes Dev,12,3831-3842.

Rong,Y.S.and Golic,K.G.(2000)Gene targeting by homologous recombination in Drosophila.Science,288,2013-2018.

Rong,Y.S.and Golic,K.G.(2001)A targeted gene knockout in Drosophila.Genetics,157,1307-1312.

Rong,Y.S.,Titen,S.W.,Xie,H.B.,Golic,M.M.,Bastiani,M., Bandyopadhyay,P.,Olivera,B.M.,Brodsky,M.,Rubin,G.M.and Golic,K.G.(2002) Targeted mutagenesis by homologous recombination in D.melanogaster.Genes Dev, 16,1568-1581.

Rouet,P.,Smih,F.and Jasin,M.(1994)Introduction of double- strand breaks into the genome of mouse cells by expression of a rare-cutting endonuclease.Mol Cell Biol,14,8096-8106.

Seligman et al.,1997,Genetics,1997,147,1653-1664

Seligman,L.M.,Chisholm,K.M.,Chevalier,B.S.,Chadsey,M.S., Edwards,S.T.,Savage,J.H.and Veillet,A.L.(2002)Mutations altering the cleavage specificity of a homing endonuclease.Nucleic Acids Res,30,3870-3879.

Siebert,R.and Puchta,H.(2002)Efficient repair of genomic double-strand breaks by homologous recombination between directly repeated sequences in the plant genome.Plant Cell,14,1121-1131.

Sussman,D.,Chadsey,M.,Fauce,S.,Engel,A.,Bruett,A.,Monnat, R.,Jr.,Stoddard,B.L.and Seligman,L.M.(2004)Isolation and characterization of new homing endonucleage specificities at individual target site positions.J Mol Biol, 342,31-41.

Thierry,A.and Dujon,B.(1992)Nested chromosomal fragmentation in yeast using the meganuclease I-Sce I:a new method for physical mapping of eukaryotic genomes.Nucleic Acids Res,20,5625-5631.

序列表

<110>赛莱克蒂斯公司

     菲利普.迪沙托

     弗雷德里克.帕克

<120>具有修饰特异性的I-CreI大范围核酸酶变体,制备方法及其用途

<130>F1546/5PCT

<160>80

<170>PatentIn version 3.1

<210>1

<211>24

<212>DNA

<213>人工序列

<220>

<223>ggg

<400>1

tcaaaacggg gtaccccgtt ttga    24

<210>2

<211>24

<212>DNA

<213>人工序列

<220>

<223>gga

<400>2

tcaaaacgga gtactccgtt ttga    24

<210>3

<211>24

<212>DNA

<213>人工序列

<220>

<223>ggt

<400>3

tcaaaacggt gtacaccgtt ttga    24

<210>4

<211>24

<212>DNA

<213>人工序列

<220>

<223>ggc

<400>4

tcaaaacggc gtacgccgtt ttga    24

<210>5

<211>24

<212>DNA

<213>人工序列

<220>

<223>gag

<400>5

tcaaaacgag gtacctcgtt ttga    24

<210>6

<211>24

<212>DNA

<213>人工序列

<220>

<223>gaa

<400>6

tcaaaacgaa gtacttcgtt ttga    24

<210>7

<211>24

<212>DNA

<213>人工序列

<220>

<223>gat

<400>7

tcaaaacgat gtacatcgtt ttga    24

<210>8

<211>24

<212>DNA

<213>人工序列

<220>

<223>gac

<400>8

tcaaaacgac gtacgtcgtt ttga    24

<210>9

<211>24

<212>DNA

<213>人工序列

<220>

<223>gtg

<400>9

tcaaaacgtg gtaccacgtt ttga    24

<210>10

<211>24

<212>DNA

<213>人工序列

<220>

<223>gta

<400>10

tcaaaacgta gtactacgtt ttga    24

<210>11

<211>24

<212>DNA

<213>人工序列

<220>

<223>gtt

<400>11

tcaaaacgtt gtacaacgtt ttga    24

<210>12

<211>24.

<212>DNA

<213>人工序列

<220>

<223>gtc(=C1221)

<400>12

tcaaaacgtc gtacgacgtt ttga    24

<210>13

<211>24

<212>DNA

<213>人工序列

<220>

<223>gcg

<400>13

tcaaaacgcg gtaccgcgtt ttga    24

<210>14

<211>24

<212>DNA

<213>人工序列

<220>

<223>gca

<400>14

tcaaaacgca gtactgcgtt ttga    24

<210>15

<211>24

<212>DNA

<213>人工序列

<220>

<223>gct

<400>15

tcaaaacgct gtacagcgtt ttga    24

<210>16

<211>24

<212>DNA

<213>人工序列

<220>

<223>gcc

<400>16

tcaaaacgcc gtacggcgtt ttga    24

<210>17

<211>24

<212>DNA

<213>人工序列

<220>

<223>agg

<400>17

tcaaaacagg gtaccctgtt ttga    24

<210>18

<211>24

<212>DNA

<213>人工序列

<220>

<223>aga

<400>18

tcaaaacaga gtactctgtt ttga    24

<210>19

<211>24

<212>DNA

<213>人工序列

<220>

<223>agt

<400>19

tcaaaacagt gtacactgtt ttga    24

<210>20

<211>24

<212>DNA

<213>人工序列

<220>

<223>agc

<400>20

tcaaaacagc gtacgctgtt ttga    24

<210>21

<211>24

<212>DNA

<213>人工序列

<220>

<223>aag

<400>21

tcaaaacaag gtaccttgtt ttga    24

<210>22

<211>24

<212>DNA

<213>人工序列

<220>

<223>aaa

<400>22

tcaaaacaaa gtactttgtt ttga    24

<210>23

<211>24

<212>DNA

<213>人工序列

<220>

<223>aat

<400>23

tcaaaacaat gtacattgtt ttga    24

<210>24

<211>24

<212>DNA

<213>人工序列

<220>

<223>aac

<400>24

tcaaaacaac gtacgttgtt ttga    24

<210>25

<211>24

<212>DNA

<213>人工序列

<220>

<223>atg

<400>25

tcaaaacatg gtaccatgtt ttga    24

<210>26

<211>24

<212>DNA

<213>人工序列

<220>

<223>ata

<400>26

tcaaaacata gtactatgtt ttga    24

<210>27

<211>24

<212>DNA

<213>人工序列

<220>

<223>att

<400>27

tcaaaacatt gtacaatgtt ttga    24

<210>28

<211>24

<212>DNA

<213>人工序列

<220>

<223>atc

<400>28

tcaaaacatc gtacgatgtt ttga    24

<210>29

<211>24

<212>DNA

<213>人工序列

<220>

<223>acg

<400>29

tcaaaacacg gtaccgtgtt ttga    24

<210>30

<211>24

<212>DNA

<213>人工序列

<220>

<223>aca

<400>30

tcaaaacaca gtactgtgtt ttga    24

<210>31

<211>24

<212>DNA

<213>人工序列

<220>

<223>act

<400>31

tcaaaacact gtacagtgtt ttga    24

<210>32

<211>24

<212>DNA

<213>人工序列

<220>

<223>acc

<400>32

tcaaaacacc gtacggtgtt ttga    24

<210>33

<211>24

<212>DNA

<213>人工序列

<220>

<223>tgg

<400>33

tcaaaactgg gtacccagtt ttga    24

<210>34

<211>24

<212>DNA

<213>人工序列

<220>

<223>tga

<400>34

tcaaaactga gtactcagtt ttga    24

<210>35

<211>24

<212>DNA

<213>人工序列

<220>

<223>tgt

<400>35

tcaaaactgt gtacacagtt ttga    24

<210>36

<211>24

<212>DNA

<213>人工序列

<220>

<223>tgc

<400>36

tcaaaactgc gtacgcagtt ttga    24

<210>37

<211>24

<212>DNA

<213>人工序列

<220>

<223>tag

<400>37

tcaaaactag gtacctagtt ttga    24

<210>38

<211>24

<212>DNA

<213>人工序列

<220>

<223>taa

<400>38

tcaaaactaa gtacttagtt ttga    24

<210>39

<211>24

<212>DNA

<213>人工序列

<220>

<223>tat

<400>39

tcaaaactat gtacatagtt ttga    24

<210>40

<211>24

<212>DNA

<213>人工序列

<220>

<223>tac

<400>40

tcaaaactac gtacgtagtt ttga    24

<210>41

<211>24

<212>DNA

<213>人工序列

<220>

<223>ttg

<400>41

tcaaaacttg gtaccaagtt ttga         24

<210>42

<211>24

<212>DNA

<213>人工序列

<220>

<223>tta

<400>42

tcaaaactta gtactaagtt ttga         24

<210>43

<211>24

<212>DNA

<213>人工序列

<220>

<223>ttt

<400>43

tcaaaacttt gtacaaagtt ttga         24

<210>44

<211>24

<212>DNA

<213>人工序列

<220>

<223>ttc

<400>44

tcaaaacttc gtacgaagtt ttga                 24

<210>45

<211>24

<212>DNA

<213>人工序列

<220>

<223>tcg

<400>45

tcaaaactcg gtaccgagtt ttga                 24

<210>46

<211>24

<212>DNA

<213>人工序列

<220>

<223>tca

<400>46

tcaaaactca gtactgagtt ttga                24

<210>47

<211>24

<212>DNA

<213>人工序列

<220>

<223>tct

<400>47

tcaaaactct gtacagagtt ttga                24

<210>48

<211>24

<212>DNA

<213>人工序列

<220>

<223>tcc

<400>48

tcaaaactcc gtacggagtt ttga             24

<210>49

<211>24

<212>DNA

<213>人工序列

<220>

<223>cgg

<400>49

tcaaaaccgg gtacccggtt ttga             24

<210>50

<211>24

<212>DNA

<213>人工序列

<220>

<223>cga

<400>50

tcaaaaccga gtactcggtt ttga             24

<210>51

<211>24

<212>DNA

<213>人工序列

<220>

<223>cgt

<400>51

tcaaaaccgt gtacacggtt ttga             24

<210>52

<211>24

<212>DNA

<213>人工序列

<220>

<223>cgc

<400>52

tcaaaaccgc gtacgcggtt ttga            24

<210>53

<211>24

<212>DNA

<213>人工序列

<220>

<223>cag

<400>53

tcaaaaccag gtacctggtt ttga           24

<210>54

<211>24

<212>DNA

<213>人工序列

<220>

<223>caa

<400>54

tcaaaaccaa gtacttggtt ttga           24

<210>55

<211>24

<212>DNA

<213>人工序列

<220>

<223>cat

<400>55

tcaaaaccat gtacatggtt ttga           24

<210>56

<211>24

<212>DNA

<213>人工序列

<220>

<223>cac

<400>56

tcaaaaccac gtacgtggtt ttga              24

<210>57

<211>24

<212>DNA

<213>人工序列

<220>

<223>ctg

<400>57

tcaaaacctg gtaccaggtt ttga              24

<210>58

<211>24

<212>DNA

<213>人工序列

<220>

<223>cta

<400>58

tcaaaaccta gtactaggtt ttga              24

<210>59

<211>24

<212>DNA

<213>人工序列

<220>

<223>ctt

<400>59

tcaaaacctt gtacaaggtt ttga              24

<210>60

<211>24

<212>DNA

<213>人工序列

<220>

<223>ctc

<400>60

tcaaaacctc gtacgaggtt ttga            24

<210>61

<211>24

<212>DNA

<213>人工序列

<220>

<223>ccg

<400>61

tcaaaacccg gtaccgggtt ttga            24

<210>62

<211>24

<212>DNA

<213>人工序列

<220>

<223>cca

<400>62

tcaaaaccca gtactgggtt ttga            24

<210>63

<211>24

<212>DNA

<213>人工序列

<220>

<223>cct

<400>63

tcaaaaccct gtacagggtt ttga                24

<210>64

<211>24

<212>DNA

<213>人工序列

<220>

<223>ccc

<400>64

tcaaaacccc gtacggggtt ttga                24

<210>65

<211>24

<212>DNA

<213>人工序列

<220>

<223>c1234(=wt)

<400>65

tcaaaacgtc gtgagacagt ttgg                24

<210>66

<211>24

<212>DNA

<213>人工序列

<220>

<223>C4334

<400>66

ccaaactgtc tcgagacagt ttgg                24

<210>67

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物vvk(正向)

<220>

<221>misc_feature

<223>k为g或t

     v为a 或g或c

<400>67

gtttaaacat cagctaagct tgacctttvv kgtgacttca aaagacccag             50

<210>68

<211>45

<212>DNA

<213>人工序列

<220>

<223>引物mbb(反向)

<220>

<221>misc_feature

<223>b为g或t或c

     m为a或c

<400>68

gatgtagttg gaaacggatc cmbbatcmbb tacgtaacca acgcc                  45

<210>69

<211>501

<212>DNA

<213>莱茵衣藻(chlamydomonas reinhardtii)

<220>

<221>CDS

<222>(1)..(501)

<223>

<400>69

atg gcc aat acc aaa tat aac aaa gag ttc ctg ctg tac ctg gcc ggc    48

Met Ala Asn Thr Lys Tyr Asn Lys Glu Phe Leu Leu Tyr Leu Ala Gly

1               5                   10                  15

ttt gtg gac ggt gac ggt agc atc atc gct cag att aaa cca aac cag       96

Phe Val Asp Gly Asp Gly Ser Ile Ile Ala Gln Ile Lys Pro Asn Gln

            20                  25                  30

tct tat aag ttt aaa cat cag cta agc ttg acc ttt cag gtg act caa      144

Ser Tyr Lys Phe Lys His Gln Leu Ser Leu Thr Phe Gln Val Thr Gln

        35                  40                  45

aag acc cag cgc cgt tgg ttt ctg gac aaa cta gtg gat gaa att ggc      192

Lys Thr Gln Arg Arg Trp Phe Leu Asp Lys Leu Val Asp Glu Ile Gly

    50                  55                  60

gtt ggt tac gta cgt gat cgc gga tcc gtt tcc aac tac atc tta agc      240

Val Gly Tyr Val Arg Asp Arg Gly Ser Val Ser Asn Tyr Ile Leu Ser

65                  70                  75                  80

gaa atc aag ccg ctg cac aac ttc ctg act caa ctg cag ccg ttt ctg      288

Glu Ile Lys Pro Leu His Asn Phe Leu Thr Gln Leu Gln Pro Phe Leu

                85                  90                  95

aaa ctg aaa cag aaa cag gca aac ctg gtt ctg aaa att atc gaa cag      336

Lys Leu Lys Gln Lys Gln Ala Asn Leu Val Leu Lys Ile Ile Glu Gln

            100                 105                 110

ctg ccg tct gca aaa gaa tcc ccg gac aaa ttc ctg gaa gtt tgt acc      384

Leu Pro Ser Ala Lys Glu Ser Pro Asp Lys Phe Leu Glu Val Cys Thr

        115                 120                 125

tgg gtg gat cag att gca gct ctg aac gat tct aag acg cgt aaa acc      432

Trp Val Asp Gln Ile Ala Ala Leu Asn Asp Ser Lys Thr Arg Lys Thr

    130                 135                 140

act tct gaa acc gtt cgt gct gtg ctg gac agc ctg agc gag aag aag      480

Thr Ser Glu Thr Val Arg Ala Val Leu Asp Ser Leu Ser Glu Lys Lys

145                 150                 155                 160

aaa tcc tcc ccg gcg gcc gac                                          501

Lys Ser Ser Pro Ala Ala Asp

                165

<210>70

<211>167

<212>PRT

<213>莱茵衣藻

<400>70

Met Ala Asn Thr Lys Tyr Asn Lys Glu Phe Leu Leu Tyr Leu Ala Gly

1               5                   10                  15

Phe Val Asp Gly Asp Gly Ser Ile Ile Ala Gln Ile Lys Pro Asn Gln

            20                  25                  30

Ser Tyr Lys Phe Lys His Gln Leu Ser Leu Thr Phe Gln Val Thr Gln

        35                  40                  45

Lys Thr Gln Arg Arg Trp Phe Leu Asp Lys Leu Val Asp Glu Ile Gly

    50                  55                  60

Val Gly Tyr Val Arg Asp Arg Gly Ser Val Ser Asn Tyr Tle Leu Ser

65                  70                  75                  80

Glu Ile Lys Pro Leu His Asn Phe Leu Thr Gln Leu Gln Pro Phe Leu

                85                  90                  95

Lys Leu Lys Gln Lys Gln Ala Asn Leu Val Leu Lys Ile Ile Glu Gln

            100                 105                 110

Leu Pro Ser Ala Lys Glu Ser Pro Asp Lys Phe Leu Glu Val Cys Thr

        115                 120                 125

Trp Val Asp Gln Ile Ala Ala Leu Asn Asp Ser Lys Thr Arg Lys Thr

    130                 135                 140

Thr Ser Glu Thr Val Arg Ala Val Leu Asp Ser Leu Ser Glu Lys Lys

145                 150                 155                 160

Lys Ser Ser Pro Ala Ala Asp

                165

<210>71

<211>22

<212>DNA

<213>人工序列

<220>

<223>I-CreI归巢位点

<400>71

caaaacgtcg tgagacagtt tg                  22

<210>72

<211>49

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸

<220>

<221>misc_feature

<222>(20)..(22)

<223>n为a,c,g,或t

<220>

<221>misc_feature

<222>(27)..(29)

<223>n为a,c,g,或t

<400>72

ggcatacaag tttcaaaacn nngtacnnng ttttgacaat cgtctgtca                 49

<210>73

<211>77

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸

<400>73

ggggacaagt ttgtacaaaa aagcaggctt cgaaggagat agaaccatgg  ccaataccaa    60

atataacaaa gagttcc                                                    77

<210>74

<211>64

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸

<400>74

ggggaccact ttgtacaaga aagctgggtt tagtcggccg ccggggagga tttcttcttc    60

tcgc                                                                 64

<210>75

<211>22

<212>DNA

<213>人工序列

<220>

<223>

寡核苷酸

<400>75

caaaactatg tagagggttt tg                                             22

<210>76

<211>24

<212>DNA    

<213>人工序列

<220>

<223>寡核苷酸

<400>76

tcaaaactat gtgaatagtt ttga                                           24

<210>77

<211>24

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸

<400>77

tcaaaaccct gtgaagggtt ttga                                           24

<210>78

<211>22

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸

<220>

<221>misc_feature

<222>(7)..(16)

<223>nis a,c,g,or t

<400>78

caaaacnnnn nnnnnngttt tg                           22

<210>79

<211>24

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸

<400>79

tcaaaacgtt gtacaacgtt ttga                         24

<210>80

<211>24

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸

<400>80

tcaaaacgtt gtacagggtt ttga                         24

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号