首页> 中国专利> 靶向参与脂肪酸生物合成的植物基因的工程改造锌指蛋白

靶向参与脂肪酸生物合成的植物基因的工程改造锌指蛋白

摘要

本发明涉及靶向植物中参与脂肪酸合成基因的工程改造的锌指蛋白。还提供使用所述锌指蛋白在调控基因表达、基因失活和靶基因修饰中的方法。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-02-02

    授权

    授权

  • 2015-02-11

    实质审查的生效 IPC(主分类):C07K14/415 申请日:20101022

    实质审查的生效

  • 2015-01-14

    公开

    公开

说明书

本申请是2012年6月21日提交的申请号为201080058755.7、名称为“靶向 参与脂肪酸生物合成的植物基因的工程改造锌指蛋白”的中国发明专利申请的分 案申请。

相关申请的交叉引用

本申请要求2010年10月22日提交的美国临时申请号61/279,528的优先权, 其内容通过引用整体纳入本文。

技术领域

本发明主要涉及植物基因组工程改造和蛋白表达领域。具体地,本发明涉及 工程改造的DNA结合结构域,例如靶向参与脂肪酸合成基因的锌指蛋白,以及 所述锌指蛋白在调控基因表达、基因失活和靶基因修饰中产生脂肪酸分布改变的 植物的方法。

背景技术

饮食中富含饱和脂肪酸会增加低密度脂蛋白(LDL),其进而引起血管上胆固 醇沉积,这时与动脉硬化和冠心病密切相关的前期病症(Conner等,Coronary Heart  Disease:Prevention,Complications,and Treatment,(冠心病:预防、并发症和治 疗)费城JBL公司(J.B.Lippincott,Philadelphia),1984第43-64页)。相反,已表明 饮食中富含单不饱和脂肪能减少心脏病。油酸是大多数可食用植物油中唯一的单 不饱和脂肪酸,能如亚油酸一样有效的降低LDL,但不影响高密度脂蛋白 (HDL)水平(Mensink等.(1989)New England J.Med.,321:436-441)。此外,饮 食中富含单不饱和脂肪还与收缩压降低有关(Williams等(1987)J.Am.Med. Assoc.,257:3251-3256,1987)。

鉴于脂肪酸在饮食和健康上的效果,已试图改变植物脂肪酸分布用于食用和 工业目的。然而,改变植物以改良脂肪酸分布的常规方法依赖突变生成(如化 学、放射等)和/或育种且非常耗时、耗力,并且不能特异靶向所选基因。参见例 如美国专利号5,861,187。

近期,已优选使用工程改造的DNA结合结构域如大范围核酸酶DNA-结合结 构域和锌指蛋白(ZFP)用于选择调控基因表达以及靶向改变植物基因序列(参见 例如,美国专利号7,262,054、7,235,354、7,220,719、7,001,768、和6,534,261;美 国专利公开号2008/0182332和美国系列号12/284,888)。锌指蛋白(ZFP)是以序 列特异方式凭借称为锌指的金属稳定结构域结合DNA、RNA和/或蛋白的蛋白。 参见例如Miller等(1985)EMBO J.4:1609-1614;Rhodes等(1993)Sci.Amer. 268(2):56-65;和Klug(1999)J.Mol.Biol.293:215-218。ZFP通常在转录因子中,且 目前已在数千种已知或推定的转录因子中鉴定到超过10000种锌指序列。

DNA结合结构域还可用于核酸酶结构域以制作工程改造的核酸酶。例如,可 改变寻靶内切核酸酶的DNA结合结构域以生成新的寻靶内切核酸酶。相似地, 锌指结构域已与核酸酶切割结构域关联以产生特异性靶向需要修饰(例如缺失、 突变、同源重组、或插入外源序列)的基因组区域双链断裂的锌指核酸酶 (ZFN)(参见例如,美国专利申请公开号2007/0134796;2005/0064474; 2008/0182332)。工程改造的ZFP极大的辅助了植物中特定靶位置插入外源序列 或修饰内源序列并提供了比常规方法更加有效的植物基因组的靶向改变(参见例 如,美国专利号7,262,054、7,235,354、7,220,719、7,001,768、和6,534,261)。

但是,仍需要靶向改变参与脂肪酸合成基因的组合物和方法以生产具有所选 脂肪酸的植物和植物产物(如植物油)。通过生产种子油中单独或总饱和脂肪水 平下降的植物品种,可生产含更少饱和脂肪的基于油的食物产品。这些产品通过 降低对动脉硬化和冠心病的可能性对公众健康有益。

发明内容

本发明提供完整植物或植物细胞中一种或多种参与脂肪酸生物合成的植物基 因的调控表达和靶向改变,从而改变完整植物或植物细胞的脂肪酸组合物。完整 植物或植物细胞可来自单子叶(单子叶植物)或双子叶(双子叶植物)植物物 种,在一些具体实施方式中包括产油植物,且还包括培养细胞、植物任何发育阶 段的细胞、和从完全植物中移出的植物细胞和会再生为植物的细胞(或其后 代)。植物细胞可含一种或多种同源或旁系同源基因序列,其任何数量或所有可 用本文所述方法靶向用于修饰。

在一个方面,本文描述DNA结合结构域(如锌指蛋白(ZFP)),其特异结 合参与植物脂肪酸生物合成途径的基因。在一些实施方式中,所述基因是欧洲油 菜(Brassica napus)基因。在一些具体实施方式中,所述欧洲油菜基因可编码乙 酰-CoA羧基酶、β-酮酰基-ACP合成酶(KAS,如KAS I–KAS IV)、脂肪酸硫酯酶 B(FATB,如FATB1-FATB5,或其他质体硫酯酶)、脂肪酸合成酶(FAS)、脂肪酸 延伸酶(FAE,如FAE1)、脂肪酸硫酯酶A(FatA)、脂肪酸去饱和酶(Fad2,Fad3)、 质体G-3-P脱氢酶(GPDH)、甘油激酶(GK)、硬脂酰-酰基载体蛋白去饱和酶(S- ACP-DES)、和油酰-ACP水解酶。在一些具体实施方式中,所述基因可为其他产 油植物物种中这些基因的直向同源物或同源物。

在另一方面,本文还提供含有任何DNA结合结构域(如ZFP)的融合蛋 白。在某些实施方式中,所述融合蛋白含锌指蛋白和转录调控结构域(如活化或 抑制结构域),还称为ZFP TF。在其他实施方式中,所述融合蛋白包括ZFP和 核酸酶结构域以形成锌指核酸酶(ZFN),其切割含靶基因的感兴趣基因组区 域。在某些实施方式中,ZFN包括融合多肽,所述多肽含对参与植物脂肪酸生物 合成途径的基因(例如编码ACC酶,KAS I,KAS II,KAS III,KAS IV,FATB1, FATB2,FATB3,FATB4,FATB5,FAS,FAE1,FatA,Fad2,Fad3,GPDH,GK,或S- ACP-DES的基因)特异的工程改造锌指结合结构域和切割结构域、和/或含工程改 造的锌指结合结构域和切割半结构域的一种或多种融合多肽。在某些实施方式 中,所述锌指结合结构域结合如表2或表10A所示的靶位置。在某些实施方式 中,所述锌指结合结构域包括选自下组的序列:含表1或表10B所示的识别结构 域(如单排)的锌指蛋白。切割结构域和切割半结构域可获自例如各种限制性内 切核酸酶和/或寻靶内切核酸酶。在一个实施方式中,所述切割半结构域衍生自 IIS型限制性内切核酸酶(例如Fok I)。

在其他方面,本文提供编码本文所述任何DNA结合结构域(例如锌指蛋白) 和/或融合蛋白的多核苷酸。在某些实施方式中,本文描述含操作性连接启动子的 编码本文所述一种或多种ZFP的多核苷酸的ZFP表达载体。在一个实施方式中, 一种或多种ZFP是ZFN。

ZFP和含这些ZFP的融合蛋白可在参与脂肪酸合成基因的编码区域或所述基 因内或邻近的非编码序列(如先导序列、拖尾序列或内含子)中或所述编码区域 的上游或下游的非转录区域中结合和/或切割所述基因。在某些实施方式中,所述 ZFP或ZFN结合和/或切割参与脂肪酸生物合成基因的编码序列或调控序列。

在另一方面中,本文描述含一种或多种本文所述蛋白、融合蛋白或多核苷酸 的组合物。植物细胞可含一种独特基因靶标或该基因的多种旁系同源拷贝。因 此,组合物可包括一种或多种含ZFP的蛋白(和编码其的多核苷酸),其靶向一 种或多种参与植物细胞脂肪酸合成的基因。所述ZFP可靶向植物细胞中所有旁系 同源或同源基因和所选的特定旁系同源或同源基因或其组合。

在另一方面,本文提供包括一种或多种本文所述蛋白或多核苷酸(例如ZFP 表达载体)的植物宿主细胞。对于多核苷酸,植物宿主细胞可用一种或多种ZFP 表达载体稳定转化或瞬时转染或其组合。在一个实施方式中,所述一种或多种 ZFP表达载体在植物宿主细胞中表达一种或多种ZFN。在另一实施方式中,所述 一种或多种ZFP表达载体在植物宿主细胞中表达一种或多种ZFP TF。

在另一方面,本文描述调控参与植物细胞脂肪酸生物合成的一种或多种基因 表达的方法,所述方法包括:(a)将一种或多种编码一种或多种ZFP TF的表达载 体在ZFP TF表达且所述一种或多种基因的表达被调控的条件下导入植物细胞, 所述ZFP TF结合参与脂肪酸生物合成的一种或多种基因中的靶位置。调控可为 活化或抑制。在某些实施方式中,至少一种靶位置在ACC酶、KAS I、KAS II、 KAS III、KAS IV、FATB1、FATB2、FATB3、FATB4、FATB5、FAS、FAE1、 FatA、Fad2、Fad3、GPDH、GK、和/或S-ACP-DES基因中。在一些实施方式 中,多于一种参与脂肪酸生物合成的基因被调控。在本文所述调控参与脂肪酸生 物合成的基因表达的任何方法中,所述方法产生脂肪酸成分改变的植物细胞,如 所述植物细胞中饱和脂肪的量下降。在一些实施方式中,植物细胞中脂肪酸成分 改变导致产生植物种子中脂肪酸成分改变,例如,植物种子中饱和脂肪的量下 降。在一些实施方式中,所述植物是产油植物,所述产油植物的种子中脂肪酸成 分改变(例如饱和脂肪减少)。在一些具体实施方式中,所述植物是欧洲油菜植 物,所述欧洲油菜植物的种子中脂肪酸成分改变(例如饱和脂肪减少)。

在另一方面,本文描述切割参与植物细胞脂肪酸生物合成的一种或多种基因 的方法,所述方法包括:(a)将一种或多种编码一种或多种核酸酶(如ZFN)的表 达载体在所述核酸酶(如ZFN)表达且所述一种或多种基因被切割的条件下导入 植物细胞,所述ZFN结合参与脂肪酸生物合成的一种或多种基因中的靶位置。在 某些实施方式中,至少一种靶位置在编码ACC酶、KAS I、KAS II、KAS III、 KAS IV、FATB1、FATB2、FATB3、FATB4、FATB5、FAS、FAE1、FatA、 Fad2、Fad3、GPDH、GK、和/或S-ACP-DES的基因中。在其他实施方式中,多 于一种参与脂肪酸生物合成的基因被切割。此外,在本文所述的任何方法中,一 种或多种基因的切割可在切割区域产生核苷酸的缺失、添加和/或取代。

在又一方面,本文描述将外源序列导入植物细胞基因组的方法,所述方法包 括以下步骤:(a)将所述细胞与外源序列(供体载体)接触;和(b)在细胞中表达 本文所述一种或多种核酸酶(例如锌指核酸酶),其中所述一种或多种核酸酶切 割染色体DNA;从而步骤(b)中对染色体DNA的切割刺激供体载体通过同源重组 整合到基因组中。在某些实施方式中,所述一种或多种核酸酶是IIs型限制性内切 核酸酶的切割结构域和工程改造的锌指结合结构域之间的融合。在其他实施方式 中,所述核酸酶包括寻靶内切核酸酶,例如含修饰的DNA结合结构域的寻靶内 切核酸酶。在本文所述的任何方法中,外源序列可编码蛋白产物。

在又一方面,本文提供按照本文所述任何方法获得的转基因或非转基因植物 细胞。

在另一方面,本文提供含有本文所获转基因或非转基因植物细胞的植物。

在另一方面,本文提供含有本文所获转基因或非转基因植物细胞的植物的种 子。

在另一方面,本文提供含有本文所获转基因或非转基因植物细胞的植物的种 子所提取的油。

附图简要说明

图1是油菜(欧洲油菜(B.napus))中脂肪酸生物合成途径的示意图。根据 纽约厄普顿John Shanklin,Brookhaven国家实验室(John Shanklin,Brookhaven  National Laboratory)(Thelen和Ohlrogge,2002,Metabolic engineering(《代谢工 程》)4:12-21)改编。

图2是各种示例性靶向KASII的ZFP TF靶位置在KASII基因中的定位的示 意图。编号表示ZFP的靶位置包含在表III所示的构建体中。ZFP设计列于表I和 II。

图3显示qRT-PCR所分析的KASII mRNA在转化有KASII-活化的ZFP TF构 建体4695的T0植物叶片中的表达的图表。27个对照植物的均值用于计算图中所 示的上调倍数。在某些事件中观察到多于3倍的KASII mRNA上调。

图4显示qRT-PCR检测的T1植物叶片中KASII-ZFP TF/微管表达率的图 表。三个事件与对应的空白作比较。

图5显示qRT-PCR所测定的三个事件中每个的含ZFP TF和分别的空白T1 植物中的KASII/微管mRNA表达率均值的图表。在这些T1植物叶片中观察到2- 3倍KASII mRNA上调。

图6A和6B是用JMP统计软件绘制的单向靶脂肪酸分析的图表,显示各事 件内ZFP TF阳性和同胞空白植物中总C16(6A)和总C16/总C18之比(6B)的一致 和显著(p=<0.001)下降。总C16由C16:0和C16:1成分组成且总C18由 C18:0、18:1、18:2和18:3成分组成。

图7显示AF318307和AF244520的序列比对。阴影表示精确同源的区域。

图8显示SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:46、SEQ ID NO:30、 AC189461、和BH723504的序列比对。扩增β-酮酰基-ACP合成酶II cDNA的正 向和反向引物序列(SEQ ID NO28和29)用相应序列上方的虚线突出显示。阴影 表示精确同源的区域。

图9显示FatB4和FatB5基因在欧洲油菜愈伤组织系中的表达,所述愈伤组 织系转基因有构建体pDAB4690–pDAB4692中存在的不同ZFP TF设计.分析17 个品系的对照和25个品系的各ZFP构建体。黑色柱=FatB4mRNA表达;灰色柱 =FatB5mRNA表达。

图10显示qRT-PCR分析的欧洲油菜T0转基因植物叶片中的FatB4和FatB5 表达。在转基因植物中测试三种含ZFP TF的构建体,pDAB4689–pDAB4691。 本实验分析的独立T0转基因植物的总数量是pDAB4689–pDAB4691、和 pDAB8210分别为40、62、41、和22。Nex710对照由10个植物组成。3ZFP TF 构建体中97%的转基因事件为ZFP TF表达阳性,如ZFP TF表达试验所测定(实 施例8.3)。天然微管mRNA表达用作标准化FatB基因表达的内参时获得相似的 结果。黑色柱=FatB4表达;灰色柱=FatB5表达。

图11是显示用T1植物分析时FatB基因和微管表达之间线性关系的图。黑色 方块=FatB4表达;灰色方块=FatB5表达。

图12显示ZFP TF构建体pDAB4691转基因的T1植物叶片中FatB4和FatB5 表达的qRT-PCR。黑色方块=FatB4表达;灰色方块=FatB5表达。

图13是用JMP统计软件对样品的C18:0成分的单向分析。

图14显示用JMP统计分析软件对样品的总C16/C18成分的单向分析。

图15显示用JMP统计软件所示的含4ZFP TF构建体事件的成熟种子的T1 FA分布分析。A和B图分别代表C18:0成分和C16:0/C18:0成分的样品(构建 体)的单向分析。

图16显示用JMP统计软件所示的含4ZFP TF构建体事件的成熟种子的T1 FA分布分析。A和B图分别代表C14:0成分和C16:1成分的样品(构建体)的单 向分析,突出显示构建体pDAS5227的差异特征。用JMP统计软件显示的含4 ZFP TF构建体事件的成熟种子的T1FA分布分析。A和B图分别代表C14:0成分 和C16:1成分的样品(构建体)的单向分析,突出显示构建体pDAS5227的差异 特征。

图17显示用pDAS5227ZFP TF构建体转化的T2未成熟种子中FatB5mRNA 下调。ZFP TF表达用ERF3表达代表(灰色柱)。从事件5227-12的4-空白、3杂 合体(5227_12ZF-1)和4纯合体(5227_12ZF-2)T1植物中分析25DAF未成熟种子。

图18显示用pDAS5212ZFP TF构建体转化的T2未成熟种子中FatB5mRNA 下调(黑色柱)。ZFP TFmRNA表达用KRAB1表达代表(灰色柱)。从事件5212- 4的5-空白、3杂合体和4纯合体植物中分析25DAF未成熟种子。

图19显示在ZFP TF事件5227-12的T2种子中用接合性单向分析总饱和脂肪 酸(饱和)。获自T1空、杂合体和纯合体亲本植物的T2种子分别用5227-12ZF 空、5227-12ZF(1)和5227-12ZF(2)标记。

图20显示在ZFP TF事件5212-4的T2种子中用接合性单向分析总饱和脂肪 酸(饱和)。获自T1空、杂合体和纯合体亲本植物的T2种子分别用5212-4ZF 空、5212-4ZF(1)和5212-4(2)标记。

发明详述

本文公开用于调控植物中一种或多种参与脂肪酸合成基因的表达和靶向切割 和改变的组合物和方法。所述基因的调节可例如通过用工程改造的ZFP转录因子 或修饰基因调控区域来调控。基因可被改变,例如通过靶向切割然后染色体内同 源重组或通过靶向切割然后与外源多核苷酸(包括与所述基因核苷酸序列同源的 一种或多种区域)和基因组序列的同源重组。

基因组序列包括染色体、附加体、细胞器(例如,线粒体、质体)基因组、人 工染色体和细胞中存在的任何其他类型核酸例如扩增序列、双微染色体和内源或 感染细菌和病毒的基因组中存在的那些。基因组序列可为正常(即野生型)或突 变的;突变序列可包括例如插入、缺失、移位、重排、和/或定点突变。基因组序 列还可包括许多不同等位基因之一。

本文公开的组合物包括含工程改造的锌指接合结构域的一种或多种ZFP、编 码这些多肽的多核苷酸以及ZFP和ZFP编码多核苷酸的组合。锌指结合结构域可 包括一种或多种锌指(例如2、3、4、5、6、7、8、9或更多锌指),且可被工程 改造以结合参与脂肪酸生物合成基因的任何基因组序列,包括操作性连接所述基 因的调节序列,

本文所述ZFP可通过活化或抑制基因转录用于调控基因表达。可构建包含调 控结构域连接锌指结构域的融合蛋白的ZFP,产生活化或抑制转录的嵌合转录因 子。ZFP还可通过连接锌指结构域和核酸酶切割结构域(或切割板结构域)产生 锌指核酸酶来用于靶向切割感兴趣的基因组区域。因此,通过鉴定感兴趣的靶向 基因组区域上何处需要基因调节、切割或重组,可按照本发明方法构建包含一种 或多种融合蛋白的锌指蛋白,所述融合蛋白包括连接工程改造以识别所述基因组 区域内基因序列的锌指结构域的一种或多种调节结构域和/或切割结构域(或切割 半结构域)。细胞中存在所述含融合蛋白的ZFP会使融合蛋白与其结合位置相结 合并在基因组区域内或附近改变调控或切割。此外,若基因组区域被切割且与该 基因组区域同源的外源多核苷酸也存在与细胞中,则所述基因组区域和所述外源 多核苷酸之间同源重组的发生率会很高。

如图1所示,脂肪酸生物合成有数种基因参与。因此,本文所述组合物可靶 向植物细胞中这些基因的一种或多种,包括但不限于ACC酶、KAS I、KAS II、 KAS III、KAS IV、FATB1、FATB2、FATB3、FATB4、FATB5、FAS、FAE1、 FatA、Fad2、Fad3、GPDH、GK、或S-ACP-DES基因和这些基因的直向同源 物、旁系同源物和同源物。例如,参与脂肪酸生物合成的1、2、3、4、5、或更 多种基因可被本文所述蛋白靶向(例如ZFP)。因此,具有不同特异性的一种或 多种ZFP或编码ZFP的表达载体可组合靶向植物中感兴趣的所需基因。

概述

除非另有说明,本方法的实施以及本文所述组合物的制备与应用采用本领域 技术范围内的分子生物学、生物化学、染色质结构与分析、计算化学、细胞培 养、重组DNA与相关领域的常规技术。这些技术在文献中已有充分描述。参见 例如,Sambrook等,MOLECULAR CLONING:A LABORATORY MANUAL (《分子克隆:实验室手册》)第2版,冷泉港实验室出版社(Cold Spring Harbor  Laboratory Press),1989以及第3版,2001;Ausubel等,CURRENT  PROTOCOLS IN MOLECULAR BIOLOGY(《新编分子生物学实验指南》),纽约 约翰韦利父子公司(John Wiley&Sons,New York)1987及定期更新;METHODS IN  ENZYMOLOGY(《酶学方法》)丛书,圣迭戈学术出版社(Academic Press,San  Diego);Wolffe,CHROMATIN STRUCTURE AND FUNCTION(《染色质结构与 功能》),第3版,学术出版社,圣迭戈,1998;METHODS IN ENZYMOLOGY (《酶学方法》),第304卷,“Chromatin(染色质)”(P.M.Wassarman和A.P. Wolffe编),学术出版社,圣迭戈,1999;和METHODS IN MOLECULAR  BIOLOGY(《分子生物学方法》),第119卷,“Chromatin Protocols(染色质方法)” (P.B.Becker编),托托瓦的休玛纳出版社(Humana Press,Totowa),1999。

定义

术语"核酸","多核苷酸"和"寡核苷酸"互换使用并指脱氧核糖核苷酸或核糖核 甘酸聚合物,可以是直链或环状构型的,是单链或双链形式的。就本公开的目的 而言,这些术语不构成对聚合物长度的限制。这些术语可涵盖天然核苷酸的已知 类似物以及在碱基、糖和/或磷酸部分经过修饰的核苷酸(例如,硫代磷酸主链)。 通常,特定核苷酸的类似物具有相同的碱基配对特异性;即,A的类似物与T碱 基配对。

互换使用的术语“多肽”、“肽”和“蛋白质”指氨基酸残基的聚合物。该术语也 适用于其中一个或多个氨基酸是相应的天然存在氨基酸的化学类似物或修饰衍生 物的氨基酸聚合物。

"结合"指大分子之间(例如蛋白与核酸之间)的序列特异性、非共价相互作用。 只要相互作用作为整体为序列特异性,不要求结合相互作用的所有组分都是序列 特异性(例如,与DNA主链中的磷酸残基接触)。这样的相互作用通常表征为解离 常数(Kd)是10-6M-1或更低。“亲合力”指结合的强度:提高的结合亲合力与较低的 Kd关联。

"结合蛋白"是能与另一分子非共价结合的蛋白质。例如,结合蛋白能结合 DNA分子(DNA-结合蛋白),RNA分子(RNA-结合蛋白)和/或蛋白分子(蛋白-结合 蛋白)。在蛋白-结合蛋白的情况中,其可与自身结合(形成同型二聚体、同型三聚 体等)和/或其可与一种或多种不同蛋白的一个或多个分子结合。结合蛋白可具有 超过一种结合活性。例如,锌指蛋白具有DNA结合,RNA结合和蛋白结合活 性。

"锌指DNA结合蛋白"(或结合结构域)是能以序列特异性方式通过一个或多个 锌指结合DNA的蛋白质或较大蛋白质内的结构域,锌指是通过锌离子配位稳定 其结构的结合结构域内氨基酸序列的区域。术语锌指DNA结合蛋白常简称为锌 指蛋白或ZFP。

锌指结合结构域可被“工程改造”以结合预定的核苷酸序列(例如任何参与 脂肪酸生物合成的基因中的靶序列)。工程改造锌指蛋白的方法的非限制性示例 是设计和选择。设计的锌指蛋白是其设计/组成主要由合理基准所得的非天然存在 的蛋白。用于设计的合理基准包括取代法则和计算机化算法的应用,计算机化算 法用于加工储存已有ZFP设计与结合数据的数据库内的信息。参见例如,美国专 利号6,140,081、6,453,242、6,534,261和6,785,613;也参见WO98/53058、WO 98/53059、WO98/53060、WO02/016536和WO03/016496;和美国专利 6,746,838、6,866,997和7,030,215。因此,“工程改造”的锌指蛋白或“非天然产 生”的锌指蛋白是其中一种或多种组分锌指DNA结合结构域(识别螺旋)不是 天然产生且被工程改造为结合预选的靶位置。

"选定的"锌指蛋白是其生成主要由经验方法如噬菌体展示、相互作用陷阱或 杂交体选择产生的天然情况下未发现的蛋白质。参见例如5,789,538;US5,925,523; US6,007,988;US6,013,453;US6,200,759;US6,733,970;US RE39,229;和 WO95/19431;WO96/06166;WO98/53057;WO98/54311;WO00/27878; WO01/60970WO01/88197和WO02/099084。

术语"序列"指任意长度的核苷酸序列,可以是DNA或RNA;可以是直链、 环状或支链且可以是单链或双链。术语"供体序列"指插入基因组的核苷酸序列。 供体序列可以是任意长度,例如长度为2-25,000个核苷酸(或其间或其上的任意整 数值),优选长度为100-5,000个核苷酸(或其间的任意整数),更优选长度为200- 2,500个核苷酸。

"同源序列"指与第二序列共有一定程度序列相同性的第一序列,且其序列可 与第二序列的序列相同。"同源,非相同序列"指与第二序列共有一定程度序列相 同性的第一序列,但其序列与第二序列的序列并不相同。例如,含有突变基因的 野生型序列的多核苷酸与所述突变基因的序列同源且非相同。在某些实施方式 中,两个序列间的同源度足以允许利用正常的细胞机制在它们之间进行同源重 组。两个同源非相同序列可以是任意长度,且其非同源的程度可低至单个核苷酸 (例如,用于通过靶向同源重组校正基因组点突变)或高达10kb或更高(例如,用 于将基因插入染色体中预定的位点)。不要求包含同源非相同序列的两个多核苷酸 为相同长度。例如,可使用20-10,000个核苷酸或核苷酸对的外源多核苷酸(即, 供体多核苷酸)。

本领域已知确定核酸和氨基酸序列相同性的技术。通常,此类技术包括确定 某基因mRNA的核苷酸序列和/或确定由其编码的氨基酸序列,并将这些序列与 第二核苷酸或氨基酸序列比较。也可以此方式确定并比较基因组序列。相同性通 常分别指两条多核苷酸或多肽序列的核苷酸与核苷酸或氨基酸与氨基酸的确切对 应性。可通过测定两条或多条序列(多核苷酸或氨基酸)的相同性百分数来比较这 些序列。无论是核酸还是氨基酸序列,两条序列的相同性百分数是两条比对序列 之间的确切匹配数目除以较短序列的长度并将结果乘以100。核酸序列的近似比 对用Smith和Waterman,Advances in Applied Mathematics(《应用数学发展》)2:482-489(1981)的局部同源算法提供。所述算法可通过使用Dayhoff开发(Atlas  of Protein Sequences and Structure(《蛋白序列和结构图谱》),M.O.Dayhoff编, 5增刊3:353-358,国家生物医学研究基金,美国华盛顿特区)和Gribskov归一化 (Nucl.Acids Res.14(6):6745-6763(1986))的评分矩阵应用于氨基酸序列。测定序 列相同百分比的本算法的示例性实践由遗传计算机公司(Genetics Computer  Group)(威斯康星州麦迪逊)在“BestFit”应用中提供。该方法的默认参数描述于 Wisconsin Sequence Analysis Package Program Manual(威斯康星序列分析软件包 手册),第8版(1995)(获自遗传计算机公司,威斯康星州麦迪逊)。本发明内容中 建立相同性百分比的优选方法是使用John F.Collins和Shane S.Sturrok开发,爱丁 堡大学版权所有,并获自智慧遗传公司(IntelliGenetics,Inc.)(加州芒廷维尤) 的MPSRCH程序包。这套程序包可使用Smith-Waterman算法,其中评分表使用 默认参数(例如,空位开放罚12分、空位延伸罚1分、一个空位罚6分)。产生“匹 配”值的数据反映了序列相同性。计算序列之间相同性或类似性百分比的其它合适 程序一般是本领域已知的,例如另一比对程序是BLAST,使用默认参数。例如, BLASTN和BLASTP可以使用以下默认参数:遗传密码=标准;过滤器=无;链= 两条;阈值=60;预期值=10;矩阵=BLOSUM62;描述=50条序列;分类标准=高 评分;数据库=非冗余,GenBank+EMBL+DDBJ+PDB+GenBank CDS翻译+ Swiss蛋白+Spupdate+PIR。这些程序的细节可在互联网上找到。考虑本文所述 的序列,需要的序列相同性范围约为35%-100%和其中任何整数值。通常序列之 间的相同性百分比至少为35%-40%;40%-45%;45%-50%;50%-60%;60%-70%;70- 75%,优选80-82%,更优选85-90%,更优选92%,更优选95%,最优选98%序列相 同性。

或者,多核苷酸之间序列相似性的程度可以通过多核苷酸在允许同源区域间 形成稳定双链体的条件下杂交,然后用单链特异性核酸酶消化并确定消化后片段 的大小来测定。当按上述方法测定得到两条核酸或两个多核苷酸序列在所述分子 的限定长度上显示至少约70%-75%,优选80%-82%,更优选85%-90%,更优选 92%,更优选95%,且最优选98%的序列相同性时,所述序列彼此间基本同源。 如本文所用,基本同源也指序列与特定的DNA或多肽序列显示完全的相同性。 基本同源的DNA序列可在Southern杂交实验中鉴定,例如,以在对特定系统限 定的严谨条件下。本领域技术人员能确定适当的杂交条件。参见例如,Sambrook 等,同上;Nucleic Acid Hybridization:A Practical Approach(《核酸杂交,实践方法》),B.D.Hames和S.J.Higgins编,(1985)牛津(Oxford);华盛顿特区;IRL出 版社)。

可以如下测定两个核酸片段的选择性杂交。两个核酸分子之间的序列同一性 程度影响这两个分子之间杂交事件的效率和强度。部分相同的核酸序列将至少部 分抑制与靶分子完全相同的序列的杂交。可使用本领域公知的杂交分析(例如, Southern(DNA)印迹,Northern(RNA)印迹,溶液杂交,等等,参见Sambrook 等,Molecular Cloning:A Laboratory Manual,《分子克隆实验室手册》第二版, (1989)纽约冷泉港)测定完全相同序列的杂交抑制。可使用不同程度的选择性, 例如,使用从低到高严谨的不同条件,进行这种分析。如果应用低严谨条件,可 使用缺乏甚至部分程度序列同一性的第二探针(例如,与靶分子具有小于大约 30%序列同一性的探针)评价不存在非特异性结合,在不存在非特异性结合事件 时,第二探针不会与靶标杂交。

应用基于杂交的检测系统时,选择与参考核酸序列互补的核酸探针,然后通 过选择合适条件,所述探针和所述参考序列彼此选择性杂交或结合以形成双链分 子。能在适当严谨杂交条件下选择性杂交参考序列的核酸分子通常在能检测长度 至少约10-14核苷酸的靶核酸序列的条件下杂交,所述靶核酸序列与所选的核酸 探针具有至少约70%的序列相同性。严谨杂交条件通常能检测长度至少约10-14 核苷酸的靶核酸序列,所述靶核酸序列与所选的核酸探针具有大于约90-95%的序 列相同性。用于探针/参考序列杂交的杂交条件可如本领域已知方法确定,其中所 述探针和参考序列具有特定程度的序列相同性(参见例如,Nucleic Acid  Hybridization:A Practical Approach(《核酸杂交:实践方法》),B.D.Hames和S.J. Higgins编,(1985)牛津;华盛顿特区;IRL出版)。

杂交条件是本领域技术人员公知的。杂交严谨性指不利于包含错配核苷酸的 杂交体形成的杂交条件的程度,同时较高严谨性与错配杂交体的较低耐受性相 关。影响杂交严谨性的因素是本领域技术人员公知的,其包括但不限于温度、 pH、离子强度和有机溶剂如例如甲酰胺和二甲亚砜的浓度。如本领域技术人员已 知的,杂交严谨性随温度升高、离子强度降低和溶剂浓度降低而增加。

关于杂交的严谨性条件,本领域公知的许多等价条件可以用于通过改变例如 下列因素来建立特定严谨性:序列的长度和特性、不同序列的碱基组成、盐和其 他杂交液组分的浓度、杂交液中存在或不存在封闭剂(例如,硫酸葡聚糖和聚乙 二醇)、杂交反应温度和时间参数、以及改变洗涤条件。根据本领域的标准方法 选择一组特定的杂交条件(参见,例如,Sambrook,等,Molecular Cloning:A  Laboratory Manual(《分子克隆:实验室手册》),第二版,(1989)纽约冷泉 港)。

"重组"指两个多核苷酸之间交换遗传信息的过程。就本公开的目的而言,"同 源重组(HR)"指发生这种交换的特定形式,例如在修复细胞内双链断裂期间发生。 该过程要求核苷酸序列同源性,利用"供体"分子模板修复"靶"分子(即,经历双链 断裂的分子),该过程也称作"非交叉基因转化"或"短道基因转化",因为其导致遗 传信息从供体向靶转移。不希望受限于任何特定理论,这种转移可以涉及断裂的 靶与供体间形成的异双链体DNA的错配校正,和/或采用供体再合成将成为部分 靶的遗传信息的"合成依赖性链退火",和/或相关过程。这些特定HR通常导致靶 分子的序列改变使得供体多核苷酸的部分或全部序列被纳入靶多核苷酸。

"切割"指DNA分子共价主链的断裂。切割可以由多种方法启动,包括但不限 于磷酸二酯键的酶促或化学水解。单链切割和双链切割都可行,且双链切割可以 是两次不同的单链切割事件的结果。DNA切割可导致产生钝端或交错末端。在某 些实施方式中,将融合多肽用于靶向双链DNA切割。

“切割结构域”包括一种或多种多肽序列,其具有DNA切割的催化活性。 切割结构域可包含在单一多肽链中或切割活性可由两种(或更多)多肽的联合产 生。

"切割半结构域"是能与第二多肽(两者相同或不同)形成具有切割活性(优选双 链切割活性)的复合物的多肽序列。

"染色质"是包含细胞基因组的核蛋白结构。细胞染色质包含核酸和蛋白,核 酸主要为DNA,蛋白包括组蛋白和非组蛋白染色体蛋白。真核细胞染色质主要以 核小体形式存在,其中核小体核心包含约150碱基对的DNA与八聚体关联,所 述八聚体包含组蛋白H2A、H2B、H3和H4各两份;以及在核小体核心之间延伸 的接头DNA(长度根据生物体而各有不同)。组蛋白H1分子通常与接头DNA关 联。就本公开的目的而言,术语“染色质”意在涵盖所有类型的细胞核蛋白,包括 原核与真核的。细胞染色质包括染色体和附加体的染色质。

"染色体"是包含细胞的全部或部分基因组的染色质复合体。细胞的基因组通 常以其核型为特征,核型是包含细胞基因组的全部染色体的集合。细胞的基因组 可包含一个或多个染色体。

"附加体"是复制的核酸、核蛋白复合体或其它包含并非细胞染色体核型部分 的核酸的结构。附加体的示例包括质粒和某些病毒基因组。

“可进入区”是细胞染色质中的位置,这里核酸中存在的靶位置可被识别所述 靶位置的外源分子结合。不希望受任何具体理论的限制,认为可进入区是不包装 在核小体结构中的区域。可进入区的不同结构常可通过其对化学和酶性探针如核 酸酶的敏感度来检测。

"靶位点"或"靶序列"是限定结合分子将结合的核酸部分的核酸序列,前提是 存在结合的充分条件。例如,序列5’-GAATTC-3’是Eco RI限制性内切核酸酶的 靶位点。

"外源"分子是通常不存在于细胞内的分子,但可通过一种或多种遗传、生化 或其它方法引入细胞。“通常存在于细胞内”是针对细胞的具体发育阶段和环境条 件而定。因此,例如,仅在肌肉的胚胎发育期间存在的分子对于成体肌肉细胞是 外源分子。类似地,通过热激诱导的分子对于未热激细胞是外源分子。例如,外 源分子可包含功能失常的内源分子的功能性形式或者正常功能的内源分子的功能 失常形式。

外源分子可以是小分子或大分子等,小分子如由组合化学方法所产生,大分 子如蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、上述分子的任 何经修饰衍生物,或者是包含一种或多种上述分子的任何复合物。核酸包括DNA 和RNA,可以是单链或双链,可以是直链、支链或环状;且可以是任意长度。核 酸包括那些能形成双链体以及形成三链体的核酸。参见例如,美国专利号 5,176,996和5,422,251。蛋白质包括但不限于DNA结合蛋白、转录因子、染色质 重塑因子、甲基化DNA结合蛋白、聚合酶、甲基化酶、去甲基化酶、乙酰基转 移酶、脱乙酰基酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、促 旋酶和解旋酶。

外源分子可以是与内源分子同一类型的分子,例如外源蛋白或核酸。例如, 外源核酸可包含感染性病毒基因组、根癌农杆菌(Agrobacterium tumefaciens)T 链、引入细胞内的质粒或附加体,或包含通常不存在于细胞内的染色体。本领域 技术人员已知将外源分子引入细胞内的方法,包括但不限于脂质介导的转移(即脂 质体,包括中性和阳离子脂质)、电转导、直接注射、细胞融合、粒子轰击、磷酸 钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的转移。外源分子可为非植 物分子例如哺乳动物(如人或人源化)抗体。

相反,"内源"分子是通常存在于特定环境条件下特定发育阶段的特定细胞中 的分子。例如,内源核酸可包含染色体,线粒体、叶绿体或其它细胞器的基因 组,或天然产生的附加体核酸。其它内源分子可包括蛋白质,例如转录因子和 酶。

"融合"分子是其中两个或多个亚单元分子相连(优选共价相连)的分子。所述亚 单元分子可以是同一化学类型的分子,或可以是不同化学类型的分子。第一类融 合分子的示例包括但不限于融合蛋白(例如,含ZFP DNA结合域与切割结构域之 间的融合体的ZFN)和融合核酸(例如,编码前述融合蛋白的核酸)。第二类融合分 子的示例包括但不限于:形成三链体的核酸与多肽之间的融合体,以及小沟结合 子与核酸之间的融合体。

细胞内融合蛋白的表达可由融合蛋白递送入细胞造成或通过向细胞递送编码 融合蛋白的多核苷酸而引起,其中所述多核苷酸被转录,转录本经翻译产生所述 融合蛋白。细胞内蛋白的表达中也可包括反式剪接、多肽切割和多肽连接。向细 胞递送多核苷酸和多肽的方法在本公开中另有描述。

就本公开的目的而言,"基因"包括编码基因产物(见前文)的DNA区域,以及 调节基因产物生成的DNA区域,不论这类调节序列是否毗邻编码和/或转录序 列。因此,基因包括但未必限于:启动子序列,终止子,翻译调节序列如核糖体 结合位点和内部核糖体进入位点、增强子、沉默子、隔离子、边界元件、复制起 点、基质附着位点和基因座控制区。

"基因表达"指基因所含信息转化成基因产物。基因产物可以是基因的直接转 录产物(例如,mRNA、tRNA、rRNA、反义RNA、核酶、shRNA、微小RNA、结 构RNA、或任何其它类型的RNA)或由mRNA翻译产生的蛋白。基因产物还包括 经过修饰的RNA和经过修饰的蛋白,RNA修饰过程如加帽、聚腺苷酸化、甲基 化和编辑,蛋白修饰过程如甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、 十四烷基化和糖基化。

基因表达的"调节"指基因活性的改变。表达的调节可包括但不限于基因激活 和基因阻遏。

"植物"细胞包括但不限于单子叶的(单子叶植物)或双子叶的(双子叶植物)植 物。单子叶植物的非限制性示例包括谷类植物如玉米、大米、大麦、燕麦、小 麦、高粱、黑麦、甘蔗、菠萝、洋葱、香蕉和椰子。双子叶植物的非限制性示例 包括烟草、番茄、向日葵、棉花、制糖甜菜、马铃薯、莴苣、瓜、大豆、油菜(菜 籽)和苜蓿。植物细胞可以来自植物的任意部位和/或来自植物发育的任意阶段。 因此,植物细胞可为植物种子的细胞。在一些实施方式中,所述植物或植物细胞 为或衍生自涉及食用和/或工业用植物油生产的植物(即“产油植物”)。示例性 的产油植物包括但不限于,芸苔属物种(Brassica sp.)(例如欧洲油菜包括油菜 栽培品种)、玉米、大豆、海甘蓝、芥菜、蓖麻、花生、芝麻、棉花、亚麻子、 红花、油棕、亚麻、向日葵和椰子。

"感兴趣区域"是需要结合外源分子的细胞染色质的任意区域,例如,基因或 者基因内或与之毗邻的非编码序列。结合可以是用于靶向DNA切割和/或靶向重 组的目的。例如,感兴趣区域可存在于染色体、附加体、细胞器(例如,线粒体、 叶绿体)基因组或感染性病毒基因组。感兴趣区域可以在基因的编码区内,在转录 的非编码区如前导序列、尾随序列或内含子内,或在编码区上游或下游的非转录 区内。感兴趣区域可以小到单个核苷酸对或大到长25,000个核苷酸对,或任意整 数值的核苷酸对。

涉及两个或多个组件(例如序列元件)的并置,所述组件设置成组件都可正常 发挥作用并允许组件中至少一种能介导施加于至少一种其它组件上的作用时,术 语"操作性连接"和"操作性相连"互换使用。例如,若转录调节序列控制编码序列 响应一种或多种转录调节因子存在或缺失时的转录水平,则所述转录调节序列如 启动子与所述编码序列操作性连接。转录调节序列通常与编码序列顺式操作性连 接,但不需要与其直接毗邻。例如,尽管并非毗连,但增强子仍是与编码序列操 作性连接的转录调节序列。

对于融合多肽,术语"操作性连接"可指各组件在与其它组件的连接中所发挥 的功能与其在未连接时的功能相同。例如,对于ZFP DNA结合域与调节结构域 融合的融合多肽,若在融合多肽中ZFP DNA结合域部分能结合其靶位点和/或其 结合位点,而调节结构域能调节靶位点附近的DNA表达,则ZFP DNA结合域与 调节结构域操作性连接。

蛋白、多肽或核酸的"功能性片段"是序列与全长蛋白、多肽或核酸不相同但 保留全长蛋白、多肽或核酸的相同功能的蛋白、多肽或核酸。功能片段可具有比 相应的天然分子更多、更少或相同数量的残基,和/或可含有1个或多个氨基酸或 核苷酸取代。本领域熟知测定核酸功能(例如,编码功能、与另一核酸杂交的能力) 的方法。类似地,也熟知测定蛋白质功能的方法。例如,可测定多肽的DNA结 合功能,例如通过滤膜结合、电泳迁移率改变或免疫沉淀试验。DNA切割可通过 凝胶电泳分析。参见Ausubel等,同上。可测定蛋白与另一蛋白相互作用的能 力,例如,通过共免疫沉淀、双杂交试验或互补分析,既可以是遗传的也可以是 生化的。参见例如,Fields等,(1989)Nature340:245-246;美国专利号5,585,245 和PCT WO98/44350。

如本文所用,“饱和脂肪酸”包括但不限于月桂酸(C12:0)、肉豆蔻酸 (C14:0)、棕榈酸(C16:0)和硬脂酸(C18:0)。相似地,“单不饱和脂肪酸”和“多 不饱和脂肪酸”包括但不限于C18脂肪酸如油酸(C18:1)、还原亚油酸(C18:2)和 还原亚麻酸(C18:3)。

靶位置

公开的方法和组合物包括含DNA结合结构域(例如ZFP)和调节结构域或切 割(核酸酶)结构域(或切割半结构域)的融合蛋白,其中所述DNA结合结构域 (例如锌指结构域)通过结合细胞内染色质上参与脂肪酸合成的基因中的序列, 将转录调节结构域或切割结构域(或切割半结构域)的活性指向所述序列附近, 从而调控转录或诱导所述靶序列附近的切割。

如本发明另述,锌指结构域可工程改造以实质结合任何想要的序列。因此, 鉴定含需要基因调控、切割或重组的位置序列的感兴趣区域后,一种或多种锌指 结合结构域可工程改造以结合感兴趣区域的一种或多种序列。

细胞染色质中感兴趣的基因组区域中参与脂肪酸生物合成的任何基因的用于 被锌指结构域(例如靶位置)结合的靶位置的选择可例如按照共同拥有的美国专 利号6,453,242(2002年9月17日)所公开的方法实现,所述专利还公开了设计结 合所选序列的ZFP的方法。本领域计数人员清楚核苷酸序列的简单视觉检查也可 用于靶位置选择。因此,要求保护的方法可适用任何靶位置选择手段。

在某些实施方式中,本文所述ZFP结合编码ACC酶、KAS I、KAS II、KAS  III、KAS IV、FATB1、FATB2、FATB3、FATB4、FATB5、FAS、FAE1、 FatA、Fad2、Fad3、GPDH、GK、和/或S-ACP-DES的基因中的靶位置。

靶位置通常由多种邻近亚靶位置组成。亚靶位置表示结合单独锌指的序列 (通常为核苷酸三体、或与邻近四体有1核苷酸重叠的核苷酸四体)。参见例如, WO02/077227。若锌指蛋白接触最多的链称为靶向链“主要识别链”或“主要接 触链”,则一些锌指蛋白结合靶向链中的三碱基三体和非靶向链上的第四碱基。 靶位置长度通常至少为9个核苷酸,因此被含至少3个锌指的锌指结合结构域结 合。然而也可能有例如4指结合结构域与12核苷酸靶位、5指结合结构域与15 核苷酸靶位或6指结合结构域与18核苷酸靶位的结合。显而易见,也可能有更大 的结合结构域(如7-、8-、9-指或更多)与更长的靶位的结合。

靶位置不一定要为多种三核苷酸。例如,在发生交联链相互作用的情况中(参 见例如,美国专利6,453,242和WO02/077227),多指结合结构域的一种或多种单 独锌指可结合重叠的四体亚位置。因此,三指蛋白可结合10核苷酸序列,其中第 10核苷酸是被末端指结合的四体的部分,4指蛋白可结合13核苷酸序列,其中第 13核苷酸是被末端指结合的四体的部分等。

多指结合结构域中单独锌指之间的氨基酸接头序列的长度和特性了影响对靶 序列的结合。例如,多指结合结构域中邻近锌指之间所谓“非经典接头”、“长 接头”或“结构接头”的存在可使这些指结合非紧密邻近的亚位置。所述接头的 非限制性示例描述于例如美国专利号6,479,626和WO01/53480。因此,锌指结合 结构域的靶位置中的一种或多种亚位置可彼此被1、2、3、4、5、或更多核苷酸 分隔。为了提供一种示例,4指结合结构域可结合13核苷酸靶位置,其在序列上 包括2个毗邻的3核苷酸亚位置、插入核苷酸、和2个毗邻的3体亚位置。参见 美国申请号61/130,099中连接的人工核酸酶结合以用不同数量核苷酸分隔的靶位 置的组合物和方法。序列(如靶位置)之间的距离表示插入两序列之间的核苷酸 或核苷酸对的数量,从彼此最接近的序列边缘测量。

在某些实施方式中,设计具有转录因子功能的ZFP。对于转录因子功能,与 其启动子简单结合和足够接近是通常需要的所有功能。关于启动子的精确位置、 方向和限度内的距离不是特别重要。所述特征使用于构建人工转录因子的所选靶 位置具有相当的灵活性。因此ZFP识别的靶位置可为所述靶基因中操作性连接调 节结构域的任何合适位置,所述位置能使ZFP活化或抑制基因表达。优选的靶位 置包括邻近转录起始位置、位于转录起始位点下游或上游的区域。此外,靶位置 位于增强子区域、抑制子位置、RNA聚合酶停止位置、和特异调节位置(例如SP- 1位置、缺氧反应元件、核酸受体识别元件、p53结合位置)、cDNA编码区域中 或表达序列标签(EST)编码区域中的位置。

在其他实施方式中,设计具有核酸酶活性的ZFP。细胞中含融合蛋白的ZFN 的表达影响所述靶序列附近的切割,所述融合蛋白包括锌指结合结构域和切割结 构域(或两种融合蛋白,各包括锌指结合结构域和切割半结构域)。在某些实施 方式中,切割取决于两种锌指结构域/切割半结构域融合分子与分别的靶位置的结 合。两种靶位置可在相对的DNA链上,或者两种靶位置可都在相同DNA链上。

DNA结合结构域

本发明实践可用任何DNA结合结构域。在某些实施方式中,所述DNA结合 结构域包括一种或多种锌指的锌指结合结构域(Miller等(1985)EMBO J.4:1609- 1614;Rhodes(1993)Scientific American Feb.:56-65;美国专利号6,453,242)。通常, 单一锌指结构域约为30氨基酸长。结构研究表明各锌指结构域(基序)含有两个 β片层(保持在β转角中,其含有两个恒定半胱氨酸残基)和α螺旋(含两个恒定组 氨酸残基),其通过所述两个半胱氨酸和所述两个组氨酸对锌原子的配位而保持在 特定构型中。

锌指包括经典的C2H2锌指(即,其中锌离子由2个半胱氨酸和2个组氨酸残 基配位)和非经典锌指,例如,C3H和C2HC锌指(其中锌离子由3个半胱氨酸和1 个组氨酸残基配位,参见例如美国专利公开号2008/0182332)和C4锌指(其中锌离 子由4个半胱氨酸残基配位)。参见例如WO02/057293。

锌指结合域可经工程改造以结合所选序列。参见例如,Beerli等(2002)Nature  Biotechnol.20:135-141;Pabo等(2001)Ann.Rev.Biochem.70:313-340;Isalan等 (2001)Nature Biotechnol.19:656-660;Segal等(2001)Curr.Opin.Biotechnol. 12:632-637;Choo等(2000)Curr.Opin.Struct.Biol.10:411-416。与天然存在的锌 指蛋白相比,经工程改造(或非天然存在)的锌指结合域可具有新的结合特异 性。工程改造方法包括但不限于合理设计与多种选择。例如,合理设计包括利用 包含三体(或四体)核苷酸序列和单独锌指氨基酸序列的数据库,其中各三体或四 体核苷酸序列与一种或多种结合该特定三体或四体序列的锌指氨基酸序列相关 联。参见,例如美国专利6,453,242和6,534,261。其他设计方法描述于例如美国 专利6,746,838、6,785,613、6,866,997和7,030,215。

示例性选择方法包括噬菌体展示和双杂交系统,公开于美国专利5,789,538、 5,925,523、6,007,988、6,013,453、6,410,248、6,140,466、6,200,759和6,242,568; 以及WO98/37186、WO98/53057、WO00/27878、WO01/88197和GB 2,338,237。

增强锌指结合域结合特异性的描述参见如共同拥有的美国专利号6,794,136。

由于单独锌指结合三核苷酸(即三体)序列(或与邻近锌指的4核苷酸结合 位置有1个核苷酸重叠的4核苷酸序列),工程改造的锌指结合结构域结合的序 列(如靶序列)的长度决定工程改造的锌指结合结构域中的锌指数量。例如,对 于锌指基序不结合重叠亚位置的ZFP,6核苷酸靶位序列被2指结合结构域结 合,9核苷酸靶位序列被3指结合结构域结合等。如本文所示,靶位置中单独锌 指的结合位置(即亚位置)不需要毗邻,但可被一种或多种核苷酸分离,取决于 多指结合结构域中锌指之间序列(即指内接头)的氨基酸的长度和特征。

在多指锌指结合结构域中,邻近锌指可被约5个氨基酸的氨基酸接头序列 (所谓“经典”指内接头)或者被一种或多种非经典接头分隔。参见例如,共同 拥有的美国专利号6,453,242和6,534,261。对于包括多于三指的工程改造的锌指 结合结构域,某些锌指之间优选插入更长的(“非经典”)指间接头,因为其可 增加所述结合结构域的结合亲合力和/或特异性。参见例如,美国专利号6,479,626 和WO01/53480。因此,多指锌指结合结构域还可根据非经典指间接头的存在和 位置表征。例如,包括三指(2经典指间接头连接)、长接头和额外3指(由2 经典指间接头连接)的6指锌指结合结构域表示2x3的构型。相似地,包括2指 (其中有经典接头)、长接头和额外2指(由经典接头连接)的结合结构域表示 2x2蛋白。包括3个2指单元(各2指由经典指间接头连接),且其中各2指单 元与邻近2指单元通过长接头相连的蛋白称为3x2蛋白。

多指结合结构域内两种邻近锌指指间长或非经典指间接头的存在常使所述2 指结合靶序列中不紧密接近的亚位置。因此,靶位置中的亚位置中可有一个或多 个核苷酸的间隙,即靶位置可包括一个或多个不接触锌指的核苷酸。例如,2x2 锌指结合结构域可结合2个被一个核苷酸分隔的6核苷酸序列,即其结合13核苷 酸靶位置。还可参见Moore等(2001a)Proc.Natl.Acad.Sci.USA98:1432-1436; Moore等(2001b)Proc.Natl.Acad.Sci.USA98:1437-1441和WO01/53480。

如前所述,亚靶位置是被单一锌指结合的3或4核苷酸序列。为了某些目 的,2指单元表示结合模块。结合模块可由例如在结合特定6核苷酸靶序列的多 指蛋白(通常为3指)环境中选择2个邻近指来获得。或者,可通过装配单独锌 指来构建所述模块。参见WO98/53057和WO01/53480。

在一个实施方式中,本文描述包括表1所示氨基酸序列的锌指结合结构域。 在另一实施方式中,本发明提供编码锌指结合结构域的多核苷酸,其中所述锌指 结合结构域包括表1所示的氨基酸序列。

或者,所述DNA结合结构域可衍生自核酸酶。例如,已知寻靶内切核酸酶 和大范围核酸酶的识别序列如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I- CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。还可 参见美国专利第5,420,032号;美国专利第6,833,252号;Belfort等(1997)Nucleic  Acids Res.25:3379–3388;Dujon等(1989)Gene82:115–118;Perler等(1994) Nucleic Acids Res.22,1125–1127;Jasin(1996)Trends Genet.12:224–228;Gimble 等(1996)J.Mol.Biol.263:163–180;Argast等(1998)J.Mol.Biol.280:345–353和 NEB公司(New England Biolabs)产品目录。此外,寻靶内切核酸酶和大范围核酸 酶的DNA结合特异性可被工程改造以结合非天然靶位置。参见例如,Chevalier等 (2002)Molec.Cell10:895-905;Epinat等(2003)Nucleic Acids Res.31:2952-2962; Ashworth等(2006)Nature441:656-659;Paques等(2007)Current Gene Therapy 7:49-66;美国专利公开号20070117128。

在其他实施方式中,所述DNA结合结构域包括天然存在或工程改造的(非 天然存在)TAL效应子DNA结合结构域。已知黄单胞菌属(Xanthomonas)的植物 病原菌在重要农作物中导致很多疾病。黄单胞菌属的病原性取决于保守的III型分 泌(T3S)系统,该系统向植物细胞内注入超过25种不同的效应子蛋白。这些注入 的蛋白质中,有模拟植物转录激活物并操纵植物转录组的转录活化样(TAL)效应 子(参见Kay等(2007)Science318:648-651)。这些蛋白含有DNA结合域和转录活 化结构域。最为充分鉴定的TAL效应子之一是来自野油菜黄单胞菌辣椒斑点病致 病变种(Xanthomonas campestris pv.vesicatoria)的AvrBs3(参见Bonas等(1989)Mol  Gen Genet218:127-136和WO2010079430)。TAL效应子含有串联重复的集中化结 构域,各重复含有约34个氨基酸,它们是这些蛋白的DNA结合特异性的关键。 此外,它们含有核定位序列和酸性转录活化结构域(综述参见Schornack S等(2006) J Plant Physiol163(3):256-272)。此外,在致植物病细菌烟草青枯菌(Ralstonia  solanacearum)中,已发现烟草青枯菌生物变型(biovar)1菌株GMI1000和生物变型 4菌株RS1000中称为brg11和hpx17的两个基因与黄单胞菌属(Xanthomonas)的 AvrBs3家族同源(参见Heuer等(2007)Appl and Envir Micro73(13):4379-4384)。这 些基因在核苷酸序列上彼此98.9%相同,但区别为hpx17重复结构域中的1,575bp 缺失。但是,两种基因产物与黄单胞菌属的AvrBs3家族蛋白的序列相同性都低 于40%。

这些TAL效应子的特异性取决于串联重复中发现的序列。重复序列包含约 102bp,且重复区彼此间通常91-100%同源(Bonas,同上)。重复区的多态性通常 位于12和13位,且看来在12和13位的高可变双残基的种类和TAL效应子靶序 列中毗邻核苷酸的种类之间存在一一对应(参见Moscou和Bogdanove,(2009) Science326:1501以及Boch等(2009)Science326:1509-1512)。实验上已确定用于这 些TAL效应子的DNA天然识别编码,12与13位的HD序列导致结合于胞嘧啶 (C),NG结合T、NI结合A、C、G或T,NN结合A或G,而ING结合T。这些 DNA结合重复区已装配在具有新重复区组合与数量的蛋白质中,产生能在植物细 胞中与新序列相互作用并激活非内源报道基因的表达的人工转录因子(Boch等, 同上)。工程改造的TAL蛋白已连接FokI切割半结构域以产生在酵母报告试验 (基于靶标的质粒)中表现活性的TAL效应子结构域核酸酶融合(TALEN)。 Christian等((2010)Genetics epub10.1534/genetics.110.120717).

调节结构域

本文所述DNA结合结构域(例如ZFP)可任选地与调控基因表达的调节结构 域结合。ZFP可共价或非共价结合一种或多种调节结构域,或者2种或更多调节 结构域,所述2种或更多结构域为相同结构域的两份拷贝或两种不同结构域。调 节结构域可例如通过氨基酸接头共价连接ZFP作为融合蛋白的部分。ZFP还可通 过非共价二聚化结构域例如亮氨酸拉链、STAT蛋白N末端结构域、或FK506结合 蛋白结合调节结构域(参见例如,O'Shea,Science254:539(1991),Barahmand-Pour 等,Curr.Top.Microbiol.Immunol.211:121-128(1996);Klemm等,Annu.Rev. Immunol.16:569-592(1998);Klemm等,Annu.Rev.Immunol.16:569-592(1998);Ho 等,Nature382:822-826(1996);和Pomeranz等,Biochem.37:965(1998))。调节结 构域可在任何合适的位置结合ZFP,包括ZFP的C或N末端。

用于添加到ZFP的常见的调节结构域包括例如转录因子的效应子结构域(激 活子、抑制子、共激活子、共抑制子)、沉默子、核激素受体、致癌基因转录因子 (例如myc、jun、fos、myb、max、mad、rel、ets、bcl、myb、mos家族成员等); DNA修复酶和其结合因子和修饰子;DNA重排酶和其结合因子和修饰子;染色质 结合蛋白和其修饰子(例如激酶、乙酰化酶和脱乙酰基酶);和DNA修饰酶(例如 甲基转移酶、拓扑异构酶、解螺旋酶、连接酶、激酶、磷酸酶、聚合酶、内切核 酸酶)和其结合因子和修饰子。

可从中获得调节结构域的转录因子多肽包括参与受调节和基础转录的那些。 所述多肽包括转录因子,其效应子结构域、共激活子、沉默子、核激素受体(参见 例如,Goodrich等,Cell84:825-30(1996)对参与转录的蛋白和核酸元件的综述; Barnes和Adcock,Clin.Exp.Allergy25Suppl.2:46-9(1995)和Roeder,Methods  Enzymol.273:165-71(1996)对转录因子总体的综述)。核激素受体转录因子描述于 例如Rosen等,J Med.Chem.38:4855-74(1995)。C/EBP转录因子家族综述参见 Wedel等,Immunobiology193:171-85(1995)。介导核激素受体转录调控的共激活 子和共抑制子的综述参见例如Meier,Eur.J Endocrinol.134(2):158-9(1996);Kaiser 等,Trends Biochem.Sci.21:342-5(1996);和Utley等,Nature394:498-502(1998)). 参与生血作用调节的GATA转录因子描述于例如Simon,Nat.Genet.11:9-11(1995); Weiss等,Exp.Hematol.23:99-107。TATA盒结合蛋白(TBP)和其结合的TAP多肽 (包括TAF30、TAF55、TAF80、TAF10、TAFI50、和TAF250)描述于Goodrich 和Tjian,Curr.Opin.Cell Biol.6:403-9(1994)和Hurley,Curr.Opin.Struct.Biol. 6:69-75(1996)。STAT转录因子家族的综述例如Barahmand-Pour等,Curr.Top. Microbiol.Immunol.211:121-8(1996)。参与疾病的转录因子的参见Aso等,J Clin. Invest.97:1561-9(1996)。

在一个实施方式中,人KOX-1蛋白的KRAB抑制结构域用作转录抑制子 (Thiesen等,New Biologist2:363-374(1990);Margolin等,Proc.Natl.Acad.Sci USA 91:4509-4513(1994);Pengue等,Nucl.Acids Res.22:2908-2914(1994);Witzgall等, Proc.Natl.Acad.Sci USA91:4514-4518(1994))。在另一实施方式中,KRAB共抑 制子KAP-1与KRAB一起使用(Friedman等,Genes Dev.10:2067-2078(1996))。或 者,KAP-1可与ZFP单独使用。其他用作转录抑制子的优选转录因子和转录因子 结构域包括MAD(参见例如,Sommer等,J.Biol.Chem.273:6632-6642(1998); Gupta等,Oncogene16:1149-1159(1998);Queva等,Oncogene16:967-977(1998); Larsson等,Oncogene15:737-748(1997);Laherty等,Cell89:349-356(1997);和 Cultraro等,Mol Cell.Biol.17:2353-2359(19977));FKHR(横纹肌肉瘤 (rhapdosarcoma))基因的叉头;Ginsberg等,Cancer Res.15:3542-3546(1998); Epstein等,Mol.Cell.Biol.18:4118-4130(1998));EGR-1(早期生长响应基因产物-1; Yan等,Proc.Natl.Acad.Sci USA95:8298-8303(1998);和Liu等,Cancer Gene Ther. 5:3-28(1998));ets2抑制因子抑制结构域(ERD;Sgouras等,EMBO J14:4781-4793 ((19095));MAD smSIN3相互作用结构(SID;Ayer等,Mol.Cell.Biol.16:5772-5781 (1996));和ERF3(乙烯反应因子-3)两亲性抑制结构域,EAR(Ohta,M.,等(2001), Plant Cell13:1959-1968)。

在一个实施方式中,HSV VP16活化结构域用作转录激活子(参见例如, Hagmann等,J.Virol.71:5952-5962(1997))。其他可补充活化结构域的优选转录因 子包括VP64活化结构域(Seipel等,EMBO J.11:4961-4968(1996));核激素受体(参 见例如,Torchia等,Curr.Opin.Cell.Biol.10:373-383(1998));核因子kappa B的 p65亚单位(Bitko和Barik,J.Virol.72:5610-5618(1998)以及Doyle和Hunt, Neuroreport8:2937-2942(1997));EGR-1(早期生长响应基因产物-1;Yan等,Proc. Natl.Acad.Sci USA95:8298-8303(1998);和Liu等,Cancer Gene Ther.5:3-28 (1998));和玉米花青素生物合成途径调节蛋白,C1(S.A.Goff,等,,(1991),Genetics  and Development5:298-309)。

修饰参与基因调节的多肽的激酶、磷酸酶和其他蛋白也用作ZFP的调节结构 域。所述修饰子常参与例如激素介导的转录打开或关闭。参与转录调节的激酶的 综述参见Davis,Mol.Reprod.Dev.42:459-67(1995),Jackson等,Adv.Second  Messenger Phosphoprotein Res.28:279-86(1993),和Boulikas,Crit.Rev.Eukaryot. Gene Expr.5:1-77(1995),而磷酸酶的综述参见例如Schonthal和Semin,Cancer Biol. 6:239-48(1995)。核酪氨酸激酶描述于Wang,Trends Biochem.Sci.19:373-6 (1994)。

如上所述,有用的结构域也可获自致癌基因(例如myc、jun、fos、myb、 max、mad、rel、ets、bcl、myb、mos家族成员等)和其结合因子和修饰子的基因 产物。致癌基因描述于例如Cooper,Oncogenes(《致癌基因》),第二版,Jones 和Bartlett生物系列丛书,马萨诸塞州波士顿,Jones和Bartlett出版社,1995。ets 转录因子的综述参见Waslylk等,Eur.J.Biochem.211:7-18(1993)和Crepieux等, Crit.Rev.Oncog.5:615-38(1994)。Myc致癌基因综述参见例如Ryan等,Biochem.J. 314:713-21(1996)。jun和fos转录因子描述于例如The Fos and Jun Families of  Transcription Factors(《Fos和Jun转录因子家族》),Angel和Herrlich,编. (1994).max致癌基因综述参见Hurlin等,Cold Spring Harb.Symp.Quant.Biol. 59:109-16。myb基因家族综述参见Kanei-Ishii等,Curr.Top.Microbiol.Immunol. 211:89-98(1996)。mos家族综述参见Yew等,Curr.Opin.Genet.Dev.3:19-25 (1993)。

ZFP可包括获自DNA修复酶和其结合因子和修饰子的调节结构域。DNA修 复系统综述参见例如Vos,Curr.Opin.Cell Biol.4:385-95(1992);Sancar,Ann.Rev. Genet.29:69-105(1995);Lehmann,Genet.Eng.17:1-19(1995);和Wood,Ann.Rev. Biochem.65:135-67(1996)。DNA重排酶和其结合因子和修饰子还可用作调节结构 域(参见例如,Gangloff等,Experientia50:261-9(1994);Sadowski,FASEB J.7:760- 7(1993))。

相似地,调节结构域可衍生自DNA修饰酶(例如DNA甲基转移酶、拓扑异构 酶、解螺旋酶、连接酶、激酶、磷酸酶、聚合酶)和其结合因子和修饰子。解旋 酶综述参见Matson等,Bioessays,16:13-22(1994),和甲基转移酶描述于Cheng, Curr.Opin.Struct.Biol.5:4-10(1995)。染色质结合蛋白和其修饰子(例如激酶、乙 酰化酶、和去乙酰化酶),例如组氨酸去乙酰化酶(Wolffe,Science272:371-2(1996)) 也可用作添加到所选ZFP的结构域。在一个优选实施方式中,调节结构域是用作 转录抑制子的DNA甲基转移酶(参见例如,Van den Wyngaert等,FEBS Lett. 426:283-289(1998);Flynn等,J.Mol.Biol.279:101-116(1998);Okano等,Nucleic  Acids Res.26:2536-2540(1998);以及Zardo和Caiafa,J.Biol.Chem.273:16517- 16520(1998))。在另一优选实施方式中,内切核酸酶如Fok1用作转录抑制子,其 通过基因切割发挥作用(参见例如,WO95/09233;和PCT/US94/01201)。

控制染色质和DNA结构、移动、和定位的因子和其结合因子和修饰子;衍生 自微生物(如原核生物、真核生物和病毒)的因子和与之结合或修饰它们的因子 也可用于获得嵌合蛋白。在一个实施方式中,重组酶和整合酶用作调节结构域。 在一个实施方式中,组氨酸乙酰转移酶用作转录激活子(参见例如,Jin和Scotto, Mol.Cell.Biol.18:4377-4384(1998);Wolffe,Science272:371-372(1996);Taunton等, Science272:408-411(1996);和Hassig等,Proc.Natl.Acad.Sci USA95:3519-3524 (1998))。在另一实施方式中,组氨酸去乙酰化酶用作转录抑制子((参见例如,Jin 和Scotto,Mol.Cell.Biol.18:4377-4384(1998);Syntichaki和Thireos,J.Biol.Chem. 273:24414-24419(1998);Sakaguchi等,Genes Dev.12:2831-2841(1998);和Martinez 等,J.Biol.Chem.273:23781-23785(1998))。

可包括多肽结构域之间(例如2个ZFP之间或ZFP和调节结构域之间)的接 头结构域。所述接头通常为多肽序列,例如约5-200氨基酸的聚gly序列。接头可 为灵活或刚性的氨基酸亚序列,其作为重组融合蛋白的部分合成。参见例如,美 国专利号6,534,261;Liu等,Proc.Nat.Acad.Sci.USA,95:5525-5530(1997); Pomerantz等,Proc.Nat.Acad.Sci.USA92:9752-9756(1995);Kim等,Proc.Nat. Acad.Sci.USA93:1156-1160(1996);其通过引用全文纳入本文。或者,灵活接头可 用能建模DNA结合位置和肽自身的计算机程序合理设计(Desjarlais和Berg,Proc. Nat.Acad.Sci.USA90:2256-2260(1993),Desjarlais和Berg,Proc.Nat.Acad.Sci. USA91:11099-11103(1994)或用噬菌体展示方法。

在其他实施方式中,化学接头用于连接合成或重组生产的结构域序列。本领 域技术人员已知所述灵活接头。例如,聚(乙二醇)接头可获自阿拉巴马汉茨维 尔的谢氏聚合物有限公司(Shearwater Polymers,Inc.)。这些接头任选具有酰胺键、 巯基键、或杂官能键。除了ZFP与调节结构域的共价键之外,非共价方法可用于 生产ZFP连接调节结构域的分子。

切割结构域

如上所述,DNA结合结构域也可结合切割(核酸酶)结构域。例如,寻靶内 切核酸酶的DNA结合特异性可被修饰而保留核酸酶功能。此外,锌指蛋白还可 融合切割结构域以形成锌指核酸酶(ZFN)。本文公开的融合蛋白的切割结构域 部分可获自任何内切核酸酶或外切核酸酶。可衍生出切割结构域的示范性核酸内 切核酸酶,包括但不限于限制性内切核酸酶和寻靶内切核酸酶。参见例如,马萨 诸塞州贝弗利(Beverly,MA)的NEB公司的2002-2003产品目录;和Belfort等 (1997)Nucleic Acids Res.25:3379-3388。已知切割DNA的其它酶(例如,S1核酸 酶、绿豆核酸酶、胰DNA酶I、微球菌核酸酶、酵母HO核酸内切酶;还参见 Linn等编,Nucleases(《核酸酶》),冷泉港实验室出版社(Cold Spring Harbor  Laboratory Press),1993)。可将一种或多种这些酶(或其功能性片段)用作切割结构 域和切割半结构域的来源。

类似地,切割活性需要二聚化的切割半结构域可衍生自任何核酸酶或其部 分,正如前文所述。通常,若融合蛋白包含切割半结构域,则切割需要两个融合 蛋白。或者,可使用包含两个切割半结构域的单个蛋白。这两个切割半结构域可 衍生自同一核酸内切核酸酶(或其功能性片段),或各切割半结构域可衍生自不同 的核酸内切核酸酶(或其功能性片段)。此外,优选两种融合蛋白的靶位点相对彼 此排列,从而这两种融合蛋白与其各自靶位点的结合将切割半结构域放置为能使 切割半结构域形成功能性切割结构域(例如,通过二聚化)的彼此空间定位。因 此,在某些实施方式中,这些靶位点的邻近边缘间隔有5-8个核苷酸或15-18个 核苷酸。但是,两个靶位点间可间插有任意整数数量的核苷酸或核苷酸对(例如, 2–50个核苷酸对或更多)。通常,切割位点位于靶位点之间。

限制性内切核酸酶(限制性酶)存在于许多物种,能序列特异性结合DNA(在 识别位点处),并在结合位点处或其附近切割DNA。某些限制性酶(例如,IIS型) 在从识别位点移除的位点处切割DNA并具有可分离的结合与切割结构域。例 如,IIS型酶Fok I催化DNA的双链切割,切割在一条链上距其识别位点9个核 苷酸,而在另一条链上距其识别位点13个核苷酸。参见例如,美国专利 5,356,802、5,436,150和5,487,994;以及Li等,(1992)Proc.Natl.Acad.Sci.USA 89:4275-4279;Li等,(1993)Proc.Natl.Acad.Sci.USA90:2764-2768;Kim等 (1994a)Proc.Natl.Acad.Sci.USA91:883-887;Kim等(1994b)J.Biol.Chem. 269:31,978-31,982。因此,在一种实施方式中,融合蛋白包含来自至少一种IIS型 限制性酶的切割结构域(或切割半结构域)和一种或多种经或未经工程改造的锌 指结合域。

Fok I是示例性IIS型限制性酶,其切割结构域可与结合域分离。该特定的酶 为二聚体时有活性。Bitinaite等,(1998)Proc.Natl.Acad.Sci.USA95:10,570- 10,575。因此,就本公开的目的而言,认为所述融合蛋白所用Fok I酶的部分是切 割半结构域。因此,对于利用锌指-Fok I融合体的靶向双链切割和/或靶向细胞序 列置换,可使用各自含有一个FokI切割半结构域的两种融合蛋白重建催化活性的 切割结构域。或者,也可使用含有锌指结合域和两个Fok I切割半结构域的单一 多肽分子。用锌指-Fok I融合体进行靶向切割和靶向序列改变的参数在本公开中 另行提供。

切割结构域或切割半结构域可以是保留切割活性或保留多聚化(例如,二聚化) 能力以形成功能性切割结构域的蛋白质任意部分。

通过引用全文纳入本文的国际公开WO07/014275中描述了示例性IIS型限制 性酶。其它限制性酶也含有可分离的结合与切割结构域,本公开也考虑到这些 酶。参见例如,Roberts等(2003)Nucleic Acids Res.31:418-420.

在某些实施方式中,切割结构域包含一种或多种经工程改造的切割半结构域 (也称作二聚化结构域突变体),其同二聚作用降至最小或被阻止,例如,如美国 专利公开号20050064474、20060188987、20080131962,所有公开通过引用全文 纳入本文。在Fok I的446、447、479、483、484、486、487、490、491、496、 498、499、500、531、534、537和538位的氨基酸残基都是影响Fok I切割半结 构域二聚化的靶标。

能形成专性异二聚体的示例性工程改造Fok I切割半结构域包括以下一对: 第一切割半结构域包括Fok I第490和538位氨基酸残基处的突变,和第二切割半 结构域包括第486和499位氨基酸残基处的突变。

因此,在某些实施方式中,490位的突变将Glu(E)替换为Lys(K);538位的 突变将Iso(I)替换为Lys(K);486位的突变将Gln(Q)替换为Glu(E);而499位的 突变将Iso(I)替换为Lys(K)。具体地,制备本文所述经工程改造的切割半结构域 是通过在一个切割半结构域的490(E→K)和538(I→K)位突变来产生名为 “E490K:I538K”的经工程改造切割半结构域,并通过另一切割半结构域的486 (Q→E)和499(I→L)位突变来产生名为“Q486E:I499L”的经工程改造切割半结构 域。本文所述的经工程改造切割半结构域是专性异二聚体突变体,其异常切割降 至最低或被消除。参见例如美国专利公开号2008/0131962,其公开全文通过引用 纳入本文用于所有目的。还参见Szczepek等(2007)Nat Biotechnol25:786-793。在 某些实施方式中,经工程改造的切割半结构域包括在486、499和496位(根据野 生型FokI编号)的突变,例如突变将野生型486位的Gln(Q)残基替换为Glu(E)残 基,野生型499位的Iso(I)残基替换为Leu(L)残基,以及野生型496位的Asn(N) 残基替换为Asp(D)或Glu(E)残基(还分别称作“ELD”和“ELE”结构域)。在其它实 施方式中,经工程改造的切割半结构域包括在490、538和537位(根据野生型 FokI编号)的突变,例如突变将野生型490位的Glu(E)残基替换为Lys(K)残基, 野生型538位的Iso(I)残基替换为Lys(K)残基,以及野生型537位的His(H)残基 替换为Lys(K)或Arg(R)残基(还分别称作“KKK”和“KKR”结构域)。在其它实施方 式中,经工程改造的切割半结构域包括在490和537位(根据野生型FokI编号)的 突变,例如突变将野生型490位的Glu(E)残基替换为Lys(K)残基,野生型537 位的His(H)残基替换为Lys(K)或Arg(R)残基(还分别称作“KIK”和“KIR”结构 域)。(参见2010年2月8日提交的美国临时申请61/337,769)。在其他实施方式 中,工程改造的切割半结构域包括“Sharkey”和/或“Sharkey’”突变(参见Guo等, (2010)J.Mol.Biol.doi:10.1016/j.jmb.2010.04.060)。

本文所述的经工程改造的切割半结构域可用任何适当方法制备,例如,如美 国专利公开号20050064474和20080131962所述通过定点诱变野生型切割半结构 域(Fok I)制备。

另一优选的IIS型限制性酶是BfiI(参见Zaremba等,(2004)J.Mol Biol. 336(1):81-92)。该酶的切割结构域可从其DNA结合结构域分离并操作性连接锌指 DNA结合结构域以产生ZFN。

融合蛋白

本领域已知设计和构建融合蛋白(和编码其的多核苷酸)的方法。例如,设 计和构建包含DNA结合结构域(例如锌指结构域)和调节或切割结构域(或切 割半结构域)的融合蛋白以及编码该融合蛋白的多核苷酸的方法描述于共同拥有 的美国专利6,453,242和6,534,261和美国专利申请公开2007/0134796和 2005/0064474;其全文通过引用纳入本文。

在某些实施方式中,构建编码该融合蛋白的多核苷酸。这些多核苷酸可插入 载体且所述载体可导入细胞(参见下述有关载体和导入多核苷酸到细胞中的方法 另述)。

如上所述,在某些实施方式中,所述融合蛋白包括参与脂肪酸生物合成基因 中结合靶位置的锌指蛋白和至少一种转录调节结构域,例如活化或抑制结构域。

在本文所述方法的其他实施方式中,锌指核酸酶包括融合蛋白且两种所述融 合蛋白在细胞中表达,其中所述融合蛋白包含锌指结合结构域和来自Fok I限制 性酶的切割半结构域。细胞中表达两种融合蛋白是由两种蛋白递送到细胞;一种 蛋白和编码两种所述蛋白的一种核酸递送到细胞;各编码一种所述蛋白的两种核 酸递送到细胞;或编码两种蛋白的单一核酸递送到细胞而产生的。在其他实施方 式中,融合蛋白包括单一多肽链,所述多肽链包括切割半结构域和锌指结合结构 域。该情况中,单一融合蛋白在细胞中表达,并且不受任何理论限制,认为其切 割DNA是切割半结构域形成分子内二聚体的结果。

在某些实施方式中,排列所述锌指核酸酶(例如ZFP-Fok I融合物)的组分 从而所述锌指结构域与所述融合蛋白的氨基末端最接近,且所述切割半结构域与 羧基末端最接近。这反映出天然产生的二聚化切割结构域例如衍生自Fok I酶的 那些中的切割结构域的相对方向,其中所述DNA结合结构域与所述氨基末端最 接近且所述切割半结构域与氨基末端最接近。在这些实施方式中,通过所述融合 蛋白与相对DNA链上的位置的结合发生切割半结构域的二聚化形成功能性的核 酸酶,所述结合位置的5’末端彼此邻近。

在其他实施方式中,排列所述融合蛋白(例如ZFP-Fok I融合物)的组分从 而所述切割半结构域与所述融合蛋白的氨基末端最接近,且所述锌指结构域与羧 基末端最接近。在这些实施方式中,通过所述融合蛋白与相对DNA链上的位置 的结合发生切割半结构域的二聚化形成功能性的核酸酶,所述结合位置的3’末端 彼此邻近。

在其他实施方式中,第一融合蛋白包含最接近所述融合蛋白氨基末端的切割 半结构域、最接近所述羧基末端的锌指结构域,且第二融合蛋白排列为锌指结构 域最接近所述融合蛋白氨基末端且切割半结构域最接近所述羧基末端。在这些实 施方式中,融合蛋白结合相同的DNA链,锌指结构域最接近羧基末端的第一融 合蛋白的结合位置位于锌指结构域最接近氨基末端的第二融合蛋白的5’侧。

在某些实施方式中,公开的融合蛋白中锌指结构域和切割结构域(或切割半 结构域)之间的氨基酸序列称为“ZC接头”。所述ZC接头与上述指内连接不 同。获取最优切割的ZC接头的细节参见例如,美国专利公开20050064474A1和 20030232410,和国际专利公开WO05/084190。

在一个实施方式中,本发明提供包含锌指蛋白的ZFN,所述蛋白具有表1或 表10所示的识别螺旋氨基酸序列。在另一实施方式中,本文提供包含编码ZFP的 核酸序列的ZFN表达载体,所述ZFP具有表1或表10所示的识别螺旋。

基因表达调节

可用各种试验测定ZFP调控基因表达。具体ZFP的活性可用各种体外和体内 试验评估,通过测量例如蛋白或mRNA水平、产物水平、酶活性;用例如免疫试 验(例如用抗体的ELISA和免疫组化试验)、杂交试验(例如RNA酶保护、 Northern、原位杂交、寡核苷酸阵列研究)、比色试验、扩增试验、酶活性试 验、表型试验等测量报告基因的转录活化或抑制。

通常先用ELISA试验检测ZFP体外活性然后用肾细胞。通常先用报告基因的 瞬时表达系统检测ZFP,然后在细胞或完整植物中体内或离体检测靶内源基因的 调节。ZFP可在细胞中重组表达、在移植到植物中的细胞中重组表达、或在转基 因植物中重组表达,以及用下述递送载剂作为蛋白给予植物或细胞。所述细胞可 被固定、溶于溶液、注射到植物中、或在转基因或非转基因植物中天然存在。

基因表达的调控用本文所述体外或体内试验之一检测。用ZFP测试样品或试 验并与没有测试化合物的对照样品比较以检测调控范围。为了调节内源基因表 达,ZFP的Kd通常为200nM或更小,优选100nM或更小,更优选50nM,最优 选25nM或更小。

ZFP的效果可通过检测上述任何参数来测量。任何合适的基因表达、表型、 或生理变化可用于评估ZFP的影响。用完整细胞或植物测定功能性序列时,还可 测量如植物生长、转录变化对已知和未表征的遗传标记(例如northern印迹或寡 核苷酸阵列研究)、细胞代谢变化如细胞生长或pH变化、和细胞内第二信使如 cGMP的变化的各种效应。

内源基因表达的ZFP调节的优选试验可体外进行。在一个优选体外试验形式 中,培养细胞的内源基因表达的ZFP调节通过用ELISA试验检测蛋白生产来测 量。测试样品与用空载体或靶向其他基因的无关ZFP的对照细胞比较。

在另一实施方式中,内源基因表达的ZFP调节通过测量靶基因mRNA表达水 平体外测定。基因表达水平用扩增测量,例如用PCR、LCR或杂交试验如 northern杂交、RNA酶保护、斑点印迹。RNA酶保护用于一个实施方式中。用直 接或检测标记检测剂,如本文所述荧光或放射标记核酸、放射或酶标记抗体等检 测蛋白或mRNA水平。

或者,报告基因系统可用操作性连接报告基因如荧光素酶、绿色荧光蛋白、 CAT或β-gal的靶基因启动子设计。报告构建体通常共转染到培养细胞中。用所 选的ZFP处理后,根据本领域技术人员已知的标准技术测量报告基因转录量、翻 译量或活性。

转基因和非转基因植物还可用作检测体内内源基因表达调节的优选实施方 式。转基因植物可稳定表达所选的ZFP。或者可使用瞬时表达所选的ZFP的植 物,或用递送载剂给予ZFP的植物。用本文所述试验的任一检测内源基因表达的 调节。

靶向切割方法。

所公开的方法和组合物可用来在细胞染色质的感兴趣区域(例如,在基因组内 需要的或预定的位点处例如参与脂肪酸生物合成的基因内或附近)切割DNA。对 于这种靶向DNA切割,例如,锌指结合结构域经工程改造成在预定切割位点或 其附近结合靶位点,且含有工程改造的锌指结合结构域和切割结构域的融合蛋白 在细胞中表达。融合蛋白的锌指部分结合靶位点后,DNA在邻近靶位点处被切割 结构域切割。切割的精确位置可根据ZC接头的长度确定。

或者,各含有锌指结合域和切割半结构域的两种融合蛋白在细胞中表达,并 结合于靶位点,所述靶位点以能重建功能性切割结构域且DNA在所述靶位点附 近被切割的方式并置。在一种实施方式中,切割发生在两个锌指结合域的靶位点 之间。所述锌指结合域之一或两者可以经过工程改造。

对于用锌指结合结构域-切割结构域融合多肽的靶向切割,所述结合位置可包 括切割位置,或所述结合位置的近边缘可为距离切割位置1、2、3、4、5、6、 10、25、50或更多个核苷酸(或1-50之间任何整数个核甘酸)。考虑所述切割位 置,结合位置精确定位取决于具体切割结构域和ZC接头长度。对于使用各含锌 指结合结构域和切割半结构域的两种融合多肽的方法,所述结合位置通常跨越所 述切割位置。因此所述第一结合位置的近边缘可位于所述切割位置一侧的1、2、 3、4、5、6、10、25或更多个核苷酸(或1-50之间任何整数个核甘酸),且所述第 二结合位置的近边缘可位于所述切割位置另一侧的1、2、3、4、5、6、10、25或 更多个核苷酸(或1-50之间任何整数个核甘酸)。体外和体内对切割位置作图的方 法本领域技术人员已知。

因此,本发明所述方法可使用融合切割结构域的工程改造的锌指结合结构 域。在这些情况中,所述结合结构域经工程改造为在需要切割或邻近需要切割的 位置结合靶序列。所述融合蛋白或编码其的多核苷酸导入植物细胞。一旦导入或 在细胞中表达,所述融合蛋白结合靶序列并在该靶序列位置或邻近位置切割。切 割的精确位置取决于切割结构域的特性和/或结合与切割结构域之间的接头序列的 存在和/或特性。在使用各包含一个切割半结构域的两个融合多肽的情况中,所述 结合位置的近边缘之间的距离可为1、2、3、4、5、6、7、8、9、10、25或更多 个核苷酸(或1-50之间任何整数个核甘酸)。切割的最佳水平也可取决于两融合 蛋白的结合位置之间的距离(参见例如,Smith等(2000)Nucleic Acids Res.28:3361- 3369;Bibikova等(2001)Mol.Cell.Biol.21:289-297)和各融合蛋白中ZC接头的长 度。还参见美国专利公开20050064474A1和国际专利公开WO05/084190、 WO05/014791和WO03/080809。

在某些实施方式中,所述切割结构域含两种切割半结构域,二者为单一多肽 的部分,所述多肽包含结合结构域、第一切割半结构域和第二切割半结构域。所 述切割半结构域可具有相同氨基酸序列或不同氨基酸序列,只要其有切割DNA 的功能。

切割半结构域还可在分开的分子中提供。例如,两融合多肽可导入细胞,其 中各多肽包括结合结构域和切割半结构域。所述切割半结构域可具有相同氨基酸 序列或不同氨基酸序列,只要其有切割DNA的功能。此外,所述结合结构域结 合靶序列,所述靶序列排列方式为结合融合多肽后,所述两个切割半结构域呈现 出能重建为切割结构域(例如,通过半结构域的二聚化)的彼此空间定位,从而将 半结构域彼此相关的放置以形成功能性切割结构域,产生感兴趣的区域中细胞染 色质的切割。通常,重建切割结构域的切割发生在两种靶向序列之间的位置。所 述蛋白之一或二者可工程改造为结合其靶位。

两种融合蛋白可以相同或相对极性结合感兴趣的区域,且其结合位置(即靶 位置)可被任何数目的核苷酸分隔,例如0-200个核苷酸或其间任何整数。在某 些实施方式中,各包括括锌指结合结构域和切割半结构域的两融合蛋白的结合位 置可位于距离各结合位置最接近另一结合位置的边缘5-18个核苷酸、例如5-8个 核苷酸、或15-18个核苷酸、或6个核苷酸、或16个核苷酸,且切割发生在所述 结合位置之间。

DNA切割位置通常位于两融合蛋白的结合位置之间。DNA的双链断裂常导 致两个单链断开,或“缺口”,偏移1、2、3、4、5、6或更多个核苷酸(例如天 然Fok I切割双链DNA导致偏移4个核苷酸的单链断开)。因此,切割不一定发 生在各DNA链的精确相反位置。此外,融合蛋白的结构和靶位置之间的距离可 影响切割是否发生在单核苷酸对附近,或切割是否发生在数个位置。然而,对于 许多应用,在核苷酸一定范围内包含靶向重组和靶向突变(见下)切割通常已足 够,且不需要具体碱基对之间的切割。

如上所述,融合蛋白可作为多肽和/或多核苷酸导入。例如,各含编码前述多 肽之一的两条多核苷酸可导入细胞,且所述多肽表达并各结合其靶序列时,切割 在靶序列处或附近发生。或者,含编码两种融合多肽的序列的单一多核苷酸导入 细胞。多核苷酸可为DNA、RNA或任何修饰形式或类似物或DNA和/或RNA。

为了提高切割特异性,本文所述方法也可使用其他组合物。例如,单一切割 半结构域可展示有限的双链切割活性。各含3指锌指结构域和切割半结构域的两 种融合蛋白导入细胞时,任一蛋白对约9核苷酸靶位置是特异的。尽管18核苷酸 的聚集靶序列可能在哺乳动物和植物基因组中是独特的,任何给定的9核苷酸靶 位置在人基因组中平均出现约23000次。因此,由于单一半结构域的位置特异结 合,可发生非特异性切割。因此,本文所述方法期望使用切割半结构域如Fok I (或编码其的核酸)的显性负突变,其在细胞中随着所述两种融合蛋白一起表 达。显性负突变能二聚化但不能切割,且还会封闭其二聚化的半结构域的切割活 性。通过提供摩尔量超过融合蛋白的显性负突变,仅两种融合蛋白都结合的区域 具有足够高的功能性切割半结构域的局部浓度用于二聚化和发生切割。在仅两种 融合蛋白之一结合的位置,其切割半结构域与显性负突半结构域形成二聚体,且 理想情况下不发生非特异性切割。

表达载体

可将本文所述编码一种或多种蛋白(例如ZFP)的核酸克隆入用于转化至原 核或真核细胞中复制和/或表达的载体内。载体可以是原核载体,例如质粒,或穿 梭质粒,昆虫载体,病毒载体或真核载体。编码ZFP的核酸还可克隆到表达载体 中用于给予植物细胞。

为了表达ZFP,编码ZFP的序列通常亚克隆到含引导转录的启动子的表达载 体中。本领域熟知合适的细菌与真核启动子并已有描述,例如,Sambrook等, Molecular Cloning,A Laboratory Manual(《分子克隆:实验室手册》)(第2版, 1989;第3版,2001);Kriegler,Gene Transfer and Expression:A Laboratory  Manual(《基因转移与表达:实验室手册》)纽约Stockton出版社(1990);以及 Current Protocols in Molecular Biology(《新编分子生物学实验指南》)(Ausubel 等,同上)。大肠杆菌(E.coli)、芽孢杆菌属(Bacillus sp.)和沙门氏菌 (Salmonella)(Palva等(1983)Gene22:229-235)。这类表达系统的试剂盒市售可得。 哺乳动物、植物、酵母和昆虫细胞的真核表达系统是本领域技术人员熟知的,并 且市售可得。

用于引导ZFP编码核酸表达的启动子取决于具体应用。例如,适于宿主细胞 的强组成型启动子通常用于表达和纯化ZFP。

相反,体内给予ZFP用于调节植物基因时(见下“Nucleic Acid Delivery to  Plant Cells”(《植物细胞的核酸递送》)部分),根据ZFP的具体应用来使用组 成型或诱导型启动子。植物启动子的非限制性示例包括衍生自拟南芥(A.thaliana) 泛素-3(ubi-3)(Callis等,1990,J.Biol.Chem.265-12486-12493);根癌农杆菌(A. tumifaciens)甘露碱合酶(Δmas)(Petolino等,美国专利号6,730,824);和/或木薯叶 脉花叶病毒(CsVMV)(Verdaguer等,(1996)Plant Molecular Biology31:1129-1139) 的启动子序列。还见实施例。

除启动子以外,表达载体一般还包含转录单元或表达盒,它们含有在原核或 真核宿主细胞中表达所述核酸所必须的所有其它元件。因此,典型的表达盒含有 操作性连接有例如编码ZFP的核酸序列的启动子和例如转录物有效聚腺苷酸化、 转录终止、核糖体结合位点或翻译终止等所需的信号。表达盒的其它元件可包括 例如增强子、异源剪接信号和/或核定位信号(NLS)。

用于转运遗传信息到细胞中的具体表达载体参考ZFP的预期应用而选择,例 如植物、动物、细菌、真菌、原生动物等中的表达(参见下述表达载体)。本领 域已知标准细菌和动物表达载体并在例如美国专利公开20050064474A1和国际专 利公开WO05/084190、WO05/014791和WO03/080809中详细描述。

可利用标准的转染方法产生表达大量蛋白的细菌、哺乳动物、酵母或昆虫细 胞系,然后用标准技术纯化(参见例如,Colley等,J.Biol.Chem.264:17619- 17622(1989);蛋白质纯化指南(Guide to Protein Purification),刊于《酶学方法》 (Methods in Enzymology),第182卷(Deutscher编,1990))。按照标准技术转化真 核和原核细胞(参见例如,Morrison,J.Bact.132:349-351(1977);Clark-Curtiss 和Curtiss,《酶学方法》(Methods in Enzymology)101:347-362(Wu等编, 1983)。

可采用将外来核苷酸序列引入此类宿主细胞的任何熟知方法。这些方法包括 使用磷酸钙转染、聚凝胺、原生质体融合、电穿孔、超声方法(如声致穿孔)、脂 质体、显微注射、裸露DNA、质粒载体、病毒载体,附加型和整合型均可,和将 克隆的基因组DNA、cDNA、合成DNA或其它外来遗传物质引入宿主细胞的任 何其它熟知方法(参见例如,Sambrook等,同上)。唯一必要的是,所用的具体遗 传工程方法能将至少一种基因成功引入能表达所选蛋白的宿主细胞中。

植物细胞的核酸递送

如上所述,DNA构建物可用多种常规技术引入需要的植物宿主(例如,引入 其基因组)。这类技术的综述可参见,例如Weissbach和Weissbach,Methods for  Plant Molecular Biology(《植物分子生物学方法》)(1988,学术出版社(Academic  Press),纽约),VIII部分,第421-463页;以及Grierson和Corey,Plant  Molecular Biology(《植物分子生物学》)(1988,第2版),布来基公司(Blackie), 伦敦,第7-9章。

例如,可将DNA构建物利用如植物细胞原生质体的电穿孔和微注射等技术 直接引入植物细胞的基因组DNA,或者可将DNA构建物利用生物射弹方法如 DNA粒子轰击直接引入植物组织(参见例如,Klein等(1987)Nature327:70-73)。或 者,DNA构建物可与合适的T-DNA侧接区域组合并引入常规的根癌农杆菌 (Agrobacterium tumefaciens)宿主载体。根癌农杆菌介导的转化技术,包括二元载 体的卸装和使用。参见例如Horsch等(1984)Science233:496-498和Fraley等(1983) Proc.Nat'l.Acad.Sci.USA80:4803。

此外,基因转移可利用非农杆菌的细菌或病毒如根瘤菌属(Rhizobium sp.) NGR234,苜蓿中华根瘤菌(Sinorhizoboium meliloti)、百脉根根瘤菌(Mesorhizobium  loti)、马铃薯病毒X、椰菜花叶病毒和木薯叶脉花叶病毒和/或烟草花叶病毒完 成,参见例如Chung等,(2006)Trends Plant Sci.11(1):1-4。

当利用二元T DNA载体(Bevan(1984)Nuc.Acid Res.12:8711-8721)或共培养 方法(Horsch等,(1985)Science227:1229-1231)使细胞被细菌感染时,根癌农杆菌 宿主的毒力作用将引导构建物和相邻标记物插入植物细胞DNA中。通常,农杆 菌转化系统用于工程改造双子叶植物(Bevan等,(1982)Ann.Rev.Genet 16:357-384;Rogers等,(1986)Methods Enzymol.118:627-641)。农杆菌转化系统 也可用于转化以及转移DNA至单子叶植物和植物细胞。参见美国专利号5, 591,616;Hernalsteen等,(1984)EMBO J3:3039-3041;Hooykass-Van Slogteren 等,(1984)Nature311:763-764;Grimsley等,(1987)Nature325:1677-179; Boulton等,(1989)Plant Mol.Biol.12:31-40;和Gould等,(1991)Plant Physiol. 95:426-434。

替代的基因转移和转化方法包括但不限于:通过钙、聚乙二醇(PEG)或电穿 孔介导的裸露DNA摄取进行原生质体转化(参见Paszkowski等,(1984)EMBO J 3:2717-2722;Potrykus等,(1985)Molec.Gen.Genet.199:169-177;Fromm等, (1985)Proc.Nat.Acad.Sci.USA82:5824-5828;和Shimamoto(1989)Nature 338:274-276)和植物组织的电穿孔(D'Halluin等,(1992)Plant Cell4:1495-1505)。 植物细胞转化的其它方法包括微注射、碳化硅介导的DNA摄取(Kaeppler等, (1990)Plant Cell Reporter9:415-418)和微粒轰击(参见Klein等,(1988)Proc.Nat. Acad.Sci.USA85:4305-4309;和Gordon-Kamm等,(1990)Plant Cell2:603-618)或 纳米颗粒。

公开的方法和组合物可用于插入外源序列到植物细胞基因组的预定位置。这 可用于根据整合位置表达尽可能多的导入植物基因组的转基因。因此,可透过靶 向重组将编码例如营养物、抗生素或治疗性分子的基因插入有利于其表达的植物 基因组区域。

上述转化技术中任一生产的转化植物细胞可培养再生为完整植物,其具有转 化的基因型和所需的表型。此类再生技术有赖于组织培养生长培养基中某些植物 激素的控制,通常有赖于和所需核苷酸序列一同引入的抗微生物剂和/或除草剂标 记物。从培养的原生质体进行植物再生的内容描述于Evans等收录于Handbook of  Plant Cell Culture(《植物细胞培养手册》)第124-176页的"Protoplasts Isolation  and Culture(原生质体分离与培养)",麦克米兰出版公司(Macmillian Publishing  Company),纽约,1983;和Binding,Regeneration of Plants,Plant Protoplasts (《植物的再生、植物原生质体》),第21-73页,CRC出版社,博卡拉顿, 1985。也可从植物胼胝体、外植体、器官、花粉、胚胎或其部分获得再生。这些 再生技术在Klee等(1987)Ann.Rev.of Plant Phys.38:467-486中有一般描述。

导入植物细胞的核酸可用于将所需的特征赋予基本上任何植物。广泛的植物 和植物细胞系统可用本发明的核酸构建体和上述各种转化方法,根据本文所述需 要的生理和农艺特征而工程改造。在优选的实施方式中,用于工程改造的靶植物 和植物细胞包括但不限于那些单子叶和双子叶植物,例如作物包括谷类作物(例 如,小麦、玉米、大米、小米、大麦),水果作物(例如,番茄、苹果、梨、草 莓、橙),饲料作物(例如,苜蓿),根菜作物(例如,胡萝卜、马铃薯、甜菜、甘 薯),叶菜作物(例如,莴苣、菠菜);开花植物(例如,矮牵牛花、玫瑰、菊),针 叶树和松树(例如,松杉、云杉);用于植物修复的植物(例如,重金属积累植物); 油料作物(例如,向日葵、菜籽、大豆)和用于实验目的的植物(例如,拟南芥)。因 此,本文公开的方法和组合物可用于各种植物,包括但不限于来自以下属的种: 天门冬属(Asparagus)、燕麦属(Avena)、芸苔属(Brassica)、柑桔属(Citrus)、西瓜属 (Citrullus)、辣椒属(Capsicum)、南瓜属(Cucurbita)、胡萝卜属(Daucus)、飞蓬属 (Erigeron)、大豆属(Glycine)、棉(Gossypium)、大麦属(Hordeum)、莴苣(Lactuca)、 黑麦(Lolium)、番茄(Lycopersicon)、苹果(Malus)、木薯(Manihot)、烟草 (Nicotiana)、诸葛菜属(Orychophragmus)、稻属(Oryza)、鳄梨(Persea)、菜豆属 (Phaseolus)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卜属(Raphanus)、黑 麦属(Secale)、茄属(Solanum)、高粱属(Sorghum)、小麦属(Triticum)、葡萄属 (Vitis)、豇豆属(Vigna)和玉蜀黍属(Zea)。

本领域技术人员认识到,表达盒稳定整合入转基因植物中并证实为可操作 后,可通过有性杂交将其引入其它植物。取决于待杂交物种,可使用任意数量的 标准育种技术。

转化的植物细胞、愈伤组织、组织或植物可通过根据转化DNA上的标记基 因编码的特征选择或筛选工程改造的植物材料来鉴定和分离。例如,可通过将经 工程改造植物材料在含有抑制量的抗生素或除草剂的培养基上生长来进行选择, 转化的基因构建物提供对该抗生素或除草剂的抗性。此外,转化的植物和植物细 胞还可通过对任何可见标记物基因(例如,β-葡糖苷酸酶,荧光素酶,B或C1基 因)活性的筛选来鉴定,该标记基因可存在于重组核酸构建物上。本领域技术人员 熟知这类选择和筛选方法。

也可用物理和生化方法来鉴定含有插入基因构建体的植物或植物细胞转化 体。这些方法包括但不限于:1)Southern分析或PCR扩增,用于检测和测定重组 DNA插入物的结构;2)Northern印迹,S1RNA酶保护,引物延伸或逆转录 酶-PCR扩增,用于检测和检验基因构建物的RNA转录物;3)酶促试验,用于检 测酶或核酶活性,其中此类基因产物由基因构建物编码;4)蛋白质凝胶电泳分 析,Western印迹技术,免疫沉淀或酶联免疫试验,其中基因构建物的产物是蛋白 质。其它技术如原位杂交、酶染色和免疫染色也可用来检测重组构建物在特定植 物器官和组织中的存在或表达。本领域技术人员熟知进行所有这些试验的方法。

用本文所述方法进行基因操作的效果可以通过例如分离自感兴趣组织的RNA (如mRNA)的northern印迹观察到。通常,若mRNA的量提高,则可认为相应的 内源基因正以高于之前的速率表达。可采用测定基因和/或CYP74B活性的其它方 法。可使用不同类型的酶促试验,取决于所用底物和检测反应产物或副产物增加 或减少的方法。此外,(基因)和/或CYP74B蛋白表达的水平可进行免疫化学测 定,即ELISA、RIA、EIA和本领域技术人员熟知的其它基于抗体的试验,例如 电泳检测试验(用染色或western印迹)。转基因可在所述植物的一些组织或某些发 育阶段选择性表达,或所述转基因可基本上在所有植物组织中,基本上植物全部 生命周期表达。然而还可应用任何组合表达模式。

本公开还涵盖上文所述转基因植物的种子,其中所述种子具有所述转基因或 基因构建物,且包括具有需要的修饰油分布的种子。本公开还涵盖上文所述转基 因植物的子代、克隆、细胞系或细胞,其中所述子代、克隆、细胞系或细胞具有 所述转基因或基因构建物。

有效量的给予通过常规用于引入ZFP至最终接触待处理植物细胞的任何途径 完成。ZFP以任何适当方式给予,优选与可接受的载体一同给予。合适的给予方 法如调节剂可得且为本领域技术人员熟知,并且,尽管可利用超过一种途径给予 特定组合物,某特定途径通常能提供比另一途径更直接和更有效的反应。

也可使用载体,并部分取决于需给予的特定组合物以及用来给予组合物的特 定方法。因此,可用各种合适的组合物制剂。

应用

如上所述,参与脂肪酸合成基因的靶向修饰可用于快速有效地生成所需脂肪 酸分布的植物油。

对产油植物如油菜中植物油的脂肪酸组合物的改变对食物生产以及因此饮食 健康有深远的影响。例如,种子油中具有较低水平饱和脂肪酸的油菜质量的油种 子芸苔品种可用于生产食物产品,其促进心血管健康。本文所述方法和组合物可 用于生成具有低棕榈酸和/或硬脂酸成分的产油植物,其降低植物油中饱和脂肪酸 水平。相似地,生成具有较高水平油酸成分的产油植物也会降低植物油中饱和脂 肪酸的含量。

此外,本文所述方法和组合物可用于增加例如所述植物生产的油中棕榈酸的 含量。富含棕榈酸成分的油特别适用于制备人造黄油。

此外,本文所述脂肪酸分布的靶向改变可用于生成低亚油酸含量的植物(和 植物油)。低亚油酸油稳定性增加;用这些油生产的食物在风味和气味方面不会 如高亚油酸浓度的植物材料生产的食物那样快速消失。

实施例

以下为实施本发明的具体实施方式的示例。实施例仅提供用于说明目的,并 非旨在以任何方式限制本发明的范围。

努力保证所用数值(如含量、温度等)的准确性,但应允许一些实验误差和偏 差。

实施例1:欧洲油菜中鉴定靶序列

1.1靶序列鉴定

本实施例中,鉴定编码欧洲油菜(油菜)的天然β-酮酰基-ACP合成酶II (KAS II)的内源DNA序列。这些基因选为示例性的靶标以证明通过工程改造的锌 指蛋白转录因子(ZFP TF)的转录调节产生需要的脂肪酸生物合成修饰和伴随改 变的种子油分布。酶β-酮酰基-ACP合成酶II催化16:0-ACP转变为18:0-ACP并 随后形成油酸(Ohlrogge和Browse,1995,The Plant Cell,7:957-970).报道的β-酮酰 基-ACP合成酶II的拟南芥fab1突变使酶活性下降65%并伴随着叶片和根中硬脂 酸成分分别增加7%和3%(Wu等,1994,Plant Physiology,106:143-150)。稳定表 达的转化大豆的β-酮酰基-ACP合成酶II转基因在油菜中使种子棕榈酸成分降低 0.8%且在烟草中导入相同基因使棕榈酸成分降低2%(日本专利公开# 501446/1995)。

β-酮酰基-ACP合成酶II的cDNA序列已在多种植物物种中报道,包括拟南芥 (GenBank:AF318307)和欧洲油菜(GenBank:AF244520)。拟南芥(A.thaliana)欧 洲油菜cDNA序列(分别为GenBank:AF318307和AF244520)的比对显示 AF244520序列不完整(图7)。该截短的欧洲油菜DNA序列在5’末端缺失数百 碱基对。此外,由于欧洲油菜是芜青(B.rapa)(2n=20,AA)和甘蓝(B. oleracea)(2n=18,CC)的染色体组的组合形成的双二倍体物种(Morinaga,1934, Cytologia,6:62-67;U.N.,1935,Japanese J.Bot.,7:389-452),预测该物种中有多于一 种β-酮酰基-ACP合成酶II基因。鉴定并获得cDNA序列中存在的额外5’UTR序 列。这些5’β-酮酰基-ACP合成酶II基因序列作为本实施例中通过ZFP-TFs上调 转录的靶标。

1.2总RNA分离

用凯杰(Qiagen)植物微量试剂盒(加州瓦伦西亚的凯杰公司)在 开花后(DAF)15天从欧洲油菜(油菜)基因型Nex710(农作物证书(Crop  Certificate)99-7049208-501)的未成熟种子中分离总RNA。按照生产商建议用不含 RNA酶的DNA酶处理总mRNA以去除可在定量RT-PCR中扩增的污染DNA。

1.35’RACE和序列分析

用安碧RLM-RACE(得克萨斯州奥斯汀的安碧公司(Ambion)) 试剂盒根据生产商建议进行欧洲油菜β-酮酰基-ACP合成酶II cDNA(GenBank  AF244520)的5’末端特异的cDNA末端快速扩增(RACE)。为了获得5’cDNA 序列,合成的RNA接头与5’未加帽的mRNA区域退火。试剂盒提供的引物(5’- CGCGGATCCGAACACTGCGTTTGCTGGCTTTGATGAAA-3’)(SEQ ID NO:1) 和的第二引物(5’-CTCGAGCTGCTACTGCTAGTTCCGGTGGAGGAGCC-3’) (SEQ ID NO:2)设计用于结合部分欧洲油菜cDNA序列(GenBank AF244520), 用于扩增片段以测定未知的上游序列。5’RACE扩增鉴定到约500碱基对的新欧 洲油菜序列。比对扩增序列时鉴定到β-酮酰基-ACP合成酶II的四种明显不同的 5’cDNA序列毗连群(SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:46、和SEQ ID  NO:30)。这些5’序列显示与芜青(GenBank:AC189461)和甘蓝(GenBank: BH723504)有相同区域序列的高度同一性。.

在β-酮酰基-ACP合成酶II基因的5’cDNA序列中鉴定到ZFP TF结合序列。 β-酮酰基-ACP合成酶II基因上游区域的序列(表2)用作ZFP TF结合的靶标 (表1)。质粒构建体:含工程改造的ZFP TF设计pDAB4695、pDAB4696、 pDAB4697、和pDAB4698用于在下述部分稳定转化欧洲油菜。假设工程改造的 ZFP TF在植物细胞中表达后会结合内源的β-酮酰基-ACP合成酶II靶标,产生所 述靶标的修饰mRNA表达。

实施例2:设计对β-酮酰基-ACP合成酶II基因特异的ZFP DNA结合结构 域

针对欧洲油菜β-酮酰基-ACP合成酶II基因启动子区域和5’非翻译和翻译 区域的各种靶位置设计锌指蛋白。参见图2。代表性ZFP设计的识别螺旋示于表 1。锌指设计的靶位置示于表2。

表1:β-酮酰基-ACP合成酶II锌指设计

表2:β-酮酰基-ACP合成酶II锌指的靶位置

β-酮酰基-ACP合成酶II设计纳入编码蛋白的锌指表达载体中,所述蛋白具 有至少一种CCHC结合的指。参见美国专利公开2008/0182332。具体地,各蛋白中 最后的指具有CCHC结构(构造)。

然后锌指编码序列融合编码VP16活化结构域和opaque-2核定位信号的序 列。融合蛋白的表达由相对强的组成型启动子驱动,如衍生自拟南芥泛素10 (AtUbi10)启动子的启动子。示例性载体示于下表3。

实施例3:ZFP TF介导欧洲油菜中的天然β-酮酰基-ACP合成酶II基因的 上调

为了评估设计的锌指蛋白在植物细胞中的功能,采用在活植物细胞中表达所 述蛋白的方法。编码锌指蛋白的DNA可在所述DNA不整合入植物细胞基因组的 条件下递送到植物细胞中。因此,DNA分子瞬时维持在植物细胞中并作为基因表 达的模板。或者,编码锌指蛋白的DNA可在DNA整合入植物细胞基因组的条件 下递送到细胞中。产生所述锌指蛋白编码基因的转基因组从而所述DNA分子在 植物细胞中稳定维持并作为基因表达的模板。本领域技术人员可用瞬时或转基因 表达锌指蛋白编码DNA,从而评估这些蛋白在活植物细胞中的功能。

3.1构建体设计

为此设计并构建的二元质粒列于表3。

表3:靶向欧洲油菜KAS II的ZFP TF构建体描述

AtUbi10=拟南芥泛素10启动子、CsVMV=木薯叶脉花叶病毒启动子、ZFP =锌指蛋白基因、pat=草胺膦乙酰转移酶基因、AtuORF1=根癌农杆菌3’UTR1 和AtuORF23=根癌农杆菌3’UTR23。

pDAB4695是含有14025v3/VP16和pat基因表达盒的二元质粒。该构建体 包括下述基因元件;RB7MAR v3(基质附着区(Thompson等,1997, WO9727207))::AtUbi10启动子v2(拟南芥泛素-10启动子(Callis,等,1990,J.Biol. Chem.265-12486-12493))::14025v3锌指/VP16融合体::Atu ORF23 3’UTR v1(根 癌农杆菌开放阅读框23,3’非翻译区(Gelvin等,1987,EP222493))::CsVMV启动 子v2(木薯叶脉花叶病毒启动子(Verdaguer等,1996,Plant Molecular Biology31: 1129-1139))::pat v5(草胺膦乙酰转移酶基因(Wohlleben等,1988,Gene70:25-37)):: AtuORF1 3’UTR v4(根癌农杆菌开放阅读框1,3’非翻译区(Huang等,J.Bacteriol. 172:1814-1822))。通过NcoI–SacI限制性位点将含14025v3锌指/VP16融合体的 DNA片段克隆到pDAB3916构建所述二元质粒。得到的构建体pDAB8221包含 AtUbi10启动子v2::14025v3锌指/VP16融合体::Atu ORF23 3’UTR v1基因表 达盒。用L-R反应(英杰公司,加利福尼亚州卡尔斯巴德)将pDAB8221 克隆到pDAB7309二元体中。该反应产生pDAB4695并通过限制性酶切和测序反 应证实。

pDAB4696是含有14033v3/VP16和pat基因表达盒的二元质粒。该构建包 含下述基因元件;RB7MAR v3::AtUbi10启动子v2::14033v3锌指/VP16融合 体::Atu ORF23 3’UTR v1::CsVMV启动子v2::pat v5::AtuORF1 3’UTR v4。通 过NcoI–SacI限制性位点将含14033v3锌指/VP16融合体的DNA片段克隆到 pDAB3916构建所述二元质粒。得到的构建体pDAB8222包含AtUbi10启动子 v2::14033v3锌指/VP16融合体::Atu ORF23 3’UTR v1基因表达盒。用L-R 反应(英杰公司,加利福尼亚州卡尔斯巴德)将pDAB8222克隆到 pDAB7309二元体中。该反应产生pDAB4696并通过限制性酶切和测序反应证 实。

pDAB4697是含有14035v3/VP16和pat基因表达盒的二元质粒。该构建包 含下述基因元件;RB7MAR v3::AtUbi10启动子v2::14035v3锌指/VP16融合 体::Atu ORF23 3’UTR v1::CsVMV启动子v2::pat v5::AtuORF1 3’UTR v4。通 过NcoI–SacI限制性位点将含14035v3锌指/VP16融合体的DNA片段克隆到 pDAB3916构建所述二元质粒。得到的构建体pDAB8223包含AtUbi10启动子 v2::14035v3锌指/VP16融合体::Atu ORF23 3’UTR v1基因表达盒。用L-R 反应(英杰公司,加利福尼亚州卡尔斯巴德)将pDAB8223克隆到 pDAB7309二元体中。该反应产生pDAB4697并通过限制性酶切和测序反应证 实。

pDAB4698是含有14047v3/VP16和pat基因表达盒的二元质粒。该构建包 含下述基因元件;RB7MAR v3::AtUbi10启动子v2::14047v3锌指/VP16融合 体::Atu ORF23 3’UTR v1::CsVMV启动子v2::pat v5::AtuORF1 3’UTR v4。通 过NcoI–SacI限制性位点将含14047v3锌指/VP16融合体的DNA片段克隆到 pDAB3916构建所述二元质粒。得到的构建体pDAB8224包含AtUbi10启动子 v2::14047v3锌指/VP16融合体::Atu ORF23 3’UTR v1基因表达盒。用L-R 反应(英杰公司,加利福尼亚州卡尔斯巴德)将pDAB8224克隆到 pDAB7309二元体中。该反应产生pDAB4698并通过限制性酶切和测序反应证 实。

3.2农杆菌转化

用Weigel D.,Glazebrook J.Arabidopsis:A Laboratory Manual(《拟南芥:实验室手册》)冷泉港实验室出版社,2002:第123-124页描述的实验方案制备农杆菌 细胞用于电穿孔。对所述实验方案进行少量修改以使农杆菌生长最佳(即YEP培 养基用LB取代)。独立地,各构建体的1.5-3μg的质粒DNA加入50μl C58:: Z707s根癌农杆菌细胞中并温和混合。所述混合物转移到冷的0.2cm GENE 试管中(美国加利福尼亚州赫库斯市的伯乐(BioRad)公司)并置于冰 上。然后试管置于冷的GENE架上(美国加利福尼亚州赫库斯市的伯 乐公司)并在下述条件电穿孔:电容输出25微法拉(μFarad)、电容延长器960 微法拉、电阻200欧姆、和电压2.5千伏。电穿孔后立即加入950μl的SOC培养 基(英杰公司,加利福尼亚州卡尔斯巴德)且所述混合物转移到Falcon2059管 (新泽西州富兰克林湖的BD公司(Becton Dickinson and Co.,Franklin Lakes,NJ)) 或等同物中。随后28℃孵育转化细胞1小时。孵育后,50μl、100μl、和200μl 细胞置于分别的含适量抗生素的YEP培养基板中(1升水中10克酵母提取物,10 克蛋白胨,5克NaCl,10克蔗糖,和15克琼脂)。所述板于28℃倒置生长约36-48 小时。挑取单一菌落并接种在含适量抗生素的50ml液体YEP中(1升水中10克 酵母提取物,10克蛋白胨,5克NaCl和10克蔗糖),28℃孵育约36小时。

根癌农杆菌株系通过酮乳糖(ketolactose)测试确认。推定地转化菌落在乳糖 琼脂上划线并于28℃孵育48小时。然后板用本氏(Benedict)溶液浸没。监控所 述板;将本氏溶液从蓝变黄的划线分离物确认为农杆菌(Bouzar,H.,Jones,J.,Bishop, A.“Simple Cultural Tests for Identification of Agrobacterium Biovars.”(“鉴定农杆 菌生物变型的简单培养测试”)Methods in Molecular Biology(《分子生物学方法》),44卷.休曼出版社(Humana Press),1995:9-13)。

完成低拷贝微制备实验方案(加州瓦伦西亚的凯杰公司)后,纯化 的质粒DNA从细菌培养物中制备。用限制性酶切评估DNA完整性。鉴定有预期 带形的克隆并通过添加500μl细菌培养物到500μl无菌甘油(密苏里州圣路易斯西 格玛化学品公司)中并颠倒混合制备甘油储存液。甘油储存液在干冰上冷冻并存 于-80℃。

3.3用ZFP TF转化欧洲油菜

制备胚轴区段:欧洲油菜基因型Nex710的种子用10%市售漂白剂表面灭菌 10分钟,并用无菌蒸馏水漂洗3次。用无菌纸巾干燥种子然后置于含由一半浓度 的MS基础培养基(Murashige和Skoog,Physiol Plant15(3):473-497,1962)、20g/L 蔗糖、和8g/L TC琼脂(堪萨斯州肖尼的植物技术实验室)组成的‘萌发培养基’ 的Phyta-tray中并维持23℃和16小时光照/8小时黑暗的光周期的生长条件。

在第5天,检查幼苗的无菌并将Phyta-tray置于层流净化柜内 (缅因州桑福德的贝克公司(The Baker Company))以维持无菌。用无菌镊子和 解剖剪将植物从Phyta-tray中移出并将空气中(分生组织和子叶)的区域和根分 离并弃置。将下胚轴置于含无菌蒸馏水的100x25mm皮氏培养皿中,避免干燥。 将下胚轴放在100x25mm皮氏培养皿盖上并用#10手术刀横向切成3mm区段。 将下胚轴区段置于由含30g/L蔗糖的MS培养基、1mg/L激动素和1mg/L2,4-D 并用7g/L TC琼脂凝固的包括无菌铝纸的‘愈伤组织诱导培养基’上。所述板放 在透明盆中并维持在相同生长条件下3天作为预处理。

第8天,所述区段转移到含20mL‘液体培养基’的100x25无菌皮氏板中 预处理1小时,所述培养基由含30g/L葡萄糖的LS(Linsmaier和Skoog(1965)) 基础培养基、1/2强度的甘波(Gamborg)维生素(1968)、215.2mg/l激动素和 221.04mg/l2,4-D组成。将‘液体培养基’从胚轴区段中移除,将50克莱特 (Klett)的40mL农杆菌悬浮液(在Z707s中含pDAB4695、pDAB4696、 pDAB4697或pDAB4698)简单涡旋并倒入含胚轴区段的100x25mm皮氏培养皿 中持续处理30分钟。30分钟后,所有农杆菌悬液用双组移液器移除。处理的胚 轴放回添加滤纸的‘愈伤组织诱导培养基’上,放回管中,盖上黑色盖 并放回与上述相同生长条件的培养室,持续3天共培养期。3天后,将胚轴直接 放在含1mg/L的‘愈伤组织诱导培养基上’,放回管中盖上透明盖并放 回培养室,保持与上相同的生长条件。1周后,胚轴直接转移到‘愈伤组织诱导 培养基’中,用3mg/L筛选2周以进一步发育愈伤组织并转移到‘愈 伤组织诱导培养基’中,用5mg/L Herbiace筛选2-8周以额外发育愈伤组织。获 得足量的愈伤组织后,进行分子分析。

老化油菜愈伤组织中再生植物:油菜愈伤组织置于含30g/L蔗糖、3mg/L苄 氨基嘌呤、0.5g/L MES[2-(N-吗啉代)乙磺酸]、5mg/L硝酸银、1mg/L玉米素、 250mg/L羧苄青霉素、300mg/L特美汀和7g/L TC琼脂的MS培养基的‘出芽再 生培养基’上,用5mg/L筛选,用3M胶带包裹平板并将其置于23℃ 和16小时光照/8小时黑暗的光周期的生长条件下。然后所述组织移动到含0.5 g/L MES、300mg/L特美汀、20g/L蔗糖和7g/L TC琼脂的MS培养基的‘出芽 伸长培养基’上,用5mg/L筛选。小苗转移到含10g/L蔗糖、0.5 mg/L吲哚丁酸、300mg/L特美汀和8g/L TC琼脂的1/2MS培养基的‘生根培养 基’上,用5mg/L筛选。

小苗体外生根后,将其转移到含Metro Mix360的51/4”罐子中。植物盖有透 明单盖并放于康威恩培养箱(conviron)中驯化。48-72小时后,移去盖子使空气 流通。总计7天后,将所述罐子从康威恩培养箱移到温室中进一步发育。在16:8- 小时光期和白天和晚上温度在22-24℃之间的条件下培养植物。当主要花茎开始 伸长并形成花芽时,整个植物用自交袋覆盖以阻止异型杂交。移植4个月后收获 自花传粉的种子。

农杆菌制备:处理4天前用甘油母液中的农杆菌在含10g/L蛋白胨、10g/L 酵母提取物、5g/L NaCl、10g/L蔗糖加100mg/L壮观霉素和250mg/L链霉素并 用15g/L细菌琼脂固化的‘半固体细菌生长培养基’上划线并在28℃培养箱中 培养2天。2天后,含150mL‘液体细菌生长培养基’(与上述配方相同但去除 固化剂)、250mg/L链霉素和100mg/L壮观霉素的无菌一次性挡板培养瓶中,在 200rpm封闭摇床(新布兰斯维克科学公司Innova4330冷藏孵育摇床)上28℃生 长16小时避光过夜。16小时后,农杆菌培养物从摇床上移出,并等分为50mL离 心管中(1只含35mL用于制备,2只含50mL用于重新验证)。离心管置于离心 机上(贝克曼J2-21型离心机)并6,000rpm离心15分钟,随后在‘液体培养 基’中重悬到红色滤光器观察的终密度50克莱特。

实施例4:分析转化的愈伤组织样本

分析推定的转化油菜愈伤组织样本中β-酮酰基-ACP合成酶II内源基因、微 管蛋白内源基因和ZFP TF转基因mRNA表达情况的改变。微管蛋白mRNA的水 平用于作为内参对ZFP TF和β-酮基酰基-ACP合成酶II mRNA的表达量进行标 准化。锌指结构蛋白TF mRNA的表达数据被用于证明在转化的愈伤组织中,至 少存在一种功能性的锌指结构蛋白TF转基因。

4.1愈伤组织样本的制备

Nex710胚轴组织转化后获得约40-50株8周大的欧洲油菜愈伤组织样品。它 们分别用上述实施例3.3中的ZFP TF构建体、pDAB4695、pDAB4696、 pDAB4697和pDAB4698转化。转化含pat基因表达盒(AtUbi10启动子v2::pat  v3::Atu ORF13’UTR v3)的对照二元构建体获得对照样品。所有样品收获前在 补充有Herbiace的细胞培养基中生长。

用凯杰RNeasy96试剂盒(加州瓦伦西亚的凯杰公司)从新鲜愈伤组织中制 备总RNA。用无RNA酶的DNA酶按照试剂盒说明处理RNA以移除任何基因组 DNA污染。按照III反转录酶(加利福尼亚州卡尔斯巴德的英杰公 司)生产商说明设置第一链合成并用随机六聚物作引物。合成的cDNA链在水中 以1:10和1:50稀释(这给PCR扩增多个靶标提供了足够的模板)。各等分试样 在-20℃长期保存。

4.2β-酮酰基-ACP合成酶II mRNA表达分析

β-酮酰基-ACP合成酶II cDNA扩增的qRT-PCR反应混合物按照如下设置: 7.5μL的2X LC480Probes Master缓冲液(罗氏诊断公司(Roche Diagnostics,印第 安纳州,印第安纳波利斯市)、从10μM母液中取0.3μL基因特异正向引物(SEQ  ID NO:28:5’-TTGACTCGAGCTGCTACTGC-3’;图8的比对中SEQ ID NO:3的 核苷酸位置544–563),从10μM母液中取0.3μL基因特异反向引物(SEQ ID NO: 29:5’-TTTCCATATCCATCGCAACA-3’;图8的比对中SEQ ID NO:3的核苷酸 位置588–607)、480Probes Master中的0.15μL UPL探针#25(罗氏 诊断公司,印第安纳州印第安纳波利斯市)、1.5μL的10%(w/v)聚乙烯吡咯烷酮- 40(PVP-40),和3.9μL水。UPL探针(罗氏诊断公司,美国印第安纳波利斯市) 是封闭核酸,因此比计算出的具有更高的Tm。操作标准品和未知物之前所有组 分放回冷冻器中。划分并标记384孔微板,每孔加入13.5μL反应混合物。用密 封箔轻轻封住所述微板。所述板在凯杰微板离心机中3,000rpm离心1分钟。加 入1.5μL解冻的稀释合成cDNA链。此外,1.5μL质粒DNA拷贝数标准品从最低 到最高浓度的稀释系列加入分别的孔,这些标准品与β-酮酰基-ACP合成酶II cDNA(从总mRNA合成)对比以定量拷贝数量。β-酮酰基-ACP合成酶II DNA拷 贝数量标准品稀释通过克隆靶扩增子到pCR2.1质粒中(英杰公司,加利福尼亚州 卡尔斯巴德)并制作用于定量拷贝数的稀释系列来制备。密封箔固定附在板上并 如上所述离心。PCR程序如下进行:i.活化95℃5分钟;ii.变性95℃10秒钟@ 4.8℃/秒种;iii.退火/延伸60℃25秒钟@2.5℃/秒钟;iv.补平72℃1秒种@ 4.8℃/秒钟;再重复步骤ii–iv,40-50次;冷却至38℃5秒钟.。DNA在实时PCR仪 LC480(印第安纳州印第安纳波利斯的罗氏公司)或等同物中扩增。扩增子大小为 64碱基对。本PCR试验中使用的正向和反向引物序列完美匹配两种β-酮酰基- ACP合成酶II基因靶标的相应序列,SEQ ID NO:3和30(图8)。因此,本试验 代表两种β-酮酰基-ACP合成酶II基因靶标的定量表达。

4.3微管mRNA表达分析

欧洲油菜天然基因微管基因(GenBank:AF258790和GenBank: DU106489),用作qRT-PCR试验的基因中精确标准化mRNA表达信号的参比标 准。用于β-酮酰基-ACP合成酶II qRT-PCR试验(描述于实施例4.1)的合成 cDNA还用于下述微管qRT-PCR试验。

qRT-PCR设置为:0.3μL基因特异性正向引物(SEQ ID NO:31:5’- ACAGCGATTGCCTACAAGG-3’)(10μM母液)和0.3μL基因特异反向引物(SEQ  ID NO:32:5’-AGATGGTTAAGATCACCAAAGG-3’)(10μM母液)、1.5μL10% (w/v)PVP-40、3.9μL水和7.5μL2X480SYBR Green I反应混合物 (印第安纳州印第安纳波利斯的罗氏公司)以检测和定量DNA。划分并标记384孔 微板,每孔加入13.5μL反应混合物。密封箔轻轻封住所述微板,所述板在凯杰 微板离心机中3,000rpm离心1分钟。移除密封箔并加入1.5μL解冻的稀释合成 cDNA链。此外,1.5μL质粒DNA拷贝数标准品从最低到最高浓度的稀释系列加 入分别的孔,这些标准品与微管cDNA(从总mRNA合成)对比以定量拷贝数量。 微管DNA拷贝数量标准品稀释通过克隆靶扩增子到pCR2.1质粒中(英杰公司, 加利福尼亚州卡尔斯巴德)并制作用于定量拷贝数的稀释系列来制备。密封箔固 定附在板上并如上所述离心。PCR程序如下进行:i.活化95℃10分钟;ii.变性 95℃10秒钟@4.8℃/秒种;iii.退火/延伸55.5℃20秒钟@2.5℃/秒钟;iv.补平 72℃20秒种@4.8℃/秒钟;步骤ii–iv再重复39次;vi.冷却至38℃5秒钟。DNA 在实时PCR仪LC480或等同物中扩增。307碱基对扩增子在本反应中扩增。该反 向引物跨越基于GenBank序列的78bp的内含子。因此,不利于基因组DNA扩增 的扩增子,并且基因组DNA污染物分子量较高,能容易地在琼脂糖凝胶中与 cDNA扩增子区分开。

4.4ZFP TF mRNA表达分析

ZFP TF mRNA的表达用最初合成用于β-酮酰基-ACP合成酶II mRNA(上述 实施例4.1)的cDNA样品定量。通过将引物锚定在opaque-2NLS序列的5’端和 VP16序列的3’端,用ZFP盒设计TaqMan PCR试验。PCR试验设置为:从10μM 母液取0.5μL正向引物“OP2_NLS_F1”(SEQ ID NO:33:5’- AAGGAAGAGGAAGGAGTCTAACAG-3’)、从10μM母液取0.5μL反向引物 “VP16_R1”(SEQ ID34:5’-CTTCTGCTCTCCACCGTA-3’)、从5μM母液取0.25 μL探针“VP16_MGB_185”(SEQ ID NO:45:5’–TTGATGGTGAAGATGT-3’)、 1.5μL10%(w/v)PVP-40、1.5μL10x热启动PCR缓冲液、1.0μL25mM MgCl2、 1.2μL dNTP(各2.5mM)、0.15μL热启动Taq聚合酶(加州瓦伦西亚的凯杰公 司)、和6.9μL水。用480(美国罗氏诊断公司)扩增混合物。划分并 标记384孔微板,每孔加入13.5μL反应混合物。密封箔轻轻封住所述微板,所 述板在凯杰微板离心机中3,000rpm离心1分钟。移除密封箔并加入1.5μL解冻的 稀释合成cDNA链。密封箔固定附在板上并如上所述离心。PCR程序如下进行:i. 活化95℃15分钟;ii.变性95℃20秒钟@4.8℃/秒种;iii.退火/延伸60℃20秒钟 @2.5℃/秒钟;iv.补平72℃55秒种@4.8℃/秒钟;步骤ii–iv再重复44次;vi.冷 却至38℃5秒钟。DNA在实时PCR仪LC480或等同物中扩增。扩增子大小为 775碱基对。用标准品系列测定ZFP TF cDNA/mRNA拷贝数,其中所述靶向扩增 子克隆到质粒中并如β-酮酰基-ACP合成酶II和微管实施例所述制备稀释系列用 于PCR测试。

4.5愈伤组织样品表达分析

在推定转化有ZFP TF并在选择培养基(参见实施例3)上生长的 8周大的转基因愈伤组织样品中检测ZFP TF mRNA表达。qRT-PCR试验测量的 ZFP TF定量mRNA表达仅在转化有含构建体的ZFP TF的样品中检测到,而含对 照构建体的样品中没有。该数据表明所述试验对ZFP TF表达特异,且对照愈伤 组织含有ZFP TF转基因。

根据qRT-PCR结果计算β-酮酰基-ACP合成酶II和微管mRNA表达之比,了 解愈伤组织样品之间的表达差异。转化有pDAB4695构建体的油菜愈伤组织样品 中观察到β-酮酰基-ACP合成酶II mRNA的最高mRNA上调(表4)。该27%上调 相对对照样品统计学上显著(p=0.05)。

表4:转化有不同ZFP TF构建体的欧洲油菜愈伤组织样品中的KASII mRNA表达

实施例5:转化的T0植物样品分析

5.1β-酮酰基-ACP合成酶II、微管和ZFP TF mRNA表达分析

含pDAB4695转基因构建体的T0油菜植物生长到6叶植物期,分析β-酮酰 基-ACP合成酶II内源基因、微管内源基因和ZFP TF转基因的mRNA表达。转基 因植物与转化含pat基因表达盒(AtUbi10启动子v2::pat v3::Atu ORF1 3’UTR  v3)的二元构建体的对照样品比较。标准尺寸纸打孔器打孔的各植物的6叶孔片 置于冰中,用凯杰96孔RNeasy RNA提取试剂盒根据生产商说明提取mRNA (加州瓦伦西亚凯杰)。用实施例4所述的实验方案完成β-酮酰基-ACP合成酶 II、微管和ZFP TF mRNA表达分析。

β-酮酰基-ACP合成酶II mRNA的表达在独立的转基因T0植物中不同。在 16个分析事件中观察到超过3倍的mRNA上调(图3)。所有植物均为ZFP TF 表达阳性。此外,用27个对照植物计算β-酮酰基-ACP合成酶II mRNA表达基 线。基线对照的β-酮酰基-ACP合成酶II mRNA表达均值与分别的ZFP TF植物事 件的β-酮酰基-ACP合成酶II mRNA表达作比较,计算表达增加的倍数(图3)。 这些植物生长成熟,收获T1种子。开花前,所有植物单独用自交袋覆盖以便于 植物中花的自花传粉。这些植物转移到温室后约4个月收集T1种子。

事件3、6和12.2(后文称为事件12)代表了不同β-酮酰基-ACP合成酶II  mRNA的表达范围,选用于后续研究。

实施例6:转化的T1植物样品分析

6.1T1种子的脂肪酸分析

每个事件在24单独T1种子中进行单一种子脂肪酸分析,以研究ZFP TF对 脂肪酸成分改变的影响(表5)。使用基于AOCS方法Ce2–66(97)的脂肪酸甲酯 (FAME)分析方法,表5中所有数目为总脂肪酸在油菜种子中的百分比。

表5:用FAME分析测量的单独T1种子的脂肪酸分布

对于样品制备,单独单一种子置于含1个1/8”钢珠(佛罗里达州迈阿密的SP 公司(Small Parts))的96孔提取板上标记的管组中。管子盖上盖,种子在 GenoGrinder研磨机(新泽西州梅塔钦的SPEX CP公司(SPEX CertiPrep))中以 1300撞击/分钟干燥碾碎3.0分钟。移去盖子,各孔加入0.6mL庚烷。孔再次加盖 并放回GenoGrinder研磨机上以1200撞击/分钟再研磨2.0分钟。然后移除样品并 在6℃3700rpm离心10.0分种。用贝克曼库尔特MC机器人将上清转移到带有玻 璃插件的96孔板中(乔治亚州苏文(Suwanee)的密克利公司(MicroLiter))。 将40μL1%甲醇钠加入样品。甲酸钠从30%的母液中用甲醇稀释(美国密苏里州 圣路易斯的Fluka/Sigma Aldrich公司)。用Teflon垫子盖住所述板,GC分析前 室温孵育4小时。

样品在装配有J&W科学公司的DB-23柱(15米x0.25mm ID柱和0.25μm 膜厚度)(加利福尼亚州佛森的J&W科学公司)的Agilent6890GC-FID(加利福尼 亚州圣克拉拉市的安捷伦技术公司(Agilent))上分析脂肪酸成分。初始烘箱温度为 200℃并在运行期间保持该温度。入口的分流比设为1:100,温度为280℃。起始 2分钟保持逐步的氦气流速0.8mL/分钟。然后流速以1.0mL/分钟到2.5mL/分钟 的速率增加,维持1.5分钟。检测器设为300℃,补充有恒定的载气,柱流速30 mL/分钟、燃料氢气流速30mL/分钟、和氧化剂流速400mL/分钟。2μL注射体积 用于所有样品。

通过与甲酯参比标准品(GLC#428,明尼苏达州伊利森的NCP公司(Nu- Chek-Prep))的保留时间比较用沃特斯公司(Waters Corp.)的Empower软件来鉴 定单独脂肪酸甲酯峰值。基于总体整合的色谱峰值面积,计算参比标准品中所有 分析物的单独百分比面积。还用庚烷空白鉴定GC上的任何污染。

T1种子与三种最低C16:0水平(其最可能为ZFP TF阳性植物)和三种最高 C16:0水平(其最可能为ZFP TF空转植物)的比较表明C16:0成分的变化可能是 由于ZFp TF转基因的分离(表5)。总C18(C18:0+C18:1+C18:2+C18:3)的 相应变化也在所有事件中观察到,低C16:0水平种子的总C18水平增加,反之亦 然。不管单独脂肪酸成分C18:0,C18:1,C18:2and C18:3的变化,这是由于转化的 Nex710基因型fad2和fad3突变基因的分离(Hu,X.,等Theor.Appl.Genet.2006, 113:497-507)。因此,进行下面的步骤鉴定各事件的T1分离群中ZFP TF阳性和 同胞空转植物,以检测相似基因背景下的脂肪酸分布变化。

6.2T1植物中ZFP TF的存在分析

筛选所有三种转基因事件3、6、12的100-150T1幼苗以鉴定ZFP TF阳性和 同胞空转植物(表6)。检测植物是否存在ZFP TF转基因的至少一种全长盒。根 据生产商推荐用凯杰植物DNeasy提取试剂盒(加州瓦伦西亚的凯杰公司)分离 这些植物叶片中的总基因组DNA。实验方案改良为在凯杰缓冲液AP1中添加 PVP-40到终浓度1%。纯化的gDNA用DNA定量实验方案(俄勒冈 州尤金的分子探针有限公司(Molecular Probes,Inc.,Eugene,OR))定量。在含有 下述试剂的PCR试验中分析DNA样品是否含有ZFP TF转基因的最小量,一个 全长拷贝:5μL10X EX Taq缓冲液(日本滋贺县大津的Takara生物公司)、5μL 10%聚乙烯吡咯烷酮-40、从10μM母液中取1.0μL ubi10正向引物(SEQ ID NO: 35:5’-GGTCAACGGATCAGGATATTCTTG-3’)、从10μM母液中取1.0μL AtuORF23反向引物(SEQ ID NO:36:5’-CCATGTTGGCAAAGGCAACC-3’)、4 uL dNTPs(各2.5mM)、0.2μL TaKaRa EX TaqTM热启动酶、31.8μL水和2μL浓 度为10ng/μL的DNA。PCR循环条件条件如下:94℃2分钟,10循环的降落 PCR:98℃10秒钟、65℃20秒钟、每循环温度降低0.5℃直到60℃,然后72℃ 3:00分钟。然后35循环的98℃10秒钟、60℃20秒钟和72℃3:00分钟以及最后 72℃延伸10分钟。用5μl的各反应在1%琼脂糖凝胶上跑胶,检测预期大小的 2662bp ZFP TF条带是否存在。

进行与ZFP TF在pDAB4695构建体中分子连接的pat基因的实时定量PCR 试验,并用于鉴定pat阳性和空转植物以证实其和与之分子连接的ZFP TF盒遗传 分离。

表6:在三个事件的T1分离群中鉴定ZFP TF阳性和同胞空植物

pat TaqMan RT-PCR试验的反应混合物由下述组成:3μL罗氏循环480II探针2X反应混合物、0.6μL10%PVP-40、从10μM母液中取0.2μL pat正向引物(SEQ ID NO:37:5’-ACAAGAGTGGATTGATGATCTAGAGAGGT- 3’)、从10μM母液中取0.2μL PAT反向引物(SEQ ID NO:38:5’- CTTTGATGCCTATGTGACACGTAAACAGT-3’)、从5μM母液中取0.2μL探针 (SEQ ID NO:39:5’-6FAM-CCAGCGTAAGCAATACCAGCCACAACACC-猝灭分 子-3’),且其与下述试剂复合用于HMG(GenBank:AF127919)的内部参比标准 品:从10μM母液中取0.2μL HMG正向引物(SEQ ID NO:40:5’- CCTCTCTACCACCGTCTCACATG-3’)、从10μM母液中取0.2μL HMG反向引 物(SEQ ID NO:41:5’-GATCTGGCCGGACTGTTTCA-3’)、从5μM母液中取 0.2μL探针(SEQ ID NO:42:5’-6FAM-CGCTCCTCAGCTACCACCTCAACCA-淬 灭分子-3’)、1μL DNA和0.2μL水。PCR循环条件条件如下:1循环的95℃5 分钟,40循环的95℃10秒钟、60℃40秒钟和72℃1秒钟。在罗氏480PCR机器中所有样品在384孔板中扩增三份以及1-4份拷贝的转基因基因组 DNA标准品。

基于各事件中ZFP TF阳性和空转植物的分离比,事件3、6和12分别含有约 2、1、和2个ZFP TF转基因插入到欧洲油菜基因组中(表6,第三列)。该数据 与所有三个事件中pat基因分离数据相符。

6.3β-酮酰基-ACP合成酶II mRNA在T1植物中上调

所有T1ZFP TF阳性和同胞空转植物示于表6,然后列3进行内源β-酮酰 基-ACP合成酶II基因、ZFP TF转基因和内源微管基因的mRNA表达分析。后者作 为参比基因标准化β-酮酰基-ACP合成酶II和ZFP TF基因表达。各6叶植物的6 叶孔片置于冰中用凯杰96孔试剂盒提取提取总RNA。按照实施例4.1 中所述完成cDNA链合成和稀释。

完成3个基因的合成cDNA的qRT-PCR分析。β-酮酰基-ACP合成酶II和 微管mRNA表达分析分别如实施例4.2和实施例4.3所述进行。改良ZFP TF试 验。PCR反应如下设置:反应条件如下:7.5μL2X LC480Probes Master缓冲液 (罗氏诊断公司,印第安纳州印第安纳波利斯市)、0.3μL基因特异正向引物#1 (SEQ ID NO:43:5’-TCGATCTTGATATGTTGGGAGA-3’)(10μM母液)、0.3μL 基因特异反向引物#2(SEQ ID NO:44:5’-AGGTGCAGAATCATGTGGTG-3’)(10 μM母液)、0.15μL UPL探针#85、1.5μL of10%(w/v)PVP-40、和3.9μL水。划 分384孔微板,并如上所述每孔加入13.5μL混合物。密封箔附在板上,以3000 rpm离心1分钟。移除膜并在每孔加入1.5μL解冻的稀释第一链。此外,cDNA链 加入分别的对照孔。用密封箔密封板并重复离心步骤。PCR程序按照下述条件进 行:i.活化95℃5分钟;ii.变性95℃10秒钟(@4.8℃/秒种);iii.退火/延伸 60℃25秒钟(@2.5℃/秒钟);iv.补平72℃1秒种(@4.8℃/秒钟);v.再重复 步骤ii–iv39-49次;vi.冷却至38℃5秒钟。

ZFP TF阳性样品的ZFP TF mRNA表达在事件6中最低,在事件3中最高 (图4)。空转植物不表达ZFP TF mRNA表明ZFP TF试验对ZFP TF转基因特 异。ZFP TF的靶标β-酮酰基-ACP合成酶II基因的mRNA水平在所有事件的 ZFP TF阳性植物中上调(图5)。通过逐对比较各事件中ZFP TF阳性和相应的 同胞空转植物观察到β-酮酰基-ACP合成酶II mRNA表达有多至3-4倍的增加。 β-酮酰基-ACP合成酶II mRNA水平的上调与各事件中ZFP TF mRNA表达水平的 增加有关(图4),即事件6中最低和事件3中最高。

6.4T1植物叶片的脂肪酸分析

收集第2组T1叶片样品用于脂肪酸分析,同时如实施例6.3中所述收集 mRNA分析样品。但是仅用1组样品分析仅表6中第4列所示的那些进展到成熟 的植物的脂肪酸。如下完成叶片材料的脂肪酸甲酯(FAME)分析。将10-100mg 叶片材料收集到冰上,然后冷冻干燥,然后用溶于无水甲醇的0.25M甲醇钠在 40℃进行20分钟转甲基反应。转甲基反应后,用含十七烷酸作为替代标准品的 庚烷溶液提取3次脂肪酸。干燥分离的己烷组分并用已知体积的庚烷重悬。用 SGE的BPX70毛细管柱(15m x0.25mm x0.25μm)通过GC-FID分析得到的脂肪酸 甲酯(FAME)。各FAME通过其保留时间鉴定并通过注射Matreya LLC的油菜籽 油参比混合物作为校准标准来定量。反应的完整性通过检测第4次萃取/衍生的内 源FAME的存在来确认。

在逐对比对各事件内ZFP TF阳性和相应的同胞空转植物中,所有3个事件都 显示总C16:0成分下降和总C18成分伴随上升(表7)。例如,与其自身同胞空 转植物相比,事件12ZFP TF阳性植物显示C16:0成分下降6.3%且总C18成分增 加1.44%。

表7:T1叶片脂肪酸分布

实施例7:转基因T2种子的ZFP TF分析

各事件内表现出最高β-酮酰基-ACP合成酶II mRNA表达的ZFP TF阳性植 物亚组和同胞空转植物进展到成熟,获得T2种子(表6,列4)。事件3是例 外,其中还进展了少量低表达范围的ZFP TF阳性植物。这些代表另一分离插入 pDAB4695转基因。各T1植物用滤袋覆盖以便在给定的植物中自花授粉。收获种 子并分析脂肪酸水平。

如实施例6.1中的T1种子分析所述在每株24个种子池中进行T2脂肪酸分 析。通过与对应的同胞空转植物逐对比较,结果显示所有3个事件中ZFP TF阳 性植物的C16:0成分下降(图8A和8B)。事件12、3和6的C16:0成分分别下 降12.6%、11.2%和22.3%。C16:1成分中也观察到一致的下降。ZFP TF阳性植物 与相应同胞空转植物相比观察到与C16:0和C16:1成分的下降相应的总C18 (C18:0+C18:1+C18:2+C18:3)成分的伴随增加。用JMP统计软件分析后,ZFP TF阳性和相应同胞空转植物的所有三种逐对比较在总C16(C16:0+C16:1)成分和 总C16/总C18成分的增加上统计上显著(p=<0.001)(图6,A和B)。尽管基 于同胞空转植物观察,3种事件的C16:0成分可变(表8A和8B),ZFP TF在将 C16:0成分降低到约相似水平中有效,约2.93-3.05。虽然事件3和12的所有 ZFP TF阳性植物产种子(表8和9),但事件6中仅一株ZFP TF产种子。基于 T1叶片脂肪酸数据,事件6的该具体植物的C16:0含量最高。表8A和8B显示 pDAB4695ZFP TF阳性的3个欧洲油菜转基因事件和相应同胞空转植物的T2脂 肪酸分布比较。该数据用FAME分析获得并描述于6.1部分。分析C12:0-C24:1 脂肪酸,主要的几个在这些表中显示。所有数目代表欧洲油菜种子中总脂肪酸的 百分比。

表8A:C16:0、C16:1、C18:0、C:18:1、C:18:2和C:18:3脂肪酸分析

表8B:C20:0、C20:1、C20:2、C22:0、C22:1、C24:0和C24:1的脂肪酸分析

表9显示基于表8A和8B所示的单独脂肪酸的总脂肪酸分布。

表9

*总C18代表下述碳之和:C18:0、C18:1、C18:2和C18:3。

**总LC或长链代表下述碳之和:总C18+总C20(C20:0+C20:1+C20:2)+ 总C22(C22:0+C22:1)+总C24(C24:0+C24:1)。

***总饱和脂肪酸代表表8A和8B中所示的所有饱和脂肪酸。

不同事件的ZFP TF阳性植物与同胞空转相比观察到所有长链脂肪酸(总 C18、总C20、总C22和总C24)增加0.4%-1.2%。较长链脂肪酸中,事件6的 ZFP TF阳性植物中可观察到C20:1增加约25%。所有事件中含ZFP TF植物中还 观察到总饱和脂肪酸成分降低。其从事件12中降低6%到事件6中降低31%。

总体而言,ZFP TF介导的β-酮酰基-ACP合成酶II基因在T0和T1植物中转 录上调,T2种子中总C16的伴随降低和总C18脂肪酸成分的增加作为示例。这些 数据表明新ZFP TF技术的成功应用于靶向和修饰脂肪酸生物合成途径中的特异 基因,在种子油分布中产生预期变化且在后代中可遗传。

实施例8-15:FatB上调/下调

高等植物中质体是新生脂肪酸生物合成的主要位置(Ohlrogge等,1979,Proc  Natl Acad Sci U S A76:1194-8;Thelen和Ohlrogge,2002,Metabolic Engineering 4:12-21)。质体中未利用的脂肪酸通过乙酰-ACP硫酯酶(FAT)的特异活性输出到胞 质中,所述特异活性通过水解乙酰-乙酰载体蛋白(乙酰-ACP)以释放游离脂肪 酸。植物中有两类FAT酶,FATA和FATB。FATA类优选体外18:1-ACP,而 FATB类优选饱和乙酰-ACP底物,例如16:0-ACP和18:0-ACP,但还显示其他异 质底物特异性(Doermann等,1995,Arch.Biochem.Biophys.316:612-618;Voelker等, 1997,Plant Physiology114:669-677;Salas和Ohlrogge,2002,Archives of  Biochemistry and Biophysics,403:25-34)。与FATA相似,认为FATB也存在于所有 植物组织中,但主要在正在发育的种子中表达(Jha等,2006,Plant Physiology and  Biochemistry44:645-655)。

拟南芥核基因组编码两种FatA基因和单一FatB基因。FatB活性的失活可显 著降低甘油脂类中的饱和脂肪酸成分。例如,插入T-DNA产生的FatB突变体 中,棕榈酸盐(16:0)和硬脂酸盐(18:0)成分根据组织分别降低42–56%和30 –50%(Bonaventure等,The Plant Cell,200315:1020-1033)。植物生长速率受到 该突变的显著影响,4周时与野生型相比湿重下降50%。该发现支持FatB作为主 要因子控制植物饱和脂肪酸率的发现。

主要油种作物欧洲油菜是双二倍体物种,与模式物种拟南芥关系紧密,但基 因组大小约比拟南芥大8倍。因此,在该物种中报道了6种FatB基因(WO 2009/007091),拟南芥中仅一种。这种复杂性使理解单独基因的操作功能变得困 难。相反,存在较多数量基因使针对所需脂肪酸目标的调控多基因表达变得容 易,而不是完全敲除一种。已知锌指转录因子结合基本任何DNA序列并调控靶向 基因的基因功能(Van Eenennaam等,Metab.Eng.20046:101-108;Sanchez等,2006, Plant Biotechnology Journal4:103-114)。因此,该工具可用于FatB基因以了解其 在欧洲油菜中的功能。该知识有助于针对饱和脂肪酸较低的需要“更健康”的油 菜种子油操作一种到多种FatB基因的表达。

下述实施例8-15表明欧洲油菜中FatB基因的转录上调,产生种子中脂肪酸 分布的变化。

实施例8:欧洲油菜中鉴定FatB基因的靶序列

8.1靶序列鉴定

用改良的基因组步移方法发现并表征欧洲油菜品种Nex710的FatB基因的启 动子序列。分离并鉴定这些核苷酸序列用于设计和生产ZFP TF,其可用于改良 FatB基因的基因表达。用克隆泰克(Clontech)基因组步移试剂盒(加州帕洛阿 尔托)构建9种基因组步移库。这些库用于获得FatB基因转录起始位置上游约 1kb序列。FatB基因特异巢式引物的正向对基于公开数据库可得的FatB EST序列 设计和合成。设计和合成巢式引物的反向对以与接头序列杂交。从9种库扩增多 重PCR片段。得到的PCR片段克隆到TOPO载体(美国加利福尼亚州卡尔斯巴 德的英杰公司)中并测序以鉴定FatB启动子序列。两种不同FatB基因FatB4和 FatB5基于该方法鉴定。发现尽管这些FatB基因的编码序列高度保守,5’UTR和 启动子区域序列有差异。

在正在发育的欧洲油菜种子中用定量RT-PCR分析FatB表达以及FatB4和 FatB5基因的定量,表明所述基因在欧洲油菜种子中高度表达。分离、定量总 RNA,并如实施例1所述对转录起始位置做图。应用这两种基因的启动子序列设 计ZFP TF用于转录表达修饰。

实施例9:设计对FatB基因特异的ZFP DNA结合结构域

锌指蛋白针对FatB基因中各种靶位置设计。代表性ZFP设计的靶位置和识 别螺旋示于表10A和10B。

表10A:FatB ZFP TF的靶向结合位置

表10B:ZFP识别螺旋区域

*大些字母代表ZFP结合序列而侧连的小写字母代表ZFP TF结合位置的侧连 序列内容。大写字母之间小写的斜体字代表ZFP设计中跳过的碱基。

**FatB4和FatB5之间的ZFP结合序列相同,但3’侧连序列在两种基因之间 不同。

***数字代表锌指(1是锌指1、2是锌指2等)。

实施例10:欧洲油菜中天然FatB基因的ZFP TF介导的上调

为了示例欧洲油菜细胞中FatB的ZFP TF介导的上调,构建含ZFP TF基因 的四种设计的构建体(表10和11),这些基因通过农杆菌介导的转化稳定递送 到欧洲油菜细胞中。

10.1构建体设计

设计并构建下述表11所列的ZFP TF二元质粒。ZFP TF基因的表达由相对强 的组成型启动子驱动,如衍生自木薯叶脉花叶病毒(CsVMV)启动子的启动子。如 实施例3.2所述进行农杆菌介导的植物转化以将ZFP TF稳定整合入欧洲油菜基因 组。

表11:靶向欧洲油菜FatB基因的ZFP TF构建体描述

pDAB4689是含有opaque-2(Op-2)核定位序列或NLS/13685/VP16和pat基 因表达盒的二元质粒。该构建体包括下述基因元件;RB7MAR v3(基质连接区 (Thompson等,1997,WO9727207))::CsVMV启动子v2(木薯叶脉花叶病毒启动子 (Verdaguer等,1996,Plant Molecular Biology31:1129-1139))::opaque-2NLS(Van  Eenennaam等,2004,Metabolic Engineering6:101-108;Holmes-Davis等,2005,Plant  Molecular Biology57:411-423)/13685锌指/VP16(Jamieson等,Biochem.Biophy.Res. Commun.2006,348:873-879)融合物::AtuORF23 3’UTR v1(根癌农杆菌开放阅读 框23,3’未翻译区域(Gelvin等,1987,EP222493))::AtUbi10启动子v2(拟南芥泛 素-10启动子(Callis,等,1990,J.Biol.Chem.265-12486-12493))::pat v5(草胺膦乙 酰转移酶基因(Wohlleben等,1988,Gene70:25-37))::AtuORF1 3’UTR v4(根癌农 杆菌开放阅读框1,3’未翻译区域(Huang等,J.Bacteriol.172:1814-1822))。通过 NcoI–SacI限制位点将含opaque-2NLS/13685锌指/VP16融合体的DNA片段克隆 到pDAB3912构建所述二元体。得到的构建体标记为pDAB8215,包含CsVMV 启动子v2::opaque-2NLS/13685锌指/VP16融合体::Atu ORF23 3’UTR v1基因 表达盒。用L-R反应(英杰公司,加利福尼亚州卡尔斯巴德)将 pDAB8215克隆到pDAB4668二元体中。该反应产生pDAB4689并通过限制性酶 切和测序反应证实。

pDAB4690是含有opaque-2NLS/13714/VP16和pat基因表达盒的二元质粒。 该构建体包含下述基因元件;RB7MAR v3::CsVMV启动子v2::opaque-2 NLS/13714锌指/VP16融合体::Atu ORF23 3’UTR v1::AtUbi10启动子v2::pat v5::AtuORF1 3’UTR v4。通过NcoI–SacI限制位点将含opaque-2NLS/13714锌 指/VP16融合体的DNA片段克隆到pDAB3912构建所述二元体。得到的构建体标 记为pDAB8216,包含CsVMV启动子v2::opaque-2NLS/13714锌指/VP16融合 体::Atu ORF23 3’UTR v1基因表达盒。用L-R反应(英杰公司,加利 福尼亚州卡尔斯巴德)将pDAB8216克隆到pDAB4668二元体中。该反应产生 pDAB4690并通过限制性酶切和测序反应证实。

pDAB4691是含有opaque-2NLS/13722/VP16和pat基因表达盒的二元质粒。 该构建体包含下述基因元件;RB7MAR v3::CsVMV启动子v2::opaque-2 NLS/13722锌指/VP16融合体::Atu ORF23 3’UTR v1::AtUbi10启动子v2::pat  v5(草胺膦乙酰转移酶基因)::AtuORF1 3’UTR v4。通过NcoI–SacI限制位点 将含opaque-2NLS/13722锌指/VP16融合体的DNA片段克隆到pDAB3912构建 所述二元体。得到的构建体标记为pDAB8217,包含CsVMV启动子v2::opaque- 2NLS/13722锌指/VP16融合体::Atu ORF23 3’UTR v1基因表达盒。用L-R 反应(英杰公司,加利福尼亚州卡尔斯巴德)将pDAB8217克隆到 pDAB4668二元体中。该反应产生pDAB4691并通过限制性酶切和测序反应证 实。

pDAB4692是含有opaque-2NLS/13743/VP16和pat基因表达盒的二元质粒。 该构建体包含下述基因元件;RB7MAR v3(基质连接区)::CsVMV启动子v2:: opaque-2NLS/13743锌指/VP16融合体::Atu ORF23 3’UTR v1::AtUbi10启动子 v2(拟南芥泛素-10启动子)::pat v5::AtuORF1 3’UTR v4。通过NcoI–SacI限 制位点将含opaque-2NLS/13743锌指/VP16融合体的DNA片段克隆到pDAB3912 构建所述二元体。得到的构建体标记为pDAB8218,包含CsVMV启动子v2:: opaque-2NLS/13743锌指/VP16融合体::Atu ORF23 3’UTR v1基因表达盒。用 L-R反应(英杰公司,加利福尼亚州卡尔斯巴德)将pDAB8218克隆到 pDAB4668二元体中。该反应产生pDAB4692并通过限制性酶切和测序反应证 实。

实施例11:分析转化的愈伤组织样品

用实施例3.2所述的农杆菌介导的植物转化通过转化4种ZFP TF构建体 pDAB4689–pDAB4692和对照构建体pDAB8210生产转基因欧洲油菜愈伤组织 系。对照构建体pDAB8210含pat基因表达盒(AtUbi10启动子/pat/AtuORF1 3’ UTR)和非靶向ZFN盒(CsVMV启动子/ZFN/AtuORF23 3’UTR)。如实施例4.1 所述从所有系中提取总RNA并合成cDNA。根据生产商说明,前述实施方案的改 良仅为用寡聚dT引物引导cDNA反应替代随机六聚体以及相应的cDNA反应的 改良。

11.1FatB4和FatB5mRNA表达分析

11.1.1欧洲油菜的FatB4实时定量PCR(qRT-PCR)试验

如下设置PCR混合物用于FatB4的cDNA扩增:每反应1.5μL10X热启动 PCR缓冲液(美国巴伦西亚的凯杰公司)、1.2μL of10mM dNTPs、1μL25mM MgCl2、0.15μL凯杰热启动Taq(5U/μL)、10μM母液中的0.5μL zz143FW引物 (SEQ ID NO:53:CTTTGAACGCTTATCTTCCTC)(10μM母液)、10μM母液中的 0.5μL FATB5_R4REV引物(SEQ ID NO:54:TTCCACAACATCTCCCCAAG)、 5μM母液中的0.25μL TaqMan MGB探针(加利福尼亚州卡尔斯巴德的生命技术 公司(Life Technologies))FatB4_MGB_Probe_4(SEQ ID NO:55:FAM- CTCAGGCTCCACCC)、1.5μL of10%(w/v)PVP-40)、和加H2O至13.5μL。适 当的四分384孔微板并每孔加入13.5μL反应混合物。然后密封箔轻轻封住所述 板。所述微板在凯杰微板离心机中3,000rpm离心1分钟。然后在合适的孔中加 入1.5μL解冻、稀释的第一链cDNA,然后在对照孔中加入DNA浓度从最低到 最高的1.5μL质粒cDNA标准品。最后,密封箔固定附在板上并离心。PCR程度 在480实时PCR系统(印第安纳州印第安纳波利斯市的罗氏诊 断公司)中运行,用下述程序:1)活化95℃15分钟;2)变性95℃20-30秒钟 (@4.8℃/秒种);3)退火60℃20-30秒钟(@2.5℃/秒钟);4)补平72℃45-60 秒种(@4.8℃/秒钟);再重复步骤2)-4),39-49次;5)冷却至38℃5秒钟停止反 应。

FatB4扩增子大小为678bp。基于基因组序列,上述序列跨越79bp内含子。 此外,设计反向引物跨越内含子,从而有利于仅特异扩增FatB4cDNA,并因此 消除基因组DNA扩增。

11.1.2欧洲油菜的FatB5qRT-PCR试验

如下设置PCR混合物用于FatB5的cDNA扩增:每个反应含1.5μL10X热启 动PCR缓冲液(美国巴伦西亚的凯杰公司)、1.2μL的10mM dNTPs、1μL25mM MgCl2、0.15μL凯杰热启动Taq(5U/μL)、10μM母液中的0.5μL zz145FW引物 (SEQ ID NO:56:CTTTGAAAGCTCATCTTCCTC)(10μM母液)、10μM母液中的 0.5μL FATB5_R4REV引物(SEQ ID NO:57:TTCCACAACATCTCCCCAAG)、 5μM母液中的0.25μL TaqMan MGB探针(加利福尼亚州卡尔斯巴德的生命技术 公司(Life Technologies))FatB5_MGB_Probe_1(SEQ ID NO:58:FAM- AACCTTCATCCTCCCA)、1.5μL of10%(w/v)PVP-40)、和加H2O至13.5μL。 剩下的试验和PCR循环说明如实施例11.1.1中的FatB4qRT-PCR试验所述。

产生的扩增子大小为678bp。基于基因组序列,上述cDNA序列跨越76bp 内含子。此外,设计反向引物跨越内含子,从而有利于扩增FatB5cDNA,并因 此消除基因组DNA扩增。

11.2微管蛋白mRNA表达分析

如实施例4.3所述测定完成本试验。

11.3ZFP TF mRNA表达分析

T0愈伤组织样品ZFP TF mRNA分析根据实施例4.4完成。基于每个设计中 的ZFP大小,本试验中的扩增子大小小于1Kb。用如下基于VP16活化结构域的 试验进行T0植物ZFP TF表达定量。如下设置VP16qRT-PCR混合物用于ZFP TF 的cDNA扩增:7.5μL480Probes Master2X缓冲液(美国印第 安纳州印第安纳波利斯市的罗氏诊断公司)、10μM母液中的0.3μL VP16_UPL_F1引物(SEQ ID NO:59:TCGATCTTGATATGTTGGGAGA)、10μM 母液中的0.3μL VP16_UPL_R1(SEQ ID NO:60: AGGTGCAGAATCATGTGGTG)、0.15μL UPL探针#85(美国印第安纳州印第安 纳波利斯市的罗氏诊断公司)、1.5μL of10%(w/v)PVP-40)、和加H2O到13.65 μL。适当的四分384孔微板并每孔加入13.5μL反应混合物。然后密封箔轻轻封 住所述板。所述微板在凯杰微板离心机中3000rpm离心1分钟。加入1.5μL解 冻、稀释的第一链cDNA,然后在对照孔中加入浓度从低到高的1.5μL质粒 cDNA标准品。密封箔固定附在板上并离心。PCR程度在480 实时PCR系统(印第安纳州印第安纳波利斯市的罗氏诊断公司)中运行,用下述 条件:1)活化95℃5分钟;2)变性95℃10秒钟(@4.8℃/秒种);3)退火60℃ 25秒钟(@2.5℃/秒钟);4)补平72℃1秒种(@4.8℃/秒钟);5)再重复步骤2 -4,39-49次。最后反应降至38℃5秒钟以停止反应。

VP16扩增子大小为68bp,该片段大小对应于PCR扩增预期产生的VP16片 段。

11.4愈伤组织样品表达分析

在选择培养基上生长的转基因愈伤组织系通过qRT-PCR分析 FatB4、FatB5、微管蛋白和ZFP TF的表达水平。微管蛋白基因作为参比基因标 准化FatB4、FatB5和ZFP TF mRNA的表达水平。计算FatB4/微管蛋白和 FatB5/微管蛋白之比用于标准化mRNA表达。结果显示构建体设计pDAB4691的 FatB4mRNA和FatB5mRNA上调统计上显著(p=0.005;图9)。pDAB4692愈伤 组织系显示FatB4和FatB5mRNA有上调趋势,但该趋势统计上不显著。还在分 别的实验中分析pDAB4689愈伤组织系,其显示上调趋势,但统计上不显著(数 据未显示)。对照细胞系没有扩增ZFP TF特异扩增子,证实ZFP TF试验仅对 ZFP TF表达系特异。

实施例12:转基因T0植物样品的表达分析

12.1欧洲油菜肌动蛋白试验用作qRT-PCR的内部对照

如实施例11所述从所有系中提取总RNA并合成cDNA。如下设置PCR混合 物用于肌动蛋白的cDNA扩增(Bo Yang等,2007,Plant Science173:156-171;肌动蛋 白基因Genbank登录号AF111812):7.5μL480SYBR Green I混 合物2X缓冲液,10μM母液的0.3μL BN_肌动蛋白_F引物(SEQ ID NO:61: ACGAGCTACCTGACGGACAAG),10μM母液的0.3μL BN_肌动蛋白_R(SEQ ID  NO:62:GAGCGACGGCTGGAAGAGTA),1.5μL10%(w/v)PVP-40),和q/s,用 H2O加至13.5μL。适当的四分384孔微板并每孔加入13.5μL反应混合物。然 后密封箔轻轻封住所述板。所述微板在凯杰微板离心机中3000rpm离心1分钟。 加入1.5μL解冻、稀释的第一链cDNA,然后在对照孔中加入浓度从低到高的1.5 μL cDNA标准品。密封箔固定附在板上并离心。PCR程度在480实时PCR系统(印第安纳州印第安纳波利斯市的罗氏诊断公司)中运行,用 下述条件:1)活化95℃10分钟;2)变性95℃10秒钟(@4.8℃/秒种);3)退火 60℃20秒钟(@2.5℃/秒钟);4)补平72℃20秒种(@4.8℃/秒钟);5)再重复 步骤2-4,39-49次。最后反应降至38℃5秒钟以停止反应。产生的扩增子大小为 80bp。

12.2FatB4和FatB5mRNA表达分析

分析用pDAB4689-pDAB4691转化的欧洲油菜植物的FatB4和FatB5mRNA 表达增加。此外,使用两种类型的对照。包括Nex710植物的非转基因对照用作 负对照。还分析转化有pDAB8210的欧洲油菜Nex710植物的第二转基因对照。 pDAB8210构建体设计由两种基因表达盒组成。pat基因表达盒(AtUbi10启动子:: pat基因::AtuORF1 3’UTR)和非靶向锌指核酸酶(ZFN)基因表达盒(AtUbi10启动 子::ZFN基因::AtuORF23 3’UTR)。pDAB8210中表达的ZFN没有预期结合并切 割欧洲油菜Nex710植物的基因组且不应改变这些植物的表型。

在选择培养基上生长的推定转基因愈伤组织再生为植物(实施 例3.3)。从温室里生长的6叶期欧洲油菜植物收集叶片样品用于mRNA表达分 析。分离各植物的6叶孔片并在RNA提取前置于冰中。用凯杰RNEASY试剂盒 提取总RNA。按照实施例11中所述完成cDNA合成和后续稀释。通过qRT-PCR 的FatB4和FatB5的表达分析实验方案如上所述。所述试验的ZFP TF表达分析 为正/负。肌动蛋白参比基因的qRT-PCR分析如上所述。

T0叶片FatB4和FatB5基因的表达在构建体之间不同(图10)。在 pDAB4691转基因植物事件中观察到最高的FatB4和FatB5mRNA上调,与 Nex710非转基因和pDAB8210转基因对照相比,其产生总共2.0–2.5倍的 mRNA表达增加。两种基因的表达与对照相比统计上显著(低于p=0.05)。因 此,所述构建体的其他特征在pDAB4691延续。

实施例13:转基因T1植物分析

13.1T1种子的脂肪酸分析

观察到事件pDAB4691-003-049.1(“事件49”)“低”和“高”油种子之间 的C18:0成分的显著差异(表12)。“低”类别种子的C18:0成分与Nex710(非 转基因对照)和pDAB8210(转基因对照)系相似。“高”种子中的C18:0成分与 ZFP TF表达关联,使FatB基因上调。基于C18:0流向较长链脂肪酸观察到 C20:0、C22:0和C24:0的一些增加。单独种子中的C16:0成分似乎在“低”或 “高”类别中没有变化。该结果表明pDAB4691ZFP TF结合并上调FatB基因对 C18:0-ACP到C18:0的酶反应特异而不是C16:0-ACP到C16:0的反应的(参见实 施例1,图1)。

表12:用FAME分析测量的单独T1种子的脂肪酸分布

*事件49和Nex710的24个单独T1种子和包括6事件的pDAB8210的144种 子上进行脂肪酸分析。“低”和“高”类别代表基于C18:0成分分选时的单独种子的 特异FA成分。

13.2T1植物中ZFP TF的存在分析

事件49的100个T1种子种在温室中。97株萌发成幼苗。用实施例6.2所述 的pat qRT-PCR试验评估分离自2-4叶期的植物材料的ZFP TF拷贝数。事件49 包含多重插入(约3次插入)和分离到T1群中的0-7pat基因和ZFP TF拷贝。从 T1群中仅鉴定到1株空转植物。

13.3T1植物中FatB4和FatB5mRNA上调

天然FatB基因表达分析在所有97株分离的T1群上进行。同时种植的非转基 因Nex710植物包括在研究中作为对照。收集每株植物的6叶孔片并置于冰上直 到完成RNA提取。用凯杰RNEASY试剂盒提取总RNA。按照实施例11中所述 完成cDNA合成和后续稀释。如上所述进行FatB4、FatB5、微管蛋白和VP16 (ZFP TF)的表达分析。

FatB4/FatB5和微管蛋白之比的统计分析显示与微管蛋白表达显著的线性趋势 (图11),表明FatB4/FatB5的增加与内源对照微管蛋白的增加不是1:1的关 系。因此,本分析不用该比例,且微管蛋白作为协变量包括在FatB4/FatB5的表 达模型中。为了移除微管蛋白和VP16(ZFP TF)之间的任何共线性,将模型方程的 发生率矩阵正交。

下述模型根据当前研究的所有数据组拟合:其中状态i是yijk的转基因状态 (转基因或空转/对照);

yijk=状态i+转基因*VP16+eijk

转基因*VP16是转基因系中VP16上的嵌套式线性回归;且eijk是随机余项。 给定各样品有三次重复测量,使用相关的余项结构:

其中In是鉴定矩阵,列数等于样品数且是重复检测余项之间的相关性。

事件49的分析结果中检测到FatB4显著上调,VP16上的FatB4表达的嵌套式 回归显示高度显著的正斜率(图12,表13)。对于FatB5嵌套式回归显示上调的 正斜率,且所述斜率统计上显著。对于上调事件,应注意转化和对照植物不形成 相同的线,所以可能有所述线和转化效应的一些混杂。

表13:上调事件结果

A转化对照=转化系和不携带转基因的系之间的最少均方表达的差异。转化 的*VP16=转基因系中FatB4/FatB5表达在VP16表达上的嵌套式回归。

随后事件49的T1植物基于FatB4/微管蛋白然后FatB5/微管蛋白表达比分 选,以找到表达最高的植物继续在温室中进展到T2代。选择8株最高表达FatB4 的植物进展到成熟。这些植物中有6株也最高表达FatB5。这些最高表达的植物 中ZFP TF的拷贝数从2-4份拷贝不等,而完整T1后代中分离的拷贝数是0-7份拷 贝。对于对照植物,事件49的一株空转植物和10株Nex710对照植物也进展到成 熟,收集T2种子。

13.4T2种子的脂肪酸分析

如实施例6.1中所述在所有植物的24个种子池中进行脂肪酸(FA)分析。一株 空转植物的FA分布与用于对照FA分布计算的10株Nex710对照植物组合。与 Nex710相比,事件49观察到C18:0成分平均增加12%(表14A和14B)。所述 增加统计上显著,p=0.05(图13)。长链FA如C20:0、C22:0和C24:0也显示 了一些增加,导致总饱和FA成分增加5%。由于FatB酶催化C18:0ACP转变为 C18:0游离FA,FatB4和FatB5转录上调会积累更多的C18:0(图1)。pDAB4691 (实施例6,表1和2)对FatB4和FatB5基因特异,其导致FA分布的显著改变(表 14A和14B)。

表14A:事件49转基因和Nex710对照样品的脂肪酸分布(C16:0、C16:1、 C18:0、C18:1、C18:2和C18:3)。

2列括号中的数字表示分析的植物数量。

表14B:事件49转基因和Nex710对照样品的脂肪酸分布(C20:0、C20:1、 C20:2、C22:0、C22:1、C24:2和C24:1)

2列括号中的数字表示分析的植物数量。

天然FatB4和FatB5基因上调没有观察到总C16成分的显著变化。可能是其 他FatB基因发生C16:0-ACP向C16:0的催化,而不是使用pDAB4691ZFP TF设 计的上调的示例性靶标FatB4和FatB5(图1)。

单独种子的C16:0成分似乎在T1种子的“低”和“高”类别中没有变化(表 12),表明pDAB4691ZFP TF设计更特异地结合FatB基因用于C18:0-ACP向 C18:0的酶反应而不是C16:0-ACP向C16:0的反应(图1)。

应注意ZFP TF诱导的天然β-酮酰基-ACP合成酶II基因的上调(实施例1- 6)引起相较天然FatB4和FatB5基因上调的FA分布的不同变化。例如,相较其 空转分离体,β-酮酰基-ACP合成酶II基因上调引起C16:0和C16:1成分统计上 显著的下降以及总C18成分的伴随上升(实施例6,图6,表5和8)。相应地, ZFP-TF介导的FatB基因上调引起C18:0的统计上显著上升,但C16:0成分没有 明显变化(图14)。同样,通过ZFP TF介导的β-酮酰基-ACP合成酶II和FatB 基因上调的FA分布的这些变化经FA生物合成途径同时发生(图1)。

实施例14:植物转化的ZFP TF构建体设计

设计并构建4种构建体用于欧洲油菜中FatB基因的转录下调(表15)。使 用最佳的FatB上调ZFP设计13722和13714说明FatB下调(实施例9-13)。这 些ZFP设计与opaque-2核酸定位信号和由KRAB1(Hanna-Rose和Hansen,1996, Trends in Genetics,12:229-234)或NtERF3(Ohta等,The Plant Cell,2001,13:1959- 1968)组成的抑制结构域融合以构建功能性ZFP TF。所有ZFP TF在种子特异启动 子下表达;使用拟南芥脂转移蛋白2启动子(AtLTP170启动子)(Genbank ID: NC_003076)或菜豆(Phaseolus vulgaris)的β-菜豆蛋白启动子(PvPhas启动 子)(美国专利号No.5,591,605)。

表15:用于FatB基因靶向下调的ZFP TF构建体细节

*Op-2=Opaque-2核定位信号

pDAB5203是含有opaque-2NLS/13722/KRAB1和pat基因表达盒的二元质 粒。该构建体包含下述基因元件;AtLTP启动子170::opaque-2NLS/13722锌指 /KRAB1融合体::AtuORF23 3’UTR v1::AtUbi10启动子v2::pat v5::AtuORF1 3’UTR v4。将含opaque-2NLS/13722锌指/KRAB1融合体的DNA片段克隆到 Gateway供体载体中构建所述二元体。得到的构建体包含AtLTP启动子170:: opaque-2NLS/13722锌指/KRAB1融合体::Atu ORF23 3’UTR v1基因表达盒。 用L-R反应(英杰公司,加利福尼亚州卡尔斯巴德)将所述构建体克隆 到二元体中。该反应产生pDAS5203并通过限制性酶切和测序反应证实。

pDAB5204是含有opaque-2NLS/13714/KRAB1和pat基因表达盒的二元质 粒。该构建体包含下述基因元件;AtLTP启动子170::opaque-2NLS/13714锌指 /KRAB1融合体::AtuORF23 3’UTR v1::AtUbi10启动子v2::pat v5::AtuORF1 3’UTR v4。将含opaque-2NLS/13714锌指/KRAB1融合体的DNA片段克隆到 Gateway供体载体中构建所述二元体。得到的构建体包含AtLTP启动子170:: opaque-2NLS/13714锌指/KRAB1融合体::Atu ORF23 3’UTR v1基因表达盒。 用L-R反应(英杰公司,加利福尼亚州卡尔斯巴德)将所述构建体克隆 到二元体中。该反应产生pDAS5204并通过限制性酶切和测序反应证实。

pDAB5212是含有opaque-2NLS/13722/KRAB1和pat基因表达盒的二元质 粒。该构建体包含下述基因元件;PvPhas启动子::opaque-2NLS/13722锌指 /KRAB1融合体::AtuORF23 3’UTR v1::AtUbi10启动子v2::pat v5::AtuORF1 3’UTR v4。将含opaque-2NLS/13722锌指/KRAB1融合体的DNA片段克隆到 Gateway供体载体中构建所述二元体。得到的构建体包含PvPhas启动子:: opaque-2NLS/13722锌指/KRAB1融合体::Atu ORF23 3’UTR v1基因表达盒。 用L-R反应(英杰公司,加利福尼亚州卡尔斯巴德)将所述构建体克隆 到二元体中。该反应产生pDAS5212并通过限制性酶切和测序反应证实。

pDAB5227是含有opaque-2NLS/13722/NtERF3和pat基因表达盒的二元质 粒。该构建体包含下述基因元件;RB7MAR v3::AtLTP启动子170::opaque-2 NLS/13722锌指/NtERF3融合体::Atu ORF23 3’UTR v1::AtUbi10启动子v2:: pat v5::AtuORF1 3’UTR v4。将含opaque-2NLS/13722锌指/NtERF3融合体的 DNA片段克隆到Gateway供体载体中构建所述二元体。得到的构建体包含AtLTP 启动子170::opaque-2NLS/13722锌指/NtERF3融合体::Atu ORF23 3’UTR v1基 因表达盒。用L-R反应(英杰公司,加利福尼亚州卡尔斯巴德)将所述 构建体克隆到二元体中。该反应产生pDAS5227并通过限制性酶切和测序反应证 实。

所述构建体通过农杆菌介导的胚轴外植体转化稳定转化到欧洲油菜品种 Nex710中(实施例3.2–3.3)。生长在温室中的T0植物自花授粉并在移植4个月后 收集T1种子。

实施例15:4ZFP TF构建体转基因的T1种子分析

分别从构建体pDAS5203、pDAS5204、pDAS5212和pDAS5227的转基因事 件(系)8、20、37和15获取T1种子。5个Nex710植物种子用作对照。如前述 实施例6.1,各T1转基因事件的24个单独种子上进行FA分析以先鉴定更有效改 变FA分布的ZFP TF构建体。

15.1T1种子的脂肪酸(FA)分析

构建体pDAS5203、pDAS5212和pDAS5227产生相较对照Nex710有最低总 饱和FA分布的转基因事件(表16)。两个构建体事件pDAS5203和pDAS5212 以及Nex710对照中每个之间的逐对差异显著(p=<0.005)。然而,pDAS5227的 逐对差异表现出强的趋势(p=0.06)。相较Nex710对照中6.38%的均值, pDAS5203的事件之一含的饱和FA成分总量最少为5.3%(未显示)。总饱和FA 下降了17%。

表16A:多构建体转基因事件的T1种子FA

*括号中的数字显示分析中包括的事件数量。

**p值等于或小于0.05被认为是统计上显著并用JMP软件计算。

表16B:多构建体转基因事件的T1种子FA

*括号中的数字显示分析中包括的事件数量。

**p值等于或小于0.05被认为是统计上显著并用JMP软件计算。

事件pDAS5203、pDAS5212和pDAS5227的特异FA分布导致C18:0相较 Nex710下降21-25%(图15A)。所有这些差异均为统计上显著,等于或小于p= 0.001(表16)。其他长链FA,C20:0、C22:0和C24:0也显示浓度下降。然而, 所有三种构建体转基因事件中没有观察到导致C16:0/C18:0成分显著增加的C16:0 成分变化(图165B)。

pDAS5227转基因种子的FA分布显示出相较pDAS5203和pDAS5212的明显 差异。相较Nex710,pDAS5227种子中观察到C14:0减少23%(p=0.002)和 C16:1增加19%(p=0.01)(图16A和B,表16)。pDAS5227ZFP TF设计与 pDAS5203和pDAS5212相同,除了存在融合ZFP的ERF3下调结构域而非 KRAB1结构域(表15)。

pDAS5204中的不同ZFP设计13714在降低C18:0方面没有13722设计有效 (表16)。不同于FatB4和FatB5基因都结合的13722设计,13714设计仅结合 FatB5基因(实施例9,表10B)。

15.2植物mRNA分析的鉴定

选择通过转化构建体pDAS5212和pDAS5227分别产生的两个转基因事件 5212[1]-004和5227[4]-012用于FatB5转录下调分析。50-100个T1种子种在温室 中生长。2-3叶期时从植物中收集4叶孔片。用pat qRT-PCR试验分析该植物材料 的ZFP TF拷贝数目(实施例6.2)。然后选择随机的ZFP空转和ZFP阳性植物 用于进展成熟以收集T2种子(表17)。开花后(DAF)25天收集相同植物中未 成熟的豆荚用于FatB mRNA分析。两个事件都分离为单一拷贝。这些事件标记 为5212-4和5227-12。

表17:用于鉴定ZFP阳性和空转植物的转基因事件筛选

*NT=未测试

15.3RNA提取和qRT-PCR试验开发

用获自凯杰公司的(加州瓦伦西亚)植物试剂盒从未成熟芸苔 属(Brassica)种子中分离RNA。种子置于含RLT缓冲液(凯杰)/β-巯基乙醇 (BME)和不锈钢珠的管组中。样品放在管组架上并在球磨器(加州维塞利亚的克 勒空公司(Kleco))中在500振荡/分钟下均质5分钟.管架转180度并再均质5 分钟。然后样品转移到1.5ml EP管中并20,000x g离心5分钟,上清转移到新管 中。如生产商实验方案(加州瓦伦西亚的凯杰公司)所述分离RNA。用50uL无 RNA酶的水从柱上洗脱RNA并用塞摩费舍尔公司(Thermo Fisher)(特拉华州威尔 明顿)的NanoDrop8000.定量RNA样品。

10-20微克的RNA用TURBO无DNA(目录号AM1907;加利福尼亚州福斯特 城的应用生物系统公司(Applied Biosystems))的DNA酶在1.5ml无RNA酶 /DNA酶管中处理以移除基因组DNA。对各RNA样品制备含RNA、1X DNA酶 缓冲液和2单位TURBO DNA酶的50微升反应。反应37℃孵育30分钟。各管 加入5微升(5μl)DNA酶失活剂并混合。样品室温孵育3分钟,再次混合,并在室 温下再孵育2分钟。样品20,000xg离心5分钟。移除40微升(40μl)上清,留下 DNA酶失活浆料。各DNA酶处理的样品用Nanodrop定量从而等量的RNA可用 于cDNA合成。

用cDNA高容量试剂盒(美国加利福尼亚州福斯特城的应用生物系统公司) 制备各RNA样品的互补DNA(cDNA)。简单的说,用1.5μg RNA作为50微升 反应的模板,所述反应含有1X反向转录缓冲液、1X dNTPs、1X随机低聚物、和 125单位的Multiscribe反转录酶。此外,用1.5μg DNA酶处理的RNA在如上相 同条件下制备各非RT(noRT)对照反应而不用Multiscribe反转录酶。所有样品 25℃孵育10分钟、37℃2小时、85℃5分钟,4℃过夜。

FATB、KASII、ERF3、KRAB1和微管的引物和探针用应用生物系统公司(加 利福尼亚州福斯特城)的引物表达3(Primer Express3)软件设计。由集成DNA 技术公司合成引物(爱荷华州克拉威尔)。下述是用于引物的序列:

SEQ ID NO:63:FATB5fwd–5’TCGCTGCCATAACAACCATTT3’;

SEQ ID NO:64:FATB5rev–5’CGCCTGGGTTTCCAGTCA3’;

SEQ ID NO:65:KRAB1fwd–5’AAGGATGTGTTCGTGGATTTCA3’;

SEQ ID NO:66:KRAB1rev–5’CACAATCTGCTGTGCAGTATCAAG3’;

SEQ ID NO:67:ERF3fwd–5’GCGGGCGGGAGTTGTTA3’;

SEQ ID NO:68:ERF3rev–5’CCCCATCGGCGTTACATG3’;

SEQ ID NO:69:微管fwd–5’GAAGCTGAGAACAGCGATTGC3’;

SEQ ID NO:70:微管rev–5’GTTCCTCCTCCCAACGAATG3’.

探针为应用生物系统公司(加利福尼亚州福斯特城)合成的6FAM/MGB:

SEQ ID NO:71:FATB5探针6FAM TTTCTCAGCCGCCA;

SEQ ID NO:72:KRAB1探针6FAM TAGGGAAGAGTGGAAGCT;

SEQ ID NO:73:ERF3探针6FAM CAGGCCTCAGCCTT;和

SEQ ID NO:74:微管探针6FAM TACAAGGTTTCCAAGTTT.

FatB、ERF3、KRAB1和微管的基因表达用应用生物系统公司的7900HT(加 利福尼亚州福斯特城)通过实时PCR评估。用不同组内等分的数种cDNA样品制 备标准曲线以建立动态范围和试验效率。制备初始稀释液的后续1:5和1:4系列稀 释。各cDNA样品用10mM Tris,pH7.5 1:50稀释。在20微升体积中制备PCR反 应,含有1X基因表达反应混合物(Gene Expression Master Mix)(加利福尼亚州 福斯特城的应用生物系统公司)、0.8μM正向和反向引物、0.2μM基因特异的 6FAM/MGB探针和4微升稀释的cDNA。所有反应在具有SDS2.4版软件的应用 生物系统7900HT中于下述条件下运行:步骤1)50℃2分钟;步骤2)95℃10分 钟;步骤3)95℃15秒钟,和;步骤4)60℃1分钟。步骤3和4再重复39次。微 管蛋白基因表达在各板上评估,而FatB、ERF3、和KRAB1分别运行。所有反应 进行三次。

根据需要计算标准曲线的回归和斜率和端值。非RT样品(没有反转录酶的对 照,含有RNA和所有cDNA反应组分除了反转录酶)与相应的样品比较以确保存 在5-7的Ct差异。所述数据输入Excel用于分析。FatB、ERF3、和KRAB1的平 均量值根据微管蛋白的平均量标准化并报道为FatB和微管蛋白的表达比。

15.4未成熟种子中种子特异的FatB5mRNA下调分析

结果显示未成熟种子中开花后(DAF)25天的FatB mRNA下调取决于T1植物 的结合子状态。例如,5227-12未成熟种子的杂合植物中(1拷贝)没有观察到明 显的FatB5mRNA下调(图17)。然而,当纯合植物(2拷贝)的ZFP TF表达 增加到2倍时,观察到FatB5mRNA表达下降21%(p=0.025)。不同构建体 pDAS5212的另一事件5212-4获得相似的结果。该事件中,杂合植物中没有观察 到明显的FatB5下调(图18)。然而,当ZFP TF表达增加时,纯合植物中观察 到FatB5转录下降了15%。

两种事件的空、杂合和纯合植物都进展到成熟,并在各植物的24种子池中测 定FA分布。从含ZFP TF的谱系中分离空转谱系的过程允许FA分布差异,这更 紧密的反映了ZFP TF的存在。

15.4T2成熟种子中FA分布的分析

基于事件5227-12的T1亲本植物的ZFP TF结合子状态,T2成熟种子的FA 分布不同(表18A和18B)。尽管25DAF未成熟种子的杂合T1植物不显示任何 明显的FatB mRNA下调,其种子FA分布显示C18:0含量下降8%。没有观察到 C16:0成分显著下降。此外,观察到C18:1(油酸)的较少增加和FA的后续下调, 这使总饱和FA总体下降5.5%(表18A和18B,图19)。5227-12T1植物是ZFP TF纯合时,FatB mRNA显著下调。这些T2种子的FA分布不同。观察到C16:1 成分增加11%,这使总饱和FA下降2.7%(表18A和18B)。然而,相较杂合植 物没有观察到C18:0进一步下降。这些变化和T1成熟种子FA分布(实施例 15.1)同时。

表18A:显示事件5227-12的T2成熟种子的FA分布

表18B:事件5227-12的T2成熟种子的FA分布

植物ID 拷贝数 总饱和脂肪酸 C20:0 C20:1 C20:2 C22:0 C24:0 C24:1 5227-12均值(n=4) 0 7.21 0.64 1.01 0.04 0.27 0.13 0.09 5227-12标准差(n=4) 0 0.21 0.03 0.02 0.01 0.01 0.03 0.01 5227-12均值(n=3) 1 6.84 0.62 1.07 0.04 0.28 0.12 0.09 5227-12标准差(n=3) 1 0.33 0.02 0.11 0.00 0.03 0.02 0.01 5227-12均值(n=4) 2 7.00 0.62 1.06 0.04 0.27 0.12 0.08 5227-12标准差(n=4) 2 0.29 0.09 0.03 0.01 0.03 0.03 0.01

事件5212-4的T2成熟种子FA分布中获得相似结果。杂合植物种子中,观察 到C18:0成分下降5.5%,使总饱和FA下降了3.2%(表18,图20)。观察到 C18:1少量增加;而剩下的FA浓度显示少量降低。纯合植物相较半合子植物没有 显示C18:0成分的较多降低,尽管FatB mRNA有显著下调。

总之,已在这些实施例中证明用种子特异的ZFP TF表达使FatB5基因转录 下调。ZFP TF在赋予T2纯合种子中靶标FatB5基因的转录下调中有效。然而, T2纯合种子中C18:0的下调没有T2分离种子的多。这些结果表明纯合ZFP TF拷 贝可启动调整FA分布的反馈机制,因为FatB基因为植物生长和发育所必需 (Bonaventure等,The Plant Cell,200315:1020-1033)。值得注意的是,未成熟种 子中ZFP TF介导的FatB mRNA下调与FatB上调对C18:0成分的改变逆相关。

这些实施例显示ZFP TF对天然FatB基因的靶向效应特异改变FatB mRNA 含量,因此产生欧洲油菜中特异且可遗传的FA分布变化。

表19A:不同接合子水平的事件5212-4T2种子的FA分布

表19B:不同接合子水平的事件5212-4T2种子的FA分布

本文所述所有专利、专利申请和发表物通过引用全文纳入本文以用于所有目 的。

尽管出于理解清楚的目的,本发明通过说明和示例的方式提供了一些细节, 本领域技术人员显然理解可进行各种改变和改进而不偏离本发明的主旨或范围。 因此,上述说明和实施例不应理解为限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号