首页> 中国专利> 植物细胞中草甘膦抗性编码核酸分子的优化表达

植物细胞中草甘膦抗性编码核酸分子的优化表达

摘要

提供了一种可提供对草甘膦的抗性的编码5-烯醇丙酮酰-3-磷酸莽草酸合酶(EPSPS)的核酸分子,所述核酸分子已被优化用于在单子叶植物和双子叶植物中尤其是在大豆中表达。还提供了使用方法。

著录项

  • 公开/公告号CN103562392A

    专利类型发明专利

  • 公开/公告日2014-02-05

    原文格式PDF

  • 申请/专利权人 MS技术有限责任公司;

    申请/专利号CN201180066871.8

  • 申请日2011-11-23

  • 分类号C12N15/82;A01H5/00;

  • 代理机构北京北翔知识产权代理有限公司;

  • 代理人张广育

  • 地址 美国爱荷华州

  • 入库时间 2024-02-19 22:53:23

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-07-20

    授权

    授权

  • 2014-03-12

    实质审查的生效 IPC(主分类):C12N15/82 申请日:20111123

    实质审查的生效

  • 2014-02-05

    公开

    公开

说明书

相关申请的引用

本申请要求先前提交的共同未决临时申请USSN61/419,703的优先 权,所述临时申请的内容以引用的方式全文纳入本文。

序列表

本申请包括已通过EFS-Web以ASCII格式提交的序列表,并特此以 引用的方式全文纳入本文。所述ASCII复本,创建于2011年11月22日, 名称为210007PCT.txt,大小为26,865字节。

背景技术

草甘膦(N-膦酰甲基甘氨酸)是除草剂中广泛使用的组分。草甘膦 抑制5-烯醇丙酮酰-3-磷酸莽草酸合酶(EPSP合酶或EPSPS)。5-烯醇丙 酮酰-3-磷酸莽草酸合酶参与植物细胞中芳香族氨基酸的合成。抑制 EPSPS可有效地破坏蛋白质合成,从而杀死受影响的植物细胞。因为草 甘膦是非选择性的,它既杀死杂草又杀死农作物。因此,改进农作物使其 抗草甘膦以使得所需的植物在暴露于草甘膦后继续存活对农作物是有用 的。

重组DNA技术已被用于分离抗草甘膦的突变型EPSP合酶。可将这 种抗草甘膦的突变型EPSP合酶转化到植物中并将草甘膦抗性赋予转化 的植物。作为实例,如美国专利5,633,435所述,从土壤杆菌属 (Agrobacterium)菌株CP4中分离出了耐草甘膦基因。全长玉米EPSPS 基因在美国专利7,045,684中描述。其进入至叶绿体并切割叶绿体转运肽, 生成成熟EPSPS。参见Herouet-Guicheney et al.(2009)“Safety evaluation  of the double mutant5-enolypyruvylshikimate-3-phosphate synthase  (2mEPSPS)from maize that confers tolerance to glyphosate herbicide in  transgenic plants”Regulatory Toxicology and Pharmacology,Vol.54, Issue2,pp143-153。该参考文献和引用的全部参考文献均以引用的方式 纳入本文。

已经通过引入突变产生了其他耐草甘膦基因。这些基因包括由Comai 分离且在美国专利5,094,945、4,769,061和4,535,060中描述的基因。如 5,310,667所述,已通过将80位和120位之间的甘氨酸残基置换为丙氨酸 残基而使用单突变体。双重突变体也在美国专利6,225,114和5,866,775描 述,其中除了上述突变以外,将第二突变(苏氨酸残基置换在170位和 210位之间的丙氨酸残基)引入至野生型EPSPS基因中。

其他工作通过引入携带位于以下位置的突变的修饰的玉米EPSPS基 因产生了双重突变型EPSPS玉米:由GenBank登记号X63374的序列编 码的氨基酸序列中的102位残基(从苏氨酸变为异亮氨酸)和106位残基 (从脯氨酸变为丝氨酸),所述修饰的玉米EPSPS基因在美国专利 6,566,587和6,040,497中描述,所述美国专利均以引用的方式全文纳入本 文。

发明内容

本发明涉及一种密码子优化的修饰的EPSPS序列,当在植物中表 达时,该序列可赋予对草甘膦除草剂的抗性或耐受性。所述核苷酸序 列被优化用于在植物中表达,优选用于在双子叶植物和单子叶植物中 表达,最优选用于在大豆(Glycine max)植物中表达。所编码的氨基 酸与野生型EPSPS多肽相比包括两个突变:与野生型玉米(Zea mays) EPSPS多肽相比,在相应的102位残基上苏氨酸成异亮氨酸和在相应 的106位残基上脯氨酸成丝氨酸。

附图说明

图1为Genbank登录号X63374中列出的序列,该序列是编码在进 入并切除优化的叶绿体转运肽之后的预测成熟玉米EPSPS序列的野生型 玉米(Zea mays)EPSPS核苷酸序列,该序列为SEQ ID NO:1;在所述 核苷酸序列下面标出预测成熟玉米EPSPS的编码氨基酸序列,为SEQ ID  NO:2。残基102和残基106为下划线粗体;在蛋白的102位上以异亮氨 酸置换苏氨酸和106位上以丝氨酸置换脯氨酸的蛋白是双重突变型玉米 EPSPS蛋白(2mEPSPS),为SEQ ID NO:3。图1公开了如SEQ ID NO: 6的包括“atg”起始密码子的全长序列。

图2示出双重突变型玉米EPSPS基因(2mEPSPS v1)的核苷酸序列, 为SEQ ID NO:4。ATG起始密码子位点为斜体。

图3示出优化的双重突变型玉米EPSPS基因(2mEPSPS v2)核酸分 子,为SEQ ID NO:5。图3公开了如SEQ ID NO:7的包括“atg”起始密码 子的全长序列。

图4A-B示出玉米2mEPSPS v1核酸分子(SEQ ID NO:4)和优化的 DMMG核酸分子(2mEPSPS v2,SEQ ID NO:7)的比对。

图5为构建体pDAB8291的质粒图。

图6为表达2mEPSPS v2的第一事件的蛋白质印迹。

图7为表达2mEPSPS v2的第二事件的蛋白质印迹。

序列说明

SEQ ID NO:1:为X63374玉米EPSPS野生型核苷酸序列(编码推 测的成熟野生型EPSPS)。

SEQ ID NO:2:为自X63374的推测的成熟野生型EPSPS氨基酸序 列。

SEQ ID NO:3:为推测的2mEPSPS双重突变型氨基酸序列。

SEQ ID NO:4:为编码双重突变型2mEPSPS的玉米天然序列核苷酸 序列2mEPSPS v1。

SEQ ID NO:5:为编码双重突变型2mEPSPS的单子叶植物优化的核 苷酸序列2mEPSPS v2。

SEQ ID NO:6:为包括ATG起始密码子的野生型EPSPS核苷酸序列。

SEQ ID NO:7:为包括ATG起始密码子的编码双重突变型2mEPSPS 的优化的核苷酸序列2mEPSPS v2。

具体实施方式

为了获得异源基因在植物中的高表达,优选重新设计所述基因从而使 它们在植物细胞中更有效地表达,当需要单子叶植物基因既在双子叶植物 细胞又在单子叶植物细胞中表达时,尤其优选如此。已分离出编码5-烯 醇丙酮酰-3-磷酸莽草酸合酶(EPSPS)的野生型基因,编码在进入并切 割优化的叶绿体转运肽之后的推测成熟玉米EPSPS序列的玉米核苷酸序 列可见于GenBank登录号X63374,也示于美国专利6,566,587(其中具 体为序列识别号3),所述美国专利以引用的方式全文纳入本文。在本文 中,所述序列为SEQ ID NO:1,也示于图1中。在图1中,野生型EPSPS 核苷酸序列下面标出所编码的野生型氨基酸序列,为SEQ ID NO:2。草 甘膦(N-膦酰甲基甘氨酸)是除草剂中广泛使用的组分。草甘膦抑制 EPSPS,其参与植物细胞中芳香族氨基酸的合成。抑制EPSPS可有效地 破坏蛋白质合成,从而杀死受影响的植物细胞。提供抗草甘膦的植物或植 物细胞在多种应用中是有用的,其中具有所述抗性的植物细胞可对草甘膦 暴露耐受。当在植物细胞中表达时,对野生型植物EPSPS核苷酸序列的 修饰可提供这种抗性。参照图1,并且如‘587专利中所述,当比较EPSPS 多肽和图1的野生型多肽时,所述蛋白质102位上以异亮氨酸置换苏氨酸 和106位上以丝氨酸置换脯氨酸的修饰(所述两个位置在图1中都以下划 线黑体示出)可得到双重突变型EPSPS多肽(2mEPSPS),在本文中为 SEQ ID NO:3。当与合适的叶绿体转运肽一起在植物细胞中表达时,它在 进入叶绿体中并加工为成熟的酶形式之后可提供对草甘膦的耐受性(图 1)。

在本文中,用于在单子叶植物和双子叶植物中表达相同的2mEPSPS 蛋白的基因2mEPSPS v2的设计被显示,为了优化的表达而重新设计该基 因的蛋白编码区。本文描述了编码5-烯醇丙酮酰-3-磷酸莽草酸合酶 (EPSP合酶或EPSPS)多肽的优化的核苷酸序列,所述优化的多肽由野 生型EPSPS修饰而来。

1338碱基对的来自玉米的双重突变型核苷酸序列示于图2示出,为 SEQ ID NO:4。该修饰的核苷酸序列被称为双重突变型玉米基因或 DMMG,并且可提供对草甘膦的耐受性。这是玉米2mEPSPS核苷酸序 列,也称为2mEPSPS v1。其编码SEQ ID NO:3的2mEPSPS多肽,该多 肽与SEQ ID NO:2的野生型EPSPS多肽相比包含残基102位以异亮氨酸 置换苏氨酸和残基106位以丝氨酸置换脯氨酸。

优化了SEQ ID NO:4的2mEPSPS v1核酸分子以改善在双子叶植物 和单子叶植物中的表达,尤其是在大豆中的表达。根据优先的单子叶植物 密码子选择来选择密码子选择,因为重新设计密码子选择使得所述蛋白质 由对单子叶植物选择和双子叶植物选择都有偏好的密码子来编码,并除去 有害序列和多余限制位点以提高DMMG编码序列的转录/翻译的效率并 有利于DNA操作步骤。这样做,在双子叶植物尤其是大豆中表达 2mEPSPS可提供对草甘膦施用的抗性。

图3示出优化的序列(SEQ ID NO:5)。ATG起始位点为斜体并在所 述优化序列SEQ ID NO:5上面标出(包含“atg”起始密码子的全长序列以 SEQ ID NO:7公开)。优化的序列和突变型玉米序列编码相同的2mEPSPS 蛋白(示于SEQ ID NO:3中)。

图4示出与来自玉米的天然玉米密码子2mEPSPS v1DNA序列(SEQ  ID NO:4)比较,单子叶植物和双子叶植物优化的2mEPSPS v2DNA序列 的核苷酸序列比对。虽然2mEPSPS蛋白质序列在氨基酸水上100%相同, 但是它们是在核苷酸水平上仅为85.5%相同的基因版本1和基因版本2。 所产生的差异是使用上述策略产生的密码子选择的结果。

优化的2mEPSPS v2核酸分子可用于其中草甘膦抗性可用于植物中 的多种广泛应用。草甘膦、草硫膦和fosametine是膦酰甲基甘氨酸家族 的广谱系统性除草剂。当提及草甘膦时,该术语应被认为包括N-膦酰甲 基甘氨酸的任何有效除草形式和其任何盐及可在植物中导致草甘膦两性 离子生成的形式。对于PEP(磷酸烯醇式丙酮酸)的结合而言,草甘膦 是5-烯醇丙酮酰莽草酸-3-磷酸合酶(EC2.5.1.19)或EPSPS的竞争性抑 制剂。向植物施用膦酰甲基甘氨酸除草剂之后,它被转移至植物中,在其 中它在快速生长部分(尤其是茎和根端)积累,对敏感植物的破坏点造成 损害。取决于除草剂的施用量,可抑制所述敏感植物的生长,即其生长变 慢或完全停止。植物对草甘膦或其家族产品的耐受性可通过将这种优化的 修饰EPSPS稳定地引入至它们的基因组中来获得。从例如美国专利 4,535,060和6,566,587已知,可通过将编码EPSPS的基因引入至基因组 中来赋予植物对上述类型的除草剂(尤其是N-膦酰甲基甘氨酸或草甘膦) 的耐受性,所述编码EPSPS的基因携带有可使该酶在定位于质体区室之 后对其竞争性抑制剂(草甘膦)抗性更大的突变。当提及对草甘膦除草剂 的抗性或耐受性时,它是指除草剂对植物的任何影响都不会杀死植物;可 以对植物有极小的影响或者是完全没有影响,使得对含有可提供抗性或耐 受性的异源核酸分子的植物的任何不利影响小于不含可提供对草甘膦的 抗性或耐受性的核酸分子的植物。

当在大豆(Glycine max)、大豆植物中表达时,这种核酸分子是尤其 有用的。所述核酸分子可从任何宿主分离并被修饰以使其包含本发明的核 酸分子,可以从玉米或大豆或其他植物分离,从微生物分离,或者可以通 过合成产生;产生本发明的核酸分子的方法并不是至关重要的。

本文使用的术语核酸或多核苷酸是指脱氧核糖核苷酸或核糖核苷酸 和其单链或双链形式的聚合物。因此,所述术语包括RNA和DNA—— 可以是基因或其部分、cDNA、合成的聚脱氧核糖核苷酸序列等,可以是 单链或双链以及DNA/RNA杂合体。此外,本文所使用的术语包括天然 存在的核酸分子,其可从细胞中分离,以及合成分子,其可通过例如化学 合成方法或通过酶法(例如通过聚合酶链式反应(PCR))制备。除非特 别限定,否则所述术语包括含有天然核苷酸的已知类似物的核酸,所述核 酸具有与参比核酸相似的结合性质并以与天然存在核苷酸相似的方式进 行代谢。所述术语核酸可与基因、cDNA和基因编码的mRNA互换使用。

术语“互补的”用于描述能够彼此杂交的核苷酸碱基之间的关系。例 如,就DNA而言,腺嘌呤核苷与胸腺嘧啶互补,胞嘧啶与鸟嘌呤互补。 因此,本发明还包括与所述全序列互补的分离的核酸片段。

脱氧核糖核苷酸(DNA)是含有4种单核苷酸单元的聚合物,(D) dAMP(2'-(D)脱氧腺苷-5-一磷酸)、dGMP(2'-(D)脱氧鸟苷-5-一磷酸)、 dCMP(2'-(D)脱氧胞苷-5-一磷酸)和dTMP(2'-(D)脱氧胸苷-5-一磷酸) 在各序列中通过3',5'-磷酸二酯桥连接。所述结构DNA由多个称为“密码 子”的编码氨基酸的核苷酸三联体组成。所述密码子对应如下的各种氨基 酸:Arg(CGA、CGC、CGG、CGT、AGA、AGG);Leu(CTA、CTC、 CTG、CTT、TTA、TTG);Ser(TCA、TCC、TCG、TCT、AGC、AGT); Thr(ACA、ACC、ACG、ACT);Pro(CCA、CCC、CCG、CCT);Ala  (GCA、GCC、GCG、GCT);Gly(GGA、GGC、GGG、GGT);Ile(ATA、 ATC、ATT);Val(GTA、GTC、GTG、GTT);Lys(AAA、AAG);Asn (AAC、AAT);Gln(GAA、CAG);His(CAC、CAT);Glu(GAA、GAG); Asp(GAC、GAT);Tyr(TAC、TAT);Cys(TGC、TGT);Phe(TTC、 TTT);Met(ATG)和Trp(UGG)。此外,由于遗传密码子的冗余(即除 了两种氨基酸以外,所有的氨基酸对应多于一种密码子),存在可编码具 体氨基酸序列的许多可能的DNA序列。

在本文讨论的氨基酸序列中,使用了标准的单字母或三字母命名法。 在说明书下文中出现的所有肽结构以其中N末端氨基出现在左边和C末 端羧基出现在右边的常规形式表示。同样,在蛋白质中出现的天然存在氨 基酸的氨基酸命名如下:丙氨酸(Ala;A)、天冬酰胺(Asn;N)、天冬 氨酸(Asp;D)、精氨酸(Arg;R)、半胱氨酸(Cys;C)、谷氨酸(Glu; E)、谷氨酰胺(Gln;Q)、甘氨酸(Gly;G)、组氨酸(His;H)、异亮 氨酸(Ile;I)、亮氨酸(Leu;L)、赖氨酸(Lys;K)、甲硫氨酸(Met; M)、苯丙氨酸(Phe;F)、脯氨酸(Pro;P)、丝氨酸(Ser;S)、苏氨 酸(Thr;T)、色氨酸(Trp;W)、酪氨酸(Tyr;Y)和缬氨酸(Val; V)。当氨基酸残基是未知的时候,可使用“X”,括号表示确定的指定是不 可能的,括号内的氨基酸名称是基于已知信息的最可能的估计。

当提及杂交技术时,可将已知核苷酸序列的全部或一部分用作探针, 所述探针可选择性杂交存在于选择植物的克隆基因组DNA片段或cDNA 片段的集合(即基因组文库或cDNA文库)中的其他相应的核苷酸序列。 所述杂交探针可以是基因组DNA片段、质粒DNA片段、cDNA片段、 RNA片段、PCR扩增的DNA片段、寡核苷酸或其他多核苷酸,并且可 以以可检测基团(例如32P)或任何其他可检测标记物标记。因此,例如, 用于杂交的探针可通过标记基于本发明的DNA序列的合成寡核苷酸制 成。制备用于杂交的探针的方法和构建cDNA文库和基因组文库的方法 通常是本领域已知的,并且已被公开(Sambrook et al.,1989)。

例如,本文公开的序列或其一个或多个部分可用作能够特异性杂交相 应序列的探针。为了在多种条件下实现特异性杂交,这种探针包括要筛选 的序列中的独特序列,长度优选为至少约10个核苷酸,长度更优选至少 约20个核苷酸。或者,这种序列可用于通过PCR从选择的植物中扩增相 应的序列。该技术可用于从所需的植物中分离序列,或可用作诊断测定以 确定植物中的序列存在情况。杂交技术包括杂交筛选以噬菌斑或菌落铺板 的DNA文库(Sambrook et.al.,1989)。

这种序列的杂交可在严格条件下进行。“严格条件”或“严格杂交条件” 是指探针将会与其靶序列杂交至与其他序列相比更容易检测的程度(即背 景的至少2倍)的条件。严格条件是序列依赖性的,在不同的环境中不同。 通过控制杂交条件和/或洗涤条件的严格性,可鉴定与探针100%互补的靶 序列(同源探测)。或者,可调整严格条件以允许序列中有一些错配使得 可检测更低程度的相似性(异源探测)。通常,探针的长度少于约1000 个核苷酸,优选长度少于500个核苷酸。

通常,严格条件是这样的条件:在pH7.0至8.3下盐浓度低于约1.5M Na+离子,通常约0.01至1.0M Na+离子浓度(或其他盐),并且温度对于 短探针(例如10至50个核苷酸)为至少约30℃,对于长探针(例如多 于50个核苷酸)为至少约60℃。严格条件也可以通过加入去稳定剂(例 如甲酰胺)来实现。示例性的低严格条件包括以37℃下于含有30-35%甲 酰胺、1M NaCl、0.1%SDS(十二烷基硫酸钠)的缓冲溶液杂交,并且 在50-55℃下在1×-2×SSC(20×SSC=3.0M NaCl/0.3M柠檬酸三钠)中洗 涤。示例性的中等严格条件包括在37℃下于40-45%甲酰胺、1.0M NaCl、 1%SDS中杂交,并且在55-60℃下在0.5×-1×SSC中洗涤。示例性的高严 格条件包括在37℃下于50%甲酰胺、1.0M NaCl、0.1%SDS中杂交,并 且在60-65℃下在0.1×SSC中洗涤。

特异性通常是杂交后洗涤的函数,关键因素是最终洗涤溶液的离子强 度和温度。对于DNA-DNA杂合体,Tm可用Meinkoth和Wahl, Anal.Biochem.,138:267-284(1984)的等式估算:Tm=81.5℃+16.6(log M) +0.41(%GC)–0.61(%form)–500/L;其中M为单价阳离子的容积摩尔 数,%GC为DNA中鸟苷和胞嘧啶核苷酸的百分比,%form为杂交溶液 中甲酰胺的百分比,L为以碱基对表示的杂交体的长度。Tm为(在确定 的离子强度和pH下)50%的互补靶序列与完全匹配的探针杂交时的温 度。对于每1%的错配,Tm降低约1℃;因此,为了杂交所需同一性的序 列,可调节Tm、杂交条件和/或洗涤条件。例如,如果要寻求具有≥90% 同一性的序列,则可将Tm降低10℃。通常,在确定的离子强度和pH下, 严格条件选择为比特定序列和其互补序列的热解链温度(Tm)低约5℃。 然而,极严格条件可采用在比热解链温度(Tm)低1、2、3或4℃的温度 下杂交和/或洗涤;中等严格条件可采用在比热解链温度(Tm)低6、7、 8、9或10℃的温度下杂交和/或洗涤;低严格条件可采用在比热解链温度 低11、12、13、14、15或20℃的温度下杂交和/或洗涤。使用所述等式、 杂交和洗涤组合物以及所需的Tm,本领域普通技术人员将会理解,杂交 和/或洗涤溶液的严格度的变化在本质上已经被描述。如果所需的错配程 度导致Tm低于45℃(水溶液)或32℃(甲酰胺溶液),则优选增加SSC 的浓度使得可以使用更高的温度。对核酸杂交的详尽指导可在以下文献中 找到:Tijssen,Laboratory Techniques in Biochemistry and Molecular  Biology—Hybridization with Nucleic Acids Probes,Part I,Chapter2, Ausubel,et al.,Eds.,Greene Publishing and Wiley-Interscience,New York (1995)。

特异性还是杂交后洗涤的函数,关键因素是最终洗涤溶液的离子强度 和温度。对于DNA-DNA杂合体,Tm可用以下等式估算:Tm=81.5℃+16.6 (log M)+0.41(%GC)–0.61(%form)–500/L;其中M为单价阳离子的容 积摩尔数,%GC为DNA中鸟苷和胞嘧啶核苷酸的百分比,%form为杂 交溶液中甲酰胺的百分比,L为以碱基对表示的杂交体的长度(Meinkoth 和Wahl,1984)。Tm为(在确定的离子强度和pH下)50%的互补靶序 列与完全匹配的探针杂交时的温度。对于每1%的错配,Tm降低约1℃; 因此,为了杂交所需同一性的序列,可调节Tm、杂交条件和/或洗涤条件。 例如,如果要寻求具有90%同一性的序列,则可将Tm降低10℃。通常, 在确定的离子强度和pH下,严格条件选择为比特定序列和其互补序列的 热解链温度(Tm)低约5℃。然而,极严格条件可采用在比热解链温度(Tm) 低1、2、3或4℃的温度下杂交和/或洗涤;中等严格条件可采用在比热解 链温度(Tm)低6、7、8、9或10℃的温度下杂交和/或洗涤;低严格条 件可采用在比热解链温度低11-20℃的温度下杂交和/或洗涤。使用所述等 式、杂交和洗涤组合物以及所需的Tm,本领域普通技术人员将会理解, 杂交溶液和/或洗涤溶液的严格度的变化在本质上已经被描述。如果所需 的错配程度导致Tm低于45℃(水溶液)或32℃(甲酰胺溶液),则优选 增加SSC的浓度使得可以使用更高的温度。对核酸杂交的详尽指导可在 以下文献中找到:(1997)Ausubelet al,Short Protocols in Molecular  Biology,page2-40,Third Edit.(1997)和Sambrook et al.(1989)。

通常,对应本发明的核苷酸序列并且可与本文公开的核苷酸序列杂交 的序列与所公开的序列至少50%同源、70%同源,甚至85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%同源或更高。也就是说,探针和靶之间的序列相似性是一个范围,共 享至少约50%、约70%以及甚至约85%或更高的序列相似性。

以下术语被用于描述两条或多条核酸或多核苷酸之间的序列关系: (a)“参比序列”,(b)“对比窗口”,(c)“序列同一性”以及(d)“序列同一性百 分比”。

(a)本文使用的“参比序列”是用作序列对比基础的给定序列。参比序 列可以是指定序列的子集或整体;例如,作为全长启动子序列的区段或全 启动子序列。

(b)本文使用的“对比窗口”是指多核苷酸序列的连续的指定区段,其 中多核苷酸序列与参比序列(不包含插入或缺失)相比在对比窗口中可包 含插入或缺失(即,缺口),以最佳比对所述两条序列。通常,对比窗口 长度为至少20个连续核苷酸,任选可以为30、40、50、100或者更长。 本领域技术人员可理解,由于多核苷酸序列中包含缺口,为了精确地反映 与参比序列的相似性,缺口惩罚通常被引入并从匹配数目减去。

比对用于对比的序列的方法是本领域公知的。因此,可使用数学算法 来完成对任意两条序列间百分比同一性的确定。

最佳比对用于对比的序列可使用本领域已知的任何方法来分析序列 同一性(同源性),例如通过称为“PILEUP”的渐进比对法(Morrison,Mol. Biol.Evol.14:428-441(1997),其作为使用PILEUP的实例);通过Smith 和Watermanby的局部同源性算法(Adv.Appl.Math.2:482(1981));通 过Needleman和Wunsch的同源性比对算法(J.Mol.Biol.48:443(1970)); 通过Pearson的搜索相似性的方法(Proc.Natl.Acad.Sci.USA85:2444 (1988));通过这些算法的计算机实现(例如Wisconsin Genetics软件包 (Genetics Computer Group,575Science Dr.,Madison,Wis.)中的GAP、 BEST FIT、FASTA和TFASTA);ClustalW(Intelligenetics(Mountain  View,Calif.)的PC/Gene程序中的CLUSTAL,描述于例如Higgins,Gene 73:237-244(1988);Corpet,Nucleic Acids Res.16:10881-10890(1988); Huang,Computer Applications in the Biosciences8:155-165(1992);和 Pearson,Methods in Mol.Biol.24:307-331(1994)中;Pfam(Sonnhammer, Nucleic Acids Res.26:322-325(1998);TreeAlign(Hein,Methods Mol.Biol. 25:349-364(1994);MEG-ALIGN和SAM序列比对计算机程序;或通过 肉眼观察进行比对。

适合用于确定序列相似性的算法的另一个实例是BLAST算法,其被 描述于Altschul et al,J.Mol.Biol.215:403-410(1990)中。Altschul,S.F., et al.,(1993)J.Mol.Biol.215:403-410的BLAST程序(基本局部比对搜索 工具)在默认参数下搜索与BLAST“GENEMBL”数据库中包含的序列的 同一性。使用BLASTN算法在默认参数下可以分析序列与GENEMBL 数据库中包含的所有公开可得DNA序列的同一性。

进行BLAST分析的软件可从美国国家生物技术信息中心(National  Center for Biotechnology Information,www.ncbi.nlm.nih.gov/)公开获得; 对于“PowerBLAST”变体,还可参见Zhang,Genome Res.7:649-656 (1997)。该算法包括首先通过在查询序列中识别如下的长度为W的短字 串而识别高得分序列对(HSP):在与数据库序列中相同长度的字串比对 时所述短字串匹配或者满足某个正值的阈值T。T称为相邻字串阈值 (Altschul et al,J.Mol.Biol.215:403-410(1990)。将这些初始相邻字串命 中作为种子用于启动搜索,以发现包含它们的更长HSP。字串命中沿着 每条序列在两个方向上延伸,只要累积比对分值可以增加。在每个方向上 延伸字串命中停止的条件是:所述累积比对分值从其所达到的最大值下降 X量;由于一个或多个负得分残基比对的累积,所述累积分值达到0或小 于0;或者达到任何一序列末端。所述BLAST算法参数W、T和X决定 了所述比对的敏感度和速度。所述BLAST程序使用默认的字长(W)11、 BLOSUM62打分矩阵(参见Henikoff,Proc.Natl.Acad.Sci.USA 89:10915-10919(1992))比对(B)50、期望(E)10、M=5、N=-4和双 链对比。术语BLAST是指可进行两条序列间相似性的统计分析的BLAST 算法;参见例如Karlin,Proc.Natl.Acad.Sci.USA90:5873-5787(1993)。 所述BLAST算法提供的一种相似性量度是最小和概率(P(N)),其提供 两条核苷酸序列或氨基酸序列之间随机出现匹配的概率的指示。例如,如 果在核酸与参比核酸的对比中最小和概率小于约0.1,更优选小于约0.1, 更优选小于约0.01,最优选小于约0.001,那么所述测试核酸被认为与参 比序列相似。

在一个实施方案中,可使用GAP(全局比对程序)。GAP使用 Needleman和Wunsch(J.Mol.Biol.48:443-453,1970)的算法来发现两 条完整序列匹配数目最多且缺口数目最少的比对。在常用的 (Accelrys,Inc.,San Diego,CA)第10版中,对于蛋 白质序列来说,默认的缺口产生惩罚值和缺口延伸惩罚值分别为8和2。 对核苷酸序列来说,默认的缺口产生惩罚为50,而默认的缺口延伸惩罚 为3。百分比相似性是相似的符号的百分比。忽略越过缺口的符号。当符 号对的打分矩阵值大于或者等于0.50(相似性阈值)时,就记录相似性。 通用的打分系统是BLOSUM62矩阵(Henikoff and Henikoff,Proteins,17: 49-61(1993)),其是目前BLAST程序的默认选择。BLOSUM62使用三 种矩阵的组合以覆盖全部的偶然性。Altschul,J.Mol.Biol.36:290-300 (1993)以引用的方式全文纳入本文,其为Wisconsin软件包的版本10 (Accelrys,Inc.,San Diego,CA)中使用的打分矩阵(参见 Henikoff&Henikoff(1989)Proc.Natl.Acad.Sci.USA89:10915)。

(c)在两条核酸序列的情形中,本文使用的“序列同一性”或“同一性” 是指:在特定的对比窗口上比对获得最大的对应时,所述两条序列中相同 的残基。

(d)本文使用的“序列同一性百分比”是指通过比较在对比窗口上两 条最佳对比的序列而确定的值,其中,为了最佳比对两条序列,多核苷酸 序列的所述部分与参比序列(不含插入或缺失)相比在对比窗口中可以包 含插入或缺失(即缺口)。所述百分比是这样计算的:测定两条序列中出 现相同核酸碱基的位置的数目以获得匹配位置的数目,将匹配位置的数目 除以对比窗口中的位置总数,再将所述结果乘以100,以获得序列同一性 百分比。

本发明的序列的同一性是指这样的多核苷酸序列:具有至少65%序 列同一性,更优选至少70%序列同一性,更优选至少75%序列同一性, 更优选至少80%同一性,更优选至少85%86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性。

可采用与本发明的核酸分子有关的多种测定。对于DNA印迹分析, 将DNA用限制性内切酶酶切并在琼脂糖凝胶上分级,以通过分子量分离 所述DNA,然后转移至尼龙膜上。然后,将其与以32P(或其他探针标记 物)放射性标记的探针片段杂交并在SDS溶液中洗涤。在蛋白质印迹分 析中,不是分离DNA,而是提取关注的蛋白质,并将其置于丙烯酰胺凝 胶上。然后,将所述蛋白质印迹至膜上并与标记物质接触。参见,例如 Hood et al.,“Commercial Production of Avidin from Transgenic Maize; Characterization of Transformants,Production,Processing,Extraction  and Purification”Molecular Breeding3:291-306(1997);Towbin et al, (1979)“Electrophoretic transfer of proteins from polyacrylamide gels to  nitrocellulose sheets:procedure and some applications”Proc Natl Acad  Sci USA76(9):4350-4354;Renart et al.“Transfer of proteins from gels to  diazobenzyloxymethyl-paper and detection with antisera:a method for  studying antibody specificity and antigen structure”Proc Natl Acad Sci  USA76(7):3116-3120。在RNA印迹分析中,将RNA分离并分析。

ELISA或酶联免疫测定自1971年就为人所知。一般而言,将溶解于 缓冲液中的抗原涂敷于塑料表面。当加入血清时,抗体可连接于固相上的 抗原上。当这些抗体与酶缀合时,可证明它们的存不存在。加入合适的底 物将可检测可被定量的结合缀合物的量。常用的ELISA测定使用生物素 化的抗(蛋白质)的多克隆抗体和碱性磷酸酶缀合物的测定。例如,用于 定量确定漆酶水平的ELISA可以是抗体夹心测定,所述测定利用市售的 多克隆兔抗体。所述抗体与碱性磷酸酶缀合用于检测。在另一个实例中, 检测胰岛素或胰蛋白酶原的ELISA测定使用了生物素化的胰岛素多克隆 抗体或生物素化的胰蛋白酶原多克隆抗体和链霉亲和素-碱性磷酸酶的缀 合物。

前述技术可用于多种情况,在一个实施方案中,其可用于检测植物细 胞中核酸分子和/或所编码的多肽的存在情况。例如,可以以多种方式确 定所述分子的存在情况,包括使用所述序列的引物或探针、用于检测所编 码蛋白质的ELISA测定、用于检测所述蛋白的蛋白质印迹、用于检测RNA 或DNA的RNA印迹或DNA印迹、和/或分离序列并测定其与所述核酸 分子的百分比同一性或检测可操作连接的标记物的存在情况。此外,可检 测双重突变型EPSPS蛋白的存在情况的抗体公开于美国专利7,807,791 中,所述专利以引用的方式纳入本文。

在将核酸插入至细胞中的情形中,术语“引入的”包括转染或转化或转 导,包括将核酸纳入至真核细胞或原核细胞中,在这些细胞中所述核酸被 纳入至所述细胞的基因组(例如染色体、质粒、质体或线粒体DNA)中, 被转移至自主复制子中或被瞬时表达(例如转染的mRNA)。当提及将核 苷酸序列引入至植物中时,意在包括转化至所述细胞中,以及将具有所述 序列的植物与另一植物杂交,使得第二植物包含所述异源序列,如常规植 物育种技术中那样。这种育种技术对于本领域的技术人员是熟知的。对于 植物育种技术的详述,参见Poehlman(1995)Breeding Field Crops.AVI Publication Co.,WestportConn,4th Edit。回交法可用于将基因引入植物 中。该技术用于将性状引入植物已有数十年。对于该技术和公知的其他植 物育种法的描述的实例可在参考文献例如上文的Poelman和Plant  Breeding Methodology,edit.Neal Jensen,John Wiley&Sons,Inc.(1988) 中找到。在典型的回交方案中,将原始关注的品种(回归亲本)与携带要 转移的关注的单基因的第二品种(非回归亲本)杂交。然后,将从该杂交 所得的子代与回归亲本再次杂交,并重复该过程直至获得这样的植物:其 中,除了来自非回归亲本的单转移的基因以外,在回归亲本中的所需的形 态特征或生理特征基本上全部在转化的植物中恢复。

如本文使用的,当核苷酸区段是指被置于与另一DNA区段的功能关 系中时,它被称为是可操作连接的。例如,如果信号序列的DNA表达参 与多肽分泌的前蛋白,则将其可操作地连接至编码所述多肽的DNA上; 如果启动子或增强子促进编码序列的转录,则将其可操作地连接至所述序 列上。通常,可操作连接的DNA序列是连续的,在信号序列的情形中, 其是连续的并且在阅读相中。然而,增强子不需要与其控制转录的编码序 列连续。连接通过在方便的限制位点或插入代替其的连接物(adapter) 或接头处进行连接来实现。表达盒除包括启动子外可以包括一个或多个增 强子。增强子意欲是指可提高启动子的利用的顺式作用序列。这种增强子 可以是基因的天然增强子或者来自异源基因的增强子。此外,现认为一些 启动子可包含一个或多个天然增强子或类增强子元件。一个这类增强子的 实例是35S增强子,其可以是单增强子或者是双增强子。参见,例如 McPherson et al、美国专利5,322,938。

广义上,本文使用的术语植物包括处于发育任何阶段的植物或植物部 分,包括植物插条、植物细胞、植物细胞培养物、植物器官、植物种子和 小植物(plantlet)。植物细胞是植物的结构和生理单元,包括原生质体 和细胞壁。植物细胞可以为如下的形式:分离的单细胞或细胞的集合体(例 如易碎的愈伤组织)或培养的细胞,或者可以是更高组织的单元(例如植 物组织、植物器官或植物)的部分。因此,植物细胞可以是原生质体、配 子生成细胞或者可再生成完整植物的细胞的细胞或集合物。因此,包含多 种植物细胞且能够再生成完整植物的种子被认为是用于本公开的目的的 植物细胞。植物组织或植物器官可以是种子、原生质体、愈伤组织,或者 是可形成结构或功能单元的任何其他植物细胞群。植物中尤其有用的部分 包括可收获的部分和用于繁殖子代植物的部分。植物的可收获部分可以是 植物的任何有用部分,例如花、花粉、幼苗、块茎、叶、茎、果实、种子、 根等。对繁殖有用的植物部分包括种子、果实、插条、幼苗、块茎、根状 茎等。组织培养物优选能够再生具有前述近交玉米植物的生理特征和形态 特征的植物,和能够再生具有与前述近交玉米植物基本相同的基因型的植 物。优选地,在这种组织培养物中的可再生细胞会是胚、原生质体、分生 细胞、愈伤组织、花粉、叶、花药、根、根尖、穗丝(silk)、花、核、 穗(ear)、穗轴(cob)、外壳(husk)或茎。此外,本发明还提供了从 本发明的组织培养物中再生得到的植物。

构建体是通过多种技术插入至细胞基因组中的遗传材料包。

本文使用的术语载体广义上是指编码外源核酸的任何质粒或病毒。植 物分子生物学中常用的载体的实例是双元载体,其可被设计为包含构建 体,参见Bevan M.,(1984)Nucl.Acids Res.,12(22):8711-8721。所述术语 也应被理解为包括有助于将核酸转移至病毒体或细胞中的非质粒和非病 毒化合物,例如聚赖氨酸化合物等。所述载体可以是适于作为用于将核酸 或其突变体递送至细胞的递送载体的病毒载体,或者所述载体可以是适用 于同样目的的非病毒载体。用于将DNA递送至细胞或组织的病毒载体或 非病毒载体的实例是本领域熟知的,并被描述于例如Ma et al.(1997,Proc. Natl.Acad.Sci.U.S.A.94:12744-12746)中。病毒载体的实例包括但不限 于重组痘苗病毒、重组腺病毒、重组反转录病毒、重组腺伴随病毒、重组 禽痘病毒等(Cranage et al.,1986,EMBO J.5:3057-3063;国际专利申请 No.WO94/17810,公开于1984年8月18日;国际专利申请No. WO94/23744,公开于1994年10月27日)。非病毒载体的实例包括但不 限于脂质体、DNA的多胺衍生物等。

一般而言,可用于构建重组基因(任选包括改进表达的多种修饰)的 方法在细节上可能不同。但是,常规采用的方法包括PCR扩增,或重叠、 互补的合成寡核苷酸的设计和合成,所述合成寡核苷酸可退火并连接在一 起,以产生具有方便限制性位点的基因,用于从另一已克隆的来源克隆或 亚克隆或者从文库中克隆。对于分子生物学家来说,所涉及的方法是标准 方法(Sambrook et al.,1989.Molecular Cloning:A Laboratory Manual,2nd Edition.Cold Spring Harbor Laboratory Press,Plainview,NY)。

在本发明的方法中,可采用指导基因在植物中表达的多个启动子。这 种启动子可选自组成型启动子、化学调控启动子、可诱导启动子、组织特 异性启动子、种子优先的启动子。组成型启动子包括例如核心CaMV35S 启动子(Odell et al.(1985)Nature313:810-812);水稻肌动蛋白(McElroy et al.(1990)Plant Cell2:163-171);玉米泛素(美国专利5,510,474; Christensen et al.(1989)Plant Mol.Biol.12:619-632和Christensen et al. (1992)Plant Mol.Biol.18:675-689);pEMU(Last et al.(1991)Theor.Appl. Genet.81:581-588);MAS(Velten et al.(1984)EMBO J.3:2723-2730), Rsyn7启动子的核心启动子以及公开于WO99/43838和美国专利 6,072,050中的其他组成型启动子;水稻肌动蛋白(McElroy et al.(1990) Plant Cell2:163-171);pEMU(Last et al.(1991)Theor.Appl.Genet. 81:581-588);MAS(Velten et al.(1984)EMBO J.3:2723-2730);ALS启 动子(美国专利5,659,026);水稻肌动蛋白启动子(美国专利5,641,876; WO00/70067);玉米组蛋白启动子(Chaboutéet al.Plant Molecular  Biology,8:179-191(1987),Brignon et al.,Plant Mol Bio22(6):1007-1015 (1993);Rasco-Gaunt et al.,Plant Cell Rep.21(6):569-576(2003))等。其 他组成型启动子包括例如美国专利5,608,149、5,608,144、5,604,121、 5,569,597、5,466,785、5,399,680、5,268,463和5,608,142。

可用的植物相容性启动子的范围包括组织特异性启动子和可诱导启 动子。可诱导调控元件是这样的元件:在响应诱导物时能够直接地或间接 地激活一条或多条DNA序列或基因的转录。在缺乏诱导物的情况下,将 不会转录所述DNA序列和基因。通常,特异性结合可诱导调控元件以激 活转录的蛋白因子以无活性形式存在,随后其被所述诱导物直接或间接转 化为活性形式。所述诱导物可以是化学试剂例如蛋白质、代谢物、生长调 节剂、除草剂或酚类化合物,或者是由热、冷、盐或毒性元素直接施加的 生理应激或通过病原体或致病物(例如病毒)的作用间接施加的生理应激。 通常,特异性结合可诱导调控元件以激活转录的蛋白因子以无活性形式存 在,随后其被诱导物直接或间接转化为活性形式。所述诱导物可以是化学 试剂例如蛋白质、代谢物、生长调节剂、除草剂或酚类化合物,或者由热、 冷、盐或毒性元素直接施加的生理应激或通过病原体或致病物(例如病毒) 的作用间接施加的生理应激。含有可诱导调控元件的植物细胞可通过对所 述细胞或植物外部施用所述诱导物,例如通过喷洒、浇水、加热或类似的 方法,来使其暴露于诱导物下。

任何的可诱导启动子都可用于本发明。参见Ward et al.Plant Mol. Biol.22:361-366(1993)。示例性的可诱导启动子包括蜕皮激素受体启动子 (美国专利6,504,082);对铜响应的来自ACE1系统的启动子(Mett et al. PNAS90:4567-4571(1993));对苯磺酰胺除草剂安全剂响应的来自玉米 的In2-1基因和In2-2基因(美国专利5,364,780;Hershey et al.,Mol.Gen. Genetics227:229-237(1991)和Gatz et al.,Mol.Gen.Genetics243:32-38 (1994));来自Tn10的Tet阻抑物(Gatz et al.,Mol.Gen.Genet.227: 229-237(1991);或来自类固醇基因,其转录活性由糖皮质类固醇激素诱 导(Schena et al.,Proc.Natl.Acad.Sci.U.S.A.88:10421(1991));玉米 GST启动子,由用作萌前除草剂的疏水性亲电子化合物激活;以及烟草 PR-1a启动子,由水杨酸激活。其他关注的化学调控的启动子包括响应甾 类化合物的启动子(参见,例如Schena et al.(1991)Proc.Natl.Acad.Sci. USA88:10421-10425和McNellis et al.(1998)Plant J.14(2):247-257中糖 皮质激素诱导的启动子)和四环素诱导的启动子和四环素抑制的启动子 (参见,例如Gatz et al.(1991)Mol.Gen.Genet.227:229-237和美国专利 5,814,618和5,789,156)。

冷响应调控元件或热休克调控元件,其转录分别受对暴露于冷或热反 应的影响(Takahashi et al.,Plant Physiol.99:383-390,1992);醇脱氢酶基 因的启动子(Gerlach et al.,PNAS USA79:2981-2985(1982);Walker et al., PNAS84(19):6624-6628(1987)),其由厌氧条件诱导;以及来自豌豆rbcS 基因或豌豆psaDb基因的光诱导启动子(Yamamoto et al.(1997)Plant J. 12(2):255-265);光诱导调控元件(Feinbaum et al.,Mol.Gen.Genet. 226:449,1991;Lam and Chua,Science248:471,1990;Matsuoka et al. (1993)Proc.Natl.Acad.Sci.USA90(20):9586-9590;Orozco et al.(1993) Plant Mol.Bio.23(6):1129-1138);植物激素诱导的调控元件 (Yamaguchi-Shinozaki et al.,Plant Mol.Biol.15:905,1990;Kares et al., Plant Mol.Biol.15:225,1990)等。可诱导调控元件也可以是玉米In2-1 基因或In2-2基因的可响应苯磺酰胺除草剂安全剂的启动子(Hershey et  al.,Mol.Gen.Gene.227:229-237,1991;Gatz et al.,Mol.Gen.Genet. 243:32-38,1994),和转座子Tn10的Tet阻抑物(Gatz et al.,Mol.Gen. Genet.227:229-237,1991)。应激诱导的启动子包括盐/水应激诱导的启动 子,例如P5CS(Zang et al.(1997)Plant Sciences129:81-89);冷诱导 启动子,例如cor15a(Hajela et al.(1990)Plant Physiol.93:1246-1252)、 cor15b(Wlihelm et al.(1993)Plant Mol Biol23:1073-1077)、wsc120 (Ouellet et al.(1998)FEBS Lett.423-324-328)、ci7(Kirch et al.(1997) Plant Mol Biol.33:897-909)、ci21A(Schneider et al.(1997)Plant Physiol. 113:335-45);干旱诱导启动子,例如Trg-31(Chaudhary et al(1996)Plant  Mol.Biol.30:1247-57)、rd29(Kasuga et al.(1999)Nature Biotechnology  18:287-291);渗透诱导启动子,例如Rab17(Vilardell et al.(1991)Plant  Mol.Biol.17:985-93)和渗透蛋白(Raghothama et al.(1993)Plant Mol  Biol23:1117-28);和热诱导启动子,例如热休克蛋白(Barros et al.(1992) Plant Mol.19:665-75;Marrs et al.(1993)Dev.Genet.14:27-41)、smHSP (Waters et al.(1996)J.Experimental Botany47:325-338)和来自欧芹泛 素启动子的热休克诱导元件(WO03/102198)。其他应激诱导启动子包 括rip2(美国专利5,332,808和美国公开No.2003/0217393)和rd29a (Yamaguchi-Shinozaki et al.(1993)Mol.Gen.Genetics236:331-340)。 一些启动子可通过创伤诱导,包括土壤杆菌(Agrobacterium)pmas启动 子(Guevara-Garcia et al.(1993)Plant J.4(3):495-505)和土壤杆菌ORF13 启动子(Hansen et al.,(1997)Mol.Gen.Genet.254(3):337-343)。

组织优先的启动子可用于在特定的植物组织中靶向增强的转录和/或 表达。当提及优先表达时,是指在与在其他植物组织中相比在特定植物组 织中以更高的水平表达。这种类型的启动子的实例包括种子优先表达,例 如由菜豆蛋白启动子(Bustos et al.1989.The Plant Cell Vol.1,839-853)和 玉米球蛋白-1基因(Belanger,et al.1991Genetics129:863-972)提供的。 对于双子叶植物,种子优先的启动子包括但不限于大豆β-菜豆蛋白、油菜 籽蛋白、β-伴大豆球蛋白、大豆凝集素、十字花科蛋白(cruciferin)等。 对于单子叶植物,种子优先的启动子包括但不限于玉米15kDa玉米醇溶 蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、γ-玉米醇溶蛋白、 waxy、shrunken1、shrunken2、球蛋白1等。种子优先的启动子还包括 主要对种子中的特定组织指导基因表达的启动子,例如γ-玉米醇溶蛋白的 胚乳优先的启动子、来自烟草的隐蔽性启动子(Fobert et al.1994.T-DNA  tagging of a seed coat-specific cryptic promoter in tobacco.Plant J.4: 567-577)、来自玉米的P-基因启动子(Chopra et al.1996.Alleles of the  maize P gene with distinct tissue specificities encode Myb-homologous  proteins with C-terminal replacements.Plant Cell7:1149-1158,Erratum  in Plant Cell.1997,1:109)、来自玉米的球蛋白-1启动子(Belenger and  Kriz.1991.Molecular basis for Allelic Polymorphism of the maize  Globulin-1gene.Genetics129:863-972)和对种皮或玉米籽粒外皮指导表 达的启动子,例如果皮特异性谷氨酰胺合成酶启动子(Muhitch et al.,2002. Isolation of a Promoter Sequence From the Glutamine Synthetase1-2Gene  Capable of Conferring Tissue-Specific Gene Expression in Transgenic  Maize.Plant Science163:865-872),GenBank登录号AF359511。

可以包括载体的其他元件,这也取决于基因的拟定用途。实例包括选 择标记物、靶序列或调控序列、转运肽序列例如优化的转运肽序列(参见 美国专利5,510,471)稳定序列例如RB7MAR(参见,Thompson and Myatt, (1997)Plant Mol.Biol.,34:687-692and WO9727207)或前导序列、内含 子等。植物表达载体和报告基因的一般性描述和实例可在Gruber,et al., “Vectors for Plant Transformation”in Method in Plant Molecular Biology  and Biotechnology,Glick et al eds;CRC Press pp.89-119(1993)中找到。 合适的表达载体的选择将取决于宿主和将所述表达载体引入所述宿主的 方法。表达盒在关注的异源核苷酸序列的3‘末端还包括在植物中有功能 的转录终止区或翻译终止区。所述终止区可以是本发明的启动子核苷酸序 列天然的,可以是关注的DNA序列天然的,或者可以来自其他来源。方 便的终止区可获自农杆菌(A.tumefaciens)的Ti-质粒,例如章鱼碱合酶 和胭脂碱合酶(nos)终止区(Depicker et al.,Mol.and Appl.Genet. 1:561-573(1982)和Shaw et al.(1984)Nucleic Acids Research vol.12,No. 20pp7831-7846(nos))。还可参见,Guerineau et al.Mol.Gen.Genet. 262:141-144(1991);Proudfoot,Cell64:671-674(1991);Sanfacon et al. Genes Dev.5:141-149(1991);Mogen et al.Plant Cell2:1261-1272(1990); Munroe et al.Gene91:151-158(1990);Ballas et al.Nucleic Acids Res. 17:7891-7903(1989);Joshi et al.Nucleic Acid Res.15:9627-9639(1987)。

用于选择转染细胞或组织或植物部分或植物的报告基因和标记物基 因可包括在转化载体中。可选择标记物的实例包括可赋予对抗代谢物(例 如除草剂或抗体)的抗性的标记物,例如可赋予对甲氨蝶呤的抗性的二氢 叶酸还原酶(Reiss,Plant Physiol.(Life Sci.Adv.)13:143-149,1994;也可 参见Herrera Estrella et al.,Nature303:209-213,1983;Meijer et al.,Plant  Mol.Biol.16:807-820,1991);可赋予对氨基糖甙类的新霉素、卡那霉素 和巴龙霉素的抗性的新霉素磷酸转移酶(Herrera-Estrella,EMBO J. 2:987-995,1983和Fraley et al.Proc.Natl.Acad.Sci USA80:4803(1983)) 和可赋予对潮霉素的抗性的潮霉素磷酸转移酶(Marsh,Gene32:481-485, 1984;还可参见Waldron et al.,Plant Mol.Biol.5:103-108,1985;Zhijian  et al.,Plant Science108:219-227,1995);使细胞利用吲哚代替色氨酸的 trpB;使细胞利用histinol代替组氨酸的hisD(Hartman,Proc.Natl.Acad. Sci.,USA85:8047,1988);使细胞利用甘露糖的甘露糖-6-磷酸异构酶(WO 94/20627);可赋予对鸟氨酸脱羧酶抑制剂2-(二氟甲基)-DL-鸟氨酸 (DFMO)的抗性的鸟氨酸脱羧酶(McConlogue,1987,In:Current  Communications in Molecular Biology,Cold Spring Harbor Laboratory ed.);和可赋予对杀稻瘟素S的抗性的来自土曲霉(Aspergillus terreus) 的脱氨酶(Tamura,Biosci.Biotechnol.Biochem.59:2336-2338,1995)。 其他的选择标记物包括例如可赋予对草甘膦的抗性的突变型EPSP合酶 (Hinchee et al.,BioTechnology91:915-922,1998)、可赋予对咪唑啉酮的 抗性或对磺酰脲的抗性的突变型乙酰乳酸合酶(Lee et al.,EMBO J. 7:1241-1248,1988)、可赋予对莠去净(atrazine)的抗性的突变型psbA (Smeda et al.,Plant Physiol.103:911-917,1993)或突变型初卟啉原氧化 酶(参见美国专利No.5,767,373)或可赋予对除草剂(例如草铵膦)的 抗性的其他标记物。合适的可选择标记基因的实例包括但不限于编码对以 下物质的抗性的基因:氯霉素(Herrera Estrella et al.,EMBO J.2:987-992, 1983)、链霉素(Jones et al.,Mol.Gen.Genet.210:86-91,1987)、壮观 霉素(Bretagne-Sagnard et al.,Transgenic Res.5:131-137,1996)、博来 霉素(Hille et al.,Plant Mol.Biol.7:171-176,1990)、氨磺酰(Guerineau  et al.,Plant Mol.Biol.15:127-136,1990)、溴苯腈(Stalker et al.,Science 242:419-423,1988)、草甘膦(Shaw et al.,Science233:478-481,1986)、 草丁膦(DeBlock et al.,EMBO J.6:2513-2518,1987)等。使用选择基因 的一个选项是草铵膦抗性编码DNA,在一个实施方案中,可以是CaMV 35S启动子或泛素启动子控制下的草丁膦乙酰转移酶(PAT)基因、优化 的玉米PAT基因或bar基因。所述基因赋予对双丙氨酰膦的抗性(参见, Wohllebenet al.,(1988)Gene70:25-37);Gordon-Kamm et al.,Plant Cell 2:603;1990;Uchimiya et al.,BioTechnology11:835,1993;White et al., Nucl.Acids Res.18:1062,1990;Spencer et al.,Theor.Appl.Genet. 79:625-631,1990;和Anzai et al.,Mol.Gen.Gen.219:492,1989)。PAT 基因的一个版本是描述于美国专利No.6,096,947中的优化的玉米PAT基 因。

此外,可采用这样的标记物,即其有助于鉴定含有编码所述标记物的 核苷酸的植物细胞。当所述序列的存在可产生可测定的产物并可无需破坏 植物细胞而产生产物时,可评分(Scorable)或可筛选的标记物是有用的。 实例包括β-葡糖醛酸糖苷酶或uidA基因(GUS),所述uidA基因编码已 知有多种显色底物的酶(例如,美国专利5,268,463和5,599,670);氯霉 素乙酰转移酶(Jefferson et al.The EMBO Journal vol.6No.13pp. 3901-3907);碱性磷酸酶。在优选的实施方案中,所使用的标记物是β- 胡萝卜素或前维生素A(Ye et al,Science287:303-305-(2000))。所述基因 已被用于增强水稻的营养,但是在此实例中,其被改用作筛选标记物,连 接关注的基因的所述基因可通过其提供的金黄色来检测。与所述基因被用 于其为植物贡献营养的情况不同,仅需要较少量的蛋白质。通常,其他筛 选标记物包括花色素苷/黄酮类化合物基因(参见Taylor and Briggs,The  Plant Cell(1990)2:115-127中的讨论)——包括例如R-基因座基因,该基 因编码可调控植物组织中花青素苷色素(红色)产生的产物(Dellaporta et  al.,in Chromosome Structure and Function,Kluwer Academic Publishers, Appels and Gustafson eds.,pp.263-282(1988));控制黄酮类色素生物合 成的基因,例如玉米C1基因(Kao et al.,Plant Cell(1996)8:1171-1179; Scheffler et al.Mol.Gen.Genet.(1994)242:40-48)和玉米C2(Wienand et  al.,Mol.Gen.Genet.(1986)203:202-207);B基因(Chandler et al.,Plant  Cell(1989)1:1175-1183);p1基因(Grotewold et al,Proc.Natl.Acad.Sci  USA(1991)88:4587-4591;Grotewold et al.,Cell(1994)76:543-553; Sidorenko et al.,Plant Mol.Biol.(1999)39:11-19);bronze基因座基因 (Ralston et al.,Genetics(1988)119:185-197;Nash et al.,Plant Cell(1990) 2(11):1039-1049)等。适合的标记物的其他实例包括青色荧光蛋白(CYP) 基因(Bolte et al.(2004)J.Cell Science117:943-54and Kato et al.(2002) Plant Physiol129:913-42)、黄色荧光蛋白基因(来自Evrogen的 PHIYFPTM;参见Bolte et al.(2004)J.Cell Science117:943-54);编码荧 光素酶的lux基因,所述荧光素酶的存在情况可使用X光片、闪烁计数法、 荧光分光光度法、低照度摄像机、光子计数照相机或多孔发光测定法 (multiwell luminometry)检测(Teeri et al.(1989)EMBO J.8:343);绿 色荧光蛋白(GFP)基因(Sheen et al.,Plant J.(1995)8(5):777-84);和 DsRed2,用该标记物基因转化的植物细胞是红色的,因此可用视觉选择 (Dietrich et al.(2002)Biotechniques2(2):286-293)。其他实例包括β-内 酰胺酶基因(Sutcliffe,Proc.Nat'l.Acad.Sci.U.S.A.(1978)75:3737),该 基因编码已知存在多种显色底物(例如PADAC,显色头孢霉素)的酶; xylE基因(Zukowsky et al.,Proc.Nat'l.Acad.Sci.U.S.A.(1983)80:1101), 该基因编码可转化显色儿茶酚的儿茶酚双加氧酶;α-淀粉酶基因(Ikuta et  al.,Biotech.(1990)8:241);和酪氨酸酶基因(Katz et al.,J.Gen.Microbiol. (1983)129:2703),该基因编码能够将酪氨酸氧化为DOPA和多巴醌(其 可进而浓缩以形成易于检测的化合物黑色素)的酶。明显的是,本领域技 术人员可获得许多这类标记物。

表达盒可另外地包括5‘前导序列。这种前导序列可以发挥作用以增 强翻译。翻译前导序列在本领域是已知的,包括例如小RNA病毒前导序 列、EMCV前导序列(脑心肌炎病毒5‘非编码区,Elroy-Stein et al.Proc. Nat.Acad.Sci.USA86:6126-6130(1989);马铃薯Y病毒组前导序列,例 如TEV前导序列(烟草蚀纹病毒),Carrington and Freed Journal of  Virology,64:1590-1597(1990),MDMV前导序列(玉米矮花叶病毒), Allison et al.;Virology154:9-20(1986);人免疫球蛋白重链结合蛋白 (BiP),Macejak et al.Nature353:90-94(1991);来自苜蓿花叶病毒外壳 蛋白mRNA(AMV RNA4)的非翻译前导序列,Jobling et al.Nature 325:622-625(1987);烟草花叶病毒前导序列(TMV),Gallie et al.(1989) Molecular Biology of RNA,pages237-256;和玉米褪绿斑驳病毒前导序列 (MCMV),Lommel et al.Virology81:382-385(1991)。还参见 Della-Cioppa et al.Plant Physiology84:965-968(1987)。

所述构建体还可以包括增强翻译和/或mRNA稳定性的序列例如内含 子。一个这类内含子的实例是拟南芥(Arabidopsis thaliana)组蛋白H3.III 变体的基因II的第一内含子。Chaubet et al.Journal of Molecular Biology, 225:569-574(1992)。

在需要使异源核苷酸序列表达的产物定位至特定的细胞器(尤其是质 体、造粉体)或定位至内质网或在细胞表面或细胞外分泌的情况中,表达 盒还可包括转运肽的编码序列。这种转运肽在本领域是已知的,包括但不 限于酰基载体蛋白、RUBISCO的小亚基、植物EPSP合酶的转运肽和向 日葵(Heilianthus annus)(参见Lebrun et al.美国专利5,510,417)、玉米 (Zea mays)Brittle-1叶绿体转运肽(Nelson et al.Plant Physiol 117(4):1235-1252(1998);Sullivan et al.Plant Cell3(12):1337-48;Sullivan  et al.,Planta(1995)196(3):477-84;Sullivan et al.,J.Biol.Chem.(1992) 267(26):18999-9004)等。此外,嵌合转运肽是本领域已知的,例如优化 的转运肽(参见,美国专利5,510,471)。本领域技术人员会容易理解,在 将产物表达至特定细胞器的过程中可用的多种选择。例如,大麦α淀粉 酶经常被用于指导表达至内质网(Rogers,J.Biol.Chem.260:3731-3738 (1985))。转运肽的使用是公知的(例如,参见美国专利5,717,084、 5,728,925)。

任选地,可将本发明的核苷酸序列与另一关注的核苷酸序列结合。术 语“关注的核苷酸序列”是指这样的核酸分子(其也被称为多核苷酸):可 以是RNA分子以及DNA分子,可以是编码所需多肽或蛋白质的分子, 所述术语还可以是指不构成整个基因且不一定编码多肽或蛋白质的核酸 分子(例如启动子)。例如,可将本发明的核酸分子与另一核酸分子结合 或“堆叠”,所述另一核酸分子可提供对草甘膦或其他除草剂的另外的抗性 或耐受性,和/或可提供对选择昆虫或疾病的抗性,和/或增强的营养,和 /或改进的农艺特性,和/或可用于饲料、食物、工业、制药或其他用途的 蛋白质或其他产物。在植物基因组内含有构建体的核酸的堆叠可通过植物 育种、转基因植物的再转化,或者通过同源重组的靶向整合加入新性状来 实现。

这种核苷酸序列包括但不限于下面提供的这些实例:

1.可赋予对害虫或疾病的抗性的基因或编码序列(例如,iRNA)。

(A)植物疾病抗性基因。植物防卫经常由植物中疾病抗性基因(R) 的产物和病原体中相应的无毒(Avr)基因的产物之间的特异性相互作用 激活。可以用克隆的抗性基因来转化植物变种以设计抗特定病原体株的植 物。这种基因的实例包括用于抗黄枝孢霉(Cladosporium fulvum)的番茄 Cf-9基因(Jones et al.,1994Science266:789)、用于抗丁香假单胞菌 (Pseudomonas syringae)番茄致病变种的编码蛋白激酶的番茄Pto基因 (Martin et al.,1993Science262:1432)和用于抗丁香假单胞菌的拟南芥 RSSP2基因(Mindrinos et al.,1994Cell78:1089)。

(B).苏芸金芽胞杆菌(Bacillus thuringiensis)蛋白、其衍生物或以 其为模型的合成多肽,例如Btδ-内毒素基因的核苷酸序列(Geiser et al., 1986Gene48:109)和营养期杀虫(VIP)基因(参见,例如Estruch et al. (1996)Proc.Natl.Acad.Sci.93:5389-94)。此外,编码δ-内毒素基因的DNA 分子可从美国典型培养物保藏中心(American Type Culture Collection) 购得,ATCC登录号为40098、67136、31995和31998。

(C)凝集素,例如多个君子兰(Clivia miniata)甘露糖结合凝集素基 因的核苷酸序列(Van Damme et al.,1994Plant Molec.Biol.24:825)。

(D)维生素结合蛋白,例如抗生素蛋白和用作抗虫害的杀幼虫剂的抗 生素蛋白同系物。参见美国专利No.5,659,026。

(E)酶抑制剂,例如蛋白酶抑制剂或淀粉酶抑制剂。这类基因的实例 包括水稻半胱氨酸蛋白酶抑制剂(Abe et al.,1987J.Biol.Chem. 262:16793)、烟草蛋白酶抑制剂I(Huub et al.,1993Plant Molec.Biol. 21:985)和α-淀粉酶抑制剂Sumitani et al.,1993Biosci.Biotech.Biochem. 57:1243)。

(F)昆虫特异性的激素或信息素例如蜕皮甾类和保幼激素其变体、基 于其的模仿物或者其拮抗物或激动剂,例如杆状病毒表达的克隆的保幼激 素酯酶(一种保幼激素的灭活剂)(Hammock et al.,1990Nature 344:458)。

(G)昆虫特异性肽或神经肽,其在表达时破坏受影响的害虫的生理机 能。J.Biol.Chem.269:9。这类基因的实例包括昆虫利尿激素受体(Regan, 1994),太平洋折翅蠊(Diploptera punctata)中鉴定的allostatin(Pratt, 1989)、昆虫特异性麻痹性神经毒素(美国专利No.5,266,361)。

(H)自然界中蛇、黄蜂等产生的昆虫特异性毒液,例如蝎子虫毒肽 (Pang,1992Gene116:165)。

(I)使得单萜、倍半萜、甾醇、氧肟酸、苯丙素衍生物或具有杀虫活 性的另一非蛋白质分子超积累的酶。

(J)参与生物活性分子的修饰(包括翻译后修饰)的酶;例如:天然 的或合成的糖酵解酶、蛋白水解酶、脂肪分解酶、核酸酶、环化酶、转氨 酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、几 丁质酶和葡聚糖酶。这种基因的实例包括callas基因(PCT公开的申请 WO93/02197)、几丁质酶编码序列(例如,可以从ATCC获得,登录号 为3999637和67152)、烟草钩虫几丁质酶(Kramer et al.,1993Insect  Molec.Biol.23:691)和欧芹ubi4-2多聚泛素蛋白基因(Kawalleck et al., 1993Plant Molec.Biol.21:673)。

(K)促进信号转导的分子。这类分子的实例包括绿豆钙调蛋白cDNA 克隆的核苷酸序列(Botella et al.,1994Plant Molec.Biol.24:757)和玉米 钙调蛋白cDNA克隆的核苷酸序列(Griess et al.,1994Plant Physiol. 104:1467)。

(L)疏水性moment肽。参见美国专利No.5,659,026和5,607,914, 后者教导了可赋予疾病抗性的合成抗微生物肽。

(M)膜通透酶,通道形成剂(channel former)或通道阻滞剂,例如 可使得转基因番茄植物抗青枯假单胞菌(Pseudomonas solanacearum)的 杀菌肽-β裂解肽类似物(Jaynes et al.,1993Plant Sci.89:43)。

(N)病毒侵入性蛋白或从其衍生出的复合毒素。例如,转化的植物细 胞中病毒外壳蛋白的累积给予对受从中获得外壳蛋白的病毒以及相关病 毒影响的病毒感染和/或疾病发生的抗性。已经对转化植物赋予了外壳蛋 白介导的对以下病毒的抗性:苜蓿花叶病毒、黄瓜花叶病毒、烟草线条病 毒、马铃薯X病毒、马铃薯Y病毒、烟草蚀纹病毒、烟草格格病毒和烟 草花叶病毒。参见,例如Beachy et al.(1990)Ann.Rev.Phytopathol. 28:451。

(O)昆虫特异性抗体或从其衍生的免疫毒素。因此,靶向昆虫肠道中 关键代谢功能的抗体会使受影响的酶失活,杀死昆虫。例如,Taylor et al. (1994)Abstract#497,Seventh Int'l。关于分子植物-微生物相互作用的专 题论文表明通过产生单链抗体片段使转基因烟草中的酶失活。

(P)病毒特异性抗体。参见,例如,Tavladoraki et al.(1993)Nature 266:469,该文献表明表达重组抗体基因的转基因植物可免受病毒攻击。

(Q)自然界中由病原体或寄生虫产生的发育停滞蛋白。因此,真菌内 切α-1,4-D多聚半乳糖醛酸酶通过溶解植物细胞壁同型α-1,4-D-半乳糖醛 酸酶有利于真菌定植和植物营养素释放(Lamb et al.,1992) Bio/Technology10:1436。克隆和鉴定编码大豆多聚半乳糖醛酸内切酶抑 制蛋白的基因描述于Toubart et al(1992Plant J.2:367)中。

(R)自然界中由植物产生的发育停滞蛋白,例如大麦核糖体失活基因 具有增强的真菌疾病抗性(Longemann et al.,1992).Bio/Technology 10:3305。

(S)其中RNA分子用于抑制靶基因表达的RNA干扰。在一个实例中, RNA分子部分或全部为双链,其可引发沉默反应,导致dsRNA被切割成 小干扰RNA,随后所述小干扰RNA被纳入至可破坏同源mRNA的靶复 合体中。参见,例如,Fire et al.,美国专利6,506,559;Graham et al. 6,573,099。

2.可赋予对除草剂的抗性的基因

(A)编码对抑制生长点或分生组织的除草剂(例如咪唑酮类或磺酰 脲)的抗性或耐受性的基因。该类别中的示例性基因编码突变型乙酰乳酸 合酶(ALS)(Lee et al.,1988EMBOJ.7:1241)——也被称为乙酰羟酸合 酶(AHAS)(Miki et al.,1990Theor.Appl.Genet.80:449)。

(B)编码草甘膦抗性或耐受性的一个或多个其他基因,所述草甘膦抗 性或耐受性由突变型EPSP合酶和aroA基因给予,或由基因例如GAT (草甘膦乙酰转移酶或GOX(草甘膦氧化酶)和其他膦酰化合物例如草 铵膦(PAT基因和bar基因),和pyridinoxy或苯氧基丙酸和环己二酮 (ACC酶抑制剂编码基因)通过代谢失活给予。参见,例如,美国专利 No.4,940,835,该专利公开了可赋予草甘膦抗性的EPSPS形式的核苷酸 序列。编码突变型aroA基因的DNA分子可以以ATCC登录号39256获 得,所述突变型基因的核苷酸序列公开在美国专利No.4,769,061中。欧 洲专利申请No.0333033和美国专利No.4,975,374公开了可赋予对除草 剂(例如L-草丁膦)的抗性的谷氨酰胺合酶基因的核苷酸序列。草丁膦 乙酰转移酶基因的核苷酸序列提供在欧洲申请No.0242246中。De Greef  et al.(1989)Bio/Technology7:61描述了可表达编码草丁膦乙酰转移酶活 性的嵌合bar基因的转基因植物的产生。可赋予对苯氧基丙酸抗性和环己 二酮(例如稀禾定和吡氟氯禾灵)的抗性的示例性基因是描述在Marshall  et al.(1992)Theor.Appl.Genet.83:435中的Accl-S1基因、Accl-S2基因 和Accl-S3基因。

(C)编码对可抑制光合作用的除草剂例如三嗪(psbA基因和gs+基 因)和氰苯(腈水解酶基因)的抗性或耐受性的基因。Przibilla et al.(1991) Plant Cell3:169描述了使用编码突变型psbA基因的质粒来转化衣滴虫 (Chlamydomonas)。腈水解酶基因的核苷酸序列公开在美国专利No. 4,810,648中,含有这些基因的DNA分子可以以ATCC登录号53435、 67441和67442获得。编码谷胱甘肽-S-转移酶的DNA的克隆和表达描述 于Hayes et al.(1992)Biochem.J.285:173中。

(D)编码对可结合羟基苯丙酮酸双加氧酶(HPPD)的除草剂的抗性 或耐受性的基因,所述酶可催化将对羟基苯丙酮酸(HPP)转化为高龙胆 酸的反应。这包括除草剂例如异噁唑(EP418175、EP470856、EP487352、 EP527036、EP560482、EP682659、美国专利No.5,424,276),尤其是针对 玉米的选择性除草剂异噁氟草;二酮腈类(EP496630、EP496631),尤其 是2-氰基-3-环丙基-1-(2-SO2CH3-4-CF3苯基)丙烷-1,3-二酮和2-氰基-3- 环丙基-1-(2-SO2CH3-4-2,3Cl2苯基)丙烷-1,3-二酮;三酮类(EP625505、 EP625508、美国专利No.5,506,195),尤其是磺草酮;或者吡唑特 (pyrazolinate)。在植物中产生过多HPPD的基因可提供对这类除草剂的 耐受性或抗性,包括例如描述于美国专利No.6,268,549和6,245,968以及 美国公开No.20030066102中的基因。

(E)编码对苯氧基生长素除草剂例如2,4-二氯苯氧乙酸(2,4-D)的抗 性或耐受性的基因,所述基因还可赋予对芳氧基苯氧丙酸(AOPP)除草 剂的抗性或耐受性。这类基因的实例包括α-酮戊二酸依赖性双加氧酶 (AAD-1)基因,所述基因描述于美国公开20090093366中。

(F)编码对苯氧基生长素除草剂例如2,4-二氯苯氧乙酸(2,4-D)的抗 性或耐受性的基因,所述基因还可赋予对吡啶氧基生长素除草剂例如氟草 烟或定草酯的抗性或耐受性的基因。这种基因的实例包括α-酮戊二酸依赖 性双加氧酶(AAD-12)基因,所述基因描述于WO2007/053482A2中。

(G)编码对dicambia的抗性或耐受性的基因(参见,例如,美国专 利公开20030135879)。

(H)提供对可抑制初卟啉原氧化酶(PPO)的除草剂的抗性或耐受性 的基因(参见,美国专利No.5,767,373)。

(I)提供对可结合光系统II反应中心(PS II)的核心蛋白的均三氮苯 类除草剂(例如敌菌灵)和脲衍生物(例如敌草隆)的抗性或耐受性的基 因(参见,Brussian et al.,(1989)EMBO J.1989,8(4):1237-1245。

3.可赋予增值性状的基因或对增值性状有贡献的基因

(A)改进的脂肪酸代谢,例如通过以反义基因或硬脂酰-ACP去饱和 酶转化玉米或芸苔属(Brassica)以增加所述植物的硬脂酸的含量 (Knultzon et al.,1992)Proc.Nat.Acad.Sci.USA89:2624。

(B)降低的肌醇六磷酸含量

(1)引入肌醇六磷酸编码基因会增强肌醇六磷酸的分解,增加转化植 物的游离磷酸,例如黑曲霉(Aspergillus niger)肌醇六磷酸基因(Van  Hartingsveldt et al.,1993Gene127:87)。

(2)可引入降低肌醇六磷酸含量的基因。在玉米中,例如,这可通过 克隆并随后重新引入与单等位基因相关的DNA来实现,所述单等位基因 是以低水平的肌醇六磷酸为特征的玉米突变体的原因(Raboy et al.,1990 Maydica35:383)。

(C)改进的碳水化合物组成,例如通过以编码可改变淀粉分支模式的 酶的基因转化植物产生。这类酶的实例包括粘液链球菌(Streptococcus  mucus)果糖基转移酶基因(Shiroza et al.,1988)J.Bacteriol.170:810、枯 草杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(Steinmetz et al.,1985Mol. Gen.Genel.200:220)、藓样芽胞杆菌(Bacillus licheniformis)α-淀粉酶 (Pen et al.,1992Bio/Technology10:292)、番茄转化酶基因(Elliot et al., 1993)、大麦淀粉酶基因(Sogaard et al.,1993J.Biol.Chem.268:22480) 和玉米胚乳淀粉分支酶II(Fisher et al.,1993Plant Physiol.102:1045)。

关注的核苷酸序列也可以是通过同源重组引入至植物基因组的预定 区域的核苷酸序列。现有技术中已经描述了经同源重组将多核苷酸序列整 合至植物细胞中特定染色体位点的方法。例如,美国专利申请公开 No.2009/0111188A1中记载的定点整合描述了使用重组酶或整合酶以介 导供体多核苷酸序列引入至染色体标靶。此外,国际专利申请No.WO 2008/021207描述了锌指介导的同源重组用于在基因组的特定位置内整合 一条或多条供体多核苷酸序列。使用重组酶(例如描述于美国专利No. 6,720,475的FLP/FRT或描述于美国专利No.5,658,772的CRE/LOX)可 以被利用以将多核苷酸序列整合至特定染色体位点中。最后,Puchta et al., PNAS USA93(1996)pp.5055-5060描述了使用大范围核酸酶,用于将供 体多核苷酸序列靶向至特定染色体位置。

用于植物细胞中点特异性整合的方法是公知的且是可应用的 (Kumar et al.,Trends in Plant Sci.6(4)(2001)pp.155-159)。此外,可将 已在若干原核生物和低等真核生物中鉴定的点特异性重组系统可以应用 于植物中。这类系统的实例包括但不限于来自鲁氏酵母 (Zygosaccharomyces rouxii)的pSR1质粒的R/RS重组酶系统(Araki et  al.(1985)J.Mol.Biol.182:191-203)和噬菌体Mu的Gin/gix系统(Maeser  and Kahlmann(1991)Mol.Gen.Genet.230:170-176)。

如本文所述,本发明提供了能够表达关注的基因的载体。一般而言, 所述载体在植物细胞中应是有功能的。有时,优选在大肠杆菌(E.coli) 中有功能(例如,产生蛋白质用于增加抗体,分析DNA序列,构建插入 片段,获得大量的核酸)的载体。载体和用于在大肠杆菌中克隆和表达的 方法被描述于Sambrook et al.(见上文)中。

包括被可操作连接至表达盒中异源核苷酸序列的本发明序列的转化 质粒,也可包括要共转化至生物中的至少一条其他核苷酸序列。或者,所 述其他序列可由另一转化质粒提供。

转化/转染的方法对于本发明来说不是关键的;各种转化和转染方法 目前都是可用的。随着新的方法可用于转化作物或其他宿主细胞,可直接 采用这些方法。因此,已经开发了将DNA序列插入至宿主细胞的基因组 中以获得所述序列的转录或转录本和翻译以产生表型改变的多种方法。因 此,可采用提供有效的转化/转染的任何方法。

本领域技术人员可获得的用于将表达载体引入至植物组织的方法是 不同的,并且取决于所选择的植物。转化各种植物种类的方法是公知的, 并在文献中有详尽描述。参见,例如,Miki et al,“Procedures for  Introducing Foreign DNA into Plants”in Methods in Plant Molecular  Biotechnology,见上文;Klein et al,Bio/Technology10:268(1992);和 Weising et al.,Ann.Rev.Genet.22:421-477(1988)。例如,可使用以下 技术将DNA构建体引入至植物细胞的基因组DNA中:例如微弹介导的 递送,Klein et al.,Nature327:70-73(1987)和Tomes et al.Plant Cell, Tissue&Organ Culture:Fundamental Methods,eds.Gambourg and  Phillips(1995)(Springer-Velag,Berlin),美国专利4,945,050、5,879,918 和5,932,782;例如电穿孔,Fromm et al.,Proc.Natl.Acad.Sci.82:5824 (1985);聚乙二醇(PEG)沉淀,Paszkowski et al.,EMBO J.3:2717-2722 (1984);直接基因转移,WO85/01856和EP No.0275069;体外原生质 体转化,美国专利4,684,611;和植物细胞原生质体或胚性愈伤组织的微 注射,Crossway,Mol.Gen.Genetics202:179-185(1985)。当将DAN构建 体置于双元载体系统中时,另一选择是将植物组织与根癌土壤杆菌 (Agrobacterium tumefaciens)共培养。参见,例如,美国专利5,591,616、 5,563,055和5,981,840;Ishida et al.,“High Efficiency Transformation of  Maize(Zea mays L.)mediated by Agrobacterium tumefaciens”Nature  Biotechnology14:745-750(1996)。当细胞被根癌土壤杆菌感染时,所述细 菌宿主的毒力作用会指导所述构建体插入到植物细胞DNA中。参见,例 如,Horsch et al.,Science233:496-498(1984),和Fraley et al.,Proc.Natl. Acad.Sci.80:4803(1983)。使用病毒或病毒核酸和使用病毒DAN分子和 RNA分子的病毒复制系统是已知的。参见,例如,美国专利6,660,500、 6,462,255、5,889,190和5,889,101。

转化油菜的标准方法被描述于Moloney et al.“High Efficiency  Transformation of Brassica napus using Agrobacterium Vectors”Plant  Cell Reports8:238-242(1989)中。Fromm et al,Bio/Technology8:833 (1990)和Gordon-Kamm et al(见上文)描述了玉米转化。土壤杆菌属 (Agrobacterium)主要用于双子叶植物中,但是一些单子叶植物可用土 壤杆菌属来转化。参见上文和美国专利5,550,318。水稻转化被描述于Hiei  et al.,“Efficient Transformation of Rice(Oryza sativa L.)Mediated by  Agrobacterium and Sequence Analysis of the Boundaries of the T-DNA” The Plant Journal6(2):271-282(1994)、Christou et al,Trends in  Biotechnology10:239(1992)和Lee et al,Proc.Nat‘l Acad.Sci.USA 88:6389(1991)中。小麦可通过与转化玉米或水稻所用的技术类似的技术 来转化。高粱转化被描述于Casas et al(见上文),和Wan et al,Plant  Physiol.104:37(1994)中。大豆转化被描述于许多出版物中,包括美国专 利5,015,580。棉花转化被描述于美国专利5,004,863;美国专利;Christou, (1992)Plant Journal Vol.2(3)275-281Kumar et al.(2004)Plant Mol. Biol.56,203-216中。

在一个优选的方法中,可采用气溶胶束技术,用于将核苷酸序列引入 至细胞内。气溶胶束技术利用惰性气体经过小口(orifice)从较高气体压 力区域传向较低气体压力区域时所述气体的射流彭胀(jet expansion)。 膨胀气体可加快含有待引入细胞或组织的分子的气溶胶微滴。仅仅由于所 述气溶胶微滴获得的速度,该小体积的气溶胶微滴中携带的DNA可透入 细胞。通过本发明的气溶胶束法达到的速度是超音速的,可达到2000米/ 秒。在优选的实施方案中,所述方法包括(I)培养细胞源,(II)任选地,预 处理细胞以获得组织,所述组织通过气溶胶束技术具有提高的摄取和整合 的能力,(III)通过本发明的气溶胶束方法以外源核苷酸序列转化所述组 织,(IV)任选地,鉴定或选择转化的组织,(V)任选地,从所转化的细 胞或组织中再生转基因植物,和(VI)任选地,产生所述转基因植物的子 代。该方法被详细地描述于Held et al.,美国专利6,809,232、7,067,716和 7,026,286中。

下文以示例的方式提供,不是意欲限制本发明的范围。

实施例1优化的2mEPSPS v2编码核苷酸序列

来自玉米编码区的2mEPSPS v1的DNA序列的分析揭示了被认为对 优化的植物表达有害的若干序列基序的存在情况,以及双子叶植物中用于 表达的非最优的密码子组成。因此,本发明完成了植物优化的编码 2mEPSPS v2的基因的设计,以产生可在双子叶植物和单子叶植物中优化 表达的DNA序列,并且其中所述序列修饰不阻碍翻译或造成mRAN不稳 定。

由于遗传密码的冗余和简并(例如一些氨基酸由多于一种密码子指 定)所给予的可塑性,不同生物或生物种类中基因组的进化已经导致了同 义密码子的差异选择。该“密码子偏好”反映在蛋白编码区的平均碱基组成 中。例如,基因组具有相对低的G+C含量的生物会使用更多在同义密码 子第三位上为A或T的密码子,而具有较高G+C含量的生物使用更多在第 三位上为G或C的密码子。此外,现认为,mRNA中存在“稀有”密码子可 降低该mRNA的绝对翻译速率,尤其当对应于所述稀有密码子的负载 tRNA的相对丰度低的时候。该推理的延伸是,对于多个稀有密码子来说, 由单个稀有密码子引起的翻译速率的降低至少会是累加的。因此,具有高 稀有密码子相对含量的mRNA会相应具有低的翻译速率。该速率可相应由 低水平的编码蛋白所反映。

在设计用于在双子叶植物(例如棉花、油菜、烟草)尤其是大豆以及 单子叶植物(例如水稻、玉米或小麦)中表达的编码2mEPSPS的基因中, 确定潜在宿主植物的密码子偏好是有用的。存在多个公众可用的DNA序 列数据库,其中可找到关于植物基因组的密码子分布或多种植物基因的蛋 白编码区的密码子分布的信息。密码子偏好是植物用于编码其蛋白质的氨 基酸的密码子的统计分布。双子叶植物和单子叶植物(玉米)优先的密码 子选择示于表1中。

表1.单子叶植物(玉米%)和双子叶植物(双子叶植物%)基因的 编码区的同义密码子表示示于D列、E列、I列和J列中。为植物优化的 合成基因设计设定的偏好平衡的密码子表示的值示于C列和H列中。

*DNU=不使用

密码子偏好可以计算为,相对于全部氨基酸的密码子,使用单个密码 子的频率。或者,密码子偏好可以计算为,相对于该氨基酸的所有其他密 码子(同义密码子),使用编码某一氨基酸单个密码子的频率。在设计用 于植物表达的编码区中,应确定所述植物优先的首要(“首选”)密码子, 以及当存在多个选择时优先密码子的第二选择、第三选择、第四选择等。 然后,可设计编码相同2mEPSPS肽的氨基酸序列的新DNA序列,但是所 述新DNA序列通过置换植物(第一优先、第二优先、第三优先、第四优 先等)密码子以指定氨基酸序列中每个位置上的氨基酸而不同于原始 DNA序列。然后,对所述新序列中可能通过所述修饰产生的限制性酶切 位点。所述鉴定的位点通过以第一、第二、第三或第四优先选择密码子替 代所述密码子来进一步修饰。可影响关注的基因的转录或翻译的序列中的 其他位点是茎环结构、外显子:内含子接点(5‘或3‘)、多A添加信号或RNA 聚合酶终止信号;这些位点通过置换植物密码子而除去。还分析并改进了 所述序列以降低TA或GC双联体的频率。除了所述双联体以外,具有多于 约6个相同残基的G或C序列块可能影响所述序列的转录或翻译。因此,这 些块可通过以其次的优先密码子选择替代第一选择或第二选择等来有利 地修饰。

因此,可使用多种方法以产生如本文所述的基因。一个这类方法的实 例还被描述于PCT申请WO97/13402中。因此,表达有功能的2mEPSPS 蛋白的合成基因可用于转化包括植物的宿主。关于产生合成基因的其他指 导可在例如美国专利5,380,831中找到。

为了设计植物优化的编码2mEPSPS v2的基因,利用从密码子偏好表 建立的冗余遗传密码子设计了DNA序列以编码氨基酸序列,所述密码子 偏好表从特定宿主植物的蛋白编码序列编制。在表1中,D列、E列、I列 和J列示出每种氨基酸的同义密码子的分布(以该氨基酸的全部密码子的 %选择表示),这出现在单子叶植物(玉米)和双子叶植物的编码区中。 一些氨基酸的一些同义密码子被发现在植物基因中非常稀有(例如 CGG)。通常,如果密码子出现约10%或更少的编码任一株型基因中的相 关氨基酸的情况下,那么所述密码子被认为是很少使用的(在表1的C列 和H列中用DNU表示)。为了平衡氨基酸的剩余密码子选择的分布,使用 以下式计算了每个密码子的加权平均值表示:

C1的加权平均值%=1/(%C1+%C2+%C3+等)×%C1×100,

其中

C1是被计算的密码子,%C2、%C3等表示表1的其余同义密码子对 于大豆的%值的平均值(相关密码子的平均%值取自C列和G列)。

表1的C列和H列中给出了每个密码子的加权平均%值。

使用出现在单子叶植物和双子叶植物基因中的常用密码子的平衡密 码子分布设计了基本编码2mEPSPS蛋白的氨基酸序列的新DNA序列,用 于在双子叶植物尤其是大豆以及单子叶植物中优化表达。所述新DNA序 列通过置换植物(第一优先、第二优先、第三优先或第四优先)密码子以 在蛋白氨基酸序列中的每个位置上指定合适的氨基酸而不同于原始DNA 序列。设计植物优化的DNA序列开始是使用从表1中C列和H列构建的单 子叶/双子叶植物密码子偏好表来反向翻译玉米2mEPSPS蛋白序列(SEQ ID NO:3)。然后,通过补偿密码子改变(同时保持总的加权平均密码子 表象)来修饰所述原始序列,以除去或添加限制性内切酶识别位点,除去 高度稳定的链内二级结构,并除去可能对在植物中克隆操作或表达所述设 计基因有害的其他序列。然后,对所述DNA序列重新分析可能通过所述 修饰产生的限制性内切酶识别位点。将所述鉴定的位点通过以第一、第二、 第三或第四优先选择密码子替代相关密码子来进一步修饰。所述序列中可 能影响关注的基因的转录或翻译的其他位点包括外显子:内含子接点(5‘ 或3‘)、多A添加信号或RNA聚合酶终止信号。进一步分析并进一步修饰 所述修饰的序列,以降低TA或CG双联体的频率并提高TG或CT双联体的 频率。除了这些双联体以外,具有多于约6个[G+C]或[A+T]连续残基的序 列块也可能影响所述序列的转录或翻译。因此,这些序列块也通过以其他 优先的密码子选择替代第一、第二选择密码子等来修饰。很少使用的密码 子在很大程度上不包括在所述基因设计中,仅当必须满足密码子组成本身 以外的不同设计标准时使用(例如限制性内切酶位点的添加或删除)。

新设计的单子叶植物和双子叶植物优化的2mEPSPS v2DNA序列列 于图3所示的SEQ ID NO:5中(包括“atg”起始密码子的全长序列以SEQ  ID NO:7公开)。所得的DNA序列具有较高程度的密码子多样性、所需的 密码子组成,含有有意放置的限制性内切酶识别位点,并且不含可能干扰 所述基因的转录或产物mRNA的翻译的序列。表2示出对出现在原始基因、 单子叶植物优化版本和双子叶植物优化版本中的2mEPSP蛋白的编码区 的密码子组成的对比,并与从表1的C列和H列计算的单子叶植物优化的序 列和双子叶植物优化的序列的推荐密码子组成都进行比较。

表2为植物优化的合成基因设计设定的偏好平衡的密码子表示的值。 DNU=不使用

一旦已经在纸上或在计算机上设计了植物优化的DNA序列,就可在 实验室合成在序列上与所设计序列精确对应的实际DNA分子。可克隆这 类合成DNA分子,并另外对其操作,如来自自然或天然来源一样。包括 其他序列的含有SEQ ID NO5和7的DNA片段的合成由商业供应商 (DNA2.0,Menlo Park,CA)进行,所述其他序列例如6-框终止子(位于 加至编码序列的3‘端的全部六个阅读框中的终止密码子)和用于克隆的5‘ NcoI限制性位点。然后,如下文实施例所述,将所述合成DNA克隆至表 达载体并转化入大豆中。

实施例2制备质粒

构建pDAB8290

合成2mEPSPS编码序列的密码子优化的版本,记为2mEPSPS v2。 将该编码序列作为Bgl II--Spe I片段克隆至pDAB8261中。所得的 2mEPSPS v2表达盒构建体由以下基因元件组成:组蛋白H4A748启动子:: 组蛋白内含子2::优化的转运肽(OTPc)::2mEPSPS v2::组蛋白H4A748 3‘UTR终止子。

对含2mEPSPS v2表达盒的质粒经限制性内切酶和DNA测序分析进 行鉴定。将所得的质粒记为pDAB8290。

构建pDAB8291

将含有组蛋白H4A748启动子::组蛋白内含子2::优化的转运肽:: 2mEPSPS v2::组蛋白H4A7483‘UTR终止子的构建体作为Asc I片段从 pDAB8290中释放,并克隆至含有pat(见上文)和AAD-12表达盒(WO 2007/053482A2)的pDAB4468中的相应Asc I酶位点内。经限制性内切 酶和DNA测序分析鉴定了含有以反向2mEPSPS v2朝向(←→→)克隆 至aad-12和pat表达盒的2mEPSPS v2表达盒的质粒。将所得双元质粒记 为pDAB8291(图5)。

组蛋白H4A748是指来自组蛋白4基因的启动子(参见,Chaboutéet  al.Plant Molecular Biology,8:179-191(1987))。组蛋白内含子是拟南芥的 组蛋白H3.III变体的基因II的第一内含子。Chaubet et al.Journal of  Molecular Biology,225:569-574(1992)。OTPc是指优化的转运肽。参见, 美国专利No.5,510,471。组蛋白H4A7483‘UTR是指来自H4A748的终 止子,描述于Chaboutéet al.(1987)(见上文)中。AtUbi10是指拟南芥 泛素10启动子(参见,Callis,et al.,(1990)J.Biol.Chem.,265: 12486-12493)。aad-12的参考文献描述了编码能够降解2,4-D和吡啶氧乙 酸除草剂的酶的基因(WO2007/053482A2)。AtuORF233‘UTR是指来 自根癌土壤杆菌的开放阅读框233‘非翻译区(参见,美国专利5,428,147)。 CsVMV启动子是指木薯叶脉花叶病毒启动子,描述于Verdauger et al. Plant Mol.Biol.31:1129-1139(1996).Plant Science Vol.169,Issue4,pp. 704-711(2005)。pat的注释是编码能够降解草丁膦的草丁膦乙酰转移酶的 基因(参见,Wohllebenet al.,(1988)Gene70:25-37)。AtuORF13‘UTR 是指来自根癌土壤杆菌的开放阅读框13‘非翻译区(参见,Huang et al., (1990)J.Bacteriol.172:1814-1822)。RB7MAR是指RB7基质附着区,描 述于Thompson and Myatt,(1997)Plant Mol.Biol.,34:687-692和 WO9727207中。

包含本发明核苷酸序列的具有所产生的两个事件的2500粒种子的保 藏物以ATCC保藏号PTA-11335和PTA-11337A保藏于美国 Va.20110-2209马纳萨斯10801大学大道的美国典型培养物保藏中心 (American Type Culture Collection,ATCC)。所述种子于2010年9月 14号保藏于ATCC。在所述申请的未决期间,专利和商标委员会以及由 所述委员会确定授权去那里的人请求即可获得该保藏物。所述保藏物将在 ATCC保藏处(其为公公共保藏处)中保持30年的时间,或者在最后一 次的请求之后保持5年,或者在专利的有效期内保持,取三者中较长的那 个,并且如果在该期间所述保藏物变得失活,那么其将被替换。申请人会 坚持追究对该专利所授予的其权利的任何损害。

实施例3植物转化

通过对大豆子叶节外植体进行的土壤杆菌介导的转化生成了转基因 大豆(Glycine max)。使用携带双元载体pDAB8291的去肿瘤土壤杆菌菌 株EHA101(Hood E.,Helmer G.,Fraley R.,Chilton M.,(1986)J. Bacteriol.,168:1291-1301)起始转化,所述pDAB8291在T-链DNA区内 包括选择标记物pat和关注的基因aad-12和2mEPSPS v2。

使用Zenget al.(Zeng P.,Vadnais D.A.,Zhang Z.,Polacco J.C.,(2004), Plant Cell Rep.,22(7):478-482)的改进方法进行了土壤杆菌介导的转化。 简言之,将大豆种子(Maverick变种)在基础培养基上萌发,分离子叶 节并将其用土壤杆菌感染。以氨噻肟头孢菌素、特美汀和万古霉素补充芽 形成培养基、芽伸长培养基、生根培养基,用于除去土壤杆菌。施用草铵 膦选择以抑制非转化芽的生长。将选择的芽转移至用于根发育的生根培养 基,然后转移至用于驯化小植物的土壤混合物。

以草铵膦局部地处理(涂叶技术)所选择小植物的顶生小叶,以筛选 推定的转化体。将所筛选的小植物转移至温室,将其驯化,然后以草甘膦 涂叶子以再次确认耐受性。从这些推定的转化T0植物取样并使用分子分 析来确认pat、aad-12和2mEPSPS v2的存在情况。使T0植物在温室中自 我受精以产生T1种子。

实施例4分子确认

分离并确定大豆事件的侧翼基因组DNA边界区域,以确认T-链插入 至染色体基因组位点的存在情况。确认基因组序列的5‘侧翼边界序列和3‘ 侧翼边界序列。使用基于这些边界序列的PCR扩增来验证所述边界区域 为大豆来源,并且所述接头区包括基因渗入的来自pDAB8291的T-链。 总的来说,对大豆事件的插入物和边界序列的表征表明了所述大豆基因组 中存在完整拷贝的T-链。

DNA印迹分析还可用于建立pDAB8291至大豆基因组中的整合模 式。RNA印迹数据表明,T-链片段被插入至所分离的大豆事件的基因组 中。使用对包含在pDAB8291的T-链整合区中的aad-12基因和2mEPSPS  v2基因的基因特异性探针进行详细的RNA印迹分析。产生了具有位于质 粒内的切割位点并且可产生质粒内部的杂交片段或是跨越质粒与大豆基 因组DNA的接头的片段(边界片段)的描述性限制性内切酶,并将其与 上述探针杂交。从DNA杂交得到的限制性内切酶和探针的结合物的分子 量对于每个事件来说是独特的。这些实验证明了,aad-12、pat和2mEPSPS  v2转基因被整合至大豆基因组内而没有发生重排。大豆事件的特征在于 全长的简单的插入事件,所述插入事件包含来pDAB8291的aad-12、pat 和2mEPSPS v2植物转化单元(PTU)。

实施例5植物内2mEPSPS的蛋白表达

在T5代,测定了以pDAB8291转化的大豆事件中存在的2mEPSPS 的水平。使用蛋白质印迹法测量了来自大豆叶组织的可提取的可溶性 2mEPSPS蛋白。

在发育的R3阶段,采样喷洒的和未喷洒的植物。喷洒处理物由在发 育的V6/V7阶段施用2240g ae/ha草甘膦和2240g ae/ha2,4-D的桶混制剂 组成。以磷酸盐缓冲盐水溶液从大豆植物组织提取2mEPSPS,所述磷酸 盐缓冲盐水溶液包括洗涤剂Tween-20(PBST)和0.5%牛血清蛋白 (BSA)。离心所述植物组织;收集水性上清液,如果需要将其用合适的 缓冲液稀释。将所述蛋白质使用SDS-PAGE凝胶分离并转移至尼龙膜。 如美国专利7,807,791(以引用的方式全文纳入本文)所述,将所得的蛋 白质印迹与2mEPSPS突变体特异性的抗体探测,以研究来自pDAB8291 事件的2mEPSPS的稳定性。所述两个事件的蛋白质印迹示于图6和7中。 泳道1和泳道18为分子标记物;泳道2-5示出2、1、0.5和0.25ng/孔的 2mEPSPS蛋白标准品。泳道6-9为未喷洒的具有优化的2mEPSPS v2的 大豆事件。泳道10-13为喷洒处理的具有优化的2mEPSPS v2的大豆事件。 所述喷洒处理物由2240g ae/ha草甘膦和2240g ae/ha2,4-D的桶混制剂 组成。泳道14-16为未喷洒的具有未优化的2mEPSPS的大豆事件,泳道 17为非转基因变种“Maverick”。

表达2mEPSPS的大豆事件是稳定的,每个事件几乎没有至没有蛋白 截短或降解迹象。没有观察到喷洒和未喷洒的大豆事件在表达上有显著差 异。从表达2mEPSPS的所述大豆事件分离的蛋白的分子量与蛋白标准品 和含有未优化的2mEPSPS的阳性对照相同。最后,从大豆事件中纯化的 蛋白样品的带强度比包含未优化的2mEPSPS的阳性对照大豆植物的强。 所述蛋白质印迹数据表明全长2mEPSPS的强表达。

实施例52mEPSPS提供的植物内草甘膦耐受性

含有来自pDAB8291的2mEPSPv2表达盒构建体的大豆事件可对草 甘膦耐受。在2009和2010的生长季节期间进行了田间试验。在样地上种 植以pDAB8291转化产生的转基因大豆种子和用作对照的非转基因大豆 (Maverick变种)。以大施用率的草甘膦喷洒来自T2和T4代的田地种 植植物。在植物发育的V3或V5阶段以2240g ae/ha的比例进行草甘膦 herbicide Dow AgroSciences,Indianapolis,IN)施用。在 草甘膦施用后7天,评估所述植物的损伤。与Maverick对照相比,观察 到对以pDAB8291转化的大豆植物造成的损害极小(表3)。

表3.表达2mEPSPS(构建体pDAB8291)的大豆事件对2240g ae/ha 草甘膦的耐受性。

因此,当在植物中表达时,2mEPSPS v2的优化版本可提供草甘膦抗 性。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号