首页> 中国专利> 增强植物中基因表达的调节性核酸分子

增强植物中基因表达的调节性核酸分子

摘要

本发明属于植物分子生物学领域并且提供了用于产生高表达性启动子和产生核酸表达增强的植物的方法,其中增强核酸表达的核酸(NEENAs)与所述启动子功能性连接和/或引入植物中。

著录项

  • 公开/公告号CN113825838A

    专利类型发明专利

  • 公开/公告日2021-12-21

    原文格式PDF

  • 申请/专利权人 巴斯夫欧洲公司;

    申请/专利号CN202080034886.5

  • 申请日2020-05-06

  • 分类号C12N15/113(20100101);C12N15/84(20060101);A01H5/00(20180101);A01H6/46(20180101);A01H6/82(20180101);

  • 代理机构11247 北京市中咨律师事务所;

  • 代理人史文静;黄革生

  • 地址 德国莱茵河畔路德维希港

  • 入库时间 2023-06-19 13:46:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-05-24

    实质审查的生效 IPC(主分类):C12N15/113 专利申请号:2020800348865 申请日:20200506

    实质审查的生效

说明书

发明描述

本发明属于植物分子生物学领域并且提供了用于产生高表达性启动子和产生核酸表达增强的植物的方法,其中增强核酸表达的核酸(NEENAs)与所述启动子功能性连接和/或引入植物中。

转基因或同源转基因(cisgene)在植物中的表达强烈地受多种外部及内部因素影响,从而导致水平变动和不可预测的转基因或同源转基因表达。经常必须产生并分析大量转化体,以鉴定出表达强度合乎需要的株系。由于转化并筛选表达强度合乎需要的株系是昂贵和耗费人力的,故需要植物中高表达一个或多个转基因或同源转基因。当必须在转基因植物或同源转基因植物中协调表达几个基因以实现特定效应时,鉴于必须鉴定其中每个基因均强烈表达的植物,这个问题尤其严重。

例如,取决于构建体设计和各个转化事件中T-DNA插入基因座的位置效应,转基因或同源转基因的表达可以显著地变动。强启动子可以部分地克服这些难题。然而,显示强烈表达同时特异性合乎需要的合适启动子的可获得性经常有限。为了确保可获得具有合乎需要的表达特异性的充足启动子,额外启动子的鉴定和表征可能有助于弥合这种缺口。然而,具有相应特异性和强度的启动子的天然可获得性和费时的候选启动子表征妨碍鉴定合适的新启动子。

另外,重组技术、基因组编辑和定向诱变的开发带来调节植物基因组中已存在基因的表达水平的可能性。然而,这受到能够调节任何靶启动子的活性的合适遗传元件的可用性限制。

为了克服这些难题,已经证明多样性遗传元件和/或基序积极地影响基因表达。在它们当中,已经认可一些内含子作为具有改善基因表达的强大潜能的遗传元件。虽然机制大多未知,但是已经显示一些内含子积极地影响成熟mRNA的稳态量,这可能通过增强转录活性、改善mRNA成熟、增强胞核mRNA输出和/或改善翻译起始来影响(例如Huang和Gorman,1990,Nucleic Acid Research 18;Le Hir等人,2003,Trend Biochem Sci 28;Nott等人,2004,Genes Dev.18)。

进一步,已经鉴定到并不必然与内含子有关的通用增强子。增强子是重要的顺式调节DNA元件,它们通过细胞类型/组织特异性方式召集转录因子并指引它们至靶基因的启动子,调节转录程序。基因表达可以受一个或多个增强子调节(Marand等人2017;Biochimica and BioBiophysica Acta 1860(131-139)。难以鉴定增强子,因为它们的位置相对于其同族启动子不可预测。它们可以位于某些已表达核酸的转录起始位点上游或下游并且可以在远离相应启动子的5000个或更多个核苷酸的位置发挥功能。引人注目地,已经在植物物种中仅鉴定到少数的增强子,这主要归因于缺少鉴定增强子的通用方法。

Ryan等人((2010),The Plant Journal 64,第446-455页)推测了位于普通小麦(Triticum aes-tivum)ALMT1启动子内部的串联重复序列的基因表达增强能力。然而,他们仅证实在串联重复序列AB或BC的三重体和基因表达增强之间的相关性,但是从未显示正式单个元件(如B元件)参与增强的基因表达。

Geng等人((2014)PLOS 9(8),e105363)推测了增强的基因表达和普通小麦HMW-GS1Bx7启动子中存在一个43核苷酸插入物的相关性。然而,他们证实,普通小麦中并非全部包含这个元件的HMW-GS 1Bx7启动子均显示增强的基因表达。另外,其他普通小麦1Bx启动子中这43个核苷酸的存在与增强的表达不相关。

两项研究结果强调了植物中鉴定通用增强子元件的困难。

本申请中将增强功能性连接的核酸表达的核酸分子描述为“增强核酸表达的核酸”(NEENA)。

发明详述

本发明的第一实施方案包括用于产生表达强度增强的启动子的方法,所述启动子包含一种或多种与启动子功能性连接的增强核酸表达的核酸(NEENA)分子,所述方法包括

i)具有如SEQ ID NO:1或2任一者中所限定的序列的核酸分子,和

ii)具有以下序列的核酸分子,所述序列与如SEQ ID NO:1或2所限定的任一序列具有80%或更大的同一性;相对于如SEQ ID NO:1或2所限定的任一序列,同一性优选地是85%或更大,同一性更优选地是90%或更大,同一性甚至更优选地是95%或更大、96%或更大、97%或更大、98%或更大或99%或更大,在最优选的实施方案中,同一性是100%,或

iii)30个或更多个核苷酸,40个或更多个核苷酸,50个或更多个核苷酸或100个或更多个核苷酸的核酸分子,所述核酸分子与包含SEQ ID NO:1或2的转录增强性核苷酸序列的至少30个、优选地至少40个、更优选地至少50个、甚至更优选地至少100个、最优选地至少150个连续核苷酸的核酸分子或其互补物在等同于7%十二烷基硫酸钠(SDS)、0.5MNaPO

iv)i)至iii)的核酸分子的30个或更多个连续碱基、优选地40个或更多个连续碱基、更优选地50个或更多连续碱基、甚至更优选地100个或更多个连续碱基的片段,所述片段具有例如65%或更大、优选地70%或更大、更优选地75%或更大、甚至更优选地80%或更大,85%或更大或90%或更大的增强表达活性,在最优选的实施方案中,它具有95%或更大如具有SEQ ID NO:1或2所限定的任一序列的序列的相应核酸分子那样的增强表达活性,或

v)具有如SEQ ID NO:1或2的任一者中所限定的序列的核酸分子,还包含至少1个核苷酸直至20个核苷酸、至少1个核苷酸直至15个核苷酸、至少1个核苷酸直至10个核苷酸、至少1个核苷酸直至5个核苷酸、至少1个核苷酸直至4个核苷酸、至少1个核苷酸直至3个核苷酸或甚至至少1个核苷酸直至2个核苷酸的插入、缺失、取代,或

vi)作为事先在i)至vi)下提到的核酸分子中任一者的互补物或反向互补物的核酸分子。

具有增强表达活性的片段可以包含SEQ ID NO:1从核苷酸位置1至核苷酸位置30的核苷酸序列、SEQ ID NO:1从核苷酸位置1至核苷酸位置35的核苷酸序列、SEQ ID NO:1从核苷酸位置1至核苷酸位置40的核苷酸序列、SEQ ID NO:1从核苷酸位置3至核苷酸位置33的核苷酸序列、SEQ ID NO:1从核苷酸位置3至核苷酸位置38的核苷酸序列、SEQ ID NO:1从核苷酸位置3至核苷酸位置43的核苷酸序列、SEQ ID NO:1从核苷酸位置8至核苷酸位置38的核苷酸序列、SEQ ID NO:1从核苷酸位置8至核苷酸位置43的核苷酸序列、SEQ ID NO:1从核苷酸位置13至核苷酸位置43的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置30的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置35的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置40的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置45的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置50的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置55的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置60的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置65的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置70的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置75的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置80的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置85的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置90的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置95的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置100的核苷酸序列、SEQ ID NO:2从核苷酸位置1至核苷酸位置105的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置35的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置40的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置45的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置50的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置55的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置60的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置65的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置70的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置75的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置80的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置85的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置90的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置95的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置100的核苷酸序列、SEQ ID NO:2从核苷酸位置5至核苷酸位置105的核苷酸序列、SEQ ID NO:2从核苷酸位置10至核苷酸位置40的核苷酸序列、SEQ IDNO:2从核苷酸位置10至核苷酸位置45的核苷酸序列、SEQ ID NO:2从核苷酸位置10至核苷酸位置50的核苷酸序列、SEQ ID NO:2从核苷酸位置10至核苷酸位置55的核苷酸序列、SEQID NO:2从核苷酸位置10至核苷酸位置60的核苷酸序列、SEQ ID NO:2从核苷酸位置10至核苷酸位置65的核苷酸序列、SEQ ID NO:2从核苷酸位置10至核苷酸位置70的核苷酸序列、SEQ ID NO:2从核苷酸位置10至核苷酸位置75的核苷酸序列、SEQ ID NO:2从核苷酸位置10至核苷酸位置80的核苷酸序列、SEQ ID NO:2从核苷酸位置10至核苷酸位置85的核苷酸序列、SEQ ID NO:2从核苷酸位置10至核苷酸位置90的核苷酸序列、SEQ ID NO:2从核苷酸位置10至核苷酸位置95的核苷酸序列、SEQ ID NO:2从核苷酸位置10至核苷酸位置100的核苷酸序列、SEQ ID NO:2从核苷酸位置10至核苷酸位置105的核苷酸序列、SEQ ID NO:2从核苷酸位置15至核苷酸位置45的核苷酸序列、SEQ ID NO:2从核苷酸位置15至核苷酸位置50的核苷酸序列、SEQ ID NO:2从核苷酸位置15至核苷酸位置55的核苷酸序列、SEQ ID NO:2从核苷酸位置15至核苷酸位置60的核苷酸序列、SEQ ID NO:2从核苷酸位置15至核苷酸位置65的核苷酸序列、SEQ ID NO:2从核苷酸位置15至核苷酸位置70的核苷酸序列、SEQ ID NO:2从核苷酸位置15至核苷酸位置75的核苷酸序列、SEQ ID NO:2从核苷酸位置15至核苷酸位置80的核苷酸序列、SEQ ID NO:2从核苷酸位置15至核苷酸位置85的核苷酸序列、SEQ IDNO:2从核苷酸位置15至核苷酸位置90的核苷酸序列、SEQ ID NO:2从核苷酸位置15至核苷酸位置95的核苷酸序列、SEQ ID NO:2从核苷酸位置15至核苷酸位置100的核苷酸序列、SEQID NO:2从核苷酸位置15至核苷酸位置105的核苷酸序列、SEQ ID NO:2从核苷酸位置20至核苷酸位置50的核苷酸序列、SEQ ID NO:2从核苷酸位置20至核苷酸位置55的核苷酸序列、SEQ ID NO:2从核苷酸位置20至核苷酸位置60的核苷酸序列、SEQ ID NO:2从核苷酸位置20至核苷酸位置65的核苷酸序列、SEQ ID NO:2从核苷酸位置20至核苷酸位置70的核苷酸序列、SEQ ID NO:2从核苷酸位置20至核苷酸位置75的核苷酸序列、SEQ ID NO:2从核苷酸位置20至核苷酸位置80的核苷酸序列、SEQ ID NO:2从核苷酸位置20至核苷酸位置85的核苷酸序列、SEQ ID NO:2从核苷酸位置20至核苷酸位置90的核苷酸序列、SEQ ID NO:2从核苷酸位置20至核苷酸位置95的核苷酸序列、SEQ ID NO:2从核苷酸位置20至核苷酸位置100的核苷酸序列、SEQ ID NO:2从核苷酸位置20至核苷酸位置105的核苷酸序列、SEQ ID NO:2从核苷酸位置25至核苷酸位置55的核苷酸序列、SEQ ID NO:2从核苷酸位置25至核苷酸位置60的核苷酸序列、SEQ ID NO:2从核苷酸位置25至核苷酸位置65的核苷酸序列、SEQ ID NO:2从核苷酸位置25至核苷酸位置70的核苷酸序列、SEQ ID NO:2从核苷酸位置25至核苷酸位置75的核苷酸序列、SEQ ID NO:2从核苷酸位置25至核苷酸位置80的核苷酸序列、SEQ IDNO:2从核苷酸位置25至核苷酸位置85的核苷酸序列、SEQ ID NO:2从核苷酸位置25至核苷酸位置90的核苷酸序列、SEQ ID NO:2从核苷酸位置25至核苷酸位置95的核苷酸序列、SEQID NO:2从核苷酸位置25至核苷酸位置100的核苷酸序列、SEQ ID NO:2从核苷酸位置25至核苷酸位置105的核苷酸序列、SEQ ID NO:2从核苷酸位置30至核苷酸位置60的核苷酸序列、SEQ ID NO:2从核苷酸位置30至核苷酸位置65的核苷酸序列、SEQ ID NO:2从核苷酸位置30至核苷酸位置70的核苷酸序列、SEQ ID NO:2从核苷酸位置30至核苷酸位置75的核苷酸序列、SEQ ID NO:2从核苷酸位置30至核苷酸位置80的核苷酸序列、SEQ ID NO:2从核苷酸位置30至核苷酸位置85的核苷酸序列、SEQ ID NO:2从核苷酸位置30至核苷酸位置90的核苷酸序列、SEQ ID NO:2从核苷酸位置30至核苷酸位置95的核苷酸序列、SEQ ID NO:2从核苷酸位置30至核苷酸位置100的核苷酸序列、SEQ ID NO:2从核苷酸位置30至核苷酸位置105的核苷酸序列、SEQ ID NO:2从核苷酸位置35至核苷酸位置65的核苷酸序列、SEQ IDNO:2从核苷酸位置35至核苷酸位置70的核苷酸序列、SEQ ID NO:2从核苷酸位置35至核苷酸位置75的核苷酸序列、SEQ ID NO:2从核苷酸位置35至核苷酸位置80的核苷酸序列、SEQID NO:2从核苷酸位置35至核苷酸位置85的核苷酸序列、SEQ ID NO:2从核苷酸位置35至核苷酸位置90的核苷酸序列、SEQ ID NO:2从核苷酸位置35至核苷酸位置95的核苷酸序列、SEQ ID NO:2从核苷酸位置35至核苷酸位置100的核苷酸序列、SEQ ID NO:2从核苷酸位置35至核苷酸位置105的核苷酸序列、SEQ ID NO:2从核苷酸位置40至核苷酸位置70的核苷酸序列、SEQ ID NO:2从核苷酸位置40至核苷酸位置75的核苷酸序列、SEQ ID NO:2从核苷酸位置40至核苷酸位置80的核苷酸序列、SEQ ID NO:2从核苷酸位置40至核苷酸位置85的核苷酸序列、SEQ ID NO:2从核苷酸位置40至核苷酸位置90的核苷酸序列、SEQ ID NO:2从核苷酸位置40至核苷酸位置95的核苷酸序列、SEQ ID NO:2从核苷酸位置40至核苷酸位置100的核苷酸序列、SEQ ID NO:2从核苷酸位置40至核苷酸位置105的核苷酸序列、SEQ ID NO:2从核苷酸位置45至核苷酸位置75的核苷酸序列、SEQ ID NO:2从核苷酸位置45至核苷酸位置80的核苷酸序列、SEQ ID NO:2从核苷酸位置45至核苷酸位置85的核苷酸序列、SEQ IDNO:2从核苷酸位置45至核苷酸位置90的核苷酸序列、SEQ ID NO:2从核苷酸位置45至核苷酸位置95的核苷酸序列、SEQ ID NO:2从核苷酸位置45至核苷酸位置100的核苷酸序列、SEQID NO:2从核苷酸位置45至核苷酸位置105的核苷酸序列、SEQ ID NO:2从核苷酸位置50至核苷酸位置80的核苷酸序列、SEQ ID NO:2从核苷酸位置50至核苷酸位置85的核苷酸序列、SEQ ID NO:2从核苷酸位置50至核苷酸位置90的核苷酸序列、SEQ ID NO:2从核苷酸位置50至核苷酸位置95的核苷酸序列、SEQ ID NO:2从核苷酸位置50至核苷酸位置100的核苷酸序列、SEQ ID NO:2从核苷酸位置50至核苷酸位置105的核苷酸序列、SEQ ID NO:2从核苷酸位置55至核苷酸位置85的核苷酸序列、SEQ ID NO:2从核苷酸位置55至核苷酸位置90的核苷酸序列、SEQ ID NO:2从核苷酸位置55至核苷酸位置95的核苷酸序列、SEQ ID NO:2从核苷酸位置55至核苷酸位置100的核苷酸序列、SEQ ID NO:2从核苷酸位置55至核苷酸位置105的核苷酸序列、SEQ ID NO:2从核苷酸位置60至核苷酸位置90的核苷酸序列、SEQ ID NO:2从核苷酸位置60至核苷酸位置95的核苷酸序列、SEQ ID NO:2从核苷酸位置60至核苷酸位置100的核苷酸序列、SEQ ID NO:2从核苷酸位置60至核苷酸位置105的核苷酸序列、SEQ IDNO:2从核苷酸位置65至核苷酸位置95的核苷酸序列、SEQ ID NO:2从核苷酸位置65至核苷酸位置100的核苷酸序列、SEQ ID NO:2从核苷酸位置65至核苷酸位置105的核苷酸序列、SEQ ID NO:2从核苷酸位置70至核苷酸位置100的核苷酸序列、SEQ ID NO:2从核苷酸位置70至核苷酸位置105的核苷酸序列,或者SEQ ID NO:2从核苷酸位置75至核苷酸位置105的核苷酸序列。

在一个实施方案中,一种或多种NEENA相对于功能性连接至NEENA的启动子为异源。

在又一个实施方案中,将本发明的NEENA在这样的位置引入启动子,其实所述位置在5'端和/或3’端毗邻于并非天然与本发明NEENA毗邻的序列,例如在WT植物的基因组中是这样。

在本发明的另一个实施方案中,将本发明NEENA的2个或更少副本引入启动子。

原则上,NEENA可以与任意的启动子如组织特异性、诱导型、发育特异性或组成型启动子功能性连接。相应的NEENA将导致在至少一种NEENA与其功能性连接的相应启动子控制下的异源核酸的增强表达。

一个或多个NEENA可以与任意的启动子功能性连接并且将增强在所述启动子控制下的核酸分子表达。待用于本发明任意方法中的组成型启动子可以源自植物例如单子叶或双子叶植物、源自细菌和/或病毒或可以是合成性启动子。待使用的组成型启动子例如是木薯脉花叶病毒启动子(Verdaguer B等人(1996).PMB 31(6),1129-39)、地下车轴草矮缩病毒启动子(Boevink P,等人(1995).Virology 207(2),354-61)、与组蛋白3A内含子组合的拟南芥(A.thali-ana)组蛋白4A启动子(Chaboute等人(1984).PMB 8(2),179-91)、欧洲油菜(B.napus)P450依赖性脂肪酸ω-羟化酶启动子(WO2016113333),来自稻的pAct10s启动子(McElroy等人(1990).Plant Cell 2(2),163-71)、来自欧芹(P.crispum)的PcUbi-启动子(WO 2003102198)、来自玉蜀黍(Zea mays)的ZmUbi-启动子(Christensen等人(1992).Plant Mol Biol.18(4),675-89)、来自编码腈水解酶1的拟南芥基因At3g44310的AtNit-启动子、来自玄参花叶病毒的34S-启动子(Sanger等人,1990,PMB 14(3))、来自花椰菜花叶病毒的35S-启动子(Odell等人(1985).Nature 313(6005),810-2)、从根癌农杆菌(Agrobacterium tumefaciens)衍生的nos启动子(Depicker等人(1982).J Mol ApplGenet.1(6),561-73)和ocs-启动子、ScBV-启动子(US 5 994 123)、超级启动子(Lee等人2007,Plant.Phys.145),来自编码铁氧还蛋白NADH还原酶的拟南芥基因At5g66190的AtFNR-启动子、来自豌豆(Pisum sativum)的ptxA启动子(WO2005085450)、来自编码磷酸三糖易位蛋白的拟南芥基因At5g46110的AtTPT-启动子、来自拟南芥基因At4g14880和At4g14890的双向AtOASTL-启动子、来自编码3-磷酸甘油醛脱氢酶的拟南芥基因At1g13440的PRO0194启动子、来自编码二磷酸果糖醛缩酶的拟南芥基因At3g52930的PRO0162启动子、AHAS-启动子(WO2008124495)、来自稻的咖啡酰辅酶A-MT启动子和OsCP12(WO2006084868)或来自稻的pGOS2启动子(de Pater等人(1992).Plant J.2(6),837-44)。

待用于本发明任意方法中的组织或发育特异性或诱导型启动子可以源自植物例如单子叶或双子叶植物、源自细菌和/或病毒或可以是合成性启动子。待使用的组织或发育特异性或诱导型启动子例如是种子特异性和/或种子偏好性启动子,例如来自普通小麦(T.aestivum)的高分子量麦谷蛋白Bx17启动子(Reddy P和Appels R(1993)Theor ApplGenet.85(5),616-24)、来自普通小麦的高分子量麦谷蛋白1Dx5启动子(Lamacchia等人(2001)J Exp Bot.52(355),243-50)、来自普通小麦的质体AGPase启动子(Thorneycroft等人(2003)Plant Biotechnol J.1(4),259-70),来自大麦(Hordeum vulgare)的大麦醇溶蛋白B1启动子(Brandt等人(1985)Carlsberg Research Communications 50,333)、来自蚕豆(Vicia faba)的SBP-启动子(WO2000026388)、来自蚕豆的未知种子蛋白质启动子(USP)(WO2003092362)、来自欧洲油菜(Brassica napus)的油菜籽蛋白启动子(EP0255378)、来自亚麻(Linum usitatissmum)的conlinin-启动子(WO2001016340)、来自编码过氧化还原蛋白样蛋白质的拟南芥基因At5g01670的启动子(WO2006089950)、来自亚麻的过氧化还原蛋白样蛋白质的启动子(WO2006089950)、来自欧洲油菜的球蛋白样蛋白质启动子(Roh等人,2014,Journal of the Ko-rean Society for Applied Biological Chemistry 57(5))、来自菜豆(Phaseolus vulgaris)的arcelin5-1启动子(WO 2012077020)、来自玉蜀黍的玉米醇溶蛋白启动子(Shepherd和Scott Biotechnol Appl Biochem.2009,52(3))、来自玉蜀黍的球蛋白启动子(Mei等人,2004,Maydica 49(4))、来自玉蜀黍的pKG86启动子(WO2010122110)、来自马铃薯(Solanum tuberosum)的叶特异性ST-LS1启动子(Stockhaus等人(1989)EMBO J.8(9),2445-51)、来自稻(oryza sativa)的叶特异性硫氧还蛋白启动子(Fukuda等人(2005)Plant Cell Physiol.46(11),1779-86)、来自陆地棉(G.hirsutum)的根特异性或根偏好性启动子Pbtg-26D(WO2017/025282)、来自玉蜀黍的PGL4和5(EP1862473)或来自玉蜀黍的Pzrp2(Held等人(1997)PMG 35(3),367–375)、来自拟南芥的诱导型启动子Phpr1(Wang等人(2009)Molecular Plant 2(1),191–200)、来自拟南芥的rd29a启动子(Yamaguchi-Shinozaki K和Shinozaki K(1994)Plant Cell 6(2),251-64)、来自玉蜀黍的蛋白酶抑制蛋白启动子(Cordero等人(1994)Plant J.6(2),141-50),或如WO2012093032、US2013081154、WO2004065571、WO2008083969或WO2012136788中所述的来自陆地棉的纤维特异性或偏好性启动子。

与NEENA功能性连接的本发明高表达启动子可以用于任意植物中,所述植物包括例如苔藓、蕨类植物、裸子植物或被子植物,例如单子或双子叶植物。在一个优选的实施方案中,与NEENA功能性连接的本发明所述启动子可以用于单子叶或双子叶植物中,优选地是作物植物如玉米、大豆、卡诺拉油菜、棉、马铃薯、甜菜、稻、小麦、高粱、大麦、芭蕉属植物、甘蔗、芒属植物等。在本发明的优选实施方案中,与NEENA功能性连接的所述启动子可以用于单子叶作物植物如玉米、稻、小麦、高粱、芭蕉属植物、芒属植物、甘蔗或大麦中。在一个特别优选的实施方案中,与NEENA功能性连接的启动子可以用于小麦中。

如本申请中所用的高表达性启动子意指例如与NEENA功能性连接的启动子,所述NEENA在植物或其部分中引起该启动子增强的表达,其中源自功能性连接于NEENA的相应启动子控制下的核酸分子的RNA积累或RNA合成速率比由缺少本发明NEENA的相同启动子引起的表达高,优选地显著更高。优选地,与相同条件下培育的包含不与本发明NEENA功能性连接的相同启动子的同龄对照植物相比,植物中相应核酸的RNA的量和/或RNA合成速率和/或RNA稳定性增加50%或更大,例如100%或更大、优选地200%或更大、更优选地5倍或更大、甚至更优选地10倍或更大、最优选地20倍或更大,例如50倍。

在本文中使用时,显著更高指技术人员知晓如何确定的统计显著性,例如通过对相应的数据集合应用统计检验如t-检验。

用于检测由启动子赋予的表达的方法是本领域已知的。例如,该启动子可以与标记基因如GUS、GFP或荧光素酶基因功能性连接,并且可以在植物或其部分中测定由相应标记基因编码的相应蛋白质的活性。作为代表性实例,下文详细描述用于检测荧光素酶的方法。其他方法例如是通过本领域已知的方法,例如RNA印迹分析法、qPCR、连缀(run-on)测定法或本领域所述的其他方法测量受该启动子控制的核酸分子的RNA稳态水平或合成速率。

技术人员知晓多种用于功能性连接两个或多个核酸分子的方法。此类方法可以包括限制性切割/连接法、不依赖连接酶的克隆法、重组工程法、重组或合成法。其他方法可以用来功能性连接两个或多个核酸分子。

本发明的又一个实施方案是用于产生植物或其部分的方法,所述植物或其部分与相应的对照植物或其部分相比具有一种或多种核酸分子的增强表达,所述方法包括步骤:将包含如上文在i)至vi)下所定义核酸分子的一种或多种NEENA引入所述植物或其部分,并且将所述一种或多种NEENA与启动子并且与处在所述启动子控制下的核酸分子功能性连接,其中NEENA对所述核酸分子为异源。

NEENA可以相对于处在NEENA与其功能性连接的所述启动子的控制下的核酸分子为异源,或它可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。

就核酸分子或DNA而言,术语“异源的”指这样的核酸分子,所述核酸分子有效连接于或受到操作以变成有效连接于自然界中不与该核酸分子有效连接或自然界中与该核酸分子在不同位置有效连接的第二种核酸分子。例如,本发明的NEENA在其天然环境中与其天然启动子功能性连接,而在本发明中,它与可以源自相同生物、不同生物或可以作为合成性启动子如SUPER-启动子的另一个启动子连接。它也可以意指本发明的NEENA与其天然启动子连接,但是处于所述启动子控制下的核酸分子相对于包含其天然NEENA的启动子为异源。此外,应当理解,启动子和/或处在与本发明NEENA功能性连接的所述启动子控制下的核酸分子相对于所述NEENA为异源,原因是它们的序列已经受到例如突变如插入、缺失等操作,从而启动子天然序列和/或处在所述启动子控制下的核酸分子的天然序列被修饰并且因此已经相对于本发明的NEENA变成异源。也可以理解,当NEENA与其天然启动子功能性连接,其中NEENA的位置相对于所述启动子改变,从而该启动子在这种操作后显示更高表达时,该NEENA相对于功能性连接至所述NEENA的核酸为异源。

如本文中所意指的显示核酸分子表达增强的植物意指一种植物,其与相同条件下培育的没有与相应核酸分子功能性连接的相应NEENA的对照植物相比,具有更高的、优选地统计显著更高的核酸分子表达。这种对照植物可以是野生型植物或是包含控制与本发明植物中相同的基因的相同启动子的转基因植物或同源转基因植物,其中所述启动子不与本发明的NEENA连接。

产生如本文中所用的植物包括用于稳定转化的方法,如借助农杆菌介导转化、原生质体转化、粒子轰击等将重组DNA构建体引入植物或其部分并且任选地随后再生出转基因植物或同源转基因植物。

它还包括用于瞬时转化植物或其部分的方法,如病毒感染法或农杆菌浸润法。技术人员知晓用于稳定和/或瞬时转植物或其部分的其他方法。

多种方法如使用供体DNA的原生质体融合或重组技术也可能用于产生本发明植物并且由本发明涵盖。例如,使用本领域已知的重组技术如TALEN(WO12138939、WO12138927);锌指蛋白(WO02057293、WO05084190)、归巢核酸内切酶(WO11104382、WO14199358)或核酸导引的核酸酶如AGO、Cas9或Cas12(WO13141680、WO13176772、WO14093595、WO15157534或WO16205711),可以向植物的基因组引入单链断口(切刻)或双链断口。连同引入这类单链或双链断口诱导剂一起,可以向植物或其部分引入一种或多种供体DNA(WO13176772、WO14089290),包括旁侧有以下核酸分子的NEENA分子,所述核酸分子包含与切刻或双链断口毗邻的区域基本上相同或基本上互补的序列,因而促进同源重组并且向植物或其部分的基因组引入NEENA分子。

进一步,可以通过以下方式将本发明NEENA的序列引入基因组并且与相应的异源启动子功能性连接:使用多种技术如脱氨酶等(WO0058480、WO18027078)向基因组引入一系列点突变,所述技术可以通过将致突变性多肽部分(例如脱氨酶或糖苷酶)与DNA结合多肽(例如TALEN、锌指蛋白质、归巢核酸内切酶或RNA导引的核酸酶,切刻酶或失活的核酸酶如Cas9或Cas12)融合,指向植物或其部分的基因组中特定区域,如WO15089406、US2017321210、WO15133554或WO17070632中所述。通过应用这些方法,在不引入异源分子的情况下,向基因组引入NEENA序列,不过NEENA序列代替基因组中的另一个序列。这类技术由术语向基因组中“整合”或“引入”NEENA序列或“整合”或“引入”NEENA分子并且将这类序列和/或分子与异源启动子功能性连接所涵盖。

本发明的方法可以适用于任意植物,例如裸子植物或被子植物,优选地是被子植物,例如双子叶或单子叶植物,优选地是单子叶植物。优选的单子叶植物例如是玉米(corn)、小麦、稻、大麦、高粱、芭蕉属植物、甘蔗、芒属植物和短柄草属植物(Brachypodium),特别优选的单子叶植物是玉米、小麦和稻,最优选小麦。优选的双子叶植物是例如大豆、油菜、卡诺拉油菜、亚麻、棉、马铃薯、甜菜、万寿菊和拟南芥属植物(Arabidopsis),特别选的双叶植物是大豆、油菜、卡诺拉油菜和马铃薯。

在本发明方法的一个实施方案中,通过应用基因组编辑技术,将一个或多个NEENA分子或NEENA序列整合入植物或其部分的基因组中。

在本发明方法的又一个实施方案中,基因组编辑技术包括使用核酸导引的核酸酶,例如AGO、Cas9或Cas12核酸酶、TALEN、归巢核酸内切酶或锌指蛋白,在NEENA分子待整合入基因组的位置处引入单链断口或双链断口,并且进一步包括引入DNA修复模板,所述DNA修复模板包含NEENA分子并且在其3′末端和5′末端包含与单链断口或双链断口上游和/或下游基本上相同或基本上互补的序列,促进在单链断口或双链断口的位置处重组。优选地,基本上相同或基本上互补的序列各自单独地长至少1000个、至少500个碱基、至少450个碱基、至少400个碱基、至少350个碱基、至少300个碱基、至少250个碱基、至少200个碱基、至少150个碱基、至少100个碱基或至少50个碱基。优选地,同一性或互补性序列是至少50%、至少60%、至少70%至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少98或至少99%与这些序列重组的相应基因组区域相同或互补。

在本发明方法的又一个实施方案中,基因组编辑技术包括在植物或其部分的基因组中引入点突变,因而在植物的基因组中引入NEENA的序列。这可能例如通过引入功能上与胞苷脱氨酶(WO17070633)或腺嘌呤脱氨酶(WO18027078)结合的DNA结合蛋白,例如锌指蛋白、TALE蛋白或核酸导引的核酸酶(例如Cas9、Cas12(CpfI)或AGO)来实现。

在本发明的一个实施方案中,如上文定义的方法包括以下步骤:

a)向植物或其部分引入包含如上文的i)至vi)中所限定核酸分子的一种或多种NEENA,并且

b)将所述一种或多种NEENA整合至所述植物或其部分的基因组中,从而所述一种或多种NEENA与相对所述一种或多种NEENA为异源的内源表达核酸功能性连接,并且任选地

c)从所述转化的细胞再生出包含所述一种或多种NEENA的植物或其部分。

NEENA可以相对于处在NEENA与其功能性连接的所述启动子的控制下的核酸分子为异源,或它可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。

可以将一个或多个NEENA分子借助粒子轰击法、原生质体电穿孔法、病毒感染法、农杆菌介导转化法、CRISPR/Cas或本领域已知的任意其他方法引入植物或其部分。可以将NEENA分子按CRISPR/Cas方案引入整合例如至质粒或病毒DNA或病毒RNA或供体DNA中。NEENA分子也可以在引入植物或植物部分中之前包含于BAC、YAC或人工染色体上。也可以将NEENA分子作为包含NEENA序列的线性核酸分子引入,其中额外的序列可以紧邻该核酸分子上的NEENA序列存在。毗邻NEENA序列的这些序列可以长约20bp,例如20bp至数百碱基对,例如100bp或更多,并且可以促进整合至基因组中,例如通过同源重组。可以使用用于基因组整合的任何其他方法,无论它是定向整合法,如同源重组,或随机整合法,如非常规(illegitimate)重组。

NEENA分子可以与其功能连接的内源表达核酸可以是任意核酸,优选地是任意的表达的核酸分子。该核酸分子可以编码是蛋白质的核酸分子或非编码性分子如反义RNA、rRNA、tRNA、miRNA、ta-siRNA、siRNA、dsRNA、snRNA、snoRNA或本领域已知的任何其他非编码性RNA。

实施本发明方法的又一种方式可以是

a)提供包含一种或多种NEENA的表达构建体,所述NEENA包含如上文i)至vi)中限定的核酸分子,所述核酸分子与上文定义的启动子并且与一个或多个核酸分子功能性连接,所述后一核酸分子相对于所述一种或多种NEENA为异源并处于所述启动子控制下,并且

b)将包含所述一种或多种NEENA的所述表达构建体整合至所述植物或其部分的基因组中,并且任选地

c)从所述转化的植物或其部分再生出包含所述一个或多个表达构建体的植物或其部分。

NEENA可以相对于处在NEENA与其功能性连接的所述启动子的控制下的核酸分子为异源,或它可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。

表达构建体可以借助本领域已知的任何方法整合至相应植物的基因组中。使用多种方法如粒子轰击法或农杆菌介导转化法或CRISPR/Cas应用时,整合可以是随机的。在优选的实施方案中,整合借助定向整合例如,通过同源重组进行。后一种方法将允许包含与NEENA功能性连接的高表达启动子的表达构建体整合至有利的基因组区域中。有利的基因组区域例如是已知包含例如在种子中高度表达的基因的基因组区域,并且因而与显示无转录活性的基因组区域相比,可以增加源自所述表达构建体的表达。

在另一个优选的实施方案中,所述一种或多种NEENA与靠近所述异源核酸分子的转录起始位点的启动子功能性连接。

如本文中所意指的靠近转录起始位点包括一种或多种NEENA与远离所述异源核酸分子的转录起始位点5000bp或更少、4000bp或更少、3000或更少、2500bp或更少、优选2000bp或更少、更优选1500bp或更少、甚至更优选1000bp或更少并且最优选地500bp或更少的启动子功能性连接。应当理解,该NEENA可以距相应启动子的转录起始位点以相应距离在上游或下游整合。因而,一种或多种NEENA可以包含于受功能性连接于所述一种或多种NEENA的优选性组成型启动子控制的相应异源核酸的初级转录物中或其可以整合入启动子分子中。如果NEENA整合在相应启动子的转录起始位点下游,整合位点优选地处于该启动子的控制下异源核酸的5′UTR、3′UTR或内含子中,最优选地,它整合在相应异源核酸的第1内含子中。

优选地,一种或多种NEENA整合在启动子、5′UTR或第1内含子中或NEENA替换启动子、5′UTR或第1内含子中的一部分。

在其中所述一个或多个NEENA与7A海藻糖-6-磷酸磷酸酶(T6PP)基因(WO/2018/113702,SEQ ID NO.13)连接的本发明另一个方面,NEENA可以在翻译起始密码子上游约200bp处、约397bp处、约676bp处或约1000bp处插入。所述一种或多种NEENA可以在翻译起始密码子的上游介于150和250bp之间、350和450bp之间、620和720bp之间或950和1000bp之间的位置插入7A海藻糖-6-磷酸磷酸酶(T6PP)基因中。

本发明的又一个实施方案包括含有一种或多种NEENA的重组表达构建体,其中所述的NEENA包含上文i)至vi)中所限定的核酸分子。

重组表达构建体可以还包含与一种或多种NEENA功能性连接的一个或多个启动子和任选地一个或多个已表达的核酸分子,所述核酸分子相对于所述一种或多种NEENA为异源。

NEENA可以相对于处在NEENA与其功能性连接的所述启动子的控制下的核酸分子为异源,或它可以相对于该启动子和处在该启动子控制下的核酸分子均为异源。

该表达构建体可以包含与NEENA功能性连接的启动子和相对于相应的NEENA为异源的待表达核酸分子的一个或多个,例如两个或更多个,例如5个或更多个,如10个或更多个组合。该表达构建体也可以包含其他启动子,所述的其他启动子不包含与相对于相应的启动子为同源或异源的待表达核酸分子功能性连接的NEENA。

包含如上文定义的一个或多个重组表达构建体的重组表达载体是本发明的另一个实施方案。可以在本发明中使用的多种表达载体是技术人员已知的。用于将包含这种表达构建体的此种载体引入植物基因组中的方法和用于从转化的细胞恢复转基因植物或同源转基因植物的方法也是本领域熟知的,其中所述的表达构建体包含例如与NEENA功能性连接的启动子和任选地其他元件如终止子。取决于用于转化植物或其部分的方法,完整载体可以整合至所述植物或其部分的基因组,或载体的某些组分可以整合至所述基因组中,例如T-DNA。

本发明中还包括植物或其部分,其包含如上文i)至vi)中限定的一种或多种异源NEENA。如果NEENA是合成的、源自不可杂交生物(转基因)、可杂交生物(同源转基因)或相同生物,但是其天然基因组位置与对照植物(同源转基因)例如野生型植物相比被转换(rendered),则将NEENA理解为相对于该植物是异源的。应当理解,转换的基因组位置意指,NEENA位于另一条染色体上或位于同一条染色体上,但是脱离其在野生型植物中的天然基因组位置10kb或更远,例如10kb,优选地5kb或更远,例如5kb,更优选地1000bp或更远,例如1000bp,甚至更优选地500bp或更远,例如500bp,特别优选地100bp或更远,例如100bp,最优选地10bp或更远,例如10bp。

包含如上文定义的重组表达载体或如上文定义的重组表达构建体的细胞或植物或其部分是本发明的又一个实施方案。细胞、植物或其部分可以选自细菌、真菌、酵母或植物、昆虫细胞或哺乳动物细胞或植物。优选地,细胞是细菌、真菌、酵母或植物细胞。优选的细菌是肠杆菌属细菌如大肠杆菌(E.coli)和农杆菌属的细菌,例如根癌农杆菌(Agrobacterium tu-mefaciens)和发根农杆菌(Agrobacterium rhizogenes)。优选的植物是单子叶或双子叶植物,例如单子叶或双子叶作物植物,如玉米、大豆、卡诺拉油菜、棉、马铃薯、甜菜、稻、小麦、高粱、大麦、芒属植物、芭蕉属植物、甘蔗等。优选的作物植物是玉米、稻、小麦、大豆、卡诺拉油菜、棉或马铃薯。特别优选的双子叶作物植物是大豆、卡诺拉油菜、棉或马铃薯。

特别优选的单子叶作物植物是玉米、小麦和稻。最优选地是小麦。

包含从如上文定义的细胞或植物或其部分衍生的所述异源NEENA的细胞培养、种子、部分或繁殖材料是本发明的其他实施方案,其中所述细胞或植物或其部分包含如上文在i)至vi)中定义的所述异源NEENA或如上文定义的所述重组表达构建体或所述重组载体。

如本文中所意指的部分或繁殖材料包含包含相应NEENA、重组表达构建体或重组载体的全部组织和器官,例如叶、茎和果实以及用于植物繁殖和/或再生的材料如插条、接穗、压条、枝条或幼苗(shoot)。

本发明的又一个实施方案是如上文在i)至vi)中定义的NEENA或如上文定义的重组构建体或重组载体用于增强植物或其部分中表达的用途。

本申请在本文提供增强基因表达的核酸分子,即包含一个或多个与一种或多种NEENA功能性连接的启动子的构建体。另外,提供了此类增强基因表达的核酸分子和包含此类增强异源基因表达的核酸分子的表达构建体、表达载体、转基因植物或其部分和细胞的用途。

本发明中还包括从如上文定义的细胞或植物或其部分衍生的细胞培养物、种子、部分或繁殖材料用于生产食品、动物饲料、种子、药物或精细化学品的用途,所述细胞培养物、种子、部分或繁殖材料包含异源NEENA。

定义

缩略语:NEENA–增强核酸表达的核酸,GFP–绿色荧光蛋白,GUS–β-葡萄糖醛酸酶,BAP–6-苄氨基嘌呤,2,4-D–2,4-二氯苯氧乙酸,MS–Murashige-Skoog培养基,NAA–1-萘乙酸,MES,2-(N-吗啉代)-乙磺酸,IAA:吲哚乙酸,Kan:硫酸卡那霉素,GA3–赤霉酸,Timentin

应当理解,本发明不限于具体的方法或方案。还应当理解本文所用的术语目的仅在于描述具体实施方案,并且不意图限制本发明,本发明将仅受所附权利要求书限制。必须指出,除非上下文另外明确指出,否则如本文中和所附权利要求中所用,单数形式“一个”、“一种”和“该”包括复数称谓。因此,例如,对“一种载体”的称谓是对一种或多种载体的称谓并且包括本领域技术人员已知的其等同物等。术语“约”在本文中用来指大约、大致、左右和在……范围内。当术语“约”与一个数字范围联合使用时,它通过扩展界限值高于和低于所述数值而修饰该范围。通常而言,术语“约”在本文中用来通过20%、优选地10%之上或之下(更高或更低)变异而修饰高于和低于所述值的数值。如本文中所用,词汇“或”意指特定列出的任何一成员并且还包括该列出的成员的任意组合。在本说明书中及以下权利要求中使用时,词汇“包含”、“包含着”、“包括”、“包括着”和“包括了”意图指明一个或多个所述特征、整数、组分或步骤的存在,但是它们不排除一个或多个其他特征、整数、组分、步骤或其组的存在或添加。为清晰起见,将本说明书中使用的某些术语如下定义并使用。

反平行:“反平行”在本文中指经互补性碱基残基之间氢键配对的两个核苷酸序列,其中磷酸二酯键在一个核苷酸序列中以5'-3'方向趋向并且在另一个核苷酸序列中以3'-5'方向趋向。

反义:术语“反义”指相对于其转录或发挥作用的正常方向为反向并且从而表达下述RNA转录物的核苷酸序列,其中所述的RNA转录物与宿主细胞内部表达的靶基因mRNA分子互补(例如,它可以借助Watson-Crick碱基配对作用与靶基因mRNA分子或单链基因组DNA杂交)或与靶DNA分子(例如宿主细胞中存在的基因组DNA)互补。

编码区:如本文中所用,术语“编码区”在谈及结构基因使用时,指编码在作为mRNA分子翻译结果的新生多肽中存在的氨基酸的核苷酸序列。在真核生物中,编码区在5'侧以编码起始子甲硫氨酸的核苷酸三联体“ATG”为界并且在3'侧,以指定终止密码子的三种三联体(即TAA、TAG、TGA)之一为界。除了包含内含子外,基因的基因组形式还可以包含位于RNA转录物中存在的序列的5'端及3'端二者上的序列。这些序列称作“侧翼”序列或区(这些侧翼序列位于mRNA转录物上存在的非翻译序列的5'或3')。5'-侧翼区可以含有控制或影响基因转录的调节序列如启动子和增强子。3'-侧翼区可以含有指导转录终止、转录后剪切和聚腺苷酸化的序列。

互补的:“互补的”或“互补性”指包含反平行核苷酸序列的两个核苷酸序列,其中一旦在反平行核苷酸序列中的互补性碱基残基之间形成氢键,则所述反平行核苷酸序列能够相互配对(通过碱基配对原则)。例如,序列5'-AGT-3'与序列5'-ACT-3'互补。互补性可以是“部分的”或“全部的”。“部分”互补性是其中一个或多个核酸碱基根据碱基配对规则未匹配的情况。核酸分子之间的“全部”或“完全”互补性是其中每个核酸碱基按照碱基配对规则与另一个碱基匹配的情况。核酸分子链之间互补性的程度对核酸分子链之间杂交的效率和强度具有明显影响。如本文中所用的核酸序列“互补物”指这样的核苷酸序列,其核酸分子显示与该核酸序列的核酸分子的全部互补性。

双链RNA:“双链RNA分子”或“dsRNA”分子包含核苷酸序列的有义RNA片段和该核苷酸序列的反义RNA片段,二者均包含彼此互补的核苷酸序列,因而允许有义RNA片段和反义RNA片段配对并形成双链RNA分子。

内源:“内源”核苷酸序列指存在于未转化或野生型植物细胞的基因组中的核苷酸序列。

增强的表达:“增强”或“增加”核酸分子在植物细胞中的表达在本文中同等地使用,并且意指该核酸分子在应用本发明方法之后在植物、植物部分或植物细胞中的表达水平比其在应用该方法之前在植物、植物部分或植物细胞中的表达更高,或与缺少本发明重组核酸分子的参比植物相比更高。例如,参比植物包含仅缺少相应NEENA的相同构建体。如本文中所用的术语“增强”或“增加”是同义的,并且在本文中意指待表达的核酸分子的更高、优选显著更高的表达。如本文中所用,“增强”或“增加”某物质(如蛋白质、mRNA或RNA)的水平意指相对于基本上相同条件下培育的、缺少本发明重组核酸分子(例如缺少本发明的NEENA分子、重组构建体或重组载体)的基本上相同植物、植物部分或植物细胞,该水平增加。如本文中所用,“增强”或“增加”某物质(例如由靶基因表达的前RNA、mRNA、rRNA、tRNA、snoRNA、snRNA和/或由其编码的蛋白质产物)的水平意指,相对于缺少本发明重组核酸分子的细胞或生物,该水平增加50%或更多,例如100%或更多,优选地200%或更多,更优选地5倍或更多倍,甚至更优选地10倍或更多倍,最优选地20倍或更多倍,例如50倍。可以通过技术人员熟悉的方法测定所述增强或增加。因而,可以例如通过蛋白质的免疫学检测法确定核酸或蛋白质量的增强或增加。另外,可以使用技术如蛋白质测定法、荧光法、RNA杂交法、核酸酶保护测定法、逆转录法(定量RT-PCR)、ELISA(酶联免疫吸附测定法)、蛋白质印迹法、放射免疫测定法(RIA)或其他免疫测定法和荧光激活的细胞分析(FACS)来测量植物或植物细胞中的特定蛋白质或RNA。取决于所诱导蛋白质产物的类型,也可以确定其活性或对生物或细胞表型的影响。用于确定蛋白质数量的方法是技术人员已知的。可以提到的实例是:微量Biuret法(Goa J(1953)Scand J Clin Lab Invest 5:218-222)、Folin-Ciocalteau法(Lowry OH等人(1951)J Biol Chem 193:265-275)或测量CBB G-250的吸光度(BradfordMM(1976)Analyt Biochem 72:248-254)。作为用于量化蛋白质的活性的一个实例,在下文实施例中描述荧光素酶活性检测法。

表达:“表达”指基因产物的生物合成,优选地指细胞中核苷酸序列例如内源基因或异源基因的转录和/或翻译。例如,在结构基因的情况下,表达涉及结构基因转录成mRNA并且任选地随后mRNA翻译成一种或多种多肽。在其他情况下,表达可以仅指携带RNA分子的DNA的转录。

表达构建体:如本文中所用的“表达构建体”意指能够指导特定核苷酸序列在适宜植物部分或植物细胞中表达的DNA序列,该DNA序列包含在将引入此DNA序列的所述植物部分或植物细胞中有功能的启动子,所述启动子与任选地有效连接至终止信号的目的核苷酸序列有效连接。如果需要翻译,该DNA序列一般还包含为正确翻译所述核苷酸序列所需的序列。编码区可以编码目的蛋白,但也可以以有义或反义方向编码功能性目的RNA,例如RNAa、siRNA、snoRNA、snRNA、microRNA、ta-siRNA或任何其他非编码的调节性RNA。包含目的核苷酸序列的表达构建体可以是嵌合的,这意指该表达构建体的组件中一者或多者相对于该表达构建体的其他组件中一者或多者是异源的。该表达构建体也可以是一种这样的表达构建体,它天然地存在,但已经以用于异源表达的重组形式获得。然而,一般而言,该表达构建体相对于宿主是异源,即,该表达构建体的特定DNA序列不天然存在于宿主细胞中并且必须已经通过转化事件引入宿主细胞或该宿主细胞的祖先中。该表达构建体中的核苷酸序列的表达可以处于组成型启动子或处于仅在宿主细胞暴露于一些特定外部刺激时才启动转录的诱导型启动子的控制下。在植物的情况下,该启动子也可以是针对特定组织或器官或发育阶段特异的。

外来:术语“外来”指通过实验操作引入细胞基因组中并且从与所述细胞源自其中的物种不可杂交的物种起源的任何核酸分子(例如,基因序列)。它可以包括这样的序列,所述序列含有一些修饰(例如,点突变、存在可选择标记基因等)并且因此相对于天然存在的序列为不同。

功能性连接:将术语“功能性连接”或“功能性连接的”理解为意指例如调节性元件(例如启动子)与待表达的核酸序列并且根据需要与其他调节性元件(例如,终止子或NEENA)以如此方式依次排列,从而每种调节性元件可以履行其目的功能以允许、修饰、促进或影响所述核酸序列的表达。作为同义词,可以使用“有效连接”或“有效连接的”。取决于核酸序列的排列,表达可以产生有义或反义RNA。为此目的,不是必需要求化学意义上的直接连接。遗传控制序列例如增强子序列也能够从远离的位置或甚至从其它DNA分子对靶序列产生其作用。优选的排列是这样的排列,其中待表达的核酸序列重组地位于充当启动子的序列之后,从而这两个序列相互共价地连接。该启动子序列与待重组表达的核酸序列之间的距离优选地小于200碱基对、特别地优选小于100碱基对、非常特别优选地小于50碱基对。在优选的实施方案中,待转录的核酸序列以如此方式位于启动子之后,其中转录起点与本发明嵌合RNA的合乎需要的开端相同。功能性连接和表达构建体可以借助如(例如,在Maniatis T,Fritsch EF和Sambrook J(1989)Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory,Cold Spring Harbor(NY);Silhavy等人(1984)Experiments with Gene Fusions,Cold Spring Harbor Laboratory,Cold SpringHarbor(NY);Ausubel等人(1987)Current Proto-cols in Molecular Biology,GreenePublishing Assoc.and Wiley Interscience;Gelvin等人(编著)(1990)Plant MolecularBiology Manual;Kluwer Academic Publisher,Dordrecht,The Netherlands)所述的惯用重组和克隆技术产生。然而,其他序列,例如充当带限制性酶特定切割位点的接头或充当信号肽的序列,也可以位于这两个序列之间。序列的插入也可以导致融合蛋白表达。优选地,由调节性区域例如启动子和待表达核酸序列的连接组成的表达构建体可以按载体整合的形式存在并且被插入植物基因组,例如通过转化插入。

基因:术语“基因”指与能够以某种方式调节基因产物(例如,多肽或功能性RNA)表达的适宜调节序列有效连接的区域。基因包括DNA中位于编码区(可读框,ORF)之前(上游)和之后(下游)的非翻译调节区(例如启动子、增强子、阻抑物等),以及在适用情况下,在各个编码区(例如外显子)之间的间插序列(即内含子)。如本文中所用的术语“结构基因”意指转录成mRNA的DNA序列,其中所述的mRNA随后翻译成表征特定多肽的氨基酸序列。

基因组和基因组DNA:术语“基因组”或“基因组DNA”指宿主生物的可遗传信息。所述基因组DNA包括胞核的DNA(也称作染色体DNA),还包括质体(例如,叶绿体)和其他细胞器(例如,线粒体)的DNA。优选地,术语“基因组”或基因组“DNA”指胞核的染色体DNA。

异源:就核酸分子或DNA而言,术语“异源的”指这样的核酸分子,所述核酸分子有效连接于或受到操作以变成有效连接于自然界中(例如,野生型(WT)植物的基因组中)不与该核酸分子有效连接或自然界中(例如,所述WT植物的基因组中)与该核酸分子在不同部位或位置有效连接的第二种核酸分子,例如启动子。

优选地,就核酸分子或DNA(例如NEENA)而言,术语“异源的”指这样的核酸分子,所述核酸分子有效连接于或受到操作以变成有效连接于自然界中并不与之有效连接的第二种核酸分子,例如,启动子。

包含核酸分子和与之连接的一个或多个调节性核酸分子(如启动子或转录终止信号)的异源表达构建体例如是源自实验操作的构建体,在所述构建体中,a)所述核酸分子或b)所述调节性核酸分子或c)二者(即(a)和(b))不位于其天然(原有)遗传环境中或已经因实验操作受到修饰,修饰的实例是一个或多个核苷酸残基的置换、添加、缺失、倒位或插入。天然遗传环境指来源生物中的天然染色体基因座或指存在于基因组文库中。在基因组文库的情况下,优选地保留,至少部分地保留该核酸分子的序列的天然遗传环境。该环境分布在该核酸序列的至少一侧并且具有至少50bp、优选地至少500bp、特别优选地至少1,000bp、非常特别优选地至少5,000bp序列长度。天然存在的表达构建体例如启动子与相应基因的天然存在组合-在通过非天然的合成性“人工”方法(例如诱导的诱变法)修饰时变成异源表达构建体。已经描述了此类方法(US 5,565,350;WO 00/15815)。例如,与启动子有效连接的编码蛋白质的核酸分子相对于该启动子视为异源,其中所述的启动子不是该核酸分子的天然启动子。异源DNA可以相对于导入该异源DNA的细胞不是内源的或不天然与该细胞相关,但是已经从另一种细胞获得或已经合成。异源DNA还包括含有一些修饰的内源DNA序列、不天然存在的多拷贝内源DNA序列或这样的DNA序列,该DNA序列不与同物理连接于所述DNA序列的另一个DNA序列天然接合。通常地,虽然不必然地,异源DNA编码正常情况下引入所述异源DNA的细胞不编码的RNA或蛋白质。

高表达启动子:如本文中所用的“高表达启动子”意指在植物或其部分中引起表达的启动子,其中源自处于相应启动子控制下的核酸分子中的RNA积累或合成速率或RNA稳定性比缺少本发明NEENA的启动子所引起的表达更高,优选显著更高。优选地,相对于缺少本发明NEENA的启动子,RNA的量和/或RNA合成速率和/或RNA稳定性增加50%或更大,例如100%或更多,优选地200%或更多,更优选地5倍或更多倍,甚至更优选地10倍或更多倍,最优选地20倍或更多倍,例如50倍。

杂交:如本文中所定义的术语“杂交”是其中基本上互补的核苷酸序列相互复性的过程。杂交过程可以完全在溶液中进行,即两种互补性核酸均处于溶液中。杂交过程也可以在互补性核酸之一固定到基质如磁珠、琼脂糖凝胶(Sepharose)珠或任何其他树脂的情况下发生。杂交过程也可以在互补性核酸之一固定至固相支持体如硝酸纤维素膜或尼龙膜上或通过例如照相平版印刷术固定至例如硅酸玻璃支持物(后者称作核酸阵列或微阵列或称作核酸芯片)上的情况下进行。为使杂交发生,通常将核酸分子热变性或化学变性以使双链解链成为两条单链和/或去除来自单链核酸的发夹或其它二级结构。

术语“严格性”指杂交发生的条件。杂交的严格性受条件如温度、盐浓度、离子强度和杂交缓冲液组成的影响。通常,将低严格条件选择成在定义的离子强度和pH处,低于特定序列的热解链温度(Tm)约30℃。中等严格条件是当所述温度在Tm以下20℃时,并且高严格条件是当所述温度在Tm以下10℃时。高严格杂交条件一般用于分离与靶核酸序列具有高序列相似性的杂交序列。但是,核酸可以在序列上悖离并且仍然编码基本上相同的多肽,原因在于遗传密码简并性。因而,有时候可能需要中等严格杂交条件以鉴定此类核酸分子。

“Tm”是在确定的离子强度和pH时的温度,在所述温度下50%的靶序列在所述温度与完美匹配的探针杂交。Tm取决于溶液条件组合物和探针的碱基组成及长度。例如,较长的序列在较高的温度下特异性杂交。最大杂交速率从低于Tm约16℃直至32℃获得。杂交溶液中一价阳离子的存在降低两条核酸链之间的静电排斥作用,因而促进杂交分子形成;这种作用对于高达0.4M的钠浓度是显而易见的(对于更高浓度,可以忽略这种作用)。甲酰胺降低DNA-DNA和DNA-RNA双链体的解链温度,每百分数甲酰胺降低0.6-0.7℃,并且添加50%甲酰胺允许在30-45℃进行杂交,虽然杂交速率会降低。碱基对错配降低杂交速率及双链体的热稳定性。平均而言并且对于大的探针来说,每%碱基错配Tm下降约1℃取决于杂交分子的类型,Tm可以使用以下等式计算:

DNA-DNA杂交分子(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):

T

DNA-RNA或RNA-RNA杂交分子:

T

寡DNA杂交体或寡RNAd杂交体:

对少于20个核苷酸而言:Tm=2(ln)

对于20-35个核苷酸:Tm=22+1.46(ln)

a或对于其他一价阳离子,而仅在0.01-0.4M范围内是精确的。

b仅对于%GC在30%至75%范围内是精确的。

c L=双链体的长度(以碱基对计)。

可以使用许多已知技术中任意一种技术控制非特异性结合,例如将膜以含有蛋白质的溶液封闭、添加异源RNA、异源DNA和SDS至杂交缓冲液,并且用RNA酶处理。对于非相关的探针,可以通过改变以下条件之一进行一系列杂交:(i)渐进地降低复性温度(例如从68℃至42℃)或(ii)渐进地降低甲酰胺浓度(例如从50%至0%)。技术人员了解杂交期间可以加以改变和将维持或改变严格条件的多种参数。

除了杂交条件之外,杂交特异性一般还取决于杂交后洗涤的功能。为除去因非特异性杂交所致的背景,样品用稀的盐溶液洗涤。此类洗涤的关键因素包括最终洗涤溶液的离子强度和温度:盐浓度越低并且洗涤温度越高,则洗涤的严格性越高。洗涤状态一般在杂交严格性处或低于杂交严格性而进行。阳性杂交产生至少两倍于背景信号的信号。通常,用于核酸杂交分析法或基因扩增检测方法的合适严格条件如上所述。也可以选择更严格或更不严格的条件。技术人员了解洗涤期间可以加以改变和将维持或改变严格性条件的多种参数。

例如,用于长度大于50个核苷酸的DNA杂交分子的常见高严格杂交条件包括在65℃于1×SSC中或在42℃于1×SSC和50%甲酰胺中杂交,随后在65℃于0.3×SSC中洗涤。用于长度大于50个核苷酸的DNA杂交分子的中等严格杂交条件的实例包括在50℃于4×SSC或在40℃于6×SSC和50%甲酰胺中杂交,随后在50℃于2×SSC中洗涤。杂交分子的长度是杂交用核酸的预期长度。当杂交序列已知的核酸时,可以通过比对序列并鉴定本文中所述的保守区域而确定杂交体长度。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以额外地包含5x Denhardt试剂、0.5-1.0%SDS、100μg/ml变性的片段化鲑精DNA、0.5%焦磷酸钠。高严格性条件的另一个实例是在65℃于包含0.1SDS和任选地5x Denhardt试剂、100μg/ml变性片段化鲑精DNA、0.5%焦磷酸钠的0.1x SSC中杂交,随后在65℃于0.3x SSC中的洗涤。

出于定义严格性水平的目的,可以参考Sambrook等(2001)Molecular Cloning:alaborato-ry manua,第3版,Cold Spring Harbor Laboratory Press,CSH,New York或参考Current Proto-cols in Molecular Biology,John Wiley&Sons,N.Y.(1989和年度更新版)。

“同一性”:在比较两个或多个核酸或氨基酸分子使用时,“同一性”意指所述分子的序列共有某种程度的序列相似性,即所述序列是部分相同的。

酶变体可以由它们与亲本酶相比时的序列同一性定义。序列同一性通常作为“序列同一性%”或“同一性%”提供。为了确定两个氨基酸序列之间的同一性百分数,在第一步骤中,在这两个序列之间生成配对序列比对结果,其中将两个序列在其整个长度范围内比对(即,配对的全局比对)。用实施Needlem和Wunsch算法(J.Mol.Biol.(1979)48,第443-453页)的程序,优选地通过使用程序“NEEDLE”(欧洲分子生物学开放软件套件(EuropeanMolecular Biology Open Software Suite)(EMBOSS)),采用程序默认参数(空位开口=10.0、空位延伸=0.5和矩阵=EBLOSUM62),生成比对结果。用于本发明目的的优选比对是从中可以确定最高序列同一性的比对。

以下实例意在说明两个核苷酸序列,但是相同的计算适用于蛋白质序列:

Seq A:AAGATACTG长度:9个碱基

Seq B:GATCTGA长度:7个碱基

因此,较短序列是序列B。

产生在其整个长度范围内显示两个序列的两两全局比对产生了

比对结果中的“I”符号表示相同的残基(其意指DNA的碱基或蛋白质的氨基酸)。相同残基的数目是6。

比对结果中的“-”符号指示空位。Seq B内部因比对引入的空位数是1。通过比对引入的空位的编号在Seq B的边界处是2,并且在Seq A的边界处为1。

在其整个长度范围内显示比对序列的比对长度是10。

根据本发明产生在其整个长度范围内显示较短序列的两两比对因此产生:

根据本发明产生在其整个长度范围内显示序列A的两两比对因此产生:

根据本发明产生在其整个长度范围内显示序列B的两两比对因此产生:

在其整个长度范围内显示较短序列的比对长度是8(存在一个在较短序列的比对长度中考虑的缺口)。

因此,在其整个长度范围内显示Seq A的比对长度将是9(意指Seq A是本发明的序列)。

因此,在其整个长度范围内显示Seq B的比对长度将是8(意指Seq B是本发明的序列)。

在比对两个序列后,在第二步骤中,从产生的比对测定同一性值。为了本说明书的目的,通过以下方式计算同一性百分数:同一性%=(相同残基/在其整个长度范围内显示本发明相应序列的比对区域的长度)*100。因此,根据这个实施方案,通过相同残基的数目除以其整个长度范围内显示本发明相应序列的比对区域的长度,计算与比较两个氨基酸序列有关的序列同一性。这个值乘以100以得出“同一性%”。根据上文提供的实例,同一性%:对于作为本发明序列的Seq A(6/9)*100=66.7%;对于作为本发明序列的Seq B(6/8)*100=75%。

内含子:指基因内部的DNA区段(间插序列),该DNA区段不编码该基因产生的蛋白质的部分,并且从该基因转录的mRNA中在该mRNA从细胞核输出之前剪切下来。内含子序列指内含子的核酸序列。因而,内含子是DNA序列的这些区域,它们随编码序列(外显子)一起转录但是在成熟mRNA形成期间移除。内含子可以位于实际编码区内部或位于前mRNA(未剪接的mRNA)的5'或3'非翻译前导序列中。初级转录物中的内含子被切下并且编码序列同时且精确地连接以形成成熟的mRNA。内含子和外显子的交界形成剪接位点。内含子的序列始于GU并止于AG。另外,在植物中,已经描述AU-AC内含子的两个实例:来自拟南芥(Arabidopsis thaliana)的RecA样蛋白基因第14内含子和G5基因第7内含子是AT-AC内含子。含有内含子的前mRNA具有三种短序列,连同其他序列,这些短序列对于精确剪接内含子是必需的。这些序列是5'剪接位点、3'剪接位点和分支点。mRNA剪接是移除初级mRNA转录物中存在的间插序列(内含子)并接合或连接外显子序列。这又称作顺式剪接作用,所述顺式剪接作用将相同RNA上的两个外显子接合,同时除去间插序列(内含子)。内含子的功能性元件包含由剪接体的特定蛋白质组分(例如其剪接内含子末端处的共有序列)识别并结合的序列。功能性元件与剪接体的相互作用导致从不成熟mRNA除去内含子序列和外显子序列的再接合。内含子具有三种短序列,这些短序列对于精确剪接内含子是必需的,但是并非足够的。这些序列是5'剪接位点、3'剪接位点和分支点。分支点序列是在植物中剪接过程和剪接位点选择方面重要的。分支点序列通常位于3′剪接位点上游10-60个核苷酸处。

同基因的:除可以因存在或不存在异源DNA序列而不同之外,在遗传上相同的生物(例如植物)。

分离的:如本文中所用的术语“分离”意指材料已经通过人工取出并且离开其原来的天然环境存在并且因此不是自然界的产物。分离的材料或分子(如DNA分子或酶)可以以纯化的形式存在或可以存在于非天然环境中如例如存在于转基因(transgenic)或同源转基因(cisgenic)宿主细胞中。例如,活植物中存在的天然存在多核苷酸或多肽不是分离的,然而与该天然系统中一些或全部共存物质分开的相同多核苷酸或多肽是分离的。此类多核苷酸可以是载体的一部分和/或此类多核苷酸或多肽可以是组合物的一部分,并且将是分离的,因为这种载体或组合物不是其最初环境的一部分。优选地,术语“分离的”相对于核酸分子使用时,如在“分离的核酸序列”指被鉴定并且与该核酸序列天然来源中通常与其接合的至少一种杂质性核酸分子分开的核酸序列。分离的核酸分子是这样的核酸分子,其在与自然界中找到该核酸分子的形式或环境不同的形式或环境下存在。相反,未分离的核酸分子是以其在自然界中存在的状态所找到的核酸分子如DNA和RNA。例如,在宿主细胞染色体上相邻基因附近找到给定的DNA序列(例如,基因);作为与编码多种蛋白质的众多其他mRNA的混合物,在细胞中找到RNA序列,如编码特定蛋白质的特定mRNA序列。然而,包含例如SEQID NO:1的分离的核酸序列包括例如在细胞中通常含有SEQ ID NO:1的此类核酸序列,其中所述核酸序列处在与天然细胞的染色体或染色体外相异的染色体或染色体外位置,或否则侧翼分布有与自然界中存在的核酸序列相异的核酸序列。分离的核酸序列可以以单链或双链形式存在。当分离的核酸序列用来表达蛋白质时,该核酸序列将最少含有有义链或编码链的至少一部分(即,该核酸序列可以是单链的)。备选地,它可以含有有义链和反义链(即,该核酸序列可以是双链的)。

最小启动子:无活性或在缺少上游激活情况下启动子活性大大降低的启动子元件,尤其是TATA元件。在合适的转录因子存在下,最小启动子发挥作用以允许转录。

NEENA:参见“增强核酸表达的核酸”。

非编码的:术语“非编码的”指核酸分子中不编码所表达蛋白质的部分或全部的序列。非编码序列包括,但不限于内含子、增强子、启动子区、3'非翻译区和5'非翻译区。

增强核酸表达的核酸(NEENA):术语“增强核酸表达的核酸”指这样的序列和/或特定序列的核酸分子,其具有在与NEENA功能性连接的启动子的控制下增强核酸表达的内在特性。不同于启动子序列,NEENA本身不能驱动表达。为了履行增强与NEENA功能性连接的核酸分子表达的功能,NEENA本身应当与启动子功能性连接。与本领域已知的增强子序列不同,NEENA以顺式方式而不以反式方式起作用,并且必需靠近待表达核酸的转录起始位点存在。

核酸和核苷酸:术语“核酸”和“核苷酸”指天然存在的或合成的或人工核酸或核苷酸。术语“核酸”和“核苷酸”包括处于单链或双链、有义或反义形式的脱氧核糖核苷酸或核糖核苷酸或其任何核苷酸类似物和聚合物或杂合体。除非另外说明,特定核酸序列也内在包括其保守方式修饰的变体(例如简并密码子置换)和互补序列,以及明确指出的序列。术语“核酸”在本文中与“基因”、“cDNA”、“mRNA”、“寡核苷酸”和“多核苷酸”互换地使用。核苷酸类似物包括在碱基、糖和/或磷酸酯的化学结构中具有修饰的核苷酸,包括但不限于5-位置嘧啶修饰、8-位置嘌呤修饰、胞嘧啶环外环胺处的修饰、5-溴-尿嘧啶置换等;和2'-位置糖修饰,包括不限于糖修饰的核糖核苷酸,其中2'-OH由选自H、OR、卤素、SH、SR、NH2、NHR、NR2或CN的基团替换。短发夹RNA(shRNA)也可以包含非天然元件如非天然碱基,例如,肌苷和黄嘌呤,非天然糖,例如,2'-甲氧基核糖,或非天然的磷酸二酯键,例如甲基磷酸酯、硫代磷酸酯和肽。

核酸序列:短语“核酸序列”指从5'-端至3'-端读取的脱氧核糖核苷酸或核糖核苷酸的单链或双链聚合物。它包括染色体DNA、自我复制型质粒、DNA或RNA的感染性聚合物、和主要发挥结构性作用的DNA或RNA。“核酸序列”也指代表核苷酸的缩写、字母、字符或字的连续串。在一个实施方案中,核酸可以是“探针”,所述探针是相对短的核酸,通常长度小于100个核苷酸。经常地,核酸探针具有约50个核苷酸长度至约10个核苷酸长度。核酸的“靶区域”是核酸中被鉴定为有目标的部分。核酸的“编码区”是核酸的部分,其中置于适宜的调节性序列控制下时,所述部分以序列特异性方式转录和翻译以产生特定的多肽或蛋白质。称该编码区编码这种多肽或蛋白质。

寡核苷酸:术语“寡核苷酸”指核糖核酸(RNA)或脱氧核糖核酸(DNA)或其模拟物的低聚物或聚合物,以及具有类似发挥作用的非天然存在部分的寡核苷酸。此类修饰或取代的寡核苷酸因合乎需要的特性,例如增强的细胞摄取、增强的核酸靶亲和力和在核酸酶存在下增加的稳定性而经常优选地胜过其天然形式。寡核苷酸优选地包括通过键(例如,磷酸二酯键)或取代键(substitute linkage)相互共价偶联的两个或多个核苷酸单体(nucleomonomer)。

突出端:“突出端”是双链寡核苷酸分子的5'-或3'-羟基端上相对短的单链核苷酸序列(也称作“延伸”、“伸出端”或“粘末端”)。

植物:通常理解为意指能够光合作用的任何真核单细胞或多细胞生物或其细胞、组织、器官、部分或繁殖材料(如种子或果实)。为本发明的目的,包括植物界(PlantKingdom)的高等和低等植物的全部属和物种。优选一年生、多年生、单子叶和双子叶植物。该术语包括成熟植物、种子、幼苗(shoot)和籽苗(seedling)及其衍生部分、繁殖材料(如种子或微孢子)、植物器官、组织、原生质体、愈伤组织和其他培养物(例如细胞培养物),和归并成产生功能单元或结构单元的任何其他类型的植物细胞。成熟植物指在除籽苗之外的任何目的发育阶段的植物。籽苗指在早期发育阶段的年幼不成熟植物。一年生、二年生、单子叶和双子叶植物是用于产生转基因或同源转基因植物的优选宿主生物。基因的表达在全部观赏植物、用材树或观赏树、花、切花、灌木或草坪草中是更进一步有利的。可以用举例方式、但非限制方式提到的植物是被子植物、苔藓植物例如苔纲(Hepaticae)(地钱(liverwort))和藓纲(Musci)(苔藓植物);蕨类植物如蕨类、木贼类和石松类;裸子植物如松柏类、苏铁类、银杏(ginkgo)和买麻藤纲(Gnetaeae)植物;藻类如绿藻纲(Chlorophyceae)、褐藻纲(Phaeophpyceae)、红藻纲(Rhodophyceae)、粘藻纲(Myxophyceae)、黄藻纲(Xanthophyceae)、硅藻纲(Bacillariophyceae)(硅藻类)和裸藻纲(Euglenophyceae)。优选的是用于食物或饲料目的的植物,如豆科(Leguminosae)如豌豆、苜蓿和大豆;禾本科(Gramineae)如稻、玉米、小麦、大麦、高粱、粟、黑麦、黑小麦或燕麦;伞形科(Umbelliferae),特别地是胡萝卜属(Daucus)(非常特别地是物种胡萝卜(carota))和芹属(Apium)(非常特别地是物种旱芹(Graveolens dulce(celery)))及众多其它植物;茄科(Solanaceae),特别地是番茄属(Lycopersicon),非常特别地是物种番茄(tomato),和茄属(Solanum),非常特别地是物种马铃薯(potato)和茄子(egg plant)和众多其它植物(如烟草(tobacco)),和辣椒属(Capsicum),非常特别地是物种辣椒(pepper)及众多其它植物;豆科(Leguminosae),特别地是大豆属(Glycine),非常特别地是物种大豆(soybean)、苜蓿、豌豆、紫花苜蓿、菜豆或花生及众多其它植物;和十字花科(Brassicacae),特别地是芸苔属(Brassica),非常特别地是物种欧洲油菜(oilseed rape)、芸苔(beet)、甘蓝(Brassicaoleracea cv Tastie(卷心菜))、花椰菜(Brassica oleracea cv Snowball Y(花椰菜))和花茎甘蓝(oleracea cv Emperor(broccoli));和拟南芥属,非常特别地是物种拟南芥及众多其它植物;菊科(Compositae),特别地是莴苣属(Lactuca),非常特别地是物种莴苣(lettuce)及众多其它植物;菊科(Asteraceae)如向日葵、万寿菊、莴苣或金盏花及众多其它植物;葫芦科(Cucurbitaceae)如甜瓜、西葫芦/南瓜或夏南瓜,和亚麻。更优选地是棉、甘蔗、大麻、亚麻、辣椒和多种树、坚果和藤本(wine)物种。

多肽:术语“多肽”、“肽”、“寡肽”、“多肽”、“基因产物”、“表达产物”和“蛋白质”在文中互换地适用,用来指连续氨基酸残基的聚合物或低聚物。

前蛋白:正常情况下靶向细胞器如叶绿体并且仍包含其转运肽的蛋白质。

初级转录物:如本文中所用的术语“初级转录物”指基因的不成熟RNA转录物。“初级转录物”例如仍包含内含子和/或仍不包含聚腺苷酸尾或帽结构和/或是缺少对其作为转录物正常发挥作用必需的其他修饰,例如修剪或编辑。

启动子:术语“启动子”或“启动子序列”是等同物并且如本文中所用的,指与目的核苷酸序列连接时能够控制目的核苷酸序列转录成RNA的DNA序列。可以例如在以下公共数据库中http://www.grassius.org/grasspromdb.html、http://mendel.cs.rhul.ac.uk/mendel.php?topic=plantprom、http://ppdb.gene.nagoya-u.ac.jp/cgi-bin/index.cgi找到此类启动子。其中所列的启动子可以用于本发明的方法处理并且在此引用而包括。启动子位于由该启动子控制转录成mRNA的目的核苷酸序列的5'(即,上游),靠近其转录起始位点,并且为RNA聚合酶和用于转录起始的其他转录因子的特异性结合提供位点。所述启动子包含靠近转录起始位点例如至少10kb,例如5kb或2kb。它也可以包含靠近转录起始位点至少1500bp,优选地至少1000bp,更优选地至少500bp,甚至更优选地至少400bp,至少300bp,至少200bp或至少100bp。在又一个优选的实施方案中,启动子包含靠近转录起始位点至少50bp,例如至少25bp。启动子不包含外显子和/或内含子区或5'非翻译区。启动子可以例如相对于相应植物为异源或同源。如果多核苷酸序列源自外来物种,或如果来自相同物种,但从其原有形式中被修饰,则它相对于某生物或第二多核苷酸序列为“异源”。例如,与异源编码序列有效连接的启动子指编码序列来自不同于衍生该启动子的物种中,或,如果来自相同物种,该编码序列与该启动子不天然接合(例如基因修饰的编码序列或来自不同生态型或品种的等位基因)。合适的启动子可以源自其中应当出现表达的宿主细胞的基因或源自该宿主细胞的病原体(例如,植物或植物病原体如植物病毒)。植物特异性启动子是适于调节植物中表达的启动子。这种启动子可以源自植物,也可以源自植物病原体,或它可以是由人设计的合成性启动子。如果启动子是诱导型启动子,则转录速率响应于诱导剂而增加。另外,启动子可以以组织特异性或组织优先的方式受到调节,从而它仅仅或优势地在特定组织类型如叶、根或分生组织中转录所接合的编码区方面有活性。用于启动子时,术语“组织特异性”指这样的启动子,该启动子能够指导目的核苷酸序列在特定类型的组织(例如,花瓣)中选择性表达,同时相同目的核苷酸序列在不同类型组织(例如,根)中相对缺少下的表达。可以例如通过这样的方式评价启动子的组织特异性:将报道基因与该启动子序列有效连接以产生报道构建体,将报道构建体引入植物的基因组,从而该报道构建体整合至所产生的转基因植物的每种组织中,并且检测报道基因在转基因植物的不同组织中的表达(例如,检测mRNA、蛋白质或由报道基因编码的蛋白质的活性)。相对于报道基因在其他组织中的表达水平,检测到该报道基因在一种或多种组织中的更大表达水平表明该启动子对其中检测到更大表达水平的组织是特异性的。用于启动子时,术语“细胞类型特异的”指这样的启动子,该启动子能够指导目的核苷酸序列在特定类型的细胞中选择性表达,同时相同目的核苷酸序列在相同组织内部的不同类型细胞中相对缺少下的表达。用于启动子时,术语“细胞类型特异的”还意指能够促进目的核苷酸序列在单一组织内部的某区域中选择表达的启动子。使用本领域熟知的方法,例如GUS活性染色法、GFP蛋白法或免疫组织化学染色法,可以评估启动子的细胞类型特异性。谈及启动子或源自启动子的表达时,术语“组成型”意指能够指导有效连接的核酸分子在刺激物(例如,热休克、化学品、光等)不存在下在大部分植物组织和细胞中贯穿植物或植物部分的基本上整个生活期限转录的启动子。一般而言,组成型启动子能够指导基因在基本上任何细胞和任何组织中的表达。

启动子特异性:谈及启动子时,术语“特异性”意指由相应启动子引起的表达的样式。特异性描述了植物或其部分的组织和/或发育状态,在其中该启动子引起处于相应启动子控制下的核酸分子表达。启动子的特异性也可以包含环境条件,在所述环境条件下可以激活或下调该启动子,如由生物胁迫或环境胁迫如寒冷、干旱、受伤或感染诱导或阻遏。

纯化的:如本文中所用,术语“纯化的”指从其天然环境取出、分离或分开的分子,即核酸序列或氨基酸序列。“基本上纯化的”分子至少60%没有、优选地至少75%没有和更优选地至少90%没有与它们天然结合在一起的其他组分。纯化的核酸序列可以是分离的核酸序列。

重组:就核酸分子而言,术语“重组”指通过重组DNA技术产生的核酸分子。重组核酸分子也可以包括本身不存在于自然界中但是被人修饰、改变、突变或操纵的分子。优选地,“重组核酸分子”是在序列方面与天然存在的核酸分子有至少一个核酸不同的非天然存在的核酸分子。“重组核酸分子”也可以包括“重组构建体”,其包含不天然地以这种顺序存在的一系列核酸分子,所述核酸分子优选地有效地连接。用于产生所述重组核酸分子的优选方法可以包括克隆技术、定向或非定向诱变法、合成或重组技术。

有义:术语“有义”理解为意指核酸分子,其具有与靶序列互补或相同的序列,例如与蛋白质转录因子结合和参与给定基因表达的序列。根据一个优选的实施方案,该核酸分子包含目的基因和允许表达该目的基因的元件。

明显增加或下降:大于测量技术中固有误差幅度的增加或减少,例如在酶活性或在基因表达方面,优选地是对照酶的活性或对照细胞中的表达增加或减少约2倍或更多,更优选地增加或减少约5倍或更多,并且最优选地增加或减少约10倍或更多。

小核酸分子:“小核酸分子”理解为由核酸或其衍生物如RNA或DNA组成的分子。它们可以是双链或单链的,并且其长度在约15和约30bp之间,例如在15和30bp之间,更优选在约19和约26bp之间,例如在19和26bp之间,甚至更优选在约20和约25bp之间,例如在20和25bp之间。在特别优选的实施方案中,寡核苷酸的长度在约21和约24bp之间,例如在21和24bp之间。在最优选的实施方案中,小核酸分子的长度是约21bp和约24bp,例如21bp和24bp。

基本上互补的:在最广意义上,本文中就核苷酸序列相对于参考或目标核苷酸序列而言使用时,术语“基本上互补的”意指这样的核苷酸序列,其具有在基本上互补的核苷酸序列和所述参考或目标核苷酸序列的完全互补序列之间至少60%,更希望地至少70%,更希望地至少80%或85%,优选地至少90%,更优选地至少93%,仍更优选地至少95%或96%,仍旧更优选地至少97%或98%,依旧更优选地至少99%或最优选地100%的同一性百分数(后者等同于本上下文中的术语“相同”)。优选地,在至少19个核苷酸长度、优选地至少50个核苷酸长度、更优选核酸序列的全部长度范围内针对所述参比核苷酸序列评估同一性(如果不是,则另外在下文说明)。使用威斯康辛大学GCG的默认GAP分析,GAP的SEQWEB应用,基于Needleman和Wunsch算法(Needleman和Wunsch(1970)J Mol.Biol.48:443-453;如上文定义)实施序列比较。与参比核苷酸序列“基本上互补的”核苷酸序列与该参比核苷酸序列在低严格性条件、优选地中等严格性条件、最优选地高严格性条件(如上文定义)下杂交。

转基因:如本文中所用的术语“转基因”指通过实验操作引入细胞的基因组中的任何核酸序列。转基因是源自不可杂交物种的“异源DNA序列”。

同源转基因:如本文中所用的术语“同源转基因”指通过实验操作导入细胞的基因组中的任何核酸序列。同源转基因可以是源自可杂交、性相容物种中的“内源DNA序列”或“异源DNA序列”。

术语“内源DNA序列”指这样的核苷酸序列,其天然存在于引入该核苷酸序列的细胞中,只要它相对于天然存在序列不含有一些修饰(例如,例如,点突变、存在可选择标记基因等)。

转基因:当提及生物时,术语“转基因的”意指用重组DNA分子进行转化,优选地进行稳定转化,其中所述重组DNA分子优选地包含与目的DNA序列有效连接的合适启动子,其中所述重组DNA分子是转基因。

同源转基因的:当指生物时,术语“同源转基因的”意指用同源转基因进行转化、优选地稳定转化或进行基因组编辑。

可杂交物种:术语“可杂交物种”意指在分类学的生物科内的物种。相反,术语“不可杂交物种”意指在分类学的生物科外部的物种。

载体:如本文中所用,术语“载体”指能够运输已经与之连接的另一个核酸分子的核酸分子。一种类型的载体是基因组整合的载体,或“整合的载体”,所述载体可以整合至宿主细胞的染色体DNA中。另一个类型的载体是游离型载体,即,能够进行染色体外复制的核酸分子。本文中将能够指导与它们有效连接的基因表达的载体称作“表达载体”。在本说明书中,“质粒”和“载体”互换地使用,除非从上下文并非如此。设计旨在体外或体内产生如本文所述RNA的表达载体可以含有被任何RNA聚合酶识别的序列,所述的RNA聚合酶包括线粒体RNA聚合酶、RNA pol I、RNA pol II和RNA pol III。这些载体可以以用来在根据本发明的细胞中转录想要的RNA分子。将植物转化载体理解为适用于植物转化过程中的载体。

野生型:就生物、多肽或核酸序列而言,术语“野生型”、“天然”或“天然来源”意指所述生物是天然存在的或是在至少一种天然存在生物中可获得的,未被改变、突变或另外受到人类操作。

附图:

图1:CaMV 35S启动子的各种部分对瞬时转化的小麦原生质体中启动子活性的影响。水平轴图注:第1行:启动子(35S2:528核苷酸长度的CaMV 35S启动子;-46:最小35S启动子);第2行:增强子(35S增强子坐标或λ噬菌体序列)。使用共引入的pKA63质粒的荧光素酶活性时,针对原生质体转染效率的变异修正GUS活性。

图2:小麦候选增强子对瞬时转化的小麦原生质体中启动子活性的影响。水平轴图注:第1行:启动子(35S2:528核苷酸长度的CaMV 35S启动子;min35S:最小35S启动子);第2行:不存在或存在-208至-65 35S增强子;第3行:小麦候选增强子的同一性。使用共引入的pKA63质粒的荧光素酶活性时,针对原生质体转染效率的变异修正GUS活性。

图3:ALMT1B片段对于瞬时转化的小麦原生质体中的完整增强子活性足够用。水平轴图注:第1行:启动子(35S2:528核苷酸长度的CaMV 35S启动子;min35S:最小35S启动子);第2行:增强子序列。使用共引入的pKA63质粒的荧光素酶活性时,针对原生质体转染效率的变异修正GUS活性。

图4:瞬时转化的小麦原生质体中的完整增强子活性需要ALMT1B片段。水平轴图注:第1行:启动子(35S2:528核苷酸长度的CaMV 35S启动子;min35S:最小35S启动子);第2行:增强子序列。使用共引入的pKA63质粒的荧光素酶活性时,针对原生质体转染效率的变异修正GUS活性。

图5:ALMT1B片段和HMW-GS-43片段增加瞬时转化的小麦原生质体中35S启动子的活性。水平轴图注:第1行:最小35S启动子;第2行:-208至-65 35S增强子;第3行:增强子序列。使用共引入的pKA63质粒的荧光素酶活性时,针对原生质体转染效率的变异修正GUS活性。

图6:ALMT1B增强子和HMW-GS-43增强子增加瞬时转化的小麦原生质体中小麦T6PP启动子的活性。水平轴图注指示相对于翻译起始位点的增强子插入位点的位置。使用共引入的pKA63质粒的荧光素酶活性,针对原生质体转染效率的变异修正GUS活性。

图7:ALMT1B增强子和HMW-GS-43增强子增加瞬时转化的小麦原生质体中小麦ACCase启动子的活性。水平轴图注指示相对于翻译起始位点的增强子插入位点的位置;(i)表示插入位点位于第一内含子内部。使用共引入的pKA63质粒的荧光素酶活性,针对原生质体转染效率的变异修正GUS活性。

图8:ALMT1B增强子的反向互补物增加瞬时转化的小麦原生质体中小麦T6PP启动子的活性。增强子在翻译起始位点上游200nt插入。使用共引入的pKA63质粒的荧光素酶活性,针对原生质体转染效率的变异修正GUS活性。

图9:HMW-GS-43增强子在浸润的本明烟草(Nicotiana benthamiana)叶中增加启动子活性。

图10:ALMT1B增强子对瞬时转化的小麦原生质体中小麦T6PP启动子活性的影响。竖轴显示启动子相对活性。水平轴图注显示使用哪种增强子片段:反向互补物(ALMT1BRC)、2个拷贝(2xALMT1B)或1个拷贝(ALMT1B)的SEQ ID 2。使用共引入的pKA63质粒的荧光素酶活性,针对原生质体转染效率的变异修正GUS活性。无增强子(无)时启动子的活性设为1。

图11:ALMT1B增强子对瞬时转化的小麦原生质体中小麦ACCase启动子活性的影响。竖轴显示启动子相对活性。水平轴图注显示相对于翻译起始位点,增强子插入物在启动子内部的位置。使用共引入的pKA63质粒的荧光素酶活性,针对原生质体转染效率的变异修正GUS活性。无增强子(无)时启动子的活性设为1。

实施例

化学品和常用方法

除非另外说明,如(Sambrook等人,1989)所述为本发明的目的进行克隆过程,包括限制性消化、琼脂糖凝胶电泳、核酸的纯化、核酸的连接、细菌细胞的转化、选择和培养。使用Sanger技术(Sanger等人,1977),用激光荧光DNA测序仪(Applied Biosystems,FosterCity,CA,USA)进行重组DNA的序列分析。除非另外描述,从Sigma Aldrich(Sigma Aldrich,St.Louis,USA)、Promega(Madison,WI,USA)、Duchefa(Haarlem,The Netherlands)或Invitrogen(Carlsbad,CA,USA)获得化学品和试剂。限制性核酸内切酶来自New EnglandBiolabs(Ips-wich,MA,USA)或Roche Diagnostics GmbH(Penzberg,Germany)。寡核苷酸由Eurofins MWG Operon(Ebersberg,Germany)合成。

实施例1:表征小麦增强子序列

在小麦叶肉原生质体中通过瞬时表达测试三个小麦启动子元件对启动子活性的影响。为了鉴定适于测试增强子活性的表达载体,在小麦原生质体中测试质粒pBay01160(SEQ ID NO 6)的多种衍生物,所述衍生物含有组成型CaMV 35S2启动子控制下的GUS编码序列(Odell等人(1985).Nature 313(6005),810-2)和稻肌动蛋白-1内含子(McElroy等人(1991).Mol Gen Genet.231(1),150-60)。为了修正引入效率差异,转染的小麦原生质体的GUS活性除以来自共引入的对照载体(pKA63,SEQ ID NO 9)的荧光素酶活性,所述对照载体具有组成型玉米泛素启动子控制下的萤火虫荧光素酶基因(Christensen等人(1992).Plant Mol Biol.18(4),675-89)。根据Shang等人.((2014),Nature protocols 9(10),2395-2410)进行小麦原生质体制备和PEG转染小麦原生质体。

与pBay01160的有完整活性35S2启动子相比,仅含有最少35S启动子(核苷酸-46至-1)的载体pBay01697(SEQ ID NO 7)以及其具有最小35S启动子上游144-ntλ噬菌体序列的衍生物pBay01704(SEQ ID NO 10)显示强烈降低的启动子活性(图1)。在最小35S启动子上游具有35S启动子的-208至-65增强子序列的质粒pBay01701(SEQ ID NO 8)显示与pBay01160的35S2启动子接近的启动子活性(图1)。这表明,这些载体适于在小麦原生质体中测试增强子活性。载体pBay01697进一步用来测试SEQ ID NO:1、2和3的推定性增强子对具有最小活性的启动子的影响,而载体pBay01701用来评估对已经具有良好活性的启动子的影响。

为了测试小麦启动子元件的增强子活性,将Vrn-D1 175-nt插入(SEQ ID NO 5)(Zhang等人(2015).Front Plant Sci 6,470)、一个含有43-nt HMW-GS 1Bx7OE启动子插入(SEQ ID NO 1)的99-nt序列(SEQ ID NO 11)(Geng等人(2014).PLoS ONE 9(8),e105363)和与ALMT1 AB元件(block)和BC元件相对应的序列(SEQ ID NO 2至4)(Ryan等人(2010).The Plant Journal 64,446–455)插入pBay01697中35S最小启动子的上游以及pBay01701中-208至-65 35S增强子的上游。在小麦原生质体中引入时,ALMT1 AB增强子显示最强烈的表达增长(图2)。最小35S启动子的表达增加多达完整活性的35S2启动子的60%,而在35S增强子存在下,启动子活性比35S2启动子增加3.3倍。HMW-GS序列增加含35S增强子的启动子的表达至2倍高于35S2启动子的水平,而未观察到这个增强子对最小35S启动子的正向影响。相反,Vrn-D1序列对最小和完整活性35S启动子均未显示明确的表达增长。

实施例2:ALMT1AB增强子的缺失分析

为了确定ALMT1AB增强子的活性片段,测试与最小35S启动子组合的多种缺失突变体。单独的B片段显示与完整AB片段相同的增强子活性(图3)。相反,B片段内部的任何35-bp缺失摧毁增强子活性,而A片段不显示任何增强子活性(图4)。从而这种增强子活性定位至至107-nt长的B片段。

实施例3:验证完整活性35S启动子的活性增强子片段

接下来,用完整活性35S启动子测试ALMT1B增强子片段和各种变体1Bx7OEHMW-GS片段(图5)。在这个实验中,与对照质粒(仅35S增强子)相比,ALMT1 B片段显示增加表达2.9倍,这明确地高于AB片段。

从受测的HMW-GS片段中,43-nt片段(SEQ ID NO 1)产生最好的表达增强作用(2.5倍)。两拷贝的插入物并未导致活性增强。1Bx7OEHMW-GS 43-nt片段与ALMT1 B片段的组合未导致进一步增强表达。

43-nt HMW-GS和107-nt ALMT1B片段因此显示最高增强子活性并且将与小麦启动子组合时受测。

实施例4:HMW-GS-43增强子和ALMT1B增强子对小麦启动子活性的影响

为了评价1Bx7OEHMW-GS-43增强子和ALMT1B增强子对内源小麦启动子活性的影响,将两种片段在2种小麦启动子内部的4个不同位点插入:

-7A海藻糖-6-磷酸磷酸酶(T6PP)基因的1-kb启动子片段,造成组成型表达(小麦原生质体中启动子活性为p35S2启动子活性的约25%)(WO/2018/113702)。-B基因组ACCase基因的2.95-kb启动子片段,造成组成型表达(含有1-kb内含子;2个插入位点在内含子内部;小麦原生质体中表达水平为p35S2的约50%)。

选择插入位点(编号相对于翻译起始密码子而言)不重叠于MotifLocator(Claeys等人(2012).Bioinformatics 28(14),1931–1932)预测的转录因子结合位点。

图6和图7中的数据显示这些增强子各自增加两种启动子的活性。表达增加水平取决于增强子在启动子内部的位置并且在ALMT1增强子时最高。对于T6PP启动子,启动子活性增加因ALMT1增强子而高达7倍并且因HMW-GS增强子而高达2倍。增强子越接近转录起始位点(其相对于翻译起始密码子位于-126处)存在,表达增加更大。

对于ACCase启动子,仅2个插入位点位于转录启动位点上游(相对于翻译起始密码子为nt-1240)。自位于转录起始位点上游的这2个插入位点,最靠近转录起始位点的位点的表达增加最高(增加2.3倍至2.7倍)。但是,这个位点仍然在转录起始位点上游约700nt。因此,测试在ACCase启动子的TSS上游且与之更靠近的2个额外插入位点。图11显示仅在TSS上游约70nt插入增强子时,出现最大的表达增加(约8倍)。与转录起始位点上游插入相比,在内含子中插入产生较低的表达增加。

这些结果显示ALMT1B增强子和HMW-GS-43增强子均可以用来通过在小麦启动子内部或在第一内含子内部的适宜位置插入增强子,增加来自该启动子的表达。

实施例5:增强子活性与增强子片段的取向无关

为了测试增强子活性是否依赖于增强子相对于启动子的取向,确定ALMT1B增强子的反向互补物对T6PP启动子活性的影响。结果显示,ALMT1B增强子的互补序列增加T6PP启动子的表达(图8)并且因此在两个方向均具有增强子活性。

实施例6:HMW-GS-43增强子对双子叶植物中启动子活性的影响

评价这种增强子是否将在双子叶植物中起作用。为此,将HMW-GS-43增强子紧邻已知在大豆中具有微弱组成型活性的两个启动子上游插入:P-rpl13-1.3(SEQ ID NO 14的nt3442-2818的反向互补物)和P-atad1-1.3(SEQ ID NO 15)。将增强子插入含有在P-rpl13-1.3启动子(pBay02771,SEQ ID NO 14)或P-atad1-1.3启动子(pBay02773,除启动子序列之外,序列与pBay02771相同)控制下的荧光素酶-dsRed融合蛋白编码序列的2个T-DNA载体中,分别产生T-DNA载体pBay02772和pBay02774。将4种T-DNA载体转化入农杆菌并且所产生的菌株用于浸润本明烟草叶。图9显示浸润后2天测量的荧光素酶活性的水平。与无增强子的载体相比,含有小麦HMW-GS-43增强子的载体显示启动子活性水平增加2倍至4倍。这些结果显示,HMW-GS-43增强子在双子叶植物中也有活性。

实施例7:ALMT1B增强子重复导致增强子活性增加

测试了2个拷贝的ALMT1增强子对小麦T6PP启动子活性的影响(翻译起始位点上游200nt插入)。图10显示两个拷贝的ALMT1B增强子(2x ALMT1B)增加T6PP启动子活性约4倍多于原始增强子序列,而反向互补物(ALMT1B RC)显示相似的表达增加。这显示,ALMT1增强子的作用取决于拷贝数,但是与增强子序列的取向无关。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号