首页> 中国专利> 用于在单子叶植物中调节胚特异性表达的核酸序列

用于在单子叶植物中调节胚特异性表达的核酸序列

摘要

本发明涉及农业生物技术领域。本文中公开了用于萌芽胚特异性表达的方法、核酸分子和表达构建体或其载体;包含此类核酸、载体、表达构建体的转基因植物和细胞,以及制备和使用此类DNA构建体和转基因植物的方法。

著录项

  • 公开/公告号CN101631868A

    专利类型发明专利

  • 公开/公告日2010-01-20

    原文格式PDF

  • 申请/专利权人 巴斯福植物科学有限公司;

    申请/专利号CN200880005186.2

  • 发明设计人 H-S·宋;C·达曼;

    申请日2008-02-15

  • 分类号C12N15/82;A01H5/00;

  • 代理机构北京市中咨律师事务所;

  • 代理人黄革生

  • 地址 德国路德维希港

  • 入库时间 2023-12-17 23:18:41

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-03-09

    未缴年费专利权终止 IPC(主分类):C12N15/82 授权公告日:20160210 终止日期:20170215 申请日:20080215

    专利权的终止

  • 2016-02-10

    授权

    授权

  • 2010-05-12

    实质审查的生效 IPC(主分类):C12N15/82 申请日:20080215

    实质审查的生效

  • 2010-01-20

    公开

    公开

说明书

发明领域

本发明涉及农业生物技术领域。本文中公开了具有针对萌芽胚 (germinating embryo)的表达特异性的表达构建体、包含此类表达构建体的 转基因植物以及制备并使用此类DNA构建体和转基因植物的方法。

发明背景

在农学重要的谷类作物中,种子形成是植物发育的最终目标。将种子 收获用于食品、饲料及工业产品。这些种子的用途和价值由种子中所含有 的蛋白质、油和淀粉的数量和品质决定。于是,所产生的种子的品质和数 量可能在受精前至种子成熟的任何时点上受环境条件影响。尤其,在受精 时刻及其附近的胁迫可以明显地影响种子发育。包括谷类谷粒(cereal grain)在内的禾本科(Poaceae)成员产生干的单种子果实。严格地说,这种 类型的果实是颖果,但通常叫做核(kernel)或谷粒(grain)。颖果的果皮或囊 果皮包围种子并且牢固地与种子外皮附着。种子由胚和胚乳组成,被珠心 表皮和种子外皮包裹。因此,谷粒包含种子和其外皮或囊果皮。种子包含 胚和胚乳。

能育的谷物(corn)植物含有雄性繁殖组织和雌性繁殖组织,通常分别 称作雄穗(tassel)和雌穗(ear)。雄穗组织形成了单倍花粉粒,每个花粉粒中 具备两个核,其中在花开期被散播时,所述花粉粒与雌穗的穗丝接触。雌 穗可以位于散播花粉的同一株植物上,或位于不同的植物上。花粉细胞发 育为称作花粉管的结构,其中所述花粉管向下延伸穿过单个雌性穗丝抵达 胚珠。两个雄性核经花粉管移动以抵达位于穗丝基部的单倍体雌性卵。两 个雄性核之一与所述单倍体雌性卵核融合并且使其受精以形成合子,其中 所述合子在染色体数上是二倍体并且会变成谷粒中的胚。剩余雄性核与第 二个雌性核融合并且使其受精以形成初生胚乳核,其中所述的初生胚乳核 在染色体数上是三倍体并且会变成谷物植物的谷粒或种子的胚乳。未受精 的胚珠不产生谷粒并且未受精的组织逐步退化。

谷粒由众多部分组成,其中一些部分从母体组织衍生而其他部分来自 受精过程。按照母系方式,所述谷粒继承了众多种组织,包括保护性包围 的囊果皮和花梗。花梗是使谷粒连接于穗轴并且促使营养从母体组织转移 至谷粒的短柱样组织。谷粒含有因受精活动产生的组织,包括新胚和胚乳。 胚是下一个世代的缩微祖先,含有用于新生幼龄谷物植物的根和苗生长的 细胞。胚也是贮藏油和蛋白质于谷粒中的一种组织。胚乳更多地作为营养 组织发挥作用并且以贮藏淀粉、蛋白质和油形式提供胚萌发及初期生长所 需要的能量。

鉴于高等植物中胚及谷粒发育期间存在复杂的调节作用,并且鉴于谷 粒通常是动物及人类营养的主要来源,所需要旨在改良此类营养来源的重 要工具包括可以驱动营养增强性基因表达的遗传启动子。另一方面,胚对 胁迫高度敏感。针对植物的胁迫可以由生物介质和非生物介质引起。例如, 胁迫的生物原因包括病原体感染、昆虫采食及被另一种植物(如槲寄生)寄 生以及反刍动物啃食。非生物性胁迫例如包括过量或不充分的可用水、不 充分的光照、极端温度、人工化学品(如除草剂)、大风、土壤极端pH、受 限的营养获得性和空气污染。然而,利用多种内部机制及外部机制以躲避 或耐受胁迫,植物存活下来并且经常枝繁叶茂,甚至在不利条件下也是如 此。植物对胁迫的生理应答反映在基因表达方面的改变。

尽管操作胁迫诱导型基因可能在改善植物的胁迫耐受性方面发挥重 要作用,然而已经证实当胁迫不存在时,胁迫诱导型基因的组成型表达严 重不利地影响植物生长和发育(Kasuga 1999)。因此,本领域需要驱动具有 时间和/或空间差异性地表达的启动子,旨在提供在重要时间处控制并指导 在特定细胞或组织中基因表达的工具,尤其旨在提供胁迫耐受性或躲避。 尤其,玉米的干旱胁迫和/或密度胁迫经常导致减产。为稳定在不利环境下 的植物发育及谷粒产量,调节种子萌发期间对胚(胚轴和盾片)的激素和营 养供应是有意义的。因此,需要在非生物胁迫条件下驱动胚或盾片中基因 表达的转录调节序列。

植物生物技术领域中的另一个熟知的问题是标记缺失 (marker-deletion)。选择标记在转化过程期间用来选择并鉴定转化的生 物,然而一旦已经鉴定出转化的生物后,则选择标记一般不提供有用的功 能,并且主要构成消费者中不接受这些“基因食品”产品的原因(Kuiper 2001),并且几乎没有不基于这些机制的标记(Hare 2002)。因此,人们反复 尝试开发这样的技术,其中借助所述技术可以从植物基因组切除标记 DNA(Ow 1995;Gleave 1999)。本领域技术人员熟悉用于位点定向方式除 去重组导入的核酸序列的多种系统。这些系统主要基于使用序列特异性的 重组酶。描述了多种序列特异性重组系统,如噬菌体P1的Cre/lox系统 (Dale 1991;Russell 1992;Osborne 1995)、酵母FLP/FRT系统(Kilby 1995; Lyznik1996)、Mu噬菌体Gin重组酶、大肠杆菌(E.coli)Pin重组酶、质粒 pSR1的R/RS系统(Onouchi1995;Sugita2000)、attP/噬菌体λ系统(Zubko 2000)。现有技术领域已知的这些方法的一个已知缺点是切除在整个植物范 围内是不均一的,因此产生嵌合样的切除模式,这需要繁琐的额外选择和 再生轮次。

描述了在种子或谷粒成熟期间赋予表达增强的启动子(如大麦(barley) 的大麦醇溶蛋白启动子;见美国专利申请20040088754)。在双子叶植物中 指导胚特异性或种子特异性表达的启动子(例如大豆(soybean)伴大豆球蛋 白启动子;Chen 1988;油菜籽蛋白启动子,Kridl 1991)通常不能在单子叶 植物中指导相似的表达。不幸地是,相当少的启动子被鉴定为特异性指导 此方面的生理学(见例如US20040163144)。

因而,所描述的种子特异性或谷粒特异性启动子包括与编码植物种子 贮藏蛋白的基因(如编码大麦的大麦醇溶蛋白、稻(rice)的稻谷蛋白、水稻 素、谷醇溶蛋白或球蛋白;小麦(wheat)的麦醇溶蛋白或麦谷蛋白;玉米 (maize)的玉米醇溶蛋白或谷蛋白;燕麦(oat)的谷蛋白;高粱(sorghum)的 高粱醇溶蛋白;黍(millet)pennisetins或黑麦(rye)的裸麦醇溶蛋白的基因) 相关的那些启动子。然而,另一方面,这些启动子的表达往往是渗漏的, 或是低表达水平的。此外,已经指出用多个转基因(“堆积”)改良作物植物 的兴趣正在增长。例如,单个玉米杂交体可以包含不仅赋予昆虫抗性,也 赋予特定除草剂抗性的重组DNA构建体。重要的是:需要适宜的调节序 列以驱动这些或其他目的转基因中的每一转基因按需要表达。此外,重要 的是调节元件应当彼此明显不同。伴随利用相似调节序列驱动多个基因表 达的顾虑包括但不限于:(a)在整合前的质粒内或在整合后的植物基因组 内,沿同源区域配对、交换和间插区域丢失;(b)由相反方向彼此邻近的序 列的两个拷贝导致的发夹环,以及切除和丢失这些调节区域的可能性;(c) 相同启动子区域的不同拷贝间对结合启动子特异性转录因子或其它调节 性DNA结合蛋白的竞争。

因此,本领域迫切需要鉴定可以用于经济重要的植物、尤其单子叶植 物中表达所选择的转基因的新序列。另外,本领域还需要在早期萌发种子 期间允许在胚或盾片中表达的转录调节序列。因此,本发明的一个目的是 提供用于胚优先地或特异地表达的新颖和备选的表达盒。该目的由本发明 实现。

发明概述

本发明涉及包含植物转录调节序列的分离的核酸分子,其中所述的转 录调节序列包含

i)第一核酸序列,其包含干旱、寒冷应答性和/或ABA调节型基因的 启动子序列,例如图4中定义的植物基因-干燥应答性rd29或低温诱导的 蛋白78基因或其功能等同物或同源物(homolog)的启动子序列(在下文中为 “cor78启动子”),

和与其有效连接的

ii)第二核酸序列,其包含如图5中定义的编码金属硫蛋白1(在下文中 为“MET1”)的植物基因或其功能等同物或同源物的第一内含子(在下文中 为“MET1内含子”)。

干旱、寒冷应答性和/或ABA调节型基因的启动子序列包含熟知的蛋 白质类型的启动子。优选地,它是干旱、寒冷应答性和ABA调节型基因 的启动子序列。干旱、寒冷应答性和/或ABA调节型基因的基因实例是 rd29A、rd29B、lti或cor78。

图4序列代表RD29A和低温诱导的蛋白78。cor78启动子又称作rd29 启动子序列。Genbank数据库的BLAST指例如Genbank登录号 AB019226,其包含其他基因。在这个基因组序列中,cor78启动子以5’-3’ 方向位于bp11743-bp12328。位于该启动子区下游的基因是低温诱导的蛋 白78(例如bp 12650-12698、12784-12966、13063-13536和13621-15047)。

干燥应答性RD29植物基因例如在登录号NM_001036984下公开,具 有2131 bp mRNA,注册日期PLN 2006年6月9日,VERSION NM_001036984.1 GI:79330663,并且被描述为编码一种在应答水剥夺如寒 冷、高盐和干燥时诱导表达的蛋白质的基因。该应答似乎通过脱落酸进行。 所述启动子区含有对于rd29B脱水应答性表达所需要的两个ABA应答元 件(ABRE)作为顺式应答元件。所述蛋白质是具有植物、动物和真菌中存在 的其他成员的基因家族的成员。将其描述为类似于胁迫应答蛋白相关的[拟 南芥(Arabidopsis thaliana)](TAIR:At4g25580.1)。RD29还作为cor78在登 录号GB:AAA32776.1下公开。

因此,在一个实施方案中,使用在植物中控制编码所述蛋白质之一的 mRNA转录的启动子,例如编码胁迫应答蛋白的基因的启动子,如拟南芥 (TAIR:At4g25580.1)的启动子,例如rd29A,rd29B,lti或 cor78(GB:AAA32776.1)的启动子。优选地,所述启动子具有图4中所示的 序列或其同源物,例如其直向同源物。

优选地,cor78启动子衍生自双子叶植物。

在一个实施方案中,所述同源物是作为直向同源物预测在植物界 (Viridiplantae)中存在;优选地在链形植物(Streptophyta),更优选在有胚植 物(Embryophyta);维管植物(Tracheophyta)、甚至更优选在种子植物门 (Spermatophyta)中存在的同源物。所述同源物更优选地从被子植物门 (Magnoliophtya)鉴定到,该同源物更优选地来自真双子叶植物 (eudicotyledons),该同源物甚至更优选来自核心真双子叶植物(core eudicotyledons)。因此,该同源物优选地来自蔷薇分支(rosids);更优选来 自真蔷薇II(eurosids II);甚至更优选来自十字花目(Brassicales),该同源 物甚至更优选例如来自十字花科(Brassicaceae),优选地来自拟南芥属 (Arabbidopsis)。

在一个实施方案中,所述同源物来自拟南芥栽培品种,例如来自C24, 或来自生态型如“Columbia”。

除了具有基本上相同的功能外,两种多肽基本上彼此相似的一个进一 步迹象是与所述多肽之一特异性结合的物质(例如抗体)还特异性地结合至 另一个多肽。因此,在一个实施方案中,RD29的同源物是可以在蛋白质 印迹分析法中因与单克隆抗体结合而被鉴定的蛋白质,其中产生所述的单 克隆抗体以特异性结合至具有图4中所示的氨基酸的蛋白质。

在一个实施方案中,使用其启动子的基因是与图4中所示的氨基酸序 列或核酸序列具有至少60%、61%、62%、63%、64%、65%、66%、67%、 68%、69%、70%,例如71%、72%、73%、74%、75%、76%、77%、 78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、 89%和甚至90%或更大,例如91%、92%、93%、94%、95%、96%、97%、 98%、大到至少99%的氨基酸序列同一性或核酸同一性的核酸或蛋白质。

优选地,使用其启动子的基因是显示低温诱导的蛋白78的表达模式的 基因或RD29基因。优选地,与所述基因连接的启动子序列与如SEQ ID NO.:1所描述的核酸序列60%、61%、62%、63%、64%、65%、66%、 67%、68%、69%、70%,例如71%、72%、73%、74%、75%、76%、 77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%和甚至90%或更大,例如91%、92%、93%、94%、95%、96%、 97%、98%、大到至少99%同一。可以通过使用鉴定或克隆核酸序列的标 准技术(但不排除其他技术)、数据库搜索法、杂交或基于PCR的技术,利 用SEQ ID NO.:1、5或6的或例如图4a-4c中所示的低温诱导的蛋白78 或RD29基因的至少10、15、20、30或更多个连续核苷酸获得所述启动子。

Met1基因在Sasaki,T.等,Nature 420(6913),312-316(2002)中并在登 录号AP002540下公开,是249bp的线性DNA,PLN 19-OCT-2004, VERSION AP002540.2 GI:13872872。该序列于2000年6月21日提交, 并且在2001年4月27日将该序列版本替换为gi:8698578。基因从以下数 据库GENSCAN、FGENESH、GeneMark.hmm、GlimmerM、RiceHMM、 SplicePredictor、sim4、gap2、BLASTN和BLASTX的综合结果中预测。 将基因组序列针对NCBI非冗余蛋白质数据库、在RGP或DDBJ上的nr 和cDNA序列数据库搜索。将编码区的蛋白质同源性针对NCBI非冗余蛋 白质数据库用BLASTP搜索。EST代表使用BLASTN、以相应DDBJ登 录号和RGP克隆ID鉴定的cDNA序列。全长cDNA代表使用BLASTN, 以相应DDBJ登录号鉴定的cDNA序列。与某蛋白质具有同一性或显著同 源性的基因基于该蛋白质的名称进行分类,以指示同源性水平,如相同名 称、“推定的-”和“-样蛋白”。与任意蛋白质无显著同源性,但具有全长cDNA 或EST同源性(覆盖部分序列的几乎全部长度)的基因分类为“未知的”蛋 白。根据IRGSP标准,由两个或多个基因预测程序预测的基因分类为“假 定的”蛋白。由单个基因预测程序预测的基因也分类为可能的“假定”蛋白, 并且将该基因纳入作为序列的一个混杂特征。所述序列的方向是从PAC 克隆的T7至SP6。P0434B04克隆的这个序列与P0416D03(DDBJ: AP002872)克隆在5′端处重叠并且与P0009G03(DDBJ:AP002522)克隆在 3′端处重叠。关于重叠和装配品质的详细信息以及该条目的注释可在 GenomeSeq获得。

优选地,使用图5中所示的MET1基因或其同源物的内含子,例如其 直向同源物的内含子。

优选地,所述第一内含子衍生自单子叶植物的MET1基因。所述同源 物优选地是例如来自植物界,例如来自链形植物,更优选来自有胚植物, 甚至更优选来自维管植物的直向同源物。该同源物例如来自种子植物门, 优选地来自被子植物门,更优选来自百合纲(Liliopsida)、甚至更优选来自 禾本目(Poales),甚至更优选来自禾本科(Poaceae)。在一个实施方案中,该 同源物来自BEP进化枝,例如来自稻亚科(Ehrhartoideae),更优选来自稻 族(Oryzeae),例如来自稻属(Oryza)。

在一个实施方案中,使用衍生自稻(Oryza sativa),例如衍生自栽培品 种如粳型稻栽培品种组(japonica cultivar-group)的直向同源物。

优选地,所述同源物是直向同源物并且在耗尽测定法(depletion assay) 中显示与野生型基本上相同的表型。

除了具有基本上相同的功能外,两种多肽基本上彼此相似的一个进一 步迹象是与所述多肽之一特异性结合的物质(例如抗体)还特异性地结合至 另一个多肽。因此,在一个实施方案中,MET1的同源物是可以在蛋白质 印迹分析法中因与单克隆抗体结合而被鉴定的蛋白质,其中产生所述的单 克隆抗体以特异性结合至具有图5中所示的氨基酸的蛋白质。

在一个实施方案中,使用其内含子例如所述第一内含子的基因的同源 物编码这样的蛋白质,所述蛋白质与图5中所示的氨基酸序列具有至少 60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%, 例如71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、 81%、82%、83%、84%、85%、86%、87%、88%、89%和甚至90%或 更高,例如91%、92%、93%、94%、95%、96%、97%、98%、大到至 少99%的氨基酸序列同一性或核酸同一性。

优选地,使用其内含子的基因的同源物编码显示MET1基因表达模式 的蛋白质。优选地,所述基因的内含子的核酸序列与如SEQ ID NO.:3所 描述的核酸序列60%、61%、62%、63%、64%、65%、66%、67%、68%、 69%、70%,例如71%、72%、73%、74%、75%、76%、77%、78%、 79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89% 和甚至90%或更高,例如91%、92%、93%、94%、95%、96%、97%、 98%、大到至少99%同一。可以通过使用鉴定或克隆核酸序列的标准技术 (但不排除其他技术)、数据库搜索法、杂交或基于PCR的技术,利用SEQ ID NO.:3、7或8的或MET1基因的至少10、15、20、30或更多个连续 核苷酸获得所述启动子。

可以使用Smith-Waterman序列比对算法(参见例如Waterman 1995) 实施序列比较,优选地使用具有以下参数的localS程序1.16版:匹配:1,错 配罚分:0.33,开口缺口罚分:2,延伸缺口罚分:2。

cor78启动子与所述内含子(例如MET1的第一内含子)之间的距离优 选地是短的。在一个实施方案中,核酸分子包含例如接头序列,所述的接 头序列位于cor78启动子与所述内含子的第一核苷酸之间,例如长度是0 bp-100bp,例如10bp-90bp或20-80bp,例如20、30、40、50、60、70、 80或90bp。

在本发明的另一个实施方案中,所述的内含子例如MET1的第一内含 子位于受转录调节性核苷酸序列控制所转录的核苷酸序列的另一个内含 子的序列中。

此外,在一个实施方案中,所述的核酸分子包含例如位于所述cor78 启动子序列与MET1内含子的第一核苷酸之间的5’UTR。

一种可能的排列由SEQ ID NO:2的第8199-第9656位碱基对代表, 其包含cor79启动子和MET1基因的第一内含子,或由第8134-第9656 位碱基对代表,其包含cor79启动子、MET1基因的第一内含子和5’UTR。

受转录调节性核苷酸序列控制所转录的核苷酸序列的内含子例如位 于5’UTR中或位于靠近cor78启动子序列的另一个位置内,例如它位于编 码区5’端的头100bp范围内或位于转录起始密码子后的第一个100bp范 围内。

因此在一个实施方案中,本发明涉及分离的核酸分子,其包含编码植 物转录调节序列的多核苷酸,其中所述植物转录调节序列包含

i)选自以下的第一核酸

a)如SEQ ID NO:1中定义的多核苷酸;

b)与SEQ ID NO:1的多核苷酸具有至少50%序列同一性的多核苷 酸;

c)SEQ ID NO:1的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和

d)在下述条件下与包含如SEQ ID NO:1中所定义多核苷酸的至少50 个核苷酸的核酸杂交的多核苷酸,其中所述的条件等同于:在50℃于7% 十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 2×SSC,0.1%SDS中洗涤,和

ii)选自以下的第二核酸

a)如SEQ ID NO:3中定义的多核苷酸;

b)与SEQ ID NO:3的多核苷酸具有至少50%序列同一性的多核苷 酸;

c)SEQ ID NO:3的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和

d)在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸杂交的多核苷酸,其中所述的条件等同于:在50℃于7%十二烷 基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于2×SSC, 0.1%SDS中洗涤,

其中所述的第一和第二核酸序列是功能性连接的并且彼此是异源的。

优选地,包含编码转录调节序列的多核苷酸的核酸分子能够介导植物 或植物细胞中有效连接的核酸序列转录。更优选地,包含编码转录调节序 列的多核苷酸的核酸分子能够介导单子叶植物或单子叶植物细胞中有效 连接的核酸序列转录。优选包含编码转录调节序列的多核苷酸的核酸分子 具有组织特异性。更优选地,包含编码转录调节序列的多核苷酸的核酸分 子优先地在胚或盾片中表达。还优选包含编码转录调节序列的多核苷酸的 核酸分子优先地在非生物性或生物性胁迫条件下表达。所述生物性胁迫条 件选自真菌、线虫、昆虫、病毒和细菌和其组合。所述非生物胁迫条件选 自干旱、寒冷、热、盐、盐度、植物群体高密度、氮、紫外光和其组合。 最优选地,包含编码转录调节序列的多核苷酸的核酸分子优先地在干旱条 件下表达。

本发明的另一个实施方案涉及包含编码如上所述的转录调节序列的 多核苷酸的核酸分子,其中所述核酸包含选自以下序列的至少两个,优选 地多个,例如3、4、5、6、7、8、9、10或更多个,例如多到所有核心启 动子基序,所述的序列如SEQ ID NOs:10、12、14、17、20、22、25、27、 29、31、33、35、37、39、42、44、46、48、50、53、55、57、59、63、 66、68、70、72、74、77、79、82、84、86、88、90、94、96、98、102、 104、108、112、114、117、121、123、125、127、129、131、137和138 中定义。优选地,所述启动子基序排列在如表8和9中所述的转录调节序 列的负链或正链上。甚至更优选地,所述的启动子基序位于与如表8和9 中所述的转录调节序列相同或相似的位置处。

本发明的又一个实施方案涉及了包含编码如上所述的转录调节序列 的多核苷酸的核酸分子,其中所述核酸包含选自以下序列的至少两个,优 选地多个,例如3、4、5、6、7、8、9、10或更多个,例如多到所有核心 启动子基序,所述的序列如SEQ ID NOs:9、11、13、15、16、18、19、 21、23、24、26、28、30、32、34、36、38、40、41、43、45、47、49、 51、52、54、56、58、60、61、62、64、65、67、69、71、73、75、76、 78、80、81、83、85、87、89、91、92、93、95、97、99、100、101、103、 105、106、107、109、110、111、113、115、116、118、119、120、122、 124、126、128、130、132、133、134、135和136中定义。优选地,所述 启动子基序排列在如表8和9中所述的转录调节序列的负链或正链上。甚 至更优选地,所述的启动子基序位于与如表8和9中所述的转录调节序列 相同或相似的位置处。

本发明的另一个实施方案涉及表达构建体,其中所述的表达构建体包 含与核酸序列功能性连接的这样的核酸分子,所述核酸分子包含编码转录 调节序列的多核苷酸。优选地,所述功能性连接的核酸序列赋予植物性状 或特性,其中所述的性状或特性选自提高的产量、胁迫条件下提高的抗性、 提高的种子或籽苗营养品质和/或油含量、和选择标记切除。所述提高的营 养品质和/或油含量可以包括至少一种化合物的含量提高,其中所述的化合 物选自维生素、类胡萝卜素、抗氧化剂、不饱和脂防酸、多不饱和脂防酸 或其氨基酸含量改变的蛋白质。还优选的是所述表达构建体中功能性连接 的核酸序列的转录导致能够在目标植物中赋予至少一种基因功能的蛋白 质或功能性核糖核苷酸序列表达。功能性RNA包含选自反义RNA、有义 RNA、dsRNA、微RNA、ta-siRNA、snRNA、RNAi或其组合的至少一种 RNA。

本发明的一个实施方案提供了由转基因植物产生的植物或种子,其中 所述的转基因植物用包含编码与核酸功能性连接的转录调节序列的多核 苷酸的核酸分子转化。在一个进一步优选的实施方案中,由所述转基因植 物产生的种子表达了能够在目标植物中赋予至少一种基因功能的蛋白质 或功能性核糖核苷酸序列,其中所述的种子或植物具有胁迫条件下提高的 抗性和/或提高的产量和/或提高的种子或籽苗营养品质和/或油含量。更优 选地,所述种子或植物是单子叶植物。优选地,所述种子或植物选自玉米、 小麦、稻、大麦、燕麦、黑麦、高粱、黑麦草或薏苡。更优选地,所述种 子或植物是禾谷类植物,选自玉米、小麦、大麦、稻、燕麦、黑麦和高粱, 甚至更优选地选自玉米、小麦和稻,最优选地,所述种子或植物是玉米。 本发明的其他实施方案涉及本发明单子叶植物的种子、部分和细胞。优选 地,所述植物部分选自细胞、原生质体、细胞组织培养物、愈伤组织、细 胞团块、胚、花粉、胚珠、种子、花、谷粒、穗、穗轴、叶、外壳、柄、 根、根尖、花药和穗丝。

本发明的另一个实施方案涉及用于植物提高产量和/或提高胁迫耐受 性的方法,其中所述的方法包括步骤

A)向植物导入表达构建体,所述表达构建体包含

i)选自以下的第一核酸序列

a)如SEQ ID NO:1中定义的多核苷酸;

b)与SEQ ID NO:1的多核苷酸具有至少50%序列同一性的多核苷 酸;

c)SEQ ID NO:1的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和

d)在下述条件下与包含如SEQ ID NO:1中所定义多核苷酸的至少50 个核苷酸的核酸杂交的多核苷酸或其互补物,其中所述的条件是:在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于2×SSC,0.1%SDS中洗涤,和与其有效连接的

ii)选自以下的第二核酸

a)如SEQ ID NO:3中定义的多核苷酸;

b)与SEQ ID NO:3的多核苷酸具有至少50%序列同一性的多核苷 酸;

c)SEQ ID NO:3的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和

d)在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸杂交的多核苷酸或其互补物,其中所述的条件是:在50℃于7% 十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 2×SSC,0.1%SDS中洗涤,

并且与至少一个核酸有效连接,其中所述的至少一个核酸相对于所述 第一或第二核酸序列是异源的并且能够向植物赋予提高的产量和/或提高 的胁迫耐受性,和

B)选择转基因植物,其中与野生型或无效分离子植物相比较,所述的 植物具有提高的产量和/或在胁迫条件下提高的胁迫耐受性。

本领域技术人员已知多种核酸以获得产量和/或胁迫抗性。所述核酸可 以包括但不限于编码参与植物激素生物合成、植物激素调节、细胞周期调 节或糖代谢的多肽。

本发明的另一个实施方案涉及用于赋予提高的种子或籽苗营养品质 和/或油含量的方法,其中所述的方法包括步骤

A)向植物导入表达构建体,所述表达构建体包含

i)选自以下的第一核酸

a)如SEQ ID NO:1中定义的多核苷酸;

b)与SEQ ID NO:1的多核苷酸具有至少50%序列同一性的多核苷 酸;

c)SEQ ID NO:1的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和

d)在下述条件下与包含如SEQ ID NO:1中所定义多核苷酸的至少50 个核苷酸的核酸杂交的多核苷酸或其互补物,其中所述的条件是:在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于2×SSC,0.1%SDS中洗涤;和与其有效连接的

ii)选自以下的第二核酸

a)如SEQ ID NO:3中定义的多核苷酸;

b)与SEQ ID NO:3的多核苷酸具有至少50%序列同一性的多核苷 酸;

c)SEQ ID NO:3的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和

d)在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸杂交的多核苷酸或其互补物,其中所述的条件是:在50℃于7% 十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 2×SSC,0.1%SDS中洗涤,

并且与至少一个核酸有效连接,其中所述的至少一个核酸相对于所述 第一或第二核酸序列是异源的并且适于向植物赋予提高的种子或籽苗营 养品质和/或油含量,并且

B)选择转基因植物,其中与野生型或无效分离子植物相比较,所述的 植物具有提高的营养品质和/或油含量。

营养品质和/或油含量如上文定义。更具体的实例在下文中给出。转录 调节序列在上文描述,更优选地,所述转录调节序列是胚特异的。

本发明的又一个实施方案涉及用于从植物中切除靶序列例如标记序 列的方法,所述的方法包括步骤

A)通过有效地连接转录调节性核苷酸序列而构建表达盒,所述转录 调节性核苷酸序列包含

i)选自以下的第一核酸

a)如SEQ ID NO:1中定义的多核苷酸;

b)与SEQ ID NO:1的多核苷酸具有至少50%序列同一性的多核苷 酸;

c)SEQ ID NO:1的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和

d)在下述条件下与包含如SEQ ID NO:1中所定义多核苷酸的至少50 个核苷酸的核酸杂交的多核苷酸或其互补物,其中所述的条件是:在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于2×SSC,0.1%SDS中洗涤;和与其有效连接的

ii)选自以下的第二核酸

a)如SEQ ID NO:3中定义的多核苷酸;

b)与SEQ ID NO:3的多核苷酸具有至少50%序列同一性的多核苷 酸;

c)SEQ ID NO:3的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和

d)在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸杂交的多核苷酸或其互补物,其中所述的条件是:在50℃于7% 十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 2×SSC,0.1%SDS中洗涤,

并且与至少一个核酸有效连接,其中所述的至少一个核酸相对于所述 的第一或第二核酸序列异源性的并且适于诱导从植物中切除靶序列例如 标记序列,和

B)将所述的表达盒插入包含至少一个靶序列例如标记序列的植物以 产生转基因植物,其中所述的植物表达所述的异源核酸序列,和

C)选择转基因植物,其中所述转基因植物表现出切除所述靶序列例 如所述标记序列。

优选地,所述靶序列是标记序列,例如抗生素抗性基因或除草剂抗性 基因。

在本发明的一个优选实施方案中,从本发明的嵌合性转录调节序列表 达的核苷酸序列不编码β-葡糖醛酸糖苷酶(GUS)或不是用于表达GUS基因 以实现GUS介导染色的方法。

附图简述

图1.质粒pBPSMM368:At.Cor78::BPS1.1::GUS::NOS的图谱

图2.At.Cor78启动子构建体的组织化学GUS染色。显示了所述构建 体的典型染色模式的代表性实例。A: At.Cor78::BPS1.1::GUS::NOS(pBPSMM368);B:At.Cor78::GUS::NOS (pBPSMM250);C:At.Cor78::Ubi-内含子1::GUS::NOS(pBPSMM346)

图3.玉米中受pBPSMM346启动子构建体控制的干旱胁迫诱导型表 达或稳定表达。5叶簇阶段的转基因植物因断水遭受干旱胁迫。在所示时 间点上从叶采集样品。RNA从叶样品分离并用定量RT-PCR分析。针对 每个样品中的内对照基因归一化GUS表达。与设置为1的0-时间点相比, 结果表示为表达水平提高的倍数。

图4a-4c:RD29A基因和低温诱导的蛋白78基因的核苷酸序列和氨基 酸序列。

图5:MET1基因的核苷酸序列。

定义

除非另外说明,技术术语根据常规用法使用。分子生物学中常见术语 的定义可以在Lewin,Genes V,Oxford University Press出版,1994年 (ISBN 0-19-854187-9);Kendrew等(编者),The Encyclopedia of Molecular Biology,Blackwell Science Ltd.出版,1994年(ISBN 0-632-02182-9)以及 VCH Publishers,Inc.出版,Robert A.Meyers(编著),Molecular Biology and Biotechnology:a Comprehensive Desk Reference,1995年(ISBN 1-56081-569-8)中找到。

应当理解本发明不限于所描述的具体方法学、方案、细胞系、植物物 种或属、构建体和试剂。还应当理解本文中所用术语的目的仅是描述具体 实施方案,并且不意图限制本发明的范围,其中所述的本发明范围仅受所 附的权利要求书限制。必须指出:如本文中和在所附权利要求书中所用, 单数形式“一”和“该”包括复数指称,除非上下文另外清楚地声明。因此, 例如对“一个载体”的称谓是对一个或多个载体的称谓并包括本领域技术人 员已知的其等同物,以及其他等。

术语“约”在本文中用来意指大约地、粗略地、左右或在......范围内。 当术语“约”与数字范围相连使用时,该术语通过延伸边界值高于和低于所 述值而修饰这个范围。通常,术语“约”在本文中用来以高于和低于一个数 字值的20%变异、优选以10%以上或以下(之上或之下)的变异修饰所述值。

如本文中所用,词语“或”意指特定列举的任一成员并且也包括所列举 成员的任意组合。

术语“基因”广义地用来指与生物学功能相关的核酸的任意节段。因此, 基因包括编码序列和/或其表达所需要的调节序列。例如,基因指表达 mRNA或功能性RNA或者编码特定蛋白质的核酸片段,并且其包括调节 序列。基因可以包括非编码性DNA序列和/或调节序列,其中所述的非编 码区可以转录成如微RNA。基因也包括例如形成其他蛋白质和/或RNA的 识别序列的非表达性节段。基因可以通过化学方法或分子生物学方法从多 种来源获得,包括从目的来源克隆或从已知或预测的序列信息合成,并且 可以包括设计旨在具有所需参数的序列。

术语“天然”或“野生型”基因指在未转化的细胞即没有已知突变的细胞 的基因组中存在的基因。

“标记基因”或“标记序列”编码可选择或可筛选性状。

术语“嵌合基因”指含有以下项的任一基因

1)包括在自然界中不在一起存在的调节序列和编码序列的DNA序列, 或

2)非天然连接的编码部分编码序列(例如编码蛋白质)的序列,或

3)非天然连接的调节序列(例如启动子)的部分。

因此,嵌合基因可以包含衍生自不同来源的调节序列和编码序列,或 包含衍生自相同来源,但以不同于自然界中存在的方式排列的调节序列和 编码序列。

“转基因”指已经通过转化作用导入基因组并且得以稳定维持的基因。 转基因可以包括例如相对于待转化的特定植物的基因为异源的或同源的 基因。此外,转基因可以包含插入非原本生物的天然基因或包含嵌合基因。 术语“内源性基因”指位于生物基因组中其天然位置内的天然基因。“外源” 基因指通常在宿主细胞中找不到,但通过基因转移所导入的基因。

与本发明核苷酸序列相对应的例如用于探测或扩增反应中的“寡核苷 酸”可以是约30个或更少核苷酸长度(例如9、12、15、18、20、21或24 个或在9和30个之间的任意数)。通常,特异性引物具有多于14个核苷酸 的长度。对于最佳特异性和成本效率而言,可以优选16至24个核苷酸长 度的引物。本领域技术人员完全能够针对使用方法如PCR法设计引物。 根据需要,探测可以用本文中公开的基因的完整限制性片段进行,其中所 述的完整限制性片可以是100个或甚至1000个核苷酸长度。

术语“多肽”、“肽”、“寡肽”、“多肽”、“基因产物”、“表达产物”和“蛋 白质”在本文中可互换地用来指连续氨基酸残基的聚合物或寡聚物。如本文 中所用,术语“氨基酸序列”或“多肽序列”指一串代表氨基酸残基的缩写、 字母、字符或词。氨基酸可以在本文中通过它们共知的三字母符号或由 IUPAC-IUB生物化学命名委员会(IUPAC-IUB Biochemical Nomenclature Commission)推荐的单字母符号提到。本文中所用的缩写是氨基酸的常规 单字母代码:A,丙氨酸;B,天冬酰胺或天冬氨酸;C,半胱氨酸;D天 冬氨酸;E,谷氨酸(glutamate),谷氨酸(glutamic acid);F,苯丙氨酸;G, 甘氨酸;H组氨酸;I异亮氨酸;K,赖氨酸;L,亮氨酸;M,甲硫氨 酸;N,天冬酰胺;P,脯氨酸;Q,谷氨酰胺;R,精氨酸;S,丝氨酸; T,苏氨酸;V,缬氨酸;W,色氨酸;Y,酪氨酸;Z,谷氨酰胺或谷氨 酸(参见L. Stryer,Biochemistry,1988,W.H.Freeman and Company, New York)。如本文在氨基酸序列中所用的字母“X”可以代表任意氨基酸残 基。

“编码序列”指编码特定氨基酸序列并且排除非编码序列的DNA序列 或RNA序列。它可以构成“未间断的编码序列”(即无内含子),如在cDNA 中,或它可以包括由适宜的剪接接点(splice junction)界定的一个或多个内 含子。“内含子”是这样的RNA序列,其包含在初级转录物中,但通过细 胞内的RNA切割和再连接作用被除去以产生可以翻译成蛋白质的成熟 mRNA。

术语“可读框”和“ORF”指在编码序列的翻译起始密码子与终止密码 子之间编码的氨基酸序列。术语“起始密码子”和“终止密码子”指编码序列 中分别指导蛋白质合成(mRNA翻译)起始和链终止的三个毗邻核苷酸的单 元(“密码子”)。

“功能性RNA”指不被翻译的反义RNA、核酶或其他RNA。

术语“RNA转录物”指因RNA聚合酶催化DNA序列转录而产生的产 物。当所述RNA转录物是此DNA序列的完美互补性拷贝时,此RNA转 录物称作初级转录物,或所述RNA转录物可以是从所述初级转录物的翻 译后加工过程衍生的RNA序列并且称作成熟RNA。“信使RNA”(mRNA) 指无内含子并可由细胞翻译成蛋白质的RNA。“cDNA”指与mRNA互补并 且衍生自mRNA的单链或双链DNA。

“转录调节性核苷酸序列”、“调节序列”和“合适的调节序列”分别指影 响已连接(或功能性连接)的待转录核苷酸序列的转录、RNA加工或稳定性 或者翻译的核苷酸序列。转录调节性核苷酸序列可以相对于待转录的核苷 酸序列具有多种定位。转录调节性核苷酸序列可以位于待转录序列(例如编 码序列)的上游(5’非编码序列)、位于其中或其下游(3’非编码序列)。转录调 节性核苷酸序列可以选自增强子、启动子、翻译前导序列、内含子、5’-非 翻译序列、3’-非翻译序列和聚腺苷酸化信号序列。它们包括天然序列和人 工序列,以及可以是人工序列与天然序列组合的序列。如上文指出,术语 “转录调节性核苷酸序列”不限于启动子。然而优选地,本发明的转录调节 性核苷酸序列包含至少一个启动子序列(例如位于能够诱导下游序列转录 的基因的转录起点上游的序列)。在一个优选实施方案中,本发明的转录调 节性核苷酸序列包含相应基因的启动子序列和任选地且优选地该基因的 天然5’非翻译区。此外,也可以使用该基因的3’非翻译区和/或聚腺苷酸化 区。

“启动子”指为RNA聚合酶和对于正确转录所需要的其他因子(例如反 式作用转录因子)提供识别作用而控制编码序列表达的核苷酸序列,其通常 位于编码序列的上游(5′)。“启动子”包括最小启动子,其中所述的最小启动 子是由起指定转录起点作用的TATA盒和其他序列组成的短DNA序列, 其中向所述的短DNA序列添加调节元件(例如顺式元件)以控制表达。“启 动子”还指包含最小启动子和能够控制编码序列或功能性RNA表达的调节 元件的核苷酸序列。这种类型的启动子序列由近端和更远的上游元件组 成,更远的上游元件常称作增强子。因此,“增强子”是这样的DNA序列, 该DNA序列可以刺激启动子活性并且可以是该启动子的固有元件或所插 入旨在增强启动子的水平或组织特异性的异源性元件。增强子能够在两个 (正常或倒转)方向上起作用,并且甚至当被移到该启动子上游或下游时还 能够发挥功能。增强子和其他上游启动子元件均结合介导其效应的序列特 异性DNA结合蛋白。启动子可以完整地从天然基因衍生,或由从自然界 中存在的不同启动子衍生的不同元件组成,或甚至由人工DNA节段组成。 启动子也可以含有参与蛋白质因子结合的DNA序列,其中所述的蛋白质 因子控制应答生理条件或发育条件时的转录起始效率。如本文中所用,术 语“顺式元件”指赋予整体控制基因表达的一个方面的顺式作用转录调节元 件。顺式元件可以结合调节转录的转录因子、反式作用蛋白质因子而发挥 作用。一些顺式元件结合不止一种转录因子,并且转录因子可以与不止一 种顺式元件以不同的亲和力相互作用。本发明的启动子受欢迎地含有可以 赋予基因表达或调节基因表达的顺式元件。顺式元件可以通过多种技术鉴 定,其中所述的技术包括缺失分析(即从启动子的5’端或内部缺失一个或多 个核苷酸;使用DNA酶I足迹法的DNA结合蛋白分析法、甲基化干扰、 电泳迁移率移动分析、通过连接介导的PCR进行体内基因组足迹法和其 他常规分析;或通过常规DNA序列比较方法与已知顺式元件基序比较的 DNA序列相似性分析。顺式元件的精细结构可以通过诱变(或置换)一个或 多个核苷酸或通过其他常规方法进一步研究。顺式元件可以通过化学合成 或通过从包含如此元件的启动子分离获得,并且可以合成带有额外侧翼核 苷酸的所述顺式元件,其中所述的额外侧翼核苷酸含有旨在促进亚序列操 作的有用限制性酶位点。

“起始位点”是环绕在构成已转录序列的部分的第一核苷酸周围的位 置,该位置又定义为位置+1。相对于该位置,对基因及其控制区的全部其 他序列编号。下游序列(即3’方向上的其他蛋白质编码序列)命名为正数, 而上游序列(大部分是5’方向上的控制区)命名为负数。

在缺少上游激活作用时无活性或启动子活性明显降低的启动子元件、 尤其TATA元件称作“最小或核心启动子”。在合适的转录因子存在下,所 述最小启动子发挥允许转录的作用。“最小或核心启动子”因此仅由对于转 录起始所需要的全部基础元件组成,例如TATA盒和/或起始子。

术语“内含子”指在基因中DNA的部分(间插序列),其中所述的部分不 编码由该基因产生蛋白质的部分并且在从该基因转录出的mRNA离开细 胞核被输出之前,从该mRNA中剪接出来。内含子序列指内含子的核酸序 列。因此,内含子是DNA序列的这些区域,其中所述区域随编码序列(外 显子)一起转录出来,但是在成熟mRNA形成期间被除去。内含子可以位 于实际编码区内部或位于前mRNA(未剪接的mRNA)的5’或3’非翻译前导 序列中。初级转录物中的内含子被切除,并且同时且精确地连接所述编码 序列以形成成熟的mRNA。内含子与外显子的接界形成剪接位点。内含子 序列始于GU并且止于AG。此外,已经在植物中描述了两个AU-AC内含 子实例:来自拟南芥(Arabidopsis thaliana)的RecA样蛋白质基因的内含子 14和G5基因的内含子7是AT-AC内含子。含有内含子的前mRNA具有 三个短序列,其中除了其他序列之外,这三个短序列对于精确地剪接内含 子是必需的。这些序列是5’剪接位点、3’剪接位点和分支点。mRNA剪接 是除去在初级mRNA转录物中存在的间插序列(内含子),以及接合或连接 外显子序列。这又称作顺式剪接,其中使相同RNA上的两个外显子接合, 同时除去间插序列(内含子)。内含子的功能性元件包含由剪接体的特定蛋 白质成分结合并识别的序列(例如在内含子末端的剪接共有序列)。所述功 能性元件与剪接体的相互作用导致内含子序列从不成熟mRNA中除去并 外显子序列再连接。内含子具有对于内含子精确剪接所必需(尽管不充分) 的三个短序列。这些序列是5’剪接位点、3’剪接位点和分支点。分支点序 列对于植物中剪接作用和剪接位点的选择是重要的。分支点序列通常位于 3’剪接位点上游10-60个核苷酸。植物序列在分支点中显示序列变异性, 所述的共有序列是CURAY或YURAY。

“组成型表达”指使用组成型启动子或调节型启动子的表达。“条件性表 达”和“调节型表达”指由调节型启动子控制的表达。

“组成型启动子”指这样的启动子,其能够在植物的全部或几乎全部发 育阶段期间的全部或几乎全部植物组织中表达受该启动子控制的可读框 (ORF)。每种转录激活元件均不表现绝对的组织特异性,不过在绝大多数 植物部分中以转录最活跃的植物部分内所达到水平的至少1%水平介导转 录激活。

“调节型启动子”指这样的启动子,该启动子并不以组成型方式而以时 间和/或空间调节方式指导基因表达,并且包括组织特异性启动子和诱导型 启动子。这种启动子包含天然序列、人工序列以及可以是人工序列与天然 序列组合的序列。不同启动子可以指导基因在不同组织或细胞类型中或在 不同发育阶段或应答不同环境条件时表达。不断发现用于植物细胞的多种 类型的新启动子,众多实例可以在Okamuro等(1989)的编著内找到。植物 中有用的常见调节型启动子包括但不限于安全剂诱导型启动子、从四环素 诱导型系统衍生的启动子、从水杨酸诱导型系统衍生的启动子、从醇诱导 型系统衍生的启动子、从糖皮质激素诱导型系统衍生的启动子、从病原体 诱导型系统衍生的启动子和从蜕皮激素诱导型系统衍生的启动子。

“组织特异性启动子”指并不在全部植物细胞中表达而仅在特定器官 (如叶或种子)、特定组织(如胚或子叶)的一个或多个细胞类型中,或在特定 细胞类型(如叶薄壁组织细胞或种子贮藏细胞)中表达的调节型启动子。这 些启动子也包括以时间方式,例如在胚发生早期或晚期、在正在发育的种 子或果实中果实成熟期间、在充分分化的叶内或在衰老发作时受到调节的 启动子。

“诱导型启动子”指可以由外部刺激(如化学品、光、激素、胁迫或病原 体)在一个或多个细胞类型中开启(turn on)的那些调节型启动子。

“有效连接”或“功能性连接”优选地指多个核酸序列在单个核酸片段上 的连接,从而一个核酸序列的功能受另一个核酸序列影响。更具体地,它 指第一个序列的位置与第二序列充分接近,从而所述第一序列可以对第二 序列或对受所述第二序列控制的区域产生影响。例如,如果调节性DNA 序列和编码RNA或多肽的DNA序列如此安置,从而所述调节性DNA序 列影响编码性DNA序列的表达(即编码序列或功能性RNA处于所述启动 子的转录性控制下),则将调节性DNA序列称作与编码RNA或多肽的DNA 序列“有效连接”或“结合”。

大部分激活性序列(例如内含子)处于被增强的启动子的约300-400碱 基对范围内。

在一个实施方案中,内含子(例如INME内含子)的位置在受控基因的 5’UTR内(Rose等,RNA 2002,8:1444-1453;Callis等,1987,Genes & Dev 1:1183-1200;PF56400)。

在所述启动子区与内含子之间的接头例如小于400碱基对长度,例如 200、100、50或更少碱基对。优选地,核酸分子的第一序列通过长度约100 个核苷酸或更少核苷酸的接头与第二序列连接。

在本发明的又一个实施方案中,使用不止一个激活性序列并且所述激 活性序列相互之间间隔约16-约80碱基对。所述编码序列可以有效地以 有义或反义方向连接于调节序列,例如转录成编码多肽或蛋白质片段的 mRNA或转录成调节性或酶型RNA分子,例如反义RNA、RNAi、核酶、 miRNA、ta-siRNA、dsRNA、snRNA或本文中或相关文献描述的其他RNA 等,或者其组合。

“表达”指植物中内源性基因、ORF或其部分或转基因的转录和/或翻 译。例如,在反义构建体的情形下,表达可以仅指反义DNA的转录。此 外,表达指有义RNA(mRNA)或功能性RNA的转录和稳定累积。表达也 可以指蛋白质产生。

“特异性表达”是限于一种或一些种植物组织(空间限制)和/或限于一个 或一些植物发育阶段(时间限制)的基因产物表达。已知几乎不存在真正的 特异性:启动子似乎优选地在某些组织中开启,而在其他组织中可能无活 性或仅有少量活性。这种现象称作渗漏表达。然而,特异性表达在本发明 中意指优先在一种或几种植物组织中表达。

(具有或没有增强子的)启动子的“表达模式”是显示转录由该启动子在 植物何处及在哪个发育阶段启动的表达水平模式。当一种启动子的表达模 式显示与其余启动子的表达模式很少重叠时,将一组启动子的表达模式称 为是互补的。启动子的表达水平可以通过测量已转录的标准报道mRNA 的‘稳态’浓度来确定。这种测量是间接的,因为报道mRNA的浓度不仅仅 取决于其合成速率,还取决于该mRNA降解的速率。因此,稳态水平是合 成速率和降解速率的结果。然而当转录的序列相同时,可以认为降解速率 以固定速率进行,并且这个值因此可以起到测量合成速率的作用。当启动 子以这种方式比较时,本领域技术人员可用的技术是杂交、S1-RNA酶分 析法、RNA印迹法和竞争性RT-PCR。这些技术无论如何不代表可用的全 部技术,反而仅描述了分析mRNA转录活性和表达水平的常用方法。实际 上分析几乎全部启动子内的转录起点表明在转录起始的位点处通常不存 在单个碱基,反而存在或多或少簇集的成组起始位点,其中每组起始位点 构成mRNA的一些起点。由于这种分布在启动子与启动子之间不同,故在 每个群体内的报道mRNA序列彼此不同。由于每一mRNA种类或多或少 地易于降解,因而不可能对不同的报道mRNA期望单一降解速率。已经对 多种真核生物启动子序列证实:围绕起始位点(“起始子”)的序列在决定受 所述具体启动子指导的RNA表达水平中发挥重要作用。这种序列也包括 已转录序列的部分。因此,启动子与报道序列的直接融合将导致次优水平 的转录。分析表达模式和表达水平的常用方法是测定细胞内蛋白质累积的 稳态’水平。本领域技术人员已知的常见使用的候选报道基因是β-葡糖醛 酸糖苷酶(GUS)、氯霉素乙酰基转移酶(CAT)和具有荧光特性的蛋白质,如 维多利亚水母(Aequora victoria)的绿色荧光蛋白(GFP)。然而原则上, 众多蛋白质适用于此目的,只要该蛋白质不干扰重要的植物功能即可。多 种工具适用于量化和确定位置。可以轻易地产生或获得检测系统,其中所 述的检测系统基于例如免疫化学、酶、荧光检测和定量。可以在植物组织 提取物或在完整组织中使用蛋白质表达的原位分析法测定蛋白质水平。通 常,用一种嵌合启动子报道构建体转化的单个株系在它们的报道基因表达 水平上不同。还经常观察到此类转化体不表达任何可检测产物(RNA或蛋 白质)的现象。通常这种表达变异性归咎于‘位置效应’,虽然决定这种无活 性的分子机制通常不明了。

“过量表达”指转基因细胞或转基因生物中这样的表达水平,其超过正 常或未转化(非转基因)的细胞或生物中的表达水平。

“5’非编码序列”或“5’-非翻译序列”或“-区域”指位于编码序列5’(上游) 的核苷酸序列。这种核苷酸序列存在于充分加工的mRNA的起始密码子上 游并且可以影响初级转录物至mRNA的加工过程、mRNA稳定性或翻译 效率(Turner 1995)。

“3’非编码序列”或“3’-非翻译序列”或“-区域”指位于编码序列3’(下游) 的核苷酸序列并且包括聚腺苷酸化信号序列和其他序列,其中所述的其他 序列编码能够影响mRNA加工过程或基因表达的调节信号。聚腺苷酸化信 号通常以影响聚腺苷酸添加至mRNA前体的3’末端。不同3’非编码序列 的用途由Ingelbrecht等,1989例举。

术语“翻译前导序列”指基因在启动子和编码序列之间的DNA序列部 分,其中所述的DNA序列部分转录成RNA并且存在于充分加工的mRNA 的翻译起始密码子上游(5′)。翻译前导序列可以影响初级转录物至mRNA 的加工过程、mRNA稳定性或翻译效率。

“信号肽”指一种多肽的氨基端延伸物,这种氨基端延伸物同所述多肽 一起被翻译,形成前体肽,并且是该前体肽进入分泌途径所需要的。术语 “信号序列”指编码所述信号肽的核苷酸序列。如本文中所用的术语“转运 肽”指已表达多肽的一部分(优选地指多肽的氨基端延伸物),这个部分与所 述多肽一起被翻译,形成前体肽,并且是该前体肽进入细胞器(如质体(例 如叶绿体)或线粒体)所需要的。术语“转运序列”指编码所述转运肽的核苷 酸序列。

“反义抑制”指产生能够抑制蛋白质从内源性基因或转基因表达的反义 RNA转录物。

“基因沉默”指病毒基因、转基因或内源核基因的同源性依赖抑制作用。 当所述抑制作用因受影响基因的转录降低引起时,基因沉默可以是转录水 平的,或当所述抑制作用因与受影响基因同源的RNA种类周转(降解)增加 引起时(English 1996),基因沉默可以是转录后的。基因沉默包括病毒诱导 的基因沉默(Ruiz等1998)。

如本文中所用,术语“异源DNA序列”、“外源DNA节段”或“异源核 酸”分别指这样的序列,其源自相对于特定宿主细胞为外来的来源,或若来 自相同来源,则相对于其原初形式是经修饰的。因此,宿主细胞中的异源 性基因包括相对于特定宿主细胞是内源性的,但已经例如通过利用DNA 改组法被修饰的基因。该术语也包括天然存在的DNA序列的多重非天然 存在的拷贝。因此,本术语指这样的DNA节段,其相对于所述细胞是外 来或异源性的,或虽然相对于所述细胞是同源的,但是处于宿主细胞核酸 内该元件通常不存在的位置中。表达外源DNA节段以产生外源性多肽。“同 源”DNA序列是这样的DNA序列,其与导入该DNA序列的宿主细胞天然 地相关。

在核苷酸序列同一性的上下文中,“同源于”指两种核酸分子的核苷酸 序列之间或两种蛋白质分子的氨基酸序列之间的相似性。通过如本领域技 术人员充分理解的严格条件下(如在Haines和Higgins(编者),Nucleic Acid Hybridization,IRL Press,Oxford,U.K.中描述)DNA-DNA杂交或 DNA-RNA杂交或通过两种核酸或两种蛋白质之间的序列相似性比较,提 供对此类同源性的评估。

术语“基本上相似”指代表本文中所公开序列、尤其稻、拟南芥或欧洲 油菜(Brassica napus)序列的功能性和/或结构性等同物或直向同源物的核 苷酸和氨基酸序列。

在最广泛的意义上,当在本文中就核苷酸序列使用“基本上相似”时, 术语“基本上相似”意指该核苷酸序列是编码多肽的基因的部分,其中所述 的多肽具有与作为参考核苷酸序列的基因编码的多肽基本上相同的结构 和功能,例如,该核苷酸序列包含来自基因(其中该基因是与参考核苷酸序 列相对应的基因的直向同源物)的启动子以及在结构上与本文中特别例举 启动子序列相关的启动子序列,即基本上相似的启动子序列与本文中所例 举启动子序列的互补序列在高严格条件或极高严格条件下杂交。例如,仅 反映遗传密码子简并性但仍编码与特定氨基酸序列相同的氨基酸序列的 变异核苷酸序列与特定核苷酸序列基本上相似。术语“基本上相似”也包括 这样的核苷酸序列,其中所述序列已经被修饰例如旨在优化于特定细胞中 的表达,也包括编码变异多肽的核苷酸序列,其中所述的变异多肽相对于 所述参考序列编码的(未修饰)多肽具有一个或多个氨基酸置换,所述的置 换不改变该变异多肽相对于所述未修饰多肽的活性。

在最广泛的意义上,当在本文中就多肽使用“基本上相似”时,术语“基 本上相似”意指该多肽具有与参考多肽基本上相同的结构和功能。优选地, 所述同源物是直向同源物。可以在一种简单测定法中检验具有基本上相似 序列的基因是否是基因(例如cor78或Met1基因)的直向同源物:首先缺失 内源性基因例如cor78或Met并随后将所述潜在直向同源物导入缺失的细 胞或植物。直向同源物应当重建与野生型相似或基本上相似的表型,优选 地,该表型与野生型相同。在一个实施方案中,该术语可以意指与特定序 列基本上相似的氨基酸序列是这样一些氨基酸序列,其中整体氨基酸同一 性相对于本发明序列是至少60%或更高。产生等效核苷酸或氨基酸序列的 修饰完全属于本领域常规技术的范围内。在一个实施方案中,基本上相似 的多肽与参考多肽之间的氨基酸序列同一性百分数是至少60%、61%、 62%、63%、64%、65%、66%、67%、68%、69%、70%,例如71%、 72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%和甚至90%或更高,例如91%、 92%、93%、94%、95%、96%、97%、98%、大到至少99%。除了具有 基本上相同的功能以外,两种多肽彼此基本上相似的又一个迹象是与所述 多肽之一特异性结合的一种物质(例如抗体)也特异性地与另一种多肽结 合。

序列比较可以使用Smith-Waterman序列比对算法(参见例如 Waterman(1995))实施。优选地使用具有如下参数的1.16版localS程序:匹 配:1、错配罚分:0.33,缺口开口罚分:2,缺口延伸罚分:2。

此外,与参考核苷酸序列“基本上相似”的核苷酸序列称作与该参考核 苷酸序列“等效”。技术人员认识到由本发明包含的等效核苷酸序列也可以 由它们在低严格条件、中等严格条件和/或严格条件(例如0.1×SSC、0.1% SDS、65℃)下与本权利要求书字面意思范围内的核苷酸序列杂交的能力进 行定义。

当谈及多核苷酸片段或多肽片段使用“基本上相同活性”时,“基本上相 同活性”的含义是所述片段具有全长多核苷酸活性或全长多肽活性的至少 60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%, 例如71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、 81%、82%、83%、84%、85%、86%、87%、88%、89%和甚至90%或 更高,例如91%、92%、93%、94%、95%、96%、97%、98%、大到至 少99%。

“靶基因”指表达所需要的目的编码序列、功能性RNA或蛋白质的基 因,如指复制子中的基因。在一个实施方案中,靶基因不是复制子复制必 需的。此外,靶基因可以包含插入非本源生物的天然非病毒基因或包含嵌 合基因,并且将处于适宜的调节序列控制下。因此,在所述靶基因中的调 节序列可以来自任何来源,包括病毒。靶基因可以包括相对于待转化的具 体植物的基因为异源性或同源的编码序列。然而,在一个实施方案中,靶 基因可以是不包含天然病毒基因的基因。常见靶基因包括但不限于编码结 构蛋白、种子贮藏蛋白、赋予除草剂抗性的蛋白质和赋予昆虫抗性的蛋白 质的基因。由靶基因编码的蛋白质称作“外源蛋白”。植物中靶基因的表达 通常将导致改变的植物性状。

术语“改变的植物性状”意指转基因植物中相对于野生型或非转基因植 物宿主的任意表型变化或基因型变化。

术语“转化”指转移核酸片段至宿主细胞的基因组,产生遗传稳定的遗 传。含有转化核酸片段的宿主细胞称作“转基因”细胞,并且包含转基因细 胞的生物称作“转基因生物”。转化植物和植物细胞的方法实例包括农杆菌 介导的转化法(De Blaere 1987)和粒子轰击技术(US 4,945,050)。完整植物可 以从转基因细胞通过技术人员熟知的方法再生(参见例如,Fromm 1990)。

“转化的”、“转基因的”和”重组的”指其中已经导入异源性核酸分子的 宿主生物,如细菌或植物。所述核酸分子可以稳定地整合至基因组中。例 如,“转化的”、“转化体”和“转基因”植物或愈伤组织已经经历转化过程并 且含有整合至其染色体中的外来基因。术语“未转化的”指未经历转化过程 的正常植物。

“瞬时转化的”指其中转基因和外来DNA(例如通过此类方法,如农杆 菌介导的转化法或生物射弹轰击法)已经导入,但是没有针对稳定维持进行 选择的细胞。

“稳定转化”指转化后已经在选择性培养基上选择和再生的细胞。

“染色体整合的”指外来基因或DNA构建体通过共价键整合至宿主 DNA。在基因未发生“染色体整合”的情形下,它们可以被“瞬时地表达”。 基因瞬时表达指如此基因的表达,其中所述基因未整合至宿主染色体,但 例如作为自主复制性质粒或表达盒的部分或作为另一种生物系统(如病毒) 的部分而独立发挥作用。

“瞬时表达”指在如此细胞中的表达,在所述细胞中病毒或转基因借助 病毒感染或借助此类方法如农杆菌介导的转化法、电穿孔法或生物射弹轰 击法导入,但是没有针对其稳定维持进行选择。

“遗传稳定的”和“可遗传的”指在植物中稳定维持并经过连续世代由子 代稳定遗传的染色体性整合性遗传元件。

“原代转化体”和“T0世代”指具有与最初所转化组织(即自转化以来没 有经历减数分裂和受精)相同的遗传世代的转基因植物。

“次代转化体”和“T1、T2、T3等世代”指经一个或多个减数分裂循环 和受精循环从原代转化体衍生的转基因植物。它们可以通过原代转化体或 次代转化体的自我受精或原代转化体或次代转化体与其他转化或未转化 的植物杂交而衍生。

“野生型”指无任何已知突变的自然界中存在的病毒或生物。

无效分离子是因孟德尔分离作用而不含转基因的转基因植物后代(或 从该后代衍生的株系)。

术语“基因组”或“基因组DNA”指宿主生物的可遗传性遗传信息。所述 基因组DNA包含核DNA(又称作染色体DNA),也包括质体(例如叶绿体) 和其他细胞器(例如线粒体)的DNA。优选地,术语“基因组”或“基因组 DNA”指核的染色体DNA。

术语“染色体DNA”或“染色体DNA序列”应当理解为独立于细胞周期 状态的细胞核基因组DNA。染色体DNA因此可以在染色体或染色单体中 组织,它们可能是压缩的或松散的。对染色体DNA的插入可以通过本领 域已知的多种方法例如聚合酶链反应(PCR)分析法、DNA印迹分析、荧光 原位杂交(FISH)和原位PCR证实并分析。

术语“核酸”指脱氧核糖核苷酸或核糖核苷酸及由含有糖、磷酸酯和碱 基(其为嘌呤或嘧啶)的单体(核苷酸)组成的单链或双链形式的聚合物。除非 专门限定,否则该术语包括含有天然核苷酸的已知类似物的核酸,其中所 述的核酸具有与参考核酸相似的结合特性并且以与天然存在的核苷酸相 似的方式进行代谢。除非另外说明,特定核酸序列也内在地包括其保守修 饰变体(例如简并密码子置换)和互补性序列,以及明确指出的序列。具体 地,简并密码子置换可以通过产生这样的序列实现,在所述序列中一个或 多个所选(或全部)密码子的第三位置置换为混合碱基和/或脱氧次黄苷残基 (Batzer 1991;Ohtsuka 1985;Rossolini 1994)。“核酸片段”是给定核酸分 子的部分。在高等植物中,脱氧核糖核酸(DNA)是遗传物质,而核糖核酸 (RNA)参与将DNA中所含的信息转移至蛋白质。术语“核苷酸序列”指可以 作为单链或双链的DNA或RNA聚合物,其中所述聚合物任选含有能够并 入DNA或RNA聚合物的人工、非天然性或改变的核苷酸碱基。术语“核 酸”或“核酸序列”也可以与基因、cDNA、DNA和由基因编码的RNA相互 交换使用。

本发明包括分离的或基本上纯化的核酸或蛋白质组合物。在本发明的 上下文中,“分离的”或“纯化的”DNA分子或“分离的”或“纯化的”多肽是这 样的DNA分子或多肽,其因人为作用而脱离于其天然环境存在并且因此 不是自然产物。分离的DNA分子或多肽可以以纯化形式存在或可以存在 于非本源环境(例如转基因宿主细胞)内。例如“分离的”或“纯化的”核酸分 子或蛋白质或其生物活性部分通过重组技术产生时,基本上没有其他细胞 材料或培养基,或通过化学合成时,基本上没有化学前体或其他化学品。 优选地,“分离的”核酸(优选地,蛋白质编码序列)不含在衍生该核酸的生 物的基因组DNA中天然分布于该核酸侧翼的序列(即位于该核酸的5′和3′ 末端的序列)。例如,在不同的实施方案中,分离的核酸分子可以含有少于 约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列,其中所 述的核苷酸序列是在衍生所述核酸分子的细胞的基因组DNA中天然分布 于该核酸分子侧翼的核苷酸序列。基本上没有细胞材料的蛋白质包括具有 少于约30%、20%、10%、5%(干重)杂质蛋白质的蛋白质或多肽制品。当 重组地产生本发明的蛋白质或其生物活性部分时,培养基优选地占少于约 30%、20%、10%、或5%(干重)的化学前体或非目的蛋白质的化学品。本 发明的核苷酸序列包括天然存在的序列以及突变(变异)形式。此类变体仍 将具有想要的活性,即启动子活性或由非变异核苷酸序列的可读框编码的 产物的活性。

就序列(例如多肽序列或核酸序列,例如本发明的转录调节性核苷酸序 列)而言,术语“变体”意指基本上相似的序列。对于包含可读框的核苷酸序 列,变体包括这样的序列,其中所述序列因遗传密码子简并性而编码天然 蛋白质的相同氨基酸序列。诸如此类的天然存在的等位变体可以使用熟知 的分子生物学技术(例如聚合酶链反应(PCR)和杂交技术)鉴定。变异核苷酸 序列也包括以合成方式衍生的核苷酸序列,例如通过使用位点定向诱变法 产生并(对于可读框而言)编码天然蛋白质的那些核苷酸序列,以及编码相 对于天然蛋白质具有氨基酸置换的多肽的那些核苷酸序列。通常,本发明 的核苷酸序列变体具有相对于天然(野生型或内源性)核苷酸序列的至少 40%、50%、60%,至70%,例如优选71%、72%、73%、74%、75%、 76%、77%、78%、至79%,通常至少80%,例如81%-84%、至少85%, 例如86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96%、97%,至98%和99%核苷酸序列同一性。

特定核酸序列的“保守修饰性变异”指编码相同或基本上相同的氨基酸 序列的那些核酸序列,或当该核酸序列不编码氨基酸序列时,指基本上相 同的序列。因为遗传密码的简并性,大量功能相同的核酸编码任意给定的 多肽。例如,密码子CGT、CGC、CGA、CGG、AGA和AGG均编码 氨基酸精氨酸。因此,在精氨酸由密码子指定的每个位置上,该密码子可 以变更成任意的所述相应密码子,而不改动编码的蛋白质。此类核酸变异 是作为“保守修饰性变异”类型之一的“沉默变异”。本文所述编码多肽的每 种核酸序列还描述了每种可能的沉默变异,除非另外指出。技术人员将认 识到可以通过标准技术修饰核酸中的每个密码子(ATG例外,该密码子通 常是仅用于甲硫氨酸的密码子)以产生功能性相同的分子,因此,编码多肽 的核酸的每种“沉默变异”包含在所描述的每种序列中。

本发明的核酸分子可以进行“优化”以在目的植物中增强表达(参见例 如,WO 91/16432;Perlak 1991;Murray 1989)。以这种方式,基因或基 因片段中的可读框可以利用植物优选性密码子合成(参见例如,Campbell 和Gowri,1990年对宿主优选性密码子选择的讨论)。因此,可以优化核 苷酸序列以在任何植物中表达。已经认识到基因序列的全部或任何部分可 以是优化的或人工的,也即也可以使用人工序列或部分优化序列。变异核 苷酸序列和蛋白质也包括从诱变方法和重组方法(如DNA改组法)衍生的 序列和蛋白质。使用这种方法,可以操作一种或多种不同的编码序列以产 生具有想要特性的新多肽。以这种方式,从相关多核苷酸序列群体产生重 组多核苷酸文库,其中所述的多核苷酸序列群体包含具有相当大的序列同 一性并可以在体外或体内同源重组的序列区域。本领域中已知用于这种 DNA改组法的策略(参见例如,Stemmer 1994;Stemmer 1994;Crameri 1997;Moore 1997;Zhang 1997;Crameri 1998和US 5,605,797、9、11、 13、15和17,837,458)。

“变异”多肽意指通过如此方式从天然蛋白质衍生的多肽:即对所述天 然蛋白质的氨基末端和/或羧基末端缺失(所谓截短)或添加一个或多个氨基 酸;在所述天然蛋白质的一个或多个位点处缺失或添加一个或多个氨基酸 或在所述天然蛋白质的一个或多个位点处置换一个或多个氨基酸。此类变 体可以例如因遗传多态性或因人类操作产生。用于此类操作的方法通常是 本领域已知的。

因此,多肽可以通过多种方法(包括氨基酸置换、缺失、截短和插入) 改变。用于此类操作的方法通常是本领域已知的。例如,所述多肽的氨基 酸序列变体可以通过在DNA中突变而制备。用于诱变和改变核苷酸序列 的方法是本领域熟知的(参见例如,Kunkel 1985;Kunkel 1987;US 4,873,192;Walker和Gaastra,1983及其中引用的参考文献)。不影响目的 蛋白生物学活性的适宜氨基酸置换指南可以在Dayhoff等(1978)的模型中 找到。优选保守性置换,如一种氨基酸与具相似特性的其他氨基酸交换。 变更、添加或缺失编码序列中单个氨基酸或小百分比例氨基酸(一般少于 5%,更一般少于1%)的个别置换、缺失或添加是“保守修饰性变异”,其中 所述的变更导致氨基酸置换为化学上相似的氨基酸。提供功能相似的氨基 酸的保守性置换表是本技术领域熟知的。以下五个组分别含有可以相互进 行保守性置换的氨基酸:脂族氨基酸:甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、 亮氨酸(L)、异亮氨酸(I);芳族氨基酸:苯丙氨酸(F)、酪氨酸(Y)、色氨酸 (W);含硫氨基酸:甲硫氨酸(M)、半胱氨酸(C);碱性氨基酸:精氨酸(R)、 赖氨酸(K)、组氨酸(H);酸性氨基酸:天冬氨酸(D)、谷氨酸(E)、天冬酰 胺(N)、谷氨酰胺(Q)。还见Creighton,1984。此外,变更、添加或缺失编 码序列中单个氨基酸或小百分比例氨基酸的个别置换、缺失或添加也是“保 守修饰性变异”。

“表达盒”或“表达构建体”如本文中所用意指能够指导特定核苷酸序列 在适宜宿主细胞中表达的DNA序列,其中所述DNA序列包含与目的核苷 酸序列有效连接的启动子,所述目的核苷酸序列任选地与终止信号和/或其 他调节元件有效连接。表达盒也可以包含对该核苷酸序列正确翻译所需的 序列。编码区域通常编码目的蛋白,然而也可以编码有义方向或反义方向 上的功能性目的RNA,例如反义RNA或非翻译性RNA。包含目的核苷酸 序列的表达盒可以是嵌合的,意指至少一个该表达盒的成分相对于该表达 盒其他成分的至少之一是异源的。所述表达盒也可以是这样一种表达盒, 其中此表达盒天然地存在,但是已经以重组形式获得用于异源性表达。表 达盒可以完全在细胞外装配(例如通过重组克隆技术)。然而,表达盒也可 以部分地使用内源性成分进行装配。例如,表达盒可以通过将启动子序列 置于(或插入)内源性序列上游获得,其中所述的内源性序列因此功能性地 与所述启动子序列连接并受其控制。类似地,待表达的核酸序列可以置于 (或插入)内源性启动子序列下游,因而形成表达盒。通常,表达盒中核苷 酸序列的表达可以受组成型启动子或受诱导型启动子控制,其中所述的诱 导型启动子仅在宿主细胞暴露于某些特定外部刺激时才启动转录。本发明 的表达盒、转录调节序列或启动子也可以针对特定组织或器官或发育阶 段,尤其针对胚或盾片是特异性的。在一个优选实施方案中,此类表达盒 将包含与目的核苷酸序列连接的本发明转录起始区。这样的表达盒优选地 配备有多个限制性位点用于插入受所述调节区域转录调节的目的基因。该 表达盒可以额外地含有选择标记基因。这种表达盒在转录的5′-3′方向包括 转录和翻译起始区、目的DNA序列以及植物中有功能的转录和翻译终止 区。所述终止区可以与转录起始区是天然关系,可以与目的DNA序列是 天然关系或可以从另一来源衍生。便利的终止区可以从根癌农杆菌(A. tumefaciens)的Ti-质粒获得,如章鱼碱合酶终止区和胭脂碱合酶终止区和 下文描述的其他终止区(还参见Guerineau 1991;Proudfoot 1991;Sanfacon 1991;Mogen 1990;Munroe 1990;Ballas 1989;Joshi 1987)。

“载体”定义为尤其包括双链或单链的直链或环状形式的任意质粒、粘 粒、噬菌体或农杆菌双元载体,它们可以或不可以自我传播或运动,和可 以通过整合至细胞基因组而转化原核或真核宿主,或者以染色体外方式存 在(例如具有复制起点的自主复制质粒)。

具体地包括穿梭载体,所述的穿梭载体意指能够天然地或通过设计在 两种不同宿主生物中复制的DNA运载体,其中所述的宿主生物可以选自 例如放线菌(actinomycete)和相关物种,如酿酒酵母(Sacharomyces cerevisiae)、细菌和真核生物(例如高等植物、哺乳动物、酵母或真菌细胞)。

优选地,所述载体中的核酸处于适宜启动子或其他调节元件控制下并 与其有效连接以在宿主细胞如微生物(例如细菌)细胞或植物细胞中转录。 该载体可以是在多种宿主中有功能的双功能表达载体。在基因组DNA的 情况下,所述核酸可以含有自身启动子或其他调节元件,并且在cDNA的 情况下,所述核酸可以处在适宜启动子或其他调节元件控制下以在宿主细 胞中表达。

“克隆载体”通常含有一个或少数限制性核酸内切酶识别位点和在鉴定 并选择以所述克隆载体转化的细胞中适用的标记基因,其中外来DNA序 列可以按照确定方式插入所述限制性核酸内切酶识别位点,同时该载体的 基本生物学功能不丧失。标记基因一般包括提供四环素抗性、潮霉素抗性 或氨苄青霉素抗性的基因。

“转基因植物”是具有一个或多个含有表达载体或重组表达盒(如本发 明表达盒)的植物细胞的植物。

“植物组织”包括分化和未分化的组织或植物,包括但不限于根、茎、 苗、叶、花粉、种子、瘤组织和多种形式的细胞和培养物,如单个细胞、 原生质体、胚和愈伤组织。所述植物组织可以处于植物中或位于器官、组 织或细胞培养物中。

如下术语用于描述两个或多个核酸或多核苷酸之间的序列关系:(a)“参 考序列”、(b)“比较窗口”、(c)“序列同一性”、(d)“序列同一性百分数”和 (e)“相当大的同一性”。

(a)如本文中所用,“参考序列”是作为序列比较基础使用的定义序列。 参考序列可以是指定序列的子集或全体;例如,作为全长cDNA或基因序 列的节段或完整cDNA或基因序列。

(b)如本文中所用,“比较窗口”指多核苷酸序列中连续且指定的节段, 其中与所述参考序列(不包含添加或缺失)相比,在比较窗口中的多核苷酸 序列可以包含添加或缺失(即缺口)以便这两个序列的最佳比对。通常,所 述比较窗口是至少20个连续核苷酸长度并且任选地可以是30、40、50、 100个连续核苷酸长度或更长。本领域技术人员理解为避免因多核苷酸序 列中包含缺口而与参考序列高度相似,一般引入并从匹配数中扣减缺口罚 分。

用于比较的序列比对方法是本领域熟知的。因此,使用数学算法可以 实现任意两个序列之间同一性百分数的确定。此类数学算法的优选非限制 性实例是Myers和Miller(1988年)算法;Smith等(1981年)局部同源性算 法;Needleman和Wunsch(1970年)同源性比对算法;Pearson和 Lipman(1988年)相似性搜索法;Karlin和Altschul(1990年)算法,该算法 在Karlin和Altschul(1993年)中改良。

这些数学算法的计算机执行可以用于序列比较以确定序列同一性。这 类执行包括但不限于:在PC/Gene程序(可从Intelligenetics,Mountain View,Calif.获得)的CLUSTAL;ALIGN程序(版本2.0)和(从Genetics Computer Group(GCG),575 Science Drive,Madison,Wis.,USA可获得 的)Wisconsin Genetics Software Package,版本8中的GAP、BESTFIT、 BLAST、FASTA和TFASTA。可以使用默认执行参数,使用这些程序开 展比对。已充分描述了CLUSTAL程序(Higgins 1988年,1989年;Corpet 1988年;Huang 1992;Pearson 1994年)。ALIGN程序以上述Myers和 Miller的算法为基础。Altschul等1990年的BLAST程序以上述Karlin和 Altschul的算法为基础。优选地使用Clustal W算法(Thompson 1994年; 例如在软件Vector NTITM,版本9;Invitrogen Inc.),评分矩阵 BLOSUM62MT2,默认设置(缺口开口罚分15/19,缺口延伸罚分 6.66/0.05;缺口分离罚分范围8;比对延误的%同一性40;使用残基特异 性缺口和亲水性残基缺口)开展多重比对(即多于2种序列)。

可从National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/)公开地获得开展BLAST分析的软件。这种 算法包括首先通过确定提交序列中长度为W的短字而确定高评分序列对 (HSP),其中与数据库序列中长度相同的字比对时,所述的短字匹配或满 足某些正值阈评分T。T称作邻近字评分阈值(Altschul 1990)。这些初始性 邻近字命中充当种子用于启动搜索以发现含有这些种子的更长HSP。所述 的字命中随后在两个方向上沿每个序列尽可能远地延伸,只要可以提高累 积性比对评分。对于核苷酸序列,使用参数M(一对匹配残基的回馈评分; 总是>0)和N(错配残基的惩罚评分;总是<0)计算所述累积性评分。对于氨 基酸序列,使用评分矩阵计算所述累积性评分。当该累积性比对评分以量 X从其最大实现值上降低时,则停止每一方向上的字命中延伸,所述累积 性评分变成零或以下,原因在于累积了一个或多个负评分性残基比对结果 或抵达两种序列之一的末尾。

除了计算序列同一性百分数之外,BLAST算法还开展两个序列之间 相似性的统计分析(参见例如Karlin和Altschul(1993).由BLAST算法提 供的一种相似性测量是最小总和概率(P(N)),这种统计分析提供了两个核 苷酸序列或氨基酸序列之间的匹配会因偶然发生匹配的概率的指示。例 如,若最小总和概率在一个试验核酸序列与参考核酸序列的比较结果中小 于约0.1,更优选地小于约0.01和最优选地小于约0.001,则认为该试验核 酸序列与此参考序列相似。

为出于比较目的获得缺口比对结果,可以利用(BLAST 2.0中 的)Gapped BLAST,如Altschul等1997年所述。或者,可以使用(BLAST 2.0中的)PSI-BLAST开展可检测分子之间远缘关系的多重搜索。见上文 Altschul等。利用BLAST、Gapped BLAST、PSI-BLAST时,可以使用 各自程序的默认执行参数(例如BLASTN用于核苷酸序列、BLASTX用于 蛋白质)。BLASTN程序(用于核苷酸序列)默认使用字长度(W)11、期望 (E)10、界限值100、M=5、N=-4并比较两条链。对于氨基酸序列,BLASTP 程序默认使用字长度(W)3、期望(E)10和BLOSUM62评分矩阵(参见 Henikoff和Henikoff,1989)。见http://www.ncbi.nlm.nih.gov。也可以人 工地通过观察进行比对。

为了本发明的目的,优选地使用具有其默认执行参数的BlastN程序 (版本1.4.7或更新的版本)或任何等效程序开展核苷酸序列比较,以确定与 本文中公开的启动子序列的序列同一性百分数。“等效程序”意指任意的序 列比较程序,即针对所讨论的任意两个序列,与通过优选程序生成的对应 比对结果相比,所述的序列比较程序产生具有相同核苷酸匹配或相同氨基 酸残基匹配和相同序列同一性百分数的比对结果。

(c)如本文中所用,“序列同一性”或“同一性”在两个核酸序列或多肽 序列的情况中意指在指定比较窗口范围内为最大对应进行比对时,这两个 序列中相同的残基。当序列同一性百分数用于蛋白质时,认识到不相同的 残基位置经常因保守性氨基酸置换而不同,其中氨基酸残基被替换为具有 相似化学特性(例如电荷或疏水性)的其他氨基酸残基并且因而并不改变该 分子的功能特性。当序列因保守性置换而不同时,序列同一性百分数可以 上调以校正置换的保守性本质。因此类保守性置换而不同的序列称作具有 “序列相似性”或“相似性”。本领域技术人员熟知开展这种调整的方法。通 常,这种方法包括将一个保守性置换评定为部分错配而非完全错配,因而 提高序列同一性百分数。因此,例如,当给予相同氨基酸评分1并且给予 非保守性置换评分0时,则给予保守性置换0-1之间的评分。保守性置换 的评分例如如在程序PC/GENE(Intelligenetics,Mountain View,Calif.)中 执行那样计算。

(d)如本文中所用,“序列同一性百分数”意指通过比较一个比较窗口 范围内两个最佳比对序列所确定的值,其中与参考序列(其不包含添加或缺 失)相比时,所述多核苷酸序列在比较窗口中的部分可以包含添加或缺失 (即缺口)以最佳比对这两种序列。通过这种方式计算该百分数,即通过确 定其中相同核酸碱基或相同氨基酸残基在两个序列内均存在的位置数目 以产生匹配位置数,将匹配位置数除以比较窗口中的位置总数,并且结果 乘以100以产生所述序列同一性百分数。

(e)(i)术语多核苷酸序列的“相当大的同一性”意指包含如此序列的多 核苷酸,其中使用所述的比对程序之一,利用标准参数与参考序列相比时, 所述序列具有至少60%、61%、62%、63%、64%、65%、66%、67%、 68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78% 或79%、优选至少80%、81%、82%、83%、84%、85%、86%、87%、 88%或89%、更优选至少90%、91%、92%、93%或94%和最优选至少 95%、96%、97%、98%或99%序列同一性。考虑到密码子简并性、氨基 酸相似性、读码框位置等,本领域技术人员将认识到这些值可以适度地调 整以确定由两个核苷酸序列编码的蛋白质的相应同一性。出于这些目的, 氨基酸序列的相当大的同一性通常意指至少60%或70%、更优选至少 80%、90%,和最优选至少95%序列同一性。

核苷酸序列是基本上相同的另一个指标是两种分子是否在严格条件 下(参见下文)相互杂交。通常,选择的严格条件是在定义的离子强度和pH 处低于具体序列的热解链温度(Tm)约5℃。然而,严格条件包括范围在约 1℃-约20℃范围的温度,这取决于如本文中另外定义的所需严格性程度。 若核酸编码的多肽是基本上相同的,则在严格条件下相互不杂交的核酸仍 是基本上相同的。例如当使用遗传密码子所允许的最大密码子简并性产生 核酸拷贝时,这种情况可以出现。当第一个核酸编码的多肽与第二个核酸 编码的多肽出现免疫交叉反应时,则表明这两个核酸序列基本上相同。

(ii)术语“相当大的同一性”在肽的情况下指肽包含这样的序列,其中 所述序列相对于指定比较窗口中的参考序列具有至少60%、61%、62%、 63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、 74%、75%、76%、77%、78%或79%、优选80%、81%、82%、83%、 84%、85%、86%、87%、88%或89%、更优选至少90%、91%、92%、 93%或94%或甚至更优选地95%、96%、97%、98%或99%序列同一性。 优选地,使用Needleman和Wunsch(1970)同源性比对算法实施最佳比对。 当一种肽与针对第二种肽的抗体发生免疫交叉反应时,则表明这两种肽序 列是基本上相同的。因此,例如在两种肽仅因保守性置换而不同时,这种 肽与第二种肽是基本上相同的。

对于序列比较,通常一种序列充当参考序列,将试验序列与之比较。 当使用序列比较算法时,将试验序列和参考序列输入计算机,根据需要指 定亚序列坐标,并指定序列算法程序参数。基于指定的程序参数,该序列 比较算法随后计算试验序列相对于参考序列的序列同一性百分数。

如上所述,两个核苷酸序列基本上相同的另一个指标是两个分子在严 格条件下相互杂交。短语“特异性杂交至”指一种分子仅与一个特定核苷酸 序列在严格条件下结合、配对或杂交,此时所述序列存在于复杂混合物(例 如总细胞)DNA或RNA中。“基本上结合”指探针核酸与靶核酸之间的互补 性杂交并且包括可通过降低杂交介质的严格性而容忍的少量错配,以实现 所需要的靶核酸序列检测。

“严格杂交条件”和“严格杂交洗涤条件”在核酸杂交实验如Southern 和Northern杂交的上下文中是序列依赖性的并且在不同环境参数下是不 同的。Tm是(在定义的离子强度和pH下)50%靶序列与完全匹配性探针杂 交的温度。特异性通常是杂交后洗涤的函数,关键因素是终末洗液的离子 强度和温度。对DNA-DNA杂交体,Tm可以从Meinkoth和Wahl,1984 的等式近似计算:

Tm=81.5℃+16.6(log10M)+0.41(%GC)-0.61(%甲酰胺)-500/L

其中M是单价阳离子的体积摩尔浓度,%GC是DNA中鸟嘌呤和胞 嘧啶的百分含量。%甲酰胺是杂交溶液中甲酰胺的百分含量并且L是杂交 体的碱基对长度。对于每1%的错配,Tm降低约1℃;因此,可以调节 Tm、杂交条件和/或洗涤条件以便与具有目的同一性的序列杂交。例如,若 寻求具有>90%同一性的序列,则Tm可以减少10℃。通常,选择的严格 条件是在定义的离子强度和pH处低于具体序列和其互补序列的热解链温 度I约5℃。然而,极严格条件可以使用在比热解链温度I低1、2、3或4℃ 的杂交和/或洗涤;中等严格的条件可以使用在比热解链温度I低6、7、8、 9或10℃的杂交和/或洗涤;低严格条件可以使用在比热解链温度I低11、 12、13、14、15或20℃的杂交和/或洗涤。使用该等式、杂交和洗涤组合 物以及想要的T,技术人员将理解杂交溶液和/或洗涤溶液严格性的变化是 内在描述的。若所需的错配程度导致小于45℃(水溶液)或32℃(甲酰胺溶 液)的T,优选提高SSC浓度,从而可以使用较高温度。关于核酸杂交的 深入指南可在Tijssen,1993中找到。通常,选择高度严格杂交条件和洗 涤条件是在定义的离子强度和pH处低于具体序列的热解链温度Tm约 5℃。

高度严格洗涤条件的实例是0.15M NaCl,在72℃持续约15分钟。 严格洗涤条件的实例是0.2×SSC,在65℃洗15分钟(对于SSC缓冲液的 描述,尤其参见Sambrook)。低严格洗涤往往先于高严格洗涤进行,以除 去背景探针信号。对双链体(例如超过100个核苷酸)的中等严格性洗涤的 实例是1×SSC,在45℃持续15分钟。对双链体(例如超过100个核苷酸) 的低严格洗涤的实例是4×至6×SSC,在40℃持续15分钟。对于短探针(例 如约10个至50个核苷酸),严格条件通常包括在pH7.0-8.3,低于约1.5 M的盐浓度,更优选约0.01-1.0M的Na离子浓度(或其他盐),并且温度 一般是至少约30℃且对于长探针(例如>50个核苷酸)是至少约60℃。严格 条件也可以通过添加去稳定剂(如甲酰胺)实现。通常,信噪比2倍(或更高 倍)于特定杂交分析中对非相关性探针观察到的信噪比时,表明检测到特异 性杂交。在严格条件下相互不杂交的核酸,如果它们编码的多肽基本上相 同,则仍基本上是相同的。例如当使用遗传密码子所允许的最大密码子简 并性产生核酸的拷贝时,这种情况可以出现。

选择非常严格条件等同于具体探针的Tm。对于DNA或RNA印迹中 在滤纸上具有超过100个互补残基的互补核酸杂交的严格条件的实例是 50%甲酰胺,例如在50%甲酰胺、1M NaCl、1%SDS中于37℃杂交并 在0.1×SSC于60℃-65℃洗涤。示例性低严格条件包括使用含30%-35% 甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液在37℃杂交并 在1×至2×SSC(20×SSC=3.0M NaCl/0.3M柠檬酸三钠)中在50℃-55℃洗 涤。示例性的中等严格条件包括使用含40%-45%甲酰胺、1.0M NaCl、 1%SDS在37℃杂交并在0.5×至1×SSC中于55℃-60℃洗涤。

如下是可以用来克隆与本发明参考核苷酸序列基本上相同的直向同 源性核苷酸序列的杂交/洗涤组合条件的实例:直向同源性核苷酸序列优选 地与参考核苷酸序列在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、 1mM EDTA中杂交并在50℃于2×SSC、0.1%SDS中洗涤,更希望是在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并 在50℃在1×SSC、0.1%SDS中洗涤,还更希望是在50℃于7%十二烷 基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.5×SSC、 0.1%SDS中洗涤,优选地在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.1×SSC、0.1%SDS中洗涤, 更优选在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在65℃于0.1×SSC、0.1%SDS中洗涤。

“DNA改组法”是在DNA分子中导入、优选随机导入突变或重排的方 法或在两种或多种DNA分子之间产生、优选随机产生DNA序列交换的方 法。因DNA改组法而产生的DNA分子是改组的DNA分子,该DNA分 子是从至少一个模板DNA分子衍生的非天然存在的DNA分子。改组的 DNA优选地编码变异多肽,其中所述的变异多肽相对于由所述模板DNA 编码的多肽是修饰的,并且相对于由所述模板DNA编码的多肽而言,可 以具有改变的生物学活性。

“重组DNA分子”是使用例如Sambrook等,1989中描述的用来将DNA 序列连接起来的重组DNA技术和方法连接在一起的DNA序列的组合。

本发明尤其在单子叶植物中应用。术语“单子叶植物”包括具有多个倍 性水平的植物,所述的倍性水平包括非整倍体、多倍体、二倍体、单倍体 和半合子。还包括成熟的植物、种子、苗和籽苗,和部分、繁殖材料(例如 种子和果实)以及从中衍生的培养物,例如细胞培养物。一年生和多年生单 子叶植物是旨在产生转基因植物的优选宿主生物。

此外,本发明包括成熟的植物、种子、苗和籽苗,和部分、繁殖材料 以及从中衍生的培养物,例如细胞培养物。成熟的植物指除籽苗发育阶段 之外处于任意发育阶段上的植物。术语“籽苗”指处于发育早期的年幼不成 熟植物,在所述的发育早期上籽苗仍依赖于贮藏在种子中(例如胚乳、外胚 乳或子叶中)的同化产物。本发明包括竹亚科(Bambusoideae)(例如bamboo 属)、Andropogonoideae(例如甘蔗属(Saccharum)、高粱属(Sorghum)或玉蜀 黍属(Zea))、芦竹族(Arundineae)(例如芦苇属(Phragmites))、稻亚科 (Oryzoideae)(例如稻属(Oryza))、黍亚科(Panicoideae)(例如黍属(Panicum)、 狼尾草属(Pennisetum)和狗尾草属(Setaria))、早熟禾亚科(Pooideae)(羊茅亚 科(Festuciadeae))(例如早熟禾属(Poa)、羊茅属(Festuca)、黑麦草属 (Lolium)、三毛草属(Trisetum)、剪股颖属(Agrostis)、梯牧草属(Phleum)、 鸭茅属(Dactylis)、看麦娘属(Alopecurus)、燕麦属(Avena)、小麦属(Triticum)、 黑麦属(Secale)和大麦属(Hordeum))的全部属。优选的是燕麦(Avena sativa)(燕麦)、簕竹属物种(Bambusa sp.)和印度箣(Bambusa bambos)(bamboo)、甘蔗(Saccharum officinarum)(甘蔗)、栽培二粒小麦 (Triticum dicoccum)(二粒小麦(Emmer wheat))、栽培一粒小麦(Triticum monococcum)(一粒小麦(Einkorn wheat))、斯卑尔脱小麦(Triticum spelta)(斯卑尔脱小麦(spelta wheat))、硬粒小麦(Triticum durum)(小麦)、圆 锥小麦(Triticum turgidum)、普通小麦(Triticum aestivum)(小麦)、玉蜀黍(玉 米(maize)/玉米(corn))、稷(Panicum miliaceum)(普通黍)、Pennisetum thiphoide(Bulrush millet)、大麦(Hordeum vulgare或H.sativum)(大麦)、稻 (Oryza sativa)(稻)、水生菰(Zizania aquatica)(野生稻(wild rice))、黑麦 (Secale cereale)(黑麦)、高粱(Sorghum bicolor)(S.vulgare)(高粱)。更优选 小麦(Triticum spp.)、稻(Oryza spp.)、大麦(Hordeum spp.)、燕麦(Avena spp.)、黑麦(Secale spp.)、玉米(玉蜀黍)、高粱和黍(Pennisettum spp)。更 优选的是小麦(小麦属物种(Triticum spp.))、稻(稻属物种(Oryza spp.))、大 麦(大麦属物种(Hordeum spp.))、燕麦(燕麦属物种(Avena spp.))、黑麦(黑 麦属物种(Secale spp.))、玉米(玉蜀黍)、高粱和谷子(黍属物种(Pennisettum spp))。优选的是小麦家族的全部小麦种(包括冬小麦和春小麦)、更具体是 普通小麦(Triticum spp.:common(T.aestivum))、硬粒小麦(T.durum)、斯 卑尔脱小麦(T.spelta)、栽培二粒小麦、圆锥小麦和栽培一粒小麦,特别优 选普通小麦。本发明的方法可以用来从春小麦(例如Bobwhite、Marshall、 PIVOT1、UC702和Panewawa)和从冬小麦(例如HY368、Neeley、FL302、 RH91、R332、R1269和R585)产生的转基因植物。其他合适的小麦基因型 包括但不限于Yecora Rojo、Karl和Anza。然而,应当指出本发明不限于 某些品种,而是高度基因型非依赖的。

词语“植物”指任何植物,尤其指农学有用的植物(例如种子植物),并 且“植物细胞”是植物的结构单元和生理单元,其包含细胞壁,然而还可以 指原生质体。植物细胞可以是分离的单个细胞或培养的细胞形式,或作为 更高级有机体单元的部分,其中更高级有机体单元例如是植物组织,或分 化成为植物任何发育阶段上均存在的结构的植物器官。此类结构包括一种 或多种植物器官,包括但不限于果实、苗、茎、叶、花瓣等。优选地、术 语“植物”包括完整植物、苗营养器官/结构(例如叶、茎和块茎)、根、花和 花器官/结构(例如苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包 括胚、胚乳和种皮)和果实(成熟子房)、植物组织(例如维管组织、基本组织 等)和细胞(例如保卫细胞、卵细胞、毛状体等),和前述对象的后代。

“显著增加”是大于测量技术中固有误差边界的增加,优选增加约2倍 或更多倍。

“显著少于”意指大于测量技术中固有误差边界的减少,优选减少约2 倍或更多倍。

发明详述

本发明的第一个实施方案涉及

包含表达盒的植物或植物细胞,所述的表达盒包含

a)选自以下的第一核酸分子

i)如SEQ ID NO:1中定义的多核苷酸;

ii)与SEQ ID NO:1的多核苷酸具有至少50%、优选至少60%、70% 或80%、更优选至少85%或90%、最优选至少95%、98%或99%序列同 一性的多核苷酸;和

iii)在下述条件下与包含如SEQ ID NO:1中定义的多核苷酸中至少50 个核苷酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于:在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在 50℃于2×SSC,0.1%SDS中洗涤、更优选在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS 中洗涤、更优选在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、更优选在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于0.1×SSC,0.1%SDS中洗涤,并且最优选在50℃于7%十二烷基硫酸 钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1% SDS中洗涤,

和与其有效连接的

b)第二核酸分子,其选自以下多核苷酸

i)如SEQ ID NO:3中定义的多核苷酸;

ii)与SEQ ID NO:3的多核苷酸具有至少50%、优选至少60%、70% 或80%、更优选至少85%或90%、最优选至少95%、98%或99%序列同 一性的多核苷酸;和

iii)在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核 苷酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于:在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于2×SSC,0.1%SDS中洗涤,更优选在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS中洗涤、 更优选在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、更优选在50℃于7%十 二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 0.1×SSC,0.1%SDS中洗涤,并且最优选在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1%SDS 中洗涤,

并且与至少一个核酸有效连接,其中所述的至少一个核酸相对于转录 调节序列的所述第一或第二核酸序列是异源的,并且能够适用于向植物赋 予提高的产量和/或提高的胁迫耐受性和/或提高的种子或籽苗营养品质和/ 或油含量。

优选地,所述嵌合性转录调节核苷酸序列引起所述异源性DNA优势 地在萌芽胚中表达。这种表达模式对如下应用特别有用:

i)增强胁迫因子抗性:现有技术中如上所述,胚对各种生物性和非生物 性胁迫因子(干旱、寒冷、疾病等)非常敏感。这些胁迫因子直接影响产量 和作物品质。本领域中已知的绝大多数启动子在胚期没有表达能力或具有 低表达能力。本文中公开的转录调节特异性尤其用来按需要表达胁迫抗性 基因,即在合适时间到达高水平。此外,由于淀粉胚乳中的特异性,有可 能寻求解决胁迫抗性的新途径。因为淀粉胚乳是滋养胚的组织,故可以通 过改善胚的养分补充而提高胁迫抗性。

ii)提高的种子营养品质或籽苗营养品质:嵌合的转录调节核酸序列 (例如超级启动子)的表达模式允许转化种子(谷粒)成分或允许改变种子中 成分的分布。例如,可以将糖类(淀粉)转化成油或其它高价值成分(例如维 生素)或可以使成分从胚乳转移至胚,因而提供具有改善的营养价值的籽 苗。

iii)提高产量:提高的产量部分地与胁迫抗性(见以上i))相关。然而, 嵌合的转录调节核酸序列(例如超级启动子)的表达模式甚至允许在无胁迫 因子下通过优化胚生长而增加产量,其中胚的生长将直接影响幼苗生长。 还可以实现田间条件下更早的萌发以及会引起更高或更早产量的其它性 状。

iv)靶向的序列切除。如上所述,均一地切除序列(尤其标记序列)是生 物技术领域内未解决的问题。绝大多数植物表现出嵌合样切除模式,既有 成功切除的区域,又有未切除的区域。当生物不是由众多植物组成时,为 实现均一或基本均一的切除,优选地需要在发育早期激活切除机制。此外 需要强烈的激活(即切除介导酶的表达)。这两种要求均由本文中公开的嵌 合的转录调节核酸序列(例如超级启动子)的表达模式满足。早期胚萌发中 的强烈转录活性允许在该时期有效地切除标记,由此产生无靶序列(例如无 标记)的植物。

“萌芽胚特异性转录”在本发明上下文中意指核酸序列由转录调节元件 以如此方式转录,从而所述核酸序列在萌芽植物、优选在萌芽胚中的转录 作用提供了大于90%、优选大于95%、更优选大于99%的在所述发育阶 段期间从完整植物、种子或籽苗中转录的全部RNA量。

1.嵌合性转录调节核酸序列

在其最一般形式中,包含编码嵌合性转录调节核苷酸序列的多核苷酸 的核酸分子包含

i)选自以下的第一核酸分子

a)如SEQ ID NO:1中定义的多核苷酸;

b)与SEQ ID NO:1的多核苷酸具有至少50%、优选至少60%、70% 或80%、更优选至少85%或90%、最优选至少95%、98%或99%序列同 一性的多核苷酸;和

c)在下述条件下与包含如SEQ ID NO:1中定义的多核苷酸中至少50 个核苷酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于:在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在 50℃于2×SSC,0.1%SDS中洗涤、更优选在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS 中洗涤、更优选在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、更优选在50℃于 7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于0.1×SSC,0.1%SDS中洗涤,并且最优选在50℃于7%十二烷基硫酸 钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1% SDS中洗涤,和

ii)第二核酸分子,其选自以下多核苷酸

a)如SEQ ID NO:3中定义的多核苷酸;

b)与SEQ ID NO:3的多核苷酸具有至少50%、优选至少60%、70% 或80%、更优选至少85%或90%、最优选至少95%、98%或99%序列同 一性的多核苷酸;和

c)在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于:在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于2×SSC,0.1%SDS中洗涤,更优选在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS中洗涤、 更优选在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、更优选在50℃于7%十 二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 0.1×SSC,0.1%SDS中洗涤,并且最优选在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1%SDS 中洗涤,

其中所述的第一和第二核酸序列是功能性连接的并且彼此是异源的。

当在DNA区域如启动子、转录调节性核酸序列或上游激活性序列的 上下中使用时,术语“衍生”指如此情形,其中衍生的DNA区域从天然存 在的DNA区域或其他来源的DNA区域获得或基于这些区域获得。衍生的 DNA区域可以与天然存在的DNA区域或其他来源的DNA区域不同,通 常是通过故意的突变而不同。

1.1本发明的嵌合性转录调节核苷酸序列和其功能性元件的衍生物和 变体

在本文公开的本发明构思了:除了本文中公开的具体嵌合性转录调节 核苷酸序列和其特定元件之外,还可以使用所述序列的衍生物和变体。

所述具体嵌合性转录调节核苷酸序列和其特定元件的衍生物可以包 括但不限于序列缺失、单个或多个点突变、在特定限制性酶位点处改变、 添加功能性元件或分子修饰的其他方法。这种修饰可以或不可以增强,或 可以或不可以改变所述序列的转录调节活性。

例如,本领域技术人员可以限定所述序列中的功能性元件并且删除任 意非必需元件。可以修饰或组合功能性元件以增加本发明序列的用途或表 达用于任意具体应用。也可以通过除去或删除非必需序列而不删除必需序 列,获得本发明的转录调节性核苷酸序列的功能性等效片段。所述转录调 节性核苷酸序列缩减至其介导转录的必需元件可以体外通过试误法 (trial-and-error)缺失突变或在计算机(in silico)中使用启动子元件搜索常 用程序在体外实现。启动子活性必需的区域经常显示某些已知启动子元件 的簇集。此类分析可以使用可获得的计算机算法如PLACE(“植物顺式作用 调节性DNA元件(Plant Cis-acting Regulatory DNA Elements)”;Higo 1999,BIOBASE数据库“Transfac”(Biologische Datenbanken GmbH, Braunschweig;Wingender 2001)或数据库PlantCARE(Lescot 2002)进行。 尤其优选的是转录调节性核苷酸序列的等效片段,其中所述的等效片段通 过删除编码mRNA的5’非翻译区的区域,因而仅提供(非转录的)启动子区 域而获得。所述5’非翻译区可以轻易地通过本领域已知的方法(如5’-RACE 分析)确定。因此,本发明的一些转录调节性核苷酸序列是其他序列的等效 片段。

如上所示,本发明启动子的缺失突变体可随机地制备并随后进行分 析。使用这种策略,制备了一系列构建体,每种构建体含有所述克隆的不 同部分(亚克隆),并且随后筛选这些构建体的活性。用于筛选活性的合适 方法是将含有缺失节段的缺失型启动子构建体连接至选择标记或筛选标 记,并且仅分离可表达所述标记基因的那些细胞。以这种方式,鉴定了众 多不同的缺失型启动子构建体,它们仍保留想要的或甚至增强的活性。因 此,通过比较所选择的构建体鉴定到活性必需的最小节段。随后,该节段 可以用来构建表达外源基因的载体。

在编码任意启动子序列的DNA节段中诱变或产生缺失的方法是本领 域技术人员熟知的并且公开于例如US 6,583,338,其中所述文献通过引用 的方式完整地并入本文。本发明的某些变异核苷酸序列仍保留生物学活性 (即以如以上定义的模式调节转录)。调节性序列变体的一个实例是通过从 较长启动子中进行一个或多个缺失所形成的启动子。启动子的5’部分直至 接近转录起点的TATA盒有时可以缺失,而不消除启动子活性,如Zhu 等,(1995)The Plant Cell 7:1681-1689描述。除去部分DNA序列的常规方 法是结合DNA扩增,使用外切核酸酶,以产生双链DNA克隆的单向巢式 缺失。用于此目的的商业试剂盒在商品名Exo-Size.TM.(New England Biolabs,Beverly,Mass.)下出售。生物学活性变体还包括例如具有一个或多 个核苷酸置换、缺失或插入的本发明天然启动子序列。

衍生物和变体也包括来自其他物种,如但不限于细菌、真菌和植物的 同源物、旁系同源物和直向同源物。“同源物”是本领域用来指示与参考序 列具有高程度序列相关性的多核苷酸或多肽序列的类属性术语。这种相关 性可以通过确定两个序列之间如前文定义的同一性和/或相似性程度加以 量化。术语“直向同源物”和“旁系同源物”属于这个类属性术语。“旁系同源 物”指相同物种中功能相似的多核苷酸或多肽。“直向同源物”指这样的多核 苷酸或多肽,其是另一个物种中所述多核苷酸或多肽的功能等同物。直向 同源基因优选地意指编码直向同源蛋白质的基因。更具体地,术语“直向同 源物”指从一个物种获得的多肽或蛋白质,其中所述的多肽或蛋白质是来自 不同物种的多肽或蛋白质的功能性对应物。直向同源物之间的序列差异是 物种形成的结果。

优选地,嵌合性转录调节核苷酸序列的变体或衍生物的转录调节活性 基本上与本文具体公开的嵌合性转录调节核苷酸序列的转录调节活性(即 以如上所述的萌芽胚特异性方式调节表达)相同(或等效)。除此之外,衍生 物或变体的转录调节活性也可以与其亲本序列的活性不同,尤其在表达水 平方面如此。所述表达水平可以高于或低于亲本序列的表达水平。这两种 偏离可能是有利的,这取决于待表达的目的核酸序列。优选这类功能性等 效序列,其中与亲本序列相比,所述的功能性等效序列偏离所述亲本序列 的表达水平不超过50%、优选25%、更优选10%(如优选地通过mRNA 表达或蛋白质(例如报道基因)表达进行判断)。更优选这样的等效序列,其 与它的亲本序列相比显示表达增加,优选增加达至少50%,更优选至少 100%,最优选至少500%。此类表达模式优选地使用与所述转录调节性核 苷酸序列有效连接的报道基因证实。在本上下文中的优选报道基因 (Schenborn 1999)是绿色荧光蛋白(GFP)(Chui 1996;Leffel 1997)、氯霉素 乙酰转移酶、萤光素酶(Millar 1992)、β-葡糖醛酸糖苷酶或β-半乳糖苷酶。 特别优选β-葡糖醛酸糖苷酶(Jefferson 1987)。分析转录性调节作用的其他 方法是本领域熟知的并且包括RNA印迹和RT-PCR(参见例如以上提到 的本文中引用作为参考的Sambrook等)。

在一个优选实施方案中,所述转录调节性核苷酸序列由包含多核苷酸 的分离的核酸分子描述,所述的多核苷酸编码选自以下的序列

i)由SEQ ID NO:1描述的序列;

ii)由SEQ ID NO:1描述的序列的至少50个连续碱基、优选至少100 个连续碱基、更优选200个连续碱基的片段

iii)与由SEQ ID NO:1描述的序列具有至少50%、优选至少60%、 70%或80%、更优选至少85%或90%、最优选至少95%、98%或99%序 列同一性的核苷酸序列,

iv)能够与由SEQ ID NO:1描述的序列或其互补物杂交(所述杂交优 选地在如上文“定义”部分中定义的低严格条件下、更优选在中等严格条件 下、最优选在高严格条件下,例如在等效于如下的条件下进行:在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于2×SSC,0.1%SDS中洗涤、更希望在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS中洗涤、 仍更希望在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、优选地在50℃于7%十 二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 0.1×SSC,0.1%SDS中洗涤,并且更优选在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1%SDS 中洗涤)的核苷酸序列;

v)核苷酸序列,能够与包含由SEQ ID NO:1描述的序列的50-200个 或更多个连续核苷酸(如50或100个、优选150或200个、更优选250或 400个连续核苷酸、最优选全部序列)的核酸或其互补物杂交(所述杂交优选 地在如上文“定义”部分中定义的低严格条件下、更优选在中等严格条件下、 最优选在高严格条件下,例如在等效于如下的条件下进行:在50℃于7% 十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 2×SSC,0.1%SDS中洗涤、更希望在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS中洗涤、 仍更希望在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、优选地在50℃于7%十 二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 0.1×SSC,0.1%SDS中洗涤,更优选在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1%SDS中洗 涤);

vi)作为前述在i)-v)下提及的任一核苷酸序列的互补物或反向互补物 的核苷酸序列。

在另一个优选实施方案中,所述上游激活性序列由包含多核苷酸的核 酸分子描述,所述的多核苷酸编码选自以下的序列

i)由SEQ ID NO:3描述的序列,

ii)由SEQ ID NO:3描述的序列的至少50个连续碱基、优选至少100 个连续碱基、更优选200个连续碱基的片段,

iii)与由SEQ ID NO:3描述的序列具有至少50%、优选至少60%、 70%或80%、更优选至少85%或90%、最优选至少95%、98%或99%序 列同一性的核苷酸序列,

iv)能够与由SEQ ID NO:3描述的序列或其互补物杂交(所述杂交优 选地在如上文“定义”部分中定义的低严格条件下、更优选在中等严格条件 下、最优选在高严格条件下,例如在等效于如下的条件下进行:在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于2×SSC,0.1%SDS中洗涤、更希望在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS中洗涤、 仍更希望在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、优选地在50℃于7%十 二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 0.1×SSC,0.1%SDS中洗涤,更优选在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1%SDS中洗 涤)的核苷酸序列;

v)核苷酸序列,能够与包含由SEQ ID NO:3描述的序列的50-200个 或更多个连续核苷酸(如50或100个、优选150或200个、更优选250或 400个连续核苷酸、最优选全部序列)的核酸或其互补物杂交(所述杂交优选 地在如上文“定义”部分中定义的低严格条件下、更优选在中等严格条件下、 最优选在高严格条件下,例如在等效于如下的条件下进行:在50℃于7% 十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 2×SSC,0.1%SDS中洗涤、更希望在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS中洗涤、 仍更希望在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、优选地在50℃于7%十 二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 0.1×SSC,0.1%SDS中洗涤,更优选在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1%SDS中洗 涤);

vi)作为前述在i)-v)下提及的任一核苷酸序列的互补物或反向互补物 的核苷酸序列。

上文定义的任意所述嵌合性转录调节序列的在ii)、iii)、iv)、v)和vi) 下详述的序列优选地能够调节单子叶植物细胞或生物中的转录,它们更优 选地能够诱导胚特异性表达。优选地,在iv)或v)下详述的序列在严格条件 下与所述靶序列杂交。

优选地,所述核苷酸序列同一性通过使用带其默认执行参数(字长度 (W)11、期望(E)10、截止值100、M=5、N=-4并比较两条链)的BlastN程 序(版本1.4.7或更新版本)或任何等效程序确定。

在杂交技术中,使用已知核苷酸序列的全部或部分作为选择性地与其 他相应核苷酸序列杂交的探针,其中所述的其他相应核苷酸序列存在于来 自所选生物的克隆基因组DNA片段或cDNA片段(即基因组文库或cDNA 文库)的群体中。所述杂交探针可以是基因组DNA片段、cDNA片段、RNA 片段或其他寡核苷酸,并且可以用可检测基团如32P或任何其他可检测标 记物标记。因此,例如,用于杂交的探针可以通过标记以本发明序列为基 础的合成寡核苷酸进行制造。用于制备杂交探针的方法和用于构建cDNA 文库和基因组文库的方法通常是本领域已知的并且在Sambrook等(1989) 中公开。通常,与本文公开的序列杂交的序列将与所述公开的序列具有至 少约60%-70%并且甚至约80%、85%、90%、95%-98%或更多同一性。 即,序列的序列相似性可以变化,共有至少约60%-70%并且甚至约80%、 85%、90%、95%-98%的序列相似性。

如表8和表9中所示的本发明常见核心启动子基序包含四个充分定义 的核苷酸,在所述启动子基序5′和3′端侧翼均分布有一串任意核苷酸。例 如,GAPB/GAP.01启动子基序包含如SEQ ID NO:26中定义的15个核苷 酸“aaaaATGAatagaaa”,其中“nnnnATGAnnnnnnn”是如SEQ ID NO:27 中描述的核心GAPB/GAP.01启动子基序,其中n选自a、c、t和g。在 核心启动子基序的5′端或3′端处的数值n对应于分别在5′端或3′端处,在 相应启动子基序中的核心启动子基序侧翼分布的核苷酸数目。例如下文所 示,计算核心启动子基序相对于相应启动子基序的同一性百分数。当SEQ ID NO:26的核心GAPB/GAP.01启动子基序中的两个“n”与SEQ ID NO:27的GAPB/GAP.01启动子基序在相应位置处的核苷酸相同,例如 n(2)=a和n(4)=a时,所述同一性百分数通过相同核苷酸(包括所述四个核 心核苷酸)总数除以该启动子基序的全部长度而确定,即6/15=40%。当 SEQ ID NO:26的核心GAPB/GAP.01启动子基序中的5个“n”与SEQ ID NO:27的GAPB/GAP.01启动子基序在相应位置处的核苷酸相同,例n(1)= a,n(3)=a,n(10)=t,n(12)=g和n(14)=a时,所述同一性百分数是9/15= 60%。

在Ar.cor78中鉴定出的启动子基序和核心启动子基序在表8和表9中 显示。更具体地,SEQ ID NOs:10、12、14、17、20、22、25、27、29、 31、33、35、37、39、42、44、46、48、50、53、55、57、59、63、66、 68、70、72、74、77、79、82、84、86、88、90、94、96、98、102、104、 108、112、114、117、121、123、125、127、129、131、137和138是Ar.cor78 启动子中鉴定出的核心启动子基序。SEQ ID NOs:9、11、13、15、16、 18、19、21、23、24、26、28、30、32、34、36、38、40、41、43、45、 47、49、51、52、54、56、58、60、61、62、64、65、67、69、71、73、 75、76、78、80、81、83、85、87、89、91、92、93、95、97、99、100、 101、103、105、106、107、109、110、111、113、115、116、118、119、 120、122、124、126、128、130、132、133、134、135和136是Ar.cor78 启动子中鉴定出的启动子基序。拟南芥属植物cor78启动子(SEQ ID NO:1) 例如在(Horvath 1993)和(Gilmour等,1991;Nordin等,1991)中描述。在 一些情况下,如表9中所示,一种核心启动子基序与具有不同侧翼5′和3′ 核苷酸的位于At.cor78不同位置的启动子基序相对应。

本发明还涉及包含多核苷酸的核酸分子,其中所述的多核苷酸编码包 含至少两个核心启动子基序的转录调节序列,所述的核心启动子基序选自 如SEQ ID NOs:10、12、14、17、20、22、25、27、29、31、33、35、37、 39、42、44、46、48、50、53、55、57、59、63、66、68、70、72、74、 77、79、82、84、86、88、90、94、96、98、102、104、108、112、114、 117、121、123、125、127、129、131、137和138中定义的序列。优选地, SEQ ID NOs:10、12、14、17、20、22、25、27、29、31、33、35、37、 39、42、44、46、48、50、53、55、57、59、63、66、68、70、72、74、 77、79、82、84、86、88、90、94、96、98、102、104、108、112、114、 117、121、123、125、127、129、131、137和138的核心启动子基序分别 与SEQ ID NOs:9、(11、18)、13、(15、16)、19、(21、23、61、92)、(24、 75)、(26、40)、28、30、(32、51、80、105、109)、34、36、38、41、(43、 64、132)、45、47、49、52、(54、99)、(56、119)、(58、60)、62、65、67、 69、71、73、76、78、81、83、85、(87、100、106、110)、(89、91)、93、 95、97、101、103、107、111、(113、115)、(116、118)、120、122、124、 126、128、(130、134、135)、136和133是30-40%、优选40-50%或更优 选50-60%或更高地同一的。更优选地,SEQ ID NOs:10、12、14、16、 19、22、24、27、29、31、33、35、37、39、41、44、46、48、50、52、 55、57、59、61、65、68、70、72、74、76、79、81、84、86、88、90、 92、96、98、100、104、106、110、114、116、119、123、125、127、129、 131、133、139和140的核心启动子基序分别与SEQ ID NOs:9、(11、18)、 13、(15、16)、19、(21、23、61、92)、(24、75)、(26、40)、28、30、(32、 51、80、105、109)、34、36、38、41、(43、64、132)、45、47、49、52、 (54、99)、(56、119)、(58、60)、62、65、67、69、71、73、76、78、81、 83、85、(87、100、106、110)、(89、91)、93、95、97、101、103、107、 111、(113、115)、(116、118)、120、122、124、126、128、(130、134、 135)、136和133是60-70%、优选地70-80%或更优选地80-90%或更高 地同一的。最优选地,SEQ ID NOs:10、12、14、16、19、22、24、27、 29、31、33、35、37、39、41、44、46、48、50、52、55、57、59、61、 65、68、70、72、74、76、79、81、84、86、88、90、92、96、98、100、 104、106、110、114、116、119、123、125、127、129、131、133、139 和140的核心启动子基序分别与SEQ ID NOs:9、(11、18)、13、(15、16)、 19、(21、23、61、92)、(24、75)、(26、40)、28、30、(32、51、80、105、 109)、34、36、38、41、(43、64、132)、45、47、49、52、(54、99)、(56、 119)、(58、60)、62、65、67、69、71、73、76、78、81、83、85、(87、 100、106、110)、(89、91)、93、95、97、101、103、107、111、(113、115)、 (116、118)、120、122、124、126、128、(130、134、135)、136和133是 90-95%或优选95-99%同一的。

1.2用于本发明的表达盒和载体的额外调节元件和功能性元件

本发明的表达盒可以包含其他调节元件。该术语在本上下文中应当作 广义理解,包含可以影响表达盒的构建或功能的全部序列。调节元件可以 例如在原核或真核生物中调节转录和/或翻译。在一个优选的实施方案中, 本发明的表达盒包含转录调节序列和任选地额外的调节元件,每一所述转 录调节序列和任选地额外的调节元件与待表达的核酸序列(或转录调节性 核苷酸序列)有效连接。

多种5’和3’转录调节序列可用于本发明中。转录终止子负责终止转录 和使mRNA正确地聚腺苷酸化。3’非翻译调节性DNA序列优选地包含约 50-约1000个、更优选约100-约1000个核苷酸碱基对并且含有植物转录终 止序列和翻译终止序列。适宜的转录终止子和已知在植物中有功能的那些 转录终止子包括CaMV 35S终止子、tml终止子、胭脂碱合酶终止子、豌 豆(pea)rbcS E9终止子、来自根癌农杆菌章鱼碱合酶基因的用于T7转录物 的终止子和来自马铃薯或番茄的蛋白酶抑制物I或II基因的3’端,不过也 可以使用本领域技术人员已知的其他3’元件。备选地,还可以使用γ薏苡 醇溶蛋白终止子、油质蛋白3终止子或来自薏苡属(Coix)的其他终止子。

由于在转录起点与编码序列的起点之间的DNA序列(即非翻译的前导 序列)可以影响基因表达,也可以希望使用特定前导序列。优选的前导序列 构思包括这样的前导序列,它们包括据预测会指导所连接基因最佳表达的 序列,即构思包括优选的共有前导序列,其中所述的共有前导序列可以提 高或维持mRNA稳定性并防止不恰当的翻译启动。本领域技术人员因本 公开而知道选择此类序列。最优选衍生自植物中高表达基因的序列。

优选的调节元件还包括基因的5’非翻译区、内含子和3’非翻译区。

已经发现在转基因植物中增强基因表达的此类序列包括内含子序列 (详见下文)和病毒前导序列(例如来自TMV、MCMV和AMV;Gallie 1987)。例如,从病毒衍生的众多非翻译性前导序列已知增强表达。具体而 言,已经证实来自烟草花叶病毒(TMV)、玉米褪绿斑驳病毒(MCMV)和苜 蓿花叶病毒(AMV)的前导序列有效地增强表达(例如Gallie 1987;Skuzeski 1990)。本领域已知的其他前导序列包括但不限于:微小RNA病毒前导序 列,例如EMCV前导序列(脑心肌炎病毒5’非编码区)(Elroy-Stein 1989); 马铃薯Y病毒前导序列,例如TEV前导序列(烟草蚀纹病毒);MDMV前 导序列(玉米矮花叶病毒);人免疫球蛋白重链结合蛋白(BiP)前导序列 (Macejak 1991);来自苜蓿花叶病毒衣壳蛋白mRNA(AMV RNA 4)的非翻 译前导序列(Jobling 1987);烟草花叶病毒前导序列(TMV)(Gallie 1989)和玉 米褪绿斑驳病毒前导序列(MCMV)(Lommel 1991)。还见Della-Cioppa 1987。根据需要,也可以包括调节元件如TMVΩ元件(Gallie 1989)。增强 子的额外实例包括来自CaMV 35S启动子、章鱼碱合酶基因(Ellis等, 1987)、稻肌动蛋白I基因、玉米醇脱氢酶基因(Callis 1987)、玉米皱缩I 基因(Vasil 1989)的元件、TMV Ω元件(Gallie 1989)和来自非植物的真核生 物(例如酵母;Ma 1988)的启动子。可以构建根据本发明用途的载体以包括 ocs增强子元件。这种元件首先被鉴定为来自鳄梨(ultilane)章鱼碱合酶 (ocs)基因中的16bp回文增强子(Ellis 1987)并且存在于至少10种其他启 动子中(Bouchez 1989)。当用于植物转化时,使用增强子元件(如ocs元件) 和尤其所述元件的多重拷贝将起到提高来自毗邻启动子的转录水平的作 用。

额外的优选调节元件是增强子序列或聚腺苷酸化序列。优选的聚腺苷 酸化序列是来自植物基因或农杆菌T-DNA基因的那些序列(例如OCS(章 鱼碱合酶)基因或NOS(胭脂碱合酶)基因的终止子序列)。

本发明的表达盒(或自其衍生的载体,即包含本发明表达盒的载体)可 以包含额外的功能性元件,其中所述的功能性元件应当广义地理解为影响 表达盒或载体或包含所述表达盒或载体的转基因生物的构建、增殖或功能 的全部元件。此类功能性元件可以包括复制起点(以允许在细菌中复制; pBR322的ORI或P15A ori;Sambrook 1989),或对于农杆菌T-DNA转 移所需要的元件(例如所述T-DNA的左边界和/或右边界)。

此外,可以构建所述表达盒并用于转基因植物细胞内特定基因产物的 胞内靶向或用于引导蛋白质至胞外环境。通常,这通过将编码转运肽或信 号肽序列的DNA序列与具体基因的编码序列连接而实现。所得的转运肽 或信号肽将分别转运所述蛋白质至特定胞内或胞外目的地并随后以翻译 后方式被去除。转运肽或信号肽的作用是协助蛋白质转运穿过胞内膜(如液 泡、囊泡、质体和线粒体膜),而信号肽指导蛋白质穿过胞外膜。通过协助 蛋白质转运至区室内部和细胞外,这些序列可以增加基因产物的积累,保 护基因产物免遭蛋白酶解降解。这些序列还允许来自高表达基因的其他 mRNA序列与基因的编码序列连接。由于经核糖体翻译的mRNA比裸 mRNA更稳定,可翻译性mRNA在基因前的存在可以提高该基因的mRNA 转录物的整体稳定性并且因而增加基因产物的合成。因为转运序列和信号 序列通常以翻译后方式从初始翻译产物中除去,故这些序列的使用允许添 加可能在最终多肽中不出现的额外翻译的序列。可能希望使某些蛋白质定 向分布,以增强蛋白质的稳定性(US 5,545,818)。

1.3本发明的嵌合性转录调节核酸序列、表达盒和载体的装配

就本发明任意的嵌合性转录调节核酸序列、表达盒或载体而言,有效 连接可以通过本领域已知的多种方法(包括体外方法和体内方法)实现。因 此,本发明任意的嵌合性转录调节核酸序列、表达盒或载体可以通过使用 本领域熟知的标准重组技术和克隆技术实现(参见例如Maniatis 1989; Silhavy 1984;Ausubel 1987)。已经开发了众多方案或方法并用于基因克隆。 这些方法的实例是通过限制性酶消化并连接匹配性末端的克隆法、直接从 PCR产物进行的T-A克隆法、TOPO-连接的单向克隆法和基于重组的克 隆法。基于重组的克隆法是最通用的可用克隆方法之一,其原因是克隆效 率高和广泛用于克隆多种基因,无论是否存在可用的限制性酶位点。重组 克隆法使用λ重组系统将基因克隆入载体,其中所述的载体含有用于λ重 组酶装置的重组序列。重组克隆法使用位点特异性重组酶,其中所述的位 点特异性重组酶(在某些情况下连同相关蛋白质)识别核酸分子中特定的碱 基序列并交换这些序列侧翼的核酸节段。重组酶和相关蛋白质统称为“重组 蛋白”。位点特异性重组酶是在众多生物(例如病毒和细菌)中存在并已经被 表征为具有核酸内切酶特性和连接酶特性这两者的蛋白质。已知的多种位 点特异性重组酶属于整合酶家族重组酶,包括来自噬菌体λ的整合酶/att 系统。来自噬菌体λ的整合酶/att系统的一个应用实例是如在US 5,888,732 和US 6,277,608和美国公开的专利申请2002/0007051A1和国际申请WO 02/081711A1中公开的LR克隆反应,其中所述文献通过引用的方式并入 本文作为参考。LR克隆反应可作为GATEWAYTM克隆技术(可从 Invitrogen Corporation,Carlsbad,California获得)从商业途径获得。LR 克隆反应由LR克隆酶酶混合物催化,其中所述的LR克隆酶酶混合物包 含λ重组蛋白Int、Xis和大肠杆菌编码的蛋白IHF。

表达盒也可以通过将本发明的嵌合性转录调节核酸序列插入植物基 因组进行装配。这种插入将导致与已经存在于基因组中的目的核酸序列有 效连接。通过插入,目的核酸以萌芽胚特异性方式表达,原因在于所述嵌 合性转录调节核苷酸序列的转录调节特性。所述插入可以是定向的或随机 的。优选地,该插入是定向的并且通过例如同源重组实现。通过这种方法, 天然启动子可以替换为本发明的嵌合性转录调节核苷酸序列,从而调节内 源性基因的表达模式。所述转录调节性核苷酸序列也可以通过内源性基因 的反义mRNA表达的方式插入,从而诱导基因沉默。

有效连接例如可以包含本发明嵌合性转录调节核苷酸序列连同待表 达的核酸序列和任选地额外调节元件,例如聚腺苷酸化元件或转录终止元 件、增强子、内含子等以如此方式依次排列,从而转录调节性核苷酸序列 可以在适宜条件下表达目的核酸序列的过程中实现其功能。术语“适宜条 件”优选地意指植物细胞中所述表达盒的存在。优选这样的排列,其中待表 达的目的核酸序列以如此方式置于本发明的嵌合性转录调节核苷酸序列 下游(即在3’方向上),从而使这两种序列共价地连接。任选地,额外序列 可以插入这两种序列之间。此类序列可以例如是接头或多克隆位点。此外, 可以插入编码融合蛋白的部分的序列(在意图表达由目的核酸编码的蛋白 质的融合蛋白的情况下)。优选地,待表达的目的核酸序列与本发明转录调 节性核苷酸序列之间的距离不超过200碱基对,优选地不超过100碱基对, 更优选地不超过50碱基对。

实际上,任意DNA组合物可以用于递送至受体单子叶植物或细胞中, 以最终产生本发明的能育性转基因植物。例如,可以使用载体或质粒形式 的DNA节段或片段,或线性DNA节段或片段等,在一些情况下,所述的 DNA节段或片段仅含有待于植物中表达的DNA元件。在本公开内容的教 导下,构建可以与本发明联合使用的载体将为本领域技术人员所知(参见例 如Sambrook 1989;Gelvin 1990)。

本发明也提供含有本发明表达盒的适用于植物转化的重组载体或其 他DNA构建体(包括但不限于粘粒、YAC(酵母人工染色体)、BAC(细菌人 工染色体)和植物人工染色体),和包含所述表达盒或载体(例如包含质粒) 的单子叶植物宿主细胞。所述表达盒或载体可以(优选地)增多转化的单子 叶植物的基因组或可以以染色体外方式维持。本发明的表达盒或载体可以 存在于植物细胞的细胞核、叶绿体、线粒体和/或质体中。优选地,本发明 的表达盒或载体包含于植物细胞核的染色体DNA中。在某些实施方案中, 构思的是可能想要在单子叶植物转化中利用有复制能力的病毒载体。这些 载体包括例如小麦矮化病毒(WDV)“穿梭”载体,如pW1-11和 PW1-GUS(Ugaki 1991)。这些载体能够在玉米细胞和大肠杆菌中自主性复 制,并且从而可以为检测递送至转基因细胞的DNA提供提高的灵敏度。 复制型载体也可以用于递送在侧翼具有来自转座元件(如Ac、Ds或Mu) 的DNA序列的基因。

本发明的DNA构建体和从其衍生的任意载体可以包含其他功能性元 件。应当广义地理解术语“其他功能性元件”。该术语优选地指这样的全部 元件,它们影响所述DNA构建体或包含所述DNA构建体的载体或包含 所述DNA构建体或载体的细胞或生物的产生、繁殖、功能、用途或价值。 所述的其他功能性元件可以包括,但是不应当限于:

i)确保本发明的表达盒或载体复制(例如在大肠杆菌中复制)的复制起 点。可以提到的实例是ORI(DNA复制起点、pBR322ori或P15A ori(Sambrook等,1989)。

ii)使得能够和使得便于插入一个或多个核酸序列的多克隆位点 (MCS)。

iii)使同源重组或插入宿主生物基因组成为可能的序列。

iv)使植物细胞中用于转移和整合至植物基因组的农杆菌介导的转移 成为可能的元件,例如边界序列,例如T-DNA的右边界或左边界或vir 区域。

用于本文中转化的所导入的重组DNA分子可以是环状或线性、双链 或单链的。通常,DNA是嵌合DNA形式,如质粒DNA,其中所述的嵌合 DNA也可以含有在侧翼具有调节序列的编码区,所述调节序列促进所得植 物中存在的重组DNA表达。通常,所导入的重组DNA分子相对较小,即 小于约30kb,以最小化对任意的物理、化学或酶降解的易感性,其中所 述的降解易感性随核苷酸分子大小增加而增加。如上指出,优选地预先选 择并限定导入植物基因组的蛋白质、RNA转录物或其混合物的数量,例如, 可以形成导入的DNA的1个-约5-10个此类产物。

本发明也提供单子叶植物(优选转基因植物)、来自这种植物的种子和 部分、和来自这种植物的子代植物,包括杂交种和近交种。

本发明也提供植物育种方法,例如旨在制备能育性杂交转基因植物。 所述方法包括使包含本发明具体表达盒的能育性转基因植物与自身或与 第二种植物(例如缺少所述具体表达盒的一种植物)杂交,以制备包含所述 具体表达盒的能育性杂交转基因植物的种子。随后将种子播种以获得能育 性杂交转基因植物。所述植物可以优选地是单子叶植物(优选如以上定义)。 该能育性杂交转基因植物可以具有经雌性亲代或经雄性亲代遗传的所述 具体表达盒。第二种植物可以是近交植物。该能育性杂交转基因植物可以 是杂交种。本发明也包括这些能育性杂交转基因植物中任意植物的种子。

2.由本发明的表达盒表达的有利性状或特性

本发明的嵌合性转录调节核苷酸序列用于改变植物的表型。转基因植 物表型的多种改变是想要的并且可以使用本文公开的转录调节性核苷酸 序列的有利表达模式(即萌芽胚特异性表达)实现。这些结果可以通过提供 植物中异源性产物表达或内源性产物表达增加来实现。备选地,这些结果 可以通过提供植物中一种或多种内源性产物、尤其酶或辅因子表达减少来 实现。通常,所述嵌合性转录调节核苷酸序列可以用来在植物中表达与所 述启动子有效连接的核酸节段(例如可读框)或其部分、反义序列、编码有 义RNA序列或双链RNA序列的序列、编码微RNA序列的序列、或转基 因。这些变化导致转化植物的表型变异。

将根据转化的目的选择用于在本发明单子叶植物宿主细胞中表达的 异源性DNA。作物植物转化的主要目的之一是向植物添加商业上希望的、 农学重要的性状或终产物性状。

虽然众多核酸序列适于由本发明的嵌合性转录调节核酸序列表达,最 优选地,所述核酸在表达后赋予单子叶植物选自如下的性状或特性:

i)针对至少一种胁迫因子的增强抗性,

ii)提高的种子或籽苗营养品质,

iii)提高的产量,和

iv)切除靶序列,例如切除选择标记序列。

2.1基本原理

已知两类基本方法用于控制表达:过量表达和不足表达。过量表达可 以通过插入所选择基因的一个或多于一个额外拷贝实现,然而,不清楚用 核苷酸序列的一个或多于一个的额外拷贝最初转化的植物或其子代是否 表现出对不足表达和过量表达的影响。对于不足表达,存在两种基本方法, 它们在本领域中通常称作“反义下调”和“有义下调”(有义下调又称作“共抑 制”)。这些方法通常称作“基因沉默”。这两类方法导致靶基因表达的抑制。

因此,所述核酸序列在嵌合性转录调节序列控制下的表达可以导致 mRNA转录和蛋白质表达,或反义RNA、有义RNA、dsRNA、微RNA、 ta-siRNA、snRNA、RNAi、或其任意组合的表达。

在本发明方法中表达/转录的mRNA或调节性RNA可以是例如

a)如上所述的双链RNA核酸序列(dsRNA);

b)反义核酸序列,包括其中引导所述反义核酸序列针对基因(即基因 组DNA序列,包括启动子序列)或包括5′和3′非翻译区在内的基因转录物 (即RNA序列)的那些方法。也包括α-异头核酸序列;

c)与核酶组合的反义核酸序列;

d)用于诱导共抑制的有义核酸序列;

e)编码显性失活因子的核酸序列;

f)针对基因、RNA或蛋白质的DNA结合因子、RNA结合因子或蛋 白质结合因子或者抗体;

g)引起RNA降解的病毒核酸序列;

h)微RNA或微小RNA(miRNA),它们已经被设计旨在靶向目的基因 以诱导该目的基因的mRNA降解或翻译性抑制并且因而使基因表达沉默;

i)ta-siRNA,它们已经被设计旨在靶向目的基因以诱导该目的基因的 mRNA降解(或可能诱导翻译抑制)并且因而使基因表达沉默;和/或

下文是对各个优选方法的简短描述。通常,根据需要,术语“表达”的 含义应当包括术语“转录”和/或“翻译”的含义。

a)在本发明方法中表达的调节性RNA可以例如是双链RNA核酸序 列(dsRNA),例如用于降低或消除在本发明方法中待降低其活性的核酸分 子或多肽的活性。

作为反义多核苷酸和有义多核苷酸的替代,双链RNA(dsRNA)可以用 来降低基因的表达。如本文中所用,术语“dsRNA”指包含两条RNA链的 RNA杂交体。所述dsRNA可以在结构上是线性或环状。杂交性RNA可 以是基本上或完全互补的。“基本上互补”意指当两条杂交性RNA使用如 上所述Needleman和Wunsch算法进行最佳比对时,杂交部分是至少95% 互补的。优选地,所述dsRNA具有至少100个碱基对长度。用于制备和 使用dsRNA的方法是本领域已知的。一种方法包括在体内同时转录两条 互补性DNA链(参见如美国专利号5,795,715)。

dsRNA可以通过标准转化方法直接导入植物或植物细胞。或者,可以 通过转录两条互补RNA在植物细胞中表达dsRNA。

已经对动物、酵母、真菌和植物生物,例如对脉孢霉(Neurospora)、 斑马鱼(Zebrafish)、果蝇、小鼠、人类、锥虫(Trypanosoma)、矮牵牛或拟 南芥属植物广泛描述了通过双链RNA(“双链RNA干扰”;dsRNAi)调节基 因的方法(例如Matzke MA等,(2000)Plant Mol.Biol.43:401-415;Fire A.等,(1998)Nature 391:806-811;WO 99/32619;WO 99/53050;WO 00/68374;WO 00/44914;WO 00/44895;WO 00/49035; WO 00/63364)。此外,还报道RNAi作为抑制细菌(如大肠杆菌)基因的有 利工具,例如由Tchurikov等报道[J.Biol.Chem.,2000,275(34): 26523-26529]。Fire等将RNAi现象命名为RNA干扰。明确地参考在以上 参考文献中描述的技术和方法。高效基因抑制也可以在例如瞬时表达的情 况下或在瞬时转化后观察到,例如,作为生物射弹转化法的结果(Schweizer P等(2000)Plant J 200024:895-903)。dsRNAi方法基于这样的现象,即同 时导入基因转录物的互补链和反向链导致高效地抑制所讨论基因的表达。 所得的表型极相似于类似的敲除突变体的表型(Waterhouse PM等 (1998)Proc.Natl.Acad.Sci.USA 95:13959-64)。

Tuschl等[Gens Dev.,1999,13(24):3191-3197]能够证实RNAi方法的 效率与双链体长度、3′-末端突出物的长度和这些突出物中的序列相关。

基于Tuschl等的工作并且认为以下原则在不同物种间是保守的,可以 给予技术人员如下指导原则。因此,本发明或本发明方法中使用的dsRNA 分子优选地符合以下至少一个原则:

-为实现良好的结果,通常应当避开所用核酸序列的5′和3′非翻译区 和靠近起始密码子的区域,因为这些区域中的调节蛋白结合位点较丰富, 并且RNAi序列与此类调节蛋白之间的相互作用可能导致不希望的相互作 用;

-在植物中,所用核酸序列的5′和3′非翻译区和靠近起始密码子的区 域,优选在起始密码子上游50至100nt的区域产生良好结果并且不应当 避开;

-优选地,选择所用mRNA的这样一个区域,其在AUG起始密码子 下游50至100nt(=核苷酸或碱基);

-仅来自外显子的dsRNA(=双链RNA)序列用于本方法,因为来自内 含子的序列没有效果;

-该区域中的G/C含量应当大于30%并小于70%,理想地在50%左 右;

-靶mRNA的可能二级结构对RNAi方法的效果而言重要性较低。

所述dsRNAi方法可能特别有效和有利于减少在本发明方法中待降低 其活性的核酸分子表达。尤其如WO 99/32619中描述,dsRNAi方法明显 优于常规反义方法。

因此,本发明可以用于表达双链RNA分子(dsRNA分子),其中所述 的双链RNA分子导入生物,有利地导入植物(或细胞、组织、器官或由它 们衍生的种子)时,因本发明方法中待降低其活性的核酸分子的表达降低而 引起改变的代谢活性。

在双链RNA分子,例如用于减少由本发明方法中待降低其活性的核 酸分子编码的蛋白质表达的dsRNA,这两条RNA链之一与核酸序列的至 少部分基本上相同,并且相应的另一条RNA链与核酸序列的互补链的至 少部分基本上相同。

术语“基本上相同”指这样的事实,即与靶序列相比,所述dsRNA序 列也可以包括插入、缺失和单个点突变,而仍导致表达的有效降低。优选 地,所述抑制性dsRNA的“有义”链与本发明核酸序列(其中所述的本发明 核酸序列在本发明的优选实施方案中包括其内源性5’和3’非翻译区)的部 分节段之间或“反义”链与核酸序列的互补链之间如上定义的同源性分别等 于至少30%、优选至少40%、50%、60%、70%或80%、非常特别优选 至少90%、最优选100%。所述的部分节段达至少10个碱基、优选至少 17、18、19、20、21、22、23、24、25、26、27、28、29或30个碱基、 特别优选至少40、50、60、70、80或90个碱基、非常特别优选至少100、 200、300或400个碱基、最优选至少500、600、700、800、900或更多个 碱基或至少1000或2000个碱基或更多个碱基长度。在本发明的另一个优 选实施方案中,所述的部分节段达17、18、19、20、21、22、23、24、25、 26或27个碱基、优选地达20、21、22、23、24或25个碱基。这些短序 列在动物和植物中是优选的。200-800个碱基之间的较长序列在非哺乳动 物中、优选在无脊椎动物中、在酵母、真菌或细菌中是优选的,但是它们 也可用于植物中。长的双链RNA在所述生物中例如由蛋白质Dicer加工成 众多siRNA(=小/短干扰性RNA),其中所述的蛋白质Dicer是双链特异性 RNA酶III。作为一种替代,“基本上相同的”dsRNA也可以定义为能够与 基因转录物的部分杂交(例如在50℃或70℃于400mM NaCl,40mM PIPES pH 6.4,1mM EDTA中持续12-16小时)的核酸序列。

所述dsRNA可以由聚合的核糖核苷酸的一条或两条链组成。也可以 存在对糖-磷酸酯主链和对核苷的修饰。例如,天然RNA的磷酸二酯键可 以按照如此方式受到修饰,从而它们包含至少一个氮或硫杂原子。碱基可 以按照如此方式受到修饰,从而例如腺苷脱氨酶的活性受到限制。这些修 饰和其他修饰在下文用于稳定反义RNA的方法中描述。

所述dsRNA可以酶学地制备;它也可以完全地或部分地以化学方式 合成。有效介导RNA干扰的达30bp的短dsRNA可以例如通过使用大肠 杆菌核糖核酸酶III(RNase III)部分消化长dsRNA模板而有效地产生 (Yang,D.,等(2002)Proc.Natl.Acad.Sci.USA 99,9942.)。

双链结构可以从一条自我互补的单链开始或从两条互补链开始而形 成。在一条自我互补的单链中,“有义”序列和“反义”序列可以通过接头序 列(“接头”)连接并形成例如发夹结构。优选地,所述接头序列可以采取内 含子的形式,其中所述的内含子在dsRNA合成后被剪切掉。编码dsRNA 的核酸序列可以含有其他元件,例如转录终止信号或聚腺苷酸化信号。如 果所述dsRNA的两条链将在细胞或生物中、有利地在植物中组合,则这 可以以多种方式引起:

a)用包含两个表达盒的载体转化细胞或生物,有利地转化植物;

b)用两种载体共转化细胞或生物,有利地转化植物,其中所述的两种 载体之一包含具有“有义”链的表达盒而另一种载体包含具有“反义”链的表 达盒;

c)在已经用包含具有“反义”链的表达盒的载体转化细胞或生物后,用 包含具有“有义”链的表达盒的载体超转化所述的细胞或生物,有利地超转 化植物,或反之操作;

d)杂交,例如使两种生物、有利地使植物杂交,其中每种生物已经用 一种载体转化,其中一种载体包含具有“有义”链的表达盒而另一种载体包 含具有“反义”链的表达盒;

e)导入包含两个启动子的构建体,其中所述的启动子导致所需序列从 两个方向上转录;

f)用能够产生所需dsRNA分子的工程化病毒感染细胞或感染生物, 有利地感染植物。

RNA双链体的形成可以在细胞外部或在细胞内部启动。若所述 dsRNA在靶细胞或生物外部合成,则它可以通过注射法、微注射法、电穿 孔法、高速粒子法、通过激光束导入或通过化学化合物(DEAE葡聚糖、磷 酸钙、脂质体)介导而导入生物或所述生物的细胞。

因此在一个实施方案中,本发明涉及一种dsRNA,其中所述双链RNA 核酸分子的有义链与所述核酸序列具有至少30%、35%、40%、45%、50%、 55%或60%、优选地65%、70%、75%或80%、更优选地85%、90%、 95%、96%、97%、98%或99%的同源性。

本发明的另一个实施方案是一种dsRNA分子,其包含核酸分子中至 少10碱基对(=个碱基,nt,核苷酸)、优选至少17、18、19、20、21、22、 23、24、25、26、27、28、29、30、35、40、45或50、特别优选至少55、 60、70、80或90碱基对、非常特别优选至少100、200、300或400碱基 对、最优选至少500、600、700、800、900或更多碱基对或至少1000或 2000碱基对的片段,所述的片段与核酸分子具有至少50%、60%、70%、 80%或90%、优选地100%的同源性。

在本发明的另一个优选实施方案中,所述dsRNA分子的编码序列或 其部分节段达17、18、19、20、21、22、23、24、25、26或27个碱基、 优选地达20、21、22、23、24或25个碱基,其中所述序列的同源性基本 上是95%、96%、97%、98%或优选99%或100%。

在本发明的一个优选的实施方案中,所述双链RNA的有义和反义链 共价地结合或通过其他键,例如弱化学键如氢键相互结合,并且所述反义 链基本上是所述有义RNA链的互补物。

如WO 99/53050中所示,所述dsRNA也可以通过“接头”(例如内含子) 连接“有义”链和“反义”链而包含发夹结构。优选自我互补性dsRNA结构, 因为它们仅需要一个构建体的表达并且总是以等摩尔比率包含互补链。

使用本文如下所述的方法(如使用选择标记),优选地将编码dsRNA的 “反义”链或“有义”链或编码dsRNA的自我互补链的表达盒插入载体并稳 定地插入植物基因组,旨在确保所述dsRNA的持久表达。用细菌载体或 病毒载体的瞬时表达是类似有用的。

可以利用可能使每细胞具有至少一个拷贝的量导入所述dsRNA。更 大的量(例如每个细胞至少5、10、100、500或1000个拷贝)可以引起效率 更高的减少作用。

如已经描述那样,为引起表达的有效降低,并不是必需要求所述 dsRNA与待减少的核酸分子的基因转录物之间具有100%序列同一性。因 此,有利的是本发明方法容忍序列偏差,因为所述的序列偏差可以作为遗 传性突变、多态性或进化趋异性的结果存在。因此,例如使用了从根据本 发明方法待减少的核酸分子开始所产生的dsRNA。

所述dsRNA可以在体内或在体外合成。为此目的,可以将编码dsRNA 的DNA序列导入处在至少一个遗传控制元件(例如,启动子、增强子、沉 默子、剪接供体或剪接受体或聚腺苷酸化信号)控制下的表达盒。合适的有 利构建体在下文中描述。聚腺苷酸化并非是必需的,用于启动翻译的元件 也不是必需存在的。

dsRNA可以按照化学或酶方式合成。细胞RNA聚合酶或细菌噬菌体 RNA聚合酶(例如T3、T7或SP6RNA聚合酶)可以用于此目的。描述了用 于体外表达RNA的合适方法(WO 97/32016;US 5,593,874;US 5,698,425、 US 5,712,135、US 5,789,214、US 5,804,693)。在导入细胞、组织或生物之 前,已在体外以化学或酶方式合成的dsRNA可以例如通过提取、沉淀、 电泳、层析或这些方法的组合较高或较低程度地从反应混合物中分离。所 述dsRNA可以直接导入细胞或在细胞外使用(例如进入胞间隙)。在本发明 的一个实施方案中,所述RNAi方法仅导致基因功能的部分丧失并且因而 能够使技术人员在希望的生物中研究基因剂量效应并且细致地调节本发 明的方法。在另一个优选实施方案中,此方法导致功能完全丧失并且因而 提高精细化学品的生产。此外,该方法还能够使本领域技术人员研究基因 的多个功能。

然而,优选用引起dsRNA表达的表达构建体稳定地转化植物。合适 的方法在下文描述。

b)在本发明方法中表达的调节性RNA可以是反义核酸序列,例如旨 在降低或消除在本发明方法中待降低其活性的核酸分子或多肽。

可以设计外源性DNA序列以下调特定核酸序列。例如通过与本发明 的嵌合性转录调节核酸序列、处于反义方向的外源性DNA或如此设计从 而转录后产生发夹型RNA分子的DNA有效连接而实现这一点。基因抑制 可以针对与性状相关的天然植物基因实现,例如旨在为植物提供降低水平 的由所述天然基因编码的蛋白质或提供增强或减弱水平的受影响的代谢 物。例如,本发明的嵌合性转录调节核酸序列可以与异源性DNA有效连 接,其中如此设计所述的异源性DNA,从而形成旨在抑制玉米胚中天然基 因的发夹形RNA。导致基因抑制的不同类型的外源性DNA排列是本领域 技术人员已知的,并且包括,但不限于以下内容。国际公开WO 94/01550 披露了DNA构建体,其中反义RNA以自我互补性3′节段稳定。转录的 RNA中形成双链发夹的其他元件在WO 98/05770中披露,其中所述的反 义RNA由形成发夹的聚(CG)核苷酸重复序列稳定,并且专利申请公开号 2002/0048814A1描述了由聚(T)-聚(A)尾稳定的有义或反义RNA。美国专 利申请公开号2003/0018993A1披露了由NOS基因3′非翻译区的亚序列的 反向重复序列稳定的有义或反义RNA。美国专利申请公开号2003/0036197 A1描述了由与靶序列具有同源性的两个互补性RNA区稳定的RNA。

用于通过“反义”技术阻止特定蛋白质的mRNA累积而抑制该蛋白质 的方法可以被广泛使用并且已经被广泛地描述,包括针对植物的描述; Sheehy等(1988)Proc.Natl.Acad.Sci.USA 85:8805-8809;US 4,801,100; MoI JN等(1990)FEBS Lett 268(2):427-430)。反义核酸分子与编码待抑制 的靶蛋白的细胞mRNA和/或基因组DNA杂交或与之结合。这个过程抑制 所述靶蛋白的转录和/或翻译。杂交可以通过形成稳定双链体以常规方式发 生,或在基因组DNA的情况下,通过反义核酸分子借助DNA螺旋大沟内 的特异性相互作用与该基因组DNA的双链体结合而发生。

在一个实施方案中,“反义”核酸分子包含至少部分地与编码蛋白质的 “有义”核酸分子互补(例如与双链cDNA分子的编码链互补或与编码性 mRNA序列互补)的核苷酸序列。因此,反义核酸分子可以通过氢键与有 义核酸分子杂交。该反义核酸分子可以与核酸分子的完整编码链互补或仅 与其一部分互补,其中所述的核酸分子引起在本发明方法中待减少的多肽 表达或包含在本发明方法中待降低其活性的核酸分子。因此,反义核酸分 子可以反义于本发明核酸分子的核苷酸序列中编码链的“编码区”。

术语“编码区”指核苷酸序列的区域,该区域包含翻译成氨基酸残基的 密码子。

在另一个实施方案中,该反义核酸分子反义于mRNA中分布在核苷酸 序列编码区侧翼的“非编码区”。术语“非编码区”指分布在编码区侧翼的不 翻译成多肽的5′和3′序列,即也称为5′和3′非翻译区(5′-UTR或3′-UTR)。 有利地,所述非编码区处在所述编码区上游或下游50bp、100bp、200bp 或300bp、优选地400bp、500bp、600bp、700bp、800bp、900bp或 1000bp的区域内。

假定编码在本发明方法中待减少的多肽或核酸分子的编码链序列例 如具有上文提及的活性,例如这样一种多肽的活性,其中所述的多肽具有 在如本文公开的本发明方法中待降低其活性的蛋白质的活性,反义核酸分 子可以根据Watson和Crick碱基配对原则设计。

在又一个实施方案中,所述反义核酸分子可以是α-异头核酸。此类α- 异头核酸分子与互补性RNA形成特定双链杂交体,在所述的双链杂交体 中,与常见的β核酸相反,所述两条链相互呈平行分布(Gaultier等,1987, Nucleic Acids.Res.15:6625-6641)。此外,所述反义核酸分子也可以包含 2′-O-甲基核糖核苷酸(Inoue等,1987,Nucleic Acids Res.15:6131-6148)或 嵌合RNA-DNA类似物(Inoue等,1987,FEBS Lett.215:327-330))。

本发明的反义核酸分子一般施用至细胞或原位地(in situ)产生,从而它 们与编码多肽或编码核酸分子的细胞mRNA和/或基因组DNA杂交或与之 结合(其中所述的多肽具有在本发明的方法中待降低其活性的蛋白质的活 性,所述的核酸分子具有在本发明的方法中待降低其活性的核酸分子的活 性)并因而抑制该蛋白质表达,例如通过抑制转录和/或翻译并引起前述精 细化学品提高活性。

本发明的反义分子也包含这样的核酸分子,其包含与编码本发明天 然存在的多肽(例如序列表中所示的或根据本文描述的方法鉴定的多肽序 列)的核苷酸序列的调节区(例如其启动子和/或增强子)互补的核苷酸序列, 例如旨在形成阻止靶细胞中转录所述基因的三股螺旋结构,一般参见 Helene,C.(1991)Anticancer Drug Des.6(6):569-84;Helene,C.等 (1992)Ann.N. Y. Acad.Sci. 660:27-36;和Maher,L.J.(1992)Bioassavs 14(12):807-15。

c)在本发明方法中表达的调节性RNA可以是与核酶联合的反义核酸 序列,例如旨在降低或消除在本发明方法中待降低其活性的核酸分子或多 肽的活性。

有利的是将上文所述反义策略与核酶方法联合。催化性RNA分子或 核酶可以适应于任意的靶RNA并且切割特定位置上的磷酸二酯主链,因 而功能性地使靶RNA失活(Tanner NK(1999)FEMS Microbiol.Rev.23(3): 257-275)。核酶本身因而不被修饰,但是能够以类似方式切割其他靶RNA 分子,因此获得酶的特性。将核酶序列并入“反义”RNA则向这些“反 义”RNA精确地赋予这种酶样RNA切割特性并且因此在使所述靶RNA失 活时提高“反义”RNA的效率。合适的核酶“反义”RNA分子的制备和用途 例如由Haseloff等(1988)Nature 310:585-591描述。

此外,本发明的反义核酸分子也可以是核酶。核酶是具有核糖核酸酶 活性的催化性RNA分子,能够切割与其具有互补区的单链核酸,如 mRNA。以这种方式,核酶(例如锤头状核酶(在Haselhoff和 Gerlach(1988)Nature 334,585-591中描述)可以用来催化地切割待抑制的 酶的mRNA并且用来阻止翻译。核酶技术可以提高反义策略的效率。用于 表达核酶以减少特定蛋白质的方法在(EP 0291533、EP 0321201、EP 0 360257)中描述。核酶表达也已经针对植物细胞(Steinecke P等 (1992)EMBO J 11(4):1525-1530;de Feyter R等(1996)Mol.Gen.Genet. 250(3):329-338)描述。合适的靶序列和核酶可以如Steinecke P,Ribozymes, Methods in Cell Biology 50,编者Galbraith等,Academic Press,Inc.(1995), 第449-460页所述,通过计算核酶RNA和靶RNA的二级结构并通过它们 的相互作用[Bayley CC等(1992)Plant Mol.Biol.18(2):353-361;Lloyd AM和Davis RW等(1994)Mol.Gen.Genet.242(6):653-657]鉴定。例如, 可以构建与待抑制的蛋白质的mRNA具有互补区的四膜虫 (Tetrahymena)L-19IVS RNA的衍生物(还参见US 4,987,071和US 5,116,742)。作为替代,此类核酶也可以通过选择过程从多种核酶的文库鉴 定(Bartel,D.和Szostak,J.W.,1993,Science 261:1411-1418)。

d)在本发明方法中表达的调节性RNA可以例如是用于诱导共抑制的 (有义)核酸序列,例如旨在降低或消除在本发明方法中待降低其活性的核 酸分子或多肽的活性。

如本发明中所用,“基因抑制”意指用于抑制RNA转录物或抑制从 RNA转录物翻译的蛋白质产生(包括转录后基因抑制和转录抑制)的任意熟 知方法。转录后基因抑制由与基因具有同源性的双链RNA介导,其靶向 所述的基因以抑制。由转录自外源性DNA构建体的RNA进行的基因抑制 是称作反义抑制、共抑制和RNA干扰的基因抑制方法的共同特征,其中 所述的外源性DNA构建体包含至少部分的转录单位的反向重复序列。更 具体地,通过插入具有反义方向DNA的外源性DNA构建体以调节植物细 胞中基因表达的转录后基因抑制在US 5,107,065和US 5,759,829中披露。 转录抑制可以由转录的双链RNA介导,其中所述转录的双链RNA与启动 子DNA序列具有同源性以实施所谓启动子反式抑制作用。通过插入具有 有义方向DNA的外源性DNA构建体以调节植物中基因表达的转录后基因 抑制在US 5,283,184和US 5,231,020中披露。

表达有义方向的核酸序列可以导致相应的同源内源性基因共抑制。表 达与内源性基因具有同源性的有义RNA可以按照如已对以下反义方法所 描述的类似方式减少或实际上消除所述内源性基因的表达:Jorgensen等 [(1996)Plant Mol.Biol.31(5):957-973]、Goring等[(1991)Proc.Natl.Acad. Sci.USA 88:1770-1774]、Smith等[(1990)Mol.Gen.Genet.224:447-481]、 Napoli等[(1990)Plant Cell 2:279-289]或Van der Krol等[(1990)Plant Cell 2:291-99]。在本上下文中,所导入的构建体可以代表完整或仅部分的待减 少的同源基因。这项技术对植物的应用已经例如由Napoli等[(1990)The Plant Cell 2:279-289中描述和在US5,010,323中描述。此外,上文所述的 共抑制策略可以有利地与如Brummell等,2003,Plant J.33,第793-800 页所述的RNAi方法联合。至少在植物中有利的是在共抑制方法中使用强 启动子或非常强的启动子。最近的研究工作,例如Schubert等(Plant Journal 2004,16,2561-2572)的研究工作,已经表明共抑制效应依赖于基因 特定的阈值水平,高于所述阈值水平时共抑制发生。

e)在本发明方法中表达的mRNA可以例如是编码显性失活蛋白的核 酸序列,例如旨在降低或消除在本发明方法中待降低其活性的多肽的活 性。

蛋白质的功能或活性也可以通过表达该蛋白质的显性失活变体有效 地降低。技术人员熟悉用于通过共表达蛋白质的显性失活形式而降低该蛋 白质的功能或活性的方法[Lagna G和Hemmati-Brivanlou A(1998)Current Topics in Developmental Biology 36:75-98;Perlmutter RM和Alberola-lla J(1996)Current Opinion in Immunology 8(2):285-90; Sheppard D(1994)American Journal of Respiratory Cell & Molecular Biology 11(1):1-6;Herskowitz I(1987)Nature 329(6136):219-22]。

显性失活变体可以例如通过改变多肽的氨基酸实现。

这种改变可以例如通过计算机辅助的比较法(“比对法”)确定。用于实 现显性失活变体的这些突变优选地在核酸序列水平上实施。相应的突变可 以例如使用籍此导入所希望突变的合适寡核苷酸引物,通过PCR介导的 体外诱变法进行。为此目的,使用技术人员熟悉的方法。例如“LA PCR体 外诱变试剂盒”(Takara Shuzo,Kyoto)可以用于此目的。也有可能并且本领 域技术人员已知的是缺失或改变功能域(例如,可以结合但不激活的TF或 其他信号成分)可以实现蛋白质活性的降低。

f)本发明的又一个实施方案是受控的mRNA编码DNA结合因子或蛋 白质结合因子。

这些因子结合至内源性靶基因的基因组序列,优选结合在调节区内, 并引起内源性基因的抑制。这种方法的使用使得降低内源性基因表达而无 需重组性操作内源性基因的序列成为可能。用于制备相关因子的此类方法 在Dreier B等[(2001)J.Biol.Chem.276(31):29466-78和(2000)J.Mol.Biol. 303(4):489-502]、Beerli RR等[(1998)Proc.Natl.Acad.Sci.USA 95(25): 14628-14633;(2000)Proc.Natl.Acad.Sci.USA 97(4):1495-1500和(2000)J. Biol.Chem.275(42):32617-32627)]、Segal DJ和Barbas CF[第三版 (2000)Curr.Opin.Chem.Biol.4(1):10-39]、Kang JS和Kim JS[(2000)J. Biol.Chem.275(12):8742-8748]、Kim JS等[(1997)Proc.Natl.Acad.Sci. USA 94(8):3616-3620]、Klug A[(1999)J.Mol.Biol.293(2):215-218]、Tsai SY等[(1998)Adv.Drug Deliv.Rev.30(1-3):23-31]、Mapp AK等 [(2000)Proc.Natl.Acad.Sci.USA 97(8):3930-3935]、Sharrocks AD等 [(1997)Int.J.Biochem.Cell Biol.29(12):1371-1387]和Zhang L等[(2000)J. Biol.Chem.275(43):33850-33860]中描述。这项技术在植物中应用的实例 已经在WO 01/52620、Ordiz Ml等(Proc.Natl.Acad.Sci.USA,第99卷, 第20期,13290-13295,2002)或Guan等(Proc.Natl.Acad.Sci.USA,第99 卷,第20期,13296-13301,2002)中描述。

可以使用基因的任何部分选择这些因子。这种节段优选地位于启动子 区内。然而,为基因抑制目的,它也可以位于编码性外显子区或内含子区 内。技术人员可以通过数据库搜索从Genbank获得相关节段,或从其基因 不存在于Genbank中的cDNA开始,通过筛选基因组文库的相应基因组 克隆而获得相关节段。

还有可能首先鉴定目标作物中的序列,其中所述的序列编码在本发明 的方法中待降低其活性的多肽,随后通过使用上文提及的因子找到启动子 并降低表达。

技术人员熟悉为如此操作所需要的方法。

此外,导入细胞的因子也可以是本身抑制靶蛋白的那些因子。蛋白质 结合因子例如可以是适配子[Famulok M和Mayer G(1999)Curr.Top Microbiol.Immunol.243:123-36]或者抗体或抗体片段或单链抗体。已经描 述这些因子的获得并且是技术人员熟悉的。例如,一种胞浆scFv抗体已经 用于调节经遗传修饰的烟草植物中植物光敏素A蛋白的活性[Owen M等 (1992)Biotechnology(NY)10(7):790-794;Franken E等(1997)Curr.Opin. Biotechnol.8(4):411-416;Whitelam(1996)Trend Plant Sci.1:286-272]。

基因表达也可以由特制的低分子量合成化合物抑制,例如聚酰胺型化 合物[Dervan PB和RW(1999)Current Opinion in Chemical Biology 3:688-693;Gottesfeld JM等(2000)Gene Expr.9(1-2):77-91]。这些寡聚 物由3-(二甲胺基)丙胺、N-甲基-3-羟基吡咯、N-甲基咪唑和N-甲基吡咯单 元组成;它们可以按照如此方式适配至双链DNA的每个部分,所述方式 为它们以序列特异性方式与大沟结合并阻断位于该位置内的基因序列的 表达。合适方法已经在Bremer RE等[(2001)Bioorg.Med.Chem.9(8): 2093-103]、Ansari AZ等[(2001)Chem.Biol.8(6):583-92]、Gottesfeld JM 等[(2001)J.Mol.Biol.309(3):615-29]、Wurtz NR等[(2001)Org.Lett 3(8): 1201-3]、Wang CC等[(2001)Bioorg.Med.Chem.9(3):653-7]、Urbach AR和Dervan PB[(2001)Proc.Natl.Acad.Sci.USA 98(8):4103-8]以及 Chiang SY等[(2000)J.Biol.Chem.275(32):24246-54]中描述。

g)在本发明方法中表达的调节性RNA可以例如是引起RNA降解的 病毒核酸序列,例如旨在降低或消除在本发明方法中待降低其活性的核酸 分子或多肽的活性。

借助病毒表达系统(Amplikon),也可以通过由生物、有利地在植物中 诱导特异性RNA降解而有效地引起失活或下调[Angell,SM等 (1999)Plant J.20(3):357-362]。与待抑制的转录物具有同源性的核酸序列 通过这些系统借助病毒载体导入植物,其中所述的系统又称做“VIGS”(病 毒诱导的基因沉默)。随后,转录被关闭,这可能由针对病毒的植物防御机 制介导。合适的技术和方法在Ratcliff F等[(2001)Plant J.25(2):237-45]、 Fagard M和Vaucheret H[(2000)Plant Mol.Biol.43(2-3):285-93]、 Anandalakshmi R等[(1998)Proc.Natl.Acad.Sci.USA 95(22):13079-84]和 Ruiz MT[(1998)Plant Cell 10(6):937-46]中描述。

g)在本发明方法中表达的调节性RNA可以例如是微RNA(或微小 RNA),其中所述的微RNA已经被设计旨在靶向目的基因以诱导该目的基 因的mRNA降解或翻译性抑制并且因而使基因表达沉默或靶向确保所述 目的基因表达的表达盒,例如旨在降低或消除在本发明方法中待降低其活 性的核酸分子或多肽的活性。

基因表达的调节也可以通过调节微RNA的表达实现。日益增长的证 据表明植物miRNA在分生组织鉴定、细胞分裂、器官分离、器官极化和 非生物胁迫应答方面具有广泛的调节功能(Bartel D 2004)。众多植物 miRNA具有独特的空间或时间表达模式。植物miRNA的过量表达或异位 表达可以改变植物的形态学和生理学。也可以设计植物miRNA前体以靶 向拟南芥属植物中的报道基因(Parizotto E A等,2004)。

微RNA(miRNA)作为植物和动物中进化保守的基于RNA的基因表达 调节物出现。miRNA(约21-25nt)来自具有茎环结构的更大前体,所述的 前体从非蛋白质编码基因转录出来。miRNA靶向特定mRNA以在转录后 水平上(即降解mRNA)或在翻译水平(即抑制蛋白质合成)抑制基因表达 (Bartel D 2004,Cell 116,281-297)。可以有效地设计miRNA,以特异性地 靶向并下调所选择的基因。Schwab及其合作者已经分析了天然植物 miRNA的靶选择的决定因素(Schwab等,2005,Dev.Cell 8,517-527)。该 项工作已经扩展至有效下调靶基因的人工miRNAs(amiRNAs)的设计和用 途,形成设计用于定向基因沉默的有效amiRNA的概念和原则(拟南芥中 通过人工微RNA的高度特异性基因沉默(Highly Specific Gene Silencing by Artificial microRNAs in Arabidopsis),Schwab等,Plant Cell 2006 18(4))和用于有效amiRNA  设计的基于网络的工具 (http://wmd.weigelworld.org))。

i)在本发明方法中表达的调节性RNA可以例如是反式的干扰性小 RNA(ta-siRNA)或是确保前者表达的表达盒,例如旨在降低或消除在本发 明方法中待降低其活性的核酸分子或多肽的活性。

反式siRNA(ta-siRNA)是新近鉴定的内源性siRNA(Peragine等, 2004;Vazquez等,2004)。ta-siRNA的产生需要miRNA介导的mRNA 切割和随后由一种RNA依赖性RNA聚合酶(RdRP)RDR6(Allen等,2005) 进行的dsRNA合成。ta-siRNA以类似于miRNA的方式调节基因表达。

反式的干扰性小RNA(ta-siRNA)可以设计为靶向目的基因,以诱导目 的基因的mRNA降解并且因而使基因沉默。

使用ta-siRNA用以根据本发明方法抑制或失活基因产物的方法在US 60/672976和60/718645中描述。

如以上项中描述的核酸序列在细胞或生物中通过转化/转染所述细胞 或生物进行表达或通过已知方法(例如项A)中披露的方法)导入所述细胞或 生物。

2.2农学相关的性状

所述嵌合性转录调节核苷酸序列可以优选地用来向转化的单子叶植 物赋予农学相关的性状。此类性状包括但不限于除草剂抗性、除草剂耐受 性、昆虫抗性、昆虫耐受性、疾病抗性、疾病耐受性(病毒病、细菌病、真 菌病、线虫病)、胁迫耐受性、胁迫抗性,例如对干旱、热、急冷、冷冻、 过度潮湿、盐胁迫和氧化胁迫的抗性或耐受性、提高的产量、食品含量与 价值、提高的饲料含量与价值、物理外观、雄性不育、雌性不育性、干透、 直立性、多育性、淀粉的量与品质、油的量与品质、蛋白质的品质与量、 氨基酸组成等。虽然众多核酸序列适合由(例如与优选的启动子,例如与超 级启动子组合的)本发明的嵌合性转录调节核酸序列表达,不过最优选地, 所述核酸在表达后向所述单子叶植物赋予选自以下性状的农学相关性状

i)增强的针对至少一种胁迫因子的抗性或耐受性

ii)提高的种子或籽苗营养品质,

iii)提高的产量。

经济上最相关的性状之一是产量,对胚和年幼籽苗的任意类型的损伤 严重影响产量。因此,保护年幼籽苗和胚或增强其性能的任意类型的性状 就产量而言是有利的。因此,导致胁迫抗性的性状(见下文)也可导致增 加的产量。因此,本发明的另一个实施方案涉及向植物赋予提高的产量和 /或提高的胁迫耐受性的方法,所述的方法包括步骤

A)将表达构建体导入植物,所述表达构建体包含编码植物转录调节 序列的多核苷酸和与其有效连接的至少一个核酸,其中所述编码转录调节 序列的多核苷酸包含

i)选自以下的第一核酸分子

a)如SEQ ID NO:1中定义的多核苷酸;

b)与SEQ ID NO:1的多核苷酸具有至少50%、优选至少60%、70% 或80%、更优选至少85%或90%、最优选至少95%、98%或99%序列同 一性的多核苷酸;

c)SEQ ID NO:1的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和

d)在下述条件下与包含如SEQ ID NO:1中定义的多核苷酸中至少50 个核苷酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于:在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在 50℃于2×SSC,0.1%SDS中洗涤、更优选在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS 中洗涤、更优选在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、更优选在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于0.1×SSC,0.1%SDS中洗涤,并且最优选在50℃于7%十二烷基硫酸 钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1% SDS中洗涤,和与其有效连接的

ii)第二核酸分子,其选自以下多核苷酸

a)如SEQ ID NO:3中定义的多核苷酸;

b)与SEQ ID NO:3的多核苷酸具有至少50%、优选至少60%、70% 或80%、更优选至少85%或90%、最优选至少95%、98%或99%序列同 一性的多核苷酸;

c)SEQ ID NO:3的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段,和

d)在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于:在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于2×SSC,0.1%SDS中洗涤,更优选在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS中洗涤、 更优选在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、更优选在50℃于7%十 二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 0.1×SSC,0.1%SDS中洗涤,并且最优选在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1%SDS 中洗涤

其中所述的至少一个核酸相对于转录调节序列的所述第一或第二核 酸序列是异源的并且能够向植物赋予提高的产量和/或提高的胁迫耐受性, 和

B)选择转基因植物,其中与野生型或无效分离子植物相比较,所述的 植物具有提高的产量和/或提高的胁迫耐受性。

所述提高的产量和/或提高的胁迫耐受性以及相应待表达的异源核酸 序列如上文定义。更具体的实例在下文给出。优选的嵌合性转录调节核苷 酸序列在上文描述。

2.2.1提高胁迫抗性或耐受性

所述转录调节核苷酸序列可以优选地用来向转化的单子叶植物赋予 提高(或增强)的胁迫抗性(优选地用来产生抗胁迫或胁迫耐受性植物)。“抗 性”意指基本上不显示因施用化学物、病原体感染或暴露于胁迫所致表型变 化的植物。“耐受性”意指这样的植物,该植物尽管可以表现一些因感染所 致的表型变化,然而其繁殖力没有明显下降或其代谢没有明显改变。

本领域技术人员已知多种核酸序列可获得此类胁迫抗性。所述序列可 以包括但不限于编码参与植物激素生物合成、植物激素调节、细胞周期调 节或糖代谢的多肽的多核苷酸。所述胁迫因子优选地如上文定义。待(例如 作为有义、反义或双链RNA)表达的异源核酸序列可以编码如上所述的胁 迫相关多肽(或其部分;优选至少5个、更优选至少10个、最优选至少30 个连续氨基酸的一部分)。优选的嵌合性转录调节核苷酸序列在上文描述。

所述胁迫因子和待表达的异源核酸序列优选地如上文定义。优选的嵌 合性转录调节核苷酸序列在上文描述。

可以有利地获得的胁迫抗性优选地针对非生物性或生物性胁迫因子。 所述生物性胁迫因子可以选自真菌抗性、线虫抗性、昆虫抗性、病毒抗性 和细菌抗性。优选地,所述生物性胁迫因子是种生疾病(主要是真菌疾病, 例如主要在小麦中的普通腥黑穗病(小麦光腥黑穗菌(Tilletia tritici));主要 在大麦中的条纹病(麦类核腔菌(Pyrenophora graminea))和散黑穗病(麦散 黑粉菌(Ustilago nuda)))。

非生物性胁迫因子可以选自干旱、过度潮湿、热、急冷、冷冻、寒冷、 盐、氮、植物群体高密度、紫外光和氧化胁迫。优选地,所述胁迫抗性通 过诱导早期生长势实现。

本领域技术人员已知多种核酸序列可获得此类胁迫抗性。所述序列可 以包括但不限于编码参与植物激素生物合成、植物激素调节、细胞周期调 节或糖代谢的多肽的多核苷酸。更具体的实例在下文给出。

本发明适用于全部单子叶植物如玉米、小麦、稻、大麦、燕麦、黑麦、 高粱、谷子、小黑麦、黑麦草或薏苡,然而优选地适用于禾本科产生谷粒 的禾谷类植物如玉米、小麦、稻、大麦、燕麦、黑麦、高粱、谷子或小黑 麦,优选地适用于玉米、大麦和小麦,最优选地适用于玉米。

本发明的其他实施方案涉及本发明单子叶植物的种子、部分和细胞。 优选地,所述植物部分选自:细胞、原生质体、细胞组织培养物、愈伤组 织、细胞团块、胚、花粉、胚珠、种子、花、谷粒、穗、穗轴、叶、外壳、 柄、根、根尖、花药和穗丝。

所述提高的胁迫耐受性可以间接地引起促进谷粒农学特征增强、谷粒 充实提高、谷粒败育下降、营养转运增加等方面的一种或多种性状。

2.2.1.1昆虫抗性和耐受性

本发明的一个重要方面涉及导入赋予昆虫抗性的基因至植物中。可以 导入的潜在昆虫抗性基因包括苏云金芽孢杆菌(Bacillus thuringiensis)结晶 毒素基因或Bt基因(Watrud 1985)。Bt基因可以提供对鳞翅目 (lepidopteran)害虫或鞘翅目(coleopteran)害虫如欧洲玉米螟(European Maize Borer,ECB))和南瓜十二星叶甲(corn rootworm,CRW)的抗性。 用于此类实施方案的优选Bt毒素基因包括CryIA(b)和CryIA(c)基因。就 此方面而言,还可以使用来自苏云金芽孢杆菌的其它种中影响昆虫生长或 发育的内毒素基因。蛋白酶抑制物也可以提供昆虫抗性(Johnson 1989)并且 因此用于植物转化。预期使用来自番茄或马铃薯的蛋白酶抑制物II基因即 pinII特别有用。甚至更有利的是使用与Bt毒素基因组合的pinII基因, 本发明人已经发现该组合的联合效应产生协同性杀昆虫活性。还可以使用 编码昆虫消化系统抑制物的其它基因或编码促进抑制物产生的酶或辅因 子的那些基因。如那些来自小麦和大麦的半胱氨酸蛋白酶抑制物和淀粉酶 抑制物可以作为本组的示例。

另外,编码凝集素的基因可以赋予额外的或备选的杀昆虫特性。凝集 素(最初称作植物血凝素)是多价的糖结合蛋白,具有凝集来自多个物种中 的红细胞。最近已经确定凝集素作为具有抗象甲(weevil)、ECB和根虫的 杀虫剂(Murdock 1990;Czapla & Lang,1990)。预计有用的凝集素基因包 括例如,大麦和小麦胚凝集素(WGA)和稻凝集素(Gatehouse 1984),优选 WGA。

在导入昆虫害虫时控制具有抗昆虫活性的大多肽或小多肽(例如裂解 肽、肽激素和毒素和毒物)产生的基因形成了本发明的另一方面。例如, 预计表达针对特定昆虫害虫的保幼激素酯酶还可以产生杀昆虫活性或可 能引起变态中止(Hammock 1990)。

表达编码影响昆虫角质层完整性的酶的基因的转基因植物又形成本 发明的另外方面。此类基因包括编码例如几丁质酶、蛋白酶、脂肪酶的那 些基因并且还是产生日光霉素(一种抑制几丁质合成的化合物)的基因,其 中导入所述的任一基因预计产生抗昆虫的玉米植物。编码影响昆虫蜕皮活 性的基因,如影响蜕皮激素UDP-葡糖基转移酶产生的那些基因也处于本 发明的有用转基因范围内。

本发明还包括这样的基因,其中所述的基因编码促进对害虫而言降低 宿主植物营养品质的化合物产生的酶。有可能例如通过改变甾醇组成而赋 予植物杀昆虫活性。甾醇由昆虫从它们的肠道中获得并用于激素合成和膜 稳定性。因此,通过表达新基因改变植物甾醇组成可能对昆虫生长和/或发 育产生不利影响并赋予植物杀昆虫活性,其中所述的新基因例如是直接促 进不想要的甾醇产生的基因和使所需要的甾醇转化成不利形式的甾醇的 基因。脂肪氧化酶是已经证实对昆虫表现抗营养效应并降低昆虫膳食的营 养品质的天然存在的植物酶。因此,本发明的又一实施方案涉及具有增强 的脂肪氧化酶活性的可以抗昆虫采食的转基因植物。

本发明还提供了借此实现植物次级代谢产物的定性或定量改变的方 法和组合物。一个实例涉及转化植物以便产生预计将赋予抗欧洲玉米螟、 南瓜十二星叶甲和其它数种玉米害虫抗性的DIMBOA。特别考虑用于该方 面的候选基因包括已知参与DIMBOA合成途径的在bx基因座内的那些基 因(Dunn 1981)。还预计导入可以调节黄酮甙(maysin)产生的基因以及在 高粱内参与蜀黍苷产生的基因分别用于促进棉铃虫(earworm)抗性和根 虫抗性。

鸭茅状摩擦禾(Tripsacum dactyloides)是抗某些昆虫(包括南瓜十二星 叶甲)的禾草物种。预计将从摩擦禾中分离编码这样的蛋白质的基因,其中 所述的蛋白质对昆虫有毒或参与对昆虫有毒的化合物的生物合成,并且这 些新基因将用于赋予抗昆虫抗性。已知摩擦禾中的昆虫抗性基础是遗传性 的,因为所述的抗性已经通过有性交配转移至玉米中(Branson和Guss, 1972)。

编码表征为具有有效杀虫活性的蛋白质的其它基因还可以用作本文 中的转基因。此类基因包括例如编码可以用作根虫拒食剂的豇豆胰蛋白酶 抑制物(CpTI;Hilder 1987)的基因;编码可以特别用作南瓜十二星叶甲拒 食剂的阿维菌素(Campbell 1989;Ikeda 1987)的基因;核糖体失活蛋白基 因和甚至调节植物结构的基因。还考虑了包括抗昆虫抗体基因和编码这样 的酶的基因的转基因玉米,其中所述的酶可以将施加在植物外部的无毒杀 虫剂(杀虫剂原)转变成植物中的杀虫剂。

2.2.1.2环境或胁迫抗性和耐受性

对植物耐受多种环境胁迫(如但不限于干旱、过度潮湿、氮、急冷、冷 冻、高温、盐和氧化胁迫)能力的改善还可以通过表达异源基因或过量表达 同源基因实施。可以通过导入如Winter Flounder(Cutler 1989)所述的“抗 冻”蛋白或其合成性基因衍生物实现增加的抗冰冻温度抗性而受益。还可以 通过增加叶绿体中甘油-3-磷酸乙酰基转移酶的表达赋予改善的急冷耐受 性(Murata 1992;Wolter 1992)。对氧化胁迫(常由于如寒冷温度加高光照 强度恶化)的抗性可以通过表达超氧化物歧化酶(Gupta 1993)赋予并可以通 过谷胱甘肽还原酶加以改善(Bowler 1992)。此类策略可以允许在新出田地 中耐受冰冻并允许将产量较高的较晚成熟品种延伸到相对较早熟的地带 内。

表达有利地影响植物水含量、总水势、渗透势和膨压的新基因可以增 强植物耐受干旱的能力。如本文中所用,术语“干旱抗性”和“干旱耐受性” 用来指与正常环境相比,植物增加对降低的有效水诱导的胁迫的抗性或耐 受性,以及植物在缺水环境中发挥功能并存活,以及性能相对优异的能力。 在本发明的这个方面,提出例如表达编码渗透活性溶质生物合成的基因可 以赋予抗干旱保护。在这类基因中包括编码甘露醇脱氢酶(Lee和Saier, 1982)和海藻糖-6-磷酸合酶(Kaasen 1992)的DNA。通过细胞内天然磷酸酶 的后续作用或通过导入并共表达特定的磷酸酶,这些导入的基因将分别导 致甘露醇累积或海藻糖累积,甘露醇和海藻糖均已充分报道为能够减轻胁 迫效应的保护性化合物。已经验证在转基因烟草中的甘露醇累积并且初步 结果表明表达高水平甘露醇的植物能够耐受所施加的渗透胁迫 (Tarczynski 1992)。

类似地,已经报道其它代谢物在保护酶功能(例如2,2亚氨双丙氨酸 (alanopine)或丙酸)或膜完整性(例如2,2亚氨双丙氨酸)(Loomis 1989)方面 的效力并且因此表达编码这些化合物生物合成的基因可以按照与甘露醇 相似或互补的方式赋予干旱抗性。在干旱和/或脱水期间有渗透活性和/或 提供某些直接保护效应的天然存在的代谢物的其它实例包括糖和糖衍生 物,如果糖、赤藓醇(Coxson 1992)、山梨醇、卫矛醇(Karsten 1992)、葡 糖基甘油(Reed 1984;Erdmann 1992)、蔗糖、水苏糖(Koster和Leopold 1988;Blackman 1992)、芒柄醇和松醇(Vernon和Bohnert 1992)和棉子糖 (Bernal-Lugo和Leopold 1992)。其它不是糖的渗透活性溶质包括但不限于 脯氨酸和甘氨酸-甜菜碱(Wyn-Jones和Storey,1981)。在胁迫期间的冠 继续生长和生殖适合度增加可以通过导入并表达如控制以上所讨论的渗 透活性化合物和此类其它化合物的那些基因(如在一个示例性实施方案由 肌醇O-甲基转移酶代表的基因)而增强。

考虑了特定蛋白质的表达也可以增加干旱耐受性。基于结构相似性, 将晚期胚发生蛋白划分为三组(见Dure 1989)。全部三组这些蛋白质已经在 正在成熟(即正在干燥)的种子中得到证实。在这3类蛋白质中,II型(脱水 素(dehydrin)-型)通常在植物营养部分中在干旱和/或干燥耐受性方面发挥 作用(例如Mundy和Chua,1988;Piatkowski 1990;Yamaguchi-Shinozaki 1992)。最近,发现烟草中表达的III型LEA(HVA-1)可影响植物高度、成 熟度和干旱耐受性(Fitzpatrick,1993)。因此,表达来自全部三组的结构基 因可以赋予干旱耐受性。在水胁迫期间被诱导的其他类型蛋白质包括可以 在干旱胁迫期间赋予多种保护型功能和/或修复型功能的巯基蛋白酶、醛缩 酶和跨膜转运蛋白(Guerrero 1990)。执行脂类生物合成因此影响膜组成的 基因的表达还可以用来赋予植物干旱抗性。

改善干旱抗性的众多基因具有互补性作用模式。因此,这些基因的组 合可能在改善玉米的干旱抗性方面具有加成效应和/或协同效应。众多的这 些基因还改善冰冻耐受性(或抗性);在冰冻和干旱期间发生的物理胁迫在 本质上是相似的并且可以以类似方式减轻。可以通过这些基因的组成型表 达或组织特异性表达而受益,但是表达这些新基因的优选方式可以是利用 膨压诱导型启动子(如用于膨压诱导型基因的启动子在Guerrero等1990和 Shagan 1993中描述)。这些基因的空间和时间表达模式可以使玉米更好地 忍受胁迫。

表达这样的基因是有益的,其中所述的基因参与允许增加从干燥土壤 中汲取水的特定形态学性状。例如,导入并表达改变根特征的基因可以增 强水摄取。表达在胁迫期间增强生殖适合度的基因将有明显的价值。例如, 表达改善花粉散播的同步性和雌性花部分(即穗丝)的接受性的DNA将有 意义。此外,表达在胁迫期间使谷粒败育最小化的基因将增加待收获的谷 粒量并且是有价值的。通过导入并表达具有适宜调节序列的异戊烯基转移 酶基因而调节单子叶植物(如玉米)中的细胞分裂素水平可以改善单子叶植 物的胁迫抗性和产量(Gan 1995)。

鉴于水在决定产量方面的重要作用,预计能够通过导入并表达新基因 而使植物更有效地利用水将改善整体性能,甚至当土壤水可用性无限制时 也是如此。通过导入这样的基因可以实现产量稳定性或均匀,其中所述的 基因改善植物在与水可用性有关的严重程度胁迫期间最大程度利用水的 能力。

改善植物免受非生物性胁迫因子如干旱、热或寒冷作用还可以如此实 现-例如通过过量表达来自短角床杜父鱼(Myoxocephalus Scorpius)(WO 00/00512)、多刺床杜父鱼(Myoxocephalus octodecemspinosus)的抗冻多肽、 拟南芥菜转录激活物CBF1、谷氨酸脱氢酶(WO 97/12983,WO 98/11240)、 钙依赖性蛋白激酶基因(WO 98/26045)、钙依赖性磷酸酶(WO 99/05902)、 来自酵母的酪蛋白激酶(WO 02/052012)、法尼基转移酶(WO 99/06580; Pei ZM等(1998)Science 282:287-290)、铁蛋白(Deak M等(1999)Nature Biotechnology 17:192-196)、草酸氧化酶(WO 99/04013;Dunwell JM (1998)Biotechn Genet Eng Rev 15:1-32)、DREB1A因子(“dehydration response element B 1A”;Kasuga M等(1999)Nature Biotech 17:276-286)、 甘露醇或海藻糖合成的基因如海藻糖-磷酸合酶基因或海藻糖-磷酸磷酸酶 基因(WO 97/42326)或通过对基因如海藻糖酶抑制(WO 97/50561)。

嵌合性转录调节序列的一个用途是保护胚在萌发期间免受冷损伤。一 个重要因子是氧化损害。超级启动子能够驱动即过氧化氢酶、抗坏血酸过 氧化物酶、超氧化物歧化酶等。寒冷还通过使膜硬化而影响COX酶活性。 对于干旱胁迫,表达谷氨酰胺合酶和甘氨酸甜菜碱合酶可能是有益的。

2.2.1.3疾病抗性和耐受性

提出可以通过将基因导入植物中实现疾病抗性增加。有可能对病毒、 细菌、真菌、根病原体、昆虫和线虫所引起的疾病产生抗性。还预计可以 通过表达导入的基因而实现控制产生霉菌毒素的生物。

病毒抗性可以通过表达新基因产生。例如,已经证实在转基因植物中 表达病毒衣壳蛋白可以赋予对病毒及可能其它亲缘关系密切的病毒感染 植物的抗性(Cuozzo 1988、Hemenway 1988、Abel 1986)。预计表达靶向病 毒必需功能的反义基因可以赋予对该病毒的抗性。例如,以负责复制病毒 核酸的基因为靶的反义基因可以抑制所述复制并产生病毒抗性。认为通过 使用反义基因而干扰病毒的其它功能还可以增加病毒抗性。另外,提出有 可能通过其它方法(包括但不限于使用卫星病毒)实现病毒抗性。

提出可以通过导入新基因实现对细菌和真菌所致疾病的抗性的增加。 预计可使用编码所谓“肽抗生素”、致病相关蛋白(PR)、毒素抗性和影响宿 主-病原体相互作用如形态学特征的蛋白质的基因。肽抗生素是抑制细菌和 其它微生物生长的多肽序列。例如,称作杀菌肽和蛙皮素的肽类抑制众多 种类的细菌和真菌生长,提出PR蛋白在植物中的表达可以用于赋予细菌 性疾病抗性。这些基因在病原体侵袭宿主植物后被诱导并且分成至少5类 蛋白质(Bol 1990)。在PR蛋白中包括β-1,3-葡聚糖酶、几丁质酶和渗透蛋 白以及认为对植物抵抗病原生物有作用的其它蛋白质。已经鉴定了具有抗 真菌特性的其它基因,例如UDA(荨麻(stinging nettle)凝集素)和橡胶蛋白 (Broakgert 1989;Barkai-Golan 1978)。已知某些植物疾病因植物毒素的产 生而引起。可以通过如此方式实现对这些疾病的抗性,即表达编码能够降 解植物毒素或使植物毒素失活的酶的新基因。表达改变宿主植物与病原体 之间相互作用的新基因可以用于减少疾病生物侵入宿主植物组织的能力, 例如增加叶角质层蜡质或其它形态学特征。

植物寄生性线虫是众多植物中的病因。提出有可能通过表达新基因而 使植物抵抗这些生物。预期控制线虫感染将通过改变线虫识别或黏着宿主 植物的能力和/或使植物能够产生杀线虫化合物(包括但不限于蛋白质)而完 成。

此外,对真菌、昆虫、线虫和疾病的抗性可以通过定向地累积某些代 谢物或蛋白质而实现。此类蛋白质包括但不限于芥子油苷(抗食草动物防 御)、几丁质酶或葡聚糖酶和摧毁寄生虫细胞壁的其它酶、核糖体失活蛋白 (RIP)和(如当植物受到伤害或微生物侵袭时或化学方式(例如通过水杨酸、 茉莉酮酸或乙烯)所诱导的)植物抗性和胁迫反应的其它蛋白质,或来自非 植物源的溶菌酶例如T4-溶菌酶或来自多种哺乳动物的溶菌酶、杀虫蛋白 如苏云金芽孢杆菌内毒素、α-淀粉酶抑制物或蛋白酶抑制物(豇豆胰蛋白酶 抑制物)、集素如小麦胚凝集素、RNA酶或核酶。其它实例是编码哈茨木 霉(Trichoderma harzianum)chit42内切几丁质酶(GenBank登录号: S78423)或来自高粱的N-羟基化多功能细胞色素P-450(CYP79)蛋白质 (GenBank登录号:U32624),或这些蛋白质的功能等同物的核酸。累积作 为抗害虫保护的芥子油苷(Rask L等(2000)Plant Mol Biol 42:93-113; Menard R等(1999)Phytochemistry 52:29-35)、表达苏云金芽孢杆菌内毒素 (Vaeck等(1987)Nature 328:33-37)或通过表达几丁质酶(例如来自绿豆 (bean))而保护免受真菌侵袭(Broglie等(1991)Science 254:1194-1197)是有 利的。害虫(例如稻植物中的稻害虫褐稻虱(Nilaparvata lugens))抗性可以通 过表达雪钟花(Galanthus nivalis)凝集素(agglutinin)(Rao等(1998)Plant J 15(4):469-77)而实现。表达编码鳞翅目昆虫特异性苏云金芽孢杆菌D-内毒 素的合成性基因cryIA(b)和cryIA(c)可以在多种植物中引起害虫抗性 (Goyal RK等(2000)Crop Protection 19(5):307-312)。适用于防御病原体的 其它靶基因包含“聚半乳糖醛酸酶抑制蛋白”(PGIP)、非洲甜果素、转化 酶和抗微生物肽(如乳铁蛋白)(Lee TJ等(2002)J Amer Soc Horticult Sci 127(2):158-164)。可以利用于本文中的其它核酸序列包括用于昆虫控制的 性状(美国专利号6,063,597;6,063,756;6,093,695;5,942,664及6,110,464)、 真菌疾病抗性(美国专利号5,516,671;5,773,696;6,121,436;6,316,407及 6,506,962)、病毒抗性(美国专利号5,304,730及6,013,864)、线虫抗性(US 6,228,992)和细菌疾病抗性(US 5,516,671)。

待表达的异源核酸序列可以编码胁迫相关多肽(或其部分;优选至少5 个、更优选至少10个、最优选至少30个连续氨基酸的一部分)。优选的嵌 合性转录调节核苷酸序列在上文描述。

2.2.2提高的种子或籽苗营养品质

所述嵌合性转录调节核苷酸序列(可以优选地用来向转化的单子叶植 物赋予提高(或增强)的种子或籽苗营养品质。因此,本发明的另一个实施 方案涉及用于向单子叶植物赋予提高的种子或籽苗营养品质和/或油含量 的方法,所述方法包括步骤

A)向植物导入表达构建体,所述的构建体包含编码植物转录调节序 列的多核苷酸和与其有效连接的至少一个核酸,其中编码转录调节序列的 多核苷酸包含

i)选自以下的第一核酸分子

a)如SEQ ID NO:1中定义的多核苷酸;

b)与SEQ ID NO:1的多核苷酸具有至少50%、优选至少60%、70% 或80%、更优选至少85%或90%、最优选至少95%、98%或99%序列同 一性的多核苷酸;和

c)在下述条件下与包含如SEQ ID NO:1中定义的多核苷酸中至少50 个核苷酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于:在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在 50℃于2×SSC,0.1%SDS中洗涤、更优选在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS 中洗涤、更优选在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、更优选在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于0.1×SSC,0.1%SDS中洗涤,并且最优选在50℃于7%十二烷基硫酸 钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1% SDS中洗涤,和与其有效连接的

ii)第二核酸分子,其选自以下多核苷酸

a)如SEQ ID NO:3中定义的多核苷酸;

b)与SEQ ID NO:3的多核苷酸具有至少50%、优选至少60%、70% 或80%、更优选至少85%或90%、最优选至少95%、98%或99%序列同 一性的多核苷酸;和

c)在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于:在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于2×SSC,0.1%SDS中洗涤,更优选在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS中洗涤、 更优选在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、更优选在50℃于7%十 二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 0.1×SSC,0.1%SDS中洗涤,并且最优选在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1%SDS 中洗涤,

并且与至少一个核酸有效连接,其中所述的至少一个核酸与所述第一 或第二核酸序列是异源的,并且适用于向植物赋予提高的种子或籽苗营养 品质和/或油含量,和

B)选择转基因植物,其中与野生型或无效分离子植物相比较,所述的 植物具有提高的种子或籽苗营养品质和/或油含量。

所述的营养品质和/或油含量可以包括选自维生素、类胡萝卜素、抗氧 化剂、不饱和脂防酸和多不饱和脂防酸至少一种化合物的含量提高。待表 达的异源核酸序列(例如作为有义、反义或双链RNA表达)可以编码如下文 描述的性状相关多肽(或其部分;优选地是至少5个、更优选至少10个、 最优选至少30个连续氨基酸的部分)或其功能等同物,其中所述的功能等 同物能够带来与任一所述多肽所致的相同表型。优选的嵌合性转录调节核 苷酸序列在上文描述。

所述的营养品质和待表达的相应异源核酸序列优选地如下文定义。优 选的嵌合性转录调节核苷酸序列在上文描述,最优选是超级启动子。优选 适用于本发明方法的单子叶植物可以选自玉米、小麦、稻、大麦、燕麦、 黑麦、高粱、黑麦草或薏苡。优选地,该植物是选自玉米、小麦、大麦、 稻、燕麦、黑麦和高粱的禾谷类植物,甚至更优选地来自玉米、小麦和稻, 最优选地,该植物是玉米植物。

提高的营养品质可以例如导致一种或多种如下特性:调节植物中的脂 肪酸组成、改变植物的氨基酸含量、提高植物代谢物的浓度。

基因可以导入单子叶植物,尤其商业重要的禾谷类植物,如玉米、小 麦或稻,以改良谷粒,其中主要为获得所述谷粒而种植该禾谷类植物。根 据谷粒的最终具体用途,可以预见种类广泛的以这种方式产生的新颖转基 因植物。

例如,玉米谷粒的最大用途是饲料或食品。导入改变谷粒成分的基因 可以明显增强饲料价值或食品价值。玉米谷粒的主要成分是淀粉、蛋白质 和油。玉米谷粒的这些主要成分中的每一种可以通过改变其水平或组成加 以改良。可以提及数个用于说明目的的实例,但是无论如何不是提供对可 能性的穷举。

就饲料和食品目的而言,多种谷类谷粒的蛋白质是次优的,尤其用于 猪、家禽和人食用时。蛋白质在这些物种的饮食中的数种必需氨基酸上有 缺陷,需要向谷粒添加补充物。受限的必需氨基酸可以包括赖氨酸、甲硫 氨酸、色氨酸、苏氨酸、缬氨酸、精氨酸和组氨酸。某些氨基酸仅在谷粒 以用于饲料配合的其它输入物补充后才变成受限的。例如,当时谷粒用豆 粕补充以满足赖氨酸要求时,甲硫氨酸变成受限的。种子和谷粒内这些必 需氨基酸的水平可以通过如此机制提高,所述的机制包括,但不限于导入 增加氨基酸生物合成的基因、减少氨基酸降解、增加蛋白质中氨基酸的贮 藏或增加氨基酸转运至种子或谷粒内。

用于增加氨基酸生物合成的一个机制是导入解除氨基酸生物合成途 径中受控制的基因以至于植物不再能够充分控制氨基酸的产生水平。这可 以通过解除控制氨基酸生物合成途径中通常受途径内氨基酸终产物水平 调节的步骤或绕过所述步骤而完成。实例包括导入编码用于增加赖氨酸和 苏氨酸产生的解除控制形式的天冬氨酸激酶或二氢吡啶二羧酸(DHDP)合 酶和用于增加色氨酸产生的邻氨基苯甲酸合酶的基因。减少氨基酸的代谢 可以通过导入减少或消除编码酶的基因表达的DNA序列完成,其中所述 的酶催化分解代谢途径中的步骤,如赖氨酸-酮戊二酸还原酶。

谷粒的蛋白质组成可以用多种方式加以改变以改善氨基酸的平衡,所 述方式包括提高天然蛋白质的表达、降低那些具有不良组成的天然蛋白质 的表达、改变天然蛋白质的组成或导入编码具有优异组成的全新蛋白质的 基因。可以导入降低贮藏蛋白中玉米醇溶蛋白家族成员表达的DNA。这种 DNA可以编码旨在破坏玉米醇溶蛋白表达或破坏玉米醇溶蛋白表达的调 节物(如不透明-2基因产物)表达的核酶或反义序列。谷粒的蛋白质组成可 以通过共抑制现象(即通过表达经转化作用导入的相同结构性基因或基因 片段而抑制内源基因的表达)进行修饰(Goring 1991)。此外,导入的DNA 可以编码降解玉米醇溶蛋白的酶。所实现的玉米醇溶蛋白表达降低可以伴 随增加具有更希望的氨基酸组成的蛋白质以及增加种子其它主要成分如 淀粉。或者,可以导入嵌合基因,其中该嵌合基因包含具有适当氨基酸组 成的天然蛋白质(如玉米中球蛋白的一种或10kD玉米醇溶蛋白)的编码序 列以及设计旨在提高所述蛋白质表达的启动子或其它调节序列。所述基因 的编码序列可以包括必需氨基酸的额外密码子或替换密码子。此外,可以 使用从其它物种中获得的编码序列,或编码完全独特的肽序列的部分或完 全合成的序列,其中所述肽序列的设计目的旨在增强种子的氨基酸组成。

导入改变谷粒油含量的基因可以是有价值的。油含量增加可以导致增 加用于饲料和食品中的种子的可代谢能量含量及密度。导入的基因可以编 码移除或减弱脂肪酸或脂类生物合成中限速步骤或受调节步骤的酶。此类 基因可以包括,但不限于编码乙酰CoA羧化酶、ACP-酰基转移酶、β-酮 酰基-ACP合酶和其它众所周知的脂肪酸生物合成活性的那些基因。其它 可能基因是编码无酶活性的蛋白质如酰基载体蛋白的基因。额外的实例包 括2-乙酰基转移酶、油质蛋白丙酮酸脱氢酶复合体、乙酰CoA合成酶、 ATP柠檬酸裂合酶、ADP-葡萄糖焦磷酸化酶和涉及肉碱CoA-乙酰-CoA 穿梭的基因。预计使用质体转运肽序列并且优选地在种子胚中表达,将使 与油生物合成有关的基因的表达导向质体。可以导入改变存在于油中的脂 肪酸平衡的基因,提供更有益健康或更有营养的饲料原料。导入的DNA 还可以编码这样的序列,该序列阻遏参与脂肪酸生物合成的酶的表达,从 而如下所述改变存在于谷粒中的脂肪酸的比例。

可以导入增强谷粒中淀粉成分的营养价值的基因,例如通过增加分支 程度,从而因延缓淀粉代谢而导致淀粉在奶牛中利用的改善。

除了影响谷粒的主要成分之外,可以导入影响饲料或食品用谷粒的多 种其它养分方面、加工方面或其它品质方面的基因。例如,可以增加或减 少谷粒的色素形成。某些动物饲料中黄色色素形成的增强和稳定性是受到 欢迎的并可以通过导入这样的基因而实现,其中所述的基因通过消除叶黄 素及胡萝卜素产生中的限速步骤而导致增强产生叶黄素和胡萝卜素。此类 基因可以编码改变形式的八氢番茄红素合酶、八氢番茄红素去饱和酶或番 茄红素合酶。或者,无色素的白色玉米是众多食品产品产生所需要的并且 可以通过导入阻遏或消除色素产生途径中的步骤的DNA而产生。

包含一些谷类谷粒的饲料或食品具有不充分量的维生素并且必须进 行补足以提供合适的营养价值。可以设想导入增强种子中维生素生物合成 的基因,包括例如维生素A、E、B12、胆碱等。例如,玉米谷粒也不具有 用于最佳营养价值的充分矿物质含量。影响含磷、硫、钙、锰、锌和铁等 的化合物累积或可用性的基因是有价值的。实例可以是导入减少植酸生产 或编码植酸酶的基因,这增强植酸分解。这些基因将增加食物中的可用磷 酸盐水平,减少用矿物磷酸盐作补充的需要。

可描述为饲料和食品目的而改良谷物的众多其它实例。改良可以实际 上甚至不涉及谷粒,然而可以例如改善谷粒的青贮价值。为此目的所导入 的DNA可以包括改变木质素产生的序列,如导致与牛的优良饲用价值相 关的“棕色中脉(brown midrib)”表型的那些序列。

除了指导改良饲料价值或食品价值外,还可以导入这样的基因,该基 因改善谷粒加工并改善从加工中所产生产品的价值。加工某些谷粒如玉米 的主要方法是湿磨法。玉米可以通过新基因的表达受到改良,其中所述的 新基因提高加工效率并降低加工成本(如通过减少浸泡时间)。

改善湿磨法产物的价值可以包括改变淀粉、油、玉米面筋粉的数量或 品质或玉米淀粉渣的成分。可以如此实现淀粉的升高,即通过鉴定并消除 淀粉生物合成中的限速步骤或通过降低谷粒其它成分水平,从而导致成比 例地增加淀粉。前者的实例可以是导入这样的基因,该基因编码具有改变 的调节活性或在更高水平上表达的ADP-葡萄糖焦磷酸化酶。后者的实例 可以包括在谷粒发育晚期期间表达的例如蛋白质生物合成或油生物合成 的选择性抑制物。

油是玉米和其它谷物的另一种湿磨法产物,其价值可以通过导入并表 达基因加以改善。能够通过湿磨法提取的油量可以通过如以上对饲料和食 品所述的方法加以提高。也可以改变油的特性以改善油在食用油、起酥油、 润滑油或其它的油衍生性产物的生产和使用中的性能或改善其在用于食 品相关性应用中的健康特性。还可以合成可在提取后充当化学合成原材料 的新脂肪酸。油特性的改变可以通过改变存在于油中的脂肪酸的类型、水 平或脂类排列而实现。这又可以通过添加编码酶的基因(其中所述的酶催化 新脂肪酸和含有新脂肪酸的脂类合成)或通过提高天然脂肪酸的水平,与此 同时可能降低前体的水平而完成。或者,可以导入这样的DNA序列,其 延缓或阻断脂肪酸生物合成中的步骤,导致前体脂肪酸中间体增加。可以 添加的基因包括去饱和酶、环氧酶、水合酶、脱水酶和催化涉及脂肪酸中 间体的反应的其它酶。可以被阻断的催化步骤的代表性实例包括从硬脂酸 至油酸和从油酸至亚麻酸的去饱和步骤,阻断所述步骤导致相应地累积硬 脂酸酸和油酸。

也可以通过导入用来获得新植物的基因实现改良其它的谷物湿磨法 产物、面筋粉和玉米淀粉渣。代表性的可能方式包括但不限于以上对改善 食品价值和饲料价值所述的那些方式。

此外,还可以考虑应当使用植物来产生或制造植物中先前根本不产生 或不以这个水平产生的有用生物化合物。可能通过转化方法导入并表达基 因而制备产生这些化合物的新植物。有可能包括,但不限于目前通过任何 生物所产生的任一生物化合物,如蛋白质、核酸、初级代谢物和中间代谢 物、糖类聚合物等。化合物可以由植物产生、在收获和/或加工后提取并且 用于任何目前认识到的有用目的,如药物、香料、工业用酶,不一而足。

作为由转基因植物中导入的基因所潜在编码的谷粒性状或特性范围 的其它可能例证包括因导入增强γ-玉米醇溶蛋白合成的基因而具有较少 易断性的出口用谷粒或在干磨法加工时具有较大粒度的谷粒、因增加囊果 皮厚度的基因而具有改良的爆裂性、品质和膨胀体积的爆花玉米、因导入 有效阻断参与色素产生途径的酶发生表达的基因而具有食品用白色谷粒 的玉米以及因导入影响风味的基因如甜玉米矮缩基因(编码蔗糖合酶)而改 善的酒精饮料或甜玉米品质。

可以与本发明的启动子核酸序列组合并改良终产物性状的有用核酸 序列包括但不限于编码种子贮藏蛋白、脂肪酸途径酶、生育酚生物合成酶、 氨基酸生物合成酶和淀粉分支酶的那些基因。对用于改良植物表型的示例 性异源DNA的讨论可以在例如美国专利号6,194,636;6,207,879; 6,232,526;6,426,446;6,429,357;6,433,252;6,437,217;6,515,201;和6,583,338 以及PCT公开WO 02/057471中找到,所述每篇文献具体地在本文中完 整引用作为参考。所述性状包括但不限于:

-用于食品和饲料领域内的代谢酶(如植酸酶和纤维素酶)的表达。尤其 优选核酸,如编码微生物植酸酶的人工cDNA(GenBank登录号:A19451) 或其功能等同物。

-引起精细化学品如生育酚、生育三烯酚或类胡萝卜素累积的基因的 表达。可以提到的实例是八氢番茄红素去饱和酶。优选编码黄水仙 (Narcissus pseudonarcissus)八氢番茄红素去饱和酶的核酸(GenBank登录 号:X78815)或其功能等同物。优选的生育酚生物合成酶包括tyrA、slr1736、 ATPT2、dxs、dxr、GGPPS、HPPD、GMT、MT1、tMT2、AANT1、slr 1737和用于尿黑酸双加氧酶的反义构建体(Kridl等(1991);Keegstra (1989);Nawrath等(1994);Xia等(1992);Lois等(1998);Takahashi等(1998); Norris等(1998);Bartley和Scolnik(1994);Smith等(1997);WO 00/32757; WO 00/10380;Saint Guily等(1992);Sato等(2000)),全部文献在本文中 引用作为参考。

-淀粉生产(美国专利号5,750,876和6,476,295)、高量蛋白质生产(US 6,380,466)、果实成熟(US 5,512,466)、增强的动物及人营养(美国专利号 5,985,605和6,171,640)、生物聚合物(US 5,958,745和美国专利公开号 2003/0028917)、环境胁迫抗性(US 6,072,103)、药学肽(US 6,080,560)、改 良的加工性状(US 6,476,295)、改善的消化性(US 6,531,648)、低棉子糖(US 6,166,292)、工业用酶生产(US 5,543,576)、改善的风味(US 6,011,199)、固 氮(US 5,229,114)、杂交种子生产(US 5,689,041)和生物燃料生产(US 5,998,700),其中在以上所列专利中描述的遗传元件和转基因在本文中引用 作为参考。优选的淀粉分支酶(用于改良淀粉特性)包括在美国专利号 6,232,122和6,147,279;和PCT公开WO 97/22703中所述的那些淀粉分支 酶,全部文献在本文中引用作为参考。

-改变的油生产(US 6,444,876)、高量油生产(美国专利号5,608,149 和6,476,295)或改变的脂肪酸含量(US 6,537,750)。优选的脂肪酸途径酶包 括硫酯酶(美国专利号5,512,482;5,530,186;5,945,585;5,639,790; 5,807,893;5,955,650;5,955,329;5,759,829;5,147,792;5,304,481;5,298,421; 5,344,771;和5,760,206)、二酰甘油酰基转移酶(美国专利公开 20030115632A1和20030028923A1)和去饱和酶(美国专利号5,689,050; 5,663,068;5,614,393;5,856,157;6,117,677;6,043,411;6,194,167;5,705,391; 5,663,068;5,552,306;6,075,183;6,051,754;5,689,050;5,789,220;5,057,419; 5,654,402;5,659,645;6,100,091;5,760,206;6,172,106;5,952,544;5,866,789; 5,443,974和5,093,249),其中全部文献在本文中引用作为参考。

-优选的氨基酸生物合成酶包括邻氨基苯甲酸合酶(US 5,965,727和 PCT公开WO 97/26366,WO 99/11800,WO 99/49058)、色氨酸脱羧酶(PCT 公开WO 99/06581)、苏氨酸脱羧酶(美国专利号5,534,421和5,942,660; PCT公开WO 95/19442)、苏氨酸脱氨酶(PCT公开WO 99/02656和WO 98/55601)、二氢吡啶二羧酸合酶(US 5,258,300)和天冬氨酸激酶(美国专利 号5,367,110;5,858,749和6,040,160),其中全部文献在本文中引用作为参 考。

-通过脂肪酸延伸酶和/或去饱和酶的表达生产营养品,例如多不饱和 脂肪酸(例如花生四烯酸、二十碳五烯酸或二十二碳六烯酸),或产生具有 改良的营养价值例如具有高含量的必需氨基酸(例如巴西坚果树(brazil nut)的高-甲硫氨酸2S白蛋白基因)的蛋白质。优选这样的核酸,其编码巴 西坚果树(Bertholletia excelsa)高-甲硫氨酸2S白蛋白(GenBank登录号: AB044391)、小立碗藓Δ6-酰基-脂去饱和酶(GenBank登录号:AJ222980; Girke等(1998))、高山被孢霉(Mortierella alpina)Δ6-去饱和酶(Sakuradani 等(1999))、秀丽隐杆线虫(Caenorhabditis elegan)Δ5-去饱和酶(Michaelson 等(1998))、秀丽隐杆线虫Δ5-脂肪酸去饱和酶(des-5)(GenBank登录号: AF078796)、高山被孢霉Δ5-去饱和酶(Michaelson等JBC 273:19055-19059)、秀丽隐杆线虫Δ6-延伸酶(Beaudoin等,2000)、小立碗 藓Δ6-延伸酶(Zank等,2000)或这些蛋白质的功能等同物。

-产生用于工业目的的高质量蛋白质和酶(例如酶,如脂肪酶)或药物 (例如,抗体、凝血因子、干扰素、淋巴因子、集落刺激因子、纤溶酶原激 活剂、激素或疫苗,如Hood EE和Jilka JM(1999)所述的)。例如,已经 有可能在转基因玉米植物中大规模产生来自鸡卵清内的重组抗生物素蛋 白和细菌的β-葡糖醛酸糖苷酶(GUS)(Hood等,1999)。

-例如通过表达乙酰CoA羧化酶获得在通常包含较少贮藏蛋白或贮 藏脂类的细胞内增加的贮藏性,其目的是增加这些物质的产量。优选的核 酸是编码紫苜蓿(Medicago sativa)乙酰CoA羧化酶(ACC酶)(GenBank登 录号:L25042)的那些核酸,或其功能等同物。或者,在某些情况下,增加 贮藏蛋白含量可能对生产高量蛋白质产物有利。优选的种子贮藏蛋白包括 玉米醇溶蛋白(美国专利号4,886,878;4,885,357;5,215,912;5,589,616; 5,508,468;5,939,599;5,633,436;和5,990,384;PCT公开WO 90/01869、 WO 91/13993、WO 92/14822、WO 93/08682、WO 94/20628、WO 97/28247、 WO 98/26064和WO 99/40209)、7S蛋白质(美国专利号5,003,045和 5,576,203)、巴西坚果树蛋白(US 5,850,024)、无苯丙氨酸的蛋白质(PCT公 开WO 96/17064)、白蛋白(PCT公开WO 97/35023)、β-伴大豆球蛋白(PCT 公开WO 00/19839)、11S(US 6,107,051)、α-大麦硫素(hordothionin)(美国 专利号5,885,802和5,88,5801)、arcelin种子贮藏蛋白(US 5,270,200)、凝 集素(US 6,110,891)和麦谷蛋白(美国专利号5,990,389和5,914,450),其中 全部文献在本文中引用作为参考。

-降低α-葡聚糖L-型块茎磷酸化酶(GLTP)或α-葡聚糖H-型块茎磷酸 化酶(GHTP)酶活性的水平,优选地是在马铃薯块茎内(见US 5,998,701)。 马铃薯块茎内淀粉至糖的转化在表现降低的GLTP或GHTP酶活性的块 茎内减少,尤其马铃薯块茎在低于7℃贮藏时。减少马铃薯内的冷致甜作 用允许在更凉的温度下贮藏马铃薯,导致休眠延长、降低疾病发生率并增 加贮藏期。降低马铃薯块茎内GLTP或GHTP的活性可以通过如使用同 源性反义RNA或双链RNA抑制基因表达、利用共抑制、调节性沉默序列 的技术而实现。具有改良冷贮藏特征的马铃薯植物包含用如此表达盒转化 的马铃薯植物,其中所述的表达盒具有与DNA序列有效连接的TPT启动 子序列,其中所述的DNA序列包含编码选自α-葡聚糖L-型块茎磷酸化酶 (GLTP)和α-葡聚糖H-型磷酸化酶(GHTP)的α-葡聚糖磷酸化酶的基因的 至少20个核苷酸。

有利基因的其它实例在例如Dunwell JM,Transgenic approaches to crop improvement,J Exp Bot.2000;51Spec No;第487-96页提到。对 用于改良植物表型的示例性异源DNA的讨论可以在例如美国专利号 6,194,636中找到。

本发明的另一个方面提供这样的DNA构建体,所述DNA构建体中具 有淀粉胚乳和/或萌芽胚特异性或优先地表达的启动子驱动基因抑制性 DNA元件,其目的是例如抑制氨基酸分解代谢酶。

种子成熟或谷粒发育指始于受精并止于种子干燥的时间段,其中可代 谢性食物储备(例如蛋白质、脂类、淀粉等)沉积在正在发育的种子中,尤 其沉积在种子的贮藏器官内,所述的贮藏器官包括胚乳、种皮、糊粉层、 胚和盾片上皮,导致种子增大和充实,并且以种子干燥为结束。

本发明的胚特异性启动子可以用于使产量滞后和对玉米生长和发育 的其它潜在不利生理影响最小化,其中所述的不利生理影响可能因在植物 中转基因蛋白质或其它分子的高水平非诱导的组成型表达而遭遇。当每种 转基因与本发明启动子融合时,可以使DNA序列同源性依赖的转基因失 活(共抑制)的风险最小化。

使DNA本身定位在细胞内可能有用。例如,导入的DNA定位在细胞 核内可能是有用的,因为这可以增加转化频率。在细胞核内,为了实现位 点特异性整合,以基因为靶是有用的。例如,使经过转化作用所导入的基 因替换细胞内现存的基因将是有用的。其它元件包括可以受内源性介质或 外源性物质(例如受锌指蛋白,包括天然存在的锌指蛋白或嵌合的锌指蛋白 (见,例如US 5,789,538,WO 99/48909;WO 99/45132;WO 98/53060;WO 98/53057;WO 98/53058;WO 00/23464;WO 95/19431和WO 98/54311) 或Myb样转录因子)调节的那些元件。嵌合的锌指蛋白可以包括结合至特 定DNA序列的氨基酸序列(锌指)以及激活(例如GAL 4序列)或抑制与这 种特定DNA序列连接的序列转录的氨基酸序列。

为本发明目的,对目的基因的一般分类例如包括与信息有关的那些基 因如锌指基因、与通信有关的那些基因如激酶基因,和与持家有关的那些 基因如热休克蛋白基因。更具体的转基因分类包括这样的基因,其编码对 农学品质、昆虫抗性、疾病抗性、除草剂抗性和谷粒特征重要的性状。其 它的转基因分类包括诱导来自植物和其它真核生物以及来自原核生物的 外源产物(如酶、辅因子和激素)表达的基因。已经认识到任一目的基因可 以有效地与本发明的启动子连接并在胁迫下得以表达。

在一个更优选的实施方案中,本发明的启动子调节这样的基因,该基 因编码充当细胞周期调节物或控制糖代谢或植物激素水平的蛋白质,这一 点已经在具有其它组织优选的启动子的烟草和卡诺拉油菜(canola)中证实 (Ma,Q.H.等,1998;Roeckel,P.等,1997)。例如,编码异戊烯基转移酶 或IAA-M的基因可以用于调节雌性小花枝的发育。其它重要的基因编码 生长因子和转录因子。表达受启动子指导的所选择内源核苷酸或异源核苷 酸可以引起雌性小花枝在不利条件下持续或改善的发育。

种子产生可以通过改变在环境胁迫期间影响种子生长和发育应答的 基因(Cheikh-N等,1994)和控制糖代谢以减少玉米中种子败育(Zinselmeier 等,1995)的基因表达进行改善。

2.3靶向的序列切除

本发明的嵌合性转录调节核酸序列在单子叶植物中的特异性使其特 别用于从所述单子叶植物的基因组中定向地切除或缺失序列(如标记序 列)。现有技术中已知方法的一个已知缺点是在整个植物范围内切除的不均 一性,因此导致嵌合样的切除模式,这需要繁琐的额外选择和再生轮次。 本发明启动子在早期胚中的特异性允许遍及整个胚的均一性切除,随后将 提供无植物同源靶序列(例如标记)的植物。

本发明的另一个实施方案涉及用于从植物,优选地从单子叶植物切除 靶序列(例如标记序列)的方法,所述方法包括步骤

A)通过将编码嵌合性转录调节核苷酸序列的多核苷酸有效连接至至 少一个核酸序列而构建表达盒,其中所述的嵌合性转录调节核苷酸序列包 含

i)选自以下的第一核酸分子

a)如SEQ ID NO:1中定义的多核苷酸;

b)与SEQ ID NO:1的多核苷酸具有至少50%、优选至少60%、70% 或80%、更优选至少85%或90%、最优选至少95%、98%或99%序列同 一性的多核苷酸;

c)SEQ ID NO:1的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和

d)在下述条件下与包含如SEQ ID NO:1中定义的多核苷酸中至少50 个核苷酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于:在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在 50℃于2×SSC,0.1%SDS中洗涤、更优选在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS 中洗涤、更优选在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、更优选在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于0.1×SSC,0.1%SDS中洗涤,并且最优选在50℃于7%十二烷基硫酸 钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1% SDS中洗涤,和与其有效连接的

ii)第二核酸分子,其选自以下多核苷酸

a)如SEQ ID NO:3中定义的多核苷酸;

b)与SEQ ID NO:3的多核苷酸具有至少50%、优选至少60%、70% 或80%、更优选至少85%或90%、最优选至少95%、98%或99%序列同 一性的多核苷酸;

c)SEQ ID NO:3的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段,和

d)在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于:在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于2×SSC,0.1%SDS中洗涤,更优选在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS中洗涤、 更优选在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、更优选在50℃于7%十 二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 0.1×SSC,0.1%SDS中洗涤,并且最优选在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1%SDS 中洗涤,

其中所述的至少一个核酸序列相对于所述的嵌合性转录调节核苷酸 序列是异源的并且适于诱导从单子叶植物切除靶序列,和

B)将所述表达盒插入包含至少一个靶序列的单子叶植物以提供转基 因植物,其中所述的植物表达所述的异源核酸序列,和

C)选择表现出所述标记切除的转基因植物。

所述切除由多种方法实现,所述方法包括但不限于:

-使用位点特异性重组酶通过位点特异性重组而诱导序列缺失,其中 所述的位点特异性重组酶由本发明的嵌合性转录调节核苷酸序列表达,

-通过诱导的同源重组而诱导序列缺失,其中待缺失的序列在侧翼分 布有这样的序列,所述序列具有允许在它们之间发生同源重组的方向、足 够长度和相互同源性,其中同源重组因位点特异性核酸内切酶(优选归巢 核酸内切酶、更优选归巢核酸内切酶I-SceI)所产生的位点特异性双链断裂 而诱导,其中所述的位点特异性核酸内切酶由本发明的嵌合的转录调节核 苷酸序列表达。

本发明的另一个实施方案涉及植物,优选单子叶植物,或植物细胞, 它们包含

A)稳定整合至所述植物基因组的至少一个靶序列,其中所述的靶序 列在侧翼具有切除序列,该切除序列与介导序列特异性切除的酶相互作用 时能够介导从该植物基因组切除所述靶序列,和

B)包含至少一个核酸序列的表达盒,其中所述的核酸序列编码能够与 i)的所述切除序列相互作用的介导切除的酶,其中所述的核酸序列有效连 接至包含以下核酸分子的嵌合性转录调节核苷酸序列

i)选自以下的第一核酸分子

a)如SEQ ID NO:1中定义的多核苷酸;

b)与SEQ ID NO:1的多核苷酸具有至少50%、优选至少60%、70% 或80%、更优选至少85%或90%、最优选至少95%、98%或99%序列同 一性的多核苷酸;

c)SEQ ID NO:1的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和

d)在下述条件下与包含如SEQ ID NO:1中定义的多核苷酸中至少50 个核苷酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于:在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在 50℃于2×SSC,0.1%SDS中洗涤、更优选在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS 中洗涤、更优选在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、更优选在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于0.1×SSC,0.1%SDS中洗涤,并且最优选在50℃于7%十二烷基硫酸 钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1% SDS中洗涤,和与其有效连接的

ii)第二核酸分子,其选自以下多核苷酸

a)如SEQ ID NO:3中定义的多核苷酸;

b)与SEQ ID NO:3的多核苷酸具有至少50%、优选至少60%、70% 或80%、更优选至少85%或90%、最优选至少95%、98%或99%序列同 一性的多核苷酸;

c)SEQ ID NO:3的多核苷酸的至少50个连续碱基、优选至少100个 连续碱基、更优选200个连续碱基的片段;和

d)在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于:在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于2×SSC,0.1%SDS中洗涤,更优选在50℃于7%十二烷基硫酸钠(SDS)、 0.5M NaPO4、1mM EDTA中杂交并在50℃于1×SSC,0.1%SDS中洗涤、 更优选在50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA 中杂交并在50℃于0.5×SSC,0.1%SDS中洗涤、更优选在50℃于7%十 二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃于 0.1×SSC,0.1%SDS中洗涤,并且最优选在50℃于7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA中杂交并在65℃于0.1×SSC,0.1%SDS 中洗涤。

上文描述了包含编码嵌合性转录调节核苷酸序列的多核苷酸的优选 核酸分子。在下文描述待表达以实现序列切除的优选异源核酸序列(例如编 码位点特异性重组酶或核酸内切酶)。

优选适用于本发明方法的单子叶植物可以选自玉米、小麦、稻、大麦、 黑麦、谷子、高粱、黑麦草或薏苡、小黑麦或燕麦和甘蔗。优选地,所述 植物选自玉米、小麦、大麦、稻、燕麦、黑麦和高粱,甚至更优选地选自 玉米、小麦和稻,最优选地,该植物是玉米植物。

所述嵌合性转录调节核苷酸序列优选地如上定义。一旦所述植物的种 子萌发和胚开始生长,将切除在以上定义的单子叶植物或植物细胞中的靶 序列。无靶序列的植物将从这种胚产生。

靶序列和用于切除介导酶的表达盒可以组合于一个DNA中或在不同 的构建体上。不同DNA构建体可以通过其它方法于单子叶植物或单子叶 植物细胞的基因组中组合-例如,使分别包含所述靶序列和所述的用于切除 介导酶的表达盒的不同亲代株系杂交,或共转化或后继转化。

因此,本发明的另一个实施方案涉及用于从单子叶植物或植物细胞的 基因组中切除至少一个靶序列的方法,所述方法包括步骤

A)将包含至少一个靶序列的核酸构建体稳定插入基因组,其中所述 核酸构建体稳定插入植物基因组中,其中所述靶序列的侧翼为切除序列, 该切除序列能够在与序列特异性切除介导酶相互作用后介导从植物基因 组中切除所述靶序列,和

B)将包含至少一个编码介导切除的酶的核酸序列和与其有效连接的 嵌合性转录调节核苷酸序列的表达盒导入所述的单子叶植物或单子叶植 物细胞,其中所述的介导切除的酶能够与i)的所述切除序列相互作用,其 中所述的嵌合性转录调节核苷酸序列包含:

i)选自以下的第一核酸分子

a)如SEQ ID NO:1中定义的多核苷酸;

b)与SEQ ID NO:1的多核苷酸具至少50%序列同一性的多核苷酸; 和

c)在下述条件下与包含如SEQ ID NO:1中定义的多核苷酸中至少50 个核苷酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于:在 50℃于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在 50℃于2×SSC,0.1%SDS中洗涤,和与其有效连接的

ii)第二核酸分子,其选自以下多核苷酸

a)如SEQ ID NO:3中定义的多核苷酸;

b)与SEQ ID NO:3的多核苷酸具至少50%序列同一性的多核苷酸; 和

c)在下述条件下与包含如SEQ ID NO:3所描述序列的至少50个核苷 酸的核酸或其互补物杂交的多核苷酸,其中所述的条件等同于:在50℃ 于7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交并在50℃ 于2×SSC,0.1%SDS中洗涤,

C)产生包含所述靶序列和所述表达盒这两者的所述单子叶植物或植 物细胞的种子,萌发该种子并培育来自其的植物,和

D)选择切除了所述靶序列的植物。

在一个优选的实施方案中,本发明方法还包括再生能育植物的步骤。 所述方法还可以包括有性繁殖或无性繁殖或培育从所述植物细胞再生的 植物的子孙或后代。

优选地,靶序列的切除(或缺失)可以通过本领域已知的多种方法实 现,包括但不限于一个或多个如下的方法:

a)通过序列特异性重组酶诱导的重组,其中所述的靶序列以如此方式 在侧翼具有相应的重组位点,以至于在所述的侧翼重组位点之间的重组导 致从基因组中缺失侧翼重组位点之间的靶序列,

b)在所述靶序列侧翼分布的同源序列A和A’之间同源重组,其中在 同源序列之间的所述同源重组优选地由序列特异性核酸内切酶所产生的 序列特异性双链断裂诱导,其中所述的同源序列A和A’具有足够长度和 同源性以便确保A和A’之间发生同源重组,并具有这样的方向,当A和 A’之间重组时,所述方向将导致从所述植物的基因组中切除所述靶序列。

优选的切除序列和切除酶在以下详细描述。在另一个优选的实施方案 中,可以以如此方式诱导或激活缺失/切除机制以防止过早地缺失/切除双 功能标记。优选地,因此优选采用的序列特异性重组酶或核酸内切酶的表 达和/或活性可以被诱导和/或激活,优选地通过选自如下的方法:

a)通过将编码所述切除酶(例如重组酶或核酸内切酶)的序列有效连接 至与诱导型启动子或启动子元件组合的嵌合性转录调性序列而可诱导的 表达,

b)通过利用可诱导的、经修饰(例如包含配体结合结构域)的切除酶(例 如重组酶或核酸内切酶)而可诱导的激活,其中所述经修饰切除酶的活性可 以通过用具有对所述配体结合结构域的结合活性的化合物处理受到调节。

优选地,靶序列是一个标记,更优选地是一个选择标记(优选的标记序 列下文详述)。因此,本发明方法产生无选择标记的单子叶植物细胞或单子 叶植物。

2.3.1优选的切除序列和切除酶

为确保靶序列缺失/切除,靶序列在侧翼具有在与序列特异性切除介导 酶相互作用时能够介导从植物基因组中切除所述靶序列的切除序列。优选 地,靶序列的缺失可以通过本领域已知的多种方法实现,包括但不限于一 个或多个如下的方法:

a)通过序列特异性重组酶诱导的重组,其中所述的靶序列以如此方式 在侧翼具有相应的重组位点,以至于在所述的侧翼重组位点之间的重组导 致从基因组中缺失在侧翼重组位点之间的靶序列,

b)在所述靶序列侧翼分布的同源序列A和A’之间同源重组,其中在 同源序列之间的所述同源重组优选地由序列特异性核酸内切酶所产生的 序列特异性双链断裂诱导,其中所述的同源序列A和A’具有足够长度和 同源性以便确保A和A’之间发生同源重组,并具有这样的方向,当A和 A’之间重组时,所述方向将导致从所述植物的基因组中切除所述序列。

因此,为确保靶序列缺失/切除,靶序列在侧翼具有允许特异性地缺失 所述表达盒的序列。所述的序列可以是序列特异性重组酶的重组位点,其 中以如此方式安置所述的重组位点以至于在所述的侧翼重组位点之间的 重组导致从基因组中缺失所述靶序列。存在本领域中已知的多种重组位点 和相应的序列特异性重组酶(描述于下文),可以为本发明的目的而采用。

在另一个优选的实施方案中,靶序列的缺失/切除通过分子内(优选在 染色体内的)同源重组开展。同源重组可以天然发生,但是优选地由序列特 异性双链断裂(例如在同源序列之间)诱导。基本原理在WO 03/004659中公 开。为此目的,靶序列在侧翼具有同源序列A和A’,其中所述的同源序 列A和A’具有足够长度和同源性以便确保A和A’之间发生同源重组,并 具有这样的方向,当A和A’之间重组时,所述方向将导致从所述基因组 中切除所述序列。此外,在侧翼有所述同源序列的序列还包含具有至少10 个碱基对的至少一个识别序列,其中所述的识别序列用于通过序列特异性 DNA双链断裂诱导酶、优选序列特异性DNA核酸内切酶、更优选归巢核 酸内切酶、最优选选自I-SceI、I-CpaI、I-CpaII、I-CreI和I-ChuI的核酸 内切酶或其具有配体结合结构域的嵌合体而位点定向地诱导DNA双链断 裂。合适的核酸内切酶在下文描述。

2.3.1.1重组位点和重组酶

在本发明范围内适合的序列特异性重组酶和它们相应的重组位点可 以包括但不限于噬菌体P1的Cre/lox系统(Dale EC和Ow DW 1991; Russell SH等,1992;Osborne BI等,1995)、酵母FLP/FRT系统(Kilby NJ 等,1995;Lyznik LA等,1996)、Mu噬菌体Gin重组酶、大肠杆菌Pin 重组酶或质粒pSR1的R/RS系统(Onouchi H等,1995;Sugita Ket等, 2000)。所述重组酶(例如Cre或FLP)与其相应的重组序列(分别是34bp lox 序列和47bp FRT序列)特异性地相互作用以缺失或倒转位于所述重组序 列之间的序列。描述了植物中通过Cre缺失在侧翼具有两个lox序列的标 准选择标记(Dale EC和Ow DW 1991)。下表1中描述了用于适宜重组酶的 优选重组位点:

表1.合适的序列特异性重组酶

  重组酶   来源生物   重组位点   CRE   噬菌体P1   5’-AACTCTCATCGCTTCGGATAACTTC   CTGTTATCCGAAACATATCACTCACTT   TGGTGATTTCACCGTAACTGTCTATG   ATTAATG-3’   FLP   酿酒酵母   (Saccharomyces   cerevisiae)   5’-GAAGTTCCTATTCCGAAGTTCCTAT   TCTCTAGAA AGTATAGGAACTTC-3’   R   pSR1质粒   5’-CGAGATCATATCACTGTGGACGTTG

  重组酶   来源生物  重组位点  ATGAAAGAATACGTTATTCTTTCATCA  AATCGT

2.3.1.2同源序列

就同源序列(例如A,A’)而言,“足够长度”优选指具有至少20碱基对、 优选至少50碱基对、特别优选至少100碱基对、非常特别优选至少250 碱基对、最优选至少500碱基对长度的序列。

就同源序列(例如A,A’)而言,“足够同源性”优选指这样的序列,所 述的序列在这些同源序列中在至少20碱基对、优选至少50碱基对、特别 优选至少100碱基对、非常特别优选至少250碱基对、最优选至少500碱 基对长度的范围内具有至少70%、优选地80%、优选至少90%、特别优 选至少95%、非常特别优选地至少99%、最优选地100%同源性。

同源序列A和A’优选地以同向重复序列的形式排列。术语“同向重 复序列”意指两种序列在DNA分子的同一链上在相同方向上的连续定位, 其中这两种序列满足以上所给出的所述两个序列之间发生同源重组的条 件。

在一个优选的实施方案中,同源序列可以是DNA构建体中具有额外 用途的序列的复制。例如,同源序列可以是两个转录终止子序列。这两个 终止子序列中的一个序列可以有效地与具有农学价值的性状基因连接,而 另一个序列可以与存在于性状基因3’方向的双功能选择标记连接。在两个 终止子序列之间的重组将切除靶序列(例如标记基因),但是将重构性状基 因的终止子。在另一个实例中,同源序列可以是两个启动子序列。这两个 启动子序列中的一个序列可以有效地与具有农学价值的性状基因连接,而 另一个序列可以与性状基因5’-方向存在的靶序列(例如选择标记)连接。在 两个启动子序列之间的重组将切除靶序列(例如标记基因),但是将重构性 状基因的启动子。本领域技术人员知道同源序列没有必要限于单一功能性 元件(例如启动子或终止子),而可以包含或扩展到其它的序列(例如作为性 状基因编码区域的部分和所述性状基因的分别的终止子序列的部分)。

2.3.1.3.双链断裂诱导酶

优选地,靶序列(例如标记基因)的缺失/切除通过在以上所述同源序列 之间、优选在应当发生重组的同源序列之间由序列特异性双链断裂所诱导 的同源重组而实现。一般方法在例如WO 03/004659中公开,所述文献在 本文中完整引用作为参考。本领域中已知适用于诱导序列特异性双链断裂 的多种酶(本文以下统称为“核酸内切酶”)。核酸内切酶可以例如选自:

1.(II型)限制性核酸内切酶,优选如下文详述的归巢核酸内切酶。

2.转座酶,例如P-元件转座酶(Kaufman PD和Rio DC 1992)或 AcDs(Xiao YL和Peterson T 2000)。原则上,所有转座酶或整合酶是合适 的,只要它们具有序列特异性(Haren L等,1999;Beall EL,Rio DC 1997)。

3.如下文详述的嵌合核酸酶。

4.免疫系统中诱导双链断裂的酶,如RAG1/RAG2系统(Agrawal A 等,1998)。

5.II组内含子核酸内切酶。对内含子序列的修饰允许将II组内含子指 向双链DNA内的几乎任一序列,其中II组内含子可以随后借助逆剪接机 制插入(Mohr等,2000;Guo等,2000)。在这种逆剪接机制期间,双链断 裂被导入靶DNA内,已切除的内含子RNA切割有义链,同时II组内含 子核酸内切酶的蛋白质部分水解反义链(Guo等,1997)。当仅需要诱导双 链断裂而不实现彻底的逆剪接时,正如本发明的情况,有可能借助例如无 逆转录酶活性的II组内含子核酸内切酶。尽管这未阻止产生双链断裂,然 而逆剪接机制不能推进至完成。

合适的酶是天然酶和合成酶。优选的酶是其识别序列已知并且可以 以其蛋白质形式获得(例如通过纯化)或使用其核酸序列加以表达的全部核 酸内切酶。

在一个优选的实施方案中,使用序列特异性核酸内切酶用于特异性诱 导双链断裂并随后诱导同源重组。术语“序列特异性DNA核酸内切酶”通 常指全部的如此核酸内切酶,这些酶能够在双链DNA中于一个或多个识 别序列处以序列特异性方式生成双链断裂。所述的DNA切割可以产生 DNA的平端或所谓“粘端”(具有5”-或3’-突出端)。切割位点可以位于识别 序列内部或外部。可以采用多种类型的核酸内切酶。核酸内切酶可以属于 例如II类或IIs类型。IIs类R-M限制性核酸内切酶在识别位点之外的序 列处催化DNA切割,即它们在距离识别序列特定数目的核苷酸的DNA序 列处切割(Szybalski等,1991)。可以通过举例方式,但不是限制性方式提 到如下酶:

1.限制性核酸内切酶(例如I型或II型),优选如本文以下详述的归巢 核酸内切酶。

2.如本文以下详述的嵌合核酸酶或合成核酸酶。

与重组酶不同,限制性酶一般连接DNA,而仅切割DNA。限制性酶 例如在New England Biolabs在线目录(www.neb.com)、Promega在线目录 (www.promega.com)和Rao等(2000)描述。在本发明中,因核酸内切酶切 割产生的DNA末端的“连接”通过同源序列的同源重组引起的融合实现。

优选地,以如此方式选择核酸内切酶,从而该核酸内切酶的相应识别 序列是目标植物生物的未修饰基因组中稀有的,甚至是未曾出现过的。理 想地,在所述基因组中的唯一(数个)识别序列拷贝是由本发明的DNA构建 体导入的识别序列拷贝,因而消除了表达这种序列特异性核酸内切酶时切 除或使基因组中其他DNA重排的可能性。

选择合适核酸内切酶的一个标准是该核酸内切酶相应的识别序列的 长度。所述识别序列具有适宜长度以产生稀有切割,更优选仅在本发明的 DNA构建体中所包含的识别位点处切割。从统计观点看,决定所述识别序 列的最小长度的一个因素是宿主生物基因组的大小。在一个优选的实施方 案中,所述识别序列的长度是至少10碱基对、优选至少14碱基对、更优 选至少16碱基对、尤其优选至少18碱基对、最优选至少20碱基对。

切割10碱基对识别序列的限制性酶在Huang B等,1996中描述。

合适的酶是天然酶和合成酶。优选的酶是其识别序列已知并且可以 以其蛋白质形式获得(例如通过纯化)或使用其核酸序列进行表达的全部序 列特异性DNA核酸内切酶。

特别优选除了在转基因重组构建体内存在的识别序列之外,在特定真 核生物的染色体DNA序列内没有或仅有少量识别序列的限制性核酸内切 酶(限制性酶)。这避免了在基因组中在不需要的基因座处的其它双链断裂。 这是特别优选归巢核酸内切酶的原因(综述:(Belfort M和Roberts RJ 1997;Jasin M 1996;Internet: http://rebase.neb.com/rebase/rebase.homing.html)。由于其长的识别序列, 归巢核酸内切酶大多数情况下在真核生物的染色体DNA序列中没有或仅 有少量其他识别序列。

编码此类归巢核酸内切酶的序列可以例如从衣藻(Chlamydomonas)的 叶绿体基因组(Turmel M等,1993)分离。它们是小分子(18至26kD)并且 其可读框(ORF)具有直接适用于真核生物中胞核表达的“密码子使用频 率”(Monnat RJ Jr等,1999)。极特别优选加以分离的归巢核酸内切酶是归 巢核酸内切酶I-SceI(WO96/14408)、I-SceII(Sarguiel B等,1990)、 I-SceIII(Sarguiel B等,1991)、I-CeuI(Marshall 1991)、I-CreI(Wang J等, 1997)、I-ChuI(Cote V等,1993)、I-TevI(Chu等,1990;Bell-Pedersen等, 1990)、I-TevII(Bell-Pedersen等,1990)、I-TevIII(Eddy等,1991)、Endo SceI(Kawasaki等,1991)、I-CpaI(Turmel M等,1995a)和I-CpaII(Turmel M等,1995b)。

其他归巢核酸内切酶在以上提及的互联网站点详细描述,并且可以提 到的实例是归巢核酸内切酶如F-SceI、F-SceII、F-SuvI、F-TevI、 F-TevII、I-AmaI、I-AniI、I-CeuI、I-CeuAIIP、I-ChuI、I-CmoeI、 I-CpaI、I-CpaII、I-CreI、I-CrepsbIP、I-CrepsbIIP、I-CrepsbIIIP、 I-CrepsbIVP、I-CsmI、I-CvuI、I-CvuAIP、I-DdiI、I-DdiII、I-DirI、 I-DmoI、I-HmuI、I-HmuII、I-HspNIP、I-LlaI、I-MsoI、I-NaaI、 I-NanI、I-NclIP、I-NgrIp、I-NitI、I-NjaI、I-Nsp236IP、I-PakI、 I-PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrIP、I-PobIP、I-PorI、 I-PorIIP、I-PpbIP、I-PpoI、I-SPBetaIP、I-ScaI、I-SceI、I-SceII、 I-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-SexIP、I-SneIP、 I-SpomCP、I-SpomIP、I-SpomIIP、I-SquIP、I-Ssp6803I、I-SthPhiJP、 I-SthPhiST3P、I-SthPhiS3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、 I-UarAP、I-UarHGPA1P、I-UarHGPA13P、I-VinIP、I-ZbiIP、 PI-MtuI、PI-MtuHIP、PI-MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、 PI-PkoII、PI-PspI、PI-Rma43812IP、PI-SPBetaIP、PI-SceI、PI-TfuI、 PI-TfuII、PI-ThyI、PI-TliI、PI-TliII、H-DreI、I-BasI、I-BmoI、 I-PogI、I-TwoI、PI-MgaI、PI-PabI、PI-PabII。

在本上下文中优选的是已知其基因序列的归巢核酸内切酶,例如 F-SceI、I-CeuI、I-ChuI、I-DmoI、I-CpaI、I-CpaII、I-CreI、I-CsmI、 F-TevI、F-TevII、I-TevI、I-TevII、I-AniI、I-CvuI、I-DdiI、I-HmuI、 I-HmuII、I-LlaI、I-NanI、I-MsoI、I-NitI、I-NjaI、I-PakI、I-Porl、 I-PpoI、I-ScaI、I-Ssp6803I、PI-PkoI、PI-PkoII、PI-PspI、PI-TfuI、 PI-TliI。特别优选市售的归巢核酸内切酶,如I-CeuI、I-SceI、I-DmoI、 I-PpoI、PI-PspI或PI-SceI。具有极长识别序列并且因而在基因组中仅以 稀有方式(若存在)切割的核酸内切酶包括:I-CeuI(26bp识别序列)、 PI-PspI(30bp识别序列)、PI-SceI(39bp识别序列)、I-SceI(18bp识别序列) 和I-PpoI(15bp识别序列)。所述酶可以从其来源生物以技术人员熟悉的方 式分离,和/或可以克隆所述酶的编码核酸序列。多种酶的序列已保存在 GenBank。特别优选归巢核酸内切酶I-SceI、I-CpaI、I-CpaII、I-CreI和 I-ChuI。编码所述核酸酶的序列是本领域已知的并且例如在WO 03/004659 中详述(如作为WP 03/004659的SEQ ID NO:2、4、6、8和10,该文献以 引用方式并入本文)。

待表达的异源核酸序列可以优选地编码如SEQ ID NO:22所述的多肽 或其功能等同物,其中所述的功能等同物能够产生与所述任意多肽相同的 表型。最优选地,待表达的核酸序列由SEQ ID NO 21或23描述。

在一个优选的实施方案中,编码所述归巢核酸内切酶的序列可以通过 插入内含子序列进行修饰。这防止功能性酶在原核宿主生物中表达并且因 而促进(例如基于大肠杆菌或农杆菌的)克隆和转化过程。在植物生物中, 实现了功能性酶的表达,因为植物能够识别并“剪接”去掉内含子。优选地, 将内含子插入以上提到作为优选的归巢核酸内切酶(例如I-SceI或I-CreI) 的基因中。

在本发明的一些方面,可以利用分子演化来产生改良的核酸内切酶。 编码候选核酸内切酶的多核苷酸例如可以用DNA改组方法进行调整。 DNA改组是递归性重组和突变的过程,通过使相关基因集合的随机片段化 而进行,随后通过聚合酶链式反应样过程使片段再装配。见例如 Stemmer(1994);Stemmer(1994);和US 5,605,793、US 5,837,458、US 5,830,721和US 5,811,238。

可以通过举例方式提到的其他合成的核酸内切酶是由非特异性核酸 酶结构域和包含锌指的序列特异性DNA结合结构域组成的嵌合核酸酶 (Bibikova M等,2001)。这些结合DNA的锌指结构域可以加以改变以适 应于任意DNA序列。描述了用于制备适用锌指结构域的合适方法并且它 们是技术人员已知的(Beerli RR等,2000;Beerli RR等,2000;Segal DJ 和Barbas CF 2000;Kang JS和Kim JS 2000;Beerli RR等,1998;Kim JS等,1997;Klug A 1999;Tsai SY等,1998;Mapp AK等,2000;Sharrocks AD等,1997;Zhang L等,2000)。

优选地将所述核酸内切酶表达为具有核定位序列(NLS)的融合蛋白。 这种NLS序列能够促进输送至胞核并提高重组系统的效率。多种NLS序 列是技术人员已知的并且尤其由Jicks GR和Raikhel NV 1995描述。例如, 优选用于植物生物的是SV40大抗原的NLS序列。在WO 03/060133中提 供实例。然而,由于许多DSBI酶(例如归巢核酸内切酶)尺寸小,故而NLS 序列实际上并非必需。这些酶甚至在无任何协助时就能经过核孔。

在又一个优选的实施方案中,可以诱导所述核酸内切酶的活性。已经 描述了适用于序列特异性重组酶的方法(Angrand PO等,1998;Logie C 和Stewart AF 1995;Imai T等,2001)。这些方法利用核酸内切酶与针对 类固醇激素受体(例如,人雄激素受体或如本文中描述的人雌激素受体的突 变变体)的配体结合结构域的融合蛋白。诱导可以用配体例如雌二醇、地塞 米松、4-羟基他莫昔芬或雷洛昔芬实现。一些核酸内切酶作为二聚体(同二 聚体或异二聚体;I-CreI形成同二聚体;I-SecIV形成异二聚体)有活性 (Wernette CM 1998)。二聚化可以设计为诱导型特征,例如通过天然二聚 化结构域交换成低分子量配体结合结构域。二聚体配体的添加随后导致融 合蛋白的二聚化。已经描述了相应的诱导型二聚化方法和所述二聚体配体 的制备法(Amara JF等,1997;Muthuswamy SK等,1999;Schultz LW 和Clardy J 1998;Keenan T等,1998)。

本领域描述了序列特异性DNA核酸内切酶(例如归巢核酸内切酶)的 识别序列。“识别序列”指由本发明的序列特异性DNA核酸内切酶识别的 DNA序列。该识别序列的长度一般是至少10碱基对,更一般是10至30 碱基对长度并且在绝大多数的实施方案中,长度少于50碱基对。

“识别序列”一般指在本发明范围内所用的植物细胞中的条件下,能够 由序列特异性DNA-核酸内切酶识别并切割的那些序列。在下文表2中以 举例方式,而非限制性方式提及各自序列特异性DNA-核酸内切酶的识别 序列。

表2.核酸内切酶的识别序列和来源生物(例如归巢核酸内切酶;“^” 指示序列特异性DNA-核酸内切酶在识别序列中的切割位点).

  DSBI酶   来源生物   识别序列   P-元件   转座酶   果蝇(Drosophila)   5’-CTAGATGAAATAACATAAGGTGG-3’   I-AniI   构巢曲霉   (Aspergillus   nidulans)   5’-TTGAGGAGGTT^TCTCTGTAAATAANNNNNNN   NNNNNNNN   3’-AACTCCTCCAAAGAGACATTTATTNNNNNNNN   NNNNNNN^   I-DdiI   盘基网柄菌   (Dictyostelium   discoideum)AX3   5’-TTTTTTGGTCATCCAGAAGTATAT   3’-AAAAAACCAG^TAGGTCTTCATATA

  I-CvuI   小球藻(Chlorella   vulgaris)   5’-CTGGGTTCAAAACGTCGTGA^GACAGTTTGG   3’-GACCCAAGTTTTGCAG^CACTCTGTCAAACC   I-CsmI   史氏衣藻   (Chlamydomonas   smithii)   5’-GTACTAGCATGGGGTCAAATGTCTTTCTGG   I-CmoeI   淡水衣藻   (Chlamydomonas   moewusii)   5’-TCGTAGCAGCT^CACGGTT   3’-AGCATCG^TCGAGTGCCAA   I-CreI   莱茵衣藻   (Chlamydomonas   reinhardtii)   5’-CTGGGTTCAAAACGTCGTGA^GACAGTTTGG   3’-GACCCAAGTTTTGCAG^CACTCTGTCAAACC   I-ChuI   土生衣藻   (Chlamydomonas   humicola)   5’-GAAGGTTTGGCACCTCG^ATGTCGGCTCATC   3’-CTTCCAAACCGTG^GAGCTACAGCCGAGTAG   I-CpaI   大斑衣藻   (Chlamydomonas   pallidostigmatica)   5’-CGATCCTAAGGTAGCGAA^ATTCA   3’-GCTAGGATTCCATC^GCTTTAAGT   I-CpaII   大斑衣藻   5’-CCCGGCTAACTC^TGTGCCAG   3’-GGGCCGAT^TGAGACACGGTC   I-CeuI   Chlamydomonas   eugametos   5’-CGTAACTATAACGGTCCTAA^GGTAGCGAA   3’-GCATTGATATTGCCAG^GATTCCATCGCTT   I-DmoI   运动脱硫球菌   (Desulfurococcus   mobilis)   5’-ATGCCTTGCCGGGTAA^GTTCCGGCGCGCAT   3’-TACGGAACGGCC^CATTCAAGGCCGCGCGTA   I-SceI   酿酒酵母   5’-AGTTACGCTAGGGATAA^CAGGGTAATATAG   3’-TCAATGCGATCCC^TATTGTCCCATTATATC   5’-TAGGGATAA^CAGGGTAAT   3’-ATCCC^TATTGTCCCATTA(“Core”-序列)   I-SceII   酿酒酵母   5’-TTTTGATTCTTTGGTCACCC^TGAAGTATA   3’-AAAACTAAGAAACCAG^TGGGACTTCATAT

  I-SceIII   酿酒酵母   5’-ATTGGAGGTTTTGGTAAC^TATTTATTACC   3’-TAACCTCCAAAACC^ATTGATAAATAATGG   I-SceIV   酿酒酵母   5’-TCTTTTCTCTTGATTA^GCCCTAATCTACG   3’-AGAAAAGAGAAC^TAATCGGGATTAGATGC   I-SceV   酿酒酵母   5’-AATAATTTTCT^TCTTAGTAATGCC   3’-TTATTAAAAGAAGAATCATTA^CGG   I-SceVI   酿酒酵母   5’-GTTATTTAATG^TTTTAGTAGTTGG   3’-CAATAAATTACAAAATCATCA^ACC   I-SceVII   酿酒酵母   5’-TGTCACATTGAGGTGCACTAGTTATTAC   PI-SceI   酿酒酵母   5’-ATCTATGTCGGGTGC^GGAGAAAGAGGTAAT   3’-TAGATACAGCC^CACGCCTCTTTCTCCATTA   F-SceI   酿酒酵母   5’-GATGCTGTAGGC^ATAGGCTTGGTT   3’-CTACGACA^TCCGTATCCGAACCAA   F-SceII   酿酒酵母   5’-CTTTCCGCAACA^GTAAAATT   3’-GAAAGGCG^TTGTCATTTTAA   I-HmuI   枯草芽孢杆菌   (Bacillus  subtilis)   噬菌体SPO1   5’-AGTAATGAGCCTAACGCTCAGCAA   3’-TCATTACTCGGATTGC^GAGTCGTT   I-HmuII   枯草芽孢杆菌噬菌   体SP82   5’-AGTAATGAGCCTAACGCTCAACAANNNNNNN   NNNNNNNNN-NNNNNNNNNNNNNNNNNNNNNNN   I-LlaI   乳酸乳球菌   (Lactococcus   lactis)   5’-CACATCCATAAC^CATATCATTTTT   3’-GTGTAGGTATTGGTATAGTAA^AAA   I-MsoI   Monomastix物种   5’-CTGGGTTCAAAACGTCGTGA^GACAGTTTGG   3’-GACCCAAGTTTTGCAG^CACTCTGTCAAACC   I-NanI   安氏纤毛虫   (Naegleria   andersoni)   5’-AAGTCTGGTGCCA^GCACCCGC   3’-TTCAGACC^ACGGTCGTGGGCG   I-NitI   斜纤毛虫   (Naegleria   italica)   5’-AAGTCTGGTGCCA^GCACCCGC   3’-TTCAGACC^ACGGTCGTGGGCG

  I-NjaI  加米纤毛虫  (Naegleria  jamiesoni)   5’-AAGTCTGGTGCCA^GCACCCGC   3’-TTCAGACC^ACGGTCGTGGGCG   I-PakI  Pseudendoclonium  akinetum   5’-CTGGGTTCAAAACGTCGTGA^GACAGTTTGG   3’-GACCCAAGTTTTGCAG^CACTCTGTCAAACC   I-PorI  Pyrobaculum  organotrophum   5’-GCGAGCCCGTAAGGGT^GTGTACGGG   3’-CGCTCGGGCATT^CCCACACATGCCC   I-PpoI  多头绒泡菌  (Physarum  polycephalum)   5’-TAACTATGACTCTCTTAA^GGTAGCCAAAT   3’-ATTGATACTGAGAG^AATTCCATCGGTTTA   I-ScaI  好望角酵母  (Saccharomyces  capensis)   5’-TGTCACATTGAGGTGCACT^AGTTATTAC   3’-ACAGTGTAACTCCAC^GTGATCAATAATG   I-Ssp6803I  集胞藻  (Synechocystis  species)   5’-GTCGGGCT^CATAACCCGAA   3’-CAGCCCGAGTA^TTGGGCTT   PI-PfuI  激烈热球菌  (Pyrococcus  furiosus)Vc1   5’-GAAGATGGGAGGAGGG^ACCGGACTCAACTT   3’-CTTCTACCCTCC^TCCCTGGCCTGAGTTGAA   PI-PfuII  激烈热球菌Vc1   5’-ACGAATCCATGTGGAGA^AGAGCCTCTATA   3’-TGCTTAGGTACAC^CTCTTCTCGGAGATAT   PI-PkoI  Pyrococcus  kodakaraensis  KOD1   5’-GATTTTAGAT^CCCTGTACC   3’-CTAAAA^TCTAGGGACATGG   PI-PkoII  Pyrococcus  kodakaraensis  KOD1   5’-CAGTACTACG^GTTAC   3’-GTCATG^ATGCCAATG   PI-PspI  热球菌(Pyrococcus  sp.)   5’-AAAATCCTGGCAAACAGCTATTAT^GGGTAT   3’-TTTTAGGACCGTTTGTCGAT^AATACCCATA   PI-TfuI  Thermococcus  fumicolans ST557   5’-TAGATTTTAGGT^CGCTATATCCTTCC   3’-ATCTAAAA^TCCAGCGATATAGGAAGG

  PI-TfuII   Thermococcus   fumicolans ST557   5’-TAYGCNGAYACN^GACGGYTTYT   3’-ATRCGNCT^RTGNCTGCCRAARA   PI-ThvI   Thermococcus   hydrothermalis   5’-TAYGCNGAYACN^GACGGYTTYT   3’-ATRCGNCT^RTGNCTGCCRAARA   PI-TliI   Thermococcus   litoralis   5’-TAYGCNGAYACNGACGG^YTTYT   3’-ATRCGNCTRTGNC^TGCCRAARA   PI-TliII   Thermococcus   litoralis   5’-AAATTGCTTGCAAACAGCTATTACGGCTAT   I-TevI   噬菌体T4   5’-AGTGGTATCAAC^GCTCAGTAGATG   3’-TCACCATAGT^TGCGAGTCATCTAC   I-TevII   噬菌体T4   5’-GCTTATGAGTATGAAGTGAACACGT^TATTC   3’-CGAATACTCATACTTCACTTGTG^CAATAAG   F-TevI   噬菌体T4   5’-GAAACACAAGA^AATGTTTAGTAAANNNNNN   NNNNNNNN   3’-CTTTGTGTTCTTTACAAATCATTTNNNNNNNN   NNNNNN^   F-TevII   噬菌体T4   5’-TTTAATCCTCGCTTC^AGATATGGCAACTG   3’-AAATTAGGAGCGA^AGTCTATACCGTTGAC   H-DreI   大肠杆菌pI-DreI   5’-CAAAACGTCGTAA^GTTCCGGCGCG   3’-GTTTTGCAG^CATTCAAGGCCGCGC   I-BasI   苏云金芽孢杆菌噬   菌体Bastille   5’AGTAATGAGCCTAACGCTCAGCAA   3’-TCATTACGAGTCGAACTCGGATTG   I-BmoI   莫哈维芽胞杆菌   (Bacillus   mojavensis)s87-18   5’-GAGTAAGAGCCCG^TAGTAATGACATGGC   3’-CTCATTCTCG^GGCATCATTACTGTACCG   I-PogI   Pyrobaculum   oguniense   5’-CTTCAGTAT^GCCCCGAAAC   3’-GAAGT^CATACGGGGCTTTG   I-TwoI   金黄色葡萄球菌   (Staphylococcus   aureus)噬菌体   Twort   5’-TCTTGCACCTACACAATCCA   3’-AGAACGTGGATGTGTTAGGT

  PI-MgaI   胃分支杆菌   (Mycobacterium   gastri)  5’-CGTAGCTGCCCAGTATGAGTCA  3’-GCATCGACGGGTCATACTCAGT   PI-PabI   Pyrococcus abyssi  5’-GGGGGCAGCCAGTGGTCCCGTT  3’-CCCCCGTCGGTCACCAGGGCAA   PI-PabII   Pyrococcus abyssi  5’-ACCCCTGTGGAGAGGAGCCCCTC  3’-TGGGGACACCTCTCCTCGGGGAG

还包括仍能够由所讨论的序列特异性DNA-核酸内切酶识别和切割的 识别序列的微小偏离(简并性)。已经描述此类偏离及与之有关的不同构架 条件,例如钙浓度或镁浓度(Argast GM等,1998)。还包括这些识别序列 的核心序列和其中的微小偏离(简并性)。已知识别序列的内侧部分足以诱 导双链断裂并且外侧部分不是绝对重要的,但是可以共同地决定切割效 率。因此,例如,可以对I-SceI定义18bp核心序列。

2.3.2缺失/切除的启动

存在适宜地启动靶序列缺失/切除的多种方法。优选地,缺失仅在靶序 列成功整合至植物基因组后才启动。例如在靶序列是选择标记的情况下, 优选地标记已经成功完成其功能,导致DNA构建体插入待转化植物细胞 或生物的基因组之后,启动切除。

本领域技术人员可获得多种方法以将切除酶与侧翼具有切除序列的 靶序列组合。优选地,通过选自如下的方法可以表达切除酶(例如重组酶或 核酸内切酶)或与其相应的切除序列(例如重组或识别位点)的组合:

a)将切除酶(例如重组酶或序列特异性核酸内切酶)的表达盒掺入 DNA构建体,优选地连同侧翼具有所述切除序列的靶序列(例如标记基因) 一起掺入,

b)将切除酶(例如重组酶或序列特异性核酸内切酶)的表达盒的掺入 已经包含侧翼具有所述切除序列的靶序列(例如标记基因)的植物细胞或植 物,

c)将切除酶(例如重组酶或序列特异性核酸内切酶)的表达盒掺入植物 细胞或植物,其中所述的植物细胞或植物随后作为以构建体转化的主植物 或主细胞使用,其中所述的构建体包含侧翼具有所述切除序列的靶序列(例 如标记基因),

d)将切除酶(例如重组酶或序列特异性核酸内切酶)的表达盒掺入分 别的DNA构建体,其中所述的DNA构建体通过共转化方式与包含侧翼具 有所述切除序列的靶序列(例如标记基因)的独立DNA构建体转化。

因此,靶序列和切除酶(例如重组酶或核酸内切酶)可以在例如以下的 植物生物、细胞、细胞区室或组织中组合:

1.)以惯常方式方式产生这样的植物,该植物包含插入其基因组中(优 选地至染色体DNA)的侧翼具有切除序列的靶序列(例如标记基因)。另外的 用于切除酶的表达盒随后与所述DNA构建体以如下方式组合:

a)用所述第二表达盒进行第二转化,或

b)包含靶序列的植物与包含切除酶表达盒的主植物杂交。

2.)编码切除酶的表达盒可以整合至已经携带靶序列的DNA构建体 中。优选将编码切除酶的序列插入允许进行缺失的序列之间,并因此在该 序列完成其功能后,从基因组DNA中缺失该序列。非常特别优选在这种 情况下(例如在下文所述的诱导型启动子之一控制下),核酸内切酶的表达 是使用发育依赖性启动子以发育依赖性方式可诱导的,或采用这样的切除 酶,其中为避免双功能标记在插入基因组之前过早缺失,该切除酶的活性 是可诱导的。

3.)根据共转化技术,切除酶的表达盒可以随包含靶序列而位于另外 的DNA分子(例如载体)中的DNA构建体同时转化至细胞内。共转化可以 是稳定的或短暂的。在此时,切除酶的表达优选地是可诱导的(例如在如上 所述可诱导的嵌合的转录调节性序列之一的控制下),尽管未修饰的超级启 动子的发育依赖性表达模式已经防止过旱切除。

4.)表达切除酶的植物还可以充当亲代个体。在来自表达切除酶的植 物与携带靶序列的植物之间杂交的子代中观察到所需要的靶序列切除(例 如通过双链断裂和同源序列之间的重组)。

本发明的一个优选实施方案涉及这样的DNA构建体,其包含靶序列 (例如包含选择标记的表达盒;第一表达盒)和用于切除酶的第二表达盒(例 如与植物启动子连接的核酸内切酶编码序列或重组酶编码序列),它们优选 地处于如此形式,以至于所述第二表达盒与侧翼具有所述切除序列的所述 第一表达盒连接在一起,这允许特定靶序列的缺失。

在另一个优选的实施方案中,可以以防止过早缺失/切除双功能标记的 方式诱导或激活缺失/切除机制。因而优选地,可以诱导优选使用的切除酶 的表达和/或活性,优选地通过选自以下方法诱导:

a)通过将编码所述切除酶(例如重组酶或核酸内切酶)的序列有效连接 至诱导型启动子而可诱导的表达,

b)通过采用包含配体结合结构域的修饰的切除酶(例如重组酶或核酸 内切酶)而可诱导的激活,其中所述修饰的切除酶的活性可以通过对所述配 体结合结构域具有结合活性的化合物的处理进行调节。

编码切除酶的多核苷酸的表达优选地受切除启动子控制,该启动子允 许以时间方式的表达以至于双功能标记在受到切除前可以执行其作为负 选择标记的功能。例如在德国专利申请DE 03028884.9中描述了合适的启 动子。此类启动子可以具有例如对晚期发育阶段如繁殖组织的表达特异 性。切除启动子可以选自下文的启动子之一。

2.3.3待切除的靶序列

虽然本文中构思了多种序列,其中切除可能是有利的,然而待切除的 最优选靶序列是标记序列。在常用术语“标记序列”下包含可选择和可筛选 的多种标记序列。因此,本发明的方法产生无标记的单子叶植物细胞或单 子叶植物,术语“无标记”或“无选择标记”如本文中就细胞或生物方面所 用,意指不能够表达功能性标记蛋白质的细胞或生物。编码所述标记蛋白 质的序列可以部分地或优选地被全部缺失。

2.3.3.1标记基因

经常使用标记基因(例如可选择或可筛选的标记)以便改善鉴定转化体 的能力。“标记基因”是这样的基因,该基因赋予表达该标记基因的细胞明 显的表型并因此允许将这种转化细胞与不含标记的细胞区分开。此类基因 可以编码可选择或可筛选的标记,这取决于标记赋予的性状是否可以通过 化学方法即通过使用选择剂(例如除草剂、抗生素等)加以选择,或该性状 是否可简单地由观察或检验即由‘筛选’(例如R-基因座性状、绿色荧光蛋 白(GFP))加以鉴定的性状。当然,合适标记基因的众多实例是本领域中已 知的并可以用于本发明的实施。该术语中包含的可选择或可筛选标记基因 还是编码“可分泌标记”的基因,其中所述的可分泌标记可以作为鉴定或选 择已转化细胞的方法受到检测。可分泌标记的实例包括编码可通过与抗体 相互作用进行鉴定的可分泌抗原标记,或甚至是可以因其催化活性得到检 测的可分泌酶。可分泌蛋白质分成多个类别,包括(例如通过ELISA)可检 测的扩散性小分子蛋白;在细胞外溶液中可检测的小分子活性酶(例如α- 淀粉酶、β-内酰胺酶、草铵膦乙酰基转移酶)和插入或截获于细胞壁中的蛋 白质(例如包含如伸展蛋白或烟草PR-S的表达单元中存在前导序列的蛋白 质)。

就可选择的可分泌标记而言,认为使用编码隔离于细胞壁中的蛋白质 和包含独特表位的蛋白质的基因特别有利。这种分泌型抗原标记将理想地 利用在植物组织内提供浅背景的表位序列和这样的启动子-前导序列,其赋 予高效表达和穿过胞浆膜的高效定向,并将产生在细胞壁内束缚且抗体仍 可接近的蛋白质。为包括独特表位进行修饰的正常分泌的细胞壁蛋白质将 满足全部的此类要求。适合以这种方式修饰的蛋白质的一个实例是伸展蛋 白或羟脯氨酸丰富的糖蛋白(HPRG)。例如,已经充分表征玉米HPRG (Steifel 1990)分子的分子生物学、表达和蛋白质结构。然而,多种ultilane 和/或甘氨酸丰富的细胞壁蛋白质(Keller 1989)中的任一种蛋白质可以通过 添加抗原性位点进行修饰以产生可筛选标记。

可分泌的可筛选标记的一个示例性实施方案涉及使用编码经修饰以 包含来自小鼠白细胞介素前区域(pro-region)的一个15个残基表位的细 胞壁蛋白质HPRG的玉米序列,然而,在此类实施方案中几乎可以采用 任何可检测的表位,如从本领域技术人员已知的种类非常广泛的抗原-抗体 组合中选择。随后独特的细胞外表位可以使用经生色附加物或荧光附加物 标记的抗体直接检测。

本公开的元件可以通过使用bar和/或GUS基因并且还可通过使用多 种的其它标记详细举例说明。当然,根据本公开,除本文以下所述的标记 基因之外,众多其它可能的可选择和/或可筛选的标记基因对本领域技术人 员是显而易见的。因此,可以理解的是如下讨论是示例性而非排他性的。 根据本文中所公开技术和本领域中已知的常用重组技术,本发明有可能将 任一基因(包括标记基因)导入受体细胞以产生转化植物。

标记序列可以通过在植物细胞中具有表达能力的任一转录调节性序 列或启动子(合适的启动子序列在下文描述)表达。最优选的是在植物转化、 筛选和选择中所用的标记序列。标记能够鉴定转化后的转基因细胞或转基 因生物(例如植物或植物细胞)。它们可以分别分成正选择标记(赋予选择性 优势)、负选择标记(弥补选择劣势)和反选择标记(赋予选择缺点)。此类标 记可以包括但不限于:

2.3.3.1.1负选择标记

负选择标记赋予对杀生物性化合物如代谢抑制物(例如2-脱氧葡萄糖 -6-磷酸,WO 98/45456)、抗生素(例如卡那霉素、G 418、博来霉素或潮霉 素)或除草剂(例如草铵膦或草甘膦)的抗性。表达标记基因的转化植物材料 (例如细胞、组织或幼苗)能够在抑制未转化的野生型组织生长的相应选择 化合物(例如抗生素或除草剂)的浓度存在下发育。尤其优选的负选择标记 是赋予除草剂抗性的那些负选择标记。可以提到的负选择标记的实例是:

-草铵膦乙酰基转移酶(PAT;又称双丙氨抗性;bar;de Block 1987;Vasil 1992,1993;Weeks 1993;Becker 1994;Nehra 1994;Wan和 Lemaux 1994;EP 0 333 033;US 4,975,374)。优选来自吸水链霉菌 (Streptomyces hygroscopicus)的bar基因或来自绿色产色链霉菌 (Streptomyces viridochromogenes)的pat基因。PAT使除草剂双丙氨膦中 的活性成分草铵膦(PPT)失活。PPT抑制谷氨酰胺合成酶(Murakami 1986;Twell 1989),导致氨的迅速累积和细胞死亡。

-赋予草甘(N-(膦酰甲基)甘氨酸)抗性的改变的5-烯醇丙酮莽草酸 -3-磷酸合酶(EPSPS)(Hinchee 1988;Shah 1986;Della-Cioppa 1987)。在使 用突变的EPSP合酶基因中,额外益处可以通过掺入合适的叶绿体转运肽 CTP实现(EP-A10218571)。

-降解草甘的酶(草甘氧化还原酶;gox),

-失活茅草的脱卤素酶(deh),

-失活磺酰脲-和/或咪唑啉酮的乙酰乳酸合酶(ahas或ALS;例如具有 如S4、XI12、XA17和/或Hra突变的经突变的ahas/ALS变体(EP-A1154 204),

-降解溴苯的腈水解酶(bxn;Stalker 1988),

-编码例如新霉素磷酸转移酶(Fraley 1983;Nehra 1994)的卡那霉素抗 性基因或庆大霉素(G418)抗性基因(NPTII;NPT或neo;Potrykus 1985),

-赋予2-脱氧葡萄糖抗性(Randez-Gil 1995)的2-脱氧葡萄糖-6-磷酸磷 酸酶(DOGR1-基因产物;WO 98/45456;EP 0807836),

-介导潮霉素抗性的潮霉素磷酸转移酶(HPT)(Vanden Elzen 1985),

-赋予氨甲叶酸抗性(Thillet 1988)的改变的二氢叶酸还原酶(Eichholtz 1987),

-赋予5-甲基色氨酸抗性的突变的邻氨基苯甲酸合酶基因。

细菌来源的赋予抗生素抗性的其它负选择标记基因包括赋予壮观霉 素抗性的aadA基因、庆大霉素乙酰基转移酶、链霉素磷酸转移酶(SPT)、 氨基糖甙-3-腺苷酰基转移酶和博来霉素抗性决定子(Hayford 1988;Jones 1987;Svab 1990;Hille 1986)。

尤其优选这样的负选择标记,其赋予对D-氨基酸(例如D-丙氨酸和D- 丝氨酸)所致的毒性效应的抗性(WO 03/060133;Erikson 2004)。作为本上 下文中的负选择标记,尤其优选来自纤细红酵母(Rhodotorula gracilis)(红 冬孢酵母(Rhodosporidium toruloides))的daol基因(EC:1.4.3.3:GenBank 登录号:U60066)和大肠杆菌基因dsdA(D-丝氨酸脱水酶(D-丝氨酸脱氨 酶)[EC:4.3.1.18;GenBank登录号:J01603)。

表达此类标记基因的经转化植物材料(例如细胞、组织或幼苗)能够在 抑制未转化野生型组织生长的相应选择化合物(例如抗生素或除草剂)的 浓度存在下发育。得到的植物可以以常规方式育种和杂交。应当培育两个 或多个世代以确信基因组整合是稳定的且遗传的。描述了相应的方法 (Jenes 1993;Potrykus 1991)。

此外,可以利用允许视观筛选的报道基因,这可能需要或可能不需要 (取决于报道基因类型)补充作为选择化合物的底物。

可以对多种负选择标记基因采用多种时间方案。在抗性基因(例如抗除 草剂或D-氨基酸)的例子中,优选地自始至终施加在整个愈伤组织导入期 进行选择约4周并超过至少4周至再生。这种选择方案可以应用于全部选 择计划。还有可能(虽然不是明确优选的)也在整个再生计划(包括生根)期 间自始至终保持选择。

例如用膦丝菌素抗性基因(bar)作为选择标记,培养基中可以包含浓度 从约1至50mg/L的膦丝菌素。例如,用dao1基因作为选择标记,培养 基中可以包含浓度从约3至100mg/L的D-丝氨酸或D-丙氨酸。用于选择 的常用浓度是20至40mg/L。例如,用突变的ahas基因作为选择标记, 培养基中可以包含浓度从约3至100mg/L的PURSUITTM。用于选择的常 用浓度是20至40mg/L。

2.3.3.1.2正选择标记

此外,可以使用正选择标记。正选择标记是这样的选择标记,它们不 引起对杀生物性化合物的脱毒,但是通过增加或改善包含此种标记的细胞 或生物的再生、生长、增殖、繁殖等而赋予优势。正选择标记的实例是异 戊烯基转移酶(细胞分裂素生物合成的关键酶,该酶促进在无细胞分裂素的 培养基上选择经转化植物细胞的再生;Ebinuma 2000a;Ebinuma 2000b; 例如来自菌株:PO22;GenBank登录号:AB025109)。与未转化物细胞相比, 对已转化物细胞赋予生长优势的其它正选择标记例如在EP-A 0601092中 描述。生长刺激选择标记可以包括(但是不应当限于)β-葡糖醛酸糖苷酶(与 例如细胞分裂素葡糖苷酸组合)、甘露糖-6-磷酸异构酶(与甘露糖组合)、 UDP-半乳糖-4-差向异构酶(与例如半乳糖组合)、其中尤其优选与甘露糖组 合的甘露糖-6-磷酸异构酶。

2.3.3.1.3反选择标记

待切除的靶序列可以不仅包含负选择标记或正选择标记(以促进选择 和分离已成功转化的植物),而且还可以包含反选择标记以便评估成功的后 续标记切除。在一个优选的实施方案中,正选择标记和/或正选择标记和反 选择标记在侧翼具有切除序列并均通过切除酶的作用被缺失/切除。反选择 标记尤其适合于选择这样的生物,该生物具有包含所述标记的经定义缺失 的序列(Koprek 1999)。反选择标记是编码能够使无毒化合物转化成有毒化 合物的酶的序列。因此仅缺少所述反选择标记的细胞在用所述无毒化合物 处理时存活下来,因而允许选择已经成功使序列(例如标记)缺失的细胞。 本领域中已知的常用反选择标记是例如

a)与5-氟胞嘧啶(5-FC)组合的胞嘧啶脱氨酶(CodA)(WO 93/01281; US 5,358,866;Gleave AP等1999;Perera RJ等,1993;Stougaard J 1993; EP-A1595837;Mullen CA等,1992;Kobayashi T等,1995;Schlaman HRM与Hooykaas PFF 1997;Xiaohui Wang H等,2001;Koprek T等, 1999;Gleave AP等,1999;Gallego ME 1999;Salomon S与Puchta H 1998; Thykjaer T等,1997;Serino G 1997;Risseeuw E 1997;Blanc V等,1996; Corneille S等,2001)。

b)细胞色素P-450酶与磺酰脲除草剂原R7402(2-甲基乙基-2-3-二 氢-N-[(4,6-二甲氧嘧啶-2-基)氨基羰基]-1,2-苯并异噻唑-7-磺酰胺-1,1-二氧 化物)的组合(O’Keefe DP等,1994;Tissier AF等,1999;Koprek T等, 1999;O’Keefe DP 1991)。

c)与萘乙酰胺(NAM)组合的吲哚乙酸水解酶(例如来自根癌农杆菌的 tms2基因产物)(Fedoroff NV与Smith DL 1993;Upadhyaya NM等, 2000;Depicker AG等,1988;Karlin-Neumannn GA等,1991; Sundaresan V等,1995;Cecchini E等,1998;Zubko E等,2000)。

d)来自养黄色杆菌GJ10(Xanthobacter autotropicus GJ10)的与1,2-二 氯乙烷(DCE)组合的卤烷脱卤素酶(dhlA基因产物)(Naested H等,1999; Janssen DB等,1994;Janssen DB 1989)。

e)与无环鸟苷、更昔洛韦或1,2-脱氧-2-氟-β-D-阿拉伯呋喃糖基-5-碘 尿嘧啶(FIAU)组合的(例如来自1型单纯疱疹病毒(TK HSV-1))的胸苷激酶 (TK)(Czako M和Marton L 1994;Wigler M等,1977;McKnight SL 等,1980;McKnight SL等,1980;Preston等,1981;Wagner等, 1981;St.Clair等1987)。

本领域中已知其它数种反选择系统(见例如国际申请WO 04/013333; 第13至20页的概述;该文献本文中引用作为参考)。

2.3.3.1.4.可筛选标记

可以利用的可筛选标记(又称作报道基因或报道蛋白;Schenborn E, Groskreutz D.1999)包括但不限于β-葡糖醛酸糖苷酶(GUS;Jefferson等 (1987)EMBO J 6:3901-3907)或编码多种生色底物已知的酶的uidA基因; 编码调节植物组织内花青苷色素(红颜色)产生的产物的R-基因座基因 (Dellaporta 1988);编码已知多种生色底物的酶(例如PADAC,一种生色 的头孢菌素)的β-内酰胺酶基因(Sutcliffe 1978);编码可以转化生色儿茶酚 的儿茶酚双加氧酶的xylE基因(Zukowsky 1983);α-淀粉酶基因(Ikuta 1990);酪氨酸酶基因(Katz 1983),该基因编码能够将酪氨酸氧化成DOPA 和多巴醌的酶,其中DOPA和多巴醌随后缩合形成可轻易加以检测的黑色 素;编码存在生色底物的酶的β-半乳糖苷酶基因;允许生物发光检测的萤 光素酶(lux)基因(Ow 1986;Millar等(1992)Plant Mol Biol Rep 10:324-414),或甚至可以在钙敏感的生物发光检测中利用的水母发光蛋白 基因(Prasher 1985),或绿色荧光蛋白基因(GFP)(Niedz 1995;Chui WL等, 1996;Leffel SM等,1997;Sheen等,1995;Haseloff等,1997;Reichel 等,1996;Tian等,1997)。

预计来自玉米R基因复合体的基因作为可筛选标记是特别有用的。R 基因复合体在玉米中编码这样的蛋白质,所述蛋白质起到调节花青苷色素 在大部分种子和植物组织中产生的作用。来自R基因复合体的基因应用于 玉米转化,因为该基因在转化细胞内的表达不伤害细胞。因此,导入这 种细胞的R基因将引起红色素的表达,并且,若R基因稳定整合,则可 以以视观方式记分为红色区域。当玉米品系对编码花青苷生物合成途径中 的酶中间体(C2、A1、A2、Bz1和Bz2)的基因为显性、但是在R基因座内 携带隐性等位基因时,转化来自具有R的株系的任何细胞将导致红色色素 形成。示例性株系包括含有rg-Stadler等位基因和TR112的Wisconsin 22, 其中TR112是K55衍生物(r-g、b、P1)。或者,可以利用任一基因型的玉 米,只要同时导入等位基因C1和R。

还提出可以在嵌合构建体中利用R基因调节区域以便提供控制嵌合基 因表达的机制。已知在R基因座处比任何其它基因座处存在更多样的表型 表现(Coe 1988)。预计从结构性R基因的5′区域中获得的调节区域具有指 导基因(例如编码昆虫抗性、干旱抗性、除草剂耐受性或其它蛋白质的区域) 表达的价值。为了本发明的目的,认为可以成功利用多种R基因的任一 家族成员(例如P、S、Lc等)。然而,通常最优选Sn(特别是Sn:bol3)。Sn 是R基因复合体的显性成员并且与R和B基因座功能相似,因为Sn控 制花青苷色素在某些幼苗和植物细胞中的组织特异性沉积,因此,Sn的表 型与R相似。

预计用于本发明中的另一种可筛选标记是由lux基因编码的萤火虫萤 光素酶。lux基因在转化细胞内的存在可以使用例如X线胶片、闪烁计数、 荧光分光光度法、微光摄影法、光子计数照相(photon counting cameras) 或多孔发光测量法(multiwell luminometry)进行检测。还预计可以开发此系 统用于群体性生物发光筛选,如在组织培养皿上,或甚至用于筛选完整植 物。在需要使用可筛选标记基因如lux或GFP时,益处可以通过产生可筛 选标记基因与可选择标记基因之间的基因融合物(例如GFP-NPTII基因融 合物)而实现。这可能允许例如选择转化的细胞,随后筛选转基因的植物或 种子。

2.3.3.1.5.双功能标记

在本发明的一个优选的实施方案中,靶序列是双功能标记。术语“双功 能标记”包含这样的标记,该标记在一个序列中组合了待用作负选择标记或 反选择标记的可能。实现哪种效果的选择取决于筛选过程中采用的底物。 双功能标记最优选地是D-氨基酸氧化酶。这种酶能够转化D-氨基酸。某 些D-氨基酸对植物有毒并通过D-氨基酸氧化酶的作用脱毒。其它D-氨基 酸对植物无害,但是通过D-氨基酸氧化酶转化成有毒化合物。

术语D-氨基酸氧化酶(缩写DAAO、DAMOX或DAO)指这样的酶, 该酶通过(优选地)利用氧(O2)作为底物,将D-氨基酸转化成2-氧代酸并产 生过氧化氢(H2O2)作为伴生产物(Dixon M和Kleppe K.Biochim.Biophys. Acta 96(1965)357-367;Dixon M和Kleppe K Biochim.Biophys.Acta 96(1965)368-382;Dixon M 和Kleppe Biochim.Biophys.Acta 96(1965)383-389;Massey V等,Biochim.Biophys.Acta 48(1961)1-9. Meister A和Wellner D,黄素蛋白氨基酸氧化酶(Flavoprotein amino acid oxidase).在:Boyer,P.D.,Lardy,H.和K.(编者)1963)

DAAO可以由国际生物化学与生子生物学联合学会命名委员会 (Nomenclature Committee of the International Union of Biochemistry and Molecular Biology(IUBMB))描述,具有EC(酶委员会)编号EC 1.4.3.3。 通常,EC 1.4.3.3类的DAAO酶是催化中性和碱性D-氨基酸氧化成其相 应酮酸的FAD黄素酶。DAAO已经在真菌和脊椎动物中表征并测序,其 中已知它们位于过氧化物酶体中。术语D-氨基酸氧化酶还包含D-天冬氨 酸氧化酶(EC 1.4.3.1)(DASOX)(Negri A等,1992),其中D-天冬氨酸氧化 酶是与DAAO结构相似的酶,催化相同反应,但仅对二羧D-氨基酸有活 性。在本发明中优选EC 1.4.3.3类的DAAO。

在DAAO中,已经证实一个保守的组氨酸(Miyano M等,1991)对于 酶催化活性是重要的。在本发明的优选实施方案中,DAAO指包含以下共 有基序的蛋白质:

[LIVM]-[LIVM]-H-[NHA]-Y-G-x-[GSA]-[GSA]-x-G-x5-G-x-A

其中括号内给出的氨基酸残基代表相应位置的备选残基,x代表任一 氨基酸残基并且指示数字表示相应的连续氨基酸残基数。各氨基酸残基的 缩写具有它们以上定义的标准IUPAC含义。表3中描述包含所述基序的 其它潜在的DAAO酶。

表3.来自多种生物的合适D-氨基酸氧化酶。登录号指来自SwisProt 数据库的蛋白质序列。

  登录号   基因名称   描述   来源生物   长度   Q19564   F18E3.7   推定的D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   秀丽隐杆线虫   334   P24552   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   腐皮镰刀茵(豌豆亚   种))(Fusarium   solani)(subsp.pisi)(血   红丛赤壳(Nectria   haematococca)   361   P14920   DAO,   DAMOX   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   智人(Homo   sapiens)(人)   347   P18894   DAO,DAO1   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   小家鼠(Mus   musculus)(小鼠)   346   P00371   DAO   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   家猪(Sus scrofa)(猪)   347   P22942   DAO   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   穴兔(Oryctolagus   cuniculus)(兔)   347   O35078   DAO   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   褐家鼠(Rattus   norvegicus)(大鼠)   346   P80324   DAO1   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   红冬孢酵母(酵母)(纤   细红酵母)   368   U60066   DAO   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   红冬孢酵母,菌株TCC   26217   368   Q99042   DAO1   D-氨基酸氧化酶(EC   1.4.3.3)(DAMOX)(DAO)(DAAO)   三角酵母(Trigonopsis   variabilis)(酵母)   356

  P31228   DDO   D-天冬氨酸氧化酶(EC   1.4.3.1)(DASOX)(DDO)   黄牛(Bos taurus)(牛)   341   Q99489   DDO   D-天冬氨酸氧化酶(EC   1.4.3.1)(DASOX)(DDO)   智人(人)   341   Q9C1L2   NCU06558.1   (AF309689)推定的D-氨基酸氧化酶   G6G8.6(假设的蛋白质)   粗糙脉孢霉   (Neurospora crassa)   362   Q7SFW4   NCU03131.1   假设的蛋白质   粗糙脉孢霉   390   Q8N552   与D-天冬氨酸氧化酶相似   智人(人)   369   Q7Z312   DKFZP686F   04272   假设的蛋白质DKFZp686F04272   智人(人)   330   Q9VM80   CG11236   CG11236蛋白质(GH12548p)   黑腹果蝇(Drosophila   melanogaster)(果蝇)   341   O01739   F20H11.5   F20H11.5蛋白质   秀丽隐杆线虫   383   O45307   C47A10.5   C47A10.5蛋白质   秀丽隐杆线虫   343   Q8SZN5   CG12338   RE73481p   黑腹果蝇(果蝇)   335   Q9V5P1   CG12338   CG12338蛋白质(RE49860p)   黑腹果蝇(果蝇)   335   Q86JV2   与黄牛(牛)D-天冬氨酸氧化酶(EC   1.4.3.1)(DASOX)(DDO)相似   盘基网柄菌(粘菌)   599   Q95XG9   Y69A2AR.5   假设的蛋白质   秀丽隐杆线虫   322   Q7Q7G4   AGCG53627   AgCP5709(片段)   冈比亚按蚊   (Anopheles   gambiae)PEST株   344   Q7PWY   8   AGCG53442   AgCP12432(片段)   冈比亚按蚊PEST株   355   Q7PWX   4   AGCG45272   AgCP12797(片段)   冈比亚按蚊PEST株   373

  Q8PG95   XAC3721   D-氨基酸氧化酶   地毯草黄单胞柑桔致   病变种(Xanthomonas   axonopodis(pv.citri))   404   Q8P4M9   XCC3678   D-氨基酸氧化酶   野油菜黄单胞菌野油   菜致病变种   (Xanthomonas   campestris(pv.   campestris))   405   Q9X7P6   SCO6740,   SC5F2A.23C   推定的D-氨基酸氧化酶   天蓝色链霉菌   (Streptomyces   coelicolor)   320   Q82MI8   DAO,   SAV1672   推定的D-氨基酸氧化酶   阿维链霉菌   (Streptomyces   avermitilis)   317   Q8VCW   7   DAO1   D-氨基酸氧化酶   小家鼠(小鼠)   345   Q9Z302   D-氨基酸氧化酶   黑线仓鼠(Cricetulus   griseus)(中华仓鼠)   346   Q9Z1M5   D-氨基酸氧化酶   豚鼠(Cavia   porcellus)(豚鼠)   347   Q922Z0   与相似D-天冬氨酸氧化酶   小家鼠(小鼠)   341   Q8R2R2   假设的蛋白质   小家鼠(小鼠)   341   P31228   D-天冬氨酸氧化酶   黄牛   341

D-氨基酸氧化酶(EC编号1.4.3.3)可以分离自多种生物,包括但不限于 猪、人、大鼠、酵母、细菌或真菌。举例生物是热带假丝酵母(Candida tropicalis)、三角酵母、粗糙脉孢霉、小球藻(Chlorella vulgaris)和纤细红酵 母。合适的D-氨基酸代谢多肽可以是真核生物的酶,例如来自酵母(例如 纤细红酵母)、真菌或动物,或可以是原核生物的酶、例如来自细菌如大肠 杆菌。代谢D-氨基酸的合适多肽的实例示于表4.

表4.来自多种生物的合适D-氨基酸氧化酶。登录号指来自SwisProt 数据库的蛋白质序列。

 GenBank登录号  来源生物  Q19564  秀丽隐杆线虫F18E3.7.  P24552  腐皮镰刀茵(豌豆亚种)(血红丛赤壳).  JX0152  腐皮镰刀茵  P14920  智人(人)  P18894  小家鼠(小鼠)  P00371  家猪(猪)  P22942  穴兔(兔)  O35078  褐家鼠(大鼠)  P80324  红冬孢酵母(酵母)(纤细红酵母)  Q99042  三角酵母  Q9Y7N4  粟酒裂殖酵母(Schizosaccharomyces pombe)(裂殖  酵母)SPCC 1450  O01739  秀丽隐杆线虫.F20H11.5  Q28382  家猪(猪)  O33145  麻风分支杆菌(Mycobacterium leprae)  Q9X7P6  天蓝色链霉菌.SCSF2A.23C  Q9JXF8  脑膜炎奈瑟菌(Neisseria meningitidis)(血清组B)  Q9Z302  黑线仓鼠(中华仓鼠)  Q921M5  D-氨基酸氧化酶。豚鼠(Cavia parcellus)

D-氨基酸氧化酶优选地从由选自下表5的核酸序列编码的酶或相应的 氨基酸序列中选择:

表5:来自多种生物的合适D-氨基酸氧化酶。登录号指来自GenBank 数据库的蛋白质序列。

  GenBank登录号   生物   U60066   红冬孢酵母(酵母)   Z71657   纤细红酵母

  A56901   纤细红酵母   AF003339   红冬孢酵母   AF003340   红冬孢酵母   U53139   秀丽隐杆线虫   D00809   血红丛赤壳   Z50019.   三角酵母   NC_003421   粟酒裂殖酵母(裂殖酵母)   AL939129.   天蓝色链霉菌A3(2)   AB042032   波氏假丝酵母(Candida boidinii)

DAAO是充分表征的酶,并且它的晶体结构及催化机制已经通过高分 辨率X射线光谱分析加以确定(Umhau S.等,2000)。它是位于过氧化物酶 体中的黄素酶,并且它在动物内已认识的功能是使D-氨基酸脱毒(Pilone MS 2000)。此外,它能够使酵母利用D-氨基酸生长(Yurimoto H等,2000)。 如以上所示,来自数个不同物种的DAAO已经得以表征并在底物亲和性 上显示略微不同(Gabler M等,2000),但是它们通常表现宽的底物特异性, 使全部D-氨基酸氧化脱氨(除对EC 1.4.3.3.类DAAO酶的D-谷氨酸和D- 天冬氨酸以外;Pilone MS 2000)。

在众多的真核生物中发现了DAAO活性(Pilone MS 2000),但是在植 物中没有报道过DAAO活性。植物中代谢D-氨基酸的低能力对植物应答 D-氨基酸的方式有重要影响。

在一个优选的实施方案中,从本发明的DNA构建体中表达的D-氨基 酸氧化酶优选地对选自D-丙氨酸、D-丝氨酸、D-异亮氨酸、D-缬氨酸和其 衍生物的至少一个氨基酸具有酶活性。

合适的D-氨基酸氧化酶还包括以上例所举多肽的片段、突变体、衍生 物、变体和等位基因。合适的片段、突变体、衍生物、变体和等位基因是 保留以上定义的D-氨基酸氧化酶的功能性特征的那些合适的片段、突变 体、衍生物、变体和等位基因。可以如此对序列改变以产生突变体、变体 或衍生物,即通过在核酸中一次或多次地添加、插入、缺失或替换一个或 多个核苷酸,导致所编码的多肽中添加、插入、缺失或替换一个或多个氨 基酸。当然,还包括改变核酸而不改变所编码的氨基酸序列。

本发明的D-氨基酸氧化酶可以表达在植物细胞的细胞浆、过氧化物酶 体或其它细胞区室内。D-氨基酸代谢多肽的区室化可以通过将编码DAAO 多肽的核酸序列与编码转运肽的序列融合以生成融合蛋白而实现。没有这 种转运肽的基因表达产物通常累积在细胞浆内。表达的DAAO在过氧化 物酶体的定位产生可由H2O2降解酶即过氧化氢酶代谢的H2O2。可能需要 较高水平的D-氨基酸以产生破坏性水平的H2O2。DAAO在过氧化氢酶活 性水平较低的细胞浆内的表达降低了产生破坏性水平的H2O2所需要的D- 氨基酸量。细胞浆内DAAO的表达可以通过从编码性核酸序列中去除过氧 化物酶体靶向信号或转运肽而实现。例如,来自纤细红酵母(红冬孢酵母) 的dao1基因(EC:1.4.3.3:GenBank登录号:U60066)如所述(WO 03/060133)得到克隆。最后9个核苷酸编码指导蛋白质进入亚细胞器过氧 化物酶体中的信号肽SKL。虽然在细胞浆表达的DAAO和过氧化物酶体 表达的DAAO之间未观察到显著差异,然而就抑制DAAO转基因植物萌 发的方面,发现在30mM D-Asn上,过氧化物酶体构建物比细胞浆形式构 建物略微有效。然而,两种构建体均比野生型更显著地抑制并且因此可以 用于条件性反选择。

双功能标记的其它修饰和用途在欧洲专利申请号04006358.8 (SweTree Technologies AB&BASF;IMPROVED CONSTRUCTS FOR MARKER EXCISION BASED ON DUAL-FUNCTION SELECTION MARKER)及其它要求其优先权的国家申请和国际申请中公开。

2.3.4.标记基因和其他序列的表达

标记基因(或可以从本发明DNA构建体之一中表达的其它序列)可以 由在植物中有功能的任一启动子表达。这些启动子包括但不限于组成型 的、诱导型、时间性调节、发育调节、空间调节的、化学调节的、胁迫应 答性、组织特异性、病毒性和合成性启动子。启动子可以是γ-玉米醇溶蛋 白启动子、油质蛋白ole16启动子、球蛋白启动子、肌动蛋白I启动子、 肌动蛋白cl启动子、蔗糖合成酶启动子、INOPS启动子、EXM5启动子、 球蛋白2启动子、β-32,ADPG-焦磷酸化酶启动子、LtpI启动子、Ltp2启 动子、油质蛋白ole17启动子、油质蛋白ole18启动子、肌动蛋白2启动子、 花粉特异性蛋白质启动子、花粉特异性果胶酸裂合酶启动子、花药特异性 蛋白质启动子、花药特异性基因RTS2启动子、花粉特异性基因启动子、 绒毡层特异性基因启动子,绒毡层特异性基因RAB24启动子、邻氨基苯甲 酸合酶α亚基启动子、α-玉米醇溶蛋白启动子、邻氨基苯甲酸合酶β亚基 启动子、二氢吡啶二羧酸合酶启动子、Thil启动子、醇脱氢酶启动子、cab 结合蛋白启动子、H3C4启动子、RUBISCO SS淀粉分支酶启动子、ACC 酶启动子、肌动蛋白3启动子、肌动蛋白7启动子、调节性蛋白质GF14-12 启动子、核糖体蛋白L9启动子、纤维素生物合成酶启动子、S-腺苷基-L- 高半胱氨酸水解酶启动子、超氧化物歧化酶启动子、C-激酶受体启动子、 磷酸甘油酸变位酶启动子、根特异性RCc3mRNA启动子、葡萄糖-6磷酸 异构酶启动子、焦磷酸-果糖6-磷酸基磷酸转移酶启动子、遍在蛋白启动子、 β-酮酰基-ACP合酶启动子、33kDa光合系统11启动子、放氧蛋白启动子、 69kDa液泡ATP酶亚基启动子、金属硫蛋白样蛋白质启动子、甘油醛-3- 磷酸脱氢酶启动子、ABA诱导型样和成熟诱导型样蛋白启动子、苯丙氨酸 脱氨酶启动子、腺苷三磷酸酶-腺苷基-L-高半胱氨酸水解酶启动子、α-微 管蛋白启动子、cab启动子、PEPC酶启动子、R基因启动子、凝集素启 动子、集光复合体启动子、热休克蛋白启动子、查尔酮合酶启动子、玉米 醇溶蛋白启动子、球蛋白-1启动子、ABA启动子、植物生长素结合蛋白启 动子、UDP葡萄糖类黄酮糖基转移酶基因启动子、NTI启动子、肌动蛋白 启动子、不透明2启动子、b70启动子、油质蛋白启动子、CaMV 35S启 动子、CaMV 34S启动子、CaMV 19S启动子、组蛋白启动子、膨压诱导 型启动子、豌豆小亚基RuBP羧化酶启动子、Ti质粒甘露氨酸合酶启动子、 Ti质粒胭脂碱合酶启动子、矮牵牛(petunia)查尔酮异构酶启动子、豆类甘 氨酸丰富的蛋白质I启动子、CaMV 35S转录物启动子、马铃薯patatin 启动子或S-E9小亚基RuBP羧化酶启动子。

3.转基因表达的测定法

为证实在再生的植物中存在外源DNA,可以开展多种分析法。此类 分析法包括例如分子生物学分析法如Southern印迹和RNA印迹和PCR; 生物化学分析法如检测蛋白质产物的存在,例如通过免疫学方法(ELISA 和蛋白质印迹)或通过酶功能;植物部分的测定如叶或根测定;以及在某些 情况下对完整的再生植物的表型分析。用于确定转基因表达和启动子功能 的效率的其它分析法还包括,但不限于荧光原位杂交(FISH)、直接DNA 测序、脉冲场凝胶电泳(PFGE)分析、单链构象分析(SSCA)、RNA酶保护 分析、等位基因特异性寡核苷酸(ASO)、点印迹分析、变性梯度凝胶电泳、 RT-PCR、定量RT-PCR、RFLP和PCR-SSCP。分析对于本领域技术人 员是已知的(也见下文)。

4.本发明的转化(转基因)植物和制备方法

单子叶植物物种可以用本发明的DNA构建体通过本领域中已知的多 种方法转化。可以转化能够随后克隆性增殖(无论通过器官发生或胚发生) 的任一植物组织。术语“器官发生”如本文中所用意指从分生中心依次地发 育枝条和根的过程;术语“胚发生”如本文中所用意指枝条和根(从体细胞或 配子中)以协调的方式(不是依次)一同发育的过程。所选的特定组织取决于 对所转化特定物种可用的并且是最适合的克隆增殖系统而不同。示例性靶 组织包括叶盘、花粉、胚、子叶、下胚轴、雌配子、愈伤组织、现有分 生组织(例如顶端分生组织、腋芽和根分生组织)和诱导的分生组织(例如 子叶分生组织和ultilane分生组织)。

本发明的植物可以采取多种形式。植物可以是转化细胞和非转化细胞 的嵌合体;植物可以是克隆的转化体(例如所转化的全部细胞均含有表达 盒);植物可以包含转化及未转化组织的移植物(例如移植到柑桔(citus)物 种中的未转化接穗上的已转化砧木)。转化的植物可以通过多种方法增殖, 如通过克隆性增殖或传统育种技术。例如,第一世代(或T1)的转化植物可 以自交以产生纯合的第二世代(或T2)转化植物并且T2植物通过传统育种技 术进一步增殖。显性选择标记(如npt II)可以与表达盒组合以辅助育种。

因此,本发明以植物中(in planta)或植物外(ex planta)方式提供包含已 转化的质体或其它器官(例如细胞核、线粒体或叶绿体)的转化(转基因)单 子叶植物和单子叶植物细胞。本发明可以用来转化任一单子叶植物物种, 包括但是不限于来自以上在“定义”部分中已详述植物物种的细胞。优选地, 本发明的转基因植物是作物植物并且尤其是谷类(例如,玉米、苜蓿、稻、 大麦、高粱、小麦、黍等)并且甚至更优选地是玉米、小麦和稻。本发明的 其它实施方案涉及所述单子叶植物的细胞、细胞培养物、组织、部分(如植 物器官、叶、根等)和繁殖材料(如种子)。

单子叶植物的转化可以用单种DNA分子或多种DNA分子(即共转化) 开展并且这两种技术适用于本发明的表达盒。众多转化载体可用于植物转 化并且本发明的表达盒可以与任一此类载体共同使用。载体的选择将取决 于优选的转化技术和转化的目标物种。

本领域中技术人员可获得并知道用于将构建体导入植物细胞宿主的 多种技术。这些技术通常包括利用根癌农杆菌或发根农杆菌(A. rhizogeneas)作为转化介质的DNA转化法、脂质体法、PEG沉淀法、电 穿孔法、DNA注射法、直接DNA摄取法、微抛射体轰击法、粒子加速法 等(见例如,EP 295959和EP 138341)。然而,除植物细胞以外的细胞也可 以用本发明的表达盒转化。对植物表达载体和报道基因以及农杆菌和农杆 菌介导性基因转移的一般描述可以在Gruber等(1993)中找到。

含有基因组片段或合成片段的表达载体可以导入原生质体或导入完 整组织或分离的细胞。表达载体优选地导入完整组织。培养植物组织的一 般方法例如由Maki等,(1993)以及由Phillips等(1988)提供。优选地,使用 直接基因转移方法如微抛射体介导性递送法、DNA注射法、电穿孔法等, 将表达载体导入玉米或其它植物组织。更优选地,使用微抛射体介导递送 法,用生物射弹装置将表达载体导入植物组织。见,例如Tomes等(1995)。 本发明的载体不仅可以用来表达结构基因,而且还可以用于外显子捕获 (exon-trap)克隆、或启动子捕获(promoter trap)方法以检测多种组织中的 差异性基因表达(Lindsey 1993;Auch和Reth 1990)。

特别优选使用农杆菌某些种的Ti和Ri质粒的双元型载体。Ti衍生的 载体转化类型广泛的高等植物,包括单子叶植物和双子叶植物,如大豆、 棉花、油菜、烟草和稻(Pacciotti 1985:Byrne 1987;Sukhapinda 1987;Lorz 1985;Potrykus,1985;Park 1985:Hiei 1994)。使用T-DNA转化植物细胞 已经受到广泛研究并得到大量描述(EP 120516;Hoekema,1985;Knauf, 1983;和An 1985)。为导入植物,可将本发明的嵌合基因插入如实施例中描 述的双元载体。

本领域技术人员可获得其它转化方法,如外源DNA构建体直接摄取 法(见EP 295959),电穿孔技术(Fromm 1986)或使用以核酸构建体包被的 金属粒子的高速生物射弹轰击法(Kline 1987和US 4,945,050)。一旦转化, 细胞可以由本领域技术人员进行再生。

本领域中技术人员知道转化方法的选择将取决于预定转化的单子叶 植物的类型。适合用于转化植物细胞的方法包括,但不限于微注射法 (Crossway 1986)、电穿孔法(Riggs 1986)、农杆菌介导的转化法、直接基 因转移法(Paszkowski 1984)和其中使用可从Agracetus,Inc.,Madison, Wis.和BioRad,Hercules,Calif.获得的装置的生物射弹粒子加速法(见例 如,US 4,945,050;和McCabe 1988)。还见Datta 1990;(稻);Klein 1988(玉 米);Klein 1988(玉米);Klein 1988(玉米);Fromm 1990(玉米);和 Gordon-Kamm 1990(玉米);Koziel 1993(玉米);Shimamoto 1989(稻); Christou 1991(稻);欧洲专利申请EP 0332581(羊茅草(orchardgrass)和 其它羊茅亚科(Pooideae));Vasil 1993(小麦);Weeks 1993(小麦),Li 1993 和Christou 1995(稻);Osjoda 1996(玉米,借助根癌农杆菌),稻(Hiei 1994) 和谷物(Gordon-Kamm 1990;Fromm 1990),其中全部文献在本文中引用 作为参考。

在产生转化植物的方法中使用含有包含本发明表达盒的载体的根癌 农杆菌细胞,其中所述的载体包含Ti质粒。植物细胞用如上所述的根癌 农杆菌感染以产生转化的植物细胞并随后使植物从转化的植物细胞再生。 已知用于实施本发明的众多农杆菌载体系统。可以采用多种农杆菌菌株, 优选卸甲的根癌农杆菌菌株或发根农杆菌菌株。在优选的实施方案中,用 于实施本发明的农杆菌菌株包括章鱼碱菌株(例如LBA4404)或农杆碱菌株 (例如EHA101或EHA105)。适合用于DNA转移的根癌农杆菌菌株例如 是EHA101[pEHA101](Hood 1986)、EHA105[pEHA105](Li 1992)、 LBA4404[pAL4404](Hoekema 1983)、C58C1[pMP90](Koncz&Schell 1986)和C58C1[pGV2260](Deblaere 1985)。其它合适的菌株是根癌农杆菌 胭脂碱菌株C58。其它合适的菌株是根癌农杆菌C58C1(Van Larebeke 1974)、A136(Watson 1975)或LBA4011(Klapwijk 1980)。在另一个优选的 实施方案中,土源细菌是发根农杆菌菌株K599(NCPPB 2659)的卸甲变体。 优选地,这些菌株包含了提供T-DNA转移至植物细胞内的所需功能(例如 vir基因)的Ti质粒或Ri质粒的卸甲质粒变体。在优选的实施方案中,用 来转化与植物酚类化合物预培养的植物组织的农杆菌菌株含有L,L-琥珀 碱型(succinamopine type)Ti-质粒,优选地卸甲的L,L-琥珀碱型Ti-质 粒,如pEHA101。在另一个优选的实施方案中,用来转化与植物酚类化合 物预培养的植物组织的农杆菌菌株含有章鱼碱型Ti-质粒,优选地卸甲的 章鱼碱型Ti-质粒,如pAL4404。当使用章鱼碱型Ti-质粒或辅助质粒时, 优选使virF基因缺失或失活(Jarschow 1991)。

本发明方法还可以与特定的农杆菌菌株组合使用以进一步增加转化 效率,如其中vir基因的表达和/或其引入因存在突变性或嵌合的virA或 virG基因而受到改变的农杆菌菌株(例如Hansen 1994;Chen和Winans 1991;Scheeren-Groot,1994)。优选根癌农杆菌菌株LBA4404(Hiei 1994) 与超强毒性质粒的进一步组合。这些质粒优选地是基于pTOK246的载体 (Ishida 1996)。

双元载体或其它任何载体可以通过常规DNA重组技术得以修饰,在 大肠杆菌中增殖并通过例如电穿孔或其它转化技术(Mozo和Hooykaas 1991)导入农杆菌。

农杆菌以类似Ishida(1996)所述的方式进行培养和使用。包含载体的 农杆菌菌株例如可以在补充适宜抗生素(例如50mg/L壮观霉素)的YP 培养基(5g/L酵母提取物、10g/L蛋白胨、5g/L NaCl、15g/L琼脂、pH 6.8) 上培育3日。细菌用接种环从固体培养基上收集并重悬。在本发明的优选 实施方案中,以使用在-80℃冷冻的等分试样开始培养农杆菌。

农杆菌对靶组织(例如不成熟的胚)的转化可以通过仅将靶组织与农杆 菌接触而实施。可能需要变动用于感染和共培养的农杆菌浓度。例如,制 备农杆菌的细胞混悬液,其中所述的细胞混悬液具有大约105-1011、优选 106至1010、更优选约108个细胞或cfu/ml的群体浓度并且将靶组织浸泡 在这种混悬液内约3至10分钟。得到靶组织随后在固体培养基上与农杆 菌一起培养数日。

优选地,以106至1010cfu/mL的浓度使用细菌。在对共培养步骤的 优选实施方案中,在共培养介质中将约1至10μl的土源细菌(例如农杆 菌)混悬液直接施加至每种靶组织外植体并进行空气干燥。这节省劳动力 和时间并减少由于过量使用农杆菌所致的非故意的农杆菌介导的损伤。

对于农杆菌处理,将细菌重悬于植物兼容的共培养介质中。用可减少 因植物防御应答(如酚氧化作用)所致的组织坏死的抗氧化剂(例如硝酸银)、 酚吸收性化合物(如聚乙烯吡咯烷酮,Perl 1996)或巯基化合物(例如二硫苏 糖醇、L-半胱氨酸,Olhoft 2001)对共培养介质补充还可以改善农杆菌介导 的转化的效率。在另一个优选的实施方案中,共培养介质包含至少一种巯 基化合物,该巯基化合物优选地选自硫代硫酸钠、二硫苏糖醇(DTT)和半胱 氨酸。浓度优选地是在约1mM和10mM之间的L-半胱氨酸、0.1mM至 5mM DTT和/或0.1mM至5mM硫代硫酸钠。优选地,在共培养期间使 用的培养基包含约1μM至约10μM的硝酸银和约50mg/L至约1,000 mg/L的L-半胱氨酸。这导致明显降低靶组织对农杆菌介导的损伤(如诱导 的坏死)的脆弱性并明显改善整体转化效率。

多种载体系统可以与农杆菌组合使用。优选双元载体系统。常见双元 载体基于“广宿主范围”质粒,如衍生自P-型质粒RK2的质粒如pRK252 (Bevan 1984)或pTJS75(Watson 1985)。这些载体大部分是pBIN19(Bevan 1984)的衍生物。多种双元载体是已知的,其中某些可商业地获得,例如 pBI101.2或pBIN19(Clontech Laboratories,Inc.USA)。其它载体在大小 和操作性方面得到改良(例如pPZP;Hajdukiewicz 1994)。改良的载体系统 还在WO 02/00900中描述。

使用直接基因转移或农杆菌介导的转移形式的方法通常但不必需与 选择标记一起实施,其中所述的选择标记可以提供对抗生素(例如卡那霉 素、潮霉素或甲氨蝶呤)或除草剂(例如膦丝菌素)的抗性。然而,选择用于 植物转化的选择标记对本发明不重要。

对于某些植物物种,可以优选不同的抗生素选择标记或除草剂选择标 记。转化中常规使用的选择标记包括赋予卡那霉素抗性和相关抗生素抗性 的nptII基因(Messing和Vierra,1982;Bevan 1983)、赋予除草剂膦丝菌 素抗性的bar基因(White 1990,Spencer 1990)、赋予抗生素潮霉素抗性的 hph基因(Blochlinger和Diggelmann)和赋予甲氨蝶呤抗性的dhfr基因 (Bourouis 1983)。

5.产生和表征稳定转化的植物。

随后将转基因植物细胞放置在适宜的选择性培养基中以选择转基因 细胞,其中所述的转基因细胞随后培育成愈伤组织。从愈伤组织中培育出 枝条。通过在生根培养基中培育从枝条生成小植物。多种构建体通常连接 有在植物细胞中用于选择的选择标记。便利地,标记可以抵抗杀生物物质 (特别是抗生素(如卡那霉素、G418、博来霉素、潮霉素、氯霉素)、除草剂 等)。与缺乏已导入DNA的细胞比较时,所用的特定标记将允许选择转化 的细胞。包括本发明转录盒的DNA构建体的成分可以从对宿主是天然(内 源性)或外来(外源)的序列中制备。“外来的”意指在导入构建体的野生型宿 主中找不到该序列。异源构建体将含有对衍生转录启动区的基因是非天然 的至少一个区域。

为证实转基因细胞和转基因植物存在外源DNA,可以开展多种分析 法。如此分析法例如包括本领域技术人员众所周知的“分子生物学”分析法, 如Southern印迹和RNA印迹,原位杂交和基于核酸的扩增方法如PCR 或RT-PCR或TaqMan;“生物化学”分析法,如检测蛋白质产物的存在, 例如通过免疫学方法(ELISA和蛋白质印迹)或通过酶功能;植物部分测定 如种子测定;并且还包括分析完整的再生植物的表型,例如对疾病抗性或 害虫抗性分析。

可以从细胞系或任一植物部分中分离DNA以便通过使用本领域技术 人员众所周知的技术确定存在预选择的核酸节段。应当指出完整序列并非 总是存在,其可能原因是所述序列在细胞内的重排或缺失。

可以通过聚合酶链式反应(PCR)确定由本发明方法所导入的核酸元件 的存在。使用这些技术,扩增并通过凝胶电泳检测核酸的预期片段。这种 类型的分析允许确定预选择的核酸节段是否存在于稳定的转化体,但是没 有证明导入的预选择核酸节段整合至宿主细胞基因组中。此外,不可能使 用PCR技术来确定转化体是否使外源基因导入基因组中的不同位点处, 即转化体是否有独立的来源。考虑了使用PCR技术,将有可能克隆毗邻 已导入的预选择DNA节段的宿主基因组DNA片段。

DNA整合至宿主基因组中和转化体独立身份的直接证据可以使用 Southern杂交技术确定。使用该技术,可以鉴定导入宿主基因组并分布在 宿主DNA序列侧翼的特定DNA序列。因此,给定转化体的Southern杂 交模式充当该转化体的鉴定性特征。此外,有可能通过Southern杂交来证 实已导入的预选择DNA节段存在于高分子量DNA中,即证实导入的预 选择DNA节段已经整合至宿主细胞基因组中。Southern杂交技术提供了 使用PCR所获得的信息,例如预选择DNA节段的存在,而且还证实基因 组整合并表征每个单独的转化体。

认为使用作为Southern杂交技术的改良技术:点杂交或狭线印迹杂交 技术可以获得从PCR中推导出的相同信息,例如预选择DNA节段的存在。

PCR和Southern杂交技术均可以用来证实预选择DNA节段传递至子 代。在大多数情况下,对给定转化体的特征性Southern杂交模式将在子代 中分离为说明基因稳定遗传的一个或多个孟德尔基因(Spencer 1992); Laursen 1994)。通过生殖系传递和相同的DNA印迹分析杂交模式及转化 性DNA在愈伤组织、R0植物和对所转化基因分离的R1子代中的密集度而 显示愈伤组织和亲代转化体(R0)的非嵌合本质。

尽管DNA分析技术可以利用分离自植物任一部分的DNA进行,RNA 可能仅表达于特定细胞或组织型并且因此需要从这些组织中制备用于分 析的RNA。PCR技术还可以用于检测和定量从预选择的DNA节段中产 生的RNA。在PCR的这种应用中,首先需要使用酶如逆转录酶,将RNA 逆转录成DNA并随后利用常规PCR技术扩增DNA。在大多数情况下, 尽管PCR技术有用,但它没有证实RNA产物的完整性。关于RNA产物 本质的其它信息可以通过RNA印迹获得。该技术将证实RNA种类的存在 并产生关于该RNA完整性的信息。RNA种类的存在或不存在还可以点印 迹或狭线印迹Northern杂交确定。这些技术是RNA印迹法的修改并仅证 实RNA种类的存在或不存在。

尽管DNA印迹分析和PCR可以用来检测预选择的所讨论DNA节段, 然而它们不提供例如是否表达预选择的DNA节段的信息。表达可以通过 特异性地鉴定预选择DNA节段的蛋白质产物或评估因这些蛋白质产物表 达所致的表型改变进行评价。

用于特定蛋白质的产生和鉴定的分析法可以利用蛋白质的物理化学、 结构、功能或其它特性。独特的物理化学特征或结构特性允许通过电泳方 法(如天然凝胶或变性凝胶电泳或等电聚焦法)或色谱技术(如离子交换或凝 胶排阻色谱)分离并鉴定蛋白质。各种蛋白质的独特结构提供在测定(如 ELISA测定)中利用特定抗体来检测蛋白质存在的可能。可以采用具有甚 至更强特异性的方法的组合,如在其中使用抗体来确定已通过电泳技术分 离的各个基因产物的蛋白质印迹法。可以采用其它技术来绝对地证实目的 产物身份,如通过纯化后的氨基酸测序评估。虽然这些方法属于最常见使 用的方法,然而也可以使用其它方法。

测定方法还可以用来通过蛋白质功能、尤其酶催化包含特定底物和产 物的特定化学反应的能力而鉴定蛋白质的表达。这些反应可以通过在反应 中提供底物并由物理方法或化学方法测定底物的丧失或产物的生成而进 行。实例随着待分析的酶而不同。

基因产物的表达最经常地通过评估基因产物表达的表型结果而确定。 这些分析法还可以采取众多形式,包括但不限于分析植物的化学组成、形 态学或生理特性的改变。形态学改变可以包括更大的株型或更厚实的茎。 最经常的是在精心控制的条件定义的生物测定法中评估对所施加处理应 答的植物或植物部分的改变。可以培育两个或多个世代以确信稳定维持和 遗传所需要的表型特征在目的条件下的组织优先地表达。

6.转基因植物的用途

一旦将本发明的表达盒转化至特定的植物种中,则使用传统育种技 术,可以在所述物种中增殖该表达盒或使之移动到相同物种的其它品种 中,尤其包括商业品种。本发明特别优选的植物包括上文所列的农学重要 的作物。工程化至以上所述的转基因种子或转基因植物中的遗传特性通过 有性繁殖进行传递并且因此可以在子代植物中得到维持和增殖。本发明还 涉及从转基因植物中获得的转基因植物细胞、组织、器官、种子或植物部 分。本发明还包括植物的转基因后代以及从该后代中获得的转基因植物细 胞、组织、器官、种子和植物部分。

优选地,转基因植物中的表达盒以有性方式传递。在一个优选的实施 方案中,编码序列通过R0植物的完整正常有性周期以有性方式传递至R1世代。还优选表达盒在转基因植物细胞、组织、种子或植物中以这样的量 表达,其中所述的量与差异仅在于缺少所述表达盒的植物细胞、组织、种 子或植物中的量不同。因此,预期本文中产生的转基因植物用于多种商业 目的和研究目的。可以产生转基因植物用在传统农业中,以便种植者获得 益处(例如农学性状如水匮乏抗性、害虫抗性或提高的产量),消费者从该 植物中所收获的谷粒中获得益处(例如人食品或动物饲料内改善的营养含 量;维生素、氨基酸和抗氧化剂含量增加,产生抗体(被动免疫)和营养品) 或食品加工者获得益处(例如改善的加工性状)。在此类用途中,通常为在 人食物或动物饲料中使用植物的谷粒而培育植物。此外,转基因植物中根 特异性启动子的使用可以提供局限于(动物和人)可消费的植物根(如胡萝 卜、欧防风(parsnips)和甜菜)中的有益性状。然而,植物的其它部分, 包括茎、壳、营养部分等还可以具有用途,包括用作动物青贮饲料的部分 或化妆品目的。通常提取玉米和其它作物的化学成分(例如油或淀粉)用于 食品或工业用途,并且可以产生具有增强或改良的此类成分的转基因植 物。

转基因植物还可以用于商业地制造蛋白质或其它分子,其中从植物部 分或种子等中提取或纯化目的分子。还可以培养、体外生长或发酵来自该 植物的细胞或组织以制造此类分子。转基因植物还可以在商业育种计划内 使用或可以与相关的作物植物物种杂交或育种。由表达盒编码的改良可以 例如从玉米细胞转移至其它物种的细胞,例如通过原生质体融合。

所述转基因植物可以在研究或育种中具有众多用途,包括通过插入性 诱变而产生新的突变植物,以鉴定可能随后通过传统突变和选择法产生的 有益突变体。实例是导入编码可用来生成遗传变异的转座元件的重组DNA 序列。本发明方法还可以用来产生具有可用于鉴定专有品系或品种的独特 “标签序列”或其它标记序列的植物。

因此,本发明的转基因植物和转基因种子可以用于旨在开发如此植物 的植物育种中使用,其中所述植物具有由表达盒所赋予的改良特性,如对 干旱、疾病或其它胁迫的耐受性。多种育种步骤由充分定义的人类干预加 以表征,如选择待杂交的系、亲代系的定向授粉或选择适宜的后代植物。 根据需要的特性,采用不同的育种措施。相关技术在本领域中是众所周知 的并且包括但不限于杂交、近交、回交、并行育种(multilane breeding)、 品种混杂、种间杂交、非整倍体的技术等。杂交技术还包括通过机械方法、 化学方法或生物化学方法致植物不育,以产生雄性不育或雌性不育植物。 用不同品系的花粉对雄性不育植物交叉授粉确保雄性不育植物的基因组 而非雌性能育植物的基因组均匀地获得两个亲代系的特性。因此,本发明 的转基因种子和转基因植物可以用于对改良植物品系进行育种,例如因所 述植物改良的遗传特性而增加常规方法如除草剂处理或杀虫剂处理的效 率或允许替代所述方法。或者,可以获得具有改善的胁迫耐受性的新作物, 所述的新作物因其优化的遗传“装置”而产生这样的收获产物,其质量比不 能够耐受相当的不利发育条件的产物更好。

因此在一个进一步的实施方案中,本发明涉及本申请的核酸分子用于 优先地或特异性地在胚组织或胚细胞中表达目的基因的用途。

另外,在另一个实施方案中,本发明涉及本发明的核酸分子用于增加 胁迫条件下的植物中核酸分子转录的用途。

在另一个实施方案中,本发明涉及用于产生植物的方法,所述植物具 有提高的产量和/或提高的胁迫耐受性和/或提高的营养品质和/或植物的种 子或籽苗的提高或改善的油含量,其中所述方法包括步骤

A)向所述植物导入本发明的核酸分子、本发明的表达盒或本发明的 表达载体,其中所述的核酸分子有效连接至至少一个核酸分子,所述的至 少一个核酸分具有相对于所述第一或第二核酸序列是异源的序列并且能 够向该植物赋予提高的产量和/或提高的胁迫耐受性、提高的营养品质和/ 或提高或改善的油含量;和

B)选择转基因植物,其中与野生型或无效分离子植物相比较,所述植 物具有提高的产量和/或在胁迫条件下提高的胁迫耐受性,和/或提高的该 植物种子或籽苗营养品质和/或提高或改善的油含量。

序列

                                                             

                编码拟南芥Cor78基因的转录调节性核苷酸序

SEQ ID NO:1

                列的核酸序列

SEQ ID NO:2    pBPSMM368双元载体的核酸序列

SEQ ID NO:3    编码Os.BPSI.1内含子的核酸序列

SEQ ID NO:4    编码Zm.遍在蛋白内含子的核酸序列

SEQ ID NO:5    Cor78启动子正向引物

                5’-gcaagaatct caaacacgga gatctca-3’

SEQ ID NO:6    Cor78启动子反向引物

                5’-atttgtgagt aaaacagagg agggtctca-3’

SEQ ID NO:7    BPSI.1-5’引物

                5’-cccgggcaccctgcggagggtaagatccgatcacc-3’

SEQ ID NO:8    BPSI.1-3’引物

                      5’-cggaccggtacatcttgcatctgcatgtac-3’

                      位于At.cor78第4-18位置的CCAF/CCA1.01基

SEQ ID NO:9

                      序

                      gccgcaagaa tctca

SEQ ID NO:9-138      如表9中描述

SEQ ID NO:139-144    如图4a-4c和图5中描述

实施例

材料和通用方法

除非另外说明,实施例中的化学品和试剂从Sigma Chemical Company (St.Louis,MO)获得,限制性核酸内切酶获自New England Biolabs (Beverly,MA)或Roche(Indianapolis,IN),寡核苷酸由MWG Biotech Inc.(High Point,NC)合成并且其它关于生物化学分析或分子生物学分析 的修饰酶试剂盒来自Clontech(Palo Alto,CA)、Pharmacia Biotech (Piscataway,NJ)、Promega Corporation(Madison,WI)或Stratagene(La Jolla,CA)。用于细胞培养基的材料从Gibco/BRL(Gaithersburg,MD)或 DIFCO(Detroit,MI)获得。如Sambrook(1989)所述实施用于本发明目的 的克隆步骤,例如,限制性切割、琼脂糖凝胶电泳、纯化DNA片段、转 移核酸至纤维素和尼龙膜、连接DNA片段、转化大肠杆菌细胞、培养细 菌、增殖噬菌体和重组DNA的序列分析。按照Sanger方法(Sanger 1977) 使用ABI激光荧光DNA序列仪来开展重组DNA分子测序。

为了产生转基因植物。将根癌农杆菌(菌株C58C1[pMP90])以多种启 动子::GUS载体构建体(参见下文)转化。所得农杆菌菌株随后用来获得转 基因植物。为此目的,将分离的经转化农杆菌菌落在28℃于4mL培养基 (培养基:含50μg/mL卡那霉素和25μg/mL利福平的YEB培养基)中孵育 过夜。400ml相同的培养基用这种培养物接种并孵育过夜(28℃,220转 /分钟)。细菌通过离心法沉淀(GSA转头,8000U/分钟,20分钟)并将沉淀 物重悬在浸润培养基(1/2MS培养基;0.5g/L MES,pH 5.8;50g/L蔗糖) 中。将混悬液置于植物箱(Duchefa)内,并且添加100mL SILVET L-77(Osi Special-ties Inc.,目录号P030196)至终浓度0.02%。具有8-12株植物的植 物箱置于干燥器内真空下10-15分钟,随后自然通风(扩散)。此过程重复 2-3次。此后,将全部植物转移至含湿润土壤的花钵中并在长日照条件下 培育(16小时日照;昼间温度22-24℃,夜间温度19℃;65%相对湿度)。6 周后收获种子。

实施例1.载体构建

产生了含有BPSI.1内含子的拟南芥属植物cor78启动子构建体 (pBPSMM368;图1)或不含有BPSI.1内含子的拟南芥属植物cor78启动 子构建体(pBPSMM250)(表6)。出于比较目的,将BPSI.1内含子替换为玉 米遍在蛋白内含子(pBPSMM346)。赋予内含子介导的增强作用(IME)的内 含子如BPSI.1和Zm.遍在蛋白内含子亚克隆至表达盒的5’非翻译区 (UTR)。

表6.GUS嵌合构建体

  双元载体   表达盒的组成   (启动子::内含子::报道基因::终止子)   pBPSMM250   At.cor78启动子::GUS::NOS3’   pBPSMM346   At.cor78启动子::Zm.遍在蛋白内含子::GUS::NOS 3’   pBPSMM368   At.cor78启动子::BPSI.1内含子::GUS::NOS3’

实施例2.单子叶植物转化

也可以实施使用标准的转化和再生技术进行农杆菌介导的植物转化 法,以转化作物植物(Gelvin 1995;Glick 1993)

玉米或其他单子叶植物的转化可以使用例如在US 5,591,616中描述的 技术实施。

使用粒子轰击法、聚乙二醇介导的DNA摄入法或通过碳酸硅纤维技 术转化植物例如由Freeling和Walbot 1993描述。

实施例3.报道基因表达的检测

为鉴定带来组织特异性的启动子的特征和该启动子的必需元件,需要 将启动子自身及其多种片段置于允许测定表达活性的所谓报道基因的前 面。可提到的实例是细菌的β-葡糖醛酸糖苷酶(Jefferson 1987a)。β-葡糖醛 酸糖苷酶活性在植物中借助生色底物如5-溴-4-氯-3-吲哚基-β-D-葡糖醛酸 于活性染色法(Jefferson 1987b)中进行检测。为研究组织特异性,植物组织 如(例如1991b)所述进行切割、包埋、染色和分析。

第二种分析法允许定量确定所研究组织中的GUS活性。为定量的活 性确定,使用MUG(4-甲基伞形基-β-D-葡糖苷酸)作为β-葡糖醛酸糖苷酶 的底物并且MUG被切割成MU(甲基伞形酮)和葡糖醛酸。

为做到这点,首先制备目的组织的蛋白质提取物并随后添加底物GUS 至该提取物。底物可以仅在GUS已经得到反应后用荧光测定法测量。在 多个时间点处收集随后于荧光计中得到测量的样品。该测定法可以用例如 处于各种发育阶段(开花后21日,24日或30日)的亚麻籽胚实施。为此目的, 在任何情况下,将一个胚在2mL反应容器在液氮中借助振动研磨机(型 号:Retsch MM 2000)研磨成粉末。在添加100μL的EGL缓冲液(0.1M KPO4、pH 7.8;1mM EDTA;5%甘油;1M DTT)后,将混合物在25℃ 和14,000xg离心10分钟。移走并再次离心上清液。再次将上清液转移至 新的反应容器并在冰上保存直至进一步使用。25μL的这种蛋白质提取物用 65μL的EGL缓冲液(无DTT)处理和用于GUS测定法中。现在添加10 μL底物MUG(10mM 4-甲基伞形基-β-D-葡糖苷酸),涡旋混合该混合物 并且立即取出30μL作为零值并用470μL终止缓冲液(0.2M Na2CO3)处 理。该方法以30秒间隔重复用于全部样品。采集的样品贮藏在冰箱内直至 进行测量。在1小时和在2小时后获得其它读数。对荧光测量法建立含有 0.1mM至10mM MU(4-甲基伞形酮)浓度的校正系列。如果样品值在这 些浓度之外,使用较少的蛋白质提取物(来自1∶10稀释的10μL、1μL、1μL) 并且测量更短的间隔期(0小时、30分钟、1小时)。在Fluoroscan II装置 (Lab系统)中在365nm激发和445nm发射处实施测量。作为备选,底物 切割可以如Bustos(1989)中所述以荧光测量方式在碱性条件下监测(在365 nm激发,测量在455nm的发射;Spectro荧光计BMG Polarstar+)。全 部样品通过Bradford(1976)蛋白质浓度测定方法测定蛋白质浓度,因此允 许鉴定多种组织和植物中的启动子活性和启动子强度。

实施例4.玉米中的胚特异性表达

构建体pBPSMM368在胚、尤其在盾片中高度表达,而使用GUS组 织化学测定法几乎检测不到在胚乳中的染色(图2)。这种强的胚特异性表达 在萌发期间维持。构建体pBPSMM368在根或叶中不表达。然而,在 At.cor78启动子与Zm.遍在蛋白内含子组合的构建体(pBPSMM346)中检 测不到这种胚特异性表达。用pBPS346转化的转基因玉米植物显示组成型 表达,不过整体上极为微弱。构建体pBPSMM250在分析的任意组织中不 表达。

表7.受单子叶植物候选的组成型启动子控制的GUS表达

1作为组成型启动子的阳性对照(pBPSMM232=Zm.遍在蛋白启动 子::Zm.遍在蛋白内含子::GUS(PIV2)::NOS终止子;通过组织化学测定法 测量的GUS表达水平范围(-至+++++),ND:还未测定,2含有pBPSMM368 的转基因植物在胚轴的第一节间结区中显示微弱表达,在胚轴其他区域中 几乎不显示表达,所述的胚轴其他区域包括初生根、胚芽、茎、叶和胚芽 鞘。3吸胀(萌发)3日(72小时)后,含有pBPSMM346的转基因植物在胚根 和整个种子中显示表达,不过含有pBPSMM368的那些转基因植物显示主 要限于盾片中的表达。

实施例5.干旱诱导的表达

含有pBPSMM250(不含赋予内含子介导的增强作用的内含子)的转基 因玉米植物在干旱胁迫下不显示可诱导的表达(在5叶簇阶段、断水4日、 8日、13日后)。为了增强转基因的表达,将Zm.遍在蛋白内含子添加至 At.cor78启动子构建体的5’UTR以产生pBPSMM346构建体。含有 pBPSMM346的5叶簇阶段转基因玉米植物用于干旱胁迫试验。使用定量 RT-PCR在T0植物中检测到干旱诱导的表达。基于这种敏感测定法,在 干旱胁迫下检测到3.5倍的诱导。当用定量PCR测定时,诱导达3.5倍(图 3)。

实施例6.转基因作物的利用

pBPSMM368中的报道基因可以替换为旨在以胚特异性方式表达并赋 予生物性和非生物性环境胁迫耐受性的目的基因。将嵌合构建体转化至单 子叶植物。根据需要,可以使用本领域的标准转化方法。转化植物使用已 知方法再生。测量了多种表型以确定改善了生物量、产量、脂肪酸组成、 高油含量、疾病耐受性或与产量增强或产量稳定性关联的任一其它表型。 在不同发育阶段上和在不同世代(T0至T2植物或其他世代)上测定基因表达 水平。在植物中评价的结果导致确定与这种启动子组合以提高产量、改善 疾病耐受性和/或改善非生物胁迫耐受性的合适基因。

实施例7.单子叶植物中选择标记基因的表达

pBPSMM368中的报道基因可以替换为一种选择标记基因并转化至单 子叶植物如玉米、小麦、稻、大麦、黑麦、谷子、高粱、黑麦草或薏苡、 小黑麦、甘蔗或燕麦,但不限于这些植物物种。根据需要,可以使用本领 域的标准转化方法。经转化的植物在目的选择剂下选择并使用已知方法再 生。在组织或组织培养细胞的发育早期阶段检验选择方案。可以在不同发 育阶段上和在不同世代(T0至T2植物或其他世代)上测定基因表达水平。在 植物中评价的结果导致确定与这种启动子组合的合适基因。

实施例8.缺失分析

克隆方法由Rouster(1997)和Sambrook(1989)描述。启动子的详细作 图(即缩减到与启动子特异性有关的核酸节段)通过产生多种报道基因表 达载体实施,其中所述的报道基因表达载体首先含有完整启动子区并且其 次含有该完整启动子区的多种片段。首先,将完整启动子区或其片段克隆 入含有GUS或其它报道基因的双元载体中。为此目的,首先使用这样的 片段,所述片段通过使用识别全长启动子序列中的内部限制性切割位点的 限制酶获得。其次,使用具有由引物导入的切割位点的PCR片段。使用 本领域中的转化方法,将含有多种缺失型启动子的嵌合GUS构建体转化 入玉米、拟南芥属植物和其它植物物种中。启动子活性通过使用GUS组 织化学测定法或其它适宜方法分析不同发育阶段的多种组织和器官。根据 需要,对所述启动子序列的修饰可以消除渗漏。

实施例9.体内诱变

技术人员熟知用于修饰启动子活性或鉴定重要启动子元件的多种方 法。这些方法中的一种方法是基于随机突变,随后用如上所述的报道基因 进行检测。微生物的体内诱变可以通过质粒(或另一种载体的)DNA经其中 维持遗传信息完整性的能力被破坏的大肠杆菌或其它的微生物(例如芽孢 杆菌某些种(Bacillus spp.)或酵母如酿酒酵母)传代而来实现。常用的突变 菌株在用于DNA修复系统的基因(例如mutHLS,mutD,mutT等;参见 Rupp 1996)中具有突变。技术人员熟知这些菌株。这些菌株的使用例如由 Greener(1994)阐述。优选地在选择和测试微生物之后将突变的DNA分子 转移至植物中。如上所述产生并分析转基因植物。

实施例10.用于过量表达的载体构建和基因“敲除”实验

10.1过量表达

设计用于植物中全长目的“候选基因”表达(过量表达)的载体,以过量 表达目的蛋白质,并且根据待用的植物转化方法,所述载体分为两个通用 类型:生物射弹型(biolistic)和双元型。

对于生物射弹转化(生物射弹型载体),要求如下:

1.主链,其具有细菌的选择标记(一般是抗生素抗性基因)和在大肠埃 希氏菌中有功能的复制起点(大肠杆菌;例如ColE1),和

2.植物特异性部分,其由以下部分组成:

a.由启动子(例如ZmUBIint MOD)、目的基因(一般是全长cDNA)和 转录终止子(例如根癌农杆菌nos终止子)组成的基因表达盒;

b.植物选择标记盒,其由合适的启动子、选择标记基因(例如D-氨基酸 氧化酶;dao1)和转录终止子(例如nos终止子)组成。

设计用于根癌农杆菌转化的载体(A.tumefaciens;双元载体)由以下部 分组成:

1.主链,其具有携带在大肠杆菌和根癌农杆菌中均有功能的细菌选择 标记(例如由aadA基因介导的壮观霉素抗性)和在每一前述细菌宿主中有 功能的两个复制起点,以及根癌农杆菌virG基因;

2.如上文对生物射弹型载体所述的植物特异性部分,但是在这种情况 下,例外的是该部分在侧翼具有根癌农杆菌右边界和左边界序列,其中所 述序列介导侧翼具有这两个序列的DNA转移至植物。

10.2基因沉默载体

对应于用来下调基因表达的方法,设计用来降低或消除单个基因或基 因家族或相关基因表达的载体(基因沉默载体)也分为两个通用类型:反义 或双链RNA干扰(dsRNAi)。

(a)反义

对于反义载体,全长或部分基因片段(一般是cDNA的一部分)可以在 对于全长表达所描述的相同载体中作为基因表达盒的部分使用。对于反义 介导的基因表达下调,基因或基因片段的编码区将相对于所述启动子处于 相反方向;因此,mRNA将在植物中从非编码(反义)链产生。

(b)dsRNAi

对于dsRNAi载体,在基因表达盒中使用部分基因片段(一般长300-500 碱基对),且所述片段以有义和反义两个方向表达,其中所述的部分基因片 段由间隔区(一般是植物内含子,例如OsSH1内含子1或选择标记,例如 赋予卡那霉素抗性的选择标记)隔开。设计这种类型的载体以形成双链 mRNA茎,所述的双链mRNA茎因两个互补性基因片段在植物中碱基配 对而产生。

设计用于过量表达或敲除的生物射弹载体或双元载体可以在众多方 面不同,包括例如在植物和细菌中使用的选择标记、在基因表达盒和植物 选择标记盒中所用的转录终止子和用于克隆目的基因或目的基因片段的 方法学(一般是常用的限制性酶介导的方法或基于GatewayTM重组酶的克 隆法)。

实施例11.At.Cor78启动子(SEQ ID NO:1)的推定的转录因子结合位 点分析

基于下文给出的Genomatix结果,潜在的TATA盒可位于SEQ ID NO:1的第790-804位碱基对。

表8在如SEQ ID NO:1所述的At.cor78启动子中鉴定到的启动子 元件簇。

表9At.cor78(SEQ ID NO:1)中鉴定的具有以下SEQ ID NO的启动子 基序和核心启动子基序

  启动子基序名称   在At.cor78   中的位置   序列   链   SEQ ID NO:   AGP1/AGP1.01基序   18-28   ggaGATCtcaa   (+)   9

  AGP1/AGP1.01核心基序   nnngatcnnn n   10   MYBL/MYBPH3.02基序1   55-71   gtaagtTTGTtttgagt   (-)   11   MYBL/MYBPH3.02基序2   110-126   aacattTTGTtacaaaa   (-)   18   MYBL/MYBPH3.02核心基序   nnnnnnttgt nnnnnnn   12   MADS/AGL15.01基序1   66-86   actTACGaaatttaggtagaa   (+)   13   MADS/AGL15.01核心基序1   nnntacgnnn nnnnnnnnnn n   14   MADS/AGL15.01基序2   89-109   aatTACAatataatgtatata   (-)   15   MADS/AGL15.01基序3   90-110   ataTACAttatattgtaattt   (+)   16   MADS/AGL15.01核心基序2   nnntacannn nnnnnnnnnn n   17   MADS/AGL15.01基序4   557-577   actTACTattattagtagtcg   (-)   89   MADS/AGL15.01核心基序4   nnntactnnn nnnnnnnnnn n   90   MADS/AGL15.01基序5   558-578   gacTACTaataatagtaagtt   (+)   91   SEF4/SEF4.01基序   123-133   tgTTTTtatta   (+)   19   SEF4/SEF4.01核心基序   nnttttnnnn n   20   AHBP/HAHB4.01基序1   127-137   tttattATTAt   (+)   21   AHBP/HAHB4.01核心基序   nnnnnnatta n   22   AHBP/HAHB4.01基序2   130-140   attattATTAt   (+)   23   AHBP/HAHB4.01基序3   300-310   aagatcATTAt   (+)   61   AHBP/HAHB4.01基序4   563-573   actattATTAg   (-)   92   GTBX/SBF1.01基序1   147-163   ttactggTTAAattaaa   (+)   24   GTBX/SBF1.01核心基序   nnnnnnntta annnnnn   25   GTBX/SBF1.01基序2   402-418   cgtaaaaTTAAaattga   (-)   75   GAPB/GAP.01基序1   161-175   aaaaATGAatagaaa   (+)   26   GAPB/GAP.01核心基序   nnnnatgann nnnnn   27   GAPB/GAP.01基序2   215-229   aaatATGAaaaaata   (-)   40   DOFF/PBOX.01基序1   166-182   tgaatagaAAAGgtgaa   (+)   28   DOFF/PBOX.01核心基序1   nnnnnnnnaa agnnnnn   29   DOFF/PBOX.01基序2   362-378   tcctttgtAAATacaaa   (+)   73   DOFF/PBOX.01核心基序2   nnnnnnnnaaa tnnnnn   74   IBOX/IBOX.01基序   167-183   gaataGAAAaggtgaat   (+)   30   IBOX/IBOX.01核心基序   nnnnngaaan nnnnnnn   31

  NCS1/NCS1.01基序6   172-182   gAAAAggtgaa   (+)   32   NCS1/NCS1.01核心基序1   naaaannnnn n   33   NCS1/NCS1.01基序1   246-256   tAAAAgtttac   (+)   51   NCS1/NCS1.01基序3   426-436   tAAAAgatcat   (+)   80   NCS1/NCS1.01基序4   649-659   tAAAAgatata   (+)   105   NCS1/NCS1.01基序5   688-698   aAAAAgatcaa   (+)   109   NCS1/NCS1.01基序2   200-210   aAAATgtttac   (-)   36   NCS1/NCS1.01核心基序2   naaatnnnnn n   37   OCSE/OCSL.01基序1   195-215   agaagaaaatgtttACCTcct   (-)   34   OCSE/OCSL.01核心基序1   nnnnnnnnnn nnnnacctnn n   35   OCSE/OCSL.01基序2   762-782   agagataaagggacACGTatg   (-)   128   OCSE/OCSL.01核心基序2   nnnnnnnnnn nnnnacgtnn n   129   MADS/SQUA.01基序   209-229   ttcttctATTTtttcatattt   (+)   38   MADS/SQUA.01核心基序   nnnnnnnatt tnnnnnnnnn n   39   MYBS/MYBST1.01基序   226-242   taatttATCCtgaaaat   (-)   41   MYBS/MYBST1.01核心基序   nnnnnnatcc nnnnnnn   42   IBOX/GATA.01基序1   229-245   ttcagGATAaattattg   (+)   43   IBOX/GATA.01核心基序   nnnnngatan nnnnnnn   44   IBOX/GATA.01基序2   318-334   tagaaGATAaaagaagt   (-)   64   IBOX/GATA.01基序3   768-784   agagaGATAaagggaca   (-)   132   AHBP/ATHB1.01基序   236-246   taaATTAttgt   (+)   45   AHBP/ATHB1.01核心基序   nnnattannn n   46   AHBP/ATHB5.01基序   236-246   acaATAAttta   (-)   47   AHBP/ATHB5.01核心基序   nnnataannn n   48   GTBX/GT3A.01基序1   239-255   taaactTTTAcaataat   (-)   49   GTBX/GT3A.01核心基序1   nnnnnnttta nnnnnnn   50   GTBX/GT3A.01基序2   570-586   tagtaaGTTAcatttta   (+)   95   GTBX/GT3A.01核心基序2   nnnnnngtta nnnnnnn   96   PSRE/GAAA.01基序   253-269   aaatgGAAAtcttgtaa   (-)   52   PSRE/GAAA.01核心基序   nnnnngaaan nnnnnnn   53   GTBX/S1F.01基序1   255-271   tcaaATGGaaatcttgt   (-)   54

  GTBX/S1F.01核心基序   nnnnatggnn nnnnnnn   55   GTBX/S1F.01基序2   585-601   taggATGGaataaatat   (+)   99   WBXF/WRKY.01基序1   263-279   tccatTTGActagtgta   (+)   56   WBXF/WRKY.01核心基序   nnnnnttgan nnnnnnn   57   WBXF/WRKY.01基序2   728-744   tgactTTGAcgtcacac   (+)   119   MYBS/TAMYB80.01基序1   279-295   gagaATATtcctcattt   (-)   58   MYBS/TAMYB80.01核心基序1   nnnnatatnn nnnnnnn   59   MYBS/TAMYB80.01基序2   284-300   aggaATATtctctagta   (+)   60   MYBS/TAMYB80.01基序3   337-353   ttgtTTATtcctctact   (-)   71   MYBS/TAMYB80.01核心基序3   nnnnttatnn nnnnnnn   72   LREM/ATCTA.01基序   312-322   tcATCTacttc   (+)   62   LREM/ATCTA.01核心基序   nnatctnnnn n   63   热/HSE.01基序   319-333   agaagataaaAGAAg   (-)   65   热/HSE.01核心基序   nnnnnnnnnn agaan   66   P$MADS/AGL1.01基序   329-349   ttaTTCCtctactggtagaag   (-)   67   P$MADS/AGL1.01核心基序   nnnttccnnn nnnnnnnnnn n   68   MADS/AGL1.01基序   330-350   ttcTACCagtagaggaataaa   (+)   69   MADS/AGL1.01核心基序   nnntaccnnn nnnnnnnnnn n   70   NACF/TANAC69.01基序   409-431   cttttattttaTACGtaaaatta   (-)   76   NACF/TANAC69.01核心基序   nnnnnnnnnn ntacgnnnnn nnn   77   HMGF/HMG_IY.01基序   417-431   ctttTATTttatacg   (-)   78   HMGF/HMG_IY.01核心基序   nnnntattnn nnnnn   79   AHBP/WUS.01基序   448-458   ctcctTAATcg   (-)   81   AHBP/WUS.01核心基序   nnnnntaatn n   82   GTBX/GT1.01基序   520-536   catgtgGTCAttttacg   (-)   83   GTBX/GT1.01核心基序   nnnnnngtca nnnnnnn   84   TCPF/ATTCP20.01基序   534-546   attgGCCCatcat   (-)   85   TCPF/ATTCP20.01核心基序   nnnngcccnn nnn   86   DREB/CRT_DRE.01基序1   551-565   atggaCCGActacta   (+)   87   DREB/CRT_DRE.01核心基序   nnnnnccgan nnnnn   88   DREB/CRT_DRE.01基序2   601-615   tcataCCGAca tcag   (+)   100

  DREB/CRT_DRE.01基序3   658-672   tactaCCGAcatgag   (+)   106   DREB/CRT_DRE.01基序4   695-709   tcaagCCGAcacaga   (+)   110   SPF1/SP8BF.01基序   564-576   ctTACTattatta   (-)   93   SPF1/SP8BF.01核心基序   nntactnnnn nnn   94   EINL/TEIL.01基序   574-582   aTGTAactt   (-)   97   EINL/TEIL.01核心基序   ntgtannnn   98   DOFF/PBF.01基序   617-633   ttgaaagaAAAGggaaa   (+)   101   DOFF/PBF.01核心基序   nnnnnnnnaa agnnnnn   102   TEFB/TEF1.01基序   624-646   aaAAGGgaaaaaaagaaaaaa   (+)   103   TEFB/TEF1.01核心基序   nnaaggnnnn nnnnnnnnnn n   104   DOFF/DOF3.01基序   671-687   agttccaaAAAGcaaaa   (+)   107   DOFF/DOF3.01核心基序   nnnnnnnnaa agnnnnn   108   CE3S/CE3.01基序   703-721   tctctaCGCGtgtctgtgt   (-)   111   CE3S/CE3.01核心基序   nnnnnncgcg nnnnnnnnn   112   CGCG/ATSR1.01基序1   708-718   ctaCGCGtgtc   (-)   113   CGCG/ATSR1.01核心基序   nnncgcgnnn n   114   CGCG/ATSR1.01基序2   709-719   acaCGCGtaga   (+)   115   GBOX/TGA1.01基序1   727-747   gtggtgTGACgtcaaagtcat   (-)   116   GBOX/TGA1.01核心基序   nnnnnntgac nnnnnnnnnn n   117   GBOX/TGA1.01基序2   728-748   tgacttTGACgtcacaccacg   (+)   118   OPAQ/RITA1.01基序   730-746   actttgACGTcacacca   (+)   120   OPAQ/RITA1.01核心基序   nnnnnnacgt nnnnnnn   121   盐/ALFIN1.01基序   738-752   ttttcGTGGtgtgac   (-)   122   盐/ALFIN1.01核心基序   nnnnngtggn nnnnn   123   GBOX/GBF1.01基序   757-777   cgcttcatACGTgtcccttta   (+)   124   GBOX/GBF1.01核心基序   nnnnnnnnac gtnnnnnnnn n   125   ABRE/ABRE.01基序   758-774   gct tcatACGTgtccct   (+)   126   ABRE/ABRE.01基序   nnnnnnnacg tnnnnnn   127   GAGA/GAGABP.01基序1   764-788   actgagAGAGataaagggacacgta   (-)   130   GAGA/GAGABP.01核心基序1   nnnnnnagag nnnnnnnnnn nnnnn   131   GAGA/GAGABP.01基序2   772-796   atagagAGACtgagagagataaagg   (-)   133

  GAGA/GAGABP.01核心基序2   nnnnnnagac  nnnnnnnnnn nnnnn   138   GAGA/GAGABP.01基序3   774-798   ttatagAGAGactgagagagataaa   (-)   134   GAGA/GAGABP.01基序4   776-800   gtttatAGAGagactgagagagata   (-)   135   TBPF/TATA.01基序   790-804   tctcTATAaacttag   (+)   136   TBPF/TATA.01核心基序   nnnnta tann nnnnn   137

实施例12.对至少一种胁迫因子的增强的抗性、种子或籽苗营养品 质、产量、或选择标记切除的频率

pBPSMM368中的报道基因可以替换为

(1)非生物性胁迫抗性基因(14-3-3蛋白和磷酸肌醇特异性磷脂酶C: WO0177355和US6720477),

(2)参与维生素E生物合成的基因(酪氨酸氨基转移酶(BT000782: WO02072848),推定的胆色素原脱氨酶,推定的ω-3脂肪酸去饱和酶 [NM185577]),

(3)生物性胁迫抗性基因(稻镰刀菌(Oryza sativa Fusarium)抗性蛋 白质I2C-5-样[NM194161],致病相关基因5的组成型表达因子(cpr5: NM185577)),GTP酶[WO03020939],肌动蛋白解聚因子3[WO2004035798], ROR2的t-SNARE相互作用因子和突触融合蛋白、SNAP34的相互作用因子 [WO2004081217],

(4)归巢核酸内切酶基因(例如编码归巢核酸内切酶I-SceI的序列)

以在萌发期间的胚中表达,因而改善例如针对非生物性环境胁迫耐受 性、导致潜在产量增强作用的早期生长势、维生素E的量、针对生物的胁 迫耐受性和标记切除的频率。所述嵌合构建体转化至单子叶植物。可以根 据需要使用本领域中用于转化的标准方法。使用已知方法使转化的植物再 生。测量多种表型以确定改善了生物量、产量、脂肪酸组成、高油、疾病 耐受性或指示产量增强或产量稳定性的任何其它表型。测定在不同发育阶 段和不同世代(T0至T2植物或其它世代)中的基因表达水平。植物中的评价 结果导致鉴定与这种启动子组合而增加产量、改善疾病耐受性、改善非生 物性胁迫耐受性和/或提高种子或籽苗营养品量的合适基因。

实施例13.表达转基因以改善单子叶植物中的饲用、食用或产量性状

当pBPSMM368转化至单子叶植物如稻、大麦、玉米、小麦或黑麦草, 但不限于这些植物物种时,pBPSMM368中的报道基因可以替换为主要在胚 中过量表达以改善胚营养价值的目的基因。所述目的基因可以是下调一个 或多个靶基因的非编码序列(例如miRNA前体或ta-siRNA)。根据需要,可 以使用本领域的标准转化方法。在目的选择剂下选择经转化的植物并使用 已知方法再生。在组织或组织培养细胞的发育早期阶段检验选择方案。可 以在不同发育阶段上和在不同世代(T0至T2植物或其他世代)上测定基因表 达水平。在植物中评价的结果导致确定与这种启动子组合的合适基因。

参考文献

1.Abel等,Science,232:738(1986)。

2.Agrawal A等,(1998)Nature 394(6695):744-451

3.Altschul等,J.Mol.Biol.,215:403(1990)。

4.Altschul等,Nucleic Acids Res.,25:3389(1997)。

5.Amara JF等,(1997)Proc Natl Acad Sci USA 94(20):10618-1623

6.An等,EMBO J.,4:277(1985)。

7.Angrand PO等,(1998)Nucl.Acids Res.26(13):3263-3269

8.Argast GM等,(1998)J Mol Biol 280:345-353

9.Auch与Reth,Nucleic Acids Research,18:6743(1990)。

10.Ausubel等,(1987)Current Protocols in Molecular Biology,Greene Publishing Assoc.and Wiley Interscience(1987)。

11.Ballas等,Nucleic Acids Res.,17:7891(1989)。

12.Barkai-Golan等,Arch.Microbiol.,116:119(1978)。

13.Barker等,(1983)Plant Molec.Biol.2:335-50。

14.Bartel D 2004,Cell 116,281-297

15.Bartley和Scolnik(1994)Plant Physio1.,104:1469-1470

16.Batzer等,Nucleic Acid Res.,19:5081(1991)。

17.等,Mol Gen Genet 225:121-128(1991)

18.Beall EL,Rio DC(1997)Genes Dev.11(16):2137-2151

19.Beaudoin等,2000,PNAS 97:6421-6426

20.Becker等,(1994)Plant J.,5:299-307,

21.Beerli RR等,(1998)Proc Natl Acad Sci USA 95(25):14628-14633

22.Beerli RR等,(2000)J Biol Chem 275(42):32617-32627

23.Beerli RR等,(2000)Proc Natl Acad Sci USA.97(4):1495-1500

24.Belfort M和Roberts RJ(1997)Nucleic Acids Res 25:3379-3388

25.Bell-Pedersen等,(1990)Nucleic Acids Res18:3763-3770

26.Bernal-Lugo和Leopold,Plant Physiol.,98:1207(1992)。

27.Bevan等,Nature,304:184(1983)。

28.Bevan等,Nucl.Acids Res.,11:369(1983)。

29.Bevan,Nucl. Acids Res.,12:8711(1984)。

30.Bibikova M等,(2001)Mol Cell Biol.21:289-297

31.Blackman等,Plant Physiol.,100:225(1992)。

32.Blanc V等,(1996)Biochimie 78(6):511-517

33.Blochlinger与Diggelmann,Mol Cell Biol,4:2929(1984)。

34.Bol等,Ann.Rev.Phytopath.,28:113(1990)。

35.Bouchez等,EMBO J.,8:4197(1989)。

36.Bourouis等,EMBO J.,2:1099(1983)。

37.Bowler等,Ann.Rev.Plant Physiol.,43:83(1992)。

38.Bradford,Anal.Biochem.72:248-254(1976)

39.Branson和Guss,Proc.North Central Branch Entomological Society of America(1972)。

40.Broakgert等,Science,245:110(1989)。

41.Broglie等,(1991)Science 254:1194-1197

42.Bustos等,(1989)Plant Gell 1:839-853

43.Byrne等,Plant Cell Tissue and Organ Culture,8:3(1987)。

44.Callis等,Genes and Develop.,1:1183(1987)。

45.Campbell和Gowri,Plant Physiol.,92:1(1990)。

46.Campbell编著.Ivermectin andAbamectin,Springer-Verlag,New York,(1989)。

47.Cecchini E等,(1998)Mutat Res 401(1-2):199-206

48.Chee等,Plant Physiol.,91:1212(1989)。

49.Cheikh-N等,(1994)Plant Physiol. 106(1):45-51

50.Chen和Winans J.Bacteriol.173:1139-1144(1991)。

51.Chen等,(1988)EMBO J.,6:3559-3564

52.Christou等,(1995)Annals of Botany 75:407-413

53.Christou等,Proc.Natl.Acad.Sci USA,86:7500(1989)。

54.Christou等,Biotechnology,9:957(1991)。

55.Christou等,Plant Physiol.,87:671(1988)。

56.Chu等,(1990)Proc Natl Acad Sci USA 87:3574-3578

57.Chui等,Curr Biol 6:325-330(1996)。

58.Coe等,在:Corn and Corn Improvement,Sprague等(编著)的一书 中,第81-258页(1988)。

59.Corneille S等,(2001)Plant J 27:171-178

60.Corpet等,Nucleic Acids Res.,16:10881(1988)。

61.Cote V等,(1993)Gene 129:69-76

62.Coxson等,Biotropica,24:121(1992)。

63.Crameri等,Nature Biotech.,15:436(1997)。

64.Crameri等,Nature,391:288(1998)。

65.Crossway等,BioTechniques,4:320-334(1986)。

66.Cuozzo等,Bio/Technology,6:549(1988)。

67.Cutler等,J.Plant Physiol.,135:351(1989)。

68.Czako M和Marton L,(1994)Plant Physiol 104:1067-1071

69.Czapla和Lang,J.Econ.Entomol.,83:2480(1990)。

70.Dale EC和Ow DW(1991)Proc Natl Acad Sci USA 88:10558-10562

71.Datta等,Bio/Technology,8:736-740(1990)。

72.Davies等,Plant Physiol.,93:588(1990)。

73.Dayhoff等,Atlas of Protein Sequence and Structure,Natl.Biomed. Res.Found.,Washington,C.D.(1978)。

74.De Blaere等,Meth.Enzymol.,143:277(1987)。

75.De Block等,Plant Physiol.,91:694(1989)。

76.De Block等,EMBO Journal,6:2513(1987)。

77.Deak M等,(1999)Nature Biotechnology 17:192-196

78.Deblaere等,Nucl Acids Res 13:4777-4788(1985)

79.Della-Cioppa等,Bio/Technology 5:579-584(1987)

80.Della-Cioppa等,Plant Physiology,84:965-968(1987)。

81.Dellaporta等,Chromosome Structure and Function,Plenum Press, 263-282(1988)。

82.Depicker AG等,(1988)Plant Cell rep 104:1067-1071

83.Depicker等,Plant Cell Reports,7:63(1988)。

84.Dixon M和Kleppe,Biochim.Biophys.Acta 96(1965)383-389

85.Dixon M和Kleppe K,Biochim.Biophys.Acta96(1965)368-382

86.Dixon M和Kleppe K.,Biochim.Biophys.Acta96(1965)357-367

87.Dunn等,Can.J.Plant Sci.,61:583(1981)。

88.Dunwell JM(1998)Biotechn Genet Eng Rev 15:1-32

89.Dure等,Plant Mol.Biol.,12:475(1989)。

90.Ebinuma 等,Proc Natl Acad Sci USA 94:2117-2121(2000a)。

91.Ebinuma等,使用农杆菌癌基因(ipt,rol A,B,C)作为选择标记选出 无标记转基因植物(Selection of Marker-free transgenic plants using the oncogenes(ipt,rol A,B,C)of Agrobacterium as selectable markers),In Molecular Biology of Woody Plants.Kluwer Academic Publishers(2000b) 一书中。

92.Eddy等,(1991)Genes Dev.5:1032-1041

93.Eichholtz等,Somatic Cell and Molecular Genetics 13,67-76(1987)。

94.Ellis等,(1984)Mol.Gen.Genet.195:466-73

95.Elroy-Stein等,Proc.Natl.Acad.Sci.U.S.A.,86:6126(1989)。

96.English等,Plant Cell,8:179(1996)。

97.Erdmann等,J.Gen.Microbiol.,138:363(1992)。

98.Erikson等,Nat Biotechnol. 22(4):455-8(2004)。

99.Everett等,Bio/Technology,5:1201(1987)。

100.Fedoroff和Smith,Plant J 3:273-289(1993)。

101.Fedoroff NV和Smith DL,(1993)Plant J 3:273-289

102.Fire等,Nature 391:806-811(1998)。

103.Fitzpatrick,Gen.Engineering News,22:7(1993)。

104.Fox等,(1992)Plant Mol. Biol.20:219-33

105.Fraley等,Proc Natl Acad Sci USA 80:4803(1983)。

106.Freeling和Walbot,(1993)“The  maize  handbook”ISBN 3-540-97826-7,Springer Verlag New York)

107.Fromm等,Bio/Technology,8:833-839(1990)。

108.Fromm等,Nature(London),319:791(1986)。

109.Gabler M等,(2000)Enzyme Microb.Techno.27:605-611

110.Galbiati等,Funct.Integr Genozides,20 1:25-34(2000)。

111.Gallego ME(1999)Plant Mol Biol 39(1):83-93

112Gallie等,Nucl Acids Res 15:8693-8711(1987)。

113.Gallie等,Nucleic Acids Res.,15:3257(1987)。

114.Gallie等,The Plant Cell,1:301(1989)。

115.Gan等,Science,270:1986(1995)。

116.Gatehouse等,J.Sci.Food Agric.,35:373(1984)。

117.Gelfand编著,PCR Strategies Academic Press,New York(1995)。

118.Gilmour等,Plant Mol Biol 17:1233-1240(1991)

119.Gelvin等,Plant Molecular Biology Manual,(1990)。

120.Girke等,(1998)Plant J 15:39-48

121.Gleave AP等,(1999)Plant Mol Biol 40(2):223-235

122.Gleave等,Plant Mol Biol. 40(2):223-35(1999)

123.Gordon-Kamm等,Plant Cell,2:603(1990)。

124.Goring等,PNAS,88:1770(1991)。

125.Goyal RK等,(2000)Crop Protection 19(5):307-312

126.Gruber等,Vectors for Plant Transformation,在:Methods in Plant Molecular Biology & Biotechnology,Glich等(编著,第89-119页, CRC Press,1993)中。

127.Guerineau等,Mol. Gen.Genet.,262:141(1991)。

128.Guerrero等,Plant Mol.Biol.,15:11(1990)。

129.Guo等,(1997)EMBO J 16:6835-6848

130.Guo等,(2000)Science 289:452-457

131.Gupta等,PNAS,90:1629(1993)。

132.Haines和Higgins(编著),Nucleic Acid Hybridization,IRL Press, Oxford,U.K。

133.Hajdukiewicz等,Plant Mol Biol 25:989-994(1994)。

134.Hammock等,Nature,344:458(1990)。

135.Hansen等,Proc.Natl.Acad.Sci.USA 91:7603-7607(1994)。

136.Hare P和Chua NH(2002)Nat.Biotechnol.20,575-580。

137.Haren L等,(1999)Annu Rev Microbiol. 1999;53:245-281

138.Haseloff等,(1997)Proc Natl Acad Sci USA 94(6):2122-2127

139.Hayford等,Plant Physiol. 86:1216(1988)

140.Hemenway等,EMBO Journal,7:1273(1988)。

141.Henikoff  和Henikoff,Proc.Natl.Acad.Sci.USA, 89:10915(1989)。

142.Hiei等,Plant J 6:271-282(1994)

143.Higgins等,Gene,73:237(1988)。

144.Higo等,(1999)Nucl Acids Res 27(1):297-300

145.Hilder等,Nature,330:160(1987)。

146.Hille等,Plant Mol. Biol. 7:171(1986)

147.Hinchee等,Bio/Technology 6:915(1988)。

148.Hoekema等,Nature 303:179-181(1983)。

149.Hoekema,在:The Binary Plant Vector System.Offset-drukkerij Kanters B.V.;Alblasserdam(1985)一书中。

150.Hood EE和Jilka JM(1999),Curr Opin Biotechnol 10(4):382-6

151.Hood等,(1999)Adv Exp Med Biol 464:127-47,综述

152.Hood等,J Bacteriol 168:1291-1301(1986)。

153.Horvath等,(1993)Plant Physiol.103:1047-1053

154.Huang B等,(1996)J Protein Chem 15(5):481-9

155.Huang等,CABIOS,8:155(1992)。

156.Ikeda等,J.Bacteriol.,169:5612(1987)。

157.Ikuta等,Biotech.,8:241(1990)。

158.Imai T等,(2001)Proc Natl Acad Sci USA 98(1):224-228)

159.Ingelbrecht等,Plant Cell,1:671(1989)。

160.Innis和Gelfand编著,PCR Methods Manual(Academic Press, New York)(1999)。

161.Innis  等编著,PCR Protocols:A Guide to Methods and Applications(Academic Press,New York(1995)。

162.Innis等,PCR Protocols:A Guide to Methods and Applications, Academic Press,Inc.,San Diego,Calif.(1990)。

163.Ishida等,Nature Biotech 745-750(1996)。

164.Janssen DB(1989)J Bacteriol 171(12):6791-9

165.Janssen DB等,(1994)Annu Rev Microbiol 48:163-191

166.Jasin M(1996)Trends Genet.12:224-228

167.Jefferson等,(1987)EMBO J 6:3901-3907

168.Jefferson等,EMBO J 6:3901-3907(1987)。

169.Jefferson等,Plant Mol Biol Rep 5:387-405(1987)。

170.Jenes等,Techniques for Gene Transfer,在:Recombinant Plants, Vol.1,Engineering and Utilization,SD Kung和R Wu编著,Academic Press一书中,pp.128-143(1993)

171.Jicks GR和Raikhel NV,(1995)Annu.Rev.Cell Biol.11:155-188

172.Jobling等,Nature,325:622(1987)。

173.Johnson等,PNAS USA,86:9871(1989)。

174.Jones等,Mol. Gen.Genet.,210:86(1987)。

175.Joshi等,Nucleic Acid Res.,15:9627(1987)。

176.Kaasen等,J.Bacteriol.,174:889(1992)。

177.Kang JS和Kim JS(2000)J Biol Chem 275(12):8742-8748

178.Karlin和Altschul,Proc.Natl.Acad Sci.USA,87:2264(1990)。

179.Karlin和Altschul,Proc.Natl.Acad.Sci.USA,90:5873(1993)。

180.Karlin-Neumannn GA等,(1991)Plant Cell 3:573-582

181.Karsten等,Botanica Marina,35:11(1992)。

182.Kasuga等,(1999)Nature Biotechnology 17(3):287-291

183.Kasuga M等,(1999)Nature Biotech 17:276-286

184.Katz等,J.Gen.Microbiol.,129:2703(1983)。

185.Kaufman PD和Rio DC(1992)Cell 69(1):27-39

186.Kawasaki等,(1991)J Biol Chem 266:5342-5347

187.Keegstra(1989)Cell,56(2):247-53

188.Keenan T等,(1998)Bioorg Med Chem.6(8):1309-1335

189.Keller等,EMBO Journal,8:1309(1989)。

190.Keller等,Genes Dev.,3:1639(1989)

191.Kilby NJ等,(1995)Plant J 8:637-652

192.Kim JS等,(1997)Proc Natl Acad Sci USA 94(8):3616-3620

193.Klapwijk等,J.Bacteriol.,141,128-136(1980)。

194.Klein等,Bio/Technoloy,6:559-563(1988)。

195.Klein等,Plant Physiol.,91:440-444(1988)。

196.Klein等,Proc.Natl.Acad.Sci.USA,85:4305-4309(1988)。

197.Klug A(1999)J Mol Biol 293(2):215-218

198.Knauf等,农杆菌的宿主范围表达的遗传分析(Genetic Analysis of Host Range Expression by Agrobacterium),在Molecular Genetics of the Bacteria-Plant Interaction,Puhler,A.编著,Springer-Verlag,New York, 1983一书中。

199.Kobayashi T等,(1995)Jpn J Genet 70(3):409-422

200.Komro等,(1985)Plant Mol.Biol. 4:253-63

201.Koncz和Schell,Mol Gen Genet 204:383-396(1986)。

202.Kononowicz等,(1992)Plant Cell 4:17-27。

203.Koprek等,Plant J 19(6):719-726(1999)。

204.Koprek T等,(1999)Plant J 19(6):719-726

205.Koster和Leopold,Plant Physiol.,88:829(1988)。

206.Koziel等,Biotechnology,11:194(1993)。

207.Kridl等,(1991)Seed Sci.Res.,1:209-219

208.Kuiper HA等,(2001)Plant J.27,503-528

209.Kunkel等,Methods in Enzymol.,154:367(1987)。

210.Kunkel,Proc.Natl.Acad.Sci.USA,82:488(1985)。

211.Lam和Chua,J Biol Chem;266(26):17131-17135(1991)。

212.Laufs等,PNAS,87:7752(1990)。

213.Lawton等,Mol.Cell Biol.,7:335(1987)。

214.Lee和Saier,J.Bacteriol.,153(1982)。

215.Lee TJ等,(2002)J Amer Soc Horticult Sci 127(2):158-164

216.Leffel等,Biotechniquess 23(5):912-8(1997)。

217.Leffel SM等,(1997)Biotechniquess 23(5):912-8

218.Lescot等,Nucleic Acids Res 30(1):325-7(2002)。

219.Leung等,(1991)Mol.Gen.Genet.230:463-74

220.Levings,Science,250:942(1990)。

221.Li等,(1993)Plant Cell Reports 12:250-255

222.Li等,Plant Mol Biol 20:1037-1048(1992)。

223.Lindsey等,Transgenic Research,2:3347(1993)。

224.Liu等,Plant J.8,457-463(1995)

225.Logie C 和Stewart AF,(1995)Proc Natl Acad  Sci USA 92(13):5940-5944

226.Lois等,(1998)Proc.Natl.Acad.Sci.USA,95(5):2105-2110

227.Lommel等,Virology,181:382(1991)。

228.Loomis等,J.Expt.Zool.,252:9(1989)。

229.Lorz等,Mol. Gen.Genet.,199:178(1985)。

230.Lyznik LA等,(1996)Nucleic Acids Res 24:3784-3789

231.Ma等,Nature,334:631(1988)。

232.Ma JK和Vine ND,(1999)Curr Top Microbiol Immunol

236:275-92

233.Ma,Q.H.等,(1998)Australian Journal of Plant Physiology 25(1):53-59

234.Macejak等,Nature,353:90(1991)。

235.Maki等,Methods in Plant Mol.Biol.&Biotechnol,Glich等,67-88 CRC Press,(1993)。

236.Maniatis等,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor(NY),(1989)。

237.Mapp AK等,(2000)Proc Natl Acad Sci USA 97(8):3930-3935 Mariani等,Nature,347:737(1990)。

239.Marshall(1991)Gene 104:241-245

240.Massey V等,Biochim.Biophys.Acta 48(1961)1-9

241.Matzke等,(2000)Plant Mol Biol 43:401-415(2000)。

242.McBride等,PNAS USA,91:7301(1994)。

243.McCabe等,Bio/Technology,6:923(1988)。

244.McKnight SL等,(1980)Nucl Acids Res 8(24):5931-5948

245.McKnight SL等,(1980)Nucl Acids Res 8(24):5949-5964

246.Meinkoth和Wahl,Anal.Biochem.,138:267(1984)。

247.Meister A和Wellner D,黄素蛋白氨基酸氧化酶(Flavoprotein amino acid oxidase),在Boyer,P.D.,Lardy,H.和K.(编著),The Enzymes,第二版,第7卷,Academic Press,New York,1963,第609-648 页。

248.Menard R等,(1999)Phytochemistry 52:29-35

249.Messing和Vierra,Gene,19:259(1982)。

250.Michael等,J.Mol.Biol.,26:585(1990)

251.Michaelson等,(1998)FEBS Letters 439:215-218

252.Michaelson等,JBC 273:19055-19059

253.Millar等,(1992)Plant Mol Biol Rep 10:324-414

254.Millar等,Plant Mol Biol Rep 10:324-414(1992)。

255.Miyano M等,(1991)J Biochem 109:171-177

256.Mogen等,Plant Cell,2:1261(1990)。

257.Mohr等,(2000)Genes&Development 14:559-573

258.Monnat RJ Jr等,(1999)Biochem Biophys Res Com 255:88-93

259.Moore等,J.Mol.Biol.,272:336(1997)。

260.Mozo和Hooykaas,Plant Mol. Biol.16:917-918(1991)。

261.Muuen CA等,(1992)Proc Natl Acad Sci USA 89(1):33-37

262.Mundy和Chua,EMBO J.,7:2279(1988)。

263.Munroe等,Gene,91:151(1990)。

264.Murakami等,Mol.Gen.Genet.,205:42(1986)。

265.Murata等,FEBS Lett.,296:187(1992)。

266.Murdock等,Phytochemistry,29:85(1990)。

267.Murray 等,Nucleic Acids Res.,17:477(1989)。

268.Muthuswamy SK等,(1999)Mol Cell Biol19(10):6845-685

269.Myers和Miller,CABIOS,4:11(1988)。

270.Naested H等,(1999)Plant J 18(5)571-576

271.Naested,Plant J 18:571-576(1999)。

272.Napoli等,Plant Cell,2:279(1990)。

273.Nawrath等,(1994)Proc.Natl.Acad.Sci.USA,91:12760-12764

274.Needleman和Wunsch,J.Mol.Biol.,48:443-453(1970)。

275.Negri A等,(1992)J Biol Chem.267:11865-11871

276.Nehra等,Plant J.5:285-297(1994)

277.Ni M等,(1995)Plant J 7(4):661-676

278.Niedz等,Plant Cell Reports,14:403(1995)。

279.Nordin等,Plant Mol Biol 21:641-653(1991)

280.Norris等,(1998)Plant Physiol.,117:1317-1323

281.O’Keefe DP,(1991)Biochemistry 30(2):447-55

282.O’Keefe DP等,(1994)Plant Physiol 105:473-482

283.Odell等,Mol.Gen.Genet.,113:369(1990)。

284.Odell等,Nature,313:810(1985)。

285.Ohtsuka等,J.Biol. Chem.,260:2605(1985)。

286.Olhoft等,Plant Cell Rep 20:706-711(2001)。

287.Onouchi H等(1995)Mol Gen Genet 247:653-660

288.Osborne BI等,(1995)Plant J.7:687-701

289.Osjoda等,(1996)Nature Biotechnology 14:745-750

290.Ow DW和Medberry SL,(1995)Crit Rev in Plant Sci14:239-261

291.Ow等,Science,234:856(1986)。

292.Pacciotti等,Bio/Technology,3:241(1985)。

293.Parizotto E A等,2004,Genes  &Development,18:2237-2242

294.Park等,J.Plant Biol.,38:365(1985)。

295.Paszkowski等,EMBO J.,3:2717-2722(1984)。

296.Pearson和Lipman,Proc.Natl.Acad.Sci.,85:2444(1988)。

297.Pearson等,Meth.Mol.Biol.,24:307(1994)。

298.Pei ZM等,(1998)Science 282:287-290

299.Perera等,Plant Mol.Biol 23(4):793-799(1993)。

300.Perera RJ等,(1993)Plant Mol Biol 23(4):793-799

301.Perlak等,Proc.Natl.Acad.Sci.USA,88:3324(1991)。

302.Phillips等,In Corn & Corn Improvement,第三版10Sprague 等,(编著,第345-387页)(1988)。

303.Phi-Van等,Mol. Cell.Biol.,10:2302(1990)。

304.Piatkowski等,Plant Physiol.,94:1682(1990)。

305.Pilone MS,(2000)Cell.Mol.Life.Sci.57:1732-1740

306.Potrykus等,Mol.Gen.Genet.,199:183(1985)。

307.Potrykus,Trends Biotech.,7:269(1989)。

308.Prasher等,Biochem.Biophys.Res.Comm.,126:1259(1985)。

309.Preston等,(1981)J Virol 38(2):593-605

310.Proudfoot,Cell,64:671(1991)。

311.Rao等,(2000)Prog Nucleic Acid Res Mol Biol 64:1-63

312.Rao等,(1998)Plant J 15(4):469-77

313.Rask L等,(2000)Plant Mol Biol 42:93-113

314.Reed等,J.Gen.Microbiol.,130:1(1984)。

315.Reichel等,(1996)Proc Natl Acad Sci USA 93(12):5888-5893

316.Riggs等,Proc.Natl.Acad.Sci.USA,83:5602-5606(1986)。

317.Risseeuw E(1997)Plant J 11(4):717-728

318.Roeckel,P.等,(1997)Transgenic Research 6(2):133-141

319.Rossolini等,Mol. Cell.Probes,8:91(1994)。

320.Ruiz,Plant Cell,10:937(1998)。

321.Russell SH等,(1992)Mol Gene Genet 234:49-59。

322.Saint Guily等,(1992)Plant Physiol.,100(2):1069-1071

323.Sakuradani等,(1999)Gene 238:445-453

324.Salomon S和Puchta H(1998)EMBO J 17(20):6086-6095

325.Sambrook等,Molecular Cloning:A Laboratory Manual(第二版, Cold Spring Harbor Laboratory Press,Plainview,N.Y.)(1989)。

326.Sanfacon等,Genes Dev.,5:141(1991)。

327.Sanford等,Particulate Science和Technology,5:27(1987)。

328.Sanger等,(1990)Plant Mol. Biol.14:433-43

329.Sarguiel B等,(1990)Nucleic Acids Res 18:5659-5665

330.Sarguiel B等,(1991)Mol Gen Genet.255:340-341

331.Sato等,(2000)J.DNA Res.,7(1):31-63

332.Scheeren-Groot等,J.Bacteriol 176:6418-6426(1994)。

333.Schenborn和Groskreutz,Mol Biotechnol13(1):29-44(1999)。

334.Schenborn E,Groskreutz D.(1999)Mol Biotechnol 13(1):29-44

335.Schlaman和Hooykaas,Plant J 11:1377-1385(1997)。

336.Schlaman HRM和Hooykaas PFF(1997)Plant J 11:1377-1385

337.Schoffl等,Mol Gen Genetics 217(2-3):246-53(1989)。

338.Schultz LW和Clardy J(1998)Bioorg Med Chem Lett.8(1):1-6

339.Segal DJ 和Barbas CF 3rd.,Curr Opin Chem Biol(2000)4(1):34-39

340.Serino G(1997)Plant J 12(3):697-701

341.Shagan等,Plant Physiol.,101:1397(1993)。

342.Shah等,Science 233:478(1986)。

343.Shapiro,Mobile Genetic Elements,Academic Press,N.Y.(1983)。

344.Sharrocks AD等,(1997)Int J Biochem Cell Biol 29(12):1371-1387

345.Sheen等,(1995)Plant J 8(5):777-784

346.Shimamoto等,Nature,338:274(1989)。

347.Silhavy等,Experiments with Gene Fusions,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(NY),(1984)。

348.Skuzeski等,Plant Molec.Biol. 15:65-79(1990)。

349.Smith等,(1997)Plant J.,11:83-92

350.Smith等,Adv.Appl. Math.,2:482.(1981)。

351.Smith等,Mol.Gen.Genet.,224:447(1990)。

352.Spencer等,Theor.Appl. Genet,79:625(1990)。

353.St.Clair等(1987)Antimicrob Agents Chemother 31(6):844-849

354.Stalker等,Science,242:419(1988)。

355.Staub等,EMBO J.,12:601(1993)。

356.Staub等,Plant Cell,4:39(1992)。

357.Steifel等,The Plant Cell,2:785(1990)。

358.Stemmer(1994)Nature 370:389-391

359.Stemmer(1994)Proc Natl Acad Sci USA 91:10747-10751

360.Stemmer,Nature,370:389(1994)。

361.Stemmer,Proc.Natl.Acad.Sci.USA,91:10747(1994)。

362.Stief等,Nature,341:343(1989)。

363.Stougaard J(1993)Plant J 3:755-761);EP-A1595837

364.Stougaard,Plant J 3:755-761(1993)

365.Sugita Ket等,(2000)Plant J.22:461-469

366.Sukhapinda等,Plant Mol.Biol.,8:209(1987)。

367.Sundaresan等,Gene Develop 9:1797-1810(1995)。

368.Sundaresan V等,(1995)Gene Develop 9:1797-1810

369.Sutcliffe,PNAS USA,75:3737(1978)。

370.Svab等,Plant Mol.Biol.14:197(1990)。

371.Svab等,Proc.Natl.Acad.Sci.USA,87:8526(1990)。

372.Svab等,Proc.Natl.Acad.Sci.USA,90:913(1993)。

373.Szybalski等,(1991)Gene 100:13-26

374.Takahashi等,(1998)Proc.Natl.Acad.Sci.USA,95(17):9879-9884

375.Tarczynski等,PNAS USA,89:2600(1992)。

376.Teeri等,(1989)EMBO J.,8:343-50

377.Thillet等,J.Biol. Chem.,263:12500(1988)。

378.Thompson等,NAR 22(22):4673-4680(1994)。

379.Thykjaer T等,(1997)Plant Mol Biol 35(4):523-530

380.Tian等,(1997)Plant Cell Rep 16:267-271;WO 97/41228

381.Tijssen,Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,Elsevier,N.Y.(1993)。

382.Tissier AF等,(1999)Plant Cell 11:1841-1852

383.Tomes等,Plant Cell,Tissue and Organ Culture:Fundamental Methods,Springer Verlag,Berlin(1995)。

384.Tomic等,NAR,12:1656(1990)。

385.Tsai SY等,(1998)Adv Drug Deliv Rev 30(1-3):23-31

386.Turmel M等,(1993)J Mol Biol 232:446-467

387.Turmel M等,(1995a)Nucleic Acids Res 23:2519-2525

388.Turmel M等,(1995b)Mol.Biol.Evol.12,533-545

389.Turner等,Molecular Biotechnology,3:225(1995)。

390.Twell等,Plant Physiol.,91:1270(1989)。

391.Ugaki等,Nucl.Acids Res.,19:371(1991)。

392.Ulmasov等,Plant Mol. Biol.,35:417(1997)。

393.Umhau S.等,(2000)Proc.Natl.Acad.Sci.USA 97:12463-12468

394.Upadhyaya NM等,(2000)Plant Mol Biol Rep 18:227-223

395.Upender等,Biotechniquess,18:29(1995)。

396.van der Krol等,Plant Cell,2:291(1990)。

397.Vanden Elzen等,Plant Mol Biol. 5:299(1985)。

398.Vasil等,Bio/Technology,10:667-674(1992)。

399.Vasil等,Bio/Technology,11:1153-1158(1993)。

400.Vasil等,Mol.Microbiol.,3:371(1989)。

401.Vasil等,Plant Physiol.,91:1575(1989)。

402.Vernon和Bohnert,EMBO J.,11:2077(1992)。

403.Wagner等,(1981)Proc Natl Acad Sci USA 78(3):1441-1445

404.Walker和Gaastra编著,Techniques in Molecular Biology, MacMillan Publishing Company,New York(1983)。

405.Wan和Lemaux,Plant Physiol.,104:3748(1994)。

406.Wang等,Mol.Cell.Biol.,12:3399(1992)。

407.Wang J等,(1997)Nucleic Acids Res 25:3767-3776

408.Waterman,Introduction  to  Computational  Biology:Maps, sequences and genomes.Chapman & Hall.London(1995)。

409.Watrud 等,in Engineered Organisms and the Environment(1985)。

410.Watson等,J.Bacteriol123,255-264(1975)

411.Watson等,Corn:Chemistry and Technology(1987)。

412.Weeks等,Plant Physiol102:1077-1084(1993)

413.Weissinger等,Annual Rev.Genet.,22:421(1988)。

414.Wernette  CM,(1998)Biochemical & Biophysical Research Communications 248(1):127-333

415.White等,Nucl Acids Res,18,1062(1990)。

416.Wigler M等,(1977)Cell 11(1):223-232

417.Wingender等,Nucleic Acids Res 29(1):281-3(2001)。

418.Wolter等,EMBO Journal,11:4685(1992)。

419.Wyn-Jones和Storey,Physiology and Biochemistry of Drought Resistance in Plants,Paleg等(编著),第171-204页(1981)。

420.Xia等,(1992)J.Gen.Microbiol.,138:1309-1316

421.Xiao YL和Peterson T,(2000)Mol Gen Genet 263(1):22-29

422.Xiaohui Wang H等,(2001)Gene 272(1-2):249-255

423.Yamaguchi-Shinozaki等,Plant Cell Physiol.,33:217(1992)。

424.Yurimoto H等,(2000)Yeast 16:1217-1227

425.Zank等,2000,Biochemical Society Transactions 28:654-657

426.Zhang等,Proc.Natl.Acad.Sci.USA,94:4504(1997)。

427.Zhang L等,(2000)J Biol Chem 275(43):33850-33860

428.Zinselmeier等,(1995)Plant Physiol.107(2):385-391

429.Zubko E等,(2000)Nat Biotechnol 18:442-445

430Zubko等,(2000)Nature Biotech 18(4):442-445

431.Zukowsky等,PNAS USA,80:1101(1983)。

全部出版物、专利和专利申请在本文中引用作为参考。尽管在以上说 明书中,本发明已经就其中某些优选的实施方案进行了描述,并且众多细 节已经为说明目的而描述,对于本领域中技术人员而言显而易见的是本发 明容易变成其它实施方案并且本文中所述的某些细节可以做明显变化而 不脱离本发明的基本精神。

序列表

<110>巴斯福植物科学有限公司

<120>用于在单子叶植物中调节胚特异性表达的核酸序列

<130>PF58489

<160>144

<170>PatentIn版本3.3

<210>1

<211>833

<212>DNA

<213>拟南芥(Arabidopsis thaliana)

<220>

<221>启动子

<222>(1)..(833)

<223>拟南芥属植物(Arabidopsis)cor78启动子区TATA盒:nt 790-804

<400>1

gcaagaatct caaacacgga gatctcaaag tttgaaagaa aatttatttc ttcgactcaa   60

aacaaactta cgaaatttag gtagaactta tatacattat attgtaattt tttgtaacaa  120

aatgttttta ttattattat agaattttac tggttaaatt aaaaatgaat agaaaaggtg  180

aattaagagg agagaggagg taaacatttt cttctatttt ttcatatttt caggataaat  240

tattgtaaaa gtttacaaga tttccatttg actagtgtaa atgaggaata ttctctagta  300

agatcattat ttcatctact tcttttatct tctaccagta gaggaataaa caatatttag  360

ctcctttgta aatacaaatt aattttcgtt cttgacatca ttcaatttta attttacgta  420

taaaataaaa gatcatacct attagaacga ttaaggagaa atacaattcg aatgagaagg  480

atgtgccgct tgttataata aacagccaca cgacgtaaac gtaaaatgac cacatgatgg  540

gccaatagac atggaccgac tactaataat agtaagttac attttaggat ggaataaata  600

tcataccgac atcagtttga aagaaaaggg aaaaaaagaa aaaataaata aaagatatac  660

taccgacatg agttccaaaa agcaaaaaaa aagatcaagc cgacacagac acgcgtagag  720

agcaaaatga ctttgacgtc acaccacgaa aacagacgct tcatacgtgt ccctttatct  780

ctctcagtct ctctataaac ttagtgagac cctcctctgt tttactcaca aat 833

<210>2

<211>15553

<212>DNA

<213>未知的

<220>

<223>这是构建体

<220>

<221>misc_feature

<222>(197)..(221)

<223>左T-DNA边界重复序列

<220>

<221>终止子

<222>(5811)..(6063)

<223>NOS终止子

<220>

<221>misc_feature

<222>(6134)..(8134)

<223>GUS编码序列

<220>

<221>内含子

<222>(8199)..(8781)

<223>BPS1.1内含子

<220>

<221>启动子

<222>(8813)..(9656)

<223>Cor78启动子

<220>

<221>misc_feature

<222>(9703)..(9726)

<223>右T-DNA边界重复序列

<400>2

atgttgattg taacgatgac agagcgttgc tgcctgtgat caaatatcat ctccctcgca    60

gagatccgaa ttatcagcct tcttattcat ttctcgctta accgtgacag gctgtcgatc    120

ttgagaacta tgccgacata ataggaaatc gctggataaa gccgctgagg aagctgagtg    180

gcgctatttc tttagaagtg aacgttgacg atcgtcgacc gtaccccgat gaattaattc    240

ggacgtacgt tctgaacaca gctggatact tacttgggcg attgtcatac atgacatcaa     300

caatgtaccc gtttgtgtaa ccgtctcttg gaggttcgta tgacactagt ggttcccctc     360

agcttgcgac tagatgttga ggcctaacat tttattagag agcaggctag ttgcttagat     420

acatgatctt caggccgtta tctgtcaggg caagcgaaaa ttggccattt atgacgacca     480

atgccccgca gaagctccca tctttgccgc catagacgcc gcgcccccct tttggggtgt     540

agaacatcct tttgccagat gtggaaaaga agttcgttgt cccattgttg gcaatgacgt     600

agtagccggc gaaagtgcga gacccatttg cgctatatat aagcctacga tttccgttgc     660

gactattgtc gtaattggat gaactattat cgtagttgct ctcagagttg tcgtaatttg     720

atggactatt gtcgtaattg cttatggagt tgtcgtagtt gcttggagaa atgtcgtagt     780

tggatgggga gtagtcatag ggaagacgag cttcatccac taaaacaatt ggcaggtcag     840

caagtgcctg ccccgatgcc atcgcaagta cgaggcttag aaccaccttc aacagatcgc     900

gcatagtctt ccccagctct ctaacgcttg agttaagccg cgccgcgaag cggcgtcggc     960

ttgaacgaat tgttagacat tatttgccga ctaccttggt gatctcgcct ttcacgtagt    1020

gaacaaattc ttccaactga tctgcgcgcg aggccaagcg atcttcttgt ccaagataag    1080

cctgcctagc ttcaagtatg acgggctgat actgggccgg caggcgctcc attgcccagt    1140

cggcagcgac atccttcggc gcgattttgc cggttactgc gctgtaccaa atgcgggaca    1200

acgtaagcac tacatttcgc tcatcgccag cccagtcggg cggcgagttc catagcgtta    1260

aggtttcatt tagcgcctca aatagatcct gttcaggaac cggatcaaag agttcctccg    1320

ccgctggacc taccaaggca acgctatgtt ctcttgcttt tgtcagcaag atagccagat    1380

caatgtcgat cgtggctggc tcgaagatac ctgcaagaat gtcattgcgc tgccattctc    1440

caaattgcag ttcgcgctta gctggataac gccacggaat gatgtcgtcg tgcacaacaa    1500

tggtgacttc tacagcgcgg agaatctcgc tctctccagg ggaagccgaa gtttccaaaa    1560

ggtcgttgat caaagctcgc cgcgttgttt catcaagcct tacggtcacc gtaaccagca    1620

aatcaatatc actgtgtggc ttcaggccgc catccactgc ggagccgtac aaatgtacgg    1680

ccagcaacgt cggttcgaga tggcgctcga tgacgccaac tacctctgat agttgagtcg    1740

atacttcggc gatcaccgct tccctcatga tgtttaactc ctgaattaag ccgcgccgcg    1800

aagcggtgtc ggcttgaatg aattgttagg cgtcatcctg tgctcccgag aaccagtacc    1860

agtacatcgc tgtttcgttc gagacttgag gtctagtttt atacgtgaac aggtcaatgc    1920

cgccgagagt aaagccacat tttgcgtaca aattgcaggc aggtacattg ttcgtttgtg    1980

tctctaatcg tatgccaagg agctgtctgc ttagtgccca ctttttcgca aattcgatga    2040

gactgtgcgc gactcctttg cctcggtgcg tgtgcgacac aacaatgtgt tcgatagagg    2100

ctagatcgtt ccatgttgag ttgagttcaa tcttcccgac aagctcttgg tcgatgaatg    2160

cgccatagca agcagagtct tcatcagagt catcatccga gatgtaatcc ttccggtagg    2220

ggctcacact tctggtagat agttcaaagc cttggtcgga taggtgcaca tcgaacactt    2280

cacgaacaat gaaatggttc tcagcatcca atgtttccgc cacctgctca gggatcaccg    2340

aaatcttcat atgacgccta acgcctggca cagcggatcg caaacctggc gcggcttttg    2400

gcacaaaagg cgtgacaggt ttgcgaatcc gttgctgcca cttgttaacc cttttgccag    2460

atttggtaac tataatttat gttagaggcg aagtcttggg taaaaactgg cctaaaattg    2520

ctggggattt caggaaagta aacatcacct tccggctcga tgtctattgt agatatatgt    2580

agtgtatcta cttgatcggg ggatctgctg cctcgcgcgt ttcggtgatg acggtgaaaa    2640

cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag    2700

cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggcg cagccatgac    2760

ccagtcacgt agcgatagcg gagtgtatac tggcttaact atgcggcatc agagcagatt    2820

gtactgagag tgcaccatat gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac    2880

cgcatcaggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg    2940

cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat    3000

aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc    3060

gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc    3120

tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga    3180

agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt    3240

ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg    3300

taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc    3360

gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg    3420

gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc    3480

ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg    3540

ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc    3600

gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct    3660

caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt    3720

taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa    3780

aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa    3840

tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc    3900

tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct    3960

gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca    4020

gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt    4080

aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt    4140

gccattgctg cagggggggg gggggggggg gacttccatt gttcattcca cggacaaaaa    4200

cagagaaagg aaacgacaga ggccaaaaag cctcgctttc agcacctgtc gtttcctttc    4260

ttttcagagg gtattttaaa taaaaacatt aagttatgac gaagaagaac ggaaacgcct    4320

taaaccggaa aattttcata aatagcgaaa acccgcgagg tcgccgcccc gtaacctgtc    4380

ggatcaccgg aaaggacccg taaagtgata atgattatca tctacatatc acaacgtgcg    4440

tggaggccat caaaccacgt caaataatca attatgacgc aggtatcgta ttaattgatc    4500

tgcatcaact taacgtaaaa acaacttcag acaatacaaa tcagcgacac tgaatacggg    4560

gcaacctcat gtcccccccc cccccccccc tgcaggcatc gtggtgtcac gctcgtcgtt    4620

tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat    4680

gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc    4740

cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc    4800

cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat    4860

gcggcgaccg agttgctctt gcccggcgtc aacacgggat aataccgcgc cacatagcag    4920

aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt    4980

accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc    5040

ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa    5100

gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg    5160

aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa    5220

taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac    5280

cattattatc atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtcttca    5340

agaattggtc gacgatcttg ctgcgttcgg atattttcgt ggagttcccg ccacagaccc    5400

ggattgaagg cgagatccag caactcgcgc cagatcatcc tgtgacggaa ctttggcgcg    5460

tgatgactgg ccaggacgtc ggccgaaaga gcgacaagca gatcacgctt ttcgacagcg    5520

tcggatttgc gatcgaggat ttttcggcgc tgcgctacgt ccgcgaccgc gttgagggat    5580

caagccacag cagcccactc gaccttctag ccgacccaga cgagccaagg gatctttttg    5640

gaatgctgct ccgtcgtcag gctttccgac gtttgggtgg ttgaacagaa gtcattatcg    5700

cacggaatgc caagcactcc cgaggggaac cctgtggttg gcatgcacat acaaatggac    5760

gaacggataa accttttcac gcccttttaa atatccgatt attctaataa acgctctttt    5820

ctcttaggtt tacccgccaa tatatcctgt caaacactga tagtttatca ccactttgta    5880

caagaaagct gggtcggcgc gccgcaagaa tctcaaacac ggagatctca aagtttgaaa    5940

gaaaatttat ttcttcgact caaaacaaac ttacgaaatt taggtagaac ttatatacat    6000

tatattgtaa ttttttgtaa caaaatgttt ttattattat tatagaattt tactggttaa    6060

attaaaaatg aatagaaaag gtgaattaag aggagagagg aggtaaacat tttcttctat    6120

tttttcatat tttcaggata aattattgta aaagtttaca agatttccat ttgactagtg    6180

taaatgagga atattctcta gtaagatcat tatttcatct acttctttta tcttctacca    6240

gtagaggaat aaacaatatt tagctccttt gtaaatacaa attaattttc gttcttgaca    6300

tcattcaatt ttaattttac gtataaaata aaagatcata cctattagaa cgattaagga    6360

gaaatacaat tcgaatgaga aggatgtgcc gcttgttata ataaacagcc acacgacgta    6420

aacgtaaaat gaccacatga tgggccaata gacatggacc gactactaat aatagtaagt    6480

tacattttag gatggaataa atatcatacc gacatcagtt tgaaagaaaa gggaaaaaaa    6540

gaaaaaataa ataaaagata tactaccgac atgagttcca aaaagcaaaa aaaaagatca    6600

agccgacaca gacacgcgta gagagcaaaa tgactttgac gtcacaccac gaaaacagac    6660

gcttcatacg tgtcccttta tctctctcag tctctctata aacttagtga gaccctcctc    6720

tgttttactc acaaatttaa ttaaagatct cccgggcctt cacctgcgga gggtaagatc    6780

cgatcaccat cttctgaatt tctgttcttg atctgtcatg tataataact gtctagtctt    6840

ggtgttggtg agatggaaat tcggtggatc tcggaaggga tattgttcgt ttgctggggt    6900

tttttttgtg tgttgtgatc cgtagagaat ttgtgtttat ccatgttgtt gatcttggta    6960

tgtattcatg acatattgac atgcatgtgt tgtatgtgtc atatgtgtgc ctctccttgg    7020

gatttgtttt ggataataga acatgttatg gactcaatag tctgtgaaca aatctttttt    7080

tagatggtgg ccaaatctga tgatgatctt tcttgagagg aaaaagttca tgatagaaaa    7140

atcttttttg agatggtggc ttaatgtgat gatgatcttt cttgagagga aaaaaaagat    7200

tcattatagg agattttgat ttagctcctt tccaccgata ttaaatgagg agcatgcatg    7260

ctgattgctg ataaggatct gattttttta tcccctcttc tttgaacaga caagaaatag    7320

gctctgaatt tctgattgat tatttgtaca tgcagatgca agatgtacaa cggtccgcct    7380

cagcgcgatc gccttaaggt ttgggtaggt cagtccctta tgttacgtcc tgtagaaacc    7440

ccaacccgtg aaatcaaaaa actcgacggc ctgtgggcat tcagtctgga tcgcgaaaac    7500

tgtggaattg gtcagcgttg gtgggaaagc gcgttacaag aaagccgggc aattgctgtg    7560

ccaggcagtt ttaacgatca gttcgccgat gcagatattc gtaattatgc gggcaacgtc    7620

tggtatcagc gcgaagtctt tataccgaaa ggttgggcag gccagcgtat cgtgctgcgt    7680

ttcgatgcgg tcactcatta cggcaaagtg tgggtcaata atcaggaagt gatggagcat    7740

cagggcggct atacgccatt tgaagccgat gtcacgccgt atgttattgc cgggaaaagt    7800

gtacgtaagt ttctgcttct acctttgata tatatataat aattatcatt aattagtagt    7860

aatataatat ttcaaatatt tttttcaaaa taaaagaatg tagtatatag caattgcttt    7920

tctgtagttt ataagtgtgt atattttaat ttataacttt tctaatatat gaccaaaatt    7980

tgttgatgtg caggtatcac cgtttgtgtg aacaacgaac tgaactggca gactatcccg    8040

ccgggaatgg tgattaccga cgaaaacggc aagaaaaagc agtcttactt ccatgatttc    8100

tttaactatg ccggaatcca tcgcagcgta atgctctaca ccacgccgaa cacctgggtg    8160

gacgatatca ccgtggtgac gcatgtcgcg caagactgta accacgcgtc tgttgactgg    8220

caggtggtgg ccaatggtga tgtcagcgtt gaactgcgtg atgcggatca acaggtggtt    8280

gcaactggac aaggcactag cgggactttg caagtggtga atccgcacct ctggcaaccg    8340

ggtgaaggtt atctctatga actgtgcgtc acagccaaaa gccagacaga gtgtgatatc    8400

tacccgcttc gcgtcggcat ccggtcagtg gcagtgaagg gcgaacagtt cctgattaac    8460

cacaaaccgt tctactttac tggctttggt cgtcatgaag atgcggactt gcgtggcaaa    8520

ggattcgata acgtgctgat ggtgcacgac cacgcattaa tggactggat tggggccaac    8580

tcctaccgta cctcgcatta cccttacgct gaagagatgc tcgactgggc agatgaacat    8640

ggcatcgtgg tgattgatga aactgctgct gtcggcttta acctctcttt aggcattggt    8700

ttcgaagcgg gcaacaagcc gaaagaactg tacagcgaag aggcagtcaa cggggaaact    8760

cagcaagcgc acttacaggc gattaaagag ctgatagcgc gtgacaaaaa ccacccaagc    8820

gtggtgatgt ggagtattgc caacgaaccg gatacccgtc cgcaaggtgc acgggaatat    8880

ttcgcgccac tggcggaagc aacgcgtaaa ctcgacccga cgcgtccgat cacctgcgtc    8940

aatgtaatgt tctgcgacgc tcacaccgat accatcagcg atctctttga tgtgctgtgc    9000

ctgaaccgtt attacggatg gtatgtccaa agcggcgatt tggaaacggc agagaaggta    9060

ctggaaaaag aacttctggc ctggcaggag aaactgcatc agccgattat catcaccgaa    9120

tacggcgtgg atacgttagc cgggctgcac tcaatgtaca ccgacatgtg gagtgaagag    9180

tatcagtgtg catggctgga tatgtatcac cgcgtctttg atcgcgtcag cgccgtcgtc    9240

ggtgaacagg tatggaattt cgccgatttt gcgacctcgc aaggcatatt gcgcgttggc     9300

ggtaacaaga aagggatctt cactcgcgac cgcaaaccga agtcggcggc ttttctgctg     9360

caaaaacgct ggactggcat gaacttcggt gaaaaaccgc agcagggagg caaacaatga     9420

atcaacaact ctcctggcgc accatcgtcg gctacagcct cgggaattgc taccgagctc     9480

gaatttcccc gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc     9540

cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg taataattaa     9600

catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata     9660

catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc     9720

ggtgtcatct atgttactag atcgggaatt ggcatgcaag cttggcactg gccgtcgttt     9780

tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc     9840

cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt     9900

tgcgcagcct gaatggcgaa tgctagagca gcttgagctt ggatcagatt gtcgtttccc     9960

gccttcagtt taaacgatag cggtgaaggg ggcggccgcg gagcctgctt ttttgtacaa    10020

acttgtgata aacgggccgc tctagattag tgtacggaat aaaagtccta attcattctt    10080

tttcttatac gtcaccgttt tctacattta gaaaaatgaa gtgggaatca attgaaacaa    10140

ttgatagctt taaatatcaa gctgtcttct ccaggaccag gccccagcac atcggcgtgg    10200

aaagcgctag gccccagaac aactcgtcaa tcgtcatggc aaataatgac acattgagcc    10260

gatttgatgc atggaacaga ctaataagga actcaaatct ctttggagat tgaatgattg    10320

agatgaaaat gaattaatat tttttctcaa tcccctccaa tgctaagaaa gtttgagttt    10380

ccaaattagc tttagagggc gtttagatcc cttcgtttta gagaaattag aattcactca    10440

ataaaataac ttatttaatt tggaatttga tattcaacca cttttcaaag tttagatata    10500

ggtctatctc aaattcatag ggtggatgat ggaaatgatt ttatgcatta atagaatttg    10560

tttctactgt gtaacttaca tgacactctt catctcactc ctgtatagta aaaatgtagc    10620

atataaatat ctccgacatc ttgataataa tagtatacaa atatattttg cataaaaccg    10680

aattaactta attgatatat gccaaaatta ctattattag aatggaattt aattccaatg    10740

atccaaacca cgaaaatgga tcaggtaact aattcagtca aatgcctcat tttttttcac     10800

tcccctcaaa ccacgaaaat gccattctgg tttgtaaaat agtttgaaat tgcagcccta     10860

gcattattcc atacatcata tgttgagttg aaattaccaa tataataata actaaaaaag     10920

gaaaaaaata gcgaaaacaa aagcaaggac cagttggaca cttaaatttg gcaacagaag     10980

ccaattcaga accactgcat agcagtgctt attatcttat ttatatgtag caaaaggcac     11040

ttaaatgatc tcttatgaca catgccagaa ggaaaacaac agactacaca attacaaggt     11100

cggaagctac ataggattac cataacagat agctgacggc ctacaaaaaa agatagaata     11160

caggagaaca tcacacagat aaaaacatat cacccttgta ctagcaggga ggcggtgctt     11220

gctggatttt agatcagttg cttgctggat tttagatcag tacacagtcc tgccatcacc     11280

atccaggatc atatccttga aagccccacc attagggatc ataggcaaca catgctcctg     11340

gtgtgggacg attatatcca agaggtacgg ccctggagtc tcgagcatct tctttatcgc     11400

tgcgcggact tcgttcttct ttgtcacacg gaccgctgga atgttgaacc ctttggcgat     11460

cgtcacgaaa tctggatata tctcactttc attctctggg tttcccaagt atgtgtgcgc     11520

tctgttggcc ttatagaacc tgtcctccca ctgcaccacc atccccaggt gctggttgtt     11580

tagcacaaag accttcaccg ggaggttctc aattcggatc atagctagct cctgaacgtt     11640

catgagaaag ctaccatctc catcgatgtc aacaacagta acacctgggt tggccacaga     11700

agcaccagca gcagccggca aaccaaatcc catagcccca agaccagctg aagacaacca     11760

ctgccttggc cgcttgtaag tgtagtactg tgccgcccac atctggtgct gcccaacacc     11820

tgtgccgatg atggcctcgc ctttcgtcag ctcatcaaga acctgaatag catattgtgg     11880

ctggatctcc tcattagatg ttttataccc aagggggaat tccctcttct gctgatccaa     11940

ctcatcgttc catgagccaa agtcaaagct cttctttgat gtgcttcctt caagaagagc     12000

attcatgccc tgcaaagcaa gcttaacatc tgcacagatg gacacatgtg gctgcttgtt     12060

cttgccaatc tcagccggat caatatcaac gtgcacaatc ttagccctgc ttgcaaaagc     12120

ctcaatcttc cctgtcacac gatcatcaaa ccgcacacca agtgcaagca acagatcggc     12180

cttatccact gcataatttg catacaccgt gccatgcata cctagcatgc gcagagacag     12240

tgggtcgtcg ctggggaagt tgccgaggcc cataagagta gttgtgaccg ggattccagt    12300

cagctccaca aagcgtcgca actcctcacc agatgctgcg cagccaccgc caacataaag    12360

aacagggcgc cgggattcac caacaagacg cagcacctgc tcaagcaact cagtcgcagg    12420

gggcttggga aggcgcgcaa tgtacccagg cagactcatg ggcttgtccc agacaggcac    12480

cgccatctgc tgctggatgt ccttggggat gtcgacaagc accggccccg gtcgaccaga    12540

ggaggcgagg aagaaagcct cctgcacgac gcgggggatg tcgtcgacgt cgaggaccag    12600

gtagttgtgc ttggtgatgg agcgggtgac ctcgacgatg ggcgtctcct ggaaggcgtc    12660

ggtgccaatc atgcgtcgcg gcacctgtcc cgtgatggcg accatgggga cggaatcgag    12720

cagcgcgtcg gcgagcgcgg agacaaggtt ggtggcgccg gggccggagg tggcgatgca    12780

gacgccgacg cggcccgagg agcgcgcgta gccggaggcc gcaaaggcct ccccttgctc    12840

gtggcggaag aggtggttgg cgatgacggg ggagcgggtg agtgcctggt ggatctccat    12900

ggacgcgccg ccggggtagg cgaagacgtc gcggacgccg cagcgctcga gggactcgac    12960

gaggatgtcg gcgcccttgc ggggatcggt ggggccccac ggccggagcg gggtggccgg    13020

gggagccatc ggcatggcgg gtgacgccgc tgagcacctg atgggcgcgg cgagggcgcg    13080

gcgggtggcc aggaggtgcg cccggcgcct cgccttgggc gcagcggtag tggcgccagt    13140

gagcgcggta gacgcggcgg cggcggtggc catggtttct agaactagtg gatcccccgg    13200

gggtaccctg cagaagtaac accaaacaac agggtgagca tcgacaaaag aaacagtacc    13260

aagcaaataa atagcgtatg aaggcagggc taaaaaaatc cacatatagc tgctgcatat    13320

gccatcatcc aagtatatca agatcgaaat aattataaaa catacttgtt tattataata    13380

gataggtact caaggttaga gcatatgaat agatgctgca tatgccatca tgtatatgca    13440

tcagtaaaac ccacatcaac atgtatacct atcctagatc gatatttcca tccatcttaa    13500

actcgtaact atgaagatgt atgacacaca catacagttc caaaattaat aaatacacca    13560

ggtagtttga aacagtattc tactccgatc tagaacgaat gaacgaccgc ccaaccacac    13620

cacatcatca caaccaagcg aacaaaaagc atctctgtat atgcatcagt aaaacccgca    13680

tcaacatgta tacctatcct agatcgatat ttccatccat catcttcaat tcgtaactat    13740

gaatatgtat ggcacacaca tacagatcca aaattaataa atccaccagg tagtttgaaa    13800

cagaattcta ctccgatcta gaacgaccgc ccaaccagac cacatcatca caaccaagac    13860

aaaaaaaagc atgaaaagat gacccgacaa acaagtgcac ggcatatatt gaaataaagg    13920

aaaagggcaa accaaaccct atgcaacgaa acaaaaaaaa tcatgaaatc gatcccgtct    13980

gcggaacggc tagagccatc ccaggattcc ccaaagagaa acactggcaa gttagcaatc    14040

agaacgtgtc tgacgtacag gtcgcatccg tgtacgaacg ctagcagcac ggatctaaca    14100

caaacacgga tctaacacaa acatgaacag aagtagaact accgggccct aaccatggac    14160

cggaacgccg atctagagaa ggtagagagg gggggggggg gggaggacga gcggcgtacc    14220

ttgaagcgga ggtgccgacg ggtggatttg ggggagatct ggttgtgtgt gtgtgcgctc    14280

cgaacaacac gaggttgggg aaagagggtg tggagggggt gtctatttat tacggcgggc    14340

gaggaaggga aagcgaagga gcggtgggaa aggaatcccc cgtagctgcc ggtgccgtga    14400

gaggaggagg aggccgcctg ccgtgccggc tcacgtctgc cgctccgcca cgcaatttct    14460

ggatgccgac agcggagcaa gtccaacggt ggagcggaac tctcgagagg ggtccagagg    14520

cagcgacaga gatgccgtgc cgtctgcttc gcttggcccg acgcgacgct gctggttcgc    14580

tggttggtgt ccgttagact cgtcgacggc gtttaacagg ctggcattat ctactcgaaa    14640

caagaaaaat gtttccttag tttttttaat ttcttaaagg gtatttgttt aatttttagt    14700

cactttattt tattctattt tatatctaaa ctattaaata aaaaaactaa aatagagttt    14760

tagttttctt aatttagagg ctaaaataga ataaaataga tgtactaaaa aaattagtct    14820

ataaaaacca ttaaccctaa accctaaatg gatgtactaa taaaatggat gaagtattat    14880

ataggtgaag ctatttgcaa aaaaaaagga gaacacatgc acactaaaaa gataaaactg    14940

tagagtcctg ttgtcaaaat actcaattgt cctttagacc atgtctaact gttcatttat    15000

atgattctct aaaacactga tattattgta gtactataga ttatattatt cgtagagtaa    15060

agtttaaata tatgtataaa gatagataaa ctgcacttca aacaagtgtg acaaaaaaaa    15120

tatgtggtaa ttttttataa cttagacatg caatgctcat tatctctaga gaggggcacg    15180

accgggtcac gctgcactgc agccgcggaa gcttgcatgc ctgcaggcat gcaagcttgg    15240

cgcgccttaa ttaacacgtg ggcgcgccac tagtcaattc agtacattaa aaacgtccgc  15300

aatgtgttat taagttgtct aagcgtcaat ttgtttacac cacaatatat cctgccacca  15360

gccagccaac agctccccga ccggcagctc ggcacaaaat caccactcga tacaggcagc  15420

ccatcagtcc gggacggcgt cagcgggaga gccgttgtaa ggcggcagac tttgctcatg  15480

ttaccgatgc tattcggaag aacggcaact aagctgccgg gtttgaaaca cggatgatct  15540

cgcggagggt agc                                                     15553

<210>3

<211>583

<212>DNA

<213>稻(Oryza sativa)

<220>

<221>内含子

<222>(1)..(583)

<223>BPSI.1内含子

<400>3

gtaagatccg atcaccatct tctgaatttc tgttcttgat ctgtcatgta taataactgt     60

ctagtcttgg tgttggtgag atggaaattc ggtggatctc ggaagggata ttgttcgttt    120

gctggggttt tttttgtgtg ttgtgatccg tagagaattt gtgtttatcc atgttgttga    180

tcttggtatg tattcatgac atattgacat gcatgtgttg tatgtgtcat atgtgtgcct    240

ctccttggga tttgttttgg ataatagaac atgttatgga ctcaatagtc tgtgaacaaa    300

tcttttttta gatggtggcc aaatctgatg atgatctttc ttgagaggaa aaagttcatg    360

atagaaaaat cttttttgag atggtggctt aatgtgatga tgatctttct tgagaggaaa    420

aaaaagattc attataggag attttgattt agctcctttc caccgatatt aaatgaggag    480

catgcatgct gattgctgat aaggatctga tttttttatc ccctcttctt tgaacagaca    540

agaaataggc tctgaatttc tgattgatta tttgtacatg cag                      583

<210>4

<211>1006

<212>DNA

<213>玉米(Zea mays)

<220>

<221>内含子

<222>(1)..(1006)

<400>4

gtacgccgct cgtcctcccc cccccccccc ctctctacct tctctagatc ggcgttccgg     60

tccatggtta gggcccggta gttctacttc tgttcatgtt tgtgttagat ccgtgtttgt    120

gttagatccg tgctgctagc gttcgtacac ggatgcgacc tgtacgtcag acacgttctg    180

attgctaact tgccagtgtt tctctttggg gaatcctggg atggctctag ccgttccgca    240

gacgggatcg atttcatgat tttttttgtt tcgttgcata gggtttggtt tgcccttttc    300

ctttatttca atatatgccg tgcacttgtt tgtcgggtca tcttttcatg cttttttttg    360

tcttggttgt gatgatgtgg tctggttggg cggtcgttct agatcggagt agaattctgt    420

ttcaaactac ctggtggatt tattaatttt ggatctgtat gtgtgtgcca tacatattca    480

tagttacgaa ttgaagatga tggatggaaa tatcgatcta ggataggtat acatgttgat    540

gcgggtttta ctgatgcata tacagagatg ctttttgttc gcttggttgt gatgatgtgg    600

tgtggttggg cggtcgttca ttcgttctag atcggagtag aatactgttt caaactacct    660

ggtgtattta ttaattttgg aactgtatgt gtgtgtcata catcttcata gttacgagtt    720

taagatggat ggaaatatcg atctaggata ggtatacatg ttgatgtggg ttttactgat    780

gcatatacat gatggcatat gcagcatcta ttcatatgct ctaaccttga gtacctatct    840

attataataa acaagtatgt tttataatta tttcgatctt gatatacttg gatgatggca    900

tatgcagcag ctatatgtgg atttttttag ccctgccttc atacgctatt tatttgcttg    960

gtactgtttc ttttgtcgat gctcaccctg ttgtttggtg ttactt                  1006

<210>5

<211>27

<212>DNA

<213>拟南芥

<220>

<221>引物_结合

<222>(1)..(27)

<400>5

gcaagaatct caaacacgga gatctca                       27

<210>6

<211>29

<212>DNA

<213>拟南芥

<220>

<221>引物_结合

<222>(1)..(29)

<400>6

atttgtgagt aaaacagagg agggtctca                     29

<210>7

<211>35

<212>DNA

<213>稻

<220>

<221>引物_结合

<222>(1)..(35)

<400>7

cccgggcacc ctgcggaggg taagatccga tcacc              35

<210>8

<211>30

<212>DNA

<213>稻

<220>

<221>引物_结合

<222>(1)..(30)

<400>8

cggaccggta catcttgcat ctgcatgtac                     30

<210>9

<211>11

<212>DNA

<213>未知的

<220>

<223>AG基序结合蛋白

<400>9

ggagatctca a                                 11

<210>10

<211>11

<212>DNA

<213>未知的

<220>

<223>AG基序结合蛋白1核心序列

<220>

<221>misc_feature

<222>(1)..(3)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(8)..(11)

<223>n是a,c,g,或t

<400>10

nnngatcnnn n                                 11

<210>11

<211>17

<212>DNA

<213>矮牵牛(Petunia hybrida)

<400>11

gtaagtttgt tttgagt                           17

<210>12

<211>17

<212>DNA

<213>矮牵牛

<220>

<221>misc_feature

<222>(1)..(6)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(11)..(17)

<223>n是a,c,g,或t

<400>12

nnnnnnttgt nnnnnnn                  17

<210>13

<211>21

<212>DNA

<213>拟南芥

<400>13

acttacgaaa tttaggtaga a             21

<210>14

<211>21

<212>DNA

<213>拟南芥

<220>

<221>misc_feature

<222>(1)..(3)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(8)..(21)

<223>n是a,c,g,或t

<400>14

nnnt acgnnn nnnnnnnnnn n            21

<210>15

<211>21

<212>DNA

<213>拟南芥

<400>15

aattacaata taatgtatat a            21

<210>16

<211>21

<212>DNA

<213>拟南芥

<400>16

atatacatta tattgtaatt t               21

<210>17

<211>21

<212>DNA

<213>拟南芥

<220>

<221>misc_feature

<222>(1)..(3)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(8)..(21)

<223>n是a,c,g,或t

<400>17

nnntacannn nnnnnnnnnn n               21

<210>18

<211>17

<212>DNA

<213>矮牵牛

<400>18

aacattttgt tacaaaa                    17

<210>19

<211>11

<212>DNA

<213>大豆(Glycine max)

<400>19

tgtttttatt a                          11

<210>20

<211>11

<212>DNA

<213>大豆

<220>

<221>misc_feature

<222>(1)..(2)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(7)..(11)

<223>n是a,c,g,或t

<400>20

nnttttnnnn n                                 11

<210>21

<211>11

<212>DNA

<213>向日葵(Helianthus annuus)

<400>21

tttattatta t                                 11

<210>22

<211>11

<212>DNA

<213>向日葵

<220>

<221>misc_feature

<222>(1)..(6)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(11)..(11)

<223>n是a,c,g,或t

<400>22

nnnnnnatta n                                 11

<210>23

<211>11

<212>DNA

<213>向日葵

<400>23

attattatta t                       11

<210>24

<211>17

<212>DNA

<213>未知的

<220>

<223>SBF-1

<400>24

ttactggtta aattaaa                 17

<210>25

<211>17

<212>DNA

<213>未知的

<220>

<223>SBF-1

<220>

<221>misc_feature

<222>(1)..(7)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(12)..(17)

<223>n是a,c,g,或t

<400>25

nnnnnnntta annnnnn                 17

<210>26

<211>15

<212>DNA

<213>未知的

<220>

<223>GAP-1

<400>26

aaaaat gaat agaaa                        15

<210>27

<211>15

<212>DNA

<213>未知的

<220>

<223>顺式元件

<220>

<221>misc_feature

<222>(1)..(4)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(9)..(15)

<223>n是a,c,g,或t

<400>27

nnnnatgann nnnnn                         15

<210>28

<211>17

<212>DNA

<213>未知的

<220>

<223>谷醇溶蛋白(prolamin)盒

<400>28

tgaatagaaa aggtgaa                       17

<210>29

<211>17

<212>DNA

<213>未知的

<220>

<223>谷醇溶蛋白盒

<220>

<221>misc_feature

<222>(1)..(8)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(13)..(17)

<223>n是a,c,g,或t

<400>29

nnnnnnnnaa agnnnnn                                         17

<210>30

<211>17

<212>DNA

<213>未知的

<220>

<223>rbc基因和其它光调节型基因中的I盒

<400>30

gaat agaaaa ggt gaat                                       17

<210>31

<211>17

<212>DNA

<213>未知的

<220>

<223>rbcS基因和其它光调节型基因中的I盒

<220>

<221>misc_feature

<222>(1)..(5)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(10)..(17)

<223>n是a,c,g,或t

<400>31

nnnnngaaan nnnnnnn                                         17

<210>32

<211>11

<212>DNA

<213>未知的

<220>

<223>结瘤蛋白共有序列1

<400>32

gaaaaggtga a                               11

<210>33

<211>11

<212>DNA

<213>未知的

<220>

<223>结瘤蛋白共有序列1

<220>

<221>misc_feature

<222>(1)..(1)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(6)..(11)

<223>n是a,c,g,或t

<400>33

naaaannnnn n                               11

<210>34

<211>21

<212>DNA

<213>未知的

<220>

<223>OCS样元件

<400>34

agaagaaaat gtttacctcc t                    21

<210>35

<211>21

<212>DNA

<213>未知的

<220>

<223>OCS样元件

<220>

<221>misc_feature

<222>(1)..(14)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(19)..(21)

<223>n是a,c,g,或t

<400>35

nnnnnnnnnn nnnnacctnn n             21

<210>36

<211>11

<212>DNA

<213>未知的

<220>

<223>结瘤蛋白共有序列1

<400>36

aaaatgttta c                        11

<210>37

<211>11

<212>DNA

<213>未知的

<220>

<223>结瘤蛋白共有序列1

<220>

<221>misc_feature

<222>(1)..(1)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(6)..(11)

<223>n是a,c,g,或t

<400>37

naaatnnnnn n                       11

<210>38

<211>21

<212>DNA

<213>未知的

<220>

<223>MADS盒蛋白

<400>38

ttcttctatt ttttcatatt t                                             21

<210>39

<211>21

<212>DNA

<213>未知的

<220>

<223>MADS盒蛋白

<220>

<221>misc_feature

<222>(1)..(7)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(12)..(21)

<223>n是a,c,g,或t

<400>39

nnnnnnnatt tnnnnnnnnn n                                             21

<210>40

<211>15

<212>DNA

<213>未知的

<220>

<223>GAPDH启动子中赋予光可诱导性的顺式元件

<400>40

aaatatgaaa aaata                                                    15

<210>41

<211>17

<212>DNA

<213>马铃薯(Solanum tuberosum)

<400>41

taatttatcc tgaaaat                          17

<210>42

<211>17

<212>DNA

<213>马铃薯

<220>

<221>misc_feature

<222>(1)..(6)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(11)..(17)

<223>n是a,c,g,或t

<400>42

nnnnnnatcc nnnnnnn                          17

<210>43

<211>17

<212>DNA

<213>未知的

<220>

<223>I类GATA因子

<400>43

ttcaggataa attattg                          17

<210>44

<211>17

<212>DNA

<213>未知的

<220>

<223>I类GATA因子

<220>

 <221>misc_feature

<222>(1)..(5)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(10)..(17)

<223>n是a,c,g,或t

<400>44

nnnnngatan nnnnnnn                           17

<210>45

<211>11

<212>DNA

<213>拟南芥

<400>45

taaattattg t                                 11

<210>46

<211>11

<212>DNA

<213>拟南芥

<220>

<221>misc_feature

<222>(1)..(3)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(8)..(11)

<223>n是a,c,g,或t

<400>46

nnnattannn n                                11

<210>47

<211>11

<212>DNA

<213>未知的

<220>

<223>HDZip I类蛋白ATHB5

<400>47

acaataattt a                                11

<210>48

<211>11

<212>DNA

<213>未知的

<220>

<223>HDZip I类蛋白ATHB5

<220>

<221>misc_feature

<222>(1)..(3)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(8)..(11)

<223>n是a,c,g,或t

<400>48

nnnataannn n                                           11

<210>49

<211>17

<212>DNA

<213>未知的

<220>

<223>三股螺旋DNA结合因子GT-3a

<400>49

taaactttta caataat                                     17

<210>50

<211>17

<212>DNA

<213>未知的

<220>

<223>三股螺旋DNA结合因子GT-3a

<220>

<221>misc_feature

<222>(1)..(6)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(11)..(17)

<223>n是a,c,g,或t

<400>50

nnnnnnttta nnnnnnn                            17

<210>51

<211>11

<212>DNA

<213>未知的

<220>

<223>结瘤蛋白共有序列1

<400>51

taaaagttta c                                  11

<210>52

<211>17

<212>DNA

<213>未知的

<220>

<223>GAAA基序

<400>52

aaatggaaat cttgtaa                            17

<210>53

<211>17

<212>DNA

<213>未知的

<220>

<223>GAAA基序

<220>

<221>misc_feature

<222>(1)..(5)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(10)..(17)

<223>n是a,c,g,或t

<400>53

nnnnngaaan nnnnnnn                               17

<210>54

<211>17

<212>DNA

<213>菠菜(Spinacia oleracea)

<400>54

tcaaatggaa atcttgt                               17

<210>55

<211>17

<212>DNA

<213>菠菜

<220>

<221>misc_feature

<222>(1)..(4)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(9)..(17)

<223>n是a,c,g,或t

<400>55

nnnnat ggnn nnnnnnn                              17

<210>56

<211>17

<212>DNA

<213>未知的

<220>

<223>WRKY植物特异的锌指型因子

<400>56

tccatttgac tagtgta                               17

<210>57

<211>17

<212>DNA

<213>未知的

<220>

<223>WRKY植物特异的锌指型因子

<220>

<221>misc_feature

<222>(1)..(5)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(10)..(17)

<223>n是a,c,g,或t

<400>57

nnnnnttgan nnnnnnn    17

<210>58

<211>17

<212>DNA

<213>普通小麦(Triticum aestivum)

<400>58

gagaatattc ctcattt                                     17

<210>59

<211>17

<212>DNA

<213>普通小麦

<220>

<221>misc_feature

<222>(1)..(4)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(9)..(17)

<223>n是a,c,g,或t

<400>59

nnnnatatnn nnnnnnn                                    17

<210>60

<211>17

<212>DNA

<213>普通小麦

<400>60

aggaatattc tctagta                                                           17

<210>61

<211>11

<212>DNA

<213>向日葵

<220>

<221>misc_feature

<223>n是a,c,g,或t

<400>61

aagatcatta t                                                                 11

<210>62

<211>11

<212>DNA

<213>未知的

<220>

<223>参与类胡萝卜素和生育酚生物合成和光合作用相关基因表达的基序

<400>62

tcatctactt c                                                                 11

<210>63

<211>11

<212>DNA

<213>未知的

<220>

<223>参与类胡萝卜素和生育酚生物合成和光合作用相关基因表达的基序

<220>

<221>misc_feature

<222>(1)..(2)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(7)..(11)

<223>n是a,c,g,或t

<400>63

nnatctnnnn n                             11

<210>64

<211>17      <212>DNA

<213>未知的

<220>

<223>I类GATA因子

<400>64

tagaagataa aagaagt                       17

<210>65

<211>15

<212>DNA

<213>未知的

<220>

<223>热休克元件

<400>65

agaagataaa agaag                         15

<210>66

<211>15

<212>DNA

<213>未知的

<220>

<223>热休克元件

<220>

<221>misc_feature

<222>(1)..(10)

<223>n是a,c,g,或t

<220>

<221>misc_feature

 <222>(15)..(15)

<223>n是a,c,g,或t

<400>66

nnnnnnnnnn agaan                                     15

<210>67

<211>21

<212>DNA

<213>拟南芥

<400>67

ttattcctct actggtagaa g                              21

<210>68

<211>21

<212>DNA

<213>拟南芥

<220>

<221>misc_feature

<222>(1)..(3)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(8)..(21)

<223>n是a,c,g,或t

<400>68

nnnttccnnn nnnnnnnnnn n                              21

<210>69

<211>21

<212>DNA

<213>拟南芥

<400>69

ttctaccagt agaggaataa a                              21

<210>70

<211>21

<212>DNA

<213>拟南芥

<220>

<221>misc_feature

<222>(1)..(3)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(8)..(21)

<223>n是a,c,g,或t

<400>70

nnntaccnnn nnnnnnnnnn n                                            21

<210>71

<211>17

<212>DNA

<213>普通小麦

<400>71

ttgtttattc ctctact                                                 17

<210>72

<211>17

<212>DNA

<213>普通小麦

<220>

<221>misc_feature

<222>(1)..(4)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(9)..(17)

<223>n是a,c,g,或t

<400>72

nnnnttatnn nnnnnnn                                                 17

<210>73

<211>17

<212>DNA

<213>未知的

<220>

<223>禾谷类种子贮藏蛋白基因启动子中保守的谷醇溶蛋白盒

<400>73

tcctttgtaa atacaaa                                                      17

<210>74

<211>17

<212>DNA

<213>未知的

<220>

<223>禾谷类种子贮藏蛋白基因启动子中保守的谷醇溶蛋白盒

<220>

<221>misc_feature

<222>(1)..(8)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(13)..(17)

<223>n是a,c,g,或t

<400>74

nnnnnnnnaa atnnnnn                                                      17

<210>75

<211>17

<212>DNA

<213>未知的

<220>

<223>SBF-1

<400>75

cgtaaaatta aaattga                                                       17

<210>76

<211>23

<212>DNA

<213>普通小麦

<400>76

cttttatttt atacgtaaaa tta                                                23

<210>77

<211>23

<212>DNA

<213>普通小麦

<220>

<221>misc_feature

<222>(1)..(11)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(16)..(23)

<223>n是a,c,g,或t

<400>77

nnnnnnnnnn ntacgnnnnn nnn                            23

<210>78

<211>15

<212>DNA

<213>未知的

<220>

<223>高速泳动族I/Y样蛋白

<400>78

cttttatttt atacg                                     15

<210>79

<211>15

<212>DNA

<213>未知的

<220>

<223>高速泳动族I/Y样蛋白

<220>

<221>misc_feature

<222>(1)..(4)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(9)..(15)

<223>n是a,c,g,或t

<400>79

nnnntattnn nnnnn                                     15

<210>80

<211>11

<212>DNA

<213>未知的

<220>

<223>结瘤蛋白共有序列1

<400>80

taaaagatca t                                              11

<210>81

<211>11

<212>DNA

<213>未知的

<220>

<223>同源异型域蛋白WUSCHEL

<400>81

ctccttaatc g                                              11

<210>82

<211>11

<212>DNA

<213>未知的

<220>

<223>同源异型域蛋白WUSCHEL

<220>

<221>misc_feature

<222>(1)..(5)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(10)..(11)

<223>n是a,c,g,或t

<400>82

nnnnntaatn n                                              11

<210>83

<211>17

<212>DNA

<213>未知的

<220>

<223>具有三股螺旋DNA结合结构域的GT1盒结合因子

<400>83

catgtggtca ttttacg                                             17

<210>84

<211>17

<212>DNA

<213>未知的

<220>

<223>具有三股螺旋DNA结合结构域的GT1盒结合因子

<220>

<221>misc_feature

<222>(1)..(6)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(11)..(17)

<223>n是a,c,g,或t

<400>84

nnnnnngtca nnnnnnn                                             17

<210>85

<211>13

<212>DNA

<213>拟南芥

<400>85

attggcccat cat                                                 13

<210>86

<211>13

<212>DNA

<213>拟南芥

<220>

<221>misc_feature

<222>(1)..(4)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(9)..(13)

<223>n是a,c,g,或t

<400>86

nnnngcccnn nnn                                           13

<210>87

<211>15

<212>DNA

<213>未知的

<220>

<223>C重复序列/脱水应答元件

<400>87

atggaccgac tacta                                         15

<210>88

<211>15

<212>DNA

<213>未知的

<220>

<223>C重复序列/脱水应答元件

<220>

<221>misc_feature

<222>(1)..(5)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(10)..(15)

<223>n是a,c,g,或t

<400>88

nnnnnccgan nnnnn                                         15

<2t0>89

<211>21

<212>DNA

<213>拟南芥

<400>89

acttactatt attagtagtc g                            21

<210>90

<211>21

<212>DNA

<213>拟南芥

<220>

<221>misc_feature

<222>(1)..(3)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(8)..(21)

<223>n是a,c,g,或t

<400>90

nnntactnnn nnnnnnnnnn n                            21

<210>91

<211>21

<212>DNA

<213>拟南芥

<400>91

gactactaat aatagtaagt t                            21

<210>92

<211>11

<212>DNA

<213>向日葵

<400>92

actattatta g                                       11

<210>93

<211>13

<212>DNA

<213>番薯(Ipomoea batatas)

<400>93

cttactatta tta                                 13

<210>94

<211>13

<212>DNA

<213>番薯

<220>

<221>misc_feature

<222>(1)..(2)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(7)..(13)

<223>n是a,c,g,或t

<400>94

nntactnnnn nnn                                 13

<210>95

<211>17

<212>DNA

<213>未知的

<220>

<223>三股螺旋DNA结合因子GT-3a

<400>95

tagtaagtta catttta                             17

<210>96

<211>17

<212>DNA

<213>未知的

<220>

<223>三股螺旋DNA结合因子GT-3a

<220>

<221>misc_feature

<222>(1)..(6)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(11)..(17)

<223>n是a,c,g,或t

<400>96

nnnnnngtta nnnnnnn                      17

<210>97

<211>9

<212>DNA

<213>未知的

<220>

<223>TEIL

<400>97

atgtaactt                                9

<210>98

<211>9

<212>DNA

<213>未知的

<220>

<223>TEIL

<220>

<221>misc_feature

<222>(1)..(1)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(6)..(9)

<223>n是a,c,g,或t

<400>98

ntgtannnn                                9

<210>99

<211>17

<212>DNA

<213>菠菜

<400>99

taggatggaa taaatat                      17

<210>100

<211>15

<212>DNA

<213>未知的

<220>

<223>C重复序列/脱水应答元件

<220>

<221>mi sc feature

<223>n是a,c,g,或t

<400>100

tcataccgac atcag                               15

<210>101

<211>17

<212>DNA

<213>未知的

<220>

<223>PBF

<400>101

ttgaaagaaa agggaaa                             17

<210>102

<211>17

<212>DNA

<213>未知的

<220>

<223>PBF

<220>

<221>misc_feature

<222>(1)..(8)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(13)..(17)

<223>n是a,c,g,或t

<400>102

nnnnnnnnaa agnnnnn                             17

<210>103

<211>21

<212>DNA

<213>未知的

<220>

<223>TEF顺式作用元件

<400>103

aaaagggaaa aaaagaaaaa a                        21

<210>104

<211>21

<212>DNA

<213>未知的

<220>

<223>TEF顺式作用元件

<220>

<221>misc_feature

<222>(1)..(2)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(7)..(21)

<223>n是a,c,g,或t

<400>104

nnaaggnnnn nnnnnnnnnn n                        21

<210>105

<211>11

<212>DNA

<213>未知的

<220>

<223>结瘤蛋白共有序列1

<400>105

taaaagatat a                                   11

<210>106

<211>15

<212>DNA

<213>未知的

<220>

<223>C重复序列/脱水应答元件s

<400>106

tactaccgac atgag                         15

<210>107

<211>17

<212>DNA

<213>未知的

<220>

<223>Dof3单锌指转录因子

<400>107

agttccaaaa agcaaaa                       17

<210>108

<211>17

<212>DNA

<213>未知的

<220>

<223>Dof3单锌指转录因子

<220>

<221>misc_feature

<222>(1)..(8)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(13)..(17)

<223>n是a,c,g,或t

<400>108

nnnnnnnnaa agnnnnn                       17

<210>109

<211>11

<212>DNA

<213>未知的

<220>

<223>结瘤蛋白共有序列1

<400>109

aaaaagatca a                           11

<210>110

<211>15

<212>DNA

<213>未知的

<220>

<223>C重复序列/脱水应答元件

<400>110

tcaagccgac acaga                       15

<210>111

<211>19

<212>DNA

<213>未知的

<220>

<223>耦合元件3(CE3)

<400>111

tctctacgcg tgtctgtgt                   19

<210>112

<211>19

<212>DNA

<213>未知的

<220>

<223>耦合元件3(CE3)

<220>

<221>misc_feature

<222>(1)..(6)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(11)..(19)

<223>n是a,c,g,或t

<400>112

nnnnnnc gc g nnnnnnnnn                 19

<210>113

<211>11

<212>DNA

<213>拟南芥

<400>113

ctacgcgtgt c                           11

<210>114

<211>11

<212>DNA

<213>拟南芥

<220>

<221>misc_feature

<222>(1)..(3)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(8)..(11)

<223>n是a,c,g,或t

<400>114

nnncgcgnnn n                           11

<210>115

<211>11

<212>DNA

<213>拟南芥

<400>115

acacgcgtag a                           11

<210>116

<211>21

<212>DNA

<213>拟南芥

<400>116

gtggtgtgac gtcaaagtca t                                         21

<210>117

<211>21

<212>DNA

<213>拟南芥

<220>

<221>misc_feature

<222>(1)..(6)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(11)..(21)

<223>n是a,c,g,或t

<400>117

nnnnnntgac nnnnnnnnnn n                                         21

<210>118

<211>21

<212>DNA

<213>拟南芥

<400>118

tgactttgac gtcacaccac g                                         21

<210>119

<211>17

<212>DNA

<213>未知的

<220>

<223>与病原体防御相关的WRKY植物特异性锌指型因子

<400>119

tgactttgac gtcacac                                              17

<210>120

<211>17

<212>DNA

<213>稻

<400>120

actttgacgt cacacca                        17

<210>121

<211>17

<212>DNA

<213>稻

<220>

<221>misc_feature

<222>(1)..(6)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(11)..(17)

<223>n是a,c,g,或t

<400>121

nnnnnnacgt nnnnnnn                        17

<210>122

<211>15

<212>DNA

<213>紫苜蓿(Medicago sativa)

<400>122

ttttcgtggt gtgac                          15

<210>123

<211>15

<212>DNA

<213>未知的

<220>

<223>锌指蛋白核心基序

<220>

<221>misc_feature

<222>(1)..(5)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(10)..(15)

<223>n是a,c,g,或t

<400>123

nnnnngtggn nnnnn                                 15

<210>124

<211>21

<212>DNA

<213>未知的

<220>

<223>bZIP蛋白G盒结合因子1

<400>124

cgcttcatac gtgtcccttt a                          21

<210>125

<211>21

<212>DNA

<213>未知的

<220>

<223>bZIP蛋白G盒结合因子1

<220>

<221>misc_feature

<222>(1)..(8)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(13)..(21)

<223>n是a,c,g,或t

<400>125

nnnnnnnnac gtnnnnnnnn n                         21

<210>126

<211>17

<212>DNA

<213>未知的

<220>

<223>ABA应答元件

<400>126

gcttcatacg tgtccct                           17

<210>127

<211>17

<212>DNA

<213>未知的

<220>

<223>ABA应答元件

<220>

<221>misc_feature

<222>(1)..(7)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(12)..(17)

<223>n是a,c,g,或t

<400>127

nnnnnnnacg tnnnnnn                            17

<210>128

<211>21

<212>DNA

<213>未知的

<220>

<223>OCS样元件

<400>128

agagataaag ggacacgtat g                       21

<210>129

<211>21

<212>DNA

<213>未知的

<220>

<223>OCS样元件

<220>

<221>misc_feature

<222>(1)..(14)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(19)..(21)

<223>n是a,c,g,或t

<400>129

nnnnnnnnnn nnnnac gt nn n                           21

<210>130

<211>25

<212>DNA

<213>未知的

<220>

<223>(GA)n/(CT)n结合蛋白

<400>130

actgagagag ataaagggac acgta                         25

<210>131

<211>25

<212>DNA

<213>未知的

<220>

<223>(GA)n/(CT)n结合蛋白

<220>

<221>misc_feature

<222>(1)..(6)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(11)..(25)

<223>n是a,c,g,或t

<400>131

nnnnnnagag nnnnnnnnnn nnnnn                         25

<210>132

<211>17

<212>DNA

<213>未知的

<220>

<223>I类GATA因子

<400>132

agagagataa agggaca                             17

<210>133

<211>25

<212>DNA

<213>未知的

<220>

<223>(GA)n/(CT)n结合蛋白

<400>133

atagagagac tgagagagat aaagg                    25

<210>134

<211>25

<212>DNA

<213>未知的

<220>

<223>(GA)n/(CT)n结合蛋白

<400>134

ttatagagag actgagagag ataaa                    25

<210>135

<211>25

<212>DNA

<213>未知的

<220>

<223>(GA)n/(CT)n结合蛋白

<400>135

gtttatagag agactgagag agata                    25

<210>136

<211>15

<212>DNA

<213>未知的

<220>

<223>植物TATA盒

<400>136

tctctataaa cttag                           15

<210>137

<211>15

<212>DNA

<213>未知的

<220>

<223>植物tata盒

<220>

<221>misc_feature

<222>(1)..(4)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(9)..(15)

<223>n是a,c,g,或t

<400>137

nnnntatann nnnnn                           15

<210>138

<211>25

<212>DNA

<213>人工的

<220>

<223>GAGA/GAGABP.01基序2的核心基序

<220>

<221>misc_feature

<222>(1)..(6)

<223>n是a,c,g,或t

<220>

<221>misc_feature

<222>(11)..(25)

<223>n是a,c,g,或t

<400>138

nnnnnnagac nnnnnnnnnn nnnnn               25

<210>139

<211>1800

<212>DNA

<213>拟南芥

<400>139

atggagtcac agttgacacg tccttatggt catgagcaag cagaagaacc aatcagaatt     60

caccatccag aagaagagca tcatgagaag ggagcatcca aagtgttgaa gaaagtaaaa    120

gaaaaggcta agaaaatcaa gaacagtctc actaaacatg gaaatggtca tgatcacgat    180

gtggaagatg atgatgatga gtatgacgag caagacccag aagttcacgg cgcaccagtg    240

tatgaatcct ctgccgtgag aggtggtgta acgggtaaac ctaagtctct tagtcatgcc    300

ggagaaacta atgttccggc atcggaggag attgttcctc cagggacaaa agtttttcct    360

gtcgtgtctt ctgaccacac caaacccatt gagcctgtat cattacaaga tacctcttac    420

ggacatgagg cactggctga tcctgtaaga acgacggaaa catcggactg ggaagcgaaa    480

agagaggcac cgactcatta tcctctcgga gtgtcagaat tttcagacag aggagagagc    540

agagaggctc atcaagagcc attgaacact cctgtgtctc tgctttcagc aacagaggac    600

gtgactagga cgtttgctcc tggtggtgaa gatgactatc tcggtggtca acggaaagtc    660

aacgtcgaga cgccaaaacg tttggaggaa gatccggctg ctccaggagg aggatcggat    720

tatctcagtg gtgtatctaa ttatcagtcc aaagttactg atcccacgca taaaggtgga    780

gaagctggag taccagagat tgctgagtct cttggtagaa tgaaagtgac tgatgagtct    840

cctgatcaga aatcaagaca aggacgcgaa gaagactttc cgacgagaag ccatgagttt    900

gatctgaaga aggaatctga tatcaacaag aattctccgg caagatttgg aggggaatca    960

aaagctggga tggaggaaga ttttccgaca agaggtgatg tgaaagtaga gagtggattg   1020

ggaagagact taccgacggg aactcatgat cagttctcac cagaactatc tcgtcccaaa   1080

gagagagatg attctgagga aaccaaagat gagtcgacac atgagacaaa accaagcacc   1140

tacacagagc agttagcttc agctacatca gccataacta acaaagctat agccgcaaag   1200

aacgtcgttg cctcaaagct aggttacacc ggagagaatg gcggcgggca aagcgagagc   1260

cctgtaaaag atgaaactcc gagatctgtt actgcttacg ggcagaaagt ggcgggaact   1320

gttgctgaga agttgactcc ggtttacgaa aaagtcaaag aaacaggatc aacggtgatg  1380

acaaagctac ctctctccgg aggtggaagt ggagtgaagg agacgcaaca aggggaagag  1440

aaaggtgtga cggctaaaaa ttatatatca gagaagctga aacctggaga agaggacaaa  1500

gctttatcgg aaatgatagc tgagaaactt cattttggag gaggaggaga gaagaagaca  1560

acggctacaa aggaggtgga agtgacggtt gagaagatac cttccgacca gatagcggag  1620

gggaaaggac atggtgaggc ggttgcagag gaaggaaaag gtggagaagg aatggtgggg  1680

aaagttaaag gagcggtcac ttcttggctc ggtggtaaac cgaagtcgcc acggtccgtt  1740

gaagagtctc cacaatcact tggcaccacc gttgggacta tggggttttc ggattccggt  1800

<210>140

<211>618

<212>PRT

<213>拟南芥

<400>140

Met Glu Ser Gln Leu Thr Arg Pro Tyr Gly His Glu Gln Ala Glu Glu

1               5                   10                  15

Pro Ile Arg Ile His His Pro Glu Glu Glu His His Glu Lys Gly Ala

            20                  25                  30

Ser Lys Val Leu Lys Lys Val Lys Glu Lys Ala Lys Lys Ile Lys Asn

        35                  40                  45

Ser Leu Thr Lys His Gly Asn Gly His Asp His Asp Val Glu Asp Asp

    50                  55                  60

Asp Asp Glu Tyr Asp Glu Gln Asp Pro Glu Val His Gly Ala Pro Val

65                  70                  75                  80

Tyr Glu Ser Ser Ala Val Arg Gly Gly Val Thr Gly Lys Pro Lys Ser

                85                  90                  95

Leu Ser His Ala Gly Glu Thr Asn Val Pro Ala Ser Glu Glu Ile Val

            100                 105                 110

Pro Pro Gly Thr Lys Val Phe Pro Val Val Ser Ser Asp His Thr Lys

         115                120                 125

Pro Ile Glu Pro Val Ser Leu Gln Asp Thr Ser Tyr Gly His Glu Ala

    130                 135                 140

Leu Ala Asp Pro Val Arg Thr Thr Glu Thr Ser Asp Trp Glu Ala Lys

145                 150                 155                 160

Arg Glu Ala Pro Thr His Tyr Pro Leu Gly Val Ser Glu Phe Ser Asp

                165                 170                 175

Arg Gly Glu Ser Arg Glu Ala His Gln Glu Pro Leu Asn Thr Pro Val

            180                 185                 190

Ser Leu Leu Ser Ala Thr Glu Asp Val Thr Arg Thr Phe Ala Pro Gly

        195                 200                 205

Gly Glu Asp Asp Tyr Leu Gly Gly Gln Arg Lys Val Asn Val Glu Thr

    210                 215                 220

Pro Lys Arg Leu Glu Glu Asp Pro Ala Ala Pro Gly Gly Gly Ser Asp

225                 230                 235                 240

Tyr Leu Ser Gly Val Ser Asn Tyr Gln Ser Lys Val Thr Asp Pro Thr

                245                 250                 255

His Lys Gly Gly Glu Ala Gly Val Pro Glu Ile Ala Glu Ser Leu Gly

            260                 265                 270

Arg Met Lys Val Thr Asp Glu Ser Pro Asp Gln Lys Ser Arg Gln Gly

        275                 280                 285

Arg Glu Glu Asp Phe Pro Thr Arg Ser His Glu Phe Asp Leu Lys Lys

    290                 295                 300

Glu Ser Asp Ile Asn Lys Asn Ser Pro Ala Arg Phe Gly Gly Glu Ser

305                 310                 315                 320

Lys Ala Gly Met Glu Glu Asp Phe Pro Thr Arg Gly Asp Val Lys Val

                325                 330                 335

Glu Ser Gly Leu Gly Arg Asp Leu Pro Thr Gly Thr His Asp Gln Phe

            340                 345                 350

Ser Pro Glu Leu Ser Arg Pro Lys Glu Arg Asp Asp Ser Glu Glu Thr

        355                 360                 365

Lys Asp Glu Ser Thr His Glu Thr Lys Pro Ser Thr Tyr Thr Glu Gln

    370                 375                 380

Leu Ala Ser Ala Thr Ser Ala Ile Thr Asn Lys Ala Ile Ala Ala Lys

385                 390                 395                 400

Asn Val Val Ala Ser Lys Leu Gly Tyr Thr Gly Glu Asn Gly Gly Gly

                405                 410                 415

Gln Ser Glu Ser Pro Val Lys Asp Glu Thr Pro Arg Ser Val Thr Ala

            420                 425                 430

Tyr Gly Gln Lys Val Ala Gly Thr Val Ala Glu Lys Leu Thr Pro Val

        435                 440                 445

Tyr Glu Lys Val Lys Glu Thr Gly Ser Thr Val Met Thr Lys Leu Pro

    450                 455                 460

Leu Ser Gly Gly Gly Ser Gly Val Lys Glu Thr Gln Gln Gly Glu Glu

465                 470                 475                 480

Lys Gly Val Thr Ala Lys Asn Tyr Ile Ser Glu Lys Leu Lys Pro Gly

                485                 490                 495

Glu Glu Asp Lys Ala Leu Ser Glu Met Ile Ala Glu Lys Leu His Phe

            500                 505                 510

Gly Gly Gly Gly Glu Lys Lys Thr Thr Ala Thr Lys Glu Val Glu Val

        515                 520                 525

Thr Val Glu Lys Ile Pro Ser Asp Gln Ile Ala Glu Gly Lys Gly Hi s

    530                 535                 540

Gly Glu Ala Val Ala Glu Glu Gly Lys Gly Gly Glu Gly Met Val Gly

545                 550                 555                 560

Lys Val Lys Gly Ala Val Thr Ser Trp Leu Gly Gly Lys Pro Lys Ser

                565                 570                 575

Pro Arg Ser Val Glu Glu Ser Pro Gln Ser Leu Gly Thr Thr Val Gly

            580                 585                 590

Thr Met Gly Phe Ser Asp Ser Gly Gly Ser Glu Leu Gly Gly Ser Gly

        595                 600                 605

Gly Gly Lys Gly Val Gln Asp Ser Gly Asn

    610                 615

<210>141

<211>844

<212>DNA

<213>拟南芥

<400>141

cgcgccgcaa gaatctcaaa cacggagatc tcaaagtttg aaagaaaatt tatttcttcg     60

actcaaaaca aacttacgaa atttaggtag aacttatata cattatattg taattttttg    120

taacaaaatg tttttattat tattatagaa ttttactggt taaattaaaa atgaatagaa    180

aaggtgaatt aagaggagag aggaggtaaa cattttcttc tattttttca tattttcagg    240

ataaattatt gtaaaagttt acaagatttc catttgacta gtgtaaatga ggaatattct    300

ctagtaagat cattatttca tctacttctt ttatcttcta ccagtagagg aataaacaat    360

atttagctcc tttgtaaata caaattaatt ttcgttcttg acatcattca attttaattt    420

tacgtataaa ataaaagatc atacctatta gaacgattaa ggagaaatac aattcgaatg    480

agaaggatgt gccgcttgtt ataataaaca gccacacgac gtaaacgtaa aatgaccaca    540

tgatgggcca atagacatgg accgactact aataatagta agttacattt taggatggaa    600

taaatatcat accgacatca gtttgaaaga aaagggaaaa aaagaaaaaa taaataaaag    660

atatactacc gacatgagtt ccaaaaagca aaaaaaaaga tcaagccgac acagacacgc    720

gtagagagca aaatgacttt gacgtcacac cacgaaaaca gacgcttcat acgtgtccct    780

ttatctctct cagtctctct ataaacttag tgagaccctc ctctgtttta ctcacaaatt    840

taat                                                                 844

<210>142

<211>710

<212>PRT

<213>拟南芥

<400>142

Met Asp Gln Thr Glu Glu Pro Pro Leu Asn Thr His Gln Gln His Pro

1               5                   10                  15

Glu Glu Val Glu His His Glu Asn Gly Ala Thr Lys Met Phe Arg Lys

            20                  25                  30

Val Lys Ala Arg Ala Lys Lys Phe Lys Asn Ser Leu Thr Lys His Gly

        35                  40                  45

Gln Ser Asn Glu His Glu Gln Asp His Asp Leu Val Glu Glu Asp Asp

    50                  55                  60

Asp Asp Asp Glu Leu Glu Pro Glu Val Ile Asp Ala Pro Gly Val Thr

65                  70                  75                  80

Gly Lys Pro Arg Glu Thr Asn Val Pro Ala Ser Glu Glu Ile Ile Pro

                85                  90                  95

Pro Gly Thr Lys Val Phe Pro Val Val Ser Ser Asp Tyr Thr Lys Pro

            100                 105                110

Thr Glu Ser Val Pro Val Gln Glu Ala Ser Tyr Gly His Asp Ala Pro

        115                 120                 125

Ala His Ser Val Arg Thr Thr Phe Thr Ser Asp Lys Glu Glu Lys Arg

    130                 135                 140

Asp Val Pro Ile His His Pro Leu Ser Glu Leu Ser Asp Arg Glu Glu

145                 150                 155                 160

Ser Arg Glu Thr His His Glu Ser Leu Asn Thr Pro Val Ser Leu Leu

                165                 170                 175

Ser Gly Thr Glu Asp Val Thr Ser Thr Phe Ala Pro Ser Gly Asp Asp

            180                 185                 190

Glu Tyr Leu Asp Gly Gln Arg Lys Val Asn Val Glu Thr Pro Ile Thr

        195                 200                 205

Leu Glu Glu Glu Ser Ala Val Ser Asp Tyr Leu Ser Gly Val Ser Asn

    210                 215                 220

Tyr Gln Ser Lys Val Thr Asp Pro Thr Lys Glu Glu Thr Gly Gly Val

225                 230                 235                 240

Pro Glu Ile Ala Glu Ser Phe Gly Asn Met Glu Val Thr Asp Glu Ser

                245                 250                 255

Pro Asp Gln Lys Pro Gly Gln Phe Glu Arg Asp Leu Ser Thr Arg Ser

            260                 265                 270

Lys Glu Phe Lys Glu Phe Asp Gln Asp Phe Asp Ser Val Leu Gly Lys

        275                 280                 285

Asp Ser Pro Ala Lys Phe Pro Gly Glu Ser Gly Val Val Phe Pro Val

    290                 295                 300

Gly Phe Gly Asp Glu Ser Gly Ala Glu Leu Glu Lys Asp Phe Pro Thr

305                 310                 315                 320

Arg Ser His Asp Phe Asp Met Lys Thr Glu Thr Gly Met Asp Thr Asn

                325                 330                 335

Ser Pro Ser Arg Ser His Glu Phe Asp Leu Lys Thr Glu Ser Gly Asn

           340                 345                 350

Asp Lys Asn Ser Pro Met Gly Phe Gly Ser Glu Ser Gly Ala Glu Leu

        355                 360                 365

Glu Lys Glu Phe Asp Gln Lys Asn Asp Ser Gly Arg Asn Glu Tyr Ser

    370                 375                 380

Pro Glu Ser Asp Gly Gly Leu Gly Ala Pro Leu Gly Gly Asn Phe Pro

385                 390                 395                 400

Val Arg Ser His Glu Leu Asp Leu Lys Asn Glu Ser Asp Ile Asp Lys

                405                 410                 415

Asp Val Pro Thr Gly Phe Asp Gly Glu Pro Asp Phe Leu Ala Lys Gly

            420                 425                 430

Arg Pro Gly Tyr Gly Glu Ala Ser Glu Glu Asp Lys Phe Pro Ala Arg

        435                 440                 445

Ser Asp Asp Val Glu Val Glu Thr Glu Leu Gly Arg Asp Pro Lys Thr

    450                 455                 460

Glu Thr Leu Asp Gln Phe Ser Pro Glu Leu Ser His Pro Lys Glu Arg

465                 470                 475                 480

Asp Glu Phe Lys Glu Ser Arg Asp Asp Phe Glu Glu Thr Arg Asp Glu

                485                 490                 495

Lys Thr Glu Glu Pro Lys Gln Ser Thr Tyr Thr Glu Lys Phe Ala Ser

            500                 505                 510

Met Leu Gly Tyr Ser Gly Glu Ile Pro Val Gly Asp Gln Thr Gln Val

        515                 520                 525

Ala Gly Thr Val Asp Glu Lys Leu Thr Pro Val Asn Glu Lys Asp Gln

    530                 535                 540

Glu Thr Glu Ser Ala Val Thr Thr Lys Leu Pro Ile Ser Gly Gly Gly

545                 550                 555                 560

Ser Gly Val Glu Glu Gln Arg Gly Glu Asp Lys Ser Val Ser Gly Arg

                565                 570                 575

Asp Tyr Val Ala Glu Lys Leu Thr Thr Glu Glu Glu Asp Lys Ala Phe

            580                 585                 590

Ser Asp Met Val Ala Glu Lys Leu Gln Ile Gly Gly Glu Glu Glu Lys

        595                 600                 605

Lys Glu Thr Thr Thr Lys Glu Val Glu Lys Ile Ser Thr Glu Lys Ala

    610                 615                 620

Ala Ser Glu Glu Gly Glu Ala Val Glu Glu Glu Val Lys Gly Gly Gly

625                 630                 635                 640

Gly Met Val Gly Arg Ile Lys Gly Trp Phe Gly Gly Gly Ala Thr Asp

                645                 650                 655

Glu Val Lys Pro Glu Ser Pro His Ser Val Glu Glu Ala Pro Lys Ser

            660                 665                 670

Ser Gly Trp Phe Gly Gly Gly Ala Thr Glu Glu Val Lys Pro Lys Ser

        675                 680                 685

Pro His Ser Val Glu Glu Ser Pro Gln Ser Leu Gly Ser Thr Val Val

    690                 695                 700

Pro Val Gln Lys Glu Leu

705                 710

<210>143

<211>3533

<212>DNA

<213>拟南芥

<400>143

gatctcaaag tttgaaagaa aatttatttc ttcgactcaa aacaaactta cgaaatttag     60

gtagaactta tatacattat attgtaattt tttgtaacaa aatgttttta ttattattat    120

agaattttac tggttaaatt aaaaatgaat agaaaaggtg aattaagagg agagaggagg    180

taaacatttt cttctatttt ttcatatttt caggataaat tattgtaaaa gtttacaaga    240

tttccatttg actagtgtaa atgaggaata ttctctagta agatcattat ttcatctact    300

tcttttatct tctaccagta gaggaataaa caatatttag ctcctttgta aatacaaatt    360

aattttcgtt cttgacatca ttcaatttta attttcgtat aaaataaaag atcataccta    420

ttagaacgat taaggagaaa tacaattcga atgagaagga tgtgccgttt gttataataa    480

acagccacac gacgtaaacg taaaatgacc acatgatggg ccaatagaca tggaccgact    540

actaataata gtaagttaca ttttaggatg gaataaatat cataccgaca tcagtttgaa    600

aagaaaaagg gaaaaaaaga aaaaataaat aaaagatata ctaccgacat gagttccaaa    660

aagcaaaaaa aaagatcaag ccgacacaga cacgcgtaga gagcaaaatg actttgacgt    720

cacaccacga aaacagacgc ttcatacgtg tccctttatc tctctcagtc tctctataaa    780

cttagtgaga ccctcctctg ttttactcac aaatatgcaa actagaaaac aatcatcagg    840

aataaagggt ttgattactt ctattggaaa gaaaaaaact ttggaaaatg gatcaaacag    900

aggaaccacc actcaacaca caccagcagc acccaggtag attctaattt cagaaactta    960

tatttttttt aagtgacaat cctctgaatt tacttaaact tattgtgatt tatggataca   1020

gaagaagttg aacatcatga gaatggtgcg actaagatgt ttaggaaagt aaaggctaga   1080

gctaagaagt tcaagaacag tctcactaaa catggacaaa gcaatgagca tgagcaagat   1140

catgatttgg ttgaagaaga tgatgatgat gacgagctag aacctgaagt gatcgatgca   1200

ccaggttact ttcttttgta gtttcattca acttatgatc taaaaactat tggttattca    1260

attttgcgtg acattaacgg tttggtatct gtatatgcag cgtaacaggt aaacctagag    1320

aaactaatgt tccagcatcg gaggaaatta ttccaccagg gacaaaggtg tttcctgtcg    1380

tgtcttccga ttacaccaaa cccactgaat ctgtaccagt acaagaggcc tcttacggac    1440

acgatgcacc ggctcattct gtaaggacga cgtttacatc ggacaaggaa gagaaaagag    1500

atgtaccgat tcatcatcct ctgtccgaat tgtcagacag agaagagagt agagagactc    1560

atcatgagtc attgaacact ccggtctctc tgctttctgg aacagaggat gtaacgagta    1620

cgtttgctcc aagtggtgat gatgaatatc ttgatggtca acggaaggtc aacgtcgaga    1680

ccccgataac gttggaggaa gagtcggctg tttcagacta tcttagtggt gtatctaatt    1740

atcagtccaa agttactgat cccaccaaag aaggtaagaa ctttgacctt ttaagattgt    1800

gtttttcttt agtgattatg aatatgtaat aactctgtta cgttgtgttt ggtttagaaa    1860

ctggaggagt accggagatt gctgagtctt ttggtaatat ggaagtgact gatgagtctc    1920

ctgatcagaa gccaggacaa tttgaaagag acttgtcgac gagaagcaaa gaattcaaag    1980

agtttgatca ggactttgac tctgttctcg gtaaggattc gccggcgaaa tttccaggtg    2040

aatcaggagt tgttttcccg gtgggctttg gtgacgagtc aggagctgag ctggaaaaag    2100

attttccgac gagaagtcat gattttgata tgaagactga aactggaatg gacacgaatt    2160

ctccatcaag aagccatgaa tttgatctga agactgaatc tggaaacgac aagaattctc    2220

cgatgggctt tggtagtgaa tcaggagctg agctggaaaa agaatttgat cagaagaacg    2280

attctggaag aaacgagtat tcgccggaat ctgacggcgg tttaggagct ccgttgggag    2340

gaaattttcc ggtgagaagt catgagttgg atctgaagaa cgaatctgat atcgacaagg    2400

atgtgccgac gggatttgac ggagaaccag attttctggc gaagggaaga cctggatacg    2460

gtgaggcatc agaagaggat aaatttccgg cgagaagtga tgatgtggaa gtagagactg    2520

agctgggaag agacccaaag acggagactc ttgatcaatt ctcaccggaa ctttctcatc    2580

ctaaagaaag agatgagttt aaggagtcca gagatgattt tgaggagacg agagatgaga    2640

aaacagagga gccaaaacag agcacttaca cagagaagtt tgcttcaatg ctaggttact    2700

ccggagaaat tccggtggga gatcaaactc aagtggcggg aactgttgat gagaggttga    2760

ctccggtcaa tgagaaggat caagaaacag agtctgccgt gacgacgaag ttacctatct    2820

ccggaggtgg aagtggagta gaggagcaac gaggggaaga taaaagtgtg tcgggtagag    2880

attatgtggc ggagaaactg acaactgaag aagaagacaa agccttttct gatatggttg    2940

ccgagaaact tcagattgga ggagaagaag agaagaagga aacgacgaca aaggaagtgg    3000

agaagatctc taccgagaag gcagcatcgg aggagggtga ggcggtggaa gaggaagtga    3060

aaggaggagg aggaatggtt gggaggatta aaggatggtt cggtggtggt gcgactgatg    3120

aggtgaagcc agaatcgcca cattctgttg aagaggctcc aaaatcatct ggctggtttg    3180

gtggtggtgc gacggaggag gtgaagccaa aatcgcctca ttccgttgaa gagtctccac    3240

aatcacttgg ctccactgtt gttccggtgc agaaggagct ttaagaatat gagaactgag    3300

attttcaagt ttcactttgg atgtttatgt gtgttttgtt tgacgtcttt gatgtattat    3360

ggtataattc cttgtttgtg tgaaaaaagg acatttggtt aataaattgt tcggctttgg    3420

attaagaagt tcctccatac cagctactag gtctaaagtg ggtaaaatca ttggatttat    3480

tcccttcaaa gttcttagaa ttattcacag gatttacatt atgagctagt agt           3533

<210>144

<211>249

<212>DNA

<213>稻

<400>144

atgtcgtgct gcggaggaaa ctgcggctgc ggatccggct gccagtgcgg cagcggctgc     60

ggaggatgca agatgtaccc ggagatggct gaggaggtga ccactaccca gactgtcatc    120

atgggtgttg caccttccaa gggtcatgcc gaggggttgg aggccggcgc cgccgccgga    180

gcaggagcag agaacgggtg caagtgcggc gacaactgca cctgcaaccc ctgcaactgc    240

ggcaagtga                                                            249

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号