首页> 中国专利> 具有新Rht-B1等位基因的小麦

具有新Rht-B1等位基因的小麦

摘要

本发明提供了小麦植物,其包含编码Rht-B1(DELLA)多肽的Rht-B1等位基因。对来自包含Rht-B1矮化等位基因的近等基因小麦品系的谷粒进行叠氮化钠诱变。选择与矮化亲本相比表现出更高的早期叶伸长速率或成熟植株高度的植物并对Rht-B1基因进行测序。这样鉴定出35个突变的Rht-B1c等位基因。利用类似的方法鉴定大麦中slnld矮化等位基因的突变等位基因,其中DELLA由sln1基因编码。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-06-05

    授权

    授权

  • 2015-09-09

    实质审查的生效 IPC(主分类):A01H5/00 申请日:20130822

    实质审查的生效

  • 2015-08-12

    公开

    公开

说明书

技术领域

本发明涉及包含改变的Rht-B1c等位基因的小麦的过度生长突变体。 本发明还涉及来自此类植物的谷粒和由所述谷粒衍生的产品。

背景技术

植物部分地或全部地通过调节生长速率来对发育、生理和环境信号做 出响应。已对很多机制进行了描述,包括改变植物激素赤霉素(GA)类 的含量(由Yamaguchi综述,2008)或与GA相关的信号传导组分,例如 蛋白质GID1和DELLA(由Sun综述,2010)。这些导致GA信号传导的 动态调节,使得生长与来自其他激素调节途径的信号传导和环境因素(例 如光、温度和水利用率)相协调(Hartweck,2008;Achard和Genschik, 2009;Kuppusamy等,2009)。已提议通过昼夜节律钟门控GA信号传导来 解释生长速率的昼夜差异(Arana等,2011)。

已对植物中的多种赤霉素(GA)突变体(自然发生或在诱变后被鉴 定)进行了表征。这些突变体包括通常由GA含量或GA信号传导的改变 导致的不同的矮化和伸长(“细长”)表型。鉴定相关的基因并对其编码的 蛋白质进行分析有助于形成对通过GA调节生长的理解,特别是在模型物 种水稻和拟南芥(Arabidopsis)中。生物活性GA与GA受体蛋白结合 (“GID1”,Ueguchi-Tanaka等,2005;Murase等,2008;Shimada等,2008) 并形成随后被DELLA蛋白结合的复合物,DELLA蛋白被鉴定为发挥生 长抑制因子作用的GRAS转录因子家族的一个亚族(Griffiths等,2006; Willige等,2007;Hirano等,2010)。在一种情况下,证据表明DELLA 与PIF转录因子结合阻止它们对增强生长所需基因之表达的促进(de  Lucas等,2008;Feng等,2008)。

大麦和水稻的Della突变体受到特别关注,因为它们包括两种显著不 同的表型:高度伸长的“细长”型和“GA不敏感的”矮化型。前者性状 是隐形的并且特征为极度GA响应,而后者则是显性的或半显性的。编码 DELLA之Slender1基因中的不同单核苷酸替换导致这些根本不同的表型 (“伸长细长”或“矮化细长”,Ikeda等,2001;Chandler等,2002;Asano 等,2009)。前者涉及消除DELLA抑制生长之能力的突变,而后者是由于 无法与GA-GID1复合物结合导致的DELLA累积。

普通小麦是六倍体,DELLA由分别位于小麦A、B和D基因组的染 色体4AL、4BS和4DS上的三个同源基因(Rht-A1、Rht-B1、Rht-D1) 编码,其中“L”表示染色体的长臂而“S”表示染色体的短臂。这使对 小麦突变体的研究变得更加困难,并且因此,与水稻和大麦相比,对小麦 了解得更少。已对B和D基因组的“GA不敏感”半矮化等位基因进行 了描述(Peng等,1999;Pearce等,2011)。极度矮化等位基因的一个实例 为通过插入DNA元件而产生B基因组中的Rht-B1c等位基因。预计该插 入物的大部分将从基因的转录物中被剪接掉,但保留了90个核苷酸并预 计在DELLA中产生30个氨基酸的框内插入物(Pearce等,2011;Wu等, 2011)。

由于半矮化基因对作物产量的有益作用,自绿色革命(Green  Revolution)以来,其在小麦和水稻育种方面一直是重要的。半矮化植物 高度的适度(10%至20%)降低归因于内源性GA的生长促进的缺陷。 在水稻中,这由GA生物合成基因突变造成,使得存在较少活性的GA (Monna等,2002;Sasaki等,2002;Spielmeyer等,2002)。相比之下, 在小麦中,Della基因的矮化突变导致对GA相对“不敏感”的生长(Peng 等,1999)。原始半矮化突变体是自发产生的,并且其农学重要性由其自首 次引进后约50年在当前品种中的持续广泛使用而显而易见。然而,现存 的Rht等位基因具有一些缺点。

因此,仍然需要改良的半矮化小麦品种。

发明内容

在第一方面,本发明提供了一种小麦植物,其包含编码Rht-B1多肽 的Rht-B1等位基因,所述多肽包含N端结构域和C端结构域,其中该C 端结构域的氨基酸序列与SEQ ID NO:5的50-621位氨基酸具有至少98% 的同一性,并且其中所述Rht-B1多肽的氨基酸序列与SEQ ID NO:5所示 序列的不同之处在于至少(i)在SEQ ID NO:5的49和50位氨基酸之间 插入了一个或更多个氨基酸,和(ii)该C端结构域中相对于SEQ ID NO:5 的50-621位氨基酸的一个或更多个氨基酸替换。

在第二方面,本发明提供了一种小麦植物,其包含编码Rht-B1多肽 的Rht-B1等位基因,所述多肽包含N端结构域和C端结构域,其中该C 端结构域的氨基酸序列与SEQ ID NO:5的50-621位氨基酸具有至少98% 的同一性,其中所述Rht-B1多肽的氨基酸序列与SEQ ID NO:5所示序列 的不同之处在于至少在SEQ ID NO:5的49和50位氨基酸之间插入了一 个或更多个氨基酸,并且其中所述Rht-B1等位基因的核苷酸序列与SEQ  ID NO:1所示核苷酸序列的不同之处至少在于存在内含子剪接位点突变。

在第三方面,本发明提供了小麦谷粒,其包含编码Rht-B1多肽的 Rht-B1等位基因,所述多肽包含N端结构域和C端结构域,其中该C端 结构域的氨基酸序列与SEQ ID NO:5的50-621位氨基酸具有至少98%的 同一性,并且其中所述Rht-B1多肽的氨基酸序列与SEQ ID NO:5所示序 列的不同之处在于至少(i)在SEQ ID NO:5的49和50位氨基酸之间插 入了一个或更多个氨基酸,和(ii)该C端结构域中相对于SEQ ID NO:5 的50-621位氨基酸的一个或更多个氨基酸替换。

在第四方面,本发明提供了小麦谷粒,其包含编码Rht-B1多肽的 Rht-B1等位基因,所述多肽包含N端结构域和C端结构域,其中该C端 结构域的氨基酸序列与SEQ ID NO:5的50-621位氨基酸具有至少98%的 同一性,其中所述Rht-B1多肽的氨基酸序列与SEQ ID NO:5所示序列的 不同之处在于至少在SEQ ID NO:5的49和50位氨基酸之间插入了一个 或更多个氨基酸,并且其中所述Rht-B1等位基因的核苷酸序列与SEQ ID  NO:1所示核苷酸序列的不同之处至少在于存在内含子剪接位点突变。

在第五方面,本发明提供了小麦细胞,其包含编码Rht-B1多肽的 Rht-B1等位基因,所述多肽包含N端结构域和C端结构域,其中该C端 结构域的氨基酸序列与SEQ ID NO:5的50-621位氨基酸具有至少98%的 同一性,并且其中所述Rht-B1多肽的氨基酸序列与SEQ ID NO:5所示序 列的不同之处在于至少(i)在SEQ ID NO:5的49和50位氨基酸之间插 入了一个或更多个氨基酸,和(ii)该C端结构域中相对于SEQ ID NO:5 的50-621位氨基酸的一个或更多个氨基酸替换。在一个优选实施方案中, 小麦细胞是小麦胚乳细胞。这样的小麦胚乳细胞不能够再生成小麦植株。

在第六方面,本发明提供了小麦细胞,其包含编码Rht-B1多肽的 Rht-B1等位基因,所述多肽包含N端结构域和C端结构域,其中该C端 结构域的氨基酸序列与SEQ ID NO:5的50-621位氨基酸具有至少98%的 同一性,其中所述Rht-B1多肽的氨基酸序列与SEQ ID NO:5所示序列的 不同之处在于至少在SEQ ID NO:5的49和50位氨基酸之间插入了一个 或更多个氨基酸,并且其中所述Rht-B1等位基因的核苷酸序列与SEQ ID  NO:1所示核苷酸序列的不同之处至少在于存在内含子剪接位点突变。在 一个优选实施方案中,小麦细胞是小麦胚乳细胞。这样的小麦胚乳细胞不 能够再生成小麦植株。

在第七方面,本发明提供了编码Rht-B1多肽的核酸分子,所述多肽 包含N端结构域和C端结构域,其中该C端结构域的氨基酸序列与SEQ  ID NO:5的50-621位氨基酸具有至少98%的同一性,并且其中所述 Rht-B1多肽的氨基酸序列与SEQ ID NO:5所示序列的不同之处在于至少 (i)在SEQ ID NO:5的49和50位氨基酸之间插入了一个或更多个氨基 酸,和(ii)该C端结构域中相对于SEQ ID NO:5的50-621位氨基酸的 一个或更多个氨基酸替换。这样的核酸分子不是天然存在的。这样的核酸 分子可以是分离的或者作为转基因植物中的转基因。

在第八方面,本发明提供了编码Rht-B1多肽的核酸分子,所述多肽 包含N端结构域和C端结构域,其中该C端结构域的氨基酸序列与SEQ  ID NO:5的50-621位氨基酸具有至少98%的同一性,其中所述Rht-B1 多肽的氨基酸序列与SEQ ID NO:5所示序列的不同之处在于至少在SEQ  ID NO:5的49和50位氨基酸之间插入了一个或更多个氨基酸,并且其中 所述Rht-B1等位基因的核苷酸序列与SEQ ID NO:1所示核苷酸序列的不 同之处至少在于存在内含子剪接位点突变。这些核酸分子不是天然存在 的。这些核酸分子可以是分离的或者作为转基因植物中的转基因。

在第九方面,本发明提供了Rht-B1多肽,其包含N端结构域和C端 结构域,其中该C端结构域的氨基酸序列与SEQ ID NO:5的50-621位氨 基酸具有至少98%的同一性,并且其中所述Rht-B1多肽的氨基酸序列与 SEQ ID NO:5所示序列的不同之处在于至少(i)在SEQ ID NO:5的49 和50位氨基酸之间插入了一个或更多个氨基酸,和(ii)该C端结构域 中相对于SEQ ID NO:5的50-621位氨基酸的一个或更多个氨基酸替换。

在第十方面,本发明提供了分离的寡核苷酸,其包含本发明第七或第 八方面的多核苷酸中的至少19个连续核苷酸或者与其完全互补,其中这 19个连续核苷酸包括参照SEQ ID NO:1的选自以下的至少一个核苷酸替 换:G2715A、G2726A、G2747A、G2829A、G2831A、G2849A、C2865T、 C2966T、C2972T、G3065A、C3117T、G3477A、C3507T、C3519T、G3624A、 G2792A、CC2108TA、G3047A、G2864A、G3671A、G148A、G148T、 G147A、G2084A和G2083A。

附图说明

图1:通过在平板中筛选分离的小麦过度生长突变体的实例。箭头所 示为以生长速率增加为特征的一株突变体幼苗。

图2:与亲本植物(矮化)和野生型植物(高)相比,在控制条件下 生长的小麦的过度生长突变体。从左到右,携带Rht-B1c(矮化)、Rht-B1a (高)之Maringa的衍生品种或Rht-B1c的三种不同过度生长衍生品种。 这三种过度生长衍生品种的不同之处在于其最终高度,并且箭头指向每种 品系的穗(head)。两种衍生品种为半矮化的,第三种与野生型一样高。

图3:大麦(向上箭头)和小麦(向下箭头)过度生长突变体的DELLA 多肽C端GRAS结构域中的氨基酸替换位点的示意图。标出了保守的氨 基酸区域。

图4:年龄相同的大麦幼苗(从左到右):Himalaya(WT)、M463 (grd2b)、TR261(grd2b、sln1m)、M240(sln1m)、M640(Sln1d)、TR107 (Sln1d.10)、TR60(Sln1d.8)。

图5:一些小麦突变体品系中改变的形态。正常(左)和异常(右) 形态的一个实例,其中后者以窄叶、细茎、根系发育不良和在一些情况下 的比正常谷粒少的穗为特征。

图6:来自以下品系的DNA的双重PCR(Duplex PCR)分析(1至 r):Maringá rht-1、Maringá Rht-B1c对照、具有异常形态学的两种过度 生长品系、具有正常形态学的两种过度生长品系、无模板对照。大小标记 物在左边。上面条带表示扩增的Rht-B1c等位基因的片段,而下面条带为 Rht-D1基因的产物。

图7:小麦中Rht-A1a(JF930277)、Rht-B1(JF930278)和Rht-D1a (JF930281)编码的氨基酸序列的ClustalW比对。

图8:通过Blastp对小麦Rht-B1a多肽(SEQ ID NO:5,上面序列) 和拟南芥(Arabidopsis thaliana)GAI蛋白(登录号CAA75492,下面序 列)的比对。星号表示两个多肽之间的相同(保守的)氨基酸,而“+” 符号表示类似但不相同的氨基酸。

有关序列表的说明:

SEQ ID NO:1示出了来自Maringa/Rht-B1c之Rht-B1c基因的3892nt 核苷酸序列,以蛋白质编码区的ATG开始直至该编码区末端的TGA。在 将逆转录转座子的2026nt插入物(insertion)插入到Rht-B1基因中以使 得Rht-B1c紧接前147nt之后产生。

SEQ ID NO:2示出了对应于小麦Maringa/Rht-B1c中Rht-B1c等位 基因的cDNA的1956nt核苷酸序列。该序列与Genbank登录号JN857971 (Wu等,2011)中提供的核苷酸序列几乎相同,仅813和1851位的两个 核苷酸不同。相对于来自Rht-B1a等位基因的cDNA,所述cDNA中的 90nt插入物对应于SEQ ID NO:2的核苷酸148-237。

SEQ ID NO:3示出了由Rht-B1c等位基因编码,即由具有SEQ ID NO: 1之核苷酸序列的基因和SEQ ID NO:2的cDNA编码的651氨基酸多肽 的氨基酸序列。插入该多肽中的30个氨基酸相对于Rht-B1a多肽为SEQ  ID NO:3的50-79位氨基酸。

SEQ ID NO:4示出了对应于Rht-B1a(野生型)等位基因的cDNA的 核苷酸序列,其以ATG翻译起始密码子开始(Pearce等,2011;Genbank 登录号JF930278)。

SEQ ID NO:5示出了Rht-B1a多肽(野生型)的氨基酸序列(Genbank 登录号JF930278),621个氨基酸。

SEQ ID NO:6示出了来自栽培品种Xiaoyan54的普通小麦(Triticum  aestivum)Rht1-B1b基因的7057nt核苷酸序列(Genbank登录号 FN649763)。核苷酸1-2136对应于Rht-B1b的启动子和5’UTR;核苷酸 2137-4002对应于蛋白质编码区,与野生型相比,其被2326位C到T的 核苷酸改变间断;并且核苷酸4003-7057对应于Rht-B1b的3’UTR和该 基因的3’区。

SEQ ID NO:7示出了由Rht-B1b编码的多肽的555氨基酸序列,与 野生型Rht-B1a相比,其为N端截短的Rht-B1蛋白,截短了前66个氨 基酸。翻译重新以氨基酸67起始。

SEQ ID NO:8示出了普通小麦Rht-A1a基因(野生型Rht-A1)的 3463nt核苷酸序列(Genbank登录号JF930277)。核苷酸1-1600对应于 Rht-A1a的启动子和5’UTR,并且核苷酸1601-3463对应于Rht-A1a的蛋 白质编码区。该蛋白质编码区与Rht-B1a编码区具有96%同一性。

SEQ ID NO:9示出了Rht-A1a(野生型)多肽的620氨基酸序列。

SEQ ID NO:10示出了对应于Rht-D1a基因的cDNA的1872核苷酸 序列(Genbank登录号AJ242531)。

SEQ ID NO:11示出了Rht-D1多肽的623氨基酸序列(登录号 JF930281)。

SEQ ID NO:12示出了大麦Sln1基因的618氨基酸序列(登录号 AK372064)。

SEQ ID NO:13示出了拟南芥GAI多肽的532氨基酸序列(登录号 CAA75492)。

SEQ ID NO:14示出了插入到Rht-B1c多肽中30个氨基酸的氨基酸 序列。

SEQ ID NO:15示出了小麦野生型Rht-B1a多肽中“Della”基序的 11氨基酸序列,其在Rht-B1c多肽中被间断。

SEQ ID NO:16示出了Rht-B1c基因的核苷酸序列(登录号JN857970; Wu等,2011)。cDNA对应于被连接至2289-4097的核苷酸206-352。

SEQ ID NO:17至30示出了寡核苷酸引物的核苷酸序列。

发明详述

植物

本发明提供了小麦植物、其部分(例如小麦谷粒)、获自这些植株和 谷粒的产品(例如食物成分和食物产品),以及产生和使用其的方法。本 文所用的术语“小麦”指物种普通小麦(Triticum aestivum L.)或圆锥小 麦硬粒小麦亚种(Triticum turgidum ssp.durum)或黑小麦(Triticale)的 植物、植物部分、谷粒或由其衍生的产品。普通小麦(也称为面包小麦) 是一种六倍体小麦,其具有由42条染色体构成的AABBDD基因组组构。 通常将普通小麦的“A”、“B”和“D”亚基因组称为“基因组”。圆锥小 麦硬粒小麦亚种(通常称为硬粒小麦)是一种四倍体小麦,其具有由28 条染色体构成的AABB基因组组构。六倍体或四倍体小麦的二倍体亲本 包括A基因组的小麦属(Triticum sp.),例如乌拉尔图小麦(T.uartu)、 栽培一粒小麦(T.monococcum)或野生一粒小麦(T.boeoticum);B基 因组的拟斯卑尔脱山羊草(Aegilops speltoides)和D基因组的粗小麦(T. tauschii;也称为节节麦(Aegilops squarrosa)或粗山羊草(Aegilops  tauschii)),但是其不涵盖在本文使用的“小麦”中。然而,通过常规技 术使用普通小麦作为亲本与非小麦物种黑麦(Secale cereale)进行有性杂 交产生的植物涵盖在本文使用的“小麦”中,所述杂交后代在本文中被称 为黑小麦。优选地,小麦植物适于商业化生产谷粒,例如具有本领域技术 人员已知的合适农学特征的面包小麦或硬粒小麦的市售品种。

在第一方面,本发明提供了小麦植物,其包含编码变体(非野生型) Rht-B1多肽的Rht-B1等位基因,优选地,该Rht-B1等位基因是纯合的。 在一些实施方案中,该小麦植物包含选自Rht-B1c.1、Rht-B1c.2、 Rht-B1c.3、Rht-B1c.4、Rht-B1c.5、Rht-B1c.6、Rht-B1c.7、Rht-B1c.8、 Rht-B1c.9、Rht-B1c.10、Rht-B1c.12、Rht-B1c.15、Rht-B1c.16、Rht-B1c.17、 Rht-B1c.18、Rht-B1c.21、Rht-B1c.22、Rht-B1c.23、Rht-B1c.24、Rht-B1c.26、 Rht-B1c.27、Rht-B1c.28、Rht-B1c.29、Rht-B1c.30和Rht-B1c.32的Rht-B1 等位基因,并且优选地,该等位基因是纯合的。在一些优选实施方案中, 该小麦植物包含选自Rht-B1c.22、Rht-B1c.23、Rht-B1c.24和Rht-B1c.26 的Rht-B1等位基因,并且优选地,该等位基因是纯合的。在一个实施方 案中,所述Rht-B1多肽包含N端结构域和C端结构域,其中该C端结 构域的氨基酸序列与SEQ ID NO:5的50-621位氨基酸具有至少98%的同 一性,并且其中所述Rht-B1多肽的氨基酸序列与SEQ ID NO:5所示序列 的不同之处在于至少(i)SEQ ID NO:5的49和50位氨基酸之间插入了 一个或更多个氨基酸,和(ii)该C端结构域中相对于SEQ ID NO:5的 50-621位氨基酸的一个或更多个氨基酸替换。SEQ ID NO:5示出了长度 为621个氨基酸的野生型小麦Rht-B1a蛋白的氨基酸序列,其由小麦中的 野生型Rht-B1a等位基因编码并且在本文中用作野生型Rht-B1多肽的参 照序列。

或者,变体Rht-B1多肽的氨基酸序列与SEQ ID NO:5所示序列的不 同之处在于至少SEQ ID NO:5的约49和50位氨基酸之间插入了一个或 更多个氨基酸,并且编码变体Rht-B1多肽的Rht-B1等位基因的核苷酸序 列与SEQ ID NO:1所示核苷酸序列的不同之处至少在于存在位于或邻近 内含子剪接位点的突变,从而使Rht-B1等位基因RNA转录物的内含子 剪接受到影响。本文使用的“内含子剪接位点”指跨越内含子接点的4 个核苷酸,即内含子接点5’侧的2个核苷酸和3’侧的2个核苷酸。本文 使用的“邻近内含子剪接位点”指内含子剪接位点5’侧的3个核苷酸和3’ 侧的3个核苷酸。SEQ ID NO:1示出了来源于小麦品种Maringa遗传背 景的Rht-B1c等位基因蛋白质编码区的核苷酸序列,其以翻译起始ATG 开始直到翻译终止密码子TGA。SEQ ID NO:1包含插入到Rht-B1基因中 形成Rht-B1c等位基因的2026个核苷酸的逆转录转座子插入物(核苷酸 148-2173)(Wu等,2011)。在该实施方案中,由Rht-B1等位基因编码的 多肽的氨基酸序列可与SEQ ID NO:3相同或者其可以不同。Rht-B1等位 基因可同时包含内含子剪接突变,并且编码具有前段中的(i)和(ii)差 异的多肽;或者,在一个优选实施方案中,该多肽具有上述(i)和(ii) 的差异并且不具有任何内含子剪接位点突变。

本文使用的“Rht-B1多肽”指由小麦中Rht-B1等位基因编码的多肽。 一般情况下,该Rht-B1多肽具有与约572个氨基酸之C端结构域相连的 N端结构域,所述C端结构域的氨基酸序列与SEQ ID NO:5的50-621位 氨基酸具有至少98%的同一性。该C端结构域包括通常被称为GRAS结 构域的结构域。在一个实施方案中,该N端结构域的长度为约49至约79 个氨基酸。在一个优选实施方案中,该N端结构域的长度为约79个氨基 酸,具有例如SEQ ID NO:3的1-79位氨基酸的序列或相对于SEQ ID  NO:3的1-79位氨基酸具有1至5个氨基酸替换的变体。在一个替代实施 方案中,该Rht-B1多肽衍生自经历N端末端截短的野生型Rht-B1多肽, 例如由Rht-B1b等位基因(也称为Rht1基因)编码的Rht-B1b多肽(SEQ  ID NO:7)。在一个实施方案中,该Rht-B1等位基因编码其氨基酸序列与 SEQ ID NO:3具有至少98%的同一性的Rht-B1多肽。

在一个实施方案中,该Rht-B1多肽的氨基酸序列不与SEQ ID NO:5 相同,并且也不与SEQ ID NO:7相同,但是其可包含SEQ ID NO:7。在 一个实施方案中,如果该多肽的氨基酸序列与SEQ ID NO:3相同,那么 该Rht-B1等位基因则不具有SEQ ID NO:1所示的核苷酸序列;相反地, 其编码相对于SEQ ID NO:1在或邻近内含子剪接位点具有突变的SEQ  ID NO:1的序列变体。在一个优选实施方案中,该多肽的氨基酸序列不与 SEQ ID NO:3相同。即,该多肽的序列与Rht-B1a(野生型)多肽、Rht-B1b 多肽和Rht-B1c多肽中的每一种均不相同。在一个实施方案中,该多肽的 氨基酸序列与SEQ ID NO:5所示Rht-B1a氨基酸序列的不同之处在于至 少(i)在SEQ ID NO:5的49和50位氨基酸之间插入了一个或更多个氨 基酸,和(ii)该多肽在对应于SEQ ID NO:5的200-621位氨基酸的区域 的一个或更多个氨基酸替换。Rht-B1a多肽的该区域对应于该多肽的 GRAS结构域。

在一个优选实施方案中,相对于Rht-B1a多肽(上述(i))在SEQ ID  NO:5的49和50位氨基酸之间插入一个或更多个氨基酸是约30个氨基酸 的插入物,其序列优选为DSATPPDAPLVAAAGLAANETTHIKISANK (SEQ ID NO:14;对应于SEQ ID NO:3的氨基酸50-79)或其变体,其 中该变体的序列与SEQ ID NO:14的不同之处在于不超过5个氨基酸的氨 基酸替换、插入或缺失,优选1或2个氨基酸替换。序列 DSATPPDAPLVAAAGLAANETTHIKISANK(SEQ ID NO:14)为 Rht-B1c多肽中相对于Rht-B1a多肽插入的序列。这30个氨基酸的插入 由形成Rht-B1c等位基因的Rht-B1基因中的插入所致。该插入在Rht-B1 多肽所谓的DELLA基序(DELLAALGYKV;SEQ ID NO:15)中,DELLA 基序被认为是与GA受体蛋白GID1相互作用所必需的,从而使具有该插 入的多肽不再与GID1结合。对该插入序列的变化可通过诱变获得,并且 预期1至5个氨基酸的替换、插入或缺失不会影响该多肽与GID1相互作 用的丧失。

在一个实施方案中,该小麦植物的多肽还包含在对应于SEQ ID NO:5 的1-200位氨基酸的多肽区域中的一个或更多个氨基酸替换,优选保守氨 基酸替换,该区域还被称为野生型Rht-B1多肽的DELLA结构域,因为 其包含还称作DELLA基序的氨基酸序列DELLAALGYKV(SEQ ID  NO:15)。不过,优选地,本发明Rht-B1多肽在突变DELLA结构域中的 氨基酸序列与SEQ ID NO:3相同,即包含SEQ ID NO:3的1-230位氨基 酸。

在另一些优选实施方案中,所述C端结构域中的一个或更多个氨基 酸替换在该多肽的对应于SEQ ID NO:5的200-621位氨基酸的区域中。 在一个优选实施方案中,所述一个或更多个氨基酸替换包括参照SEQ ID  NO:3的选自G260、V264、A271、G298、A299、A305、A310、P344、 L346、G377、P394、R514、T524、S528、G563、V286、D371、A310、 E579、S493、R283、R271、G274、A280、V234、R484、V285、G230、 S488和C240的氨基酸的替换。优选地,所述替换选自G260E、V264M、 A271T、G298D、A299T、A305T、A310V、P344S、L346F、G377R、P394L、 R514H、T524I、S528F、G563D、V286M、D371N、A310T、E579K、 S493F、R283H、R271H、G274D、A280T、V234M、R484H、V285F、 G230E、S488F和C240Y。在一个更优选的实施方案中,该小麦植物的 Rht-B1等位基因包含相对于SEQ ID NO:1的序列变化,所述序列变化选 自G2715A、G2726A、G2747A、G2829A、G2831A、G2849A、C2865T、 C2966T、C2972T、G3065A、C3117T、G3477A、C3507T、C3519T、G3624A、 G2792A、CC2108TA、G3047A、G2864A、G3671A、G148A、G148T、 G147A、G2084A和G2083A。这些序列变化对应于上文刚刚列举的氨基 酸替换,参见表3。

优选地,当这些植物在相同条件下生长时,本发明的小麦植物相对于 Rht-B1c等位基因纯合的小麦植物具有增加的植株高度并且相对于 Rht-B1a等位基因纯合的小麦植物具有降低的高度。因此,将本发明的小 麦植物称为“半矮化”。在一个优选实施方案中,本发明小麦植物的高度 为Rht-B1a等位基因纯合(“高表型”)的对照植物高度的约70%至约94%, 更优选地,为Rht-B1a等位基因纯合的植物高度的约75%至约90%。相 比之下,Rht-B1c等位基因纯合的小麦植物(“矮化植物”)的高度为 Rht-B1a等位基因纯合的植物高度的约42%。本发明小麦植物的高度可与 Rht-B1b等位基因纯合的小麦植物的高度大约或基本相同,其为高植物高 度的约80%至81%,或者可低于Rht-B1b植物的高度或高于Rht-B1b植 物的高度。本文使用的“植株高度”指成熟植物从地面到最高茎顶部(即, 穗的底部)的高度。相对于本发明的小麦植物,Rht-B1c、Rht-B1a或 Rht-B1b等位基因纯合的并用作比较之对照的植物优选具有基本相同的遗 传背景,更优选地,其为近等基因(near-isogenic)系;因而,将其称为 “Rht-B1c(或Rht-B1a或Rht-B1b)等位基因纯合的对应小麦植物”。本 领域的技术人员能够容易选择适用于进行比较的对应小麦植物。为了进行 比较,例如在重复田间试验中,使本发明的植物与对照植物在基本相同的 时间和环境条件下生长,包括相同的温度方案、光条件、养分和水供给以 及土壤条件。优选地,测量田间生长植物的植株高度,但是也可使用温室 生长植物用于进行比较,并且按照本领域中已知的田间试验进行生长。可 在生长周期中的任意点测量植株高度,但是优选在植物成熟时期测量。

此外,优选地,所述小麦植物相对于Rht-B1c等位基因纯合的小麦植 物具有增强的能育性和/或生产增加的谷粒量;和/或相对于Rht-B1c等位 基因纯合的小麦植物具有增加的胚芽鞘长度;和/或能够生产与从Rht-B1a 等位基因纯合的小麦植物获得之谷粒相比休眠增加的谷粒。优选地,该植 物产生的谷粒量与Rht-B1b等位基因纯合的对应小麦植物基本相同或者 比其更大。将本文使用的“能育性”限定为每个穗的谷粒数目,而“谷粒 量”或“从植物产生的谷粒产量”指可从该植物收获的成熟谷粒的重量。

所述谷粒一般具有按重量计约10%至约15%的含水量。优选地,本发明 的小麦植物相对于Rht-B1c等位基因纯合的小麦植物还具有增加的胚芽 鞘长度。优选地,本发明小麦植物的胚芽鞘长度为Rht-B1a等位基因纯合 的植物的胚芽鞘长度的70%至120%,优选80%至100%。本发明小麦植 物的另一优选性状是获自该植物的谷粒的休眠。优选地,该植物相对于 Rht-B1a等位基因纯合的小麦植物具有增加的谷粒休眠。优选地,该小麦 植株的休眠水平是Rht-B1c等位基因纯合的小麦植物的50%至100%,优 选60%至100%。在一个实施方案中,获自本发明小麦植物之谷粒的萌发 率位于来自Rht-B1a等位基因纯合之小麦植物的谷粒和来自Rht-B1c等位 基因纯合之小麦植物的谷粒之间。可按照实施例1中所述测定萌发率。例 如,可测定谷粒群达到50%萌发所需的时间。在一个优选实施方案中, 与相对于来自Rht-B1a等位基因纯合之对应小麦植物的谷粒相比,本发明 小麦植物的谷粒在室温下需要1至8周多,优选2至5周多的储存(“后 熟期”)以达到50%的萌发率。

应当理解,当将本发明的植物或谷粒与Rht-B1c等位基因纯合或 Rht-B1a等位基因纯合的那些进行比较时,使用在基本相同的生长条件、 生长时间、温度、水和养分供给等下生长的植物以及获自这些植物的谷粒 进行该比较。

谷粒在第二方面,本发明提供了小麦谷粒,其获自或可获自本发明 的小麦植物,或者其为本发明小麦植物的一部分。本文使用的“谷粒”指 一般由农民从田间生长的成熟小麦植物收获的谷粒,包括用于食品生产或 用在食品产品中的谷粒和在播种后而幼苗长出(emergence)前萌发的谷 粒。谷粒还包括经历加工用于食品生产或为食品产品中成分的谷粒。本发 明收获的小麦谷粒一般具有按重量计约10%至约15%的含水量。在一个 实施方案中,所述小麦谷粒包含编码变体(非野生型)Rht-B1多肽的 Rht-B1等位基因,优选地,该谷粒对该等位基因是纯合的。在一个实施 方案中,所述Rht-B1多肽包含N端结构域和C端结构域,其中该C端 结构域的氨基酸序列与SEQ ID NO:5的50-621位氨基酸具有至少98%的 同一性,并且其中所述Rht-B1多肽的氨基酸序列与SEQ ID NO:5所示序 列的不同之处在于至少(i)SEQ ID NO:5的49和50位氨基酸之间插入 了一个或更多个氨基酸,和(ii)该C端结构域中相对于SEQ ID NO:5 的50-621位氨基酸的一个或更多个氨基酸替换。在一些实施方案中,所 述小麦谷粒包含选自如下的Rht-B1等位基因:Rht-B1c.1、Rht-B1c.2、 Rht-B1c.3、Rht-B1c.4、Rht-B1c.5、Rht-B1c.6、Rht-B1c.7、Rht-B1c.8、 Rht-B1c.9、Rht-B1c.10、Rht-B1c.12、Rht-B1c.15、Rht-B1c.16、Rht-B1c.17、 Rht-B1c.18、Rht-B1c.21、Rht-B1c.22、Rht-B1c.23、Rht-B1c.24、Rht-B1c.26、 Rht-B1c.27、Rht-B1c.28、Rht-B1c.29、Rht-B1c.30和Rht-B1c.32,并且优 选地,其该等位基因是纯合的。在一些优选实施方案中,所述小麦谷粒包 含选自Rht-B1c.22、Rht-B1c.23、Rht-B1c.24和Rht-B1c.26的Rht-B1等 位基因,并且优选地,其该等位基因是纯合的。

或者,该谷粒变体Rht-B1多肽的氨基酸序列与SEQ ID NO:5所示序 列的不同之处在于至少在SEQ ID NO:5的49和50位氨基酸之间插入了 一个或更多个氨基酸,并且编码变体Rht-B1多肽之Rht-B1等位基因的核 苷酸序列与SEQ ID NO:1所示核苷酸序列的不同之处至少在于存在位于 或邻近内含子剪接位点的突变,从而使Rht-B1等位基因RNA转录物的 内含子剪接受到影响。在该实施方案中,由Rht-B1等位基因编码的多肽 氨基酸序列可与SEQ ID NO:3相同,或者其可以是不同的。Rht-B1等位 基因可同时包含内含子剪接突变,并且编码具有前段中(i)和(ii)差异 的多肽;或者,在一个优选实施方案中,该多肽具有上述(i)和(ii)的 差异并且相对于SEQ ID NO:1不具有任何内含子剪接位点突变。

还可按照上文针对所述小麦植物的段落中所述,对该谷粒的变体 Rht-B1多肽及编码其的Rht-B1等位基因进行进一步限定。在一个优选实 施方案中,该谷粒与从Rht-B1a等位基因纯合的小麦植物获得之谷粒相比 具有增加的休眠。在一个实施方案中,本发明谷粒的萌发率位于来自 Rht-B1a等位基因纯合之小麦植物的谷粒和来自Rht-B1c等位基因纯合之 小麦植物的谷粒的萌发率之间。可按照实施例1中所述测定萌发率。例如, 可测定谷粒群达到50%萌发所需的时间。在显示“休眠增加”的一个优 选实施方案中,与来自Rht-B1a等位基因纯合的对应小麦植物的谷粒相 比,本发明的谷粒在室温下需要1至8周多,优选2至5周多的储存(“后 熟期”)以达到50%的萌发率。还优选的是,当将该谷粒播种到土壤中时, 本发明的小麦谷粒能够生长成小麦植物;当这些植物在相同条件下生长 时,该植物相对于Rht-B1c等位基因纯合的小麦植物具有增加的植株高度 并且相对于Rht-B1a等位基因纯合的小麦植物具有降低的高度。由该谷粒 产生的小麦植物相对于Rht-B1c等位基因纯合的小麦植物可具有增强的 能育性和/或产生增加的谷粒量,和/或相对于Rht-B1c等位基因纯合的小 麦植物具有增加的胚芽鞘长度。

本发明还提供了产生本发明谷粒的方法,所述方法包括(i)种植本 发明的小麦植物,和(ii)从该植物收获谷粒。在一些优选实施方案中, 可对所述小麦谷粒进行加工使得其不再能够萌发。这可通过去除种子的胚 实现,例如通过研磨或通过热处理或其他谷粒加工方法。所述谷粒可以是 经粗磨、经破裂、经煮半熟(par-boiled)、经辊压、经抛光、经粉碎或经 研磨的谷粒。

本发明还提供了产生面粉、全麦面粉(wholemeal)、淀粉、淀粉颗粒 或麸的方法,所述方法包括获得本发明的谷粒并对该谷粒进行加工以产生 所述面粉、全麦面粉、淀粉、淀粉颗粒或麸。所述加工方法在本领域中是 公知的。获得谷粒的步骤包括,例如从本发明的小麦植株收获谷粒或者购 买谷粒。

本发明还提供了由本发明的植物或谷粒生产的产品,例如食物产品, 其可以是食物成分。食物产品的实例包括面粉、淀粉、经发酵的或未经发 酵的面包、意大利面(pasta)、面条、动物饲料、早餐麦片、点心、蛋糕、 麦芽、糕点或基于面粉的调味品。所述食物产品可以是面包圈、饼干、面 包、小圆面包、羊角面包、饺子、英式松饼、松饼、皮塔面包、速成面包、 冷藏/冷冻面团产品、面团、烘豆、玉米煎饼(burrito)、辣椒酱(chili)、 墨西哥卷饼(taco)、玉米面团包馅卷(tamale)、玉米粉圆饼(tortilla)、 馅饼(pot pie)、即食谷类、即食餐(ready to eat meal)、填料、微波炉 餐、核仁巧克力饼(brownie)、蛋糕、奶酪蛋糕、咖啡蛋糕、曲奇、甜点、 糕点、甜面包、糖块(candy bar)、馅饼皮(pie crust)、灌饼(pie filling)、 婴儿食品、烘焙混合物、面糊(batter)、面包糊(breading)、肉汁混合 物、肉混合剂、肉替代品、调味品混合物、汤混合物、肉汁、掺油面粉糊 (roux)、色拉调料(salad dressing)、汤、酸奶油、面条、意大利面、拉 面、炒面、捞面、冰淇淋内容物(ice cream inclusion)、冰淇淋棒、冰淇 淋蛋卷、冰淇淋三明治、薄脆饼干(cracker)、油煎面包块(crouton)、 甜甜圈、蛋卷(egg roll)、膨化食品(extruded snack)、水果谷物棒(fruit  and grain bar)、微波炉点心产品、营养棒、煎饼、烤半熟的烘焙产品 (par-baked bakery product)、椒盐卷饼(pretzel)、布丁、基于格兰诺 拉麦片的产品、点心片、点心、点心混合物、华夫饼、匹萨壳、动物食品 或宠物食品。食物产品可通过混合谷粒或来自所述谷粒的面粉、全麦面粉 或麸与其他成分制备。另一种产品为动物饲料,例如收获的谷粒、干草、 稻草或青贮饲料。本发明的植物可直接用作动物饲料,例如当在田间生长 时。

多核苷酸在第三方面,本发明提供了编码本发明Rht-B1多肽的核 酸分子。该核酸分子可从小麦植物分离或者包含在小麦植物中或者作为植 物中的外源核酸分子,所述植物可以是任何植物,例如谷类植物或除非小 麦之外的植物。在一个实施方案中,所述Rht-B1多肽包含N端结构域和 C端结构域,其中该C端结构域的氨基酸序列与SEQ ID NO:5的50-621 位氨基酸具有至少98%的同一性,并且其中所述Rht-B1多肽的氨基酸序 列与SEQ ID NO:5所示序列的不同之处在于至少(i)在SEQ ID NO:5 的49和50位氨基酸之间插入了一个或更多个氨基酸,和(ii)该C端结 构域中相对于SEQ ID NO:5的50-621位氨基酸的一个或更多个氨基酸替 换。还可按照上文针对所述小麦植物的段落中所述,对本发明的Rht-B1 多肽进行进一步限定。在一些优选实施方案中,所述核酸分子包含选自以 下的Rht-B1等位基因:Rht-B1c.1、Rht-B1c.2、Rht-B1c.3、Rht-B1c.4、 Rht-B1c.5、Rht-B1c.6、Rht-B1c.7、Rht-B1c.8、Rht-B1c.9、Rht-B1c.10、 Rht-B1c.12、Rht-B1c.15、Rht-B1c.16、Rht-B1c.17、Rht-B1c.18、Rht-B1c.21、 Rht-B1c.22、Rht-B1c.23、Rht-B1c.24、Rht-B1c.26、Rht-B1c.27、Rht-B1c.28、 Rht-B1c.29、Rht-B1c.30和Rht-B1c.32。在一些更优选的实施方案中,所 述核酸分子包含选自Rht-B1c.22、Rht-B1c.23、Rht-B1c.24和Rht-B1c.26 的Rht-B1等位基因。

多肽在第四方面,本发明提供了Rht-B1多肽,其包含N端结构域 和C端结构域,其中该C端结构域的氨基酸序列与SEQ ID NO:5的50-621 位氨基酸具有至少98%的同一性,并且其中所述Rht-B1多肽的氨基酸序 列与SEQ ID NO:5所示序列的不同之处在于至少(i)在SEQ ID NO:5 的49和50位氨基酸之间插入了一个或更多个氨基酸,和(ii)该C端结 构域中相对于SEQ ID NO:5的50-621位氨基酸的一个或更多个氨基酸替 换。还可按照上文针对所述小麦植物的段落中所述,对本发明的Rht-B1 多肽进行进一步限定。

本发明还提供了一种对小麦植物基因分型的方法,所述方法包括(i) 获得包含从小麦植物提取的核酸或蛋白质的样品,和(ii)检测该样品中 本发明的核酸分子或多肽。在一些优选实施方案中,所述小麦植物包含选 自以下的Rht-B1等位基因:Rht-B1c.1、Rht-B1c.2、Rht-B1c.3、Rht-B1c.4、 Rht-B1c.5、Rht-B1c.6、Rht-B1c.7、Rht-B1c.8、Rht-B1c.9、Rht-B1c.10、 Rht-B1c.12、Rht-B1c.15、Rht-B1c.16、Rht-B1c.17、Rht-B1c.18、Rht-B1c.21、 Rht-B1c.22、Rht-B1c.23、Rht-B1c.24、Rht-B1c.26、Rht-B1c.27、Rht-B1c.28、 Rht-B1c.29、Rht-B1c.30和Rht-B1c.32。

本发明还提供了一种将Rht-B1等位基因导入缺乏所述等位基因的小 麦植物中的方法,所述方法包括:i)将第一亲本小麦植物与第二亲本小 麦植物杂交,其中该第二植物为本发明的小麦植物,和ii)将步骤i)的 杂交后代植物和与所述第一亲本植物具有相同基因型的植物回交以产生 具有该第一亲本大部分基因型但包含所述Rht-B1等位基因的植物。

可将本发明的核酸分子与能够指导该核酸分子在植物细胞中表达的 启动子有效连接。本发明还提供了一种包含或编码本发明核酸分子的载体 和包含该载体和/或本发明核酸分子的宿主细胞。

本发明还提供了一种经遗传修饰的植物,其中该植物已用本发明的核 酸分子转化;并且其后代植物包含所述核酸分子。在某些实施方案中,所 述经遗传修饰的植物为小麦或大麦植物。

本文使用的谷类指单子叶植物家族禾本科(Poaceae或Graminae) 的植物或谷粒,其被培植来用于获得其种子的可食用成分,并且包括小麦、 大麦、玉米、燕麦、黑麦、水稻、高粱、黑小麦、粟、荞麦。优选地,所 述谷类植物或谷粒为小麦或大麦植物或谷粒,更优选小麦植物或谷粒。在 另一优选实施方案中,所述谷类植物不是水稻或玉米或这些中的任何一 种。

本文使用的术语“大麦”指大麦属(Genus Hordeum)的任何物种, 包括其亲代以及其通过与其他物种杂交产生的后代。优选地,所述植物为 可商业化培植(例如多棱大麦(Hordeum vulgare)品系或栽培品种或品 种)或适用于商业化生产谷粒的大麦属物种。

本发明的小麦植物不仅具有用于食品或动物饲料用途,还可具有很多 用途,例如用于研究或育种。对于种子繁殖的农作物例如小麦,可使这些 植物自交以产生对期望基因纯合的植物,或者可诱导单倍体组织(例如发 育中的精细胞)以使染色体组加倍从而产生纯合的植物。

可使本发明的小麦植物与包含更理想遗传背景的植物杂交。期望的遗 传背景可包括提供商业产量和其他特征(例如农学性能或非生物胁迫抗 性)的基因的合适组合。所述遗传背景还可包括其他经改变的淀粉生物合 成或修饰基因,例如来自其他小麦品系的基因。所述遗传背景可包含一种 或更多种转基因,例如赋予除草剂(如草甘膦)耐受性的基因。

本文使用的术语“连锁的”指染色体上的标记基因座和第二基因座足 够接近,使得其在超过50%的减数分裂中一起遗传,例如非随机地。该 定义包括其中标记基因座和第二基因座形成同一基因的一部分的情况。此 外,该定义包括其中标记基因座包含负责目的性状的多态性的情况(换句 话说,该标记基因座与表型直接“连锁”)。本文使用的术语“遗传连锁” 是狭义的,仅用于与如下有关的情况:染色体上的标记基因座和第二基因 座足够接近,使得其在超过50%的减数分裂中一起遗传。因此,每代观 察到的基因座之间的重组百分数(厘摩(cM))将小于50。在本发明的 一些具体实施方案中,染色体上遗传连锁的基因座可间隔45cM、35cM、 25cM、15cM、10cM、5cM、4cM、3cM、2cM或1cM或者小于cM。 优选地,这些标记间隔小于5cM或2cM,最优选间隔为约0cM。

本文使用的“其他遗传标记”可以是与谷类植物(例如小麦)的期望 性状有关的任何分子。所述标记为本领域的技术人员已知,并且包括与决 定如下性状的基因相关的分子标记:例如抗病性、产量、植物形态学、谷 粒质量、其他休眠性状例如谷粒颜色、种子中的赤霉酸含量、植株高度、 面粉颜色等。这样的基因的实例为茎锈病抗性基因Sr2或Sr 38、条锈病 抗性基因YrIO或Yr 17、线虫抗性基因例如Cre和Cre3、位于麦谷蛋白 基因座决定面团强度的等位基因,例如Ax、Bx、Dx、Ay、By和Dy等 位基因。具体对于谷粒休眠,其他标记包括红谷粒色的R基因(Himi等, 2002)以及Mares等(2005)、Li等(2004)、Kato等(2001)、Mori等(2005) 和Prada等(2004)所述的标记。

作为名词时,本文使用的术语“植物”指整个植物,但是作为形容词 使用时,指植物中存在、从其获得、由其衍生或与其相关的任何物质,例 如植物器官(例如叶、茎、根、花)、单个细胞(例如花粉)、种子、植物 细胞等。本发明提供的或预期用于实践本发明的植物包括单子叶植物和双 子叶植物两者。在一些优选实施方案中,本发明的植物为农作物植物(例 如谷类和豆类、玉米、小麦、马铃薯、木薯、水稻、高粱、大豆、粟、木 薯、大麦或豌豆)或豆科植物。可种植用于生产可食用根、块茎、叶、茎、 花或果实的植物。

本文使用的术语“种子”和“谷粒”具有重叠含义。根据上下文,“谷 粒”包括已从植物收获的种子,并且一般指成熟的收获谷粒,但是也可指 经历吸胀和萌发后的谷粒。“种子”可指收获前或后的成熟谷粒或指正在 植物内发育的未成熟种子。成熟的谷粒一般具有低于约10%至15%的含 水量。

本文使用的术语“基因”采用其最广义的范围,包括含有结构基因的 蛋白质编码区的脱氧核糖核苷酸序列并且包括位于编码区5’和3’两端附 近与各端相距至少约2kb的序列。将位于编码区5’且存在于mRNA上的 序列称为5’非翻译序列。将位于编码区3’或下游且存在于mRNA上的序 列称为3’非翻译序列。术语“基因”涵盖基因的cDNA和基因组形式两 者。基因的基因组形式或克隆包含编码区,编码区可被称为“内含子”或 “间插区”或“间插序列”的非编码序列间断。内含子为转录成核RNA (hnRNA)的基因区段;内含子可包含调控元件,例如增强子。内含子 被从核或初级转录物中除去或“剪接掉”;因而,内含子不存在于信使RNA (mRNA)转录物中。mRNA在翻译期间起确定新生多肽中氨基酸序列 或顺序的作用。术语“基因”包括编码本文所述的本发明全部或部分蛋白 质的合成或融合分子和上述中任意一个的互补核苷酸序列。

等位基因为单个遗传基因座上基因的变体。六倍体小麦(例如普通小 麦)包含六组染色体,基因组组构为AABBDD。每条染色体具有每个基 因的一个拷贝(一个等位基因)。如果一个染色体对的两个等位基因是相 同的,那么该生物体对所述基因则是纯合的;如果等位基因是不同的,那 么该生物体则对所述基因是杂合的。一般将基因座上等位基因之间的相互 作用描述为显性或隐性。

本发明的小麦植物可以是在诱变后产生和被鉴定出的。这样可提供非 转基因的或不含外源核酸分子的小麦植物,非转基因小麦植物是一些市场 上所需要的。一般地,可对祖先植物细胞(progenitor plant cell)、组织、 种子或植物进行诱变以产生单个或多个突变,例如核苷酸替换、缺失、添 加和/或密码子修饰。

诱变可通过本领域中公知的化学或辐射方法实现,例如EMS或叠氮 化钠(Zwar和Chandler,1995)处理种子或γ辐射。化学诱变倾向有利 于核苷酸替换而非缺失。已知重离子束(HIB)辐射为用于进行突变育种 以产生新植物栽培品种的有效技术,参见例如Hayashi等,2007和Kazama 等,2008。对于生物效应,离子束辐射具有决定DNA损伤量和DNA缺失 大小的两个物理因素,剂量(gy)和LET(线性能量转移,keV/um), 并且这些均可根据期望的诱变程度进行调整。

用于产生位点特异性突变的生物剂包括酶,所述酶涉及刺激内源修复 机制的DNA双链断裂。这些包括核酸内切酶、锌指核酸酶、TAL效应物、 转座酶和位点特异性重组酶。锌指核酸酶(ZFN),例如有利于基因组内 的位点特异性切割,并允许内源或其他末端连接修复机制引入缺失或插入 从而修复该缺口。Le Provost等,2009中对锌指核酸酶技术进行了综述, 另外参见Durai等,2005和Liu等,2010。

突变体的分离可通过筛选经诱变的植物或种子实现。例如,可直接筛 选经诱变的小麦群以获得期望的基因型,或者间接地通过筛选表型,例如 植株高度。直接筛选基因型优选包括测定突变的存在,这些突变可在PCR 测定中通过当缺失一些基因时预期标记的缺失或者如Tilling中基于异源 双链的测定或者通过深度测序观察到。筛选表型可包括按照筛选实施例中 所述的生长物。可利用该方法对大的经诱变种子群进行筛选以获得增加的 生长,增加的生长提供增加的植株高度。

然后,可如下将鉴定的突变引入理想的遗传背景中:使该突变体与具 有期望遗传背景的植物杂交并进行适当数目的回交以去除原始非期望的 亲本背景。

在本申请的上下文中,“诱导突变”或“引入突变”为人工诱导的遗 传变异,其可以是通过化学或辐射方法处理亲代种子或植物的结果。核苷 酸插入衍生物包括5’和3’端融合以及单个或多个核苷酸的序列内插入。 插入核苷酸序列的变体为在核苷酸序列的位点中引入了一个或更多个核 苷酸的那些变体,在预定位点用锌指核酸酶(ZFN)、TAL效应物或同源 重组方法是可能的,或者通过随机插入并适当筛选所得产物。缺失变体以 从序列中去除一个或更多个核苷酸为特征。优选地,与野生型基因相比, 突变基因仅具有核苷酸序列的单个插入物以及一个或更多个替换突变。替 换核苷酸变体为其中除去序列中的至少一个核苷酸并且在其位置插入不 同核苷酸的那些变体。相对于野生型基因,优选突变基因中受替换影响的 核苷酸数最多为10个核苷酸,更优选最多9、8、7、6、5、4、3或2, 或最优选仅1个核苷酸。

本文使用的术语“突变”不包括不影响基因活性的沉默核苷酸替换, 因而仅包括影响基因活性的基因序列改变。术语“多态性”指对核苷酸序 列的任何改变,包括所述沉默核苷酸替换。筛选方法可首先包括在一组多 态变体中筛选多态性,其次筛选突变。

在经典的育种过程中,标记辅助筛选是用于在与轮回亲本回交时筛选 所需杂合植物的公认方法。每个回交代中的植物群将是目的基因杂合的, 在回交群中通常以1∶1比例存在,并且分子标记可用于区分该基因的两个 等位基因。通过从例如嫩芽中提取DNA并用特异性标记测试渗入的理想 性状来对用于进一步回交的植物进行早期筛选,同时精力和资源集中于较 少数植物上。为了进一步加快回交过程,可将未成熟种子(开花后25天) 的胚切除,并使其于无菌条件下在营养培养基上生长,而不是允许饱满种 子成熟。

本领域中已知的能够检测Rht-B1等位基因的任何分子生物技术均可 用在本发明的方法中。这些方法包括,但不局限于利用核酸扩增、核酸测 序、与经适当标记之探针的核酸杂交、单链构象分析(SSCA)、变性梯度 凝胶电泳(DGGE)、异源双链分析(HET)、化学切割分析(chemical  cleavage analysis,CCM)、催化核酸切割或其组合(参见,例如Lemieux, 2000;Langridge等,2001)。

“聚合酶链式反应”(“PCR”)为这样的反应,其中复制拷贝由靶多 核苷酸利用由“上游”和“下游”引物组成的“引物对”或“引物组”以 及聚合反应催化剂(例如DNA聚合酶,一般地,热稳定性聚合酶)产生。 用于PCR的方法在本领域中是已知的,并且在例如“PCR”中有所教导 (Ed.MJ.McPherson和S.G Moiler(2000)BIOS Scientific Publishers  Ltd,Oxford)。

引物为在PCR期间能够以序列特异性方式与靶序列杂交并被延伸的 寡核苷酸序列。扩增子或PCR产物或PCR片段或扩增产物为包含引物和 新合成的靶序列拷贝的延伸产物。多重PCR体系包含多组引物,并且导 致同时产生超过一个扩增子。引物可与靶序列完全匹配或者其可包含内部 不匹配的碱基,这些碱基可导致在特定靶序列中引入限制性内切酶或催化 核酸识别/切割位点。引物还可包含额外的序列和/或包含经修饰或经标记 的核苷酸从而有利于捕获或检测扩增子。重复如下循环导致以指数扩增靶 序列:热变性DNA、使引物与其互补序列退火并用聚合酶延伸退火的引 物。术语靶标或靶序列或模板指被扩增的核酸序列。

本文使用的术语“转基因植物”和“转基因小麦植物”指包含相同物 种、品种或栽培品种的野生型植物中不存在的基因构建体(“转基因”)的 植物。即,转基因植物(转化植物)包含其在转化前不含有的遗传物质。 本文提及的“转基因”具有生物技术领域中的一般含义,指已通过重组 DNA或RNA技术产生或改变并已被引入祖先植物细胞中的遗传序列,所 述细胞用于产生新的植物。转基因可包括获自或来源于植物细胞或其他植 物细胞或非植物来源的遗传序列或合成序列。通常,通过人操作将转基因 导入植物中,例如通过转化,但可使用本领域技术人员认可的任何方法。 通常将遗传物质稳定地整合到植物的基因组中。引入的遗传物质可包含相 同物种中天然存在但以重排的顺序或以不同的元件排列的序列,例如反义 序列或者编码双链RNA或人工微RNA前体的序列。本文的“转基因植 物”包含含有这些序列的植物。本文限定的转基因植物包括已利用重组技 术进行遗传修饰的初始转化和再生植物(T0植物)的所有后代,其中所 述后代包含该转基因。这样的后代可通过原代转基因植物的自体受精或通 过使这样的植物与相同物种的另一植物杂交获得。在一个实施方案中,所 述转基因植物对已导入的每个基因(转基因)均是纯合的,从而使其后代 对于期望表型不分离。转基因植物部分包括包含转基因的所述植物的全部 部分和细胞,例如种子、培养组织、愈伤组织和原生质体。“非转基因植 物”,优选非转基因小麦植物为未经通过重组DNA技术引入遗传物质进 行遗传修饰的植物。

本文使用的术语“相应非转基因植物”指大多数特征与转基因植物相 同或类似(优选等基因或近等基因),但不含目的转基因的植物。优选地, 相应非转基因植物与目的转基因植物的祖先或缺乏构建体的同胞植物品 系(通常称为“分离子”)或转化有“空载体”构建体的相同栽培品种或 品种植物是相同的栽培品种或品种,并且可以是非转基因植物。根据本发 明,本文使用的“野生型”指未经改变的细胞、组织或植物。野生型细胞、 组织或植物在本领域中是已知的,并且可用作对照以与本文所述之经改变 的细胞、组织或植物比较外源性核酸的表达水平或性状改变的程度和性 质。本文使用的“野生型小麦谷粒”指相应的未经诱变的非转基因小麦谷 粒。本文使用的具体野生型小麦谷粒包括但不局限于Sunstate。

可利用数种方法中的任何来确定转化植物中转基因的存在。例如,可 利用聚合酶链式反应(PCR)扩增转化植物所特有的序列,并通过凝胶电 泳或其他方法检测扩增产物。可利用常规方法从植物中提取DNA并使用 将区别转化和非转化植物的引物进行PCR反应。确定阳性转化株的一种 替代方法是通过本领域中公知的Southern印迹杂交。还可对被转化的小 麦植物进行鉴定,即与非转化或野生型小麦植物的区别在于其例如由存在 的可选择标记基因赋予的表型,或者在于检测或量化该转基因编码之酶的 表达的免疫测定,或由该基因赋予的任何其他表型。

本发明的小麦植物可为了谷粒而被种植或收获,主要用作用于人消耗 的食物或用作动物饲料,或者用于发酵或生产工业原料,例如生产乙醇等。 或者,所述小麦植物可直接用作饲料。本发明的植物优选用于食品生产, 具体用于商业化食品生产。所述食品生产可包括由谷粒制作面粉、面团、 粗面粉(semolina)或其它产品,其可为商业化食品生产中的一个组成部 分。本发明还提供了由所述谷粒生产的面粉、粗磨粉(meal)或其他产品。 这些可以是未经加工的或经加工的,例如通过分级分离(fractionation) 或漂白。

术语“多肽”和“蛋白质”在本文中一般可互换使用。本文使用的术 语“蛋白质”和“多肽”还包括本文所述的本发明多肽的变体、突变体、 修饰物和/或衍生物。本文使用的“基本纯的多肽”指已与在其天然状态 中与其缔合的脂质、核酸、其他肽和其他分子分离的多肽。优选地,基本 纯多肽至少60%不含,更优选至少75%不含,更优选至少90%不含与其 天然缔合的其他成分。“重组多肽”指利用重组技术产生的多肽,即通过 在细胞,优选植物细胞,更优选小麦细胞中表达重组多核苷酸。

多肽相对于另一多肽的%同一性可通过GAP(Needleman和Wunsch, 1970)分析确定(GCG程序),其中空位产生罚分=5,空位延伸罚分=0.3。 查询序列的长度为至少250个氨基酸,并且GAP分析对两个序列在至少 250个氨基酸的区域上进行比对。最优选地,可对所讨论的两个多肽的全 长氨基酸序列进行比对。

对于限定的多肽,应当理解的是,高于上文提供的那些的%同一性数 值将涵盖优选实施方案。因此,在可适用时,根据最小%同一性数值,所 述多肽优选包含这样的氨基酸序列,其与对应的指定SEQ ID NO具有至 少75%,更优选至少80%,更优选至少85%,更优选至少90%,更优选 至少91%,更优选至少92%,更优选至少93%,更优选至少94%,更优 选至少95%,更优选至少96%,更优选至少97%,更优选至少98%,更 优选至少99%,更优选至少99.1%,更优选至少99.2%,更优选至少 99.3%,更优选至少99.4%,更优选至少99.5%,更优选至少99.6%,更 优选至少99.7%,更优选至少99.8%,并且甚至更优选至少99.9%的同一 性。

氨基酸序列缺失一般为约1至15个残基,更优选约1至10个残基, 一般约1至5个连续残基。替换突变体的多肽分子中去除了至少一个氨基 酸残基,并在其位置插入不同的残基。

“分离的”指基本或大体上不含在其天然状态中通常与其共存的成分 的物质。本文使用的“分离的多核苷酸”或“分离的核酸分子”指至少部 分地与在其天然状态中与其缔合或相连之相同类型的多核苷酸序列分离、 优选基本或大体上不含所述多核苷酸序列的多核苷酸。例如,“分离的多 核苷酸”包括已从在天然存在的状态中位于其侧翼的序列中纯化或分离的 多核苷酸,例如已从通常邻近该片段的序列中移出的DNA片段。优选地, 分离的多核苷酸也至少90%不含其他成分,例如蛋白质、碳水化合物、 脂质等。本文使用的术语“重组多核苷酸”指通过将核酸改造成自然界中 通常不存在的形式而体外形成的多核苷酸。例如,所述重组多核苷酸可以 是表达载体的形式。一般地,这样的表达载体包括与细胞中的待转录核苷 酸序列有效相连的转录和翻译调控核酸。

本发明涉及使用可用作“探针”或“引物”的寡核苷酸。本文使用的 “寡核苷酸”为长度至多50个核苷酸的多核苷酸。它们可以是RNA、 DNA或者其各自的组合或衍生物。寡核苷酸一般是长度为10至30个核 苷酸,通常15至25个核苷酸的相对短的单链分子,其通常由与目的序列 相同或互补的10至30或15至25个核苷酸构成。当用作探针或扩增反应 中的引物时,这种寡核苷酸的最小尺寸为用于在该寡核苷酸与靶核酸分子 上的互补序列之间形成稳定杂交所需的尺寸。优选地,所述寡核苷酸的长 度为至少15个核苷酸,更优选至少18个核苷酸,更优选至少19个核苷 酸,更优选至少20个核苷酸,甚至更优选至少25个核苷酸。用作探针的 多聚核苷酸一般与可检测标记缀合,例如放射性同位素、酶、生物素、荧 光分子或化学发光分子。

术语“多核苷酸变体”和“变体”等指表现出与参照核苷酸序列具有 基本序列同一性并且能够以与参照序列类似的方式起作用或与其具有相 同活性的多核苷酸。这些术语还涵盖与参照多核苷酸的区别在于至少一个 核苷酸的添加、缺失或替换或者与天然存在的分子相比时,具有一个或更 多个突变的多核苷酸。因此,术语“多核苷酸变体”和“变体”包括其中 已添加或缺失或用不同核苷酸替换一个或更多个核苷酸的多核苷酸。在此 方面,本领域中众所周知的是,可对参照多核苷酸进行某些改变,包括突 变、添加、缺失和替换,由此使经改变的多核苷酸保留该参照多核苷酸的 生物功能或活性。因此,这些术语涵盖编码表现酶促活性或其他调控活性 之多肽的多核苷酸或能够用作选择性探针或其他杂交剂的多核苷酸。术语 “多核苷酸变体”和“变体”还包括天然存在的等位基因变体。突变体可 以是天然存在的(也就是说,分离自天然来源)或合成的(例如,通过对 核酸进行定点诱变)。优选地,编码具有酶活性之多肽的本发明多核苷酸 变体的长度为大于400,更优选大于500,更优选大于600,更优选大于 700,更优选大于800,更优选大于900,甚至更优选大于1000个核苷酸, 直至该基因的全长。

本发明的寡核苷酸变体包括能够例如在接近本文限定的特异性寡核 苷酸分子的位置与小麦基因组杂交的不同大小的分子。例如,变体可包含 额外的核苷酸(例如1、2、3、4或更多)或更少的核苷酸,只要其仍与 靶区域杂交即可。此外,可在不影响寡核苷酸与靶区域的杂交能力的情况 下替换少数核苷酸。此外,在本文限定的特异性寡核苷酸杂交的地方,可 容易地设计接近(例如,但不局限于50个核苷酸内)植物基因组区域杂 交的变体。

在多核苷酸和多肽的上下文中,“对应于”指如下的多核苷酸(a)与 参照多核苷酸序列的全部或一部分具有基本相同或互补的核苷酸序列或 (b)编码与肽或蛋白质的氨基酸序列相同的氨基酸序列。该短语在其范 围内还包含具有与参照肽或蛋白质的氨基酸序列基本相同之氨基酸序列 的肽或多肽。用于描述两个或更多个多核苷酸或多肽之间的序列关系的术 语包括“参照序列”、“比较窗口”、“序列同一性”、“序列同一性百分数”、 “基本相同”和“相同的”,并且根据限定的最小核苷酸或氨基酸残基数 或者优选在全长内对其进行限定。术语“序列同一性”或“同一性”在本 文内可交替使用,指在比较窗口内序列在核苷酸对核苷酸基础上或氨基酸 对氨基酸基础上的相同程度。因此,如下计算“序列同一性百分数”:在 比较窗口内比较两个经最佳比对的序列、确定两个序列中出现相同核酸碱 基(例如,A、T、C、G、U)或相同氨基酸残基(Ala、Pro、Ser、Thr、 Gly、Val、Leu、Ile、Phe、Tyr、Trp、Iys、Arg、His、Asp、Glu、Asn、 Gln、Cys和Met)的位置数目以得到匹配位置的数目、将匹配位置数除 以比较窗口中的位置总数(即,窗口尺寸)并将结果乘以100,从而得到 序列同一性百分数。

多核苷酸的%同一性可通过GAP(Needleman和Wunsch,1970)分 析(GCG程序)确定,其中空位产生罚分=5,空位延伸罚分=0.3。除非 另有说明,否则查询序列的长度为至少45个核苷酸,并且GAP分析在至 少45个核苷酸的区域内对两个序列进行比对。优选地,查询序列的长度 至少为150个核苷酸,并且GAP分析在至少150个核苷酸的区域内对两 个序列进行比对。更优选地,查询序列的长度至少为300个核苷酸,并且 GAP分析在至少300个核苷酸的区域内对两个序列进行比对,或者在各 自的情况下为至少400、500或600个核苷酸。还可对例如由Altschul等, 1997公开的BLAST程序家族进行参照。对序列分析的详细讨论可见于 Ausubel等,1994-1998,第15章的第19.3单元。

当这样的序列的序列同一性为至少约98%,更特别地至少约98.5%, 相当特别地约99%,尤其是约99.5%,更尤其是约100%时,则认为核苷 酸或氨基酸序列“基本类似”,相当特别地是相同的。明显地,当RNA 序列被描述为与DNA序列基本类似或具有一定程度的序列同一性时,则 认为该DNA序列中的胸腺嘧啶(T)等于该RNA序列中的尿嘧啶(U)。

对于限定的多核苷酸,应当理解的是,高于上文提供的那些的%同一 性数值将涵盖优选实施方案。因此,当适用时,根据最小%同一性数值, 所述多核苷酸优选包含这样的多核苷酸序列,其与对应的指定SEQ ID  NO具有至少75%,更优选至少80%,更优选至少85%,更优选至少90%, 更优选至少91%,更优选至少92%,更优选至少93%,更优选至少94%, 更优选至少95%,更优选至少96%,更优选至少97%,更优选至少98%, 更优选至少99%,更优选至少99.1%,更优选至少99.2%,更优选至少 99.3%,更优选至少99.4%,更优选至少99.5%,更优选至少99.6%,更 优选至少99.7%,更优选至少99.8%,并且甚至更优选至少99.9%的同一 性。

在一些实施方案中,本发明涉及用于限定两个多核苷酸互补程度的杂 交条件严格性。本文使用的“严格性”指杂交期间的温度和离子强度条件 以及是否存在某些有机溶剂。严格性越高,靶核苷酸序列与经标记的多核 苷酸序列之间的互补程度越高。“严格条件”指在此条件下仅具有高频率 互补碱基的核苷酸序列将杂交的温度和离子条件。本文使用的术语“在低 严格性、中严格性、高严格性或非常高的严格性条件下杂交”描述了用于 杂交和洗涤的条件。用于进行杂交反应的指导可见于Current Protocols in  Molecular Biology,John Wiley和Sons,N.Y.(1989),6.3.1-6.3.6中,其通 过引用并入文本。本文提及的具体杂交条件如下:1)低严格性杂交条件: 在约45℃的6X氯化钠/柠檬酸钠(SSC)中,然后在50℃至55℃下用0.2 X SSC、0.1%SDS洗涤两次;2)中严格性杂交条件:在约45℃的6X SSC 中,然后于60℃下用0.2X SSC、0.1%SDS洗涤一次或更多次;3)高严 格性杂交条件:在约45℃的6X SSC中,然后于65℃下用0.2X SSC、0.1% SDS洗涤一次或更多次;4)非常高严格性杂交条件:65℃的0.5M磷酸 钠,7%SDS,然后于65℃下用0.2X SSC、1%SDS洗涤一次或更多次。

本文使用的“嵌合基因”或“遗传构建体”指不是在其天然位置中的 天然基因的任何基因,即已对其进行人工改造,包括被整合到小麦基因组 中的嵌合基因或遗传构建体。一般地,嵌合基因或遗传构建体包含在自然 界中不一起存在的调控序列和转录序列或蛋白质编码序列。因此,嵌合基 因或遗传构建体可包含来自不同来源的调控序列和编码序列,或来自相同 来源但以与自然界中存在的方式不同的方式排列的调控序列和编码序列。 术语“内源性”在本文中用于指与所研究植物(优选小麦植物)处于相同 发育阶段的未经改良植物中正常产生的物质。“内源基因”指在生物体基 因组内(优选在小麦植物内)其天然位置中的天然基因。本文使用的“重 组核酸分子”指已通过重组DNA技术构建或修饰的核酸分子。术语“外 来多核苷酸”或“外源多核苷酸”或“异源多核苷酸”等指通过实验操作 被引入细胞基因组(优选小麦基因组)中但不天然存在于该细胞中的任何 核酸。这些包括该细胞中存在的基因序列的修饰形式,只要被引入的基因 包含相对于天然存在基因的一些修饰,例如引入突变或存在可选择标记基 因即可。外来或外源基因可以是插入非天然生物体中的自然界中存在的基 因、被引入天然宿主内新位置中的天然基因或嵌合基因或遗传构建体。“转 基因”为通过转化方法引入基因组内的基因。术语“遗传修饰”包括将向 细胞中导入基因、突变细胞中的基因以及改变或调节已经历这些作用的细 胞或生物体或者其后代中的基因调控。

将启动子或增强子元件“有效连接”至可转录多核苷酸意指将可转录 多核苷酸(例如,蛋白质编码多核苷酸或其他转录物)置于启动子的调节 控制之下,随后所述启动子控制该多核苷酸的转录。在构建异源启动子/ 结构基因组合时,一般优选将启动子或其变体置于距离可转录多核苷酸转 录起始位点的一定距离处,该距离大约与该启动子与在其天然情况下受其 控制的基因(即,该启动子来源的基因)之间的距离相同。如本领域中所 众所周知的,对该距离进行一些改变是可容忍的且不丧失功能。

对于谷类植物,本文使用的术语“萌发”指吸涨后胚根鞘从种皮长出。

种子的“萌发率”指在吸涨开始后的一段时间内,例如多至21天, 或者在1至10天的时间内群体中已萌发种子的百分数。可在数天内每日 对种子群进行测定以确定随时间变化的萌发百分数。本发明的某些方面涉 及改变或调节种子的萌发率。这种改变/调节在种子的寿命内可以是瞬时 的。例如,当与收获时的相应非转基因植物的种子相比较时,刚收获后的 本发明转基因植物的种子可具有改变的萌发率;然而,在筒仓中储存六个 月后,与在筒仓中储存六个月后的相应非转基因植物的种子相比时,本发 明之相同转基因植物的种子可具有相同的萌发率,或反之亦然。换而言之, 在种子寿命中的一些点,当与已暴露于相同条件的合适对照(非转基因或 野生型等)相比较时,其将具有改变的萌发率。

本文使用的术语“休眠”指有活力的完整植物种子在特定的有利条件 下(特别是在温度方面和在水分存在下)不能萌发。休眠是一个定量性状。 对于大麦和小麦,如果在20℃下,低于90%的有活力完整种子在吸涨开 始后7天后萌发,则认为植物的种子是休眠的。本领域公知的,有活力的 种子是在打破休眠例如在室温或热处理下储存一段时间(数周或数月)后 能够萌发的那些。

本文使用的术语“非休眠”指植物种子在特定有利条件下萌发的能力。 对于大麦和小麦,如果在20℃下,至少90%的有活力完整种子在吸涨开 始后7天后萌发,则认为植物的种子是非休眠的。

本文使用的术语“核酸扩增”指用于利用DNA聚合酶增加核酸分子 拷贝数的任何体外方法。核酸扩增导致核苷酸被并入到DNA分子或引物 中,由此形成与DNA模板互补的新DNA分子。新形成的DNA分子可用 作模板来合成另外的DNA分子。

本发明包括多种转基因植物的产生。这些包括,但不局限于具有由本 发明小麦植物表现的一种或更多种理想性状的植物。

用于产生上述转基因植物的核酸构建体可容易地利用标准技术产生。 核酸构建体一般包含一个或更多个调控元件,例如启动子、增强子以及转 录终止或多腺苷酸化序列以确保编码目的mRNA的基因的适当表达。这 些元件在本领域中是众所周知的。包含调控元件的转录起始区可提供植物 中的调控型表达或组成型表达。调控元件可选自,例如,种子特异性启动 子或对种子细胞不具有特异性的启动子(例如泛素启动子或CaMV35S或 增强的35S启动子)。用于本发明的种子特异性启动子的实例包括,但不 局限于小麦低分子量麦谷蛋白启动子(Colot等,1987)、小麦种子中表达 α-淀粉酶的启动子(Stefanov等,1991)和大麦醇溶蛋白启动子(Brandt 等,1985)。启动子可受到诸如温度、光或胁迫的因素的调控。一般而言, 可在待表达遗传序列的5’提供调控元件。构建体还可包含增强转录的其他 元件,例如nos 3’或ocs 3’多聚腺苷酸化区或转录终止子。

一般地,核酸构建体包含可选择的标记。可选择标记有助于鉴定和筛 选已转化有外源核酸分子的植物或细胞。可选择标记基因可为小麦细胞提 供抗生素或除草剂抗性,或允许利用底物,例如甘露糖。可选择标记优选 赋予小麦细胞潮霉素抗性。

优选地,所述核酸构建体被稳定地并入植物的基因组中。因此,所述 核酸包含允许分子被引入基因组中的合适元件,或所述构建体位于可被并 入到植物细胞染色体中的合适载体中。

本发明的一个实施方案包括重组载体,其包含至少一个被插入到能够 递送核酸分子至宿主细胞中的任何载体中的本发明多核苷酸分子。这种载 体包含异源核酸序列,即在天然情况下非邻近本发明核酸分子存在的核酸 序列,并且优选来源于除所述核酸分子所来源的物种之外的物种。所述载 体可以是RNA或DNA,真核的或原核的,并且一般为病毒或质粒。

本发明的另一个实施方案包括重组细胞,其包括用本发明的一个或更 多个重组分子转化的宿主细胞。可通过能够将核酸分子插入到细胞中的任 何方法来实现将核酸分子转化到细胞中。转化技术包括,但不限于转染、 电穿孔、显微注射、脂转染(lipofection)、吸附和原生质体融合。重组细 胞可保持单细胞的,或者可生长成组织、器官或多细胞生物体。本发明的 转化核酸分子可保持在染色体外,或者可整合到转化(即,重组)细胞之 染色体中的一个或更多个位点上,以这样的方式使得其被表达能力得以保 留。优选的宿主细胞为植物细胞,更优选谷类植物细胞,更优选大麦或小 麦细胞,甚至更优选小麦细胞。

优选地,转基因植物为谷类植物。谷类植物的实例包括,但不限于小 麦、大麦、高粱、燕麦和黑麦。更优选地,谷类植物为小麦或大麦。在另 一优选实施方案中,谷类植物不是水稻。

如本发明的上下文中所限定,转基因植物包括已用重组技术进行了遗 传修饰的植物及其后代。一般地,这将调节本文中限定的至少一种多肽在 期望植物或植物器官中的产生。转基因植物部分包括所述植物的全部部分 和细胞,例如培养组织、愈伤组织和原生质体。转化的植物包含有在转化 前其不包含的遗传物质。优选地,所述遗传物质被稳定地并入到植物的基 因组中。该被引入的遗传物质可包含天然存在于相同物种中但以重排的顺 序或以不同的元件排列的序列,例如反义序列。这些植物均包含在本文的 “转基因植物”中。“非转基因植物”是未通过重组DNA技术引入遗传 物质而进行遗传修饰的植物。在一个优选实施方案中,所述转基因植物对 已引入的每个基因(转基因)均是纯合的,从而使其后代对于期望表型不 分离。

存在数种用于将外来遗传物质引入到植物细胞中的技术。所述技术包 括加速包被到微粒上的遗传物质直接进入细胞中(参见,例如US  4,945,050和US 5,141,131)。可利用农杆菌技术对植物进行转化(参见, 例如US 5,177,010、US 5,104,310、US 5,004,863、US 5,159,135)。还利用 电穿孔技术来转化植物(参见,例如WO 87/06614、US 5,472,869、US  5,384,253、WO 92/09696和WO 93/21335)。不仅用于转化植物的多种技 术可以不同,与外来基因接触的组织类型也可不同。所述组织将包括,但 将不局限于胚胎发生组织、I型和II型愈伤组织、下胚轴、分生组织等。 可利用本文所述的合适技术在发育和/或分化期间对几乎所有的植物组织 进行转化。

适用于稳定转染植物细胞或适用于构建转基因植物的多种载体已在 例如Pouwels等,Cloning Vectors:A Laboratory Manual,1985,supp.1987; Weissbach和Weissbach,Methods for Plant Molecular Biology,Academic  Press,1989;和Gelvin等,Plant Molecular Biology Manual,Kluwer  Academic Publishers,1990中进行了描述。一般地,植物表达载体包含, 例如,受5’和3’调控序列转录控制的一个或更多个克隆的植物基因和显 性可选择标记。这些植物表达载体还可包含启动子调控区(例如控制诱导 型或组成型表达、环境或发育调控型表达,或者细胞或组织特异性表达的 调控区)、转录起始位点、核糖体结合位点、RNA加工信号、转录终止位 点和/或多腺苷酸化信号。

可采用数种方法中的任何来确定转化植物的存在。例如,可利用聚合 酶链式反应(PCR)来扩增转化植物所特有的序列,并通过凝胶电泳或其 他方法检测扩增产物。可利用常规方法从植物中提取DNA并使用将区别 转化和未转化植物的引物进行PCR反应。例如,可设计将从读入构建体 中的转化载体中扩增DNA区的引物,并根据目的基因设计反向引物。如 果植物已得到成功转化,那么这些引物则将仅扩增片段。用于确定阳性转 化株的一种替代方法是通过本领域中公知的Southern印迹杂交。还可对 被转化的植物进行鉴定,即与未转化植物或野生型植物的区别在于其表 型,例如由存在的可选择标记基因赋予的表型,或所期望种子休眠赋予的 表型。

用于转化谷类植物(例如小麦和大麦)从而通过引入外源核酸来将遗 传变化引入植物中的方法和用于由原生质体或未成熟植物胚再生植物的 方法在本领域中是公知的,参见例如Wan和Lemaux(1994);Tingay等, (1997);加拿大专利申请No.2,092,588;澳大利亚专利申请No 61781/94; 澳大利亚专利No 667939;美国专利No.6,100,447;国际专利申请 PCT/US97/10621;美国专利No.5,589,617;美国专利No.6,541,257,并 且其他方法在专利说明书WO99/14314中进行了阐述。优选地,通过根癌 农杆菌(Agrobacterium tumefacien)介导的转化方法产生转基因小麦或大 麦植物。可将携带期望核酸构建体的载体引入到组织培养植物或外植体的 可再生小麦细胞,或合适的植物系统(例如原生质体)中。

优选地,所述可再生小麦细胞来自未成熟胚、成熟胚的小盾片、来源 于这些的愈伤组织或分生组织。

在经典的育种过程中,标记辅助筛选是用于在与轮回亲本回交时筛选 所需杂合植物的公认方法。每个回交代中的植物群将对目的基因是杂合 的,在回交群中通常以1∶1比例存在,并且分子标记可用于区分该基因的 两个等位基因。通过从例如嫩芽中提取DNA并用特异性标记测试渗入的 理想性状来对用于进一步回交的植物进行早期筛选,同时将精力和资源集 中于较少数植物上。为了进一步加快回交过程,可将未成熟种子(开花后 25天)的胚切除,并使其于无菌条件下在营养培养基上生长,而不是允 许饱满种子成熟。

本领域中已知的能够检测Rht-B1等位基因的任何分子生物技术均可 用在本发明的方法中。这样的方法包括,但不局限于利用核酸扩增、核酸 测序、核酸与经适当标记的探针杂交、单链构象分析(SSCA)、变性梯度 凝胶电泳(DGGE)、异源双链分析(HET)、化学切割分析(CCM)、催 化核酸切割或其组合(参见,例如Lemieux,2000;Langridge等,2001)。 本发明还包括利用分子标记技术来检测与Rht-B1等位基因相连锁的多态 性。这样的方法包括检测或分析限制性片段长度多态性(RFLP)、RAPD、 扩增片段长度多态性(AFLP)和微卫星(简单序列重复,SSR)多态性。 这些紧密连锁的标记可容易地通过本领域中公知的方法获得,例如由 Langridge等综述的Bulked Segregant Analysis(2001)。

贯穿本说明书通篇,词语“包含”或变化形式例如“包括”或“含有” 将被理解为指包含所述要素、整体或步骤,或者要素、整体或步骤的组, 但不排除任何其他要素、整体或步骤,或者要素、整体或步骤的组。

本说明书中提及的所有公开文本均通过引用并入本文。本说明书中包 含的对文献、作用、材料、装置、条款等的讨论仅出于提供本发明之背景 的目的。在本申请的各项权利要求的优先权日之前,不应认为是承认这些 事物的任一或全部形成了现有技术基础的一部分,或者为澳大利亚或其他 地方存在的本发明相关领域中的公知常识。

除非上下文另外明确指出,否则本说明书中使用的没有数量词修饰的 和“所述/该”修饰的名词包括复数方面。因此,例如提及的没有数量词 修饰的名词包括单个以及两个或更多个;提及的没有数量词修饰的名词包 括单个以及两个或更多个;提及的“所述/该”修饰的名词包括单个以及 两个或更多个等。

尽管已总体上对本发明进行了描述,但是通过参考下述实施例将更容 易理解本发明,通过举例的方式提供这些实施例,并且不旨在做出限制。

实施例

实施例1.材料和方法

植物材料

高小麦品种Maringá(Rht-B1a)和Maringa遗传背景中的近等基因 矮化品系(Rht-B1c)的谷粒获自澳大利亚冬季谷类保藏中心(Australian  Winter Cereals Collection,Tamworth,NSW,Australia)。Maringá是 一种巴西面包小麦品种。近等基因矮化品系通过与Maringá中轮回筛选 的矮化等位基因进行七次回交(BC7)产生(Hoogendoorn等1988)。

Himalaya大麦和三种先前表征的矮化突变体衍生株描述于表1中。 植物种植在温室中的包含有基于堆肥的混合物的20cm盆中,提供有自然 光并且冬季月份期间昼长延长至14小时,或者种植在黑山(Black  Mountain)或金宁德拉试验站(Ginninderra Experimental Station)的田 间,两者均位于澳大利亚的堪培拉。

诱变

用于诱变大麦和小麦谷粒的方法为简化的先前使用的方法(Zwar和 Chandler,1995)。在4℃下过夜,使每种品系的1至2kg谷粒吸收两倍其 质量的水。将其转移至填充有水的2升量筒,并用加压空气充气8小时, 其中在4小时后更换一次新鲜水。然后,将谷粒用新鲜制备的溶解于0.1M 磷酸钾缓冲液pH 3.0中的1mM叠氮化钠孵育2小时,随后用流水充分 洗涤2小时、置于通风橱中干燥过夜并在处理的几天内播种到田间。

构建携带过度生长等位基因的衍生品系

对大麦过度生长等位基因进行回交、互交和远交以产生一组适用于细 化生理表征的品系。在grd2b或gse1n矮化背景中出现四个新的Sln1过 度生长等位基因,并且与WT回交两代以允许过度生长表型在高和矮化背 景中比较。通过PCR确定丢失的原始矮化等位基因。剩余的7个新Sln1 过度生长等位基因出现在Sln1d矮化背景中,并且这些中的4个(Sln1d.7、 Sln1d.8、Sln1d.9和TR103)始终遍及与WT回交的两代。

通过胚乳半粒(half-grain)产生α-淀粉酶

制备胚乳半粒并在有或无GA3(1μM)的情况下于22℃下温育0、 42或72小时。向每个样品添加1.5mL的10mm CaCl2溶液、均化半粒 并通过离心(20,000g,5分钟)使1mL的等份样品澄清。利用Megazyme α-淀粉酶(Ceralpha)方法分析上清液的α-淀粉酶活性。

评估谷粒休眠

以单行的方式将植物种植在田间,并每周检查穗两次以监测干燥程 度。当所有绿色均已从穗消失时,认为其是生理上成熟的,将其切下并带 到实验室。将穗放置于通风橱中48小时以促进最终干燥,特别是易于保 持潮湿的基部谷粒,然后手工脱粒。将谷粒放置于马尼拉纸信封(manila  envelope)中,并留在实验室环境中,持续不同的后熟时间。通过在低强 度荧光照明的条件下,在20℃环境下于湿滤纸上孵育每个品系的100个 谷粒来评价萌发。在孵育7天后,评估每个谷粒样品中的萌发百分数。在 这种情况下,萌发定义为胚根从种皮长出。在第一季节的实验中,很多谷 粒样品,尤其是来自高小麦植物的谷粒样品表现出低休眠,并且在后熟仅 13至19天后,存在大量萌发(至少50%的谷粒萌发)。一般对这些品系 不再进行测试。另一些谷粒样品在后熟13至19天后具有较低的萌发,并 且将这些谷粒在32至33天后再次测试,如果萌发仍然较低,在后熟48 至49天后,再次测试。在1(最低休眠)至4(最高休眠)的量表内给出 相对休眠得分。

在第二季节的实验中,休眠评估集中在半矮化和对照品系上,并从收 获开始每周确定萌发,直至休眠结束或直至后熟12周。谷粒休眠测试结 果的一个实例提供在图9中。将谷粒休眠的一个量度确定为在室温下使谷 粒群中的至少50%谷粒萌发的谷粒储存周数(也称为后熟),如通过前段 中所述的方法评估的。

大麦和小麦过度生长品系的胚芽鞘长度

在完全充分供应水的情况下,在12℃下12小时和在8℃下12小时的 每日温度方案中,于黑暗中生长21天后,确定小麦和大麦幼苗的胚芽鞘 长度。

在干燥条件下的深播发芽(emergence)

将谷粒样品播种在温室中的土壤的10cm深处(标准盆栽土)。初始 土壤含水量为12%至14%(w/w)。在不添加任何额外水以模拟田间的干 燥播种条件的情况下进行萌发、早期生长和幼苗建立直至第三叶长出。评 价产生发芽幼苗的谷粒的百分数和发芽时间。

叶伸长速率和GA剂量-响应曲线

方法在之前已进行了描述(Chandler和Robertson,1999)。利用4- 参数Hill方程将曲线拟合至数据点。

测量根长

在控制条件下和在田间生长的植物中评估根生长。在前者情况下,通 过扫描评估根长,而在田间时,则取出2m钻芯(core)并沿该钻芯以 10cm的间隔评估根数目。

DNA的PCR扩增和测序

通过Ellis等,2005的方法从大麦或小麦叶制备DNA。利用其中一个 引物对Rht-B1基因特异性的引物对(表2)扩增小麦序列。利用3’UT 区中的保守正向引物和对B基因序列特异性的反向引物扩增该基因的3’ 半。利用对Sln1、Spy1和Gse1基因特异性的引物PCR扩增大麦序列。 用Exosap-IT(Affymetrix)处理扩增的片段以除去引物,然后利用Big Dye  Terminator(Applied Biosystems)进行测序。

DNA序列

小麦Rht-A1a、Rht-B1a和Rht-D1b基因的序列及其编码的蛋白质分 别在登录号JF930277、JF930278和JF930281中。通过ClustalW对氨基 酸序列进行比对,并显示不同的氨基酸(图7)。矮化Maringa衍生株中 的Rht3-B1c基因的部分核苷酸序列示于SEQ ID NO.1中。

由Rht-B1c等位基因编码的Rht-B1c蛋白的序列示于SEQ ID NO.3 中。

大麦Sln1和Spy1基因的序列登录号分别为AK372064和AF035820。

实施例2.分离包含新Rht-B1等位基因的小麦突变体

按照实施例1中所述用叠氮化钠处理包含Rht-B1c等位基因的小麦品 种Maringá的谷粒,该等位基因导致严重植物矮化。将经诱变的谷粒播 种在田间并且允许所得M1植物自体受精。在成熟后,从M1植物收获M2谷粒。将M2种子播种在田间,或者以高密度播种在温室中的平板中(图 1),并在早期生长期间或者在田间成熟时筛选增加的高度。通过这些方法 筛选出约160万株M2植物。图1是示出了可多么容易地鉴定出突变体。 筛选出约400株植物,这些植物表现出提早的叶伸长速率或者其成熟植物 高度的范围为稍微高于矮化亲本品种Maringa(Rht-B1c)至与近等基因 Rht-B1a(野生型等位基因)植物一样高。这些是自体受精植物,后代植 物在控制条件下生长,并将与亲本植物(Rht-B1c)和野生型植物(Rht-B1a) 进行比较(图2)。将这些植物称为“过度生长突变体”,因为与亲本品种 相比,他们以增加的速率生长或生长到增加的成熟高度。

Rht-B1c等位基因中的矮化突变归因于Maringa的Rht-B1基因中的 2026bp插入物(Wu等,2011)。PCR测试揭示400株经筛选突变体植物 中约一半对该基因中插入物的存在呈阳性;这些植物均已保留了Rht-B1 基因。剩余的经筛选植物对PCR测定呈阴性并且似乎全部缺乏Rht-B1 基因,但是根据阳性PCR扩增产物,仍然存在由D基因组(Rht-D1)编 码的同源基因。在该后一组中,有很多具有不同的形态学改变和差的穗 (spike)能育性。他们可能表示Rht-B1基因以及不同量的侧翼染色体 DNA缺失。对这些缺失品系不进行进一步研究。

通过用PCR扩增基因区域来对139个各非缺失突变体中的Rht-B1 基因进行测序。鉴定出35个新的衍生Rht-B1c等位基因,每一个均为 Maringa中Rht-B1c等位基因的变体。将这些命名为Rht-B1c.1、Rht-B1c.2、 Rht-B1c.3等。将它们列于表3中。35个等位基因中的很多由包含相同特 异性突变的多个品系表示。在一些情况下,这些多个品系可以是同胞,而 在另一些情况下,他们必须表示独立的突变事件。总共有62个独立事件, 产生了35个等位基因。

这些突变体呈现出导致过度生长表型的三种不同类别的突变。在第一 类别中,10个等位基因包含Rht-B1基因中的提前翻译终止密码子。在大 多数情况下,突变体密码子为从TGG密码子(编码Trp)变成TGA密 码子(终止密码子)。在大麦中,DELLA中的提前终止密码子导致伸长的 细长表型和雄性不育。相比之下,除一个例外,这10个突变体小麦品系 的植物均生长至与高(野生型)等位基因系(isoline)相同或接近其的高 度,并且示出与野生型类似的能育性。可推测,那些突变体中A和/或D 基因组Rht-1蛋白的表达为B基因组无效突变基因提供了遗传补偿,并将 表型表达限制在“高”而非“细长”。那个例外,唯一的Rht-B1c.22代表 的植物(品系TR544)为半矮化的而非“高”。该表型可能归因于对这些 植物中突变的Rht-B1c.22基因的剪接发生了改变,从而产生具有不同框 内插入物的Rht-B1蛋白(下文所讨论的)。

第二类别包括对B基因组编码的Rht-B1蛋白的氨基酸替换。20个实 例列于表3中。关注将这20个替换与大麦中分离的DELLA替换突变体 进行比较(实施例5),参见图3。在这两个物种中,存在31个单氨基酸 替换,包括其中发生相同氨基酸改变的四个位点。还注意到,尽管是独立 的,但是在大麦和小麦内均出现了相同的突变,其中发现该相同突变位于 衍生自M2谷粒不同亚群的品系中的对应位置。

图3示意性地示出了突变体中相对于大麦和小麦蛋白质C端区域中 保守基序位置的氨基酸替换位点。观察结果,过度生长突变分布在整个C 端区域的部分,表明具有相当大的可能性改变了DELLA蛋白与相互作用 蛋白质伴侣的结合。

第三类的突变体包括5个等位基因,各个等位基因均包含对Rht-B1 区的突变,预测该突变涉及切除大部分Rht-B1基因中产生Rht-B1c等位 基因的插入物(表3)。这些等位基因都影响直接邻近于剪接供体和受体 位点的四个核苷酸之一。在包括Rht-B1c.22等位基因的一些情况下,并 基于使用的剪接预测软件,这些序列改变潜在地改变剪接的优选位点,从 而产生具有稍微更大或更小框内插入物的Rht-B1蛋白。推测这些剪接等 位基因产生较少的含有30氨基酸插入物的Rht-B1蛋白,和/或产生框内 插入物发生了改变的经修饰Rht-B1蛋白。通过用RT-PCR方法检测RNA 来获得剪接效率发生改变的实验证据。

实施例3.包含新Rht-B1等位基因的小麦突变体的表型测试

对包含新Rht-B1等位基因的小麦过度生长突变体的与田间实际应用 相关的多个性状进行测试以用于商业化生产小麦。测量成熟茎的长度、胚 芽鞘的长度和获自突变植物的谷粒的相对谷粒休眠并与对照植物进行比 较。数据包含在表4中。评估成熟植物在不同灌溉田条件(即灌溉良好) 下和不同季节中的茎长。在大多数情况下,获得四个独立的数据点并将利 用其计算表4中所示的平均值,平均值表示为相对于Rht-B1a植物的百分 数。不同的等位基因导致不同的茎长,其中一些实例(例如Rht-B1c.6、 c.8、c.21)为相当矮化的,而另一些(Rht-B1c.11、c.25、c.31)与Rht-B1a 等位基因系一样高。在大多数情况下,携带相同等位基因的品系之间的不 同很小。基于针对Rht-B1b等位基因系植物观察到的约为野生型(高)植 物高度之81%的半矮化植物,存在15个新的等位基因,这些基因导致类 似程度的矮化,例如为高的高度的75%至91%。

还测量突变植物的胚芽鞘长度,并计算为Rht-B1a植物平均胚芽鞘长 度的百分数。来自2至4个独立测量的平均值示于表4中。与针对茎长所 发现的相比,一个品系内胚芽鞘长存在更多不同。部分地,这可能与来自 田间和温室来源的谷粒之间的差异相关。在下一种植季节中,田间种植谷 粒可用于绝大多数品系,并且还进行胚芽鞘测量。预期这些将表现出较少 的不同。总而言之,茎长和胚芽鞘长度之间一般呈正相关。在相关性似乎 失效的一些情况下,需要进行进一步工作以评估差异的统计学显著性。

用收获自两个田间季节的谷粒来评估大多数突变品系谷粒的休眠。在 两个季节中,高和Rht-B1b Maringa等位基因系均表现出低的休眠,而 Rht-B1c等位基因系则具有相对高的休眠。不同的过度生长品系之间存在 相当大的相对谷粒休眠得分差异。一些品系与对照相比较的数据示于图9 中。特别关注的是提供合适半矮化植株高度并保留相当大的谷粒休眠的等 位基因,例如Rht-B1c.9、c.17、c.22、c.23、c.24、c.26、c.27。这些包括 目前被回交成优良品种的四个半矮化品系。

在田间于第三个季节测试多个品系。植株高度和休眠得分的数据示于 表8中。该结果在趋势上与之前两个季节一致,表明在标准萌发测试中(实 施例1),一些突变品系的谷粒需要显著更长的储存(“后熟”)以使50% 的谷粒萌发。尽管所述品系和对照之间的休眠趋势在季节之间相同,但是 任一品系的绝对数目在季节间有所不同。

实施例4.分离大麦的过度生长突变体

选择“Himalaya”大麦的三个矮化突变体作为初始材料以分离大麦 的过度生长突变体。每个突变体在涉及以下的基因中包含限定的单个核苷 酸替换:(i)GA生物合成,即编码GA3-氧化酶的Grd2;(ii)GA受体 “GID1”,由Gse1基因编码;和(iii)GA响应,即编码大麦中DELLA 蛋白的Sln1基因。用叠氮化钠处理各个矮化品系的谷粒、将其播种在田 间并允许自体受精从而产生M1种子。播种这些种子以产生M1植物,从 其收获M2谷粒。在第二叶期筛选所得的生长于土壤中的M2幼苗以获得 表现出比其矮化同胞生长更快的那些。从播种的总共约106个谷粒(表示 约50,000个M1穗)中收获三种不同类别的突变体。

与该申请最相关的第一类别包括22株与其矮化同胞相比生长更快的 植物。这些是完全能育的,而且其后代植物是一样的并表现出快速生长。 在各种情况下,通过对合适的PCR片段测序来确定原始矮化突变的存在。 由于存在的矮化突变,其叶伸长速率比预期更高。他们示出一定程度范围 内的生长增强,一些的叶伸长速率略微但显著快于其矮化亲本,而另一些 则与相应高野生型植物伸长的一样快或甚至略比其快(参见下文)。不同 过度生长突变体在成熟时的高度范围在矮化亲本和野生型之间至与野生 型一样高。

仅在Sln1d矮化背景中收获到的第二类别包括三株植物,这三株植物 均比其矮化同胞生长的更快,但仍保留一定程度的矮化性。在下一代中, 这些植物的后代由矮化植物和典型的伸长细长植物以约3∶1的比例组成。 进一步的分析(下文)表明他们包含新的sln1等位基因,其中第二突变 起基因内抑制Sln1d突变的作用。

在GA生物合成和GA受体矮化背景下观察到的第三类别由典型的伸 长细长突变体组成。这些容易地通过其独特的高度伸长的表型和浅绿色, 以及其移植后的高度伸长的茎和能育性而被识别。该类突变体是预期到 的,因为伸长的sln1无效等位基因对GA生物合成或GA受体功能中的 缺陷是上位的(Chandler和Robertson,1999)。

实施例5.鉴定大麦突变和遗传连锁研究

由Sln1d矮化背景(上文的第二类别)中的三种分离品系的细长植物 制备DNA,并对Sln1基因进行测序。各种品系植物的Sln1基因中均包 含不同的新突变,从而产生开放阅读框(ORF)内的提前翻译终止密码子。 新的突变等位基因为Sln1d的衍生物,并因而将其命名为Sln1d.1、Sln1d.2、 Sln1d.3(表1)。它们表示新的等位基因内突变,其中第二突变将Sln1d 矮化基因座改变成典型的功能丧失的伸长sln1等位基因。不对这些植物 进行进一步研究。

对各个过度生长突变体(上文的第一类别)中的完整Sln1基因进行 测序以证实Sln1d等位基因仍然存在,并确定该基因中是否发生其他突 变,因为其是可导致过度生长表型之新突变的数个候选基因之一。在22 株植物的20株中均发现Sln1 ORF的新突变。这些突变限定了Sln1基因 的11个新等位基因。一些植物携带相同的突变,并且可能是同胞植物。7 个新Sln1过度生长等位基因发生在Sln1d矮化背景中,因而是包含基因 内抑制突变的等位基因。将其命名为Sln1d.4至Sln1d.10。三种突变发生 在grd2b背景中(sln1m、sln1o、sln1s),一种发生在gse1n背景中(sln1n)。 各个新等位基因与其亲本等位基因的不同之处均在于导致SLN1蛋白序 列中发生单氨基酸替换的单核苷酸替换。所获得的氨基酸替换列于表1 中(TR品系)。它们均发生在对应于GRAS结构域的SLN1蛋白的C端 60%中,并且它们所有均对应于上文所述小麦突变体中的类似突变。观察 到两个相同的突变事件,其均导致G829A氨基酸替换,一个发生在Sln1d.7 突变群中,而另一个发生在sln1s群中。这些均是独立的突变事件,因为 前者为Sln1d等位基因的衍生物,而后者发生在grd2b矮化背景中的野生 型Sln1基因中。

剩余的两个过度生长品系(TR26、TR103)缺乏Sln1 ORF中的任何 新突变,并且潜在地表示另一些基因中的突变。它们均发生在Sln1d矮化 背景中。将这些品系和作为阳性对照的携带Sln1d.5的Himalaya杂交以 评估Sln1d矮化等位基因和新过度生长等位基因之间的遗传连锁。来自对 照WT×Sln1d.5杂交的F2群的最大叶伸长速率表现出预期的3∶1 (Sln1d.5∶WT)分配。不存在具有Sln1d亲本之缓慢生长速率的F2个体, 表明在该相对小的群体中原始矮化突变和第二过度生长突变之间完全连 锁。因而,该第二突变为基因内抑制突变。在TR103×WT F2群中观察到 类似的结果,表明TR103中的过度生长突变与Sln1d完全连锁。相比之 下,TR26×WT F2群中包括大部分与Sln1d具有相同的生长速率的幼苗, 约25%与WT具有相同的生长速率,而一些幼苗具有中间生长速率。这 些结果与TR26中的过度生长突变一致,其位于不与Sln1连锁的基因中。

对TR26中的一些其他候选GA信号传导基因进行测序。GA受体 (Gse1)和两个F-盒候选基因的序列与野生型中的相同,但是Spindly1 的序列显示导致SPY1的第六TPR基序中发生氨基酸替换的单核苷酸替 换(spy1a,表1)。在拟南芥中,该区域对SPY活性是重要的,因为其包 含几个突变等位基因(Silverstone等,2007)。SPY1编码GA信号传导的 负调节蛋白,其最初在拟南芥中被鉴定出,但随后显示,大麦(Robertson 等,1998)和水稻(Shimada等,2006)中存在功能相关的基因。

总之,这22个大麦过度生长突变体表示13个独立的突变事件。这些 中的11个为导致SLN1中单氨基酸替换的新Sln1等位基因。第12个为 与Sln1紧密连锁,但位于未鉴定区域中,可能是启动子突变,而第13个 为非连锁基因Spy1中的新等位基因。

实施例6.包含新Sln1等位基因的大麦的叶伸长速率

标准条件下由第一叶获得的最大日伸长速率(LERmax)为GA响应 的可靠度量(Chandler和Robertson,1999),因而针对所有大麦过度生长 品系及其亲本进行测定(表5)。虽然与其各自的矮化亲本相比,这13种 原始过度生长品系全部均具有显著更高的LERmax值,但是生长提高的程 度以等位基因依赖性方式变化。在其原始的矮化遗传背景中以及与高WT 背景回交后的两种情况下,对三个过度生长等位基因(sln1m、sln1n和 sln1s)进行比较。矮化背景中的生长速率始终较低,表明过度生长等位基 因仍然具有因为GA生物合成或GA受体功能受损导致的降低的GA信号 传导。在野生型背景中,过度生长等位基因趋向于提高生长速率。

实施例7.通过胚乳半粒产生α-淀粉酶

通过野生型大麦胚乳半粒产生α-淀粉酶依赖于活性GA的存在。因 此,监测不存在活性GA时的α-淀粉酶活性提供了对突变体中“基础” GA信号传导的方便测量。与基础水平相比,与GA3孵育72小时后,具 有正常GA敏感性的两个对照品系(WT,grd2b)的α-淀粉酶活性增加了 接近15倍(表5)。当检测过度生长突变体及其矮化亲本时,成熟胚乳半 粒中的初始α-淀粉酶活性量非常低,但与其矮化亲本相比,一些过度生 长品系(Sln1d.4、Sln1d.7、Sln1d.8、Sln1d.9;Sln1d、spy1a;grd2b、sln1m; grd2b、sln1o;grd2b、sln1s)在孵育后表现出增加的α-淀粉酶产生,而 另一些(Sln1d.5、Sln1d.6、Sln1d.10;gse1n、sln1n)则没有。在Sln1d 的过度生长衍生物中,Sln1d.9衍生物是例外的,其在孵育42小时和72 小时时均积累很高水平的α-淀粉酶,但是该品系仅表现出对生长速率的 适度恢复(表5)。

实施例8.与过度生长等位基因相关的其他性状

在生长期间和成熟时,除总体高度不同之外,过度生长品系植物的外 观均接近正常。Sln1d的9个过度生长衍生株的高度有所不同,但在成熟 时没有一个与野生型一样高。过度生长品系的胚芽鞘长度总体上根据 LERmax值和最终植株高度而变化。

过度生长突变大麦植物的一个一般特征是其产生比其矮化亲本大的 谷粒。在不同生长季节的不同收获物中,谷粒大小一般介于矮化亲本(谷 粒质量约40mg)和高野生型(谷粒质量约55mg)之间。然而,在成熟 时与野生型一样高的过度生长品系中有几个具有可观地更大的穗和谷粒。 在不同的温室代中,grd2b和sln1m的谷粒平均比grd2b矮化亲本的谷粒 大40%。当与Himalaya背景回交时,观察到谷粒重量平均增加20%, 当与商业化品种Sloop远交时,观察到BC2材料中增加了15%。当获得 Sloop的BC3姐妹品系时,进行全面分析。

实施例9.对一些最佳标记的描述

可将小麦或大麦中的新Rht-B1c等位基因引入到育种过程中,并随后 使用该过度生长等位基因的普通最佳标记进行标记辅助的筛选。例如,对 于小麦,这包括两个引物之间的PCR扩增,其中一个在Rht-B1c基因的 2062bp插入物中,而另一个在该插入物的外部,例如在Rht-B1编码区中。 合适产物的扩增仅在模板DNA来自包含至少一个拷贝的过度生长基因的 植物材料时发生。这些中的两个实例提供在表2中。利用这些扩增产物可 容易地将来源于Rht-B1c的新等位基因与其他半矮化等位基因Rht-B1b和 Rht-D1b半矮化基因区别开来。可容易地通过利用Rht-B1c中位于插入位 点侧翼的引物对来产生针对除Rht-B1c等位基因或其衍生等位基因之外 的Rht-B1基因的标记。

实施例10.将所选的等位基因与其他小麦品种回交

上述大麦中杂交研究表明突变Rht-B1等位基因与过度生长表型之间 具有100%共遗传性(coinheritance)。在小麦中进行两个杂交实验。在第 一个中,6个过度生长品系的植物与Rht-B1b等位基因(半矮化)纯合的 Maringa杂交,并且另外4个品系的植物与对野生型Rht-B1a等位基因 (高)纯合的Maringa杂交。使F1后代自交以产生F2植物。在任何情 况下,在F2代中均未检测到任何矮化(纯合Rht-B1c)植物的存在,表 明对于10个品系中的每一个,在新Rht-B1等位基因和过度生长表型之间 观察到100%遗传连锁,并且新的突变抑制矮化性在基因Rht-B1中而非 在该基因组中的其他地方。在与Rht-B1b的杂交中,F2后代中的过度生 长等位基因和Rht-B1b显示出预期的遗传模式,即1∶2∶1纯合∶杂合∶纯 合比例。在一个杂交中,观察到过度生长亲本(品系TR550,Rht-B1c.8) 明显矮小于Rht-B1b,并且F2群的高度(纯合过度生长=65cm,杂合=80 至85cm,纯合Rht-B1b=95至100cm)之分离比例不与1∶2∶1显著不同, 表明该表型由单基因差异决定。重要的是,该适度矮化的过度生长等位基 因与品系TR550的高休眠相关。此外,来自田间种植F2植物的F3谷粒 群显示Rht-B1c.8纯合的F2植物具有高休眠,Rht-B1c.8/Rht-B1b杂合的 F2植物具有中等休眠,而Rht-B1b纯合的F2植物具有低休眠。该结果表 明该过度生长等位基因决定杂交后的高度和休眠表型两者。

与Maringa Rht-B1a杂交的4个品系为命名为544、612、705和791 (表4)的品系,其分别包含Rht-B1等位基因Rht-B1c.22、RhtB1c.23、 Rht-B1c.24和Rht-B1c.26。在各种情况下,在F2代中均观察到预期的基 因型分离比例。过度生长等位基因纯合的F2植物表现出预期的高度降低 和增强的休眠,表明可将突变Rht-B1等位基因杂交成其他遗传背景并保 留表型效应。这还表明由突变Rht-B1等位基因导致的两个表型(即半矮 化植物高度和增强的休眠)的遗传连锁。

在第二个实验中,通过回交将所选的过度生长等位基因引入到优良的 育种品系中,意图用新的过度生长等位基因替换其现有的半矮化基因 (Rht-B1b或Rht-D1b)。这样做是为了将成熟时的半矮化高度表型与其他 有益性状例如经改良的发芽和更高的谷粒休眠水平结合。使用作为花粉供 体的品系544、612、705和791之植物进行与10个不同优良小麦品种植 物的杂交,所述优良小麦品种为Crusader、EGA Gregory、Espada、 Lincoln、Magenta、Yitpi、Young、KWS Chasmin、KWS Scirocco、McNeal 和Outlook。F1谷粒从所有的杂交获得,并将三个供体等位基因播种以用 于进一步与轮回亲本回交。PCR标记用于证实F1植物是杂种。4个供体 中有一个略高于具有Rht-B1b的植物,而四个供体中有3个的高度彼此之 间以及与具有Rht-B1b的植物(半矮化)均非常类似。比Rht-B1b略微更 矮化并且具有优异谷粒休眠的一个或两个另外的等位基因包含在杂交试 验中,例如Rht-B1c.3和/或Rht-B1c.17。

讨论

在诱变包含严重矮化等位基因的矮化品种后分离大麦和小麦的过度 生长突变体。目的突变体保留了导致亲本品种严重矮化的突变,但由于在 同一Rht-B1或Sln1基因中新诱导的突变却比亲本植物生长得更快。他们 以增强的GA信号传导为特征,但是增强的程度对所考虑的等位基因和 GA响应两者都是特异的。该结果表明Della基因(大麦中的Sln1,小麦 中的Rht-B1)为最经常发生过度生长突变的位点。仅在一种情况下涉及 到一个不同的基因,即在大麦中,过度生长突变体归因于Spy1中的新突 变。

5个独立品系的证据支持以下结论:本文鉴定的Della基因中的新突 变导致过度生长表型,而不是非连锁突变或不同基因中的突变,或者简单 地为用诱变剂处理的一般结果。第一,对于13个大麦突变体中的每一个, 对约与Sln1具有相同长度的“对照”基因(Gse1)进行测序,并且在任 何情况下,均未检测到碱基改变。第二,观察到的突变几乎都是(31个 突变体中有30个)G至A的替换,假定C至T表示相反DNA链上的G 至A,则与之前在另一些基因座处对叠氮化物诱导的突变体的观察结果类 似,所述基因座包括Gse1(GA受体)、Sln1、GA生物合成和淀粉生物 合成的基因。遗传密码的冗余性预测到对于随机的G至A改变,33%将 不具有相应的氨基酸替换。不过,在超过90个新诱导的突变体中,未观 察到一个沉默核苷酸替换的情况,每个突变体均包含在这些不同大麦基因 的开放阅读框中的突变。这种不存在表明突变仅在氨基酸改变损害蛋白质 功能,导致表型改变时获得。第三,鉴定的突变几乎总是涉及保守的氨基 酸残基。例如,除仅有的两个或三个例外之外,谷类物种和分类学上远距 的拟南芥之间的DELLA突变涉及相同的氨基酸残基。这可见于图8中, 其示出了对小麦Rht-B1a和拟南芥GAI蛋白的比对,并显示出两个序列 之间保守的相同氨基酸。与改变保守性差的残基相比,替换高度保守的氨 基酸残基将更可能导致蛋白质活性的功能破坏。第四,在大麦中、大麦和 小麦之间以及小麦中,独立的诱变处理提供了相同突变的实例,并因而诱 导相应的相同氨基酸替换。第五,在杂交和随后的分离之后,在完成连锁 研究时,在突变表型和突变基因序列之间总是观察到100%连锁。

过度生长等位基因增强GA信号传导,因而最可能降低DELLA蛋白 的量或其功能活性,后者可能涉及其与另一些蛋白质的相互作用。在差别 剪接的一些情况下,仍然可能产生具有不同框内氨基酸插入物的DELLA 蛋白。例如,突变体偶然产生比Rht-B1c蛋白中的30氨基酸插入物更长 或更短的插入物。如果氨基酸替换导致对GA-GID1复合物或F盒亚基具 有更强亲和力的话,则其可导致DELLA蛋白降解增加。随机改变不可能 增强蛋白质相互作用,但是利用有效的突变体筛选仍可获得极其罕见的事 件。之前通过抗体方法来尝试确定DELLA蛋白在小麦植株不同部分中的 含量是不成功的(Pearce等,2011)。本发明人认为更可能的是按照上文所 述产生的突变DELLA蛋白对其他相互作用蛋白伴侣的亲和力降低。大量 的氨基酸替换发生在LHR1基序中,其为在拟南芥中涉及与PIF4和PIL5 相互作用的区域(de Lucas等,2008;Feng等,2008)。相对于大麦中的α- 淀粉酶产生,特定过度生长等位基因对生长的不同影响表明不同的 DELLA蛋白区与不同的蛋白伴侣相互作用以调控这两种响应。

未预期到的是,几乎所有经鉴定的过度生长突变均位于单个基因中, 尤其是已经被证明在控制和田间两种条件下对控制多种植物物种生长至 关重要的基因。DELLA编码基因的新等位基因在小麦和大麦两者中的优 势强调了该基因在控制生长方面的重要性。例如,在GA生物合成矮化的 过度生长衍生株中,不考虑分析的突变数目,未鉴定出可能增加活性GA 含量的突变,例如GA分解代谢基因的突变。在小麦中成功分离出很多新 的突变源于以下事实:由半显性等位基因(例如Rht-B1c)导致的矮化性 实际上是一种二倍体性状,仅涉及三个基因组中的一个。这使得能够筛选 多种丧失功能(相对于Rht-B1c)的衍生等位基因,其中很多涉及基因内 二次突变。

在两种物种中,获得农业上重要性状(即植株高度)的新等位基因。 此外,在另一些GA影响的性状中观察到一些变化,其中一些具有实际益 处。在无需补充GA的情况下,在大麦中同时观察到谷粒尺寸变大和α- 淀粉酶产生增加。认为这两个性状是有用的,例如分别用于改善早期幼苗 活力和改善制麦芽性能。大的小麦突变体集合包括矮化程度范围超过现有 Rht-1半矮化等位基因的矮化程度范围的突变体,预期其在将特定等位基 因靶向特定环境方面具有价值(Flintham等,1997)。还在具有实际重要 性的另一些GA性状中观察到大量变化,例如相对于Rht-1纯合的植物增 加的胚芽鞘长度和相对于Rht-B1a或Rht-B1b纯合的植物增加的谷粒休 眠。这些等位基因应该充当向育种品系中引入性状组的主要遗传决定簇, 所述引入过程通过可用于该基因的最佳分子标记加速。

DELLA基因在多种物种中是高度保守的。小麦Rht-B1a蛋白与拟南 芥GAI蛋白之间的序列比较示于图8中。可以看出,不同物种的这些蛋 白质序列之间存在大程度的同一性。重要的是,在小麦过度生长突变体中 发现的20个氨基酸替换中,除两个或三个之外,全部位于由小麦和拟南 芥基因编码的多肽之间的保守氨基酸中。这强烈地支持了在多种物种中, 位于DELLA蛋白中这些特定位置的残基对活性特别重要。

表1:大麦品系、基因型和突变

脚注

1坐标指在来自Himalaya的以ATG开始且以TGA结束的HvSln1编码序列或SLN1氨基酸 序列(Genbank登录号AK372064))中的位置。对于TR26,该坐标指在以ATG起始且以 TGA结束的HvSpy1(AF035820)编码序列或SPY1氨基酸序列中的位置。

2谷粒为来自在所示Sln1基因座处分离的杂合子的后代(纯合的伸长细长植物是不育的)。

3Sln1d.1至Sln1d.10为Sln1d的衍生物,其不仅包含所示新替换,还包含原始的Sln1d突变。 仅过度生长品系(Sln1d.4至Sln1d.10)可保持为纯合子。

4在筛选所示等位基因的纯合子之前,与Himalaya回交两次后所建立的品系。

表2:本文所用PCR引物的核苷酸序列(5’至3’)

表3:小麦品系、Rht-B1基因型和突变

表4:过度生长品系依赖于等位基因的表型

表5:大麦过度生长突变体的叶伸长速率和α-淀粉酶产生

表6:spy1a对生长速率和α-淀粉酶产生的影响

表7:大麦过度生长品系的胚芽鞘长度(mm)

品系 基因型 胚芽鞘长度(mm) Himalaya WT 100.3±1.6 M640 Sln1d 32.6±1.8 TR1 Sln1d.4 65.8±3.1 TR9 Sln1d.5 40.7±2.4 TR13 Sln1d.6 45.2±1.8 TR26 Sln1d,spy1a 50.9±1.0 TR56 Sln1d.7 60.7±2.1 TR60 Sln1d.8 80.7±2.5 TR100 Sln1d.9 66.9±1.7 TR103 - 58.5±1.5 TR107 Sln1d.10 44.6±2.0 M463 grd2b 62.4±2.2 TR216 grd2b,sln1s 84.1±1.7 TR261 grd2b,sln1m 96.4±3.5 TR305 grd2b,sln1o 104.4±2.0 M693 gse1n 72.0±1.5 TR407 gse1n,sln1n 89.7±1.5 M240 sln1m 123.3±2.7 M242 sln1n 119.8±2.3 M243 sln1s 112.9±4.6 M247 spy1a 101.6±2.5

表8:突变品系小麦植物相对于高品种(Rht-Bla等位基因)的植株高度和 谷粒休眠得分

*休眠得分计算为在萌发测试中,使50%谷粒萌发的谷粒储存周数。

参考文献

Achard et al.,(2009).J.Exptl Bot.60,1085-1092.

Arana et al.,(2011).Proc.Natl.Acad.Sci.USA.108,9292-9297.

Asano et al.,(2009).Mol.Genet Genomics 281,223-231.

Carol et al.,(1995Planta 197,414-417.

Chandler et al.,(1999).Plant Physiol.120,623-632.

Chandler et al.,(2002).Plant Physiol 129,181-190.

Chandler et al.,(2008).Mol.Plant.1,285-294.

de Lucas M et al.,(2008).Nature 451,480-484.

Dill et al.,(2004).Plant Cell 16,1392-1405.

Ellis et al.,(2005).TheorAppl Genet 111,423-430.

Feng et al.,(2008).Nature 451,475-479.

Flintham et al.,(1997).J.Agric.Sci.128,11-25.

Fu et al.,(2002).Plant Cell 14,3191-3200.

Griffiths et al.,(2006).Plant Cell 18,3399-3414.

Hartweck,(2008).Planta 229,1-13.

Hirano et al.,(2010).Plant Cell 22,2680-2696.

Hoogendoorn et al.,(1988).In Miller T.E.,Koebner,R.M.D.,Proceedings of the Seventh  International Wheat Genetics Symposium,Institute of Plant Science Research,Cambridge, U.K.,pp.1093-1100.

Ikeda et al.,(2001).Plant Cell,13,999-1010.

Kuppusamy et al.,(2009).Plant Mol.Biol.69,375-381.

Monna et al.,(2002).DNA Res.9,11-17.

Murase et al.,(2008).Nature 456,459-463.

Pearce et al.,(2011).Plant Physiol.DOI:10.1104/pp.111.183657.

Peng et al.,J(1999Nature 400,256-261.

Robertson et al.,(1998).Plant Cell 10,995-1007.

Sasaki et al.,(2002).Nature 416,701-702.

Sasaki et al.,(2003).Science 299,1896-1898.

Shimada et al.,(2006).Plant J.48,390-402.

Shimada et al.,(2008Nature 456,520-544.

Silverstone et al.,(1997).Genetics 146,1087-1099.

Silverstone et al.,(2007).Plant Physiol.143,987-1000.

Spielmeyer et al.,(2002).Proc Natl Acad Sci(USA)99,9043-9048.

Sun,(2010).Plant Physiol 154,567-570.

Ueguchi-Tanaka et al.,(2005).Nature 437,693-698.

Willige et al.,(2007).Plant Cell 19,1209-1220.

Wilson et al.,(1995).Plant Physiol 108:495-502.

Wolbang et al.,(2004).Plant Physiol 134,769-776.

Wu et al.,(2011)Plant Physiol DOI:10.1104/pp.111.185272.

Yamaguchi,(2008).Annu.Rev.Plant Biol.59,225-251.

Yamamoto et al.,(2010).Plant Cell 22,3589-3602.

Zwar et al.,(1995).Planta 197,39-48.

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号