首页> 中国专利> 改善植物中基因组工程化和再生的方法

改善植物中基因组工程化和再生的方法

摘要

该文件涉及用于真核细胞中的基因组工程化的方法和材料,以及尤其涉及用于通过一种或多种加强子多肽和加强基因与基因组工程化组分来提高基因组工程化(即转化或基因组编辑)效率的方法。

著录项

  • 公开/公告号CN112566924A

    专利类型发明专利

  • 公开/公告日2021-03-26

    原文格式PDF

  • 申请/专利权人 科沃施种子欧洲股份两合公司;

    申请/专利号CN201980053302.6

  • 发明设计人 孟玲;

    申请日2019-06-14

  • 分类号C07K14/415(20060101);C12N15/29(20060101);C12N15/82(20060101);C12N5/10(20060101);A01H4/00(20060101);A01H5/00(20180101);A01H5/10(20180101);A01H6/46(20180101);

  • 代理机构72002 永新专利商标代理有限公司;

  • 代理人左路;区斌

  • 地址 德国艾恩贝克

  • 入库时间 2023-06-19 10:22:47

说明书

技术领域

本文描述了新的再生加强子(booster)基因和多肽,以及用于真核细胞中基因组工程化的方法和材料,尤其是用于通过加强子多肽和加强基因与基因组工程化组分的递送来提高基因组工程化(即,转化或基因组编辑)效率的方法。

发明背景

传统育种已提供了驯养的植物和动物,而现代生物技术(尤其是基因组工程化)正在扩大育种能力,并实现仅传统近缘种的杂交无法实现的改善。利用生物技术,已将诸如高产、除草剂抗性和昆虫抗性的多种特性导入作物,导致全球农业和粮食安全的巨大进步。但是,此类生物技术产品中存在外来DNA会引发生物安全和环境问题。

通过分离出任何整合的DNA,基因组编辑技术可用于生成靶基因组的位点特异性修饰,无需在最终植物中存在外来DNA的。此外,通过瞬时表达,基因组编辑可涉及瞬时编辑活性,以产生位点特异性修饰,无需在过程的任何点进行DNA整合。基因组编辑的植物,特别是那些源自瞬时活性的植物,将与常规的基因组修饰植物有显着不同,并且可能不会作为经遗传修饰的(GM)植物受到监管。因此,基因组编辑技术(特别通过瞬时编辑方法)可以在农业中提供高准确、安全和强大的植物育种和开发工具。

然而,基于瞬时活性的基因组工程化面临更多挑战。与稳定转化相比,瞬时工程化通常会导致更少的修饰细胞。如果没有整合的可选择标记,鉴定工程化化的细胞并在再生植物中实现同种修饰(homogenous modification)是高度挑战的。这些挑战阻碍了瞬时基因编辑作为改良植物的育种工具的常规实施。因此,非常需要增强基因组工程化效率的新方法和材料。

发明内容

在一方面,提供了一种(再生)加强子多肽,其包含SEQ ID NO:2或48的氨基酸序列或与SEQ ID NO:2或48至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。

在另一方面,提供了编码包含SEQ ID NO:2或48的氨基酸序列,或与SEQ ID NO:2或48至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的加强子多肽的核酸。在一些实施方案中,编码包含SEQ ID NO:2的氨基酸序列、与SEQ IDNO:2至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的加强子多肽的核酸包含选自以下的编码序列:(i)包含SEQ ID NO:1的核苷酸序列的核酸;(ii)包含与SEQ ID NO:1至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸;和(iii)在严格杂交条件与(i)或(ii)中定义的核酸的互补链杂交的核酸。在一些实施方案中,编码包含SEQ ID NO:48的氨基酸序列或与SEQ ID NO:48至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的加强子多肽的核酸包含选自以下的编码序列:(I)包含SEQ ID NO:47的核苷酸序列的核酸;(II)包含与SEQ ID NO:47至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸;和(III)在严格杂交条件与(I)或(II)中定义的核酸的互补链杂交的核酸。

在另一方面,提供了包含编码包含SEQ ID NO:2或48的氨基酸序列,或与SEQ IDNO:2或48至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的加强子多肽的核酸的重组基因。在一些实施方案中,编码包含SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的加强子多肽的核酸包含选自以下的编码序列:(i)包含SEQ ID NO:1的核苷酸序列的核酸;(ii)包含与SEQ ID NO:1至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸;和(iii)在严格杂交条件与(i)或(ii)中定义的核酸的互补链杂交的核酸。在一些实施方案中,编码包含SEQ ID NO:48的氨基酸序列,或与SEQ ID NO:48至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的加强子多肽的核酸包含选自以下的编码序列:(I)包含SEQ ID NO:47的核苷酸序列的核酸;(II)包含与SEQ ID NO:47至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸;和(III)在严格杂交条件与(I)或(II)中定义的核酸的互补链杂交的核酸。

在一些实施方案中,所述核酸可操作地连接至异源启动子。所述异源启动子可以是强组成型启动子、组织特异性启动子、发育特异性启动子或诱导型启动子。

在另一方面,提供了一种DNA构建体,优选为载体,其包含任何上述核酸或重组基因。在一些实施方案中,所述核酸包含选自以下的编码序列:(i)包含SEQ ID NO:1或47的核苷酸序列的核酸;(ii)包含与SEQ ID NO:1或47至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸;和(iii)在严格杂交条件与(i)或(ii)中定义的核酸的互补链杂交的核酸。

在另一方面,提供了一种植物细胞,其包含上述加强子多肽、核酸、重组基因或DNA构建体,特别是作为转基因或作为异源多肽或异源核酸。在一些实施方案中,所述加强子多肽包含SEQ ID NO:2或48的氨基酸序列。在一些实施方案中,所述加强子多肽包含与SEQ IDNO:2或48至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。在一些实施方案中,所述核酸包含选自以下的编码序列:(i)包含SEQ ID NO:1或47的核苷酸序列的核酸;(ii)包含与SEQ ID NO:1或47至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸;和(iii)在严格杂交条件与(i)或(ii)中定义的核酸的互补链杂交的核酸。

还提供了一种植物、所述植物的部分、种子、胚胎或愈伤组织,其包含所述植物细胞。

在另一方面,提供了一种在植物细胞中进行遗传修饰的方法。所述方法包含(a)向植物细胞导入(i)上述所述加强子多肽、核酸、重组基因或DNA构建体中的任何一项;和(ii)转基因和/或基因组工程化组分;(b)任选地,在允许从所述核酸、所述重组基因或所述DNA构建体合成所述加强子多肽的条件下,培养所述植物细胞;和(c)任选地,在允许所述植物细胞的基因组在所述加强子多肽存在时通过感兴趣的转基因的整合和基因组工程化组分的活性进行遗传修饰的条件下,培养所述植物细胞。

在一些实施方案中,所述加强子多肽在植物细胞中瞬时存在、瞬时有活性和/或瞬时表达。在一些实施方案中,所述编码所述加强子多肽的核酸在植物细胞中瞬时存在、瞬时有活性和/或瞬时表达。

在在植物细胞中进行遗传修饰的方法的步骤(i)中,将选自PLT5多肽、PLT7多肽、RKD4多肽和RKD2多肽的另外一个或多个多肽,和/或选自编码PLT5多肽、PLT7多肽、RKD4多肽和RKD2多肽的核酸的一个或多个核酸,和/或适合于瞬时提高内源性PLT5多肽、内源性PLT7多肽、内源性RKD4多肽或内源性RKD2多肽的表达的一个或多个定点转录激活子,和/或编码这种定点转录激活子的核酸导入植物细胞。

在一些实施方案中,所述PLT5多肽或PLT7多肽在植物细胞中瞬时存在,瞬时有活性和/或瞬时表达,或编码所述PLT5多肽或所述PLT7多肽的核酸在植物细胞中瞬时存在,瞬时有活性的和/或瞬时表达。

在一些实施方案中,将所述加强子多肽或编码所述加强子多肽的核酸以及所述PLT5多肽或编码所述PLT5多肽的核酸一起导入或共同递送到所述植物细胞中,优选地同一个植物细胞,并任选地瞬时共表达。在一些实施方案中,将所述加强子多肽或编码所述加强子多肽的核酸以及所述PLT7多肽或编码所述PLT7多肽的核酸一起导入所述植物细胞中,并任选地瞬时共表达。

在一些实施方案中,所述PLT5多肽包含SEQ ID NO:4或6的氨基酸序列,或与SEQID NO:4或6至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,或编码PLT5多肽的核酸编码这种多肽。所述PLT7多肽包含SEQ ID NO:8或10的氨基酸序列,或与SEQ ID NO:8或10至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,或编码PLT7多肽的核酸编码这种多肽。在一些实施方案中,所述RKD4多肽包含SEQ ID NO:12、14或16的氨基酸序列,或与SEQ ID NO:12、14或16至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,或编码RKD4多肽的核酸编码这种多肽。在一些实施方案中,RKD2多肽包含SEQ ID NO:18、20或22的氨基酸序列,或与SEQ ID NO:18、20或22至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,或编码RKD2多肽的核酸编码这种多肽。

在一些实施方案中,编码PLT5多肽的核酸包含具有选自以下的编码序列的核酸:(i)包含SEQ ID NO:3或5的核苷酸序列的核酸;(ii)包含与SEQ ID NO:3或5至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸;和(iii)在严格杂交条件与(i)或(ii)中定义的核酸的互补链杂交的核酸。在一些实施方案中,编码PLT7多肽的核酸包含具有选自以下的编码序列的核酸:(I)包含SEQ ID NO:7或9的核苷酸序列的核酸;(II)包含与SEQ ID NO:7或9至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸;和(III)在严格杂交条件与(I)或(III)中定义的核酸的互补链杂交的核酸。在一些实施方案中,编码RKD4多肽的核酸包含具有选自以下的编码序列的核酸:(1)包含SEQ ID NO:11、13或15的核苷酸序列的核酸;(2)包含与SEQ IDNO:11、13或15至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸;和(3)在严格杂交条件与(1)或(2)中定义的核酸的互补链杂交的核酸。在一些实施方案中,编码RKD2多肽的核酸包含具有选自以下的编码序列的核酸:a)包含SEQ IDNO:17、19或21的核苷酸序列的核酸;b)包含与SEQ ID NO:17、19或21至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸;和c)在严格杂交条件与a)或b)中定义的核酸的互补链杂交的核酸。

在一些实施方案中,所述基因组工程化组分包含a)双链断裂(DSB)诱导酶或编码其的核酸,以及任选地修复核酸分子,其中所述DSB诱导酶优选地识别所述细胞的基因组中的预定位点;b)单链断裂(SSB)诱导酶或编码其的核酸,以及任选地修复核酸分子,其中所述SSB诱导酶优选地识别所述细胞的基因组中的预定位点;c)碱基编辑器酶,其任选地与解除武装的DSB诱导酶或SSB诱导酶融合,其中所述碱基编辑器酶优选地识别所述细胞的基因组中的预定位点;或d)影响DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化,组蛋白磷酸化、组蛋白核糖基化或组蛋白瓜氨酸化的酶,其优选地与解除武装的DSB诱导酶或SSB诱导酶融合,其中所述酶优选地识别所述细胞的基因组中的预定位点。

在一些实施方案中,包含DSB诱导酶或SSB诱导酶或其变体的基因组工程化组分是CRISPR/Cas内切核酸酶、CRISPR/Cas9内切核酸酶、CRISPR/Cpf1内切核酸酶、CRISPR/Csm1内切核酸酶、锌指核酸酶(ZFN)、归巢内切核酸酶、大范围核酸酶或TAL效应物核酸酶。

在一些实施方案中,步骤(b)中的基因组工程化组分的活性包含在植物细胞的基因组中诱导一个或多个双链断裂,在植物细胞的基因组中诱导一个或多个单链断裂,在植物细胞的基因组中诱导一个或多个碱基编辑事件,或在植物细胞的基因组中诱导一个或多个DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化,组蛋白磷酸化、组氨酸SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化。

在一些实施方案中,在诱导一个或多个双链断裂或一个或多个单链断裂之后进行非同源末端连接(NHEJ)和/或通过同源重组机制(HDR)对断裂进行同源性定向修复。

在一些实施方案中,步骤(a)(ii)中的转基因选自编码对非生物胁迫具有抗性或耐受性的基因,所述非生物胁迫包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、氮缺乏,磷缺乏、盐胁迫或涝渍,编码除草剂抗性的基因,所述除草剂抗性包括对草甘膦、草铵膦/草丁膦、潮霉素、原卟啉原氧化酶(PPO)抑制剂、ALS抑制剂和Dicamba的抗性,编码对生物胁迫具有抗性或耐受性的基因,所述对生物胁迫具有抗性或耐受性的基因包括病毒抗性基因、真菌抗性基因、细菌抗性基因、昆虫抗性基因,或编码与产量相关的性状的基因,所述性状包括倒伏抗性、开花时间、抗落粒性(shattering resistance)、种子颜色、胚乳组分或营养成分。

在一些实施方案中,在步骤(c)中,所述基因组的修饰选自i)置换至少一个核苷酸;ii)缺失至少一个核苷酸;iii)插入至少一个核苷酸;iv)DNA甲基化的改变;v)组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化,组蛋白磷酸化、组氨酸SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化的改变;或vi)i)-v)的任何组合。

在一些实施方案中,所述方法有效地促进细胞增殖或细胞再生,优选在遗传修饰/基因组的修饰之后有效地促进细胞增殖或细胞再生,或有效地提高转基因、基因编辑或碱基编辑的植物的再生的效率。

在一些实施方案中,所述方法有效地从单个细胞优选胚胎细胞、体细胞或原生质体,或从愈伤组织细胞诱导直接或间接的胚胎发生,优选地在遗传修饰/基因组的修饰之后。

在一些实施方案中,所述方法有效地提高转基因向植物细胞中的稳定转化效率或有效地提高转基因的植物的产生的效率。

在一些实施方案中,所述方法有效地提高了基因组工程化组分编辑植物细胞的基因组的效率或有效地提高转基因、基因编辑或碱基编辑的植物的产生的效率。

在一些实施方案中,所述方法有效地改善源自顽抗基因型的植物的再生效率,有效地改善非常规组织类型的植物的再生效率,或有效地加速再生过程,优选在遗传修饰/基因组的修饰之后。

在一些实施方案中,所述定点转录激活子或编码其的核酸包含至少一个识别结构域和至少一个激活结构域,其中所述定点转录激活子被配置为提高内源性PLT5多肽、内源性PLT7多肽、内源性RKD4多肽或内源性RKD2多肽的表达,优选地通过结合至位于与内源性PLT5多肽、内源性PLT7多肽、内源性RKD4多肽或内源性RKD2多肽的起始密码子一定距离的调控区域。

在一些实施方案中,所述至少一个识别结构域是选自以下的分子或其片段:至少一个TAL效应物、至少一个解除武装的CRISPR/核酸酶系统、至少一个锌-指结构域、和至少一个解除武装的归巢内切核酸酶或其任何组合。在一些实施方案中,所述至少一个解除武装的CRISPR/核酸酶系统选自CRISPR/dCas9系统、CRISPR/dCpf1系统、CRISPR/dCsm1系统、CRISPR/dCasX系统或CRISPR/dCasY系统或其任何组合,其中所述至少一个解除武装的CRISPR/核酸酶系统包含至少一个导向RNA。在一些实施方案中,所述至少一个激活结构域是酸性转录激活结构域,优选地,其中所述至少一个激活结构域来自稻白叶枯病黄杆菌的TAL效应物基因、来自单纯疱疹的VP16或四聚体VP64、VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。

在另一方面,提供了一种用于改善植物再生效率或提高植物细胞再生能力的方法,所述方法包含将上述加强子多肽、核酸、重组基因或DNA构建体中的任一项导入植物细胞。

在另一方面,提供了根据上述方法获得或可获得的经遗传修饰的植物细胞。还提供了一种植物或植物部分,其包含所述经遗传修饰的植物细胞。

在另一方面,提供了一种用上述加强子多肽、核酸、重组基因或DNA构建体中的至少一个包被的微粒。在一些实施方案中,所述微粒还被基因组工程化组分包被。

在另一方面,提供了一种用于通过微弹轰击对植物基因组进行遗传修饰的试剂盒,所述试剂盒包含(I)一个或多个微粒,和(II)包被微粒的工具。在一些实施方案中,所述试剂盒还包含用基因组工程化组分包被所述微粒的工具。

在另一方面,提供了一种生产经遗传修饰的植物的方法,其包含以下步骤:(a)根据上述方法遗传修饰植物细胞,和(b)从步骤(a)的修饰的植物细胞再生植物。

在一些实施方案中,所产生的植物不含有在步骤(a)中共同导入的基因组工程化组分、加强基因和加强子多肽中的任一项。

在另一方面,提供了一种通过上述用于生产经遗传修饰的植物的方法获得或可获得的经遗传修饰的植物或其部分,或其后代植物。

还提供了上述加强子多肽、核酸、重组基因、DNA构建体、微粒或试剂盒在改善植物再生效率或提高植物细胞再生能力中的用途。

附图说明

图1显示了加强基因表达载体pABM-BdEF1(SEQ ID NO:24)的图。BdEF1和nos-T分别定义了来自短柄草属(Brachypodium)EF1基因的强组成型启动子和nos终止子。BamHI和HindIII说明了克隆位点。

图2显示了玉米PLT5表达构建体pABM-BdEF1_ZmPLT5(SEQ ID NO:25)的图。玉米PLT5基因(ZmPLT5)由短柄草属(pBdEF1)的强组成型EF1启动子驱动。

图3显示了玉米PLT7表达构建体pABM-BdEF1_ZmPLT7(SEQ ID NO:26)的图。玉米PLT7基因(ZmPLT7)由短柄草属(pBdEF1)的强组成型EF1启动子驱动。

图4显示了KWS-RBP1表达构建体pABM-BdEF1-KWS-RBP1(SEQ ID NO:27)的图。KWS-RBP1基因由来自短柄草属(pBdEF1)的强组成型EF1启动子驱动。

图5显示了小麦RKD4表达构建体pABM-BdEF1-TaRKD4(SEQ ID NO:28)的图。小麦RKD4(TaRKD4)基因是由来自短柄草属(pBdEF1)组成的强组成型EF1启动子驱动。

图6显示了编辑基因组的CRISPR Cpf1表达构建体pGEP359(SEQ ID NO:29)的图。tDTomato定义了tdTomato基因(tDT)。ZmLpCpf1定义了毛螺菌科细菌CRISPR/Cpf1(LbCpf1)基因的玉米优化了密码子的CDS。

图7显示了编辑基因组的CRISPR RNA构建体pGEP324(SEQ ID NO:30)的图。crGEP05定义了靶向玉米HMG13基因的crRNA5。ZmUbi1定义了来自玉米泛素1基因的启动子和内含子。Tnos定义了nos终止子。

图8显示了在ZmPLT5(图2)与pGEP359(图6)和pGEP324(图7)质粒共同轰击后18小时,A188未成熟胚胎的荧光图像。轰击后18小时获取图像。

图9显示了在Hi II未成熟胚胎中促进胚胎发生的ZmPLT5和KWS-RBP1或ZmPLT7和KWS-RBP1的瞬时共表达。图像显示了与加强基因构建体共同轰击后5天,从玉米Hi II胚胎诱导的胚胎发生结构(B)。图9A显示了仅基因组工程化构建体pGEP359(图6)和pGEP324(图7)(仅GE构建体)的轰击。图9B显示了ZmPLT5(图2)和KWS-RBP1(图4)与GE构建体(GE构建体加ZmPLT5+KWS-RBP1)的共同递送。图9C显示了ZmPLT7和KWS-RBP1与GE构建体(GE构建体加上ZmPLT7+KWS-RBP1)的共同递送。轰击后5天获取图像。

图10显示了ZmPLT5和KWS-RBP1或ZmPLT7和KWS-RBP1的瞬时共表达促进了玉米HiII胚胎中共同递送的tDT报告基因的稳定转化。红色荧光图像显示了共同轰击后12天从玉米Hi II胚胎产生的稳定的tDT表达结构(图10A至10C)。图10A显示了仅基因组工程化构建体pGEP359(图6)和pGEP324(图7)(仅GE构建体)的轰击。图10B显示了ZmPLT5和KWS-RBP1与GE构建体(GE构建体加上ZmPLT5+KWS-RBP1)的共同递送。图10C显示了ZmPLT7和KWS-RBP1与GE构建体(GE构建体加上ZmPLT7+KWS-RBP1)的共同递送。图10D是显示ZmPLT5或ZmPLT7与KWS-RBP1的共同递送提高了tDT报告基因的稳定转化频率的图。轰击后12天获取结果。

图11显示ZmPLT5和KWS-RBP1或ZmPLT7和KWS-RBP1的瞬时共表达促进A188未成熟胚胎中的胚胎发生。图像显示用加强基因构建体共同轰击后7天,从玉米A188胚胎诱导的胚胎发生结构。图11A显示了仅基因组工程化构建体pGEP359(图6)和pGEP324(图7)(仅GE构建体)的轰击。图11B显示了ZmPLT5和KWS-RBP1与GE构建体(GE构建体加上ZmPLT5+KWS-RBP1)的共同递送。图11C显示了ZmPLT7和KWS-RBP1与GE构建体(GE构建体加上ZmPLT7+KWS-RBP1)的共同递送。轰击后7天获取图像。

图12显示了ZmPLT5和KWS-RBP1的瞬时共表达促进了玉米A188胚胎中共同递送的tDT报告基因的稳定转化。红色荧光图像显示了共同轰击(A到C)后16天从玉米A188胚胎产生的稳定的tDT表达结构。图12A显示了仅基因组工程化构建体pGEP359(图6)和pGEP324(图7)(仅GE构建体)的轰击。图12B显示了ZmPLT5和KWS-RBP1与GE构建体(GE构建体加上ZmPLT5+KWS-RBP1)的共同递送。图12C显示了ZmPLT7和KWS-RBP1与GE构建体(GE构建体加上ZmPLT7+KWS-RBP1)的共同递送。图12D显示了ZmPLT5或ZmPLT7和KWS-RBP1的共同递送提高了tDT报告基因的稳定转化频率。轰击后12天获取结果。

图13显示了玉米WUS2(ZmWUS2)启动子报告构建体pAMK-ZmWUS2-tDT-nosT(SEQ IDNO:43)的图。tDToma定义了荧光tDT报告基因,其由玉米WUSCHEL2启动子(pZmWUS2)驱动。

图14显示小麦TaRKD4基因通过玉米未成熟胚胎IE(上图)和叶(下图)中的瞬时共同轰击而激活玉米WUS2启动子。图14A仅显示了玉米WUS2启动子报告构建体(图13;SEQ IDNO:46)(仅pZmWUS2报告)。图14B显示了玉米WUS启动子报告构建体和小麦RKD4构建体的共同轰击(图5)(pZmWUS2报告和TaRKD4)。轰击后44小时获取图像。

图15显示了在Hi II未成熟胚胎中促进胚胎发生的小麦RKD4(TaRKD4)和KWS-RBP1的瞬时共表达。图像显示了与加强基因构建体共同轰击后5天,从玉米Hi II胚胎诱导的胚胎发生结构。图15A显示了仅基因组工程化构建体pGEP359(图6)和pGEP324(图7)(仅GE构建体)的轰击。图15B显示了TaRKD4和KWS-RBP1与GE构建体(GE构建体加KWS_RGB1+TaRKD4)的共同递送。轰击后5天获取图像

图16显示小麦RKD4(TaRKD4)和KWS-RBP1的瞬时共表达促进了玉米Hi II胚胎中共同递送的tDT报告基因的稳定转化。红色荧光图像显示了共同轰击后12天从玉米Hi II胚胎产生的稳定的tDT表达结构(图16A至16C)。图16A显示了仅基因组工程化构建体pGEP359(图6)和pGEP324(图7)(仅GE构建体)的轰击。图16B显示了TaRKD4和KWS-RBP1与GE构建体(GE构建体加上TaRKD4+KWS-RGB1)的共同递送。图16C显示了在Hi II未成熟胚胎中TaRKD4和KWS-RBP1的共同递送提高了tDT报告基因的稳定转化频率。轰击后12天获取结果。

图17显示小麦RKD4和KWS-RBP1的瞬时共表达促进A188未成熟胚胎中的胚胎发生。图像显示用加强基因构建体共同轰击后5天,从玉米Hi II胚胎诱导的胚胎发生结构。图17A显示了仅基因组工程化构建体pGEP359(图6)和pGEP324(图7)(仅GE构建体)的轰击。图17B显示了TaRKD4和KWS-RBP1与GE构建体(GE构建体加上TaRKD4+KWS-RBP1)的共同递送。轰击后5天获取图像。

图18显示了小麦RKD4和KWS-RBP1的瞬时共表达促进了玉米A188胚胎中共同递送的tDT报告基因的稳定转化。红色荧光图像显示了共同轰击(A到C)后14天从玉米A188胚胎产生的稳定的tDT表达结构。图18A显示了仅基因组工程化构建体pGEP359(图6)和pGEP324(图7)(仅GE构建体)的轰击。图18B显示了KWS-RBP1和TaRKD4与GE构建体(GE构建体加上TaRKD4+KWS-RBP1)的共同递送。图18C显示了TaRKD4和KWS-RBP1的共同递送提高了在玉米A188未成熟胚胎中tDT报告基因的稳定转化频率。轰击后14天获取结果。

图19显示了ZmPLT5或ZmPLT7的瞬时共表达促进了玉米中的瞬时基因组编辑。将基因组编辑构建体pGEP359和pGEP324与加强基因构建体共同轰击进玉米Hi II未成熟胚胎中。编辑效率定义为100个再生植物中具有位点特异性修饰的植物数目。瞬时编辑用于描述没有遗传物质的整合的由基因组编辑的瞬时活动所导致位点特异性修饰。

图20描述了Droplet Digital PCR结果,其显示了无需选择通过加强基因和基因组编辑组分的瞬时共表达在再生植物中的同种基因组编辑。约50%和100%的位点特异性InDel比率分别表明单等位基因和双等位遗传修饰。图20A显示了使用水(底部)或野生型DNA(WT液滴)的Droplet Digital PCR的阴性对照结果。图20B显示了源自加强子和基因组编辑组分的瞬时共表达的编辑的T0植物的Droplet Digital PCR结果。顶部和中间的图显示了来自两个编辑的T0植物的接近100%的InDel比率,其表明同种双等位遗传修饰,而下图说明了同种单等位基因编辑事件。

图21描绘了通过Sanger测序分析,来自编辑的T0植物的靶区域的多序列比对。图21A和21B分别显示了双等位基因事件CB0113-T-591和CB0113-T-632。图21C显示了单等位基因事件CB0113-T-303。标记了PAM和预期的切割位点。也标记了PAM位点(TTTA)附近的SNP(A188的G和B73等位基因的A)。测序结果证实在这些T0植物中发生了同种修饰。具体而言,CB0113-T-591具有分别从A188和B73等位基因中5bp和2bp缺失的双等位遗传修饰。CB0113-T-632包含分别A188和B73等位基因中的6bp和5bp缺失的双等位基因编辑。CB0113-T-303具有A188等位基因8bp缺失,而B73等位基因未修饰。CB0113-T-591和CB0113-T-632源自ZmPLT5和KWS-RBP1的共表达,且CB0113-T-303来自ZmPLT7和KWS-RBP1与基因组编辑构建体的共表达。

图22显示了KWS-RBP2表达构建体(pABM-BdEF1_KWS_RBP2)图。KWS-RBP2基因自其蛋白质序列中进行了玉米密码子优化且由Integrated DNA Technologies(IDT,SanDiego,CA,USA)合成,并在BamHI和BamIII的克隆位点克隆进表达载体pABM-BdEF1(图1)中。pKWS-RBP2基因由来自短柄草属(pBdEF1)的强组成型EF1启动子驱动。

图23说明了ZmPLT5和KWS-RBG1或ZmPLT5和KWS-RBP2的共同递送促进了玉米A188的再生比率。仅基因组工程化构建体pGEP359(图6)和pGEP324(图7)(仅tDT)轰击玉米未成熟胚胎,或与ZmPLT5和KWS_RBP1(tDT加上ZmPLT5和KWS_RBP1)或与ZmPLT5和KWS_RBP2(tDT加上ZmPLT5和KWS_RBP2)共同轰击玉米未成熟胚胎。

图24显示ZmPLT5和KWS_RBG1或ZmPLT5和KWS_RBP2的共同递送促进了tDTomato报告基因在玉米A188中的稳定转化效率。红色荧光图像显示了共同轰击(A至C)后10天从玉米A188胚胎产生的稳定的tDT表达结构(亮点/区域)。A:仅基因组工程化(GE)构建体pGEP359(图6)和pGEP324(图7)(仅tDT)轰击;B:GE构建体与ZmPLT5和KWS-RBP1(tDT加ZmPLT5和KWS_RBP1)的共同轰击;C:GE构建体与ZmPLT5和KWS-RBP2(tDT加ZmPLT5和KWS_RBP2)的共同轰击。轰击后10天获取图像。

图25显示了ZmPLT5和KWS-RBG1或ZmPLT5和KWS_RBP2的共同递送促进了tDTomato报告基因在玉米A188中的稳定转化效率。红色荧光图像显示了共同轰击(A到C)后16天从玉米A188胚胎产生的稳定的tDT表达结构(亮点/区域)。A:仅基因组工程化(GE)构建体pGEP359(图6)和pGEP324(图7)(仅tDT)轰击;B:GE构建体与ZmPLT5和KWS-RBP1(tDT加ZmPLT5和KWS_RBP1)的共同轰击;C:GE构建体与ZmPLT5和KWS-RBP2(tDT加ZmPLT5和KWS_RBP2)的共同轰击。D:ZmPLT5和KWS-RBP1或ZmPLT5和KWS-RBP2的共同递送提高了tDT报告基因的稳定转化频率。轰击后16天记录数据。轰击后16天获取图像。

发明详述

除非另有定义,否则本文使用的技术和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同含义。

如在本申请的上下文中使用的,术语“约”是指该值的+/-10%,优选地该值的+/-5%。例如,应将约100个核苷酸(nt)理解为介于90nt和110nt之间的值,优选介于95nt和105nt之间。

如本文所用,术语“加强子”、“加强子基因”、“加强子多肽”、“加强多肽”、“加强基因”和“加强因子”是指蛋白质/肽或编码蛋白质/多肽的(多)核酸片段,其可导致改善的基因组工程化和/或改善的转化或基因编辑植物细胞的植物再生。这样的蛋白质/多肽可以提高植物细胞的性能或能力,该植物细胞优选地源自体细胞组织、胚组织、愈伤组织或原生质体,以在整个植物,优选地在可育植物中再生。因此,它们可以调节体细胞胚的形成(体细胞胚胎发生)和/或可以提高植物细胞的增殖速率。示例性的加强子多肽包括但不限于KWS-RBP1(例如,SEQ ID NO:2)和变体。其变体是例如KWS-RBP2(SEQ ID NO:48),其具有在氨基酸序列水平93%的序列同一性。转化的或基因编辑的植物细胞的再生可包括体细胞胚胎发生的过程,其是一种人工过程,其中植物或胚源自单个体细胞或一组体细胞。体细胞胚是从通常不参与胚发育的植物细胞(即如萌芽(bud)、叶、芽(shoot)等植物组织)形成的。该过程的应用可包括:克隆繁殖遗传上均一的植物材料;消除病毒;提供用于基因转化的源组织;从单个细胞(诸如原生质体)生成完整植物;发展合成种子技术。可以培养源自感受态的源组织的细胞以形成愈伤组织。可以操纵组织培养基中的植物生长调节剂,例如植物生长素或细胞分裂素以诱导愈伤组织形成,以及随后改变该植物生长调节剂以诱导从愈伤组织形成胚。已经以直接或间接两种方式描述了体细胞胚胎发生的发生。当直接从外植体组织产生相同克隆的胚胎时发生直接胚胎发生。当外植体产生未分化或部分分化的细胞(即愈伤组织),然后其维持或分化成植物组织(如叶,茎或根)时,发生间接胚胎发生。

根据本发明公开的术语“转基因的(transgenic)”是指包含基因或遗传构建体的植物、植物细胞、组织、器官或材料,其包含通过自然手段或另一生物的转化技术已转移至植物、植物细胞、组织、器官或材料中的“转基因”。术语“转基因”包含核酸序列(包括DNA或RNA)或氨基酸序列,或其组合或混合。因此,术语“转基因”不限于通常被识别为“基因”的序列,即编码蛋白质的序列。它也可以指,例如,非编码蛋白质的DNA或RNA序列。因此,术语“转基因的”通常意味着相应的核酸或氨基酸序列不是天然存在于相应的靶细胞(包括植物、植物细胞、组织、器官或材料)。因此,本文所用的术语“转基因”或“转基因的”是指核酸序列或氨基酸序列,其从一种生物的基因组获得或合成产生,然后通过分子生物学,遗传学等人工技术其以瞬时或稳定方式导入另一种生物。如本文所用,“植物材料”是指可以在任何发育阶段从植物获得的任何材料。植物材料可以在植物中或从植物或其植物组织或器官的体外培养物中获得。因此,该术语包含植物细胞、组织和器官以及发育的植物结构以及亚细胞组分,如核酸、多肽以及可以在植物细胞或区室内找到和/或可以由植物产生或可以从处于任何发育阶段的任何植物细胞、组织或植物的提取物中获得的所有化学植物物质或代谢物。该术语还包含植物材料(例如原生质体)的衍生物,其衍生自植物材料所包含的至少一个植物细胞。因此,该术语还包含植物的分生组织细胞或分生组织。

本文使用的术语“基因组工程化”是指用于植物细胞的任何遗传信息或基因组的遗传修饰的策略和技术,其包含基因组转化、基因组编辑。因此,“基因组编辑”是指用于对植物细胞的任何遗传信息或基因组进行靶向、特异性修饰的技术。因此,该术语既包含基因编码区域的基因编辑,还包含除基因组的基因编码区域以外的区域的编辑。它还包含植物细胞的核(如果存在)以及其他遗传信息的编辑或工程化。此外,“基因组工程化”还包含表观遗传编辑或工程化,即例如甲基化、组蛋白修饰或可能引起基因表达可遗传改变的非编码RNA的靶向修饰。

如本文所用,术语“基因组编辑”是指用于植物细胞的任何遗传信息或基因组的靶向、特异性修饰的策略和技术。因此,这些术语既包含基因编辑,也包含基因组中除基因编码区域以外的区域的编辑,例如内含子序列、非编码RNA、miRNA、调节元件序列(如启动子、终止子、转录激活子结合位点、顺式或反式作用原件)。另外,“基因组编辑”可以包含针对单个核碱基的靶向置换的碱基编辑。它可以进一步包含植物细胞的核基因组以及其他遗传信息(即线粒体基因组或叶绿体基因组以及miRNA、mRNA前体或mRNA)的编辑。此外,“基因组编辑”可以包含可能导致基因表达的遗传改变的表观遗传编辑或工程化,即例如DNA甲基化或组蛋白修饰(诸如组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化)的靶向修饰。“基因组编辑”还可包含可能导致基因表达的遗传改变的非编码RNA的表观遗传编辑或工程化。

如本文所用,“碱基编辑器(base editor)”是指蛋白质或其片段(该片段具有与其衍生的蛋白质相同催化活性),该蛋白质或其片段单独或以分子复合物(在本文中称为碱基编辑复合物)形式提供时具有介导靶向碱基修饰的能力,即如果碱基转换未引起沉默突变而是引起由包含要用碱基编辑器转换的位置的密码子所编码的氨基酸的转换,感兴趣的碱基的转换导致感兴趣的点突变,进而能导致靶向突变。

如本文所用,“调节元件”是指核苷酸序列,其不是编码蛋白质的核苷酸序列的一部分,而是介导编码蛋白质的核苷酸序列的表达。调节元件包括例如启动子、顺式调节元件、增强子、内含子或终止子。根据调节元件的类型,它位于编码蛋白质的核苷酸序列之前(即其5')或之后(即其3')的核酸分子上。术语“可操作地连接”是指调节元件以这种方式与编码蛋白质的核苷酸序列连接,即,相对于编码蛋白质的核苷酸序列以这种方式定位在例如核酸分子上,使得在活细胞中可发生调节元件的控制下的该编码蛋白的核苷酸序列的表达。

如本文所用,“上游”表示核酸分子上更靠近该核酸分子的5'端的位置。同样地,术语“下游”是指核酸分子上更靠近该核酸分子的3'端的位置。为避免疑问,核酸分子及其序列通常以其5'至3'方向(从左至右)表示。

如本文所用,“侧翼区域”是具有与位于预选位点侧翼(即上游或下游)的DNA区域的核苷酸序列同源的核苷酸序列的修复核酸分子的区域。

如本文所用,“瞬时表达”是指这样的现象,其中转移的蛋白/多肽和编码该蛋白/多肽的核酸片段在细胞中瞬时地表达和/或有活性,并不久后随细胞生长而关闭和/或降解。

如本文所用,“双链DNA断裂诱导酶”、“诱导双链断裂的酶”或“DSBI酶”是能够在被称为“识别位点”或“预定位点”的特定核苷酸序列诱导双链DNA断裂的酶。因而,“单链DNA或RNA断裂诱导酶”、“诱导单链断裂的酶”或“SSBI酶”是能够在被称为“识别位点”或“预定位点”的特定核苷酸序列诱导单链DNA断裂的酶。

如本文所用,“修复核酸分子”是单链或双链DNA分子或RNA分子,其用作在切割位点或其邻近基因组DNA或RNA修饰的模板。如本文所用,“用作基因组DNA修饰的模板”是指通过预选位点侧翼的在靶基因组中的侧翼区域和相应同源区域之间的同源重组,任选地与修复核酸分子的两端之一的非同源末端连接(NHEJ)组合(例如仅有一个侧翼区域)来在预定位点复制或整合修复核酸分子。

如本文所用,“基因组的修饰”是指在至少一个核苷酸或通过至少一次表观遗传编辑改变了基因组。

如本文所用,“预选位点”、“预定位点”或“预定义位点”表示在基因组(例如核基因组或叶绿体基因组)中期望插入、置换和/或缺失一个或多个核苷酸的位置上的特定核苷酸序列。

如本文所用,“植物激素”或“植物生长调节剂”指促进植物细胞分裂和/或植物形态发生的天然存在或合成的任何材料和化学物质。如本文所用,“再生”是指单个或多个细胞增殖并发展成组织、器官最终为整个植物的过程。

如本文所用,术语“载体”或“质粒(载体)”是指尤其包含用于导入或转化,转染或转导进任何真核细胞(包括植物、植物细胞、组织、器官或材料)中的质粒或(质粒)载体、粘粒、人工酵母染色体或细菌人工染色体(YAC和BAC)、噬菌粒、基于噬菌体的载体、表达盒、分离的单链或双链核酸序列(其包含线性或环状形式的序列)、或氨基酸序列、病毒载体(包括修饰的病毒)及其组合或混合。

在重组基因的背景下的“重组体”可以包含调节序列和/或定位序列。根据本发明的重组构建体或DNA构建体可以整合进载体(包括质粒载体)或可以是载体(包括质粒载体),和/或其可以例如以单链或双链核酸的形式从载体结构中分离存在。导入后,例如通过利用生物或物理手段的转化或转染,重组基因或DNA构建体也可例如以双链或单链DNA的形式存在于染色体外,即未整合进靶细胞的基因组。或者,重组基因或DNA构建体可以稳定地整合进靶细胞的基因组,该基因组包括靶细胞的核基因组或其他遗传元件,该其他遗传原件包括质体(如线粒体或叶绿体)的基因组。

在一个方面,提供了加强子多肽,其包含SEQ ID NO:2或48(例如KWS-RBP1或KWS-RBP2)的氨基酸序列或与SEQ ID NO:2或48至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。

发明人表明不仅加强子多肽KWS-RBP1和KWS-RBP2单独介导强加强子效应,而且与其他加强子多肽组合,尤其在转基因和/或基因组工程化组分递送后的再生早期也介导强加强子效应。这种加强效应不会损害植物发育,以及再生的植物在成年期显示出有利的植物生长并且可育。这样,可以通过杂交和选择在下一代中分离出加强子基因或加强子多肽的整合。

在本文公开的各种方法中,可瞬时提供或共表达任何单个加强子多肽或加强子多肽的组合。加强子多肽本身可被导入植物细胞,或者可替代地,编码加强子多肽的多核苷酸可以被导入植物细胞。关于组合,可以将一个加强子多肽与编码另一个加强子多肽或相同加强子多肽的核苷酸一起导入植物细胞。例如,可以将包含SEQ ID NO:2序列的加强子多肽与包含SEQ ID NO:1的核苷酸序列的核酸(其编码SEQ ID NO:2的序列)一起导入植物细胞。

MESGSGTAAGSGYVYRQPGSTRWNPTAEQLSLLREIYYRNGLRTPTADEIRQISSKLSRYGKIEGKNVYNWFQNRRAREKRKQRLSTIGCDPALIEMGNVASLEFGTESALESLSSGPSSELREAPTRKFYEKKTVGENSTIINPVEQNCTLSCGTSQEFQYAVDSRRVMKAMEEKQATDDEPDGNKWTESNRHVKILQLFPLHNNEDQTLIKSDKEIYCLGSCEKKMDLSPLGHSGSQRASALDLCLSLGNESCGLHDN(SEQ ID NO:2)

ATGGAGTCGGGCTCCGGGACGGCTGCTGGCTCTGGCTATGTTTACAGACAGCCAGGATCAACGCGGTGGAACCCGACAGCTGAACAACTGTCCTTGCTTAGAGAAATCTACTACCGCAACGGATTGCGGACCCCGACCGCGGACGAAATCAGACAAATCAGCTCAAAGCTCTCAAGGTACGGAAAAATAGAGGGCAAAAACGTTTACAACTGGTTCCAGAATAGACGCGCAAGAGAAAAGCGCAAGCAACGGCTCTCTACAATCGGCTGTGATCCAGCACTGATCGAGATGGGGAATGTCGCTTCACTGGAATTCGGTACTGAGAGCGCCCTGGAATCGCTGTCGTCAGGACCATCCTCAGAACTCCGCGAAGCGCCAACGAGAAAATTTTACGAAAAAAAGACGGTTGGAGAGAACTCAACTATAATAAACCCAGTGGAACAAAACTGTACCCTTTCCTGCGGAACGTCCCAAGAGTTCCAGTATGCGGTCGATTCTCGGCGCGTCATGAAAGCTATGGAGGAAAAGCAGGCGACGGACGATGAACCCGACGGAAATAAATGGACTGAGTCAAACAGACACGTCAAGATTCTCCAGCTTTTCCCGCTCCACAATAACGAGGATCAGACATTGATAAAGAGCGACAAAGAAATCTATTGTTTGGGCTCGTGCGAGAAGAAAATGGATTTGTCACCGCTGGGTCATTCAGGCTCTCAGCGCGCTTCGGCCCTTGACTTGTGCCTTTCATTGGGCAACGAATCTTGTGGGCTGCATGATAATTGA(SEQ ID NO:1)

在另一个实例中,可以将包含SEQ ID NO:48的序列的加强子多肽与包含SEQ IDNO:47的核苷酸序列的核酸(其编码SEQ ID NO:48的序列)一起导入至植物细胞中。

MESGSGTAAGSGYVYRQSGSTRWNPTAEQLSLLKELYYRNGIRTPSADQIRQISARLSRYGKIEGKNVFYWFQNHKARERQKKRLSTVGCDPALIEMGNVASLEFGTESALESLSSGPSSELREAPTRKFYEKKTVGENSTIINPVEQNCTLSCGTSQEFQYAVDSRRVMKAMEEKQATDDEPDGNKWTESNRHVKTLPLFPLHNNEDQTLIKSDKEIYCLGSCEKKMDLSPLGHSGSQRASALDLCLSLGNESCGLHDN(SEQ ID NO:48)

ATGGAATCGGGCTCCGGCACGGCGGCAGGGTCTGGTTATGTCTATCGGCAGAGCGGAAGCACCCGGTGGAATCCAACAGCAGAACAGTTGTCGCTGCTCAAGGAACTTTATTACCGGAATGGAATTCGGACACCGTCGGCAGATCAAATTAGGCAAATTTCGGCCCGGCTGTCCAGATACGGCAAAATAGAAGGGAAAAACGTCTTTTACTGGTTTCAAAATCATAAAGCACGGGAACGGCAGAAGAAAAGACTTTCCACGGTCGGCTGCGACCCTGCTCTCATAGAAATGGGTAACGTCGCGAGCTTGGAATTTGGGACCGAAAGCGCTCTTGAATCTCTCAGCTCAGGCCCGTCCAGCGAGTTGCGCGAGGCTCCTACCCGCAAGTTTTATGAGAAGAAAACCGTTGGTGAGAACAGCACCATAATCAATCCTGTTGAGCAGAACTGCACACTTTCTTGCGGTACTTCGCAGGAATTTCAGTATGCTGTTGATAGCCGCCGGGTGATGAAGGCAATGGAAGAGAAGCAAGCAACGGATGATGAACCGGACGGAAACAAATGGACGGAGTCGAACAGGCATGTGAAGACCCTCCCTCTTTTCCCCTTGCATAATAATGAAGATCAGACCTTGATCAAGTCGGACAAGGAAATTTATTGCCTTGGGAGCTGTGAAAAAAAAATGGATCTGTCCCCATTGGGACACTCGGGCTCTCAGAGGGCGTCGGCACTGGATTTGTGCCTGTCTTTGGGTAATGAATCTTGTGGCCTCCACGACAATTGA(SEQ ID NO:47)

还提供了编码包含SEQ ID NO:2或48的氨基酸序列的加强子多肽。还提供了编码包含与SEQ ID NO:2或48至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的加强子多肽的核酸。

所述编码包含SEQ ID NO:2的氨基酸序列或与SEQ ID NO:2至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的加强子多肽可包含包含SEQID NO:1的核苷酸序列的核酸。核酸可包含与SEQ ID NO:1至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列。或者,该核酸可以在严格杂交条件与包含SEQ ID NO:1核苷酸序列的核酸或与包含与SEQ ID NO:1至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸的互补链进行杂交。

编码包含SEQ ID NO:48的氨基酸序列的加强子多肽或与SEQ ID NO:48至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的核酸还可包含包含SEQ ID NO:47的核苷酸序列的核酸。所述核酸可包含与47至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列。或者,该核酸可以在严格杂交条件与包含SEQ ID NO:47的核苷酸序列的核酸或与包含与SEQ ID NO:47至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸的互补链进行杂交。

提供一种包含编码包含SEQ ID NO:2或48的氨基酸序列或与SEQ ID NO:2或48至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的加强子多肽的核酸的重组基因。该核酸可可操作地与一个或多个调节元件连接。该调节元件可以是启动子、顺式调节元件、增强子、内含子或终止子。该调节元件可以是核酸序列的5'。该调节元件可以是核酸序列的3'。该核酸可包含包含SEQ ID NO:1或47的核苷酸序列的核酸。该核酸可包含与SEQ ID NO:1或47至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列。该核酸可以在严格的杂交条件与包含SEQ ID NO:1或47的核苷酸序列的核酸的互补链进行杂交或与SEQ ID NO:1或47至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸的互补链进行杂交。

在一些实施方案中,核酸与异源启动子可操作地连接。异源启动子可以是强组成型启动子(诸如双35S启动子(d35S))、组织特异性启动子、发育特异性启动子或诱导型启动子。异源启动子可以是来自EF1基因的启动子(诸如短柄草属EF1基因(pBdEF1,SEQ ID NO:22)、来自泛素1基因的启动子(诸如玉米泛素1基因)、WUSCHEL2启动子(诸如玉米WUSHCEL2启动子(pZmWUS2))。异源启动子可以是美国专利号6,528,701描述的泛素启动子,该专利以引用的方式并入本文。可以使用的各种组织特异性启动子描述于美国专利号7,763,774和7,767,801,其各自通过引用并入本文。

还提供了包含以上任何核酸或重组基因的DNA构建体,优选为载体。该核酸可包含SEQ ID NO:1或47的核苷酸序列的的核酸。所述核酸可包含与SEQ ID NO:1或47至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列。另外,该核酸可以在严格杂交条件与包含SEQ ID NO:1或47的核苷酸序列的核酸的互补链杂交或与包含与SEQ ID NO:1或47至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸的互补链杂交。在一些实施方案中,DNA构建体是质粒。

在另一方面,提供了一种植物细胞,其包含本文所述的加强子多肽、核酸、重组基因和DNA构建体中的一个或多个,优选地作为转基因。在一些实施方案中,加强子多肽包含SEQ ID NO:2或48的氨基酸序列。在一些实施方案中,加强子多肽包含与与SEQ ID NO:2或48至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。该核酸可包含包含SEQ ID NO:1或47的核苷酸序列的核酸。该核酸可包含包含与SEQ ID NO:1或47至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸。该核酸可以在严格杂交条件与包含SEQ ID NO:1或47的核苷酸序列的核酸的互补链杂交或与包含与SEQ ID NO:1或47至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核苷酸序列的核酸的互补链杂交。还提供了包含该植物细胞的植物、植物的一部分、种子、胚胎或愈伤组织。

植物细胞可以是任何类型的植物材料的部分或衍生自任何类型的植物材料,优选地为芽、下胚胎轴、子叶、茎、叶、叶柄、根、胚胎、愈伤组织、花、配子体或其部分,或者可以是原生质体或衍生自原生质体。可以使用分离的植物细胞以及植物材料,即含有植物细胞的整个植物或植物的部分。

植物的一部分或植物的多个部分可以与整个完整的植物附着或分离。植物的此类部分包括但不限于植物的器官、组织和细胞,及优选种子。

植物细胞、植物部分或植物可以来自任何植物物种,无论是单子叶植物还是双子叶植物。优选地,可以经受本发明的方法和用途的植物选自以下属的植物:大麦属(Hordeum)、高粱属(Sorghum)、甘蔗属(Saccharum)、玉蜀黍属(Zea)、狗尾草属(Setaria)、水稻属(Oryza)、小麦属(Triticum)、黑麦属(Secale)、黑小麦属(Triticale)、苹果属(Malus)、短柄草属、山羊草属(Aegilops)、胡萝卜属(Daucus)、甜菜属(Beta)、桉属(Eucalyptus)、烟草属(Nicotiana)、茄属(Solanum)、咖啡属(Coffea)、葡萄属(Vitis)、Erythrante、螺旋狸藻属(Genlisea)、黄瓜属(Cucumis)、Marus、拟南芥属(Arabidopsis)、须弥芥属(Crucihimalaya)、碎米荠属(Cardamine)、独行菜属(Lepidium)、荠属(Capsella)、Olmarabidopsis、筷子芥属(Arabis)、芸苔属(Brassica)、芝麻菜属(Eruca)、萝卜属(Raphanus)、柑橘属(Citrus)、麻风树属(Jatropha)、杨属(Populus)、苜蓿属(Medicago)、鹰咀豆属(Cicer)、木豆属(Cajanus)、菜豆属(Phaseolus)、大豆属(Glycine)、棉属(Gossypium)、黄芪属(Astragalus)、莲属(Lotus)、蝴蝶草属(Torenia)、葱属(Allium)或向日葵属(Helianthus)。更优选地,该植物选自:大麦(Hordeum vulgare)、球茎大麦(Hordeum bulbusom)、两色高粱(Sorghum bicolor)、甘蔗(Saccharum officinarium)、包括玉米(Zeamays)在内的玉蜀黍属物种(Zea spp.,)、小米(Setaria italica)、小粒稻(Oryza minuta)、水稻(Oryza sativa)、澳洲野生稻(Oryza australiensis)、高秆野生稻(Oryza alta)、小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、黑麦(Secalecereale)、黑小麦(Triticale)、苹果(Malus domestica)、紫短柄草(Brachypodiumdistachyon)、海滨大麦(Hordeum marinum)、节节麦(Aegilops tauschii)、Daucusglochidiatus、包括甜菜(Beta vulgaris)在内的甜菜属物种(Beta spp.)、小胡萝卜(Daucus pusillus)、Daucus muricatus、胡萝卜(Daucus carota)、巨桉(Eucalyptusgrandis)、美花烟草(Nicotiana sylvestris)、绒毛状烟草(Nicotianatomentosiformis)、烟草(Nicotiana tabacum)、本氏烟草(Nicotiana benthamiana)、番茄(Solanum lycopersicum),马铃薯(Solanum tuberosum)、中果咖啡(Coffea canephora)、葡萄(Vitis vinifera)、Erythrante guttata、螺旋狸藻(Genlisea aurea)、黄瓜(Cucumissativus)、Marus notabilis、Arabidopsis arenosa、深山南芥(Arabidopsis lyrata)、拟南芥(Arabidopsis thaliana)、喜马拉雅鼠耳芥(Crucihimalaya himalaica)、卵叶须弥芥(Crucihimalaya wallichii)、弯曲碎米荠(Cardamine nexuosa)、北美独行菜(Lepidiumvirginicum)、荠菜(Capsella bursa pastoris)、Olmarabidopsis pumila、筷子芥(Arabishirsute)、欧洲油菜(Brassica napus)、甘蓝(Brassica oleracea)、芜菁(Brassicarapa)、萝卜(Raphanus sativus)、芥菜(Brassica juncacea)、黑芥(Brassica nigra)、芝麻菜亚种sativa(Eruca vesicaria subsp.Sativa)、甜橙(Citrus sinensis)、麻风树(Jatropha curcas)、毛果杨(Populus trichocarpa)、蒺藜状苜蓿(Medicagotruncatula)、山下鹰嘴豆(Cicer yamashitae)、Cicer bijugum、鹰嘴豆(Cicerarietinum)、网状鹰嘴豆(Cicer reticulatum)、Cicer judaicum、木豆(Cajanuscajanifolius)、蔓草虫豆(Cajanus scarabaeoides)、菜豆(Phaseolus vulgaris),大豆(Glycine max)、棉花(Gossypium sp.)、紫云英(Astragalus sinicus)、百脉根(Lotusjaponicas)、夏堇(Torenia fournieri)、洋葱(Allium cepa)、葱(Allium fistulosum)、蒜(Allium sativum)、向日葵(Helianthus annuus)、菊芋(Helianthus tuberosus)和/或韭菜(Allium tuberosum)。特别优选地是甜菜(Beta vulgaris)、玉米(Zea mays)、小麦(Triticum aestivum)、大麦(Hordeum vulgare)、黑麦(Secale cereale)、向日葵(Helianthus annuus)、马铃薯(Solanum tuberosum)、两色高粱(Sorghum bicolor)、芜菁(Brassica rapa)、欧洲油菜(Brassica napus)、芥菜(Brassica juncacea)、甘蓝(Brassica oleracea)、萝卜(Raphanus sativus)、水稻(Oryza sativa)、大豆(Glycinemax)和/或棉花(Gossypium sp.)。

经遗传修饰的植物细胞可以是整个植物的部分或其一部分。因此,本发明还涉及包含上述经遗传修饰的植物细胞的植物或植物部分。

在允许该植物细胞的基因组在至少一个加强因子存在时通过整合感兴趣的转基因和基因组工程化组分的活性进行遗传修饰的条件下,培养已(共)导入基因组工程化组分的植物细胞。

还提供了一种在植物细胞中进行遗传修饰的方法。该方法包括将(i)本文所述的任何加强子多肽、核酸、重组基因或DNA构建体和(ii)转基因和/或基因组工程化组分导入植物细胞。可以在允许从核酸、重组基因或DNA构建体合成加强子多肽的条件培养植物细胞。可在允许该植物细胞的基因组在加强子多肽存在下通过基因组工程化组分的活性进行遗传修饰的条件下培养植物细胞。

基因组工程化组分可以作为蛋白质和/或编码基因组工程化组分的核酸导入,特别是作为DNA诸如质粒DNA、RNA、mRNA或RNP。基因组工程化可用于生产转基因、基因编辑或碱基编辑的植物材料。

对于要修饰的植物细胞,可以使用基于生物学方法的转化方法,诸如农杆菌属转化或病毒载体介导的植物转化。一种常见的生物学手段是用农杆菌转化。其几十年来已用于各种不同的植物材料。病毒载体介导的植物转化也可以用于将遗传物质导入感兴趣的细胞。农杆菌属介导的转化是指使用根癌农杆菌(一种作为天然基因工程化载体的土壤细菌)将外来DNA递送到植物细胞中的方法。根癌农杆菌可侵袭植物并将外来DNA转移进非常广泛的植物。

或者,可以使用基于物理递送方法的转化方法,如粒子轰击或显微注射。粒子轰击包括基因枪法转染(biolistic transfection)或微粒介导的基因转移,其是指将包含感兴趣的核酸或遗传构建体的包被微粒或纳米粒子转移到靶细胞或组织中的物理递送方法。物理导入手段适合于导入核酸,即RNA和/或DNA,以及蛋白质。粒子轰击和显微注射已发展成为将遗传物质导入感兴趣的植物细胞或组织的突出技术。Helenius等人,“Gene deliveryinto intact plants using the Helios

如本文所用,术语“粒子轰击”,也称为“基因枪法转染”或“微粒介导的基因转移”,是指一种用于将包含加强基因、加强子多肽、基因组工程化组分和/或转基因的包被微粒或纳米颗粒转移进靶细胞或组织中的物理递送方法。微米或纳米粒子起射弹的作用,并使用合适的装置(通常称为基因枪)在高压下发射到感兴趣的靶结构上。通过粒子轰击进行的转化使用包被有感兴趣的构建体的金属微粒,然后使用称为“基因枪”的设备(Sandford等,1987)以足够快的高速(~1500km/h)将其发射到靶细胞上,以使其能够穿透靶组织细胞壁,但不够严酷以导致细胞死亡。对于原生质体,其细胞壁被完全去除,条件在逻辑上是不同的。至少一个微粒上的沉淀的核酸或遗传构建体在轰击后释放到细胞中。微粒的加速是通过高压放电或压缩气体(氦气)来实现的。关于所使用的金属颗粒,必须无毒,无反应,并且其直径小于靶细胞的直径。最常用的是金或钨。基因枪及其相关系统的制造商和供应商可以公开获得大量有关其一般用途的信息。

在微粒轰击的一个特别优选的实施方案中,一种或多种加强基因、加强子多肽、基因组工程化组分和/或转基因是通过包含具有0.4-1.6微米(μm)范围大小,优选0.4-1.0μm范围大小的金颗粒的微载体共同递送的,。在示例性方法中,每一次轰击使用10-1000μg的金颗粒,优选50-300μg。

可以使用例如Bio-Rad PDS-1000/He粒子枪或手持式Helios基因枪系统将加强基因、加强子多肽、基因组工程化组分和/或转基因递送进靶细胞中。当使用PDS-1000/He粒子枪系统时,轰击破裂压力为450psi至2200psi,优选为450-1100psi,而Helios基因枪系统的破裂压力为100-600psi。可以将一种以上的化学物质或构建体与基因组工程化组分共同递送到进细胞中。

可以将上述用于转化和转染的递送方法同时应用于导入本发明的工具。同样,存在用于将感兴趣的核酸或氨基酸构建体特异性地导入植物细胞的特异性转化或转染方法,包括电穿孔、显微注射、纳米颗粒和细胞穿透肽(CPP)。此外,存在基于化学的转染方法以导入遗传构建体和/或核酸和/或蛋白质,尤其包含用磷酸钙转染、使用脂质体(例如阳离子脂质体)转染或使用阳离子聚合物(包括DEAD-右旋糖酐或聚乙烯亚胺或其组合)转染。单独或组合使用以上递送技术可用于体内(包括植物中)或体外方法。

在一些实施方案中,基因组工程化组分包含:

a)双链断裂(DSB)诱导酶或编码其的核酸,以及任选地修复核酸分子,其中所述DSB诱导酶优选地识别所述细胞的基因组中的预定位点;

b)单链断裂(SSB)诱导酶或编码其的核酸,以及任选地修复核酸分子,其中所述SSB诱导酶优选地识别所述细胞的基因组中的预定位点;

c)碱基编辑器酶,其任选地与解除武装的DSB诱导酶或SSB诱导酶融合,其中所述碱基编辑器酶优选地识别所述细胞的基因组中的预定位点;或

d)影响DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化,组蛋白磷酸化、组蛋白核糖基化或组蛋白瓜氨酸化的酶,其优选地与解除武装的DSB诱导酶或解除武装的SSB诱导酶融合,其中所述酶优选地识别所述细胞的基因组中的预定位点。。

为了能够在预定的靶位点断裂,该酶优选包括结合/识别结构域和切割结构域。能够诱导双链或单链断裂的特定酶是核酸酶或切口酶及其变体,包括不再包含核酸酶或切口酶功能而是作为识别分子与另一种酶组合起作用的分子。近年来,已经开发了许多合适的核酸酶,特别是特定的内切核酸酶,其包含例如衍生自Natronobacterium gregoryi的大范围核酸酶、锌指核酸酶、TALE核酸酶、Argonaute核酸酶和CRISPR核酸酶(例如包含作为规律间隔成簇短回文重复序列(CRISPR)系统部分的Cas9、Cpf1、Csm1、CasX或CasY核酸酶)。因此,在本发明的一个优选方面,基因组工程化组分包含DSB或SSB诱导酶或其变体,其选自CRISPR/Cas内切核酸酶,优选CRISPR/Cas9内切核酸酶、CRISPR/Cpf1内切核酸酶或CRISPR/Csm1内切核酸酶、锌指核酸酶(ZFN)、归巢内切核酸酶、大范围核酸酶和TAL效应物核酸酶。

稀有切割的(rare-cleaving)内切核酸酶是识别优选为约14至70个连续的核苷酸的位点的DSBI/SSBI酶,因此,即使在诸如大多数植物基因组的较大基因组中,裂解频率也非常低。归巢内切核酸酶,也称为大范围核酸酶,构成了此类稀有切割内切核酸酶的家族。它们可由内含子、独立基因或间插序列编码,并呈现出惊人的结构和功能特性,使它们与更经典的限制性内切酶区分开,通常与细菌限制性修饰II型系统区分开。它们的识别位点具有一般的不对称性,这与大多数限制性内切酶识别位点的特征性二元对称性相反。已显示由内含子或内含肽编码的几种归巢内切核酸酶可促进其各自的遗传因子向等位基因无内含子或无内含肽位点归巢。通过在无内含子或无内含肽等位基因中进行位点特异性双链断裂,这些核酸酶会产生重组末端,从而参与基因转化过程,该过程会复制编码序列,并导致在DNA水平插入内含子或间插序列。在WO03/004659的表I(第17至20页)(其通过引用并入本文)中提供了其他稀有切割大范围核酸酶及其各自的识别位点的列表。

此外,存在设计定制的基本可以识别选择的任何靶核苷酸序列的稀有切割的内切核酸酶的方法。简而言之,可以利用设计为识别特异性核苷酸序列的锌指结构域和诸如Fokl的天然限制性酶的非特异性DNA切割结构域之间的杂合体制备嵌合限制性酶。例如,此类方法在下述文献中进行了描述:WO03/080809;WO94/18313;WO95/09233;Isalan等,(2001),A rapid,generally applicable method to engineer zinc fingersillustrated by targeting the HIV-1promoter.Nature biotechnology,19(7):656;Liu等,(1997),Design of polydactyl zinc-finger proteins for unique addressingwithin complex genomes,Proceedings of the National Academy of Sciences,94(11):5525-5530。

定制设计的内切核酸酶的另一个示例包括TALE核酸酶(TALEN),其基于融合到核酸酶(例如,FokI或其变体)的催化结构域的细菌属黄单胞菌(Xanthomonas)的转录激活子样效应物核酸酶(TALE))。这些TALE的DNA结合特异性由串联排列的34/35个氨基酸重复单元的重复可变二残基(RVD)定义,从而使得RVD特异性地识别靶DNA中的一个核苷酸。可以组装重复单元以基本识别任何靶序列,并且可以将重复单元与核酸酶的催化结构域融合以产生序列特异性内切核酸酶(参见例如,Boch等,(2009),Breaking the code of DNAbinding specificity of TAL-type III effectors,Science,326(5959),509-1512;Moscou&Bogdanove(2009)。A simple cipher governs DNA recognition by TALeffectors,Science,326(5959),1501-1501;以及WO2010/079430、WO2011/072246、WO2011/154393、WO2011/146121、WO2012/001527、WO2012/093833、WO2012/104729、WO2012/138927、WO2012/138939)。WO2012/138927还描述了单体(紧凑型)TALEN和具有各种催化结构域的TALE及其组合。

最近,已经描述了一种新型的可定制内切核酸酶系统,即所谓的CRISPR/Cas系统。CRISPR系统在其自然环境中描述了一种分子复合物,该分子复合物包含至少一个与可制备特异性DNA双链断裂的Cas核酸酶或另一种CRISPR核酸酶(如Cpf1核酸酶)或Csm1核酸酶(Zetsche等,“Cpf1是2类CRISPR-Cas系统的单RNA指导内切核酸酶”,细胞(Cell),163,第1-13页,2015年10月;US 2017/0233756 A1)结合的非编码RNA。目前,CRISPR系统分为两类,包括五种类型的CRISPR系统,例如用Cas9作为效应物的II型系统,以及用Cpf1作为效应分子的V型系统(Makarova等,Nature Rev.Microbiol.,2015)。在人工CRISPR系统中,可以将合成的非编码RNA和CRISPR核酸酶和/或可选的修饰的CRISPR核酸酶(修饰用作切口酶或缺乏任何核酸酶功能)与至少一种合成或人工导向RNA或gRNA和/或tracrRNA结合使用(Makarova等,2015,同上)。CRISPR/Cas在自然系统中介导的免疫应答需要CRISPR-RNA(crRNA),其中控制CRISPR核酸酶特异性激活的该导向RNA的成熟在迄今为止已表征的各种CRISPR系统之间存在显著差异。首先,将入侵DNA(也称为间隔区域)整合到CRISPR基因座近端的两个相邻重复区域之间。II型CRISPR系统将Cas9核酸酶编码为干扰步骤的关键酶,该系统既包含crRNA,又包含反式激活RNA(tracrRNA)作为指导基序。这些杂交并形成双链(ds)RNA区域,其被RNAseIII识别并可以进行裂解以形成成熟的crRNA。然后,这些反过来又与Cas分子缔合,以便将核酸酶特异性地引导至靶核酸区域。重组gRNA分子既可包含可变DNA识别区域,也可包含Cas相互作用区域,因此可以独立于特异性靶核酸和所需的Cas核酸酶进行专门设计。

作为另一种安全机制,靶核酸区域中必须存在PAM(与前间隔区域邻近基序);这些是直接来自Cas9/RNA复合物识别DNA的DNA序列。来自酿脓链球菌的Cas9的PAM序列已被描述为“NGG”或“NAG”(标准IUPAC核苷酸代码)(Jinek等,“A programmable dual-RNA-guidedDNA endonuclease in adaptive bacterial immunity”,Science 2012,337:816-821)。来自金黄色葡萄球菌的Cas9的PAM序列是“NNGRRT”或“NNGRR(N)”。其他变体CRISPR/Cas9系统是公知的。因此,脑膜炎双球菌Cas9在PAM序列NNNNGATT处裂解。嗜热链球菌Cas9在PAM序列NNAGAAW处裂解。最近,已经描述了用于弯曲杆菌的CRISPR系统的另一种PAM基序NNNNRYAC(WO2016/021973A1)。对于Cpf1核酸酶,与通常由Cas9系统识别的富含G的PAM相反,没有tracrRNA的Cpf1-crRNA复合物有效地识别和裂解由较短的富TPAM进行的靶DNA(Zetsche等,同上)。此外,通过使用修饰的CRISPR多肽,可以获得特异性单链断裂。Cas切口酶与各种重组gRNA的组合使用还可通过双DNA切口诱导高度特异性DNA双链断裂。此外,通过使用两个gRNA,可以优化DNA结合的特异性,从而可以优化DNA裂解。同时,还有其他最初针对细菌描述的CRISPR效应物,如CasX和CasY效应物,它们代表了其他效应物,可用于基因组工程化目的(Burstein等,“New CRISPR-Cas systems from uncultivated microbes”,Nature,2017,542,237-241)。

DSBI/SSBI酶的裂解位点与DNA或RNA上诱导断裂的确切位置有关。裂解位点可包含在(重叠)DSBI/SSBI酶的识别位点中,也可以不包含在(重叠)该位点上,因此可以说DSBI/SSBI酶的裂解位点位于其识别位点处或附近。DSBI/SSBI酶的识别位点,有时也称为结合位点,是由DSBI/SSBI酶(特异性)识别并确定其结合特异性的核苷酸序列。例如,TALEN或ZNF单体具有分别由其RVD重复或ZF重复确定的识别位点,而其裂解位点由其核酸酶结构域(例如,FokI)确定,并且通常位于识别位点之外。在二聚TALEN或ZFN的情况下,裂解位点位于相应单体的两个识别/结合位点之间,其中发生裂解的中间DNA或RNA区域称为间隔子区域。

本领域技术人员将能够选择识别特定识别位点并在预选/预定位点处或附近的裂解位点诱导DSB或SSB的DSBI/SSBI酶,或设计此类DSBI/SSBI酶。或者,可以使用任何常规转化方法或通过与在其基因组中具有DSBI/SSBI酶识别位点的生物体杂交,将DSBI/SSBI酶识别位点导入靶基因组中,然后可以在DSBI/SSBI酶的裂解位点处或附近导入任何所需的核酸。

在各种实施方案中,在基因组的修饰中包含以下一种或多种:i)至少一个核苷酸的置换;ii)至少一个核苷酸的缺失;iii)至少一个核苷酸的插入;iv)DNA甲基化的改变;以及v)组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化的改变。

在一些实施方案中,基因组工程化组分的活性诱导植物细胞的基因组中的一个或多个双链断裂、植物细胞的基因组中的一个或多个单链断裂、植物细胞的基因组中的一个或多个碱基编辑事件或植物细胞的基因组中的DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化中的一种或多种。

在一些实施方案中,在诱导一个或多个双链断裂或一个或多个单链断裂之后进行非同源末端连接(NHEJ)和/或通过同源重组机制(HDR)对断裂进行同源性定向修复。NHEJ和HDR是修复断裂的两个主要及显著的途径。同源重组需要作为模板的同源序列(例如,修复核酸分子或“供体”)的存在以指导细胞修复过程,并且修复的结果是无错误且可预测的。在用于同源重组的模板(或修复核酸分子或“供体”)序列缺失时,细胞通常尝试通过非同源末端连接(NHEJ)过程修复断裂。

在该实施方案的特别优选的方面,将修复核酸分子另外导入植物细胞中。“修复核酸分子”是单链或双链DNA分子或RNA分子,其用作修饰裂解位点处或附近的预选位点的基因组DNA或RNA的模板。在一些实施方案中,修复核酸分子用作修饰基因组DNA的模板,其中通过在预选位点两侧的侧翼区域和相应的同源区域之间的同源重组,可选地与修复核酸分子的两端中的一端处的非同源末端连接(NHEJ)组合(例如在只有一个侧翼区域的情况下),而在预定位点复制或整合修复核酸分子。通过同源重组的整合使得修复核酸分子能够精确地连接至靶基因组直至核苷酸水平,而NHEJ可导致修复核酸分子与基因组DNA之间的连接处的小插入/缺失。

在本文所描述方面的各种实施例中,发生基因组的修饰,其中基因组已经由至少一个核苷酸改变。可以通过插入转基因,优选地表达包含感兴趣的转基因的表达,置换至少一个核苷酸和/或缺失至少一个核苷酸和/或插入至少一个核苷酸而发生基因组的修饰,只要与修饰前的预选基因组靶位点的核苷酸序列相比导致至少一个核苷酸发生总改变,从而可以鉴定修饰,例如通过本领域技术人员熟知的诸如测序或PCR分析等的技术。

基因组的修饰可发生在预选位点、预定位点或预定义位点,即在基因组(例如,核基因组或叶绿体基因组)中期望插入、置换和/或缺失一个或多个核苷酸的特定核苷酸序列。例如,预选位点、预定位点或预定义位点可以是在先前导入的外来DNA、RNA或转基因中或与之连接的内源基因座或特定核苷酸序列。该预选位点可以是特定的核苷酸位置,该位置意在插入一个或多个核苷酸。预选位点还可以包含一个或多个要交换(置换)或缺失的核苷酸的序列。

在各种实施例中,选择侧翼区域的长度和序列同一性百分比,以使得能够在该侧翼区域与它们在预选位点上游或下游的相应DNA区域之间进行同源重组。与修复核酸分子的侧翼DNA区域具有同源性的位于预选位点侧翼的DNA区域也被称为基因组DNA中的一个或多个同源区域。

为了具有足够的重组同源性,修复核酸分子的侧翼DNA区域的长度可有所不同,并且长度应至少为约10nt、约15nt、约20nt、约25nt、约30nt、约40nt或约50nt。然而,侧翼区域可以尽可能长(例如,高达约100-150kb,例如完整的细菌人工染色体(BAC))。优选地,侧翼区域将为约50nt至约2000nt,例如约100nt、200nt、500nt或1000nt。此外,位于感兴趣的DNA两侧的区域不必与同源区域(位于预选位点两侧的DNA区域)相同,并且可具有与预选位点两侧的DNA区域约80%至约100%的序列同一性,优选地为约95%至约100%的序列同一性。侧翼区域越长,对同源性的要求越不严格。此外,为了在不改变相邻DNA序列的DNA序列的情况下实现预选位点处的靶DNA序列的交换,侧翼DNA序列应优选与在预选位点两侧的上游和下游DNA区域相同。

为了在预选位点处进行靶序列修饰,必须选择侧翼区域,使得上游侧翼区域的3'端和/或下游侧翼区域的5'端与预定义位点的端部对齐。这样,上游侧翼区域的3'端确定预定义位点的5'端,而下游侧翼区域的5'端确定预定义位点的3'端。

该预选位点位于该裂解(和/或识别)位点之外或远离该裂解(和/或识别)位点,使得欲进行基因组修饰的位点(预选位点)不包含裂解位点和/或DSBI/SSBI酶的识别位点,使得预选位点与裂解(和/或识别)位点不重叠。因此,在这方面之外/远离这方面是指裂解(和/或识别)位点的上游或下游。

在各种实施方案中,根据本发明的至少一种碱基编辑器与至少一种位点特异性DSBI/SSBI酶复合物或至少一种修饰的位点特异性DSBI/SSBI酶复合物或任选地与该至少一种位点特异性DSBI/SSBI酶复合物的部分暂时或永久连接。该连接可以是共价和/或非共价的。可以将本文公开的任何碱基编辑器或位点特异性DSBI/SSBI酶复合物或其催化活性片段,或碱基编辑器复合物或位点特异性DSBI/SSBI酶复合物的任何部分作为代表或编码DNA、RNA或蛋白质效应物的核酸片段导入细胞,或其可以作为DNA、RNA和/或蛋白质或其任何组合导入。

碱基编辑器是具有介导靶碱基修饰能力的蛋白质或其片段,即,感兴趣的碱基的转变导致感兴趣的点突变。优选地,在本发明的上下文中,将至少一种碱基编辑器暂时或永久地融合至至少一种DSBI/SSBI酶,或任选地融合至至少一种DSBI/SSBI的部分。融合可以是共价和/或非共价的。多个出版物已显示,使用CRISPR/Cas9切口酶或与胞苷脱氨酶结构域连接的非功能性核酸酶,载脂蛋白B mRNA编辑酶催化多肽(APOBEC1)(例如来自大鼠的APOBEC)的靶碱基转变,主要从胞嘧啶(C)转变为胸腺嘧啶(T)。由胞嘧啶脱氨酶催化胞嘧啶(C)的脱氨基,并产生具有胸腺嘧啶(T)的碱基配对特性的尿嘧啶(U)。大多数已知的胞苷脱氨酶作用于RNA上,并且已知接受DNA的少数实例需要单链(ss)DNA。对dCas9-靶DNA复合物的研究揭示了,在形成Cas9-导向RNA-DNA“R-环”复合物后,置换的DNA链的至少九个核苷酸(nt)不配对(Jore et等,Nat.Struct.Mol.Biol.,18,529-536(2011))。确实,在Cas9 R-环复合物的结构中,被置换的DNA链上的前间隔序列的前11个nt是无序的,其表明它们的运动不被高度限制。还已经推测,Cas9切口酶诱导的在非模板链的胞嘧啶中的突变可能是由细胞胞嘧啶脱氨酶对它们的可及性引起。有理由认为,R-环中此ssDNA片段的子集可以作为dCas9-连接的胞苷脱氨酶的有效底物以实现DNA中C到U的直接可编程转变(Komor等,同上)。最近,Goudelli等(Programmable base editing of A·T to G·C in genomic DNAwithout DNAcleavage,Nature,2017,551(7681),464,描述了介导基因组DNA中的A·T至G·C转变的腺嘌呤碱基编辑器(ABE)。

在本领域中已经鉴定了影响DNA甲基化的酶以及组蛋白修饰酶。组蛋白翻译后修饰在调节染色质结构和基因表达中起重要作用。例如,在Sterner D.E.,Berger S.L(2000年6月):“Acetylation of histones and transcription-related factors”,Microbiol.Mol.Biol.Rev.64(2):435–59中描述的用于组蛋白乙酰化的酶。影响组蛋白甲基化的酶描述于Zhang Y.,Reinberg D(2001):“Transcription regulation by histonemethylation:interplay between different covalent modifications of the corehistone tails”,Genes Dev.15(18):2343–60。组蛋白的泛素化描述于Shilatifard A(2006):“Chromatin modifications by methylation and ubiquitination:implications in the regulation of gene expression”,Annu.Rev.Biochem.75:243–69。用于组蛋白磷酸化的酶描述于Nowak S.J.,Corces V.G.(2004年4月):“Phosphorylation of histone H3:a balancing act between chromosomecondensation and transcriptional activation”,Trends genet.20(4):214–20。用于组蛋白SUMO化的酶描述于Nathan D.,Ingvarsdottir K.,Sterner D.E.等,(2006年4月):“Histone sumoylation is a negative regulator in Saccharomyces cerevisiae andshows dynamic interplay with positive-acting histone modifications”,GenesDev.20(8):966–76。用于组蛋白核糖基化的酶描述于Hassa P.O.,Haenni S.S.,Elser M.,Hottiger M.O.(2006年9月):“Nuclear ADP-ribosylation reactions in mammaliancells:where are we today and where are we going?”,Microbiol.Mol.Biol.Rev.70(3):789–829。组蛋白瓜氨酸化被例如称为肽基精氨酸脱亚胺酶4(PAD4,也称为PADI4)的酶催化,其将组蛋白精氨酸(Arg)和单甲基精氨酸残基均转化为瓜氨酸。

可将影响DNA甲基化的酶和组蛋白修饰酶与解除武装的DSB或SSB诱导酶融合,所述解除武装的DSB或SSB诱导酶优选识别该细胞的基因组中的预定位点。

在植物细胞中用于遗传修饰的方法的各种实施方案中,转基因选自编码对非生物胁迫具有抗性或耐受性的基因,该非生物胁迫包括干旱胁迫、渗透胁迫、热胁迫、冷胁迫、氧化胁迫、重金属胁迫、氮缺乏、磷缺乏、盐胁迫或涝渍,编码除草剂抗性的基因,该除草剂抗性包括对草甘膦、草铵膦/草丁膦、潮霉素、原卟啉原氧化酶(PPO)抑制剂、ALS抑制剂和Dicamba的抗性,编码对生物胁迫具有抗性或耐受性的基因,该对生物胁迫具有抗性或耐受性的基因包括病毒抗性基因、真菌抗性基因、细菌抗性基因、昆虫抗性基因,或编码与产量相关的性状的基因,该性状包括倒伏抗性、开花时间、抗脱粒性、种子颜色、胚乳组分或营养成分。

在植物细胞中用于遗传修饰的方法的各种实施方案中,该方法有效地促进细胞增殖或细胞再生,或有效地提高转基因、基因编辑或碱基编辑的植物的再生效率。该方法优选在遗传修饰/基因组修饰后有效。在植物细胞中用于遗传修饰的方法的各种实施方案中,该方法有效地诱导来自单个细胞(优选胚胎细胞、体细胞或原生质体)或来自愈伤组织细胞或来自愈伤组织细胞的直接或间接(体细胞)胚胎发生。该方法优选在遗传修饰/基因组修饰后有效。在各种实施方案中,该方法有效地提高转基因进入植物细胞的稳定转化效率,或者有效地提高产生经遗传修饰的植物的效率。在各种实施方案中,该方法有效地提高基因组工程化组分编辑植物细胞的基因组的效率,或者有效地提高产生转基因、基因编辑或碱基编辑的植物的效率。

在一些实施方案中,该方法有效地改善源自顽抗基因型的植物的再生效率,有效地改善非常规组织类型的植物的再生效率,或有效地加速再生过程,优选地在遗传修饰/基因组的修饰之后。

还提供了植物细胞中瞬时表达加强子多肽和/或加强基因的方法。该方法包含将(i)加强子多肽、本文所述的核酸、重组基因或DNA构建体;和(ii)转基因和/或基因组工程化组分导入植物细胞中。

在一些实施方案中,加强子多肽和加强基因中的一个或多个被瞬时共表达。共表达可能有效地促进细胞增殖。这种共表达可能有效地促进细胞再生。共表达可以有效地诱导来自单个细胞的胚胎发生,并因此提供无需选择可再生同种植物的能力。共表达可以通过与基因组编辑组分共同递送来改善基因组编辑效率。共表达可以包含瞬时共导入加强多肽(例如,KWS-RBP-1)以及一个或多个编码加强基因(例如,PLT5、PLT7、RKD4和RKD2)的核酸。

加强子多肽和/或一个或多个加强基因的瞬时共同递送可以如美国临时申请No.62/685,626(通过引用整体并入本文)中进行。

在各种实施方案中,如美国临时申请No.62/685,626中所述,可以递送其他加强因子诸如化学物质HDACi和植物激素。

在一些实施方案中,加强子多肽在植物细胞中瞬时存在、有瞬时活性的和/或瞬时表达。在一些实施方案中,编码加强子多肽的核酸在植物细胞中瞬时存在、有瞬时活性的和/或瞬时表达。可将选自PLT5多肽、PLT7多肽的一种或多种多肽和/或选自编码PLT5多肽、多肽和RKD2多肽的核酸的一种或多种核酸和/或适合于瞬时提高内源性PLT5多肽、内源性PLT7多肽或内源性RKD2多肽的表达的一个或多个定点转录激活子和/或编码这种定点转录激活子的核酸导入植物细胞。

瞬时表达可以通过加强蛋白质/多肽或编码该蛋白质/多肽的核酸片段的瞬时转化/转染来进行,优选在强组成型启动子下表达。编码PLT5多肽的核酸、编码PLT7多肽的核酸和/或适合于瞬时提高内源性PLT5多肽、内源性PLT7多肽的表达的一个或多个定点转录激活子的瞬时表达也可通过在组织和发育特异性启动子或诱导型启动子的控制下稳定转化加强基因来实现。该加强基因可以被表达且然后有瞬时活性的。然后,当植物细胞发育改变或诱导条件消除时,可以很快关闭并降解加强基因。例如,来自短柄草属EF1基因的强组成型启动子pBdEF1(SEQ ID NO:23)可用于驱动加强基因以进行瞬时转化(参见,例如实施例1)。

瞬时表达可产生自瞬时转染、瞬时转化和稳定转化中的任何一种。“瞬时转化”和“瞬时转染”包含将外来材料[即核酸片段、蛋白质、核糖核蛋白(RNP)等]转移进宿主细胞,从而导致无需整合和稳定遗传外来材料的基因表达和/或活性。外来组分不是永久性地掺入细胞基因组中,而是提供暂时的作用导致基因组的修饰。瞬时转化事件可能不能传递给下一代,及因此是不可遗传的。“稳定转化”是指转移的核酸片段被整合到宿主细胞的基因组(包括核和细胞器基因组)中导致核酸片段稳定遗传的事件。

例如,瞬时表达可用于瞬时基因组编辑。基因组工程化组分在植物细胞中的瞬时活性和/或瞬时存在可导致在植物细胞的基因组中导入一个或多个双链断裂、在植物细胞的基因组中导入一个或多个单链断裂、或在植物细胞的基因组中导入DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化中的一个或多个。在植物细胞的基因组中所产生的修饰可以例如选自至少一个核苷酸的置换,至少一个核苷酸的缺失,至少一个核苷酸的插入、DNA甲基化的改变,组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化的改变,或其组合。

定点转录激活子意指美国临时申请No.62/609,508(其通过引用并入本文)中描述的合成转录因子。合成转录因子可以包含至少一个识别结构域和至少一个基因表达调节结构域,特别是激活结构域,其中合成转录因子被配置为调节植物或植物细胞的基因组中内源基因的表达。这种内源基因优选是(天然)形态发生基因,其编码参与植物发育过程如根形成或芽形成的多肽。在一些实施方案中,内源性形态发生基因选自编码PLT5多肽的内源核酸、编码PLT7多肽的内源核酸、编码RKD4多肽的内源核酸或编码RKD2多肽的内源核酸的组合。在一些实施方案中,至少一个识别结构域是选自以下的分子的片段:至少一个TAL效应物、至少一个解除武装的CRISPR/核酸酶系统、至少一个锌指结构域和至少一种解除武装的归巢内切核酸酶,或其任何组合。

在一些实施方案中,至少一个解除武装的CRISPR/核酸酶系统是CRISPR/dCas9系统、CRISPR/dCpf1系统、CRISPR/dCsm1系统、CRISPR/dCasX系统或CRISPR/dCasY系统、或其任何组合,并且其中至少一个解除武装的CRISPR/核酸酶系统包含至少一个导向RNA。

在一些实施方案中,该至少一个激活结构域选自酸性转录激活结构域,优选地,该至少一个激活结构域来自稻白叶枯病黄杆菌的TAL效应物基因,来自单纯疱疹的VP16或四聚体VP64,VPR、SAM、Scaffold、Suntag、P300、VP160或其任何组合。在一些实施例中,激活结构域是VP64。

在一些实施方案中,合成转录因子被配置为通过结合至位于与起始密码子一定距离的调控区域来调节形态发生基因的表达,优选地转录。在优选的实施方案中,合成转录因子被配置为通过结合至位于与起始密码子一定距离的调控区域来提高形态发生基因的表达,优选地转录

在一些实施方案中,定点转录激活子/合成转录因子或其编码的核酸包含至少一个识别结构域和至少一个激活结构域,其中定点转录激活子被配置为提高内源性PLT5多肽、内源性PLT7多肽、内源性RKD4多肽或内源性RKD2多肽的表达,优选地通过结合至位于与内源性PLT5多肽、内源性PLT7多肽、内源性RKD4多肽或内源性RKD2多肽的起始密码子一定距离的调控区域。

如本文所用的,“调控区域”是指至少一个识别结构域与基因组中感兴趣的形态发生基因处或附近的靶序列的结合位点。取决于本文进一步公开的至少一个激活结构域和至少一个识别结构域的性质,可存在两个离散调控区域,或可存在重叠调控区域,本发明的合成转录因子的不同结构域可以以模块化的方式进行组装。

在某些实施方案中,该至少一个识别结构域可靶向相对于感兴趣的基因的起始密码子的至少一个序列(识别位点),该序列可以是至少1000bp,相对于感兴趣的基因起始密码子的上游(-)或下游(+)-700bp至+700bp、-550bp至+500bp或-550bp至+425bp。在某些实施方案中,识别启动子附近的识别结构域可能是优选的,而这表示了本发明的特异性STF的优点,即,STF的靶向范围比常规或天然存在的TF进行了高度扩展。由于识别和/或激活结构域可以被专门设计和构建以特异性识别和靶向调控的热点。

在某些实施方案中,该至少一个识别位点可以是相对于感兴趣的基因的起始密码子-169bp至-4bp、-101bp至-48bp、-104至-42bp或-175至+450bp(上游(-)或下游(+)),以提供最佳的空间结合环境,从而实现最佳的调控(优选地是转录激活)活性。特别是对于根据本发明的基于CRISPR的合成转录因子,其与作为识别部分的导向RNA一起起作用,该结合位点也可位于感兴趣的基因的编码区域内(感兴趣的基因的起始密码子的下游)。

在其他实施方案中,本发明的合成转录因子的识别结构域可结合至感兴趣的基因的5'和/或3'非翻译区域(UTR)。在实施方案中,在采用不同的识别结构域的情况下,至少两个识别结构域可结合至感兴趣的形态发生基因的不同靶区域,包括5'和/或3'UTR,但是它们也可以在基因区域之外结合,但是仍然在最多1到1500bp的特定距离内。可以结合识别结构域的一个优选区域位于感兴趣的形态发生基因的起始密码子上游约-4bp至约-300bp,优选地约-40bp至约-170bp。此外,识别结构域的长度以及由此感兴趣基因组中的相应识别位点的长度可以因此取决于所述合成转录因子和所应用的识别结构域的性质而变化。基于至少一个识别结构域的分子特征,这还将确定相应的至少一个识别位点的长度。例如,在单个锌指可以为约8bp至约20bp,其中三至六个锌指基序之间的阵列可能是优选的,在这种情况下,单个TALE识别位点可以为约11至约30bp,或更多。基于CRISPR的STF的gRNA的识别位点包含与感兴趣的基因组区域杂交的gRNA的靶向序列或“间隔子”序列,而gRNA包含其他结构域,包括与根据本发明的解除武装的CRISPR效应物相互作用的结构域。基于解除武装的CRISPR效应物的STF的识别位点将包含一个PAM基序,因为PAM序列对于任何CRISPR效应物的靶标结合都是必需的,确切的序列取决于CRISPR效应物(即,本文公开的解除武装的CRISPR效应物)的种类。

加强子和/或基因组工程化组分可以作为蛋白质/多肽或作为编码蛋白质/多肽的核酸,特别是作为蛋白质/多肽或诸如质粒DNA、RNA、mRNA或RNP之类的DNA导入。

加强子可以与一个或多个基因组工程化组分共同递送。如本文所用,“共同递送”或“共同-递送”和“共同导入”或“共同-导入”可互换使用。就本发明而言,“共导入”是指这样的过程,其中至少两个不同的组分同时被递送进同一植物细胞中。因此,基因组工程化组分和加强因子被一起导入同一植物细胞。优选地,通过单独的构建体导入两种类型的组分,加强子和感兴趣的基因。可以通过粒子轰击、显微注射、农杆菌属介导的转化、电穿孔、电融合、农杆菌浸润或真空浸润来共同导入进植物细胞。

据信转化的细胞比野生型细胞具有较差的可再生性。由于细胞内存在外来DNA,转化的细胞容易受到程序性细胞死亡。递送(例如轰击破坏)引起的应激也可能引发细胞死亡。因此,促进细胞分裂对于再生修饰的细胞至关重要。此外,基因组工程化效率很大程度上由宿主细胞状态控制。像植物分生组织中一样经历快速细胞分裂的细胞是基因组工程化的最合适受体。促进细胞分裂可能会提高DNA复制和分裂过程中的DNA整合或修饰,及因而提高基因组工程化效率。

根据本发明的加强基因和加强多肽、KWS-RBP1(SEQ ID NO:2)和KWS-RBP2(SEQ IDNO:48)是人造的,并且已被设计用来改善基因组工程化组分的活性。当将加强子多肽与转基因一起导入植物细胞,加强子多肽可以提高转基因和该转基因编码的多肽的表达。当将加强子多肽与基因组工程化组分和转基因一起导入植物细胞时,基因组工程化组分的活性可能提高。这种提高可以导致转基因更有效地整合进植物细胞的基因组中。一个或多个加强基因可以与加强子多肽共表达。一个或多个加强基因可以与加强子多肽共转染。

基于它们在促进细胞分裂和植物形态发生中所起的作用来选择这些额外加强基因。每个候选基因均由强组成型启动子克隆和驱动,并通过瞬时表达在玉米细胞中进行评估而无需选择。增强基因的实例是PLT5(PLETHORA5;SEQ ID NO:4和6)、PLT7(PLETHORA7;SEQ ID NO:8、10)和RKD2(SEQ ID NO:18、20和22)。

PLT(PLETHORA),也称为AIL(AINTEGUMENT-LIKE)基因,是转录调节子AP2家族的成员。转录因子AP2家族成员在植物的细胞增殖和胚胎发生中起重要作用(El Ouakfaoui,S.,Schnell,J.,Abdeen,A.,Colville,A.,Labbé,H.,Han,S.,Baum,B.,Laberge,S.,Miki,B(2010)Control of somatic embryogenesis and embryo development by AP2transcription factors.PLANT MOLECULAR BIOLOGY 74(4-5):313-326.)。PLT基因主要在芽和根的发育组织中表达,是干细胞稳态、细胞分裂和再生,以及器官原基模式化所必需的。

PLT家族包含由六个成员的AP2子分支。四个PLT成员,PLT1/AIL3、PLT2/AIL4、PLT3/AIL6和BBM/PLT4/AIL2在根尖分生组织(RAM)中部分重叠表达,并且在干细胞微环境内在正确的位置表达QC(静态中心)标记是必需的。这些基因对维持根尖分生组织的细胞分裂和防止细胞分化起冗余作用。

三个PLT基因,PLT3/AIL6,PLT5/AIL5和PLT7/AIL7在芽分生组织(shoot apicalmeristem)(SAM)中表达,它们在侧器官的定位和向外生长中起冗余作用。PLT3、PLT5和PLT7通过控制两个不同的发育事件来调节拟南芥中的新生芽再生。PLT3、PLT5和PLT7在分生组织的外围维持高水平的PIN1表达是必需的,并调节SAM中央区域的局部生长素生成,这是叶序转换(phyllotactic transitions)的基础。这三个基因功能的累积丧失导致中间细胞团、愈伤组织不能形成芽祖细胞,而诱导PLT5或PLT7则可以以激素非依赖性方式使芽再生。PLT3,PLT5,PLT7调节并需要芽促进因子CUP-SHAPED COTYLEDON2(CUC2)来完成芽形成程序。PLT3,PLT5和PLT7也在侧根生成细胞中表达,在侧根生成细胞中它们冗余地激活PLT1和PLT2的表达,并接着调节侧根形成。

额外加强基因可以来自本领域已知的任何数量的植物。这样的植物包括但不限于玉米、拟南芥和小麦。在一些实施方案中,加强基因是玉米PLT5。在一些实施方案中,加强基因是拟南芥PLT5。在一些实施方案中,加强基因可以是PLT7。在一些实施方案中,加强基因是拟南芥PLT7。在一些实施方案中,加强基因是小麦RKD4。在一些实施方案中,加强基因是拟南芥RKD4。在一些实施方案中,加强基因是玉米RKD4。在一些实施方案中,加强基因是小麦RKD2。在一些实施方案中,加强基因是拟南芥RKD2。在一些实施方案中,加强基因是玉米RKD2。

在一些实施方案中,将编码根据本发明的加强子多肽和PLT5多肽(由PLT5加强基因编码)的核酸导入植物细胞中,并且任选地瞬时共表达。在一些实施方案中,将编码根据本发明的加强子多肽和PLT7多肽(由PLT7加强基因编码)的核酸导入植物细胞中,并且任选地瞬时共表达。

由PLT5加强基因编码的多肽可包含与SEQ ID NO:4至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。由PLT5加强基因编码的多肽可包含SEQ ID NO:4的序列。由PLT5加强基因编码的多肽可包含与SEQ ID NO:6至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。由PLT5加强基因编码的多肽可包含SEQ ID NO:6的序列。

由玉米PLT5加强基因编码的多肽可以包含与SEQ ID NO:4至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。由玉米PLT5加强基因编码的多肽可以包含SEQ ID NO:4的序列。

拟南芥PLT5加强基因编码的多肽可包含与SEQ ID NO:6至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。拟南芥PLT5加强基因编码的多肽可包含SEQ ID NO:6的序列。

由PLT7加强基因编码的多肽可以包含与SEQ ID NO:8至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。由PLT7加强基因编码的多肽可以包含SEQ ID NO:8的序列。PLT7多肽可以包含与SEQ ID NO:10至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。由PLT7加强基因编码的多肽可以包含SEQ ID NO:10的序列。

由玉米PLT7加强基因编码的多肽可以包含与SEQ ID NO:8至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。由玉米PLT7加强基因编码的多肽可以包含SEQ ID NO:8的序列。

由拟南芥PLT7加强基因编码的多肽可以包含与SEQ ID NO:10至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。由拟南芥PLT7加强基因编码的多肽可以包含SEQ ID NO:10的序列。

RKD4加强基因编码的多肽可包含与SEQ ID NO:12至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。RKD4加强基因编码的多肽可包含SEQID NO:12的序列。RKD4加强基因编码的多肽可包含与SEQ ID NO:14至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。RKD4加强基因编码的多肽可包含SEQ ID NO:14的序列。RKD4加强基因编码的多肽可包含与SEQ ID NO:16至少60%,65%,70%,至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的相同的氨基酸序列。RKD4加强基因编码的多肽可包含SEQ ID NO:16的序列。

小麦RKD4加强基因编码的多肽可包含与SEQ ID NO:12至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。小麦RKD4加强基因编码的多肽可包含SEQ ID NO:12的序列。

拟南芥RKD4加强基因编码的多肽可包含与SEQ ID NO:14至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。拟南芥RKD4加强基因编码的多肽可包含SEQ ID NO:14的序列。

玉米RKD4加强基因编码的多肽可包含与SEQ ID NO:16至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。玉米RKD4加强基因编码的多肽可包含SEQ ID NO:16的序列。

RKD2加强基因编码的多肽可包含与SEQ ID NO:18至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。RKD2加强基因编码的多肽可包含SEQID NO:18的序列。RKD2加强基因编码的多肽可包含与SEQ ID NO:20至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。RKD2加强基因编码的多肽可包含SEQ ID NO:20的序列。RKD2加强基因编码的多肽可包含与SEQ ID NO:22至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。RKD2加强基因编码的多肽可包含SEQ ID NO:22的序列。

小麦RKD2加强基因编码的多肽可包含与SEQ ID NO:18至少60%、65%、70%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。小麦RKD2加强基因编码的多肽可包含SEQ ID NO:18的序列。

拟南芥RKD2加强基因编码的多肽可包含与SEQ ID NO:20至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。拟南芥RKD2加强基因编码的多肽可包含SEQ ID NO:20的序列。

玉米RKD2加强基因编码的多肽可包含与SEQ ID NO:22至少60%、65%、70%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。玉米RKD2加强基因编码的多肽可包含SEQ ID NO:22的序列。

在一些实施方案中,编码PLT5多肽的核酸包含SEQ ID NO:3或5的核苷酸序列的核酸。在一些实施方案中,编码PLT5多肽的核酸包含与与SEQ ID NO:3或5至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的核酸的互补链杂交的核酸,或包含SEQ ID NO:3或5的核苷酸序列。

在一些实施方案中,编码PLT7多肽的核酸包含SEQ ID NO:7或9的核苷酸序列的核酸。在一些实施方案中,编码PLT7多肽的核酸包含与SEQ ID NO:7或9至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的核酸。在一些实施方案中,编码PLT7多肽的核酸包含与与SEQ ID NO:7或9至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的核酸的互补链杂交的核酸,或包含SEQ ID NO:7或9的核苷酸序列。

在一些实施方案中,编码RKD4多肽的核酸包含SEQ ID NO:11、13或15的核苷酸序列的核酸。在一些实施方案中,编码RKD4多肽的核酸包含与SEQ ID NO:11、13或15至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的核酸。在一些实施方案中,编码RKD4多肽的核酸包含与与SEQ ID NO:11、13或15至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的核酸的互补链杂交的核酸,或包含SEQ ID NO:11、13或15的核苷酸序列。

在一些实施方案中,编码RKD2多肽的核酸包含SEQ ID NO:17、19或21的核苷酸序列的核酸。在一些实施方案中,编码RKD2多肽的核酸包含与SEQ ID NO:17、19或21至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的核酸。在一些实施方案中,编码RKD2多肽的核酸包含与与SEQ ID NO:17、19或21至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列的核酸的互补链杂交的核酸,或包含SEQ ID NO:17、19或21的核苷酸序列。

为了本发明的目的,两个相关核苷酸或氨基酸序列的“序列同一性”(以百分比表示)是指在两个具有相同残基(x100)的最优比对序列中的位置数除以比较的位置数。缺口,即在一个序列中存在而另一个序列不存在的残基的比对中的位置,被认为是具有非相同残基的位置。通过Needleman和Wunsch算法(Needleman和Wunsch 1970)进行两个序列的比对。上面的计算机辅助序列比对可以使用标准软件程序诸如在European Molecular BiologyOpen Software Suite(EMBOSS)如版本6.3.1.2(Trends in genetics 16(6),276(2000))(其默认参数例如为对于蛋白质矩阵=EBLOSUM62,gapopen=10.0,gapextend=0.5)中实施的NEEDLE程序方便地进行。

如本文所用,术语“杂交”是指通过互补核苷酸的碱基配对在两个核酸分子之间杂交体的形成。术语“在严格条件杂交”是指在特定条件的杂交。这样的条件的一个实例包括这样的条件,在该条件,基本互补性的链(即由具有至少80%互补性的核苷酸序列组成的链)与给定的链杂交,而较低互补性的链不杂交。或者,这些条件是指钠盐浓度、温度和洗涤条件的特定杂交条件。例如,高度严格的条件包含在42℃、50%甲酰胺、5x SSC(150mMNaCl、15mM柠檬酸三钠)、50mM磷酸钠、5x Denhardt溶液、10x硫酸葡聚糖、20mg/1ml剪切的鲑鱼精子DNA并在约65℃的0.2x SSC(SSC代表0.15M氯化钠和0.015M柠檬酸三钠缓冲液)中洗涤。或者,高度严格的条件可意指在68℃于0.25M磷酸钠、pH 7.2、7%SDDS、1mM EDTA和1%BSA中杂交16小时,并在68℃用2x SSC和0.1%SDDS洗涤两次。进一步可选地,高度严格的杂交条件例如是:在65℃在4×SSC中杂交,然后在65℃在0.1×SSC中多次洗涤总共约1小时,或在68℃在0.25M磷酸钠、pH 7.2、7%SDS、1mM EDTA和1%BSA中杂交16小时,然后在68℃用2x SSC和0.1%SDS洗涤两次。

表观遗传调控化学物质,例如蛋白质脱乙酰基酶抑制剂(ii.1),可以与基因组工程化组分共同导入。根据本发明使用的示例性表观遗传调控化学物质包括但不限于组蛋白脱乙酰基酶抑制剂(HDACis)诸如制滴菌素A(trichostatin A)(TSA)和DNA甲基转移酶抑制剂。

据假设共同递送的表观遗传调控化学物质(ii.1)(特别是HDACis)松弛植物的染色质结构,促进轰击细胞中DNA对基因组工程化组分的可及性,因而接着促进基因组工程化(即转化和基因组编辑)效率。这种假设的原因是:遗传物质的基本结构和功能单元是核小体,其中带负电荷的DNA包裹在带正电荷的组蛋白八聚体和相关的连接子组蛋白周围。核小体单元进一步折叠并堆积成染色质(Andrews,A.J.,和Luger,K.(2011).Nucleosomestructure(s)and stability:Variations on a theme.Annu.Rev.Biophys.40:99–117)。DNA的可及性很大程度上取决于核小体和染色质的紧密度。染色质重塑酶可动态修饰组蛋白的赖氨酸或其他氨基酸,其导致它们电荷以及与DNA和其他蛋白质的相互作用的改变,并导致染色质折叠或解折叠(Bannister A.J.,Kouzarides T.(2011)Regulation ofchromatin by histone modifications.Cell Res21:381–95)。通过添加或去除乙酰基,组蛋白中赖氨酸残基的乙酰化和脱乙酰化通常参与真核生物染色质结构的可逆调节,并介导染色质可及性和基因表达调控。组蛋白脱乙酰基酶(HDAC)是从位于组蛋白的N末端尾部的赖氨酸残基去除乙酰基的酶,其使组蛋白带更多正电荷,并因此使组蛋白更紧地包裹DNA。抑制HDAC可能有助于染色质解折叠,并使DNA更易接近。

染色质重塑和其他表观遗传修饰无疑在调控细胞全能和再生中起重要作用(Zhang,H.,和Ogas,J.(2009).An epigenetic perspective on developmentalregulation of seed genes.Mol.Plant 2:610–627)。已经证明组蛋白脱乙酰基酶(HDAC)活性的抑制与植物再生和小孢子胚胎发生有关(Miguel,C.,和Marum,L.,2011.Anepigenetic view of plant cells cultured in vitro:somaclonal variation andbeyond.J.Exp.Bot.62:3713–3725.,Li Hui et al.(2014)The Histone DeacetylaseInhibitor Trichostatin A Promotes Totipotency in the Male Gametophyte Plantcell,26:195–209)。HDAC活性或下游HDAC介导的途径的抑制在应激诱导的单倍体胚胎发生中起主要作用。一种这样的HDACi是制滴菌素A(TSA)。已证明TSA在欧洲油菜的雄配子体中诱导大量的胚胎发生细胞增殖。TSA处理导致培养的小孢子和花粉中高频率的孢子体细胞分裂。

在一种或多种表观遗传调节化学物质例如蛋白脱乙酰酶抑制剂特别是HDACi存在下,可以使用各种方法来进一步提高基因组工程化效率。这样的HDACi可以是制滴菌素A(TSA)、N-羟基-7-(4-二甲基氨基苯甲酰基)-氨基庚酰胺(M344)、辛二酰苯胺异羟肟酸(SAHA)或其他。这些HDAC选自基于异羟肟酸(HA)的化学物质,其目标是锌依赖性HDAC。

在各种实施方案中,将一种或多种植物激素,例如植物生长素和细胞分裂素,例如2,4-D、6-苄基氨基嘌呤(6-BA)玉米素,与一种或多种加强基因、加强子多肽、基因组工程化组分和一个转基因共同递送。

植物体细胞能够通过体细胞胚胎发生或器官发生而在体外培养中恢复细胞分裂并再生为整个植物,这主要取决于植物激素诸如植物生长素和细胞分裂素。在本发明中,发现植物激素促进细胞增殖,提高植物细胞对基因组工程化的敏感性,并因此改善基因组工程化(即转化和基因组编辑)的效率。

植物生长素之一是2,4-二氯苯氧基乙酸(2,4-D),其对于单子叶植物例如玉米和小麦的体细胞胚胎发生和细胞再生几乎是必不可少的。同时,细胞分裂素例如6苄基氨基嘌呤(6-BA)或玉米素对植物器官发生、芽分生组织的形成和发育至关重要。改善基因组工程化效率的方法可以包括与基因组工程化组分共同递送一种或多种植物激素(2,4-D、6-BA、玉米素等)。

基因组工程化组分和至少一种表观遗传调控的化学物质和植物激素可以共导入一个植物细胞中。

如本文所用,“共同递送”或“共同-递送”和“共同导入”或“共同-导入”可互换使用。就本发明而言,“共导入”是指这样的过程,其中至少两个不同的组分同时被递送进同一植物细胞中。因此,可以将基因组工程化组分和至少一种表观遗传调节的化学物质和植物激素一起导入同一植物细胞中。

可以通过粒子轰击、显微注射、农杆菌属介导的转化、电穿孔、农杆菌浸润或真空浸润来共同导入进植物细胞。根据本发明,基于物理递送(如粒子轰击、显微注射、电穿孔、纳米颗粒和细胞穿透肽(CPP))的方法特别优选用于共同导入加强基因、加强子多肽、基因组工程化组分和/或转基因。特别优选的是通过粒子轰击共同导入。

根据本发明的另一方面,经遗传修饰的植物细胞可以再生为完整(可育)植物。因此,在本发明的优选方面,在植物细胞的遗传修饰之后是再生植物的步骤。因此,本发明提供了一种生产经遗传修饰的植物的方法,包括以下步骤:

a)根据上述用于在植物细胞中进行遗传修饰的任何方法对植物细胞进行遗传修饰,和

b)从步骤a)的修饰的植物细胞再生植物,

单个细胞或多细胞增殖并发展成组织、器官、及最后是整个植物。在一些实施方案中,产生的植物不包含在步骤a)中导入或共同导入的任何基因组工程化组分、加强基因和加强子多肽。再生植物的步骤b)可以例如包含在再生培养基上培养来自步骤a)的经遗传修饰的植物细胞。

植物再生的效率或提高植物细胞再生能力的方法可以通过将本文所述的任何加强子多肽、加强基因、核酸、重组基因和DNA构建体结合导入植物细胞中来改善。

本发明还提供了通过上述产生经遗传修饰的植物或其后代植物的方法获得或可获得的经遗传修饰的植物。经遗传修饰的植物可包含本文所述的任何经遗传修饰的植物细胞。

在各种实施方案中,所产生的植物不包含导入或共同导入用于产生所产生的植物的植物细胞中的任何基因组工程化组分、加强基因和加强子多肽。

本发明还提供了无需常规选择的源于上述经遗传修饰的细胞的植物或种子。如本文所用,“常规选择”是指通过使用整合的选择标记例如抗生素(例如卡那霉素、潮霉素)或除草剂(例如草丁膦(phosphinothricin)、草甘膦)抗性基因,从野生型细胞中选择和纯化转化的细胞的任何方法。没有常规选择,此类植物或种子可能没有任何整合的基因组工程化组分,从而导致无转基因的遗传修饰植物。

遗传修饰可以是植物细胞基因组中的永久且可遗传的改变。可以使用含有微粒轰击、农杆菌属转化、电穿孔等在内的当前可用方法来进行植物组织培养和基因组工程化。可以通过使用可见报告基因,例如红色荧光tDTomato基因(tDT)(其编码异常亮的红色荧光蛋白,最大激发波长为554nm,最大发射波长为581nm)来监测转化和转基因表达。基因组编辑效率可以例如通过下一代测序(NGS)、qPCR、标记毛细管电泳分析和Droplet Digital PCR来分析。通过Sanger测序进一步证实了位点特异性修饰。

在加强基因、加强子多肽和一种或多种转基因存在下,通过基因组工程化组分的活性,在允许该植物细胞的基因组的遗传修饰的条件,可培养已导入或共同导入了加强基因、加强子多肽、基因组工程化组分和/或转基因的植物细胞。

如本文所用,“基因组的遗传修饰”包括任何类型的操作,使得内源核苷酸已被改变以包括突变诸如缺失、插入、转换、颠换或其组合。例如,可以缺失内源编码区域。此类突变可导致多肽具有与内源多核苷酸编码的氨基酸序列不同的氨基酸序列。遗传修饰的另一个实例是调控序列诸如启动子的改变以导致提高或减少可操作连接的内源编码区域的表达。

“适合”植物基因组的遗传修饰发生的条件诸如多核苷酸的切割,或“适合”条件是不能阻止此类事件发生的条件。因此,这些条件允许、增强、促进和/或有助于该事件。根据各个基因组工程化组分(i),这些条件可不同。

在本发明的方法中,优选用基因组工程化组分(i)和至少一种化合物(ii)瞬时转化植物细胞。如本文所用,“瞬时转化”是指外来材料[即核酸片段、蛋白质、核糖核蛋白(RNP)等]转移进宿主细胞从而导致基因表达和/或活性,而没有整合和稳定遗传该外来材料。因此,基因组工程化组分(i)在植物细胞中有瞬时活性的和/或瞬时存在。基因组工程化组分不是永久性地掺入细胞基因组中而是提供暂时的作用以导致基因组的修饰。例如,基因组工程化组分在植物细胞中的瞬时活性和/或瞬时存在可导致在植物细胞的基因组中导入一个或多个双链断裂、在植物细胞的基因组中导入一个或多个单链断裂、或在植物细胞的基因组中导入DNA甲基化、组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化中的一个或多个。

优选在导入一个或多个双链断裂或一个或多个单链断裂之后进行非同源末端连接(NHEJ)和/或通过同源重组机制对断裂进行同源定向修复(HDR)。

植物细胞的基因组中的所得修饰可以例如选自转基因优选地包含感兴趣的基因的表达盒的插入,至少一个核苷酸的置换,至少一个核苷酸的缺失,至少一个核苷酸的插入,DNA甲基化的改变,组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化的改变,或其组合。根据本发明的一个特别优选的方面,没有与所应用的基因编辑机制/系统有关的外源遗传物质被稳定地整合进植物细胞的基因组中。

遗传修饰可以是植物细胞基因组中的永久且可遗传的改变。

在各种实施方案中,可以包括用美国临时申请No.62/685,626中描述的一种或多种化学物质对植物材料进行预处理,该专利通过引用并入本文。因此,用于在植物细胞中进行遗传修饰的方法可以进一步包含对植物细胞进行预处理的步骤,该预处理包含在含有(1)表观遗传调控化学物质或其活性衍生物,特别是组蛋白脱乙酰基酶抑制剂(HDACi)或DNA甲基转移酶抑制剂,或(2)植物激素或其活性衍生物,或其任何组合的培养基中培养植物细胞或包含其的植物材料。

在预处理步骤之后,可以从含有化合物(1)和(2)中的至少一种的培养基中提取处理过的植物细胞,并用于共导入。

作为示例,对于组蛋白脱乙酰基酶抑制剂TSA,HDACis预处理的持续时间为10分钟至2天,优选2.0小时至24小时。用于预处理的TSA浓度为1.0nM至1000nM,优选10nM至100nM。此后,将处理过的植物材料转移至无HDACi的培养基中,并立即用于TSA共导入(长时间的TSA预处理可能会造成非选择性地增强细胞再生,这可能会提高回收被轰击和修饰的细胞的难度)。

相似的预处理条件可以应用于所有类型的化合物(1)和(2)。植物组织培养和基因组工程化可以使用目前可用的方法进行。可以使用红色荧光报告基因tdTomato(其编码异常亮的红色荧光蛋白,最大激发波长为554nm,最大发射波长为581nm)或绿色荧光报告基因mNeonGreen(其编码最亮的单体绿色或黄色荧光蛋白,最大激发波长为506nm,最大发射波长为517nm)监测瞬时转化和转基因表达。基因组编辑效率可以例如通过下一代测序(NGS)来分析。

在另一方面,提供了用上述加强子多肽、核酸、重组基因和DNA构建体中至少一个所包被的微粒。在一些实施方案中,微粒进一步用基因组工程化组分包被。

在另一方面,提供了一种通过微粒轰击对植物基因组进行遗传修饰的试剂盒,包括

(I)一种或多种微粒,以及

(II)包被该微粒的工具。

在一些实施方案中,试剂盒还包括用于用基因组工程化组分包被微粒的工具。

在各种实施方案中,微粒至少用以下包被:

(i)加强子多肽、或编码加强子多肽的核酸;

(ii)转基因;和/或基因组工程化组分。

微粒轰击的一个特别优选的实施方案中,通过包含具有0.4-1.6微米(μm)范围大小,优选0.4-1.0μm范围大小的金颗粒的微载体,将加强多肽、和/或一种或多种加强基因与基因组工程化组分共同递送的。在示例性方法中,每一次轰击使用包被在10-1000μg金颗粒,优选50-300μg金颗粒上的10ng-10μgDNA,优选50-1000ngDNA。可使用每一个样品板最多10次轰击(发射),优选1-4次发射将外来分子递送进植物细胞中。

可以使用例如Bio-Rad PDS-1000/He粒子枪或手持式Helios基因枪系统将加强因子(例如,加强多肽或编码这种加强多肽的多核苷酸)和基因组工程化组分递送进靶细胞中。当使用PDS-1000/He粒子枪系统时,轰击破裂压力为450psi至2200psi,优选为450-1100psi,而Helios基因枪系统的破裂压力为100-600psi。可以将一种以上的化学物质或构建体与基因组工程化组分共同递送到进细胞中。

微粒包被可以进一步包含一个或多个包被层。例如,微粒可含有包含加强因子的第一包被层和包含基因组工程化组分和转基因的第二包被层。或者,微粒可含有包含加强因子以及转基因或基因组工程化组分的包被层。

此外,本发明提供了一种通过微粒轰击对植物基因组进行遗传修饰的试剂盒,其包括

(I)一种或多种微粒,以及

(II)用于用至少基因组工程化组分以及(1)表观遗传调控化学物质,例如DNA甲基转移酶抑制剂或蛋白质脱乙酰基酶抑制剂或其活性衍生物,特别是组蛋白脱乙酰基酶抑制剂(HDACi),和/或(2)植物激素或其活性衍生物包被微粒的工具。

本发明的另一方面是如上该的微粒在植物细胞的基因枪法转化中的用途。

本发明的主题还是通过上述方法获得或可获得的植物细胞。因此,本发明的一个实施方案是通过上述在植物细胞中进行遗传修饰的方法获得或可获得的经遗传修饰的植物细胞。与原始植物细胞相比,这些植物细胞中的遗传修饰例如可包括转基因优选地包含感兴趣的基因的表达盒的插入,至少一个核苷酸的置换,至少一个核苷酸的缺失,至少一个核苷酸的插入,DNA甲基化的改变,组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、组蛋白SUMO化、组蛋白核糖基化或组蛋白瓜氨酸化的改变,或其组合。优选地,经遗传修饰的植物细胞不包含任何稳定整合进植物细胞基因组中的外源遗传物质。

经遗传修饰的植物细胞可以是整个植物的部分或其一部分。因此,本发明还涉及包含上述经遗传修饰的植物细胞的植物或植物部分。

根据本发明的另一方面,经遗传修饰的植物细胞可以再生为完整(可育)植物。因此,在本发明的优选方面,在植物细胞的遗传修饰之后是再生植物的步骤。因此,本发明提供了一种生产经遗传修饰的植物的方法,包括以下步骤:

a)根据上述用于在植物细胞中进行遗传修饰的方法对植物细胞进行遗传修饰,和

b)从步骤a)的修饰的植物细胞再生植物。

再生植物的步骤b)可以例如包含在再生培养基上培养来自步骤a)的经遗传修饰的植物细胞。

再生技术依赖于组织培养基生长培养基中某些植物激素的处理,偶尔依赖于可以导入的抗微生物剂和/或除草剂标记。再生可以得自植物体细胞、愈伤组织细胞或胚胎细胞以及来自不同外植体(例如愈伤组织、未成熟或成熟的胚胎、叶、芽、根、花、小孢子、胚胎组织、分生组织、器官或其任何部分)的原生质体。此种再生技术在Klee(1987)Ann.Rev.ofPlant Phys.38:467486中有一般描述。来自培养的原生质体的植物再生描述于Evans等,Protoplasts Isolation and Culture,Handbook of Plant cell Culture,pp.124-176,Macmillan Publishing Company,New York,1983;和Binding,Regeneration of Plants,Plant Protoplasts,pp.21-73,CRC Press,Boca Raton,1985。要从转化或基因编辑的细胞中获得完整的植物,可以在一系列含有营养和激素受控的环境条件进行生长,该过程称为组织培养。一旦生成完整植物并产生种子,就开始评估后代。

本发明还提供通过上述生产经遗传修饰的植物或其后代植物的方法获得或可获得的经遗传修饰的植物。

本发明的另一主题是源自上述经遗传修饰的植物的植物细胞或种子。

本发明的另一主题是无需基于标记基因的选择的源自上述经遗传修饰的细胞的植物、植物细胞或种子。如本文所用,“基于标记基因的选择”是指通过使用整合的选择标记(基因),例如抗生素抗性基因(例如卡那霉素抗性基因、潮霉素抗性基因)或除草剂抗性基因(例如草丁膦抗性基因、草甘膦抗性基因)从野生型细胞中选择,鉴定和/或纯化修饰的细胞,特别是转化的、基因编辑的或碱基编辑的细胞的任何方法。没有这样的选择,这种植物、植物细胞或种子可能没有整合任何基因组工程化组分,从而可能产生(i)无转基因的经遗传修饰植物或(ii)仅整合了感兴趣的基因的修饰植物。

除非在实施例中另有说明,否则所有重组DNA技术均根据如在以下文献中所述的标准方案进行:Sambrook等(1989),(1989)Molecular Cloning:A Laboratory Manual,Second Edition,Cold Spring Harbor Laboratory Press,NY;以及Ausubel等(1994),Current Protocols in Molecular Biology,Current Protocols,USA的第1卷和第2卷。BIOS Scientific Publications(UK)和英国布莱克威尔出版公司(Blackwell)联合出版的R.D.D.Cray的Plant Molecular Biology Labfax(1993)中描述了用于植物分子研究的标准材料和方法。标准分子生物学技术的其他参考包括Sambrook and Russell(2001)Molecular Cloning:A Laboratory Manual,Third Edition,Cold Spring HarborLaboratory Press,NY,Brown(1998)Molecular Biology LabFax,Second Edition,Academic Press(UK)的第I卷和第II卷。用于聚合酶链反应的标准材料和方法可参见Dieffenbach和Dveksler(1995)PCR Primer:A Laboratory Manual,Cold SpringHarborLaboratory Press,以及McPherson等,(2000)PCR-Basics:FromBackground to Bench,First Edition,Springer Verlag,Germany。

SEQ ID NO: 描述

1 KWS-RBP1的cDNA

2 KWS-RBP1的蛋白质

3 ZmPLT5(基因型A188)的cDNA

4 ZmPLT5(基因型A188)的蛋白质

5 AtPLT5的cDNA

6 AtPLT5的蛋白质

7 ZmPLT7(基因型A188)的cDNA

8 ZmPLT7(基因型A188)的蛋白质

9 AtPLT7的cDNA

10 AtPLT7的蛋白质

11 TaRKD4的cDNA

12 TaRKD4的蛋白质

13 AtRKD4的cDNA

14 AtRKD4的蛋白质

15 ZmRKD4的cDNA

16 ZmRKD4的蛋白质

17 TaRKD2的cDNA

18 TaRKD2的蛋白质

19 AtRKD2的cDNA

20 AtRKD2的蛋白质

21 ZmRKD2的cDNA

22 ZmRKD2的蛋白质

23 BdEF1的启动子

24 pABM-BdEF1

25 pABM-BdEF1_ZmPLT5

26 pABM-BdEF1_ZmPLT7

27 pABM-BdEF1_KWS-RBP1

28 pABM-BdEF1_TaRKD4

29 pGEP359

30 pGEP324

31 pAMK-BdEF_ZmWUS2

32 BdEF1::ZmPLT5_表达盒

33 BdEF1::ZmPLT7_表达盒

34 BdEF1::KWS-RBP1_表达盒

35 BdEF1::TaRKD4_表达盒

36 BdEF1::ZmWUS2_表达盒

37 pUbi::LpCpf1_表达盒

38 pUbi::crRNA5_表达盒

39 LbCpf1的cDNA

40 LbCpf1的蛋白质

41 crRNA5_靶_HMG13

42 crRNA5_靶_序列

43 pAMK-ZmWUS2-tDT-nosT

44 ZmPLT7(基因型B73)的cDNA

45 ZmPLT7(基因型B73)的蛋白质

46 pZmWUS2::tDT-nosT表达盒

47 KWS-RBP2

48 KWS-RBP2的蛋白质

49 pABM-BdEF1_KWS-RBP2

50 BdEF1::KWS-RBP2_表达盒

本文引用或援引的所有专利、专利申请和出版物或公共公开内容(包括互联网上的出版物)均通过引用全文并入本文。

具体实施方式

通过以下实施例进一步说明本发明。然而,应当理解,本发明不限于这些示例。在说明书中任何地方使用这些和其他示例仅是说明性的,绝不限制本发明或任何示例性术语的范围和含义。同样,本发明不限于这里描述的任何特定的优选实施例。实际上,在阅读本说明书后,本发明的许多修改和变化对本领域技术人员而言是显而易见的,并且在不脱离本发明的精神或范围的情况下,可以进行这种变化。因此,本发明仅由所附权利要求的条款以及那些权利要求所赋予的等价物的全部范围来限制。

实施例1.利用共同轰击的加强基因和感兴趣的基因(GOI)的瞬时共表达。

通过使用从玉米A188未成熟胚胎中分离的总RNA的RT-PCR克隆了玉米PLT5(ZmPLT5(ZmWUS2)和PLT7(ZmPLT7)基因。小麦RKD4和KWS-RBP1基因自其蛋白质序列进行了玉米密码子优化,并通过Integrated DNA Technologies(IDT,圣地亚哥,加利福尼亚,美国)合成。加强基因片段在BamHI和HindIII的克隆位点克隆到表达载体pABM-BdEF1(图1)中,并在BdEF1启动子(pBdFE1)和nos终止子(nos-T)的控制下表达。pBdFE1是来自短柄草属的强组成型启动子。测序确认的构建体图显示在图2至8中。

授粉后9-12天,收获具有0.8-1.8mm,优选1.0-1.5mm大小的未成熟胚胎的玉米穗(即A188或Hi II)。将穗用70%乙醇消毒10-15分钟。在层状通风橱(laminar hood)中短暂风干后,用鲨鱼解剖刀将~1/3的果仁从穗上去除,然后用刮刀小心地将未成熟的胚胎从果仁中取出。将新鲜的分离的胚胎置于盾片面朝上的渗透培养基板(见下文)中的轰击靶区域上。将板用石蜡膜包裹,在轰击之前在黑暗中于25℃孵育4小时。

使用粒子轰击枪和具有大小为0.4或0.6微米(μm)的金粒子将DNA递送到玉米未成熟胚胎的盾片细胞中。将加强基因质粒与感兴趣的基因(GOI)预混合,例如,具有CRISPR核酸酶Cpf1和tDT报告基因的基因组编辑构建体pGEP359(图6),以及针对pGEP324的含有CRISPR导向RNA crRNA5靶标的HMG13(图7)。对于10次发射,将总体积为100微升(μl)的50%(v/v)甘油中的1毫克金颗粒(每针100克金颗粒)吸移到透明的低滞留微离心管中。将混合物超声处理15秒以悬浮金颗粒。在低速涡旋的同时,向每个100μl金颗粒中依次添加以下物质:(a)最多10μlDNA(1.0-10.0μg预混合的总DNA,每个发射100-1000ng,(b)100μl的2.5MCaCl

关闭盖子,并将管在0-10℃下涡旋2-30分钟,然后将DNA包被的金颗粒离心下来。用500μl 100%乙醇洗涤两次后,将沉淀重悬于120μl 100%乙醇中。在低速涡旋的同时,将10μl包被的金颗粒从管中以宽阔的20μl尖端平均地吸移到大载体的中心。由于此时颗粒倾向于形成团块,因此将金颗粒尽快放置在大载体上,然后进行空气干燥。使用Bio-Rad PDS-1000/He粒子枪进行轰击。轰击条件是:28mm/Hg真空,450或650psi破裂盘,6mm的间隙距离,样品平台在距腔室底部60mm距离的第二位置,每个样品(玉米未成熟的胚胎)平板三次发射。

轰击后,胚胎在渗透培养基上再保留16个小时。轰击后16-20小时,使用荧光显微镜检查瞬时转化的tDT表达,其最大激发波长为554nm且最大发射波长为581nm。选择在荧光显微镜下具有密集荧光信号的胚胎(图8),并将其从N6OSM转移到N6-5Ag平板上(每个平板~15个胚胎),将盾片正面朝上以诱导愈伤组织(参见下文)。

渗透培养基:N6盐、N6维生素、1.0mg/L的2,4-D、100mg/L的酪蛋白、0.7g/L的L-脯氨酸、0.2M的甘露醇(36.4g/L)、0.2M的山梨醇(36.4g/L)、20g/L蔗糖、15g/L细菌琼脂、pH5.8。

N6-5Ag:N6盐、N6维生素、1.0mg/L的2,4-D、100mg/L的酪蛋白、2.9g/L的脯氨酸、20g/L的蔗糖、5g/L的葡萄糖、5mg/L的AgNO3、8g/L的琼脂、pH 5.8。

实施例2.ZmPLT5或ZmPLT7基因和KWS-RBP1的瞬时共表达促进玉米Hi II未成熟胚胎的早期胚胎发生和再生。

在上文实施例1中描述了瞬时共同递送、胚胎制备和培养。对于每次轰击,将四个预混合的DNA质粒包被在100μg大小为0.4μm的金颗粒上,并在650psi的破裂压力共同导入Hi II未成熟胚胎的盾片细胞中。如下将四种质粒进行预混,进行一次轰击:

-100ng加强ZmPLT5或ZmPLT7(图2和图3)

-200ng KWS-RBP1(图4)

-100ng pGEP359(图6)

-150ng pGEP324(图7)

选择在荧光显微镜下具有密集荧光信号的胚胎(图8),并将其从N6OSM转移到N6-5Ag上以诱导胚胎愈伤组织。选择的胚胎在N6-5Ag平板中培养,盾片面朝上(每个平板大约15个胚胎)在27℃黑暗中培养14在黑暗中。通过在解剖显微镜下观察来监测胚胎发生的愈伤组织的诱导。具体地,通过在荧光显微镜下目视观察轰击后5-7天的诱导胚胎形成的能力来测量对细胞分裂和再生的加强作用。

图9显示了通过微粒轰击的共表达ZmPLT5(图9B)或ZmPLT7(图9C)和KWS-RBP1显着促进了玉米Hi II未成熟胚胎中的胚胎发生愈伤组织诱导。相比于没有加强子轰击的图9A中的图像,图9B和图9C的图像显示了粒子轰击5天后形成并出现的多个胚胎结构。

实施例3.ZmPLT5或ZmPLT7和KWS-RBP1的瞬时共表达改善了玉米Hi未成熟胚胎中共同递送的报告基因的稳定转化

实施例1和2描述了玉米胚胎的制备、瞬时轰击和胚胎愈伤组织的诱导。将胚胎在N6-5Ag培养基中于27℃在黑暗中培养14天。通过在荧光显微镜下观察将tDT荧光用于监测胚胎发生的愈伤组织的诱导和稳定转化。具体地,加强作用是通过无选择地轰击后12天提高tDT报告基因的转化频率(TF)的能力来衡量的。

来自图10中新兴胚胎结构的强而均匀的tDT荧光信号表明tDT基因的整合和稳定转化。稳定转化频率定义为从最初使用的100个胚胎中诱导出的具有至少一个稳定的tDT荧光结构的胚胎数。轰击后12天测量稳定转化频率。

ZmPLT5和KWS-RBP1基因的瞬时共表达导致tDT基因的转化频率达到65%(与没有加强子的对照相比,提高了26倍),而tDT与ZmPLT7和KWS-RBP1的共递送使tDT基因的转化频率为72.8%(与对照相比提高超过29倍)(图10D)。图10的结果表明(i)ZmPLT5或ZmPLT7和(ii)KWS-RBP1的瞬时共表达促进了玉米Hi II未成熟胚胎中稳定转化频率。

稳定转化发生在单个细胞水平,其中最初转移的DNA被整合到宿主细胞的基因组中。为了恢复同种经遗传修饰的植物,需要多轮选择以鉴定和纯化具有稳定DNA整合的细胞。如果没有加强子,稳定转化的发育要花多周时间(取决于细胞增殖的速度),例如玉米中4-8周。与没有加强子的传统转化相比,在用加强子轰击后仅12天实现了图10所示的稳定转化。因此,ZmPLT5或ZmPLT7与KWS-RBP1基因的瞬时共表达减少了产生稳定转化所需的时间,并导致了玉米中快速且高效的转化。

实施例4.1ZmPLT5或ZmPLT7基因和KWS-RBP1的瞬时共表达促进玉米A188未成熟胚胎中的早期胚胎发生和再生

如实施例2中所述进行实验过程。轰击后7天记录结果。结果显示在图11中,其表明通过微粒轰击的ZmPLT5(图11B)或ZmPLT7(图11C)和KWS-RBP1的瞬时共表达显着促进了玉米A188未成熟胚胎的胚胎发生结构诱导。相比于没有加强子的图11A中的图像,图11B和图11C中的图像显示形成了多个胚胎结构。这些结构在粒子轰击7天后出现。

实施例4.2ZmPLT5基因和KWS-RBP2的瞬时共表达促进玉米A188未成熟胚胎中的早期胚胎发生和再生

如实施例2中所述进行实验过程。轰击10天后记录结果。结果显示在图23中,其表明通过微粒轰击的ZmPLT5和KWS-RBP2的瞬时共表达显着促进了玉米A188未成熟胚胎的胚胎发生结构诱导。ZmPLT5基因和KWS-RBP2共表达后的再生比率(%)甚至高于ZmPLT5基因和KWS-RBP1共表达后的再生比率。再生比率定义为从最初使用的100个胚胎中再生出至少一个植物的胚胎数目。轰击后10天记录数据。

实施例5.1ZmPLT5或ZmPLT7基因和KWS-RBP1的瞬时共表达促进了玉米A188未成熟胚胎中共递送的报告基因的早期稳定转化。

如实施例3中所述进行实验过程。轰击后16天记录结果。来自图12B和12C中出现的胚胎结构的强且均匀的tDT荧光信号表明了tDT基因的整合和稳定转化。相比于图12A中的图像,图12B和12C中的红色荧光图像说明ZmPLT5(图12B)或ZmPLT7(图12C)与KWS-RBP1的共表达显着改善了玉米A188未成熟胚胎中报告基因的稳定转化。

未选择的轰击A188未成熟胚胎后16天,从没有加强子的对照中未观察到稳定转化。相比于对照,在玉米A188轰击后16天,tDT构建体与ZmPLT5和KWS-RBP1的共同轰击导致了12.2%的转化频率,而与ZmPLT7和KWS-RBP1的共同轰击(图12D)产生了7.1%的tDT报告的转化频率。

实施例5.2ZmPLT5和KWS-RBP2的瞬时共表达促进了玉米A188未成熟胚胎中共递送的报告基因的早期稳定转化。

如实施例3中所述进行实验过程。轰击10天后记录结果。来自图24B和24C中出现的胚胎结构的强且均匀的tDT荧光信号表明了tDT基因的整合和稳定转化。相比于图24A中的图像,图24B和24C中的红色荧光图像说明ZmPLT5与KWS-RBP1的共表达以及ZmPLT5与KWS-RBP2的共表达显着改善了玉米A188未成熟胚胎中报告基因的稳定转化。

未选择的轰击A188未成熟胚胎后16天,从没有加强子的对照(仅tDT;图25A)中未观察到稳定转化。相比于对照,在玉米A188轰击后16天,tDT构建体与ZmPLT5和KWS-RBP1的共同轰击(图25B)导致了9.8%的转化频率,而与ZmPLT5和KWS-RBP2的共同轰击(图25C)产生了79.2%的tDT报告的转化频率(图25D)。

实施例6.小麦RKD4激活玉米WUSCHEL(WUS)表达。

同源盒结构域转录因子WUSCHEL(WUS)在建立和维持芽分生组织中起重要作用。为了鉴定促进内源性WUS2表达的加强因子,玉米WUSCHEL2启动子报告构建体(pAMK-ZmWUS2-tDT-noT)(SEQ ID NO:43;图13)用于说明玉米WUS2启动子活性。玉米WUS2启动子(pZmWUS2)驱动tDT报告基因在该报告构建体中的表达(图13)。WUS2启动子报告构建体分别与在玉米未成熟胚胎和叶节中的加强因子共同轰击。

从体外培养的10-14天大的玉米A188幼苗中制备长度为1-2cm的新鲜叶节,然后放置在背面侧朝上的渗透培养基中4小时。为了进行共同轰击,将两个质粒(100ng ZmWUS2启动子报告(图13)和100ng加强构建体(例如TaRKD4)(图5))预混合并包被在100μg大小为0.4μm的金颗粒上。如实施例1和实施例2中所述进行未成熟的胚胎制备、轰击和轰击后培养。使用轰击后16小时开始的荧光显微镜监测显示tDT表达的红色荧光。

WUS专门在植物芽尖分生组织(SAM)的组织中心(OC)中转录并控制SAM中的干细胞身份。

在轰击后培养期间的任何时间(16小时至7天),仅使用ZmWUS2启动子报告(仅pZmWUS2报告)的轰击不会导致轰击的叶样品产生任何tDT荧光信号。但是,当与小麦RKD4构建体共同轰击时(图5),轰击后约36小时在叶节中检测到tDT信号,轰击后约44小时达到峰值(图14B的底部)。与仅使用WUS启动子报告子进行的对照轰击相比,在未成熟的胚胎中仅观察到了微弱的tDT信号(图14A的顶部),在用WUS启动子报告子和小麦RKD4构建体共同轰击的胚胎中观察到了异常强的红色荧光信号(图14B的顶部)。这些结果表明小麦RKD4强烈激活玉米WUS2基因。轰击后44小时拍摄图像。

实施例7.TaRKD4和KWS-RBP1的瞬时共表达促进了来自玉米Hi II未成熟胚胎的早期胚胎发生。

图15显示了通过微粒轰击的共表达小麦RKD4(图5)和KWS-RBP1(图4)显着促进了玉米Hi II未成熟胚胎中的胚胎发生结构诱导。如实施例2所述进行实验过程,轰击后5天记录结果。相比于没有加强子的图15A中的图像,图15B中的图像显示在粒子轰击后5天形成并出现的多个胚胎结构。粒子轰击后5天获取图像。

实施例8.TaRKD4和KWS-RBP1的瞬时共表达促进了来自玉米Hi II未成熟胚胎的共递送的报告基因的早期稳定转化。

如实施例3所述进行实验,且轰击后12天记录结果。

来自图16B中出现的胚胎结构的强且均匀的tDT荧光信号表明了tDT基因的整合和稳定转化。相比于图16A中的图像,图16B中的红色荧光图像说明了TaRKD4和KWS-RBP1的共递送显着改善了玉米Hi II未成熟胚胎中报告基因的稳定转化。

未选择的轰击Hi II未成熟胚胎后12天,从没有加强子的对照中未观察到稳定转化。相比于对照,tDT构建体与TaPLT4和KWS-RBP1的共同轰击导致了23.5%的tDT报告的转化频率(图16C)。

实施例9.TaRKD4和KWS-RBP1的瞬时共表达促进了玉米A188未成熟胚胎的早期胚胎发生

如实施例3中所述进行实验,且轰击后5天记录结果。图17显示了通过微粒轰击的共同递送TaRKD4(图5)和KWS-RBP1(图4)显着促进了玉米A188未成熟胚胎中的胚胎发生结构诱导。相比于没有加强子的图17A中的图像,图17B中的图像显示了在粒子轰击后5天形成并出现的多个胚胎结构。粒子轰击后5天获取图像。

实施例10.TaRKD4和KWS-RBP1的瞬时共表达促进了来自玉米A188未成熟胚胎的共递送的报告基因的早期稳定转化

如实施例3中所述进行实验,且轰击后14天记录结果。来自图18B中产生的胚胎结构的强且均匀的tDT荧光信号表明tDT基因的整合和稳定转化。相比于图18A中的图像,图18B中的红色荧光图像说明TaRKD4和KWS-RBP1的共递送显着改善了玉米A188未成熟胚胎中报告基因的稳定转化。

未选择的轰击A188未成熟胚胎后14天,从没有加强子的对照轰击中未观察到稳定tDT荧光结构。相比于对照,tDT构建体与TaRKD4和KWS-RBP1的共同轰击导致35.5%的A188未成熟胚胎的tDT报告的转化频率(图18C)。

实施例11.加强基因与基因组编辑组分的共表达促进玉米中瞬时基因组的编辑。

对于胚胎制备、轰击和轰击后胚胎培养进行实施例1和实施例2中所述的程序。在N6-5Ag培养基中诱导愈伤组织14天(Hi II)或18天(A188)之后,从轰击的胚胎的盾片表面挑选迅速生长的胚胎性愈伤组织,并转移到MRM1培养基中(见下文)进行胚胎成熟。在黑暗中于25℃在MRM1培养基中培养约两周后,将成熟的胚胎移至MSO培养基(见下文)中以在25℃的光照下在植物托盘中进行胚胎发芽。在MSO培养基中培养约10天后,再生的小植株已准备好进行分子分析并转移到土壤中。从再生小植株的所有叶中收集大约5mm的叶尖用于DNA提取。通过Taqman qPCR、标记毛细管电泳从再生植物中筛选出特定位点的基因组修饰,并通过Digital PCR、下一代测序(NGS)和Sanger测序进行确认。通过qPCR检查DNA整合。

如果没有加强子,通过选择的瞬时表达(仅GE),使用Cpf1(pGEP359)和crRNA5(pGEP324)的基因组编辑不会导致任何可检测的编辑事件(图19)。但是,通过与ZmPLT5和KWS-RBP1(GE加ZmPLT5和KWS-RBP1)共表达,实现了1%的瞬时基因组编辑效率(图19A),以及当与ZmPLT7和KWS-RBP1(GE加ZmPLT5和KWS-RBP1)共表达时还可以获得0.8%的瞬时基因组编辑效率(图19B)。这些结果表明增强子ZmPLT5、ZmPLT7和KWS-RBP1改善了瞬时基因组编辑。

MRM1:MS盐+MS维生素+100mg/L肌醇+6%蔗糖+9g/L细菌琼脂、pH 5.8

MS0:MS盐+MS维生素+2g/L的肌醇+2%蔗糖+8克/升的细菌琼脂、pH 5.8

实施例12.可以通过在玉米中基因组编辑组分与加强基因的瞬时共表达恢复同种编辑的植物。

进行了无需选择的加强基因和基因组编辑组分的瞬时共表达的Droplet DigitalPCR(ddPCR)。约50%和100%的位点特异性InDel比率分别表明单等位基因和双等位遗传修饰。图20A中的数据是通过使用水(底部)或野生型DNA(WT液滴)的Droplet Digital PCR的阴性对照得到的结果。图20B显示了对源自加强子和基因组编辑组分的瞬时共表达的编辑的T0植物所进行Droplet Digital PCR的结果。顶部和中间的图显示了来自两个编辑的T0植物的接近100%的InDel比率,其表明同种双等位遗传修饰,而下图说明了同种单等位基因编辑事件。

不希望受到理论的束缚,遗传修饰发生在单个细胞水平。为了恢复同种修饰的植物,通常需要进行选择以分离具有修饰的细胞并去除野生型细胞。常规选择通常涉及使用整合的选择标记例如抗生素(例如卡那霉素、潮霉素)或除草剂(例如膦丝菌素、草甘膦)抗性基因。如果在瞬时基因组编辑中没有整合的选择标记,再生植物很可能是嵌合体。

相反,图20所示的Droplet Digital PCR(ddPCR)结果表明,通过无需选择的基因组编辑组分与加强基因的瞬时共表达可实现同种基因组编辑。来自所有编辑的植物的约50%或100%的InDel比率表明是同种单等位基因或双等位遗传修饰。Sanger测序结果进一步证实了ddPCR结果(图21)。这些结果表明,与加强基因的瞬时共表达可以导致单个细胞的植物再生。

***

本发明不限于本文所述的具体实施方案的范围。实际上,除了本文描述的那些之外,根据前述描述和附图,本发明的各种修改对于本领域技术人员将变得明显。这样的修改旨在落入所附权利要求的范围内。还应理解,所有值都是近似值,并提供用以描述。

在整个本申请中援引了专利、专利申请、出版物、产品描述和协议,出于所有目的,其公开内容通过引用整体并入本文。

序列表

<110> 科沃施种子欧洲股份两合公司

<120> 改善植物中基因组工程化和再生的方法

<130> KWS0309PCT

<150> US 62/685,626

<151> 2018-06-15

<150> US 62/728,445

<151> 2018-09-07

<160> 59

<170> PatentIn version 3.5

<210> 1

<211> 783

<212> DNA

<213> 人工序列

<220>

<223> KWS_RBP1的编码序列

<400> 1

atggagtcgg gctccgggac ggctgctggc tctggctatg tttacagaca gccaggatca 60

acgcggtgga acccgacagc tgaacaactg tccttgctta gagaaatcta ctaccgcaac 120

ggattgcgga ccccgaccgc ggacgaaatc agacaaatca gctcaaagct ctcaaggtac 180

ggaaaaatag agggcaaaaa cgtttacaac tggttccaga atagacgcgc aagagaaaag 240

cgcaagcaac ggctctctac aatcggctgt gatccagcac tgatcgagat ggggaatgtc 300

gcttcactgg aattcggtac tgagagcgcc ctggaatcgc tgtcgtcagg accatcctca 360

gaactccgcg aagcgccaac gagaaaattt tacgaaaaaa agacggttgg agagaactca 420

actataataa acccagtgga acaaaactgt accctttcct gcggaacgtc ccaagagttc 480

cagtatgcgg tcgattctcg gcgcgtcatg aaagctatgg aggaaaagca ggcgacggac 540

gatgaacccg acggaaataa atggactgag tcaaacagac acgtcaagat tctccagctt 600

ttcccgctcc acaataacga ggatcagaca ttgataaaga gcgacaaaga aatctattgt 660

ttgggctcgt gcgagaagaa aatggatttg tcaccgctgg gtcattcagg ctctcagcgc 720

gcttcggccc ttgacttgtg cctttcattg ggcaacgaat cttgtgggct gcatgataat 780

tga 783

<210> 2

<211> 260

<212> PRT

<213> 人工序列

<220>

<223> KWS_RBP1的蛋白

<400> 2

Met Glu Ser Gly Ser Gly Thr Ala Ala Gly Ser Gly Tyr Val Tyr Arg

1 5 10 15

Gln Pro Gly Ser Thr Arg Trp Asn Pro Thr Ala Glu Gln Leu Ser Leu

20 25 30

Leu Arg Glu Ile Tyr Tyr Arg Asn Gly Leu Arg Thr Pro Thr Ala Asp

35 40 45

Glu Ile Arg Gln Ile Ser Ser Lys Leu Ser Arg Tyr Gly Lys Ile Glu

50 55 60

Gly Lys Asn Val Tyr Asn Trp Phe Gln Asn Arg Arg Ala Arg Glu Lys

65 70 75 80

Arg Lys Gln Arg Leu Ser Thr Ile Gly Cys Asp Pro Ala Leu Ile Glu

85 90 95

Met Gly Asn Val Ala Ser Leu Glu Phe Gly Thr Glu Ser Ala Leu Glu

100 105 110

Ser Leu Ser Ser Gly Pro Ser Ser Glu Leu Arg Glu Ala Pro Thr Arg

115 120 125

Lys Phe Tyr Glu Lys Lys Thr Val Gly Glu Asn Ser Thr Ile Ile Asn

130 135 140

Pro Val Glu Gln Asn Cys Thr Leu Ser Cys Gly Thr Ser Gln Glu Phe

145 150 155 160

Gln Tyr Ala Val Asp Ser Arg Arg Val Met Lys Ala Met Glu Glu Lys

165 170 175

Gln Ala Thr Asp Asp Glu Pro Asp Gly Asn Lys Trp Thr Glu Ser Asn

180 185 190

Arg His Val Lys Ile Leu Gln Leu Phe Pro Leu His Asn Asn Glu Asp

195 200 205

Gln Thr Leu Ile Lys Ser Asp Lys Glu Ile Tyr Cys Leu Gly Ser Cys

210 215 220

Glu Lys Lys Met Asp Leu Ser Pro Leu Gly His Ser Gly Ser Gln Arg

225 230 235 240

Ala Ser Ala Leu Asp Leu Cys Leu Ser Leu Gly Asn Glu Ser Cys Gly

245 250 255

Leu His Asp Asn

260

<210> 3

<211> 1485

<212> DNA

<213> 人工序列

<220>

<223> PLT5的cDNA

<400> 3

atggacacct cgcaccacta tcatccatgg ctcaacttct ccctcgccca ccactgtgac 60

ctcgaggagg aggagagggg cgcggccgcc gagctggccg cgatagccgg cgccgcgccg 120

ccgccgaagc tggaggactt cctcggcgga ggcgtcgcca ccggtggtcc ggaggcggtg 180

gcgcccgcgg agatgtacga ctcggacctc aagttcatag ccgccgccgg gttccttggc 240

ggctcggcgg cggcggcggc gacgtcgccg ctgtcctccc tcgaccaggc cggttccaag 300

ctggccttgc ctgcggcggc ggctgctccg gcgccggagc agaggaaggc cgtcgactcc 360

tttgggcagc gcacgtccat ctaccgcggc gtcacacggc accggtggac tggcaggtac 420

gaggcacatc tgtgggacaa cagctgccga cgcgaagggc agagccgcaa gggccgccaa 480

gtatatttgg gtggctatga taaggaggag aaggctgcca gggcgtatga tcttgcagct 540

ttgaagtact ggggttctag caccaccacc aactttccgg ttgctgagta tgagaaggag 600

gtcgaggaga tgaagaacat gacgcgacaa gagtttgttg cttcccttcg aaggaagagc 660

agtggattct ctcggggtgc ttccatctac agaggtgtaa ccagacatca ccagcatgga 720

cggtggcagg cgaggatcgg aagggtggcc ggtaacaagg acctctacct tgggacgttc 780

agcaccgagg aggaagctgc agaggcctac gacatagcgg ccatcaagtt cagaggcctg 840

aacgccgtca caaacttcga gatcagccgg tacaacgtgg agaccataat gagcagcaac 900

cttccagtcg cgagcatgtc gtcgtcgtcg gcggcggcgg cgggtggccg gagcagcaag 960

gcgctggagt cccctccgtc cggctcgctt gacggcggcg gcggcatgcc agtcgtcgaa 1020

ggcagcacgg caccgccgct gttcattccg gtgaagtacg accagcagca gcaggagtac 1080

ctgtcgatgc tcgcgttgca gcaccaccac cagcagcaac aagcagggaa cctgttgcag 1140

gggccgctag tagggttcgg cggcctctac tcctccgggg tgaacctgga tttcgccaac 1200

tcccacggca cggcggctcc gtcgtcgatg gcccaccact gctacgccaa tggcaccgcg 1260

tccgcctcgc atgagcacca gcaccagcac cagatgcagc agggcggcga gaacgagacg 1320

cagccgcagc cgcagcagag ctccagcagc tgctcctccc tgccattcgc caccccggtc 1380

gctttcaatg ggtcctatga aagctccatc acggcggcag gcccctttgg atactcctac 1440

ccaaatgtgg cagcctttca gacgccgatc tatggaatgg aatga 1485

<210> 4

<211> 492

<212> PRT

<213> Zea mays

<400> 4

Met Asp Thr Ser His His Tyr His Pro Trp Leu Asn Phe Ser Leu Ala

1 5 10 15

His His Cys Asp Leu Glu Glu Glu Glu Arg Gly Ala Ala Ala Glu Leu

20 25 30

Ala Ala Ile Ala Gly Ala Ala Pro Pro Pro Lys Leu Glu Asp Phe Leu

35 40 45

Gly Gly Gly Val Ala Thr Gly Gly Pro Glu Ala Val Ala Pro Ala Glu

50 55 60

Met Tyr Asp Ser Asp Leu Lys Phe Ile Ala Ala Ala Gly Phe Leu Gly

65 70 75 80

Gly Ser Ala Ala Ala Ala Ala Thr Ser Pro Leu Ser Ser Leu Asp Gln

85 90 95

Ala Gly Ser Lys Leu Ala Leu Pro Ala Ala Ala Ala Ala Pro Ala Pro

100 105 110

Glu Gln Arg Lys Ala Val Asp Ser Phe Gly Gln Arg Thr Ser Ile Tyr

115 120 125

Arg Gly Val Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu

130 135 140

Trp Asp Asn Ser Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg Gln

145 150 155 160

Glu Ser Glu Gly Gly Tyr Asp Lys Glu Glu Lys Ala Ala Arg Ala Tyr

165 170 175

Asp Leu Ala Ala Leu Lys Tyr Trp Gly Ser Ser Thr Thr Thr Asn Phe

180 185 190

Pro Val Ala Glu Tyr Glu Lys Glu Val Glu Glu Met Lys Asn Met Thr

195 200 205

Arg Gln Glu Phe Val Ala Ser Leu Arg Arg Lys Ser Ser Gly Phe Ser

210 215 220

Arg Gly Ala Ser Ile Tyr Arg Gly Val Thr Arg His His Gln His Gly

225 230 235 240

Arg Trp Gln Ala Arg Ile Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr

245 250 255

Leu Gly Thr Phe Ser Thr Glu Glu Glu Ala Ala Glu Ala Tyr Asp Ile

260 265 270

Ala Ala Ile Lys Phe Arg Gly Leu Asn Ala Val Thr Asn Phe Glu Ile

275 280 285

Ser Arg Tyr Asn Val Glu Thr Ile Met Ser Ser Asn Leu Pro Val Ala

290 295 300

Ser Met Ser Ser Ser Ala Ala Ala Ala Ala Gly Gly Arg Ser Ser Lys

305 310 315 320

Ala Leu Glu Ser Pro Pro Ser Gly Ser Leu Asp Gly Gly Gly Gly Met

325 330 335

Pro Val Val Glu Ala Ser Thr Ala Pro Pro Leu Phe Ile Pro Val Lys

340 345 350

Tyr Asp Gln Gln Gln Gln Glu Tyr Leu Ser Met Leu Ala Leu Gln Gln

355 360 365

His His Gln Gln Gln Gln Ala Gly Asn Leu Leu Gln Gly Pro Leu Val

370 375 380

Gly Phe Gly Gly Leu Tyr Ser Ser Gly Val Asn Leu Asp Phe Ala Asn

385 390 395 400

Ser His Gly Thr Ala Ala Pro Ser Ser Met Ala His His Cys Tyr Ala

405 410 415

Asn Gly Thr Ala Ser Ala Ser His Glu His Gln His Gln Met Gln Gln

420 425 430

Gly Gly Glu Asn Glu Thr Gln Pro Gln Pro Gln Gln Ser Ser Ser Ser

435 440 445

Cys Ser Ser Leu Pro Phe Ala Thr Pro Val Ala Phe Asn Gly Ser Tyr

450 455 460

Glu Ser Ser Ile Thr Ala Ala Gly Pro Phe Gly Tyr Ser Tyr Pro Asn

465 470 475 480

Val Ala Ala Phe Gln Thr Pro Ile Tyr Gly Met Glu

485 490

<210> 5

<211> 1677

<212> DNA

<213> 人工序列

<220>

<223> AtPLT5的cDNA

<400> 5

atgaagaaca ataacaacaa atcttcttct tcttctagct atgattcttc tttgtctcct 60

tcttcttcat cctcctccca ccagaactgg ctctctttct ctctctccaa caataacaac 120

aacttcaatt cttcctcaaa ccctaatctc acttcctcca catcagatca tcatcatcct 180

cacccttctc acctctctct ctttcaagct ttctccactt ctccagtcga acggcaagat 240

gggtcaccgg gagtttcacc cagcgatgcc acggcggttc tttccgtata ccccggcggt 300

cctaaacttg agaacttcct cggcggagga gcctcaacga cgacaacaag accaatgcaa 360

caagtgcaat ctcttggcgg cgttgtcttc tcttccgacc tacagccacc gcttcatcct 420

ccgtccgccg ccgagatcta cgactctgag ctcaagtcaa tagccgctag cttcctagga 480

aactactccg gtggacactc gtcggaggtc tctagcgtac ataaacaaca accgaatcct 540

ctagctgtct cagaggcttc gcctactccg aagaagaacg tagagagttt tggacaacgt 600

acctcgattt atagaggagt cacaagacat agatggactg gaagatacga agctcatcta 660

tgggataata gttgccgaag agaaggccaa agcagaaaag gaagacaagt ttatttaggt 720

ggttatgata aggaagataa agcagctaga gcttacgacc ttgcagctct taagtattgg 780

ggtcctacaa ctacgactaa tttcccgata tcaaattacg aatctgaact tgaagaaatg 840

aaacacatga ctcgacaaga gttcgttgct tctttaagac ggaaaagcag tggattctct 900

aggggtgcct ccatgtacag aggcgtcact agacatcatc agcatggtcg atggcaggca 960

cgaattggaa gagttgcagg caacaaagac ctttatcttg gcacatttag cactcaagag 1020

gaagctgcag aagcttatga tatagcagcg atcaaattcc gcggtctaaa tgcagtcacc 1080

aatttcgaca tcagtcgata tgatgtcaaa tcaattgcta gctgtaatct ccctgtgggt 1140

ggactaatgc ctaaaccttc tccagcaacc gcagcggctg acaaaaccgt tgatctttct 1200

ccatccgact ctccatctct aaccacaccg tccctcacgt tcaatgtggc aacaccggtc 1260

aatgaccatg gaggaacttt ttaccacact ggtataccaa tcaaaccaga cccggctgat 1320

cattattggt ccaacatctt tggattccag gcaaacccga aagcagaaat gcgaccatta 1380

gcaaactttg ggtcggatct tcataaccct tctcctggtt atgctataat gccggtaatg 1440

caggaaggtg aaaacaactt tggtggtagt tttgttgggt ctgatgggta taacaatcat 1500

tccgctgcat cgaacccggt ctcagcaatt ccgctgtcct cgacaactac aatgagtaac 1560

ggtaacgaag ggtatggtgg aaacataaac tggattaata acaacatttc aagttcttac 1620

caaactgcaa aatcaaatct ctctgttttg cacacaccgg tttttgggtt ggaatga 1677

<210> 6

<211> 558

<212> PRT

<213> Zea mays

<400> 6

Met Lys Asn Asn Asn Asn Lys Ser Ser Ser Ser Ser Ser Tyr Asp Ser

1 5 10 15

Ser Leu Ser Pro Ser Ser Ser Ser Ser Ser His Gln Asn Trp Leu Ser

20 25 30

Phe Ser Leu Ser Asn Asn Asn Asn Asn Phe Asn Ser Ser Ser Asn Pro

35 40 45

Asn Leu Thr Ser Ser Thr Ser Asp His His His Pro His Pro Ser His

50 55 60

Leu Ser Leu Phe Gln Ala Phe Ser Thr Ser Pro Val Glu Arg Gln Asp

65 70 75 80

Gly Ser Pro Gly Val Ser Pro Ser Asp Ala Thr Ala Val Leu Ser Val

85 90 95

Tyr Pro Gly Gly Pro Lys Leu Glu Asn Phe Leu Gly Gly Gly Ala Ser

100 105 110

Thr Thr Thr Thr Arg Pro Met Gln Gln Val Gln Ser Leu Gly Gly Val

115 120 125

Val Phe Ser Ser Asp Leu Gln Pro Pro Leu His Pro Pro Ser Ala Ala

130 135 140

Glu Ile Tyr Asp Ser Glu Leu Lys Ser Ile Ala Ala Ser Phe Leu Gly

145 150 155 160

Asn Tyr Ser Gly Gly His Ser Ser Glu Val Ser Ser Val His Lys Gln

165 170 175

Gln Pro Asn Pro Leu Ala Val Ser Glu Ala Ser Pro Thr Pro Lys Lys

180 185 190

Asn Val Glu Ser Phe Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val Thr

195 200 205

Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn Ser

210 215 220

Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg Gln Val Tyr Leu Gly

225 230 235 240

Gly Tyr Asp Lys Glu Asp Lys Ala Ala Arg Ala Tyr Asp Leu Ala Ala

245 250 255

Leu Lys Tyr Trp Gly Pro Thr Thr Thr Thr Asn Phe Pro Ile Ser Asn

260 265 270

Tyr Glu Ser Glu Leu Glu Glu Met Lys His Met Thr Arg Gln Glu Phe

275 280 285

Val Ala Ser Leu Arg Arg Lys Ser Ser Gly Phe Ser Arg Gly Ala Ser

290 295 300

Met Tyr Arg Gly Val Thr Arg His His Gln His Gly Arg Trp Gln Ala

305 310 315 320

Arg Ile Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu Gly Thr Phe

325 330 335

Ser Thr Gln Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala Ala Ile Lys

340 345 350

Phe Arg Gly Leu Asn Ala Val Thr Asn Phe Asp Ile Ser Arg Tyr Asp

355 360 365

Val Lys Ser Ile Ala Ser Cys Asn Leu Pro Val Gly Gly Leu Met Pro

370 375 380

Lys Pro Ser Pro Ala Thr Ala Ala Ala Asp Lys Thr Val Asp Leu Ser

385 390 395 400

Pro Ser Asp Ser Pro Ser Leu Thr Thr Pro Ser Leu Thr Phe Asn Val

405 410 415

Ala Thr Pro Val Asn Asp His Gly Gly Thr Phe Tyr His Thr Gly Ile

420 425 430

Pro Ile Lys Pro Asp Pro Ala Asp His Tyr Trp Ser Asn Ile Phe Gly

435 440 445

Phe Gln Ala Asn Pro Lys Ala Glu Met Arg Pro Leu Ala Asn Phe Gly

450 455 460

Ser Asp Leu His Asn Pro Ser Pro Gly Tyr Ala Ile Met Pro Val Met

465 470 475 480

Gln Glu Gly Glu Asn Asn Phe Gly Gly Ser Phe Val Gly Ser Asp Gly

485 490 495

Tyr Asn Asn His Ser Ala Ala Ser Asn Pro Val Ser Ala Ile Pro Leu

500 505 510

Ser Ser Thr Thr Thr Met Ser Asn Gly Asn Glu Gly Tyr Gly Gly Asn

515 520 525

Ile Asn Trp Ile Asn Asn Asn Ile Ser Ser Ser Tyr Gln Thr Ala Lys

530 535 540

Ser Asn Leu Ser Val Leu His Thr Pro Val Phe Gly Leu Glu

545 550 555

<210> 7

<211> 1470

<212> DNA

<213> 人工序列 A188

<220>

<223> ZmPLT7的cDNA

<400> 7

atggacatgg acatgagctc agcttatccc caccattggc tctccttctc cctctccaac 60

aactaccacc atggcctact cgaggccttc tctaactcct ccggtactcc tcttggagac 120

gagccgggcg cagtggagga gtccccgagg acggtggagg acttcctcgg cggcgtcggt 180

ggcgccggcg ccccgccgca gccggcggct gctgcagatc aggatcacca gcttgtgtgc 240

ggcgagctgg gcagcatcac agccaggttc ttgcgccact acccggcggc gccagctggg 300

acgacggtgg agaaccccgg cgcggtgacc gtggcggcca tgtcgtcgac ggacgtggcg 360

ggggcggagt ccgaccaggc gaggcggccc gccgagacgt tcggccagcg cacatccatc 420

taccgtggcg tcaccaggca ccggtggaca gggagatatg aggcgcactt gtgggacaac 480

agctgccgcc gggagggcca aagccgcaaa ggacgccaag tctacctagg aggctatgac 540

aaggaggaga aggcggctag agcttacgac ctcgccgcgc tcaagtactg ggggcctaca 600

accacgacca acttcccggt gtccaactac gagaaggagc tggaggagat gaagtccatg 660

acgcggcagg agttcatcgc gtcgttgcgc aggaagagca gcggcttctc acgaggcgcc 720

tccatctaca gaggagtcac aaggcatcat cagcacggcc ggtggcaggc gaggatcggc 780

agggtggccg gaaacaagga cctgtacttg ggcactttca gtactcagga agaggcggcg 840

gaggcgtacg acatcgctgc gatcaagttc cgcgggctca acgccgtcac caacttcgac 900

atgagccgct acgacgtgga gagcatcctc agcagcgacc tccccgtcgg gggcggagcc 960

accgggcgcg ccgccaagtt cccgttggac tcgctgcagc cggggagcgc tgctgcgatg 1020

atgctcgccg gggctgctgc cgcttcgcag gccaccatgc cgccgtccga gaaggactac 1080

tggtctctgc tcgccctgca ctaccagcag cagcaggagc aggagcggca gttcccggct 1140

tctgcttacg aggcttacgg ctccggcggc gtgaacgtgg acttcacgat gggcaccagt 1200

agcggcaaca acaacaacaa caccggcagc ggcgtcatgt ggggcgccac cactggtgca 1260

gtagtagtgg gacagcaaga cagcagcggc aagcagggca acggctatgc cagcaacatt 1320

ccttatgctg ctgctgctgc tatggtttct ggatctgctg gctacgaggg ctccaccggc 1380

gacaatggaa cctgggttac tacgactatt accagcagca acaccggcac ggctccccac 1440

tactacaact atctcttcgg gatggagtag 1470

<210> 8

<211> 489

<212> PRT

<213> Zea mays A188

<400> 8

Met Asp Met Asp Met Ser Ser Ala Tyr Pro His His Trp Leu Ser Phe

1 5 10 15

Ser Leu Ser Asn Asn Tyr His His Gly Leu Leu Glu Ala Phe Ser Asn

20 25 30

Ser Ser Gly Thr Pro Leu Gly Asp Glu Pro Gly Ala Val Glu Glu Ser

35 40 45

Pro Arg Thr Val Glu Asp Phe Leu Gly Gly Val Gly Gly Ala Gly Ala

50 55 60

Pro Pro Gln Pro Ala Ala Ala Ala Asp Gln Asp His Gln Leu Val Cys

65 70 75 80

Gly Glu Leu Gly Ser Ile Thr Ala Arg Phe Leu Arg His Tyr Pro Ala

85 90 95

Ala Pro Ala Gly Thr Thr Val Glu Asn Pro Gly Ala Val Thr Val Ala

100 105 110

Ala Met Ser Ser Thr Asp Val Ala Gly Ala Glu Ser Asp Gln Ala Arg

115 120 125

Arg Pro Ala Glu Thr Phe Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val

130 135 140

Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn

145 150 155 160

Ser Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg Gln Val Tyr Leu

165 170 175

Gly Gly Tyr Asp Lys Glu Glu Lys Ala Ala Arg Ala Tyr Asp Leu Ala

180 185 190

Ala Leu Lys Tyr Trp Gly Pro Thr Thr Thr Thr Asn Phe Pro Val Ser

195 200 205

Asn Tyr Glu Lys Glu Leu Glu Glu Met Lys Ser Met Thr Arg Gln Glu

210 215 220

Phe Ile Ala Ser Leu Arg Arg Lys Ser Ser Gly Phe Ser Arg Gly Ala

225 230 235 240

Ser Ile Tyr Arg Gly Val Thr Arg His His Gln His Gly Arg Trp Gln

245 250 255

Ala Arg Ile Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu Gly Thr

260 265 270

Phe Ser Thr Gln Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala Ala Ile

275 280 285

Lys Phe Arg Gly Leu Asn Ala Val Thr Asn Phe Asp Met Ser Arg Tyr

290 295 300

Asp Val Glu Ser Ile Leu Ser Ser Asp Leu Pro Val Gly Gly Gly Ala

305 310 315 320

Thr Gly Arg Ala Ala Lys Phe Pro Leu Asp Ser Leu Gln Pro Gly Ser

325 330 335

Ala Ala Ala Met Met Leu Ala Gly Ala Ala Ala Ala Ser Gln Ala Thr

340 345 350

Met Pro Pro Ser Glu Lys Asp Tyr Trp Ser Leu Leu Ala Leu His Tyr

355 360 365

Gln Gln Gln Gln Glu Gln Glu Arg Gln Phe Pro Ala Ser Ala Tyr Glu

370 375 380

Ala Tyr Gly Ser Gly Gly Val Asn Val Asp Phe Thr Met Gly Thr Ser

385 390 395 400

Ser Gly Asn Asn Asn Asn Asn Thr Gly Ser Gly Val Met Trp Gly Ala

405 410 415

Thr Thr Gly Ala Val Val Val Gly Gln Gln Asp Ser Ser Gly Lys Gln

420 425 430

Gly Asn Gly Tyr Ala Ser Asn Ile Pro Tyr Ala Ala Ala Ala Ala Met

435 440 445

Val Ser Gly Ser Ala Gly Tyr Glu Gly Ser Thr Gly Asp Asn Gly Thr

450 455 460

Trp Val Thr Thr Thr Ile Thr Ser Ser Asn Thr Gly Thr Ala Pro His

465 470 475 480

Tyr Tyr Asn Tyr Leu Phe Gly Met Glu

485

<210> 9

<211> 1497

<212> DNA

<213> 人工序列

<220>

<223> AtPLT7的cDNA

<400> 9

atggctcctc caatgacgaa ttgcttaacg ttttctctgt caccaatgga gatgttgaaa 60

tcaactgatc agtctcactt ctcttcttct tacgacgatt cttctactcc ttatctcatc 120

gataacttct atgctttcaa agaagaagct gagatagaag ctgctgctgc ttcaatggcg 180

gattcaacaa ccttatctac ttttttcgat cattctcaga ctcagattcc aaagctggaa 240

gatttcctcg gtgattcctt tgtccgttac tctgataacc aaacagagac ccaagactct 300

tcttctctca ctccattcta cgatccacgt caccgcaccg ttgccgaagg agttacaggg 360

ttcttctctg atcatcatca gccagatttc aagacgataa actcgggacc agaaatcttc 420

gatgactcaa caacttccaa catcggtggt actcatctct ccagtcacgt ggtggagtca 480

tcaacgacgg cgaagttagg gtttaacggt gattgcacca ccaccggagg agttttgtct 540

ctaggggtta acaacacatc agatcaacct ttgagctgta acaatggcga gagaggtgga 600

aacagtaaca agaagaaaac agtttctaag aaggaaacat cagatgattc aaagaagaag 660

attgtcgaaa cattgggaca aagaacttca atttatcgtg gagtcacccg acatagatgg 720

actggaagat acgaagcgca tctatgggat aacagctgta ggagggaagg tcaagccaga 780

aaaggacgtc aagtgtactt aggtggatat gacaaggaag atagagcagc tagagcctat 840

gacttggcag ctttaaaata ctggggttct actgctacta caaattttcc ggtctcgagt 900

tattcaaaag aacttgagga aatgaatcac atgaccaagc aagagtttat tgcatctctt 960

aggaggaaaa gtagcggttt ttcgagagga gcttcaatat atagaggtgt cacaaggcat 1020

catcaacaag gtcgctggca agcaagaatc ggccgtgtcg caggaaacaa agatctttac 1080

ctcggaacct ttgcaaccga agaggaagca gcagaggctt atgacattgc agccataaag 1140

ttcagaggaa tcaacgcagt aactaacttt gagatgaaca ggtatgacat tgaagctgtc 1200

atgaatagtt ctttacctgt aggaggagca gctgcgaaac gccacaaact caaactcgct 1260

cttgaatctc cttcttcatc atcctctgac cataacctcc aacaacaaca gttgcttccg 1320

tcctcttctc cctcggatca aaaccctaac tcaatcccat gtggcattcc atttgagcct 1380

tcagttctct attaccacca gaacttcttt cagcattatc ctttggtctc tgactctaca 1440

attcaagctc ctatgaacca agctgagttt ttcttgtggc ctaaccagtc ttactaa 1497

<210> 10

<211> 498

<212> PRT

<213> Zea mays

<400> 10

Met Ala Pro Pro Met Thr Asn Cys Leu Thr Phe Ser Leu Ser Pro Met

1 5 10 15

Glu Met Leu Lys Ser Thr Asp Gln Ser His Phe Ser Ser Ser Tyr Asp

20 25 30

Asp Ser Ser Thr Pro Tyr Leu Ile Asp Asn Phe Tyr Ala Phe Lys Glu

35 40 45

Glu Ala Glu Ile Glu Ala Ala Ala Ala Ser Met Ala Asp Ser Thr Thr

50 55 60

Leu Ser Thr Phe Phe Asp His Ser Gln Thr Gln Ile Pro Lys Leu Glu

65 70 75 80

Asp Phe Leu Gly Asp Ser Phe Val Arg Tyr Ser Asp Asn Gln Thr Glu

85 90 95

Thr Gln Asp Ser Ser Ser Leu Thr Pro Phe Tyr Asp Pro Arg His Arg

100 105 110

Thr Val Ala Glu Gly Val Thr Gly Phe Phe Ser Asp His His Gln Pro

115 120 125

Asp Phe Lys Thr Ile Asn Ser Gly Pro Glu Ile Phe Asp Asp Ser Thr

130 135 140

Thr Ser Asn Ile Gly Gly Thr His Leu Ser Ser His Val Val Glu Ser

145 150 155 160

Ser Thr Thr Ala Lys Leu Gly Phe Asn Gly Asp Cys Thr Thr Thr Gly

165 170 175

Gly Val Leu Ser Leu Gly Val Asn Asn Thr Ser Asp Gln Pro Leu Ser

180 185 190

Cys Asn Asn Gly Glu Arg Gly Gly Asn Ser Asn Lys Lys Lys Thr Val

195 200 205

Ser Lys Lys Glu Thr Ser Asp Asp Ser Lys Lys Lys Ile Val Glu Thr

210 215 220

Leu Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val Thr Arg His Arg Trp

225 230 235 240

Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn Ser Cys Arg Arg Glu

245 250 255

Gly Gln Ala Arg Lys Gly Arg Gln Val Tyr Leu Gly Gly Tyr Asp Lys

260 265 270

Glu Asp Arg Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys Tyr Trp

275 280 285

Gly Ser Thr Ala Thr Thr Asn Phe Pro Val Ser Ser Tyr Ser Lys Glu

290 295 300

Leu Glu Glu Met Asn His Met Thr Lys Gln Glu Phe Ile Ala Ser Leu

305 310 315 320

Arg Arg Lys Ser Ser Gly Phe Ser Arg Gly Ala Ser Ile Tyr Arg Gly

325 330 335

Val Thr Arg His His Gln Gln Gly Arg Trp Gln Ala Arg Ile Gly Arg

340 345 350

Val Ala Gly Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ala Thr Glu Glu

355 360 365

Glu Ala Ala Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg Gly Ile

370 375 380

Asn Ala Val Thr Asn Phe Glu Met Asn Arg Tyr Asp Ile Glu Ala Val

385 390 395 400

Met Asn Ser Ser Leu Pro Val Gly Gly Ala Ala Ala Lys Arg His Lys

405 410 415

Leu Lys Leu Ala Leu Glu Ser Pro Ser Ser Ser Ser Ser Asp His Asn

420 425 430

Leu Gln Gln Gln Gln Leu Leu Pro Ser Ser Ser Pro Ser Asp Gln Asn

435 440 445

Pro Asn Ser Ile Pro Cys Gly Ile Pro Phe Glu Pro Ser Val Leu Tyr

450 455 460

Tyr His Gln Asn Phe Phe Gln His Tyr Pro Leu Val Ser Asp Ser Thr

465 470 475 480

Ile Gln Ala Pro Met Asn Gln Ala Glu Phe Phe Leu Trp Pro Asn Gln

485 490 495

Ser Tyr

<210> 11

<211> 1104

<212> DNA

<213> 人工序列

<220>

<223> TaRKD4的cDNA

<400> 11

atggagatgc aacaacaata cttcgggggg gacggcgatg cggactggtt ccatcaactc 60

gcattgcttc ccccacttcc aatctcatcg tctctccccc cactcccgat gtcagagggc 120

tcatgtctcc ctatggcagc agcagctgca gctgcactcc cccttggcga ttgctcgagc 180

gccctcatga tacgccctga ggaacagatg tcttgccttc caatgaaccc ctctccagcg 240

gtcgtcgacg atgtctactc ttcctacgca ccgaacaatg tcgacgtgtt gccgccattc 300

ccggcaggac ttgacgacgc tctgttgatg gagtcttttt ctgacatcga cctcgaggag 360

tttgctgacg catttggcca caagatcaag acagaacccc tcgacgatgc catggtcccc 420

gcggaccacg acttcgcggc tcaagcccaa caggcctgcc ctgtggtcat catgaatcag 480

caacaactca acgcacccag agacgtgcgc ctgctcattg acccggatga tgatgacagc 540

accgtggtgg ccgggggcta tgaagctgca gcggtggggt gcgccgagca gaaacaggtc 600

aggccagcac cacgtagggt gagaaagagc tcaggcggcg caagaccagc cgcgggagga 660

aagtccctcg atcacatcgg attcgaggaa ctcaggacct atttctatat gccaatcacc 720

aaggcagcga gggaaatgaa cgtggggctg acagtcctga agaagagatg ccgggaactg 780

ggggtggcgc gctggccaca cagaaagatg aagtctctga gaagcctgat cctcaacatt 840

caggagatgg ggaagggcgc aacatctccc gcagccgtgc agggggaact tgaagcgctt 900

gagaggtatt gcgccattat ggaggagaac ccggctatag agctcaccga gcaaacgaag 960

aagctcaggc aggcttgttt caaagagaat tataagcggc gtagagccgc cgcttctgtt 1020

aatcttctcg atcactgcta taacgatctg gcatctcatg agcagcaaat gcctctccca 1080

caaatgggat tctttggatt ttag 1104

<210> 12

<211> 367

<212> PRT

<213> Triticum aestivum

<400> 12

Met Glu Met Gln Gln Gln Tyr Phe Gly Gly Asp Gly Asp Ala Asp Trp

1 5 10 15

Phe His Gln Leu Ala Leu Leu Pro Pro Leu Pro Ile Ser Ser Ser Leu

20 25 30

Pro Pro Leu Pro Met Ser Glu Gly Ser Cys Leu Pro Met Ala Ala Ala

35 40 45

Ala Ala Ala Ala Leu Pro Leu Gly Asp Cys Ser Ser Ala Leu Met Ile

50 55 60

Arg Pro Glu Glu Gln Met Ser Cys Leu Pro Met Asn Pro Ser Pro Ala

65 70 75 80

Val Val Asp Asp Val Tyr Ser Ser Tyr Ala Pro Asn Asn Val Asp Val

85 90 95

Leu Pro Pro Phe Pro Ala Gly Leu Asp Asp Ala Leu Leu Met Glu Ser

100 105 110

Phe Ser Asp Ile Asp Leu Glu Glu Phe Ala Asp Ala Phe Gly His Lys

115 120 125

Ile Lys Thr Glu Pro Leu Asp Asp Ala Met Val Pro Ala Asp His Asp

130 135 140

Phe Ala Ala Gln Ala Gln Gln Ala Cys Pro Val Val Ile Met Asn Gln

145 150 155 160

Gln Gln Leu Asn Ala Pro Arg Asp Val Arg Leu Leu Ile Asp Pro Asp

165 170 175

Asp Asp Asp Ser Thr Val Val Ala Gly Gly Tyr Glu Ala Ala Ala Val

180 185 190

Gly Cys Ala Glu Gln Lys Gln Val Arg Pro Ala Pro Arg Arg Val Arg

195 200 205

Lys Ser Ser Gly Gly Ala Arg Pro Ala Ala Gly Gly Lys Ser Leu Asp

210 215 220

His Ile Gly Phe Glu Glu Leu Arg Thr Tyr Phe Tyr Met Pro Ile Thr

225 230 235 240

Lys Ala Ala Arg Glu Met Asn Val Gly Leu Thr Val Leu Lys Lys Arg

245 250 255

Cys Arg Glu Leu Gly Val Ala Arg Trp Pro His Arg Lys Met Lys Ser

260 265 270

Leu Arg Ser Leu Ile Leu Asn Ile Gln Glu Met Gly Lys Gly Ala Thr

275 280 285

Ser Pro Ala Ala Val Gln Gly Glu Leu Glu Ala Leu Glu Arg Tyr Cys

290 295 300

Ala Ile Met Glu Glu Asn Pro Ala Ile Glu Leu Thr Glu Gln Thr Lys

305 310 315 320

Lys Leu Arg Gln Ala Cys Phe Lys Glu Asn Tyr Lys Arg Arg Arg Ala

325 330 335

Ala Ala Ser Val Asn Leu Leu Asp His Cys Tyr Asn Asp Leu Ala Ser

340 345 350

His Glu Gln Gln Met Pro Leu Pro Gln Met Gly Phe Phe Gly Phe

355 360 365

<210> 13

<211> 897

<212> DNA

<213> 人工序列

<220>

<223> AtRKD4的cDNA

<400> 13

atggctgatc acacaaccaa agaacagaag tcattctcat tcctagctca ttctccatcc 60

tttgatcaca gctccttaag ttatccttta ttcgactggg aagaagatct tcttgctctc 120

caagaaaact ctggctctca agcatttcct tttactacaa cttctctgcc tttacctgat 180

cttgaaccct tgtctgaaga tgtactcaat tcatacagct ctgcgtcatg gaacgaaaca 240

gagcaaaaca gaggagatgg cgcttcatcg gagaagaaga gggaaaatgg aacagtgaaa 300

gagacaacta agaagaggaa aatcaatgag agacacagag aacatagcgt gagaatcatc 360

agcgatatta ctacctacac aactagttca gctccaacga cattgtcaaa ggaaactgtc 420

tctcgctact tctacatgcc cataactcag gctgcaatag cacttaacgt tggtttaact 480

ctactaaaaa ggagatgtcg cgaattgggt attcgccgat ggcctcatcg taaacttatg 540

agcttaaaca ctttgatcag taacgtcaag gagctgcaga agatggaagg cgaagagaat 600

gcagaaaaac tgcaggacgc gttggagatg cttgagaagg agaagaggac aattgaggat 660

ttgccggatt tggagtttaa ggacaagaca aagaggctaa gacaagcttg tttcaaggct 720

aaccacaaga ggaagaagaa gagaagtctc aagtccgatc agtctcaagt accctcgtgt 780

tcaagcagcg gatcagttcc tagtgatgag tcggttgatg aagcaggaat ggagagtgat 840

gaagaaatga agtatctctt gtgtggtttc tcaagtgaat ttactagtgg tttgtga 897

<210> 14

<211> 298

<212> PRT

<213> Arabidopsis thaliana

<400> 14

Met Ala Asp His Thr Thr Lys Glu Gln Lys Ser Phe Ser Phe Leu Ala

1 5 10 15

His Ser Pro Ser Phe Asp His Ser Ser Leu Ser Tyr Pro Leu Phe Asp

20 25 30

Trp Glu Glu Asp Leu Leu Ala Leu Gln Glu Asn Ser Gly Ser Gln Ala

35 40 45

Phe Pro Phe Thr Thr Thr Ser Leu Pro Leu Pro Asp Leu Glu Pro Leu

50 55 60

Ser Glu Asp Val Leu Asn Ser Tyr Ser Ser Ala Ser Trp Asn Glu Thr

65 70 75 80

Glu Gln Asn Arg Gly Asp Gly Ala Ser Ser Glu Lys Lys Arg Glu Asn

85 90 95

Gly Thr Val Lys Glu Thr Thr Lys Lys Arg Lys Ile Asn Glu Arg His

100 105 110

Arg Glu His Ser Val Arg Ile Ile Ser Asp Ile Thr Thr Tyr Thr Thr

115 120 125

Ser Ser Ala Pro Thr Thr Leu Ser Lys Glu Thr Val Ser Arg Tyr Phe

130 135 140

Tyr Met Pro Ile Thr Gln Ala Ala Ile Ala Leu Asn Val Gly Leu Thr

145 150 155 160

Leu Leu Lys Arg Arg Cys Arg Glu Leu Gly Ile Arg Arg Trp Pro His

165 170 175

Arg Lys Leu Met Ser Leu Asn Thr Leu Ile Ser Asn Val Lys Glu Leu

180 185 190

Gln Lys Met Glu Gly Glu Glu Asn Ala Glu Lys Leu Gln Asp Ala Leu

195 200 205

Glu Met Leu Glu Lys Glu Lys Arg Thr Ile Glu Asp Leu Pro Asp Leu

210 215 220

Glu Phe Lys Asp Lys Thr Lys Arg Leu Arg Gln Ala Cys Phe Lys Ala

225 230 235 240

Asn His Lys Arg Lys Lys Lys Arg Ser Leu Lys Ser Asp Gln Ser Gln

245 250 255

Val Pro Ser Cys Ser Ser Ser Gly Ser Val Pro Ser Asp Glu Ser Val

260 265 270

Asp Glu Ala Gly Met Glu Ser Asp Glu Glu Met Lys Tyr Leu Leu Cys

275 280 285

Gly Phe Ser Ser Glu Phe Thr Ser Gly Leu

290 295

<210> 15

<211> 1185

<212> DNA

<213> 人工序列

<220>

<223> ZmRKD4的cDNA

<400> 15

atggcgatgg tgccatgcgg cgatgacacc gactggtgcc acgtgctgga caacttcaac 60

ctgttgctgt gttcgtcgtc ctgctcgccg aatgctatgg ccaacagagc ggaagactgt 120

ctgccgatat ctgctgctcc acccggaccc ggccatcatc agagctgctg caaaaacgaa 180

gtcgtcctcg aagcctcttg tgatggcgcg tttgctgcag ccgactgctt gtcttcggct 240

ctgacgaacc tgcagaggga ggacgacagt ttctatttgc ccatgtactc tgcgccaccc 300

gcagtcggcg atgagtactt ctccgatcta ctcgcgcccg atgccgacgg cattgacgag 360

gcgctcctga tgccgttcag cgacatcgat cttcaggtct tcgacagtga cgacgagcac 420

aggcctcctg tcgaccaaat ggttaatatg atcccgccgg cggttcttca tcatccctcc 480

accgccggga cgcaaaatgg aggtgccgtt catgctcatc agaaggccat ggcggtcatc 540

gatgactcct gtttccgacg aggagccagt ggtgtcgaga tggccgtcgt caggcatcat 600

ggtgagcctc gtcaaggaag ctcttccgtg gcgccagtgc cgccaccgtc actgccgggg 660

acgcgtgcaa ggaggagcga cggccgatca gctcgggcgg ggaagacgac gaagctggac 720

tacatcggct tcgacgagct gcggaagtac ttctgcatgc ccatcaccag ggcggcgagg 780

gagatgaacg tcgggctcac cgtgctcaag aagcgctgcc gcgagctcgg cgtggcgcgg 840

tggcctcacc ggaagatgaa gagcctcaag tccctcatgg ccaacgtcca ggaaatgggg 900

aacgtcatgt cctcggtggc tgtgcagcag gagcttgcgg cgctcgagac gtactgcacg 960

ctcatggagg acaatccctg gatcgagctc acggacagga ccaagaagct gcgccaggcg 1020

tgcttcaagg agaggtacaa gcgtaggagg gcggccgaag tcaacgtcat ggatatggat 1080

cgcatctact gctttggcca gcatcaccac cagcagctgc tgcctccgac gacaagcagt 1140

tctgacgacc gccatggcca gtgcagccgt tcctttggct actga 1185

<210> 16

<211> 394

<212> PRT

<213> Zea mays

<400> 16

Met Ala Met Val Pro Cys Gly Asp Asp Thr Asp Trp Cys His Val Leu

1 5 10 15

Asp Asn Phe Asn Leu Leu Leu Cys Ser Ser Ser Cys Ser Pro Asn Ala

20 25 30

Met Ala Asn Arg Ala Glu Asp Cys Leu Pro Ile Ser Ala Ala Pro Pro

35 40 45

Gly Pro Gly His His Gln Ser Cys Cys Lys Asn Glu Val Val Leu Glu

50 55 60

Ala Ser Cys Asp Gly Ala Phe Ala Ala Ala Asp Cys Leu Ser Ser Ala

65 70 75 80

Leu Thr Asn Leu Gln Arg Glu Asp Asp Ser Phe Tyr Leu Pro Met Tyr

85 90 95

Ser Ala Pro Pro Ala Val Gly Asp Glu Tyr Phe Ser Asp Leu Leu Ala

100 105 110

Pro Asp Ala Asp Gly Ile Asp Glu Ala Leu Leu Met Pro Phe Ser Asp

115 120 125

Ile Asp Leu Gln Val Phe Asp Ser Asp Asp Glu His Arg Pro Pro Val

130 135 140

Asp Gln Met Val Asn Met Ile Pro Pro Ala Val Leu His His Pro Ser

145 150 155 160

Thr Ala Gly Thr Gln Asn Gly Gly Ala Val His Ala His Gln Lys Ala

165 170 175

Met Ala Val Ile Asp Asp Ser Cys Phe Arg Arg Gly Ala Ser Gly Val

180 185 190

Glu Met Ala Val Val Arg His His Gly Glu Pro Arg Gln Gly Ser Ser

195 200 205

Ser Val Ala Pro Val Pro Pro Pro Ser Leu Pro Gly Thr Arg Ala Arg

210 215 220

Arg Ser Asp Gly Arg Ser Ala Arg Ala Gly Lys Thr Thr Lys Leu Asp

225 230 235 240

Tyr Ile Gly Phe Asp Glu Leu Arg Lys Tyr Phe Cys Met Pro Ile Thr

245 250 255

Arg Ala Ala Arg Glu Met Asn Val Gly Leu Thr Val Leu Lys Lys Arg

260 265 270

Cys Arg Glu Leu Gly Val Ala Arg Trp Pro His Arg Lys Met Lys Ser

275 280 285

Leu Lys Ser Leu Met Ala Asn Val Gln Glu Met Gly Asn Val Met Ser

290 295 300

Ser Val Ala Val Gln Gln Glu Leu Ala Ala Leu Glu Thr Tyr Cys Thr

305 310 315 320

Leu Met Glu Asp Asn Pro Trp Ile Glu Leu Thr Asp Arg Thr Lys Lys

325 330 335

Leu Arg Gln Ala Cys Phe Lys Glu Arg Tyr Lys Arg Arg Arg Ala Ala

340 345 350

Glu Val Asn Val Met Asp Met Asp Arg Ile Tyr Cys Phe Gly Gln His

355 360 365

His His Gln Gln Leu Leu Pro Pro Thr Thr Ser Ser Ser Asp Asp Arg

370 375 380

His Gly Gln Cys Ser Arg Ser Phe Gly Tyr

385 390

<210> 17

<211> 1125

<212> DNA

<213> 人工序列

<220>

<223> TaRKD2的cDNA

<400> 17

atggagatgc agcagtactt cggcggctgc ggcgatggcg atgctgactg gttccatcag 60

ctcgccttgc tcccgccttt gccggtctct tcgtctctgc cgcctctccc catgagcgag 120

ggcagctgct tacctatggc cgccgccgcc ccaacgcttc ctcttgggga ttgctcatca 180

gctctcatga ttaggccgga agaacagatg ggctgcctgc agatgatacc tccacaggct 240

gttgccgatg atgagtacag cagctacgcc accaacaatg tcgacgtcct cccgccgttt 300

cctgcaggtc tcgatgatcc cacggcaggc ctcgacgacg cgctgctcat ggagtccttc 360

agagacatcg acctggagga gttcgccgac gccgtcggcc ccaagattaa gaccgagcct 420

ctcgacgacg ccatggtgcc ggcggatcac gatttcgcgg cgcaagtgca acaggcgcgc 480

cccgtggtga tcatgaacca gcagcagctg aatgcgccac acggcgtgcg cctgctcaat 540

gatcccgacg acgatgactc agctgtcgtc gccgggggct atgaggcggc ggccgttggg 600

tgcgctgagc agaagcgggt gaggccggcg ccacgtcgtg tgcggaagag cagcggtggg 660

tcacgccctg ccgccggtgg gaaaagcctc gatcacatag ggtttgagga gctgcgtacg 720

tatttctaca tgcctatcac caaggcggcg cgggagatga acgtcggtct caccgtgctc 780

aagaagcgct gccgtgagct cggtgtcgcc cgttggcctc accggaagat gaagagcctc 840

aggtctctca tccttaacat ccaggacatg gggaagggcg ccacgtcgcc ggcggcggtg 900

caaggggagc tggaggcgct tgagaggtat tgtgccataa tggaggagaa cccggcgatc 960

gagctgacgg agcagaccaa gaagctgagg caggcctgct ttaaggagaa ctacaagagg 1020

aggagagcgg cggcctccgt caacttgctc gagcattgct acaacgactt gggcagtcat 1080

gagcagcaga tgccattgcc acagatgggt ttctttgggt tctaa 1125

<210> 18

<211> 374

<212> PRT

<213> Triticum aestivum

<400> 18

Met Glu Met Gln Gln Tyr Phe Gly Gly Cys Gly Asp Gly Asp Ala Asp

1 5 10 15

Trp Phe His Gln Leu Ala Leu Leu Pro Pro Leu Pro Val Ser Ser Ser

20 25 30

Leu Pro Pro Leu Pro Met Ser Glu Gly Ser Cys Leu Pro Met Ala Ala

35 40 45

Ala Ala Pro Thr Leu Pro Leu Gly Asp Cys Ser Ser Ala Leu Met Ile

50 55 60

Arg Pro Glu Glu Gln Met Gly Cys Leu Gln Met Ile Pro Pro Gln Ala

65 70 75 80

Val Ala Asp Asp Glu Tyr Ser Ser Tyr Ala Thr Asn Asn Val Asp Val

85 90 95

Leu Pro Pro Phe Pro Ala Gly Leu Asp Asp Pro Thr Ala Gly Leu Asp

100 105 110

Asp Ala Leu Leu Met Glu Ser Phe Arg Asp Ile Asp Leu Glu Glu Phe

115 120 125

Ala Asp Ala Val Gly Pro Lys Ile Lys Thr Glu Pro Leu Asp Asp Ala

130 135 140

Met Val Pro Ala Asp His Asp Phe Ala Ala Gln Val Gln Gln Ala Arg

145 150 155 160

Pro Val Val Ile Met Asn Gln Gln Gln Leu Asn Ala Pro His Gly Val

165 170 175

Arg Leu Leu Asn Asp Pro Asp Asp Asp Asp Ser Ala Val Val Ala Gly

180 185 190

Gly Tyr Glu Ala Ala Ala Val Gly Cys Ala Glu Gln Lys Arg Val Arg

195 200 205

Pro Ala Pro Arg Arg Val Arg Lys Ser Ser Gly Gly Ser Arg Pro Ala

210 215 220

Ala Gly Gly Lys Ser Leu Asp His Ile Gly Phe Glu Glu Leu Arg Thr

225 230 235 240

Tyr Phe Tyr Met Pro Ile Thr Lys Ala Ala Arg Glu Met Asn Val Gly

245 250 255

Leu Thr Val Leu Lys Lys Arg Cys Arg Glu Leu Gly Val Ala Arg Trp

260 265 270

Pro His Arg Lys Met Lys Ser Leu Arg Ser Leu Ile Leu Asn Ile Gln

275 280 285

Asp Met Gly Lys Gly Ala Thr Ser Pro Ala Ala Val Gln Gly Glu Leu

290 295 300

Glu Ala Leu Glu Arg Tyr Cys Ala Ile Met Glu Glu Asn Pro Ala Ile

305 310 315 320

Glu Leu Thr Glu Gln Thr Lys Lys Leu Arg Gln Ala Cys Phe Lys Glu

325 330 335

Asn Tyr Lys Arg Arg Arg Ala Ala Ala Ser Val Asn Leu Leu Glu His

340 345 350

Cys Tyr Asn Asp Leu Gly Ser His Glu Gln Gln Met Pro Leu Pro Gln

355 360 365

Met Gly Phe Phe Gly Phe

370

<210> 19

<211> 771

<212> DNA

<213> 人工序列

<220>

<223> AtRKD2的cDNA

<400> 19

atgagttcgt caaaacattc ctctgttttt aactattctg ctctgtttct atcactgttt 60

cttcaacaaa tggatcagaa ctctcttcat catctcgatt ctccaaaaat cgaaaacgag 120

tatgaaccag attcgttata cgacatgtta gataagttgc ctccgcttga ttctctccta 180

gatatggaag atttgaaacc aaatgcaggg ttgcactttc agttccatta caatagcttt 240

gaagatttct tcgaaaacat tgaagtggat aacacaattc catctgatat tcacttgttg 300

acacaagagc cctacttctc aagtgactcc tcttcctctt caccattggc tatccaaaac 360

gacggtctca tttccaacgt gaaagttgaa aaggtaacag ttaagaagaa gaggaacctt 420

aagaaaaaga ggcaagacaa attggagatg tctgagatca aacaattttt cgataggccg 480

atcatgaaag cggctaaaga actgaacgtg ggactcactg tgttgaagaa gcgatgcagg 540

gaattaggaa tttaccggtg gcctcaccgg aagctcaaga gtctaaactc tcttataaag 600

aatctcaaga atgttggaat ggaagaggaa gtgaagaact tggaggaaca taggtttctt 660

attgaacaag aacctgatgc agaactcagt gatggaacca agaagctaag gcaagcttgt 720

ttcaaagcca attataagag aagaaaatca cttggtgatg attattattg a 771

<210> 20

<211> 256

<212> PRT

<213> Arabidopsis thaliana

<400> 20

Met Ser Ser Ser Lys His Ser Ser Val Phe Asn Tyr Ser Ala Leu Phe

1 5 10 15

Leu Ser Leu Phe Leu Gln Gln Met Asp Gln Asn Ser Leu His His Leu

20 25 30

Asp Ser Pro Lys Ile Glu Asn Glu Tyr Glu Pro Asp Ser Leu Tyr Asp

35 40 45

Met Leu Asp Lys Leu Pro Pro Leu Asp Ser Leu Leu Asp Met Glu Asp

50 55 60

Leu Lys Pro Asn Ala Gly Leu His Phe Gln Phe His Tyr Asn Ser Phe

65 70 75 80

Glu Asp Phe Phe Glu Asn Ile Glu Val Asp Asn Thr Ile Pro Ser Asp

85 90 95

Ile His Leu Leu Thr Gln Glu Pro Tyr Phe Ser Ser Asp Ser Ser Ser

100 105 110

Ser Ser Pro Leu Ala Ile Gln Asn Asp Gly Leu Ile Ser Asn Val Lys

115 120 125

Val Glu Lys Val Thr Val Lys Lys Lys Arg Asn Leu Lys Lys Lys Arg

130 135 140

Gln Asp Lys Leu Glu Met Ser Glu Ile Lys Gln Phe Phe Asp Arg Pro

145 150 155 160

Ile Met Lys Ala Ala Lys Glu Leu Asn Val Gly Leu Thr Val Leu Lys

165 170 175

Lys Arg Cys Arg Glu Leu Gly Ile Tyr Arg Trp Pro His Arg Lys Leu

180 185 190

Lys Ser Leu Asn Ser Leu Ile Lys Asn Leu Lys Asn Val Gly Met Glu

195 200 205

Glu Glu Val Lys Asn Leu Glu Glu His Arg Phe Leu Ile Glu Gln Glu

210 215 220

Pro Asp Ala Glu Leu Ser Asp Gly Thr Lys Lys Leu Arg Gln Ala Cys

225 230 235 240

Phe Lys Ala Asn Tyr Lys Arg Arg Lys Ser Leu Gly Asp Asp Tyr Tyr

245 250 255

<210> 21

<211> 936

<212> DNA

<213> 人工序列

<220>

<223> ZmRKD2的cDNA

<400> 21

atgacgggcc tcgacgaggc gctcatgctg ccgttcaccg acatcgatct tgaggccttc 60

gacaacgccg aagagcaaaa gcctcctgtc gaccaaatgg ttatgatgcc gccgacggtt 120

gaacaccccg ccgccgccgg gacgcgagcc ccaatcatca ttgatggtac ggcgaccgtt 180

ggccaaaatg taggtggtgg tgtcgtccac gctcatcaga aggcggccat gacgaccata 240

gaggactcca gctgcttccg acgaggagcc agctgtgtcg acgacgacat ggccgtcgtc 300

attcaccatg tcgagcgtcg tcgtcaagca ggctctaccg ccgtggcgct attgccgccg 360

ccgcagccgt cactgccgcg gccgcgtgca agggcgagcg gcggcgcggg cgagcggtca 420

gctccggcgg ccgccgggaa gacgaggatg gaccacatcg gcttcgacga gctgcgcaag 480

tacttctaca tgcccatcac cagggcggcc agggagatga acgtggggct caccgtgctc 540

aagaagcgct gccgcgagct cggcgtggcg cggtggcctc accggaagat gaagagcctc 600

aagtccctca tggccaacgt acaggaaatg gggaacggca tgtcgccggt ggctgtgcag 660

catgagcttg cggcgctgga gacgtactgc gcgctcatgg aggagaaccc atggatcgag 720

ctcacggacc ggacgaagag gctgcggcag gcctgcttca aggagagcta caagcggagg 780

aaggcggccg caggcaacgc tatcgagacg gatcacattg tctacagctt tggacagcat 840

cgtcgttaca agcagcagct gctgcctccg ccaactgcgg gtagtaccag tgctgacgac 900

cgccatggcc agagcagccg tttcttttgc tactga 936

<210> 22

<211> 311

<212> PRT

<213> Zea mays

<400> 22

Met Thr Gly Leu Asp Glu Ala Leu Met Leu Pro Phe Thr Asp Ile Asp

1 5 10 15

Leu Glu Ala Phe Asp Asn Ala Glu Glu Gln Lys Pro Pro Val Asp Gln

20 25 30

Met Val Met Met Pro Pro Thr Val Glu His Pro Ala Ala Ala Gly Thr

35 40 45

Arg Ala Pro Ile Ile Ile Asp Gly Thr Ala Thr Val Gly Gln Asn Val

50 55 60

Gly Gly Gly Val Val His Ala His Gln Lys Ala Ala Met Thr Thr Ile

65 70 75 80

Glu Asp Ser Ser Cys Phe Arg Arg Gly Ala Ser Cys Val Asp Asp Asp

85 90 95

Met Ala Val Val Ile His His Val Glu Arg Arg Arg Gln Ala Gly Ser

100 105 110

Thr Ala Val Ala Leu Leu Pro Pro Pro Gln Pro Ser Leu Pro Arg Pro

115 120 125

Arg Ala Arg Ala Ser Gly Gly Ala Gly Glu Arg Ser Ala Pro Ala Ala

130 135 140

Ala Gly Lys Thr Arg Met Asp His Ile Gly Phe Asp Glu Leu Arg Lys

145 150 155 160

Tyr Phe Tyr Met Pro Ile Thr Arg Ala Ala Arg Glu Met Asn Val Gly

165 170 175

Leu Thr Val Leu Lys Lys Arg Cys Arg Glu Leu Gly Val Ala Arg Trp

180 185 190

Pro His Arg Lys Met Lys Ser Leu Lys Ser Leu Met Ala Asn Val Gln

195 200 205

Glu Met Gly Asn Gly Met Ser Pro Val Ala Val Gln His Glu Leu Ala

210 215 220

Ala Leu Glu Thr Tyr Cys Ala Leu Met Glu Glu Asn Pro Trp Ile Glu

225 230 235 240

Leu Thr Asp Arg Thr Lys Arg Leu Arg Gln Ala Cys Phe Lys Glu Ser

245 250 255

Tyr Lys Arg Arg Lys Ala Ala Ala Gly Asn Ala Ile Glu Thr Asp His

260 265 270

Ile Val Tyr Ser Phe Gly Gln His Arg Arg Tyr Lys Gln Gln Leu Leu

275 280 285

Pro Pro Pro Thr Ala Gly Ser Thr Ser Ala Asp Asp Arg His Gly Gln

290 295 300

Ser Ser Arg Phe Phe Cys Tyr

305 310

<210> 23

<211> 1883

<212> DNA

<213> Brachypodium distachyon

<400> 23

cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60

tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120

gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180

gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240

ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300

tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360

catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420

tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480

cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540

aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600

aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660

ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720

ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780

atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840

attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900

acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960

agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020

gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080

tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140

ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200

tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260

gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320

tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380

agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440

gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500

ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560

acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620

ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680

gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740

agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800

taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860

ctgttacttc gatgctgcag ttt 1883

<210> 24

<211> 5100

<212> DNA

<213> 人工序列

<220>

<223> pABM-BdEF1

<400> 24

gatcccccgg gctgcaggaa ttcaagctta cgcgtgtcga ctcgaatttc cccgatcgtt 60

caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta 120

tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt 180

tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag 240

aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatgttac 300

tagatcgctc gacgcggccg ccatggccag atcgtaccca attcgcccta tagtgagtcg 360

tattacaatt cactggccgt cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc 420

caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag cgaagaggcc 480

cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggaa attgtaagcg 540

ttaatatttt gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat 600

aggccgaaat cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg 660

ttgttccagt ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc 720

gaaaaaccgt ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt 780

tggggtcgag gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag 840

cttgacgggg aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg 900

gcgctagggc gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc 960

ttaatgcgcc gctacagggc gcgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 1020

ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 1080

gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 1140

cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 1200

tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 1260

tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 1320

cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 1380

tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 1440

agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 1500

ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 1560

ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 1620

aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 1680

gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 1740

tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 1800

ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 1860

cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 1920

atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 1980

cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 2040

ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 2100

cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 2160

ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 2220

tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 2280

taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 2340

caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 2400

agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 2460

gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 2520

gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 2580

ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 2640

acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 2700

tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 2760

ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 2820

ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 2880

ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc 2940

tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 3000

cgggcagtga gcgcaacgca attaatgtga gttagctcac tcattaggca ccccaggctt 3060

tacactttat gcttccggct cgtatgttgt gtggaattgt gagcggataa caatttcaca 3120

caggaaacag ctatgaccat gattacgcca agctcgaaat taaccctcac taaagggaac 3180

aaaagctgga ctagaggccc ttaaggcctt actagacttc accgccattg caaaaattgt 3240

caataaatat ttagagtggg tggcatcaga aaaacatctc tagtggactc tcttcctatc 3300

atagctactc gggctgtaga tagaacgagg gcacaagagt tgggtggcgt aggtttactc 3360

gtgacctcaa ctcttttggc tgtgtcttac gtctaagatg ggtttggcat gtgagaaaca 3420

taggtctaag caattcatgt tagggctgtt gcattgttgt tgcatcaacc aaatgtccag 3480

atagcagttc atgctacatc tagttgaaaa ccctcatcat taggcggaac atgtgttctt 3540

ttttagcata gtcaaagtca gattgcggca ctcgctcatc cacggaaaga attttccctg 3600

tgcaggcatc tcgatcaaaa gacgcaaatt aatttttgaa tagcgatata acaatatcta 3660

attaacgttt cttgttttct gcgaaatgtc tttcatcata aaatgagtca tctcgatgag 3720

cccaagtgac atagcccaac accccacccc accaataaaa gtgaagaaaa catgttggga 3780

aaactatacc aagtaaaata cgagttgttc taaagaaaaa gtaaagtacg agttagatcg 3840

caccctgtcc tggagtgtgg cttgatgatc caactcctag cattgtatcc ctgtttttgg 3900

atgatgtaac tattatttac aatgaataaa gaggtgtttt actagtaaaa aaatcttgag 3960

gggaggagaa aataatggag gtcttttttc aaaccgatgg actattattt ttagtgaaag 4020

agaataatat tattggaaaa attattctat ccacttattt tatattggca gaatacaaag 4080

aatggtgggg tccacgcgga acttgcggcc cccgaaacct atcgagggcg cggtacccaa 4140

gcaaggaacg gaggaaactt gcggggcccg aaacctagtg ataaaaggca tatcatccac 4200

acgatgaaga tctgacggac catatctccc accacggaaa gccatcagac gaggatcaga 4260

cggccaggaa ggaaccctag cgcccgccgg tgccaatata aagcgccact ctctctcgtc 4320

ttaagcccca gcctctccat tcccctctcc ctctcgccgc cgccgtctcc ttctcctact 4380

cccttcgagg tgtgttgttc atccgtcccg aatccatcca tcccctcttc agatgtgttg 4440

ttcatggctc taatagctct agatctgctt gtttgtgttg tttagctcta gatctactcg 4500

cgcgcgcttc tctctcgatc tcctgtagaa caattttggt tggttttttg tgcatatcca 4560

tggtaatttt gtctgcaata tggaggaggc tttctaagct cctacgtagc atcgatcttt 4620

agaattccct cggtttctgt ttatttcttc gcgagggctc tctgttatct gtaggagtag 4680

ctgtaagcgc ggttcgttac ggattaatcg tcatgcttag ttgaacctat cggtcgaagg 4740

atttgtgtgg gttgtcgtgt agaattgaca ccatctactt actgtactga tatgccgatc 4800

tgtaggatac tcttcattac ttttgtttac tgctagttgt ggtgtagatt tagcattctc 4860

aaacccatgc tgtagcgttt ctaatattgt tacatagatc taccggtgcc tgttaattgt 4920

attcgatcgg gcgtttctac atctgtccgc ccacctagtt ttatatgtgg taatcaaaat 4980

tgcgttgact tcgtgatgct gtctgtgtac tgtttttaat cgctcttact tagatgatca 5040

acatggtgat ggttacgatt tactgttttc taatccctgt tacttcgatg ctgcagtttg 5100

<210> 25

<211> 6567

<212> DNA

<213> 人工序列

<220>

<223> pABM-BdEF1_ZmPLT5

<400> 25

agcttacgcg tgtcgactcg aatttccccg atcgttcaaa catttggcaa taaagtttct 60

taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 120

ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 180

ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 240

aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tcgctcgacg cggccgccat 300

ggccagatcg tacccaattc gccctatagt gagtcgtatt acaattcact ggccgtcgtt 360

ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 420

ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 480

ttgcgcagcc tgaatggcga atggaaattg taagcgttaa tattttgtta aaattcgcgt 540

taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt 600

ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc 660

cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg 720

gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac 780

taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg 840

tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag 900

cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt 960

caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 1020

attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 1080

aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 1140

tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 1200

agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 1260

gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 1320

cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 1380

agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 1440

taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 1500

tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 1560

taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 1620

acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 1680

ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 1740

cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 1800

agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 1860

tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 1920

agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 1980

tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 2040

ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 2100

tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 2160

aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 2220

tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 2280

agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 2340

taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 2400

caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 2460

agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 2520

aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 2580

gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 2640

tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 2700

gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 2760

ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 2820

ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 2880

aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 2940

aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 3000

atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 3060

tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 3120

acgccaagct cgaaattaac cctcactaaa gggaacaaaa gctggactag aggcccttaa 3180

ggccttacta gacttcaccg ccattgcaaa aattgtcaat aaatatttag agtgggtggc 3240

atcagaaaaa catctctagt ggactctctt cctatcatag ctactcgggc tgtagataga 3300

acgagggcac aagagttggg tggcgtaggt ttactcgtga cctcaactct tttggctgtg 3360

tcttacgtct aagatgggtt tggcatgtga gaaacatagg tctaagcaat tcatgttagg 3420

gctgttgcat tgttgttgca tcaaccaaat gtccagatag cagttcatgc tacatctagt 3480

tgaaaaccct catcattagg cggaacatgt gttctttttt agcatagtca aagtcagatt 3540

gcggcactcg ctcatccacg gaaagaattt tccctgtgca ggcatctcga tcaaaagacg 3600

caaattaatt tttgaatagc gatataacaa tatctaatta acgtttcttg ttttctgcga 3660

aatgtctttc atcataaaat gagtcatctc gatgagccca agtgacatag cccaacaccc 3720

caccccacca ataaaagtga agaaaacatg ttgggaaaac tataccaagt aaaatacgag 3780

ttgttctaaa gaaaaagtaa agtacgagtt agatcgcacc ctgtcctgga gtgtggcttg 3840

atgatccaac tcctagcatt gtatccctgt ttttggatga tgtaactatt atttacaatg 3900

aataaagagg tgttttacta gtaaaaaaat cttgagggga ggagaaaata atggaggtct 3960

tttttcaaac cgatggacta ttatttttag tgaaagagaa taatattatt ggaaaaatta 4020

ttctatccac ttattttata ttggcagaat acaaagaatg gtggggtcca cgcggaactt 4080

gcggcccccg aaacctatcg agggcgcggt acccaagcaa ggaacggagg aaacttgcgg 4140

ggcccgaaac ctagtgataa aaggcatatc atccacacga tgaagatctg acggaccata 4200

tctcccacca cggaaagcca tcagacgagg atcagacggc caggaaggaa ccctagcgcc 4260

cgccggtgcc aatataaagc gccactctct ctcgtcttaa gccccagcct ctccattccc 4320

ctctccctct cgccgccgcc gtctccttct cctactccct tcgaggtgtg ttgttcatcc 4380

gtcccgaatc catccatccc ctcttcagat gtgttgttca tggctctaat agctctagat 4440

ctgcttgttt gtgttgttta gctctagatc tactcgcgcg cgcttctctc tcgatctcct 4500

gtagaacaat tttggttggt tttttgtgca tatccatggt aattttgtct gcaatatgga 4560

ggaggctttc taagctccta cgtagcatcg atctttagaa ttccctcggt ttctgtttat 4620

ttcttcgcga gggctctctg ttatctgtag gagtagctgt aagcgcggtt cgttacggat 4680

taatcgtcat gcttagttga acctatcggt cgaaggattt gtgtgggttg tcgtgtagaa 4740

ttgacaccat ctacttactg tactgatatg ccgatctgta ggatactctt cattactttt 4800

gtttactgct agttgtggtg tagatttagc attctcaaac ccatgctgta gcgtttctaa 4860

tattgttaca tagatctacc ggtgcctgtt aattgtattc gatcgggcgt ttctacatct 4920

gtccgcccac ctagttttat atgtggtaat caaaattgcg ttgacttcgt gatgctgtct 4980

gtgtactgtt tttaatcgct cttacttaga tgatcaacat ggtgatggtt acgatttact 5040

gttttctaat ccctgttact tcgatgctgc agtttggatc catggacacc tcgcaccact 5100

atcatccatg gctcaacttc tccctcgccc accactgtga cctcgaggag gaggagaggg 5160

gcgcggccgc cgagctggcc gcgatagccg gcgccgcgcc gccgccgaag ctggaggact 5220

tcctcggcgg aggcgtcgcc accggtggtc cggaggcggt ggcgcccgcg gagatgtacg 5280

actcggacct caagttcata gccgccgccg ggttccttgg cggctcggcg gcggcggcgg 5340

cgacgtcgcc gctgtcctcc ctcgaccagg ccggttccaa gctggccttg cctgcggcgg 5400

cggctgctcc ggcgccggag cagaggaagg ccgtcgactc ctttgggcag cgcacgtcca 5460

tctaccgcgg cgtcacacgg caccggtgga ctggcaggta cgaggcacat ctgtgggaca 5520

acagctgccg acgcgaaggg cagagccgca agggccgcca agtatatttg ggtggctatg 5580

ataaggagga gaaggctgcc agggcgtatg atcttgcagc tttgaagtac tggggttcta 5640

gcaccaccac caactttccg gttgctgagt atgagaagga ggtcgaggag atgaagaaca 5700

tgacgcgaca agagtttgtt gcttcccttc gaaggaagag cagtggattc tctcggggtg 5760

cttccatcta cagaggtgta accagacatc accagcatgg acggtggcag gcgaggatcg 5820

gaagggtggc cggtaacaag gacctctacc ttgggacgtt cagcaccgag gaggaagctg 5880

cagaggccta cgacatagcg gccatcaagt tcagaggcct gaacgccgtc acaaacttcg 5940

agatcagccg gtacaacgtg gagaccataa tgagcagcaa ccttccagtc gcgagcatgt 6000

cgtcgtcgtc ggcggcggcg gcgggtggcc ggagcagcaa ggcgctggag tcccctccgt 6060

ccggctcgct tgacggcggc ggcggcatgc cagtcgtcga aggcagcacg gcaccgccgc 6120

tgttcattcc ggtgaagtac gaccagcagc agcaggagta cctgtcgatg ctcgcgttgc 6180

agcaccacca ccagcagcaa caagcaggga acctgttgca ggggccgcta gtagggttcg 6240

gcggcctcta ctcctccggg gtgaacctgg atttcgccaa ctcccacggc acggcggctc 6300

cgtcgtcgat ggcccaccac tgctacgcca atggcaccgc gtccgcctcg catgagcacc 6360

agcaccagca ccagatgcag cagggcggcg agaacgagac gcagccgcag ccgcagcaga 6420

gctccagcag ctgctcctcc ctgccattcg ccaccccggt cgctttcaat gggtcctatg 6480

aaagctccat cacggcggca ggcccctttg gatactccta cccaaatgtg gcagcctttc 6540

agacgccgat ctatggaatg gaatgaa 6567

<210> 26

<211> 6552

<212> DNA

<213> 人工序列

<220>

<223> pABM-BdEF1_ZmPLT7

<400> 26

agcttacgcg tgtcgactcg aatttccccg atcgttcaaa catttggcaa taaagtttct 60

taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 120

ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 180

ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 240

aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tcgctcgacg cggccgccat 300

ggccagatcg tacccaattc gccctatagt gagtcgtatt acaattcact ggccgtcgtt 360

ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 420

ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 480

ttgcgcagcc tgaatggcga atggaaattg taagcgttaa tattttgtta aaattcgcgt 540

taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt 600

ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc 660

cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg 720

gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac 780

taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg 840

tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag 900

cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt 960

caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 1020

attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 1080

aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 1140

tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 1200

agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 1260

gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 1320

cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 1380

agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 1440

taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 1500

tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 1560

taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 1620

acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 1680

ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 1740

cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 1800

agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 1860

tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 1920

agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 1980

tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 2040

ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 2100

tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 2160

aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 2220

tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 2280

agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 2340

taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 2400

caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 2460

agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 2520

aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 2580

gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 2640

tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 2700

gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 2760

ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 2820

ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 2880

aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 2940

aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 3000

atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 3060

tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 3120

acgccaagct cgaaattaac cctcactaaa gggaacaaaa gctggactag aggcccttaa 3180

ggccttacta gacttcaccg ccattgcaaa aattgtcaat aaatatttag agtgggtggc 3240

atcagaaaaa catctctagt ggactctctt cctatcatag ctactcgggc tgtagataga 3300

acgagggcac aagagttggg tggcgtaggt ttactcgtga cctcaactct tttggctgtg 3360

tcttacgtct aagatgggtt tggcatgtga gaaacatagg tctaagcaat tcatgttagg 3420

gctgttgcat tgttgttgca tcaaccaaat gtccagatag cagttcatgc tacatctagt 3480

tgaaaaccct catcattagg cggaacatgt gttctttttt agcatagtca aagtcagatt 3540

gcggcactcg ctcatccacg gaaagaattt tccctgtgca ggcatctcga tcaaaagacg 3600

caaattaatt tttgaatagc gatataacaa tatctaatta acgtttcttg ttttctgcga 3660

aatgtctttc atcataaaat gagtcatctc gatgagccca agtgacatag cccaacaccc 3720

caccccacca ataaaagtga agaaaacatg ttgggaaaac tataccaagt aaaatacgag 3780

ttgttctaaa gaaaaagtaa agtacgagtt agatcgcacc ctgtcctgga gtgtggcttg 3840

atgatccaac tcctagcatt gtatccctgt ttttggatga tgtaactatt atttacaatg 3900

aataaagagg tgttttacta gtaaaaaaat cttgagggga ggagaaaata atggaggtct 3960

tttttcaaac cgatggacta ttatttttag tgaaagagaa taatattatt ggaaaaatta 4020

ttctatccac ttattttata ttggcagaat acaaagaatg gtggggtcca cgcggaactt 4080

gcggcccccg aaacctatcg agggcgcggt acccaagcaa ggaacggagg aaacttgcgg 4140

ggcccgaaac ctagtgataa aaggcatatc atccacacga tgaagatctg acggaccata 4200

tctcccacca cggaaagcca tcagacgagg atcagacggc caggaaggaa ccctagcgcc 4260

cgccggtgcc aatataaagc gccactctct ctcgtcttaa gccccagcct ctccattccc 4320

ctctccctct cgccgccgcc gtctccttct cctactccct tcgaggtgtg ttgttcatcc 4380

gtcccgaatc catccatccc ctcttcagat gtgttgttca tggctctaat agctctagat 4440

ctgcttgttt gtgttgttta gctctagatc tactcgcgcg cgcttctctc tcgatctcct 4500

gtagaacaat tttggttggt tttttgtgca tatccatggt aattttgtct gcaatatgga 4560

ggaggctttc taagctccta cgtagcatcg atctttagaa ttccctcggt ttctgtttat 4620

ttcttcgcga gggctctctg ttatctgtag gagtagctgt aagcgcggtt cgttacggat 4680

taatcgtcat gcttagttga acctatcggt cgaaggattt gtgtgggttg tcgtgtagaa 4740

ttgacaccat ctacttactg tactgatatg ccgatctgta ggatactctt cattactttt 4800

gtttactgct agttgtggtg tagatttagc attctcaaac ccatgctgta gcgtttctaa 4860

tattgttaca tagatctacc ggtgcctgtt aattgtattc gatcgggcgt ttctacatct 4920

gtccgcccac ctagttttat atgtggtaat caaaattgcg ttgacttcgt gatgctgtct 4980

gtgtactgtt tttaatcgct cttacttaga tgatcaacat ggtgatggtt acgatttact 5040

gttttctaat ccctgttact tcgatgctgc agtttggatc catggacatg gacatgagct 5100

cagcttatcc ccaccattgg ctctccttct ccctctccaa caactaccac catggcctac 5160

tcgaggcctt ctctaactcc tccggtactc ctcttggaga cgagccgggc gcagtggagg 5220

agtccccgag gacggtggag gacttcctcg gcggcgtcgg tggcgccggc gccccgccgc 5280

agccggcggc tgctgcagat caggatcacc agcttgtgtg cggcgagctg ggcagcatca 5340

cagccaggtt cttgcgccac tacccggcgg cgccagctgg gacgacggtg gagaaccccg 5400

gcgcggtgac cgtggcggcc atgtcgtcga cggacgtggc gggggcggag tccgaccagg 5460

cgaggcggcc cgccgagacg ttcggccagc gcacatccat ctaccgtggc gtcaccaggc 5520

accggtggac agggagatat gaggcgcact tgtgggacaa cagctgccgc cgggagggcc 5580

aaagccgcaa aggacgccaa gtctacctag gaggctatga caaggaggag aaggcggcta 5640

gagcttacga cctcgccgcg ctcaagtact gggggcctac aaccacgacc aacttcccgg 5700

tgtccaacta cgagaaggag ctggaggaga tgaagtccat gacgcggcag gagttcatcg 5760

cgtcgttgcg caggaagagc agcggcttct cacgaggcgc ctccatctac agaggagtca 5820

caaggcatca tcagcacggc cggtggcagg cgaggatcgg cagggtggcc ggaaacaagg 5880

acctgtactt gggcactttc agtactcagg aagaggcggc ggaggcgtac gacatcgctg 5940

cgatcaagtt ccgcgggctc aacgccgtca ccaacttcga catgagccgc tacgacgtgg 6000

agagcatcct cagcagcgac ctccccgtcg ggggcggagc caccgggcgc gccgccaagt 6060

tcccgttgga ctcgctgcag ccggggagcg ctgctgcgat gatgctcgcc ggggctgctg 6120

ccgcttcgca ggccaccatg ccgccgtccg agaaggacta ctggtctctg ctcgccctgc 6180

actaccagca gcagcaggag caggagcggc agttcccggc ttctgcttac gaggcttacg 6240

gctccggcgg cgtgaacgtg gacttcacga tgggcaccag tagcggcaac aacaacaaca 6300

acaccggcag cggcgtcatg tggggcgcca ccactggtgc agtagtagtg ggacagcaag 6360

acagcagcgg caagcagggc aacggctatg ccagcaacat tccttatgct gctgctgctg 6420

ctatggtttc tggatctgct ggctacgagg gctccaccgg cgacaatgga acctgggtta 6480

ctacgactat taccagcagc aacaccggca cggctcccca ctactacaac tatctcttcg 6540

ggatggagta ga 6552

<210> 27

<211> 5865

<212> DNA

<213> 人工序列

<220>

<223> pABM-BdEF1_KWS_RBP1

<400> 27

agcttacgcg tgtcgactcg aatttccccg atcgttcaaa catttggcaa taaagtttct 60

taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 120

ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 180

ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 240

aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tcgctcgacg cggccgccat 300

ggccagatcg tacccaattc gccctatagt gagtcgtatt acaattcact ggccgtcgtt 360

ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 420

ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 480

ttgcgcagcc tgaatggcga atggaaattg taagcgttaa tattttgtta aaattcgcgt 540

taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt 600

ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc 660

cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg 720

gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac 780

taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg 840

tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag 900

cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt 960

caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 1020

attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 1080

aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 1140

tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 1200

agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 1260

gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 1320

cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 1380

agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 1440

taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 1500

tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 1560

taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 1620

acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 1680

ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 1740

cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 1800

agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 1860

tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 1920

agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 1980

tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 2040

ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 2100

tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 2160

aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 2220

tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 2280

agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 2340

taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 2400

caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 2460

agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 2520

aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 2580

gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 2640

tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 2700

gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 2760

ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 2820

ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 2880

aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 2940

aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 3000

atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 3060

tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 3120

acgccaagct cgaaattaac cctcactaaa gggaacaaaa gctggactag aggcccttaa 3180

ggccttacta gacttcaccg ccattgcaaa aattgtcaat aaatatttag agtgggtggc 3240

atcagaaaaa catctctagt ggactctctt cctatcatag ctactcgggc tgtagataga 3300

acgagggcac aagagttggg tggcgtaggt ttactcgtga cctcaactct tttggctgtg 3360

tcttacgtct aagatgggtt tggcatgtga gaaacatagg tctaagcaat tcatgttagg 3420

gctgttgcat tgttgttgca tcaaccaaat gtccagatag cagttcatgc tacatctagt 3480

tgaaaaccct catcattagg cggaacatgt gttctttttt agcatagtca aagtcagatt 3540

gcggcactcg ctcatccacg gaaagaattt tccctgtgca ggcatctcga tcaaaagacg 3600

caaattaatt tttgaatagc gatataacaa tatctaatta acgtttcttg ttttctgcga 3660

aatgtctttc atcataaaat gagtcatctc gatgagccca agtgacatag cccaacaccc 3720

caccccacca ataaaagtga agaaaacatg ttgggaaaac tataccaagt aaaatacgag 3780

ttgttctaaa gaaaaagtaa agtacgagtt agatcgcacc ctgtcctgga gtgtggcttg 3840

atgatccaac tcctagcatt gtatccctgt ttttggatga tgtaactatt atttacaatg 3900

aataaagagg tgttttacta gtaaaaaaat cttgagggga ggagaaaata atggaggtct 3960

tttttcaaac cgatggacta ttatttttag tgaaagagaa taatattatt ggaaaaatta 4020

ttctatccac ttattttata ttggcagaat acaaagaatg gtggggtcca cgcggaactt 4080

gcggcccccg aaacctatcg agggcgcggt acccaagcaa ggaacggagg aaacttgcgg 4140

ggcccgaaac ctagtgataa aaggcatatc atccacacga tgaagatctg acggaccata 4200

tctcccacca cggaaagcca tcagacgagg atcagacggc caggaaggaa ccctagcgcc 4260

cgccggtgcc aatataaagc gccactctct ctcgtcttaa gccccagcct ctccattccc 4320

ctctccctct cgccgccgcc gtctccttct cctactccct tcgaggtgtg ttgttcatcc 4380

gtcccgaatc catccatccc ctcttcagat gtgttgttca tggctctaat agctctagat 4440

ctgcttgttt gtgttgttta gctctagatc tactcgcgcg cgcttctctc tcgatctcct 4500

gtagaacaat tttggttggt tttttgtgca tatccatggt aattttgtct gcaatatgga 4560

ggaggctttc taagctccta cgtagcatcg atctttagaa ttccctcggt ttctgtttat 4620

ttcttcgcga gggctctctg ttatctgtag gagtagctgt aagcgcggtt cgttacggat 4680

taatcgtcat gcttagttga acctatcggt cgaaggattt gtgtgggttg tcgtgtagaa 4740

ttgacaccat ctacttactg tactgatatg ccgatctgta ggatactctt cattactttt 4800

gtttactgct agttgtggtg tagatttagc attctcaaac ccatgctgta gcgtttctaa 4860

tattgttaca tagatctacc ggtgcctgtt aattgtattc gatcgggcgt ttctacatct 4920

gtccgcccac ctagttttat atgtggtaat caaaattgcg ttgacttcgt gatgctgtct 4980

gtgtactgtt tttaatcgct cttacttaga tgatcaacat ggtgatggtt acgatttact 5040

gttttctaat ccctgttact tcgatgctgc agtttggatc catggagtcg ggctccggga 5100

cggctgctgg ctctggctat gtttacagac agccaggatc aacgcggtgg aacccgacag 5160

ctgaacaact gtccttgctt agagaaatct actaccgcaa cggattgcgg accccgaccg 5220

cggacgaaat cagacaaatc agctcaaagc tctcaaggta cggaaaaata gagggcaaaa 5280

acgtttacaa ctggttccag aatagacgcg caagagaaaa gcgcaagcaa cggctctcta 5340

caatcggctg tgatccagca ctgatcgaga tggggaatgt cgcttcactg gaattcggta 5400

ctgagagcgc cctggaatcg ctgtcgtcag gaccatcctc agaactccgc gaagcgccaa 5460

cgagaaaatt ttacgaaaaa aagacggttg gagagaactc aactataata aacccagtgg 5520

aacaaaactg taccctttcc tgcggaacgt cccaagagtt ccagtatgcg gtcgattctc 5580

ggcgcgtcat gaaagctatg gaggaaaagc aggcgacgga cgatgaaccc gacggaaata 5640

aatggactga gtcaaacaga cacgtcaaga ttctccagct tttcccgctc cacaataacg 5700

aggatcagac attgataaag agcgacaaag aaatctattg tttgggctcg tgcgagaaga 5760

aaatggattt gtcaccgctg ggtcattcag gctctcagcg cgcttcggcc cttgacttgt 5820

gcctttcatt gggcaacgaa tcttgtgggc tgcatgataa ttgaa 5865

<210> 28

<211> 6186

<212> DNA

<213> 人工序列

<220>

<223> pABM-BdEF1_TaRKD4

<400> 28

agcttacgcg tgtcgactcg aatttccccg atcgttcaaa catttggcaa taaagtttct 60

taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 120

ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 180

ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 240

aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tcgctcgacg cggccgccat 300

ggccagatcg tacccaattc gccctatagt gagtcgtatt acaattcact ggccgtcgtt 360

ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 420

ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 480

ttgcgcagcc tgaatggcga atggaaattg taagcgttaa tattttgtta aaattcgcgt 540

taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt 600

ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc 660

cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg 720

gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac 780

taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg 840

tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag 900

cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt 960

caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 1020

attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 1080

aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 1140

tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 1200

agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 1260

gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 1320

cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 1380

agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 1440

taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 1500

tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 1560

taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 1620

acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 1680

ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 1740

cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 1800

agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 1860

tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 1920

agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 1980

tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 2040

ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 2100

tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 2160

aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 2220

tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 2280

agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 2340

taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 2400

caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 2460

agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 2520

aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 2580

gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 2640

tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 2700

gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 2760

ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 2820

ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 2880

aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 2940

aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 3000

atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 3060

tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 3120

acgccaagct cgaaattaac cctcactaaa gggaacaaaa gctggactag aggcccttaa 3180

ggccttacta gacttcaccg ccattgcaaa aattgtcaat aaatatttag agtgggtggc 3240

atcagaaaaa catctctagt ggactctctt cctatcatag ctactcgggc tgtagataga 3300

acgagggcac aagagttggg tggcgtaggt ttactcgtga cctcaactct tttggctgtg 3360

tcttacgtct aagatgggtt tggcatgtga gaaacatagg tctaagcaat tcatgttagg 3420

gctgttgcat tgttgttgca tcaaccaaat gtccagatag cagttcatgc tacatctagt 3480

tgaaaaccct catcattagg cggaacatgt gttctttttt agcatagtca aagtcagatt 3540

gcggcactcg ctcatccacg gaaagaattt tccctgtgca ggcatctcga tcaaaagacg 3600

caaattaatt tttgaatagc gatataacaa tatctaatta acgtttcttg ttttctgcga 3660

aatgtctttc atcataaaat gagtcatctc gatgagccca agtgacatag cccaacaccc 3720

caccccacca ataaaagtga agaaaacatg ttgggaaaac tataccaagt aaaatacgag 3780

ttgttctaaa gaaaaagtaa agtacgagtt agatcgcacc ctgtcctgga gtgtggcttg 3840

atgatccaac tcctagcatt gtatccctgt ttttggatga tgtaactatt atttacaatg 3900

aataaagagg tgttttacta gtaaaaaaat cttgagggga ggagaaaata atggaggtct 3960

tttttcaaac cgatggacta ttatttttag tgaaagagaa taatattatt ggaaaaatta 4020

ttctatccac ttattttata ttggcagaat acaaagaatg gtggggtcca cgcggaactt 4080

gcggcccccg aaacctatcg agggcgcggt acccaagcaa ggaacggagg aaacttgcgg 4140

ggcccgaaac ctagtgataa aaggcatatc atccacacga tgaagatctg acggaccata 4200

tctcccacca cggaaagcca tcagacgagg atcagacggc caggaaggaa ccctagcgcc 4260

cgccggtgcc aatataaagc gccactctct ctcgtcttaa gccccagcct ctccattccc 4320

ctctccctct cgccgccgcc gtctccttct cctactccct tcgaggtgtg ttgttcatcc 4380

gtcccgaatc catccatccc ctcttcagat gtgttgttca tggctctaat agctctagat 4440

ctgcttgttt gtgttgttta gctctagatc tactcgcgcg cgcttctctc tcgatctcct 4500

gtagaacaat tttggttggt tttttgtgca tatccatggt aattttgtct gcaatatgga 4560

ggaggctttc taagctccta cgtagcatcg atctttagaa ttccctcggt ttctgtttat 4620

ttcttcgcga gggctctctg ttatctgtag gagtagctgt aagcgcggtt cgttacggat 4680

taatcgtcat gcttagttga acctatcggt cgaaggattt gtgtgggttg tcgtgtagaa 4740

ttgacaccat ctacttactg tactgatatg ccgatctgta ggatactctt cattactttt 4800

gtttactgct agttgtggtg tagatttagc attctcaaac ccatgctgta gcgtttctaa 4860

tattgttaca tagatctacc ggtgcctgtt aattgtattc gatcgggcgt ttctacatct 4920

gtccgcccac ctagttttat atgtggtaat caaaattgcg ttgacttcgt gatgctgtct 4980

gtgtactgtt tttaatcgct cttacttaga tgatcaacat ggtgatggtt acgatttact 5040

gttttctaat ccctgttact tcgatgctgc agtttggatc catggagatg caacaacaat 5100

acttcggggg ggacggcgat gcggactggt tccatcaact cgcattgctt cccccacttc 5160

caatctcatc gtctctcccc ccactcccga tgtcagaggg ctcatgtctc cctatggcag 5220

cagcagctgc agctgcactc ccccttggcg attgctcgag cgccctcatg atacgccctg 5280

aggaacagat gtcttgcctt ccaatgaacc cctctccagc ggtcgtcgac gatgtctact 5340

cttcctacgc accgaacaat gtcgacgtgt tgccgccatt cccggcagga cttgacgacg 5400

ctctgttgat ggagtctttt tctgacatcg acctcgagga gtttgctgac gcatttggcc 5460

acaagatcaa gacagaaccc ctcgacgatg ccatggtccc cgcggaccac gacttcgcgg 5520

ctcaagccca acaggcctgc cctgtggtca tcatgaatca gcaacaactc aacgcaccca 5580

gagacgtgcg cctgctcatt gacccggatg atgatgacag caccgtggtg gccgggggct 5640

atgaagctgc agcggtgggg tgcgccgagc agaaacaggt caggccagca ccacgtaggg 5700

tgagaaagag ctcaggcggc gcaagaccag ccgcgggagg aaagtccctc gatcacatcg 5760

gattcgagga actcaggacc tatttctata tgccaatcac caaggcagcg agggaaatga 5820

acgtggggct gacagtcctg aagaagagat gccgggaact gggggtggcg cgctggccac 5880

acagaaagat gaagtctctg agaagcctga tcctcaacat tcaggagatg gggaagggcg 5940

caacatctcc cgcagccgtg cagggggaac ttgaagcgct tgagaggtat tgcgccatta 6000

tggaggagaa cccggctata gagctcaccg agcaaacgaa gaagctcagg caggcttgtt 6060

tcaaagagaa ttataagcgg cgtagagccg ccgcttctgt taatcttctc gatcactgct 6120

ataacgatct ggcatctcat gagcagcaaa tgcctctccc acaaatggga ttctttggat 6180

tttaga 6186

<210> 29

<211> 10427

<212> DNA

<213> 人工序列

<220>

<223> pGEP359

<400> 29

actgctgcag tgcagcgtga cccggtcgtg cccctctcta gagataatga gcattgcatg 60

tctaagttat aaaaaattac cacatatttt ttttgtcaca cttgtttgaa gtgcagttta 120

tctatcttta tacatatatt taaactttac tctacgaata atataatcta tagtactaca 180

ataatatcag tgttttagag aatcatataa atgaacagtt agacatggtc taaaggacaa 240

ttgagtattt tgacaacagg actctacagt tttatctttt tagtgtgcat gtgttctcct 300

ttttttttgc aaatagcttc acctatataa tacttcatcc attttattag tacatccatt 360

tagggtttag ggttaatggt ttttatagac taattttttt agtacatcta ttttattcta 420

ttttagcctc taaattaaga aaactaaaac tctattttag tttttttatt taataattta 480

gatataaaat agaataaaat aaagtgacta aaaattaaac aaataccctt taagaaatta 540

aaaaaactaa ggaaacattt ttcttgtttc gagtagataa tgccagcctg ttaaacgccg 600

tcgatcgacg agtctaacgg acaccaacca gcgaaccagc agcgtcgcgt cgggccaagc 660

gaagcagacg gcacggcatc tctgtcgctg cctctggacc cctctcgaga gttccgctcc 720

accgttggac ttgctccgct gtcggcatcc agaaattgcg tggcggagcg gcagacgtga 780

gccggcacgg caggcggcct cctcctcctc tcacggcacc ggcagctacg ggggattcct 840

ttcccaccgc tccttcgctt tcccttcctc gcccgccgta ataaatagac accccctcca 900

caccctcttt ccccaacctc gtgttgttcg gagcgcacac acacacaacc agatctcccc 960

caaatccacc cgtcggcacc tccgcttcaa ggtacgccgc tcgtcctccc cccccccccc 1020

tctctacctt ctctagatcg gcgttccggt ccatggttag ggcccggtag ttctacttct 1080

gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg ttcgtacacg 1140

gatgcgacct gtacgtcaga cacgttctga ttgctaactt gccagtgttt ctctttgggg 1200

aatcctggga tggctctagc cgttccgcag acgggatcga tctaggatag gtatacatgt 1260

tgatgtgggt tttactgatg catatacatg atggcatatg cagcatctat tcatatgctc 1320

taaccttgag tacctatcta ttataataaa caagtatgtt ttataattat tttgatcttg 1380

atatacttgg atgatggcat atgcagcagc tatatgtgga tttttttagc cctgccttca 1440

tacgctattt atttgcttgg tactgtttct tttgtcgatg ctcaccctgt tgtttggtgt 1500

tacttctgca ggtcgaagct tgaagcaaac atggcatcta gcatggcacc aaagaaaaaa 1560

aggaaagttt ccaaacttga aaaatttaca aactgctact ccctttccaa gacgcttagg 1620

tttaaagcga tccccgttgg caagacccaa gagaatatcg ataacaaaag acttctggtc 1680

gaagatgaaa aaagggccga agactacaag ggggtcaaga agttgctcga tcgctattat 1740

ctttccttta tcaacgatgt gcttcattca atcaaactga agaacttgaa taactacatt 1800

agccttttca gaaagaaaac gaggactgaa aaggagaaca aggaacttga gaatcttgaa 1860

ataaaccttc gcaaagaaat tgcaaaagcc ttcaagggga acgaaggata taaatctctt 1920

ttcaaaaaag acattataga aacaattttg cctgagtttc ttgacgacaa ggatgaaatt 1980

gcgctcgtca atagctttaa cggatttaca actgccttca cagggttctt cgacaatagg 2040

gagaatatgt ttagcgagga ggcaaaaagc acatccatcg cattcagatg catcaatgaa 2100

aatcttaccc ggtacatatc gaatatggac atatttgaaa aagtggatgc aatattcgat 2160

aagcacgaag tccaggagat aaaggaaaag atactgaata gcgactatga tgtcgaagat 2220

tttttcgaag gtgagttctt caactttgtc ctgactcaag aaggcattga tgtctataat 2280

gcaataattg gaggttttgt gactgagtct ggcgagaaga taaagggctt gaacgagtat 2340

atcaatctct acaaccagaa gactaagcaa aagttgccta aatttaaacc gctttacaag 2400

caagttttga gcgaccggga aagcctttcc ttttacggtg aaggatacac gagcgatgaa 2460

gaagtcctcg aagtcttccg caacacactc aacaagaact cagaaatctt ttcctcaatt 2520

aaaaaattgg agaagctttt caagaacttc gatgaatact cttcggcggg gatttttgtg 2580

aagaacggcc cggcaatttc cacaatatct aaagacattt tcggagaatg gaacgtgata 2640

agagacaagt ggaatgcgga gtatgatgac atacacctga agaagaaggc agttgtgact 2700

gaaaaatacg aagatgacag gagaaaaagc tttaaaaaga tcgggtcctt ttcactggaa 2760

cagctgcagg agtatgccga cgccgatctt tcggttgtcg aaaagctcaa agaaataatt 2820

atccagaagg tcgatgaaat ctacaaggtg tacggctcaa gcgagaagct ctttgatgct 2880

gacttcgtgt tggagaagtc tcttaaaaaa aacgacgcag tcgtcgcgat aatgaaagat 2940

ttgctggatt cagtgaaatc cttcgagaat tatatcaaag ccttcttcgg cgaggggaag 3000

gagacaaaca gggatgagtc cttctatgga gacttcgttc tggcttacga catccttctt 3060

aaggtcgacc acatctatga cgcaattcgg aactatgtga cgcagaagcc gtattcgaaa 3120

gataagttca agctctattt ccaaaaccct caatttatgg gtgggtggga taaagacaaa 3180

gagaccgatt accgggcaac aattttgcgg tacgggtcta aatattacct cgctataatg 3240

gataagaaat acgctaaatg tctccagaaa attgacaaag atgacgtcaa cggcaattat 3300

gaaaaaatca attataaact ccttcctggc ccaaataaaa tgctcccgaa ggtgtttttt 3360

tccaaaaagt ggatggccta ttataatcca tcagaggata ttcagaaaat ctataaaaat 3420

gggaccttta agaagggtga catgtttaac ctgaacgatt gccacaagct tatagatttt 3480

ttcaaagact ctattagccg ctatcccaaa tggtctaatg cttatgattt caacttctct 3540

gaaactgaaa agtacaaaga tattgcagga ttctaccgcg aagttgaaga acaaggttat 3600

aaggtttcct ttgagtctgc gtccaagaaa gaggtcgata agttggtcga agaagggaaa 3660

ttgtatatgt ttcaaattta caataaagac ttttccgaca agtcccatgg tacacctaat 3720

ctgcatacca tgtacttcaa actgctgttc gatgagaata atcacggtca gattcgcctg 3780

agcggagggg cggaactctt catgaggaga gcatcgttga aaaaagagga gctcgtcgtg 3840

catccggcta acagccccat tgctaacaag aatccggata atccaaagaa gactactacc 3900

ctctcctatg acgtctataa ggataagaga ttctctgagg accagtacga gttgcacatc 3960

cctattgcga taaataaatg ccctaagaac atctttaaaa tcaatactga ggtcagagtc 4020

ctgcttaagc acgacgacaa cccgtatgtg atcgggattg ataggggtga aaggaacttg 4080

ctttatattg tggttgtcga tggaaaaggt aatatagtgg aacaatactc tctgaatgaa 4140

attatcaaca acttcaatgg cattaggatc aagaccgact atcattctct gttggacaag 4200

aaagagaaag agcgcttcga ggcacggcaa aactggacgt ctattgagaa catcaaggag 4260

cttaaggctg gttacatttc tcaggttgtg cacaaaattt gcgaactggt cgagaaatat 4320

gatgccgtta tcgcacttga agatctcaac agcggattta agaattctcg ggtgaaagtc 4380

gaaaaacagg tgtatcaaaa attcgaaaag atgctgatcg acaagctcaa ttatatggtt 4440

gataaaaaga gcaacccatg cgccacgggg ggtgcgctta agggctatca gattacgaac 4500

aaatttgaat ccttcaagtc aatgtcgacg caaaatgggt ttatattcta tataccggcg 4560

tggcttacat ctaaaataga tcctagcact gggttcgtga acctgctgaa aaccaagtac 4620

acttcaatcg cagattctaa aaaatttata agcagcttcg acagaatcat gtatgtgccc 4680

gaggaagacc tcttcgagtt tgcccttgat tacaaaaatt tctcaagaac ggatgcagac 4740

tacataaaga agtggaagct gtactcttat gggaaccgga ttcggatatt cagaaatccg 4800

aaaaaaaaca atgtctttga ttgggaggaa gtttgtctta cctctgctta caaagagctg 4860

ttcaataaat atggcattaa ttaccagcaa ggtgatatcc gggcgctcct ttgcgaacag 4920

tctgacaaag ctttctattc ttcatttatg gcgctcatgt cattgatgct gcagatgagg 4980

aatagcatta cggggaggac tgatgttgac tttctgatct cgcccgtgaa aaattctgat 5040

ggaatcttct acgattccag gaattatgag gcccaggaaa atgctatcct tcccaagaac 5100

gcagacgcaa atggcgcgta caatatagct cgcaaggttt tgtgggctat aggccaattc 5160

aagaaagccg aagacgaaaa gctggacaaa gttaagattg ctatatctaa caaagagtgg 5220

cttgagtatg cgcaaacatc tgttaaacac aaacgccccg cggctacaaa gaaggctggc 5280

caggcaaaga agaagaagtg agtcgaccga tcgttcaaac atttggcaat aaagtttctt 5340

aagattgaat cctgttgccg gtcttgcgat gattatcata taatttctgt tgaattacgt 5400

taagcatgta ataattaaca tgtaatgcat gacgttattt atgagatggg tttttatgat 5460

tagagtcccg caattataca tttaatacgc gatagaaaac aaaatatagc gcgcaaacta 5520

ggataaatta tcgcgcgcgg tgtcatctat gttactagat cgatcccggg atatcgcggc 5580

cgcgtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc 5640

acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg 5700

aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat 5760

cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag 5820

gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga 5880

tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg 5940

tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt 6000

cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac 6060

gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc 6120

ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt 6180

ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc 6240

ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc 6300

agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg 6360

aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag 6420

atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg 6480

tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt 6540

tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca 6600

tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca 6660

gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc 6720

tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt 6780

ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg 6840

gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc 6900

aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg 6960

ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc atccgtaaga 7020

tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga 7080

ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta 7140

aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg 7200

ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact 7260

ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata 7320

agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta ttgaagcatt 7380

tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 7440

ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgcgccctg tagcggcacg 7500

tctaattcgg gggatctgga ttttagtact ggattttggt tttaggaatt agaaatttta 7560

ttgatagaag tattttacaa atacaaatac atactaaggg tttcttatat gctcaacaca 7620

tgagcgaaac cctataggaa ccctaattcc cttatctggg aactactcac acattattat 7680

ggagaaactc gagcttgtcg atcgacatga tcagggagct ctcaggtacc tctagacttg 7740

tacagctcgt ccatgccgta caggaacagg tggtggcggc cctcggagcg ctcgtactgt 7800

tccacgatgg tgtagtcctc gttgtgggag gtgatgtcca gcttggtgtc cacgtagtag 7860

tagccgggca gttgcacggg cttcttggcc atgtagatgg tcttgaactc caccaggtag 7920

tggccgccgt ccttcagctt cagggcctgg tggatctcgc ccttcagcac gccgtcgcgg 7980

gggtacaggc gctcggtgga ggcctcccag cccatggtct tcttctgcat tacggggccg 8040

tcggggggga agttggtgcc gcgcatcttc accttgtaga tcagcgtgcc gtcctgcagg 8100

gaggagtcct gggtcacggt caccagaccg ccgtcctcga agttcatcac gcgctcccac 8160

ttgaagccct cggggaagga cagcttcttg taatcgggga tgtcggcggg gtgcttcacg 8220

tacgccttgg agccgtacat gaactggggg gacaggatgt cccaggcgaa gggcaggggg 8280

ccgcccttgg tcaccttcag cttggcggtc tgggtgccct cgtaggggcg gccctcgccc 8340

tcgccctcga tctcgaactc gtggccgttc atggagccct ccatgcgcac cttgaagcgc 8400

atgaactctt tgatgacctc ctcgcccttg ctcaccatgg tggcgggatc gcgccctatc 8460

gttcgtaaat ggtgaaaatt ttcagaaaat tgcttttgct ttaaaagaaa tgatttaaat 8520

tgctgcaata gaagtagaat gcttgattgc ttgagattcg tttgttttgt atatgttgtg 8580

ttgagaggat cctctagagt cgacctgcag aagtaacacc aaacaacagg gtgagcatcg 8640

acaaaagaaa cagtaccaag caaataaata gcgtatgaag gcagggctaa aaaaatccac 8700

atatagctgc tgcatatgcc atcatccaag tatatcaaga tcaaaataat tataaaacat 8760

acttgtttat tataatagat aggtactcaa ggttagagca tatgaataga tgctgcatat 8820

gccatcatgt atatgcatca gtaaaaccca catcaacatg tatacctatc ctagatcgat 8880

atttccatcc atcttaaact cgtaactatg aagatgtatg acacacacat acagttccaa 8940

aattaataaa tacaccaggt agtttgaaac agtattctac tccgatctag aacgaatgaa 9000

cgaccgccca accacaccac atcatcacaa ccaagcgaac aaaagcatct ctgtatatgc 9060

atcagtaaaa cccgcatcaa catgtatacc tatcctagat cgatatttcc atccatcatc 9120

ttcaattcgt aactatgaat atgtatggca cacacataca gatccaaaat taataaatcc 9180

accaggtagt ttgaaacaga attctactcc gatctagaac gaccgcccaa ccagaccaca 9240

tcatcacaac caagacaaaa aaaagcatga aaagatgacc cgacaaacaa gtgcacggca 9300

tatattgaaa taaaggaaaa gggcaaacca aaccctatgc aacgaaacaa aaaaaatcat 9360

gaaatcgatc ccgtctgcgg aacggctaga gccatcccag gattccccaa agagaaacac 9420

tggcaagtta gcaatcagaa cgtgtctgac gtacaggtcg catccgtgta cgaacgctag 9480

cagcacggat ctaacacaaa cacggatcta acacaaacat gaacagaagt agaactaccg 9540

ggccctaacc atggaccgga acgccgatct agagaaggta gagagggggg gggaggacga 9600

gcggcgtacc ttgaagcgga ggtgccgacg ggtggatttg ggggagatcc actagttcta 9660

gagcggccgc caccgcggtg gaattctcga ggtcctctcc aaatgaaatg aacttcctta 9720

tatagaggaa gggtcttgcg aaggatagtg ggattgtgcg tcatccctta cgtcagtgga 9780

gatatcacat caatccactt gctttgaaga cgtggttgga acgtcttctt tttccacgat 9840

gctcctcgtg ggtgggggtc catctttggg accactgtcg gcagaggcat cttgaacgat 9900

agcctttcct ttatcgcaat gatggcattt gtaggtgcca ccttcctttt ctactgtcct 9960

tttgatcaag tgaccgatag ctgggcaatg gaatccgagg aggtttcccg atattaccct 10020

ttgttgaaaa gtctcaatag ccctttggtc ttctgagact gtatctttga tattcttgga 10080

gtagacgaga gtgtcgtgct ccaccatgtt atcacatcaa ttcacttgct ttgaagacgt 10140

ggttggaacg tcttcttttt ccacgatgct cctcgtgggt gggggtccat ctttgggacc 10200

actgtcggca gaggcatctt gaacgatagc ctttccttta tcgcaatgat ggcatttgta 10260

ggtgccacct tccttttcta ctgtcctttt gatcaagtga cagatagctg ggcaatggaa 10320

tccgaggagg tttcccgata ttaccctttg ttgaaaagtc tcaatagccc tttggtcttc 10380

tgagacttgc aggcaagcaa gcatgaatgc ctgggcgcgc cgatatc 10427

<210> 30

<211> 3841

<212> DNA

<213> 人工序列

<220>

<223> pGEP324

<400> 30

ctgacgcgcc ctgtagcggc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga 60

taatgagcat tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg 120

tttgaagtgc agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat 180

aatctatagt actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac 240

atggtctaaa ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt 300

gtgcatgtgt tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt 360

tattagtaca tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta 420

catctatttt attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt 480

tttatttaat aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat 540

accctttaag aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc 600

agcctgttaa acgccgtcga tcgacgagtc taacggacac caaccagcga accagcagcg 660

tcgcgtcggg ccaagcgaag cagacggcac ggcatctctg tcgctgcctc tggacccctc 720

tcgagagttc cgctccaccg ttggacttgc tccgctgtcg gcatccagaa attgcgtggc 780

ggagcggcag acgtgagccg gcacggcagg cggcctcctc ctcctctcac ggcaccggca 840

gctacggggg attcctttcc caccgctcct tcgctttccc ttcctcgccc gccgtaataa 900

atagacaccc cctccacacc ctctttcccc aacctcgtgt tgttcggagc gcacacacac 960

acaaccagat ctcccccaaa tccacccgtc ggcacctccg cttcaaggta cgccgctcgt 1020

cctccccccc cccccctctc taccttctct agatcggcgt tccggtccat ggttagggcc 1080

cggtagttct acttctgttc atgtttgtgt tagatccgtg tttgtgttag atccgtgctg 1140

ctagcgttcg tacacggatg cgacctgtac gtcagacacg ttctgattgc taacttgcca 1200

gtgtttctct ttggggaatc ctgggatggc tctagccgtt ccgcagacgg gatcgatcta 1260

ggataggtat acatgttgat gtgggtttta ctgatgcata tacatgatgg catatgcagc 1320

atctattcat atgctctaac cttgagtacc tatctattat aataaacaag tatgttttat 1380

aattattttg atcttgatat acttggatga tggcatatgc agcagctata tgtggatttt 1440

tttagccctg ccttcatacg ctatttattt gcttggtact gtttcttttg tcgatgctca 1500

ccctgttgtt tggtgttact tctgcaggga tccaaattac tgatgagtcc gtgaggacga 1560

aacgagtaag ctcgtctaat ttctactaag tgtagatctc gtcacgattc ccctctcctg 1620

gggccggcat ggtcccagcc tcctcgctgg cgccggctgg gcaacatgct tcggcatggc 1680

gaatgggacc gatcgttcaa acatttggca ataaagtttc ttaagattga atcctgttgc 1740

cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg taataattaa 1800

catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc cgcaattata 1860

catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat tatcgcgcgc 1920

ggtgtcatct atgttactag atcgatcgtc gttcggctgc ggcgagcggt atcagctcac 1980

tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 2040

gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 2100

aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 2160

ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 2220

gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 2280

ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 2340

ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 2400

cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 2460

attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 2520

ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 2580

aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 2640

gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 2700

tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 2760

ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 2820

taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 2880

atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 2940

actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 3000

cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 3060

agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 3120

gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg 3180

gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga 3240

gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt 3300

gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct 3360

cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca 3420

ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat 3480

accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga 3540

aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc 3600

aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg 3660

caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc 3720

ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt 3780

gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca 3840

c 3841

<210> 31

<211> 5611

<212> DNA

<213> 人工序列

<220>

<223> pAMK-ZmWUS2-tDT-nosT

<400> 31

aggccttgaa gacaaatcca ctagtcctgc aggggatccc ttcaccgcca ttgcaaaaat 60

tgtcaataaa tatttagagt gggtggcatc agaaaaacat ctctagtgga ctctcttcct 120

atcatagcta ctcgggctgt agatagaacg agggcacaag agttgggtgg cgtaggttta 180

ctcgtgacct caactctttt ggctgtgtct tacgtctaag atgggtttgg catgtgagaa 240

acataggtct aagcaattca tgttagggct gttgcattgt tgttgcatca accaaatgtc 300

cagatagcag ttcatgctac atctagttga aaaccctcat cattaggcgg aacatgtgtt 360

cttttttagc atagtcaaag tcagattgcg gcactcgctc atccacggaa agaattttcc 420

ctgtgcaggc atctcgatca aaagacgcaa attaattttt gaatagcgat ataacaatat 480

ctaattaacg tttcttgttt tctgcgaaat gtctttcatc ataaaatgag tcatctcgat 540

gagcccaagt gacatagccc aacaccccac cccaccaata aaagtgaaga aaacatgttg 600

ggaaaactat accaagtaaa atacgagttg ttctaaagaa aaagtaaagt acgagttaga 660

tcgcaccctg tcctggagtg tggcttgatg atccaactcc tagcattgta tccctgtttt 720

tggatgatgt aactattatt tacaatgaat aaagaggtgt tttactagta aaaaaatctt 780

gaggggagga gaaaataatg gaggtctttt ttcaaaccga tggactatta tttttagtga 840

aagagaataa tattattgga aaaattattc tatccactta ttttatattg gcagaataca 900

aagaatggtg gggtccacgc ggaacttgcg gcccccgaaa cctatcgagg gcgcggtacc 960

caagcaagga acggaggaaa cttgcggggc ccgaaaccta gtgataaaag gcatatcatc 1020

cacacgatga agatctgacg gaccatatct cccaccacgg aaagccatca gacgaggatc 1080

agacggccag gaaggaaccc tagcgcccgc cggtgccaat ataaagcgcc actctctctc 1140

gtcttaagcc ccagcctctc cattcccctc tccctctcgc cgccgccgtc tccttctcct 1200

actcccttcg aggtgtgttg ttcatccgtc ccgaatccat ccatcccctc ttcagatgtg 1260

ttgttcatgg ctctaatagc tctagatctg cttgtttgtg ttgtttagct ctagatctac 1320

tcgcgcgcgc ttctctctcg atctcctgta gaacaatttt ggttggtttt ttgtgcatat 1380

ccatggtaat tttgtctgca atatggagga ggctttctaa gctcctacgt agcatcgatc 1440

tttagaattc cctcggtttc tgtttatttc ttcgcgaggg ctctctgtta tctgtaggag 1500

tagctgtaag cgcggttcgt tacggattaa tcgtcatgct tagttgaacc tatcggtcga 1560

aggatttgtg tgggttgtcg tgtagaattg acaccatcta cttactgtac tgatatgccg 1620

atctgtagga tactcttcat tacttttgtt tactgctagt tgtggtgtag atttagcatt 1680

ctcaaaccca tgctgtagcg tttctaatat tgttacatag atctaccggt gcctgttaat 1740

tgtattcgat cgggcgtttc tacatctgtc cgcccaccta gttttatatg tggtaatcaa 1800

aattgcgttg acttcgtgat gctgtctgtg tactgttttt aatcgctctt acttagatga 1860

tcaacatggt gatggttacg atttactgtt ttctaatccc tgttacttcg atgctgcagt 1920

ttattaatgg cggccaatgc gggcggcggt ggagcgggag gaggcagcgg cagcggcagc 1980

gtggctgcgc cggcggtgtg ccgccccagc ggctcgcggt ggacgccgac gccggagcag 2040

atcaggatgc tgaaggagct ctactacggc tgcggcatcc ggtcgcccag ctcggagcag 2100

atccagcgca tcaccgccat gctgcggcag cacggcaaga tcgagggcaa gaacgtcttc 2160

tactggttcc agaaccacaa ggcccgcgag cgccagaagc gccgcctcac cagcctcgac 2220

gtcaacgtgc ccgccgccgg cgcggccgac gccaccacca gccaactcgg cgtcctctcg 2280

ctgtcgtcgc cgccgccttc aggcgcggcg cctccctcgc ccaccctcgg cttctacgcc 2340

gccggcaatg gcggcggatc ggctgtgctg ctggacacga gttccgactg gggcagcagc 2400

ggcgctgcca tggccaccga gacatgcttc ctccaggact acatgggcgt gacggacacg 2460

ggcagctcgt cgcagtggcc acgcttctcg tcgtcggaca cgataatggc ggcggccgcg 2520

gcgcgggcgg cgacgacgcg ggcgcccgag acgctccctc tcttcccgac ctgcggcgac 2580

gacggcggca gcggtagcag cagctacttg ccgttctggg gtgccgcgtc cacaactgcc 2640

ggcgccactt cttccgttgc gatccagcag caacaccagc tgcaggagca gtacagcttt 2700

tacagcaaca gcaacagcac ccagctggcc ggcaccggca accaagacgt atcggcaaca 2760

gcagcagcag ccgccgccct ggagctgagc ctcagctcat ggtgctcccc ttaccctgct 2820

gcagggagta tgtgaattgc aaagacaagc gaatcatcag cacaaaaggt aaacaggaac 2880

acactgcaaa gggtagtaca aaactcataa ccatgtatgc cttacattcg atgttccata 2940

aaaaaattaa gtcttaatag catcacggtt tcaacgaaag taataatact tcatgaccag 3000

gcaaacattg ccatcataga ttacttgttc acgcgacaac tgcaaggatg tcaacaagac 3060

gagatatttt aagcttccac gaggtaacca acaagcaagc acagcaccag acagatagaa 3120

gatccaatgc attggtcctg caggccccgg gctatctttg tcttccggcc gccatggcca 3180

gatcgtaccc aattcgccct atagtgagtc gtattacaat tcactggccg tcgttttaca 3240

acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc 3300

tttcgccagc tgcattaaca tggtcatagc tgtttccttg cgtattgggc gctctccgct 3360

tcctcgctca ctgactcgct gcgctcggtc gttcgggtaa agcctggggt gcctaatgag 3420

caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata 3480

ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 3540

cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg 3600

ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 3660

tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 3720

gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 3780

ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 3840

ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 3900

gctacactag aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 3960

aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg 4020

tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt 4080

ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat 4140

tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct 4200

aaagtatata tgagtaaact tggtctgaca gttattagaa aaattcatcc agcagacgat 4260

aaaacgcaat acgctggcta tccggtgccg caatgccata cagcaccaga aaacgatccg 4320

cccattcgcc gcccagttct tccgcaatat cacgggtggc cagcgcaata tcctgataac 4380

gatccgccac gcccagacgg ccgcaatcaa taaagccgct aaaacggcca ttttccacca 4440

taatgttcgg caggcacgca tcaccatggg tcaccaccag atcttcgcca tccggcatgc 4500

tcgctttcag acgcgcaaac agctctgccg gtgccaggcc ctgatgttct tcatccagat 4560

catcctgatc caccaggccc gcttccatac gggtacgcgc acgttcaata cgatgtttcg 4620

cctgatgatc aaacggacag gtcgccgggt ccagggtatg cagacgacgc atggcatccg 4680

ccataatgct cactttttct gccggcgcca gatggctaga cagcagatcc tgacccggca 4740

cttcgcccag cagcagccaa tcacggcccg cttcggtcac cacatccagc accgccgcac 4800

acggaacacc ggtggtggcc agccagctca gacgcgccgc ttcatcctgc agctcgttca 4860

gcgcaccgct cagatcggtt ttcacaaaca gcaccggacg accctgcgcg ctcagacgaa 4920

acaccgccgc atcagagcag ccaatggtct gctgcgccca atcatagcca aacagacgtt 4980

ccacccacgc tgccgggcta cccgcatgca ggccatcctg ttcaatcata ctcttccttt 5040

ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat 5100

gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccaccta 5160

aattgtaagc gttaatattt tgttaaaatt cgcgttaaat ttttgttaaa tcagctcatt 5220

ttttaaccaa taggccgaaa tcggcaaaat cccttataaa tcaaaagaat agaccgagat 5280

agggttgagt ggccgctaca gggcgctccc attcgccatt caggctgcgc aactgttggg 5340

aagggcgttt cggtgcgggc ctcttcgcta ttacgccagc tggcacgaca ggtttcccga 5400

ctggaaagcg ggcagtgagc gcaacgcaat taatgtgagt tagctcactc attaggcacc 5460

ccaggcttta cactttatgc ttccggctcg tatgttgtgt ggaattgtga gcggataaca 5520

atttcacaca ggaaacagct atgaccatga ttacgccaag ctcgaaatta accctcacta 5580

aagggaacaa aagctggact agaggccctt a 5611

<210> 32

<211> 3663

<212> DNA

<213> 人工序列

<220>

<223> BdEF1::ZmPLT5_表达盒

<400> 32

cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60

tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120

gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180

gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240

ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300

tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360

catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420

tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480

cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540

aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600

aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660

ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720

ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780

atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840

attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900

acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960

agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020

gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080

tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140

ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200

tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260

gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320

tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380

agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440

gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500

ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560

acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620

ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680

gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740

agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800

taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860

ctgttacttc gatgctgcag tttggatcca tggacacctc gcaccactat catccatggc 1920

tcaacttctc cctcgcccac cactgtgacc tcgaggagga ggagaggggc gcggccgccg 1980

agctggccgc gatagccggc gccgcgccgc cgccgaagct ggaggacttc ctcggcggag 2040

gcgtcgccac cggtggtccg gaggcggtgg cgcccgcgga gatgtacgac tcggacctca 2100

agttcatagc cgccgccggg ttccttggcg gctcggcggc ggcggcggcg acgtcgccgc 2160

tgtcctccct cgaccaggcc ggttccaagc tggccttgcc tgcggcggcg gctgctccgg 2220

cgccggagca gaggaaggcc gtcgactcct ttgggcagcg cacgtccatc taccgcggcg 2280

tcacacggca ccggtggact ggcaggtacg aggcacatct gtgggacaac agctgccgac 2340

gcgaagggca gagccgcaag ggccgccaag tatatttggg tggctatgat aaggaggaga 2400

aggctgccag ggcgtatgat cttgcagctt tgaagtactg gggttctagc accaccacca 2460

actttccggt tgctgagtat gagaaggagg tcgaggagat gaagaacatg acgcgacaag 2520

agtttgttgc ttcccttcga aggaagagca gtggattctc tcggggtgct tccatctaca 2580

gaggtgtaac cagacatcac cagcatggac ggtggcaggc gaggatcgga agggtggccg 2640

gtaacaagga cctctacctt gggacgttca gcaccgagga ggaagctgca gaggcctacg 2700

acatagcggc catcaagttc agaggcctga acgccgtcac aaacttcgag atcagccggt 2760

acaacgtgga gaccataatg agcagcaacc ttccagtcgc gagcatgtcg tcgtcgtcgg 2820

cggcggcggc gggtggccgg agcagcaagg cgctggagtc ccctccgtcc ggctcgcttg 2880

acggcggcgg cggcatgcca gtcgtcgaag gcagcacggc accgccgctg ttcattccgg 2940

tgaagtacga ccagcagcag caggagtacc tgtcgatgct cgcgttgcag caccaccacc 3000

agcagcaaca agcagggaac ctgttgcagg ggccgctagt agggttcggc ggcctctact 3060

cctccggggt gaacctggat ttcgccaact cccacggcac ggcggctccg tcgtcgatgg 3120

cccaccactg ctacgccaat ggcaccgcgt ccgcctcgca tgagcaccag caccagcacc 3180

agatgcagca gggcggcgag aacgagacgc agccgcagcc gcagcagagc tccagcagct 3240

gctcctccct gccattcgcc accccggtcg ctttcaatgg gtcctatgaa agctccatca 3300

cggcggcagg cccctttgga tactcctacc caaatgtggc agcctttcag acgccgatct 3360

atggaatgga atgaaagctt acgcgtgtcg actcgaattt ccccgatcgt tcaaacattt 3420

ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt atcatataat 3480

ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg ttatttatga 3540

gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata gaaaacaaaa 3600

tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta ctagatcgct 3660

cga 3663

<210> 33

<211> 3648

<212> DNA

<213> 人工序列

<220>

<223> BdEF1::ZmPLT7_表达盒

<400> 33

cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60

tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120

gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180

gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240

ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300

tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360

catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420

tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480

cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540

aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600

aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660

ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720

ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780

atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840

attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900

acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960

agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020

gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080

tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140

ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200

tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260

gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320

tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380

agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440

gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500

ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560

acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620

ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680

gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740

agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800

taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860

ctgttacttc gatgctgcag tttggatcca tggacatgga catgagctca gcttatcccc 1920

accattggct ctccttctcc ctctccaaca actaccacca tggcctactc gaggccttct 1980

ctaactcctc cggtactcct cttggagacg agccgggcgc agtggaggag tccccgagga 2040

cggtggagga cttcctcggc ggcgtcggtg gcgccggcgc cccgccgcag ccggcggctg 2100

ctgcagatca ggatcaccag cttgtgtgcg gcgagctggg cagcatcaca gccaggttct 2160

tgcgccacta cccggcggcg ccagctggga cgacggtgga gaaccccggc gcggtgaccg 2220

tggcggccat gtcgtcgacg gacgtggcgg gggcggagtc cgaccaggcg aggcggcccg 2280

ccgagacgtt cggccagcgc acatccatct accgtggcgt caccaggcac cggtggacag 2340

ggagatatga ggcgcacttg tgggacaaca gctgccgccg ggagggccaa agccgcaaag 2400

gacgccaagt ctacctagga ggctatgaca aggaggagaa ggcggctaga gcttacgacc 2460

tcgccgcgct caagtactgg gggcctacaa ccacgaccaa cttcccggtg tccaactacg 2520

agaaggagct ggaggagatg aagtccatga cgcggcagga gttcatcgcg tcgttgcgca 2580

ggaagagcag cggcttctca cgaggcgcct ccatctacag aggagtcaca aggcatcatc 2640

agcacggccg gtggcaggcg aggatcggca gggtggccgg aaacaaggac ctgtacttgg 2700

gcactttcag tactcaggaa gaggcggcgg aggcgtacga catcgctgcg atcaagttcc 2760

gcgggctcaa cgccgtcacc aacttcgaca tgagccgcta cgacgtggag agcatcctca 2820

gcagcgacct ccccgtcggg ggcggagcca ccgggcgcgc cgccaagttc ccgttggact 2880

cgctgcagcc ggggagcgct gctgcgatga tgctcgccgg ggctgctgcc gcttcgcagg 2940

ccaccatgcc gccgtccgag aaggactact ggtctctgct cgccctgcac taccagcagc 3000

agcaggagca ggagcggcag ttcccggctt ctgcttacga ggcttacggc tccggcggcg 3060

tgaacgtgga cttcacgatg ggcaccagta gcggcaacaa caacaacaac accggcagcg 3120

gcgtcatgtg gggcgccacc actggtgcag tagtagtggg acagcaagac agcagcggca 3180

agcagggcaa cggctatgcc agcaacattc cttatgctgc tgctgctgct atggtttctg 3240

gatctgctgg ctacgagggc tccaccggcg acaatggaac ctgggttact acgactatta 3300

ccagcagcaa caccggcacg gctccccact actacaacta tctcttcggg atggagtaga 3360

agcttacgcg tgtcgactcg aatttccccg atcgttcaaa catttggcaa taaagtttct 3420

taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 3480

ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 3540

ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 3600

aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tcgctcga 3648

<210> 34

<211> 2961

<212> DNA

<213> 人工序列

<220>

<223> BdEF1::KWS_RBP1_表达盒

<400> 34

cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60

tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120

gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180

gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240

ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300

tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360

catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420

tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480

cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540

aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600

aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660

ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720

ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780

atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840

attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900

acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960

agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020

gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080

tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140

ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200

tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260

gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320

tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380

agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440

gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500

ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560

acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620

ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680

gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740

agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800

taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860

ctgttacttc gatgctgcag tttggatcca tggagtcggg ctccgggacg gctgctggct 1920

ctggctatgt ttacagacag ccaggatcaa cgcggtggaa cccgacagct gaacaactgt 1980

ccttgcttag agaaatctac taccgcaacg gattgcggac cccgaccgcg gacgaaatca 2040

gacaaatcag ctcaaagctc tcaaggtacg gaaaaataga gggcaaaaac gtttacaact 2100

ggttccagaa tagacgcgca agagaaaagc gcaagcaacg gctctctaca atcggctgtg 2160

atccagcact gatcgagatg gggaatgtcg cttcactgga attcggtact gagagcgccc 2220

tggaatcgct gtcgtcagga ccatcctcag aactccgcga agcgccaacg agaaaatttt 2280

acgaaaaaaa gacggttgga gagaactcaa ctataataaa cccagtggaa caaaactgta 2340

ccctttcctg cggaacgtcc caagagttcc agtatgcggt cgattctcgg cgcgtcatga 2400

aagctatgga ggaaaagcag gcgacggacg atgaacccga cggaaataaa tggactgagt 2460

caaacagaca cgtcaagatt ctccagcttt tcccgctcca caataacgag gatcagacat 2520

tgataaagag cgacaaagaa atctattgtt tgggctcgtg cgagaagaaa atggatttgt 2580

caccgctggg tcattcaggc tctcagcgcg cttcggccct tgacttgtgc ctttcattgg 2640

gcaacgaatc ttgtgggctg catgataatt gaaagcttac gcgtgtcgac tcgaatttcc 2700

ccgatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg 2760

cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt aacatgtaat 2820

gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat 2880

acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat 2940

ctatgttact agatcgctcg a 2961

<210> 35

<211> 3282

<212> DNA

<213> 人工序列

<220>

<223> BdEF1::TaRKD4_表达盒

<400> 35

cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60

tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120

gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180

gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240

ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300

tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360

catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420

tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480

cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540

aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600

aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660

ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720

ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780

atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840

attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900

acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960

agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020

gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080

tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140

ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200

tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260

gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320

tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380

agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440

gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500

ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560

acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620

ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680

gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740

agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800

taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860

ctgttacttc gatgctgcag tttggatcca tggagatgca acaacaatac ttcggggggg 1920

acggcgatgc ggactggttc catcaactcg cattgcttcc cccacttcca atctcatcgt 1980

ctctcccccc actcccgatg tcagagggct catgtctccc tatggcagca gcagctgcag 2040

ctgcactccc ccttggcgat tgctcgagcg ccctcatgat acgccctgag gaacagatgt 2100

cttgccttcc aatgaacccc tctccagcgg tcgtcgacga tgtctactct tcctacgcac 2160

cgaacaatgt cgacgtgttg ccgccattcc cggcaggact tgacgacgct ctgttgatgg 2220

agtctttttc tgacatcgac ctcgaggagt ttgctgacgc atttggccac aagatcaaga 2280

cagaacccct cgacgatgcc atggtccccg cggaccacga cttcgcggct caagcccaac 2340

aggcctgccc tgtggtcatc atgaatcagc aacaactcaa cgcacccaga gacgtgcgcc 2400

tgctcattga cccggatgat gatgacagca ccgtggtggc cgggggctat gaagctgcag 2460

cggtggggtg cgccgagcag aaacaggtca ggccagcacc acgtagggtg agaaagagct 2520

caggcggcgc aagaccagcc gcgggaggaa agtccctcga tcacatcgga ttcgaggaac 2580

tcaggaccta tttctatatg ccaatcacca aggcagcgag ggaaatgaac gtggggctga 2640

cagtcctgaa gaagagatgc cgggaactgg gggtggcgcg ctggccacac agaaagatga 2700

agtctctgag aagcctgatc ctcaacattc aggagatggg gaagggcgca acatctcccg 2760

cagccgtgca gggggaactt gaagcgcttg agaggtattg cgccattatg gaggagaacc 2820

cggctataga gctcaccgag caaacgaaga agctcaggca ggcttgtttc aaagagaatt 2880

ataagcggcg tagagccgcc gcttctgtta atcttctcga tcactgctat aacgatctgg 2940

catctcatga gcagcaaatg cctctcccac aaatgggatt ctttggattt tagaagctta 3000

cgcgtgtcga ctcgaatttc cccgatcgtt caaacatttg gcaataaagt ttcttaagat 3060

tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc 3120

atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag 3180

tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata 3240

aattatcgcg cgcggtgtca tctatgttac tagatcgctc ga 3282

<210> 36

<211> 3080

<212> DNA

<213> 人工序列

<220>

<223> BdEF1::ZmWUS2_表达盒

<400> 36

cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60

tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120

gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180

gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240

ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300

tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360

catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420

tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480

cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540

aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600

aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660

ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720

ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780

atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840

attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900

acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960

agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020

gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080

tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140

ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200

tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260

gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320

tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380

agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440

gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500

ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560

acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620

ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680

gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740

agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800

taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860

ctgttacttc gatgctgcag tttattaatg gcggccaatg cgggcggcgg tggagcggga 1920

ggaggcagcg gcagcggcag cgtggctgcg ccggcggtgt gccgccccag cggctcgcgg 1980

tggacgccga cgccggagca gatcaggatg ctgaaggagc tctactacgg ctgcggcatc 2040

cggtcgccca gctcggagca gatccagcgc atcaccgcca tgctgcggca gcacggcaag 2100

atcgagggca agaacgtctt ctactggttc cagaaccaca aggcccgcga gcgccagaag 2160

cgccgcctca ccagcctcga cgtcaacgtg cccgccgccg gcgcggccga cgccaccacc 2220

agccaactcg gcgtcctctc gctgtcgtcg ccgccgcctt caggcgcggc gcctccctcg 2280

cccaccctcg gcttctacgc cgccggcaat ggcggcggat cggctgtgct gctggacacg 2340

agttccgact ggggcagcag cggcgctgcc atggccaccg agacatgctt cctccaggac 2400

tacatgggcg tgacggacac gggcagctcg tcgcagtggc cacgcttctc gtcgtcggac 2460

acgataatgg cggcggccgc ggcgcgggcg gcgacgacgc gggcgcccga gacgctccct 2520

ctcttcccga cctgcggcga cgacggcggc agcggtagca gcagctactt gccgttctgg 2580

ggtgccgcgt ccacaactgc cggcgccact tcttccgttg cgatccagca gcaacaccag 2640

ctgcaggagc agtacagctt ttacagcaac agcaacagca cccagctggc cggcaccggc 2700

aaccaagacg tatcggcaac agcagcagca gccgccgccc tggagctgag cctcagctca 2760

tggtgctccc cttaccctgc tgcagggagt atgtgaattg caaagacaag cgaatcatca 2820

gcacaaaagg taaacaggaa cacactgcaa agggtagtac aaaactcata accatgtatg 2880

ccttacattc gatgttccat aaaaaaatta agtcttaata gcatcacggt ttcaacgaaa 2940

gtaataatac ttcatgacca ggcaaacatt gccatcatag attacttgtt cacgcgacaa 3000

ctgcaaggat gtcaacaaga cgagatattt taagcttcca cgaggtaacc aacaagcaag 3060

cacagcacca gacagataga 3080

<210> 37

<211> 5561

<212> DNA

<213> 人工序列

<220>

<223> pUbi::LpCpf1_表达盒

<400> 37

ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat tgcatgtcta 60

agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc agtttatcta 120

tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt actacaataa 180

tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa ggacaattga 240

gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt tctccttttt 300

ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca tccatttagg 360

gtttagggtt aatggttttt atagactaat ttttttagta catctatttt attctatttt 420

agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat aatttagata 480

taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag aaattaaaaa 540

aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa acgccgtcga 600

tcgacgagtc taacggacac caaccagcga accagcagcg tcgcgtcggg ccaagcgaag 660

cagacggcac ggcatctctg tcgctgcctc tggacccctc tcgagagttc cgctccaccg 720

ttggacttgc tccgctgtcg gcatccagaa attgcgtggc ggagcggcag acgtgagccg 780

gcacggcagg cggcctcctc ctcctctcac ggcaccggca gctacggggg attcctttcc 840

caccgctcct tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc 900

ctctttcccc aacctcgtgt tgttcggagc gcacacacac acaaccagat ctcccccaaa 960

tccacccgtc ggcacctccg cttcaaggta cgccgctcgt cctccccccc cccccctctc 1020

taccttctct agatcggcgt tccggtccat ggttagggcc cggtagttct acttctgttc 1080

atgtttgtgt tagatccgtg tttgtgttag atccgtgctg ctagcgttcg tacacggatg 1140

cgacctgtac gtcagacacg ttctgattgc taacttgcca gtgtttctct ttggggaatc 1200

ctgggatggc tctagccgtt ccgcagacgg gatcgatcta ggataggtat acatgttgat 1260

gtgggtttta ctgatgcata tacatgatgg catatgcagc atctattcat atgctctaac 1320

cttgagtacc tatctattat aataaacaag tatgttttat aattattttg atcttgatat 1380

acttggatga tggcatatgc agcagctata tgtggatttt tttagccctg ccttcatacg 1440

ctatttattt gcttggtact gtttcttttg tcgatgctca ccctgttgtt tggtgttact 1500

tctgcaggtc gaagcttgaa gcaaacatgg catctagcat ggcaccaaag aaaaaaagga 1560

aagtttccaa acttgaaaaa tttacaaact gctactccct ttccaagacg cttaggttta 1620

aagcgatccc cgttggcaag acccaagaga atatcgataa caaaagactt ctggtcgaag 1680

atgaaaaaag ggccgaagac tacaaggggg tcaagaagtt gctcgatcgc tattatcttt 1740

cctttatcaa cgatgtgctt cattcaatca aactgaagaa cttgaataac tacattagcc 1800

ttttcagaaa gaaaacgagg actgaaaagg agaacaagga acttgagaat cttgaaataa 1860

accttcgcaa agaaattgca aaagccttca aggggaacga aggatataaa tctcttttca 1920

aaaaagacat tatagaaaca attttgcctg agtttcttga cgacaaggat gaaattgcgc 1980

tcgtcaatag ctttaacgga tttacaactg ccttcacagg gttcttcgac aatagggaga 2040

atatgtttag cgaggaggca aaaagcacat ccatcgcatt cagatgcatc aatgaaaatc 2100

ttacccggta catatcgaat atggacatat ttgaaaaagt ggatgcaata ttcgataagc 2160

acgaagtcca ggagataaag gaaaagatac tgaatagcga ctatgatgtc gaagattttt 2220

tcgaaggtga gttcttcaac tttgtcctga ctcaagaagg cattgatgtc tataatgcaa 2280

taattggagg ttttgtgact gagtctggcg agaagataaa gggcttgaac gagtatatca 2340

atctctacaa ccagaagact aagcaaaagt tgcctaaatt taaaccgctt tacaagcaag 2400

ttttgagcga ccgggaaagc ctttcctttt acggtgaagg atacacgagc gatgaagaag 2460

tcctcgaagt cttccgcaac acactcaaca agaactcaga aatcttttcc tcaattaaaa 2520

aattggagaa gcttttcaag aacttcgatg aatactcttc ggcggggatt tttgtgaaga 2580

acggcccggc aatttccaca atatctaaag acattttcgg agaatggaac gtgataagag 2640

acaagtggaa tgcggagtat gatgacatac acctgaagaa gaaggcagtt gtgactgaaa 2700

aatacgaaga tgacaggaga aaaagcttta aaaagatcgg gtccttttca ctggaacagc 2760

tgcaggagta tgccgacgcc gatctttcgg ttgtcgaaaa gctcaaagaa ataattatcc 2820

agaaggtcga tgaaatctac aaggtgtacg gctcaagcga gaagctcttt gatgctgact 2880

tcgtgttgga gaagtctctt aaaaaaaacg acgcagtcgt cgcgataatg aaagatttgc 2940

tggattcagt gaaatccttc gagaattata tcaaagcctt cttcggcgag gggaaggaga 3000

caaacaggga tgagtccttc tatggagact tcgttctggc ttacgacatc cttcttaagg 3060

tcgaccacat ctatgacgca attcggaact atgtgacgca gaagccgtat tcgaaagata 3120

agttcaagct ctatttccaa aaccctcaat ttatgggtgg gtgggataaa gacaaagaga 3180

ccgattaccg ggcaacaatt ttgcggtacg ggtctaaata ttacctcgct ataatggata 3240

agaaatacgc taaatgtctc cagaaaattg acaaagatga cgtcaacggc aattatgaaa 3300

aaatcaatta taaactcctt cctggcccaa ataaaatgct cccgaaggtg tttttttcca 3360

aaaagtggat ggcctattat aatccatcag aggatattca gaaaatctat aaaaatggga 3420

cctttaagaa gggtgacatg tttaacctga acgattgcca caagcttata gattttttca 3480

aagactctat tagccgctat cccaaatggt ctaatgctta tgatttcaac ttctctgaaa 3540

ctgaaaagta caaagatatt gcaggattct accgcgaagt tgaagaacaa ggttataagg 3600

tttcctttga gtctgcgtcc aagaaagagg tcgataagtt ggtcgaagaa gggaaattgt 3660

atatgtttca aatttacaat aaagactttt ccgacaagtc ccatggtaca cctaatctgc 3720

ataccatgta cttcaaactg ctgttcgatg agaataatca cggtcagatt cgcctgagcg 3780

gaggggcgga actcttcatg aggagagcat cgttgaaaaa agaggagctc gtcgtgcatc 3840

cggctaacag ccccattgct aacaagaatc cggataatcc aaagaagact actaccctct 3900

cctatgacgt ctataaggat aagagattct ctgaggacca gtacgagttg cacatcccta 3960

ttgcgataaa taaatgccct aagaacatct ttaaaatcaa tactgaggtc agagtcctgc 4020

ttaagcacga cgacaacccg tatgtgatcg ggattgatag gggtgaaagg aacttgcttt 4080

atattgtggt tgtcgatgga aaaggtaata tagtggaaca atactctctg aatgaaatta 4140

tcaacaactt caatggcatt aggatcaaga ccgactatca ttctctgttg gacaagaaag 4200

agaaagagcg cttcgaggca cggcaaaact ggacgtctat tgagaacatc aaggagctta 4260

aggctggtta catttctcag gttgtgcaca aaatttgcga actggtcgag aaatatgatg 4320

ccgttatcgc acttgaagat ctcaacagcg gatttaagaa ttctcgggtg aaagtcgaaa 4380

aacaggtgta tcaaaaattc gaaaagatgc tgatcgacaa gctcaattat atggttgata 4440

aaaagagcaa cccatgcgcc acggggggtg cgcttaaggg ctatcagatt acgaacaaat 4500

ttgaatcctt caagtcaatg tcgacgcaaa atgggtttat attctatata ccggcgtggc 4560

ttacatctaa aatagatcct agcactgggt tcgtgaacct gctgaaaacc aagtacactt 4620

caatcgcaga ttctaaaaaa tttataagca gcttcgacag aatcatgtat gtgcccgagg 4680

aagacctctt cgagtttgcc cttgattaca aaaatttctc aagaacggat gcagactaca 4740

taaagaagtg gaagctgtac tcttatggga accggattcg gatattcaga aatccgaaaa 4800

aaaacaatgt ctttgattgg gaggaagttt gtcttacctc tgcttacaaa gagctgttca 4860

ataaatatgg cattaattac cagcaaggtg atatccgggc gctcctttgc gaacagtctg 4920

acaaagcttt ctattcttca tttatggcgc tcatgtcatt gatgctgcag atgaggaata 4980

gcattacggg gaggactgat gttgactttc tgatctcgcc cgtgaaaaat tctgatggaa 5040

tcttctacga ttccaggaat tatgaggccc aggaaaatgc tatccttccc aagaacgcag 5100

acgcaaatgg cgcgtacaat atagctcgca aggttttgtg ggctataggc caattcaaga 5160

aagccgaaga cgaaaagctg gacaaagtta agattgctat atctaacaaa gagtggcttg 5220

agtatgcgca aacatctgtt aaacacaaac gccccgcggc tacaaagaag gctggccagg 5280

caaagaagaa gaagtgagtc gaccgatcgt tcaaacattt ggcaataaag tttcttaaga 5340

ttgaatcctg ttgccggtct tgcgatgatt atcatataat ttctgttgaa ttacgttaag 5400

catgtaataa ttaacatgta atgcatgacg ttatttatga gatgggtttt tatgattaga 5460

gtcccgcaat tatacattta atacgcgata gaaaacaaaa tatagcgcgc aaactaggat 5520

aaattatcgc gcgcggtgtc atctatgtta ctagatcgat c 5561

<210> 38

<211> 1945

<212> DNA

<213> 人工序列

<220>

<223> pUbi::crRNA5_表达盒

<400> 38

gacgcgccct gtagcggcct gcagtgcagc gtgacccggt cgtgcccctc tctagagata 60

atgagcattg catgtctaag ttataaaaaa ttaccacata ttttttttgt cacacttgtt 120

tgaagtgcag tttatctatc tttatacata tatttaaact ttactctacg aataatataa 180

tctatagtac tacaataata tcagtgtttt agagaatcat ataaatgaac agttagacat 240

ggtctaaagg acaattgagt attttgacaa caggactcta cagttttatc tttttagtgt 300

gcatgtgttc tccttttttt ttgcaaatag cttcacctat ataatacttc atccatttta 360

ttagtacatc catttagggt ttagggttaa tggtttttat agactaattt ttttagtaca 420

tctattttat tctattttag cctctaaatt aagaaaacta aaactctatt ttagtttttt 480

tatttaataa tttagatata aaatagaata aaataaagtg actaaaaatt aaacaaatac 540

cctttaagaa attaaaaaaa ctaaggaaac atttttcttg tttcgagtag ataatgccag 600

cctgttaaac gccgtcgatc gacgagtcta acggacacca accagcgaac cagcagcgtc 660

gcgtcgggcc aagcgaagca gacggcacgg catctctgtc gctgcctctg gacccctctc 720

gagagttccg ctccaccgtt ggacttgctc cgctgtcggc atccagaaat tgcgtggcgg 780

agcggcagac gtgagccggc acggcaggcg gcctcctcct cctctcacgg caccggcagc 840

tacgggggat tcctttccca ccgctccttc gctttccctt cctcgcccgc cgtaataaat 900

agacaccccc tccacaccct ctttccccaa cctcgtgttg ttcggagcgc acacacacac 960

aaccagatct cccccaaatc cacccgtcgg cacctccgct tcaaggtacg ccgctcgtcc 1020

tccccccccc cccctctcta ccttctctag atcggcgttc cggtccatgg ttagggcccg 1080

gtagttctac ttctgttcat gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct 1140

agcgttcgta cacggatgcg acctgtacgt cagacacgtt ctgattgcta acttgccagt 1200

gtttctcttt ggggaatcct gggatggctc tagccgttcc gcagacggga tcgatctagg 1260

ataggtatac atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat 1320

ctattcatat gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa 1380

ttattttgat cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt 1440

tagccctgcc ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc 1500

ctgttgtttg gtgttacttc tgcagggatc caaattactg atgagtccgt gaggacgaaa 1560

cgagtaagct cgtctaattt ctactaagtg tagatctcgt cacgattccc ctctcctggg 1620

gccggcatgg tcccagcctc ctcgctggcg ccggctgggc aacatgcttc ggcatggcga 1680

atgggaccga tcgttcaaac atttggcaat aaagtttctt aagattgaat cctgttgccg 1740

gtcttgcgat gattatcata taatttctgt tgaattacgt taagcatgta ataattaaca 1800

tgtaatgcat gacgttattt atgagatggg tttttatgat tagagtcccg caattataca 1860

tttaatacgc gatagaaaac aaaatatagc gcgcaaacta ggataaatta tcgcgcgcgg 1920

tgtcatctat gttactagat cgatc 1945

<210> 39

<211> 3771

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的 LbCpf1

<400> 39

atggcatcta gcatggcacc aaagaaaaaa aggaaagttt ccaaacttga aaaatttaca 60

aactgctact ccctttccaa gacgcttagg tttaaagcga tccccgttgg caagacccaa 120

gagaatatcg ataacaaaag acttctggtc gaagatgaaa aaagggccga agactacaag 180

ggggtcaaga agttgctcga tcgctattat ctttccttta tcaacgatgt gcttcattca 240

atcaaactga agaacttgaa taactacatt agccttttca gaaagaaaac gaggactgaa 300

aaggagaaca aggaacttga gaatcttgaa ataaaccttc gcaaagaaat tgcaaaagcc 360

ttcaagggga acgaaggata taaatctctt ttcaaaaaag acattataga aacaattttg 420

cctgagtttc ttgacgacaa ggatgaaatt gcgctcgtca atagctttaa cggatttaca 480

actgccttca cagggttctt cgacaatagg gagaatatgt ttagcgagga ggcaaaaagc 540

acatccatcg cattcagatg catcaatgaa aatcttaccc ggtacatatc gaatatggac 600

atatttgaaa aagtggatgc aatattcgat aagcacgaag tccaggagat aaaggaaaag 660

atactgaata gcgactatga tgtcgaagat tttttcgaag gtgagttctt caactttgtc 720

ctgactcaag aaggcattga tgtctataat gcaataattg gaggttttgt gactgagtct 780

ggcgagaaga taaagggctt gaacgagtat atcaatctct acaaccagaa gactaagcaa 840

aagttgccta aatttaaacc gctttacaag caagttttga gcgaccggga aagcctttcc 900

ttttacggtg aaggatacac gagcgatgaa gaagtcctcg aagtcttccg caacacactc 960

aacaagaact cagaaatctt ttcctcaatt aaaaaattgg agaagctttt caagaacttc 1020

gatgaatact cttcggcggg gatttttgtg aagaacggcc cggcaatttc cacaatatct 1080

aaagacattt tcggagaatg gaacgtgata agagacaagt ggaatgcgga gtatgatgac 1140

atacacctga agaagaaggc agttgtgact gaaaaatacg aagatgacag gagaaaaagc 1200

tttaaaaaga tcgggtcctt ttcactggaa cagctgcagg agtatgccga cgccgatctt 1260

tcggttgtcg aaaagctcaa agaaataatt atccagaagg tcgatgaaat ctacaaggtg 1320

tacggctcaa gcgagaagct ctttgatgct gacttcgtgt tggagaagtc tcttaaaaaa 1380

aacgacgcag tcgtcgcgat aatgaaagat ttgctggatt cagtgaaatc cttcgagaat 1440

tatatcaaag ccttcttcgg cgaggggaag gagacaaaca gggatgagtc cttctatgga 1500

gacttcgttc tggcttacga catccttctt aaggtcgacc acatctatga cgcaattcgg 1560

aactatgtga cgcagaagcc gtattcgaaa gataagttca agctctattt ccaaaaccct 1620

caatttatgg gtgggtggga taaagacaaa gagaccgatt accgggcaac aattttgcgg 1680

tacgggtcta aatattacct cgctataatg gataagaaat acgctaaatg tctccagaaa 1740

attgacaaag atgacgtcaa cggcaattat gaaaaaatca attataaact ccttcctggc 1800

ccaaataaaa tgctcccgaa ggtgtttttt tccaaaaagt ggatggccta ttataatcca 1860

tcagaggata ttcagaaaat ctataaaaat gggaccttta agaagggtga catgtttaac 1920

ctgaacgatt gccacaagct tatagatttt ttcaaagact ctattagccg ctatcccaaa 1980

tggtctaatg cttatgattt caacttctct gaaactgaaa agtacaaaga tattgcagga 2040

ttctaccgcg aagttgaaga acaaggttat aaggtttcct ttgagtctgc gtccaagaaa 2100

gaggtcgata agttggtcga agaagggaaa ttgtatatgt ttcaaattta caataaagac 2160

ttttccgaca agtcccatgg tacacctaat ctgcatacca tgtacttcaa actgctgttc 2220

gatgagaata atcacggtca gattcgcctg agcggagggg cggaactctt catgaggaga 2280

gcatcgttga aaaaagagga gctcgtcgtg catccggcta acagccccat tgctaacaag 2340

aatccggata atccaaagaa gactactacc ctctcctatg acgtctataa ggataagaga 2400

ttctctgagg accagtacga gttgcacatc cctattgcga taaataaatg ccctaagaac 2460

atctttaaaa tcaatactga ggtcagagtc ctgcttaagc acgacgacaa cccgtatgtg 2520

atcgggattg ataggggtga aaggaacttg ctttatattg tggttgtcga tggaaaaggt 2580

aatatagtgg aacaatactc tctgaatgaa attatcaaca acttcaatgg cattaggatc 2640

aagaccgact atcattctct gttggacaag aaagagaaag agcgcttcga ggcacggcaa 2700

aactggacgt ctattgagaa catcaaggag cttaaggctg gttacatttc tcaggttgtg 2760

cacaaaattt gcgaactggt cgagaaatat gatgccgtta tcgcacttga agatctcaac 2820

agcggattta agaattctcg ggtgaaagtc gaaaaacagg tgtatcaaaa attcgaaaag 2880

atgctgatcg acaagctcaa ttatatggtt gataaaaaga gcaacccatg cgccacgggg 2940

ggtgcgctta agggctatca gattacgaac aaatttgaat ccttcaagtc aatgtcgacg 3000

caaaatgggt ttatattcta tataccggcg tggcttacat ctaaaataga tcctagcact 3060

gggttcgtga acctgctgaa aaccaagtac acttcaatcg cagattctaa aaaatttata 3120

agcagcttcg acagaatcat gtatgtgccc gaggaagacc tcttcgagtt tgcccttgat 3180

tacaaaaatt tctcaagaac ggatgcagac tacataaaga agtggaagct gtactcttat 3240

gggaaccgga ttcggatatt cagaaatccg aaaaaaaaca atgtctttga ttgggaggaa 3300

gtttgtctta cctctgctta caaagagctg ttcaataaat atggcattaa ttaccagcaa 3360

ggtgatatcc gggcgctcct ttgcgaacag tctgacaaag ctttctattc ttcatttatg 3420

gcgctcatgt cattgatgct gcagatgagg aatagcatta cggggaggac tgatgttgac 3480

tttctgatct cgcccgtgaa aaattctgat ggaatcttct acgattccag gaattatgag 3540

gcccaggaaa atgctatcct tcccaagaac gcagacgcaa atggcgcgta caatatagct 3600

cgcaaggttt tgtgggctat aggccaattc aagaaagccg aagacgaaaa gctggacaaa 3660

gttaagattg ctatatctaa caaagagtgg cttgagtatg cgcaaacatc tgttaaacac 3720

aaacgccccg cggctacaaa gaaggctggc caggcaaaga agaagaagtg a 3771

<210> 40

<211> 1256

<212> PRT

<213> Lachnospiraceae bacterium

<400> 40

Met Ala Ser Ser Met Ala Pro Lys Lys Lys Arg Lys Val Ser Lys Leu

1 5 10 15

Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr Leu Arg Phe Lys

20 25 30

Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp Asn Lys Arg Leu

35 40 45

Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys Gly Val Lys Lys

50 55 60

Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp Val Leu His Ser

65 70 75 80

Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu Phe Arg Lys Lys

85 90 95

Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn Leu Glu Ile Asn

100 105 110

Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn Glu Gly Tyr Lys

115 120 125

Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu Pro Glu Phe Leu

130 135 140

Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe Asn Gly Phe Thr

145 150 155 160

Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn Met Phe Ser Glu

165 170 175

Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile Asn Glu Asn Leu

180 185 190

Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys Val Asp Ala Ile

195 200 205

Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys Ile Leu Asn Ser

210 215 220

Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe Phe Asn Phe Val

225 230 235 240

Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile Ile Gly Gly Phe

245 250 255

Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn Glu Tyr Ile Asn

260 265 270

Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys Phe Lys Pro Leu

275 280 285

Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser Phe Tyr Gly Glu

290 295 300

Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe Arg Asn Thr Leu

305 310 315 320

Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys Leu Glu Lys Leu

325 330 335

Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile Phe Val Lys Asn

340 345 350

Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe Gly Glu Trp Asn

355 360 365

Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp Ile His Leu Lys

370 375 380

Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp Arg Arg Lys Ser

385 390 395 400

Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu Gln Glu Tyr Ala

405 410 415

Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu Ile Ile Ile Gln

420 425 430

Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser Glu Lys Leu Phe

435 440 445

Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys Asn Asp Ala Val

450 455 460

Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys Ser Phe Glu Asn

465 470 475 480

Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr Asn Arg Asp Glu

485 490 495

Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile Leu Leu Lys Val

500 505 510

Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr Gln Lys Pro Tyr

515 520 525

Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro Gln Phe Met Gly

530 535 540

Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala Thr Ile Leu Arg

545 550 555 560

Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys Lys Tyr Ala Lys

565 570 575

Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly Asn Tyr Glu Lys

580 585 590

Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met Leu Pro Lys Val

595 600 605

Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro Ser Glu Asp Ile

610 615 620

Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly Asp Met Phe Asn

625 630 635 640

Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys Asp Ser Ile Ser

645 650 655

Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn Phe Ser Glu Thr

660 665 670

Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu Val Glu Glu Gln

675 680 685

Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys Glu Val Asp Lys

690 695 700

Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile Tyr Asn Lys Asp

705 710 715 720

Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His Thr Met Tyr Phe

725 730 735

Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile Arg Leu Ser Gly

740 745 750

Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys Lys Glu Glu Leu

755 760 765

Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys Asn Pro Asp Asn

770 775 780

Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr Lys Asp Lys Arg

785 790 795 800

Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile Ala Ile Asn Lys

805 810 815

Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val Arg Val Leu Leu

820 825 830

Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Asp Arg Gly Glu Arg

835 840 845

Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly Asn Ile Val Glu

850 855 860

Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn Gly Ile Arg Ile

865 870 875 880

Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu Lys Glu Arg Phe

885 890 895

Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile Lys Glu Leu Lys

900 905 910

Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys Glu Leu Val Glu

915 920 925

Lys Tyr Asp Ala Val Ile Ala Leu Glu Asp Leu Asn Ser Gly Phe Lys

930 935 940

Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln Lys Phe Glu Lys

945 950 955 960

Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys Lys Ser Asn Pro

965 970 975

Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile Thr Asn Lys Phe

980 985 990

Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe Ile Phe Tyr Ile

995 1000 1005

Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr Gly Phe Val

1010 1015 1020

Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp Ser Lys Lys

1025 1030 1035

Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro Glu Glu Asp

1040 1045 1050

Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser Arg Thr Asp

1055 1060 1065

Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr Gly Asn Arg

1070 1075 1080

Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val Phe Asp Trp

1085 1090 1095

Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu Phe Asn Lys

1100 1105 1110

Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala Leu Leu Cys

1115 1120 1125

Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met Ala Leu Met

1130 1135 1140

Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly Arg Thr Asp

1145 1150 1155

Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp Gly Ile Phe

1160 1165 1170

Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala Ile Leu Pro

1175 1180 1185

Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala Arg Lys Val

1190 1195 1200

Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp Glu Lys Leu

1205 1210 1215

Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp Leu Glu Tyr

1220 1225 1230

Ala Gln Thr Ser Val Lys His Lys Arg Pro Ala Ala Thr Lys Lys

1235 1240 1245

Ala Gly Gln Ala Lys Lys Lys Lys

1250 1255

<210> 41

<211> 201

<212> DNA

<213> 人工序列

<220>

<223> crRNA5_靶_HMG13_参考_A188

<400> 41

gaaccctgag agctgcttta tgaccggccc catattatta ctatctactt tgacttttcc 60

cttaatgacg acttattatt tgatttactc gtcacgattc ccctctcctg gtcgaacttt 120

tcaggtgggg aaagctgctg gcgacaggtg gaaatccctg agcgagtcgg taagctccat 180

cttctgtact aaagtagtag t 201

<210> 42

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> crRNA5_靶_序列

<400> 42

taatttctac taagtgtaga t 21

<210> 43

<211> 4610

<212> DNA

<213> 人工序列

<220>

<223> pAMK-ZmWus2-tDT-nosT构建体

<400> 43

aggccttgaa gacaaatcca ctagtggatc ccgagatttc catcgcacaa gacacgaaaa 60

aatcccgatc aatttaacga acattgtttt gcattataga ttatattgtt tacagaatga 120

agttaactaa aaccttaacc ttttgcagat aaatctctaa atagtgccgt actgtataca 180

ctcgagattt ccaccgcaca agacatgaga aaattccggt cgatttgaca aagactgggt 240

gttattaatt agaggaagca gatccagcca catgttgtct cacatctgat cccccacgta 300

tagtcgtata cgtttggccc aaacctagct cgatccatgt atgaaacacg tctcgtctcg 360

ccttctacct cctttttcta tcacaggaga ttaaagtgag agagagaggg cgctcaatga 420

actgcggcat tgaacaatgg agctgcaaga gcaatgatgc actagctagt gtaatgcagt 480

gcatgcatgg tagattggta gcttgccttt gcagtttgca ccaggcacca gcagcagcta 540

gaagacgaca gacgacaggg gtttggctgc taggttgcgg aagggcagtt accagttgcc 600

acaaggggag cctggccctc tgcatcctcc tcatgatagc tctgtctctc tctctcacag 660

acacacacac agagactctt ccaaattccg aagcggccaa tgcaatgcaa gagccagccc 720

ccggccgtgt gtcaacttca cttgtctctc tccaaaagat atcgtatcac ccatggccat 780

gacccccctc ccccagcccc aacctatatc acctagcgca gctacgctct cttctcccgc 840

tctcgctctc tgcatgctag ctaccttcta gctatctagc ctctaggtcc aatgcactcc 900

ctccttataa acaaggaacc ctccttcgcc tctcttgcca tagaccggac accggagagg 960

tcactgcaca ggagcgctca ggaaggccgc tgcgctgaga tagaggcatt atctcaacac 1020

aacatataca aaacaaacga atctcaagca atcaagcatt ctacttctat tgcagcaatt 1080

taaatcattt cttttaaagc aaaagcaatt ttctgaaaat tttcaccatt tacgaacgat 1140

agggcgcgat cccgccacca tggtgagcaa gggcgaggag gtcatcaaag agttcatgcg 1200

cttcaaggtg cgcatggagg gctccatgaa cggccacgag ttcgagatcg agggcgaggg 1260

cgagggccgc ccctacgagg gcacccagac cgccaagctg aaggtgacca agggcggccc 1320

cctgcccttc gcctgggaca tcctgtcccc ccagttcatg tacggctcca aggcgtacgt 1380

gaagcacccc gccgacatcc ccgattacaa gaagctgtcc ttccccgagg gcttcaagtg 1440

ggagcgcgtg atgaacttcg aggacggcgg tctggtgacc gtgacccagg actcctccct 1500

gcaggacggc acgctgatct acaaggtgaa gatgcgcggc accaacttcc cccccgacgg 1560

ccccgtaatg cagaagaaga ccatgggctg ggaggcctcc accgagcgcc tgtacccccg 1620

cgacggcgtg ctgaagggcg agatccacca ggccctgaag ctgaaggacg gcggccacta 1680

cctggtggag ttcaagacca tctacatggc caagaagccc gtgcaactgc ccggctacta 1740

ctacgtggac accaagctgg acatcacctc ccacaacgag gactacacca tcgtggaaca 1800

gtacgagcgc tccgagggcc gccaccacct gttcctgtac ggcatggacg agctgtacaa 1860

gtaaatgccg aatttccccg atcgttcaaa catttggcaa taaagtttct taagattgaa 1920

tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg ttaagcatgt 1980

aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga ttagagtccc 2040

gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact aggataaatt 2100

atcgcgcgcg gtgtcatcta tgttactaga tcgctcgaag atcccccggg ctatctttgt 2160

cttccggccg ccatggccag atcgtaccca attcgcccta tagtgagtcg tattacaatt 2220

cactggccgt cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc caacttaatc 2280

gccttgcagc acatccccct ttcgccagct gcattaacat ggtcatagct gtttccttgc 2340

gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg ttcgggtaaa 2400

gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 2460

ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 2520

agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 2580

tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 2640

ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 2700

gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 2760

ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 2820

gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 2880

aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 2940

aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 3000

ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 3060

gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 3120

gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 3180

tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttattagaaa 3240

aattcatcca gcagacgata aaacgcaata cgctggctat ccggtgccgc aatgccatac 3300

agcaccagaa aacgatccgc ccattcgccg cccagttctt ccgcaatatc acgggtggcc 3360

agcgcaatat cctgataacg atccgccacg cccagacggc cgcaatcaat aaagccgcta 3420

aaacggccat tttccaccat aatgttcggc aggcacgcat caccatgggt caccaccaga 3480

tcttcgccat ccggcatgct cgctttcaga cgcgcaaaca gctctgccgg tgccaggccc 3540

tgatgttctt catccagatc atcctgatcc accaggcccg cttccatacg ggtacgcgca 3600

cgttcaatac gatgtttcgc ctgatgatca aacggacagg tcgccgggtc cagggtatgc 3660

agacgacgca tggcatccgc cataatgctc actttttctg ccggcgccag atggctagac 3720

agcagatcct gacccggcac ttcgcccagc agcagccaat cacggcccgc ttcggtcacc 3780

acatccagca ccgccgcaca cggaacaccg gtggtggcca gccagctcag acgcgccgct 3840

tcatcctgca gctcgttcag cgcaccgctc agatcggttt tcacaaacag caccggacga 3900

ccctgcgcgc tcagacgaaa caccgccgca tcagagcagc caatggtctg ctgcgcccaa 3960

tcatagccaa acagacgttc cacccacgct gccgggctac ccgcatgcag gccatcctgt 4020

tcaatcatac tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg 4080

agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt 4140

ccccgaaaag tgccacctaa attgtaagcg ttaatatttt gttaaaattc gcgttaaatt 4200

tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc ccttataaat 4260

caaaagaata gaccgagata gggttgagtg gccgctacag ggcgctccca ttcgccattc 4320

aggctgcgca actgttggga agggcgtttc ggtgcgggcc tcttcgctat tacgccagct 4380

ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt aatgtgagtt 4440

agctcactca ttaggcaccc caggctttac actttatgct tccggctcgt atgttgtgtg 4500

gaattgtgag cggataacaa tttcacacag gaaacagcta tgaccatgat tacgccaagc 4560

tcgaaattaa ccctcactaa agggaacaaa agctggacta gaggccctta 4610

<210> 44

<211> 1458

<212> DNA

<213> Zea mays B73

<400> 44

atggacatgg acatgagctc agcttatccc caccattggc tctccttctc cctctccaac 60

aactaccacc atggcctact cgaagccttc tctaactcct ccggtactcc tcttggagac 120

gagcagggcg cagtggagga gtccccgagg acggtggagg acttcctcgg cggcgtcggt 180

ggcgccggcg ccccgccgca gccggcggcg gctgcagatc aggatcacca gcttgtgtgc 240

ggcgagctgg gcagcatcac agccaggttc ttgcgccact acccggcggc gccagctggg 300

acgacggtgg agaaccccgg cgcggtgacc gtggcggcca tgtcgtcgac ggacgtggcc 360

ggggcggagt ccgaccaggc gaggcggccc gccgagacgt tcggccagcg cacatccatc 420

taccgtggcg tcaccaggca ccggtggacg gggagatatg aggcgcacct gtgggacaac 480

agctgccgcc gggagggcca aagccgcaaa ggacggcaag gaggctatga caaggaggag 540

aaggcggcta gagcttacga cctcgccgcg ctcaagtact gggggcctac aaccacgacc 600

aacttcccgg tgtccaacta cgagaaggag ctggaggaga tgaagtccat gacgcggcag 660

gagttcatcg cgtcgttgcg caggaagagc agcggcttct cacgaggcgc ctccatctac 720

agaggagtca caaggcatca tcagcacggc cggtggcagg cgaggatcgg cagggtggcc 780

ggaaacaagg acctgtactt gggcactttc agtactcagg aagaggcggc ggaggcgtac 840

gacatcgctg cgatcaagtt ccgcgggctc aacgccgtca ccaactttga catgagccgc 900

tacgacgtgg agagcatcct cagcagcgac ctccccgtcg ggggcggagc tagcggtcgc 960

gcccccgcca agttcccgtt ggactcgctg cagccgggga gcgctgccgc catgatgctc 1020

gccggggctg ctgccgcttc gcaggccacc atgccgccgt ccgagaagga ctactggtct 1080

ctgctcgccc tgcactacca gcagcagcag gagcaggagc ggcagttccc ggcttctgct 1140

tacgaggctt acggctccgg cggcgtgaac gtggacttca cgatgggcac cagtagcggc 1200

aacaacaaca acaacaccgg cagcggcgtc atgtggggcg ccaccactgg tgcagtagta 1260

gtgggacagc aagacagcag cggcaagcag ggcaacggct atgccagcaa cattccttat 1320

gctgctgctg ctatggtttc tggatctgct ggctacgagg gctccaccgg cgacaatgga 1380

acctgggtta ctacgactac cagcagcaac accggcacgg ctccccacta ctacaactat 1440

ctcttcggga tggagtag 1458

<210> 45

<211> 485

<212> PRT

<213> Zea mays B73

<400> 45

Met Asp Met Asp Met Ser Ser Ala Tyr Pro His His Trp Leu Ser Phe

1 5 10 15

Ser Leu Ser Asn Asn Tyr His His Gly Leu Leu Glu Ala Phe Ser Asn

20 25 30

Ser Ser Gly Thr Pro Leu Gly Asp Glu Gln Gly Ala Val Glu Glu Ser

35 40 45

Pro Arg Thr Val Glu Asp Phe Leu Gly Gly Val Gly Gly Ala Gly Ala

50 55 60

Pro Pro Gln Pro Ala Ala Ala Ala Asp Gln Asp His Gln Leu Val Cys

65 70 75 80

Gly Glu Leu Gly Ser Ile Thr Ala Arg Phe Leu Arg His Tyr Pro Ala

85 90 95

Ala Pro Ala Gly Thr Thr Val Glu Asn Pro Gly Ala Val Thr Val Ala

100 105 110

Ala Met Ser Ser Thr Asp Val Ala Gly Ala Glu Ser Asp Gln Ala Arg

115 120 125

Arg Pro Ala Glu Thr Phe Gly Gln Arg Thr Ser Ile Tyr Arg Gly Val

130 135 140

Thr Arg His Arg Trp Thr Gly Arg Tyr Glu Ala His Leu Trp Asp Asn

145 150 155 160

Ser Cys Arg Arg Glu Gly Gln Ser Arg Lys Gly Arg Gln Gly Gly Tyr

165 170 175

Asp Lys Glu Glu Lys Ala Ala Arg Ala Tyr Asp Leu Ala Ala Leu Lys

180 185 190

Tyr Trp Gly Pro Thr Thr Thr Thr Asn Phe Pro Val Ser Asn Tyr Glu

195 200 205

Lys Glu Leu Glu Glu Met Lys Ser Met Thr Arg Gln Glu Phe Ile Ala

210 215 220

Ser Leu Arg Arg Lys Ser Ser Gly Phe Ser Arg Gly Ala Ser Ile Tyr

225 230 235 240

Arg Gly Val Thr Arg His His Gln His Gly Arg Trp Gln Ala Arg Ile

245 250 255

Gly Arg Val Ala Gly Asn Lys Asp Leu Tyr Leu Gly Thr Phe Ser Thr

260 265 270

Gln Glu Glu Ala Ala Glu Ala Tyr Asp Ile Ala Ala Ile Lys Phe Arg

275 280 285

Gly Leu Asn Ala Val Thr Asn Phe Asp Met Ser Arg Tyr Asp Val Glu

290 295 300

Ser Ile Leu Ser Ser Asp Leu Pro Val Gly Gly Gly Ala Ser Gly Arg

305 310 315 320

Ala Pro Ala Lys Phe Pro Leu Asp Ser Leu Gln Pro Gly Ser Ala Ala

325 330 335

Ala Met Met Leu Ala Gly Ala Ala Ala Ala Ser Gln Ala Thr Met Pro

340 345 350

Pro Ser Glu Lys Asp Tyr Trp Ser Leu Leu Ala Leu His Tyr Gln Gln

355 360 365

Gln Gln Glu Gln Glu Arg Gln Phe Pro Ala Ser Ala Tyr Glu Ala Tyr

370 375 380

Gly Ser Gly Gly Val Asn Val Asp Phe Thr Met Gly Thr Ser Ser Gly

385 390 395 400

Asn Asn Asn Asn Asn Thr Gly Ser Gly Val Met Trp Gly Ala Thr Thr

405 410 415

Gly Ala Val Val Val Gly Gln Gln Asp Ser Ser Gly Lys Gln Gly Asn

420 425 430

Gly Tyr Ala Ser Asn Ile Pro Tyr Ala Ala Ala Ala Met Val Ser Gly

435 440 445

Ser Ala Gly Tyr Glu Gly Ser Thr Gly Asp Asn Gly Thr Trp Val Thr

450 455 460

Thr Thr Thr Ser Ser Asn Thr Gly Thr Ala Pro His Tyr Tyr Asn Tyr

465 470 475 480

Leu Phe Gly Met Glu

485

<210> 46

<211> 2107

<212> DNA

<213> 人工序列

<220>

<223> pZmWUS2::tDT-nosT_表达盒

<400> 46

cgagatttcc atcgcacaag acacgaaaaa atcccgatca atttaacgaa cattgttttg 60

cattatagat tatattgttt acagaatgaa gttaactaaa accttaacct tttgcagata 120

aatctctaaa tagtgccgta ctgtatacac tcgagatttc caccgcacaa gacatgagaa 180

aattccggtc gatttgacaa agactgggtg ttattaatta gaggaagcag atccagccac 240

atgttgtctc acatctgatc ccccacgtat agtcgtatac gtttggccca aacctagctc 300

gatccatgta tgaaacacgt ctcgtctcgc cttctacctc ctttttctat cacaggagat 360

taaagtgaga gagagagggc gctcaatgaa ctgcggcatt gaacaatgga gctgcaagag 420

caatgatgca ctagctagtg taatgcagtg catgcatggt agattggtag cttgcctttg 480

cagtttgcac caggcaccag cagcagctag aagacgacag acgacagggg tttggctgct 540

aggttgcgga agggcagtta ccagttgcca caaggggagc ctggccctct gcatcctcct 600

catgatagct ctgtctctct ctctcacaga cacacacaca gagactcttc caaattccga 660

agcggccaat gcaatgcaag agccagcccc cggccgtgtg tcaacttcac ttgtctctct 720

ccaaaagata tcgtatcacc catggccatg acccccctcc cccagcccca acctatatca 780

cctagcgcag ctacgctctc ttctcccgct ctcgctctct gcatgctagc taccttctag 840

ctatctagcc tctaggtcca atgcactccc tccttataaa caaggaaccc tccttcgcct 900

ctcttgccat agaccggaca ccggagaggt cactgcacag gagcgctcag gaaggccgct 960

gcgctgagat agaggcatta tctcaacaca acatatacaa aacaaacgaa tctcaagcaa 1020

tcaagcattc tacttctatt gcagcaattt aaatcatttc ttttaaagca aaagcaattt 1080

tctgaaaatt ttcaccattt acgaacgata gggcgcgatc ccgccaccat ggtgagcaag 1140

ggcgaggagg tcatcaaaga gttcatgcgc ttcaaggtgc gcatggaggg ctccatgaac 1200

ggccacgagt tcgagatcga gggcgagggc gagggccgcc cctacgaggg cacccagacc 1260

gccaagctga aggtgaccaa gggcggcccc ctgcccttcg cctgggacat cctgtccccc 1320

cagttcatgt acggctccaa ggcgtacgtg aagcaccccg ccgacatccc cgattacaag 1380

aagctgtcct tccccgaggg cttcaagtgg gagcgcgtga tgaacttcga ggacggcggt 1440

ctggtgaccg tgacccagga ctcctccctg caggacggca cgctgatcta caaggtgaag 1500

atgcgcggca ccaacttccc ccccgacggc cccgtaatgc agaagaagac catgggctgg 1560

gaggcctcca ccgagcgcct gtacccccgc gacggcgtgc tgaagggcga gatccaccag 1620

gccctgaagc tgaaggacgg cggccactac ctggtggagt tcaagaccat ctacatggcc 1680

aagaagcccg tgcaactgcc cggctactac tacgtggaca ccaagctgga catcacctcc 1740

cacaacgagg actacaccat cgtggaacag tacgagcgct ccgagggccg ccaccacctg 1800

ttcctgtacg gcatggacga gctgtacaag taaatgccga atttccccga tcgttcaaac 1860

atttggcaat aaagtttctt aagattgaat cctgttgccg gtcttgcgat gattatcata 1920

taatttctgt tgaattacgt taagcatgta ataattaaca tgtaatgcat gacgttattt 1980

atgagatggg tttttatgat tagagtcccg caattataca tttaatacgc gatagaaaac 2040

aaaatatagc gcgcaaacta ggataaatta tcgcgcgcgg tgtcatctat gttactagat 2100

cgctcga 2107

<210> 47

<211> 783

<212> DNA

<213> 人工序列

<220>

<223> KWS-RBP2的cDNA

<400> 47

atggaatcgg gctccggcac ggcggcaggg tctggttatg tctatcggca gagcggaagc 60

acccggtgga atccaacagc agaacagttg tcgctgctca aggaacttta ttaccggaat 120

ggaattcgga caccgtcggc agatcaaatt aggcaaattt cggcccggct gtccagatac 180

ggcaaaatag aagggaaaaa cgtcttttac tggtttcaaa atcataaagc acgggaacgg 240

cagaagaaaa gactttccac ggtcggctgc gaccctgctc tcatagaaat gggtaacgtc 300

gcgagcttgg aatttgggac cgaaagcgct cttgaatctc tcagctcagg cccgtccagc 360

gagttgcgcg aggctcctac ccgcaagttt tatgagaaga aaaccgttgg tgagaacagc 420

accataatca atcctgttga gcagaactgc acactttctt gcggtacttc gcaggaattt 480

cagtatgctg ttgatagccg ccgggtgatg aaggcaatgg aagagaagca agcaacggat 540

gatgaaccgg acggaaacaa atggacggag tcgaacaggc atgtgaagac cctccctctt 600

ttccccttgc ataataatga agatcagacc ttgatcaagt cggacaagga aatttattgc 660

cttgggagct gtgaaaaaaa aatggatctg tccccattgg gacactcggg ctctcagagg 720

gcgtcggcac tggatttgtg cctgtctttg ggtaatgaat cttgtggcct ccacgacaat 780

tga 783

<210> 48

<211> 260

<212> PRT

<213> 人工序列

<220>

<223> KWS-RBP2的蛋白

<400> 48

Met Glu Ser Gly Ser Gly Thr Ala Ala Gly Ser Gly Tyr Val Tyr Arg

1 5 10 15

Gln Ser Gly Ser Thr Arg Trp Asn Pro Thr Ala Glu Gln Leu Ser Leu

20 25 30

Leu Lys Glu Leu Tyr Tyr Arg Asn Gly Ile Arg Thr Pro Ser Ala Asp

35 40 45

Gln Ile Arg Gln Ile Ser Ala Arg Leu Ser Arg Tyr Gly Lys Ile Glu

50 55 60

Gly Lys Asn Val Phe Tyr Trp Phe Gln Asn His Lys Ala Arg Glu Arg

65 70 75 80

Gln Lys Lys Arg Leu Ser Thr Val Gly Cys Asp Pro Ala Leu Ile Glu

85 90 95

Met Gly Asn Val Ala Ser Leu Glu Phe Gly Thr Glu Ser Ala Leu Glu

100 105 110

Ser Leu Ser Ser Gly Pro Ser Ser Glu Leu Arg Glu Ala Pro Thr Arg

115 120 125

Lys Phe Tyr Glu Lys Lys Thr Val Gly Glu Asn Ser Thr Ile Ile Asn

130 135 140

Pro Val Glu Gln Asn Cys Thr Leu Ser Cys Gly Thr Ser Gln Glu Phe

145 150 155 160

Gln Tyr Ala Val Asp Ser Arg Arg Val Met Lys Ala Met Glu Glu Lys

165 170 175

Gln Ala Thr Asp Asp Glu Pro Asp Gly Asn Lys Trp Thr Glu Ser Asn

180 185 190

Arg His Val Lys Thr Leu Pro Leu Phe Pro Leu His Asn Asn Glu Asp

195 200 205

Gln Thr Leu Ile Lys Ser Asp Lys Glu Ile Tyr Cys Leu Gly Ser Cys

210 215 220

Glu Lys Lys Met Asp Leu Ser Pro Leu Gly His Ser Gly Ser Gln Arg

225 230 235 240

Ala Ser Ala Leu Asp Leu Cys Leu Ser Leu Gly Asn Glu Ser Cys Gly

245 250 255

Leu His Asp Asn

260

<210> 49

<211> 5865

<212> DNA

<213> 人工序列

<220>

<223> pABM-BdEF1_KWS-RBP2

<400> 49

agcttacgcg tgtcgactcg aatttccccg atcgttcaaa catttggcaa taaagtttct 60

taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 120

ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 180

ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 240

aggataaatt atcgcgcgcg gtgtcatcta tgttactaga tcgctcgacg cggccgccat 300

ggccagatcg tacccaattc gccctatagt gagtcgtatt acaattcact ggccgtcgtt 360

ttacaacgtc gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat 420

ccccctttcg ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag 480

ttgcgcagcc tgaatggcga atggaaattg taagcgttaa tattttgtta aaattcgcgt 540

taaatttttg ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt 600

ataaatcaaa agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc 660

cactattaaa gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg 720

gcccactacg tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac 780

taaatcggaa ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg 840

tggcgagaaa ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag 900

cggtcacgct gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt 960

caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 1020

attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 1080

aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 1140

tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 1200

agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 1260

gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 1320

cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 1380

agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 1440

taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 1500

tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 1560

taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 1620

acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 1680

ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 1740

cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 1800

agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 1860

tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 1920

agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 1980

tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 2040

ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 2100

tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 2160

aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 2220

tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt 2280

agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 2340

taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 2400

caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 2460

agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 2520

aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 2580

gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 2640

tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 2700

gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 2760

ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 2820

ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 2880

aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 2940

aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 3000

atgtgagtta gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta 3060

tgttgtgtgg aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt 3120

acgccaagct cgaaattaac cctcactaaa gggaacaaaa gctggactag aggcccttaa 3180

ggccttacta gacttcaccg ccattgcaaa aattgtcaat aaatatttag agtgggtggc 3240

atcagaaaaa catctctagt ggactctctt cctatcatag ctactcgggc tgtagataga 3300

acgagggcac aagagttggg tggcgtaggt ttactcgtga cctcaactct tttggctgtg 3360

tcttacgtct aagatgggtt tggcatgtga gaaacatagg tctaagcaat tcatgttagg 3420

gctgttgcat tgttgttgca tcaaccaaat gtccagatag cagttcatgc tacatctagt 3480

tgaaaaccct catcattagg cggaacatgt gttctttttt agcatagtca aagtcagatt 3540

gcggcactcg ctcatccacg gaaagaattt tccctgtgca ggcatctcga tcaaaagacg 3600

caaattaatt tttgaatagc gatataacaa tatctaatta acgtttcttg ttttctgcga 3660

aatgtctttc atcataaaat gagtcatctc gatgagccca agtgacatag cccaacaccc 3720

caccccacca ataaaagtga agaaaacatg ttgggaaaac tataccaagt aaaatacgag 3780

ttgttctaaa gaaaaagtaa agtacgagtt agatcgcacc ctgtcctgga gtgtggcttg 3840

atgatccaac tcctagcatt gtatccctgt ttttggatga tgtaactatt atttacaatg 3900

aataaagagg tgttttacta gtaaaaaaat cttgagggga ggagaaaata atggaggtct 3960

tttttcaaac cgatggacta ttatttttag tgaaagagaa taatattatt ggaaaaatta 4020

ttctatccac ttattttata ttggcagaat acaaagaatg gtggggtcca cgcggaactt 4080

gcggcccccg aaacctatcg agggcgcggt acccaagcaa ggaacggagg aaacttgcgg 4140

ggcccgaaac ctagtgataa aaggcatatc atccacacga tgaagatctg acggaccata 4200

tctcccacca cggaaagcca tcagacgagg atcagacggc caggaaggaa ccctagcgcc 4260

cgccggtgcc aatataaagc gccactctct ctcgtcttaa gccccagcct ctccattccc 4320

ctctccctct cgccgccgcc gtctccttct cctactccct tcgaggtgtg ttgttcatcc 4380

gtcccgaatc catccatccc ctcttcagat gtgttgttca tggctctaat agctctagat 4440

ctgcttgttt gtgttgttta gctctagatc tactcgcgcg cgcttctctc tcgatctcct 4500

gtagaacaat tttggttggt tttttgtgca tatccatggt aattttgtct gcaatatgga 4560

ggaggctttc taagctccta cgtagcatcg atctttagaa ttccctcggt ttctgtttat 4620

ttcttcgcga gggctctctg ttatctgtag gagtagctgt aagcgcggtt cgttacggat 4680

taatcgtcat gcttagttga acctatcggt cgaaggattt gtgtgggttg tcgtgtagaa 4740

ttgacaccat ctacttactg tactgatatg ccgatctgta ggatactctt cattactttt 4800

gtttactgct agttgtggtg tagatttagc attctcaaac ccatgctgta gcgtttctaa 4860

tattgttaca tagatctacc ggtgcctgtt aattgtattc gatcgggcgt ttctacatct 4920

gtccgcccac ctagttttat atgtggtaat caaaattgcg ttgacttcgt gatgctgtct 4980

gtgtactgtt tttaatcgct cttacttaga tgatcaacat ggtgatggtt acgatttact 5040

gttttctaat ccctgttact tcgatgctgc agtttggatc catggaatcg ggctccggca 5100

cggcggcagg gtctggttat gtctatcggc agagcggaag cacccggtgg aatccaacag 5160

cagaacagtt gtcgctgctc aaggaacttt attaccggaa tggaattcgg acaccgtcgg 5220

cagatcaaat taggcaaatt tcggcccggc tgtccagata cggcaaaata gaagggaaaa 5280

acgtctttta ctggtttcaa aatcataaag cacgggaacg gcagaagaaa agactttcca 5340

cggtcggctg cgaccctgct ctcatagaaa tgggtaacgt cgcgagcttg gaatttggga 5400

ccgaaagcgc tcttgaatct ctcagctcag gcccgtccag cgagttgcgc gaggctccta 5460

cccgcaagtt ttatgagaag aaaaccgttg gtgagaacag caccataatc aatcctgttg 5520

agcagaactg cacactttct tgcggtactt cgcaggaatt tcagtatgct gttgatagcc 5580

gccgggtgat gaaggcaatg gaagagaagc aagcaacgga tgatgaaccg gacggaaaca 5640

aatggacgga gtcgaacagg catgtgaaga ccctccctct tttccccttg cataataatg 5700

aagatcagac cttgatcaag tcggacaagg aaatttattg ccttgggagc tgtgaaaaaa 5760

aaatggatct gtccccattg ggacactcgg gctctcagag ggcgtcggca ctggatttgt 5820

gcctgtcttt gggtaatgaa tcttgtggcc tccacgacaa ttgaa 5865

<210> 50

<211> 2961

<212> DNA

<213> 人工序列

<220>

<223> BdEF1::KWS-RBP2_表达盒

<400> 50

cttcaccgcc attgcaaaaa ttgtcaataa atatttagag tgggtggcat cagaaaaaca 60

tctctagtgg actctcttcc tatcatagct actcgggctg tagatagaac gagggcacaa 120

gagttgggtg gcgtaggttt actcgtgacc tcaactcttt tggctgtgtc ttacgtctaa 180

gatgggtttg gcatgtgaga aacataggtc taagcaattc atgttagggc tgttgcattg 240

ttgttgcatc aaccaaatgt ccagatagca gttcatgcta catctagttg aaaaccctca 300

tcattaggcg gaacatgtgt tcttttttag catagtcaaa gtcagattgc ggcactcgct 360

catccacgga aagaattttc cctgtgcagg catctcgatc aaaagacgca aattaatttt 420

tgaatagcga tataacaata tctaattaac gtttcttgtt ttctgcgaaa tgtctttcat 480

cataaaatga gtcatctcga tgagcccaag tgacatagcc caacacccca ccccaccaat 540

aaaagtgaag aaaacatgtt gggaaaacta taccaagtaa aatacgagtt gttctaaaga 600

aaaagtaaag tacgagttag atcgcaccct gtcctggagt gtggcttgat gatccaactc 660

ctagcattgt atccctgttt ttggatgatg taactattat ttacaatgaa taaagaggtg 720

ttttactagt aaaaaaatct tgaggggagg agaaaataat ggaggtcttt tttcaaaccg 780

atggactatt atttttagtg aaagagaata atattattgg aaaaattatt ctatccactt 840

attttatatt ggcagaatac aaagaatggt ggggtccacg cggaacttgc ggcccccgaa 900

acctatcgag ggcgcggtac ccaagcaagg aacggaggaa acttgcgggg cccgaaacct 960

agtgataaaa ggcatatcat ccacacgatg aagatctgac ggaccatatc tcccaccacg 1020

gaaagccatc agacgaggat cagacggcca ggaaggaacc ctagcgcccg ccggtgccaa 1080

tataaagcgc cactctctct cgtcttaagc cccagcctct ccattcccct ctccctctcg 1140

ccgccgccgt ctccttctcc tactcccttc gaggtgtgtt gttcatccgt cccgaatcca 1200

tccatcccct cttcagatgt gttgttcatg gctctaatag ctctagatct gcttgtttgt 1260

gttgtttagc tctagatcta ctcgcgcgcg cttctctctc gatctcctgt agaacaattt 1320

tggttggttt tttgtgcata tccatggtaa ttttgtctgc aatatggagg aggctttcta 1380

agctcctacg tagcatcgat ctttagaatt ccctcggttt ctgtttattt cttcgcgagg 1440

gctctctgtt atctgtagga gtagctgtaa gcgcggttcg ttacggatta atcgtcatgc 1500

ttagttgaac ctatcggtcg aaggatttgt gtgggttgtc gtgtagaatt gacaccatct 1560

acttactgta ctgatatgcc gatctgtagg atactcttca ttacttttgt ttactgctag 1620

ttgtggtgta gatttagcat tctcaaaccc atgctgtagc gtttctaata ttgttacata 1680

gatctaccgg tgcctgttaa ttgtattcga tcgggcgttt ctacatctgt ccgcccacct 1740

agttttatat gtggtaatca aaattgcgtt gacttcgtga tgctgtctgt gtactgtttt 1800

taatcgctct tacttagatg atcaacatgg tgatggttac gatttactgt tttctaatcc 1860

ctgttacttc gatgctgcag tttggatcca tggaatcggg ctccggcacg gcggcagggt 1920

ctggttatgt ctatcggcag agcggaagca cccggtggaa tccaacagca gaacagttgt 1980

cgctgctcaa ggaactttat taccggaatg gaattcggac accgtcggca gatcaaatta 2040

ggcaaatttc ggcccggctg tccagatacg gcaaaataga agggaaaaac gtcttttact 2100

ggtttcaaaa tcataaagca cgggaacggc agaagaaaag actttccacg gtcggctgcg 2160

accctgctct catagaaatg ggtaacgtcg cgagcttgga atttgggacc gaaagcgctc 2220

ttgaatctct cagctcaggc ccgtccagcg agttgcgcga ggctcctacc cgcaagtttt 2280

atgagaagaa aaccgttggt gagaacagca ccataatcaa tcctgttgag cagaactgca 2340

cactttcttg cggtacttcg caggaatttc agtatgctgt tgatagccgc cgggtgatga 2400

aggcaatgga agagaagcaa gcaacggatg atgaaccgga cggaaacaaa tggacggagt 2460

cgaacaggca tgtgaagacc ctccctcttt tccccttgca taataatgaa gatcagacct 2520

tgatcaagtc ggacaaggaa atttattgcc ttgggagctg tgaaaaaaaa atggatctgt 2580

ccccattggg acactcgggc tctcagaggg cgtcggcact ggatttgtgc ctgtctttgg 2640

gtaatgaatc ttgtggcctc cacgacaatt gaaagcttac gcgtgtcgac tcgaatttcc 2700

ccgatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg 2760

cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt aacatgtaat 2820

gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat 2880

acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat 2940

ctatgttact agatcgctcg a 2961

<210> 51

<211> 70

<212> DNA

<213> Zea mays

<400> 51

acgacttatt atttgattta ctcgtcacga ttcccctctc ctggtcgaac ttttcaggtg 60

gggaaagctg 70

<210> 52

<211> 65

<212> DNA

<213> 人工序列

<220>

<223> 如图21A所示与SEQ ID NO: 51的参考序列比对的来自经编辑的T0 植物(基因型A188) 具有5 bp 缺失的靶区域

<400> 52

acgacttatt atttgattta ctcgtcacga ttctcctggt cgaacttttc aggtggggaa 60

agctg 65

<210> 53

<211> 68

<212> DNA

<213> 人工序列

<220>

<223> 如图21A所示与SEQ ID NO: 51的参考序列比对的来自经编辑的T0 植物(基因型B73) 具有2bp 缺失的靶区域

<400> 53

acgacttatt atttaattta ctcgtcacga ttcccctcct ggtcgaactt ttcaggtggg 60

gaaagctg 68

<210> 54

<211> 70

<212> DNA

<213> Zea mays

<400> 54

cttattattt gatttactcg tcacgattcc cctctcctgg tcgaactttt caggtgggga 60

aagctgctgg 70

<210> 55

<211> 64

<212> DNA

<213> 人工序列

<220>

<223> 如图21B所示与SEQ ID NO: 54的参考序列比对的来自经编辑的T0 植物(基因型A188) 具有6 bp 缺失的靶区域

<400> 55

cttattattt gatttactcg tcacgattcc ctggtcgaac ttttcaggtg gggaaagctg 60

ctgg 64

<210> 56

<211> 65

<212> DNA

<213> 人工序列

<220>

<223> 如图21B所示与SEQ ID NO: 54的参考序列比对的来自经编辑的T0 植物(基因型B73) 具有5 bp 缺失的靶区域

<400> 56

cttattattt aatttactcg tcacgattcc cctggtcgaa cttttcaggt ggggaaagct 60

gctgg 65

<210> 57

<211> 70

<212> DNA

<213> Zea mays

<400> 57

cgacttatta tttgatttac tcgtcacgat tcccctctcc tggtcgaact tttcaggtgg 60

ggaaagctgc 70

<210> 58

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 如图21C所示与SEQ ID NO: 57的参考序列比对的来自经编辑的T0 植物(基因型A188) 具有8 bp 缺失的靶区域

<400> 58

cgacttatta tttgatttac tcgtcacgat tcccctcgaa cttttcaggt ggggaaagct 60

gc 62

<210> 59

<211> 70

<212> DNA

<213> Zea mays

<400> 59

cgacttatta tttaatttac tcgtcacgat tcccctctcc tggtcgaact tttcaggtgg 60

ggaaagctgc 70

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号