首页> 中国专利> 用于真核宿主中真核mRNA生产、输出和翻译的工程细菌系统和方法

用于真核宿主中真核mRNA生产、输出和翻译的工程细菌系统和方法

摘要

本发明技术包括用于生成基因工程化的原核生物体的新系统、方法和组合物,所述基因工程化的原核生物体被配置为生产可引入到真核宿主并在真核宿主中翻译的真核样mRNA。其他方面可包括新型真核样核苷酸构建体和mRNA分子,以及从原核细胞有效递送至靶真核宿主细胞的方法和系统。本发明进一步的方面包括用于真核细胞非整合性转化的系统、方法和组合物。

著录项

  • 公开/公告号CN113166768A

    专利类型发明专利

  • 公开/公告日2021-07-23

    原文格式PDF

  • 申请/专利权人 美国卵石实验室公司;

    申请/专利号CN201980056937.1

  • 申请日2019-07-05

  • 分类号C12N15/64(20060101);C12N15/74(20060101);C12N15/84(20060101);C12N15/55(20060101);C12N15/00(20060101);C12N1/21(20060101);C12R1/01(20060101);

  • 代理机构33239 余姚德盛专利代理事务所(普通合伙);

  • 代理人周积德

  • 地址 美国新墨西哥州

  • 入库时间 2023-06-19 11:55:48

说明书

相关申请的交叉引用

本国际PCT申请要求于2018年7月4日提交的美国临时申请第62/693,963号的利益和优先权。将上述申请的全部说明书和附图通过引用全部并入于此。

序列表

本申请含有以ASCII格式以电子方式提交的序列表,该序列表通过引用全部并入于此。

技术领域

本发明技术包括生成基因工程化的原核生物体的新系统、方法和组合物,所述基因工程化的原核生物体被配置为生产可引入真核宿主并在真核宿主中翻译的真核样mRNA。另外的实施方案可包括新型真核样核苷酸构建体和mRNA分子、促进mRNA转运和翻译的辅助蛋白、以及用于真核细胞高效运输和非整合转化的方法和系统。

背景技术

经基因修饰的真核生物体发展的一个主要限制因素是制造安全、有效、重要的稳定转基因表达系统是一个困难而漫长的过程。为了开发哪怕是一个转基因真核生物体也可能需要长达十年的时间,并且需要大量的资金投入。为了克服这个问题,有人提出使用原核系统来生产和转移真核样mRNA来改造真核宿主,这使需要的时间大大减少。然而,如下文所讨论,原核和真核转录和翻译系统之间的功能、遗传和调控差异代表了在结合这两个系统以生成新的转基因生物时的重大障碍。

细胞的遗传信息以脱氧核糖核酸(DNA)的核苷酸序列储存和递送。这些信息的表达需要将DNA转录成信使核糖核酸(mRNA)分子,所述分子将特定的、精确的信息递送到蛋白合成的细胞质部位。在所有物种中,转录始于在基因中称为启动子的开始处的RNA聚合酶复合物(或全酶)与特殊DNA序列的结合。RNA聚合酶复合物的激活使转录启动,随后是转录物的伸长。反过来,转录物的伸长又导致启动子的清除,转录过程又可以开始。因此,转录可以在两个水平上进行调节:启动子水平(顺式调节)和聚合酶水平(反式调节)。这些因素在细菌和真核生物之间是不同的。

在真核细胞中,mRNA是在细胞核中合成的,通常为称为异质核RNA(hnRNA)的较大的前体分子。在原核生物体中,mRNA一经转录就被翻译成蛋白。与真核细胞不同的是,原核生物诸如细菌没有一个将DNA和核糖体分开的独特的细胞核,所以没有立即翻译的障碍。事实上,在电子显微镜术生成的细菌高倍率图像中,可以看到核糖体正在翻译仍在从DNA转录的信使RNA。这个过程在真核细胞中根本行不通,部分原因是真核RNA含有内含子和外显子,必须在翻译开始前进行编辑。因此,真核细胞核在细胞内提供了一个独特的隔间,允许在翻译开始之前进行转录和拼接。因此,在真核生物中,虽然转录发生在细胞核中,但翻译发生在细胞质中。换句话说,真核转录和翻译在空间和时间上是隔离的。

细胞质中的mRNA有一些其他的识别结构特征。在真核细胞中,mRNA通常是一种单顺反子消息(monocistronic message),该单顺反子消息只编码一种多肽。5’端用一种特殊的结构盖住,该结构涉及7-甲基鸟苷,通过5’-三磷酸桥与信使序列的5’端相连。一个长度可能很短或数百个核苷酸5’-非翻译区将帽和翻译起始位点分开,其中含有一个AUG密码子。大多数脊椎动物mRNA的前导序列长度为20~100个核苷酸。通常翻译起始位点是第一个AUG序列,因为消息是从5’端到3’端读取的。然后,编码多肽的信息序列与启动信号相邻。多肽编码序列一直持续到达到特定的翻译终止位点,在mRNA终止于腺苷酸尾部之前,该位点后是一个长度约为100个核苷酸的3’非翻译序列。在真核生物中,起始氨基酸是蛋氨酸而不是N-甲酰基蛋氨酸。然而,与原核生物一样,一种特殊的tRNA参与启动。这个氨基乙酰-tRNA被称为Met-tRNA

原核mRNA与真核mRNA在其他一些重要方面有所不同。5’末端不封端,但保留了一个由RNA聚合酶启动合成的末端三磷酸。大多数原核mRNA是多顺反子性的,编码几个多肽,并且可以包括多于一个的起始AUG序列。在每种情况下,核糖体定位序列位于AUG起始信号上游约10个核苷酸。一个未翻译的序列跟随最后一个编码序列,但没有聚腺苷酸化的3’尾巴。

真核mRNA的翻译起始位点也称为Kozak序列。示例性Kozak序列的形式可以是:((gcc)gccRccAUGG。这个基序中最高度保守的位置是ATG密码子上游三个核苷酸的嘌呤(最常见的是A),它表示翻译的开始。

如上所提到,在大多数原核生物中,被称为SD(Shine-Dalgarno)序列的富含嘌呤的核糖体结合位点通过与16S核糖体RNA的富含嘧啶的区域相互作用来协助30S核糖体组分相对于mRNA上的起始密码子的结合和定位。SD序列位于mRNA的从转录开始的下游和翻译开始的上游,通常从起始密码子上游的4-14个核苷酸开始,更典型的是从起始密码子上游的8-10个核苷酸开始。SD序列一般可具有5’-AGGAGG-3’的六碱基共有序列。

真核生物中的起始密码子总是AUG,而原核生物并不使用5’侧富含嘌呤的特异性序列来区分起始密码子AUG和内部密码子。相反,通常选择最接近mRNA 5’端的AUG作为起始位点。40S核糖体附着在真核mRNA的5’端的帽上,并沿着3’的方向一步一步地寻找AUG密码子。真核蛋白合成中的这一扫描过程由水解ATP的解旋酶驱动。Met-tRNAi的反密码子与mRNA的AUG密码子配对,标志着目标已被发现。在几乎所有的情况下,真核mRNA只有一个起始位点,因此是单一蛋白的模板。相反,如上所述,原核mRNA可以有多个SD序列,因此,具有起始位点,它可以作为多个蛋白合成的模板。

真核生物利用的启动因子比原核生物多得多,它们之间的相互作用也复杂得多。前缀elF表示真核启动因子。例如,eIF-4E是一种直接与7-甲基鸟苷帽结合的蛋白,而eIF-4A是一种解旋酶。原核生物和真核生物在启动机制上的差异,部分是由于RNA加工的不同造成的。在原核生物中,mRNA的5’端在转录后立即容易被核糖体利用。相比之下,在真核生物中,前mRNA必须在翻译开始之前被处理并转运到细胞质中。因此,有足够的机会形成复杂的二级结构,这些结构必须被去除,以暴露成熟mRNA中的信号。5’帽提供了一个易识别的起点。

从以上可以看出,真核mRNA和原核mRNA的转录和翻译之间存在着许多结构性、遗传性和调节性的差异。例如,原核mRNA不能被真核80S核糖体翻译。基于这些不同之处,生成可能整合和/或稳定表达跨越这两个界的mRNA的转基因生物体的能力代表了经基因修饰的生物体领域的实际和商业限制。事实上,关于mRNA的跨界表达的上述问题可能代表了长期以来对一个有效、经济的解决方案的需求。虽然实施要素可能已经有了,但可能在某种程度上缺乏满足这一需求的实际尝试。这可能是由于具有本技术领域普通技能的人未能充分认识或理解所涉及的问题和挑战的性质。

由于缺乏了解,为满足这些长期以来的需求而进行的尝试可能已经无法有效地解决这里所确定的一个或多个问题或挑战。这些尝试甚至可能已经偏离了本发明技术所采取的技术方向,甚至可能导致本发明技术的成就在某种程度上被认为是本领域一些人所采取的方法的意外结果。

正如下面将更详细地讨论的那样,目前的发明技术克服了限制在原核生物中产生的真核样mRNA的跨界生产的问题,这些mRNA可进一步被引入到宿主或受体真核细胞中,并在其中进行翻译。事实上,本发明的真核样mRNA和新型递送系统允许真核宿主的可控转化,而不需要稳定的遗传整合。这一新型系统可以快速改变宿主的新陈代谢,增加作物的营养价值,以及进行基因组编辑,绕过外来DNA的稳定整合和应用GMO标签的需要。此外,新型的共生菌、内共生菌、益生菌或内寄生菌可以提供一种载体,通过持续递送靶真核样RNA分子,对真核宿主细胞进行稳定或连续的非整合性转化。

发明内容

一般来说,本发明技术涉及跨界生产和递送在供体原核生物体中表达的mRNA的新策略,该mRNA可在受体真核宿主中翻译。在一个优选的实施方案中,本发明可以包括在原核生物供体生物体中工程化和/或表达一个或多个异源“真核样mRNA”,该mRNA可以在受体真核宿主细胞中翻译成功能性蛋白。

本发明技术的另一个方面可以包括通过在生活在真核宿主内的细菌中生产和递送真核样mRNA介导的瞬态真核代谢工程策略。在一个优选的实施方案中,本发明技术可以包括在生活在宿主内的供体菌中通过生产和递送真核mRNA介导的瞬态真核代谢工程的生成。在一个优选的实施方案中,真核样mRNA可以在原核生物供体生物体中表达,该mRNA可以在受体真核宿主细胞中被翻译成功能性蛋白,其中这种功能性蛋白可以引起受体真核宿主中代谢途径的调控。这种代谢途径的调控可导致受体真核宿主细胞或更一般的宿主中表型变化的表达。

本发明的另一个方面可以包括在供体原核生物体诸如细菌中生产一种或多种新型mRNA的系统和方法,该mRNA进一步能够从供体菌中输出,被真核宿主细胞吸收和翻译。这样的系统、方法和组合物可适用于体内以及体外系统,如本发明一般所述。在另外一个方面,这样的系统、方法和组合物可以适用于植物以及动物,特别是哺乳动物系统,如本发明一般所述。

本发明的又一个方面可以包括新的分离的多核苷酸、核糖核苷酸、表达盒、表达载体和遗传构建体。在一个优选的实施方案中,本发明可包括从原核生物体(诸如细菌)中的DNA模板合成的新型mRNA组合物,该新型mRNA组合物还能够被真核宿主吸收和翻译。另外的实施方案可以包括新的分离的序列和多核苷酸、核糖核苷酸、表达盒、表达载体和遗传构建体的组合物。

本发明技术的另外的目的可包括转化的、或经基因修饰的的原核生物体,诸如细菌或甚至蓝藻细菌,其可经基因修饰以表达一种或多种新型真核样mRNA,如本发明一般所述。另外的实施方案可以包括非转化的真核生物体,诸如植物、昆虫和动物,它们已经被引入到一种或多种表达一种或多种真核样RNA的经基因修饰的原核生物体中。例如,在一个实施方案中,本发明可包括一种新型宿主真核生物体,该宿主真核生物体翻译已在经基因修饰的细菌中合成的真核样mRNA。

本发明的又一个方面可以包括在原核微生物(诸如细菌)中生产的新型真核样mRNA,该新型真核样mRNA可以进一步被配置为能够从细菌中输出,例如通过外膜囊泡(OVM)结构和/或由真核宿主摄取和翻译。在另一个优选的实施方案中,本发明可以包括在细菌中生成新型真核样mRNA的系统和方法,该新型真核样mRNA可以进一步与真核宿主共生和/或益生。

本发明技术的一个方面可以包括生成瞬态和/或非整合的非GMO基因组编辑系统。在这个优选的实施方案中,本发明技术可以包括使用可以在受体真核宿主中生活并定殖的供体原核生物体(诸如共生菌和/或益生菌)的稳定的、瞬态的转化系统的系统、方法和组合物。在这个优选的实施方案中,供体原核生物体可以被工程化以合成和递送真核样mRNA,或可以在真核宿主中递送和/或翻译的能够在原核生物体中合成的mRNA。供体原核生物可以被工程化以合成和/或递送真核样mRNA,该真核样mRNA被工程化以生产靶向蛋白,诸如巨核酶、锌指核酸酶和/或TALENS,这些蛋白可在真核宿主内表现出基因或基因组编辑功能。在该实施方案中,基因工程化的供体原核生物可促进生产可直接在宿主上实施基因组编辑的基因或基因组编辑蛋白的mRNA。在一个实施方案中,供体原核生物可以被工程化以合成和/或递送用于基因或基因组编辑蛋白的真核样mRNA,该基因或基因组编辑蛋白在诱导性或其他启动子的控制下。

本发明技术的另一个方面可以包括生成瞬态和/或非整合性的非GMO CRISPR(成簇的规律间隔的短回文重复序列)介导的基因组编辑系统。在这个优选的实施方案中,本发明技术可以包括使用可以在受体真核宿主中生活并定殖的供体原核生物体(诸如共生菌和/或益生菌)的稳定的CRISPR/Cas9或3-介导的长期瞬态转化系统的系统、方法和组合物。在一个优选的实施方案中,供体原核生物可以被工程化以合成可在真核宿主中翻译的真核样mRNA。供体原核生物可以被工程化以合成和/或递送CRISPR/Cas9系统的真核样mRNA,以及一个或多个引导RNA序列到真核宿主。在该实施方案中,基因工程化的供体原核生物可促进CRISPR/Cas9系统的mRNA加上可直接在宿主上实现基因组编辑的引导RNA序列的生产。例如,在一个实施方案中,供体原核生物可以被工程化以合成和/或递送CRISPR/Cas9系统的真核样mRNA,该mRNA是在诱导性或其他启动子的控制下。

本发明技术的另一个方面可以包括使用可以在受体真核宿主中生活并定殖的供体原核生物体(诸如共生菌和/或益生菌和/或内寄生菌)的稳定的瞬态非整合转化系统的系统、方法和组合物。在这个优选的实施方案中,供体原核生物体可以被工程化以合成可在受体真核宿主中递送和/或翻译的真核样mRNA。供体原核生物可以被工程化以合成和/或递送真核样mRNA,该mRNA被工程化以生产被配置为在受体真核生物体中生成表型、生化、代谢或其他定向调控的蛋白。例如,在一个优选的实施方案中,供体原核生物体可以被工程化以合成和递送真核样mRNA或当翻译时可诱导新的表型mRNA至真核宿主。在一个实施方案中,这种表型变化可包括一种或多种代谢或其他生长途径的增加。另外的表型变化可包括先前在野生型宿主中不存在的物理和/或生物化学变化。额外的表型变化可包括增强的,甚至新的代谢过程,甚至生产非天然存在的化合物或其他感兴趣的分子。这样的感兴趣的化合物和分子的示例可以包括疫苗或可以在真核宿主中提供增强的病原体抗性其他抗病分子。另外的示例可以包括生产一种或多种毒素或可能对特定病原体、昆虫或其他害虫是致命的其他化合物。

本发明的另一个方面可包括用于将基因工程化的原核生物体引入真核宿主的系统、方法和组合物。在一个优选的实施方案中,可将真核宿主与供体原核生物体诸如共生菌或益生菌接触,该原核生物体被工程化以合成和递送真核样mRNA。这种接触或应用可以在病原体暴露或感染之前或期间完成,或者可以响应市场条件而应用,例如对在真核宿主诸如植物或其他经济作物中表达的某种产品、化合物、分子或性状的需求。

本发明的另一个方面可包括用于将基因工程化的原核生物体施用到受体真核植物宿主的系统、方法和组合物。在一个优选的实施方案中,可将真核植物宿主与供体原核生物体诸如共生菌或益生菌接触,该原核生物体被工程化以合成和递送真核样mRNA。这种接触或应用可以通过一种或多种方法来完成,诸如:喂养、浸泡、喷洒、注射、气雾化配料、环境气雾化配料、水源中的环境气雾化配料、冻干施用、冷冻干燥施用、微胶囊施用、脱湿施用、在水载体中施用、在溶液中施用、刷洗、敷料、滴落和/或涂布。这种施用或引入步骤可以在病原体暴露或感染之前或在病原体暴露或感染期间完成,或者可以响应市场条件而施用,例如对植物宿主中表达的某种产品、化合物、分子或性状的需求。

本发明的另一个方面可以包括生成真核宿主,诸如植物,该真核宿主表达通常通过宿主基因组的直接基因修饰提供的性状。如上所述,在一个优选的实施方案中,供体原核生物体诸如内寄生细菌可以被工程化以合成和递送真核样mRNA,该真核样mRNA赋予传统GMO所需的性状和/或表型,而不需要基因型改变,诸如将一个或多个转基因整合到宿主的基因组中。

本发明的另一个目的可以包括用于治疗疾病状况的方法、系统和组合物,优选在人或植物中。在这个实施方案中,原核细菌可以经基因工程化以生产一种或多种真核样mRNA,这些mRNA可以进一步被引入到表现出疾病状况的细胞、组织或患者中。这样的真核样mRNA可以被真核宿主吸收并翻译成靶蛋白,该靶蛋白的表达导致疾病状况的减少和/或停止。

另一个方面可以包括用于改善Euk-mRNA从供体原核生物到受体真核细胞的运输的系统、方法和组合物。在一个优选的实施方案中,RNA结合辅助蛋白的共表达增加了Euk-mRNA从供体原核生物到受体真核细胞的跨界运输效率。异源辅助基因/蛋白可以包括一种或多种RNA结合辅助蛋白,诸如DRB4(dsRNA结合蛋白2)和/或PP2-A1(韧皮蛋白2-A1),它们可以在从供体原核生物到受体真核生物细胞的跨界递送过程中作为伴侣蛋白。这样的RNA结合辅助蛋白可进一步包括细菌分泌肽(例如OmpA、HylA),并克隆到编码各种IRES/CITE构建体的主链中,进一步促进Euk-mRNA的跨界递送。

本发明技术的其他优选实施方案可包括但不限于以下内容:

1.一种瞬态CRISPR基因组编辑的方法,包含以下步骤:

生成经基因修饰的供体原核生物,所述经基因修饰的供体原核生物表达与编码异源Euk-mRNA的启动子可操作地连接的异源核苷酸序列,其中所述异源Euk-mRNA在所述供体原核生物中不可翻译并且进一步包括:

至少一个形成核糖体调节控制区的非翻译区(UTR),所述至少一个UTR被配置为促进真核核糖体聚集;

编码区,所述编码区编码至少一种能在真核生物中翻译的CRISPR相关内切核酸酶;

去除原核生物核糖体结合位点;

Kozak共有序列;

聚腺苷酸化(poly-A)区域,所述Poly-A区域被配置为促进Poly-A结合蛋白;

在所述供体原核生物中表达所述异源Euk-mRNA;

在受体真核生物中共表达至少一种被配置为与靶基因组序列杂交的引导RNA(gRNA);

将所述异源Euk-mRNA和所述gRNA从所述供体原核生物运输到所述受体真核生物;以及

在所述受体真核生物中翻译来自所述异源Euk-mRNA的所述CRISPR相关内切核酸酶,所述受体真核生物生成异源CRISPR相关内切核酸酶,所述异源CRISPR相关内切核酸酶与所述gRNA结合形成复合物,并与所述靶基因组序列结合,在所述真核生物中执行基因组编辑功能。

2.根据实施方案1所述的方法,其中所述编码至少一种CRISPR相关内切核酸酶的编码区包含编码Cas9蛋白的编码区。

3.根据实施方案1所述的方法,其中所述编码至少一种CRISPR相关内切核酸酶的编码区包含选自由以下组成的群组中的编码CRISPR相关内切核酸酶的编码区:根据SEQID.NO.30的氨基酸序列;根据SEQ ID.NO.32的氨基酸序列;根据SEQ ID.NO.33的氨基酸序列;根据SEQ ID.NO.29的核苷酸序列;以及根据SEQ ID.NO.31的核苷酸序列。

4.根据实施方案2所述的方法,其中所述Euk-mRNA进一步包括稳定区,所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交序列,所述至少两个可杂交序列进一步被配置为形成发夹环。

5.根据实施方案4所述的方法,其中所述供体原核生物包含供体菌。

6.根据实施方案5所述的方法,其中所述供体菌选自由以下组成的群组:共生供体菌;内共生供体菌;内寄生供体菌;益生菌供体菌;肠道菌;RNaseIII缺失供体菌;具有内源性超起泡活性的供体菌;具有内源性超起泡活性的供体菌;基因工程化为具有超起泡活性的供体菌;枯草芽孢杆菌菌株CCB422;大肠杆菌菌株HT27;大肠杆菌菌株HT115;大肠杆菌菌株JC8031;以及阴沟肠杆菌菌株Ae003。

7.根据实施方案4所述的方法,其中所述启动子包含诱导型启动子。

8.根据实施方案4所述的方法,进一步包含具有真核停止信号的Euk-mRNA。

9.根据实施方案4所述的方法,其中所述形成核糖体调节控制区的非翻译区(ETTR)包含选自由以下组成的群组中的形成核糖体调节控制区的非翻译区(ETTR):内部核糖体进入位点(IRES)序列;和经定位的不依赖帽翻译元件”(CITE)序列。

10.根据实施方案9所述的方法,其中所述IRES序列包含选自由以下组成的群组中的IRES序列:烟草花叶病毒IRES(crTMV);烟草蚀刻病毒IRES(TEV);芜菁花叶马铃薯Y病毒IRES(TuMV);烟草(Nicotiana tabacum)热休克蛋白IRES(NtHSF)和人工IRES序列。

11.根据实施方案9所述的方法,其中所述IRES序列包含选自由以下组成的群组中的IRES序列:根据SEQ ID NO.34至SEQ ID NO.37的核苷酸序列。

12.根据实施方案9所述的方法,其中所述CITE序列包含选自由以下组成的群组中的CITE序列:烟草坏死卫星病毒(SNTV)CITE;和人工CITE序列。

13.根据实施方案9所述的方法,其中所述CITE序列包含根据SEQ ID NO.38的核苷酸序列。

14.根据实施方案4所述的方法,其中所述Euk-mRNA进一步包含至少一个额外的内源性3’UTR,所述至少一个额外的内源性3’UTR被配置为聚集促进真核生物核糖体相互作用的蛋白复合物。

15.根据权利要求4所述的方法,其中所述将所述异源Euk-mRNA和所述gRNA从所述供体原核生物运输到受体真核生物的步骤包含通过外膜囊泡(OMV)将所述异源Euk-mRNA和所述gRNA从所述供体原核生物运输到受体真核生物的步骤。

16.根据实施方案4所述的方法,进一步包含生成与所述Euk-mRNA和所述gRNA共表达异源核苷酸序列的经基因修饰的的供体原核生物的步骤,所述异源核苷酸序列可操作地连接到编码至少一个异源辅助基因的启动子,所述至少一个异源辅助基因编码至少一个辅助蛋白,所述至少一个辅助蛋白被配置为增加所述Euk-mRNA和所述gRNA从供体原核生物到受体真核细胞的运输效率。

17.根据实施方案16所述的方法,其中所述被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率的至少一种辅助蛋白包含至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白。

18.根据实施方案17所述的方法,其中所述至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白选自由以下组成的群组:与OmpA细菌分泌信号偶联的dsRNA结合蛋白2(DRB4);和与OmpA细菌分泌信号偶联的韧皮蛋白2-A1(PP2-A1)。

19.根据实施方案18所述的方法,其中所述至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白选自由以下组成的群组:与SEQ ID NO.25的氨基酸序列偶联的SEQ IDNO.11的氨基酸序列;和与SEQ ID NO.27的氨基酸序列偶联的SEQ ID NO.11的氨基酸序列。

20.根据实施方案17所述的方法,其中所述被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率的至少一种辅助蛋白选自由以下组成的群组:根据SEQID NO.25的氨基酸序列;根据SEQ ID NO.27的氨基酸序列;根据SEQ ID NO.24的核苷酸序列;以及根据SEQ ID NO.26的核苷酸序列。

21.根据实施方案17和18所述的方法,其中所述细菌分泌信号包含选自由以下组成的群组中的细菌分泌信号:来自胡萝卜软腐欧文氏菌的PelB(果胶酸裂合酶B);OmpA(外膜蛋白A);StII(热稳定肠毒素2);来自芽孢杆菌的内切木聚糖酶;PhoA(碱性磷酸酶);OmpF(外膜蛋白F);PhoE(外膜孔蛋白E);MalE(麦芽糖结合蛋白);OmpC(外膜蛋白C);Lpp(胞壁质脂蛋白);LamB(λ受体蛋白);OmpT(蛋白酶VII);LTB(热不稳定肠毒素亚单位B);以及HylA(a-溶血素)。

22.根据实施方案17所述的方法,其中所述细菌分泌信号包含选自由以下组成的群组中的细菌分泌信号:根据SEQ ID NO.11至SEQ ID NO.23的氨基酸序列。

23.根据实施方案4所述的方法,其中所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的两个可杂交序列,所述两个可杂交序列进一步被配置为形成Euk-mRNA发夹环结构包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交GC富集序列,所述至少两个可杂交GC富集序列进一步被配置为形成发夹Euk-mRNA环结构。

24.根据实施方案4所述的方法,其中所述Euk-mRNA环结构被配置为稳定Euk-mRNA分子,防止简并,提高运输效率,并且不干扰所述受体真核生物中的真核生物核糖体结合和翻译。

25.根据实施方案4所述的方法,其中所述Euk-mRNA环结构被配置为促进所述受体真核生物中的翻译。

26.一种经基因修饰的细菌,所述经基因修饰的细菌表达与编码异源Euk-mRNA的启动子可操作地连接的异源核苷酸序列,其中所述异源Euk-mRNA在所述供体原核生物中不可翻译并且进一步包括:

至少一个形成核糖体调节控制区的非翻译区(ETTR),所述至少一个ETTR被配置为促进真核核糖体聚集;

编码区,所述编码区编码至少一种能在真核生物中翻译的CRISPR相关内切核酸酶;

去除原核生物核糖体结合位点;

Kozak共有序列;以及

聚腺苷酸化(poly-A)区域,所述poly-A区域被配置为促进Poly-A结合蛋白;

在受体真核生物中共表达至少一种被配置为与靶基因组序列杂交的引导RNA(gRNA)。

27.根据实施方案26所述的细菌,其中所述编码至少一种CRISPR相关内切核酸酶的编码区包含编码Cas9蛋白的编码区。

28.根据实施方案26所述的细菌,其中所述编码至少一种CRISPR相关内切核酸酶的编码区包含选自由以下组成的群组中的编码CRISPR相关内切核酸酶的编码区:根据SEQID.NO.30的氨基酸序列;根据SEQ ID.NO.32的氨基酸序列;根据SEQ ID.NO.33的氨基酸序列;根据SEQ ID.NO.29的核苷酸序列;以及根据SEQ ID.NO.31的核苷酸序列。

29.根据实施方案27所述的细菌,其中所述Euk-mRNA进一步包含稳定区,所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交序列,所述至少两个可杂交序列进一步被配置为形成发夹环。

30.根据实施方案29所述的细菌,其中所述供体原核生物包含供体菌。

31.根据实施方案30所述的细菌,其中所述供体菌选自由以下组成的群组:共生供体菌;内共生供体菌;内寄生供体菌;益生菌供体菌;肠道菌;RNaseIII缺失供体菌;具有内源性超起泡活性的供体菌;具有内源性超起泡活性的供体菌;基因工程化为具有超起泡活性的供体菌;枯草芽孢杆菌菌株CCB422;大肠杆菌菌株HT27;大肠杆菌菌株HT115;大肠杆菌菌株JC8031;以及阴沟肠杆菌菌株Ae003。

32.根据实施方案29所述的细菌,其中所述启动子包含诱导型启动子。

33.根据实施方案29所述的细菌,进一步包含具有真核停止信号的Euk-mRNA。

34.根据实施方案29所述的细菌,其中所述形成核糖体调节控制区的非翻译区(UTR)包含选自由以下组成的群组中的形成核糖体调节控制区的非翻译区(UTR):内部核糖体进入位点(IRES)序列;和经定位的不依赖帽翻译元件”(CITE)序列。

35.根据实施方案34所述的细菌,其中所述IRES序列包含选自由以下组成的群组中的IRES序列:烟草花叶病毒IRES(crTMV);烟草蚀刻病毒IRES(TEV);芜菁花叶马铃薯Y病毒IRES(TuMV);烟草热休克蛋白IRES(NtHSF)和人工IRES序列。

36.根据实施方案34所述的细菌,其中所述IRES序列包含选自由以下组成的群组中的IRES序列:根据SEQ ID NO.34至SEQ ID NO.37的核苷酸序列。

37.根据实施方案34所述的细菌,其中所述CITE序列包含选自由以下组成的群组中的CITE序列:烟草坏死卫星病毒(SNTV)CITE;和人工CITE序列。

38.根据实施方案34所述的细菌,其中所述CITE序列包含根据SEQ ID NO.38的核苷酸序列。

39.根据实施方案29所述的细菌,其中所述Euk-mRNA进一步包含至少一个额外的内源性3’UTR,所述至少一个额外的内源性3’UTR被配置为聚集促进真核生物核糖体相互作用的蛋白复合物。

40.根据实施方案29所述的细菌,其中所述将所述异源Euk-mRNA和所述gRNA从所述供体原核生物运输到受体真核生物的步骤包含通过外膜囊泡(OMV)将所述异源Euk-mRNA和所述gRNA从所述供体原核生物运输到受体真核生物的步骤。

41.根据实施方案29所述的细菌,进一步包含生成与所述Euk-mRNA和所述gRNA共表达异源核苷酸序列的经基因修饰的供体原核生物的步骤,所述异源核苷酸序列可操作地连接到编码至少一个异源辅助基因的启动子,所述至少一个异源辅助基因编码至少一个辅助蛋白,所述至少一个辅助蛋白被配置为增加所述Euk-mRNA和所述gRNA从供体原核生物到受体真核细胞的运输效率。

42.根据实施方案41所述的细菌,其中所述被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率的至少一种辅助蛋白包含至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白。

43.根据实施方案42所述的细菌,其中所述至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白选自由以下组成的群组:与OmpA细菌分泌信号偶联的dsRNA结合蛋白2(DRB4);和与OmpA细菌分泌信号偶联的韧皮蛋白2-A1(PP2-A1)。

44.根据实施方案43所述的细菌,其中所述至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白选自由以下组成的群组:与SEQ ID NO.25的氨基酸序列偶联的SEQ IDNO.11的氨基酸序列;和与SEQ ID NO.27的氨基酸序列偶联的SEQ ID NO.11的氨基酸序列。

45.根据实施方案42所述的细菌,其中所述被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率的至少一种辅助蛋白选自由以下组成的群组:根据SEQID NO.25的氨基酸序列;根据SEQ ID NO.27的氨基酸序列;根据SEQ ID NO.24的核苷酸序列;以及根据SEQ ID NO.26的核苷酸序列。

46.根据实施方案42和43所述的细菌,其中所述细菌分泌信号包含选自由以下组成的群组中的细菌分泌信号:来自胡萝卜软腐欧文氏菌的PelB(果胶酸裂合酶B);OmpA(外膜蛋白A);StII(热稳定肠毒素2);来自芽孢杆菌的内切木聚糖酶;PhoA(碱性磷酸酶);OmpF(外膜蛋白F);PhoE(外膜孔蛋白E);MalE(麦芽糖结合蛋白);OmpC(外膜蛋白C);Lpp(胞壁质脂蛋白);LamB(λ受体蛋白);OmpT(蛋白酶VII);LTB(热不稳定肠毒素亚单位B);以及HylA(a-溶血素)。

47.根据实施方案42所述的细菌,其中所述细菌分泌信号包含选自由以下组成的群组中的细菌分泌信号:根据SEQ ID NO.11至SEQ ID NO.23的氨基酸序列。

48.根据实施方案CE110所述的细菌,其中所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的两个可杂交序列,所述两个可杂交序列进一步被配置为形成Euk-mRNA发夹环包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交GC富集序列,所述至少两个可杂交GC富集序列进一步被配置为形成发夹Euk-mRNA环结构。

49.根据实施方案29所述的细菌,其中所述Euk-mRNA环结构被配置为稳定Euk-mRNA分子,防止简并,提高运输效率,并且不干扰所述受体真核生物的真核生物核糖体结合和翻译。

50.根据实施方案29所述的细菌,其中所述Euk-mRNA环结构被配置为促进所述受体真核生物中的翻译。

51.一种瞬态CRISPR基因组编辑的方法,包含以下步骤:

生成经基因修饰的供体原核生物,所述经基因修饰的供体原核生物表达与编码异源Euk-mRNA的启动子可操作地连接的异源核苷酸序列,其中所述异源Euk-mRNA在所述供体原核生物中不可翻译并且进一步包括:

至少一个形成核糖体调节控制区的非翻译区(ETTR),所述至少一个ETTR被配置为促进真核核糖体聚集;

编码区,所述编码区编码至少一种能在真核生物中翻译并且被配置为靶向基因组序列的基因编辑内切核酸酶;

去除原核生物核糖体结合位点;

Kozak共有序列;

聚腺苷酸化(poly-A)区域,所述Poly-A区域被配置为促进Poly-A结合蛋白;

在所述供体原核生物中表达所述异源Euk-mRNA;

将所述异源Euk-mRNA和所述gRNA从所述供体原核生物运输到所述受体真核生物;以及

在所述受体真核生物中翻译来自所述异源Euk-mRNA的所述CRISPR相关内切核酸酶,所述受体真核生物生成异源CRISPR相关内切核酸酶,所述异源CRISPR相关内切核酸酶与所述gRNA结合形成复合物,并与所述靶基因组序列结合,在所述真核生物中执行基因组编辑功能。

52.根据实施方案51所述的方法,其中所述Euk-mRNA进一步包括稳定区,所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交序列,所述至少两个可杂交序列进一步被配置为形成发夹环。

53.根据实施方案52所述的方法,其中所述编码至少一种CRISPR相关内切核酸酶的编码区包含编码Cas9蛋白的编码区。

54.根据实施方案52所述的方法,其中所述编码至少一种CRISPR相关内切核酸酶的编码区包含编码选自由以下组成的群组中的CRISPR相关内切核酸酶的编码区:根据SEQID.NO.30的氨基酸序列;根据SEQ ID.NO.32的氨基酸序列;根据SEQ ID.NO.33的氨基酸序列;根据SEQ ID.NO.29的核苷酸序列;以及根据SEQ ID.NO.31的核苷酸序列。

55.根据实施方案53所述的方法,进一步包含在受体真核生物中共表达至少一种被配置为与所述靶基因组序列杂交的引导RNA(gRNA)的步骤。

56.根据实施方案52所述的方法,其中所述基因编辑内切核酸酶包含选自由以下组成的群组中的基因编辑内切核酸酶:CRISPR相关内切核酸酶、Cas9、Cas3、TALAN相关内切核酸酶;巨核酶;以及锌指相关内切核酸酶。

57.根据实施方案52所述的方法,其中所述供体原核生物包含供体菌。

58.根据实施方案57所述的方法,其中所述供体菌选自由以下组成的群组:共生供体菌;内共生供体菌;内寄生供体菌;益生菌供体菌;肠道菌;RNaseIII缺失供体菌;具有内源性超起泡活性的供体菌;具有内源性超起泡活性的供体菌;基因工程化为具有超起泡活性的供体菌;枯草芽孢杆菌菌株CCB422;大肠杆菌菌株HT27;大肠杆菌菌株HT115;大肠杆菌菌株JC8031;以及阴沟肠杆菌菌株Ae003。

59.根据实施方案52所述的方法,其中所述启动子包含诱导型启动子。

60.根据实施方案52所述的方法,进一步包含具有真核停止信号的Euk-mRNA。

61.根据实施方案52所述的方法,其中所述形成核糖体调节控制区的非翻译区(UTR)包含选自由以下组成的群组中的形成核糖体调节控制区的非翻译区(UTR):内部核糖体进入位点(IRES)序列;和经定位不依赖帽翻译元件”(CITE)序列。

62.根据实施方案61所述的方法,其中所述IRES序列包含选自由以下组成的群组中的IRES序列:烟草花叶病毒IRES(crTMV);烟草蚀刻病毒IRES(TEV);芜菁花叶马铃薯Y病毒IRES(TuMV);烟草热休克蛋白IRES(NtHSF)和人工IRES序列。

63.根据实施方案61所述的方法,其中所述IRES序列包含选自由以下组成的群组中的IRES序列:根据SEQ ID NO.34至SEQ ID NO.37的核苷酸序列。

64.根据实施方案61所述的方法,其中所述CITE序列包含选自由以下组成的群组中的CITE序列:烟草坏死卫星病毒(SNTV)CITE;和人工CITE序列。

65.根据实施方案61所述的方法,其中所述CITE序列包含根据SEQ ID NO.38的核苷酸序列。

66.根据实施方案52所述的方法,其中所述Euk-mRNA进一步包含至少一个额外的内源性3’UTR,所述至少一个额外的内源性3’UTR被配置为聚集促进真核生物核糖体相互作用的蛋白复合物。

67.根据实施方案52所述的方法,其中所述将所述异源Euk-mRNA从所述供体原核生物运输到受体真核生物的步骤包含通过外膜囊泡(OMV)将所述异源Euk-mRNA从所述供体原核生物运输到受体真核生物的步骤。

68.根据实施方案52所述的方法,进一步包含生成与所述Euk-mRNA共表达异源核苷酸序列的经基因修饰的的供体原核生物的步骤,所述异源核苷酸序列可操作地连接到编码至少一个异源辅助基因的启动子,所述至少一个异源辅助基因编码至少一个辅助蛋白,所述至少一个辅助蛋白被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率。

69.根据实施方案68所述的方法,其中所述被配置为增加所述Euk-mRNA从供体原核生物到受体真核生物的运输效率的至少一种辅助蛋白包含至少一种与细菌分泌信号结合的嵌合RNA结合辅助蛋白。

70.根据实施方案69所述的方法,其中所述至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白选自由以下组成的群组:与OmpA细菌分泌信号偶联的dsRNA结合蛋白2(DRB4);和与OmpA细菌分泌信号偶联的韧皮蛋白2-A1(PP2-A1)。

71.根据实施方案70所述的方法,其中所述至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白选自由以下组成的群组:与SEQ ID NO.25的氨基酸序列偶联的SEQ IDNO.11的氨基酸序列;和与SEQ ID NO.27的氨基酸序列偶联的SEQ ID NO.11的氨基酸序列。

72.根据实施方案69所述的方法,其中所述被配置为提高所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率的至少一种辅助蛋白选自由以下组成的群组:根据SEQID NO.25的氨基酸序列;根据SEQ ID NO.27的氨基酸序列;根据SEQ ID NO.24的核苷酸序列;以及根据SEQ ID NO.26的核苷酸序列。

73.根据实施方案69和70所述的方法,其中所述细菌分泌信号包含选自由以下组成的群组中的细菌分泌信号:来自胡萝卜软腐欧文氏菌的PelB(果胶酸裂合酶B);OmpA(外膜蛋白A);StII(热稳定肠毒素2);来自芽孢杆菌的内切木聚糖酶;PhoA(碱性磷酸酶);OmpF(外膜蛋白F);PhoE(外膜孔蛋白E);MalE(麦芽糖结合蛋白);OmpC(外膜蛋白C);Lpp(胞壁质脂蛋白);LamB(λ受体蛋白);OmpT(蛋白酶VII);LTB(热不稳定肠毒素亚单位B);以及HylA(a-溶血素)。

74.根据实施方案69所述的方法,其中所述细菌分泌信号包含选自由以下组成的群组中的细菌分泌信号:根据SEQ ID NO.11至SEQ ID NO.23的核苷酸序列。

75.根据实施方案52所述的方法,其中所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的两个可杂交序列,所述两个可杂交序列进一步被配置为形成Euk-mRNA发夹环包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交GC富集序列,所述至少两个可杂交GC富集序列进一步被配置为形成发夹Euk-mRNA环结构。

76.根据实施方案75所述的方法,其中所述Euk-mRNA环结构被配置为稳定Euk-mRNA分子,防止简并,提高运输效率,并且不干扰所述受体真核生物的真核生物核糖体结合和翻译。

77.根据实施方案76所述的方法,其中所述Euk-mRNA环结构被配置为促进所述受体真核生物中的翻译。

78.一种经基因修饰的细菌,所述经基因修饰的细菌表达与编码异源Euk-mRNA的启动子可操作地连接的异源核苷酸序列,其中所述异源Euk-mRNA在所述供体原核生物中不可翻译并且进一步包括:

至少一个形成核糖体调节控制区的非翻译区(ETTR),所述至少一个ETTR被配置为促进真核核糖体聚集;

编码区,所述编码区编码至少一种能在真核生物中翻译并且被配置为靶向基因组序列的基因编辑内切核酸酶;

去除原核生物核糖体结合位点;

Kozak共有序列;

聚腺苷酸化(poly-A)区域,所述poly-A区域被配置为促进Poly-A结合蛋白;

79.根据实施方案78所述的细菌,其中所述Euk-mRNA进一步包括稳定区,所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交序列,所述至少两个可杂交序列进一步被配置为形成发夹环。

80.根据实施方案78所述的方法,其中所述编码至少一种CRISPR相关内切核酸酶的编码区包含编码Cas9蛋白的编码区。

81.根据实施方案78所述的细菌,其中所述编码至少一种CRISPR相关内切核酸酶的编码区包含选自由以下组成的群组中的编码CRISPR相关内切核酸酶的编码区:根据SEQID.NO.30的氨基酸序列;根据SEQ ID.NO.32的氨基酸序列;根据SEQ ID.NO.33的氨基酸序列;根据SEQ ID.NO.29的核苷酸序列;以及根据SEQ ID.NO.31的核苷酸序列。

82.根据实施方案80所述的细菌,进一步包含在受体真核生物中共表达至少一种被配置为与所述靶基因组序列杂交的引导RNA(gRNA)的步骤。

83.根据实施方案78所述的细菌,其中所述基因编辑内切核酸酶包含选自由以下组成的群组中的基因编辑内切核酸酶:CRISPR相关内切核酸酶、Cas9、Cas3、TALAN相关内切核酸酶;巨核酶;以及锌指相关内切核酸酶。

84.根据实施方案79所述的细菌,其中所述供体原核生物包含供体菌。

85.根据实施方案84所述的细菌,其中所述供体菌选自由以下组成的群组:共生供体菌;内共生供体菌;内寄生供体菌;益生菌供体菌;肠道菌;RNaseIII缺失供体菌;具有内源性超起泡活性的供体菌;具有内源性超起泡活性的供体菌;基因工程化为具有超起泡活性的供体菌;枯草芽孢杆菌菌株CCB422;大肠杆菌菌株HT27;大肠杆菌菌株HT115;大肠杆菌菌株JC8031;以及阴沟肠杆菌菌株Ae003。

86.根据实施方案79所述的细菌,其中所述启动子包含诱导型启动子。

87.根据实施方案79所述的细菌,进一步包含具有真核停止信号的Euk-mRNA。

88.根据实施方案79所述的细菌,其中所述形成核糖体调节控制区的非翻译区(ETTR)包含选自由以下组成的群组中的形成核糖体调节控制区的非翻译区(ETTR):内部核糖体进入位点(IRES)序列;和经定位的不依赖帽翻译元件”(CITE)序列。

89.根据实施方案88所述的细菌,其中所述IRES序列包含选自由以下组成的群组中的IRES序列:烟草花叶病毒IRES(crTMV);烟草蚀刻病毒IRES(TEV);芜菁花叶马铃薯Y病毒IRES(TuMV);烟草热休克蛋白IRES(NtHSF)和人工IRES序列。

90.根据实施方案88所述的细菌,其中所述IRES序列包含选自由以下组成的群组中的IRES序列:根据SEQ ID NO.34至SEQ ID NO.37的核苷酸序列。

91.根据实施方案88所述的细菌,其中所述CITE序列包含选自由以下组成的群组中的CITE序列:烟草坏死卫星病毒(SNTV)CITE;和人工CITE序列。

92.根据实施方案88所述的细菌,其中所述CITE序列包含根据SEQ ID NO.38的核苷酸序列。

93.根据实施方案79所述的细菌,其中所述Euk-mRNA进一步包含至少一个额外的内源性3’UTR,所述至少一个额外的内源性3’UTR被配置为聚集促进真核生物核糖体相互作用的蛋白复合物。

94.根据实施方案79所述的细菌,其中所述将所述异源Euk-mRNA从所述供体原核生物运输到受体真核生物的步骤包含通过外膜囊泡(OMV)将所述异源Euk-mRNA从所述供体原核生物运输到受体真核生物的步骤。

95.根据实施方案79所述的细菌,进一步包含生成与所述Euk-mRNA共表达异源核苷酸序列的经基因修饰的原核生物的步骤,所述异源核苷酸序列可操作地连接到编码至少一个异源辅助基因的启动子,所述至少一个异源辅助基因编码至少一个辅助蛋白,所述至少一个辅助蛋白被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率。

96.根据实施方案95所述的细菌,其中所述被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率的至少一种辅助蛋白包含至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白。

97.根据实施方案96所述的方法,其中所述至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白选自由以下组成的群组:与OmpA细菌分泌信号偶联的dsRNA结合蛋白2(DRB4);和与OmpA细菌分泌信号偶联的韧皮蛋白2-A1(PP2-A1)。

98.根据实施方案97所述的细菌,其中所述至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白选自由以下组成的群组:与SEQ ID NO.25的氨基酸序列偶联的SEQ IDNO.11的氨基酸序列;和与SEQ ID NO.27的氨基酸序列偶联的SEQ ID NO.11的氨基酸序列。

99.根据实施方案98所述的细菌,其中所述至少一种被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率的辅助蛋白选自由以下组成的群组:根据SEQID NO.25的氨基酸序列;根据SEQ ID NO.27的氨基酸序列;根据SEQ ID NO.24的核苷酸序列;以及根据SEQ ID NO.26的核苷酸序列。

100.根据实施方案96和97所述的细菌,其中所述细菌分泌信号包含选自由以下组成的群组中的细菌分泌信号:来自胡萝卜软腐欧文氏菌的PelB(果胶酸裂合酶B);OmpA(外膜蛋白A);StII(热稳定肠毒素2);来自芽孢杆菌的内切木聚糖酶;PhoA(碱性磷酸酶);OmpF(外膜蛋白F);PhoE(外膜孔蛋白E);MalE(麦芽糖结合蛋白);OmpC(外膜蛋白C);Lpp(胞壁质脂蛋白);LamB(λ受体蛋白);OmpT(蛋白酶VII);LTB(热不稳定肠毒素亚单位B);以及HylA(a-溶血素)。

101.根据实施方案98所述的细菌,其中所述细菌分泌信号包含选自由以下组成的群组中的细菌分泌信号:根据SEQ ID NO.11至SEQ ID NO.23的氨基酸序列。

102.根据实施方案79所述的细菌,其中所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的两个可杂交序列,所述两个可杂交序列进一步被配置为形成Euk-mRNA发夹环包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交GC富集序列,所述至少两个可杂交GC富集序列进一步被配置为形成发夹Euk-mRNA环结构。

103.根据实施方案102所述的细菌,其中所述Euk-mRNA环结构被配置为稳定Euk-mRNA分子,防止简并,提高运输效率,并且不干扰所述受体真核生物的真核生物核糖体结合和翻译。

104.根据实施方案103所述的细菌,其中所述Euk-mRNA环结构被配置为促进所述受体真核生物中的翻译。

105.一种在原核生物中表达真核样信使核糖核酸分子(Euk-mRNA)的真核宿主的瞬态、非整合性转化的方法,所述原核生物能够在受体真核生物中进行翻译,所述方法包含以下步骤:

生成经基因修饰的供体原核生物,所述经基因修饰的供体原核生物表达与编码异源Euk-mRNA的启动子可操作地连接的异源核苷酸序列,其中所述异源Euk-mRNA在所述供体原核生物中不可翻译并且进一步包括:

至少一个形成核糖体调节控制区的非翻译区(ETTR),所述至少一个ETTR被配置为促进真核核糖体聚集;

至少一个能在所述真核生物中被翻译的蛋白编码区;

去除原核生物核糖体结合位点;

Kozak共有序列;以及

聚腺苷酸化(poly-A)区域,所述poly-A区域被配置为促进Poly-A结合蛋白;

在所述供体原核生物中表达所述异源Euk-mRNA;

将所述异源Euk-mRNA从所述供体原核生物运输到所述受体真核生物;以及

在所述受体真核生物中翻译所述异源Euk-mRNA的至少一个蛋白编码区,产生异源蛋白。

106.根据实施方案105所述的方法,其中所述供体原核生物包含供体菌。

107.根据实施方案106所述的方法,其中所述供体菌选自由以下组成的群组:共生供体菌;内共生供体菌;内寄生供体菌;益生菌供体菌;肠道菌;RNaseIII缺失供体菌;具有内源性超起泡活性的供体菌;具有内源性超起泡活性的供体菌;基因工程化为具有超起泡活性的供体菌;枯草芽孢杆菌菌株CCB422;大肠杆菌菌株HT27;大肠杆菌菌株HT115;大肠杆菌菌株JC8031;以及阴沟肠杆菌菌株Ae003。

108.根据实施方案105所述的方法,其中所述启动子包含诱导型启动子。

109.根据实施方案105所述的方法,进一步包含具有真核停止信号的Euk-mRNA。

110.根据实施方案105所述的方法,其中所述形成核糖体调节控制区的非翻译区(ETTR)包含选自由以下组成的群组中的形成核糖体调节控制区的非翻译区(ETTR):内部核糖体进入位点(IRES)序列;和经定位的不依赖帽翻译元件”(CITE)序列。

111.根据实施方案110所述的方法,其中所述IRES序列包含选自由以下组成的群组中的IRES序列:烟草花叶病毒IRES(crTMV);烟草蚀刻病毒IRES(TEV);芜菁花叶马铃薯Y病毒IRES(TuMV);烟草热休克蛋白IRES(NtHSF)和人工IRES序列。

112.根据实施方案105所述的方法,其中所述IRES序列包含选自由以下组成的群组中的IRES序列:根据SEQ ID NO.34至SEQ ID NO.37的核苷酸序列。

113.根据实施方案105所述的方法,其中所述CITE序列包含选自由以下组成的群组中的CITE序列:烟草坏死卫星病毒(SNTV)CITE;和人工CITE序列。

114.根据实施方案105所述的方法,其中所述CITE序列包含根据SEQ ID NO.38的核苷酸序列。

115.根据实施方案105所述的方法,其中所述Euk-mRNA进一步包含至少一个额外的内源性3’UTR,所述至少一个额外的内源性3’UTR被配置为聚集促进真核生物核糖体相互作用的蛋白复合物。

116.根据实施方案105所述的方法,其中所述蛋白编码区包含编码真核蛋白的蛋白编码区,所述蛋白编码区进一步产生以下至少一种:所述受体真核生物的表型变化;所述受体真核生物的代谢变化;所述受体真核生物的生化变化;增加生长;增加生长;增强抗应激性;增强抗病性;产生非天然存在的化合物或其他分子;治疗性病原体生物控制;减少疾病状况;基因编辑功能。

117.根据实施方案105所述的方法,其中所述将所述异源Euk-mRNA从所述供体原核生物运输到受体真核生物的步骤包含通过外膜囊泡(OMV)将所述异源Euk-mRNA从所述供体原核生物运输到受体真核生物的步骤。

118.根据实施方案105所述的方法,其中Euk-mRNA包含选自由以下组成的群组中的Euk-mRNA构建体:根据SEQ ID NO.1至SEQ ID NO.10的核苷酸序列,并且其中所述序列中的所述蛋白编码区被感兴趣的靶蛋白取代。

119.根据实施方案105所述的方法,进一步包含生成与所述Euk-mRNA共表达异源核苷酸序列的经基因修饰的供体原核生物的步骤,所述异源核苷酸序列可操作地连接到编码至少一个异源辅助基因的启动子,所述至少一个异源辅助基因编码至少一种辅助蛋白,所述至少一个辅助蛋白被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率。

120.根据实施方案119所述的方法,其中所述被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率的至少一种辅助蛋白包含至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白。

121.根据实施方案120所述的方法,其中所述至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白选自由以下组成的群组:与OmpA细菌分泌信号偶联的dsRNA结合蛋白2(DRB4);和与OmpA细菌分泌信号偶联的韧皮蛋白2-A1(PP2-A1)。

122.根据实施方案121所述的方法,其中所述至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白选自由以下组成的群组:与SEQ ID NO.25的氨基酸序列偶联的SEQ IDNO.11的氨基酸序列;和与SEQ ID NO.27的氨基酸序列偶联的SEQ ID NO.11的氨基酸序列。

123.根据实施方案119所述的方法,其中所述被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率的至少一种辅助蛋白选自由以下组成的群组:根据SEQ ID NO.25的氨基酸序列;根据SEQ ID NO.27的氨基酸序列;根据SEQ ID NO.24的核苷酸序列;以及根据SEQ ID NO.26的核苷酸序列。

124.根据实施方案120和121所述的方法,其中所述细菌分泌信号包含选自由以下组成的群组中的细菌分泌信号:来自胡萝卜软腐欧文氏菌的PelB(果胶酸裂合酶B);OmpA(外膜蛋白A);StII(热稳定肠毒素2);来自芽孢杆菌的内切木聚糖酶;PhoA(碱性磷酸酶);OmpF(外膜蛋白F);PhoE(外膜孔蛋白E);MalE(麦芽糖结合蛋白);OmpC(外膜蛋白C);Lpp(胞壁质脂蛋白);LamB(λ受体蛋白);OmpT(蛋白酶VII);LTB(热不稳定肠毒素亚单位B);以及HylA(a-溶血素)。

125.根据实施方案119所述的方法,其中所述细菌分泌信号包含选自由以下组成的群组中的细菌分泌信号:根据SEQ ID NO.11至SEQ ID NO.23的氨基酸序列。

126.根据实施方案105所述的方法,其中所述Euk-mRNA进一步包含稳定区,所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的两个可杂交序列,所述两个可杂交序列进一步被配置为形成Euk-mRNA发夹环。

127.根据实施方案126所述的方法,其中所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的两个可杂交序列,所述两个可杂交序列进一步被配置为形成Euk-mRNA发夹环包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交GC富集序列,所述至少两个可杂交GC富集序列进一步配置为发夹Euk-mRNA环结构。

128.根据实施方案127所述的方法,其中所述Euk-mRNA环结构被配置为稳定Euk-mRNA分子,防止简并,提高运输效率,并且不干扰所述受体真核生物中的真核生物核糖体结合和翻译。

129.根据实施方案127所述的方法,其中所述Euk-mRNA环结构被配置为促进所述受体真核生物中的翻译。

130.一种在原核生物中表达增强的真核样信使核糖核酸分子(Euk-mRNA)的真核宿主的非整合转化方法,所述原核生物能够在受体真核生物中进行翻译,所述方法包含以下步骤:

生成经基因修饰的供体原核生物,所述经基因修饰的供体原核生物表达与编码异源Euk-mRNA的启动子可操作地连接的异源核苷酸序列,其中所述异源Euk-mRNA在所述供体原核生物中不可翻译并且进一步包括:

至少一个形成核糖体调节控制区的非翻译区(ETTR),所述至少一个ETTR被配置为促进真核核糖体聚集;

至少一个能在所述受体真核生物中被翻译的蛋白编码区;

去除原核生物核糖体结合位点;

Kozak共有序列;

稳定区,所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交序列,所述至少两个可杂交序列进一步被配置为形成发夹环;

聚腺苷酸化(poly-A)区域,所述poly-A区域被配置为促进Poly-A结合蛋白;

在所述供体原核生物中表达所述异源Euk-mRNA;

将所述异源Euk-mRNA从所述供体原核生物运输到所述受体真核生物;以及

在所述受体真核生物中翻译所述异源Euk-mRNA的至少一个蛋白编码区,产生异源蛋白。

131.根据实施方案130所述的方法,其中所述供体原核生物包含供体菌。

132.根据实施方案131所述的方法,其中所述供体菌选自由以下组成的群组:共生供体菌;内共生供体菌;内寄生供体菌;益生菌供体菌;肠道菌;RNaseIII缺失供体菌;具有内源性超起泡活性的供体菌;具有内源性超起泡活性的供体菌;基因工程化为具有超起泡活性的供体菌;枯草芽孢杆菌菌株CCB422;大肠杆菌菌株HT27;大肠杆菌菌株HT115;大肠杆菌菌株JC8031;以及阴沟肠杆菌菌株Ae003。

133.根据实施方案130所述的方法,其中所述启动子包含诱导型启动子。

134.根据实施方案130所述的方法,进一步包含具有真核停止信号的Euk-mRNA。

135.根据实施方案130所述的方法,其中所述形成核糖体调节控制区的非翻译区(ETTR)包含选自由以下组成的群组中的形成核糖体调节控制区的非翻译区(ETTR):内部核糖体进入位点(IRES)序列;和经定位的不依赖帽翻译元件”(CITE)序列。

136.根据实施方案135所述的方法,其中所述IRES序列包含选自由以下组成的群组中的IRES序列:烟草花叶病毒IRES(crTMV);烟草蚀刻病毒IRES(TEV);芜菁花叶马铃薯Y病毒IRES(TuMV);烟草热休克蛋白IRES(NtHSF)和人工IRES序列。

137.根据实施方案135所述的方法,其中所述IRES序列包含选自由以下组成的群组中的IRES序列:根据SEQ ID NO.34至SEQ ID NO.37的核苷酸序列。

138.根据实施方案135所述的方法,其中所述CITE序列包含选自由以下组成的群组中的CITE序列:烟草坏死卫星病毒(SNTV)CITE;和人工CITE序列。

139.根据实施方案135所述的方法,其中所述CITE序列包含根据SEQ ID NO.38的核苷酸序列。

140.根据实施方案130所述的方法,其中所述Euk-mRNA进一步包含至少一个额外的内源性3’UTR,所述至少一个额外的内源性3’UTR配置为聚集促进真核生物核糖体相互作用的蛋白复合物。

141.根据实施方案130所述的方法,其中所述蛋白编码区包含编码真核蛋白的蛋白编码区,所述蛋白编码区进一步产生以下至少一种:所述受体真核生物的表型变化;所述受体真核生物的代谢变化;所述受体真核生物的生化变化;增加生长;增加生长;增强抗应激性;增强抗病性;产生非天然存在的化合物或其他分子;治疗性病原体生物控制;减少疾病状况;基因编辑功能。

142.根据实施方案130所述的方法,其中所述将所述异源Euk-mRNA从所述供体原核生物运输到受体真核生物的步骤包含通过外膜囊泡(OMV)将所述异源Euk-mRNA从所述供体原核生物运输到受体真核生物。

143.根据实施方案130所述的方法,其中Euk-mRNA包含选自由以下组成的群组中的Euk-mRNA构建体:根据SEQ ID NO.1至SEQ ID NO.10的核苷酸序列,并且其中所述序列中的所述蛋白编码区被感兴趣的靶蛋白取代。

144.根据实施方案130所述的方法,进一步包含生成与所述Euk-mRNA共表达异源核苷酸序列的经基因修饰的供体原核生物的步骤,所述异源核苷酸序列可操作地连接到编码至少一个异源辅助基因的启动子,所述至少一个异源辅助基因编码至少一种辅助蛋白,所述至少一个辅助蛋白被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率。

145.根据实施方案B144240所述的方法,其中所述被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率的至少一种辅助蛋白包含至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白。

146.根据实施方案145所述的方法,其中所述至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白选自由以下组成的群组:与OmpA细菌分泌信号偶联的dsRNA结合蛋白2(DRB4);和与OmpA细菌分泌信号偶联的韧皮蛋白2-A1(PP2-A1)。

147.根据实施方案146所述的方法,其中所述至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白选自由以下组成的群组:与SEQ ID NO.25的氨基酸序列偶联的SEQ IDNO.11的氨基酸序列;和与SEQ ID NO.27的氨基酸序列偶联的SEQ ID NO.11的氨基酸序列。

148.根据实施方案144所述的方法,其中所述被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率的至少一种辅助蛋白选自由以下组成的群组:根据SEQ ID NO.25的氨基酸序列;根据SEQ ID NO.27的氨基酸序列;根据SEQ ID NO.24的核苷酸序列;以及根据SEQ ID NO.26的核苷酸序列。

149.根据实施方案145和146所述的方法,其中所述细菌分泌信号包含选自由以下组成的群组中的细菌分泌信号:来自胡萝卜软腐欧文氏菌的PelB(果胶酸裂合酶B);OmpA(外膜蛋白A);StII(热稳定肠毒素2);来自芽孢杆菌的内切木聚糖酶;PhoA(碱性磷酸酶);OmpF(外膜蛋白F);PhoE(外膜孔蛋白E);MalE(麦芽糖结合蛋白);OmpC(外膜蛋白C);Lpp(胞壁质脂蛋白);LamB(λ受体蛋白);OmpT(蛋白酶VII);LTB(热不稳定肠毒素亚单位B);以及HylA(a-溶血素)。

150.根据实施方案130所述的方法,其中所述细菌分泌信号包含选自由以下组成的群组中的细菌分泌信号:根据SEQ ID NO.11至SEQ ID NO.23的氨基酸序列。

151.根据实施方案130所述的方法,其中所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交序列,所述至少两个可杂交序列进一步被配置为形成发夹环包含至少两个分别定位在所述Euk-mRNA的5’端和3’端的可杂交GC富集序列,所述至少两个可杂交GC富集序列进一步被配置为形成发夹Euk-mRNA环结构。

152.根据实施方案151所述的方法,其中所述Euk-mRNA环结构被配置为稳定所述Euk-mRNA,防止所述Euk-mRNA的简并,提高所述Euk-mRNA的运输效率,并且不干扰所述Euk-mRNA的真核生物核糖体结合和真核翻译。

153.根据实施方案151所述的方法,其中所述Euk-mRNA环结构被配置为促进所述受体真核生物的翻译。

154.一种真核样信使核糖核酸分子(Euk-mRNA),所述Euk-mRNA被配置为为在供体原核生物中表达,所述供体原核生物能够在受体真核生物中进行翻译,其中所述Euk-mRNA包含:

至少一个形成核糖体调节控制区的非翻译区(ETTR),所述至少一个ETTR被配置为促进真核核糖体聚集;

至少一个能在真核生物中被翻译的蛋白编码区;

Kozak共有序列;

聚腺苷酸化(poly-A)区域;并且

并且其中任何原核生物核糖体结合位点已被去除。

155.根据实施方案154所述的Euk-mRNA,其中所述至少一个形成核糖体调节控制区的非翻译区(ETTR)包含选自由以下组成的群组中的形成核糖体调节控制区的非翻译区(UTR):内部核糖体进入位点(IRES)序列;和经定位的不依赖帽翻译元件”(CITE)序列。

156.根据实施方案155所述的Euk-mRNA,其中所述IRES序列包含选自由以下组成的群组中的IRES序列:烟草花叶病毒IRES(crTMV);烟草蚀刻病毒IRES(TEV);芜菁花叶马铃薯Y病毒IRES(TuMV);烟草热休克蛋白IRES(NtHSF)和人工IRES序列。

157.根据实施方案154所述的Euk-mRNA,其中所述IRES序列包含选自由以下组成的群组中的IRES序列:根据SEQ ID NO.34至SEQ ID NO.37的核苷酸序列。

158.根据实施方案154所述的Euk-mRNA,其中所述CITE序列包含选自由以下组成的群组中的CITE序列:烟草坏死卫星病毒(SNTV)CITE;和人工CITE序列。

159.根据实施方案154所述的Euk-mRNA,其中所述CITE序列包含根据SEQ IDNO.38的核苷酸序列。

160.根据实施方案154所述的Euk-mRNA,其中Euk-mRNA包含选自由以下组成的群组中的Euk-mRNA构建体:根据SEQ ID NO.1至SEQ ID NO.10的核苷酸序列,并且其中所述序列中的所述蛋白编码区被感兴趣的靶蛋白取代。

161.一种生成与所述Euk-mRNA共表达异源核苷酸序列的经基因修饰的的供体原核生物方法,所述异源核苷酸序列可操作地连接到编码至少一个异源辅助基因的启动子,所述至少一个异源辅助基因编码至少一个辅助蛋白,所述至少一个辅助蛋白被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率。

162.根据实施方案161所述的方法,其中所述被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率的至少一种辅助蛋白包含至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白。

163.根据实施方案162所述的方法,其中所述至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白选自由以下组成的群组:与OmpA细菌分泌信号偶联的dsRNA结合蛋白2(DRB4);和与OmpA细菌分泌信号偶联的韧皮蛋白2-A1(PP2-A1)。

164.根据实施方案163所述的方法,其中所述至少一种与细菌分泌信号偶联的嵌合RNA结合辅助蛋白选自由以下组成的群组:与SEQ ID NO.25的氨基酸序列偶联的SEQ IDNO.11的氨基酸序列;和与SEQ ID NO.27的氨基酸序列偶联的SEQ ID NO.11的氨基酸序列。

165.根据实施方案161所述的方法,其中所述被配置为增加所述Euk-mRNA从供体原核生物到受体真核细胞的运输效率的至少一种辅助蛋白选自由以下组成的群组:根据SEQ ID NO.25的氨基酸序列;根据SEQ ID NO.27的氨基酸序列;根据SEQ ID NO.24的核苷酸序列;以及根据SEQ ID NO.26的核苷酸序列。

166.根据实施方案162和163所述的方法,其中所述细菌分泌信号包含选自由以下组成的群组中的细菌分泌信号:来自胡萝卜软腐欧文氏菌的PelB(果胶酸裂合酶B);OmpA(外膜蛋白A);StII(热稳定肠毒素2);来自芽孢杆菌的内切木聚糖酶;PhoA(碱性磷酸酶);OmpF(外膜蛋白F);PhoE(外膜孔蛋白E);MalE(麦芽糖结合蛋白);OmpC(外膜蛋白C);Lpp(胞壁质脂蛋白);LamB(λ受体蛋白);OmpT(蛋白酶VII);LTB(热不稳定肠毒素亚单位B);以及HylA(a-溶血素)。

167.根据实施方案161所述的方法,其中所述细菌分泌信号包含选自由以下组成的群组中的细菌分泌信号:根据SEQ ID NO.11至SEQ ID NO.23的氨基酸序列。

168.一种真核样信使核糖核酸分子(Euk-mRNA),所述Euk-mRNA被配置为为在供体原核生物中表达,所述供体原核生物能够在受体真核生物中翻译,其中所述Euk-mRNA包含:

至少一个形成核糖体调节控制区的非翻译区(UTR),所述至少一个UTR被配置为促进真核核糖体聚集;

至少一个能在真核生物中被翻译的蛋白编码区;

Kozak共有序列;

聚腺苷酸化(poly-A)区域;

稳定区,所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交序列,所述至少两个可杂交序列进一步被配置为形成Euk-mRNA发夹环结构;并且

并且其中任何原核生物核糖体结合位点已被去除。

169.根据实施方案168所述的Euk-mRNA,其中所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交序列,所述至少两个可杂交序列进一步被配置为形成发夹环包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交GC富集序列,所述至少两个可杂交GC富集序列进一步被配置为形成发夹Euk-mRNA环结构。

170.根据实施方案169所述的Euk-mRNA,其中所述Euk-mRNA环结构被配置为稳定所述Euk-mRNA,防止所述Euk-mRNA的简并,提高所述Euk-mRNA的运输效率,并且不干扰所述Euk-mRNA的真核生物核糖体结合和真核翻译。

171.根据实施方案170所述的Euk-mRNA,其中所述Euk-mRNA环结构被配置为促进所述受体真核生物的翻译。

172.一种真核样信使核糖核酸分子(Euk-mRNA),所述Euk-mRNA被配置为为在供体原核生物中表达,所述供体原核生物能够在受体真核生物中翻译,其中所述Euk-mRNA包含:

足以在受体原核生物中翻译靶蛋白的真核调节和编码区;和

稳定区,所述稳定区包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交序列,所述至少两个可杂交序列进一步被配置为形成Euk-mRNA发夹环结构。

173.根据实施方案172所述的Euk-mRNA,其中所述稳定区域包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交序列,所述至少两个可杂交序列进一步被配置为发夹环包含分别定位在所述Euk-mRNA的5’端和3’端的至少两个可杂交GC富集序列,所述至少两个可杂交GC富集序列进一步被配置为发夹Euk-mRNA环结构。

174.根据实施方案173所述的Euk-mRNA,其中所述Euk-mRNA环结构被配置为稳定所述Euk-mRNA,防止所述Euk-mRNA的简并,提高所述Euk-mRNA的运输效率,并且不干扰所述Euk-mRNA的真核生物核糖体结合和真核翻译。

175.根据实施方案173所述Euk-mRNA,其中所述Euk-mRNA环结构被配置为促进所述受体真核生物的翻译。

176.一种根据SEQ ID NO.1至SEQ ID NO.10的核苷酸序列,其中所述序列中的所述蛋白编码区被感兴趣的靶蛋白取代。

177.一种根据实施方案176所述的核苷酸序列,其中所述感兴趣的靶蛋白是CRISPR相关内切核酸酶。

178.一种根据实施方案177所述的核苷酸序列,其中所述CRISPR相关内切核酸酶是Cas9或Cas3。

179.一种根据权利要求178所述核苷酸序列,进一步包含编码至少一种引导RNA(gRNA)的核苷酸序列。

180.一种包含根据实施方案179所述核苷酸序列的表达载体。

181.一种用根据实施方案181所述表达载体转化的细菌。

附图说明

本专利的文件中至少有一张彩色附图/照片。本专利具有彩色附图/照片的副本将应要求并支付必要的费用后由审查局提供。

图1A-E显示了编码线性真核样RNA的细菌核苷酸表达构建体的示意图,该构建体包括示例性内部核糖体进入位点(IRES)和不依赖帽翻译元件(CITE)。(A-E)真核RNA构建体设计的示意图,用于验证内部核糖体进入位点(IRES)序列的能力:crTMV、NtHSF、TuMV、TEV和不依赖帽翻译元件(CITE)序列SNTV,以聚集真核核糖体并促进细胞定位的信号肽标记的2xGFP11构建体的翻译——在这种情况下,c-Myc标签用于核定位。植物细胞中的转录是在35S CaMV启动子的控制下进行的。在IRES构建体和SNTV CITE序列中的3’UTR调节区域的下游存在的情况下一个poly-A尾巴(50nt)在翻译STOP后包括在这个特定的设计中。转录将导致线性RNA分子的形成。

图2A-J显示了另外的细菌核苷酸表达构建体的示意图,该构建体编码线性真核样RNA,该线性真核样RNA包括示例性内部核糖体进入位点(IRES)和不依赖帽翻译元件(CITE),以及编码5’-UTR IRES和CITE UTR序列上游的富含CG的短序列的核苷酸序列。(A-J)发夹真核RNA构建体的示意图。细菌表达载体和植物表达载体都进行了测试。植物表达的构建体由35S CaMV启动子驱动,而细菌表达的构建体由Ptac启动子驱动。图1中提出的线性构建体设计的重要区别是包括一个非编码的5’-序列标签,该标签与终端3’——UTR序列(黄色框)同源。转录后,这两个序列标签将杂交产生一个发夹样真核RNA。线性版构建体的所有其他元素保持不变,包括内部核糖体进入位点(IRES)序列:crTMV、NtHSF、TuMV、TEV和不依赖帽翻译元件(CITE)序列SNTV。编码区的真核翻译将生产用信号肽标记的2xGFP11构建体,以用于细胞定位。在IRES构建体和在SNTV CITE序列中存在的3’UTR调节区域下游的情况下,一个poly-A尾部(50nt)在翻译STOP之后包括在这个特定的设计中。如上所述,3’UTR的末端部分将由命名的3’-配对端(PE)末端双链体组成。

图3显示了两个示例性发夹构建体的预测RNA折叠。代表的是crTMV:NLS:2xGFP11和TEV:NLS:2xGFP11。高亮显示的是负责发夹构型的成对端末端双链体,内部核糖体进入位点(IRES)——RNA二级结构,其将eIF4G聚集到RNA上,然后进行核糖体组装,翻译起始位点和poly-A拉伸,RNA折叠用RNAfold网络服务器执行,颜色梯度代表配对概率。

图4A-B(A)鉴定在宿主细菌中存在的IRES:NLS:2xGFP11编码的Euk-mRNA(示出的大肠杆菌HT115和阴沟肠杆菌菌株Ae003 Arne);和(B)在HT115细菌的分离的外膜囊泡(OMV)中存在编码序列。在OMV中鉴定出TuMV和NtHSF:NLS:2xGFP 11Euk-mRNA的存在表明分泌RNA供植物细胞吸收。

图5.验证5’UTR内部核糖体进入位点(IRES)和3’UTR不依赖帽翻译元件(CITE)在真核细胞中驱动GFP11 mRNA翻译。将构建体与编码NLS:GFP1-10(NLS核定位信号)的对照构建体共同浸润在本氏烟(N.benthamiana)叶中。NLS-GFP1 1——具有植物核糖体结合位点的对照构建体;IRES——GFP1 1构建体,具有病毒IRES序列(TEV、crTMV、TuMV)和植物IRES(NtHSF),以及病毒3’CITE序列(SNTV)驱动示例性蛋白GFP1 1的翻译。GFP1 1与GFP 1-10蛋白的关联重组了全长GFP蛋白和荧光发射。在所有测试的样品中观察到GFP阳性核,表明构建体设计驱动GFP 11在真核细胞中的翻译。用GV3101浸润叶并用2dpi.x20放大倍率分析。

图6验证TEV 5’UTR内部核糖体进入位点在真核细胞中驱动GFP 11mRNA翻译。线性和发夹版本的TEV:NLS:2xGFP1 1编码RNA都进行了测试。将构建体与编码NLS:GFP1-10(NLS-核定位信号)的对照构建体共同浸润在本氏烟叶中。LIBQ:NLS:GFP1 1——由泛素lO启动子驱动的带有植物核糖体结合位点的对照构建体。GFP11与GFP1-10蛋白的关联重组了分裂的GFP(splitGFP),并导致GFP特异性荧光发射。在测试的两个TEV构建体版本中观察到GFP阳性核,表明利用TEV进行核糖体聚集的构建体设计成功地驱动NLS:2xGFP11在真核细胞中的翻译。将所有构建体转化为根癌农杆菌GV3101并浸润到本氏烟叶中,并用2dpi.X20放大倍率分析。

图7验证发夹Euk-mRNA的5’UTR内部核糖体进入位点(IRES)在植物细胞中驱动GFP1 1mRNA翻译的设计。构建体在本氏烟叶中与编码GFP互补半数的构建体共同浸润;NLS:GFP1-10(NLS——核定位信号)。UBQ:NLS:GFP11——由泛素lO启动子驱动的带有植物核糖体结合位点的阳性对照构建体。发夹IRES:NLS:2xGFP11构建体(见图2),由35S CaMV启动子驱动表达,具有病毒IRES序列TuMV和植物IRES NtHSF以驱动NLS:2xGFP1 1的翻译。GFP11与GFP1-10蛋白的关联重组了分裂的GFP蛋白(split-GFP)并导致荧光发射。在所有测试的样品中观察到GFP阳性核,表明构建体发夹设计驱动NLS:2xGFP11在真核细胞中的翻译。在没有GFP1-10(阴性对照)的情况下,用NtHSF:NLS:2xGFP 11浸润的叶中没有检测到荧光。将所有构建体都转化为根癌农杆菌GV3101并浸润到本氏烟叶中,并用2dpi.X20放大倍率分析。

图8(A)鉴定用UBQ:NLS:GFP11:mCherry阳性对照转化的GV3101浸润的本氏烟(Abenthamiana)组织中的GFP1 1和GFP1-10肽);35S:2xGFP11构建体与植物5’UTR和发夹形成TEV:NLS:2xGFP11构建体(另见图6)。继GFP阳性核用辐射荧光显微镜术鉴定后,我们对TEV:NLS:2xGFP11叶蛋白提取物中NLS:2xGFP11肽的存在进行了进一步验证。对应于GFP11 aa序列的独特的肽确定在所有测试的样品中,这着重强调了我们的发夹IRE设计在真核细胞中驱动RNA翻译的能力。(B)质谱数据显示GFP11在瞬态植物蛋白提取物中的标准化丰度。

图9在植物原位验证RNA从细菌到植物细胞的贩运和植物细胞的蛋白翻译。表达GFP1-10的转基因拟南芥植物接种表达TEV:NLS:2xGFP11发夹的大肠杆菌HT115和/或阴沟肠杆菌Ae003 mCherry和Δrnc菌株。GFP阳性核的鉴定(亮绿色斑点)表明通过植物表达的GFP1-10蛋白和由细菌转录的发夹TEV:NLS:2xGFP11mRNA编码的NLS:2xGFP11多肽之间的相互作用,重组分裂GFP蛋白,并通过外膜囊泡贩运转移到植物细胞中。将幼嫩的GFP1-10拟南芥幼苗与细菌共同培养1小时,洗净根部,将幼苗置于MS板中。接种后2-3天进行根部可视化。X20放大倍数。

图10A-B确认大肠杆菌HT115菌株中真核-mRNA的转录和辅助蛋白的细菌翻译。这些菌系随后被用于根部接种,以测试辅助蛋白对真核生物样编码RNA从细菌转移到植物的影响。A)Western印迹易识别HA标记的OmpA:DRB4和OmpA:PP2-Al。B)RT-PCR演示预期大小的Euk-mRNA的转录——值得注意的是在每个反应中使用的正向PCR引物对目标构建体是特异性的,因为它在IRES序列退火。

图11辅助蛋白改善真核样RNA向植物细胞的递送。拟南芥根在发芽后3-5天接种大肠杆菌HT115菌株,该菌株用TEV:NLS:2xGFP11编码区转化,用或不用OmpA:3xHA:DRB4和OmpA:3xHA:PP2-A1 RNA结合蛋白共表达和细菌翻译。(A)定义的每一类的代表根尖,以分类真核样RNA的跨界转移到植物细胞的效率。对分析的每个根的GFP阳性核进行计数,并按定义的类别归类。把分析的所有基因型和构建体的数据编入表1。(B)提出了每个处理的代表根尖,并说明如果真核样RNA转移到植物细胞中是由RNA结合蛋白DRB4和PP2-A1所引导的,则GFP阳性核的数量增加。定量数据也见表1。注意对照根尖(Col-0)与来自转基因植物的根之间的标记差异。

图12显示了其一个实施方案中瞬时Euk-mRNA CRISPR/Cas9介导的瞬时基因编辑构建体的示意图。

图13显示了将Cas3、Cas9和TALEN酶的细菌表达并入目标真核细胞中进行导出和翻译的构建体设计的示意图。示意图表示发夹版本,但线性RNA版本可以通过去除5’或3’配对端(PE)终端双双链体序列来实现。Cas3和Cas9构建体也可以与另外的转录单元相关联,这些转录单元编码非编码导引RNA以将Cas蛋白引导到所需的真核宿主细胞gDNA靶区。

图14A-H显示了构建体设计的示意图,该构建体设计并入了与示例性细菌分泌信号偶联的辅助基因DRB4和PP2-A1,该信号可在其一个实施方案中与Euk-mRNA共表达。

具体实施方式

提供以下详细描述以帮助本领域的技术人员实践本公开的各种实施方案,包括本文所述的所有方法、用途、组合物等。即便如此,以下详细描述不应解释为不适当地限制本公开,因为本领域普通技术人员可以在不偏离本发现的精神或范围的情况下对本文讨论的实施方案进行修改和变化。

本发明技术可包括在体外,或更优选地在体内系统中生成新型真核或真核样mRNA。在一个实施方案中,真核样mRNA可以包括任何能够由原核生物体合成并在真核细胞或系统中翻译的mRNA分子。在一个优选的实施方案上,本发明可包括可适用于许多基因靶的真核样mRNA的通用模板。在这个实施方案中,真核样mRNA的模板可以从原核生物体的模板核酸合成。在一个优选的实施方案中,模板真核样mRNA可在供体菌中表达,该供体菌可定植受体真核宿主,可包括调节区(IRES、CITE、poly-A)和编码区的组合。在一个优选的实施方案中,模板真核样mRNA可在供体菌中表达,该供体菌可定植受体真核宿主,可包括以下一种或多种修饰:1)去除细菌SD或核糖体结合位点(RBS)(一般位于AUG起始位点上游8bp处),以损害mRNA在细菌70S核糖体上的负载及其随后的翻译;2a)添加至少一个5’内部核糖体结合位点(IRES),其可允许聚集翻译起始因子诸如elF蛋白,以及在受体真核细胞中与80S核糖体组装;2b)替代实施方案包括添加“不依赖帽翻译元件”(CITE)序列。CITE由5’和3’UTR结构的RNA序列组成,该序列允许编码RNA两端之间的相互作用复制Poly-A结合蛋白(PABP)和翻译起始因子(eIF4G)之间的相互作用效果;3)去除原核生物糖体结合位点;4)在编码区末端增加一个Poly-A尾巴,以促进PABP结合,保护RNA分子不被简并;5)mRNA稳定区,在一个优选的实施方案中,该mRNA稳定区可包括5’和5’区的可杂交区,该区可形成发夹环RNA结构,该结构稳定并防止真核样mRNA的简并,从而改善从原核生物向受体真核细胞的递送。在一个实施方案中,该mRNA稳定区可以在5’UTR IRES和CITE UTR序列的上游形成CG富集序列。该CG富集序列可与其在构建体编码序列的3’UTR末端编码的反平行序列配对,以形成发夹环RNA,本文有时称为发夹Euk-mRNA环结构。该结构可稳定Euk-mRNA分子,防止简并,并且不干扰核糖体结合和真核翻译(参见图3)和具有感兴趣的靶蛋白序列的编码区。

另外的实施方案可以包括具有以下一种或多种另外修饰的真核样RNA分子:1)在真核mRNA的5’端添加一个7G 5’CAP。该CAP可允许elF蛋白的聚集,以及在受体真核细胞中与80S核糖体的组装;2)在真核mRNA的3’UTR中添加聚腺苷酸化识别序列,以稳定真核生物中的mRNA;以及3)添加Kozak序列,以在受体宿主中提供翻译起始位点。

在一个优选的实施方案中,可以通过合成缺乏该元件的基因来去除目标mRNA的5’UTR的SD序列或RBS。类似地,可以合成一个或多个包括Kozak序列或其他识别序列的基因,从而生产一个含有翻译起始位点的真核样mRNA,以促进在真核宿主中的翻译。

关于5’CAP的添加,如图1-2所示,在一个优选的实施方案中,靶向真核样mRNA可以被工程化以在mRNA的5’ETTR中并入一个通用的内部核糖体进入位点(IRES)。在这种配置中,靶向mRNA可以绕过一般理解的5’CAP的要求,以实现真核宿主/系统中mRNA的翻译。在真核mRNA的5’UTR中编码IRES序列可进一步促进真核细胞中的翻译。一些可驱动不依赖帽翻译的IRES序列可包括但不限于:烟草花叶病毒IRES(crTMV);烟草蚀刻病毒IRES(TEV);芜菁花叶壶病毒IRES(TuMV);烟草热休克蛋白IRES(NtHSF);和烟草坏死卫星病毒(SNTV)CITE;以及人工IRES或CITE序列。

本发明还可包括筛选可在真核样mRNA中表达的适当功能调节器序列的方法、系统和组合。在这个实施方案中,本文确定的一个或多个调控序列可被并入绿色荧光蛋白(GFP)外显子编码的mRNA中,该外显子编码的mRNA可进一步包括聚腺苷酸化识别信号。在这种配置中,本发明可作为一种快速筛选系统,用于从供体原核生物(诸如细菌)中递送可在宿主生物体中翻译的真核样mRNA。例如,在该系统中,荧光供体-细菌可以表明真核样mRNA的翻译也在细菌中发生。如下文所述,在受体细胞中而不是在细菌中鉴定荧光,可以表明真核样mRNA已经被递送到宿主中,并且它能够作为真核核糖体的模板。在该系统中,GFP可以进一步用定位信号(例如SV40或用于核定位的Myc-tag)标记,以便于通过显微镜术、细胞分选等方式对真核翻译进行筛选和验证。

本发明的另一个实施方案可包括用于将工程化的真核样mRNA从供体原核生物(在此例中为细菌)稳定移动到真核宿主(诸如植物或动物细胞)的系统、方法和组合物。这种稳定移动可以包括供体内的囊泡贩运机制。在这个优选的实施方案中,真核样mRNA可包括配对末端翻译能力构建体(ptRNA),通过5’端和3’端区域的配对稳定,并包括用于核糖体聚集和聚腺苷酸化识别信号的IRES序列。在该实施方案中,IRES序列可促进核糖体聚集到工程基因构建体上,并允许在受体真核宿主中进行翻译。如上所述,使用GFP编码序列可以通过荧光检测快速筛选和/或验证各种真核样mRNA构建体设计;从供体菌成功导出ptGFP RNA,由受体细胞吸收,随后核糖体聚集和翻译,从而导致荧光受体细胞。

本发明可包括示例性线性Euk-mRNA超表达构建体。图1A-E显示了用于验证各种内部核糖体进入位点(IRES)序列:crTMV、NtHSF、TuMV、TEV和不依赖帽翻译元件(CITE)序列SNTV的能力的真核mRNA构建体设计的示意图,以聚集真核核糖体并促进被信号肽(N-tyerminal c-Myc标签)标记的2xGFP11构建体的核定位翻译。植物细胞中的瞬态转录可能是在35S CaMV启动子的控制下进行的。在IRES构建体和SNTV CITE序列中的3’UTR调节区域的下游存在的情况下,一个poly-A尾巴(50nt)在翻译STOP后包括在这个特定的设计中。值得注意的是,如上所述,针对这种示例性构建体的这种核苷酸序列的转录将导致线性RNA分子的形成。

本发明可包括示例性发夹Euk-mRNA超表达构建体。图2A-J显示了示例性发夹真核mRNA-GFP11构建体的示意图。细菌表达和植物表达载体都被使用。植物表达的构建体由35SCaMV启动子驱动,而细菌表达的构建体由Ptac启动子驱动。图1中提出的线性构建体设计的重要区别是包括一个非编码的5’-序列标签,该标签与终端3’——UTR序列(黄色框)同源。这两个序列标签将在转录后杂交产生一个发夹样真核mRNA。线性版构建体的所有其他元素也存在,并且包括内部核糖体进入位点(IRES)序列:crTMV、NtHSF、TuMV、TEV和不依赖帽翻译元件(CITE)序列SNTV。编码区的真核翻译可生产用信号肽标记d 2xGFP11构建体,以用于核定位(N-tyerminal c-Myc标签)。在IRES构建体和SNTV CITE序列中的3’UTR调节区域的下游存在的情况下,一个poly-A尾巴(50nt)在翻译STOP后包括在这些示例性构建体中。值得注意的是,如上所述,针对这些示例性构建体的此类核苷酸序列的转录将导致线性RNA分子的形成。更具体地说,在本实施方案中,该CG富集序列可与其在构建体编码序列的3’UTR末端编码的反平行序列配对,从而形成发夹环RNA。这种结构可以稳定RNA分子而不干扰核糖体结合和真核翻译(见图3)。

如图5一般所示,验证在真核细胞中驱动GFP11 mRNA翻译的5’UTR内部核糖体进入位点(IRES)和3’UTR不依赖帽翻译元件(CITE)。构建体被共同浸润在本氏烟叶中。分裂的GFP的一半由NLS:GFP1-10(NLS——核定位信号)编码。UBQ:NLS:GFP11——构建体编码由泛素lO启动子驱动的带有植物核糖体结合位点的分裂GFP的互补部分(GFP11)。其他构建体包括:1)线性IRES:NLS:2xGFP11构建体(见图1),其表达由35S CaMV启动子驱动,并含有病毒IRES序列(crTMV、TuMV);以及2)植物IRES(NtHSF)和病毒3’CITE序列(SNTV)驱动NLS:2xGFP11的翻译。GFP1 1与GFP1-10蛋白的关联重组了功能性GFP蛋白(splitGFP)的荧光发射。在所有测试的样品中观察到GFP阳性核,表明构建体设计驱动NLS:2xGFP11在真核细胞中的翻译,如图中一般所示。所有构建体都转化为根癌农杆菌GV3101并浸润到本氏烟叶中。

本发明可进一步包括用于将真核样mRNA从供体原核生物体有效递送至受体真核生物体的系统、方法和组合物。在一个优选的实施方案中,本发明可包括在细菌中表达用分泌肽标记的RNA结合蛋白——例如N-末端OmpA或C-末端HylA——其可帮助mRNA通过膜囊泡分泌,并最终促进受体真核细胞对mRNA的摄取。自然,也可以使用另外的分泌信号。优选地,信号序列为STII、OmpA、PhoE、LamB、MBP、PhoA或HylA等。在该优选的实施方案中,由OmpA或HylA标记的辅助蛋白的RNA结合可发生在供体菌细胞内,形成能胜任细菌分泌的核糖核蛋白复合物(RNP)。另外的实施方案可进一步被属性地工程化到供体菌生物体中,以帮助在细菌细胞内组装RNP复合物。例如,在一个实施方案中,这可以包括共表达融合到RNA系带域的eIF4G,并在mRNA构建体中插入RNA识别序列而不是IRES基序。在该实施方案中,一旦在工程化的eIF4G和编码mRNA之间形成RNP,RNP复合物移动到真核细胞中,在真核细胞核糖体通过与eIF4G的相互作用被聚集。该实施方案可允许从供体菌中选择性地导出仅感兴趣的真核样mRNA,并在被真核细胞摄取后直接聚集核糖体。另外的分泌信号可以包括Tat分泌信号。

在另一个实施方案中,并且在ptRNA构建体的情况下,RNP可以在OmpA标记的dsRNA结合蛋白(例如DRB4)和合成ptRNA的dsRNA区之间形成。将RNP导出到真核细胞诸如植物细胞和核糖体结合到IRES可以导致目标编码蛋白的翻译。构建体设计不限于本文所述的实施方案,并且可以被修改以结合不同的RNA系带序列和IRES基序,从而允许在真核系统中以不同的方法进行RNP组装和不依赖帽翻译启动。

在另一个实施方案中,异源RNA结合辅助蛋白的共表达增加Euk-mRNA从原核生物到真核细胞的跨界运输效率。如下文所详述,一种或多种异源辅助蛋白可在供体原核生物中共表达,以促进Euk-mRNA向受体真核细胞的跨界运输。这样的异源辅助基因核苷酸序列可以与启动子,优选与诱导型启动子可操作地连接,并且可以在供体原核生物(诸如细菌)中与一个或多个Euk-mRNA共表达。在一个实施方案中,异源辅助基因可以包括异源辅助基因,该异源辅助基因可以编码来自拟南芥的RNA结合辅助蛋白,DRB4(dsRNA结合蛋白2)和/或PP2-A1(韧皮蛋白2-A1),它们可以在从供体原核生物到受体真核细胞的跨界递送期间作为伴侣蛋白。这样的RNA结合辅助蛋白可以进一步包括细菌分泌肽(例如OmpA、HylA),并克隆到编码各种IRES/CITE构建体的主链中,如图1-2中一般所示。这种辅助基因/蛋白的转录可以由独立可操作的启动子驱动。

本发明技术可以包括生成瞬态基因编辑系统。在一个优选的实施方案中,本发明可以包括瞬态CRISPR/CAS9介导的基因组编辑系统。在这个优选的实施方案中,本发明技术可包括使用可以在受体真核宿主中生活并定殖的供体原核生物体(诸如共生菌、内寄生菌和/或益生菌)的稳定CRISPR/Cas9介导的瞬态转化系统的系统、方法和组合物。在此优选的实施方案中,供体原核生物体可被工程化以合成可在真核宿主中翻译的真核样mRNA,如本文一般所述。这里,供体原核生物可以被工程化以合成和/或将编码CRISPR/Cas9酶以及引导RNA(gRNA)序列的真核样mRNA引入到真核宿主中。在该实施方案中,基因工程化的供体原核生物可促进生产CRISPR/Cas9系统的真核样mRNA加上可直接在宿主上实现基因组编辑的gRNA序列。例如,在一个实施方案上,供体原核生物可被工程化以合成和/或递送真核样mRNA,诸如Cas9蛋白和靶向gRNA,用于CRISPR/Cas9介导的基因编辑,该基因编辑可进一步在诱导型启动子的控制下进行。

在这种情况下,基因编辑CRISPR/Cas9技术一般涵盖一种RNA引导的基因编辑平台,该平台利用细菌衍生的蛋白(Cas9)和合成的gRNA在真核宿主基因组内的特定位置引入双链断裂。一般来说,CRISPR/Cas9可用于通过共表达待靶基因特异性的gRNA和内切核酸酶Cas9来产生敲除或破坏靶基因。具体参照图12,CRISPR可由两个组分组成:gRNA和非特异性CRISPR相关内切核酸酶(Cas9)。gRNA可以是一种短的合成RNA,由可允许Cas9结合的支架序列和定义要修饰的基因组靶标的约20个核苷酸间隔或靶标序列组成。在图12所示的一个优选实施方案中,供体原核生物体诸如细菌可以被基因修饰,以生产一个或多个gRNA,这些gRNA靶向真核靶基因的遗传序列,并输出到受体真核宿主细胞,例如通过OMV。在该实施方案中,该经基因修饰的细菌还可以合成一种或多种真核样mRNA,这些mRNA可以被引入宿主或受体真核细胞并翻译成Cas9内切核酸酶。如下图所示,编码Cas9内切核酸酶的gRNA和真核样mRNA可在宿主细胞中启动瞬态基因组编辑功能。

在本实施方案中,供体原核生物体(诸如细菌,优选共生菌、内寄生菌或益生菌)可通过基因修饰以生产Cas9蛋白的真核样mRNA以及特别设计的引导RNA(gRNA),该引导RNA通过与其匹配的基因组序列杂交引导靶DNA切割。在该实施方案中,可以在供体真核宿主中的一个或多个靶基因中瞬态引入特定的遗传改变。在一些实施方案中,可以利用这种瞬态CRISPR/Cas-9系统来用修饰的版本取代一个或多个现有的野生型基因,而另外的实施方案可以包括添加改变、减少、增加或敲除靶基因表达的遗传元件。在该实施方案中,靶基因可以包括但不限于内源基因、转基因或甚至真核病原体基因。

本发明技术可以包括非CRISPR瞬态基因编辑系统的生成。在一个优选的实施方案中,本发明可包括瞬态锌指,或锌指核酸酶介导的基因组编辑系统。本文所用的术语“锌指”指的是一种小的核酸结合蛋白结构基序,其特征在于折叠和一个或多个稳定折叠的锌离子的配合。锌指涵盖多种不同的蛋白结构(参见,例如,Klug A,Rhodes D(1987).“Zincfingers:a novel protein fold for nucleic acid recognition”.Cold SpringHarb.Symp.Quant.Biol.52:473-82,其全部内容通过引用并入本文)。

锌指可以被设计成结合特定的核苷酸序列,并且包含一系列锌指的融合体的锌指阵列可以被设计成结合几乎任何所需的靶序列。这样的锌指阵列可以形成蛋白的结合域,例如,核酸酶的结合域,例如,如果与核酸裂解域结合。本领域技术人员已知不同类型的锌指基序,包括但不限于Cys2His2、Gag knuckle、Treble clef、Zinc ribbon、Zn2/Cys6和TAZ2域样基序(参见,例如,Krishna S S,Majumdar I,Grishin N V(2003年1月)。“Structural classification of zinc fingers:survey and summary”.Nucleic AcidsRes.31(2):532-50)。

通常,单个锌指基序结合核酸分子的3或4个核苷酸。因此,包含2个锌指基序的锌指域可结合6-8个核苷酸,包含3个锌指基序的锌指域可结合9-12个核苷酸,包含4个锌指基序的锌指域可结合12-16个核苷酸,等等。可以采用任何合适的蛋白工程技术来改变锌指的DNA结合特异性和/或设计新的锌指融合体,以结合长度为3-30个核苷酸的几乎任何所需的靶序列(参见,例如,Pabo C O,Peisach E,Grant RA(2001).“Design and selection ofnovel cys2H is2 Zinc finger proteins”.Annual Review of Biochemistry 70:313-340;Jamieson A C,Miller J C,Pabo C O(2003)。“Drug discovery with engineeredzinc-finger proteins”.Nature Reviews Drug Discovery2(5):361-368;and Liu Q,Segal D J,Ghiara J B,Barbas C F(May 1997)。“Design of polydactyl zinc-fingerproteins for unique addressing within complex genomes”.Proc.Natl.Acad.Sci.U.S.A.94(11);其中每项内容的全部内容通过引用并入本文)。

工程化的锌指阵列与裂解核酸的蛋白域之间的融合可用于生成“锌指核酸酶”。锌指核酸酶通常包含结合核酸分子内特定靶位点的锌指域和在结合域结合的靶位点内或附近切割核酸分子的核酸裂解域。典型的工程化锌指核酸酶包含具有3至6个独立锌指基序的结合域和长度为9个碱基对至18个碱基对的结合靶位点。在希望结合和裂解在给定基因组中唯一的靶位点的情况下,较长的靶位点特别有吸引力。

因此,在一个优选的实施方案中,可以用核酸构建体对原核供体(诸如细菌)进行基因修饰,该核酸构建体可以生成可在供体菌中合成并随后引入到真核宿主或受体中的真核样mRNA,在该宿主或受体中可以被翻译成指向靶基因的锌指核酸酶。锌指核酸酶可以通过本领域技术人员熟知的方法生成以靶向感兴趣的位点。例如,可以通过组合已知特异性的单个锌指基序来设计具有所需特异性的锌指结合域。与DNA结合的锌指蛋白Zif268的结构已经为本领域的许多工作提供了信息,并且已经描述了获得64个可能的碱基对三对中的每一个的锌指,然后混合和匹配这些模块化锌指以设计具有任何所需序列特异性的蛋白的概念(Pavletich NP,Pabo Colo.(1991年5月).“Zinc finger-DNA recognition:crystalstructure of a Zif268-DNA complex at 2.1A”.Science 252(5007):809-17,其全部内容并入本文)。

在一些实施方案中,可以生成单独的锌指,每个识别3个碱基对的DNA序列的锌指被组合起来以生成3、4、5或6指阵列,这些阵列识别长度从9个碱基对到18个碱基对的靶位点。在一些实施方案中,考虑了更长的阵列。在其他实施方案中,将识别6-8个核苷酸的2指模块组合起来以生成4、6或8锌指阵列。在一些实施方案中,采用细菌或噬菌体显示来开发识别所需核酸序列的锌指域,例如,长度为3-30bp的所需核酸酶靶位点。

如上所述,在一些实施方案中,锌指核酸酶可以包含锌指结合域和裂解域,通过接头(例如多肽间隔体)相互融合或以其他方式结合。接头的长度决定了锌指域所结合的核酸序列的切割距离。如果使用较短的接头,裂解域将切割更接近结合的核酸序列的核酸,而较长的接头将导致切割与结合的核酸序列之间的距离更大。在一些实施方案中,锌指核酸酶的裂解域必须二聚化才能切割结合的核酸。在一些这样的实施方案中,二聚体是两个单体的杂聚体,每个单体都包含不同的锌指结合域。例如,在一些实施方案中,二聚体可以包含一个包含与Fokl裂解域共轭的锌指域A的单体,以及一个包含与Fokl裂解域共轭的锌指域B的单体。在这个非限制性的示例中,锌指域A结合靶位点一侧的核酸序列,锌指域B结合靶位点另一侧的核酸序列,二聚体化Fokl域在锌指域结合位点之间切割核酸。

本发明技术可包括生成瞬态TALEN基因编辑系统。本文所用的术语TALEN或“转录激活剂样元件核酸酶”或“TALE核酸酶”是指包含转录激活剂样效应子DNA结合域与DNA裂解域(例如Fokl域)的人工核酸酶。已经报道了许多用于生成工程化TALE构建体的模块化组装方案(Zhang,Feng等人,2011年2月)。(“Efficient construction of sequence-specificTAL effectors for modulating mammalian transcription”.Nature Biotechnology 29(2):149-53;Geibler,R.;Scholze,H.;Hahn,S.;Streubel,J.;Bonas,U.;Behrens,S.E.;Boch,J.(2011),Shiu,Shin-Han.编辑“Transcriptional Activators of Human Geneswith Programmable DNA-Specificity”.PLoS ONE 6(5):el9509;Cermak,T.;Doyle,E.L.;Christian,M.;Wang,L.;Zhang,Y.;Schmidt,C.;Baller,J.A.;Somia,N.V等人(2011).“Efficient design and assembly of custom TALEN and other TAL effector-basedconstructs for DNA targeting”.Nucleic Acids Research;Morbitzer,R.;Elsaesser,J.;Hausner,J.;Lahaye,T.(2011).“Assembly of custom TALE-type DNA bindingdomains by modular cloning”.Nucleic Acids Research;Li,T.;Huang,S.;Zhao,X.;Wright,D.A.;Carpenter,S.;Spalding,M.H.;Weeks,D.P.;Yang,B.(2011).“Modularlyassembled designer TAL effector nucleases for targeted gene knockout and genereplacement in eukaryotes”.Nucleic Acids Research.;Weber,E.;Gruetzner,R.;Werner,S.;Engler,C.;Marillonnet,S.(2011).Bendahmane,Mohammed.编辑“Assembly ofDesigner TAL Effectors by Golden Gate Cloning”.PLoS ONE 6(5):e19722;其中每一个都通过引用并入本文)。

本领域的技术人员将理解,TALE核酸酶可以被工程化以高特异性地靶向几乎任何基因组序列,并且这种工程化的核酸酶可以在本技术的实施方案中用于操纵细胞的基因组,例如,通过本文公开的方法或策略,在适合TALEN在细胞的基因组内结合和切割其靶序列的情况下递送各自的TALEN。在一些实施方案中,递送的TALEN靶向与疾病或失调或生物过程相关的基因或等位基因,或一个或多个靶基因。在一些实施方案中,将TALEN递送至受试者赋予受试者治疗益处,诸如减少、改善或消除患者的疾病状况。

在本实施方案中,供体原核生物体诸如细菌可被基因修饰以生产被配置为影响真核宿主中靶基因上的基因编辑功能的真核样TALE核酸酶。在该实施方案中,可以瞬态引入供体真核宿主中的一个或多个靶基因的特定遗传改变。在一些实施方案中,可以利用这种瞬态TALEN系统用修饰的版本取代一个或多个现有的野生型基因,而另外的实施方案可以包括添加改变、减少、增加或敲除靶基因表达的遗传元件。在该实施方案中,靶基因可以包括但不限于内源基因、转基因或甚至真核病原体基因。

在一些实施方案中,细胞、组织、器官或生物体的靶基因通过本文公开的策略或方法,例如CRISPR/cas-9、TALEN或锌指核酸酶或多个此类核酸酶或此类核酸酶的组合递送到细胞中的核酸酶而改变。在一些实施方案中,核酸酶在基因组内的特定位点引入单链或双链断裂,导致靶基因组序列的破坏。

本发明技术可包括生成一种可用于治疗真核生物体,特别是人类或植物的疾病状况的瞬态基因编辑系统。在本实施方案中,可以在原核细菌中生成和合成一种真核样mRNA。在本实施方案中,原核细菌可以包括自然定植于人类患者或植物的细菌,诸如在患者或植物的正常微生物组中自然发现的细菌。示例可以包括各种共生菌、内共生菌、益生菌和/或肠道菌以及内寄生菌菌株。在此优选的实施方案中,可向患者或植物施用治疗有效量的供体原核细菌。这些供体原核细菌可合成真核样mRNA,其可被引入宿主患者或植物,在那里它们被翻译成靶蛋白。如上所述,这种真核样mRNA可以编码一种或多种靶蛋白,该靶蛋白提供代谢优势,或纠正人类患者/植物的代谢缺陷,和/或执行基因编辑功能。更广泛地,这种真核样mRNA可以编码改善或治疗疾病状况的靶蛋白。例如,在某些实施方案中,真核样mRNA可以在宿主中翻译,以生成基于蛋白的疫苗或其他预防性疾病预防剂。在其他实施方案中,本发明可包括本文一般描述的人类瞬态基因编辑系统。在某些实施方案中,真核样mRNA可在宿主中翻译以在宿主中生成表型、生化或代谢变化。这种变化一般可与疾病状况的改善相关联。

上述系统中的每一个都可以体现在遗传构建体中,这些构建体可以包括转录调节元件,诸如启动子、终止子、共激活子和共抑制子以及其他控制元件。这样的系统可以允许控制真核样RNA分子或其他蛋白在系统内表达或运输的类型、时间和数量。本发明的另一个实施方案可包括包含分离的核酸剂的细胞,诸如编码真核样mRNA的表达载体,该载体可在原核细胞中表达。这种表达载体可包括核酸构建体,诸如质粒。本发明可以进一步包括包含分离的核酸剂或核酸添加构建体诸如质粒的细胞。本发明可以进一步包括具有真核样mRNA的细胞,或真核样mRNA的翻译产物。

本发明的一些实施方案,可进一步包括一个或多个“辅助”基因的共表达,这些基因可帮助真核样mRNA的表达、保护或分泌等。本发明的另一个目的可以包括使用自养菌,以及RNase III缺乏的细菌菌株作为核酸剂传播载体。

在某些实施方案中,供体菌可包括一种或多种内寄生菌。植物可在细胞内以及其表面(包括根、叶和茎组织)上藏有许多有益细菌。生活在植物中的内寄生菌和外生菌包括下列亚门中的细菌:酸杆菌门、放线菌门、α-变形菌、装甲菌门、拟杆菌、β变形菌、δ变形菌、后壁菌门、γ-变形菌(Grammaproteobacteria)、TM7、芽孢杆菌和大肠杆菌等。在某些实施方案中,本发明可包括一种或多种具有抑制RNaselll活性的经基因修饰的内寄生菌。具体示例可进一步包括如Sayre等人在PCT/U82017/064977中描述的芽孢杆菌菌CCB422、大肠杆菌HT27或HT115、JC8031,其通过引用并入本文。

真核植物的示例可以包含单子叶植物和双子叶植物。可作为受体真核宿主的示例植物可选自由以下组成的群组:谷物、玉米、小麦、水稻、大麦、燕麦、高粱、小米、向日葵、红花、棉花、大豆、油菜籽、紫花苜蓿、拟南芥、大麻、马铃薯、芸苔、花生、烟草、热带水果和花卉、香蕉、浮萍、剑兰、甘蔗、菠萝、枣、洋葱、菠萝、腰果、开心果、花卉、观赏植物、针叶植物、落叶植物、葡萄、柑橘、玫瑰、苹果、桃子、草莓、杏仁、咖啡、橡树、豆类、豆科植物、西瓜、南瓜、卷心菜、萝卜、芥菜、仙人掌、胡桃、亚麻、红薯、大豆、椰子、牛油果、甜菜、哈密瓜、大麻、麻类和蔬菜。

本发明的某些实施方案包括分离的真核样RNA。本文使用的术语“分离的”、“纯化的”或“生物纯的”指的是这种材料,这种材料基本上或本质上不含通常在其原生状态或材料生产时伴随其的成分。在一个示例性的实施方案中,纯度和均匀性使用分析化学技术诸如聚丙烯酰胺凝胶电泳或高效液相色谱法确定。作为制剂中存在的主要物种的核酸或特定细菌基本上被纯化。在一个示例性实施方案中,术语“纯化”表示在电泳凝胶中产生基本上一个带的核酸或蛋白。典型地,分离的核酸或蛋白具有以范围表示的纯度水平。该组分的纯度范围的下端是约60%、约70%或约80%,纯度范围的上端是约70%、约80%、约90%或超过约90%。

术语“接触”或“引入”至受体或宿主真核生物或细胞,以及关于核酸分子(诸如真核样RNA)术语“与……接触”或被真核生物体“摄取”,包括核酸分子内化到生物体内,例如且不限于:生物体摄取该分子(例如通过进食);使生物体接触用包含核酸分子的组合物;用包含核酸分子的溶液浸泡生物体;用包含核酸分子的组合物注射生物体;以及用包含核酸分子的气溶胶组合物喷洒生物体。这些术语一般涵盖宿主细胞与真核样RNA的任何物理或时间上的接触。

本发明所用的术语“表达”或“编码序列的表达”(例如,基因或转基因)是指核酸转录单元(包括,例如,基因组DNA或cDNA)的编码信息转化为细胞的操作性、非操作性或结构性部分的过程,通常包括蛋白的合成。基因的表达可以受到外部信号的影响;例如,细胞、组织或生物体暴露于增加或减少基因表达的试剂。基因的表达也可以在从DNA到RNA再到蛋白的途径中的任何地方被调节。基因表达的调节例如通过作用于转录、翻译、RNA运输和处理、中间分子诸如mRNA的简并的控制,或通过特定蛋白分子被制造后的激活、失活、分化或简并,或通过其组合而发生。基因表达可以通过技术领域中任何已知的方法在RNA水平或蛋白水平上测量,包括但不限于Northern印迹、RT-PCR、Western印迹或体外、原位或体内蛋白活性测定。

术语“核酸”或“核酸分子“包括单链和双链形式的DNA;单链形式的RNA;和双链形式的RNA(dsRNA)。术语“核苷酸序列”或“核酸序列”是指核酸的有义和反义链,可以是单个单链,也可以是双链。术语“核糖核酸”(RNA)包括iRNA(抑制性RNA)、dsRNA(双链RNA)、siRNA(小干扰RNA)、mRNA(信使RNA)、miRNA(微RNA)、hpRNA(发夹RNA)、tRNA(转移RNA),不管是带电的还是带相应的酰化氨基酸放电的)和cRNA(互补RNA)。术语“脱氧核糖核酸”(DNA)包括cDNA、基因组DNA和DNA-RNA杂交体。

术语“核酸段”和“核苷酸序列段”或更一般的“段”,将被本领域技术人员理解为功能性术语,它既包括基因组序列、核糖体RNA序列、转移RNA序列、信使RNA序列、操作子序列,也包括编码或可适应于编码、肽、多肽或蛋白的较小的工程化核苷酸序列。

术语“原核的”是指包括所有可以用核酸转化或转染并表达本发明的真核样RNA的细菌、古菌和/或蓝藻细菌。原核宿主可以包括革兰氏阴性以及革兰氏阳性细菌。术语“真核的”是指包括酵母、藻类、植物、高等植物、昆虫和哺乳动物细胞。

术语“基因”或“序列”是指与能够以某种方式调节基因产物(例如,多肽或功能性RNA)表达的适当调控序列可操作地连接的编码区。基因包括编码区(开放阅读框,ORF)之前(上游)和之后(下游)的DNA非翻译调控区(例如启动子、增强子、抑制子等),以及(如适用)各个编码区(即外显子)之间的间插序列(即内含子)。本文使用的术语“结构基因”意指转录成mRNA的DNA序列,该mRNA然后被翻译成特定多肽特征的氨基酸序列。

核酸分子可以包括天然存在的和经修饰的核苷酸中的一种或两种,该核苷酸通过天然存在的和/或非天然存在的核苷酸连接物连接在一起。核酸分子可以被化学或生物化学修饰,或者可以含有非天然的或衍生的核苷酸碱基,本领域的技术人员将容易理解。这样的修饰包括,例如,标记、甲基化、用类似物取代一种或多种天然存在的核苷酸、核苷酸内修饰(例如,不带电的连接物:例如,甲基膦酸酯、磷酯、磷酰胺、氨基甲酸酯等;带电的连接物:例如,硫代磷酸酯、二硫代磷酸酯等;悬置部分:例如,肽;夹杂剂:例如,吖啶、补骨脂素等;螯合剂;烷基化剂;以及修饰的连接物:例如,α异构核酸等)。术语“核酸分子”还包括任何拓扑构象,包括单链、双链、部分双相、三相、发夹、圆形和挂锁构象。

本文所用的术语“靶基因”或“编码区”意指转录成mRNA的DNA序列,该mRNA然后被翻译成特定多肽的氨基酸特征序列。

如本文关于DNA所使用的,术语“编码序列”、“结构核苷酸序列”或“结构核酸分子”是指当置于适当的调控序列的控制下时,通过转录和mRNA最终翻译成多肽的核苷酸序列。关于RNA,术语“编码序列”是指翻译成肽、多肽或蛋白的核苷酸序列。编码序列的边界由5’-末端的翻译起始密码子和3’-末端的翻译终止密码子决定。编码序列包括但不限于:基因组DNA;cDNA;EST;以及重组核苷酸序列。

术语“序列同一性”或“同一性”,如本文在两个核酸或多肽序列的上下文中使用的,是指在指定的比较窗口上进行最大限度的对应排列时,两个序列中的残基是相同的。

术语“重组体”当用于例如细胞或核酸、蛋白或载体时,表示该细胞、生物体、核酸、蛋白或载体已通过引入异源核酸或蛋白或改变原生核酸或蛋白而被修饰,或该细胞源自如此修饰的细胞。因此,例如,重组细胞可以表达在细胞的原生(非重组或野生型)形式中没有的基因,或者表达在其他方面异常表达——超表达、表达不足或根本没有表达——的原生基因。

如本文所用,在提及核酸时,“异源”或“外源”是指来源于外来物种的核酸,或合成设计的核酸,或如果来自同一物种,则通过故意的人类干预,在成分和/或基因组位点上从其原生形式上进行了实质性修改。异源蛋白可能来自外来物种,或者,如果来自同一物种,则通过故意的人类干预从其原生形式上进行了实质性修改。“宿主细胞”是指含有引入的核酸构建体并支持该构建体的复制和/或表达的细胞。

如本文所用,术语“基因组”是指在细胞核内发现的染色体DNA,也指在细胞的亚细胞成分内发现的细胞器DNA。适用于细菌的术语“基因组”是指细菌细胞内的染色体和质粒。在本发明的一些实施方案中,可将DNA分子引入细菌中,使该DNA分子整合到细菌的基因组中。在这些和进一步的实施方案中,DNA分子可以是染色体整合的,或者是作为或位于稳定的质粒中。

术语“可操作地连接”,当用于提及调控序列和编码序列时,意味着调控序列影响连接的编码序列的表达。“调控序列”或“控制元件”是指促进原核细胞中真核样mRNA的转录,和/或促进真核样mRNA从原核细胞中输出,和/或促进真核细胞对真核样mRNA的摄取,和/或促进真核细胞中真核样mRNA的翻译的核苷酸序列。这些术语可以另外涵盖影响转录的时间和水平/数量、RNA处理或稳定性或相关编码序列的翻译的核苷酸序列。调控序列可包括启动子;翻译前导序列;内含子;增强子;茎环结构;抑制子结合序列;终止序列;聚腺苷酸化识别序列等。特定的调控序列可以位于可操作地连接到的编码序列的上游和/或下游。此外,与编码序列可操作地连接的特定调控序列可以位于双链核酸分子的相关互补链上。

如本文所用,术语“启动子”指的是DNA的可以在转录开始的上游,并且可以参与RNA聚合酶和其他蛋白的识别和结合以启动转录的区域。启动子可以与用于细胞中表达的编码序列可操作地连接,或者启动子可以与用于编码信号序列的核苷酸序列可操作地连接,该信号序列可以与用于细胞中表达的编码序列可操作地连接。“植物启动子”可以是能够在植物细胞中启动转录的启动子。发育控制下的启动子的示例包括在某些组织中优先启动转录的启动子,诸如叶、根、种子、纤维、木质部导管、管胞或厚壁组织。这样的启动子被称为“组织优先”。仅在某些组织中启动转录的启动子被称为“组织特异性”。

“细胞类型特异性”启动子主要驱动一个或多个器官中的某些细胞类型的表达,例如,根或叶中的维管细胞。“诱导型”启动子可以是可以受环境控制的启动子。可启动诱导型启动子转录的环境条件的示例包括厌氧条件和光的存在。组织特异性的、组织优先的、细胞类型特异性的和诱导型启动子构成“非组成性”启动子的类别。“构成性启动子“是指在大多数环境条件下或在大多数细胞或组织类型中可能具有活性的启动子。

术语“载体”是指可以将DNA、RNA、蛋白或多肽引入宿主的一些手段。要引入宿主的多核苷酸、蛋白和多肽可以是治疗性或预防性的;可以编码或是抗原;可以是本质上调节性的等等。载体有多种类型,包括病毒、质粒、细菌噬菌体、粘粒和细菌等。

“表达载体”是指能够在选定的宿主细胞或生物体中复制的核酸。表达载体可以作为自主结构进行复制,或者另选地可以全部或部分整合到宿主细胞的染色体或细胞器的核酸中,或者它作为穿梭机将外来DNA递送到细胞中,从而与宿主细胞基因组一起复制。因此,表达载体是能够在选定的宿主细胞、细胞器或生物体中复制的多核苷酸,例如质粒、病毒、人工染色体、核酸片段,对于这些多核苷酸,表达载体上的某些基因(包括感兴趣的基因)在细胞、细胞器或生物体内被转录并翻译成多肽或蛋白;或本技术中已知的任何合适的构建体,它包括“表达盒”。与此相反,如本文示例中所述,“盒”是含有本发明表达载体的一段的多核苷酸。盒的使用有助于表达载体的组装。表达载体是复制子,诸如质粒、噬菌体、病毒、嵌合病毒或粘粒,其含有与表达控制序列可操作地连接的所需多核苷酸序列。

如本领域中已知的,不同的生物体优先利用不同的密码子生成多肽。这样的“密码子使用”偏好可用于设计编码本发明的蛋白和嵌合体的核酸分子,以优化在特定宿主细胞系统中的表达。

当表达控制序列控制和调节该多核苷酸序列的转录和/或翻译时,多核苷酸序列可操作地连接到表达控制序列(例如,启动子和任选地,增强子)。

除非另有说明,否则特定核酸序列还隐含地涵盖其保守修饰的变体(例如,简并密码子替换)、互补(或补体)序列和反向补体序列,以及明确指出的序列。具体而言,简并密码子替换可以通过产生其中一个或多个选定的(或全部)密码子的第三位被混合碱基和/或脱氧肌苷残基替换的序列来实现(例如,见Batzer等,Nucleic Acid Res.19:5081(1991);Ohtsuka等,J.Biol.Chem.260:2605-2608(1985);和Rossolini等人,Mol.Cell.Probes 8:91-98(1994))。由于核酸密码子的简并,人们可以使用各种不同的多核苷酸来编码相同的多肽。下文表la含有关于哪些核酸密码子编码哪些氨基酸的信息。

表四氨基酸核酸密码子

术语“植物”或“植物系统”包括整株植物、植物器官、整株植物或植物器官的后代、胚胎、体胚、胚胎样结构、原球茎、原球茎样体(PLB)以及植物细胞的培养物和/或悬浮液。植物器官包括,例如,嫩枝植物器官/结构(例如,叶、茎和块茎)、根、花和花器官/结构(例如,苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包括胚、胚乳和种皮)和果实(成熟的子房)、植物组织(例如维管组织、基本组织等)和细胞(例如保卫细胞、卵细胞、毛状体等)。本发明还可以包括大麻科和其他大麻菌株,诸如一般的大麻。

任何诱导型启动子都可用于本发明的一些实施方案。参见Ward等人(1993)PlantMol.Biol.22:361-366。使用诱导型启动子,转录速率在诱导剂的作用下增加。示例性诱导型启动子包括但不限于:响应于铜的ACEI系统的启动子;响应于苯磺酰胺除草剂安全剂的玉米的In2基因;来自TnlO的Tet抑制子;以及来自类固醇激素基因的诱导型启动子,其转录活性可由糖皮质激素诱导,是一般的示例(Schena等人(1991)Proc.Natl.Acad.Sci.USA88:0421)。

任何诱导型启动子都可用于本发明的一些实施方案。参见Ward等人(1993)PlantMol.Biol.22:361-366。使用诱导型启动子,转录速率在诱导剂的作用下增加。示例性诱导型启动子包括但不限于:响应于铜的ACEI系统的启动子;响应于苯磺酰胺除草剂安全剂的玉米的In2基因;来自TnlO的Tet抑制子;以及来自类固醇激素基因的诱导型启动子,其转录活性可由糖皮质激素诱导,是一般的示例(Schena等人(1991)Proc.Natl.Acad.Sci.USA88:0421)。

如本文所用,术语“转化”或“经基因修饰”是指将一个或多个核酸分子转移到细胞中。当核酸分子被细菌稳定复制时,微生物被转入细菌的核酸分子“转化”或“经基因修饰”。如本文所用,术语“转化”或“经基因修饰”涵盖所有可将核酸分子引入原核供体细胞的技术。

“表达载体”是指能够在选定的宿主细胞或生物体中复制的核酸。表达载体可以作为自主结构进行复制,或者另选地可以全部或部分整合到宿主细胞的染色体或细胞器的核酸中,或者它作为穿梭机将外来DNA递送到细胞中,从而与宿主细胞基因组一起复制。因此,表达载体是能够在选定的宿主细胞、细胞器或生物体中复制的多核苷酸,例如质粒、病毒、人工染色体、核酸片段,对于这些多核苷酸,表达载体上的某些基因(包括感兴趣的基因)在细胞、细胞器或生物体内被转录并翻译成多肽或蛋白;或本技术中已知的任何合适的构建体,它包括“表达盒”。与此相反,如本文示例中所述,“盒”是含有本发明表达载体的一段的多核苷酸。盒的使用有助于表达载体的组装。表达载体是复制子,诸如质粒、噬菌体、病毒、嵌合病毒或粘粒,其含有与表达控制序列可操作地连接的所需多核苷酸序列。

当表达控制序列控制和调节该多核苷酸序列的转录和/或翻译时,多核苷酸序列可操作地连接到表达控制序列(例如,启动子和任选地,增强子)。

术语“重组体”当用于例如细胞或核酸、蛋白或载体时,表示该细胞、生物体、核酸、蛋白或载体已通过引入异源核酸或蛋白或改变原生核酸或蛋白而被修饰,或该细胞源自如此修饰的细胞。因此,例如,重组细胞可以表达在细胞的原生(非重组或野生型)形式中没有的基因,或者表达在其他方面异常表达——超表达、表达不足或根本没有表达——的原生基因。

术语“大约”和“约”指的是与参考数量、水平、值或量相差多达30%,或在另一实施方案中相差多达20%,和在第三实施方案中相差多达10%的数量、水平、值或量。如本文所用,单数形式“一”、“一个”和“该”包括复数参照物,除非上下文清楚地说明了其他情况。例如,术语“一个细菌”包括单个细菌和多个细菌。

如本文所用,术语“方法”和/或“系统”指用于完成给定任务的方式、手段、技术和程序,包括但不限于化学、药理、生物、生化和医学领域从业者已知的或从已知的方式、手段、技术和程序中容易发展的方式、手段、技术和程序。如本文所用,术语“治疗”包括废除、实质性抑制、减缓或逆转病情的进展,实质性改善病情的临床或美学症状,或实质性防止病情的临床或美学症状的出现。

如本文所用,“共生”或“共生体”一般指作为真核宿主的共生体的细菌。它还可以包括在真核宿主的整个生命周期内持续存在的细菌,无论是内部还是外部,并且可以进一步水平递送给真核宿主。内共生体一般指共生体的一个亚群。术语“内寄生菌”或“内寄生的”指作为植物宿主共生体的细菌。

术语“益生菌”是指一种微生物,诸如细菌,可在宿主体内定殖足够长的时间,以递送治疗性或有效量的真核样RNA多核苷酸。益生菌可包括内共生细菌,或天然存在的菌群,该菌群可永久至暂时定殖在真核生物体。益生菌生物体还可以包括藻类和真菌,诸如酵母。

在一个实施方案中,真核生物可以是动物,优选哺乳动物,更优选人类。在另一个实施方案中,真核生物可以包括“水生生物”和/或如本文所用的“水生动物”包括生长在水中的生物体,无论是淡水还是咸水。水生生物/动物包括脊椎动物、无脊椎动物、节肢动物、鱼类、软体动物,包括虾(如:对虾、食用对虾(Penaeus esculentu)、白对虾(Penaeussetiferus)、南美蓝对虾(Penaeus stylirostris)、西方对虾(Penaeus occidentalis)、日本对虾(Penaeus japonicus)、南美白对虾(Penaeus vannamei)、斑节对虾(Penaeusmonodon)、中国对虾(Penaeus chinensis)、褐对虾(Penaeus aztecus)、桃红对虾(Penaeusduorarum)、印度对虾(Penaeus indicus)、墨吉对虾(Penaeus merguiensis)、加利福尼亚对虾(Penaeus califomiensis)、短沟对虾(Penaeus semisulcatus)、斑节对虾(Penaeusmonodon)、丰年虾(brine shrimp)、淡水虾(freshwater shrimp)等)、螃蟹、牡蛎、扇贝、虾蛤、软骨鱼(如海鲷、鳟鱼、鲈鱼、条纹鲈鱼、罗非鱼、鲶鱼、、鲑鱼、鲤鱼、鲶鱼、黄尾鱼、鲤鱼斑马鱼、红鼓鱼等)、甲壳类等。虾类也包括水产养殖的虾。

如本文所用,术语“真核样RNA”或“真核样mRNA”是指在原核或其他非真核系统中表达的RNA分子,该RNA分子能够在受体真核细胞中表达。

值得注意的是,所提供的所有DNA序列可以包括所有RNA和氨基酸序列,反之亦然,因为本领域普通技术人员可以确定,例如通过Uracil替换以及冗余密码子。此外,所有序列都包括本领域普通技术人员可以确定的密码子优化的实施方案。因此,术语“编码(encoding)”或“编码序列”或“编码(coding)”指编码核苷酸和/或氨基酸序列,反之亦然。

通过参考以下示例,现在一般描述的本发明将更容易被理解,这些示例仅仅是为了说明本发明实施方案而包括的某些方面。这些示例并不是为了限制本发明,因为本领域的技术人员会从上述教导和下面的示例中认识到,其他技术和方法可以满足根据权利要求,并且可以在不偏离所要求的本发明范围的情况下采用。事实上,虽然本发明已特别参照其优选实施方案进行了展示和描述,但本领域的技术人员将理解,在不偏离所附根据权利要求所包括的本发明范围的情况下,可以在其中进行各种形式和细节的改变。

实施例

本发明人展示了在原核系统中设计和生产信使RNA(mRNA),该mRNA一旦导入到真核宿主细胞就能胜任真核核糖体结合和翻译。如图1-3一般所示,在一个优选的实施方案中,本发明人生成了多个示例性细菌生产的Euk-mRNA构建体,这些构建体包括一个或多个编码区特征,这些特征可能是必需的,或有助于真核翻译。这样的核苷酸构建体可以形成可用于转化一种或多种细菌的表达载体。这样的核苷酸构建体可以进一步在经基因修饰的原核细胞(诸如细菌或更优选的共生菌、内共生菌或内寄生菌)中表达,从而产生可被运输到真核宿主细胞中的真核样mRNA分子,在该细胞中该分子可以胜任地翻译。

如图1-2中一般所示,在一个实施方案中,本发明人生成了配置为表达具有修饰的5’端区的真核样mRNA分子的核苷酸构建体。具体地,在一个实施方案中,在编码区的5’端,本发明人包括一个5’非翻译区(EiTR)序列,以生成一个5’-CAP独立的翻译机械聚集平台。在该实施方案中,5’非翻译区(EiTR)可允许在没有5’-CAP的情况下聚集翻译机械。与真核mRNA相反,原核mRNA不被封盖。如图中进一步所示,构建了多个5’-EiTR序列,本文指定为内部核糖体进入位点(IRES)。IRES二级结构通常足以聚集核糖体亚单位,并且可以在病毒以及植物基因组中发现。此外,为了避免细菌中mRNA的翻译,所有原核生物核糖体结合位点都从编码区中省略。

作为使用IRES替代真核mRNA 5’封盖的替换,本发明人生成了被配置为表达具有“不依赖帽翻译元件”(CITE)序列的真核样mRNA分子的构建体。CITE一般由5’和3’UTR结构的RNA序列组成,该序列允许编码RNA两端之间的相互作用复制Poly-A结合蛋白(PABP)和翻译起始因子(eIF4G)之间的相互作用效果。此外,由于原核生物不会对mRNA的3’UTR进行转录后聚腺苷酸化,因此在mRNA的编码区3’UTR的设计中加入聚A尾巴,以促进PABP的结合,从而保护RNA不被简并,并使其在真核细胞中翻译。

如图1A-E和2A-J中一般所示,在示例性实施方案中,mRNA构建体的编码区编码两个由接头序列分离的串联的GFP11 B片。值得注意的是,GFP蛋白只有在其由11个B片组成的B筒完整时才会发出荧光。通过在原核细胞中生产的mRNA中仅编码一部分GFP蛋白,并通过在真核细胞(在本实施方案中植物细胞)中表达剩余的GFP蛋白(GFP1-10)来测试示例性系统,作为分裂GFP方法的一部分,发明人可以证明其系统,只有当编码GFP11的原核转录的真核样RNA在原核生物中合成、运输和递送到真核生物中并由真核生物翻译成表达GFP1-10的蛋白时,才会产生GFP的荧光。翻译后的GFP11蛋白与GFP1-10蛋白结合,然后重组GFP B-筒允许GFP荧光。最后,通过在编码序列中引入核定位信号(NLS),我们能够将荧光信号限制在核室中,通过在细胞核中重组分裂GFP实现蛋白功能的进一步测试。

所有示例性基因盒都是由本发明人在体外合成并亚克隆到改良的质粒主链中。为了在转化植物中验证构建体设计的体内表达,将线性(图1)和发夹形式(图2)两者、与NLS:2xGFP11编码序列相关的IRES和CITE UTR区克隆到修饰的pEARLEYGATE301植物转化载体中,诸如,例如农杆菌属Ti质粒植物转化载体。本发明人进一步去除Gateway重组位点(attR),并将35S(花椰菜花叶病毒)CaMV启动子引入质粒主链中。真核mRNA(有时称为Euk-mRNA)编码序列随后被克隆到35S+1核苷酸基因启动子的下游,这样mRNA转录物将只在其5’UTR中包括IRES或CITE序列,或者在发夹构建体的情况下,具有RNA配对序列作为其上游5’-UTR。随后将这些质粒引入根癌农杆菌GV3101中,用于转化表达GFP10的植物。

对于IRES和CITE发夹GFP11构建体的原核表达,将各种NLS:2xGFP11编码序列(图2)克隆在紧靠转录起始位点(+1)下游的Ptac启动子序列下(Tac-启动子(缩写为Ptac),或tac载体是一种合成生产的DNA启动子,由trp和lac操作子的启动子组合生产)。随后将质粒构建体转化到大肠杆菌HT115 Arne(如US16/031,607中所述,该描述通过引用并入本文)和申请人开发的阴沟肠杆菌WT mCherry和Arne菌株中,并通过RT-PCR验证基因构建体的转录(图4)。此外,从细菌生产的外膜囊泡中提取RNA,在50ml液体培养物孵育24小时后分离,如图4B所示。TuMV:NLS:2xGFP11和NtHSF转录物在细菌OMV中被识别。如Sayre等人在PCT/US2017/064977(通过引用并入本文)中所证明的,OMV先前已被示出可将RNA分子运输到真核宿主。

为了验证IRES和CITE序列的引入不会干扰NLS:2xGFP11肽的编码区的正确翻译,本发明人在植物原位进行了一组Euk-mRNA-GFP11的瞬态测定。这些测定由以下组成:在本氏烟叶中与农杆菌GV3101菌株共同浸润,该菌株用以下任一转化:1)编码阳性对照载体的h农杆菌Ti-质粒(UBQ:NLS:GFP11.mCherry),编码GFP11并表达mCherry荧光蛋白,2)编码GFP1-10的农杆菌植物转化载体(GV3101),该载体被在泛素启动子(UBQ)控制下表达的核定位信号(NLS)标记;或3)编码线性IRES或CITE的农杆菌植物转化载体GV3101:NLS:2xGFP11构建体(缺乏形成发夹的5’UTR序列基序——见图1)。

如图5-6所示,分别单独浸润UBQ:NLS:GFP11:mCherry和NLS:GFP1-10(模拟)没有产生GFP荧光——绿色——而在叶中与NLS:GFP1-10和NLS:GFP11:mCherry(阳性对照)共同浸润,GFP阳性核很容易识别。在IRES/CITE:NLS:2xGFP11与NLS:GFP1-10共同浸润的样品中也观察到GFP阳性核,表明构建体设计能够在真核系统中驱动NLS:2xGFP11的翻译。

本发明人接下来试图证明,添加形成发夹的5’UTR序列基序(图2,3)将允许Euk-mRNA的翻译,该基序被预测为保护RNA免受RNAse外核酸酶介导的简并并有助于保存poly-A的完整性。终端发夹区也可以作为dsRNA结合蛋白(辅助蛋白)的对接点,该对接点通过将辅助蛋白靶向到例如革兰氏阴性生物的周质外,从而潜在地帮助将RNA从原核细胞运输到真核宿主,并促进真核样RNA纳入外膜囊泡(OMV)。

为此,本发明人将辅助蛋白表达靶向到周质,以促进真核样RNA纳入OMV。具体而言,本发明人遵循上述相同的实验方法,对构建体的线性版本进行了实验,并能够验证将发夹样结构引入RNA不会损害核糖体结合和翻译。重要的是,如果NLS:2xGFP11肽不翻译并且GFP11蛋白正确地靶向到植物核中,则在植物核中不会观察到GFP荧光(图6,7)。当UBQ:NLS:GFP1-10浸润到叶片中进行瞬态表达时,没有观察到GFP阳性的细胞核。当IRES:NLS:2xGFP11构建体与UBQ:NLS:GFP1-10瞬态浸润到叶中,GFP阳性信号被识别。重要的是,这一观察结果表明,本发明人的示例性发夹构建体的底层设计能够胜任驱动真核翻译,并且5’UTR和发夹结构本身不干扰核糖体结合和正确翻译。这些数据共同证明,本发明人提出的所有示例性构建体都生产了与Euk-mRNA在真核细胞中翻译一致的阳性GFP信号。

本发明人进一步验证了细菌生产和递送的Euk-mRNA介导的多肽合成是在植物原位发生的。从对照植物(UBQ:NLS:GFP1-10+UBQ:NLS:GFP11:mCherry)和TEV:NLS:2xGFP11以及UBQ:NLS:GFP1-10共同浸润的叶盘中获得蛋白提取物。如图8所示,在总蛋白提取和LC-MS/MS运行后,我们能够确定对应于NLS:2xGFP11和NLS:GFP1-10的独特肽。与观察到的GFP阳性核一起,这两个结果强调了我们的形成发夹的5’和3’UTR末端序列与IRES和CITE UTR和poly-A尾巴的组合是胜任驱动编码序列的真核翻译。因此,在一个优选的实施方案中,由原核生物体转录的真核样RNA分子可以被引入到宿主真核细胞中,在那里它可以被真核核糖体翻译。在这个优选的实施方案中,一个或多个靶mRNA分子的递送可用于:表达靶蛋白,在宿主中生成靶表型,递送干扰RNA分子,递送用于翻译的基因编辑转录物;以及在没有稳定的遗传整合的情况下转化真核细胞或宿主。

在确定了调节区(IRES,CITE,poly-A)和编码区(在本实施方案中可以包括信号肽和2xGFP11,但可以由任何其他编码区或感兴趣的基因替代)的示例性组合能够驱动感兴趣的肽(NLS:2xGFP11)的转录后,本发明人在原核细胞中生成了本发明的Euk-mRNA表达系统。如上节所述,本发明人在细菌表达载体的Ptac启动子下克隆了真核样RNA转录单元。在大肠杆菌和阴沟肠杆菌遗传背景(HT115和阴沟肠杆菌Ae003 Arne中验证了构建体子集的转录(如16/031,607中所述,该描述通过引用并入本文)(见图4)确定了从细菌培养物中分离的外膜囊泡(OMV)中Euk-RNA的存在。值得注意的是,OMV是从革兰氏阴性细菌的外膜释放的脂质囊泡。OMV可能形成同种细菌之间,以及与周围环境中的其他微生物,重要的是与它的宿主之间沟通的重要手段。因此,本发明人试图证明,通过表达示例性真核类mRNA构建体的细菌对根组织的定植会将编码RNA转移到根细胞,并最终在真核细胞中翻译。

为此,为了证明Euk-mRNA可以由细菌生产,递送到一个真核细胞(在此情况下为植物细胞)并成功地翻译,本发明人将表达各种Euk-mRNA构建体的细菌接种到表达GFP1-10蛋白的2-4天龄拟南芥转基因幼苗中。通过在Murashige-Skoog液体培养基中将表达示例性Euk-RNA核苷酸构建体的细菌培养物与拟南芥幼苗共同孵育进行细菌接种。细菌过夜启动培养物用于接种新鲜的Luria-Bertani培养基与抗生素选择,并监测到指数生长阶段(OD600=0.5-0.8)。将细菌旋下并重悬于MS培养基中,随后将幼苗浸入细菌悬浮液中并搅拌培养1小时。用拟南芥Col-0植物作为阴性对照——Col-0是拟南芥GFP1-10转基因植物的遗传背景。随后将植物在新鲜MS缓冲液(x3)中洗涤5分钟,并种植在非选择性MS板上。继2天后让细菌定植,接种后2-5天可视化植物GFP荧光。

如图9所示,拟南芥GFP1-10转基因植物的根在根尖的分生区和伸长区的细胞中显示GFP阳性核。在接种大肠杆菌HT115 Amc和表达编码GFP11的Euk-mRNA的阴沟肠杆菌Ae003WT和Amc的根中观察到阳性GFP核。重要的是,在Col-0植物中没有观察到明显的GFP阳性细胞核。这些数据证明了真核样RNA跨界递送到真核植物细胞,在那里它能胜任聚集核糖体并翻译成NLS:2xGFP11蛋白。这些结果进一步证明本发明技术能够在原核系统中表达目标RNA分子并将其输出到真核细胞中,在那里,结合核糖体聚集序列基序(IRES/CITE)和聚A尾,它能够驱动翻译并产生蛋白。

本发明人进一步验证了具有IRES NtHSF和crTMV以及CITE SNTV的构建体也能驱动感兴趣的mRNA在真核细胞中的翻译——见表1和图11。

此外,本发明人在根部接种试验中测试了编码IRES/CITE:NLS:2xGFP11的质粒构建体与来自拟南芥的RNA结合辅助蛋白DRB4(dsRNA结合蛋白2)和PP2-A1(韧皮蛋白2-A1)的结合,以确定这些蛋白是否可以作为RNA跨界传输的伴侣。为此,用细菌分泌肽(如OmpA、HylA)标记辅助蛋白,并将其克隆到编码各种IREs/CITE:NLS:2xGFP11基因的主链中,从自身启动子驱动转录。如图10所示,在宿主大肠杆菌HT115细胞中的发夹真核样RNA的表达通过RT-PCR验证,辅助蛋白的产生也是如此。这些培养物随后用于接种拟南芥WT(Col-0)和拟南芥NLS:GFP11和GFP1 EER——内质网4-5日龄幼苗。结果总结在表1和图11中。

接种后三至四天在辐射荧光显微镜下检查根尖,并对GFP阳性核的数量进行检测,以确定Euk-mRNA与RNA结合辅助蛋白的组合是否增加了运输效率。对于TuMV:NLS:GFP11和TEV:NLS:GFP11发夹两者与DRB4和PP2-A1的表达相结合,与单独接种真核生物mRNA的植物相比,GFP阳性核数增加(表1),>50%的根(TEV)和>40%(TuMV)显示+20个核/根尖的GFP核数阳性。使用Kruskal-Wallis秩和检验对所获得的数据进行统计分析,突出了在TEV:NLS:2xGFP11构建体中,相对于单独的TEV:NLS:2xGFP11,在存在辅助蛋白DRB4或PP2-A1的情况下,GFP阳性核的数量增加有显著差异(p=0.021)。当分析TuMV:NLS:2xGFP11构建体的数据时,也得到了同样的结果,不管有无辅助蛋白,p<0.001。另外,在拟南芥WT植物中没有观察到GFP阳性核。这些结果共同表明,将RNA结合蛋白、靶向分泌与真核样RNA结合,可以提高后者的转移效率。我们还验证了具有IRES NtHSF和crTMV以及CITE SNTV的构建体也能够在真核细胞中驱动感兴趣的RNA的翻译——定量结果见表1。获得的结果支持将该技术应用于基因组编辑方法。将NLS:2xGFP11编码序列替换为例如Cas3、Cas9或TALEN酶的编码区的编码序列(图11显示了可与引导RNA共表达的示例性Cas3或Cas9构建体),将促进RNA导入真核细胞,并以非遗传的方式在宿主细胞中翻译编辑机械。

蛋白消化

蛋白的还原、烷基化和胰蛋白酶消化是按照华盛顿大学蛋白组学资源(UWPR)进行的。简而言之,使用A280蛋白浓度测定法在NanoDrop 2000上测量蛋白浓度。然后,通过稀释到0.1M的碳酸氢铵(NH4HCO3)的终浓度与1M的原液,将蛋白样品调整到

肽的脱盐

然后使用

纳米LC-MS/MS

采用Synapt G2-Si高清晰度质谱仪(HDMS)和偶联的Acquity M-Class超高效液相色谱仪(UPLC)结合纳米电喷雾电离(nano-ESI)源(Waters)对肽进行纳米LC-MS/MS分析。肽采用捕集法分离,先用nanoEase M/Z Symmetry C18捕集柱(180pm内径x20 mm L;5pm颗粒大小;Waters),再用nanoEase M/Z HSS C18 T3柱(75pm内径x150 mm L;1.8pm颗粒大小;Waters),流动相为(A)含0.1%甲酸的水和(B)含0.1%甲酸的乙腈。注射量为1μL。在流速为10pL/min的1%B的情况下进行捕集3分钟,然后使用以下线性梯度在流速为0.3pL/min的情况下进行75分钟的分析梯度:

在连续模式下,在300-2000m/z的质量范围内进行5.0-60.0分钟的数据独立采集。极性和离子光学设置为正模式(ES+)和高分辨率模式,毛细管和锥体电压分别设置为3.4kV和40V。源和脱溶温度设置为100℃和200℃,纳流气体压力为0.5Bar,脱溶气体流量为650.0L/hr。对低能扫描不施加碰撞能量,对高能扫描施加12-40V的高能碰撞斜坡。MS调查扫描时间设置为0.5秒,扫描间延迟0.014秒。LockSpray测量值每60秒采集一次,使用100fmol/pL Glu'-纤维蛋白肽B(785.8426m/z)以0.5pL/min的速度直接注入,以保持MS测量值的质量精度。

基于MS的蛋白鉴定

所有的肽数据使用Progenesis QI进行蛋白组学(非线性)处理。肽谱根据我们从设计构建体的预测翻译以及公共数据库(通过Swissprot)的蛋白序列生成的自定义数据库进行搜索。MS鉴定工作流程采用默认设置的Apex3D参数,自动对准和峰值选取。使用最合适的拟合方式自动进行多肽样品的对准。观察到胰蛋白酶和糜蛋白酶自动消化所拟合的自溶峰,因此,胰蛋白酶和糜蛋白酶消化试剂均用于肽鉴定。此外,非特异性裂解用于搜索OmpA信号肽的裂解位点。蛋白鉴定的容差参数和离子匹配要求设置如下:肽离子的质量误差为25ppm,肽离子鉴定的片段/肽为2个,错误发现率(FDR)为4%,每个蛋白鉴定的肽数为2个。非冲突肽和独特肽的丰度均用于鉴定蛋白的相对定量。鉴定蛋白的丰度值以.csv文件的形式导出到Excel中,并使用估计的蛋白浓度对各样品进行标准化。

参考文献

以下参考文献的完整内容通过引用并入本说明书:

[1]Kieft J(2008)Viral IRES RNA structures and ribosomeinteractions.Trends Biochem Sci.:33(6):274–283.

[2]Vanderhaeghen R,De Clercq R,Karimi M,Van Montagu M,Hilson P,VanLijsebettens M(2006)Leader sequence of a plant ribosomal protein gene withcomplementarity to the 18S rRNA triggers in vitro cap-independenttranslation.FEBS letters 580:2630-2636.

[3]Colussi TM,Costantino DA,Zhu J,Donohue JP,Korostelev AA,Jaafar ZA,Plank TD,Noller HF,Kieft JS(2015)Initiation of translation in bacteria by astructured eukaryotic IRES RNA.Nature 519:110–113.

[4]Nakashima N,Tamura T,Good L(2006)Paired termini stabilizeantisense RNAs and enhance conditional gene silencing in Escherichiacoli.Nuc.Acids Res.34(20):e138.

[5]Leppek K,Das R,Barna M(2018)Functional 5’UTR mRNA structures ineukaryotic translation regulation and how to find them.Nature Reviews 19:158-174.

[6]De Gregorio E,Preiss T,Hentze MW(1999)Translation driven by aneIF4G core domain in vivo.EMBO J.18(17):4865-4874.

[7]Song T,Mika F,Lindmark B,Liu Z,Schild S,Bishop A,Zhu J,Camilli A,Johansson J,Vogel J,Wai SN(2008)A new Vibrio cholerae sRNA modulatescolonization and affects release of outer membrane vesicles.Mol Microbiol.70(1):100–111.

[8]Sánchez-Vargas I,Scott JC,Poole-Smith BK,Franz AWE,Barbosa-Solomieu V,Wilusz J,Olson KE,Blair CD(2009)Dengue Virus Type 2Infections ofAedes aegypti Are Modulated by the Mosquito's RNA Interference Pathway.PLoSPathogens 5(2):e1000299.

[9]Parker G,Eckert DM,Bass BL(2006)RDE-4preferentially binds longdsRNA and its dimerization is necessary for cleavage of dsRNA to siRNA.RNA 12(5):807-818.

[10]Winston WM,Sutherlin M,Wright AJ,Feinberg EH,Hunter CP(2007)Caenorhabditis elegans SID-2is required for environmental RNAinterference.PNAS 104(25):10565-10570.

[11]Bologna NG,Voinnet O(2014)The diversity,biogenesis,and activitiesof endogenous silencing small RNAs in Arabidopsis.Annu Rev.Plant Biol.65:473-503.

[12]Park,W.,Li,J.,Song,R.,Messing,J.&Chen,X.(2002)CARPEL FACTORY,aDicer Homolog,and HEN1,a Novel Protein,Act in microRNA Metabolism inArabidopsis thaliana.Curr.Biol.12:1484–1495.

[13]Xiao J,Feehery CE,Tzertzinis G,Maina CV(2009)E.coli RNase III(E38A)generates discrete-sized products from long dsRNA.RNA 15:984-991.

表格

表1:分析拟南芥根部的GFP阳性核。3-5天龄的拟南芥幼苗WT(Col-0)和表达核定位信号(NLS)和内质网(ER)标记的GFP1-10的转基因品系接种大肠杆菌HT115该大肠杆菌用编码GFP11的真核样RNA构建体转化。经由IRES和CITE相互作用通过聚集核糖体,植物细胞成功地将细菌分泌的GFP11编码RNA和其随后由植物细胞的翻译导入NLS:2xGFP11肽将导致分裂GFP的重组和荧光发射。NLS:2xGFP11可以结合GFP1-10的两个分子并将重组分裂GFP贩运到核。GFP阳性核的评分将可以验证细菌真核样RNA从细菌的转移和被植物细胞翻译。hpCHLl是为RNAi设计的非编码发夹RNA,在本实验中用作阴性对照。表中的TEV、TuMV、NtHSF、SNTV、CRTMV为IRES:NLS:2xGFP11编码构建体的指定缩写。

表2:用于RT-PCR分析的引物

表3:构建体和辅助蛋白的序列:在适用情况下,彩色图例:

序列鉴定

如上所述,本申请含有一份完整的序列表,该序列表以ASCII格式以电子方式提交,并在此通过引用以其整体并入于此。还提供了以下序列,并在此以其整体并入本说明书。

SEQ ID NO.1

DNA

1-IRES:crTMV

人工

SEQ ID NO.2

DNA

1-IRES:NtHSF

人工

SEQ ID NO.3

DNA

1-IRES:TuMV

人工

SEQ ID NO.4

DNA

1-IRES:crTEV

人工

SEQ ID NO.5

DNA

1-CITE:SNTV

人工

SEQ ID NO.6

DNA

2-IRES:crTMV(发夹)

人工

SEQ ID NO.7

DNA

2-IRES:NtHSF(发夹)

人工

SEQ ID NO.8

DNA

2-IRES:crTEV(发夹)

人工

SEQ ID NO.9

DNA

2-IRES:TuMV(发夹)

人工

SEQ ID NO.10

DNA

2-CITE:SNTV(发夹)

人工

SEQ ID NO.10

DNA

ompA分泌信号

大肠杆菌

ATGAAAAAGACGGCGATTGCTATCGCTGTGGCGCTTGCTGGATTCGCCACTGTAGCACAAGCA

SEQ ID NO.11

氨基酸

ompA分泌信号

大肠杆菌

MKKTAIAIAVALAGFATVAQA

SEQ ID NO.12

氨基酸

PelB(果胶酸裂合酶B)

胡萝卜软腐欧文氏菌

MKYLLPTAAAGLLLLAAQPAMA

SEQ ID NO.13

氨基酸

StII(热稳定肠毒素2)

细菌

MKKNIAFLLASMFVFSIATNAYA

SEQ ID NO.14

氨基酸

内切木聚糖酶

芽孢杆菌

MFKFKKKFLVGLTAAFMSISMFSATASA

SEQ ID NO.15

氨基酸

PhoA(碱性磷酸酶)

大肠杆菌

MKQSTIALALLPLLFTPVTKA

SEQ ID NO.16

氨基酸

OmpF(外膜蛋白F)

大肠杆菌

MMKRNILAVIVPALLVAGTANA

SEQ ID NO.17

氨基酸

PhoE(外膜孔蛋白E)

大肠杆菌

MKKSTLALVVMGIVASASVQA

SEQ ID NO.18

氨基酸

MalE(麦芽糖结合蛋白)

大肠杆菌

MKIKTGARILALSALTTMMFSASALA

SEQ ID NO.19

氨基酸

OmpC(外膜蛋白C)

大肠杆菌

MKVKVLSLLVPALLVAGAANA

SEQ ID NO.20

氨基酸

Lpp(胞壁质脂蛋白)

大肠杆菌

MKATKLVLGAVILGSTLLAG

SEQ ID NO.21

氨基酸

LamB(λ受体蛋白)

大肠杆菌

MMITLRKLPLAVAVAAGVMSAQAMA

SEQ ID NO.22

氨基酸

OmpT(蛋白酶VII)

大肠杆菌

MRAKLLGIVLTTPIAISSFA

SEQ ID NO.23

氨基酸

HylA(a-溶血素)

大肠杆菌

SKQHYGIRKYKVGVCSALIALSILG

SEQ ID NO.24

DNA

dsRNA结合蛋白2(DRB4)

拟南芥

GACCACGTGTACAAGGGTCAGCTGCAAGCGTATGCGCTGCAGCACAACCTGGAGCTGCCGGTTTACGCGAACGAGCGTGAAGGTCCGCCGCACGCGCCGCGTTTCCGTTGCAACGTGACCTTCTGCGGCCAGACCTTTCAAAGCAGCGAGTTCTTTCCGACCCTGAAAAGCGCGGAACACGCGGCGGCGAAGATCGCGGTGGCGAGCCTGACCCCGCAAAGCCCGGAAGGTATCGATGTTGCGTACAAAAACCTGCTGCAGGAGATTGCGCAAAAGGAAAGCAGCCTGCTGCCGTTCTATGCGACCGCGACCAGCGGTCCGAGCCACGCGCCGACCTTTACCAGCACCGTGGAGTTCGCGGGTAAAGTTTTTAGCGGCGAGGAAGCGAAGACCAAGAAACTGGCGGAAATGAGCGCGGCGAAAGTTGCGTTCATGAGCATTAAGAACGGTAACAGCAACCAGACCGGTAGCCCGACCCTGCCGAGCGAGCGTCAAGAAGACGTGAACAGCAACGTTAAAAGCAGCCCGCAGGAGATCCACAGCCAACCGAGCAGCAAGGTGGTTATGACCCCGGACACCCCGAGCAAAGGTATTAAGGTTAACGAGGATGAATTTCCGGACCTGCACGATGCGCCGGCGAGCAACGCGAAAGAAATCAACGTGGCGCTGAACGAGCCGGAAAACCCGACCAACGACGGTACCCTGAGCGCGCTGACCACCGATGGCATGAAGATGAACATCGCGAGCAGCAGCCTGCCGATTCCGCACAACCCGACCAACGTTATTACCCTGAACGCGCCGGCGGCGAACGGTATCAAGCGTAACATTGCGGCGTGCAGCAGCTGGATGCCGCAGAACCCGACCAACGACGGCAGCGAGACCAGCAGCTGCGTGGTTGATGAGAGCGAAAAGAAAAAGCTGATCATGGGTACCGGTCACCTGAGCATTCCGACCGGTCAGCACGTGGTTTGCCGTCCGTGGAACCCGGAGATCACCCTGCCGCAAGATGCGGAAATGCTGTTCCGTGACGATAAATTTATTGCGTATCGTCTGGTGAAGCCGTAA

SEQ ID NO.25

氨基酸

dsRNA结合蛋白2(DRB4)

拟南芥

MDHVYKGQLQAYALQHNLELPVYANEREGPPHAPRFRCNVTFCGQTFQSSEFFPTLKSAEHAAAKIAVASLTPQSPEGIDVAYKNLLQEIAQKESSLLPFYATATSGPSHAPTFTSTVEFAGKVFSGEEAKTKKLAEMSAAKVAFMSIKNGNSNQTGSPTLPSERQEDVNSNVKSSPQEIHSQPSSKVVMTPDTPSKGIKVNEDEFPDLHDAPASNAKEINVALNEPENPTNDGTLSALTTDGMKMNIASSSLPIPHNPTNVITLNAPAANGIKRNIAACSSWMPQNPTNDGSETSSCVVDESEKKKLIMGTGHLSIPTGQHVVCRPWNPEITLPQDAEMLFRDDKFIAYRLVKP

SEQ ID NO.26

DNA

韧皮蛋白2-A1(PP2-A1)

拟南芥

AAGCAAGAAACACTGCAGCGAGCTGCTGCCGAACAAGATGTTCCGTAACCAGGACAGCAAGTACCTGATCCCGGTTCAAAAAGAAGCGCCGCCGGTGACCACCCTGCCGATGAAGGCGAGCACCGTTAAAAGCCCGCACAACTGCGAGGCGATCCTGCGTGACGCGGATCCGCCGATTAGCCTGAGCAGCGTTAACCTGAGCGAACAGCTGCGTAGCGGCGTGTTCCTGAAGCCGAAGAAACAAATCAAATACTGGGTTGATGAGCGTAACAGCAACTGCTTCATGCTGTTTGCGAAGAACCTGAGCATTACCTGGAGCGACGATGTGAACTATTGGACCTGGTTTACCGAGAAAGAAAGCCCGAACGAGAACGTTGAAGCGGTGGGTCTGAAGAACGTGTGCTGGCTGGACATCACCGGCAAATTCGATACCCGTAACCTGACCCCGGGTATTGTTTACGAGGTGGTTTTTAAGGTGAAACTGGAAGACCCGGCGTATGGCTGGGATACCCCGGTTAACCTGAAACTGGTGCTGCCGAACGGCAAGGAGAAACCGCAGGAAAAGAAAGTTAGCCTGCGTGAACTGCCGCGTTACAAGTGGGTGGACGTTCGTGTGGGCGAGTTCGTGCCGGAGAAGAGCGCGGCGGGCGAGATCACCTTTAGCATGTATGAACACGCGGCGGGTGTTTGGAAGAAAGGCCTGAGCCTGAAGGGTGTGGCGATTCGTCCGAAACAATAA

SEQ ID NO.27

氨基酸

韧皮蛋白2-A1(PP2-A1)

拟南芥

MSKKHCSELLPNKMFRNQDSKYLIPVQKEAPPVTTLPMKASTVKSPHNCEAILRDADPPISLSSVNLSEQLRSGVFLKPKKQIKYWVDERNSNCFMLFAKNLSITWSDDVNYWTWFTEKESPNENVEAVGLKNVCWLDITGKFDTRNLTPGIVYEVVFKVKLEDPAYGWDTPVNLKLVLPNGKEKPQEKKVSLRELPRYKWVDVRVGEFVPEKSAAGEITFSMYEHAAGVWKKGLSLKGVAIRPKQ

SEQ ID NO.28

DNA

Kozak(SD)序列

人工

AGGAGGTACCCACC

SEQ ID NO.29

DNA

Cas3

嗜热链球菌

ATGAAACATATTAATGATTATTTTTGGGCTAAGAAAACAGAGGAAAATAGTAGACTTCTTTGGTTACCATTAACTCAACACTTAGAAGACACGAAAAATATTGCAGGCCTCTTATGGGAACATTGGTTAAGTGAAGGACAAAAGGTATTAATTGAAAATTCTATTAATGTTAAATCAAATATTGAAAACCAAGGGAAAAGATTGGCACAATTCCTAGGAGCTGTTCATGATATCGGTAAAGCAACACCAGCTTTTCAGACGCAAAAAGGTTATGCAAATTCAGTAGATTTGGATATTCAATTGTTAGAAAAATTGGAACGCGCAGGTTTTTCTGGCATTAGTTCTCTCCAACTAGCCTCCCCCAAAAAGAGTCATCATAGCATTGCAGGTCAATATTTGTTATCCCATTATGGCGTGGACGAAGATATTGCAACAATTATTGGTGGACACCATGGACGACCAGTTGATGATTTAGACGGTTTAAATTCTCAAAAAAGCTATCCCTCCAATTATTACCAGGATGAAAAGAAAGATAGTCTCGTTTATCAGAAATGGAAGTCAAATCAAGAAGCTTTTTTAAACTGGGCTTTAACAGAAACAGGGTTTAATTCTGTGTCTCAGCTTCCAAAAATCAAACAGCCTGCTCAAGTTATTCTATCAGGTTTACTCATAATGTCTGACTGGATTGCTAGTAATGAGCATTTTTTTCCTTTGTTAAGTTTGGATGAAACTGATGTGAAAAACAAGAGTCAACGTATTGAAACTGGGTTTAAAAAGTGGAAAAAATCTAACTTGTGGCAACCTGAAACTTTCGTTGACCTTGTTACTCTTTATCAGGAAAGATTTGGATTTAGTCCACGAAATTTTCAGCTGATACTCTCACAAACAATCGAAAAGACGACTAATCCTGGGATAGTGATACTGGAAGCGCCAATGGGAATCGGGAAAACAGAGGCGGCTCTAGCGGTATCAGAGCAGTTATCTAGTAAAAAAGGATGTAGTGGATTGTTTTTTGGATTGCCCACACAAGCAACCTCCAATGGAATTTTTAAGAGGATTGAACAGTGGACAGAGAATATAAAGGGTAACAATTCTGATCATTTTTCCATTCAGCTGGTTCATGGAAAAGCAGCCTTAAATACGGATTTTATTGAGTTACTTAAAGGAAATACAATTAATATGGACGACTCGGAAAACGGCAGTATTTTTGTCAATGAGTGGTTTTCTGGGAGAAAAACTTCAGCATTAGATGATTTTGTAGTTGGGACGGTCGACCAATTTTTAATGGTGGCTTTAAAACAAAAACATTTGGCCTTACGTCATTTAGGATTTAGTAAAAAAGTTATCGTTATTGATGAAGTCCACGCTTATGATGCTTATATGAGCCAATATTTGTTGGAAGCTATCAGATGGATGGGAGCTTATGGTGTTCCTGTAATTATTTTATCAGCAACTTTACCTGCCCAACAAAGAGAAAAACTCATAAAAAGCTATATGGCTGGAATGGGAGTGAAATGGCGAGATATTGAAAATATAGATCAGATAAAAATAGACGCATACCCTTTAATCACTTATAATGACGGGCCTGACATTCATCAAGTTAAAATGTTCGAAAAGCAAGAACAAAAAAATATCTACATTCATCGTTTACCAGAAGAACAGTTATTTGATATTGTAAAAGAAGGTCTTGACAATGGTGGAGTAGTTGGGATAATTGTCAATACGGTGAGAAAATCTCAAGAATTGGCAAGAAATTTTTCAGATATTTTTGGAGATGATATGGTAGATTTGCTTCATTCTAATTTCATAGCAACTGAAAGAATCCGAAAAGAAAAGGATTTATTGCAAGAAATTGGGAAAAAAGCAATACGTCCACCAAAGAAAATCATTATTGGTACACAGGTGCTTGAACAGTCGTTAGATATTGATTTTGATGTACTGATAAGCGACTTAGCGCCTATGGATTTACTCATTCAACGTATCGGACGACTACATCGTCACAAAATCAAAAGGCCCCAAAAGCACGAAGTAGCAAGATTTTATGTTTTAGGAACATTTGAAGAGTTTGATTTTGATGAAGGAACGCGTTTGGTTTATGGGGACTACCTATTAGCTAGAACTCAGTACTTTTTACCAGATAAAATACGACTTCCTGATGATATTTCACCGCTAGTCCAAAAGGTTTATAATTCAGACCTAACAATTACGTTTCCAAAGCCAGAACTTCATAAAAAATATTTGGATGCTAAAATAGAACATGATGATAAGATTAAAAATAAAGAAACAAAGGCAAAGTCATACCGTATTGCTAATCCTGTCTTAAAAAAATCGAGAGTTCGAACTAACAGTTTGATTGGTTGGTTAAAGAACCTCCATCCAAATGATAGTGAAGAAAAAGCATATGCTCAAGTTCGAGATATTGAAGATACAGTTGAAGTGATTGCATTAAAAAAAATATCTGATGGGTATGGTTTGTTCATAGAAAATAAAGATATATCTCAGAACATTACTGATCCTATAATTGCAAAAAAGGTAGCACAAAATACTTTACGACTTCCGATGAGTTTATCCAAAGCCTATAATATTGATCAAACGATTAATGAGCTTGAAAGATATAACAATAGCCACTTAAGTCAATGGCAAAACTCATCATGGTTAAAGGGATCTCTTGGGATTATTTTTGATAAAAACAATGAGTTTATACTGAATGGATTTAAACTATTATATGATGAAAAATATGGTGTTACCATAGAAAGGTTGGATAAGAATGAGTCGGTTTAA

SEQ ID NO.30

氨基酸

Cas3

嗜热链球菌

MKHINDYFWAKKTEENSRLLWLPLTQHLEDTKNIAGLLWEHWLSEGQKVLIENSINVKSNIENQGKRLAQFLGAVHDIGKATPAFQTQKGYANSVDLDIQLLEKLERAGFSGISSLQLASPKKSHHSIAGQYLLSHYGVDEDIATIIGGHHGRPVDDLDGLNSQKSYPSNYYQDEKKDSLVYQKWKSNQEAFLNWALTETGFNSVSQLPKIKQPAQVILSGLLIMSDWIASNEHFFPLLSLDETDVKNKSQRIETGFKKWKKSNLWQPETFVDLVTLYQERFGFSPRNFQLILSQTIEKTTNPGIVILEAPMGIGKTEAALAVSEQLSSKKGCSGLFFGLPTQATSNGIFKRIEQWTENIKGNNSDHFSIQLVHGKAALNTDFIELLKGNTINMDDSENGSIFVNEWFSGRKTSALDDFVVGTVDQFLMVALKQKHLALRHLGFSKKVIVIDEVHAYDAYMSQYLLEAIRWMGAYGVPVIILSATLPAQQREKLIKSYMAGMGVKWRDIENIDQIKIDAYPLITYNDGPDIHQVKMFEKQEQKNIYIHRLPEEQLFDIVKEGLDNGGVVGIIVNTVRKSQELARNFSDIFGDDMVDLLHSNFIATERIRKEKDLLQEIGKKAIRPPKKIIIGTQVLEQSLDIDFDVLISDLAPMDLLIQRIGRLHRHKIKRPQKHEVARFYVLGTFEEFDFDEGTRLVYGDYLLARTQYFLPDKIRLPDDISPLVQKVYNSDLTITFPKPELHKKYLDAKIEHDDKIKNKETKAKSYRIANPVLKKSRVRTNSLIGWLKNLHPNDSEEKAYAQVRDIEDTVEVIALKKISDGYGLFIENKDISQNITDPIIAKKVAQNTLRLPMSLSKAYNIDQTINELERYNNSHLSQWQNSSWLKGSLGIIFDKNNEFILNGFKLLYDEKYGVTIERLDKNESV

SEQ ID NO.31

DNA

Cas9

链球菌

ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA

SEQ ID NO.32

氨基酸

Cas9

链球菌

MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD

SEQ ID NO.32

氨基酸

Cas9

葡萄球菌

MKRNYILGLDIGITSVGYGIIDYETRDVIDAGVRLFKEANVENNEGRRSKRGARRLKRRRRHRIQRVKKLLFDYNLLTDHSELSGINPYEARVKGLSQKLSEEEFSAALLHLAKRRGVHNVNEVEEDTGNELSTKEQISRNSKALEEKYVAELQLERLKKDGEVRGSINRFKTSDYVKEAKQLLKVQKAYHQLDQSFIDTYIDLLETRRTYYEGPGEGSPFGWKDIKEWYEMLMGHCTYFPEELRSVKYAYNADLYNALNDLNNLVITRDENEKLEYYEKFQIIENVFKQKKKPTLKQIAKEILVNEEDIKGYRVTSTGKPEFTNLKVYHDIKDITARKEIIENAELLDQIAKILTIYQSSEDIQEELTNLNSELTQEEIEQISNLKGYTGTHNLSLKAINLILDELWHTNDNQIAIFNRLKLVPKKVDLSQQKEIPTTLVDDFILSPVVKRSFIQSIKVINAIIKKYGLPNDIIIELAREKNSKDAQKMINEMQKRNRQTNERIEEIIRTTGKENAKYLIEKIKLHDMQEGKCLYSLEAIPLEDLLNNPFNYEVDHIIPRSVSFDNSFNNKVLVKQEENSKKGNRTPFQYLSSSDSKISYETFKKHILNLAKGKGRISKTKKEYLLEERDINRFSVQKDFINRNLVDTRYATRGLMNLLRSYFRVNNLDVKVKSINGGFTSFLRRKWKFKKERNKGYKHHAEDALIIANADFIFKEWKKLDKAKKVMENQMFEEKQAESMPEIETEQEYKEIFITPHQIKHIKDFKDYKYSHRVDKKPNRELINDTLYSTRKDDKGNTLIVNNLNGLYDKDNDKLKKLINKSPEKLLMYHHDPQTYQKLKLIMEQYGDEKNPLYKYYEETGNYLTKYSKKDNGPVIKKIKYYGNKLNAHLDITDDYPNSRNKVVKLSLKPYRFDVYLDNGVYKFVTVKNLDVIKKENYYEVNSKCYEEAKKLKKISNQAEFIASFYNNDLIKINGELYRVIGVNNDLLNRIEVNMIDITYREYLENMNDKRPPRIIKTIASKTQSIKKYSTDILGNLYEVKSKKHPQIIKKG

SEQ ID NO.33

DNA

IRES-TMV

烟草花叶病毒

GAATTCGTCGATTCGGTTGCAGCATTTAAAGCGGTTGACAACTTTAAAAGAAGGAAAAAGAAGGTTGAAGAAAAGGGTGTAGTAAGTAAGTATAAGTACAGACCGGAGAAGTACGCCGGTCCTGATTCGTTTAATTTGAAAGAAGAAA

SEQ ID NO.34

DNA

IRES-NtHSF

烟草IRES

GGCACGAGGCTCCCATTAATATTTCTTCTTCTGTGTAATTCCATTATTCTGTAGTAGATTCACGTCCGAGTTTAAAGAAGAGAGAAAACTGAAAAGGCAGAAAATTCCAGAGCTTTAGATTTAGCCAAAGATAGTTATGGTCGTGTTGTTCTTGGTGAAGATTGGCAAAGTAGGAGCCAATGGAAGAAACTAAGATCATAATCAATCGCCCCAAAAACAACCTTGTTCATTCTATGGTTTTTCTCTTCGGTTTCTATGTTTGGGATTGGGAATTCCTCACTGTCCTTTTGCTTTTCAGTTATTGCTCCTTCTAATTTTCCCTAGCTAGGATCTTCTCAATTAATTTCCTTTTTCATTTTCAACTAACTCATAATTAGCCCAAATCTTCAAAAGAGTTTTGTGTAAGTTGATAGACGTTTAGAGAAACAGAGAAATACAGGGGAAAAACAAGGG

SEQ ID NO.35

DNA

IRES-TuMV

芜菁花叶马铃薯Y病毒IRES

GGGAAAGCTTGCATGCCTGCAGGTCGACTCTAGAAAAATATAAAAACTCAACACAACATACACAAAACGATTAAAGCAAACACAATCTTTCAAAGCATTCAAAGCATTCAAGCAATCAAAGATTTTCAAATCTTTTGTCGTTATCAAAGCAATCACCAACAGGATCCAGGATCCCCGGGTGGTCAGTCCCTT

SEQ ID NO.36

DNA

IRES-TEV

烟草蚀刻病毒IRES

AAATAACAAATCTCAACACAACATATACAAAACAAACGAATCTCAAGCAATCAAGCATTCTACTTCTATTGCAGCAATTTAAATCATTTCTTTTAAAGCAAAAGCAATTTTCTGAAAATTTTCACCATTTACGAACGATAGCA

SEQ ID NO.37

DNA

CITE-SNTV

烟草坏死卫星病毒CITE

AAAAAAAAAAAAGTAAAGACAGGAAACTTTACTGACTAACTCCCAGAGGTTCACAATGTTAGTGATGGGGCGCTGAAAGATGCGTAGCTACCCTTCTGGAGCCACTTCCTGGTGGTAAGCAGAAATCCAAGGGTACGGTGGTACGGTGGAAAGCAGTCCC

SEQ ID NO.37

NtHSF1_IRES_F引物

人工

GGCACGAGGCTCCCATTAATATTTC

SEQ ID NO.37

TuMV_IRES_F引物

人工

GGGAAAGCTTGCATGCCTG

SEQ ID NO.37

TEV_IRES_F引物

人工

GAAATAACAAATCTCAACACAACATATAC

SEQ ID NO.37

rpoA-for引物

人工

GCACCAAAGAAGGCGTTCAG

SEQ ID NO.37

rpoA-rev引物

人工

GGTCAGGTGGCAGATCACAT

序列表

<110> 美国卵石实验室公司

<120> 用于真核宿主中真核mRNA生产、输出和翻译的工程菌系统和方法

<130> 90115.00231

<150> US 62/693,963

<151> 2018-07-04

<160> 44

<170> PatentIn version 3.5

<210> 1

<211> 512

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 1-IRES:crTMV

<400> 1

gaattcgtcg attcggttgc agcatttaaa gcggttgaca actttaaaag aaggaaaaag 60

aaggttgaag aaaagggtgt agtaagtaag tataagtaca gaccggagaa gtacgccggt 120

cctgattcgt ttaatttgaa agaagaaaat gcctgctgcg aagagggtga aattggatcc 180

ggcggccaaa cgagtcaaac ttgatccagc tgctaagcga gtgaagctag acggtggtgg 240

ggggtctggg ggaggtggta gcggaggtgg aggtagcaga gaccacatgg tattgcacga 300

atatgtaaat gcggctggca ttaccggagg ggggggtagc gggggcggcg gatccggtgg 360

tggaagcagc agagaccata tggttttgca cgagtatgtc aatgccgcgg gcataacgta 420

ataaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaacaccac 480

caccaccacc actgcatggt taattcctcc tg 512

<210> 2

<211> 858

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 1-IRES:NtHSF

<400> 2

ggcacgaggc tcccattaat atttcttctt ctgtgtaatt ccattattct gtagtagatt 60

cacgtccgag tttaaagaag agagaaaact gaaaaggcag aaaattccag agctttagat 120

ttagccaaag atagttatgg tcgtgttgtt cttggtgaag attggcaaag taggagccaa 180

tggaagaaac taagatcata atcaatcgcc ccaaaaacaa ccttgttcat tctatggttt 240

ttctcttcgg tttctatgtt tgggattggg aattcctcac tgtccttttg cttttcagtt 300

attgctcctt ctaattttcc ctagctagga tcttctcaat taatttcctt tttcattttc 360

aactaactca taattagccc aaatcttcaa aagagttttg tgtaagttga tagacgttta 420

gagaaacaga gaaatacagg ggaaaaacaa gggatgcctg ctgcgaagag ggtgaaattg 480

gatccggcgg ccaaacgagt caaacttgat ccagctgcta agcgagtgaa gctagacggt 540

ggtggggggt ctgggggagg tggtagcgga ggtggaggta gcagagacca catggtattg 600

cacgaatatg taaatgcggc tggcattacc ggaggggggg gtagcggggg cggcggatcc 660

ggtggtggaa gcagcagaga ccatatggtt ttgcacgagt atgtcaatgc cgcgggcata 720

acgtaataaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaac 780

accaccacca ccaccactgc atggttaatt cctcctgcag ataaaaaaaa tccttagctt 840

tcgctaagga tgatttct 858

<210> 3

<211> 597

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 1-IRES:TuMV

<400> 3

gggaaagctt gcatgcctgc aggtcgactc tagaaaaata taaaaactca acacaacata 60

cacaaaacga ttaaagcaaa cacaatcttt caaagcattc aaagcattca agcaatcaaa 120

gattttcaaa tcttttgtcg ttatcaaagc aatcaccaac aggatccagg atccccgggt 180

ggtcagtccc ttatgcctgc tgcgaagagg gtgaaattgg atccggcggc caaacgagtc 240

aaacttgatc cagctgctaa gcgagtgaag ctagacggtg gtggggggtc tgggggaggt 300

ggtagcggag gtggaggtag cagagaccac atggtattgc acgaatatgt aaatgcggct 360

ggcattaccg gagggggggg tagcgggggc ggcggatccg gtggtggaag cagcagagac 420

catatggttt tgcacgagta tgtcaatgcc gcgggcataa cgtaataaaa aaaaaaaaaa 480

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaca ccaccaccac caccactgca 540

tggttaattc ctcctgcaga taaaaaaaat ccttagcttt cgctaaggat gatttct 597

<210> 4

<211> 554

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 1-IRES:crTEV

<400> 4

aaataacaaa tctcaacaca acatatacaa aacaaacgaa tctcaagcaa tcaagcattc 60

tacttctatt gcagcaattt aaatcatttc ttttaaagca aaagcaattt tctgaaaatt 120

ttcaccattt acgaacgata gcaatgcctg ctgcgaagag ggtgaaattg gatccggcgg 180

ccaaacgagt caaacttgat ccagctgcta agcgagtgaa gctagacggt ggtggggggt 240

ctgggggagg tggtagcgga ggtggaggta gcagagacca catggtattg cacgaatatg 300

taaatgcggc tggcattacc ggaggggggg gtagcggggg cggcggatcc ggtggtggaa 360

gcagcagaga ccatatggtt ttgcacgagt atgtcaatgc cgcgggcata acgtaataaa 420

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaac accaccacca 480

ccaccactgc atggttaatt cctcctgcag ataaaaaaaa tccttagctt tcgctaagga 540

tgatttctga tatc 554

<210> 5

<211> 524

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 1-CITE:SNTV

<400> 5

aaaaaaaaaa aagtaaagac aggaaacttt actgactaac atgcctgctg cgaagagggt 60

gaaattggat ccggcggcca aacgagtcaa acttgatcca gctgctaagc gagtgaagct 120

agacggtggt ggggggtctg ggggaggtgg tagcggaggt ggaggtagca gagaccacat 180

ggtattgcac gaatatgtaa atgcggctgg cattaccgga ggggggggta gcgggggcgg 240

cggatccggt ggtggaagca gcagagacca tatggttttg cacgagtatg tcaatgccgc 300

gggcataacg taataaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 360

aaaaaatccc agaggttcac aatgttagtg atggggcgct gaaagatgcg tagctaccct 420

tctggagcca cttcctggtg gtaagcagaa atccaagggt acggtggtac ggtggaaagc 480

agtccccacc accaccacca ccactgcatg gttaattcct cctg 524

<210> 6

<211> 550

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 2-IRES:crTMV (发夹)

<400> 6

caggaggaat taaccatgca gtggtggtgg tggtggtgga attcgtcgat tcggttgcag 60

catttaaagc ggttgacaac tttaaaagaa ggaaaaagaa ggttgaagaa aagggtgtag 120

taagtaagta taagtacaga ccggagaagt acgccggtcc tgattcgttt aatttgaaag 180

aagaaaatgc ctgctgcgaa gagggtgaaa ttggatccgg cggccaaacg agtcaaactt 240

gatccagctg ctaagcgagt gaagctagac ggtggtgggg ggtctggggg aggtggtagc 300

ggaggtggag gtagcagaga ccacatggta ttgcacgaat atgtaaatgc ggctggcatt 360

accggagggg ggggtagcgg gggcggcgga tccggtggtg gaagcagcag agaccatatg 420

gttttgcacg agtatgtcaa tgccgcgggc ataacgtaat aaaaaaaaaa aaaaaaaaaa 480

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aacaccacca ccaccaccac tgcatggtta 540

attcctcctg 550

<210> 7

<211> 896

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 2-IRES:NtHSF (发夹)

<400> 7

caggaggaat taaccatgca gtggtggtgg tggtggtggg cacgaggctc ccattaatat 60

ttcttcttct gtgtaattcc attattctgt agtagattca cgtccgagtt taaagaagag 120

agaaaactga aaaggcagaa aattccagag ctttagattt agccaaagat agttatggtc 180

gtgttgttct tggtgaagat tggcaaagta ggagccaatg gaagaaacta agatcataat 240

caatcgcccc aaaaacaacc ttgttcattc tatggttttt ctcttcggtt tctatgtttg 300

ggattgggaa ttcctcactg tccttttgct tttcagttat tgctccttct aattttccct 360

agctaggatc ttctcaatta atttcctttt tcattttcaa ctaactcata attagcccaa 420

atcttcaaaa gagttttgtg taagttgata gacgtttaga gaaacagaga aatacagggg 480

aaaaacaagg gatgcctgct gcgaagaggg tgaaattgga tccggcggcc aaacgagtca 540

aacttgatcc agctgctaag cgagtgaagc tagacggtgg tggggggtct gggggaggtg 600

gtagcggagg tggaggtagc agagaccaca tggtattgca cgaatatgta aatgcggctg 660

gcattaccgg aggggggggt agcgggggcg gcggatccgg tggtggaagc agcagagacc 720

atatggtttt gcacgagtat gtcaatgccg cgggcataac gtaataaaaa aaaaaaaaaa 780

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaacac caccaccacc accactgcat 840

ggttaattcc tcctgcagat aaaaaaaatc cttagctttc gctaaggatg atttct 896

<210> 8

<211> 592

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 2-IRES:crTEV (发夹)

<400> 8

caggaggaat taaccatgca gtggtggtgg tggtggtgaa ataacaaatc tcaacacaac 60

atatacaaaa caaacgaatc tcaagcaatc aagcattcta cttctattgc agcaatttaa 120

atcatttctt ttaaagcaaa agcaattttc tgaaaatttt caccatttac gaacgatagc 180

aatgcctgct gcgaagaggg tgaaattgga tccggcggcc aaacgagtca aacttgatcc 240

agctgctaag cgagtgaagc tagacggtgg tggggggtct gggggaggtg gtagcggagg 300

tggaggtagc agagaccaca tggtattgca cgaatatgta aatgcggctg gcattaccgg 360

aggggggggt agcgggggcg gcggatccgg tggtggaagc agcagagacc atatggtttt 420

gcacgagtat gtcaatgccg cgggcataac gtaataaaaa aaaaaaaaaa aaaaaaaaaa 480

aaaaaaaaaa aaaaaaaaaa aaaaaaacac caccaccacc accactgcat ggttaattcc 540

tcctgcagat aaaaaaaatc cttagctttc gctaaggatg atttctgata tc 592

<210> 9

<211> 635

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 2-IRES:TuMV (发夹)

<400> 9

caggaggaat taaccatgca gtggtggtgg tggtggtggg gaaagcttgc atgcctgcag 60

gtcgactcta gaaaaatata aaaactcaac acaacataca caaaacgatt aaagcaaaca 120

caatctttca aagcattcaa agcattcaag caatcaaaga ttttcaaatc ttttgtcgtt 180

atcaaagcaa tcaccaacag gatccaggat ccccgggtgg tcagtccctt atgcctgctg 240

cgaagagggt gaaattggat ccggcggcca aacgagtcaa acttgatcca gctgctaagc 300

gagtgaagct agacggtggt ggggggtctg ggggaggtgg tagcggaggt ggaggtagca 360

gagaccacat ggtattgcac gaatatgtaa atgcggctgg cattaccgga ggggggggta 420

gcgggggcgg cggatccggt ggtggaagca gcagagacca tatggttttg cacgagtatg 480

tcaatgccgc gggcataacg taataaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 540

aaaaaaaaaa aaaaaacacc accaccacca ccactgcatg gttaattcct cctgcagata 600

aaaaaaatcc ttagctttcg ctaaggatga tttct 635

<210> 10

<211> 562

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> 2-CITE:SNTV (发夹)

<400> 10

caggaggaat taaccatgca gtggtggtgg tggtggtgaa aaaaaaaaaa gtaaagacag 60

gaaactttac tgactaacat gcctgctgcg aagagggtga aattggatcc ggcggccaaa 120

cgagtcaaac ttgatccagc tgctaagcga gtgaagctag acggtggtgg ggggtctggg 180

ggaggtggta gcggaggtgg aggtagcaga gaccacatgg tattgcacga atatgtaaat 240

gcggctggca ttaccggagg ggggggtagc gggggcggcg gatccggtgg tggaagcagc 300

agagaccata tggttttgca cgagtatgtc aatgccgcgg gcataacgta ataaaaaaaa 360

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatcccag aggttcacaa 420

tgttagtgat ggggcgctga aagatgcgta gctacccttc tggagccact tcctggtggt 480

aagcagaaat ccaagggtac ggtggtacgg tggaaagcag tccccaccac caccaccacc 540

actgcatggt taattcctcc tg 562

<210> 11

<211> 21

<212> PRT

<213> 大肠杆菌(E. Coli)

<400> 11

Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala

1 5 10 15

Thr Val Ala Gln Ala

20

<210> 12

<211> 22

<212> PRT

<213> 自胡萝卜软腐欧文氏菌(Erwinia carotovora)

<400> 12

Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala

1 5 10 15

Ala Gln Pro Ala Met Ala

20

<210> 13

<211> 23

<212> PRT

<213> 细菌(bacteria)

<400> 13

Met Lys Lys Asn Ile Ala Phe Leu Leu Ala Ser Met Phe Val Phe Ser

1 5 10 15

Ile Ala Thr Asn Ala Tyr Ala

20

<210> 14

<211> 28

<212> PRT

<213> 芽孢杆菌(Bacillus sp.)

<400> 14

Met Phe Lys Phe Lys Lys Lys Phe Leu Val Gly Leu Thr Ala Ala Phe

1 5 10 15

Met Ser Ile Ser Met Phe Ser Ala Thr Ala Ser Ala

20 25

<210> 15

<211> 21

<212> PRT

<213> 大肠杆菌(E. Coli)

<400> 15

Met Lys Gln Ser Thr Ile Ala Leu Ala Leu Leu Pro Leu Leu Phe Thr

1 5 10 15

Pro Val Thr Lys Ala

20

<210> 16

<211> 22

<212> PRT

<213> 大肠杆菌(E. Coli)

<400> 16

Met Met Lys Arg Asn Ile Leu Ala Val Ile Val Pro Ala Leu Leu Val

1 5 10 15

Ala Gly Thr Ala Asn Ala

20

<210> 17

<211> 21

<212> PRT

<213> 大肠杆菌(E. Coli)

<400> 17

Met Lys Lys Ser Thr Leu Ala Leu Val Val Met Gly Ile Val Ala Ser

1 5 10 15

Ala Ser Val Gln Ala

20

<210> 18

<211> 26

<212> PRT

<213> 大肠杆菌(E. Coli)

<400> 18

Met Lys Ile Lys Thr Gly Ala Arg Ile Leu Ala Leu Ser Ala Leu Thr

1 5 10 15

Thr Met Met Phe Ser Ala Ser Ala Leu Ala

20 25

<210> 19

<211> 21

<212> PRT

<213> 大肠杆菌(E. Coli)

<400> 19

Met Lys Val Lys Val Leu Ser Leu Leu Val Pro Ala Leu Leu Val Ala

1 5 10 15

Gly Ala Ala Asn Ala

20

<210> 20

<211> 20

<212> PRT

<213> 大肠杆菌(E. Coli)

<400> 20

Met Lys Ala Thr Lys Leu Val Leu Gly Ala Val Ile Leu Gly Ser Thr

1 5 10 15

Leu Leu Ala Gly

20

<210> 21

<211> 25

<212> PRT

<213> 大肠杆菌(E. Coli)

<400> 21

Met Met Ile Thr Leu Arg Lys Leu Pro Leu Ala Val Ala Val Ala Ala

1 5 10 15

Gly Val Met Ser Ala Gln Ala Met Ala

20 25

<210> 22

<211> 20

<212> PRT

<213> 大肠杆菌(E. Coli)

<400> 22

Met Arg Ala Lys Leu Leu Gly Ile Val Leu Thr Thr Pro Ile Ala Ile

1 5 10 15

Ser Ser Phe Ala

20

<210> 23

<211> 25

<212> PRT

<213> 大肠杆菌(E. Coli)

<400> 23

Ser Lys Gln His Tyr Gly Ile Arg Lys Tyr Lys Val Gly Val Cys Ser

1 5 10 15

Ala Leu Ile Ala Leu Ser Ile Leu Gly

20 25

<210> 24

<211> 1065

<212> DNA

<213> 拟南芥(Arabidopsis thaliana)

<400> 24

gaccacgtgt acaagggtca gctgcaagcg tatgcgctgc agcacaacct ggagctgccg 60

gtttacgcga acgagcgtga aggtccgccg cacgcgccgc gtttccgttg caacgtgacc 120

ttctgcggcc agacctttca aagcagcgag ttctttccga ccctgaaaag cgcggaacac 180

gcggcggcga agatcgcggt ggcgagcctg accccgcaaa gcccggaagg tatcgatgtt 240

gcgtacaaaa acctgctgca ggagattgcg caaaaggaaa gcagcctgct gccgttctat 300

gcgaccgcga ccagcggtcc gagccacgcg ccgaccttta ccagcaccgt ggagttcgcg 360

ggtaaagttt ttagcggcga ggaagcgaag accaagaaac tggcggaaat gagcgcggcg 420

aaagttgcgt tcatgagcat taagaacggt aacagcaacc agaccggtag cccgaccctg 480

ccgagcgagc gtcaagaaga cgtgaacagc aacgttaaaa gcagcccgca ggagatccac 540

agccaaccga gcagcaaggt ggttatgacc ccggacaccc cgagcaaagg tattaaggtt 600

aacgaggatg aatttccgga cctgcacgat gcgccggcga gcaacgcgaa agaaatcaac 660

gtggcgctga acgagccgga aaacccgacc aacgacggta ccctgagcgc gctgaccacc 720

gatggcatga agatgaacat cgcgagcagc agcctgccga ttccgcacaa cccgaccaac 780

gttattaccc tgaacgcgcc ggcggcgaac ggtatcaagc gtaacattgc ggcgtgcagc 840

agctggatgc cgcagaaccc gaccaacgac ggcagcgaga ccagcagctg cgtggttgat 900

gagagcgaaa agaaaaagct gatcatgggt accggtcacc tgagcattcc gaccggtcag 960

cacgtggttt gccgtccgtg gaacccggag atcaccctgc cgcaagatgc ggaaatgctg 1020

ttccgtgacg ataaatttat tgcgtatcgt ctggtgaagc cgtaa 1065

<210> 25

<211> 355

<212> PRT

<213> 拟南芥(Arabidopsis thaliana)

<400> 25

Met Asp His Val Tyr Lys Gly Gln Leu Gln Ala Tyr Ala Leu Gln His

1 5 10 15

Asn Leu Glu Leu Pro Val Tyr Ala Asn Glu Arg Glu Gly Pro Pro His

20 25 30

Ala Pro Arg Phe Arg Cys Asn Val Thr Phe Cys Gly Gln Thr Phe Gln

35 40 45

Ser Ser Glu Phe Phe Pro Thr Leu Lys Ser Ala Glu His Ala Ala Ala

50 55 60

Lys Ile Ala Val Ala Ser Leu Thr Pro Gln Ser Pro Glu Gly Ile Asp

65 70 75 80

Val Ala Tyr Lys Asn Leu Leu Gln Glu Ile Ala Gln Lys Glu Ser Ser

85 90 95

Leu Leu Pro Phe Tyr Ala Thr Ala Thr Ser Gly Pro Ser His Ala Pro

100 105 110

Thr Phe Thr Ser Thr Val Glu Phe Ala Gly Lys Val Phe Ser Gly Glu

115 120 125

Glu Ala Lys Thr Lys Lys Leu Ala Glu Met Ser Ala Ala Lys Val Ala

130 135 140

Phe Met Ser Ile Lys Asn Gly Asn Ser Asn Gln Thr Gly Ser Pro Thr

145 150 155 160

Leu Pro Ser Glu Arg Gln Glu Asp Val Asn Ser Asn Val Lys Ser Ser

165 170 175

Pro Gln Glu Ile His Ser Gln Pro Ser Ser Lys Val Val Met Thr Pro

180 185 190

Asp Thr Pro Ser Lys Gly Ile Lys Val Asn Glu Asp Glu Phe Pro Asp

195 200 205

Leu His Asp Ala Pro Ala Ser Asn Ala Lys Glu Ile Asn Val Ala Leu

210 215 220

Asn Glu Pro Glu Asn Pro Thr Asn Asp Gly Thr Leu Ser Ala Leu Thr

225 230 235 240

Thr Asp Gly Met Lys Met Asn Ile Ala Ser Ser Ser Leu Pro Ile Pro

245 250 255

His Asn Pro Thr Asn Val Ile Thr Leu Asn Ala Pro Ala Ala Asn Gly

260 265 270

Ile Lys Arg Asn Ile Ala Ala Cys Ser Ser Trp Met Pro Gln Asn Pro

275 280 285

Thr Asn Asp Gly Ser Glu Thr Ser Ser Cys Val Val Asp Glu Ser Glu

290 295 300

Lys Lys Lys Leu Ile Met Gly Thr Gly His Leu Ser Ile Pro Thr Gly

305 310 315 320

Gln His Val Val Cys Arg Pro Trp Asn Pro Glu Ile Thr Leu Pro Gln

325 330 335

Asp Ala Glu Met Leu Phe Arg Asp Asp Lys Phe Ile Ala Tyr Arg Leu

340 345 350

Val Lys Pro

355

<210> 26

<211> 739

<212> DNA

<213> 拟南芥(Arabidopsis thaliana)

<400> 26

aagcaagaaa cactgcagcg agctgctgcc gaacaagatg ttccgtaacc aggacagcaa 60

gtacctgatc ccggttcaaa aagaagcgcc gccggtgacc accctgccga tgaaggcgag 120

caccgttaaa agcccgcaca actgcgaggc gatcctgcgt gacgcggatc cgccgattag 180

cctgagcagc gttaacctga gcgaacagct gcgtagcggc gtgttcctga agccgaagaa 240

acaaatcaaa tactgggttg atgagcgtaa cagcaactgc ttcatgctgt ttgcgaagaa 300

cctgagcatt acctggagcg acgatgtgaa ctattggacc tggtttaccg agaaagaaag 360

cccgaacgag aacgttgaag cggtgggtct gaagaacgtg tgctggctgg acatcaccgg 420

caaattcgat acccgtaacc tgaccccggg tattgtttac gaggtggttt ttaaggtgaa 480

actggaagac ccggcgtatg gctgggatac cccggttaac ctgaaactgg tgctgccgaa 540

cggcaaggag aaaccgcagg aaaagaaagt tagcctgcgt gaactgccgc gttacaagtg 600

ggtggacgtt cgtgtgggcg agttcgtgcc ggagaagagc gcggcgggcg agatcacctt 660

tagcatgtat gaacacgcgg cgggtgtttg gaagaaaggc ctgagcctga agggtgtggc 720

gattcgtccg aaacaataa 739

<210> 27

<211> 246

<212> PRT

<213> 拟南芥(Arabidopsis thaliana)

<400> 27

Met Ser Lys Lys His Cys Ser Glu Leu Leu Pro Asn Lys Met Phe Arg

1 5 10 15

Asn Gln Asp Ser Lys Tyr Leu Ile Pro Val Gln Lys Glu Ala Pro Pro

20 25 30

Val Thr Thr Leu Pro Met Lys Ala Ser Thr Val Lys Ser Pro His Asn

35 40 45

Cys Glu Ala Ile Leu Arg Asp Ala Asp Pro Pro Ile Ser Leu Ser Ser

50 55 60

Val Asn Leu Ser Glu Gln Leu Arg Ser Gly Val Phe Leu Lys Pro Lys

65 70 75 80

Lys Gln Ile Lys Tyr Trp Val Asp Glu Arg Asn Ser Asn Cys Phe Met

85 90 95

Leu Phe Ala Lys Asn Leu Ser Ile Thr Trp Ser Asp Asp Val Asn Tyr

100 105 110

Trp Thr Trp Phe Thr Glu Lys Glu Ser Pro Asn Glu Asn Val Glu Ala

115 120 125

Val Gly Leu Lys Asn Val Cys Trp Leu Asp Ile Thr Gly Lys Phe Asp

130 135 140

Thr Arg Asn Leu Thr Pro Gly Ile Val Tyr Glu Val Val Phe Lys Val

145 150 155 160

Lys Leu Glu Asp Pro Ala Tyr Gly Trp Asp Thr Pro Val Asn Leu Lys

165 170 175

Leu Val Leu Pro Asn Gly Lys Glu Lys Pro Gln Glu Lys Lys Val Ser

180 185 190

Leu Arg Glu Leu Pro Arg Tyr Lys Trp Val Asp Val Arg Val Gly Glu

195 200 205

Phe Val Pro Glu Lys Ser Ala Ala Gly Glu Ile Thr Phe Ser Met Tyr

210 215 220

Glu His Ala Ala Gly Val Trp Lys Lys Gly Leu Ser Leu Lys Gly Val

225 230 235 240

Ala Ile Arg Pro Lys Gln

245

<210> 28

<211> 14

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> Kozak(SD) 序列

<400> 28

aggaggtacc cacc 14

<210> 29

<211> 2781

<212> DNA

<213> 嗜热链球菌(链球菌(Streptococcus) thermophilus)

<400> 29

atgaaacata ttaatgatta tttttgggct aagaaaacag aggaaaatag tagacttctt 60

tggttaccat taactcaaca cttagaagac acgaaaaata ttgcaggcct cttatgggaa 120

cattggttaa gtgaaggaca aaaggtatta attgaaaatt ctattaatgt taaatcaaat 180

attgaaaacc aagggaaaag attggcacaa ttcctaggag ctgttcatga tatcggtaaa 240

gcaacaccag cttttcagac gcaaaaaggt tatgcaaatt cagtagattt ggatattcaa 300

ttgttagaaa aattggaacg cgcaggtttt tctggcatta gttctctcca actagcctcc 360

cccaaaaaga gtcatcatag cattgcaggt caatatttgt tatcccatta tggcgtggac 420

gaagatattg caacaattat tggtggacac catggacgac cagttgatga tttagacggt 480

ttaaattctc aaaaaagcta tccctccaat tattaccagg atgaaaagaa agatagtctc 540

gtttatcaga aatggaagtc aaatcaagaa gcttttttaa actgggcttt aacagaaaca 600

gggtttaatt ctgtgtctca gcttccaaaa atcaaacagc ctgctcaagt tattctatca 660

ggtttactca taatgtctga ctggattgct agtaatgagc atttttttcc tttgttaagt 720

ttggatgaaa ctgatgtgaa aaacaagagt caacgtattg aaactgggtt taaaaagtgg 780

aaaaaatcta acttgtggca acctgaaact ttcgttgacc ttgttactct ttatcaggaa 840

agatttggat ttagtccacg aaattttcag ctgatactct cacaaacaat cgaaaagacg 900

actaatcctg ggatagtgat actggaagcg ccaatgggaa tcgggaaaac agaggcggct 960

ctagcggtat cagagcagtt atctagtaaa aaaggatgta gtggattgtt ttttggattg 1020

cccacacaag caacctccaa tggaattttt aagaggattg aacagtggac agagaatata 1080

aagggtaaca attctgatca tttttccatt cagctggttc atggaaaagc agccttaaat 1140

acggatttta ttgagttact taaaggaaat acaattaata tggacgactc ggaaaacggc 1200

agtatttttg tcaatgagtg gttttctggg agaaaaactt cagcattaga tgattttgta 1260

gttgggacgg tcgaccaatt tttaatggtg gctttaaaac aaaaacattt ggccttacgt 1320

catttaggat ttagtaaaaa agttatcgtt attgatgaag tccacgctta tgatgcttat 1380

atgagccaat atttgttgga agctatcaga tggatgggag cttatggtgt tcctgtaatt 1440

attttatcag caactttacc tgcccaacaa agagaaaaac tcataaaaag ctatatggct 1500

ggaatgggag tgaaatggcg agatattgaa aatatagatc agataaaaat agacgcatac 1560

cctttaatca cttataatga cgggcctgac attcatcaag ttaaaatgtt cgaaaagcaa 1620

gaacaaaaaa atatctacat tcatcgttta ccagaagaac agttatttga tattgtaaaa 1680

gaaggtcttg acaatggtgg agtagttggg ataattgtca atacggtgag aaaatctcaa 1740

gaattggcaa gaaatttttc agatattttt ggagatgata tggtagattt gcttcattct 1800

aatttcatag caactgaaag aatccgaaaa gaaaaggatt tattgcaaga aattgggaaa 1860

aaagcaatac gtccaccaaa gaaaatcatt attggtacac aggtgcttga acagtcgtta 1920

gatattgatt ttgatgtact gataagcgac ttagcgccta tggatttact cattcaacgt 1980

atcggacgac tacatcgtca caaaatcaaa aggccccaaa agcacgaagt agcaagattt 2040

tatgttttag gaacatttga agagtttgat tttgatgaag gaacgcgttt ggtttatggg 2100

gactacctat tagctagaac tcagtacttt ttaccagata aaatacgact tcctgatgat 2160

atttcaccgc tagtccaaaa ggtttataat tcagacctaa caattacgtt tccaaagcca 2220

gaacttcata aaaaatattt ggatgctaaa atagaacatg atgataagat taaaaataaa 2280

gaaacaaagg caaagtcata ccgtattgct aatcctgtct taaaaaaatc gagagttcga 2340

actaacagtt tgattggttg gttaaagaac ctccatccaa atgatagtga agaaaaagca 2400

tatgctcaag ttcgagatat tgaagataca gttgaagtga ttgcattaaa aaaaatatct 2460

gatgggtatg gtttgttcat agaaaataaa gatatatctc agaacattac tgatcctata 2520

attgcaaaaa aggtagcaca aaatacttta cgacttccga tgagtttatc caaagcctat 2580

aatattgatc aaacgattaa tgagcttgaa agatataaca atagccactt aagtcaatgg 2640

caaaactcat catggttaaa gggatctctt gggattattt ttgataaaaa caatgagttt 2700

atactgaatg gatttaaact attatatgat gaaaaatatg gtgttaccat agaaaggttg 2760

gataagaatg agtcggttta a 2781

<210> 30

<211> 926

<212> PRT

<213> 嗜热链球菌(链球菌(Streptococcus) thermophilus)

<400> 30

Met Lys His Ile Asn Asp Tyr Phe Trp Ala Lys Lys Thr Glu Glu Asn

1 5 10 15

Ser Arg Leu Leu Trp Leu Pro Leu Thr Gln His Leu Glu Asp Thr Lys

20 25 30

Asn Ile Ala Gly Leu Leu Trp Glu His Trp Leu Ser Glu Gly Gln Lys

35 40 45

Val Leu Ile Glu Asn Ser Ile Asn Val Lys Ser Asn Ile Glu Asn Gln

50 55 60

Gly Lys Arg Leu Ala Gln Phe Leu Gly Ala Val His Asp Ile Gly Lys

65 70 75 80

Ala Thr Pro Ala Phe Gln Thr Gln Lys Gly Tyr Ala Asn Ser Val Asp

85 90 95

Leu Asp Ile Gln Leu Leu Glu Lys Leu Glu Arg Ala Gly Phe Ser Gly

100 105 110

Ile Ser Ser Leu Gln Leu Ala Ser Pro Lys Lys Ser His His Ser Ile

115 120 125

Ala Gly Gln Tyr Leu Leu Ser His Tyr Gly Val Asp Glu Asp Ile Ala

130 135 140

Thr Ile Ile Gly Gly His His Gly Arg Pro Val Asp Asp Leu Asp Gly

145 150 155 160

Leu Asn Ser Gln Lys Ser Tyr Pro Ser Asn Tyr Tyr Gln Asp Glu Lys

165 170 175

Lys Asp Ser Leu Val Tyr Gln Lys Trp Lys Ser Asn Gln Glu Ala Phe

180 185 190

Leu Asn Trp Ala Leu Thr Glu Thr Gly Phe Asn Ser Val Ser Gln Leu

195 200 205

Pro Lys Ile Lys Gln Pro Ala Gln Val Ile Leu Ser Gly Leu Leu Ile

210 215 220

Met Ser Asp Trp Ile Ala Ser Asn Glu His Phe Phe Pro Leu Leu Ser

225 230 235 240

Leu Asp Glu Thr Asp Val Lys Asn Lys Ser Gln Arg Ile Glu Thr Gly

245 250 255

Phe Lys Lys Trp Lys Lys Ser Asn Leu Trp Gln Pro Glu Thr Phe Val

260 265 270

Asp Leu Val Thr Leu Tyr Gln Glu Arg Phe Gly Phe Ser Pro Arg Asn

275 280 285

Phe Gln Leu Ile Leu Ser Gln Thr Ile Glu Lys Thr Thr Asn Pro Gly

290 295 300

Ile Val Ile Leu Glu Ala Pro Met Gly Ile Gly Lys Thr Glu Ala Ala

305 310 315 320

Leu Ala Val Ser Glu Gln Leu Ser Ser Lys Lys Gly Cys Ser Gly Leu

325 330 335

Phe Phe Gly Leu Pro Thr Gln Ala Thr Ser Asn Gly Ile Phe Lys Arg

340 345 350

Ile Glu Gln Trp Thr Glu Asn Ile Lys Gly Asn Asn Ser Asp His Phe

355 360 365

Ser Ile Gln Leu Val His Gly Lys Ala Ala Leu Asn Thr Asp Phe Ile

370 375 380

Glu Leu Leu Lys Gly Asn Thr Ile Asn Met Asp Asp Ser Glu Asn Gly

385 390 395 400

Ser Ile Phe Val Asn Glu Trp Phe Ser Gly Arg Lys Thr Ser Ala Leu

405 410 415

Asp Asp Phe Val Val Gly Thr Val Asp Gln Phe Leu Met Val Ala Leu

420 425 430

Lys Gln Lys His Leu Ala Leu Arg His Leu Gly Phe Ser Lys Lys Val

435 440 445

Ile Val Ile Asp Glu Val His Ala Tyr Asp Ala Tyr Met Ser Gln Tyr

450 455 460

Leu Leu Glu Ala Ile Arg Trp Met Gly Ala Tyr Gly Val Pro Val Ile

465 470 475 480

Ile Leu Ser Ala Thr Leu Pro Ala Gln Gln Arg Glu Lys Leu Ile Lys

485 490 495

Ser Tyr Met Ala Gly Met Gly Val Lys Trp Arg Asp Ile Glu Asn Ile

500 505 510

Asp Gln Ile Lys Ile Asp Ala Tyr Pro Leu Ile Thr Tyr Asn Asp Gly

515 520 525

Pro Asp Ile His Gln Val Lys Met Phe Glu Lys Gln Glu Gln Lys Asn

530 535 540

Ile Tyr Ile His Arg Leu Pro Glu Glu Gln Leu Phe Asp Ile Val Lys

545 550 555 560

Glu Gly Leu Asp Asn Gly Gly Val Val Gly Ile Ile Val Asn Thr Val

565 570 575

Arg Lys Ser Gln Glu Leu Ala Arg Asn Phe Ser Asp Ile Phe Gly Asp

580 585 590

Asp Met Val Asp Leu Leu His Ser Asn Phe Ile Ala Thr Glu Arg Ile

595 600 605

Arg Lys Glu Lys Asp Leu Leu Gln Glu Ile Gly Lys Lys Ala Ile Arg

610 615 620

Pro Pro Lys Lys Ile Ile Ile Gly Thr Gln Val Leu Glu Gln Ser Leu

625 630 635 640

Asp Ile Asp Phe Asp Val Leu Ile Ser Asp Leu Ala Pro Met Asp Leu

645 650 655

Leu Ile Gln Arg Ile Gly Arg Leu His Arg His Lys Ile Lys Arg Pro

660 665 670

Gln Lys His Glu Val Ala Arg Phe Tyr Val Leu Gly Thr Phe Glu Glu

675 680 685

Phe Asp Phe Asp Glu Gly Thr Arg Leu Val Tyr Gly Asp Tyr Leu Leu

690 695 700

Ala Arg Thr Gln Tyr Phe Leu Pro Asp Lys Ile Arg Leu Pro Asp Asp

705 710 715 720

Ile Ser Pro Leu Val Gln Lys Val Tyr Asn Ser Asp Leu Thr Ile Thr

725 730 735

Phe Pro Lys Pro Glu Leu His Lys Lys Tyr Leu Asp Ala Lys Ile Glu

740 745 750

His Asp Asp Lys Ile Lys Asn Lys Glu Thr Lys Ala Lys Ser Tyr Arg

755 760 765

Ile Ala Asn Pro Val Leu Lys Lys Ser Arg Val Arg Thr Asn Ser Leu

770 775 780

Ile Gly Trp Leu Lys Asn Leu His Pro Asn Asp Ser Glu Glu Lys Ala

785 790 795 800

Tyr Ala Gln Val Arg Asp Ile Glu Asp Thr Val Glu Val Ile Ala Leu

805 810 815

Lys Lys Ile Ser Asp Gly Tyr Gly Leu Phe Ile Glu Asn Lys Asp Ile

820 825 830

Ser Gln Asn Ile Thr Asp Pro Ile Ile Ala Lys Lys Val Ala Gln Asn

835 840 845

Thr Leu Arg Leu Pro Met Ser Leu Ser Lys Ala Tyr Asn Ile Asp Gln

850 855 860

Thr Ile Asn Glu Leu Glu Arg Tyr Asn Asn Ser His Leu Ser Gln Trp

865 870 875 880

Gln Asn Ser Ser Trp Leu Lys Gly Ser Leu Gly Ile Ile Phe Asp Lys

885 890 895

Asn Asn Glu Phe Ile Leu Asn Gly Phe Lys Leu Leu Tyr Asp Glu Lys

900 905 910

Tyr Gly Val Thr Ile Glu Arg Leu Asp Lys Asn Glu Ser Val

915 920 925

<210> 31

<211> 4107

<212> DNA

<213> 链球菌(Streptococcus)

<400> 31

atggataaga aatactcaat aggcttagat atcggcacaa atagcgtcgg atgggcggtg 60

atcactgatg aatataaggt tccgtctaaa aagttcaagg ttctgggaaa tacagaccgc 120

cacagtatca aaaaaaatct tataggggct cttttatttg acagtggaga gacagcggaa 180

gcgactcgtc tcaaacggac agctcgtaga aggtatacac gtcggaagaa tcgtatttgt 240

tatctacagg agattttttc aaatgagatg gcgaaagtag atgatagttt ctttcatcga 300

cttgaagagt cttttttggt ggaagaagac aagaagcatg aacgtcatcc tatttttgga 360

aatatagtag atgaagttgc ttatcatgag aaatatccaa ctatctatca tctgcgaaaa 420

aaattggtag attctactga taaagcggat ttgcgcttaa tctatttggc cttagcgcat 480

atgattaagt ttcgtggtca ttttttgatt gagggagatt taaatcctga taatagtgat 540

gtggacaaac tatttatcca gttggtacaa acctacaatc aattatttga agaaaaccct 600

attaacgcaa gtggagtaga tgctaaagcg attctttctg cacgattgag taaatcaaga 660

cgattagaaa atctcattgc tcagctcccc ggtgagaaga aaaatggctt atttgggaat 720

ctcattgctt tgtcattggg tttgacccct aattttaaat caaattttga tttggcagaa 780

gatgctaaat tacagctttc aaaagatact tacgatgatg atttagataa tttattggcg 840

caaattggag atcaatatgc tgatttgttt ttggcagcta agaatttatc agatgctatt 900

ttactttcag atatcctaag agtaaatact gaaataacta aggctcccct atcagcttca 960

atgattaaac gctacgatga acatcatcaa gacttgactc ttttaaaagc tttagttcga 1020

caacaacttc cagaaaagta taaagaaatc ttttttgatc aatcaaaaaa cggatatgca 1080

ggttatattg atgggggagc tagccaagaa gaattttata aatttatcaa accaatttta 1140

gaaaaaatgg atggtactga ggaattattg gtgaaactaa atcgtgaaga tttgctgcgc 1200

aagcaacgga cctttgacaa cggctctatt ccccatcaaa ttcacttggg tgagctgcat 1260

gctattttga gaagacaaga agacttttat ccatttttaa aagacaatcg tgagaagatt 1320

gaaaaaatct tgacttttcg aattccttat tatgttggtc cattggcgcg tggcaatagt 1380

cgttttgcat ggatgactcg gaagtctgaa gaaacaatta ccccatggaa ttttgaagaa 1440

gttgtcgata aaggtgcttc agctcaatca tttattgaac gcatgacaaa ctttgataaa 1500

aatcttccaa atgaaaaagt actaccaaaa catagtttgc tttatgagta ttttacggtt 1560

tataacgaat tgacaaaggt caaatatgtt actgaaggaa tgcgaaaacc agcatttctt 1620

tcaggtgaac agaagaaagc cattgttgat ttactcttca aaacaaatcg aaaagtaacc 1680

gttaagcaat taaaagaaga ttatttcaaa aaaatagaat gttttgatag tgttgaaatt 1740

tcaggagttg aagatagatt taatgcttca ttaggtacct accatgattt gctaaaaatt 1800

attaaagata aagatttttt ggataatgaa gaaaatgaag atatcttaga ggatattgtt 1860

ttaacattga ccttatttga agatagggag atgattgagg aaagacttaa aacatatgct 1920

cacctctttg atgataaggt gatgaaacag cttaaacgtc gccgttatac tggttgggga 1980

cgtttgtctc gaaaattgat taatggtatt agggataagc aatctggcaa aacaatatta 2040

gattttttga aatcagatgg ttttgccaat cgcaatttta tgcagctgat ccatgatgat 2100

agtttgacat ttaaagaaga cattcaaaaa gcacaagtgt ctggacaagg cgatagttta 2160

catgaacata ttgcaaattt agctggtagc cctgctatta aaaaaggtat tttacagact 2220

gtaaaagttg ttgatgaatt ggtcaaagta atggggcggc ataagccaga aaatatcgtt 2280

attgaaatgg cacgtgaaaa tcagacaact caaaagggcc agaaaaattc gcgagagcgt 2340

atgaaacgaa tcgaagaagg tatcaaagaa ttaggaagtc agattcttaa agagcatcct 2400

gttgaaaata ctcaattgca aaatgaaaag ctctatctct attatctcca aaatggaaga 2460

gacatgtatg tggaccaaga attagatatt aatcgtttaa gtgattatga tgtcgatcac 2520

attgttccac aaagtttcct taaagacgat tcaatagaca ataaggtctt aacgcgttct 2580

gataaaaatc gtggtaaatc ggataacgtt ccaagtgaag aagtagtcaa aaagatgaaa 2640

aactattgga gacaacttct aaacgccaag ttaatcactc aacgtaagtt tgataattta 2700

acgaaagctg aacgtggagg tttgagtgaa cttgataaag ctggttttat caaacgccaa 2760

ttggttgaaa ctcgccaaat cactaagcat gtggcacaaa ttttggatag tcgcatgaat 2820

actaaatacg atgaaaatga taaacttatt cgagaggtta aagtgattac cttaaaatct 2880

aaattagttt ctgacttccg aaaagatttc caattctata aagtacgtga gattaacaat 2940

taccatcatg cccatgatgc gtatctaaat gccgtcgttg gaactgcttt gattaagaaa 3000

tatccaaaac ttgaatcgga gtttgtctat ggtgattata aagtttatga tgttcgtaaa 3060

atgattgcta agtctgagca agaaataggc aaagcaaccg caaaatattt cttttactct 3120

aatatcatga acttcttcaa aacagaaatt acacttgcaa atggagagat tcgcaaacgc 3180

cctctaatcg aaactaatgg ggaaactgga gaaattgtct gggataaagg gcgagatttt 3240

gccacagtgc gcaaagtatt gtccatgccc caagtcaata ttgtcaagaa aacagaagta 3300

cagacaggcg gattctccaa ggagtcaatt ttaccaaaaa gaaattcgga caagcttatt 3360

gctcgtaaaa aagactggga tccaaaaaaa tatggtggtt ttgatagtcc aacggtagct 3420

tattcagtcc tagtggttgc taaggtggaa aaagggaaat cgaagaagtt aaaatccgtt 3480

aaagagttac tagggatcac aattatggaa agaagttcct ttgaaaaaaa tccgattgac 3540

tttttagaag ctaaaggata taaggaagtt aaaaaagact taatcattaa actacctaaa 3600

tatagtcttt ttgagttaga aaacggtcgt aaacggatgc tggctagtgc cggagaatta 3660

caaaaaggaa atgagctggc tctgccaagc aaatatgtga attttttata tttagctagt 3720

cattatgaaa agttgaaggg tagtccagaa gataacgaac aaaaacaatt gtttgtggag 3780

cagcataagc attatttaga tgagattatt gagcaaatca gtgaattttc taagcgtgtt 3840

attttagcag atgccaattt agataaagtt cttagtgcat ataacaaaca tagagacaaa 3900

ccaatacgtg aacaagcaga aaatattatt catttattta cgttgacgaa tcttggagct 3960

cccgctgctt ttaaatattt tgatacaaca attgatcgta aacgatatac gtctacaaaa 4020

gaagttttag atgccactct tatccatcaa tccatcactg gtctttatga aacacgcatt 4080

gatttgagtc agctaggagg tgactga 4107

<210> 32

<211> 1368

<212> PRT

<213> 链球菌(Streptococcus)

<400> 32

Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg

965 970 975

Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val

980 985 990

Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe

995 1000 1005

Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala

1010 1015 1020

Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe

1025 1030 1035

Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala

1040 1045 1050

Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu

1055 1060 1065

Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val

1070 1075 1080

Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr

1085 1090 1095

Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys

1100 1105 1110

Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro

1115 1120 1125

Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val

1130 1135 1140

Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys

1145 1150 1155

Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1160 1165 1170

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys

1175 1180 1185

Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu

1190 1195 1200

Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly

1205 1210 1215

Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val

1220 1225 1230

Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser

1235 1240 1245

Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys

1250 1255 1260

His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys

1265 1270 1275

Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala

1280 1285 1290

Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn

1295 1300 1305

Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala

1310 1315 1320

Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser

1325 1330 1335

Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr

1340 1345 1350

Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp

1355 1360 1365

<210> 33

<211> 1053

<212> PRT

<213> 葡萄球菌(Staphylococcus)

<400> 33

Met Lys Arg Asn Tyr Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val

1 5 10 15

Gly Tyr Gly Ile Ile Asp Tyr Glu Thr Arg Asp Val Ile Asp Ala Gly

20 25 30

Val Arg Leu Phe Lys Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg

35 40 45

Ser Lys Arg Gly Ala Arg Arg Leu Lys Arg Arg Arg Arg His Arg Ile

50 55 60

Gln Arg Val Lys Lys Leu Leu Phe Asp Tyr Asn Leu Leu Thr Asp His

65 70 75 80

Ser Glu Leu Ser Gly Ile Asn Pro Tyr Glu Ala Arg Val Lys Gly Leu

85 90 95

Ser Gln Lys Leu Ser Glu Glu Glu Phe Ser Ala Ala Leu Leu His Leu

100 105 110

Ala Lys Arg Arg Gly Val His Asn Val Asn Glu Val Glu Glu Asp Thr

115 120 125

Gly Asn Glu Leu Ser Thr Lys Glu Gln Ile Ser Arg Asn Ser Lys Ala

130 135 140

Leu Glu Glu Lys Tyr Val Ala Glu Leu Gln Leu Glu Arg Leu Lys Lys

145 150 155 160

Asp Gly Glu Val Arg Gly Ser Ile Asn Arg Phe Lys Thr Ser Asp Tyr

165 170 175

Val Lys Glu Ala Lys Gln Leu Leu Lys Val Gln Lys Ala Tyr His Gln

180 185 190

Leu Asp Gln Ser Phe Ile Asp Thr Tyr Ile Asp Leu Leu Glu Thr Arg

195 200 205

Arg Thr Tyr Tyr Glu Gly Pro Gly Glu Gly Ser Pro Phe Gly Trp Lys

210 215 220

Asp Ile Lys Glu Trp Tyr Glu Met Leu Met Gly His Cys Thr Tyr Phe

225 230 235 240

Pro Glu Glu Leu Arg Ser Val Lys Tyr Ala Tyr Asn Ala Asp Leu Tyr

245 250 255

Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Thr Arg Asp Glu Asn

260 265 270

Glu Lys Leu Glu Tyr Tyr Glu Lys Phe Gln Ile Ile Glu Asn Val Phe

275 280 285

Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Lys Glu Ile Leu

290 295 300

Val Asn Glu Glu Asp Ile Lys Gly Tyr Arg Val Thr Ser Thr Gly Lys

305 310 315 320

Pro Glu Phe Thr Asn Leu Lys Val Tyr His Asp Ile Lys Asp Ile Thr

325 330 335

Ala Arg Lys Glu Ile Ile Glu Asn Ala Glu Leu Leu Asp Gln Ile Ala

340 345 350

Lys Ile Leu Thr Ile Tyr Gln Ser Ser Glu Asp Ile Gln Glu Glu Leu

355 360 365

Thr Asn Leu Asn Ser Glu Leu Thr Gln Glu Glu Ile Glu Gln Ile Ser

370 375 380

Asn Leu Lys Gly Tyr Thr Gly Thr His Asn Leu Ser Leu Lys Ala Ile

385 390 395 400

Asn Leu Ile Leu Asp Glu Leu Trp His Thr Asn Asp Asn Gln Ile Ala

405 410 415

Ile Phe Asn Arg Leu Lys Leu Val Pro Lys Lys Val Asp Leu Ser Gln

420 425 430

Gln Lys Glu Ile Pro Thr Thr Leu Val Asp Asp Phe Ile Leu Ser Pro

435 440 445

Val Val Lys Arg Ser Phe Ile Gln Ser Ile Lys Val Ile Asn Ala Ile

450 455 460

Ile Lys Lys Tyr Gly Leu Pro Asn Asp Ile Ile Ile Glu Leu Ala Arg

465 470 475 480

Glu Lys Asn Ser Lys Asp Ala Gln Lys Met Ile Asn Glu Met Gln Lys

485 490 495

Arg Asn Arg Gln Thr Asn Glu Arg Ile Glu Glu Ile Ile Arg Thr Thr

500 505 510

Gly Lys Glu Asn Ala Lys Tyr Leu Ile Glu Lys Ile Lys Leu His Asp

515 520 525

Met Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ala Ile Pro Leu Glu

530 535 540

Asp Leu Leu Asn Asn Pro Phe Asn Tyr Glu Val Asp His Ile Ile Pro

545 550 555 560

Arg Ser Val Ser Phe Asp Asn Ser Phe Asn Asn Lys Val Leu Val Lys

565 570 575

Gln Glu Glu Asn Ser Lys Lys Gly Asn Arg Thr Pro Phe Gln Tyr Leu

580 585 590

Ser Ser Ser Asp Ser Lys Ile Ser Tyr Glu Thr Phe Lys Lys His Ile

595 600 605

Leu Asn Leu Ala Lys Gly Lys Gly Arg Ile Ser Lys Thr Lys Lys Glu

610 615 620

Tyr Leu Leu Glu Glu Arg Asp Ile Asn Arg Phe Ser Val Gln Lys Asp

625 630 635 640

Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg Gly Leu

645 650 655

Met Asn Leu Leu Arg Ser Tyr Phe Arg Val Asn Asn Leu Asp Val Lys

660 665 670

Val Lys Ser Ile Asn Gly Gly Phe Thr Ser Phe Leu Arg Arg Lys Trp

675 680 685

Lys Phe Lys Lys Glu Arg Asn Lys Gly Tyr Lys His His Ala Glu Asp

690 695 700

Ala Leu Ile Ile Ala Asn Ala Asp Phe Ile Phe Lys Glu Trp Lys Lys

705 710 715 720

Leu Asp Lys Ala Lys Lys Val Met Glu Asn Gln Met Phe Glu Glu Lys

725 730 735

Gln Ala Glu Ser Met Pro Glu Ile Glu Thr Glu Gln Glu Tyr Lys Glu

740 745 750

Ile Phe Ile Thr Pro His Gln Ile Lys His Ile Lys Asp Phe Lys Asp

755 760 765

Tyr Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Glu Leu Ile

770 775 780

Asn Asp Thr Leu Tyr Ser Thr Arg Lys Asp Asp Lys Gly Asn Thr Leu

785 790 795 800

Ile Val Asn Asn Leu Asn Gly Leu Tyr Asp Lys Asp Asn Asp Lys Leu

805 810 815

Lys Lys Leu Ile Asn Lys Ser Pro Glu Lys Leu Leu Met Tyr His His

820 825 830

Asp Pro Gln Thr Tyr Gln Lys Leu Lys Leu Ile Met Glu Gln Tyr Gly

835 840 845

Asp Glu Lys Asn Pro Leu Tyr Lys Tyr Tyr Glu Glu Thr Gly Asn Tyr

850 855 860

Leu Thr Lys Tyr Ser Lys Lys Asp Asn Gly Pro Val Ile Lys Lys Ile

865 870 875 880

Lys Tyr Tyr Gly Asn Lys Leu Asn Ala His Leu Asp Ile Thr Asp Asp

885 890 895

Tyr Pro Asn Ser Arg Asn Lys Val Val Lys Leu Ser Leu Lys Pro Tyr

900 905 910

Arg Phe Asp Val Tyr Leu Asp Asn Gly Val Tyr Lys Phe Val Thr Val

915 920 925

Lys Asn Leu Asp Val Ile Lys Lys Glu Asn Tyr Tyr Glu Val Asn Ser

930 935 940

Lys Cys Tyr Glu Glu Ala Lys Lys Leu Lys Lys Ile Ser Asn Gln Ala

945 950 955 960

Glu Phe Ile Ala Ser Phe Tyr Asn Asn Asp Leu Ile Lys Ile Asn Gly

965 970 975

Glu Leu Tyr Arg Val Ile Gly Val Asn Asn Asp Leu Leu Asn Arg Ile

980 985 990

Glu Val Asn Met Ile Asp Ile Thr Tyr Arg Glu Tyr Leu Glu Asn Met

995 1000 1005

Asn Asp Lys Arg Pro Pro Arg Ile Ile Lys Thr Ile Ala Ser Lys

1010 1015 1020

Thr Gln Ser Ile Lys Lys Tyr Ser Thr Asp Ile Leu Gly Asn Leu

1025 1030 1035

Tyr Glu Val Lys Ser Lys Lys His Pro Gln Ile Ile Lys Lys Gly

1040 1045 1050

<210> 34

<211> 148

<212> DNA

<213> 烟草花叶病毒(Tobacco mosaic virus)

<400> 34

gaattcgtcg attcggttgc agcatttaaa gcggttgaca actttaaaag aaggaaaaag 60

aaggttgaag aaaagggtgt agtaagtaag tataagtaca gaccggagaa gtacgccggt 120

cctgattcgt ttaatttgaa agaagaaa 148

<210> 35

<211> 453

<212> DNA

<213> 烟草IRES(Nicotiana tabacum IRES)

<400> 35

ggcacgaggc tcccattaat atttcttctt ctgtgtaatt ccattattct gtagtagatt 60

cacgtccgag tttaaagaag agagaaaact gaaaaggcag aaaattccag agctttagat 120

ttagccaaag atagttatgg tcgtgttgtt cttggtgaag attggcaaag taggagccaa 180

tggaagaaac taagatcata atcaatcgcc ccaaaaacaa ccttgttcat tctatggttt 240

ttctcttcgg tttctatgtt tgggattggg aattcctcac tgtccttttg cttttcagtt 300

attgctcctt ctaattttcc ctagctagga tcttctcaat taatttcctt tttcattttc 360

aactaactca taattagccc aaatcttcaa aagagttttg tgtaagttga tagacgttta 420

gagaaacaga gaaatacagg ggaaaaacaa ggg 453

<210> 36

<211> 192

<212> DNA

<213> 芜菁花叶马铃薯Y病毒IRES(turnip mosaic potyvirus IRES)

<400> 36

gggaaagctt gcatgcctgc aggtcgactc tagaaaaata taaaaactca acacaacata 60

cacaaaacga ttaaagcaaa cacaatcttt caaagcattc aaagcattca agcaatcaaa 120

gattttcaaa tcttttgtcg ttatcaaagc aatcaccaac aggatccagg atccccgggt 180

ggtcagtccc tt 192

<210> 37

<211> 143

<212> DNA

<213> 烟草蚀刻病毒IRES(tobacco etch virus IRES)

<400> 37

aaataacaaa tctcaacaca acatatacaa aacaaacgaa tctcaagcaa tcaagcattc 60

tacttctatt gcagcaattt aaatcatttc ttttaaagca aaagcaattt tctgaaaatt 120

ttcaccattt acgaacgata gca 143

<210> 38

<211> 160

<212> DNA

<213> 烟草坏死卫星病毒CITE(satellite tobacco necrosis virus CITE)

<400> 38

aaaaaaaaaa aagtaaagac aggaaacttt actgactaac tcccagaggt tcacaatgtt 60

agtgatgggg cgctgaaaga tgcgtagcta cccttctgga gccacttcct ggtggtaagc 120

agaaatccaa gggtacggtg gtacggtgga aagcagtccc 160

<210> 39

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> NtHSF1_IRES_F引物

<400> 39

ggcacgaggc tcccattaat atttc 25

<210> 40

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> TuMV_IRES_F引物

<400> 40

gggaaagctt gcatgcctg 19

<210> 41

<211> 29

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> TEV_IRES_F引物

<400> 41

gaaataacaa atctcaacac aacatatac 29

<210> 42

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> rpoA-for 引物

<400> 42

gcaccaaaga aggcgttcag 20

<210> 43

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<221>

<222>

<223> rpoA-rev 引物

<400> 43

ggtcaggtgg cagatcacat 20

<210> 44

<211> 63

<212> DNA

<213> 大肠杆菌(E. Coli)

<400> 44

atgaaaaaga cggcgattgc tatcgctgtg gcgcttgctg gattcgccac tgtagcacaa 60

gca 63

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号