首页> 中国专利> 新的来自苏云金芽孢杆菌杀虫晶体蛋白的杀虫毒素

新的来自苏云金芽孢杆菌杀虫晶体蛋白的杀虫毒素

摘要

为在植物中表达而优化的合成的核苷酸序列编码多种形式的杂合苏云金芽胞杆菌(Bacillus thuringiensis)δ-内毒素HO4,其毒素部分包括CrylAb的结构域I和II和CrylC的结构域III。含所述杀虫毒素的组合物和制剂能控制虫害。本发明进一步涉及制备所述杂合毒素的方法,以及使用上述核苷酸序列在微生物中控制虫害以及在转基因植物中赋予所述植物昆虫抗性的方法。

著录项

  • 公开/公告号CN1449250A

    专利类型发明专利

  • 公开/公告日2003-10-15

    原文格式PDF

  • 申请/专利权人 辛根塔参与股份公司;

    申请/专利号CN01814694.5

  • 申请日2001-08-23

  • 分类号A01N63/00;C12N15/62;C12N15/32;C12N15/82;C12N5/10;C07K14/325;C07K19/00;

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人唐伟杰

  • 地址 瑞士巴塞尔

  • 入库时间 2023-12-17 14:57:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2011-11-09

    未缴年费专利权终止 IPC(主分类):A01N63/00 授权公告日:20071212 终止日期:20100823 申请日:20010823

    专利权的终止

  • 2007-12-12

    授权

    授权

  • 2003-12-17

    实质审查的生效

    实质审查的生效

  • 2003-10-15

    公开

    公开

说明书

技术领域

本发明涉及新的来自苏云金芽孢杆菌杀虫晶体蛋白的杀虫毒素,表达所述蛋白的核酸序列,以及制备和使用所述毒素和相应核酸序列以控制昆虫的方法。

背景技术

虫害是造成作物减产的主要原因。仅在美国由多种属昆虫侵染造成的损失就达数十亿美圆。除大田作物的损失之外,虫害还是蔬菜和水果培育者、观赏花卉生产者的负担,同时它们也是花匠和房主们的祸害。

虫害主要是通过集中施用化学杀虫剂进行控制,这些化学杀虫剂通过抑制昆虫生长,妨碍昆虫进食或繁殖,或者致使昆虫死亡来发挥活性。这样可以很好地控制昆虫,但这些化学物质有时候也影响其它有益的昆虫。广泛应用化学杀虫剂所导致的另一个问题是抗性昆虫变种的出现。虽然这种情况可以通过多种抗性管理策略进行部分地缓解,但对替代性的虫害防治剂的需求仍日益增强。

生物学昆虫防治剂,如表达杀虫毒素的苏云金芽胞杆菌(Bacillus thuringiensis)菌株的应用已经取得了令人满意的效果,成为化学杀虫剂的一种替代或补充。苏云金芽胞杆菌(Bacillusthuringiensis)属于革兰氏阳性、需氧、形成内孢子的细菌大组。与其它非常相近的芽孢杆菌种,例如蜡状芽孢杆菌(B.cereus)或炭疽芽孢杆菌(B.anthracis)不同,目前已知的苏云金芽胞杆菌(Bacillus thuringiensis)种大多数在其芽胞形成过程中形成一种伴胞包涵体(parasporal inclusion body),鉴于其晶体结构,通常将其称为晶体(crystalline body)。所述的晶体包含具有杀虫活性的晶体原毒素蛋白,既所谓的δ-内毒素。这些蛋白晶体负责苏云金芽胞杆菌(Bacillus thuringiensis)对昆虫的毒性。所谓的δ-内毒素直到所述晶体(crystalline body)经口摄入并溶解于靶昆虫的肠液后才表现出杀虫活性。大多数情况下,实际的毒性组分是由来自昆虫消化道的蛋白酶对原毒素进行蛋白水解切割而释放的。所述的多种苏云金芽胞杆菌(Bacillus thuringiensis)菌株的δ-内毒素具有针对特定的靶昆虫,特别是对于多种鳞翅目,鞘翅目和双翅目幼虫的高度特异性的特征,并且对这些幼虫具有高度的活性。应用苏云金芽胞杆菌(Bacillus thuringiensis)δ-内毒素进一步的优势在于,所述的毒素对人,其它哺乳动物,鸟类和鱼是无害的。

根据序列同源性和杀虫特异性,可将苏云金芽胞杆菌(Bacillusthuringiensis)晶体蛋白分成不同的类。研究得最多的是Cry1类蛋白,该蛋白是作为140kDa的原毒素产生的,对鳞翅目昆虫具有毒性。在一定程度上已阐明了晶体蛋白的作用模式。经口摄入后所述的晶体溶解于幼虫中肠的碱性环境。随后中肠蛋白酶(如胰蛋白酶)将溶解的蛋白加工成约65kDa的抗蛋白酶毒性片段,所述的毒性片段与昆虫中肠上皮细胞受体相结合并穿透细胞膜。这最终导致细胞破裂和幼虫死亡。

易感昆虫中肠上皮细胞上存在的受体在很大程度上决定了特定晶体蛋白的活性谱。上述的谱也是由所述晶体蛋白的溶解效率和体内蛋白水解活化作用共同决定的。所述晶体蛋白与中肠上皮受体结合的重要性通过下述事实得到进一步的证明,即当昆虫对一种晶体蛋白产生了抗性时,晶体蛋白与抗性昆虫中肠上皮细胞的结合明显下降。

在过去的几年中,已经分离出了一些编码上述晶体蛋白的基因,其在异源宿主中的表达为控制在经济学上重要的虫害提供了另一种工具。特别地,在转基因植物中杀虫毒素,如苏云金芽胞杆菌(Bacillus thuringiensis)晶体蛋白的表达对选定的虫害提供了有效的防护,表达这些毒素的转基因植物已商业化,这使农民减少了对化学昆虫防治剂的应用。而且,也可以表达具有经选择的意在增强针对特定昆虫或昆虫种类杀虫活性,或意在扩大毒素蛋白杀虫谱的组合功能的重组毒素。例如可通过将δ-内毒素的毒素部分与其它δ-内毒素原毒素(尾部)部分结合构建具有自然界不存在的新序列的嵌合杀虫蛋白。参见,例如引入此处作为参考的WO 98/15170。

据认为晶体蛋白毒性片段包含三个不同的结构域。结构域I,最N-末端的结构域,由7个α-螺旋组成,可能部分或全部插入到靶细胞膜中。结构域II在所谓Greek key-构象中包含3个β-折叠。大多数的研究者认为结构域II与受体相互作用,因此决定毒素的特异性。的确,存在许多的证据暗示结构域II残基涉及特异的毒性和高度亲和结合。结构域III,最C-末端结构域,由在所谓jellyroll构象中的两个β-折叠组成,也暗示着其与确定特异性相关。例如通过编码区之间的体内重组在毒素之间交换结构域III能够导致特异活性的改变。利用这种杂合体进行的结合实验表明结构域III涉及与推定的靶昆虫受体的结合,表明结构域III可能通过受体识别功能行使其在特异性方面的功能。如果投射在Cry1序列上,结构域I从约第28位到第260位残基,结构域II由约第260位到第460位,结构域III由约第460位到第600位。参见Nakamura等,Agric.Biol.Chem.54(3):715-724(1990);Li等,Nature 353:815-821(1991);Ge等,J.Biol.Chem.266(27):17954-17958(1991);和Honee等,Mol.Microbiol.5(11):2799-2806(1991);上述各篇均引入此处作为参考。在此处引入作为参考的U.S.Pat.No.5,736,131描述了在其C-末端包含第一Cry蛋白结构域III、在其N-末端包含第二Cry蛋白结构域I和II的苏云金芽胞杆菌(Bacillusthuringiensis)杂合体毒素片段。这种杂合晶体蛋白具有改变了的杀虫活性。例如,同样在De Maagd等,Appl.Environ.Microbiol.62(5):1537-1543(1996)中描述的H04杂合毒素在其N-末端包含Cry1Ab的结构域I和II,在其C-末端包含Cry1C的结构域III。据报道与亲本的Cry1Ab毒素相比,H04对甜菜粘虫(spodopteraexigua)具有高毒性,并且比亲本的Cry1C也有明显地更高毒性。也参见Bosch等,FEMS Microbiology Letters 118:129-134(1994);Bosch等,Bio/Technology 12:915-918(1994);De Maagd等,Appl.Environ.Microbiol.62(8):2753-2757(1996);和DeMaagd等,Mol.Microbiol.31(2):463-471(1999);以上各篇均引入此处作为参考。

尽管通过育种程序和遗传工程掺入昆虫抗性基因获得了成功,仍然存在长期渴望并仍未实现的对发现新的有效昆虫防治剂的需求。特别需要能靶向经济上重要的虫害,如欧洲玉米螟(European CornBorer)和草地夜蛾(Fall Army Worm),并能有效控制对现有的昆虫防治剂具有抗性的昆虫种类的控制剂。而且,需要施用后对环境的影响降到最低的试剂。

发明内容

本发明通过提供编码杂合苏云金芽胞杆菌(Bacillusthuringiensis)毒素的新的基因序列以满足上述需求,所述新的基因序列包括为在植物中表达而优化的合成的核苷酸序列。在优选的实施方案中,所述的新基因序列编码杂合苏云金芽胞杆菌(Bacillusthuringiensis)δ-内毒素H04的不同形式,其毒素部分包含Cry1Ab的结构域I和II和Cry1C的结构域III。由所述的新基因序列编码的杂合苏云金芽胞杆菌毒素对下述经济上重要的虫害具有高度的活性,如草地夜蛾(fall armyworm),红铃麦蛾(pinkbollworm),烟夜蛾(tobacco budworm),欧洲玉米螟(Europeancornborer)和菜蛾(diamondback moth)。所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素可用于多种昆虫防治策略中,以获得最高的效率和最低的环境影响。

本发明进一步涉及由本发明的核苷酸序列表达产生的杂合杀虫毒素,及包含所述杂合杀虫毒素的组合物和制剂,它们能够抑制害虫存活,生长或繁殖的能力,或者限制害虫相关的农作物损害和亏损。本发明进一步涉及制造所述杂合毒素的方法,以及使用所述核苷酸序列的方法,例如,在转基因植物中赋予昆虫抗性,和使用所述毒素、包含所述毒素的组合物及制剂的方法,例如,在受昆虫侵染的区域应用所述的毒素、组合物或制剂,或预防性地处理易受昆虫侵染的区域或植物,以赋予其对有害昆虫的防护或抗性。所述的杂合毒素可用于复合昆虫防治策略,以获得最高的效率和最低的环境影响。

一方面本发明提供控制下述昆虫的方法,所述昆虫选自草地夜蛾(fall armyworm),红铃麦蛾(pink bollworm),烟夜蛾(tobacco budworm),欧洲玉米螟(European cornborer)和菜蛾(diamondback moth),该方法包括向所述昆虫递送有效量的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素,该毒素包含来自Cry1Ab毒素的结构域I和II以及按由氨基到羧基方向与它们结合的来自Cry1C毒素的结构域III。在一个优选的实施方案中,所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素包含与SEQ IDNO:2,4,6,8,或10至少90%同一的氨基酸序列。在一个更优选的实施方案中,所述的杂合苏云金芽胞杆菌(Bacillusthuringiensis)毒素包含SEQ ID NO:2,4,6,8,或10。

在本发明上述方法的又一实施方案中,所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素进一步包含C-末端尾区域,如Cry1C尾区域或Cry1Ab尾区域。所述的C-末端尾区域可以是全长的也可以是截短的,如约40个氨基酸长。

在本发明上述方法的一个优选的实施方案中,向昆虫递送有效量的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素包括用含编码所述杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素的核苷酸序列的重组DNA转化的转基因植物组织饲喂或接触昆虫,其中,所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素在所述转基因植物组织中的表达赋予了对所述昆虫的抗性。优选地,所述核苷酸序列基本上与SEQ ID NO:1,3,5,7,或9同一。

另一方面,本发明提供了包含编码杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素的核苷酸序列的分离的核酸分子,所述毒素包括(a)含来自Cry1Ab毒素的结构域I和II以及按由氨基到羧基方向与之结合的来自Cry1C毒素的结构域III的N-端毒素部分;和(b)来自Cry1Ab毒素的C-端尾区域。优选地,所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素包含与SEQ IDNO:6,8,或10至少90%同一的氨基酸序列。更优选地,所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素包含SEQ ID NO:6,8,或10。更优选地,所述核苷酸序列与SEQ ID NO:5,7,或9至少90%同一。最优选地,所述核苷酸序列包含SEQ ID NO:5,7,或9。

本发明进一步提供包含与异源启动子序列可操作地连接的本发明如上所述核酸分子的嵌合基因;包含所述嵌合基因的重组载体;包含所述嵌合基因的转基因宿主细胞(如,植物细胞);含上述转基因植物细胞的转基因植物(如,玉米,棉花,稻,或甘兰植物);以及上述转基因植物的种子。

又一方面本发明提供使植物抗昆虫的方法,该方法包括在用下述嵌合基因转化的植物中表达杂合苏云金芽胞杆菌(Bacillusthuringiensis)毒素,所述嵌合基因包含:(a)能在植物中启动相关的编码序列高水平转录的核酸启动子序列,和(b)与所述启动子可操作地连接的本发明的核酸分子,其中,所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素在所述植物中的表达能使所述植物抗昆虫。

再一方面,本发明提供生产具有抗昆虫活性的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素的方法,该方法包括(a)获得本发明的转基因宿主细胞;和(b)在所述转基因宿主细胞中表达本发明的核酸分子,从而产生有效地抗昆虫的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素。

再一方面,本发明提供生产抗昆虫植物的方法,该方法包括将本发明的核酸分子引入所述植物,其中所述的核酸分子能在所述植物中以有效地控制昆虫的量表达。

又一方面,本发明提供包含SEQ ID NO:3,5,7,9,11,12,13,14,15,16或17的分离的核酸分子;含与上述核酸分子可操作地相连的异源启动子的嵌合基因;含上述嵌合基因的重组载体;含上述嵌合基因的转基因宿主细胞(如,植物细胞);含上述转基因植物细胞的转基因植物(如,玉米,棉花,稻,或甘兰植物);和上述转基因植物的种子。

在又一方面中,本发明提供杂合苏云金芽胞杆菌(Bacillusthuringiensis)毒素,该毒素包含:(a)含来自Cry1Ab毒素的结构域I和II以及与它们按由氨基端到羧基端方向结合的来自Cry1C毒素的结构域III的N-末端毒素部分;和(b)来自Cry1Ab毒素的C-末端尾区域。优选地,所述的杂合苏云金芽胞杆菌(Bacillusthuringiensis)毒素包含与SEQ ID NO:6,8,或10至少90%同一的氨基酸序列。更优选地,所述的杂合苏云金芽胞杆菌(Bacillusthuringiensis)毒素包含SEQ ID NO:6,8,或10。

另一方面,本发明提供含控制昆虫有效量的本发明的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素的组合物。

通过本发明的下述描述和非限制性的实施例本领域的技术人员能够清楚地了解本发明的其它方面和有益之处。

             序列表中序列的简要描述

SEQ ID NO:1是De Maagd等,Appl.Environ.Microbiol.62(5):1537-1543(1996)中描述的编码H04杂合毒素的核苷酸序列,其毒素部分包括位于其N-末端的Cry1Ab结构域I和II和位于其C-末端的Cry1C的结构域III,加上全长的Cry1C尾部分。

SEQ ID NO:2是SEQ ID NO:1中所述的核苷酸序列编码的H04杂合毒素的氨基酸序列,其包括Cry1Ab毒素结构域I和II和Cry1C的毒素结构域III,加上全长的Cry1C尾部分。

SEQ ID NO:3是合成的编码不带尾的H04毒素部分的核苷酸序列,如同胰蛋白酶位点已被切割。

SEQ ID NO:4是由SEQ ID NO:3描述的合成核苷酸序列编码的H04毒素部分的氨基酸序列。

SEQ ID NO:5是编码H04毒素部分加全长Cry1Ab尾部分的合成的核苷酸序列。

SEQ ID NO:6是由SEQ ID NO:5中描述的合成核苷酸序列编码的H04+Cry1Ab尾的氨基酸序列。

SEQ ID NO:7是编码H04毒素部分加全长Cry1Ab尾部分的另一合成的核苷酸序列。

SEQ ID NO:8是由SEQ ID NO:7中描述的合成核苷酸序列编码的H04+Cry1Ab尾的氨基酸序列。

SEQ ID NO:9是编码H04毒素部分加Cry1Ab尾头40个氨基酸的合成的核苷酸序列。

SEQ ID NO:10是由SEQ ID NO:9中描述的合成核苷酸序列编码的H04+40氨基酸的截短的Cry1Ab尾的氨基酸序列。

SEQ ID NO:11是构建体pNOV1308的核苷酸序列,其包含与如SEQ ID NO:3中所述的编码无尾的H04毒素部分的合成核苷酸序列可操作地连接的组成型玉米遍在蛋白启动子。

SEQ ID NO:12是构建体pNOV1436的核苷酸序列,其包含与如SEQ ID NO:5中所述的编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列可操作地连接的根偏好的玉米MTL启动子。

SEQ ID NO:13是构建体pNOV1441的核苷酸序列,其包含与如SEQ ID NO:5中所述的编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列可操作地连接的组成型玉米遍在蛋白启动子。

SEQ ID NO:14是构建体pNOV1305的核苷酸序列,其包含与如SEQ ID NO:7中所述的编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列可操作连接的组成型玉米遍在蛋白启动子。

SEQ ID NO:15是构建体pNOV1313的核苷酸序列,其包含与如SEQ ID NO:7中所述的编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列可操作连接的组成型玉米遍在蛋白启动子。

SEQ ID NO:16是构建体pNOV1435的核苷酸序列,其包含与如SEQ ID NO:9中所述的编码H04毒素部分加Cry1Ab尾头40个氨基酸的合成核苷酸序列可操作地连接的根偏好的玉米MTL启动子。

SEQ ID NO:17是构建体pZU578的核苷酸序列,其包含与如SEQID NO:9中所述的编码H04毒素部分加Cry1Ab尾头40个氨基酸的合成核苷酸序列可操作地连接的鼠耳芥属(Arabidopsis)肌动蛋白-2启动子。

定义

本发明的毒素的“活性”是指毒素作为经口有效的昆虫防治剂而起作用,具有毒性效力,或能破坏或阻止昆虫进食,其可能或不能引起昆虫死亡。当本发明的毒素递送到昆虫,典型的结果是昆虫死亡,或者昆虫不以使所述昆虫获得该毒素的来源为食。

“与......相关联/可操作地连接”指两核酸序列在物理上或功能上相关联。例如,若两序列可操作地相连,或处于一定的位置,使得调节DNA序列影响编码或结构DNA序列的表达水平,则称启动子或调节性的DNA与编码RNA或蛋白的DNA序列″相关联″。

“结合位点”是指分子上的某个位点,其中所述位点与毒素间的结合是可逆的,以使得位点与毒素间的Ka接近于至少104dm3mole-1

“嵌合基因”是重组的核酸序列,其中启动子或调节核酸序列与编码mRNA或表达成蛋白的核酸序列可操作地连接或相关联,从而使调节核酸序列能调节转录或相关核酸分子的转录或表达。嵌合基因中的调节核酸序列通常并不与相关核酸序列如同自然界中所发现的那样可操作地连接或相关联。

“编码序列”是转录成RNA,如mRNA,rRNA,tRNA,snRNA,有意RNA或反义RNA的核酸序列。优选地,所述RNA之后在生物体中翻译产生蛋白。

互补的:“互补的”是指两核苷酸序列包含反向平行的核苷酸序列,它们能够通过在反向平行的核苷酸序列中的互补碱基残基之间形成氢键彼此配对。

特定核酸序列的“保守修饰的变异”是指编码同一或基本上同一的氨基酸序列的那些核酸序列,或当所述的核酸序列不编码氨基酸序列时,是指基本上同一的序列。由于遗传密码的简并性,大量功能上同一的核酸编码任一给定的多肽。例如密码子CGT,CGC,CGA,CGG,AGA,和AGG全部编码精氨酸。因此在密码子编码精氨酸的每个位置,所述的密码子可改变成上述的任一密码子而不改变所编码的蛋白。这种核酸变异是″沉默变异″,其是一种″保守修饰的变异″。除非另有说明,此处所述的编码蛋白的每个核酸序列也描述了每一种可能的沉默变异。本领域的技术人员可知核酸序列内的任一密码子(除通常是甲硫氨酸的唯一密码子的ATG外)均可通过常规的技术进行修饰以获得功能同一的分子。因此,编码蛋白的核酸分子的每种“沉默变异”均暗含于所述的序列中。

而且,本领域的技术人员可知当改变导致用化学上类似的氨基酸取代某氨基酸时,在编码序列中改变,添加或缺失单一氨基酸或小百分比的氨基酸(典型地是少于5%,更典型地是少于1%)的单独的替代,缺失或添加是″保守修饰的变异”。提供功能类似氨基酸的保守替代是本领域已知的。下述的五组中,每组氨基酸彼此之间均可进行保守替代:脂肪族的:甘氨酸(G),丙氨酸(A),缬氨酸(V),亮氨酸(L),异亮氨酸(I);芳香族的:苯丙氨酸(F),酪氨酸(Y),色氨酸(W);含硫的:甲硫氨酸(M),半胱氨酸(C);碱性的:精氨酸(R),赖氨酸(K),组氨酸(H);酸性的:天冬氨酸(D),谷氨酸(E),天冬酰胺(N),谷氨酰胺(Q)。参见Creighton(1984)Proteins,W.H.Freeman and Company。另外,在编码序列中改变,添加或缺失单一氨基酸或小百分数的氨基酸的单独的替代,缺失或添加也是″保守修饰的变异”。

对昆虫的“控制”通过毒性作用抑制害虫存活、生长、进食和/或繁殖,或限制昆虫相关的作物损害或损失。“控制”昆虫可指也可以不指杀死昆虫,尽管其优选地指杀死昆虫。

相应于:在本发明的上下文中,“相应于”或“相当于”指当不同的苏云金芽胞杆菌(Bacillus thuringiensis)δ-内毒素的核酸编码序列或氨基酸序列相互对比(aligned)时,“相当于”特定的列举位置的核酸或氨基酸是与这些位置相对比,但不一定处于与特定δ-内毒素的各自核酸编码序列或氨基酸序列相应的这些确切数值位置的那些。类似地,当特定的δ-内毒素(例如,Cry1B)的编码或氨基酸序列与参考的δ-内毒素(例如,Cry1Ab)的编码或氨基酸序列相对比时,相当于Cry1Ab序列中特定的某列举位置的Cry1B序列中的核酸或氨基酸是与Cry1Ab序列中的这些位置相对比,但不一定处于Cry1B毒素各核酸编码序列或氨基酸序列的这些确切数值位置中的那些。

“递送”毒素是指将所述毒素与昆虫相接触,导致毒性效果以及对昆虫的控制。所述的毒素可通过多种已知的方法递送,如通过昆虫摄食经口递送,或通过转基因植物的表达与昆虫相接触,配制成蛋白组合物,喷雾形式的蛋白组合物,毒饵基质,或任何本领域已知的毒素递送系统。

此处所用的“表达盒”是指能指导特定的核苷酸序列在适当的宿主中表达的核酸序列,其包括与有用核苷酸序列可操作连接的启动子,所述的核苷酸序列与终止信号可操作地相连接。典型地,它还包括使所述核苷酸序列正确翻译所需的序列。包含有用核苷酸序列的所述表达盒可以是嵌合的,这就是说,对于至少一种其它组分而言,至少一种其中的组分是异源的。所述的表达盒也可以是一种在自然界中存在的,但为有利于异源表达以重组形式获得的。但典型地,所述的表达盒相对宿主而言是异源的,即所述表达盒的特定核酸序列在天然状态下并不存在于宿主细胞中,必须通过转化事件引入到宿主细胞或其前体中。在表达盒中的核苷酸序列的表达可以在组成型或诱导型启动子的控制之下,其中诱导型启动子仅当宿主细胞暴露于特定的外部刺激之下时才启动转录。对于多细胞生物,如植物,所述的启动子也可以是对特定的组织、器官或发育阶段特异的。

基因:术语″基因″广泛地用于指任何与生物功能相关的DNA节段。因此,基因包括编码序列和/或其表达所需的调控序列。基因也包括非表达的DNA节段,例如,它形成其它蛋白的识别序列。基因可以由多种来源获得,包括从有用的来源中克隆或由已知的或预测的序列信息合成,也可以包括被设计为具有所需参数的序列。

″有用基因″是指当其转移到植物中后能赋予植物所需性状的任何基因,上述所需性状如抗生素抗性,病毒抗性,昆虫抗性,疾病抗性或对其它有害之物的抗性,除草剂耐受性,改善了的营养价值,在工业加工过程中改良了的性能,或改变了的繁殖能力。所述的“有用基因”也可以是在其转移到植物中后产生有商业价值的酶或代谢物的基因。

此处所用的“H04”是指在De Maagd等,Appl.Environ.Microbiol.62(5):1537-1543(1996)中所描述的杂合Bt毒素,其毒素片段在N-末端包含Cry1Ab的结构域I和II,在C-末端包含Cry1C的结构域III。

异源核酸序列:此处所用的术语″异源核酸[或DNA]序列″,″外源核酸[或DNA]节段″或″异源基因″均指来源于相对特定宿主细胞而言是外源的来源,或者如果是相同来源即是由原始形式经修饰的序列。因此在宿主细胞中的异源基因包括通过例如密码子优化而修饰的特定宿主细胞中的内源基因。该术语也包括那些天然存在序列的非天然多拷贝形式。因此该术语指外来或异源于所述细胞的核酸节段,或虽与宿主细胞同源,但处在宿主细胞核酸内该元件通常不存在的某个位置上的核酸节段。外源核酸节段表达产生外源多肽。

“同源”核酸[或DNA]序列是指与其被引入的宿主细胞天然相关的核酸[或DNA]序列。

“同源重组”是同源核酸分子间核酸片段的相互交换。

″同质体(Homoplastidic)″指植物,植物组织或植物细胞,其中所有的质体是遗传学上同一的。这是所述质体未经转化,突变或其它形式的遗传改变前在植物中的正常状态。在不同的组织,或发育阶段,所述的质体可以是不同的形式,如,叶绿体,前质体,黄化质体,造粉体,有色体,等。

在上下文中,术语两个或更多核酸或蛋白序列的″同一″或百分″同一性″是指应用下述的序列比较算法之一或通过视觉检验测量,当比较或对比最大值相应性时,两个或更多的序列或子序列相同,或具有指明百分数的相同氨基酸残基或核苷酸百分数。

“杀虫的”定义为能够控制昆虫的毒性生物活性,优选地是通过杀死昆虫的形式。

当核酸序列编码具有与参考核酸序列编码的多肽相同的氨基酸序列的多肽时所述核酸序列是“同类编码(isocoding with)”参考核酸序列。

“分离的”核酸分子或分离的酶是指通过人工操作使其脱离天然天然环境而存在的核酸分子或酶,因此,其不是天然产物。一种分离的核酸分子或酶可以以纯化的形式存在,或存在于非天然的环境如重组的宿主细胞中。

在杂合毒素中毒素结构域间,即本发明的杂合杀虫毒素结构域II和III间的“结合点”,是在所述杂合体中的同源交换区域或位点。在所述交换位点左侧的氨基酸来源于一个亲本毒素,而在所述交换位点右侧的氨基酸来源于另一个亲本毒素。

成熟蛋白:正常情况下靶定某种细胞器的蛋白,其中转运肽已被去除。

最小启动子(minimal promoter):启动子元件,特别是TATA元件,其在缺乏上游激活的情况下是非活性的,或具有大大降低的启动子活性。在合适的转录因子存在下,所述最小启动子起作用允许转录。

天然的:指存在于非转化细胞基因组中的基因。

天然地存在:术语″天然地存在″用于描述可在自然界中发现的对象,以区别于人工生产的对象。例如在生物体(包括病毒)中存在的蛋白或核苷酸序列,其可从自然来源中分离,未经过实验室中的有意的人工修饰,是天然存在的。

核酸:术语″核酸″指脱氧核糖核苷酸或核糖核苷酸及其单链或双链形式的多聚体。除非特别限定,该术语包括与参考核酸具有相似结合特性,含有天然核苷酸的已知类似物,并以与天然存在的核苷酸类似的方式代谢的核酸。除非另有说明,特定的核酸也暗指包括其经保守修饰的变异体(如简并的密码子取代)和互补序列以及明确说明的序列。具体地,简并密码子取代可以通过产生如下序列实现,在所述序列中,一个或多个选定的(或全部)密码子第三位被混合碱基或脱氧肌苷残基所取代(Batzer等,nucleic acid Res.19:5081(1991);Ohtsuka等,J.Biol.Chem.260:2605-2608(1985);Rosso1ini等,Mol.Cell.Probes 8:91-98(1994))。术语“核酸”或“核酸序列”可与基因,由基因编码的cDNA,和mRNA相互交换地使用。

“ORF”指开放阅读框。

蛋白的″部分″是指包含在所述蛋白内的肽,其具有所述蛋白至少80%的连续序列。

“植物”是在任意发育阶段的植物,特别是种子植物。

“植物细胞”是植物的结构和生理单位,其包括原生质体和细胞壁。所述的植物细胞可以是分离的单细胞或培养细胞形式,或作为高度组织化单位,如植物组织,植物器官,或整个植物的一部分。

“植物细胞培养物”是指下述植物单位的培养物,所述植物单位如,原生质体,细胞培养细胞(cell culture cells),植物组织中的细胞,花粉,花粉管,胚珠,胚囊,受精卵和不同发育阶段的胚。

“植物材料”指叶,茎,根,花或花的组成部分,果实,花粉,卵细胞,受精卵,种子,插条,细胞或组织培养物,或其它部分或植物产物。

“植物器官”是植物明显可见结构化的分化部分,如根,茎,叶,花蕾或胚。

此处所用的“植物组织”是指组织成结构和功能单位的植物细胞群。培养的或在植物中的任何植物组织均包含在内。这一术语包括但不限于,整个植株,植物器官,植物种子或组织培养物和任何组织成结构和功能单位的植物细胞群。单独使用该术语或将该术语与上述列举的或者包含在这一定义内的任意特定类型的植物组织结合使用,并不意味着排除任何其它类型的植物组织。

“启动子”是位于编码序列上游的非翻译的DNA序列,其包含RNA聚合酶II的结合位点,并启始DNA的转录。所述的启动子区域还可以包括作为基因表达调控序列的其它元件。

“原生质体”是没有细胞壁,或只带有细胞壁的一些部分的经分离的植物细胞。

纯化的:术语″纯化的″当应用于核酸或蛋白时,是指所述的核酸或蛋白基本上不带有天然状态下与所述核酸或蛋白相关的其它的细胞组分。优选的是以同质的状态存在,但其也可以是干燥的或水溶液的形式。纯度和同质性典型地是应用分析化学技术,如聚丙烯酰胺凝胶电泳或高效液相色谱来确定。在制剂中占优势种类的蛋白是基本上纯的。术语″纯化的″是指核酸或蛋白在电泳凝胶中基本上给出一条带的情况。具体说来,它是指至少约50%纯的核酸或蛋白,更优选至少约85%纯,最优选至少约99%纯。

当来自两核酸每一个的序列在子代核酸中相联合时,这两核酸″重组″。当两核酸均作为重组底物时,两序列″直接″重组。当两核酸需中间物,如交换寡核苷酸进行重组时,两核酸是″间接重组″。对于间接重组,不多于一个序列作为实际的重组底物,有些情况下两序列均不是用于重组的底物。

“调控元件”是指涉及控制核苷酸序列表达的序列。调控元件包含与有用核苷酸序列可操作连接的启动子和终止信号。典型地,其还包括使所述核苷酸序列正确翻译所需的序列。

基本上同一:在两核酸或蛋白序列上下文中词组″基本上同一″是指应用下述的序列比较算法之一或通过视觉检验测量,当比较或对比最大值相应性时,两个或更多的序列或子序列具有至少60%,优选80%,更优选90%,更优选95%,最优选至少99%的核苷酸或氨基酸序列同一性。优选地,在至少约50个残基长度,更优选至少约100个残基的序列区域中存在基本上同一,最优选该序列在至少约150个残基上基本上同一。在最优选的实施方案中,所述的序列在编码区全长内基本上同一。而且,基本上同一的蛋白或核酸序列执行基本上相同的功能。

对于序列比较,典型地将一个序列作为参考序列,将其它序列与该序列进行比较。当使用序列比较算法时,将待测序列和参考序列输入计算机,在需要时指定子序列坐标,并指定序列算法程序的参数。然后,基于指定的序列参数,所述的序列比较算法计算待测序列相对于参考序列的百分序列同一性。

用于比较的优化序列对比(a1ignment)可根据下述算法进行,Smith & Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法,Needleman & Wunsch,J.Mol.Biol.48:443(1970)的同源对比算法,Pearson & Lipman,Proc.Nat’l.Acad.Sci.USA 85:2444(1988)的相似性搜索方法,这些算法的计算机化执行(GAP,BESTFIT,FASTA,和TFASTA,见the Wisconsin GeneticsSoftware Package,Genetics Computer Group,575 Science Dr.,Madison,WI),或通过目测(一般见Ausubel等,下文)进行。

一个适合于确定序列百分同一性和序列相似性的算法是BLAST算法,其如Altschul等,J.Mol.Biol.215:403-410(1990)所述。执行BLAST分析的软件公众可以从国家生物技术信息中心获得(http://www.ncbi.nlm.nih.gov/)。这一算法包括首先通过鉴定在待查询序列中长度为W的短字段鉴定高得分序列对(HSPs),当所述的字段与数据库序列中相同长度的字段相对比时该字段匹配或符合某些正值的阈值得分T。T是指邻近字段的得分阈值(Altschul等,1990)。这些起始邻近字段的命中作为起始搜索以发现包含它们的更长HSP的“种晶”。只要累积对比得分能够增长,即可在每个序列中沿两个方向扩展命中的字段。累积得分可通过下述方式计算,对于核苷酸序列,用参数M(一对匹配残基的回报得分;总是>0)和N(不匹配残基的罚分;总是<0)。对于氨基酸序列,可用评分矩阵计算累积得分。当累积对比得分由其矩阵最高获得值衰减量X,一个或更多的负值残基对比的累积使累积分值达到0或0以下,或者达到了任一序列的末端,则在每一方向上命中字段的延伸停止。BLAST算法参数W,T,和X决定对比的灵敏度和速度。BLASTN程序(对于核苷酸序列)字段长度(W)缺省值为11,期望值(E)为10,截断(cutoff)为100,M=5,N=-4,及两条链的比较。对于氨基酸序列,BLASTP使用的缺省值字段长度(W)为3,期望值(E)为10,BLOSUM62评分矩阵(参见Henikoff & Henikoff,Proc.Natl.Acad Sci.USA 89:10915(1989))。

除了计算序列百分同一性外,BLAST算法还可进行两序列之间相似性的统计分析(参见,如,Karlin & Altschul,proc.Nat’l.Acad.Sci.USA 90:5873-5787(1993))。BLAST算法提供的一种相似性测定是最小总和概率(P(N)),它提供随机出现两核苷酸或氨基酸序列之间的匹配的可能性的指示。例如,测试核苷酸序列被认为与参照序列相似,条件是在测试核苷酸与参照核酸序列比较中的最小总和概率小于约0.1,更优选小于约0.01,最优选小于约0.001。

两核酸序列基本上同一的另一种指示是所述的两核酸分子在严谨条件下彼此杂交。词组“特异性杂交”是指一个分子在严谨条件下仅与存在于复杂的(如,细胞的总)DNA或RNA混合物中的特定核苷酸序列结合,双螺旋化或杂交。“基本上结合”是指核酸探针与靶核酸之间的互补杂交,并且包含少量的错配,这种错配可通过降低杂交介质的严谨度来包容,以达到所需的靶核酸序列检测。

核酸杂交试验,如Southern和Northern杂交中的″严谨杂交条件″和″严谨杂交洗涤条件″是序列依赖性的,而且在不同的环境参数下也是不同的。较长的序列在较高的温度下特异性杂交。Tijssen(1993)Laboratory Techniques in Biochemistry and MolecularBiology-Hybridization with nucleic Acid Probes part Ichapter 2″Overview of principles of hybridization and thestrategy of nucleic acid probe assays″Elsevier,New York中有对核酸杂交的详细指导。一般地,高严谨性杂交和洗涤条件选择为在低于确定的离子强度和pH下特定序列的热熔点(Tm)约5℃的条件。典型地,在″严谨条件″下探针可与靶序列杂交,但不与其它序列杂交。

Tm是指如下温度(在确定的离子强度和pH下),在该温度下50%的靶序列与完全匹配的探针杂交。非常严谨的条件是选择为等同于特定探针的Tm。一个用于具有100个以上互补残基的互补核酸,在Southern或northern印迹滤膜上杂交的严谨杂交条件的示例为含1mg肝素的50%甲酰胺,于42℃杂交过夜。高度严谨洗涤条件的示例为:0.15M NaCl于72℃下处理约15分钟。一个严谨的洗涤条件的例子是于65℃下,0.2x SSC中洗15分钟(参见,Sambrook,下文,SSC缓冲液的描述)。通常低严谨的洗涤在高严谨洗涤前应用以去除背景探针信号。对于例如多于100个核苷酸的双螺旋的中度严谨洗涤条件的示例为1x SSC,45℃下15分钟。对于例如多于100个核苷酸的双螺旋的低度严谨洗涤条件的示例为4-6x SSC,40℃下15分钟。对于短探针,(如,约10到50个核苷酸),严谨条件典型地包括,盐浓度低于约1.0M Na离子,典型的是约0.01到1.0M Na离子浓度(或其它的盐),pH7.0到8.3,温度典型的是至少为30℃。严谨条件也可通过添加去稳定试剂,如甲酰胺来达到。一般,在特定杂交试验中,信噪比比使用非相关探针所达到的结果高2x(或更高)表示特异性杂交检测。在严谨条件下不能彼此杂交的核酸在它们所编码的蛋白基本上同一时仍是基本上同一的。这出现在例如,一个核酸拷贝是利用遗传密码所允许的最大密码子简并性制造的时。

下述的杂交/洗涤条件示例可用于克隆与本发明的参考核苷酸序列基本上同一的同源核苷酸序列:一种参考核苷酸序列优选地与所述参考核苷酸序列在下述条件下杂交:于50℃下7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中杂交,在50℃下用2X SSC,0.1%SDS洗涤,更希望的是于50℃下7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中杂交,于50℃下用1X SSC,0.1%SDS洗涤,更希望的是于50℃下7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中杂交,于50℃下在0.5X SSC,0.1%SDS中洗涤,优选地于50℃下7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中杂交,于50℃下在0.1X SSC,0.1%SDS中洗涤,更优选的是于50℃下7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中杂交,于65℃下在0.1X SSC,0.1%SDS中洗涤。

两种核酸序列或蛋白基本上同一的另一指示为由第一核酸编码的蛋白与由第二核酸编码的蛋白产生免疫交叉反应或特异性地相结合。因此,例如当两蛋白的区别仅在于保守取代时,第一蛋白与第二蛋白典型地基本上同一。

词组″特异性地(或选择性地)与某种抗体结合″或″特异性(或选择性地)与......发生免疫反应″,当指蛋白或肽时,是指结合反应,该反应可以确定在异质蛋白群或其它生物制剂中上述蛋白的存在。因此,在指定的免疫测定条件下,特定的抗体与特定的蛋白相结合而不以显著的量与存在于样品中的其它蛋白相结合。在这样的条件下与某种抗体的特异性结合需要选择针对特定蛋白具有特异性的抗体。例如,选择用带有由本发明的任何核酸编码的氨基酸序列的蛋白培育的抗体,可以获得与上述蛋白发生特异的免疫反应,且除多态性变异体之外不与其它蛋白发生免疫反应的抗体。多种免疫测定形式均可用于筛选可与特定蛋白进行特异地免疫反应的抗体。例如,固相ELISA免疫测定,Western印迹,或免疫组织化学都是常规用于筛选可与某种蛋白发生特异免疫反应的单克隆抗体的方法。用于确定特异性免疫反应的免疫测定形式和条件的描述参见Harlow和Lane(1988)Antibodies,A Laboratory Manual,Cold Spring HarborPublications,New York(“Harlow和Lane”)。典型地,特异性或选择性反应应至少两倍于背景信号或噪音,更典型地10倍以上-100倍于背景。

″子序列″指核酸或氨基酸序列,其分别包含较长的核酸或氨基酸(如蛋白)序列的一部分。

″合成的″指包含并不存在于天然序列中的结构特征的核苷酸序列。例如,非常接近地模仿单子叶和/或双子叶植物(dicot和/或monocot)基因G+C含量和正常的密码子分布的人工序列即被视为合成的序列。

“转化”是一种将异源核酸引入宿主细胞或生物体的过程。具体说来,″转化″是指将DNA分子稳定地整合到目的生物的基因组中。应当理解经转化的细胞,组织,或昆虫不仅包含转化过程的终产物还包括其转基因的子代。

“转化的/转基因的/重组的”是指宿主生物,如细菌或植物,在其中已引入了异源核酸分子。所述的核酸分子可以稳定地整合到宿主生物的基因组中,或者所述核酸分子也可以以染色体外分子的形式存在。这种染色体外分子可以进行自主复制。经转化的细胞,组织,或植物应当理解为不仅包含转化过程的终产物还包含其转基因子代。“非转化的”,“非转基因的”,或“非重组的”宿主指不含异源核酸分子的野生型的生物,如,细菌或植物。

核苷酸通过下述标准缩写表示的碱基表示:腺嘌呤(A),胞嘧啶(C),胸腺嘧啶(T),和鸟嘌呤(G)。氨基酸可由下述的标准缩写表示:丙氨酸(Ala;A),精氨酸(Arg;R),天冬酰胺(Asn;N),天冬氨酸(Asp;D),半胱氨酸(Cys;C),谷氨酰胺(Gln;Q),谷氨酸(Glu;E),甘氨酸(Gly;G),组氨酸(His;H),异亮氨酸(Ile;I),亮氨酸(Leu;L),赖氨酸(Lys;K),甲硫氨酸(Met;M),苯丙氨酸(Phe;F),脯氨酸(Pro;P),丝氨酸(Ser;S),苏氨酸(Thr;T),色氨酸(Trp;W),酪氨酸(Tyr;Y),和缬氨酸(Val;V)。而且用(Xaa;X)代表任意氨基酸。

本发明涉及表达为新的毒素的新核酸序列,以及制造和使用所述毒素以控制虫害。具体而言,本发明涉及经优化以便在植物中表达的合成的基因序列,该序列编码多种形式的所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)δ-内毒素H04,其毒素部分包含Cry1Ab的结构域I和II和Cry1C的结构域III。编码H04杂合毒素的杂合基因,如U.S.Pat.No.5,736,131和De Maagd等,Appl.Environ.Microbiol.62(5):1537-1543(1996)所述,由天然的cry1Ab和Cry1C基因构建。WO 93/07278中给出了构建本发明的合成的H04基因的优选方法。由所述的新基因序列编码的杂合苏云金芽胞杆菌(Bacill thuringiensis)毒素对经济上重要的虫害,如草地夜蛾(fall armyworm),红铃麦蛾(pink bollworm),烟夜蛾,欧洲玉米螟(European cornborer),和菜蛾(diamondback moth)等具有高度的活性。所述的杂合苏云金芽胞杆菌(Bacillusthuringiensis)毒素可用于复合昆虫防治策略中,以获得最高的效率和最低的环境影响。

本发明还包括含有编码本发明的杀虫毒素的核苷酸序列的DNA分子。本发明进一步包括含有本发明核酸序列的重组载体。在这样的载体中,所述的核酸序列优选地包含在含有调控元件的表达盒中,所述的调控元件使得所述核苷酸序列能在能表达所述核苷酸序列的宿主细胞中表达。这种调控元件通常包含启动子和终止信号,优选地,其还包括使本发明的核酸序列有效翻译所需的元件。含有所述核酸序列的载体通常能在特定的宿主细胞中复制,优选地作为染色体外分子而复制,由此用于在所述宿主细胞中扩增本发明的核酸序列。在一个实施方案中,所述载体的宿主细胞是微生物,如细菌,特别是苏云金芽胞杆菌(Bacillus thuringiensis)或大肠杆菌。在另一实施方案中所述重组载体的宿主细胞是内生植物或附生植物。对于所述载体,一种优选的宿主细胞是真核细胞,如植物细胞。植物细胞如玉米细胞是最优选的宿主细胞。

在特别优选的实施方案中,本发明的杀虫毒素在植物中表达。在这种情况下,表达有效量的毒素的转基因植物可保护自身不受虫害的侵袭。当昆虫开始摄食这种转基因植物后,它们也摄入了植物表达的毒素。这将制止所述昆虫进一步咬食植物组织甚至危害或杀死所述的昆虫。

本申请中所述的核酸序列可通过重组DNA技术整合到植物细胞中。一般来讲,这包括利用本领域已知的克隆程序,将本发明的编码序列插入到一种表达系统中,对所述的表达系统来说上述序列是异源的(即,通常情况下不存在的)。所述的载体包含所插入的蛋白编码序列转录和翻译所必需的元件。本领域已知的大量载体系统均可使用,如质粒,噬菌体病毒和其它经修饰的病毒。合适的载体包括但不限于病毒载体,如λ载体系统λgtl1,λgtl0和Charon 4;质粒载体如pBI121,pBR322,pACYC177,pACYC184,pAR系列,pKK223-3,pUC8,pUC9,pUC18,pUC19,pLG339,pRK290,pKC37,pKC101,pCDNAII;以及其它类似的系统。转化的细胞可再生成完整的植物,以致本发明的核苷酸序列给该转基因植物赋予昆虫抗性。

本发明转化的植物可以是单子叶或双子叶植物(monocots或dicots),其包括但不限于,玉米,小麦,大麦,黑麦,甜马铃薯,黄豆,豌豆,菊苣,莴苣,卷心菜,嫩茎花椰菜,花椰菜,芜菁,萝卜,菠菜,芦笋,洋葱,大蒜,胡椒,芹菜,南瓜属植物,南瓜,大麻,夏南瓜,苹果,梨,榅桲,瓜(如,西瓜),李子,樱桃,桃子,油桃,杏,草莓,葡萄,悬钩子,黑莓,凤梨,鳄梨,番木瓜,芒果,香蕉,大豆,番茄,高粱,甘蔗,甜菜,向日葵,菜籽油菜,三叶草,烟草,胡萝卜,棉花,苜蓿,稻,马铃薯,茄子,黄瓜,拟南芥属(Arabidopsis),和木本植物,如松柏和落叶树。一旦所需的核苷酸序列转化到特定的植物种中,它可以利用传统的育种技术在该植物种中繁殖或转移到同种植物的其它品种中,特别是包括商业化的品种。

为使本发明的核苷酸序列在转基因植物中表达,它们可能需要被修饰或优化。尽管在很多情况下,来自微生物的基因在不经修饰的情况下也能在植物中高水平表达,但有时由于微生物的核苷酸序列存在植物所不偏嗜的密码子,使得它们在转基因植物中低水平表达。本领域中已知所有的生物对于其所使用的密码子均有特异的偏嗜性,本发明所述的核苷酸序列的密码子可以改变成符合植物偏嗜性并保持其所编码的氨基酸不变。而且,在植物中的高表达由具有至少约35%,优选高于约45%,更优选高于约50%,最优选高于约60%GC含量的编码序列达到。具有低GC含量的微生物的核苷酸序列在植物中的表达量低是由于存在ATTTA基元,该基元使信息去稳定,并且AATAAA基元可能引起不适当的聚腺苷酸化。尽管优选的基因序列可以在单子叶和双子叶植物种中均能足量地表达,也可以对序列进行修饰以满足单子叶植物或双子叶植物各自的特异密码子偏嗜性和GC含量偏嗜性,因为已证明两类植物的偏嗜性是不同的(Murray等Nucl.Acids Res.17:477-498(1989))。另外,还通过筛选所述的核苷酸序列以排除可能造成信息截短的不适当的剪接位点的存在。所有需要在所述核苷酸序列内部进行的改变如上述改变均可利用本领域已知的定点突变,PCR和合成基因构建等技术,利用已公开的专利申请EP 0 385 962,EP 0 359 472,和WO 93/07278所描述的方法来进行。

为有效地起始翻译,需要对起始甲硫氨酸临近的序列进行修饰。例如,它们可以通过包括已知的在植物中有效的序列进行修饰。Joshi建议了一种用于植物的适当的共有序列(NAR 15:6643-6653(1987)),Clontech建议了另外的共有序列翻译起始区(1993/1994catalog,page 210)。这些共有序列均适合用于本发明的核苷酸序列。将上述序列整合到含所述核苷酸序列的构建体中,直至包括ATG(留下第二个氨基酸是未经修饰的),或直至包括ATG之后的GTC(具有修饰转基因中第二个氨基酸的可能性)。

核苷酸序列在转基因植物中的表达被可在植物中行使功能的启动子所驱动。对启动子的选择依表达的时空需要和靶物种的不同而变化。因此,本发明的核苷酸序列表达在叶,穗,花序(如穗状花序,圆锥花序,穗轴,等等),根,和/或幼苗中是优选的。但是,在许多情况下,需要防卫多于一种的虫害,这样就希望在多种组织中表达。尽管有许多来自双子叶植物的启动子在单子叶植物中也可以起作用,反之亦然,但理想的仍然是选择双子叶植物启动子用于在双子叶植物中表达,而单子叶植物启动子用于在单子叶植物中表达。但是对所选择的启动子的起源并没有限制;只要它们能够驱动所述核苷酸序列在所需细胞中表达就足够了。

优选的组成型表达的启动子包括来自编码肌动蛋白和遍在蛋白的基因的启动子和CaMV 35S及19S启动子。本发明的核苷酸序列也可在可被化学调控的启动子的调控下表达。这使得所述的杀虫毒素只有在所述作物经诱导性化学物质处理后才能合成。优选的化学诱导基因表达技术在已公开的专利申请EP 0 332 104和US专利5,614,395中有描述。优选的化学诱导启动子的例子是烟草PR-1a启动子。

优选的启动子的种类是创伤诱导型的。已报道了多种在创伤位点及植物病原体侵染位点表达的启动子。理想地,这种启动子应当仅在侵染位点被局部激活,通过这种方式所述的杀虫毒素仅在需要合成该杀虫毒素以杀死入侵害虫的位点积累。优选的这种类型的启动子包括在下述文献中描述的那些启动子,即Stanford等,Mol.Gen.Genet.215:200-208(1989),Xu等,Plant.Molec.Biol.22:573-588(1993),Logemann等,Plant Cell 1:151-158(1989),Rohrmeier & Lehle,Plant.Molec.Biol.22:783-792(1993),Firek等,Plant.Molec.Biol.22:129-142(1993),和Warner等,Plant J.3:191-201(1993)。

优选的组织特异性表达方式包括绿色组织特异的,根特异的,茎特异的和花特异的。适合于在绿色组织中表达的启动子包括许多调节涉及光合作用的基因的启动子,它们中许多已从单子叶植物和双子叶植物中被克隆出来。一种优选的启动子是来自磷酸烯醇羧化酶基因的玉米PEPC启动子(Hudspeth & Grula,Plant.Molec.Biol.12:579-589(1989))。一种优选的根特异性表达启动子是de Framond(FEBS 290:103-106(1991);EP 0 452 269中所描述的玉米金属硫蛋白样(Maize metallothionein-like,MTL)启动子。优选的茎特异性启动子是US专利5,625,136中所描述的启动子,其驱动玉米trpA基因的表达。

本发明的特别优选的实施方案是以根优选的或根特异的方式表达至少一种本发明的核苷酸序列的转基因植物。进一步优选的实施方案是以创伤诱导或病原体侵染诱导的方式表达所述核苷酸序列的转基因植物。

除选择合适的启动子外,用于在植物中表达杀虫毒素的构建体中还需要有合适的转录终止子附加在所述异源核苷酸序列的下游。有几种此种类型的启动子是本领域已知并可以获得的(如tm1来自CaMV,E9来自rbcS)。任何可获得的能在植物中行使功能的已知终止子均可用于本发明。

许多序列均可整合到本发明中所述的表达盒中。它们包括已表明能增强表达的序列,如内含子序列(如来自Adh1和bronze1的)和病毒前导序列(如来自TMV,MCMV和AMV的)。

也可以优选使本发明的核苷酸序列表达靶向在植物中的不同细胞。有些情况下希望在细胞胞液质中表达,另外的情况下可能优选在亚细胞器中表达。利用本领域已知的技术可以进行转基因编码的酶的亚细胞定位。典型地,将编码来源于已知的细胞器靶向性基因产物的靶肽的DNA加工并融合到所述核苷酸序列的上游。已知有很多针对叶绿体的这种靶序列,并且已经研究出它们在异源构建体中有功能。本发明的核苷酸序列的表达也可以靶向宿主细胞的内质网或液泡。达到上述目的的技术是本领域已知的。

适合于植物转化的载体已在本说明书的其它部分进行了描述。对于土壤杆菌(Agrobacterium)介导的转化,适合使用二元载体或带有至少一种T-DNA边缘序列的载体,而对于直接基因转移,任何载体都是合适的,仅含有有用构建体的线性DNA可以是优选的。对于直接DNA转移的情形,可利用单一的DNA种类转化或共转化(Schocher等Biotechnology 4:1093-1096(1986))。对于直接转移和土壤杆菌介导的转移两者,通常(但不是必须)利用选择标记进行转化,所述的选择标记可提供抗生素(卡那霉素,潮霉素或氨甲喋呤)或除草剂(basta)抗性。这种选择标记的例子是新霉素磷酸转移酶,潮霉素磷酸转移酶,二氢叶酸还原酶,膦丝菌素乙酰转移酶,2,2-二氯丙酸(2,2-dichloroproprionic acid)脱卤素酶,乙酰羟酸合酶,5-烯醇丙酮酰-莽草酸-磷酸合酶,haloarylnitrilase,原卟啉(protoporhyrinogen)氧化酶,乙酰-辅酶A羧化酶,二氢蝶酸(dihydropteroate)合酶,氯霉素乙酰转移酶,和β-葡糖醛酸糖苷酶。另一种类型的阳性选择标记是甘露糖-6-磷酸异构酶(MPI/PMI)基因,它提供代谢甘露糖-6-磷酸盐异构酶的能力。但用于植物转化的筛选或选择标记不是本发明的关键。

可利用多种本领域已知的技术将上述的重组DNA引入植物细胞。本领域的技术人员知道根据转化靶向的植物类型选择这些方法。转化植物细胞的合适方法包括微注射(Crossway等,BioTechniques4:320-334(1986)),电穿孔(Riggs等,Proc.Natl.Acad.Sci.USA 83:5602-5606(1986)),土壤杆菌介导的转化(Hinchee等,Biotechnology 6:915-921(1988);也见,Ishida等,NatureBiotechnology 14:745-750(June 1996)中的玉米转化),直接基因转移(Paszkowski等,EMBO J.3:2717-2722(1984);Hayashimoto等,Plant.Physiol.93:857-863(1990)(稻)),和利用Agracetus,Inc.,Madison,Wisconsin和Dupont,Inc.,Wilmington,Delaware提供的设备进行的冲击粒子加速作用(参见,例如,Sanford等,U.S.Patent 4,945,050;和McCabe等,Biotechnology 6:923-926(1988))。还可参见,Weissinger等,Annual Rev.Genet.22:421-477(1988);Sanford等,Particulate Science and Technology 5:27-37 91987)(洋葱);Svab等,Proc.Natl.Acad.Sci.USA 87:8526-8530(1990)(烟草叶绿体);Christou等,Plant Physiol.87:671-674(1988)(大豆);McCabe等,Bio/Technology 6:923-926(1988)(大豆);Klein等,Proc.Natl.Acad.Sci.USA,85:4305-4309(1988)(玉米);Klein等,Bio/Technology 6:559-563(1988)(玉米);Klein等,Plant.Physiol.91;440-444(1988)(玉米);Fromm等,Bio/Technology 8:833-839(1990);和Gordon-Kamm等,PlantCell 2;603-618(1990)(玉米);Koziel等,Biotechnology 11:194-200(1993)(玉米);Shimamoto等,Nature 338;274-277(1989)(稻);Christou等,Biotechnology 9:957-962(1991)(稻);Datta等,Bio/Technology 8:736-740(1990)(稻);欧洲专利申请EP 0 332 581(鸭茅和其它Pooideae);Vasil等,Biotechnology 11:1553-1558(1993)(小麦);Weeks等,PlantPhysiol.102:1077-1084(1993)(小麦);Wan等Plant Physiol.104:37-48(1994)(大麦);Jahne等,Theor.Appl.Genet.89:525-533(1994)(大麦);Umbeck等,Bio/Technology 5:263-266(1987)(棉花);Casas等,Proc.Natl.Acad.Sci.USA90:11212-11216(Dec.1993)(高粱);Somers等,Bio/Technology10:1589-1594(Dec.1992)(燕麦);Torbert等,Plant CellReports 14:635-640(1995)(燕麦);Weeks等,Plant Physiol.102:1077-1084(1993)(小麦);Chang等,WO 94/13822(小麦)和Nehra等,The Plant Journal 5:285-297(1994)(小麦)。通过微粒轰击将重组DNA分子引入玉米的特别优选的一组实施方案参见Koziel等,Biotechnology 11:194-200(1993),Hill等,Euphytica 85:119-123(1995)和Koziel等,Annals of the NewYork Academy of Sciences 792:164-171(1996)。此外的优选实施方案是如EP 0 292 435中公开的对于玉米的原生质体转化法。植物转化可用单一的DNA种类或多DNA种类(即共转化)进行,这两种技术均适用于本发明的编码序列。

在另一优选的实施方案中,本发明的核苷酸序列直接转化到质体基因组中。质体转化的一个主要的优势在于质体一般可以表达未经实质修饰的细菌基因,并且质体还能表达在单一启动子控制下的多个开放阅读框。质体转化技术在U.S.专利Nos.5,451,513,5,545,817,和5,545,818,在PCT申请WO 95/16783,和McBride等(1994)Proc.Natl.Acad.Sci.USA 91,7301-7305中有详细的描述。叶绿体转化的基本技术包括,利用生物轰击(biolistics)或原生质体转化(如,氯化钙或PEG介导的转化)将所克隆的质体DNA区域连同有用基因一起引入到合适的靶组织中,所述的质体DNA区域两侧为选择标记。称作靶向序列的1到1.5kb的侧翼区易于与质体基因组进行同源重组,从而对质体基因组(plastome)的特异区域进行置换或修饰。起初,利用在叶绿体16S rRNA和赋予壮观霉素和/或链霉素抗性的rpsl2基因处的点突变作为转化的筛选标记(Svab,Z.,Hajdukiewicz,P.,和Maliga,P.(1990)Proc.Natl.Acad.Sci.USA 87,8526-8530;Staub,J.M.,和Maliga,P.(1992)Plant Cell 4,39-45)。这导致以对靶叶轰击约每100次中有一次的频率得到稳定的同质体转化体。在这些标记之间存在的克隆位点可用于创建靶定质体的载体,该载体可用于引入外源基因(Staub,J.M.,和Maliga,P.(1993)EMBO J.12,601-606)。转化频率的大幅度提高可通过下述方式实现,即用显性的选择标记,编码壮观霉素解毒酶氨基糖苷-3’-腺嘌呤转移酶(Svab,Z.,和Maliga,P.(1993)Proc.Natl.Acad.Sci.USA 90,913-917)的细菌aadA基因替换隐性的rRNA或r-蛋白抗生素抗性基因。先前这一标记已成功地用于绿藻Chlamydomonas reinhardtii质体基因组的高频转化(Goldschmidt-Clermont,M.(1991)Nucl.AcidsRes.19:4083-4089)。其它本领域已知的对质体转化有用的选择标记也包含在本发明的范围内。典型地,在转化后需要约15-20个细胞分裂周期才能达到同质体状态。通过同源重组已使基因插入到存在于每一植物细胞的环状质体基因组的全部几千个拷贝中的质体表达,利用了相对于核表达基因的巨大拷贝数的优势,使得表达水平可容易地超过总的植物可溶蛋白的10%。在一个优选的实施方案中,本发明的核苷酸序列插入到靶定质体的载体中并转化到所需植物宿主的质体基因组中。由此获得了就含有本发明的核苷酸序列的质体基因组而言同型的植物,所述植物优选地可以高表达所述核苷酸序列。

                         实施例

本发明参照下述的详细实施例进行进一步详细描述。这些实施例只是处于示例性的目的,除非特别说明,它们不是限制性的。此处所用的标准的重组DNA技术和分子克隆技术是本领域已知的,并且在下述文献中有详细的描述:Ausubel(编),Current Protocols inMolecular Biology,John Wiley and Sons,Inc.(1994);T.Maniatis,E.F.Fritsch和J.Sambrook,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor laboratory,ColdSpring Harbor,NY(1989);和T.J.Silhavy,M.L.Berman,和L.W.Enquist,Experiments with Gene Fusions,Cold SpringHarbor Laboratory,Cold Spring Harbor,NY(1984)。

实施例1:H04毒素片段的表达和纯化

将H04杂合毒素基因的截短形式克隆到表达载体,如pBluescript SK-,芽孢杆菌穿梭载体,或pET 21b(+)中以在大肠杆菌中过表达,所述的H04杂合毒素基因的截短形式,如De Maagd等,Appl.Environ.Microbiol.62(5):1537-1543(1996)中所述,编码本质上由Cry1Ab的结构域I和II以及Cry1C的结构域III组成的Bt毒素。细胞在含50μg/ml氨苄青霉素的LB培养基上于37℃下摇床培养(250rpm)24到48小时。7,000rpm离心10min收集细胞。所得的颗粒状物用Bronson超声波仪超声处理2分30秒,脉冲间隔为2秒。全部的超声处理物在显微镜下镜检。10,000rpm离心10min去除可溶部分。所得的含有晶体蛋白的颗粒状物用含0.5M NaCl的2%Triton X-100洗4-5次。用0.5M NaGl(4-5次)连续地洗,最终的颗粒状物用蒸馏水洗(2次)。所得的颗粒状物于含10mM二硫苏糖醇的50mM Na2CO3缓冲液在37℃下溶解2h。12,000rpm离心10min将已溶的蛋白与不溶物质分离开。蛋白样品用50mM Na2CO3,pH9.0的缓冲液透析以备进行生物测定。

实施例2:生物测定

用纯化的截短H04蛋白测定了草地夜蛾(fall armyworm),红铃麦蛾(pink bollworm),烟夜蛾,和欧洲玉米螟(Europeancornborer)的LC50值,所述的H04蛋白是例如通过上述实施例1制备的。结果如下:LC50草地夜蛾(fall armyworm)              133ng/cm2LC50红铃麦蛾(pink bollworm)              691ng/cm2LC50烟夜蛾(tobacco budworm)              299ng/cm2LC50欧洲玉米螟(European cornborer)       31ng/cm2

实施例3:合成的H04基因构建体

编码H04毒素部分的合成的核苷酸序列是利用玉米偏嗜密码子表(Murray等,Nucl Acids Res.17:477-498,1989,在此引入作为参考)通过University of Wisconsin GCG程序组提供的“Backtranslation”程序,反向翻译(backtranslating)De Maagd等,Appl.Environ.Microbiol.62(5):1537-1543(1996)中描述的H04杂合毒素的氨基酸序列(Cry1Ab的结构域I和II和Cry1C的结构域III)而设计的。优选地,如WO 93/07278中所描述的,对每个氨基酸均应用使用频率最高的玉米密码子。

编码H04毒素部分的合成的核苷酸序列可由几个片段构建。每个片段都是通过代表所述基因两条链的长度为60-75个核苷酸的10对寡聚体的杂交而构建的。连续的寡核苷酸对之间有约15个核苷酸的重叠以便于正确的定位和组装。寡核苷酸可以通过,例如GenosysBiotechnologies Inc.,TX来合成。使每一对寡聚体杂交,并使用供应商提供的条件用多核苷酸激酶磷酸化,所述的多核苷酸激酶可购自New England Biolabs,Inc.,MA。使激酶作用过的片段对杂交并连接到高拷贝质粒中再转化到例如感受态的DH5α内,所述的质粒载体包含如,氨苄青霉素抗性基因。将所述的细胞涂布到含有氨苄青霉素的培养基上于37℃下培养过夜。筛选插入了DNA的克隆。将所述的DNA测序,筛选出含有正确序列的克隆。利用所述片段间独特的限制性位点进行限制性消化,连接和转化。

SEQ ID NO:3是编码631-氨基酸的H04(不带有尾区域)毒素部分的合成的核苷酸序列,SEQ ID NO:4是由SEQ ID NO:3中描述的合成的核苷酸序列编码的H04毒素的氨基酸序列。SEQ ID NO:11是构建体pNOV1308的核苷酸序列,其包含与SEQ ID NO:3中所示的合成的H04基因序列可操作性连接的组成型的玉米遍在蛋白启动子。

除上述描述的仅编码H04杂合体毒素部分(Cry1Ab的结构域I和II以及Cry1C的结构域III)的合成基因(SEQ ID NO:3)外,还利用如U.S.Patent No.5,625,136(引入此处作为参考)所述的与H04毒素部分3’末端相融合的全部或部分合成的cry1Ab尾区域构建其它的合成的H04基因。这些带有cry1Ab尾的合成的H04基因序列如下:

SEQ ID NO:5是编码H04毒素部分加全长的Cry1Ab尾部分的合成的核苷酸序列,SEQ ID NO:6是由SEQ ID NO:5中所述的合成的核苷酸序列编码的H04+Cry1Ab尾的氨基酸序列。SEQ ID NO:12是构建体pNOV1436的核苷酸序列,其包含与如SEQ ID NO:5中所述的合成的H04基因序列可操作连接的根优选的玉米MTL启动子。SEQ IDNO:13是构建体pNOV1441的核苷酸序列,其包含与如SEQ ID NO:5中所述的合成的H04基因序列可操作连接的组成型的玉米遍在蛋白启动子。

SEQ ID NO:7是编码H04毒素部分加全长的Cry1Ab尾部分的另一种合成的核苷酸序列,SEQ ID NO:8由SEQ ID NO:7中所述的合成的核苷酸序列编码的H04+Cry1Ab尾的氨基酸序列。SEQ ID NO:14是构建体pNOV1305的核苷酸序列,其包含与如SEQ ID NO:7中所述的合成的H04基因序列可操作连接的组成型的玉米遍在蛋白启动子。SEQ ID NO:15是构建体pNOV1313的核苷酸序列,其包含与如SEQID NO:7中所述的合成的H04基因序列可操作连接的组成型的玉米遍在蛋白启动子。

SEQ ID NO:9是编码H04毒素部分加Cry1Ab尾头40个氨基酸的合成的核苷酸序列,SEQ ID NO:10是由SEQ ID NO:9中描述的合成的核苷酸序列编码的H04+40氨基酸的截短的Cry1Ab尾的氨基酸序列,SEQ ID NO:16是构建体pNOV1435的核苷酸序列,其包含与如SEQ ID NO:9中所述的合成H04基因序列可操作地连接的根偏好的玉米MTL启动子。SEQ ID NO:17是构建体pZU578的核苷酸序列,其包含与如SEQ ID NO:9中所述的合成H04基因序列可操作连接的鼠耳芥属(Arabidopsis)肌动蛋白-2启动子。

实施例4:编码序列及其临近序列的修饰

本申请中所述的核苷酸序列可进行修饰以在转基因植物宿主中表达。表达所述核苷酸序列并在其细胞中产生杀虫毒素的宿主植物具有增强的对昆虫袭击的抗性,并更好地武装起来以抵抗与所述侵袭相关的作物损失。

微生物来源的基因在植物中进行转基因表达可能需要修饰这些基因以实现并优化其在植物中的表达。具体说来,编码单独的酶的细菌的ORFs,虽然在天然微生物中是由同一个转录本编码的,但在植物中需要在不同的转录本上才能较好地表达。为此,每种微生物的ORF均需单独分离出来,并克隆到在所述ORF5’末端提供植物启动子、在所述ORF3’末端提供植物转录终止子的表达盒中。所述的经分离的ORF序列优选地包含起始ATG和终止密码子,但也可以包含起始ATG和终止密码子以外的序列。除此之外,所述的ORF可以是截短的,但需保留所需的活性;对于特别长的ORFs,优选地使用其保留活性的截短形式在转基因生物中表达。“植物启动子”和“植物转录终止子(transcriptional terminator)”是指可在植物细胞中起作用的启动子和转录终止子。这也包括非植物如病毒(一个例子是花椰菜花叶病毒)来源的启动子和转录终止子。

在某些情况下,不需要对编码序列的ORF和邻近序列进行修饰。分离出含有有用的ORF的片段并插入到植物启动子的下游就足够。例如,Gaffney等(Science 261:754-756(1993))在没有对编码序列进行修饰的前提下,已在转基因植物中成功地表达了在CaMV 35S启动子和CaMV tml终止子的控制下的假单胞菌属(Pseudomonas)nahG基因,并且nahG ORF还附加了ATG的上游x bp的假单胞菌基因,和终止密码子下游y bp。优选地,尽可能少地在ATG的上游和终止密码子的下游遗留微生物的序列。在实践中这种构建要依赖于所能够获得的限制性位点。

在另外一些情况下,微生物来源的基因的表达可能存在一些问题。这些问题已在现有技术中有详细地描述,且对某些来源,如芽孢杆菌的基因有特定的共性。这些问题也存在于本发明的核苷酸序列,但可以用本领域已知的技术对这些基因进行修饰。可能遇到的问题如下:

1.密码子的使用

植物中的优选密码子使用与在特定微生物中优选的密码子使用不同。将所克隆的微生物ORF中的密码子使用与在植物基因(特别是来自靶植物的基因)中的密码子使用进行比较可以鉴定出所述ORF中应当优选地被改变的密码子。典型地,植物进化表现出对于单子叶植物在第三个碱基位置上对核苷酸C和G的强烈偏嗜性,而对于双子叶植物在这一位置上常常使用核苷酸A或T。通过对基因进行修饰掺入在特定的靶生物种中优选使用的密码子,下述的许多有关GC/AT含量和不适当剪接的问题都可以得到克服。

2.GC/AT含量

植物基因典型地具有高于35%的GC含量。富含A和T核苷酸的ORF序列将在植物中引起许多问题。首先,据信ATTTA基元引起信使RNA(message)的去稳定,且发现于许多短寿的mRNA的3’末端。第二,据信聚腺苷酸化信号,如AATAAA在信使RNA内不适当位置的出现将引起转录的成熟前截断。另外,单子叶植物可能将富含-AT的序列作为剪接位点识别(见下)。

3.邻近起始甲硫氨酸的序列

与微生物不同,植物的信使RNA没有明确的核糖体结合位点。而是,据信核糖体附加于信使RNA的5’末端扫描第一个可利用的ATG由此起始翻译。虽然如此,其对临近ATG的某些序列具有偏嗜,因此可以通过在微生物基因中ATG处包含真核细胞共有的翻译起始序列来增强其表达。Clontech(1993/1994 catalog,page 210,在此引入作为参考)建议了一种用于在植物中表达大肠杆菌uidA基因的作为翻译起始子的序列。另外,Joshi(NAR 15:6643-6653(1987),在此引入作为参考)比较了许多邻近ATG的植物序列,提示了另一种共有序列。当在植物中表达微生物ORF遇到困难时,在起始ATG处掺入上述序列中的一种可能会对翻译有改善。在这些情况下,由于对第二AA残基的修饰,共有序列的最后三个核苷酸可能不适于掺入修饰的序列中。在不同植物种中,优选的邻近起始甲硫氨酸的序列可能是不同的。对14种记录于GenBank数据库中的玉米基因进行调查给出了下述的结果:

           在14种玉米基因中起始ATG前的位置

    -10 -9  -8  -7  -6  -5  -4  -3  -2  -1

C    3     8     4     6     2     5     6     0     10    7

T    3     0     3     4     3     2     1     1     1     0

A    2     3     1     4     3     2     3     7     2     3

G    6     3     6     0     6     5     4     6     1     5

这一分析可针对有待掺入所述核苷酸序列的目的植物来进行,修饰邻近ATG的序列以掺入优选的核苷酸。

4.去除非正常的剪接位点

由非植物来源克隆的且未经为适于在植物中表达而进行优化的基因也可能包含在植物中被识别为5’或3’剪接位点的基元,从而使所述基因被切割产生截短的或缺失的信使RNA。这些位点可使用本领域熟知的方法去除。

用于修饰编码序列及邻近序列的技术是本领域已知的。在微生物ORF起始表达量低并且确定适合于对所述序列进行上述改变的情况下,可以利用本领域已知的技术来构建合成的基因。它们是在已出版的专利说明书EP 0 385 962,EP 0 359 472和WO 93/07278中描述的,上述文献均引入此处作为参考。  在大多数情况下优选在其转移到转基因植物中以前,用瞬时分析方法(其在本领域是已知的)分析基因构建体的表达。

实施例5:植物表达盒的构建

用于在转基因植物中表达的编码序列首先组装在表达盒中置于能在植物中进行表达的启动子后。所述的表达盒还可包括转基因表达所需或为其选择的其它序列。这些序列包括但不限于,转录终止子,加强表达的外来序列,如内含子,必需序列(vital sequences),和为使基因产物靶定特定的细胞器和细胞区室的序列。这些表达盒易于转移到下述的植物转化载体中。下面是对典型的表达盒的不同元件的描述。

1.启动子

用于表达盒的启动子的选择将确定转基因在转基因植物中的时空表达方式。所选择的启动子将在特定的细胞类型(如叶表皮细胞,叶肉细胞,根皮层细胞)、或在特定的组织或器官(例如,根,叶或花)中表达转基因,所述的选择将反映有待积累所述基因产物的位置。另外,所选择的启动子可以在多种诱导条件下驱动所述基因的表达。不同启动子其强度(即启动转录的能力)不同。根据所使用的宿主细胞系统,可使用任何一种合适的启动子,它们包括所述基因的天然启动子。下面是可用于表达盒中的启动子的非限制性例子。

a.组成型表达,遍在蛋白启动子:

遍在蛋白是已知在多种细胞类型中积累的基因产物,已从许多物种中克隆出了它的启动子以用于转基因植物(如向日葵-Binet等Plant Science 79:87-94(1991);玉米-Christensen等PlantMolec.Biol.12:619-632(1989);和拟南芥属-Norris等,PlantMol.Biol.21:895-906(1993))。所述的玉米遍在蛋白启动子已在转基因单子叶系统中开发出来,其序列和为进行单子叶植物转化所构建的载体已在专利出版物EP 0 342 926中公开,该文献在此引入作为参考。Taylor等(Plant cell Rep.12:491-495(1993))描述了一种载体(pAHC25),其包含玉米遍在蛋白启动子和第一内含子,当它经微粒轰击引入多种单子叶植物后,在所述植物细胞悬液中具有高活性。拟南芥属遍在蛋白启动子可理想地与本发明的核苷酸序列一起应用。所述的遍在蛋白启动子适合于在转基因的单子叶植物和双子叶植物中表达。合适的载体是经引入合适的遍在蛋白启动子和/或内含子序列而修饰的pAHC25或本说明书中所述的任意一种转化载体的衍生物。

b.组成型的表达,CaMV 35S启动子:

质粒pCGN1761的构建在已出版的专利申请EP 0 392 225(实施例23)中描述,该文献引入此处作为参考。pCGN1761包含″双″CaMV35S启动子和tml转录终止子,并在所述的启动子和终止子之间带有独特的EcoRI位点,且具有pUC-型的骨架。一种构建的pCGN1761衍生物具有经修饰的多接头,除已存在的EcoRI位点外该接头还包含NotI和XhoI位点。将这种衍生物命名为pCGN1761ENX。pCGN1761ENX对于在其多接头内克隆cDNA序列或编码序列(包含微生物的ORF序列)是有用的,这可以使所述基因在转基因植物中在35S启动子的控制下表达。这种构建体的完整的35S启动子-编码序列-tml终止子盒可被启动子5’端的HindIII,SphI,SalI,和XbaI位点和终止子3’端的XbaI,BamHI和BglI位点切割下来,转移到转化载体,如下述的载体中。而且,所述的35S启动子片段可用HindIII,SphI,SalI,XbaI,或Pstl由5’切割,或用任意一种多接头限制位点(EcoRI,NotI或XhoI)由3’切割,替换为其它的启动子。如果需要还可以通过在克隆位点周围引入增强翻译的序列以进行修饰。如果需要过表达则这种方法特别有用。例如,pCGN1761ENX可由U.S.Patent No.5,639,9493实施例37中描述的对翻译起始位点的优化进行修饰,上述文献在此引入作为参考。

c.组成型表达,肌动蛋白启动子:

已知几种肌动蛋白同种型在大多数细胞类型中表达,因此,所述的肌动蛋白启动子是组成型启动子的一个很好的选择。具体说来,来自稻ActI基因的启动子已被克隆和描述(McElroy等Plant Cell 2:163-171(1990))。已发现在该启动子的1.3kb片段内包含在稻原生质体中表达所需的所有调控元件。而且,已构建了多种基于ActI启动子的表达载体,特定地用于于单子叶植物(McElroy等Mol.Gen.Genet.231:150-160(1991))。它们并入了ActI-内含子1,AdhI 5’侧翼序列和AdhI-内含子1(来自玉米醇脱氢酶基因)和来自CaMV 35S启动子的序列。表现出最高表达的载体是35S和ActI内含子或ActI 5’侧翼序列以及ActI内含子的融合体。在起始ATG(属GUS报告基因)周围序列的优化也可增强表达。可容易地对McElroy等(MolGen.Genet.231:150-160(1991))所述的启动子表达盒进行修饰以用于基因表达,特别是在单子叶植物宿主中。例如,由McElroy构建体中分离出含启动子的片段,用于替换pCGN1761ENX中的双35S启动子,使其可用于插入特异的基因序列。可将上述构建的融合基因转移到合适的转化载体中。在单独的报道中还发现,带有其第一内含子的稻ActI启动子也可以指导在培养的大麦细胞中的高表达(Chibbar等Plant Cell Rep.12:506-509(1993))。

d.诱导型表达,PR-1启动子:

pCGN1761ENX中的双35S启动子可用任意其它的启动子替换以期达到合适的高表达水平。通过例如,一种U.S.Patent No.5,614,395中所描述的化学调节的启动子,如烟草PR-1a启动子,可用于替换上述的双35S启动子。或者,也可使用Lebel等,Plant J.16:223-233(1998)中所述的拟南芥属PR-1启动子。优选地用限制性酶将所选择的启动子从其来源中切割出来,但也可由带有合适的末端限制位点的引物通过PCR扩增。若进行PCR扩增,则在扩增启动子克隆到靶载体中后,所述的启动子应当经过再测序,检查是否有扩增错误。所述的可由化学/病原体调节的烟草PR-1a启动子可由质粒pCIB1004(有关的构建参见EP 0 332 104中的实施例21,该文献引入此处作为参考)中切割出来,然后转移到质粒pCGN1761ENX(Uknes等,Plant Cell 4:645-656(1992))中。pCIB1004再经NcoI切割,所得的线性片段的3’突出端通过T4 DNA多聚酶的处理钝化。再将所述片段用HindIII切割,所得的含PR-1a启动子的片段经凝胶纯化后克隆到已去除了双35S启动子的pCGN1761ENX中。这是通过下述操作完成的,即用XhoI切割,再由T4聚合酶钝化,接下来用HindIII切割,然后分离克隆了pCIB1004启动子片段的大的含有载体终止子的片段。由此产生了pCGN1761ENX衍生物,其带有PR-1a启动子和tml终止子以及所插入的带有独特的EcoRI和NotI位点的多接头。可将选择的编码序列插入这一载体中,所得的融合产物(即,启动子-基因-终止子)可转移到任何所选择的转化载体中,包括上文中所述的载体。多种化学调节剂可用于诱导所选择的编码序列在根据本发明转化的植物中的表达,所述的化学调节剂包括U.S.专利Nos.5,523,311和5,614,395中所述的苯并噻二唑(benzothiadiazole),异烟酸,和水杨酸化合物。

e.诱导型表达,乙醇可诱导的启动子:

可由特定的醇类或酮类,如乙醇诱导的启动子也可用于本发明编码序列的诱导型表达。这种启动子如来自构巢曲霉(Aspergillusnidulans)的alcA基因启动子(Caddick等(1998)Nat.Biotechnol 16:177-180)。在构巢曲霉中,所述的alcA基因编码醇脱氢酶I,在存在化学诱导剂的情况下,其表达可受AlcR转录因子的调节。为本发明的目的,在含与最小35S启动子(Caddick等(1998)Nat.Biotechnol 16:177-180)融合的alcA基因启动子序列的质粒palcA:CAT中CAT编码序列被本发明的编码序列所替代,形成具有在alcA基因启动子控制下的编码序列的表达盒。这可由本领域已知的方法进行。

f.诱导型表达,糖皮质激素诱导的启动子

本发明还包括用基于类固醇激素的系统诱导本发明的核苷酸序列表达。例如,使用糖皮质激素介导的诱导系统(Aoyama和Chua(1997)The Plant Journal 11:605-612),基因表达可通过应用糖皮质激素来诱导,例如合成的糖皮质激素,优选地塞米松,优选浓度范围是0.1mM到1mM,更优选从10mM到100mM。为本发明的目的,萤光素酶基因序列可由本发明的核酸序列所替代以形成具有本发明核酸序列的表达盒,所述核酸序列受6拷贝的与35S最小启动子相融合的GAL4上游激活序列调控。这可用本领域中已知的技术进行操作。反式作用因子包含GAL4 DNA结合结构域(Keegan等(1986)Science231:699-704),其与疱疹病毒蛋白VP16反式活化域(Triezenberg等(1988)Genes Devel.2:718-729)相融合,后者与大鼠糖皮质激素受体的激素结合结构域(Picard等(1988)Cell 54:1073-1080)相融合。所述融合蛋白的表达受本领域已知的或此处所述的任何合适的启动子调控。这一表达盒也包含在含有与6xGAL4/最小启动子相融合的本发明核酸序列的植物中。由此,实现融合蛋白的组织或器官特异性,导致所述杀虫毒素的可诱导的组织或器官特异性。

g.根特异性的表达:

另一种基因表达方式是根表达。合适的根启动子是de Framond(FEBS 290:103-106(1991))及U.S.Patent No.5,466,785中所描述的玉米金属硫蛋白样(MTL)基因的启动子,上述文献引入此处作为参考。这种“MTL”启动子转移到合适的载体,如pCGN1761ENX中以插入所选择的基因,接下来转移完全的启动子-基因-终止子盒到目的转化载体中。

h.创伤诱导型启动子:

创伤诱导型启动子也适合应用于基因表达。目前已有多种此种类型的启动子的描述(如Xu等Plant Molec.Biol.22:573-588(1993),Logemann等Plant Cell 1:151-158(1989),Rohrmeier& Lehle,Plant Molec.Biol.22:783-792(1993),Firek等Plant Molec.Biol.22:129-142(1993),Warner等Plant J.3:191-201(1993)),所有这些启动子均适用于本发明。Logemann等描述了双子叶的马铃薯wunI基因5’上游序列。Xu等描述了来自双子叶植物马铃薯(Pin2)的创伤诱导型启动子在单子叶的稻中具有活性。而Rohrmeier & Lehle描述了玉米WipI cDNA的克隆,其也是创伤诱导的且可用于通过标准的技术分离同族的启动子。类似地,Firek等和Warner等描述了来自单子叶的石刁柏(Asparagusofficinalis)的创伤诱导型启动子,该启动子在局部创伤和病原体侵入位点表达。利用本领域已知的克隆技术,可将这些启动子转化到合适的载体中,与本发明的基因相融合,用于在植物创伤位点表达所述基因。

i.髓(pith)偏好的表达:

引入此处作为参考的专利申请WO 93/07278描述了玉米trpA基因的分离,该基因偏好在髓细胞中表达。给出了所述的基因序列和由转录起点延伸至-1726bp的启动子。利用标准的分子生物学技术,可将这一启动子,或其片段转移到载体,如pCGN1761中,在该载体中其可替换35S启动子,并用于驱动外源基因以髓偏好的方式表达。实际上,含有髓偏好启动子或其部分的片段可转移到任何载体中,并可被修饰以用于在转基因植物中表达。

j.叶特异性的表达:

编码磷酸烯醇羧化酶(PEPC)的玉米基因已被Hudspeth和Grula(Plant Molec Biol 12:579-589(1989))公开。利用标准的分子生物学技术,该基因的启动子可在转基因植物中以叶特异的方式,驱动任何基因的表达。

k.花粉特异的表达:

WO 93/07278中描述了玉米钙依赖性蛋白激酶(CDPK)基因的分离,该基因在花粉细胞中表达。该基因序列和启动子延伸至从转录起点起多达1400bp。利用标准的分子生物学技术,可将这一启动子,或其片段转移到载体,如pCGN1761中,在该载体中其可替换35S启动子,并用于驱动本发明核酸序列以花粉特异性的方式表达。

1.在化学配体存在下由受体介导的反式激活作用:

引入此处作为参考的U.S.Patent No.5,880,333中描述了一种系统,其中II类激素受体,如作为异源二聚体行使功能的蜕皮激素受体(EcR)和Ultraspiracle(USP),在存在合适的化学配体,如tebufenozide时,在植物细胞中调节靶多肽的表达。

2.转录终止子

有多种可用于表达盒的转录终止子。它们负责使转基因转录终止并进行正确的聚腺苷酸化。合适的转录终止子是已知可在植物中形使功能的那些,其包括CaMV 35S终止子,tml终止子,胭脂碱合酶终止子和豌豆rbcS E9终止子。它们均可用于单子叶植物和双子叶植物。另外,也可以使用基因的天然转录终止子。

3.增强或调节表达的序列

已发现有很多序列可用于增强转录单位中的基因表达,可将这些序列与本发明的基因相连接以提高所述基因在转基因植物中的表达。

已表明有多种内含子序列可增强基因的表达,特别是在单子叶植物细胞中。例如当将玉米AdhI基因的内含子引入玉米细胞时,其能显著地增强在其同类启动子控制下的基因的表达。已表明内含子1特别有效并增强带有氯霉素乙酰转移酶基因的融合构建体的表达(Callis等,Genes Develop.1:1183-1200(1987))。在相同的实验系统中,来自玉米bronzel基因的内含子对增强表达有类似的效果。内含子序列已常规地引入到植物转化载体中,典型地,处在非翻译前导序列中。

已知衍生自病毒的大量非翻译前导序列有增强表达的作用,并且在双子叶植物细胞中特别有效。具体地,来自烟草花叶病毒(TMV,″W-序列″),玉米萎黄病斑点病毒(Maize Chlorotic MottleVirus,MCMV),和苜蓿花叶病毒(AMV)的前导序列能有效地增强表达(如Gallie等Nucl.Acids Res.15:8693-8711(1987);Skuzeski等Plant Molec.Biol.15:65-79(1990))。

4.在细胞内基因产物的靶定(targeting)

已知在植物中存在多种靶定基因产物的机制,并且所述机制中控制该功能的序列已有所描述。例如,将基因产物靶定到叶绿体是由在多种蛋白氨基末端发现的信号序列控制的,所述的信号序列在向叶绿体运输过程中被切除以获得成熟的蛋白  (如Comai等J.Biol.Chem.263:15104-15109(1988))。这些信号序列可与异源基因产物相融合使所述的异源产物运送到叶绿体(van den Broeck,等Nature 313:358-363(1985))。编码合适的信号序列的DNA可由编码RUBISCO蛋白、CAB蛋白,EPSP合酶,GS2蛋白以及其它已知定位于叶绿体的蛋白的cDNA的5’末端分离。参见U.S.Patent No.5,639,949实施例37中以“靶定叶绿体的表达”为标题的部分。

其它的基因产物定位于其它的细胞器,如线粒体和过氧物酶体(如Unger等Plant Molec.Biol.13:411-418(1989))。也可对编码这些产物的cDNA进行进行操作以实现所述异源基因向这些细胞器的靶定。这种序列的例子是核编码的ATP酶和对线粒体特异的天冬氨酸氨基转移酶的同种型。Rogers等描述了导向性细胞蛋白体(Proc.Natl.Acad.Sci.USA82:6512-6516(1985))。

另外也有对使基因产物靶定其它细胞区室的序列的描述。氨基末端序列负责靶向ER,质外体,及由糊粉细胞向胞外分泌(Koehler &Ho,Plant Cell2:769-783(1990))。另外,氨基末端序列与羧基末端序列联合负责基因产物的液泡靶定(Shinshi等Plant Molec.Biol.14:357-368(1990))。

通过将合适的上述靶向序列与有用的转基因序列相融合可能指导转基因产物到任何细胞器或细胞区室。对于叶绿体靶定,例如,可将来自RUBISCO蛋白、CAB蛋白,EPSP合酶,GS2基因的叶绿体信号序列与转基因的氨基末端ATG进行框内融合。所选择的信号序列应包含已知的切割位点,而且构建融合构建体应考虑到任何处于切割位点之后的对切割所必需的氨基酸。有时候为了达到上述要求可在切割位点和转基因ATG之间添加少量的氨基酸,或者替换转基因序列内的某些氨基酸。用于输入叶绿体而构建的融合体可按照Bartlett等在Edelmann等(编)Methods in chloroplast Molecular Biology,Elsevier pp 1081-1091(1982)和Wasmann等在Mol.Gen.Genet.205:446-453(1986)中所描述的技术,通过体外转录的构建体的体外翻译检测叶绿体摄取效果。这些构建技术是本领域周知的,也可应用于线粒体和过氧化物酶体。

上面所描述的细胞靶定机制不仅可与同源启动子(Cognatepromoters)结合使用,也可以与异源启动子一起使用,在该启动子的转录调节下实现特定的细胞靶定目的,该启动子的表达方式与靶定信号序列原有的启动子的表达方式是不同的。

实施例6:植物转化载体的构建

本领域的技术人员已知存在多种用于植物转化的转化载体,本发明的基因可与上述的任何一种载体结合使用。所述载体的选择依赖于优选的转化技术和待转化的靶物种。对于特定的靶物种,不同的抗生素或除草剂选择标记可能是优选的。在转化中常规使用的选择标记包括nptII基因,其可赋予卡那霉素以及相关的抗生素抗性(Messing& vierra.Gene 19:259-268(1982);Bevan等,Nature304:184-187(1983)),bar基因,其可赋予除草剂膦丝菌素抗性(White等,Nucl.Acids Res 18:1062(1990),Spencer等Theor.Appl.Genet 79:625-631(1990)),hph基因,其可赋予抗生素潮霉素抗性(Blochinger & Diggelmann,Mol Cell Biol 4:2929-2931),和dhfr基因,其可赋予methatrexate抗性(Bourouis等,EMBO J.2(7):1099-1104(1983)),EPSPS基因,其可赋予草甘膦抗性(U.S.Patent Nos.4,940,935 and 5,188,642),和甘露糖-6-磷酸异构酶基因,其可提供代谢甘露糖的能力(U.S.Patent Nos.5,767,378和5,994,629)。

1.适合于土壤杆菌转化的载体

许多载体适用于利用根癌土壤杆菌(Agrobacteriumtumefaciens)的转化。它们典型地至少带有一个T-DNA边界序列,包括载体例如pBIN19(Bevan,Nucl.Acids Res.(1984))和pXYZ。下面描述了两种适合用于利用土壤杆菌进行转化的典型载体。

a.pCIB200和pCIB2001:

用所述的二元载体pCIB200和pCIB2001构建与土壤杆菌一起使用的重组载体,其构建方式如下。pTJS75kan是通过NarI消化pTJS75而创建的(Schmidhauser & Helinski,J.Bacteriol.164:446-455(1985)),其切除了四环素抗性基因,然后插入来自带有NPTII的pUC4K的AccI片段(Vieira & Messing,Gene 19:259-268(1982):Bevan等,Nature 304:184-187(1983):McBride等,PlantMolecular Biology 14:266-276(1990))。XhoI接头与PCIB7的EcoRV片段相连接,所述的EcoRV片段包含左右T-DNA边界,植物选择性的nos/nptII嵌合基因和pUC多接头(Rothstein等,Gene 53:153-161(1987)),将XhoI消化的片段克隆到SalI-消化的pTJS75kan中以构建pCIB200(参见EP 0 332 104,实施例19)。pCIB200包含下述独特的多接头限制性位点:EcoRI,SstI,KpnI,BglII,XbaI,和SalI。pCIB2001是pCIB200的衍生物,其是通过将附加的位点插入多接头中构建的。pCIB2001的多接头中的独特的限制性位点是EcoRI,SstI,KpnI,BglII,XbaI,SalI,MluI,BclI AvrII,ApaI,HpaI,和StuI,pCIB2001,除包含上述独特的限制性位点外,还包含植物和细菌卡那霉素选择标记,用于土壤杆菌介导的转化的左右T-DNA边界,RK2-衍生的trfA的功能,用于在大肠杆菌和其它宿主之间的移动,和也来自RK2的OriT和OriV功能。所述的pCIB2001多接头适合于克隆含有其本身调节信号的植物表达框。

b.pCIB10及其潮霉素选择衍生物:

二元载体pCIB10包含编码卡那霉素抗性的基因以便于在植物中进行筛选,和T-DNA左右侧边界序列,并掺入了来自宽宿主范围的质粒pRK252的序列,使其能在大肠杆菌和土壤杆菌间复制。这一构建体已由Rothstein等(Gene 53:153-161(1987))描述。构建了多种pCIB10衍生物,其掺入了Gritz等(Gene 25:179-188(1983))描述的潮霉素B磷酸转移酶基因。这些衍生物使得可以仅通过潮霉素(pCIB743),或通过潮霉素和卡那霉素(pCIB715,pCIB717)筛选转基因植物细胞。

2.适合于非土壤杆菌转化的载体

不使用根癌土壤杆菌(Agrobacterium tumefaciens)就避免了选择载体时对T-DNA序列的需要,因此除例如上述的含T-DNA序列的载体外,还可以使用不含T-DNA序列的载体。无需借助于土壤杆菌的转化技术包括通过粒子轰击,原生质体摄入(如PEG和电穿孔)以及微注射的转化。对载体的选择很大程度上依赖于对被转化物种的优选筛选。下面描述了用于非土壤杆菌转化的典型载体的构建。

a.pCIB3064:

pCIB3064是pUC-衍生的载体,适用于与用除草剂basta(或膦丝菌素)筛选相结合的直接基因转移。质粒pCIB246包含与大肠杆菌GUS基因可操作地融合的CaMV 35S启动子和CaMV 35S转录终止子,该质粒已在PCT公开申请WO 93/07278中公开。该载体的35S启动子包含两个起始位点5’端的ATG序列。可使用标准的PCR技术使上述位点突变,由此去除ATG并产生限制性位点SspI和PvuII。新的限制性位点分别距独特的SalI位点96和37bp,距实际的起始位点101和42bp。将所得的pCIB246衍生物命名为pCIB3025。然后通过SalI和SacI消化将GUS从pCIB3025中切除,使末端成为平端并再连接以形成质粒pCIB3060。质粒pJIT82可由John Innes Centre,Norwich获得,切割含有来自绿色产色链霉菌(Streptomyces viridochromogenes)的bar基因的400bp SmaI片段,插入pCIB3060的HpaI位点(Thompson等EMBO J 6:2519-2523(1987))。由此产生了pCIB3064,其包含在CaMV35S启动子和终止子控制下的bar基因用于除草剂筛选,以及氨苄青霉素抗性基因(用于在大肠杆菌中进行筛选)和带有下述独特位点的多接头,即SphI,PstI,HindIII,和BamHI。这一载体适合于克隆含有自身调节信号的植物表达盒。

b.pSOG19和pSOG35:

pSOG35是一种转化载体,其利用大肠杆菌基因,赋予氨甲喋呤抗性的二氢叶酸还原酶(DFR)作为选择标记。用PCR自pSOG10扩增35S启动子(-800bp),来自玉米Adh1基因的内含子6(-550bp)和18bpGUS非翻译前导序列。编码大肠杆菌二氢叶酸还原酶II型基因的250-bp也通过PCR扩增,将这两个PCR片段与pB1221(Clontech)的SacI-PstI片段组装,所述的pB1221包含pUC19载体骨架和胭脂氨酸合酶终止子。将这些片段组装起来形成pSOG19,其包含与内含子6序列融合的35S启动子,GUS前导序列,DHFR基因和胭脂氨酸合酶终止子。用来自玉米萎黄病斑纹病毒(Maize Chlorotic MottleVirus(MCMV))的前导序列替换pSOG19中的GUS前导序列产生载体pSOG35。pS0619和pSOG35带有pUC基因用于氨苄青霉素抗性,并具有用于克隆外来物质的HindIII,SphI,PstI和EcoRI位点。

3.适合于叶绿体转化的载体

利用质体转化载体pH143(WO 97/32011,实施例36)在植物质体中表达本发明的核苷酸序列。所述的核苷酸序列插入到pPH143中,由此替换PROTOX编码序列。这一载体用于质体转化,并筛选壮观霉素抗性的转化子。或者,所述的核苷酸序列插入到pPH143中,由此其替换aadH基因。在这种情况下,则筛选对PROTOX抑制剂具有抗性的转化子。

实施例7:转化

一旦本发明的核酸克隆到表达载体系统中,其就可以转化到植物细胞中。植物转化和再生的方法是本领域已知的。例如,Ti质粒载体已被用于递送外源DNA,其它方法有直接DNA摄入,脂质体,电穿孔,微注射和微粒轰击。另外,来自土壤杆菌属的细菌可用于转化植物细胞。下面是对代表性的双子叶和单子叶植物转化技术,及代表性的质体转化技术的描述。

1.双子叶植物的转化

用于双子叶植物转化的技术是本领域已知的,其包括基于土壤杆菌的技术和不需要土壤杆菌的技术。非土壤杆菌技术包括由原生质体或细胞直接摄入外源遗传物质。这可通过PEG或电穿孔介导的摄入,粒子轰击-介导的递送,或微注射来实现。这些技术的实例在下述文献中有描述,Paszkowski等,EMBO J 3:2717-2722(1984),Potrykus等,Mol.Gen.Genet.199:169-177(1985),Reich等,Biotechnology 4:1001-1004(1986),和Klein等,Nature 327:70-73(1987)。在每种情况下均可通过本领域已知的技术使转化的细胞再生成整个植株。

土壤杆菌介导的是转化双子叶植物的优选技术,这是因为该技术转化效率高并可在不同的物种中广泛使用。土壤杆菌转化典型地包括将带有外源有用DNA的二元载体(如pCIB200或pCIB2001)转移到合适的土壤杆菌菌株中,其可能依赖于宿主土壤杆菌菌株共存的Ti质粒或染色体上带有的vir基因互补体(对于pCIB200和pCIB2001如菌株CIB542(Uknes等Plant Cell 5:159-169(1993))。所述的二元载体向土壤杆菌的转移是利用带有重组二元载体的大肠杆菌,带有质粒如pRK2013的能将重组二元载体移动到靶土壤杆菌菌株中的辅助大肠杆菌,由三亲本交配进行的。或者,重组的二元载体也可以通过DNA转化转移到土壤杆菌中(Hfgen & Willmitzer,Nucl.AcidsRes.16:9877(1988))。

通过重组土壤杆菌对靶植物种的转化通常包括,用本领域已知的方法将土壤杆菌与植物外植体共同培养。经转化的组织在带有存在于二元质粒T-DNA边界之间的抗生素或除草剂抗性标记物的培养基上再生。

另一种用基因转化植物的方法包括将惰性或生物活性颗粒推进到植物组织和细胞中。这一技术在U.S.Patent Nos.4,945,050,5,036,006,和5,100,792中有描述。一般,这一过程包括在能有效穿透细胞外表面并导入其内部的条件下,向细胞推进惰性的或生物活性颗粒。当通过用惰性粒子时,可通过用含有所需基因的载体包被所述颗粒,将所述载体引入细胞。或者,可用所述载体包围靶细胞,通过粒子的活动(wake)将载体带入细胞。也可将生物活性颗粒(如,干酵母细胞,干细菌或噬菌体,均含有待引入的DNA)推进到植物细胞组织中。

2.单子叶植物的转化

大多数单子叶植物物种的转化已经成为常规技术。优选的技术包括用PEG或电穿孔技术将基因直接转移到原生质体中,和粒子轰击到愈伤组织中。转化可以用单一DNA种类(single DNA species)或多DNA种类(multiple DNA species)(即共转化)转化,这两种技术均适用于本发明。当有相关的需要时,共转化具有下述的优势,即避免完全载体的构建,及产生带有非连接的有用基因和筛选标记的座位,使得能在后续子代中去除筛选标记。但是使用共转化也存在不足,即整合到所述基因组中的分离DNA种类转化频率低于100%(schocher等Biotechnology 4:1093-1096(1986))。

专利申请EP 0 292 435,EP 0 392 225,和WO 93/07278描述了用于由玉米原种自交系中制备愈伤组织和原生质体,通过PEG或电穿孔转化原生质体,和由转化的原生质体再生玉米植物的技术。Gordon-Kamm等(Plant Cell 2:603-618(1990))和Fromm等(Biotechnology 8:833-839(1990))已公开了用粒子轰击转化A188-衍生的玉米系的技术。另外,WO 93/07278和Koziel等(Biotechnology 11:194-200(1993))中描述了用粒子轰击转化玉米原种自交系的技术。这一技术利用由授粉后14-15天的玉米穗中切除的长1.5-2.5mm的未成熟玉米胚和PDS-1000He Biolistics设备进行轰击。

稻的转化也可以利用原生质体或粒子轰击的直接基因转移技术进行。原生质体介导的转化已在Japonica-型和Indica-型(Zhang等Plant Cell Rep 7:379-384(1988);Shimamoto等Nature 338:274-277(1989);Datta等Biotechnology 8:736-740(1990))中有描述。这两种类型也可使用粒子轰击进行常规转化(Christou等Biotechnology 9:957-962(1991))。另外,WO 93/21335描述了利用电穿孔的稻转化技术。

专利申请EP 0 332 581用于产生、转化和再生Pooideae原生质体的技术。这些技术可用于鸭茅属(Dactylis)和小麦的转化。而且在Vasil等(Biotechnology 10:667-674(1992))中也描述了小麦转化技术,即,利用粒子轰击到可长期再生的C型愈伤组织细胞中,Vasil等(Biotechnology 11:1553-1558(1993))和Weeks等(Plant Physiol.102:1077-1084(1993))描述了用粒子轰击未成熟的胚和由未成熟的胚衍生的愈伤组织的技术。但用于小麦转化的优选技术涉及通过粒子轰击未成熟的胚的玉米转化,并包括在基因递送前的高蔗糖或高麦芽糖步骤。在进行轰击前,将任意数量的胚(0.75-1mm长)置于含3%蔗糖(Murashiga & Skoog,PhysiologiaPlantarum 15:473-497(1962))和3mg/l 2,4-D的MS培养基中以进行体细胞胚的诱导,其在黑暗中进行。在选择进行轰击的那一天,将胚从诱导培养基上移开并置于渗压剂上(即,添加了所需浓度,典型地为15%,的蔗糖或麦芽糖的诱导培养基)。所述的胚进行2-3h的质壁分离然后进行轰击。典型的是每靶平皿上20个胚,但这不是非常严格的。合适的带有基因的质粒(如pCIB3064或pSG35)通过标准的技术沉淀到微米大小的金颗粒上。每一载有胚的板均通过DuPontBiolistics氦设备射击,所用的爆裂压为约1000psi,使用标准的80网筛。轰击后,将所述的胚重新置于黑暗中复苏24h(仍在渗压剂上)。24hr后,将所述的胚从渗压剂上移走,重新置于诱导培养基上,并在再生前保持近一个月。大约一个月后,将带有发育中的胚胎发生愈伤组织的胚外植体转移到再生培养基(MS+1mg/l NAA,5mg/l GA),所述的培养基进一步包含适当筛选试剂(对于pCIB3064用10mg/l basta,对于pSOG35用2mg/l氨甲喋呤)。约一个月后,发育的芽转移到更大的称为″GA7s″的无菌容器中,其包含半强度的MS,2%蔗糖,相同浓度的筛选试剂。

利用土壤杆菌的单子叶植物的转化也已有所描述,参见WO94/00977和U.S.Patent No.5,591,616,这两篇文献均引入此处作为参考。

3.质体转化

Nicotiana tabacum c.v.‘Xanthi nc’的种子以1”圆形阵列在T琼脂培养基上,每皿萌发7个,并在播种后的12-14天用1μm钨颗粒(M10,Biorad,Hercules,CA)进行轰击,所述的钨颗粒基本上按先前的描述(Svab,Z.和Maliga,P.(1993)PNAS 90,913-917)用质粒pPH143和pPH145的DNA包被。经过轰击的幼苗在T培养基上培养两天后将叶切除,置在含500μg/ml壮观霉素二盐酸盐(Sigma,St.Louis,MO)的RMOP培养基上(Svab,Z.,Hajdukiewicz,P.和Maliga,P.(1990)PNAS 87,8526-8530),运轴侧向上,给予强光(350-500μmol光子/m2/s)。将在轰击后3到8周在漂白叶下出现的抗性芽亚克隆到相同的选择培养基上以形成愈伤组织,分离次级芽并亚克隆。在独立的亚克隆中经转化的质体基因组拷贝的完全分离(homoplasmicity)可通过标准的Southern印迹技术(Sambrook等,(1989)Molecular Cloning:A Laboratory Manual,Cold SpringHarbor Laboratory,Cold Spring Harbor)评估。BamHI/EcoRI-消化的总DNA(Mettler,I.J.(1987)Plant Mol Biol Reporter 5,346-349)在1%Tris-硼酸盐(TBE)的琼脂糖凝胶上分离,转移到尼龙膜上(Amersham),用32P-标记的随机引物DNA序列探测,所述的随机引物DNA序列相应于来自含有rps7/12质体靶向序列一部分的pC8的0.7kb BamHI/HindIII DNA片段。同质的芽于无菌条件下在含有壮观霉素的MS/IBA培养基(McBride,K.E.等(1994)PNAS 91,7301-7305)上生根后转移到温室中。

实施例8:育种

经本发明的核酸序列转化得到的植物可以是任意的植物物种,包括单子叶和双子叶植物;但本发明的方法中使用的植物优选地选自上文所述在农学上重要的靶作物。可以通过育种使本发明的基因的表达与其它有关产量和品质的重要特性相结合一起引入植物系中。育种方法和技术是本领域已知的。参见Welsh J.R.,Fundamentals ofPlant Genetics and Breeding,John Wiley & Sons,NY(1981);Crop Breeding,Wood D.R.(编)American Society of AgronomyMadison,Wisconsin(1983);Mayo O.,The Theory of PlantBreeding,第2版,Clarendon Press,Oxford(1987);Singh,D.P.,Breeding for Resistance to Diseases and Insect Pests,Springer-Verlag,NY(1986);Wricke和Weber,QuantitativeGenetics and Selection Plant Breeding,Walter de Gruyterand Co.,Berlin(1986)。

上述已改造到转基因种子和植物中的遗传特性通过有性繁殖和营养生长进行传递,因而能保持下来,并在后代植物中传播。一般说来用已开发适于特定目的的已知的农业方法进行所述维持和传播,如耕种,播种或收获。可以应用专门的方法,如液体栽培和温室技术。生长中的作物易受昆虫的侵袭和破坏或感染,对杂草的竞争也敏感。可通过控制杂草,植物疾病和昆虫,线虫和其它不利条件的方法提高收成。这些方法包括机械方法,如土地的耕种或清除杂草或感染植物,及应用农业化学制品如,除草剂,杀真菌剂,杀配子剂,杀线虫药,生长调节剂,催熟剂和杀虫剂。

利用本发明转基因植物和种子具有优势的遗传特性可进一步应用于植物育种,目的是使植物具有改良的性状,如对害虫,除草剂或胁迫的耐性,改善了的营养价值,提高的产率,或减少由倒伏或脱粒造成的损失的改良结构。多种育种步骤以已有详细描述的人为介入为特征,所述的人为介入如,选择待杂交品系,指导亲本株系的授粉或选择合适的子代植物。根据所希望的特性可应用不同的育种方法。相关的技术在本领域中是已知的,其包括但不限于杂交,近交,回交育种,多系育种(multiline breeding),混合变种(variety blend),种间杂交,非整倍体技术等。杂交技术也包括通过机械,化学或生物学手段使植物不育以获得雄性或雌性不育植物。雄性不育植物用不同系的花粉异花授粉保证雄性不育但雌性可育植物的基因组均一地获得两亲本系的特性。因此,本发明的转基因种子和植物可用于培育改良的植物系,如提高传统方法,如除草剂或杀虫剂处理的效率,或由于其经修饰的遗传特性而允许人们省却所述的方法。或者,可以获得具有改良的耐胁迫性的新作物,它们由于具有经优化的遗传“装备”,与不能耐受可类比的不利发育条件的产品相比,可收获具有更优良品质的收获产品。

实施例9:种子的生产

在种子的生产中,萌发质量和种子的均一性是重要的产品特性,而由农民播种和收获的种子的萌发质量和均一性并不重要。由于保持某种作物与其它作物或杂草种子相分离,控制种子所带疾病,和生产发芽良好的种子是困难的,有经验的培养、调理和经销纯种子的种子生产者发展了非常详尽和明确的种子生产实践。因此农民普遍采用的方式是购买经鉴定满足特定品质标准的种子,而不使用自己收获的种子。用作种子的繁殖材料通常用经保护剂包被层,包括除草剂,杀虫剂,杀真菌剂,杀菌剂,杀线虫剂,杀螺剂或其混合物处理。常用的保护剂包被层包括,如化合物克菌丹,萎锈灵,福美双(thiram)(TMTD),methalaxyl(Apron),和安定磷(Actellic)。如果需要,这些化合物可与载体,表面活性剂,或在制剂领域常规用来防止由细菌,真菌或动物害虫引起的损害的施用促进辅药一起配制。所述的保护剂包被层可通过用液体制剂浸渍繁殖材料进行,或通过用联合的干/湿制剂包被来进行。也可以使用其它的方法,例如直接对芽或果实进行处理。    

实施例10:玉米植物分析

用质粒pNOV1436,pNOV1441,和pNOV1313通过土壤杆菌介导的转化转化的玉米植物给出100%抗欧洲玉米螟(Europeancornborer)和草地夜蛾(fall armyworm)死亡率。ELISA数据如下:

事件编号  质粒  启动子玉米基因型               T0/T1 ELISA(ng/mg)    叶穗丝  壳   髓皮壳(rind)

3275-2              pNOV1436      MTL           A188                  125/299                       4465/1913        4351/2611

3277-2              pNOV1436      MTL           A188                  218/234    136     798        743/3251         613/3055

3279-1              pNOV1436      MTL           A188                  108/398                       1566/2505        1457/2514

3309-6              pNOV1436      MTL           A188                  168/326                       1164/1017        1527/2391

3324-1              pNOV1436      MTL           A188                  192        0       203        1068             1437

3330-2              pNOV1436      MTL           A188                  262/800    0       542        5565             3366

3331-1              pNOV1436      MTL           A188                  236/347                       1010             1341

3338-1              pNOV1436      MTL           A188                  287/457    13                 4578             1795

3357-1              pNOV1436      MTL           A188                  349/551    61      780        3968             2022

3360-1              pNOV1436      MTL           A188                  300/428    0       392        2026             1764

3717-2              pNOV1441      Mz Ubi        Hi II                 2142       374     1719       NS               NS

3723-5              pNOV1441      Mz Ubi        Hi II                 2302                          13757            7215

3838-1              pNOV1441      Mz Ubi        Hi II                 2188                          24013            13564

3847-2              pNOV1441      Mz Ubi        Hi II                 741        699     3707       NS               NS

3877-1              pNOV1441      Mz Ubi        Hi II                 991        436     1349       15105            10904

3720-1              pNOV1441      Mz Ubi        Hi II                 1437                          3854             2719

3833-3              pNOV1441      Mz Ubi        Hi II                 878        166     799

4013-5              pNOV1441      Mz Ubi        Hi II                 944        174     1918

40294               pNOV1441      Mz Ubi        Hi II                 1661

4708-1              pNOV1313      Mz Ubi        Hi ll                 832

4709-2              pNOV1313      Mz Ubi        Hi ll                 581

4710-5              pNOV1313      Mz Ubi        Hi ll                 625

4711-2              pNOV1313      Mz Ubi        Hi ll                 570

4713-2              pNOV1313      Mz Ubi        Hi ll                 962

4717-1              pNOV1313      Mz Ubi        Hi ll                 881

MTL=玉米金属硫蛋白样(maize metallothionein-like)

Mz Ubi=玉米遍在蛋白

实施例11.稻植物分析

由质粒pNOV1305通过土壤杆菌介导的转化转化的植物给出100%抗欧洲玉米螟(European cornborer)和草地夜蛾(fallarmyworm)死亡率。ELISA数据如下:

  事件编号    质粒启动子   T0 ELISA(ng/mg)          叶

639                     pNOV1305                MTL           294

640                     pNOV1305                MTL           241

643                     pNOV1305                MTL           153

650                     pNOV1305                MTL           149

847                     pNOV1305                MTL           173

871                     pNOV1305                MTL           244

872                     pNOV1305                MTL           252

886                     pNOV1305                MTL           185

888                     pNOV1305                MTL           160

893                     pNOV1305                MTL           168

1148                    pNOV1305                MTL           1816

1149                    pNOV1305                MTL           224

1152                    pNOV1305                MTL           173

1154                    pNOV1305                MTL           142

1163                    pNOV1305                MTL           139

1164                    pNOV1305                MTL           138

1167                    pNOV1305                MTL           284

1168                    pNOV1305                MTL           137

1177                    pNOV1305                MTL           167

1349                    pNOV1305                MTL           164

1350                    pNOV1305                MTL           115

1357                    pNOV1305                MTL           132

1363                    pNOV1305                MTL           119

1497                    pNOV1305                MTL           94

MTL=玉米金属硫蛋白样

实施例12.卷心菜植物分析

测试了由质粒pZU578(SEQ ID NO:17)通过土壤杆菌介导的转化转化的卷心菜植物对菜蛾(Plutella xylostella)的抗性。用16只幼虫(1-3龄)感染转基因可和对照植物,用油漆刷从笼养的菜蛾(Plutella)培养物(和卷心菜植物一起)中转移,4片叶子中的每一片上放4只。经感染的植物转移到1x1x1m笼中进行持续的实验。对照植物包括未转化的卷心菜植物s(易感染的对照)和喷洒了可商购的Bt杀虫剂Dipel的未转化的卷心菜植物(抗性对照)。评分为(2周后):-=没有损害(或仅有小孔=抗性);+=在植物上有大孔(=易感染);++有许多大孔且植物严重损坏(=易感染)。Dipel植物总是评分为-,易感性对照评分总是++。转基因和对照植物的昆虫损害率和ELISA数据如下。

  事件编号  质粒启动子损害率    T0 ELISA(ng/mg)           叶

04-05-01-01                pZU578          Act2        ++                 0

04-05-01-02                pZU578          Act2        ++                 0

07-11-01                   pZU578          Act2        -                  921

10-25-05                   pZU578          Act2        ++                 0

10-39-06                   pZU578          Act2        -                  270

304-F-07                   pZU578          Act2        -

304-F-11                   pZU578          Act2        -

304-F-15                   pZU578          Act2        -

304-F-16                   pZU578          Act2        -

304-F-38                   pZU578          Act2        -

304-g-07                   pZU578          Act2        -

304-g-08                   pZU578          Act2        -

304-g-12                   pZU578          Act2        -

304-g-21                   pZU578          Act2        -

304-g-24                   pZU578          Act2        +                   0

304-H-01                   pZU578          Act2        -

304-H-08                   pZU578          Act2        -

304-H-09                   pZU578          Act2        -

304-H-34                   pZU578          Act2        -

304-H-35                   pZU578          Act2        -

391-J-08                   pZU578          Act2        -

394-F-5                    pZU578          Act2        -

394-H-12                   pZU578          Act2        -

Act2=拟南芥属肌动蛋白2

上述描述的实施例只是示例性的。本领域的技术人员可根据本发明的教导得到许多本发明的变化形式。所有这些显然的和可预见的变化形式均包含在本发明的范围内。

                 序列表

                          序列表<110>Syngenta participations AG<120>新的自来苏云金芽孢杆菌杀虫晶体蛋白的杀虫毒素<130>Case S-31282A<140><141><150>US 60/227956<151>2000-08-25<160>17<170>PatentIn Ver.2.1<210>1<211>3579<212>DNA<213>人工序列<220><223>人工序列说明:带Cry1C尾的H04<220><221>CDS<222>(1)..(3579)<223>带Cry1C尾的H04<300><303>Appl.Environ.Microbiol.<304>62<305>5<306>1537-1543<307>1996<300><310>5,736,131<400>1atg gat aac aat ccg aac atc aat gaa tgc att cct tat aat tgt tta    48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu  1               5                  10                  15agt aac cct gaa gta gaa gta tta ggt gga gaa aga ata gaa act ggt    96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

         20                      25              30tac acc cca atc gat att tcc ttg tcg cta acg caa ttt ctt ttg agt    144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

     35                  40                  45gaa ttt gtt ccc ggt gct gga ttt gtg tta gga cta gtt gat ata ata    192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

 50                  55                  60tgg gga att ttt ggt ccc tct caa tgg gac gca ttt ctt gta caa att    240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65                  70                  75                  80gaa cag tta att aac caa aga ata gaa gaa ttc gct agg aac caa gcc    288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

             85                  90                  95att tct aga tta gaa gga cta agc aat ctt tat caa att tac gca gaa    336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

        100                 105                 110tct ttt aga gag tgg gaa gca gat cct act aat cca gca tta aga gaa    384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

    115                 120                 125gag atg cgt att caa ttc aat gac atg aac agt gcc ctt aca acc gct    432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130                 135                 140att cct ctt ttt gca gtt caa aat tat caa gtt cct ctt tta tca gta    480Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160tat gtt caa gct gca aat tta cat tta tca gtt ttg aga gat gtt tca    528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

            165                 170                 175gtg ttt gga caa agg tgg gga ttt gat gcc gcg act atc aat agt cgt    576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

        180                 185                 190tat aat gat tta act agg ctt att ggc aac tat aca gat cat gct gta    624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val

    195                 200                 205cgc tgg tac aat acg gga tta gag cgt gta tgg gga ccg gat tct aga    672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210                 215                 220gat tgg ata aga tat aat caa ttt aga aga gaa tta aca cta act gta    720Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240tta gat atc gtt tct cta ttt ccg aac tat gat agt aga acg tat cca    768Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro

            245                 250                 255att cga aca gtt tcc caa tta aca aga gaa att tat aca aac cca gta    816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

        260                 265                 270tta gaa aat ttt gat ggt agt ttt cga ggc tcg gct cag ggc ata gaa    864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu

    275                 280                 285gga agt att agg agt cca cat ttg atg gat ata ctt aac agt ata acc    912Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290                 295                 300atc tat acg gat gct cat aga gga gaa tat tat tgg tca ggg cat caa    960Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320ata atg gct tct cct gta ggg ttt tcg ggg cca gaa ttc act ttt ccg    1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro

            325                 330                 335cta tat gga act atg gga aat gca gct cca caa caa cgt att gtt gct    1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala

        340                 345                 350caa cta ggt cag ggc gtg tat aga aca tta tcg tcc act tta tat aga    1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg

    355                 360                 365aga cct ttt aat ata ggg ata aat aat caa caa cta tct gtt ctt gac    1152Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp

370                 375                 380ggg aca gaa ttt gct tat gga acc tcc tca aat ttg cca tcc gct gta    1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400tac aga aaa agc gga acg gta gat tcg ctg gat gaa ata ccg cca cag    1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln

            405                 410                 415aat aac aac gtg cca cct agg caa gga ttt agt cat cga tta agc cat    1296Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His

        420                 425                 430gtt tca atg ttt cgt tca ggc ttt agt aat agt agt gta agt ata ata    1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile

    435                 440                 445aga gct cct atg ttc tct tgg ata cat cgt agt gca act ctt aca aat    1392Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn

450                 455                 460aca att gat cca gag aga att aat caa ata cct tta gtg aaa gga ttt    1440Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465                 470                 475                 480aga gtt tgg ggg ggc acc tct gtc att aca gga cca gga ttt aca gga    1488Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly

            485                 490                 495ggg gat atc ctt cga aga aat acc ttt ggt gat ttt gta tct cta caa    1536Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln

        500                 505                 510gtc aat att aat tca cca att acc caa aga tac cgt tta aga ttt cgt    1584Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg

    515                 520                 525tac gct tcc agt agg gat gca cga gtt ata gta tta aca gga gcg gca    1632Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala

530                 535                 540tcc aca gga gtg gga ggc caa gtt agt gta aat atg cct ctt cag aaa    1680Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545                 550                 555                 560act atg gaa ata ggg gag aac tta aca tct aga aca ttt aga tat acc    1728Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr

            565                 570                 575gat ttt agt aat cct ttt tca ttt aga gct aat cca gat ata att ggg    1776Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly

        580                 585                 590ata agt gaa caa cct cta ttt ggt gca ggt tct att agt agc ggt gaa    1824Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu

    595                 600                 605ctt tat ata gat aaa att gaa att att cta gca gat gca aca ttt gaa    1872Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu

610                 615                 620gca gaa tct gat tta gaa aga gca caa aag gcg gtg aat gcc ctg ttt    1920Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625                 630                 635                 640act tct tcc aat caa atc ggg tta aaa acc gat gtg acg gat tat cat    1968Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His

            645                 650                 655att gat caa gta tcc aat tta gtg gat tgt tta tca gat gaa ttt tgt    2016Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys

        660                 665                 670ctg gat gaa aag cga gaa ttg tcc gag aaa gtc aaa cat gcg aag cga    2064Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg

    675                 680                 685ctc agt gat gag cgg aat tta ctt caa gat cca aac ttc aga ggg atc    2112Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile

690                 695                 700aat aga caa cca gac cgt ggc tgg aga gga agt aca gat att acc atc    2160Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile705                 710                 715                 720caa gga gga gat gac gta ttc aaa gag aat tac gtc aca cta ccg ggt    2208Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly

            725                 730                 735acc gtt gat gag tgc tat cca acg tat tta tat cag aaa ata gat gag    2256Thr Val Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu

        740                 745                 750tcg aaa tta aaa gct tat acc cgt tat gaa tta aga ggg tat atc gaa    2304Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu

    755                 760                 765gat agt caa gac tta gaa atc tat ttg atc cgt tac aat gca aaa cac    2352Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His

770                 775                 780gaa ata gta aat gtg cca ggc acg ggt tcc tta tgg ccg ctt tca gcc    2400Glu Ile Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala785                 790                 795                 800caa agt cca atc gga aag tgt gga gaa ccg aat cga tgc gcg cca cac    2448Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His

            805                 810                 815ctt gaa tgg aat cct gat cta gat tgt tcc tgc aga gac ggg gaa aaa    2496Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys

        820                 825                 830tgt gca cat cat tcc cat cat ttc acc ttg gat att gat gtt gga tgt    2544Cys Ala His His Ser His His Phe Thr Leu Asp Ile Asp Val Gly Cys

    835                 840                 845aca gac tta aat gag gac tta ggt gta tgg gtg ata ttc aag att aag    2592Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys

850                 855                 860acg caa gat ggc cat gca aga cta ggg aat cta gag ttt ctc gaa gag    2640Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu865                 870                 875                 880aaa cca tta tta ggg gaa gca cta gct cgt gtg aaa aga gcg gag aag    2688Lys Pro Leu Leu Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys

            885                 890                 895aag tgg aga gac aaa cga gag aaa ctg cag ttg gaa aca aat att gtt    2736Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn Ile Val

        900                 905                 910tat aaa gag gca aaa gaa tct gta gat gct tta ttt gta aac tct caa    2784Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln

    915                 920                 925tat gat aga tta caa gtg gat acg aac atc gcg atg att cat gcg gca    2832Tyr Asp Arg Leu Gln Val Asp Thr Asn Ile Ala Met Ile His Ala Ala

930                 935                940gat aaa cgc gtt cat aga atc cgg gaa gcg tat ctg cca gag ttg tct    2880Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser945                 950                 955                 960gtg att cca ggt gtc aat gcg gcc att ttc gaa gaa tta gag gga cgt    2928Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg

            965                 970                 975att ttt aca gcg tat tcc tta tat gat gcg aga aat gtc att aaa aat    2976Ile Phe Thr Ala Tyr Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn

        980                 985                 990ggc gat ttc aat aat ggc tta tta tgc tgg aac gtg aaa ggt cat gta    3024Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val

    995                1000                1005gat gta gaa gag caa aac aac cac cgt tcg gtc ctt gtt atc cca gaa    3072Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Ile Pro Glu   1010                1015                1020tgg gag gca gaa gtg tca caa gag gtt cgt gtc tgt cca ggt cgt ggc    3120Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly1025               1030                1035                1040tat atc ctt cgt gtc aca gca tat aaa gag gga tat gga gag ggc tgc    3168Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys

           1045                1050                1055gta acg atc cat gag atc gaa gac aat aca gac gaa ctg aaa ttc agc    3216Val Thr Ile His Glu Ile Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser

       1060                1065                1070aac tgt gta gaa gag gaa gta tat cca aac aac aca gta acg tgt aat    3264Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn

   1075                1080                1085aat tat act ggg act caa gaa gaa tat gag ggt acg tac act tct cgt    3312Asn Tyr Thr Gly Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg   1090                1095                1100aat caa gga tat gac gaa gcc tat ggt aat aac cct tcc gta cca gct    3360Asn Gln Gly Tyr Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala1105               1110                1115                1120gat tac gct tca gtc tat gaa gaa aaa tcg tat aca gat gga cga aga    3408Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg

           1125                1130                1135gag aat cct tgt gaa tct aac aga ggc tat ggg gat tac aca cca cta    3456Glu Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu

       1140                1145                1150ccg gct ggt tat gta aca aag gat tta gag tac ttc cca gag acc gat    3504pro Ala Gly Tyr Val Thr Lys Asp Leu Glu Tyr phe Pro Glu Thr Asp

   1155                1160                1165aag gta tgg att gag atc gga gaa aca gaa gga aca ttc atc gtg gat    3552Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp   1170                1175                1180agc gtg gaa tta ctc ctt atg gag gaa                                3579Ser Val Glu Leu Leu Leu Met Glu Glu1185               1190<210>2<211>1193<212>PRT<213>人工序列<223>人工序列说明:带Cry1C尾的H04<400>2Met Asp Asn Asn pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu  1               5                  10                  15Ser Asn pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

         20                  25                  30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln phe Leu Leu Ser

     35                  40                  45Glu phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

 50                  55                  60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65                  70                  75                  80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

             85                  90                  95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

        100                 105                 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

    115                 120                 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130                 135                 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

            165                 170                 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

        180                 185                 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val

    195                 200                 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210                 215                 220Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro

            245                 250                 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

        260                 265                 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu

    275                 280                 285Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290                 295                 300Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro

            325                 330                 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala

        340                 345                 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg

    355                 360                 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp

370                 375                 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln

            405                 410                 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His

        420                 425                 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile

    435                 440                 445Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn

450                 455                 460Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465                 470                 475                 480Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly

            485                 490                 495Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln

        500                 505                 510Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg

    515                 520                 525Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala

530                 535                 540Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545                 550                 555                 560Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr

            565                 570                 575Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly

        580                 585                 590Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu

    595                 600                 605Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu

610                 615                 620Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625                 630                 635                 640Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His

            645                 650                 655Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys

       660                  665                 670Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg

    675                 680                 685Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile

690                 695                 700Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile705                 710                 715                 720Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly

            725                 730                 735Thr Val Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu

        740                 745                 750Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu

    755                 760                 765Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His

770                 775                 780Glu Ile Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala785                 790                 795                 800Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His

            805                 810                 815Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys

        820                 825                 830Cys Ala His His Ser His His Phe Thr Leu Asp Ile Asp Val Gly Cys

    835                 840                 845Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys

850                 855                 860Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu865                 870                 875                 880Lys Pro Leu Leu Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys

            885                 890                 895Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn Ile Val

        900                 905                 910Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln

    915                 920                 925Tyr Asp Arg Leu Gln Val Asp Thr Asn Ile Ala Met Ile His Ala Ala

930                 935                 940Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser945                 950                 955                 960Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg

            965                 970                 975Ile Phe Thr Ala Tyr Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn

        980                 985                 990Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val

    995                1000                1005Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Ile Pro Glu   1010                1015                1020Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly025                1030                1035                1040Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys

           1045                1050                1055Val Thr Ile His Glu Ile Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser

       1060                1065                1070Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn

   1075                1080                1085Asn Tyr Thr Gly Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg   1090                1095                1100Asn Gln Gly Tyr Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala105                1110                1115                1120Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg

           1125                1130                1135Glu Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu

       1140                1145                1150Pro Ala Gly Tyr Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp

   1155                1160                1165Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp   1170                1175                1180Ser Val Glu Leu Leu Leu Met Glu Glu185                1190<210>3<211>1896<212>DNA<213>人工序列<220><223>人工序列说明:编码不带尾的H04毒素部分的合成基因<220><221>CDS<222>(1)..(1896)<223>不带尾的H04毒素部分<400>3atg gac aac aac ccc aac atc aac gag tgc atc ccc tac aac tgc ctg    48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu  1               5                  10                  15agc aac ccc gag gtg gag gtg ctg ggc ggc gag cgc atc gag acc ggc    96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

         20                  25                  30tac acc ccc atc gac atc agc ctg agc ctg acc cag ttc ctg ctg agc    144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

     35                  40                  45gag ttc gtg ccc ggc gcc ggc ttc gtg ctg ggc ctg gtg gac atc atc    192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

 50                  55                  60tgg ggc atc ttc ggc ccc agc cag tgg gac gcc ttc ctg gtg cag atc    240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65                  70                  75                  80gag cag ttg ata aac caa ggc ata gag gaa ttc gcc cgc aac cag gcc    288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

             85                  90                  95atc agc cgc ctg gag ggc ctg agc aac ctg tac caa atc tac gcc gag    336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

        100                 105                 110agc ttc cgc gag tgg gag gcc gac ccc acc aac ccc gcc ctg cgc gag    384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

    115                 120                 125gag atg cgc atc cag ttc aac gac atg aac agc gcc ctg acc acc gcc    432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130                 135                 140atc ccc ctg ttc gcc gtg cag aac tac cag gtg ccc ctg ctg agc gtg    480Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160tac gtg cag gcc gcc aac ctg cac ctg agc gtg ctg cgc gac gtc agc    528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

            165                 170                 175gtg ttc ggc cag cgc tgg ggc ttc gac gcc gcc acc atc aac agc cgc    576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

        180                 185                 190tac aac gac ctg acc cgc ctg atc ggc aac tac acc gac cac gcc gtg    624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val

    195                 200                 205cgc tgg tac aac acc ggc ctg gag cgc gtg tgg ggt ccc gac agc cgc    672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210                 215                 220gac tgg atc agg tac aac cag ttc cgc cgc gag ctg acc ctg acc gtg    720Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240ctg gac atc gtg agc ctg ttc ccc aac tac gac agc cgc acc tac ccc    768Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro

            245                 250                 255atc cgc acc gtg agc cag ctg acc cgc gag att tac acc aac ccc gtg    816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

        260                 265                 270ctg gag aac ttc gac ggc agc ttc cgc ggc agc gcc cag ggc atc gag    864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu

    275                 280                 285ggc agc atc cgc agc ccc cac ctg atg gac atc ctg aac agc atc acc    912Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290                 295                 300atc tac acc gac gcc cac cgc ggc gag tac tac tgg agc ggc cac cag    960Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320atc atg gcc agc ccc gtc ggc ttc agc ggc ccc gag ttc acc ttc ccc    1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro

            325                 330                 335ctg tac ggc acc atg ggc aac gct gca cct cag cag cgc atc gtg gca    1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala

        340                 345                 350cag ctg ggc cag gga gtg tac cgc acc ctg agc agc acc ctg tac cgt    1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg

    355                 360                 365cga cct ttc aac atc ggc atc aac aac cag cag ctg agc gtg ctg gac    1152Arg Pro Phe Asn Ile Gly Ile Asn Ash Gln Gln Leu Ser Val Leu Asp

370                 375                 380ggc acc gag ttc gcc tac ggc acc agc agc aac ctg ccc agc gcc gtg    1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400tac cgc aag agc ggc acc gtg gac agc ctg gac gag atc ccc cct cag    1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln

            405                 410                 415aac aac aac gtg cca cct cga cag ggc ttc agc cac cgt ctg agc cac    1296Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His

        420                 425                 430gtg agc atg ttc cgc agt ggc ttc agc aac agc agc gtg agc atc atc    1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile

    435                 440                 445cgt gca ccc atg ttc agc tgg att cac cgc agc gcc acc ctg acc aac    1392Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn

450                 455                 460acc atc gac ccc gag cgc atc aac cag atc ccc ctg gtg aag ggc ttc    1440Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465                 470                 475                 480cgg gtg tgg ggc ggc acc agc gtg atc acc ggc ccc ggc ttc acc gga    1488Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly

            485                 490                 495ggc gac atc ctg cgc aga aac acc ttc ggc gac ttc gtg agc ctg cag    1536Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln

        500                 505                 510gtg aac atc aac agc ccc atc acc cag cgt tac cgc ctg cgc ttc cgc    1584Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg

    515                 520                 525tac gcc agc agc cgc gac gcc cgt gtg atc gtg ctg act ggc gcc gct    1632Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala

530                 535                 540agc acc ggt gtg ggc ggt cag gtg agc gtg aac atg ccc ctg cag aag    1680Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545                 550                 555                 560act atg gag atc ggc gag aac ctg act agt cgc acc ttc cgc tac acc    1728Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr

            565                 570                 575gac ttc agc aac ccc ttc agc ttc cgc gcc aac ccc gac atc atc ggc    1776Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly

        580                 585                 590atc agc gag cag ccc ctg ttc ggt gcc ggc agc atc agc agc ggc gag    1824Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu

    595                 600                 605ctg tac atc gac aag atc gag atc atc ctg gcc gac gcc acc ttc gag    1872Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu

610                 615                 620gcc gag agc gac ctg gag cgc taa                                    1896Ala Glu Ser Asp Leu Glu Arg625                 630<210>4<211>631<212>PRT<213>人工序列<223>人工序列说明:编码不带尾的H04毒素部分的合成基因<400>4Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu  1               5                  10                  15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

         20                  25                  30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

     35                  40                  45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

 50                  55                  60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65                  70                  75                  80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

             85                  90                  95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

        100                 105                 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

    115                 120                 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130                 135                 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

            165                 170                 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

        180                 185                 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val

    195                 200                 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210                 215                 220Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro

            245                 250                 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

        260                 265                 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu

    275                 280                 285Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290                 295                 300Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro

            325                 330                 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala

        340                 345                 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg

    355                 360                 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp

370                 375                 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln

            405                 410                 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His

        420                 425                 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile

    435                 440                 445Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn

450                 455                 460Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465                 470                 475                 480Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly

            485                 490                 495Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln

         500                505                 510Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg

    515                 520                 525Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala

530                 535                 540Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545                 550                 555                 560Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr

            565                 570                 575Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly

        580                 585                 590Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu

    595                 600                 605Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala ASp Ala Thr Phe Glu

610                 615                 620Ala Glu Ser Asp Leu Glu Arg625                 630<210>5<211>3582<212>DNA<213>人工序列<220><223>人工序列说明:编码带全长Cry1Ab尾的H04的合成基因<220><221>CDS<222>(1)..(3582)<223>带全长Cry1Ab尾的H04<400>5atg gac aac aac ccc aac atc aac gag tgc atc ccc tac aac tgc ctg    48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu  1               5                  10                  15agc aac ccc gag gtg gag gtg ctg ggc ggc gag cgc atc gag acc ggc    96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

        20                   25                  30tac acc ccc atc gac atc agc ctg agc ctg acc cag ttc ctg ctg agc    144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

     35                  40                  45gag ttc gtg ccc ggc gcc ggc ttc gtg ctg ggc ctg gtg gac atc atc    192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

 50                  55                  60tgg ggc atc ttc ggc ccc agc cag tgg gac gcc ttc ctg gtg cag atc    240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65                  70                  75                  80gag cag ttg ata aac caa cgc ata gag gaa ttc gcc cgc aac cag gcc    288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

             85                  90                  95atc agc cgc ctg gag ggc ctg agc aac ctg tac caa atc tac gcc gag    336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

        100                 105                 110agc ttc cgc gag tgg gag gcc gac ccc acc aac ccc gcc ctg cgc gag    384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

    115                 120                 125gag atg cgc atc cag ttc aac gac atg aac agc gcc ctg acc acc gcc    432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130                 135                 140atc ccc ctg ttc gcc gtg cag aac tac cag gtg ccc ctg ctg agc gtg    480Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160tac gtg cag gcc gcc aac ctg cac ctg agc gtg ctg cgc gac gtc agc    528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

            165                 170                 175gtg ttc ggc cag cgc tgg ggc ttc gac gcc gcc acc atc aac agc cgc    576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

        180                 185                 190tac aac gac ctg acc cgc ctg atc ggc aac tac acc gac cac gcc gtg    624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val

    195                 200                 205cgc tgg tac aac acc ggc ctg gag cgc gtg tgg ggt ccc gac agc cgc    672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210                 215                 220gac tgg atc agg tac aac cag ttc cgc cgc gag ctg acc ctg acc gtg    720Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240ctg gac atc gtg agc ctg ttc ccc aac tac gac agc cgc acc tac ccc    768Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro

            245                 250                 255atc cgc acc gtg agc cag ctg acc cgc gag att tac acc aac ccc gtg    816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

        260                 265                 270ctg gag aac ttc gac ggc agc ttc cgc ggc agc gcc cag ggc atc gag    864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu

    275                 280                 285ggc agc atc cgc agc ccc cac ctg atg gac atc ctg aac agc atc acc    912Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290                 295                 300atc tac acc gac gcc cac cgc ggc gag tac tac tgg agc ggc cac cag    960Ile Tyr Thr Asp Ala His Arg Gly GluTyr Tyr Trp Ser Gly His Gln305                 310                315                 320atc atg gcc agc ccc gtc ggc ttc agc ggc ccc gag ttc acc ttc ccc    1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro

            325                 330                 335ctg tac ggc acc atg ggc aac gct gca cct cag cag cgc atc gtg gca    1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala

        340                 345                 350cag ctg ggc cag gga gtg tac cgc acc ctg agc agc acc ctg tac cgt    1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg

    355                 360                 365cga cct ttc aac atc ggc atc aac aac cag cag ctg agc gtg ctg gac    1152Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp

370                 375                 380ggc acc gag ttc gcc tac ggc acc agc agc aac ctg ccc agc gcc gtg    1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400tac cgc aag agc ggc acc gtg gac agc ctg gac gag atc ccc cct cag    1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln

            405                 410                 415aac aac aac gtg cca cct cga cag ggc ttc agc cac cgt ctg agc cac    1296Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His

        420                 425                 430gtg agc atg ttc cgc agt ggc ttc agc aac agc agc gtg agc atc atc    1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile

    435                 440                 445cgt gca ccc atg ttc agc tgg att cac cgc agc gcc acc ctg acc aac    1392Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn

450                 455                 460acc atc gac ccc gag cgc atc aac cag atc ccc ctg gtg aag ggc ttc    1440Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465                 470                 475                 480cgg gtg tgg ggc ggc acc agc gtg atc acc ggc ccc ggc ttc acc gga    1488Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly

            485                 490                 495ggc gac atc ctg cgc aga aac acc ttc ggc gac ttc gtg agc ctg cag    1536Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln

        500                 505                 510gtg aac atc aac agc ccc atc acc cag cgt tac cgc ctg cgc ttc cgc    1584Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg

    515                 520                 525tac gcc agc agc cgc gac gcc cgt gtg atc gtg ctg act ggc gcc gct    1632Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala

530                 535                 540agc acc ggt gtg ggc ggt cag gtg agc gtg aac atg ccc ctg cag aag    1680Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545                 550                 555                 560act atg gag atc ggc gag aac ctg act agt cgc acc ttc cgc tac acc    1728Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr

            565                 570                 575gac ttc agc aac ccc ttc agc ttc cgc gcc aac ccc gac atc atc ggc    1776Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly

        580                 585                 590atc agc gag cag ccc ctg ttc ggt gcc ggc agc atc agc agc ggc gag    1824Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu

    595                 600                 605ctg tac atc gac aag atc gag atc atc ctg gcc gac gcc acc ttc gag    1872Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu

610                 615                 620gcc gag agc gac ctg gag cgc gcc cag aag gcc gtg aac gcc ctg ttc    1920Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625                 630                 635                 640acc agc agc aac cag atc ggc ctg aag acc gac gtg acc gac tac cac    1968Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His

            645                 650                 655atc gac cag gtg agc aac ctg gtg gac tgc tta agc gac gag ttc tgc    2016Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys

        660                 665                 670ctg gac gag aag aag gag ctg agc gag aag gtg aag cac gcc aag cgc    2064Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg

    675                 680                 685ctg agc gac gag cgc aac ctg ctg cag gac ccc aac ttc cgc ggc atc    2112Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile

690                 695                 700aac cgc cag ctg gac cgc ggc tgg cga ggc agc acc gat atc acc atc    2160Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile705                 710                 715                 720cag ggc ggc gac gac gtg ttc aag gag aac tac gtg acc ctg cag ggc    2208Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Gln Gly

            725                 730                 735acc ttc gac gag tgc tac ccc acc tac ctg tac cag ccg atc gac gag    2256Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Pro Ile Asp Glu

        740                 745                 750agc aag ctg aag gcc tac acc cgc tac cag ctg cgc ggc tac atc gag   2304Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu

    755                 760                 765gac agc cag gac ctg gaa atc tac ctg atc cgc tac aac gcg aag cac    2352Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His

770                 775                 780gag acc gtg aac gtg ccc ggc acc ggc agc ctg tgg ccc ccg agc gcc    2400Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Pro Ser Ala785                 790                 795                 800ccc agc ccc atc ggc aag tgc ggg gag ccg aat cga tgc gct ccg cac    2448Pro Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His

            805                 810                 815ctg gag tgg aac ccg gac cta gac tgc agc tgc agg gac ggg gag aag    2496Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys

        820                 825                 830tgc gcc cac cac agc cac cac ttc agc ctg gac atc gac gtg ggc tgc    2544Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys

    835                 840                 845acc gac ctg aac gag gac ctg ggc gtg tgg gtg atc ttc aag atc aag    2592Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys

850                 855                 860acc cag gac ggc cac gcc cgc ctg ggc aat cta gag ttc ctg gag gag    2640Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu865                 870                 875                 880aag ccc ctg gtg ggc gag gcc ctg gcc cgc gtg aag cgt gct gag aag    2688Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys

            885                 890                 895aag tgg cgc gac aag cgc gag aag ctg gag tgg gag acc aac atc gtg    2736Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val

        900                 905                 910tac aag gag gcc aag gag agc gtg gac gcc ctg ttc gtg aac agc cag    2784Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln

    915                 920                 925tac gac cgc ctg cag gcc gac acc aac atc gcc atg atc cac gcc gcc    2832Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala

930                 935                 940gac aag cgc gtg cac agc att cgc gag gcc tac ctg ccc gag ctg agc    2880Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser945                 950                 955                 960gtg atc ccc ggt gtg aac gcc gcc atc ttc gag gaa ctc gag ggc cgc    2928Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg

            965                 970                 975atc ttc acc gcc ttc agc ctg tac gac gcc cgc aac gtg atc aag aac    2976Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn

        980                 985                 990ggc gac ttc aac aac ggc ctg agc tgc tgg aac gtg aag ggc cac gtg    3024Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val

    995                1000                1005gac gtg gag gag cag aac aac cac cgc agc gtg ctg gtg gtg ccc gag    3072Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Val Pro Glu   1010                1015                1020tgg gag gcc gag gtg agc cag gag gtg cgc gtg tgc ccc ggc cgc ggc    3120Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly1025               1030                1035                1040tac atc ctg cgc gtg acc gcc tac aag gag ggc tac ggc gag ggc tgc    3168Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys

           1045                1050                1055gtg acc atc cac gag atc gag aac aac acc gac gag ctc aag ttc agc    3216Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser

       1060                1065                1070aac tgc gtg gag gag gag gtt tac ccc aac aac acc gtg acc tgc aac    3264Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn

   1075                1080                1085gac tac acc gcg acc cag gag gag tac gaa ggc acc tac acc tct cgc    3312Asp Tyr Thr Ala Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg   1090                1095                1100aac agg ggt tac gac ggc gcc tac gag tcc aac agc tcc gtg cca gct    3360Asn Arg Gly Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala1105               1110                1115                1120gac tac gcc agc gcc cac gag gag aaa gcc tac acc gac ggt aga cgc    3408Asp Tyr Ala Ser Ala His Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg

           1125                1130                1135gac aac cca tgt gag agc aac aga ggc tac ggc gac tac acc ccc ctg    3456Asp Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu 

       1140                1145                1150ccc gct gga tac gtg acc aag gag ctg gag tac ttc ccc gag acc gac    3504Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp

   1155                1160                1165aag gtg tgg atc gag att ggc gag acc gag ggc acc ttc atc gtg gac    3552Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp   1170                1175                1180agc gtg gag ctg ctg ctg atg gag gagtag                   3582Ser Val Glu Leu Leu Leu Met Glu Glu1185               1190<210>6<211>1193<212>PRT<213>人工序列<223>人工序列说明:编码带全长Cry1Ab尾的H04的合成基因<400>6Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu  1               5                  10                  15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

         20                  25                  30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

     35                  40                  45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

 50                  55                  60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65                  70                  75                  80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

             85                  90                  95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

        100                 105                 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

    115                 120                 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130                 135                 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

            165                 170                 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

        180                 185                 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val

    195                 200                 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210                 215                 220Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro

            245                 250                 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

        260                 265                 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu

    275                 280                 285Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290                 295                 300Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro

            325                 330                 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala

        340                 345                 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg

    355                 360                 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp

370                 375                 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln

            405                 410                 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His

        420                 425                 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile

    435                 440                 445Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn

450                 455                 460Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe 465                470                 475                 480Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly

            485                 490                 495Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln

        500                 505                 510Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg

    515                 520                 525Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala

530                 535                 540Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545                 550                 555                 560Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr

            565                 570                 575Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly

        580                 585                 590Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu

    595                 600                 605Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu

610                 615                 620Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625                 630                 635                 640Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His

            645                 650                 655Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys

        660                 665                 670Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg

    675                 680                 685Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile

690                 695                 700Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile705                 710                 715                 720Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Gln Gly

            725                 730                 735Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Pro Ile Asp Glu

        740                 745                 750Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu

    755                 760                 765Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His

770                 775                 780Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Pro Ser Ala785                 790                 795                 800Pro Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His

            805                 810                 815Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys

        820                 825                 830Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys

    835                 840                 845Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys

850                 855                 860Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu865                 870                 875                 880Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys

            885                 890                 895Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val

        900                 905                 910Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln

    915                 920                 925Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala

930                 935                 940Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser945                 950                 955                 960Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg

            965                 970                 975Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn

        980                 985                 990Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val

    995                1000                1005Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Val Pro Glu   1010                1015                1020Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly1025               1030                1035                1040Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys

           1045                1050                1055Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser

       1060                1065                1070Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn

   1075                1080                1085Asp Tyr Thr Ala Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg   1090                1095                1100Asn Arg Gly Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala1105               1110                1115                1120Asp Tyr Ala Ser Ala His Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg

           1125                1130                1135Asp Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu

       1140                1145                1150Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp

   1155                1160                1165Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp   1170                1175                1180Ser Val Glu Leu Leu Leu Met Glu Glu1185               1190<210>7<211>3582<212>DNA<213>人工序列<220><223>人工序列说明:编码带全长Cry1Ab尾的H04的合成基因<220><221>CDS<222>(1)..(3582)<223>带全长Cry1Ab尾的H04<400>7atg gac aac aac ccc aac atc aac gag tgc atc ccc tac aac tgc ctg    48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu  1               5                  10                  15agc aac ccc gag gtg gag gtg ctg ggc ggc gag cgc atc gag acc ggc    96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

         20                  25                  30tac acc ccc atc gac atc agc ctg agc ctg acc cag ttc ctg ctg agc   144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

     35                  40                  45gag ttc gtg ccc ggc gcc ggc ttc gtg ctg ggc ctg gtg gac atc atc    192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

 50                  55                  60tgg ggc atc ttc ggc ccc agc cag tgg gac gcc ttc ctg gtg cag atc    240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65                  70                  75                  80gag cag ttg ata aac caa cgc ata gag gaa ttc gcc cgc aac cag gcc    288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

             85                  90                  95atc agc cgc ctg gag ggc ctg agc aac ctg tac caa atc tac gcc gag    336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

        100                 105                 110agc ttc cgc gag tgg gag gcc gac ccc acc aac ccc gcc ctg cgc gag    384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

    115                 120                 125gag atg cgc atc cag ttc aac gac atg aac agc gcc ctg acc acc gcc    432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130                 135                 140atc ccc ctg ttc gcc gtg cag aac tac cag gtg ccc ctg ctg agc gtg    480Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160tac gtg cag gcc gcc aac ctg cac ctg agc gtg ctg cgc gac gtc agc    528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

            165                 170                 175gtg ttc ggc cag cgc tgg ggc ttc gac gcc gcc acc atc aac agc cgc    576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

        180                 185                 190tac aac gac ctg acc cgc ctg atc ggc aac tac acc gac cac gcc gtg    624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val

    195                 200                 205cgc tgg tac aac acc ggc ctg gag cgc gtg tgg ggt ccc gac agc cgc    672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210                 215                 220gac tgg atc agg tac aac cag ttc cgc cgc gag ctg acc ctg acc gtg    720Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240ctg gac atc gtg agc ctg ttc ccc aac tac gac agc cgc acc tac ccc    768Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro

            245                 250                 255atc cgc acc gtg agc cag ctg acc cgc gag att tac acc aac ccc gtg    816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

        260                 265                 270ctg gag aac ttc gac ggc agc ttc cgc ggc agc gcc cag ggc atc gag    864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu

    275                 280                 285ggc agc atc cgc agc ccc cac ctg atg gac atc ctg aac agc atc acc    912Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290                 295                 300atc tac acc gac gcc cac cgc ggc gag tac tac tgg agc ggc cac cag    960Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320atc atg gcc agc ccc gtc ggc ttc agc ggc ccc gag ttc acc ttc ccc    1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro

            325                 330                 335ctg tac ggc acc atg ggc aac gct gca cct cag cag cgc atc gtg gca    1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala

        340                 345                 350cag ctg ggc cag gga gtg tac cgc acc ctg agc agc acc ctg tac cgt    1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg   

    355                 360                 365cga cct ttc aac atc ggc atc aac aac cag cag ctg agc gtg ctg gac    1152Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp

370                 375                 380ggc acc gag ttc gcc tac ggc acc agc agc aac ctg ccc agc gcc gtg    1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400tac cgc aag agc ggc acc gtg gac agc ctg gac gag atc ccc cct cag    1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln

            405                 410                 415aac aac aac gtg cca cct cga cag ggc ttc agc cac cgt ctg agc cac    1296Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His

        420                 425                 430gtg agc atg ttc cgc agt ggc ttc agc aac agc agc gtg agc atc atc    1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile

    435                 440                 445cgt gca ccc atg ttc agc tgg att cac cgc agc gcc acc ctg acc aac    1392Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn

450                 455                 460acc atc gac ccc gag cgc atc aac cag atc ccc ctg gtg aag ggc ttc    1440Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465                 470                 475                 480cgg gtg tgg ggc ggc acc agc gtg atc acc ggc ccc ggc ttc acc gga    1488Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly

            485                 490                 495ggc gac atc ctg cgc aga aac acc ttc ggc gac ttc gtg agc ctg cag    1536Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln

        500                 505                 510gtg aac atc aac agc ccc atc acc cag cgt tac cgc ctg cgc ttc cgc    1584Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg

    515                 520                 525tac gcc agc agc cgc gac gcc cgt gtg atc gtg ctg act ggc gcc gct    1632Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala

530                 535                 540agc acc ggt gtg ggc ggt cag gtg agc gtg aac atg ccc ctg cag aag    1680Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545                 550                 555                 560act atg gag atc ggc gag aac ctg act agt cgc acc ttc cgc tac acc    1728Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr

            565                 570                 575gac ttc agc aac ccc ttc agc ttc cgc gcc aac ccc gac atc atc ggc    1776Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly

        580                 585                 590atc agc gag cag ccc ctg ttc ggt gcc ggc agc atc agc agc ggc gag    1824Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu

    595                 600                 605ctg tac atc gac aag atc gag atc atc ctg gcc gac gcc acc ttc gag    1872Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu

610                 615                 620gcc gag agc gac ctg gag cgc gcc cag aag gcc gtg aac gcc ctg ttc    1920Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625                 630                 635                 640acc agc agc aac cag atc ggc ctg aag acc gac gtg acc gac tac cac    1968Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His

            645                 650                 655atc gac cag gtg agc aac ctg gtg gac tgc tta agc gac gag ttc tgc    2016Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys

        660                 665                 670ctg gac gag aag aag gag ctg agc gag aag gtg aag cac gcc aag cgc    2064Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg

    675                 680                 685ctg agc gac gag cgc aac ctg ctg cag gac ccc aac ttc cgc ggc atc    2112Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile

690                 695                 700aac cgc cag ctg gac cgc ggc tgg cga ggc agc acc gat atc acc atc    2160Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile705                 710                 715                 720cag ggc ggc gac gac gtg ttc aag gag aac tac gtg acc ctg cag ggc    2208Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Gln Gly

            725                 730                 735acc ttc gac gag tgc tac ccc acc tac ctg tac cag ccg atc gac gag    2256Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Pro Ile Asp Glu

        740                 745                 750agc aag ctg aag gcc tac acc cgc tac cag ctg cgc ggc tac atc gag    2304Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu

    755                 760                 765gac agc cag gac ctg gaa atc tac ctg atc cgc tac aac gcg aag cac    2352Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His

770                 775                 780gag acc gtg aac gtg ccc ggc acc ggc agc ctg tgg ccc ctg agc gcc    2400Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala785                 790                 795                 800ccc agc ccc atc ggc aag tgc ggg gag ccg aat cga tgc gct ccg cac    2448Pro Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His

            805                 810                 815ctg gag tgg aac ccg gac cta gac tgc agc tgc agg gac ggg gag aag    2496Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys

        820                 825                 830tgc gcc cac cac agc cac cac ttc agc ctg gac atc gac gtg ggc tgc    2544Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys

    835                 840                 845acc gac ctg aac gag gac ctg ggc gtg tgg gtg atc ttc aag atc aag    2592Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys

850                 855                 860acc cag gac ggc cac gcc cgc ctg ggc aat cta gag ttc ctg gag gag    2640Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu865                 870                 875                 880aag ccc ctg gtg ggc gag gcc ctg gcc cgc gtg aag cgt gct gag aag    2688Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys

            885                 890                 895aag tgg cgc gac aag cgc gag aag ctg gag tgg gag acc aac atc gtg    2736Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val

        900                 905                 910tac aag gag gcc aag gag agc gtg gac gcc ctg ttc gtg aac agc cag    2784Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln

    915                 920                 925tac gac cgc ctg cag gcc gac acc aac atc gcc atg atc cac gcc gcc    2832Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala

930                 935                 940gac aag cgc gtg cac agc att cgc gag gcc tac ctg ccc gag ctg agc    2880Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser945                 950                 955                 960gtg atc ccc ggt gtg aac gcc gcc atc ttc gag gaa ctc gag ggc cgc    2928Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg

            965                 970                 975atc ttc acc gcc ttc agc ctg tac gac gcc cgc aac gtg atc aag aac    2976Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn

        980                 985                 990ggc gac ttc aac aac ggc ctg agc tgc tgg aac gtg aag ggc cac gtg    3024Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val

    995                1000                1005gac gtg gag gag cag aac aac cac cgc agc gtg ctg gtg gtg ccc gag    3072Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Val Pro Glu   1010                1015                1020tgg gag gcc gag gtg agc cag gag gtg cgc gtg tgc ccc ggc cgc ggc    3120Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly1025               1030                1035                1040tac atc ctg cgc gtg acc gcc tac aag gag ggc tac ggc gag ggc tgc    3168Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys

           1045                1050                1055gtg acc atc cac gag atc gag aac aac acc gac gag ctc aag ttc agc    3216Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser

       1060                1065                1070aac tgc gtg gag gag gag gtt tac ccc aac aac acc gtg acc tgc aac    3264Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn

   1075                1080                1085gac tac acc gcg acc cag gag gag tac gaa ggc acc tac acc tct cgc    3312Asp Tyr Thr Ala Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg   1090                1095                1100aac agg ggt tac gac ggc gcc tac gag tcc aac agc tcc gtg cca gct    3360Asn Arg Gly Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala1105               1110                1115                1120gac tac gcc agc gcc tac gag gag aaa gcc tac acc gac ggt aga cgc    3408Asp Tyr Ala Ser Ala Tyr Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg

           1125                1130                1135gac aac cca tgt gag agc aac aga ggc tac ggc gac tac acc ccc ctg    3456Asp Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu

       1140                1145                1150ccc gct gga tac gtg acc aag gag ctg gag tac ttc ccc gag acc gac    3504Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp

   1155                1160                1165aag gtg tgg atc gag att ggc gag acc gag ggc acc ttc atc gtg gac    3552Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp   1170                1175                1180agc gtg gag ctg ctg ctg atg gag gag tag                            3582Ser Val Glu Leu Leu Leu Met Glu Glu1185               1190<210>8<211>1193<212>PRT<213>人工序列<223>人工序列说明:编码带全长Cry1Ab尾的H04的合成基因<400>8Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu  1               5                  10                  15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

         20                  25                  30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

     35                  40                  45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

 50                  55                  60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65                  70                  75                  80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

             85                  90                  95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

        100                 105                 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

    115                 120                 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130                 135                 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

            165                 170                 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

        180                 185                 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val

    195                 200                 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210                 215                 220Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro

            245                 250                 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

        260                 265                 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu

    275                 280                 285Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290                 295                 300Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro

            325                 330                 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala

        340                 345                 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg

    355                 360                 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp

370                 375                 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln

            405                 410                 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His

        420                 425                 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile

    435                 440                 445Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn

450                 455                 460Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465                 470                 475                 480Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly

            485                 490                 495Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln

        500                 505                 510Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg

    515                 520                 525Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala

530                 535                 540Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545                 550                 555                 560Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr

            565                 570                 575Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly

        580                 585                 590Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu

    595                 600                 605Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu

610                 615                 620Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625                 630                 635                 640Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His

            645                 650                 655Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys

        660                 665                 670Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg

    675                 680                 685Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile

690                 695                 700Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile705                 710                 715                 720Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Gln Gly

            725                 730                 735Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Pro Ile Asp Glu

        740                 745                 750Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu

    755                 760                 765Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His

770                 775                 780Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala785                 790                 795                 800Pro Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His

            805                 810                 815Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys

        820                 825                 830Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys

    835                 840                 845Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys

850                 855                 860Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu865                 870                 875                 880Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys

            885                 890                 895Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val

        900                 905                 910Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln

    915                 920                 925Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala

930                 935                 940Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser945                 950                 955                 960Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg

            965                 970                 975Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn

        980                 985                 990Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val

    995                1000                1005Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Val Pro Glu   1010                1015                1020Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly1025               1030                1035                1040Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys

           1045                1050                1055Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser

       1060                1065                1070Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn

   1075                1080                1085Asp Tyr Thr Ala Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg   1090                1095                1100Asn Arg Gly Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala1105               1110                1115                1120Asp Tyr Ala Ser Ala Tyr Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg

           1125                1130                1135Asp Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu

       1140                1145                1150Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp

   1155                1160                1165Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp   1170                1175                1180Ser Val Glu Leu Leu Leu Met Glu Glu1185               1190<210>9<211>2007<212>DNA<213>人工序列<220><223>人工序列说明:编码H04加cry1Ab尾头40个氨基酸的合成基因<220><221>CDS<222>(1)..(2007)<223>带截短的cry1Ab尾的H04<400>9atg gac aac aac ccc aac atc aac gag tgc atc ccc tac aac tgc ctg    48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu  1               5                  10                  15agc aac ccc gag gtg gag gtg ctg ggc ggc gag cgc atc gag acc ggc    96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

         20                  25                  30tac acc ccc atc gac atc agc ctg agc ctg acc cag ttc ctg ctg agc    144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

     35                  40                  45gag ttc gtg ccc ggc gcc ggc ttc gtg ctg ggc ctg gtg gac atc atc    192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

 50                  55                  60tgg ggc atc ttc ggc ccc agc cag tgg gac gcc ttc ctg gtg cag atc    240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65                  70                  75                  80gag cag ttg ata aac caa cgc ata gag gaa ttc gcc cgc aac cag gcc    288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

            85                   90                  95atc agc cgc ctg gag ggc ctg agc aac ctg tac caa atc tac gcc gag    336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

        100                 105                 110agc ttc cgc gag tgg gag gcc gac ccc acc aac ccc gcc ctg cgc gag    384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

    115                 120                 125gag atg cgc atc cag ttc aac gac atg aac agc gcc ctg acc acc gcc    432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130                 135                 140atc ccc ctg ttc gcc gtg cag aac tac cag gtg ccc ctg ctg agc gtg    480Ile Pro Leu Phe Ala Val Gln Asn TyrGln Val Pro Leu Leu Ser Val145                 150                155                 160tac gtg cag gcc gcc aac ctg cac ctg agc gtg ctg cgc gac gtc agc    528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

            165                 170                 175gtg ttc ggc cag cgc tgg ggc ttc gac gcc gcc acc atc aac agc cgc    576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

        180                 185                 190tac aac gac ctg acc cgc ctg atc ggc aac tac acc gac cac gcc gtg    624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val

    195                 200                 205cgc tgg tac aac acc ggc ctg gag cgc gtg tgg ggt ccc gac agc cgc    672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210                 215                 220gac tgg atc agg tac aac cag ttc cgc cgc gag ctg acc ctg acc gtg    720Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240ctg gac atc gtg agc ctg ttc ccc aac tac gac agc cgc acc tac ccc    768Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro

            245                 250                 255atc cgc acc gtg agc cag ctg acc cgc gag att tac acc aac ccc gtg    816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

        260                 265                 270ctg gag aac ttc gac ggc agc ttc cgc ggc agc gcc cag ggc atc gag    864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu

    275                 280                 285ggc agc atc cgc agc ccc cac ctg atg gac atc ctg aac agc atc acc    912Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290                 295                 300atc tac acc gac gcc cac cgc ggc gag tac tac tgg agc ggc cac cag    960Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320atc atg gcc agc ccc gtc ggc ttc agc ggc ccc gag ttc acc ttc ccc    1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro

            325                 330                 335ctg tac ggc acc atg ggc aac gct gca cct cag cag cgc atc gtg gca    1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala

        340                 345                 350cag ctg ggc cag gga gtg tac cgc acc ctg agc agc acc ctg tac cgt    1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg

    355                 360                 365cga cct ttc aac atc ggc atc aac aac cag cag ctg agc gtg ctg gac    1152Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp

370                 375                 380ggc acc gag ttc gcc tac ggc acc agc agc aac ctg ccc agc gcc gtg    1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400tac cgc aag agc ggc acc gtg gac agc ctg gac gag atc ccc cct cag    1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln

            405                 410                 415aac aac aac gtg cca cct cga cag ggc ttc agc cac cgt ctg agc cac    1296Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His

        420                 425                 430gtg agc atg ttc cgc agt ggc ttc agc aac agc agc gtg agc atc atc    1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile

    435                 440                 445cgt gca ccc atg ttc agc tgg att cac cgc agc gcc acc ctg acc aac    1392Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn

450                 455                 460acc atc gac ccc gag cgc atc aac cag atc ccc ctg gtg aag ggc ttc    1440Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465                 470                 475                 480cgg gtg tgg ggc ggc acc agc gtg atc acc ggc ccc ggc ttc acc gga    1488Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly

            485                 490                 495ggc gac atc ctg cgc aga aac acc ttc ggc gac ttc gtg agc ctg cag    1536Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln

        500                 505                 510gtg aac atc aac agc ccc atc acc cag cgt tac cgc ctg cgc ttc cgc    1584Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg

    515                 520                 525tac gcc agc agc cgc gac gcc cgt gtg atc gtg ctg act ggc gcc gct    1632Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala

530                 535                 540agc acc ggt gtg ggc ggt cag gtg agc gtg aac atg ccc ctg cag aag    1680Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545                 550                 555                 560act atg gag atc ggc gag aac ctg act agt cgc acc ttc cgc tac acc    1728Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr

            565                 570                 575gac ttc agc aac ccc ttc agc ttc cgc gcc aac ccc gac atc atc ggc    1776Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly

        580                 585                 590atc agc gag cag ccc ctg ttc ggt gcc ggc agc atc agc agc ggc gag    1824Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu

    595                 600                 605ctg tac atc gac aag atc gag atc atc ctg gcc gac gcc acc ttc gag    1872Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu

610                 615                 620gcc gag agc gac ctg gag cgc gcc cag aag gcc gtg aac gcc ctg ttc    1920Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625                 630                 635                 640acc agc agc aac cag atc ggc ctg aag acc gac gtg acc gac tac cac    1968Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His

            645                 650                 655atc gac cag gtg agc aac ctg gtg gac tgc tta agc tag                 2007Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser

        660                 665<210>10<211>668<212>PRT<213>人工序列<223>人工序列说明:编码H04加cry1Ab尾头40个氨基酸的合成基因<400>10Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu  1               5                  10                  15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly

         20                  25                  30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser

     35                  40                  45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile

 50                  55                  60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65                  70                  75                  80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala

             85                  90                  95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu

        100                 105                 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu

    115                 120                 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala

130                 135                 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145                 150                 155                 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser

            165                 170                 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg

        180                 185                 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val

    195                 200                 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg

210                 215                 220Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225                 230                 235                 240Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro

            245                 250                 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val

        260                 265                 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu

    275                 280                 285Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr

290                 295                 300Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305                 310                 315                 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro

            325                 330                 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala

        340                 345                 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg

    355                 360                 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp

370                 375                 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385                 390                 395                 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln

            405                 410                 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His

        420                 425                 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile

    435                 440                 445Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn

450                 455                 460Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465                 470                 475                 480Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly

            485                 490                 495Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln

        500                 505                 510Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg

    515                 520                 525Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala

530                 535                 540Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545                 550                 555                 560Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr

            565                 570                 575Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly

        580                 585                 590Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu

    595                 600                 605Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu

610                 615                 620Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625                 630                 635                 640Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His

            645                 650                 655Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser

        660                 665<210>11<211>13269<212>DNA<213>人工序列<220><223>人工序列说明:pNOV1308<220><221>misc_feature<222>(1)..(1896)<223>编码不带尾的H04毒素部分的合成核苷酸序列<220><221>misc_feature<222>(2102)..(4083)<223>玉米遍在蛋白启动子<220><221>misc_feature<222>(4180)..(5283)<223>PMI标记基因<220><221>misc_feature<222>(11247)..(12647)<223>Zm Ubi启动子<400>11atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag  60gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg  120agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg  180gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc  240gagcagttga taaaccaacg catagaggaa ttcgcccgca accaggccat cagccgcctg  300gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac  360cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc  420ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg  480tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag  540cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc  600ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt  660cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg  720ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg  780agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc  840cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg  900aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag  960atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc  1020atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc  1080accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg  1140agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg  1200taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg  1260ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc  1320agcaacagca gcgtgagcat catccgtgca cccatgttca gctggattca ccgcagcgcc  1380accctgacca acaccatcga ccccgagcgc atcaaccaga tccccctggt gaagggcttc  1440cgggtgtggg gcggcaccag cgtgatcacc ggccccggct tcaccggagg cgacatcctg  1500cgcagaaaca ccttcggcga cttcgtgagc ctgcaggtga acatcaacag ccccatcacc  1560cagcgttacc gcctgcgctt ccgctacgcc agcagccgcg acgcccgtgt gatcgtgctg  1620actggcgccg ctagcaccgg tgtgggcggt caggtgagcg tgaacatgcc cctgcagaag  1680actatggaga tcggcgagaa cctgactagt cgcaccttcc gctacaccga cttcagcaac  1740cccttcagct tccgcgccaa ccccgacatc atcggcatca gcgagcagcc cctgttcggt  1800gccggcagca tcagcagcgg cgagctgtac atcgacaaga tcgagatcat cctggccgac  1860gccaccttcg aggccgagag cgacctggag cgctaagatc tgttctgcac aaagtggagt  1920agtcagtcat cgatcaggaa ccagacacca gacttttatt catacagtga agtgaagtga  1980agtgcagtgc agtgagttgc tggtttttgt acaacttagt atgtatttgt atttgtaaaa  2040tacttctatc aataaaattt ctaattccta aaaccaaaat ccaggggtac cagcttgcat  2100gcctgcagtg cagcgtgacc cggtcgtgcc cctctctaga gataatgagc attgcatgtc  2160taagttataa aaaattacca catatttttt ttgtcacact tgtttgaagt gcagtttatc  2220tatctttata catatattta aactttactc tacgaataat ataatctata gtactacaat  2280aatatcagtg ttttagagaa tcatataaat gaacagttag acatggtcta aaggacaatt  2340gagtattttg acaacaggac tctacagttt tatcttttta gtgtgcatgt gttctccttt  2400ttttttgcaa atagcttcac ctatataata cttcatccat tttattagta catccattta  2460gggtttaggg ttaatggttt ttatagacta atttttttag tacatctatt ttattctatt  2520ttagcctcta aattaagaaa actaaaactc tattttagtt tttttattta ataatttaga  2580tataaaatag aataaaataa agtgactaaa aattaaacaa atacccttta agaaattaaa  2640aaaactaagg aaacattttt cttgtttcga gtagataatg ccagcctgtt aaacgccgtc  2700gacgagtcta acggacacca accagcgaac cagcagcgtc gcgtcgggcc aagcgaagca  2760gacggcacgg catctctgtc gctgcctctg gacccctctc gagagttccg ctccaccgtt  2820ggacttgctc cgctgtcggc atccagaaat tgcgtggcgg agcggcagac gtgagccggc  2880acggcaggcg gcctcctcct cctctcacgg caccggcagc tacgggggat tcctttccca  2940ccgctccttc gctttccctt cctcgcccgc cgtaataaat agacaccccc tccacaccct  3000ctttccccaa cctcgtgttg ttcggagcgc acacacacac aaccagatct cccccaaatc  3060cacccgtcgg cacctccgct tcaaggtacg ccgctcgtcc tccccccccc cccctctcta  3120ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat  3180gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg  3240acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct  3300gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc  3360atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg  3420tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt  3480tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg  3540tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat  3600ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg  3660ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag  3720tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc  3780atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac  3840atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat  3900gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttattttgat  3960cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc  4020ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg  4080gtgttacttc tgcagggatc cccgatcatg caaaaactca ttaactcagt gcaaaactat  4140gcctggggca gcaaaacggc gttgactgaa ctttatggta tggaaaatcc gtccagccag  4200ccgatggccg agctgtggat gggcgcacat ccgaaaagca gttcacgagt gcagaatgcc  4260gccggagata tcgtttcact gcgtgatgtg attgagagtg ataaatcgac tctgctcgga  4320gaggccgttg ccaaacgctt tggcgaactg cctttcctgt tcaaagtatt atgcgcagca  4380cagccactct ccattcaggt tcatccaaac aaacacaatt ctgaaatcgg ttttgccaaa  4440gaaaatgccg caggtatccc gatggatgcc gccgagcgta actataaaga tcctaaccac  4500aagccggagc tggtttttgc gctgacgcct ttccttgcga tgaacgcgtt tcgtgaattt  4560tccgagattg tctccctact ccagccggtc gcaggtgcac atccggcgat tgctcacttt  4620ttacaacagc ctgatgccga acgtttaagc gaactgttcg ccagcctgtt gaatatgcag  4680ggtgaagaaa aatcccgcgc gctggcgatt ttaaaatcgg ccctcgatag ccagcagggt  4740gaaccgtggc aaacgattcg tttaatttct gaattttacc cggaagacag cggtctgttc  4800tccccgctat tgctgaatgt ggtgaaattg aaccctggcg aagcgatgtt cctgttcgct  4860gaaacaccgc acgcttacct gcaaggcgtg gcgctggaag tgatggcaaa ctccgataac  4920gtgctgcgtg cgggtctgac gcctaaatac attgatattc cggaactggt tgccaatgtg  4980aaattcgaag ccaaaccggc taaccagttg ttgacccagc cggtgaaaca aggtgcagaa  5040ctggacttcc cgattccagt ggatgatttt gccttctcgc tgcatgacct tagtgataaa  5100gaaaccacca ttagccagca gagtgccgcc attttgttct gcgtcgaagg cgatgcaacg  5160ttgtggaaag gttctcagca gttacagctt aaaccgggtg aatcagcgtt tattgccgcc  5220aacgaatcac cggtgactgt caaaggccac ggccgtttag cgcgtgttta caacaagctg  5280taagagctta ctgaaaaaat taacatctct tgctaagctg ggagctcgat ccgtcgacct  5340gcagatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt  5400gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa  5460tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa  5520tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca  5580tctatgttac tagatctgct agccctgcag gaaatttacc ggtgcccggg cggccagcat  5640ggccgtatcc gcaatgtgtt attaagttgt ctaagcgtca atttgtttac accacaatat  5700atcctgccac cagccagcca acagctcccc gaccggcagc tcggcacaaa atcaccactc  5760gatacaggca gcccatcaga attaattctc atgtttgaca gcttatcatc gactgcacgg  5820tgcaccaatg cttctggcgt caggcagcca tcggaagctg tggtatggct gtgcaggtcg  5880taaatcactg cataattcgt gtcgctcaag gcgcactccc gttctggata atgttttttg  5940cgccgacatc ataacggttc tggcaaatat tctgaaatga gctgttgaca attaatcatc  6000cggctcgtat aatgtgtgga attgtgagcg gataacaatt tcacacagga aacagaccat  6060gagggaagcg ttgatcgccg aagtatcgac tcaactatca gaggtagttg gcgtcatcga  6120gcgccatctc gaaccgacgt tgctggccgt acatttgtac ggctccgcag tggatggcgg  6180cctgaagcca cacagtgata ttgatttgct ggttacggtg accgtaaggc ttgatgaaac  6240aacgcggcga gctttgatca acgacctttt ggaaacttcg gcttcccctg gagagagcga  6300gattctccgc gctgtagaag tcaccattgt tgtgcacgac gacatcattc cgtggcgtta  6360tccagctaag cgcgaactgc aatttggaga atggcagcgc aatgacattc ttgcaggtat  6420cttcgagcca gccacgatcg acattgatct ggctatcttg ctgacaaaag caagagaaca  6480tagcgttgcc ttggtaggtc cagcggcgga ggaactcttt gatccggttc ctgaacagga  6540tctatttgag gcgctaaatg aaaccttaac gctatggaac tcgccgcccg actgggctgg  6600cgatgagcga aatgtagtgc ttacgttgtc ccgcatttgg tacagcgcag taaccggcaa  6660aatcgcgccg aaggatgtcg ctgccgactg ggcaatggag cgcctgccgg cccagtatca  6720gcccgtcata cttgaagcta ggcaggctta tcttggacaa gaagatcgct tggcctcgcg  6780cgcagatcag ttggaagaat ttgttcacta cgtgaaaggc gagatcacca aagtagtcgg  6840caaataaagc tctagtggat ctccgtaccc ccgggggatc tggctcgcgg cggacgcacg  6900acgccggggc gagaccatag gcgatctcct aaatcaatag tagctgtaac ctcgaagcgt  6960ttcacttgta acaacgattg agaatttttg tcataaaatt gaaatacttg gttcgcattt  7020ttgtcatccg cggtcagccg caattctgac gaactgccca tttagctgga gatgattgta  7080catccttcac gtgaaaattt ctcaagcgct gtgaacaagg gttcagattt tagattgaaa  7140ggtgagccgt tgaaacacgt tcttcttgtc gatgacgacg tcgctatgcg gcatcttatt  7200attgaatacc ttacgatcca cgccttcaaa gtgaccgcgg tagccgacag cacccagttc  7260acaagagtac tctcttccgc gacggtcgat gtcgtggttg ttgatctaaa tttaggtcgt  7320gaagatgggc tcgagatcgt tcgtaatctg gcggcaaagt ctgatattcc aatcataatt  7380atcagtggcg accgccttga ggagacggat aaagttgttg cactcgagct aggagcaagt  7440gattttatcg ctaagccgtt cagtatcaga gagtttctag cacgcattcg ggttgccttg  7500cgcgtgcgcc ccaacgttgt ccgctccaaa gaccgacggt ctttttgttt tactgactgg  7560acacttaatc tcaggcaacg tcgcttgatg tccgaagctg gcggtgaggt gaaacttacg  7620gcaggtgagt tcaatcttct cctcgcgttt ttagagaaac cccgcgacgt tctatcgcgc  7680gagcaacttc tcattgccag tcgagtacgc gacgaggagg tttatgacag gagtatagat  7740gttctcattt tgaggctgcg ccgcaaactt gaggcagatc cgtcaagccc tcaactgata  7800aaaacagcaa gaggtgccgg ttatttcttt gacgcggacg tgcaggtttc gcacgggggg  7860acgatggcag cctgagccaa ttcccagatc cccgaggaat cggcgtgagc ggtcgcaaac  7920catccggccc ggtacaaatc ggcgcggcgc tgggtgatga cctggtggag aagttgaagg  7980ccgcgcaggc cgcccagcgg caacgcatcg aggcagaagc acgccccggt gaatcgtggc  8040aagcggccgc tgatcgaatc cgcaaagaat cccggcaacc gccggcagcc ggtgcgccgt  8100cgattaggaa gccgcccaag ggcgacgagc aaccagattt tttcgttccg atgctctatg  8160acgtgggcac ccgcgatagt cgcagcatca tggacgtggc cgttttccgt ctgtcgaagc  8220gtgaccgacg agctggcgag gtgatccgct acgagcttcc agacgggcac gtagaggttt  8280ccgcagggcc ggccggcatg gccagtgtgt gggattacga cctggtactg atggcggttt  8340cccatctaac cgaatccatg aaccgatacc gggaagggaa gggagacaag cccggccgcg  8400tgttccgtcc acacgttgcg gacgtactca agttctgccg gcgagccgat ggcggaaagc  8460agaaagacga cctggtagaa acctgcattc ggttaaacac cacgcacgtt gccatgcagc  8520gtacgaagaa ggccaagaac ggccgcctgg tgacggtatc cgagggtgaa gccttgatta  8580gccgctacaa gatcgtaaag agcgaaaccg ggcggccgga gtacatcgag atcgagctag  8640ctgattggat gtaccgcgag atcacagaag gcaagaaccc ggacgtgctg acggttcacc  8700ccgattactt tttgatcgat cccggcatcg gccgttttct ctaccgcctg gcacgccgcg  8760ccgcaggcaa ggcagaagcc agatggttgt tcaagacgat ctacgaacgc agtggcagcg  8820ccggagagtt caagaagttc tgtttcaccg tgcgcaagct gatcgggtca aatgacctgc  8880cggagtacga tttgaaggag gaggcggggc aggctggccc gatcctagtc atgcgctacc  8940gcaacctgat cgagggcgaa gcatccgccg gttcctaatg tacggagcag atgctagggc  9000aaattgccct agcaggggaa aaaggtcgaa aaggtctctt tcctgtggat agcacgtaca  9060ttgggaaccc aaagccgtac attgggaacc ggaacccgta cattgggaac ccaaagccgt  9120acattgggaa ccggtcacac atgtaagtga ctgatataaa agagaaaaaa ggcgattttt  9180ccgcctaaaa ctctttaaaa cttattaaaa ctcttaaaac ccgcctggcc tgtgcataac  9240tgtctggcca gcgcacagcc gaagagctgc aaaaagcgcc tacccttcgg tcgctgcgct  9300ccctacgccc cgccgcttcg cgtcggccta tcgcggccgc tggccgctca aaaatggctg  9360gcctacggcc aggcaatcta ccagggcgcg gacaagccgc gccgtcgcca ctcgaccgcc  9420ggcgctgagg tctgcctcgt gaagaaggtg ttgctgactc ataccaggcc tgaatcgccc  9480catcatccag ccagaaagtg agggagccac ggttgatgag agctttgttg taggtggacc  9540agttggtgat tttgaacttt tgctttgcca cggaacggtc tgcgttgtcg ggaagatgcg  9600tgatctgatc cttcaactca gcaaaagttc gatttattca acaaagccgc cgtcccgtca  9660agtcagcgta atgctctgcc agtgttacaa ccaattaacc aattctgatt agaaaaactc  9720atcgagcatc aaatgaaact gcaatttatt catatcagga ttatcaatac catatttttg  9780aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg cagttccata ggatggcaag  9840atcctggtat cggtctgcga ttccgactcg tccaacatca atacaaccta ttaatttccc  9900ctcgtcaaaa ataaggttat caagtgagaa atcaccatga gtgacgactg aatccggtga  9960gaatggcaaa agctctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta  10020ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc  10080gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg  10140caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt  10200tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa  10260gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct  10320ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc  10380cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg  10440tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct  10500tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag  10560cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga  10620agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga  10680agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg  10740gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag  10800aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag  10860ggattttggt catgagatta tcaaaaagga tcttcaccta gatccttttg atccggaatt  10920aattcctgtg gttggcatgc acatacaaat ggacgaacgg ataaaccttt tcacgccctt  10980ttaaatatcc gattattcta ataaacgctc ttttctctta ggtttacccg ccaatatatc  11040ctgtcaaaca ctgatagttt aaactgaagg cgggaaacga caatctgatc atgagcggag  11100aattaaggga gtcacgttat gacccccgcc gatgacgcgg gacaagccgt tttacgtttg  11160gaactgacag aaccgcaacg ctgcaggaat tggccgcagc ggccatttaa atcaattggg  11220cgcgccgaat tcgagctcgg tacaagcttg catgcctgca gtgcagcgtg acccggtcgt  11280gcccctctct agagataatg agcattgcat gtctaagtta taaaaaatta ccacatattt  11340tttttgtcac acttgtttga agtgcagttt atctatcttt atacatatat ttaaacttta  11400ctctacgaat aatataatct atagtactac aataatatca gtgttttaga gaatcatata  11460aatgaacagt tagacatggt ctaaaggaca attgagtatt ttgacaacag gactctacag  11520ttttatcttt ttagtgtgca tgtgttctcc tttttttttg caaatagctt cacctatata  11580atacttcatc cattttatta gtacatccat ttagggttta gggttaatgg tttttataga  11640ctaatttttt tagtacatct attttattct attttagcct ctaaattaag aaaactaaaa  11700ctctatttta gtttttttat ttaataattt agatataaaa tagaataaaa taaagtgact  11760aaaaattaaa caaataccct ttaagaaatt aaaaaaacta aggaaacatt tttcttgttt  11820cgagtagata atgccagcct gttaaacgcc gtcgacgagt ctaacggaca ccaaccagcg  11880aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca cggcatctct gtcgctgcct  11940ctggacccct ctcgagagtt ccgctccacc gttggacttg ctccgctgtc ggcatccaga  12000aattgcgtgg cggagcggca gacgtgagcc ggcacggcag gcggcctcct cctcctctca  12060cggcacggca gctacggggg attcctttcc caccgctcct tcgctttccc ttcctcgccc  12120gccgtaataa atagacaccc cctccacacc ctctttcccc aacctcgtgt tgttcggagc  12180gcacacacac acaaccagat ctcccccaaa tccacccgtc ggcacctccg cttcaaggta  12240cgccgctcgt cctccccccc cccccctctc taccttctct agatcggcgt tccggtccat  12300ggttagggcc cggtagttct acttctgttc atgtttgtgt tagatccgtg tttgtgttag  12360atccgtgctg ctagcgttcg tacacggatg cgacctgtac gtcagacacg ttctgattgc  12420taacttgcca gtgtttctct ttggggaatc ctgggatggc tctagccgtt ccgcagacgg  12480gatcgatttc atgatttttt ttgtttcgtt gcatagggtt tggtttgccc ttttccttta  12540tttcaatata tgccgtgcac ttgtttgtcg ggtcatcttt tcatgctttt ttttgtcttg  12600gttgtgatga tgtggtctgg ttgggcggtc gttctagatc ggagtagaat tctgtttcaa  12660actacctggt ggatttatta attttggatc tgtatgtgtg tgccatacat attcatagtt  12720acgaattgaa gatgatggat ggaaatatcg atctaggata ggtatacatg ttgatgcggg  12780ttttactgat gcatatacag agatgctttt tgttcgcttg gttgtgatga tgtggtgtgg  12840ttgggcggtc gttcattcgt tctagatcgg agtagaatac tgtttcaaac tacctggtgt  12900atttattaat tttggaactg tatgtgtgtg tcatacatct tcatagttac gagtttaaga  12960tggatggaaa tatcgatcta ggataggtat acatgttgat gtgggtttta ctgatgcata  13020tacatgatgg catatgcagc atctattcat atgctctaac cttgagtacc tatctattat  13080aataaacaag tatgttttat aattattttg atcttgatat acttggatga tggcatatgc  13140agcagctata tgtggatttt tttagccctg ccttcatacg ctatttattt gcttggtact  13200gtttcttttg tcgatgctca ccctgttgtt tggtgttact tctgcaggtc gactctagag  13260gatccaaca                                                          13269<210>12<211>16179<212>DNA<213>人工序列<220><223>人工序列说明:pNOV1436<220><221>misc_feature<222>(1)..(3582)<223>编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列<220><221>misc_feature<222>Complement((10390)..(11598))<223>磷酸甘露糖异构酶(PMI)标记基因<220><221>misc_feature<222>Complement((12718)..(13608))<223>玉米泛在蛋白(Zm Ubi)启动子<220><221>misc_feature<222>(13613)..(16170)<223>MTL启动子<400>12atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag  60gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg  120agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg  180gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc  240gagcagttga taaaccaacg catagaggaa ttcgcccgca accaggccat cagccgcctg  300gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac  360cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc  420ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg  480tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag  540cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc  600ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt  660cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg  720ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg  780agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc  840cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg  900aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag  960atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc  1020atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc  1080accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg  1140agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg  1200taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg  1260ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc  1320agcaacagca gcgtgagcat catccgtgca cccatgttca gctggattca ccgcagcgcc  1380accctgacca acaccatcga ccccgagcgc atcaaccaga tccccctggt gaagggcttc  1440cgggtgtggg gcggcaccag cgtgatcacc ggccccggct tcaccggagg cgacatcctg  1500cgcagaaaca ccttcggcga cttcgtgagc ctgcaggtga acatcaacag ccccatcacc  1560cagcgttacc gcctgcgctt ccgctacgcc agcagccgcg acgcccgtgt gatcgtgctg  1620actggcgccg ctagcaccgg tgtgggcggt caggtgagcg tgaacatgcc cctgcagaag  1680actatggaga tcggcgagaa cctgactagt cgcaccttcc gctacaccga cttcagcaac  1740cccttcagct tccgcgccaa ccccgacatc atcggcatca gcgagcagcc cctgttcggt  1800gccggcagca tcagcagcgg cgagctgtac atcgacaaga tcgagatcat cctggccgac  1860gccaccttcg aggccgagag cgacctggag cgcgcccaga aggccgtgaa cgccctgttc  1920accagcagca accagatcgg cctgaagacc gacgtgaccg actaccacat cgaccaggtg  1980agcaacctgg tggactgctt aagcgacgag ttctgcctgg acgagaagaa ggagctgagc  2040gagaaggtga agcacgccaa gcgcctgagc gacgagcgca acctgctgca ggaccccaac  2100ttccgcggca tcaaccgcca gctggaccgc ggctggcgag gcagcaccga tatcaccatc  2160cagggcggcg acgacgtgtt caaggagaac tacgtgaccc tgcagggcac cttcgacgag  2220tgctacccca cctacctgta ccagccgatc gacgagagca agctgaaggc ctacacccgc  2280taccagctgc gcggctacat cgaggacagc caggacctgg aaatctacct gatccgctac  2340aacgcgaagc acgagaccgt gaacgtgccc ggcaccggca gcctgtggcc cccgagcgcc  2400cccagcccca tcggcaagtg cggggagccg aatcgatgcg ctccgcacct ggagtggaac  2460ccggacctag actgcagctg cagggacggg gagaagtgcg cccaccacag ccaccacttc  2520agcctggaca tcgacgtggg ctgcaccgac ctgaacgagg acctgggcgt gtgggtgatc  2580ttcaagatca agacccagga cggccacgcc cgcctgggca atctagagtt cctggaggag  2640aagcccctgg tgggcgaggc cctggcccgc gtgaagcgtg ctgagaagaa gtggcgcgac  2700aagcgcgaga agctggagtg ggagaccaac atcgtgtaca aggaggccaa ggagagcgtg  2760gacgccctgt tcgtgaacag ccagtacgac cgcctgcagg ccgacaccaa catcgccatg  2820atccacgccg ccgacaagcg cgtgcacagc attcgcgagg cctacctgcc cgagctgagc  2880gtgatccccg gtgtgaacgc cgccatcttc gaggaactcg agggccgcat cttcaccgcc  2940ttcagcctgt acgacgcccg caacgtgatc aagaacggcg acttcaacaa cggcctgagc  3000tgctggaacg tgaagggcca cgtggacgtg gaggagcaga acaaccaccg cagcgtgctg  3060gtggtgcccg agtgggaggc cgaggtgagc caggaggtgc gcgtgtgccc cggccgcggc  3120tacatcctgc gcgtgaccgc ctacaaggag ggctacggcg agggctgcgt gaccatccac  3180gagatcgaga acaacaccga cgagctcaag ttcagcaact gcgtggagga ggaggtttac  3240cccaacaaca ccgtgacctg caacgactac accgcgaccc aggaggagta cgaaggcacc  3300tacacctctc gcaacagggg ttacgacggc gcctacgagt ccaacagctc cgtgccagct  3360gactacgcca gcgcccacga ggagaaagcc tacaccgacg gtagacgcga caacccatgt  3420gagagcaaca gaggctacgg cgactacacc cccctgcccg ctggatacgt gaccaaggag  3480ctggagtact tccccgagac cgacaaggtg tggatcgaga ttggcgagac cgagggcacc  3540ttcatcgtgg acagcgtgga gctgctgctg atggaggagt agtagatctg ttctgcacaa  3600agtggagtag tcagtcatcg atcaggaacc agacaccaga cttttattca tacagtgaag  3660tgaagtgaag tgcagtgcag tgagttgctg gtttttgtac cacttagtat gtatttgtat  3720ttgtaaaata cttctatcaa taaaatttct aattcctaaa accaaaatcc agtgggtacc  3780agcttgggct gagtggctcc ttcaacgttg cggttctgtc agttccaaac gtaaaacggc  3840ttgtcccgcg tcatcggcgg gggtcataac gtgactccct taattctccg ctcatgatca  3900gattgtcgtt tcccgccttc agtttaaact atcagtgttt gacaggatat attggcgggt  3960aaacctaaga gaaaagagcg tttattagaa taacggatat ttaaaagggc gtgaaaaggt  4020ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttcccctcg ggagtgcttg  4080gcattccgta cgataatgac ttctgttcaa ccacccaaac gtcggaaagc ctgacgacgg  4140agcagcattc caaaaagatc ccttggctcg tctgggtcgg ctagaaggtc gagtgggctg  4200ctgtggcttg atccctcaac gcggtcgcgg acgtagcgca gcgccgaaaa atcctcgatc  4260gcaaatccga cgctgtcgaa aagcgtgatc tgcttgtcgc tctttcggcc gacgtcctgg  4320ccagtcatca cgcgccaaag ttccgtcaca ggatgatctg gcgcgagttg ctggatctcg  4380ccttcaatcc gggtctgtgg cgggaactcc acgaaaatat ccgaacgcag caagatcgtc  4440gaccaattct tgaagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat  4500gataataatg gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc  4560tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg  4620ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc  4680ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt  4740gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct  4800caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac  4860ttttaaagtt ctgctatgtg gcgcggtatt atcccgtgtt gacgccgggc aagagcaact  4920cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa  4980gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga  5040taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt  5100tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga  5160agccatacca aacgacgagc gtgacaccac gatgcctgca gggggggggg ggggggggac  5220atgaggttgc cccgtattca gtgtcgctga tttgtattgt ctgaagttgt ttttacgtta  5280agttgatgca gatcaattaa tacgatacct gcgtcataat tgattatttg acgtggtttg  5340atggcctcca cgcacgttgt gatatgtaga tgataatcat tatcacttta cgggtccttt  5400ccggtgatcc gacaggttac ggggcggcga cctcgcgggt tttcgctatt tatgaaaatt  5460ttccggttta aggcgtttcc gttcttcttc gtcataactt aatgttttta tttaaaatac  5520cctctgaaaa gaaaggaaac gacaggtgct gaaagcgagg ctttttggcc tctgtcgttt  5580cctttctctg tttttgtccg tggaatgaac aatggaagtc cccccccccc cccccccctg  5640cagcaatggc aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc  5700ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg  5760cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg  5820gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga  5880cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac  5940tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa  6000aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca  6060aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag  6120gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac  6180cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa  6240ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc  6300accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag  6360tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac  6420cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc  6480gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc  6540ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca  6600cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc  6660tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg  6720ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct  6780ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata  6840ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc  6900gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatggtgca  6960ctctcagtac aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct  7020acgtgactgg gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg  7080ggcttgtctg ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat  7140gtgtcagagg ttttcaccgt catcaccgaa acgcgcgagg cagcagatcc cccgatcaag  7200tagatacact acatatatct acaatagaca tcgagccgga aggtgatgtt tactttcctg  7260aaatccccag caattttagg ccagttttta cccaagactt cgcctctaac ataaattata  7320gttaccaaat ctggcaaaag ggttaacaag tggcagcaac ggattcgcaa acctgtcacg  7380ccttttgtgc caaaagccgc gccaggtttg cgatccgctg tgccaggcgt taggcgtcat  7440atgaagattt cggtgatccc tgagcaggtg gcggaaacat tggatgctga gaaccatttc  7500attgttcgtg aagtgttcga tgtgcaccta tccgaccaag gctttgaact atctaccaga  7560agtgtgagcc cctaccggaa ggattacatc tcggatgatg actctgatga agactctgct  7620tgctatggcg cattcatcga ccaagagctt gtcgggaaga ttgaactcaa ctcaacatgg  7680aacgatctag cctctatcga acacattgtt gtgtcgcaca cgcaccgagg caaaggagtc  7740gcgcacagtc tcatcgaatt tgcgaaaaag tgggcactaa gcagacagct ccttggcata  7800cgattagaga cacaaacgaa caatgtacct gcctgcaatt tgtacgcaaa atgtggcttt  7860actctcggcg gcattgacct gttcacgtat aaaactagac ctcaagtctc gaacgaaaca  7920gcgatgtact ggtactggtt ctcgggagca caggatgacg cctaacaatt cattcaagcc  7980gacaccgctt cgcggcgcgg cttaattcag gagttaaaca tcatgaggga agcggtgatc  8040gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca tctcgaaccg  8100acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa gccacacagt  8160gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg gcgagctttg  8220atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct ccgcgctgta  8280gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc taagcgcgaa  8340ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga gccagccacg  8400atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt tgccttggta  8460ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt tgaggcgcta  8520aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga gcgaaatgta  8580gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc gccgaaggat  8640gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt catacttgaa  8700gctaggcagg cttatcttgg acaagaagat cgcttggcct cgcgcgcaga tcagttggaa  8760gaatttgttc actacgtgaa aggcgagatc accaaggtag tcggcaaata atgtctaaca  8820attcgttcaa gccgacgccg cttcgcggcg cggcttaact caagcgttag agagctgggg  8880aagactatgc gcgatctgtt gaaggtggtt ctaagcctcg tacttgcgat ggcatcgggg  8940caggcacttg ctgacctgcc aattgtttta gtggatgaag ctcgtcttcc ctatgactac  9000tccccatcca actacgacat ttctccaagc aactacgaca actccataag caattacgac  9060aatagtccat caaattacga caactctgag agcaactacg ataatagttc atccaattac  9120gacaatagtc gcaacggaaa tcgtaggctt atatatagcg caaatgggtc tcgcactttc  9180gccggctact acgtcattgc caacaatggg acaacgaact tcttttccac atctggcaaa  9240aggatgttct acaccccaaa aggggggcgc ggcgtctatg gcggcaaaga tgggagcttc  9300tgcggggcat tggtcgtcat aaatggccaa ttttcgcttg ccctgacaga taacggcctg  9360aagatcatgt atctaagcaa ctagcctgct ctctaataaa atgttaggcc tcaacatcta  9420gtcgcaagct gaggggaacc actagtgtca tacgaacctc caagagacgg ttacacaaac  9480gggtacattg ttgatgtcat gtatgacaat cgcccaagta agtatccagc tgtgttcaga  9540acgtacgtcc gaattaattc atcggggtac ggtcgacgat cgtcaacgtt cacttctaaa  9600gaaatagcgc cactcagctt cctcagcggc tttatccagc gatttcctat tatgtcggca  9660tagttctcaa gatcgacagc ctgtcacggt taagcgagaa atgaataaga aggctgataa  9720ttcggatctc tgcgagggag atgatatttg atcacaggca gcaacgctct gtcatcgtta  9780caatcaacat gctaccctcc gcgagatcat ccgtgtttca aacccggcag cttagttgcc  9840gttcttccga atagcatcgg taacatgagc aaagtctgcc gccttacaac ggctctcccg  9900ctgacgccgt cccggactga tgggctgcct gtatcgagtg gtgattttgt gccgagctgc  9960cggtcgggga gctgttggct ggctggtggc aggatatatt gtggtgtaaa caaattgacg  10020cttagacaac ttaataacac attgcggacg tttttaatgt actgaattgt ctagacccgg  10080ggatctcatg tttgacagct tatcatcgga tctagtaaca tagatgacac cgcgcgcgat  10140aatttatcct agtttgcgcg ctatattttg ttttctatcg cgtattaaat gtataattgc  10200gggactctaa tcataaaaac ccatctcata aataacgtca tgcattacat gttaattatt  10260acatgcttaa cgtaattcaa cagaaattag atgataatca tcgcaagacc ggcaacagga  10320ttcaatctta agaaacttta ttgccaaatg tttgaacgat ctctgcaggt cgacggatcg  10380agctcccagc ttagcaagag atgttaattt tttcagtaag ctcttacagc ttgttgtaaa  10440cacgcgctaa acggccgtgg cctttgacag tcaccggtga ttcgttggcg gcaataaacg  10500ctgattcacc cggtttaagc tgtaactgct gagaaccttt ccacaacgtt gcatcgcctt  10560cgacgcagaa caaaatggcg gcactctgct ggctaatggt ggtttcttta tcactaaggt  10620catgcagcga gaaggcaaaa tcatccactg gaatcgggaa gtccagttct gcaccttgtt  10680tcaccggctg ggtcaacaac tggttagccg gtttggcttc gaatttcaca ttggcaacca  10740gttccggaat atcaatgtat ttaggcgtca gacccgcacg cagcacgtta tcggagtttg  10800ccatcacttc cagcgccacg ccttgcaggt aagcgtgcgg tgtttcagcg aacaggaaca  10860tcgcttcgcc agggttcaat ttcaccacat tcagcaatag cggggagaac agaccgctgt  10920cttccgggta aaattcagaa attaaacgaa tcgtttgcca cggttcaccc tgctggctat  10980cgagggccga ttttaaaatc gccagcgcgc gggatttttc ttcaccctgc atattcaaca  11040ggctggcgaa cagttcgctt aaacgttcgg catcaggctg ttgtaaaaag tgagcaatcg  11100ccggatgtgc acctgcgacc ggctggagta gggagacaat ctcggaaaat tcacgaaacg  11160cgttcatcgc aaggaaaggc gtcagcgcaa aaaccagctc cggcttgtgg ttaggatctt  11220tatagttacg ctcggcggca tccatcggga tacctgcggc attttctttg gcaaaaccga  11280tttcagaatt gtgtttgttt ggatgaacct gaatggagag tggctgtgct gcgcataata  11340ctttgaacag gaaaggcagt tcgccaaagc gtttggcaac ggcctctccg agcagagtcg  11400atttatcact ctcaatcaca tcacgcagtg aaacgatatc tccggcggca ttctgcactc  11460gtgaactgct tttcggatgt gcgcccatcc acagctcggc catcggctgg ctggacggat  11520tttccatacc ataaagttca gtcaacgcgt tttgctgccc caggcatagt tttgcactga  11580gttaatgagt ttttgcatga tcggggatcc ctgcagaagt aacaccaaac aacagggtga  11640gcatcgacaa aagaaacagt accaagcaaa taaatagcgt atgaaggcag ggctaaaaaa  11700atccacatat agctgctgca tatgccatca tccaagtata tcaagatcaa aataattata  11760aaacatactt gtttattata atagataggt actcaaggtt agagcatatg aatagatgct  11820gcatatgcca tcatgtatat gcatcagtaa aacccacatc aacatgtata cctatcctag  11880atcgatattt ccatccatct taaactcgta actatgaaga tgtatgacac acacatacag  11940ttccaaaatt aataaataca ccaggtagtt tgaaacggcg tctactccga tctagaacga  12000atgaacgacc gcccaaccac accacatcat cacaaccaag cgaacaaaaa gcatctctgt  12060atatgcatca gtaaaacccg catcaacatg tatacctatc ctagatcgat atttccatcc  12120atcatcttca attcgtaact atgaatatgt atggcacaca catacagatc caaaattaat  12180aaatccacca ggtagtttga aacagaattc tactccgatc tagaacgacc gcccaaccag  12240accacatcat cacaaccaag acaaaaaaaa gcatgaaaag atgacccgac aaacaagtgc  12300acggcatata ttgaaataaa ggaaaagggc aaaccaaacc ctatgcaacg aaacaaaaaa  12360aatcatgaaa tcgatcccgt ctgcggaacg gctagagcca tcccaggatt ccccaaagag  12420aaacactggc aagttagcaa tcagaacgtg tctgacgtac aggtcgcatc cgtgtacgaa  12480cgctagcagc acggatctaa cacaaacacg gatctaacac aaacatgaac agaagtagaa  12540ctaccgggcc ctaaccatgg accggaacgc cgatctagag aaggtagaga gggggggggg  12600gggaggacga gcggcgtacc ttgaagcgga ggtgccgacg ggtggatttg ggggagatct  12660ggttgtgtgt gtgtgcgctc cgaacaacac gaggttgggg aaagagggtg tggagggggt  12720gtctatttat tacggcgggc gaggaaggga aagcgaagga gcggtgggaa aggaatcccc  12780cgtagctgcc gtgccgtgag aggaggagga ggccgcctgc cgtgccggct cacgtctgcc  12840gctccgccac gcaatttctg gatgccgaca gcggagcaag tccaacggtg gagcggaact  12900ctcgagaggg gtccagaggc agcgacagag atgccgtgcc gtctgcttcg cttggcccga  12960cgcgacgctg ctggttcgct ggttggtgtc cgttagactc gtcgacggcg tttaacaggc  13020tggcattatc tactcgaaac aagaaaaatg tttccttagt ttttttaatt tcttaaaggg  13080tatttgttta atttttagtc actttatttt attctatttt atatctaaat tattaaataa  13140aaaaactaaa atagagtttt agttttctta atttagaggc taaaatagaa taaaatagat  13200gtactaaaaa aattagtcta taaaaaccat taaccctaaa ccctaaatgg atgtactaat  13260aaaatggatg aagtattata taggtgaagc tatttgcaaa aaaaaaggag aacacatgca  13320cactaaaaag ataaaactgt agagtcctgt tgtcaaaata ctcaattgtc ctttagacca  13380tgtctaactg ttcatttata tgattctcta aaacactgat attattgtag tactatagat  13440tatattattc gtagagtaaa gtttaaatat atgtataaag atagataaac tgcacttcaa  13500acaagtgtga caaaaaaaat atgtggtaat tttttataac ttagacatgc aatgctcatt  13560atctctagag aggggcacga ccgggtcacg ctgcactgca ggcatgcaag cttgcacatg  13620acaacaattg taagaggatg gagaccacaa cgatccaaca atacttctgc gacgggctgt  13680gaagtataga gaagttaaac gcccaaaagc cattgtgttt ggaattttta gttattctat  13740ttttcatgat gtatcttcct ctaacatgcc ttaatttgca aatttggtat aactactgat  13800tgaaaatata tgtatgtaaa aaaatactaa gcatatttgt gaagctaaac atgatgttat  13860ttaagaaaat atgttgttaa cagaataaga ttaatatcga aatggaaaca tctgtaaatt  13920agaatcatct tacaagctaa gagatgttca cgctttgaga aacttcttca gatcatgacc  13980gtagaagtag ctctccaaga ctcaacgaag gctgctgcaa ttccacaaat gcatgacatg  14040catccttgta accgtcgtcg ccgctataaa cacggataac tcaattccct gctccatcaa  14100tttagaaatg agcaagcaag cacccgatcg ctcaccccat atgcaccaat ctgactccca  14160agtctctgtt tcgcattagt accgccagca ctccacctat agctaccaat tgagaccttt  14220ccagcctaag cagatcgatt gatcgttaga gtcaaagagt tggtggtacg ggtactttaa  14280ctaccatgga atgatggggc gtgatgtaga gcggaaagcg cctccctacg cggaacaaca  14340ccctcgccat gccgctcgac tacagcctcc tcctcgtcgg ccgcccacaa cgagggagcc  14400cgtggtcgca gccaccgacc agcatgtctc tgtgtcctcg tccgacctcg acatgtcatg  14460gcaaacagtc ggacgccagc accagactga cgacatgagt ctctgaagag cccgccacct  14520agaaagatcc gagccctgct gctggtagtg gtaaccattt tcgtcgcgct gacgcggaga  14580gcgagaggcc agaaatttat agcgactgac gctgtggcag gcacgctatc ggaggttacg  14640acgtggcggg tcactcgacg cggagttcac aggtcctatc cttgcatcgc tcgggccgga  14700gtttacggga cttatcctta cgacgtgctc taaggttgcg ataacgggcg gaggaaggcg  14760tgtggcgtgc ggagacggtt tatacacgta gtgtgcggga gtgtgtttcg tagacgcggg  14820aaagcacgac gacttacgaa ggttagtgga ggaggaggac acactaaaat caggacgcaa  14880gaaactcttc tattatagta gtagagaaga gattatagga gtgtgggttg attctaaaga  14940aaatcgacgc aggacaaccg tcaaaacggg tgctttaata tagtagatat atatatatag  15000agagagagag aaagtacaaa ggatgcattt gtgtctgcat atgatcggag tattactaac  15060ggccgtcgta agaaggtcca tcatgcgtgg agcgagccca tttggttggt tgtcaggccg  15120cagttaaggc ctccatatat gattgtcgtc gggcccataa cagcatctcc tccaccagtt  15180tattgtaaga ataaattaag tagagatatt tgtcgtcggg cagaagaaac ttggacaaga  15240agaagaagca agctaggcca atttcttgcc ggcaagagga agatagtggc ctctagttta  15300tatatcggcg tgatgatgat gctcctagct agaaatgaga gaagaaaaac ggacgcgtgt  15360ttggtgtgtg tcaatggcgt ccatccttcc atcagatcag aacgatgaaa aagtcaagca  15420cggcatgcat agtatatgta tagcttgttt tagtgtggct ttgctgagac gaatgaaagc  15480aacggcgggc atatttttca gtggctgtag ctttcaggct gaaagagacg tggcatgcaa  15540taattcaggg aattcgtcag ccaattgagg tagctagtca acttgtacat tggtgcgagc  15600aattttccgc actcaggagg gctagtttga gagtccaaaa actataggag attaaagagg  15660ctaaaatcct ctccttattt aattttaaat aagtagtgta tttgtatttt aactcctcca  15720acccttccga ttttatggct ctcaaactag cattcagtct aatgcatgca tgcttggcta  15780gaggtcgtat ggggttgtta atagcatagc tagctacaag ttaaccgggt cttttatatt  15840taataaggac aggcaaagta ttacttacaa ataaagaata aagctaggac gaactcgtgg  15900attattacta aatcgaaatg gacgtaatat tccaggcaag aataattgtt cgatcaggag  15960acaagtgggg cattggaccg gttcttgcaa gcaagagcct atggcgtggt gacacggcgc  16020gttgcccata catcatgcct ccatcgatga tccatcctca cttgctataa aaagaggtgt  16080ccatggtgct caagctcagc caagcaaata agacgacttg tttcattgat tcttcaagag  16140atcgagcttc ttttgcacca caaggtcgag gatccaaca                         16179<210>13<211>15643<212>DNA<213>人工序列    <220><223>人工序列说明:pNOV1441<220><221>misc_feature<222>(14)..(1414)<223>玉米泛在蛋白(Mz Ubi)启动子<220><221>misc_feature<222>(2037)..(5618)<223>编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列<220><221>misc_feature<222>(5821)..(6711)<223>Mz Ubi启动子<220><221>misc_feature<222>(7831)..(9039)<223>PMI<400>13aagctggtac aagcttgcat gcctgcagtg cagcgtgacc cggtcgtgcc cctctctaga  60gataatgagc attgcatgtc taagttataa aaaattacca catatttttt ttgtcacact  120tgtttgaagt gcagtttatc tatctttata catatattta aactttactc tacgaataat  180ataatctata gtactacaat aatatcagtg ttttagagaa tcatataaat gaacagttag  240acatggtcta aaggacaatt gagtattttg acaacaggac tctacagttt tatcttttta  300gtgtgcatgt gttctccttt ttttttgcaa atagcttcac ctatataata cttcatccat  360tttattagta catccattta gggtttaggg ttaatggttt ttatagacta atttttttag  420tacatctatt ttattctatt ttagcctcta aattaagaaa actaaaactc tattttagtt  480tttttattta ataatttaga tataaaatag aataaaataa agtgactaaa aattaaacaa  540atacccttta agaaattaaa aaaactaagg aaacattttt cttgtttcga gtagataatg  600ccagcctgtt aaacgccgtc gacgagtcta acggacacca accagcgaac cagcagcgtc  660gcgtcgggcc aagcgaagca gacggcacgg catctctgtc gctgcctctg gacccctctc  720gagagttccg ctccaccgtt ggacttgctc cgctgtcggc atccagaaat tgcgtggcgg  780agcggcagac gtgagccggc acggcaggcg gcctcctcct cctctcacgg cacggcagct  840acgggggatt cctttcccac cgctccttcg ctttcccttc ctcgcccgcc gtaataaata  900gacaccccct ccacaccctc tttccccaac ctcgtgttgt tcggagcgca cacacacaca  960accagatctc ccccaaatcc acccgtcggc acctccgctt caaggtacgc cgctcgtcct  1020cccccccccc ccctctctac cttctctaga tcggcgttcc ggtccatggt tagggcccgg  1080tagttctact tctgttcatg tttgtgttag atccgtgttt gtgttagatc cgtgctgcta  1140gcgttcgtac acggatgcga cctgtacgtc agacacgttc tgattgctaa cttgccagtg  1200tttctctttg gggaatcctg ggatggctct agccgttccg cagacgggat cgatttcatg  1260attttttttg tttcgttgca tagggtttgg tttgcccttt tcctttattt caatatatgc  1320cgtgcacttg tttgtcgggt catcttttca tgcttttttt tgtcttggtt gtgatgatgt  1380ggtctggttg ggcggtcgtt ctagatcgga gtagaattct gtttcaaact acctggtgga  1440tttattaatt ttggatctgt atgtgtgtgc catacatatt catagttacg aattgaagat  1500gatggatgga aatatcgatc taggataggt atacatgttg atgcgggttt tactgatgca  1560tatacagaga tgctttttgt tcgcttggtt gtgatgatgt ggtgtggttg ggcggtcgtt  1620cattcgttct agatcggagt agaatactgt ttcaaactac ctggtgtatt tattaatttt  1680ggaactgtat gtgtgtgtca tacatcttca tagttacgag tttaagatgg atggaaatat  1740cgatctagga taggtataca tgttgatgtg ggttttactg atgcatatac atgatggcat  1800atgcagcatc tattcatatg ctctaacctt gagtacctat ctattataat aaacaagtat  1860gttttataat tattttgatc ttgatatact tggatgatgg catatgcagc agctatatgt  1920ggattttttt agccctgcct tcatacgcta tttatttgct tggtactgtt tcttttgtcg  1980atgctcaccc tgttgtttgg tgttacttct gcaggtcgac tctagaggat ccaacaatgg  2040acaacaaccc caacatcaac gagtgcatcc cctacaactg cctgagcaac cccgaggtgg  2100aggtgctggg cggcgagcgc atcgagaccg gctacacccc catcgacatc agcctgagcc  2160tgacccagtt cctgctgagc gagttcgtgc ccggcgccgg cttcgtgctg ggcctggtgg  2220acatcatctg gggcatcttc ggccccagcc agtgggacgc cttcctggtg cagatcgagc  2280agttgataaa ccaacgcata gaggaattcg cccgcaacca ggccatcagc cgcctggagg  2340gcctgagcaa cctgtaccaa atctacgccg agagcttccg cgagtgggag gccgacccca  2400ccaaccccgc cctgcgcgag gagatgcgca tccagttcaa cgacatgaac agcgccctga  2460ccaccgccat ccccctgttc gccgtgcaga actaccaggt gcccctgctg agcgtgtacg  2520tgcaggccgc caacctgcac ctgagcgtgc tgcgcgacgt cagcgtgttc ggccagcgct  2580ggggcttcga cgccgccacc atcaacagcc gctacaacga cctgacccgc ctgatcggca  2640actacaccga ccacgccgtg cgctggtaca acaccggcct ggagcgcgtg tggggtcccg  2700acagccgcga ctggatcagg tacaaccagt tccgccgcga gctgaccctg accgtgctgg  2760acatcgtgag cctgttcccc aactacgaca gccgcaccta ccccatccgc accgtgagcc  2820agctgacccg cgagatttac accaaccccg tgctggagaa cttcgacggc agcttccgcg  2880gcagcgccca gggcatcgag ggcagcatcc gcagccccca cctgatggac atcctgaaca  2940gcatcaccat ctacaccgac gcccaccgcg gcgagtacta ctggagcggc caccagatca  3000tggccagccc cgtcggcttc agcggccccg agttcacctt ccccctgtac ggcaccatgg  3060gcaacgctgc acctcagcag cgcatcgtgg cacagctggg ccagggagtg taccgcaccc  3120tgagcagcac cctgtaccgt cgacctttca acatcggcat caacaaccag cagctgagcg  3180tgctggacgg caccgagttc gcctacggca ccagcagcaa cctgcccagc gccgtgtacc  3240gcaagagcgg caccgtggac agcctggacg agatcccccc tcagaacaac aacgtgccac  3300ctcgacaggg cttcagccac cgtctgagcc acgtgagcat gttccgcagt ggcttcagca  3360acagcagcgt gagcatcatc cgtgcaccca tgttcagctg gattcaccgc agcgccaccc  3420tgaccaacac catcgacccc gagcgcatca accagatccc cctggtgaag ggcttccggg  3480tgtggggcgg caccagcgtg atcaccggcc ccggcttcac cggaggcgac atcctgcgca  3540gaaacacctt cggcgacttc gtgagcctgc aggtgaacat caacagcccc atcacccagc  3600gttaccgcct gcgcttccgc tacgccagca gccgcgacgc ccgtgtgatc gtgctgactg  3660gcgccgctag caccggtgtg ggcggtcagg tgagcgtgaa catgcccctg cagaagacta  3720tggagatcgg cgagaacctg actagtcgca ccttccgcta caccgacttc agcaacccct  3780tcagcttccg cgccaacccc gacatcatcg gcatcagcga gcagcccctg ttcggtgccg  3840gcagcatcag cagcggcgag ctgtacatcg acaagatcga gatcatcctg gccgacgcca  3900ccttcgaggc cgagagcgac ctggagcgcg cccagaaggc cgtgaacgcc ctgttcacca  3960gcagcaacca gatcggcctg aagaccgacg tgaccgacta ccacatcgac caggtgagca  4020acctggtgga ctgcttaagc gacgagttct gcctggacga gaagaaggag ctgagcgaga  4080aggtgaagca cgccaagcgc ctgagcgacg agcgcaacct gctgcaggac cccaacttcc  4140gcggcatcaa ccgccagctg gaccgcggct ggcgaggcag caccgatatc accatccagg  4200gcggcgacga cgtgttcaag gagaactacg tgaccctgca gggcaccttc gacgagtgct  4260accccaccta cctgtaccag ccgatcgacg agagcaagct gaaggcctac acccgctacc  4320agctgcgcgg ctacatcgag gacagccagg acctggaaat ctacctgatc cgctacaacg  4380cgaagcacga gaccgtgaac gtgcccggca ccggcagcct gtggcccccg agcgccccca  4440gccccatcgg caagtgcggg gagccgaatc gatgcgctcc gcacctggag tggaacccgg  4500acctagactg cagctgcagg gacggggaga agtgcgccca ccacagccac cacttcagcc  4560tggacatcga cgtgggctgc accgacctga acgaggacct gggcgtgtgg gtgatcttca  4620agatcaagac ccaggacggc cacgcccgcc tgggcaatct agagttcctg gaggagaagc  4680ccctggtggg cgaggccctg gcccgcgtga agcgtgctga gaagaagtgg cgcgacaagc  4740gcgagaagct ggagtgggag accaacatcg tgtacaagga ggccaaggag agcgtggacg  4800ccctgttcgt gaacagccag tacgaccgcc tgcaggccga caccaacatc gccatgatcc  4860acgccgccga caagcgcgtg cacagcattc gcgaggccta cctgcccgag ctgagcgtga  4920tccccggtgt gaacgccgcc atcttcgagg aactcgaggg ccgcatcttc accgccttca  4980gcctgtacga cgcccgcaac gtgatcaaga acggcgactt caacaacggc ctgagctgct  5040ggaacgtgaa gggccacgtg gacgtggagg agcagaacaa ccaccgcagc gtgctggtgg  5100tgcccgagtg ggaggccgag gtgagccagg aggtgcgcgt gtgccccggc cgcggctaca  5160tcctgcgcgt gaccgcctac aaggagggct acggcgaggg ctgcgtgacc atccacgaga  5220tcgagaacaa caccgacgag ctcaagttca gcaactgcgt ggaggaggag gtttacccca  5280acaacaccgt gacctgcaac gactacaccg cgacccagga ggagtacgaa ggcacctaca  5340cctctcgcaa caggggttac gacggcgcct acgagtccaa cagctccgtg ccagctgact  5400acgccagcgc ccacgaggag aaagcctaca ccgacggtag acgcgacaac ccatgtgaga  5460gcaacagagg ctacggcgac tacacccccc tgcccgctgg atacgtgacc aaggagctgg  5520agtacttccc cgagaccgac aaggtgtgga tcgagattgg cgagaccgag ggcaccttca  5580tcgtggacag cgtggagctg ctgctgatgg aggagtagta gatctgttct gcacaaagtg  5640gagtagtcag tcatcgatca ggaaccagac accagacttt tattcataca gtgaagtgaa  5700gtgaagtgca gtgcagtgag ttgctggttt ttgtaccact tagtatgtat ttgtatttgt  5760aaaatacttc tatcaataaa atttctaatt cctaaaacca aaatccagtg ggtaccagct  5820tgcatgcctg cagtgcagcg tgacccggtc gtgcccctct ctagagataa tgagcattgc  5880atgtctaagt tataaaaaat taccacatat tttttttgtc acacttgttt gaagtgcagt  5940ttatctatct ttatacatat atttaaactt tactctacga ataatataat ctatagtact  6000acaataatat cagtgtttta gagaatcata taaatgaaca gttagacatg gtctaaagga  6060caattgagta ttttgacaac aggactctac agttttatct ttttagtgtg catgtgttct  6120cctttttttt tgcaaatagc ttcacctata taatacttca tccattttat tagtacatcc  6180atttagggtt tagggttaat ggtttttata gactaatttt tttagtacat ctattttatt  6240ctattttagc ctctaaatta agaaaactaa aactctattt tagttttttt atttaataat  6300ttagatataa aatagaataa aataaagtga ctaaaaatta aacaaatacc ctttaagaaa  6360ttaaaaaaac taaggaaaca tttttcttgt ttcgagtaga taatgccagc ctgttaaacg  6420ccgtcgacga gtctaacgga caccaaccag cgaaccagca gcgtcgcgtc gggccaagcg  6480aagcagacgg cacggcatct ctgtcgctgc ctctggaccc ctctcgagag ttccgctcca  6540ccgttggact tgctccgctg tcggcatcca gaaattgcgt ggcggagcgg cagacgtgag  6600ccggcacggc aggcggcctc ctcctcctct cacggcacgg cagctacggg ggattccttt  6660cccaccgctc cttcgctttc ccttcctcgc ccgccgtaat aaatagacac cccctccaca  6720ccctctttcc ccaacctcgt gttgttcgga gcgcacacac acacaaccag atctccccca  6780aatccacccg tcggcacctc cgcttcaagg tacgccgctc gtcctccccc cccccccctc  6840tctaccttct ctagatcggc gttccggtcc atggttaggg cccggtagtt ctacttctgt  6900tcatgtttgt gttagatccg tgtttgtgtt agatccgtgc tgctagcgtt cgtacacgga  6960tgcgacctgt acgtcagaca cgttctgatt gctaacttgc cagtgtttct ctttggggaa  7020tcctgggatg gctctagccg ttccgcagac gggatcgatt tcatgatttt ttttgtttcg  7080ttgcataggg tttggtttgc ccttttcctt tatttcaata tatgccgtgc acttgtttgt  7140cgggtcatct tttcatgctt ttttttgtct tggttgtgat gatgtggtct ggttgggcgg  7200tcgttctaga tcggagtaga attctgtttc aaactacctg gtggatttat taattttgga  7260tctgtatgtg tgtgccatac atattcatag ttacgaattg aagatgatgg atggaaatat  7320cgatctagga taggtataca tgttgatgcg ggttttactg atgcatatac agagatgctt  7380tttgttcgct tggttgtgat gatgtggtgt ggttgggcgg tcgttcattc gttctagatc  7440ggagtagacg ccgtttcaaa ctacctggtg tatttattaa ttttggaact gtatgtgtgt  7500gtcatacatc ttcatagtta cgagtttaag atggatggaa atatcgatct aggataggta  7560tacatgttga tgtgggtttt actgatgcat atacatgatg gcatatgcag catctattca  7620tatgctctaa ccttgagtac ctatctatta taataaacaa gtatgtttta taattatttt  7680gatcttgata tacttggatg atggcatatg cagcagctat atgtggattt ttttagccct  7740gccttcatac gctatttatt tgcttggtac tgtttctttt gtcgatgctc accctgttgt  7800ttggtgttac ttctgcaggg atccccgatc atgcaaaaac tcattaactc agtgcaaaac  7860tatgcctggg gcagcaaaac gcgttgactg aactttatgg tatggaaaat ccgtccagcc  7920agccgatggc cgagctgtgg atgggcgcac atccgaaaag cagttcacga gtgcagaatg  7980ccgccggaga tatcgtttca ctgcgtgatg tgattgagag tgataaatcg actctgctcg  8040gagaggccgt tgccaaacgc tttggcgaac tgcctttcct gttcaaagta ttatgcgcag  8100cacagccact ctccattcag gttcatccaa acaaacacaa ttctgaaatc ggttttgcca  8160aagaaaatgc cgcaggtatc ccgatggatg ccgccgagcg taactataaa gatcctaacc  8220acaagccgga gctggttttt gcgctgacgc ctttccttgc gatgaacgcg tttcgtgaat  8280tttccgagat tgtctcccta ctccagccgg tcgcaggtgc acatccggcg attgctcact  8340ttttacaaca gcctgatgcc gaacgtttaa gcgaactgtt cgccagcctg ttgaatatgc  8400agggtgaaga aaaatcccgc gcgctggcga ttttaaaatc ggccctcgat agccagcagg  8460gtgaaccgtg gcaaacgatt cgtttaattt ctgaatttta cccggaagac agcggtctgt  8520tctccccgct attgctgaat gtggtgaaat tgaaccctgg cgaagcgatg ttcctgttcg  8580ctgaaacacc gcacgcttac ctgcaaggcg tggcgctgga agtgatggca aactccgata  8640acgtgctgcg tgcgggtctg acgcctaaat acattgatat tccggaactg gttgccaatg  8700tgaaattcga agccaaaccg gctaaccagt tgttgaccca gccggtgaaa caaggtgcag  8760aactggactt cccgattcca gtggatgatt ttgccttctc gctgcatgac cttagtgata  8820aagaaaccac cattagccag cagagtgccg ccattttgtt ctgcgtcgaa ggcgatgcaa  8880cgttgtggaa aggttctcag cagttacagc ttaaaccggg tgaatcagcg tttattgccg  8940ccaacgaatc accggtgact gtcaaaggcc acggccgttt agcgcgtgtt tacaacaagc  9000tgtaagagct tactgaaaaa attaacatct cttgctaagc tgggagctcg atccgtcgac  9060ctgcagagat cgttcaaaca tttggcaata aagtttctta agattgaatc ctgttgccgg  9120tcttgcgatg attatcatct aatttctgtt gaattacgtt aagcatgtaa taattaacat  9180gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc aattatacat  9240ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat cgcgcgcggt  9300gtcatctatg ttactagatc cgatgataag ctgtcaaaca tgagatcccc gggtctagac  9360aattcagtac attaaaaacg tccgcaatgt gttattaagt tgtctaagcg tcaatttgtt  9420tacaccacaa tatatcctgc caccagccag ccaacagctc cccgaccggc agctcggcac  9480aaaatcacca ctcgatacag gcagcccatc agtccgggac ggcgtcagcg ggagagccgt  9540tgtaaggcgg cagactttgc tcatgttacc gatgctattc ggaagaacgg caactaagct  9600gccgggtttg aaacacggat gatctcgcgg agggtagcat gttgattgta acgatgacag  9660agcgttgctg cctgtgatca aatatcatct ccctcgcaga gatccgaatt atcagccttc  9720ttattcattt ctcgcttaac cgtgacaggc tgtcgatctt gagaactatg ccgacataat  9780aggaaatcgc tggataaagc cgctgaggaa gctgagtggc gctatttctt tagaagtgaa  9840cgttgacgat cgtcgaccgt accccgatga attaattcgg acgtacgttc tgaacacagc  9900tggatactta cttgggcgat tgtcatacat gacatcaaca atgtacccgt ttgtgtaacc  9960gtctcttgga ggttcgtatg acactagtgg ttcccctcag cttgcgacta gatgttgagg  10020cctaacattt tattagagag caggctagtt gcttagatac atgatcttca ggccgttatc  10080tgtcagggca agcgaaaatt ggccatttat gacgaccaat gccccgcaga agctcccatc  10140tttgccgcca tagacgccgc gccccccttt tggggtgtag aacatccttt tgccagatgt  10200ggaaaagaag ttcgttgtcc cattgttggc aatgacgtag tagccggcga aagtgcgaga  10260cccatttgcg ctatatataa gcctacgatt tccgttgcga ctattgtcgt aattggatga  10320actattatcg tagttgctct cagagttgtc gtaatttgat ggactattgt cgtaattgct  10380tatggagttg tcgtagttgc ttggagaaat gtcgtagttg gatggggagt agtcataggg  10440aagacgagct tcatccacta aaacaattgg caggtcagca agtgcctgcc ccgatgccat  10500cgcaagtacg aggcttagaa ccaccttcaa cagatcgcgc atagtcttcc ccagctctct  10560aacgcttgag ttaagccgcg ccgcgaagcg gcgtcggctt gaacgaattg ttagacatta  10620tttgccgact accttggtga tctcgccttt cacgtagtga acaaattctt ccaactgatc  10680tgcgcgcgag gccaagcgat cttcttgtcc aagataagcc tgcctagctt caagtatgac  10740gggctgatac tgggccggca ggcgctccat tgcccagtcg gcagcgacat ccttcggcgc  10800gattttgccg gttactgcgc tgtaccaaat gcgggacaac gtaagcacta catttcgctc  10860atcgccagcc cagtcgggcg gcgagttcca tagcgttaag gtttcattta gcgcctcaaa  10920tagatcctgt tcaggaaccg gatcaaagag ttcctccgcc gctggaccta ccaaggcaac  10980gctatgttct cttgcttttg tcagcaagat agccagatca atgtcgatcg tggctggctc  11040gaagatacct gcaagaatgt cattgcgctg ccattctcca aattgcagtt cgcgcttagc  11100tggataacgc cacggaatga tgtcgtcgtg cacaacaatg gtgacttcta cagcgcggag  11160aatctcgctc tctccagggg aagccgaagt ttccaaaagg tcgttgatca aagctcgccg  11220cgttgtttca tcaagcctta cggtcaccgt aaccagcaaa tcaatatcac tgtgtggctt  11280caggccgcca tccactgcgg agccgtacaa atgtacggcc agcaacgtcg gttcgagatg  11340gcgctcgatg acgccaacta cctctgatag ttgagtcgat acttcggcga tcaccgcttc  11400cctcatgatg tttaactcct gaattaagcc gcgccgcgaa gcggtgtcgg cttgaatgaa  11460ttgttaggcg tcatcctgtg ctcccgagaa ccagtaccag tacatcgctg tttcgttcga  11520gacttgaggt ctagttttat acgtgaacag gtcaatgccg ccgagagtaa agccacattt  11580tgcgtacaaa ttgcaggcag gtacattgtt cgtttgtgtc tctaatcgta tgccaaggag  11640ctgtctgctt agtgcccact ttttcgcaaa ttcgatgaga ctgtgcgcga ctcctttgcc  11700tcggtgcgtg tgcgacacaa caatgtgttc gatagaggct agatcgttcc atgttgagtt  11760gagttcaatc ttcccgacaa gctcttggtc gatgaatgcg ccatagcaag cagagtcttc  11820atcagagtca tcatccgaga tgtaatcctt ccggtagggg ctcacacttc tggtagatag  11880ttcaaagcct tggtcggata ggtgcacatc gaacacttca cgaacaatga aatggttctc  11940agcatccaat gtttccgcca cctgctcagg gatcaccgaa atcttcatat gacgcctaac  12000gcctggcaca gcggatcgca aacctggcgc ggcttttggc acaaaaggcg tgacaggttt  12060gcgaatccgt tgctgccact tgttaaccct tttgccagat ttggtaacta taatttatgt  12120tagaggcgaa gtcttgggta aaaactggcc taaaattgct ggggatttca ggaaagtaaa  12180catcaccttc cggctcgatg tctattgtag atatatgtag tgtatctact tgatcggggg  12240atctgctgcc tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg  12300gagacggtca cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg  12360tcagcgggtg ttggcgggtg tcggggcgca gccatgaccc agtcacgtag cgatagcgga  12420gtgtatactg gcttaactat gcggcatcag agcagattgt actgagagtg caccatatgc  12480ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt  12540cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact  12600caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag  12660caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata  12720ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc  12780cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg  12840ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc  12900tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg  12960gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc  13020ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga  13080ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg  13140gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa  13200aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg  13260tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt  13320ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat  13380tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct  13440aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta  13500tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa  13560ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac  13620gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa  13680gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag  13740taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctgca gggggggggg  13800ggggggggga cttccattgt tcattccacg gacaaaaaca gagaaaggaa acgacagagg  13860ccaaaaagcc tcgctttcag cacctgtcgt ttcctttctt ttcagagggt attttaaata  13920aaaacattaa gttatgacga agaagaacgg aaacgcctta aaccggaaaa ttttcataaa  13980tagcgaaaac ccgcgaggtc gccgccccgt aacctgtcgg atcaccggaa aggacccgta  14040aagtgataat gattatcatc tacatatcac aacgtgcgtg gaggccatca aaccacgtca  14100aataatcaat tatgacgcag gtatcgtatt aattgatctg catcaactta acgtaaaaac  14160aacttcagac aatacaaatc agcgacactg aatacggggc aacctcatgt cccccccccc  14220cccccccctg caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc  14280ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc  14340tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt  14400atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact  14460ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc  14520ccggcgtcaa cacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt  14580ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg  14640atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct  14700gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa  14760tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt  14820ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc  14880acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat gacattaacc  14940tataaaaata ggcgtatcac gaggcccttt cgtcttcaag aattggtcga cgatcttgct  15000gcgttcggat attttcgtgg agttcccgcc acagacccgg attgaaggcg agatccagca  15060actcgcgcca gatcatcctg tgacggaact ttggcgcgtg atgactggcc aggacgtcgg  15120ccgaaagagc gacaagcaga tcacgctttt cgacagcgtc ggatttgcga tcgaggattt  15180ttcggcgctg cgctacgtcc gcgaccgcgt tgagggatca agccacagca gcccactcga  15240ccttctagcc gacccagacg agccaaggga tctttttgga atgctgctcc gtcgtcaggc  15300tttccgacgt ttgggtggtt gaacagaagt cattatcgta cggaatgcca agcactcccg  15360aggggaaccc tgtggttggc atgcacatac aaatggacga acggataaac cttttcacgc  15420ccttttaaat atccgttatt ctaataaacg ctcttttctc ttaggtttac ccgccaatat  15480atcctgtcaa acactgatag tttaaactga aggcgggaaa cgacaatctg atcatgagcg  15540gagaattaag ggagtcacgt tatgaccccc gccgatgacg cgggacaagc cgttttacgt  15600ttggaactga cagaaccgca acgttgaagg agccactcag ccc                    15643<210>14<211>15503<212>DNA<213>人工序列<220><223>人工序列说明:pNOV1305<220><221>misc_feature<222>(1)..(3582)<223>编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列<220><221>misc_feature<222>(3790)..(5771)<223>Zm Ubi启动子<220><221>misc_feature<222>(5868)..(6971)<223>PMI<220><221>misc_feature<222>(12934)..(15494)<223>MTL启动子<400>14atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag  60gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg  120agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg  180gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc  240gagcagttga taaaccaacg catagaggaa ttcgcccgca accaggccat cagccgcctg  300gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac  360cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc  420ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg  480tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag  540cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc  600ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt  660cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg  720ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg  780agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc  840cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg  900aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag  960atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc  1020atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc  1080accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg  1140agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg  1200taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg  1260ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc  1320agcaacagca gcgtgagcat catccgtgca cccatgttca gctggattca ccgcagcgcc  1380accctgacca acaccatcga ccccgagcgc atcaaccaga tccccctggt gaagggcttc  1440cgggtgtggg gcggcaccag cgtgatcacc ggccccggct tcaccggagg cgacatcctg  1500cgcagaaaca ccttcggcga cttcgtgagc ctgcaggtga acatcaacag ccccatcacc  1560cagcgttacc gcctgcgctt ccgctacgcc agcagccgcg acgcccgtgt gatcgtgctg  1620actggcgccg ctagcaccgg tgtgggcggt caggtgagcg tgaacatgcc cctgcagaag  1680actatggaga tcggcgagaa cctgactagt cgcaccttcc gctacaccga cttcagcaac  1740cccttcagct tccgcgccaa ccccgacatc atcggcatca gcgagcagcc cctgttcggt  1800gccggcagca tcagcagcgg cgagctgtac atcgacaaga tcgagatcat cctggccgac  1860gccaccttcg aggccgagag cgacctggag cgcgcccaga aggccgtgaa cgccctgttc  1920accagcagca accagatcgg cctgaagacc gacgtgaccg actaccacat cgaccaggtg  1980agcaacctgg tggactgctt aagcgacgag ttctgcctgg acgagaagaa ggagctgagc  2040gagaaggtga agcacgccaa gcgcctgagc gacgagcgca acctgctgca ggaccccaac  2100ttccgcggca tcaaccgcca gctggaccgc ggctggcgag gcagcaccga tatcaccatc  2160cagggcggcg acgacgtgtt caaggagaac tacgtgaccc tgcagggcac cttcgacgag  2220tgctacccca cctacctgta ccagccgatc gacgagagca agctgaaggc ctacacccgc  2280taccagctgc gcggctacat cgaggacagc caggacctgg aaatctacct gatccgctac  2340aacgcgaagc acgagaccgt gaacgtgccc ggcaccggca gcctgtggcc cctgagcgcc  2400cccagcccca tcggcaagtg cggggagccg aatcgatgcg ctccgcacct ggagtggaac  2460ccggacctag actgcagctg cagggacggg gagaagtgcg cccaccacag ccaccacttc  2520agcctggaca tcgacgtggg ctgcaccgac ctgaacgagg acctgggcgt gtgggtgatc  2580ttcaagatca agacccagga cggccacgcc cgcctgggca atctagagtt cctggaggag  2640aagcccctgg tgggcgaggc cctggcccgc gtgaagcgtg ctgagaagaa gtggcgcgac  2700aagcgcgaga agctggagtg ggagaccaac atcgtgtaca aggaggccaa ggagagcgtg  2760gacgccctgt tcgtgaacag ccagtacgac cgcctgcagg ccgacaccaa catcgccatg  2820atccacgccg ccgacaagcg cgtgcacagc attcgcgagg cctacctgcc cgagctgagc  2880gtgatccccg gtgtgaacgc cgccatcttc gaggaactcg agggccgcat cttcaccgcc  2940ttcagcctgt acgacgcccg caacgtgatc aagaacggcg acttcaacaa cggcctgagc  3000tgctggaacg tgaagggcca cgtggacgtg gaggagcaga acaaccaccg cagcgtgctg  3060gtggtgcccg agtgggaggc cgaggtgagc caggaggtgc gcgtgtgccc cggccgcggc  3120tacatcctgc gcgtgaccgc ctacaaggag ggctacggcg agggctgcgt gaccatccac  3180gagatcgaga acaacaccga cgagctcaag ttcagcaact gcgtggagga ggaggtttac  3240cccaacaaca ccgtgacctg caacgactac accgcgaccc aggaggagta cgaaggcacc  3300tacacctctc gcaacagggg ttacgacggc gcctacgagt ccaacagctc cgtgccagct  3360gactacgcca gcgcctacga ggagaaagcc tacaccgacg gtagacgcga caacccatgt  3420gagagcaaca gaggctacgg cgactacacc cccctgcccg ctggatacgt gaccaaggag  3480ctggagtact tccccgagac cgacaaggtg tggatcgaga ttggcgagac cgagggcacc  3540ttcatcgtgg acagcgtgga gctgctgctg atggaggagt agtagatctg ttctgcacaa  3600agtggagtag tcagtcatcg atcaggaacc agacaccaga cttttattca tacagtgaag  3660tgaagtgaag tgcagtgcag tgagttgctg gtttttgtac aacttagtat gtatttgtat  3720ttgtaaaata cttctatcaa taaaatttct aattcctaaa accaaaatcc aggggtacca  3780gcttgcatgc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat  3840tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc  3900agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt  3960actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa  4020ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt  4080tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca  4140tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta catctatttt  4200attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat  4260aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag  4320aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa  4380acgccgtcga cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa  4440gcgaagcaga cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct  4500ccaccgttgg acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt  4560gagccggcac ggcaggcggc ctcctcctcc tctcacggca ccggcagcta cgggggattc  4620ctttcccacc gctccttcgc tttcccttcc tcgcccgccg taataaatag acaccccctc  4680cacaccctct ttccccaacc tcgtgttgtt cggagcgcac acacacacaa ccagatctcc  4740cccaaatcca cccgtcggca cctccgcttc aaggtacgcc gctcgtcctc cccccccccc  4800cctctctacc ttctctagat cggcgttccg gtccatggtt agggcccggt agttctactt  4860ctgttcatgt ttgtgttaga tccgtgtttg tgttagatcc gtgctgctag cgttcgtaca  4920cggatgcgac ctgtacgtca gacacgttct gattgctaac ttgccagtgt ttctctttgg  4980ggaatcctgg gatggctcta gccgttccgc agacgggatc gatttcatga ttttttttgt  5040ttcgttgcat agggtttggt ttgccctttt cctttatttc aatatatgcc gtgcacttgt  5100ttgtcgggtc atcttttcat gctttttttt gtcttggttg tgatgatgtg gtctggttgg  5160gcggtcgttc tagatcggag tagaattctg tttcaaacta cctggtggat ttattaattt  5220tggatctgta tgtgtgtgcc atacatattc atagttacga attgaagatg atggatggaa  5280atatcgatct aggataggta tacatgttga tgcgggtttt actgatgcat atacagagat  5340gctttttgtt cgcttggttg tgatgatgtg gtgtggttgg gcggtcgttc attcgttcta  5400gatcggagta gaatactgtt tcaaactacc tggtgtattt attaattttg gaactgtatg  5460tgtgtgtcat acatcttcat agttacgagt ttaagatgga tggaaatatc gatctaggat  5520aggtatacat gttgatgtgg gttttactga tgcatataca tgatggcata tgcagcatct  5580attcatatgc tctaaccttg agtacctatc tattataata aacaagtatg ttttataatt  5640attttgatct tgatatactt ggatgatggc atatgcagca gctatatgtg gattttttta  5700gccctgcctt catacgctat ttatttgctt ggtactgttt cttttgtcga tgctcaccct  5760gttgtttggt gttacttctg cagggatccc cgatcatgca aaaactcatt aactcagtgc  5820aaaactatgc ctggggcagc aaaacggcgt tgactgaact ttatggtatg gaaaatccgt  5880ccagccagcc gatggccgag ctgtggatgg gcgcacatcc gaaaagcagt tcacgagtgc  5940agaatgccgc cggagatatc gtttcactgc gtgatgtgat tgagagtgat aaatcgactc  6000tgctcggaga ggccgttgcc aaacgctttg gcgaactgcc tttcctgttc aaagtattat  6060gcgcagcaca gccactctcc attcaggttc atccaaacaa acacaattct gaaatcggtt  6120ttgccaaaga aaatgccgca ggtatcccga tggatgccgc cgagcgtaac tataaagatc  6180ctaaccacaa gccggagctg gtttttgcgc tgacgccttt ccttgcgatg aacgcgtttc  6240gtgaattttc cgagattgtc tccctactcc agccggtcgc aggtgcacat ccggcgattg  6300ctcacttttt acaacagcct gatgccgaac gtttaagcga actgttcgcc agcctgttga  6360atatgcaggg tgaagaaaaa tcccgcgcgc tggcgatttt aaaatcggcc ctcgatagcc  6420agcagggtga accgtggcaa acgattcgtt taatttctga attttacccg gaagacagcg  6480gtctgttctc cccgctattg ctgaatgtgg tgaaattgaa ccctggcgaa gcgatgttcc  6540tgttcgctga aacaccgcac gcttacctgc aaggcgtggc gctggaagtg atggcaaact  6600ccgataacgt gctgcgtgcg ggtctgacgc ctaaatacat tgatattccg gaactggttg  6660ccaatgtgaa attcgaagcc aaaccggcta accagttgtt gacccagccg gtgaaacaag  6720gtgcagaact ggacttcccg attccagtgg atgattttgc cttctcgctg catgacctta  6780gtgataaaga aaccaccatt agccagcaga gtgccgccat tttgttctgc gtcgaaggcg  6840atgcaacgtt gtggaaaggt tctcagcagt tacagcttaa accgggtgaa tcagcgttta  6900ttgccgccaa cgaatcaccg gtgactgtca aaggccacgg ccgtttagcg cgtgtttaca  6960acaagctgta agagcttact gaaaaaatta acatctcttg ctaagctggg agctcgatcc  7020gtcgacctgc agatcgttca aacatttggc aataaagttt cttaagattg aatcctgttg  7080ccggtcttgc gatgattatc atataatttc tgttgaatta cgttaagcat gtaataatta  7140acatgtaatg catgacgtta tttatgagat gggtttttat gattagagtc ccgcaattat  7200acatttaata cgcgatagaa aacaaaatat agcgcgcaaa ctaggataaa ttatcgcgcg  7260cggtgtcatc tatgttacta gatctgctag ccctgcagga aatttaccgg tgcccgggcg  7320gccagcatgg ccgtatccgc aatgtgttat taagttgtct aagcgtcaat ttgtttacac  7380cacaatatat cctgccacca gccagccaac agctccccga ccggcagctc ggcacaaaat  7440caccactcga tacaggcagc ccatcagaat taattctcat gtttgacagc ttatcatcga  7500ctgcacggtg caccaatgct tctggcgtca ggcagccatc ggaagctgtg gtatggctgt  7560gcaggtcgta aatcactgca taattcgtgt cgctcaaggc gcactcccgt tctggataat  7620gttttttgcg ccgacatcat aacggttctg gcaaatattc tgaaatgagc tgttgacaat  7680taatcatccg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc acacaggaaa  7740cagaccatga gggaagcgtt gatcgccgaa gtatcgactc aactatcaga ggtagttggc  7800gtcatcgagc gccatctcga accgacgttg ctggccgtac atttgtacgg ctccgcagtg  7860gatggcggcc tgaagccaca cagtgatatt gatttgctgg ttacggtgac cgtaaggctt  7920gatgaaacaa cgcggcgagc tttgatcaac gaccttttgg aaacttcggc ttcccctgga  7980gagagcgaga ttctccgcgc tgtagaagtc accattgttg tgcacgacga catcattccg  8040tggcgttatc cagctaagcg cgaactgcaa tttggagaat ggcagcgcaa tgacattctt  8100gcaggtatct tcgagccagc cacgatcgac attgatctgg ctatcttgct gacaaaagca  8160agagaacata gcgttgcctt ggtaggtcca gcggcggagg aactctttga tccggttcct  8220gaacaggatc tatttgaggc gctaaatgaa accttaacgc tatggaactc gccgcccgac  8280tgggctggcg atgagcgaaa tgtagtgctt acgttgtccc gcatttggta cagcgcagta  8340accggcaaaa tcgcgccgaa ggatgtcgct gccgactggg caatggagcg cctgccggcc  8400cagtatcagc ccgtcatact tgaagctagg caggcttatc ttggacaaga agatcgcttg  8460gcctcgcgcg cagatcagtt ggaagaattt gttcactacg tgaaaggcga gatcaccaaa  8520gtagtcggca aataaagctc tagtggatct ccgtaccccc gggggatctg gctcgcggcg  8580gacgcacgac gccggggcga gaccataggc gatctcctaa atcaatagta gctgtaacct  8640cgaagcgttt cacttgtaac aacgattgag aatttttgtc ataaaattga aatacttggt  8700tcgcattttt gtcatccgcg gtcagccgca attctgacga actgcccatt tagctggaga  8760tgattgtaca tccttcacgt gaaaatttct caagcgctgt gaacaagggt tcagatttta  8820gattgaaagg tgagccgttg aaacacgttc ttcttgtcga tgacgacgtc gctatgcggc  8880atcttattat tgaatacctt acgatccacg ccttcaaagt gaccgcggta gccgacagca  8940cccagttcac aagagtactc tcttccgcga cggtcgatgt cgtggttgtt gatctaaatt  9000taggtcgtga agatgggctc gagatcgttc gtaatctggc ggcaaagtct gatattccaa  9060tcataattat cagtggcgac cgccttgagg agacggataa agttgttgca ctcgagctag  9120gagcaagtga ttttatcgct aagccgttca gtatcagaga gtttctagca cgcattcggg  9180ttgccttgcg cgtgcgcccc aacgttgtcc gctccaaaga ccgacggtct ttttgtttta  9240ctgactggac acttaatctc aggcaacgtc gcttgatgtc cgaagctggc ggtgaggtga  9300aacttacggc aggtgagttc aatcttctcc tcgcgttttt agagaaaccc cgcgacgttc  9360tatcgcgcga gcaacttctc attgccagtc gagtacgcga cgaggaggtt tatgacagga  9420gtatagatgt tctcattttg aggctgcgcc gcaaacttga ggcagatccg tcaagccctc  9480aactgataaa aacagcaaga ggtgccggtt atttctttga cgcggacgtg caggtttcgc  9540acggggggac gatggcagcc tgagccaatt cccagatccc cgaggaatcg gcgtgagcgg  9600tcgcaaacca tccggcccgg tacaaatcgg cgcggcgctg ggtgatgacc tggtggagaa  9660gttgaaggcc gcgcaggccg cccagcggca acgcatcgag gcagaagcac gccccggtga  9720atcgtggcaa gcggccgctg atcgaatccg caaagaatcc cggcaaccgc cggcagccgg  9780tgcgccgtcg attaggaagc cgcccaaggg cgacgagcaa ccagattttt tcgttccgat  9840gctctatgac gtgggcaccc gcgatagtcg cagcatcatg gacgtggccg ttttccgtct  9900gtcgaagcgt gaccgacgag ctggcgaggt gatccgctac gagcttccag acgggcacgt  9960agaggtttcc gcagggccgg ccggcatggc cagtgtgtgg gattacgacc tggtactgat  10020ggcggtttcc catctaaccg aatccatgaa ccgataccgg gaagggaagg gagacaagcc  10080cggccgcgtg ttccgtccac acgttgcgga cgtactcaag ttctgccggc gagccgatgg  10140cggaaagcag aaagacgacc tggtagaaac ctgcattcgg ttaaacacca cgcacgttgc  10200catgcagcgt acgaagaagg ccaagaacgg ccgcctggtg acggtatccg agggtgaagc  10260cttgattagc cgctacaaga tcgtaaagag cgaaaccggg cggccggagt acatcgagat  10320cgagctagct gattggatgt accgcgagat cacagaaggc aagaacccgg acgtgctgac  10380ggttcacccc gattactttt tgatcgatcc cggcatcggc cgttttctct accgcctggc  10440acgccgcgcc gcaggcaagg cagaagccag atggttgttc aagacgatct acgaacgcag  10500tggcagcgcc ggagagttca agaagttctg tttcaccgtg cgcaagctga tcgggtcaaa  10560tgacctgccg gagtacgatt tgaaggagga ggcggggcag gctggcccga tcctagtcat  10620gcgctaccgc aacctgatcg agggcgaagc atccgccggt tcctaatgta cggagcagat  10680gctagggcaa attgccctag caggggaaaa aggtcgaaaa ggtctctttc ctgtggatag  10740cacgtacatt gggaacccaa agccgtacat tgggaaccgg aacccgtaca ttgggaaccc  10800aaagccgtac attgggaacc ggtcacacat gtaagtgact gatataaaag agaaaaaagg  10860cgatttttcc gcctaaaact ctttaaaact tattaaaact cttaaaaccc gcctggcctg  10920tgcataactg tctggccagc gcacagccga agagctgcaa aaagcgccta cccttcggtc  10980gctgcgctcc ctacgccccg ccgcttcgcg tcggcctatc gcggccgctg gccgctcaaa  11040aatggctggc ctacggccag gcaatctacc agggcgcgga caagccgcgc cgtcgccact  11100cgaccgccgg cgctgaggtc tgcctcgtga agaaggtgtt gctgactcat accaggcctg  11160aatcgcccca tcatccagcc agaaagtgag ggagccacgg ttgatgagag ctttgttgta  11220ggtggaccag ttggtgattt tgaacttttg ctttgccacg gaacggtctg cgttgtcggg  11280aagatgcgtg atctgatcct tcaactcagc aaaagttcga tttattcaac aaagccgccg  11340tcccgtcaag tcagcgtaat gctctgccag tgttacaacc aattaaccaa ttctgattag  11400aaaaactcat cgagcatcaa atgaaactgc aatttattca tatcaggatt atcaatacca  11460tatttttgaa aaagccgttt ctgtaatgaa ggagaaaact caccgaggca gttccatagg  11520atggcaagat cctggtatcg gtctgcgatt ccgactcgtc caacatcaat acaacctatt  11580aatttcccct cgtcaaaaat aaggttatca agtgagaaat caccatgagt gacgactgaa 11640tccggtgaga atggcaaaag ctctgcatta atgaatcggc caacgcgcgg ggagaggcgg  11700tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg  11760gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg  11820ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa  11880ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg  11940acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc  12000tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc  12060ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc  12120ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg  12180ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc  12240actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga  12300gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc  12360tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac  12420caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg  12480atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc  12540acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttgat  12600ccggaattaa ttcctgtggt tggcatgcac atacaaatgg acgaacggat aaaccttttc  12660acgccctttt aaatatccga ttattctaat aaacgctctt ttctcttagg tttacccgcc  12720aatatatcct gtcaaacact gatagtttaa actgaaggcg ggaaacgaca atctgatcat  12780gagcggagaa ttaagggagt cacgttatga cccccgccga tgacgcggga caagccgttt  12840tacgtttgga actgacagaa ccgcaacgct gcaggaattg gccgcagcgg ccatttaaat  12900caattgggcg cgccgaattc gagctcggta caagcttgca catgacaaca attgtaagag  12960gatggagacc acaacgatcc aacaatactt ctgcgacggg ctgtgaagta tagagaagtt  13020aaacgcccaa aagccattgt gtttggaatt tttagttatt ctatttttca tgatgtatct  13080tcctctaaca tgccttaatt tgcaaatttg gtataactac tgattgaaaa tatatgtatg  13140taaaaaaata ctaagcatat ttgtgaagct aaacatgatg ttatttaaga aaatatgttg  13200ttaacagaat aagattaata tcgaaatgga aacatctgta aattagaatc atcttacaag  13260ctaagagatg ttcacgcttt gagaaacttc ttcagatcat gaccgtagaa gtagctctcc  13320aagactcaac gaaggctgct gcaattccac aaatgcatga catgcatcct tgtaaccgtc  13380gtcgccgcta taaacacgga taactcaatt ccctgctcca tcaatttaga aatgagcaag  13440caagcacccg atcgctcacc ccatatgcac caatctgact cccaagtctc tgtttcgcat  13500tagtaccgcc agcactccac ctatagctac caattgagac ctttccagcc taagcagatc  13560gattgatcgt tagagtcaaa gagttggtgg tacgggtact ttaactacca tggaatgatg  13620gggcgtgatg tagagcggaa agcgcctccc tacgcggaac aacaccctcg ccatgccgct  13680cgactacagc ctcctcctcg tcggccgccc acaacgaggg agcccgtggt cgcagccacc  13740gaccagcatg tctctgtgtc ctcgtccgac ctcgacatgt catggcaaac agtcggacgc  13800cagcaccaga ctgacgacat gagtctctga agagcccgcc acctagaaag atccgagccc  13860tgctgctggt agtggtaacc attttcgtcg cgctgacgcg gagagcgaga ggccagaaat  13920ttatagcgac tgacgctgtg gcaggcacgc tatcggaggt tacgacgtgg cgggtcactc  13980gacgcggagt tcacaggtcc tatccttgca tcgctcgggc cggagtttac gggacttatc  14040cttacgacgt gctctaaggt tgcgataacg ggcggaggaa ggcgtgtggc gtgcggagac  14100ggtttataca cgtagtgtgc gggagtgtgt ttcgtagacg cgggaaagca cgacgactta  14160cgaaggttag tggaggagga ggacacacta aaatcaggac gcaagaaact cttctattat  14220agtagtagag aagagattat aggagtgtgg gttgattcta aagaaaatcg acgcaggaca  14280accgtcaaaa cgggtgcttt aatatagtag atatatatat atagagagag agagaaagta  14340caaaggatgc atttgtgtct gcatatgatc ggagtattac taacggccgt cgtaagaagg  14400tccatcatgc gtggagcgag cccatttggt tggttgtcag gccgcagtta aggcctccat  14460atatgattgt cgtcgggccc ataacagcat ctcctccacc agtttattgt aagaataaat  14520taagtagaga tatttgtcgt cgggcagaag aaacttggac aagaagaaga agcaagctag  14580gccaatttct tgccggcaag aggaagatag tggcctctag tttatatatc ggcgtgatga  14640tgatgctcct agctagaaat gagagaagaa aaacggacgc gtgtttggtg tgtgtcaatg  14700gcgtccatcc ttccatcaga tcagaacgat gaaaaagtca agcacggcat gcatagtata  14760tgtatagctt gttttagtgt ggctttgctg agacgaatga aagcaacggc gggcatattt  14820ttcagtggct gtagctttca ggctgaaaga gacgtggcat gcaataattc agggaattcg  14880tcagccaatt gaggtagcta gtcaacttgt acattggtgc gagcaatttt ccgcactcag  14940gagggctagt ttgagagtcc aaaaactata ggagattaaa gaggctaaaa tcctctcctt  15000atttaatttt aaataagtag tgtatttgta ttttaactcc tccaaccctt ccgattttat  15060ggctctcaaa ctagcattca gtctaatgca tgcatgcttg gctagaggtc gtatggggtt  15120gttaatagca tagctagcta caagttaacc gggtctttta tatttaataa ggacaggcaa  15180agtattactt acaaataaag aataaagcta ggacgaactc gtggattatt actaaatcga  15240aatggacgta atattccagg caagaataat tgttcgatca ggagacaagt ggggcattgg  15300accggttctt gcaagcaaga gcctatggcg tggtgacacg gcgcgttgcc catacatcat  15360gcctccatcg atgatccatc ctcacttgct ataaaaagag gtgtccatgg tgctcaagct  15420cagccaagca aataagacga cttgtttcat tgattcttca agagatcgag cttcttttgc  15480accacaaggt cgaggatcca aca                                          15503<210>15<211>14946<212>DNA<213>人工序列<220><223>人工序列说明:pNOV1313<220><221>misc_feature<222>(12)..(1993)<223>Zm Ubi启动子<220><221>misc_feature<222>(2016)..(5597)<223>编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列<220><221>misc_feature<222>(5805)..(7786)<223>Zm Ubi启动子<220><221>misc_feature<222>(7883)..(8986)<223>PMI<400>15 aagcttgcat gcctgcagtg cagcgtgacc cggtcgtgcc cctctctaga gataatgagc  60attgcatgtc taagttataa aaaattacca catatttttt ttgtcacact tgtttgaagt  120gcagtttatc tatctttata catatattta aactttactc tacgaataat ataatctata  180gtactacaat aatatcagtg ttttagagaa tcatataaat gaacagttag acatggtcta  240aaggacaatt gagtattttg acaacaggac tctacagttt tatcttttta gtgtgcatgt  300gttctccttt ttttttgcaa atagcttcac ctatataata cttcatccat tttattagta  360catccattta gggtttaggg ttaatggttt ttatagacta atttttttag tacatctatt  420ttattctatt ttagcctcta aattaagaaa actaaaactc tattttagtt tttttattta  480ataatttaga tataaaatag aataaaataa agtgactaaa aattaaacaa atacccttta  540agaaattaaa aaaactaagg aaacattttt cttgtttcga gtagataatg ccagcctgtt  600aaacgccgtc gacgagtcta acggacacca accagcgaac cagcagcgtc gcgtcgggcc  660aagcgaagca gacggcacgg catctctgtc gctgcctctg gacccctctc gagagttccg  720ctccaccgtt ggacttgctc cgctgtcggc atccagaaat tgcgtggcgg agcggcagac  780gtgagccggc acggcaggcg gcctcctcct cctctcacgg caccggcagc tacgggggat  840tcctttccca ccgctccttc gctttccctt cctcgcccgc cgtaataaat agacaccccc  900tccacaccct ctttccccaa cctcgtgttg ttcggagcgc acacacacac aaccagatct  960cccccaaatc cacccgtcgg cacctccgct tcaaggtacg ccgctcgtcc tccccccccc  1020cccctctcta ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac  1080ttctgttcat gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta  1140cacggatgcg acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt  1200ggggaatcct gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt  1260gtttcgttgc atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt  1320gtttgtcggg tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt  1380gggcggtcgt tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat  1440tttggatctg tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg  1500aaatatcgat ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag  1560atgctttttg ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc  1620tagatcggag tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta  1680tgtgtgtgtc atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg  1740ataggtatac atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat  1800ctattcatat gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa  1860ttattttgat cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt  1920tagccctgcc ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc  1980ctgttgtttg gtgttacttc tgcagggatc caacaatgga caacaacccc aacatcaacg  2040agtgcatccc ctacaactgc ctgagcaacc ccgaggtgga ggtgctgggc ggcgagcgca  2100tcgagaccgg ctacaccccc atcgacatca gcctgagcct gacccagttc ctgctgagcg  2160agttcgtgcc cggcgccggc ttcgtgctgg gcctggtgga catcatctgg ggcatcttcg  2220gccccagcca gtgggacgcc ttcctggtgc agatcgagca gttgataaac caacgcatag  2280aggaattcgc ccgcaaccag gccatcagcc gcctggaggg cctgagcaac ctgtaccaaa  2340tctacgccga gagcttccgc gagtgggagg ccgaccccac caaccccgcc ctgcgcgagg  2400agatgcgcat ccagttcaac gacatgaaca gcgccctgac caccgccatc cccctgttcg  2460ccgtgcagaa ctaccaggtg cccctgctga gcgtgtacgt gcaggccgcc aacctgcacc  2520tgagcgtgct gcgcgacgtc agcgtgttcg gccagcgctg gggcttcgac gccgccacca  2580tcaacagccg ctacaacgac ctgacccgcc tgatcggcaa ctacaccgac cacgccgtgc  2640gctggtacaa caccggcctg gagcgcgtgt ggggtcccga cagccgcgac tggatcaggt  2700acaaccagtt ccgccgcgag ctgaccctga ccgtgctgga catcgtgagc ctgttcccca  2760actacgacag ccgcacctac cccatccgca ccgtgagcca gctgacccgc gagatttaca  2820ccaaccccgt gctggagaac ttcgacggca gcttccgcgg cagcgcccag ggcatcgagg  2880gcagcatccg cagcccccac ctgatggaca tcctgaacag catcaccatc tacaccgacg  2940cccaccgcgg cgagtactac tggagcggcc accagatcat ggccagcccc gtcggcttca  3000gcggccccga gttcaccttc cccctgtacg gcaccatggg caacgctgca cctcagcagc  3060gcatcgtggc acagctgggc cagggagtgt accgcaccct gagcagcacc ctgtaccgtc  3120gacctttcaa catcggcatc aacaaccagc agctgagcgt gctggacggc accgagttcg  3180cctacggcac cagcagcaac ctgcccagcg ccgtgtaccg caagagcggc accgtggaca  3240gcctggacga gatcccccct cagaacaaca acgtgccacc tcgacagggc ttcagccacc  3300gtctgagcca cgtgagcatg ttccgcagtg gcttcagcaa cagcagcgtg agcatcatcc  3360gtgcacccat gttcagctgg attcaccgca gcgccaccct gaccaacacc atcgaccccg  3420agcgcatcaa ccagatcccc ctggtgaagg gcttccgggt gtggggcggc accagcgtga  3480tcaccggccc cggcttcacc ggaggcgaca tcctgcgcag aaacaccttc ggcgacttcg  3540tgagcctgca ggtgaacatc aacagcccca tcacccagcg ttaccgcctg cgcttccgct  3600acgccagcag ccgcgacgcc cgtgtgatcg tgctgactgg cgccgctagc accggtgtgg  3660gcggtcaggt gagcgtgaac atgcccctgc agaagactat ggagatcggc gagaacctga  3720ctagtcgcac cttccgctac accgacttca gcaacccctt cagcttccgc gccaaccccg  3780acatcatcgg catcagcgag cagcccctgt tcggtgccgg cagcatcagc agcggcgagc  3840tgtacatcga caagatcgag atcatcctgg ccgacgccac cttcgaggcc gagagcgacc  3900tggagcgcgc ccagaaggcc gtgaacgccc tgttcaccag cagcaaccag atcggcctga  3960agaccgacgt gaccgactac cacatcgacc aggtgagcaa cctggtggac tgcttaagcg  4020acgagttctg cctggacgag aagaaggagc tgagcgagaa ggtgaagcac gccaagcgcc  4080tgagcgacga gcgcaacctg ctgcaggacc ccaacttccg cggcatcaac cgccagctgg  4140accgcggctg gcgaggcagc accgatatca ccatccaggg cggcgacgac gtgttcaagg  4200agaactacgt gaccctgcag ggcaccttcg acgagtgcta ccccacctac ctgtaccagc  4260cgatcgacga gagcaagctg aaggcctaca cccgctacca gctgcgcggc tacatcgagg  4320acagccagga cctggaaatc tacctgatcc gctacaacgc gaagcacgag accgtgaacg  4380tgcccggcac cggcagcctg tggcccctga gcgcccccag ccccatcggc aagtgcgggg  4440agccgaatcg atgcgctccg cacctggagt ggaacccgga cctagactgc agctgcaggg  4500acggggagaa gtgcgcccac cacagccacc acttcagcct ggacatcgac gtgggctgca  4560ccgacctgaa cgaggacctg ggcgtgtggg tgatcttcaa gatcaagacc caggacggcc  4620acgcccgcct gggcaatcta gagttcctgg aggagaagcc cctggtgggc gaggccctgg  4680cccgcgtgaa gcgtgctgag aagaagtggc gcgacaagcg cgagaagctg gagtgggaga  4740ccaacatcgt gtacaaggag gccaaggaga gcgtggacgc cctgttcgtg aacagccagt  4800acgaccgcct gcaggccgac accaacatcg ccatgatcca cgccgccgac aagcgcgtgc  4860acagcattcg cgaggcctac ctgcccgagc tgagcgtgat ccccggtgtg aacgccgcca  4920tcttcgagga actcgagggc cgcatcttca ccgccttcag cctgtacgac gcccgcaacg  4980tgatcaagaa cggcgacttc aacaacggcc tgagctgctg gaacgtgaag ggccacgtgg  5040acgtggagga gcagaacaac caccgcagcg tgctggtggt gcccgagtgg gaggccgagg  5100tgagccagga ggtgcgcgtg tgccccggcc gcggctacat cctgcgcgtg accgcctaca  5160aggagggcta cggcgagggc tgcgtgacca tccacgagat cgagaacaac accgacgagc  5220tcaagttcag caactgcgtg gaggaggagg tttaccccaa caacaccgtg acctgcaacg  5280actacaccgc gacccaggag gagtacgaag gcacctacac ctctcgcaac aggggttacg  5340acggcgccta cgagtccaac agctccgtgc cagctgacta cgccagcgcc tacgaggaga  5400aagcctacac cgacggtaga cgcgacaacc catgtgagag caacagaggc tacggcgact  5460acacccccct gcccgctgga tacgtgacca aggagctgga gtacttcccc gagaccgaca  5520aggtgtggat cgagattggc gagaccgagg gcaccttcat cgtggacagc gtggagctgc  5580tgctgatgga ggagtagtag atctgttctg cacaaagtgg agtagtcagt catcgatcag  5640gaaccagaca ccagactttt attcatacag tgaagtgaag tgaagtgcag tgcagtgagt  5700tgctggtttt tgtacaactt agtatgtatt tgtatttgta aaatacttct atcaataaaa  5760tttctaattc ctaaaaccaa aatccagggg taccagcttg catgcctgca gtgcagcgtg  5820acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta taaaaaatta  5880ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt atacatatat  5940ttaaacttta ctctacgaat aatataatct atagtactac aataatatca gtgttttaga  6000gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt ttgacaacag  6060gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg caaatagctt  6120cacctatata atacttcatc cattttatta gtacatccat ttagggttta gggttaatgg  6180tttttataga ctaatttttt tagtacatct attttattct attttagcct ctaaattaag  6240aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa tagaataaaa  6300taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta aggaaacatt  6360tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt ctaacggaca  6420ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca cggcatctct  6480gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg ctccgctgtc  6540ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag gcggcctcct  6600cctcctctca cggcaccggc agctacgggg gattcctttc ccaccgctcc ttcgctttcc  6660cttcctcgcc cgccgtaata aatagacacc ccctccacac cctctttccc caacctcgtg  6720ttgttcggag cgcacacaca cacaaccaga tctcccccaa atccacccgt cggcacctcc  6780gcttcaaggt acgccgctcg tcctcccccc ccccccctct ctaccttctc tagatcggcg  6840ttccggtcca tggttagggc ccggtagttc tacttctgtt catgtttgtg ttagatccgt  6900gtttgtgtta gatccgtgct gctagcgttc gtacacggat gcgacctgta cgtcagacac  6960gttctgattg ctaacttgcc agtgtttctc tttggggaat cctgggatgg ctctagccgt  7020tccgcagacg ggatcgattt catgattttt tttgtttcgt tgcatagggt ttggtttgcc  7080cttttccttt atttcaatat atgccgtgca cttgtttgtc gggtcatctt ttcatgcttt  7140tttttgtctt ggttgtgatg atgtggtctg gttgggcggt cgttctagat cggagtagaa  7200ttctgtttca aactacctgg tggatttatt aattttggat ctgtatgtgt gtgccataca  7260tattcatagt tacgaattga agatgatgga tggaaatatc gatctaggat aggtatacat  7320gttgatgcgg gttttactga tgcatataca gagatgcttt ttgttcgctt ggttgtgatg  7380atgtggtgtg gttgggcggt cgttcattcg ttctagatcg gagtagaata ctgtttcaaa  7440ctacctggtg tatttattaa ttttggaact gtatgtgtgt gtcatacatc ttcatagtta  7500cgagtttaag atggatggaa atatcgatct aggataggta tacatgttga tgtgggtttt  7560actgatgcat atacatgatg gcatatgcag catctattca tatgctctaa ccttgagtac  7620ctatctatta taataaacaa gtatgtttta taattatttt gatcttgata tacttggatg  7680atggcatatg cagcagctat atgtggattt ttttagccct gccttcatac gctatttatt  7740tgcttggtac tgtttctttt gtcgatgctc accctgttgt ttggtgttac ttctgcaggg  7800atccccgatc atgcaaaaac tcattaactc agtgcaaaac tatgcctggg gcagcaaaac  7860ggcgttgact gaactttatg gtatggaaaa tccgtccagc cagccgatgg ccgagctgtg  7920gatgggcgca catccgaaaa gcagttcacg agtgcagaat gccgccggag atatcgtttc  7980actgcgtgat gtgattgaga gtgataaatc gactctgctc ggagaggccg ttgccaaacg  8040ctttggcgaa ctgcctttcc tgttcaaagt attatgcgca gcacagccac tctccattca  8100ggttcatcca aacaaacaca attctgaaat cggttttgcc aaagaaaatg ccgcaggtat  8160cccgatggat gccgccgagc gtaactataa agatcctaac cacaagccgg agctggtttt  8220tgcgctgacg cctttccttg cgatgaacgc gtttcgtgaa ttttccgaga ttgtctccct  8280actccagccg gtcgcaggtg cacatccggc gattgctcac tttttacaac agcctgatgc  8340cgaacgttta agcgaactgt tcgccagcct gttgaatatg cagggtgaag aaaaatcccg  8400cgcgctggcg attttaaaat cggccctcga tagccagcag ggtgaaccgt ggcaaacgat  8460tcgtttaatt tctgaatttt acccggaaga cagcggtctg ttctccccgc tattgctgaa  8520tgtggtgaaa ttgaaccctg gcgaagcgat gttcctgttc gctgaaacac cgcacgctta  8580cctgcaaggc gtggcgctgg aagtgatggc aaactccgat aacgtgctgc gtgcgggtct  8640gacgcctaaa tacattgata ttccggaact ggttgccaat gtgaaattcg aagccaaacc  8700ggctaaccag ttgttgaccc agccggtgaa acaaggtgca gaactggact tcccgattcc  8760agtggatgat tttgccttct cgctgcatga ccttagtgat aaagaaacca ccattagcca  8820gcagagtgcc gccattttgt tctgcgtcga aggcgatgca acgttgtgga aaggttctca  8880gcagttacag cttaaaccgg gtgaatcagc gtttattgcc gccaacgaat caccggtgac  8940tgtcaaaggc cacggccgtt tagcgcgtgt ttacaacaag ctgtaagagc ttactgaaaa  9000aattaacatc tcttgctaag ctgggagctc gatccgtcga cctgcagatc gttcaaacat  9060ttggcaataa agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata  9120atttctgttg aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat  9180gagatgggtt tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa  9240aatatagcgc gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagatct  9300gctagccctg caggaaattt accggtgccc gggcggccag catggccgta tccgcaatgt  9360gttattaagt tgtctaagcg tcaatttgtt tacaccacaa tatatcctgc caccagccag  9420ccaacagctc cccgaccggc agctcggcac aaaatcacca ctcgatacag gcagcccatc  9480agaattaatt ctcatgtttg acagcttatc atcgactgca cggtgcacca atgcttctgg  9540cgtcaggcag ccatcggaag ctgtggtatg gctgtgcagg tcgtaaatca ctgcataatt  9600cgtgtcgctc aaggcgcact cccgttctgg ataatgtttt ttgcgccgac atcataacgg  9660ttctggcaaa tattctgaaa tgagctgttg acaattaatc atccggctcg tataatgtgt  9720ggaattgtga gcggataaca atttcacaca ggaaacagac catgagggaa gcgttgatcg  9780ccgaagtatc gactcaacta tcagaggtag ttggcgtcat cgagcgccat ctcgaaccga  9840cgttgctggc cgtacatttg tacggctccg cagtggatgg cggcctgaag ccacacagtg  9900atattgattt gctggttacg gtgaccgtaa ggcttgatga aacaacgcgg cgagctttga  9960tcaacgacct tttggaaact tcggcttccc ctggagagag cgagattctc cgcgctgtag  10020aagtcaccat tgttgtgcac gacgacatca ttccgtggcg ttatccagct aagcgcgaac  10080tgcaatttgg agaatggcag cgcaatgaca ttcttgcagg tatcttcgag ccagccacga  10140tcgacattga tctggctatc ttgctgacaa aagcaagaga acatagcgtt gccttggtag  10200gtccagcggc ggaggaactc tttgatccgg ttcctgaaca ggatctattt gaggcgctaa  10260atgaaacctt aacgctatgg aactcgccgc ccgactgggc tggcgatgag cgaaatgtag  10320tgcttacgtt gtcccgcatt tggtacagcg cagtaaccgg caaaatcgcg ccgaaggatg  10380tcgctgccga ctgggcaatg gagcgcctgc cggcccagta tcagcccgtc atacttgaag  10440ctaggcaggc ttatcttgga caagaagatc gcttggcctc gcgcgcagat cagttggaag  10500aatttgttca ctacgtgaaa ggcgagatca ccaaagtagt cggcaaataa agctctagtg  10560gatctccgta cccccggggg atctggctcg cggcggacgc acgacgccgg ggcgagacca  10620taggcgatct cctaaatcaa tagtagctgt aacctcgaag cgtttcactt gtaacaacga  10680ttgagaattt ttgtcataaa attgaaatac ttggttcgca tttttgtcat ccgcggtcag  10740ccgcaattct gacgaactgc ccatttagct ggagatgatt gtacatcctt cacgtgaaaa  10800tttctcaagc gctgtgaaca agggttcaga ttttagattg aaaggtgagc cgttgaaaca  10860cgttcttctt gtcgatgacg acgtcgctat gcggcatctt attattgaat accttacgat  10920ccacgccttc aaagtgaccg cggtagccga cagcacccag ttcacaagag tactctcttc  10980cgcgacggtc gatgtcgtgg ttgttgatct aaatttaggt cgtgaagatg ggctcgagat  11040cgttcgtaat ctggcggcaa agtctgatat tccaatcata attatcagtg gcgaccgcct  11100tgaggagacg gataaagttg ttgcactcga gctaggagca agtgatttta tcgctaagcc  11160gttcagtatc agagagtttc tagcacgcat tcgggttgcc ttgcgcgtgc gccccaacgt  11220tgtccgctcc aaagaccgac ggtctttttg ttttactgac tggacactta atctcaggca  11280acgtcgcttg atgtccgaag ctggcggtga ggtgaaactt acggcaggtg agttcaatct  11340tctcctcgcg tttttagaga aaccccgcga cgttctatcg cgcgagcaac ttctcattgc  11400cagtcgagta cgcgacgagg aggtttatga caggagtata gatgttctca ttttgaggct  11460gcgccgcaaa cttgaggcag atccgtcaag ccctcaactg ataaaaacag caagaggtgc  11520cggttatttc tttgacgcgg acgtgcaggt ttcgcacggg gggacgatgg cagcctgagc  11580caattcccag atccccgagg aatcggcgtg agcggtcgca aaccatccgg cccggtacaa  11640atcggcgcgg cgctgggtga tgacctggtg gagaagttga aggccgcgca ggccgcccag  11700cggcaacgca tcgaggcaga agcacgcccc ggtgaatcgt ggcaagcggc cgctgatcga  11760atccgcaaag aatcccggca accgccggca gccggtgcgc cgtcgattag gaagccgccc  11820aagggcgacg agcaaccaga ttttttcgtt ccgatgctct atgacgtggg cacccgcgat  11880agtcgcagca tcatggacgt ggccgttttc cgtctgtcga agcgtgaccg acgagctggc  11940gaggtgatcc gctacgagct tccagacggg cacgtagagg tttccgcagg gccggccggc  12000atggccagtg tgtgggatta cgacctggta ctgatggcgg tttcccatct aaccgaatcc  12060atgaaccgat accgggaagg gaagggagac aagcccggcc gcgtgttccg tccacacgtt  12120gcggacgtac tcaagttctg ccggcgagcc gatggcggaa agcagaaaga cgacctggta  12180gaaacctgca ttcggttaaa caccacgcac gttgccatgc agcgtacgaa gaaggccaag  12240aacggccgcc tggtgacggt atccgagggt gaagccttga ttagccgcta caagatcgta  12300aagagcgaaa ccgggcggcc ggagtacatc gagatcgagc tagctgattg gatgtaccgc  12360gagatcacag aaggcaagaa cccggacgtg ctgacggttc accccgatta ctttttgatc  12420gatcccggca tcggccgttt tctctaccgc ctggcacgcc gcgccgcagg caaggcagaa  12480gccagatggt tgttcaagac gatctacgaa cgcagtggca gcgccggaga gttcaagaag  12540ttctgtttca ccgtgcgcaa gctgatcggg tcaaatgacc tgccggagta cgatttgaag  12600gaggaggcgg ggcaggctgg cccgatccta gtcatgcgct accgcaacct gatcgagggc  12660gaagcatccg ccggttccta atgtacggag cagatgctag ggcaaattgc cctagcaggg  12720gaaaaaggtc gaaaaggtct ctttcctgtg gatagcacgt acattgggaa cccaaagccg  12780tacattggga accggaaccc gtacattggg aacccaaagc cgtacattgg gaaccggtca  12840cacatgtaag tgactgatat aaaagagaaa aaaggcgatt tttccgccta aaactcttta  12900aaacttatta aaactcttaa aacccgcctg gcctgtgcat aactgtctgg ccagcgcaca  12960gccgaagagc tgcaaaaagc gcctaccctt cggtcgctgc gctccctacg ccccgccgct  13020tcgcgtcggc ctatcgcggc cgctggccgc tcaaaaatgg ctggcctacg gccaggcaat  13080ctaccagggc gcggacaagc cgcgccgtcg ccactcgacc gccggcgctg aggtctgcct  13140cgtgaagaag gtgttgctga ctcataccag gcctgaatcg ccccatcatc cagccagaaa  13200gtgagggagc cacggttgat gagagctttg ttgtaggtgg accagttggt gattttgaac  13260ttttgctttg ccacggaacg gtctgcgttg tcgggaagat gcgtgatctg atccttcaac  13320tcagcaaaag ttcgatttat tcaacaaagc cgccgtcccg tcaagtcagc gtaatgctct  13380gccagtgtta caaccaatta accaattctg attagaaaaa ctcatcgagc atcaaatgaa  13440actgcaattt attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta  13500atgaaggaga aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg  13560cgattccgac tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt  13620tatcaagtga gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagctctg  13680cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct  13740tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac  13800tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga  13860gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat  13920aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac  13980ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct  14040gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg  14100ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg  14160ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt  14220cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg  14280attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac  14340ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga  14400aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt  14460gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt  14520tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga  14580ttatcaaaaa ggatcttcac ctagatcctt ttgatccgga attaattcct gtggttggca  14640tgcacataca aatggacgaa cggataaacc ttttcacgcc cttttaaata tccgattatt  14700ctaataaacg ctcttttctc ttaggtttac ccgccaatat atcctgtcaa acactgatag  14760tttaaactga aggcgggaaa cgacaatctg atcatgagcg gagaattaag ggagtcacgt  14820tatgaccccc gccgatgacg cgggacaagc cgttttacgt ttggaactga cagaaccgca  14880acgctgcagg aattggccgc agcggccatt taaatcaatt gggcgcgccg aattcgagct  14940cggtac                                                             14946<210>16<211>14603<212>DNA<213>人工序列<220><223>人工序列说明:pNOV1435<220><221>misc_feature<222>(1)..(2007)<223>编码H04毒素部分加cry1Ab尾头40个氨基酸的合成核苷酸序列<220><221>misc_feature<222>Complement((8814)..(10022))<223>PMI<220><221>misc_feature<222>(11142)..(12032)<223>玉米泛在蛋白启动子<220><221>misc_feature<222>(12037)..(14594)<223>MTL启动子<400>16atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag  60gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg  120agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg  180gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc  240gagcagttga taaaccaacg catagaggaa ttcgcccgca accaggccat cagccgcctg  300gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac  360cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc  420ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg  480tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag  540cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc  600ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt  660cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg  720ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg  780agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc  840cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg  900aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag  960atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc  1020atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc  1080accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg  1140agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg  1200taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg  1260ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc  1320agcaacagca gcgtgagcat catccgtgca cccatgttca gctggattca ccgcagcgcc  1380accctgacca acaccatcga ccccgagcgc atcaaccaga tccccctggt gaagggcttc  1440cgggtgtggg gcggcaccag cgtgatcacc ggccccggct tcaccggagg cgacatcctg  1500cgcagaaaca ccttcggcga cttcgtgagc ctgcaggtga acatcaacag ccccatcacc  1560cagcgttacc gcctgcgctt ccgctacgcc agcagccgcg acgcccgtgt gatcgtgctg  1620actggcgccg ctagcaccgg tgtgggcggt caggtgagcg tgaacatgcc cctgcagaag  1680actatggaga tcggcgagaa cctgactagt cgcaccttcc gctacaccga cttcagcaac  1740cccttcagct tccgcgccaa ccccgacatc atcggcatca gcgagcagcc cctgttcggt  1800gccggcagca tcagcagcgg cgagctgtac atcgacaaga tcgagatcat cctggccgac  1860gccaccttcg aggccgagag cgacctggag cgcgcccaga aggccgtgaa cgccctgttc  1920accagcagca accagatcgg cctgaagacc gacgtgaccg actaccacat cgaccaggtg  1980agcaacctgg tggactgctt aagctagaga tctgttctgc acaaagtgga gtagtcagtc  2040atcgatcagg aaccagacac cagactttta ttcatacagt gaagtgaagt gaagtgcagt  2100gcagtgagtt gctggttttt gtaccactta gtatgtattt gtatttgtaa aatacttcta  2160tcaataaaat ttctaattcc taaaaccaaa atccagtggg taccagcttg ggctgagtgg  2220ctccttcaac gttgcggttc tgtcagttcc aaacgtaaaa cggcttgtcc cgcgtcatcg  2280gcgggggtca taacgtgact cccttaattc tccgctcatg atcagattgt cgtttcccgc  2340cttcagttta aactatcagt gtttgacagg atatattggc gggtaaacct aagagaaaag  2400agcgtttatt agaataacgg atatttaaaa gggcgtgaaa aggtttatcc gttcgtccat  2460ttgtatgtgc atgccaacca cagggttccc ctcgggagtg cttggcattc cgtacgataa  2520tgacttctgt tcaaccaccc aaacgtcgga aagcctgacg acggagcagc attccaaaaa  2580gatcccttgg ctcgtctggg tcggctagaa ggtcgagtgg gctgctgtgg cttgatccct  2640caacgcggtc gcggacgtag cgcagcgccg aaaaatcctc gatcgcaaat ccgacgctgt  2700cgaaaagcgt gatctgcttg tcgctctttc ggccgacgtc ctggccagtc atcacgcgcc  2760aaagttccgt cacaggatga tctggcgcga gttgctggat ctcgccttca atccgggtct  2820gtggcgggaa ctccacgaaa atatccgaac gcagcaagat cgtcgaccaa ttcttgaaga  2880cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct  2940tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc  3000taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa  3060tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt  3120gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct  3180gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc  3240cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta  3300tgtggcgcgg tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac  3360tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc  3420atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac  3480ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg  3540gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac  3600gagcgtgaca ccacgatgcc tgcagggggg gggggggggg ggacatgagg ttgccccgta  3660ttcagtgtcg ctgatttgta ttgtctgaag ttgtttttac gttaagttga tgcagatcaa  3720ttaatacgat acctgcgtca taattgatta tttgacgtgg tttgatggcc tccacgcacg  3780ttgtgatatg tagatgataa tcattatcac tttacgggtc ctttccggtg atccgacagg  3840ttacggggcg gcgacctcgc gggttttcgc tatttatgaa aattttccgg tttaaggcgt  3900ttccgttctt cttcgtcata acttaatgtt tttatttaaa ataccctctg aaaagaaagg  3960aaacgacagg tgctgaaagc gaggcttttt ggcctctgtc gtttcctttc tctgtttttg  4020tccgtggaat gaacaatgga agtccccccc cccccccccc cctgcagcaa tggcaacaac  4080gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac aattaataga  4140ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg  4200gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact  4260ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac  4320tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta  4380actgtcagac caagtttact catatatact ttagattgat ttaaaacttc atttttaatt  4440taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga  4500gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc  4560tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt  4620ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc  4680gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc  4740tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg  4800cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg  4860gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga  4920actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc  4980ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg  5040gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg  5100atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt  5160tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc  5220tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg  5280aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga tgcggtattt  5340tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca gtacaatctg  5400ctctgatgcc gcatagttaa gccagtatac actccgctat cgctacgtga ctgggtcatg  5460gctgcgcccc gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg  5520gcatccgctt acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca  5580ccgtcatcac cgaaacgcgc gaggcagcag atcccccgat caagtagata cactacatat  5640atctacaata gacatcgagc cggaaggtga tgtttacttt cctgaaatcc ccagcaattt  5700taggccagtt tttacccaag acttcgcctc taacataaat tatagttacc aaatctggca  5760aaagggttaa caagtggcag caacggattc gcaaacctgt cacgcctttt gtgccaaaag  5820ccgcgccagg tttgcgatcc gctgtgccag gcgttaggcg tcatatgaag atttcggtga  5880tccctgagca ggtggcggaa acattggatg ctgagaacca tttcattgtt cgtgaagtgt  5940tcgatgtgca cctatccgac caaggctttg aactatctac cagaagtgtg agcccctacc  6000ggaaggatta catctcggat gatgactctg atgaagactc tgcttgctat ggcgcattca  6060tcgaccaaga gcttgtcggg aagattgaac tcaactcaac atggaacgat ctagcctcta  6120tcgaacacat tgttgtgtcg cacacgcacc gaggcaaagg agtcgcgcac agtctcatcg  6180aatttgcgaa aaagtgggca ctaagcagac agctccttgg catacgatta gagacacaaa  6240cgaacaatgt acctgcctgc aatttgtacg caaaatgtgg ctttactctc ggcggcattg  6300acctgttcac gtataaaact agacctcaag tctcgaacga aacagcgatg tactggtact  6360ggttctcggg agcacaggat gacgcctaac aattcattca agccgacacc gcttcgcggc  6420gcggcttaat tcaggagtta aacatcatga gggaagcggt gatcgccgaa gtatcgactc  6480aactatcaga ggtagttggc gtcatcgagc gccatctcga accgacgttg ctggccgtac  6540atttgtacgg ctccgcagtg gatggcggcc tgaagccaca cagtgatatt gatttgctgg  6600ttacggtgac cgtaaggctt gatgaaacaa cgcggcgagc tttgatcaac gaccttttgg  6660aaacttcggc ttcccctgga gagagcgaga ttctccgcgc tgtagaagtc accattgttg  6720tgcacgacga catcattccg tggcgttatc cagctaagcg cgaactgcaa tttggagaat  6780ggcagcgcaa tgacattctt gcaggtatct tcgagccagc cacgatcgac attgatctgg  6840ctatcttgct gacaaaagca agagaacata gcgttgcctt ggtaggtcca gcggcggagg  6900aactctttga tccggttcct gaacaggatc tatttgaggc gctaaatgaa accttaacgc  6960tatggaactc gccgcccgac tgggctggcg atgagcgaaa tgtagtgctt acgttgtccc  7020gcatttggta cagcgcagta accggcaaaa tcgcgccgaa ggatgtcgct gccgactggg  7080caatggagcg cctgccggcc cagtatcagc ccgtcatact tgaagctagg caggcttatc  7140ttggacaaga agatcgcttg gcctcgcgcg cagatcagtt ggaagaattt gttcactacg  7200tgaaaggcga gatcaccaag gtagtcggca aataatgtct aacaattcgt tcaagccgac  7260gccgcttcgc ggcgcggctt aactcaagcg ttagagagct ggggaagact atgcgcgatc  7320tgttgaaggt ggttctaagc ctcgtacttg cgatggcatc ggggcaggca cttgctgacc  7380tgccaattgt tttagtggat gaagctcgtc ttccctatga ctactcccca tccaactacg  7440acatttctcc aagcaactac gacaactcca taagcaatta cgacaatagt ccatcaaatt  7500acgacaactc tgagagcaac tacgataata gttcatccaa ttacgacaat agtcgcaacg  7560gaaatcgtag gcttatatat agcgcaaatg ggtctcgcac tttcgccggc tactacgtca  7620ttgccaacaa tgggacaacg aacttctttt ccacatctgg caaaaggatg ttctacaccc  7680caaaaggggg gcgcggcgtc tatggcggca aagatgggag cttctgcggg gcattggtcg  7740tcataaatgg ccaattttcg cttgccctga cagataacgg cctgaagatc atgtatctaa  7800gcaactagcc tgctctctaa taaaatgtta ggcctcaaca tctagtcgca agctgagggg  7860aaccactagt gtcatacgaa cctccaagag acggttacac aaacgggtac attgttgatg  7920tcatgtatga caatcgccca agtaagtatc cagctgtgtt cagaacgtac gtccgaatta  7980attcatcggg gtacggtcga cgatcgtcaa cgttcacttc taaagaaata gcgccactca  8040gcttcctcag cggctttatc cagcgatttc ctattatgtc ggcatagttc tcaagatcga  8100cagcctgtca cggttaagcg agaaatgaat aagaaggctg ataattcgga tctctgcgag  8160ggagatgata tttgatcaca ggcagcaacg ctctgtcatc gttacaatca acatgctacc  8220ctccgcgaga tcatccgtgt ttcaaacccg gcagcttagt tgccgttctt ccgaatagca  8280tcggtaacat gagcaaagtc tgccgcctta caacggctct cccgctgacg ccgtcccgga  8340ctgatgggct gcctgtatcg agtggtgatt ttgtgccgag ctgccggtcg gggagctgtt  8400ggctggctgg tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata  8460acacattgcg gacgttttta atgtactgaa ttgtctagac ccggggatct catgtttgac  8520agcttatcat cggatctagt aacatagatg acaccgcgcg cgataattta tcctagtttg  8580cgcgctatat tttgttttct atcgcgtatt aaatgtataa ttgcgggact ctaatcataa  8640aaacccatct cataaataac gtcatgcatt acatgttaat tattacatgc ttaacgtaat  8700tcaacagaaa ttagatgata atcatcgcaa gaccggcaac aggattcaat cttaagaaac  8760tttattgcca aatgtttgaa cgatctctgc aggtcgacgg atcgagctcc cagcttagca  8820agagatgtta attttttcag taagctctta cagcttgttg taaacacgcg ctaaacggcc  8880gtggcctttg acagtcaccg gtgattcgtt ggcggcaata aacgctgatt cacccggttt  8940aagctgtaac tgctgagaac ctttccacaa cgttgcatcg ccttcgacgc agaacaaaat  9000ggcggcactc tgctggctaa tggtggtttc tttatcacta aggtcatgca gcgagaaggc  9060aaaatcatcc actggaatcg ggaagtccag ttctgcacct tgtttcaccg gctgggtcaa  9120caactggtta gccggtttgg cttcgaattt cacattggca accagttccg gaatatcaat  9180gtatttaggc gtcagacccg cacgcagcac gttatcggag tttgccatca cttccagcgc  9240cacgccttgc aggtaagcgt gcggtgtttc agcgaacagg aacatcgctt cgccagggtt  9300caatttcacc acattcagca atagcgggga gaacagaccg ctgtcttccg ggtaaaattc  9360agaaattaaa cgaatcgttt gccacggttc accctgctgg ctatcgaggg ccgattttaa  9420aatcgccagc gcgcgggatt tttcttcacc ctgcatattc aacaggctgg cgaacagttc  9480gcttaaacgt tcggcatcag gctgttgtaa aaagtgagca atcgccggat gtgcacctgc  9540gaccggctgg agtagggaga caatctcgga aaattcacga aacgcgttca tcgcaaggaa  9600aggcgtcagc gcaaaaacca gctccggctt gtggttagga tctttatagt tacgctcggc  9660ggcatccatc gggatacctg cggcattttc tttggcaaaa ccgatttcag aattgtgttt  9720gtttggatga acctgaatgg agagtggctg tgctgcgcat aatactttga acaggaaagg  9780cagttcgcca aagcgtttgg caacggcctc tccgagcaga gtcgatttat cactctcaat  9840cacatcacgc agtgaaacga tatctccggc ggcattctgc actcgtgaac tgcttttcgg  9900atgtgcgccc atccacagct cggccatcgg ctggctggac ggattttcca taccataaag  9960ttcagtcaac gcgttttgct gccccaggca tagttttgca ctgagttaat gagtttttgc  10020atgatcgggg atccctgcag aagtaacacc aaacaacagg gtgagcatcg acaaaagaaa  10080cagtaccaag caaataaata gcgtatgaag gcagggctaa aaaaatccac atatagctgc  10140tgcatatgcc atcatccaag tatatcaaga tcaaaataat tataaaacat acttgtttat  10200tataatagat aggtactcaa ggttagagca tatgaataga tgctgcatat gccatcatgt  10260atatgcatca gtaaaaccca catcaacatg tatacctatc ctagatcgat atttccatcc  10320atcttaaact cgtaactatg aagatgtatg acacacacat acagttccaa aattaataaa  10380tacaccaggt agtttgaaac ggcgtctact ccgatctaga acgaatgaac gaccgcccaa  10440ccacaccaca tcatcacaac caagcgaaca aaaagcatct ctgtatatgc atcagtaaaa  10500cccgcatcaa catgtatacc tatcctagat cgatatttcc atccatcatc ttcaattcgt  10560aactatgaat atgtatggca cacacataca gatccaaaat taataaatcc accaggtagt  10620ttgaaacaga attctactcc gatctagaac gaccgcccaa ccagaccaca tcatcacaac  10680caagacaaaa aaaagcatga aaagatgacc cgacaaacaa gtgcacggca tatattgaaa  10740taaaggaaaa gggcaaacca aaccctatgc aacgaaacaa aaaaaatcat gaaatcgatc  10800ccgtctgcgg aacggctaga gccatcccag gattccccaa agagaaacac tggcaagtta  10860gcaatcagaa cgtgtctgac gtacaggtcg catccgtgta cgaacgctag cagcacggat  10920ctaacacaaa cacggatcta acacaaacat gaacagaagt agaactaccg ggccctaacc  10980atggaccgga acgccgatct agagaaggta gagagggggg gggggggagg acgagcggcg  11040taccttgaag cggaggtgcc gacgggtgga tttgggggag atctggttgt gtgtgtgtgc  11100gctccgaaca acacgaggtt ggggaaagag ggtgtggagg gggtgtctat ttattacggc  11160gggcgaggaa gggaaagcga aggagcggtg ggaaaggaat cccccgtagc tgccgtgccg  11220tgagaggagg aggaggccgc ctgccgtgcc ggctcacgtc tgccgctccg ccacgcaatt  11280tctggatgcc gacagcggag caagtccaac ggtggagcgg aactctcgag aggggtccag  11340aggcagcgac agagatgccg tgccgtctgc ttcgcttggc ccgacgcgac gctgctggtt  11400cgctggttgg tgtccgttag actcgtcgac ggcgtttaac aggctggcat tatctactcg  11460aaacaagaaa aatgtttcct tagttttttt aatttcttaa agggtatttg tttaattttt  11520agtcacttta ttttattcta ttttatatct aaattattaa ataaaaaaac taaaatagag  11580ttttagtttt cttaatttag aggctaaaat agaataaaat agatgtacta aaaaaattag  11640tctataaaaa ccattaaccc taaaccctaa atggatgtac taataaaatg gatgaagtat  11700tatataggtg aagctatttg caaaaaaaaa ggagaacaca tgcacactaa aaagataaaa  11760ctgtagagtc ctgttgtcaa aatactcaat tgtcctttag accatgtcta actgttcatt  11820tatatgattc tctaaaacac tgatattatt gtagtactat agattatatt attcgtagag  11880taaagtttaa atatatgtat aaagatagat aaactgcact tcaaacaagt gtgacaaaaa  11940aaatatgtgg taatttttta taacttagac atgcaatgct cattatctct agagaggggc  12000acgaccgggt cacgctgcac tgcaggcatg caagcttgca catgacaaca attgtaagag  12060gatggagacc acaacgatcc aacaatactt ctgcgacggg ctgtgaagta tagagaagtt  12120aaacgcccaa aagccattgt gtttggaatt tttagttatt ctatttttca tgatgtatct  12180tcctctaaca tgccttaatt tgcaaatttg gtataactac tgattgaaaa tatatgtatg  12240taaaaaaata ctaagcatat ttgtgaagct aaacatgatg ttatttaaga aaatatgttg  12300ttaacagaat aagattaata tcgaaatgga aacatctgta aattagaatc atcttacaag  12360ctaagagatg ttcacgcttt gagaaacttc ttcagatcat gaccgtagaa gtagctctcc  12420aagactcaac gaaggctgct gcaattccac aaatgcatga catgcatcct tgtaaccgtc  12480gtcgccgcta taaacacgga taactcaatt ccctgctcca tcaatttaga aatgagcaag  12540caagcacccg atcgctcacc ccatatgcac caatctgact cccaagtctc tgtttcgcat  12600tagtaccgcc agcactccac ctatagctac caattgagac ctttccagcc taagcagatc  12660gattgatcgt tagagtcaaa gagttggtgg tacgggtact ttaactacca tggaatgatg  12720gggcgtgatg tagagcggaa agcgcctccc tacgcggaac aacaccctcg ccatgccgct  12780cgactacagc ctcctcctcg tcggccgccc acaacgaggg agcccgtggt cgcagccacc  12840gaccagcatg tctctgtgtc ctcgtccgac ctcgacatgt catggcaaac agtcggacgc  12900cagcaccaga ctgacgacat gagtctctga agagcccgcc acctagaaag atccgagccc  12960tgctgctggt agtggtaacc attttcgtcg cgctgacgcg gagagcgaga ggccagaaat  13020ttatagcgac tgacgctgtg gcaggcacgc tatcggaggt tacgacgtgg cgggtcactc  13080gacgcggagt tcacaggtcc tatccttgca tcgctcgggc cggagtttac gggacttatc  13140cttacgacgt gctctaaggt tgcgataacg ggcggaggaa ggcgtgtggc gtgcggagac  13200ggtttataca cgtagtgtgc gggagtgtgt ttcgtagacg cgggaaagca cgacgactta  13260cgaaggttag tggaggagga ggacacacta aaatcaggac gcaagaaact cttctattat  13320agtagtagag aagagattat aggagtgtgg gttgattcta aagaaaatcg acgcaggaca  13380accgtcaaaa cgggtgcttt aatatagtag atatatatat atagagagag agagaaagta  13440caaaggatgc atttgtgtct gcatatgatc ggagtattac taacggccgt cgtaagaagg  13500tccatcatgc gtggagcgag cccatttggt tggttgtcag gccgcagtta aggcctccat  13560atatgattgt cgtcgggccc ataacagcat ctcctccacc agtttattgt aagaataaat  13620taagtagaga tatttgtcgt cgggcagaag aaacttggac aagaagaaga agcaagctag  13680gccaatttct tgccggcaag aggaagatag tggcctctag tttatatatc ggcgtgatga  13740tgatgctcct agctagaaat gagagaagaa aaacggacgc gtgtttggtg tgtgtcaatg  13800gcgtccatcc ttccatcaga tcagaacgat gaaaaagtca agcacggcat gcatagtata  13860tgtatagctt gttttagtgt ggctttgctg agacgaatga aagcaacggc gggcatattt  13920ttcagtggct gtagctttca ggctgaaaga gacgtggcat gcaataattc agggaattcg  13980tcagccaatt gaggtagcta gtcaacttgt acattggtgc gagcaatttt ccgcactcag  14040gagggctagt ttgagagtcc aaaaactata ggagattaaa gaggctaaaa tcctctcctt  14100atttaatttt aaataagtag tgtatttgta ttttaactcc tccaaccctt ccgattttat  14160ggctctcaaa ctagcattca gtctaatgca tgcatgcttg gctagaggtc gtatggggtt  14220gttaatagca tagctagcta caagttaacc gggtctttta tatttaataa ggacaggcaa  14280agtattactt acaaataaag aataaagcta ggacgaactc gtggattatt actaaatcga  14340aatggacgta atattccagg caagaataat tgttcgatca ggagacaagt ggggcattgg  14400accggttctt gcaagcaaga gcctatggcg tggtgacacg gcgcgttgcc catacatcat  14460gcctccatcg atgatccatc ctcacttgct ataaaaagag gtgtccatgg tgctcaagct  14520cagccaagca aataagacga cttgtttcat tgattcttca agagatcgag cttcttttgc  14580accacaaggt cgaggatcca aca                                          14603<210>17<211>11127<212>DNA<213>人工序列<220><223>人工序列说明:pZU578<220><221>misc_feature<222>(1485)..(3491)<223>编码H04毒素部分加Cry1Ab尾头40个氨基酸的合成核苷酸序列<220><221>misc_feature<222>(5052)..(6271)<223>PMI<220><221>misc_feature<222>(3859)..(5030)<223>SMAS启动子<220><221>misc_feature<222>(56)..(1475)<223>肌动蛋白2启动子U41998<400>17ggccgcagcg gccatttaaa tcaattgggc gcgccgaatt cgagctcggt accctgcatg      60cctgcaggtc gacaaaattt agaacgaact taattatgat ctcaaataca ttgatacata     120tctcatctag atctaggtta tcattatgta agaaagtttt gacgaatatg gcacgacaaa     180atggctagac tcgatgtaat tggtatctca actcaacatt atacttatac caaacattag     240ttagacaaaa tttaaacaac tattttttat gtatgcaaga gtcagcatat gtataattga     300ttcagaatcg ttttgacgag ttcggatgta gtagtagcca ttatttaatg tacatactaa     360tcgtgaatag tgaatatgat gaagcattgt atcttattgt ataaatatcc ataaacacat     420catgaaagac actttctttc acggtctgaa ttaattatga cacaattcta atagaaaacg     480aattaaatta cgttgaattg tatgaaatct aattgaacaa gccaaccacg acgacgacta     540acgttgcctg gattgactcg gtttaagtta accactaaaa aaacggagct gtcatgtaac     600acgcggatcg agcaggtcac agtcatgaag ccatcaaagc aaaagaacta atccaagggc     660tgagatgatt aattagttta aaaattagtt aacacgaggg aaaaggctgt ctgacagcca     720ggtcacgtta tctttacctg tggtcgaaat gattcgtgtc tgtcgatttt aattattttt     780ttgaaaggcc gaaaataaag ttgtaagaga taaacccgcc tatataaatt catatatttt     840cctctccgct ttgaattgtc tcgttgtcct cctcactttc atcagccgtt ttgaatctcc     900ggcgacttga cagagaagaa caaggaagaa gactaagaga gaaagtaaga gataatccag     960gagattcatt ctccgttttg aatcttcctc aatctcatct tcttccgctc tttctttcca    1020aggtaatagg aactttctgg atctacttta tttgctggat ctcgatcttg ttttctcaat    1080ttccttgaga tctggaattc gtttaatttg gatctgtgaa cctccactaa atcttttggt    1140tttactagaa tcgatctaag ttgaccgatc agttagctcg attatagcta ccagaatttg    1200gcttgacctt gatggagaga tccatgttca tgttacctgg gaaatgattt gtatatgtga    1260attgaaatct gaactgttga agttagattg aatctgaaca ctgtcaatgt tagattgaat    1320ctgaacactg tttaagttag atgaagtttg tgtatagatt cttcgaaact ttaggatttg    1380tagtgtcgta cgttgaacag aaagctattt ctgattcaat cagggtttat ttgactgtat    1440tgaactcttt ttgtgtgttt gcagctcata aaaaggatcc aacaatggac aacaacccca    1500acatcaacga gtgcatcccc tacaactgcc tgagcaaccc cgaggtggag gtgctgggcg    1560gcgagcgcat cgagaccggc tacaccccca tcgacatcag cctgagcctg acccagttcc    1620tgctgagcga gttcgtgccc ggcgccggct tcgtgctggg cctggtggac atcatctggg    1680gcatcttcgg ccccagccag tgggacgcct tcctggtgca gatcgagcag ttgataaacc    1740aacgcataga ggaattcgcc cgcaaccagg ccatcagccg cctggagggc ctgagcaacc    1800tgtaccaaat ctacgccgag agcttccgcg agtgggaggc cgaccccacc aaccccgccc    1860tgcgcgagga gatgcgcatc cagttcaacg acatgaacag cgccctgacc accgccatcc    1920ccctgttcgc cgtgcagaac taccaggtgc ccctgctgag cgtgtacgtg caggccgcca    1980acctgcacct gagcgtgctg cgcgacgtca gcgtgttcgg ccagcgctgg ggcttcgacg    2040ccgccaccat caacagccgc tacaacgacc tgacccgcct gatcggcaac tacaccgacc    2100acgccgtgcg ctggtacaac accggcctgg agcgcgtgtg gggtcccgac agccgcgact    2160ggatcaggta caaccagttc cgccgcgagc tgaccctgac cgtgctggac atcgtgagcc    2220tgttccccaa ctacgacagc cgcacctacc ccatccgcac cgtgagccag ctgacccgcg    2280agatttacac caaccccgtg ctggagaact tcgacggcag cttccgcggc agcgcccagg    2340gcatcgaggg cagcatccgc agcccccacc tgatggacat cctgaacagc atcaccatct    2400acaccgacgc ccaccgcggc gagtactact ggagcggcca ccagatcatg gccagccccg    2460tcggcttcag cggccccgag ttcaccttcc ccctgtacgg caccatgggc aacgctgcac    2520ctcagcagcg catcgtggca cagctgggcc agggagtgta ccgcaccctg agcagcaccc    2580tgtaccgtcg acctttcaac atcggcatca acaaccagca gctgagcgtg ctggacggca    2640ccgagttcgc ctacggcacc agcagcaacc tgcccagcgc cgtgtaccgc aagagcggca    2700ccgtggacag cctggacgag atcccccctc agaacaacaa cgtgccacct cgacagggct    2760tcagccaccg tctgagccac gtgagcatgt tccgcagtgg cttcagcaac agcagcgtga    2820gcatcatccg tgcacccatg ttcagctgga ttcaccgcag cgccaccctg accaacacca    2880tcgaccccga gcgcatcaac cagatccccc tggtgaaggg cttccgggtg tggggcggca    2940ccagcgtgat caccggcccc ggcttcaccg gaggcgacat cctgcgcaga aacaccttcg    3000gcgacttcgt gagcctgcag gtgaacatca acagccccat cacccagcgt taccgcctgc    3060gcttccgcta cgccagcagc cgcgacgccc gtgtgatcgt gctgactggc gccgctagca    3120ccggtgtggg cggtcaggtg agcgtgaaca tgcccctgca gaagactatg gagatcggcg    3180agaacctgac tagtcgcacc ttccgctaca ccgacttcag caaccccttc agcttccgcg    3240ccaaccccga catcatcggc atcagcgagc agcccctgtt cggtgccggc agcatcagca    3300gcggcgagct gtacatcgac aagatcgaga tcatcctggc cgacgccacc ttcgaggccg    3360agagcgacct ggagcgcgcc cagaaggccg tgaacgccct gttcaccagc agcaaccaga    3420tcggcctgaa gaccgacgtg accgactacc acatcgacca ggtgagcaac ctggtggact    3480gcttaagcta gagatcctct agagtcgacc atggtgatca ctgcagatcg ttcaaacatt    3540tggcaataaa gtttcttaag attgaatcct gttgccggtc ttgcgatgat tatcatataa    3600tttctgttga attacgttaa gcatgtaata attaacatgt aatgcatgac gttatttatg    3660agatgggttt ttatgattag agtcccgcaa ttatacattt aatacgcgat agaaaacaaa    3720atatagcgcg caacctagga taaattatcg cgcgcggtgt catctatgtt actagatctc    3780tagaaagctt cgtacgttaa ttaattcgaa tccggagcgg ccgcagggct agcatcgatg    3840gtaccgagct cgagactata caggccaaat tcgctcttag ccgtacaata ttactcaccg    3900gtgcgatgcc ccccatcgta ggtgaaggtg gaaattaatg atccatcttg agaccacagg    3960cccacaacag ctaccagttt cctcaagggt ccaccaaaaa cgtaagcgct tacgtacatg    4020gtcgataaga aaaggcaatt tgtagatgtt aacatccaac gtcgctttca gggatcccga    4080attccaagct tggaattcgg gatcctacag gccaaattcg ctcttagccg tacaatatta    4140ctcaccggtg cgatgccccc catcgtaggt gaaggtggaa attaatgatc catcttgaga    4200ccacaggccc acaacagcta ccagtttcct caagggtcca ccaaaaacgt aagcgcttac    4260gtacatggtc gataagaaaa ggcaatttgt agatgttaac atccaacgtc gctttcaggg    4320atcccgaatt ccaagcttgg aattcgggat cctacaggcc aaattcgctc ttagccgtac    4380aatattactc accggtgcga tccccccatc gtaggtgaag gtggaaatta atgatccatc    4440ttgagaccac aggcccacaa cagctaccag tttcctcaag ggtccaccaa aaacgtaagc    4500gcttacgtac atggtcgata agaaaaggca atttgtagat gttaacatcc aacgtcgctt    4560tcagggatcc cgaattccaa gcttgggctg caggtcaatc ccattgcttt tgaagcagct    4620caacattgat ctctttctcg agggagattt ttcaaatcag tgcgcaagac gtgacgtaag    4680tatccgagtc agtttttatt tttctactaa tttggtcgtt tatttcggcg tgtaggacat    4740ggcaaccggg cctgaatttc gcgggtattc tgtttctatt ccaacttttt cttgatccgc    4800agccattaac gacttttgaa tagatacgct gacacgccaa gcctcgctag tcaaaagtgt    4860accaaacaac gctttacagc aagaacggaa tgcgcgtgac gctcgcggtg acgccatttc    4920gccttttcag aaatggataa atagccttgc ttcctattat atcttcccaa attaccaata    4980cattacacta gcatctgaat ttcataacca atctcgatac accaaatcga gatctgcagg    5040gatccccgat catgcaaaaa ctcattaact cagtgcaaaa ctatgcctgg ggcagcaaaa    5100cggcgttgac tgaactttat ggtatggaaa atccgtccag ccagccgatg gccgagctgt    5160ggatgggcgc acatccgaaa agcagttcac gagtgcagaa tgccgccgga gatatcgttt    5220cactgcgtga tgtgattgag agtgataaat cgactctgct cggagaggcc gttgccaaac    5280gctttggcga actgcctttc ctgttcaaag tattatgcgc agcacagcca ctctccattc    5340aggttcatcc aaacaaacac aattctgaaa tcggttttgc caaagaaaat gccgcaggta    5400tcccgatgga tgccgccgag cgtaactata aagatcctaa ccacaagccg gagctggttt    5460ttgcgctgac gcctttcctt gcgatgaacg cgtttcgtga attttccgag attgtctccc    5520tactccagcc ggtcgcaggt gcacatccgg cgattgctca ctttttacaa cagcctgatg    5580ccgaacgttt aagcgaactg ttcgccagcc tgttgaatat gcagggtgaa gaaaaatccc    5640gcgcgctggc gattttaaaa tcggccctcg atagccagca gggtgaaccg tggcaaacga    5700ttcgtttaat ttctgaattt tacccggaag acagcggtct gttctccccg ctattgctga    5760atgtggtgaa attgaaccct ggcgaagcga tgttcctgtt cgctgaaaca ccgcacgctt    5820acctgcaagg cgtggcgctg gaagtgatgg caaactccga taacgtgctg cgtgcgggtc    5880tgacgcctaa atacattgat attccggaac tggttgccaa tgtgaaattc gaagccaaac    5940cggctaacca gttgttgacc cagccggtga aacaaggtgc agaactggac ttcccgattc    6000cagtggatga ttttgccttc tcgctgcatg accttagtga taaagaaacc accattagcc    6060agcagagtgc cgccattttg ttctgcgtcg aaggcgatgc aacgttgtgg aaaggttctc    6120agcagttaca gcttaaaccg ggtgaatcag cgtttattgc cgccaacgaa tcaccggtga    6180ctgtcaaagg ccacggccgt ttagcgcgtg tttacaacaa gctgtaagag cttactgaaa    6240aaattaacat ctcttgctaa gctgggagct cgtcgacgga tcgaattcct gcagatcgtt    6300caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta    6360tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt    6420tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag    6480aaaacaaaat atagcgcgca acctaggata aattatcgcg cgcggtgtca tctatgttac    6540tagatctcta gaactagtgg atctgctagc cctgcaggaa atttaccggt gcccgggcgg    6600ccagcatggc cgtatccgca atgtgttatt aagttgtcta agcgtcaatt tgtttacacc    6660acaatatatc ctgccaccag ccagccaaca gctccccgac cggcagctcg gcacaaaatc    6720accactcgat acaggcagcc catcagaatt aattctcatg tttgacagct tatcatcgac    6780tgcacggtgc accaatgctt ctggcgtcag gcagccatcg gaagctgtgg tatggctgtg    6840caggtcgtaa atcactgcat aattcgtgtc gctcaaggcg cactcccgtt ctggataatg    6900ttttttgcgc cgacatcata acggttctgg caaatattct gaaatgagct gttgacaatt    6960aatcatcggc tcgtataatg tgtggaattg tgagcggata acaatttcac acaggaaaca    7020gaccatgagg gaagcggtga tcgccgaagt atcgactcaa ctatcagagg tagttggcgt    7080catcgagcgc catctcgaac cgacgttgct ggccgtacat ttgtacggct ccgcagtgga    7140tggcggcctg aagccacaca gtgatattga tttgctggtt acggtgaccg taaggcttga    7200tgaaacaacg cggcgagctt tgatcaacga ccttttggaa acttcggctt cccctggaga    7260gagcgagatt ctccgcgctg tagaagtcac cattgttgtg cacgacgaca tcattccgtg    7320gcgttatcca gctaagcgcg aactgcaatt tggagaatgg cagcgcaatg acattcttgc    7380aggtatcttc gagccagcca cgatcgacat tgatctggct atcttgctga caaaagcaag    7440agaacatagc gttgccttgg taggtccagc ggcggaggaa ctctttgatc cggttcctga    7500acaggatcta tttgaggcgc taaatgaaac cttaacgcta tggaactcgc cgcccgactg    7560ggctggcgat gagcgaaatg tagtgcttac gttgtcccgc atttggtaca gcgcagtaac    7620cggcaaaatc gcgccgaagg atgtcgctgc cgactgggca atggagcgcc tgccggccca    7680gtatcagccc gtcatacttg aagctaggca ggcttatctt ggacaagaag atcgcttggc    7740ctcgcgcgca gatcagttgg aagaatttgt tcactacgtg aaaggcgaga tcaccaaggt    7800agtcggcaaa taaagctcta gtggatcccc gaggaatcgg cgtgacggtc gcaaaccatc    7860cggcccggta caaatcggcg cggcgctggg tgatgacctg gtggagaagt tgaaggccgc    7920gcaggccgcc cagcggcaac gcatcgaggc agaagcacgc cccggtgaat cgtggcaagc    7980ggccgctgat cgaatccgca aagaatcccg gcaaccgccg gcagccggtg cgccgtcgat    8040taggaagccg cccaagggcg acgagcaacc agattttttc gttccgatgc tctatgacgt    8100gggcacccgc gatagtcgca gcatcatgga cgtggccgtt ttccgtctgt cgaagcgtga    8160ccgacgagct ggcgaggtga tccgctacga gcttccagac gggcacgtag aggtttcagc    8220agggccggcc ggcatggcca gtgtgtggga ttacgacctg gtactgatgg cggtttccca    8280tctaaccgaa tccatgaacc gataccggga agggaaggga gacaagcccg gccgcgtgtt    8340ccgtccacac gttgcggacg tactcaagtt ctgccggcga gccgatggcg gaaagcagaa    8400agacgacctg gtagaaacct gcattcggtt aaacaccacg cacgttgcca tgcagcgtac    8460gaagaaggcc aagaacggcc gcctggtgac ggtatccgag ggtgaagcct tgattagccg    8520ctacaagatc gtaaagagcg aaaccgggcg gccggagtac atcgagatcg agctagctga    8580ttggatgtac cgcgagatca cagaaggcaa gaacccggac gtgctgacgg ttcaccccga    8640ttactttttg atcgatcccg gcatcggccg ttttctctac cgcctggcac gccgcgccgc    8700aggcaaggca gaagccagat ggttgttcaa gacgatctac gaacgcagtg gcagcgccgg    8760agagttcaag aagttctgtt tcaccgtgcg caagctgatc gggtcaaatg acctgccgga    8820gtacgatttg aaggaggagg cggggcaggc tggcccgatc ctagtcatgc gctaccgcaa    8880cctgatcgag ggcgaagcat ccgccggttc ctaatgtacg gagcagatgc tagggcaaat    8940tgccctagca ggggaaaaag gtcgaaaagg tctctttcct gtggatagca cgtacattgg    9000gaacccaaag ccgtacattg ggaaccggaa cccgtacatt gggaacccaa agccgtacat    9060tgggaaccgg tcacacatgt aagtgactga tataaaagag aaaaaaggcg atttttccgc    9120ctaaaactct ttaaaactta ttaaaactct taaaacccgc ctggcctgtg cataactgtc    9180tggccagcgc acagccgaag agctgcaaaa agcgcctacc cttcggtcgc tgcgctccct    9240acgccccgcc gcttcgcgtc ggcctatcgc ggccgctggc cgctcaaaaa tggctggcct    9300acggccaggc aatctaccag ggcgcggaca agccgcgccg tcgccactcg accgccggcg    9360ctgaggtctg cctcgtgaag aaggtgttgc tgactcatac caggcctgaa tcgccccatc    9420atccagccag aaagtgaggg agccacggtt gatgagagct ttgttgtagg tggaccagtt    9480ggtgattttg aacttttgct ttgccacgga acggtctgcg ttgtcgggaa gatgcgtgat    9540ctgatccttc aactcagcaa aagttcgatt tattcaacaa agccgccgtc ccgtcaagtc    9600agcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg    9660agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa    9720agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc    9780tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg    9840tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat    9900ggcaaaagct ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg    9960gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc   10020ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg   10080aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct   10140ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca   10200gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct   10260cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc   10320gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt   10380tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc   10440cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc   10500cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg   10560gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc   10620agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag   10680cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga   10740tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat   10800tttggtcatg agattatcaa aaaggatctt cacctagatc cttttgatcc ggaattaatt   10860cctgtggttg gcatgcacat acaaatggac gaacggataa accttttcac gcccttttaa   10920atatccgatt attctaataa acgctctttt ctcttaggtt tacccgccaa tatatcctgt   10980caaacactga tagtttaaac tgaaggcggg aaacgacaat ctgatcatga gcggagaatt   11040aagggagtca cgttatgacc cccgccgatg acgcgggaca agccgtttta cgtttggaac   11100tgacagaacc gcaacgctgc aggaatt                                       11127

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号