法律状态公告日
法律状态信息
法律状态
2011-11-09
未缴年费专利权终止 IPC(主分类):A01N63/00 授权公告日:20071212 终止日期:20100823 申请日:20010823
专利权的终止
2007-12-12
授权
授权
2003-12-17
实质审查的生效
实质审查的生效
2003-10-15
公开
公开
技术领域
本发明涉及新的来自苏云金芽孢杆菌杀虫晶体蛋白的杀虫毒素,表达所述蛋白的核酸序列,以及制备和使用所述毒素和相应核酸序列以控制昆虫的方法。
背景技术
虫害是造成作物减产的主要原因。仅在美国由多种属昆虫侵染造成的损失就达数十亿美圆。除大田作物的损失之外,虫害还是蔬菜和水果培育者、观赏花卉生产者的负担,同时它们也是花匠和房主们的祸害。
虫害主要是通过集中施用化学杀虫剂进行控制,这些化学杀虫剂通过抑制昆虫生长,妨碍昆虫进食或繁殖,或者致使昆虫死亡来发挥活性。这样可以很好地控制昆虫,但这些化学物质有时候也影响其它有益的昆虫。广泛应用化学杀虫剂所导致的另一个问题是抗性昆虫变种的出现。虽然这种情况可以通过多种抗性管理策略进行部分地缓解,但对替代性的虫害防治剂的需求仍日益增强。
生物学昆虫防治剂,如表达杀虫毒素的苏云金芽胞杆菌(Bacillus thuringiensis)菌株的应用已经取得了令人满意的效果,成为化学杀虫剂的一种替代或补充。苏云金芽胞杆菌(Bacillusthuringiensis)属于革兰氏阳性、需氧、形成内孢子的细菌大组。与其它非常相近的芽孢杆菌种,例如蜡状芽孢杆菌(B.cereus)或炭疽芽孢杆菌(B.anthracis)不同,目前已知的苏云金芽胞杆菌(Bacillus thuringiensis)种大多数在其芽胞形成过程中形成一种伴胞包涵体(parasporal inclusion body),鉴于其晶体结构,通常将其称为晶体(crystalline body)。所述的晶体包含具有杀虫活性的晶体原毒素蛋白,既所谓的δ-内毒素。这些蛋白晶体负责苏云金芽胞杆菌(Bacillus thuringiensis)对昆虫的毒性。所谓的δ-内毒素直到所述晶体(crystalline body)经口摄入并溶解于靶昆虫的肠液后才表现出杀虫活性。大多数情况下,实际的毒性组分是由来自昆虫消化道的蛋白酶对原毒素进行蛋白水解切割而释放的。所述的多种苏云金芽胞杆菌(Bacillus thuringiensis)菌株的δ-内毒素具有针对特定的靶昆虫,特别是对于多种鳞翅目,鞘翅目和双翅目幼虫的高度特异性的特征,并且对这些幼虫具有高度的活性。应用苏云金芽胞杆菌(Bacillus thuringiensis)δ-内毒素进一步的优势在于,所述的毒素对人,其它哺乳动物,鸟类和鱼是无害的。
根据序列同源性和杀虫特异性,可将苏云金芽胞杆菌(Bacillusthuringiensis)晶体蛋白分成不同的类。研究得最多的是Cry1类蛋白,该蛋白是作为140kDa的原毒素产生的,对鳞翅目昆虫具有毒性。在一定程度上已阐明了晶体蛋白的作用模式。经口摄入后所述的晶体溶解于幼虫中肠的碱性环境。随后中肠蛋白酶(如胰蛋白酶)将溶解的蛋白加工成约65kDa的抗蛋白酶毒性片段,所述的毒性片段与昆虫中肠上皮细胞受体相结合并穿透细胞膜。这最终导致细胞破裂和幼虫死亡。
易感昆虫中肠上皮细胞上存在的受体在很大程度上决定了特定晶体蛋白的活性谱。上述的谱也是由所述晶体蛋白的溶解效率和体内蛋白水解活化作用共同决定的。所述晶体蛋白与中肠上皮受体结合的重要性通过下述事实得到进一步的证明,即当昆虫对一种晶体蛋白产生了抗性时,晶体蛋白与抗性昆虫中肠上皮细胞的结合明显下降。
在过去的几年中,已经分离出了一些编码上述晶体蛋白的基因,其在异源宿主中的表达为控制在经济学上重要的虫害提供了另一种工具。特别地,在转基因植物中杀虫毒素,如苏云金芽胞杆菌(Bacillus thuringiensis)晶体蛋白的表达对选定的虫害提供了有效的防护,表达这些毒素的转基因植物已商业化,这使农民减少了对化学昆虫防治剂的应用。而且,也可以表达具有经选择的意在增强针对特定昆虫或昆虫种类杀虫活性,或意在扩大毒素蛋白杀虫谱的组合功能的重组毒素。例如可通过将δ-内毒素的毒素部分与其它δ-内毒素原毒素(尾部)部分结合构建具有自然界不存在的新序列的嵌合杀虫蛋白。参见,例如引入此处作为参考的WO 98/15170。
据认为晶体蛋白毒性片段包含三个不同的结构域。结构域I,最N-末端的结构域,由7个α-螺旋组成,可能部分或全部插入到靶细胞膜中。结构域II在所谓Greek key-构象中包含3个β-折叠。大多数的研究者认为结构域II与受体相互作用,因此决定毒素的特异性。的确,存在许多的证据暗示结构域II残基涉及特异的毒性和高度亲和结合。结构域III,最C-末端结构域,由在所谓jellyroll构象中的两个β-折叠组成,也暗示着其与确定特异性相关。例如通过编码区之间的体内重组在毒素之间交换结构域III能够导致特异活性的改变。利用这种杂合体进行的结合实验表明结构域III涉及与推定的靶昆虫受体的结合,表明结构域III可能通过受体识别功能行使其在特异性方面的功能。如果投射在Cry1序列上,结构域I从约第28位到第260位残基,结构域II由约第260位到第460位,结构域III由约第460位到第600位。参见Nakamura等,Agric.Biol.Chem.54(3):715-724(1990);Li等,Nature 353:815-821(1991);Ge等,J.Biol.Chem.266(27):17954-17958(1991);和Honee等,Mol.Microbiol.5(11):2799-2806(1991);上述各篇均引入此处作为参考。在此处引入作为参考的U.S.Pat.No.5,736,131描述了在其C-末端包含第一Cry蛋白结构域III、在其N-末端包含第二Cry蛋白结构域I和II的苏云金芽胞杆菌(Bacillusthuringiensis)杂合体毒素片段。这种杂合晶体蛋白具有改变了的杀虫活性。例如,同样在De Maagd等,Appl.Environ.Microbiol.62(5):1537-1543(1996)中描述的H04杂合毒素在其N-末端包含Cry1Ab的结构域I和II,在其C-末端包含Cry1C的结构域III。据报道与亲本的Cry1Ab毒素相比,H04对甜菜粘虫(spodopteraexigua)具有高毒性,并且比亲本的Cry1C也有明显地更高毒性。也参见Bosch等,FEMS Microbiology Letters 118:129-134(1994);Bosch等,Bio/Technology 12:915-918(1994);De Maagd等,Appl.Environ.Microbiol.62(8):2753-2757(1996);和DeMaagd等,Mol.Microbiol.31(2):463-471(1999);以上各篇均引入此处作为参考。
尽管通过育种程序和遗传工程掺入昆虫抗性基因获得了成功,仍然存在长期渴望并仍未实现的对发现新的有效昆虫防治剂的需求。特别需要能靶向经济上重要的虫害,如欧洲玉米螟(European CornBorer)和草地夜蛾(Fall Army Worm),并能有效控制对现有的昆虫防治剂具有抗性的昆虫种类的控制剂。而且,需要施用后对环境的影响降到最低的试剂。
发明内容
本发明通过提供编码杂合苏云金芽胞杆菌(Bacillusthuringiensis)毒素的新的基因序列以满足上述需求,所述新的基因序列包括为在植物中表达而优化的合成的核苷酸序列。在优选的实施方案中,所述的新基因序列编码杂合苏云金芽胞杆菌(Bacillusthuringiensis)δ-内毒素H04的不同形式,其毒素部分包含Cry1Ab的结构域I和II和Cry1C的结构域III。由所述的新基因序列编码的杂合苏云金芽胞杆菌毒素对下述经济上重要的虫害具有高度的活性,如草地夜蛾(fall armyworm),红铃麦蛾(pinkbollworm),烟夜蛾(tobacco budworm),欧洲玉米螟(Europeancornborer)和菜蛾(diamondback moth)。所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素可用于多种昆虫防治策略中,以获得最高的效率和最低的环境影响。
本发明进一步涉及由本发明的核苷酸序列表达产生的杂合杀虫毒素,及包含所述杂合杀虫毒素的组合物和制剂,它们能够抑制害虫存活,生长或繁殖的能力,或者限制害虫相关的农作物损害和亏损。本发明进一步涉及制造所述杂合毒素的方法,以及使用所述核苷酸序列的方法,例如,在转基因植物中赋予昆虫抗性,和使用所述毒素、包含所述毒素的组合物及制剂的方法,例如,在受昆虫侵染的区域应用所述的毒素、组合物或制剂,或预防性地处理易受昆虫侵染的区域或植物,以赋予其对有害昆虫的防护或抗性。所述的杂合毒素可用于复合昆虫防治策略,以获得最高的效率和最低的环境影响。
一方面本发明提供控制下述昆虫的方法,所述昆虫选自草地夜蛾(fall armyworm),红铃麦蛾(pink bollworm),烟夜蛾(tobacco budworm),欧洲玉米螟(European cornborer)和菜蛾(diamondback moth),该方法包括向所述昆虫递送有效量的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素,该毒素包含来自Cry1Ab毒素的结构域I和II以及按由氨基到羧基方向与它们结合的来自Cry1C毒素的结构域III。在一个优选的实施方案中,所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素包含与SEQ IDNO:2,4,6,8,或10至少90%同一的氨基酸序列。在一个更优选的实施方案中,所述的杂合苏云金芽胞杆菌(Bacillusthuringiensis)毒素包含SEQ ID NO:2,4,6,8,或10。
在本发明上述方法的又一实施方案中,所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素进一步包含C-末端尾区域,如Cry1C尾区域或Cry1Ab尾区域。所述的C-末端尾区域可以是全长的也可以是截短的,如约40个氨基酸长。
在本发明上述方法的一个优选的实施方案中,向昆虫递送有效量的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素包括用含编码所述杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素的核苷酸序列的重组DNA转化的转基因植物组织饲喂或接触昆虫,其中,所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素在所述转基因植物组织中的表达赋予了对所述昆虫的抗性。优选地,所述核苷酸序列基本上与SEQ ID NO:1,3,5,7,或9同一。
另一方面,本发明提供了包含编码杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素的核苷酸序列的分离的核酸分子,所述毒素包括(a)含来自Cry1Ab毒素的结构域I和II以及按由氨基到羧基方向与之结合的来自Cry1C毒素的结构域III的N-端毒素部分;和(b)来自Cry1Ab毒素的C-端尾区域。优选地,所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素包含与SEQ IDNO:6,8,或10至少90%同一的氨基酸序列。更优选地,所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素包含SEQ ID NO:6,8,或10。更优选地,所述核苷酸序列与SEQ ID NO:5,7,或9至少90%同一。最优选地,所述核苷酸序列包含SEQ ID NO:5,7,或9。
本发明进一步提供包含与异源启动子序列可操作地连接的本发明如上所述核酸分子的嵌合基因;包含所述嵌合基因的重组载体;包含所述嵌合基因的转基因宿主细胞(如,植物细胞);含上述转基因植物细胞的转基因植物(如,玉米,棉花,稻,或甘兰植物);以及上述转基因植物的种子。
又一方面本发明提供使植物抗昆虫的方法,该方法包括在用下述嵌合基因转化的植物中表达杂合苏云金芽胞杆菌(Bacillusthuringiensis)毒素,所述嵌合基因包含:(a)能在植物中启动相关的编码序列高水平转录的核酸启动子序列,和(b)与所述启动子可操作地连接的本发明的核酸分子,其中,所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素在所述植物中的表达能使所述植物抗昆虫。
再一方面,本发明提供生产具有抗昆虫活性的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素的方法,该方法包括(a)获得本发明的转基因宿主细胞;和(b)在所述转基因宿主细胞中表达本发明的核酸分子,从而产生有效地抗昆虫的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素。
再一方面,本发明提供生产抗昆虫植物的方法,该方法包括将本发明的核酸分子引入所述植物,其中所述的核酸分子能在所述植物中以有效地控制昆虫的量表达。
又一方面,本发明提供包含SEQ ID NO:3,5,7,9,11,12,13,14,15,16或17的分离的核酸分子;含与上述核酸分子可操作地相连的异源启动子的嵌合基因;含上述嵌合基因的重组载体;含上述嵌合基因的转基因宿主细胞(如,植物细胞);含上述转基因植物细胞的转基因植物(如,玉米,棉花,稻,或甘兰植物);和上述转基因植物的种子。
在又一方面中,本发明提供杂合苏云金芽胞杆菌(Bacillusthuringiensis)毒素,该毒素包含:(a)含来自Cry1Ab毒素的结构域I和II以及与它们按由氨基端到羧基端方向结合的来自Cry1C毒素的结构域III的N-末端毒素部分;和(b)来自Cry1Ab毒素的C-末端尾区域。优选地,所述的杂合苏云金芽胞杆菌(Bacillusthuringiensis)毒素包含与SEQ ID NO:6,8,或10至少90%同一的氨基酸序列。更优选地,所述的杂合苏云金芽胞杆菌(Bacillusthuringiensis)毒素包含SEQ ID NO:6,8,或10。
另一方面,本发明提供含控制昆虫有效量的本发明的杂合苏云金芽胞杆菌(Bacillus thuringiensis)毒素的组合物。
通过本发明的下述描述和非限制性的实施例本领域的技术人员能够清楚地了解本发明的其它方面和有益之处。
序列表中序列的简要描述
SEQ ID NO:1是De Maagd等,Appl.Environ.Microbiol.62(5):1537-1543(1996)中描述的编码H04杂合毒素的核苷酸序列,其毒素部分包括位于其N-末端的Cry1Ab结构域I和II和位于其C-末端的Cry1C的结构域III,加上全长的Cry1C尾部分。
SEQ ID NO:2是SEQ ID NO:1中所述的核苷酸序列编码的H04杂合毒素的氨基酸序列,其包括Cry1Ab毒素结构域I和II和Cry1C的毒素结构域III,加上全长的Cry1C尾部分。
SEQ ID NO:3是合成的编码不带尾的H04毒素部分的核苷酸序列,如同胰蛋白酶位点已被切割。
SEQ ID NO:4是由SEQ ID NO:3描述的合成核苷酸序列编码的H04毒素部分的氨基酸序列。
SEQ ID NO:5是编码H04毒素部分加全长Cry1Ab尾部分的合成的核苷酸序列。
SEQ ID NO:6是由SEQ ID NO:5中描述的合成核苷酸序列编码的H04+Cry1Ab尾的氨基酸序列。
SEQ ID NO:7是编码H04毒素部分加全长Cry1Ab尾部分的另一合成的核苷酸序列。
SEQ ID NO:8是由SEQ ID NO:7中描述的合成核苷酸序列编码的H04+Cry1Ab尾的氨基酸序列。
SEQ ID NO:9是编码H04毒素部分加Cry1Ab尾头40个氨基酸的合成的核苷酸序列。
SEQ ID NO:10是由SEQ ID NO:9中描述的合成核苷酸序列编码的H04+40氨基酸的截短的Cry1Ab尾的氨基酸序列。
SEQ ID NO:11是构建体pNOV1308的核苷酸序列,其包含与如SEQ ID NO:3中所述的编码无尾的H04毒素部分的合成核苷酸序列可操作地连接的组成型玉米遍在蛋白启动子。
SEQ ID NO:12是构建体pNOV1436的核苷酸序列,其包含与如SEQ ID NO:5中所述的编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列可操作地连接的根偏好的玉米MTL启动子。
SEQ ID NO:13是构建体pNOV1441的核苷酸序列,其包含与如SEQ ID NO:5中所述的编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列可操作地连接的组成型玉米遍在蛋白启动子。
SEQ ID NO:14是构建体pNOV1305的核苷酸序列,其包含与如SEQ ID NO:7中所述的编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列可操作连接的组成型玉米遍在蛋白启动子。
SEQ ID NO:15是构建体pNOV1313的核苷酸序列,其包含与如SEQ ID NO:7中所述的编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列可操作连接的组成型玉米遍在蛋白启动子。
SEQ ID NO:16是构建体pNOV1435的核苷酸序列,其包含与如SEQ ID NO:9中所述的编码H04毒素部分加Cry1Ab尾头40个氨基酸的合成核苷酸序列可操作地连接的根偏好的玉米MTL启动子。
SEQ ID NO:17是构建体pZU578的核苷酸序列,其包含与如SEQID NO:9中所述的编码H04毒素部分加Cry1Ab尾头40个氨基酸的合成核苷酸序列可操作地连接的鼠耳芥属(Arabidopsis)肌动蛋白-2启动子。
定义
本发明的毒素的“活性”是指毒素作为经口有效的昆虫防治剂而起作用,具有毒性效力,或能破坏或阻止昆虫进食,其可能或不能引起昆虫死亡。当本发明的毒素递送到昆虫,典型的结果是昆虫死亡,或者昆虫不以使所述昆虫获得该毒素的来源为食。
“与......相关联/可操作地连接”指两核酸序列在物理上或功能上相关联。例如,若两序列可操作地相连,或处于一定的位置,使得调节DNA序列影响编码或结构DNA序列的表达水平,则称启动子或调节性的DNA与编码RNA或蛋白的DNA序列″相关联″。
“结合位点”是指分子上的某个位点,其中所述位点与毒素间的结合是可逆的,以使得位点与毒素间的Ka接近于至少104dm3mole-1。
“嵌合基因”是重组的核酸序列,其中启动子或调节核酸序列与编码mRNA或表达成蛋白的核酸序列可操作地连接或相关联,从而使调节核酸序列能调节转录或相关核酸分子的转录或表达。嵌合基因中的调节核酸序列通常并不与相关核酸序列如同自然界中所发现的那样可操作地连接或相关联。
“编码序列”是转录成RNA,如mRNA,rRNA,tRNA,snRNA,有意RNA或反义RNA的核酸序列。优选地,所述RNA之后在生物体中翻译产生蛋白。
互补的:“互补的”是指两核苷酸序列包含反向平行的核苷酸序列,它们能够通过在反向平行的核苷酸序列中的互补碱基残基之间形成氢键彼此配对。
特定核酸序列的“保守修饰的变异”是指编码同一或基本上同一的氨基酸序列的那些核酸序列,或当所述的核酸序列不编码氨基酸序列时,是指基本上同一的序列。由于遗传密码的简并性,大量功能上同一的核酸编码任一给定的多肽。例如密码子CGT,CGC,CGA,CGG,AGA,和AGG全部编码精氨酸。因此在密码子编码精氨酸的每个位置,所述的密码子可改变成上述的任一密码子而不改变所编码的蛋白。这种核酸变异是″沉默变异″,其是一种″保守修饰的变异″。除非另有说明,此处所述的编码蛋白的每个核酸序列也描述了每一种可能的沉默变异。本领域的技术人员可知核酸序列内的任一密码子(除通常是甲硫氨酸的唯一密码子的ATG外)均可通过常规的技术进行修饰以获得功能同一的分子。因此,编码蛋白的核酸分子的每种“沉默变异”均暗含于所述的序列中。
而且,本领域的技术人员可知当改变导致用化学上类似的氨基酸取代某氨基酸时,在编码序列中改变,添加或缺失单一氨基酸或小百分比的氨基酸(典型地是少于5%,更典型地是少于1%)的单独的替代,缺失或添加是″保守修饰的变异”。提供功能类似氨基酸的保守替代是本领域已知的。下述的五组中,每组氨基酸彼此之间均可进行保守替代:脂肪族的:甘氨酸(G),丙氨酸(A),缬氨酸(V),亮氨酸(L),异亮氨酸(I);芳香族的:苯丙氨酸(F),酪氨酸(Y),色氨酸(W);含硫的:甲硫氨酸(M),半胱氨酸(C);碱性的:精氨酸(R),赖氨酸(K),组氨酸(H);酸性的:天冬氨酸(D),谷氨酸(E),天冬酰胺(N),谷氨酰胺(Q)。参见Creighton(1984)Proteins,W.H.Freeman and Company。另外,在编码序列中改变,添加或缺失单一氨基酸或小百分数的氨基酸的单独的替代,缺失或添加也是″保守修饰的变异”。
对昆虫的“控制”通过毒性作用抑制害虫存活、生长、进食和/或繁殖,或限制昆虫相关的作物损害或损失。“控制”昆虫可指也可以不指杀死昆虫,尽管其优选地指杀死昆虫。
相应于:在本发明的上下文中,“相应于”或“相当于”指当不同的苏云金芽胞杆菌(Bacillus thuringiensis)δ-内毒素的核酸编码序列或氨基酸序列相互对比(aligned)时,“相当于”特定的列举位置的核酸或氨基酸是与这些位置相对比,但不一定处于与特定δ-内毒素的各自核酸编码序列或氨基酸序列相应的这些确切数值位置的那些。类似地,当特定的δ-内毒素(例如,Cry1B)的编码或氨基酸序列与参考的δ-内毒素(例如,Cry1Ab)的编码或氨基酸序列相对比时,相当于Cry1Ab序列中特定的某列举位置的Cry1B序列中的核酸或氨基酸是与Cry1Ab序列中的这些位置相对比,但不一定处于Cry1B毒素各核酸编码序列或氨基酸序列的这些确切数值位置中的那些。
“递送”毒素是指将所述毒素与昆虫相接触,导致毒性效果以及对昆虫的控制。所述的毒素可通过多种已知的方法递送,如通过昆虫摄食经口递送,或通过转基因植物的表达与昆虫相接触,配制成蛋白组合物,喷雾形式的蛋白组合物,毒饵基质,或任何本领域已知的毒素递送系统。
此处所用的“表达盒”是指能指导特定的核苷酸序列在适当的宿主中表达的核酸序列,其包括与有用核苷酸序列可操作连接的启动子,所述的核苷酸序列与终止信号可操作地相连接。典型地,它还包括使所述核苷酸序列正确翻译所需的序列。包含有用核苷酸序列的所述表达盒可以是嵌合的,这就是说,对于至少一种其它组分而言,至少一种其中的组分是异源的。所述的表达盒也可以是一种在自然界中存在的,但为有利于异源表达以重组形式获得的。但典型地,所述的表达盒相对宿主而言是异源的,即所述表达盒的特定核酸序列在天然状态下并不存在于宿主细胞中,必须通过转化事件引入到宿主细胞或其前体中。在表达盒中的核苷酸序列的表达可以在组成型或诱导型启动子的控制之下,其中诱导型启动子仅当宿主细胞暴露于特定的外部刺激之下时才启动转录。对于多细胞生物,如植物,所述的启动子也可以是对特定的组织、器官或发育阶段特异的。
基因:术语″基因″广泛地用于指任何与生物功能相关的DNA节段。因此,基因包括编码序列和/或其表达所需的调控序列。基因也包括非表达的DNA节段,例如,它形成其它蛋白的识别序列。基因可以由多种来源获得,包括从有用的来源中克隆或由已知的或预测的序列信息合成,也可以包括被设计为具有所需参数的序列。
″有用基因″是指当其转移到植物中后能赋予植物所需性状的任何基因,上述所需性状如抗生素抗性,病毒抗性,昆虫抗性,疾病抗性或对其它有害之物的抗性,除草剂耐受性,改善了的营养价值,在工业加工过程中改良了的性能,或改变了的繁殖能力。所述的“有用基因”也可以是在其转移到植物中后产生有商业价值的酶或代谢物的基因。
此处所用的“H04”是指在De Maagd等,Appl.Environ.Microbiol.62(5):1537-1543(1996)中所描述的杂合Bt毒素,其毒素片段在N-末端包含Cry1Ab的结构域I和II,在C-末端包含Cry1C的结构域III。
异源核酸序列:此处所用的术语″异源核酸[或DNA]序列″,″外源核酸[或DNA]节段″或″异源基因″均指来源于相对特定宿主细胞而言是外源的来源,或者如果是相同来源即是由原始形式经修饰的序列。因此在宿主细胞中的异源基因包括通过例如密码子优化而修饰的特定宿主细胞中的内源基因。该术语也包括那些天然存在序列的非天然多拷贝形式。因此该术语指外来或异源于所述细胞的核酸节段,或虽与宿主细胞同源,但处在宿主细胞核酸内该元件通常不存在的某个位置上的核酸节段。外源核酸节段表达产生外源多肽。
“同源”核酸[或DNA]序列是指与其被引入的宿主细胞天然相关的核酸[或DNA]序列。
“同源重组”是同源核酸分子间核酸片段的相互交换。
″同质体(Homoplastidic)″指植物,植物组织或植物细胞,其中所有的质体是遗传学上同一的。这是所述质体未经转化,突变或其它形式的遗传改变前在植物中的正常状态。在不同的组织,或发育阶段,所述的质体可以是不同的形式,如,叶绿体,前质体,黄化质体,造粉体,有色体,等。
在上下文中,术语两个或更多核酸或蛋白序列的″同一″或百分″同一性″是指应用下述的序列比较算法之一或通过视觉检验测量,当比较或对比最大值相应性时,两个或更多的序列或子序列相同,或具有指明百分数的相同氨基酸残基或核苷酸百分数。
“杀虫的”定义为能够控制昆虫的毒性生物活性,优选地是通过杀死昆虫的形式。
当核酸序列编码具有与参考核酸序列编码的多肽相同的氨基酸序列的多肽时所述核酸序列是“同类编码(isocoding with)”参考核酸序列。
“分离的”核酸分子或分离的酶是指通过人工操作使其脱离天然天然环境而存在的核酸分子或酶,因此,其不是天然产物。一种分离的核酸分子或酶可以以纯化的形式存在,或存在于非天然的环境如重组的宿主细胞中。
在杂合毒素中毒素结构域间,即本发明的杂合杀虫毒素结构域II和III间的“结合点”,是在所述杂合体中的同源交换区域或位点。在所述交换位点左侧的氨基酸来源于一个亲本毒素,而在所述交换位点右侧的氨基酸来源于另一个亲本毒素。
成熟蛋白:正常情况下靶定某种细胞器的蛋白,其中转运肽已被去除。
最小启动子(minimal promoter):启动子元件,特别是TATA元件,其在缺乏上游激活的情况下是非活性的,或具有大大降低的启动子活性。在合适的转录因子存在下,所述最小启动子起作用允许转录。
天然的:指存在于非转化细胞基因组中的基因。
天然地存在:术语″天然地存在″用于描述可在自然界中发现的对象,以区别于人工生产的对象。例如在生物体(包括病毒)中存在的蛋白或核苷酸序列,其可从自然来源中分离,未经过实验室中的有意的人工修饰,是天然存在的。
核酸:术语″核酸″指脱氧核糖核苷酸或核糖核苷酸及其单链或双链形式的多聚体。除非特别限定,该术语包括与参考核酸具有相似结合特性,含有天然核苷酸的已知类似物,并以与天然存在的核苷酸类似的方式代谢的核酸。除非另有说明,特定的核酸也暗指包括其经保守修饰的变异体(如简并的密码子取代)和互补序列以及明确说明的序列。具体地,简并密码子取代可以通过产生如下序列实现,在所述序列中,一个或多个选定的(或全部)密码子第三位被混合碱基或脱氧肌苷残基所取代(Batzer等,nucleic acid Res.19:5081(1991);Ohtsuka等,J.Biol.Chem.260:2605-2608(1985);Rosso1ini等,Mol.Cell.Probes 8:91-98(1994))。术语“核酸”或“核酸序列”可与基因,由基因编码的cDNA,和mRNA相互交换地使用。
“ORF”指开放阅读框。
蛋白的″部分″是指包含在所述蛋白内的肽,其具有所述蛋白至少80%的连续序列。
“植物”是在任意发育阶段的植物,特别是种子植物。
“植物细胞”是植物的结构和生理单位,其包括原生质体和细胞壁。所述的植物细胞可以是分离的单细胞或培养细胞形式,或作为高度组织化单位,如植物组织,植物器官,或整个植物的一部分。
“植物细胞培养物”是指下述植物单位的培养物,所述植物单位如,原生质体,细胞培养细胞(cell culture cells),植物组织中的细胞,花粉,花粉管,胚珠,胚囊,受精卵和不同发育阶段的胚。
“植物材料”指叶,茎,根,花或花的组成部分,果实,花粉,卵细胞,受精卵,种子,插条,细胞或组织培养物,或其它部分或植物产物。
“植物器官”是植物明显可见结构化的分化部分,如根,茎,叶,花蕾或胚。
此处所用的“植物组织”是指组织成结构和功能单位的植物细胞群。培养的或在植物中的任何植物组织均包含在内。这一术语包括但不限于,整个植株,植物器官,植物种子或组织培养物和任何组织成结构和功能单位的植物细胞群。单独使用该术语或将该术语与上述列举的或者包含在这一定义内的任意特定类型的植物组织结合使用,并不意味着排除任何其它类型的植物组织。
“启动子”是位于编码序列上游的非翻译的DNA序列,其包含RNA聚合酶II的结合位点,并启始DNA的转录。所述的启动子区域还可以包括作为基因表达调控序列的其它元件。
“原生质体”是没有细胞壁,或只带有细胞壁的一些部分的经分离的植物细胞。
纯化的:术语″纯化的″当应用于核酸或蛋白时,是指所述的核酸或蛋白基本上不带有天然状态下与所述核酸或蛋白相关的其它的细胞组分。优选的是以同质的状态存在,但其也可以是干燥的或水溶液的形式。纯度和同质性典型地是应用分析化学技术,如聚丙烯酰胺凝胶电泳或高效液相色谱来确定。在制剂中占优势种类的蛋白是基本上纯的。术语″纯化的″是指核酸或蛋白在电泳凝胶中基本上给出一条带的情况。具体说来,它是指至少约50%纯的核酸或蛋白,更优选至少约85%纯,最优选至少约99%纯。
当来自两核酸每一个的序列在子代核酸中相联合时,这两核酸″重组″。当两核酸均作为重组底物时,两序列″直接″重组。当两核酸需中间物,如交换寡核苷酸进行重组时,两核酸是″间接重组″。对于间接重组,不多于一个序列作为实际的重组底物,有些情况下两序列均不是用于重组的底物。
“调控元件”是指涉及控制核苷酸序列表达的序列。调控元件包含与有用核苷酸序列可操作连接的启动子和终止信号。典型地,其还包括使所述核苷酸序列正确翻译所需的序列。
基本上同一:在两核酸或蛋白序列上下文中词组″基本上同一″是指应用下述的序列比较算法之一或通过视觉检验测量,当比较或对比最大值相应性时,两个或更多的序列或子序列具有至少60%,优选80%,更优选90%,更优选95%,最优选至少99%的核苷酸或氨基酸序列同一性。优选地,在至少约50个残基长度,更优选至少约100个残基的序列区域中存在基本上同一,最优选该序列在至少约150个残基上基本上同一。在最优选的实施方案中,所述的序列在编码区全长内基本上同一。而且,基本上同一的蛋白或核酸序列执行基本上相同的功能。
对于序列比较,典型地将一个序列作为参考序列,将其它序列与该序列进行比较。当使用序列比较算法时,将待测序列和参考序列输入计算机,在需要时指定子序列坐标,并指定序列算法程序的参数。然后,基于指定的序列参数,所述的序列比较算法计算待测序列相对于参考序列的百分序列同一性。
用于比较的优化序列对比(a1ignment)可根据下述算法进行,Smith & Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法,Needleman & Wunsch,J.Mol.Biol.48:443(1970)的同源对比算法,Pearson & Lipman,Proc.Nat’l.Acad.Sci.USA 85:2444(1988)的相似性搜索方法,这些算法的计算机化执行(GAP,BESTFIT,FASTA,和TFASTA,见the Wisconsin GeneticsSoftware Package,Genetics Computer Group,575 Science Dr.,Madison,WI),或通过目测(一般见Ausubel等,下文)进行。
一个适合于确定序列百分同一性和序列相似性的算法是BLAST算法,其如Altschul等,J.Mol.Biol.215:403-410(1990)所述。执行BLAST分析的软件公众可以从国家生物技术信息中心获得(http://www.ncbi.nlm.nih.gov/)。这一算法包括首先通过鉴定在待查询序列中长度为W的短字段鉴定高得分序列对(HSPs),当所述的字段与数据库序列中相同长度的字段相对比时该字段匹配或符合某些正值的阈值得分T。T是指邻近字段的得分阈值(Altschul等,1990)。这些起始邻近字段的命中作为起始搜索以发现包含它们的更长HSP的“种晶”。只要累积对比得分能够增长,即可在每个序列中沿两个方向扩展命中的字段。累积得分可通过下述方式计算,对于核苷酸序列,用参数M(一对匹配残基的回报得分;总是>0)和N(不匹配残基的罚分;总是<0)。对于氨基酸序列,可用评分矩阵计算累积得分。当累积对比得分由其矩阵最高获得值衰减量X,一个或更多的负值残基对比的累积使累积分值达到0或0以下,或者达到了任一序列的末端,则在每一方向上命中字段的延伸停止。BLAST算法参数W,T,和X决定对比的灵敏度和速度。BLASTN程序(对于核苷酸序列)字段长度(W)缺省值为11,期望值(E)为10,截断(cutoff)为100,M=5,N=-4,及两条链的比较。对于氨基酸序列,BLASTP使用的缺省值字段长度(W)为3,期望值(E)为10,BLOSUM62评分矩阵(参见Henikoff & Henikoff,Proc.Natl.Acad Sci.USA 89:10915(1989))。
除了计算序列百分同一性外,BLAST算法还可进行两序列之间相似性的统计分析(参见,如,Karlin & Altschul,proc.Nat’l.Acad.Sci.USA 90:5873-5787(1993))。BLAST算法提供的一种相似性测定是最小总和概率(P(N)),它提供随机出现两核苷酸或氨基酸序列之间的匹配的可能性的指示。例如,测试核苷酸序列被认为与参照序列相似,条件是在测试核苷酸与参照核酸序列比较中的最小总和概率小于约0.1,更优选小于约0.01,最优选小于约0.001。
两核酸序列基本上同一的另一种指示是所述的两核酸分子在严谨条件下彼此杂交。词组“特异性杂交”是指一个分子在严谨条件下仅与存在于复杂的(如,细胞的总)DNA或RNA混合物中的特定核苷酸序列结合,双螺旋化或杂交。“基本上结合”是指核酸探针与靶核酸之间的互补杂交,并且包含少量的错配,这种错配可通过降低杂交介质的严谨度来包容,以达到所需的靶核酸序列检测。
核酸杂交试验,如Southern和Northern杂交中的″严谨杂交条件″和″严谨杂交洗涤条件″是序列依赖性的,而且在不同的环境参数下也是不同的。较长的序列在较高的温度下特异性杂交。Tijssen(1993)Laboratory Techniques in Biochemistry and MolecularBiology-Hybridization with nucleic Acid Probes part Ichapter 2″Overview of principles of hybridization and thestrategy of nucleic acid probe assays″Elsevier,New York中有对核酸杂交的详细指导。一般地,高严谨性杂交和洗涤条件选择为在低于确定的离子强度和pH下特定序列的热熔点(Tm)约5℃的条件。典型地,在″严谨条件″下探针可与靶序列杂交,但不与其它序列杂交。
Tm是指如下温度(在确定的离子强度和pH下),在该温度下50%的靶序列与完全匹配的探针杂交。非常严谨的条件是选择为等同于特定探针的Tm。一个用于具有100个以上互补残基的互补核酸,在Southern或northern印迹滤膜上杂交的严谨杂交条件的示例为含1mg肝素的50%甲酰胺,于42℃杂交过夜。高度严谨洗涤条件的示例为:0.15M NaCl于72℃下处理约15分钟。一个严谨的洗涤条件的例子是于65℃下,0.2x SSC中洗15分钟(参见,Sambrook,下文,SSC缓冲液的描述)。通常低严谨的洗涤在高严谨洗涤前应用以去除背景探针信号。对于例如多于100个核苷酸的双螺旋的中度严谨洗涤条件的示例为1x SSC,45℃下15分钟。对于例如多于100个核苷酸的双螺旋的低度严谨洗涤条件的示例为4-6x SSC,40℃下15分钟。对于短探针,(如,约10到50个核苷酸),严谨条件典型地包括,盐浓度低于约1.0M Na离子,典型的是约0.01到1.0M Na离子浓度(或其它的盐),pH7.0到8.3,温度典型的是至少为30℃。严谨条件也可通过添加去稳定试剂,如甲酰胺来达到。一般,在特定杂交试验中,信噪比比使用非相关探针所达到的结果高2x(或更高)表示特异性杂交检测。在严谨条件下不能彼此杂交的核酸在它们所编码的蛋白基本上同一时仍是基本上同一的。这出现在例如,一个核酸拷贝是利用遗传密码所允许的最大密码子简并性制造的时。
下述的杂交/洗涤条件示例可用于克隆与本发明的参考核苷酸序列基本上同一的同源核苷酸序列:一种参考核苷酸序列优选地与所述参考核苷酸序列在下述条件下杂交:于50℃下7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中杂交,在50℃下用2X SSC,0.1%SDS洗涤,更希望的是于50℃下7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中杂交,于50℃下用1X SSC,0.1%SDS洗涤,更希望的是于50℃下7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中杂交,于50℃下在0.5X SSC,0.1%SDS中洗涤,优选地于50℃下7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中杂交,于50℃下在0.1X SSC,0.1%SDS中洗涤,更优选的是于50℃下7%十二烷基硫酸钠(SDS),0.5M NaPO4,1mM EDTA中杂交,于65℃下在0.1X SSC,0.1%SDS中洗涤。
两种核酸序列或蛋白基本上同一的另一指示为由第一核酸编码的蛋白与由第二核酸编码的蛋白产生免疫交叉反应或特异性地相结合。因此,例如当两蛋白的区别仅在于保守取代时,第一蛋白与第二蛋白典型地基本上同一。
词组″特异性地(或选择性地)与某种抗体结合″或″特异性(或选择性地)与......发生免疫反应″,当指蛋白或肽时,是指结合反应,该反应可以确定在异质蛋白群或其它生物制剂中上述蛋白的存在。因此,在指定的免疫测定条件下,特定的抗体与特定的蛋白相结合而不以显著的量与存在于样品中的其它蛋白相结合。在这样的条件下与某种抗体的特异性结合需要选择针对特定蛋白具有特异性的抗体。例如,选择用带有由本发明的任何核酸编码的氨基酸序列的蛋白培育的抗体,可以获得与上述蛋白发生特异的免疫反应,且除多态性变异体之外不与其它蛋白发生免疫反应的抗体。多种免疫测定形式均可用于筛选可与特定蛋白进行特异地免疫反应的抗体。例如,固相ELISA免疫测定,Western印迹,或免疫组织化学都是常规用于筛选可与某种蛋白发生特异免疫反应的单克隆抗体的方法。用于确定特异性免疫反应的免疫测定形式和条件的描述参见Harlow和Lane(1988)Antibodies,A Laboratory Manual,Cold Spring HarborPublications,New York(“Harlow和Lane”)。典型地,特异性或选择性反应应至少两倍于背景信号或噪音,更典型地10倍以上-100倍于背景。
″子序列″指核酸或氨基酸序列,其分别包含较长的核酸或氨基酸(如蛋白)序列的一部分。
″合成的″指包含并不存在于天然序列中的结构特征的核苷酸序列。例如,非常接近地模仿单子叶和/或双子叶植物(dicot和/或monocot)基因G+C含量和正常的密码子分布的人工序列即被视为合成的序列。
“转化”是一种将异源核酸引入宿主细胞或生物体的过程。具体说来,″转化″是指将DNA分子稳定地整合到目的生物的基因组中。应当理解经转化的细胞,组织,或昆虫不仅包含转化过程的终产物还包括其转基因的子代。
“转化的/转基因的/重组的”是指宿主生物,如细菌或植物,在其中已引入了异源核酸分子。所述的核酸分子可以稳定地整合到宿主生物的基因组中,或者所述核酸分子也可以以染色体外分子的形式存在。这种染色体外分子可以进行自主复制。经转化的细胞,组织,或植物应当理解为不仅包含转化过程的终产物还包含其转基因子代。“非转化的”,“非转基因的”,或“非重组的”宿主指不含异源核酸分子的野生型的生物,如,细菌或植物。
核苷酸通过下述标准缩写表示的碱基表示:腺嘌呤(A),胞嘧啶(C),胸腺嘧啶(T),和鸟嘌呤(G)。氨基酸可由下述的标准缩写表示:丙氨酸(Ala;A),精氨酸(Arg;R),天冬酰胺(Asn;N),天冬氨酸(Asp;D),半胱氨酸(Cys;C),谷氨酰胺(Gln;Q),谷氨酸(Glu;E),甘氨酸(Gly;G),组氨酸(His;H),异亮氨酸(Ile;I),亮氨酸(Leu;L),赖氨酸(Lys;K),甲硫氨酸(Met;M),苯丙氨酸(Phe;F),脯氨酸(Pro;P),丝氨酸(Ser;S),苏氨酸(Thr;T),色氨酸(Trp;W),酪氨酸(Tyr;Y),和缬氨酸(Val;V)。而且用(Xaa;X)代表任意氨基酸。
本发明涉及表达为新的毒素的新核酸序列,以及制造和使用所述毒素以控制虫害。具体而言,本发明涉及经优化以便在植物中表达的合成的基因序列,该序列编码多种形式的所述的杂合苏云金芽胞杆菌(Bacillus thuringiensis)δ-内毒素H04,其毒素部分包含Cry1Ab的结构域I和II和Cry1C的结构域III。编码H04杂合毒素的杂合基因,如U.S.Pat.No.5,736,131和De Maagd等,Appl.Environ.Microbiol.62(5):1537-1543(1996)所述,由天然的cry1Ab和Cry1C基因构建。WO 93/07278中给出了构建本发明的合成的H04基因的优选方法。由所述的新基因序列编码的杂合苏云金芽胞杆菌(Bacill thuringiensis)毒素对经济上重要的虫害,如草地夜蛾(fall armyworm),红铃麦蛾(pink bollworm),烟夜蛾,欧洲玉米螟(European cornborer),和菜蛾(diamondback moth)等具有高度的活性。所述的杂合苏云金芽胞杆菌(Bacillusthuringiensis)毒素可用于复合昆虫防治策略中,以获得最高的效率和最低的环境影响。
本发明还包括含有编码本发明的杀虫毒素的核苷酸序列的DNA分子。本发明进一步包括含有本发明核酸序列的重组载体。在这样的载体中,所述的核酸序列优选地包含在含有调控元件的表达盒中,所述的调控元件使得所述核苷酸序列能在能表达所述核苷酸序列的宿主细胞中表达。这种调控元件通常包含启动子和终止信号,优选地,其还包括使本发明的核酸序列有效翻译所需的元件。含有所述核酸序列的载体通常能在特定的宿主细胞中复制,优选地作为染色体外分子而复制,由此用于在所述宿主细胞中扩增本发明的核酸序列。在一个实施方案中,所述载体的宿主细胞是微生物,如细菌,特别是苏云金芽胞杆菌(Bacillus thuringiensis)或大肠杆菌。在另一实施方案中所述重组载体的宿主细胞是内生植物或附生植物。对于所述载体,一种优选的宿主细胞是真核细胞,如植物细胞。植物细胞如玉米细胞是最优选的宿主细胞。
在特别优选的实施方案中,本发明的杀虫毒素在植物中表达。在这种情况下,表达有效量的毒素的转基因植物可保护自身不受虫害的侵袭。当昆虫开始摄食这种转基因植物后,它们也摄入了植物表达的毒素。这将制止所述昆虫进一步咬食植物组织甚至危害或杀死所述的昆虫。
本申请中所述的核酸序列可通过重组DNA技术整合到植物细胞中。一般来讲,这包括利用本领域已知的克隆程序,将本发明的编码序列插入到一种表达系统中,对所述的表达系统来说上述序列是异源的(即,通常情况下不存在的)。所述的载体包含所插入的蛋白编码序列转录和翻译所必需的元件。本领域已知的大量载体系统均可使用,如质粒,噬菌体病毒和其它经修饰的病毒。合适的载体包括但不限于病毒载体,如λ载体系统λgtl1,λgtl0和Charon 4;质粒载体如pBI121,pBR322,pACYC177,pACYC184,pAR系列,pKK223-3,pUC8,pUC9,pUC18,pUC19,pLG339,pRK290,pKC37,pKC101,pCDNAII;以及其它类似的系统。转化的细胞可再生成完整的植物,以致本发明的核苷酸序列给该转基因植物赋予昆虫抗性。
本发明转化的植物可以是单子叶或双子叶植物(monocots或dicots),其包括但不限于,玉米,小麦,大麦,黑麦,甜马铃薯,黄豆,豌豆,菊苣,莴苣,卷心菜,嫩茎花椰菜,花椰菜,芜菁,萝卜,菠菜,芦笋,洋葱,大蒜,胡椒,芹菜,南瓜属植物,南瓜,大麻,夏南瓜,苹果,梨,榅桲,瓜(如,西瓜),李子,樱桃,桃子,油桃,杏,草莓,葡萄,悬钩子,黑莓,凤梨,鳄梨,番木瓜,芒果,香蕉,大豆,番茄,高粱,甘蔗,甜菜,向日葵,菜籽油菜,三叶草,烟草,胡萝卜,棉花,苜蓿,稻,马铃薯,茄子,黄瓜,拟南芥属(Arabidopsis),和木本植物,如松柏和落叶树。一旦所需的核苷酸序列转化到特定的植物种中,它可以利用传统的育种技术在该植物种中繁殖或转移到同种植物的其它品种中,特别是包括商业化的品种。
为使本发明的核苷酸序列在转基因植物中表达,它们可能需要被修饰或优化。尽管在很多情况下,来自微生物的基因在不经修饰的情况下也能在植物中高水平表达,但有时由于微生物的核苷酸序列存在植物所不偏嗜的密码子,使得它们在转基因植物中低水平表达。本领域中已知所有的生物对于其所使用的密码子均有特异的偏嗜性,本发明所述的核苷酸序列的密码子可以改变成符合植物偏嗜性并保持其所编码的氨基酸不变。而且,在植物中的高表达由具有至少约35%,优选高于约45%,更优选高于约50%,最优选高于约60%GC含量的编码序列达到。具有低GC含量的微生物的核苷酸序列在植物中的表达量低是由于存在ATTTA基元,该基元使信息去稳定,并且AATAAA基元可能引起不适当的聚腺苷酸化。尽管优选的基因序列可以在单子叶和双子叶植物种中均能足量地表达,也可以对序列进行修饰以满足单子叶植物或双子叶植物各自的特异密码子偏嗜性和GC含量偏嗜性,因为已证明两类植物的偏嗜性是不同的(Murray等Nucl.Acids Res.17:477-498(1989))。另外,还通过筛选所述的核苷酸序列以排除可能造成信息截短的不适当的剪接位点的存在。所有需要在所述核苷酸序列内部进行的改变如上述改变均可利用本领域已知的定点突变,PCR和合成基因构建等技术,利用已公开的专利申请EP 0 385 962,EP 0 359 472,和WO 93/07278所描述的方法来进行。
为有效地起始翻译,需要对起始甲硫氨酸临近的序列进行修饰。例如,它们可以通过包括已知的在植物中有效的序列进行修饰。Joshi建议了一种用于植物的适当的共有序列(NAR 15:6643-6653(1987)),Clontech建议了另外的共有序列翻译起始区(1993/1994catalog,page 210)。这些共有序列均适合用于本发明的核苷酸序列。将上述序列整合到含所述核苷酸序列的构建体中,直至包括ATG(留下第二个氨基酸是未经修饰的),或直至包括ATG之后的GTC(具有修饰转基因中第二个氨基酸的可能性)。
核苷酸序列在转基因植物中的表达被可在植物中行使功能的启动子所驱动。对启动子的选择依表达的时空需要和靶物种的不同而变化。因此,本发明的核苷酸序列表达在叶,穗,花序(如穗状花序,圆锥花序,穗轴,等等),根,和/或幼苗中是优选的。但是,在许多情况下,需要防卫多于一种的虫害,这样就希望在多种组织中表达。尽管有许多来自双子叶植物的启动子在单子叶植物中也可以起作用,反之亦然,但理想的仍然是选择双子叶植物启动子用于在双子叶植物中表达,而单子叶植物启动子用于在单子叶植物中表达。但是对所选择的启动子的起源并没有限制;只要它们能够驱动所述核苷酸序列在所需细胞中表达就足够了。
优选的组成型表达的启动子包括来自编码肌动蛋白和遍在蛋白的基因的启动子和CaMV 35S及19S启动子。本发明的核苷酸序列也可在可被化学调控的启动子的调控下表达。这使得所述的杀虫毒素只有在所述作物经诱导性化学物质处理后才能合成。优选的化学诱导基因表达技术在已公开的专利申请EP 0 332 104和US专利5,614,395中有描述。优选的化学诱导启动子的例子是烟草PR-1a启动子。
优选的启动子的种类是创伤诱导型的。已报道了多种在创伤位点及植物病原体侵染位点表达的启动子。理想地,这种启动子应当仅在侵染位点被局部激活,通过这种方式所述的杀虫毒素仅在需要合成该杀虫毒素以杀死入侵害虫的位点积累。优选的这种类型的启动子包括在下述文献中描述的那些启动子,即Stanford等,Mol.Gen.Genet.215:200-208(1989),Xu等,Plant.Molec.Biol.22:573-588(1993),Logemann等,Plant Cell 1:151-158(1989),Rohrmeier & Lehle,Plant.Molec.Biol.22:783-792(1993),Firek等,Plant.Molec.Biol.22:129-142(1993),和Warner等,Plant J.3:191-201(1993)。
优选的组织特异性表达方式包括绿色组织特异的,根特异的,茎特异的和花特异的。适合于在绿色组织中表达的启动子包括许多调节涉及光合作用的基因的启动子,它们中许多已从单子叶植物和双子叶植物中被克隆出来。一种优选的启动子是来自磷酸烯醇羧化酶基因的玉米PEPC启动子(Hudspeth & Grula,Plant.Molec.Biol.12:579-589(1989))。一种优选的根特异性表达启动子是de Framond(FEBS 290:103-106(1991);EP 0 452 269中所描述的玉米金属硫蛋白样(Maize metallothionein-like,MTL)启动子。优选的茎特异性启动子是US专利5,625,136中所描述的启动子,其驱动玉米trpA基因的表达。
本发明的特别优选的实施方案是以根优选的或根特异的方式表达至少一种本发明的核苷酸序列的转基因植物。进一步优选的实施方案是以创伤诱导或病原体侵染诱导的方式表达所述核苷酸序列的转基因植物。
除选择合适的启动子外,用于在植物中表达杀虫毒素的构建体中还需要有合适的转录终止子附加在所述异源核苷酸序列的下游。有几种此种类型的启动子是本领域已知并可以获得的(如tm1来自CaMV,E9来自rbcS)。任何可获得的能在植物中行使功能的已知终止子均可用于本发明。
许多序列均可整合到本发明中所述的表达盒中。它们包括已表明能增强表达的序列,如内含子序列(如来自Adh1和bronze1的)和病毒前导序列(如来自TMV,MCMV和AMV的)。
也可以优选使本发明的核苷酸序列表达靶向在植物中的不同细胞。有些情况下希望在细胞胞液质中表达,另外的情况下可能优选在亚细胞器中表达。利用本领域已知的技术可以进行转基因编码的酶的亚细胞定位。典型地,将编码来源于已知的细胞器靶向性基因产物的靶肽的DNA加工并融合到所述核苷酸序列的上游。已知有很多针对叶绿体的这种靶序列,并且已经研究出它们在异源构建体中有功能。本发明的核苷酸序列的表达也可以靶向宿主细胞的内质网或液泡。达到上述目的的技术是本领域已知的。
适合于植物转化的载体已在本说明书的其它部分进行了描述。对于土壤杆菌(Agrobacterium)介导的转化,适合使用二元载体或带有至少一种T-DNA边缘序列的载体,而对于直接基因转移,任何载体都是合适的,仅含有有用构建体的线性DNA可以是优选的。对于直接DNA转移的情形,可利用单一的DNA种类转化或共转化(Schocher等Biotechnology 4:1093-1096(1986))。对于直接转移和土壤杆菌介导的转移两者,通常(但不是必须)利用选择标记进行转化,所述的选择标记可提供抗生素(卡那霉素,潮霉素或氨甲喋呤)或除草剂(basta)抗性。这种选择标记的例子是新霉素磷酸转移酶,潮霉素磷酸转移酶,二氢叶酸还原酶,膦丝菌素乙酰转移酶,2,2-二氯丙酸(2,2-dichloroproprionic acid)脱卤素酶,乙酰羟酸合酶,5-烯醇丙酮酰-莽草酸-磷酸合酶,haloarylnitrilase,原卟啉(protoporhyrinogen)氧化酶,乙酰-辅酶A羧化酶,二氢蝶酸(dihydropteroate)合酶,氯霉素乙酰转移酶,和β-葡糖醛酸糖苷酶。另一种类型的阳性选择标记是甘露糖-6-磷酸异构酶(MPI/PMI)基因,它提供代谢甘露糖-6-磷酸盐异构酶的能力。但用于植物转化的筛选或选择标记不是本发明的关键。
可利用多种本领域已知的技术将上述的重组DNA引入植物细胞。本领域的技术人员知道根据转化靶向的植物类型选择这些方法。转化植物细胞的合适方法包括微注射(Crossway等,BioTechniques4:320-334(1986)),电穿孔(Riggs等,Proc.Natl.Acad.Sci.USA 83:5602-5606(1986)),土壤杆菌介导的转化(Hinchee等,Biotechnology 6:915-921(1988);也见,Ishida等,NatureBiotechnology 14:745-750(June 1996)中的玉米转化),直接基因转移(Paszkowski等,EMBO J.3:2717-2722(1984);Hayashimoto等,Plant.Physiol.93:857-863(1990)(稻)),和利用Agracetus,Inc.,Madison,Wisconsin和Dupont,Inc.,Wilmington,Delaware提供的设备进行的冲击粒子加速作用(参见,例如,Sanford等,U.S.Patent 4,945,050;和McCabe等,Biotechnology 6:923-926(1988))。还可参见,Weissinger等,Annual Rev.Genet.22:421-477(1988);Sanford等,Particulate Science and Technology 5:27-37 91987)(洋葱);Svab等,Proc.Natl.Acad.Sci.USA 87:8526-8530(1990)(烟草叶绿体);Christou等,Plant Physiol.87:671-674(1988)(大豆);McCabe等,Bio/Technology 6:923-926(1988)(大豆);Klein等,Proc.Natl.Acad.Sci.USA,85:4305-4309(1988)(玉米);Klein等,Bio/Technology 6:559-563(1988)(玉米);Klein等,Plant.Physiol.91;440-444(1988)(玉米);Fromm等,Bio/Technology 8:833-839(1990);和Gordon-Kamm等,PlantCell 2;603-618(1990)(玉米);Koziel等,Biotechnology 11:194-200(1993)(玉米);Shimamoto等,Nature 338;274-277(1989)(稻);Christou等,Biotechnology 9:957-962(1991)(稻);Datta等,Bio/Technology 8:736-740(1990)(稻);欧洲专利申请EP 0 332 581(鸭茅和其它Pooideae);Vasil等,Biotechnology 11:1553-1558(1993)(小麦);Weeks等,PlantPhysiol.102:1077-1084(1993)(小麦);Wan等Plant Physiol.104:37-48(1994)(大麦);Jahne等,Theor.Appl.Genet.89:525-533(1994)(大麦);Umbeck等,Bio/Technology 5:263-266(1987)(棉花);Casas等,Proc.Natl.Acad.Sci.USA90:11212-11216(Dec.1993)(高粱);Somers等,Bio/Technology10:1589-1594(Dec.1992)(燕麦);Torbert等,Plant CellReports 14:635-640(1995)(燕麦);Weeks等,Plant Physiol.102:1077-1084(1993)(小麦);Chang等,WO 94/13822(小麦)和Nehra等,The Plant Journal 5:285-297(1994)(小麦)。通过微粒轰击将重组DNA分子引入玉米的特别优选的一组实施方案参见Koziel等,Biotechnology 11:194-200(1993),Hill等,Euphytica 85:119-123(1995)和Koziel等,Annals of the NewYork Academy of Sciences 792:164-171(1996)。此外的优选实施方案是如EP 0 292 435中公开的对于玉米的原生质体转化法。植物转化可用单一的DNA种类或多DNA种类(即共转化)进行,这两种技术均适用于本发明的编码序列。
在另一优选的实施方案中,本发明的核苷酸序列直接转化到质体基因组中。质体转化的一个主要的优势在于质体一般可以表达未经实质修饰的细菌基因,并且质体还能表达在单一启动子控制下的多个开放阅读框。质体转化技术在U.S.专利Nos.5,451,513,5,545,817,和5,545,818,在PCT申请WO 95/16783,和McBride等(1994)Proc.Natl.Acad.Sci.USA 91,7301-7305中有详细的描述。叶绿体转化的基本技术包括,利用生物轰击(biolistics)或原生质体转化(如,氯化钙或PEG介导的转化)将所克隆的质体DNA区域连同有用基因一起引入到合适的靶组织中,所述的质体DNA区域两侧为选择标记。称作靶向序列的1到1.5kb的侧翼区易于与质体基因组进行同源重组,从而对质体基因组(plastome)的特异区域进行置换或修饰。起初,利用在叶绿体16S rRNA和赋予壮观霉素和/或链霉素抗性的rpsl2基因处的点突变作为转化的筛选标记(Svab,Z.,Hajdukiewicz,P.,和Maliga,P.(1990)Proc.Natl.Acad.Sci.USA 87,8526-8530;Staub,J.M.,和Maliga,P.(1992)Plant Cell 4,39-45)。这导致以对靶叶轰击约每100次中有一次的频率得到稳定的同质体转化体。在这些标记之间存在的克隆位点可用于创建靶定质体的载体,该载体可用于引入外源基因(Staub,J.M.,和Maliga,P.(1993)EMBO J.12,601-606)。转化频率的大幅度提高可通过下述方式实现,即用显性的选择标记,编码壮观霉素解毒酶氨基糖苷-3’-腺嘌呤转移酶(Svab,Z.,和Maliga,P.(1993)Proc.Natl.Acad.Sci.USA 90,913-917)的细菌aadA基因替换隐性的rRNA或r-蛋白抗生素抗性基因。先前这一标记已成功地用于绿藻Chlamydomonas reinhardtii质体基因组的高频转化(Goldschmidt-Clermont,M.(1991)Nucl.AcidsRes.19:4083-4089)。其它本领域已知的对质体转化有用的选择标记也包含在本发明的范围内。典型地,在转化后需要约15-20个细胞分裂周期才能达到同质体状态。通过同源重组已使基因插入到存在于每一植物细胞的环状质体基因组的全部几千个拷贝中的质体表达,利用了相对于核表达基因的巨大拷贝数的优势,使得表达水平可容易地超过总的植物可溶蛋白的10%。在一个优选的实施方案中,本发明的核苷酸序列插入到靶定质体的载体中并转化到所需植物宿主的质体基因组中。由此获得了就含有本发明的核苷酸序列的质体基因组而言同型的植物,所述植物优选地可以高表达所述核苷酸序列。
实施例
本发明参照下述的详细实施例进行进一步详细描述。这些实施例只是处于示例性的目的,除非特别说明,它们不是限制性的。此处所用的标准的重组DNA技术和分子克隆技术是本领域已知的,并且在下述文献中有详细的描述:Ausubel(编),Current Protocols inMolecular Biology,John Wiley and Sons,Inc.(1994);T.Maniatis,E.F.Fritsch和J.Sambrook,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor laboratory,ColdSpring Harbor,NY(1989);和T.J.Silhavy,M.L.Berman,和L.W.Enquist,Experiments with Gene Fusions,Cold SpringHarbor Laboratory,Cold Spring Harbor,NY(1984)。
实施例1:H04毒素片段的表达和纯化
将H04杂合毒素基因的截短形式克隆到表达载体,如pBluescript SK-,芽孢杆菌穿梭载体,或pET 21b(+)中以在大肠杆菌中过表达,所述的H04杂合毒素基因的截短形式,如De Maagd等,Appl.Environ.Microbiol.62(5):1537-1543(1996)中所述,编码本质上由Cry1Ab的结构域I和II以及Cry1C的结构域III组成的Bt毒素。细胞在含50μg/ml氨苄青霉素的LB培养基上于37℃下摇床培养(250rpm)24到48小时。7,000rpm离心10min收集细胞。所得的颗粒状物用Bronson超声波仪超声处理2分30秒,脉冲间隔为2秒。全部的超声处理物在显微镜下镜检。10,000rpm离心10min去除可溶部分。所得的含有晶体蛋白的颗粒状物用含0.5M NaCl的2%Triton X-100洗4-5次。用0.5M NaGl(4-5次)连续地洗,最终的颗粒状物用蒸馏水洗(2次)。所得的颗粒状物于含10mM二硫苏糖醇的50mM Na2CO3缓冲液在37℃下溶解2h。12,000rpm离心10min将已溶的蛋白与不溶物质分离开。蛋白样品用50mM Na2CO3,pH9.0的缓冲液透析以备进行生物测定。
实施例2:生物测定
用纯化的截短H04蛋白测定了草地夜蛾(fall armyworm),红铃麦蛾(pink bollworm),烟夜蛾,和欧洲玉米螟(Europeancornborer)的LC50值,所述的H04蛋白是例如通过上述实施例1制备的。结果如下:LC50草地夜蛾(fall armyworm) 133ng/cm2LC50红铃麦蛾(pink bollworm) 691ng/cm2LC50烟夜蛾(tobacco budworm) 299ng/cm2LC50欧洲玉米螟(European cornborer) 31ng/cm2
实施例3:合成的H04基因构建体
编码H04毒素部分的合成的核苷酸序列是利用玉米偏嗜密码子表(Murray等,Nucl Acids Res.17:477-498,1989,在此引入作为参考)通过University of Wisconsin GCG程序组提供的“Backtranslation”程序,反向翻译(backtranslating)De Maagd等,Appl.Environ.Microbiol.62(5):1537-1543(1996)中描述的H04杂合毒素的氨基酸序列(Cry1Ab的结构域I和II和Cry1C的结构域III)而设计的。优选地,如WO 93/07278中所描述的,对每个氨基酸均应用使用频率最高的玉米密码子。
编码H04毒素部分的合成的核苷酸序列可由几个片段构建。每个片段都是通过代表所述基因两条链的长度为60-75个核苷酸的10对寡聚体的杂交而构建的。连续的寡核苷酸对之间有约15个核苷酸的重叠以便于正确的定位和组装。寡核苷酸可以通过,例如GenosysBiotechnologies Inc.,TX来合成。使每一对寡聚体杂交,并使用供应商提供的条件用多核苷酸激酶磷酸化,所述的多核苷酸激酶可购自New England Biolabs,Inc.,MA。使激酶作用过的片段对杂交并连接到高拷贝质粒中再转化到例如感受态的DH5α内,所述的质粒载体包含如,氨苄青霉素抗性基因。将所述的细胞涂布到含有氨苄青霉素的培养基上于37℃下培养过夜。筛选插入了DNA的克隆。将所述的DNA测序,筛选出含有正确序列的克隆。利用所述片段间独特的限制性位点进行限制性消化,连接和转化。
SEQ ID NO:3是编码631-氨基酸的H04(不带有尾区域)毒素部分的合成的核苷酸序列,SEQ ID NO:4是由SEQ ID NO:3中描述的合成的核苷酸序列编码的H04毒素的氨基酸序列。SEQ ID NO:11是构建体pNOV1308的核苷酸序列,其包含与SEQ ID NO:3中所示的合成的H04基因序列可操作性连接的组成型的玉米遍在蛋白启动子。
除上述描述的仅编码H04杂合体毒素部分(Cry1Ab的结构域I和II以及Cry1C的结构域III)的合成基因(SEQ ID NO:3)外,还利用如U.S.Patent No.5,625,136(引入此处作为参考)所述的与H04毒素部分3’末端相融合的全部或部分合成的cry1Ab尾区域构建其它的合成的H04基因。这些带有cry1Ab尾的合成的H04基因序列如下:
SEQ ID NO:5是编码H04毒素部分加全长的Cry1Ab尾部分的合成的核苷酸序列,SEQ ID NO:6是由SEQ ID NO:5中所述的合成的核苷酸序列编码的H04+Cry1Ab尾的氨基酸序列。SEQ ID NO:12是构建体pNOV1436的核苷酸序列,其包含与如SEQ ID NO:5中所述的合成的H04基因序列可操作连接的根优选的玉米MTL启动子。SEQ IDNO:13是构建体pNOV1441的核苷酸序列,其包含与如SEQ ID NO:5中所述的合成的H04基因序列可操作连接的组成型的玉米遍在蛋白启动子。
SEQ ID NO:7是编码H04毒素部分加全长的Cry1Ab尾部分的另一种合成的核苷酸序列,SEQ ID NO:8由SEQ ID NO:7中所述的合成的核苷酸序列编码的H04+Cry1Ab尾的氨基酸序列。SEQ ID NO:14是构建体pNOV1305的核苷酸序列,其包含与如SEQ ID NO:7中所述的合成的H04基因序列可操作连接的组成型的玉米遍在蛋白启动子。SEQ ID NO:15是构建体pNOV1313的核苷酸序列,其包含与如SEQID NO:7中所述的合成的H04基因序列可操作连接的组成型的玉米遍在蛋白启动子。
SEQ ID NO:9是编码H04毒素部分加Cry1Ab尾头40个氨基酸的合成的核苷酸序列,SEQ ID NO:10是由SEQ ID NO:9中描述的合成的核苷酸序列编码的H04+40氨基酸的截短的Cry1Ab尾的氨基酸序列,SEQ ID NO:16是构建体pNOV1435的核苷酸序列,其包含与如SEQ ID NO:9中所述的合成H04基因序列可操作地连接的根偏好的玉米MTL启动子。SEQ ID NO:17是构建体pZU578的核苷酸序列,其包含与如SEQ ID NO:9中所述的合成H04基因序列可操作连接的鼠耳芥属(Arabidopsis)肌动蛋白-2启动子。
实施例4:编码序列及其临近序列的修饰
本申请中所述的核苷酸序列可进行修饰以在转基因植物宿主中表达。表达所述核苷酸序列并在其细胞中产生杀虫毒素的宿主植物具有增强的对昆虫袭击的抗性,并更好地武装起来以抵抗与所述侵袭相关的作物损失。
微生物来源的基因在植物中进行转基因表达可能需要修饰这些基因以实现并优化其在植物中的表达。具体说来,编码单独的酶的细菌的ORFs,虽然在天然微生物中是由同一个转录本编码的,但在植物中需要在不同的转录本上才能较好地表达。为此,每种微生物的ORF均需单独分离出来,并克隆到在所述ORF5’末端提供植物启动子、在所述ORF3’末端提供植物转录终止子的表达盒中。所述的经分离的ORF序列优选地包含起始ATG和终止密码子,但也可以包含起始ATG和终止密码子以外的序列。除此之外,所述的ORF可以是截短的,但需保留所需的活性;对于特别长的ORFs,优选地使用其保留活性的截短形式在转基因生物中表达。“植物启动子”和“植物转录终止子(transcriptional terminator)”是指可在植物细胞中起作用的启动子和转录终止子。这也包括非植物如病毒(一个例子是花椰菜花叶病毒)来源的启动子和转录终止子。
在某些情况下,不需要对编码序列的ORF和邻近序列进行修饰。分离出含有有用的ORF的片段并插入到植物启动子的下游就足够。例如,Gaffney等(Science 261:754-756(1993))在没有对编码序列进行修饰的前提下,已在转基因植物中成功地表达了在CaMV 35S启动子和CaMV tml终止子的控制下的假单胞菌属(Pseudomonas)nahG基因,并且nahG ORF还附加了ATG的上游x bp的假单胞菌基因,和终止密码子下游y bp。优选地,尽可能少地在ATG的上游和终止密码子的下游遗留微生物的序列。在实践中这种构建要依赖于所能够获得的限制性位点。
在另外一些情况下,微生物来源的基因的表达可能存在一些问题。这些问题已在现有技术中有详细地描述,且对某些来源,如芽孢杆菌的基因有特定的共性。这些问题也存在于本发明的核苷酸序列,但可以用本领域已知的技术对这些基因进行修饰。可能遇到的问题如下:
1.密码子的使用
植物中的优选密码子使用与在特定微生物中优选的密码子使用不同。将所克隆的微生物ORF中的密码子使用与在植物基因(特别是来自靶植物的基因)中的密码子使用进行比较可以鉴定出所述ORF中应当优选地被改变的密码子。典型地,植物进化表现出对于单子叶植物在第三个碱基位置上对核苷酸C和G的强烈偏嗜性,而对于双子叶植物在这一位置上常常使用核苷酸A或T。通过对基因进行修饰掺入在特定的靶生物种中优选使用的密码子,下述的许多有关GC/AT含量和不适当剪接的问题都可以得到克服。
2.GC/AT含量
植物基因典型地具有高于35%的GC含量。富含A和T核苷酸的ORF序列将在植物中引起许多问题。首先,据信ATTTA基元引起信使RNA(message)的去稳定,且发现于许多短寿的mRNA的3’末端。第二,据信聚腺苷酸化信号,如AATAAA在信使RNA内不适当位置的出现将引起转录的成熟前截断。另外,单子叶植物可能将富含-AT的序列作为剪接位点识别(见下)。
3.邻近起始甲硫氨酸的序列
与微生物不同,植物的信使RNA没有明确的核糖体结合位点。而是,据信核糖体附加于信使RNA的5’末端扫描第一个可利用的ATG由此起始翻译。虽然如此,其对临近ATG的某些序列具有偏嗜,因此可以通过在微生物基因中ATG处包含真核细胞共有的翻译起始序列来增强其表达。Clontech(1993/1994 catalog,page 210,在此引入作为参考)建议了一种用于在植物中表达大肠杆菌uidA基因的作为翻译起始子的序列。另外,Joshi(NAR 15:6643-6653(1987),在此引入作为参考)比较了许多邻近ATG的植物序列,提示了另一种共有序列。当在植物中表达微生物ORF遇到困难时,在起始ATG处掺入上述序列中的一种可能会对翻译有改善。在这些情况下,由于对第二AA残基的修饰,共有序列的最后三个核苷酸可能不适于掺入修饰的序列中。在不同植物种中,优选的邻近起始甲硫氨酸的序列可能是不同的。对14种记录于GenBank数据库中的玉米基因进行调查给出了下述的结果:
在14种玉米基因中起始ATG前的位置:
-10 -9 -8 -7 -6 -5 -4 -3 -2 -1
C 3 8 4 6 2 5 6 0 10 7
T 3 0 3 4 3 2 1 1 1 0
A 2 3 1 4 3 2 3 7 2 3
G 6 3 6 0 6 5 4 6 1 5
这一分析可针对有待掺入所述核苷酸序列的目的植物来进行,修饰邻近ATG的序列以掺入优选的核苷酸。
4.去除非正常的剪接位点
由非植物来源克隆的且未经为适于在植物中表达而进行优化的基因也可能包含在植物中被识别为5’或3’剪接位点的基元,从而使所述基因被切割产生截短的或缺失的信使RNA。这些位点可使用本领域熟知的方法去除。
用于修饰编码序列及邻近序列的技术是本领域已知的。在微生物ORF起始表达量低并且确定适合于对所述序列进行上述改变的情况下,可以利用本领域已知的技术来构建合成的基因。它们是在已出版的专利说明书EP 0 385 962,EP 0 359 472和WO 93/07278中描述的,上述文献均引入此处作为参考。 在大多数情况下优选在其转移到转基因植物中以前,用瞬时分析方法(其在本领域是已知的)分析基因构建体的表达。
实施例5:植物表达盒的构建
用于在转基因植物中表达的编码序列首先组装在表达盒中置于能在植物中进行表达的启动子后。所述的表达盒还可包括转基因表达所需或为其选择的其它序列。这些序列包括但不限于,转录终止子,加强表达的外来序列,如内含子,必需序列(vital sequences),和为使基因产物靶定特定的细胞器和细胞区室的序列。这些表达盒易于转移到下述的植物转化载体中。下面是对典型的表达盒的不同元件的描述。
1.启动子
用于表达盒的启动子的选择将确定转基因在转基因植物中的时空表达方式。所选择的启动子将在特定的细胞类型(如叶表皮细胞,叶肉细胞,根皮层细胞)、或在特定的组织或器官(例如,根,叶或花)中表达转基因,所述的选择将反映有待积累所述基因产物的位置。另外,所选择的启动子可以在多种诱导条件下驱动所述基因的表达。不同启动子其强度(即启动转录的能力)不同。根据所使用的宿主细胞系统,可使用任何一种合适的启动子,它们包括所述基因的天然启动子。下面是可用于表达盒中的启动子的非限制性例子。
a.组成型表达,遍在蛋白启动子:
遍在蛋白是已知在多种细胞类型中积累的基因产物,已从许多物种中克隆出了它的启动子以用于转基因植物(如向日葵-Binet等Plant Science 79:87-94(1991);玉米-Christensen等PlantMolec.Biol.12:619-632(1989);和拟南芥属-Norris等,PlantMol.Biol.21:895-906(1993))。所述的玉米遍在蛋白启动子已在转基因单子叶系统中开发出来,其序列和为进行单子叶植物转化所构建的载体已在专利出版物EP 0 342 926中公开,该文献在此引入作为参考。Taylor等(Plant cell Rep.12:491-495(1993))描述了一种载体(pAHC25),其包含玉米遍在蛋白启动子和第一内含子,当它经微粒轰击引入多种单子叶植物后,在所述植物细胞悬液中具有高活性。拟南芥属遍在蛋白启动子可理想地与本发明的核苷酸序列一起应用。所述的遍在蛋白启动子适合于在转基因的单子叶植物和双子叶植物中表达。合适的载体是经引入合适的遍在蛋白启动子和/或内含子序列而修饰的pAHC25或本说明书中所述的任意一种转化载体的衍生物。
b.组成型的表达,CaMV 35S启动子:
质粒pCGN1761的构建在已出版的专利申请EP 0 392 225(实施例23)中描述,该文献引入此处作为参考。pCGN1761包含″双″CaMV35S启动子和tml转录终止子,并在所述的启动子和终止子之间带有独特的EcoRI位点,且具有pUC-型的骨架。一种构建的pCGN1761衍生物具有经修饰的多接头,除已存在的EcoRI位点外该接头还包含NotI和XhoI位点。将这种衍生物命名为pCGN1761ENX。pCGN1761ENX对于在其多接头内克隆cDNA序列或编码序列(包含微生物的ORF序列)是有用的,这可以使所述基因在转基因植物中在35S启动子的控制下表达。这种构建体的完整的35S启动子-编码序列-tml终止子盒可被启动子5’端的HindIII,SphI,SalI,和XbaI位点和终止子3’端的XbaI,BamHI和BglI位点切割下来,转移到转化载体,如下述的载体中。而且,所述的35S启动子片段可用HindIII,SphI,SalI,XbaI,或Pstl由5’切割,或用任意一种多接头限制位点(EcoRI,NotI或XhoI)由3’切割,替换为其它的启动子。如果需要还可以通过在克隆位点周围引入增强翻译的序列以进行修饰。如果需要过表达则这种方法特别有用。例如,pCGN1761ENX可由U.S.Patent No.5,639,9493实施例37中描述的对翻译起始位点的优化进行修饰,上述文献在此引入作为参考。
c.组成型表达,肌动蛋白启动子:
已知几种肌动蛋白同种型在大多数细胞类型中表达,因此,所述的肌动蛋白启动子是组成型启动子的一个很好的选择。具体说来,来自稻ActI基因的启动子已被克隆和描述(McElroy等Plant Cell 2:163-171(1990))。已发现在该启动子的1.3kb片段内包含在稻原生质体中表达所需的所有调控元件。而且,已构建了多种基于ActI启动子的表达载体,特定地用于于单子叶植物(McElroy等Mol.Gen.Genet.231:150-160(1991))。它们并入了ActI-内含子1,AdhI 5’侧翼序列和AdhI-内含子1(来自玉米醇脱氢酶基因)和来自CaMV 35S启动子的序列。表现出最高表达的载体是35S和ActI内含子或ActI 5’侧翼序列以及ActI内含子的融合体。在起始ATG(属GUS报告基因)周围序列的优化也可增强表达。可容易地对McElroy等(MolGen.Genet.231:150-160(1991))所述的启动子表达盒进行修饰以用于基因表达,特别是在单子叶植物宿主中。例如,由McElroy构建体中分离出含启动子的片段,用于替换pCGN1761ENX中的双35S启动子,使其可用于插入特异的基因序列。可将上述构建的融合基因转移到合适的转化载体中。在单独的报道中还发现,带有其第一内含子的稻ActI启动子也可以指导在培养的大麦细胞中的高表达(Chibbar等Plant Cell Rep.12:506-509(1993))。
d.诱导型表达,PR-1启动子:
pCGN1761ENX中的双35S启动子可用任意其它的启动子替换以期达到合适的高表达水平。通过例如,一种U.S.Patent No.5,614,395中所描述的化学调节的启动子,如烟草PR-1a启动子,可用于替换上述的双35S启动子。或者,也可使用Lebel等,Plant J.16:223-233(1998)中所述的拟南芥属PR-1启动子。优选地用限制性酶将所选择的启动子从其来源中切割出来,但也可由带有合适的末端限制位点的引物通过PCR扩增。若进行PCR扩增,则在扩增启动子克隆到靶载体中后,所述的启动子应当经过再测序,检查是否有扩增错误。所述的可由化学/病原体调节的烟草PR-1a启动子可由质粒pCIB1004(有关的构建参见EP 0 332 104中的实施例21,该文献引入此处作为参考)中切割出来,然后转移到质粒pCGN1761ENX(Uknes等,Plant Cell 4:645-656(1992))中。pCIB1004再经NcoI切割,所得的线性片段的3’突出端通过T4 DNA多聚酶的处理钝化。再将所述片段用HindIII切割,所得的含PR-1a启动子的片段经凝胶纯化后克隆到已去除了双35S启动子的pCGN1761ENX中。这是通过下述操作完成的,即用XhoI切割,再由T4聚合酶钝化,接下来用HindIII切割,然后分离克隆了pCIB1004启动子片段的大的含有载体终止子的片段。由此产生了pCGN1761ENX衍生物,其带有PR-1a启动子和tml终止子以及所插入的带有独特的EcoRI和NotI位点的多接头。可将选择的编码序列插入这一载体中,所得的融合产物(即,启动子-基因-终止子)可转移到任何所选择的转化载体中,包括上文中所述的载体。多种化学调节剂可用于诱导所选择的编码序列在根据本发明转化的植物中的表达,所述的化学调节剂包括U.S.专利Nos.5,523,311和5,614,395中所述的苯并噻二唑(benzothiadiazole),异烟酸,和水杨酸化合物。
e.诱导型表达,乙醇可诱导的启动子:
可由特定的醇类或酮类,如乙醇诱导的启动子也可用于本发明编码序列的诱导型表达。这种启动子如来自构巢曲霉(Aspergillusnidulans)的alcA基因启动子(Caddick等(1998)Nat.Biotechnol 16:177-180)。在构巢曲霉中,所述的alcA基因编码醇脱氢酶I,在存在化学诱导剂的情况下,其表达可受AlcR转录因子的调节。为本发明的目的,在含与最小35S启动子(Caddick等(1998)Nat.Biotechnol 16:177-180)融合的alcA基因启动子序列的质粒palcA:CAT中CAT编码序列被本发明的编码序列所替代,形成具有在alcA基因启动子控制下的编码序列的表达盒。这可由本领域已知的方法进行。
f.诱导型表达,糖皮质激素诱导的启动子
本发明还包括用基于类固醇激素的系统诱导本发明的核苷酸序列表达。例如,使用糖皮质激素介导的诱导系统(Aoyama和Chua(1997)The Plant Journal 11:605-612),基因表达可通过应用糖皮质激素来诱导,例如合成的糖皮质激素,优选地塞米松,优选浓度范围是0.1mM到1mM,更优选从10mM到100mM。为本发明的目的,萤光素酶基因序列可由本发明的核酸序列所替代以形成具有本发明核酸序列的表达盒,所述核酸序列受6拷贝的与35S最小启动子相融合的GAL4上游激活序列调控。这可用本领域中已知的技术进行操作。反式作用因子包含GAL4 DNA结合结构域(Keegan等(1986)Science231:699-704),其与疱疹病毒蛋白VP16反式活化域(Triezenberg等(1988)Genes Devel.2:718-729)相融合,后者与大鼠糖皮质激素受体的激素结合结构域(Picard等(1988)Cell 54:1073-1080)相融合。所述融合蛋白的表达受本领域已知的或此处所述的任何合适的启动子调控。这一表达盒也包含在含有与6xGAL4/最小启动子相融合的本发明核酸序列的植物中。由此,实现融合蛋白的组织或器官特异性,导致所述杀虫毒素的可诱导的组织或器官特异性。
g.根特异性的表达:
另一种基因表达方式是根表达。合适的根启动子是de Framond(FEBS 290:103-106(1991))及U.S.Patent No.5,466,785中所描述的玉米金属硫蛋白样(MTL)基因的启动子,上述文献引入此处作为参考。这种“MTL”启动子转移到合适的载体,如pCGN1761ENX中以插入所选择的基因,接下来转移完全的启动子-基因-终止子盒到目的转化载体中。
h.创伤诱导型启动子:
创伤诱导型启动子也适合应用于基因表达。目前已有多种此种类型的启动子的描述(如Xu等Plant Molec.Biol.22:573-588(1993),Logemann等Plant Cell 1:151-158(1989),Rohrmeier& Lehle,Plant Molec.Biol.22:783-792(1993),Firek等Plant Molec.Biol.22:129-142(1993),Warner等Plant J.3:191-201(1993)),所有这些启动子均适用于本发明。Logemann等描述了双子叶的马铃薯wunI基因5’上游序列。Xu等描述了来自双子叶植物马铃薯(Pin2)的创伤诱导型启动子在单子叶的稻中具有活性。而Rohrmeier & Lehle描述了玉米WipI cDNA的克隆,其也是创伤诱导的且可用于通过标准的技术分离同族的启动子。类似地,Firek等和Warner等描述了来自单子叶的石刁柏(Asparagusofficinalis)的创伤诱导型启动子,该启动子在局部创伤和病原体侵入位点表达。利用本领域已知的克隆技术,可将这些启动子转化到合适的载体中,与本发明的基因相融合,用于在植物创伤位点表达所述基因。
i.髓(pith)偏好的表达:
引入此处作为参考的专利申请WO 93/07278描述了玉米trpA基因的分离,该基因偏好在髓细胞中表达。给出了所述的基因序列和由转录起点延伸至-1726bp的启动子。利用标准的分子生物学技术,可将这一启动子,或其片段转移到载体,如pCGN1761中,在该载体中其可替换35S启动子,并用于驱动外源基因以髓偏好的方式表达。实际上,含有髓偏好启动子或其部分的片段可转移到任何载体中,并可被修饰以用于在转基因植物中表达。
j.叶特异性的表达:
编码磷酸烯醇羧化酶(PEPC)的玉米基因已被Hudspeth和Grula(Plant Molec Biol 12:579-589(1989))公开。利用标准的分子生物学技术,该基因的启动子可在转基因植物中以叶特异的方式,驱动任何基因的表达。
k.花粉特异的表达:
WO 93/07278中描述了玉米钙依赖性蛋白激酶(CDPK)基因的分离,该基因在花粉细胞中表达。该基因序列和启动子延伸至从转录起点起多达1400bp。利用标准的分子生物学技术,可将这一启动子,或其片段转移到载体,如pCGN1761中,在该载体中其可替换35S启动子,并用于驱动本发明核酸序列以花粉特异性的方式表达。
1.在化学配体存在下由受体介导的反式激活作用:
引入此处作为参考的U.S.Patent No.5,880,333中描述了一种系统,其中II类激素受体,如作为异源二聚体行使功能的蜕皮激素受体(EcR)和Ultraspiracle(USP),在存在合适的化学配体,如tebufenozide时,在植物细胞中调节靶多肽的表达。
2.转录终止子
有多种可用于表达盒的转录终止子。它们负责使转基因转录终止并进行正确的聚腺苷酸化。合适的转录终止子是已知可在植物中形使功能的那些,其包括CaMV 35S终止子,tml终止子,胭脂碱合酶终止子和豌豆rbcS E9终止子。它们均可用于单子叶植物和双子叶植物。另外,也可以使用基因的天然转录终止子。
3.增强或调节表达的序列
已发现有很多序列可用于增强转录单位中的基因表达,可将这些序列与本发明的基因相连接以提高所述基因在转基因植物中的表达。
已表明有多种内含子序列可增强基因的表达,特别是在单子叶植物细胞中。例如当将玉米AdhI基因的内含子引入玉米细胞时,其能显著地增强在其同类启动子控制下的基因的表达。已表明内含子1特别有效并增强带有氯霉素乙酰转移酶基因的融合构建体的表达(Callis等,Genes Develop.1:1183-1200(1987))。在相同的实验系统中,来自玉米bronzel基因的内含子对增强表达有类似的效果。内含子序列已常规地引入到植物转化载体中,典型地,处在非翻译前导序列中。
已知衍生自病毒的大量非翻译前导序列有增强表达的作用,并且在双子叶植物细胞中特别有效。具体地,来自烟草花叶病毒(TMV,″W-序列″),玉米萎黄病斑点病毒(Maize Chlorotic MottleVirus,MCMV),和苜蓿花叶病毒(AMV)的前导序列能有效地增强表达(如Gallie等Nucl.Acids Res.15:8693-8711(1987);Skuzeski等Plant Molec.Biol.15:65-79(1990))。
4.在细胞内基因产物的靶定(targeting)
已知在植物中存在多种靶定基因产物的机制,并且所述机制中控制该功能的序列已有所描述。例如,将基因产物靶定到叶绿体是由在多种蛋白氨基末端发现的信号序列控制的,所述的信号序列在向叶绿体运输过程中被切除以获得成熟的蛋白 (如Comai等J.Biol.Chem.263:15104-15109(1988))。这些信号序列可与异源基因产物相融合使所述的异源产物运送到叶绿体(van den Broeck,等Nature 313:358-363(1985))。编码合适的信号序列的DNA可由编码RUBISCO蛋白、CAB蛋白,EPSP合酶,GS2蛋白以及其它已知定位于叶绿体的蛋白的cDNA的5’末端分离。参见U.S.Patent No.5,639,949实施例37中以“靶定叶绿体的表达”为标题的部分。
其它的基因产物定位于其它的细胞器,如线粒体和过氧物酶体(如Unger等Plant Molec.Biol.13:411-418(1989))。也可对编码这些产物的cDNA进行进行操作以实现所述异源基因向这些细胞器的靶定。这种序列的例子是核编码的ATP酶和对线粒体特异的天冬氨酸氨基转移酶的同种型。Rogers等描述了导向性细胞蛋白体(Proc.Natl.Acad.Sci.USA82:6512-6516(1985))。
另外也有对使基因产物靶定其它细胞区室的序列的描述。氨基末端序列负责靶向ER,质外体,及由糊粉细胞向胞外分泌(Koehler &Ho,Plant Cell2:769-783(1990))。另外,氨基末端序列与羧基末端序列联合负责基因产物的液泡靶定(Shinshi等Plant Molec.Biol.14:357-368(1990))。
通过将合适的上述靶向序列与有用的转基因序列相融合可能指导转基因产物到任何细胞器或细胞区室。对于叶绿体靶定,例如,可将来自RUBISCO蛋白、CAB蛋白,EPSP合酶,GS2基因的叶绿体信号序列与转基因的氨基末端ATG进行框内融合。所选择的信号序列应包含已知的切割位点,而且构建融合构建体应考虑到任何处于切割位点之后的对切割所必需的氨基酸。有时候为了达到上述要求可在切割位点和转基因ATG之间添加少量的氨基酸,或者替换转基因序列内的某些氨基酸。用于输入叶绿体而构建的融合体可按照Bartlett等在Edelmann等(编)Methods in chloroplast Molecular Biology,Elsevier pp 1081-1091(1982)和Wasmann等在Mol.Gen.Genet.205:446-453(1986)中所描述的技术,通过体外转录的构建体的体外翻译检测叶绿体摄取效果。这些构建技术是本领域周知的,也可应用于线粒体和过氧化物酶体。
上面所描述的细胞靶定机制不仅可与同源启动子(Cognatepromoters)结合使用,也可以与异源启动子一起使用,在该启动子的转录调节下实现特定的细胞靶定目的,该启动子的表达方式与靶定信号序列原有的启动子的表达方式是不同的。
实施例6:植物转化载体的构建
本领域的技术人员已知存在多种用于植物转化的转化载体,本发明的基因可与上述的任何一种载体结合使用。所述载体的选择依赖于优选的转化技术和待转化的靶物种。对于特定的靶物种,不同的抗生素或除草剂选择标记可能是优选的。在转化中常规使用的选择标记包括nptII基因,其可赋予卡那霉素以及相关的抗生素抗性(Messing& vierra.Gene 19:259-268(1982);Bevan等,Nature304:184-187(1983)),bar基因,其可赋予除草剂膦丝菌素抗性(White等,Nucl.Acids Res 18:1062(1990),Spencer等Theor.Appl.Genet 79:625-631(1990)),hph基因,其可赋予抗生素潮霉素抗性(Blochinger & Diggelmann,Mol Cell Biol 4:2929-2931),和dhfr基因,其可赋予methatrexate抗性(Bourouis等,EMBO J.2(7):1099-1104(1983)),EPSPS基因,其可赋予草甘膦抗性(U.S.Patent Nos.4,940,935 and 5,188,642),和甘露糖-6-磷酸异构酶基因,其可提供代谢甘露糖的能力(U.S.Patent Nos.5,767,378和5,994,629)。
1.适合于土壤杆菌转化的载体
许多载体适用于利用根癌土壤杆菌(Agrobacteriumtumefaciens)的转化。它们典型地至少带有一个T-DNA边界序列,包括载体例如pBIN19(Bevan,Nucl.Acids Res.(1984))和pXYZ。下面描述了两种适合用于利用土壤杆菌进行转化的典型载体。
a.pCIB200和pCIB2001:
用所述的二元载体pCIB200和pCIB2001构建与土壤杆菌一起使用的重组载体,其构建方式如下。pTJS75kan是通过NarI消化pTJS75而创建的(Schmidhauser & Helinski,J.Bacteriol.164:446-455(1985)),其切除了四环素抗性基因,然后插入来自带有NPTII的pUC4K的AccI片段(Vieira & Messing,Gene 19:259-268(1982):Bevan等,Nature 304:184-187(1983):McBride等,PlantMolecular Biology 14:266-276(1990))。XhoI接头与PCIB7的EcoRV片段相连接,所述的EcoRV片段包含左右T-DNA边界,植物选择性的nos/nptII嵌合基因和pUC多接头(Rothstein等,Gene 53:153-161(1987)),将XhoI消化的片段克隆到SalI-消化的pTJS75kan中以构建pCIB200(参见EP 0 332 104,实施例19)。pCIB200包含下述独特的多接头限制性位点:EcoRI,SstI,KpnI,BglII,XbaI,和SalI。pCIB2001是pCIB200的衍生物,其是通过将附加的位点插入多接头中构建的。pCIB2001的多接头中的独特的限制性位点是EcoRI,SstI,KpnI,BglII,XbaI,SalI,MluI,BclI AvrII,ApaI,HpaI,和StuI,pCIB2001,除包含上述独特的限制性位点外,还包含植物和细菌卡那霉素选择标记,用于土壤杆菌介导的转化的左右T-DNA边界,RK2-衍生的trfA的功能,用于在大肠杆菌和其它宿主之间的移动,和也来自RK2的OriT和OriV功能。所述的pCIB2001多接头适合于克隆含有其本身调节信号的植物表达框。
b.pCIB10及其潮霉素选择衍生物:
二元载体pCIB10包含编码卡那霉素抗性的基因以便于在植物中进行筛选,和T-DNA左右侧边界序列,并掺入了来自宽宿主范围的质粒pRK252的序列,使其能在大肠杆菌和土壤杆菌间复制。这一构建体已由Rothstein等(Gene 53:153-161(1987))描述。构建了多种pCIB10衍生物,其掺入了Gritz等(Gene 25:179-188(1983))描述的潮霉素B磷酸转移酶基因。这些衍生物使得可以仅通过潮霉素(pCIB743),或通过潮霉素和卡那霉素(pCIB715,pCIB717)筛选转基因植物细胞。
2.适合于非土壤杆菌转化的载体
不使用根癌土壤杆菌(Agrobacterium tumefaciens)就避免了选择载体时对T-DNA序列的需要,因此除例如上述的含T-DNA序列的载体外,还可以使用不含T-DNA序列的载体。无需借助于土壤杆菌的转化技术包括通过粒子轰击,原生质体摄入(如PEG和电穿孔)以及微注射的转化。对载体的选择很大程度上依赖于对被转化物种的优选筛选。下面描述了用于非土壤杆菌转化的典型载体的构建。
a.pCIB3064:
pCIB3064是pUC-衍生的载体,适用于与用除草剂basta(或膦丝菌素)筛选相结合的直接基因转移。质粒pCIB246包含与大肠杆菌GUS基因可操作地融合的CaMV 35S启动子和CaMV 35S转录终止子,该质粒已在PCT公开申请WO 93/07278中公开。该载体的35S启动子包含两个起始位点5’端的ATG序列。可使用标准的PCR技术使上述位点突变,由此去除ATG并产生限制性位点SspI和PvuII。新的限制性位点分别距独特的SalI位点96和37bp,距实际的起始位点101和42bp。将所得的pCIB246衍生物命名为pCIB3025。然后通过SalI和SacI消化将GUS从pCIB3025中切除,使末端成为平端并再连接以形成质粒pCIB3060。质粒pJIT82可由John Innes Centre,Norwich获得,切割含有来自绿色产色链霉菌(Streptomyces viridochromogenes)的bar基因的400bp SmaI片段,插入pCIB3060的HpaI位点(Thompson等EMBO J 6:2519-2523(1987))。由此产生了pCIB3064,其包含在CaMV35S启动子和终止子控制下的bar基因用于除草剂筛选,以及氨苄青霉素抗性基因(用于在大肠杆菌中进行筛选)和带有下述独特位点的多接头,即SphI,PstI,HindIII,和BamHI。这一载体适合于克隆含有自身调节信号的植物表达盒。
b.pSOG19和pSOG35:
pSOG35是一种转化载体,其利用大肠杆菌基因,赋予氨甲喋呤抗性的二氢叶酸还原酶(DFR)作为选择标记。用PCR自pSOG10扩增35S启动子(-800bp),来自玉米Adh1基因的内含子6(-550bp)和18bpGUS非翻译前导序列。编码大肠杆菌二氢叶酸还原酶II型基因的250-bp也通过PCR扩增,将这两个PCR片段与pB1221(Clontech)的SacI-PstI片段组装,所述的pB1221包含pUC19载体骨架和胭脂氨酸合酶终止子。将这些片段组装起来形成pSOG19,其包含与内含子6序列融合的35S启动子,GUS前导序列,DHFR基因和胭脂氨酸合酶终止子。用来自玉米萎黄病斑纹病毒(Maize Chlorotic MottleVirus(MCMV))的前导序列替换pSOG19中的GUS前导序列产生载体pSOG35。pS0619和pSOG35带有pUC基因用于氨苄青霉素抗性,并具有用于克隆外来物质的HindIII,SphI,PstI和EcoRI位点。
3.适合于叶绿体转化的载体
利用质体转化载体pH143(WO 97/32011,实施例36)在植物质体中表达本发明的核苷酸序列。所述的核苷酸序列插入到pPH143中,由此替换PROTOX编码序列。这一载体用于质体转化,并筛选壮观霉素抗性的转化子。或者,所述的核苷酸序列插入到pPH143中,由此其替换aadH基因。在这种情况下,则筛选对PROTOX抑制剂具有抗性的转化子。
实施例7:转化
一旦本发明的核酸克隆到表达载体系统中,其就可以转化到植物细胞中。植物转化和再生的方法是本领域已知的。例如,Ti质粒载体已被用于递送外源DNA,其它方法有直接DNA摄入,脂质体,电穿孔,微注射和微粒轰击。另外,来自土壤杆菌属的细菌可用于转化植物细胞。下面是对代表性的双子叶和单子叶植物转化技术,及代表性的质体转化技术的描述。
1.双子叶植物的转化
用于双子叶植物转化的技术是本领域已知的,其包括基于土壤杆菌的技术和不需要土壤杆菌的技术。非土壤杆菌技术包括由原生质体或细胞直接摄入外源遗传物质。这可通过PEG或电穿孔介导的摄入,粒子轰击-介导的递送,或微注射来实现。这些技术的实例在下述文献中有描述,Paszkowski等,EMBO J 3:2717-2722(1984),Potrykus等,Mol.Gen.Genet.199:169-177(1985),Reich等,Biotechnology 4:1001-1004(1986),和Klein等,Nature 327:70-73(1987)。在每种情况下均可通过本领域已知的技术使转化的细胞再生成整个植株。
土壤杆菌介导的是转化双子叶植物的优选技术,这是因为该技术转化效率高并可在不同的物种中广泛使用。土壤杆菌转化典型地包括将带有外源有用DNA的二元载体(如pCIB200或pCIB2001)转移到合适的土壤杆菌菌株中,其可能依赖于宿主土壤杆菌菌株共存的Ti质粒或染色体上带有的vir基因互补体(对于pCIB200和pCIB2001如菌株CIB542(Uknes等Plant Cell 5:159-169(1993))。所述的二元载体向土壤杆菌的转移是利用带有重组二元载体的大肠杆菌,带有质粒如pRK2013的能将重组二元载体移动到靶土壤杆菌菌株中的辅助大肠杆菌,由三亲本交配进行的。或者,重组的二元载体也可以通过DNA转化转移到土壤杆菌中(Hfgen & Willmitzer,Nucl.AcidsRes.16:9877(1988))。
通过重组土壤杆菌对靶植物种的转化通常包括,用本领域已知的方法将土壤杆菌与植物外植体共同培养。经转化的组织在带有存在于二元质粒T-DNA边界之间的抗生素或除草剂抗性标记物的培养基上再生。
另一种用基因转化植物的方法包括将惰性或生物活性颗粒推进到植物组织和细胞中。这一技术在U.S.Patent Nos.4,945,050,5,036,006,和5,100,792中有描述。一般,这一过程包括在能有效穿透细胞外表面并导入其内部的条件下,向细胞推进惰性的或生物活性颗粒。当通过用惰性粒子时,可通过用含有所需基因的载体包被所述颗粒,将所述载体引入细胞。或者,可用所述载体包围靶细胞,通过粒子的活动(wake)将载体带入细胞。也可将生物活性颗粒(如,干酵母细胞,干细菌或噬菌体,均含有待引入的DNA)推进到植物细胞组织中。
2.单子叶植物的转化
大多数单子叶植物物种的转化已经成为常规技术。优选的技术包括用PEG或电穿孔技术将基因直接转移到原生质体中,和粒子轰击到愈伤组织中。转化可以用单一DNA种类(single DNA species)或多DNA种类(multiple DNA species)(即共转化)转化,这两种技术均适用于本发明。当有相关的需要时,共转化具有下述的优势,即避免完全载体的构建,及产生带有非连接的有用基因和筛选标记的座位,使得能在后续子代中去除筛选标记。但是使用共转化也存在不足,即整合到所述基因组中的分离DNA种类转化频率低于100%(schocher等Biotechnology 4:1093-1096(1986))。
专利申请EP 0 292 435,EP 0 392 225,和WO 93/07278描述了用于由玉米原种自交系中制备愈伤组织和原生质体,通过PEG或电穿孔转化原生质体,和由转化的原生质体再生玉米植物的技术。Gordon-Kamm等(Plant Cell 2:603-618(1990))和Fromm等(Biotechnology 8:833-839(1990))已公开了用粒子轰击转化A188-衍生的玉米系的技术。另外,WO 93/07278和Koziel等(Biotechnology 11:194-200(1993))中描述了用粒子轰击转化玉米原种自交系的技术。这一技术利用由授粉后14-15天的玉米穗中切除的长1.5-2.5mm的未成熟玉米胚和PDS-1000He Biolistics设备进行轰击。
稻的转化也可以利用原生质体或粒子轰击的直接基因转移技术进行。原生质体介导的转化已在Japonica-型和Indica-型(Zhang等Plant Cell Rep 7:379-384(1988);Shimamoto等Nature 338:274-277(1989);Datta等Biotechnology 8:736-740(1990))中有描述。这两种类型也可使用粒子轰击进行常规转化(Christou等Biotechnology 9:957-962(1991))。另外,WO 93/21335描述了利用电穿孔的稻转化技术。
专利申请EP 0 332 581用于产生、转化和再生Pooideae原生质体的技术。这些技术可用于鸭茅属(Dactylis)和小麦的转化。而且在Vasil等(Biotechnology 10:667-674(1992))中也描述了小麦转化技术,即,利用粒子轰击到可长期再生的C型愈伤组织细胞中,Vasil等(Biotechnology 11:1553-1558(1993))和Weeks等(Plant Physiol.102:1077-1084(1993))描述了用粒子轰击未成熟的胚和由未成熟的胚衍生的愈伤组织的技术。但用于小麦转化的优选技术涉及通过粒子轰击未成熟的胚的玉米转化,并包括在基因递送前的高蔗糖或高麦芽糖步骤。在进行轰击前,将任意数量的胚(0.75-1mm长)置于含3%蔗糖(Murashiga & Skoog,PhysiologiaPlantarum 15:473-497(1962))和3mg/l 2,4-D的MS培养基中以进行体细胞胚的诱导,其在黑暗中进行。在选择进行轰击的那一天,将胚从诱导培养基上移开并置于渗压剂上(即,添加了所需浓度,典型地为15%,的蔗糖或麦芽糖的诱导培养基)。所述的胚进行2-3h的质壁分离然后进行轰击。典型的是每靶平皿上20个胚,但这不是非常严格的。合适的带有基因的质粒(如pCIB3064或pSG35)通过标准的技术沉淀到微米大小的金颗粒上。每一载有胚的板均通过DuPontBiolistics氦设备射击,所用的爆裂压为约1000psi,使用标准的80网筛。轰击后,将所述的胚重新置于黑暗中复苏24h(仍在渗压剂上)。24hr后,将所述的胚从渗压剂上移走,重新置于诱导培养基上,并在再生前保持近一个月。大约一个月后,将带有发育中的胚胎发生愈伤组织的胚外植体转移到再生培养基(MS+1mg/l NAA,5mg/l GA),所述的培养基进一步包含适当筛选试剂(对于pCIB3064用10mg/l basta,对于pSOG35用2mg/l氨甲喋呤)。约一个月后,发育的芽转移到更大的称为″GA7s″的无菌容器中,其包含半强度的MS,2%蔗糖,相同浓度的筛选试剂。
利用土壤杆菌的单子叶植物的转化也已有所描述,参见WO94/00977和U.S.Patent No.5,591,616,这两篇文献均引入此处作为参考。
3.质体转化
Nicotiana tabacum c.v.‘Xanthi nc’的种子以1”圆形阵列在T琼脂培养基上,每皿萌发7个,并在播种后的12-14天用1μm钨颗粒(M10,Biorad,Hercules,CA)进行轰击,所述的钨颗粒基本上按先前的描述(Svab,Z.和Maliga,P.(1993)PNAS 90,913-917)用质粒pPH143和pPH145的DNA包被。经过轰击的幼苗在T培养基上培养两天后将叶切除,置在含500μg/ml壮观霉素二盐酸盐(Sigma,St.Louis,MO)的RMOP培养基上(Svab,Z.,Hajdukiewicz,P.和Maliga,P.(1990)PNAS 87,8526-8530),运轴侧向上,给予强光(350-500μmol光子/m2/s)。将在轰击后3到8周在漂白叶下出现的抗性芽亚克隆到相同的选择培养基上以形成愈伤组织,分离次级芽并亚克隆。在独立的亚克隆中经转化的质体基因组拷贝的完全分离(homoplasmicity)可通过标准的Southern印迹技术(Sambrook等,(1989)Molecular Cloning:A Laboratory Manual,Cold SpringHarbor Laboratory,Cold Spring Harbor)评估。BamHI/EcoRI-消化的总DNA(Mettler,I.J.(1987)Plant Mol Biol Reporter 5,346-349)在1%Tris-硼酸盐(TBE)的琼脂糖凝胶上分离,转移到尼龙膜上(Amersham),用32P-标记的随机引物DNA序列探测,所述的随机引物DNA序列相应于来自含有rps7/12质体靶向序列一部分的pC8的0.7kb BamHI/HindIII DNA片段。同质的芽于无菌条件下在含有壮观霉素的MS/IBA培养基(McBride,K.E.等(1994)PNAS 91,7301-7305)上生根后转移到温室中。
实施例8:育种
经本发明的核酸序列转化得到的植物可以是任意的植物物种,包括单子叶和双子叶植物;但本发明的方法中使用的植物优选地选自上文所述在农学上重要的靶作物。可以通过育种使本发明的基因的表达与其它有关产量和品质的重要特性相结合一起引入植物系中。育种方法和技术是本领域已知的。参见Welsh J.R.,Fundamentals ofPlant Genetics and Breeding,John Wiley & Sons,NY(1981);Crop Breeding,Wood D.R.(编)American Society of AgronomyMadison,Wisconsin(1983);Mayo O.,The Theory of PlantBreeding,第2版,Clarendon Press,Oxford(1987);Singh,D.P.,Breeding for Resistance to Diseases and Insect Pests,Springer-Verlag,NY(1986);Wricke和Weber,QuantitativeGenetics and Selection Plant Breeding,Walter de Gruyterand Co.,Berlin(1986)。
上述已改造到转基因种子和植物中的遗传特性通过有性繁殖和营养生长进行传递,因而能保持下来,并在后代植物中传播。一般说来用已开发适于特定目的的已知的农业方法进行所述维持和传播,如耕种,播种或收获。可以应用专门的方法,如液体栽培和温室技术。生长中的作物易受昆虫的侵袭和破坏或感染,对杂草的竞争也敏感。可通过控制杂草,植物疾病和昆虫,线虫和其它不利条件的方法提高收成。这些方法包括机械方法,如土地的耕种或清除杂草或感染植物,及应用农业化学制品如,除草剂,杀真菌剂,杀配子剂,杀线虫药,生长调节剂,催熟剂和杀虫剂。
利用本发明转基因植物和种子具有优势的遗传特性可进一步应用于植物育种,目的是使植物具有改良的性状,如对害虫,除草剂或胁迫的耐性,改善了的营养价值,提高的产率,或减少由倒伏或脱粒造成的损失的改良结构。多种育种步骤以已有详细描述的人为介入为特征,所述的人为介入如,选择待杂交品系,指导亲本株系的授粉或选择合适的子代植物。根据所希望的特性可应用不同的育种方法。相关的技术在本领域中是已知的,其包括但不限于杂交,近交,回交育种,多系育种(multiline breeding),混合变种(variety blend),种间杂交,非整倍体技术等。杂交技术也包括通过机械,化学或生物学手段使植物不育以获得雄性或雌性不育植物。雄性不育植物用不同系的花粉异花授粉保证雄性不育但雌性可育植物的基因组均一地获得两亲本系的特性。因此,本发明的转基因种子和植物可用于培育改良的植物系,如提高传统方法,如除草剂或杀虫剂处理的效率,或由于其经修饰的遗传特性而允许人们省却所述的方法。或者,可以获得具有改良的耐胁迫性的新作物,它们由于具有经优化的遗传“装备”,与不能耐受可类比的不利发育条件的产品相比,可收获具有更优良品质的收获产品。
实施例9:种子的生产
在种子的生产中,萌发质量和种子的均一性是重要的产品特性,而由农民播种和收获的种子的萌发质量和均一性并不重要。由于保持某种作物与其它作物或杂草种子相分离,控制种子所带疾病,和生产发芽良好的种子是困难的,有经验的培养、调理和经销纯种子的种子生产者发展了非常详尽和明确的种子生产实践。因此农民普遍采用的方式是购买经鉴定满足特定品质标准的种子,而不使用自己收获的种子。用作种子的繁殖材料通常用经保护剂包被层,包括除草剂,杀虫剂,杀真菌剂,杀菌剂,杀线虫剂,杀螺剂或其混合物处理。常用的保护剂包被层包括,如化合物克菌丹,萎锈灵,福美双(thiram)(TMTD),methalaxyl(Apron),和安定磷(Actellic)。如果需要,这些化合物可与载体,表面活性剂,或在制剂领域常规用来防止由细菌,真菌或动物害虫引起的损害的施用促进辅药一起配制。所述的保护剂包被层可通过用液体制剂浸渍繁殖材料进行,或通过用联合的干/湿制剂包被来进行。也可以使用其它的方法,例如直接对芽或果实进行处理。
实施例10:玉米植物分析
用质粒pNOV1436,pNOV1441,和pNOV1313通过土壤杆菌介导的转化转化的玉米植物给出100%抗欧洲玉米螟(Europeancornborer)和草地夜蛾(fall armyworm)死亡率。ELISA数据如下:
3275-2 pNOV1436 MTL A188 125/299 4465/1913 4351/2611
3277-2 pNOV1436 MTL A188 218/234 136 798 743/3251 613/3055
3279-1 pNOV1436 MTL A188 108/398 1566/2505 1457/2514
3309-6 pNOV1436 MTL A188 168/326 1164/1017 1527/2391
3324-1 pNOV1436 MTL A188 192 0 203 1068 1437
3330-2 pNOV1436 MTL A188 262/800 0 542 5565 3366
3331-1 pNOV1436 MTL A188 236/347 1010 1341
3338-1 pNOV1436 MTL A188 287/457 13 4578 1795
3357-1 pNOV1436 MTL A188 349/551 61 780 3968 2022
3360-1 pNOV1436 MTL A188 300/428 0 392 2026 1764
3717-2 pNOV1441 Mz Ubi Hi II 2142 374 1719 NS NS
3723-5 pNOV1441 Mz Ubi Hi II 2302 13757 7215
3838-1 pNOV1441 Mz Ubi Hi II 2188 24013 13564
3847-2 pNOV1441 Mz Ubi Hi II 741 699 3707 NS NS
3877-1 pNOV1441 Mz Ubi Hi II 991 436 1349 15105 10904
3720-1 pNOV1441 Mz Ubi Hi II 1437 3854 2719
3833-3 pNOV1441 Mz Ubi Hi II 878 166 799
4013-5 pNOV1441 Mz Ubi Hi II 944 174 1918
40294 pNOV1441 Mz Ubi Hi II 1661
4708-1 pNOV1313 Mz Ubi Hi ll 832
4709-2 pNOV1313 Mz Ubi Hi ll 581
4710-5 pNOV1313 Mz Ubi Hi ll 625
4711-2 pNOV1313 Mz Ubi Hi ll 570
4713-2 pNOV1313 Mz Ubi Hi ll 962
4717-1 pNOV1313 Mz Ubi Hi ll 881
MTL=玉米金属硫蛋白样(maize metallothionein-like)
Mz Ubi=玉米遍在蛋白
实施例11.稻植物分析
由质粒pNOV1305通过土壤杆菌介导的转化转化的植物给出100%抗欧洲玉米螟(European cornborer)和草地夜蛾(fallarmyworm)死亡率。ELISA数据如下:
639 pNOV1305 MTL 294
640 pNOV1305 MTL 241
643 pNOV1305 MTL 153
650 pNOV1305 MTL 149
847 pNOV1305 MTL 173
871 pNOV1305 MTL 244
872 pNOV1305 MTL 252
886 pNOV1305 MTL 185
888 pNOV1305 MTL 160
893 pNOV1305 MTL 168
1148 pNOV1305 MTL 1816
1149 pNOV1305 MTL 224
1152 pNOV1305 MTL 173
1154 pNOV1305 MTL 142
1163 pNOV1305 MTL 139
1164 pNOV1305 MTL 138
1167 pNOV1305 MTL 284
1168 pNOV1305 MTL 137
1177 pNOV1305 MTL 167
1349 pNOV1305 MTL 164
1350 pNOV1305 MTL 115
1357 pNOV1305 MTL 132
1363 pNOV1305 MTL 119
1497 pNOV1305 MTL 94
MTL=玉米金属硫蛋白样
实施例12.卷心菜植物分析
测试了由质粒pZU578(SEQ ID NO:17)通过土壤杆菌介导的转化转化的卷心菜植物对菜蛾(Plutella xylostella)的抗性。用16只幼虫(1-3龄)感染转基因可和对照植物,用油漆刷从笼养的菜蛾(Plutella)培养物(和卷心菜植物一起)中转移,4片叶子中的每一片上放4只。经感染的植物转移到1x1x1m笼中进行持续的实验。对照植物包括未转化的卷心菜植物s(易感染的对照)和喷洒了可商购的Bt杀虫剂Dipel的未转化的卷心菜植物(抗性对照)。评分为(2周后):-=没有损害(或仅有小孔=抗性);+=在植物上有大孔(=易感染);++有许多大孔且植物严重损坏(=易感染)。Dipel植物总是评分为-,易感性对照评分总是++。转基因和对照植物的昆虫损害率和ELISA数据如下。
04-05-01-01 pZU578 Act2 ++ 0
04-05-01-02 pZU578 Act2 ++ 0
07-11-01 pZU578 Act2 - 921
10-25-05 pZU578 Act2 ++ 0
10-39-06 pZU578 Act2 - 270
304-F-07 pZU578 Act2 -
304-F-11 pZU578 Act2 -
304-F-15 pZU578 Act2 -
304-F-16 pZU578 Act2 -
304-F-38 pZU578 Act2 -
304-g-07 pZU578 Act2 -
304-g-08 pZU578 Act2 -
304-g-12 pZU578 Act2 -
304-g-21 pZU578 Act2 -
304-g-24 pZU578 Act2 + 0
304-H-01 pZU578 Act2 -
304-H-08 pZU578 Act2 -
304-H-09 pZU578 Act2 -
304-H-34 pZU578 Act2 -
304-H-35 pZU578 Act2 -
391-J-08 pZU578 Act2 -
394-F-5 pZU578 Act2 -
394-H-12 pZU578 Act2 -
Act2=拟南芥属肌动蛋白2
上述描述的实施例只是示例性的。本领域的技术人员可根据本发明的教导得到许多本发明的变化形式。所有这些显然的和可预见的变化形式均包含在本发明的范围内。
序列表
序列表<110>Syngenta participations AG<120>新的自来苏云金芽孢杆菌杀虫晶体蛋白的杀虫毒素<130>Case S-31282A<140><141><150>US 60/227956<151>2000-08-25<160>17<170>PatentIn Ver.2.1<210>1<211>3579<212>DNA<213>人工序列<220><223>人工序列说明:带Cry1C尾的H04<220><221>CDS<222>(1)..(3579)<223>带Cry1C尾的H04<300><303>Appl.Environ.Microbiol.<304>62<305>5<306>1537-1543<307>1996<300><310>5,736,131<400>1atg gat aac aat ccg aac atc aat gaa tgc att cct tat aat tgt tta 48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15agt aac cct gaa gta gaa gta tta ggt gga gaa aga ata gaa act ggt 96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30tac acc cca atc gat att tcc ttg tcg cta acg caa ttt ctt ttg agt 144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45gaa ttt gtt ccc ggt gct gga ttt gtg tta gga cta gtt gat ata ata 192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60tgg gga att ttt ggt ccc tct caa tgg gac gca ttt ctt gta caa att 240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80gaa cag tta att aac caa aga ata gaa gaa ttc gct agg aac caa gcc 288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95att tct aga tta gaa gga cta agc aat ctt tat caa att tac gca gaa 336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110tct ttt aga gag tgg gaa gca gat cct act aat cca gca tta aga gaa 384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125gag atg cgt att caa ttc aat gac atg aac agt gcc ctt aca acc gct 432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140att cct ctt ttt gca gtt caa aat tat caa gtt cct ctt tta tca gta 480Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145 150 155 160tat gtt caa gct gca aat tta cat tta tca gtt ttg aga gat gtt tca 528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175gtg ttt gga caa agg tgg gga ttt gat gcc gcg act atc aat agt cgt 576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190tat aat gat tta act agg ctt att ggc aac tat aca gat cat gct gta 624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val
195 200 205cgc tgg tac aat acg gga tta gag cgt gta tgg gga ccg gat tct aga 672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220gat tgg ata aga tat aat caa ttt aga aga gaa tta aca cta act gta 720Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225 230 235 240tta gat atc gtt tct cta ttt ccg aac tat gat agt aga acg tat cca 768Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro
245 250 255att cga aca gtt tcc caa tta aca aga gaa att tat aca aac cca gta 816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270tta gaa aat ttt gat ggt agt ttt cga ggc tcg gct cag ggc ata gaa 864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
275 280 285gga agt att agg agt cca cat ttg atg gat ata ctt aac agt ata acc 912Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300atc tat acg gat gct cat aga gga gaa tat tat tgg tca ggg cat caa 960Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305 310 315 320ata atg gct tct cct gta ggg ttt tcg ggg cca gaa ttc act ttt ccg 1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
325 330 335cta tat gga act atg gga aat gca gct cca caa caa cgt att gtt gct 1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
340 345 350caa cta ggt cag ggc gtg tat aga aca tta tcg tcc act tta tat aga 1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
355 360 365aga cct ttt aat ata ggg ata aat aat caa caa cta tct gtt ctt gac 1152Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370 375 380ggg aca gaa ttt gct tat gga acc tcc tca aat ttg cca tcc gct gta 1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385 390 395 400tac aga aaa agc gga acg gta gat tcg ctg gat gaa ata ccg cca cag 1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
405 410 415aat aac aac gtg cca cct agg caa gga ttt agt cat cga tta agc cat 1296Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
420 425 430gtt tca atg ttt cgt tca ggc ttt agt aat agt agt gta agt ata ata 1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
435 440 445aga gct cct atg ttc tct tgg ata cat cgt agt gca act ctt aca aat 1392Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn
450 455 460aca att gat cca gag aga att aat caa ata cct tta gtg aaa gga ttt 1440Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465 470 475 480aga gtt tgg ggg ggc acc tct gtc att aca gga cca gga ttt aca gga 1488Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
485 490 495ggg gat atc ctt cga aga aat acc ttt ggt gat ttt gta tct cta caa 1536Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
500 505 510gtc aat att aat tca cca att acc caa aga tac cgt tta aga ttt cgt 1584Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
515 520 525tac gct tcc agt agg gat gca cga gtt ata gta tta aca gga gcg gca 1632Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
530 535 540tcc aca gga gtg gga ggc caa gtt agt gta aat atg cct ctt cag aaa 1680Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545 550 555 560act atg gaa ata ggg gag aac tta aca tct aga aca ttt aga tat acc 1728Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
565 570 575gat ttt agt aat cct ttt tca ttt aga gct aat cca gat ata att ggg 1776Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
580 585 590ata agt gaa caa cct cta ttt ggt gca ggt tct att agt agc ggt gaa 1824Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
595 600 605ctt tat ata gat aaa att gaa att att cta gca gat gca aca ttt gaa 1872Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
610 615 620gca gaa tct gat tta gaa aga gca caa aag gcg gtg aat gcc ctg ttt 1920Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625 630 635 640act tct tcc aat caa atc ggg tta aaa acc gat gtg acg gat tat cat 1968Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His
645 650 655att gat caa gta tcc aat tta gtg gat tgt tta tca gat gaa ttt tgt 2016Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys
660 665 670ctg gat gaa aag cga gaa ttg tcc gag aaa gtc aaa cat gcg aag cga 2064Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg
675 680 685ctc agt gat gag cgg aat tta ctt caa gat cca aac ttc aga ggg atc 2112Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile
690 695 700aat aga caa cca gac cgt ggc tgg aga gga agt aca gat att acc atc 2160Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile705 710 715 720caa gga gga gat gac gta ttc aaa gag aat tac gtc aca cta ccg ggt 2208Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly
725 730 735acc gtt gat gag tgc tat cca acg tat tta tat cag aaa ata gat gag 2256Thr Val Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu
740 745 750tcg aaa tta aaa gct tat acc cgt tat gaa tta aga ggg tat atc gaa 2304Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu
755 760 765gat agt caa gac tta gaa atc tat ttg atc cgt tac aat gca aaa cac 2352Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His
770 775 780gaa ata gta aat gtg cca ggc acg ggt tcc tta tgg ccg ctt tca gcc 2400Glu Ile Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala785 790 795 800caa agt cca atc gga aag tgt gga gaa ccg aat cga tgc gcg cca cac 2448Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His
805 810 815ctt gaa tgg aat cct gat cta gat tgt tcc tgc aga gac ggg gaa aaa 2496Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys
820 825 830tgt gca cat cat tcc cat cat ttc acc ttg gat att gat gtt gga tgt 2544Cys Ala His His Ser His His Phe Thr Leu Asp Ile Asp Val Gly Cys
835 840 845aca gac tta aat gag gac tta ggt gta tgg gtg ata ttc aag att aag 2592Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys
850 855 860acg caa gat ggc cat gca aga cta ggg aat cta gag ttt ctc gaa gag 2640Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu865 870 875 880aaa cca tta tta ggg gaa gca cta gct cgt gtg aaa aga gcg gag aag 2688Lys Pro Leu Leu Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys
885 890 895aag tgg aga gac aaa cga gag aaa ctg cag ttg gaa aca aat att gtt 2736Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn Ile Val
900 905 910tat aaa gag gca aaa gaa tct gta gat gct tta ttt gta aac tct caa 2784Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln
915 920 925tat gat aga tta caa gtg gat acg aac atc gcg atg att cat gcg gca 2832Tyr Asp Arg Leu Gln Val Asp Thr Asn Ile Ala Met Ile His Ala Ala
930 935 940gat aaa cgc gtt cat aga atc cgg gaa gcg tat ctg cca gag ttg tct 2880Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser945 950 955 960gtg att cca ggt gtc aat gcg gcc att ttc gaa gaa tta gag gga cgt 2928Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg
965 970 975att ttt aca gcg tat tcc tta tat gat gcg aga aat gtc att aaa aat 2976Ile Phe Thr Ala Tyr Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn
980 985 990ggc gat ttc aat aat ggc tta tta tgc tgg aac gtg aaa ggt cat gta 3024Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val
995 1000 1005gat gta gaa gag caa aac aac cac cgt tcg gtc ctt gtt atc cca gaa 3072Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Ile Pro Glu 1010 1015 1020tgg gag gca gaa gtg tca caa gag gtt cgt gtc tgt cca ggt cgt ggc 3120Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly1025 1030 1035 1040tat atc ctt cgt gtc aca gca tat aaa gag gga tat gga gag ggc tgc 3168Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys
1045 1050 1055gta acg atc cat gag atc gaa gac aat aca gac gaa ctg aaa ttc agc 3216Val Thr Ile His Glu Ile Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser
1060 1065 1070aac tgt gta gaa gag gaa gta tat cca aac aac aca gta acg tgt aat 3264Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn
1075 1080 1085aat tat act ggg act caa gaa gaa tat gag ggt acg tac act tct cgt 3312Asn Tyr Thr Gly Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg 1090 1095 1100aat caa gga tat gac gaa gcc tat ggt aat aac cct tcc gta cca gct 3360Asn Gln Gly Tyr Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala1105 1110 1115 1120gat tac gct tca gtc tat gaa gaa aaa tcg tat aca gat gga cga aga 3408Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg
1125 1130 1135gag aat cct tgt gaa tct aac aga ggc tat ggg gat tac aca cca cta 3456Glu Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu
1140 1145 1150ccg gct ggt tat gta aca aag gat tta gag tac ttc cca gag acc gat 3504pro Ala Gly Tyr Val Thr Lys Asp Leu Glu Tyr phe Pro Glu Thr Asp
1155 1160 1165aag gta tgg att gag atc gga gaa aca gaa gga aca ttc atc gtg gat 3552Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp 1170 1175 1180agc gtg gaa tta ctc ctt atg gag gaa 3579Ser Val Glu Leu Leu Leu Met Glu Glu1185 1190<210>2<211>1193<212>PRT<213>人工序列<223>人工序列说明:带Cry1C尾的H04<400>2Met Asp Asn Asn pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15Ser Asn pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln phe Leu Leu Ser
35 40 45Glu phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145 150 155 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val
195 200 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225 230 235 240Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro
245 250 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
275 280 285Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305 310 315 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
325 330 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
340 345 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
355 360 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370 375 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385 390 395 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
405 410 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
420 425 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
435 440 445Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn
450 455 460Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465 470 475 480Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
485 490 495Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
500 505 510Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
515 520 525Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
530 535 540Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545 550 555 560Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
565 570 575Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
580 585 590Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
595 600 605Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
610 615 620Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625 630 635 640Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His
645 650 655Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys
660 665 670Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg
675 680 685Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile
690 695 700Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile705 710 715 720Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Pro Gly
725 730 735Thr Val Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile Asp Glu
740 745 750Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Glu Leu Arg Gly Tyr Ile Glu
755 760 765Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His
770 775 780Glu Ile Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala785 790 795 800Gln Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His
805 810 815Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys
820 825 830Cys Ala His His Ser His His Phe Thr Leu Asp Ile Asp Val Gly Cys
835 840 845Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys
850 855 860Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu865 870 875 880Lys Pro Leu Leu Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys
885 890 895Lys Trp Arg Asp Lys Arg Glu Lys Leu Gln Leu Glu Thr Asn Ile Val
900 905 910Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln
915 920 925Tyr Asp Arg Leu Gln Val Asp Thr Asn Ile Ala Met Ile His Ala Ala
930 935 940Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser945 950 955 960Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg
965 970 975Ile Phe Thr Ala Tyr Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn
980 985 990Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Val Lys Gly His Val
995 1000 1005Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Ile Pro Glu 1010 1015 1020Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly025 1030 1035 1040Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys
1045 1050 1055Val Thr Ile His Glu Ile Glu Asp Asn Thr Asp Glu Leu Lys Phe Ser
1060 1065 1070Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn
1075 1080 1085Asn Tyr Thr Gly Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg 1090 1095 1100Asn Gln Gly Tyr Asp Glu Ala Tyr Gly Asn Asn Pro Ser Val Pro Ala105 1110 1115 1120Asp Tyr Ala Ser Val Tyr Glu Glu Lys Ser Tyr Thr Asp Gly Arg Arg
1125 1130 1135Glu Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu
1140 1145 1150Pro Ala Gly Tyr Val Thr Lys Asp Leu Glu Tyr Phe Pro Glu Thr Asp
1155 1160 1165Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp 1170 1175 1180Ser Val Glu Leu Leu Leu Met Glu Glu185 1190<210>3<211>1896<212>DNA<213>人工序列<220><223>人工序列说明:编码不带尾的H04毒素部分的合成基因<220><221>CDS<222>(1)..(1896)<223>不带尾的H04毒素部分<400>3atg gac aac aac ccc aac atc aac gag tgc atc ccc tac aac tgc ctg 48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15agc aac ccc gag gtg gag gtg ctg ggc ggc gag cgc atc gag acc ggc 96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30tac acc ccc atc gac atc agc ctg agc ctg acc cag ttc ctg ctg agc 144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45gag ttc gtg ccc ggc gcc ggc ttc gtg ctg ggc ctg gtg gac atc atc 192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60tgg ggc atc ttc ggc ccc agc cag tgg gac gcc ttc ctg gtg cag atc 240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80gag cag ttg ata aac caa ggc ata gag gaa ttc gcc cgc aac cag gcc 288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95atc agc cgc ctg gag ggc ctg agc aac ctg tac caa atc tac gcc gag 336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110agc ttc cgc gag tgg gag gcc gac ccc acc aac ccc gcc ctg cgc gag 384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125gag atg cgc atc cag ttc aac gac atg aac agc gcc ctg acc acc gcc 432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140atc ccc ctg ttc gcc gtg cag aac tac cag gtg ccc ctg ctg agc gtg 480Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145 150 155 160tac gtg cag gcc gcc aac ctg cac ctg agc gtg ctg cgc gac gtc agc 528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175gtg ttc ggc cag cgc tgg ggc ttc gac gcc gcc acc atc aac agc cgc 576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190tac aac gac ctg acc cgc ctg atc ggc aac tac acc gac cac gcc gtg 624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val
195 200 205cgc tgg tac aac acc ggc ctg gag cgc gtg tgg ggt ccc gac agc cgc 672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220gac tgg atc agg tac aac cag ttc cgc cgc gag ctg acc ctg acc gtg 720Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225 230 235 240ctg gac atc gtg agc ctg ttc ccc aac tac gac agc cgc acc tac ccc 768Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro
245 250 255atc cgc acc gtg agc cag ctg acc cgc gag att tac acc aac ccc gtg 816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270ctg gag aac ttc gac ggc agc ttc cgc ggc agc gcc cag ggc atc gag 864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
275 280 285ggc agc atc cgc agc ccc cac ctg atg gac atc ctg aac agc atc acc 912Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300atc tac acc gac gcc cac cgc ggc gag tac tac tgg agc ggc cac cag 960Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305 310 315 320atc atg gcc agc ccc gtc ggc ttc agc ggc ccc gag ttc acc ttc ccc 1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
325 330 335ctg tac ggc acc atg ggc aac gct gca cct cag cag cgc atc gtg gca 1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
340 345 350cag ctg ggc cag gga gtg tac cgc acc ctg agc agc acc ctg tac cgt 1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
355 360 365cga cct ttc aac atc ggc atc aac aac cag cag ctg agc gtg ctg gac 1152Arg Pro Phe Asn Ile Gly Ile Asn Ash Gln Gln Leu Ser Val Leu Asp
370 375 380ggc acc gag ttc gcc tac ggc acc agc agc aac ctg ccc agc gcc gtg 1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385 390 395 400tac cgc aag agc ggc acc gtg gac agc ctg gac gag atc ccc cct cag 1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
405 410 415aac aac aac gtg cca cct cga cag ggc ttc agc cac cgt ctg agc cac 1296Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
420 425 430gtg agc atg ttc cgc agt ggc ttc agc aac agc agc gtg agc atc atc 1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
435 440 445cgt gca ccc atg ttc agc tgg att cac cgc agc gcc acc ctg acc aac 1392Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn
450 455 460acc atc gac ccc gag cgc atc aac cag atc ccc ctg gtg aag ggc ttc 1440Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465 470 475 480cgg gtg tgg ggc ggc acc agc gtg atc acc ggc ccc ggc ttc acc gga 1488Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
485 490 495ggc gac atc ctg cgc aga aac acc ttc ggc gac ttc gtg agc ctg cag 1536Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
500 505 510gtg aac atc aac agc ccc atc acc cag cgt tac cgc ctg cgc ttc cgc 1584Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
515 520 525tac gcc agc agc cgc gac gcc cgt gtg atc gtg ctg act ggc gcc gct 1632Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
530 535 540agc acc ggt gtg ggc ggt cag gtg agc gtg aac atg ccc ctg cag aag 1680Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545 550 555 560act atg gag atc ggc gag aac ctg act agt cgc acc ttc cgc tac acc 1728Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
565 570 575gac ttc agc aac ccc ttc agc ttc cgc gcc aac ccc gac atc atc ggc 1776Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
580 585 590atc agc gag cag ccc ctg ttc ggt gcc ggc agc atc agc agc ggc gag 1824Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
595 600 605ctg tac atc gac aag atc gag atc atc ctg gcc gac gcc acc ttc gag 1872Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
610 615 620gcc gag agc gac ctg gag cgc taa 1896Ala Glu Ser Asp Leu Glu Arg625 630<210>4<211>631<212>PRT<213>人工序列<223>人工序列说明:编码不带尾的H04毒素部分的合成基因<400>4Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145 150 155 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val
195 200 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225 230 235 240Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro
245 250 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
275 280 285Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305 310 315 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
325 330 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
340 345 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
355 360 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370 375 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385 390 395 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
405 410 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
420 425 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
435 440 445Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn
450 455 460Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465 470 475 480Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
485 490 495Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
500 505 510Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
515 520 525Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
530 535 540Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545 550 555 560Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
565 570 575Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
580 585 590Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
595 600 605Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala ASp Ala Thr Phe Glu
610 615 620Ala Glu Ser Asp Leu Glu Arg625 630<210>5<211>3582<212>DNA<213>人工序列<220><223>人工序列说明:编码带全长Cry1Ab尾的H04的合成基因<220><221>CDS<222>(1)..(3582)<223>带全长Cry1Ab尾的H04<400>5atg gac aac aac ccc aac atc aac gag tgc atc ccc tac aac tgc ctg 48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15agc aac ccc gag gtg gag gtg ctg ggc ggc gag cgc atc gag acc ggc 96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30tac acc ccc atc gac atc agc ctg agc ctg acc cag ttc ctg ctg agc 144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45gag ttc gtg ccc ggc gcc ggc ttc gtg ctg ggc ctg gtg gac atc atc 192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60tgg ggc atc ttc ggc ccc agc cag tgg gac gcc ttc ctg gtg cag atc 240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80gag cag ttg ata aac caa cgc ata gag gaa ttc gcc cgc aac cag gcc 288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95atc agc cgc ctg gag ggc ctg agc aac ctg tac caa atc tac gcc gag 336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110agc ttc cgc gag tgg gag gcc gac ccc acc aac ccc gcc ctg cgc gag 384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125gag atg cgc atc cag ttc aac gac atg aac agc gcc ctg acc acc gcc 432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140atc ccc ctg ttc gcc gtg cag aac tac cag gtg ccc ctg ctg agc gtg 480Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145 150 155 160tac gtg cag gcc gcc aac ctg cac ctg agc gtg ctg cgc gac gtc agc 528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175gtg ttc ggc cag cgc tgg ggc ttc gac gcc gcc acc atc aac agc cgc 576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190tac aac gac ctg acc cgc ctg atc ggc aac tac acc gac cac gcc gtg 624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val
195 200 205cgc tgg tac aac acc ggc ctg gag cgc gtg tgg ggt ccc gac agc cgc 672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220gac tgg atc agg tac aac cag ttc cgc cgc gag ctg acc ctg acc gtg 720Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225 230 235 240ctg gac atc gtg agc ctg ttc ccc aac tac gac agc cgc acc tac ccc 768Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro
245 250 255atc cgc acc gtg agc cag ctg acc cgc gag att tac acc aac ccc gtg 816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270ctg gag aac ttc gac ggc agc ttc cgc ggc agc gcc cag ggc atc gag 864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
275 280 285ggc agc atc cgc agc ccc cac ctg atg gac atc ctg aac agc atc acc 912Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300atc tac acc gac gcc cac cgc ggc gag tac tac tgg agc ggc cac cag 960Ile Tyr Thr Asp Ala His Arg Gly GluTyr Tyr Trp Ser Gly His Gln305 310 315 320atc atg gcc agc ccc gtc ggc ttc agc ggc ccc gag ttc acc ttc ccc 1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
325 330 335ctg tac ggc acc atg ggc aac gct gca cct cag cag cgc atc gtg gca 1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
340 345 350cag ctg ggc cag gga gtg tac cgc acc ctg agc agc acc ctg tac cgt 1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
355 360 365cga cct ttc aac atc ggc atc aac aac cag cag ctg agc gtg ctg gac 1152Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370 375 380ggc acc gag ttc gcc tac ggc acc agc agc aac ctg ccc agc gcc gtg 1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385 390 395 400tac cgc aag agc ggc acc gtg gac agc ctg gac gag atc ccc cct cag 1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
405 410 415aac aac aac gtg cca cct cga cag ggc ttc agc cac cgt ctg agc cac 1296Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
420 425 430gtg agc atg ttc cgc agt ggc ttc agc aac agc agc gtg agc atc atc 1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
435 440 445cgt gca ccc atg ttc agc tgg att cac cgc agc gcc acc ctg acc aac 1392Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn
450 455 460acc atc gac ccc gag cgc atc aac cag atc ccc ctg gtg aag ggc ttc 1440Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465 470 475 480cgg gtg tgg ggc ggc acc agc gtg atc acc ggc ccc ggc ttc acc gga 1488Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
485 490 495ggc gac atc ctg cgc aga aac acc ttc ggc gac ttc gtg agc ctg cag 1536Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
500 505 510gtg aac atc aac agc ccc atc acc cag cgt tac cgc ctg cgc ttc cgc 1584Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
515 520 525tac gcc agc agc cgc gac gcc cgt gtg atc gtg ctg act ggc gcc gct 1632Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
530 535 540agc acc ggt gtg ggc ggt cag gtg agc gtg aac atg ccc ctg cag aag 1680Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545 550 555 560act atg gag atc ggc gag aac ctg act agt cgc acc ttc cgc tac acc 1728Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
565 570 575gac ttc agc aac ccc ttc agc ttc cgc gcc aac ccc gac atc atc ggc 1776Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
580 585 590atc agc gag cag ccc ctg ttc ggt gcc ggc agc atc agc agc ggc gag 1824Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
595 600 605ctg tac atc gac aag atc gag atc atc ctg gcc gac gcc acc ttc gag 1872Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
610 615 620gcc gag agc gac ctg gag cgc gcc cag aag gcc gtg aac gcc ctg ttc 1920Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625 630 635 640acc agc agc aac cag atc ggc ctg aag acc gac gtg acc gac tac cac 1968Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His
645 650 655atc gac cag gtg agc aac ctg gtg gac tgc tta agc gac gag ttc tgc 2016Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys
660 665 670ctg gac gag aag aag gag ctg agc gag aag gtg aag cac gcc aag cgc 2064Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg
675 680 685ctg agc gac gag cgc aac ctg ctg cag gac ccc aac ttc cgc ggc atc 2112Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile
690 695 700aac cgc cag ctg gac cgc ggc tgg cga ggc agc acc gat atc acc atc 2160Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile705 710 715 720cag ggc ggc gac gac gtg ttc aag gag aac tac gtg acc ctg cag ggc 2208Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Gln Gly
725 730 735acc ttc gac gag tgc tac ccc acc tac ctg tac cag ccg atc gac gag 2256Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Pro Ile Asp Glu
740 745 750agc aag ctg aag gcc tac acc cgc tac cag ctg cgc ggc tac atc gag 2304Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu
755 760 765gac agc cag gac ctg gaa atc tac ctg atc cgc tac aac gcg aag cac 2352Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His
770 775 780gag acc gtg aac gtg ccc ggc acc ggc agc ctg tgg ccc ccg agc gcc 2400Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Pro Ser Ala785 790 795 800ccc agc ccc atc ggc aag tgc ggg gag ccg aat cga tgc gct ccg cac 2448Pro Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His
805 810 815ctg gag tgg aac ccg gac cta gac tgc agc tgc agg gac ggg gag aag 2496Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys
820 825 830tgc gcc cac cac agc cac cac ttc agc ctg gac atc gac gtg ggc tgc 2544Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys
835 840 845acc gac ctg aac gag gac ctg ggc gtg tgg gtg atc ttc aag atc aag 2592Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys
850 855 860acc cag gac ggc cac gcc cgc ctg ggc aat cta gag ttc ctg gag gag 2640Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu865 870 875 880aag ccc ctg gtg ggc gag gcc ctg gcc cgc gtg aag cgt gct gag aag 2688Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys
885 890 895aag tgg cgc gac aag cgc gag aag ctg gag tgg gag acc aac atc gtg 2736Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val
900 905 910tac aag gag gcc aag gag agc gtg gac gcc ctg ttc gtg aac agc cag 2784Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln
915 920 925tac gac cgc ctg cag gcc gac acc aac atc gcc atg atc cac gcc gcc 2832Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala
930 935 940gac aag cgc gtg cac agc att cgc gag gcc tac ctg ccc gag ctg agc 2880Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser945 950 955 960gtg atc ccc ggt gtg aac gcc gcc atc ttc gag gaa ctc gag ggc cgc 2928Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg
965 970 975atc ttc acc gcc ttc agc ctg tac gac gcc cgc aac gtg atc aag aac 2976Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn
980 985 990ggc gac ttc aac aac ggc ctg agc tgc tgg aac gtg aag ggc cac gtg 3024Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val
995 1000 1005gac gtg gag gag cag aac aac cac cgc agc gtg ctg gtg gtg ccc gag 3072Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Val Pro Glu 1010 1015 1020tgg gag gcc gag gtg agc cag gag gtg cgc gtg tgc ccc ggc cgc ggc 3120Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly1025 1030 1035 1040tac atc ctg cgc gtg acc gcc tac aag gag ggc tac ggc gag ggc tgc 3168Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys
1045 1050 1055gtg acc atc cac gag atc gag aac aac acc gac gag ctc aag ttc agc 3216Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser
1060 1065 1070aac tgc gtg gag gag gag gtt tac ccc aac aac acc gtg acc tgc aac 3264Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn
1075 1080 1085gac tac acc gcg acc cag gag gag tac gaa ggc acc tac acc tct cgc 3312Asp Tyr Thr Ala Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg 1090 1095 1100aac agg ggt tac gac ggc gcc tac gag tcc aac agc tcc gtg cca gct 3360Asn Arg Gly Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala1105 1110 1115 1120gac tac gcc agc gcc cac gag gag aaa gcc tac acc gac ggt aga cgc 3408Asp Tyr Ala Ser Ala His Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg
1125 1130 1135gac aac cca tgt gag agc aac aga ggc tac ggc gac tac acc ccc ctg 3456Asp Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu
1140 1145 1150ccc gct gga tac gtg acc aag gag ctg gag tac ttc ccc gag acc gac 3504Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
1155 1160 1165aag gtg tgg atc gag att ggc gag acc gag ggc acc ttc atc gtg gac 3552Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp 1170 1175 1180agc gtg gag ctg ctg ctg atg gag gagtag 3582Ser Val Glu Leu Leu Leu Met Glu Glu1185 1190<210>6<211>1193<212>PRT<213>人工序列<223>人工序列说明:编码带全长Cry1Ab尾的H04的合成基因<400>6Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145 150 155 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val
195 200 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225 230 235 240Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro
245 250 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
275 280 285Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305 310 315 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
325 330 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
340 345 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
355 360 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370 375 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385 390 395 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
405 410 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
420 425 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
435 440 445Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn
450 455 460Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe 465 470 475 480Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
485 490 495Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
500 505 510Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
515 520 525Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
530 535 540Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545 550 555 560Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
565 570 575Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
580 585 590Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
595 600 605Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
610 615 620Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625 630 635 640Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His
645 650 655Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys
660 665 670Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg
675 680 685Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile
690 695 700Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile705 710 715 720Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Gln Gly
725 730 735Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Pro Ile Asp Glu
740 745 750Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu
755 760 765Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His
770 775 780Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Pro Ser Ala785 790 795 800Pro Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His
805 810 815Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys
820 825 830Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys
835 840 845Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys
850 855 860Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu865 870 875 880Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys
885 890 895Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val
900 905 910Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln
915 920 925Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala
930 935 940Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser945 950 955 960Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg
965 970 975Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn
980 985 990Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val
995 1000 1005Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Val Pro Glu 1010 1015 1020Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly1025 1030 1035 1040Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys
1045 1050 1055Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser
1060 1065 1070Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn
1075 1080 1085Asp Tyr Thr Ala Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg 1090 1095 1100Asn Arg Gly Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala1105 1110 1115 1120Asp Tyr Ala Ser Ala His Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg
1125 1130 1135Asp Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu
1140 1145 1150Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
1155 1160 1165Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp 1170 1175 1180Ser Val Glu Leu Leu Leu Met Glu Glu1185 1190<210>7<211>3582<212>DNA<213>人工序列<220><223>人工序列说明:编码带全长Cry1Ab尾的H04的合成基因<220><221>CDS<222>(1)..(3582)<223>带全长Cry1Ab尾的H04<400>7atg gac aac aac ccc aac atc aac gag tgc atc ccc tac aac tgc ctg 48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15agc aac ccc gag gtg gag gtg ctg ggc ggc gag cgc atc gag acc ggc 96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30tac acc ccc atc gac atc agc ctg agc ctg acc cag ttc ctg ctg agc 144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45gag ttc gtg ccc ggc gcc ggc ttc gtg ctg ggc ctg gtg gac atc atc 192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60tgg ggc atc ttc ggc ccc agc cag tgg gac gcc ttc ctg gtg cag atc 240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80gag cag ttg ata aac caa cgc ata gag gaa ttc gcc cgc aac cag gcc 288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95atc agc cgc ctg gag ggc ctg agc aac ctg tac caa atc tac gcc gag 336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110agc ttc cgc gag tgg gag gcc gac ccc acc aac ccc gcc ctg cgc gag 384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125gag atg cgc atc cag ttc aac gac atg aac agc gcc ctg acc acc gcc 432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140atc ccc ctg ttc gcc gtg cag aac tac cag gtg ccc ctg ctg agc gtg 480Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145 150 155 160tac gtg cag gcc gcc aac ctg cac ctg agc gtg ctg cgc gac gtc agc 528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175gtg ttc ggc cag cgc tgg ggc ttc gac gcc gcc acc atc aac agc cgc 576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190tac aac gac ctg acc cgc ctg atc ggc aac tac acc gac cac gcc gtg 624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val
195 200 205cgc tgg tac aac acc ggc ctg gag cgc gtg tgg ggt ccc gac agc cgc 672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220gac tgg atc agg tac aac cag ttc cgc cgc gag ctg acc ctg acc gtg 720Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225 230 235 240ctg gac atc gtg agc ctg ttc ccc aac tac gac agc cgc acc tac ccc 768Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro
245 250 255atc cgc acc gtg agc cag ctg acc cgc gag att tac acc aac ccc gtg 816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270ctg gag aac ttc gac ggc agc ttc cgc ggc agc gcc cag ggc atc gag 864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
275 280 285ggc agc atc cgc agc ccc cac ctg atg gac atc ctg aac agc atc acc 912Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300atc tac acc gac gcc cac cgc ggc gag tac tac tgg agc ggc cac cag 960Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305 310 315 320atc atg gcc agc ccc gtc ggc ttc agc ggc ccc gag ttc acc ttc ccc 1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
325 330 335ctg tac ggc acc atg ggc aac gct gca cct cag cag cgc atc gtg gca 1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
340 345 350cag ctg ggc cag gga gtg tac cgc acc ctg agc agc acc ctg tac cgt 1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
355 360 365cga cct ttc aac atc ggc atc aac aac cag cag ctg agc gtg ctg gac 1152Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370 375 380ggc acc gag ttc gcc tac ggc acc agc agc aac ctg ccc agc gcc gtg 1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385 390 395 400tac cgc aag agc ggc acc gtg gac agc ctg gac gag atc ccc cct cag 1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
405 410 415aac aac aac gtg cca cct cga cag ggc ttc agc cac cgt ctg agc cac 1296Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
420 425 430gtg agc atg ttc cgc agt ggc ttc agc aac agc agc gtg agc atc atc 1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
435 440 445cgt gca ccc atg ttc agc tgg att cac cgc agc gcc acc ctg acc aac 1392Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn
450 455 460acc atc gac ccc gag cgc atc aac cag atc ccc ctg gtg aag ggc ttc 1440Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465 470 475 480cgg gtg tgg ggc ggc acc agc gtg atc acc ggc ccc ggc ttc acc gga 1488Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
485 490 495ggc gac atc ctg cgc aga aac acc ttc ggc gac ttc gtg agc ctg cag 1536Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
500 505 510gtg aac atc aac agc ccc atc acc cag cgt tac cgc ctg cgc ttc cgc 1584Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
515 520 525tac gcc agc agc cgc gac gcc cgt gtg atc gtg ctg act ggc gcc gct 1632Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
530 535 540agc acc ggt gtg ggc ggt cag gtg agc gtg aac atg ccc ctg cag aag 1680Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545 550 555 560act atg gag atc ggc gag aac ctg act agt cgc acc ttc cgc tac acc 1728Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
565 570 575gac ttc agc aac ccc ttc agc ttc cgc gcc aac ccc gac atc atc ggc 1776Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
580 585 590atc agc gag cag ccc ctg ttc ggt gcc ggc agc atc agc agc ggc gag 1824Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
595 600 605ctg tac atc gac aag atc gag atc atc ctg gcc gac gcc acc ttc gag 1872Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
610 615 620gcc gag agc gac ctg gag cgc gcc cag aag gcc gtg aac gcc ctg ttc 1920Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625 630 635 640acc agc agc aac cag atc ggc ctg aag acc gac gtg acc gac tac cac 1968Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His
645 650 655atc gac cag gtg agc aac ctg gtg gac tgc tta agc gac gag ttc tgc 2016Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys
660 665 670ctg gac gag aag aag gag ctg agc gag aag gtg aag cac gcc aag cgc 2064Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg
675 680 685ctg agc gac gag cgc aac ctg ctg cag gac ccc aac ttc cgc ggc atc 2112Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile
690 695 700aac cgc cag ctg gac cgc ggc tgg cga ggc agc acc gat atc acc atc 2160Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile705 710 715 720cag ggc ggc gac gac gtg ttc aag gag aac tac gtg acc ctg cag ggc 2208Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Gln Gly
725 730 735acc ttc gac gag tgc tac ccc acc tac ctg tac cag ccg atc gac gag 2256Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Pro Ile Asp Glu
740 745 750agc aag ctg aag gcc tac acc cgc tac cag ctg cgc ggc tac atc gag 2304Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu
755 760 765gac agc cag gac ctg gaa atc tac ctg atc cgc tac aac gcg aag cac 2352Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His
770 775 780gag acc gtg aac gtg ccc ggc acc ggc agc ctg tgg ccc ctg agc gcc 2400Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala785 790 795 800ccc agc ccc atc ggc aag tgc ggg gag ccg aat cga tgc gct ccg cac 2448Pro Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His
805 810 815ctg gag tgg aac ccg gac cta gac tgc agc tgc agg gac ggg gag aag 2496Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys
820 825 830tgc gcc cac cac agc cac cac ttc agc ctg gac atc gac gtg ggc tgc 2544Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys
835 840 845acc gac ctg aac gag gac ctg ggc gtg tgg gtg atc ttc aag atc aag 2592Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys
850 855 860acc cag gac ggc cac gcc cgc ctg ggc aat cta gag ttc ctg gag gag 2640Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu865 870 875 880aag ccc ctg gtg ggc gag gcc ctg gcc cgc gtg aag cgt gct gag aag 2688Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys
885 890 895aag tgg cgc gac aag cgc gag aag ctg gag tgg gag acc aac atc gtg 2736Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val
900 905 910tac aag gag gcc aag gag agc gtg gac gcc ctg ttc gtg aac agc cag 2784Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln
915 920 925tac gac cgc ctg cag gcc gac acc aac atc gcc atg atc cac gcc gcc 2832Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala
930 935 940gac aag cgc gtg cac agc att cgc gag gcc tac ctg ccc gag ctg agc 2880Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser945 950 955 960gtg atc ccc ggt gtg aac gcc gcc atc ttc gag gaa ctc gag ggc cgc 2928Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg
965 970 975atc ttc acc gcc ttc agc ctg tac gac gcc cgc aac gtg atc aag aac 2976Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn
980 985 990ggc gac ttc aac aac ggc ctg agc tgc tgg aac gtg aag ggc cac gtg 3024Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val
995 1000 1005gac gtg gag gag cag aac aac cac cgc agc gtg ctg gtg gtg ccc gag 3072Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Val Pro Glu 1010 1015 1020tgg gag gcc gag gtg agc cag gag gtg cgc gtg tgc ccc ggc cgc ggc 3120Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly1025 1030 1035 1040tac atc ctg cgc gtg acc gcc tac aag gag ggc tac ggc gag ggc tgc 3168Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys
1045 1050 1055gtg acc atc cac gag atc gag aac aac acc gac gag ctc aag ttc agc 3216Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser
1060 1065 1070aac tgc gtg gag gag gag gtt tac ccc aac aac acc gtg acc tgc aac 3264Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn
1075 1080 1085gac tac acc gcg acc cag gag gag tac gaa ggc acc tac acc tct cgc 3312Asp Tyr Thr Ala Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg 1090 1095 1100aac agg ggt tac gac ggc gcc tac gag tcc aac agc tcc gtg cca gct 3360Asn Arg Gly Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala1105 1110 1115 1120gac tac gcc agc gcc tac gag gag aaa gcc tac acc gac ggt aga cgc 3408Asp Tyr Ala Ser Ala Tyr Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg
1125 1130 1135gac aac cca tgt gag agc aac aga ggc tac ggc gac tac acc ccc ctg 3456Asp Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu
1140 1145 1150ccc gct gga tac gtg acc aag gag ctg gag tac ttc ccc gag acc gac 3504Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
1155 1160 1165aag gtg tgg atc gag att ggc gag acc gag ggc acc ttc atc gtg gac 3552Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp 1170 1175 1180agc gtg gag ctg ctg ctg atg gag gag tag 3582Ser Val Glu Leu Leu Leu Met Glu Glu1185 1190<210>8<211>1193<212>PRT<213>人工序列<223>人工序列说明:编码带全长Cry1Ab尾的H04的合成基因<400>8Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145 150 155 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val
195 200 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225 230 235 240Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro
245 250 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
275 280 285Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305 310 315 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
325 330 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
340 345 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
355 360 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370 375 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385 390 395 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
405 410 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
420 425 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
435 440 445Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn
450 455 460Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465 470 475 480Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
485 490 495Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
500 505 510Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
515 520 525Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
530 535 540Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545 550 555 560Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
565 570 575Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
580 585 590Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
595 600 605Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
610 615 620Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625 630 635 640Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His
645 650 655Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu Phe Cys
660 665 670Leu Asp Glu Lys Lys Glu Leu Ser Glu Lys Val Lys His Ala Lys Arg
675 680 685Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg Gly Ile
690 695 700Asn Arg Gln Leu Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile Thr Ile705 710 715 720Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu Gln Gly
725 730 735Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Pro Ile Asp Glu
740 745 750Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr Ile Glu
755 760 765Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala Lys His
770 775 780Glu Thr Val Asn Val Pro Gly Thr Gly Ser Leu Trp Pro Leu Ser Ala785 790 795 800Pro Ser Pro Ile Gly Lys Cys Gly Glu Pro Asn Arg Cys Ala Pro His
805 810 815Leu Glu Trp Asn Pro Asp Leu Asp Cys Ser Cys Arg Asp Gly Glu Lys
820 825 830Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val Gly Cys
835 840 845Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Val Ile Phe Lys Ile Lys
850 855 860Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu Glu Glu865 870 875 880Lys Pro Leu Val Gly Glu Ala Leu Ala Arg Val Lys Arg Ala Glu Lys
885 890 895Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn Ile Val
900 905 910Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn Ser Gln
915 920 925Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His Ala Ala
930 935 940Asp Lys Arg Val His Ser Ile Arg Glu Ala Tyr Leu Pro Glu Leu Ser945 950 955 960Val Ile Pro Gly Val Asn Ala Ala Ile Phe Glu Glu Leu Glu Gly Arg
965 970 975Ile Phe Thr Ala Phe Ser Leu Tyr Asp Ala Arg Asn Val Ile Lys Asn
980 985 990Gly Asp Phe Asn Asn Gly Leu Ser Cys Trp Asn Val Lys Gly His Val
995 1000 1005Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Val Pro Glu 1010 1015 1020Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly Arg Gly1025 1030 1035 1040Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly Glu Gly Cys
1045 1050 1055Val Thr Ile His Glu Ile Glu Asn Asn Thr Asp Glu Leu Lys Phe Ser
1060 1065 1070Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn Thr Val Thr Cys Asn
1075 1080 1085Asp Tyr Thr Ala Thr Gln Glu Glu Tyr Glu Gly Thr Tyr Thr Ser Arg 1090 1095 1100Asn Arg Gly Tyr Asp Gly Ala Tyr Glu Ser Asn Ser Ser Val Pro Ala1105 1110 1115 1120Asp Tyr Ala Ser Ala Tyr Glu Glu Lys Ala Tyr Thr Asp Gly Arg Arg
1125 1130 1135Asp Asn Pro Cys Glu Ser Asn Arg Gly Tyr Gly Asp Tyr Thr Pro Leu
1140 1145 1150Pro Ala Gly Tyr Val Thr Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp
1155 1160 1165Lys Val Trp Ile Glu Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp 1170 1175 1180Ser Val Glu Leu Leu Leu Met Glu Glu1185 1190<210>9<211>2007<212>DNA<213>人工序列<220><223>人工序列说明:编码H04加cry1Ab尾头40个氨基酸的合成基因<220><221>CDS<222>(1)..(2007)<223>带截短的cry1Ab尾的H04<400>9atg gac aac aac ccc aac atc aac gag tgc atc ccc tac aac tgc ctg 48Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15agc aac ccc gag gtg gag gtg ctg ggc ggc gag cgc atc gag acc ggc 96Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30tac acc ccc atc gac atc agc ctg agc ctg acc cag ttc ctg ctg agc 144Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45gag ttc gtg ccc ggc gcc ggc ttc gtg ctg ggc ctg gtg gac atc atc 192Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60tgg ggc atc ttc ggc ccc agc cag tgg gac gcc ttc ctg gtg cag atc 240Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80gag cag ttg ata aac caa cgc ata gag gaa ttc gcc cgc aac cag gcc 288Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95atc agc cgc ctg gag ggc ctg agc aac ctg tac caa atc tac gcc gag 336Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110agc ttc cgc gag tgg gag gcc gac ccc acc aac ccc gcc ctg cgc gag 384Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125gag atg cgc atc cag ttc aac gac atg aac agc gcc ctg acc acc gcc 432Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140atc ccc ctg ttc gcc gtg cag aac tac cag gtg ccc ctg ctg agc gtg 480Ile Pro Leu Phe Ala Val Gln Asn TyrGln Val Pro Leu Leu Ser Val145 150 155 160tac gtg cag gcc gcc aac ctg cac ctg agc gtg ctg cgc gac gtc agc 528Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175gtg ttc ggc cag cgc tgg ggc ttc gac gcc gcc acc atc aac agc cgc 576Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190tac aac gac ctg acc cgc ctg atc ggc aac tac acc gac cac gcc gtg 624Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val
195 200 205cgc tgg tac aac acc ggc ctg gag cgc gtg tgg ggt ccc gac agc cgc 672Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220gac tgg atc agg tac aac cag ttc cgc cgc gag ctg acc ctg acc gtg 720Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225 230 235 240ctg gac atc gtg agc ctg ttc ccc aac tac gac agc cgc acc tac ccc 768Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro
245 250 255atc cgc acc gtg agc cag ctg acc cgc gag att tac acc aac ccc gtg 816Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270ctg gag aac ttc gac ggc agc ttc cgc ggc agc gcc cag ggc atc gag 864Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
275 280 285ggc agc atc cgc agc ccc cac ctg atg gac atc ctg aac agc atc acc 912Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300atc tac acc gac gcc cac cgc ggc gag tac tac tgg agc ggc cac cag 960Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305 310 315 320atc atg gcc agc ccc gtc ggc ttc agc ggc ccc gag ttc acc ttc ccc 1008Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
325 330 335ctg tac ggc acc atg ggc aac gct gca cct cag cag cgc atc gtg gca 1056Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
340 345 350cag ctg ggc cag gga gtg tac cgc acc ctg agc agc acc ctg tac cgt 1104Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
355 360 365cga cct ttc aac atc ggc atc aac aac cag cag ctg agc gtg ctg gac 1152Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370 375 380ggc acc gag ttc gcc tac ggc acc agc agc aac ctg ccc agc gcc gtg 1200Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385 390 395 400tac cgc aag agc ggc acc gtg gac agc ctg gac gag atc ccc cct cag 1248Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
405 410 415aac aac aac gtg cca cct cga cag ggc ttc agc cac cgt ctg agc cac 1296Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
420 425 430gtg agc atg ttc cgc agt ggc ttc agc aac agc agc gtg agc atc atc 1344Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
435 440 445cgt gca ccc atg ttc agc tgg att cac cgc agc gcc acc ctg acc aac 1392Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn
450 455 460acc atc gac ccc gag cgc atc aac cag atc ccc ctg gtg aag ggc ttc 1440Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465 470 475 480cgg gtg tgg ggc ggc acc agc gtg atc acc ggc ccc ggc ttc acc gga 1488Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
485 490 495ggc gac atc ctg cgc aga aac acc ttc ggc gac ttc gtg agc ctg cag 1536Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
500 505 510gtg aac atc aac agc ccc atc acc cag cgt tac cgc ctg cgc ttc cgc 1584Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
515 520 525tac gcc agc agc cgc gac gcc cgt gtg atc gtg ctg act ggc gcc gct 1632Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
530 535 540agc acc ggt gtg ggc ggt cag gtg agc gtg aac atg ccc ctg cag aag 1680Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545 550 555 560act atg gag atc ggc gag aac ctg act agt cgc acc ttc cgc tac acc 1728Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
565 570 575gac ttc agc aac ccc ttc agc ttc cgc gcc aac ccc gac atc atc ggc 1776Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
580 585 590atc agc gag cag ccc ctg ttc ggt gcc ggc agc atc agc agc ggc gag 1824Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
595 600 605ctg tac atc gac aag atc gag atc atc ctg gcc gac gcc acc ttc gag 1872Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
610 615 620gcc gag agc gac ctg gag cgc gcc cag aag gcc gtg aac gcc ctg ttc 1920Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625 630 635 640acc agc agc aac cag atc ggc ctg aag acc gac gtg acc gac tac cac 1968Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His
645 650 655atc gac cag gtg agc aac ctg gtg gac tgc tta agc tag 2007Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser
660 665<210>10<211>668<212>PRT<213>人工序列<223>人工序列说明:编码H04加cry1Ab尾头40个氨基酸的合成基因<400>10Met Asp Asn Asn Pro Asn Ile Asn Glu Cys Ile Pro Tyr Asn Cys Leu 1 5 10 15Ser Asn Pro Glu Val Glu Val Leu Gly Gly Glu Arg Ile Glu Thr Gly
20 25 30Tyr Thr Pro Ile Asp Ile Ser Leu Ser Leu Thr Gln Phe Leu Leu Ser
35 40 45Glu Phe Val Pro Gly Ala Gly Phe Val Leu Gly Leu Val Asp Ile Ile
50 55 60Trp Gly Ile Phe Gly Pro Ser Gln Trp Asp Ala Phe Leu Val Gln Ile 65 70 75 80Glu Gln Leu Ile Asn Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala
85 90 95Ile Ser Arg Leu Glu Gly Leu Ser Asn Leu Tyr Gln Ile Tyr Ala Glu
100 105 110Ser Phe Arg Glu Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu
115 120 125Glu Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Leu Thr Thr Ala
130 135 140Ile Pro Leu Phe Ala Val Gln Asn Tyr Gln Val Pro Leu Leu Ser Val145 150 155 160Tyr Val Gln Ala Ala Asn Leu His Leu Ser Val Leu Arg Asp Val Ser
165 170 175Val Phe Gly Gln Arg Trp Gly Phe Asp Ala Ala Thr Ile Asn Ser Arg
180 185 190Tyr Asn Asp Leu Thr Arg Leu Ile Gly Asn Tyr Thr Asp His Ala Val
195 200 205Arg Trp Tyr Asn Thr Gly Leu Glu Arg Val Trp Gly Pro Asp Ser Arg
210 215 220Asp Trp Ile Arg Tyr Asn Gln Phe Arg Arg Glu Leu Thr Leu Thr Val225 230 235 240Leu Asp Ile Val Ser Leu Phe Pro Asn Tyr Asp Ser Arg Thr Tyr Pro
245 250 255Ile Arg Thr Val Ser Gln Leu Thr Arg Glu Ile Tyr Thr Asn Pro Val
260 265 270Leu Glu Asn Phe Asp Gly Ser Phe Arg Gly Ser Ala Gln Gly Ile Glu
275 280 285Gly Ser Ile Arg Ser Pro His Leu Met Asp Ile Leu Asn Ser Ile Thr
290 295 300Ile Tyr Thr Asp Ala His Arg Gly Glu Tyr Tyr Trp Ser Gly His Gln305 310 315 320Ile Met Ala Ser Pro Val Gly Phe Ser Gly Pro Glu Phe Thr Phe Pro
325 330 335Leu Tyr Gly Thr Met Gly Asn Ala Ala Pro Gln Gln Arg Ile Val Ala
340 345 350Gln Leu Gly Gln Gly Val Tyr Arg Thr Leu Ser Ser Thr Leu Tyr Arg
355 360 365Arg Pro Phe Asn Ile Gly Ile Asn Asn Gln Gln Leu Ser Val Leu Asp
370 375 380Gly Thr Glu Phe Ala Tyr Gly Thr Ser Ser Asn Leu Pro Ser Ala Val385 390 395 400Tyr Arg Lys Ser Gly Thr Val Asp Ser Leu Asp Glu Ile Pro Pro Gln
405 410 415Asn Asn Asn Val Pro Pro Arg Gln Gly Phe Ser His Arg Leu Ser His
420 425 430Val Ser Met Phe Arg Ser Gly Phe Ser Asn Ser Ser Val Ser Ile Ile
435 440 445Arg Ala Pro Met Phe Ser Trp Ile His Arg Ser Ala Thr Leu Thr Asn
450 455 460Thr Ile Asp Pro Glu Arg Ile Asn Gln Ile Pro Leu Val Lys Gly Phe465 470 475 480Arg Val Trp Gly Gly Thr Ser Val Ile Thr Gly Pro Gly Phe Thr Gly
485 490 495Gly Asp Ile Leu Arg Arg Asn Thr Phe Gly Asp Phe Val Ser Leu Gln
500 505 510Val Asn Ile Asn Ser Pro Ile Thr Gln Arg Tyr Arg Leu Arg Phe Arg
515 520 525Tyr Ala Ser Ser Arg Asp Ala Arg Val Ile Val Leu Thr Gly Ala Ala
530 535 540Ser Thr Gly Val Gly Gly Gln Val Ser Val Asn Met Pro Leu Gln Lys545 550 555 560Thr Met Glu Ile Gly Glu Asn Leu Thr Ser Arg Thr Phe Arg Tyr Thr
565 570 575Asp Phe Ser Asn Pro Phe Ser Phe Arg Ala Asn Pro Asp Ile Ile Gly
580 585 590Ile Ser Glu Gln Pro Leu Phe Gly Ala Gly Ser Ile Ser Ser Gly Glu
595 600 605Leu Tyr Ile Asp Lys Ile Glu Ile Ile Leu Ala Asp Ala Thr Phe Glu
610 615 620Ala Glu Ser Asp Leu Glu Arg Ala Gln Lys Ala Val Asn Ala Leu Phe625 630 635 640Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp Tyr His
645 650 655Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser
660 665<210>11<211>13269<212>DNA<213>人工序列<220><223>人工序列说明:pNOV1308<220><221>misc_feature<222>(1)..(1896)<223>编码不带尾的H04毒素部分的合成核苷酸序列<220><221>misc_feature<222>(2102)..(4083)<223>玉米遍在蛋白启动子<220><221>misc_feature<222>(4180)..(5283)<223>PMI标记基因<220><221>misc_feature<222>(11247)..(12647)<223>Zm Ubi启动子<400>11atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg 120agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg 180gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc 240gagcagttga taaaccaacg catagaggaa ttcgcccgca accaggccat cagccgcctg 300gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac 360cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc 420ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg 480tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag 540cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc 600ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt 660cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg 720ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg 780agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc 840cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg 900aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag 960atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc 1020atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc 1080accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg 1140agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg 1200taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg 1260ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc 1320agcaacagca gcgtgagcat catccgtgca cccatgttca gctggattca ccgcagcgcc 1380accctgacca acaccatcga ccccgagcgc atcaaccaga tccccctggt gaagggcttc 1440cgggtgtggg gcggcaccag cgtgatcacc ggccccggct tcaccggagg cgacatcctg 1500cgcagaaaca ccttcggcga cttcgtgagc ctgcaggtga acatcaacag ccccatcacc 1560cagcgttacc gcctgcgctt ccgctacgcc agcagccgcg acgcccgtgt gatcgtgctg 1620actggcgccg ctagcaccgg tgtgggcggt caggtgagcg tgaacatgcc cctgcagaag 1680actatggaga tcggcgagaa cctgactagt cgcaccttcc gctacaccga cttcagcaac 1740cccttcagct tccgcgccaa ccccgacatc atcggcatca gcgagcagcc cctgttcggt 1800gccggcagca tcagcagcgg cgagctgtac atcgacaaga tcgagatcat cctggccgac 1860gccaccttcg aggccgagag cgacctggag cgctaagatc tgttctgcac aaagtggagt 1920agtcagtcat cgatcaggaa ccagacacca gacttttatt catacagtga agtgaagtga 1980agtgcagtgc agtgagttgc tggtttttgt acaacttagt atgtatttgt atttgtaaaa 2040tacttctatc aataaaattt ctaattccta aaaccaaaat ccaggggtac cagcttgcat 2100gcctgcagtg cagcgtgacc cggtcgtgcc cctctctaga gataatgagc attgcatgtc 2160taagttataa aaaattacca catatttttt ttgtcacact tgtttgaagt gcagtttatc 2220tatctttata catatattta aactttactc tacgaataat ataatctata gtactacaat 2280aatatcagtg ttttagagaa tcatataaat gaacagttag acatggtcta aaggacaatt 2340gagtattttg acaacaggac tctacagttt tatcttttta gtgtgcatgt gttctccttt 2400ttttttgcaa atagcttcac ctatataata cttcatccat tttattagta catccattta 2460gggtttaggg ttaatggttt ttatagacta atttttttag tacatctatt ttattctatt 2520ttagcctcta aattaagaaa actaaaactc tattttagtt tttttattta ataatttaga 2580tataaaatag aataaaataa agtgactaaa aattaaacaa atacccttta agaaattaaa 2640aaaactaagg aaacattttt cttgtttcga gtagataatg ccagcctgtt aaacgccgtc 2700gacgagtcta acggacacca accagcgaac cagcagcgtc gcgtcgggcc aagcgaagca 2760gacggcacgg catctctgtc gctgcctctg gacccctctc gagagttccg ctccaccgtt 2820ggacttgctc cgctgtcggc atccagaaat tgcgtggcgg agcggcagac gtgagccggc 2880acggcaggcg gcctcctcct cctctcacgg caccggcagc tacgggggat tcctttccca 2940ccgctccttc gctttccctt cctcgcccgc cgtaataaat agacaccccc tccacaccct 3000ctttccccaa cctcgtgttg ttcggagcgc acacacacac aaccagatct cccccaaatc 3060cacccgtcgg cacctccgct tcaaggtacg ccgctcgtcc tccccccccc cccctctcta 3120ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac ttctgttcat 3180gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta cacggatgcg 3240acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt ggggaatcct 3300gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt gtttcgttgc 3360atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt gtttgtcggg 3420tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt gggcggtcgt 3480tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat tttggatctg 3540tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg aaatatcgat 3600ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag atgctttttg 3660ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc tagatcggag 3720tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta tgtgtgtgtc 3780atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg ataggtatac 3840atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat ctattcatat 3900gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa ttattttgat 3960cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt tagccctgcc 4020ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc ctgttgtttg 4080gtgttacttc tgcagggatc cccgatcatg caaaaactca ttaactcagt gcaaaactat 4140gcctggggca gcaaaacggc gttgactgaa ctttatggta tggaaaatcc gtccagccag 4200ccgatggccg agctgtggat gggcgcacat ccgaaaagca gttcacgagt gcagaatgcc 4260gccggagata tcgtttcact gcgtgatgtg attgagagtg ataaatcgac tctgctcgga 4320gaggccgttg ccaaacgctt tggcgaactg cctttcctgt tcaaagtatt atgcgcagca 4380cagccactct ccattcaggt tcatccaaac aaacacaatt ctgaaatcgg ttttgccaaa 4440gaaaatgccg caggtatccc gatggatgcc gccgagcgta actataaaga tcctaaccac 4500aagccggagc tggtttttgc gctgacgcct ttccttgcga tgaacgcgtt tcgtgaattt 4560tccgagattg tctccctact ccagccggtc gcaggtgcac atccggcgat tgctcacttt 4620ttacaacagc ctgatgccga acgtttaagc gaactgttcg ccagcctgtt gaatatgcag 4680ggtgaagaaa aatcccgcgc gctggcgatt ttaaaatcgg ccctcgatag ccagcagggt 4740gaaccgtggc aaacgattcg tttaatttct gaattttacc cggaagacag cggtctgttc 4800tccccgctat tgctgaatgt ggtgaaattg aaccctggcg aagcgatgtt cctgttcgct 4860gaaacaccgc acgcttacct gcaaggcgtg gcgctggaag tgatggcaaa ctccgataac 4920gtgctgcgtg cgggtctgac gcctaaatac attgatattc cggaactggt tgccaatgtg 4980aaattcgaag ccaaaccggc taaccagttg ttgacccagc cggtgaaaca aggtgcagaa 5040ctggacttcc cgattccagt ggatgatttt gccttctcgc tgcatgacct tagtgataaa 5100gaaaccacca ttagccagca gagtgccgcc attttgttct gcgtcgaagg cgatgcaacg 5160ttgtggaaag gttctcagca gttacagctt aaaccgggtg aatcagcgtt tattgccgcc 5220aacgaatcac cggtgactgt caaaggccac ggccgtttag cgcgtgttta caacaagctg 5280taagagctta ctgaaaaaat taacatctct tgctaagctg ggagctcgat ccgtcgacct 5340gcagatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt 5400gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa 5460tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa 5520tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca 5580tctatgttac tagatctgct agccctgcag gaaatttacc ggtgcccggg cggccagcat 5640ggccgtatcc gcaatgtgtt attaagttgt ctaagcgtca atttgtttac accacaatat 5700atcctgccac cagccagcca acagctcccc gaccggcagc tcggcacaaa atcaccactc 5760gatacaggca gcccatcaga attaattctc atgtttgaca gcttatcatc gactgcacgg 5820tgcaccaatg cttctggcgt caggcagcca tcggaagctg tggtatggct gtgcaggtcg 5880taaatcactg cataattcgt gtcgctcaag gcgcactccc gttctggata atgttttttg 5940cgccgacatc ataacggttc tggcaaatat tctgaaatga gctgttgaca attaatcatc 6000cggctcgtat aatgtgtgga attgtgagcg gataacaatt tcacacagga aacagaccat 6060gagggaagcg ttgatcgccg aagtatcgac tcaactatca gaggtagttg gcgtcatcga 6120gcgccatctc gaaccgacgt tgctggccgt acatttgtac ggctccgcag tggatggcgg 6180cctgaagcca cacagtgata ttgatttgct ggttacggtg accgtaaggc ttgatgaaac 6240aacgcggcga gctttgatca acgacctttt ggaaacttcg gcttcccctg gagagagcga 6300gattctccgc gctgtagaag tcaccattgt tgtgcacgac gacatcattc cgtggcgtta 6360tccagctaag cgcgaactgc aatttggaga atggcagcgc aatgacattc ttgcaggtat 6420cttcgagcca gccacgatcg acattgatct ggctatcttg ctgacaaaag caagagaaca 6480tagcgttgcc ttggtaggtc cagcggcgga ggaactcttt gatccggttc ctgaacagga 6540tctatttgag gcgctaaatg aaaccttaac gctatggaac tcgccgcccg actgggctgg 6600cgatgagcga aatgtagtgc ttacgttgtc ccgcatttgg tacagcgcag taaccggcaa 6660aatcgcgccg aaggatgtcg ctgccgactg ggcaatggag cgcctgccgg cccagtatca 6720gcccgtcata cttgaagcta ggcaggctta tcttggacaa gaagatcgct tggcctcgcg 6780cgcagatcag ttggaagaat ttgttcacta cgtgaaaggc gagatcacca aagtagtcgg 6840caaataaagc tctagtggat ctccgtaccc ccgggggatc tggctcgcgg cggacgcacg 6900acgccggggc gagaccatag gcgatctcct aaatcaatag tagctgtaac ctcgaagcgt 6960ttcacttgta acaacgattg agaatttttg tcataaaatt gaaatacttg gttcgcattt 7020ttgtcatccg cggtcagccg caattctgac gaactgccca tttagctgga gatgattgta 7080catccttcac gtgaaaattt ctcaagcgct gtgaacaagg gttcagattt tagattgaaa 7140ggtgagccgt tgaaacacgt tcttcttgtc gatgacgacg tcgctatgcg gcatcttatt 7200attgaatacc ttacgatcca cgccttcaaa gtgaccgcgg tagccgacag cacccagttc 7260acaagagtac tctcttccgc gacggtcgat gtcgtggttg ttgatctaaa tttaggtcgt 7320gaagatgggc tcgagatcgt tcgtaatctg gcggcaaagt ctgatattcc aatcataatt 7380atcagtggcg accgccttga ggagacggat aaagttgttg cactcgagct aggagcaagt 7440gattttatcg ctaagccgtt cagtatcaga gagtttctag cacgcattcg ggttgccttg 7500cgcgtgcgcc ccaacgttgt ccgctccaaa gaccgacggt ctttttgttt tactgactgg 7560acacttaatc tcaggcaacg tcgcttgatg tccgaagctg gcggtgaggt gaaacttacg 7620gcaggtgagt tcaatcttct cctcgcgttt ttagagaaac cccgcgacgt tctatcgcgc 7680gagcaacttc tcattgccag tcgagtacgc gacgaggagg tttatgacag gagtatagat 7740gttctcattt tgaggctgcg ccgcaaactt gaggcagatc cgtcaagccc tcaactgata 7800aaaacagcaa gaggtgccgg ttatttcttt gacgcggacg tgcaggtttc gcacgggggg 7860acgatggcag cctgagccaa ttcccagatc cccgaggaat cggcgtgagc ggtcgcaaac 7920catccggccc ggtacaaatc ggcgcggcgc tgggtgatga cctggtggag aagttgaagg 7980ccgcgcaggc cgcccagcgg caacgcatcg aggcagaagc acgccccggt gaatcgtggc 8040aagcggccgc tgatcgaatc cgcaaagaat cccggcaacc gccggcagcc ggtgcgccgt 8100cgattaggaa gccgcccaag ggcgacgagc aaccagattt tttcgttccg atgctctatg 8160acgtgggcac ccgcgatagt cgcagcatca tggacgtggc cgttttccgt ctgtcgaagc 8220gtgaccgacg agctggcgag gtgatccgct acgagcttcc agacgggcac gtagaggttt 8280ccgcagggcc ggccggcatg gccagtgtgt gggattacga cctggtactg atggcggttt 8340cccatctaac cgaatccatg aaccgatacc gggaagggaa gggagacaag cccggccgcg 8400tgttccgtcc acacgttgcg gacgtactca agttctgccg gcgagccgat ggcggaaagc 8460agaaagacga cctggtagaa acctgcattc ggttaaacac cacgcacgtt gccatgcagc 8520gtacgaagaa ggccaagaac ggccgcctgg tgacggtatc cgagggtgaa gccttgatta 8580gccgctacaa gatcgtaaag agcgaaaccg ggcggccgga gtacatcgag atcgagctag 8640ctgattggat gtaccgcgag atcacagaag gcaagaaccc ggacgtgctg acggttcacc 8700ccgattactt tttgatcgat cccggcatcg gccgttttct ctaccgcctg gcacgccgcg 8760ccgcaggcaa ggcagaagcc agatggttgt tcaagacgat ctacgaacgc agtggcagcg 8820ccggagagtt caagaagttc tgtttcaccg tgcgcaagct gatcgggtca aatgacctgc 8880cggagtacga tttgaaggag gaggcggggc aggctggccc gatcctagtc atgcgctacc 8940gcaacctgat cgagggcgaa gcatccgccg gttcctaatg tacggagcag atgctagggc 9000aaattgccct agcaggggaa aaaggtcgaa aaggtctctt tcctgtggat agcacgtaca 9060ttgggaaccc aaagccgtac attgggaacc ggaacccgta cattgggaac ccaaagccgt 9120acattgggaa ccggtcacac atgtaagtga ctgatataaa agagaaaaaa ggcgattttt 9180ccgcctaaaa ctctttaaaa cttattaaaa ctcttaaaac ccgcctggcc tgtgcataac 9240tgtctggcca gcgcacagcc gaagagctgc aaaaagcgcc tacccttcgg tcgctgcgct 9300ccctacgccc cgccgcttcg cgtcggccta tcgcggccgc tggccgctca aaaatggctg 9360gcctacggcc aggcaatcta ccagggcgcg gacaagccgc gccgtcgcca ctcgaccgcc 9420ggcgctgagg tctgcctcgt gaagaaggtg ttgctgactc ataccaggcc tgaatcgccc 9480catcatccag ccagaaagtg agggagccac ggttgatgag agctttgttg taggtggacc 9540agttggtgat tttgaacttt tgctttgcca cggaacggtc tgcgttgtcg ggaagatgcg 9600tgatctgatc cttcaactca gcaaaagttc gatttattca acaaagccgc cgtcccgtca 9660agtcagcgta atgctctgcc agtgttacaa ccaattaacc aattctgatt agaaaaactc 9720atcgagcatc aaatgaaact gcaatttatt catatcagga ttatcaatac catatttttg 9780aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg cagttccata ggatggcaag 9840atcctggtat cggtctgcga ttccgactcg tccaacatca atacaaccta ttaatttccc 9900ctcgtcaaaa ataaggttat caagtgagaa atcaccatga gtgacgactg aatccggtga 9960gaatggcaaa agctctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 10020ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 10080gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 10140caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 10200tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 10260gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 10320ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 10380cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 10440tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 10500tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 10560cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 10620agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga 10680agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 10740gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 10800aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 10860ggattttggt catgagatta tcaaaaagga tcttcaccta gatccttttg atccggaatt 10920aattcctgtg gttggcatgc acatacaaat ggacgaacgg ataaaccttt tcacgccctt 10980ttaaatatcc gattattcta ataaacgctc ttttctctta ggtttacccg ccaatatatc 11040ctgtcaaaca ctgatagttt aaactgaagg cgggaaacga caatctgatc atgagcggag 11100aattaaggga gtcacgttat gacccccgcc gatgacgcgg gacaagccgt tttacgtttg 11160gaactgacag aaccgcaacg ctgcaggaat tggccgcagc ggccatttaa atcaattggg 11220cgcgccgaat tcgagctcgg tacaagcttg catgcctgca gtgcagcgtg acccggtcgt 11280gcccctctct agagataatg agcattgcat gtctaagtta taaaaaatta ccacatattt 11340tttttgtcac acttgtttga agtgcagttt atctatcttt atacatatat ttaaacttta 11400ctctacgaat aatataatct atagtactac aataatatca gtgttttaga gaatcatata 11460aatgaacagt tagacatggt ctaaaggaca attgagtatt ttgacaacag gactctacag 11520ttttatcttt ttagtgtgca tgtgttctcc tttttttttg caaatagctt cacctatata 11580atacttcatc cattttatta gtacatccat ttagggttta gggttaatgg tttttataga 11640ctaatttttt tagtacatct attttattct attttagcct ctaaattaag aaaactaaaa 11700ctctatttta gtttttttat ttaataattt agatataaaa tagaataaaa taaagtgact 11760aaaaattaaa caaataccct ttaagaaatt aaaaaaacta aggaaacatt tttcttgttt 11820cgagtagata atgccagcct gttaaacgcc gtcgacgagt ctaacggaca ccaaccagcg 11880aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca cggcatctct gtcgctgcct 11940ctggacccct ctcgagagtt ccgctccacc gttggacttg ctccgctgtc ggcatccaga 12000aattgcgtgg cggagcggca gacgtgagcc ggcacggcag gcggcctcct cctcctctca 12060cggcacggca gctacggggg attcctttcc caccgctcct tcgctttccc ttcctcgccc 12120gccgtaataa atagacaccc cctccacacc ctctttcccc aacctcgtgt tgttcggagc 12180gcacacacac acaaccagat ctcccccaaa tccacccgtc ggcacctccg cttcaaggta 12240cgccgctcgt cctccccccc cccccctctc taccttctct agatcggcgt tccggtccat 12300ggttagggcc cggtagttct acttctgttc atgtttgtgt tagatccgtg tttgtgttag 12360atccgtgctg ctagcgttcg tacacggatg cgacctgtac gtcagacacg ttctgattgc 12420taacttgcca gtgtttctct ttggggaatc ctgggatggc tctagccgtt ccgcagacgg 12480gatcgatttc atgatttttt ttgtttcgtt gcatagggtt tggtttgccc ttttccttta 12540tttcaatata tgccgtgcac ttgtttgtcg ggtcatcttt tcatgctttt ttttgtcttg 12600gttgtgatga tgtggtctgg ttgggcggtc gttctagatc ggagtagaat tctgtttcaa 12660actacctggt ggatttatta attttggatc tgtatgtgtg tgccatacat attcatagtt 12720acgaattgaa gatgatggat ggaaatatcg atctaggata ggtatacatg ttgatgcggg 12780ttttactgat gcatatacag agatgctttt tgttcgcttg gttgtgatga tgtggtgtgg 12840ttgggcggtc gttcattcgt tctagatcgg agtagaatac tgtttcaaac tacctggtgt 12900atttattaat tttggaactg tatgtgtgtg tcatacatct tcatagttac gagtttaaga 12960tggatggaaa tatcgatcta ggataggtat acatgttgat gtgggtttta ctgatgcata 13020tacatgatgg catatgcagc atctattcat atgctctaac cttgagtacc tatctattat 13080aataaacaag tatgttttat aattattttg atcttgatat acttggatga tggcatatgc 13140agcagctata tgtggatttt tttagccctg ccttcatacg ctatttattt gcttggtact 13200gtttcttttg tcgatgctca ccctgttgtt tggtgttact tctgcaggtc gactctagag 13260gatccaaca 13269<210>12<211>16179<212>DNA<213>人工序列<220><223>人工序列说明:pNOV1436<220><221>misc_feature<222>(1)..(3582)<223>编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列<220><221>misc_feature<222>Complement((10390)..(11598))<223>磷酸甘露糖异构酶(PMI)标记基因<220><221>misc_feature<222>Complement((12718)..(13608))<223>玉米泛在蛋白(Zm Ubi)启动子<220><221>misc_feature<222>(13613)..(16170)<223>MTL启动子<400>12atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg 120agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg 180gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc 240gagcagttga taaaccaacg catagaggaa ttcgcccgca accaggccat cagccgcctg 300gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac 360cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc 420ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg 480tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag 540cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc 600ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt 660cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg 720ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg 780agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc 840cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg 900aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag 960atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc 1020atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc 1080accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg 1140agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg 1200taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg 1260ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc 1320agcaacagca gcgtgagcat catccgtgca cccatgttca gctggattca ccgcagcgcc 1380accctgacca acaccatcga ccccgagcgc atcaaccaga tccccctggt gaagggcttc 1440cgggtgtggg gcggcaccag cgtgatcacc ggccccggct tcaccggagg cgacatcctg 1500cgcagaaaca ccttcggcga cttcgtgagc ctgcaggtga acatcaacag ccccatcacc 1560cagcgttacc gcctgcgctt ccgctacgcc agcagccgcg acgcccgtgt gatcgtgctg 1620actggcgccg ctagcaccgg tgtgggcggt caggtgagcg tgaacatgcc cctgcagaag 1680actatggaga tcggcgagaa cctgactagt cgcaccttcc gctacaccga cttcagcaac 1740cccttcagct tccgcgccaa ccccgacatc atcggcatca gcgagcagcc cctgttcggt 1800gccggcagca tcagcagcgg cgagctgtac atcgacaaga tcgagatcat cctggccgac 1860gccaccttcg aggccgagag cgacctggag cgcgcccaga aggccgtgaa cgccctgttc 1920accagcagca accagatcgg cctgaagacc gacgtgaccg actaccacat cgaccaggtg 1980agcaacctgg tggactgctt aagcgacgag ttctgcctgg acgagaagaa ggagctgagc 2040gagaaggtga agcacgccaa gcgcctgagc gacgagcgca acctgctgca ggaccccaac 2100ttccgcggca tcaaccgcca gctggaccgc ggctggcgag gcagcaccga tatcaccatc 2160cagggcggcg acgacgtgtt caaggagaac tacgtgaccc tgcagggcac cttcgacgag 2220tgctacccca cctacctgta ccagccgatc gacgagagca agctgaaggc ctacacccgc 2280taccagctgc gcggctacat cgaggacagc caggacctgg aaatctacct gatccgctac 2340aacgcgaagc acgagaccgt gaacgtgccc ggcaccggca gcctgtggcc cccgagcgcc 2400cccagcccca tcggcaagtg cggggagccg aatcgatgcg ctccgcacct ggagtggaac 2460ccggacctag actgcagctg cagggacggg gagaagtgcg cccaccacag ccaccacttc 2520agcctggaca tcgacgtggg ctgcaccgac ctgaacgagg acctgggcgt gtgggtgatc 2580ttcaagatca agacccagga cggccacgcc cgcctgggca atctagagtt cctggaggag 2640aagcccctgg tgggcgaggc cctggcccgc gtgaagcgtg ctgagaagaa gtggcgcgac 2700aagcgcgaga agctggagtg ggagaccaac atcgtgtaca aggaggccaa ggagagcgtg 2760gacgccctgt tcgtgaacag ccagtacgac cgcctgcagg ccgacaccaa catcgccatg 2820atccacgccg ccgacaagcg cgtgcacagc attcgcgagg cctacctgcc cgagctgagc 2880gtgatccccg gtgtgaacgc cgccatcttc gaggaactcg agggccgcat cttcaccgcc 2940ttcagcctgt acgacgcccg caacgtgatc aagaacggcg acttcaacaa cggcctgagc 3000tgctggaacg tgaagggcca cgtggacgtg gaggagcaga acaaccaccg cagcgtgctg 3060gtggtgcccg agtgggaggc cgaggtgagc caggaggtgc gcgtgtgccc cggccgcggc 3120tacatcctgc gcgtgaccgc ctacaaggag ggctacggcg agggctgcgt gaccatccac 3180gagatcgaga acaacaccga cgagctcaag ttcagcaact gcgtggagga ggaggtttac 3240cccaacaaca ccgtgacctg caacgactac accgcgaccc aggaggagta cgaaggcacc 3300tacacctctc gcaacagggg ttacgacggc gcctacgagt ccaacagctc cgtgccagct 3360gactacgcca gcgcccacga ggagaaagcc tacaccgacg gtagacgcga caacccatgt 3420gagagcaaca gaggctacgg cgactacacc cccctgcccg ctggatacgt gaccaaggag 3480ctggagtact tccccgagac cgacaaggtg tggatcgaga ttggcgagac cgagggcacc 3540ttcatcgtgg acagcgtgga gctgctgctg atggaggagt agtagatctg ttctgcacaa 3600agtggagtag tcagtcatcg atcaggaacc agacaccaga cttttattca tacagtgaag 3660tgaagtgaag tgcagtgcag tgagttgctg gtttttgtac cacttagtat gtatttgtat 3720ttgtaaaata cttctatcaa taaaatttct aattcctaaa accaaaatcc agtgggtacc 3780agcttgggct gagtggctcc ttcaacgttg cggttctgtc agttccaaac gtaaaacggc 3840ttgtcccgcg tcatcggcgg gggtcataac gtgactccct taattctccg ctcatgatca 3900gattgtcgtt tcccgccttc agtttaaact atcagtgttt gacaggatat attggcgggt 3960aaacctaaga gaaaagagcg tttattagaa taacggatat ttaaaagggc gtgaaaaggt 4020ttatccgttc gtccatttgt atgtgcatgc caaccacagg gttcccctcg ggagtgcttg 4080gcattccgta cgataatgac ttctgttcaa ccacccaaac gtcggaaagc ctgacgacgg 4140agcagcattc caaaaagatc ccttggctcg tctgggtcgg ctagaaggtc gagtgggctg 4200ctgtggcttg atccctcaac gcggtcgcgg acgtagcgca gcgccgaaaa atcctcgatc 4260gcaaatccga cgctgtcgaa aagcgtgatc tgcttgtcgc tctttcggcc gacgtcctgg 4320ccagtcatca cgcgccaaag ttccgtcaca ggatgatctg gcgcgagttg ctggatctcg 4380ccttcaatcc gggtctgtgg cgggaactcc acgaaaatat ccgaacgcag caagatcgtc 4440gaccaattct tgaagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat 4500gataataatg gtttcttaga cgtcaggtgg cacttttcgg ggaaatgtgc gcggaacccc 4560tatttgttta tttttctaaa tacattcaaa tatgtatccg ctcatgagac aataaccctg 4620ataaatgctt caataatatt gaaaaaggaa gagtatgagt attcaacatt tccgtgtcgc 4680ccttattccc ttttttgcgg cattttgcct tcctgttttt gctcacccag aaacgctggt 4740gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg ggttacatcg aactggatct 4800caacagcggt aagatccttg agagttttcg ccccgaagaa cgttttccaa tgatgagcac 4860ttttaaagtt ctgctatgtg gcgcggtatt atcccgtgtt gacgccgggc aagagcaact 4920cggtcgccgc atacactatt ctcagaatga cttggttgag tactcaccag tcacagaaaa 4980gcatcttacg gatggcatga cagtaagaga attatgcagt gctgccataa ccatgagtga 5040taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt 5100tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga 5160agccatacca aacgacgagc gtgacaccac gatgcctgca gggggggggg ggggggggac 5220atgaggttgc cccgtattca gtgtcgctga tttgtattgt ctgaagttgt ttttacgtta 5280agttgatgca gatcaattaa tacgatacct gcgtcataat tgattatttg acgtggtttg 5340atggcctcca cgcacgttgt gatatgtaga tgataatcat tatcacttta cgggtccttt 5400ccggtgatcc gacaggttac ggggcggcga cctcgcgggt tttcgctatt tatgaaaatt 5460ttccggttta aggcgtttcc gttcttcttc gtcataactt aatgttttta tttaaaatac 5520cctctgaaaa gaaaggaaac gacaggtgct gaaagcgagg ctttttggcc tctgtcgttt 5580cctttctctg tttttgtccg tggaatgaac aatggaagtc cccccccccc cccccccctg 5640cagcaatggc aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc 5700ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg 5760cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg 5820gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga 5880cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac 5940tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa 6000aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca 6060aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 6120gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 6180cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 6240ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc 6300accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 6360tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 6420cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 6480gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 6540ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 6600cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 6660tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 6720ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 6780ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 6840ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc 6900gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatggtgca 6960ctctcagtac aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct 7020acgtgactgg gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg 7080ggcttgtctg ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat 7140gtgtcagagg ttttcaccgt catcaccgaa acgcgcgagg cagcagatcc cccgatcaag 7200tagatacact acatatatct acaatagaca tcgagccgga aggtgatgtt tactttcctg 7260aaatccccag caattttagg ccagttttta cccaagactt cgcctctaac ataaattata 7320gttaccaaat ctggcaaaag ggttaacaag tggcagcaac ggattcgcaa acctgtcacg 7380ccttttgtgc caaaagccgc gccaggtttg cgatccgctg tgccaggcgt taggcgtcat 7440atgaagattt cggtgatccc tgagcaggtg gcggaaacat tggatgctga gaaccatttc 7500attgttcgtg aagtgttcga tgtgcaccta tccgaccaag gctttgaact atctaccaga 7560agtgtgagcc cctaccggaa ggattacatc tcggatgatg actctgatga agactctgct 7620tgctatggcg cattcatcga ccaagagctt gtcgggaaga ttgaactcaa ctcaacatgg 7680aacgatctag cctctatcga acacattgtt gtgtcgcaca cgcaccgagg caaaggagtc 7740gcgcacagtc tcatcgaatt tgcgaaaaag tgggcactaa gcagacagct ccttggcata 7800cgattagaga cacaaacgaa caatgtacct gcctgcaatt tgtacgcaaa atgtggcttt 7860actctcggcg gcattgacct gttcacgtat aaaactagac ctcaagtctc gaacgaaaca 7920gcgatgtact ggtactggtt ctcgggagca caggatgacg cctaacaatt cattcaagcc 7980gacaccgctt cgcggcgcgg cttaattcag gagttaaaca tcatgaggga agcggtgatc 8040gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca tctcgaaccg 8100acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa gccacacagt 8160gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg gcgagctttg 8220atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct ccgcgctgta 8280gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc taagcgcgaa 8340ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga gccagccacg 8400atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt tgccttggta 8460ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt tgaggcgcta 8520aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga gcgaaatgta 8580gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc gccgaaggat 8640gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt catacttgaa 8700gctaggcagg cttatcttgg acaagaagat cgcttggcct cgcgcgcaga tcagttggaa 8760gaatttgttc actacgtgaa aggcgagatc accaaggtag tcggcaaata atgtctaaca 8820attcgttcaa gccgacgccg cttcgcggcg cggcttaact caagcgttag agagctgggg 8880aagactatgc gcgatctgtt gaaggtggtt ctaagcctcg tacttgcgat ggcatcgggg 8940caggcacttg ctgacctgcc aattgtttta gtggatgaag ctcgtcttcc ctatgactac 9000tccccatcca actacgacat ttctccaagc aactacgaca actccataag caattacgac 9060aatagtccat caaattacga caactctgag agcaactacg ataatagttc atccaattac 9120gacaatagtc gcaacggaaa tcgtaggctt atatatagcg caaatgggtc tcgcactttc 9180gccggctact acgtcattgc caacaatggg acaacgaact tcttttccac atctggcaaa 9240aggatgttct acaccccaaa aggggggcgc ggcgtctatg gcggcaaaga tgggagcttc 9300tgcggggcat tggtcgtcat aaatggccaa ttttcgcttg ccctgacaga taacggcctg 9360aagatcatgt atctaagcaa ctagcctgct ctctaataaa atgttaggcc tcaacatcta 9420gtcgcaagct gaggggaacc actagtgtca tacgaacctc caagagacgg ttacacaaac 9480gggtacattg ttgatgtcat gtatgacaat cgcccaagta agtatccagc tgtgttcaga 9540acgtacgtcc gaattaattc atcggggtac ggtcgacgat cgtcaacgtt cacttctaaa 9600gaaatagcgc cactcagctt cctcagcggc tttatccagc gatttcctat tatgtcggca 9660tagttctcaa gatcgacagc ctgtcacggt taagcgagaa atgaataaga aggctgataa 9720ttcggatctc tgcgagggag atgatatttg atcacaggca gcaacgctct gtcatcgtta 9780caatcaacat gctaccctcc gcgagatcat ccgtgtttca aacccggcag cttagttgcc 9840gttcttccga atagcatcgg taacatgagc aaagtctgcc gccttacaac ggctctcccg 9900ctgacgccgt cccggactga tgggctgcct gtatcgagtg gtgattttgt gccgagctgc 9960cggtcgggga gctgttggct ggctggtggc aggatatatt gtggtgtaaa caaattgacg 10020cttagacaac ttaataacac attgcggacg tttttaatgt actgaattgt ctagacccgg 10080ggatctcatg tttgacagct tatcatcgga tctagtaaca tagatgacac cgcgcgcgat 10140aatttatcct agtttgcgcg ctatattttg ttttctatcg cgtattaaat gtataattgc 10200gggactctaa tcataaaaac ccatctcata aataacgtca tgcattacat gttaattatt 10260acatgcttaa cgtaattcaa cagaaattag atgataatca tcgcaagacc ggcaacagga 10320ttcaatctta agaaacttta ttgccaaatg tttgaacgat ctctgcaggt cgacggatcg 10380agctcccagc ttagcaagag atgttaattt tttcagtaag ctcttacagc ttgttgtaaa 10440cacgcgctaa acggccgtgg cctttgacag tcaccggtga ttcgttggcg gcaataaacg 10500ctgattcacc cggtttaagc tgtaactgct gagaaccttt ccacaacgtt gcatcgcctt 10560cgacgcagaa caaaatggcg gcactctgct ggctaatggt ggtttcttta tcactaaggt 10620catgcagcga gaaggcaaaa tcatccactg gaatcgggaa gtccagttct gcaccttgtt 10680tcaccggctg ggtcaacaac tggttagccg gtttggcttc gaatttcaca ttggcaacca 10740gttccggaat atcaatgtat ttaggcgtca gacccgcacg cagcacgtta tcggagtttg 10800ccatcacttc cagcgccacg ccttgcaggt aagcgtgcgg tgtttcagcg aacaggaaca 10860tcgcttcgcc agggttcaat ttcaccacat tcagcaatag cggggagaac agaccgctgt 10920cttccgggta aaattcagaa attaaacgaa tcgtttgcca cggttcaccc tgctggctat 10980cgagggccga ttttaaaatc gccagcgcgc gggatttttc ttcaccctgc atattcaaca 11040ggctggcgaa cagttcgctt aaacgttcgg catcaggctg ttgtaaaaag tgagcaatcg 11100ccggatgtgc acctgcgacc ggctggagta gggagacaat ctcggaaaat tcacgaaacg 11160cgttcatcgc aaggaaaggc gtcagcgcaa aaaccagctc cggcttgtgg ttaggatctt 11220tatagttacg ctcggcggca tccatcggga tacctgcggc attttctttg gcaaaaccga 11280tttcagaatt gtgtttgttt ggatgaacct gaatggagag tggctgtgct gcgcataata 11340ctttgaacag gaaaggcagt tcgccaaagc gtttggcaac ggcctctccg agcagagtcg 11400atttatcact ctcaatcaca tcacgcagtg aaacgatatc tccggcggca ttctgcactc 11460gtgaactgct tttcggatgt gcgcccatcc acagctcggc catcggctgg ctggacggat 11520tttccatacc ataaagttca gtcaacgcgt tttgctgccc caggcatagt tttgcactga 11580gttaatgagt ttttgcatga tcggggatcc ctgcagaagt aacaccaaac aacagggtga 11640gcatcgacaa aagaaacagt accaagcaaa taaatagcgt atgaaggcag ggctaaaaaa 11700atccacatat agctgctgca tatgccatca tccaagtata tcaagatcaa aataattata 11760aaacatactt gtttattata atagataggt actcaaggtt agagcatatg aatagatgct 11820gcatatgcca tcatgtatat gcatcagtaa aacccacatc aacatgtata cctatcctag 11880atcgatattt ccatccatct taaactcgta actatgaaga tgtatgacac acacatacag 11940ttccaaaatt aataaataca ccaggtagtt tgaaacggcg tctactccga tctagaacga 12000atgaacgacc gcccaaccac accacatcat cacaaccaag cgaacaaaaa gcatctctgt 12060atatgcatca gtaaaacccg catcaacatg tatacctatc ctagatcgat atttccatcc 12120atcatcttca attcgtaact atgaatatgt atggcacaca catacagatc caaaattaat 12180aaatccacca ggtagtttga aacagaattc tactccgatc tagaacgacc gcccaaccag 12240accacatcat cacaaccaag acaaaaaaaa gcatgaaaag atgacccgac aaacaagtgc 12300acggcatata ttgaaataaa ggaaaagggc aaaccaaacc ctatgcaacg aaacaaaaaa 12360aatcatgaaa tcgatcccgt ctgcggaacg gctagagcca tcccaggatt ccccaaagag 12420aaacactggc aagttagcaa tcagaacgtg tctgacgtac aggtcgcatc cgtgtacgaa 12480cgctagcagc acggatctaa cacaaacacg gatctaacac aaacatgaac agaagtagaa 12540ctaccgggcc ctaaccatgg accggaacgc cgatctagag aaggtagaga gggggggggg 12600gggaggacga gcggcgtacc ttgaagcgga ggtgccgacg ggtggatttg ggggagatct 12660ggttgtgtgt gtgtgcgctc cgaacaacac gaggttgggg aaagagggtg tggagggggt 12720gtctatttat tacggcgggc gaggaaggga aagcgaagga gcggtgggaa aggaatcccc 12780cgtagctgcc gtgccgtgag aggaggagga ggccgcctgc cgtgccggct cacgtctgcc 12840gctccgccac gcaatttctg gatgccgaca gcggagcaag tccaacggtg gagcggaact 12900ctcgagaggg gtccagaggc agcgacagag atgccgtgcc gtctgcttcg cttggcccga 12960cgcgacgctg ctggttcgct ggttggtgtc cgttagactc gtcgacggcg tttaacaggc 13020tggcattatc tactcgaaac aagaaaaatg tttccttagt ttttttaatt tcttaaaggg 13080tatttgttta atttttagtc actttatttt attctatttt atatctaaat tattaaataa 13140aaaaactaaa atagagtttt agttttctta atttagaggc taaaatagaa taaaatagat 13200gtactaaaaa aattagtcta taaaaaccat taaccctaaa ccctaaatgg atgtactaat 13260aaaatggatg aagtattata taggtgaagc tatttgcaaa aaaaaaggag aacacatgca 13320cactaaaaag ataaaactgt agagtcctgt tgtcaaaata ctcaattgtc ctttagacca 13380tgtctaactg ttcatttata tgattctcta aaacactgat attattgtag tactatagat 13440tatattattc gtagagtaaa gtttaaatat atgtataaag atagataaac tgcacttcaa 13500acaagtgtga caaaaaaaat atgtggtaat tttttataac ttagacatgc aatgctcatt 13560atctctagag aggggcacga ccgggtcacg ctgcactgca ggcatgcaag cttgcacatg 13620acaacaattg taagaggatg gagaccacaa cgatccaaca atacttctgc gacgggctgt 13680gaagtataga gaagttaaac gcccaaaagc cattgtgttt ggaattttta gttattctat 13740ttttcatgat gtatcttcct ctaacatgcc ttaatttgca aatttggtat aactactgat 13800tgaaaatata tgtatgtaaa aaaatactaa gcatatttgt gaagctaaac atgatgttat 13860ttaagaaaat atgttgttaa cagaataaga ttaatatcga aatggaaaca tctgtaaatt 13920agaatcatct tacaagctaa gagatgttca cgctttgaga aacttcttca gatcatgacc 13980gtagaagtag ctctccaaga ctcaacgaag gctgctgcaa ttccacaaat gcatgacatg 14040catccttgta accgtcgtcg ccgctataaa cacggataac tcaattccct gctccatcaa 14100tttagaaatg agcaagcaag cacccgatcg ctcaccccat atgcaccaat ctgactccca 14160agtctctgtt tcgcattagt accgccagca ctccacctat agctaccaat tgagaccttt 14220ccagcctaag cagatcgatt gatcgttaga gtcaaagagt tggtggtacg ggtactttaa 14280ctaccatgga atgatggggc gtgatgtaga gcggaaagcg cctccctacg cggaacaaca 14340ccctcgccat gccgctcgac tacagcctcc tcctcgtcgg ccgcccacaa cgagggagcc 14400cgtggtcgca gccaccgacc agcatgtctc tgtgtcctcg tccgacctcg acatgtcatg 14460gcaaacagtc ggacgccagc accagactga cgacatgagt ctctgaagag cccgccacct 14520agaaagatcc gagccctgct gctggtagtg gtaaccattt tcgtcgcgct gacgcggaga 14580gcgagaggcc agaaatttat agcgactgac gctgtggcag gcacgctatc ggaggttacg 14640acgtggcggg tcactcgacg cggagttcac aggtcctatc cttgcatcgc tcgggccgga 14700gtttacggga cttatcctta cgacgtgctc taaggttgcg ataacgggcg gaggaaggcg 14760tgtggcgtgc ggagacggtt tatacacgta gtgtgcggga gtgtgtttcg tagacgcggg 14820aaagcacgac gacttacgaa ggttagtgga ggaggaggac acactaaaat caggacgcaa 14880gaaactcttc tattatagta gtagagaaga gattatagga gtgtgggttg attctaaaga 14940aaatcgacgc aggacaaccg tcaaaacggg tgctttaata tagtagatat atatatatag 15000agagagagag aaagtacaaa ggatgcattt gtgtctgcat atgatcggag tattactaac 15060ggccgtcgta agaaggtcca tcatgcgtgg agcgagccca tttggttggt tgtcaggccg 15120cagttaaggc ctccatatat gattgtcgtc gggcccataa cagcatctcc tccaccagtt 15180tattgtaaga ataaattaag tagagatatt tgtcgtcggg cagaagaaac ttggacaaga 15240agaagaagca agctaggcca atttcttgcc ggcaagagga agatagtggc ctctagttta 15300tatatcggcg tgatgatgat gctcctagct agaaatgaga gaagaaaaac ggacgcgtgt 15360ttggtgtgtg tcaatggcgt ccatccttcc atcagatcag aacgatgaaa aagtcaagca 15420cggcatgcat agtatatgta tagcttgttt tagtgtggct ttgctgagac gaatgaaagc 15480aacggcgggc atatttttca gtggctgtag ctttcaggct gaaagagacg tggcatgcaa 15540taattcaggg aattcgtcag ccaattgagg tagctagtca acttgtacat tggtgcgagc 15600aattttccgc actcaggagg gctagtttga gagtccaaaa actataggag attaaagagg 15660ctaaaatcct ctccttattt aattttaaat aagtagtgta tttgtatttt aactcctcca 15720acccttccga ttttatggct ctcaaactag cattcagtct aatgcatgca tgcttggcta 15780gaggtcgtat ggggttgtta atagcatagc tagctacaag ttaaccgggt cttttatatt 15840taataaggac aggcaaagta ttacttacaa ataaagaata aagctaggac gaactcgtgg 15900attattacta aatcgaaatg gacgtaatat tccaggcaag aataattgtt cgatcaggag 15960acaagtgggg cattggaccg gttcttgcaa gcaagagcct atggcgtggt gacacggcgc 16020gttgcccata catcatgcct ccatcgatga tccatcctca cttgctataa aaagaggtgt 16080ccatggtgct caagctcagc caagcaaata agacgacttg tttcattgat tcttcaagag 16140atcgagcttc ttttgcacca caaggtcgag gatccaaca 16179<210>13<211>15643<212>DNA<213>人工序列 <220><223>人工序列说明:pNOV1441<220><221>misc_feature<222>(14)..(1414)<223>玉米泛在蛋白(Mz Ubi)启动子<220><221>misc_feature<222>(2037)..(5618)<223>编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列<220><221>misc_feature<222>(5821)..(6711)<223>Mz Ubi启动子<220><221>misc_feature<222>(7831)..(9039)<223>PMI<400>13aagctggtac aagcttgcat gcctgcagtg cagcgtgacc cggtcgtgcc cctctctaga 60gataatgagc attgcatgtc taagttataa aaaattacca catatttttt ttgtcacact 120tgtttgaagt gcagtttatc tatctttata catatattta aactttactc tacgaataat 180ataatctata gtactacaat aatatcagtg ttttagagaa tcatataaat gaacagttag 240acatggtcta aaggacaatt gagtattttg acaacaggac tctacagttt tatcttttta 300gtgtgcatgt gttctccttt ttttttgcaa atagcttcac ctatataata cttcatccat 360tttattagta catccattta gggtttaggg ttaatggttt ttatagacta atttttttag 420tacatctatt ttattctatt ttagcctcta aattaagaaa actaaaactc tattttagtt 480tttttattta ataatttaga tataaaatag aataaaataa agtgactaaa aattaaacaa 540atacccttta agaaattaaa aaaactaagg aaacattttt cttgtttcga gtagataatg 600ccagcctgtt aaacgccgtc gacgagtcta acggacacca accagcgaac cagcagcgtc 660gcgtcgggcc aagcgaagca gacggcacgg catctctgtc gctgcctctg gacccctctc 720gagagttccg ctccaccgtt ggacttgctc cgctgtcggc atccagaaat tgcgtggcgg 780agcggcagac gtgagccggc acggcaggcg gcctcctcct cctctcacgg cacggcagct 840acgggggatt cctttcccac cgctccttcg ctttcccttc ctcgcccgcc gtaataaata 900gacaccccct ccacaccctc tttccccaac ctcgtgttgt tcggagcgca cacacacaca 960accagatctc ccccaaatcc acccgtcggc acctccgctt caaggtacgc cgctcgtcct 1020cccccccccc ccctctctac cttctctaga tcggcgttcc ggtccatggt tagggcccgg 1080tagttctact tctgttcatg tttgtgttag atccgtgttt gtgttagatc cgtgctgcta 1140gcgttcgtac acggatgcga cctgtacgtc agacacgttc tgattgctaa cttgccagtg 1200tttctctttg gggaatcctg ggatggctct agccgttccg cagacgggat cgatttcatg 1260attttttttg tttcgttgca tagggtttgg tttgcccttt tcctttattt caatatatgc 1320cgtgcacttg tttgtcgggt catcttttca tgcttttttt tgtcttggtt gtgatgatgt 1380ggtctggttg ggcggtcgtt ctagatcgga gtagaattct gtttcaaact acctggtgga 1440tttattaatt ttggatctgt atgtgtgtgc catacatatt catagttacg aattgaagat 1500gatggatgga aatatcgatc taggataggt atacatgttg atgcgggttt tactgatgca 1560tatacagaga tgctttttgt tcgcttggtt gtgatgatgt ggtgtggttg ggcggtcgtt 1620cattcgttct agatcggagt agaatactgt ttcaaactac ctggtgtatt tattaatttt 1680ggaactgtat gtgtgtgtca tacatcttca tagttacgag tttaagatgg atggaaatat 1740cgatctagga taggtataca tgttgatgtg ggttttactg atgcatatac atgatggcat 1800atgcagcatc tattcatatg ctctaacctt gagtacctat ctattataat aaacaagtat 1860gttttataat tattttgatc ttgatatact tggatgatgg catatgcagc agctatatgt 1920ggattttttt agccctgcct tcatacgcta tttatttgct tggtactgtt tcttttgtcg 1980atgctcaccc tgttgtttgg tgttacttct gcaggtcgac tctagaggat ccaacaatgg 2040acaacaaccc caacatcaac gagtgcatcc cctacaactg cctgagcaac cccgaggtgg 2100aggtgctggg cggcgagcgc atcgagaccg gctacacccc catcgacatc agcctgagcc 2160tgacccagtt cctgctgagc gagttcgtgc ccggcgccgg cttcgtgctg ggcctggtgg 2220acatcatctg gggcatcttc ggccccagcc agtgggacgc cttcctggtg cagatcgagc 2280agttgataaa ccaacgcata gaggaattcg cccgcaacca ggccatcagc cgcctggagg 2340gcctgagcaa cctgtaccaa atctacgccg agagcttccg cgagtgggag gccgacccca 2400ccaaccccgc cctgcgcgag gagatgcgca tccagttcaa cgacatgaac agcgccctga 2460ccaccgccat ccccctgttc gccgtgcaga actaccaggt gcccctgctg agcgtgtacg 2520tgcaggccgc caacctgcac ctgagcgtgc tgcgcgacgt cagcgtgttc ggccagcgct 2580ggggcttcga cgccgccacc atcaacagcc gctacaacga cctgacccgc ctgatcggca 2640actacaccga ccacgccgtg cgctggtaca acaccggcct ggagcgcgtg tggggtcccg 2700acagccgcga ctggatcagg tacaaccagt tccgccgcga gctgaccctg accgtgctgg 2760acatcgtgag cctgttcccc aactacgaca gccgcaccta ccccatccgc accgtgagcc 2820agctgacccg cgagatttac accaaccccg tgctggagaa cttcgacggc agcttccgcg 2880gcagcgccca gggcatcgag ggcagcatcc gcagccccca cctgatggac atcctgaaca 2940gcatcaccat ctacaccgac gcccaccgcg gcgagtacta ctggagcggc caccagatca 3000tggccagccc cgtcggcttc agcggccccg agttcacctt ccccctgtac ggcaccatgg 3060gcaacgctgc acctcagcag cgcatcgtgg cacagctggg ccagggagtg taccgcaccc 3120tgagcagcac cctgtaccgt cgacctttca acatcggcat caacaaccag cagctgagcg 3180tgctggacgg caccgagttc gcctacggca ccagcagcaa cctgcccagc gccgtgtacc 3240gcaagagcgg caccgtggac agcctggacg agatcccccc tcagaacaac aacgtgccac 3300ctcgacaggg cttcagccac cgtctgagcc acgtgagcat gttccgcagt ggcttcagca 3360acagcagcgt gagcatcatc cgtgcaccca tgttcagctg gattcaccgc agcgccaccc 3420tgaccaacac catcgacccc gagcgcatca accagatccc cctggtgaag ggcttccggg 3480tgtggggcgg caccagcgtg atcaccggcc ccggcttcac cggaggcgac atcctgcgca 3540gaaacacctt cggcgacttc gtgagcctgc aggtgaacat caacagcccc atcacccagc 3600gttaccgcct gcgcttccgc tacgccagca gccgcgacgc ccgtgtgatc gtgctgactg 3660gcgccgctag caccggtgtg ggcggtcagg tgagcgtgaa catgcccctg cagaagacta 3720tggagatcgg cgagaacctg actagtcgca ccttccgcta caccgacttc agcaacccct 3780tcagcttccg cgccaacccc gacatcatcg gcatcagcga gcagcccctg ttcggtgccg 3840gcagcatcag cagcggcgag ctgtacatcg acaagatcga gatcatcctg gccgacgcca 3900ccttcgaggc cgagagcgac ctggagcgcg cccagaaggc cgtgaacgcc ctgttcacca 3960gcagcaacca gatcggcctg aagaccgacg tgaccgacta ccacatcgac caggtgagca 4020acctggtgga ctgcttaagc gacgagttct gcctggacga gaagaaggag ctgagcgaga 4080aggtgaagca cgccaagcgc ctgagcgacg agcgcaacct gctgcaggac cccaacttcc 4140gcggcatcaa ccgccagctg gaccgcggct ggcgaggcag caccgatatc accatccagg 4200gcggcgacga cgtgttcaag gagaactacg tgaccctgca gggcaccttc gacgagtgct 4260accccaccta cctgtaccag ccgatcgacg agagcaagct gaaggcctac acccgctacc 4320agctgcgcgg ctacatcgag gacagccagg acctggaaat ctacctgatc cgctacaacg 4380cgaagcacga gaccgtgaac gtgcccggca ccggcagcct gtggcccccg agcgccccca 4440gccccatcgg caagtgcggg gagccgaatc gatgcgctcc gcacctggag tggaacccgg 4500acctagactg cagctgcagg gacggggaga agtgcgccca ccacagccac cacttcagcc 4560tggacatcga cgtgggctgc accgacctga acgaggacct gggcgtgtgg gtgatcttca 4620agatcaagac ccaggacggc cacgcccgcc tgggcaatct agagttcctg gaggagaagc 4680ccctggtggg cgaggccctg gcccgcgtga agcgtgctga gaagaagtgg cgcgacaagc 4740gcgagaagct ggagtgggag accaacatcg tgtacaagga ggccaaggag agcgtggacg 4800ccctgttcgt gaacagccag tacgaccgcc tgcaggccga caccaacatc gccatgatcc 4860acgccgccga caagcgcgtg cacagcattc gcgaggccta cctgcccgag ctgagcgtga 4920tccccggtgt gaacgccgcc atcttcgagg aactcgaggg ccgcatcttc accgccttca 4980gcctgtacga cgcccgcaac gtgatcaaga acggcgactt caacaacggc ctgagctgct 5040ggaacgtgaa gggccacgtg gacgtggagg agcagaacaa ccaccgcagc gtgctggtgg 5100tgcccgagtg ggaggccgag gtgagccagg aggtgcgcgt gtgccccggc cgcggctaca 5160tcctgcgcgt gaccgcctac aaggagggct acggcgaggg ctgcgtgacc atccacgaga 5220tcgagaacaa caccgacgag ctcaagttca gcaactgcgt ggaggaggag gtttacccca 5280acaacaccgt gacctgcaac gactacaccg cgacccagga ggagtacgaa ggcacctaca 5340cctctcgcaa caggggttac gacggcgcct acgagtccaa cagctccgtg ccagctgact 5400acgccagcgc ccacgaggag aaagcctaca ccgacggtag acgcgacaac ccatgtgaga 5460gcaacagagg ctacggcgac tacacccccc tgcccgctgg atacgtgacc aaggagctgg 5520agtacttccc cgagaccgac aaggtgtgga tcgagattgg cgagaccgag ggcaccttca 5580tcgtggacag cgtggagctg ctgctgatgg aggagtagta gatctgttct gcacaaagtg 5640gagtagtcag tcatcgatca ggaaccagac accagacttt tattcataca gtgaagtgaa 5700gtgaagtgca gtgcagtgag ttgctggttt ttgtaccact tagtatgtat ttgtatttgt 5760aaaatacttc tatcaataaa atttctaatt cctaaaacca aaatccagtg ggtaccagct 5820tgcatgcctg cagtgcagcg tgacccggtc gtgcccctct ctagagataa tgagcattgc 5880atgtctaagt tataaaaaat taccacatat tttttttgtc acacttgttt gaagtgcagt 5940ttatctatct ttatacatat atttaaactt tactctacga ataatataat ctatagtact 6000acaataatat cagtgtttta gagaatcata taaatgaaca gttagacatg gtctaaagga 6060caattgagta ttttgacaac aggactctac agttttatct ttttagtgtg catgtgttct 6120cctttttttt tgcaaatagc ttcacctata taatacttca tccattttat tagtacatcc 6180atttagggtt tagggttaat ggtttttata gactaatttt tttagtacat ctattttatt 6240ctattttagc ctctaaatta agaaaactaa aactctattt tagttttttt atttaataat 6300ttagatataa aatagaataa aataaagtga ctaaaaatta aacaaatacc ctttaagaaa 6360ttaaaaaaac taaggaaaca tttttcttgt ttcgagtaga taatgccagc ctgttaaacg 6420ccgtcgacga gtctaacgga caccaaccag cgaaccagca gcgtcgcgtc gggccaagcg 6480aagcagacgg cacggcatct ctgtcgctgc ctctggaccc ctctcgagag ttccgctcca 6540ccgttggact tgctccgctg tcggcatcca gaaattgcgt ggcggagcgg cagacgtgag 6600ccggcacggc aggcggcctc ctcctcctct cacggcacgg cagctacggg ggattccttt 6660cccaccgctc cttcgctttc ccttcctcgc ccgccgtaat aaatagacac cccctccaca 6720ccctctttcc ccaacctcgt gttgttcgga gcgcacacac acacaaccag atctccccca 6780aatccacccg tcggcacctc cgcttcaagg tacgccgctc gtcctccccc cccccccctc 6840tctaccttct ctagatcggc gttccggtcc atggttaggg cccggtagtt ctacttctgt 6900tcatgtttgt gttagatccg tgtttgtgtt agatccgtgc tgctagcgtt cgtacacgga 6960tgcgacctgt acgtcagaca cgttctgatt gctaacttgc cagtgtttct ctttggggaa 7020tcctgggatg gctctagccg ttccgcagac gggatcgatt tcatgatttt ttttgtttcg 7080ttgcataggg tttggtttgc ccttttcctt tatttcaata tatgccgtgc acttgtttgt 7140cgggtcatct tttcatgctt ttttttgtct tggttgtgat gatgtggtct ggttgggcgg 7200tcgttctaga tcggagtaga attctgtttc aaactacctg gtggatttat taattttgga 7260tctgtatgtg tgtgccatac atattcatag ttacgaattg aagatgatgg atggaaatat 7320cgatctagga taggtataca tgttgatgcg ggttttactg atgcatatac agagatgctt 7380tttgttcgct tggttgtgat gatgtggtgt ggttgggcgg tcgttcattc gttctagatc 7440ggagtagacg ccgtttcaaa ctacctggtg tatttattaa ttttggaact gtatgtgtgt 7500gtcatacatc ttcatagtta cgagtttaag atggatggaa atatcgatct aggataggta 7560tacatgttga tgtgggtttt actgatgcat atacatgatg gcatatgcag catctattca 7620tatgctctaa ccttgagtac ctatctatta taataaacaa gtatgtttta taattatttt 7680gatcttgata tacttggatg atggcatatg cagcagctat atgtggattt ttttagccct 7740gccttcatac gctatttatt tgcttggtac tgtttctttt gtcgatgctc accctgttgt 7800ttggtgttac ttctgcaggg atccccgatc atgcaaaaac tcattaactc agtgcaaaac 7860tatgcctggg gcagcaaaac gcgttgactg aactttatgg tatggaaaat ccgtccagcc 7920agccgatggc cgagctgtgg atgggcgcac atccgaaaag cagttcacga gtgcagaatg 7980ccgccggaga tatcgtttca ctgcgtgatg tgattgagag tgataaatcg actctgctcg 8040gagaggccgt tgccaaacgc tttggcgaac tgcctttcct gttcaaagta ttatgcgcag 8100cacagccact ctccattcag gttcatccaa acaaacacaa ttctgaaatc ggttttgcca 8160aagaaaatgc cgcaggtatc ccgatggatg ccgccgagcg taactataaa gatcctaacc 8220acaagccgga gctggttttt gcgctgacgc ctttccttgc gatgaacgcg tttcgtgaat 8280tttccgagat tgtctcccta ctccagccgg tcgcaggtgc acatccggcg attgctcact 8340ttttacaaca gcctgatgcc gaacgtttaa gcgaactgtt cgccagcctg ttgaatatgc 8400agggtgaaga aaaatcccgc gcgctggcga ttttaaaatc ggccctcgat agccagcagg 8460gtgaaccgtg gcaaacgatt cgtttaattt ctgaatttta cccggaagac agcggtctgt 8520tctccccgct attgctgaat gtggtgaaat tgaaccctgg cgaagcgatg ttcctgttcg 8580ctgaaacacc gcacgcttac ctgcaaggcg tggcgctgga agtgatggca aactccgata 8640acgtgctgcg tgcgggtctg acgcctaaat acattgatat tccggaactg gttgccaatg 8700tgaaattcga agccaaaccg gctaaccagt tgttgaccca gccggtgaaa caaggtgcag 8760aactggactt cccgattcca gtggatgatt ttgccttctc gctgcatgac cttagtgata 8820aagaaaccac cattagccag cagagtgccg ccattttgtt ctgcgtcgaa ggcgatgcaa 8880cgttgtggaa aggttctcag cagttacagc ttaaaccggg tgaatcagcg tttattgccg 8940ccaacgaatc accggtgact gtcaaaggcc acggccgttt agcgcgtgtt tacaacaagc 9000tgtaagagct tactgaaaaa attaacatct cttgctaagc tgggagctcg atccgtcgac 9060ctgcagagat cgttcaaaca tttggcaata aagtttctta agattgaatc ctgttgccgg 9120tcttgcgatg attatcatct aatttctgtt gaattacgtt aagcatgtaa taattaacat 9180gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc aattatacat 9240ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat cgcgcgcggt 9300gtcatctatg ttactagatc cgatgataag ctgtcaaaca tgagatcccc gggtctagac 9360aattcagtac attaaaaacg tccgcaatgt gttattaagt tgtctaagcg tcaatttgtt 9420tacaccacaa tatatcctgc caccagccag ccaacagctc cccgaccggc agctcggcac 9480aaaatcacca ctcgatacag gcagcccatc agtccgggac ggcgtcagcg ggagagccgt 9540tgtaaggcgg cagactttgc tcatgttacc gatgctattc ggaagaacgg caactaagct 9600gccgggtttg aaacacggat gatctcgcgg agggtagcat gttgattgta acgatgacag 9660agcgttgctg cctgtgatca aatatcatct ccctcgcaga gatccgaatt atcagccttc 9720ttattcattt ctcgcttaac cgtgacaggc tgtcgatctt gagaactatg ccgacataat 9780aggaaatcgc tggataaagc cgctgaggaa gctgagtggc gctatttctt tagaagtgaa 9840cgttgacgat cgtcgaccgt accccgatga attaattcgg acgtacgttc tgaacacagc 9900tggatactta cttgggcgat tgtcatacat gacatcaaca atgtacccgt ttgtgtaacc 9960gtctcttgga ggttcgtatg acactagtgg ttcccctcag cttgcgacta gatgttgagg 10020cctaacattt tattagagag caggctagtt gcttagatac atgatcttca ggccgttatc 10080tgtcagggca agcgaaaatt ggccatttat gacgaccaat gccccgcaga agctcccatc 10140tttgccgcca tagacgccgc gccccccttt tggggtgtag aacatccttt tgccagatgt 10200ggaaaagaag ttcgttgtcc cattgttggc aatgacgtag tagccggcga aagtgcgaga 10260cccatttgcg ctatatataa gcctacgatt tccgttgcga ctattgtcgt aattggatga 10320actattatcg tagttgctct cagagttgtc gtaatttgat ggactattgt cgtaattgct 10380tatggagttg tcgtagttgc ttggagaaat gtcgtagttg gatggggagt agtcataggg 10440aagacgagct tcatccacta aaacaattgg caggtcagca agtgcctgcc ccgatgccat 10500cgcaagtacg aggcttagaa ccaccttcaa cagatcgcgc atagtcttcc ccagctctct 10560aacgcttgag ttaagccgcg ccgcgaagcg gcgtcggctt gaacgaattg ttagacatta 10620tttgccgact accttggtga tctcgccttt cacgtagtga acaaattctt ccaactgatc 10680tgcgcgcgag gccaagcgat cttcttgtcc aagataagcc tgcctagctt caagtatgac 10740gggctgatac tgggccggca ggcgctccat tgcccagtcg gcagcgacat ccttcggcgc 10800gattttgccg gttactgcgc tgtaccaaat gcgggacaac gtaagcacta catttcgctc 10860atcgccagcc cagtcgggcg gcgagttcca tagcgttaag gtttcattta gcgcctcaaa 10920tagatcctgt tcaggaaccg gatcaaagag ttcctccgcc gctggaccta ccaaggcaac 10980gctatgttct cttgcttttg tcagcaagat agccagatca atgtcgatcg tggctggctc 11040gaagatacct gcaagaatgt cattgcgctg ccattctcca aattgcagtt cgcgcttagc 11100tggataacgc cacggaatga tgtcgtcgtg cacaacaatg gtgacttcta cagcgcggag 11160aatctcgctc tctccagggg aagccgaagt ttccaaaagg tcgttgatca aagctcgccg 11220cgttgtttca tcaagcctta cggtcaccgt aaccagcaaa tcaatatcac tgtgtggctt 11280caggccgcca tccactgcgg agccgtacaa atgtacggcc agcaacgtcg gttcgagatg 11340gcgctcgatg acgccaacta cctctgatag ttgagtcgat acttcggcga tcaccgcttc 11400cctcatgatg tttaactcct gaattaagcc gcgccgcgaa gcggtgtcgg cttgaatgaa 11460ttgttaggcg tcatcctgtg ctcccgagaa ccagtaccag tacatcgctg tttcgttcga 11520gacttgaggt ctagttttat acgtgaacag gtcaatgccg ccgagagtaa agccacattt 11580tgcgtacaaa ttgcaggcag gtacattgtt cgtttgtgtc tctaatcgta tgccaaggag 11640ctgtctgctt agtgcccact ttttcgcaaa ttcgatgaga ctgtgcgcga ctcctttgcc 11700tcggtgcgtg tgcgacacaa caatgtgttc gatagaggct agatcgttcc atgttgagtt 11760gagttcaatc ttcccgacaa gctcttggtc gatgaatgcg ccatagcaag cagagtcttc 11820atcagagtca tcatccgaga tgtaatcctt ccggtagggg ctcacacttc tggtagatag 11880ttcaaagcct tggtcggata ggtgcacatc gaacacttca cgaacaatga aatggttctc 11940agcatccaat gtttccgcca cctgctcagg gatcaccgaa atcttcatat gacgcctaac 12000gcctggcaca gcggatcgca aacctggcgc ggcttttggc acaaaaggcg tgacaggttt 12060gcgaatccgt tgctgccact tgttaaccct tttgccagat ttggtaacta taatttatgt 12120tagaggcgaa gtcttgggta aaaactggcc taaaattgct ggggatttca ggaaagtaaa 12180catcaccttc cggctcgatg tctattgtag atatatgtag tgtatctact tgatcggggg 12240atctgctgcc tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg 12300gagacggtca cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg 12360tcagcgggtg ttggcgggtg tcggggcgca gccatgaccc agtcacgtag cgatagcgga 12420gtgtatactg gcttaactat gcggcatcag agcagattgt actgagagtg caccatatgc 12480ggtgtgaaat accgcacaga tgcgtaagga gaaaataccg catcaggcgc tcttccgctt 12540cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact 12600caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag 12660caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata 12720ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 12780cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg 12840ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 12900tttctcatag ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 12960gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 13020ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 13080ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 13140gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 13200aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg 13260tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt 13320ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat 13380tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct 13440aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta 13500tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa 13560ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac 13620gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa 13680gtggtcctgc aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag 13740taagtagttc gccagttaat agtttgcgca acgttgttgc cattgctgca gggggggggg 13800ggggggggga cttccattgt tcattccacg gacaaaaaca gagaaaggaa acgacagagg 13860ccaaaaagcc tcgctttcag cacctgtcgt ttcctttctt ttcagagggt attttaaata 13920aaaacattaa gttatgacga agaagaacgg aaacgcctta aaccggaaaa ttttcataaa 13980tagcgaaaac ccgcgaggtc gccgccccgt aacctgtcgg atcaccggaa aggacccgta 14040aagtgataat gattatcatc tacatatcac aacgtgcgtg gaggccatca aaccacgtca 14100aataatcaat tatgacgcag gtatcgtatt aattgatctg catcaactta acgtaaaaac 14160aacttcagac aatacaaatc agcgacactg aatacggggc aacctcatgt cccccccccc 14220cccccccctg caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc 14280ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc 14340tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt 14400atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact 14460ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc 14520ccggcgtcaa cacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt 14580ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg 14640atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct 14700gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa 14760tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt 14820ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc 14880acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat gacattaacc 14940tataaaaata ggcgtatcac gaggcccttt cgtcttcaag aattggtcga cgatcttgct 15000gcgttcggat attttcgtgg agttcccgcc acagacccgg attgaaggcg agatccagca 15060actcgcgcca gatcatcctg tgacggaact ttggcgcgtg atgactggcc aggacgtcgg 15120ccgaaagagc gacaagcaga tcacgctttt cgacagcgtc ggatttgcga tcgaggattt 15180ttcggcgctg cgctacgtcc gcgaccgcgt tgagggatca agccacagca gcccactcga 15240ccttctagcc gacccagacg agccaaggga tctttttgga atgctgctcc gtcgtcaggc 15300tttccgacgt ttgggtggtt gaacagaagt cattatcgta cggaatgcca agcactcccg 15360aggggaaccc tgtggttggc atgcacatac aaatggacga acggataaac cttttcacgc 15420ccttttaaat atccgttatt ctaataaacg ctcttttctc ttaggtttac ccgccaatat 15480atcctgtcaa acactgatag tttaaactga aggcgggaaa cgacaatctg atcatgagcg 15540gagaattaag ggagtcacgt tatgaccccc gccgatgacg cgggacaagc cgttttacgt 15600ttggaactga cagaaccgca acgttgaagg agccactcag ccc 15643<210>14<211>15503<212>DNA<213>人工序列<220><223>人工序列说明:pNOV1305<220><221>misc_feature<222>(1)..(3582)<223>编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列<220><221>misc_feature<222>(3790)..(5771)<223>Zm Ubi启动子<220><221>misc_feature<222>(5868)..(6971)<223>PMI<220><221>misc_feature<222>(12934)..(15494)<223>MTL启动子<400>14atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg 120agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg 180gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc 240gagcagttga taaaccaacg catagaggaa ttcgcccgca accaggccat cagccgcctg 300gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac 360cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc 420ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg 480tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag 540cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc 600ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt 660cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg 720ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg 780agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc 840cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg 900aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag 960atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc 1020atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc 1080accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg 1140agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg 1200taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg 1260ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc 1320agcaacagca gcgtgagcat catccgtgca cccatgttca gctggattca ccgcagcgcc 1380accctgacca acaccatcga ccccgagcgc atcaaccaga tccccctggt gaagggcttc 1440cgggtgtggg gcggcaccag cgtgatcacc ggccccggct tcaccggagg cgacatcctg 1500cgcagaaaca ccttcggcga cttcgtgagc ctgcaggtga acatcaacag ccccatcacc 1560cagcgttacc gcctgcgctt ccgctacgcc agcagccgcg acgcccgtgt gatcgtgctg 1620actggcgccg ctagcaccgg tgtgggcggt caggtgagcg tgaacatgcc cctgcagaag 1680actatggaga tcggcgagaa cctgactagt cgcaccttcc gctacaccga cttcagcaac 1740cccttcagct tccgcgccaa ccccgacatc atcggcatca gcgagcagcc cctgttcggt 1800gccggcagca tcagcagcgg cgagctgtac atcgacaaga tcgagatcat cctggccgac 1860gccaccttcg aggccgagag cgacctggag cgcgcccaga aggccgtgaa cgccctgttc 1920accagcagca accagatcgg cctgaagacc gacgtgaccg actaccacat cgaccaggtg 1980agcaacctgg tggactgctt aagcgacgag ttctgcctgg acgagaagaa ggagctgagc 2040gagaaggtga agcacgccaa gcgcctgagc gacgagcgca acctgctgca ggaccccaac 2100ttccgcggca tcaaccgcca gctggaccgc ggctggcgag gcagcaccga tatcaccatc 2160cagggcggcg acgacgtgtt caaggagaac tacgtgaccc tgcagggcac cttcgacgag 2220tgctacccca cctacctgta ccagccgatc gacgagagca agctgaaggc ctacacccgc 2280taccagctgc gcggctacat cgaggacagc caggacctgg aaatctacct gatccgctac 2340aacgcgaagc acgagaccgt gaacgtgccc ggcaccggca gcctgtggcc cctgagcgcc 2400cccagcccca tcggcaagtg cggggagccg aatcgatgcg ctccgcacct ggagtggaac 2460ccggacctag actgcagctg cagggacggg gagaagtgcg cccaccacag ccaccacttc 2520agcctggaca tcgacgtggg ctgcaccgac ctgaacgagg acctgggcgt gtgggtgatc 2580ttcaagatca agacccagga cggccacgcc cgcctgggca atctagagtt cctggaggag 2640aagcccctgg tgggcgaggc cctggcccgc gtgaagcgtg ctgagaagaa gtggcgcgac 2700aagcgcgaga agctggagtg ggagaccaac atcgtgtaca aggaggccaa ggagagcgtg 2760gacgccctgt tcgtgaacag ccagtacgac cgcctgcagg ccgacaccaa catcgccatg 2820atccacgccg ccgacaagcg cgtgcacagc attcgcgagg cctacctgcc cgagctgagc 2880gtgatccccg gtgtgaacgc cgccatcttc gaggaactcg agggccgcat cttcaccgcc 2940ttcagcctgt acgacgcccg caacgtgatc aagaacggcg acttcaacaa cggcctgagc 3000tgctggaacg tgaagggcca cgtggacgtg gaggagcaga acaaccaccg cagcgtgctg 3060gtggtgcccg agtgggaggc cgaggtgagc caggaggtgc gcgtgtgccc cggccgcggc 3120tacatcctgc gcgtgaccgc ctacaaggag ggctacggcg agggctgcgt gaccatccac 3180gagatcgaga acaacaccga cgagctcaag ttcagcaact gcgtggagga ggaggtttac 3240cccaacaaca ccgtgacctg caacgactac accgcgaccc aggaggagta cgaaggcacc 3300tacacctctc gcaacagggg ttacgacggc gcctacgagt ccaacagctc cgtgccagct 3360gactacgcca gcgcctacga ggagaaagcc tacaccgacg gtagacgcga caacccatgt 3420gagagcaaca gaggctacgg cgactacacc cccctgcccg ctggatacgt gaccaaggag 3480ctggagtact tccccgagac cgacaaggtg tggatcgaga ttggcgagac cgagggcacc 3540ttcatcgtgg acagcgtgga gctgctgctg atggaggagt agtagatctg ttctgcacaa 3600agtggagtag tcagtcatcg atcaggaacc agacaccaga cttttattca tacagtgaag 3660tgaagtgaag tgcagtgcag tgagttgctg gtttttgtac aacttagtat gtatttgtat 3720ttgtaaaata cttctatcaa taaaatttct aattcctaaa accaaaatcc aggggtacca 3780gcttgcatgc ctgcagtgca gcgtgacccg gtcgtgcccc tctctagaga taatgagcat 3840tgcatgtcta agttataaaa aattaccaca tatttttttt gtcacacttg tttgaagtgc 3900agtttatcta tctttataca tatatttaaa ctttactcta cgaataatat aatctatagt 3960actacaataa tatcagtgtt ttagagaatc atataaatga acagttagac atggtctaaa 4020ggacaattga gtattttgac aacaggactc tacagtttta tctttttagt gtgcatgtgt 4080tctccttttt ttttgcaaat agcttcacct atataatact tcatccattt tattagtaca 4140tccatttagg gtttagggtt aatggttttt atagactaat ttttttagta catctatttt 4200attctatttt agcctctaaa ttaagaaaac taaaactcta ttttagtttt tttatttaat 4260aatttagata taaaatagaa taaaataaag tgactaaaaa ttaaacaaat accctttaag 4320aaattaaaaa aactaaggaa acatttttct tgtttcgagt agataatgcc agcctgttaa 4380acgccgtcga cgagtctaac ggacaccaac cagcgaacca gcagcgtcgc gtcgggccaa 4440gcgaagcaga cggcacggca tctctgtcgc tgcctctgga cccctctcga gagttccgct 4500ccaccgttgg acttgctccg ctgtcggcat ccagaaattg cgtggcggag cggcagacgt 4560gagccggcac ggcaggcggc ctcctcctcc tctcacggca ccggcagcta cgggggattc 4620ctttcccacc gctccttcgc tttcccttcc tcgcccgccg taataaatag acaccccctc 4680cacaccctct ttccccaacc tcgtgttgtt cggagcgcac acacacacaa ccagatctcc 4740cccaaatcca cccgtcggca cctccgcttc aaggtacgcc gctcgtcctc cccccccccc 4800cctctctacc ttctctagat cggcgttccg gtccatggtt agggcccggt agttctactt 4860ctgttcatgt ttgtgttaga tccgtgtttg tgttagatcc gtgctgctag cgttcgtaca 4920cggatgcgac ctgtacgtca gacacgttct gattgctaac ttgccagtgt ttctctttgg 4980ggaatcctgg gatggctcta gccgttccgc agacgggatc gatttcatga ttttttttgt 5040ttcgttgcat agggtttggt ttgccctttt cctttatttc aatatatgcc gtgcacttgt 5100ttgtcgggtc atcttttcat gctttttttt gtcttggttg tgatgatgtg gtctggttgg 5160gcggtcgttc tagatcggag tagaattctg tttcaaacta cctggtggat ttattaattt 5220tggatctgta tgtgtgtgcc atacatattc atagttacga attgaagatg atggatggaa 5280atatcgatct aggataggta tacatgttga tgcgggtttt actgatgcat atacagagat 5340gctttttgtt cgcttggttg tgatgatgtg gtgtggttgg gcggtcgttc attcgttcta 5400gatcggagta gaatactgtt tcaaactacc tggtgtattt attaattttg gaactgtatg 5460tgtgtgtcat acatcttcat agttacgagt ttaagatgga tggaaatatc gatctaggat 5520aggtatacat gttgatgtgg gttttactga tgcatataca tgatggcata tgcagcatct 5580attcatatgc tctaaccttg agtacctatc tattataata aacaagtatg ttttataatt 5640attttgatct tgatatactt ggatgatggc atatgcagca gctatatgtg gattttttta 5700gccctgcctt catacgctat ttatttgctt ggtactgttt cttttgtcga tgctcaccct 5760gttgtttggt gttacttctg cagggatccc cgatcatgca aaaactcatt aactcagtgc 5820aaaactatgc ctggggcagc aaaacggcgt tgactgaact ttatggtatg gaaaatccgt 5880ccagccagcc gatggccgag ctgtggatgg gcgcacatcc gaaaagcagt tcacgagtgc 5940agaatgccgc cggagatatc gtttcactgc gtgatgtgat tgagagtgat aaatcgactc 6000tgctcggaga ggccgttgcc aaacgctttg gcgaactgcc tttcctgttc aaagtattat 6060gcgcagcaca gccactctcc attcaggttc atccaaacaa acacaattct gaaatcggtt 6120ttgccaaaga aaatgccgca ggtatcccga tggatgccgc cgagcgtaac tataaagatc 6180ctaaccacaa gccggagctg gtttttgcgc tgacgccttt ccttgcgatg aacgcgtttc 6240gtgaattttc cgagattgtc tccctactcc agccggtcgc aggtgcacat ccggcgattg 6300ctcacttttt acaacagcct gatgccgaac gtttaagcga actgttcgcc agcctgttga 6360atatgcaggg tgaagaaaaa tcccgcgcgc tggcgatttt aaaatcggcc ctcgatagcc 6420agcagggtga accgtggcaa acgattcgtt taatttctga attttacccg gaagacagcg 6480gtctgttctc cccgctattg ctgaatgtgg tgaaattgaa ccctggcgaa gcgatgttcc 6540tgttcgctga aacaccgcac gcttacctgc aaggcgtggc gctggaagtg atggcaaact 6600ccgataacgt gctgcgtgcg ggtctgacgc ctaaatacat tgatattccg gaactggttg 6660ccaatgtgaa attcgaagcc aaaccggcta accagttgtt gacccagccg gtgaaacaag 6720gtgcagaact ggacttcccg attccagtgg atgattttgc cttctcgctg catgacctta 6780gtgataaaga aaccaccatt agccagcaga gtgccgccat tttgttctgc gtcgaaggcg 6840atgcaacgtt gtggaaaggt tctcagcagt tacagcttaa accgggtgaa tcagcgttta 6900ttgccgccaa cgaatcaccg gtgactgtca aaggccacgg ccgtttagcg cgtgtttaca 6960acaagctgta agagcttact gaaaaaatta acatctcttg ctaagctggg agctcgatcc 7020gtcgacctgc agatcgttca aacatttggc aataaagttt cttaagattg aatcctgttg 7080ccggtcttgc gatgattatc atataatttc tgttgaatta cgttaagcat gtaataatta 7140acatgtaatg catgacgtta tttatgagat gggtttttat gattagagtc ccgcaattat 7200acatttaata cgcgatagaa aacaaaatat agcgcgcaaa ctaggataaa ttatcgcgcg 7260cggtgtcatc tatgttacta gatctgctag ccctgcagga aatttaccgg tgcccgggcg 7320gccagcatgg ccgtatccgc aatgtgttat taagttgtct aagcgtcaat ttgtttacac 7380cacaatatat cctgccacca gccagccaac agctccccga ccggcagctc ggcacaaaat 7440caccactcga tacaggcagc ccatcagaat taattctcat gtttgacagc ttatcatcga 7500ctgcacggtg caccaatgct tctggcgtca ggcagccatc ggaagctgtg gtatggctgt 7560gcaggtcgta aatcactgca taattcgtgt cgctcaaggc gcactcccgt tctggataat 7620gttttttgcg ccgacatcat aacggttctg gcaaatattc tgaaatgagc tgttgacaat 7680taatcatccg gctcgtataa tgtgtggaat tgtgagcgga taacaatttc acacaggaaa 7740cagaccatga gggaagcgtt gatcgccgaa gtatcgactc aactatcaga ggtagttggc 7800gtcatcgagc gccatctcga accgacgttg ctggccgtac atttgtacgg ctccgcagtg 7860gatggcggcc tgaagccaca cagtgatatt gatttgctgg ttacggtgac cgtaaggctt 7920gatgaaacaa cgcggcgagc tttgatcaac gaccttttgg aaacttcggc ttcccctgga 7980gagagcgaga ttctccgcgc tgtagaagtc accattgttg tgcacgacga catcattccg 8040tggcgttatc cagctaagcg cgaactgcaa tttggagaat ggcagcgcaa tgacattctt 8100gcaggtatct tcgagccagc cacgatcgac attgatctgg ctatcttgct gacaaaagca 8160agagaacata gcgttgcctt ggtaggtcca gcggcggagg aactctttga tccggttcct 8220gaacaggatc tatttgaggc gctaaatgaa accttaacgc tatggaactc gccgcccgac 8280tgggctggcg atgagcgaaa tgtagtgctt acgttgtccc gcatttggta cagcgcagta 8340accggcaaaa tcgcgccgaa ggatgtcgct gccgactggg caatggagcg cctgccggcc 8400cagtatcagc ccgtcatact tgaagctagg caggcttatc ttggacaaga agatcgcttg 8460gcctcgcgcg cagatcagtt ggaagaattt gttcactacg tgaaaggcga gatcaccaaa 8520gtagtcggca aataaagctc tagtggatct ccgtaccccc gggggatctg gctcgcggcg 8580gacgcacgac gccggggcga gaccataggc gatctcctaa atcaatagta gctgtaacct 8640cgaagcgttt cacttgtaac aacgattgag aatttttgtc ataaaattga aatacttggt 8700tcgcattttt gtcatccgcg gtcagccgca attctgacga actgcccatt tagctggaga 8760tgattgtaca tccttcacgt gaaaatttct caagcgctgt gaacaagggt tcagatttta 8820gattgaaagg tgagccgttg aaacacgttc ttcttgtcga tgacgacgtc gctatgcggc 8880atcttattat tgaatacctt acgatccacg ccttcaaagt gaccgcggta gccgacagca 8940cccagttcac aagagtactc tcttccgcga cggtcgatgt cgtggttgtt gatctaaatt 9000taggtcgtga agatgggctc gagatcgttc gtaatctggc ggcaaagtct gatattccaa 9060tcataattat cagtggcgac cgccttgagg agacggataa agttgttgca ctcgagctag 9120gagcaagtga ttttatcgct aagccgttca gtatcagaga gtttctagca cgcattcggg 9180ttgccttgcg cgtgcgcccc aacgttgtcc gctccaaaga ccgacggtct ttttgtttta 9240ctgactggac acttaatctc aggcaacgtc gcttgatgtc cgaagctggc ggtgaggtga 9300aacttacggc aggtgagttc aatcttctcc tcgcgttttt agagaaaccc cgcgacgttc 9360tatcgcgcga gcaacttctc attgccagtc gagtacgcga cgaggaggtt tatgacagga 9420gtatagatgt tctcattttg aggctgcgcc gcaaacttga ggcagatccg tcaagccctc 9480aactgataaa aacagcaaga ggtgccggtt atttctttga cgcggacgtg caggtttcgc 9540acggggggac gatggcagcc tgagccaatt cccagatccc cgaggaatcg gcgtgagcgg 9600tcgcaaacca tccggcccgg tacaaatcgg cgcggcgctg ggtgatgacc tggtggagaa 9660gttgaaggcc gcgcaggccg cccagcggca acgcatcgag gcagaagcac gccccggtga 9720atcgtggcaa gcggccgctg atcgaatccg caaagaatcc cggcaaccgc cggcagccgg 9780tgcgccgtcg attaggaagc cgcccaaggg cgacgagcaa ccagattttt tcgttccgat 9840gctctatgac gtgggcaccc gcgatagtcg cagcatcatg gacgtggccg ttttccgtct 9900gtcgaagcgt gaccgacgag ctggcgaggt gatccgctac gagcttccag acgggcacgt 9960agaggtttcc gcagggccgg ccggcatggc cagtgtgtgg gattacgacc tggtactgat 10020ggcggtttcc catctaaccg aatccatgaa ccgataccgg gaagggaagg gagacaagcc 10080cggccgcgtg ttccgtccac acgttgcgga cgtactcaag ttctgccggc gagccgatgg 10140cggaaagcag aaagacgacc tggtagaaac ctgcattcgg ttaaacacca cgcacgttgc 10200catgcagcgt acgaagaagg ccaagaacgg ccgcctggtg acggtatccg agggtgaagc 10260cttgattagc cgctacaaga tcgtaaagag cgaaaccggg cggccggagt acatcgagat 10320cgagctagct gattggatgt accgcgagat cacagaaggc aagaacccgg acgtgctgac 10380ggttcacccc gattactttt tgatcgatcc cggcatcggc cgttttctct accgcctggc 10440acgccgcgcc gcaggcaagg cagaagccag atggttgttc aagacgatct acgaacgcag 10500tggcagcgcc ggagagttca agaagttctg tttcaccgtg cgcaagctga tcgggtcaaa 10560tgacctgccg gagtacgatt tgaaggagga ggcggggcag gctggcccga tcctagtcat 10620gcgctaccgc aacctgatcg agggcgaagc atccgccggt tcctaatgta cggagcagat 10680gctagggcaa attgccctag caggggaaaa aggtcgaaaa ggtctctttc ctgtggatag 10740cacgtacatt gggaacccaa agccgtacat tgggaaccgg aacccgtaca ttgggaaccc 10800aaagccgtac attgggaacc ggtcacacat gtaagtgact gatataaaag agaaaaaagg 10860cgatttttcc gcctaaaact ctttaaaact tattaaaact cttaaaaccc gcctggcctg 10920tgcataactg tctggccagc gcacagccga agagctgcaa aaagcgccta cccttcggtc 10980gctgcgctcc ctacgccccg ccgcttcgcg tcggcctatc gcggccgctg gccgctcaaa 11040aatggctggc ctacggccag gcaatctacc agggcgcgga caagccgcgc cgtcgccact 11100cgaccgccgg cgctgaggtc tgcctcgtga agaaggtgtt gctgactcat accaggcctg 11160aatcgcccca tcatccagcc agaaagtgag ggagccacgg ttgatgagag ctttgttgta 11220ggtggaccag ttggtgattt tgaacttttg ctttgccacg gaacggtctg cgttgtcggg 11280aagatgcgtg atctgatcct tcaactcagc aaaagttcga tttattcaac aaagccgccg 11340tcccgtcaag tcagcgtaat gctctgccag tgttacaacc aattaaccaa ttctgattag 11400aaaaactcat cgagcatcaa atgaaactgc aatttattca tatcaggatt atcaatacca 11460tatttttgaa aaagccgttt ctgtaatgaa ggagaaaact caccgaggca gttccatagg 11520atggcaagat cctggtatcg gtctgcgatt ccgactcgtc caacatcaat acaacctatt 11580aatttcccct cgtcaaaaat aaggttatca agtgagaaat caccatgagt gacgactgaa 11640tccggtgaga atggcaaaag ctctgcatta atgaatcggc caacgcgcgg ggagaggcgg 11700tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 11760gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 11820ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 11880ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 11940acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 12000tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 12060ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 12120ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 12180ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 12240actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 12300gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 12360tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 12420caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 12480atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 12540acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttgat 12600ccggaattaa ttcctgtggt tggcatgcac atacaaatgg acgaacggat aaaccttttc 12660acgccctttt aaatatccga ttattctaat aaacgctctt ttctcttagg tttacccgcc 12720aatatatcct gtcaaacact gatagtttaa actgaaggcg ggaaacgaca atctgatcat 12780gagcggagaa ttaagggagt cacgttatga cccccgccga tgacgcggga caagccgttt 12840tacgtttgga actgacagaa ccgcaacgct gcaggaattg gccgcagcgg ccatttaaat 12900caattgggcg cgccgaattc gagctcggta caagcttgca catgacaaca attgtaagag 12960gatggagacc acaacgatcc aacaatactt ctgcgacggg ctgtgaagta tagagaagtt 13020aaacgcccaa aagccattgt gtttggaatt tttagttatt ctatttttca tgatgtatct 13080tcctctaaca tgccttaatt tgcaaatttg gtataactac tgattgaaaa tatatgtatg 13140taaaaaaata ctaagcatat ttgtgaagct aaacatgatg ttatttaaga aaatatgttg 13200ttaacagaat aagattaata tcgaaatgga aacatctgta aattagaatc atcttacaag 13260ctaagagatg ttcacgcttt gagaaacttc ttcagatcat gaccgtagaa gtagctctcc 13320aagactcaac gaaggctgct gcaattccac aaatgcatga catgcatcct tgtaaccgtc 13380gtcgccgcta taaacacgga taactcaatt ccctgctcca tcaatttaga aatgagcaag 13440caagcacccg atcgctcacc ccatatgcac caatctgact cccaagtctc tgtttcgcat 13500tagtaccgcc agcactccac ctatagctac caattgagac ctttccagcc taagcagatc 13560gattgatcgt tagagtcaaa gagttggtgg tacgggtact ttaactacca tggaatgatg 13620gggcgtgatg tagagcggaa agcgcctccc tacgcggaac aacaccctcg ccatgccgct 13680cgactacagc ctcctcctcg tcggccgccc acaacgaggg agcccgtggt cgcagccacc 13740gaccagcatg tctctgtgtc ctcgtccgac ctcgacatgt catggcaaac agtcggacgc 13800cagcaccaga ctgacgacat gagtctctga agagcccgcc acctagaaag atccgagccc 13860tgctgctggt agtggtaacc attttcgtcg cgctgacgcg gagagcgaga ggccagaaat 13920ttatagcgac tgacgctgtg gcaggcacgc tatcggaggt tacgacgtgg cgggtcactc 13980gacgcggagt tcacaggtcc tatccttgca tcgctcgggc cggagtttac gggacttatc 14040cttacgacgt gctctaaggt tgcgataacg ggcggaggaa ggcgtgtggc gtgcggagac 14100ggtttataca cgtagtgtgc gggagtgtgt ttcgtagacg cgggaaagca cgacgactta 14160cgaaggttag tggaggagga ggacacacta aaatcaggac gcaagaaact cttctattat 14220agtagtagag aagagattat aggagtgtgg gttgattcta aagaaaatcg acgcaggaca 14280accgtcaaaa cgggtgcttt aatatagtag atatatatat atagagagag agagaaagta 14340caaaggatgc atttgtgtct gcatatgatc ggagtattac taacggccgt cgtaagaagg 14400tccatcatgc gtggagcgag cccatttggt tggttgtcag gccgcagtta aggcctccat 14460atatgattgt cgtcgggccc ataacagcat ctcctccacc agtttattgt aagaataaat 14520taagtagaga tatttgtcgt cgggcagaag aaacttggac aagaagaaga agcaagctag 14580gccaatttct tgccggcaag aggaagatag tggcctctag tttatatatc ggcgtgatga 14640tgatgctcct agctagaaat gagagaagaa aaacggacgc gtgtttggtg tgtgtcaatg 14700gcgtccatcc ttccatcaga tcagaacgat gaaaaagtca agcacggcat gcatagtata 14760tgtatagctt gttttagtgt ggctttgctg agacgaatga aagcaacggc gggcatattt 14820ttcagtggct gtagctttca ggctgaaaga gacgtggcat gcaataattc agggaattcg 14880tcagccaatt gaggtagcta gtcaacttgt acattggtgc gagcaatttt ccgcactcag 14940gagggctagt ttgagagtcc aaaaactata ggagattaaa gaggctaaaa tcctctcctt 15000atttaatttt aaataagtag tgtatttgta ttttaactcc tccaaccctt ccgattttat 15060ggctctcaaa ctagcattca gtctaatgca tgcatgcttg gctagaggtc gtatggggtt 15120gttaatagca tagctagcta caagttaacc gggtctttta tatttaataa ggacaggcaa 15180agtattactt acaaataaag aataaagcta ggacgaactc gtggattatt actaaatcga 15240aatggacgta atattccagg caagaataat tgttcgatca ggagacaagt ggggcattgg 15300accggttctt gcaagcaaga gcctatggcg tggtgacacg gcgcgttgcc catacatcat 15360gcctccatcg atgatccatc ctcacttgct ataaaaagag gtgtccatgg tgctcaagct 15420cagccaagca aataagacga cttgtttcat tgattcttca agagatcgag cttcttttgc 15480accacaaggt cgaggatcca aca 15503<210>15<211>14946<212>DNA<213>人工序列<220><223>人工序列说明:pNOV1313<220><221>misc_feature<222>(12)..(1993)<223>Zm Ubi启动子<220><221>misc_feature<222>(2016)..(5597)<223>编码H04毒素部分加全长Cry1Ab尾部分的合成核苷酸序列<220><221>misc_feature<222>(5805)..(7786)<223>Zm Ubi启动子<220><221>misc_feature<222>(7883)..(8986)<223>PMI<400>15 aagcttgcat gcctgcagtg cagcgtgacc cggtcgtgcc cctctctaga gataatgagc 60attgcatgtc taagttataa aaaattacca catatttttt ttgtcacact tgtttgaagt 120gcagtttatc tatctttata catatattta aactttactc tacgaataat ataatctata 180gtactacaat aatatcagtg ttttagagaa tcatataaat gaacagttag acatggtcta 240aaggacaatt gagtattttg acaacaggac tctacagttt tatcttttta gtgtgcatgt 300gttctccttt ttttttgcaa atagcttcac ctatataata cttcatccat tttattagta 360catccattta gggtttaggg ttaatggttt ttatagacta atttttttag tacatctatt 420ttattctatt ttagcctcta aattaagaaa actaaaactc tattttagtt tttttattta 480ataatttaga tataaaatag aataaaataa agtgactaaa aattaaacaa atacccttta 540agaaattaaa aaaactaagg aaacattttt cttgtttcga gtagataatg ccagcctgtt 600aaacgccgtc gacgagtcta acggacacca accagcgaac cagcagcgtc gcgtcgggcc 660aagcgaagca gacggcacgg catctctgtc gctgcctctg gacccctctc gagagttccg 720ctccaccgtt ggacttgctc cgctgtcggc atccagaaat tgcgtggcgg agcggcagac 780gtgagccggc acggcaggcg gcctcctcct cctctcacgg caccggcagc tacgggggat 840tcctttccca ccgctccttc gctttccctt cctcgcccgc cgtaataaat agacaccccc 900tccacaccct ctttccccaa cctcgtgttg ttcggagcgc acacacacac aaccagatct 960cccccaaatc cacccgtcgg cacctccgct tcaaggtacg ccgctcgtcc tccccccccc 1020cccctctcta ccttctctag atcggcgttc cggtccatgg ttagggcccg gtagttctac 1080ttctgttcat gtttgtgtta gatccgtgtt tgtgttagat ccgtgctgct agcgttcgta 1140cacggatgcg acctgtacgt cagacacgtt ctgattgcta acttgccagt gtttctcttt 1200ggggaatcct gggatggctc tagccgttcc gcagacggga tcgatttcat gatttttttt 1260gtttcgttgc atagggtttg gtttgccctt ttcctttatt tcaatatatg ccgtgcactt 1320gtttgtcggg tcatcttttc atgctttttt ttgtcttggt tgtgatgatg tggtctggtt 1380gggcggtcgt tctagatcgg agtagaattc tgtttcaaac tacctggtgg atttattaat 1440tttggatctg tatgtgtgtg ccatacatat tcatagttac gaattgaaga tgatggatgg 1500aaatatcgat ctaggatagg tatacatgtt gatgcgggtt ttactgatgc atatacagag 1560atgctttttg ttcgcttggt tgtgatgatg tggtgtggtt gggcggtcgt tcattcgttc 1620tagatcggag tagaatactg tttcaaacta cctggtgtat ttattaattt tggaactgta 1680tgtgtgtgtc atacatcttc atagttacga gtttaagatg gatggaaata tcgatctagg 1740ataggtatac atgttgatgt gggttttact gatgcatata catgatggca tatgcagcat 1800ctattcatat gctctaacct tgagtaccta tctattataa taaacaagta tgttttataa 1860ttattttgat cttgatatac ttggatgatg gcatatgcag cagctatatg tggatttttt 1920tagccctgcc ttcatacgct atttatttgc ttggtactgt ttcttttgtc gatgctcacc 1980ctgttgtttg gtgttacttc tgcagggatc caacaatgga caacaacccc aacatcaacg 2040agtgcatccc ctacaactgc ctgagcaacc ccgaggtgga ggtgctgggc ggcgagcgca 2100tcgagaccgg ctacaccccc atcgacatca gcctgagcct gacccagttc ctgctgagcg 2160agttcgtgcc cggcgccggc ttcgtgctgg gcctggtgga catcatctgg ggcatcttcg 2220gccccagcca gtgggacgcc ttcctggtgc agatcgagca gttgataaac caacgcatag 2280aggaattcgc ccgcaaccag gccatcagcc gcctggaggg cctgagcaac ctgtaccaaa 2340tctacgccga gagcttccgc gagtgggagg ccgaccccac caaccccgcc ctgcgcgagg 2400agatgcgcat ccagttcaac gacatgaaca gcgccctgac caccgccatc cccctgttcg 2460ccgtgcagaa ctaccaggtg cccctgctga gcgtgtacgt gcaggccgcc aacctgcacc 2520tgagcgtgct gcgcgacgtc agcgtgttcg gccagcgctg gggcttcgac gccgccacca 2580tcaacagccg ctacaacgac ctgacccgcc tgatcggcaa ctacaccgac cacgccgtgc 2640gctggtacaa caccggcctg gagcgcgtgt ggggtcccga cagccgcgac tggatcaggt 2700acaaccagtt ccgccgcgag ctgaccctga ccgtgctgga catcgtgagc ctgttcccca 2760actacgacag ccgcacctac cccatccgca ccgtgagcca gctgacccgc gagatttaca 2820ccaaccccgt gctggagaac ttcgacggca gcttccgcgg cagcgcccag ggcatcgagg 2880gcagcatccg cagcccccac ctgatggaca tcctgaacag catcaccatc tacaccgacg 2940cccaccgcgg cgagtactac tggagcggcc accagatcat ggccagcccc gtcggcttca 3000gcggccccga gttcaccttc cccctgtacg gcaccatggg caacgctgca cctcagcagc 3060gcatcgtggc acagctgggc cagggagtgt accgcaccct gagcagcacc ctgtaccgtc 3120gacctttcaa catcggcatc aacaaccagc agctgagcgt gctggacggc accgagttcg 3180cctacggcac cagcagcaac ctgcccagcg ccgtgtaccg caagagcggc accgtggaca 3240gcctggacga gatcccccct cagaacaaca acgtgccacc tcgacagggc ttcagccacc 3300gtctgagcca cgtgagcatg ttccgcagtg gcttcagcaa cagcagcgtg agcatcatcc 3360gtgcacccat gttcagctgg attcaccgca gcgccaccct gaccaacacc atcgaccccg 3420agcgcatcaa ccagatcccc ctggtgaagg gcttccgggt gtggggcggc accagcgtga 3480tcaccggccc cggcttcacc ggaggcgaca tcctgcgcag aaacaccttc ggcgacttcg 3540tgagcctgca ggtgaacatc aacagcccca tcacccagcg ttaccgcctg cgcttccgct 3600acgccagcag ccgcgacgcc cgtgtgatcg tgctgactgg cgccgctagc accggtgtgg 3660gcggtcaggt gagcgtgaac atgcccctgc agaagactat ggagatcggc gagaacctga 3720ctagtcgcac cttccgctac accgacttca gcaacccctt cagcttccgc gccaaccccg 3780acatcatcgg catcagcgag cagcccctgt tcggtgccgg cagcatcagc agcggcgagc 3840tgtacatcga caagatcgag atcatcctgg ccgacgccac cttcgaggcc gagagcgacc 3900tggagcgcgc ccagaaggcc gtgaacgccc tgttcaccag cagcaaccag atcggcctga 3960agaccgacgt gaccgactac cacatcgacc aggtgagcaa cctggtggac tgcttaagcg 4020acgagttctg cctggacgag aagaaggagc tgagcgagaa ggtgaagcac gccaagcgcc 4080tgagcgacga gcgcaacctg ctgcaggacc ccaacttccg cggcatcaac cgccagctgg 4140accgcggctg gcgaggcagc accgatatca ccatccaggg cggcgacgac gtgttcaagg 4200agaactacgt gaccctgcag ggcaccttcg acgagtgcta ccccacctac ctgtaccagc 4260cgatcgacga gagcaagctg aaggcctaca cccgctacca gctgcgcggc tacatcgagg 4320acagccagga cctggaaatc tacctgatcc gctacaacgc gaagcacgag accgtgaacg 4380tgcccggcac cggcagcctg tggcccctga gcgcccccag ccccatcggc aagtgcgggg 4440agccgaatcg atgcgctccg cacctggagt ggaacccgga cctagactgc agctgcaggg 4500acggggagaa gtgcgcccac cacagccacc acttcagcct ggacatcgac gtgggctgca 4560ccgacctgaa cgaggacctg ggcgtgtggg tgatcttcaa gatcaagacc caggacggcc 4620acgcccgcct gggcaatcta gagttcctgg aggagaagcc cctggtgggc gaggccctgg 4680cccgcgtgaa gcgtgctgag aagaagtggc gcgacaagcg cgagaagctg gagtgggaga 4740ccaacatcgt gtacaaggag gccaaggaga gcgtggacgc cctgttcgtg aacagccagt 4800acgaccgcct gcaggccgac accaacatcg ccatgatcca cgccgccgac aagcgcgtgc 4860acagcattcg cgaggcctac ctgcccgagc tgagcgtgat ccccggtgtg aacgccgcca 4920tcttcgagga actcgagggc cgcatcttca ccgccttcag cctgtacgac gcccgcaacg 4980tgatcaagaa cggcgacttc aacaacggcc tgagctgctg gaacgtgaag ggccacgtgg 5040acgtggagga gcagaacaac caccgcagcg tgctggtggt gcccgagtgg gaggccgagg 5100tgagccagga ggtgcgcgtg tgccccggcc gcggctacat cctgcgcgtg accgcctaca 5160aggagggcta cggcgagggc tgcgtgacca tccacgagat cgagaacaac accgacgagc 5220tcaagttcag caactgcgtg gaggaggagg tttaccccaa caacaccgtg acctgcaacg 5280actacaccgc gacccaggag gagtacgaag gcacctacac ctctcgcaac aggggttacg 5340acggcgccta cgagtccaac agctccgtgc cagctgacta cgccagcgcc tacgaggaga 5400aagcctacac cgacggtaga cgcgacaacc catgtgagag caacagaggc tacggcgact 5460acacccccct gcccgctgga tacgtgacca aggagctgga gtacttcccc gagaccgaca 5520aggtgtggat cgagattggc gagaccgagg gcaccttcat cgtggacagc gtggagctgc 5580tgctgatgga ggagtagtag atctgttctg cacaaagtgg agtagtcagt catcgatcag 5640gaaccagaca ccagactttt attcatacag tgaagtgaag tgaagtgcag tgcagtgagt 5700tgctggtttt tgtacaactt agtatgtatt tgtatttgta aaatacttct atcaataaaa 5760tttctaattc ctaaaaccaa aatccagggg taccagcttg catgcctgca gtgcagcgtg 5820acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta taaaaaatta 5880ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt atacatatat 5940ttaaacttta ctctacgaat aatataatct atagtactac aataatatca gtgttttaga 6000gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt ttgacaacag 6060gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg caaatagctt 6120cacctatata atacttcatc cattttatta gtacatccat ttagggttta gggttaatgg 6180tttttataga ctaatttttt tagtacatct attttattct attttagcct ctaaattaag 6240aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa tagaataaaa 6300taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta aggaaacatt 6360tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt ctaacggaca 6420ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca cggcatctct 6480gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg ctccgctgtc 6540ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag gcggcctcct 6600cctcctctca cggcaccggc agctacgggg gattcctttc ccaccgctcc ttcgctttcc 6660cttcctcgcc cgccgtaata aatagacacc ccctccacac cctctttccc caacctcgtg 6720ttgttcggag cgcacacaca cacaaccaga tctcccccaa atccacccgt cggcacctcc 6780gcttcaaggt acgccgctcg tcctcccccc ccccccctct ctaccttctc tagatcggcg 6840ttccggtcca tggttagggc ccggtagttc tacttctgtt catgtttgtg ttagatccgt 6900gtttgtgtta gatccgtgct gctagcgttc gtacacggat gcgacctgta cgtcagacac 6960gttctgattg ctaacttgcc agtgtttctc tttggggaat cctgggatgg ctctagccgt 7020tccgcagacg ggatcgattt catgattttt tttgtttcgt tgcatagggt ttggtttgcc 7080cttttccttt atttcaatat atgccgtgca cttgtttgtc gggtcatctt ttcatgcttt 7140tttttgtctt ggttgtgatg atgtggtctg gttgggcggt cgttctagat cggagtagaa 7200ttctgtttca aactacctgg tggatttatt aattttggat ctgtatgtgt gtgccataca 7260tattcatagt tacgaattga agatgatgga tggaaatatc gatctaggat aggtatacat 7320gttgatgcgg gttttactga tgcatataca gagatgcttt ttgttcgctt ggttgtgatg 7380atgtggtgtg gttgggcggt cgttcattcg ttctagatcg gagtagaata ctgtttcaaa 7440ctacctggtg tatttattaa ttttggaact gtatgtgtgt gtcatacatc ttcatagtta 7500cgagtttaag atggatggaa atatcgatct aggataggta tacatgttga tgtgggtttt 7560actgatgcat atacatgatg gcatatgcag catctattca tatgctctaa ccttgagtac 7620ctatctatta taataaacaa gtatgtttta taattatttt gatcttgata tacttggatg 7680atggcatatg cagcagctat atgtggattt ttttagccct gccttcatac gctatttatt 7740tgcttggtac tgtttctttt gtcgatgctc accctgttgt ttggtgttac ttctgcaggg 7800atccccgatc atgcaaaaac tcattaactc agtgcaaaac tatgcctggg gcagcaaaac 7860ggcgttgact gaactttatg gtatggaaaa tccgtccagc cagccgatgg ccgagctgtg 7920gatgggcgca catccgaaaa gcagttcacg agtgcagaat gccgccggag atatcgtttc 7980actgcgtgat gtgattgaga gtgataaatc gactctgctc ggagaggccg ttgccaaacg 8040ctttggcgaa ctgcctttcc tgttcaaagt attatgcgca gcacagccac tctccattca 8100ggttcatcca aacaaacaca attctgaaat cggttttgcc aaagaaaatg ccgcaggtat 8160cccgatggat gccgccgagc gtaactataa agatcctaac cacaagccgg agctggtttt 8220tgcgctgacg cctttccttg cgatgaacgc gtttcgtgaa ttttccgaga ttgtctccct 8280actccagccg gtcgcaggtg cacatccggc gattgctcac tttttacaac agcctgatgc 8340cgaacgttta agcgaactgt tcgccagcct gttgaatatg cagggtgaag aaaaatcccg 8400cgcgctggcg attttaaaat cggccctcga tagccagcag ggtgaaccgt ggcaaacgat 8460tcgtttaatt tctgaatttt acccggaaga cagcggtctg ttctccccgc tattgctgaa 8520tgtggtgaaa ttgaaccctg gcgaagcgat gttcctgttc gctgaaacac cgcacgctta 8580cctgcaaggc gtggcgctgg aagtgatggc aaactccgat aacgtgctgc gtgcgggtct 8640gacgcctaaa tacattgata ttccggaact ggttgccaat gtgaaattcg aagccaaacc 8700ggctaaccag ttgttgaccc agccggtgaa acaaggtgca gaactggact tcccgattcc 8760agtggatgat tttgccttct cgctgcatga ccttagtgat aaagaaacca ccattagcca 8820gcagagtgcc gccattttgt tctgcgtcga aggcgatgca acgttgtgga aaggttctca 8880gcagttacag cttaaaccgg gtgaatcagc gtttattgcc gccaacgaat caccggtgac 8940tgtcaaaggc cacggccgtt tagcgcgtgt ttacaacaag ctgtaagagc ttactgaaaa 9000aattaacatc tcttgctaag ctgggagctc gatccgtcga cctgcagatc gttcaaacat 9060ttggcaataa agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata 9120atttctgttg aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat 9180gagatgggtt tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa 9240aatatagcgc gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagatct 9300gctagccctg caggaaattt accggtgccc gggcggccag catggccgta tccgcaatgt 9360gttattaagt tgtctaagcg tcaatttgtt tacaccacaa tatatcctgc caccagccag 9420ccaacagctc cccgaccggc agctcggcac aaaatcacca ctcgatacag gcagcccatc 9480agaattaatt ctcatgtttg acagcttatc atcgactgca cggtgcacca atgcttctgg 9540cgtcaggcag ccatcggaag ctgtggtatg gctgtgcagg tcgtaaatca ctgcataatt 9600cgtgtcgctc aaggcgcact cccgttctgg ataatgtttt ttgcgccgac atcataacgg 9660ttctggcaaa tattctgaaa tgagctgttg acaattaatc atccggctcg tataatgtgt 9720ggaattgtga gcggataaca atttcacaca ggaaacagac catgagggaa gcgttgatcg 9780ccgaagtatc gactcaacta tcagaggtag ttggcgtcat cgagcgccat ctcgaaccga 9840cgttgctggc cgtacatttg tacggctccg cagtggatgg cggcctgaag ccacacagtg 9900atattgattt gctggttacg gtgaccgtaa ggcttgatga aacaacgcgg cgagctttga 9960tcaacgacct tttggaaact tcggcttccc ctggagagag cgagattctc cgcgctgtag 10020aagtcaccat tgttgtgcac gacgacatca ttccgtggcg ttatccagct aagcgcgaac 10080tgcaatttgg agaatggcag cgcaatgaca ttcttgcagg tatcttcgag ccagccacga 10140tcgacattga tctggctatc ttgctgacaa aagcaagaga acatagcgtt gccttggtag 10200gtccagcggc ggaggaactc tttgatccgg ttcctgaaca ggatctattt gaggcgctaa 10260atgaaacctt aacgctatgg aactcgccgc ccgactgggc tggcgatgag cgaaatgtag 10320tgcttacgtt gtcccgcatt tggtacagcg cagtaaccgg caaaatcgcg ccgaaggatg 10380tcgctgccga ctgggcaatg gagcgcctgc cggcccagta tcagcccgtc atacttgaag 10440ctaggcaggc ttatcttgga caagaagatc gcttggcctc gcgcgcagat cagttggaag 10500aatttgttca ctacgtgaaa ggcgagatca ccaaagtagt cggcaaataa agctctagtg 10560gatctccgta cccccggggg atctggctcg cggcggacgc acgacgccgg ggcgagacca 10620taggcgatct cctaaatcaa tagtagctgt aacctcgaag cgtttcactt gtaacaacga 10680ttgagaattt ttgtcataaa attgaaatac ttggttcgca tttttgtcat ccgcggtcag 10740ccgcaattct gacgaactgc ccatttagct ggagatgatt gtacatcctt cacgtgaaaa 10800tttctcaagc gctgtgaaca agggttcaga ttttagattg aaaggtgagc cgttgaaaca 10860cgttcttctt gtcgatgacg acgtcgctat gcggcatctt attattgaat accttacgat 10920ccacgccttc aaagtgaccg cggtagccga cagcacccag ttcacaagag tactctcttc 10980cgcgacggtc gatgtcgtgg ttgttgatct aaatttaggt cgtgaagatg ggctcgagat 11040cgttcgtaat ctggcggcaa agtctgatat tccaatcata attatcagtg gcgaccgcct 11100tgaggagacg gataaagttg ttgcactcga gctaggagca agtgatttta tcgctaagcc 11160gttcagtatc agagagtttc tagcacgcat tcgggttgcc ttgcgcgtgc gccccaacgt 11220tgtccgctcc aaagaccgac ggtctttttg ttttactgac tggacactta atctcaggca 11280acgtcgcttg atgtccgaag ctggcggtga ggtgaaactt acggcaggtg agttcaatct 11340tctcctcgcg tttttagaga aaccccgcga cgttctatcg cgcgagcaac ttctcattgc 11400cagtcgagta cgcgacgagg aggtttatga caggagtata gatgttctca ttttgaggct 11460gcgccgcaaa cttgaggcag atccgtcaag ccctcaactg ataaaaacag caagaggtgc 11520cggttatttc tttgacgcgg acgtgcaggt ttcgcacggg gggacgatgg cagcctgagc 11580caattcccag atccccgagg aatcggcgtg agcggtcgca aaccatccgg cccggtacaa 11640atcggcgcgg cgctgggtga tgacctggtg gagaagttga aggccgcgca ggccgcccag 11700cggcaacgca tcgaggcaga agcacgcccc ggtgaatcgt ggcaagcggc cgctgatcga 11760atccgcaaag aatcccggca accgccggca gccggtgcgc cgtcgattag gaagccgccc 11820aagggcgacg agcaaccaga ttttttcgtt ccgatgctct atgacgtggg cacccgcgat 11880agtcgcagca tcatggacgt ggccgttttc cgtctgtcga agcgtgaccg acgagctggc 11940gaggtgatcc gctacgagct tccagacggg cacgtagagg tttccgcagg gccggccggc 12000atggccagtg tgtgggatta cgacctggta ctgatggcgg tttcccatct aaccgaatcc 12060atgaaccgat accgggaagg gaagggagac aagcccggcc gcgtgttccg tccacacgtt 12120gcggacgtac tcaagttctg ccggcgagcc gatggcggaa agcagaaaga cgacctggta 12180gaaacctgca ttcggttaaa caccacgcac gttgccatgc agcgtacgaa gaaggccaag 12240aacggccgcc tggtgacggt atccgagggt gaagccttga ttagccgcta caagatcgta 12300aagagcgaaa ccgggcggcc ggagtacatc gagatcgagc tagctgattg gatgtaccgc 12360gagatcacag aaggcaagaa cccggacgtg ctgacggttc accccgatta ctttttgatc 12420gatcccggca tcggccgttt tctctaccgc ctggcacgcc gcgccgcagg caaggcagaa 12480gccagatggt tgttcaagac gatctacgaa cgcagtggca gcgccggaga gttcaagaag 12540ttctgtttca ccgtgcgcaa gctgatcggg tcaaatgacc tgccggagta cgatttgaag 12600gaggaggcgg ggcaggctgg cccgatccta gtcatgcgct accgcaacct gatcgagggc 12660gaagcatccg ccggttccta atgtacggag cagatgctag ggcaaattgc cctagcaggg 12720gaaaaaggtc gaaaaggtct ctttcctgtg gatagcacgt acattgggaa cccaaagccg 12780tacattggga accggaaccc gtacattggg aacccaaagc cgtacattgg gaaccggtca 12840cacatgtaag tgactgatat aaaagagaaa aaaggcgatt tttccgccta aaactcttta 12900aaacttatta aaactcttaa aacccgcctg gcctgtgcat aactgtctgg ccagcgcaca 12960gccgaagagc tgcaaaaagc gcctaccctt cggtcgctgc gctccctacg ccccgccgct 13020tcgcgtcggc ctatcgcggc cgctggccgc tcaaaaatgg ctggcctacg gccaggcaat 13080ctaccagggc gcggacaagc cgcgccgtcg ccactcgacc gccggcgctg aggtctgcct 13140cgtgaagaag gtgttgctga ctcataccag gcctgaatcg ccccatcatc cagccagaaa 13200gtgagggagc cacggttgat gagagctttg ttgtaggtgg accagttggt gattttgaac 13260ttttgctttg ccacggaacg gtctgcgttg tcgggaagat gcgtgatctg atccttcaac 13320tcagcaaaag ttcgatttat tcaacaaagc cgccgtcccg tcaagtcagc gtaatgctct 13380gccagtgtta caaccaatta accaattctg attagaaaaa ctcatcgagc atcaaatgaa 13440actgcaattt attcatatca ggattatcaa taccatattt ttgaaaaagc cgtttctgta 13500atgaaggaga aaactcaccg aggcagttcc ataggatggc aagatcctgg tatcggtctg 13560cgattccgac tcgtccaaca tcaatacaac ctattaattt cccctcgtca aaaataaggt 13620tatcaagtga gaaatcacca tgagtgacga ctgaatccgg tgagaatggc aaaagctctg 13680cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct 13740tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 13800tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 13860gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 13920aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 13980ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 14040gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 14100ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 14160ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 14220cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 14280attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 14340ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 14400aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 14460gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 14520tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 14580ttatcaaaaa ggatcttcac ctagatcctt ttgatccgga attaattcct gtggttggca 14640tgcacataca aatggacgaa cggataaacc ttttcacgcc cttttaaata tccgattatt 14700ctaataaacg ctcttttctc ttaggtttac ccgccaatat atcctgtcaa acactgatag 14760tttaaactga aggcgggaaa cgacaatctg atcatgagcg gagaattaag ggagtcacgt 14820tatgaccccc gccgatgacg cgggacaagc cgttttacgt ttggaactga cagaaccgca 14880acgctgcagg aattggccgc agcggccatt taaatcaatt gggcgcgccg aattcgagct 14940cggtac 14946<210>16<211>14603<212>DNA<213>人工序列<220><223>人工序列说明:pNOV1435<220><221>misc_feature<222>(1)..(2007)<223>编码H04毒素部分加cry1Ab尾头40个氨基酸的合成核苷酸序列<220><221>misc_feature<222>Complement((8814)..(10022))<223>PMI<220><221>misc_feature<222>(11142)..(12032)<223>玉米泛在蛋白启动子<220><221>misc_feature<222>(12037)..(14594)<223>MTL启动子<400>16atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg 120agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg 180gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc 240gagcagttga taaaccaacg catagaggaa ttcgcccgca accaggccat cagccgcctg 300gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac 360cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc 420ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg 480tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag 540cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc 600ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt 660cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg 720ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg 780agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc 840cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg 900aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag 960atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc 1020atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc 1080accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg 1140agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg 1200taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg 1260ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc 1320agcaacagca gcgtgagcat catccgtgca cccatgttca gctggattca ccgcagcgcc 1380accctgacca acaccatcga ccccgagcgc atcaaccaga tccccctggt gaagggcttc 1440cgggtgtggg gcggcaccag cgtgatcacc ggccccggct tcaccggagg cgacatcctg 1500cgcagaaaca ccttcggcga cttcgtgagc ctgcaggtga acatcaacag ccccatcacc 1560cagcgttacc gcctgcgctt ccgctacgcc agcagccgcg acgcccgtgt gatcgtgctg 1620actggcgccg ctagcaccgg tgtgggcggt caggtgagcg tgaacatgcc cctgcagaag 1680actatggaga tcggcgagaa cctgactagt cgcaccttcc gctacaccga cttcagcaac 1740cccttcagct tccgcgccaa ccccgacatc atcggcatca gcgagcagcc cctgttcggt 1800gccggcagca tcagcagcgg cgagctgtac atcgacaaga tcgagatcat cctggccgac 1860gccaccttcg aggccgagag cgacctggag cgcgcccaga aggccgtgaa cgccctgttc 1920accagcagca accagatcgg cctgaagacc gacgtgaccg actaccacat cgaccaggtg 1980agcaacctgg tggactgctt aagctagaga tctgttctgc acaaagtgga gtagtcagtc 2040atcgatcagg aaccagacac cagactttta ttcatacagt gaagtgaagt gaagtgcagt 2100gcagtgagtt gctggttttt gtaccactta gtatgtattt gtatttgtaa aatacttcta 2160tcaataaaat ttctaattcc taaaaccaaa atccagtggg taccagcttg ggctgagtgg 2220ctccttcaac gttgcggttc tgtcagttcc aaacgtaaaa cggcttgtcc cgcgtcatcg 2280gcgggggtca taacgtgact cccttaattc tccgctcatg atcagattgt cgtttcccgc 2340cttcagttta aactatcagt gtttgacagg atatattggc gggtaaacct aagagaaaag 2400agcgtttatt agaataacgg atatttaaaa gggcgtgaaa aggtttatcc gttcgtccat 2460ttgtatgtgc atgccaacca cagggttccc ctcgggagtg cttggcattc cgtacgataa 2520tgacttctgt tcaaccaccc aaacgtcgga aagcctgacg acggagcagc attccaaaaa 2580gatcccttgg ctcgtctggg tcggctagaa ggtcgagtgg gctgctgtgg cttgatccct 2640caacgcggtc gcggacgtag cgcagcgccg aaaaatcctc gatcgcaaat ccgacgctgt 2700cgaaaagcgt gatctgcttg tcgctctttc ggccgacgtc ctggccagtc atcacgcgcc 2760aaagttccgt cacaggatga tctggcgcga gttgctggat ctcgccttca atccgggtct 2820gtggcgggaa ctccacgaaa atatccgaac gcagcaagat cgtcgaccaa ttcttgaaga 2880cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 2940tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 3000taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 3060tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 3120gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 3180gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 3240cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 3300tgtggcgcgg tattatcccg tgttgacgcc gggcaagagc aactcggtcg ccgcatacac 3360tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 3420atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 3480ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 3540gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 3600gagcgtgaca ccacgatgcc tgcagggggg gggggggggg ggacatgagg ttgccccgta 3660ttcagtgtcg ctgatttgta ttgtctgaag ttgtttttac gttaagttga tgcagatcaa 3720ttaatacgat acctgcgtca taattgatta tttgacgtgg tttgatggcc tccacgcacg 3780ttgtgatatg tagatgataa tcattatcac tttacgggtc ctttccggtg atccgacagg 3840ttacggggcg gcgacctcgc gggttttcgc tatttatgaa aattttccgg tttaaggcgt 3900ttccgttctt cttcgtcata acttaatgtt tttatttaaa ataccctctg aaaagaaagg 3960aaacgacagg tgctgaaagc gaggcttttt ggcctctgtc gtttcctttc tctgtttttg 4020tccgtggaat gaacaatgga agtccccccc cccccccccc cctgcagcaa tggcaacaac 4080gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac aattaataga 4140ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg 4200gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact 4260ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac 4320tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta 4380actgtcagac caagtttact catatatact ttagattgat ttaaaacttc atttttaatt 4440taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga 4500gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc 4560tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 4620ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 4680gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc 4740tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 4800cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 4860gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 4920actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc 4980ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 5040gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg 5100atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt 5160tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc 5220tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg 5280aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga tgcggtattt 5340tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca gtacaatctg 5400ctctgatgcc gcatagttaa gccagtatac actccgctat cgctacgtga ctgggtcatg 5460gctgcgcccc gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg 5520gcatccgctt acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca 5580ccgtcatcac cgaaacgcgc gaggcagcag atcccccgat caagtagata cactacatat 5640atctacaata gacatcgagc cggaaggtga tgtttacttt cctgaaatcc ccagcaattt 5700taggccagtt tttacccaag acttcgcctc taacataaat tatagttacc aaatctggca 5760aaagggttaa caagtggcag caacggattc gcaaacctgt cacgcctttt gtgccaaaag 5820ccgcgccagg tttgcgatcc gctgtgccag gcgttaggcg tcatatgaag atttcggtga 5880tccctgagca ggtggcggaa acattggatg ctgagaacca tttcattgtt cgtgaagtgt 5940tcgatgtgca cctatccgac caaggctttg aactatctac cagaagtgtg agcccctacc 6000ggaaggatta catctcggat gatgactctg atgaagactc tgcttgctat ggcgcattca 6060tcgaccaaga gcttgtcggg aagattgaac tcaactcaac atggaacgat ctagcctcta 6120tcgaacacat tgttgtgtcg cacacgcacc gaggcaaagg agtcgcgcac agtctcatcg 6180aatttgcgaa aaagtgggca ctaagcagac agctccttgg catacgatta gagacacaaa 6240cgaacaatgt acctgcctgc aatttgtacg caaaatgtgg ctttactctc ggcggcattg 6300acctgttcac gtataaaact agacctcaag tctcgaacga aacagcgatg tactggtact 6360ggttctcggg agcacaggat gacgcctaac aattcattca agccgacacc gcttcgcggc 6420gcggcttaat tcaggagtta aacatcatga gggaagcggt gatcgccgaa gtatcgactc 6480aactatcaga ggtagttggc gtcatcgagc gccatctcga accgacgttg ctggccgtac 6540atttgtacgg ctccgcagtg gatggcggcc tgaagccaca cagtgatatt gatttgctgg 6600ttacggtgac cgtaaggctt gatgaaacaa cgcggcgagc tttgatcaac gaccttttgg 6660aaacttcggc ttcccctgga gagagcgaga ttctccgcgc tgtagaagtc accattgttg 6720tgcacgacga catcattccg tggcgttatc cagctaagcg cgaactgcaa tttggagaat 6780ggcagcgcaa tgacattctt gcaggtatct tcgagccagc cacgatcgac attgatctgg 6840ctatcttgct gacaaaagca agagaacata gcgttgcctt ggtaggtcca gcggcggagg 6900aactctttga tccggttcct gaacaggatc tatttgaggc gctaaatgaa accttaacgc 6960tatggaactc gccgcccgac tgggctggcg atgagcgaaa tgtagtgctt acgttgtccc 7020gcatttggta cagcgcagta accggcaaaa tcgcgccgaa ggatgtcgct gccgactggg 7080caatggagcg cctgccggcc cagtatcagc ccgtcatact tgaagctagg caggcttatc 7140ttggacaaga agatcgcttg gcctcgcgcg cagatcagtt ggaagaattt gttcactacg 7200tgaaaggcga gatcaccaag gtagtcggca aataatgtct aacaattcgt tcaagccgac 7260gccgcttcgc ggcgcggctt aactcaagcg ttagagagct ggggaagact atgcgcgatc 7320tgttgaaggt ggttctaagc ctcgtacttg cgatggcatc ggggcaggca cttgctgacc 7380tgccaattgt tttagtggat gaagctcgtc ttccctatga ctactcccca tccaactacg 7440acatttctcc aagcaactac gacaactcca taagcaatta cgacaatagt ccatcaaatt 7500acgacaactc tgagagcaac tacgataata gttcatccaa ttacgacaat agtcgcaacg 7560gaaatcgtag gcttatatat agcgcaaatg ggtctcgcac tttcgccggc tactacgtca 7620ttgccaacaa tgggacaacg aacttctttt ccacatctgg caaaaggatg ttctacaccc 7680caaaaggggg gcgcggcgtc tatggcggca aagatgggag cttctgcggg gcattggtcg 7740tcataaatgg ccaattttcg cttgccctga cagataacgg cctgaagatc atgtatctaa 7800gcaactagcc tgctctctaa taaaatgtta ggcctcaaca tctagtcgca agctgagggg 7860aaccactagt gtcatacgaa cctccaagag acggttacac aaacgggtac attgttgatg 7920tcatgtatga caatcgccca agtaagtatc cagctgtgtt cagaacgtac gtccgaatta 7980attcatcggg gtacggtcga cgatcgtcaa cgttcacttc taaagaaata gcgccactca 8040gcttcctcag cggctttatc cagcgatttc ctattatgtc ggcatagttc tcaagatcga 8100cagcctgtca cggttaagcg agaaatgaat aagaaggctg ataattcgga tctctgcgag 8160ggagatgata tttgatcaca ggcagcaacg ctctgtcatc gttacaatca acatgctacc 8220ctccgcgaga tcatccgtgt ttcaaacccg gcagcttagt tgccgttctt ccgaatagca 8280tcggtaacat gagcaaagtc tgccgcctta caacggctct cccgctgacg ccgtcccgga 8340ctgatgggct gcctgtatcg agtggtgatt ttgtgccgag ctgccggtcg gggagctgtt 8400ggctggctgg tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata 8460acacattgcg gacgttttta atgtactgaa ttgtctagac ccggggatct catgtttgac 8520agcttatcat cggatctagt aacatagatg acaccgcgcg cgataattta tcctagtttg 8580cgcgctatat tttgttttct atcgcgtatt aaatgtataa ttgcgggact ctaatcataa 8640aaacccatct cataaataac gtcatgcatt acatgttaat tattacatgc ttaacgtaat 8700tcaacagaaa ttagatgata atcatcgcaa gaccggcaac aggattcaat cttaagaaac 8760tttattgcca aatgtttgaa cgatctctgc aggtcgacgg atcgagctcc cagcttagca 8820agagatgtta attttttcag taagctctta cagcttgttg taaacacgcg ctaaacggcc 8880gtggcctttg acagtcaccg gtgattcgtt ggcggcaata aacgctgatt cacccggttt 8940aagctgtaac tgctgagaac ctttccacaa cgttgcatcg ccttcgacgc agaacaaaat 9000ggcggcactc tgctggctaa tggtggtttc tttatcacta aggtcatgca gcgagaaggc 9060aaaatcatcc actggaatcg ggaagtccag ttctgcacct tgtttcaccg gctgggtcaa 9120caactggtta gccggtttgg cttcgaattt cacattggca accagttccg gaatatcaat 9180gtatttaggc gtcagacccg cacgcagcac gttatcggag tttgccatca cttccagcgc 9240cacgccttgc aggtaagcgt gcggtgtttc agcgaacagg aacatcgctt cgccagggtt 9300caatttcacc acattcagca atagcgggga gaacagaccg ctgtcttccg ggtaaaattc 9360agaaattaaa cgaatcgttt gccacggttc accctgctgg ctatcgaggg ccgattttaa 9420aatcgccagc gcgcgggatt tttcttcacc ctgcatattc aacaggctgg cgaacagttc 9480gcttaaacgt tcggcatcag gctgttgtaa aaagtgagca atcgccggat gtgcacctgc 9540gaccggctgg agtagggaga caatctcgga aaattcacga aacgcgttca tcgcaaggaa 9600aggcgtcagc gcaaaaacca gctccggctt gtggttagga tctttatagt tacgctcggc 9660ggcatccatc gggatacctg cggcattttc tttggcaaaa ccgatttcag aattgtgttt 9720gtttggatga acctgaatgg agagtggctg tgctgcgcat aatactttga acaggaaagg 9780cagttcgcca aagcgtttgg caacggcctc tccgagcaga gtcgatttat cactctcaat 9840cacatcacgc agtgaaacga tatctccggc ggcattctgc actcgtgaac tgcttttcgg 9900atgtgcgccc atccacagct cggccatcgg ctggctggac ggattttcca taccataaag 9960ttcagtcaac gcgttttgct gccccaggca tagttttgca ctgagttaat gagtttttgc 10020atgatcgggg atccctgcag aagtaacacc aaacaacagg gtgagcatcg acaaaagaaa 10080cagtaccaag caaataaata gcgtatgaag gcagggctaa aaaaatccac atatagctgc 10140tgcatatgcc atcatccaag tatatcaaga tcaaaataat tataaaacat acttgtttat 10200tataatagat aggtactcaa ggttagagca tatgaataga tgctgcatat gccatcatgt 10260atatgcatca gtaaaaccca catcaacatg tatacctatc ctagatcgat atttccatcc 10320atcttaaact cgtaactatg aagatgtatg acacacacat acagttccaa aattaataaa 10380tacaccaggt agtttgaaac ggcgtctact ccgatctaga acgaatgaac gaccgcccaa 10440ccacaccaca tcatcacaac caagcgaaca aaaagcatct ctgtatatgc atcagtaaaa 10500cccgcatcaa catgtatacc tatcctagat cgatatttcc atccatcatc ttcaattcgt 10560aactatgaat atgtatggca cacacataca gatccaaaat taataaatcc accaggtagt 10620ttgaaacaga attctactcc gatctagaac gaccgcccaa ccagaccaca tcatcacaac 10680caagacaaaa aaaagcatga aaagatgacc cgacaaacaa gtgcacggca tatattgaaa 10740taaaggaaaa gggcaaacca aaccctatgc aacgaaacaa aaaaaatcat gaaatcgatc 10800ccgtctgcgg aacggctaga gccatcccag gattccccaa agagaaacac tggcaagtta 10860gcaatcagaa cgtgtctgac gtacaggtcg catccgtgta cgaacgctag cagcacggat 10920ctaacacaaa cacggatcta acacaaacat gaacagaagt agaactaccg ggccctaacc 10980atggaccgga acgccgatct agagaaggta gagagggggg gggggggagg acgagcggcg 11040taccttgaag cggaggtgcc gacgggtgga tttgggggag atctggttgt gtgtgtgtgc 11100gctccgaaca acacgaggtt ggggaaagag ggtgtggagg gggtgtctat ttattacggc 11160gggcgaggaa gggaaagcga aggagcggtg ggaaaggaat cccccgtagc tgccgtgccg 11220tgagaggagg aggaggccgc ctgccgtgcc ggctcacgtc tgccgctccg ccacgcaatt 11280tctggatgcc gacagcggag caagtccaac ggtggagcgg aactctcgag aggggtccag 11340aggcagcgac agagatgccg tgccgtctgc ttcgcttggc ccgacgcgac gctgctggtt 11400cgctggttgg tgtccgttag actcgtcgac ggcgtttaac aggctggcat tatctactcg 11460aaacaagaaa aatgtttcct tagttttttt aatttcttaa agggtatttg tttaattttt 11520agtcacttta ttttattcta ttttatatct aaattattaa ataaaaaaac taaaatagag 11580ttttagtttt cttaatttag aggctaaaat agaataaaat agatgtacta aaaaaattag 11640tctataaaaa ccattaaccc taaaccctaa atggatgtac taataaaatg gatgaagtat 11700tatataggtg aagctatttg caaaaaaaaa ggagaacaca tgcacactaa aaagataaaa 11760ctgtagagtc ctgttgtcaa aatactcaat tgtcctttag accatgtcta actgttcatt 11820tatatgattc tctaaaacac tgatattatt gtagtactat agattatatt attcgtagag 11880taaagtttaa atatatgtat aaagatagat aaactgcact tcaaacaagt gtgacaaaaa 11940aaatatgtgg taatttttta taacttagac atgcaatgct cattatctct agagaggggc 12000acgaccgggt cacgctgcac tgcaggcatg caagcttgca catgacaaca attgtaagag 12060gatggagacc acaacgatcc aacaatactt ctgcgacggg ctgtgaagta tagagaagtt 12120aaacgcccaa aagccattgt gtttggaatt tttagttatt ctatttttca tgatgtatct 12180tcctctaaca tgccttaatt tgcaaatttg gtataactac tgattgaaaa tatatgtatg 12240taaaaaaata ctaagcatat ttgtgaagct aaacatgatg ttatttaaga aaatatgttg 12300ttaacagaat aagattaata tcgaaatgga aacatctgta aattagaatc atcttacaag 12360ctaagagatg ttcacgcttt gagaaacttc ttcagatcat gaccgtagaa gtagctctcc 12420aagactcaac gaaggctgct gcaattccac aaatgcatga catgcatcct tgtaaccgtc 12480gtcgccgcta taaacacgga taactcaatt ccctgctcca tcaatttaga aatgagcaag 12540caagcacccg atcgctcacc ccatatgcac caatctgact cccaagtctc tgtttcgcat 12600tagtaccgcc agcactccac ctatagctac caattgagac ctttccagcc taagcagatc 12660gattgatcgt tagagtcaaa gagttggtgg tacgggtact ttaactacca tggaatgatg 12720gggcgtgatg tagagcggaa agcgcctccc tacgcggaac aacaccctcg ccatgccgct 12780cgactacagc ctcctcctcg tcggccgccc acaacgaggg agcccgtggt cgcagccacc 12840gaccagcatg tctctgtgtc ctcgtccgac ctcgacatgt catggcaaac agtcggacgc 12900cagcaccaga ctgacgacat gagtctctga agagcccgcc acctagaaag atccgagccc 12960tgctgctggt agtggtaacc attttcgtcg cgctgacgcg gagagcgaga ggccagaaat 13020ttatagcgac tgacgctgtg gcaggcacgc tatcggaggt tacgacgtgg cgggtcactc 13080gacgcggagt tcacaggtcc tatccttgca tcgctcgggc cggagtttac gggacttatc 13140cttacgacgt gctctaaggt tgcgataacg ggcggaggaa ggcgtgtggc gtgcggagac 13200ggtttataca cgtagtgtgc gggagtgtgt ttcgtagacg cgggaaagca cgacgactta 13260cgaaggttag tggaggagga ggacacacta aaatcaggac gcaagaaact cttctattat 13320agtagtagag aagagattat aggagtgtgg gttgattcta aagaaaatcg acgcaggaca 13380accgtcaaaa cgggtgcttt aatatagtag atatatatat atagagagag agagaaagta 13440caaaggatgc atttgtgtct gcatatgatc ggagtattac taacggccgt cgtaagaagg 13500tccatcatgc gtggagcgag cccatttggt tggttgtcag gccgcagtta aggcctccat 13560atatgattgt cgtcgggccc ataacagcat ctcctccacc agtttattgt aagaataaat 13620taagtagaga tatttgtcgt cgggcagaag aaacttggac aagaagaaga agcaagctag 13680gccaatttct tgccggcaag aggaagatag tggcctctag tttatatatc ggcgtgatga 13740tgatgctcct agctagaaat gagagaagaa aaacggacgc gtgtttggtg tgtgtcaatg 13800gcgtccatcc ttccatcaga tcagaacgat gaaaaagtca agcacggcat gcatagtata 13860tgtatagctt gttttagtgt ggctttgctg agacgaatga aagcaacggc gggcatattt 13920ttcagtggct gtagctttca ggctgaaaga gacgtggcat gcaataattc agggaattcg 13980tcagccaatt gaggtagcta gtcaacttgt acattggtgc gagcaatttt ccgcactcag 14040gagggctagt ttgagagtcc aaaaactata ggagattaaa gaggctaaaa tcctctcctt 14100atttaatttt aaataagtag tgtatttgta ttttaactcc tccaaccctt ccgattttat 14160ggctctcaaa ctagcattca gtctaatgca tgcatgcttg gctagaggtc gtatggggtt 14220gttaatagca tagctagcta caagttaacc gggtctttta tatttaataa ggacaggcaa 14280agtattactt acaaataaag aataaagcta ggacgaactc gtggattatt actaaatcga 14340aatggacgta atattccagg caagaataat tgttcgatca ggagacaagt ggggcattgg 14400accggttctt gcaagcaaga gcctatggcg tggtgacacg gcgcgttgcc catacatcat 14460gcctccatcg atgatccatc ctcacttgct ataaaaagag gtgtccatgg tgctcaagct 14520cagccaagca aataagacga cttgtttcat tgattcttca agagatcgag cttcttttgc 14580accacaaggt cgaggatcca aca 14603<210>17<211>11127<212>DNA<213>人工序列<220><223>人工序列说明:pZU578<220><221>misc_feature<222>(1485)..(3491)<223>编码H04毒素部分加Cry1Ab尾头40个氨基酸的合成核苷酸序列<220><221>misc_feature<222>(5052)..(6271)<223>PMI<220><221>misc_feature<222>(3859)..(5030)<223>SMAS启动子<220><221>misc_feature<222>(56)..(1475)<223>肌动蛋白2启动子U41998<400>17ggccgcagcg gccatttaaa tcaattgggc gcgccgaatt cgagctcggt accctgcatg 60cctgcaggtc gacaaaattt agaacgaact taattatgat ctcaaataca ttgatacata 120tctcatctag atctaggtta tcattatgta agaaagtttt gacgaatatg gcacgacaaa 180atggctagac tcgatgtaat tggtatctca actcaacatt atacttatac caaacattag 240ttagacaaaa tttaaacaac tattttttat gtatgcaaga gtcagcatat gtataattga 300ttcagaatcg ttttgacgag ttcggatgta gtagtagcca ttatttaatg tacatactaa 360tcgtgaatag tgaatatgat gaagcattgt atcttattgt ataaatatcc ataaacacat 420catgaaagac actttctttc acggtctgaa ttaattatga cacaattcta atagaaaacg 480aattaaatta cgttgaattg tatgaaatct aattgaacaa gccaaccacg acgacgacta 540acgttgcctg gattgactcg gtttaagtta accactaaaa aaacggagct gtcatgtaac 600acgcggatcg agcaggtcac agtcatgaag ccatcaaagc aaaagaacta atccaagggc 660tgagatgatt aattagttta aaaattagtt aacacgaggg aaaaggctgt ctgacagcca 720ggtcacgtta tctttacctg tggtcgaaat gattcgtgtc tgtcgatttt aattattttt 780ttgaaaggcc gaaaataaag ttgtaagaga taaacccgcc tatataaatt catatatttt 840cctctccgct ttgaattgtc tcgttgtcct cctcactttc atcagccgtt ttgaatctcc 900ggcgacttga cagagaagaa caaggaagaa gactaagaga gaaagtaaga gataatccag 960gagattcatt ctccgttttg aatcttcctc aatctcatct tcttccgctc tttctttcca 1020aggtaatagg aactttctgg atctacttta tttgctggat ctcgatcttg ttttctcaat 1080ttccttgaga tctggaattc gtttaatttg gatctgtgaa cctccactaa atcttttggt 1140tttactagaa tcgatctaag ttgaccgatc agttagctcg attatagcta ccagaatttg 1200gcttgacctt gatggagaga tccatgttca tgttacctgg gaaatgattt gtatatgtga 1260attgaaatct gaactgttga agttagattg aatctgaaca ctgtcaatgt tagattgaat 1320ctgaacactg tttaagttag atgaagtttg tgtatagatt cttcgaaact ttaggatttg 1380tagtgtcgta cgttgaacag aaagctattt ctgattcaat cagggtttat ttgactgtat 1440tgaactcttt ttgtgtgttt gcagctcata aaaaggatcc aacaatggac aacaacccca 1500acatcaacga gtgcatcccc tacaactgcc tgagcaaccc cgaggtggag gtgctgggcg 1560gcgagcgcat cgagaccggc tacaccccca tcgacatcag cctgagcctg acccagttcc 1620tgctgagcga gttcgtgccc ggcgccggct tcgtgctggg cctggtggac atcatctggg 1680gcatcttcgg ccccagccag tgggacgcct tcctggtgca gatcgagcag ttgataaacc 1740aacgcataga ggaattcgcc cgcaaccagg ccatcagccg cctggagggc ctgagcaacc 1800tgtaccaaat ctacgccgag agcttccgcg agtgggaggc cgaccccacc aaccccgccc 1860tgcgcgagga gatgcgcatc cagttcaacg acatgaacag cgccctgacc accgccatcc 1920ccctgttcgc cgtgcagaac taccaggtgc ccctgctgag cgtgtacgtg caggccgcca 1980acctgcacct gagcgtgctg cgcgacgtca gcgtgttcgg ccagcgctgg ggcttcgacg 2040ccgccaccat caacagccgc tacaacgacc tgacccgcct gatcggcaac tacaccgacc 2100acgccgtgcg ctggtacaac accggcctgg agcgcgtgtg gggtcccgac agccgcgact 2160ggatcaggta caaccagttc cgccgcgagc tgaccctgac cgtgctggac atcgtgagcc 2220tgttccccaa ctacgacagc cgcacctacc ccatccgcac cgtgagccag ctgacccgcg 2280agatttacac caaccccgtg ctggagaact tcgacggcag cttccgcggc agcgcccagg 2340gcatcgaggg cagcatccgc agcccccacc tgatggacat cctgaacagc atcaccatct 2400acaccgacgc ccaccgcggc gagtactact ggagcggcca ccagatcatg gccagccccg 2460tcggcttcag cggccccgag ttcaccttcc ccctgtacgg caccatgggc aacgctgcac 2520ctcagcagcg catcgtggca cagctgggcc agggagtgta ccgcaccctg agcagcaccc 2580tgtaccgtcg acctttcaac atcggcatca acaaccagca gctgagcgtg ctggacggca 2640ccgagttcgc ctacggcacc agcagcaacc tgcccagcgc cgtgtaccgc aagagcggca 2700ccgtggacag cctggacgag atcccccctc agaacaacaa cgtgccacct cgacagggct 2760tcagccaccg tctgagccac gtgagcatgt tccgcagtgg cttcagcaac agcagcgtga 2820gcatcatccg tgcacccatg ttcagctgga ttcaccgcag cgccaccctg accaacacca 2880tcgaccccga gcgcatcaac cagatccccc tggtgaaggg cttccgggtg tggggcggca 2940ccagcgtgat caccggcccc ggcttcaccg gaggcgacat cctgcgcaga aacaccttcg 3000gcgacttcgt gagcctgcag gtgaacatca acagccccat cacccagcgt taccgcctgc 3060gcttccgcta cgccagcagc cgcgacgccc gtgtgatcgt gctgactggc gccgctagca 3120ccggtgtggg cggtcaggtg agcgtgaaca tgcccctgca gaagactatg gagatcggcg 3180agaacctgac tagtcgcacc ttccgctaca ccgacttcag caaccccttc agcttccgcg 3240ccaaccccga catcatcggc atcagcgagc agcccctgtt cggtgccggc agcatcagca 3300gcggcgagct gtacatcgac aagatcgaga tcatcctggc cgacgccacc ttcgaggccg 3360agagcgacct ggagcgcgcc cagaaggccg tgaacgccct gttcaccagc agcaaccaga 3420tcggcctgaa gaccgacgtg accgactacc acatcgacca ggtgagcaac ctggtggact 3480gcttaagcta gagatcctct agagtcgacc atggtgatca ctgcagatcg ttcaaacatt 3540tggcaataaa gtttcttaag attgaatcct gttgccggtc ttgcgatgat tatcatataa 3600tttctgttga attacgttaa gcatgtaata attaacatgt aatgcatgac gttatttatg 3660agatgggttt ttatgattag agtcccgcaa ttatacattt aatacgcgat agaaaacaaa 3720atatagcgcg caacctagga taaattatcg cgcgcggtgt catctatgtt actagatctc 3780tagaaagctt cgtacgttaa ttaattcgaa tccggagcgg ccgcagggct agcatcgatg 3840gtaccgagct cgagactata caggccaaat tcgctcttag ccgtacaata ttactcaccg 3900gtgcgatgcc ccccatcgta ggtgaaggtg gaaattaatg atccatcttg agaccacagg 3960cccacaacag ctaccagttt cctcaagggt ccaccaaaaa cgtaagcgct tacgtacatg 4020gtcgataaga aaaggcaatt tgtagatgtt aacatccaac gtcgctttca gggatcccga 4080attccaagct tggaattcgg gatcctacag gccaaattcg ctcttagccg tacaatatta 4140ctcaccggtg cgatgccccc catcgtaggt gaaggtggaa attaatgatc catcttgaga 4200ccacaggccc acaacagcta ccagtttcct caagggtcca ccaaaaacgt aagcgcttac 4260gtacatggtc gataagaaaa ggcaatttgt agatgttaac atccaacgtc gctttcaggg 4320atcccgaatt ccaagcttgg aattcgggat cctacaggcc aaattcgctc ttagccgtac 4380aatattactc accggtgcga tccccccatc gtaggtgaag gtggaaatta atgatccatc 4440ttgagaccac aggcccacaa cagctaccag tttcctcaag ggtccaccaa aaacgtaagc 4500gcttacgtac atggtcgata agaaaaggca atttgtagat gttaacatcc aacgtcgctt 4560tcagggatcc cgaattccaa gcttgggctg caggtcaatc ccattgcttt tgaagcagct 4620caacattgat ctctttctcg agggagattt ttcaaatcag tgcgcaagac gtgacgtaag 4680tatccgagtc agtttttatt tttctactaa tttggtcgtt tatttcggcg tgtaggacat 4740ggcaaccggg cctgaatttc gcgggtattc tgtttctatt ccaacttttt cttgatccgc 4800agccattaac gacttttgaa tagatacgct gacacgccaa gcctcgctag tcaaaagtgt 4860accaaacaac gctttacagc aagaacggaa tgcgcgtgac gctcgcggtg acgccatttc 4920gccttttcag aaatggataa atagccttgc ttcctattat atcttcccaa attaccaata 4980cattacacta gcatctgaat ttcataacca atctcgatac accaaatcga gatctgcagg 5040gatccccgat catgcaaaaa ctcattaact cagtgcaaaa ctatgcctgg ggcagcaaaa 5100cggcgttgac tgaactttat ggtatggaaa atccgtccag ccagccgatg gccgagctgt 5160ggatgggcgc acatccgaaa agcagttcac gagtgcagaa tgccgccgga gatatcgttt 5220cactgcgtga tgtgattgag agtgataaat cgactctgct cggagaggcc gttgccaaac 5280gctttggcga actgcctttc ctgttcaaag tattatgcgc agcacagcca ctctccattc 5340aggttcatcc aaacaaacac aattctgaaa tcggttttgc caaagaaaat gccgcaggta 5400tcccgatgga tgccgccgag cgtaactata aagatcctaa ccacaagccg gagctggttt 5460ttgcgctgac gcctttcctt gcgatgaacg cgtttcgtga attttccgag attgtctccc 5520tactccagcc ggtcgcaggt gcacatccgg cgattgctca ctttttacaa cagcctgatg 5580ccgaacgttt aagcgaactg ttcgccagcc tgttgaatat gcagggtgaa gaaaaatccc 5640gcgcgctggc gattttaaaa tcggccctcg atagccagca gggtgaaccg tggcaaacga 5700ttcgtttaat ttctgaattt tacccggaag acagcggtct gttctccccg ctattgctga 5760atgtggtgaa attgaaccct ggcgaagcga tgttcctgtt cgctgaaaca ccgcacgctt 5820acctgcaagg cgtggcgctg gaagtgatgg caaactccga taacgtgctg cgtgcgggtc 5880tgacgcctaa atacattgat attccggaac tggttgccaa tgtgaaattc gaagccaaac 5940cggctaacca gttgttgacc cagccggtga aacaaggtgc agaactggac ttcccgattc 6000cagtggatga ttttgccttc tcgctgcatg accttagtga taaagaaacc accattagcc 6060agcagagtgc cgccattttg ttctgcgtcg aaggcgatgc aacgttgtgg aaaggttctc 6120agcagttaca gcttaaaccg ggtgaatcag cgtttattgc cgccaacgaa tcaccggtga 6180ctgtcaaagg ccacggccgt ttagcgcgtg tttacaacaa gctgtaagag cttactgaaa 6240aaattaacat ctcttgctaa gctgggagct cgtcgacgga tcgaattcct gcagatcgtt 6300caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta 6360tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt 6420tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag 6480aaaacaaaat atagcgcgca acctaggata aattatcgcg cgcggtgtca tctatgttac 6540tagatctcta gaactagtgg atctgctagc cctgcaggaa atttaccggt gcccgggcgg 6600ccagcatggc cgtatccgca atgtgttatt aagttgtcta agcgtcaatt tgtttacacc 6660acaatatatc ctgccaccag ccagccaaca gctccccgac cggcagctcg gcacaaaatc 6720accactcgat acaggcagcc catcagaatt aattctcatg tttgacagct tatcatcgac 6780tgcacggtgc accaatgctt ctggcgtcag gcagccatcg gaagctgtgg tatggctgtg 6840caggtcgtaa atcactgcat aattcgtgtc gctcaaggcg cactcccgtt ctggataatg 6900ttttttgcgc cgacatcata acggttctgg caaatattct gaaatgagct gttgacaatt 6960aatcatcggc tcgtataatg tgtggaattg tgagcggata acaatttcac acaggaaaca 7020gaccatgagg gaagcggtga tcgccgaagt atcgactcaa ctatcagagg tagttggcgt 7080catcgagcgc catctcgaac cgacgttgct ggccgtacat ttgtacggct ccgcagtgga 7140tggcggcctg aagccacaca gtgatattga tttgctggtt acggtgaccg taaggcttga 7200tgaaacaacg cggcgagctt tgatcaacga ccttttggaa acttcggctt cccctggaga 7260gagcgagatt ctccgcgctg tagaagtcac cattgttgtg cacgacgaca tcattccgtg 7320gcgttatcca gctaagcgcg aactgcaatt tggagaatgg cagcgcaatg acattcttgc 7380aggtatcttc gagccagcca cgatcgacat tgatctggct atcttgctga caaaagcaag 7440agaacatagc gttgccttgg taggtccagc ggcggaggaa ctctttgatc cggttcctga 7500acaggatcta tttgaggcgc taaatgaaac cttaacgcta tggaactcgc cgcccgactg 7560ggctggcgat gagcgaaatg tagtgcttac gttgtcccgc atttggtaca gcgcagtaac 7620cggcaaaatc gcgccgaagg atgtcgctgc cgactgggca atggagcgcc tgccggccca 7680gtatcagccc gtcatacttg aagctaggca ggcttatctt ggacaagaag atcgcttggc 7740ctcgcgcgca gatcagttgg aagaatttgt tcactacgtg aaaggcgaga tcaccaaggt 7800agtcggcaaa taaagctcta gtggatcccc gaggaatcgg cgtgacggtc gcaaaccatc 7860cggcccggta caaatcggcg cggcgctggg tgatgacctg gtggagaagt tgaaggccgc 7920gcaggccgcc cagcggcaac gcatcgaggc agaagcacgc cccggtgaat cgtggcaagc 7980ggccgctgat cgaatccgca aagaatcccg gcaaccgccg gcagccggtg cgccgtcgat 8040taggaagccg cccaagggcg acgagcaacc agattttttc gttccgatgc tctatgacgt 8100gggcacccgc gatagtcgca gcatcatgga cgtggccgtt ttccgtctgt cgaagcgtga 8160ccgacgagct ggcgaggtga tccgctacga gcttccagac gggcacgtag aggtttcagc 8220agggccggcc ggcatggcca gtgtgtggga ttacgacctg gtactgatgg cggtttccca 8280tctaaccgaa tccatgaacc gataccggga agggaaggga gacaagcccg gccgcgtgtt 8340ccgtccacac gttgcggacg tactcaagtt ctgccggcga gccgatggcg gaaagcagaa 8400agacgacctg gtagaaacct gcattcggtt aaacaccacg cacgttgcca tgcagcgtac 8460gaagaaggcc aagaacggcc gcctggtgac ggtatccgag ggtgaagcct tgattagccg 8520ctacaagatc gtaaagagcg aaaccgggcg gccggagtac atcgagatcg agctagctga 8580ttggatgtac cgcgagatca cagaaggcaa gaacccggac gtgctgacgg ttcaccccga 8640ttactttttg atcgatcccg gcatcggccg ttttctctac cgcctggcac gccgcgccgc 8700aggcaaggca gaagccagat ggttgttcaa gacgatctac gaacgcagtg gcagcgccgg 8760agagttcaag aagttctgtt tcaccgtgcg caagctgatc gggtcaaatg acctgccgga 8820gtacgatttg aaggaggagg cggggcaggc tggcccgatc ctagtcatgc gctaccgcaa 8880cctgatcgag ggcgaagcat ccgccggttc ctaatgtacg gagcagatgc tagggcaaat 8940tgccctagca ggggaaaaag gtcgaaaagg tctctttcct gtggatagca cgtacattgg 9000gaacccaaag ccgtacattg ggaaccggaa cccgtacatt gggaacccaa agccgtacat 9060tgggaaccgg tcacacatgt aagtgactga tataaaagag aaaaaaggcg atttttccgc 9120ctaaaactct ttaaaactta ttaaaactct taaaacccgc ctggcctgtg cataactgtc 9180tggccagcgc acagccgaag agctgcaaaa agcgcctacc cttcggtcgc tgcgctccct 9240acgccccgcc gcttcgcgtc ggcctatcgc ggccgctggc cgctcaaaaa tggctggcct 9300acggccaggc aatctaccag ggcgcggaca agccgcgccg tcgccactcg accgccggcg 9360ctgaggtctg cctcgtgaag aaggtgttgc tgactcatac caggcctgaa tcgccccatc 9420atccagccag aaagtgaggg agccacggtt gatgagagct ttgttgtagg tggaccagtt 9480ggtgattttg aacttttgct ttgccacgga acggtctgcg ttgtcgggaa gatgcgtgat 9540ctgatccttc aactcagcaa aagttcgatt tattcaacaa agccgccgtc ccgtcaagtc 9600agcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg 9660agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 9720agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 9780tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 9840tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 9900ggcaaaagct ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg 9960gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc 10020ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 10080aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 10140ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 10200gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 10260cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 10320gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 10380tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 10440cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 10500cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 10560gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 10620agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 10680cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 10740tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 10800tttggtcatg agattatcaa aaaggatctt cacctagatc cttttgatcc ggaattaatt 10860cctgtggttg gcatgcacat acaaatggac gaacggataa accttttcac gcccttttaa 10920atatccgatt attctaataa acgctctttt ctcttaggtt tacccgccaa tatatcctgt 10980caaacactga tagtttaaac tgaaggcggg aaacgacaat ctgatcatga gcggagaatt 11040aagggagtca cgttatgacc cccgccgatg acgcgggaca agccgtttta cgtttggaac 11100tgacagaacc gcaacgctgc aggaatt 11127
机译: 来自苏云金芽孢杆菌杀虫剂晶体蛋白的杀虫毒素
机译: 苏云金芽孢杆菌杀虫晶体蛋白衍生的新型杀虫毒素
机译: 苏云金芽孢杆菌杀虫晶体蛋白衍生的新型杀虫毒素