首页> 中国专利> 控制鞘翅目害虫的苏云金芽孢杆菌毒素和基因

控制鞘翅目害虫的苏云金芽孢杆菌毒素和基因

摘要

本发明涉及可用于控制害虫,尤其是植物害虫的材料和方法。更具体地说,本发明涉及命名为86Al(b)和52Al(b)的新基因和杀虫毒素。在优选实施例中,所述毒素用于控制菜跳甲属的跳甲虫。利用文中描述的基因,借助本领域技术人员已知的技术可以完成植物转化。此外,本发明提供了为在植物中进行表达而优化过的毒素基因。

著录项

  • 公开/公告号CN1305528A

    专利类型发明专利

  • 公开/公告日2001-07-25

    原文格式PDF

  • 申请/专利权人 麦考根公司;

    申请/专利号CN99807354.7

  • 申请日1999-05-10

  • 分类号C12N15/32;C07K14/325;A01N63/00;

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人黄革生

  • 地址 美国加利福尼亚州

  • 入库时间 2023-12-17 13:58:38

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-06-29

    未缴年费专利权终止 IPC(主分类):C12N15/32 授权公告日:20100303 终止日期:20150510 申请日:19990510

    专利权的终止

  • 2010-03-03

    授权

    授权

  • 2001-08-01

    实质审查请求的生效

    实质审查请求的生效

  • 2001-07-25

    公开

    公开

说明书

相关申请的相互参考

该申请是1998年5月12日提交的流水号09/076193申请的部分继续申请。

发明背景

每年由昆虫和其他害虫造成的农作物减产以及用于控制这些害虫的花费要消耗农民几十亿美元。由昆虫造成的农产品产地的损失包括农作物产量的减少、质量的下降以及收获成本的提高。

鞘翅目的昆虫是一群重要的农业害虫,每年引起巨大的农作物损失。有多种甲虫能带来显著的经济损失;例子包括叶甲科甲虫(比如跳甲虫(flea beetle)和玉米根虫)和象虫(比如苜蓿象鼻虫)。

跳甲虫包括许多属(例如,跳甲属(Altica)、Apphthona、瓢跳甲属(Argopistes)、Disonycha、毛跳甲属(Epitrix)、长跗跳甲属(Longitarsus)、Prodagricomela、小跳甲属(Systena)、蚤跳甲属(Psylliodes)和菜跳甲属(Phyllotreta))。黄曲条菜跳甲包括条纹的跳甲虫。十字花菜跳甲包括canola跳甲虫、油菜跳甲虫和十字花科植物跳甲虫。Canola,又称油菜,是一种油籽芸苔(例如油菜、芜青、蔓菁以及芥菜)。

跳甲虫包括许多以草、谷物和牧草的叶子为生的甲虫。十字花菜跳甲、黄曲条菜跳甲和波条菜跳甲是尤其有危害性的一年生害虫,它们破坏易感植物的叶子、茎、豆荚和根组织。油菜金头跳甲(Psylliodeschrysocephala)是一种跳甲虫,同样是危害性的两年生害虫,攻击易感植物的茎和叶。

化学杀虫剂能有效地控制害虫,但是公众日益关注残余化学物质对食物和环境(包括土壤、地表水和地下水)的污染。使用杀虫剂还可能给施用者带来危害。严格限制杀虫剂的使用以及禁止某些高效的杀虫剂销售可能局限了控制害虫的经济的和有效的途径。

另外,常规使用杀虫剂来控制有害生物会选择抗性株。在许多种有重要经济影响的昆虫和其他害虫中已发生了这种情况。杀虫剂抗性的发展要求持续开发新的作用方式不同的控制剂。

因此,迫切需要找出新的控制害虫,比如对易感植物造成巨大损失的许多不同类型的鞘翅目害虫的方法和组合物。

土壤微生物苏云金芽孢杆菌(B.t.),一种革兰氏阳性、生芽孢的杆菌的某些株特征性具有伴胞晶体蛋白内含物。这些内含物经常呈现特别形状的晶体的显微结构。所述蛋白质对害虫毒性高,并且毒性作用是特异性的。这些由某些B.t.菌株产生的δ内毒素由孢子形成细胞合成。在被敏感性昆虫摄入时,某些种类的B.t.毒素被昆虫胃液蛋白酶转化成生物活性部分。主要的攻击目标是昆虫胃上皮细胞,能被毒素迅速破坏。

已经分离和测定了某些芽孢杆菌毒素基因的序列。公开文献中描述了B.t.晶体蛋白基因在大肠杆菌中的克隆和表达。此外,利用基因工程技术,正在开发向农业环境递送这些芽孢杆菌毒素的新方法,包括用毒素基因基因工程化的植物获得昆虫抗性和利用稳定化完整微生物细胞作为B.t.内毒素递送载体。已经制备出并批准使用基于重组DNA的B.t.产品。因此,分离的芽孢杆菌毒素基因日趋有商业价值。

直到最近,B.t.杀虫剂的商业使用主要限于少数鳞翅目(毛虫)害虫。苏云金芽孢杆菌库尔斯塔克亚种的芽孢和晶体制剂已作为针对鳞翅目害虫的杀虫剂使用了多年。例如,苏云金芽孢杆菌库尔斯塔克变种HD-1产生的一种晶体δ内毒素对许多鳞翅目昆虫的幼虫有毒性。

但是近几年,已鉴定到了新的B.t.亚种,并且研究者发现了对更宽范围的害虫有特异性的B.t.杀虫剂。例如,其他种B.t.,如以色列亚种和莫氏亚种(a.k.a.tenebrionis,a.k.a.B.t.M-7,a.k.a.B.t.san diego)已商业化分别用来控制双翅目和鞘翅目昆虫。

Hofte和Whiteley(Hofte,H.,H.R.Whiteley[1989]微生物学综述52(2):242-255)将B.t.晶体蛋白基因分为四大类。它们是CryⅠ(鳞翅目特异性)、CryⅡ(鳞翅目和双翅目特异性)、CryⅢ(鞘翅目特异性)和CryⅣ(双翅目特异性)。推测CryⅤ和CryⅥ代表一类线虫特异性的毒素基因。现在已鉴定到了其他类的B.t.基因。

Hofte和Whiteley 1989年对晶体蛋白的命名法和分类系统都是基于推测的氨基酸序列以及毒素的宿主范围。该系统已覆盖了被分为5大类的14个不同类型的毒素基因。随着更多毒素基因的发现,发现有类似序列的基因却具有明显不同的杀虫特异性,因此这一系统逐渐变得不适用。已有人提出一种改进的命名系统,它主要根据氨基酸相同性(Crickmore等,[1996]无脊椎动物病理学会,第29届年会,第3次国际苏云金芽孢杆菌研讨会,University of Cordoba,Spain,9月1-6日,摘要)。除了cytA和cytB(仍作为单独一类)外,所有毒素基因保留助记符“cry”。第一级的罗马数字换成了阿拉伯数字,去掉了第三级中的括号。除了提到的例外情况,许多原始名字作了保留,但有些被重新分类。还可参见“苏云金芽孢杆菌杀虫晶体蛋白命名法改编”N.Crickmore,D.R.Zeigler,J.Feitelson.E.Schnepf,J.VanRie,D.Lereclus,J.Baum和D.H.Dean,微生物及分子生物学综述(1998)62卷:807-813;以及Crickmore,Zeigler,Feitelson,Schnepf,Van Rie,Lereclus,Baum和Dean,“苏云金芽孢杆菌毒素命名法”(1999)http://www.biols.susx.ac.uk/home/Neil Crickmore/Bt/index.html。该系统使用免费的软件程序CLUSTAL W和PHYLIP。PHYLIP程序包中的NEIGHBOR应用程序采用算术均值(UPGMA)算法。

在以下美国专利中公开了B.t.分离物PS86A1:4,849,217(抗苜蓿象鼻虫活性);5208017(抗玉米根虫活性)5,286,485(抗鳞翅目活性)和5427786(抗菜跳甲属活性)。将来自PS86A1的一个基因克隆至B.t.MR506其在美国专利5670365(抗线虫活性),和PCT国际专利申请公开号WO9304587(抗鳞翅目活性)中公开了。在以下美国专利中公开了来自PS86A1的一个基因和Cry6A(CryⅥA)毒素的序列:5186934(抗叶象属活性);5273746(虱);5262158和5424410(抗螨活性)以及PCT国际专利申请公开号WO9423036(抗捻转血矛线虫活性)。美国专利5262159和5468636公开了PS86A1,其基因和毒素的序列以及具有抗蚜虫活性的毒素的通式。

以下美国专利公开了具抗线虫活性的B.t.分离物PS52A1:4,861,595、4,948,734、5,093,120、5,262,399、5,236,843、5,322,932和5,670,365。在上述4,849,217和PCT国际专利申请公开号095/02694中也公开了PS52A1(抗丽蝇科活性)。美国专利5,439,881和欧洲的专利申请EP0462721公开了来自PS52A1的一个基因和作用于线虫的毒素的序列。在公开号为WO 92/19739的PCT国际专利申请中公开了PS52A1、基因及其作用于线虫的毒素的序列和CryⅥA毒素的通式。

经过广泛的研究,已有其他有关新的B.t.分离物和分离物新用途的专利被授权。然而发现新的芽孢杆菌分离物、毒素和基因以及已知的B.t.分离物的新用途仍是一个完全根据经验的不可预知的技术。

虽然B.t.菌株PS86A1和PS52A1、基因及其毒素有某种杀虫活性是已知,本领域以前不知道来自这些分离物的编码活性毒素的其他基因。

                        发明简述

本发明提供了编码杀虫毒素的新基因。优选的,本发明的新毒素基因称为86A1(b)和52A1(b)。这些基因编码能抗植物害虫的毒素,所述害虫优选是昆虫,优选鞘翅目昆虫,最优选菜跳甲属的跳甲虫。

在一个优选实施方案中,本发明涉及植物和转化了至少一个发明所述多核苷酸序列从而该转化植物细胞能在被目标害虫摄取的组织中表达杀虫毒素的植物细胞。以这种方式转化植物是为了赋予该植物对害虫的抗性。在这些优选实施方案中,害虫通过摄取或消耗表达毒素的植物组织来与转化植物表达的毒素发生接触。这类植物转化可以利用本领域技术人员已知的技术来完成。以这种方式表达的蛋白质更能免于环境的降解和失活。使用本发明的转化植物还有很多其他的益处。

在一个替代的实施方案中,可以利用本发明所述B.t.分离物或表达此处描述的毒素的重组微生物来控制害虫。因此,本发明包括基本上完整的B.t.细胞,以及包含表达的本发明所述毒素的重组细胞,在目标害虫环境中使用该基本上完整的细胞时,将所述细胞处理以便延长其杀虫活性。被处理细胞作为杀虫毒素的保护层。在被目标昆虫吸收时毒素变成有活性。

本发明另一个方面包括合成的、优化用于植物的B.t.基因,该基因尤其适合在转化植物中稳定保持和表达。

序列简述

SEQ ID NO.1是52A1(b)和86A1(b)的一个正向寡核苷酸探针。

SEQ ID NO.2是编码86A1(b)毒素的基因的一段核苷酸序列。

SEQ ID NO.3是86A1(b)毒素的氨基酸序列。

SEQ ID NO.4是编码52A1(b)毒素的基因的一段核苷酸序列。

SEQ ID NO.5是52A1(b)毒素的氨基酸序列。

SEQ ID NO.6是优化用于植物的MR510基因的核苷酸序列。

SEQ ID NO.7是优化用于植物的MR510基因编码的氨基酸序列。

SEQ ID NO.8是全长、天然52A1(b)毒素的一个优选的截短形式。在编码该毒素的基因中(以及编码SEQ ID NO.9-19所示的全部氨基酸序列的基因),添加了甲硫氨酸起始密码子因此氨基端氨基酸是甲硫氨酸而非亮氨酸(亮氨酸是天然蛋白质中的第一个氨基酸)。这个截短的片段和SEQ ID NO.9-13中所示的蛋白质在天然蛋白质的氨基端有缺失。其它截短的片段中使用天然52A1(b)的末端。在第一个氨基酸之后,该截短的毒素以天然蛋白质的氨基酸10开始。即天然蛋白质的前9个氨基酸被一个氨基酸甲硫氨酸取代。所述毒素的剩余(羧基端)部分与天然蛋白质相同。在优选实施方案中,在编码该毒素的基因以及编码下列截短蛋白质的基因(SEQ ID NO.9-19)中使用了两个终止密码子。

SEQ ID NO.9是全长、天然52A1(b)蛋白质的另一个优选的截短形式。这个蛋白质包含加到以天然蛋白质21位氨基酸起始的天然蛋白质上的甲硫氨酸。因此,天然蛋白质的前21个氨基端氨基酸被甲硫氨酸取代。

SEQ ID NO.10是全长、天然52A1(b)蛋白质的再一个优选的截短形式。在该截短的蛋白质中,天然蛋白质的前26个氨基端氨基酸被甲硫氨酸取代。

SEQ ID NO.11是全长、天然52A1(b)蛋白质的再一个优选的截短形式。在该截短的蛋白质中,天然蛋白质的前41个氨基端氨基酸被甲硫氨酸取代。

SEQ ID NO.12是全长、天然52A1(b)蛋白质的再一个优选的截短形式。在该截短的蛋白质中,天然蛋白质的前52个氨基端氨基酸被甲硫氨酸取代。

SEQ ID NO.13是全长、天然52A1(b)蛋白质的再一个优选的截短形式。在该截短的蛋白质中,天然蛋白质的前74个氨基端氨基酸被甲硫氨酸取代。

SEQID NO.14是全长、天然52A1(b)蛋白质的再一个优选的截短形式。在该截短的蛋白质(以及SEQ ID NO.15-19所示的其余截短形式)中,使用了52A1(b)蛋白质的天然起始部分(除了以甲硫氨酸取代亮氨酸)。因此,这些毒素(和编码它们的基因)是对天然蛋白质进行羧基端缺失的产物。在该截短的蛋白质中,从天然蛋白质的羧基端去掉了93个氨基酸。因此,该截短的蛋白质以天然蛋白质的269位氨基酸结束。

SEQ ID NO.15是全长、天然52A1(b)蛋白质的再一个优选的截短形式。在该截短的蛋白质中,从天然蛋白质的羧基端去掉了82个氨基酸。因此,该截短的蛋白质以天然蛋白质的280位氨基酸结束。

SEQ ID NO.16是全长、天然52A1(b)蛋白质的再一个优选的截短形式。在该截短的蛋白质中,从天然蛋白质的羧基端去掉了74个氨基酸。因此,该截短的蛋白质以天然蛋白质的288位氨基酸结束。

SEQ ID NO.17是全长、天然52A1(b)蛋白质的再一个优选的截短形式。在该截短的蛋白质中,从天然蛋白质的羧基端去掉了30个氨基酸。因此,该截短的蛋白质以天然蛋白质的332位氨基酸结束。

SEQ ID NO.18是全长、天然52A1(b)蛋白质的再一个优选的截短形式。在该截短的蛋白质中,从天然蛋白质的羧基端去掉了20个氨基酸。因此,该截短的蛋白质以天然蛋白质的342位氨基酸结束。SEQ Ⅱ)NO.19是全长、天然52A1(b)蛋白质的再一个优选的截短形式。在该截短的蛋白质中,从天然蛋白质的羧基端去掉了3个氨基酸。因此,该截短的蛋白质以天然蛋白质的359位氨基酸结束。

                        发明详述

本发明提供了编码杀虫毒素的新基因。优选地,本发明的新毒素基因命名为86A1(b)和52A1(b)。这些基因编码能抗(能用来控制、或者对其有毒、或能致死)植物害虫,尤其是昆虫,优选鞘翅目昆虫,最优选菜跳甲属的跳甲虫的毒素。本发明还涉及所述基因以及毒素用于控制其他害虫,比如蚤跳甲属的害虫的用途。

在一个优选实施方案中,本发明涉及植物和转化了至少一个发明所述多核苷酸序列的植物细胞从而该转化植物细胞能在被目标害虫摄取的组织中表达杀虫毒素的植物细胞。以这种方式转化植物是为了赋予该植物害虫抗性。在这些优选实施方案中,害虫通过摄取或消耗表达毒素的植物组织来与转化植物表达的毒素发生接触。这类植物转化可以利用本领域技术人员已知的技术来完成。以这种方式表达的蛋白质更能免于环境的降解和失活。使用本发明的转化植物还有很多其他的益处。

在一个替代的实施方案中,可以利用本发明所述B.t.分离物或表达此处描述的毒素的重组微生物来控制害虫。因此,本发明包括基本上完整的B.t.细胞,以及包含被表达的本发明所述毒素的重组细胞。在目标害虫所处环境中使用所述基本上完整的细胞时,可以将所述细胞进行处理以便延长其杀虫活性。参见例如美国专利4695462、4861595和4695455。处理细胞作为杀虫毒素的保护层起作用。在被目标昆虫吸收时毒素变成有活性。

苏云金芽孢杆菌分离物PS86A1和PS52A1的特性,比如菌落形态、包涵物类型和碱溶性蛋白质的大小(通过SDS-PAGE)分别在例如美国专利5,427,786和已公开的PCT申请WO 95/02694中公开了。

借助多项美国专利中描述的保藏物可以获得本发明有用的分离物。这类专利的例子在背景技术部分(见前文)有更详细的讨论。本申请中公开的培养物已保藏于农业研究机构专利保藏中心(NRRL),Northern Regional Research Center,1815 North University,Street,Peoria,Illinois 61604,USA。

                                表1.  培养物    保藏号    保藏日期  B.t.武汉变种P586A1  B.t.武汉变种PS52A1 NRRL B-18400 NRRL B-18245    1988年8月16日    1987年7月28日

所述培养物已进行了保藏,在该专利申请的待审期内,保证根据37 CFR 1.14和35 U.S.C.122.授权的专利和商标委员会所确定的人能获取所述培养物。在提交了该申请的副本或其后续申请的国家中,可以按照该国专利法的要求提供所述保藏物。但是,应当明白保藏物的可获得性并不构成对以侵犯由政府行为授予的专利权来实施本发明的许可。

此外,应按照微生物保藏的布达佩斯条约款项来保存和对公众发放所述保藏培养物,即应小心储存以保证其在最近一次要求重新提供保藏物样品后至少5年内,以及任何情况中在保藏日后至少30年内或公开该培养物的专利授权后的有效期内存活并不被污染。由于保藏物状况使得无法由保藏物提供样品时,保藏者承担替换保藏物的责任。公众获取所述培养物的全部限制在公开该培养物的专利被授权时去除。

基因和毒素。本发明的某些DNA序列在此处具体地例证。这些序列是发明的范例。显然,本发明包括此处具体示范的基因和序列,也包括与此处具体公开的基因和序列相比,显示出相同或类似杀虫活性和在植物中表达方面的特性的等同体、变体、变异体、突变体、融合体、嵌合体、截短形式、片段以及更小的基因。

此处具体示范的保持了示范性毒素杀虫活性的基因和毒素片段在本发明的范围内。本发明有用的基因和毒素包括全长序列和这些序列的保留了具体示范性毒素的特征性杀虫活性的片段。

变体DNA序列在本发明的范围内。此处所用变体和等同体指含有不会根本影响所述基因的表达以及所得编码毒素(尤其是在植物中)的杀虫活性的核苷酸(或氨基酸)取代、缺失、添加或插入的序列。此处所用术语基因的“变体”或“变异体”指编码相同毒素或编码具有相当杀虫活性的毒素的核苷酸序列。此处所用术语“等同毒素”指具有与举例的毒素相同或基本相同的抗目标害虫的生物活性的毒素。

正如本领域技术人员已知的,可以对基因进行修饰,可以很容易地构建基因变异体。例如,美国专利5,605,793描述了利用随机片段化后进行DNA重装配来产生另外的分子多样性。制备点突变有标准技术。使用定点诱变是本领域已知的。所述基因的片段可以利用商品外切核酸酶或内切核酸酶按照常规操作制备。例如,酶如Ra131可以用来逐步地从这些基因末端切下核苷酸。利用许多限制酶都可以获得有用的基因。可以用蛋白酶直接获得这些毒素的活性片段。

由于遗传密码的简并性,许多不同的DNA序列都能编码此处公开的氨基酸序列。本领域技术人员能够制造出编码相同或基本上相同的毒素的其它DNA序列。这些变体DNA序列在本发明范围内。“基本上相同的”序列用在此处是指含有不会实质性地影响杀虫活性的氨基酸取代、删除、添加或插入的序列。

显然对本领域技术人员来说,给了此处阐述的基因和毒素的序列,可以通过几种途径获得发明所述基因和毒素。例如,可以利用基因合成仪合成性地构建所述基因。所述基因和毒素还可以来源于保藏在上面描述过的培养物保藏中心的分离物的野生型基因和毒素。等同毒素和/或编码这些等同毒素的基因可以利用此处给出的教导从芽孢杆菌分离物和/或DNA文库获得。

正如技术人员容易想到的,DNA可以是双链形式的。在这种排列方式中,一条链与另一链互补,反之亦然。在本领域内“编码链”通常用来指含有一系列密码子(密码子是能三个一组地阅读从而产生特定氨基酸的三个核苷酸)的链,它能被作为一个开放读码框(ORF)阅读从而产生目的蛋白质或肽。为了在体内表达蛋白质,通常将DNA的一条链翻译成RNA的互补链,后者作为蛋白质的模板。当在(例如)植物中复制DNA时,将产生另外的DNA互补链。因此,本发明包括使用所附序列表中示范的多核苷酸或其互补链。与示范DNA在功能上等同的RNA和PNA(肽核酸)包括在本发明中。因此,在优选实施方案中,所述多核苷酸的直接或间接表达将直接或间接地在胞内产生并保留所需多肽或蛋白质。

许多方法可以获得本发明的杀虫毒素。例如,可以利用此处公开并请求保护的杀虫毒素的抗体来从蛋白质混合物中鉴定和分离毒素。具体来说,可以针对毒素中最稳定并且与其他芽孢杆菌毒素最不同的部分来制备抗体。然后可以用这些抗体通过免疫沉淀、酶联免疫吸收法(ELISA)或Western印迹来特异识别具有特征性活性的等同毒素。利用本领域的常规步骤可以容易地制备出此处公开的毒素、或等同毒素或者这些毒素的片段的抗体。

文中具体示范了本发明的某些毒素;这些毒素只是发明所述毒素的范例。显然,本发明包括具有与示范的毒素相同或类似杀虫活性的变体或等同毒素(以及编码等同毒素的核苷酸序列)。等同基因能编码与所述基因编码的毒素有高度氨基酸相同性或同源性的毒素。等同毒素与示范的毒素有氨基酸同源性。该氨基酸相同性通常大于60%,优选大于75%,更优选大于80%,更优选大于90%,甚至可以大于95%。这些相同性是用标准的比对技术确定的。在Criclemore等的文中(同前)讨论了优选的确定相同性百分数的方法。毒素中的关键区域,即决定生物活性或参与决定三维构型(这最终决定生物活性)的区域中的氨基酸同源性最高。就这方面来说,某些氨基酸取代是可以接受和预料的,如果这些取代位于非活性关键区或者是不影响分子的三维构象的保守性氨基酸取代。例如,氨基酸可以分入下列类型:非极性氨基酸、不带电荷的极性氨基酸、碱性氨基酸和酸性氨基酸。一个组中的氨基酸被同类的另一氨基酸代替,只要该取代不会实质性地改变化合物的生物活性,这样的保守性取代就落在本发明的范围内。表2提供了各类氨基酸的例子。

    表2    氨基酸类型    氨基酸例子    非极性氨基酸    不带电荷的极性氨基酸    酸性氨基酸    碱性氨基酸    Ala、Val、Leu、Ile、Pro、Met、Phe、Trp    Gly、Ser、Thr、Cys、Tyr、Asn、Gln    Asp、Glu    Lys、Arg、His

在某些情况中,也可以制备非保守性取代。关键因素是这些取代不能显著降低毒素的生物活性。

文中提及的“分离的”多核苷酸和/或“提纯的”毒素是指这些分子与其他在自然状态中结合在一起的分子脱离,并且包括其在植物中的应用。因此,提及“分离和纯化的”表示有文中描述的人的参与。嵌合毒素和基因也包括人的作用。

可以表达全长B.t.毒素然后通过加入适当的试剂和/或使培养物生长在导致蛋白质经偶然的内源蛋白酶的作用被截除的条件下,从而将其转化为活性、截短的形式。在一个替代的实施方案中,可以对全长毒素进行其他修饰以便生成活性形式的毒素。可以通过调节毒素的稳定性,以及其他反应条件,比如pH、离子强度、或氧化还原电势来完成对毒素的预期修饰。可以通过用丝氨酸蛋白酶,比如用牛胰蛋白酶在碱性pH,并优选没有β-巯基乙醇的情况下处理苏云金芽孢杆菌的结晶δ-内毒素,获得发明所述截短形式的毒素。

也可以根据本发明的教导使用嵌合和/或融合基因和毒素(通常通过将来自多个芽孢杆菌毒素或基因的部分合并在一起,或者将全长基因和毒素合并在一起或者其各种组合形式产生的)。本发明包括在制备融合蛋白和融合基因中使用全部或部分毒素和基因。也可以通过将多种毒素的部分结合在一起来制备嵌合毒素。

已经建立了通过将B.t.晶体蛋白的部分结合在一起来产生有用的嵌合毒素的方法。所述被结合的部分其自身不需要能杀虫,只要各部分的结合形成了能杀虫的嵌合蛋白质即可。利用限制酶,按照例如欧洲专利0 228 838、Ge.AZ.,N.L.Shivarova,D.H.Dean(1989)美国科学院学报86:4037-4041、Ge AZ.,D.Rivers.R.Milne.D.H.Dean(1991)生物化学杂志266:17954-17958、Schnepf.H.E..K.Tomczak,J.P.Ortega.H.R.Whiteley(1990)生物化学杂志265:20923-20930;Honee,G..D.Convents,J.Van Rie,S.Jansens.M.Peferoen.B.Visser(1991)分子微生物学5:2799-2806中的描述可以实现这种目的。可选择地,可以用借助细胞重组机制的重组方法来取得类似的结果。参见,例如Caramori,T.,AM.Albertini,A.Galizzi(1991)基因98:37-44;Widner,W.R.,H.R.Whiteley(1990)细菌学杂志172:2826-2832;Bosch,D.,B.Schipper,H.van derKliej,RA.de Maagd,W.J.Stickema(1994)生物技术12:915-918。本领域已知有许多其他方法可以制备这类嵌合DNA。本发明意欲包括那些使用在本申请中确定的新序列的嵌合蛋白质。

此外,可以用本发明的毒素相互结合或与其他毒素结合来增强对害虫的控制。当然,这包括在控制那些已对1或多种毒素有抗性的害虫的方案中将所述毒素与不同毒素一起使用。

根据文中提供的教导,本领域技术人员能很容易地制备和使用此处描述的各种毒素和多核苷酸序列。

重组宿主和其他应用方法。可以将本发明所述编码毒素的基因导入多种微生物或植物宿主。文中使用的术语“异源”基因指不是天然存在于转化了该基因的宿主中的基因。在优选实施方案中,毒素基因的表达直接或间接导致杀虫剂在胞内产生并存留。

当本发明的转化植物被害虫摄取时,害虫将摄取所述毒素。结果就控制了害虫。植物体内表达毒素蛋白的益处包括使杀虫剂免于环境的降解和灭活。在植物体内使用也能避免为了接触并控制目标害虫而对植物或有害虫的部位喷洒或以其他方式施用生物体和/或毒素时的时间和费用。

可以经合适的载体将所述B.t.毒素基因导入宿主,优选植物宿主。有许多合适的目的作物,比如棉花、玉米和向日葵。

文中举例的合成的、为植物而优化的基因尤其适用于使基因在转化植物中稳定地保持和表达。

在本发明的某些实施方案中,转化的微生物宿主可以用于制备前体物质的初始步骤,所述前体最终用于转化植物细胞和/或植物。以这种方式转化和使用的微生物在本发明的范围内。重组微生物可以是,例如B.t.、大肠杆菌、或假单胞菌(比如荧光假单胞菌)。本领域技术人员利用常规技术即可实现转化。文中公开了转化所需材料,或者是技术人员容易得到的。

作为使用转化了本发明所述基因的植物的替代方法,可以用文中描述的表达毒素的B.t.分离物或重组微生物来控制害虫。

可以用常规培养基和发酵技术来培养发明所述B.t.分离物。一俟发酵循环结束,即可以通过首先借助公知的手段从发酵液中分离B.t.芽孢和晶体来收集细菌。通过加入表面活性剂、分散剂、惰性载体以及其他有助对特定目标害虫进行处理和使用的成分,可以将回收的B.t.芽孢、晶体和/或毒素制成可湿性粉剂、液体浓缩物、颗粒或其他剂型。这些制剂和应用步骤是领域内公知的。

本发明还包括以上B.t.分离物的突变体,所述突变体与亲本B.t.分离物的杀虫特性基本相同。通过领域内公知的操作可以制备到突变体。紫外光和亚硝基胍被广泛地用于这一目的。通过对分离物进行甲磺酸乙酯(EMS)诱变可以获得不产孢子的突变体。

可以将被转化来表达本发明所述的1或多个基因的合适微生物宿主(例如假单胞菌)施用到有害虫的地点,在此转化宿主可以增殖和/或被摄取。结果就能控制害虫。

可选择地,可以在能延长毒素活性和使细胞稳定的条件下杀死和处理载有毒素基因的微生物,然后将处理过的细胞(所述细胞保留有毒性)施加到有目标害虫的环境中。参见例如美国专利4,695,462、4,861,595和4,695,455。因此,本发明包括含有得到表达的发明所述毒素的基本上完整的B.t.细胞和/或重组细胞的处理。这种处理使得将基本上完整的细胞施加到有害虫的环境时能延长杀虫活性。这类处理可以是化学或物理手段,或者两种手段联合使用,只要该技术不会负面影响杀虫剂的特性,也不会使细胞保护杀虫剂的能力丧失即可。处理过的细胞作为杀虫毒素的保护层。毒素在被目标昆虫摄食时可发挥作用。

合成的、为植物而优化的基因.根据本发明,优选的合成B.t.基因包括这样的核苷酸序列,它们有(1)比天然B.t.基因多的植物偏爱的密码子,(2)密码子使用频率更接近预期的植物宿主而非天然B.t.基因,或者(3)基本上所有的密码子包含都在预期的植物宿主中使用频率最高的密码子。本发明提供了尤其适用于转化植物的合成基因的具体实施方案,与文中示范的基因功能等同的其他基因也可以用来转化宿主,尤其是植物宿主。在例如美国专利5,380,83l中有制备用于植物的合成基因的其他指导。

多核苷酸探针。鉴定有用毒素和基因的一个方法是通过使用寡核苷酸探针。这些探针是可检测性的核苷酸序列。探针提供了一种鉴定编码毒素的基因的快速方法。可以利用DNA合成仪和常规操作来合成用作探针的核苷酸片段。

众所周知,DNA具有的一个基本特性是碱基互补性。在自然界中,DNA通常以一对反向链的形式存在,每条链上的碱基从该链向其相对链伸出。一条链上的碱基腺嘌呤(A)总是与另一链上的碱基胸腺嘧啶(T)相对,而碱基鸟嘌呤(G)总是与胞嘧啶(C)相对。碱基通过其以这种特异方式形成氢键的能力留在原位。每个键比较弱,但许多相邻的氢键结合的碱基的净效应,加上碱基堆积效应是两条互补链的稳定结合力。可以通过比如高pH或高温处理来打断这些键,这些条件造成双链的分离或变性。如果随后将DNA置于能使碱基在热动力学上有利于氢键结合的条件下,所述DNA链会退火,或“杂交”,并重新形成原始的双链DNA。如果是在合适的条件下进行的,所述杂交能作到高度特异。即,只有碱基互补性高的链能形成稳定的双链结构。杂交特异性与反应条件的关系是众所周知的。因此,可以利用杂交来检测两段DNA的碱基序列是否互补。正是该杂交机制使得利用探针能容易地检测和鉴定目的DNA序列。

探针可以是RNA、DNA或PNA(肽核酸)。所述探针通常有至少大约10个碱基,更通常有至少大约17个碱基,也可以有多达大约100个甚至更多个碱基。更长的探针也可很方便使用,这样的探针可以长达例如几千碱基对。将探针序列设计成至少与编码目的毒素的基因的一部分基本上互补。探针不必与待杂交序列完全互补。可以采用本领域技术人员熟知的技术将探针标记。

使用探针的一个步骤要求首先通过对芽孢杆菌分离物的基因文库进行Southern印迹分析来鉴定与已公开核苷酸序列同源的所有DNA片段。因此,不借助生物学分析,就有可能预先知道许多新芽孢杆菌分离物,以及给定芽孢杆菌分离物表达的单个基因产物的可能活性。这种探针分析提供了一种在许多B.t.亚种中鉴定有潜在商业价值的杀昆虫毒素基因的快速方法。不需要特殊的杂交技术。随着杂交技术的改进,可以很容易地应用。

一个适用的杂交过程通常包括分离目的DNA样品并化学纯化之的起始步骤。可以使用裂解的细菌或分离自细菌的完全分级化的核酸。可以采用已知技术处理所述细胞以便释放其DNA(和/或RNA)。用合适的限制酶可以将DNA样品切成片段。通过在凝胶,通常是琼脂糖或丙烯酰胺凝胶中进行电泳可以将这些片段按大小分离。可将目的片段转移到固定化膜上。

然后可以使探针和样品在杂交缓冲溶液中合并,并维持在适当的温度下至发生退火。此后,洗去膜上的无关物质,留下样品和结合的探针分子,通常经放射自显影和/或液体闪烁计数来检测和定量。本领域已知,如果探针分子和核酸样品通过两分子间形成强的非共价键杂交,可以合理地推断探针和样品基本相同。探针上的可检测标记提供了一种以已知方式来确定是否发生杂交的手段。

在用核苷酸片段作为探针时,用任何本领域技术人员已知的合适的标记物,包括放射性和非放射性标记物将特定探针标记。典型的放射性标记物包括32P、35S等。非放射性标记包括,例如配体(比如生物素或甲状腺素)、酶(比如水解酶或过氧化物酶),或者各种化学发光剂(比如萤光素)或荧光化合物(如荧光素及其衍生物)。可以按照国际申请WO 93/16094的描述将探针制成本身发荧光的。

可以按照以下描述采用各种严谨度的杂交。条件越严谨,形成双螺旋所需的互补性越高。可以通过温度、探针浓度、探针长度、离子强度、时间等来控制严谨度。优选地,在中等至高度严谨的条件下,通过公知技术(例如Keller,G.H.,MM.Manak(1987)DNA探针,Stoclcton Press,New York,NY.169-170页中描述的)进行杂交。

Southern印迹上固定的DNA与32P标记的基因特异性探针的杂交可以经常规方法(Maniatis et al.[1982]分子克隆:实验指南,ColdSpring Harbor Laboratory,Cold Spring Harbor,NY)进行。一般来说,可以在低度、中等、和/或高度严谨条件下作杂交和随后的洗涤,从而能检测与示范的毒素基因同源的目标序列。对双链DNA基因探针,可以于比DNA杂合体的解链温度(Tm)低20~25℃的温度下,在6X SSPE、5X Denhardt氏溶液、0.1%SDS、0.1mg/ml变性DNA中进行杂交过夜。下列公式表示了解链温度(Beltz,G.A.,K.A.Jacobs,T.H.Eickbush,P.T.Cherbas,和F.C.Kafatos[1983]酶学方法,R.Wu,L.Grossman和K.Moldaye[编]Academic Press,New York 100:266-285)。

Tm=81.5℃+16.6Log[Na+]+0.41(%G+C)-0.61(%甲酰胺)-600/双螺旋碱基对长度。

通常如下进行洗涤:

(1)在1X SSPE、0.1%SDS中于室温洗涤两次15分钟(低严谨度洗涤)。

(2)在0.2X SSPE、0.1%SDS中于Tm-20℃洗涤1次15分钟(中等严谨洗涤)。

其他的低严谨度洗涤包括于37℃在6X SSPE、0.1%SDS中或者于Tm-20℃在2X SSPE、0.1%SDS中进行。

对于寡核苷酸探针,可以在比解链温度(Tm)低10-20℃温度下,在6X SSPE,5X Denhardt氏溶液、0.1%SDS、0.1mg/ml变性DNA中过夜杂交。可以按照以下公式确定寡核苷酸探针的Tm:

Tm(℃)=2(T/A碱基对数目)+4(G/C碱基对数目)(Suggs,S.V.,T.Mivake.E.H.Kawashime.M.J.Johnson,K.Itak’ura,和RB.Wallace[1981]ICN-UCLA Symp.Dev.Biol.Using Purified Genes,D.D.Brown[编],Academic Press,New York.23:683-693)。

通常如下进行洗涤:

(1)在1X SSPE、0.1%SDS中于室温洗涤两次15分钟(低严谨度洗涤)。

(2)在1X SSPE、0.1%SDS中于杂交温度洗涤1次15分钟(中等严谨洗涤)。

一般来说,可以改变盐和/或温度使严谨度发生变化。此外,可以用甲酰胺或水溶液洗。甲酰胺洗涤需要的温度比水溶液洗低。对于>70左右碱基的标记DNA片段,可以使用以下条件(水溶液洗涤):

                    低严谨:    1或2X SSPE,室温

                    低严谨:1或2X SSPE,42℃

                    中等严谨:0.2X或1X SSPE,65℃

                    高度严谨:0.1X SSPE,65℃。

双螺旋的形成和稳定性依赖于杂合体双链之间的基本互补性,但如上提及的,可以容忍一定程度的错配。因此,有用的探针序列可以包含所描述的序列的突变(单个和多个突变)、缺失、插入,以及这些情况的组合,其中所述突变、插入和缺失仍能保证与目的靶多核苷酸形成稳定的杂合体。可以多种方式在给定多核苷酸序列中产生突变、插入和缺失,这些方法是本领域技术人员已知的;将来可能有其他方法。可以将这些变体以和原始引物序列相同的方式使用,只要它们与原序列有相当的序列同源性即可。文中所用“相当的序列同源性”指该同源性足够保证变体探针以和原探针相同的能力发挥作用。优选地,这种同源性是50%以上;更优选地,该同源性大于75%,最优选地,该同源性大于90%。所述变体以预期能力发挥作用必需的同源性程度取决于该序列的预期用途。本领域技术人员有能力制备突变性、插入性和缺失性变化,设计这些变化是为了提高序列的功能,或者提供一种方法上的便利。

PCR技术。聚合酶链反应(PCR)是一种反复的、酶催化的、引导性的核酸序列合成。该过程是公知并被本领域技术人员广泛使用的(参见,Mullis.美国专利4,683,195、4,683,202和4,800,159;Saiki.Randall K.,Stephen Scharf,Fred Faloona.Kary B.Mullis,GlennT.Horn,Henry A.Erlich,Norman Artiheim[1985]“诊断镰形细胞贫血病的β-珠蛋白基因组序列的酶法扩增以及限制位点分析”科学230:1350-1354.)。PCR基于对侧翼为两个与目的序列相对链可杂交的寡核苷酸引物的目的DNA片段进行酶法扩增。该引物的方向是3’端相对。反复循环的模板热变性、引物与其互补序列退火以及DNA聚合酶引导的退火引物的延伸使由PCR引物5’末端界定的片段得以扩增。由于每个引物的延伸产物可以作为另一引物的模板,每次循环基本能使前一循环产生的DNA片段的量加倍。这就导致特异靶片段的指数累积,在几个小时内达到几百万倍。通过使用热稳定的DNA聚合酶,比如Taq聚合酶(其分离自嗜热杆菌水生栖热菌),扩增过程可以完全自动化。其他可以使用的酶是本领域技术人员已知的。

可以设计DNA序列并用作PCR扩增的引物。进行PCR扩增时,可以容忍引物和模板之间一定程度的错配。因此,可以通过本领域普通技术人员已知的方法在给定引物中形成突变、缺失和插入(尤其是向5’末端添加核苷酸)。

文中提及的所有文献在此引入作为参考。

以下是阐述实施本发明的过程的实施例。这些实施例不应理解为对发明的限制。除非另外指出,所有的百分数是重量百分比,溶剂混合比均为体积份。

实施例1-本发明的B.t.分离物的培养

可以用B.t.分离物的次级培养物来接种以下培养基(蛋白胨、葡萄糖、盐培养基,pH7.2):

Bacto蛋白胨     7.5g/l

葡萄糖          1.0g/l

KH2PO4       3.4g/l

K2HPO4       4.35g/l

盐溶液          5.0ml/l

CaCl2溶液      5.0ml/l

盐溶液(100ml)

MgSO4.7H2O   2.46g

MnSO4.H2O    0.04g

ZnSO4.7H2O   0.28g

FeSO4.7H2O   0.40g

CaCl2溶液(100ml)

CaCl2.2H2O   3.66g

将盐溶液和CaCl2溶液过滤除菌,并在接种时加入高温灭菌培养液。摇瓶于30℃在震荡器上以200rpm培养64小时。

通过本领域的已知操作很容易将以上过程扩大到更大的发酵罐中。

通过本领域的已知操作可以分离出在以上发酵过程获得的B.t.芽孢和晶体。一种常用操作是对收集到的发酵液使用分离技术,例如离心。

实施例2-来自苏云金芽孢杆菌PS52A1和PS86A1株的新毒素基因的分子克隆、表达和测序

苏云金芽孢杆菌(B.t.)PS52A1和PS86A1株于30℃生长至600nm的光密度为1.0,从细胞中制备总细胞DNA。经离心沉淀细胞,并重悬在原生质体缓冲液(在0.3M蔗糖、25mM Tris-Cl[pH8.0]、25mM EDTA中20mg/ml溶菌酶)中。于37℃保温1小时后,通过两个冻融循环将原生质体裂解。向完全裂解液中加入9个体积的0.1M NaCl、0.1%SDS、0.1M Tris-Cl[pH8.0]溶液。用酚∶氯仿(1∶1)将澄清的裂解液提取两次。用两体积乙醇沉淀核酸并经离心沉淀。沉淀重悬于TE缓冲液(10mM Tris-Cl[pH8.0]、1mM EDTA)中,加入RNase至终浓度50μg/ml。于37℃保温1小时后,溶液用苯酚∶氯仿(1∶1)和TE-饱和的氯仿各提取1次。通过加入1/10体积3M NaOAc和2体积乙醇从液相中沉淀DNA。经离心沉淀DNA,用70%乙醇洗涤,干燥并重悬于TE缓冲液中。

还从B.t.菌株PS86A1中制备质粒DNA。使B.t.细胞于30℃生长至600nm光密度1.0。经离心沉淀细胞,重悬于原生质体缓冲液(在0.3M蔗糖、25mM Tris-Cl[pH8.0]、25mM EDTA中20mg/ml溶菌酶)中。在冰上保持30分钟后,加入10体积裂解缓冲液(溶于TE缓冲液的0.085MNaOH、0.1%SDS)。于室温将裂解物轻轻摇晃30分钟。向上清液中加入半体积的3M KOAc,于4℃保温过夜。用1体积异丙醇集聚核酸,并经离心沉淀,用70%乙醇洗涤,干燥,并重悬于TE缓冲液中。进一步用苯酚∶氯仿(1∶1)提取1次来纯化DNA悬液。通过加入1/10体积3M NaOAc和1体积异丙醇来沉积液相中的DNA。离心沉淀DNA,用70%乙醇洗涤,干燥并重悬于TE缓冲液中。向DNA溶液中加入与其体积相等重量的CsCl,并加入溴乙锭至终浓度0.5mg/ml。经过夜超速离心从无关的核酸中分离出质粒DNA。用过量的水饱和丁醇将纯化的质粒条带提取5次,并对TE缓冲液透析。按照先前的描述,将DNA聚集、沉淀、洗涤、干燥并重悬于TE缓冲液中。根据PS86A1 45kDa多肽的氨基端氨基酸序列数据,合成下列正向寡核苷酸序列(SEQ ID NO.1)用于Southern杂交:5’-TGGATAAAAAATCWATWACACATGAAGAATTTATWMGACA-3’,按照标准的IUPAC条约,其中W=A或T,M=A或C。

用所选的限制内切核酸酶消化PS86A1总细胞和质粒DNA,在琼脂糖凝胶上电泳,然后印迹至尼龙膜上,通过于80℃“烘烤”将膜固定。用上面描述的寡核苷酸探针作限制片段长度多态性(RFLP)分析。于37℃在6X SSPE、5X Denhardt’s溶液、0.1mg/ml单链载体DNA和0.1%SDS中作Southern印迹杂交过夜。然后于37℃C在1X SSPE、0.1%SDS中清洗印迹,风干,随后对X-ray胶片曝光。放射自显影在总细胞DNA和质粒DNA印迹中均鉴定到一个大约6.6 kbp的Xba Ⅰ条带,该条带理论上含有全部或部分PS86B1(b)毒素基因。

将所述大约6.6kbp的XbaⅠ片段克隆至pHTBlueⅡ(一种大肠杆菌/苏云金芽孢杆菌穿梭载体,含有pBluescriptⅡ SK-(Stratagene,La Jolla.CA),和来自固有B.t.质粒的复制起点,Lereclus等[1989FEMS微生物学快报60:211-218))。用前面描述的正向寡核苷酸引物和载体引物进行聚合酶链反应(PCR)作图以便确定该片段是否含有全长基因。联合使用正向引物与载体引物T7使得只有一个大约400bp的片段发生扩增,而不是所预期的编码45kDa蛋白质的近于1.0kbp的基因。这证明只有P586A1(b)毒素基因的大约三分之一被克隆。使用测序酶(US Riochemical,Cleveland,OH)在亚基因构建体上通过双脱氧核苷酸测序(Sanger等[1977]美国科学院学报74:5463-5467)可以给出进一步证明。随后用32P将PCR片段放射标记,并作为Southern印迹与PS86A1和PS52A1总细胞DNA基因文库进行常规杂交的探针。

从用Sau3AⅠ部分消化的PS86A1总细胞DNA构建基因文库。经琼脂糖凝胶电泳将部分限制酶切物分开。将9.3到23 kbp的DNA片段从胶上切下,从胶条上电洗脱下来,在Elutip-D离子交换柱(Schleicher andSchuell,Keene,NH)上纯化,并经乙醇沉淀回收。将Sau3AⅠ插入片段连接至用BamHⅠ消化过的LambdaGem-11(Promega,Madison,WI)。包装重组噬菌体并铺在大肠杆菌KW251(Promega,Madison,WI)细胞上。通过将重组噬菌体DNA转移至膜上,并用前面描述的PCR探针杂交来筛选噬斑。于37℃在含有6X SSPE、5X Denhardt’s溶液、0.1mg/mL单链载体DNA,以及0.1%SDS的溶液中过夜杂交。随后于37℃在1X SSPE和0.1%SDS中洗膜,风干,然后对X-光胶片曝光。将杂交噬菌体进行噬斑纯化并用来感染大肠杆菌KW251细胞的液体培养物从而通过常规操作(Maniatis等[1982]分子克隆:实验指南,Cold Spring HarborLaboratory,Cold Spring Harbor,NY)分离DNA。用所选限制内切酶消化噬斑纯化的杂交噬菌体DNA,使用PCR扩增的探针和以上描述的洗涤条件对其进行的Southern印迹显示出一个大约2.3kbp的EcoRⅤ+SalⅠ片段,相信该片段含有PS86A1(b)基因。

为了亚克隆编码大约45kDa毒素的PS86A 1(b)基因,用EcoRⅤ和SalⅠ消化制备量的噬菌体DNA。将所述大约2.3kb的条带连接到用Smal+SalⅠ消化过的pHTBlueⅡ中。用连接体系转化冷冻的感受态大肠杆菌NM522细胞(ATCC 47000)。对碱法小量制备的质粒DNA进行限制酶切筛选出β-半乳糖苷酶阴性的转化子。预期的质粒构建体pMYC2344含有PS86A1(b)毒素基因。经电穿孔将pMYC2344导入无晶体(Cry-)B.t.宿主CryB(A.Aronson.Purdue University,West Larayette,IN)中。由显微镜检观察晶体的形成以及SDS-PAGE分析证实毒素的表达。B.t.中的基因构建体pMYC2344命名为MR509。

86A1(b)基因的序列示于SEQ ID NO.2,86A1(b)毒素的推断氨基酸序列示于SEQ ID NO:3。

PS86A1(b)的探针、杂交和洗涤条件还用来克隆一个相关基因-来自苏云金芽孢杆菌菌株PS52A1的PS52A1(b)。从用Sau3AⅠ部分消化的PS52A1总细胞DNA构建基因文库。经琼脂糖凝胶电泳将部分限制酶切产物分开。将9.3到23 kbp的DNA片段从胶上切下,从胶条上电洗脱下来,在Elutip-D离子交换柱上纯化,并经乙醇沉淀回收。将该Sau3AⅠ插入片段连接至用BamHⅠ消化过的LambdaGem-11。包装重组噬菌体并铺在大肠杆菌KW251细胞上。通过用前面描述的PCR探针进行杂交来筛选噬斑。将杂交噬菌体进行噬斑纯化并用来感染大肠杆菌KW251细胞的液体培养物从而通过常规操作分离DNA。用所选限制内切酶消化噬斑纯化的杂交噬菌体DNA,使用PCR探针对其进行的Soutern印迹显示出一个大约2.3kbp的EcoRⅤ+SalⅠ片段,相信该片段含有PS52A1(b)基因。

为了亚克隆编码大约45 kDa毒素的PS52A 1(b)基因,用EcoRⅤ和SalⅠ消化制备量的噬菌体DNA。将所述大约2.3kb的条带连接到用SmaⅠ+SalⅠ消化过的pHTBlueⅡ中。用连接体系转化冷冻的感受态大肠杆菌NM522细胞。对碱法小量制备的质粒DNA进行限制酶切筛选出β-半乳糖苷酶阴性的转化子。预期的质粒构建体pMYC2349含有52A1(b)毒素基因,该基因与其他编码杀虫蛋白的毒素基因相比是新的。经电穿孔将pMYC2349导入无晶体(Cry-)B.t.宿主CryB中。显微镜检观察晶体的形成以及SDS-PAGE分析证实毒素得以表达。B.t.中的基因构建体pMYC2349命名为MR510。

52A1(b)基因的序列示于SEQ ID NO.4,52A1(b)毒素的推断氨基酸序列示于SEQ ID NO.5。

实施例3-MR509/86A1(b)毒素抗菜跳甲的生物检测

收集野生十字花菜跳甲并盛在25℃、16L:8D光照周期的饲养室中。将5粒canola(Hyola 401)种子种在普通罐装土中。从幼苗上切下子叶并浸在用0.1%Bond(作为粘着剂)制成的B.t.MR509悬液(100ug毒素/ml)中。将单个处理的子叶干燥并放在盛有大约1ml 2%琼脂凝胶的塑料孔(NuTrend托盘)中。该琼脂凝胶作为湿分来源以便提高切下来的子叶的寿命。在每个测试孔中放入一个成年甲虫,室温保存。处理后第4和7天测试死亡率和植物损伤。在1-10分范围评价子叶损伤,10分对应于植物组织完全破坏。

几个处理样品显示出相对未处理和CryB(无晶体B.t.菌株)对照其植物损伤降低。来自MR509的大约45 kDa的蛋白质被确定为抗受测十字花菜跳甲害虫活性很高;该毒素即是86A1(b)基因。

实施例4-进一步的生物检测:MR509/86A1(b)和MR510/52A1(b)抗菜跳甲

在下列实验中评估MR509和MR510。用CryB作为阴性对照。其他阴性对照是未处理的叶子和加入作为散布剂-粘着剂的Bond溶液。

将新萌发的子叶切下,浸在实验悬浮液中。干燥后,用2个成年跳甲虫侵染子叶。在处理后第4天估计叶子的损伤。在0到10的范围内估计叶子损伤程度,0表示无损伤:

克隆MR509和MR510明确显示剂量依赖性的叶子保护力。MR510的活性尤其如此。

实施例5-截短的天然86A1(b)和52A1(b)毒素

使用本领域技术人员已知的技术(其中的一些在上面讨论过),可以将天然蛋白质截短。技术人员可以利用文中提供的指导和本领域的已知技术来对这些截短的毒素进行活性筛选。优选的截短的蛋白质示于SEQ ID NO.8-19中。本方面还包括编码这些示范的截短蛋白质,以及举例说明的毒素的其他截短形式、片段和变体的多核苷酸,只要这些截短形式、片段和变体保持杀虫活性,优选抗鞘翅目,最优选抗跳甲虫活性即可。

本发明所述的截短的毒素包括文中示范的在氨基端或羧基端有缺失的毒素,也包括在天然蛋白质氨基端和羧基端部分均有缺失的毒素。这类截短分子的例子包括利用文中示范的任何氨基端缺失和任何羧基端缺失一起产生的蛋白质。

实施例6-86A1(b)和52A1(b)毒素的进一步鉴定

制备抗天然毒素52A1(b)的多克隆抗体R#56并将其纯化。该抗体能识别天然86A1(b)毒素。可以用于印迹筛选(斑点、狭线和/或Western印迹)来确定52A1(b)和86A1(b)毒素的同系物是否存在于芽孢杆菌其他菌株中。

因此,在本发明其他实施方案中,通过它们与文中举例说明的杀虫毒素的抗体的反应水平来定性和/或鉴定另外的杀虫毒素。可以针对本发明特别举例的毒素来生产抗体。然后通过与所述抗体的反应性来鉴定和/或定性本发明范围内的其他毒素。在一个优选实施方案中,所述抗体是多克隆抗体。在这个实施方案中,与52A1(b)或86A1(b)毒素相似性最高的毒素和多克隆抗体反应性应该最强。差异更大的毒素也能与多克隆抗体反应,但程度较小。

实施例7-将毒素基因插入植物

本发明的一个方面是用编码发明所述杀虫毒素的基因转化植物。转化植物能抗目标害虫的攻击。优选的基因能在转化植物和/或植物细胞中稳定地维持并高水平表达。SEQ ID NO.6中提供了一个优选的合成的、为植物而优化的基因的例子,它是来源自MR510的为双子叶植物优化的基因。该基因所编码的蛋白质在SEQ ID NO.7中给出(氨基酸缩写按照标准的IUPAC规定)。

利用多种本领域公知的技术可以将文中公开的编码杀虫毒素的基因插入植物细胞。例如,有许多含有大肠杆菌的复制系统和使得转化细胞能被筛选出来的标记物的克隆载体可供将外源基因插入高等植物。这类载体包括,例如pBR322、pUC系列、M13mp系列、pACYC184等。因此,可以将编码芽孢杆菌毒素的序列插入所述载体中的适当的限制位点。将所得质粒用于转化大肠杆菌。在合适的营养基质中培养大肠杆菌细胞,然后收集并裂解。纯化质粒。一般性地进行序列分析、限制片段分析、电泳和其他生化-分子生物学方法。每步操作后,可以将所用DNA序列切割并连接至下一个DNA序列。每个质粒序列可以克隆到相同的或其他质粒中。根据所需基因插入植物的方法,可能需要其他DNA序列。例如,如果用Ti或Ri质粒转化植物细胞,那么至少要将Ti或Ri质粒的T-DNA的右边界序列,但通常是左右边界序列连接成待插入基因的旁侧区域。

用T-DNA转化植物细胞已有广泛的研究并且在EP 120516、Hoekema(1985):二元植物载体系统,Offset-durkkerij Kanters B.V.,AIblasserdam,第5章、Fraley等.,植物科学述评4∶1-46;以及An等(1985)EMBOJ4:277-287中有充分的描述。

插入的DNA一旦整合到基因组中,它就相对比较稳定。所述DNA通常含有选择标记,能赋予转化植物细胞对杀虫剂、除草剂(比如草甘膦或BASTA)或者抗生素(比如卡那霉素、G418、博莱霉素、潮霉素或氯霉素等)的抗性。单独采用的标记能相应地保证筛选出转化细胞而非不含插入DNA的细胞。

有许多技术可供将DNA插入植物宿主细胞。这些技术包括利用根癌农杆菌或发根农杆菌作为转化剂以T-DNA进行的转化、融合、显微注射、biolistic(微颗粒轰击)、PEG介导的DNA摄入或者电穿孔和其他可能的技术。如果用农杆菌进行转化,应将待插入DNA克隆至特殊的质粒中,即插入中间载体或二元载体。由于与T-DNA中的序列同源的序列,所述中间载体可以通过同源重组整合至Ti或Ri质粒。Ti或Ri质粒还包含T-DNA转移所必需的vir区。中间载体不能在农杆菌中自我复制。可以借助辅助质粒(接合)转移到根癌农杆菌中。二元载体在大肠杆菌和农杆菌中均可自我复制。它们含有以T-DNA左右边界区域界定的选择标记基因以及接头或者多接头。它们可以被直接转化到农杆菌中(Holsters等[1978]分子与普通遗传学163:181-187)。作为宿主细胞的农杆菌含有一个携带vir区的质粒。该vir区是T-DNA转移到植物细胞所必需的。也可以含有另外的T-DNA。这样转化的杆菌可以用于转化植物细胞。可以方便地用根癌农杆菌或发根农杆菌培养植物外植体从而使DNA转移到植物细胞中。然后可以在合适的培养基(可以含有用于选择的抗生素、除草剂或杀虫剂)中由被感染的植物材料(例如,叶片、茎段、根,或者是原生质体或悬浮培养的细胞)再生出完整植物。然后可以检测这样获得的植物中是否有插入的DNA。就注射和电穿孔的情况而言,对质粒没有特殊的要求。可以使用普通质粒,比如,例如pUC衍生物。在biolistic转化中,可以采用质粒DNA或线性DNA。

以通常方式将被转化的细胞再生为形态正常的植物。如果转化过程涉及种系细胞,那么插入的DNA和相应的表型性状会传递到后代植物。可以通过普通方式培养这样的植物,并与含有相同的转化遗传因子或其他遗传因子的植物杂交。根据遗传分离法则,所得后代植物有相应的表型性能。

在本发明的一个优选实施方案中,用含有优化用于植物的密码子的基因转化植物。参见,例如,美国专利5,380,831。同样有利地是,可以使用编码截短的毒素的DNA。所述截短的毒素通常编码全长毒素的大约55%到大约80%。制备用于植物的合成芽孢杆菌基因的方法是本领域已知的。

应当理解,文中描述的实施例和实施方案仅用于阐述发明,各种改进或变化对本领域技术人员是可以想见的,并且包含在本申请以及所附权利要求的精神和范围内。

                      序列表(1)一般信息:

(ⅰ)  申请人:MYCOGEN CORPORATION

      街道地址:5501 Oberlin Drive

      城市:San Diego

      州:California

      国家:US

      邮编:92121

      电话:(619)453-8030

      传真:(619)453-6991

(ⅱ)发明名称:控制鞘翅目害虫的苏云金芽孢杆菌毒素和基因

(ⅲ)序列数:19

(ⅳ)联系地址:

      (A)收信人:SaliWanchik,Lloyd & Saliwanchik

      (B)街道:2421 NW 41st Street,Suite A-1

      (C)城市:Gainesville

      (D)州:FL

      (E)国家:USA

      (F)邮编:32606

(ⅴ)计算机可读形式:

      (A)介质类型:软盘

      (B)计算机:IBM PC兼容机

      (C)操作系统:PC-DOS/MS-DOS

      (D)软件:PatentIn Release #1.0,Version #1.30

(ⅵ)当前申请信息:

      (A)申请号:

      (B)申请日:

      (C)分类:

(ⅶ)在先申请信息:

      (A)申请号:US09/076,193

      (B)申请日:12-MAY-1998

(ⅷ)代理人/代理机构信息:

      (A)姓名:Sanders,Jay M.

      (B)登记号:39,355

      (C)文档号:MA-716C1

(ⅸ)电信信息:

      (A)电话:(352)375-8100

      (B)电传:(352)372-5800(2)SEQ ID NO:1序列信息:

(ⅰ)序列特征:

      (A)长度:40个碱基对

      (B)类型:核酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子链型:DNA(基因组)

(ⅹⅰ)序列描述:SEQ ID NO:1:  TGGATAAAAA ATCWATWACA CATGAAGAAT TTATWMGACA               40(2)SEQ ID NO:2序列信息:

(ⅰ)序列特征:

      (A)长度:1089个碱基对

      (B)类型:核酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子链型:DNA(基因组)

(ⅹⅰ)序列描述:SEQ ID NO:2:

TTGAACAAAA AATCTATTAC TCATGAAGAA TTTATTAGAC AATTAAAAGA ATATAATTTA  60

GATAACAATC TTAATTATCA TGATCCAGCT GTACTAAAAA AAATTAATGA ATTATTACCT 120

GCTGATCAAC AATATGATTT AATTTCACCC ACTCAAGATT GGTATCAATT TAAAACTTTA 180

TATCCTATTT CTAAGAATGG TGTAATTATT TCATCTAATC TAGATGATAG CTCAAACGTT  240

CTAGTCCCAG AATTATCTGA AAATCCTTAT GATCCAATTC CCCAATCAGG TAAGTCAACA  300

ATTCAAACTG CTGTACGTTC ACCAGAAGCT CTTTATATTA TTCTAACTAC TAACAACAGT  360

CTATCTTTTG GTGATGGTAC CAATGGAATG ATAGCAGCAC GTATAGCATT ATTAAGTGTG  420

ACTCGCCCAG AACTTTCTCA AGCAATTACA AAAGTAAATT ACGTTTATAA ATCAGGACAA  480

ACAGCTCCTA GAAATGCTCC TGTAGCATAT ATTGAACTAT CTCCAAATAA TAGTTATGTA  540

CAAACTCTTT TAAATGATAG TCATATGAAA CGAACATCTT CATACGAACT CGTTGGATCT  600

AGCATAGCAA GAAGAGGAAT TGAAACAAAA TGGAGTAAAT CTCATACCTC TGGTGTAAGT  660

GATACAGATA GTTGGTCACT AGCAGTATCT GCTGGTATTG ATATTGAATG GGATGTAGGT  720

ATTCCACTTA CTGCTTCTGC AAAAGAAAAA TTATCTCTCA GTATAACTGG AACATATGGT  780

CAATCTACTA CAGTATCATC TCAAGATACA ATTACACAAG AATATACTTT TGCTAAGCCA  840

GGAAAAGATT ATAAATATGA TGATTATGCT TATGCTGTAT ATCAATTAAA ATCTAATTAT  900

CAATTCATAG CTGGAGATGC TTTTAATAAT TTAATAAATT CTCTATCATT TGGTAATCAG  960

TTTAGTGTAC ATGGAGATGC AAGCTATCAA TATAGTACAG ATACAATTTT TAGCACTCAA 1020

ACACCTGATC CAACACCAAC AAATGAAAAG TCATTAATTC AGGTAAATTT TAATCCTAGA 1080

TTTTCATAA                                                         1089(2)SEQ ID NO:3序列信息:

(ⅰ)序列特征:

      (A)长度:362个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:3:

Leu Asn Lys Lys Ser Ile Thr His Glu Glu Phe Ile Arg Gln Leu Lys

1                5                  10                  15

Glu Tyr Asn Leu Asp Asn Asn Leu Asn Tyr His Asp Pro Ala Val Leu

            20                  25                  30

Lys Lys Ile Asn Glu Leu Leu Pro Ala Asp Gln Gln Tyr Asp Leu Ile

        35                  40                  45

Ser Pro Thr Gln Asp Trp Tyr Gln Phe Lys Thr Leu Tyr Pro Ile Ser

    50                  55                  60

Lys Asn Gly Val Ile Ile Ser Ser Asn Leu Asp Asp Ser Ser Asn Val

65                  70                  75                  80

Leu Val Pro Glu Leu Ser Glu Asn Pro Tyr Asp Pro Ile Pro Gln Ser

                85                  90                  95

Gly Lys Ser Thr Ile Gln Thr Ala Val Arg Ser Pro Glu Ala Leu Tyr

            100                 105                 110

Ile Ile Leu Thr Thr Asn Asn Ser Leu Ser Phe Gly Asp Gly Thr Asn

        115                 120                 125

Gly Met Ile Ala Ala Arg Ile Ala Leu Leu Ser Val Thr Arg Pro Glu

    130                 135                 140

Leu Ser Gln Ala Ile Thr Lys Val Asn Tyr Val Tyr Lys Ser Gly Gln

145                 150                 155                 160

Thr Ala Pro Arg Asn Ala Pro Val Ala Tyr Ile Glu Leu Ser Pro Asn

                165                 170                 175

Asn Ser Tyr Val Gln Thr Leu Leu Asn Asp Ser His Met Lys Arg Thr

            180                 185                 190

Ser Ser Tyr Glu Leu Val Gly Ser Ser Ile Ala Arg Arg Gly Ile Glu

        195                 200                 205

Thr Lys Trp Ser Lys Ser His Thr Ser Gly Val Ser Asp Thr Asp Ser

    210                 215                 220

Trp Ser Leu Ala Val Ser Ala Gly Ile Asp Ile Glu Trp Asp Val Gly

225                 230                 235                 240

Ile Pro Leu Thr Ala Ser Ala Lys Glu Lys Leu Ser Leu Ser Ile Thr

                245                 250                 255

Gly Thr Tyr Gly Gln Ser Thr Thr Val Ser Ser Gln Asp Thr Ile Thr

            260                 265                 270

Gln Glu Tyr Thr Phe Ala Lys Pro Gly Lys Asp Tyr Lys Tyr Asp Asp

        275                 280                 285

Tyr Ala Tyr Ala Val Tyr Gln Leu Lys Ser Asn Tyr Gln Phe  Ile Ala

    290                 295                 300

Gly Asp Ala Phe Asn Asn Leu Ile Asn Ser Leu Ser Phe Gly Asn Gln

305             310                     315                 320

Phe Ser Val His Gly Asp Ala Ser Tyr Gln Tyr Ser Thr Asp Thr Ile

                325                 330                 335

Phe Ser Thr Gln Thr Pro Asp Pro Thr Pro Thr Asn Glu Lys Ser Leu

            340                 345                 350

Ile Gln Val Asn Phe Asn Pro Arg Phe Ser

        355                 360(2)SEQ ID NO:4序列信息:

(ⅰ)序列特征:

      (A)长度:1089个碱基对

      (B)类型:核酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:DNA(基因组)

(ⅹⅰ)序列描述:SEQ ID NO:4:

TTGAACAAAA AATCTATTAC TCATGAAGAA TTTATTAGAC AATTAAAAGA ATATAATTTA   60

GATAACAATC TTAATTATCA TGATCCAGCT GTACTAAAAA AAATTAATGA ATTATTACCT  120

GCTGATCAAC AATATGATTT AATTTCACCC ACTCAAGATT GGTATCAATT TAAAACTTTA  180

TATCCTATTT CTAAGAATGG TGTAATTATT TCATCTAATC TAGATGATAG CTCAAACGTT  240

CTAGTCCCAG AATTATCTGA AAATCCTTAT GATCCAATTC CCCAATCAGG TAAGTCAACA  300

ATTCAAACTG CTGTACGTTC ACCAGAAGCT CTTTATATTA TTCTAACTAC TAACAACAGT  360

CTATCTTTTG GTGGTGGTAC CAATACAATG ATAGCAACAC GTATAGCATT ATTAAGTGTG  420

ACTCGCCCAG AACTTTATCA AGCAATTACA AAAGTAAATT ACGTTTATAA ATCAGGACAA  480

ACAGCTCCTA GAAATGCTCC TGTAGCATAT ATTGAACTAT CTCCAAATAA TAGTTATGTA  540

CAAACTCTTT TAAATGATAG TCATATGAAA CGAACATCTT CATACGAACT CGTTGGATCT  600

AGCATAGCAA GAAGAGGAAT TGAAACAAAA TGGAGTAAAT CTCATACCTC TGGTGTAAGT  660

GATACAGATA GTTGGTCACT AGCAGTATCT GCTGGTATTG ATATTGAATG GGATGTAGGT  720

ATTCCACTTA CTGCTTCTGC AAAAGAAAAA TTATCTCTCA GTATAACTGG AACATATGGT  780

CAATCTACTA CAGTATCATC TCAAGATACA ATTACACAAG AATATACTTT TGCTAAGCCA  840

GGAAAAGATT ATAAATATGA TGATTATGCT TATGCTGTAT ATCAATTAAA ATCTAATTAT  900

CAATTCATAG CTGGAGATGC TTTTAATAAT TTAATAAATT CTCTATCATT TGGTAATCAG  960

TTTAGTGTAC ATGGAGATGC AAGCTATCAA TATAGTACAG ATACAATTTT TAGCACTCAA 1020

ACACCTGATC CAACACCAAC AAATGAAAAG TCATTAATTC AGGTAAATTT TAATCCTAGA 1080

TTTTCATAA                                                         1089(2)SEQ ID NO:5序列信息:

(ⅰ)序列特征:

      (A)长度:362个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:5:

Leu Asn Lys Lys Ser Ile Thr His Glu Glu Phe Ile Arg Gln Leu Lys

1                5                   10                  15

Glu Tyr Asn Leu Asp Asn Asn Leu Asn Tyr His Asp Pro Ala Val Leu

             20                 25                  30

Lys Lys Ile Asn Glu Leu Leu Pro Ala Asp Gln Gln Tyr Asp Leu Ile

        35                  40                  45

Ser Pro Thr Gln Asp Trp Tyr Gln Phe Lys Thr Leu Tyr Pro Ile Ser

    50                  55                  60

Lys Asn Gly Val Ile Ile Ser Ser Asn Leu Asp Asp Ser Ser Asn Val

65                  70                  75                  80

Leu Val Pro Glu Leu Ser Glu Asn Pro Tyr Asp Pro Ile Pro Gln Ser

                85                  90                  95

Gly Lys Ser Thr Ile Gln Thr Ala Val Arg Ser Pro Glu Ala Leu Tyr

            100                 105                 110

Ile Ile Leu Thr Thr Asn Asn Ser Leu Ser Phe Gly Gly Gly Thr Asn

        115                 120                     125

Thr Met Ile Ala Thr Arg Ile Ala Leu Leu Ser Val Thr Arg Pro Glu

    130                 135                 140

Leu Tyr Gln Ala Ile Thr Lys Val Asn Tyr Val Tyr Lys Ser Gly Gln

145                 150                 155                 160

Thr Ala Pro Arg Asn Ala Pro Val Ala Tyr Ile Glu Leu Ser Pro Asn

                165                 170                 175

Asn Ser Tyr Val Gln Thr Leu Leu Asn Asp Ser His Met Lys Arg Thr

            180                 185                 190

Ser Ser Tyr Glu Leu Val Gly Ser Ser Ile Ala Arg Arg Gly Ile Glu

        195                 200                 205

Thr Lys Trp Ser Lys Ser His Thr Ser Gly Val Ser Asp Thr Asp Ser

    210                 215                 220

Trp Ser Leu Ala Val Ser Ala Gly Ile Asp Ile Glu Trp Asp Val Gly

225                 230                 235                 240

Ile Pro Leu Thr Ala Ser Ala Lys Glu Lys Leu Ser Leu Ser Ile Thr

                245                 250                 255

Gly Thr Tyr Gly Gln Ser Thr Thr Val Ser Ser Gln Asp Thr Ile Thr

            260                 265                 270

Gln Glu Tyr Thr Phe Ala Lys Pro Gly Lys Asp Tyr Lys Tyr Asp Asp

        275                 280                 285

Tyr Ala Tyr Ala Val Tyr Gln Leu Lys Ser Asn Tyr Gln Phe Ile Ala   

    290                 295                 300

Gly Asp Ala Phe Asn Asn Leu Ile Asn Ser Leu Ser Phe Gly Asn Gln

305                 310                 315                 320

Phe Ser Val His Gly Asp Ala Ser Tyr Gln Tyr Ser Thr Asp Thr Ile

                325                 330                 335

Phe Ser Thr Gln Thr Pro Asp Pro Thr Pro Thr Asn Glu Lys Ser Leu

            340                 345                 350

Ile Gln Val Asn Phe Asn Pro Arg  Phe  Ser

        355                 360(2)SEQ ID NO:6序列信息:

(ⅰ)序列特征:

      (A)长度:1086个碱基对

      (B)类型:核酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:DNA(基因组)

(ⅹⅰ)序列描述:SEQ ID NO:6:

ATGAACAAGA AGTCTATCAC TCATGAGGAG TTCATCAGAC AACTCAAGGA ATACAACCTT   60

GACAACAACC TCAACTACCA TGATCCAGCT GTTCTCAAGA AGATCAACGA GCTTCTTCCA  120

GCTGATCAAC AGTACGATCT CATCTCTCCA ACTCAAGATT GGTACCAATT CAAGACTCTC  180

TACCCAATCT CTAAGAACGG AGTGATCATC TCTTCTAACC TTGATGATTC TTCTAACGTT  240

CTTGTTCCAG AGCTTTCTGA GAACCCATAC GATCCAATCC CACAATCTGG AAAGTCTACT  300

ATCCAAACTG CTGTTAGATC TCCAGAGGCT CTCTACATCA TTCTTACTAC TAACAACTCT  360

CTTTCTTTCG GAGGTGGAAC TAACACTATG ATTGCTACTA GAATCGCTCT TCTTTCTGTT  420

ACTAGACCAG AGCTCTATCA AGCTATCACT AAGGTGAACT ACGTGTACAA GTCTGGACAA  480

ACTGCTCCAA GAAACGCTCC AGTTGCTTAC ATTGAGCTTT CTCCAAACAA CTCTTACGTT   540

CAAACTCTTC TCAACGATTC TCACATGAAG AGAACTAGTT CTTACGAGCT TGTTGGATCT   600

TCTATCGCTA GAAGAGGAAT CGAGACTAAG TGGTCTAAGT CTCATACTTC TGGAGTTTCT   660

GATACTGATT CTTGGTCTCT TGCTGTTTCT GCTGGAATCG ACATTGAATG GGATGTTGGA   720

ATCCCACTTA CTGCTTCTGC TAAGGAGAAG CTTTCTCTTT CTATCACTGG AACTTACGGA   780

CAATCTACTA CTGTTTCTTC TCAAGATACT ATCACTCAAG AGTACACTTT CGCTAAGCCA   840

GGAAAGGACT ACAAATACGA TGACTACGCT TACGCTGTGT ACCAACTCAA GAGCAACTAT   900

CAGTTCATTG CTGGAGATGC ATTCAACAAC CTCATCAACT CTCTTTCTTT CGGAAACCAG   960

TTCTCTGTTC ATGGAGATGC TTCTTACCAG TACTCTACTG ATACTATCTT CTCTACTCAA  1020

ACTCCAGATC CAACTCCAAC TAACGAGAAG TCTCTCATTC AAGTGAACTT CAACCCAAGA  1080

TTCTCT                                                             1086(2)SEQ ID NO:7序列信息:

(ⅰ)序列特征:

      (A)长度:362个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:7:

Met Asn Lys Lys Ser Ile Thr His Glu Glu Phe Ile Arg Gln Leu Lys

1               5                   10                  15

Glu Tyr Asn Leu Asp Asn Asn Leu Asn Tyr His Asp Pro Ala Val Leu 

            20                  25                  30

Lys Lys Ile Asn Glu Leu Leu Pro Ala Asp Gln Gln Tyr Asp Leu Ile

         35                  40                  45

Ser Pro Thr Gln Asp Trp Tyr Gln Phe Lys Thr Leu Tyr Pro Ile Ser

     50                  55                  60

Lys Asn Gly Val Ile Ile Ser Ser Asn Leu Asp Asp Ser Ser Asn Val

65                   70                  75                  80

Leu Val Pro Glu Leu Ser Glu Asn Pro Tyr Asp Pro Ile Pro Gln Ser

                 85                  90                  95

Gly Lys Ser Thr Ile Gln Thr Ala Val Arg Ser Pro Glu Ala Leu Tyr

            100                 105                 110

Ile Ile Leu Thr Thr Asn Asn Ser Leu Ser Phe Gly Gly Gly Thr Asn

        115                 120                 125

Thr Met Ile Ala Thr Arg Ile Ala Leu Leu Ser Val Thr Arg Pro Glu

    130                 135                 140

Leu Tyr Gln Ala Ile Thr Lys Val Asn Tyr Val Tyr Lys Ser Gly Gln

145                 150                 155                 160

Thr Ala Pro Arg Asn Ala Pro Val Ala Tyr Ile Glu Leu Ser Pro Asn

                165                 170                 175

Asn Ser Tyr Val Gln Thr Leu Leu Asn Asp Ser His Met Lys Arg Thr

            180                 185                 190

Ser Ser Tyr Glu Leu Val Gly Ser Ser Ile Ala Arg Arg Gly Ile Glu 

        195                 200                 205

Thr Lys Trp Ser Lys Ser His Thr Ser Gly Val Ser Asp Thr Asp Ser

    210                 215                 220

Trp Ser Leu Ala Val Ser Ala Gly Ile Asp Ile Glu Trp Asp Val Gly

225                 230                 235                 240

Ile Pro Leu Thr Ala Ser Ala Lys Glu Lys Leu Ser Leu Ser Ile Thr

                245                 250                 255

Gly Thr Tyr Gly Gln Ser Thr Thr Val Ser Ser Gln Asp Thr Ile Thr

            260                 265                 270

Gln Glu Tyr Thr Phe Ala Lys Pro Gly Lys Asp Tyr Lys Tyr Asp Asp

        275                 280                 285

Tyr Ala Tyr Ala Val Tyr Gln Leu Lys Ser Asn Tyr Gln Phe Ile Ala

    290                 295                 300

Gly Asp Ala Phe Asn Asn Leu Ile Asn Ser Leu Ser Phe Gly Asn Gln

305                 310                 315                 320

Phe Ser Val His Gly Asp Ala Ser Tyr Gln Tyr Ser Thr Asp Thr Ile

                325                 330                 335

Phe Ser Thr Gln Thr Pro Asp Pro Thr Pro Thr Asn Glu Lys Ser Leu

            340                 345                 350

Ile Gln Val Asn Phe Asn Pro Arg Phe Ser

        355                 360(2)SEQ ID NO:8序列信息:

(ⅰ)序列特征:

      (A)长度:354个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:8:

Met Glu Phe Ile Arg Gln Leu Lys Glu Tyr Asn Leu Asp Asn Asn Leu

1               5                   10                  15

Asn Tyr His Asp Pro Ala Val Leu Lys Lys Ile Asn Glu Leu Leu Pro

            20                  25                   30

Ala Asp Gln Gln Tyr Asp Leu Ile Ser Pro Thr Gln Asp Trp Tyr Gln

        35                  40                  45

Phe Lys Thr Leu Tyr Pro Ile Ser Lys Asn Gly Val Ile Ile Ser Ser

    50                  55                  60

Asn Leu Asp Asp Ser Ser Asn Val Leu Val Pro Glu Leu Ser Glu Asn

65                   70                  75                  80

Pro Tyr Asp Pro Ile Pro Gln Ser Gly Lys Ser Thr Ile Gln Thr Ala

                 85                  90                  95

Val Arg Ser Pro Glu Ala Leu Tyr Ile Ile Leu Thr Thr Asn Asn Ser

            100                 105                 110

Leu Ser Phe Gly Gly Gly Thr Asn Thr Met Ile Ala Thr Arg Ile Ala

        115                 120                 125

Leu Leu Ser Val Thr Arg Pro Glu Leu Tyr Gln Ala Ile Thr Lys Val

    130                 135                 140

Asn Tyr Val Tyr Lys Ser Gly Gln Thr Ala Pro Arg Asn Ala Pro Val

145                 150                 155                 160

Ala Tyr Ile Glu Leu Ser Pro Asn Asn Ser Tyr Val Gln Thr Leu Leu

                165                 170                 175

Asn Asp Ser His Met Lys Arg Thr Ser Ser Tyr Glu Leu Val Gly Ser

            180                 185                 190

Ser Ile Ala Arg Arg Gly Ile Glu Thr Lys Trp Ser Lys Ser His Thr

        195                 200                 205

Ser Gly Val Ser Asp Thr Asp Ser Trp Ser Leu Ala Val Ser Ala Gly

    210                 215                 220

Ile Asp Ile Glu Trp Asp Val Gly Ile Pro Leu Thr Ala Ser Ala Lys

225                 230                 235                 240

Glu Lys Leu Ser Leu Ser Ile Thr Gly Thr Tyr Gly Gln Ser Thr Thr

                245                 250                 255

Val Ser Ser Gln Asp Thr Ile Thr Gln Glu Tyr Thr Phe Ala Lys Pro

            260                 265                 270

Gly Lys Asp Tyr Lys Tyr Asp Asp Tyr Ala Tyr Ala Val Tyr Gln Leu

        275                 280                 285

Lys Ser Asn Tyr Gln Phe Ile Ala Gly Asp Ala Phe Asn Asn Leu Ile

    290                 295                 300

Asn Ser Leu Ser Phe Gly Asn Gln Phe Ser Val His Gly Asp Ala Ser

305                 310                 315                 320

Tyr Gln Tyr Ser Thr Asp Thr Ile Phe Ser Thr Gln Thr Pro Asp Pro

                325                 330                 335

Thr Pro Thr Asn Glu Lys Ser Leu Ile Gln Val Asn Phe Asn Pro Arg

            340                 345                 350

Phe Ser(2)SEQ ID NO:9序列信息:

(ⅰ)序列特征:

      (A)长度:343个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:9:

Met Asp Asn Asn Leu Asn Tyr His Asp Pro Ala Val Leu Lys Lys Ile

1               5                   10                  15

Asn Glu Leu Leu Pro Ala Asp Gln Gln Tyr Asp Leu Ile Ser Pro Thr

            20                  25                  30

Gln Asp Trp Tyr Gln Phe Lys Thr Leu Tyr Pro Ile Ser Lys Asn Gly

        35                  40                  45

Val Ile Ile Ser Ser Asn Leu Asp Asp Ser Ser Asn Val Leu Val Pro

    50                  55                  60

Glu Leu Ser Glu Asn Pro Tyr Asp Pro Ile Pro Gln Ser Gly Lys Ser

65                  70                  75                  80

Thr Ile Gln Thr Ala Val Arg Ser Pro Glu Ala Leu Tyr Ile Ile Leu

                85                  90                  95

Thr Thr Asn Asn Ser Leu Ser Phe Gly Gly Gly Thr Asn Thr Met Ile

            100                 105                 110

Ala Thr Arg Ile Ala Leu Leu Ser Val Thr Arg Pro Glu Leu Tyr Gln

        115                 120                 125

Ala Ile Thr Lys Val Asn Tyr Val Tyr Lys Ser Gly Gln Thr Ala Pro

    130                 135                 140

Arg Asn Ala Pro Val Ala Tyr Ile Glu Leu Ser Pro Asn Asn Ser Tyr

145                 150                 155                 160

Val Gln Thr Leu Leu Asn Asp Ser His Met Lys Arg Thr Ser Ser Tyr

                165                 170                 175

Glu Leu Val Gly Ser Ser Ile Ala Arg Arg Gly Ile Glu Thr Lys Trp

            180                 185                 190

Ser Lys Ser His Thr Ser Gly Val Ser Asp Thr Asp Ser Trp Ser Leu

        195                 200                 205

Ala Val Ser Ala Gly Ile Asp Ile Glu Trp Asp Val Gly Ile Pro Leu

    210                 215                 220

Thr Ala Ser Ala Lys Glu Lys Leu Ser Leu Ser Ile Thr Gly Thr Tyr

225                 230                 235                 240

Gly Gln Ser Thr Thr Val Ser Ser Gln Asp Thr Ile Thr Gln Glu Tyr

                245                 250                 255

Thr Phe Ala Lys Pro Gly Lys Asp Tyr Lys Tyr Asp Asp Tyr Ala Tyr

            260                 265                 270

Ala Val Tyr Gln Leu Lys Ser Asn Tyr Gln Phe Ile Ala Gly Asp Ala

        275                 280                 285

Phe Asn Asn Leu Ile Asn Ser Leu Ser Phe Gly Asn Gln Phe Ser Val

    290                 295                 300

His Gly Asp Ala Ser Tyr Gln Tyr Ser Thr Asp Thr Ile Phe Ser Thr

305                 310                 315                 320

Gln Thr Pro Asp Pro Thr Pro Thr Asn Glu Lys Ser Leu Ile Gln Val

                325                 330                 335

Asn Phe Asn Pro Arg Phe Ser

            340(2)SEQ ID NO:1O序列信息:

(ⅰ)序列特征:

      (A)长度:337个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:10:

Met His Asp Pro Ala Val Leu Lys Lys Ile Asn Glu Leu Leu Pro Ala

1               5                   10                  15

Asp Gln Gln Tyr Asp Leu Ile Ser Pro Thr Gln Asp Trp Tyr Gln Phe

            20                  25                  30

Lys Thr Leu Tyr Pro Ile Ser Lys Asn Gly Val Ile Ile Ser Ser Asn

        35                  40                  45

Leu Asp Asp Ser Ser Asn Val Leu Val Pro Glu Leu Ser Glu Asn Pro

    50                  55                  60

Tyr Asp Pro Ile Pro Gln Ser Gly Lys Ser Thr Ile Gln Thr Ala Val

65                  70                  75                  80

Arg Ser Pro Glu Ala Leu Tyr Ile Ile Leu Thr Thr Asn Asn Ser Leu

                85                  90                  95

Ser Phe Gly Gly Gly Thr Asn Thr Met Ile Ala Thr Arg Ile Ala Leu

            100                 105                 110

Leu Ser Val Thr Arg Pro Glu Leu Tyr Gln Ala Ile Thr Lys Val Asn

        115                 120                 125

Tyr Val Tyr Lys Ser Gly Gln Thr Ala Pro Arg Asn Ala Pro Val Ala

    130                 135                 140

Tyr Ile Glu Leu Ser Pro Asn Asn Ser Tyr Val Gln Thr Leu Leu Asn

145                 150                 155                 160

Asp Ser His Met Lys Arg Thr Ser Ser Tyr Glu Leu Val Gly Ser Ser 

                165                 170                 175

Ile Ala Arg Arg Gly Ile Glu Thr Lys Trp Ser Lys Ser His Thr Ser

            180                 185                 190

Gly Val Ser Asp Thr Asp Ser Trp Ser Leu Ala Val Ser Ala Gly Ile

            195                 200                 205

Asp Ile Glu Trp Asp Val Gly Ile Pro Leu Thr Ala Ser Ala Lys Glu

    210                 215                 220

Lys  Leu Ser Leu Ser Ile Thr Gly Thr Tyr Gly Gln Ser Thr Thr Val

225                  230                 235                 240

Ser Ser Gln Asp Thr Ile Thr Gln Glu Tyr Thr Phe Ala Lys  Pro Gly

                245                 250                  255

Lys Asp Tyr Lys Tyr Asp Asp Tyr Ala Tyr Ala Val Tyr Gln Leu Lys

            260                 265                 270

Ser Asn Tyr Gln Phe Ile Ala Gly Asp Ala Phe Asn Asn Leu Ile Asn

        275                 280                 285

Ser Leu Ser Phe Gly Asn Gln Phe Ser Val His Gly Asp Ala Ser Tyr

    290                 295                300

Gln Tyr Ser Thr Asp Thr Ile Phe Ser Thr Gln Thr Pro Asp Pro Thr

305                310                  315                 320

Pro Thr Ash Glu Lys Ser Leu Ile Gln Val Asn Phe Asn Pro Arg Phe

                325                 330                335

Ser(2)SEQ ID NO:11序列信息:

(ⅰ)序列特征:

      (A)长度:322个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:11:

Met Asp Gln Gln Tyr Asp Leu Ile Ser Pro Thr Gln Asp Trp Tyr Gln

1               5                   10                  15

Phe Lys Thr Leu Tyr Pro Ile Ser Lys Asn Gly Val Ile Ile Ser Ser

            20                  25                  30

Asn Leu Asp Asp Ser Ser Asn Val Leu Val Pro Glu Leu Ser Glu Asn

        35                  40                  45

Pro Tyr Asp Pro Ile Pro Gln Ser Gly Lys Ser Thr Ile Gln Thr Ala

    50                  55                  60

Val Arg Ser Pro Glu Ala Leu Tyr Ile Ile Leu Thr Thr Asn Asn Ser

65                  70                  75                  80

Leu Ser Phe Gly Gly Gly Thr Asn Thr Met Ile Ala Thr Arg Ile Ala

                85                 90                       95

Leu Leu Ser Val Thr Arg Pro Glu Leu Tyr Gln Ala Ile Thr Lys Val

            100                 105                 110

Asn Tyr Val Tyr Lys Ser Gly Gln Thr Ala Pro Arg Asn Ala Pro Val

        115                 120                 125

Ala Tyr Ile Glu Leu Ser Pro Asn Asn Ser Tyr Val Gln Thr Leu Leu

    130                 135                 140

Asn Asp Ser His Met Lys Arg Thr Ser Ser Tyr Glu Leu Val Gly Ser

145                150                  155                 160

Ser Ile Ala Arg Arg Gly Ile Glu Thr Lys Trp Ser Lys Ser His Thr

                165                 170                 175

Ser Gly Val Ser Asp Thr Asp Ser Trp Ser Leu Ala Val Ser Ala Gly

            180                 185                 190

Ile Asp Ile Glu Trp Asp Val Gly Ile Pro Leu Thr Ala Ser Ala Lys

        195                 200                 205

Glu Lys Leu Ser Leu Ser Ile Thr Gly Thr Tyr Gly Gln Ser Thr Thr

    210                 215                 220

Val Ser Ser Gln Asp Thr Ile Thr Gln Glu Tyr Thr Phe Ala Lys Pro

225                 230                 235                 240

Gly Lys Asp Tyr Lys Tyr Asp Asp Tyr Ala Tyr Ala Val Tyr Gln Leu

                245                 250                 255

Lys Ser Asn Tyr Gln Phe Ile Ala Gly Asp Ala Phe Asn Asn Leu Ile

            260                 265                 270

Asn Ser Leu Ser Phe Gly Asn Gln Phe Ser Val His Gly Asp Ala Ser

        275                 280                 285

Tyr Gln Tyr Ser Thr Asp Thr Ile Phe Ser Thr Gln Thr Pro Asp Pro

    290                 295                 300

Thr Pro Thr Asn Glu Lys ser Leu Ile Gln Val Asn Phe Asn Pro Arg

305                 310                 315                 320

Phe Ser(2)SEQ ID NO:12序列信息:

(ⅰ)序列特征:

      (A)长度:311个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:12:

Met Asp Trp Tyr Gln Phe Lys Thr Leu Tyr Pro Ile Ser Lys Asn Gly

1               5                   10                  15

Val Ile Ile Ser Ser Asn Leu Asp Asp Ser Ser Asn Val Leu Val Pro

            20                  25                  30

Glu Leu Ser Glu Asn Pro Tyr Asp Pro Ile Pro Gln Ser Gly Lys Ser

        35                  40                  45

Thr Ile Gln Thr Ala Val Arg Ser Pro Glu Ala Leu Tyr Ile Ile Leu

    50                  55                  60

Thr Thr Asn Asn Ser Leu Ser Phe Gly Gly Gly Thr Asn Thr Met Ile

65                  70                  75                  80

Ala Thr Arg Ile Ala Leu Leu Ser Val Thr Arg Pro Glu Leu Tyr Gln

                85                  90                  95

Ala Ile Thr Lys Val Asn Tyr Val Tyr Lys Ser Gly Gln Thr Ala Pro

            100                 105                 110

Arg Asn Ala Pro Val Ala Tyr Ile Glu Leu Ser Pro Asn Asn Ser Tyr

        115                 120                 125

Val Gln Thr Leu Leu Asn Asp Ser His Met Lys Arg Thr Ser Ser Tyr

    130                 135                 140

Glu Leu Val Gly Ser Ser Ile Ala Arg Arg Gly Ile Glu Thr Lys Trp

145                 150                 155                 160

Ser Lys Ser His Thr Ser Gly Val Ser Asp Thr Asp Ser Trp Ser Leu

                165                 170                 175

Ala Val Ser Ala Gly Ile Asp Ile Glu Trp Asp Val Gly Ile Pro Leu

            180                 185                 190

Thr Ala Ser Ala Lys Glu Lys Leu Ser Leu Ser Ile Thr Gly Thr Tyr

        195                 200                 205

Gly Gln Ser Thr Thr Val Ser Ser Gln Asp Thr Ile Thr Gln Glu Tyr

    210                 215                 220

Thr Phe Ala Lys Pro Gly Lys Asp Tyr Lys Tyr Asp Asp Tyr Ala Tyr

225                 230                 235                 240

Ala Val Tyr Gln Leu Lys Ser Asn Tyr Gln Phe Ile Ala Gly Asp Ala

                245                 250                 255

Phe Ash Asn Leu Ile Asn Ser Leu Ser Phe Gly Asn Gln Phe Ser Val

            260                 265                 270

His Gly Asp Ala Ser Tyr Gln Tyr Ser Thr Asp Thr Ile Phe Ser Thr

        275                 280                 285

Gln Thr Pro Asp Pro Thr Pro Thr Asn Glu Lys Ser Leu Ile Gln Val

    290                 295                 300

Asn Phe Asn Pro Arg Phe Ser

305                 310(2)SEQ ID NO:13序列信息:

(ⅰ)序列特征:

      (A)长度:289个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:13:

Met Asp Asp Ser Ser Asn Val Leu Val Pro Glu Leu Ser Glu Asn Pro

1               5                   10                  15

Tyr Asp Pro Ile Pro Gln Ser Gly Lys Ser Thr Ile Gln Thr Ala Val

            20                  25                  30

Arg Ser Pro Glu Ala Leu Tyr Ile Ile Leu Thr Thr Asn Asn Ser Leu

        35                  40                  45

Ser Phe Gly Gly Gly Thr Asn Thr Met Ile Ala Thr Arg Ile Ala Leu

    50                  55                  60

Leu Ser Val Thr Arg Pro Glu Leu Tyr Gln Ala Ile Thr Lys Val Asn

65                  70                  75                  80

Tyr Val Tyr Lys Ser Gly Gln Thr Ala Pro Arg Asn Ala Pro Val Ala

                85                  90                  95

Tyr Ile Glu Leu Ser Pro Asn Asn Ser Tyr Val Gln Thr Leu Leu Asn

            100                 105                 110

Asp Ser His Met Lys Arg Thr Ser Ser Tyr Glu Leu Val Gly Ser Ser

        115                 120                 125

Ile Ala Arg Arg Gly Ile Glu Thr Lys Trp Ser Lys Ser His Thr Ser

    130                 135                 140

Gly Val Ser Asp Thr Asp Ser Trp Ser Leu Ala Val Ser Ala Gly Ile

145                 150                 155                 160

Asp Ile Glu Trp Asp Val Gly Ile Pro Leu Thr Ala Ser Ala Lys Glu

                165                 170                 175

Lys Leu Ser Leu Ser Ile Thr Gly Thr Tyr Gly Gln Ser Thr Thr Val

            180                 185                 190

Ser Ser Gln Asp Thr Ile Thr Gln Glu Tyr Thr Phe Ala Lys Pro Gly

        195                 200                 205

Lys Asp Tyr Lys Tyr Asp Asp Tyr Ala Tyr Ala Val Tyr Gln Leu Lys

    210                 215                 220

Ser Asn Tyr Gln Phe Ile Ala Gly Asp Ala Phe Asn Asn Leu Ile Asn

225                 230                 235                 240

Ser Leu Ser Phe Gly Asn Gln Phe Ser Val His Gly Asp Ala Ser Tyr

                245                 250                 255

Gln Tyr Ser Thr Asp Thr Ile Phe Ser Thr Gln Thr Pro Asp Pro Thr

            260                 265                 270

Pro Thr Asn Glu Lys Ser Leu Ile Gln Val Asn Phe Asn Pro Arg Phe

        275                 280                 285

Ser(2)SEQ ID NO:14序列信息:

(ⅰ)序列特征:

      (A)长度:269个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:14:

Met Asn Lys Lys Ser Ile Thr His Glu Glu Phe Ile Arg Gln Leu Lys

1               5                   10                  15

Glu Tyr Asn Leu Asp Asn Asn Leu Asn Tyr His Asp Pro Ala Val Leu

            20                  25                  30

Lys Lys Ile Asn Glu Leu Leu Pro Ala Asp Gln Gln Tyr Asp Leu Ile

        35                  40                  45

Ser Pro Thr Gln Asp Trp Tyr Gln Phe Lys Thr Leu Tyr Pro Ile Ser

    50                  55                  60

Lys Asn Gly Val Ile Ile Ser Ser Asn Leu Asp Asp Ser Ser Asn Val

65                  70                  75                  80

Leu Val Pro Glu Leu Ser Glu Asn Pro Tyr Asp Pro Ile Pro Gln Ser

                85                  90                  95

Gly Lys Ser Thr Ile Gln Thr Ala Val Arg Ser Pro Glu Ala Leu Tyr

            100                 105                 110

Ile Ile Leu Thr Thr Asn Asn Ser Leu Ser Phe Gly Gly Gly Thr Asn

        115                 120                 125

Thr Met Ile Ala Thr Arg Ile Ala Leu Leu Ser Val Thr Arg Pro Glu

    130                 135                 140

Leu Tyr Gln Ala Ile Thr Lys Val Asn Tyr Val Tyr Lys Ser Gly Gln

145                 150                 155                 160

Thr Ala Pro Arg Asn Ala Pro Val Ala Tyr Ile Glu Leu Ser Pro Asn

                165                 170                 175

Asn Ser Tyr Val Gln Thr Leu Leu Asn Asp Ser His Met Lys Arg Thr

            180                 185                 190

Ser Ser Tyr Glu Leu Val Gly Ser Ser Ile Ala Arg Arg Gly Ile Glu

        195                 200                 205

Thr Lys Trp Ser Lys Ser His Thr Ser Gly Val Ser Asp Thr Asp Ser

    210                 215                 220

Trp Ser Leu Ala Val Ser Ala Gly Ile Asp Ile Glu Trp Asp Val Gly

225                 230                 235                 240

Ile Pro Leu Thr Ala Ser Ala Lys Glu Lys Leu Ser Leu Ser Ile Thr

                245                 250                 255

Gly Thr Tyr Gly Gln Ser Thr Thr Val Ser Ser Gln Asp

            260                 265(2)SEQ ID NO:15序列信息:

(ⅰ)序列特征:

      (A)长度:280个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:15:

Met Asn Lys Lys Ser Ile Thr His Glu Glu Phe Ile Arg Gln Leu Lys

1               5                   10                  15

Glu Tyr Asn Leu Asp Asn Asn Leu Asn Tyr His Asp Pro Ala Val Leu

            20                  25                  30

Lys Lys Ile Asn Glu Leu Leu Pro Ala Asp Gln Gln Tyr Asp Leu Ile

        35                  40                  45

Ser Pro Thr Gln Asp Trp Tyr Gln Phe Lys Thr Leu Tyr Pro Ile Ser

    50                  55                  60

Lys Asn Gly Val Ile Ile Ser Ser Asn Leu Asp Asp Ser Ser Asn Val

65                  70                  75                  80

Leu Val Pro Glu Leu Ser Glu Asn Pro Tyr Asp Pro Ile Pro Gln Ser

                85                  90                  95

Gly Lys Ser Thr Ile Gln Thr Ala Val Arg Ser Pro Glu Ala Leu Tyr

            100                 105                 110

Ile Ile Leu Thr Thr Asn Asn Ser Leu Ser Phe Gly Gly Gly Thr Asn

        115                 120                 125

Thr Met Ile Ala Thr Arg Ile Ala Leu Leu Ser Val Thr Arg Pro Glu

    130                 135                 140

Leu Tyr Gln Ala Ile Thr Lys Val Asn Tyr Val Tyr Lys Ser Gly Gln

145                 150                 155                 160

Thr Ala Pro Arg Asn Ala Pro Val Ala Tyr Ile Glu Leu Ser Pro Asn

                165                 170                 175

Asn Ser Tyr Val Gln Thr Leu Leu Asn Asp Ser His Met Lys Arg Thr

            180                 185                 190

Ser Ser Tyr Glu Leu Val Gly Ser Ser Ile Ala Arg Arg Gly Ile Glu

        195                 200                 205

Thr Lys Trp Ser Lys Ser His Thr Ser Gly Val Ser Asp Thr Asp Ser

    210                 215                 220

Trp Ser Leu Ala Val Ser Ala Gly Ile Asp Ile Glu Trp Asp Val Gly

225                 230                 235                 240

Ile ProLeu Thr Ala Ser Ala Lys Glu Lys Leu Ser Leu Ser Ile Thr

               245                 250                 255

Gly Thr Tyr Gly Gln Ser Thr Thr Val Ser Ser Gln Asp Thr Ile Thr

            260                 265                 270

Gln Glu Tyr Thr Phe Ala Lys Pro

        275             280(2)SEQ ID NO:16序列信息:

(ⅰ)序列特征:

      (A)长度:288个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:16:

Met Asn Lys Lys Ser Ile Thr His Glu Glu Phe Ile Arg Gln Leu Lys

1               5                   10                  15

Glu Tyr Asn Leu Asp Asn Asn Leu Asn Tyr His Asp Pro Ala Val Leu

            20                  25                  30

Lys Lys Ile Asn Glu Leu Leu Pro Ala Asp Gln Gln Tyr Asp Leu Ile

        35                  40                  45

Ser Pro Thr Gln Asp Trp Tyr Gln Phe Lys Thr Leu Tyr Pro Ile Ser

    50                  55                  60

Lys Asn Gly Val Ile Ile Ser Ser Asn Leu Asp Asp Ser Ser Asn Val

65                  70                  75                  80

Leu Val Pro Glu Leu Ser Glu Asn Pro Tyr Asp Pro Ile Pro Gln Ser

                85                  90                  95

Gly Lys Ser Thr Ile Gln Thr Ala Val Arg Ser Pro Glu Ala Leu Tyr

            100                 105                 110

Ile Ile Leu Thr Thr Asn Asn Ser Leu Ser Phe Gly Gly Gly Thr Asn

        115                 120                 125

Thr Met Ile Ala Thr Arg Ile Ala Leu Leu Ser Val Thr Arg Pro Glu

    130                 135                 140

Leu Tyr Gln Ala Ile Thr Lys Val Asn Tyr Val Tyr Lys Ser Gly Gln

145                 150                 155                 160

Thr Ala Pro Arg Asn Ala Pro Val Ala Tyr Ile Glu Leu Ser Pro Asn

                165                 170                 175

Asn Ser Tyr Val Gln Thr Leu Leu Asn Asp Ser His Met Lys Arg Thr

            180                 185                 190

Ser Ser Tyr Glu Leu Val Gly Ser Ser Ile Ala Arg Arg Gly Ile Glu

        195                 200                 205

Thr Lys Trp Ser Lys Ser Mis Thr Ser Gly Val Ser Asp Thr Asp Ser

    210                 215                 220

Trp Ser Leu Ala Val Ser Ala Gly Ile Asp Ile Glu Trp Asp Val Gly

225                 230                 235                 240

Ile Pro Leu Thr Ala Ser Ala Lys Glu Lys Leu Ser Leu Ser Ile Thr

                245                 250                 255

Gly Thr Tyr Gly Gln Ser Thr Thr Val Ser Ser Gln Asp Thr Ile Thr

            260                 265                 270

Gln Glu Tyr Thr Phe Ala Lys Pro Gly Lys Asp Tyr Lys Tyr Asp Asp

        275                 280                 285(2)SEQ ID NO:17序列信息:

(ⅰ)序列特征:

      (A)长度:332个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:17:

Met Asn Lys Lys Ser Ile Thr His Glu Glu Phe Ile Arg Gln Leu Lys

1               5                   10                  15

Glu Tyr Asn Leu Asp Asn Asn Leu Asn Tyr His Asp Pro Ala Val Leu

            20                  25                  30

Lys Lys Ile Asn Glu Leu Leu Pro Ala Asp Gln Gln Tyr Asp Leu Ile

        35                  40                  45

Ser Pro Thr Gln Asp Trp Tyr Gln Phe Lys Thr Leu Tyr Pro Ile Ser

    50                  55                  60

Lys Asn Gly Val Ile Ile Ser Ser Asn Leu Asp Asp Ser Ser Asn Val

65                  70                  75                  80

Leu Val Pro Glu Leu Ser Glu Asn Pro Tyr Asp Pro Ile Pro Gln Ser

                85                  90                  95

Gly Lys Ser Thr Ile Gln Thr Ala Val Arg Ser Pro Glu Ala Leu Tyr

            100                 105                 110

Ile Ile Leu Thr Thr Asn Asn Ser Leu Ser Phe Gly Gly Gly Thr Asn

        115                 120                 125

Thr Met Ile Ala Thr Arg Ile Ala Leu Leu Ser Val Thr Arg Pro Glu

    130                 135                 140

Leu Tyr Gln Ala Ile Thr Lys Val Asn Tyr Val Tyr Lys Ser Gly Gln

145                 150                 155                 160

Thr Ala Pro Arg Asn Ala Pro Val Ala Tyr Ile Glu Leu Ser Pro Asn

                165                 170                 175

Asn Ser Tyr Val Gln Thr Leu Leu Asn Asp Ser His Met Lys Arg Thr

            180                 185                 190

Ser Ser Tyr Glu Leu Val Gly Ser Ser Ile Ala Arg Arg Gly Ile Glu

        195                 200                 205

Thr Lys Trp Ser Lys Ser His Thr Ser Gly Val Ser Asp Thr Asp Ser

    210                 215                 220

Trp Ser Leu Ala Val Ser Ala Gly Ile Asp Ile Glu Trp Asp Val Gly

225                 230                 235                 240

lle Pro Leu Thr Ala Ser Ala Lys Glu Lys Leu Ser Leu Ser Ile Thr

                245                 250                 255

Gly Thr Tyr Gly Gln Ser Thr Thr Val Ser Ser Gln Asp Thr Ile Thr

            260                 265                 270

Gln Glu Tyr Thr Phe Ala Lys Pro Gly Lys Asp Tyr Lys Tyr Asp Asp

        275                 280                 285

Tyr Ala Tyr Ala Val Tyr Gln Leu Lys Ser Asn Tyr Gln Phe Ile Ala

    290                 295                 300

Gly Asp Ala Phe Asn Asn Leu Ile Asn Ser Leu Ser Phe Gly Asn Gln

305                 310                 315                 320

Phe Ser Val His Gly Asp Ala Ser Tyr Gln Tyr Ser

                325                 330(2)SEQ ID NO:18序列信息:

(ⅰ)序列特征:

      (A)长度:342个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:18:

Met Asn Lys Lys Ser Ile Thr His Glu Glu Phe Ile Arg Gln Leu Lys

1               5                   10                  15

Glu Tyr Asn Leu Asp Asn Asn Leu Asn Tyr His Asp Pro Ala Val Leu

            20                  25                  30

Lys Lys Ile Asn Glu Leu Leu Pro Ala Asp Gln Gln Tyr Asp Leu Ile

        35                  40                  45

Ser Pro Thr Gln Asp Trp Tyr Gln Phe Lys Thr Leu Tyr Pro Ile Ser

    50                  55                  60

Lys Asn Gly Val Ile Ile Ser Ser Asn Leu Asp Asp Ser Ser Asn Val

65                  70                  75                  80

Leu Val Pro Glu Leu Ser Glu Asn Pro Tyr Asp Pro Ile Pro Gln Ser

                85                  90                  95

Gly Lys Ser Thr Ile Gln Thr Ala Val Arg Ser Pro Glu Ala Leu Tyr

            100                 105                 110

Ile Ile Leu Thr Thr Asn Asn Ser Leu Ser Phe Gly Gly Gly Thr Asn

        115                 120                 125

Thr Met Ile Ala Thr Arg Ile Ala Leu Leu Ser Val Thr Arg Pro Glu

    130                 135                 140

Leu Tyr Gln Ala Ile Thr Lys Val Asn Tyr Val Tyr Lys Ser Gly Gln

145                 150                 155                 160

Thr Ala Pro Arg Asn Ala Pro Val Ala Tyr Ile Glu Leu Ser Pro Asn

                165                 170                 175

Asn Ser Tyr Val Gln Thr Leu Leu Asn Asp Ser His Met Lys Arg Thr

            180                 185                 190

Ser Ser Tyr Glu Leu Val Gly Ser Ser Ile Ala Arg Arg Gly Ile Glu

        195                 200                 205

Thr Lys Trp Ser Lys Ser His Thr Ser Gly Val Ser Asp Thr Asp Ser

    210                 215                 220

Trp Ser Leu Ala Val Ser Ala Gly Ile Asp Ile Glu Trp Asp Val Gly

225                 230                 235                 240

Ile Pro Leu Thr Ala Ser Ala Lys Glu Lys Leu Ser Leu Ser Ile Thr

                245                 250                 255

Gly Thr Tyr Gly Gln Ser Thr Thr Val Ser Ser Gln Asp Thr Ile Thr

            260                 265                 270

Gln Glu Tyr Thr Phe Ala Lys Pro Gly Lys Asp Tyr Lys Tyr Asp Asp

        275                 280                 285

Tyr Ala Tyr Ala Val Tyr Gln Leu Lys Ser Asn Tyr Gln Phe Ile Ala

    290                 295                 300

Gly Asp Ala Phe Asn Asn Leu Ile Asn Ser Leu Ser Phe Gly Asn Gln

305                 310                 315                 320

Phe Ser Val His Gly Asp Ala Ser Tyr Gln Tyr Ser Thr Asp Thr Ile

                325                 330                 335

Phe Ser Thr Gln Thr Pro

            340(2)SEQ ID NO:19序列信息:

(ⅰ)序列特征:

      (A)长度:359个氨基酸

      (B)类型:氨基酸

      (C)链型:单链

      (D)拓扑结构:线性

(ⅱ)分子类型:蛋白质

(ⅹⅰ)序列描述:SEQ ID NO:19:

Met Asn Lys Lys Ser Ile Thr His Glu Glu Phe Ile Arg Gln Leu Lys

1               5                   10                  15

Glu Tyr Asn Leu Asp Asn Asn Leu Asn Tyr His Asp Pro Ala Val Leu

            20                  25                  30

Lys Lys Ile Asn Glu Leu Leu Pro Ala Asp Gln Gln Tyr Asp Leu Ile

        35                  40                  45

Ser Pro Thr Gln Asp Trp Tyr Gln Phe Lys Thr Leu Tyr Pro Ile Ser

    50                  55                  60

Lys Asn Gly Val Ile Ile Ser Ser Asn Leu Asp Asp Ser Ser Asn Val

65                  70                  75                  80

Leu Val Pro Glu Leu Ser Glu Asn Pro Tyr Asp Pro Ile Pro Gln Ser

                85                  90                  95

Gly Lys Ser Thr Ile Gln Thr Ala Val Arg Ser Pro Glu Ala Leu Tyr

            100                 105                 110

Ile Ile Leu Thr Thr Asn Asn Ser Leu Ser Phe Gly Gly Gly Thr Asn

        115                 120                 125

Thr Met Ile Ala Thr Arg Ile Ala Leu Leu Ser Val Thr Arg Pro Glu

    130                 135                 140

Leu Tyr Gln Ala Ile Thr Lys Val Asn Tyr Val Tyr Lys Ser Gly Gln

145                 150                 155                 160

Thr Ala Pro Arg Asn Ala Pro Val Ala Tyr Ile Glu Leu Ser Pro Asn

                165                 170                 175

Asn Ser Tyr Val Gln Thr Leu Leu Asn Asp Ser His Met Lys Arg Thr

            180                 185                 190

Ser Ser Tyr Glu Leu Val Gly Ser Ser Ile Ala Arg Arg Gly Ile Glu

        195                 200                 205

Thr Lys Trp Ser Lys Ser His Thr Ser Gly Val Ser Asp Thr Asp Sar

    210                 215                 220

Trp Ser Leu Ala Val Ser Ala Gly Ile Asp Ile Glu Trp Asp Val Gly

225                 230                 235                 240

Ile Pro Leu Thr Ala Ser Ala Lys Glu Lys Leu Ser Leu Ser Ile Thr

                245                 250                 255

Gly Thr Tyr Gly Gln Ser Thr Thr Val Ser Ser Gln Asp Thr Ile Thr

            260                 265                 270

Gln Glu Tyr Thr Phe Ala Lys Pro Gly Lys Asp Tyr Lys Tyr Asp Asp

        275                 280                 285

Tyr Ala Tyr Ala Val Tyr Gln Leu Lys Ser Asn Tyr Gln Phe Ile Ala

    290                 295                 300

Gly Asp Ala Phe Asn Asn Leu Ile Asn Ser Leu Ser Phe Gly Asn Gln

305                 310                 315                 320

Phe Ser Val His Gly Asp Ala Ser Tyr Gln Tyr Ser Thr Asp Thr Ile

                325                 330                 335

Phe Ser Thr Gln Thr Pro Asp Pro Thr Pro Thr Asn Glu Lys Ser Leu

            340                 345                 350

Ile Gln Val Asn Phe Asn Pro

        355

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号