首页> 中国专利> 二硫桥连双链形式的蛋白质的重组表达

二硫桥连双链形式的蛋白质的重组表达

摘要

本发明涉及以双链形式产生多肽或蛋白质的方法,该方法通过在大肠杆菌中的重组表达,由此i)所述多肽或蛋白质作为双链多肽或蛋白质发挥其功能,ii)第一链的C末端氨基酸基团是Arg或Lys基团,iii)所述蛋白质/多肽的第二链在其N末端具有1-20个氨基酸基团和称为PRS的五肽序列VPXGS,其中X可以是任何天然存在的氨基酸,其中V代表Val、Leu、Ile、Ala、Phe、Pro或Gly,P代表Pro、Leu、Ile、Ala、Phe、Val或Gly,G代表Gly、Leu、Ile、Ala、Pro、Phe或Val,而S代表Ser、Tyr、Trp或Thr;以及iv)所述方法包含以下步骤:a)在核酸水平修饰所述多肽或蛋白质,使经修饰形式的该多肽或蛋白质在其环区域包含序列VPXGS,其中X、V、P、G和S如上所定义;b)引入所述在核酸水平修饰的构建体到大肠杆菌细胞中;c)培养并且随后裂解所述宿主细胞;以及d)分离双链多肽或蛋白质。根据本发明的优选实施方案,所述多肽或蛋白质是肉毒杆菌神经毒素,特别是肉毒杆菌神经毒素(BoNT(A))A型。

著录项

  • 公开/公告号CN101107361A

    专利类型发明专利

  • 公开/公告日2008-01-16

    原文格式PDF

  • 申请/专利权人 比奥泰康医疗有限责任公司;

    申请/专利号CN200680002957.3

  • 发明设计人 沃尔克·施佩希特;

    申请日2006-01-20

  • 分类号C12N15/70;C12N9/50;C07K14/33;C12N15/57;A61K38/48;

  • 代理机构北京市柳沈律师事务所;

  • 代理人封新琴

  • 地址 德国波茨坦

  • 入库时间 2023-12-17 19:37:05

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-03-13

    未缴年费专利权终止 IPC(主分类):C12N15/70 授权公告日:20130717 终止日期:20170120 申请日:20060120

    专利权的终止

  • 2013-07-17

    授权

    授权

  • 2010-04-28

    专利申请权的转移 IPC(主分类):C12N15/70 变更前: 变更后: 登记生效日:20100319 申请日:20060120

    专利申请权、专利权的转移

  • 2008-03-05

    实质审查的生效

    实质审查的生效

  • 2008-01-16

    公开

    公开

说明书

本发明的一个方面涉及通过在大肠杆菌宿主细胞中的重组表达产生双链 形式的蛋白质的方法。本发明的另一个方面涉及双链生物学活性形式的蛋白 质或多肽,其可通过前述的方法产生。

它们与相应的不呈现本发明特征的重组蛋白质/多肽相比,重要的优势在 于不必为了定向切割多肽链而用特异性蛋白酶处理,因而产生方法得以显著 简化。本发明的其它方面为:编码根据本发明的多肽/蛋白质的核酸;含有这 样的核酸或核酸序列的载体;含有前述载体的宿主细胞;和最后含有双链和 生物学活性蛋白质/多肽的药物制剂。

梭菌神经毒素是神经细胞中钙依赖性神经递质的分泌的强抑制剂。在通 过口腔摄入肉毒杆菌毒素(BoNT)(例如通过腐败的食物)之后,将出现被称作 肉毒中毒的临床现象,其特征在于多种肌肉的麻痹。呼吸肌的麻痹最终可导 致患者的死亡。在这种情况中,从神经到肌肉的信号转移在肌感受器 (myoceptor)处被中断,因为运动神经元不再能够分泌乙酰胆碱。肉毒杆菌神 经毒素通过蛋白水解切割参与该分泌过程的蛋白质,即所谓SNARE蛋白, 来产生它们的抑制作用。在这里,不同血清型的神经毒素在SNARE蛋白和 各自氨基酸序列的切割位点方面具有不同的特异性。BoNT(A)和BoNT(E)切 割SNARE蛋白SNAP-25,而BoNT(C)将SNAP-25以及突触融合蛋白-1识别 为底物。同样,血清型B、D、F和G的毒素以及破伤风毒素(TeNT)切割VAMP-2 (synaprobrevin-2)(Schiavo et al.,1997)。

梭菌神经毒素是已知的最强的毒药。例如,导致剂量组所有小鼠的一半 死于肉毒中毒的静脉给药致死剂量仅为5pg。大多数血清型的毒素当口服时 也是有毒的,这是由于它们被包埋在复合蛋白质中,因此在通过胃肠道时免 遭消化酶分解。人们还认为它们在通过小肠上皮细胞再吸收毒素中起作用 (Fujinaga,1997)。

在过去的几十年中,血清型A和B的肉毒杆菌毒素已经在治疗中得到了 应用。例如,通过定位注射仅最小剂量即可能松弛个体慢性痉挛的肌肉。一 个特别的优点是长效,例如,BoNT(A)和BoNT(B)的效力多于三到六个月。 最先的适应证包括张力失常,例如斜颈(torticollia)、睑痉挛和斜视;又增加了 更多的适应证,例如多汗或用于平滑皱纹的美容治疗。肉毒杆菌作为治疗剂 的市场增长迅速,相当重要的原因是发展了更多的适应证,而且在已有的用 途中有了更加广泛的使用。在这样的背景下,人们尝试了对神经毒素在活性 持续时间、效力和抗原潜力方面的性质加以改进。测试显示商业上可获得的 制剂(可获自Allergen的BOTOX和可获自Ipsen-Beaufort的Dysport,均为 BoNT(A)制剂;以及可获自Elan的Myobloc/Neurobloc,为BoNT(B)制剂)中 含有的复合蛋白质对活性持续时间和效力不具积极影响,但是由于蛋白质量 比具有相同活性的纯神经毒素制剂更高,可导致患者免疫反应的触发,使进 一步的注射变得无效。

由于复合蛋白质在活性成分制剂中不是必需的,甚至是不利的,并且某 些用于改进特性的修饰只能通过基因技术完成,因此人们对通过重组表达产 生神经毒素存在强烈的需求,例如,通过在大肠杆菌中的表达(以这种方式产 生的神经毒素不含前述的复合蛋白质)。此外由于肉毒杆菌毒素将被赋予不同 的细胞特异性,将发展新的适应证。这里,通过重组毒素或毒素衍生物的途 径同样是优选的。

肉毒杆菌毒素以及破伤风毒素在它们的氨基酸序列上具有高同源性,并 且特别是在其域结构方面是相似的。它们由受体结合域(HC)、易位域(HN)和催 化亚基(L)组成,其导致神经细胞中相应SNARE蛋白的切割。HC负责神经毒 素特异性结合到肌感受器,而易位域保证L能够通过核内体进入神经元的细 胞质。HN(N末端)和HC(C末端)形成100kDa的重链,而L是轻链,形成50 kDa的催化亚基。两种多肽链彼此通过二硫键相连。在参与的半胱氨酸残基 之间有接头区或环区(还同义地称为接头序列或环序列,或更简单的,称为接 头或环),其长度在各种血清型的肉毒杆菌毒素之间变化很大。最迟在细胞溶 胞过程中从梭菌释放毒素时,该环被至今还未定性的梭菌内肽酶切割,其中 切割和未切割的种类的比率在血清型之间有所不同。对于神经毒素的活性而 言,将环切割成双链毒素是关键的(Schiavo et al.,1997)。例如,在肉毒杆菌神 经毒素A的情况下,从环中,即环序列VRGIITSKTKSLDKGYNKALNDL中, 切出一个十肽,其在N末端以及C末端有半胱氨酸残基直接相邻,不仅一个 肽键被切割,而且发生两个蛋白酶切割作用。在这种情况下,生物活性的肉 毒杆菌神经毒素A的分子量天然地低于原本在梭菌中翻译的毒素的分子量。

因为其他宿主生物体例如大肠杆菌中不存在梭菌蛋白酶,重组肉毒杆菌 毒素和它们的片段或衍生物在其中作为单链肽表达。对于任何其它作为双链 蛋白发挥其正常生物/生化活性的蛋白质而言也是如此:一般而言,这种蛋白 质通过重组DNA技术作为单链蛋白获得,它们天然作为双链蛋白发挥的生物 /生化活性因此几乎不存在或完全不存在。

在过去,为了产生活性的蛋白质,尤其是活性的肉毒杆菌毒素,必须插 入序列特异性蛋白酶(例如凝血酶、因子Xa AA或genenase)的识别序列,使 得在纯化之后,能够通过添加内切蛋白酶进行切割并由此进行活化。这种内 切蛋白酶的使用主要有两种的缺点:一方面,不能在任何情况下排除这样的 可能,即除了通过基因技术方法添加的切割位点之外,氨基酸序列中还存在 其它添加的切割位点。即使当这些次要切割位点的切割效率显著较低时,在 蛋白酶处理之后,毒素的不同切割变体的混合物可导致分离上的困难。另一 方面,在药物制剂的情况下,由于制药法律(受规章限制的考虑因素)的原因, 后续添加蛋白质或让制剂接触其它蛋白质是非常不利的,因为必须证明该蛋 白质和其可能存在的污染物在进一步的处理中得以完全去除;这通常需要相 当的花费。

对于其它细菌毒素(例如假单胞菌外毒素或白喉毒素),也需要通过蛋白水 解切割成双链二硫桥连多肽的活化来使酶域发挥毒性作用(例如,通过ADP 核糖基化延伸因子并且由此抑制蛋白质合成)。这些毒素用于产生所谓的免疫 毒素,特别是用于肿瘤治疗。为了这种目的,将毒素的细胞结合域换成对肿 瘤特异表面蛋白(分化抗原或肿瘤相关抗原)具有高结合亲和力的蛋白质域。在 经典的免疫毒素中这些蛋白质域由单克隆抗体或其片段组成,但也可以利用 下述蛋白质来赋予针对某些肿瘤细胞的特异性,仅举数例:细胞因子、生长 因子以及affilin、锚蛋白重复蛋白或经过突变和选择的anticalin家族蛋白质 等。在这种融合蛋白的重组表达中,获得单链多肽。然而,例如,除了蓖麻 (Ricinus communis)的蛋白酶以外,蓖麻毒蛋白没有蛋白酶加工位点,而必须 插入这种位点,白喉毒素片段和假单胞菌外毒素片段作为免疫毒素的组成部 分能够在内在化于内体区室中之后被目标细胞的蛋白酶所切割。这在形成二 硫键的半胱氨酸残基之间的环区域中发生。然而,仅仅最小部分而非全部内 在化的免疫毒素分子以这种方式被加工(Ogata et al.,1990)。

为了以足够的数量和可溶的形式获得重组蛋白,尤其是较小的多肽,在 许多情况下必须将它们作为融合蛋白或杂合蛋白,例如与谷胱甘肽-S-转移酶 或麦芽糖结合蛋白融合或杂合的蛋白在大肠杆菌中表达。此外,市场上有许 多借助用于亲和纯化的N-末端或C-末端标签(例如His标签、Strep标签或 FLAG标签)来表达所需多肽的表达系统。许多情况下,表达质粒中在插入所 需蛋白的编码DNA序列的多克隆位点和融合配偶体(fusion partner)或亲和标 记物的编码序列之间存在蛋白酶识别序列。该序列被这样设计,使得在表达 和纯化融合蛋白之后,通过添加合适的序列特异内切蛋白酶(例如,凝血酶、 因子Xa或genenase),能够将所需蛋白从额外的肽区域分离出来。如果两种 融合配偶体通过二硫键而非肽键彼此共价结合,则在纯化之后借助含巯基物 质例如β-巯基乙醇、DTT或还原谷胱甘肽的简单还原作用将其彼此分离是可 能的。例如,可使用前述还原剂将所需的蛋白质从亲和基质(例如Ni-NTA琼 脂糖或StrepTactin琼脂糖)洗脱,而亲和标签保持与基质结合。这样就可以免 去分离亲和标签的进一步纯化步骤或添加内切蛋白酶。

因此,最好提供一种方法,用来重组表达各种蛋白质/多肽,尤其是神经 毒素和所述神经毒素的片段和衍生物以及融合蛋白或杂合蛋白,特别是用来 重组表达这样的免疫毒素:其在宿主细胞裂解之后已经以其生物活性的双链 结构存在,其中所述两条链是二硫桥连的。本文所述的发明提供了这种用于 产生这些蛋白质和多肽的方法。

令人惊讶的是,发明者们发现,当BoNT(A)的LHN片段或完整的神经毒 素A——二者通过重组表达作为单链获得,但均以双链二硫桥连形式发挥它 们正常的生物/生化活性——被施以至少一个特定的修饰,优选核酸水平的修 饰时,可通过重组表达以双链形式获得LHN片段和完整的毒素。发明者进行 的后续测试已证明,对于任何其他蛋白质/多肽也是如此,如果它们依照常规 重组方法作为单链获得但以双链二硫键形式发挥其生物活性的话。

前述“至少一个修饰”在BoNT(A)的情况下或在BoNT(A)的LHN片段的 情况下,涉及一种五肽序列的插入,该五肽序列在本文中称为PRS(蛋白酶识 别位点)。对于蛋白质/多肽的一般情况,可以对存在于待修饰(优选在核酸水 平)的蛋白质/多肽中的五肽序列进行这样的修饰(例如,通过替换至少一个氨 基酸残基或通过插入PRS的少数氨基酸残基或通过缺失氨基酸残基),使得其 与插入到已经存在的序列中的五肽序列PRS一致。以相同的方式可插入六/ 七/八(等)肽序列插入,需要或不需要缺失一个或两个或三个或数个氨基酸残 基。依照本发明,有利无害的是最终表达的多肽在其环区域具有PRS(五肽) 序列,其中所述“环区域”根据本发明定义为位于两个参与二硫键的半胱氨 酸残基之间的氨基酸序列。当该PRS序列存在于环区域时将产生这样的结果, 即在切断多肽序列PRS相邻的单链多肽后(在氨基酸水平),天然存在于两条 不同链中的序列也被分到两条不同的链上。在肉毒杆菌神经毒素A(BoNT(A)) 的情况下,该PRS序列优选地通过缺失BoNT(A)的五肽Asp443-Asp447而插 入到环中(参见图3-1)。在其它蛋白质/多肽中(例如,在BoNT(B)、BoNT(C1)、 BoNT(D)、BoNT(E)的情况下,在蓖麻毒蛋白的情况下,在假单胞菌外毒素 PE40的情况下或在白喉毒素(DT)的情况下),则优选将经修饰的BoNT(A)的 环插入到环序列中(参见图3-2至3-5),其中可缺失掉或不缺失掉天然环序列 的氨基酸残基。图3-2至3-5中修饰的环序列是不具有两个末端Cys残基的 那些序列,其中PRS序列的中央氨基酸不但可以是R、Y、H或Q,还可以 是任何其它天然存在的氨基酸。在前述其他蛋白质/多肽的情况下,特别优选 插入仅仅一部分经修饰的BoNT(A)的环,尤其是序列 GIITSKTKSLVPXGSKALNDL(X=天然存在的氨基酸),其中可以缺失掉或不 缺失掉天然环序列的氨基酸残基。图3-2至3-5中的修饰的环序列是那些不具 有两个末端Cys残基的序列。

因此,对于BoNT(A)的LHN片段或对于完整的重组毒素,这意味着序列 修饰是L和HN之间的环区域中的改变,并且这种改变为PRS序列的存在作 了准备。根据本发明,PRS序列,不只对于BoNT(A),是五肽序列 Val-Pro-Xaa-Gly-Ser。Xaa代表任何天然存在的氨基酸。与Xaa是Arg还是任 何其它天然存在的氨基酸无关,在任何情况下均将五肽序列 Val-Pro-Xaa-Gly-Ser称作五肽序列。然而当PRS序列的另外四个氨基酸残基 之一被替换时——这在本发明的背景下确实是可能的——特别是替换为相应 的亲水/疏水或极性单极残基时,将此情况下和下文中,将把该序列称为PRS 五肽序列的变体。例如,当Val被Leu、Ile、Ala、Phe、Pro或Gly取代时即 出现变体。此外,(还或仅)当PRS从N末端数起第二位的脯氨酸由Leu、Ile、 Ala、Phe、Val或Gly取代时出现变体。同样,PRS的第四位的甘氨酸可以, 例如,被Leu、Ile、Ala、Pro、Phe或Val取代;这导致其它的变体。并且当 PRS的第五位的丝氨酸被例如,Tyr、Trp、Thr,及任选地Cys或Met取代时, 将出现另外类型的变体。根据本发明,将至少在PRS序列的位置1、2、4和 5之一含有不同于Val-1、Pro-2、Gly-4和/或Ser-5氨基酸残基的那些序列称 为五肽序列的变体。

当BoNT(A)的LHN片段(或完整的毒素)或任何其它蛋白质/多肽——其通 常由重组表达作为单链蛋白质/多肽获得但(仅)在双链形式是生物/生化活性 的——含有五肽序列Val-Pro-Xaa-Gly-Ser(其中Xaa是20种天然存在的氨基 酸中的任一种,且其中四个其它氨基酸可根据上段的含义加以取代)时,其将 以双链形式存在于大肠杆菌宿主细胞(例如,大肠杆菌K12,尤其是菌株 M15[pREP4]、XL1-BLUE或UT5600的大肠杆菌K12宿主细胞)的裂解物中, 其中在BoNT(A)的情况下,轻链通过二硫键共价结合至HN或完整的重链(图 7)。多肽链的切割在细胞裂解之后立即实现,或在温育细胞裂解物几小时后 基本上完成。通过毒素或毒素片段的蛋白酶域活性的自我蛋白酶解是可以排 除的,因为相应修饰了环区域的蛋白酶失活突变体在表达和大肠杆菌宿主细 胞解体之后仍以双链结构存在。显而易见,负责切割PRS五肽序列的是大肠 杆菌宿主菌株的蛋白酶。

根据四段之前以“令人惊讶的是,发明者们......”开始的那一段(在第4 页),另一个优选的修饰位于PRS序列N末端间隔1-20个氨基酸残基处(N末 端方向上紧邻五肽PRS序列的缬氨酸残基的氨基酸——在图3-2至3-5的情 况下是亮氨酸残基——与PRS序列的间隔是1个氨基酸残基),尤其是间隔 3-15个氨基酸残基处,特别是间隔3-10个氨基酸残基处,更加优选间隔3-8 个氨基酸残基处,更加优选在间隔3个氨基酸残基处存在碱性氨基酸残基, 优选赖氨酸残基或精氨酸残基,其中大肠杆菌宿主细胞蛋白酶在它的C末端 切割环序列。切断之后即获得多肽,该多肽,例如,从PRS序列的缬氨酸残 基的N末端起具有两个氨基酸残基(当以上定义的间隔是3氨基酸残基时)。 在目前的情况下,“修饰”不一定意味着发生真正意义上的修饰,即氨基酸残 基的插入或取代,而使得PRS序列的N末端在前面定义的间隔1-20个氨基 酸残基处存在碱性氨基酸残基(例如,赖氨酸残基)。唯一重要的是与PRS序 列N末端具有上述间隔的地方存在碱性氨基酸残基(例如赖氨酸残基或精氨 酸残基)。

依照五段之前“令人惊讶的是,发明者们......”的那一段,另一种同样 非必需但优选的修饰在于,被大肠杆菌宿主细胞蛋白酶切割的环序列长度为 至少9个氨基酸残基。环序列优选的长度是至少12、至少15、至少18、至 少20和至少23个氨基酸残基。环序列特别优选的长度是15-22,尤其是18-22 个氨基酸残基。

根据本发明的方法在非常一般的意义上,是一种以大肠杆菌宿主细胞中 的重组表达为手段来产生双链形式的蛋白质/多肽的方法,其中所述两条链是 二硫桥连的,其中(i)所述蛋白质/多肽作为双链二硫桥连的蛋白质/多肽发挥其 生物活性;(ii)第一链的C末端氨基酸残基是Arg残基或Lys残基;(iii)蛋白 质/多肽的第二链在一个半胱氨酸残基的N端方向具有1-20氨基酸残基作为N 末端,并且具有命名为PRS五肽序列VPXGS,其中X是任何天然存在的氨 基酸,其中V是Val、Leu、Ile、Ala、Phe、Pro或Gly,其中P是Pro、Leu、 Ile、Ala、Phe、Val或Gly,其中G是Gly、Leu、Ile、Ala、Pro、Phe或Val, 并且其中S是Ser、Tyr、Trp或Thr;以及(iv)所述方法包括以下步骤:(a)在 核酸水平上修饰蛋白质/多肽,使得修饰形式的该蛋白质/多肽在其环区域之内 具有前述五肽序列(VPXGS);(b)在核酸水平上插入修饰的构建体到大肠杆菌 细胞中;(c)培养并且随后裂解宿主细胞;和(d)分离双链蛋白质/多肽。

根据本发明,蛋白质/多肽的第一链优选是由相应DNA的N末端编码的 链,而蛋白质/多肽的第二链因而是由相应的DNA的C末端编码的链。因为 5”-DNA-3‘的表达的结果产生N-多肽-C,在前述的本发明优选的情况下,这 意味着所述表达可如下表示:5’DNA-3′表达成为N-第一多肽链-C-环-N-第二 多肽链-C。根据本发明,所述环已被原位切割,因而最终本发明的多肽/蛋白 质N-第一多肽链-C-N-第二多肽链-C以双链结构被获得。

短语“蛋白质/多肽的第二链在一个半胱氨酸残基的N端方向具有1-20 氨基酸残基作为N末端,并且具有命名为PRS五肽序列VPXGS”的意思是 N末端不是由例如五肽序列VPXGS的缬氨酸残基形成,而是由其它(任何) 氨基酸残基形成的。在后者和PRS的缬氨酸残基之间,还可存在1-19个氨基 酸残基,但N末端氨基酸残基可通过肽键与例如所述缬氨酸残基直接结合, 即,可以紧邻PRS的缬氨酸残基。

可以以它们的(生物)活性双链结构被分离的本发明的蛋白质/多肽是这样 的蛋白质,其第一链的C末端具有碱性氨基酸残基,尤其是Arg残基或Lys 残基,并且其第二链N末端具有1-20个氨基酸残基以及称为PRS的五肽序 列VPXGS,其中X、V、P、G和S是如上所定义。

根据本发明,例如,在基于重组蓖麻毒蛋白的免疫毒素的情况下,序列 特异蛋白酶(例如凝血酶或因子Xa)的处理对于活化而言是不必要的。例如, 在基于白喉毒素或假单胞菌毒素的免疫毒素的情况下,预期可以获得,事实 上也获得了显著增加的效率,因为不再需要靶细胞蛋白酶的加工——毒素的 酶域易位至细胞质中的限速步骤了。已经作为双链二硫桥连的多肽存在的免 疫毒素,可以小剂量施用并且仍然提供相同的细胞毒作用。这一方面降低了 治疗成本,另一方面减少了形成可能使进一步施用该免疫毒素无效的抗体的 危险。本发明提供了用于产生双链二硫桥连并由此活化免疫毒素的方法。

用本发明提供的方法还可能制备融合蛋白或杂合蛋白,即,带有用于亲 和纯化的肽标签的双链形式的蛋白质,这些蛋白质的两条多肽链通过二硫键 共价结合,并且在亲和层析或其它纯化方法之后,可以用含巯基物质(例如β- 巯基乙醇、DTT或还原谷胱甘肽)通过简单还原作用来分离。

在大肠杆菌表达菌株例如M15[pREP4]或BL21(DE3)中重组表达梭菌神 经毒素和其片段(例如,梭菌神经毒素的LHN片段或衍生物,例如具有修饰的 细胞特异性),产生单链多肽。通过用胰岛素处理这些多肽,在蛋白酶域到易 位域的过渡区域的环序列区域中发生切割。因为胰岛素不是序列特异蛋白酶, 在多肽的其它区域可能发生切割(通常是不希望的)。例如,BoNT(A)被胰岛素 额外地在HN和HC之间切割,因而产生双链LHN片段和HC片段。为了保证 大多数情况下理想的、发生在环区域中的选择性切割,特异性内切蛋白酶的 识别序列的存在(可选地,在发生插入之后)是必需的。

利用序列特异内切蛋白酶例如凝血酶、因子Xa、genenase等切割重组融 合蛋白/杂合蛋白,属于公知的各种方法的范围。纯化之后,可分离融合配偶 体,其赋予重组蛋白/多肽更好的可溶性和/或更好的表达,或充当用于亲和纯 化的肽标签。为了这种目的,将蛋白质溶液与合适的可溶形式或在基质上固 定形式的内切蛋白酶一起温育。

这种技术也可以用于表达前述重组蛋白/多肽,它们作为双链蛋白质/多肽 发挥它们的正常生物/生化活性,但利用重组DNA技术获得它们时是无活性 的单链蛋白质/多肽(例如,表达梭菌神经毒素、梭菌神经毒素的片段例如LHN片段、或梭菌神经毒素的衍生物,例如细胞特异性被修饰的衍生物):将内切 蛋白酶的识别序列克隆到多肽中,优选在核酸水平克隆,例如克隆到L和HN之间的环区域中;此外,将另一个相同或另外的内切蛋白酶的识别序列克隆 至N末端或C末端,使其两侧与用于亲和纯化的肽标签邻接。随后用相应的 内切蛋白酶处理或多种内切蛋白酶同时或连续地处理被表达的单链蛋白质/ 多肽,在环区域的L和HN之间切割来加以活化,并去除肽标签。

这样的内切蛋白酶除了使用的成本和由此所需的额外工作步骤的成本之 外,由于制药法律(受规章限制的)方面的原因,它们在药物制剂(例如,使用 重组肉毒杆菌毒素或其衍生物)中的使用问题重重。一方面,所使用的内切蛋 白酶的纯度必需是经实验证实的,而另一方面,完全的去除以及制剂的无病 毒性在进一步纯化流程期间必需得到证明;这通常需要巨大的分析费用。由 于将来肉毒杆菌毒素(例如具有性质改良的或细胞特异性被修饰的肉毒杆菌 毒素)同样将由重组表达产生,因此人们非常需要这样的表达方法,可以提供 前文所述的、作为双链蛋白质/多肽发挥正常生物/生化活性,但通过重组DNA 技术获取时以无活性的单链蛋白质/多肽形式存在的重组蛋白质/多肽,特别 地,该方法可提供这样的肉毒杆菌毒素或其衍生物,它们是双链二硫桥连的、 因此具有生物活性的多肽/蛋白质,而不必要使用内切蛋白酶。

在下文中将更具体地解释本发明,因而最广义地提供一种方法,使用该 方法能够通过在大肠杆菌宿主细胞中的重组表达产生蛋白质例如梭菌神经毒 素以及其片段和衍生物,并且能够以它们的双链二硫桥连的并且因此是生物 活性的形式分离,它们的活化不需要添加内切蛋白酶。

在本发明的第一个优选实施方案中,BoNT(A)半胱氨酸残基430和454 之间的环区域的氨基酸序列(参见图3-1至3-5)已被修饰,因而在大肠杆菌宿 主细胞的裂解物中表达的毒素或其片段/衍生物已作为双链多肽存在。所述两 条链由半胱氨酸残基430和454参与形成二硫键而彼此共价结合。在本发明 特别优选的实施方案中,如图3所说明的,五肽Asp443-Asn447(DKGYN)可以 用Val-Pro-Arg-Gly-Ser(VPRGS)来取代。在本发明的另一个优选实施方案中, 该五肽Asp443-Asn447(DKGYN)还可以用Val-Pro-Tyr-Gly-Ser(VPYGS)、 Val-Pro-His-Gly-Ser(VPHGS)或Val-Pro-Gln-Gly-Ser(VPQGS)来取代。在这里, 同样地,不仅中央氨基酸残基可以是任何天然存在的氨基酸,另外四个氨基 酸残基也可以被替换,如在前文中详细说明的(当替换这些残基的至少一个 时,即出现本发明意义上的PRS序列变体)。此外,对该实施方案以及所有其 它在下文中将解释的优选实施方案而言仍然优选的是,环序列在PRS的N端 方向间隔1-28个氨基酸处具有碱性氨基酸残基,特别是赖氨酸或精氨酸残基。

对于本领域技术人员显而易见的是,替换其它的单个或几个氨基酸残基, 或在上面描述的BoNT(A)环区域中插入或缺失另外的氨基酸残基,同样会导 致被表达的本发明的毒素或源自它们的片段/衍生物在裂解物中作为双链多 肽存在。这些可能的变体同样被本发明所涵盖。

对于本领域技术人员同样显而易见的是,存在于野生型BoNT(A)中的五 肽Asp443-Asn447(DKGYN)可以用六肽,七肽、八肽等取代,只要在被表达和 单链翻译的多肽/蛋白质中,该PRS五肽序列或其可能的变体之一存在于环区 域之内。如上文中已说明的,优选该五肽的N末端存在碱性氨基酸残基(优选 赖氨酸)。

此外对于本领域技术人员显而易见的是,PRS五肽(Val-Pro-Arg-Gly-Ser) 的优选实施方案是蛋白酶凝血酶可能的识别序列的一部分,凝血酶在凝血级 联中扮演重要角色并且具有高度的序列特异性。需要明确地指出,首先,不 管是在肉毒杆菌神经毒素A型中还是在其它多肽中,凝血酶切割均不是为了 获得所需双链二硫桥连形式必需的,其次,凝血酶识别序列本身,即其未修 饰形式,对于借助大肠杆菌裂解物蛋白酶活性的切割是有益的,但完全不是 必需的。这样的PRS五肽序列的实施方案——PRS五肽序列插入到或产生在 相应的多肽中(更佳:在它们的环中),而该多肽不含C末端能被凝血酶切割 的精氨酸残基(而是存在另一种天然存在的氨基酸)——也导致在环中发生切 割,如上文说明的。如上所述,优选在五肽的N端方向、环中的赖氨酸残基 处实现切割(同样参见实施例2;图3)。

由于肉毒杆菌毒素的其它血清型,例如作为长效神经毒素的BoNT(B)和 BoNT(C1)和作为短效神经毒素的BoNT(E)可用于治疗,而且完全不同的、可 作为单链重组表达但仅作为双链发挥其生物活性的多肽/蛋白质也可在治疗 上使用,因此,理想地,这些神经毒素以及它们的片段或衍生物(以及其它多 肽/蛋白质)也能够作为双链二硫键多肽/蛋白质从大肠杆菌裂解物获得。特别 地,在BoNT(B)的情况下,在大肠杆菌裂解物中完全切割重组毒素成为双链 多肽/蛋白质,与肉毒梭菌(Clostridium botulinum)分泌的天然神经毒素相比有 显著的优势;该天然神经毒素通常有至少40%作为单链存在且因此是失活的 多肽,并且不能与活性的双链形式分离。同样显而易见的是,血清型B、C1 和E神经毒素中参与二硫键的半胱氨酸残基之间的环区域,相对于BoNT(A) 的环而言显著较短(图3和4)。在BoNT(A)中存在23个氨基酸残基(Val431- Leu453),而在BoNT(B)中仅8个(Lys438-Ile445),在BoNT(C1)中15个(His438- Asp452),在BoNT(E)中有13个氨基酸残基(Lys413-Ile425)存在于该区域中。尽 管如此,发现除BoNT(B)之外,当这些相对缩短的区域具有根据本发明的PRS 序列时,它们的长度足以使链的切割和二硫键形成成为可能。尽管BoNT(B) 环中的五肽被替换为PRS五肽序列时(这样环序列的全长仅8个氨基酸残基), BoNT(B)被切割成符合本发明含义的两条链(轻的和重的),但是,当环是至少 9个、至少15个、至少20个或甚至至少22个氨基酸残基时,获得了更好的 结果,也就是说依照本发明这是优选的。最后提到的实施方案之一中,所述 环具有22个氨基酸残基,图4-1和4-2的序列或二者之间的比较,对该实施 方案作了示例性的说明。

还通过实验证实,对于将神经毒素切割成二硫桥连的双链多肽/蛋白质而 言,优选将亚型B、C1等等中的环区域或它们的有效部分替换为BoNT(A) 的环区域或它们的有效部分,尤其是当以这种方式环被延伸到至少9个、优 选15个残基时,和/或当PRS的N末端插入了碱性氨基酸残基时(例如且优选 Lys残基)(如果先前无N末端碱性或Lys残基存在的话)。特别优选的是图4 所示的变化(其中图4中的PRS序列是VPRGS,但同时并且优选也是序列 VPYGS、VPHGS、VPQGS、VPKGS、VPIGS和VPAGS)。

在本发明的其它实施方案中,将血清型B、C1、D、E、F和G肉毒杆菌 毒素以及破伤风毒素中环区域的氨基酸序列和编码基因部分在参与L和HN之间二硫键的半胱氨酸残基之间修饰,使得大肠杆菌宿主细胞裂解物中表达 的毒素或源自它们的片段/衍生物已经作为双链多肽存在,该双链多肽中两条 链通过二硫键共价结合(对任何通过重组表达作为单链产生但仅以双链形式 展现生物活性的其它多肽/蛋白质也是如此)。在本发明的优选实施方案中,神 经毒素的完整环区域(或其部分),或源自它们的毒素片段/衍生物,可以替换 为BoNT(A)的完整环区域,如图3所示,或替换为BoNT(A)环区域的部分, 其中优选将五肽Asp443-Asn447替换为Val-Pro-Arg-Gly-Ser(VPRGS)。在本发 明另外的优选实施方案中,还可以将五肽Asp443-Asn447替换为Val-Pro Tyr-Gly-Ser、Val-Pro-His-Gly-Ser或Val-Pro-Gln-Gly-Ser。在本发明的特别优 选实施方案中,前述神经毒素的环区域或环区域的部分,以及源自它们的片 段/衍生物,可以被替换为寡肽Arg/Ser-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser- Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala(18聚体:R/SGIITSKTKSLVPRGSKA)。如果 在上述环序列的区域中进一步替换、插入或缺失单个或几个氨基酸残基,如 图4所示,也导致在大肠杆菌(例如,在大肠杆菌K12宿主细胞或其衍生物) 中表达之后,被表达的神经毒素或其片段/衍生物成为二硫桥连的双链多肽/ 蛋白质,这样的替换、插入或缺失明确地包含于本发明中(对任何能够通过重 组表达作为单链产生但仅以双链形式具有生物活性的其它多肽/蛋白质也是 如此)。

如上文中反复重申的,用根据本发明的方法或根据本发明另外的实施方 案的方法,还可以产生融合蛋白或杂合蛋白,其具有,例如,以下成分A、B 和C:

-效应物域,通过其酶活性,能够例如抑制靶细胞中的分泌或杀死它们 (A);

-环序列,其被根据本发明如上的说明修饰,且具有如上定义的PRS五 肽序列VPXGS(例如,如图3所示的BoNT(A)的修饰环序列或其变体),并且 可具有N末端和/或C末端附着的半胱氨酸残基(B);以及

-细胞结合域,其赋予融合蛋白或杂合蛋白以细胞特异性(C)。

成分B(环序列)在前两个实施方案中也同样可优选为:(i)如图4所示的 修饰的环序列,(ii)在PRS的中央残基可以是任何天然存在氨基酸的残基的 范围内,任何源自(i)的序列,或(iii)(i)或(ii)的变体(变体的定义见上)。在图4 中,BoNT(B)、BoNT(C1)或BoNT(E)的环序列分别缺失了除N末端和C末端 一或两个氨基酸残基以外的部分,并且缺失的氨基酸残基被BoNT(A)的修饰 环序列的17聚体GIITSKTKSLVPRGSKA(图4-2和4-6)或18聚体 RGIITSKTKSLVPRGSKA(图4-4)所取代。

除了前述的成分A、B和C,融合/杂合蛋白可具有翻译域(在肉毒杆菌神 经毒素中位于环序列和细胞结合域之间)。这种额外的域协助效应物域插入靶 细胞的细胞质。这种融合蛋白在大肠杆菌(例如,大肠杆菌K12或其衍生菌株) 中的表达产生这样的双链多肽/蛋白质,其中一个域在一条链上,而其它两个 域在第二条链上(在肉毒杆菌毒素中,效应物域在轻链上,其通过二硫键与在 重链上的其它两个域共价结合)。

这些本发明的融合或杂合蛋白可以是所谓的免疫毒素,它们尤其在肿瘤 治疗中有用处。在这种背景下,通过使细胞结合域附着于毒素,而赋予毒素 对于某种细胞类型(通常为肿瘤细胞)的特异性。作为毒素结合域,主要使用白 喉毒素、假单胞菌毒素和蓖麻毒蛋白的酶域。这些毒素属于双链AB毒素, 其中提供酶活性的A链通过二硫键共价结合于兼有易位活性和细胞结合活性 的B链。然而,在靶细胞中产生期望的作用(例如,肿瘤细胞的杀灭)的范围 内,免疫毒素中其它的毒素或毒素片段是可以想到的。第一代免疫毒素是将 毒素域(例如蓖麻毒蛋白的A链)与单克隆抗体化学偶联而产生的,第二代免 疫毒素是通过重组表达(主要是在大肠杆菌中)作为Fab毒素、单链FV毒素 (scFv毒素)或二硫键稳定化Fv(dsFv毒素),以及作为与生长因子或细胞因子 的融合蛋白产生的(Reiter,2001)。在将来各代免疫毒素中,还可以由经过选择 的修饰多肽来赋予细胞特异性,该多肽是根据,例如,与肿瘤特异表面蛋白(如 affilins、锚蛋白重复蛋白或anticalins蛋白家族的蛋白)的高亲和力结合而选择 的。

在免疫毒素所有可以想到的变体中,必须保证酶性毒素域能够进入靶细 胞的细胞质以在其中发生毒性作用。因为在大肠杆菌中免疫毒素作为单链多 肽表达,蛋白水解切割以及二硫键的还原对于将酶性毒素域与易位单位和细 胞结合域分离(对于链而言)是必需的。在重组白喉毒素片段和重组假单胞菌外 毒素片段的情况下,切割于内在化之后在靶细胞的内体区室中通过细胞蛋白 酶例如弗林蛋白酶发生(Williams et al.,1990)。另一方面,蓖麻毒蛋白不具有 这样的加工位点,因此,为了作为已经双链二硫桥连的免疫毒素施用,其需 要人工插入的蛋白酶识别序列。然而,在基于白喉毒素和假单胞菌外毒素的 免疫毒素的情况下,内在化融合蛋白只有最小一部分被切割,因而同样只有 最小一部分酶域能够到达细胞质(Ogata et al.,1990)。下述本发明的优选实施 方案描述了多种方法和构建体,依靠这些方法,通过在大肠杆菌宿主细胞中 重组表达产生如前面段落中所述的免疫毒素的变体,并且这些变体能够以它 们的双链二硫桥连的从而具有生物(酶促)活性的形式被分离,它们的活化不需 要细胞内切蛋白酶或体外添加内切蛋白酶。这些免疫毒素能够将酶性毒素域 以具有易位能力(translocation competent)的形式转运至靶细胞中,因而不需要 细胞蛋白酶的切割,并且为了达到期望的细胞毒性效应而使用的免疫毒素剂 量可以显著降低。

相应地,本发明的另一个优选实施方案进一步包含融合蛋白和杂合蛋白, 其具有以下成分A、B和C:

-毒素域或其片段/衍生物(A);

-环序列,其根据本发明如上所述被修饰,并具有如上定义的PRS五肽 序列VPXGS(例如,示于图3的BoNT(A)的修饰的环序列或其变体之一),并 且可能已于N末端和/或C末端附着有半胱氨酸残基(B);以及

-细胞结合域,其可以取自下列蛋白家族中的代表:单克隆抗体蛋白、 它们的片段、affilins、锚蛋白重复蛋白、anticalins、生长因子(例如,TGF-alpha、 FGF、VEGF或IGF-1)或细胞因子(例如,IL2、IL4或IL6)(C)。

依照最后的这种优选实施方案,成分B(环序列)同样可以是(i)图4所示的 修饰的环序列之一,(ii)在PRS的中央残基可以是任何天然存在氨基酸的残基 的范围内,任何源自(i)的序列,或(iii)(i)或(ii)的变体(变体的定义见上)。

毒素域可以是蓖麻毒蛋白的A链、假单胞菌外毒素的片段例如PE40或 PE38(域II和III,具有或不具有域Ib;图2)或白喉毒素的片段。前述效应物 域或毒素域和细胞结合域应仅仅理解为示例。本发明涵盖所有如下所述的蛋 白质或蛋白片段:一方面,其赋予融合蛋白/杂合蛋白对靶细胞(例如肿瘤细胞) 表面抗原的特异性结合活性,另一方面,其在靶细胞中内在化之后发挥某种 作用,例如杀死该细胞,其中在大肠杆菌中表达这种根据本发明的融合/杂合 蛋白产生双链多肽/蛋白质,在这些双链多肽/蛋白质中毒素域或它们的衍生物 通过二硫键共价结合于细胞结合域。

为了改善基于假单胞菌外毒素的免疫毒素的效率和特异性,曾经选择过 不同的方法。例如,曾将受体结合域(域Ia氨基酸残基1-152)替换为单克隆抗 体的片段,并且同时将易位域(域II)中半胱氨酸残基13和35(相对于域II编 号)之间的环区域(图2和5)修饰,使得后者对普遍存在的细胞蛋白酶——福 林蛋白酶的切割不再敏感,但对仅被某种肿瘤细胞以较强的程度表达并部分 分泌的特殊蛋白酶的切割敏感(美国专利6,426,075)。设计这种修饰的蛋白酶 敏感性,是为了在替换的受体结合域之外进一步赋予免疫毒素增加的细胞特 异性。然而,不应期望利用其它细胞蛋白酶可导致环切割的增加并因此提高 酶域III的易位效率。

根据另一种用于免疫毒素的方法,将受体结合域和易位域的N末端区域 去除,直到环区域中的精氨酸残基27为止。通过下述手段提供这种免疫毒素 中所需的细胞特异性:例如,通过在域II和III之间的Ib域处,插入以二硫 键相互结合的单克隆抗体VH域和VL域;或通过附加域III的C末端(美国专 利5,980,895)。在这种构建体中,通过蛋白酶的活化不再是必需的;一方面, 这将导致转运效率显著增加。然而,另一方面可以预期,依靠位于酶域III的 N末端或C末端的受体结合域(如单克隆抗体或TGF-alpha的VH域)的易位将 被阻碍。因为这些受体结合域未与酶域分离,可以预期会影响酶活性,从而 影响靶细胞中的毒性。下面两种情况下,基于假单胞菌外毒素的免疫毒素产 生相对最大程度的细胞毒素活性:一方面,半胱氨酸残基13和35之间的环 已经以被切割的二硫桥连形式存在,从而不再需要细胞蛋白酶的活化;另一 方面,受体结合域取代外毒素的域I而融合于易位域的N末端,使得在细胞 质中还原之后其与毒素域分离,从而不阻碍域III的酶活性。

因此,本发明一个特别优选的实施方案包括一种融合/杂合蛋白,其包含 细胞结合域,该细胞结合域可取自以下蛋白家族的代表:单克隆抗体、它们 的片段、affilins、锚蛋白重复蛋白、anticalins、生长因子(例如,TGF-alpha、 FGF、VEGF或IGF-1)或细胞因子(例如,IL2、IL4和IL6),细胞结合域的C 末端融合修饰的PE38片段或其变体,该片段能够在C终端携带内质网保留 信号Lys-Asp-Gly-Leu。PE38片段的修饰包含将半胱氨酸残基13和35之间 的完整环序列(或仅其部分)替换为PRS五肽序列VPXGS,优选替换为图3所 示的BoNT(A)的修饰的环序列或其变体,特别是替换为肽序列Arg-Gly-Ile-Ile- Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala(图5)(变体的定义 见上)。优选的,在这个实施方案中,还保证有碱性氨基酸位于PRS的N端 方向间隔1-20个氨基酸处,如图5的序列中所示。如此修饰的PE38片段以 及含有这种修饰片段的融合/杂合蛋白以双链二硫桥连形式存在于大肠杆菌 宿主细胞(例如,M15[pREP4])的裂解物中。

和假单胞菌外毒素相反,白喉毒素的酶域——A链存在于N末端。在C 末端的B链上有易位域和受体结合域。两条链均通过环序列连接,当被白喉 棒杆菌(Corynebacterium diphtheriae)的细胞分泌时,在所述环序列中精氨酸残 基193处由蛋白酶进行蛋白水解切割(Collier,2001)。切割后,两条链通过半 胱氨酸残基186和201之间的二硫键保持彼此共价结合。在这点上,白喉毒 素在其域结构上与肉毒杆菌毒素和破伤风毒素相似。

为了产生重组免疫毒素,将受体结合域或其部分替换为例如VEGF或IL2 (Arora e al.,1999;Williams et al.,1990)以赋予融合蛋白新的细胞特异性。为了 使A链到达靶细胞的细胞质,一方面,在大肠杆菌中作为单链表达的免疫毒 素的多肽链必须在A链和B链的环区域之间切割,而另一方面,必须将二硫 键还原。虽然后者在易位过程中发生,但细胞蛋白酶的蛋白水解切割是不完 全的,因而仅有最小部分的A链的能够释放至细胞质中(Williams et al.,1990)。 如果免疫毒素在施用时已经以双链二硫桥连的形式存在,则可望显著地增加 功效,因为所有A链都可成为具有易位能力的形式以供使用。

因此,本发明的另一个特别优选实施方案包含这样的融合或杂合蛋白, 其包含细胞结合域,该细胞结合域可取自以下的蛋白家族的代表:单克隆抗 体、它们的片段、affilins、锚蛋白重复蛋白、anticalins、生长因子(例如, TGF-alpha、FGF、VEGF或IGF-1)或细胞因子(例如,IL2、IL4和IL6);所述 细胞结合域的N末端融合了修饰的白喉毒素片段。此毒素片段可包含A链以 及B链的至少一个易位域(Gly1-Phe389或Gly1-Asn486)。白喉毒素片段的修饰 在于:半胱氨酸残基186和201之间的完整环序列(或仅其部分)被替换为图3 所示的修饰的环序列或其变体,尤其是替换为肽序列Arg-Gly-Ile-Ile-Thr-Ser- Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala(图5)(变体的定义见上)。这 样修饰的白喉毒素片段,以及含有这种修饰片段的融合蛋白,均以双链二硫 桥连的形式存在于大肠杆菌宿主细胞(例如M15[pREP4])的裂解物中。

第一代基于蓖麻毒蛋白的免疫毒素是通过连接蓖麻毒蛋白的A链和单克 隆抗体而产生。过去这是通过具有化学接头分子的抗体衍生化完成的,其中 所述接头分子与位于A链C末端的半胱氨酸残基的巯基官能团形成二硫键。 由于抗体的非定向衍生化,这种偶联物是不均一的。抗肿瘤效率不足,很重 要的原因是偶联物的大小,以及缺乏位于B链的易位域。当还存在天然形式 的B链作为免疫毒素的成分时,毒性将显著增加,但是由于B链的凝集素样 细胞结合性,被靶细胞之外的细胞非特异性地摄入也是有可能发生的。人们 使用了这样一种策略来应对这种靶标冲突(target conflict):根据该策略,对B 链进行修饰,使得易位活性保持完整而对细胞表面糖结构的结合亲和性却显 著降低(专利申请WO 89/04839)。然而,含有这种修饰的B链的重组表达免 疫毒素具有单链结构,因此,由于A链和B链之间的接头肽中缺乏细胞蛋白 酶识别序列,在免疫毒素被摄入靶细胞后A链的释放和易位完全不可能发生, 或仅可能以极低的效率发生。美国专利6,593,132中显示,这种天然接头肽是 不同细胞特异蛋白酶的识别序列。如果能以蛋白水解方式切割修饰的接头肽 的蛋白酶仅在期望的靶细胞中以显著高于其它细胞类型的量表达,具有这种 修饰的蓖麻毒蛋白变体可具有相应的细胞特异性。然而,必需假设切割仅在 一部分内在化的毒素分子中发生,并且因此仅相应的最小量的A链易位到细 胞质中。理想的基于蓖麻毒蛋白的双链免疫毒素是这样的:其中,A链通过 二硫键与修饰的B链连接,B链中易位活性保持完整,但非特异性凝集素样 细胞结合性被抑制;并且在它们的C末端与特异细胞结合域融合。这种免疫 毒素将兼具细胞特异性和高毒性。

因此,本发明的另一个优选实施方案包含这样的融合蛋白,其具有以下 成分A、B和C:

-蓖麻毒蛋白的A链(A);

-环序列,其根据本发明如上所述被修饰,并且具有如上定义的PRS五 肽序列VPXGS(例如,示于图3的BoNT(a)的环序列或其变体之一),并且在 N末端和/或C末端可能附着有半胱氨酸残基(B);以及

-细胞结合域,其可取自以下蛋白家族的代表:单克隆抗体、它们的片 段、affilins、锚蛋白重复蛋白、anticalins、生长因子(例如,TGF-alpha、FGF、 VEGF或IGF-1)或细胞因子(例如,IL2、IL4和IL6)(C)。

根据最后的优选实施方案的成分B也可以是(i)图4所示修饰的环序列之 一,(ii)在PRS的中央残基能够是任何天然存在氨基酸的残基的范围内,任 何源自(i)的序列,或(iii)(i)或(ii)的变体(变体的定义见上)。

具体而言,环序列可含有肽序列Ala-Pro-Pro-Arg-Gly-Ile-Ile-Thr-Ser- Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala-Asp-Val(图5-6),即,修饰 的蓖麻毒蛋白A链的环。优选在环序列的C末端具有半胱氨酸残基。但在其 中所含的Val-Pro-Arg-Gly-Ser的PRS序列中,Arg可以是任何其它天然存在 的氨基酸Xaa。环序列还可以被更多的氨基酸残基(例如,甘氨酸和丝氨酸残 基)所扩展。此外,蓖麻毒蛋白的A链可以通过环序列与完整的B链或其部 分或变体连接,该环序列取代蓖麻毒蛋白原野生型序列半胱氨酸残基259和 283之间的全部或部分氨基酸残基,并且至少包含图3所述的修饰的BoNT(A) 的环或其变体。在此情况下,半胱氨酸残基259和283(相对于蓖麻毒蛋白原 (pro ricin))形成二硫键。B链的C末端融合了细胞结合域,该细胞结合域取自 上述多肽家族。相应的融合/杂合蛋白以双链二硫桥连的形式存在于大肠杆菌 宿主细胞(例如菌株M15[pREP4]的细胞)的裂解物中。

本发明的另一个实施方案涉及重组融合蛋白,其具有以下成分A、B和C:

-蛋白质或寡肽,其赋予融合蛋白更好的可溶性,实现较高的表达率和/ 或使亲和纯化成为可能,(例如,谷胱甘肽-S-转移酶(GST)、麦芽糖结合蛋白 (MBP)、His标签、Strep标签、FLAG标签(A)。

-环序列,其根据本发明如上所述被修饰,该环序列包含如上定义的PRS 五肽序列VPXGS(例如,如图3所示的BoNT(A)修饰的环序列或其变体),并 且可能具有附着于N末端和/或C末端的半胱氨酸残基,以及

-任何类型的多肽(C)。

依照此最后优选序列的成分B(环序列)同样可以是(i)如图4所示修饰的 环序列之一,(ii)在PRS的中央残基可以是任何天然存在的氨基酸残基的范 围内,任何源自(i)的序列,或(iii)(i)或(ii)的变体(变体的定义如上所示)。

具体而言,环可以具有肽序列Val-Arg-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser- Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala-Leu-Asn-Asp-Leu,其中在PRS中央的Arg 仍然可以是Xaa。其在两端均可被更多的氨基酸残基(例如,甘氨酸和丝氨酸 残基)延伸。这种融合蛋白在大肠杆菌中的表达产生双链多肽/蛋白质,这些多 肽/蛋白质的两条链通过二硫键共价结合,并且在完全纯化之后,可以在不添 加蛋白酶的条件下,直接由含巯基物质(例如β-巯基乙醇、DTT或还原谷胱甘 肽)还原后彼此分离。这种表达系统尤其适合于这样的蛋白:其要在两个末端 之一提供半胱氨酸残基,以便在纯化和分离带有反应性巯基基团的融合配偶 体之后,提供用来例如与巯基反应性接头分子偶联反应或供例如聚乙二醇修 饰的位点。

此外本发明包含编码根据本发明前面部分所述多肽的所有核酸,并考虑 到密码子使用的不同可能性。此外,本发明包含商业上可以获得的或单独构 建的克隆和表达质粒,其含有根据本发明的各种多肽的编码DNA序列;以及 合适的大肠杆菌克隆和表达菌株,其用相应的表达质粒转化并且能够以其双 链二硫桥连形式表达各种根据本发明的多肽。这种表达系统的一个实例是 pQE系列的表达质粒和大肠杆菌宿主菌株M15[pREP4]的组合。

对于本领域熟练技术人员,尤其是从事药用多肽/蛋白质开发的技术人员 而言,这些多肽/蛋白质的活化不必添加内切蛋白酶的优势是显而易见的。前 面部分描述的根据本发明多肽/蛋白质大多是特别以药用为目标的。因此本发 明还包含药物制剂,其包含本发明的多肽/蛋白质之一或本发明的多肽/蛋白质 的混合物作为有效成分,以及赋予该制剂足够稳定性的有用添加剂;并且其 组成与其期望的施用形式相匹配。

所附的附图和序列表序列如下所述:

图1显示从肉毒杆菌或大肠杆菌K12释放具有野生型环或根据本发明的 修饰环的肉毒杆菌神经毒素A型的示意图。A:在肉毒杆菌细胞的裂解中, 神经毒素在轻链(L)和重链(H)之间的环区域中被梭菌内切蛋白酶切割。两条链 均通过二硫键彼此相连。B:具有野生型环的重组神经毒素在大肠杆菌中表达 并裂解细胞之后,其以单链形式存在。C:当具有根据本发明修饰的环的重组 神经毒素从大肠杆菌细胞释放时,内切蛋白酶在环区域中切割。

图2是比较具有野生型环区域以及根据本发明的修饰环区域的不同重组 毒素从大肠杆菌细胞释放之后的示意图。A:肉毒杆菌神经毒素;B:假单胞 菌外毒素;C:白喉毒素。

图3显示野生型环和挑选的根据本发明修饰的BoNT(A)环序列的比较。 图示为核苷酸序列和衍生的氨基酸序列,其包含轻链和重链的限定性半胱氨 酸残基。箭头标注大肠杆菌裂解物中内切蛋白酶的切割位点。

图4分别显示肉毒杆菌神经毒素血清型B、C1和E的野生型环和根据本 发明修饰的示例环序列的比较。图示为核苷酸序列和衍生的氨基酸序列,其 包含轻链和重链的限定性半胱氨酸残基。箭头标注大肠杆菌裂解物中内切蛋 白酶的切割位点。

图5分别显示假单胞菌外毒素片段PE40、白喉毒素(DT)和蓖麻毒蛋白的 野生型环和根据本发明修饰的示例环序列的比较。图示为核苷酸序列和衍生 的氨基酸序列,其包含限定性半胱氨酸残基。箭头标注大肠杆菌裂解物中内 切蛋白酶的切割位置。

图6显示用于克隆重组毒素和毒素片段的寡核苷酸的组合。限制性内切 酶的识别序列以下划线标记。

图7显示具有根据本发明修饰的环序列的BoNT(A)重组LHN片段在SDS 聚丙烯酰胺凝胶上的分析。LHN片段的表达在M15[pREP4]细胞中进行,该细 胞被质粒pQE-BoNT(A)-Lmod1HN转化。泳道2和5:在Ni-NTA琼脂糖上纯化 的LHN片段;泳道1和4:同凝血酶一起温育之后的LHN片段;泳道3:分 子量标记。上样在还原条件(泳道1和2)和非还原条件下(泳道4和5)。

图8显示具有根据本发明修饰的环序列的BoNT(B)重组LHN片段在SDS 聚丙烯酰胺凝胶上的分析。LHN片段的表达在M15[pREP4]细胞中进行,该细 胞被质粒pQE-BoNT(B)-Lmod1HN转化。泳道1和4:在Ni-NTA琼脂糖上纯化 的片段LHN;泳道2:分子量标记;泳道3:无上样。上样在还原条件(泳道 1)和非还原条件下(泳道4)。

图9显示具有根据本发明修饰的环序列的重组BoNT(C1)在SDS聚丙烯 酰胺凝胶上的分析。该毒素的表达在M15[pREP4]细胞中完成,该细胞被质粒 pQE-BoNT(C1)-Lmod1HNHC转化。泳道1和4:在Ni-NTA琼脂糖上纯化的毒 素;泳道2:分子量标记;泳道3:无上样。上样在还原条件(泳道1)或非还 原条件下(泳道4)。

SEQ ID NO.1是编码具有根据本发明修饰的环序列和C末端六组氨酸标 签的重组肉毒杆菌神经毒素A型(rBoTN(A)-mod1)的核酸(DNA)的实例。

SEQ ID NO.2是具有根据本发明修饰的环序列和C末端六组氨酸标签的 重组肉毒杆菌神经毒素A型(rBoTN(A)-mod1)的实例。

SEQ ID NO.3是编码具有根据本发明修饰的环序列和C末端六组氨酸标 签的肉毒杆菌神经毒素A型重组LHN片段(rBoTN(A)-Lmod1HN)的核酸(DNA) 的实例。该序列相应于SEQ ID NO.1,其中缺失核苷酸2620-3888。

SEQ ID NO.4是具有根据本发明修饰的环序列和C末端六组氨酸标签的 肉毒杆菌神经毒素A型重组LHN片段(rBoTN(A)-Lmod1HN)的实例。该序列相 应于SEQ ID NO.2,其中缺失氨基酸残基874-1296。

SEQ ID NO.5是编码具有根据本发明修饰的环序列和C末端六组氨酸标 记的肉毒杆菌神经毒素A型重组LHNHCN片段(rBoTN(A)-Lmod1HNHCN)的核酸 (DNA)的实例。该序列相应于SEQ ID NO.1,其中缺失核苷酸3286-3888。

SEQ ID NO.6是具有根据本发明修饰的环序列和C末端六组氨酸标记的 肉毒杆菌神经毒素A型重组LHNHCN片段(rBoTN(A)-Lmod1HNHCN)的实例。该 序列相应于SEQ ID NO.2,其中缺失氨基酸残基1096-1296。

SEQ ID NO.7是编码具有根据本发明修饰的环序列和C末端六组氨酸标 签重组肉毒杆菌神经毒素B型(rBoTN(B)-mod1)的核酸(DNA)的实例。

SEQ ID NO.8是具有根据本发明修饰的环序列和C末端六组氨酸标签的 重组肉毒杆菌神经毒素B型(rBoTN(B)-mod1)的实例。

SEQ ID NO.9是编码具有根据本发明修饰的环序列和C末端六组氨酸标 签的肉毒杆菌神经毒素B型重组LHN片段(rBoTN(B)-Lmod1HN)的核酸(DNA) 的实例。该序列对应于SEQ ID NO.7,其中缺失了核苷酸2623-3915。

SEQ ID NO.10是具有根据本发明修饰的环序列和C末端六组氨酸标签 的肉毒杆菌神经毒素B型重组LHN片段(rBoTN(B)-Lmod1HN)的实例。该序列 对应于SEQ ID NO.8的序列,其中缺失了氨基酸残基875-1305。

SEQ ID NO.11是编码具有根据本发明修饰的环序列和C末端六组氨酸 标签的重组肉毒杆菌神经毒素C1型(rBoTN(C1)-mod1)的核酸(DNA)的实例。

SEQ ID NO.12是具有根据本发明修饰的环序列和C末端六组氨酸标签 的重组肉毒杆菌神经毒素C1型(rBoTN(C1)-mod1)的实例。

SEQ ID NO.13是编码具有根据本发明修饰的环序列和C末端六组氨酸 标签的肉毒杆菌神经毒素C1型重组LHN片段(rBoTN(C1)-Lmod1HN)的核酸 (DNA)的实例。该序列对应于SEQ ID NO.11,其中缺失了核苷酸2599-3858。

SEQ ID NO.14是具有根据本发明修饰的环序列和C末端六组氨酸标签 的肉毒杆菌神经毒素C1型重组LHN片段(rBoTN(C1)-Lmod1HN)的实例。该序 列对应于SEQ ID NO.12,其中缺失了氨基酸残基867-1286。

SEQ ID NO.15是编码具有根据本发明修饰的环序列和C末端六组氨酸 标签的肉毒杆菌神经毒素E型(rBoTN(E)-mod1)的核酸(DNA)的实例。

SEQ ID NO.16是具有根据本发明修饰的环序列和C末端六组氨酸标签 的重组肉毒杆菌神经毒素E型(rBoTN(E)-mod1)的实例。

SEQ ID NO.17是编码具有根据本发明修饰的环序列和C末端六组氨酸 标签,并包含域II、Ib和III的假单胞菌外毒素重组40kDa片段(PE40-mod1) 的核酸(DNA)的实例。

SEQ ID NO.18是具有根据本发明修饰的环序列和C末端六组氨酸标签, 并包含域II、Ib和III的假单胞菌外毒素重组40kDa片段(PE40-mod1)的实例。

SEQ ID NO.19是编码具有根据本发明修饰的环序列和C末端六组氨酸 标签、且包含A链和B链N末端片段的白喉毒素重组片段(DT389-mod1)的 核酸(DNA)的实例。

SEQ ID NO.20是具有根据本发明修饰的环序列和C末端六组氨酸标签、 且包含A链和B链N末端片段的白喉毒素重组片段(DT389-mod1)的实例。

SEQ ID NO.21是编码具有根据本发明修饰的环序列和C末端六组氨酸 标签的重组蓖麻毒蛋白(rRicin-mod1)的核酸(DNA)的实例。

SEQ ID NO.22是具有根据本发明修饰的环序列和C末端六组氨酸标签 的重组蓖麻毒蛋白(rRicin-mod1)的实例。

实施例

实施例1克隆和表达具有修饰的环的肉毒杆菌神经毒素A型LHN片段

为了克隆轻链以及易位域的DNA序列,将染色体DNA从肉毒梭菌A 型(菌株ATCC 3502)的培养物中分离。通过用引物#1和#2(图6)的PCR扩增, 获得编码具有修饰的环序列和C末端His标签的BoNT(A)轻链的基因片段。 借助Nco 1和Sal1的限制位点将PCR扩增产物克隆到表达质粒pQE-60中, 从而产生质粒pQE-BoNT(A)-Lmod1。通过用引物#3和#4(图6)的PCR扩增, 产生编码BoNT(A)的易位域的基因片段。借助Stu I和Xho I的限制位点将该 片段克隆到pQE-BoNT(A)-Lmod1中的环序列和His标签的序列之间(质粒 pQE-BoNT(A)-Lmod1HN;序列#2,图3,No.2)。将大肠杆菌表达菌株 M15[pREP4](Qiagen)用质粒pQE-BoNT(A)-Lmod1HN转化。修饰的LHN片段的 表达通过用500μM终浓度的IPTG于25摄氏度过夜分步诱导进行。在具有 300mM NaC1的50mM pH8.0磷酸缓冲液中通过溶菌酶处理和超声波处理将 细胞裂解。将经过离心的裂解物在Ni-NTA琼脂糖柱上层析。在SDS聚丙烯 酰胺凝胶上的分析显示,在还原条件下两条大约50kDA的带以及一条100 kDA的带被考马斯染色,而在非还原条件下仅观察到所述100kDA的带(图 7)。这样就清楚地证明,有多于75%的LHN片段是作为双链多肽从细菌中释 放的,其中两条链通过二硫键彼此共价结合。后续的凝血酶处理一方面导致 单链形式的切割,另一方面导致双链多肽中易位域的缩短(图7)。在纯化LHN片段之前将大肠杆菌裂解物温育两小时,导致双链多肽的完全切割。

相应被表达和纯化的具有天然环序列的LHN片段(图3,No.1)在SDS聚 丙烯酰胺凝胶上于非还原以及还原条件下均呈现100kDa的带。仅在用胰蛋 白酶切割时才能将该单链多肽转化成双链二硫桥连的LHN片段。

实施例2克隆和表达具有修饰的环的肉毒杆菌神经毒素A型LHNHCN片段和切割位点的鉴定

用引物#3和#5(图6)通过PCR扩增产生HNHCN片段(具有BoNT(A)受体 结合域的N端一半的易位域),并且借助StuI和Xho I的限制性位点克隆到质 粒pQE-BoNT(A)-Lmod1中(质粒pQE-BoNT(A)-Lmod1HNHCN;序列#3)。表达和 纯化根据实施例1所述进行。在SDS聚丙烯酰胺凝胶上的分析显示,除了对 应于单链多肽的弱带和其它未定义的带之外,有对应于轻链和HNHCN片段的 50kDa的带以及一条75kDa的带。对HNHCN片段最先四个氨基酸残基的N 末端测序提供了序列Ser-Leu-Val-Pro。在大肠杆菌裂解物中通过蛋白酶活性 的切割由此发生在Lys440之后,从而在插入到环中的五肽Val-Pro-Arg-Gly-Ser 的N端方向上。

实施例3克隆和表达具有修饰的环的肉毒杆菌神经毒素B型LHN片段

为了克隆轻链以及易位域的DNA序列,从肉毒梭菌B型(菌株Okra)的 培养物中分离染色体DNA。用引物#6和#7(图6)通过PCR扩增产生了编码 具有BoNT(A)修饰的环序列的BoNT(B)轻链的基因片段。用引物#8和#9(图 6)了产生编码BoNT(B)的易位域的基因片段。克隆到表达质粒pQE-60中是这 样实现的:首先借助Nco I和Stu I限制性位点,用BoNT(B)-Lmod1扩增产物替 换pQE-BoNT(A)-Lmod1中的BoNT(A)-L基因片段。接下来,借助Stu I和Xho I限制性位点将BoNT(B)-HN扩增产物克隆在其后面,由此产生质粒 pQE-BoNT(B)-Lmod1HN(序列#5)。以类似于实施例1的方式在宿主菌株 M15[pREP4]中表达并纯化LHN片段。SDS聚丙烯酰胺凝胶上的分析显示在还 原条件下有大约50kDa和55kDa的两条带被考马斯染色,而在非还原条件 下观察到一条大约105kDa的带(图8)。这些清楚地说明LHN片段基本上作为 双链多肽从细菌中释放,其中多于80%的两条链通过二硫键彼此共价连接。

实施例4克隆和表达具有修饰的环的肉毒杆菌神经毒素C1型LHN片段 和切割位点的鉴定

为了克隆轻链以及易位域的DNA序列,从肉毒梭菌C1型(菌株C205) 的培养物中制备染色体DNA。用引物#10和#11进行PCR扩增(图6)产生了 编码具有BoNT(A)的修饰环序列的BoNT(C1)轻链的基因片段。用引物#12 和#13(图6),产生编码BoNT(C1)的易位域的基因片段。克隆到表达质粒 pQE-60中是这样实现的:首先借助Nco I和Stu I的限制性位点用 pQE-BoNT(C1)-Lmod1扩增产物替换pQE-BoNT(A)-Lmod1中的BoNT(A)-L基因 片段。接下来,借助Stu I和Xho I限制性位点将BoNT(C1)-HN扩增产物克隆 在其后面,由此产生质粒pQE-BoNT(C1)-Lmod1HN(序列#7)。以类似于实施例 1的方式在宿主菌株M15[pREP4]中表达并纯化LHN片段。SDS聚丙烯酰胺凝 胶上的分析显示在还原条件下有大约50kDa和55kDa的两条带被考马斯染 色,而在非还原条件下观察到一条大约105kDa的带。这清楚地说明多于90% 的LHN片段作为双链多肽从细菌中释放,在所述双链多肽中两条链通过二硫 键彼此共价连接。对HN片段最先四个氨基酸残基的N末端测序结果为序列 Ser-Leu-Val-Pro。大肠杆菌裂解物中蛋白酶活性所致的切割发生在Lys447之后, 因而在插入BoNT(A)环中的五肽Val-Pro-Arg-Gly-Ser的N端方向上。通过直 接诱变,将插入的五肽的精氨酸残基替换为组氨酸、酪氨酸和谷氨酰胺。温 育大肠杆菌裂解物两小时之后,以相同方式表达的诱变的LHN片段中多于 90%以双链二硫键化的形式存在,其中切割的效率稍低于含有用五肽 Val-Pro-Arg-Gly-Ser修饰的BoNT(A)环的LHN片段。

实施例5克隆和表达带有修饰环的重组肉毒杆菌神经毒素C1型

使用肉毒梭菌C205菌株的染色体DNA,用引物#12和#14(图6)扩增编 码重链的基因片段。借助Stu I和Xho I的限制性位点将其克隆到质粒 BoNT(C1)-Lmod1HN中编码轻链的序列段和His标签的序列段之间(质粒 pQE-BoNT(C1)-Lmod1HNHC;序列#6)。用相应的表达质粒转化大肠杆菌表达 菌株M15[pREP4](Qiagen)。以类似于实施例1的方式在宿主菌株M15[pREP4] 中表达并纯化。SDS聚丙烯酰胺凝胶上的分析显示在还原条件下有大约50 kDa和105kDa的两条带被考马斯染色,而在非还原条件下观察到一条大约 155kDa的带(图9)。这样清楚地证明,多于90%的重组神经毒素作为双链多 肽从细菌中释放,在所述双链多肽中两条链通过二硫键彼此共价连接。偏侧 膈鉴定(hemidiaphragm assay)中活性检测的结果是其毒性可以与分离自肉毒 梭菌的天然神经毒素C1型的毒性相比较。因此轻链和易位域之间环区域的修 饰对毒性不产生影响。

实施例6克隆和表达具有修饰的环的假单胞菌外毒素(Pe40)的重组片段

使用菌株铜绿假单胞菌(Pseudomonas aeruginosa)103的染色体DNA,使 用引物#17和#18(图6)通过PCR扩增了一个基因片段,其编码域II中位于 半胱氨酸残基13和36之间的环的C端的区域以及域III。借助Nco I和Mlu I 将扩增产物克隆到质粒pQE-BoNT(A)-Lmod1中,替换基因片段BoNT(A)-Lmod1(质粒pQE-PEII3 III)。通过寡核苷酸#15和#16(图6)的杂交并借助Nco I和 Kpn I限制性位点克隆,将环N端方向的域II区域的序列段插入质粒pQE-PEII3III中(质粒pQE-PEIImod III;序列#9)。用相应的表达质粒转化大肠杆菌表达 菌株M15[pREP4](Qiagen)。以类似于实施例1的方式在宿主菌株M15[pREP4] 中表达和纯化。SDS凝胶上还原条件下的分析产生一条较弱的40kDa的带和 一条较强的37kDa的带。然而在非还原条件下,仅观察到一条40kDa的带。 当亲和层析纯化之前室温温育细胞裂解物至少两小时时,在还原条件下不再 能够检测到40kDa的带。用修饰的BoNT(A)环替换PE40片段的域II中半胱 氨酸残基13和36之间的环区域,从而发生了多肽链的切割,其中前述半胱 氨酸残基形成二硫键。在12%SDS凝胶中还原之后,不再能够检测到大约3 kDa的N末端片段。

实施例7克隆和表达具有修饰的环的白喉毒素(Dt389)的重组片段

使用白喉棒杆菌(Corynebacterium diphtheria)NCTC 13129菌株的染色体 DNA,用引物#19和#20(图6)通过PCR扩增编码白喉毒素A链的基因片段。 借助Nco I和Stu I的限制性位点将扩增产物克隆到质粒pQE-BoNT(A)-Lmod1中(参见实施例1)(质粒pQE-DT-Amod1)。以相同的方式,用引物#21和#22(图 6)扩增编码B链N末端片段的基因片段,并且将该基因片段借助Stu I和Xho I的限制性位点克隆到pQE-DT-Amod1中(质粒pQE-DT389-mod1;序列#10)。用 相应的表达质粒转化大肠杆菌表达菌株M1 5[pREP4](Qiagen)。以类似于实施 例1的方式在宿主菌株M15[pREP4]中表达和纯化。SDS聚丙烯酰胺凝胶上 的分析显示,在还原条件下两条大约22kDa的带被考马斯染色,而在非还原 条件下观察到一条大约43kDa的带。这清楚地说明,多于90%的重组白喉毒 素片段作为双链多肽从细菌中释放,在所述双链多肽中两条链通过二硫键彼 此共价连接。

实施例8克隆和表达具有修饰的环的重组蓖麻毒蛋白

使用蓖麻的种子mRNA,用引物#23和#24(图6)通过RT-PCR扩增编码 蓖麻毒蛋白A链的基因片段。借助Nco I和Xho I的限制性位点将其克隆到质 粒pQE-BoNT(A)-Lmod1中(参见实施例1)(质粒pQE-Ricin-A)。以相同的方式, 用引物#25和#26(图6)扩增编码B链的基因片段,并借助Kpn I和Xho I的 限制性位点克隆到pQE-Ricin-A中(质粒pQE-Ricin-mod1;序列#11)。用相应 的表达质粒转化大肠杆菌表达菌株M15[pREP4](Qiagen)。以类似于实施例1 的方式在宿主菌株M15[pREP4]中表达并纯化所表达的蓖麻毒蛋白的可溶部 分。SDS聚丙烯酰胺凝胶上的分析显示,在还原条件下有两条大约19kDa和 42kDa的带被考马斯染色,而在非还原条件下观察到大约62kDa的带。这清 楚的说明多于90%的重组蓖麻毒蛋白的可溶部分以双链多肽形式从细菌中释 放,所述双链多肽中两条链通过二硫键彼此共价连接。

科学文献

Arora et al.(1999),Cancer Res.59:183-8

Collier(2001),Toxicon 39(11):1793-803

Fujinaga(1997),Microbiology 143:3841-47

Ogata et al.(1990),J.Biol.Chem 265(33):20678-85

Reiter(2001),Adv.Cancer Res.81:93-124

Schiavo and Montecucco(1997),The Clostridia:Molecular Biology and Pathogenesis,Academic Press,San Diego:295-322

Williams et al.(1990)J.Biol Chem,265(33):20673-77

专利文献

Borgford,美国专利6,593,132

Brown and Jones,WO 89/04839

Fitzgerald et al.,美国专利6,426,075

Pastan et al.,美国专利5,980,895

                                   序  列  表

<110>比奥泰康医疗有限责任公司(BioteCon Therapeutics GmbH)

<120>二硫桥连双链形式的蛋白质的重组表达

<130>BIO-008 PCT/natPh

<140>PCT/DE 2006/000088

<141>2006-01-20

<150>10 2005 002978.7

<151>2005-01-21

<160>22

<170>PatentIn version 3.3

<210>1

<211>3915

<212>DNA

<213>肉毒梭菌(Clostridium botulinum)

<400>1

atggcatttg ttaataaaca atttaattat aaagatcctg taaatggtgt tgatattgct     60

tatataaaaa ttccaaatgc aggacaaatg caaccagtaa aagcttttaa aattcataat    120

aaaatatggg ttattccaga aagagataca tttacaaatc ctgaagaagg agatttaaat    180

ccaccaccag aagcaaaaca agttccagtt tcatattatg attcaacata tttaagtaca    240

gataatgaaa aagataatta tttaaaggga gttacaaaat tatttgagag aatttattca    300

actgatcttg gaagaatgtt gttaacatca atagtaaggg gaataccatt ttggggtgga    360

agtacaatag atacagaatt aaaagttatt gatactaatt gtattaatgt gatacaacca    420

gatggtagtt atagatcaga agaacttaat ctagtaataa taggaccctc agctgatatt    480

atacagtttg aatgtaaaag ctttggacat gaagttttga atcttacgcg aaatggttat    540

ggctctactc aatacattag atttagccca gattttacat ttggttttga ggagtcactt    600

gaagttgata caaatcctct tttaggtgca ggcaaatttg ctacagatcc agcagtaaca    660

ttagcacatg aacttataca tgctggacat agattatatg gaatagcaat taatccaaat    720

agggttttta aagtaaatac taatgcctat tatgaaatga gtgggttaga agtaagcttt    780

gaggaactta gaacatttgg gggacatgat gcaaagttta tagatagttt acaggaaaac    840

gaatttcgtc tatattatta taataagttt aaagatatag caagtacact taataaagct    900

aaatcaatag taggtactac tgcttcatta cagtatatga aaaatgtttt taaagagaaa    960

tatctcctat ctgaagatac atctggaaaa ttttcggtag ataaattaaa atttgataag   1020

ttatacaaaa tgttaacaga gatttacaca gaggataatt ttgttaagtt ttttaaagta   1080

cttaacagaa aaacatattt gaattttgat aaagccgtat ttaagataaa tatagtacct   1140

aaggtaaatt acacaatata tgatggattt aatttaagaa atacaaattt agcagcaaac   1200

tttaatggtc aaaatacaga aattaataat atgaatttta ctaaactaaa aaattttact   1260

ggattgtttg aattttataa gttgctatgt gtaagaggga taataacttc taaaactaaa   1320

tcattagttc cgcgtggatc caaggcctta aatgatttat gtatcaaagt taataattgg   1380

gacttgtttt ttagtccttc agaagataat tttactaatg atctaaataa aggagaagaa   1440

attacatctg atactaatat agaagcagca gaagaaaata ttagtttaga tttaatacaa   1500

caatattatt taacctttaa ttttgataat gaacctgaaa atatttcaat agaaaatctt   1560

tcaagtgaca ttataggcca attagaactt atgcctaata tagaaagatt tcctaatgga   1620

aaaaagtatg agttagataa atatactatg ttccattatc ttcgtgctca agaatttgaa   1680

catggtaaat ctaggattgc tttaacaaat tctgttaacg aagcattatt aaatcctagt   1740

cgtgtttata catttttttc ttcagactat gtaaagaaag ttaataaagc tacggaggca   1800

gctatgtttt taggctgggt agaacaatta gtatatgatt ttaccgatga aactagcgaa   1860

gtaagtacta cggataaaat tgcggatata actataatta ttccatatat aggacctgct   1920

ttaaatatag gtaatatgtt atataaagat gattttgtag gtgctttaat attttcagga   1980

gctgttattc tgttagaatt tataccagag attgcaatac ctgtattagg tacttttgca   2040

cttgtatcat atattgcgaa taaggttcta accgttcaaa caatagataa tgctttaagt   2100

aaaagaaatg aaaaatggga tgaggtctat aaatatatag taacaaattg gttagcaaag   2160

gttaatacac agattgatct aataagaaaa aaaatgaaag aagctttaga aaatcaagca   2220

gaagcaacaa aggctataat aaactatcag tataatcaat atactgagga agagaaaaat    2280

aatattaatt ttaatattga tgatttaagt tcgaaactta atgagtctat aaataaagct    2340

atgattaata taaataaatt tttgaatcaa tgctctgttt catatttaat gaattctatg    2400

atcccttatg gtgttaaacg gttagaagat tttgatgcta gtcttaaaga tgcattatta    2460

aagtatatat atgataatag aggaacttta attggtcaag tagatagatt aaaagataaa    2520

gttaataata cacttagtac agatatacct tttcagcttt ccaaatacgt agataatcaa    2580

agattattat ctacatttac tgaatatatt aagaatatta ttaatacttc tatattgaat    2640

ttaagatatg aaagtaatca tttaatagac ttatctaggt atgcatcaaa aataaatatt    2700

ggtagtaaag taaattttga tccaatagat aaaaatcaaa ttcaattatt taatttagaa    2760

agtagtaaaa ttgaggtaat tttaaaaaat gctattgtat ataatagtat gtatgaaaat    2820

tttagtacta gcttttggat aagaattcct aagtatttta acagtataag tctaaataat    2880

gaatatacaa taataaattg tatggaaaat aattcaggat ggaaagtatc acttaattat    2940

ggtgaaataa tctggacttt acaggatact caggaaataa aacaaagagt agtttttaaa    3000

tacagtcaaa tgattaatat atcagattat ataaacagat ggatttttgt aactatcact    3060

aataatagat taaataactc taaaatttat ataaatggaa gattaataga tcaaaaacca    3120

atttcaaatt taggtaatat tcatgctagt aataatataa tgtttaaatt agatggttgt    3180

agagatacac atagatatat ttggataaaa tattttaatc tttttgataa ggaattaaat    3240

gaaaaagaaa tcaaagattt atatgataat caatcaaatt caggtatttt aaaagacttt    3300

tggggtgatt atttacaata tgataaacca tactatatgt taaatttata tgatccaaat    3360

aaatatgtcg atgtaaataa tgtaggtatt agaggttata tgtatcttaa agggcctaga    3420

ggtagcgtaa tgactacaaa catttattta aattcaagtt tgtatagggg gacaaaattt    3480

attataaaaa aatatgcttc tggaaataaa gataatattg ttagaaataa tgatcgtgta    3540

tatattaatg tagtagttaa aaataaagaa tataggttag ctactaatgc atcacaggca    3600

ggcgtagaaa aaatactaag tgcattagaa atacctgatg taggaaatct aagtcaagta    3660

gtagtaatga agtcaaaaaa tgatcaagga ataacaaata aatgcaaaat gaatttacaa    3720

gataataatg ggaatgatat aggctttata ggatttcatc agtttaataa tatagctaaa    3780

ctagtagcaa gtaattggta taatagacaa atagaaagat ctagtaggac tttgggttgc    3840

tcatgggaat ttattcctgt agatgatgga tggggagaaa ggccactgct cgagcaccac    3900

caccaccacc actaa                                                     3915

<210>2

<211>1304

<212>PRT

<213>肉毒梭菌(Clostridium botulinum)

<400>2

Met Ala Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly

1               5                   10                  15

Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Val Gly Gln Met Gln Pro

            20                  25                  30

Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg

        35                  40                  45

Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu

    50                  55                  60

Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr

65                  70                  75                  80

Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu

                85                  90                  95

Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val

            100                 105                 110

Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys

        115                 120                 125

Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr

    130                 135                 140

Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile

145                 150                 155                 160

Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr

                165                 170                 175

Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe

            180                 185                 190

Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu

        195                 200                 205

Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu

    210                 215                 220

Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn

225                 230                 235                 240

Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu

                245                 250                 255

Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys

            260                 265                 270

Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn

        275                 280                 285

Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val

    290                 295                 300

Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys

305                 310                 315                 320

Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu

                325                 330                 335

Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp

            340                 345                 350

Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn

        355                 360                 365

Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr

    370                 375                 380

Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn

385                 390                 395                 400

Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu

                405                 410                 415

Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Arg

            420                 425                 430

Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys

        435                 440                 445

Ala Leu Asn Asp Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe

    450                 455                 460

Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu

465                 470                 475                 480

Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu

                485                 490                 495

Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro

            500                 505                 510

Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu

        515                 520                 525

Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu

    530                 535                 540

Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu

545                 550                 555                 560

His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu

                565                 570                 575

Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys

            580                 585                 590

Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu

        595                 600                 605

Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr

    610                 615                 620

Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala

625                 630                 635                 640

Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu

                645                 650                 655

Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala

            660                 665                 670

Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys

        675                 680                 685

Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu

    690                 695                 700

Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys

705                 710                 715                 720

Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu

                725                 730                 735

Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn

            740                 745                 750

Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp

        755                 760                 765

Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile

    770                 775                 780

Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met

785                 790                 795                 800

Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys

                805                 810                 815

Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly

            820                 825                 830

Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp

        835                 840                 845

Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser

    850                 855                 860

Thr Phe Thr Glu Tyr Ile Lys Asn Ile Ile Asn Thr Ser Ile Leu Asn

865                 870                 875                 880

Leu Arg Tyr Glu Ser Asn His Leu Ile Asp Leu Ser Arg Tyr Ala Ser

                885                 890                 895

Lys Ile Asn Ile Gly Ser Lys Val Asn Phe Asp Pro Ile Asp Lys Asn

            900                 905                 910

Gln Ile Gln Leu Phe Asn Leu Glu Ser Ser Lys Ile Glu Val Ile Leu

        915                 920                 925

Lys Asn Ala Ile Val Tyr Asn Ser Met Tyr Glu Asn Phe Ser Thr Ser

    930                 935                 940

Phe Trp Ile Arg Ile Pro Lys Tyr Phe Asn Ser Ile Ser Leu Asn Asn

945                 950                 955                 960

Glu Tyr Thr Ile Ile Asn Cys Met Glu Asn Asn Ser Gly Trp Lys Val

                965                 970                 975

Ser Leu Asn Tyr Gly Glu Ile Ile Trp Thr Leu Gln Asp Thr Gln Glu

            980                 985                 990

Ile Lys Gln Arg Val Val Phe Lys Tyr Ser Gln Met Ile Asn Ile Ser

        995                 1000                1005

Asp Tyr Ile Asn Arg Trp Ile Phe Val Thr Ile Thr Asn Asn Arg

    1010                1015                1020

Leu Asn Asn Ser Lys Ile Tyr Ile Asn Gly Arg Leu Ile Asp Gln

    1025                1030                1035

Lys Pro Ile Ser Asn Leu Gly Asn Ile His Ala Ser Asn Asn Ile

    1040                1045                1050

Met Phe Lys Leu Asp Gly Cys Arg Asp Thr His Arg Tyr Ile Trp

    1055                1060                1065

Ile Lys Tyr Phe Asn Leu Phe Asp Lys Glu Leu Asn Glu Lys Glu

    1070                1075                1080

Ile Lys Asp Leu Tyr Asp Asn Gln Ser Asn Ser Gly Ile Leu Lys

    1085                1090                1095

Asp Phe Trp Gly Asp Tyr Leu Gln Tyr Asp Lys Pro Tyr Tyr Met

    1100                1105                1110

Leu Asn Leu Tyr Asp Pro Asn Lys Tyr Val Asp Val Asn Asn Val

    1115                1120                1125

Gly Ile Arg Gly Tyr Met Tyr Leu Lys Gly Pro Arg Gly ser Val

    1130                1135                1140

Met Thr Thr Asn Ile Tyr Leu Asn Ser Ser Leu Tyr Arg Gly Thr

    1145                1150                1155

Lys Phe Ile Ile Lys Lys Tyr Ala Ser Gly Asn Lys Asp Asn Ile

    1160                1165                1170

Val Arg Asn Asn Asp Arg Val Tyr Ile Asn Val Val Val Lys Asn

    1175                1180                1185

Lys Glu Tyr Arg Leu Ala Thr Asn Ala Ser Gln Ala Gly Val Glu

    1190                1195                1200

Lys Ile Leu Ser Ala Leu Glu Ile Pro Asp Val Gly Asn Leu Ser

    1205                1210                1215

Gln Val Val Val Met Lys Ser Lys Asn Asp Gln Gly Ile Thr Asn

    1220                1225                1230

Lys Cys Lys Met Asn Leu Gln Asp Asn Asn Gly Asn Asp Ile Gly

    1235                1240                1245

Phe Ile Gly Phe His Gln Phe Asn Asn Ile Ala Lys Leu Val Ala

    1250                1255                1260

Ser Asn Trp Tyr Asn Arg Gln Ile Glu Arg Ser Ser Arg Thr Leu

    1265                1270                1275

Gly Cys Ser Trp Glu Phe Ile Pro Val Asp Asp Gly Trp Gly Glu

    1280                1285                1290

Arg Pro Leu Leu Glu His His His His His His

    1295                1300

<210>3

<211>2646

<212>DNA

<213>肉毒梭菌(Clostridinm botulinum)

<400>3

atggcatttg ttaataaaca atttaattat aaagatcctg taaatggtgt tgatattgct      60

tatataaaaa ttccaaatgc aggacaaatg caaccagtaa aagcttttaa aattcataat     120

aaaatatggg ttattccaga aagagataca tttacaaatc ctgaagaagg agatttaaat     180

ccaccaccag aagcaaaaca agttccagtt tcatattatg attcaacata tttaagtaca     240

gataatgaaa aagataatta tttaaaggga gttacaaaat tatttgagag aatttattca     300

actgatcttg gaagaatgtt gttaacatca atagtaaggg gaataccatt ttggggtgga     360

agtacaatag atacagaatt aaaagttatt gatactaatt gtattaatgt gatacaacca     420

gatggtagtt atagatcaga agaacttaat ctagtaataa taggaccctc agctgatatt     480

atacagtttg aatgtaaaag ctttggacat gaagttttga atcttacgcg aaatggttat     540

ggctctactc aatacattag atttagccca gattttacat ttggttttga ggagtcactt     600

gaagttgata caaatcctct tttaggtgca ggcaaatttg ctacagatcc agcagtaaca     660

ttagcacatg aacttataca tgctggacat agattatatg gaatagcaat taatccaaat     720

agggttttta aagtaaatac taatgcctat tatgaaatga gtgggttaga agtaagcttt     780

gaggaactta gaacatttgg gggacatgat gcaaagttta tagatagttt acaggaaaac     840

gaatttcgtc tatattatta taataagttt aaagatatag caagtacact taataaagct     900

aaatcaatag taggtactac tgcttcatta cagtatatga aaaatgtttt taaagagaaa     960

tatctcctat ctgaagatac atctggaaaa ttttcggtag ataaattaaa atttgataag    1020

ttatacaaaa tgttaacaga gatttacaca gaggataatt ttgttaagtt ttttaaagta    1080

cttaacagaa aaacatattt gaattttgat aaagccgtat ttaagataaa tatagtacct    1140

aaggtaaatt acacaatata tgatggattt aatttaagaa atacaaattt agcagcaaac    1200

tttaatggtc aaaatacaga aattaataat atgaatttta ctaaactaaa aaattttact    1260

ggattgtttg aattttataa gttgctatgt gtaagaggga taataacttc taaaactaaa    1320

tcattagttc cgcgtggatc caaggcctta aatgatttat gtatcaaagt taataattgg    1380

gacttgtttt ttagtccttc agaagataat tttactaatg atctaaataa aggagaagaa    1440

attacatctg atactaatat agaagcagca gaagaaaata ttagtttaga tttaatacaa    1500

caatattatt taacctttaa ttttgataat gaacctgaaa atatttcaat agaaaatctt    1560

tcaagtgaca ttataggcca attagaactt atgcctaata tagaaagatt tcctaatgga    1620

aaaaagtatg agttagataa atatactatg ttccattatc ttcgtgctca agaatttgaa    1680

catggtaaat ctaggattgc tttaacaaat tctgttaacg aagcattatt aaatcctagt    1740

cgtgtttata catttttttc ttcagactat gtaaagaaag ttaataaagc tacggaggca    1800

gctatgtttt taggctgggt agaacaatta gtatatgatt ttaccgatga aactagcgaa    1860

gtaagtacta cggataaaat tgcggatata actataatta ttccatatat aggacctgct    1920

ttaaatatag gtaatatgtt atataaagat gattttgtag gtgctttaat attttcagga    1980

gctgttattc tgttagaatt tataccagag attgcaatac ctgtattagg tacttttgca    2040

cttgtatcat atattgcgaa taaggttcta accgttcaaa caatagataa tgctttaagt    2100

aaaagaaatg aaaaatggga tgaggtctat aaatatatag taacaaattg gttagcaaag    2160

gttaatacac agattgatct aataagaaaa aaaatgaaag aagctttaga aaatcaagca    2220

gaagcaacaa aggctataat aaactatcag tataatcaat atactgagga agagaaaaat    2280

aatattaatt ttaatattga tgatttaagt tcgaaactta atgagtctat aaataaagct    2340

atgattaata taaataaatt tttgaatcaa tgctctgttt catatttaat gaattctatg    2400

atcccttatg gtgttaaacg gttagaagat tttgatgcta gtcttaaaga tgcattatta    2460

aagtatatat atgataatag aggaacttta attggtcaag tagatagatt aaaagataaa    2520

gttaataata cacttagtac agatatacct tttcagcttt ccaaatacgt agataatcaa    2580

agattattat ctacatttac tgaatatatt aagaatattc tcgagcacca ccaccaccac    2640

cactaa                                                               2646

<210>4

<211>881

<212>PRT

<213>肉毒梭菌(Clostridium botulinum)

<400>4

Met Ala Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly

1               5                   10                  15

Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Val Gly Gln Met Gln Pro

            20                  25                  30

Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg

        35                  40                  45

Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu

    50                  55                  60

Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr

65                  70                  75                  80

Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu

                85                  90                  95

Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val

            100                 105                 110

Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys

        115                 120                 125

Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr

    130                 135                 140

Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile

145                 150                 155                 160

Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr

                165                 170                 175

Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe

            180                 185                 190

Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu

        195                 200                 205

Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu

    210                 215                 220

Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn

225                 230                 235                 240

Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu

                245                 250                 255

Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys

            260                 265                 270

Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn

        275                 280                 285

Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val

    290                 295                 300

Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys

305                 310                 315                 320

Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu

                325                 330                 335

Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp

            340                 345                 350

Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn

        355                 360                 365

Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr

    370                 375                 380

Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn

385                 390                 395                 400

Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu

                405                 410                 415

Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Arg

            420                 425                 430

Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys

        435                 440                 445

Ala Leu Asn Asp Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe

    450                 455                 460

Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu

465                 470                 475                 480

Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu

                485                 490                 495

Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro

            500                 505                 510

Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu

        515                 520                 525

Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu

    530                 535                 540

Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu

545                 550                 555                 560

His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu

                565                 570                 575

Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys

            580                 585                 590

Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu

        595                 600                 605

Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr

    610                 615                 620

Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala

625                 630                 635                 640

Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu

                645                 650                 655

Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala

            660                 665                 670

Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys

        675                 680                 685

Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu

    690                 695                 700

Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys

705                 710                 715                 720

Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu

                725                 730                 735

Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn

            740                 745                 750

Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp

        755                 760                 765

Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile

    770                 775                 780

Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met

785                 790                 795                 800

Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys

                805                 810                 815

Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly

            820                 825                 830

Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp

        835                 840                 845

Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser

    850                 855                 860

Thr Phe Thr Glu Tyr Ile Lys Asn Ile Leu Glu His His His His His

865                 870                 875                 880

His

<210>5

<211>3312

<212>DNA

<213>肉毒梭菌(Clostridium botulinum)

<400>5

atggcatttg ttaataaaca atttaattat aaagatcctg taaatggtgt tgatattgct      60

tatataaaaa ttccaaatgc aggacaaatg caaccagtaa aagcttttaa aattcataat     120

aaaatatggg ttattccaga aagagataca tttacaaatc ctgaagaagg agatttaaat     180

ccaccaccag aagcaaaaca agttccagtt tcatattatg attcaacata tttaagtaca     240

gataatgaaa aagataatta tttaaaggga gttacaaaat tatttgagag aatttattca     300

actgatcttg gaagaatgtt gttaacatca atagtaaggg gaataccatt ttggggtgga     360

agtacaatag atacagaatt aaaagttatt gatactaatt gtattaatgt gatacaacca     420

gatggtagtt atagatcaga agaacttaat ctagtaataa taggaccctc agctgatatt     480

atacagtttg aatgtaaaag ctttggacat gaagttttga atcttacgcg aaatggttat     540

ggctctactc aatacattag atttagccca gattttacat ttggttttga ggagtcactt     600

gaagttgata caaatcctct tttaggtgca ggcaaatttg ctacagatcc agcagtaaca     660

ttagcacatg aacttataca tgctggacat agattatatg gaatagcaat taatccaaat     720

agggttttta aagtaaatac taatgcctat tatgaaatga gtgggttaga agtaagcttt     780

gaggaactta gaacatttgg gggacatgat gcaaagttta tagatagttt acaggaaaac     840

gaatttcgtc tatattatta taataagttt aaagatatag caagtacact taataaagct     900

aaatcaatag taggtactac tgcttcatta cagtatatga aaaatgtttt taaagagaaa     960

tatctcctat ctgaagatac atctggaaaa ttttcggtag ataaattaaa atttgataag    1020

ttatacaaaa tgttaacaga gatttacaca gaggataatt ttgttaagtt ttttaaagta    1080

cttaacagaa aaacatattt gaattttgat aaagccgtat ttaagataaa tatagtacct    1140

aaggtaaatt acacaatata tgatggattt aatttaagaa atacaaattt agcagcaaac    1200

tttaatggtc aaaatacaga aattaataat atgaatttta ctaaactaaa aaattttact    1260

ggattgtttg aattttataa gttgctatgt gtaagaggga taataacttc taaaactaaa    1320

tcattagttc cgcgtggatc caaggcctta aatgatttat gtatcaaagt taataattgg    1380

gacttgtttt ttagtccttc agaagataat tttactaatg atctaaataa aggagaagaa    1440

attacatctg atactaatat agaagcagca gaagaaaata ttagtttaga tttaatacaa    1500

caatattatt taacctttaa ttttgataat gaacctgaaa atatttcaat agaaaatctt    1560

tcaagtgaca ttataggcca attagaactt atgcctaata tagaaagatt tcctaatgga    1620

aaaaagtatg agttagataa atatactatg ttccattatc ttcgtgctca agaatttgaa    1680

catggtaaat ctaggattgc tttaacaaat tctgttaacg aagcattatt aaatcctagt    1740

cgtgtttata catttttttc ttcagactat gtaaagaaag ttaataaagc tacggaggca    1800

gctatgtttt taggctgggt agaacaatta gtatatgatt ttaccgatga aactagcgaa    1860

gtaagtacta cggataaaat tgcggatata actataatta ttccatatat aggacctgct    1920

ttaaatatag gtaatatgtt atataaagat gattttgtag gtgctttaat attttcagga    1980

gctgttattc tgttagaatt tataccagag attgcaatac ctgtattagg tacttttgca    2040

cttgtatcat atattgcgaa taaggttcta accgttcaaa caatagataa tgctttaagt    2100

aaaagaaatg aaaaatggga tgaggtctat aaatatatag taacaaattg gttagcaaag    2160

gttaatacac agattgatct aataagaaaa aaaatgaaag aagctttaga aaatcaagca    2220

gaagcaacaa aggctataat aaactatcag tataatcaat atactgagga agagaaaaat    2280

aatattaatt ttaatattga tgatttaagt tcgaaactta atgagtctat aaataaagct    2340

atgattaata taaataaatt tttgaatcaa tgctctgttt catatttaat gaattctatg    2400

atcccttatg gtgttaaacg gttagaagat tttgatgcta gtcttaaaga tgcattatta    2460

aagtatatat atgataatag aggaacttta attggtcaag tagatagatt aaaagataaa    2520

gttaataata cacttagtac agatatacct tttcagcttt ccaaatacgt agataatcaa    2580

agattattat ctacatttac tgaatatatt aagaatatta ttaatacttc tatattgaat    2640

ttaagatatg aaagtaatca tttaatagac ttatctaggt atgcatcaaa aataaatatt    2700

ggtagtaaag taaattttga tccaatagat aaaaatcaaa ttcaattatt taatttagaa    2760

agtagtaaaa ttgaggtaat tttaaaaaat gctattgtat ataatagtat gtatgaaaat    2820

tttagtacta gcttttggat aagaattcct aagtatttta acagtataag tctaaataat    2880

gaatatacaa taataaattg tatggaaaat aattcaggat ggaaagtatc acttaattat    2940

ggtgaaataa tctggacttt acaggatact caggaaataa aacaaagagt agtttttaaa    3000

tacagtcaaa tgattaatat atcagattat ataaacagat ggatttttgt aactatcact    3060

aataatagat taaataactc taaaatttat ataaatggaa gattaataga tcaaaaacca    3120

atttcaaatt taggtaatat tcatgctagt aataatataa tgtttaaatt agatggttgt    3180

agagatacac atagatatat ttggataaaa tattttaatc tttttgataa ggaattaaat    3240

gaaaaagaaa tcaaagattt atatgataat caatcaaatt caggtctcga gcaccaccac    3300

caccaccact aa                                                        3312

<210>6

<211>1103

<212>PRT

<213>肉毒梭菌(Clostridium botulinum)

<400>6

Met Ala Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly

1               5                   10                  15

Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Val Gly Gln Met Gln Pro

            20                  25                  30

Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg

        35                  40                  45

Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu

    50                  55                  60

Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr

65                  70                  75                  80

Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu

                85                  90                  95

Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val

            100                 105                 110

Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys

        115                 120                 125

Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr

    130                 135                 140

Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile

145                 150                 155                 160

Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr

                165                 170                 175

Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe

            180                 185                 190

Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu

        195                 200                 205

Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu

    210                 215                 220

Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn

225                 230                 235                 240

Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu

                245                 250                 255

Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys

            260                 265                 270

Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn

        275                 280                 285

Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val

    290                 295                 300

Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys

305                 310                 315                 320

Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu

                325                 330                 335

Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp

            340                 345                 350

Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn

        355                 360                 365

Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr

    370                 375                 380

Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn

385                 390                 395                 400

Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu

                405                 410                 415

Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Arg

            420                 425                 430

Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys

        435                 440                 445

Ala Leu Asn Asp Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe

    450                 455                 460

Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu

465                 470                 475                 480

Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu

                485                 490                 495

Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro

            500                 505                 510

Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu

        515                 520                 525

Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu

    530                 535                 540

Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu

545                 550                 555                 560

His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu

                565                 570                 575

Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys

            580                 585                 590

Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu

        595                 600                 605

Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr

    610                 615                 620

Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala

625                 630                 635                 640

Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu

                645                 650                 655

Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala

            660                 665                 670

Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys

        675                 680                 685

Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu

    690                 695                 700

Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys

705                 710                 715                 720

Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu

                725                 730                 735

Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn

            740                 745                 750

Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp

        755                 760                 765

Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile

    770                 775                 780

Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met

785                 790                 795                 800

Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys

                805                 810                 815

Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly

            820                 825                 830

Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp

        835                 840                 845

Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser

    850                 855                 860

Thr Phe Thr Glu Tyr Ile Lys Asn Ile Ile Asn Thr Ser Ile Leu Asn

865                 870                 875                 880

Leu Arg Tyr Glu Ser Asn His Leu Ile Asp Leu Ser Arg Tyr Ala Ser

                885                 890                 895

Lys Ile Asn Ile Gly Ser Lys Val Asn Phe Asp Pro Ile Asp Lys Asn

            900                 905                 910

Gln Ile Gln Leu Phe Asn Leu Glu Ser Ser Lys Ile Glu Val Ile Leu

        915                 920                 925

Lys Asn Ala Ile Val Tyr Asn Ser Met Tyr Glu Asn Phe Ser Thr Ser

    930                 935                 940

Phe Trp Ile Arg Ile Pro Lys Tyr Phe Asn Ser Ile Ser Leu Asn Asn

945                 950                 955                 960

Glu Tyr Thr Ile Ile Asn Cys Met Glu Asn Asn Ser Gly Trp Lys Val

                965                 970                 975

Ser Leu Asn Tyr Gly Glu Ile Ile Trp Thr Leu Gln Asp Thr Gln Glu

            980                 985                 990

Ile Lys Gln Arg Val Val Phe Lys Tyr Ser Gln Met Ile Asn Ile Ser

        995                 1000                1005

Asp Tyr Ile Asn Arg Trp Ile Phe Val Thr Ile Thr Asn Asn Arg

    1010                1015                1020

Leu Asn Asn Ser Lys Ile Tyr Ile Asn Gly Arg Leu Ile Asp Gln

    1025                1030                1035

Lys Pro Ile Ser Asn Leu Gly Asn Ile His Ala Ser Asn Asn Ile

    1040                1045                1050

Met Phe Lys Leu Asp Gly Cys Arg Asp Thr His Arg Tyr Ile Trp

    1055                1060                1065

Ile Lys Tyr Phe Asn Leu Phe Asp Lys Glu Leu Asn Glu Lys Glu

    1070                1075                1080

Ile Lys Asp Leu Tyr Asp Asn Gln Ser Asn Ser Gly Leu Glu His

    1085                1090                1095

His His His His His

    1100

<210>7

<211>3942

<212>DNA

<213>肉毒梭菌(Clostridium botulinum)

<400>7

atggcagtta caataaataa ttttaattat aatgatccta ttgataataa taatattatt      60

atgatggagc ctccatttgc gagaggtacg gggagatatt ataaagcttt taaaatcaca     120

gatcgtattt ggataatacc ggaaagatat acttttggat ataaacctga ggattttaat     180

aaaagttccg gtatttttaa tagagatgtt tgtgaatatt atgatccaga ttacttaaat     240

actaatgata aaaagaatat atttttacaa acaatgatca agttatttaa tagaatcaaa     300

tcaaaaccat tgggtgaaaa gttattagag atgattataa atggtatacc ttatcttgga     360

gatagacgtg ttccactcga agagtttaac acaaacattg ctagtgtaac tgttaataaa     420

ttaatcagta atccaggaga agtggagcga aaaaaaggta ttttcgcaaa tttaataata     480

tttggacctg ggccagtttt aaatgaaaat gagactatag atataggtat acaaaatcat     540

tttgcatcaa gggaaggctt cgggggtata atgcaaatga agttttgccc agaatatgta     600

agcgtattta ataatgttca agaaaacaaa ggcgcaagta tatttaatag acgtggatat     660

ttttcagatc cagccttgat attaatgcat gaacttatac atgttttaca tggattatat     720

ggcattaaag tagatgattt accaattgta ccaaatgaaa aaaaattttt tatgcaatct     780

acagatgcta tacaggcaga agaactatat acatttggag gacaagatcc cagcatcata     840

actccttcta cggataaaag tatctatgat aaagttttgc aaaattttag agggatagtt     900

gatagactta acaaggtttt agtttgcata tcagatccta acattaatat taatatatat     960

aaaaataaat ttaaagataa atataaattc gttgaagatt ctgagggaaa atatagtata    1020

gatgtagaaa gttttgataa attatataaa agcttaatgt ttggttttac agaaactaat    1080

atagcagaaa attataaaat aaaaactaga gcttcttatt ttagtgattc cttaccacca    1140

gtaaaaataa aaaatttatt agataatgaa atctatacta tagaggaagg gtttaatata    1200

tctgataaag atatggaaaa agaatataga ggtcagaata aagctataaa taaacaagct    1260

tatgaagaaa ttagcaagga gcatttggct gtatataaga tacaaatgtg taaaagtggg    1320

ataataactt ctaaaactaa atcattggtt ccacgtggat ccaaggcctc aggaatatgt    1380

attgatgttg ataatgaaga tttgttcttt atagctgata aaaatagttt ttcagatgat    1440

ttatctaaaa acgaaagaat agaatataat acacagagta attatataga aaatgacttc    1500

cctataaatg aattaatttt agatactgat ttaataagta aaatagaatt accaagtgaa    1560

aatacagaat cacttactga ttttaatgta gatgttccag tatatgaaaa acaacccgct    1620

ataaaaaaaa tttttacaga tgaaaatacc atctttcaat atttatactc tcagacattt    1680

cctctagata taagagatat aagtttaaca tcttcatttg atgatgcatt attattttct    1740

aacaaagttt attcattttt ttctatggat tatattaaaa ctgctaataa agtggtagaa    1800

gcaggattat ttgcaggttg ggtgaaacag atagtaaatg attttgtaat cgaagctaat    1860

aaaagcaata ctatggataa aattgcagat atatctctaa ttgttcctta tataggatta    1920

gctttaaatg taggaaatga aacagctaaa ggaaattttg aaaatgcttt tgagattgca    1980

ggagccagta ttctactaga atttatacca gaacttttaa tacctgtagt tggagccttt    2040

ttattagaat catatattga caataaaaat aaaattatta aaacaataga taatgcttta    2100

actaaaagaa atgaaaaatg gagtgatatg tacggattaa tagtagcgca atggctctca    2160

acagttaata ctcaatttta tacaataaaa gagggaatgt ataaggcttt aaattatcaa    2220

gcacaagcat tggaagaaat aataaaatac agatataata tatattctga aaaagaaaag    2280

tcaaatatta acatcgattt taatgatata aattctaaac ttaatgaggg tattaaccaa    2340

gctatagata atataaataa ttttataaat ggatgttctg tatcatattt aatgaaaaaa    2400

atgattccat tagctgtaga aaaattacta gactttgata atactctcaa aaaaaatttg    2460

ttaaattata tagatgaaaa taaattatat ttgattggaa gtgcagaata tgaaaaatca    2520

aaagtaaata aatacttgaa aaccattatg ccgtttgatc tttcaatata taccaatgat    2580

acaatactaa tagaaatgtt taataaatat aatagcgaaa ttttaaataa tattatctta    2640

aatttaagat ataaggataa taatttaata gatttatcag gatatggggc aaaggtagag    2700

gtatatgatg gagtcgagct taatgataaa aatcaattta aattaactag ttcagcaaat    2760

agtaagatta gagtgactca aaatcagaat atcatattta atagtgtgtt ccttgatttt    2820

agcgttagct tttggataag aatacctaaa tataagaatg atggtataca aaattatatt    2880

cataatgaat atacaataat taattgtatg aaaaataatt cgggctggaa aatatctatt    2940

aggggtaata ggataatatg gactttaatt gatataaatg gaaaaaccaa atcggtattt    3000

tttgaatata acataagaga agatatatca gagtatataa atagatggtt ttttgtaact    3060

attactaata atttgaataa cgctaaaatt tatattaatg gtaagctaga atcaaataca    3120

gatattaaag atataagaga agttattgct aatggtgaaa taatatttaa attagatggt    3180

gatatagata gaacacaatt tatttggatg aaatatttca gtatttttaa tacggaatta    3240

agtcaatcaa atattgaaga aagatataaa attcaatcat atagcgaata tttaaaagat    3300

ttttggggaa atcctttaat gtacaataaa gaatattata tgtttaatgc ggggaataaa    3360

aattcatata ttaaactaaa gaaagattca cctgtaggtg aaattttaac acgtagcaaa    3420

tataatcaaa attctaaata tataaattat agagatttat atattggaga aaaatttatt    3480

ataagaagaa agtcaaattc tcaatctata aatgatgata tagttagaaa agaagattat    3540

atatatctag atttttttaa tttaaatcaa gagtggagag tatataccta taaatatttt    3600

aagaaagagg aagaaaaatt gtttttagct cctataagtg attctgatga gttttacaat    3660

actatacaaa taaaagaata tgatgaacag ccaacatata gttgtcagtt gctttttaaa    3720

aaagatgaag aaagtactga tgagatagga ttgattggta ttcatcgttt ctacgaatct    3780

ggaattgtat ttgaagagta taaagattat ttttgtataa gtaaatggta cttaaaagag    3840

gtaaaaagga aaccatataa tttaaaattg ggatgtaatt ggcagtttat tcctaaagat    3900

gaagggtgga ctgaactcga gcaccaccac caccaccactaa                        3942

<210>8

<211>1313

<212>PRT

<213>肉毒梭菌(Clostridium botulihum)

<400>8

Met Ala Val Thr Ile Asn Asn Phe Asn Tyr Asn Asp Pro Ile Asp Asn

1               5                   10                  15

Asn Asn Ile Ile Met Met Glu Pro Pro Phe Ala Arg Gly Thr Gly Arg

            20                  25                  30

Tyr Tyr Lys Ala Phe Lys Ile Thr Asp Arg Ile Trp Ile Ile Pro Glu

        35                  40                  45

Arg Tyr Thr Phe Gly Tyr Lys Pro Glu Asp Phe Asn Lys Ser Ser Gly

    50                  55                  60

Ile Phe Asn Arg Asp Val Cys Glu Tyr Tyr Asp Pro Asp Tyr Leu Asn

65                  70                  75                  80

Thr Asn Asp Lys Lys Asn Ile Phe Leu Gln Thr Met Ile Lys Leu Phe

                85                  90                  95

Asn Arg Ile Lys Ser Lys Pro Leu Gly Glu Lys Leu Leu Glu Met Ile

            100                 105                 110

Ile Asn Gly Ile Pro Tyr Leu Gly Asp Arg Arg Val Pro Leu Glu Glu

        115                 120                 125

Phe Asn Thr Asn Ile Ala Ser Val Thr Val Asn Lys Leu Ile Ser Asn

    130                 135                 140

Pro Gly Glu Val Glu Arg Lys Lys Gly Ile Phe Ala Asn Leu Ile Ile

145                 150                 155                 160

Phe Gly Pro Gly Pro Val Leu Asn Glu Asn Glu Thr Ile Asp Ile Gly

                165                 170                 175

Ile Gln Asn His Phe Ala Ser Arg Glu Gly Phe Gly Gly Ile Met Gln

            180                 185                 190

Met Lys Phe Cys Pro Glu Tyr Val Ser Val Phe Asn Asn Val Gln Glu

        195                 200                 205

Asn Lys Gly Ala Ser Ile Phe Asn Arg Arg Gly Tyr Phe Ser Asp Pro

    210                 215                 220

Ala Leu Ile Leu Met His Glu Leu Ile His Val Leu His Gly Leu Tyr

225                 230                 235                 240

Gly Ile Lys Val Asp Asp Leu Pro Ile Val Pro Asn Glu Lys Lys Phe

                245                 250                 255

Phe Met Gln Ser Thr Asp Ala Ile Gln Ala Glu Glu Leu Tyr Thr Phe

            260                 265                 270

Gly Gly Gln Asp Pro Ser Ile Ile Thr Pro Ser Thr Asp Lys Ser Ile

        275                 280                 285

Tyr Asp Lys Val Leu Gln Asn Phe Arg Gly Ile Val Asp Arg Leu Asn

    290                 295                 300

Lys Val Leu Val Cys Ile Ser Asp Pro Asn Ile Asn Ile Asn Ile Tyr

305                 310                 315                 320

Lys Asn Lys Phe Lys Asp Lys Tyr Lys Phe Val Glu Asp Ser Glu Gly

                325                 330                 335

Lys Tyr Ser Ile Asp Val Glu Ser Phe Asp Lys Leu Tyr Lys Ser Leu

            340                 345                 350

Met Phe Gly Phe Thr Glu Thr Asn Ile Ala Glu Asn Tyr Lys Ile Lys

        355                 360                 365

Thr Arg Ala Ser Tyr Phe Ser Asp Ser Leu Pro Pro Val Lys Ile Lys

    370                 375                 380

Asn Leu Leu Asp Asn Glu Ile Tyr Thr Ile Glu Glu Gly Phe Asn Ile

385                 390                 395                 400

Ser Asp Lys Asp Met Glu Lys Glu Tyr Arg Gly Gln Asn Lys Ala Ile

                405                 410                 415

Asn Lys Gln Ala Tyr Glu Glu Ile Ser Lys Glu His Leu Ala Val Tyr

            420                 425                 430

Lys Ile Gln Met Cys Lys Ser Gly Ile Ile Thr Ser Lys Thr Lys Ser

        435                 440                 445

Leu Val Pro Arg Gly Ser Lys Ala Ser Gly Ile Cys Ile Asp Val Asp

    450                 455                 460

Asn Glu Asp Leu Phe Phe Ile Ala Asp Lys Asn Ser Phe Ser Asp Asp

465                 470                 475                 480

Leu Ser Lys Asn Glu Arg Ile Glu Tyr Asn Thr Gln Ser Asn Tyr Ile

                485                 490                 495

Glu Asn Asp Phe Pro Ile Asn Glu Leu Ile Leu Asp Thr Asp Leu Ile

            500                 505                 510

Ser Lys Ile Glu Leu Pro Ser Glu Asn Thr Glu Ser Leu Thr Asp Phe

        515                 520                 525

Asn Val Asp Val Pro Val Tyr Glu Lys Gln Pro Ala Ile Lys Lys Ile

    530                 535                 540

Phe Thr Asp Glu Asn Thr Ile Phe Gln Tyr Leu Tyr Ser Gln Thr Phe

545                 550                 555                 560

Pro Leu Asp Ile Arg Asp Ile Ser Leu Thr Ser Ser Phe Asp Asp Ala

                565                 570                 575

Leu Leu Phe Ser Asn Lys Val Tyr Ser Phe Phe Ser Met Asp Tyr Ile

            580                 585                 590

Lys Thr Ala Asn Lys Val Val Glu Ala Gly Leu Phe Ala Gly Trp Val

        595                 600                 605

Lys Gln Ile Val Asn Asp Phe Val Ile Glu Ala Asn Lys Ser Asn Thr

    610                 615                 620

Met Asp Lys Ile Ala Asp Ile Ser Leu Ile Val Pro Tyr Ile Gly Leu

625                 630                 635                 640

Ala Leu Asn Val Gly Asn Glu Thr Ala Lys Gly Asn Phe Glu Asn Ala

                645                 650                 655

Phe Glu Ile Ala Gly Ala Ser Ile Leu Leu Glu Phe Ile Pro Glu Leu

            660                 665                 670

Leu Ile Pro Val Val Gly Ala Phe Leu Leu Glu Ser Tyr Ile Asp Asn

        675                 680                 685

Lys Asn Lys Ile Ile Lys Thr Ile Asp Asn Ala Leu Thr Lys Arg Asn

    690                 695                 700

Glu Lys Trp Ser Asp Met Tyr Gly Leu Ile Val Ala Gln Trp Leu Ser

705                 710                 715                 720

Thr Val Asn Thr Gln Phe Tyr Thr Ile Lys Glu Gly Met Tyr Lys Ala

                725                 730                 735

Leu Asn Tyr Gln Ala Gln Ala Leu Glu Glu Ile Ile Lys Tyr Arg Tyr

            740                 745                 750

Asn Ile Tyr Ser Glu Lys Glu Lys Ser Asn Ile Asn Ile Asp Phe Asn

        755                 760                 765

Asp Ile Asn Ser Lys Leu Asn Glu Gly Ile Asn Gln Ala Ile Asp Asn

    770                 775                 780

Ile Asn Asn Phe Ile Asn Gly Cys Ser Val Ser Tyr Leu Met Lys Lys

785                 790                 795                 800

Met Ile Pro Leu Ala Val Glu Lys Leu Leu Asp Phe Asp Asn Thr Leu

                805                 810                 815

Lys Lys Asn Leu Leu Asn Tyr Ile Asp Glu Asn Lys Leu Tyr Leu Ile

            820                 825                 830

Gly Ser Ala Glu Tyr Glu Lys Ser Lys Val Asn Lys Tyr Leu Lys Thr

        835                 840                 845

Ile Met Pro Phe Asp Leu Ser Ile Tyr Thr Asn Asp Thr Ile Leu Ile

    850                 855                 860

Glu Met Phe Asn Lys Tyr Asn Ser Glu Ile Leu Asn Asn Ile Ile Leu

865                 870                 875                 880

Asn Leu Arg Tyr Lys Asp Asn Asn Leu Ile Asp Leu Ser Gly Tyr Gly

                885                 890                 895

Ala Lys Val Glu Val Tyr Asp Gly Val Glu Leu Asn Asp Lys Asn Gln

            900                 905                 910

Phe Lys Leu Thr Ser Ser Ala Asn Ser Lys Ile Arg Val Thr Gln Asn

        915                 920                 925

Gln Asn Ile Ile Phe Asn Ser Val Phe Leu Asp Phe Ser Val Ser Phe

    930                 935                 940

Trp Ile Arg Ile Pro Lys Tyr Lys Asn Asp Gly Ile Gln Asn Tyr Ile

945                 950                 955                 960

His Asn Glu Tyr Thr Ile Ile Asn Cys Met Lys Asn Asn Ser Gly Trp

                965                 970                 975

Lys Ile Ser Ile Arg Gly Asn Arg Ile Ile Trp Thr Leu Ile Asp Ile

            980                 985                 990

Asn Gly Lys Thr Lys Ser Val Phe Phe Glu Tyr Asn Ile Arg Glu Asp

        995                 1000                1005

Ile Ser Glu Tyr Ile Asn Arg Trp Phe Phe Val Thr Ile Thr Asn

    1010                1015                1020

Asn Leu Asn Asn Ala Lys Ile Tyr Ile Asn Gly Lys Leu Glu Ser

    1025                1030                1035

Asn Thr Asp Ile Lys Asp Ile Arg Glu Val Ile Ala Asn Gly Glu

    1040                1045                1050

Ile Ile Phe Lys Leu Asp Gly Asp Ile Asp Arg Thr Gln Phe Ile

    1055                1060                1065

Trp Met Lys Tyr Phe Ser Ile Phe Asn Thr Glu Leu Ser Gln Ser

    1070                1075                1080

Asn Ile Glu Glu Arg Tyr Lys Ile Gln Ser Tyr Ser Glu Tyr Leu

    1085                1090                1095

Lys Asp Phe Trp Gly Asn Pro Leu Met Tyr Asn Lys Glu Tyr Tyr

    1100                1105                1110

Met Phe Asn Ala Gly Asn Lys Asn Ser Tyr Ile Lys Leu Lys Lys

    1115                1120                1125

Asp Ser Pro Val Gly Glu Ile Leu Thr Arg Ser Lys Tyr Asn Gln

    1130                1135                1140

Asn Ser Lys Tyr Ile Asn Tyr Arg Asp Leu Tyr Ile Gly Glu Lys

    1145                1150                1155

Phe Ile Ile Arg Arg Lys Ser Asn Ser Gln Ser Ile Asn Asp Asp

    1160                1165                1170

Ile Val Arg Lys Glu Asp Tyr Ile Tyr Leu Asp Phe Phe Asn Leu

    1175                1180                1185

Asn Gln Glu Trp Arg Val Tyr Thr Tyr Lys Tyr Phe Lys Lys Glu

    1190                1195                1200

Glu Glu Lys Leu Phe Leu Ala Pro Ile Ser Asp Ser Asp Glu Phe

    1205                1210                1215

Tyr Asn Thr Ile Gln Ile Lys Glu Tyr Asp Glu Gln Pro Thr Tyr

    1220                1225                1230

Ser Cys Gln Leu Leu Phe Lys Lys Asp Glu Glu Ser Thr Asp Glu

    1235                1240                1245

Ile Gly Leu Ile Gly Ile His Arg Phe Tyr Glu Ser Gly Ile Val

    1250                1255                1260

Phe Glu Glu Tyr Lys Asp Tyr Phe Cys Ile Ser Lys Trp Tyr Leu

    1265                1270                1275

Lys Glu Val Lys Arg Lys Pro Tyr Asn Leu Lys Leu Gly Cys Asn

    1280                1285                1290

Trp Gln Phe Ile Pro Lys Asp Glu Gly Trp Thr Glu Leu Glu His

    1295                1300                1305

His His His His His

    1310

<210>9

<211>2649

<212>DNA

<213>肉毒梭菌(Clostridium botulinum)

<400>9

atggcagtta caataaataa ttttaattat aatgatccta ttgataataa taatattatt      60

atgatggagc ctccatttgc gagaggtacg gggagatatt ataaagcttt taaaatcaca     120

gatcgtattt ggataatacc ggaaagatat acttttggat ataaacctga ggattttaat     180

aaaagttccg gtatttttaa tagagatgtt tgtgaatatt atgatccaga ttacttaaat     240

actaatgata aaaagaatat atttttacaa acaatgatca agttatttaa tagaatcaaa     300

tcaaaaccat tgggtgaaaa gttattagag atgattataa atggtatacc ttatcttgga     360

gatagacgtg ttccactcga agagtttaac acaaacattg ctagtgtaac tgttaataaa     420

ttaatcagta atccaggaga agtggagcga aaaaaaggta ttttcgcaaa tttaataata     480

tttggacctg ggccagtttt aaatgaaaat gagactatag atataggtat acaaaatcat     540

tttgcatcaa gggaaggctt cgggggtata atgcaaatga agttttgccc agaatatgta     600

agcgtattta ataatgttca agaaaacaaa ggcgcaagta tatttaatag acgtggatat     660

ttttcagatc cagccttgat attaatgcat gaacttatac atgttttaca tggattatat     720

ggcattaaag tagatgattt accaattgta ccaaatgaaa aaaaattttt tatgcaatct     780

acagatgcta tacaggcaga agaactatat acatttggag gacaagatcc cagcatcata     840

actccttcta cggataaaag tatctatgat aaagttttgc aaaattttag agggatagtt     900

gatagactta acaaggtttt agtttgcata tcagatccta acattaatat taatatatat     960

aaaaataaat ttaaagataa atataaattc gttgaagatt ctgagggaaa atatagtata    1020

gatgtagaaa gttttgataa attatataaa agcttaatgt ttggttttac agaaactaat    1080

atagcagaaa attataaaat aaaaactaga gcttcttatt ttagtgattc cttaccacca    1140

gtaaaaataa aaaatttatt agataatgaa atctatacta tagaggaagg gtttaatata    1200

tctgataaag atatggaaaa agaatataga ggtcagaata aagctataaa taaacaagct    1260

tatgaagaaa ttagcaagga gcatttggct gtatataaga tacaaatgtg taaaagtggg    1320

ataataactt ctaaaactaa atcattggtt ccacgtggat ccaaggcctc aggaatatgt    1380

attgatgttg ataatgaaga tttgttcttt atagctgata aaaatagttt ttcagatgat    1440

ttatctaaaa acgaaagaat agaatataat acacagagta attatataga aaatgacttc    1500

cctataaatg aattaatttt agatactgat ttaataagta aaatagaatt accaagtgaa    1560

aatacagaat cacttactga ttttaatgta gatgttccag tatatgaaaa acaacccgct    1620

ataaaaaaaa tttttacaga tgaaaatacc atctttcaat atttatactc tcagacattt    1680

cctctagata taagagatat aagtttaaca tcttcatttg atgatgcatt attattttct    1740

aacaaagttt attcattttt ttctatggat tatattaaaa ctgctaataa agtggtagaa    1800

gcaggattat ttgcaggttg ggtgaaacag atagtaaatg attttgtaat cgaagctaat    1860

aaaagcaata ctatggataa aattgcagat atatctctaa ttgttcctta tataggatta    1920

gctttaaatg taggaaatga aacagctaaa ggaaattttg aaaatgcttt tgagattgca    1980

ggagccagta ttctactaga atttatacca gaacttttaa tacctgtagt tggagccttt    2040

ttattagaat catatattga caataaaaat aaaattatta aaacaataga taatgcttta    2100

actaaaagaa atgaaaaatg gagtgatatg tacggattaa tagtagcgca atggctctca    2160

acagttaata ctcaatttta tacaataaaa gagggaatgt ataaggcttt aaattatcaa    2220

gcacaagcat tggaagaaat aataaaatac agatataata tatattctga aaaagaaaag    2280

tcaaatatta acatcgattt taatgatata aattctaaac ttaatgaggg tattaaccaa    2340

gctatagata atataaataa ttttataaat ggatgttctg tatcatattt aatgaaaaaa    2400

atgattccat tagctgtaga aaaattacta gactttgata atactctcaa aaaaaatttg    2460

ttaaattata tagatgaaaa taaattatat ttgattggaa gtgcagaata tgaaaaatca    2520

aaagtaaata aatacttgaa aaccattatg ccgtttgatc tttcaatata taccaatgat    2580

acaatactaa tagaaatgtt taataaatat aatagcgaaa ttctcgagca ccaccaccac    2640

caccactaa                                                            2649

<210>10

<211>882

<212>PRT

<213>肉毒梭菌(Clostridium botulinum)

<400>10

Met Ala Val Thr Ile Asn Asn Phe Asn Tyr Asn Asp Pro Ile Asp Asn

1               5                   10                  15

Asn Asn Ile Ile Met Met Glu Pro Pro Phe Ala Arg Gly Thr Gly Arg

            20                  25                  30

Tyr Tyr Lys Ala Phe Lys Ile Thr Asp Arg Ile Trp Ile Ile Pro Glu

        35                  40                  45

Arg Tyr Thr Phe Gly Tyr Lys Pro Glu Asp Phe Asn Lys Ser Ser Gly

    50                  55                  60

Ile Phe Asn Arg Asp Val Cys Glu Tyr Tyr Asp Pro Asp Tyr Leu Asn

65                  70                  75                  80

Thr Asn Asp Lys Lys Asn Ile Phe Leu Gln Thr Met Ile Lys Leu Phe

                85                  90                  95

Asn Arg Ile Lys Ser Lys Pro Leu Gly Glu Lys Leu Leu Glu Met Ile

            100                 105                 110

Ile Asn Gly Ile Pro Tyr Leu Gly Asp Arg Arg Val Pro Leu Glu Glu

        115                 120                 125

Phe Asn Thr Asn Ile Ala Ser Val Thr Val Asn Lys Leu Ile Ser Asn

    130                 135                 140

Pro Gly Glu Val Glu Arg Lys Lys Gly Ile Phe Ala Asn Leu Ile Ile

145                 150                 155                 160

Phe Gly Pro Gly Pro Val Leu Asn Glu Asn Glu Thr Ile Asp Ile Gly

                165                 170                 175

Ile Gln Asn His Phe Ala Ser Arg Glu Gly Phe Gly Gly Ile Met Gln

            180                 185                 190

Met Lys Phe Cys Pro Glu Tyr Val Ser Val Phe Asn Asn Val Gln Glu

        195                 200                 205

Asn Lys Gly Ala Ser Ile Phe Asn Arg Arg Gly Tyr Phe Ser Asp Pro

    210                 215                 220

Ala Leu Ile Leu Met His Glu Leu Ile His Val Leu His Gly Leu Tyr

225                 230                 235                 240

Gly Ile Lys Val Asp Asp Leu Pro Ile Val Pro Asn Glu Lys Lys Phe

                245                 250                 255

Phe Met Gln Ser Thr Asp Ala Ile Gln Ala Glu Glu Leu Tyr Thr Phe

            260                 265                 270

Gly Gly Gln Asp Pro Ser Ile Ile Thr Pro Ser Thr Asp Lys Ser Ile

        275                 280                 285

Tyr Asp Lys Val Leu Gln Asn Phe Arg Gly Ile Val Asp Arg Leu Asn

    290                 295                 300

Lys Val Leu Val Cys Ile Ser Asp Pro Asn Ile Asn Ile Asn Ile Tyr

305                 310                 315                 320

Lys Asn Lys Phe Lys Asp Lys Tyr Lys Phe Val Glu Asp Ser Glu Gly

                325                 330                 335

Lys Tyr Ser Ile Asp Val Glu Ser Phe Asp Lys Leu Tyr Lys Ser Leu

            340                 345                 350

Met Phe Gly Phe Thr Glu Thr Asn Ile Ala Glu Asn Tyr Lys Ile Lys

        355                 360                 365

Thr Arg Ala Ser Tyr Phe Ser Asp Ser Leu Pro Pro Val Lys Ile Lys

    370                 375                 380

Asn Leu Leu Asp Asn Glu Ile Tyr Thr Ile Glu Glu Gly Phe Asn Ile

385                 390                 395                 400

Ser Asp Lys Asp Met Glu Lys Glu Tyr Arg Gly Gln Asn Lys Ala Ile

                405                 410                 415

Asn Lys Gln Ala Tyr Glu Glu Ile Ser Lys Glu His Leu Ala Val Tyr

            420                 425                 430

Lys Ile Gln Met Cys Lys Ser Gly Ile Ile Thr Ser Lys Thr Lys Ser

        435                 440                 445

Leu Val Pro Arg Gly Ser Lys Ala Ser Gly Ile Cys Ile Asp Val Asp

    450                 455                 460

Asn Glu Asp Leu Phe Phe Ile Ala Asp Lys Asn Ser Phe Ser Asp Asp

465                 470                 475                 480

Leu Ser Lys Asn Glu Arg Ile Glu Tyr Asn Thr Gln Ser Asn Tyr Ile

                485                 490                 495

Glu Asn Asp Phe Pro Ile Asn Glu Leu Ile Leu Asp Thr Asp Leu Ile

            500                 505                 510

Ser Lys Ile Glu Leu Pro Ser Glu Asn Thr Glu Ser Leu Thr Asp Phe

        515                 520                 525

Asn Val Asp Val Pro Val Tyr Glu Lys Gln Pro Ala Ile Lys Lys Ile

    530                 535                 540

Phe Thr Asp Glu Asn Thr Ile Phe Gln Tyr Leu Tyr Ser Gln Thr Phe

545                 550                 555                 560

Pro Leu Asp Ile Arg Asp Ile Ser Leu Thr Ser Ser Phe Asp Asp Ala

                565                 570                 575

Leu Leu Phe Ser Asn Lys Val Tyr Ser Phe Phe Ser Met Asp Tyr Ile

            580                 585                 590

Lys Thr Ala Asn Lys Val Val Glu Ala Gly Leu Phe Ala Gly Trp Val

        595                 600                 605

Lys Gln Ile Val Asn Asp Phe Val Ile Glu Ala Asn Lys Ser Asn Thr

    610                 615                 620

Met Asp Lys Ile Ala Asp Ile Ser Leu Ile Val Pro Tyr Ile Gly Leu

625                 630                 635                 640

Ala Leu Asn Val Gly Asn Glu Thr Ala Lys Gly Asn Phe Glu Asn Ala

                645                 650                 655

Phe Glu Ile Ala Gly Ala Ser Ile Leu Leu Glu Phe Ile Pro Glu Leu

            660                 665                 670

Leu Ile Pro Val Val Gly Ala Phe Leu Leu Glu Ser Tyr Ile Asp Asn

        675                 680                 685

Lys Asn Lys Ile Ile Lys Thr Ile Asp Asn Ala Leu Thr Lys Arg Asn

    690                 695                 700

Glu Lys Trp Ser Asp Met Tyr Gly Leu Ile Val Ala Gln Trp Leu Ser

705                 710                 715                 720

Thr Val Asn Thr Gln Phe Tyr Thr Ile Lys Glu Gly Met Tyr Lys Ala

                725                 730                 735

Leu Asn Tyr Gln Ala Gln Ala Leu Glu Glu Ile Ile Lys Tyr Arg Tyr

            740                 745                 750

Asn Ile Tyr Ser Glu Lys Glu Lys Ser Asn Ile Asn Ile Asp Phe Asn

        755                 760                 765

Asp Ile Asn Ser Lys Leu Asn Glu Gly Ile Asn Gln Ala Ile Asp Asn

    770                 775                 780

Ile Asn Asn Phe Ile Asn Gly Cys Ser Val Ser Tyr Leu Met Lys Lys

785                 790                 795                 800

Met Ile Pro Leu Ala Val Glu Lys Leu Leu Asp Phe Asp Asn Thr Leu

                805                 810                 815

Lys Lys Asn Leu Leu Asn Tyr Ile Asp Glu Asn Lys Leu Tyr Leu Ile

            820                 825                 830

Gly Ser Ala Glu Tyr Glu Lys Ser Lys Val Asn Lys Tyr Leu Lys Thr

        835                 840                 845

Ile Met Pro Phe Asp Leu Ser Ile Tyr Thr Asn Asp Thr Ile Leu Ile

    850                 855                 860

Glu Met Phe Asn Lys Tyr Asn Ser Glu Ile Leu Glu His His His His

865                 870                 875                 880

His His

<210>11

<211>3885

<212>DNA

<213>肉毒梭菌(Clostridium botulinum)

<400>11

atggcaataa caattaacaa ctttaattat tcagatcctg ttgataataa aaatatttta      60

tatttagata ctcatttaaa tacattagct aatgagcctg aaaaagcctt tcgcattata     120

gggaatatat gggtaatacc cgatagattt tcaagagatt ctaatccaaa tttaaataaa     180

cctccacgag ttacaagccc taaaagtggt tattatgatc ctaattattt gagtactgat     240

tctgaaaaag atacattttt aaaagaaatt ataaagttat ttaaaagaat taactctaga     300

gaaataggag aagaattaat atatagactt gcaacagaca taccctttcc tgggaataac     360

aatactccaa ttaatacttt tgattttgat gtagatttta acagtgttga tgttaaaact     420

agacaaggta acaactgggt taaaactggt agtataaatc ctagtgttat aataactgga     480

cctagagaaa acattataga cccagaaact tctacgttta aattaactaa caatactttt     540

gcggcacaag aaggatttgg tgctttatca ataatttcaa tatcacctag atttatgcta     600

acatatagta atgcaactaa taatgtagga gagggtagat tttctaagtc tgaattttgc     660

atggatccaa tactaatttt aatgcatgaa cttaatcatg caatgcataa tttatatgga     720

atagctatac caaatgatca aagaatttca tctgtaacta gtaatatttt ttattctcaa     780

tataatgtga aattagagta tgcagaaata tatgcatttg gaggtccaac tatagacctt     840

attcctaaaa gtgcaaggaa atattttgag gaaaaggcat tggattatta tagatccata     900

gctaaaagac ttaatagtat aactactgca aatccttcaa gctttaataa atatatagga     960

gaatataaac agaaacttat tagaaagtat agattcgtag tagaatcttc aggtgaagtt    1020

gcagtagatc gtaataagtt tgctgagtta tataaagaac ttacacaaat atttacagaa    1080

tttaactacg ctaaaatata taatgtacaa aataggaaaa tatatctttc aaatgtatat    1140

actccggtta cggcaaatat attagacgat aatgtttatg atatacaaaa tggatttaac    1200

atacctaaaa gtaatttaaa tgtactattt atgggtcaaa atttatctcg aaatccagca    1260

ttaagaaaag tcaatcctga aaatatgctt tatttattta caaaattttg tcatagaggg    1320

ataataactt ctaaaactaa atcattagtt ccgcgtggat ccaaggcctt agattgtaga    1380

gagcttttag ttaaaaatac tgacttaccc tttataggtg atattagtga tatcaaaact    1440

gatatatttt taagcaaaga tattaatgaa gaaactgaag ttatagacta tccggacaat    1500

gtttcagtgg atcaagttat tctcagtaag aatacctcag aacatggaca actagattta    1560

ttatacccta ttattgaagg tgagagtcaa gtattaccgg gagagaatca agtcttttat    1620

gataatagaa ctcaaaatgt tgattatttg aattcttatt attacctaga atctcaaaaa    1680

ctaagtgata atgttgaaga ttttactttt acgacatcaa ttgaggaagc tttggataat    1740

agtggaaaag tatatactta ctttcctaaa ctagctgata aagtaaatac gggtgttcaa    1800

ggtggtttat ttttaatgtg ggcaaatgat gtagttgaag attttactac aaatattcta    1860

agaaaagata cattagataa aatatcagat gtatcagcta ttattcccta tataggacct    1920

gcattaaata taagtaattc tgtaagaagg ggaaatttta ctgaagcatt tgcagttacc    1980

ggtgtaacta ttttattaga agcgtttcaa gaatttacaa tacctgcact tggtgcattt    2040

gtgatttata gtaaggttca agaaagaaac gagattatta aaactataga taattgttta    2100

gaacaaagga ttaaaagatg gaaagattca tatgaatgga tgataggaac gtggttatcc    2160

aggattacta ctcaatttaa taatataagt tatcaaatgt atgattcttt aaattatcag    2220

gcagatgcaa tcaaagataa aatagattta gaatataaaa aatactcagg aagtgataaa    2280

gaaaatataa aaagtcaagt tgaaaattta aaaaatagtt tagatataaa aatctcggaa    2340

gcaatgaata atataaataa atttatacga gaatgttctg taacatactt atttaaaaat    2400

atgctcccta aagtaattga tgaattaaat aagtttgatt taaaaactaa aacagaatta    2460

attaatctta tagatagtca taatattatt ctagttggtg aagtagatag attaaaagca    2520

aaaataaatg agagttttga aaatacaata ccctttaata ttttttcata tactaataat    2580

tctttattaa aagatatact cgaggaatat ttcaatagta ttaatgattc aaaaattttg    2640

agcttacaaa acaaaaaaaa tgctttagtg gatacatcag gatataatgc agaagtgagg    2700

ctagaaggtg atgttcaagt taatacgata tatacaaatg attttaaatt aagtagttca    2760

ggagataaaa ttatagtaaa tttaaataat aatattttat atagcgctat ttatgagaac    2820

tctagtgtta gtttttggat taagatatct aaagatttaa ctaattctca taatgaatat    2880

actataatta atagtataaa acaaaattct gggtggaaat tatgtattag aaatggcaat    2940

atagaatgga ttttacaaga tattaataga aagtataaaa gtttaatttt tgattatagt    3000

gaatcattaa gtcatacagg atatacaaat aaatggtttt ttgttactat aactaataat    3060

ataatggggt atatgaaact ttatataaat ggagaattaa agcagagtga aagaattgaa    3120

gatttagatg aggttaagtt agataaaacc atagtatttg gaatagatga gaatatagat    3180

gagaatcaga tgctttggat tagagatttt aatatttttt ctaaagaatt aagcaatgaa    3240

gatattaata ttgtatatga gggacaaata ttaagaaatg ttattaaaga ttattgggga    3300

aatcctttga agtttgatac agaatattat atgattaatt ataattatat agataggtat    3360

atagcaccta aaaataatat acttgtactt gttcagtatt cagatatatc taaattatat    3420

actaaaaatc ctattactat taaatcagca gctaataaga atccttatag tagaatttta    3480

aatggagatg atataatgtt tcatatgtta tatgatagta gggaatatat gataataaga    3540

gatactgata caatatatgc aacacaagga ggacagtgtt caaaaaattg tgtatatgca    3600

ttaaaattac agagtaattt aggtaattat ggtataggta tatttagtat aaaaaatatt    3660

gtatctcaaa ataaatattg tagtcaaatt ttctctagtt ttatgaaaaa tacaatgctt    3720

ctagcagata tatataaacc ttggagattt tcttttgaaa atgcatacac gccagttgca    3780

gtaactaatt atgagacaaa actattatca acttcatctt tttggaaatt tatttctagg    3840

gatccaggat gggtagagct cgagcaccac caccaccacc actaa                    3885

<210>12

<211>1294

<212>PRT

<213>肉毒梭菌(Clostridium botulinum)

<400>12

Met Ala Ile Thr Ile Asn Asn Phe Asn Tyr Ser Asp Pro Val Asp Asn

1               5                   10                  15

Lys Asn Ile Leu Tyr Leu Asp Thr His Leu Asn Thr Leu Ala Asn Glu

            20                  25                  30

Pro Glu Lys Ala Phe Arg Ile Ile Gly Asn Ile Trp Val Ile Pro Asp

        35                  40                  45

Arg Phe Ser Arg Asp Ser Asn Pro Asn Leu Asn Lys Pro Pro Arg Val

    50                  55                  60

Thr Ser Pro Lys Ser Gly Tyr Tyr Asp Pro Asn Tyr Leu Ser Thr Asp

65                  70                  75                  80

Ser Glu Lys Asp Thr Phe Leu Lys Glu Ile Ile Lys Leu Phe Lys Arg

                85                  90                  95

Ile Asn Ser Arg Glu Ile Gly Glu Glu Leu Ile Tyr Arg Leu Ala Thr

            100                 105                 110

Asp Ile Pro Phe Pro Gly Asn Asn Asn Thr Pro Ile Asn Thr Phe Asp

        115                 120                 125

Phe Asp Val Asp Phe Asn Ser Val Asp Val Lys Thr Arg Gln Gly Asn

   130                  135                 140

Asn Trp Val Lys Thr Gly Ser Ile Asn Pro Ser Val Ile Ile Thr Gly

145                 150                 155                 160

Pro Arg Glu Asn Ile Ile Asp Pro Glu Thr Ser Thr Phe Lys Leu Thr

                165                 170                 175

Asn Asn Thr Phe Ala Ala Gln Glu Gly Phe Gly Ala Leu Ser Ile Ile

            180                 185                 190

Ser Ile Ser Pro Arg Phe Met Leu Thr Tyr Ser Asn Ala Thr Asn Asn

        195                 200                 205

Val Gly Glu Gly Arg Phe Ser Lys Ser Glu Phe Cys Met Asp Pro Ile

    210                 215                 220

Leu Ile Leu Met His Glu Leu Asn His Ala Met His Asn Leu Tyr Gly

225                 230                 235                 240

Ile Ala Ile Pro Asn Asp Gln Arg Ile Ser Ser Val Thr Ser Asn Ile

                245                 250                 255

Phe Tyr Ser Gln Tyr Asn Val Lys Leu Glu Tyr Ala Glu Ile Tyr Ala

            260                 265                 270

Phe Gly Gly Pro Thr Ile Asp Leu Ile Pro Lys Ser Ala Arg Lys Tyr

        275                 280                 285

Phe Glu Glu Lys Ala Leu Asp Tyr Tyr Arg Ser Ile Ala Lys Arg Leu

    290                 295                 300

Asn Ser Ile Thr Thr Ala Asn Pro Ser Ser Phe Asn Lys Tyr Ile Gly

305                 310                 315                 320

Glu Tyr Lys Gln Lys Leu Ile Arg Lys Tyr Arg Phe Val Val Glu Ser

                325                 330                 335

Ser Gly Glu Val Ala Val Asp Arg Asn Lys Phe Ala Glu Leu Tyr Lys

            340                 345                 350

Glu Leu Thr Gln Ile Phe Thr Glu Phe Asn Tyr Ala Lys Ile Tyr Asn

        355                 360                 365

Val Gln Asn Arg Lys Ile Tyr Leu Ser Asn Val Tyr Thr Pro Val Thr

    370                 375                 380

Ala Asn Ile Leu Asp Asp Asn Val Tyr Asp Ile Gln Asn Gly Phe Asn

385                 390                 395                 400

Ile Pro Lys Ser Asn Leu Asn Val Leu Phe Met Gly Gln Asn Leu Ser

                405                 410                 415

Arg Asn Pro Ala Leu Arg Lys Val Asn Pro Glu Asn Met Leu Tyr Leu

            420                 425                 430

Phe Thr Lys Phe Cys His Arg Gly Ile Ile Thr Ser Lys Thr Lys Ser

        435                 440                 445

Leu Val Pro Arg Gly Ser Lys Ala Leu Asp Cys Arg Glu Leu Leu Val

    450                 455                 460

Lys Asn Thr Asp Leu Pro Phe Ile Gly Asp Ile Ser Asp Ile Lys Thr

465                 470                 475                 480

Asp Ile Phe Leu Ser Lys Asp Ile Asn Glu Glu Thr Glu Val Ile Asp

                485                 490                 495

Tyr Pro Asp Asn Val Ser Val Asp Gln Val Ile Leu Ser Lys Asn Thr

            500                 505                 510

Ser Glu His Gly Gln Leu Asp Leu Leu Tyr Pro Ile Ile Glu Gly Glu

        515                 520                 525

Ser Gln Val Leu Pro Gly Glu Asn Gln Val Phe Tyr Asp Asn Arg Thr

    530                 535                 540

Gln Asn Val Asp Tyr Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys

545                 550                 555                 560

Leu Ser Asp Asn Val Glu Asp Phe Thr Phe Thr Thr Ser Ile Glu Glu

                565                 570                 575

Ala Leu Asp Asn Ser Gly Lys Val Tyr Thr Tyr Phe Pro Lys Leu Ala

            580                 585                 590

Asp Lys Val Asn Thr Gly Val Gln Gly Gly Leu Phe Leu Met Trp Ala

        595                 600                 605

Asn Asp Val Val Glu Asp Phe Thr Thr Asn Ile Leu Arg Lys Asp Thr

    610                 615                 620

Leu Asp Lys Ile Ser Asp Val Ser Ala Ile Ile Pro Tyr Ile Gly Pro

625                 630                 635                 640

Ala Leu Asn Ile Ser Asn Ser Val Arg Arg Gly Asn Phe Thr Glu Ala

                645                 650                 655

Phe Ala Val Thr Gly Val Thr Ile Leu Leu Glu Ala Phe Gln Glu Phe

            660                 665                 670

Thr Ile Pro Ala Leu Gly Ala Phe Val Ile Tyr Ser Lys Val Gln Glu

        675                 680                 685

Arg Asn Glu Ile Ile Lys Thr Ile Asp Asn Cys Leu Glu Gln Arg Ile

    690                 695                 700

Lys Arg Trp Lys Asp Ser Tyr Glu Trp Met Ile Gly Thr Trp Leu Ser

705                 710                 715                 720

Arg Ile Thr Thr Gln Phe Asn Asn Ile Ser Tyr Gln Met Tyr Asp Ser

                725                 730                 735

Leu Asn Tyr Gln Ala Asp Ala Ile Lys Asp Lys Ile Asp Leu Glu Tyr

            740                 745                 750

Lys Lys Tyr Ser Gly Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu

        755                 760                 765

Asn Leu Lys Asn Ser Leu Asp Ile Lys Ile Ser Glu Ala Met Asn Asn

    770                 775                 780

Ile Asn Lys Phe Ile Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn

785                 790                 795                 800

Met Leu Pro Lys Val Ile Asp Glu Leu Asn Lys Phe Asp Leu Lys Thr

                805                 810                 815

Lys Thr Glu Leu Ile Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val

            820                 825                 830

Gly Glu Val Asp Arg Leu Lys Ala Lys Ile Asn Glu Ser Phe Glu Asn

        835                 840                 845

Thr Ile Pro Phe Asn Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys

    850                 855                 860

Asp Ile Leu Glu Glu Tyr Phe Asn Ser Ile Asn Asp Ser Lys Ile Leu

865                 870                 875                 880

Ser Leu Gln Asn Lys Lys Asn Ala Leu Val Asp Thr Ser Gly Tyr Asn

                885                 890                 895

Ala Glu Val Arg Leu Glu Gly Asp Val Gln Val Asn Thr Ile Tyr Thr

            900                 905                 910

Asn Asp Phe Lys Leu Ser Ser Ser Gly Asp Lys Ile Ile Val Asn Leu

        915                 920                 925

Asn Asn Asn Ile Leu Tyr Ser Ala Ile Tyr Glu Asn Ser Ser Val Ser

    930                 935                 940

Phe Trp Ile Lys Ile Ser Lys Asp Leu Thr Asn Ser His Asn Glu Tyr

945                 950                 955                 960

Thr Ile Ile Asn Ser Ile Lys Gln Asn Ser Gly Trp Lys Leu Cys Ile

                965                 970                 975

Arg Asn Gly Asn Ile Glu Trp Ile Leu Gln Asp Ile Asn Arg Lys Tyr

            980                 985                 990

Lys Ser Leu Ile Phe Asp Tyr Ser Glu Ser Leu Ser His Thr Gly Tyr

        995                 1000                1005

Thr Asn Lys Trp Phe Phe Val Thr Ile Thr Asn Asn Ile Met Gly

    1010                1015                1020

Tyr Met Lys Leu Tyr Ile Asn Gly Glu Leu Lys Gln Ser Glu Arg

    1025                1030                1035

Ile Glu Asp Leu Asp Glu Val Lys Leu Asp Lys Thr Ile Val Phe

    1040                1045                1050

Gly Ile Asp Glu Asn Ile Asp Glu Asn Gln Met Leu Trp Ile Arg

    1055                1060                1065

Asp Phe Asn Ile Phe Ser Lys Glu Leu Ser Asn Glu Asp Ile Asn

    1070                1075                1080

Ile Val Tyr Glu Gly Gln Ile Leu Arg Asn Val Ile Lys Asp Tyr

    1085                1090                1095

Trp Gly Asn Pro Leu Lys Phe Asp Thr Glu Tyr Tyr Met Ile Asn

    1100                1105                1110

Tyr Asn Tyr Ile Asp Arg Tyr Ile Ala Pro Lys Asn Asn Ile Leu

    1115                1120                1125

Val Leu Val Gln Tyr Ser Asp Ile Ser Lys Leu Tyr Thr Lys Asn

    1130                1135                1140

Pro Ile Thr Ile Lys Ser Ala Ala Asn Lys Asn Pro Tyr Ser Arg

    1145                1150                1155

Ile Leu Asn Gly Asp Asp Ile Met Phe His Met Leu Tyr Asp Ser

    1160                1165                1170

Arg Glu Tyr Met Ile Ile Arg Asp Thr Asp Thr Ile Tyr Ala Thr

    1175                1180                1185

Gln Gly Gly Gln Cys Ser Lys Asn Cys Val Tyr Ala Leu Lys Leu

    1190                1195                1200

Gln Ser Asn Leu Gly Asn Tyr Gly Ile Gly Ile Phe Ser Ile Lys

    1205                1210                1215

Asn Ile Val Ser Gln Asn Lys Tyr Cys Ser Gln Ile Phe Ser Ser

    1220                1225                1230

Phe Met Lys Asn Thr Met Leu Leu Ala Asp Ile Tyr Lys Pro Trp

    1235                1240                1245

Arg Phe Ser Phe Glu Asn Ala Tyr Thr Pro Val Ala Val Thr Asn

    1250                1255                1260

Tyr Glu Thr Lys Leu Leu Ser Thr Ser Ser Phe Trp Lys Phe Ile

    1265                1270                1275

Ser Arg Asp Pro Gly Trp Val Glu Leu Glu His His His His His

    1280                1285                1290

His

<210>13

<211>2625

<212>DNA

<213>肉毒梭菌(Clostridium botulinum)

<400>13

atggcaataa caattaacaa ctttaattat tcagatcctg ttgataataa aaatatttta      60

tatttagata ctcatttaaa tacattagct aatgagcctg aaaaagcctt tcgcattata     120

gggaatatat gggtaatacc cgatagattt tcaagagatt ctaatccaaa tttaaataaa     180

cctccacgag ttacaagccc taaaagtggt tattatgatc ctaattattt gagtactgat     240

tctgaaaaag atacattttt aaaagaaatt ataaagttat ttaaaagaat taactctaga     300

gaaataggag aagaattaat atatagactt gcaacagaca taccctttcc tgggaataac     360

aatactccaa ttaatacttt tgattttgat gtagatttta acagtgttga tgttaaaact     420

agacaaggta acaactgggt taaaactggt agtataaatc ctagtgttat aataactgga     480

cctagagaaa acattataga cccagaaact tctacgttta aattaactaa caatactttt     540

gcggcacaag aaggatttgg tgctttatca ataatttcaa tatcacctag atttatgcta     600

acatatagta atgcaactaa taatgtagga gagggtagat tttctaagtc tgaattttgc     660

atggatccaa tactaatttt aatgcatgaa cttaatcatg caatgcataa tttatatgga     720

atagctatac caaatgatca aagaatttca tctgtaacta gtaatatttt ttattctcaa     780

tataatgtga aattagagta tgcagaaata tatgcatttg gaggtccaac tatagacctt     840

attcctaaaa gtgcaaggaa atattttgag gaaaaggcat tggattatta tagatccata     900

gctaaaagac ttaatagtat aactactgca aatccttcaa gctttaataa atatatagga     960

gaatataaac agaaacttat tagaaagtat agattcgtag tagaatcttc aggtgaagtt    1020

gcagtagatc gtaataagtt tgctgagtta tataaagaac ttacacaaat atttacagaa    1080

tttaactacg ctaaaatata taatgtacaa aataggaaaa tatatctttc aaatgtatat    1140

actccggtta cggcaaatat attagacgat aatgtttatg atatacaaaa tggatttaac    1200

atacctaaaa gtaatttaaa tgtactattt atgggtcaaa atttatctcg aaatccagca    1260

ttaagaaaag tcaatcctga aaatatgctt tatttattta caaaattttg tcatagaggg    1320

ataataactt ctaaaactaa atcattagtt ccgcgtggat ccaaggcctt agattgtaga    1380

gagcttttag ttaaaaatac tgacttaccc tttataggtg atattagtga tatcaaaact    1440

gatatatttt taagcaaaga tattaatgaa gaaactgaag ttatagacta tccggacaat    1500

gtttcagtgg atcaagttat tctcagtaag aatacctcag aacatggaca actagattta    1560

ttatacccta ttattgaagg tgagagtcaa gtattaccgg gagagaatca agtcttttat    1620

gataatagaa ctcaaaatgt tgattatttg aattcttatt attacctaga atctcaaaaa    1680

ctaagtgata atgttgaaga ttttactttt acgacatcaa ttgaggaagc tttggataat    1740

agtggaaaag tatatactta ctttcctaaa ctagctgata aagtaaatac gggtgttcaa    1800

ggtggtttat ttttaatgtg ggcaaatgat gtagttgaag attttactac aaatattcta    1860

agaaaagata cattagataa aatatcagat gtatcagcta ttattcccta tataggacct    1920

gcattaaata taagtaattc tgtaagaagg ggaaatttta ctgaagcatt tgcagttacc    1980

ggtgtaacta ttttattaga agcgtttcaa gaatttacaa tacctgcact tggtgcattt    2040

gtgatttata gtaaggttca agaaagaaac gagattatta aaactataga taattgttta    2100

gaacaaagga ttaaaagatg gaaagattca tatgaatgga tgataggaac gtggttatcc    2160

aggattacta ctcaatttaa taatataagt tatcaaatgt atgattcttt aaattatcag    2220

gcagatgcaa tcaaagataa aatagattta gaatataaaa aatactcagg aagtgataaa    2280

gaaaatataa aaagtcaagt tgaaaattta aaaaatagtt tagatataaa aatctcggaa    2340

gcaatgaata atataaataa atttatacga gaatgttctg taacatactt atttaaaaat    2400

atgctcccta aagtaattga tgaattaaat aagtttgatt taaaaactaa aacagaatta    2460

attaatctta tagatagtca taatattatt ctagttggtg aagtagatag attaaaagca    2520

aaaataaatg agagttttga aaatacaata ccctttaata ttttttcata tactaataat    2580

tctttattaa aagatatact cgagcaccac caccaccacc actaa                    2625

<210>14

<211>874

<212>PRT

<213>肉毒梭菌(Clostridium botulinum)

<400>14

Met Ala Ile Thr Ile Asn Asn Phe Asn Tyr Ser Asp Pro Val Asp Asn

1               5                   10                  15

Lys Asn Ile Leu Tyr Leu Asp Thr His Leu Asn Thr Leu Ala Asn Glu

            20                  25                  30

Pro Glu Lys Ala Phe Arg Ile Ile Gly Asn Ile Trp Val Ile Pro Asp

        35                  40                  45

Arg Phe Ser Arg Asp Ser Asn Pro Asn Leu Asn Lys Pro Pro Arg Val

    50                  55                  60

Thr Ser Pro Lys Ser Gly Tyr Tyr Asp Pro Asn Tyr Leu Ser Thr Asp

65                  70                  75                  80

Ser Glu Lys Asp Thr Phe Leu Lys Glu Ile Ile Lys Leu Phe Lys Arg

                85                  90                  95

Ile Asn Ser Arg Glu Ile Gly Glu Glu Leu Ile Tyr Arg Leu Ala Thr

            100                 105                 110

Asp Ile Pro Phe Pro Gly Asn Asn Asn Thr Pro Ile Asn Thr Phe Asp

        115                 120                 125

Phe Asp Val Asp Phe Asn Ser Val Asp Val Lys Thr Arg Gln Gly Asn

    130                 135                 140

Asn Trp Val Lys Thr Gly Ser Ile Asn Pro Ser Val Ile Ile Thr Gly

145                 150                 155                 160

Pro Arg Glu Asn Ile Ile Asp Pro Glu Thr Ser Thr Phe Lys Leu Thr

                165                 170                 175

Asn Asn Thr Phe Ala Ala Gln Glu Gly Phe Gly Ala Leu Ser Ile Ile

            180                 185                 190

Ser Ile Ser Pro Arg Phe Met Leu Thr Tyr Ser Asn Ala Thr Asn Asn

        195                 200                 205

Val Gly Glu Gly Arg Phe Ser Lys Ser Glu Phe Cys Met Asp Pro Ile

    210                 215                 220

Leu Ile Leu Met His Glu Leu Asn His Ala Met His Asn Leu Tyr Gly

225                 230                 235                 240

Ile Ala Ile Pro Asn Asp Gln Arg Ile Ser Ser Val Thr Ser Asn Ile

                245                 250                 255

Phe Tyr Ser Gln Tyr Asn Val Lys Leu Glu Tyr Ala Glu Ile Tyr Ala

            260                 265                 270

Phe Gly Gly Pro Thr Ile Asp Leu Ile Pro Lys Ser Ala Arg Lys Tyr

        275                 280                 285

Phe Glu Glu Lys Ala Leu Asp Tyr Tyr Arg Ser Ile Ala Lys Arg Leu

    290                 295                 300

Asn Ser Ile Thr Thr Ala Asn Pro Ser Ser Phe Asn Lys Tyr Ile Gly

305                 310                 315                 320

Glu Tyr Lys Gln Lys Leu Ile Arg Lys Tyr Arg Phe Val Val Glu Ser

                325                 330                 335

Ser Gly Glu Val Ala Val Asp Arg Asn Lys Phe Ala Glu Leu Tyr Lys

            340                 345                 350

Glu Leu Thr Gln Ile Phe Thr Glu Phe Asn Tyr Ala Lys Ile Tyr Asn

        355                 360                 365

Val Gln Asn Arg Lys Ile Tyr Leu Ser Asn Val Tyr Thr Pro Val Thr

    370                 375                 380

Ala Asn Ile Leu Asp Asp Asn Val Tyr Asp Ile Gln Asn Gly Phe Asn

385                 390                 395                 400

Ile Pro Lys Ser Asn Leu Asn Val Leu Phe Met Gly Gln Asn Leu Ser

                405                 410                 415

Arg Asn Pro Ala Leu Arg Lys Val Asn Pro Glu Asn Met Leu Tyr Leu

            420                 425                 430

Phe Thr Lys Phe Cys His Arg Gly Ile Ile Thr Ser Lys Thr Lys Ser

        435                 440                 445

Leu Val Pro Arg Gly Ser Lys Ala Leu Asp Cys Arg Glu Leu Leu Val

    450                 455                 460

Lys Asn Thr Asp Leu Pro Phe Ile Gly Asp Ile Ser Asp Ile Lys Thr

465                 470                 475                 480

Asp Ile Phe Leu Ser Lys Asp Ile Asn Glu Glu Thr Glu Val Ile Asp

                485                 490                 495

Tyr Pro Asp Asn Val Ser Val Asp Gln Val Ile Leu Ser Lys Asn Thr

            500                 505                 510

Ser Glu His Gly Gln Leu Asp Leu Leu Tyr Pro Ile Ile Glu Gly Glu

        515                 520                 525

Ser Gln Val Leu Pro Gly Glu Asn Gln Val Phe Tyr Asp Asn Arg Thr

    530                 535                 540

Gln Asn Val Asp Tyr Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys

545                 550                 555                 560

Leu Ser Asp Asn Val Glu Asp Phe Thr Phe Thr Thr Ser Ile Glu Glu

                565                 570                 575

Ala Leu Asp Asn Ser Gly Lys Val Tyr Thr Tyr Phe Pro Lys Leu Ala

            580                 585                 590

Asp Lys Val Asn Thr Gly Val Gln Gly Gly Leu Phe Leu Met Trp Ala

        595                 600                 605

Asn Asp Val Val Glu Asp Phe Thr Thr Asn Ile Leu Arg Lys Asp Thr

    610                 615                 620

Leu Asp Lys Ile Ser Asp Val Ser Ala Ile Ile Pro Tyr Ile Gly Pro

625                 630                 635                 640

Ala Leu Asn Ile Ser Asn Ser Val Arg Arg Gly Asn Phe Thr Glu Ala

                645                 650                 655

Phe Ala Val Thr Gly Val Thr Ile Leu Leu Glu Ala Phe Gln Glu Phe

            660                 665                 670

Thr Ile Pro Ala Leu Gly Ala Phe Val Ile Tyr Ser Lys Val Gln Glu

        675                 680                 685

Arg Asn Glu Ile Ile Lys Thr Ile Asp Asn Cys Leu Glu Gln Arg Ile

    690                 695                 700

Lys Arg Trp Lys Asp Ser Tyr Glu Trp Met Ile Gly Thr Trp Leu Ser

705                 710                 715                 720

Arg Ile Thr Thr Gln Phe Asn Asn Ile Ser Tyr Gln Met Tyr Asp Ser

                725                 730                 735

Leu Asn Tyr Gln Ala Asp Ala Ile Lys Asp Lys Ile Asp Leu Glu Tyr

            740                 745                 750

Lys Lys Tyr Ser Gly Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu

        755                 760                 765

Asn Leu Lys Asn Ser Leu Asp Ile Lys Ile Ser Glu Ala Met Asn Asn

    770                 775                 780

Ile Asn Lys Phe Ile Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn

785                 790                 795                 800

Met Leu Pro Lys Val Ile Asp Glu Leu Asn Lys Phe Asp Leu Lys Thr

                805                 810                 815

Lys Thr Glu Leu Ile Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val

            820                 825                 830

Gly Glu Val Asp Arg Leu Lys Ala Lys Ile Asn Glu Ser Phe Glu Asn

        835                 840                 845

Thr Ile Pro Phe Asn Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys

    850                 855                 860

Asp Ile Leu Glu His His His His His His

865                 870

<210>15

<211>3810

<212>DNA

<213>肉毒梭菌(Clostridium botulinum)

<400>15

atggcaacaa ttaatagttt taattataat gatcctgtta ataatagaac aattttatat      60

attaaaccag gcggttgtca acaattttat aaatcattta atattatgaa aaatatttgg     120

ataattccag agagaaatgt aattggtaca attccccaag attttcttcc gcctacttca     180

ttgaaaaatg gagatagtag ttattatgac cctaattatt tacaaagtga tcaagaaaag     240

gataaatttt taaaaatagt cacaaaaata tttaatagaa taaatgataa tctttcagga     300

aggattttat tagaagaact gtcaaaagct aatccatatt taggaaatga taatactcca     360

gatggtgact tcattattaa tgatgcatca gcagttccaa ttcaattctc aaatggtagc     420

caaagcatac tattacctaa tgttattata atgggagcag agcctgattt atttgaaact     480

aacagttcca atatttctct aagaaataat tatatgccaa gcaatcacgg ttttggatca     540

atagctatag taacattctc acctgaatat tcttttagat ttaaagataa tagtatgaat     600

gaatttattc aagatcctgc tcttacatta atgcatgaat taatacattc attacatgga     660

ctatatgggg ctaaagggat tactacaaag tatactataa cacaaaaaca aaatccccta     720

ataacaaata taagaggtac aaatattgaa gaattcttaa cttttggagg tactgattta     780

aacattatta ctagtgctca gtccaatgat atctatacta atcttctagc tgattataaa     840

aaaatagcgt ctaaacttag caaagtacaa gtatctaatc cactacttaa tccttataaa     900

gatgtttttg aagcaaagta tggattagat aaagatgcta gcggaattta ttcggtaaat     960

ataaacaaat ttaatgatat ttttaaaaaa ttatacagct ttacggaatt tgatttagca    1020

actaaatttc aagttaaatg taggcaaact tatattggac agtataaata cttcaaactt    1080

tcaaacttgt taaatgattc tatttataat atatcagaag gctataatat aaataattta    1140

aaggtaaatt ttagaggaca gaatgcaaat ttaaatccta gaattattac accaattaca    1200

ggtagaggac tagtaaaaaa aatcattaga ttttgtaaaa gtgggataat aacttctaaa    1260

actaaatcat tggttccacg tggatccaag gcctcaatat gtatcgaaat aaataatggt    1320

gagttatttt ttgtggcttc cgagaatagt tataatgatg ataatataaa tactcctaaa    1380

gaaattgacg atacagtaac ttcaaataat aattatgaaa atgatttaga tcaggttatt    1440

ttaaatttta atagtgaatc agcacctgga ctttcagatg aaaaattaaa tttaactatc    1500

caaaatgatg cttatatacc aaaatatgat tctaatggaa caagtgatat agaacaacat    1560

gatgttaatg aacttaatgt atttttctat ttagatgcac agaaagtgcc cgaaggtgaa    1620

aataatgtca atctcacctc ttcaattgat acagcattat tagaacaacc taaaatatat    1680

acattttttt catcagaatt tattaataat gtcaataaac ctgtgcaagc agcattattt    1740

gtaggctgga tacaacaagt attagtagat tttactactg aagctaacca aaaaagtact    1800

gttgataaaa ttgcagatat ttctatagtt gttccatata taggtcttgc tttaaatata    1860

ggaaatgaag cacaaaaagg aaattttaaa gatgcacttg aattattagg agcaggtatt    1920

ttattagaat ttgaacccga gcttttaatt cctacaattt tagtattcac gataaaatct    1980

tttttaggtt catctgataa taaaaataaa gttattaaag caataaataa tgcattgaaa    2040

gaaagagatg aaaaatggaa agaagtatat agttttatag tatcgaattg gatgactaaa    2100

attaatacac aatttaataa aagaaaagaa caaatgtatc aagctttaca aaatcaagta    2160

aatgcactta aagcaataat agaatctaag tataatagtt atactttaga agaaaaaaat    2220

gagcttacaa ataaatatga tattgagcaa atagaaaatg aacttaatca aaaggtttct    2280

atagcaatga ataatataga caggttctta actgaaagtt ctatatctta tttaatgaaa    2340

ttaataaatg aagtaaaaat taataaatta agagaatatg atgaaaatgt taaaacgtat    2400

ttattagatt atattataaa acatggatca atcttgggag agagtcagca agaactaaat    2460

tctatggtaa ttgataccct aaataatagt attcctttta agctttcttc ttatacagat    2520

gataaaattt taatttcata ttttaataag ttctttaaga gaattaaaag tagttctgtt    2580

ttaaatatga gatataaaaa tgataaatac gtagatactt caggatatga ttcaaatata    2640

aatattaatg gagatgtata taaatatcca actaataaaa atcaatttgg aatatataat    2700

gataaactta gtgaagttaa tatatctcaa aatgattaca ttatatatga taataaatat    2760

aaaaatttta gtattagttt ttgggtaaga attcctaact atgataataa gatagtaaat    2820

gttaataatg aatacactat aataaattgt atgagggata ataattcagg atggaaagta    2880

tctcttaatc ataatgaaat aatttggaca ttgcaagata attcaggaat taatcaaaaa    2940

ttagcattta actatggtaa cgcaaatggt atttctgatt atataaataa gtggattttt    3000

gtaactataa ctaatgatag attaggagat tctaaacttt atattaatgg aaatttaata    3060

gataaaaaat caattttaaa tttaggtaat attcatgtta gtgacaatat attatttaaa    3120

atagttaatt gtagttatac aagatatatt ggtattagat attttaatat ttttgataaa    3180

gaattagatg aaacagaaat tcaaacttta tataacaatg agcctaatgc aaatatttta    3240

aaggattttt ggggaaatta tttgctttat gacaaagaat attatttatt aaatgtgtta    3300

aaaccaaata actttattaa taggagaaca gattctactt taagcattaa taatataaga    3360

agcactattc ttttagctaa tagattatat agtggaataa aagttaaaat acaaagagtt    3420

aataatagta gtactaacga taatcttgtt agaaagaatg atcaggtata tattaatttt    3480

gtagccagca aaactcactt acttccatta tatgctgata cagctaccac aaataaagag    3540

aaaacaataa aaatatcatc atctggcaat agatttaatc aagtagtagt tatgaattca    3600

gtaggaaata attgtacaat gaattttaaa aataataatg gaaataatat tgggttgtta    3660

ggtttcaagg cagatactgt agttgctagt acttggtatt atacacatat gagagataat    3720

acaaacagca atggattttt ttggaacttt atttctgaag aacatggatg gcaagaaaaa    3780

acgcgttctc accaccacca ccaccactaa                                     3810

<210>16

<211>1269

<212>PRT

<213>肉毒梭菌(Clostridium botulinum)

<400>16

Met Ala Thr Ile Asn Ser Phe Asn Tyr Asn Asp Pro Val Asn Asn Arg

1               5                   10              15

Thr Ile Leu Tyr Ile Lys Pro Gly Gly Cys Gln Gln Phe Tyr Lys Ser

            20                  25                  30

Phe Asn Ile Met Lys Asn Ile Trp Ile Ile Pro Glu Arg Asn Val Ile

        35                  40                  45

Gly Thr Ile Pro Gln Asp Phe Leu Pro Pro Thr Ser Leu Lys Asn Gly

    50                  55                  60

Asp Ser Ser Tyr Tyr Asp Pro Asn Tyr Leu Gln Ser Asp Gln Glu Lys

65                  70                  75                  80

Asp Lys Phe Leu Lys Ile Val Thr Lys Ile Phe Asn Arg Ile Asn Asp

                85                  90                  95

Asn Leu Ser Gly Arg Ile Leu Leu Glu Glu Leu Ser Lys Ala Asn Pro

            100                 105                 110

Tyr Leu Gly Asn Asp Asn Thr Pro Asp Gly Asp Phe Ile Ile Asn Asp

        115                 120                 125

Ala Ser Ala Val Pro Ile Gln Phe Ser Asn Gly Ser Gln Ser Ile Leu

    130                 135                 140

Leu Pro Asn Val Ile Ile Met Gly Ala Glu Pro Asp Leu Phe Glu Thr

145                 150                 155                 160

Asn Ser Ser Asn Ile Ser Leu Arg Asn Asn Tyr Met Pro Ser Asn His

                165                 170                 175

Gly Phe Gly Ser Ile Ala Ile Val Thr Phe Ser Pro Glu Tyr Ser Phe

            180                 185                 190

Arg Phe Lys Asp Asn Ser Met Asn Glu Phe Ile Gln Asp Pro Ala Leu

        195                 200                 205

Thr Leu Met His Glu Leu Ile His Ser Leu His Gly Leu Tyr Gly Ala

    210                 215                 220

Lys Gly Ile Thr Thr Lys Tyr Thr Ile Thr Gln Lys Gln Asn Pro Leu

225                 230                 235                 240

Ile Thr Asn Ile Arg Gly Thr Asn Ile Glu Glu Phe Leu Thr Phe Gly

                245                 250                 255

Gly Thr Asp Leu Asn Ile Ile Thr Ser Ala Gln Ser Asn Asp Ile Tyr

            260                 265                 270

Thr Asn Leu Leu Ala Asp Tyr Lys Lys Ile Ala Ser Lys Leu Ser Lys

        275                 280                 285

Val Gln Val Ser Asn Pro Leu Leu Asn Pro Tyr Lys Asp Val Phe Glu

    290                 295                 300

Ala Lys Tyr Gly Leu Asp Lys Asp Ala Ser Gly Ile Tyr Ser Val Asn

305                 310                 315                 320

Ile Asn Lys Phe Asn Asp Ile Phe Lys Lys Leu Tyr Ser Phe Thr Glu

                325                 330                 335

Phe Asp Leu Ala Thr Lys Phe Gln Val Lys Cys Arg Gln Thr Tyr Ile

            340                 345                 350

Gly Gln Tyr Lys Tyr Phe Lys Leu Ser Asn Leu Leu Asn Asp Ser Ile

        355                 360                 365

Tyr Asn Ile Ser Glu Gly Tyr Asn Ile Asn Asn Leu Lys Val Asn Phe

    370                 375                 380

Arg Gly Gln Asn Ala Asn Leu Asn Pro Arg Ile Ile Thr Pro Ile Thr

385                 390                 395                 400

Gly Arg Gly Leu Val Lys Lys Ile Ile Arg Phe Cys Lys Ser Gly Ile

                405                 410                 415

Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys Ala Ser

            420                 425                 430

Ile Cys Ile Glu Ile Asn Asn Gly Glu Leu Phe Phe Val Ala Ser Glu

        435                 440                 445

Asn Ser Tyr Asn Asp Asp Asn Ile Asn Thr Pro Lys Glu Ile Asp Asp

    450                 455                 460

Thr Val Thr Ser Asn Asn Asn Tyr Glu Asn Asp Leu Asp Gln Val Ile

465                 470                 475                 480

Leu Asn Phe Asn Ser Glu Ser Ala Pro Gly Leu Ser Asp Glu Lys Leu

                485                 490                 495

Asn Leu Thr Ile Gln Asn Asp Ala Tyr Ile Pro Lys Tyr Asp Ser Asn

            500                 505                 510

Gly Thr Ser Asp Ile Glu Gln His Asp Val Asn Glu Leu Asn Val Phe

        515                 520                 525

Phe Tyr Leu Asp Ala Gln Lys Val Pro Glu Gly Glu Asn Asn Val Asn

    530                 535                 540

Leu Thr Ser Ser Ile Asp Thr Ala Leu Leu Glu Gln Pro Lys Ile Tyr

545                 550                 555                 560

Thr Phe Phe Ser Ser Glu Phe Ile Asn Asn Val Asn Lys Pro Val Gln

                565                 570                 575

Ala Ala Leu Phe Val Gly Trp Ile Gln Gln Val Leu Val Asp Phe Thr

            580                 585                 590

Thr Glu Ala Asn Gln Lys Ser Thr Val Asp Lys Ile Ala Asp Ile Ser

        595                 600                 605

Ile Val Val Pro Tyr Ile Gly Leu Ala Leu Asn Ile Gly Asn Glu Ala

    610                 615                 620

Gln Lys Gly Asn Phe Lys Asp Ala Leu Glu Leu Leu Gly Ala Gly Ile

625                 630                 635                 640

Leu Leu Glu Phe Glu Pro Glu Leu Leu Ile Pro Thr Ile Leu Val Phe

                645                 650                 655

Thr Ile Lys Ser Phe Leu Gly Ser Ser Asp Asn Lys Asn Lys Val Ile

            660                 665                 670

Lys Ala Ile Asn Asn Ala Leu Lys Glu Arg Asp Glu Lys Trp Lys Glu

        675                 680                 685

Val Tyr Ser Phe Ile Val Ser Asn Trp Met Thr Lys Ile Asn Thr Gln

    690                 695                 700

Phe Asn Lys Arg Lys Glu Gln Met Tyr Gln Ala Leu Gln Asn Gln Val

705                 710                 715                 720

Asn Ala Leu Lys Ala Ile Ile Glu Ser Lys Tyr Asn Ser Tyr Thr Leu

                725                 730                 735

Glu Glu Lys Asn Glu Leu Thr Asn Lys Tyr Asp Ile Glu Gln Ile Glu

            740                 745                 750

Asn Glu Leu Asn Gln Lys Val Ser Ile Ala Met Asn Asn Ile Asp Arg

        755                 760                 765

Phe Leu Thr Glu Ser Ser Ile Ser Tyr Leu Met Lys Leu Ile Asn Glu

    770                 775                 780

Val Lys Ile Asn Lys Leu Arg Glu Tyr Asp Glu Asn Val Lys Thr Tyr

785                 790                 795                 800

Leu Leu Asp Tyr Ile Ile Lys His Gly Ser Ile Leu Gly Glu Ser Gln

                805                 810                 815

Gln Glu Leu Asn Ser Met Val Ile Asp Thr Leu Asn Asn Ser Ile Pro

            820                 825                 830

Phe Lys Leu Ser Ser Tyr Thr Asp Asp Lys Ile Leu Ile Ser Tyr Phe

        835                 840                 845

Asn Lys Phe Phe Lys Arg Ile Lys Ser Ser Ser Val Leu Asn Met Arg

    850                 855                 860

Tyr Lys Asn Asp Lys Tyr Val Asp Thr Ser Gly Tyr Asp Ser Asn Ile

865                 870                 875                 880

Asn Ile Asn Gly Asp Val Tyr Lys Tyr Pro Thr Asn Lys Asn Gln Phe

                885                 890                 895

Gly Ile Tyr Asn Asp Lys Leu Ser Glu Val Asn Ile Ser Gln Asn Asp

            900                 905                 910

Tyr Ile Ile Tyr Asp Asn Lys Tyr Lys Asn Phe Ser Ile Ser Phe Trp

        915                 920                 925

Val Arg Ile Pro Asn Tyr Asp Asn Lys Ile Val Asn Val Asn Asn Glu

    930                 935                 940

Tyr Thr Ile Ile Asn Cys Met Arg Asp Asn Asn Ser Gly Trp Lys Val

945                 950                 955                 960

Ser Leu Asn His Asn Glu Ile Ile Trp Thr Leu Gln Asp Asn Ser Gly

                965                 970                 975

Ile Asn Gln Lys Leu Ala Phe Asn Tyr Gly Asn Ala Asn Gly Ile Ser

            980                 985                 990

Asp Tyr Ile Asn Lys Trp Ile Phe Val Thr Ile Thr Asn Asp Arg Leu

        995                 1000                1005

Gly Asp Ser Lys Leu Tyr Ile Asn Gly Asn Leu Ile Asp Lys Lys

    1010                1015                1020

Ser Ile Leu Asn Leu Gly Asn Ile His Val Ser Asp Asn Ile Leu

    1025                1030                1035

Phe Lys Ile Val Asn Cys Ser Tyr Thr Arg Tyr Ile Gly Ile Arg

    1040                1045                1050

Tyr Phe Asn Ile Phe Asp Lys Glu Leu Asp Glu Thr Glu Ile Gln

    1055                1060                1065

Thr Leu Tyr Asn Asn Glu Pro Asn Ala Asn Ile Leu Lys Asp Phe

    1070                1075                1080

Trp Gly Asn Tyr Leu Leu Tyr Asp Lys Glu Tyr Tyr Leu Leu Asn

    1085                1090                1095

Val Leu Lys Pro Asn Asn Phe Ile Asn Arg Arg Thr Asp Ser Thr

    1100                1105                1110

Leu Ser Ile Asn Asn Ile Arg Ser Thr Ile Leu Leu Ala Asn Arg

    1115                1120                1125

Leu Tyr Ser Gly Ile Lys Val Lys Ile Gln Arg Val Asn Asn Ser

    1130                1135                1140

Ser Thr Asn Asp Asn Leu Val Arg Lys Asn Asp Gln Val Tyr Ile

    1145                1150                1155

Asn Phe Val Ala Ser Lys Thr His Leu Leu Pro Leu Tyr Ala Asp

    1160                1165                1170

Thr Ala Thr Thr Asn Lys Glu Lys Thr Ile Lys Ile Ser Ser Ser

    1175                1180                1185

Gly Asn Arg Phe Asn Gln Val Val Val Met Asn Ser Val Gly Asn

    1190                1195                1200

Asn Cys Thr Met Asn Phe Lys Asn Asn Asn Gly Asn Asn Ile Gly

    1205                1210                1215

Leu Leu Gly Phe Lys Ala Asp Thr Val Val Ala Ser Thr Trp Tyr

    1220                1225                1230

Tyr Thr His Met Arg Asp Asn Thr Asn Ser Asn Gly Phe Phe Trp

    1235                1240                1245

Asn Phe Ile Ser Glu Glu His Gly Trp Gln Glu Lys Thr Arg Ser

    1250                1255                1260

His His His His His His

    1265

<210>17

<211>1116

<212>DNA

<213>铜绿假单胞菌(Pseudomonas aeruginosa)

<400>17

atgggcagcc tggccgcgct gaccgcgcac caggcttgcc acagagggat aataacttct     60

aaaactaaat cattagttcc gcgtggatcc aaggccctgg agcagtgcgg gtacccggtg    120

cagcggctgg tcgccctcta cctggcggcg cggctgtcgt ggaaccaggt cgaccaggtg    180

atccgcaacg ccctggccag ccccggcagc ggcggcgacc tgggcgaagc gatccgcgag    240

cagccggagc aggcccgtct ggccctgacc ctggccgccg ccgagagcga gcgcttcgtc    300

cggcagggca ccggcaacga cgaggccggc gcggccaacg ccgacgtggt gagcctgacc    360

tgcccggtcg ccgccggtga atgcgcgggc ccggcggaca gcggcgacgc cctgctggag    420

cgcaactatc ccactggcgc ggagttcctc ggcgacggcg gcgacgtcag cttcagcacc    480

cgcggcacgc agaactggac ggtggagcgg ctgctccagg cgcaccgcca actggaggag    540

cgcggctatg tgttcgtcgg ctaccacggc accttcctcg aagcggcgca aagcatcgtc    600

ttcggcgggg tgcgcgcgcg cagccaggac ctcgacgcga tctggcgcgg tttctatatc    660

gccggcgatc cggcgctggc ctacggctac gcccaggacc aggaacccga cgcacgcggc    720

cggatccgca acggtgccct gctgcgggtc tatgtgccgc gctcgagcct gccgggcttc    780

taccgcacca gcctgaccct ggccgcgccg gaggcggcgg gcgaggtcga acggctgatc    840

ggccatccgc tgccgctgcg cctggacgcc atcaccggcc ccgaggagga aggcgggcgc    900

ctggagacca ttctcggctg gccgctggcc gagcgcaccg tggtgattcc ctcggcgatc    960

cccaccgacc cgcgcaacgt cggcggcgac ctcgacccgt ccagcatccc cgacaaggaa   1020

caggcgatca gcgccctgcc ggactacgcc agccagcccg gcaaaccgcc gcgcgaggac   1080

ctgacgcgtc tcgagcacca ccaccaccac cactaa                             1116

<210>18

<211>371

<212>PRT

<213>铜绿假单胞菌(Pseudomonas aeruginosa)

<400>18

Met Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His Arg Gly

1               5                   10                  15

Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys Ala

            20                  25                  30

Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr Leu

        35                  40                  45

Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Arg Asn Ala

    50                  55                  60

Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg Glu

65                  70                  75                  80

Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu Ser

                85                  90                  95

Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly Ala Ala

            100                 105                 110

Asn Ala Asp Val Val Ser Leu Thr Cys Pro Val Ala Ala Gly Glu Cys

        115                 120                 125

Ala Gly Pro Ala Asp Ser Gly Asp Ala Leu Leu Glu Arg Asn Tyr Pro

    130                 135                 140

Thr Gly Ala Glu Phe Leu Gly Asp Gly Gly Asp Val Ser Phe Ser Thr

145                 150                 155                 160

Arg Gly Thr Gln Asn Trp Thr Val Glu Arg Leu Leu Gln Ala His Arg

                165                 170                 175

Gln Leu Glu Glu Arg Gly Tyr Val Phe Val Gly Tyr His Gly Thr Phe

            180                 185                 190

Leu Glu Ala Ala Gln Ser Ile Val Phe Gly Gly Val Arg Ala Arg Ser

        195                 200                 205

Gln Asp Leu Asp Ala Ile Trp Arg Gly Phe Tyr Ile Ala Gly Asp Pro

    210                 215                 220

Ala Leu Ala Tyr Gly Tyr Ala Gln Asp Gln Glu Pro Asp Ala Arg Gly

225                 230                 235                 240

Arg Ile Arg Asn Gly Ala Leu Leu Arg Val Tyr Val Pro Arg Ser Ser

                245                 250                 255

Leu Pro Gly Phe Tyr Arg Thr Ser Leu Thr Leu Ala Ala Pro Glu Ala

            260                 265                 270

Ala Gly Glu Val Glu Arg Leu Ile Gly His Pro Leu Pro Leu Arg Leu

        275                 280                 285

Asp Ala Ile Thr Gly Pro Glu Glu Glu Gly Gly Arg Leu Glu Thr Ile

    290                 295                 300

Leu Gly Trp Pro Leu Ala Glu Arg Thr Val Val Ile Pro Ser Ala Ile

305                 310                 315                 320

Pro Thr Asp Pro Arg Asn Val Gly Gly Asp Leu Asp Pro Ser Ser Ile

                325                 330                 335

Pro Asp Lys Glu Gln Ala Ile Ser Ala Leu Pro Asp Tyr Ala Ser Gln

            340                 345                 350

Pro Gly Lys Pro Pro Arg Glu Asp Leu Thr Arg Leu Glu His His His

        355                 360                 365

His His His

    370

<210>19

<211>1215

<212>DNA

<213>白喉棒杆菌(Corynebacterium diphtheriae)

<400>19

atggctgatg atgttgttga ttcttctaaa tcttttgtga tggaaaactt ttcttcgtac     60

cacgggacta aacctggtta tgtagattcc attcaaaaag gtatacaaaa gccaaaatct    120

ggtacacaag gaaattatga cgatgattgg aaagggtttt atagtaccga caataaatac    180

gacgctgcgg gatactctgt agataacgaa aacccgctct ctggaaaagc tggaggcgtg    240

gtcaaagtga cgtatccagg actgacgaag gtcctcgcac taaaagtgga taatgccgaa    300

actattaaga aagagttagg tttaagtctc actgaaccgt tgatggagca agtcggaaca    360

gaagagttta tcaaaaggtt cggggatggt gcttcgcgtg tagtactcag ccttcccttt    420

gccgagggga gttctagcgt cgaatatatt aataactggg aacaggcgaa agcgttaagc    480

gtagaacttg agattaattt tgaaacccgt ggaaaacgtg gccaagatgc gatgtatgag    540

tatatggctc aagcctgtgc aagagggata ataacttcta aaactaaatc attggttcca    600

cgtggatcca aggccttgtc atgcataaat cttgattggg atgtcataag ggataaaact    660

aagacaaaga tagagtcttt gaaagagcat ggccctatca aaaataaaat gagcgaaagt    720

cccaataaaa cagtatctga ggaaaaagct aaacaatacc tagaagaatt tcatcaaacc    780

gcattagagc atcctgaatt gtcagaactt aaaaccgtta ctgggaccaa tcctcttttc    840

gctggggcta actatgcggc gtgggcagta aacgttgcgc aagttatcga tagcgaaaca    900

gctgataatt tggaaaagac aactgctgct ctttcgatac ttcctggtat cggtagcgta    960

atgggcattg cagacggtgc cgttcaccac aatacagaag agatagtggc acaatcaata   1020

gctttatcgt ctttaatggt tgctcaagct attccattgg taggagagct agttgatatt   1080

ggtttcgctg catataattt tgtagagagt attatcaatt tgtttcaagt agttcataat   1140

tcgtataatc gtcccgcgta ttctccgggg cataaaacgc aaccatttct cgagcaccac   1200

caccaccacc actaa                                                    1215

<210>20

<211>404

<212>PRT

<213>白喉棒杆菌(Corynebacterium diphtheriae)

<400>20

Met Ala Asp Asp Val Val Asp Ser Ser Lys Ser Phe Val Met Glu Asn

1               5                   10                  15

Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr Val Asp Ser Ile Gln

            20                  25                  30

Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln Gly Asn Tyr Asp Asp

        35                  40                  45

Asp Trp Lys Gly Phe Tyr Ser Thr Asp Asn Lys Tyr Asp Ala Ala Gly

    50                  55                  60

Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly Lys Ala Gly Gly Val

65                  70                  75                  80

Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val

                85                  90                  95

Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu

            100                 105                 110

Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly

        115                 120                 125

Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser

    130                 135                 140

Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser

145                 150                 155                 160

Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln Asp

                165                 170                 175

Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Arg Gly Ile Ile Thr

            180                 185                 190

Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys Ala Leu Ser Cys

        195                 200                 205

Ile Asn Leu Asp Trp Asp Val Ile Arg Asp Lys Thr Lys Thr Lys Ile

    210                 215                 220

Glu Ser Leu Lys Glu His Gly Pro Ile Lys Asn Lys Met Ser Glu Ser

225                 230                 235                 240

Pro Asn Lys Thr Val Ser Glu Glu Lys Ala Lys Gln Tyr Leu Glu Glu

                245                 250                 255

Phe His Gln Thr Ala Leu Glu His Pro Glu Leu Ser Glu Leu Lys Thr

            260                 265                 270

Val Thr Gly Thr Asn Pro Val Phe Ala Gly Ala Asn Tyr Ala Ala Trp

        275                 280                 285

Ala Val Asn Val Ala Gln Val Ile Asp Ser Glu Thr Ala Asp Asn Leu

    290                 295                 300

Glu Lys Thr Thr Ala Ala Leu Ser Ile Leu Pro Gly Ile Gly Ser Val

305                 310                 315                 320

Met Gly Ile Ala Asp Gly Ala Val His His Asn Thr Glu Glu Ile Val

                325                 330                 335

Ala Gln Ser Ile Ala Leu Ser Ser Leu Met Val Ala Gln Ala Ile Pro

            340                 345                 350

Leu Val Gly Glu Leu Val Asp Ile Gly Phe Ala Ala Tyr Asn Phe Val

        355                 360                 365

Glu Ser Ile Ile Asn Leu Phe Gln Val Val His Asn Ser Tyr Asn Arg

    370                 375                 380

Pro Ala Tyr Ser Pro Gly His Lys Thr Gln Pro Phe Leu Glu His His

385                 390                 395                 400

His His His His

<210>21

<211>1650

<212>DNA

<213>蓖麻(Ricinus communis)

<400>21

atggtcccca aacaataccc aattataaac tttaccacag cgggtgccac tgtgcaaagc     60

tacacaaact ttatcagagc tgttcgcggt cgtttaacaa ctggagctga tgtgagacat    120

gatataccag tgttgccaaa cagagttggt ttgcctataa accaacggtt tattttagtt    180

gaactctcaa atcatgcaga gctttctgtt acattagccc tggatgtcac caatgcatat    240

gtggtcggct accgtgctgg aaatagcgca tatttctttc atcctgacaa tcaggaagat    300

gcagaagcaa tcactcatct tttcactgat gttcaaaatc gatatacatt cgcctttggt    360

ggtaattatg atagacttga acaacttgct ggtaatctga gagaaaatat cgagttggga    420

aatggtccac tagaggaggc tatctcagcg ctttattatt acagtactgg tggcactcag    480

cttccaactc tggctcgttc ctttataatt tgcatccaaa tgatttcaga agcagcaaga    540

ttccaatata ttgagggaga aatgcgcacg agaattaggt acaaccggag atctgcacca    600

gatcctagcg taattacact tgagaatagt tgggggagac tttccactgc aattcaagag    660

tctaaccaag gagcctttgc tagtccaatt caactgcaaa gacgtaatgg ttccaaattc    720

agtgtgtacg atgtgagtat attaatccct atcatagctc tcatggtgta tagatgcgca    780

cctcctaggg ggataataac ttctaaaact aaatcattgg ttccacgtgg atccaaggct    840

gatgtttgta tggatcctga gcccatagtg cgtatcgtag gtcgaaatgg tctatgtgtt    900

gatgttaggg atggaagatt ccacaacgga aacgcaatac agttgtggcc atgcaagtct    960

aatacagatg caaatcagct ctggactttg aaaagagaca atactattcg atctaatgga   1020

aagtgtttaa ctacttacgg gtacagtccg ggagtctatg tgatgatcta tgattgcaat   1080

actgctgcaa ctgatgccac ccgctggcaa atatgggata atggaaccat cataaatccc   1140

agatctagtc tagttttagc agcgacatca gggaacagtg gtaccacact tacggtgcaa   1200

accaacattt atgccgttag tcaaggttgg cttcctacta ataatacaca accttttgtt   1260

acaaccattg ttgggctata tggtctgtgc ttgcaagcaa atagtggaca agtatggata    1320

gaggactgta gcagtgaaaa ggctgaacaa cagtgggctc tttatgcaga tggttcaata    1380

cgtcctcagc aaaaccgaga taattgcctt acaagtgatt ctaatatacg ggaaacagtt    1440

gttaagatcc tctcttgtgg ccctgcatcc tctggccaac gatggatgtt caagaatgat    1500

ggaaccattt taaatttgta tagtggattg gtgttagatg tgaggcgatc ggatccgagc    1560

cttaaacaaa tcattcttta ccctctccat ggtgacccaa accaaatatg gttaccatta    1620

tttctcgagc accaccacca ccaccactaa                                     1650

<210>22

<211>549

<212>PRT

<213>蓖麻(Ricinus communis)

<400>22

Met Val Pro Lys Gln Tyr Pro Ile Ile Asn Phe Thr Thr Ala Gly Ala

1               5                   10                  15

Thr Val Gln Ser Tyr Thr Asn Phe Ile Arg Ala Val Arg Gly Arg Leu

            20                  25                  30

Thr Thr Gly Ala Asp Val Arg His Asp Ile Pro Val Leu Pro Asn Arg

        35                  40                  45

Val Gly Leu Pro Ile Asn Gln Arg Phe Ile Leu Val Glu Leu Ser Asn

    50                  55                  60

His Ala Glu Leu Ser Val Thr Leu Ala Leu Asp Val Thr Asn Ala Tyr

65                  70                  75                  80

Val Val Gly Tyr Arg Ala Gly Asn Ser Ala Tyr Phe Phe His Pro Asp

                85                  90                  95

Asn Gln Glu Asp Ala Glu Ala Ile Thr His Leu Phe Thr Asp Val Gln

            100                 105                 110

Asn Arg Tyr Thr Phe Ala Phe Gly Gly Asn Tyr Asp Arg Leu Glu Gln

        115                 120                 125

Leu Ala Gly Asn Leu Arg Glu Asn Ile Glu Leu Gly Asn Gly Pro Leu

    130                 135                 140

Glu Glu Ala Ile Ser Ala Leu Tyr Tyr Tyr Ser Thr Gly Gly Thr Gln

145                 150                 155                 160

Leu Pro Thr Leu Ala Arg Ser Phe Ile Ile Cys Ile Gln Met Ile Ser

                165                 170                 175

Glu Ala Ala Arg Phe Gln Tyr Ile Glu Gly Glu Met Arg Thr Arg Ile

            180                 185                 190

Arg Tyr Asn Arg Arg Ser Ala Pro Asp Pro Ser Val Ile Thr Leu Glu

        195                 200                 205

Asn Ser Trp Gly Arg Leu Ser Thr Ala Ile Gln Glu Ser Asn Gln Gly

    210                 215                 220

Ala Phe Ala Ser Pro Ile Gln Leu Gln Arg Arg Asn Gly Ser Lys Phe

225                 230                 235                 240

Ser Val Tyr Asp Val Ser Ile Leu Ile Pro Ile Ile Ala Leu Met Val

                245                 250                 255

Tyr Arg Cys Ala Pro Pro Arg Gly Ile Ile Thr Ser Lys Thr Lys Ser

            260                 265                 270

Leu Val Pro Arg Gly Ser Lys Ala Asp Val Cys Met Asp Pro Glu Pro

        275                 280                 285

Ile Val Arg Ile Val Gly Arg Asn Gly Leu Cys Val Asp Val Arg Asp

    290                 295                 300

Gly Arg Phe His Asn Gly Asn Ala Ile Gln Leu Trp Pro Cys Lys Ser

305                 310                 315                 320

Asn Thr Asp Ala Asn Gln Leu Trp Thr Leu Lys Arg Asp Asn Thr Ile

                325                 330                 335

Arg Ser Asn Gly Lys Cys Leu Thr Thr Tyr Gly Tyr Ser Pro Gly Val

            340                 345                 350

Tyr Val Met Ile Tyr Asp Cys Asn Thr Ala Ala Thr Asp Ala Thr Arg

        355                 360                 365

Trp Gln Ile Trp Asp Asn Gly Thr Ile Ile Asn Pro Arg Ser Ser Leu

    370                 375                 380

Val Leu Ala Ala Thr Ser Gly Asn Ser Gly Thr Thr Leu Thr Val Gln

385                 390                 395                 400

Thr Asn Ile Tyr Ala Val Ser Gln Gly Trp Leu Pro Thr Asn Asn Thr

                405                 410                 415

Gln Pro Phe Val Thr Thr Ile Val Gly Leu Tyr Gly Leu Cys Leu Gln

            420                 425                 430

Ala Asn Ser Gly Gln Val Trp Ile Glu Asp Cys Ser Ser Glu Lys Ala

        435                 440                 445

Glu Gln Gln Trp Ala Leu Tyr Ala Asp Gly Ser Ile Arg Pro Gln Gln

    450                 455                 460

Asn Arg Asp Asn Cys Leu Thr Ser Asp Ser Asn Ile Arg Glu Thr Val

465                 470                 475                 480

Val Lys Ile Leu Ser Cys Gly Pro Ala Ser Ser Gly Gln Arg Trp Met

                485                 490                 495

Phe Lys Asn Asp Gly Thr Ile Leu Asn Leu Tyr Ser Gly Leu Val Leu

            500                 505                 510

Asp Val Arg Arg Ser Asp Pro Ser Leu Lys Gln Ile Ile Leu Tyr Pro

        515                 520                 525

Leu His Gly Asp Pro Asn Gln Ile Trp Leu Pro Leu Phe Leu Glu His

    530                 535                 540

His His His His His

545

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号