首页> 中国专利> 包含植物内生产之血凝素的流感病毒样颗粒(VLP)

包含植物内生产之血凝素的流感病毒样颗粒(VLP)

摘要

本发明提供了在植物或植物部分内合成流感病毒样颗粒(influenzavirus-like particle,VLP)的方法。所述方法包括在植物中表达流感HA并通过体积排阻色谱进行纯化。本发明还涉及包含流感HA蛋白和植物脂质的VLP。本发明还涉及编码流感HA的核酸以及载体。所述VLP可用于配制流感疫苗,或者可用于充实现有的疫苗。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-10-30

    授权

    授权

  • 2010-12-22

    实质审查的生效 IPC(主分类):C12N15/82 申请日:20080711

    实质审查的生效

  • 2010-11-10

    公开

    公开

说明书

技术领域

本发明涉及病毒样颗粒的生产。更具体而言,本发明涉及包含流感抗原的病毒样颗粒的生产。

背景技术

流感是人中由于呼吸道病毒引起的死亡的首要原因。常见的症状包括发热、喉咙疼痛、气短和肌肉酸痛等。在流感季节,流感病毒感染全世界10~20%的人口,每年导致250~500,000人死亡。

流感病毒是从哺乳动物受感染细胞质膜出芽的包膜病毒。根据所存在的核蛋白和基质蛋白抗原,流感病毒分为A型、B型或C型。根据所存在的血凝素(HA)和神经氨酸酶(NA)表面糖蛋白的组合,A型流感病毒可进一步分成若干亚型。HA支配病毒与宿主细胞结合以及穿入宿主细胞的能力。NA从宿主细胞和病毒表面蛋白的聚糖链上除去末端唾液酸残基,这防止病毒聚集并有利于病毒运动。目前,已鉴定出16种HA(H1-H16)和9种NA(N1-N9)亚型。每种A型流感病毒具有一种HA糖蛋白类型和一种NA糖蛋白类型。一般而言,每种亚型均表现出物种特异性;例如,已知所有HA和NA亚型均感染鸟类,而只有H1、H2、H3、H5、H7、H9、H10、N1、N2、N3和N7显示感染人类(Horimoto 2006;Suzuki 2005)。含有H5、H7和H9的流感病毒被认为是致病性最强的A型流感病毒形式,并且最有可能引起将来的大流行。

流感大流行通常由高传播性且致病性强的流感病毒引起,并可导致全球性疾病和死亡水平升高。在20世纪,新的A型流感亚型的出现导致四次主要的大流行。1918~1919年由H1N1病毒引起的西班牙流感在1917年至1920年之间导致世界范围内超过五千万人死亡。当前,新亚型出现的风险或者动物中特有的亚型向人传播的风险总是存在。特别受到关注的是高致病性形式的禽流感(也称作“鸟流感”),据报道其已经在全世界若干国家爆发。在许多情形下,该禽流感可在48小时内导致接近100%的死亡率。据推测,1997年在香港首次鉴定的禽流感病毒(H5N1)向其它亚洲国家和欧洲的传播与野生鸟类的迁徙模式有关。

目前对抗人中流感的方法是每年接种疫苗。疫苗通常是预测为即将到来之“流感季节”强势毒株(dominant strain)的几种毒株的组合。所述预测由世界卫生组织来协调完成。一般而言,每年生产的疫苗剂量数不足以接种全世界的人群。例如,加拿大和美国获得足以免疫其约三分之一人口的疫苗剂量,而欧盟仅有17%的人口可接种疫苗。很显然,在世界范围的流感大流行到来时,目前全世界的流感疫苗生产不能满足需求。即使所需的年产量在给定年份中可以某种方式实现,然而强势毒株每年都在变化,因此在一年的低需求时间大量储备是不切实际的。经济地、大规模地生产有效流感疫苗是政府和私营企业等非常关心的。

用于疫苗中的病毒储液是在受精的蛋中生产的。收获病毒颗粒,为了得到灭活病毒疫苗,通过去污剂干扰进行灭活。减毒活疫苗由适于在低温下生长的流感病毒制备,这意味着在正常体温下所述疫苗的毒力减弱。这样的疫苗在美国被批准用于5~49岁的个体。全病毒灭活疫苗是通过化学试剂灭活而变为无害的,并且其已在胚蛋或哺乳动物细胞培养物中生产。所有这些类型的疫苗都显示出一些特定的优点和缺点。全病毒来源之疫苗的一个优点是这种疫苗所引起的免疫类型。通常,裂解型疫苗诱导强的抗体应答,而由全病毒制得的疫苗诱导抗体(体液)应答和细胞应答。尽管功能性抗体应答是与疫苗诱导的保护作用相关的获批标准,然而越来越多的证据表明T细胞应答对流感免疫也很重要,其还可为老年人提供更好的保护。

为了诱导细胞免疫应答,开发了由全病毒制得的疫苗。由于流感毒株(例如H5N1)的高致病性,因此在BL3+设备中生产这些疫苗。对于高致病性流感毒株(例如H5N1)来说,为了降低流感毒株的致病性、使其无毒且更容易在胚蛋或哺乳动物细胞培养物中生产,一些制造商对血凝素的基因序列进行了修饰。另一些人还使用重排列(reassortant)流感株,其中血凝素和神经氨酸酶蛋白的基因序列被克隆进高产量、低致病性的流感供体株(A/PR/8/34;Quan F-S等,2007)中。尽管这些方法可产生有用的疫苗,但是它们不能提供以满足正常年份全球需求的所需规模来大量、低成本及快速生产疫苗的解决方法,并且当大流行到来时几乎必然地不能满足需求。

利用该反向遗传技术,还可能需要对HA蛋白的基因序列进行突变以使其无毒。就高致病性流感株而言,全病毒疫苗的生产需要防护(confinement)程序或者所得疫苗不与循环病毒的基因序列完全匹配。在减毒活疫苗的情形中,仍存在所施用的疫苗可与来自宿主的流感病毒重组而产生新流感病毒的风险。

尽管该方法保持了抗原表位和翻译后修饰,但是该方法存在许多缺点,包括由于使用全病毒而引起的污染风险以及取决于病毒株的可变的产量。亚最佳水平的保护可由以下原因导致:由于将病毒引入蛋中而引起的病毒遗传异质性。其它缺点包括为了获得蛋而进行大量计划,由于在纯化中使用的化学品引起的污染风险以及生产时间长。此外,对蛋中蛋白质过敏的人可能不适于接种所述疫苗。

在大流行的情形中,裂解型疫苗的生产受到需要使毒株适于在蛋中生长以及所得产量不同的限制。尽管此技术用于生产季节性疫苗已使用了多年,但是它很难在合理的时间范围内响应于大流行,并且世界范围的生产能力有限。

为了避免使用蛋,已经在哺乳动物细胞培养物中(例如在MDCK或PERC.6细胞等中)生产流感病毒。另一种方法是反向遗传方法,其中通过用病毒基因转化细胞来生产病毒。然而,这些方法也需要使用全病毒以及精准的方法和特定的培养环境。

已开发了几种作为候选重组流感疫苗的重组产物。这些方法关注A型流感病毒HA和NA蛋白的表达、制备以及纯化,包括利用杆状病毒感染的昆虫细胞(Crawford等,1999;Johansson,1999)、病毒载体和DNA疫苗构建体(Olsen等,1997)来表达这些蛋白质。

流感病毒感染的特异性是公知的。简言之,感染循环是从病毒体表面HA蛋白与含有唾液酸的细胞受体(糖蛋白和糖脂)结合开始的。NA蛋白介导对唾液酸受体的处理,病毒穿入细胞则取决于HA依赖性受体介导的内吞作用。在含有流感病毒体的内化内涵体的酸性界限内,HA蛋白发生构象变化,这导致病毒与细胞膜融合,病毒脱壳以及M2介导的从核衣壳相关核糖核蛋白(RNP)释放M1蛋白,M1蛋白迁移到细胞核内用于病毒RNA合成。抗HA蛋白的抗体通过中和病毒感染性来预防病毒感染,而抗NA蛋白的抗体介导其对病毒复制早期步骤的作用。

Crawford等(1999)公开了流感病毒HA在杆状病毒感染的昆虫细胞中的表达。所表达的蛋白质被描述为能够预防由禽类H5和H7流感亚型引起的致命性流感疾病。Johansson等(1999)教导了杆状病毒表达的流感病毒HA和NA蛋白在动物中诱导了优于常规疫苗所诱导之应答的免疫应答。杆状病毒表达的马流感病毒血凝素的免疫原性和效力可与同源DNA候选疫苗相比较(Olsen等,1997)。总之,这些数据表明,使用多种实验方法以及在不同动物模型中,可利用重组HA或NA蛋白诱导针对流感病毒攻击的高度保护。

由于先前的研究已显示表面流感病毒糖蛋白HA和NA是用于诱导针对流感病毒之保护性免疫的主要靶标,并且M1提供了用于流感病毒之细胞免疫的保守性靶标,所以新的候选疫苗可包含作为蛋白质大分子颗粒(例如病毒样颗粒(VLP))的这些病毒抗原。作为疫苗产品,VLP提供了如下优点:比亚基或重组抗原更强的免疫原性,能刺激体液和细胞免疫应答(Grgacic和Anderson,2006)。此外,含有这些流感抗原的颗粒可展示出构象表位,其诱导针对多种流感病毒株的中和抗体。

生产用于疫苗目的的非感染性流感病毒株是避免发生意外感染的一种方法。作为替代,已研究出用作培养病毒之替代物的病毒样颗粒(VLP)。VLP模拟病毒衣壳的结构,但缺少基因组,因此不能复制或提供二次感染的机会。

一些研究表明,使用哺乳动物表达质粒或杆状病毒载体,重组流感病毒蛋白在细胞培养物中自组装成VLP(Gomez-Puertas等,1999;Neumann等,2000;Latham和Galarza,2001)。Gomez-Puertas等(1999)公开了流感病毒VLP的有效形成取决于几种病毒蛋白质的表达水平。Neumann等(2000)建立了基于哺乳动物表达质粒的系统,其用于完全从克隆cDNA产生感染性流感病毒样颗粒。Latham和Galarza(2001)报道了在用共表达HA、NA、M1和M2基因的重组杆状病毒感染的昆虫细胞中形成流感病毒VLP。这些研究表明,流感病毒体蛋白质可在真核细胞中共表达后进行自组装。

Gomez-Puertas等(2000)教导,除了血凝素(HA)以外,流感病毒的基质蛋白(M1)对于VLP从昆虫细胞出芽也是必需的。然而,Chen等(2007)教导了M1可能不是VLP形成所需的,并观察到M1和VLP的有效释放需要存在HA和由NA提供的唾液酸酶活性。NA切割产生VLP之细胞表面上的糖蛋白的唾液酸,并将VLP释放到介质中。

Quan等(2007)教导了在杆状病毒表达系统(昆虫细胞)中产生的VLP疫苗诱导针对某些流感病毒株(A/PR8/34(H1N1))的保护性免疫。经观察,Quan所研究的VLP从质膜出芽,并被认为具有合适的大小和形态,与在哺乳动物系统(MDCK系统)中得到的相似。

包膜病毒可在从感染细胞“出芽”时获得脂质包膜,并且从质膜获得膜,或者从内部细胞器的质膜获得膜。流感病毒颗粒和VLP从宿主细胞的质膜出芽。例如,在哺乳动物或杆状病毒细胞系统中,流感病毒从质膜出芽(Quan等,2007)。已知仅有少数包膜病毒感染植物(例如,番茄斑萎病毒属(Topovirus)和弹状病毒属(Rhabdovirus)的成员)。在已知的植物包膜病毒中,它们的特征在于从宿主细胞的内膜出芽,而不是从质膜出芽。虽然已在植物宿主中产生了少数的重组VLP,但是它们均非源自质膜,于是提出了这样的问题——是否可以在植物中生产质膜来源的VLP(包括流感病毒VLP)。

目前的流感病毒VLP生产技术依赖于多种病毒蛋白质的共表达,这种依赖性代表了这些技术的缺点,这是因为在全世界大流行和每年流行的情形中,反应时间对于疫苗接种来说是至关重要的。为了加快疫苗的开发,需要仅依赖于表达一种病毒蛋白质的更为简单的VLP生产体系。

为了保护全世界人口免于患流感并且击退将来的大流行,疫苗生产商需要开发有效的、快速的生产疫苗制剂的方法。目前使用受精的蛋生产疫苗不能满足需求,并且生产过程长。

发明内容

本发明的一个目的是提供改进的流感病毒样颗粒(VLP)。

本发明提供了核酸,其包含编码来自包膜病毒之抗原的核苷酸序列,所述核苷酸序列与在植物中有活性的调控区有效连接。所述抗原可以是流感病毒血凝素(HA)。

本发明还提供了在植物中生产流感病毒样颗粒(VLP)的方法,其包括:

a)将与在植物中有活性的调控区有效连接的、编码来自包膜病毒之抗原(例如流感病毒血凝素(HA))的核酸导入植物或其部分中,以及

b)在允许表达所述核酸的条件下培养所述植物或其部分,从而产生VLP。

所述方法还包括收获所述植物以及从所述植物组织中纯化或分离VLP的步骤。

本发明包括上述方法,其中在导入步骤(步骤a)中,所述核酸可在植物中瞬时表达或在植物中稳定表达。此外,可使用体积排阻色谱对VLP进行纯化。

本发明还提供了病毒样颗粒(VLP),其包含流感病毒HA蛋白以及一种或多种植物脂质。

此外,本发明还涉及组合物,其包含含有流感病毒HA蛋白的有效剂量VLP、一种或多种植物脂质以及可药用载体。

本发明还涉及在植物中形成VLP的HA蛋白片段或部分。

所述VLP可包含一种或多种亚型的HA蛋白,包括H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15或H16或者其片段或部分。含有这些HA蛋白的亚型的实例包括A/新喀里多尼亚/20/99(H1N1)、A/印度尼西亚/5/2006(H5N1)、A/鸡/纽约/1995、A/银鸥/DE/677/88(H2N8)、A/得克萨斯/32/2003、A/绿头鸭/MN/33/00、A/鸭/上海/1/2000、A/针尾鸭/TX/828189/02、A/火鸡/安大略/6118/68(H8N4)、A/琵嘴鸭/伊朗/G54/03、A/鸡/德国/N/1949(H10N7)、A/鸭/英格兰/56(H11N6)、A/鸭/阿尔伯达/60/76(H12N5)、A/鸥/马里兰/704/77(H13N6)、A/绿头鸭/Gurjev/263/82、A/鸭/澳大利亚/341/83(H15N8)、A/红嘴鸥/瑞典/5/99(H16N3)、B/Lee/40、C/约翰内斯堡/66、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛3/2006(H1N1)、A/布里斯班10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、B/马来西亚/2506/2004、B/佛罗里达/4/2006、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/马/布拉格/56(H7N7)、A/香港/1073/99(H9N2)。

在本发明的一个方面中,所述HA蛋白可以是H1、H2、H3、H5、H6、H7或H9亚型。在另一方面中,所述H1蛋白可来自A/新喀里多尼亚/20/99(H1N1)、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)或A/所罗门群岛3/2006(H1N1)株。所述H3蛋白可来自A/布里斯班10/2007(H3N2)或A/威斯康星/67/2005(H3N2)株。在本发明的又一方面中,所述H2蛋白可来自A/新加坡/1/57(H2N2)株。所述H5蛋白可来自A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)或A/印度尼西亚/5/2005株。在本发明的一个方面中,所述H6蛋白可来自A/水鸭/香港/W312/97(H6N1)株。所述H7蛋白可来自A/马/布拉格/56(H7N7)株。在本发明的一个方面中,所述H9蛋白来自A/香港/1073/99(H9N2)株。在本发明的又一方面中,所述HA蛋白可来自可以是B型病毒的流感病毒,包括B/马来西亚/2506/2004或B/佛罗里达/4/2006。来自H1、H2、H3、H5、H6、H7或H9亚型的HA蛋白的氨基酸序列的实例包括SEQ ID NO:48-59。

所述流感病毒HA蛋白可以是H5(印度尼西亚)。

本发明还提供了包含编码HA蛋白之序列的核酸分子。所述核酸分子还可包含与所述编码HA蛋白之序列有效连接的一个或多个调控区。所述核酸分子可包含编码H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15或H16的序列。在本发明的一个方面中,由所述核酸分子编码的HA蛋白可以是H1、H2、H3、H5、H6、H7或H9亚型。所述核酸分子编码的H1蛋白来自A/新喀里多尼亚/20/99(H1N1)、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)或A/所罗门群岛3/2006(H1N1)株。在本发明的一个方面中,所述核酸分子编码的H3蛋白可来自A/布里斯班10/2007(H3N2)或A/威斯康星/67/2005(H3N2)株。在本发明的又一方面中,所述核酸分子编码的H2蛋白可来自A/新加坡/1/57(H2N2)株。所述核酸分子编码的H5蛋白可来自A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)或A/印度尼西亚/5/2005株。在本发明的一个方面中,所述核酸分子编码的H6蛋白可来自A/水鸭/香港/W312/97(H6N1)株。所述核酸分子编码的H7蛋白可来自A/马/布拉格/56(H7N7)株。另外,所述核酸分子编码的H9蛋白可来自A/香港/1073/99(H9N2)株。编码来自H1、H2、H3、H5、H6、H7或H9亚型的这些HA蛋白的核酸分子序列的实例包括SEQID NO:36-47和60-73。

所述核酸序列可编码流感病毒HA蛋白H5(印度尼西亚)。

可与编码HA蛋白之序列有效连接的调控区包括在植物细胞、昆虫细胞或酵母细胞中可操作的调控区。这样的调控区可包括质体蓝素调控区、核酮糖-1,5-二磷酸羧化酶/加氧酶(Ribulose 1,5-bisphosphatecarboxylase/oxygenase,RuBisCO)调控区、叶绿素a/b结合蛋白(CAB)、ST-LS1、多角体蛋白调控区或gp64调控区。其它调控区包括5’UTR、3’UTR或终止子序列。所述质体蓝素调控区可以是苜蓿质体蓝素调控区;所述5’UTR、3’UTR或终止子序列也可以是苜蓿序列。

还提供了诱导对象中针对流感病毒感染之免疫的方法,该方法包括施用含有流感病毒HA蛋白、一种或多种植物脂质和可药用载体的病毒样颗粒。所述病毒样颗粒可经口、皮内、鼻内、肌内、腹膜内、静脉内或皮下施用给对象。

本发明还涉及病毒样颗粒(VLP),其包含源于选自流感病毒、麻疹病毒、埃博拉病毒、马尔堡病毒和HIV病毒之病毒的一种或多种蛋白质,以及源于非唾液酸化宿主生产细胞的一种或多种脂质。所述HIV蛋白可以是p24、gp120或gp41;所述埃博拉病毒蛋白可以是VP30或VP35;所述马尔堡病毒蛋白可以是Gp/SGP;所述麻疹病毒蛋白可以是H蛋白或F蛋白。

另外,本发明涉及含有流感病毒HA蛋白和一种或多种宿主脂质的病毒样颗粒(VLP)。例如,如果宿主是昆虫,那么所述病毒样颗粒(VLP)可包含流感病毒HA蛋白和一种或多种昆虫脂质,或者,如果宿主是酵母,那么所述病毒样颗粒(VLP)可包含流感病毒HA蛋白和一种或多种酵母脂质。

本发明还涉及组合物,其包含两种或更多种流感毒株或亚型的VLP。所述两种或更多种亚型或毒株可选自:A/新喀里多尼亚/20/99(H1N1)、A/印度尼西亚/5/2006(H5N1)、A/鸡/纽约/1995、A/银鸥/DE/677/88(H2N8)、A/得克萨斯/32/2003、A/绿头鸭/MN/33/00、A/鸭/上海/1/2000、A/针尾鸭/TX/828189/02、A/火鸡/安大略/6118/68(H8N4)、A/琵嘴鸭/伊朗/G54/03、A/鸡/德国/N/1949(H10N7)、A/鸭/英格兰/56(H11N6)、A/鸭/阿尔伯达/60/76(H12N5)、A/鸥/马里兰/704/77(H13N6)、A/绿头鸭/Gurjev/263/82、A/鸭/澳大利亚/341/83(H15N8)、A/红嘴鸥/瑞典/5/99(H16N3)、B/Lee/40、C/约翰内斯堡/66、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛3/2006(H1N1)、A/布里斯班10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、B/马来西亚/2506/2004、B/佛罗里达/4/2006、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/马/布拉格/56(H7N7)或A/香港/1073/99(H9N2)。所述两种或更多种亚型或毒株的VLP可以大致相等的量存在;或者,一种或多种亚型或毒株可以占所存在毒株或亚型的大部分。

本发明涉及诱导动物或靶标生物中针对流感病毒感染之免疫的方法,其包括施用含有一种或多种VLP的有效剂量疫苗,所述VLP是利用非唾液酸化宿主(例如植物宿主、昆虫宿主或酵母宿主)生产的。所述疫苗可经口、皮内、鼻内、肌内、腹膜内、静脉内或皮下施用。所述靶标生物可选自人、灵长类、马、猪、鸟(禽)类、水禽、候鸟、鹌鹑、鸭、鹅、家禽、鸡、骆驼、犬科动物、狗、猫科动物、猫、虎、豹、麝猫、水貂、石貂、雪貂、宠物、家畜、小鼠、大鼠、海豹、鲸等。

本发明提供了用于在能够生产VLP的合适宿主(例如植物、昆虫或酵母)中生产含有来自不同流感毒株之血凝素(HA)的VLP的方法。在植物中生产的VLP含有植物来源的脂质,在昆虫细胞中生产的VLP含有来自昆虫细胞质膜的脂质(通常称为“昆虫脂质”),在酵母中生产的VLP含有来自酵母细胞质膜的脂质(通常称为“酵母脂质”)。

与在昆虫细胞培养物中生产VLP相比,在植物中生产这些颗粒具有若干优点。植物脂质可刺激特异性免疫细胞并增强所诱导的免疫应答。植物的膜由脂质、磷脂酰胆碱(PC)和磷脂酰乙醇胺(PE)组成,并且还含有植物以及某些细菌和原生动物所特有的鞘糖脂。鞘脂类之所以不常见的原因是,它们不是甘油酯(例如PC或PE),而是由与含有18个以上碳的脂肪酸链形成酰胺连接的长链氨基醇组成。PC和PE以及鞘糖脂可结合哺乳动物免疫细胞(例如抗原呈递细胞(APC),如树突状细胞和巨噬细胞)和另一些细胞(包括胸腺和肝脏中的B淋巴细胞和T淋巴细胞))中表达的CD1分子(Tsuji M,.2006)。此外,除了植物脂质的存在具有潜在的佐剂作用以外,植物N-聚糖促进抗原呈递细胞捕获糖蛋白抗原的能力(Saint-Jore-Dupas,2007)也可能是在植物中生产VLP的优点。

不希望受理论限制,预计由植物生产的VLP会比在其它生产体系中制得的VLP诱导出更强的免疫反应,并且与活的或减毒的全病毒疫苗诱导的免疫反应相比,由这些植物生产的VLP诱导的免疫反应会更强。

与由全病毒制得的疫苗相比,VLP具有优势,这是因为它们无感染性,因此限制性生物防范问题不再像使用感染性全病毒时那么重要,并且不是生产所必需的。由植物生产的VLP的另一优点是,允许表达系统生长在温室或田间,从而具有更显著的经济效益并适于扩大规模。

另外,植物不含有参与合成唾液酸残基以及将唾液酸残基添加到蛋白质中的酶。VLP的生产可以不需要神经氨酸酶(NA),并且不需要共表达NA或者用唾液酸酶(神经氨酸酶)处理生产细胞或提取物以确保在植物中生产VLP。

根据本发明生产的VLP不包含已知与RNA结合的M1蛋白。RNA是VLP制备物中的污染物,其在VLP产品获得监管部门审批时是不期望的。

所述发明内容不必然描述本发明的所有特征。

附图说明

通过以下描述以及参考附图,本发明的这些和其它特征会更加明显,其中:

图1A显示根据本发明的一个实施方案用于表达H1的基于苜蓿质体蓝素之表达盒的序列(SEQ ID NO:8)。下划线标示蛋白质二硫键异构酶(protein disulfide isomerase,PDI)信号肽。粗体显示用于克隆的BglII(AGATCT)和SacI(GAGCTC)限制性位点。图1B显示流感病毒血凝素的功能结构域的示意图。切割HA0后,HA1和HA2片段仍通过二硫桥结合在一起。

图2A显示被组装用于表达HA之H1亚型的质粒540的示意图。图2B显示被组装用于表达HA之H5亚型的质粒660的示意图。

图3显示来自产生血凝素H1或H5的叶的蛋白质提取物的体积排阻色谱。图3A显示H1的洗脱模式;Blue Dextran 2000(三角形)和蛋白质(菱形)。图3B显示在体积排阻色谱(S500HR珠)后H1洗脱级分的免疫检测(Western印迹;抗H1抗体)。图3C显示H5的洗脱模式;Blue Dextran 2000(三角形)和蛋白质(菱形)。图3D显示在体积排阻色谱(S500HR珠)后H5洗脱级分的免疫检测(Western印迹;抗H5抗体)。

图4显示来自体积排阻柱洗脱级分9的大的血凝素H1和H5结构的电子显微镜显微照片。图4A显示对来自H1的VLP放大50000倍,显示出存在多个相似的结构(比例尺表示200nm)。图4B显示对来自H1的VLP放大150000倍(比例尺表示100nm)。图4C显示对来自H5的VLP放大50000倍,显示出存在多个相似的结构(比例尺表示50nm)。

图5A显示H1的N末端片段序列(SEQ ID NO:1)。图5B显示H1的C末端片段(SEQ ID NO:2)。图5C显示编码H1的HA0的全长序列(SEQ ID NO:28)。

图6显示编码H5的序列,其侧翼为紧邻起始ATG上游的HindIII位点以及紧邻终止密码子(TAA)下游的SacI位点(SEQ ID NO:3)。

图7A显示引物Plasto-443c的序列(SEQ ID NO:4)。图7B显示引物SpHA(Ind)-Plasto.r的序列(SEQ ID NO:5)。图7C显示引物Plasto-SpHA(Ind).c的序列(SEQ ID NO:6)。图7D显示引物HA(Ind)-Sac.r的序列(SEQ ID NO:7)。

图8A显示HA1肽序列的氨基酸序列(SEQ ID NO:9)。图8B显示HA5肽序列的氨基酸序列(SEQ ID NO:10)。粗体指示天然信号肽。

图9显示A型流感病毒H7亚型的HA序列(SEQ ID NO:11)。

图10A显示A型流感病毒HA的H2亚型序列(SEQ ID NO:12)。图10B显示A型流感病毒HA的H3亚型序列(SEQ ID NO:13)。图10C显示A型流感病毒HA的H4亚型序列(SEQ ID NO:14)。图10D显示A型流感病毒HA的H5亚型序列(SEQ ID NO:15)。图10E显示A型流感病毒HA的H6亚型序列(SEQ ID NO:16)。图10F显示A型流感病毒HA的H8亚型序列(SEQ ID NO:17)。图10G显示A型流感病毒HA的H9亚型序列(SEQ ID NO:18)。图10H显示A型流感病毒HA的H10亚型序列(SEQ ID NO:19)。图10I显示A型流感病毒HA的H11亚型序列(SEQ ID NO:20)。图10J显示A型流感病毒HA的H12亚型序列(SEQ ID NO:21)。图10K显示A型流感病毒HA的H13亚型序列(SEQ ID NO:22)。图10L显示A型流感病毒HA的H14亚型序列(SEQ ID NO:23)。图10M显示A型流感病毒HA的H15亚型序列(SEQ ID NO:24)。图10N显示A型流感病毒HA的H16亚型序列(SEQ ID NO:25)。图10O显示B型流感病毒的HA序列(SEQID NO:26)。图10P显示C型流感病毒的HA序列(SEQ ID NO:27)。图10Q显示引物XmaI-pPlas.c的序列(SEQ ID NO:29)。图10R显示引物SacI-ATG-pPlas.r的序列(SEQ ID NO:30)。图10S显示引物SacI-PlasTer.c的序列(SEQ ID NO:31)。图10T显示引物EcoRI-PlasTer.r的序列(SEQ ID NO:32)。

图11显示本文使用的几种构建体的示意图。构建体660包含与质体蓝素启动子(Plasto)和终止子(Pter)有效连接的编码HA之H5亚型的核苷酸序列;构建体540包含编码HA的H1亚型连同苜蓿蛋白质二硫键异构酶信号肽(SP PDI)的核苷酸序列,并且其与质体蓝素启动子(Plasto)和终止子(Pter)有效连接;构建体544被组装用于表达HA的H1亚型,编码H1的核苷酸序列与苜蓿蛋白质二硫键异构酶信号肽(SP PDI)和GCN4pII亮氨酸拉链(替代H1的跨膜结构域和胞质尾)相组合并与质体蓝素启动子(Plasto)和终止子(Pter)有效连接;用于表达流感A/PR/8/34之M1编码区的构建体750与烟草蚀纹病毒(tobacco etch virus,TEV)的5’UTR相组合,并与双35S启动子和Nos终止子有效连接。

图12显示使用抗H5(越南)抗体对用构建体660转化的本塞姆氏烟草(N.benthamiana)叶蛋白质提取物中的H5进行免疫检测(泳道3)。使用来自流感病毒A/越南/1203/2004的市售H5作为检测的阳性对照(泳道1),用空载体转化的叶蛋白质提取物用作阴性对照(泳道2)。

图13显示通过体积排阻色谱对血凝素结构进行表征。利用S-500HR通过凝胶过滤分离来自产生H5、H1、可溶性H1或H1以及M1之各生物质的蛋白质提取物。还对市售的玫瑰花结形式的H1进行分级分离(H1玫瑰花结)。图13A显示用于分析相对蛋白质含量的洗脱级分(相对蛋白质水平——显示生物质分级分离的标准蛋白质洗脱模式)。标出了Blue Dextran 2000(2MDa标准参照物)的洗脱峰。图13B显示通过使用抗H5(越南)抗体(针对H5)进行免疫印迹用于分析洗脱级分中的血凝素存在情况。图13C显示用于分析针对H1之抗A型流感病毒抗体的洗脱级分。图13D显示用于分析针对可溶性H1之抗A型流感病毒抗体的洗脱级分。图13E显示用于分析针对H1玫瑰花结之抗A型流感病毒抗体的洗脱级分。图13F显示用于分析针对H1+M1之抗A型流感病毒抗体的洗脱级分。

图14显示通过蔗糖梯度离心浓缩流感病毒H5结构以及对血凝素浓缩级分进行电子显微镜检查。图14A显示由蔗糖密度梯度离心得到的级分的表征。通过利用抗H5(越南)抗体进行免疫印迹(上图)分析每一级分中H5的存在及其相对蛋白质含量和血细胞凝集能力(曲线图)。图14B显示来自蔗糖梯度离心的合并级分17、18和19的负染色透射电子显微镜检查。比例尺表示100nm。

图15显示流感病毒H5VLP的纯化。图15A显示纯化步骤和胎球蛋白亲和纯化步骤中用考马斯蓝染色的SDS-PAGE分析蛋白质含量。在纯化步骤中,泳道1,粗提物;泳道2,pH6经调节提取物;泳道3,经热处理的提取物;泳道4,经DE过滤的提取物;在胎球蛋白亲和纯化步骤中,泳道5,加样;泳道6,清洗;泳道7,洗脱(10倍浓缩)。图15B显示对纯化的H5 VLP样品的负染色透射电子显微镜检查。比例尺表示100nm。图15C显示放大的经分离H5VLP以显示结构细节。图15D显示利用考马斯染色的还原型SDS-PAGE(泳道A)以及利用针对来自A/越南/1203/2004毒株(H5N1)的HA产生的兔多克隆抗体进行的Western印迹(泳道B)显示的H5VLP产物。

图16显示A型流感病毒(A/新喀里多尼亚/20/99(H1N1))血凝素(HA)基因全长cds的核苷酸序列。GenBank登录号AY289929(SEQID NO:33)。

图17显示紫花苜蓿(Medicago sativa)的蛋白质二硫键异构酶mRNA的核苷酸序列。GenBank登录号Z11499(SEQ ID NO:34)。

图18显示A型流感病毒(A/波多黎各/8/34(H1N1))区段7全长序列的核苷酸序列。GenBank登录号NC_002016.1(SEQ ID NO:35)。

图19显示正染色透射电子显微镜所观察的产生H5之组织的VLP累积定位。CW:细胞壁,ch:叶绿体,pm:质膜,VLP:病毒样颗粒。比例尺表示100nm。

图20显示在用植物生产的流感病毒H5 VLP或重组可溶性HA接种的Balb/c小鼠中加强后14天诱导的血清抗体应答。图20(A)通过肌内注射免疫的小鼠的抗体应答。图20(B)通过鼻内施用免疫的小鼠的抗体应答。测量针对失活的H5N1全病毒(A/印度尼西亚/5/05)的抗体应答。GMT:几何平均效价。数值是每组中五只小鼠的终点效价倒数的GMT(log2)。短线表示平均偏差。与重组可溶性HA相比,*p<0.05。

图21显示在用植物生产的流感病毒H5VLP或重组可溶性HA接种的Balb/c小鼠中加强后14天的血细胞凝集抑制(hemagglutinationinhibition,HAI)抗体应答。图21(A)通过肌内注射免疫的小鼠的抗体应答。图21(B)通过鼻内施用免疫的小鼠的抗体应答。使用失活的H5N1全病毒(A/印度尼西亚/5/05)测量HAI抗体应答。GMT:几何平均效价。数值是每组中五只小鼠的终点效价倒数的GMT(log2)。短线表示平均偏差。与重组可溶性HA相比,*p<0.05,**p<0.01。

图22显示佐剂对小鼠中VLP免疫原性的作用。图22(A)明矾对通过肌内注射免疫之小鼠的作用。图22(B)壳聚糖对通过鼻内施用免疫之小鼠的作用。使用失活的H5N1全病毒(A/印度尼西亚/5/05)测量HAI抗体应答。GMT:几何平均效价。数值是每组中五只小鼠的终点效价倒数的GMT(log2)。短线表示平均偏差。与相应的重组可溶性HA相比,*p<0.05。

图23显示施用VLP的抗体应答。图23(A)通过肌内注射接种的小鼠加强后30天的抗印度尼西亚/5/05免疫球蛋白同种型。数值是每组中五只小鼠的终点效价倒数的GMT(log2)。使用失活全病毒作为涂覆剂进行ELISA。短线表示平均偏差。与相应的重组可溶性HA相比,*p<0.05,**p<0.001。图23(B)针对失活全病毒的抗体效价。所有组均与阴性对照具有统计学差异。

图24显示初次剂量后2周(第2周)、加强后14天(第5周)或加强后30天(第7周)的针对同源失活全病毒(A/印度尼西亚/5/05)的抗体效价。GMT:几何平均效价。数值是每组中五只小鼠的终点效价倒数的GMT(log2)。与重组可溶性HA相比,*p<0.05。

图25显示血清抗体的体外交叉反应性。(A)针对失活全病毒的抗体效价。(B)针对多种失活全病毒的血细胞凝集抑制效价。数值是每组中五只小鼠的终点效价倒数的GMT(log2)。短线表示平均偏差。所有组均与阴性对照具有统计学差异。与相应的重组可溶性HA相比,*p<0.05,**p<0.001。

图26显示由植物生产的H5VLP的效力。(A)用10倍LD50(4.09×105CCID50)的流感毒株A/土耳其/582/06(H5N1)攻击后小鼠的存活率。(B)攻击后免疫小鼠的体重。数值是存活小鼠的平均体重。

图27显示植物来源的流感病毒VLP的来源。(A)纯化的流感病毒VLP的极性脂质组成。将包含在相当于40μg蛋白质中的脂质从上述VLP中提取出来,通过HP-TLC进行分离,并与从高度纯化的烟草质膜(PM)中分离的脂质的迁移模式进行比较。脂质缩写如下:DGDG,双半乳糖二酰甘油;gluCER,葡萄糖神经酰胺;PA,磷酸;PC,磷脂酰胆碱;PE,磷脂酰乙醇胺;PG,磷脂酰甘油;PI,磷酯酰肌醇;PS,磷脂酰丝氨酸;SG,类固醇糖苷(Steryl-glycoside)。(B)纯化的流感病毒VLP的中性脂质组成。将包含在相当于20μg蛋白质中的脂质从上述VLP中提取出来,通过HP-TLC进行分离,并与谷固醇的迁移进行比较。(C)对纯化的VLP、来自烟草叶的高度纯化PM(PML)和BY2烟草细胞(PMBY2)的高度纯化PM中质膜标志物质子泵ATP酶(PMA)进行免疫检测。在每一泳道中加入18μg蛋白质。

图28显示克隆体774的DraIII至SacI位点之间的序列——A/布里斯班/59/2007(H1N1)的核苷酸序列(SEQ ID NO:36)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。

图29显示克隆体775的DraIII至SacI位点之间的序列——A/所罗门群岛3/2006(H1N1)的核苷酸序列(SEQ ID NO:37)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。

图30显示克隆体776的DraIII至SacI位点之间的序列——A/布里斯班10/2007(H1N1)的核苷酸序列(SEQ ID NO:38)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。

图31显示克隆体777的DraIII至SacI位点之间的序列——A/威斯康星/67/2005(H3N2)的核苷酸序列(SEQ ID NO:39)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。

图32显示克隆体778的DraIII至SacI位点之间的序列——B/马来西亚/2506/2004的核苷酸序列(SEQ ID NO:40)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。

图33显示克隆体779的DraIII至SacI位点之间的序列——B/佛罗里达/4/2006的核苷酸序列(SEQ ID NO:41)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。

图34显示克隆体780的DraIII至SacI位点之间的序列——A/新加坡/1/57(H2N2)的核苷酸序列(SEQ ID NO:42)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。

图35显示克隆体781的DraIII至SacI位点之间的序列——A/安徽/1/2005(H5N1)的核苷酸序列(SEQ ID NO:43)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。

图36显示克隆体782的DraIII至SacI位点之间的序列——A/越南/1194/2004(H5N1)的核苷酸序列(SEQ ID NO:44)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。

图37显示克隆体783的DraIII至SacI位点之间的序列——A/水鸭/香港/W312/97(H6N1)的核苷酸序列(SEQ ID NO:45)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。

图38显示克隆体784的DraIII至SacI位点之间的序列——A/马/布拉格/56(H7N7)的核苷酸序列(SEQ ID NO:46)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。

图39显示克隆体785的DraIII至SacI位点之间的序列——A/香港/1073/99(H9N2)的核苷酸序列(SEQ ID NO:47)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。

图40A显示由克隆体774(A/布里斯班/59/2007(H1N1))翻译的多肽的氨基酸序列(SEQ ID NO:48)。克隆体774的开放阅读框从图28中所示的ATG开始。图40B显示由克隆体775(A/所罗门群岛3/2006(H1N1))翻译的多肽的氨基酸序列(SEQ ID NO:49)。克隆体775的开放阅读框从图29中所示的ATG开始。

图41A显示由克隆体776(A/布里斯班/10/2007(H3N2))翻译的多肽的氨基酸序列(SEQ ID NO:50)。克隆体776的开放阅读框从图30中所示的ATG开始。图41B显示由克隆体777(A/威斯康星/67/2005(H3N2))翻译的多肽的氨基酸序列(SEQ ID NO:51)。克隆体777的开放阅读框从图31中所示的ATG开始。

图42A显示由克隆体778(B/马来西亚/2506/2004)翻译的多肽的氨基酸序列(SEQ ID NO:52)。克隆体778的开放阅读框从图32中所示的ATG开始。图42B显示由克隆体779(B/佛罗里达/4/2006)翻译的多肽的氨基酸序列(SEQ ID NO:53)。克隆体779的开放阅读框从图33中所示的ATG开始。

图43A显示由克隆体780(A/新加坡/1/57(H2N2))翻译的多肽的氨基酸序列(SEQ ID NO:54)。克隆体780的开放阅读框从图34中所示的ATG开始。图43B显示由克隆体781(A/安徽/1/2005(H5N1))翻译的多肽的氨基酸序列(SEQ ID NO:55)。克隆体781的开放阅读框从图35中所示的ATG开始。

图44A显示由克隆体782(A/越南/1194/2004(H5N1))翻译的多肽的氨基酸序列(SEQ ID NO:56)。克隆体782的开放阅读框从图36中所示的ATG开始。图44B显示由克隆体783(A/水鸭/香港/W312/97(H6N1))翻译的多肽的氨基酸序列(SEQ ID NO:57)。克隆体783的开放阅读框从图37中所示的ATG开始。

图45A显示由克隆体784(A/马/布拉格/56(H7N7))翻译的多肽的氨基酸序列(SEQ ID NO:58)。克隆体784的开放阅读框从图38中所示的ATG开始。图45B显示由克隆体785(A/香港/1073/99(H9N2))翻译的多肽的氨基酸序列(SEQ ID NO:59)。克隆体785的开放阅读框从图39中所示的ATG开始。

图46显示在体积排阻色谱之后对由植物生产的VLP的洗脱级分进行免疫检测(Western印迹)。显示了血凝素亚型H1、H2、H5、H6和H9。在级分7-14中检出血凝素,其对应于VLP洗脱物。

图47显示来自年度流行毒株的一系列H1血凝素之表达的免疫印迹分析。将10μg和20μg蛋白质提取物分别加至泳道1和2中。

图48显示来自潜在大流行毒株的一系列H5血凝素之表达的免疫印迹分析。将10μg和20μg蛋白质提取物分别加至泳道1和2中。

图49显示来自利用AGL1/660农杆菌渗入的烟草(Nicotianatabacum)叶之蛋白质提取物中A/印度尼西亚/5/2005毒株H5的免疫印迹。对两株植物进行渗入,并将10μg和20μg来自各植物的可溶性蛋白质分别加至泳道1和2中。

图50显示血清抗体的体外交叉反应性。用植物生产的流感病毒H5 VLP(A)第一次免疫后14天以及(B)第二次加强后14天,雪貂血清中的血细胞凝集抑制(HI)效价。使用下述失活H5N1全病毒测量HAI抗体应答:A/火鸡/土耳其/1/05、A/越南/1194/04、A/安徽/5/05以及同源株A/印度尼西亚/5/05。数值是每组中五只雪貂的终点效价倒数的GMT(log2)。斜条纹—A/印度尼西亚/6/06(进化枝2.1.3);方格图案—A/火鸡/土耳其/1/05(进化枝2.2);白柱—A/越南/1194/04(进化枝1);黑柱—A/安徽/5/05。标出了响应者。短线表示平均偏差。

图51显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/印度尼西亚/5/2005(构建体#660)的H5的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。

图52显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/新喀里多尼亚/20/1999(构建体#540)的H1的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。

图53显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/布里斯班/59/2007(构建体#774)的H1的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。

图54显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/所罗门群岛/3/2006(H1N1)(构建体#775)的H1的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。

图55显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/新加坡/1/57(H2N2)(构建体#780)的H2的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。

图56显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/安徽/1/2005(H5N1)(构建体#781)的H5的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。

图57显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/越南/1194/2004(H5N1)(构建体#782)的H5的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。

图58显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/水鸭/香港/W312/97(H6N1)(构建体#783)的H6的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。

图59显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/香港/1073/99(H9N2)(构建体#785)的H9的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。

图60显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/布里斯班/10/2007(H3N2)的H3的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。

图61显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/威斯康星/67/2005(H3N2)的H3的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。

图62显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/马/布拉格/56(H7N7)的H7的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。

图63显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自B/马来西亚/2506/2004的HA的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。

图64显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自B/佛罗里达/4/2006的HA的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。

图65显示A/新喀里多尼亚/20/99(H1N1)(由SEQ ID NO:33编码)、A/布里斯班/59/2007(H1N1)(SEQ ID NO:48)、A/所罗门群岛/3/2006(H1N1)(SEQ ID NO:49)的HA和SEQ ID NO:9的共有氨基酸序列(SEQ ID NO:74)。X1(第3位)是A或V;X2(第52位)是D或N;X3(第90位)是K或R;X4(第99位)是K或T;X5(第111位)是Y或H;X6(第145位)是V或T;X7(第154位)是E或K;X8(第161位)是R或K;X9(第181位)是V或A;X10(第203位)是D或N;X11(第205位)是R或K;X12(第210位)是T或K;X13(第225位)是R或K;X14(第268位)是W或R;X15(第283位)是T或N;X16(第290位)是E或K;X17(第432位)是I或L;X18(第489位)是N或D。

图66显示由SEQ ID NO:33编码的H1(新喀里多尼亚)(AAP34324.1)的氨基酸序列。

图67显示由SEQ ID NO:35编码的H1(波多黎各)(NC_0409878.1)的氨基酸序列。

发明详述

本发明涉及病毒样颗粒的生产。更具体而言,本发明涉及含有流感病毒抗原的病毒样颗粒的生产。

下面的描述是优选的实施方案。

本发明提供了含有编码来自包膜病毒的抗原(例如流感血凝素(HA))之核苷酸序列的核酸,其与在植物中有活性的调控区有效连接。

此外,本发明提供了在植物中生产病毒样颗粒(VLP)的方法。所述方法包括将编码抗原并与在植物中有活性之调控区有效连接的核酸导入所述植物或其部分中,以及在允许所述核酸表达的条件下培养所述植物或其部分,从而产生VLP。

VLP可由流感病毒制得,然而,VLP还可由其它质膜来源的病毒制得,包括但不限于麻疹病毒、埃博拉病毒、马尔堡病毒和HIV。

本发明包括可感染人的所有类型流感病毒的VLP,包括例如但不限于非常流行的A型(H1N1)亚型(例如A/新喀里多尼亚/20/99(H1N1))、A/印度尼西亚/5/05亚型(H5N1)(SEQ ID NO:60)以及较不常见的B型(例如SEQ ID NO:26,图10O)、C型(SEQ ID NO:27,图10P)以及从其它流感病毒亚型得到的HA。本发明中其它流感病毒亚型的VLP还包括例如A/布里斯班/59/2007(H1N1;SEQ ID NO:48)、A/所罗门群岛/3/2006(H1N1;SEQ ID NO:49)、A/新加坡/1/57(H2N2;SEQ ID NO:54)、A/安徽/1/2005(H5N1;SEQ ID NO:55)、A/越南/1194/2004(H5N1;SEQ ID NO:56)、A/水鸭/香港/W312/97(H6N1;SEQID NO:57)、A/香港/1073/99(H9N2;SEQ ID NO:59)、A/布里斯班/10/2007(H3N2;SEQ ID NO:50)、A/威斯康星/67/2005(H3N2;SEQ IDNO:51)、A/马/布拉格/56(H7N7;SEQ ID NO:58)、B/马来西亚/2506/2004(SEQ ID NO:52)或B/佛罗里达/4/2006(SEQ ID NO:53)。

本发明还涉及感染其它哺乳动物或宿主动物的流感病毒,所述哺乳动物或宿主动物为例如人、灵长类、马、猪、鸟类、禽类、水禽、候鸟、鹌鹑、鸭、鹅、家禽、鸡、骆驼、犬科动物、狗、猫科动物、猫、虎、豹、麝猫、水貂、石貂、雪貂、宠物、家畜、小鼠、大鼠、海豹、鲸等。

可在质膜来源的病毒中表达的其它抗原的非限制性实例包括HIV的衣壳蛋白p24;包膜蛋白gp120、gp41;结构蛋白VP30和VP35;丝状病毒(例如埃博拉病毒或马尔堡病毒)的Gp/SGP(糖基化内膜蛋白),或副粘病毒(例如麻疹病毒)的H蛋白以及F蛋白。

本发明还包括但不限于从细胞质膜获得脂质包膜的流感病毒来源的VLP,所述VLP蛋白在所述细胞中表达。例如,如果VLP在基于植物的系统中表达,那么VLP可从该细胞的质膜获得脂质包膜。

一般而言,术语“脂质”是指脂溶性的(亲脂性的)天然分子。更具体地,该术语还用于指脂肪酸及其衍生物(包括甘油三酯、甘油二酯和甘油单酯以及磷脂)以及其它脂溶性的含固醇的代谢物或固醇类。磷脂连同糖脂、固醇和蛋白质是所有生物膜的主要组分。磷脂的实例包括磷脂酰乙醇胺、磷脂酰胆碱、磷脂酰肌醇、磷脂酰丝氨酸等。固醇的实例包括动物固醇(例如胆固醇)和植物固醇。已经在多种植物中鉴定了超过200种的植物固醇,最常见的有菜油固醇、豆固醇、麦角固醇、菜子固醇、Δ-7-豆固醇、Δ-7-燕麦固醇、胡萝卜固醇(daunosterol)、谷固醇、24-甲基胆固醇、胆固醇或β-谷固醇。本领域技术人员应当理解,细胞质膜的脂质组成可随细胞或获得细胞之生物体的培养或生长条件而变化。

细胞膜通常包含脂双层以及各种功能的蛋白质。在脂双层中可发现局部浓缩的特定脂质,称为“脂质筏”。不希望受理论限制,脂质筏可在内吞和胞吐作用、病毒或其它感染原的进入或逸出、细胞间信号转导、与细胞或生物体的其它结构组分(例如细胞内和细胞外基质)相互作用中起重要作用。

针对流感病毒,本文所用的术语“血凝素”或“HA”是指存在于流感病毒颗粒外部的糖蛋白。HA是同三聚体I型膜糖蛋白,通常含有信号肽、HA1结构域和HA2结构域,所述HA2结构域含有C端的跨膜锚定位点以及小的胞质尾(图1B)。编码HA的核苷酸序列是公知的并且是可用的,参见例如BioDefence Public Health base(流感病毒;参见URL:biohealthbase.org)或美国国立生物技术信息中心(参见URL:ncbi.nlm.nih.gov),其均通过引用并入本文。

术语“同三聚体”或“同三聚体的”表示寡聚体由三个HA蛋白分子形成。不希望受理论限制,HA蛋白是作为约75kDa的单体前体蛋白(HA0)合成的,其在表面处组装成长形的三聚体蛋白。在三聚化发生之前,前体蛋白在保守的活化切割位点(也称为“融合肽”)处被切割成2条通过二硫键连接的多肽链——HA1和HA2(包含跨膜区)。HA1区段的长度可以为328个氨基酸,HA2区段的长度可以为221个氨基酸。尽管该切割对于病毒感染性可以是重要的,但是其对于蛋白质三聚化却不是必需的。HA插入宿主细胞的内质网(ER)膜内,信号肽切割和蛋白质糖基化是共翻译事件。正确的HA重折叠需要蛋白质糖基化以及形成6个链内二硫键。HA三聚体在顺式-和反式-高尔基体复合物内组装,跨膜结构域在三聚化加工中起作用。经菠萝蛋白酶处理的HA蛋白(缺少跨膜结构域)的晶体结构显示在流感毒株之间具有高度保守的结构。还已明确,HA在感染过程中发生重大的构象变化,这需要将前体HA0切割成2条多肽链(HA1和HA2)。HA蛋白可被加工(即包含HA1和HA2结构域),或者可以不进行加工(即包含HA0结构域)。

本发明涉及包含跨膜结构域并包含HA1和HA2结构域的HA蛋白的用途,例如所述HA蛋白可以是HA0,或是包含HA1和HA2的经加工HA。所述HA蛋白可用于利用植物、植物细胞或表达系统生产或形成VLP。

本发明的HA可得自任意亚型。例如,HA可以是H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15或H16亚型。本发明的重组HA还可包含基于本领域公知的任意血凝素序列的氨基酸序列——参见例如BioDefence Public Health base(流感病毒;参见URL:biohealthbase.org)或者美国国立生物技术信息中心(参见URL:ncbi.nlm.nih.gov)。此外,HA可基于从一种或多种新发现的或新鉴定出的流感病毒中分离出的血凝素的序列。

本发明还包括VLP,其包含得自一种或多种流感病毒亚型的HA。例如,VLP可包含来自以下亚型的一种或多种HA:H1(由SEQ IDNO:28编码)、H2(由SEQ ID NO:12编码)、H3(由SEQ ID NO:13编码)、H4(由SEQ ID NO:14编码)、H5(由SEQ ID NO:15编码)、H6(由SEQ ID NO:16编码)、H7(由SEQ ID NO:11编码)、H8(由SEQ ID NO:17编码)、H9(由SEQ ID NO:18编码)、H10(由SEQ IDNO:19编码)、H11(由SEQ ID NO:20编码)、H12(由SEQ ID NO:21编码)、H13(由SEQ ID NO:27编码)、H14(由SEQ ID NO:23编码)、H15(由SEQ ID NO:24编码)、H16(由SEQ ID NO:25编码)或其组合。来自一种或多种流感病毒亚型的一种或多种HA可以在植物或昆虫细胞内共表达,以确保所述一种或多种HA的合成导致形成含有得自一种或多种流感病毒亚型之HA组合的VLP。对HA之组合的选择可通过由VLP制得之疫苗的目的用途来确定。例如,用于接种鸟类的疫苗可包含HA亚型的任意组合,而用于接种人的VLP可包含一种或多种H1、H2、H3、H5、H7、H9、H10、N1、N2、N3和N7亚型。然而,也可根据接种用途来制备其它HA亚型的组合。

因此,本发明涉及含有一种或多种HA亚型的VLP。

本发明还提供了编码血凝素的核酸,当其在植物中表达时形成VLP。

流感病毒HA蛋白在分子量、等电点、大小、聚糖成分等方面表现出一系列相似之处和不同之处。各种血凝素的物理化学性质可用于区分在植物、昆虫细胞或酵母系统中表达的HA,并且当多于一种HA在单一系统中共表达时其可具有特殊用途。所述物理化学性质的实例示于表1中。

本发明还包括分别编码H1、H5或H7之HA的核苷酸序列SEQ IDNO:28、SEQ ID NO:3、SEQ ID NO:11;在严格杂交条件下与SEQ IDNO:28、SEQ ID NO:3、SEQ ID NO:11杂交的核苷酸序列;在严格的杂交条件下与SEQ ID NO:28、SEQ ID NO:3、SEQ ID NO:1互补序列杂交的核苷酸序列,其中所述核苷酸序列编码当表达时形成VLP的血凝素蛋白,并且当施用给对象时所述VLP诱导抗体产生。例如,所述核苷酸序列在植物细胞内表达形成VLP,所述VLP可用于产生能结合HA(包括一种或多种流感病毒类型或亚型的成熟HA、HA0、HA1或HA2)的抗体。当施用给对象时,所述VLP诱导免疫应答。

在严格杂交条件下杂交是本领域公知的(参见例如CurrentProtocols in Molecular Biology,Ausubel等编,1995及增刊;Maniatis等,Molecular Cloning(A Laboratory Manual),Cold Spring HarborLaboratory,1982;Sambrook和Russell,Molecular Cloning:ALaboratory Manual,第3版,2001;所有这些均通过引用并入本文)。所述严格杂交条件的一个实例可以是在65℃下于4×SSC中杂交约16~20小时,然后在65℃下于0.1×SSC中清洗1小时,或在65℃下于0.1×SSC中清洗两次(每次20或30分钟)。或者,一个示例性的严格杂交条件可以是在42℃下于50%甲酰胺、4×SSC中过夜(16~20小时),然后在65℃下于0.1×SSC中清洗1小时,或在65℃下于0.1×SSC中清洗2次(每次20或30分钟或者过夜(16~20小时)),或者在65℃下于Church水性磷酸盐缓冲液(7%SDS;0.5M NaPO4缓冲液pH 7.2;10mM EDTA)中杂交,在50℃下于0.1×SSC、0.1%SDS中清洗2次(每次20或30分钟),或者在65℃下于2×SSC、0.1%SDS中清洗2次(每次20或30分钟)。

另外,本发明包括核苷酸序列,其特征在于与编码H1(SEQ IDNO:28)、H5(SEQ ID NO:3)或H7(SEQ ID NO:11)之HA的核苷酸序列具有约70%、75%、80%、85%、87%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或其间任意量的序列同一性或序列相似性,其中所述核苷酸序列编码当表达时形成VLP的血凝素蛋白,并且所述VLP诱导抗体产生。例如,所述核苷酸序列在植物细胞内表达形成VLP,所述VLP可用于产生能结合HA(包括成熟HA、HA0、HA1或HA2)的抗体。当施用给对象时,所述VLP诱导免疫应答。

类似地,本发明包括与下述亚型相关的HA:H1(由SEQ ID NO:28编码)、H2(由SEQ ID NO:12编码)、H3(由SEQ ID NO:13编码)、H4(由SEQ ID NO:14编码)、H5(由SEQ ID NO:15编码)、H6(由SEQ IDNO:16编码)、H7(由SEQ ID NO:11编码)、H8(由SEQ ID NO:17编码)、H9(由SEQ ID NO:18编码)、H10(由SEQ ID NO:19编码)、H11(由SEQ ID NO:20编码)、H12(由SEQ ID NO:21编码)、H13(由SEQ IDNO:27编码)、H14(由SEQ ID NO:23编码)、H15(由SEQ ID NO:24编码)、H16(由SEQ ID NO:25编码),参见图10A至10P,以及特征在于与H1(SEQ ID NO:28)、H2(SEQ ID NO:12)、H3(SEQ ID NO:13)、H4(SEQ ID NO:14)、H5(SEQ ID NO:15)、H6(SEQ ID NO:16)、H7(SEQ ID NO:11)、H8(SEQ ID NO:17)、H9(SEQ ID NO:18)、H10(SEQ ID NO:19)、H11(SEQ ID NO:20)、H12(SEQ ID NO:21)、H13(SEQ ID NO:27)、H14(SEQ ID NO:23)、H15(SEQ ID NO:24)、H16(SEQ ID NO:25)具有约70~100%或其中任意量、80~100%或其中任意量、90~100%或其中任意量或者95~100%或其中任意量的序列同一性的核苷酸序列,其中所述核苷酸序列编码当表达时形成VLP的血凝素蛋白,并且所述VLP诱导抗体产生。例如,所述核苷酸序列在植物细胞内表达形成VLP,所述VLP可用于产生能结合HA(包括成熟HA、HA0、HA1或HA2)的抗体。当施用给对象时,所述VLP诱导免疫应答。

“免疫应答”一般是指获得性免疫系统的应答。所述获得性免疫系统通常包括体液应答和细胞介导的应答。体液应答是由B淋巴细胞谱系的细胞(B细胞)中产生的分泌型抗体所介导的免疫方面。分泌型抗体结合入侵微生物(例如病毒或细菌)表面上的抗原,标示它们以进行破坏。体液免疫一般用于指抗体产生和伴随抗体产生的过程,以及抗体的效应器功能,包括Th2细胞活化和细胞因子产生、记忆细胞形成、调理素促进吞噬作用、病原体清除等。术语“调节”等指根据通常知晓或使用的任意几种测定方法(其中一些在本文中举例说明)测定的特定应答或参数的升高或降低。

细胞介导的应答是这样的免疫应答,其不涉及抗体,而涉及巨噬细胞、自然杀伤细胞(NK)、抗原特异性细胞毒性T淋巴细胞的活化,以及多种细胞因子响应于抗原而释放。细胞介导的免疫一般用于指某些Th细胞的活化、Tc细胞的活化以及T细胞介导的应答。细胞介导的免疫在响应于病毒感染中尤为重要。

例如,可使用ELISPOT测定来测量对抗原特异性CD8+T淋巴细胞的诱导;可使用增殖测定来测量对CD4+T淋巴细胞的刺激。可使用ELISA测定来定量抗流感病毒抗体的效价;还可使用抗同种型抗体的抗体(例如抗IgG的抗体、抗IgA的抗体、抗IgE的抗体或抗IgM的抗体)来测量抗原特异性或交叉反应性抗体的同种型。实施这些测定的方法和技术是本领域中熟知的。

血细胞凝集抑制(HI或HAI)测定也可用于证明由疫苗或疫苗组合物所诱导的抗体效力可抑制由重组HA所致的血红细胞(RBC)凝集。血清样品的血细胞凝集抑制性抗体效价可利用微量滴定HAI来评估(Aymard等,1973)。可使用来自任意几个物种的红细胞,例如马、火鸡、鸡等。该测定给出有关HA三聚体在VLP表面上组装的间接信息,证实了HA抗原位点的正确展示。

交叉反应性HAI滴定还可用于证明免疫应答对与疫苗亚型相关的其它病毒株的效力。例如,来自用第一毒株的疫苗组合物(例如A/印度尼西亚5/05的VLP)免疫之对象的血清可用于利用第二株全病毒或病毒颗粒(例如A/越南/1194/2004)的HAI测定中,并且可测定HAI效价。

还可对细胞因子的存在或水平进行定量。例如,利用ELISA(例如BD Biosciences OptEIA试剂盒)测量IFN-γ和IL-4分泌细胞来表征T辅助细胞应答(Th1/Th2)。可培养从对象得到的外周血单核细胞(PBMC)或脾细胞,并分析上清。还可使用标志物特异性荧光标记和本领域公知的方法通过荧光激活细胞分选(fluorescence-activated cellsorting,FACS)对T淋巴细胞定量。

还可进行微量中和测定来表征对象中的免疫应答,参见例如Rowe等,1973的方法。可通过几种方法得到病毒中和效价,包括1):在对细胞进行结晶紫固定/着色之后,计数裂解斑(空斑测定);2)显微镜观察培养物中的细胞裂解;3)对NP病毒蛋白(与病毒感染宿主细胞有关)进行ELISA和分光光度检测。

序列同一性或序列相似性可利用核苷酸序列比较程序来确定,例如DNASIS所提供的(例如,使用但不限于下述参数:空隙罚分5、顶部对角线编号(# of top diagonal)5、固定的空隙罚分10、k元祖2、游隙10,窗口大小5)。然而,其它用于比较的序列比对方法是本领域熟知的,例如Smith & Waterman算法(1981,Adv.Appl.Math.2:482)、Needleman & Wunsch(J.Mol.Biol.48:443,1970)算法、Pearson &Lipman(1988,Proc.Nat’l.Acad.Sci.USA 85:2444)算法,以及这些算法的计算机化执行(例如GAP、BESTFIT、FASTA和BLAST)或者人工比对和目视检查。

术语“血凝素结构域”是指含有HA0结构域或者HA1及HA2结构域的肽。所述血凝素结构域不包含天然蛋白质中存在的信号肽、跨膜结构域或胞质尾。

术语“病毒样颗粒(VLP)”是指自组装并且含有结构蛋白(例如流感病毒HA蛋白)的结构。VLP通常在形态上和抗原性上与感染中产生的病毒体相似,但是缺少足以进行复制的遗传信息,因此是不具有感染性的。在一些实例中,VLP可含有一种蛋白质或多于一种蛋白质。对于含有多于一种蛋白质的VLP而言,所述蛋白质种类可来自同种病毒,或者可包含来自不同种、属、亚科或科之病毒的蛋白质(如ICTV命名法所指定)。在另一些实例中,可对VLP包含的一种或多种蛋白质的天然序列进行修饰。VLP可以在合适的宿主细胞(包括植物和昆虫宿主细胞)中产生。在从宿主细胞中提取、分离以及在合适条件下进一步纯化之后,VLP可作为完整结构被纯化。

根据本发明,由流感来源的蛋白质产生的VLP不含有M1蛋白。已知M1蛋白结合RNA(Wakefield和Brownlee,1989),RNA是VLP制备物中的污染物。当获得VLP产品的监管部门审批时,不期望存在RNA,因此不含RNA的VLP制备物可以是有利的。

本发明的VLP可以在特征在于缺少使蛋白质唾液酸化之能力(例如不含唾液酸酶)的宿主细胞中产生,所述宿主细胞例如植物细胞、昆虫细胞、真菌和其它生物(包括海绵动物、腔肠动物、环节动物、节肢动物、软体动物、线形动物(nemathelminthea)、担轮动物(trochelmintes)、扁形动物、毛颚动物、触手动物、衣原体、螺旋体、革兰氏阳性细菌、蓝细菌、古细菌,如glycoforum中所鉴定的(参见例如URL:glycoforum.gr.jp/science/word/evolution/ES-A03E.html)。如本文所述生产的VLP通常不含有神经氨酸酶(NA)。然而,如果需要包含HA和NA的VLP,可以将NA与HA共表达。

根据本发明的一些方面,在植物中生产的VLP可与植物来源的脂质复合。所述VLP可包含HA0、HA1或HA2肽。所述植物来源的脂质可以是脂双层形式,并且还可包含围绕VLP的包膜。所述植物来源的脂质可包含产生VLP之植物的质膜脂质组分,包括但不限于磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、鞘糖脂、植物固醇或其组合。植物来源的脂质还可称为“植物脂质”。植物固醇的实例是本领域公知的,包括例如豆固醇、谷固醇、24-甲基胆固醇和胆固醇,参见例如Mongrand等,2004。

可通过例如血细胞凝集测定、电子显微镜或体积排阻色谱来评估VLP的结构和大小。

对于体积排阻色谱而言,可通过以下方法从植物组织中提取全部可溶性蛋白质:将冷冻粉碎的植物材料样品在提取缓冲液中匀浆(Polytron),并通过离心除去不溶性的物质。利用PEG沉淀也可以是有益的。对可溶性蛋白质定量,并将提取物通过SephacrylTM柱。BlueDextran 2000可用作校准标准。实施色谱之后,可通过免疫印迹进一步分析级分以确定所述级分中蛋白质成分。

不希望受理论限制,HA结合来自不同动物之RBC的能力是由HA对唾液酸α2,3或α2,3的亲和力以及RBC表面上存在这些唾液酸来驱动的。马和鸟的流感病毒HA使来自所有几个物种(包括火鸡、鸡、鸭、豚鼠、人、绵羊、马和牛)的红细胞凝集;而人HA将结合火鸡、鸡、鸭、豚鼠、人和绵羊的红细胞(还参见Ito T.等,1997,Virology,卷227,493-499页;以及Medeiros R等,2001,Virology,卷289,74-85页)。不同流感株的HA的物种反应性实例显示在表2A和2B中。

表2A:所选的季节性流感株之HA所结合RBC的物种

  B/佛罗里达/4/2006  779  人  +  ++

表2B:所选的大流行流感株之HA所结合RBC的物种

本文所用的“蛋白质”一般是指通过肽键连接的氨基酸链,其可折叠成二级、三级或四级结构以获得特定的形态。或者,术语“多肽”、“肽”或“肽片段”可用在相似的语境中。

蛋白质、融合蛋白或多肽的片段或部分包括含有特定蛋白质或多肽之一部分氨基酸组成的肽或多肽,前提是当表达时所述片段可形成VLP。所述片段可以例如包含抗原区域、应激应答诱导区域或含有该蛋白质或多肽之功能结构域的区域。所述片段还可包含同一家族的蛋白质共有的区域或结构域,或者所述片段可包含足以特异性鉴别其来源的全长蛋白质的氨基酸序列。

例如,片段或部分可包含蛋白质全长的约60%至约100%或其间任意量,前提是当表达时该片段可形成VLP。例如,蛋白质全长的约60%至约100%、约70%至约100%、约80%至约100%、约90%至约100%、约95%至约100%,或其间任意量。或者,片段或部分可以取决于HA为约150至约500个氨基酸或其间任意量,前提是当表达时所述片段可形成VLP。例如,片段或部分可以取决于HA为约150至约500个氨基酸或其间任意量、约200至约500个氨基酸或其间任意量、约250至约500个氨基酸或其间任意量、约300至约500个氨基酸或其间任意量、约350至约500个氨基酸或其间任意量、约400至约500个氨基酸或其间任意量、约450至约500个氨基酸或其间任意量,前提是当表达时所述片段可形成VLP。例如,可从HA蛋白的C端、N端或者N和C端去除约5、10、20、30、40或50个氨基酸或其间任意量,前提是当表达时所述片段可形成VLP。

任意给定序列中的氨基酸编号是相对于该特定序列而言的,然而,本领域技术人员可根据结构和/或序列容易地确定序列中特定氨基酸的“等同性”。例如,如果当为了结晶而构建克隆时去除了6个N端氨基酸,那么这将改变氨基酸的具体编码标识(例如,相对于蛋白质全长而言),但是不会改变氨基酸在所述结构中的相对位置。

可使用BLAST算法(Altschul等,1990,J.Mol Biol 215:403-410)进行序列比较。BLAST检索允许将查询序列与特定的序列或序列组进行比较,或者与较大的序列文库或数据库(例如GenBank或GenPept)进行比较,并且不但鉴定具有100%同一性的序列,还鉴定同一性程度较低的序列。可使用BLAST算法比较核酸或氨基酸序列。此外,两个或更多个序列之间的同一性可通过将序列一起比对并测定序列间的同一性百分比来确定。可使用BLAST算法(例如可利用GenBank,URL:ncbi.nlm.nih.gov/cgi-bin/BLAST/,使用默认的参数:程序:blastn;数据库:nr;期望值10;过滤:默认;比对:成对比对;查询序列的遗传密码:标准(1);或者通过EMBL(URL:embl-heidelberg.de/Services/index.html)利用BLAST2,使用默认的参数:Matrix BLOSUM 62;过滤:默认;回声过滤(echofilter):打开;期望值:10;临界值:默认;链:两者;描述:50;比对:50;或利用FASTA,使用默认的参数)或人工比较序列进行比对并计算同一性百分比。

本发明描述了(但不限于)将编码HA的核酸克隆到植物表达载体中,并从适于生产疫苗的植物中生产流感病毒VLP。所述核酸的实例包括例如但不限于:流感病毒A/新喀里多尼亚/20/99(H1N1)病毒HA(例如SEQ ID NO:61)、来自A/印度尼西亚/5/05亚型(H5N1)的HA(例如SEQID NO:60)、来自A/布里斯班/59/2007(H1N1)的HA(例如SEQ ID NO:36、48、62)、来自A/所罗门群岛/3/2006(H1N1)的HA(例如SEQ ID NO:37、49、63)、来自A/新加坡/1/57(H2N2)的HA(例如SEQ ID NO:42、54、64)、来自A/安徽/1/2005(H5N1)的HA(例如SEQ ID NO:43、55、65)、来自A/越南/1194/2004(H5N1)的HA(例如SEQ ID NO:44、56、66)、来自A/水鸭/香港/W312/97(H6N1)的HA(例如SEQ ID NO:45、57、67)、来自A/香港/1073/99(H9N2)的HA(例如SEQ ID NO:47、59、68)、来自A/布里斯班/10/2007(H3N2)的HA(例如SEQ ID NO:38、50、69)、来自A/威斯康星/67/2005(H3N2)的HA(例如SEQ ID NO:39、51、70)、来自A/马/布拉格/56(H7N7)的HA(例如SEQ ID NO:46、58、71)、来自B/马来西亚/2506/2004的HA(例如SEQ ID NO:40、52、72)、来自B/佛罗里达/4/2006的HA(例如SEQ ID NO:41、53、73)。这些毒株的对应克隆或构建体编号提供在表1中。对应于SEQ ID NO:36-47的核酸序列包含质体蓝素启动子,其位于每个类型或亚型HA编码序列的上游并与其有效连接,如图28-39所示。对应于SEQ ID NO:60-73的核酸序列包含HA表达盒,其含有苜蓿质体蓝素启动子和5’UTR、HA的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列,如图51-64所示。

所述VLP还可用于生产由重组流感病毒结构蛋白组成的试剂,其在经转化的宿主细胞(例如植物细胞或昆虫细胞)中自组装成功能性和免疫原性的同型大分子蛋白质结构(包括流感亚病毒颗粒和流感病毒VLP)。

因此,本发明提供了VLP以及通过表达单一包膜蛋白在植物表达系统中生产病毒VLP的方法。所述VLP可以是流感病毒VLP,或者是由其它质膜来源的病毒(包括但不限于麻疹病毒、埃博拉病毒、马尔堡病毒和HIV)产生的VLP。

还可使用本领域技术人员公知的来自其它包膜病毒的蛋白质,所述包膜病毒例如但不限于:丝状病毒科(例如埃博拉病毒、马尔堡病毒等)、副粘病毒科(例如麻疹病毒、腮腺炎病毒、呼吸道合胞病毒、肺病毒等)、逆转录病毒科(例如人类免疫缺陷病毒-1、人类免疫缺陷病毒-2、人T细胞白血病病毒-1等)、黄病毒科(例如西尼罗河脑炎、登革病毒、丙型肝炎病毒、黄热病毒等)、布尼病毒科(例如汉坦病毒等)、冠状病毒科(例如冠状病毒、SARS等)。可在质膜来源的病毒中表达之抗原的非限制性实例包括:HIV衣壳蛋白p24;HIV糖蛋白gp120或gp41;丝状病毒蛋白质,包括埃博拉病毒的VP30或VP35,或马尔堡病毒的Gp/SGP,或麻疹副粘病毒的H蛋白或F蛋白。例如,HIV的P24(例如GenBank编号gi:19172948)是对HIV病毒基因组gag序列(例如GenBank编号gi:9629357)进行翻译和切割而得到的蛋白质;HIV的gp120和gp41是对由HIV病毒基因组的env编码的gp160蛋白(例如GenBank编号gi:9629363)进行翻译和切割而得到的糖蛋白。埃博拉病毒的VP30(GenPept编号gi:55770813)是对埃博拉病毒基因组的vp30序列(例如GenBank编号gi:55770807)进行翻译而得到的蛋白质;埃博拉病毒的VP35(GenPept编号gi:55770809)是对埃博拉病毒基因组的vp35序列进行翻译而得到的蛋白质。马尔堡病毒的Gp/SGP(GenPept编号gi:296965)是对马尔堡病毒基因组序列(GenBank编号gi:158539108)进行翻译而得到的蛋白质。H蛋白(GenPept编号gi:9626951)是麻疹病毒基因组的H序列(GenBank编号gi:9626945)的蛋白质;F蛋白(GenPept编号gi:9626950)是麻疹病毒基因组的F序列的蛋白质。

然而,本发明方法中也可使用本领域技术人员已知的其它外壳蛋白。

因此,本发明提供了包含编码HIV-p24、HIV-gp120、HIV-gp41、埃博拉病毒-VP30、埃博拉病毒-VP35、马尔堡病毒Gp/SGP、麻疹病毒-H蛋白或-F蛋白之序列的核酸分子。所述核酸分子与在昆虫、酵母或植物细胞中或在特定植物组织中有活性的调控区有效连接。

本发明还提供了将编码HA(例如但不限于人流感病毒A/印度尼西亚/5/05病毒(H5N1)的HA)的核酸克隆到植物或昆虫表达载体(例如杆状病毒表达载体)中,并在经转化的植物细胞或经转化的昆虫细胞中产生流感候选疫苗或试剂,所述疫苗或试剂包含自组装成功能性和免疫原性同型大分子蛋白质结构(包括流感亚病毒颗粒和流感病毒VLP)的重组流感病毒结构蛋白。

可例如使用杆状病毒表达系统在合适的细胞系(例如草地贪夜蛾(Spodoptera frugiperda)细胞(如Sf-9细胞系;ATCC PTA-4047))中表达编码流感病毒亚型之HA的核酸,所述流感亚型例如但不限于A/新喀里多尼亚/20/99(H1N1)、A/印度尼西亚/5/05亚型(H5N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛/3/2006(H1N1)、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/香港/1073/99(H9N2)、A/布里斯班/10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、A/马/布拉格/56(H7N7)、B/马来西亚/2506/2004、B/佛罗里达/4/2006。还可使用其它昆虫细胞系。

或者,编码HA的核酸可在植物细胞或植物中表达。可使用HA RNA通过逆转录和聚合酶链反应(PCR)来合成编码HA的核酸。例如,所述RNA可从人流感病毒A/新喀里多尼亚/20/99(H1N1)病毒或人流感病毒A/印度尼西亚/5/05(H5N1)病毒或其它流感病毒(例如A/布里斯班/59/2007(H1N1)、A/所罗门群岛/3/2006(H1N1)、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/香港/1073/99(H9N2)、A/布里斯班/10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、A/马/布拉格/56(H7N7)、B/马来西亚/2506/2004,B/佛罗里达/4/2006)中分离,或者从被流感病毒感染的细胞中分离。对于逆转录和PCR而言,可使用特异性针对HA RNA的寡核苷酸引物,所述HA例如但不限于人流感病毒A/新喀里多尼亚/20/99(H1N1)病毒的HA序列,或人流感病毒A/印度尼西亚/5/05(H5N1)病毒的HA0序列,或来自流感病毒亚型A/布里斯班/59/2007(H1N1)、A/所罗门群岛/3/2006(H1N1)、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/香港/1073/99(H9N2)、A/布里斯班/10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、A/马/布拉格/56(H7N7)、B/马来西亚/2506/2004、B/佛罗里达/4/2006的HA序列。另外,可使用本领域技术人员已知的方法来化学合成编码HA的核酸。

根据宿主表达系统的要求,可将这些基因所得的cDNA拷贝克隆进合适的表达载体中。以下描述了用于植物的合适表达载体的实例,或者说,可利用已知的方法以及制造商说明书中提供的信息,使用杆状病毒表达载体(例如pFastBacl(InVitrogen))得到基于pFastBacl的质粒,。

本发明还涉及包含编码HA之核酸的基因构建体,如上所述,其与在植物中可用的调控元件有效连接。在植物细胞中有效并可用在本发明中的调控元件的实例包括但不限于质体蓝素调控区(US 7,125,978;其通过引用并入本文)或核酮糖-1,5-二磷酸羧化酶/加氧酶(RuBisCO;US4,962,028;其通过引用并入本文)、叶绿素a/b结合蛋白(CAB;Leutwiler等;1986;其通过引用并入本文)、ST-LS1(与光系统II的放氧复合物相关,并描述于Stockhaus等1987、1989中;其通过引用并入本文)的调控区。质体蓝素调控区的实例是包含SEQ ID NO:36的第10~85位核苷酸或SEQ ID NO:37~47任一序列中的相似区域的序列。

如果构建体在昆虫细胞中表达,在昆虫细胞中可用的调控元件的实例包括但不限于多角体蛋白启动子(Possee和Howard 1987.Nucleic AcidsResearch 15:10233-10248)、gp64启动子(Kogan等,1995.J Virology69:1452-1461)等。

因此,本发明的一个方面提供了包含调控区和编码流感病毒HA之序列的核酸。所述调控区可以是质体蓝素调控元件,所述流感病毒HA可选自包含以下的流感毒株或亚型:A/新喀里多尼亚/20/99(H1N1)、A/印度尼西亚/5/05亚型(H5N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛/3/2006(H1N1)、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/香港/1073/99(H9N2)、A/布里斯班/10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、A/马/布拉格/56(H7N7)、B/马来西亚/2506/2004、B/佛罗里达/4/2006。本文中通过SEQ ID NO:36~47举例说明了包含质体蓝素调控元件和流感病毒HA的核酸序列。

已知,当在蛋或哺乳动物细胞(例如MDCK细胞)中培养流感病毒时,或者当从被感染的对象中分离流感病毒时,流感病毒血凝素的氨基酸序列或编码它们的核酸序列可存在序列差异。这样的差异的非限制性实例在本文中举例说明,包括实施例18。此外,本领域技术人员应当认识到,由于另外的突变继续出现,因此可在来自新毒株的流感病毒血凝素中观察到其它变异。由于不同流感病毒血凝素之间的已知序列变异,本发明包括可利用任意流感病毒血凝素制备的VLP,前提是当如本文所述在宿主中表达时流感病毒血凝素形成VLP。

可使用本领域中已知的几种软件包中的任意一种例如MULTALIN(F.CORPET,1988,Nucl.Acids Res.,16(22),10881-10890)来确定序列比对和共有序列,或者可人工比对序列并测定序列之间的相似性和差异。

已深入研究了血凝素的结构,并且已知所述结构是高度保守的。在将血凝素的结构进行重叠时,观察到高度的结构保守性(rmsd<2A)。即使某些位置中的氨基酸序列可改变,仍可观察到这种结构保守性(参见例如Skehel和Wiley,2000 Ann Rev Biochem 69:531-69;Vaccaro等2005)。血凝素的区域也是非常保守的,例如:

结构域:HA0多肽被切割以提供成熟的HA。HA是同三聚体,其中每个单体包含通过一个二硫键连接的受体结合结构域(HA1)和膜锚定结构域(HA2);HA2亚基的N端20个残基还称为“HA融合结构域(或序列)”。还存在“尾”区域(被膜内部)。每种血凝素均包含这些区域或结构域。各区域或结构域的长度通常是保守的。

所有血凝素含有相同数目和位置的分子内和分子间二硫桥。参与二硫桥网络之半胱氨酸的氨基酸序列的数目和位置在HA中是保守的。举例说明特征性分子内和分子间二硫桥和其它保守氨基酸及其相对位置之结构的实例描述于例如Gamblin等2004(Science 303:1838-1842)中。示例性结构和序列包括1RVZ、1RVX、1RVT、1RV0、1RUY、1RU7,其可从蛋白质数据库(URL:www.rcsb.org)获取。

胞质尾—大多数血凝素在保守位置包含3个半胱氨酸。作为翻译后修饰,这些半胱氨酸中的一个或多个可被棕榈酸化。

流感病毒的血凝素可容忍氨基酸变异。该变异提供了不断鉴定出的新毒株。所述新毒株之间的感染性可以不同。然而,保持了血凝素三聚体的形成,其随后形成VLP。因此,本发明提供了血凝素氨基酸序列或编码血凝素氨基酸序列的核酸,其在植物中形成VLP,并包括已知的序列及其可能出现的变异序列。

图65举例说明这些已知变异的实例。该图显示下述H1N1毒株之HA的共有氨基酸序列(SEQ ID NO:74):

A/新喀里多尼亚/20/99(H1N1)(由SEQ ID NO:33编码)、A/布里斯班/59/2007(H1N1)(SEQ ID NO:48)、A/所罗门群岛/3/2006(H1N1)(SEQID NO:49)以及SEQ ID NO:9。X1(第3位)是A或V;X2(第52位)是D或N;X3(第90位)是K或R;X4(第99位)是K或T;X5(第111位)是Y或H;X6(第145位)是V或T;X7(第154位)是E或K;X8(第161位)是R或K;X9(第181位)是V或A;X10(第203位)是D或N;X11(第205位)是R或K;X12(第210位)是T或K;X13(第225位)是R或K;X14(第268位)是W或R;X15(第283位)是T或N;X16(第290位)是E或K;X17(第432位)是I或L;X18(第489位)是N或D。

作为这种变异的另一实例,A/新喀里多尼亚/20/99(H1N1)(由SEQID NO:33编码)、A/布里斯班/59/2007(H1N1)(SEQ ID NO:48)、A/所罗门群岛/3/2006(H1N1)(SEQ ID NO:49)、A/波多黎各/8/34(H1N1)之HA和SEQ ID NO:9的序列比对和共有序列示于如下表3中。

表3:所选H1N1毒株之HA的序列比对和共有序列

SEQ ID NO.                  序列

         1                                                   50

      75 MKAKLLVLLC TFTATYADTI CIGYHANNST DTVDTVLEKN VTVTHSVNLL

       9 MKAKLLVLLC TFTATYADTI CIGYHANNST DTVDTVLEKN VTVTHSVNLL

      48 MKVKLLVLLC TFTATYADTI CIGYHANNST DTVDTVLEKN VTVTHSVNLL

      49 MKVKLLVLLC TFTATYADTI CIGYHANNST DTVDTVLEKN VTVTHSVNLL

      76 .......... .......... .......... .......... ..........

共有序列 mkxkllvllc tftatyadti cigyhannst dtvdtvlekn vtvthsvnll

         51                                                 100

      75 EDSHNGKLCL LKGIAPLQLG NCSVAGWILG NPECELLISK ESWSYIVETP

       9 EDSHNGKLCL LKGIAPLQLG NCSVAGWILG NPECELLISK ESWSYIVETP

      48 ENSHNGKLCL LKGIAPLQLG NCSVAGWILG NPECELLISK ESWSYIVEKP

      49 EDSHNGKLCL LKGIAPLQLG NCSVAGWILG NPECELLISR ESWSYIVEKP

      76 .......... .......... .......... .......... ..........

共有序列 exshngklcl lkgiaplqlg ncsvagwilg npecellis. eswsyive.p

         101                                                150

      75 NPENGTCYPG YFADYEELRE QLSSVSSFER FEIFPKESSW PNHTVTGVSA

       9 NPENGTCYPG YFADYEELRE QLSSVSSFER FEIFPKESSW PNHTVTGVSA

      48 NPENGTCYPG HFADYEELRE QLSSVSSFER FEIFPKESSW PNHTVTGVSA

      49 NPENGTCYPG HFADYEELRE QLSSVSSFER FEIFPKESSW PNHTTTGVSA

      76 .......... .......... .......... .......... ..........

共有序列 npengtcypg xfadyeelre qlssvssfer feifpkessw pnhtxtgvsa

         151                                                200

      75 SCSHNGKSSF YRNLLWLTGK NGLYPNLSKS YVNNKEKEVL VLWGVHHPPN

       9 SCSHNGKSSF YRNLLWLTGK NGLYPNLSKS YVNNKEKEVL VLWGVHHPPN

      48 SCSHNGESSF YRNLLWLTGK NGLYPNLSKS YANNKEKEVL VLWGVHHPPN

      49 SCSHNGESSF YKNLLWLTGK NGLYPNLSKS YANNKEKEVL VLWGVHHPPN

      76 .......... .......... .......... .......... ..........

共有序列 scshngxssf yxnllwltgk nglypnlsks yxnnkekevl vlwgvhhppn

         201                                                250

      75 IGNQRALYHT ENAYVSVVSS HYSRRFTPEI AKRPKVRDQE GRINYYWTLL

       9 IGNQRALYHT ENAYVSVVSS HYSRRFTPEI AKRPKVRDQE GRINYYWTLL

      48 IGDQKALYHT ENAYVSVVSS HYSRKFTPEI AKRPKVRDQE GRINYYWTLL

      49 IGDQRALYHK ENAYVSVVSS HYSRKFTPEI AKRPKVRDQE GRINYYWTLL

      76 .......... .....MSLLT EVETYVLSII PSGPLKAEIA QRLEDVFAGK

共有序列 igxqxalyhx enayvsvvss hysrxftpeI akrPkvr#qe gRi#yywtll

         251                                                300

      75 EPGDTIIFEA NGNLIAPWYA FALSRGFGSG IITSNAPMDE CDAKCQTPQG

       9 EPGDTIIFEA NGNLIAPWYA FALSRGFGSG IITSNAPMDE CDAKCQTPQG

      48 EPGDTIIFEA NGNLIAPRYA FALSRGFGSG IINSNAPMDK CDAKCQTPQG

      49 EPGDTIIFEA NGNLIAPRYA FALSRGFGSG IINSNAPMDE CDAKCQTPQG

      76 NTDLEVLMEW ...LKTRPIL SPLTKGILGF VFTLTVPSER GLQRRRFVQN

共有序列 #pgdt!ifEa ngnLiapxya faLsrGfgsg !itsnaPm#x cdakcqtpQg

         301                                               350

      75 AINSSLPFQN VHPVTIGECP KYVRSAKLRM VT.GLRNIPS IQSRGLFGAI

       9 AINSSLPFQN VHPVTIGECP KYVRSAKLRM VT.GLRNIPS IQSRGLFGAI

      48 AINSSLPFQN VHPVTIGECP KYVRSAKLRM VT.GLRNIPS IQSRGLFGAI

      49 AINSSLPFQN VHPVTIGECP KYVRSAKLRM VT.GLRNIPS IQSRGLFGAI

      76 ALNG.....N GDPNNMDKAV KLYRKLKREI TFHGAKEISL SYSAGALASC

共有序列 AiNsslpfqN vhPvtigecp KyvRsaKlrm vtxGlr#Ips iqSrGlfgai

         351                                                400

      75 AGFIEGGWTG MVDGWYGYHH QNEQGSGYAA DQKSTQNAIN GITNKVNSVI

       9 AGFIEGGWTG MVDGWYGYHH QNEQGSGYAA DQKSTQNAIN GITNKVNSVI

      48 AGFIEGGWTG MVDGWYGYHH QNEQGSGYAA DQKSTQNAIN GITNKVNSVI

      49 AGFIEGGWTG MVDGWYGYHH QNEQGSGYAA DQKSTQNAIN GITNKVNSVI

      76 MGLIYNRM.G AVTTEVAFGL VCATCEQIAD SQHRSHRQMV TTTNPLIRHE

共有序列aGfIeggwtG mVdgwyg%hh qneqgsgyAa dQkstqnain giTNkvnsvi

         401                                                450

      75 EKMNTQFTAV GKEFNKLERR MENLNKKVDD GFLDIWTYNA ELLVLLENER

       9 EKMNTQFTAV GKEFNKLERR MENLNKKVDD GFLDIWTYNA ELLVLLENER

      48 EKMNTQFTAV GKEFNKLERR MENLNKKVDD GFIDIWTYNA ELLVLLENER

      49 EKMNTQFTAV GKEFNKLERR MENLNKKVDD GFIDIWTYNA ELLVLLENER

      76 NRMVLASTTA .KAMEQMAGS SEQAAEAMEV A........S QARQMVQAMR

共有序列 #kMntqfTav gKef#k$err mE#lnkkv#d gfxdiwtyna #llv$l#neR

         451                                                500

      75 TLDFHDSNVK NLYEKVKSQL KNNAKEIGNG CFEFYHKCNN ECMESVKNGT

       9 TLDFHDSNVK NLYEKVKSQL KNNAKEIGNG CFEFYHKCNN ECMESVKNGT

      48 TLDFHDSNVK NLYEKVKSQL KNNAKEIGNG CFEFYHKCND ECMESVKNGT

      49 TLDFHDSNVK NLYEKVKSQL KNNAKEIGNG CFEFYHKCND ECMESVKNGT

      76 TIGTHPSSSA GLKNDLLENL QAYQKRMGVQ MQRFK..... ..........

共有序列TldfHdSnvk nLy#kvks#L knnaKeiGng cfeFyhkcnx ecmesvkngt

         501                                                550

      75 YDYPKYSEES KLNREKIDGV KLESMGVYQI LAIYSTVASS LVLLVSLGAI

       9 YDYPKYSEES KLNREKIDGV KLESMGVYQI LAIYSTVASS LVLLVSLGAI

      48 YDYPKYSEES KLNREKIDGV KLESMGVYQI LAIYSTVASS LVLLVSLGAI

      49 YDYPKYSEES KLNREKIDGV KLESMGVYQI LAIYSTVASS LVLLVSLGAI

      76 .......... .......... .......... .......... ..........

共有序列 ydypkysees klnrekidgv klesmgvyqi laiystvass lvllvslgai

         551           566

      75 SFWMCSNGSL QCRICI

       9 SFWMCSNGSL QCRICI

      48 SFWMCSNGSL QCRICI

      49 SFWMCSNGSL QCRICI

      76 ................

共有序列 sfwmcsngsl gcrici

共有序列中大写字母表示所有序列在指定位置处共有的氨基酸;小写字母表示至少一半或大部分序列共有的氨基酸;符号“!”是I或V中任意一个;符号“$”是L或M中任意一个;符号“%”是F或Y中任意一个,符号“#”是N、D、Q、E、B或Z中任意一个;符号“.”是无氨基酸(例如缺失);第3位的X是A或V中任意一个;第52位的X是E或N中任意一个;第90位的X是K或R;第99位的X是T或K;第111位的X是Y或H中任意一个;第145位的X是V或T中任意一个;第157位的X是K或E;第162位的X是R或K;第182位的X是V或A;第203位的X是N或D;第205位的X是R或K;第210位的X是T或K;第225位的X是K或Y;第333位的X是H或缺失;第433位的X是I或L;第49位的X是N或D。

作为这种变异的另一实例,A/安徽/1/2005(H5N1)(SEQ ID NO:55)、A/越南/1194/2004(H5N1)和A/印度尼西亚/5/2006(H5N1)(SEQ ID NO:10)之HA的序列比对和共有序列示于如下表4中。

表4:所选H1N1毒株之HA的序列比对和共有序列

SEQ ID NO.                       序列

         1                                                   50

      10 MEKIVLLLAI VSLVKSDQIC IGYHANNSTE QVDTIMEKNV TVTHAQDILE

      56 MEKIVLLFAI VSLVKSDQIC IGYHANNSTE QVDTIMEKNV TVTHAQDILE

      55 MEKIVLLLAI VSLVKSDQIC IGYHANNSTE QVDTIMEKNV TVTHAQDILE

共有序列 MEKIVLLlAI VSLVKSDQIC IGYHANNSTE QVDTIMEKNV TVTHAQDILE

         51                                                 100

      10 KTHNGKLCDL DGVKPLILRD CSVAGWLLGN PMCDEFINVP EWSYIVEKAN

      56 KTHNGKLCDL DGVKPLILRD CSVAGWLLGN PMCDEFINVP EWSYIVEKAN

      55 KTHNGKLCDL DGVKPLILRD CSVAGWLLGN PMCDEFINVP EWSYIVEKAN

共有序列 KTHNGKLCDL DGVKPLILRD CSVAGWLLGN PMCDEFINVP EWSYIVEKAN

         101                                                150

      10 PTNDLCYPGS FNDYEELKHL LSRINHFEKI QIIPKSSWSD HEASSGVSSA

      56 PVNDLCYPGD FNDYEELKHL LSRINHFEKI QIIPKSSWSS HEASLGVSSA

      55 PANDLCYPGN FNDYEELKHL LSRINHFEKI QIIPKSSWSD HEASSGVSSA

共有序列 PxNDLCYPGx FNDYEELKHL LSRINHFEKI QIIPKSSWSd HEASsGVSSA

         151                                                200

      10 CPYLGSPSFF RNVVWLIKKN STYPTIKKSY NNTNQEDLLV LWGIHHPNDA

      56 CPYQGKSSFF RNVVWLIKKN STYPTIKRSY NNTNQEDLLV LWGIHHPNDA

      55 CPYQGTPSFF RNVVWLIKKN NTYPTIKRSY NNTNQEDLLI LWGIHHSNDA

共有序列 CPYqGxpSFF RNVVWLIKKN sTYPTIKrSY NNTNQEDLL! LWGIHHpNDA

         201                                                250

      10 AEQTRLYQNP TTYISIGTST LNQRLVPKIA TRSKVNGQSG RMEFFWTILK

      56 AEQTKLYQNP TTYISVGTST LNQRLVPRIA TRSKVNGQSG RMEFFWTILK

      55 AEQTKLYQNP TTYISVGTST LNQRLVPKIA TRSKVNGQSG RMDFFWTILK

共有序列 AEQTkLYQNP TTYIS!GTST LNQRLVPkIA TRSKVNGQSG RM#FFWTILK

         251                                                300

      10 PNDAINFESN GNFIAPEYAY KIVKKGDSAI MKSELEYGNC NTKCQTPMGA

      56 PNDAINFESN GNFIAPEYAY KIVKKGDSTI MKSELEYGNC NTKCQTPMGA

      55 PNDAINFESN GNFIAPEYAY KIVKKGDSAI VKSEVEYGNC NTKCQTPIGA

共有序列 PNDAINFESN GNFIAPEYAY KIVKKGDSaI mKSElEYGNC NTKCQTPmGA

         301                                                350

      10 INSSMPFHNI HPLTIGECPK YVKSNRLVLA TGLRNSPQRE SRRKKRGLFG

      56 INSSMPFHNI HPLTIGECPK YVKSNRLVLA TGLRNSPQRE RRRKKRGLFG

      55 INSSMPFHNI HPLTIGECPK YVKSNKLVLA TGLRNSPLRE RRRK.RGLFG

共有序列 INSSMPFHNI HPLTIGECPK YVKSNrLVLA TGLRNSPqRE rRRKkRGLFG

         351                                                400

      10 AIAGFIEGGW QGMVDGWYGY HHSNEQGSGY AADKESTQKA IDGVTNKVNS

      56 AIAGFIEGGW QGMVDGWYGY HHSNEQGSGY AADKESTQKA IDGVTNKVNS

      55 AIAGFIEGGW QGMVDGWYGY HHSNEQGSGY AADKESTQKA IDGVTNKVNS

共有序列 AIAGFIEGGW QGMVDGWYGY HHSNEQGSGY AADKESTQKA IDGVTNKVNS

         401                                                450

      10 IIDKMNTQFE AVGREFNNLE RRIENLNKKM EDGFLDVWTY NAELLVLMEN

      56 IIDKMNTQFE AVGREFNNLE RRIENLNKKM EDGFLDVWTY NAELLVLMEN

      55 IIDKMNTQFE AVGREFNNLE RRIENLNKKM EDGFLDVWTY NAELLVLMEN

共有序列 IIDKMNTQFE AVGREFNNLE RRIENLNKKM EDGFLDVWTY NAELLVLMEN

         451                                                500

      10 ERTLDFHDSN VKNLYDKVRL QLRDNAKELG NGCFEFYHKC DNECMESIRN

      56 ERTLDFHDSN VKNLYDKVRL QLRDNAKELG NGCFEFYHKC DNECMESVRN

      55 ERTLDFHDSN VKNLYDKVRL QLRDNAKELG NGCFEFYHKC DNECMESVRN

共有序列 ERTLDFHDSN VKNLYDKVRL QLRDNAKELG NGCFEFYHKC DNECMES!RN

         501                                                550

      10 GTYNYPQYSE EARLKREEIS GVKLESIGTY QILSIYSTVA SSLALAIMMA

      56 GTYDYPQYSE EARLKREEIS GVKLESIGIY QILSIYSTVA SSLALAIMVA

      55 GTYDYPQYSE EARLKREEIS GVKLESIGTY QILSIYSTVA SSLALAIMVA

共有序列 GTY#YPQYSE EARLKREEIS GVKLESIGtY QILSIYSTVA SSLALAIMvA

         551             568

      10 GLSLWMCSNG SLQCRICI

      56 GLSLWMCSNG SLQCRICI

      55 GLSLWMCSNG SLQCRICI

共有序列 GLSLWMCSNG SLQCRICI

共有序列中大写字母表示所有序列在指定位置处共有的氨基酸;小写字母表示至少一半或大部分序列共有的氨基酸;符号“!”是I或V中任意一个;符号“$”是L或M中任意一个;符号“%”是F或Y中任意一个,符号“#”是N、D、Q、E、B或Z中任意一个;第102位的X是T、V或A;第110位的X是S、D或N;第156位的X是S、K或T。

以上例举和描述的比对和共有序列是血凝素氨基酸序列中变异的非限制性实例,所述氨基酸序列可用于本发明多个实施方案中以在植物中生产VLP。

可容易地测定编码氨基酸序列的核酸,因为每种氨基酸的密码子是本领域公知的。因此,提供氨基酸序列则可得出编码它的简并核酸序列。因此,本发明提供了编码本文所述的流感毒株和亚型(例如A/新喀里多尼亚/20/99(H1N1)、A/印度尼西亚/5/2006(H5N1)、A/鸡/纽约/1995、A/银鸥/DE/677/88(H2N8)、A/得克萨斯/32/2003、A/绿头鸭/MN/33/00、A/鸭/上海/1/2000、A/针尾鸭/TX/828189/02、A/火鸡/安大略/6118/68(H8N4)、A/琵嘴鸭/伊朗/G54/03、A/鸡/德国/N/1949(H10N7)、A/鸭/英格兰/56(H11N6)、A/鸭/阿尔伯达/60/76(H12N5)、A/鸥/马里兰/704/77(H13N6)、A/绿头鸭/Gurjev/263/82、A/鸭/澳大利亚/341/83(H15N8)、A/红嘴鸥/瑞典/5/99(H16N3)、B/Lee/40、C/约翰内斯堡/66、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛3/2006(H1N1)、A/布里斯班10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、B/马来西亚/2506/2004、B/佛罗里达/4/2006、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/马/布拉格/56(H7N7)、A/香港/1073/99(H9N2))之血凝素的核酸序列以及编码上述血凝素的简并序列。

此外,可容易地测定核酸编码的氨基酸序列,因为每种氨基酸的密码子是公知的。因此,提供核酸则可得出其编码的氨基酸序列。因此,本发明提供了本文所述的流感毒株和亚型(例如A/新喀里多尼亚/20/99(H1N1)、A/印度尼西亚/5/2006(H5N1)、A/鸡/纽约/1995、A/银鸥/DE/677/88(H2N8)、A/得克萨斯/32/2003、A/绿头鸭/MN/33/00、A/鸭/上海/1/2000、A/针尾鸭/TX/828189/02、A/火鸡/安大略/6118/68(H8N4)、A/琵嘴鸭/伊朗/G54/03、A/鸡/德国/N/1949(H10N7)、A/鸭/英格兰/56(H11N6)、A/鸭/阿尔伯达/60/76(H12N5)、A/鸥/马里兰/704/77(H13N6)、A/绿头鸭/Gurjev/263/82、A/鸭/澳大利亚/341/83(H15N8)、A/红嘴鸥/瑞典/5/99(H16N3)、B/Lee/40、C/约翰内斯堡/66、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛3/2006(H1N1)、A/布里斯班10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、B/马来西亚/2506/2004、B/佛罗里达/4/2006、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/马/布拉格/56(H7N7)、A/香港/1073/99(H9N2))之血凝素的氨基酸序列。

在植物中,流感病毒VLP从质膜中出芽(参见实施例5和图19),因此,VLP的脂质组成反映了其来源。根据本发明生产的VLP包含一种或多种类型或亚型流感病毒的HA,其与植物来源的脂质复合。植物脂质可刺激特异性免疫细胞以及增强所诱导的免疫应答。植物的膜包含脂质、磷脂酰胆碱(PC)和磷脂酰乙醇胺(PE),并且还包含鞘糖脂、皂苷和植物固醇。此外,植物质膜中还存在脂质筏—这些微小区域富含鞘脂和固醇。在植物中,已知存在多种植物固醇,包括豆固醇、谷固醇、24-甲基胆固醇和胆固醇(Mongrand等,2004)。

PC和PE以及鞘糖脂可结合哺乳动物免疫细胞表达的CD1分子,所述免疫细胞例如抗原呈递细胞(APC)(例如树突状细胞和巨噬细胞)以及其它细胞包括胸腺和肝脏中的B淋巴细胞和T淋巴细胞(Tsuji M,.2006)。CD1分子在结构上与主要组织相容性复合体(MHC)I类分子相似,其作用是将糖脂抗原呈递给NKT细胞(自然杀伤T细胞)。活化后,NKT细胞激活先天免疫细胞(例如NK细胞和树突状细胞)并且还激活获得性免疫细胞(例如产生抗体的B细胞和T细胞)。

在质膜中可发现多种植物固醇—该特异性组成可因物种、生长条件、营养源或病原体状态而异(以上因素仅为举例说明)。一般而言,β-谷固醇是最丰富的植物固醇。

存在于与脂双层(例如质膜来源的包膜)复合的流感病毒VLP中的植物固醇可提供有利的疫苗组合物。不希望受理论限制,与脂双层(例如质膜来源的包膜)复合的由植物生产的VLP可诱导比在其它表达系统中制得的VLP更强的免疫反应,并且可与由活的或减毒的全病毒疫苗诱导的免疫反应相似。

因此,在一些实施方案中,本发明提供了与植物来源之脂双层复合的VLP。在一些实施方案中,所述植物来源的脂双层可包含VLP的包膜。

在植物内生产的VLP可诱导含有植物特异性N-聚糖的HA。因此,本发明还提供了包含具有植物特异性N-聚糖之HA的VLP。

此外,植物中N-聚糖的修饰是公知的(参见例如U.S.60/944,344,其通过引用并入本文),并且可产生含有经修饰N-聚糖的HA。可得到包含经修饰糖基化模式(例如岩藻糖基化减少、木糖基化减少、或二者均减少)之N-聚糖的HA,或者可得到含有经修饰糖基化模式的HA,其中蛋白质缺少岩藻糖基化、木糖基化或两者皆缺少,并包含增加的半乳糖基化。此外,与表达HA的野生型植物相比,翻译后修饰的调节(例如末端添加半乳糖)可导致所表达HA的岩藻糖基化和木糖基化降低。

例如(但不视为限制),合成具有经修饰糖基化模式的HA可通过使目的蛋白质与编码β-1,4-半乳糖基转移酶(GalT)(例如但不限于哺乳动物GalT或人GalT,然而,也可以使用其它来源的GalT)的核苷酸序列共表达来实现。还可将GalT的催化结构域与N-乙酰氨基葡萄糖基转移酶(GNT1)的CTS结构域(即胞质尾、跨膜结构域、主干区)融合以产生GNT1-GalT杂合酶,并且该杂合酶可与HA共表达。HA还可与编码N-乙酰氨基葡萄糖基转移酶III(GnT-III)(例如但不限于哺乳动物GnT-III或人GnT-III,还可使用其它来源的GnT-III)的核苷酸序列共表达。另外,还可使用包含与GnT-III融合的GNT1之CTS的GNT1-GnT-III杂合酶。

因此,本发明还包括含有HA的VLP,所述HA具有经修饰的N-聚糖。

不希望受理论限制,HA上存在植物N-聚糖可通过促进抗原呈递细胞与HA的结合来刺激免疫应答。Saint-jore-Dupas等(2007)已提出使用植物N-聚糖来刺激免疫应答。此外,VLP的构象对于抗原呈递可以是有利的,并且当与植物来源的脂质层复合时增强VLP的佐剂作用。

“调控区”、“调控元件”或“启动子”意指通常(但不总是)位于基因的蛋白质编码区上游的一部分核酸,其可包括DNA或RNA或者DNA和RNA两者。当调控区有活性并与目的基因有效结合或有效连接时,可导致所述目的基因的表达。调控元件可以介导器官特异性,或控制发育基因或时序基因的活化。“调控区”包括启动子元件、表现出启动子基础活性的核心启动子元件、可响应于外部刺激而诱导的元件、介导启动子活性的元件(例如负调控元件或转录增强子)。本文所用的“调控区”还包括在转录后具有活性的元件,例如调节基因表达的调控元件(例如翻译增强子和转录增强子、翻译抑制子和转录抑制子)、上游激活序列以及mRNA不稳定性决定子(mRNA instability determinant)。这后几种元件中有几种可位于编码区附近。

在本公开内容中,术语“调控元件”或“调控区”一般是指通常(但不总是)位于结构基因编码序列上游(5’)的DNA序列,其通过识别RNA聚合酶和/或转录所需的其它因子来控制编码区在特定位点起始表达。然而,应当理解的是,位于内含子中或序列3’端的其它核苷酸序列也可有助于调节目的编码区的表达。识别RNA聚合酶或其它转录因子以确保在特定位点起始的调控元件的一个实例是启动子元件。大多数(但不是全部)真核生物启动子元件包含TATA盒,其是由腺苷和胸苷核苷酸碱基对组成的保守核酸序列,通常位于转录起始位点上游约25个碱基对处。启动子元件包含负责起始转录的基础启动子元件以及修饰基因表达的其它调控元件(如上文所述)。

存在几种类型的调控区,包括受发育调节的、诱导型的或组成型的调控区。受发育调节的调控区或对所控制基因的差异性表达进行控制的调控区在特定器官或器官之组织中、在发育过程中的特定时间在所述器官或组织中被活化。然而,受发育调节的一些调控区也可偏好性地在某些器官或组织的特定发育阶段具有活性,它们还可以以受发育调节的方式具有活性,或在所述植物的其它器官或组织内具有基础水平的活性。组织特异性调控区(例如参见特异性调控区)的实例包括napin启动子和cruciferin启动子(Rask等,1998,J.Plant Physiol.152:595-599;Bilodeau等,1994,Plant Cell 14:125-130)。叶特异性启动子的实例包括质体蓝素启动子(图1b或SEQ ID NO:23),US 7,125,978,其通过引用并入本文。

诱导型调控区是能够响应于诱导物而直接或间接激活一种或多种DNA序列或基因之转录的调控区。当不存在诱导物时,所述DNA序列或基因不会被转录。通常,特异性结合诱导型调控区以激活转录的蛋白因子可以无活性形式存在,然后通过诱导物直接或间接转化成活性形式。然而,也可以不存在蛋白因子。所述诱导物可以是化学剂,例如蛋白质、代谢物、生长调节剂、除草剂或酚类化合物,或通过加热、致冷、盐或毒性元素直接施加的生理胁迫;或通过病原体或致病剂(例如病毒)的作用间接产生的生理胁迫。可通过向细胞或植物外部施加诱导物(例如通过喷雾、浇水、加热或类似方法)使含有诱导型调控区的植物细胞暴露于诱导物。诱导型调控元件可来源于植物基因或非植物基因(例如Gatz,C.和Lenk,I.R.P.,1998,Trends Plant Sci.3,352-358,其通过引用并入本文)。可能的诱导型启动子的实例包括但不限于四环素诱导型启动子(Gatz,C.,1997,Ann.Rev.Plant Physiol.Plant Mol.Biol.48,89-108,其通过引用并入本文)、类固醇诱导型启动子(Aoyama,T.和Chua,N.H.,1997,Plant J.2,397-404,其通过引用并入本文)和乙醇诱导型启动子(Salter,M.G.等,1998,Plant Journal16,127-132;Caddick,M.X.等,1998,Nature Biotech.16,177-180,其通过引用并入本文)、细胞分裂素诱导型IB6和CKI1基因(Brandstatter,I.和Kieber,J.J.,1998,Plant Cell 10,1009-1019;Kakimoto,T.,1996,Science274,982-985,其通过引用并入本文)以及生长素诱导型元件DR5(Ulmasov,T.等,1997,Plant Cell 9,1963-1971,其通过引用并入本文)。

组成型调控区指导基因在植物各部分以及整个植物发育过程中持续表达。已知的组成型调控元件的实例包括与以下转录物相关的启动子:CaMV 35S转录物(Odell等,1985,Nature,313:810-812)、水稻肌动蛋白1(Zhang等,1991,Plant Cell,3:1155-1165)、肌动蛋白2(An等,1996,PlantJ.,10:107-121)或tms 2(U.S.5,428,147,其通过引用并入本文)以及磷酸丙糖异构酶1基因(Xu等,1994,Plant Physiol.106:459-467)、玉米泛素1基因(Cornejo等,1993,Plant Mol.Biol.29:637-646)、拟南芥泛素1和6基因(Holtorf等,1995,Plant Mol.Biol.29:637-646)、烟草翻译起始因子4A基因(Mandel等,1995,Plant Mol.Biol.29:995-1004)。本文所用的术语“组成型”不一定是指受所述组成型调控区控制的基因在所有细胞类型中以相同水平表达,而是指所述基因在多种细胞类型中表达,即使常常观察到不同的丰度。

“有效连接”意指特定序列(例如调控元件与目的编码区)直接或间接地相互作用以实现预定功能(例如介导或调节基因表达)。有效连接的序列之间的相互作用可例如通过与所述有效连接之序列相互作用的蛋白质来介导。

本发明的一种或多种核苷酸序列可在由本发明的核苷酸序列、构建体或载体转化的任意合适的植物宿主中表达。合适宿主的实例包括但不限于农作物,包括苜蓿、油菜、芸苔属物种、玉米、烟草属物种、苜蓿、马铃薯、人参、豌豆、燕麦、水稻、大豆、小麦、大麦、向日葵和棉花等。

本发明的一种或多种嵌合基因构建体还可包含3’非翻译区。3’非翻译区是指这样的基因部分,其包含含有多腺苷酸化信号和能够影响mRNA加工或基因表达之任意其它调控信号的DNA区段。所述多腺苷酸化信号的特征一般在于向mRNA前体的3’端添加多腺苷酸链。多腺苷酸化信号常通过存在经典形式的5’AATAAA-3’同源物来鉴定,但是也会出现变异。需要时,本发明的一种或多种嵌合基因构建体还可包含另外的增强子(翻译增强子或转录增强子)。这些增强子区域是本领域技术人员公知的,并且可包括ATG起始密码子和邻近序列。所述起始密码子必须在编码序列的读码框内,以确保翻译出完整序列。

合适的3’区的非限制性实例是含有以下基因的多腺苷酸化信号的3’经转录的非翻译区:农杆菌致瘤(Ti)质粒基因(例如胭脂碱合酶(Nos基因))以及植物基因(例如大豆贮藏蛋白基因)、核酮糖-1,5-二磷酸羧化酶的小亚基基因(ssRUBISCO;US 4,962,028,其通过引用并入本文)、用于调节质体蓝素表达的启动子(Pwee和Gray 1993,其通过引用并入本文)。质体蓝素启动子的实例描述于US 7,125,978(其通过引用并入本文)中。

如本文所述,已发现包含增强子(经证实其在叶表达中具有效力)序列的启动子在瞬时表达中有效。不希望受理论限制,通过将光合作用基因的上游调控元件与核基质结合可介导强的表达。例如,可使用豌豆质体蓝素基因的翻译起始位点至-784位来介导强的报告基因表达。

为了帮助鉴定转化植物细胞,可进一步处理本发明的构建体使其包含植物选择标记。可用的选择标记包括提供针对化学品(例如抗生素,如庆大霉素、潮霉素、卡那霉素;或除草剂,如膦丝菌素(phosphinothrycin)、草甘膦、氯磺隆等)之抗性的酶。类似地,可使用产生可通过颜色变化进行鉴定之化合物的酶(例如GUS(β-葡萄糖醛酸酶))或化学发光的酶(萤光素酶或GFP)。

本发明还涉及包含本发明的嵌合基因构建体的转基因植物、植物细胞或种子。由植物细胞再生完整植物的方法也是本领域公知的。一般而言,将转化植物细胞培养在合适的培养基中,所述培养基可包含选择剂(例如抗生素),其中选择标记有利于鉴定转化植物细胞。愈伤组织一经形成,可根据已知的方法应用合适的植物激素来促进芽的形成,并将芽移至生根培养基中用于再生植物。然后,通过种子或利用植物无性繁殖技术,所述植物可反复用于形成子代。也可以不使用组织培养物来形成转基因植物。

本发明还涉及包含嵌合基因构建体的转基因植物、树木、酵母、细菌、真菌、昆虫和动物细胞,所述嵌合基因构建体含有编码用于根据本发明产生VLP之重组HA0的核酸。

为了在一系列可用于转化或瞬时表达的宿主生物中表达,可以将本发明的调控元件与目的编码区相组合。这样的生物包括但不限于植物(单子叶植物和双子叶植物),例如但不限于玉米、谷类植物、小麦、大麦、燕麦、烟草属物种、芸苔属物种、大豆、豌豆、苜蓿、马铃薯、番茄、人参和拟南芥。

用于稳定转化以及再生这些生物的方法已在本领域中建立并且是本领域技术人员公知的。获得转化植物和再生植物的方法对本发明来说不是关键性的。

“转化”意指表现为基因型、表型或二者兼有的遗传信息在种间的稳定转移。遗传信息从嵌合构建体向宿主进行种间转移可以是可遗传的,认为所述遗传信息的转移是稳定的;或者,所述转移可以是瞬时的,这时所述遗传信息是不可遗传的。

术语“植物物质”意指来源于植物的任何材料。植物物质可包括完整植株、组织、细胞或其任意部分。此外,植物物质可包括细胞内植物组分、细胞外植物组分、植物的液体或固体提取物,或者其组合。此外,植物物质可包括来自植物叶、茎、果实、根或其组合的植物、植物细胞、组织、液体提取物或其组合。植物物质可包括未进行任何处理步骤的植物或其部分。然而,还应当考虑的是,可对所述植物材料施加下文定义的最低限度处理步骤或更严格的处理,包括使用本领域公知的技术(包括但不限于色谱、电泳等)进行部分或大量蛋白质纯化。

术语“最低限度处理”意指部分纯化包含目的蛋白的植物物质(例如植物或其部分)以得到植物提取物、匀浆、植物匀浆的级分等(即最低限度处理)。部分纯化可包括但不限于破坏植物细胞结构从而产生含有可溶性植物组分和不溶性植物组分的组合物,所述不溶性植物组分可通过例如但不限于离心、过滤或其组合进行分离。在此方面,使用真空或离心提取可容易地获得分泌到叶或其它组织的细胞外空间内的蛋白质,或可以利用通过滚轴或研磨等在压力下进行组织提取从而将所述蛋白从细胞外空间中挤压或释放。最低限度处理还可包括制备可溶性蛋白质的粗提物,因为这些制备物中将含有可忽略不计的来自次植物产物的污染。另外,最低限度处理可包括从叶中用水性溶液提取可溶性蛋白质,然后用任意合适的盐进行沉淀。其它方法可包括大规模的浸渍和汁液提取,从而允许直接使用所述提取物。

可将植物物质(采取植物材料或组织的形式)经口递送给对象。所述植物物质可作为膳食补充剂的一部分与其它食物一起施用,或者被装入胶囊中。植物物质或组织还可以被浓缩以改善或增进适口性,或者在需要时与其它材料、成分或药物赋形剂一起提供。

可施用本发明VLP的对象或目标生物的实例包括但不限于人、灵长类、鸟类、水禽、候鸟、鹌鹑、鸭、鹅、家禽、鸡、猪、绵羊、马科动物、马、骆驼、犬科动物、狗、猫科动物、猫、虎、豹、麝猫、水貂、石貂、雪貂、宠物、家畜、兔、小鼠、大鼠、豚鼠或其它啮齿动物、海豹、鲸等。这些目标生物是示例性的,并且不视为限制本发明的应用和用途。

根据需要和情形,可以考虑以多种方式将含有目的蛋白的植物或表达含有目的蛋白之VLP的植物施用给对象或目标生物。例如,在使用之前,得自所述植物的目的蛋白可以粗提物、部分纯化或纯化的形式被提取。如果对蛋白质进行纯化,那么所述蛋白可以在可食用植物或不可食用植物中产生。此外,如果经口施用蛋白质,则可以收集所述植物组织并直接向对象饲喂,或者可在饲喂之前进行干燥,或者可以不预先收集而使动物在所述植物上进食。本发明还涉及将收集的植物组织作为动物饲料的食物补充剂。如果向动物饲喂的植物组织不进行或几乎不进行进一步处理的话,则优选所施用的植物组织是可食用的。

转录后基因沉默(PTGS)可参与限制转基因在植物中的表达,来自马铃薯Y病毒的沉默抑制子(HcPro)的共表达可用于抵抗转基因mRNA的特异性降解(Brigneti等,1998)。可替代的沉默抑制子是本领域熟知的并且可如本文所述使用(Chiba等,2006,Virology 346:7-14,其通过引用并入本文),例如但不限于TEV-p1/HC-Pro(烟草蚀纹病毒-p1/HC-Pro)、BYV-p21、番茄丛矮病毒的p19(TBSV p19)、番茄皱缩病毒的衣壳蛋白(TCV-CP)、黄瓜花叶病毒的2b(CMV-2b)、马铃薯X病毒的p25(PVX-p25)、马铃薯M病毒的p11(PVM-p11)、马铃薯S病毒的p11(PVS-p11)、蓝莓枯黄病毒的p16(BScV-p16)、柑橘衰退病毒(Citrustristexa virus)的p23(CTV-p23)、葡萄卷叶相关病毒-2的p24(GLRaV-2p24)、葡萄病毒A的p10(GVA-p10)、葡萄病毒B的p14(GVB-p14)、白芷潜伏性病毒(Heracleum latent virus)的p10(HLV-p10)或大蒜普通潜伏性病毒的p16(GCLV-p16)。因此,沉默抑制子(例如但不限于HcPro、TEV-p1/HC-Pro、BYV-p21、TBSV p19、TCV-CP、CMV-2b、PVX-p25、PVM-p11、PVS-p11、BScV-p16、CTV-p23、GLRaV-2p24、GBV-p14、HLV-p10、GCLV-p16或GVA-p10)可与编码目的蛋白的核酸序列共表达以进一步确保在植物中生产高水平蛋白质。

此外,可生产含有多种HA亚型之组合的VLP。例如,VLP可包含来自H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15、H16亚型或其组合的一种或多种HA。HA组合的选择可由VLP制得之疫苗的目的用途来确定。例如,用于接种鸟的疫苗可包含HA亚型的任意组合,而用于接种人的VLP可包含H1、H2、H3、H5亚型的一种或多种亚型。然而,根据VLP的用途,也可制备其它的HA亚型组合。为了生产含有HA亚型组合的VLP,可将期望的HA亚型在同一细胞(例如植物细胞)中共表达。

此外,如本文所述生产的VLP不包含神经氨酸酶(NA)。然而,如果含有HA和NA的VLP是所期望,则可将NA与HA共表达。

此外,本发明还包括合适的载体,其含有适用于稳定或瞬时表达系统中的嵌合构建体。所述遗传信息还可提供在一种或多种构建体中。例如,可将编码目的蛋白的核苷酸序列引入一种构建体中,可将编码修饰目的蛋白糖基化之蛋白质的第二核苷酸序列引入单独的构建体中。然后,可将这些核苷酸序列在植物中共表达。然而,也可使用包含编码目的蛋白和修饰目的蛋白糖基化之蛋白质的核苷酸序列的构建体。在此情形中,所述核苷酸序列将包含第一序列和第二序列,所述第一序列包含与启动子或调控区有效连接的编码目的蛋白的第一核酸序列,所述第二序列包含与启动子或调控区有效连接的编码修饰目的蛋白糖基化之蛋白质的第二核酸序列。

“共表达”意指两种或两种以上核苷酸序列大致同时在植物中以及在植物的同一组织中表达。然而,所述核苷酸序列不必严格地同时表达。而是说,所述两种或更多种核苷酸序列的表达使得所编码产物有机会相互作用。例如,所述修饰目的蛋白糖基化的蛋白质可在目的蛋白表达前或表达期间表达,以允许发生对目的蛋白的糖基化修饰。可使用瞬时表达系统共表达两种或两种以上的核苷酸序列,其中所述两种或更多种序列大致同时在适于这两种序列表达的条件下被导入植物中。或者,可以用所述核苷酸序列之一(例如,编码目的蛋白的序列)以瞬时或稳定方式转化含有编码修饰所述目的蛋白糖基化之蛋白质的序列的平台植物(platformplant)。在此情形中,编码修饰目的蛋白糖基化之蛋白质的序列可在期望的发育阶段表达在期望的组织内,或者可使用诱导型启动子诱导其表达,而编码目的蛋白的其它序列可在相似条件下在同一组织内表达,以确保所述核苷酸序列的共表达。

可使用Ti质粒、Ri质粒、植物病毒载体、直接DNA转化、显微注射、电穿孔等将本发明的构建体导入植物细胞中。这些技术的综述参见例如Weissbach和Weissbach,Methods for Plant Molecular Biology,Academy Press,纽约VIII,421-463页(1988);Geierson和Corey,PlantMolecular Biology,第2版(1988)以及Miki和Iyer,Fundamentals ofGene Transfer in Plants.Plant Metabolism,第2版,DT.Dennis,DHTurpin,DD Lefebrve,DB Layzell(编),Addison Wesly,Langmans Ltd.London,561-579页(1997)。其它的方法包括直接DNA摄入、使用脂质体、电穿孔(例如使用原生质体)、显微注射、微弹(microprojectile)或whisker以及真空渗入。参见例如Bilang等(Gene 100:247-250(1991))、Scheid等(Mol.Gen.Genet.228:104-112,1991)、Guerche等(Plant Science 52:111-116,1987)、Neuhause等(Theor.Appl Genet.75:30-36,1987)、Klein等,Nature 327:70-73(1987)、Howell等(Science 208:1265,1980)、Horsch等(Science 227:1229-1231,1985)、DeBlock等,Plant Physiology 91:694-701,1989),Methods for Plant MolecularBiology(Weissbach和Weissbach编,Academic Press Inc.,1988)、Methods in Plant Molecular Biology(Schuler和Zielinski编,AcademicPress Inc.,1989)、Liu和Lomonossoff(J.Virol Meth,105:343-348,2002);美国专利No.4,945,050;5,036,006和5,100,792;美国专利申请序列号08/438,666(1995年5月10日提交)以及07/951,715(1992年9月25日提交)(所有这些文献均通过引用并入本文)。

可使用瞬时表达法表达本发明的构建体(参见Liu和Lomonossoff,2002,Journal of Virological Methods,105:343-348,其通过引用并入本文)。或者,可使用基于真空的瞬时表达法,如Kapila等1997(其通过引用并入本文)所述。这些方法可包括例如但不限于农杆菌接种法或农杆菌渗入法,然而,也可使用其它瞬时方法,如上文所述。使用农杆菌接种法或农杆菌渗入法时,含有期望核酸的农杆菌混合物进入组织(例如叶)的细胞间隙、植物的地上部分(包括茎、叶和花)、植物的其它部分(茎、根、花)或整个植株中。穿过表皮后,所述农杆菌感染细胞并将t-DNA拷贝移至细胞中。所述t-DNA以附加体形式转录并且其mRNA被翻译,导致在感染细胞中产生目的蛋白,然而,t-DNA在细胞核内的这种传递是瞬时的。

如果目的核苷酸序列编码的产物对所述植物具有直接或间接的毒性,则通过使用本发明的方法可降低对整株植物的毒性,其通过在期望的组织中或者在期望的植物发育阶段中选择性表达目的核苷酸序列来实现。此外,当在植物中制备毒性产物时,由瞬时表达导致的有限表达时间也可降低所述作用。可使用诱导型启动子、组织特异性启动子或细胞特异性启动子来选择性指导目的序列的表达。

本发明VLP的重组HA可与现有的流感病毒疫苗组合使用,以补充所述疫苗,使它们更加有效,以及降低所需的施用剂量。如本领域技术人员所公知地,疫苗可针对一种或多种流感病毒。合适的疫苗的实例包括但不限于Sanofi-Pasteur、ID Biomedical、Merial、Sinovac、Chiron、Roche、MedImmune、GlaxoSmithKline、Novartis、Sanofi-Aventis、Serono、Shire Pharmaceuticals等市售的疫苗。

需要时,可将本发明的VLP与本领域技术人员公知的合适佐剂混合。此外,VLP可用于疫苗组合物中,其含有用于治疗靶标生物的有效剂量VLP,如上文所述。此外,根据本发明生产的VLP可与使用不同流感病毒蛋白质(例如神经氨酸酶(NA))得到的VLP相组合。

因此,本发明提供了用于诱导动物或靶标生物中针对流感病毒感染之免疫的方法,其包括施用有效剂量的疫苗,所述疫苗含有一种或多种VLP。所述疫苗可经口、皮内、鼻内、肌内、腹膜内、静脉内或皮下施用。

根据本发明生产的VLP的施用描述于实施例6中。与施用可溶性HA相比,施用由植物生产的H5 VLP产生显著更高的应答(参见图21A和21B)。

如图26A和26B所示,施用A/印度尼西亚/5/05 H5 VLP的对象产生了针对流感病毒A/土耳其/582/06(H5N1;“土耳其H5N1”)攻击的交叉保护。在攻击之前施用印度尼西亚H5 VLP不导致体重的任何减轻。然而,未施用H5 VLP但用土耳其H5N1攻击的对象表现出显著的体重减轻,并且有几只对象死亡。

因此,这些数据表明由植物生产的含有H5血凝素病毒蛋白的流感病毒VLP诱导特异性针对病原性流感毒株的免疫应答,并且该病毒样颗粒可从植物质膜出芽。

因此,本发明提供了包含含有流感病毒HA蛋白的有效剂量VLP、一种或多种植物脂质以及可药用载体的组合物。所述流感病毒HA蛋白可以是H5印度尼西亚/5/2006。还提供了诱导对象中针对流感病毒感染之免疫的方法。该方法包括施用含有流感病毒HA蛋白的病毒样颗粒、一种或多种的植物脂质以及可药用载体。所述病毒样颗粒可经口、皮内、鼻内、肌内、腹膜内、静脉内或皮下施用给对象。

本发明多个实施方案的组合物可包含两种或更多种流感毒株或亚型的VLP。“两种或更多种”是指两种、三种、四种、五种、六种、七种、八种、九种、十种或更多种毒株或亚型。所示毒株或亚型可以是单一亚型(例如,所有都为H1N1,或所有都为H5N1),或者可以是亚型的组合。示例性的亚型和毒株包括但不限于本文所述的那些,例如A/新喀里多尼亚/20/99(H1N1)、A/印度尼西亚/5/2006(H5N1)、A/鸡/纽约/1995、A/银鸥/DE/677/88(H2N8)、A/得克萨斯/32/2003、A/绿头鸭/MN/33/00、A/鸭/上海/1/2000、A/针尾鸭/TX/828189/02、A/火鸡/安大略/6118/68(H8N4)、A/琵嘴鸭/伊朗/G54/03、A/鸡/德国/N/1949(H10N7)、A/鸭/英格兰/56(H11N6)、A/鸭/阿尔伯达/60/76(H12N5)、A/鸥/马里兰/704/77(H13N6)、A/绿头鸭/Gurjev/263/82、A/鸭/澳大利亚/341/83(H15N8)、A/红嘴鸥/瑞典/5/99(H16N3)、B/Lee/40、C/约翰内斯堡/66、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛3/2006(H1N1)、A/布里斯班10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、B/马来西亚/2506/2004、B/佛罗里达/4/2006、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/马/布拉格/56(H7N7)、A/香港/1073/99(H9N2)。

对毒株和亚型之组合的选择可取决于可能暴露于流感病毒之对象的地区;动物物种(例如水禽类、农业动物(例如猪)等)与待免疫人群的接近程度以及所述动物物种携带、暴露或可能暴露的毒株;对亚型或毒株内抗原漂移的预测;或者这些因素的组合。过去几年所使用的组合的实例可见于URL:who.int/csr/dieease/influenza/vaccinerecommendations1/en。可将这些毒株中的某些或全部应用于所示组合中,或产生疫苗组合物的其它组合中。

更特别地,示例性组合可包括来自两种或更多种选自以下的毒株或亚型的VLP:A/布里斯班/59/2007(H1N1)、A/布里斯班/59/2007(H1N1)样病毒、A/布里斯班/10/2007(H3N2)、A/布里斯班/10/2007(H3N2)样病毒、B/佛罗里达/4/2006或B/佛罗里达/4/2006样病毒。

另一示例性组合可包括来自两种或更多种选自以下的毒株或亚型的VLP:A/印度尼西亚/5/2005、A/印度尼西亚/5/2005样病毒、A/越南/1194/2004、A/越南/1194/2004样病毒、A/安徽/1/05、A/安徽/1/05样病毒、A/鹅/贵阳/337/2006、A/鹅/贵阳/337/2006样病毒、A/鸡/山西/2/2006或A/鸡/山西/2/2006样病毒。

另一示例性组合可包括A/鸡/意大利/13474/99(H7型)或A/鸡/英属哥伦比亚省/04(H7N3)流感毒株的VLP。

另一示例性组合可包括A/鸡/香港/G9/97或A/香港/1073/99的VLP。另一示例性组合可包括A/所罗门群岛/3/2006的VLP。另一示例性组合可包括A/布里斯班/10/2007的VLP。另一示例性组合可包括A/威斯康星/67/2005的VLP。另一示例性组合可包括B/马来西亚/2506/2004、B/佛罗里达/4/2006或B/布里斯班/3/2007毒株或亚型的VLP。

所述两种或更多种VLP可单独表达,随后将纯化的或半纯化的VLP相组合。或者,VLP可在同一宿主(例如植物)中共表达。VLP可以期望的比例(例如大致相等的比例)组合或生产,或者可以组合以使一种亚型或毒株占组合物中VLP的大部分。

因此,本发明提供了包含两种或更多种毒株或亚型之VLP的组合物。

包膜病毒的VLP通常从它们出芽时所穿过的膜获得它们的包膜。植物质膜具有可具有免疫刺激作用的植物固醇成分。为了研究该可能性,在存在或不存在佐剂的情形下将由植物生产的H5 VLP施用给动物并测定HAI(血细胞凝集抑制抗体反应)(图22A、22B)。在未添加佐剂的情形中,由植物产生的H5 VLP表现出显著的HAI,这表示对施用抗原的全身免疫应答。此外,在存在或不存在佐剂的情形中,所施用VLP的抗体同种型谱相似(图23A)。

表5列出了本发明多个实施方案中提供的序列。

表5:针对序列标识的序列描述

 SEQ ID No  序列描述  本公开内容中 1  H1片段N端  图5a 2  H1片段C端  图5b 3  H5编码序列  图6 4  引物Plato-443c  图7a  5  引物SpHA(Ind)-Plasto.r  图7b  6  引物Plato-SpHA(Ind).c  图7c  7  引物HA(Ind)-Sac.r  图7d  8  用于H1表达的基于苜蓿质体蓝素之  表达盒的序列  图1  9  HA1肽序列(A/新喀里多尼亚/20/99)  图8a  10  HA5肽序列(A/印度尼西亚/5/2006)  图8b  11  A型流感病毒H7亚型编码序列  (A/鸡/纽约/1995)  图9  12  A型流感病毒H2亚型编码序列  (A/银鸥/DE/677/88(H2N8))  图10a  13  A型流感病毒H3亚型编码序列  (A/得克萨斯/32/2003)  图10b  14  A型流感病毒H4亚型编码序列  (A/绿头鸭/MN/33/00)  图10c  15  A型流感病毒H5亚型编码序列  (A/鸭/上海/1/2000)  图10d  16  A型流感病毒H6亚型编码序列  (A/针尾鸭/TX/828189/02)  图10e

 SEQ ID No  序列描述  本公开内容中  17  A型流感病毒H8亚型编码序列  (A/火鸡/安大略/6118/68(H8N4))  图10f  18  A型流感病毒H9亚型编码序列  (A/琵嘴鸭/伊朗/G54/03)  图10g  19  A型流感病毒H10亚型编码序列  (A/鸡/德国/N/1949(H10N7))  图10h  20  A型流感病毒H11亚型编码序列  (A/鸭/英格兰/56(H11N6))  图10i  21  A型流感病毒H12亚型编码序列  (A/鸭/阿尔伯达/60/76(H12N5))  图10j  22  A型流感病毒H13亚型编码序列  (A/鸥/马里兰/704/77(H13N6))  图10k  23  A型流感病毒H14亚型编码序列  (A/绿头鸭/Gurjev/263/82)  图10l  24  A型流感病毒H15亚型编码序列  图10m  (A/鸭/澳大利亚/341/83(H15N8))  25  A型流感病毒H16亚型编码序列  (A/红嘴鸥/瑞典/5/99(H16N3))  图10n  26  B型流感病毒HA编码序列  (B/Lee/40)  图10o  27  C型流感病毒HA编码序列  (C/约翰内斯堡/66)  图10p  28  全长HA0 H1序列  图5c  29  引物XmaI-pPlas.c  图10q

 SEQ ID No  序列描述  本公开内容中  30  引物SacI-ATG-pPlas.r  图10r  31  引物SacI-PlasTer.c  图10s  32  引物EcoRI-PlasTer.r  图10t  33  A/新喀里多尼亚/20/99(H1N1)  GenBank登录号AY289929  图16  34  紫花苜蓿蛋白质二硫键异构酶  GenBank登录号Z11499  图17  35  A/波多黎各/8/34(H1N1)  GenBank登录号NC_002016.1  图18  36  克隆体774:从DraIII至SacI的  DNA,包含与编码A/布里斯班  /59/2007(H1N1)之HA的序列有效  连接的质体蓝素调控区  图28  37  克隆体775:从DraIII至SacI的  DNA,包含与编码A/所罗门群岛  3/2006(H1N1)之HA的序列有效连  接的质体蓝素调控区  图29  38  克隆体776:从DraIII至SacI的  DNA,包含与编码A/布里斯班  10/2007(H3N2)之HA的序列有效  连接的质体蓝素调控区  图30  39  克隆体777:从DraIII至SacI的  DNA,包含与编码A/威斯康星  /67/2005(H3N2)之HA的序列有效  连接的质体蓝素调控区  图31

 SEQ ID No  序列描述  本公开内容中  40  克隆体778:从DraIII至SacI的  DNA,包含与编码B/马来西亚  /2506/2004之HA的序列有效连接的  质体蓝素调控区  图32  41  克隆体779:从DraIII至SacI的  DNA,包含与编码B/佛罗里达/4/2006  之HA的序列有效连接的质体蓝素调  控区  图33  42  克隆体780:从DraIII至SacI的  DNA,包含与编码A/新加坡/1/57  (H2N2)之HA的序列有效连接的  质体蓝素调控区  图34  43  克隆体781:从DraIII至SacI的  DNA,包含与编码A/安徽/1/2005  (H5N1)之HA的序列有效连接的  质体蓝素调控区  图35  44  克隆体782:从DraIII至SacI的  DNA,包含与编码A/越南/1194/2004  (H5N1)之HA的序列有效连接的  质体蓝素调控区  图36  45  克隆体783:从DraIII至SacI的  DNA,包含与编码A/水鸭/香港  /W312/97(H6N1)之HA的序列有  效连接的质体蓝素调控区  图37  46  克隆体784:从DraIII至SacI的  DNA,包含与编码A/马/布拉格/56  (H7N7)之HA的序列有效连接的  质体蓝素调控区  图38

 SEQ ID No  序列描述  本公开内容中  47  克隆体785:从DraIII至SacI的  DNA,包含与编码A/香港/1073/99  (H9N2)之HA的序列有效连接的  质体蓝素调控区  图39  48  克隆体774的HA氨基酸序列  A/布里斯班/59/2007(H1N1)  图40A  49  克隆体775的HA氨基酸序列  A/所罗门群岛3/2006(H1N1)  图40B  50  克隆体776的HA氨基酸序列  A/布里斯班10/2007(H3N2)  图41A  51  克隆体777的HA氨基酸序列  A/威斯康星/67/2005(H3N2)  图41B  52  克隆体778的HA氨基酸序列  B/马来西亚/2506/2004  图42A  53  克隆体779的HA氨基酸序列  B/佛罗里达/4/2006  图42B  54  克隆体780的HA氨基酸序列  A/新加坡/1/57(H2N2)  图43A  55  克隆体781的HA氨基酸序列  A/安徽/1/2005(H5N1)  图43B  56  克隆体782的HA氨基酸序列  A/越南/1194/2004(H5N1)  图44A  57  克隆体783的HA氨基酸序列  A/水鸭/香港/W312/97(H6N1)  图44B  58  克隆体784的HA氨基酸序列  A/马/布拉格/56(H7N7)  图45A

 SEQ ID No  序列描述  本公开内容中  59  克隆体785的HA氨基酸序列  A/香港/1073/99(H9N2)  图45B  60  HA表达盒,其包含苜蓿质体蓝素启  动子和5’UTR、来自A/印度尼西亚  /5/2005之H5(构建体#660)的血凝  素编码序列、苜蓿质体蓝素3’UTR  和终止子序列  图51  61  HA表达盒,其包含苜蓿质体蓝素启  动子和5’UTR、来自A/新喀里多尼  亚/20/1999之H1(构建体#540)的  血凝素编码序列、苜蓿质体蓝素  3’UTR和终止子序列  图52  62  HA表达盒,其包含苜蓿质体蓝素启  动子和5’UTR、来自A/布里斯班  图53  /59/2007之H1(构建体#774)的血  凝素编码序列、苜蓿质体蓝素3’UTR  和终止子序列  63  HA表达盒,其包含苜蓿质体蓝素启  动子和5’UTR、来自A/所罗门群岛  /3/2006(H1N1)之H1(构建体#775)  的血凝素编码序列、苜蓿质体蓝素  3’UTR和终止子序列  图54  64  HA表达盒,其包含苜蓿质体蓝素启  动子和5’UTR、来自A/新加坡/1/57  (H2N2)之H2(构建体#780)的  血凝素编码序列、苜蓿质体蓝素  3’UTR和终止子序列  图55

 SEQ ID No  序列描述  本公开内容中  65  HA表达盒,其包含苜蓿质体蓝素启  动子和5’UTR、来自A/安徽/1/2005  (H5N1)之H5(构建体#781)的  血凝素编码序列、苜蓿质体蓝素  3’UTR和终止子序列  图56  66  HA表达盒,其包含苜蓿质体蓝素启  动子和5’UTR、来自A/越南  /1194/2004(H5N1)之H5(构建体  #782)的血凝素编码序列、苜蓿质  体蓝素3’UTR和终止子序列  图57  67  HA表达盒,其包含苜蓿质体蓝素启  动子和5’UTR、来自A/水鸭/香港  /W312/97(H6N1)之H6(构建体#  783)的血凝素编码序列、苜蓿质体  蓝素3’UTR和终止子序列  图58  68  HA表达盒,其包含苜蓿质体蓝素启  动子和5’UTR、来自A/香港/1073/99  (H9N2)之H9(构建体#785)的  血凝素编码序列、苜蓿质体蓝素  3’UTR和终止子序列  图59  69  HA表达盒,其包含苜蓿质体蓝素启  图60  动子和5’UTR、来自A/布里斯班  /10/2007(H3N2)之H3的血凝素编  码序列、苜蓿质体蓝素3’UTR和终  止子序列  70  HA表达盒,其包含苜蓿质体蓝素启  动子和5’UTR、来自A/威斯康星  /67/2005(H3N2)之H3的血凝素编  码序列、苜蓿质体蓝素3’UTR和终  止子序列  图61

 SEQ ID No  序列描述  本公开内容中  71  HA表达盒,其包含苜蓿质体蓝素启  动子和5’UTR、来自A/马/布拉格/56  (H7N7)之H7的血凝素编码序列、  苜蓿质体蓝素3’UTR和终止子序列  图62  72  HA表达盒,其包含苜蓿质体蓝素启  动子和5’UTR、来自B/马来西亚  /2506/2004之HA的血凝素编码序  列、苜蓿质体蓝素3’UTR和终止子  序列  图63  73  HA表达盒,其包含苜蓿质体蓝素启  动子和5’UTR、来自B/佛罗里达  /4/2006之HA的血凝素编码序列、苜  蓿质体蓝素3’UTR和终止子序列  图64  74  SEQ ID NO:49、48、33和9的共有  序列  图65  75  SEQ ID NO:33编码H1(新喀里多  尼亚)(AAP34324.1)的氨基酸序列  图67  76  SEQ ID NO:35编码的H1(波多黎  各)(NC_0409878.1)的氨基酸序列  图68

本发明将通过仅参考下述非限制性实施例的方式进行详述。

方法和材料

1.表达盒的组装

使用Sambrook和Russell(2001;其通过参考并入本文)的一般分子生物学操作方法完成所有操作。第一个克隆步骤是组装受体质粒,其包含苜蓿质体蓝素基因的上游和下游调控元件。使用寡核苷酸引物XmaI-pPlas.c(SEQ ID NO:29;图10Q)和SacI-ATG-pPlas.r(SEQ IDNO:30;图10R)从苜蓿基因组DNA中扩增质体蓝素启动子和5’UTR序列。所得扩增产物用XmaI和SacI消化并与预先用同样的酶进行消化的pCAMBIA2300(Cambia,Canberra,Australia)连接以形成pCAMBIApromoPlasto。类似地,使用引物SacI-PlasTer.c(SEQ ID NO:31;图10S)和EcoRI-PlasTer.r(SEQ ID NO:32;图10T)从苜蓿基因组DNA中扩增质体蓝素基因的3’UTR序列和终止子,所得产物用SacI和EcoRI消化,然后插入到pCAMBIApromoPlasto的同样位点中以形成pCAMBIAPlasto。

将流感毒株A/新喀里多尼亚/20/99(H1N1)之H1基因的开放阅读框作为两个片段来合成(Plant Biotechnology Institute,NationalResearch Council,Saskatoon,Canada)。所合成的第一片段对应于缺少了5’端信号肽编码序列和3’端跨膜结构域编码序列的野生型H1编码序列(GenBank登录号AY289929;SEQ ID NO:33;图16)。将BglII限制性位点添加在编码序列的5’端,将SacI/StuI双位点添加在紧邻该片段3’端终止密码子下游,得到SEQ ID NO:1(图5A)。还合成了编码H1蛋白C端(包含跨膜结构域和胞质尾)的第二片段,其从KpnI位点至终止密码子,并且其3’侧翼是SacI/StuI限制性位点(SEQ ID NO.2;图5B)。

所述第一H1片段用BglII和SacI消化,并克隆到含有质体蓝素启动子和5’UTR之二元载体(pCAMBIAPlasto)的同样位点中,并与苜蓿蛋白质二硫键异构酶(PDI)基因(32-103位核苷酸;登录号Z11499;SEQ ID NO:34;图17)的信号肽融合得到PDI-H1嵌合基因,该嵌合基因位于质体蓝素调控元件的下游。含有PDI信号肽的基于质体蓝素的盒序列示于图1中(SEQ ID NO:8)。所得质粒包含与PDI信号肽融合的H1编码区,并且侧翼为质体蓝素调控元件。通过将预先用KpnI和SacI消化的合成片段(SEQ ID NO:2;图5B)插入到H1表达质粒中来添加C端编码区(编码跨膜结构域和胞质尾)。所得质粒称为540,其示于图11中(还参见图2A)。

2.H5表达盒的组装

利用Epoch Biolabs(Sugar Land,TX,USA)合成编码流感毒株A/印度尼西亚/5/05(H5N1;登录号LANL ISDN125873)之血凝素的片段。所产生的片段示于SEQ ID NO:3(图6)中,其包含H5全长编码区,所述全长编码区包含天然信号肽,其侧翼为紧邻起始ATG上游的HindIII位点以及紧邻终止密码子(TAA)下游的SacI位点。通过Darveau等(1995)中所示的基于PCR的连接方法将H5编码区克隆到基于质体蓝素的表达盒中。简言之,使用引物Plato-443c(SEQ ID NO:4;图7A)和SpHA(Ind)-Plasto.r(SEQ ID NO:5;图7B),以pCAMBIApromoPlasto作为模板进行第一次PCR扩增。平行地,使用引物Plasto-SpHA(Ind).c(SEQ ID NO:6;图7C)和HA(Ind)-Sac.r(SEQ IDNO:7;图7D),以H5编码片段作为模板进行第二次扩增。将由上述两个反应得到的扩增物混合,将所得混合物作为模板,使用Plato-443c(SEQ ID NO:4;图7A)和HA(Ind)-Sac.r(SEQ ID NO:7;图7D)作为引物进行第三次反应(组装反应)。用BamHI(在质体蓝素启动子中)和SacI(在所述片段的3’端)消化所得片段并将其克隆到先前用同样的酶进行消化的pCAMBIAPlasto中。所得质粒称为660,其示于图2B中(还参见图11)。

通过用编码亮氨酸拉链GCN4pII变体的片段替换编码540中跨膜结构域和胞质尾的区域来制备编码可溶形式H1的盒(Harbury等,1993,Science 1993;262:1401-1407)。将该片段合成成侧翼具有KpnI和SacI位点以促进克隆。由该替换得到的质粒称为544,该表达盒示于图11中。

合成马铃薯蚀纹病毒(TEV)5’UTR与流感病毒A/PR/8/34 M1基因(登录号NC_002016)开放阅读框的融合蛋白,其在终止密码子下游加入了侧翼SacI位点。该片段用SwaI(在TEV 5’UTR中)和SacI消化,并克隆到pCAMBIA二元质粒中基于2X35S/TEV的表达盒中。所得质粒具有受控于2X35S/TEV启动子的M1编码区和5’UTR以及NOS终止子(构建体750;图11)。

如Hamilton等(2002)所述制备HcPro构建体(35HcPro)。对所有克隆进行测序以证实构建体的完整性。所述质粒用于通过电穿孔转化根瘤农杆菌(AGL1;ATCC,Manassas,VA 20108,USA)(Mattanovich等,1989)。通过限制性酶切图谱证实所有根瘤农杆菌株的完整性。

3.植物生物质的准备、接种、农杆菌渗入和收获

在填装市售的泥炭基质的平地中用种子培养本塞姆氏烟草或普通烟草(Nicotiana tabacum)。使植物生长在温室中,16/8光照周期,温度采用白天25℃/晚上20℃。播种3周后,挑出各株幼苗,移栽到盆中,并在同样的环境条件下在温室中再生长3周。转化前,在不同时间通过掐掉植物的芽或通过化学处理植物而除去顶芽和腋芽。

在补充有10mM 2-[N-吗啉]乙磺酸(MES)、20μM乙酰丁香酮、50μg/ml卡那霉素和25μg/ml羧苄青霉素的YEB培养基(pH 5.6)中培养用构建体660、540、544、750或35SHcPro转染的农杆菌,直至其OD600为0.6~1.6。使用前将农杆菌混悬液离心并重悬在渗入培养基(10mM MgCl2和10mM MES,pH 5.6)中。如Liu和Lomonossoff(2002,Journal of Virological Methods,105:343-348)所述进行注射器渗入。对于真空渗入而言,将根瘤农杆菌混悬液离心,重悬在渗入培养基中,并储存在4℃过夜。在渗入当天,将分批培养物稀释成2.5倍培养物体积并在使用前温热。在20-40托真空下,使本塞姆氏烟草或普通烟草的整个植株倒置于气密性不锈钢罐中的细菌混悬液中2分钟。注射器或真空渗入后,将植株移回温室中培养4-5天直至收获。

4.叶片取样和总蛋白质提取

培养后,收获植株的地上部分,冷冻在-80℃,进行破碎。通过将每个冷冻破碎植物材料的样品在3倍体积的冷的50mM Tris(pH 7.4)、0.15M NaCl和1mM苯甲基磺酰氟中匀浆(Polytron)来提取总的可溶性蛋白质。匀浆后,于4℃下以20,000g对浆液离心20分钟,将这些澄清的粗提物(上清)用于分析。使用牛血清白蛋白作为参照标准,通过Bradford测定(Bio-Rad,Hercules,CA)来测定经纯化粗提物的总蛋白质含量。

5.蛋白质提取物的体积排阻色谱

填装有32ml SephacrylTM S-500高分辨率珠(S-500HR:GEHealthcare,Uppsala,Sweden,货号17-0613-10)的体积排阻色谱(SEC)柱用平衡/洗脱缓冲液(50mM的Tris(pH8),150mM NaCl)平衡。将1.5mL粗蛋白质提取物加到该柱上,然后用45mL平衡/洗脱缓冲液进行洗脱。以1.5mL级分收集洗脱液,洗脱级分的相对蛋白质含量通过将10μL级分与200μL稀释的Bio-Rad蛋白染色试剂(Bio-Rad,Hercules,CA)混合来监测的。用2倍柱体积的0.2N NaOH清洗该柱,然后用10倍柱体积的50mM Tris(pH8)、150mM NaCl和20%乙醇溶液清洗。每次分离之后用Blue Dextran 2000(GE Healthcare Bio-Science Corp.,Piscataway,NJ,USA)校准所述柱。在每次分离之间对Blue Dextran 2000和宿主可溶性蛋白质的洗脱曲线进行比较,以确保所用柱之间的洗脱曲线的一致性。

6.蛋白质分析与免疫印迹

通过BCA蛋白质测定(Pierce Biochemicals,Rockport IL)来测定蛋白质浓度。在还原条件下通过SDS-PAGE分离蛋白质,并用考马斯蓝染色。对经染色的凝胶进行扫描,并使用ImageJ Software(NIH)进行密度分析。

用丙酮沉淀来自SEC洗脱级分的蛋白质(Bollag等,1996),重悬在1/5体积的平衡/洗脱缓冲液中,在还原条件下通过SDS-PAGE分离并电转移到聚偏氟乙烯(PVDF)膜(Roche Diagnostics Corporation,Indianapolis,IN)上用于免疫检测。在免疫印迹之前,用Tris缓冲盐水(TBS-T)中5%脱脂奶和0.1%Tween-20在4℃下封闭所述膜16~18小时。

通过用2μg/ml合适的抗体(表6)(在2%脱脂奶、0.1%TBS-Tween20溶液中)孵育进行免疫印迹。用于化学发光检测的第二抗体示于表4中,如所示在2%脱脂奶、0.1%TBS-Tween 20溶液中稀释。使用luminol(Roche Diagnostics Corporation)作为底物,通过化学发光检测免疫反应性复合物。使用EZ-Link Plus活化辣根过氧化物酶缀合试剂盒(Pierce,Rockford,IL)进行人IgG抗体的辣根过氧化物酶缀合。

表6:用于所表达蛋白质免疫印迹的电泳条件、抗体和稀释度

  HA  亚型  流感毒株  电泳  条件  第一抗体  稀释度  第二抗体  稀释度  H1  A/布里斯班  /59/2007  还原性  FII 10-I50  4μg/ml  山羊抗小鼠(JIR  115-035-146)  1∶100  (H1N1)  H1  A/所罗门群岛  /3/2006  (H1N1)  还原性  NIBSC  07/104  1∶2000  兔抗绵羊(JIR  313-035-045)  1∶100  H1  A/新喀里多尼  亚/20/99  (H1N1)  还原性  FII 10-I50  4μg/ml  山羊抗小鼠(JIR  115-035-146)  1∶100  H2  A/新加坡/1/57  (H2N2)  非还原  性  NIBSC  00/440  1∶1000  兔抗绵羊(JIR  313-035-045)  1∶100  H5  A/印度尼西亚  /5/2005  (H5N1)  还原性  ITC  IT-003-005V  1∶4000  山羊抗兔(JIR  111-035-144)  1∶100  H5  A/安徽/1/2005  (H5N1)  还原性  NIBSC  07/338  1∶750  兔抗绵羊(JIR  313-035-045)  1∶100

  HA  亚型  流感毒株  电泳  条件  第一抗体  稀释度  第二抗体  稀释度  H5  A/越南  /1194/2004  (H5N1)  非还原  性  ITC  IT-003-005  1∶2000  山羊抗兔(JIR  111-035-144)  1∶100  H6  A/水鸭/香港  /W312/97  (H6N1)  非还原  性  BEI NR 663  1∶500  兔抗绵羊(JIR  313-035-045)  1∶100  H9  A/香港  /1073/99  (H9N2)  还原性  NIBSC  07/146  1∶1000  兔抗绵羊(JIR  313-035-045)  1∶10000

FII:Fitzgerald Industries International,Concord,MA,USA;

NISBIC:National Institute for Biological Standards and Control;

JIR:Jackson ImmunoResearch,West Grove,PA,USA;

BEI NR:Biodefense and emerging infections research resources repository;

ITC:Immune Technology Corporation,Woodside,NY,USA

针对H5的血凝素分析是基于Nayak.和Reichl(2004)所述的方法。简言之,在含有100μL PBS的V形底96孔微滴定板中进行测试样品的两倍系列稀释(100μL),使每孔中含有100μL稀释样品。将100μL0.25%火鸡红细胞悬液(Bio Link Inc.,Syracuse,NY)加到每孔中,将板在室温下孵育2小时。将显示完全血细胞凝集的最高稀释度的倒数记录为HA活性。平行地,用PBS稀释重组HA标准物(A/越南/1203/2004H5N1)(Protein Science Corporation,Meriden,CT),并作为每个板的对照。

7.蔗糖梯度超离心

将对含有H5的生物质进行凝胶过滤色谱而洗脱得到的1mL级分9、10和11合并,并加到20~60%(重量/体积)不连续蔗糖密度梯度中,以125 000g(4℃)离心17.5小时。从顶部起,将梯度物分级分离成19个3mL级分,并在免疫分析和血细胞凝集测定之前通过透析除去蔗糖。

8.电子显微镜

首先,使用30MWCO超滤装置(Millipore,Billerica,MA,USA)将待通过电子显微镜(EM)观察的来自SEC的洗脱级分进行浓缩。在4℃下,将所述浓缩级分在含有2%戊二醛的PBS(pH7.4)中固定24小时。一经固定,将所述样品吸附在经Formvar涂敷的200目镍网(Canemco,Lakefield,Canada)上2分钟,用去离子水清洗网两遍,然后用1%磷钨酸染色。在放大倍数为10000×至150000×的透射电子显微镜下进行观察(图4A和4B中的图像)。

或者,将100μL待测样品置于Airfuge超离心管(BeckmanInstruments,Palo Alto,CA,USA)中。将网置于该管的底部,然后将所述管以120 000g离心5分钟。取出网,温和干燥并置于3%磷钨酸(pH6)液滴上进行染色。利用Hitachi 7100透射电子显微镜(TEM)检测网(图14B、15B和15C中的图像)。

对于图19中的图像而言,将约1mm3的叶块用含有2.5%戊二醛的PBS固定,并用含有3%蔗糖的PBS清洗,然后用1.33%四氧化锇再次固定。用Spurr树脂对固定样品进行包埋,并将超薄切片铺于网上。用5%醋酸双氧铀和0.2%柠檬酸铅对样品进行正染色,然后观察。利用Hitachi 7100透射电子显微镜(TEM)观察网。

9.质膜脂质分析

根据Mongrand等人利用聚乙二醇3350/葡聚糖T-500(各6.6%)在水性聚合物两相系统中分配而进行细胞分级分离后,从烟草叶和培养的BY2细胞得到质膜(PM)。所有步骤均在4℃下进行。

根据Bligh和Dyer所述,从不同级分提取和纯化脂质。使用Lefebvre等所述的溶剂体系通过一维HP-TLC分离极性和中性脂质。如Macala等所述,用醋酸铜染色后检测脂质的PM级分。通过比较脂质的迁移时间与标准物的迁移时间来鉴定脂质(除了SG得自Matreya,Pleasant Gap,PA,USA以外,其它所有标准物均得自Sigma-Aldrich,St-Louis,MO,USA)。

10.H5 VLP的纯化

使用市售的搅拌器,在1.5倍体积的50mM Tris(pH 8)、NaCl 150mM和0.04%偏亚硫酸氢钠溶液中对冷冻的经660渗入的本塞姆氏烟草叶进行匀浆。向所得提取物中添加1mM PMSF,并用1M醋酸调节至pH6,然后在42℃加热5分钟。将硅藻土(DE)添加到经热处理的提取物中,以吸附由pH变化和热处理所沉淀出的污染物,并通过Whatman滤纸过滤所述浆液。所得澄清的提取物在室温下以10000×g离心10分钟以除去残留的DE,通过0.8/0.2μm Acropack 20滤器,并加到胎球蛋白-琼脂糖亲和柱(Sigma-Aldrich,St-Louis,MO,USA)上。用400mM NaCl、25mM Tris(pH 6)清洗后,用1.5M NaCl、50mMMES(pH 6)洗脱所结合的蛋白质。向洗脱的VLP中添加Tween-80使终浓度为0.0005%(体积/体积)。利用100kDa MWCO Amicon膜浓缩VLP,在40℃以10000×g离心30分钟,并用含有0.01%Tween-80和0.01%硫柳汞的PBS(pH7.4)重悬。使用之前对混悬的VLP进行过滤除菌。

1.1动物研究

小鼠

利用6~8周龄雌性BALB/c小鼠(Charles River Laboratories)对流感病毒VLP施用的免疫应答进行研究。将70只小鼠随机分到14组中,每组5只。8组用于肌内免疫,6组用于测试鼻内施用途径。所有组均以两剂方案免疫,即初次免疫后3周进行加强免疫。

对于在后肢进行肌内施用而言,用由植物生产的VLP H5疫苗(0.1、1、5或12μg)或对照血凝素(HA)抗原免疫未麻醉的小鼠。对照HA含有基于A/印度尼西亚/5/05 H5N1毒株制备并从293细胞培养物(Immune Technology Corp.,New York,USA)中纯化的重组可溶性血凝素(除非另外指明,每剂注射使用5μg)。缓冲液对照是PBS。该抗原由HA蛋白的18~530位氨基酸组成,并具有组氨酸标签(His-tag)和经修饰的切割位点。电子显微镜观察证实了该市售产品不是VLP形式。

为了测量佐剂的作用,用5μg由植物生产的VLP H5疫苗外加1倍体积的2%铝胶(明矾,Accurate Chemical & Scientific Corporation,Westbury,NY,US)或用5μg从293细胞培养物中纯化的重组血凝素外加1倍体积的明矾来分别免疫两组动物。将70只小鼠随机分到14组中,每组5只。8组用于肌内免疫,6组用于测试鼻内施用途径。所有组均根据初免-加强方案进行免疫,即初次免疫后3周进行加强免疫。

对于在后肢进行肌内施用而言,用由植物生产的VLP H5疫苗(0.1、1、5或12μg)或对照血凝素(HA)抗原(5μg)或PBS免疫未麻醉的小鼠。在免疫之前以1∶1体积比将各抗原制备物与1%铝胶(明矾,Accurate Chemical & Scientific Corporation,Westbury,NY,US)混合。为了测量佐剂的作用,用不含任何佐剂的5μg由植物生产的VLPH5疫苗或者用不含任何佐剂的5μg对照HA抗原分别免疫两组动物。

对于鼻内施用而言,使用自动吸气室通过吸入异氟烷短暂麻醉小鼠。然后,用由植物生产的VLP疫苗(0.1或1μg)或者用对照HA抗原(1μg)或者用PBS以4μl滴/鼻孔来免疫小鼠。在免疫之前将各抗原制备物与1%壳聚糖谷氨酸(Protosan,Novamatrix/FMC BioPolymer,Norway)混合。然后,使小鼠在所述溶液中呼吸。为了验证鼻内施用途径中佐剂的作用,用1μg由植物生产的VLP H5疫苗或用1μg对照HA抗原来分别免疫两组动物。

雪貂

使用10组雪貂(雄性,18~24周龄,重量约为1kg),每组5只。如表7中所述对每组进行处理。所用的佐剂是2%铝胶(明矾)(SuperfosBiosector,Denmark)(终浓度为1%)。疫苗组合物是如所述制备的膜相关的A/印度尼西亚/5/05(H5N1)VLP。疫苗对照(阳性对照)是来自印度尼西亚毒株的完全糖基化的膜结合重组H5,其由ImmuneTechnology Corporation(ITC)使用293细胞培养物中的腺病毒来制备。

表7.处理组

  组  n  注射给动物的产品  施用途径  佐剂  1  5  PBS(阴性对照)  i.m.*  -  2  5  由植物生产的疫苗,1μg  i.m.  -  3  5  由植物生产的疫苗,1μg  i.m.  明矾  4  5  由植物生产的疫苗,5μg  i.m.  -  5  5  由植物生产的疫苗,5μg  i.m.  明矾  6  5  由植物生产的疫苗,7.5μg  i.m.  -  7  5  由植物生产的疫苗,15μg  i.m.  -  8  5  由植物生产的疫苗,15μg  i.m.  明矾

  组  n  注射给动物的产品  施用途径  佐剂  9  5  由植物生产的疫苗,30μg  i.m.  -  10  5  由植物生产的疫苗,5μg  i.m.  -

*i.m.:肌内

在研究期间定期评价雪貂的整体健康情况和外观(体重、直肠温度、姿态、皮毛、运动模式、呼吸、排泄)。在第0、14和28天向四头肌中肌内注射(0.5~1.0倍总体积)来免疫动物;对于引入佐剂的方案而言,在免疫之前以1∶1体积比将疫苗组合物与铝胶混合。在第0天(免疫前)以及第21和第35天获取血清样品。在第40~45天处死(放血/心脏穿刺)动物,收集脾脏并进行尸检。

可使用同源或异源的失活H5N1病毒,利用ELISA测定来定量抗流感病毒的抗体效价。

如Aymard等(1973)所述,利用微滴定HAI评估血清样品(免疫前、第21天和第35天)的血细胞凝集抑制抗体效价。简言之,用受体破坏酶对血清进行预处理,热失活并与红细胞(经清洗的血红细胞(RBC))混悬液混合。推荐使用来自Lampire的经清洗的马RBC(10%),考虑到该测定可根据RBC来源而变化(马依赖型),测试了来自10匹马的经清洗RBC,以选择最敏感的批次。或者,可使用火鸡的RBC。抗体效价表示为完全抑制血细胞凝集的最高稀释度的倒数。

交叉反应性HAI效价:用针对A/印度尼西亚/5/05(进化枝2.1)的疫苗免疫的雪貂的HAI效价使用来自另一亚进化枝或进化枝的失活H5N1流感毒株(例如进化枝1越南毒株(A/越南/1203/2004和A/越南/1194/2004)或者A/安徽/01/2005(亚进化枝2.3)或A/火鸡/土耳其/1/05(亚进化枝2.2))测量。所有分析均是针对单个样品进行的。

数据分析:对所有数据进行统计学分析(ANOVA)以确定组与组之间的差异是否具有统计学显著性。

致命性攻击的实验设计(小鼠)

将128只小鼠随机分到16组中,每组8只动物,1组未免疫且未受攻击(阴性对照)。所有组均以两剂方案通过肌内施用进行免疫,在初次免疫后2周进行第二次免疫。

对于在后肢进行肌内施用而言,用由植物生产的H5 VLP疫苗(1、5或15μg)或15μg对照HA抗原或PBS免疫未麻醉的小鼠。在免疫之前将各抗原制备物与1倍体积的1%铝胶(明矾,Accurate Chemical &Scientific Corporation,Westbury,NY,US)混合。

在免疫期间,每周为小鼠称重一次,并观察和监测注射部位的局部反应。

第二次免疫后第22天,在BL4防护实验室(P4-JeanMérieux-INSERM,Lyon,France)对经麻醉小鼠鼻内攻击(i.n.)4.09×106的50%细胞培养物感染剂量(CCID50)的流感病毒A/土耳其/582/06病毒(由法国里昂大学的Bruno Lina博士馈赠)。攻击之后,在14天内观察小鼠的疾病临床症状并每日称重。将具有严重感染症状且体重减轻≥25%的小鼠麻醉后处以安乐死。

血液收集、肺和鼻腔清洗以及脾脏收集

在初次免疫后第14天和第二次免疫后第14天收集未麻醉动物的侧隐静脉之静脉血。以8000g离心10分钟收集血清。

在第二次免疫后4周,利用CO2气体麻醉小鼠并在终止后马上进行心脏穿刺以收集血液。

最后放血后,将导管朝向肺插入气管中,将1ml冷的PBS-蛋白酶抑制剂混合溶液置于与所述导管相连的1cc注射器中并注射到肺中,然后取出用于分析。该清洗步骤进行2次。对肺清洗物进行离心以除去细胞碎片。对于鼻内清洗而言,将导管朝鼻区方向插入,将0.5ml PBS-蛋白酶抑制剂混合溶液通过所述导管推进鼻腔中,然后收集。对鼻清洗物进行离心以除去细胞碎片。收集用5μg添加佐剂的由植物生产之疫苗或5μg添加佐剂的重组H5抗原进行肌内免疫的小鼠以及用1μg添加佐剂的由植物生产之疫苗或1μg添加佐剂的重组H5抗原进行鼻内免疫的小鼠的脾脏。将收集的脾脏置于补充有庆大霉素的RPMI中,并用10ml注射器的推筒将所述脾脏研碎到50ml锥形管中。清洗研碎的脾脏2次,以2000rpm离心5分钟,室温下用ACK裂解缓冲液重悬5分钟。用PBS-庆大霉素清洗脾细胞,重悬在5%RPMI中并计数。脾细胞用于增殖测定。

抗体效价

在初次免疫后第14天以及第二次免疫后第14天和第28天测量血清的抗流感病毒抗体效价。使用失活病毒A/印度尼西亚/5/05作为包被抗原,利用酶联免疫吸附测定(ELISA)测定效价。终点效价表示为达到高出阴性对照样品至少0.1的OD值的最高稀释度的倒数。

对于抗体种类测定而言(IgG1、IgG2a、IgG2b、IgG3、IgM),如上文所述通过ELISA评估效价。

血细胞凝集抑制(HI)效价

如先前所述(WHO 2002;Kendal 1982),在第二次免疫后第14天和第28天测量血清的血细胞凝集抑制(HI)效价。将A/印度尼西亚/5/05或A/越南/1203/2004毒株的失活病毒制备物用于测试小鼠血清样品的HI活性。用由霍乱弧菌(Kendal 1982)制得的受体破坏酶II(RDE II)(DenkaSeiken Co.,Tokyo,Japan)对血清进行预处理。用0.5%火鸡血红细胞进行HI测定。HI抗体效价被定义为引起完全凝集抑制的最高稀释度的倒数。

实施例

实施例1.通过农杆菌渗入法在本塞姆氏烟草植物中瞬时表达流感病毒A/印度尼西亚/5/05(H5N1)血凝素

通过A/印度尼西亚/5/05(H5N1)毒株之H5亚型的表达来测定瞬时表达系统产生流感病毒血凝素的能力。如图11所示,首先将带有天然信号肽和跨膜结构域的血凝素基因编码序列(登录号EF541394)组装在质体蓝素表达盒(来自苜蓿质体蓝素基因的启动子、5’UTR、3’UTR以及转录终止序列)中,将所组装的盒(660)插入到pCAMBIA二元质粒中。然后,将该质粒转染到农杆菌(AGL1)中,得到重组株AGL1/660,其用于瞬时表达。

用AGL1/660渗入本塞姆氏烟草植物,并在6天的培养期后收获叶。为了测定H5是否在农杆菌渗入的叶中积累,首先从经渗入的叶组织中提取蛋白质并通过Western印迹利用抗-H5(越南)多克隆抗体进行分析。检测到提取物中约72kDa的独特条带(图12),其大小对应于未切割的流感病毒血凝素HA0形式。用作阳性对照的市售H5(A/越南/1203/2004;Protein Science Corp.,Meriden,CT,USA)被检测为约48kDa和28kDa的两个条带,分别对应于HA1和HA2片段的分子量。这表明H5在经渗入叶中的表达导致未切割之翻译产物的累积。

来自经AGL1/660转化的叶的粗蛋白质提取物能够凝集火鸡血红细胞,证明形成了活性HA三聚体(数据未显示)。

实施例2:使用体积排阻色谱表征植物提取物中含有血凝素的结构

通过凝胶过滤对由植物生产的流感病毒血凝素组装成高分子量结构进行评估。通过体积排阻色谱(SEC)利用SephacrylTM S-500HR柱(GEHealthcare Bio-Science Corp.,Piscataway,NJ,USA)对经AGL1/660渗入之植物的粗蛋白质提取物(1.5mL)进行分级分离。使用抗HA抗体通过免疫检测测定洗脱级分的总蛋白质含量和HA丰度(图13A)。如图13A所示,Blue Dextran(2MDa)洗脱物早在级分10中出现峰值,而大部分宿主蛋白质仍保留在柱中并在级分14与22之间被洗脱出来。当利用丙酮沉淀法将来自200μL各SEC洗脱级分的蛋白质浓缩(5倍)并通过Western印迹(图15A,H5)分析时,血凝素(H5)主要存在于级分9~14中(图13B)。不希望受理论限制,这表明HA蛋白已被组装成大的超级结构或已附着于高分子量结构上。

将第二表达盒与来自A/新喀里多尼亚/20/99(H1N1)(SEQ ID NO:33;图16;GenBank登录号AY289929)的H1核酸序列进行组装以产生构建体540(图11)。设计嵌合基因构建体以产生可溶性三聚体形式的H1,其中信号肽源自植物蛋白质二硫键异构酶基因,H1的跨膜结构域被GCN4亮氨酸拉链的pII变体替代,其已显示可自组装成三聚体的肽(Harbury等,1993)(盒544,图11)。虽然缺乏跨膜结构域,但是该可溶性三聚体形式仍具有血细胞凝集能力(数据未显示)。

通过SEC对用AGL1/540或AGL1/544渗入之植物的蛋白提取物进行分级分离,用抗A型流感病毒抗体(Fitzgerald,Concord,MA,USA)通过Western印迹检测H1洗脱级分的存在。在经AGL1/540渗入的叶中,H1主要以很高分子量的结构累积,其中峰朝较小结构偏离(H1;图13C)。在经AGL1/544渗入的叶中,可溶性形式的H1作为分离的三聚体累积,这可通过与宿主蛋白质洗脱曲线平行的凝胶过滤洗脱曲线来证明(可溶性H1;图13D)。相比较而言,由5~6个血凝素三聚体微团组成的H1玫瑰花结(Protein Science Corp.,Meriden,CT,USA)在级分12~16中洗脱出来(图13E),早于可溶性H1(图13D)但晚于天然H1(图13C)。

为了评价M1共表达对血凝素组装成结构的影响,使用对应于A/PR/8/34(H1N1)M1编码序列(SEQ ID NO:35;图18;GenBank登录号NC_002016)的核酸组装了M1表达盒。该构建体称为750,示于图11中。对于M1和H1共表达而言,在渗入前以相等体积混合AGL1/540和AGL1/750混悬液。多种农杆菌混悬液的共渗入允许共表达多种转基因。对SEC洗脱级分的Western印迹分析表明M1共表达不改变H1结构的洗脱曲线,但导致经农杆菌渗入的叶中H1累积减少(参见图13F)。

实施例3:通过蔗糖梯度离心分离H5结构并在电子显微镜下观察

在电子显微镜(EM)下观察血凝素结构需要的浓度和纯度水平比从SEC获得的叶蛋白质粗提物更高。为了能通过EM观察H5结构,首先通过PEG沉淀(20%聚乙二醇)浓缩叶蛋白质粗提物,然后重悬在1/10体积的提取缓冲液中。将所浓缩的蛋白提取物通过S-500HR凝胶过滤进行分级分离,并合并洗脱级分9、10和11(对应于柱的空隙体积),通过20~60%蔗糖密度梯度超速离心,进一步与宿主蛋白质分离。在分析之前,从顶部开始进行蔗糖梯度分级分离,将级分透析,并利用100NMWL离心过滤装置进行浓缩。如Western印迹和血细胞凝集结果所示(图14A),H5主要累积在级分16~19中,其含有约60%蔗糖,而大多数宿主蛋白质在级分13中出现峰值。合并级分17、18和19,进行负染色,并在EM下观察。对样品的观察清楚地表明存在大小为80~300nm的刺突球状结构,其与流感病毒VLP的形态学特征相吻合(图14B)。

实施例4:来自植物生物质的流感病毒H5VLP的纯化

除了含量丰富的可溶性蛋白质以外,植物的叶提取物中含有可溶性糖、核酸和脂质的复杂混合物。通过改变pH和热处理然后利用硅藻土过滤对粗提物进行纯化(参见“材料和方法”部分中有关纯化方法的详述)。图15A(泳道1~4)表示考马斯蓝染色的凝胶,其比较了多个纯化步骤的蛋白质含量。粗提物(泳道1)和经纯化提取物(泳道4)中蛋白质含量的比较表明,纯化步骤能降低总蛋白质含量以及除去叶粗提物中的大多数主要污染物(显示为50kDa)。所述50kDa条带对应于RuBisCO大亚基,占叶总蛋白质的高达30%。

通过亲和色谱利用胎球蛋白柱对来自这些经澄清提取物的流感病毒H5VLP进行纯化。对加样级分(图15A,泳道5)、流穿(图15A,泳道6)以及经洗脱VLP(图15A,泳道7)的比较表明胎球蛋白亲和柱对经澄清植物提取物中的流感病毒H5VLP具有特异性。

如利用考马斯蓝染色的SDS-PAGE凝胶的密度测定所示(图15,泳道7),纯化步骤导致H5的纯度大于75%。为了评价所纯化产物的结构质量,利用100NMWL(nominal molecular weight limit,名义分子量极限)离心过滤装置对经纯化的H5进行浓缩,并在负染色后于EM下观察。图15B显示了表示存在大量VLP的代表性部分。更加细致地观察证实了VLP上存在刺突(图15C)。

如图15D所示,基于考马斯蓝染色的H5血凝素的密度以及基于通过BCA法测定的总蛋白质含量,利用胎球蛋白柱亲和色谱将来自经澄清叶提取物的H5VLP纯化至纯度约89%。

通过凝集火鸡红细胞的能力证实HA VLP生物活性(数据未显示)。

图20B还通过Western印迹目测以及利用抗H5多克隆血清(A/越南/1203/2004)进行的免疫检测验证了纯化VLP的身份。检测到约72kDa的独特条带,其大小对应于未切割的HA0形式流感病毒血凝素。图15c显示所述疫苗的VLP结构,其中血凝素刺突覆盖其结构。

通过0.22μm滤器过滤来制备用于免疫小鼠的VLP,利用内毒素LVL(Limulus Amebocyte Lysate)检测试剂盒(Lonza,Walkserville,MS,USA)测定内毒素含量。经过滤的疫苗含有105.8±11.6%EU/ml(内毒素单位/ml)。

实施例5:流感病毒VLP在植物中的定位

为了对VLP定位并证实其质膜来源,将产生H5的植物的叶薄切片固定,并在正染色后于TEM下观察。对叶细胞的观察表明VLP存在于由质膜内陷形成的细胞外腔中(图19)。所观察的VLP的形态和位置表明,尽管其质膜附着在细胞壁上,但是植物细胞具有产生来源于其质膜的流感VLP并将它们累积在质外体空隙中所需的可塑性。

实施例6:质膜脂质分析

对植物流感病毒VLP的组成和来源的进一步验证来自于对脂质成分的分析。从经纯化的VLP提取脂质,并通过高效薄层色谱(HP-TLC)将其组成与高度纯化的烟草质膜的组成进行比较。来自VLP与对照质膜的极性和中性脂质的迁移模式相似。经纯化的VLP包含在质膜中发现的主要磷脂(磷脂酰胆碱和磷脂酰乙醇胺)和鞘脂(葡萄糖神经酰胺)(图27A),并且二者均含有作为唯一中性脂质的游离固醇(图27B)。然而,对经纯化VLP提取物中质膜蛋白质标志物(ATP酶)的免疫检测表明,VLP脂双层不包含与植物质膜相关的主要蛋白质中任一种,这表明宿主蛋白质可能在VLP从植物细胞中出芽的过程中被排除在膜以外(图27C)。

实施例7:H5 VLP的免疫原性以及施用途径的影响

通过肌内注射或鼻内(吸入)向小鼠施用由植物生产的H5 VLP。根据所述的方法,将0.1~12μg VLP肌内注射给小鼠,以明矾作为佐剂。使用最低抗原量即观察到了峰值抗,其幅度与5μg重组可溶性血凝素(HA)相似(图20A)。

0.1~1μg由植物生产的H5 VLP与壳聚糖佐剂一起鼻内施用所提供的抗体应答大于重组可溶性HA与明矾佐剂所提供的抗体应答(图20B)。

对于这两种施用途径而言,在一定的抗原量范围内,在所有测试小鼠中均观察到血清转换。重组H5可溶性抗原产生低的(<1/40)或可忽略不计的(1<1/10,对于未加佐剂的重组H5而言)HI效价。

实施例8:H5 VLP的血细胞凝集抑制抗体效价(HAI)

图21A、21B示意在用由植物生产的H5VLP或重组可溶性HA“加强”后第14天的血细胞凝集抑制(HAI)抗体应答。当肌内施用时最低剂量的抗原(0.1μg)所产生的HAI应答是施用5μg重组可溶性HA的10倍。与最低剂量相比,H5 VLP的剂量增加导致HAI适度增加。

鼻内施用后,与施用1μg重组可溶性HA的小鼠(其与阴性对照类似)相比,施用由植物生产的H5 VLP(1.0或0.1μg)之小鼠的HAI应答显著提高。通过肌内注射H5 VLP(0.1~12μg)免疫的所有小鼠的HAI效价均高于用对照HA抗原免疫的小鼠(图4a~图21A)。对于同样的5μg剂量,VLP诱导的HAI效价是相应剂量的对照HA抗原的20倍。当通过鼻内途径递送时,VLP诱导的HAI效价也显著高于对照HA抗原(图21b)。对于给定剂量的H5 VLP而言,鼻内免疫之小鼠的HAI效价水平低于肌内免疫的小鼠;当肌内施用时,1μg VLP诱导的平均HAI效价为210,而鼻内施用同样剂量所诱导的平均HAI效价为34。

当肌内施用时,所有剂量VLP均诱导高水平的能与失活的同源全病毒结合的抗体(图20b和24)。由植物生产的VLP疫苗与对照HA抗原之间无显著差异(除了加强后第14天的12μg VLP组以外),因为这两种抗原制备物均诱导针对同源毒株的高结合抗体效价。然而,当鼻内施用时,VLP诱导的结合抗体效价高于对照HA抗原(图20b)。当与壳聚糖混合时,用1μg VLP免疫诱导的平均Ab效价倒数为5500,其是在用1μg对照HA抗原免疫的小鼠中水平(平均Ab效价倒数为920)的8.6倍。

然后,通过在小鼠中进行剂量范围研究来研究由植物生产的流感VLP的免疫原性。以3周的间隔用配制在明矾(1∶1比例)中的0.1μg至12μg含有来自流感病毒A/印度尼西亚/5/05(H5N1)之HA的VLP肌内免疫数组BALB/c小鼠(每组5只)。使用失活全病毒抗原(A/印度尼西亚/5/05(H5N1))测量第二次免疫后第14天收集之血清的血细胞凝集抑制效价(HI)。用低至0.1μg剂量VLP进行的免疫诱导抗体产生,所述抗体在高稀释度下抑制病毒凝集红细胞(图21A)。用5μg非VLP、明矾佐剂化的对照H5抗原(同样来自A/印度尼西亚/5/05)平行免疫小鼠所诱导的HI应答比用最低VLP剂量所产生的HI应答低2~3个对数值。

对于两种施用途径而言,在一定的抗原量范围内,施用VLP之小鼠的HAI应答均更佳。

实施例9:佐剂对H5 VLP免疫原性的作用

由植物生产的H5 VLP具有质膜来源(图19,实施例5)。不希望受理论限制,包膜病毒或包膜病毒的VLP通常从其出芽的膜获得包膜。植物质膜含有植物固醇成分(即使在动物细胞中发现,也非常稀少),并且已表明这些固醇的某一些表现出免疫刺激作用。

在佐剂存在或不存在下,向小鼠肌内(图22A)或鼻内(图22B)施用由植物生产的H5 VLP,并测定HAI(血细胞凝集抑制抗体应答)。在添加或不添加佐剂(明矾或壳聚糖,如这些实施例中所示)下,以任一施用体系施用VLP表现出比重组可溶性HA显著更高的HAI血细胞凝集抑制。即使不添加佐剂(即明矾或壳聚糖),由植物生产的H5 VLP仍表现出显著的HAI,这表示对施用所述抗原的全身免疫应答。

明矾使肌内施用VLP的平均HAI效价水平提高至5倍(图22a),使对照HA抗原的平均HAI效价水平提高至3.7倍。当肌内施用时,5μgVLP诱导的平均HAI效价比对应剂量的对照HA抗原高12倍。壳聚糖不提高对照HA抗原的平均HAI水平(图22b),而其使鼻内施用1μgVLP免疫的小鼠的平均HAI水平提高5倍。

实施例10:抗体同种型

在存在或不存在明矾作为所添加佐剂的情形下,施用由植物生产的H5 VLP或重组可溶性HA的小鼠表现出多种免疫球蛋白同种型(图23A)。

在添加佐剂的情形下,VLP与HA的抗体同种型模式相似,其中IgG1是主要的同种型。当不添加佐剂而施用VLP或HA时,IgG1应答降低,但仍是响应于VLP的主要同种型,IgM、IgG2a、IgG2B和IgG3保持与添加佐剂时相似的效价。当不添加佐剂而施用HA时,IgG1、IgG2a和IgG2b效价显著降低。

因此,这些数据表明,由植物生产的VLP不需要添加佐剂来激发宿主的抗体应答。

图23B示意在添加抗原的情形下肌内施用由植物生产的VLP或可溶性重组HA的小鼠中抗失活全流感病毒株(A/印度尼西亚/5/05;A/越南/I 203/04)的抗体效价。在施用1μg或5μg VLP或者5μg可溶性HA的小鼠中未观察到针对这些流感毒株之抗体效价的显著差异。

实施例11:H5 VLP疫苗诱导的血清抗体的交叉反应性

评价了H5VLP疫苗诱导的血清抗体针对不同的失活全流感病毒株的交叉反应性。所有VLP剂量(0.1~12μg)以及5μg对照HA抗原均诱导针对进化枝1毒株(A/越南/1194/04)、进化枝2.1的同源毒株A/印度尼西亚/5/05以及进化枝2.2毒株A/火鸡/土耳其/1/05的高的结合抗体效价(图25A)。

然而,只有由植物生产的VLP诱导针对A/火鸡/土耳其/1/05毒株的HAI效价(图25b)。VLP针对A/印度尼西亚/5/05的HAI效价高。

实施例12:由植物生产的H5 VLP进行免疫所提供的交叉保护

向如上文所述先前已施用两剂方案之A/印度尼西亚/5/05 H5 VLP的小鼠随后用流感病毒A/土耳其/582/06(H5N1)(“土耳其H5N1”)感染性病毒进行鼻内攻击,并观察。每只动物所施用的剂量为10LD50(4.09×105CCID50)。

攻击后7天内,只有37.5%的施用PBS疫苗对照的小鼠在暴露于土耳其H5N1后存活(图26A)。100%的施用对照抗原(HA)或者1、5或15μg印度尼西亚H5 VLP的动物在攻击后存活至17天(此时实验结束)。

还在实验期间监测了小鼠的体重,并绘制了存活小鼠的平均体重图(图26B)。在攻击之前施用1、5或15μg印度尼西亚H5 VLP的小鼠在实验过程中没有可觉察的体重损失,特别是施用5μg VLP的小鼠似乎体重明显增加。阴性对照小鼠(未用土耳其H5N1攻击)没有可觉察的体重增加或减轻。阳性对照小鼠(未施用VLP,但用土耳其H5N1攻击)在实验过程中表现出体重显著减轻,并且其中有3只小鼠死亡。由于体重是所有同组小鼠的平均值,所以去除“患病最严重的”小鼠(死亡的3只)可导致体重明显呈整体增加,然而,需注意的是阳性对照组的平均体重仍然显著低于阴性组或VLP处理组的平均体重。

因此,这些数据表明,由植物生产的含有H5血凝素病毒蛋白的流感病毒VLP诱导特异性针对病原性流感毒株的免疫应答,并且病毒样颗粒可从植物质膜出芽。

因此,这些数据表明,植物能够生产流感病毒样颗粒,并且还首次表明病毒样颗粒可从植物质膜出芽。

此外,使用现有的瞬时表达技术,在得到靶标HA序列后仅用16天就生产了第一批抗原。按照当前的H5 VLP产量,以及示例性的5μg/对象的剂量,每千克经渗入的叶可生产约20000剂疫苗。除了其它实施方案以外,这种平台简单、能大量生产以及具有强免疫原性的独特组合为响应于大流行提供了新的方法。

实施例13:使用体积排阻色谱表征植物提取物中含有血凝素的结构

通过凝胶过滤对由植物生产的不同亚型流感病毒血凝素组装成高分子量结构进行评估。通过体积排阻色谱(SEC)利用SephacrylTM S-500HR柱(GE Healthcare Bio-Science Corp.,Piscataway,NJ,USA)对经AGL1/660、AGL1/540、AGL1/783、AGL1/780和AGL1/785渗入之植物的蛋白质粗提物或经浓缩蛋白质提取物(1.5mL)进行分级分离。如图46所示,Blue Dextran(2MDa)洗脱物早在级分10中出现峰值。当利用丙酮沉淀法将来自200μL各SEC洗脱级分的蛋白质浓缩(5倍)并通过Western印迹(图46)分析时,血凝素主要存在于级分7~14中,这表示HA已并入VLP中。不希望受理论限制,这表明HA蛋白已被组装成大的超级结构或者其已附着于高分子量结构上,而与所产生的亚型无关。

实施例14:通过农杆菌渗入在本塞姆氏烟草植物中瞬时表达季节性流感病毒血凝素

通过表达来自毒株A/布里斯班/59/2007(H1N1)(774号质粒)、A/新喀里多尼亚/20/1999(H1N1)(540号质粒)以及A/所罗门群岛/3/2006(H1N1)(775号质粒)的H1亚型来测定瞬时表达系统产生季节性流感病毒血凝素的能力。首先将血凝素基因编码序列组装在质体蓝素表达盒(苜蓿质体蓝素基因的启动子、5’UTR、3’UTR以及转录终止序列)中,将所组装的盒插入pCAMBIA二元质粒中。然后将所述质粒转染到农杆菌(AGL1)中,分别产生农杆菌株AGL1/774、AGL1/540和AGL1/775。

用AGL1/774、AGL1/540和AGL1/775渗入本塞姆氏烟草植物,并在6天培养期后收集叶。为了测定H1是否累积在经农杆菌渗入的叶中,首先从经渗入的叶组织中提取蛋白质,并用抗H1抗体通过Western印迹进行分析。检测到提取物中约72kDa的独特条带(图47),其大小对应于流感病毒血凝素的未切割的HA0形式。这表明不同的年度流行毒株的血凝素在经渗入叶中的表达导致未切割翻译产物的累积。

实施例15:通过农杆菌渗入在本塞姆氏烟草植物中瞬时表达潜在大流行流感病毒血凝素

通过表达来自毒株A/安徽/1/2005(H5N1)(781号质粒)、A/印度尼西亚/5/2005(H5N1)(660号质粒)以及A/越南/1194/2004(H5N1)(782号质粒)的H5亚型来测定瞬时表达系统产生潜在流感病毒血凝素的能力。首先将血凝素基因编码序列组装在质体蓝素表达盒(苜蓿质体蓝素基因的启动子、5’UTR、3’UTR以及转录终止序列)中,将所组装的盒插入pCAMBIA二元质粒中。然后将所述质粒转染到农杆菌(AGL1)中。

用AGL1/781、AGL1/660和AGL1/782渗入本塞姆氏烟草植物,并在6天培养期后收集叶。为了测定H5是否累积在经农杆菌渗入的叶中,首先从经渗入的叶组织中提取蛋白质,并用抗H5抗体通过Western印迹进行分析。检测到提取物中约72kDa的独特条带(图48),其大小对应于流感病毒血凝素的未切割的HA0形式。这表明不同的潜在大流行毒株的血凝素在经渗入叶中的表达导致未切割的翻译产物的累积。

实施例16:通过农杆菌渗入在普通烟草植物中瞬时表达H5

通过表达来自毒株A/印度尼西亚/5/2005(H5N1)(660号质粒)的H5亚型来分析瞬时表达系统在普通烟草的叶中产生流感病毒血凝素的能力。首先将血凝素基因编码序列组装在质体蓝素表达盒(苜蓿质体蓝素基因的启动子、5’UTR、3’UTR以及转录终止序列)中,将所组装的盒插入pCAMBIA二元质粒中。然后将所述质粒转染到农杆菌(AGL1)中。

用AGL1/660渗入普通烟草植物,并在6天培养期后收集叶。为了测定H5是否累积在经农杆菌渗入的叶中,首先从经渗入的叶组织中提取蛋白质,并用抗H5抗体通过Western印迹进行分析。检测到提取物中约72kDa的独特条带(图49),其大小对应于未切割的HA0形式的流感病毒血凝素。这表明血凝素在经渗入普通烟草叶中的表达导致未切割翻译产物的累积。

实施例17:由植物生产的来自A/印度尼西亚/5/05(H5N1)的H5N1 VLP疫苗在雪貂中的免疫原性

在雪貂中进行剂量渐增的研究以评价由植物生产的VLP的免疫原性。使用第一剂疫苗后第14天(图50A)和第二剂后第14天(图50B)采集的血清,通过另外三种H5N1毒株(A/火鸡/土耳其/1/05(进化枝2.2)、A/越南/1194/04(进化枝1)以及A/安徽/5/05(所有均为失活全病毒))的血细胞凝集抑制来评价3种剂量(1、5和15μg)下H5VLP疫苗所诱导血清抗体的体外交叉反应性。在所有3种剂量浓度下,均观察到交叉反应性。

实施例17:根据CHMP标准分析免疫原性结果

EMEA的人用医疗产品委员会(Committee for MedicinalProducts for Human Use,CHMP)(http://www.emea.europa.eu/htms/general/contacts/CHMP/CHMP.html)确立了疫苗效力的三个标准(适用于第二剂之后):1-血清转换的数目或HI效价显著增加(4倍)>40%;2-几何平均值增加至少2.5;3-达到1/40HI效价的对象比例应当为至少70%。在雪貂模型中对这些标准的分析示于表8~11中。(*)表示符合或超出CHMP标准。与用于颁发许可的CHMP标准相关的交叉免疫原性分析的总结于表12中。

每天评价动物的体重、体温和总体状况。在研究期间没有记录到患病或不适的迹象。在研究期间体重和体温在正常范围内。所述疫苗是安全的并被研究动物耐受。

表12:与用于颁发许可的CHMP标准相关的交叉免疫原性分析的总结

实施例18:血凝素核苷酸序列的选择

从流感病毒序列数据库(参见URL:flu.lanl.gov)或NCBI流感病毒源(参见URL:ncbi.nlm.nih.gov/genomes/FLU/FLU.html)获取HA的核苷酸序列。对于几种HA核酸序列而言,所述数据库中列了多个条目(表13)。一些变异主要与培养体系(来源-MDCK、蛋、未知、病毒RNA/临床分离株)有关;例如,当B型流感病毒在蛋的尿囊液中表达时,HA的第194位(以成熟蛋白质编号)的糖基化位点不存在(还参见Chen等,2008)。对一些序列而言,可缺少结构域(例如不完全克隆、测序假象等)。血凝素序列可分为5个结构域:信号肽(SP)、HA1、HA2、跨膜(DTm)和胞质尾。一个序列的结构域可与另一已有序列的结构域相组合,例如一种毒株之序列的信号肽可与另一毒株血凝素编码序列的平衡相组合以提供完整的编码序列。

表13:流感病毒亚型中所选HA编码序列的变异

  毒株  序列数  据库参  考号  来源  SP  HA  1  HA2  DTm  变异  H1  A/所罗门群  岛/3/2006  ISDN231  558  (重组疫苗)  MDCK  Y  Y  Y  Y  189:R或G,220:K(MDCK)  T(蛋),249:Q(MDCK)  R(蛋),550:L(MDCK)R  (蛋)  A/所罗门群  岛/3/2006  ISDN238  190  蛋  Y  Y  Y  Y  189:R或G,220:K(MDCK)  T(蛋),249:Q(MDCK)  R(蛋),550:L(MDCK)R  (蛋)  A/所罗门群  岛/3/2006  EU10072  4  ?  Y  Y  Y  Y  189:R或G,220:K(MDCK)  T(蛋),249:Q(MDCK)  R(蛋),550:L(MDCK)R  (蛋)  A/所罗门群  岛/3/2006  ISDN220  951  MDCK  Y  Y  N  N  189:R或G,220:K(MDCK)  T(蛋),249:Q(MDCK)  R(蛋),550:L(MDCK)R  (蛋)

  毒株  序列数  据库参  考号  来源  SP  HA  1  HA2  DTm  变异  A/所罗门群  岛/3/2006  ISDN220  953  蛋  Y  Y  N  N  189:R或G,220:K(MDCK)  T(蛋),249:Q(MDCK)  R(蛋),550:L(MDCK)R  (蛋)  A/所罗门群  岛/3/2006  EU12413  7  蛋  Y  Y  N  N  189:R或G,220:K(MDCK)  T(蛋),249:Q(MDCK)  R(蛋),550:L(MDCK)R  (蛋)  A/所罗门群  岛/3/2006  EU12413  5  MDCK  Y  Y  N  N  189:R或G,220:K(MDCK)  T(蛋),249:Q(MDCK)  R(蛋),550:L(MDCK)R  (蛋)  A/所罗门群  岛/3/2006  EU12417  7  MDCK  Y  Y  Y  Y  189:R或G,220:K(MDCK)  T(蛋),249:Q(MDCK)  R(蛋),550:L(MDCK)R  (蛋)

  H1  A/布里斯班  /59/2007  ISDN282  676  MDCK  Y  Y  Y  203:D/I/N  D在H1中丰度最高  A/布里斯班  /59/2007  ISDN285  101  蛋  Y  Y  N  N  203:D/I/N  D在H1中丰度最高  A/布里斯班  /59/2007  ISDN285  777  蛋  Y  Y  Y  Y  203:D/I/N  D在H1中丰度最高  A/布里斯班  /59/2007  ISDN282  677  蛋  Y  Y  Y  Y  203:D/I/N  D在H1中丰度最高

  H3  A/布里斯班  /10/2007  ISDN274  893  蛋  Y  Y  Y  Y  202:V/G,210:L/P,215:del  Ala,242:S/I  毒株  序列数  据库参  考号  来源  SP  HA  1  HA2  DTm  变异  A/布里斯班  /10/2007  ISDN257  648  MDCK  N  Y  Y  Y  202:V/G,210:L/P,215:del  Ala,242:S/I  A/布里斯班  /10/2007  ISDN256  751  蛋  Y  Y  Y  Y  202:V/G,210:L/P,215:del  Ala,242:S/I  A/布里斯班  /10/2007  ISDN273  757  蛋  Y  Y  Y  Y  202:V/G,210:L/P,215:del  Ala,242:S/I  A/布里斯班  /10/2007  ISDN273  759  蛋  Y  Y  Y  Y  202:V/G,210:L/P,215:del  Ala,242:S/I  A/布里斯班  /10/2007  EU19924  8  蛋  N  Y  Y  Y  202:V/G,210:L/P,215:del  Ala,242:S/I  A/布里斯班  /10/2007  EU19936  6  蛋  Y  Y  Y  Y  202:V/G,210:L/P,215:del  Ala,242:S/I  A/布里斯班  /10/2007  ISDN257  043  蛋  N  Y  Y  Y  202:V/G,210:L/P,215:del  Ala,242:S/I  A/布里斯班  /10/2007  EU19925  0  MDCK  N  Y  Y  Y  202:V/G,210:L/P,215:del  Ala,242:S/I

  A/布里斯班  /10/2007  ISDN275  357  蛋  N  Y  N  N  202:V/G,210:L/P,215:del  Ala,242 S/I  A/布里斯班  /10/2007  ISDN260  430  蛋  N  Y  Y  Y  202:V/G,210:L/P,215:del  Ala,242:S/I

  H3  A/威斯康星  /67/2005  ISDN131  464  (重组疫苗)  ?  N  Y  Y  N  138:A/S  156:H/Q  186:G/V  196:H/Y  A/威斯康星  /67/2005  DQ86594  7  ?  N  Y  部分  N  138:A/S  156:H/Q  186:G/V  196:H/Y  A/威斯康星  /67/2005  EF473424  ?  N  Y  Y  N  138:A/S  156:H/Q  186:G/V  196:H/Y  A/威斯康星  /67/2005  ISDN138  723  蛋  N  Y  Y  Y  138:A/S  156:H/Q  186:G/V  196:H/Y  A/威斯康星  /67/2005  EF473455  蛋  N  Y  Y  Y  138:A/S  156:H/Q  186:G/V  196:H/Y

  H3  A/威斯康星  /67/2005  ISDN131  464  (重组疫苗)  ?  N  Y  Y  N  138:A/S  156:H/Q  186:G/V  196:H/Y  A/威斯康星  /67/2005  ISDN138  724  ?  N  Y  Y  Y  138:A/S  156:H/Q  186:G/V  196:H/Y  毒株  序列数  据库参  考号  来源  SP  HA  1  HA2  DTm  变异 B  B/马来西亚  /2506/2004  ISDN126  672  (重组疫苗)  蛋  Y  Y  N  N  120:K/N  210:T/A  B/马来西亚  /2506/2004  EF566433  蛋  Y  Y  N  N  120:K/N  210:T/A  B/马来西亚  /2506/2004  ISDN231  265  蛋  Y  Y  Y  Y  120:K/N  210:T/A

  H3  A/威斯康星  /67/2005  ISDN131  464  (重组疫苗)  ?  N  Y  Y  N  138:A/S  156:H/Q  186:G/V  196:H/Y  B/马来西亚  /2506/2004  ISDN231  557  MDCK  Y  Y  Y  Y  120:K/N  210:T/A  B/马来西亚  /2506/2004  EF566394  MDCK  Y  Y  N  N  120:K/N  210:T/A  B/马来西亚  /2506/2004  EU12427  4  蛋  Y  Y  Y  Y  120:K/N  210:T/A  B/马来西亚  /2506/2004  EU12427  5  MDCK  Y  Y  Y  Y  120:K/N  210:T/A  B/马来西亚  /2506/2004  ISDN124  776  MDCK  Y  Y  N  N  120:K/N  210:T/A

  B  B/佛罗里达  /4/2006  ISDN261  649  蛋  Y  Y  Y  N  缺少211位的糖基化位点、  DTm/胞质尾的10个氨基酸  B/佛罗里达  /4/2006  EU10060  4  MDCK  N  Y  N  N  B/佛罗里达  /4/2006  ISDN218  061  MDCK  N  Y  N  N  B/佛罗里达  /4/2006  ISDN285  778  蛋  Y  Y  Y  Y  包括胞质尾

 B  B/布里斯班  /3/2007 ISDN256 628  蛋  N  Y  N  N 缺少211位的糖基化位点  B/布里斯班  /3/2007 ISDN263 782  蛋  Y  Y  Y  Y 缺少211位的糖基化位点  B/布里斯班  /3/2007 ISDN263 783  MDCK  Y  Y  Y  Y

  H5  A/越南/11  94/2004  ISDN386  86  (重组疫苗)  ?  Y  Y  Y  Y  毒株  序列数  据库参  考号  来源  SP  HA  1  HA2  DTm  变异  A/越南/11  94/2004  AY65133  3  ?  Y  Y  Y  Y  A/越南/11  94/2004  EF541402  ?  Y  Y  Y  Y

  H5  A/安徽/1  /2005  DQ37928  (重组疫苗)  ?  Y  Y  Y  Y  A/安徽/1  /2005  ISDN131  465  蛋  Y  Y  Y  Y

  H7  A/鸡/意  大利/13474  /1999  AJ91720  ARN  gen  Y Y  Y  Y

  H7  A/马/布拉  格/56  AB29827  7  (实验室  重组)  ?  Y  Y  Y  Y  152(R/G)  169(T/I)  208(N/D)  (糖基化位点被消除)  A/马/布拉  格/56  X62552  ?  Y  Y  Y  Y

  H9  A/香港  /1073  /1999  AJ404626  ?  Y  Y  Y  Y  A/香港  /1073  /1999  AB08022  6  ?  N  Y  N  N

  H2  A/新加坡  /1/1957  AB29607  4  ?  Y  Y  Y  Y  A/新加坡  /1/1957  L20410  RNA  Y  Y  Y  Y  A/新加坡  /1/1957  L11142  ?  Y  Y  Y  Y

  H2  A/日本/30  5/1957  L20406  ?  Y  Y  Y  Y  A/日本/3  05/1957  L20407  ?  Y  Y  Y  Y  A/日本/3  05/1957  CY01497  6  ?  Y  Y  Y  Y  A/日本/3  05/1957  AY20995  3  ?  Y  Y  N  N  A/日本/3  05/1957  J02127  ?  Y  Y  Y  Y  毒株  序列数  据库参  考号  来源  SP  HA  1  HA2  DTm  变异  A/日本/3  05/1957  DQ50884  1  ?  Y  Y  Y  Y  A/日本/3  05/1957  AY64308  6  ?  Y  Y  Y  N  A/日本/3  05/1957  AB28933  7  ?  Y  Y  Y  Y  A/日本/3  05/1957  AY64308  5  ?  Y  Y  Y  Y  A/日本/3  05/1957  AY64308  7  抗药性  Y  Y  Y  N

  H6  A/水鸭/香  港/W312/  1997(H6N1)AF250479 蛋 Y  Y  Y  Y

Y,N-分别为是、否

SP-信号肽序列的存在 是/否

HA1-全长HA1结构域 是/否

HA2-全长HA2结构域 是/否

DTm-全长跨膜结构域 是/否

毒株:A/所罗门群岛/3/2006的H1

比较了8种氨基酸序列并鉴定了变异(表14)。在一些序列中,第171位表现出甘氨酸(G)或精氨酸(R)变异。

表14:A/所罗门群岛/3/2006的氨基酸变异

  氨基酸编号*  MDCK  蛋  212  K  T  241  Q  R  542  L  R

从起始M编号

毒株:A/布里斯班/59/2007的H1

第203位表现出天冬氨酸(D)、异亮氨酸(I)或天冬酰胺(N)变异。

毒株:A/布里斯班/10/2007的H3

在5个位置观察到序列变异(表15)。在两个采样序列的第215位观察到缺失。

表15:A/布里斯班/10/2007的H3的氨基酸变异

  来源  202,210,215,235 242*  ISDN274893  蛋  V    L    -    Y   I  ISDN273759  蛋  G    P    A    S   I  EU199248  蛋  G    P    A    S   I  EU199366  蛋  G    P    A    S   I  ISDN273757  蛋  V    L    -    S   S  ISDN257043  蛋  G    P    A    S   I  EU199250  MDCK  G    L    A    S   I  ISDN375357  蛋  G    P    A    S   I  ISDN260430  蛋  G    P    A    S   I  ISDN256751  蛋  G    P    A    S   I

  来源  202,210,215,235 242*  ISDN257648  MDCK  G    L    A    S   I

*从起始M编号

毒株:A/威斯康星/67/2005的H3

在该株的4个位置观察到序列变异(表16)。

表16:A/威斯康星/67/2005的H3的氨基酸变异

  来源  138,156,186,196  ISDN138724  未知  A    H    G    H  DQ865947  未知  S    H    V    Y  EF473424  未知  A    H    G    H  ISDN138723  蛋  S    Q    V    Y  ISDN131464  未知  A    H    G    H  EF473455  蛋  A    H    G    H

*从成熟蛋白开始编号

毒株:B/马来西亚/2506/2004的B型

在两个位置观察到变异(表17)。第120位不是糖基化位点;第210位参与糖基化;在蛋中培养之后该糖基化被消除。

表17:来自B/马来西亚/2506/2004的血凝素的氨基酸变异

  氨基酸编号*  MDCK  蛋  120  K  N  210  T  A

*从SP中部开始编号

毒株:来自B/佛罗里达/4/2006的血凝素;ISDN261649

所观察的变异包括第211位的氨基酸序列变异,这取决于培养系统。在从MDCK细胞分离的序列中观察到天冬酰胺(N),而在从蛋分离的序列中观察到谷氨酸(D)。第211位是糖基化位点,并且在蛋中培养后被消除。

毒株:来自A/新加坡/1/1957的H2

在6个位置观察到序列变异(表18)。

表18:来自A/新加坡/1/1957的H2的氨基酸变异

 来源氨基酸编号166 168 199\236 238 358  L20410 病毒RNAK   E   T   L   S   V  L11142 未知E   G   K   L   S   I  AB296074 未知K   G   T   Q   G   V  共有序列  A/日本/305/1957K   G   T   Q/L G   V

1从成熟蛋白开始编号

毒株:来自A/越南/1194/2004的H5以及来自A/安徽/1/2005的H5

与这些H5株任一的一级序列比对,未观察到氨基酸序列的变异。

毒株:来自A/水鸭/香港/W312/1997的H6

毒株(AF250179)仅有一个条目可获取。

毒株:来自A/马/布拉格/56的H7

在数据库中总共发现2个序列条目。条目AB298877被排除在外,因此其是由实验室重组的。

毒株:来自A/香港/1073/1999的H9;AJ404626

在数据库中总计发现2个序列条目。只有一个是完整的。

所有引文通过引用并入本文。

本发明通过一个或多个实施方案进行了描述。然而,对于本领域技术人员而言显然的是,可在不背离权利要求中所述的本发明范围的情形下进行多种改动和改进。

参考文献:

Aymard,H M,M T Coleman,W R Dowdle,W G Laver,G C Schild,and R GWebster 1973 Influenza virus neuraminidase-inhibition test procedures BullW H O 48 199-202

Bollag,D M.,Rozycki,M D,and Edelstein,S J(1996)Protein methods(2ndedition)Wiley-Liss,New York,USA

Bligh,E G,& Dyer,W J Can J Med Sci 37,911-917(1959)

Chen,B J,Leser,G P,Morita,E,and Lamb R.A(2007)Influenza virushemagglutinin and neuraminidase,but not the matrix protein,are required forassembly and budding of plasmid-derived virus-like particles J Virol 81,7111-7123Chen Z,Aspelund A,Jin H 2008 Stabilizing the glycosylation pattern of influenza Bhemagglutinin following adaptation to growth in eggs Vaccine vol 26 p 361-371

Crawford,J,Wilkinson,B,Vosnesensky,A,Smith,G,Garcia,M,Stone,H,and Perdue,M L(1999)Baculovirus-derived hemagglutinin vaccines protectagainst lethal influenza infections by avian H5 and H7 subtypes Vaccine 17,2265-2274

Darveau,A,Pelletier,A & Perreault,J PCR-mediated synthesis of chimericmolecules Methods Neurosc.26,77-85(1995)

Grgacic EVL,Anderson DA.Virus-like particles passport to immune recognitionMethods 2006,40 60-65

Gillim-Ross,L,and Subbarao,K(2006)Emerging respiratory viruses chanllengesand vaccine strategies Clin Microbiol Rev 19,614-636

Gomez-Puertas,P,Mena,I,Castillo,M,Vivo,A,Perez-Pastrana,E and Portela,A(1999)Efficient formation of influenza virus-like particles dependence on theexpression level of viral proteins J Gen Virol 80,1635-1645Gomez-Puertas,P,Albo,C,Perez-Pastrana,E,Vivo,A,and Portela,A(2000)Influenza Virus protein is the major driving force in virus budding J Virol 74,11538-11547

Hamilton,A,Voinnet,O,Chappell,L & Baulcombe,D Two classes of shortinterfering RNA in RNA silencing.EMBO J 21,4671-4679(2002)

Hofgen,R & Willmitzer,L Storage of competent cells for Agrobacteriumtransformation Nucleic Acid Res 16,9877(1988)

Harbury PB,Zhang T,Kim PS,Alber T(1993)A switch between two-,three-,andfour-stranded coiled coils in GCN4 leucine zipper mutants Science;262 1401-1407)

Horimoto T,Kawaoka Y Strategies for developing vaccines against h5N1 influenzaa viruses Trends in Mol Med 2006,12(11)506-514

Huang Z,Elkin G,Maloney BJ,Beuhner N,Arntzen CJ,Thanavala Y,Mason HSVirus-like particle expression and assembly in plants hepatitis B and Norwalkviruses Vaccine 2005 Mar 7,23(15)1851-8

Johansson,B E(1999)Immunization with influenza A virus hemagglutinin andneuraminidase produced in recombinant baculovirus results in a balanced andbroadened immune response superior to conventional vaccine Vaccine 17,2073-2080

Latham,T,and Galarza,J M(2001)Formation of wild-type and chimericinfluenza virus-like particles following simultaneous expression of only fourstructural proteins J Virol 75,6154-6165

Lefebvre,B et al Plant Physiol 144,402-418(2007)

Leutwiler LS et al 1986 Nucleic Acid Sresearch 14910)4051-64

Liu,L & Lomonossoff,G P Agroinfection as a rapid method for propagating Cowpeamosaic virus-based constructs J Virol Methods 105,343-348(2002)

Macala,L J,Yo,R K & Ando,S J Lipid Res 24,1243-1250(1983)Mattanovich,D,Ruker,F,da  Machado,A,Laimer,M,Regner,F,Steinkellner,H,Himmler,G,and Katinger,H(1989)Efficient transformation ofAgrobacterium spp By electroporation Nucl Ac Res 17,6747

Mena,I,Vivo,A,Perez,E,and Portela,A(1996)Rescue of syntheticchloramphenicol acetyltransferase RNA into influenza virus-like particles obtainedfrom recombinant plasmids J Virol 70,5016-5024

Mongrand S,Morel J,Laroche J,Claverol S,Carde JP,Hartmann MA et al Lipidrafts in higher plant cells The Journal of Biological Chemistry 2004,279(35)36277-36286

Neumann,G,Watanabe,T,and Kawaoka,Y(2000)Plasmid-driven formation ofvirus-like particles J Virol 74,547-551

Nayak DP,Reichl U.(2004)Neuraminidase activity assays for monitoring MDCKcell culture derived influenza virus J Virol Methods 122(1)9-15

Olsen,C W,McGregor,M W,Dybdahl-Sissoko,N,Schram,B R,Nelson,KM,Lunn,D,Macklin,M D,and Swain,W F(1997)Immunogemcity andefficacy of baculovirus-expressed and DNA-based equine influenza virushemagglutinin vaccines in mice Vaccine 15,1149-1156

Quan FS,Huang C,Compans RW,Kang SM Virus-like particle vaccine inducesprotective immunity against homologous and heterologous strains of influenza virusJournal of Virology 2007,81(7)3514-3524

Rowe,T et al 1999 Detection of antibody to avian influenza a(h5N1)virus inhuman serum by using a cmbiation of serologic assays J Clin Microbiol 37(4)937-43

Saint-Jore-Dupas C et al 2007 From planta to pharma with glycosylation in thetoolbox Trends in Biotechnology 25(7)317-23

Sambrook J,and Russell DW.Molecular cloning a laboratory manual Cold SpringHarbor,N Y Cold Spring Harbor Laboratory Press,2001Stockhaus J et al 1987 Analysis of cis-active sequences involved in the leaf-specificexpression of a potato gene in transgenic plants Proceedings of the NationalAcademy of Sciences U S S 84(22)7943-7947

Stockhaus J et al 1989 Identification of enhancer elements in the upstream region ofthe nuclear photosynthetic gene ST-LS1 Plant Cell 1(8)805-13

Suzuki,Y(2005)Sialobiology of influenza Molecular mechanism of host rangevariation of influenza viruses Biol Pharm Bull 28,399-408

Tsuji M,Cell Mol Life Sci,63(2006),1889-1898

Wakefield L,G G Brownlee Nuc Acid Res 17(1989),8569-8580

Kendal,AP,Pereira MS,Skehel J Concepts and procedures for laboratory-basedinfluenza surveillance Atlanta CDC,1982 p B 17-B35

WHO Manual on animal influenza diagnosis and surveillance.Department ofcommunicable disease surveillance and response.World Health Organisation GlobalInfluenza Program 2002

Skehel JJ and Wildy DC Ann Rev Biochem 2000 69 531-69

Vaccaro L et al 2005 Biophysical J 88 25-36

Gamblin,S J,Haire,L.F,Russell,R J,Stevens,D J,Xiao,B,Ha,Y,Vasisht,N,Steinhauer,D A,Daniels,R S,Elliot,A,Wiley,D C.,Skehel,J J(2004)Thestructure and receptor binding properties of the 1918 influenza hemagglutininScience 303 1838-1842

序列表

<110>麦迪卡格公司

     马克-安德烈·德奥斯特

     马农·科图雷

     弗雷德里克·奥尔斯

     索尼娅·特雷帕尼耶

     皮埃尔-奥列弗·拉瓦

     米凯莱·拉吉斯

     路易斯-菲利普·韦齐纳

     纳萨莉·兰德里

 

<120>含有血凝素的流感病毒样颗粒(VLP)

 

<130>V81270WO

 

<160>76

 

<170>PatentIn version 3.5

 

<210>1

<211>1556

<212>DNA

<213>流感病毒

 

<400>1

agatcttcgc tgacacaata tgtataggct accatgccaa caactcaacc gacactgttg        60

acacagtact tgagaagaat gtgacagtga cacactctgt caacctactt gaggacagtc       120

acaatggaaa actatgtcta ctaaaaggaa tagccccact acaattgggt aattgcagcg       180

ttgccggatg gatcttagga aacccagaat gcgaattact gatttccaag gaatcatggt       240

cctacattgt agaaacacca aatcctgaga atggaacatg ttacccaggg tatttcgccg       300

actatgagga actgagggag caattgagtt cagtatcttc atttgagaga ttcgaaatat       360

tccccaaaga aagctcatgg cccaaccaca ccgtaaccgg agtatcagca tcatgctccc       420

ataatgggaa aagcagtttt tacagaaatt tgctatggct gacggggaag aatggtttgt       480

acccaaacct gagcaagtcc tatgtaaaca acaaagagaa agaagtcctt gtactatggg       540

gtgttcatca cccgcctaac atagggaacc aaagggcact ctatcataca gaaaatgctt       600

atgtctctgt agtgtcttca cattatagca gaagattcac cccagaaata gccaaaagac       660

ccaaagtaag agatcaggaa ggaagaatca actactactg gactctgctg gaacctgggg       720

atacaataat atttgaggca aatggaaatc taatagcgcc atggtatgct tttgcactga       780

gtagaggctt tggatcagga atcatcacct caaatgcacc aatggatgaa tgtgatgcga       840

agtgtcaaac acctcaggga gctataaaca gcagtcttcc tttccagaat gtacacccag       900

tcacaatagg agagtgtcca aagtatgtca ggagtgcaaa attaaggatg gttacaggac       960

taaggaacat cccatccatt caatccagag gtttgtttgg agccattgcc ggtttcattg      1020

aaggggggtg gactggaatg gtagatgggt ggtatggtta tcatcatcag aatgagcaag      1080

gatctggcta tgctgcagat caaaaaagta cacaaaatgc cattaacggg attacaaaca      1140

aggtcaattc tgtaattgag aaaatgaaca ctcaattcac agctgtgggc aaagagttca      1200

acaaattgga aagaaggatg gaaaacttaa ataaaaaagt tgatgatggg tttctagaca      1260

tttggacata taatgcagaa ttgttggttc tactggaaaa tgaaaggact ttggatttcc      1320

atgactccaa tgtgaagaat ctgtatgaga aagtaaaaag ccaattaaag aataatgcca      1380

aagaaatagg aaacgggtgt tttgagttct atcacaagtg taacaatgaa tgcatggaga      1440

gtgtgaaaaa tggtacctat gactatccaa aatattccga agaatcaaag ttaaacaggg      1500

agaaaattga tggagtgaaa ttggaatcaa tgggagtata ctaagagctc aggcct          1556

 

<210>2

<211>219

<212>DNA

<213>流感病毒

 

<400>2

ggtacctatg actatccaaa atattccgaa gaatcaaagt taaacaggga gaaaattgat        60

ggagtgaaat tggaatcaat gggagtatac cagattctgg cgatctactc aactgtcgcc       120

agttccctgg ttcttttggt ctccctgggg gcaatcagct tctggatgtg ttccaatggg       180

tctttgcagt gtagaatatg catctaagag ctcaggcct                              219

 

<210>3

<211>1719

<212>DNA

<213>流感病毒

 

<400>3

aagcttatgg agaaaatagt gcttcttctt gcaatagtca gtcttgttaa aagtgatcag        60

atttgcattg gttaccatgc aaacaattca acagagcagg ttgacacaat catggaaaag       120

aacgttactg ttacacatgc ccaagacata ctggaaaaga cacacaacgg gaagctctgc       180

gatctagatg gagtgaagcc tctaatttta agagattgta gtgtagctgg atggctcctc       240

gggaacccaa tgtgtgacga attcatcaat gtaccggaat ggtcttacat agtggagaag       300

gccaatccaa ccaatgacct ctgttaccca gggagtttca acgactatga agaactgaaa       360

cacctattga gcagaataaa ccattttgag aaaattcaaa tcatccccaa aagttcttgg       420

tccgatcatg aagcctcatc aggagttagc tcagcatgtc catacctggg aagtccctcc       480

ttttttagaa atgtggtatg gcttatcaaa aagaacagta catacccaac aataaagaaa       540

agctacaata ataccaacca agaggatctt ttggtactgt ggggaattca ccatcctaat       600

gatgcggcag agcagacaag gctatatcaa aacccaacca cctatatttc cattgggaca       660

tcaacactaa accagagatt ggtaccaaaa atagctacta gatccaaagt aaacgggcaa       720

agtggaagga tggagttctt ctggacaatt ttaaaaccta atgatgcaat caacttcgag       780

agtaatggaa atttcattgc tccagaatat gcatacaaaa ttgtcaagaa aggggactca       840

gcaattatga aaagtgaatt ggaatatggt aactgcaaca ccaagtgtca aactccaatg       900

ggggcgataa actctagtat gccattccac aacatacacc ctctcaccat cggggaatgc       960

cccaaatatg tgaaatcaaa cagattagtc cttgcaacag ggctcagaaa tagccctcaa      1020

agagagagca gaagaaaaaa gagaggacta tttggagcta tagcaggttt tatagaggga      1080

ggatggcagg gaatggtaga tggttggtat gggtaccacc atagcaatga gcaggggagt      1140

gggtacgctg cagacaaaga atccactcaa aaggcaatag atggagtcac caataaggtc      1200

aactcaatca ttgacaaaat gaacactcag tttgaggccg ttggaaggga atttaataac      1260

ttagaaagga gaatagagaa tttaaacaag aagatggaag acgggtttct agatgtctgg      1320

acttataatg ccgaacttct ggttctcatg gaaaatgaga gaactctaga ctttcatgac      1380

tcaaatgtta agaacctcta cgacaaggtc cgactacagc ttagggataa tgcaaaggag      1440

ctgggtaacg gttgtttcga gttctatcac aaatgtgata atgaatgtat ggaaagtata      1500

agaaacggaa cgtacaacta tccgcagtat tcagaagaag caagattaaa aagagaggaa      1560

ataagtgggg taaaattgga atcaatagga acttaccaaa tactgtcaat ttattcaaca      1620

gtggcgagtt ccctagcact ggcaatcatg atggctggtc tatctttatg gatgtgctcc      1680

aatggatcgt tacaatgcag aatttgcatt taagagctc                             1719

 

<210>4

<211>25

<212>DNA

<213>人工序列

 

<220>

<223>引物

 

<400>4

gtattagtaa ttagaatttg gtgtc                                              25

 

<210>5

<211>44

<212>DNA

<213>人工序列

 

<220>

<223>引物

 

<400>5

gcaagaagaa gcactatttt ctccattttc  tctcaagatg atta                        44

 

<210>6

<211>45

<212>DNA

<213>人工序列

 

<220>

<223>引物

 

<400>6

ttaatcatct tgagagaaaa tggagaaaat agtgcttctt cttgc                        45

 

<210>7

<211>38

<212>DNA

<213>人工序列

 

<220>

<223>引物

 

<400>7

actttgagct  cttaaatgca aattctgcat  tgtaacga                              38

 

<210>8

<211>1471

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

 

<400>8

agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt        60

taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa       120

atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt       180

tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca       240

aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga       300

gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa       360

aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg       420

taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta       480

aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt       540

aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct       600

atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa       660

ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc       720

cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac       780

aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa       840

atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca       900

ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag       960

agaagagact aattaattaa ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt      1020

ttcggcttat tgttttctct tcttgtgttg gttccttctc agatctgagc tctaagttaa      1080

aatgcttctt cgtctcctat ttataatatg gtttgttatt gttaattttg ttcttgtaga      1140

agagcttaat taatcgttgt tgttatgaaa tactatttgt atgagatgaa ctggtgtaat      1200

gtaattcatt tacataagtg gagtcagaat cagaatgttt cctccataac taactagaca      1260

tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac taaaattgaa catcttttgc      1320

cacaacttta taagtggtta atatagctca aatatatggt caagttcaat agattaataa      1380

tggaaatatc agttatcgaa attcattaac aatcaactta acgttattaa ctactaattt      1440

tatatcatcc cctttgataa atgatagtac a                                     1471

 

<210>9

<211>565

<212>PRT

<213>流感病毒

 

<400>9

Met Lys Ala Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr

1               5                   10                  15

Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr

            20                  25                  30

Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn

        35                  40                  45

Leu Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile

    50                  55                  60

Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly

65                  70                  75                  80

Asn Pro Glu Cys Glu Leu Leu Ile Ser Lys Glu Ser Trp Ser Tyr Ile

                85                  90                  95

Val Glu Thr Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Tyr Phe

            100                 105                 110

Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe

        115                 120                 125

Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr

    130                 135                 140

Val Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Lys Ser Ser Phe

145                 150                 155                 160

Tyr Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn

                165                 170                 175

Leu Ser Lys Ser Tyr Val Asn Asn Lys Glu Lys Glu Val Leu Val Leu

            180                 185                 190

Trp Gly Val His His Pro Pro Asn Ile Gly Asn Gln Arg Ala Leu Tyr

        195                 200                 205

His Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg

    210                 215                 220

Arg Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu

225                 230                 235                 240

Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile

                245                 250                 255

Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Trp Tyr Ala Phe Ala

            260                 265                 270

Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Thr Ser Asn Ala Pro Met

        275                 280                 285

Asp Glu Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser

    290                 295                 300

Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro

305                 310                 315                 320

Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn

                325                 330                 335

Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe

            340                 345                 350

Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His

        355                 360                 365

His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr

    370                 375                 380

Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu

385                 390                 395                 400

Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu

                405                 410                 415

Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu

            420                 425                 430

Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu

        435                 440                 445

Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys

    450                 455                 460

Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys

465                 470                 475                 480

Phe Glu Phe Tyr His Lys Cys Asn Asn Glu Cys Met Glu Ser Val Lys

                485                 490                 495

Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn

            500                 505                 510

Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln

        515                 520                 525

Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val

    530                 535                 540

Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln

545                 550                 555                 560

Cys Arg Ile Cys Ile

                565

 

<210>10

<211>568

<212>PRT

<213>流感病毒

 

<400>10

Met Glu Lys Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser

1               5                   10                  15

Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val

            20                  25                  30

Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile

        35                  40                  45

Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys

    50                  55                  60

Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn

65                  70                  75                  80

Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val

                85                  90                  95

Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro Gly Ser Phe Asn

            100                 105                 110

Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu

        115                 120                 125

Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser

130                 135                 140

Ser Gly Val Ser Ser Ala Cys Pro Tyr Leu Gly Ser Pro Ser Phe Phe

145                 150                 155                 160

Arg Asn Val Val Trp Leu Ile Lys Lys Asn Ser Thr Tyr Pro Thr Ile

                165                 170                 175

Lys Lys Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Val Leu Trp

            180                 185                 190

Gly Ile His His Pro Asn Asp Ala Ala Glu Gln Thr Arg Leu Tyr Gln

        195                 200                 205

Asn Pro Thr Thr Tyr Ile Ser Ile Gly Thr Ser Thr Leu Asn Gln Arg

    210                 215                 220

Leu Val Pro Lys Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly

225                 230                 235                 240

Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn

                245                 250                 255

Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile

            260                 265                 270

Val Lys Lys Gly Asp Ser Ala Ile Met Lys Ser Glu Leu Glu Tyr Gly

        275                 280                 285

Asn Cys Asn Thr Lys Cys Gln Thr Pro Met Gly Ala Ile Asn Ser Ser

    290                 295                 300

Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys

305                 310                 315                 320

Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser

                325                 330                 335

Pro Gln Arg Glu Ser ArgArg Lys Lys Arg Gly Leu Phe Gly Ala Ile

            340                 345                 350

Ala Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr

        355                 360                 365

Gly Tyr His His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys

    370                 375                 380

Glu Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser

385                 390                 395                 400

Ile Ile Asp Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe

                405                 410                 415

Asn Asn Leu Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp

            420                 425                 430

Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met

        435                 440                 445

Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu

    450                 455                 460

Tyr Asp Lys Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly

465                 470                 475                 480

Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu

                485                 490                 495

Ser Ile Arg Asn Gly Thr Tyr Asn Tyr Pro Gln Tyr Ser Glu Glu Ala

            500                 505                 510

Arg Leu Lys Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly

        515                 520                 525

Thr Tyr Gln Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala

    530                 535                 540

Leu Ala Ile Met Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly

545                 550                 555                 560

Ser Leu Gln Cys Arg Ile Cys Ile

                565

 

<210>11

<211>1629

<212>DNA

<213>A型流感病毒

 

<400>11

gacaaaatat gtcttgggca ccatgctgtg gcaaatggaa caaaagtgaa cacattaaca        60

gagaggggga ttgaagtagt gaacgccaca gagacggtgg aaactgcgaa tatcaagaaa       120

atatgtattc aagggaaaag gccaacagat ctgggacaat gtggacttct aggaacccta       180

ataggacctc cccaatgtga tcaattcctg gagttttact ctgatttgat aattgagcga       240

agagaaggaa ccgatgtgtg ctatcccggt aaattcacaa atgaagaatc actgaggcag       300

atccttcgag ggtcaggagg aattgataag gagtcaatgg gtttcaccta tagtggaata       360

agaaccaatg gagcgacaag tgcctgcaaa agatcaggtt cttctttcta tgcagagatg       420

aagtggttgc tgtcgaattc agacaatgcg gcattccctc aaatgacaaa gtcgtataga       480

aatcccagaa acaaaccagc tctgataatt tggggagttc atcactctgg atcggttagc       540

gagcagacca aactctatgg aagtggaaac aagttgataa cagtaggaag ctcaaaatac       600

cagcaatcat tcaccccaag tccgggagca cggccacaag tgaatggaca atcagggaga       660

atcgattttc actggctact ccttgatccc aatgacacag tgaccttcac tttcaatggg       720

gcattcatag cccctgacag ggcaagtttc tttagaggag aatcactagg agtccagagt       780

gatgttcctc tggattctag ttgtggaggg gattgctttc acagtggggg tacgatagtc       840

agttccctgc cattccaaaa catcaaccct agaactgtgg ggagatgccc tcggtatgtc       900

aaacagacaa gcctcctttt ggctacagga atgagaaatg ttccagagaa tccaaagccc       960

agaggccttt ttggagcaat tgctggattc atagagaatg gatgggaggg tctcatcgat      1020

ggatggtatg gtttcagaca tcaaaatgca caaggggaag gaactgcagc tgactacaaa      1080

agcacccaat ctgcaataga tcagatcaca ggcaaattga atcgtctgat tgacaaaaca      1140

aatcagcagt ttgagctgat agacaatgag ttcaatgaga tagaacaaca aataggaaat      1200

gtcattaatt ggacacgaga cgcaatgact gaggtatggt cgtataatgc tgagctgttg      1260

gtggcaatgg aaaatcagca tacaatagat cttgcggact cagaaatgaa caaactttat      1320

gagcgtgtca gaaaacaact aagggagaat gctgaagaag atggaactgg atgttttgag      1380

atattccata agtgtgatga tcagtgcatg gagagcataa ggaacaacac ttatgaccat      1440

actcaataca gaacagagtc attgcagaat agaatacaga tagacccagt gaaattgagt      1500

agtggataca aagacataat cttatggttt agcttcgggg catcatgttt tcttcttcta      1560

gccgttgtaa tgggattggt tttcatttgc ataaagaatg gaaacatgcg gtgcaccatt      1620

tgtatataa                                                              1629

 

<210>12

<211>1773

<212>DNA

<213>A型流感病毒

 

<400>12

agcaaaagca ggggttatac catagacaac caaaggcaag acaatggcca tcatttatct        60

aattcttctg ttcacagcag tgagagggga ccaaatatgc attggatacc attccaacaa       120

ttccacagaa aaggttgaca caatcctaga gagaaatgtc actgtgactc acgctgagga       180

cattcttgag aagactcaca atgggaagtt atgcaaacta aatggaatcc ctccacttga       240

attaagggat tgcagcattg ccggatggct ccttgggaat ccagaatgtg atatacttct       300

aactgtgcca gaatggtcat acataataga aaaagaaaat ccaaggaacg gcttgtgcta       360

cccaggcagt ttcaatgatt atgaagaatt gaagcatctt atcagcagcg tgacacattt       420

tgagaaagta aagattctgc ccagaaatga atggacacag catacaacaa ctggaggttc       480

acaggcttgc gcagactatg gtggtccgtc attcttccgg aacatggtct ggttgacaaa       540

gaaagggtcg aattatccaa ttgccaaaag atcttacaac aatacaagtg gggaacaaat       600

gctgatcatt tgggggatac atcaccccaa tgatgaaagt gaacaaagag cattgtatca       660

gaatgtgggg acctatgtgt cagtaggaac atcaacactg aacaaaagat catccccaga       720

aatagcaaca agacctaaag tgaatggaca aggaggcaga atggaattct cgtggactat       780

cttagatata tgggacacaa taaattttga gagtactggc aatctaattg caccagaata       840

tggtttcaaa atatccaaac gaggtagttc agggatcatg aaaacagaag gaaaacttga       900

aaactgcgag accaagtgcc aaactccttt gggagcaata aatacaacat taccctttca       960

caatatccac ccactgacca ttggtgagtg ccccaaatat gtaaaatcgg aaagattagt      1020

cttagcaaca ggactaagaa acgtccctca gattgagtca aggggattgt ttggggcaat      1080

agctggtttt atagagggtg gatggcaagg aatggttgat ggttggtatg ggtatcatca      1140

cagcaatgac cagggatctg ggtatgcagc agacaaagaa tccactcaaa aggcaattga      1200

tggaatcacc aacaaggtaa attctgtgat cgaaaagatg aacacccaat tcggagctgt      1260

tggaaaagaa ttcagtaact tggagagaag actggagaac ttgaataaaa agatggagga      1320

cggatttcta gatgtgtgga catacaatgc cgagctccta gttctaatgg aaaatgagag      1380

gacacttgac tttcatgatt ctaatgtcaa gaatctatat gataaagtca gaatgcaact      1440

gagagacaat gcaaaagaac tagggaatgg atgttttgaa ttttatcaca aatgtgatga      1500

tgaatgcatg aacagtgtga agaatgggac atatgattat tccaagtatg aagaggagtc      1560

taaactaaac aggactgaaa tcaaaggggt taaattgagc aatatggggg tttatcaaat      1620

ccttgccatc tatgctacag tagcaggttc cctgtcactg gcaatcatga tagctgggat      1680

ttctatatgg atgtgctcca acgggtctct gcaatgcaga atctgcatat gatcatcagt      1740

cattttgtaa ttaaaaacac ccttgtttct act                                   1773

 

<210>13

<211>1086

<212>DNA

<213>A型流感病毒

 

<400>13

caaaaacttc ccggaaatga caacagcacg gcaacgctgt gccttgggca ccatgcagta        60

ccaaacggaa cgatagtgaa aacaatcacg aatgaccaaa ttgaagttac taatgctact       120

gagctggtac agagttcctc aacaggtgga atatgcgaca gtcctcatca gatccttgat       180

ggagaaaact gcacactaat agatgctcta ttgggagacc ctcagtgtga tggcttccaa       240

aataagaaat gggacctttt tgttgaacgc agcaaagcct acagcaactg ttacccttat       300

gatgtgccgg attatgcctc ccttaggtca ctagttgcct catccggcac actggagttt       360

aacaatgaaa gcttcgattg gactggagtc actcagaatg gaacaagctc tgcttgcaaa       420

aggagatcta ataaaagttt ctttagtaga ttgaattggt tgacccactt aaaatacaaa       480

tacccagcat tgaacgtgac tatgccaaac aatgaaaaat ttgacaaatt gtacatttgg       540

ggggttcacc acccgggtac ggacagtgac caaatcagcc tatatgctca agcatcagga       600

agaatcacag tctctaccaa aagaagccaa caaactgtaa tcccgaatat cggatctaga       660

cccagggtaa gggatgtctc cagccgaata agcatctatt ggacaatagt aaaaccggga       720

gacatacttt tgattaacag cacagggaat ctaattgctc ctcggggtta cttcaaaata       780

cgaagtggga aaagctcaat aatgagatca gatgcaccca ttggcaaatg caattccgaa       840

tgcatcactc caaatggaag cattcccaat gacaaaccat ttcaaaatgt aaacaggatc       900

acatatgggg cctgtcccag atatgttaag caaaacactc tgaaattggc aacagggatg       960

cgaaatgtac cagagaaaca aactagaggc atatttggcg caatcgcggg tttcatagaa      1020

aatggttggg agggaatggt ggacggttgg tacggtttca ggcatcaaaa ttctgagggc      1080

acagga                                                                 1086

 

<210>14

<211>1048

<212>DNA

<213>A型流感病毒

 

<400>14

atgctatcaa tcacgattct gtttctgctc atagcagagg gttcctctca gaattacaca        60

gggaatcccg tgatatgcct gggacatcat gccgtatcca atgggacaat ggtgaaaacc       120

ctgactgatg accaagtaga agttgtcact gcccaagaat tagtggaatc gcaacatcta       180

ccggagttgt gtcctagccc tttaagatta gtagatggac aaacttgtga catcgtcaat       240

ggtgccttgg ggagtccagg ctgtgatcac ttgaatggtg cagaatggga tgtcttcata       300

gaacgaccca ctgctgtgga cacttgttat ccatttgatg tgccggatta ccagagccta       360

cggagtatcc tagcaaacaa tgggaaattt gagttcattg ctgaggaatt ccaatggaac       420

acagtcaaac aaaatgggaa atccggagca tgcaaaagag caaatgtgaa tgactttttc       480

aacagattga actggctgac caaatctgat gggaatgcat acccacttca aaacctgaca       540

aaggttaaca acggggacta tgcaagactt tacatatggg gagttcatca tccttcaact       600

gacacagaac aaaccaactt gtataagaac aaccctggga gagtaactgt ttccaccaaa       660

accagtcaaa caagtgtggt accaaacatt ggcagtagac catgggtaag aggccaaagc       720

ggcaggatta gcttctattg gacaattgtg gagccaggag acctcatagt cttcaacacc       780

atagggaatt taattgctcc gagaggtcat tacaagctta acagtcaaaa gaagagcaca       840

attctgaata ctgcaattcc cataggatct tgtgttagta aatgtcacac agataggggt       900

tcaatctcta caaccaaacc ctttcagaac atctcaagaa tatcaattgg ggactgtccc       960

aagtatgtca aacagggatc cttgaaacta gctacaggaa tgaggaatat ccctgagaaa      1020

gcaaccagag gcctgtttgg tgcaattg                                         1048

 

<210>15

<211>1707

<212>DNA

<213>A型流感病毒

 

<400>15

atggagaaaa tagtgcttct tcttgcaata gtcagtcttg ttaaaagtga tcagatttgc        60

attggttacc atgcaaacaa ctcgacagag caggttgaca caataatgga aaagaacgtt       120

actgttacac atgcccaaga catactggaa aagacacaca acgggaaact ctgcgatcta       180

gatggagtga agcctctaat tttgagagat tgtagtgtag ctggatggct cctcggaaac       240

cctatgtgtg acgaattcat caatgtgccg gaatggtctt acatagtgga gaaggccagt       300

ccagccaatg acctctgtta cccaggggat ttcaacgact atgaagaact gaaacaccta       360

ttgagcagaa taaaccactt tgagaaaatt cagatcatcc ccaaaagttc ttggtccaat       420

catgaagcct catcaggggt gagcgcagca tgtccatacc atgggaagcc ctcctttttc       480

agaaatgtgg tatggcttat caaaaagaac agtgcatacc caacaataaa gaggagctac       540

aataatacca accaagaaga tcttttggta ctgtggggga ttcaccatcc taatgatgcg       600

gcagagcaga caaagctcta tcaaaaccca accacctata tttccgttgg aacatcaaca       660

ctaaaccaga gattggtccc aaaaatagct actagatcca aagtaaacgg gcaaagtgga       720

agaatggagt tcttctggac aattttaaag ccgaatgatg ccataaattt cgagagtaat       780

ggaaatttca ttgctccaga atatgcatac aaaattgtca agaaagggga ctcagcaatt       840

atgaaaagtg aattggaata tggtaactgc aacaccaagt gtcaaactcc aatgggggcg       900

ataaactcta gtatgccatt ccacaacata caccctctca caatcgggga atgccccaaa       960

tatgtgaaat caaacagatt agtccttgcg actggactca gaaatacccc tcaaagagat      1020

agaagaagaa aaaagagagg actatttgga gctatagcag gttttataga gggaggatgg      1080

caaggaatgg tagatggttg gtatgggtac caccatagca atgagcaggg gagtggatac      1140

gctgcagaca aagaatccac tcaaaaggca atagatggag tcaccaataa ggtcaactcg      1200

atcattgaca aaatgaacac tcagtttgag gccgttggaa gggaatttaa taacttagaa      1260

aggaggatag aaaatttaaa caagaagatg gaagacggat tcctagatgt ctggacttat      1320

aatgctgaac ttctggttct catggaaaat gagagaactc tagactttca tgattcaaat      1380

gtcaagaacc tttacaacaa ggtccgacta cagcttaggg ataatgcaaa ggagctgggt      1440

aatggttgtt tcgagttcta tcacaaatgt gataatgaat gtatggaaag tgtaaaaaac      1500

gggacgtatg actacccgca gtattcagaa gaagcaagac taaacagaga ggaaataagt      1560

ggagtaaaat tggaatcaat gggaacttac caaatactgt caatttattc aacagtggcg      1620

agttccctag cactggcaat catggtagct ggtctatctt tatggatgtg ctccaatggg      1680

tcgttacaat gcagaatttg catttaa                                          1707

 

<210>16

<211>1050

<212>DNA

<213>A型流感病毒

 

<400>16

atgattgcaa tcattgtaat agcgatactg gcagcagccg gaaagtcaga caagatctgc        60

attgggtatc atgccaacaa ttcaacaaca caggtggata cgatacttga gaagaatgta       120

accgtcacac actcagttga attgctggag aatcagaagg aagaaagatt ctgcaagatc       180

ttgaacaagg cccctctcga cctaaaggga tgcaccatag agggttggat cttggggaat       240

ccccaatgcg atctgttgct tggtgaccaa agctggtcat atatagtgga aagacctact       300

gcccaaaatg ggatatgcta cccaggagct ttgaatgagg tagaagaact gaaagcattt       360

atcggatcag gagaaagggt agagagattt gagatgtttc ccaaaagcac atgggcaggg       420

gtagacacca gcagtggggt aacaaaagct tgtccttata atagtggttc atctttctac       480

agaaacctcc tatggataat aaagaccaag tcagcagcgt atccagtaat taagggaact       540

tacagcaaca ctggaaacca gccaatcctc tatttctggg gtgtgcacca tcctcctgac       600

accaatgagc aaaatactct gtatggctct ggcgatcggt atgttaggat gggaactgag       660

agcatgaatt ttgccaagag cccagaaatt gcggcaagac ccgctgtgaa tggccaaaga       720

ggtcgaattg attattactg gtctgtttta aaaccaggag aaaccttgaa tgtggaatct       780

aatggaaatc taatcgctcc ttggtatgca tacaaatttg tcaacacaaa taataaggga       840

gccgtcttca agtcaaattt accaatcgag aattgcgatg ccacatgcca gactattgca       900

ggagtcctaa ggaccaataa aacatttcag aatgtgagcc ctctgtggat aggagaatgc       960

cccaagtatg tgaaaagtga aagtctaagg cttgctactg gactaagaaa tgttccacag      1020

attgaaacca gagggctttt cggagctatc                                       1050

 

<210>17

<211>1698

<212>DNA

<213>A型流感病毒

 

<400>17

atggaaaaat tcatcgcaat agcaaccttg gcgagcacaa atgcatacga taggatatgc        60

attgggtacc aatcaaacaa ctccacagac acagtgaaca ctctcataga acagaatgta       120

ccagtcaccc aaacaatgga gctcgtggaa acagagaaac atcccgctta ttgtaacact       180

gatttaggtg ccccattgga actgcgagac tgcaagattg aggcagtaat ctatgggaac       240

cccaagtgtg acatccatct gaaggatcaa ggttggtcat acatagtgga gaggcccagc       300

gcaccagaag ggatgtgtta ccctggatct gtggaaaatc tagaagaact gaggtttgtc       360

ttctccagtg ctgcatctta caagagaata agactatttg actattccag gtggaatgtg       420

actagatctg gaacgagtaa agcatgcaat gcatcaacag gtggccaatc cttctatagg       480

agcatcaatt ggttgaccaa aaaggaacca gacacttatg acttcaatga aggagcttat       540

gttaataatg aagatggaga catcattttc ttatggggga tccatcatcc gccggacaca       600

aaagagcaga caacactata taaaaatgca aacactttga gtagtgttac tactaacact       660

ataaacagaa gctttcaacc aaatattggt cccagaccat tagtaagagg acagcaaggg       720

aggatggatt actattgggg cattctgaaa agaggggaga ctctgaagat caggaccaac       780

ggaaatttaa tcgcacctga atttggctat ctgctcaaag gtgaaagcta cggcagaata       840

attcaaaatg aggatatacc catcgggaac tgtaacacaa aatgtcaaac atatgcggga       900

gcaatcaata gcagcaaacc ctttcagaat gcaagtaggc attacatggg agaatgtccc       960

aaatatgtga agaaggcaag cttgcgactt gcagttgggc ttaggaatac gccttctgtt      1020

gaacccagag gactgtttgg agccattgct ggtttcattg aaggaggatg gtctggaatg      1080

attgatgggt ggtatggatt tcatcacagc aattcagagg gaacaggaat ggcagctgac      1140

cagaaatcaa cacaagaagc catcgataag atcaccaata aagtcaacaa tatagttgac      1200

aagatgaaca gggagtttga agttgtgaat catgagttct ctgaagttga aaaaagaata      1260

aacatgataa acgataaaat agatgaccaa attgaagatc tttgggctta caatgcagag      1320

ctccttgtgc tcttagagaa ccagaaaacg ctagacgaac atgattccaa tgtcaaaaac      1380

ctttttgatg aagtgaaaag gagactgtca gccaatgcaa tagatgctgg gaacggttgc      1440

tttgacatac ttcacaaatg cgacaatgag tgtatggaaa ctataaagaa cggaacttac      1500

gatcataagg aatatgaaga ggaggctaaa ctagaaagga gcaagataaa tggagtaaaa      1560

ctagaagaga acaccactta caaaattctt agcatttaca gtacagtggc ggccagtctt      1620

tgcttggcaa tcctgattgc tggaggttta atcctgggca tgcaaaatgg atcttgtaga      1680

tgcatgttct gtatttga                                                    1698

 

<210>18

<211>1363

<212>DNA

<213>A型流感病毒

 

<400>18

atggaaacag tatcactaat gactatacta ctagtagcaa cagcaagcaa tgcagacaaa        60

atctgcatcg gccaccagtc aacaaactcc acagaaactg tggacacgct aacagaaacc       120

aatgttcctg tgacacatgc caaagaattg ctccacacag agcacaatgg aatgctgtgt       180

gcaacaaatc tgggacatcc cctaatctta gacacgtgca ctattgaagg actgatctat       240

ggtaaccctt cttgtgactt gctgttggga ggaagagaat ggtcctacat cgtcgaaagg       300

tcatcagctg taaatggaac gtgttaccct gggaatgtag agaacctaga ggaactcagg       360

acacttttta gttccgctag ttcctaccga agaatccaaa tcttcccaga cacaatctgg       420

aatgtgactt acactggaac aagcaaagca tgttcagatt cattctacag gagtatgaga       480

tggctgactc aaaaaagcgg gtcttaccct gttcaagacg ctcaatacac aaataatatg       540

ggaaagagca ttcttttcgt gtggggcata catcacccac ccactgaagc tgcacagaca       600

aatttgtaca caagaaccga cacaacaaca agcgtgacaa cagaagactt aaataggatc       660

ttcaaaccga tggtagggcc aaggcccctt gtcaatggtc tgcagggaag aattaattat       720

tattggtcgg tactaaaacc aggccagaca ctgcgagtaa gatccaatgg gaatctaatt       780

gctccatggt atggacacat tctttcggga gggagccatg gaagaatcct gaagactgat       840

ttaaaaagta gtaattgcgt agtgcaatgt cagactgaaa aaggcggctt aaacagtaca       900

ttgccgttcc acaatatcag taaatatgca tttggaaact gtcccaaata tgttagagtt       960

aaaagtctca aactggcagt agggttgagg aacgtgcctg ctagatcaag tagaggacta      1020

ttcggagcca tagctggatt catagaagga ggttggccag gactagtcgc tggttggtat      1080

ggtttccagc attcaaatga tcaaggggtt ggtattgcgg cagataggga ttcaactcaa      1140

aaggcaattg atagaataac aaccaaggtg aataatatag tcgacaaaat gaacaaacaa      1200

tatgaaataa ttgatcatga attcagtgag gttgaaacta ggctcaacat gatcaataat      1260

aagattgatg accaaataca agacatatgg gcatataatg cagagttgct agtactactt      1320

gaaaaccaga aaacactcga tgagcatgac gcaaatgtga aga                        1363

 

<210>19

<211>1727

<212>DNA

<213>A型流感病毒

 

<400>19

agcaaaagca ggggtcacaa tgtacaaagt agtagtaata attgcgctcc ttggagcagt        60

gaaaggtctt gacagaatct gcctaggaca ccatgcggtt gccaatggaa ccattgtgaa       120

gacccttaca aatgaacaag aggaagtgac caatgctact gagacggtag agagcacaaa       180

tttgaataaa ttgtgtatga aaggaagaag ctacaaggac ttgggcaatt gtcacccggt       240

aggaatgttg ataggaacac ctgtttgtga tccgcacttg accgggacct gggacactct       300

cattgagcga gagaatgcca ttgcccactg ttatccaggg gcaaccataa atgaagaagc       360

attgaggcag aaaataatgg aaagtggagg aatcagcaag atgagcactg gcttcactta       420

tgggtcttcc atcacctcag ctgggaccac taaggcatgc atgagaaatg gaggagatag       480

tttctatgca gagctcaaat ggctagtgtc aaagacaaag ggacaaaatt tccctcagac       540

aacaaacacc tatcggaata cggacacagc agaacatctc ataatatggg gaattcatca       600

cccttccagc acacaggaaa agaatgactt atacggaact cagtcactat ctatatcagt       660

tgagagttct acatatcaga acaactttgt tccagttgtt ggggcaagac ctcaggtcaa       720

tggacaaagt gggcgaattg actttcactg gacactagta cagccgggtg acaacataac       780

cttctcagac aatggaggtc taatagcacc aagtcgagtt agcaaattaa ctggaaggga       840

tttgggaatc caatcagaag cgttgataga caacagttgt gaatccaaat gcttttggag       900

agggggttct ataaatacaa agctcccttt tcaaaatctg tcacccagaa cagtaggtca       960

atgccccaaa tacgtaaatc agaggagttt actgcttgca acagggatga ggaatgtgcc      1020

agaagtggtg cagggaaggg gtctgtttgg tgcaatagca gggttcatag aaaacggatg      1080

ggaaggaatg gtagacggct ggtatggttt cagacaccaa aatgcccagg gcacaggcca      1140

agctgctgat tacaagagta ctcaagcagc tattgaccaa atcacaggga aactgaacag      1200

gttgattgag aagaccaaca ctgagtttga gtcaatagaa tctgaattca gtgagactga      1260

gcatcaaatt ggtaacgtca ttaattggac caaagattca ataaccgaca tttggactta      1320

caacgcagag ctattagtgg caatggagaa tcagcacaca attgacatgg ctgattcaga      1380

gatgctaaat ctgtatgaaa gggtaagaaa gcaactcaga cagaatgcag aagaagacgg      1440

aaagggatgt tttgagatat atcatacttg tgatgattcg tgcatggaga gtataaggaa      1500

caatacttat gaccattcac aatacagaga ggaggctctt ctgaatagac tgaacatcaa      1560

cccagtgaaa ctttcttcgg ggtacaaaga catcatactt tggtttagct tcggggaatc      1620

atgctttgtt cttctagccg ttgttatggg tcttgttttc ttctgcctga aaaatggaaa      1680

catgcgatgc acaatctgta tttagttaaa aacaccttgt ttctact                    1727

 

<210>20

<211>1698

<212>DNA

<213>A型流感病毒

 

<400>20

atggagaaaa cactgctatt tgcagctatt ttcctttgtg tgaaagcaga tgagatctgt        60

atcgggtatt taagcaacaa ctcgacagac aaagttgaca caataattga gaacaatgtc       120

acggtcacta gctcagtgga actggttgag acagaacaca ctggatcatt ctgttcaatc       180

aatggaaaac aaccaataag ccttggagat tgttcatttg ctggatggat attaggaaac       240

cctatgtgtg atgaactaat tggaaagact tcatggtctt acattgtgga aaaacccaat       300

ccaacaaatg gaatctgtta cccaggaact ttagagagtg aagaagaact aagactgaaa       360

ttcagtggag ttttagaatt taacaaattc gaagtattca catcaaatgg atggggtgct       420

gtaaattcag gagtaggagt aaccgctgca tgcaaattcg ggggttctaa ttctttcttt       480

cgaaacatgg tatggctgat acaccaatca ggaacatatc ctgtaataaa gagaaccttt       540

aacaacacca aagggagaga tgtactgatt gtttggggaa ttcatcatcc tgctacactg       600

acagaacatc aagatctgta taaaaaggac agctcctatg tagcagtggg ttcagagacc       660

tacaacagaa gattcactcc agaaatcaac actaggccca gagtcaatgg acaggccgga       720

cggatgacat tctactggaa gatagtcaaa ccaggagaat caataacatt cgaatctaat       780

ggggcgttcc tagctcctag atatgctttt gagattgtct ctgttggaaa tgggaaactg       840

ttcaggagcg aactgaacat tgaatcatgc tctaccaaat gtcaaacaga aataggagga       900

attaatacga acaaaagctt ccacaatgtt cacagaaaca ctatcgggga ttgccccaag       960

tatgtgaatg tcaaatcctt aaagcttgca acaggaccta gaaatgtccc agcaatagca      1020

tcgagaggct tgtttggagc aatagctgga ttcatagaag ggggatggcc tggactgatc      1080

aatggatggt atgggttcca acacagggac gaagaaggaa caggcattgc agcagacaag      1140

gagtcaactc aaaaggcaat agaccagata acatccaagg taaataacat cgttgacagg      1200

atgaatacaa actttgagtc tgtgcaacac gaattcagtg aaatagagga aagaataaat      1260

caattatcaa aacacgtaga tgattctgtg gttgacatct ggtcatataa tgcacagctt      1320

ctcgttttac ttgaaaatga gaagacactg gacctccatg actcaaatgt caggaacctc      1380

catgagaaag tcagaagaat gctaaaggac aatgccaaag atgaggggaa cggatgcttc      1440

accttttacc ataagtgtga caataaatgc attgaacgag ttagaaacgg aacatatgat      1500

cataaagaat tcgaggagga atcaaaaatc aatcgccagg agattgaagg ggtgaaacta      1560

gattctagtg ggaatgtgta taaaatactg tcaatttaca gctgcattgc aagcagtctt      1620

gtattggcag cactcatcat ggggttcatg ttttgggcat gcagtaatgg atcatgtaga      1680

tgtaccattt gcatttag                                                    1698

 

<210>21

<211>1695

<212>DNA

<213>A型流感病毒

 

<400>21

atggaaaaat tcatcatttt gagtactgtc ttggcagcaa gctttgcata tgacaaaatt        60

tgcattggat accaaacaaa caactcgact gaaacggtaa acacactaag tgaacaaaac       120

gttccggtga cgcaggtgga agaacttgta catcgtggga ttgatccgat cctgtgtgga       180

acggaactag gatcaccact agtgcttgat gactgttcat tagagggtct aatcctaggc       240

aatcccaaat gtgatcttta tttgaatggc agggaatggt catacatagt agagaggccc       300

aaagagatgg aaggagtttg ctatccaggg tcaattgaaa accaggaaga gctaagatct       360

ctgttttctt ccatcaaaaa atatgaaaga gtgaagatgt ttgatttcac caaatggaat       420

gtcacataca ctgggaccag caaggcctgc aataatacat caaaccaagg ctcattctat       480

aggagcatga gatggttgac cttaaaatca ggacaatttc cagtccaaac agatgagtac       540

aagaacacca gagattcaga cattgtattc acctgggcca ttcaccaccc accaacatct       600

gatgaacaag taaaattata caaaaatcct gatactctct cttcagtcac caccgtagaa       660

atcaatagga gcttcaagcc taatataggg ccaagaccac tcgtgagagg acaacaaggg       720

agaatggatt actactgggc tgttcttaaa cctggacaaa cagtcaaaat acaaaccaat       780

ggtaatctta ttgcacctga atatggtcac ttaatcacag ggaaatcaca tggcaggata       840

ctcaagaata atttgcccat gggacagtgt gtgactgaat gtcaattgaa cgagggtgta       900

atgaacacaa gcaaaccttt ccagaacact agtaagcact atattgggaa atgccccaaa       960

tacataccat cagggagttt aaaattggca atagggctca ggaatgtccc acaagttcaa      1020

gatcgggggc tctttggagc aattgcaggt ttcatagaag gcggatggcc agggctagtg      1080

gctggttggt acggatttca gcatcaaaat gcggagggga caggcatagc tgcagacaga      1140

gacagcaccc aaagggcaat agacaatatg caaaacaaac tcaacaatgt catcgacaaa      1200

atgaataaac aatttgaagt ggtgaatcat gagttttcag aagtggaaag cagaataaac      1260

atgattaatt ccaaaattga tgatcagata actgacatat gggcatacaa tgctgaattg      1320

cttgtcctat tggaaaatca gaagacatta gatgagcatg acgctaatgt aaggaatcta      1380

catgatcggg tcagaagagt cctgagggaa aatgcaattg acacaggaga cggctgcttt      1440

gagattttac ataaatgtga caacaattgt atggacacga ttagaaacgg gacatacaat      1500

cacaaagagt atgaggaaga aagcaaaatc gaacgacaga aagtcaatgg tgtgaaactt      1560

gaggagaatt ctacatataa aattctgagc atctacagca gtgttgcctc aagcttagtt      1620

ctactgctca tgattattgg gggtttcatt ttcgggtgtc aaaatggaaa tgttcgttgt      1680

actttctgta tttaa                                                       1695

 

<210>22

<211>1701

<212>DNA

<213>A型流感病毒

 

<400>22

atggctctaa atgtcattgc aactttgaca cttataagtg tatgtgtaca tgcagacaga        60

atatgcgtgg ggtatctgag caccaattca tcagaaaggg tcgacacgct ccttgaaaat       120

ggggtcccag tcaccagctc cattgatctg attgagacaa accacacagg aacatactgt       180

tctctaaatg gagtcagtcc agtgcatttg ggagattgca gctttgaagg atggattgta       240

ggaaacccag cctgcaccag caactttggg atcagagagt ggtcatacct gattgaggac       300

cccgcggccc ctcatgggct ttgctaccct ggagaattaa acaacaatgg tgaactcaga       360

cacttgttca gtggaatcag gtcattcagt agaacggaat tgatcccacc tacctcctgg       420

ggggaagtac ttgacggtac aacatctgct tgcagagata acacgggaac caacagcttc       480

tatcgaaatt tagtttggtt tataaagaag aatactagat atccagttat cagtaagacc       540

tacaacaata caacgggaag ggatgtttta gttttatggg gaatacatca cccagtgtct       600

gtggatgaga caaagactct gtatgtcaat agtgatccat acacactggt ttccaccaag       660

tcttggagcg agaaatataa actagaaacg ggagtccgac ctggctataa tggacagagg       720

agctggatga aaatttattg gtctttgata catccagggg agatgattac tttcgagagt       780

aatggtggat ttttagcccc aagatatggg tacataattg aagaatatgg aaaaggaagg       840

attttccaga gtcgcatcag aatgtctagg tgcaacacca agtgccagac ttcggttgga       900

gggataaaca caaacagaac gttccaaaac atcgataaga atgctcttgg tgactgtccc       960

aaatacataa agtctggcca actcaagcta gccactggac tcagaaatgt gccagctata      1020

tcgaatagag gattgttcgg agcaattgca gggttcatag aaggaggctg gccaggttta      1080

atcaatggtt ggtacggttt tcagcatcaa aatgaacagg gaacaggaat agctgcagac      1140

aaagaatcaa cacagaaagc tatagaccag ataacaacca aaataaataa cattattgat      1200

aaaatgaatg ggaactatga ttcaattagg ggtgaattca atcaagttga gaagcgtata      1260

aacatgcttg cagacagaat agatgatgcc gtgacggaca tttggtcata caatgccaaa      1320

cttcttgtat tgctggaaaa tgataaaact ttagatatgc atgatgctaa tgtaaagaat      1380

ttacatgagc aagtacgaag agaattgaag gacaatgcaa ttgacgaagg aaatggctgt      1440

tttgaactcc ttcataaatg caatgactcc tgcatggaaa ctataagaaa tggaacgtat      1500

gaccacactg agtatgcaga ggagtcaaag ttaaagaggc aagaaatcga tgggatcaaa      1560

ctcaaatcag aagacaacgt ttacaaagca ttatcaatat acagttgcat tgcaagtagt      1620

gttgtactag taggactcat actctctttc atcatgtggg cctgtagtag tgggaattgc      1680

cgattcaatg tttgtatata a                                                1701

 

<210>23

<211>1749

<212>DNA

<213>A型流感病毒

 

<400>23

agcaaaagca ggggaaaatg attgcactca tattggttgc actggctctg agccacactg        60

cttattctca gatcacaaat gggacaacag gaaaccccat tatatgcttg gggcatcatg       120

cagtggaaaa cggcacatct gttaaaacac taacagacaa tcacgtagaa gttgtgtcag       180

ctaaagaatt agttgagacg aaccacactg atgaactgtg cccaagcccc ttgaagcttg       240

tcgacgggca agactgccac ctcatcaatg gtgcattggg gagtccaggc tgtgaccgtt       300

tgcaggacac cacttgggat gtcttcattg aaaggcccac tgcagtagac acatgttatc       360

cattcgacgt cccagattac cagagtctca gaagcatcct agcaagcagt gggagtttgg       420

agttcatcgc cgaacaattc acctggaatg gtgtcaaagt tgacggatca agcagtgctt       480

gtttgagggg cggtcgcaac agcttcttct cccgactaaa ctggctaacc aaagcaacaa       540

atggaaacta tggacctatt aacgtcacta aagaaaatac gggctcttat gtcaggctct       600

atctctgggg agtgcatcac ccatcaagcg ataatgagca aacggatctc tacaaggtgg       660

caacagggag agtaacagta tctacccgct cggaccaaat cagtattgtt cccaatatag       720

gaagtagacc gagggtaagg aatcagagcg gcaggataag catctactgg accctagtaa       780

acccagggga ctccatcatt ttcaacagta ttgggaattt gattgcacca agaggccact       840

acaaaataag caaatctact aagagcacag tgcttaaaag tgacaaaagg attgggtcat       900

gcacaagccc ttgcttaact gataaaggtt cgatccaaag tgacaaacct tttcagaatg       960

tatcaaggat tgctatagga aactgcccga aatatgtaaa gcaagggtcc ctgatgttag      1020

caactggaat gcgcaacatc cctggcaaac aggcaaaggg cttatttggg gcaattgctg      1080

gattcattga aaatggttgg caaggcctga ttgatgggtg gtatggattc aggcaccaaa      1140

atgctgaagg aacaggaact gctgcagacc tgaagtcaac tcaggcagcc attgatcaga      1200

taaatggcaa gctgaacaga ttgatagaga agacaaatga aaaatatcac caaatagaaa      1260

aggaattcga acaggtggaa ggaagaatac aagaccttga gaagtacgtt gaggacacta      1320

agattgattt gtggtcatac aatgctgaat tgctagtagc actagagaat cagcacacaa      1380

tagatgtcac agactccgaa atgaacaagc tttttgaaag agtaagaagg caattaagag      1440

agaatgcaga agatcaaggc aacggttgtt tcgagatatt ccatcagtgt gacaacaatt      1500

gtatagaaag cattagaaac ggaacttatg accacaacat ctacagggat gaagccatca      1560

acaatcgaat caaaataaat cctgtcactt tgacgatggg gtacaaggac ataatcctgt      1620

ggatttcttt ctccatgtca tgctttgtct tcgtggcact gattctggga tttgttctat      1680

gggcttgtca aaacgggaat atccgatgcc aaatctgtat ataaagaaaa aacacccttg      1740

tttctactc                                                              1749

 

<210>24

<211>1762

<212>DNA

<213>A型流感病毒

 

<400>24

agcaaaagca ggggatacaa aatgaacact caaatcatcg tcattctagt cctcggactg        60

tcgatggtga gatctgacaa gatttgtctc gggcaccatg ccgtagcaaa tgggacaaaa       120

gtcaacacac taactgagaa aggagtggaa gtggtcaatg ccacggagac agtggagatt       180

acaggaataa ataaagtgtg cacaaaaggg aagaaagcgg tggacttggg atcttgtgga       240

atactgggaa ctatcattgg gcctccacaa tgtgactctc atcttaaatt caaagctgat       300

ctgataatag aaagaagaaa ttcaagtgac atctgttacc cagggaaatt cactaatgag       360

gaagcactga gacaaataat cagagaatct ggtggaattg acaaagagcc aatgggattt       420

agatattcag gaataaaaac agacggggca accagtgcgt gtaagagaac agtgtcctct       480

ttctactcag aaatgaaatg gcttttatcc agcaaggcta accaggtgtt cccacaactg       540

aatcagacat acaggaacaa cagaaaagaa ccagccctaa ttgtttgggg agtacatcat       600

tcaagttcct tggatgagca aaataagcta tatggagctg ggaacaagct gataacagta       660

ggaagctcaa aataccaaca atcgttttca ccaagtccag gggacaggcc caaagtgaat       720

ggtcaggccg ggaggatcga ctttcattgg atgctattgg acccagggga tacagtcact       780

tttaccttca atggtgcatt catagcccca gatagagcca cctttctccg ctctaatgcc       840

ccatcgggag ttgagtacaa tgggaagtca ctgggaatac agagtgatgc acaaattgat       900

gaatcatgtg aaggggaatg cttctacagt ggagggacaa taaacagccc tttgccattt       960

caaaacatcg atagttgggc tgtcggaagg tgccccagat atgtaaagca atcaagcctg      1020

ccgctggcct taggaatgaa aaatgtacca gagaaaatac atactagggg actgttcggt      1080

gcaattgcag gattcatcga gaatggatgg gaaggactca ttgatggatg gtatggattt      1140

aggcatcaaa atgcacaggg gcagggaaca gctgctgact acaagagtac tcaggctgca      1200

attgaccaga taacagggaa acttaataga ttaattgaaa aaaccaacac acagtttgaa      1260

ctcatagaca atgagttcac tgaagtggag cagcagatag gcaatgtaat aaactggaca      1320

agggactcct tgactgagat ctggtcatac aatgctgaac ttctagtagc aatggaaaat      1380

cagcatacaa ttgaccttgc agattctgaa atgaacaaac tctatgagag agtgagaaga      1440

cagctaaggg agaatgccga ggaggatgga actggatgtt ttgagatttt ccaccgatgt      1500

gacgatcaat gtatggagag catacgaaat aatacttaca atcacactga atatcgacag      1560

gaagccttac agaataggat aatgatcaat ccggtaaagc ttagtggtgg gtacaaagat      1620

gtgatactat ggtttagctt cggggcatca tgtgtaatgc ttctagccat tgctatgggt      1680

cttattttca tgtgtgtgaa aaacgggaat ctgcggtgca ctatctgtat ataattattt      1740

gaaaaacacc cttgtttcta ct                                               1762

 

<210>25

<211>1760

<212>DNA

<213>A型流感病毒

 

<400>25

agcaaaagca ggggatattg tcaaaacaac agaatggtga tcaaagtgct ctactttctc        60

atcgtattgt taagtaggta ttcgaaagca gacaaaatat gcataggata tctaagcaac       120

aacgccacag acacagtaga cacactgaca gagaacggag ttccagtgac cagctcagtt       180

gatctcgttg aaacaaacca cacaggaaca tactgctcac tgaatggaat cagcccaatt       240

catcttggtg actgcagctt tgagggatgg atcgtaggaa acccttcctg tgccaccaac       300

atcaacatca gagagtggtc gtatctaatt gaggacccca atgcccccaa caaactctgc       360

ttcccaggag agttagataa taatggagaa ttacgacatc tcttcagcgg agtgaactct       420

tttagcagaa cagaattaat aagtcccaac aaatggggag acattctgga tggagtcacc       480

gcttcttgcc gcgataatgg ggcaagcagt ttttacagaa atttggtctg gatagtgaag       540

aataaaaatg gaaaataccc tgtcataaag ggggattaca ataacacaac aggcagagat       600

gttctagtac tctggggcat tcaccatccg gatacagaaa caacagccat aaacttgtac       660

gcaagcaaaa acccctacac attagtatca acaaaggaat ggagcaaaag atatgaacta       720

gaaattggca ccagaatagg tgatggacag agaagttgga tgaaactata ttggcacctc       780

atgcgccctg gagagaggat aatgtttgaa agcaacgggg gccttatagc gcccagatac       840

ggatacatca ttgagaagta cggtacagga cgaattttcc aaagtggagt gagaatggcc       900

aaatgcaaca caaagtgtca aacatcatta ggtgggataaacaccaacaa aactttccaa        960

aacatagaga gaaatgctct tggagattgc ccaaagtaca taaagtctgg acagctgaag      1020

cttgcaactg ggctgagaaa tgtcccatcc gttggtgaaa gaggtttgtt tggtgcaatt      1080

gcaggcttca tagaaggagg gtggcctggg ctaattaatg gatggtatgg tttccagcat      1140

cagaatgaac aggggactgg cattgctgca gacaaagcct ccactcagaa agcgatagat      1200

gaaataacaa caaaaattaa caatataata gagaagatga acggaaacta tgattcaata      1260

agaggggaat tcaatcaagt agaaaagagg atcaacatgc tcgctgatcg agttgatgat      1320

gcagtaactg acatatggtc gtacaatgct aaacttcttg tactgcttga aaatgggaga      1380

acattggact tacacgacgc aaatgtcagg aacttacacg atcaggtcaa gagaatattg      1440

aaaagtaatg ctattgatga aggagatggt tgcttcaatc ttcttcacaa atgtaatgac      1500

tcatgcatgg aaactattag aaatgggacc tacaatcatg aagattacag ggaagaatca      1560

caactgaaaa ggcaggaaat tgagggaata aaattgaagt ctgaagacaa tgtgtataaa      1620

gtactgtcga tttatagctg cattgcaagc agtattgtgc tggtaggtct catacttgcg      1680

ttcataatgt gggcatgcag caatggaaat tgccggttta atgtttgtat atagtcggaa      1740

aaaataccct tgtttctact                                                  1760

 

<210>26

<211>1882

<212>DNA

<213>A型流感病毒

 

<400>26

agcagaagcg ttgcattttc taatatccac aaaatgaagg caataattgt actactcatg        60

gtagtaacat ccaatgcaga tcgaatctgc actgggataa catcgtcaaa ctcacctcat       120

gtggttaaaa ctgccactca aggggaagtc aatgtgactg gtgtgatacc actaacaaca       180

acacctacca aatctcattt tgcaaatctc aaaggaacac agaccagagg aaaactatgc       240

ccaaactgtt ttaactgcac agatctggac gtggccctag gcagaccaaa atgcatgggg       300

aacacaccct ccgcaaaagt ctcaatactc catgaagtca aacctgctac atctggatgc       360

tttcctataa tgcacgacag aacaaaaatc agacaactac ctaatcttct cagaggatat       420

gaaaacatca ggttatcaac cagtaatgtt atcaatacag agacggcacc aggaggaccc       480

tacaaggtgg ggacctcagg atcttgccct aacgttgcta atgggaacgg cttcttcaac       540

acaatggctt gggttatccc aaaagacaac aacaagacag caataaatcc agtaacagta       600

gaagtaccat acatttgttc agaaggggaa gaccaaatta ctgtttgggg gttccactct       660

gatgacaaaa cccaaatgga aagactctat ggagactcaa atcctcaaaa gttcacctca       720

tctgccaatg gagtaaccac acattatgtt tctcagattg gtggcttccc aaatcaaaca       780

gaagacgaag ggctaaaaca aagcggcaga attgttgttg attacatggt acaaaaacct       840

ggaaaaacag gaacaattgt ttatcaaaga ggcattttat tgcctcaaaa agtgtggtgc       900

gcaagtggca ggagcaaggt aataaaaggg tccttgcctt taattggtga agcagattgc       960

ctccacgaaa agtacggtgg attaaataaa agcaagcctt actacacagg agagcatgca      1020

aaggccatag gaaattgccc aatatgggtg aaaacaccct tgaagctggc caatggaacc      1080

aaatatagac cgcctgcaaa actattaaag gaaagaggtt tcttcggagc tattgctggt      1140

ttcttggaag gaggatggga aggaatgatt gcaggttggc acggatacac atctcatgga      1200

gcacatggag tggcagtggc agcagacctt aagagtacac aagaagctat aaacaagata      1260

acaaaaaatc tcaactattt aagtgagcta gaagtaaaaa accttcaaag actaagcgga      1320

gcaatgaatg agcttcacga cgaaatactc gagctagacg aaaaagtgga tgatctaaga      1380

gctgatacaa taagctcaca aatagagctt gcagtcttgc tttccaacga agggataata      1440

aacagtgaag atgagcatct cttggcactt gaaagaaaac tgaagaaaat gcttggcccc      1500

tctgctgtag aaatagggaa tgggtgcttt gaaaccaaac acaaatgcaa ccagacttgc      1560

ctagacagga tagctgctgg cacctttaat gcaggagatt tttctcttcc cacttttgat      1620

tcattaaaca ttactgctgc atctttaaat gatgatggct tggataatca tactatactg      1680

ctctactact caactgctgc ttctagcttg gctgtaacat taatgatagc tatcttcatt      1740

gtctacatgg tctccagaga caatgtttct tgttccatct gtctgtgagg gagattaagc      1800

cctgtgtttt cctttactgt agtgctcatt tgcttgtcac cattacaaag aaacgttatt      1860

gaaaaatgct cttgttacta ct                                               1882

 

<210>27

<211>2073

<212>DNA

<213>A型流感病毒

 

<400>27

agcagaagca gggggttaat aatgtttttc tcattactct tggtgttggg cctcacagag        60

gctgaaaaaa taaagatatg ccttcaaaag caagtgaaca gtagcttcag cctacacaat       120

ggcttcggag gaaatttgta tgccacagaa gaaaaaagaa tgtttgagct tgttaagccc       180

aaagctggag cctctgtctt gaatcaaagt acatggattg gctttggaga ttcaaggact       240

gacaaaagca attcagcttt tcctaggtct gctgatgttt cagcaaaaac tgctgataag       300

tttcgttttt tgtctggtgg atccttaatg ttgagtatgt ttggcccacc tgggaaggta       360

gactaccttt accaaggatg tggaaaacat aaagtttttt atgaaggagt taactggagt       420

ccacatgctg ctataaattg ttacagaaaa aattggactg atatcaaact gaatttccag       480

aaaaacattt atgaattggc ttcacaatca cattgcatga gcttggtgaa tgccttggac       540

aaaactattc ctttacaagt gactgctggg actgcaggaa attgcaacaa cagcttctta       600

aaaaatccag cattgtacac acaagaagtc aagccttcag aaaacaaatg tgggaaagaa       660

aatcttgctt tcttcacact tccaacccaa tttggaacct atgagtgcaa actgcatctt       720

gtggcttctt gctatttcat ctatgatagt aaagaagtgt acaataaaag aggatgtgac       780

aactactttc aagtgatcta tgattcattt ggaaaagtcg ttggaggact agataacagg       840

gtatcacctt acacagggaa ttctggagac accccaacaa tgcaatgtga catgctccag       900

ctgaaacctg gaagatattc agtaagaagc tctccaagat tccttttaat gcctgaaaga       960

agttattgct ttgacatgaa agaaaaagga ccagtcactg ctgtccaatc catttgggga      1020

aaaggcagag aatctgacta tgcagtggat caagcttgcttgagcactcc agggtgcatg       1080

ttgatccaaa agcaaaagcc atacattgga gaagctgatg atcaccatgg agatcaagaa      1140

atgagggagt tgctgtcagg actggactat gaagctagat gcatatcaca atcagggtgg      1200

gtgaatgaaa ccagtccttt tacggagaaa tacctccttc ctcccaaatt tggaagatgc      1260

cctttggctg caaaggaaga atccattcca aaaatcccag atggccttct aattcccacc      1320

agtggaaccg ataccactgt aaccaaacct aagagcagaa tttttggaat cgatgacctc      1380

attattggtg tgctctttgt tgcaatcgtt gaaacaggaa ttggaggcta tctgcttgga      1440

agtagaaaag aatcaggagg aggtgtgaca aaagaatcag ctgaaaaagg gtttgagaaa      1500

attggaaatg acatacaaat tttaaaatct tctataaata tcgcaataga aaaactaaat      1560

gacagaattt ctcatgatga gcaagccatc agagatctaa ctttagaaat tgaaaatgca      1620

agatctgaag ctttattggg agaattggga ataataagag ccttattggt aggaaatata      1680

agcataggat tacaggaatc tttatgggaa ctagcttcag aaataacaaa tagagcagga      1740

gatctagcag ttgaagtctc cccaggttgc tggataattg acaataacat ttgtgatcaa      1800

agctgtcaaa attttatttt caagttcaac gaaactgcac ctgttccaac cattccccct      1860

cttgacacaa aaattgatct gcaatcagat cctttttact ggggaagcag cttgggctta      1920

gcaataactg ctactatttc attggcagct ttggtgatct ctgggatcgc catctgcaga      1980

actaaatgat tgagacaatt ttgaaaaatg gataatgtgt tggtcaatat tttgtacagt      2040

tttataaaaa acaaaaatcc ccttgctact gct                                   2073

 

<210>28

<211>1670

<212>DNA

<213>流感病毒

 

<400>28

agatcttcgc tgacacaata tgtataggct accatgccaa caactcaacc gacactgttg        60

acacagtact tgagaagaat gtgacagtga cacactctgt caacctactt gaggacagtc       120

acaatggaaa actatgtcta ctaaaaggaa tagccccact acaattgggt aattgcagcg       180

ttgccggatg gatcttagga aacccagaat gcgaattact gatttccaag gaatcatggt       240

cctacattgt agaaacacca aatcctgaga atggaacatg ttacccaggg tatttcgccg       300

actatgagga actgagggag caattgagtt cagtatcttc atttgagaga ttcgaaatat       360

tccccaaaga aagctcatgg cccaaccaca ccgtaaccgg agtatcagca tcatgctccc       420

ataatgggaa aagcagtttt tacagaaatt tgctatggct gacggggaag aatggtttgt       480

acccaaacct gagcaagtcc tatgtaaaca acaaagagaa agaagtcctt gtactatggg       540

gtgttcatca cccgcctaac atagggaacc aaagggcact ctatcataca gaaaatgctt       600

atgtctctgt agtgtcttca cattatagca gaagattcac cccagaaata gccaaaagac       660

ccaaagtaag agatcaggaa ggaagaatca actactactg gactctgctg gaacctgggg       720

atacaataat atttgaggca aatggaaatc taatagcgcc atggtatgct tttgcactga       780

gtagaggctt tggatcagga atcatcacct caaatgcacc aatggatgaa tgtgatgcga       840

agtgtcaaac acctcaggga gctataaaca gcagtcttcc tttccagaat gtacacccag       900

tcacaatagg agagtgtcca aagtatgtca ggagtgcaaa attaaggatg gttacaggac       960

taaggaacat cccatccatt caatccagag gtttgtttgg agccattgcc ggtttcattg      1020

aaggggggtg gactggaatg gtagatgggt ggtatggtta tcatcatcag aatgagcaag      1080

gatctggcta tgctgcagat caaaaaagta cacaaaatgc cattaacggg attacaaaca      1140

aggtcaattc tgtaattgag aaaatgaaca ctcaattcac agctgtgggc aaagagttca      1200

acaaattgga aagaaggatg gaaaacttaa ataaaaaagt tgatgatggg tttctagaca      1260

tttggacata taatgcagaa ttgttggttc tactggaaaa tgaaaggact ttggatttcc      1320

atgactccaa tgtgaagaat ctgtatgaga aagtaaaaag ccaattaaag aataatgcca      1380

aagaaatagg aaacgggtgt tttgagttct atcacaagtg taacaatgaa tgcatggaga      1440

gtgtgaaaaa tggtacctat gactatccaa aatattccga agaatcaaag ttaaacaggg      1500

agaaaattga tggagtgaaa ttggaatcaa tgggagtata ccagattctg gcgatctact      1560

caactgtcgc cagttccctg gttcttttgg tctccctggg ggcaatcagc ttctggatgt      1620

gttccaatgg gtctttgcag tgtagaatat gcatctaaga gctcaggcct                 1670

 

<210>29

<211>32

<212>DNA

<213>人工序列

 

<220>

<223>引物

 

<400>29

agttccccgg gctggtatat ttatatgttg tc                                      32

 

<210>30

<211>46

<212>DNA

<213>人工序列

 

<220>

<223>引物

 

<400>30

aatagagctc cattttctct caagatgatt aattaattaa ttagtc                       46

<210>31

<211>46

<212>DNA

<213>人工序列

 

<220>

<223>引物

 

<400>31

aatagagctc gttaaaatgc ttcttcgtct  cctatttata atatgg                      46

 

<210>32

<211>48

<212>DNA

<213>人工序列

 

<220>

<223>引物

 

<400>32

ttacgaattc tccttcctaa ttggtgtact atcatttatc aaagggga                     48

 

<210>33

<211>1711

<212>DNA

<213>流感病毒

 

<400>33

atgaaagcaa aactactggt cctgttatgt acatttacag ctacatatgc agacacaata        60

tgtataggct accatgccaa caactcaacc gacactgttg acacagtact tgagaagaat       120

gtgacagtga cacactctgt caacctactt gaggacagtc acaatggaaa actatgtcta       180

ctaaaaggaa tagccccact acaattgggt aattgcagcg ttgccggatg gatcttagga       240

aacccagaat gcgaattact gatttccaag gaatcatggt cctacattgt agaaacacca       300

aatcctgaga atggaacatg ttacccaggg tatttcgccg actatgagga actgagggag       360

caattgagtt cagtatcttc atttgagaga ttcgaaatat tccccaaaga aagctcatgg       420

cccaaccaca ccgtaaccgg agtatcagca tcatgctccc ataatgggaa aagcagtttt       480

tacagaaatt tgctatggct gacggggaag aatggtttgt acccaaacct gagcaagtcc       540

tatgtaaaca acaaagagaa agaagtcctt gtactatggg gtgttcatca cccgcctaac       600

atagggaacc aaagggccct ctatcataca gaaaatgctt atgtctctgt agtgtcttca       660

cattatagca gaagattcac cccagaaata gccaaaagac ccaaagtaag agatcaggaa       720

ggaagaatca actactactg gactctgctg gaacctgggg atacaataat atttgaggca       780

aatggaaatc taatagcgcc atggtatgct tttgcactga gtagaggctt tggatcagga       840

atcatcacct caaatgcacc aatggatgaa tgtgatgcga agtgtcaaac acctcaggga       900

gctataaaca gcagtcttcc tttccagaat gtacacccag tcacaatagg agagtgtcca       960

aagtatgtca ggagtgcaaa attaaggatg gttacaggac taaggaacat cccatccatt      1020

caatccagag gtttgtttgg agccattgcc ggtttcattg aaggggggtg gactggaatg      1080

gtagatgggt ggtatggtta tcatcatcag aatgagcaag gatctggcta tgctgcagat      1140

caaaaaagta cacaaaatgc cattaacggg attacaaaca aggtgaattc tgtaattgag      1200

aaaatgaaca ctcaattcac agctgtgggc aaagaattca acaaattgga aagaaggatg      1260

gaaaacttaa ataaaaaagt tgatgatggg tttctagaca tttggacata taatgcagaa      1320

ttgttggttc tactggaaaa tgaaaggact ttggatttcc atgactccaa tgtgaagaat      1380

ctgtatgaga aagtaaaaag ccaattaaag aataatgcca aagaaatagg aaacgggtgt      1440

tttgaattct atcacaagtg taacaatgaa tgcatggaga gtgtgaaaaa tggaacttat      1500

gactatccaa aatattccga agaatcaaag ttaaacaggg agaaaattga tggagtgaaa      1560

ttggaatcaa tgggagtcta tcagattctg gcgatctact caactgtcgc cagttccctg      1620

gttcttttgg tctccctggg ggcaatcagc ttctggatgt gttccaatgg gtctttgcag      1680

tgtagaatat gcatctgaga ccagaatttc a                                     1711

 

<210>34

<211>1781

<212>DNA

<213>紫花苜蓿

 

<400>34

ccaaatcctt aacattcttt caacaccaac aatggcgaaa aacgttgcga ttttcggttt        60

attgttttct cttcttctgt tggttccttc tcagatcttc gctgaggaat catcaactga       120

cgctaaggaa tttgttctta cattggataa cactaatttc catgacactg ttaagaagca       180

cgatttcatc gtcgttgaat tctacgcacc ttggtgtgga cactgtaaga agctagcccc       240

agagtatgag aaggctgctt ctatcttgag cactcacgag ccaccagttg ttttggctaa       300

agttgatgcc aatgaggagc acaacaaaga cctcgcatcg gaaaatgatg ttaagggatt       360

cccaaccatt aagattttta ggaatggtgg aaagaacatt caagaataca aaggtccccg       420

tgaagctgaa ggtattgttg agtatttgaa aaaacaaagt ggccctgcat ccacagaaat       480

taaatctgct gatgatgcga ccgcttttgt tggtgacaac aaagttgtta ttgtcggagt       540

tttccctaaa ttttctggtg aggagtacga taacttcatt gcattagcag agaagttgcg       600

ttctgactat gactttgctc acactttgaa tgccaaacac cttccaaagg gagactcatc       660

agtgtctggg cctgtggtta ggttatttaa gccatttgac gagctctttg ttgactcaaa       720

ggatttcaat gtagaagctc tagagaaatt cattgaagaa tccagtaccc caattgtgac       780

tgtcttcaac aatgagccta gcaatcaccc ttttgttgtc aaattcttta actctcccaa       840

cgcaaaggct atgttgttca tcaactttac taccgaaggt gctgaatctt tcaaaacaaa       900

ataccatgaa gtggctgagc aatacaaaca acagggagtt agctttcttg ttggagatgt       960

tgagtctagt caaggtgcct tccagtattt tggactgaag gaagaacaag tacctctaat      1020

tattattcag cataatgatg gcaagaagtt tttcaaaccc aatttggaac ttgatcaact      1080

cccaacttgg ttgaaggcat acaaggatgg caaggttgaa ccatttgtca agtctgaacc      1140

tattcctgaa actaacaacg agcctgttaa agtggtggtt gggcaaactc ttgaggacgt      1200

tgttttcaag tctgggaaga atgttttgat agagttttat gctccttggt gtggtcactg      1260

caagcagttg gctccaatct tggatgaagt tgctgtctca ttccaaagcg atgctgatgt      1320

tgttattgca aaactggatg caactgccaa cgatatccca accgacacct ttgatgtcca      1380

aggctatcca accttgtact tcaggtcagc aagtggaaaa ctatcacaat acgacggtgg      1440

taggacaaag gaagacatca tagaattcat tgaaaagaac aaggataaaa ctggtgctgc      1500

tcatcaagaa gtagaacaac caaaagctgc tgctcagcca gaagcagaac aaccaaaaga      1560

tgagctttga aaagttccgc ttggaggata tcggcacaca gtcatctgcg ggctttacaa      1620

ctcttttgta tctcagaatc agaagttagg aaatcttagt gccaatctat ctatttttgc      1680

gtttcatttt atctttttgg tttactctaa tgtattactg aataatgtga gttttggcgg      1740

agtttagtac tggaactttt gtttctgtaa aaaaaaaaaa a                          1781

 

<210>35

<211>1027

<212>DNA

<213>流感病毒

 

<400>35

agcgaaagca ggtagatatt gaaagatgag tcttctaacc gaggtcgaaa cgtacgttct        60

ctctatcatc ccgtcaggcc ccctcaaagc cgagatcgca cagagacttg aagatgtctt       120

tgcagggaag aacaccgatc ttgaggttct catggaatgg ctaaagacaa gaccaatcct       180

gtcacctctg actaagggga ttttaggatt tgtgttcacg ctcaccgtgc ccagtgagcg       240

aggactgcag cgtagacgct ttgtccaaaa tgcccttaat gggaacgggg atccaaataa       300

catggacaaa gcagttaaac tgtataggaa gctcaagagg gagataacat tccatggggc       360

caaagaaatc tcactcagtt attctgctgg tgcacttgcc agttgtatgg gcctcatata       420

caacaggatg ggggctgtga ccactgaagt ggcatttggc ctggtatgtg caacctgtga       480

acagattgct gactcccagc atcggtctca taggcaaatg gtgacaacaa ccaacccact       540

aatcagacat gagaacagaa tggttttagc cagcactaca gctaaggcta tggagcaaat       600

ggctggatcg agtgagcaag cagcagaggc catggaggtt gctagtcagg ctaggcaaat       660

ggtgcaagcg atgagaacca ttgggactca tcctagctcc agtgctggtc tgaaaaatga       720

tcttcttgaa aatttgcagg cctatcagaa acgaatgggg gtgcagatgc aacggttcaa       780

gtgatcctct cgctattgcc gcaaatatca ttgggatctt gcacttgata ttgtggattc       840

ttgatcgtct ttttttcaaa tgcatttacc gtcgctttaa atacggactg aaaggagggc       900

cttctacgga aggagtgcca aagtctatga gggaagaata tcgaaaggaa cagcagagtg       960

ctgtggatgc tgacgatggt cattttgtca gcatagagct ggagtaaaaa actaccttgt      1020

ttctact                                                                1027

 

<210>36

<211>1788

<212>DNA

<213>人工序列

 

<220>

<223>克隆体

 

<400>36

cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta        60

attaattaat catcttgaga gaaaatgaaa gtaaaactac tggtcctgtt atgcacattt       120

acagctacat atgcagacac aatatgtata ggctaccatg ctaacaactc gaccgacact       180

gttgacacag tacttgaaaa gaatgtgaca gtgacacact ctgtcaacct gcttgagaac       240

agtcacaatg gaaaactatg tctattaaaa ggaatagccc cactacaatt gggtaattgc       300

agcgttgccg ggtggatctt aggaaaccca gaatgcgaat tactgatttc caaggagtca       360

tggtcctaca ttgtagaaaa accaaatcct gagaatggaa catgttaccc agggcatttc       420

gctgactatg aggaactgag ggagcaattg agttcagtat cttcatttga gaggttcgaa       480

atattcccca aagaaagctc atggcccaac cacaccgtaa ccggagtgtc agcatcatgc       540

tcccataatg gggaaagcag tttttacaga aatttgctat ggctgacggg gaagaatggt       600

ttgtacccaa acctgagcaa gtcctatgca aacaacaaag aaaaagaagt ccttgtacta       660

tggggtgttc atcacccgcc aaacataggt gaccaaaagg ccctctatca tacagaaaat       720

gcttatgtct ctgtagtgtc ttcacattat agcagaaaat tcaccccaga aatagccaaa       780

agacccaaag taagagatca agaaggaaga atcaattact actggactct gcttgaaccc       840

ggggatacaa taatatttga ggcaaatgga aatctaatag cgccaagata tgctttcgca       900

ctgagtagag gctttggatc aggaatcatc aactcaaatg caccaatgga taaatgtgat       960

gcgaagtgcc aaacacctca gggagctata aacagcagtc ttcctttcca gaacgtacac      1020

ccagtcacaa taggagagtg tccaaagtat gtcaggagtg caaaattaag gatggttaca      1080

ggactaagga acatcccatc cattcaatcc agaggtttgt ttggagccat tgccggtttc      1140

attgaagggg ggtggactgg aatggtagat ggttggtatg gttatcatca tcagaatgag      1200

caaggatctg gctatgctgc agatcaaaaa agcacacaaa atgccattaa tgggattaca      1260

aacaaggtca attctgtaat tgagaaaatg aacactcaat tcacagcagt gggcaaagag      1320

ttcaacaaat tggaaagaag gatggaaaac ttgaataaaa aagttgatga tgggtttata      1380

gacatttgga catataatgc agaactgttg gttctactgg aaaatgaaag gactttggat      1440

ttccatgact ccaatgtgaa gaatctgtat gagaaagtaa aaagccagtt aaagaataat      1500

gctaaagaaa taggaaatgg gtgttttgag ttctatcaca agtgtaacga tgaatgcatg      1560

gagagtgtaa agaatggaac ttatgactat ccaaaatatt ccgaagaatc aaagttaaac      1620

agggagaaaa ttgatggagt gaaattggaa tcaatgggag tctatcagat tctggcgatc      1680

tactcaacag tcgccagttc tctggttctt ttggtctccc tgggggcaat cagcttctgg      1740

atgtgttcca atgggtcttt acagtgtaga atatgcatct aagagctc                   1788

 

<210>37

<211>1788

<212>DNA

<213>人工序列

 

<220>

<223>克隆体

 

<400>37

cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta        60

attaattaat catcttgaga gaaaatgaaa gtaaaactac tggtcctgtt atgcacattt       120

acagctacat atgcagacac aatatgtata ggctaccatg ccaacaactc aaccgacact       180

gttgacacag tacttgagaa gaatgtgaca gtgacacact ctgtcaacct gcttgaggac       240

agtcacaatg gaaaattatg tctattaaaa ggaatagccc cactacaatt gggtaattgc       300

agcgttgccg gatggatctt aggaaaccca gaatgcgaat tactgatttc cagggaatca       360

tggtcctaca ttgtagaaaa accaaatcct gagaatggaa catgttaccc agggcatttc       420

gccgactatg aggaactgag ggagcaattg agttcagtat cttcatttga gagattcgaa       480

atattcccca aagaaagctc atggcccaac cacaccacaa ccggagtatc agcatcatgc       540

tcccataatg gggaaagcag tttttacaaa aatttgctat ggctgacggg gaagaatggt       600

ttgtacccaa acctgagcaa gtcctatgca aacaacaaag agaaagaagt ccttgtacta       660

tggggtgttc atcacccgcc taacataggt gaccaaaggg ctctctatca taaagaaaat       720

gcttatgtct ctgtagtgtc ttcacattat agcagaaaat tcaccccaga aatagccaaa       780

agacccaaag taagagatca agaaggaaga atcaactact actggactct acttgaaccc       840

ggggatacaa taatatttga ggcaaatgga aatctaatag cgccaagata tgctttcgca       900

ctgagtagag gctttggatc aggaatcatc aactcaaatg caccaatgga tgaatgtgat       960

gcgaagtgcc aaacacctca gggagctata aacagcagtc ttcctttcca gaatgtacac      1020

cctgtcacaa taggagagtg tccaaagtat gtcaggagtg caaaattaag gatggttaca      1080

ggactaagga acatcccatc cattcaatcc agaggtttgt ttggagccat tgccggtttc      1140

attgaagggg ggtggactgg aatggtagat ggttggtatg gttatcatca tcagaatgag      1200

caaggatctg gctatgctgc agatcaaaaa agcacacaaa atgccattaa tgggattaca      1260

aacaaggtca attctgtaat tgagaaaatg aacactcaat tcacagctgt gggcaaagag      1320

ttcaacaaat tggaaagaag gatggaaaac ttaaataaaa aagttgatga tgggtttata      1380

gacatttgga catataatgc agaattgttg gttctactgg aaaatgaaag gactttggat      1440

ttccatgact ccaatgtgaa gaatctgtat gagaaagtaa aaagccaatt aaagaataat      1500

gccaaagaaa taggaaatgg gtgttttgag ttctatcata agtgtaacga tgaatgcatg      1560

gagagtgtaa aaaatggaac ttatgactat ccaaaatatt ccgaagaatc aaagttaaac      1620

agggagaaaa ttgatggagt gaaattggaa tcaatgggag tctatcagat tctggcgatc      1680

tactcaacag tcgccagttc tctggttctt ttggtctccc tgggggcaat cagcttctgg      1740

atgtgttcca atgggtcttt gcagtgtaga atatgcatct gagagctc                   1788

 

<210>38

<211>1791

<212>DNA

<213>人工序列

 

<220>

<223>克隆体

 

<400>38

cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta        60

attaattaat catcttgaga gaaaatgaag actatcattg ctttgagcta cattctatgt       120

ctggttttca ctcaaaaact tcccggaaat gacaacagca cggcaacgct gtgccttggg       180

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgacca aattgaagtt       240

actaatgcta ctgagctggt tcagagttcc tcaacaggtg aaatatgcga cagtcctcat       300

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt       360

gatggcttcc aaaataagaa atgggacctt tttgttgaac gcagcaaagc ctacagcaac       420

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc       480

acactggagt ttaacaatga aagtttcaat tggactggag tcactcaaaa cggaacaagc       540

tctgcttgca taaggagatc taataacagt ttctttagta gattgaattg gttgacccac       600

ttaaaattca aatacccagc attgaacgtg actatgccaa acaatgaaaa atttgacaaa       660

ttgtacattt ggggggttca ccacccgggt acggacaatg accaaatctt cctgtatgct       720

caagcatcag gaagaatcac agtctctacc aaaagaagcc aacaaactgt aatcccgaat       780

atcggatcta gacccagagt aaggaatatc cccagcagaa taagcatcta ttggacaata       840

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt       900

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa       960

tgcaattctg aatgcatcac tccaaacgga agcattccca atgacaaacc attccaaaat      1020

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg      1080

gcaacaggga tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatcgcg      1140

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtatggttt caggcatcaa      1200

aattctgagg gaataggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa      1260

atcaatggga agctgaatag gttgatcggg aaaaccaacg agaaattcca tcagattgaa      1320

aaagagttct cagaagtcga agggagaatc caggaccttg agaaatatgt tgaggacacc      1380

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca      1440

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg      1500

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc      1560

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacagaga tgaagcatta      1620

aacaaccggt tccagatcaa gggcgttgag ctgaagtcag gatacaaaga ttggatacta      1680

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg      1740

tgggcctgcc aaaaaggcaa cattaggtgc aacatttgca tttgagagct c               1791

 

<210>39

<211>1791

<212>DNA

<213>人工序列

 

<220>

<223>克隆体

 

<400>39

cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta        60

attaattaat catcttgaga gaaaatgaag actatcattg ctttgagcta cattctatgt       120

ctggttttca ctcaaaaact tcccggaaat gacaacagca cggcaacgct gtgccttggg       180

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgacca aattgaagtt       240

actaatgcta ctgagctggt tcagagttcc tcaacaggtg gaatatgcga cagtcctcat       300

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt       360

gatggcttcc aaaataagaa atgggacctt tttgttgaac gcagcaaagc ctacagcaac       420

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc       480

acactggagt ttaacgatga aagtttcaat tggactggag tcactcaaaa tggaacaagc       540

tctgcttgca aaaggagatc taataacagt ttctttagta gattgaattg gttgacccac       600

ttaaaattca aatacccagc attgaacgtg actatgccaa acaatgaaaa atttgacaaa       660

ttgtacattt ggggggttca ccacccgggt acggacaatg accaaatctt cctgcatgct       720

caagcatcag gaagaatcac agtctctacc aaaagaagcc aacaaactgt aatcccgaat       780

atcggatcta gacccagaat aaggaatatc cccagcagaa taagcatcta ttggacaata       840

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt       900

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa       960

tgcaattctg aatgcatcac tccaaatgga agcattccca atgacaaacc atttcaaaat      1020

gtaaacagga tcacatatgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg      1080

gcaacaggga tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatcgcg      1140

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa      1200

aattctgagg gaataggaca agcagcagat ctcaaaagca ctcaagcagc aatcaatcaa      1260

atcaatggga agctgaatag gttgatcggg aaaaccaacg agaaattcca tcagattgaa      1320

aaagagttct cagaagtaga agggagaatc caggacctcg agaaatatgt tgaggacact      1380

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca      1440

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa gaacaaagaa gcaactgagg      1500

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc      1560

tgcataggat caatcagaaa tggaacttat gaccatgatg tatacagaga tgaagcatta      1620

aacaaccggt tccagatcaa aggcgttgag ctgaagtcag gatacaaaga ttggatacta      1680

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg      1740

tgggcctgcc aaaaaggcaa cattaggtgc aacatttgca tttgagagct c               1791

 

<210>40

<211>1848

<212>DNA

<213>人工序列

 

<220>

<223>克隆体

 

<400>40

cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta        60

attaattaat catcttgaga gaaaatgaag gcaataattg tactactcat ggtagtaaca       120

tccaatgcag atcgaatctg cactgggata acatcgtcaa actcaccaca tgttgtcaaa       180

actgctactc aaggggaggt caatgtgact ggtgtaatac cactgacaac aacacccacc       240

aaatctcatt ttgcaaatct caaaggaaca gaaaccagag ggaaactatg cccaaaatgc       300

ctcaactgca cagatctgga cgtggccttg ggcagaccaa aatgcacggg gaacataccc       360

tcggcaagag tttcaatact ccatgaagtc agacctgtta catctgggtg ctttcctata       420

atgcacgaca gaacaaaaat tagacagctg cctaaacttc tcagaggata cgaacatatc       480

aggttatcaa ctcataacgt tatcaatgca gaaaatgcac caggaggacc ctacaaaatt       540

ggaacctcag ggtcttgccc taacgttacc aatggaaacg gatttttcgc aacaatggct       600

tgggccgtcc caaaaaacga caacaacaaa acagcaacaa attcattaac aatagaagta       660

ccatacattt gtacagaagg agaagaccaa attaccgttt gggggttcca ctctgataac       720

gaaacccaaa tggcaaagct ctatggggac tcaaagcccc agaagttcac ctcatctgcc       780

aacggagtga ccacacatta cgtttcacag attggtggct tcccaaatca aacagaagac       840

ggaggactac cacaaagcgg tagaattgtt gttgattaca tggtgcaaaa atctgggaaa       900

acaggaacaa ttacctatca aagaggtatt ttattgcctc aaaaagtgtg gtgcgcaagt       960

ggcaggagca aggtaataaa aggatcgttg cctttaattg gagaagcaga ttgcctccac      1020

gaaaaatacg gtggattaaa caaaagcaag ccttactaca caggggaaca tgcaaaggcc      1080

ataggaaatt gcccaatatg ggtgaaaaca cccttgaagc tggccaatgg aaccaaatat      1140

agacctcctg caaaactatt aaaggaaagg ggtttcttcg gagctattgc tggtttctta      1200

gaaggaggat gggaaggaat gattgcaggt tggcacggat acacatccca tggggcacat      1260

ggagtagcgg tggcagcaga ccttaagagc actcaagagg ccataaacaa gataacaaaa      1320

aatctcaact ctttgagtga gctggaagta aagaatcttc aaagactaag cggtgccatg      1380

gatgaactcc acaacgaaat actagaacta gacgagaaag tggatgatct cagagctgat      1440

acaataagct cacaaataga actcgcagtc ctgctttcca atgaaggaat aataaacagt      1500

gaagatgagc atctcttggc gcttgaaaga aagctgaaga aaatgctggg cccctctgct      1560

gtagagatag ggaatggatg ctttgaaacc aaacacaagt gcaaccagac ctgtctcgac      1620

agaatagctg ctggtacctt tgatgcagga gaattttctc tccccacttt tgattcactg      1680

aatattactg ctgcatcttt aaatgacgat ggattggata atcatactat actgctttac      1740

tactcaactg ctgcctccag tttggctgta acattgatga tagctatctt tgttgtttat      1800

atggtctcca gagacaatgt ttcttgctcc atctgtctat aagagctc                   1848

<210>41

<211>1845

<212>DNA

<213>人工序列

 

<220>

<223>克隆体

 

<400>41

cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta        60

attaattaat catcttgaga gaaaatgaag gcaataattg tactactcat ggtagtaaca       120

tccaatgcag atcgaatctg cactggaata acatcttcaa actcacctca tgtggtcaaa       180

acagccactc aaggggaggt caatgtgact ggtgtgatac cactaacaac aacaccaaca       240

aaatcttatt ttgcaaatct caaaggaaca aggaccagag ggaaactatg cccagactgt       300

ctcaactgca cagatctgga tgtggctttg ggcagaccaa tgtgtgtggg gaccacacct       360

tcggcgaagg cttcaatact ccacgaagtc aaacctgtta catccgggtg ctttcctata       420

atgcacgaca gaacaaaaat caggcaacta cccaatcttc tcagaggata tgaaaatatc       480

aggctatcaa cccaaaacgt catcgatgcg gaaaaggcac caggaggacc ctacagactt       540

ggaacctcag gatcttgccc taacgctacc agtaagagcg gatttttcgc aacaatggct       600

tgggctgtcc caaaggacaa caacaaaaat gcaacgaacc cactaacagt agaagtacca       660

tacatttgta cagaagggga agaccaaatc actgtttggg ggttccattc agataacaaa       720

acccaaatga agaacctcta tggagactca aatcctcaaa agttcacctc atctgctaat       780

ggagtaacca cacactatgt ttctcagatt ggcagcttcc cagatcaaac agaagacgga       840

ggactaccac aaagcggcag gattgttgtt gattacatga tgcaaaaacc tgggaaaaca       900

ggaacaattg tctaccaaag aggtgttttg ttgcctcaaa aggtgtggtg cgcgagtggc       960

aggagcaaag taataaaagg gtccttgcct ttaattggtg aagcagattg ccttcatgaa      1020

aaatacggtg gattaaacaa aagcaagcct tactacacag gagaacatgc aaaagccata      1080

ggaaattgcc caatatgggt gaaaacacct ttgaagctcg ccaatggaac caaatataga      1140

cctcctgcaa aactattaaa ggaaaggggt ttcttcggag ctattgctgg tttcctagaa      1200

ggaggatggg aaggaatgat tgcaggctgg cacggataca catctcacgg agcacatgga      1260

gtggcagtgg cggcggacct taagagtacg caagaagcta taaacaagat aacaaaaaat      1320

ctcaattctt tgagtgagct agaagtaaag aatcttcaaa gactaagtgg tgccatggat      1380

gaactccaca acgaaatact cgagctggat gagaaagtgg atgatctcag agctgacact      1440

ataagctcgc aaatagaact tgcagtcttg ctttccaacg aaggaataat aaacagtgaa      1500

gatgagcatc tattggcact tgagagaaaa ctaaagaaaa tgctgggtcc ctctgctgta      1560

gagataggaa atggatgctt cgaaaccaaa cacaagtgca accagacctg cttagacagg      1620

atagctgctg gcacctttaa tgcaggagaa ttttctctcc ccacttttga ttcactgaac      1680

attactgctg catctttaaa tgatgatgga ttggataacc atactatact gctctattac      1740

tcaactgctg cttctagttt ggctgtaaca ttgatgctag ctatttttat tgtttatatg      1800

gtctccagag acaacgtttc atgctccatc tgtctataag agctc                      1845

 

<210>42

<211>1779

<212>DNA

<213>人工序列

 

<220>

<223>克隆体

 

<400>42

cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta        60

attaattaat catcttgaga gaaaatggcc atcatttatc taattctcct gttcacagca       120

gtgagagggg accaaatatg cattggatac catgccaata attccacaga gaaggtcgac       180

acaattctag agcggaacgt cactgtgact catgccaagg acattcttga gaagacccat       240

aacggaaagt tatgcaaact aaacggaatc cctccacttg aactagggga ctgtagcatt       300

gccggatggc tccttggaaa tccagaatgt gataggcttc taagtgtgcc agaatggtcc       360

tatataatgg agaaagaaaa cccgagagac ggtttgtgtt atccaggcag cttcaatgat       420

tatgaagaat tgaaacatct cctcagcagc gtgaaacatt tcgagaaagt aaagattctg       480

cccaaagata gatggacaca gcatacaaca actggaggtt cacgggcctg cgcggtgtct       540

ggtaatccat cattcttcag gaacatggtc tggctgacaa agaaagaatc aaattatccg       600

gttgccaaag gatcgtacaa caatacaagc ggagaacaaa tgctaataat ttggggggtg       660

caccatccca atgatgagac agaacaaaga acattgtacc agaatgtggg aacctatgtt       720

tccgtaggca catcaacatt gaacaaaagg tcaaccccag acatagcaac aaggcctaaa       780

gtgaatggac taggaagtag aatggagttc tcttggaccc tattggatat gtgggacacc       840

ataaattttg agagtactgg taatctaatt gcaccagagt atggattcaa aatatcgaaa       900

agaggtagtt cagggatcat gaaaacagaa ggaacacttg agaactgtga gaccaaatgc       960

caaactcctt tgggagcaat aaatacaaca ttgccttttc acaatgtcca cccactgaca      1020

ataggtgagt gccccaaata tgtaaaatcg gagaagttgg tcttagcaac aggactaagg      1080

aatgttcccc agattgaatc aagaggattg tttggggcaa tagctggttt tatagaagga      1140

ggatggcaag gaatggttga tggttggtat ggataccatc acagcaatga ccagggatca      1200

gggtatgcag cagacaaaga atccactcaa aaggcatttg atggaatcac caacaaggta      1260

aattctgtga ttgaaaagat gaacacccaa tttgaagctg ttgggaaaga gttcagtaac      1320

ttagagagaa gactggagaa cttgaacaaa aagatggaag acgggtttct agatgtgtgg      1380

acatacaatg ctgagcttct agttctgatg gaaaatgaga ggacacttga ctttcatgat      1440

tctaatgtca agaatctgta tgataaagtc agaatgcagc tgagagacaa cgtcaaagaa      1500

ctaggaaatg gatgttttga attttatcac aaatgtgatg atgaatgcat gaatagtgtg      1560

aaaaacggga cgtatgatta tcccaagtat gaagaagagt ctaaactaaa tagaaatgaa      1620

atcaaagggg taaaattgag cagcatgggg gtttatcaaa tccttgccat ttatgctaca      1680

gtagcaggtt ctctgtcact ggcaatcatg atggctggga tctctttctg gatgtgctcc      1740

aacgggtctc tgcagtgcag gatctgcata tgagagctc                             1779

 

<210>43

<211>1794

<212>DNA

<213>人工序列

 

<220>

<223>克隆体

 

<400>43

cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta        60

attaattaat catcttgaga gaaaatggag aaaatagtgc ttcttcttgc aatagtcagc       120

cttgttaaaa gtgatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt       180

gacacaataa tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca       240

cacaacggga agctctgcga tctagatgga gtgaagcctc tgattttaag agattgtagt       300

gtagctggat ggctcctcgg aaacccaatg tgtgacgagt tcatcaatgt gccggaatgg       360

tcttacatag tggagaaggc caacccagcc aatgacctct gttacccagg gaatttcaac       420

gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcagatc       480

atccccaaaa gttcttggtc cgatcatgaa gcctcatcag gggtcagctc agcatgtcca       540

taccagggaa cgccctcctt tttcagaaat gtggtatggc ttatcaaaaa gaacaataca       600

tacccaacaa taaagagaag ctacaataat accaaccagg aagatctttt gatactgtgg       660

gggattcatc attctaatga tgcggcagag cagacaaagc tctatcaaaa cccaaccacc       720

tatatttccg ttgggacatc aacactaaac cagagattgg taccaaaaat agctactaga       780

tccaaagtaa acgggcaaag tggaaggatg gatttcttct ggacaatttt aaaaccgaat       840

gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt       900

gtcaagaaag gggactcagc aattgttaaa agtgaagtgg aatatggtaa ctgcaataca       960

aagtgtcaaa ctccaatagg ggcgataaac tctagtatgc cattccacaa catacaccct      1020

ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca aattagtcct tgcgactggg      1080

ctcagaaata gtcctctaag agaaagaaga agaaaaagag gactatttgg agctatagca      1140

gggtttatag agggaggatg gcagggaatg gtagatggtt ggtatgggta ccaccatagc      1200

aatgagcagg ggagtgggta cgctgcagac aaagaatcca ctcaaaaggc aatagatgga      1260

gtcaccaata aggtcaactc gatcattgac aaaatgaaca ctcagtttga ggccgttgga      1320

agggaattta ataacttaga aaggagaata gagaatttaa acaagaaaat ggaagacgga      1380

ttcctagatg tctggactta taatgctgaa cttctggttc tcatggaaaa tgagagaact      1440

ctagacttcc atgattcaaa tgtcaagaac ctttacgaca aggtccgact acagcttagg      1500

gataatgcaa aggagctggg taacggttgt ttcgagttct atcacaaatg tgataatgaa      1560

tgtatggaaa gtgtaagaaa cggaacgtat gactacccgc agtattcaga agaagcaaga      1620

ttaaaaagag aggaaataag tggagtaaaa ttggaatcaa taggaactta ccaaatactg      1680

tcaatttatt caacagttgc gagttctcta gcactggcaa tcatggtggc tggtctatct      1740

ttgtggatgt gctccaatgg gtcgttacaa tgcagaattt gcatttaaga gctc            1794

 

<210>44

<211>1797

<212>DNA

<213>人工序列

 

<220>

<223>克隆体

 

<400>44

cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta        60

attaattaat catcttgaga gaaaatggag aaaatagtgc ttctttttgc aatagtcagt       120

cttgttaaaa gtgatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt       180

gacacaataa tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca       240

cacaatggga agctctgcga tctagatgga gtgaagcctc taattttgag agattgtagt       300

gtagctggat ggctcctcgg aaacccaatg tgtgacgagt tcatcaatgt gccggaatgg       360

tcttacatag tggagaaggc caatccagtc aatgacctct gttacccagg ggatttcaat       420

gactatgaag aattgaaaca cctattgagc agaataaacc attttgagaa aattcagatc       480

atccccaaaa gttcttggtc cagtcatgaa gcctcattgg gggtcagctc agcatgtcca       540

taccagggaa agtcctcctt tttcagaaat gtggtatggc ttatcaaaaa gaacagtaca       600

tacccaacaa taaagaggag ctacaataat accaaccaag aagatctttt ggtactgtgg       660

gggattcacc atcctaatga tgcggcagag cagacaaagc tctatcaaaa cccaaccacc       720

tatatttccg ttgggacatc tacactaaac cagagattgg taccaagaat agctactaga       780

tccaaagtaa acgggcaaag tggaaggatg gagttcttct ggacaatttt aaaaccgaat       840

gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt       900

gtcaagaaag gggactcaac aattatgaaa agtgaattgg aatatggtaa ctgcaatacc       960

aagtgtcaaa ctccaatggg ggcgataaac tctagcatgc cattccacaa tatacaccct      1020

ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca gattagtcct tgcgactggg      1080

ctcagaaata gccctcaaag agagagaaga agaaaaaaga gaggattatt tggagctata      1140

gcaggtttta tagagggagg atggcaggga atggtagatg gttggtatgg gtaccaccat      1200

agcaacgagc aggggagtgg gtacgctgca gacaaagaat ccactcaaaa ggcaatagat      1260

ggagtcacca ataaggtcaa ctcgattatt gacaaaatga acactcagtt tgaggccgtt      1320

ggaagggaat ttaacaactt agaaaggaga atagagaatt taaacaagaa gatggaagac      1380

gggttcctag atgtctggac ttataatgct gaacttctag ttctcatgga aaacgagaga      1440

actctagact ttcatgactc aaatgtcaag aacctttacg acaaggtccg actacagctt      1500

agggataatg caaaggagct gggtaacggt tgtttcgagt tctatcataa atgtgataat      1560

gaatgtatgg aaagtgtaag aaacggaacg tatgactacc cgcagtattc agaagaagca      1620

agactaaaaa gagaggaaat aagtggagta aaattggaat caataggaat ttaccaaata      1680

ttgtcaattt attctacagt ggccagctcc ctagcactgg caatcatggt agctggtcta      1740

tccttatgga tgtgctccaa tgggtcgtta caatgcagaa tttgcattta agagctc         1797

 

<210>45

<211>1791

<212>DNA

<213>人工序列

 

<220>

<223>克隆体

 

<400>45

cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta        60

attaattaat catcttgaga gaaaatgatt gcaatcattg taatagcaat actggcagca       120

gccggaaagt cagacaagat ctgcattggg tatcatgcca acaattcaac aacacaggta       180

gatacgatac ttgagaagaa tgtgactgtc acacactcaa ttgaattgct ggaaaatcag       240

aaggaagaaa gattctgcaa gatattgaac aaggcccctc tcgacttaag ggaatgtacc       300

atagagggtt ggatcttggg gaatccccaa tgcgacctat tgcttggtga tcaaagctgg       360

tcatacattg tggaaagacc tactgctcaa aacgggatct gctacccagg aaccttaaat       420

gaggtagaag aactgagggc acttattgga tcaggagaaa gggtagagag atttgagatg       480

tttccccaaa gcacctggca aggagttgac accaacagtg gaacaacaag atcctgccct       540

tattctactg gtgcgtcttt ctacagaaac ctcctatgga taataaaaac caagacagca       600

gaatatccag taattaaggg aatttacaac aacactggaa cccagccaat cctctatttc       660

tggggtgtgc atcatcctcc taacaccgac gagcaagata ctctgtatgg ctctggtgat       720

cgatacgtta gaatgggaac tgaaagcatg aattttgcca agagtccgga aattgcggca       780

aggcctgctg tgaatggaca aagaggcaga attgattatt attggtcggt tttaaaacca       840

ggggaaacct tgaatgtgga atctaatgga aatctaatcg ccccttggta tgcatacaaa       900

tttgtcaaca caaatagtaa aggagccgtc ttcaggtcag atttaccaat cgagaactgc       960

gatgccacat gccagactat tgcaggggtt ctaaggacca ataaaacatt tcagaatgtg      1020

agtcccctgt ggataggaga atgtcccaaa tacgtgaaaa gtgaaagtct gaggcttgca      1080

actggactaa gaaatgttcc acagattgaa actagaggac tcttcggagc tattgcaggg      1140

tttattgaag gaggatggac tgggatgata gatgggtggt atggctatca ccatgaaaat      1200

tctcaagggt caggatatgc agcagacaga gaaagcactc aaaaggctgt aaacagaatt      1260

acaaataagg tcaattccat catcaacaaa atgaacacac aatttgaagc tgtcgatcac      1320

gaattttcaa atctggagag gagaattgac aatctgaaca aaagaatgca agatggattt      1380

ctggatgttt ggacatacaa tgctgaactg ttggttcttc ttgaaaacga aagaacacta      1440

gacatgcatg acgcaaatgt gaagaaccta catgaaaagg tcaaatcaca actaagggac      1500

aatgctacga tcttagggaa tggttgcttt gaattttggc ataagtgtga caatgaatgc      1560

atagagtctg tcaaaaatgg tacatatgac tatcccaaat accagactga aagcaaatta      1620

aacaggctaa aaatagaatc agtaaagcta gagaaccttg gtgtgtatca aattcttgcc      1680

atttatagta cggtatcgag cagcctagtg ttggtagggc tgatcatggc aatgggtctt      1740

tggatgtgtt caaatggttc aatgcagtgc aggatatgta tataagagct c               1791

 

<210>46

<211>1803

<212>DNA

<213>人工序列

 

<220>

<223>克隆体

 

<400>46

cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta        60

attaattaat catcttgaga gaaaatgaac actcaaattc taatattagc cacttcggca       120

ttcttctatg tacgtgcaga taaaatctgc ctaggacatc atgctgtgtc taatggaacc       180

aaagtagaca cccttactga aaaaggaata gaagttgtca atgcaacaga aacagttgaa       240

caaacaaaca tccctaagat ctgctcaaaa ggaaaacaga ctgttgacct tggtcaatgt       300

ggattactag ggaccgttat tggtcctccc caatgtgacc aatttcttga gttctctgct       360

aatttaatag ttgaaagaag ggaaggtaat gacatttgtt atccaggcaa atttgacaat       420

gaagaaacat tgagaaaaat actcagaaaa tccggaggaa ttaaaaagga gaatatggga       480

ttcacatata ccggagtgag aaccaatgga gagactagcg catgtagaag gtcaagatct       540

tccttttatg cagagatgaa atggcttcta tccagcacag acaatgggac atttccacaa       600

atgacaaagt cctacaagaa cactaagaag gtaccagctc tgataatctg gggaatccac       660

cactcaggat caactactga acagactaga ttatatggaa gtgggaataa attgataaca       720

gtttggagtt ccaaatacca acaatctttt gtcccaaatc ctggaccaag accgcaaatg       780

aatggtcaat caggaagaat tgactttcac tggctgatgc tagatcccaa tgatactgtc       840

actttcagtt ttaatggggc ctttatagca cctgaccgcg ccagttttct aagaggtaaa       900

tctctaggaa tccaaagtga tgcacaactt gacaataatt gtgaaggtga atgctatcat       960

attggaggta ctataattag caacttgccc tttcaaaaca ttaatagtag ggcaatcgga      1020

aaatgcccca gatacgtgaa gcagaagagc ttaatgctag caacaggaat gaaaaatgtt      1080

cctgaagctc ctgcacataa acaactaact catcacatgc gcaaaaaaag aggtttattt      1140

ggtgcaatag caggattcat tgaaaatggg tgggaaggat taatagacgg atggtatgga      1200

tataagcatc agaatgcaca aggagaaggg actgctgcag actacaaaag tacacaatct      1260

gctatcaacc aaataaccgg aaaattgaac agactaatag aaaaaaccaa ccagcaattc      1320

gaactaatag ataatgagtt caatgaaata gaaaaacaaa ttggcaatgt tattaactgg      1380

actagagatt ctatcatcga agtatggtca tataatgcag agttcctcgt agcagtggag      1440

aatcaacaca ctattgattt aactgactca gaaatgaaca aactatatga aaaggtaaga      1500

agacaactga gagaaaatgc tgaggaagat ggtaatggct gttttgaaat attccaccaa      1560

tgtgacaatg attgcatggc cagcattaga aacaacacat atgaccataa aaaatacaga      1620

aaagaggcaa tacaaaacag aatccagatt gacgcagtaa agttgagcag tggttacaaa      1680

gatataatac tttggtttag cttcggggca tcatgtttct tatttcttgc cattgcaatg      1740

ggtcttgttt tcatatgtat aaaaaatgga aacatgcggt gcactatttg tatataagag      1800

ctc                                                                    1803

 

<210>47

<211>1773

<212>DNA

<213>人工序列

 

<220>

<223>克隆体

 

<400>47

cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta        60

attaattaat catcttgaga gaaaatggaa acaatatcac taataactat actactagta       120

gtaacagcaa gcaatgcaga taaaatctgc atcggccacc agtcaacaaa ctccacagaa       180

actgtggaca cgctaacaga aaccaatgtt cctgtgacac atgccaaaga attgctccac       240

acagagcata atggaatgct gtgtgcaaca agcctgggac atcccctcat tctagacaca       300

tgcactattg aaggactagt ctatggcaac ccttcttgtg acctgctgtt gggaggaaga       360

gaatggtcct acatcgtcga aagatcatca gctgtaaatg gaacgtgtta ccctgggaat       420

gtagaaaacc tagaggaact caggacactt tttagttccg ctagttccta ccaaagaatc       480

caaatcttcc cagacacaac ctggaatgtg acttacactg gaacaagcag agcatgttca       540

ggttcattct acaggagtat gagatggctg actcaaaaga gcggttttta ccctgttcaa       600

gacgcccaat acacaaataa caggggaaag agcattcttt tcgtgtgggg catacatcac       660

ccacccacct ataccgagca aacaaatttg tacataagaa acgacacaac aacaagcgtg       720

acaacagaag atttgaatag gaccttcaaa ccagtgatag ggccaaggcc ccttgtcaat       780

ggtctgcagg gaagaattga ttattattgg tcggtactaa aaccaggcca aacattgcga       840

gtacgatcca atgggaatct aattgctcca tggtatggac acgttctttc aggagggagc       900

catggaagaa tcctgaagac tgatttaaaa ggtggtaatt gtgtagtgca atgtcagact       960

gaaaaaggtg gcttaaacag tacattgcca ttccacaata tcagtaaata tgcatttgga      1020

acctgcccca aatatgtaag agttaatagt ctcaaactgg cagtcggtct gaggaacgtg      1080

cctgctagat caagtagagg actatttgga gccatagctg gattcataga aggaggttgg      1140

ccaggactag tcgctggctg gtatggtttc cagcattcaa atgatcaagg ggttggtatg      1200

gctgcagata gggattcaac tcaaaaggca attgataaaa taacatccaa ggtgaataat      1260

atagtcgaca agatgaacaa gcaatatgaa ataattgatc atgaatttag tgaggttgaa      1320

actagactca atatgatcaa taataagatt gatgaccaaa tacaagacgt atgggcatat      1380

aatgcagaat tgctagtact acttgaaaat caaaaaacac tcgatgagca tgatgcgaac      1440

gtgaacaatc tatataacaa ggtgaagagg gcactgggct ccaatgctat ggaagatggg      1500

aaaggctgtt tcgagctata ccataaatgt gatgatcagt gcatggaaac aattcggaac      1560

gggacctata ataggagaaa gtatagagag gaatcaagac tagaaaggca gaaaatagag      1620

ggggttaagc tggaatctga gggaacttac aaaatcctca ccatttattc gactgtcgcc      1680

tcatctcttg tgcttgcaat ggggtttgct gccttcctgt tctgggccat gtccaatgga      1740

tcttgcagat gcaacatttg tatataagag ctc                                   1773

 

<210>48

<211>565

<212>PRT

<213>人工序列

 

<220>

<223>克隆体

 

<400>48

Met Lys Val Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr

1               5                   10                  15

Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr

            20                  25                  30

Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn

        35                  40                  45

Leu Leu Glu Asn Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile

    50                  55                  60

Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly

65                  70                  75                  80

Asn Pro Glu Cys Glu Leu Leu Ile Ser Lys Glu Ser Trp Ser Tyr Ile

                85                  90                  95

Val Glu Lys Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly His Phe

            100                 105                 110

Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe

        115                 120                 125

Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr

    130                 135                 140

Val Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Glu Ser Ser Phe

145                 150                 155                 160

Tyr Arg Asn Leu Leu Trp LeuT hr Gly Lys Asn Gly Leu Tyr Pro Asn

                165                 170                 175

Leu Ser Lys Ser Tyr Ala Asn Asn Lys Glu Lys Glu Val Leu Val Leu

            180                 185                 190

Trp Gly Val His His Pro Pro Asn Ile Gly Asp Gln Lys Ala Leu Tyr

        195                 200                 205

His Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg

    210                 215                 220

Lys Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu

225                 230                 235                 240

Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile

                245                 250                 255

Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Arg Tyr Ala Phe Ala

            260                 265                 270

Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Asn Ser Asn Ala Pro Met

        275                 280                 285

Asp Lys Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser

    290                 295                 300

Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro

305                 310                 315                 320

Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn

                325                 330                 335

Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe

            340                 345                 350

Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His

        355                 360                 365

His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr

    370                 375                 380

Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu

385                 390                 395                 400

Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu

                405                 410                 415

Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Ile

            420                 425                 430

Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu

        435                 440                 445

Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys

    450                 455                 460

Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys

465                 470                 475                 480

Phe Glu Phe Tyr His Lys Cys Asn Asp Glu Cys Met Glu Ser Val Lys

                485                 490                 495

Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn

            500                 505                 510

Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln

        515                 520                 525

Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val

    530                 535                 540

Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln

545                 550                 555                 560

Cys Arg Ile Cys Ile

                565

 

<210>49

<211>565

<212>PRT

<213>人工序列

 

<220>

<223>克隆体

 

<400>49

Met Lys Val Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr

1               5                   10                  15

Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr

            20                  25                  30

Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn

        35                  40                  45

Leu Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile

    50                  55                  60

Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly

65                  70                  75                  80

Asn Pro Glu Cys Glu Leu Leu Ile Ser Arg Glu Ser Trp Ser Tyr Ile

                85                  90                  95

Val Glu Lys Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly His Phe

            100                 105                 110

Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe

        115                 120                 125

Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr

    130                 135                 140

Thr Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Glu Ser Ser Phe

145                 150                 155                 160

Tyr Lys Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn

                165                 170                 175

Leu Ser Lys Ser Tyr Ala Asn Asn Lys Glu Lys Glu Val Leu Val Leu

            180                 185                 190

Trp Gly Val His His Pro Pro Asn Ile Gly Asp Gln Arg Ala Leu Tyr

        195                 200                 205

His Lys Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg

    210                 215                 220

Lys Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu

225                 230                 235                 240

Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile

                245                 250                 255

Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Arg Tyr Ala Phe Ala

            260                 265                 270

Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Asn Ser Asn Ala Pro Met

        275                 280                 285

Asp Glu Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser

    290                 295                 300

Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro

305                 310                 315                 320

Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn

                325                 330                 335

Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe

            340                 345                 350

Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His

        355                 360                 365

His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr

    370                 375                 380

Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu

385                 390                 395                 400

Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu

                405                 410                 415

Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Ile

            420                 425                 430

Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu

        435                 440                 445

Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys

    450                 455                 460

Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys

465                 470                 475                 480

Phe Glu Phe Tyr His Lys Cys Asn Asp Glu Cys Met Glu Ser Val Lys

                485                 490                 495

Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn

            500                 505                 510

Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln

        515                 520                 525

Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val

    530                 535                 540

Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln

545                 550                 555                 560

Cys Arg Ile Cys Ile

                565

 

<210>50

<211>566

<212>PRT

<213>人工序列

 

<220>

<223>克隆体

 

<400>50

Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Leu Cys Leu Val Phe Thr

1               5                   10                  15

Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

            20                  25                  30

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

        35                  40                  45

Gln Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ser Ser Thr

    50                  55                  60

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys

65                  70                  75                  80

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

                85                  90                  95

Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn

            100                 105                 110

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

        115                 120                 125

Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp Thr

    130                 135                 140

Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser Asn

145                 150                 155                 160

Asn Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Lys Phe Lys

                165                 170                 175

Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Lys Phe Asp Lys

            180                 185                 190

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Asn Asp Gln Ile

        195                 200                 205

Phe Leu Tyr Ala Gln Ala Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

    210                 215                 220

Ser Gln Gln Thr Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Val Arg

225                 230                 235                 240

Asn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

                245                 250                 255

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

            260                 265                 270

Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

        275                 280                 285

Pro Ile Gly Lys Cys Asn Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

    290                 295                 300

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

305                 310                 315                 320

Cys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly Met

                325                 330                 335

Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

            340                 345                 350

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly

        355                 360                 365

Phe Arg His Gln Asn Ser Glu Gly Ile Gly Gln Ala Ala Asp Leu Lys

    370                 375                 380

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

385                 390                 395                 400

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

                405                 410                 415

Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

            420                 425                 430

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

        435                 440                 445

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

    450                 455                 460

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

465                 470                 475                 480

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

                485                 490                 495

Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu

            500                 505                 510

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

        515                 520                 525

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

    530                 535                 540

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

545                 550                 555                 560

Arg Cys Asn Ile Cys Ile

                565

 

<210>51

<211>566

<212>PRT

<213>人工序列

 

<220>

<223>克隆体

 

<400>51

Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Leu Cys Leu Val Phe Thr

1               5                   10                  15

Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

            20                  25                  30

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

        35                  40                  45

Gln Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ser Ser Thr

    50                  55                  60

Gly Gly Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys

65                  70                  75                  80

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

                85                  90                  95

Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn

            100                 105                 110

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

        115                 120                 125

Ala Ser Ser Gly Thr Leu Glu Phe Asn Asp Glu Ser Phe Asn Trp Thr

    130                 135                 140

Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Lys Arg Arg Ser Asn

145                 150                 155                 160

Asn Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Lys Phe Lys

                165                 170                 175

Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Lys Phe Asp Lys

            180                 185                 190

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Asn Asp Gln Ile

        195                 200                 205

Phe Leu His Ala Gln Ala Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

    210                 215                 220

Ser Gln Gln Thr Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

225                 230                 235                 240

Asn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

                245                 250                 255

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

            260                 265                 270

Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

        275                 280                 285

Pro Ile Gly Lys Cys Asn Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

    290                 295                 300

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

305                 310                 315                 320

Cys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly Met

                325                 330                 335

Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

            340                 345                 350

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly

        355                 360                 365

Phe Arg His Gln Asn Ser Glu Gly Ile Gly Gln Ala Ala Asp Leu Lys

    370                 375                 380

Ser Thr Gln Ala Ala Ile Asn Gln Ile Asn Gly Lys Leu Asn Arg Leu

385                 390                 395                 400

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

                405                 410                 415

Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

            420                 425                 430

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

        435                 440                 445

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

    450                 455                 460

Glu Arg Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

465                 470                 475                 480

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

                485                 490                 495

Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu

            500                 505                 510

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

        515                 520                 525

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

    530                 535                 540

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

545                 550                 555                 560

Arg Cys Asn Ile Cys Ile

                565

 

<210>52

<211>585

<212>PRT

<213>人工序列

 

<220>

<223>克隆体

 

<400>52

Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp

1               5                   10                  15

Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys

            20                  25                  30

Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr

        35                  40                  45

Thr Thr Pro Thr Lys Ser His Phe Ala Asn Leu Lys Gly Thr Glu Thr

    50                  55                  60

Arg Gly Lys Leu Cys Pro Lys Cys Leu Asn Cys Thr Asp Leu Asp Val

65                  70                  75                  80

Ala Leu Gly Arg Pro Lys Cys Thr Gly Asn Ile Pro Ser Ala Arg Val

                85                  90                  95

Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro Ile

            100                 105                 110

Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Lys Leu Leu Arg Gly

        115                 120                 125

Tyr Glu His Ile Arg Leu Ser Thr His Asn Val Ile Asn Ala Glu Asn

    130                 135                 140

Ala Pro Gly Gly Pro Tyr Lys Ile Gly Thr Ser Gly Ser Cys Pro Asn

145                 150                 155                 160

Val Thr Asn Gly Asn Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro

                165                 170                 175

Lys Asn Asp Asn Asn Lys Thr Ala Thr Asn Ser Leu Thr Ile Glu Val

            180                 185                 190

Pro Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe

        195                 200                 205

His Ser Asp Asn Glu Thr Gln Met Ala Lys Leu Tyr Gly Asp Ser Lys

    210                 215                 220

Pro Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val

225                 230                 235                 240

Ser Gln Ile Gly Gly Phe Pro Asn Gln Thr Glu Asp Gly Gly Leu Pro

                245                 250                 255

Gln Ser Gly Arg Ile Val Val Asp Tyr Met Val Gln Lys Ser Gly Lys

            260                 265                 270

Thr Gly Thr Ile Thr Tyr Gln Arg Gly Ile Leu Leu Pro Gln Lys Val

        275                 280                 285

Trp Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu

    290                 295                 300

Ile Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys

305                 310                 315                 320

Ser Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys

                325                 330                 335

Pro Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr

            340                 345                 350

Arg Pro Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala Ile

        355                 360                 365

Ala Gly Phe Leu Glu Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His

    370                 375                 380

Gly Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu

385                 390                 395                 400

Lys Ser Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser

                405                 410                 415

Leu Ser Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met

            420                 425                 430

Asp Glu Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp

        435                 440                 445

Leu Arg Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu

    450                 455                 460

Ser Asn Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu

465                 470                 475                 480

Glu Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu Ile Gly

                485                 490                 495

Asn Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp

            500                 505                 510

Arg Ile Ala Ala Gly Thr Phe Asp Ala Gly Glu Phe Ser Leu Pro Thr

        515                 520                 525

Phe Asp Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu

    530                 535                 540

Asp Asn His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu

545                 550                 555                 560

Ala Val Thr Leu Met Ile Ala Ile Phe Val Val Tyr Met Val Ser Arg

                565                 570                 575

Asp Asn Val Ser Cys Ser Ile Cys Leu

            580                 585

 

<210>53

<211>584

<212>PRT

<213>人工序列

 

<220>

<223>克隆体

 

<400>53

Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp

1               5                   10                  15

Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys

             20                  25                  30

Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr

        35                  40                  45

Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg Thr

    50                  55                  60

Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp Val

65                  70                  75                  80

Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys Ala

                85                  90                  95

Ser Ile Leu His Glu Val Lys Pro Val Thr Ser Gly Cys Phe Pro Ile

            100                 105                 110

Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg Gly

        115                 120                 125

Tyr Glu Asn Ile Arg Leu Ser Thr Gln Asn Val Ile Asp Ala Glu Lys

    130                 135                 140

Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro Asn

145                 150                 155                 160

Ala Thr Ser Lys Ser Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro

                165                 170                 175

Lys Asp Asn Asn Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val Pro

            180                 185                 190

Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe His

        195                 200                 205

Ser Asp Asn Lys Thr Gln Met Lys Asn Leu Tyr Gly Asp Ser Asn Pro

    210                 215                 220

Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val Ser

225                 230                 235                 240

Gln Ile Gly Ser Phe Pro Asp Gln Thr Glu Asp Gly Gly Leu Pro Gln

                245                 250                 255

Ser Gly Arg Ile Val Val Asp Tyr Met Met Gln Lys Pro Gly Lys Thr

            260                 265                 270

Gly Thr Ile Val Tyr Gln Arg Gly Val Leu Leu Pro Gln Lys Val Trp

        275                 280                 285

Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu Ile

    290                 295                 300

Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys Ser

305                 310                 315                 320

Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys Pro

                325                 330                 335

Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg

            340                 345                 350

Pro Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala Ile Ala

        355                 360                 365

Gly Phe Leu Glu Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His Gly

    370                 375                 380

Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu Lys

385                 390                 395                 400

Ser Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser Leu

                405                 410                 415

Ser Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met Asp

            420                 425                 430

Glu Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp Leu

        435                 440                 445

Arg Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu Ser

    450                 455                 460

Asn Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu Glu

465                 470                 475                 480

Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu Ile Gly Asn

                485                 490                 495

Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp Arg

            500                 505                 510

Ile Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr Phe

        515                 520                 525

Asp Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu Asp

    530                 535                 540

Asn His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu Ala

545                 550                 555                 560

Val Thr Leu Met Leu Ala Ile Phe Ile Val Tyr Met Val Ser Arg Asp

                565                 570                 575

Asn Val Ser Cys Ser Ile Cys Leu

            580

 

<210>54

<211>562

<212>PRT

<213>人工序列

 

<220>

<223>克隆体

 

<400>54

Met Ala Ile Ile Tyr Leu Ile Leu Leu Phe Thr Ala Val Arg Gly Asp

1               5                   10                  15

Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Lys Val Asp

            20                  25                  30

Thr Ile Leu Glu Arg Asn Val Thr Val Thr His Ala Lys Asp Ile Leu

        35                  40                  45

Glu Lys Thr His Asn Gly Lys Leu Cys Lys Leu Asn Gly Ile Pro Pro

    50                  55                  60

Leu Glu Leu Gly Asp Cys Ser Ile Ala Gly Trp Leu Leu Gly Asn Pro

65                  70                  75                  80

Glu Cys Asp Arg Leu Leu Ser Val Pro Glu Trp Ser Tyr Ile Met Glu

                85                  90                  95

Lys Glu Asn Pro Arg Asp Gly Leu Cys Tyr Pro Gly Ser Phe Asn Asp

            100                 105                 110

Tyr Glu Glu Leu Lys His Leu Leu Ser Ser Val Lys His Phe Glu Lys

        115                 120                 125

Val Lys Ile Leu Pro Lys Asp Arg Trp Thr Gln His Thr Thr Thr Gly

    130                 135                 140

Gly Ser Arg Ala Cys Ala Val Ser Gly Asn Pro Ser Phe Phe Arg Asn

145                 150                 155                 160

Met Val Trp Leu Thr Lys Lys Glu Ser Asn Tyr Pro Val Ala Lys Gly

                165                 170                 175

Ser Tyr Asn Asn Thr Ser Gly Glu Gln Met Leu Ile Ile Trp Gly Val

            180                 185                 190

His His Pro Asn Asp Glu Thr Glu Gln Arg Thr Leu Tyr Gln Asn Val

        195                 200                 205

Gly Thr Tyr Val Ser Val Gly Thr Ser Thr Leu Asn Lys Arg Ser Thr

    210                 215                 220

Pro Asp Ile Ala Thr Arg Pro Lys Val Asn Gly Leu Gly Ser Arg Met

225                 230                 235                 240

Glu Phe Ser Trp Thr Leu Leu Asp Met Trp Asp Thr Ile Asn Phe Glu

                245                 250                 255

Ser Thr Gly Asn Leu Ile Ala Pro Glu Tyr Gly Phe Lys Ile Ser Lys

            260                 265                 270

Arg Gly Ser Ser Gly Ile Met Lys Thr Glu Gly Thr Leu Glu Asn Cys

        275                 280                 285

Glu Thr Lys Cys Gln Thr Pro Leu Gly Ala Ile Asn Thr Thr Leu Pro

    290                 295                 300

Phe His Asn Val His Pro Leu Thr Ile Gly Glu Cys Pro Lys Tyr Val

305                 310                 315                 320

Lys Ser Glu Lys Leu Val Leu Ala Thr Gly Leu Arg Asn Val Pro Gln

                325                 330                 335

Ile Glu Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly

            340                 345                 350

Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn

        355                 360                 365

Asp Gln Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Lys Ala

    370                 375                 380

Phe Asp Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn

385                 390                 395                 400

Thr Gln Phe Glu Ala Val Gly Lys Glu Phe Ser Asn Leu Glu Arg Arg

                405                 410                 415

Leu Glu Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp

            420                 425                 430

Thr Tyr Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu

        435                 440                 445

Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Met

    450                 455                 460

Gln Leu Arg Asp Asn Val Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe

465                 470                 475                 480

Tyr His Lys Cys Asp Asp Glu Cys Met Asn Ser Val Lys Asn Gly Thr

                485                 490                 495

Tyr Asp Tyr Pro Lys Tyr Glu Glu Glu Ser Lys Leu Asn Arg Asn Glu

            500                 505                 510

Ile Lys Gly Val Lys Leu Ser Ser Met Gly Val Tyr Gln Ile Leu Ala

        515                 520                 525

Ile Tyr Ala Thr Val Ala Gly Ser Leu Ser Leu Ala Ile Met Met Ala

    530                 535                 540

Gly Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile

545                 550                 555                 560

Cys Ile

 

<210>55

<211>567

<212>PRT

<213>人工序列

<220>

<223>克隆体

 

<400>55

Met Glu Lys Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser

1               5                   10                  15

Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val

            20                  25                  30

Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile

        35                  40                  45

Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys

    50                  55                  60

Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn

65                  70                  75                  80

Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val

                85                  90                  95

Glu Lys Ala Asn Pro Ala Asn Asp Leu Cys Tyr Pro Gly Asn Phe Asn

            100                 105                 110

Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu

        115                 120                 125

Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser

    130                 135                 140

Ser Gly Val Ser Ser Ala Cys Pro Tyr Gln Gly Thr Pro Ser Phe Phe

145                 150                 155                 160

Arg Asn Val Val Trp Leu Ile Lys Lys Asn Asn Thr Tyr Pro Thr Ile

                165                 170                 175

Lys Arg Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Ile Leu Trp

            180                 185                 190

Gly Ile His His Ser Asn Asp Ala Ala Glu Gln Thr Lys Leu Tyr Gln

        195                 200                 205

Asn Pro Thr Thr Tyr Ile Ser Val Gly Thr Ser Thr Leu Asn Gln Arg

    210                 215                 220

Leu Val Pro Lys Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly

225                 230                 235                 240

Arg Met Asp Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn

                245                 250                 255

Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile

            260                 265                 270

Val Lys Lys Gly Asp Ser Ala Ile Val Lys Ser Glu Val Glu Tyr Gly

        275                 280                 285

Asn Cys Asn Thr Lys Cys Gln Thr Pro Ile Gly Ala Ile Asn Ser Ser

    290                 295                 300

Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys

305                 310                 315                 320

Tyr Val Lys Ser Asn Lys Leu Val Leu Ala Thr Gly Leu Arg Asn Ser

                325                 330                 335

Pro Leu Arg Glu Arg Arg Arg Lys Arg Gly Leu Phe Gly Ala Ile Ala

            340                 345                 350

Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly

        355                 360                 365

Tyr His His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys Glu

    370                 375                 380

Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser Ile

385                 390                 395                 400

Ile Asp Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe Asn

                405                 410                 415

Asn Leu Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp Gly

            420                 425                 430

Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met Glu

        435                 440                 445

Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr

    450                 455                 460

Asp Lys Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly Asn

465                 470                 475                 480

Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu Ser

                485                 490                 495

Val Arg Asn Gly Thr Tyr Asp Tyr Pro Gln Tyr Ser Glu Glu Ala Arg

            500                 505                 510

Leu Lys Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly Thr

        515                 520                 525

Tyr Gln Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala Leu

    530                 535                 540

Ala Ile Met Val Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly Ser

545                 550                 555                 560

Leu Gln Cys Arg Ile Cys Ile

                565

 

<210>56

<211>568

<212>PRT

<213>人工序列

 

<220>

<223>克隆体

 

<400>56

Met Glu Lys Ile Val Leu Leu Phe Ala Ile Val Ser Leu Val Lys Ser

1               5                   10                  15

Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val

            20                  25                  30

Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile

        35                  40                  45

Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys

    50                  55                  60

Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn

65                  70                  75                  80

Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val

                85                  90                  95

Glu Lys Ala Asn Pro Val Asn Asp Leu Cys Tyr Pro Gly Asp Phe Asn

            100                 105                 110

Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu

        115                 120                 125

Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Ser His Glu Ala Ser

    130                 135                 140

Leu Gly Val Ser Ser Ala Cys Pro Tyr Gln Gly Lys Ser Ser Phe Phe

145                 150                 155                 160

Arg Asn Val Val Trp Leu Ile Lys Lys Asn Ser Thr Tyr Pro Thr Ile

                165                 170                 175

Lys Arg Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Val Leu Trp

            180                 185                 190

Gly Ile His His Pro Asn Asp Ala Ala GluGln Thr Lys Leu Tyr Gln

        195                 200                 205

Asn Pro Thr Thr Tyr Ile Ser Val Gly Thr Ser Thr Leu Asn Gln Arg

    210                 215                 220

Leu Val Pro Arg Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly

225                 230                 235                 240

Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn

                245                 250                 255

Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile

            260                 265                 270

Val Lys Lys Gly Asp Ser Thr Ile Met Lys Ser Glu Leu Glu Tyr Gly

        275                 280                 285

Asn Cys Asn Thr Lys Cys Gln Thr Pro Met Gly Ala Ile Asn Ser Ser

     290                 295                 300

Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys

305                 310                 315                 320

Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser

                325                 330                 335

Pro Gln Arg Glu Arg Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile

            340                 345                 350

Ala Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr

        355                 360                 365

Gly Tyr His His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys

    370                 375                 380

Glu Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser

385                 390                 395                 400

Ile Ile Asp Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe

                405                 410                 415

Asn Asn Leu Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp

            420                 425                 430

Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met

        435                 440                 445

Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu

    450                 455                 460

Tyr Asp Lys Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly

465                 470                 475                 480

Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu

                485                 490                 495

Ser Val Arg Asn Gly Thr Tyr Asp Tyr Pro Gln Tyr Ser Glu Glu Ala

            500                 505                 510

Arg Leu Lys Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly

        515                 520                 525

Ile Tyr Gln Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala

    530                 535                 540

Leu Ala Ile Met Val Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly

545                 550                 555                 560

Ser Leu Gln Cys Arg Ile Cys Ile

                565

 

<210>57

<211>566

<212>PRT

<213>人工序列

 

<220>

<223>克隆体

 

<400>57

Met Ile Ala Ile Ile Val Ile Ala Ile Leu Ala Ala Ala Gly Lys Ser

1               5                   10                  15

Asp Lys Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Thr Gln Val

            20                  25                  30

Asp Thr Ile Leu Glu Lys Asn Val Thr Val Thr His Ser Ile Glu Leu

        35                  40                  45

Leu Glu Asn Gln Lys Glu Glu Arg Phe Cys Lys Ile Leu Asn Lys Ala

    50                  55                  60

Pro Leu Asp Leu Arg Glu Cys Thr Ile Glu Gly Trp Ile Leu Gly Asn

65                  70                  75                  80

Pro Gln Cys Asp Leu Leu Leu Gly Asp Gln Ser Trp Ser Tyr Ile Val

                85                  90                  95

Glu Arg Pro Thr Ala Gln Asn Gly Ile Cys Tyr Pro Gly Thr Leu Asn

            100                 105                 110

Glu Val Glu Glu Leu Arg Ala Leu Ile Gly Ser Gly Glu Arg Val Glu

        115                 120                 125

Arg Phe Glu Met Phe Pro Gln Ser Thr Trp Gln Gly Val Asp Thr Asn

    130                 135                 140

Ser Gly Thr Thr Arg Ser Cys Pro Tyr Ser Thr Gly Ala Ser Phe Tyr

145                 150                 155                 160

Arg Asn Leu Leu Trp Ile Ile Lys Thr Lys Thr Ala Glu Tyr Pro Val

                165                 170                 175

Ile Lys Gly Ile Tyr Asn Asn Thr Gly Thr Gln Pro Ile Leu Tyr Phe

            180                 185                 190

Trp Gly Val His His Pro Pro Asn Thr Asp Glu Gln Asp Thr Leu Tyr

        195                 200                 205

Gly Ser Gly Asp Arg Tyr Val Arg Met Gly Thr Glu Ser Met Asn Phe

    210                 215                 220

Ala Lys Ser Pro Glu Ile Ala Ala Arg Pro Ala Val Asn Gly Gln Arg

225                 230                 235                 240

Gly Arg Ile Asp Tyr Tyr Trp Ser Val Leu Lys Pro Gly Glu Thr Leu

                245                 250                 255

Asn Val Glu Ser Asn Gly Asn Leu Ile Ala Pro Trp Tyr Ala Tyr Lys

            260                 265                 270

Phe Val Asn Thr Asn Ser Lys Gly Ala Val Phe Arg Ser Asp Leu Pro

        275                 280                 285

Ile Glu Asn Cys Asp Ala Thr Cys Gln Thr Ile Ala Gly Val Leu Arg

    290                 295                 300

Thr Asn Lys Thr Phe Gln Asn Val Ser Pro Leu Trp Ile Gly Glu Cys

305                 310                 315                 320

Pro Lys Tyr Val Lys Ser Glu Ser Leu Arg Leu Ala Thr Gly Leu Arg

                325                 330                 335

Asn Val Pro Gln Ile Glu Thr Arg Gly Leu Phe Gly Ala Ile Ala Gly

            340                 345                 350

Phe Ile Glu Gly Gly Trp Thr Gly Met Ile Asp Gly Trp Tyr Gly Tyr

        355                 360                 365

His His Glu Asn Ser Gln Gly Ser Gly Tyr Ala Ala Asp Arg Glu Ser

    370                 375                 380

Thr Gln Lys Ala Val Asn Arg Ile Thr Asn Lys Val Asn Ser Ile Ile

385                 390                 395                 400

Asn Lys Met Asn Thr Gln Phe Glu Ala Val Asp His Glu Phe Ser Asn

                405                 410                 415

Leu Glu Arg Arg Ile Asp Asn Leu Asn Lys Arg Met Gln Asp Gly Phe

            420                 425                 430

Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn

        435                 440                 445

Glu Arg Thr Leu Asp Met His Asp Ala Asn Val Lys Asn Leu His Glu

    450                 455                 460

Lys Val Lys Ser Gln Leu Arg Asp Asn Ala Thr Ile Leu Gly Asn Gly

465                 470                 475                 480

Cys Phe Glu Phe Trp His Lys Cys Asp Asn Glu Cys Ile Glu Ser Val

                485                 490                 495

Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Gln Thr Glu Ser Lys Leu

            500                 505                 510

Asn Arg Leu Lys Ile Glu Ser Val Lys Leu Glu Asn Leu Gly Val Tyr

        515                 520                 525

Gln Ile Leu Ala Ile Tyr Ser Thr Val Ser Ser Ser Leu Val Leu Val

    530                 535                 540

Gly Leu Ile Met Ala Met Gly Leu Trp Met Cys Ser Asn Gly Ser Met

545                 550                 555                 560

Gln Cys Arg Ile Cys Ile

                565

 

<210>58

<211>570

<212>PRT

<213>人工序列

 

<220>

<223>克隆体

 

<400>58

Met Asn Thr Gln Ile Leu Ile Leu Ala Thr Ser Ala Phe Phe Tyr Val

1               5                   10                  15

Arg Ala Asp Lys Ile Cys Leu Gly His His Ala Val Ser Asn Gly Thr

            20                  25                  30

Lys Val Asp Thr Leu Thr Glu Lys Gly Ile Glu Val Val Asn Ala Thr

        35                  40                  45

Glu Thr Val Glu Gln Thr Asn Ile Pro Lys Ile Cys Ser Lys Gly Lys

    50                  55                  60

Gln Thr Val Asp Leu Gly Gln Cys Gly Leu Leu Gly Thr Val Ile Gly

65                  70                  75                  80

Pro Pro Gln Cys Asp Gln Phe Leu Glu Phe Ser Ala Asn Leu Ile Val

                85                  90                  95

Glu Arg Arg Glu Gly Asn Asp Ile Cys Tyr Pro Gly Lys Phe Asp Asn

            100                 105                 110

Glu Glu Thr Leu Arg Lys Ile Leu Arg Lys Ser Gly Gly Ile Lys Lys

        115                 120                 125

Glu Asn Met Gly Phe Thr Tyr Thr Gly Val Arg Thr Asn Gly Glu Thr

    130                 135                 140

Ser Ala Cys Arg Arg Ser Arg Ser Ser Phe Tyr Ala Glu Met Lys Trp

145                 150                 155                 160

Leu Leu Ser Ser Thr Asp Asn Gly Thr Phe Pro Gln Met Thr Lys Ser

                165                 170                 175

Tyr Lys Asn Thr Lys Lys Val Pro Ala Leu Ile Ile Trp Gly Ile His

            180                 185                 190

His Ser Gly Ser Thr Thr Glu Gln Thr Arg Leu Tyr Gly Ser Gly Asn

        195                 200                 205

Lys Leu Ile Thr Val Trp Ser Ser Lys Tyr Gln Gln Ser Phe Val Pro

    210                 215                 220

Asn Pro Gly Pro Arg Pro Gln Met Asn Gly Gln Ser Gly Arg Ile Asp

225                 230                 235                 240

Phe His Trp Leu Met Leu Asp Pro Asn Asp Thr Val Thr Phe Ser Phe

                245                 250                 255

Asn Gly Ala Phe Ile Ala Pro Asp Arg Ala Ser Phe Leu Arg Gly Lys

            260                 265                 270

Ser Leu Gly Ile Gln Ser Asp Ala Gln Leu Asp Asn Asn Cys Glu Gly

        275                 280                 285

Glu Cys Tyr His Ile Gly Gly Thr Ile Ile Ser Asn Leu Pro Phe Gln

    290                 295                 300

Asn Ile Asn Ser Arg Ala Ile Gly Lys Cys Pro Arg Tyr Val Lys Gln

305                 310                 315                 320

Lys Ser Leu Met Leu Ala Thr Gly Met Lys Asn Val Pro Glu Ala Pro

                325                 330                 335

Ala His Lys Gln Leu Thr His His Met Arg Lys Lys Arg Gly Leu Phe

            340                 345                 350

Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu Gly Leu Ile Asp

        355                 360                 365

Gly Trp Tyr Gly Tyr Lys His Gln Asn Ala Gln Gly Glu Gly Thr Ala

    370                 375                 380

Ala Asp Tyr Lys Ser Thr Gln Ser Ala Ile Asn Gln Ile Thr Gly Lys

385                 390                 395                 400

Leu Asn Arg Leu Ile Glu Lys Thr Asn Gln Gln Phe Glu Leu Ile Asp

                405                 410                 415

Asn Glu Phe Asn Glu Ile Glu Lys Gln Ile Gly Asn ValIle Asn Trp

            420                 425                 430

Thr Arg Asp Ser Ile Ile Glu Val Trp Ser Tyr Asn Ala Glu Phe Leu

        435                 440                 445

Val Ala Val Glu Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met

    450                 455                 460

Asn Lys Leu Tyr Glu Lys Val Arg Arg Gln Leu Arg Glu Asn Ala Glu

465                 470                 475                 480

Glu Asp Gly Asn Gly Cys Phe Glu Ile Phe His Gln Cys Asp Asn Asp

                485                 490                 495

Cys Met Ala Ser Ile Arg Asn Asn Thr Tyr Asp His Lys Lys Tyr Arg

            500                 505                 510

Lys Glu Ala Ile Gln Asn Arg Ile Gln Ile Asp Ala Val Lys Leu Ser

        515                 520                 525

Ser Gly Tyr Lys Asp Ile Ile Leu Trp Phe Ser Phe Gly Ala Ser Cys

    530                 535                 540

Phe Leu Phe Leu Ala Ile Ala Met Gly Leu Val Phe Ile Cys Ile Lys

545                 550                 555                 560

Asn Gly Asn Met Arg Cys Thr Ile Cys Ile

                565                 570

<210>59

<211>560

<212>PRT

<213>人工序列

 

<220>

<223>克隆体

 

<400>59

Met Glu Thr Ile Ser Leu Ile Thr Ile Leu Leu Val Val Thr Ala Ser

1               5                   10                  15

Asn Ala Asp Lys Ile Cys Ile Gly His Gln Ser Thr Asn Ser Thr Glu

            20                  25                  30

Thr Val Asp Thr Leu Thr Glu Thr Asn Val Pro Val Thr His Ala Lys

       35                  40                  45

Glu Leu Leu His Thr Glu His Asn Gly Met Leu Cys Ala Thr Ser Leu

    50                  55                  60

Gly His Pro Leu Ile Leu Asp Thr Cys Thr Ile Glu Gly Leu Val Tyr

65                  70                  75                  80

Gly Asn Pro Ser Cys Asp Leu Leu Leu Gly Gly Arg Glu Trp Ser Tyr

                85                  90                  95

Ile Val Glu Arg Ser Ser Ala Val Asn Gly Thr Cys Tyr Pro Gly Asn

            100                 105                 110

Val Glu Asn Leu Glu Glu Leu Arg Thr Leu Phe Ser Ser Ala Ser Ser

        115                 120                 125

Tyr Gln Arg Ile Gln Ile Phe Pro Asp Thr Thr Trp Asn Val Thr Tyr

    130                 135                 140

Thr Gly Thr Ser Arg Ala Cys Ser Gly Ser Phe Tyr Arg Ser Met Arg

145                 150                 155                 160

Trp Leu Thr Gln Lys Ser Gly Phe Tyr Pro Val Gln Asp Ala Gln Tyr

                165                 170                 175

Thr Asn Asn Arg Gly Lys Ser Ile Leu Phe Val Trp Gly Ile His His

            180                 185                 190

Pro Pro Thr Tyr Thr Glu Gln Thr Asn Leu Tyr Ile Arg Asn Asp Thr

        195                 200                 205

Thr Thr Ser Val Thr Thr Glu Asp Leu Asn Arg Thr Phe Lys Pro Val

    210                 215                 220

Ile Gly Pro Arg Pro Leu Val Asn Gly Leu Gln Gly Arg Ile Asp Tyr

225                 230                 235                 240

Tyr Trp Ser Val Leu Lys Pro Gly Gln Thr Leu Arg Val Arg Ser Asn

                245                 250                 255

Gly Asn Leu Ile Ala Pro Trp Tyr Gly His Val Leu Ser Gly Gly Ser

            260                 265                 270

His Gly Arg Ile Leu Lys Thr Asp Leu Lys Gly Gly Asn Cys Val Val

        275                 280                 285

Gln Cys Gln Thr Glu Lys Gly Gly Leu Asn Ser Thr Leu Pro Phe His

    290                 295                 300

Asn Ile Ser Lys Tyr Ala Phe Gly Thr Cys Pro Lys Tyr Val Arg Val

305                 310                 315                 320

Asn Ser Leu Lys Leu Ala Val Gly Leu Arg Asn Val Pro Ala Arg Ser

                325                 330                 335

Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp

            340                 345                 350

Pro Gly Leu Val Ala Gly Trp Tyr Gly Phe Gln His Ser Asn Asp Gln

        355                 360                 365

Gly Val Gly Met Ala Ala Asp Arg Asp Ser Thr Gln Lys Ala Ile Asp

    370                 375                 380

Lys Ile Thr Ser Lys Val Asn Asn Ile Val Asp Lys Met Asn Lys Gln

385                 390                 395                 400

Tyr Glu Ile Ile Asp His Glu Phe Ser Glu Val Glu Thr Arg Leu Asn

                405                 410                 415

Met Ile Asn Asn Lys Ile Asp Asp Gln Ile Gln Asp Val Trp Ala Tyr

            420                 425                 430

Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Gln Lys Thr Leu Asp Glu

        435                 440                 445

His Asp Ala Asn Val Asn Asn Leu Tyr Asn Lys Val Lys Arg Ala Leu

    450                 455                 460

Gly Ser Asn Ala Met Glu Asp Gly Lys Gly Cys Phe Glu Leu Tyr His

465                 470                 475                 480

Lys Cys Asp Asp Gln Cys Met Glu Thr Ile Arg Asn Gly Thr Tyr Asn

                485                 490                 495

Arg Arg Lys Tyr Arg Glu Glu Ser Arg Leu Glu Arg Gln Lys Ile Glu

            500                 505                 510

Gly Val Lys Leu Glu Ser Glu Gly Thr Tyr Lys Ile Leu Thr Ile Tyr

        515                 520                 525

Ser Thr Val Ala Ser Ser Leu Val Leu Ala Met Gly Phe Ala Ala Phe

     530                 535                 540

Leu Phe Trp Ala Met Ser Asn Gly Ser Cys Arg Cys Asn Ile Cys Ile

545                 550                 555                 560

 

<210>60

<211>3111

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

 

<400>60

agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt        60

taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa       120

atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt       180

tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca       240

aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga       300

gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa       360

aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg       420

taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta       480

aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt       540

aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct       600

atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa       660

ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc       720

cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac       780

aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa       840

atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca       900

ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag       960

agaagagact aattaattaa ttaatcatct tgagagaaaa tggagaaaat agtgcttctt      1020

cttgcaatag tcagtcttgt taaaagtgat cagatttgca ttggttacca tgcaaacaat      1080

tcaacagagc aggttgacac aatcatggaa aagaacgtta ctgttacaca tgcccaagac      1140

atactggaaa agacacacaa cgggaagctc tgcgatctag atggagtgaa gcctctaatt      1200

ttaagagatt gtagtgtagc tggatggctc ctcgggaacc caatgtgtga cgaattcatc      1260

aatgtaccgg aatggtctta catagtggag aaggccaatc caaccaatga cctctgttac      1320

ccagggagtt tcaacgacta tgaagaactg aaacacctat tgagcagaat aaaccatttt      1380

gagaaaattc aaatcatccc caaaagttct tggtccgatc atgaagcctc atcaggagtt      1440

agctcagcat gtccatacct gggaagtccc tcctttttta gaaatgtggt atggcttatc      1500

aaaaagaaca gtacataccc aacaataaag aaaagctaca ataataccaa ccaagaggat      1560

cttttggtac tgtggggaat tcaccatcct aatgatgcgg cagagcagac aaggctatat      1620

caaaacccaa ccacctatat ttccattggg acatcaacac taaaccagag attggtacca      1680

aaaatagcta ctagatccaa agtaaacggg caaagtggaa ggatggagtt cttctggaca      1740

attttaaaac ctaatgatgc aatcaacttc gagagtaatg gaaatttcat tgctccagaa      1800

tatgcataca aaattgtcaa gaaaggggac tcagcaatta tgaaaagtga attggaatat      1860

ggtaactgca acaccaagtg tcaaactcca atgggggcga taaactctag tatgccattc      1920

cacaacatac accctctcac catcggggaa tgccccaaat atgtgaaatc aaacagatta      1980

gtccttgcaa cagggctcag aaatagccct caaagagaga gcagaagaaa aaagagagga      2040

ctatttggag ctatagcagg ttttatagag ggaggatggc agggaatggt agatggttgg      2100

tatgggtacc accatagcaa tgagcagggg agtgggtacg ctgcagacaa agaatccact      2160

caaaaggcaa tagatggagt caccaataag gtcaactcaa tcattgacaa aatgaacact      2220

cagtttgagg ccgttggaag ggaatttaat aacttagaaa ggagaataga gaatttaaac      2280

aagaagatgg aagacgggtt tctagatgtc tggacttata atgccgaact tctggttctc      2340

atggaaaatg agagaactct agactttcat gactcaaatg ttaagaacct ctacgacaag      2400

gtccgactac agcttaggga taatgcaaag gagctgggta acggttgttt cgagttctat      2460

cacaaatgtg ataatgaatg tatggaaagt ataagaaacg gaacgtacaa ctatccgcag      2520

tattcagaag aagcaagatt aaaaagagag gaaataagtg gggtaaaatt ggaatcaata      2580

ggaacttacc aaatactgtc aatttattca acagtggcga gttccctagc actggcaatc      2640

atgatggctg gtctatcttt atggatgtgc tccaatggat cgttacaatg cagaatttgc      2700

atttaagagc tctaagttaa aatgcttctt cgtctcctat ttataatatg gtttgttatt      2760

gttaattttg ttcttgtaga agagcttaat taatcgttgt tgttatgaaa tactatttgt      2820

atgagatgaa ctggtgtaat gtaattcatt tacataagtg gagtcagaat cagaatgttt      2880

cctccataac taactagaca tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac      2940

taaaattgaa catcttttgc cacaacttta taagtggtta atatagctca aatatatggt      3000

caagttcaat agattaataa tggaaatatc agttatcgaa attcattaac aatcaactta      3060

acgttattaa ctactaattt tatatcatcc cctttgataa atgatagtac a               3111

 

<210>61

<211>3123

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

 

<400>61

agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt        60

taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa       120

atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt       180

tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca       240

aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga       300

gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa       360

aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg       420

taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta       480

aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt       540

aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct       600

atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa       660

ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc       720

cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac       780

aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa       840

atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca       900

ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag       960

agaagagact aattaattaa ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt      1020

ttcggcttat tgttttctct tcttgtgttg gttccttctc agatcttcgc tgacacaata      1080

tgtataggct accatgccaa caactcaacc gacactgttg acacagtact tgagaagaat      1140

gtgacagtga cacactctgt caacctactt gaggacagtc acaatggaaa actatgtcta      1200

ctaaaaggaa tagccccact acaattgggt aattgcagcg ttgccggatg gatcttagga      1260

aacccagaat gcgaattact gatttccaag gaatcatggt cctacattgt agaaacacca      1320

aatcctgaga atggaacatg ttacccaggg tatttcgccg actatgagga actgagggag      1380

caattgagtt cagtatcttc atttgagaga ttcgaaatat tccccaaaga aagctcatgg      1440

cccaaccaca ccgtaaccgg agtatcagca tcatgctccc ataatgggaa aagcagtttt      1500

tacagaaatt tgctatggct gacggggaag aatggtttgt acccaaacct gagcaagtcc      1560

tatgtaaaca acaaagagaa agaagtcctt gtactatggg gtgttcatca cccgcctaac      1620

atagggaacc aaagggcact ctatcataca gaaaatgctt atgtctctgt agtgtcttca      1680

cattatagca gaagattcac cccagaaata gccaaaagac ccaaagtaag agatcaggaa      1740

ggaagaatca actactactg gactctgctg gaacctgggg atacaataat atttgaggca      1800

aatggaaatc taatagcgcc atggtatgct tttgcactga gtagaggctt tggatcagga      1860

atcatcacct caaatgcacc aatggatgaa tgtgatgcga agtgtcaaac acctcaggga      1920

gctataaaca gcagtcttcc tttccagaat gtacacccag tcacaatagg agagtgtcca      1980

aagtatgtca ggagtgcaaa attaaggatg gttacaggac taaggaacat cccatccatt      2040

caatccagag gtttgtttgg agccattgcc ggtttcattg aaggggggtg gactggaatg      2100

gtagatgggt ggtatggtta tcatcatcag aatgagcaag gatctggcta tgctgcagat      2160

caaaaaagta cacaaaatgc cattaacggg attacaaaca aggtcaattc tgtaattgag      2220

aaaatgaaca ctcaattcac agctgtgggc aaagagttca acaaattgga aagaaggatg      2280

gaaaacttaa ataaaaaagt tgatgatggg tttctagaca tttggacata taatgcagaa      2340

ttgttggttc tactggaaaa tgaaaggact ttggatttcc atgactccaa tgtgaagaat      2400

ctgtatgaga aagtaaaaag ccaattaaag aataatgcca aagaaatagg aaacgggtgt      2460

tttgagttct atcacaagtg taacaatgaa tgcatggaga gtgtgaaaaa tggtacctat      2520

gactatccaa aatattccga agaatcaaag ttaaacaggg agaaaattga tggagtgaaa      2580

ttggaatcaa tgggagtata ccagattctg gcgatctact caactgtcgc cagttccctg      2640

gttcttttgg tctccctggg ggcaatcagc ttctggatgt gttccaatgg gtctttgcag      2700

tgtagaatat gcatctaaga gctctaagtt aaaatgcttc ttcgtctcct atttataata      2760

tggtttgtta ttgttaattt tgttcttgta gaagagctta attaatcgtt gttgttatga      2820

aatactattt gtatgagatg aactggtgta atgtaattca tttacataag tggagtcaga      2880

atcagaatgt ttcctccata actaactaga catgaagacc tgccgcgtac aattgtctta      2940

tatttgaaca actaaaattg aacatctttt gccacaactt tataagtggt taatatagct      3000

caaatatatg gtcaagttca atagattaat aatggaaata tcagttatcg aaattcatta      3060

acaatcaact taacgttatt aactactaat tttatatcat cccctttgat aaatgatagt      3120

aca                                                                    3123

 

<210>62

<211>3088

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

 

<400>62

ctggtatatt tatatgttgt caaataactc aaaaaccata aaagtttaag ttagcaagtg       60

tgtacatttt tacttgaaca aaaatattca cctactactg ttataaatca ttattaaaca       120

ttagagtaaa gaaatatgga tgataagaac aagagtagtg atattttgac aacaattttg       180

ttgcaacatt tgagaaaatt ttgttgttct ctcttttcat tggtcaaaaa caatagagag       240

agaaaaagga agagggagaa taaaaacata atgtgagtat gagagagaaa gttgtacaaa       300

agttgtacca aaatagttgt acaaatatca ttgaggaatt tgacaaaagc tacacaaata       360

agggttaatt gctgtaaata aataaggatg acgcattaga gagatgtacc attagagaat       420

ttttggcaag tcattaaaaa gaaagaataa attattttta aaattaaaag ttgagtcatt       480

tgattaaaca tgtgattatt taatgaattg atgaaagagt tggattaaag ttgtattagt       540

aattagaatt tggtgtcaaa tttaatttga catttgatct tttcctatat attgccccat       600

agagtcagtt aactcatttt tatatttcat agatcaaata agagaaataa cggtatatta       660

atccctccaa aaaaaaaaaa cggtatattt actaaaaaat ctaagccacg taggaggata       720

acaggatccc cgtaggagga taacatccaa tccaaccaat cacaacaatc ctgatgagat       780

aacccacttt aagcccacgc atctgtggca catctacatt atctaaatca cacattcttc       840

cacacatctg agccacacaa aaaccaatcc acatctttat cacccattct ataaaaaatc       900

acactttgtg agtctacact ttgattccct tcaaacacat acaaagagaa gagactaatt       960

aattaattaa tcatcttgag agaaaatgaa agtaaaacta ctggtcctgt tatgcacatt      1020

tacagctaca tatgcagaca caatatgtat aggctaccat gctaacaact cgaccgacac      1080

tgttgacaca gtacttgaaa agaatgtgac agtgacacac tctgtcaacc tgcttgagaa      1140

cagtcacaat ggaaaactat gtctattaaa aggaatagcc ccactacaat tgggtaattg      1200

cagcgttgcc gggtggatct taggaaaccc agaatgcgaa ttactgattt ccaaggagtc      1260

atggtcctac attgtagaaa aaccaaatcc tgagaatgga acatgttacc cagggcattt      1320

cgctgactat gaggaactga gggagcaatt gagttcagta tcttcatttg agaggttcga      1380

aatattcccc aaagaaagct catggcccaa ccacaccgta accggagtgt cagcatcatg      1440

ctcccataat ggggaaagca gtttttacag aaatttgcta tggctgacgg ggaagaatgg      1500

tttgtaccca aacctgagca agtcctatgc aaacaacaaa gaaaaagaag tccttgtact      1560

atggggtgtt catcacccgc caaacatagg tgaccaaaag gccctctatc atacagaaaa      1620

tgcttatgtc tctgtagtgt cttcacatta tagcagaaaa ttcaccccag aaatagccaa      1680

aagacccaaa gtaagagatc aagaaggaag aatcaattac tactggactc tgcttgaacc      1740

cggggataca ataatatttg aggcaaatgg aaatctaata gcgccaagat atgctttcgc      1800

actgagtaga ggctttggat caggaatcat caactcaaat gcaccaatgg ataaatgtga      1860

tgcgaagtgc caaacacctc agggagctat aaacagcagt cttcctttcc agaacgtaca      1920

cccagtcaca ataggagagt gtccaaagta tgtcaggagt gcaaaattaa ggatggttac      1980

aggactaagg aacatcccat ccattcaatc cagaggtttg tttggagcca ttgccggttt      2040

cattgaaggg gggtggactg gaatggtaga tggttggtat ggttatcatc atcagaatga      2100

gcaaggatct ggctatgctg cagatcaaaa aagcacacaa aatgccatta atgggattac      2160

aaacaaggtc aattctgtaa ttgagaaaat gaacactcaa ttcacagcag tgggcaaaga      2220

gttcaacaaa ttggaaagaa ggatggaaaa cttgaataaa aaagttgatg atgggtttat      2280

agacatttgg acatataatg cagaactgtt ggttctactg gaaaatgaaa ggactttgga      2340

tttccatgac tccaatgtga agaatctgta tgagaaagta aaaagccagt taaagaataa      2400

tgctaaagaa ataggaaatg ggtgttttga gttctatcac aagtgtaacg atgaatgcat      2460

ggagagtgta aagaatggaa cttatgacta tccaaaatat tccgaagaat caaagttaaa      2520

cagggagaaa attgatggag tgaaattgga atcaatggga gtctatcaga ttctggcgat      2580

ctactcaaca gtcgccagtt ctctggttct tttggtctcc ctgggggcaa tcagcttctg      2640

gatgtgttcc aatgggtctt tacagtgtag aatatgcatc taagagctct aagttaaaat      2700

gcttcttcgt ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga      2760

gcttaattaa tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta      2820

attcatttac ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga      2880

agacctgccg cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac      2940

aactttataa gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg      3000

aaatatcagt tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat      3060

atcatcccct ttgataaatg atagtaca                                         3088

 

<210>63

<211>3102

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

 

<400>63

agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt        60

taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa       120

atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt       180

tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca       240

aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga       300

gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa       360

aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg       420

taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta       480

aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt       540

aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct       600

atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa       660

ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc       720

cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac       780

aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa       840

atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca       900

ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag       960

agaagagact aattaattaa ttaatcatct tgagagaaaa tgaaagtaaa actactggtc      1020

ctgttatgca catttacagc tacatatgca gacacaatat gtataggcta ccatgccaac      1080

aactcaaccg acactgttga cacagtactt gagaagaatg tgacagtgac acactctgtc      1140

aacctgcttg aggacagtca caatggaaaa ttatgtctat taaaaggaat agccccacta      1200

caattgggta attgcagcgt tgccggatgg atcttaggaa acccagaatg cgaattactg      1260

atttccaggg aatcatggtc ctacattgta gaaaaaccaa atcctgagaa tggaacatgt      1320

tacccagggc atttcgccga ctatgaggaa ctgagggagc aattgagttc agtatcttca      1380

tttgagagat tcgaaatatt ccccaaagaa agctcatggc ccaaccacac cacaaccgga      1440

gtatcagcat catgctccca taatggggaa agcagttttt acaaaaattt gctatggctg      1500

acggggaaga atggtttgta cccaaacctg agcaagtcct atgcaaacaa caaagagaaa      1560

gaagtccttg tactatgggg tgttcatcac ccgcctaaca taggtgacca aagggctctc      1620

tatcataaag aaaatgctta tgtctctgta gtgtcttcac attatagcag aaaattcacc      1680

ccagaaatag ccaaaagacc caaagtaaga gatcaagaag gaagaatcaa ctactactgg      1740

actctacttg aacccgggga tacaataata tttgaggcaa atggaaatct aatagcgcca      1800

agatatgctt tcgcactgag tagaggcttt ggatcaggaa tcatcaactc aaatgcacca      1860

atggatgaat gtgatgcgaa gtgccaaaca cctcagggag ctataaacag cagtcttcct      1920

ttccagaatg tacaccctgt cacaatagga gagtgtccaa agtatgtcag gagtgcaaaa      1980

ttaaggatgg ttacaggact aaggaacatc ccatccattc aatccagagg tttgtttgga      2040

gccattgccg gtttcattga aggggggtgg actggaatgg tagatggttg gtatggttat      2100

catcatcaga atgagcaagg atctggctat gctgcagatc aaaaaagcac acaaaatgcc      2160

attaatggga ttacaaacaa ggtcaattct gtaattgaga aaatgaacac tcaattcaca      2220

gctgtgggca aagagttcaa caaattggaa agaaggatgg aaaacttaaa taaaaaagtt      2280

gatgatgggt ttatagacat ttggacatat aatgcagaat tgttggttct actggaaaat      2340

gaaaggactt tggatttcca tgactccaat gtgaagaatc tgtatgagaa agtaaaaagc      2400

caattaaaga ataatgccaa agaaatagga aatgggtgtt ttgagttcta tcataagtgt      2460

aacgatgaat gcatggagag tgtaaaaaat ggaacttatg actatccaaa atattccgaa      2520

gaatcaaagt taaacaggga gaaaattgat ggagtgaaat tggaatcaat gggagtctat      2580

cagattctgg cgatctactc aacagtcgcc agttctctgg ttcttttggt ctccctgggg      2640

gcaatcagct tctggatgtg ttccaatggg tctttgcagt gtagaatatg catctgagag      2700

ctctaagtta aaatgcttct tcgtctccta tttataatat ggtttgttat tgttaatttt      2760

gttcttgtag aagagcttaa ttaatcgttg ttgttatgaa atactatttg tatgagatga      2820

actggtgtaa tgtaattcat ttacataagt ggagtcagaa tcagaatgtt tcctccataa      2880

ctaactagac atgaagacct gccgcgtaca attgtcttat atttgaacaa ctaaaattga      2940

acatcttttg ccacaacttt ataagtggtt aatatagctc aaatatatgg tcaagttcaa      3000

tagattaata atggaaatat cagttatcga aattcattaa caatcaactt aacgttatta      3060

actactaatt ttatatcatc ccctttgata aatgatagta ca                         3102

<210>64

<211>3093

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

 

<400>64

agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt        60

taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa       120

atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt       180

tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca       240

aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga       300

gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa       360

aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg       420

taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta       480

aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt       540

aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct       600

atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa       660

ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc       720

cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac       780

aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa       840

atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca       900

ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag       960

agaagagact aattaattaa ttaatcatct tgagagaaaa tggccatcat ttatctaatt      1020

ctcctgttca cagcagtgag aggggaccaa atatgcattg gataccatgc caataattcc      1080

acagagaagg tcgacacaat tctagagcgg aacgtcactg tgactcatgc caaggacatt      1140

cttgagaaga cccataacgg aaagttatgc aaactaaacg gaatccctcc acttgaacta      1200

ggggactgta gcattgccgg atggctcctt ggaaatccag aatgtgatag gcttctaagt      1260

gtgccagaat ggtcctatat aatggagaaa gaaaacccga gagacggttt gtgttatcca      1320

ggcagcttca atgattatga agaattgaaa catctcctca gcagcgtgaa acatttcgag      1380

aaagtaaaga ttctgcccaa agatagatgg acacagcata caacaactgg aggttcacgg      1440

gcctgcgcgg tgtctggtaa tccatcattc ttcaggaaca tggtctggct gacaaagaaa      1500

gaatcaaatt atccggttgc caaaggatcg tacaacaata caagcggaga acaaatgcta      1560

ataatttggg gggtgcacca tcccaatgat gagacagaac aaagaacatt gtaccagaat      1620

gtgggaacct atgtttccgt aggcacatca acattgaaca aaaggtcaac cccagacata      1680

gcaacaaggc ctaaagtgaa tggactagga agtagaatgg agttctcttg gaccctattg      1740

gatatgtggg acaccataaa ttttgagagt actggtaatc taattgcacc agagtatgga      1800

ttcaaaatat cgaaaagagg tagttcaggg atcatgaaaa cagaaggaac acttgagaac      1860

tgtgagacca aatgccaaac tcctttggga gcaataaata caacattgcc ttttcacaat      1920

gtccacccac tgacaatagg tgagtgcccc aaatatgtaa aatcggagaa gttggtctta      1980

gcaacaggac taaggaatgt tccccagatt gaatcaagag gattgtttgg ggcaatagct      2040

ggttttatag aaggaggatg gcaaggaatg gttgatggtt ggtatggata ccatcacagc      2100

aatgaccagg gatcagggta tgcagcagac aaagaatcca ctcaaaaggc atttgatgga      2160

atcaccaaca aggtaaattc tgtgattgaa aagatgaaca cccaatttga agctgttggg      2220

aaagagttca gtaacttaga gagaagactg gagaacttga acaaaaagat ggaagacggg      2280

tttctagatg tgtggacata caatgctgag cttctagttc tgatggaaaa tgagaggaca      2340

cttgactttc atgattctaa tgtcaagaat ctgtatgata aagtcagaat gcagctgaga      2400

gacaacgtca aagaactagg aaatggatgt tttgaatttt atcacaaatg tgatgatgaa      2460

tgcatgaata gtgtgaaaaa cgggacgtat gattatccca agtatgaaga agagtctaaa      2520

ctaaatagaa atgaaatcaa aggggtaaaa ttgagcagca tgggggttta tcaaatcctt      2580

gccatttatg ctacagtagc aggttctctg tcactggcaa tcatgatggc tgggatctct      2640

ttctggatgt gctccaacgg gtctctgcag tgcaggatct gcatatgaga gctctaagtt      2700

aaaatgcttc ttcgtctcct atttataata tggtttgtta ttgttaattt tgttcttgta      2760

gaagagctta attaatcgtt gttgttatga aatactattt gtatgagatg aactggtgta      2820

atgtaattca tttacataag tggagtcaga atcagaatgt ttcctccata actaactaga      2880

catgaagacc tgccgcgtac aattgtctta tatttgaaca actaaaattg aacatctttt      2940

gccacaactt tataagtggt taatatagct caaatatatg gtcaagttca atagattaat      3000

aatggaaata tcagttatcg aaattcatta acaatcaact taacgttatt aactactaat      3060

tttatatcat cccctttgat aaatgatagt aca                                   3093

 

<210>65

<211>3108

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

<400>65

agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt        60

taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa       120

atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt       180

tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca       240

aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga       300

gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa       360

aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg       420

taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta       480

aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt       540

aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct       600

atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa       660

ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc       720

cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac       780

aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa       840

atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca       900

ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag       960

agaagagact aattaattaa ttaatcatct tgagagaaaa tggagaaaat agtgcttctt      1020

cttgcaatag tcagccttgt taaaagtgat cagatttgca ttggttacca tgcaaacaac      1080

tcgacagagc aggttgacac aataatggaa aagaacgtta ctgttacaca tgcccaagac      1140

atactggaaa agacacacaa cgggaagctc tgcgatctag atggagtgaa gcctctgatt      1200

ttaagagatt gtagtgtagc tggatggctc ctcggaaacc caatgtgtga cgagttcatc      1260

aatgtgccgg aatggtctta catagtggag aaggccaacc cagccaatga cctctgttac      1320

ccagggaatt tcaacgacta tgaagaactg aaacacctat tgagcagaat aaaccatttt      1380

gagaaaattc agatcatccc caaaagttct tggtccgatc atgaagcctc atcaggggtc      1440

agctcagcat gtccatacca gggaacgccc tcctttttca gaaatgtggt atggcttatc      1500

aaaaagaaca atacataccc aacaataaag agaagctaca ataataccaa ccaggaagat      1560

cttttgatac tgtgggggat tcatcattct aatgatgcgg cagagcagac aaagctctat      1620

caaaacccaa ccacctatat ttccgttggg acatcaacac taaaccagag attggtacca      1680

aaaatagcta ctagatccaa agtaaacggg caaagtggaa ggatggattt cttctggaca      1740

attttaaaac cgaatgatgc aatcaacttc gagagtaatg gaaatttcat tgctccagaa      1800

tatgcataca aaattgtcaa gaaaggggac tcagcaattg ttaaaagtga agtggaatat      1860

ggtaactgca atacaaagtg tcaaactcca ataggggcga taaactctag tatgccattc      1920

cacaacatac accctctcac catcggggaa tgccccaaat atgtgaaatc aaacaaatta      1980

gtccttgcga ctgggctcag aaatagtcct ctaagagaaa gaagaagaaa aagaggacta      2040

tttggagcta tagcagggtt tatagaggga ggatggcagg gaatggtaga tggttggtat      2100

gggtaccacc atagcaatga gcaggggagt gggtacgctg cagacaaaga atccactcaa      2160

aaggcaatag atggagtcac caataaggtc aactcgatca ttgacaaaat gaacactcag      2220

tttgaggccg ttggaaggga atttaataac ttagaaagga gaatagagaa tttaaacaag      2280

aaaatggaag acggattcct agatgtctgg acttataatg ctgaacttct ggttctcatg      2340

gaaaatgaga gaactctaga cttccatgat tcaaatgtca agaaccttta cgacaaggtc      2400

cgactacagc ttagggataa tgcaaaggag ctgggtaacg gttgtttcga gttctatcac      2460

aaatgtgata atgaatgtat ggaaagtgta agaaacggaa cgtatgacta cccgcagtat      2520

tcagaagaag caagattaaa aagagaggaa ataagtggag taaaattgga atcaatagga      2580

acttaccaaa tactgtcaat ttattcaaca gttgcgagtt ctctagcact ggcaatcatg      2640

gtggctggtc tatctttgtg gatgtgctcc aatgggtcgt tacaatgcag aatttgcatt      2700

taagagctct aagttaaaat gcttcttcgt ctcctattta taatatggtt tgttattgtt      2760

aattttgttc ttgtagaaga gcttaattaa tcgttgttgt tatgaaatac tatttgtatg      2820

agatgaactg gtgtaatgta attcatttac ataagtggag tcagaatcag aatgtttcct      2880

ccataactaa ctagacatga agacctgccg cgtacaattg tcttatattt gaacaactaa      2940

aattgaacat cttttgccac aactttataa gtggttaata tagctcaaat atatggtcaa      3000

gttcaataga ttaataatgg aaatatcagt tatcgaaatt cattaacaat caacttaacg      3060

ttattaacta ctaattttat atcatcccct ttgataaatg atagtaca                   3108

 

<210>66

<211>3111

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

 

<400>66

agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt        60

taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa       120

atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt       180

tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca       240

aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga       300

gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa       360

aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg       420

taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta       480

aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt       540

aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct       600

atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa       660

ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc       720

cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac       780

aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa       840

atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca       900

ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag       960

agaagagact aattaattaa ttaatcatct tgagagaaaa tggagaaaat agtgcttctt      1020

tttgcaatag tcagtcttgt taaaagtgat cagatttgca ttggttacca tgcaaacaac      1080

tcgacagagc aggttgacac aataatggaa aagaacgtta ctgttacaca tgcccaagac      1140

atactggaaa agacacacaa tgggaagctc tgcgatctag atggagtgaa gcctctaatt      1200

ttgagagatt gtagtgtagc tggatggctc ctcggaaacc caatgtgtga cgagttcatc      1260

aatgtgccgg aatggtctta catagtggag aaggccaatc cagtcaatga cctctgttac      1320

ccaggggatt tcaatgacta tgaagaattg aaacacctat tgagcagaat aaaccatttt      1380

gagaaaattc agatcatccc caaaagttct tggtccagtc atgaagcctc attgggggtc      1440

agctcagcat gtccatacca gggaaagtcc tcctttttca gaaatgtggt atggcttatc      1500

aaaaagaaca gtacataccc aacaataaag aggagctaca ataataccaa ccaagaagat      1560

cttttggtac tgtgggggat tcaccatcct aatgatgcgg cagagcagac aaagctctat      1620

caaaacccaa ccacctatat ttccgttggg acatctacac taaaccagag attggtacca      1680

agaatagcta ctagatccaa agtaaacggg caaagtggaa ggatggagtt cttctggaca      1740

attttaaaac cgaatgatgc aatcaacttc gagagtaatg gaaatttcat tgctccagaa      1800

tatgcataca aaattgtcaa gaaaggggac tcaacaatta tgaaaagtga attggaatat      1860

ggtaactgca ataccaagtg tcaaactcca atgggggcga taaactctag catgccattc      1920

cacaatatac accctctcac catcggggaa tgccccaaat atgtgaaatc aaacagatta      1980

gtccttgcga ctgggctcag aaatagccct caaagagaga gaagaagaaa aaagagagga      2040

ttatttggag ctatagcagg ttttatagag ggaggatggc agggaatggt agatggttgg      2100

tatgggtacc accatagcaa cgagcagggg agtgggtacg ctgcagacaa agaatccact      2160

caaaaggcaa tagatggagt caccaataag gtcaactcga ttattgacaa aatgaacact      2220

cagtttgagg ccgttggaag ggaatttaac aacttagaaa ggagaataga gaatttaaac      2280

aagaagatgg aagacgggtt cctagatgtc tggacttata atgctgaact tctagttctc      2340

atggaaaacg agagaactct agactttcat gactcaaatg tcaagaacct ttacgacaag      2400

gtccgactac agcttaggga taatgcaaag gagctgggta acggttgttt cgagttctat      2460

cataaatgtg ataatgaatg tatggaaagt gtaagaaacg gaacgtatga ctacccgcag      2520

tattcagaag aagcaagact aaaaagagag gaaataagtg gagtaaaatt ggaatcaata      2580

ggaatttacc aaatattgtc aatttattct acagtggcca gctccctagc actggcaatc      2640

atggtagctg gtctatcctt atggatgtgc tccaatgggt cgttacaatg cagaatttgc      2700

atttaagagc tctaagttaa aatgcttctt cgtctcctat ttataatatg gtttgttatt      2760

gttaattttg ttcttgtaga agagcttaat taatcgttgt tgttatgaaa tactatttgt      2820

atgagatgaa ctggtgtaat gtaattcatt tacataagtg gagtcagaat cagaatgttt      2880

cctccataac taactagaca tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac      2940

taaaattgaa catcttttgc cacaacttta taagtggtta atatagctca aatatatggt      3000

caagttcaat agattaataa tggaaatatc agttatcgaa attcattaac aatcaactta      3060

acgttattaa ctactaattt tatatcatcc cctttgataa atgatagtac a               3111

 

<210>67

<211>3105

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

 

<400>67

agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt        60

taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa       120

atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt       180

tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca       240

aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga       300

gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa       360

aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg       420

taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta       480

aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt       540

aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct       600

atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa       660

ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc       720

cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac       780

aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa       840

atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca       900

ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag       960

agaagagact aattaattaa ttaatcatct tgagagaaaa tgattgcaat cattgtaata      1020

gcaatactgg cagcagccgg aaagtcagac aagatctgca ttgggtatca tgccaacaat      1080

tcaacaacac aggtagatac gatacttgag aagaatgtga ctgtcacaca ctcaattgaa      1140

ttgctggaaa atcagaagga agaaagattc tgcaagatat tgaacaaggc ccctctcgac      1200

ttaagggaat gtaccataga gggttggatc ttggggaatc cccaatgcga cctattgctt      1260

ggtgatcaaa gctggtcata cattgtggaa agacctactg ctcaaaacgg gatctgctac      1320

ccaggaacct taaatgaggt agaagaactg agggcactta ttggatcagg agaaagggta      1380

gagagatttg agatgtttcc ccaaagcacc tggcaaggag ttgacaccaa cagtggaaca      1440

acaagatcct gcccttattc tactggtgcg tctttctaca gaaacctcct atggataata      1500

aaaaccaaga cagcagaata tccagtaatt aagggaattt acaacaacac tggaacccag      1560

ccaatcctct atttctgggg tgtgcatcat cctcctaaca ccgacgagca agatactctg      1620

tatggctctg gtgatcgata cgttagaatg ggaactgaaa gcatgaattt tgccaagagt      1680

ccggaaattg cggcaaggcc tgctgtgaat ggacaaagag gcagaattga ttattattgg      1740

tcggttttaa aaccagggga aaccttgaat gtggaatcta atggaaatct aatcgcccct      1800

tggtatgcat acaaatttgt caacacaaat agtaaaggag ccgtcttcag gtcagattta      1860

ccaatcgaga actgcgatgc cacatgccag actattgcag gggttctaag gaccaataaa      1920

acatttcaga atgtgagtcc cctgtggata ggagaatgtc ccaaatacgt gaaaagtgaa      1980

agtctgaggc ttgcaactgg actaagaaat gttccacaga ttgaaactag aggactcttc      2040

ggagctattg cagggtttat tgaaggagga tggactggga tgatagatgg gtggtatggc      2100

tatcaccatg aaaattctca agggtcagga tatgcagcag acagagaaag cactcaaaag      2160

gctgtaaaca gaattacaaa taaggtcaat tccatcatca acaaaatgaa cacacaattt      2220

gaagctgtcg atcacgaatt ttcaaatctg gagaggagaa ttgacaatct gaacaaaaga      2280

atgcaagatg gatttctgga tgtttggaca tacaatgctg aactgttggt tcttcttgaa      2340

aacgaaagaa cactagacat gcatgacgca aatgtgaaga acctacatga aaaggtcaaa      2400

tcacaactaa gggacaatgc tacgatctta gggaatggtt gctttgaatt ttggcataag      2460

tgtgacaatg aatgcataga gtctgtcaaa aatggtacat atgactatcc caaataccag      2520

actgaaagca aattaaacag gctaaaaata gaatcagtaa agctagagaa ccttggtgtg      2580

tatcaaattc ttgccattta tagtacggta tcgagcagcc tagtgttggt agggctgatc      2640

atggcaatgg gtctttggat gtgttcaaat ggttcaatgc agtgcaggat atgtatataa      2700

gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt tattgttaat      2760

tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat ttgtatgaga      2820

tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat gtttcctcca      2880

taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa caactaaaat      2940

tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata tggtcaagtt      3000

caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa cttaacgtta      3060

ttaactacta attttatatc atcccctttg ataaatgata gtaca                      3105

 

<210>68

<211>3087

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

 

<400>68

agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt        60

taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa       120

atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt       180

tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca       240

aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga       300

gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa       360

aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg       420

taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta       480

aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt       540

aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct       600

atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa       660

ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc       720

cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac       780

aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa       840

atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca       900

ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag       960

agaagagact aattaattaa ttaatcatct tgagagaaaa tggaaacaat atcactaata      1020

actatactac tagtagtaac agcaagcaat gcagataaaa tctgcatcgg ccaccagtca      1080

acaaactcca cagaaactgt ggacacgcta acagaaacca atgttcctgt gacacatgcc      1140

aaagaattgc tccacacaga gcataatgga atgctgtgtg caacaagcct gggacatccc      1200

ctcattctag acacatgcac tattgaagga ctagtctatg gcaacccttc ttgtgacctg      1260

ctgttgggag gaagagaatg gtcctacatc gtcgaaagat catcagctgt aaatggaacg      1320

tgttaccctg ggaatgtaga aaacctagag gaactcagga cactttttag ttccgctagt      1380

tcctaccaaa gaatccaaat cttcccagac acaacctgga atgtgactta cactggaaca      1440

agcagagcat gttcaggttc attctacagg agtatgagat ggctgactca aaagagcggt      1500

ttttaccctg ttcaagacgc ccaatacaca aataacaggg gaaagagcat tcttttcgtg      1560

tggggcatac atcacccacc cacctatacc gagcaaacaa atttgtacat aagaaacgac      1620

acaacaacaa gcgtgacaac agaagatttg aataggacct tcaaaccagt gatagggcca      1680

aggccccttg tcaatggtct gcagggaaga attgattatt attggtcggt actaaaacca      1740

ggccaaacat tgcgagtacg atccaatggg aatctaattg ctccatggta tggacacgtt      1800

ctttcaggag ggagccatgg aagaatcctg aagactgatt taaaaggtgg taattgtgta      1860

gtgcaatgtc agactgaaaa aggtggctta aacagtacat tgccattcca caatatcagt      1920

aaatatgcat ttggaacctg ccccaaatat gtaagagtta atagtctcaa actggcagtc      1980

ggtctgagga acgtgcctgc tagatcaagt agaggactat ttggagccat agctggattc      2040

atagaaggag gttggccagg actagtcgct ggctggtatg gtttccagca ttcaaatgat      2100

caaggggttg gtatggctgc agatagggat tcaactcaaa aggcaattga taaaataaca      2160

tccaaggtga ataatatagt cgacaagatg aacaagcaat atgaaataat tgatcatgaa      2220

tttagtgagg ttgaaactag actcaatatg atcaataata agattgatga ccaaatacaa      2280

gacgtatggg catataatgc agaattgcta gtactacttg aaaatcaaaa aacactcgat      2340

gagcatgatg cgaacgtgaa caatctatat aacaaggtga agagggcact gggctccaat      2400

gctatggaag atgggaaagg ctgtttcgag ctataccata aatgtgatga tcagtgcatg      2460

gaaacaattc ggaacgggac ctataatagg agaaagtata gagaggaatc aagactagaa      2520

aggcagaaaa tagagggggt taagctggaa tctgagggaa cttacaaaat cctcaccatt      2580

tattcgactg tcgcctcatc tcttgtgctt gcaatggggt ttgctgcctt cctgttctgg      2640

gccatgtcca atggatcttg cagatgcaac atttgtatat aagagctcta agttaaaatg      2700

cttcttcgtc tcctatttat aatatggttt gttattgtta attttgttct tgtagaagag      2760

cttaattaat cgttgttgtt atgaaatact atttgtatga gatgaactgg tgtaatgtaa      2820

ttcatttaca taagtggagt cagaatcaga atgtttcctc cataactaac tagacatgaa      2880

gacctgccgc gtacaattgt cttatatttg aacaactaaa attgaacatc ttttgccaca      2940

actttataag tggttaatat agctcaaata tatggtcaag ttcaatagat taataatgga      3000

aatatcagtt atcgaaattc attaacaatc aacttaacgt tattaactac taattttata      3060

tcatcccctt tgataaatga tagtaca                                          3087

 

<210>69

<211>3105

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

 

<400>69

agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt        60

taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa       120

atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt       180

tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca       240

aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga       300

gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa       360

aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg       420

taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta       480

aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt       540

aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct       600

atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa       660

ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc       720

cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac       780

aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa       840

atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca       900

ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag       960

agaagagact aattaattaa ttaatcatct tgagagaaaa tgaagactat cattgctttg      1020

agctacattc tatgtctggt tttcactcaa aaacttcccg gaaatgacaa cagcacggca      1080

acgctgtgcc ttgggcacca tgcagtacca aacggaacga tagtgaaaac aatcacgaat      1140

gaccaaattg aagttactaa tgctactgag ctggttcaga gttcctcaac aggtgaaata      1200

tgcgacagtc ctcatcagat ccttgatgga gaaaactgca cactaataga tgctctattg      1260

ggagaccctc agtgtgatgg cttccaaaat aagaaatggg acctttttgt tgaacgcagc      1320

aaagcctaca gcaactgtta cccttatgat gtgccggatt atgcctccct taggtcacta      1380

gttgcctcat ccggcacact ggagtttaac aatgaaagtt tcaattggac tggagtcact      1440

caaaacggaa caagctctgc ttgcataagg agatctaata acagtttctt tagtagattg      1500

aattggttga cccacttaaa attcaaatac ccagcattga acgtgactat gccaaacaat      1560

gaaaaatttg acaaattgta catttggggg gttcaccacc cgggtacgga caatgaccaa      1620

atcttcctgt atgctcaagc atcaggaaga atcacagtct ctaccaaaag aagccaacaa      1680

actgtaatcc cgaatatcgg atctagaccc agagtaagga atatccccag cagaataagc      1740

atctattgga caatagtaaa accgggagac atacttttga ttaacagcac agggaatcta      1800

attgctccta ggggttactt caaaatacga agtgggaaaa gctcaataat gagatcagat      1860

gcacccattg gcaaatgcaa ttctgaatgc atcactccaa acggaagcat tcccaatgac      1920

aaaccattcc aaaatgtaaa caggatcaca tacggggcct gtcccagata tgttaagcaa      1980

aacactctga aattggcaac agggatgcga aatgtaccag agaaacaaac tagaggcata      2040

tttggcgcaa tcgcgggttt catagaaaat ggttgggagg gaatggtgga tggttggtat      2100

ggtttcaggc atcaaaattc tgagggaata ggacaagcag cagatctcaa aagcactcaa      2160

gcagcaatcg atcaaatcaa tgggaagctg aataggttga tcgggaaaac caacgagaaa      2220

ttccatcaga ttgaaaaaga gttctcagaa gtcgaaggga gaatccagga ccttgagaaa      2280

tatgttgagg acaccaaaat agatctctgg tcatacaacg cggagcttct tgttgccctg      2340

gagaaccaac atacaattga tctaactgac tcagaaatga acaaactgtt tgaaaaaaca      2400

aagaagcaac tgagggaaaa tgctgaggat atgggcaatg gttgtttcaa aatataccac      2460

aaatgtgaca atgcctgcat aggatcaatc agaaatggaa cttatgacca cgatgtatac      2520

agagatgaag cattaaacaa ccggttccag atcaagggcg ttgagctgaa gtcaggatac      2580

aaagattgga tactatggat ttcctttgcc atatcatgtt ttttgctttg tgttgctttg      2640

ttggggttca tcatgtgggc ctgccaaaaa ggcaacatta ggtgcaacat ttgcatttga      2700

gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt tattgttaat      2760

tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat ttgtatgaga      2820

tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat gtttcctcca      2880

taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa caactaaaat      2940

tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata tggtcaagtt      3000

caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa cttaacgtta      3060

ttaactacta attttatatc atcccctttg ataaatgata gtaca                      3105

 

<210>70

<211>3105

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

 

<400>70

agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt        60

taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa       120

atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt       180

tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca       240

aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga       300

gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa       360

aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg       420

taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta       480

aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt       540

aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct       600

atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa       660

ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc       720

cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac       780

aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa       840

atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca       900

ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag       960

agaagagact aattaattaa ttaatcatct tgagagaaaa tgaagactat cattgctttg      1020

agctacattc tatgtctggt tttcactcaa aaacttcccg gaaatgacaa cagcacggca      1080

acgctgtgcc ttgggcacca tgcagtacca aacggaacga tagtgaaaac aatcacgaat      1140

gaccaaattg aagttactaa tgctactgag ctggttcaga gttcctcaac aggtggaata      1200

tgcgacagtc ctcatcagat ccttgatgga gaaaactgca cactaataga tgctctattg      1260

ggagaccctc agtgtgatgg cttccaaaat aagaaatggg acctttttgt tgaacgcagc      1320

aaagcctaca gcaactgtta cccttatgat gtgccggatt atgcctccct taggtcacta      1380

gttgcctcat ccggcacact ggagtttaac gatgaaagtt tcaattggac tggagtcact      1440

caaaatggaa caagctctgc ttgcaaaagg agatctaata acagtttctt tagtagattg      1500

aattggttga cccacttaaa attcaaatac ccagcattga acgtgactat gccaaacaat      1560

gaaaaatttg acaaattgta catttggggg gttcaccacc cgggtacgga caatgaccaa      1620

atcttcctgc atgctcaagc atcaggaaga atcacagtct ctaccaaaag aagccaacaa      1680

actgtaatcc cgaatatcgg atctagaccc agaataagga atatccccag cagaataagc      1740

atctattgga caatagtaaa accgggagac atacttttga ttaacagcac agggaatcta      1800

attgctccta ggggttactt caaaatacga agtgggaaaa gctcaataat gagatcagat      1860

gcacccattg gcaaatgcaa ttctgaatgc atcactccaa atggaagcat tcccaatgac      1920

aaaccatttc aaaatgtaaa caggatcaca tatggggcct gtcccagata tgttaagcaa      1980

aacactctga aattggcaac agggatgcga aatgtaccag agaaacaaac tagaggcata      2040

tttggcgcaa tcgcgggttt catagaaaat ggttgggagg gaatggtgga tggttggtac      2100

ggtttcaggc atcaaaattc tgagggaata ggacaagcag cagatctcaa aagcactcaa      2160

gcagcaatca atcaaatcaa tgggaagctg aataggttga tcgggaaaac caacgagaaa      2220

ttccatcaga ttgaaaaaga gttctcagaa gtagaaggga gaatccagga cctcgagaaa      2280

tatgttgagg acactaaaat agatctctgg tcatacaacg cggagcttct tgttgccctg      2340

gagaaccaac atacaattga tctaactgac tcagaaatga acaaactgtt tgaaagaaca      2400

aagaagcaac tgagggaaaa tgctgaggat atgggcaatg gttgtttcaa aatataccac      2460

aaatgtgaca atgcctgcat aggatcaatc agaaatggaa cttatgacca tgatgtatac      2520

agagatgaag cattaaacaa ccggttccag atcaaaggcg ttgagctgaa gtcaggatac      2580

aaagattgga tactatggat ttcctttgcc atatcatgtt ttttgctttg tgttgctttg      2640

ttggggttca tcatgtgggc ctgccaaaaa ggcaacatta ggtgcaacat ttgcatttga      2700

gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt tattgttaat      2760

tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat ttgtatgaga      2820

tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat gtttcctcca      2880

taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa caactaaaat      2940

tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata tggtcaagtt      3000

caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa cttaacgtta      3060

ttaactacta attttatatc atcccctttg ataaatgata gtaca                      3105

 

<210>71

<211>3117

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

 

<400>71

agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt        60

taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa       120

atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt       180

tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca       240

aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga       300

gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa       360

aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg       420

taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta       480

aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt       540

aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct       600

atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa       660

ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc       720

cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac       780

aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa       840

atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca       900

ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag       960

agaagagact aattaattaa ttaatcatct tgagagaaaa tgaacactca aattctaata      1020

ttagccactt cggcattctt ctatgtacgt gcagataaaa tctgcctagg acatcatgct      1080

gtgtctaatg gaaccaaagt agacaccctt actgaaaaag gaatagaagt tgtcaatgca      1140

acagaaacag ttgaacaaac aaacatccct aagatctgct caaaaggaaa acagactgtt      1200

gaccttggtc aatgtggatt actagggacc gttattggtc ctccccaatg tgaccaattt      1260

cttgagttct ctgctaattt aatagttgaa agaagggaag gtaatgacat ttgttatcca      1320

ggcaaatttg acaatgaaga aacattgaga aaaatactca gaaaatccgg aggaattaaa      1380

aaggagaata tgggattcac atataccgga gtgagaacca atggagagac tagcgcatgt      1440

agaaggtcaa gatcttcctt ttatgcagag atgaaatggc ttctatccag cacagacaat      1500

gggacatttc cacaaatgac aaagtcctac aagaacacta agaaggtacc agctctgata      1560

atctggggaa tccaccactc aggatcaact actgaacaga ctagattata tggaagtggg      1620

aataaattga taacagtttg gagttccaaa taccaacaat cttttgtccc aaatcctgga      1680

ccaagaccgc aaatgaatgg tcaatcagga agaattgact ttcactggct gatgctagat      1740

cccaatgata ctgtcacttt cagttttaat ggggccttta tagcacctga ccgcgccagt      1800

tttctaagag gtaaatctct aggaatccaa agtgatgcac aacttgacaa taattgtgaa      1860

ggtgaatgct atcatattgg aggtactata attagcaact tgccctttca aaacattaat      1920

agtagggcaa tcggaaaatg ccccagatac gtgaagcaga agagcttaat gctagcaaca      1980

ggaatgaaaa atgttcctga agctcctgca cataaacaac taactcatca catgcgcaaa      2040

aaaagaggtt tatttggtgc aatagcagga ttcattgaaa atgggtggga aggattaata      2100

gacggatggt atggatataa gcatcagaat gcacaaggag aagggactgc tgcagactac      2160

aaaagtacac aatctgctat caaccaaata accggaaaat tgaacagact aatagaaaaa      2220

accaaccagc aattcgaact aatagataat gagttcaatg aaatagaaaa acaaattggc      2280

aatgttatta actggactag agattctatc atcgaagtat ggtcatataa tgcagagttc      2340

ctcgtagcag tggagaatca acacactatt gatttaactg actcagaaat gaacaaacta      2400

tatgaaaagg taagaagaca actgagagaa aatgctgagg aagatggtaa tggctgtttt      2460

gaaatattcc accaatgtga caatgattgc atggccagca ttagaaacaa cacatatgac      2520

cataaaaaat acagaaaaga ggcaatacaa aacagaatcc agattgacgc agtaaagttg      2580

agcagtggtt acaaagatat aatactttgg tttagcttcg gggcatcatg tttcttattt      2640

cttgccattg caatgggtct tgttttcata tgtataaaaa atggaaacat gcggtgcact      2700

atttgtatat aagagctcta agttaaaatg cttcttcgtc tcctatttat aatatggttt      2760

gttattgtta attttgttct tgtagaagag cttaattaat cgttgttgtt atgaaatact      2820

atttgtatga gatgaactgg tgtaatgtaa ttcatttaca taagtggagt cagaatcaga      2880

atgtttcctc cataactaac tagacatgaa gacctgccgc gtacaattgt cttatatttg      2940

aacaactaaa attgaacatc ttttgccaca actttataag tggttaatat agctcaaata      3000

tatggtcaag ttcaatagat taataatgga aatatcagtt atcgaaattc attaacaatc      3060

aacttaacgt tattaactac taattttata tcatcccctt tgataaatga tagtaca         3117

 

<210>72

<211>3162

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

 

<400>72

agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt        60

taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa       120

atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt       180

tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca       240

aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga       300

gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa       360

aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg       420

taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta       480

aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt       540

aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct       600

atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa       660

ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc       720

cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac       780

aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa       840

atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca       900

ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag       960

agaagagact aattaattaa ttaatcatct tgagagaaaa tgaaggcaat aattgtacta      1020

ctcatggtag taacatccaa tgcagatcga atctgcactg ggataacatc gtcaaactca      1080

ccacatgttg tcaaaactgc tactcaaggg gaggtcaatg tgactggtgt aataccactg      1140

acaacaacac ccaccaaatc tcattttgca aatctcaaag gaacagaaac cagagggaaa      1200

ctatgcccaa aatgcctcaa ctgcacagat ctggacgtgg ccttgggcag accaaaatgc      1260

acggggaaca taccctcggc aagagtttca atactccatg aagtcagacc tgttacatct      1320

gggtgctttc ctataatgca cgacagaaca aaaattagac agctgcctaa acttctcaga      1380

ggatacgaac atatcaggtt atcaactcat aacgttatca atgcagaaaa tgcaccagga      1440

ggaccctaca aaattggaac ctcagggtct tgccctaacg ttaccaatgg aaacggattt      1500

ttcgcaacaa tggcttgggc cgtcccaaaa aacgacaaca acaaaacagc aacaaattca      1560

ttaacaatag aagtaccata catttgtaca gaaggagaag accaaattac cgtttggggg      1620

ttccactctg ataacgaaac ccaaatggca aagctctatg gggactcaaa gccccagaag      1680

ttcacctcat ctgccaacgg agtgaccaca cattacgttt cacagattgg tggcttccca      1740

aatcaaacag aagacggagg actaccacaa agcggtagaa ttgttgttga ttacatggtg      1800

caaaaatctg ggaaaacagg aacaattacc tatcaaagag gtattttatt gcctcaaaaa      1860

gtgtggtgcg caagtggcag gagcaaggta ataaaaggat cgttgccttt aattggagaa      1920

gcagattgcc tccacgaaaa atacggtgga ttaaacaaaa gcaagcctta ctacacaggg      1980

gaacatgcaa aggccatagg aaattgccca atatgggtga aaacaccctt gaagctggcc      2040

aatggaacca aatatagacc tcctgcaaaa ctattaaagg aaaggggttt cttcggagct      2100

attgctggtt tcttagaagg aggatgggaa ggaatgattg caggttggca cggatacaca      2160

tcccatgggg cacatggagt agcggtggca gcagacctta agagcactca agaggccata      2220

aacaagataa caaaaaatct caactctttg agtgagctgg aagtaaagaa tcttcaaaga      2280

ctaagcggtg ccatggatga actccacaac gaaatactag aactagacga gaaagtggat      2340

gatctcagag ctgatacaat aagctcacaa atagaactcg cagtcctgct ttccaatgaa      2400

ggaataataa acagtgaaga tgagcatctc ttggcgcttg aaagaaagct gaagaaaatg      2460

ctgggcccct ctgctgtaga gatagggaat ggatgctttg aaaccaaaca caagtgcaac      2520

cagacctgtc tcgacagaat agctgctggt acctttgatg caggagaatt ttctctcccc      2580

acttttgatt cactgaatat tactgctgca tctttaaatg acgatggatt ggataatcat      2640

actatactgc tttactactc aactgctgcc tccagtttgg ctgtaacatt gatgatagct      2700

atctttgttg tttatatggt ctccagagac aatgtttctt gctccatctg tctataagag      2760

ctctaagtta aaatgcttct tcgtctccta tttataatat ggtttgttat tgttaatttt      2820

gttcttgtag aagagcttaa ttaatcgttg ttgttatgaa atactatttg tatgagatga      2880

actggtgtaa tgtaattcat ttacataagt ggagtcagaa tcagaatgtt tcctccataa      2940

ctaactagac atgaagacct gccgcgtaca attgtcttat atttgaacaa ctaaaattga      3000

acatcttttg ccacaacttt ataagtggtt aatatagctc aaatatatgg tcaagttcaa      3060

tagattaata atggaaatat cagttatcga aattcattaa caatcaactt aacgttatta      3120

actactaatt ttatatcatc ccctttgata aatgatagta ca                         3162

 

<210>73

<211>3159

<212>DNA

<213>人工序列

 

<220>

<223>表达盒

 

<400>73

agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt        60

taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa       120

atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt       180

tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca       240

aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga       300

gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa       360

aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg       420

taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta       480

aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt       540

aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct       600

atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa       660

ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc       720

cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac       780

aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa       840

atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca       900

ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag       960

agaagagact aattaattaa ttaatcatct tgagagaaaa tgaaggcaat aattgtacta      1020

ctcatggtag taacatccaa tgcagatcga atctgcactg gaataacatc ttcaaactca      1080

cctcatgtgg tcaaaacagc cactcaaggg gaggtcaatg tgactggtgt gataccacta      1140

acaacaacac caacaaaatc ttattttgca aatctcaaag gaacaaggac cagagggaaa      1200

ctatgcccag actgtctcaa ctgcacagat ctggatgtgg ctttgggcag accaatgtgt      1260

gtggggacca caccttcggc gaaggcttca atactccacg aagtcaaacc tgttacatcc      1320

gggtgctttc ctataatgca cgacagaaca aaaatcaggc aactacccaa tcttctcaga      1380

ggatatgaaa atatcaggct atcaacccaa aacgtcatcg atgcggaaaa ggcaccagga      1440

ggaccctaca gacttggaac ctcaggatct tgccctaacg ctaccagtaa gagcggattt      1500

ttcgcaacaa tggcttgggc tgtcccaaag gacaacaaca aaaatgcaac gaacccacta      1560

acagtagaag taccatacat ttgtacagaa ggggaagacc aaatcactgt ttgggggttc      1620

cattcagata acaaaaccca aatgaagaac ctctatggag actcaaatcc tcaaaagttc      1680

acctcatctg ctaatggagt aaccacacac tatgtttctc agattggcag cttcccagat      1740

caaacagaag acggaggact accacaaagc ggcaggattg ttgttgatta catgatgcaa      1800

aaacctggga aaacaggaac aattgtctac caaagaggtg ttttgttgcc tcaaaaggtg      1860

tggtgcgcga gtggcaggag caaagtaata aaagggtcct tgcctttaat tggtgaagca      1920

gattgccttc atgaaaaata cggtggatta aacaaaagca agccttacta cacaggagaa      1980

catgcaaaag ccataggaaa ttgcccaata tgggtgaaaa cacctttgaa gctcgccaat      2040

ggaaccaaat atagacctcc tgcaaaacta ttaaaggaaa ggggtttctt cggagctatt      2100

gctggtttcc tagaaggagg atgggaagga atgattgcag gctggcacgg atacacatct      2160

cacggagcac atggagtggc agtggcggcg gaccttaaga gtacgcaaga agctataaac      2220

aagataacaa aaaatctcaa ttctttgagt gagctagaag taaagaatct tcaaagacta      2280

agtggtgcca tggatgaact ccacaacgaa atactcgagc tggatgagaa agtggatgat      2340

ctcagagctg acactataag ctcgcaaata gaacttgcag tcttgctttc caacgaagga      2400

ataataaaca gtgaagatga gcatctattg gcacttgaga gaaaactaaa gaaaatgctg      2460

ggtccctctg ctgtagagat aggaaatgga tgcttcgaaa ccaaacacaa gtgcaaccag      2520

acctgcttag acaggatagc tgctggcacc tttaatgcag gagaattttc tctccccact      2580

tttgattcac tgaacattac tgctgcatct ttaaatgatg atggattgga taaccatact      2640

atactgctct attactcaac tgctgcttct agtttggctg taacattgat gctagctatt      2700

tttattgttt atatggtctc cagagacaac gtttcatgct ccatctgtct ataagagctc      2760

taagttaaaa tgcttcttcg tctcctattt ataatatggt ttgttattgt taattttgtt      2820

cttgtagaag agcttaatta atcgttgttg ttatgaaata ctatttgtat gagatgaact      2880

ggtgtaatgt aattcattta cataagtgga gtcagaatca gaatgtttcc tccataacta      2940

actagacatg aagacctgcc gcgtacaatt gtcttatatt tgaacaacta aaattgaaca      3000

tcttttgcca caactttata agtggttaat atagctcaaa tatatggtca agttcaatag      3060

attaataatg gaaatatcag ttatcgaaat tcattaacaa tcaacttaac gttattaact      3120

actaatttta tatcatcccc tttgataaat gatagtaca                             3159

 

<210>74

<211>565

<212>PRT

<213>人工序列

 

<220>

<223>共有序列

 

<220>

<221>misc_feature

<222>(3)..(3)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(52)..(52)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(90)..(90)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(99)..(99)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(111)..(111)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(145)..(145)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(157)..(157)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(162)..(162)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(182)..(182)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(203)..(203)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(205)..(205)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(210)..(210)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(225)..(225)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(268)..(268)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(283)..(283)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(290)..(290)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(432)..(432)

<223>X氨基酸可以是任意天然氨基酸

 

<220>

<221>misc_feature

<222>(489)..(489)

<223>X氨基酸可以是任意天然氨基酸

 

<400>74

Met Lys Xaa Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr

1               5                   10                  15

Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr

            20                  25                  30

Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn

        35                  40                  45

Leu Leu Glu Xaa Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile

    50                  55                  60

Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly

65                  70                  75                  80

Asn Pro Glu Cys Glu Leu Leu Ile Ser Xaa Glu Ser Trp Ser Tyr Ile

                85                  90                  95

Val Glu Xaa Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Xaa Phe

            100                 105                 110

Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe

        115                 120                 125

Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr

    130                 135                 140

Xaa Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Xaa Ser Ser Phe

145                 150                 155                 160

Tyr Xaa Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn

                165                 170                 175

Leu Ser Lys Ser Tyr Xaa Asn Asn Lys Glu Lys Glu Val Leu Val Leu

            180                 185                 190

Trp Gly Val His His Pro Pro Asn Ile Gly Xaa Gln Xaa Ala Leu Tyr

        195                 200                 205

His Xaa Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg

    210                 215                 220

Xaa Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu

225                 230                 235                 240

Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile

                245                 250                 255

Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Xaa Tyr Ala Phe Ala

            260                 265                 270

Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Xaa Ser Asn Ala Pro Met

        275                 280                 285

Asp Xaa Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser

    290                 295                 300

Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro

305                 310                 315                 320

Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn

                325                 330                 335

Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe

            340                 345                 350

Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His

        355                 360                 365

His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr

    370                 375                 380

Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu

385                 390                 395                 400

Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu

                405                 410                 415

Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Xaa

            420                 425                 430

Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu

        435                 440                 445

Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys

    450                 455                 460

Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys

465                 470                 475                 480

Phe Glu Phe Tyr His Lys Cys Asn Xaa Glu Cys Met Glu Ser Val Lys

                485                 490                 495

Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn

            500                 505                 510

Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln

    515                 520                 525

Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val

    530                 535                 540

Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln

545                 550                 555                 560

Cys Arg Ile Cys Ile

                565

 

<210>75

<211>565

<212>PRT

<213>流感病毒

 

<400>75

Met Lys Ala Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr

1               5                   10                  15

Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr

            20                  25                  30

Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn

        35                  40                  45

Leu Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile

    50                  55                  60

Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly

65                  70                  75                  80

Asn Pro Glu Cys Glu Leu Leu Ile Ser Lys Glu Ser Trp Ser Tyr Ile

                85                  90                  95

Val Glu Thr Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Tyr Phe

            100                 105                 110

Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe

        115                 120                 125

Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr

    130                 135                 140

Val Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Lys Ser Ser Phe

145                 150                 155                 160

Tyr Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn

                165                 170                 175

Leu Ser Lys Ser Tyr Val Asn Asn Lys Glu Lys Glu Val Leu Val Leu

            180                 185                 190

Trp Gly Val His His Pro Pro Asn Ile Gly Asn Gln Arg Ala Leu Tyr

        195                 200                 205

His Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg

    210                 215                 220

Arg Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu

225                 230                 235                 240

Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile

                245                 250                 255

Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Trp Tyr Ala Phe Ala

            260                 265                 270

Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Thr Ser Asn Ala Pro Met

        275                 280                 285

Asp Glu Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser

    290                 295                 300

Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro

305                 310                 315                 320

Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn

                325                 330                 335

Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe

            340                 345                 350

Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His

        355                 360                 365

His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr

    370                 375                 380

Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu

385                 390                 395                 400

Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu

                405                 410                 415

Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu

            420                 425                 430

Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu

        435                 440                 445

Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys

    450                 455                 460

Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys

465                 470                 475                 480

Phe Glu Phe Tyr His Lys Cys Asn Asn Glu Cys Met Glu Ser Val Lys

                485                 490                 495

Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn

            500                 505                 510

Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln

        515                 520                 525

Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val

    530                 535                 540

Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln

545                 550                 555                 560

Cys Arg Ile Cys Ile

                565

 

<210>76

<211>252

<212>PRT

<213>流感病毒

 

<400>76

Met Ser Leu Leu Thr Glu Val Glu Thr Tyr Val Leu Ser Ile Ile Pro

1               5                   10                  15

ser Gly Pro Leu Lys Ala Glu Ile Ala Gln Arg Leu Glu Asp Val Phe

            20                  25                  30

Ala Gly Lys Asn Thr Asp Leu Glu Val Leu Met Glu Trp Leu Lys Thr

        35                  40                  45

Arg Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe

    50                  55                  60

Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Gln Arg Arg Arg Phe Val

65                  70                  75                  80

Gln Asn Ala Leu Asn Gly Asn Gly Asp Pro Asn Asn Met Asp Lys Ala

                85                  90                  95

Val Lys Leu Tyr Arg Lys Leu Lys Arg Glu Ile Thr Phe His Gly Ala

            100                 105                 110

Lys Glu Ile Ser Leu Ser Tyr Ser Ala Gly Ala Leu Ala Ser Cys Met

        115                 120                 125

Gly Leu Ile Tyr Asn Arg Met Gly Ala Val Thr Thr Glu Val Ala Phe

    130                 135                 140

Gly Leu Val Cys Ala Thr Cys Glu Gln Ile Ala Asp Ser Gln His Arg

145                 150                 155                 160

Ser His Arg Gln Met Val Thr Thr Thr Asn Pro Leu Ile Arg His Glu

                165                 170                 175

Asn Arg Met Val Leu Ala Ser Thr Thr Ala Lys Ala Met Glu Gln Met

            180                 185                 190

Ala Gly Ser Ser Glu Gln Ala Ala Glu Ala Met Glu Val Ala Ser Gln

        195                 200                 205

Ala Arg Gln Met Val Gln Ala Met Arg Thr Ile Gly Thr His Pro Ser

    210                 215                 220

Ser Ser Ala Gly Leu Lys Asn Asp Leu Leu Glu Asn Leu Gln Ala Tyr

225                 230                 235                 240

Gln Lys Arg Met Gly Val Gln Met Gln Arg Phe Lys

                245                 250

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号