公开/公告号CN101883856A
专利类型发明专利
公开/公告日2010-11-10
原文格式PDF
申请/专利权人 麦迪卡格公司;
申请/专利号CN200880107072.9
申请日2008-07-11
分类号C12N15/82(20060101);A61K39/145(20060101);A61P31/16(20060101);A61P37/04(20060101);C07K14/11(20060101);C12N15/44(20060101);C12N7/01(20060101);C12N7/02(20060101);C12N15/29(20060101);
代理机构11227 北京集佳知识产权代理有限公司;
代理人顾晋伟;彭鲲鹏
地址 加拿大魁北克
入库时间 2023-12-18 01:00:57
法律状态公告日
法律状态信息
法律状态
2013-10-30
授权
授权
2010-12-22
实质审查的生效 IPC(主分类):C12N15/82 申请日:20080711
实质审查的生效
2010-11-10
公开
公开
技术领域
本发明涉及病毒样颗粒的生产。更具体而言,本发明涉及包含流感抗原的病毒样颗粒的生产。
背景技术
流感是人中由于呼吸道病毒引起的死亡的首要原因。常见的症状包括发热、喉咙疼痛、气短和肌肉酸痛等。在流感季节,流感病毒感染全世界10~20%的人口,每年导致250~500,000人死亡。
流感病毒是从哺乳动物受感染细胞质膜出芽的包膜病毒。根据所存在的核蛋白和基质蛋白抗原,流感病毒分为A型、B型或C型。根据所存在的血凝素(HA)和神经氨酸酶(NA)表面糖蛋白的组合,A型流感病毒可进一步分成若干亚型。HA支配病毒与宿主细胞结合以及穿入宿主细胞的能力。NA从宿主细胞和病毒表面蛋白的聚糖链上除去末端唾液酸残基,这防止病毒聚集并有利于病毒运动。目前,已鉴定出16种HA(H1-H16)和9种NA(N1-N9)亚型。每种A型流感病毒具有一种HA糖蛋白类型和一种NA糖蛋白类型。一般而言,每种亚型均表现出物种特异性;例如,已知所有HA和NA亚型均感染鸟类,而只有H1、H2、H3、H5、H7、H9、H10、N1、N2、N3和N7显示感染人类(Horimoto 2006;Suzuki 2005)。含有H5、H7和H9的流感病毒被认为是致病性最强的A型流感病毒形式,并且最有可能引起将来的大流行。
流感大流行通常由高传播性且致病性强的流感病毒引起,并可导致全球性疾病和死亡水平升高。在20世纪,新的A型流感亚型的出现导致四次主要的大流行。1918~1919年由H1N1病毒引起的西班牙流感在1917年至1920年之间导致世界范围内超过五千万人死亡。当前,新亚型出现的风险或者动物中特有的亚型向人传播的风险总是存在。特别受到关注的是高致病性形式的禽流感(也称作“鸟流感”),据报道其已经在全世界若干国家爆发。在许多情形下,该禽流感可在48小时内导致接近100%的死亡率。据推测,1997年在香港首次鉴定的禽流感病毒(H5N1)向其它亚洲国家和欧洲的传播与野生鸟类的迁徙模式有关。
目前对抗人中流感的方法是每年接种疫苗。疫苗通常是预测为即将到来之“流感季节”强势毒株(dominant strain)的几种毒株的组合。所述预测由世界卫生组织来协调完成。一般而言,每年生产的疫苗剂量数不足以接种全世界的人群。例如,加拿大和美国获得足以免疫其约三分之一人口的疫苗剂量,而欧盟仅有17%的人口可接种疫苗。很显然,在世界范围的流感大流行到来时,目前全世界的流感疫苗生产不能满足需求。即使所需的年产量在给定年份中可以某种方式实现,然而强势毒株每年都在变化,因此在一年的低需求时间大量储备是不切实际的。经济地、大规模地生产有效流感疫苗是政府和私营企业等非常关心的。
用于疫苗中的病毒储液是在受精的蛋中生产的。收获病毒颗粒,为了得到灭活病毒疫苗,通过去污剂干扰进行灭活。减毒活疫苗由适于在低温下生长的流感病毒制备,这意味着在正常体温下所述疫苗的毒力减弱。这样的疫苗在美国被批准用于5~49岁的个体。全病毒灭活疫苗是通过化学试剂灭活而变为无害的,并且其已在胚蛋或哺乳动物细胞培养物中生产。所有这些类型的疫苗都显示出一些特定的优点和缺点。全病毒来源之疫苗的一个优点是这种疫苗所引起的免疫类型。通常,裂解型疫苗诱导强的抗体应答,而由全病毒制得的疫苗诱导抗体(体液)应答和细胞应答。尽管功能性抗体应答是与疫苗诱导的保护作用相关的获批标准,然而越来越多的证据表明T细胞应答对流感免疫也很重要,其还可为老年人提供更好的保护。
为了诱导细胞免疫应答,开发了由全病毒制得的疫苗。由于流感毒株(例如H5N1)的高致病性,因此在BL3+设备中生产这些疫苗。对于高致病性流感毒株(例如H5N1)来说,为了降低流感毒株的致病性、使其无毒且更容易在胚蛋或哺乳动物细胞培养物中生产,一些制造商对血凝素的基因序列进行了修饰。另一些人还使用重排列(reassortant)流感株,其中血凝素和神经氨酸酶蛋白的基因序列被克隆进高产量、低致病性的流感供体株(A/PR/8/34;Quan F-S等,2007)中。尽管这些方法可产生有用的疫苗,但是它们不能提供以满足正常年份全球需求的所需规模来大量、低成本及快速生产疫苗的解决方法,并且当大流行到来时几乎必然地不能满足需求。
利用该反向遗传技术,还可能需要对HA蛋白的基因序列进行突变以使其无毒。就高致病性流感株而言,全病毒疫苗的生产需要防护(confinement)程序或者所得疫苗不与循环病毒的基因序列完全匹配。在减毒活疫苗的情形中,仍存在所施用的疫苗可与来自宿主的流感病毒重组而产生新流感病毒的风险。
尽管该方法保持了抗原表位和翻译后修饰,但是该方法存在许多缺点,包括由于使用全病毒而引起的污染风险以及取决于病毒株的可变的产量。亚最佳水平的保护可由以下原因导致:由于将病毒引入蛋中而引起的病毒遗传异质性。其它缺点包括为了获得蛋而进行大量计划,由于在纯化中使用的化学品引起的污染风险以及生产时间长。此外,对蛋中蛋白质过敏的人可能不适于接种所述疫苗。
在大流行的情形中,裂解型疫苗的生产受到需要使毒株适于在蛋中生长以及所得产量不同的限制。尽管此技术用于生产季节性疫苗已使用了多年,但是它很难在合理的时间范围内响应于大流行,并且世界范围的生产能力有限。
为了避免使用蛋,已经在哺乳动物细胞培养物中(例如在MDCK或PERC.6细胞等中)生产流感病毒。另一种方法是反向遗传方法,其中通过用病毒基因转化细胞来生产病毒。然而,这些方法也需要使用全病毒以及精准的方法和特定的培养环境。
已开发了几种作为候选重组流感疫苗的重组产物。这些方法关注A型流感病毒HA和NA蛋白的表达、制备以及纯化,包括利用杆状病毒感染的昆虫细胞(Crawford等,1999;Johansson,1999)、病毒载体和DNA疫苗构建体(Olsen等,1997)来表达这些蛋白质。
流感病毒感染的特异性是公知的。简言之,感染循环是从病毒体表面HA蛋白与含有唾液酸的细胞受体(糖蛋白和糖脂)结合开始的。NA蛋白介导对唾液酸受体的处理,病毒穿入细胞则取决于HA依赖性受体介导的内吞作用。在含有流感病毒体的内化内涵体的酸性界限内,HA蛋白发生构象变化,这导致病毒与细胞膜融合,病毒脱壳以及M2介导的从核衣壳相关核糖核蛋白(RNP)释放M1蛋白,M1蛋白迁移到细胞核内用于病毒RNA合成。抗HA蛋白的抗体通过中和病毒感染性来预防病毒感染,而抗NA蛋白的抗体介导其对病毒复制早期步骤的作用。
Crawford等(1999)公开了流感病毒HA在杆状病毒感染的昆虫细胞中的表达。所表达的蛋白质被描述为能够预防由禽类H5和H7流感亚型引起的致命性流感疾病。Johansson等(1999)教导了杆状病毒表达的流感病毒HA和NA蛋白在动物中诱导了优于常规疫苗所诱导之应答的免疫应答。杆状病毒表达的马流感病毒血凝素的免疫原性和效力可与同源DNA候选疫苗相比较(Olsen等,1997)。总之,这些数据表明,使用多种实验方法以及在不同动物模型中,可利用重组HA或NA蛋白诱导针对流感病毒攻击的高度保护。
由于先前的研究已显示表面流感病毒糖蛋白HA和NA是用于诱导针对流感病毒之保护性免疫的主要靶标,并且M1提供了用于流感病毒之细胞免疫的保守性靶标,所以新的候选疫苗可包含作为蛋白质大分子颗粒(例如病毒样颗粒(VLP))的这些病毒抗原。作为疫苗产品,VLP提供了如下优点:比亚基或重组抗原更强的免疫原性,能刺激体液和细胞免疫应答(Grgacic和Anderson,2006)。此外,含有这些流感抗原的颗粒可展示出构象表位,其诱导针对多种流感病毒株的中和抗体。
生产用于疫苗目的的非感染性流感病毒株是避免发生意外感染的一种方法。作为替代,已研究出用作培养病毒之替代物的病毒样颗粒(VLP)。VLP模拟病毒衣壳的结构,但缺少基因组,因此不能复制或提供二次感染的机会。
一些研究表明,使用哺乳动物表达质粒或杆状病毒载体,重组流感病毒蛋白在细胞培养物中自组装成VLP(Gomez-Puertas等,1999;Neumann等,2000;Latham和Galarza,2001)。Gomez-Puertas等(1999)公开了流感病毒VLP的有效形成取决于几种病毒蛋白质的表达水平。Neumann等(2000)建立了基于哺乳动物表达质粒的系统,其用于完全从克隆cDNA产生感染性流感病毒样颗粒。Latham和Galarza(2001)报道了在用共表达HA、NA、M1和M2基因的重组杆状病毒感染的昆虫细胞中形成流感病毒VLP。这些研究表明,流感病毒体蛋白质可在真核细胞中共表达后进行自组装。
Gomez-Puertas等(2000)教导,除了血凝素(HA)以外,流感病毒的基质蛋白(M1)对于VLP从昆虫细胞出芽也是必需的。然而,Chen等(2007)教导了M1可能不是VLP形成所需的,并观察到M1和VLP的有效释放需要存在HA和由NA提供的唾液酸酶活性。NA切割产生VLP之细胞表面上的糖蛋白的唾液酸,并将VLP释放到介质中。
Quan等(2007)教导了在杆状病毒表达系统(昆虫细胞)中产生的VLP疫苗诱导针对某些流感病毒株(A/PR8/34(H1N1))的保护性免疫。经观察,Quan所研究的VLP从质膜出芽,并被认为具有合适的大小和形态,与在哺乳动物系统(MDCK系统)中得到的相似。
包膜病毒可在从感染细胞“出芽”时获得脂质包膜,并且从质膜获得膜,或者从内部细胞器的质膜获得膜。流感病毒颗粒和VLP从宿主细胞的质膜出芽。例如,在哺乳动物或杆状病毒细胞系统中,流感病毒从质膜出芽(Quan等,2007)。已知仅有少数包膜病毒感染植物(例如,番茄斑萎病毒属(Topovirus)和弹状病毒属(Rhabdovirus)的成员)。在已知的植物包膜病毒中,它们的特征在于从宿主细胞的内膜出芽,而不是从质膜出芽。虽然已在植物宿主中产生了少数的重组VLP,但是它们均非源自质膜,于是提出了这样的问题——是否可以在植物中生产质膜来源的VLP(包括流感病毒VLP)。
目前的流感病毒VLP生产技术依赖于多种病毒蛋白质的共表达,这种依赖性代表了这些技术的缺点,这是因为在全世界大流行和每年流行的情形中,反应时间对于疫苗接种来说是至关重要的。为了加快疫苗的开发,需要仅依赖于表达一种病毒蛋白质的更为简单的VLP生产体系。
为了保护全世界人口免于患流感并且击退将来的大流行,疫苗生产商需要开发有效的、快速的生产疫苗制剂的方法。目前使用受精的蛋生产疫苗不能满足需求,并且生产过程长。
发明内容
本发明的一个目的是提供改进的流感病毒样颗粒(VLP)。
本发明提供了核酸,其包含编码来自包膜病毒之抗原的核苷酸序列,所述核苷酸序列与在植物中有活性的调控区有效连接。所述抗原可以是流感病毒血凝素(HA)。
本发明还提供了在植物中生产流感病毒样颗粒(VLP)的方法,其包括:
a)将与在植物中有活性的调控区有效连接的、编码来自包膜病毒之抗原(例如流感病毒血凝素(HA))的核酸导入植物或其部分中,以及
b)在允许表达所述核酸的条件下培养所述植物或其部分,从而产生VLP。
所述方法还包括收获所述植物以及从所述植物组织中纯化或分离VLP的步骤。
本发明包括上述方法,其中在导入步骤(步骤a)中,所述核酸可在植物中瞬时表达或在植物中稳定表达。此外,可使用体积排阻色谱对VLP进行纯化。
本发明还提供了病毒样颗粒(VLP),其包含流感病毒HA蛋白以及一种或多种植物脂质。
此外,本发明还涉及组合物,其包含含有流感病毒HA蛋白的有效剂量VLP、一种或多种植物脂质以及可药用载体。
本发明还涉及在植物中形成VLP的HA蛋白片段或部分。
所述VLP可包含一种或多种亚型的HA蛋白,包括H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15或H16或者其片段或部分。含有这些HA蛋白的亚型的实例包括A/新喀里多尼亚/20/99(H1N1)、A/印度尼西亚/5/2006(H5N1)、A/鸡/纽约/1995、A/银鸥/DE/677/88(H2N8)、A/得克萨斯/32/2003、A/绿头鸭/MN/33/00、A/鸭/上海/1/2000、A/针尾鸭/TX/828189/02、A/火鸡/安大略/6118/68(H8N4)、A/琵嘴鸭/伊朗/G54/03、A/鸡/德国/N/1949(H10N7)、A/鸭/英格兰/56(H11N6)、A/鸭/阿尔伯达/60/76(H12N5)、A/鸥/马里兰/704/77(H13N6)、A/绿头鸭/Gurjev/263/82、A/鸭/澳大利亚/341/83(H15N8)、A/红嘴鸥/瑞典/5/99(H16N3)、B/Lee/40、C/约翰内斯堡/66、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛3/2006(H1N1)、A/布里斯班10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、B/马来西亚/2506/2004、B/佛罗里达/4/2006、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/马/布拉格/56(H7N7)、A/香港/1073/99(H9N2)。
在本发明的一个方面中,所述HA蛋白可以是H1、H2、H3、H5、H6、H7或H9亚型。在另一方面中,所述H1蛋白可来自A/新喀里多尼亚/20/99(H1N1)、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)或A/所罗门群岛3/2006(H1N1)株。所述H3蛋白可来自A/布里斯班10/2007(H3N2)或A/威斯康星/67/2005(H3N2)株。在本发明的又一方面中,所述H2蛋白可来自A/新加坡/1/57(H2N2)株。所述H5蛋白可来自A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)或A/印度尼西亚/5/2005株。在本发明的一个方面中,所述H6蛋白可来自A/水鸭/香港/W312/97(H6N1)株。所述H7蛋白可来自A/马/布拉格/56(H7N7)株。在本发明的一个方面中,所述H9蛋白来自A/香港/1073/99(H9N2)株。在本发明的又一方面中,所述HA蛋白可来自可以是B型病毒的流感病毒,包括B/马来西亚/2506/2004或B/佛罗里达/4/2006。来自H1、H2、H3、H5、H6、H7或H9亚型的HA蛋白的氨基酸序列的实例包括SEQ ID NO:48-59。
所述流感病毒HA蛋白可以是H5(印度尼西亚)。
本发明还提供了包含编码HA蛋白之序列的核酸分子。所述核酸分子还可包含与所述编码HA蛋白之序列有效连接的一个或多个调控区。所述核酸分子可包含编码H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15或H16的序列。在本发明的一个方面中,由所述核酸分子编码的HA蛋白可以是H1、H2、H3、H5、H6、H7或H9亚型。所述核酸分子编码的H1蛋白来自A/新喀里多尼亚/20/99(H1N1)、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)或A/所罗门群岛3/2006(H1N1)株。在本发明的一个方面中,所述核酸分子编码的H3蛋白可来自A/布里斯班10/2007(H3N2)或A/威斯康星/67/2005(H3N2)株。在本发明的又一方面中,所述核酸分子编码的H2蛋白可来自A/新加坡/1/57(H2N2)株。所述核酸分子编码的H5蛋白可来自A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)或A/印度尼西亚/5/2005株。在本发明的一个方面中,所述核酸分子编码的H6蛋白可来自A/水鸭/香港/W312/97(H6N1)株。所述核酸分子编码的H7蛋白可来自A/马/布拉格/56(H7N7)株。另外,所述核酸分子编码的H9蛋白可来自A/香港/1073/99(H9N2)株。编码来自H1、H2、H3、H5、H6、H7或H9亚型的这些HA蛋白的核酸分子序列的实例包括SEQID NO:36-47和60-73。
所述核酸序列可编码流感病毒HA蛋白H5(印度尼西亚)。
可与编码HA蛋白之序列有效连接的调控区包括在植物细胞、昆虫细胞或酵母细胞中可操作的调控区。这样的调控区可包括质体蓝素调控区、核酮糖-1,5-二磷酸羧化酶/加氧酶(Ribulose 1,5-bisphosphatecarboxylase/oxygenase,RuBisCO)调控区、叶绿素a/b结合蛋白(CAB)、ST-LS1、多角体蛋白调控区或gp64调控区。其它调控区包括5’UTR、3’UTR或终止子序列。所述质体蓝素调控区可以是苜蓿质体蓝素调控区;所述5’UTR、3’UTR或终止子序列也可以是苜蓿序列。
还提供了诱导对象中针对流感病毒感染之免疫的方法,该方法包括施用含有流感病毒HA蛋白、一种或多种植物脂质和可药用载体的病毒样颗粒。所述病毒样颗粒可经口、皮内、鼻内、肌内、腹膜内、静脉内或皮下施用给对象。
本发明还涉及病毒样颗粒(VLP),其包含源于选自流感病毒、麻疹病毒、埃博拉病毒、马尔堡病毒和HIV病毒之病毒的一种或多种蛋白质,以及源于非唾液酸化宿主生产细胞的一种或多种脂质。所述HIV蛋白可以是p24、gp120或gp41;所述埃博拉病毒蛋白可以是VP30或VP35;所述马尔堡病毒蛋白可以是Gp/SGP;所述麻疹病毒蛋白可以是H蛋白或F蛋白。
另外,本发明涉及含有流感病毒HA蛋白和一种或多种宿主脂质的病毒样颗粒(VLP)。例如,如果宿主是昆虫,那么所述病毒样颗粒(VLP)可包含流感病毒HA蛋白和一种或多种昆虫脂质,或者,如果宿主是酵母,那么所述病毒样颗粒(VLP)可包含流感病毒HA蛋白和一种或多种酵母脂质。
本发明还涉及组合物,其包含两种或更多种流感毒株或亚型的VLP。所述两种或更多种亚型或毒株可选自:A/新喀里多尼亚/20/99(H1N1)、A/印度尼西亚/5/2006(H5N1)、A/鸡/纽约/1995、A/银鸥/DE/677/88(H2N8)、A/得克萨斯/32/2003、A/绿头鸭/MN/33/00、A/鸭/上海/1/2000、A/针尾鸭/TX/828189/02、A/火鸡/安大略/6118/68(H8N4)、A/琵嘴鸭/伊朗/G54/03、A/鸡/德国/N/1949(H10N7)、A/鸭/英格兰/56(H11N6)、A/鸭/阿尔伯达/60/76(H12N5)、A/鸥/马里兰/704/77(H13N6)、A/绿头鸭/Gurjev/263/82、A/鸭/澳大利亚/341/83(H15N8)、A/红嘴鸥/瑞典/5/99(H16N3)、B/Lee/40、C/约翰内斯堡/66、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛3/2006(H1N1)、A/布里斯班10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、B/马来西亚/2506/2004、B/佛罗里达/4/2006、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/马/布拉格/56(H7N7)或A/香港/1073/99(H9N2)。所述两种或更多种亚型或毒株的VLP可以大致相等的量存在;或者,一种或多种亚型或毒株可以占所存在毒株或亚型的大部分。
本发明涉及诱导动物或靶标生物中针对流感病毒感染之免疫的方法,其包括施用含有一种或多种VLP的有效剂量疫苗,所述VLP是利用非唾液酸化宿主(例如植物宿主、昆虫宿主或酵母宿主)生产的。所述疫苗可经口、皮内、鼻内、肌内、腹膜内、静脉内或皮下施用。所述靶标生物可选自人、灵长类、马、猪、鸟(禽)类、水禽、候鸟、鹌鹑、鸭、鹅、家禽、鸡、骆驼、犬科动物、狗、猫科动物、猫、虎、豹、麝猫、水貂、石貂、雪貂、宠物、家畜、小鼠、大鼠、海豹、鲸等。
本发明提供了用于在能够生产VLP的合适宿主(例如植物、昆虫或酵母)中生产含有来自不同流感毒株之血凝素(HA)的VLP的方法。在植物中生产的VLP含有植物来源的脂质,在昆虫细胞中生产的VLP含有来自昆虫细胞质膜的脂质(通常称为“昆虫脂质”),在酵母中生产的VLP含有来自酵母细胞质膜的脂质(通常称为“酵母脂质”)。
与在昆虫细胞培养物中生产VLP相比,在植物中生产这些颗粒具有若干优点。植物脂质可刺激特异性免疫细胞并增强所诱导的免疫应答。植物的膜由脂质、磷脂酰胆碱(PC)和磷脂酰乙醇胺(PE)组成,并且还含有植物以及某些细菌和原生动物所特有的鞘糖脂。鞘脂类之所以不常见的原因是,它们不是甘油酯(例如PC或PE),而是由与含有18个以上碳的脂肪酸链形成酰胺连接的长链氨基醇组成。PC和PE以及鞘糖脂可结合哺乳动物免疫细胞(例如抗原呈递细胞(APC),如树突状细胞和巨噬细胞)和另一些细胞(包括胸腺和肝脏中的B淋巴细胞和T淋巴细胞))中表达的CD1分子(Tsuji M,.2006)。此外,除了植物脂质的存在具有潜在的佐剂作用以外,植物N-聚糖促进抗原呈递细胞捕获糖蛋白抗原的能力(Saint-Jore-Dupas,2007)也可能是在植物中生产VLP的优点。
不希望受理论限制,预计由植物生产的VLP会比在其它生产体系中制得的VLP诱导出更强的免疫反应,并且与活的或减毒的全病毒疫苗诱导的免疫反应相比,由这些植物生产的VLP诱导的免疫反应会更强。
与由全病毒制得的疫苗相比,VLP具有优势,这是因为它们无感染性,因此限制性生物防范问题不再像使用感染性全病毒时那么重要,并且不是生产所必需的。由植物生产的VLP的另一优点是,允许表达系统生长在温室或田间,从而具有更显著的经济效益并适于扩大规模。
另外,植物不含有参与合成唾液酸残基以及将唾液酸残基添加到蛋白质中的酶。VLP的生产可以不需要神经氨酸酶(NA),并且不需要共表达NA或者用唾液酸酶(神经氨酸酶)处理生产细胞或提取物以确保在植物中生产VLP。
根据本发明生产的VLP不包含已知与RNA结合的M1蛋白。RNA是VLP制备物中的污染物,其在VLP产品获得监管部门审批时是不期望的。
所述发明内容不必然描述本发明的所有特征。
附图说明
通过以下描述以及参考附图,本发明的这些和其它特征会更加明显,其中:
图1A显示根据本发明的一个实施方案用于表达H1的基于苜蓿质体蓝素之表达盒的序列(SEQ ID NO:8)。下划线标示蛋白质二硫键异构酶(protein disulfide isomerase,PDI)信号肽。粗体显示用于克隆的BglII(AGATCT)和SacI(GAGCTC)限制性位点。图1B显示流感病毒血凝素的功能结构域的示意图。切割HA0后,HA1和HA2片段仍通过二硫桥结合在一起。
图2A显示被组装用于表达HA之H1亚型的质粒540的示意图。图2B显示被组装用于表达HA之H5亚型的质粒660的示意图。
图3显示来自产生血凝素H1或H5的叶的蛋白质提取物的体积排阻色谱。图3A显示H1的洗脱模式;Blue Dextran 2000(三角形)和蛋白质(菱形)。图3B显示在体积排阻色谱(S500HR珠)后H1洗脱级分的免疫检测(Western印迹;抗H1抗体)。图3C显示H5的洗脱模式;Blue Dextran 2000(三角形)和蛋白质(菱形)。图3D显示在体积排阻色谱(S500HR珠)后H5洗脱级分的免疫检测(Western印迹;抗H5抗体)。
图4显示来自体积排阻柱洗脱级分9的大的血凝素H1和H5结构的电子显微镜显微照片。图4A显示对来自H1的VLP放大50000倍,显示出存在多个相似的结构(比例尺表示200nm)。图4B显示对来自H1的VLP放大150000倍(比例尺表示100nm)。图4C显示对来自H5的VLP放大50000倍,显示出存在多个相似的结构(比例尺表示50nm)。
图5A显示H1的N末端片段序列(SEQ ID NO:1)。图5B显示H1的C末端片段(SEQ ID NO:2)。图5C显示编码H1的HA0的全长序列(SEQ ID NO:28)。
图6显示编码H5的序列,其侧翼为紧邻起始ATG上游的HindIII位点以及紧邻终止密码子(TAA)下游的SacI位点(SEQ ID NO:3)。
图7A显示引物Plasto-443c的序列(SEQ ID NO:4)。图7B显示引物SpHA(Ind)-Plasto.r的序列(SEQ ID NO:5)。图7C显示引物Plasto-SpHA(Ind).c的序列(SEQ ID NO:6)。图7D显示引物HA(Ind)-Sac.r的序列(SEQ ID NO:7)。
图8A显示HA1肽序列的氨基酸序列(SEQ ID NO:9)。图8B显示HA5肽序列的氨基酸序列(SEQ ID NO:10)。粗体指示天然信号肽。
图9显示A型流感病毒H7亚型的HA序列(SEQ ID NO:11)。
图10A显示A型流感病毒HA的H2亚型序列(SEQ ID NO:12)。图10B显示A型流感病毒HA的H3亚型序列(SEQ ID NO:13)。图10C显示A型流感病毒HA的H4亚型序列(SEQ ID NO:14)。图10D显示A型流感病毒HA的H5亚型序列(SEQ ID NO:15)。图10E显示A型流感病毒HA的H6亚型序列(SEQ ID NO:16)。图10F显示A型流感病毒HA的H8亚型序列(SEQ ID NO:17)。图10G显示A型流感病毒HA的H9亚型序列(SEQ ID NO:18)。图10H显示A型流感病毒HA的H10亚型序列(SEQ ID NO:19)。图10I显示A型流感病毒HA的H11亚型序列(SEQ ID NO:20)。图10J显示A型流感病毒HA的H12亚型序列(SEQ ID NO:21)。图10K显示A型流感病毒HA的H13亚型序列(SEQ ID NO:22)。图10L显示A型流感病毒HA的H14亚型序列(SEQ ID NO:23)。图10M显示A型流感病毒HA的H15亚型序列(SEQ ID NO:24)。图10N显示A型流感病毒HA的H16亚型序列(SEQ ID NO:25)。图10O显示B型流感病毒的HA序列(SEQID NO:26)。图10P显示C型流感病毒的HA序列(SEQ ID NO:27)。图10Q显示引物XmaI-pPlas.c的序列(SEQ ID NO:29)。图10R显示引物SacI-ATG-pPlas.r的序列(SEQ ID NO:30)。图10S显示引物SacI-PlasTer.c的序列(SEQ ID NO:31)。图10T显示引物EcoRI-PlasTer.r的序列(SEQ ID NO:32)。
图11显示本文使用的几种构建体的示意图。构建体660包含与质体蓝素启动子(Plasto)和终止子(Pter)有效连接的编码HA之H5亚型的核苷酸序列;构建体540包含编码HA的H1亚型连同苜蓿蛋白质二硫键异构酶信号肽(SP PDI)的核苷酸序列,并且其与质体蓝素启动子(Plasto)和终止子(Pter)有效连接;构建体544被组装用于表达HA的H1亚型,编码H1的核苷酸序列与苜蓿蛋白质二硫键异构酶信号肽(SP PDI)和GCN4pII亮氨酸拉链(替代H1的跨膜结构域和胞质尾)相组合并与质体蓝素启动子(Plasto)和终止子(Pter)有效连接;用于表达流感A/PR/8/34之M1编码区的构建体750与烟草蚀纹病毒(tobacco etch virus,TEV)的5’UTR相组合,并与双35S启动子和Nos终止子有效连接。
图12显示使用抗H5(越南)抗体对用构建体660转化的本塞姆氏烟草(N.benthamiana)叶蛋白质提取物中的H5进行免疫检测(泳道3)。使用来自流感病毒A/越南/1203/2004的市售H5作为检测的阳性对照(泳道1),用空载体转化的叶蛋白质提取物用作阴性对照(泳道2)。
图13显示通过体积排阻色谱对血凝素结构进行表征。利用S-500HR通过凝胶过滤分离来自产生H5、H1、可溶性H1或H1以及M1之各生物质的蛋白质提取物。还对市售的玫瑰花结形式的H1进行分级分离(H1玫瑰花结)。图13A显示用于分析相对蛋白质含量的洗脱级分(相对蛋白质水平——显示生物质分级分离的标准蛋白质洗脱模式)。标出了Blue Dextran 2000(2MDa标准参照物)的洗脱峰。图13B显示通过使用抗H5(越南)抗体(针对H5)进行免疫印迹用于分析洗脱级分中的血凝素存在情况。图13C显示用于分析针对H1之抗A型流感病毒抗体的洗脱级分。图13D显示用于分析针对可溶性H1之抗A型流感病毒抗体的洗脱级分。图13E显示用于分析针对H1玫瑰花结之抗A型流感病毒抗体的洗脱级分。图13F显示用于分析针对H1+M1之抗A型流感病毒抗体的洗脱级分。
图14显示通过蔗糖梯度离心浓缩流感病毒H5结构以及对血凝素浓缩级分进行电子显微镜检查。图14A显示由蔗糖密度梯度离心得到的级分的表征。通过利用抗H5(越南)抗体进行免疫印迹(上图)分析每一级分中H5的存在及其相对蛋白质含量和血细胞凝集能力(曲线图)。图14B显示来自蔗糖梯度离心的合并级分17、18和19的负染色透射电子显微镜检查。比例尺表示100nm。
图15显示流感病毒H5VLP的纯化。图15A显示纯化步骤和胎球蛋白亲和纯化步骤中用考马斯蓝染色的SDS-PAGE分析蛋白质含量。在纯化步骤中,泳道1,粗提物;泳道2,pH6经调节提取物;泳道3,经热处理的提取物;泳道4,经DE过滤的提取物;在胎球蛋白亲和纯化步骤中,泳道5,加样;泳道6,清洗;泳道7,洗脱(10倍浓缩)。图15B显示对纯化的H5 VLP样品的负染色透射电子显微镜检查。比例尺表示100nm。图15C显示放大的经分离H5VLP以显示结构细节。图15D显示利用考马斯染色的还原型SDS-PAGE(泳道A)以及利用针对来自A/越南/1203/2004毒株(H5N1)的HA产生的兔多克隆抗体进行的Western印迹(泳道B)显示的H5VLP产物。
图16显示A型流感病毒(A/新喀里多尼亚/20/99(H1N1))血凝素(HA)基因全长cds的核苷酸序列。GenBank登录号AY289929(SEQID NO:33)。
图17显示紫花苜蓿(Medicago sativa)的蛋白质二硫键异构酶mRNA的核苷酸序列。GenBank登录号Z11499(SEQ ID NO:34)。
图18显示A型流感病毒(A/波多黎各/8/34(H1N1))区段7全长序列的核苷酸序列。GenBank登录号NC_002016.1(SEQ ID NO:35)。
图19显示正染色透射电子显微镜所观察的产生H5之组织的VLP累积定位。CW:细胞壁,ch:叶绿体,pm:质膜,VLP:病毒样颗粒。比例尺表示100nm。
图20显示在用植物生产的流感病毒H5 VLP或重组可溶性HA接种的Balb/c小鼠中加强后14天诱导的血清抗体应答。图20(A)通过肌内注射免疫的小鼠的抗体应答。图20(B)通过鼻内施用免疫的小鼠的抗体应答。测量针对失活的H5N1全病毒(A/印度尼西亚/5/05)的抗体应答。GMT:几何平均效价。数值是每组中五只小鼠的终点效价倒数的GMT(log2)。短线表示平均偏差。与重组可溶性HA相比,*p<0.05。
图21显示在用植物生产的流感病毒H5VLP或重组可溶性HA接种的Balb/c小鼠中加强后14天的血细胞凝集抑制(hemagglutinationinhibition,HAI)抗体应答。图21(A)通过肌内注射免疫的小鼠的抗体应答。图21(B)通过鼻内施用免疫的小鼠的抗体应答。使用失活的H5N1全病毒(A/印度尼西亚/5/05)测量HAI抗体应答。GMT:几何平均效价。数值是每组中五只小鼠的终点效价倒数的GMT(log2)。短线表示平均偏差。与重组可溶性HA相比,*p<0.05,**p<0.01。
图22显示佐剂对小鼠中VLP免疫原性的作用。图22(A)明矾对通过肌内注射免疫之小鼠的作用。图22(B)壳聚糖对通过鼻内施用免疫之小鼠的作用。使用失活的H5N1全病毒(A/印度尼西亚/5/05)测量HAI抗体应答。GMT:几何平均效价。数值是每组中五只小鼠的终点效价倒数的GMT(log2)。短线表示平均偏差。与相应的重组可溶性HA相比,*p<0.05。
图23显示施用VLP的抗体应答。图23(A)通过肌内注射接种的小鼠加强后30天的抗印度尼西亚/5/05免疫球蛋白同种型。数值是每组中五只小鼠的终点效价倒数的GMT(log2)。使用失活全病毒作为涂覆剂进行ELISA。短线表示平均偏差。与相应的重组可溶性HA相比,*p<0.05,**p<0.001。图23(B)针对失活全病毒的抗体效价。所有组均与阴性对照具有统计学差异。
图24显示初次剂量后2周(第2周)、加强后14天(第5周)或加强后30天(第7周)的针对同源失活全病毒(A/印度尼西亚/5/05)的抗体效价。GMT:几何平均效价。数值是每组中五只小鼠的终点效价倒数的GMT(log2)。与重组可溶性HA相比,*p<0.05。
图25显示血清抗体的体外交叉反应性。(A)针对失活全病毒的抗体效价。(B)针对多种失活全病毒的血细胞凝集抑制效价。数值是每组中五只小鼠的终点效价倒数的GMT(log2)。短线表示平均偏差。所有组均与阴性对照具有统计学差异。与相应的重组可溶性HA相比,*p<0.05,**p<0.001。
图26显示由植物生产的H5VLP的效力。(A)用10倍LD50(4.09×105CCID50)的流感毒株A/土耳其/582/06(H5N1)攻击后小鼠的存活率。(B)攻击后免疫小鼠的体重。数值是存活小鼠的平均体重。
图27显示植物来源的流感病毒VLP的来源。(A)纯化的流感病毒VLP的极性脂质组成。将包含在相当于40μg蛋白质中的脂质从上述VLP中提取出来,通过HP-TLC进行分离,并与从高度纯化的烟草质膜(PM)中分离的脂质的迁移模式进行比较。脂质缩写如下:DGDG,双半乳糖二酰甘油;gluCER,葡萄糖神经酰胺;PA,磷酸;PC,磷脂酰胆碱;PE,磷脂酰乙醇胺;PG,磷脂酰甘油;PI,磷酯酰肌醇;PS,磷脂酰丝氨酸;SG,类固醇糖苷(Steryl-glycoside)。(B)纯化的流感病毒VLP的中性脂质组成。将包含在相当于20μg蛋白质中的脂质从上述VLP中提取出来,通过HP-TLC进行分离,并与谷固醇的迁移进行比较。(C)对纯化的VLP、来自烟草叶的高度纯化PM(PML)和BY2烟草细胞(PMBY2)的高度纯化PM中质膜标志物质子泵ATP酶(PMA)进行免疫检测。在每一泳道中加入18μg蛋白质。
图28显示克隆体774的DraIII至SacI位点之间的序列——A/布里斯班/59/2007(H1N1)的核苷酸序列(SEQ ID NO:36)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。
图29显示克隆体775的DraIII至SacI位点之间的序列——A/所罗门群岛3/2006(H1N1)的核苷酸序列(SEQ ID NO:37)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。
图30显示克隆体776的DraIII至SacI位点之间的序列——A/布里斯班10/2007(H1N1)的核苷酸序列(SEQ ID NO:38)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。
图31显示克隆体777的DraIII至SacI位点之间的序列——A/威斯康星/67/2005(H3N2)的核苷酸序列(SEQ ID NO:39)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。
图32显示克隆体778的DraIII至SacI位点之间的序列——B/马来西亚/2506/2004的核苷酸序列(SEQ ID NO:40)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。
图33显示克隆体779的DraIII至SacI位点之间的序列——B/佛罗里达/4/2006的核苷酸序列(SEQ ID NO:41)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。
图34显示克隆体780的DraIII至SacI位点之间的序列——A/新加坡/1/57(H2N2)的核苷酸序列(SEQ ID NO:42)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。
图35显示克隆体781的DraIII至SacI位点之间的序列——A/安徽/1/2005(H5N1)的核苷酸序列(SEQ ID NO:43)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。
图36显示克隆体782的DraIII至SacI位点之间的序列——A/越南/1194/2004(H5N1)的核苷酸序列(SEQ ID NO:44)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。
图37显示克隆体783的DraIII至SacI位点之间的序列——A/水鸭/香港/W312/97(H6N1)的核苷酸序列(SEQ ID NO:45)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。
图38显示克隆体784的DraIII至SacI位点之间的序列——A/马/布拉格/56(H7N7)的核苷酸序列(SEQ ID NO:46)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。
图39显示克隆体785的DraIII至SacI位点之间的序列——A/香港/1073/99(H9N2)的核苷酸序列(SEQ ID NO:47)。所述编码序列的侧翼是在5’端以DraIII限制性位点起始的质体蓝素调控区,以及3’端的终止密码子和SacI位点。限制性位点用下划线标出;ATG以粗体表示并用下划线标出。
图40A显示由克隆体774(A/布里斯班/59/2007(H1N1))翻译的多肽的氨基酸序列(SEQ ID NO:48)。克隆体774的开放阅读框从图28中所示的ATG开始。图40B显示由克隆体775(A/所罗门群岛3/2006(H1N1))翻译的多肽的氨基酸序列(SEQ ID NO:49)。克隆体775的开放阅读框从图29中所示的ATG开始。
图41A显示由克隆体776(A/布里斯班/10/2007(H3N2))翻译的多肽的氨基酸序列(SEQ ID NO:50)。克隆体776的开放阅读框从图30中所示的ATG开始。图41B显示由克隆体777(A/威斯康星/67/2005(H3N2))翻译的多肽的氨基酸序列(SEQ ID NO:51)。克隆体777的开放阅读框从图31中所示的ATG开始。
图42A显示由克隆体778(B/马来西亚/2506/2004)翻译的多肽的氨基酸序列(SEQ ID NO:52)。克隆体778的开放阅读框从图32中所示的ATG开始。图42B显示由克隆体779(B/佛罗里达/4/2006)翻译的多肽的氨基酸序列(SEQ ID NO:53)。克隆体779的开放阅读框从图33中所示的ATG开始。
图43A显示由克隆体780(A/新加坡/1/57(H2N2))翻译的多肽的氨基酸序列(SEQ ID NO:54)。克隆体780的开放阅读框从图34中所示的ATG开始。图43B显示由克隆体781(A/安徽/1/2005(H5N1))翻译的多肽的氨基酸序列(SEQ ID NO:55)。克隆体781的开放阅读框从图35中所示的ATG开始。
图44A显示由克隆体782(A/越南/1194/2004(H5N1))翻译的多肽的氨基酸序列(SEQ ID NO:56)。克隆体782的开放阅读框从图36中所示的ATG开始。图44B显示由克隆体783(A/水鸭/香港/W312/97(H6N1))翻译的多肽的氨基酸序列(SEQ ID NO:57)。克隆体783的开放阅读框从图37中所示的ATG开始。
图45A显示由克隆体784(A/马/布拉格/56(H7N7))翻译的多肽的氨基酸序列(SEQ ID NO:58)。克隆体784的开放阅读框从图38中所示的ATG开始。图45B显示由克隆体785(A/香港/1073/99(H9N2))翻译的多肽的氨基酸序列(SEQ ID NO:59)。克隆体785的开放阅读框从图39中所示的ATG开始。
图46显示在体积排阻色谱之后对由植物生产的VLP的洗脱级分进行免疫检测(Western印迹)。显示了血凝素亚型H1、H2、H5、H6和H9。在级分7-14中检出血凝素,其对应于VLP洗脱物。
图47显示来自年度流行毒株的一系列H1血凝素之表达的免疫印迹分析。将10μg和20μg蛋白质提取物分别加至泳道1和2中。
图48显示来自潜在大流行毒株的一系列H5血凝素之表达的免疫印迹分析。将10μg和20μg蛋白质提取物分别加至泳道1和2中。
图49显示来自利用AGL1/660农杆菌渗入的烟草(Nicotianatabacum)叶之蛋白质提取物中A/印度尼西亚/5/2005毒株H5的免疫印迹。对两株植物进行渗入,并将10μg和20μg来自各植物的可溶性蛋白质分别加至泳道1和2中。
图50显示血清抗体的体外交叉反应性。用植物生产的流感病毒H5 VLP(A)第一次免疫后14天以及(B)第二次加强后14天,雪貂血清中的血细胞凝集抑制(HI)效价。使用下述失活H5N1全病毒测量HAI抗体应答:A/火鸡/土耳其/1/05、A/越南/1194/04、A/安徽/5/05以及同源株A/印度尼西亚/5/05。数值是每组中五只雪貂的终点效价倒数的GMT(log2)。斜条纹—A/印度尼西亚/6/06(进化枝2.1.3);方格图案—A/火鸡/土耳其/1/05(进化枝2.2);白柱—A/越南/1194/04(进化枝1);黑柱—A/安徽/5/05。标出了响应者。短线表示平均偏差。
图51显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/印度尼西亚/5/2005(构建体#660)的H5的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。
图52显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/新喀里多尼亚/20/1999(构建体#540)的H1的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。
图53显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/布里斯班/59/2007(构建体#774)的H1的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。
图54显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/所罗门群岛/3/2006(H1N1)(构建体#775)的H1的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。
图55显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/新加坡/1/57(H2N2)(构建体#780)的H2的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。
图56显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/安徽/1/2005(H5N1)(构建体#781)的H5的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。
图57显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/越南/1194/2004(H5N1)(构建体#782)的H5的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。
图58显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/水鸭/香港/W312/97(H6N1)(构建体#783)的H6的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。
图59显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/香港/1073/99(H9N2)(构建体#785)的H9的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。
图60显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/布里斯班/10/2007(H3N2)的H3的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。
图61显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/威斯康星/67/2005(H3N2)的H3的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。
图62显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自A/马/布拉格/56(H7N7)的H7的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。
图63显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自B/马来西亚/2506/2004的HA的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。
图64显示HA表达盒的核酸序列,其含有苜蓿质体蓝素启动子和5’UTR、来自B/佛罗里达/4/2006的HA的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列。
图65显示A/新喀里多尼亚/20/99(H1N1)(由SEQ ID NO:33编码)、A/布里斯班/59/2007(H1N1)(SEQ ID NO:48)、A/所罗门群岛/3/2006(H1N1)(SEQ ID NO:49)的HA和SEQ ID NO:9的共有氨基酸序列(SEQ ID NO:74)。X1(第3位)是A或V;X2(第52位)是D或N;X3(第90位)是K或R;X4(第99位)是K或T;X5(第111位)是Y或H;X6(第145位)是V或T;X7(第154位)是E或K;X8(第161位)是R或K;X9(第181位)是V或A;X10(第203位)是D或N;X11(第205位)是R或K;X12(第210位)是T或K;X13(第225位)是R或K;X14(第268位)是W或R;X15(第283位)是T或N;X16(第290位)是E或K;X17(第432位)是I或L;X18(第489位)是N或D。
图66显示由SEQ ID NO:33编码的H1(新喀里多尼亚)(AAP34324.1)的氨基酸序列。
图67显示由SEQ ID NO:35编码的H1(波多黎各)(NC_0409878.1)的氨基酸序列。
发明详述
本发明涉及病毒样颗粒的生产。更具体而言,本发明涉及含有流感病毒抗原的病毒样颗粒的生产。
下面的描述是优选的实施方案。
本发明提供了含有编码来自包膜病毒的抗原(例如流感血凝素(HA))之核苷酸序列的核酸,其与在植物中有活性的调控区有效连接。
此外,本发明提供了在植物中生产病毒样颗粒(VLP)的方法。所述方法包括将编码抗原并与在植物中有活性之调控区有效连接的核酸导入所述植物或其部分中,以及在允许所述核酸表达的条件下培养所述植物或其部分,从而产生VLP。
VLP可由流感病毒制得,然而,VLP还可由其它质膜来源的病毒制得,包括但不限于麻疹病毒、埃博拉病毒、马尔堡病毒和HIV。
本发明包括可感染人的所有类型流感病毒的VLP,包括例如但不限于非常流行的A型(H1N1)亚型(例如A/新喀里多尼亚/20/99(H1N1))、A/印度尼西亚/5/05亚型(H5N1)(SEQ ID NO:60)以及较不常见的B型(例如SEQ ID NO:26,图10O)、C型(SEQ ID NO:27,图10P)以及从其它流感病毒亚型得到的HA。本发明中其它流感病毒亚型的VLP还包括例如A/布里斯班/59/2007(H1N1;SEQ ID NO:48)、A/所罗门群岛/3/2006(H1N1;SEQ ID NO:49)、A/新加坡/1/57(H2N2;SEQ ID NO:54)、A/安徽/1/2005(H5N1;SEQ ID NO:55)、A/越南/1194/2004(H5N1;SEQ ID NO:56)、A/水鸭/香港/W312/97(H6N1;SEQID NO:57)、A/香港/1073/99(H9N2;SEQ ID NO:59)、A/布里斯班/10/2007(H3N2;SEQ ID NO:50)、A/威斯康星/67/2005(H3N2;SEQ IDNO:51)、A/马/布拉格/56(H7N7;SEQ ID NO:58)、B/马来西亚/2506/2004(SEQ ID NO:52)或B/佛罗里达/4/2006(SEQ ID NO:53)。
本发明还涉及感染其它哺乳动物或宿主动物的流感病毒,所述哺乳动物或宿主动物为例如人、灵长类、马、猪、鸟类、禽类、水禽、候鸟、鹌鹑、鸭、鹅、家禽、鸡、骆驼、犬科动物、狗、猫科动物、猫、虎、豹、麝猫、水貂、石貂、雪貂、宠物、家畜、小鼠、大鼠、海豹、鲸等。
可在质膜来源的病毒中表达的其它抗原的非限制性实例包括HIV的衣壳蛋白p24;包膜蛋白gp120、gp41;结构蛋白VP30和VP35;丝状病毒(例如埃博拉病毒或马尔堡病毒)的Gp/SGP(糖基化内膜蛋白),或副粘病毒(例如麻疹病毒)的H蛋白以及F蛋白。
本发明还包括但不限于从细胞质膜获得脂质包膜的流感病毒来源的VLP,所述VLP蛋白在所述细胞中表达。例如,如果VLP在基于植物的系统中表达,那么VLP可从该细胞的质膜获得脂质包膜。
一般而言,术语“脂质”是指脂溶性的(亲脂性的)天然分子。更具体地,该术语还用于指脂肪酸及其衍生物(包括甘油三酯、甘油二酯和甘油单酯以及磷脂)以及其它脂溶性的含固醇的代谢物或固醇类。磷脂连同糖脂、固醇和蛋白质是所有生物膜的主要组分。磷脂的实例包括磷脂酰乙醇胺、磷脂酰胆碱、磷脂酰肌醇、磷脂酰丝氨酸等。固醇的实例包括动物固醇(例如胆固醇)和植物固醇。已经在多种植物中鉴定了超过200种的植物固醇,最常见的有菜油固醇、豆固醇、麦角固醇、菜子固醇、Δ-7-豆固醇、Δ-7-燕麦固醇、胡萝卜固醇(daunosterol)、谷固醇、24-甲基胆固醇、胆固醇或β-谷固醇。本领域技术人员应当理解,细胞质膜的脂质组成可随细胞或获得细胞之生物体的培养或生长条件而变化。
细胞膜通常包含脂双层以及各种功能的蛋白质。在脂双层中可发现局部浓缩的特定脂质,称为“脂质筏”。不希望受理论限制,脂质筏可在内吞和胞吐作用、病毒或其它感染原的进入或逸出、细胞间信号转导、与细胞或生物体的其它结构组分(例如细胞内和细胞外基质)相互作用中起重要作用。
针对流感病毒,本文所用的术语“血凝素”或“HA”是指存在于流感病毒颗粒外部的糖蛋白。HA是同三聚体I型膜糖蛋白,通常含有信号肽、HA1结构域和HA2结构域,所述HA2结构域含有C端的跨膜锚定位点以及小的胞质尾(图1B)。编码HA的核苷酸序列是公知的并且是可用的,参见例如BioDefence Public Health base(流感病毒;参见URL:biohealthbase.org)或美国国立生物技术信息中心(参见URL:ncbi.nlm.nih.gov),其均通过引用并入本文。
术语“同三聚体”或“同三聚体的”表示寡聚体由三个HA蛋白分子形成。不希望受理论限制,HA蛋白是作为约75kDa的单体前体蛋白(HA0)合成的,其在表面处组装成长形的三聚体蛋白。在三聚化发生之前,前体蛋白在保守的活化切割位点(也称为“融合肽”)处被切割成2条通过二硫键连接的多肽链——HA1和HA2(包含跨膜区)。HA1区段的长度可以为328个氨基酸,HA2区段的长度可以为221个氨基酸。尽管该切割对于病毒感染性可以是重要的,但是其对于蛋白质三聚化却不是必需的。HA插入宿主细胞的内质网(ER)膜内,信号肽切割和蛋白质糖基化是共翻译事件。正确的HA重折叠需要蛋白质糖基化以及形成6个链内二硫键。HA三聚体在顺式-和反式-高尔基体复合物内组装,跨膜结构域在三聚化加工中起作用。经菠萝蛋白酶处理的HA蛋白(缺少跨膜结构域)的晶体结构显示在流感毒株之间具有高度保守的结构。还已明确,HA在感染过程中发生重大的构象变化,这需要将前体HA0切割成2条多肽链(HA1和HA2)。HA蛋白可被加工(即包含HA1和HA2结构域),或者可以不进行加工(即包含HA0结构域)。
本发明涉及包含跨膜结构域并包含HA1和HA2结构域的HA蛋白的用途,例如所述HA蛋白可以是HA0,或是包含HA1和HA2的经加工HA。所述HA蛋白可用于利用植物、植物细胞或表达系统生产或形成VLP。
本发明的HA可得自任意亚型。例如,HA可以是H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15或H16亚型。本发明的重组HA还可包含基于本领域公知的任意血凝素序列的氨基酸序列——参见例如BioDefence Public Health base(流感病毒;参见URL:biohealthbase.org)或者美国国立生物技术信息中心(参见URL:ncbi.nlm.nih.gov)。此外,HA可基于从一种或多种新发现的或新鉴定出的流感病毒中分离出的血凝素的序列。
本发明还包括VLP,其包含得自一种或多种流感病毒亚型的HA。例如,VLP可包含来自以下亚型的一种或多种HA:H1(由SEQ IDNO:28编码)、H2(由SEQ ID NO:12编码)、H3(由SEQ ID NO:13编码)、H4(由SEQ ID NO:14编码)、H5(由SEQ ID NO:15编码)、H6(由SEQ ID NO:16编码)、H7(由SEQ ID NO:11编码)、H8(由SEQ ID NO:17编码)、H9(由SEQ ID NO:18编码)、H10(由SEQ IDNO:19编码)、H11(由SEQ ID NO:20编码)、H12(由SEQ ID NO:21编码)、H13(由SEQ ID NO:27编码)、H14(由SEQ ID NO:23编码)、H15(由SEQ ID NO:24编码)、H16(由SEQ ID NO:25编码)或其组合。来自一种或多种流感病毒亚型的一种或多种HA可以在植物或昆虫细胞内共表达,以确保所述一种或多种HA的合成导致形成含有得自一种或多种流感病毒亚型之HA组合的VLP。对HA之组合的选择可通过由VLP制得之疫苗的目的用途来确定。例如,用于接种鸟类的疫苗可包含HA亚型的任意组合,而用于接种人的VLP可包含一种或多种H1、H2、H3、H5、H7、H9、H10、N1、N2、N3和N7亚型。然而,也可根据接种用途来制备其它HA亚型的组合。
因此,本发明涉及含有一种或多种HA亚型的VLP。
本发明还提供了编码血凝素的核酸,当其在植物中表达时形成VLP。
流感病毒HA蛋白在分子量、等电点、大小、聚糖成分等方面表现出一系列相似之处和不同之处。各种血凝素的物理化学性质可用于区分在植物、昆虫细胞或酵母系统中表达的HA,并且当多于一种HA在单一系统中共表达时其可具有特殊用途。所述物理化学性质的实例示于表1中。
本发明还包括分别编码H1、H5或H7之HA的核苷酸序列SEQ IDNO:28、SEQ ID NO:3、SEQ ID NO:11;在严格杂交条件下与SEQ IDNO:28、SEQ ID NO:3、SEQ ID NO:11杂交的核苷酸序列;在严格的杂交条件下与SEQ ID NO:28、SEQ ID NO:3、SEQ ID NO:1互补序列杂交的核苷酸序列,其中所述核苷酸序列编码当表达时形成VLP的血凝素蛋白,并且当施用给对象时所述VLP诱导抗体产生。例如,所述核苷酸序列在植物细胞内表达形成VLP,所述VLP可用于产生能结合HA(包括一种或多种流感病毒类型或亚型的成熟HA、HA0、HA1或HA2)的抗体。当施用给对象时,所述VLP诱导免疫应答。
在严格杂交条件下杂交是本领域公知的(参见例如CurrentProtocols in Molecular Biology,Ausubel等编,1995及增刊;Maniatis等,Molecular Cloning(A Laboratory Manual),Cold Spring HarborLaboratory,1982;Sambrook和Russell,Molecular Cloning:ALaboratory Manual,第3版,2001;所有这些均通过引用并入本文)。所述严格杂交条件的一个实例可以是在65℃下于4×SSC中杂交约16~20小时,然后在65℃下于0.1×SSC中清洗1小时,或在65℃下于0.1×SSC中清洗两次(每次20或30分钟)。或者,一个示例性的严格杂交条件可以是在42℃下于50%甲酰胺、4×SSC中过夜(16~20小时),然后在65℃下于0.1×SSC中清洗1小时,或在65℃下于0.1×SSC中清洗2次(每次20或30分钟或者过夜(16~20小时)),或者在65℃下于Church水性磷酸盐缓冲液(7%SDS;0.5M NaPO4缓冲液pH 7.2;10mM EDTA)中杂交,在50℃下于0.1×SSC、0.1%SDS中清洗2次(每次20或30分钟),或者在65℃下于2×SSC、0.1%SDS中清洗2次(每次20或30分钟)。
另外,本发明包括核苷酸序列,其特征在于与编码H1(SEQ IDNO:28)、H5(SEQ ID NO:3)或H7(SEQ ID NO:11)之HA的核苷酸序列具有约70%、75%、80%、85%、87%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或其间任意量的序列同一性或序列相似性,其中所述核苷酸序列编码当表达时形成VLP的血凝素蛋白,并且所述VLP诱导抗体产生。例如,所述核苷酸序列在植物细胞内表达形成VLP,所述VLP可用于产生能结合HA(包括成熟HA、HA0、HA1或HA2)的抗体。当施用给对象时,所述VLP诱导免疫应答。
类似地,本发明包括与下述亚型相关的HA:H1(由SEQ ID NO:28编码)、H2(由SEQ ID NO:12编码)、H3(由SEQ ID NO:13编码)、H4(由SEQ ID NO:14编码)、H5(由SEQ ID NO:15编码)、H6(由SEQ IDNO:16编码)、H7(由SEQ ID NO:11编码)、H8(由SEQ ID NO:17编码)、H9(由SEQ ID NO:18编码)、H10(由SEQ ID NO:19编码)、H11(由SEQ ID NO:20编码)、H12(由SEQ ID NO:21编码)、H13(由SEQ IDNO:27编码)、H14(由SEQ ID NO:23编码)、H15(由SEQ ID NO:24编码)、H16(由SEQ ID NO:25编码),参见图10A至10P,以及特征在于与H1(SEQ ID NO:28)、H2(SEQ ID NO:12)、H3(SEQ ID NO:13)、H4(SEQ ID NO:14)、H5(SEQ ID NO:15)、H6(SEQ ID NO:16)、H7(SEQ ID NO:11)、H8(SEQ ID NO:17)、H9(SEQ ID NO:18)、H10(SEQ ID NO:19)、H11(SEQ ID NO:20)、H12(SEQ ID NO:21)、H13(SEQ ID NO:27)、H14(SEQ ID NO:23)、H15(SEQ ID NO:24)、H16(SEQ ID NO:25)具有约70~100%或其中任意量、80~100%或其中任意量、90~100%或其中任意量或者95~100%或其中任意量的序列同一性的核苷酸序列,其中所述核苷酸序列编码当表达时形成VLP的血凝素蛋白,并且所述VLP诱导抗体产生。例如,所述核苷酸序列在植物细胞内表达形成VLP,所述VLP可用于产生能结合HA(包括成熟HA、HA0、HA1或HA2)的抗体。当施用给对象时,所述VLP诱导免疫应答。
“免疫应答”一般是指获得性免疫系统的应答。所述获得性免疫系统通常包括体液应答和细胞介导的应答。体液应答是由B淋巴细胞谱系的细胞(B细胞)中产生的分泌型抗体所介导的免疫方面。分泌型抗体结合入侵微生物(例如病毒或细菌)表面上的抗原,标示它们以进行破坏。体液免疫一般用于指抗体产生和伴随抗体产生的过程,以及抗体的效应器功能,包括Th2细胞活化和细胞因子产生、记忆细胞形成、调理素促进吞噬作用、病原体清除等。术语“调节”等指根据通常知晓或使用的任意几种测定方法(其中一些在本文中举例说明)测定的特定应答或参数的升高或降低。
细胞介导的应答是这样的免疫应答,其不涉及抗体,而涉及巨噬细胞、自然杀伤细胞(NK)、抗原特异性细胞毒性T淋巴细胞的活化,以及多种细胞因子响应于抗原而释放。细胞介导的免疫一般用于指某些Th细胞的活化、Tc细胞的活化以及T细胞介导的应答。细胞介导的免疫在响应于病毒感染中尤为重要。
例如,可使用ELISPOT测定来测量对抗原特异性CD8+T淋巴细胞的诱导;可使用增殖测定来测量对CD4+T淋巴细胞的刺激。可使用ELISA测定来定量抗流感病毒抗体的效价;还可使用抗同种型抗体的抗体(例如抗IgG的抗体、抗IgA的抗体、抗IgE的抗体或抗IgM的抗体)来测量抗原特异性或交叉反应性抗体的同种型。实施这些测定的方法和技术是本领域中熟知的。
血细胞凝集抑制(HI或HAI)测定也可用于证明由疫苗或疫苗组合物所诱导的抗体效力可抑制由重组HA所致的血红细胞(RBC)凝集。血清样品的血细胞凝集抑制性抗体效价可利用微量滴定HAI来评估(Aymard等,1973)。可使用来自任意几个物种的红细胞,例如马、火鸡、鸡等。该测定给出有关HA三聚体在VLP表面上组装的间接信息,证实了HA抗原位点的正确展示。
交叉反应性HAI滴定还可用于证明免疫应答对与疫苗亚型相关的其它病毒株的效力。例如,来自用第一毒株的疫苗组合物(例如A/印度尼西亚5/05的VLP)免疫之对象的血清可用于利用第二株全病毒或病毒颗粒(例如A/越南/1194/2004)的HAI测定中,并且可测定HAI效价。
还可对细胞因子的存在或水平进行定量。例如,利用ELISA(例如BD Biosciences OptEIA试剂盒)测量IFN-γ和IL-4分泌细胞来表征T辅助细胞应答(Th1/Th2)。可培养从对象得到的外周血单核细胞(PBMC)或脾细胞,并分析上清。还可使用标志物特异性荧光标记和本领域公知的方法通过荧光激活细胞分选(fluorescence-activated cellsorting,FACS)对T淋巴细胞定量。
还可进行微量中和测定来表征对象中的免疫应答,参见例如Rowe等,1973的方法。可通过几种方法得到病毒中和效价,包括1):在对细胞进行结晶紫固定/着色之后,计数裂解斑(空斑测定);2)显微镜观察培养物中的细胞裂解;3)对NP病毒蛋白(与病毒感染宿主细胞有关)进行ELISA和分光光度检测。
序列同一性或序列相似性可利用核苷酸序列比较程序来确定,例如DNASIS所提供的(例如,使用但不限于下述参数:空隙罚分5、顶部对角线编号(# of top diagonal)5、固定的空隙罚分10、k元祖2、游隙10,窗口大小5)。然而,其它用于比较的序列比对方法是本领域熟知的,例如Smith & Waterman算法(1981,Adv.Appl.Math.2:482)、Needleman & Wunsch(J.Mol.Biol.48:443,1970)算法、Pearson &Lipman(1988,Proc.Nat’l.Acad.Sci.USA 85:2444)算法,以及这些算法的计算机化执行(例如GAP、BESTFIT、FASTA和BLAST)或者人工比对和目视检查。
术语“血凝素结构域”是指含有HA0结构域或者HA1及HA2结构域的肽。所述血凝素结构域不包含天然蛋白质中存在的信号肽、跨膜结构域或胞质尾。
术语“病毒样颗粒(VLP)”是指自组装并且含有结构蛋白(例如流感病毒HA蛋白)的结构。VLP通常在形态上和抗原性上与感染中产生的病毒体相似,但是缺少足以进行复制的遗传信息,因此是不具有感染性的。在一些实例中,VLP可含有一种蛋白质或多于一种蛋白质。对于含有多于一种蛋白质的VLP而言,所述蛋白质种类可来自同种病毒,或者可包含来自不同种、属、亚科或科之病毒的蛋白质(如ICTV命名法所指定)。在另一些实例中,可对VLP包含的一种或多种蛋白质的天然序列进行修饰。VLP可以在合适的宿主细胞(包括植物和昆虫宿主细胞)中产生。在从宿主细胞中提取、分离以及在合适条件下进一步纯化之后,VLP可作为完整结构被纯化。
根据本发明,由流感来源的蛋白质产生的VLP不含有M1蛋白。已知M1蛋白结合RNA(Wakefield和Brownlee,1989),RNA是VLP制备物中的污染物。当获得VLP产品的监管部门审批时,不期望存在RNA,因此不含RNA的VLP制备物可以是有利的。
本发明的VLP可以在特征在于缺少使蛋白质唾液酸化之能力(例如不含唾液酸酶)的宿主细胞中产生,所述宿主细胞例如植物细胞、昆虫细胞、真菌和其它生物(包括海绵动物、腔肠动物、环节动物、节肢动物、软体动物、线形动物(nemathelminthea)、担轮动物(trochelmintes)、扁形动物、毛颚动物、触手动物、衣原体、螺旋体、革兰氏阳性细菌、蓝细菌、古细菌,如glycoforum中所鉴定的(参见例如URL:glycoforum.gr.jp/science/word/evolution/ES-A03E.html)。如本文所述生产的VLP通常不含有神经氨酸酶(NA)。然而,如果需要包含HA和NA的VLP,可以将NA与HA共表达。
根据本发明的一些方面,在植物中生产的VLP可与植物来源的脂质复合。所述VLP可包含HA0、HA1或HA2肽。所述植物来源的脂质可以是脂双层形式,并且还可包含围绕VLP的包膜。所述植物来源的脂质可包含产生VLP之植物的质膜脂质组分,包括但不限于磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、鞘糖脂、植物固醇或其组合。植物来源的脂质还可称为“植物脂质”。植物固醇的实例是本领域公知的,包括例如豆固醇、谷固醇、24-甲基胆固醇和胆固醇,参见例如Mongrand等,2004。
可通过例如血细胞凝集测定、电子显微镜或体积排阻色谱来评估VLP的结构和大小。
对于体积排阻色谱而言,可通过以下方法从植物组织中提取全部可溶性蛋白质:将冷冻粉碎的植物材料样品在提取缓冲液中匀浆(Polytron),并通过离心除去不溶性的物质。利用PEG沉淀也可以是有益的。对可溶性蛋白质定量,并将提取物通过SephacrylTM柱。BlueDextran 2000可用作校准标准。实施色谱之后,可通过免疫印迹进一步分析级分以确定所述级分中蛋白质成分。
不希望受理论限制,HA结合来自不同动物之RBC的能力是由HA对唾液酸α2,3或α2,3的亲和力以及RBC表面上存在这些唾液酸来驱动的。马和鸟的流感病毒HA使来自所有几个物种(包括火鸡、鸡、鸭、豚鼠、人、绵羊、马和牛)的红细胞凝集;而人HA将结合火鸡、鸡、鸭、豚鼠、人和绵羊的红细胞(还参见Ito T.等,1997,Virology,卷227,493-499页;以及Medeiros R等,2001,Virology,卷289,74-85页)。不同流感株的HA的物种反应性实例显示在表2A和2B中。
表2A:所选的季节性流感株之HA所结合RBC的物种
表2B:所选的大流行流感株之HA所结合RBC的物种
本文所用的“蛋白质”一般是指通过肽键连接的氨基酸链,其可折叠成二级、三级或四级结构以获得特定的形态。或者,术语“多肽”、“肽”或“肽片段”可用在相似的语境中。
蛋白质、融合蛋白或多肽的片段或部分包括含有特定蛋白质或多肽之一部分氨基酸组成的肽或多肽,前提是当表达时所述片段可形成VLP。所述片段可以例如包含抗原区域、应激应答诱导区域或含有该蛋白质或多肽之功能结构域的区域。所述片段还可包含同一家族的蛋白质共有的区域或结构域,或者所述片段可包含足以特异性鉴别其来源的全长蛋白质的氨基酸序列。
例如,片段或部分可包含蛋白质全长的约60%至约100%或其间任意量,前提是当表达时该片段可形成VLP。例如,蛋白质全长的约60%至约100%、约70%至约100%、约80%至约100%、约90%至约100%、约95%至约100%,或其间任意量。或者,片段或部分可以取决于HA为约150至约500个氨基酸或其间任意量,前提是当表达时所述片段可形成VLP。例如,片段或部分可以取决于HA为约150至约500个氨基酸或其间任意量、约200至约500个氨基酸或其间任意量、约250至约500个氨基酸或其间任意量、约300至约500个氨基酸或其间任意量、约350至约500个氨基酸或其间任意量、约400至约500个氨基酸或其间任意量、约450至约500个氨基酸或其间任意量,前提是当表达时所述片段可形成VLP。例如,可从HA蛋白的C端、N端或者N和C端去除约5、10、20、30、40或50个氨基酸或其间任意量,前提是当表达时所述片段可形成VLP。
任意给定序列中的氨基酸编号是相对于该特定序列而言的,然而,本领域技术人员可根据结构和/或序列容易地确定序列中特定氨基酸的“等同性”。例如,如果当为了结晶而构建克隆时去除了6个N端氨基酸,那么这将改变氨基酸的具体编码标识(例如,相对于蛋白质全长而言),但是不会改变氨基酸在所述结构中的相对位置。
可使用BLAST算法(Altschul等,1990,J.Mol Biol 215:403-410)进行序列比较。BLAST检索允许将查询序列与特定的序列或序列组进行比较,或者与较大的序列文库或数据库(例如GenBank或GenPept)进行比较,并且不但鉴定具有100%同一性的序列,还鉴定同一性程度较低的序列。可使用BLAST算法比较核酸或氨基酸序列。此外,两个或更多个序列之间的同一性可通过将序列一起比对并测定序列间的同一性百分比来确定。可使用BLAST算法(例如可利用GenBank,URL:ncbi.nlm.nih.gov/cgi-bin/BLAST/,使用默认的参数:程序:blastn;数据库:nr;期望值10;过滤:默认;比对:成对比对;查询序列的遗传密码:标准(1);或者通过EMBL(URL:embl-heidelberg.de/Services/index.html)利用BLAST2,使用默认的参数:Matrix BLOSUM 62;过滤:默认;回声过滤(echofilter):打开;期望值:10;临界值:默认;链:两者;描述:50;比对:50;或利用FASTA,使用默认的参数)或人工比较序列进行比对并计算同一性百分比。
本发明描述了(但不限于)将编码HA的核酸克隆到植物表达载体中,并从适于生产疫苗的植物中生产流感病毒VLP。所述核酸的实例包括例如但不限于:流感病毒A/新喀里多尼亚/20/99(H1N1)病毒HA(例如SEQ ID NO:61)、来自A/印度尼西亚/5/05亚型(H5N1)的HA(例如SEQID NO:60)、来自A/布里斯班/59/2007(H1N1)的HA(例如SEQ ID NO:36、48、62)、来自A/所罗门群岛/3/2006(H1N1)的HA(例如SEQ ID NO:37、49、63)、来自A/新加坡/1/57(H2N2)的HA(例如SEQ ID NO:42、54、64)、来自A/安徽/1/2005(H5N1)的HA(例如SEQ ID NO:43、55、65)、来自A/越南/1194/2004(H5N1)的HA(例如SEQ ID NO:44、56、66)、来自A/水鸭/香港/W312/97(H6N1)的HA(例如SEQ ID NO:45、57、67)、来自A/香港/1073/99(H9N2)的HA(例如SEQ ID NO:47、59、68)、来自A/布里斯班/10/2007(H3N2)的HA(例如SEQ ID NO:38、50、69)、来自A/威斯康星/67/2005(H3N2)的HA(例如SEQ ID NO:39、51、70)、来自A/马/布拉格/56(H7N7)的HA(例如SEQ ID NO:46、58、71)、来自B/马来西亚/2506/2004的HA(例如SEQ ID NO:40、52、72)、来自B/佛罗里达/4/2006的HA(例如SEQ ID NO:41、53、73)。这些毒株的对应克隆或构建体编号提供在表1中。对应于SEQ ID NO:36-47的核酸序列包含质体蓝素启动子,其位于每个类型或亚型HA编码序列的上游并与其有效连接,如图28-39所示。对应于SEQ ID NO:60-73的核酸序列包含HA表达盒,其含有苜蓿质体蓝素启动子和5’UTR、HA的血凝素编码序列、苜蓿质体蓝素3’UTR和终止子序列,如图51-64所示。
所述VLP还可用于生产由重组流感病毒结构蛋白组成的试剂,其在经转化的宿主细胞(例如植物细胞或昆虫细胞)中自组装成功能性和免疫原性的同型大分子蛋白质结构(包括流感亚病毒颗粒和流感病毒VLP)。
因此,本发明提供了VLP以及通过表达单一包膜蛋白在植物表达系统中生产病毒VLP的方法。所述VLP可以是流感病毒VLP,或者是由其它质膜来源的病毒(包括但不限于麻疹病毒、埃博拉病毒、马尔堡病毒和HIV)产生的VLP。
还可使用本领域技术人员公知的来自其它包膜病毒的蛋白质,所述包膜病毒例如但不限于:丝状病毒科(例如埃博拉病毒、马尔堡病毒等)、副粘病毒科(例如麻疹病毒、腮腺炎病毒、呼吸道合胞病毒、肺病毒等)、逆转录病毒科(例如人类免疫缺陷病毒-1、人类免疫缺陷病毒-2、人T细胞白血病病毒-1等)、黄病毒科(例如西尼罗河脑炎、登革病毒、丙型肝炎病毒、黄热病毒等)、布尼病毒科(例如汉坦病毒等)、冠状病毒科(例如冠状病毒、SARS等)。可在质膜来源的病毒中表达之抗原的非限制性实例包括:HIV衣壳蛋白p24;HIV糖蛋白gp120或gp41;丝状病毒蛋白质,包括埃博拉病毒的VP30或VP35,或马尔堡病毒的Gp/SGP,或麻疹副粘病毒的H蛋白或F蛋白。例如,HIV的P24(例如GenBank编号gi:19172948)是对HIV病毒基因组gag序列(例如GenBank编号gi:9629357)进行翻译和切割而得到的蛋白质;HIV的gp120和gp41是对由HIV病毒基因组的env编码的gp160蛋白(例如GenBank编号gi:9629363)进行翻译和切割而得到的糖蛋白。埃博拉病毒的VP30(GenPept编号gi:55770813)是对埃博拉病毒基因组的vp30序列(例如GenBank编号gi:55770807)进行翻译而得到的蛋白质;埃博拉病毒的VP35(GenPept编号gi:55770809)是对埃博拉病毒基因组的vp35序列进行翻译而得到的蛋白质。马尔堡病毒的Gp/SGP(GenPept编号gi:296965)是对马尔堡病毒基因组序列(GenBank编号gi:158539108)进行翻译而得到的蛋白质。H蛋白(GenPept编号gi:9626951)是麻疹病毒基因组的H序列(GenBank编号gi:9626945)的蛋白质;F蛋白(GenPept编号gi:9626950)是麻疹病毒基因组的F序列的蛋白质。
然而,本发明方法中也可使用本领域技术人员已知的其它外壳蛋白。
因此,本发明提供了包含编码HIV-p24、HIV-gp120、HIV-gp41、埃博拉病毒-VP30、埃博拉病毒-VP35、马尔堡病毒Gp/SGP、麻疹病毒-H蛋白或-F蛋白之序列的核酸分子。所述核酸分子与在昆虫、酵母或植物细胞中或在特定植物组织中有活性的调控区有效连接。
本发明还提供了将编码HA(例如但不限于人流感病毒A/印度尼西亚/5/05病毒(H5N1)的HA)的核酸克隆到植物或昆虫表达载体(例如杆状病毒表达载体)中,并在经转化的植物细胞或经转化的昆虫细胞中产生流感候选疫苗或试剂,所述疫苗或试剂包含自组装成功能性和免疫原性同型大分子蛋白质结构(包括流感亚病毒颗粒和流感病毒VLP)的重组流感病毒结构蛋白。
可例如使用杆状病毒表达系统在合适的细胞系(例如草地贪夜蛾(Spodoptera frugiperda)细胞(如Sf-9细胞系;ATCC PTA-4047))中表达编码流感病毒亚型之HA的核酸,所述流感亚型例如但不限于A/新喀里多尼亚/20/99(H1N1)、A/印度尼西亚/5/05亚型(H5N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛/3/2006(H1N1)、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/香港/1073/99(H9N2)、A/布里斯班/10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、A/马/布拉格/56(H7N7)、B/马来西亚/2506/2004、B/佛罗里达/4/2006。还可使用其它昆虫细胞系。
或者,编码HA的核酸可在植物细胞或植物中表达。可使用HA RNA通过逆转录和聚合酶链反应(PCR)来合成编码HA的核酸。例如,所述RNA可从人流感病毒A/新喀里多尼亚/20/99(H1N1)病毒或人流感病毒A/印度尼西亚/5/05(H5N1)病毒或其它流感病毒(例如A/布里斯班/59/2007(H1N1)、A/所罗门群岛/3/2006(H1N1)、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/香港/1073/99(H9N2)、A/布里斯班/10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、A/马/布拉格/56(H7N7)、B/马来西亚/2506/2004,B/佛罗里达/4/2006)中分离,或者从被流感病毒感染的细胞中分离。对于逆转录和PCR而言,可使用特异性针对HA RNA的寡核苷酸引物,所述HA例如但不限于人流感病毒A/新喀里多尼亚/20/99(H1N1)病毒的HA序列,或人流感病毒A/印度尼西亚/5/05(H5N1)病毒的HA0序列,或来自流感病毒亚型A/布里斯班/59/2007(H1N1)、A/所罗门群岛/3/2006(H1N1)、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/香港/1073/99(H9N2)、A/布里斯班/10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、A/马/布拉格/56(H7N7)、B/马来西亚/2506/2004、B/佛罗里达/4/2006的HA序列。另外,可使用本领域技术人员已知的方法来化学合成编码HA的核酸。
根据宿主表达系统的要求,可将这些基因所得的cDNA拷贝克隆进合适的表达载体中。以下描述了用于植物的合适表达载体的实例,或者说,可利用已知的方法以及制造商说明书中提供的信息,使用杆状病毒表达载体(例如pFastBacl(InVitrogen))得到基于pFastBacl的质粒,。
本发明还涉及包含编码HA之核酸的基因构建体,如上所述,其与在植物中可用的调控元件有效连接。在植物细胞中有效并可用在本发明中的调控元件的实例包括但不限于质体蓝素调控区(US 7,125,978;其通过引用并入本文)或核酮糖-1,5-二磷酸羧化酶/加氧酶(RuBisCO;US4,962,028;其通过引用并入本文)、叶绿素a/b结合蛋白(CAB;Leutwiler等;1986;其通过引用并入本文)、ST-LS1(与光系统II的放氧复合物相关,并描述于Stockhaus等1987、1989中;其通过引用并入本文)的调控区。质体蓝素调控区的实例是包含SEQ ID NO:36的第10~85位核苷酸或SEQ ID NO:37~47任一序列中的相似区域的序列。
如果构建体在昆虫细胞中表达,在昆虫细胞中可用的调控元件的实例包括但不限于多角体蛋白启动子(Possee和Howard 1987.Nucleic AcidsResearch 15:10233-10248)、gp64启动子(Kogan等,1995.J Virology69:1452-1461)等。
因此,本发明的一个方面提供了包含调控区和编码流感病毒HA之序列的核酸。所述调控区可以是质体蓝素调控元件,所述流感病毒HA可选自包含以下的流感毒株或亚型:A/新喀里多尼亚/20/99(H1N1)、A/印度尼西亚/5/05亚型(H5N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛/3/2006(H1N1)、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/香港/1073/99(H9N2)、A/布里斯班/10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、A/马/布拉格/56(H7N7)、B/马来西亚/2506/2004、B/佛罗里达/4/2006。本文中通过SEQ ID NO:36~47举例说明了包含质体蓝素调控元件和流感病毒HA的核酸序列。
已知,当在蛋或哺乳动物细胞(例如MDCK细胞)中培养流感病毒时,或者当从被感染的对象中分离流感病毒时,流感病毒血凝素的氨基酸序列或编码它们的核酸序列可存在序列差异。这样的差异的非限制性实例在本文中举例说明,包括实施例18。此外,本领域技术人员应当认识到,由于另外的突变继续出现,因此可在来自新毒株的流感病毒血凝素中观察到其它变异。由于不同流感病毒血凝素之间的已知序列变异,本发明包括可利用任意流感病毒血凝素制备的VLP,前提是当如本文所述在宿主中表达时流感病毒血凝素形成VLP。
可使用本领域中已知的几种软件包中的任意一种例如MULTALIN(F.CORPET,1988,Nucl.Acids Res.,16(22),10881-10890)来确定序列比对和共有序列,或者可人工比对序列并测定序列之间的相似性和差异。
已深入研究了血凝素的结构,并且已知所述结构是高度保守的。在将血凝素的结构进行重叠时,观察到高度的结构保守性(rmsd<2A)。即使某些位置中的氨基酸序列可改变,仍可观察到这种结构保守性(参见例如Skehel和Wiley,2000 Ann Rev Biochem 69:531-69;Vaccaro等2005)。血凝素的区域也是非常保守的,例如:
结构域:HA0多肽被切割以提供成熟的HA。HA是同三聚体,其中每个单体包含通过一个二硫键连接的受体结合结构域(HA1)和膜锚定结构域(HA2);HA2亚基的N端20个残基还称为“HA融合结构域(或序列)”。还存在“尾”区域(被膜内部)。每种血凝素均包含这些区域或结构域。各区域或结构域的长度通常是保守的。
所有血凝素含有相同数目和位置的分子内和分子间二硫桥。参与二硫桥网络之半胱氨酸的氨基酸序列的数目和位置在HA中是保守的。举例说明特征性分子内和分子间二硫桥和其它保守氨基酸及其相对位置之结构的实例描述于例如Gamblin等2004(Science 303:1838-1842)中。示例性结构和序列包括1RVZ、1RVX、1RVT、1RV0、1RUY、1RU7,其可从蛋白质数据库(URL:www.rcsb.org)获取。
胞质尾—大多数血凝素在保守位置包含3个半胱氨酸。作为翻译后修饰,这些半胱氨酸中的一个或多个可被棕榈酸化。
流感病毒的血凝素可容忍氨基酸变异。该变异提供了不断鉴定出的新毒株。所述新毒株之间的感染性可以不同。然而,保持了血凝素三聚体的形成,其随后形成VLP。因此,本发明提供了血凝素氨基酸序列或编码血凝素氨基酸序列的核酸,其在植物中形成VLP,并包括已知的序列及其可能出现的变异序列。
图65举例说明这些已知变异的实例。该图显示下述H1N1毒株之HA的共有氨基酸序列(SEQ ID NO:74):
A/新喀里多尼亚/20/99(H1N1)(由SEQ ID NO:33编码)、A/布里斯班/59/2007(H1N1)(SEQ ID NO:48)、A/所罗门群岛/3/2006(H1N1)(SEQID NO:49)以及SEQ ID NO:9。X1(第3位)是A或V;X2(第52位)是D或N;X3(第90位)是K或R;X4(第99位)是K或T;X5(第111位)是Y或H;X6(第145位)是V或T;X7(第154位)是E或K;X8(第161位)是R或K;X9(第181位)是V或A;X10(第203位)是D或N;X11(第205位)是R或K;X12(第210位)是T或K;X13(第225位)是R或K;X14(第268位)是W或R;X15(第283位)是T或N;X16(第290位)是E或K;X17(第432位)是I或L;X18(第489位)是N或D。
作为这种变异的另一实例,A/新喀里多尼亚/20/99(H1N1)(由SEQID NO:33编码)、A/布里斯班/59/2007(H1N1)(SEQ ID NO:48)、A/所罗门群岛/3/2006(H1N1)(SEQ ID NO:49)、A/波多黎各/8/34(H1N1)之HA和SEQ ID NO:9的序列比对和共有序列示于如下表3中。
表3:所选H1N1毒株之HA的序列比对和共有序列
SEQ ID NO. 序列
1 50
75 MKAKLLVLLC TFTATYADTI CIGYHANNST DTVDTVLEKN VTVTHSVNLL
9 MKAKLLVLLC TFTATYADTI CIGYHANNST DTVDTVLEKN VTVTHSVNLL
48 MKVKLLVLLC TFTATYADTI CIGYHANNST DTVDTVLEKN VTVTHSVNLL
49 MKVKLLVLLC TFTATYADTI CIGYHANNST DTVDTVLEKN VTVTHSVNLL
76 .......... .......... .......... .......... ..........
共有序列 mkxkllvllc tftatyadti cigyhannst dtvdtvlekn vtvthsvnll
51 100
75 EDSHNGKLCL LKGIAPLQLG NCSVAGWILG NPECELLISK ESWSYIVETP
9 EDSHNGKLCL LKGIAPLQLG NCSVAGWILG NPECELLISK ESWSYIVETP
48 ENSHNGKLCL LKGIAPLQLG NCSVAGWILG NPECELLISK ESWSYIVEKP
49 EDSHNGKLCL LKGIAPLQLG NCSVAGWILG NPECELLISR ESWSYIVEKP
76 .......... .......... .......... .......... ..........
共有序列 exshngklcl lkgiaplqlg ncsvagwilg npecellis. eswsyive.p
101 150
75 NPENGTCYPG YFADYEELRE QLSSVSSFER FEIFPKESSW PNHTVTGVSA
9 NPENGTCYPG YFADYEELRE QLSSVSSFER FEIFPKESSW PNHTVTGVSA
48 NPENGTCYPG HFADYEELRE QLSSVSSFER FEIFPKESSW PNHTVTGVSA
49 NPENGTCYPG HFADYEELRE QLSSVSSFER FEIFPKESSW PNHTTTGVSA
76 .......... .......... .......... .......... ..........
共有序列 npengtcypg xfadyeelre qlssvssfer feifpkessw pnhtxtgvsa
151 200
75 SCSHNGKSSF YRNLLWLTGK NGLYPNLSKS YVNNKEKEVL VLWGVHHPPN
9 SCSHNGKSSF YRNLLWLTGK NGLYPNLSKS YVNNKEKEVL VLWGVHHPPN
48 SCSHNGESSF YRNLLWLTGK NGLYPNLSKS YANNKEKEVL VLWGVHHPPN
49 SCSHNGESSF YKNLLWLTGK NGLYPNLSKS YANNKEKEVL VLWGVHHPPN
76 .......... .......... .......... .......... ..........
共有序列 scshngxssf yxnllwltgk nglypnlsks yxnnkekevl vlwgvhhppn
201 250
75 IGNQRALYHT ENAYVSVVSS HYSRRFTPEI AKRPKVRDQE GRINYYWTLL
9 IGNQRALYHT ENAYVSVVSS HYSRRFTPEI AKRPKVRDQE GRINYYWTLL
48 IGDQKALYHT ENAYVSVVSS HYSRKFTPEI AKRPKVRDQE GRINYYWTLL
49 IGDQRALYHK ENAYVSVVSS HYSRKFTPEI AKRPKVRDQE GRINYYWTLL
76 .......... .....MSLLT EVETYVLSII PSGPLKAEIA QRLEDVFAGK
共有序列 igxqxalyhx enayvsvvss hysrxftpeI akrPkvr#qe gRi#yywtll
251 300
75 EPGDTIIFEA NGNLIAPWYA FALSRGFGSG IITSNAPMDE CDAKCQTPQG
9 EPGDTIIFEA NGNLIAPWYA FALSRGFGSG IITSNAPMDE CDAKCQTPQG
48 EPGDTIIFEA NGNLIAPRYA FALSRGFGSG IINSNAPMDK CDAKCQTPQG
49 EPGDTIIFEA NGNLIAPRYA FALSRGFGSG IINSNAPMDE CDAKCQTPQG
76 NTDLEVLMEW ...LKTRPIL SPLTKGILGF VFTLTVPSER GLQRRRFVQN
共有序列 #pgdt!ifEa ngnLiapxya faLsrGfgsg !itsnaPm#x cdakcqtpQg
301 350
75 AINSSLPFQN VHPVTIGECP KYVRSAKLRM VT.GLRNIPS IQSRGLFGAI
9 AINSSLPFQN VHPVTIGECP KYVRSAKLRM VT.GLRNIPS IQSRGLFGAI
48 AINSSLPFQN VHPVTIGECP KYVRSAKLRM VT.GLRNIPS IQSRGLFGAI
49 AINSSLPFQN VHPVTIGECP KYVRSAKLRM VT.GLRNIPS IQSRGLFGAI
76 ALNG.....N GDPNNMDKAV KLYRKLKREI TFHGAKEISL SYSAGALASC
共有序列 AiNsslpfqN vhPvtigecp KyvRsaKlrm vtxGlr#Ips iqSrGlfgai
351 400
75 AGFIEGGWTG MVDGWYGYHH QNEQGSGYAA DQKSTQNAIN GITNKVNSVI
9 AGFIEGGWTG MVDGWYGYHH QNEQGSGYAA DQKSTQNAIN GITNKVNSVI
48 AGFIEGGWTG MVDGWYGYHH QNEQGSGYAA DQKSTQNAIN GITNKVNSVI
49 AGFIEGGWTG MVDGWYGYHH QNEQGSGYAA DQKSTQNAIN GITNKVNSVI
76 MGLIYNRM.G AVTTEVAFGL VCATCEQIAD SQHRSHRQMV TTTNPLIRHE
共有序列aGfIeggwtG mVdgwyg%hh qneqgsgyAa dQkstqnain giTNkvnsvi
401 450
75 EKMNTQFTAV GKEFNKLERR MENLNKKVDD GFLDIWTYNA ELLVLLENER
9 EKMNTQFTAV GKEFNKLERR MENLNKKVDD GFLDIWTYNA ELLVLLENER
48 EKMNTQFTAV GKEFNKLERR MENLNKKVDD GFIDIWTYNA ELLVLLENER
49 EKMNTQFTAV GKEFNKLERR MENLNKKVDD GFIDIWTYNA ELLVLLENER
76 NRMVLASTTA .KAMEQMAGS SEQAAEAMEV A........S QARQMVQAMR
共有序列 #kMntqfTav gKef#k$err mE#lnkkv#d gfxdiwtyna #llv$l#neR
451 500
75 TLDFHDSNVK NLYEKVKSQL KNNAKEIGNG CFEFYHKCNN ECMESVKNGT
9 TLDFHDSNVK NLYEKVKSQL KNNAKEIGNG CFEFYHKCNN ECMESVKNGT
48 TLDFHDSNVK NLYEKVKSQL KNNAKEIGNG CFEFYHKCND ECMESVKNGT
49 TLDFHDSNVK NLYEKVKSQL KNNAKEIGNG CFEFYHKCND ECMESVKNGT
76 TIGTHPSSSA GLKNDLLENL QAYQKRMGVQ MQRFK..... ..........
共有序列TldfHdSnvk nLy#kvks#L knnaKeiGng cfeFyhkcnx ecmesvkngt
501 550
75 YDYPKYSEES KLNREKIDGV KLESMGVYQI LAIYSTVASS LVLLVSLGAI
9 YDYPKYSEES KLNREKIDGV KLESMGVYQI LAIYSTVASS LVLLVSLGAI
48 YDYPKYSEES KLNREKIDGV KLESMGVYQI LAIYSTVASS LVLLVSLGAI
49 YDYPKYSEES KLNREKIDGV KLESMGVYQI LAIYSTVASS LVLLVSLGAI
76 .......... .......... .......... .......... ..........
共有序列 ydypkysees klnrekidgv klesmgvyqi laiystvass lvllvslgai
551 566
75 SFWMCSNGSL QCRICI
9 SFWMCSNGSL QCRICI
48 SFWMCSNGSL QCRICI
49 SFWMCSNGSL QCRICI
76 ................
共有序列 sfwmcsngsl gcrici
共有序列中大写字母表示所有序列在指定位置处共有的氨基酸;小写字母表示至少一半或大部分序列共有的氨基酸;符号“!”是I或V中任意一个;符号“$”是L或M中任意一个;符号“%”是F或Y中任意一个,符号“#”是N、D、Q、E、B或Z中任意一个;符号“.”是无氨基酸(例如缺失);第3位的X是A或V中任意一个;第52位的X是E或N中任意一个;第90位的X是K或R;第99位的X是T或K;第111位的X是Y或H中任意一个;第145位的X是V或T中任意一个;第157位的X是K或E;第162位的X是R或K;第182位的X是V或A;第203位的X是N或D;第205位的X是R或K;第210位的X是T或K;第225位的X是K或Y;第333位的X是H或缺失;第433位的X是I或L;第49位的X是N或D。
作为这种变异的另一实例,A/安徽/1/2005(H5N1)(SEQ ID NO:55)、A/越南/1194/2004(H5N1)和A/印度尼西亚/5/2006(H5N1)(SEQ ID NO:10)之HA的序列比对和共有序列示于如下表4中。
表4:所选H1N1毒株之HA的序列比对和共有序列
SEQ ID NO. 序列
1 50
10 MEKIVLLLAI VSLVKSDQIC IGYHANNSTE QVDTIMEKNV TVTHAQDILE
56 MEKIVLLFAI VSLVKSDQIC IGYHANNSTE QVDTIMEKNV TVTHAQDILE
55 MEKIVLLLAI VSLVKSDQIC IGYHANNSTE QVDTIMEKNV TVTHAQDILE
共有序列 MEKIVLLlAI VSLVKSDQIC IGYHANNSTE QVDTIMEKNV TVTHAQDILE
51 100
10 KTHNGKLCDL DGVKPLILRD CSVAGWLLGN PMCDEFINVP EWSYIVEKAN
56 KTHNGKLCDL DGVKPLILRD CSVAGWLLGN PMCDEFINVP EWSYIVEKAN
55 KTHNGKLCDL DGVKPLILRD CSVAGWLLGN PMCDEFINVP EWSYIVEKAN
共有序列 KTHNGKLCDL DGVKPLILRD CSVAGWLLGN PMCDEFINVP EWSYIVEKAN
101 150
10 PTNDLCYPGS FNDYEELKHL LSRINHFEKI QIIPKSSWSD HEASSGVSSA
56 PVNDLCYPGD FNDYEELKHL LSRINHFEKI QIIPKSSWSS HEASLGVSSA
55 PANDLCYPGN FNDYEELKHL LSRINHFEKI QIIPKSSWSD HEASSGVSSA
共有序列 PxNDLCYPGx FNDYEELKHL LSRINHFEKI QIIPKSSWSd HEASsGVSSA
151 200
10 CPYLGSPSFF RNVVWLIKKN STYPTIKKSY NNTNQEDLLV LWGIHHPNDA
56 CPYQGKSSFF RNVVWLIKKN STYPTIKRSY NNTNQEDLLV LWGIHHPNDA
55 CPYQGTPSFF RNVVWLIKKN NTYPTIKRSY NNTNQEDLLI LWGIHHSNDA
共有序列 CPYqGxpSFF RNVVWLIKKN sTYPTIKrSY NNTNQEDLL! LWGIHHpNDA
201 250
10 AEQTRLYQNP TTYISIGTST LNQRLVPKIA TRSKVNGQSG RMEFFWTILK
56 AEQTKLYQNP TTYISVGTST LNQRLVPRIA TRSKVNGQSG RMEFFWTILK
55 AEQTKLYQNP TTYISVGTST LNQRLVPKIA TRSKVNGQSG RMDFFWTILK
共有序列 AEQTkLYQNP TTYIS!GTST LNQRLVPkIA TRSKVNGQSG RM#FFWTILK
251 300
10 PNDAINFESN GNFIAPEYAY KIVKKGDSAI MKSELEYGNC NTKCQTPMGA
56 PNDAINFESN GNFIAPEYAY KIVKKGDSTI MKSELEYGNC NTKCQTPMGA
55 PNDAINFESN GNFIAPEYAY KIVKKGDSAI VKSEVEYGNC NTKCQTPIGA
共有序列 PNDAINFESN GNFIAPEYAY KIVKKGDSaI mKSElEYGNC NTKCQTPmGA
301 350
10 INSSMPFHNI HPLTIGECPK YVKSNRLVLA TGLRNSPQRE SRRKKRGLFG
56 INSSMPFHNI HPLTIGECPK YVKSNRLVLA TGLRNSPQRE RRRKKRGLFG
55 INSSMPFHNI HPLTIGECPK YVKSNKLVLA TGLRNSPLRE RRRK.RGLFG
共有序列 INSSMPFHNI HPLTIGECPK YVKSNrLVLA TGLRNSPqRE rRRKkRGLFG
351 400
10 AIAGFIEGGW QGMVDGWYGY HHSNEQGSGY AADKESTQKA IDGVTNKVNS
56 AIAGFIEGGW QGMVDGWYGY HHSNEQGSGY AADKESTQKA IDGVTNKVNS
55 AIAGFIEGGW QGMVDGWYGY HHSNEQGSGY AADKESTQKA IDGVTNKVNS
共有序列 AIAGFIEGGW QGMVDGWYGY HHSNEQGSGY AADKESTQKA IDGVTNKVNS
401 450
10 IIDKMNTQFE AVGREFNNLE RRIENLNKKM EDGFLDVWTY NAELLVLMEN
56 IIDKMNTQFE AVGREFNNLE RRIENLNKKM EDGFLDVWTY NAELLVLMEN
55 IIDKMNTQFE AVGREFNNLE RRIENLNKKM EDGFLDVWTY NAELLVLMEN
共有序列 IIDKMNTQFE AVGREFNNLE RRIENLNKKM EDGFLDVWTY NAELLVLMEN
451 500
10 ERTLDFHDSN VKNLYDKVRL QLRDNAKELG NGCFEFYHKC DNECMESIRN
56 ERTLDFHDSN VKNLYDKVRL QLRDNAKELG NGCFEFYHKC DNECMESVRN
55 ERTLDFHDSN VKNLYDKVRL QLRDNAKELG NGCFEFYHKC DNECMESVRN
共有序列 ERTLDFHDSN VKNLYDKVRL QLRDNAKELG NGCFEFYHKC DNECMES!RN
501 550
10 GTYNYPQYSE EARLKREEIS GVKLESIGTY QILSIYSTVA SSLALAIMMA
56 GTYDYPQYSE EARLKREEIS GVKLESIGIY QILSIYSTVA SSLALAIMVA
55 GTYDYPQYSE EARLKREEIS GVKLESIGTY QILSIYSTVA SSLALAIMVA
共有序列 GTY#YPQYSE EARLKREEIS GVKLESIGtY QILSIYSTVA SSLALAIMvA
551 568
10 GLSLWMCSNG SLQCRICI
56 GLSLWMCSNG SLQCRICI
55 GLSLWMCSNG SLQCRICI
共有序列 GLSLWMCSNG SLQCRICI
共有序列中大写字母表示所有序列在指定位置处共有的氨基酸;小写字母表示至少一半或大部分序列共有的氨基酸;符号“!”是I或V中任意一个;符号“$”是L或M中任意一个;符号“%”是F或Y中任意一个,符号“#”是N、D、Q、E、B或Z中任意一个;第102位的X是T、V或A;第110位的X是S、D或N;第156位的X是S、K或T。
以上例举和描述的比对和共有序列是血凝素氨基酸序列中变异的非限制性实例,所述氨基酸序列可用于本发明多个实施方案中以在植物中生产VLP。
可容易地测定编码氨基酸序列的核酸,因为每种氨基酸的密码子是本领域公知的。因此,提供氨基酸序列则可得出编码它的简并核酸序列。因此,本发明提供了编码本文所述的流感毒株和亚型(例如A/新喀里多尼亚/20/99(H1N1)、A/印度尼西亚/5/2006(H5N1)、A/鸡/纽约/1995、A/银鸥/DE/677/88(H2N8)、A/得克萨斯/32/2003、A/绿头鸭/MN/33/00、A/鸭/上海/1/2000、A/针尾鸭/TX/828189/02、A/火鸡/安大略/6118/68(H8N4)、A/琵嘴鸭/伊朗/G54/03、A/鸡/德国/N/1949(H10N7)、A/鸭/英格兰/56(H11N6)、A/鸭/阿尔伯达/60/76(H12N5)、A/鸥/马里兰/704/77(H13N6)、A/绿头鸭/Gurjev/263/82、A/鸭/澳大利亚/341/83(H15N8)、A/红嘴鸥/瑞典/5/99(H16N3)、B/Lee/40、C/约翰内斯堡/66、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛3/2006(H1N1)、A/布里斯班10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、B/马来西亚/2506/2004、B/佛罗里达/4/2006、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/马/布拉格/56(H7N7)、A/香港/1073/99(H9N2))之血凝素的核酸序列以及编码上述血凝素的简并序列。
此外,可容易地测定核酸编码的氨基酸序列,因为每种氨基酸的密码子是公知的。因此,提供核酸则可得出其编码的氨基酸序列。因此,本发明提供了本文所述的流感毒株和亚型(例如A/新喀里多尼亚/20/99(H1N1)、A/印度尼西亚/5/2006(H5N1)、A/鸡/纽约/1995、A/银鸥/DE/677/88(H2N8)、A/得克萨斯/32/2003、A/绿头鸭/MN/33/00、A/鸭/上海/1/2000、A/针尾鸭/TX/828189/02、A/火鸡/安大略/6118/68(H8N4)、A/琵嘴鸭/伊朗/G54/03、A/鸡/德国/N/1949(H10N7)、A/鸭/英格兰/56(H11N6)、A/鸭/阿尔伯达/60/76(H12N5)、A/鸥/马里兰/704/77(H13N6)、A/绿头鸭/Gurjev/263/82、A/鸭/澳大利亚/341/83(H15N8)、A/红嘴鸥/瑞典/5/99(H16N3)、B/Lee/40、C/约翰内斯堡/66、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛3/2006(H1N1)、A/布里斯班10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、B/马来西亚/2506/2004、B/佛罗里达/4/2006、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/马/布拉格/56(H7N7)、A/香港/1073/99(H9N2))之血凝素的氨基酸序列。
在植物中,流感病毒VLP从质膜中出芽(参见实施例5和图19),因此,VLP的脂质组成反映了其来源。根据本发明生产的VLP包含一种或多种类型或亚型流感病毒的HA,其与植物来源的脂质复合。植物脂质可刺激特异性免疫细胞以及增强所诱导的免疫应答。植物的膜包含脂质、磷脂酰胆碱(PC)和磷脂酰乙醇胺(PE),并且还包含鞘糖脂、皂苷和植物固醇。此外,植物质膜中还存在脂质筏—这些微小区域富含鞘脂和固醇。在植物中,已知存在多种植物固醇,包括豆固醇、谷固醇、24-甲基胆固醇和胆固醇(Mongrand等,2004)。
PC和PE以及鞘糖脂可结合哺乳动物免疫细胞表达的CD1分子,所述免疫细胞例如抗原呈递细胞(APC)(例如树突状细胞和巨噬细胞)以及其它细胞包括胸腺和肝脏中的B淋巴细胞和T淋巴细胞(Tsuji M,.2006)。CD1分子在结构上与主要组织相容性复合体(MHC)I类分子相似,其作用是将糖脂抗原呈递给NKT细胞(自然杀伤T细胞)。活化后,NKT细胞激活先天免疫细胞(例如NK细胞和树突状细胞)并且还激活获得性免疫细胞(例如产生抗体的B细胞和T细胞)。
在质膜中可发现多种植物固醇—该特异性组成可因物种、生长条件、营养源或病原体状态而异(以上因素仅为举例说明)。一般而言,β-谷固醇是最丰富的植物固醇。
存在于与脂双层(例如质膜来源的包膜)复合的流感病毒VLP中的植物固醇可提供有利的疫苗组合物。不希望受理论限制,与脂双层(例如质膜来源的包膜)复合的由植物生产的VLP可诱导比在其它表达系统中制得的VLP更强的免疫反应,并且可与由活的或减毒的全病毒疫苗诱导的免疫反应相似。
因此,在一些实施方案中,本发明提供了与植物来源之脂双层复合的VLP。在一些实施方案中,所述植物来源的脂双层可包含VLP的包膜。
在植物内生产的VLP可诱导含有植物特异性N-聚糖的HA。因此,本发明还提供了包含具有植物特异性N-聚糖之HA的VLP。
此外,植物中N-聚糖的修饰是公知的(参见例如U.S.60/944,344,其通过引用并入本文),并且可产生含有经修饰N-聚糖的HA。可得到包含经修饰糖基化模式(例如岩藻糖基化减少、木糖基化减少、或二者均减少)之N-聚糖的HA,或者可得到含有经修饰糖基化模式的HA,其中蛋白质缺少岩藻糖基化、木糖基化或两者皆缺少,并包含增加的半乳糖基化。此外,与表达HA的野生型植物相比,翻译后修饰的调节(例如末端添加半乳糖)可导致所表达HA的岩藻糖基化和木糖基化降低。
例如(但不视为限制),合成具有经修饰糖基化模式的HA可通过使目的蛋白质与编码β-1,4-半乳糖基转移酶(GalT)(例如但不限于哺乳动物GalT或人GalT,然而,也可以使用其它来源的GalT)的核苷酸序列共表达来实现。还可将GalT的催化结构域与N-乙酰氨基葡萄糖基转移酶(GNT1)的CTS结构域(即胞质尾、跨膜结构域、主干区)融合以产生GNT1-GalT杂合酶,并且该杂合酶可与HA共表达。HA还可与编码N-乙酰氨基葡萄糖基转移酶III(GnT-III)(例如但不限于哺乳动物GnT-III或人GnT-III,还可使用其它来源的GnT-III)的核苷酸序列共表达。另外,还可使用包含与GnT-III融合的GNT1之CTS的GNT1-GnT-III杂合酶。
因此,本发明还包括含有HA的VLP,所述HA具有经修饰的N-聚糖。
不希望受理论限制,HA上存在植物N-聚糖可通过促进抗原呈递细胞与HA的结合来刺激免疫应答。Saint-jore-Dupas等(2007)已提出使用植物N-聚糖来刺激免疫应答。此外,VLP的构象对于抗原呈递可以是有利的,并且当与植物来源的脂质层复合时增强VLP的佐剂作用。
“调控区”、“调控元件”或“启动子”意指通常(但不总是)位于基因的蛋白质编码区上游的一部分核酸,其可包括DNA或RNA或者DNA和RNA两者。当调控区有活性并与目的基因有效结合或有效连接时,可导致所述目的基因的表达。调控元件可以介导器官特异性,或控制发育基因或时序基因的活化。“调控区”包括启动子元件、表现出启动子基础活性的核心启动子元件、可响应于外部刺激而诱导的元件、介导启动子活性的元件(例如负调控元件或转录增强子)。本文所用的“调控区”还包括在转录后具有活性的元件,例如调节基因表达的调控元件(例如翻译增强子和转录增强子、翻译抑制子和转录抑制子)、上游激活序列以及mRNA不稳定性决定子(mRNA instability determinant)。这后几种元件中有几种可位于编码区附近。
在本公开内容中,术语“调控元件”或“调控区”一般是指通常(但不总是)位于结构基因编码序列上游(5’)的DNA序列,其通过识别RNA聚合酶和/或转录所需的其它因子来控制编码区在特定位点起始表达。然而,应当理解的是,位于内含子中或序列3’端的其它核苷酸序列也可有助于调节目的编码区的表达。识别RNA聚合酶或其它转录因子以确保在特定位点起始的调控元件的一个实例是启动子元件。大多数(但不是全部)真核生物启动子元件包含TATA盒,其是由腺苷和胸苷核苷酸碱基对组成的保守核酸序列,通常位于转录起始位点上游约25个碱基对处。启动子元件包含负责起始转录的基础启动子元件以及修饰基因表达的其它调控元件(如上文所述)。
存在几种类型的调控区,包括受发育调节的、诱导型的或组成型的调控区。受发育调节的调控区或对所控制基因的差异性表达进行控制的调控区在特定器官或器官之组织中、在发育过程中的特定时间在所述器官或组织中被活化。然而,受发育调节的一些调控区也可偏好性地在某些器官或组织的特定发育阶段具有活性,它们还可以以受发育调节的方式具有活性,或在所述植物的其它器官或组织内具有基础水平的活性。组织特异性调控区(例如参见特异性调控区)的实例包括napin启动子和cruciferin启动子(Rask等,1998,J.Plant Physiol.152:595-599;Bilodeau等,1994,Plant Cell 14:125-130)。叶特异性启动子的实例包括质体蓝素启动子(图1b或SEQ ID NO:23),US 7,125,978,其通过引用并入本文。
诱导型调控区是能够响应于诱导物而直接或间接激活一种或多种DNA序列或基因之转录的调控区。当不存在诱导物时,所述DNA序列或基因不会被转录。通常,特异性结合诱导型调控区以激活转录的蛋白因子可以无活性形式存在,然后通过诱导物直接或间接转化成活性形式。然而,也可以不存在蛋白因子。所述诱导物可以是化学剂,例如蛋白质、代谢物、生长调节剂、除草剂或酚类化合物,或通过加热、致冷、盐或毒性元素直接施加的生理胁迫;或通过病原体或致病剂(例如病毒)的作用间接产生的生理胁迫。可通过向细胞或植物外部施加诱导物(例如通过喷雾、浇水、加热或类似方法)使含有诱导型调控区的植物细胞暴露于诱导物。诱导型调控元件可来源于植物基因或非植物基因(例如Gatz,C.和Lenk,I.R.P.,1998,Trends Plant Sci.3,352-358,其通过引用并入本文)。可能的诱导型启动子的实例包括但不限于四环素诱导型启动子(Gatz,C.,1997,Ann.Rev.Plant Physiol.Plant Mol.Biol.48,89-108,其通过引用并入本文)、类固醇诱导型启动子(Aoyama,T.和Chua,N.H.,1997,Plant J.2,397-404,其通过引用并入本文)和乙醇诱导型启动子(Salter,M.G.等,1998,Plant Journal16,127-132;Caddick,M.X.等,1998,Nature Biotech.16,177-180,其通过引用并入本文)、细胞分裂素诱导型IB6和CKI1基因(Brandstatter,I.和Kieber,J.J.,1998,Plant Cell 10,1009-1019;Kakimoto,T.,1996,Science274,982-985,其通过引用并入本文)以及生长素诱导型元件DR5(Ulmasov,T.等,1997,Plant Cell 9,1963-1971,其通过引用并入本文)。
组成型调控区指导基因在植物各部分以及整个植物发育过程中持续表达。已知的组成型调控元件的实例包括与以下转录物相关的启动子:CaMV 35S转录物(Odell等,1985,Nature,313:810-812)、水稻肌动蛋白1(Zhang等,1991,Plant Cell,3:1155-1165)、肌动蛋白2(An等,1996,PlantJ.,10:107-121)或tms 2(U.S.5,428,147,其通过引用并入本文)以及磷酸丙糖异构酶1基因(Xu等,1994,Plant Physiol.106:459-467)、玉米泛素1基因(Cornejo等,1993,Plant Mol.Biol.29:637-646)、拟南芥泛素1和6基因(Holtorf等,1995,Plant Mol.Biol.29:637-646)、烟草翻译起始因子4A基因(Mandel等,1995,Plant Mol.Biol.29:995-1004)。本文所用的术语“组成型”不一定是指受所述组成型调控区控制的基因在所有细胞类型中以相同水平表达,而是指所述基因在多种细胞类型中表达,即使常常观察到不同的丰度。
“有效连接”意指特定序列(例如调控元件与目的编码区)直接或间接地相互作用以实现预定功能(例如介导或调节基因表达)。有效连接的序列之间的相互作用可例如通过与所述有效连接之序列相互作用的蛋白质来介导。
本发明的一种或多种核苷酸序列可在由本发明的核苷酸序列、构建体或载体转化的任意合适的植物宿主中表达。合适宿主的实例包括但不限于农作物,包括苜蓿、油菜、芸苔属物种、玉米、烟草属物种、苜蓿、马铃薯、人参、豌豆、燕麦、水稻、大豆、小麦、大麦、向日葵和棉花等。
本发明的一种或多种嵌合基因构建体还可包含3’非翻译区。3’非翻译区是指这样的基因部分,其包含含有多腺苷酸化信号和能够影响mRNA加工或基因表达之任意其它调控信号的DNA区段。所述多腺苷酸化信号的特征一般在于向mRNA前体的3’端添加多腺苷酸链。多腺苷酸化信号常通过存在经典形式的5’AATAAA-3’同源物来鉴定,但是也会出现变异。需要时,本发明的一种或多种嵌合基因构建体还可包含另外的增强子(翻译增强子或转录增强子)。这些增强子区域是本领域技术人员公知的,并且可包括ATG起始密码子和邻近序列。所述起始密码子必须在编码序列的读码框内,以确保翻译出完整序列。
合适的3’区的非限制性实例是含有以下基因的多腺苷酸化信号的3’经转录的非翻译区:农杆菌致瘤(Ti)质粒基因(例如胭脂碱合酶(Nos基因))以及植物基因(例如大豆贮藏蛋白基因)、核酮糖-1,5-二磷酸羧化酶的小亚基基因(ssRUBISCO;US 4,962,028,其通过引用并入本文)、用于调节质体蓝素表达的启动子(Pwee和Gray 1993,其通过引用并入本文)。质体蓝素启动子的实例描述于US 7,125,978(其通过引用并入本文)中。
如本文所述,已发现包含增强子(经证实其在叶表达中具有效力)序列的启动子在瞬时表达中有效。不希望受理论限制,通过将光合作用基因的上游调控元件与核基质结合可介导强的表达。例如,可使用豌豆质体蓝素基因的翻译起始位点至-784位来介导强的报告基因表达。
为了帮助鉴定转化植物细胞,可进一步处理本发明的构建体使其包含植物选择标记。可用的选择标记包括提供针对化学品(例如抗生素,如庆大霉素、潮霉素、卡那霉素;或除草剂,如膦丝菌素(phosphinothrycin)、草甘膦、氯磺隆等)之抗性的酶。类似地,可使用产生可通过颜色变化进行鉴定之化合物的酶(例如GUS(β-葡萄糖醛酸酶))或化学发光的酶(萤光素酶或GFP)。
本发明还涉及包含本发明的嵌合基因构建体的转基因植物、植物细胞或种子。由植物细胞再生完整植物的方法也是本领域公知的。一般而言,将转化植物细胞培养在合适的培养基中,所述培养基可包含选择剂(例如抗生素),其中选择标记有利于鉴定转化植物细胞。愈伤组织一经形成,可根据已知的方法应用合适的植物激素来促进芽的形成,并将芽移至生根培养基中用于再生植物。然后,通过种子或利用植物无性繁殖技术,所述植物可反复用于形成子代。也可以不使用组织培养物来形成转基因植物。
本发明还涉及包含嵌合基因构建体的转基因植物、树木、酵母、细菌、真菌、昆虫和动物细胞,所述嵌合基因构建体含有编码用于根据本发明产生VLP之重组HA0的核酸。
为了在一系列可用于转化或瞬时表达的宿主生物中表达,可以将本发明的调控元件与目的编码区相组合。这样的生物包括但不限于植物(单子叶植物和双子叶植物),例如但不限于玉米、谷类植物、小麦、大麦、燕麦、烟草属物种、芸苔属物种、大豆、豌豆、苜蓿、马铃薯、番茄、人参和拟南芥。
用于稳定转化以及再生这些生物的方法已在本领域中建立并且是本领域技术人员公知的。获得转化植物和再生植物的方法对本发明来说不是关键性的。
“转化”意指表现为基因型、表型或二者兼有的遗传信息在种间的稳定转移。遗传信息从嵌合构建体向宿主进行种间转移可以是可遗传的,认为所述遗传信息的转移是稳定的;或者,所述转移可以是瞬时的,这时所述遗传信息是不可遗传的。
术语“植物物质”意指来源于植物的任何材料。植物物质可包括完整植株、组织、细胞或其任意部分。此外,植物物质可包括细胞内植物组分、细胞外植物组分、植物的液体或固体提取物,或者其组合。此外,植物物质可包括来自植物叶、茎、果实、根或其组合的植物、植物细胞、组织、液体提取物或其组合。植物物质可包括未进行任何处理步骤的植物或其部分。然而,还应当考虑的是,可对所述植物材料施加下文定义的最低限度处理步骤或更严格的处理,包括使用本领域公知的技术(包括但不限于色谱、电泳等)进行部分或大量蛋白质纯化。
术语“最低限度处理”意指部分纯化包含目的蛋白的植物物质(例如植物或其部分)以得到植物提取物、匀浆、植物匀浆的级分等(即最低限度处理)。部分纯化可包括但不限于破坏植物细胞结构从而产生含有可溶性植物组分和不溶性植物组分的组合物,所述不溶性植物组分可通过例如但不限于离心、过滤或其组合进行分离。在此方面,使用真空或离心提取可容易地获得分泌到叶或其它组织的细胞外空间内的蛋白质,或可以利用通过滚轴或研磨等在压力下进行组织提取从而将所述蛋白从细胞外空间中挤压或释放。最低限度处理还可包括制备可溶性蛋白质的粗提物,因为这些制备物中将含有可忽略不计的来自次植物产物的污染。另外,最低限度处理可包括从叶中用水性溶液提取可溶性蛋白质,然后用任意合适的盐进行沉淀。其它方法可包括大规模的浸渍和汁液提取,从而允许直接使用所述提取物。
可将植物物质(采取植物材料或组织的形式)经口递送给对象。所述植物物质可作为膳食补充剂的一部分与其它食物一起施用,或者被装入胶囊中。植物物质或组织还可以被浓缩以改善或增进适口性,或者在需要时与其它材料、成分或药物赋形剂一起提供。
可施用本发明VLP的对象或目标生物的实例包括但不限于人、灵长类、鸟类、水禽、候鸟、鹌鹑、鸭、鹅、家禽、鸡、猪、绵羊、马科动物、马、骆驼、犬科动物、狗、猫科动物、猫、虎、豹、麝猫、水貂、石貂、雪貂、宠物、家畜、兔、小鼠、大鼠、豚鼠或其它啮齿动物、海豹、鲸等。这些目标生物是示例性的,并且不视为限制本发明的应用和用途。
根据需要和情形,可以考虑以多种方式将含有目的蛋白的植物或表达含有目的蛋白之VLP的植物施用给对象或目标生物。例如,在使用之前,得自所述植物的目的蛋白可以粗提物、部分纯化或纯化的形式被提取。如果对蛋白质进行纯化,那么所述蛋白可以在可食用植物或不可食用植物中产生。此外,如果经口施用蛋白质,则可以收集所述植物组织并直接向对象饲喂,或者可在饲喂之前进行干燥,或者可以不预先收集而使动物在所述植物上进食。本发明还涉及将收集的植物组织作为动物饲料的食物补充剂。如果向动物饲喂的植物组织不进行或几乎不进行进一步处理的话,则优选所施用的植物组织是可食用的。
转录后基因沉默(PTGS)可参与限制转基因在植物中的表达,来自马铃薯Y病毒的沉默抑制子(HcPro)的共表达可用于抵抗转基因mRNA的特异性降解(Brigneti等,1998)。可替代的沉默抑制子是本领域熟知的并且可如本文所述使用(Chiba等,2006,Virology 346:7-14,其通过引用并入本文),例如但不限于TEV-p1/HC-Pro(烟草蚀纹病毒-p1/HC-Pro)、BYV-p21、番茄丛矮病毒的p19(TBSV p19)、番茄皱缩病毒的衣壳蛋白(TCV-CP)、黄瓜花叶病毒的2b(CMV-2b)、马铃薯X病毒的p25(PVX-p25)、马铃薯M病毒的p11(PVM-p11)、马铃薯S病毒的p11(PVS-p11)、蓝莓枯黄病毒的p16(BScV-p16)、柑橘衰退病毒(Citrustristexa virus)的p23(CTV-p23)、葡萄卷叶相关病毒-2的p24(GLRaV-2p24)、葡萄病毒A的p10(GVA-p10)、葡萄病毒B的p14(GVB-p14)、白芷潜伏性病毒(Heracleum latent virus)的p10(HLV-p10)或大蒜普通潜伏性病毒的p16(GCLV-p16)。因此,沉默抑制子(例如但不限于HcPro、TEV-p1/HC-Pro、BYV-p21、TBSV p19、TCV-CP、CMV-2b、PVX-p25、PVM-p11、PVS-p11、BScV-p16、CTV-p23、GLRaV-2p24、GBV-p14、HLV-p10、GCLV-p16或GVA-p10)可与编码目的蛋白的核酸序列共表达以进一步确保在植物中生产高水平蛋白质。
此外,可生产含有多种HA亚型之组合的VLP。例如,VLP可包含来自H1、H2、H3、H4、H5、H6、H7、H8、H9、H10、H11、H12、H13、H14、H15、H16亚型或其组合的一种或多种HA。HA组合的选择可由VLP制得之疫苗的目的用途来确定。例如,用于接种鸟的疫苗可包含HA亚型的任意组合,而用于接种人的VLP可包含H1、H2、H3、H5亚型的一种或多种亚型。然而,根据VLP的用途,也可制备其它的HA亚型组合。为了生产含有HA亚型组合的VLP,可将期望的HA亚型在同一细胞(例如植物细胞)中共表达。
此外,如本文所述生产的VLP不包含神经氨酸酶(NA)。然而,如果含有HA和NA的VLP是所期望,则可将NA与HA共表达。
此外,本发明还包括合适的载体,其含有适用于稳定或瞬时表达系统中的嵌合构建体。所述遗传信息还可提供在一种或多种构建体中。例如,可将编码目的蛋白的核苷酸序列引入一种构建体中,可将编码修饰目的蛋白糖基化之蛋白质的第二核苷酸序列引入单独的构建体中。然后,可将这些核苷酸序列在植物中共表达。然而,也可使用包含编码目的蛋白和修饰目的蛋白糖基化之蛋白质的核苷酸序列的构建体。在此情形中,所述核苷酸序列将包含第一序列和第二序列,所述第一序列包含与启动子或调控区有效连接的编码目的蛋白的第一核酸序列,所述第二序列包含与启动子或调控区有效连接的编码修饰目的蛋白糖基化之蛋白质的第二核酸序列。
“共表达”意指两种或两种以上核苷酸序列大致同时在植物中以及在植物的同一组织中表达。然而,所述核苷酸序列不必严格地同时表达。而是说,所述两种或更多种核苷酸序列的表达使得所编码产物有机会相互作用。例如,所述修饰目的蛋白糖基化的蛋白质可在目的蛋白表达前或表达期间表达,以允许发生对目的蛋白的糖基化修饰。可使用瞬时表达系统共表达两种或两种以上的核苷酸序列,其中所述两种或更多种序列大致同时在适于这两种序列表达的条件下被导入植物中。或者,可以用所述核苷酸序列之一(例如,编码目的蛋白的序列)以瞬时或稳定方式转化含有编码修饰所述目的蛋白糖基化之蛋白质的序列的平台植物(platformplant)。在此情形中,编码修饰目的蛋白糖基化之蛋白质的序列可在期望的发育阶段表达在期望的组织内,或者可使用诱导型启动子诱导其表达,而编码目的蛋白的其它序列可在相似条件下在同一组织内表达,以确保所述核苷酸序列的共表达。
可使用Ti质粒、Ri质粒、植物病毒载体、直接DNA转化、显微注射、电穿孔等将本发明的构建体导入植物细胞中。这些技术的综述参见例如Weissbach和Weissbach,Methods for Plant Molecular Biology,Academy Press,纽约VIII,421-463页(1988);Geierson和Corey,PlantMolecular Biology,第2版(1988)以及Miki和Iyer,Fundamentals ofGene Transfer in Plants.Plant Metabolism,第2版,DT.Dennis,DHTurpin,DD Lefebrve,DB Layzell(编),Addison Wesly,Langmans Ltd.London,561-579页(1997)。其它的方法包括直接DNA摄入、使用脂质体、电穿孔(例如使用原生质体)、显微注射、微弹(microprojectile)或whisker以及真空渗入。参见例如Bilang等(Gene 100:247-250(1991))、Scheid等(Mol.Gen.Genet.228:104-112,1991)、Guerche等(Plant Science 52:111-116,1987)、Neuhause等(Theor.Appl Genet.75:30-36,1987)、Klein等,Nature 327:70-73(1987)、Howell等(Science 208:1265,1980)、Horsch等(Science 227:1229-1231,1985)、DeBlock等,Plant Physiology 91:694-701,1989),Methods for Plant MolecularBiology(Weissbach和Weissbach编,Academic Press Inc.,1988)、Methods in Plant Molecular Biology(Schuler和Zielinski编,AcademicPress Inc.,1989)、Liu和Lomonossoff(J.Virol Meth,105:343-348,2002);美国专利No.4,945,050;5,036,006和5,100,792;美国专利申请序列号08/438,666(1995年5月10日提交)以及07/951,715(1992年9月25日提交)(所有这些文献均通过引用并入本文)。
可使用瞬时表达法表达本发明的构建体(参见Liu和Lomonossoff,2002,Journal of Virological Methods,105:343-348,其通过引用并入本文)。或者,可使用基于真空的瞬时表达法,如Kapila等1997(其通过引用并入本文)所述。这些方法可包括例如但不限于农杆菌接种法或农杆菌渗入法,然而,也可使用其它瞬时方法,如上文所述。使用农杆菌接种法或农杆菌渗入法时,含有期望核酸的农杆菌混合物进入组织(例如叶)的细胞间隙、植物的地上部分(包括茎、叶和花)、植物的其它部分(茎、根、花)或整个植株中。穿过表皮后,所述农杆菌感染细胞并将t-DNA拷贝移至细胞中。所述t-DNA以附加体形式转录并且其mRNA被翻译,导致在感染细胞中产生目的蛋白,然而,t-DNA在细胞核内的这种传递是瞬时的。
如果目的核苷酸序列编码的产物对所述植物具有直接或间接的毒性,则通过使用本发明的方法可降低对整株植物的毒性,其通过在期望的组织中或者在期望的植物发育阶段中选择性表达目的核苷酸序列来实现。此外,当在植物中制备毒性产物时,由瞬时表达导致的有限表达时间也可降低所述作用。可使用诱导型启动子、组织特异性启动子或细胞特异性启动子来选择性指导目的序列的表达。
本发明VLP的重组HA可与现有的流感病毒疫苗组合使用,以补充所述疫苗,使它们更加有效,以及降低所需的施用剂量。如本领域技术人员所公知地,疫苗可针对一种或多种流感病毒。合适的疫苗的实例包括但不限于Sanofi-Pasteur、ID Biomedical、Merial、Sinovac、Chiron、Roche、MedImmune、GlaxoSmithKline、Novartis、Sanofi-Aventis、Serono、Shire Pharmaceuticals等市售的疫苗。
需要时,可将本发明的VLP与本领域技术人员公知的合适佐剂混合。此外,VLP可用于疫苗组合物中,其含有用于治疗靶标生物的有效剂量VLP,如上文所述。此外,根据本发明生产的VLP可与使用不同流感病毒蛋白质(例如神经氨酸酶(NA))得到的VLP相组合。
因此,本发明提供了用于诱导动物或靶标生物中针对流感病毒感染之免疫的方法,其包括施用有效剂量的疫苗,所述疫苗含有一种或多种VLP。所述疫苗可经口、皮内、鼻内、肌内、腹膜内、静脉内或皮下施用。
根据本发明生产的VLP的施用描述于实施例6中。与施用可溶性HA相比,施用由植物生产的H5 VLP产生显著更高的应答(参见图21A和21B)。
如图26A和26B所示,施用A/印度尼西亚/5/05 H5 VLP的对象产生了针对流感病毒A/土耳其/582/06(H5N1;“土耳其H5N1”)攻击的交叉保护。在攻击之前施用印度尼西亚H5 VLP不导致体重的任何减轻。然而,未施用H5 VLP但用土耳其H5N1攻击的对象表现出显著的体重减轻,并且有几只对象死亡。
因此,这些数据表明由植物生产的含有H5血凝素病毒蛋白的流感病毒VLP诱导特异性针对病原性流感毒株的免疫应答,并且该病毒样颗粒可从植物质膜出芽。
因此,本发明提供了包含含有流感病毒HA蛋白的有效剂量VLP、一种或多种植物脂质以及可药用载体的组合物。所述流感病毒HA蛋白可以是H5印度尼西亚/5/2006。还提供了诱导对象中针对流感病毒感染之免疫的方法。该方法包括施用含有流感病毒HA蛋白的病毒样颗粒、一种或多种的植物脂质以及可药用载体。所述病毒样颗粒可经口、皮内、鼻内、肌内、腹膜内、静脉内或皮下施用给对象。
本发明多个实施方案的组合物可包含两种或更多种流感毒株或亚型的VLP。“两种或更多种”是指两种、三种、四种、五种、六种、七种、八种、九种、十种或更多种毒株或亚型。所示毒株或亚型可以是单一亚型(例如,所有都为H1N1,或所有都为H5N1),或者可以是亚型的组合。示例性的亚型和毒株包括但不限于本文所述的那些,例如A/新喀里多尼亚/20/99(H1N1)、A/印度尼西亚/5/2006(H5N1)、A/鸡/纽约/1995、A/银鸥/DE/677/88(H2N8)、A/得克萨斯/32/2003、A/绿头鸭/MN/33/00、A/鸭/上海/1/2000、A/针尾鸭/TX/828189/02、A/火鸡/安大略/6118/68(H8N4)、A/琵嘴鸭/伊朗/G54/03、A/鸡/德国/N/1949(H10N7)、A/鸭/英格兰/56(H11N6)、A/鸭/阿尔伯达/60/76(H12N5)、A/鸥/马里兰/704/77(H13N6)、A/绿头鸭/Gurjev/263/82、A/鸭/澳大利亚/341/83(H15N8)、A/红嘴鸥/瑞典/5/99(H16N3)、B/Lee/40、C/约翰内斯堡/66、A/波多黎各/8/34(H1N1)、A/布里斯班/59/2007(H1N1)、A/所罗门群岛3/2006(H1N1)、A/布里斯班10/2007(H3N2)、A/威斯康星/67/2005(H3N2)、B/马来西亚/2506/2004、B/佛罗里达/4/2006、A/新加坡/1/57(H2N2)、A/安徽/1/2005(H5N1)、A/越南/1194/2004(H5N1)、A/水鸭/香港/W312/97(H6N1)、A/马/布拉格/56(H7N7)、A/香港/1073/99(H9N2)。
对毒株和亚型之组合的选择可取决于可能暴露于流感病毒之对象的地区;动物物种(例如水禽类、农业动物(例如猪)等)与待免疫人群的接近程度以及所述动物物种携带、暴露或可能暴露的毒株;对亚型或毒株内抗原漂移的预测;或者这些因素的组合。过去几年所使用的组合的实例可见于URL:who.int/csr/dieease/influenza/vaccinerecommendations1/en。可将这些毒株中的某些或全部应用于所示组合中,或产生疫苗组合物的其它组合中。
更特别地,示例性组合可包括来自两种或更多种选自以下的毒株或亚型的VLP:A/布里斯班/59/2007(H1N1)、A/布里斯班/59/2007(H1N1)样病毒、A/布里斯班/10/2007(H3N2)、A/布里斯班/10/2007(H3N2)样病毒、B/佛罗里达/4/2006或B/佛罗里达/4/2006样病毒。
另一示例性组合可包括来自两种或更多种选自以下的毒株或亚型的VLP:A/印度尼西亚/5/2005、A/印度尼西亚/5/2005样病毒、A/越南/1194/2004、A/越南/1194/2004样病毒、A/安徽/1/05、A/安徽/1/05样病毒、A/鹅/贵阳/337/2006、A/鹅/贵阳/337/2006样病毒、A/鸡/山西/2/2006或A/鸡/山西/2/2006样病毒。
另一示例性组合可包括A/鸡/意大利/13474/99(H7型)或A/鸡/英属哥伦比亚省/04(H7N3)流感毒株的VLP。
另一示例性组合可包括A/鸡/香港/G9/97或A/香港/1073/99的VLP。另一示例性组合可包括A/所罗门群岛/3/2006的VLP。另一示例性组合可包括A/布里斯班/10/2007的VLP。另一示例性组合可包括A/威斯康星/67/2005的VLP。另一示例性组合可包括B/马来西亚/2506/2004、B/佛罗里达/4/2006或B/布里斯班/3/2007毒株或亚型的VLP。
所述两种或更多种VLP可单独表达,随后将纯化的或半纯化的VLP相组合。或者,VLP可在同一宿主(例如植物)中共表达。VLP可以期望的比例(例如大致相等的比例)组合或生产,或者可以组合以使一种亚型或毒株占组合物中VLP的大部分。
因此,本发明提供了包含两种或更多种毒株或亚型之VLP的组合物。
包膜病毒的VLP通常从它们出芽时所穿过的膜获得它们的包膜。植物质膜具有可具有免疫刺激作用的植物固醇成分。为了研究该可能性,在存在或不存在佐剂的情形下将由植物生产的H5 VLP施用给动物并测定HAI(血细胞凝集抑制抗体反应)(图22A、22B)。在未添加佐剂的情形中,由植物产生的H5 VLP表现出显著的HAI,这表示对施用抗原的全身免疫应答。此外,在存在或不存在佐剂的情形中,所施用VLP的抗体同种型谱相似(图23A)。
表5列出了本发明多个实施方案中提供的序列。
表5:针对序列标识的序列描述
本发明将通过仅参考下述非限制性实施例的方式进行详述。
方法和材料
1.表达盒的组装
使用Sambrook和Russell(2001;其通过参考并入本文)的一般分子生物学操作方法完成所有操作。第一个克隆步骤是组装受体质粒,其包含苜蓿质体蓝素基因的上游和下游调控元件。使用寡核苷酸引物XmaI-pPlas.c(SEQ ID NO:29;图10Q)和SacI-ATG-pPlas.r(SEQ IDNO:30;图10R)从苜蓿基因组DNA中扩增质体蓝素启动子和5’UTR序列。所得扩增产物用XmaI和SacI消化并与预先用同样的酶进行消化的pCAMBIA2300(Cambia,Canberra,Australia)连接以形成pCAMBIApromoPlasto。类似地,使用引物SacI-PlasTer.c(SEQ ID NO:31;图10S)和EcoRI-PlasTer.r(SEQ ID NO:32;图10T)从苜蓿基因组DNA中扩增质体蓝素基因的3’UTR序列和终止子,所得产物用SacI和EcoRI消化,然后插入到pCAMBIApromoPlasto的同样位点中以形成pCAMBIAPlasto。
将流感毒株A/新喀里多尼亚/20/99(H1N1)之H1基因的开放阅读框作为两个片段来合成(Plant Biotechnology Institute,NationalResearch Council,Saskatoon,Canada)。所合成的第一片段对应于缺少了5’端信号肽编码序列和3’端跨膜结构域编码序列的野生型H1编码序列(GenBank登录号AY289929;SEQ ID NO:33;图16)。将BglII限制性位点添加在编码序列的5’端,将SacI/StuI双位点添加在紧邻该片段3’端终止密码子下游,得到SEQ ID NO:1(图5A)。还合成了编码H1蛋白C端(包含跨膜结构域和胞质尾)的第二片段,其从KpnI位点至终止密码子,并且其3’侧翼是SacI/StuI限制性位点(SEQ ID NO.2;图5B)。
所述第一H1片段用BglII和SacI消化,并克隆到含有质体蓝素启动子和5’UTR之二元载体(pCAMBIAPlasto)的同样位点中,并与苜蓿蛋白质二硫键异构酶(PDI)基因(32-103位核苷酸;登录号Z11499;SEQ ID NO:34;图17)的信号肽融合得到PDI-H1嵌合基因,该嵌合基因位于质体蓝素调控元件的下游。含有PDI信号肽的基于质体蓝素的盒序列示于图1中(SEQ ID NO:8)。所得质粒包含与PDI信号肽融合的H1编码区,并且侧翼为质体蓝素调控元件。通过将预先用KpnI和SacI消化的合成片段(SEQ ID NO:2;图5B)插入到H1表达质粒中来添加C端编码区(编码跨膜结构域和胞质尾)。所得质粒称为540,其示于图11中(还参见图2A)。
2.H5表达盒的组装
利用Epoch Biolabs(Sugar Land,TX,USA)合成编码流感毒株A/印度尼西亚/5/05(H5N1;登录号LANL ISDN125873)之血凝素的片段。所产生的片段示于SEQ ID NO:3(图6)中,其包含H5全长编码区,所述全长编码区包含天然信号肽,其侧翼为紧邻起始ATG上游的HindIII位点以及紧邻终止密码子(TAA)下游的SacI位点。通过Darveau等(1995)中所示的基于PCR的连接方法将H5编码区克隆到基于质体蓝素的表达盒中。简言之,使用引物Plato-443c(SEQ ID NO:4;图7A)和SpHA(Ind)-Plasto.r(SEQ ID NO:5;图7B),以pCAMBIApromoPlasto作为模板进行第一次PCR扩增。平行地,使用引物Plasto-SpHA(Ind).c(SEQ ID NO:6;图7C)和HA(Ind)-Sac.r(SEQ IDNO:7;图7D),以H5编码片段作为模板进行第二次扩增。将由上述两个反应得到的扩增物混合,将所得混合物作为模板,使用Plato-443c(SEQ ID NO:4;图7A)和HA(Ind)-Sac.r(SEQ ID NO:7;图7D)作为引物进行第三次反应(组装反应)。用BamHI(在质体蓝素启动子中)和SacI(在所述片段的3’端)消化所得片段并将其克隆到先前用同样的酶进行消化的pCAMBIAPlasto中。所得质粒称为660,其示于图2B中(还参见图11)。
通过用编码亮氨酸拉链GCN4pII变体的片段替换编码540中跨膜结构域和胞质尾的区域来制备编码可溶形式H1的盒(Harbury等,1993,Science 1993;262:1401-1407)。将该片段合成成侧翼具有KpnI和SacI位点以促进克隆。由该替换得到的质粒称为544,该表达盒示于图11中。
合成马铃薯蚀纹病毒(TEV)5’UTR与流感病毒A/PR/8/34 M1基因(登录号NC_002016)开放阅读框的融合蛋白,其在终止密码子下游加入了侧翼SacI位点。该片段用SwaI(在TEV 5’UTR中)和SacI消化,并克隆到pCAMBIA二元质粒中基于2X35S/TEV的表达盒中。所得质粒具有受控于2X35S/TEV启动子的M1编码区和5’UTR以及NOS终止子(构建体750;图11)。
如Hamilton等(2002)所述制备HcPro构建体(35HcPro)。对所有克隆进行测序以证实构建体的完整性。所述质粒用于通过电穿孔转化根瘤农杆菌(AGL1;ATCC,Manassas,VA 20108,USA)(Mattanovich等,1989)。通过限制性酶切图谱证实所有根瘤农杆菌株的完整性。
3.植物生物质的准备、接种、农杆菌渗入和收获
在填装市售的泥炭基质的平地中用种子培养本塞姆氏烟草或普通烟草(Nicotiana tabacum)。使植物生长在温室中,16/8光照周期,温度采用白天25℃/晚上20℃。播种3周后,挑出各株幼苗,移栽到盆中,并在同样的环境条件下在温室中再生长3周。转化前,在不同时间通过掐掉植物的芽或通过化学处理植物而除去顶芽和腋芽。
在补充有10mM 2-[N-吗啉]乙磺酸(MES)、20μM乙酰丁香酮、50μg/ml卡那霉素和25μg/ml羧苄青霉素的YEB培养基(pH 5.6)中培养用构建体660、540、544、750或35SHcPro转染的农杆菌,直至其OD600为0.6~1.6。使用前将农杆菌混悬液离心并重悬在渗入培养基(10mM MgCl2和10mM MES,pH 5.6)中。如Liu和Lomonossoff(2002,Journal of Virological Methods,105:343-348)所述进行注射器渗入。对于真空渗入而言,将根瘤农杆菌混悬液离心,重悬在渗入培养基中,并储存在4℃过夜。在渗入当天,将分批培养物稀释成2.5倍培养物体积并在使用前温热。在20-40托真空下,使本塞姆氏烟草或普通烟草的整个植株倒置于气密性不锈钢罐中的细菌混悬液中2分钟。注射器或真空渗入后,将植株移回温室中培养4-5天直至收获。
4.叶片取样和总蛋白质提取
培养后,收获植株的地上部分,冷冻在-80℃,进行破碎。通过将每个冷冻破碎植物材料的样品在3倍体积的冷的50mM Tris(pH 7.4)、0.15M NaCl和1mM苯甲基磺酰氟中匀浆(Polytron)来提取总的可溶性蛋白质。匀浆后,于4℃下以20,000g对浆液离心20分钟,将这些澄清的粗提物(上清)用于分析。使用牛血清白蛋白作为参照标准,通过Bradford测定(Bio-Rad,Hercules,CA)来测定经纯化粗提物的总蛋白质含量。
5.蛋白质提取物的体积排阻色谱
填装有32ml SephacrylTM S-500高分辨率珠(S-500HR:GEHealthcare,Uppsala,Sweden,货号17-0613-10)的体积排阻色谱(SEC)柱用平衡/洗脱缓冲液(50mM的Tris(pH8),150mM NaCl)平衡。将1.5mL粗蛋白质提取物加到该柱上,然后用45mL平衡/洗脱缓冲液进行洗脱。以1.5mL级分收集洗脱液,洗脱级分的相对蛋白质含量通过将10μL级分与200μL稀释的Bio-Rad蛋白染色试剂(Bio-Rad,Hercules,CA)混合来监测的。用2倍柱体积的0.2N NaOH清洗该柱,然后用10倍柱体积的50mM Tris(pH8)、150mM NaCl和20%乙醇溶液清洗。每次分离之后用Blue Dextran 2000(GE Healthcare Bio-Science Corp.,Piscataway,NJ,USA)校准所述柱。在每次分离之间对Blue Dextran 2000和宿主可溶性蛋白质的洗脱曲线进行比较,以确保所用柱之间的洗脱曲线的一致性。
6.蛋白质分析与免疫印迹
通过BCA蛋白质测定(Pierce Biochemicals,Rockport IL)来测定蛋白质浓度。在还原条件下通过SDS-PAGE分离蛋白质,并用考马斯蓝染色。对经染色的凝胶进行扫描,并使用ImageJ Software(NIH)进行密度分析。
用丙酮沉淀来自SEC洗脱级分的蛋白质(Bollag等,1996),重悬在1/5体积的平衡/洗脱缓冲液中,在还原条件下通过SDS-PAGE分离并电转移到聚偏氟乙烯(PVDF)膜(Roche Diagnostics Corporation,Indianapolis,IN)上用于免疫检测。在免疫印迹之前,用Tris缓冲盐水(TBS-T)中5%脱脂奶和0.1%Tween-20在4℃下封闭所述膜16~18小时。
通过用2μg/ml合适的抗体(表6)(在2%脱脂奶、0.1%TBS-Tween20溶液中)孵育进行免疫印迹。用于化学发光检测的第二抗体示于表4中,如所示在2%脱脂奶、0.1%TBS-Tween 20溶液中稀释。使用luminol(Roche Diagnostics Corporation)作为底物,通过化学发光检测免疫反应性复合物。使用EZ-Link Plus活化辣根过氧化物酶缀合试剂盒(Pierce,Rockford,IL)进行人IgG抗体的辣根过氧化物酶缀合。
表6:用于所表达蛋白质免疫印迹的电泳条件、抗体和稀释度
FII:Fitzgerald Industries International,Concord,MA,USA;
NISBIC:National Institute for Biological Standards and Control;
JIR:Jackson ImmunoResearch,West Grove,PA,USA;
BEI NR:Biodefense and emerging infections research resources repository;
ITC:Immune Technology Corporation,Woodside,NY,USA
针对H5的血凝素分析是基于Nayak.和Reichl(2004)所述的方法。简言之,在含有100μL PBS的V形底96孔微滴定板中进行测试样品的两倍系列稀释(100μL),使每孔中含有100μL稀释样品。将100μL0.25%火鸡红细胞悬液(Bio Link Inc.,Syracuse,NY)加到每孔中,将板在室温下孵育2小时。将显示完全血细胞凝集的最高稀释度的倒数记录为HA活性。平行地,用PBS稀释重组HA标准物(A/越南/1203/2004H5N1)(Protein Science Corporation,Meriden,CT),并作为每个板的对照。
7.蔗糖梯度超离心
将对含有H5的生物质进行凝胶过滤色谱而洗脱得到的1mL级分9、10和11合并,并加到20~60%(重量/体积)不连续蔗糖密度梯度中,以125 000g(4℃)离心17.5小时。从顶部起,将梯度物分级分离成19个3mL级分,并在免疫分析和血细胞凝集测定之前通过透析除去蔗糖。
8.电子显微镜
首先,使用30MWCO超滤装置(Millipore,Billerica,MA,USA)将待通过电子显微镜(EM)观察的来自SEC的洗脱级分进行浓缩。在4℃下,将所述浓缩级分在含有2%戊二醛的PBS(pH7.4)中固定24小时。一经固定,将所述样品吸附在经Formvar涂敷的200目镍网(Canemco,Lakefield,Canada)上2分钟,用去离子水清洗网两遍,然后用1%磷钨酸染色。在放大倍数为10000×至150000×的透射电子显微镜下进行观察(图4A和4B中的图像)。
或者,将100μL待测样品置于Airfuge超离心管(BeckmanInstruments,Palo Alto,CA,USA)中。将网置于该管的底部,然后将所述管以120 000g离心5分钟。取出网,温和干燥并置于3%磷钨酸(pH6)液滴上进行染色。利用Hitachi 7100透射电子显微镜(TEM)检测网(图14B、15B和15C中的图像)。
对于图19中的图像而言,将约1mm3的叶块用含有2.5%戊二醛的PBS固定,并用含有3%蔗糖的PBS清洗,然后用1.33%四氧化锇再次固定。用Spurr树脂对固定样品进行包埋,并将超薄切片铺于网上。用5%醋酸双氧铀和0.2%柠檬酸铅对样品进行正染色,然后观察。利用Hitachi 7100透射电子显微镜(TEM)观察网。
9.质膜脂质分析
根据Mongrand等人利用聚乙二醇3350/葡聚糖T-500(各6.6%)在水性聚合物两相系统中分配而进行细胞分级分离后,从烟草叶和培养的BY2细胞得到质膜(PM)。所有步骤均在4℃下进行。
根据Bligh和Dyer所述,从不同级分提取和纯化脂质。使用Lefebvre等所述的溶剂体系通过一维HP-TLC分离极性和中性脂质。如Macala等所述,用醋酸铜染色后检测脂质的PM级分。通过比较脂质的迁移时间与标准物的迁移时间来鉴定脂质(除了SG得自Matreya,Pleasant Gap,PA,USA以外,其它所有标准物均得自Sigma-Aldrich,St-Louis,MO,USA)。
10.H5 VLP的纯化
使用市售的搅拌器,在1.5倍体积的50mM Tris(pH 8)、NaCl 150mM和0.04%偏亚硫酸氢钠溶液中对冷冻的经660渗入的本塞姆氏烟草叶进行匀浆。向所得提取物中添加1mM PMSF,并用1M醋酸调节至pH6,然后在42℃加热5分钟。将硅藻土(DE)添加到经热处理的提取物中,以吸附由pH变化和热处理所沉淀出的污染物,并通过Whatman滤纸过滤所述浆液。所得澄清的提取物在室温下以10000×g离心10分钟以除去残留的DE,通过0.8/0.2μm Acropack 20滤器,并加到胎球蛋白-琼脂糖亲和柱(Sigma-Aldrich,St-Louis,MO,USA)上。用400mM NaCl、25mM Tris(pH 6)清洗后,用1.5M NaCl、50mMMES(pH 6)洗脱所结合的蛋白质。向洗脱的VLP中添加Tween-80使终浓度为0.0005%(体积/体积)。利用100kDa MWCO Amicon膜浓缩VLP,在40℃以10000×g离心30分钟,并用含有0.01%Tween-80和0.01%硫柳汞的PBS(pH7.4)重悬。使用之前对混悬的VLP进行过滤除菌。
1.1动物研究
小鼠
利用6~8周龄雌性BALB/c小鼠(Charles River Laboratories)对流感病毒VLP施用的免疫应答进行研究。将70只小鼠随机分到14组中,每组5只。8组用于肌内免疫,6组用于测试鼻内施用途径。所有组均以两剂方案免疫,即初次免疫后3周进行加强免疫。
对于在后肢进行肌内施用而言,用由植物生产的VLP H5疫苗(0.1、1、5或12μg)或对照血凝素(HA)抗原免疫未麻醉的小鼠。对照HA含有基于A/印度尼西亚/5/05 H5N1毒株制备并从293细胞培养物(Immune Technology Corp.,New York,USA)中纯化的重组可溶性血凝素(除非另外指明,每剂注射使用5μg)。缓冲液对照是PBS。该抗原由HA蛋白的18~530位氨基酸组成,并具有组氨酸标签(His-tag)和经修饰的切割位点。电子显微镜观察证实了该市售产品不是VLP形式。
为了测量佐剂的作用,用5μg由植物生产的VLP H5疫苗外加1倍体积的2%铝胶(明矾,Accurate Chemical & Scientific Corporation,Westbury,NY,US)或用5μg从293细胞培养物中纯化的重组血凝素外加1倍体积的明矾来分别免疫两组动物。将70只小鼠随机分到14组中,每组5只。8组用于肌内免疫,6组用于测试鼻内施用途径。所有组均根据初免-加强方案进行免疫,即初次免疫后3周进行加强免疫。
对于在后肢进行肌内施用而言,用由植物生产的VLP H5疫苗(0.1、1、5或12μg)或对照血凝素(HA)抗原(5μg)或PBS免疫未麻醉的小鼠。在免疫之前以1∶1体积比将各抗原制备物与1%铝胶(明矾,Accurate Chemical & Scientific Corporation,Westbury,NY,US)混合。为了测量佐剂的作用,用不含任何佐剂的5μg由植物生产的VLPH5疫苗或者用不含任何佐剂的5μg对照HA抗原分别免疫两组动物。
对于鼻内施用而言,使用自动吸气室通过吸入异氟烷短暂麻醉小鼠。然后,用由植物生产的VLP疫苗(0.1或1μg)或者用对照HA抗原(1μg)或者用PBS以4μl滴/鼻孔来免疫小鼠。在免疫之前将各抗原制备物与1%壳聚糖谷氨酸(Protosan,Novamatrix/FMC BioPolymer,Norway)混合。然后,使小鼠在所述溶液中呼吸。为了验证鼻内施用途径中佐剂的作用,用1μg由植物生产的VLP H5疫苗或用1μg对照HA抗原来分别免疫两组动物。
雪貂
使用10组雪貂(雄性,18~24周龄,重量约为1kg),每组5只。如表7中所述对每组进行处理。所用的佐剂是2%铝胶(明矾)(SuperfosBiosector,Denmark)(终浓度为1%)。疫苗组合物是如所述制备的膜相关的A/印度尼西亚/5/05(H5N1)VLP。疫苗对照(阳性对照)是来自印度尼西亚毒株的完全糖基化的膜结合重组H5,其由ImmuneTechnology Corporation(ITC)使用293细胞培养物中的腺病毒来制备。
表7.处理组
*i.m.:肌内
在研究期间定期评价雪貂的整体健康情况和外观(体重、直肠温度、姿态、皮毛、运动模式、呼吸、排泄)。在第0、14和28天向四头肌中肌内注射(0.5~1.0倍总体积)来免疫动物;对于引入佐剂的方案而言,在免疫之前以1∶1体积比将疫苗组合物与铝胶混合。在第0天(免疫前)以及第21和第35天获取血清样品。在第40~45天处死(放血/心脏穿刺)动物,收集脾脏并进行尸检。
可使用同源或异源的失活H5N1病毒,利用ELISA测定来定量抗流感病毒的抗体效价。
如Aymard等(1973)所述,利用微滴定HAI评估血清样品(免疫前、第21天和第35天)的血细胞凝集抑制抗体效价。简言之,用受体破坏酶对血清进行预处理,热失活并与红细胞(经清洗的血红细胞(RBC))混悬液混合。推荐使用来自Lampire的经清洗的马RBC(10%),考虑到该测定可根据RBC来源而变化(马依赖型),测试了来自10匹马的经清洗RBC,以选择最敏感的批次。或者,可使用火鸡的RBC。抗体效价表示为完全抑制血细胞凝集的最高稀释度的倒数。
交叉反应性HAI效价:用针对A/印度尼西亚/5/05(进化枝2.1)的疫苗免疫的雪貂的HAI效价使用来自另一亚进化枝或进化枝的失活H5N1流感毒株(例如进化枝1越南毒株(A/越南/1203/2004和A/越南/1194/2004)或者A/安徽/01/2005(亚进化枝2.3)或A/火鸡/土耳其/1/05(亚进化枝2.2))测量。所有分析均是针对单个样品进行的。
数据分析:对所有数据进行统计学分析(ANOVA)以确定组与组之间的差异是否具有统计学显著性。
致命性攻击的实验设计(小鼠)
将128只小鼠随机分到16组中,每组8只动物,1组未免疫且未受攻击(阴性对照)。所有组均以两剂方案通过肌内施用进行免疫,在初次免疫后2周进行第二次免疫。
对于在后肢进行肌内施用而言,用由植物生产的H5 VLP疫苗(1、5或15μg)或15μg对照HA抗原或PBS免疫未麻醉的小鼠。在免疫之前将各抗原制备物与1倍体积的1%铝胶(明矾,Accurate Chemical &Scientific Corporation,Westbury,NY,US)混合。
在免疫期间,每周为小鼠称重一次,并观察和监测注射部位的局部反应。
第二次免疫后第22天,在BL4防护实验室(P4-JeanMérieux-INSERM,Lyon,France)对经麻醉小鼠鼻内攻击(i.n.)4.09×106的50%细胞培养物感染剂量(CCID50)的流感病毒A/土耳其/582/06病毒(由法国里昂大学的Bruno Lina博士馈赠)。攻击之后,在14天内观察小鼠的疾病临床症状并每日称重。将具有严重感染症状且体重减轻≥25%的小鼠麻醉后处以安乐死。
血液收集、肺和鼻腔清洗以及脾脏收集
在初次免疫后第14天和第二次免疫后第14天收集未麻醉动物的侧隐静脉之静脉血。以8000g离心10分钟收集血清。
在第二次免疫后4周,利用CO2气体麻醉小鼠并在终止后马上进行心脏穿刺以收集血液。
最后放血后,将导管朝向肺插入气管中,将1ml冷的PBS-蛋白酶抑制剂混合溶液置于与所述导管相连的1cc注射器中并注射到肺中,然后取出用于分析。该清洗步骤进行2次。对肺清洗物进行离心以除去细胞碎片。对于鼻内清洗而言,将导管朝鼻区方向插入,将0.5ml PBS-蛋白酶抑制剂混合溶液通过所述导管推进鼻腔中,然后收集。对鼻清洗物进行离心以除去细胞碎片。收集用5μg添加佐剂的由植物生产之疫苗或5μg添加佐剂的重组H5抗原进行肌内免疫的小鼠以及用1μg添加佐剂的由植物生产之疫苗或1μg添加佐剂的重组H5抗原进行鼻内免疫的小鼠的脾脏。将收集的脾脏置于补充有庆大霉素的RPMI中,并用10ml注射器的推筒将所述脾脏研碎到50ml锥形管中。清洗研碎的脾脏2次,以2000rpm离心5分钟,室温下用ACK裂解缓冲液重悬5分钟。用PBS-庆大霉素清洗脾细胞,重悬在5%RPMI中并计数。脾细胞用于增殖测定。
抗体效价
在初次免疫后第14天以及第二次免疫后第14天和第28天测量血清的抗流感病毒抗体效价。使用失活病毒A/印度尼西亚/5/05作为包被抗原,利用酶联免疫吸附测定(ELISA)测定效价。终点效价表示为达到高出阴性对照样品至少0.1的OD值的最高稀释度的倒数。
对于抗体种类测定而言(IgG1、IgG2a、IgG2b、IgG3、IgM),如上文所述通过ELISA评估效价。
血细胞凝集抑制(HI)效价
如先前所述(WHO 2002;Kendal 1982),在第二次免疫后第14天和第28天测量血清的血细胞凝集抑制(HI)效价。将A/印度尼西亚/5/05或A/越南/1203/2004毒株的失活病毒制备物用于测试小鼠血清样品的HI活性。用由霍乱弧菌(Kendal 1982)制得的受体破坏酶II(RDE II)(DenkaSeiken Co.,Tokyo,Japan)对血清进行预处理。用0.5%火鸡血红细胞进行HI测定。HI抗体效价被定义为引起完全凝集抑制的最高稀释度的倒数。
实施例
实施例1.通过农杆菌渗入法在本塞姆氏烟草植物中瞬时表达流感病毒A/印度尼西亚/5/05(H5N1)血凝素
通过A/印度尼西亚/5/05(H5N1)毒株之H5亚型的表达来测定瞬时表达系统产生流感病毒血凝素的能力。如图11所示,首先将带有天然信号肽和跨膜结构域的血凝素基因编码序列(登录号EF541394)组装在质体蓝素表达盒(来自苜蓿质体蓝素基因的启动子、5’UTR、3’UTR以及转录终止序列)中,将所组装的盒(660)插入到pCAMBIA二元质粒中。然后,将该质粒转染到农杆菌(AGL1)中,得到重组株AGL1/660,其用于瞬时表达。
用AGL1/660渗入本塞姆氏烟草植物,并在6天的培养期后收获叶。为了测定H5是否在农杆菌渗入的叶中积累,首先从经渗入的叶组织中提取蛋白质并通过Western印迹利用抗-H5(越南)多克隆抗体进行分析。检测到提取物中约72kDa的独特条带(图12),其大小对应于未切割的流感病毒血凝素HA0形式。用作阳性对照的市售H5(A/越南/1203/2004;Protein Science Corp.,Meriden,CT,USA)被检测为约48kDa和28kDa的两个条带,分别对应于HA1和HA2片段的分子量。这表明H5在经渗入叶中的表达导致未切割之翻译产物的累积。
来自经AGL1/660转化的叶的粗蛋白质提取物能够凝集火鸡血红细胞,证明形成了活性HA三聚体(数据未显示)。
实施例2:使用体积排阻色谱表征植物提取物中含有血凝素的结构
通过凝胶过滤对由植物生产的流感病毒血凝素组装成高分子量结构进行评估。通过体积排阻色谱(SEC)利用SephacrylTM S-500HR柱(GEHealthcare Bio-Science Corp.,Piscataway,NJ,USA)对经AGL1/660渗入之植物的粗蛋白质提取物(1.5mL)进行分级分离。使用抗HA抗体通过免疫检测测定洗脱级分的总蛋白质含量和HA丰度(图13A)。如图13A所示,Blue Dextran(2MDa)洗脱物早在级分10中出现峰值,而大部分宿主蛋白质仍保留在柱中并在级分14与22之间被洗脱出来。当利用丙酮沉淀法将来自200μL各SEC洗脱级分的蛋白质浓缩(5倍)并通过Western印迹(图15A,H5)分析时,血凝素(H5)主要存在于级分9~14中(图13B)。不希望受理论限制,这表明HA蛋白已被组装成大的超级结构或已附着于高分子量结构上。
将第二表达盒与来自A/新喀里多尼亚/20/99(H1N1)(SEQ ID NO:33;图16;GenBank登录号AY289929)的H1核酸序列进行组装以产生构建体540(图11)。设计嵌合基因构建体以产生可溶性三聚体形式的H1,其中信号肽源自植物蛋白质二硫键异构酶基因,H1的跨膜结构域被GCN4亮氨酸拉链的pII变体替代,其已显示可自组装成三聚体的肽(Harbury等,1993)(盒544,图11)。虽然缺乏跨膜结构域,但是该可溶性三聚体形式仍具有血细胞凝集能力(数据未显示)。
通过SEC对用AGL1/540或AGL1/544渗入之植物的蛋白提取物进行分级分离,用抗A型流感病毒抗体(Fitzgerald,Concord,MA,USA)通过Western印迹检测H1洗脱级分的存在。在经AGL1/540渗入的叶中,H1主要以很高分子量的结构累积,其中峰朝较小结构偏离(H1;图13C)。在经AGL1/544渗入的叶中,可溶性形式的H1作为分离的三聚体累积,这可通过与宿主蛋白质洗脱曲线平行的凝胶过滤洗脱曲线来证明(可溶性H1;图13D)。相比较而言,由5~6个血凝素三聚体微团组成的H1玫瑰花结(Protein Science Corp.,Meriden,CT,USA)在级分12~16中洗脱出来(图13E),早于可溶性H1(图13D)但晚于天然H1(图13C)。
为了评价M1共表达对血凝素组装成结构的影响,使用对应于A/PR/8/34(H1N1)M1编码序列(SEQ ID NO:35;图18;GenBank登录号NC_002016)的核酸组装了M1表达盒。该构建体称为750,示于图11中。对于M1和H1共表达而言,在渗入前以相等体积混合AGL1/540和AGL1/750混悬液。多种农杆菌混悬液的共渗入允许共表达多种转基因。对SEC洗脱级分的Western印迹分析表明M1共表达不改变H1结构的洗脱曲线,但导致经农杆菌渗入的叶中H1累积减少(参见图13F)。
实施例3:通过蔗糖梯度离心分离H5结构并在电子显微镜下观察
在电子显微镜(EM)下观察血凝素结构需要的浓度和纯度水平比从SEC获得的叶蛋白质粗提物更高。为了能通过EM观察H5结构,首先通过PEG沉淀(20%聚乙二醇)浓缩叶蛋白质粗提物,然后重悬在1/10体积的提取缓冲液中。将所浓缩的蛋白提取物通过S-500HR凝胶过滤进行分级分离,并合并洗脱级分9、10和11(对应于柱的空隙体积),通过20~60%蔗糖密度梯度超速离心,进一步与宿主蛋白质分离。在分析之前,从顶部开始进行蔗糖梯度分级分离,将级分透析,并利用100NMWL离心过滤装置进行浓缩。如Western印迹和血细胞凝集结果所示(图14A),H5主要累积在级分16~19中,其含有约60%蔗糖,而大多数宿主蛋白质在级分13中出现峰值。合并级分17、18和19,进行负染色,并在EM下观察。对样品的观察清楚地表明存在大小为80~300nm的刺突球状结构,其与流感病毒VLP的形态学特征相吻合(图14B)。
实施例4:来自植物生物质的流感病毒H5VLP的纯化
除了含量丰富的可溶性蛋白质以外,植物的叶提取物中含有可溶性糖、核酸和脂质的复杂混合物。通过改变pH和热处理然后利用硅藻土过滤对粗提物进行纯化(参见“材料和方法”部分中有关纯化方法的详述)。图15A(泳道1~4)表示考马斯蓝染色的凝胶,其比较了多个纯化步骤的蛋白质含量。粗提物(泳道1)和经纯化提取物(泳道4)中蛋白质含量的比较表明,纯化步骤能降低总蛋白质含量以及除去叶粗提物中的大多数主要污染物(显示为50kDa)。所述50kDa条带对应于RuBisCO大亚基,占叶总蛋白质的高达30%。
通过亲和色谱利用胎球蛋白柱对来自这些经澄清提取物的流感病毒H5VLP进行纯化。对加样级分(图15A,泳道5)、流穿(图15A,泳道6)以及经洗脱VLP(图15A,泳道7)的比较表明胎球蛋白亲和柱对经澄清植物提取物中的流感病毒H5VLP具有特异性。
如利用考马斯蓝染色的SDS-PAGE凝胶的密度测定所示(图15,泳道7),纯化步骤导致H5的纯度大于75%。为了评价所纯化产物的结构质量,利用100NMWL(nominal molecular weight limit,名义分子量极限)离心过滤装置对经纯化的H5进行浓缩,并在负染色后于EM下观察。图15B显示了表示存在大量VLP的代表性部分。更加细致地观察证实了VLP上存在刺突(图15C)。
如图15D所示,基于考马斯蓝染色的H5血凝素的密度以及基于通过BCA法测定的总蛋白质含量,利用胎球蛋白柱亲和色谱将来自经澄清叶提取物的H5VLP纯化至纯度约89%。
通过凝集火鸡红细胞的能力证实HA VLP生物活性(数据未显示)。
图20B还通过Western印迹目测以及利用抗H5多克隆血清(A/越南/1203/2004)进行的免疫检测验证了纯化VLP的身份。检测到约72kDa的独特条带,其大小对应于未切割的HA0形式流感病毒血凝素。图15c显示所述疫苗的VLP结构,其中血凝素刺突覆盖其结构。
通过0.22μm滤器过滤来制备用于免疫小鼠的VLP,利用内毒素LVL(Limulus Amebocyte Lysate)检测试剂盒(Lonza,Walkserville,MS,USA)测定内毒素含量。经过滤的疫苗含有105.8±11.6%EU/ml(内毒素单位/ml)。
实施例5:流感病毒VLP在植物中的定位
为了对VLP定位并证实其质膜来源,将产生H5的植物的叶薄切片固定,并在正染色后于TEM下观察。对叶细胞的观察表明VLP存在于由质膜内陷形成的细胞外腔中(图19)。所观察的VLP的形态和位置表明,尽管其质膜附着在细胞壁上,但是植物细胞具有产生来源于其质膜的流感VLP并将它们累积在质外体空隙中所需的可塑性。
实施例6:质膜脂质分析
对植物流感病毒VLP的组成和来源的进一步验证来自于对脂质成分的分析。从经纯化的VLP提取脂质,并通过高效薄层色谱(HP-TLC)将其组成与高度纯化的烟草质膜的组成进行比较。来自VLP与对照质膜的极性和中性脂质的迁移模式相似。经纯化的VLP包含在质膜中发现的主要磷脂(磷脂酰胆碱和磷脂酰乙醇胺)和鞘脂(葡萄糖神经酰胺)(图27A),并且二者均含有作为唯一中性脂质的游离固醇(图27B)。然而,对经纯化VLP提取物中质膜蛋白质标志物(ATP酶)的免疫检测表明,VLP脂双层不包含与植物质膜相关的主要蛋白质中任一种,这表明宿主蛋白质可能在VLP从植物细胞中出芽的过程中被排除在膜以外(图27C)。
实施例7:H5 VLP的免疫原性以及施用途径的影响
通过肌内注射或鼻内(吸入)向小鼠施用由植物生产的H5 VLP。根据所述的方法,将0.1~12μg VLP肌内注射给小鼠,以明矾作为佐剂。使用最低抗原量即观察到了峰值抗,其幅度与5μg重组可溶性血凝素(HA)相似(图20A)。
0.1~1μg由植物生产的H5 VLP与壳聚糖佐剂一起鼻内施用所提供的抗体应答大于重组可溶性HA与明矾佐剂所提供的抗体应答(图20B)。
对于这两种施用途径而言,在一定的抗原量范围内,在所有测试小鼠中均观察到血清转换。重组H5可溶性抗原产生低的(<1/40)或可忽略不计的(1<1/10,对于未加佐剂的重组H5而言)HI效价。
实施例8:H5 VLP的血细胞凝集抑制抗体效价(HAI)
图21A、21B示意在用由植物生产的H5VLP或重组可溶性HA“加强”后第14天的血细胞凝集抑制(HAI)抗体应答。当肌内施用时最低剂量的抗原(0.1μg)所产生的HAI应答是施用5μg重组可溶性HA的10倍。与最低剂量相比,H5 VLP的剂量增加导致HAI适度增加。
鼻内施用后,与施用1μg重组可溶性HA的小鼠(其与阴性对照类似)相比,施用由植物生产的H5 VLP(1.0或0.1μg)之小鼠的HAI应答显著提高。通过肌内注射H5 VLP(0.1~12μg)免疫的所有小鼠的HAI效价均高于用对照HA抗原免疫的小鼠(图4a~图21A)。对于同样的5μg剂量,VLP诱导的HAI效价是相应剂量的对照HA抗原的20倍。当通过鼻内途径递送时,VLP诱导的HAI效价也显著高于对照HA抗原(图21b)。对于给定剂量的H5 VLP而言,鼻内免疫之小鼠的HAI效价水平低于肌内免疫的小鼠;当肌内施用时,1μg VLP诱导的平均HAI效价为210,而鼻内施用同样剂量所诱导的平均HAI效价为34。
当肌内施用时,所有剂量VLP均诱导高水平的能与失活的同源全病毒结合的抗体(图20b和24)。由植物生产的VLP疫苗与对照HA抗原之间无显著差异(除了加强后第14天的12μg VLP组以外),因为这两种抗原制备物均诱导针对同源毒株的高结合抗体效价。然而,当鼻内施用时,VLP诱导的结合抗体效价高于对照HA抗原(图20b)。当与壳聚糖混合时,用1μg VLP免疫诱导的平均Ab效价倒数为5500,其是在用1μg对照HA抗原免疫的小鼠中水平(平均Ab效价倒数为920)的8.6倍。
然后,通过在小鼠中进行剂量范围研究来研究由植物生产的流感VLP的免疫原性。以3周的间隔用配制在明矾(1∶1比例)中的0.1μg至12μg含有来自流感病毒A/印度尼西亚/5/05(H5N1)之HA的VLP肌内免疫数组BALB/c小鼠(每组5只)。使用失活全病毒抗原(A/印度尼西亚/5/05(H5N1))测量第二次免疫后第14天收集之血清的血细胞凝集抑制效价(HI)。用低至0.1μg剂量VLP进行的免疫诱导抗体产生,所述抗体在高稀释度下抑制病毒凝集红细胞(图21A)。用5μg非VLP、明矾佐剂化的对照H5抗原(同样来自A/印度尼西亚/5/05)平行免疫小鼠所诱导的HI应答比用最低VLP剂量所产生的HI应答低2~3个对数值。
对于两种施用途径而言,在一定的抗原量范围内,施用VLP之小鼠的HAI应答均更佳。
实施例9:佐剂对H5 VLP免疫原性的作用
由植物生产的H5 VLP具有质膜来源(图19,实施例5)。不希望受理论限制,包膜病毒或包膜病毒的VLP通常从其出芽的膜获得包膜。植物质膜含有植物固醇成分(即使在动物细胞中发现,也非常稀少),并且已表明这些固醇的某一些表现出免疫刺激作用。
在佐剂存在或不存在下,向小鼠肌内(图22A)或鼻内(图22B)施用由植物生产的H5 VLP,并测定HAI(血细胞凝集抑制抗体应答)。在添加或不添加佐剂(明矾或壳聚糖,如这些实施例中所示)下,以任一施用体系施用VLP表现出比重组可溶性HA显著更高的HAI血细胞凝集抑制。即使不添加佐剂(即明矾或壳聚糖),由植物生产的H5 VLP仍表现出显著的HAI,这表示对施用所述抗原的全身免疫应答。
明矾使肌内施用VLP的平均HAI效价水平提高至5倍(图22a),使对照HA抗原的平均HAI效价水平提高至3.7倍。当肌内施用时,5μgVLP诱导的平均HAI效价比对应剂量的对照HA抗原高12倍。壳聚糖不提高对照HA抗原的平均HAI水平(图22b),而其使鼻内施用1μgVLP免疫的小鼠的平均HAI水平提高5倍。
实施例10:抗体同种型
在存在或不存在明矾作为所添加佐剂的情形下,施用由植物生产的H5 VLP或重组可溶性HA的小鼠表现出多种免疫球蛋白同种型(图23A)。
在添加佐剂的情形下,VLP与HA的抗体同种型模式相似,其中IgG1是主要的同种型。当不添加佐剂而施用VLP或HA时,IgG1应答降低,但仍是响应于VLP的主要同种型,IgM、IgG2a、IgG2B和IgG3保持与添加佐剂时相似的效价。当不添加佐剂而施用HA时,IgG1、IgG2a和IgG2b效价显著降低。
因此,这些数据表明,由植物生产的VLP不需要添加佐剂来激发宿主的抗体应答。
图23B示意在添加抗原的情形下肌内施用由植物生产的VLP或可溶性重组HA的小鼠中抗失活全流感病毒株(A/印度尼西亚/5/05;A/越南/I 203/04)的抗体效价。在施用1μg或5μg VLP或者5μg可溶性HA的小鼠中未观察到针对这些流感毒株之抗体效价的显著差异。
实施例11:H5 VLP疫苗诱导的血清抗体的交叉反应性
评价了H5VLP疫苗诱导的血清抗体针对不同的失活全流感病毒株的交叉反应性。所有VLP剂量(0.1~12μg)以及5μg对照HA抗原均诱导针对进化枝1毒株(A/越南/1194/04)、进化枝2.1的同源毒株A/印度尼西亚/5/05以及进化枝2.2毒株A/火鸡/土耳其/1/05的高的结合抗体效价(图25A)。
然而,只有由植物生产的VLP诱导针对A/火鸡/土耳其/1/05毒株的HAI效价(图25b)。VLP针对A/印度尼西亚/5/05的HAI效价高。
实施例12:由植物生产的H5 VLP进行免疫所提供的交叉保护
向如上文所述先前已施用两剂方案之A/印度尼西亚/5/05 H5 VLP的小鼠随后用流感病毒A/土耳其/582/06(H5N1)(“土耳其H5N1”)感染性病毒进行鼻内攻击,并观察。每只动物所施用的剂量为10LD50(4.09×105CCID50)。
攻击后7天内,只有37.5%的施用PBS疫苗对照的小鼠在暴露于土耳其H5N1后存活(图26A)。100%的施用对照抗原(HA)或者1、5或15μg印度尼西亚H5 VLP的动物在攻击后存活至17天(此时实验结束)。
还在实验期间监测了小鼠的体重,并绘制了存活小鼠的平均体重图(图26B)。在攻击之前施用1、5或15μg印度尼西亚H5 VLP的小鼠在实验过程中没有可觉察的体重损失,特别是施用5μg VLP的小鼠似乎体重明显增加。阴性对照小鼠(未用土耳其H5N1攻击)没有可觉察的体重增加或减轻。阳性对照小鼠(未施用VLP,但用土耳其H5N1攻击)在实验过程中表现出体重显著减轻,并且其中有3只小鼠死亡。由于体重是所有同组小鼠的平均值,所以去除“患病最严重的”小鼠(死亡的3只)可导致体重明显呈整体增加,然而,需注意的是阳性对照组的平均体重仍然显著低于阴性组或VLP处理组的平均体重。
因此,这些数据表明,由植物生产的含有H5血凝素病毒蛋白的流感病毒VLP诱导特异性针对病原性流感毒株的免疫应答,并且病毒样颗粒可从植物质膜出芽。
因此,这些数据表明,植物能够生产流感病毒样颗粒,并且还首次表明病毒样颗粒可从植物质膜出芽。
此外,使用现有的瞬时表达技术,在得到靶标HA序列后仅用16天就生产了第一批抗原。按照当前的H5 VLP产量,以及示例性的5μg/对象的剂量,每千克经渗入的叶可生产约20000剂疫苗。除了其它实施方案以外,这种平台简单、能大量生产以及具有强免疫原性的独特组合为响应于大流行提供了新的方法。
实施例13:使用体积排阻色谱表征植物提取物中含有血凝素的结构
通过凝胶过滤对由植物生产的不同亚型流感病毒血凝素组装成高分子量结构进行评估。通过体积排阻色谱(SEC)利用SephacrylTM S-500HR柱(GE Healthcare Bio-Science Corp.,Piscataway,NJ,USA)对经AGL1/660、AGL1/540、AGL1/783、AGL1/780和AGL1/785渗入之植物的蛋白质粗提物或经浓缩蛋白质提取物(1.5mL)进行分级分离。如图46所示,Blue Dextran(2MDa)洗脱物早在级分10中出现峰值。当利用丙酮沉淀法将来自200μL各SEC洗脱级分的蛋白质浓缩(5倍)并通过Western印迹(图46)分析时,血凝素主要存在于级分7~14中,这表示HA已并入VLP中。不希望受理论限制,这表明HA蛋白已被组装成大的超级结构或者其已附着于高分子量结构上,而与所产生的亚型无关。
实施例14:通过农杆菌渗入在本塞姆氏烟草植物中瞬时表达季节性流感病毒血凝素
通过表达来自毒株A/布里斯班/59/2007(H1N1)(774号质粒)、A/新喀里多尼亚/20/1999(H1N1)(540号质粒)以及A/所罗门群岛/3/2006(H1N1)(775号质粒)的H1亚型来测定瞬时表达系统产生季节性流感病毒血凝素的能力。首先将血凝素基因编码序列组装在质体蓝素表达盒(苜蓿质体蓝素基因的启动子、5’UTR、3’UTR以及转录终止序列)中,将所组装的盒插入pCAMBIA二元质粒中。然后将所述质粒转染到农杆菌(AGL1)中,分别产生农杆菌株AGL1/774、AGL1/540和AGL1/775。
用AGL1/774、AGL1/540和AGL1/775渗入本塞姆氏烟草植物,并在6天培养期后收集叶。为了测定H1是否累积在经农杆菌渗入的叶中,首先从经渗入的叶组织中提取蛋白质,并用抗H1抗体通过Western印迹进行分析。检测到提取物中约72kDa的独特条带(图47),其大小对应于流感病毒血凝素的未切割的HA0形式。这表明不同的年度流行毒株的血凝素在经渗入叶中的表达导致未切割翻译产物的累积。
实施例15:通过农杆菌渗入在本塞姆氏烟草植物中瞬时表达潜在大流行流感病毒血凝素
通过表达来自毒株A/安徽/1/2005(H5N1)(781号质粒)、A/印度尼西亚/5/2005(H5N1)(660号质粒)以及A/越南/1194/2004(H5N1)(782号质粒)的H5亚型来测定瞬时表达系统产生潜在流感病毒血凝素的能力。首先将血凝素基因编码序列组装在质体蓝素表达盒(苜蓿质体蓝素基因的启动子、5’UTR、3’UTR以及转录终止序列)中,将所组装的盒插入pCAMBIA二元质粒中。然后将所述质粒转染到农杆菌(AGL1)中。
用AGL1/781、AGL1/660和AGL1/782渗入本塞姆氏烟草植物,并在6天培养期后收集叶。为了测定H5是否累积在经农杆菌渗入的叶中,首先从经渗入的叶组织中提取蛋白质,并用抗H5抗体通过Western印迹进行分析。检测到提取物中约72kDa的独特条带(图48),其大小对应于流感病毒血凝素的未切割的HA0形式。这表明不同的潜在大流行毒株的血凝素在经渗入叶中的表达导致未切割的翻译产物的累积。
实施例16:通过农杆菌渗入在普通烟草植物中瞬时表达H5
通过表达来自毒株A/印度尼西亚/5/2005(H5N1)(660号质粒)的H5亚型来分析瞬时表达系统在普通烟草的叶中产生流感病毒血凝素的能力。首先将血凝素基因编码序列组装在质体蓝素表达盒(苜蓿质体蓝素基因的启动子、5’UTR、3’UTR以及转录终止序列)中,将所组装的盒插入pCAMBIA二元质粒中。然后将所述质粒转染到农杆菌(AGL1)中。
用AGL1/660渗入普通烟草植物,并在6天培养期后收集叶。为了测定H5是否累积在经农杆菌渗入的叶中,首先从经渗入的叶组织中提取蛋白质,并用抗H5抗体通过Western印迹进行分析。检测到提取物中约72kDa的独特条带(图49),其大小对应于未切割的HA0形式的流感病毒血凝素。这表明血凝素在经渗入普通烟草叶中的表达导致未切割翻译产物的累积。
实施例17:由植物生产的来自A/印度尼西亚/5/05(H5N1)的H5N1 VLP疫苗在雪貂中的免疫原性
在雪貂中进行剂量渐增的研究以评价由植物生产的VLP的免疫原性。使用第一剂疫苗后第14天(图50A)和第二剂后第14天(图50B)采集的血清,通过另外三种H5N1毒株(A/火鸡/土耳其/1/05(进化枝2.2)、A/越南/1194/04(进化枝1)以及A/安徽/5/05(所有均为失活全病毒))的血细胞凝集抑制来评价3种剂量(1、5和15μg)下H5VLP疫苗所诱导血清抗体的体外交叉反应性。在所有3种剂量浓度下,均观察到交叉反应性。
实施例17:根据CHMP标准分析免疫原性结果
EMEA的人用医疗产品委员会(Committee for MedicinalProducts for Human Use,CHMP)(http://www.emea.europa.eu/htms/general/contacts/CHMP/CHMP.html)确立了疫苗效力的三个标准(适用于第二剂之后):1-血清转换的数目或HI效价显著增加(4倍)>40%;2-几何平均值增加至少2.5;3-达到1/40HI效价的对象比例应当为至少70%。在雪貂模型中对这些标准的分析示于表8~11中。(*)表示符合或超出CHMP标准。与用于颁发许可的CHMP标准相关的交叉免疫原性分析的总结于表12中。
每天评价动物的体重、体温和总体状况。在研究期间没有记录到患病或不适的迹象。在研究期间体重和体温在正常范围内。所述疫苗是安全的并被研究动物耐受。
表12:与用于颁发许可的CHMP标准相关的交叉免疫原性分析的总结
实施例18:血凝素核苷酸序列的选择
从流感病毒序列数据库(参见URL:flu.lanl.gov)或NCBI流感病毒源(参见URL:ncbi.nlm.nih.gov/genomes/FLU/FLU.html)获取HA的核苷酸序列。对于几种HA核酸序列而言,所述数据库中列了多个条目(表13)。一些变异主要与培养体系(来源-MDCK、蛋、未知、病毒RNA/临床分离株)有关;例如,当B型流感病毒在蛋的尿囊液中表达时,HA的第194位(以成熟蛋白质编号)的糖基化位点不存在(还参见Chen等,2008)。对一些序列而言,可缺少结构域(例如不完全克隆、测序假象等)。血凝素序列可分为5个结构域:信号肽(SP)、HA1、HA2、跨膜(DTm)和胞质尾。一个序列的结构域可与另一已有序列的结构域相组合,例如一种毒株之序列的信号肽可与另一毒株血凝素编码序列的平衡相组合以提供完整的编码序列。
表13:流感病毒亚型中所选HA编码序列的变异
Y,N-分别为是、否
SP-信号肽序列的存在 是/否
HA1-全长HA1结构域 是/否
HA2-全长HA2结构域 是/否
DTm-全长跨膜结构域 是/否
毒株:A/所罗门群岛/3/2006的H1
比较了8种氨基酸序列并鉴定了变异(表14)。在一些序列中,第171位表现出甘氨酸(G)或精氨酸(R)变异。
表14:A/所罗门群岛/3/2006的氨基酸变异
从起始M编号
毒株:A/布里斯班/59/2007的H1
第203位表现出天冬氨酸(D)、异亮氨酸(I)或天冬酰胺(N)变异。
毒株:A/布里斯班/10/2007的H3
在5个位置观察到序列变异(表15)。在两个采样序列的第215位观察到缺失。
表15:A/布里斯班/10/2007的H3的氨基酸变异
*从起始M编号
毒株:A/威斯康星/67/2005的H3
在该株的4个位置观察到序列变异(表16)。
表16:A/威斯康星/67/2005的H3的氨基酸变异
*从成熟蛋白开始编号
毒株:B/马来西亚/2506/2004的B型
在两个位置观察到变异(表17)。第120位不是糖基化位点;第210位参与糖基化;在蛋中培养之后该糖基化被消除。
表17:来自B/马来西亚/2506/2004的血凝素的氨基酸变异
*从SP中部开始编号
毒株:来自B/佛罗里达/4/2006的血凝素;ISDN261649
所观察的变异包括第211位的氨基酸序列变异,这取决于培养系统。在从MDCK细胞分离的序列中观察到天冬酰胺(N),而在从蛋分离的序列中观察到谷氨酸(D)。第211位是糖基化位点,并且在蛋中培养后被消除。
毒株:来自A/新加坡/1/1957的H2
在6个位置观察到序列变异(表18)。
表18:来自A/新加坡/1/1957的H2的氨基酸变异
1从成熟蛋白开始编号
毒株:来自A/越南/1194/2004的H5以及来自A/安徽/1/2005的H5
与这些H5株任一的一级序列比对,未观察到氨基酸序列的变异。
毒株:来自A/水鸭/香港/W312/1997的H6
毒株(AF250179)仅有一个条目可获取。
毒株:来自A/马/布拉格/56的H7
在数据库中总共发现2个序列条目。条目AB298877被排除在外,因此其是由实验室重组的。
毒株:来自A/香港/1073/1999的H9;AJ404626
在数据库中总计发现2个序列条目。只有一个是完整的。
所有引文通过引用并入本文。
本发明通过一个或多个实施方案进行了描述。然而,对于本领域技术人员而言显然的是,可在不背离权利要求中所述的本发明范围的情形下进行多种改动和改进。
参考文献:
Aymard,H M,M T Coleman,W R Dowdle,W G Laver,G C Schild,and R GWebster 1973 Influenza virus neuraminidase-inhibition test procedures BullW H O 48 199-202
Bollag,D M.,Rozycki,M D,and Edelstein,S J(1996)Protein methods(2ndedition)Wiley-Liss,New York,USA
Bligh,E G,& Dyer,W J Can J Med Sci 37,911-917(1959)
Chen,B J,Leser,G P,Morita,E,and Lamb R.A(2007)Influenza virushemagglutinin and neuraminidase,but not the matrix protein,are required forassembly and budding of plasmid-derived virus-like particles J Virol 81,7111-7123Chen Z,Aspelund A,Jin H 2008 Stabilizing the glycosylation pattern of influenza Bhemagglutinin following adaptation to growth in eggs Vaccine vol 26 p 361-371
Crawford,J,Wilkinson,B,Vosnesensky,A,Smith,G,Garcia,M,Stone,H,and Perdue,M L(1999)Baculovirus-derived hemagglutinin vaccines protectagainst lethal influenza infections by avian H5 and H7 subtypes Vaccine 17,2265-2274
Darveau,A,Pelletier,A & Perreault,J PCR-mediated synthesis of chimericmolecules Methods Neurosc.26,77-85(1995)
Grgacic EVL,Anderson DA.Virus-like particles passport to immune recognitionMethods 2006,40 60-65
Gillim-Ross,L,and Subbarao,K(2006)Emerging respiratory viruses chanllengesand vaccine strategies Clin Microbiol Rev 19,614-636
Gomez-Puertas,P,Mena,I,Castillo,M,Vivo,A,Perez-Pastrana,E and Portela,A(1999)Efficient formation of influenza virus-like particles dependence on theexpression level of viral proteins J Gen Virol 80,1635-1645Gomez-Puertas,P,Albo,C,Perez-Pastrana,E,Vivo,A,and Portela,A(2000)Influenza Virus protein is the major driving force in virus budding J Virol 74,11538-11547
Hamilton,A,Voinnet,O,Chappell,L & Baulcombe,D Two classes of shortinterfering RNA in RNA silencing.EMBO J 21,4671-4679(2002)
Hofgen,R & Willmitzer,L Storage of competent cells for Agrobacteriumtransformation Nucleic Acid Res 16,9877(1988)
Harbury PB,Zhang T,Kim PS,Alber T(1993)A switch between two-,three-,andfour-stranded coiled coils in GCN4 leucine zipper mutants Science;262 1401-1407)
Horimoto T,Kawaoka Y Strategies for developing vaccines against h5N1 influenzaa viruses Trends in Mol Med 2006,12(11)506-514
Huang Z,Elkin G,Maloney BJ,Beuhner N,Arntzen CJ,Thanavala Y,Mason HSVirus-like particle expression and assembly in plants hepatitis B and Norwalkviruses Vaccine 2005 Mar 7,23(15)1851-8
Johansson,B E(1999)Immunization with influenza A virus hemagglutinin andneuraminidase produced in recombinant baculovirus results in a balanced andbroadened immune response superior to conventional vaccine Vaccine 17,2073-2080
Latham,T,and Galarza,J M(2001)Formation of wild-type and chimericinfluenza virus-like particles following simultaneous expression of only fourstructural proteins J Virol 75,6154-6165
Lefebvre,B et al Plant Physiol 144,402-418(2007)
Leutwiler LS et al 1986 Nucleic Acid Sresearch 14910)4051-64
Liu,L & Lomonossoff,G P Agroinfection as a rapid method for propagating Cowpeamosaic virus-based constructs J Virol Methods 105,343-348(2002)
Macala,L J,Yo,R K & Ando,S J Lipid Res 24,1243-1250(1983)Mattanovich,D,Ruker,F,da Machado,A,Laimer,M,Regner,F,Steinkellner,H,Himmler,G,and Katinger,H(1989)Efficient transformation ofAgrobacterium spp By electroporation Nucl Ac Res 17,6747
Mena,I,Vivo,A,Perez,E,and Portela,A(1996)Rescue of syntheticchloramphenicol acetyltransferase RNA into influenza virus-like particles obtainedfrom recombinant plasmids J Virol 70,5016-5024
Mongrand S,Morel J,Laroche J,Claverol S,Carde JP,Hartmann MA et al Lipidrafts in higher plant cells The Journal of Biological Chemistry 2004,279(35)36277-36286
Neumann,G,Watanabe,T,and Kawaoka,Y(2000)Plasmid-driven formation ofvirus-like particles J Virol 74,547-551
Nayak DP,Reichl U.(2004)Neuraminidase activity assays for monitoring MDCKcell culture derived influenza virus J Virol Methods 122(1)9-15
Olsen,C W,McGregor,M W,Dybdahl-Sissoko,N,Schram,B R,Nelson,KM,Lunn,D,Macklin,M D,and Swain,W F(1997)Immunogemcity andefficacy of baculovirus-expressed and DNA-based equine influenza virushemagglutinin vaccines in mice Vaccine 15,1149-1156
Quan FS,Huang C,Compans RW,Kang SM Virus-like particle vaccine inducesprotective immunity against homologous and heterologous strains of influenza virusJournal of Virology 2007,81(7)3514-3524
Rowe,T et al 1999 Detection of antibody to avian influenza a(h5N1)virus inhuman serum by using a cmbiation of serologic assays J Clin Microbiol 37(4)937-43
Saint-Jore-Dupas C et al 2007 From planta to pharma with glycosylation in thetoolbox Trends in Biotechnology 25(7)317-23
Sambrook J,and Russell DW.Molecular cloning a laboratory manual Cold SpringHarbor,N Y Cold Spring Harbor Laboratory Press,2001Stockhaus J et al 1987 Analysis of cis-active sequences involved in the leaf-specificexpression of a potato gene in transgenic plants Proceedings of the NationalAcademy of Sciences U S S 84(22)7943-7947
Stockhaus J et al 1989 Identification of enhancer elements in the upstream region ofthe nuclear photosynthetic gene ST-LS1 Plant Cell 1(8)805-13
Suzuki,Y(2005)Sialobiology of influenza Molecular mechanism of host rangevariation of influenza viruses Biol Pharm Bull 28,399-408
Tsuji M,Cell Mol Life Sci,63(2006),1889-1898
Wakefield L,G G Brownlee Nuc Acid Res 17(1989),8569-8580
Kendal,AP,Pereira MS,Skehel J Concepts and procedures for laboratory-basedinfluenza surveillance Atlanta CDC,1982 p B 17-B35
WHO Manual on animal influenza diagnosis and surveillance.Department ofcommunicable disease surveillance and response.World Health Organisation GlobalInfluenza Program 2002
Skehel JJ and Wildy DC Ann Rev Biochem 2000 69 531-69
Vaccaro L et al 2005 Biophysical J 88 25-36
Gamblin,S J,Haire,L.F,Russell,R J,Stevens,D J,Xiao,B,Ha,Y,Vasisht,N,Steinhauer,D A,Daniels,R S,Elliot,A,Wiley,D C.,Skehel,J J(2004)Thestructure and receptor binding properties of the 1918 influenza hemagglutininScience 303 1838-1842
序列表
<110>麦迪卡格公司
马克-安德烈·德奥斯特
马农·科图雷
弗雷德里克·奥尔斯
索尼娅·特雷帕尼耶
皮埃尔-奥列弗·拉瓦
米凯莱·拉吉斯
路易斯-菲利普·韦齐纳
纳萨莉·兰德里
<120>含有血凝素的流感病毒样颗粒(VLP)
<130>V81270WO
<160>76
<170>PatentIn version 3.5
<210>1
<211>1556
<212>DNA
<213>流感病毒
<400>1
agatcttcgc tgacacaata tgtataggct accatgccaa caactcaacc gacactgttg 60
acacagtact tgagaagaat gtgacagtga cacactctgt caacctactt gaggacagtc 120
acaatggaaa actatgtcta ctaaaaggaa tagccccact acaattgggt aattgcagcg 180
ttgccggatg gatcttagga aacccagaat gcgaattact gatttccaag gaatcatggt 240
cctacattgt agaaacacca aatcctgaga atggaacatg ttacccaggg tatttcgccg 300
actatgagga actgagggag caattgagtt cagtatcttc atttgagaga ttcgaaatat 360
tccccaaaga aagctcatgg cccaaccaca ccgtaaccgg agtatcagca tcatgctccc 420
ataatgggaa aagcagtttt tacagaaatt tgctatggct gacggggaag aatggtttgt 480
acccaaacct gagcaagtcc tatgtaaaca acaaagagaa agaagtcctt gtactatggg 540
gtgttcatca cccgcctaac atagggaacc aaagggcact ctatcataca gaaaatgctt 600
atgtctctgt agtgtcttca cattatagca gaagattcac cccagaaata gccaaaagac 660
ccaaagtaag agatcaggaa ggaagaatca actactactg gactctgctg gaacctgggg 720
atacaataat atttgaggca aatggaaatc taatagcgcc atggtatgct tttgcactga 780
gtagaggctt tggatcagga atcatcacct caaatgcacc aatggatgaa tgtgatgcga 840
agtgtcaaac acctcaggga gctataaaca gcagtcttcc tttccagaat gtacacccag 900
tcacaatagg agagtgtcca aagtatgtca ggagtgcaaa attaaggatg gttacaggac 960
taaggaacat cccatccatt caatccagag gtttgtttgg agccattgcc ggtttcattg 1020
aaggggggtg gactggaatg gtagatgggt ggtatggtta tcatcatcag aatgagcaag 1080
gatctggcta tgctgcagat caaaaaagta cacaaaatgc cattaacggg attacaaaca 1140
aggtcaattc tgtaattgag aaaatgaaca ctcaattcac agctgtgggc aaagagttca 1200
acaaattgga aagaaggatg gaaaacttaa ataaaaaagt tgatgatggg tttctagaca 1260
tttggacata taatgcagaa ttgttggttc tactggaaaa tgaaaggact ttggatttcc 1320
atgactccaa tgtgaagaat ctgtatgaga aagtaaaaag ccaattaaag aataatgcca 1380
aagaaatagg aaacgggtgt tttgagttct atcacaagtg taacaatgaa tgcatggaga 1440
gtgtgaaaaa tggtacctat gactatccaa aatattccga agaatcaaag ttaaacaggg 1500
agaaaattga tggagtgaaa ttggaatcaa tgggagtata ctaagagctc aggcct 1556
<210>2
<211>219
<212>DNA
<213>流感病毒
<400>2
ggtacctatg actatccaaa atattccgaa gaatcaaagt taaacaggga gaaaattgat 60
ggagtgaaat tggaatcaat gggagtatac cagattctgg cgatctactc aactgtcgcc 120
agttccctgg ttcttttggt ctccctgggg gcaatcagct tctggatgtg ttccaatggg 180
tctttgcagt gtagaatatg catctaagag ctcaggcct 219
<210>3
<211>1719
<212>DNA
<213>流感病毒
<400>3
aagcttatgg agaaaatagt gcttcttctt gcaatagtca gtcttgttaa aagtgatcag 60
atttgcattg gttaccatgc aaacaattca acagagcagg ttgacacaat catggaaaag 120
aacgttactg ttacacatgc ccaagacata ctggaaaaga cacacaacgg gaagctctgc 180
gatctagatg gagtgaagcc tctaatttta agagattgta gtgtagctgg atggctcctc 240
gggaacccaa tgtgtgacga attcatcaat gtaccggaat ggtcttacat agtggagaag 300
gccaatccaa ccaatgacct ctgttaccca gggagtttca acgactatga agaactgaaa 360
cacctattga gcagaataaa ccattttgag aaaattcaaa tcatccccaa aagttcttgg 420
tccgatcatg aagcctcatc aggagttagc tcagcatgtc catacctggg aagtccctcc 480
ttttttagaa atgtggtatg gcttatcaaa aagaacagta catacccaac aataaagaaa 540
agctacaata ataccaacca agaggatctt ttggtactgt ggggaattca ccatcctaat 600
gatgcggcag agcagacaag gctatatcaa aacccaacca cctatatttc cattgggaca 660
tcaacactaa accagagatt ggtaccaaaa atagctacta gatccaaagt aaacgggcaa 720
agtggaagga tggagttctt ctggacaatt ttaaaaccta atgatgcaat caacttcgag 780
agtaatggaa atttcattgc tccagaatat gcatacaaaa ttgtcaagaa aggggactca 840
gcaattatga aaagtgaatt ggaatatggt aactgcaaca ccaagtgtca aactccaatg 900
ggggcgataa actctagtat gccattccac aacatacacc ctctcaccat cggggaatgc 960
cccaaatatg tgaaatcaaa cagattagtc cttgcaacag ggctcagaaa tagccctcaa 1020
agagagagca gaagaaaaaa gagaggacta tttggagcta tagcaggttt tatagaggga 1080
ggatggcagg gaatggtaga tggttggtat gggtaccacc atagcaatga gcaggggagt 1140
gggtacgctg cagacaaaga atccactcaa aaggcaatag atggagtcac caataaggtc 1200
aactcaatca ttgacaaaat gaacactcag tttgaggccg ttggaaggga atttaataac 1260
ttagaaagga gaatagagaa tttaaacaag aagatggaag acgggtttct agatgtctgg 1320
acttataatg ccgaacttct ggttctcatg gaaaatgaga gaactctaga ctttcatgac 1380
tcaaatgtta agaacctcta cgacaaggtc cgactacagc ttagggataa tgcaaaggag 1440
ctgggtaacg gttgtttcga gttctatcac aaatgtgata atgaatgtat ggaaagtata 1500
agaaacggaa cgtacaacta tccgcagtat tcagaagaag caagattaaa aagagaggaa 1560
ataagtgggg taaaattgga atcaatagga acttaccaaa tactgtcaat ttattcaaca 1620
gtggcgagtt ccctagcact ggcaatcatg atggctggtc tatctttatg gatgtgctcc 1680
aatggatcgt tacaatgcag aatttgcatt taagagctc 1719
<210>4
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>4
gtattagtaa ttagaatttg gtgtc 25
<210>5
<211>44
<212>DNA
<213>人工序列
<220>
<223>引物
<400>5
gcaagaagaa gcactatttt ctccattttc tctcaagatg atta 44
<210>6
<211>45
<212>DNA
<213>人工序列
<220>
<223>引物
<400>6
ttaatcatct tgagagaaaa tggagaaaat agtgcttctt cttgc 45
<210>7
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物
<400>7
actttgagct cttaaatgca aattctgcat tgtaacga 38
<210>8
<211>1471
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>8
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt 1020
ttcggcttat tgttttctct tcttgtgttg gttccttctc agatctgagc tctaagttaa 1080
aatgcttctt cgtctcctat ttataatatg gtttgttatt gttaattttg ttcttgtaga 1140
agagcttaat taatcgttgt tgttatgaaa tactatttgt atgagatgaa ctggtgtaat 1200
gtaattcatt tacataagtg gagtcagaat cagaatgttt cctccataac taactagaca 1260
tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac taaaattgaa catcttttgc 1320
cacaacttta taagtggtta atatagctca aatatatggt caagttcaat agattaataa 1380
tggaaatatc agttatcgaa attcattaac aatcaactta acgttattaa ctactaattt 1440
tatatcatcc cctttgataa atgatagtac a 1471
<210>9
<211>565
<212>PRT
<213>流感病毒
<400>9
Met Lys Ala Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr
1 5 10 15
Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr
20 25 30
Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn
35 40 45
Leu Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile
50 55 60
Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly
65 70 75 80
Asn Pro Glu Cys Glu Leu Leu Ile Ser Lys Glu Ser Trp Ser Tyr Ile
85 90 95
Val Glu Thr Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Tyr Phe
100 105 110
Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe
115 120 125
Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr
130 135 140
Val Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Lys Ser Ser Phe
145 150 155 160
Tyr Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn
165 170 175
Leu Ser Lys Ser Tyr Val Asn Asn Lys Glu Lys Glu Val Leu Val Leu
180 185 190
Trp Gly Val His His Pro Pro Asn Ile Gly Asn Gln Arg Ala Leu Tyr
195 200 205
His Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg
210 215 220
Arg Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu
225 230 235 240
Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile
245 250 255
Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Trp Tyr Ala Phe Ala
260 265 270
Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Thr Ser Asn Ala Pro Met
275 280 285
Asp Glu Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser
290 295 300
Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro
305 310 315 320
Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn
325 330 335
Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
340 345 350
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His
355 360 365
His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr
370 375 380
Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu
385 390 395 400
Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu
405 410 415
Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu
420 425 430
Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu
435 440 445
Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys
450 455 460
Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys
465 470 475 480
Phe Glu Phe Tyr His Lys Cys Asn Asn Glu Cys Met Glu Ser Val Lys
485 490 495
Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn
500 505 510
Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln
515 520 525
Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val
530 535 540
Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln
545 550 555 560
Cys Arg Ile Cys Ile
565
<210>10
<211>568
<212>PRT
<213>流感病毒
<400>10
Met Glu Lys Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser
1 5 10 15
Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val
20 25 30
Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile
35 40 45
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys
50 55 60
Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn
65 70 75 80
Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val
85 90 95
Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro Gly Ser Phe Asn
100 105 110
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu
115 120 125
Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser
130 135 140
Ser Gly Val Ser Ser Ala Cys Pro Tyr Leu Gly Ser Pro Ser Phe Phe
145 150 155 160
Arg Asn Val Val Trp Leu Ile Lys Lys Asn Ser Thr Tyr Pro Thr Ile
165 170 175
Lys Lys Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Val Leu Trp
180 185 190
Gly Ile His His Pro Asn Asp Ala Ala Glu Gln Thr Arg Leu Tyr Gln
195 200 205
Asn Pro Thr Thr Tyr Ile Ser Ile Gly Thr Ser Thr Leu Asn Gln Arg
210 215 220
Leu Val Pro Lys Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly
225 230 235 240
Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn
245 250 255
Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile
260 265 270
Val Lys Lys Gly Asp Ser Ala Ile Met Lys Ser Glu Leu Glu Tyr Gly
275 280 285
Asn Cys Asn Thr Lys Cys Gln Thr Pro Met Gly Ala Ile Asn Ser Ser
290 295 300
Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys
305 310 315 320
Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser
325 330 335
Pro Gln Arg Glu Ser ArgArg Lys Lys Arg Gly Leu Phe Gly Ala Ile
340 345 350
Ala Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr
355 360 365
Gly Tyr His His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys
370 375 380
Glu Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser
385 390 395 400
Ile Ile Asp Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe
405 410 415
Asn Asn Leu Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp
420 425 430
Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met
435 440 445
Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu
450 455 460
Tyr Asp Lys Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly
465 470 475 480
Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu
485 490 495
Ser Ile Arg Asn Gly Thr Tyr Asn Tyr Pro Gln Tyr Ser Glu Glu Ala
500 505 510
Arg Leu Lys Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly
515 520 525
Thr Tyr Gln Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala
530 535 540
Leu Ala Ile Met Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly
545 550 555 560
Ser Leu Gln Cys Arg Ile Cys Ile
565
<210>11
<211>1629
<212>DNA
<213>A型流感病毒
<400>11
gacaaaatat gtcttgggca ccatgctgtg gcaaatggaa caaaagtgaa cacattaaca 60
gagaggggga ttgaagtagt gaacgccaca gagacggtgg aaactgcgaa tatcaagaaa 120
atatgtattc aagggaaaag gccaacagat ctgggacaat gtggacttct aggaacccta 180
ataggacctc cccaatgtga tcaattcctg gagttttact ctgatttgat aattgagcga 240
agagaaggaa ccgatgtgtg ctatcccggt aaattcacaa atgaagaatc actgaggcag 300
atccttcgag ggtcaggagg aattgataag gagtcaatgg gtttcaccta tagtggaata 360
agaaccaatg gagcgacaag tgcctgcaaa agatcaggtt cttctttcta tgcagagatg 420
aagtggttgc tgtcgaattc agacaatgcg gcattccctc aaatgacaaa gtcgtataga 480
aatcccagaa acaaaccagc tctgataatt tggggagttc atcactctgg atcggttagc 540
gagcagacca aactctatgg aagtggaaac aagttgataa cagtaggaag ctcaaaatac 600
cagcaatcat tcaccccaag tccgggagca cggccacaag tgaatggaca atcagggaga 660
atcgattttc actggctact ccttgatccc aatgacacag tgaccttcac tttcaatggg 720
gcattcatag cccctgacag ggcaagtttc tttagaggag aatcactagg agtccagagt 780
gatgttcctc tggattctag ttgtggaggg gattgctttc acagtggggg tacgatagtc 840
agttccctgc cattccaaaa catcaaccct agaactgtgg ggagatgccc tcggtatgtc 900
aaacagacaa gcctcctttt ggctacagga atgagaaatg ttccagagaa tccaaagccc 960
agaggccttt ttggagcaat tgctggattc atagagaatg gatgggaggg tctcatcgat 1020
ggatggtatg gtttcagaca tcaaaatgca caaggggaag gaactgcagc tgactacaaa 1080
agcacccaat ctgcaataga tcagatcaca ggcaaattga atcgtctgat tgacaaaaca 1140
aatcagcagt ttgagctgat agacaatgag ttcaatgaga tagaacaaca aataggaaat 1200
gtcattaatt ggacacgaga cgcaatgact gaggtatggt cgtataatgc tgagctgttg 1260
gtggcaatgg aaaatcagca tacaatagat cttgcggact cagaaatgaa caaactttat 1320
gagcgtgtca gaaaacaact aagggagaat gctgaagaag atggaactgg atgttttgag 1380
atattccata agtgtgatga tcagtgcatg gagagcataa ggaacaacac ttatgaccat 1440
actcaataca gaacagagtc attgcagaat agaatacaga tagacccagt gaaattgagt 1500
agtggataca aagacataat cttatggttt agcttcgggg catcatgttt tcttcttcta 1560
gccgttgtaa tgggattggt tttcatttgc ataaagaatg gaaacatgcg gtgcaccatt 1620
tgtatataa 1629
<210>12
<211>1773
<212>DNA
<213>A型流感病毒
<400>12
agcaaaagca ggggttatac catagacaac caaaggcaag acaatggcca tcatttatct 60
aattcttctg ttcacagcag tgagagggga ccaaatatgc attggatacc attccaacaa 120
ttccacagaa aaggttgaca caatcctaga gagaaatgtc actgtgactc acgctgagga 180
cattcttgag aagactcaca atgggaagtt atgcaaacta aatggaatcc ctccacttga 240
attaagggat tgcagcattg ccggatggct ccttgggaat ccagaatgtg atatacttct 300
aactgtgcca gaatggtcat acataataga aaaagaaaat ccaaggaacg gcttgtgcta 360
cccaggcagt ttcaatgatt atgaagaatt gaagcatctt atcagcagcg tgacacattt 420
tgagaaagta aagattctgc ccagaaatga atggacacag catacaacaa ctggaggttc 480
acaggcttgc gcagactatg gtggtccgtc attcttccgg aacatggtct ggttgacaaa 540
gaaagggtcg aattatccaa ttgccaaaag atcttacaac aatacaagtg gggaacaaat 600
gctgatcatt tgggggatac atcaccccaa tgatgaaagt gaacaaagag cattgtatca 660
gaatgtgggg acctatgtgt cagtaggaac atcaacactg aacaaaagat catccccaga 720
aatagcaaca agacctaaag tgaatggaca aggaggcaga atggaattct cgtggactat 780
cttagatata tgggacacaa taaattttga gagtactggc aatctaattg caccagaata 840
tggtttcaaa atatccaaac gaggtagttc agggatcatg aaaacagaag gaaaacttga 900
aaactgcgag accaagtgcc aaactccttt gggagcaata aatacaacat taccctttca 960
caatatccac ccactgacca ttggtgagtg ccccaaatat gtaaaatcgg aaagattagt 1020
cttagcaaca ggactaagaa acgtccctca gattgagtca aggggattgt ttggggcaat 1080
agctggtttt atagagggtg gatggcaagg aatggttgat ggttggtatg ggtatcatca 1140
cagcaatgac cagggatctg ggtatgcagc agacaaagaa tccactcaaa aggcaattga 1200
tggaatcacc aacaaggtaa attctgtgat cgaaaagatg aacacccaat tcggagctgt 1260
tggaaaagaa ttcagtaact tggagagaag actggagaac ttgaataaaa agatggagga 1320
cggatttcta gatgtgtgga catacaatgc cgagctccta gttctaatgg aaaatgagag 1380
gacacttgac tttcatgatt ctaatgtcaa gaatctatat gataaagtca gaatgcaact 1440
gagagacaat gcaaaagaac tagggaatgg atgttttgaa ttttatcaca aatgtgatga 1500
tgaatgcatg aacagtgtga agaatgggac atatgattat tccaagtatg aagaggagtc 1560
taaactaaac aggactgaaa tcaaaggggt taaattgagc aatatggggg tttatcaaat 1620
ccttgccatc tatgctacag tagcaggttc cctgtcactg gcaatcatga tagctgggat 1680
ttctatatgg atgtgctcca acgggtctct gcaatgcaga atctgcatat gatcatcagt 1740
cattttgtaa ttaaaaacac ccttgtttct act 1773
<210>13
<211>1086
<212>DNA
<213>A型流感病毒
<400>13
caaaaacttc ccggaaatga caacagcacg gcaacgctgt gccttgggca ccatgcagta 60
ccaaacggaa cgatagtgaa aacaatcacg aatgaccaaa ttgaagttac taatgctact 120
gagctggtac agagttcctc aacaggtgga atatgcgaca gtcctcatca gatccttgat 180
ggagaaaact gcacactaat agatgctcta ttgggagacc ctcagtgtga tggcttccaa 240
aataagaaat gggacctttt tgttgaacgc agcaaagcct acagcaactg ttacccttat 300
gatgtgccgg attatgcctc ccttaggtca ctagttgcct catccggcac actggagttt 360
aacaatgaaa gcttcgattg gactggagtc actcagaatg gaacaagctc tgcttgcaaa 420
aggagatcta ataaaagttt ctttagtaga ttgaattggt tgacccactt aaaatacaaa 480
tacccagcat tgaacgtgac tatgccaaac aatgaaaaat ttgacaaatt gtacatttgg 540
ggggttcacc acccgggtac ggacagtgac caaatcagcc tatatgctca agcatcagga 600
agaatcacag tctctaccaa aagaagccaa caaactgtaa tcccgaatat cggatctaga 660
cccagggtaa gggatgtctc cagccgaata agcatctatt ggacaatagt aaaaccggga 720
gacatacttt tgattaacag cacagggaat ctaattgctc ctcggggtta cttcaaaata 780
cgaagtggga aaagctcaat aatgagatca gatgcaccca ttggcaaatg caattccgaa 840
tgcatcactc caaatggaag cattcccaat gacaaaccat ttcaaaatgt aaacaggatc 900
acatatgggg cctgtcccag atatgttaag caaaacactc tgaaattggc aacagggatg 960
cgaaatgtac cagagaaaca aactagaggc atatttggcg caatcgcggg tttcatagaa 1020
aatggttggg agggaatggt ggacggttgg tacggtttca ggcatcaaaa ttctgagggc 1080
acagga 1086
<210>14
<211>1048
<212>DNA
<213>A型流感病毒
<400>14
atgctatcaa tcacgattct gtttctgctc atagcagagg gttcctctca gaattacaca 60
gggaatcccg tgatatgcct gggacatcat gccgtatcca atgggacaat ggtgaaaacc 120
ctgactgatg accaagtaga agttgtcact gcccaagaat tagtggaatc gcaacatcta 180
ccggagttgt gtcctagccc tttaagatta gtagatggac aaacttgtga catcgtcaat 240
ggtgccttgg ggagtccagg ctgtgatcac ttgaatggtg cagaatggga tgtcttcata 300
gaacgaccca ctgctgtgga cacttgttat ccatttgatg tgccggatta ccagagccta 360
cggagtatcc tagcaaacaa tgggaaattt gagttcattg ctgaggaatt ccaatggaac 420
acagtcaaac aaaatgggaa atccggagca tgcaaaagag caaatgtgaa tgactttttc 480
aacagattga actggctgac caaatctgat gggaatgcat acccacttca aaacctgaca 540
aaggttaaca acggggacta tgcaagactt tacatatggg gagttcatca tccttcaact 600
gacacagaac aaaccaactt gtataagaac aaccctggga gagtaactgt ttccaccaaa 660
accagtcaaa caagtgtggt accaaacatt ggcagtagac catgggtaag aggccaaagc 720
ggcaggatta gcttctattg gacaattgtg gagccaggag acctcatagt cttcaacacc 780
atagggaatt taattgctcc gagaggtcat tacaagctta acagtcaaaa gaagagcaca 840
attctgaata ctgcaattcc cataggatct tgtgttagta aatgtcacac agataggggt 900
tcaatctcta caaccaaacc ctttcagaac atctcaagaa tatcaattgg ggactgtccc 960
aagtatgtca aacagggatc cttgaaacta gctacaggaa tgaggaatat ccctgagaaa 1020
gcaaccagag gcctgtttgg tgcaattg 1048
<210>15
<211>1707
<212>DNA
<213>A型流感病毒
<400>15
atggagaaaa tagtgcttct tcttgcaata gtcagtcttg ttaaaagtga tcagatttgc 60
attggttacc atgcaaacaa ctcgacagag caggttgaca caataatgga aaagaacgtt 120
actgttacac atgcccaaga catactggaa aagacacaca acgggaaact ctgcgatcta 180
gatggagtga agcctctaat tttgagagat tgtagtgtag ctggatggct cctcggaaac 240
cctatgtgtg acgaattcat caatgtgccg gaatggtctt acatagtgga gaaggccagt 300
ccagccaatg acctctgtta cccaggggat ttcaacgact atgaagaact gaaacaccta 360
ttgagcagaa taaaccactt tgagaaaatt cagatcatcc ccaaaagttc ttggtccaat 420
catgaagcct catcaggggt gagcgcagca tgtccatacc atgggaagcc ctcctttttc 480
agaaatgtgg tatggcttat caaaaagaac agtgcatacc caacaataaa gaggagctac 540
aataatacca accaagaaga tcttttggta ctgtggggga ttcaccatcc taatgatgcg 600
gcagagcaga caaagctcta tcaaaaccca accacctata tttccgttgg aacatcaaca 660
ctaaaccaga gattggtccc aaaaatagct actagatcca aagtaaacgg gcaaagtgga 720
agaatggagt tcttctggac aattttaaag ccgaatgatg ccataaattt cgagagtaat 780
ggaaatttca ttgctccaga atatgcatac aaaattgtca agaaagggga ctcagcaatt 840
atgaaaagtg aattggaata tggtaactgc aacaccaagt gtcaaactcc aatgggggcg 900
ataaactcta gtatgccatt ccacaacata caccctctca caatcgggga atgccccaaa 960
tatgtgaaat caaacagatt agtccttgcg actggactca gaaatacccc tcaaagagat 1020
agaagaagaa aaaagagagg actatttgga gctatagcag gttttataga gggaggatgg 1080
caaggaatgg tagatggttg gtatgggtac caccatagca atgagcaggg gagtggatac 1140
gctgcagaca aagaatccac tcaaaaggca atagatggag tcaccaataa ggtcaactcg 1200
atcattgaca aaatgaacac tcagtttgag gccgttggaa gggaatttaa taacttagaa 1260
aggaggatag aaaatttaaa caagaagatg gaagacggat tcctagatgt ctggacttat 1320
aatgctgaac ttctggttct catggaaaat gagagaactc tagactttca tgattcaaat 1380
gtcaagaacc tttacaacaa ggtccgacta cagcttaggg ataatgcaaa ggagctgggt 1440
aatggttgtt tcgagttcta tcacaaatgt gataatgaat gtatggaaag tgtaaaaaac 1500
gggacgtatg actacccgca gtattcagaa gaagcaagac taaacagaga ggaaataagt 1560
ggagtaaaat tggaatcaat gggaacttac caaatactgt caatttattc aacagtggcg 1620
agttccctag cactggcaat catggtagct ggtctatctt tatggatgtg ctccaatggg 1680
tcgttacaat gcagaatttg catttaa 1707
<210>16
<211>1050
<212>DNA
<213>A型流感病毒
<400>16
atgattgcaa tcattgtaat agcgatactg gcagcagccg gaaagtcaga caagatctgc 60
attgggtatc atgccaacaa ttcaacaaca caggtggata cgatacttga gaagaatgta 120
accgtcacac actcagttga attgctggag aatcagaagg aagaaagatt ctgcaagatc 180
ttgaacaagg cccctctcga cctaaaggga tgcaccatag agggttggat cttggggaat 240
ccccaatgcg atctgttgct tggtgaccaa agctggtcat atatagtgga aagacctact 300
gcccaaaatg ggatatgcta cccaggagct ttgaatgagg tagaagaact gaaagcattt 360
atcggatcag gagaaagggt agagagattt gagatgtttc ccaaaagcac atgggcaggg 420
gtagacacca gcagtggggt aacaaaagct tgtccttata atagtggttc atctttctac 480
agaaacctcc tatggataat aaagaccaag tcagcagcgt atccagtaat taagggaact 540
tacagcaaca ctggaaacca gccaatcctc tatttctggg gtgtgcacca tcctcctgac 600
accaatgagc aaaatactct gtatggctct ggcgatcggt atgttaggat gggaactgag 660
agcatgaatt ttgccaagag cccagaaatt gcggcaagac ccgctgtgaa tggccaaaga 720
ggtcgaattg attattactg gtctgtttta aaaccaggag aaaccttgaa tgtggaatct 780
aatggaaatc taatcgctcc ttggtatgca tacaaatttg tcaacacaaa taataaggga 840
gccgtcttca agtcaaattt accaatcgag aattgcgatg ccacatgcca gactattgca 900
ggagtcctaa ggaccaataa aacatttcag aatgtgagcc ctctgtggat aggagaatgc 960
cccaagtatg tgaaaagtga aagtctaagg cttgctactg gactaagaaa tgttccacag 1020
attgaaacca gagggctttt cggagctatc 1050
<210>17
<211>1698
<212>DNA
<213>A型流感病毒
<400>17
atggaaaaat tcatcgcaat agcaaccttg gcgagcacaa atgcatacga taggatatgc 60
attgggtacc aatcaaacaa ctccacagac acagtgaaca ctctcataga acagaatgta 120
ccagtcaccc aaacaatgga gctcgtggaa acagagaaac atcccgctta ttgtaacact 180
gatttaggtg ccccattgga actgcgagac tgcaagattg aggcagtaat ctatgggaac 240
cccaagtgtg acatccatct gaaggatcaa ggttggtcat acatagtgga gaggcccagc 300
gcaccagaag ggatgtgtta ccctggatct gtggaaaatc tagaagaact gaggtttgtc 360
ttctccagtg ctgcatctta caagagaata agactatttg actattccag gtggaatgtg 420
actagatctg gaacgagtaa agcatgcaat gcatcaacag gtggccaatc cttctatagg 480
agcatcaatt ggttgaccaa aaaggaacca gacacttatg acttcaatga aggagcttat 540
gttaataatg aagatggaga catcattttc ttatggggga tccatcatcc gccggacaca 600
aaagagcaga caacactata taaaaatgca aacactttga gtagtgttac tactaacact 660
ataaacagaa gctttcaacc aaatattggt cccagaccat tagtaagagg acagcaaggg 720
aggatggatt actattgggg cattctgaaa agaggggaga ctctgaagat caggaccaac 780
ggaaatttaa tcgcacctga atttggctat ctgctcaaag gtgaaagcta cggcagaata 840
attcaaaatg aggatatacc catcgggaac tgtaacacaa aatgtcaaac atatgcggga 900
gcaatcaata gcagcaaacc ctttcagaat gcaagtaggc attacatggg agaatgtccc 960
aaatatgtga agaaggcaag cttgcgactt gcagttgggc ttaggaatac gccttctgtt 1020
gaacccagag gactgtttgg agccattgct ggtttcattg aaggaggatg gtctggaatg 1080
attgatgggt ggtatggatt tcatcacagc aattcagagg gaacaggaat ggcagctgac 1140
cagaaatcaa cacaagaagc catcgataag atcaccaata aagtcaacaa tatagttgac 1200
aagatgaaca gggagtttga agttgtgaat catgagttct ctgaagttga aaaaagaata 1260
aacatgataa acgataaaat agatgaccaa attgaagatc tttgggctta caatgcagag 1320
ctccttgtgc tcttagagaa ccagaaaacg ctagacgaac atgattccaa tgtcaaaaac 1380
ctttttgatg aagtgaaaag gagactgtca gccaatgcaa tagatgctgg gaacggttgc 1440
tttgacatac ttcacaaatg cgacaatgag tgtatggaaa ctataaagaa cggaacttac 1500
gatcataagg aatatgaaga ggaggctaaa ctagaaagga gcaagataaa tggagtaaaa 1560
ctagaagaga acaccactta caaaattctt agcatttaca gtacagtggc ggccagtctt 1620
tgcttggcaa tcctgattgc tggaggttta atcctgggca tgcaaaatgg atcttgtaga 1680
tgcatgttct gtatttga 1698
<210>18
<211>1363
<212>DNA
<213>A型流感病毒
<400>18
atggaaacag tatcactaat gactatacta ctagtagcaa cagcaagcaa tgcagacaaa 60
atctgcatcg gccaccagtc aacaaactcc acagaaactg tggacacgct aacagaaacc 120
aatgttcctg tgacacatgc caaagaattg ctccacacag agcacaatgg aatgctgtgt 180
gcaacaaatc tgggacatcc cctaatctta gacacgtgca ctattgaagg actgatctat 240
ggtaaccctt cttgtgactt gctgttggga ggaagagaat ggtcctacat cgtcgaaagg 300
tcatcagctg taaatggaac gtgttaccct gggaatgtag agaacctaga ggaactcagg 360
acacttttta gttccgctag ttcctaccga agaatccaaa tcttcccaga cacaatctgg 420
aatgtgactt acactggaac aagcaaagca tgttcagatt cattctacag gagtatgaga 480
tggctgactc aaaaaagcgg gtcttaccct gttcaagacg ctcaatacac aaataatatg 540
ggaaagagca ttcttttcgt gtggggcata catcacccac ccactgaagc tgcacagaca 600
aatttgtaca caagaaccga cacaacaaca agcgtgacaa cagaagactt aaataggatc 660
ttcaaaccga tggtagggcc aaggcccctt gtcaatggtc tgcagggaag aattaattat 720
tattggtcgg tactaaaacc aggccagaca ctgcgagtaa gatccaatgg gaatctaatt 780
gctccatggt atggacacat tctttcggga gggagccatg gaagaatcct gaagactgat 840
ttaaaaagta gtaattgcgt agtgcaatgt cagactgaaa aaggcggctt aaacagtaca 900
ttgccgttcc acaatatcag taaatatgca tttggaaact gtcccaaata tgttagagtt 960
aaaagtctca aactggcagt agggttgagg aacgtgcctg ctagatcaag tagaggacta 1020
ttcggagcca tagctggatt catagaagga ggttggccag gactagtcgc tggttggtat 1080
ggtttccagc attcaaatga tcaaggggtt ggtattgcgg cagataggga ttcaactcaa 1140
aaggcaattg atagaataac aaccaaggtg aataatatag tcgacaaaat gaacaaacaa 1200
tatgaaataa ttgatcatga attcagtgag gttgaaacta ggctcaacat gatcaataat 1260
aagattgatg accaaataca agacatatgg gcatataatg cagagttgct agtactactt 1320
gaaaaccaga aaacactcga tgagcatgac gcaaatgtga aga 1363
<210>19
<211>1727
<212>DNA
<213>A型流感病毒
<400>19
agcaaaagca ggggtcacaa tgtacaaagt agtagtaata attgcgctcc ttggagcagt 60
gaaaggtctt gacagaatct gcctaggaca ccatgcggtt gccaatggaa ccattgtgaa 120
gacccttaca aatgaacaag aggaagtgac caatgctact gagacggtag agagcacaaa 180
tttgaataaa ttgtgtatga aaggaagaag ctacaaggac ttgggcaatt gtcacccggt 240
aggaatgttg ataggaacac ctgtttgtga tccgcacttg accgggacct gggacactct 300
cattgagcga gagaatgcca ttgcccactg ttatccaggg gcaaccataa atgaagaagc 360
attgaggcag aaaataatgg aaagtggagg aatcagcaag atgagcactg gcttcactta 420
tgggtcttcc atcacctcag ctgggaccac taaggcatgc atgagaaatg gaggagatag 480
tttctatgca gagctcaaat ggctagtgtc aaagacaaag ggacaaaatt tccctcagac 540
aacaaacacc tatcggaata cggacacagc agaacatctc ataatatggg gaattcatca 600
cccttccagc acacaggaaa agaatgactt atacggaact cagtcactat ctatatcagt 660
tgagagttct acatatcaga acaactttgt tccagttgtt ggggcaagac ctcaggtcaa 720
tggacaaagt gggcgaattg actttcactg gacactagta cagccgggtg acaacataac 780
cttctcagac aatggaggtc taatagcacc aagtcgagtt agcaaattaa ctggaaggga 840
tttgggaatc caatcagaag cgttgataga caacagttgt gaatccaaat gcttttggag 900
agggggttct ataaatacaa agctcccttt tcaaaatctg tcacccagaa cagtaggtca 960
atgccccaaa tacgtaaatc agaggagttt actgcttgca acagggatga ggaatgtgcc 1020
agaagtggtg cagggaaggg gtctgtttgg tgcaatagca gggttcatag aaaacggatg 1080
ggaaggaatg gtagacggct ggtatggttt cagacaccaa aatgcccagg gcacaggcca 1140
agctgctgat tacaagagta ctcaagcagc tattgaccaa atcacaggga aactgaacag 1200
gttgattgag aagaccaaca ctgagtttga gtcaatagaa tctgaattca gtgagactga 1260
gcatcaaatt ggtaacgtca ttaattggac caaagattca ataaccgaca tttggactta 1320
caacgcagag ctattagtgg caatggagaa tcagcacaca attgacatgg ctgattcaga 1380
gatgctaaat ctgtatgaaa gggtaagaaa gcaactcaga cagaatgcag aagaagacgg 1440
aaagggatgt tttgagatat atcatacttg tgatgattcg tgcatggaga gtataaggaa 1500
caatacttat gaccattcac aatacagaga ggaggctctt ctgaatagac tgaacatcaa 1560
cccagtgaaa ctttcttcgg ggtacaaaga catcatactt tggtttagct tcggggaatc 1620
atgctttgtt cttctagccg ttgttatggg tcttgttttc ttctgcctga aaaatggaaa 1680
catgcgatgc acaatctgta tttagttaaa aacaccttgt ttctact 1727
<210>20
<211>1698
<212>DNA
<213>A型流感病毒
<400>20
atggagaaaa cactgctatt tgcagctatt ttcctttgtg tgaaagcaga tgagatctgt 60
atcgggtatt taagcaacaa ctcgacagac aaagttgaca caataattga gaacaatgtc 120
acggtcacta gctcagtgga actggttgag acagaacaca ctggatcatt ctgttcaatc 180
aatggaaaac aaccaataag ccttggagat tgttcatttg ctggatggat attaggaaac 240
cctatgtgtg atgaactaat tggaaagact tcatggtctt acattgtgga aaaacccaat 300
ccaacaaatg gaatctgtta cccaggaact ttagagagtg aagaagaact aagactgaaa 360
ttcagtggag ttttagaatt taacaaattc gaagtattca catcaaatgg atggggtgct 420
gtaaattcag gagtaggagt aaccgctgca tgcaaattcg ggggttctaa ttctttcttt 480
cgaaacatgg tatggctgat acaccaatca ggaacatatc ctgtaataaa gagaaccttt 540
aacaacacca aagggagaga tgtactgatt gtttggggaa ttcatcatcc tgctacactg 600
acagaacatc aagatctgta taaaaaggac agctcctatg tagcagtggg ttcagagacc 660
tacaacagaa gattcactcc agaaatcaac actaggccca gagtcaatgg acaggccgga 720
cggatgacat tctactggaa gatagtcaaa ccaggagaat caataacatt cgaatctaat 780
ggggcgttcc tagctcctag atatgctttt gagattgtct ctgttggaaa tgggaaactg 840
ttcaggagcg aactgaacat tgaatcatgc tctaccaaat gtcaaacaga aataggagga 900
attaatacga acaaaagctt ccacaatgtt cacagaaaca ctatcgggga ttgccccaag 960
tatgtgaatg tcaaatcctt aaagcttgca acaggaccta gaaatgtccc agcaatagca 1020
tcgagaggct tgtttggagc aatagctgga ttcatagaag ggggatggcc tggactgatc 1080
aatggatggt atgggttcca acacagggac gaagaaggaa caggcattgc agcagacaag 1140
gagtcaactc aaaaggcaat agaccagata acatccaagg taaataacat cgttgacagg 1200
atgaatacaa actttgagtc tgtgcaacac gaattcagtg aaatagagga aagaataaat 1260
caattatcaa aacacgtaga tgattctgtg gttgacatct ggtcatataa tgcacagctt 1320
ctcgttttac ttgaaaatga gaagacactg gacctccatg actcaaatgt caggaacctc 1380
catgagaaag tcagaagaat gctaaaggac aatgccaaag atgaggggaa cggatgcttc 1440
accttttacc ataagtgtga caataaatgc attgaacgag ttagaaacgg aacatatgat 1500
cataaagaat tcgaggagga atcaaaaatc aatcgccagg agattgaagg ggtgaaacta 1560
gattctagtg ggaatgtgta taaaatactg tcaatttaca gctgcattgc aagcagtctt 1620
gtattggcag cactcatcat ggggttcatg ttttgggcat gcagtaatgg atcatgtaga 1680
tgtaccattt gcatttag 1698
<210>21
<211>1695
<212>DNA
<213>A型流感病毒
<400>21
atggaaaaat tcatcatttt gagtactgtc ttggcagcaa gctttgcata tgacaaaatt 60
tgcattggat accaaacaaa caactcgact gaaacggtaa acacactaag tgaacaaaac 120
gttccggtga cgcaggtgga agaacttgta catcgtggga ttgatccgat cctgtgtgga 180
acggaactag gatcaccact agtgcttgat gactgttcat tagagggtct aatcctaggc 240
aatcccaaat gtgatcttta tttgaatggc agggaatggt catacatagt agagaggccc 300
aaagagatgg aaggagtttg ctatccaggg tcaattgaaa accaggaaga gctaagatct 360
ctgttttctt ccatcaaaaa atatgaaaga gtgaagatgt ttgatttcac caaatggaat 420
gtcacataca ctgggaccag caaggcctgc aataatacat caaaccaagg ctcattctat 480
aggagcatga gatggttgac cttaaaatca ggacaatttc cagtccaaac agatgagtac 540
aagaacacca gagattcaga cattgtattc acctgggcca ttcaccaccc accaacatct 600
gatgaacaag taaaattata caaaaatcct gatactctct cttcagtcac caccgtagaa 660
atcaatagga gcttcaagcc taatataggg ccaagaccac tcgtgagagg acaacaaggg 720
agaatggatt actactgggc tgttcttaaa cctggacaaa cagtcaaaat acaaaccaat 780
ggtaatctta ttgcacctga atatggtcac ttaatcacag ggaaatcaca tggcaggata 840
ctcaagaata atttgcccat gggacagtgt gtgactgaat gtcaattgaa cgagggtgta 900
atgaacacaa gcaaaccttt ccagaacact agtaagcact atattgggaa atgccccaaa 960
tacataccat cagggagttt aaaattggca atagggctca ggaatgtccc acaagttcaa 1020
gatcgggggc tctttggagc aattgcaggt ttcatagaag gcggatggcc agggctagtg 1080
gctggttggt acggatttca gcatcaaaat gcggagggga caggcatagc tgcagacaga 1140
gacagcaccc aaagggcaat agacaatatg caaaacaaac tcaacaatgt catcgacaaa 1200
atgaataaac aatttgaagt ggtgaatcat gagttttcag aagtggaaag cagaataaac 1260
atgattaatt ccaaaattga tgatcagata actgacatat gggcatacaa tgctgaattg 1320
cttgtcctat tggaaaatca gaagacatta gatgagcatg acgctaatgt aaggaatcta 1380
catgatcggg tcagaagagt cctgagggaa aatgcaattg acacaggaga cggctgcttt 1440
gagattttac ataaatgtga caacaattgt atggacacga ttagaaacgg gacatacaat 1500
cacaaagagt atgaggaaga aagcaaaatc gaacgacaga aagtcaatgg tgtgaaactt 1560
gaggagaatt ctacatataa aattctgagc atctacagca gtgttgcctc aagcttagtt 1620
ctactgctca tgattattgg gggtttcatt ttcgggtgtc aaaatggaaa tgttcgttgt 1680
actttctgta tttaa 1695
<210>22
<211>1701
<212>DNA
<213>A型流感病毒
<400>22
atggctctaa atgtcattgc aactttgaca cttataagtg tatgtgtaca tgcagacaga 60
atatgcgtgg ggtatctgag caccaattca tcagaaaggg tcgacacgct ccttgaaaat 120
ggggtcccag tcaccagctc cattgatctg attgagacaa accacacagg aacatactgt 180
tctctaaatg gagtcagtcc agtgcatttg ggagattgca gctttgaagg atggattgta 240
ggaaacccag cctgcaccag caactttggg atcagagagt ggtcatacct gattgaggac 300
cccgcggccc ctcatgggct ttgctaccct ggagaattaa acaacaatgg tgaactcaga 360
cacttgttca gtggaatcag gtcattcagt agaacggaat tgatcccacc tacctcctgg 420
ggggaagtac ttgacggtac aacatctgct tgcagagata acacgggaac caacagcttc 480
tatcgaaatt tagtttggtt tataaagaag aatactagat atccagttat cagtaagacc 540
tacaacaata caacgggaag ggatgtttta gttttatggg gaatacatca cccagtgtct 600
gtggatgaga caaagactct gtatgtcaat agtgatccat acacactggt ttccaccaag 660
tcttggagcg agaaatataa actagaaacg ggagtccgac ctggctataa tggacagagg 720
agctggatga aaatttattg gtctttgata catccagggg agatgattac tttcgagagt 780
aatggtggat ttttagcccc aagatatggg tacataattg aagaatatgg aaaaggaagg 840
attttccaga gtcgcatcag aatgtctagg tgcaacacca agtgccagac ttcggttgga 900
gggataaaca caaacagaac gttccaaaac atcgataaga atgctcttgg tgactgtccc 960
aaatacataa agtctggcca actcaagcta gccactggac tcagaaatgt gccagctata 1020
tcgaatagag gattgttcgg agcaattgca gggttcatag aaggaggctg gccaggttta 1080
atcaatggtt ggtacggttt tcagcatcaa aatgaacagg gaacaggaat agctgcagac 1140
aaagaatcaa cacagaaagc tatagaccag ataacaacca aaataaataa cattattgat 1200
aaaatgaatg ggaactatga ttcaattagg ggtgaattca atcaagttga gaagcgtata 1260
aacatgcttg cagacagaat agatgatgcc gtgacggaca tttggtcata caatgccaaa 1320
cttcttgtat tgctggaaaa tgataaaact ttagatatgc atgatgctaa tgtaaagaat 1380
ttacatgagc aagtacgaag agaattgaag gacaatgcaa ttgacgaagg aaatggctgt 1440
tttgaactcc ttcataaatg caatgactcc tgcatggaaa ctataagaaa tggaacgtat 1500
gaccacactg agtatgcaga ggagtcaaag ttaaagaggc aagaaatcga tgggatcaaa 1560
ctcaaatcag aagacaacgt ttacaaagca ttatcaatat acagttgcat tgcaagtagt 1620
gttgtactag taggactcat actctctttc atcatgtggg cctgtagtag tgggaattgc 1680
cgattcaatg tttgtatata a 1701
<210>23
<211>1749
<212>DNA
<213>A型流感病毒
<400>23
agcaaaagca ggggaaaatg attgcactca tattggttgc actggctctg agccacactg 60
cttattctca gatcacaaat gggacaacag gaaaccccat tatatgcttg gggcatcatg 120
cagtggaaaa cggcacatct gttaaaacac taacagacaa tcacgtagaa gttgtgtcag 180
ctaaagaatt agttgagacg aaccacactg atgaactgtg cccaagcccc ttgaagcttg 240
tcgacgggca agactgccac ctcatcaatg gtgcattggg gagtccaggc tgtgaccgtt 300
tgcaggacac cacttgggat gtcttcattg aaaggcccac tgcagtagac acatgttatc 360
cattcgacgt cccagattac cagagtctca gaagcatcct agcaagcagt gggagtttgg 420
agttcatcgc cgaacaattc acctggaatg gtgtcaaagt tgacggatca agcagtgctt 480
gtttgagggg cggtcgcaac agcttcttct cccgactaaa ctggctaacc aaagcaacaa 540
atggaaacta tggacctatt aacgtcacta aagaaaatac gggctcttat gtcaggctct 600
atctctgggg agtgcatcac ccatcaagcg ataatgagca aacggatctc tacaaggtgg 660
caacagggag agtaacagta tctacccgct cggaccaaat cagtattgtt cccaatatag 720
gaagtagacc gagggtaagg aatcagagcg gcaggataag catctactgg accctagtaa 780
acccagggga ctccatcatt ttcaacagta ttgggaattt gattgcacca agaggccact 840
acaaaataag caaatctact aagagcacag tgcttaaaag tgacaaaagg attgggtcat 900
gcacaagccc ttgcttaact gataaaggtt cgatccaaag tgacaaacct tttcagaatg 960
tatcaaggat tgctatagga aactgcccga aatatgtaaa gcaagggtcc ctgatgttag 1020
caactggaat gcgcaacatc cctggcaaac aggcaaaggg cttatttggg gcaattgctg 1080
gattcattga aaatggttgg caaggcctga ttgatgggtg gtatggattc aggcaccaaa 1140
atgctgaagg aacaggaact gctgcagacc tgaagtcaac tcaggcagcc attgatcaga 1200
taaatggcaa gctgaacaga ttgatagaga agacaaatga aaaatatcac caaatagaaa 1260
aggaattcga acaggtggaa ggaagaatac aagaccttga gaagtacgtt gaggacacta 1320
agattgattt gtggtcatac aatgctgaat tgctagtagc actagagaat cagcacacaa 1380
tagatgtcac agactccgaa atgaacaagc tttttgaaag agtaagaagg caattaagag 1440
agaatgcaga agatcaaggc aacggttgtt tcgagatatt ccatcagtgt gacaacaatt 1500
gtatagaaag cattagaaac ggaacttatg accacaacat ctacagggat gaagccatca 1560
acaatcgaat caaaataaat cctgtcactt tgacgatggg gtacaaggac ataatcctgt 1620
ggatttcttt ctccatgtca tgctttgtct tcgtggcact gattctggga tttgttctat 1680
gggcttgtca aaacgggaat atccgatgcc aaatctgtat ataaagaaaa aacacccttg 1740
tttctactc 1749
<210>24
<211>1762
<212>DNA
<213>A型流感病毒
<400>24
agcaaaagca ggggatacaa aatgaacact caaatcatcg tcattctagt cctcggactg 60
tcgatggtga gatctgacaa gatttgtctc gggcaccatg ccgtagcaaa tgggacaaaa 120
gtcaacacac taactgagaa aggagtggaa gtggtcaatg ccacggagac agtggagatt 180
acaggaataa ataaagtgtg cacaaaaggg aagaaagcgg tggacttggg atcttgtgga 240
atactgggaa ctatcattgg gcctccacaa tgtgactctc atcttaaatt caaagctgat 300
ctgataatag aaagaagaaa ttcaagtgac atctgttacc cagggaaatt cactaatgag 360
gaagcactga gacaaataat cagagaatct ggtggaattg acaaagagcc aatgggattt 420
agatattcag gaataaaaac agacggggca accagtgcgt gtaagagaac agtgtcctct 480
ttctactcag aaatgaaatg gcttttatcc agcaaggcta accaggtgtt cccacaactg 540
aatcagacat acaggaacaa cagaaaagaa ccagccctaa ttgtttgggg agtacatcat 600
tcaagttcct tggatgagca aaataagcta tatggagctg ggaacaagct gataacagta 660
ggaagctcaa aataccaaca atcgttttca ccaagtccag gggacaggcc caaagtgaat 720
ggtcaggccg ggaggatcga ctttcattgg atgctattgg acccagggga tacagtcact 780
tttaccttca atggtgcatt catagcccca gatagagcca cctttctccg ctctaatgcc 840
ccatcgggag ttgagtacaa tgggaagtca ctgggaatac agagtgatgc acaaattgat 900
gaatcatgtg aaggggaatg cttctacagt ggagggacaa taaacagccc tttgccattt 960
caaaacatcg atagttgggc tgtcggaagg tgccccagat atgtaaagca atcaagcctg 1020
ccgctggcct taggaatgaa aaatgtacca gagaaaatac atactagggg actgttcggt 1080
gcaattgcag gattcatcga gaatggatgg gaaggactca ttgatggatg gtatggattt 1140
aggcatcaaa atgcacaggg gcagggaaca gctgctgact acaagagtac tcaggctgca 1200
attgaccaga taacagggaa acttaataga ttaattgaaa aaaccaacac acagtttgaa 1260
ctcatagaca atgagttcac tgaagtggag cagcagatag gcaatgtaat aaactggaca 1320
agggactcct tgactgagat ctggtcatac aatgctgaac ttctagtagc aatggaaaat 1380
cagcatacaa ttgaccttgc agattctgaa atgaacaaac tctatgagag agtgagaaga 1440
cagctaaggg agaatgccga ggaggatgga actggatgtt ttgagatttt ccaccgatgt 1500
gacgatcaat gtatggagag catacgaaat aatacttaca atcacactga atatcgacag 1560
gaagccttac agaataggat aatgatcaat ccggtaaagc ttagtggtgg gtacaaagat 1620
gtgatactat ggtttagctt cggggcatca tgtgtaatgc ttctagccat tgctatgggt 1680
cttattttca tgtgtgtgaa aaacgggaat ctgcggtgca ctatctgtat ataattattt 1740
gaaaaacacc cttgtttcta ct 1762
<210>25
<211>1760
<212>DNA
<213>A型流感病毒
<400>25
agcaaaagca ggggatattg tcaaaacaac agaatggtga tcaaagtgct ctactttctc 60
atcgtattgt taagtaggta ttcgaaagca gacaaaatat gcataggata tctaagcaac 120
aacgccacag acacagtaga cacactgaca gagaacggag ttccagtgac cagctcagtt 180
gatctcgttg aaacaaacca cacaggaaca tactgctcac tgaatggaat cagcccaatt 240
catcttggtg actgcagctt tgagggatgg atcgtaggaa acccttcctg tgccaccaac 300
atcaacatca gagagtggtc gtatctaatt gaggacccca atgcccccaa caaactctgc 360
ttcccaggag agttagataa taatggagaa ttacgacatc tcttcagcgg agtgaactct 420
tttagcagaa cagaattaat aagtcccaac aaatggggag acattctgga tggagtcacc 480
gcttcttgcc gcgataatgg ggcaagcagt ttttacagaa atttggtctg gatagtgaag 540
aataaaaatg gaaaataccc tgtcataaag ggggattaca ataacacaac aggcagagat 600
gttctagtac tctggggcat tcaccatccg gatacagaaa caacagccat aaacttgtac 660
gcaagcaaaa acccctacac attagtatca acaaaggaat ggagcaaaag atatgaacta 720
gaaattggca ccagaatagg tgatggacag agaagttgga tgaaactata ttggcacctc 780
atgcgccctg gagagaggat aatgtttgaa agcaacgggg gccttatagc gcccagatac 840
ggatacatca ttgagaagta cggtacagga cgaattttcc aaagtggagt gagaatggcc 900
aaatgcaaca caaagtgtca aacatcatta ggtgggataaacaccaacaa aactttccaa 960
aacatagaga gaaatgctct tggagattgc ccaaagtaca taaagtctgg acagctgaag 1020
cttgcaactg ggctgagaaa tgtcccatcc gttggtgaaa gaggtttgtt tggtgcaatt 1080
gcaggcttca tagaaggagg gtggcctggg ctaattaatg gatggtatgg tttccagcat 1140
cagaatgaac aggggactgg cattgctgca gacaaagcct ccactcagaa agcgatagat 1200
gaaataacaa caaaaattaa caatataata gagaagatga acggaaacta tgattcaata 1260
agaggggaat tcaatcaagt agaaaagagg atcaacatgc tcgctgatcg agttgatgat 1320
gcagtaactg acatatggtc gtacaatgct aaacttcttg tactgcttga aaatgggaga 1380
acattggact tacacgacgc aaatgtcagg aacttacacg atcaggtcaa gagaatattg 1440
aaaagtaatg ctattgatga aggagatggt tgcttcaatc ttcttcacaa atgtaatgac 1500
tcatgcatgg aaactattag aaatgggacc tacaatcatg aagattacag ggaagaatca 1560
caactgaaaa ggcaggaaat tgagggaata aaattgaagt ctgaagacaa tgtgtataaa 1620
gtactgtcga tttatagctg cattgcaagc agtattgtgc tggtaggtct catacttgcg 1680
ttcataatgt gggcatgcag caatggaaat tgccggttta atgtttgtat atagtcggaa 1740
aaaataccct tgtttctact 1760
<210>26
<211>1882
<212>DNA
<213>A型流感病毒
<400>26
agcagaagcg ttgcattttc taatatccac aaaatgaagg caataattgt actactcatg 60
gtagtaacat ccaatgcaga tcgaatctgc actgggataa catcgtcaaa ctcacctcat 120
gtggttaaaa ctgccactca aggggaagtc aatgtgactg gtgtgatacc actaacaaca 180
acacctacca aatctcattt tgcaaatctc aaaggaacac agaccagagg aaaactatgc 240
ccaaactgtt ttaactgcac agatctggac gtggccctag gcagaccaaa atgcatgggg 300
aacacaccct ccgcaaaagt ctcaatactc catgaagtca aacctgctac atctggatgc 360
tttcctataa tgcacgacag aacaaaaatc agacaactac ctaatcttct cagaggatat 420
gaaaacatca ggttatcaac cagtaatgtt atcaatacag agacggcacc aggaggaccc 480
tacaaggtgg ggacctcagg atcttgccct aacgttgcta atgggaacgg cttcttcaac 540
acaatggctt gggttatccc aaaagacaac aacaagacag caataaatcc agtaacagta 600
gaagtaccat acatttgttc agaaggggaa gaccaaatta ctgtttgggg gttccactct 660
gatgacaaaa cccaaatgga aagactctat ggagactcaa atcctcaaaa gttcacctca 720
tctgccaatg gagtaaccac acattatgtt tctcagattg gtggcttccc aaatcaaaca 780
gaagacgaag ggctaaaaca aagcggcaga attgttgttg attacatggt acaaaaacct 840
ggaaaaacag gaacaattgt ttatcaaaga ggcattttat tgcctcaaaa agtgtggtgc 900
gcaagtggca ggagcaaggt aataaaaggg tccttgcctt taattggtga agcagattgc 960
ctccacgaaa agtacggtgg attaaataaa agcaagcctt actacacagg agagcatgca 1020
aaggccatag gaaattgccc aatatgggtg aaaacaccct tgaagctggc caatggaacc 1080
aaatatagac cgcctgcaaa actattaaag gaaagaggtt tcttcggagc tattgctggt 1140
ttcttggaag gaggatggga aggaatgatt gcaggttggc acggatacac atctcatgga 1200
gcacatggag tggcagtggc agcagacctt aagagtacac aagaagctat aaacaagata 1260
acaaaaaatc tcaactattt aagtgagcta gaagtaaaaa accttcaaag actaagcgga 1320
gcaatgaatg agcttcacga cgaaatactc gagctagacg aaaaagtgga tgatctaaga 1380
gctgatacaa taagctcaca aatagagctt gcagtcttgc tttccaacga agggataata 1440
aacagtgaag atgagcatct cttggcactt gaaagaaaac tgaagaaaat gcttggcccc 1500
tctgctgtag aaatagggaa tgggtgcttt gaaaccaaac acaaatgcaa ccagacttgc 1560
ctagacagga tagctgctgg cacctttaat gcaggagatt tttctcttcc cacttttgat 1620
tcattaaaca ttactgctgc atctttaaat gatgatggct tggataatca tactatactg 1680
ctctactact caactgctgc ttctagcttg gctgtaacat taatgatagc tatcttcatt 1740
gtctacatgg tctccagaga caatgtttct tgttccatct gtctgtgagg gagattaagc 1800
cctgtgtttt cctttactgt agtgctcatt tgcttgtcac cattacaaag aaacgttatt 1860
gaaaaatgct cttgttacta ct 1882
<210>27
<211>2073
<212>DNA
<213>A型流感病毒
<400>27
agcagaagca gggggttaat aatgtttttc tcattactct tggtgttggg cctcacagag 60
gctgaaaaaa taaagatatg ccttcaaaag caagtgaaca gtagcttcag cctacacaat 120
ggcttcggag gaaatttgta tgccacagaa gaaaaaagaa tgtttgagct tgttaagccc 180
aaagctggag cctctgtctt gaatcaaagt acatggattg gctttggaga ttcaaggact 240
gacaaaagca attcagcttt tcctaggtct gctgatgttt cagcaaaaac tgctgataag 300
tttcgttttt tgtctggtgg atccttaatg ttgagtatgt ttggcccacc tgggaaggta 360
gactaccttt accaaggatg tggaaaacat aaagtttttt atgaaggagt taactggagt 420
ccacatgctg ctataaattg ttacagaaaa aattggactg atatcaaact gaatttccag 480
aaaaacattt atgaattggc ttcacaatca cattgcatga gcttggtgaa tgccttggac 540
aaaactattc ctttacaagt gactgctggg actgcaggaa attgcaacaa cagcttctta 600
aaaaatccag cattgtacac acaagaagtc aagccttcag aaaacaaatg tgggaaagaa 660
aatcttgctt tcttcacact tccaacccaa tttggaacct atgagtgcaa actgcatctt 720
gtggcttctt gctatttcat ctatgatagt aaagaagtgt acaataaaag aggatgtgac 780
aactactttc aagtgatcta tgattcattt ggaaaagtcg ttggaggact agataacagg 840
gtatcacctt acacagggaa ttctggagac accccaacaa tgcaatgtga catgctccag 900
ctgaaacctg gaagatattc agtaagaagc tctccaagat tccttttaat gcctgaaaga 960
agttattgct ttgacatgaa agaaaaagga ccagtcactg ctgtccaatc catttgggga 1020
aaaggcagag aatctgacta tgcagtggat caagcttgcttgagcactcc agggtgcatg 1080
ttgatccaaa agcaaaagcc atacattgga gaagctgatg atcaccatgg agatcaagaa 1140
atgagggagt tgctgtcagg actggactat gaagctagat gcatatcaca atcagggtgg 1200
gtgaatgaaa ccagtccttt tacggagaaa tacctccttc ctcccaaatt tggaagatgc 1260
cctttggctg caaaggaaga atccattcca aaaatcccag atggccttct aattcccacc 1320
agtggaaccg ataccactgt aaccaaacct aagagcagaa tttttggaat cgatgacctc 1380
attattggtg tgctctttgt tgcaatcgtt gaaacaggaa ttggaggcta tctgcttgga 1440
agtagaaaag aatcaggagg aggtgtgaca aaagaatcag ctgaaaaagg gtttgagaaa 1500
attggaaatg acatacaaat tttaaaatct tctataaata tcgcaataga aaaactaaat 1560
gacagaattt ctcatgatga gcaagccatc agagatctaa ctttagaaat tgaaaatgca 1620
agatctgaag ctttattggg agaattggga ataataagag ccttattggt aggaaatata 1680
agcataggat tacaggaatc tttatgggaa ctagcttcag aaataacaaa tagagcagga 1740
gatctagcag ttgaagtctc cccaggttgc tggataattg acaataacat ttgtgatcaa 1800
agctgtcaaa attttatttt caagttcaac gaaactgcac ctgttccaac cattccccct 1860
cttgacacaa aaattgatct gcaatcagat cctttttact ggggaagcag cttgggctta 1920
gcaataactg ctactatttc attggcagct ttggtgatct ctgggatcgc catctgcaga 1980
actaaatgat tgagacaatt ttgaaaaatg gataatgtgt tggtcaatat tttgtacagt 2040
tttataaaaa acaaaaatcc ccttgctact gct 2073
<210>28
<211>1670
<212>DNA
<213>流感病毒
<400>28
agatcttcgc tgacacaata tgtataggct accatgccaa caactcaacc gacactgttg 60
acacagtact tgagaagaat gtgacagtga cacactctgt caacctactt gaggacagtc 120
acaatggaaa actatgtcta ctaaaaggaa tagccccact acaattgggt aattgcagcg 180
ttgccggatg gatcttagga aacccagaat gcgaattact gatttccaag gaatcatggt 240
cctacattgt agaaacacca aatcctgaga atggaacatg ttacccaggg tatttcgccg 300
actatgagga actgagggag caattgagtt cagtatcttc atttgagaga ttcgaaatat 360
tccccaaaga aagctcatgg cccaaccaca ccgtaaccgg agtatcagca tcatgctccc 420
ataatgggaa aagcagtttt tacagaaatt tgctatggct gacggggaag aatggtttgt 480
acccaaacct gagcaagtcc tatgtaaaca acaaagagaa agaagtcctt gtactatggg 540
gtgttcatca cccgcctaac atagggaacc aaagggcact ctatcataca gaaaatgctt 600
atgtctctgt agtgtcttca cattatagca gaagattcac cccagaaata gccaaaagac 660
ccaaagtaag agatcaggaa ggaagaatca actactactg gactctgctg gaacctgggg 720
atacaataat atttgaggca aatggaaatc taatagcgcc atggtatgct tttgcactga 780
gtagaggctt tggatcagga atcatcacct caaatgcacc aatggatgaa tgtgatgcga 840
agtgtcaaac acctcaggga gctataaaca gcagtcttcc tttccagaat gtacacccag 900
tcacaatagg agagtgtcca aagtatgtca ggagtgcaaa attaaggatg gttacaggac 960
taaggaacat cccatccatt caatccagag gtttgtttgg agccattgcc ggtttcattg 1020
aaggggggtg gactggaatg gtagatgggt ggtatggtta tcatcatcag aatgagcaag 1080
gatctggcta tgctgcagat caaaaaagta cacaaaatgc cattaacggg attacaaaca 1140
aggtcaattc tgtaattgag aaaatgaaca ctcaattcac agctgtgggc aaagagttca 1200
acaaattgga aagaaggatg gaaaacttaa ataaaaaagt tgatgatggg tttctagaca 1260
tttggacata taatgcagaa ttgttggttc tactggaaaa tgaaaggact ttggatttcc 1320
atgactccaa tgtgaagaat ctgtatgaga aagtaaaaag ccaattaaag aataatgcca 1380
aagaaatagg aaacgggtgt tttgagttct atcacaagtg taacaatgaa tgcatggaga 1440
gtgtgaaaaa tggtacctat gactatccaa aatattccga agaatcaaag ttaaacaggg 1500
agaaaattga tggagtgaaa ttggaatcaa tgggagtata ccagattctg gcgatctact 1560
caactgtcgc cagttccctg gttcttttgg tctccctggg ggcaatcagc ttctggatgt 1620
gttccaatgg gtctttgcag tgtagaatat gcatctaaga gctcaggcct 1670
<210>29
<211>32
<212>DNA
<213>人工序列
<220>
<223>引物
<400>29
agttccccgg gctggtatat ttatatgttg tc 32
<210>30
<211>46
<212>DNA
<213>人工序列
<220>
<223>引物
<400>30
aatagagctc cattttctct caagatgatt aattaattaa ttagtc 46
<210>31
<211>46
<212>DNA
<213>人工序列
<220>
<223>引物
<400>31
aatagagctc gttaaaatgc ttcttcgtct cctatttata atatgg 46
<210>32
<211>48
<212>DNA
<213>人工序列
<220>
<223>引物
<400>32
ttacgaattc tccttcctaa ttggtgtact atcatttatc aaagggga 48
<210>33
<211>1711
<212>DNA
<213>流感病毒
<400>33
atgaaagcaa aactactggt cctgttatgt acatttacag ctacatatgc agacacaata 60
tgtataggct accatgccaa caactcaacc gacactgttg acacagtact tgagaagaat 120
gtgacagtga cacactctgt caacctactt gaggacagtc acaatggaaa actatgtcta 180
ctaaaaggaa tagccccact acaattgggt aattgcagcg ttgccggatg gatcttagga 240
aacccagaat gcgaattact gatttccaag gaatcatggt cctacattgt agaaacacca 300
aatcctgaga atggaacatg ttacccaggg tatttcgccg actatgagga actgagggag 360
caattgagtt cagtatcttc atttgagaga ttcgaaatat tccccaaaga aagctcatgg 420
cccaaccaca ccgtaaccgg agtatcagca tcatgctccc ataatgggaa aagcagtttt 480
tacagaaatt tgctatggct gacggggaag aatggtttgt acccaaacct gagcaagtcc 540
tatgtaaaca acaaagagaa agaagtcctt gtactatggg gtgttcatca cccgcctaac 600
atagggaacc aaagggccct ctatcataca gaaaatgctt atgtctctgt agtgtcttca 660
cattatagca gaagattcac cccagaaata gccaaaagac ccaaagtaag agatcaggaa 720
ggaagaatca actactactg gactctgctg gaacctgggg atacaataat atttgaggca 780
aatggaaatc taatagcgcc atggtatgct tttgcactga gtagaggctt tggatcagga 840
atcatcacct caaatgcacc aatggatgaa tgtgatgcga agtgtcaaac acctcaggga 900
gctataaaca gcagtcttcc tttccagaat gtacacccag tcacaatagg agagtgtcca 960
aagtatgtca ggagtgcaaa attaaggatg gttacaggac taaggaacat cccatccatt 1020
caatccagag gtttgtttgg agccattgcc ggtttcattg aaggggggtg gactggaatg 1080
gtagatgggt ggtatggtta tcatcatcag aatgagcaag gatctggcta tgctgcagat 1140
caaaaaagta cacaaaatgc cattaacggg attacaaaca aggtgaattc tgtaattgag 1200
aaaatgaaca ctcaattcac agctgtgggc aaagaattca acaaattgga aagaaggatg 1260
gaaaacttaa ataaaaaagt tgatgatggg tttctagaca tttggacata taatgcagaa 1320
ttgttggttc tactggaaaa tgaaaggact ttggatttcc atgactccaa tgtgaagaat 1380
ctgtatgaga aagtaaaaag ccaattaaag aataatgcca aagaaatagg aaacgggtgt 1440
tttgaattct atcacaagtg taacaatgaa tgcatggaga gtgtgaaaaa tggaacttat 1500
gactatccaa aatattccga agaatcaaag ttaaacaggg agaaaattga tggagtgaaa 1560
ttggaatcaa tgggagtcta tcagattctg gcgatctact caactgtcgc cagttccctg 1620
gttcttttgg tctccctggg ggcaatcagc ttctggatgt gttccaatgg gtctttgcag 1680
tgtagaatat gcatctgaga ccagaatttc a 1711
<210>34
<211>1781
<212>DNA
<213>紫花苜蓿
<400>34
ccaaatcctt aacattcttt caacaccaac aatggcgaaa aacgttgcga ttttcggttt 60
attgttttct cttcttctgt tggttccttc tcagatcttc gctgaggaat catcaactga 120
cgctaaggaa tttgttctta cattggataa cactaatttc catgacactg ttaagaagca 180
cgatttcatc gtcgttgaat tctacgcacc ttggtgtgga cactgtaaga agctagcccc 240
agagtatgag aaggctgctt ctatcttgag cactcacgag ccaccagttg ttttggctaa 300
agttgatgcc aatgaggagc acaacaaaga cctcgcatcg gaaaatgatg ttaagggatt 360
cccaaccatt aagattttta ggaatggtgg aaagaacatt caagaataca aaggtccccg 420
tgaagctgaa ggtattgttg agtatttgaa aaaacaaagt ggccctgcat ccacagaaat 480
taaatctgct gatgatgcga ccgcttttgt tggtgacaac aaagttgtta ttgtcggagt 540
tttccctaaa ttttctggtg aggagtacga taacttcatt gcattagcag agaagttgcg 600
ttctgactat gactttgctc acactttgaa tgccaaacac cttccaaagg gagactcatc 660
agtgtctggg cctgtggtta ggttatttaa gccatttgac gagctctttg ttgactcaaa 720
ggatttcaat gtagaagctc tagagaaatt cattgaagaa tccagtaccc caattgtgac 780
tgtcttcaac aatgagccta gcaatcaccc ttttgttgtc aaattcttta actctcccaa 840
cgcaaaggct atgttgttca tcaactttac taccgaaggt gctgaatctt tcaaaacaaa 900
ataccatgaa gtggctgagc aatacaaaca acagggagtt agctttcttg ttggagatgt 960
tgagtctagt caaggtgcct tccagtattt tggactgaag gaagaacaag tacctctaat 1020
tattattcag cataatgatg gcaagaagtt tttcaaaccc aatttggaac ttgatcaact 1080
cccaacttgg ttgaaggcat acaaggatgg caaggttgaa ccatttgtca agtctgaacc 1140
tattcctgaa actaacaacg agcctgttaa agtggtggtt gggcaaactc ttgaggacgt 1200
tgttttcaag tctgggaaga atgttttgat agagttttat gctccttggt gtggtcactg 1260
caagcagttg gctccaatct tggatgaagt tgctgtctca ttccaaagcg atgctgatgt 1320
tgttattgca aaactggatg caactgccaa cgatatccca accgacacct ttgatgtcca 1380
aggctatcca accttgtact tcaggtcagc aagtggaaaa ctatcacaat acgacggtgg 1440
taggacaaag gaagacatca tagaattcat tgaaaagaac aaggataaaa ctggtgctgc 1500
tcatcaagaa gtagaacaac caaaagctgc tgctcagcca gaagcagaac aaccaaaaga 1560
tgagctttga aaagttccgc ttggaggata tcggcacaca gtcatctgcg ggctttacaa 1620
ctcttttgta tctcagaatc agaagttagg aaatcttagt gccaatctat ctatttttgc 1680
gtttcatttt atctttttgg tttactctaa tgtattactg aataatgtga gttttggcgg 1740
agtttagtac tggaactttt gtttctgtaa aaaaaaaaaa a 1781
<210>35
<211>1027
<212>DNA
<213>流感病毒
<400>35
agcgaaagca ggtagatatt gaaagatgag tcttctaacc gaggtcgaaa cgtacgttct 60
ctctatcatc ccgtcaggcc ccctcaaagc cgagatcgca cagagacttg aagatgtctt 120
tgcagggaag aacaccgatc ttgaggttct catggaatgg ctaaagacaa gaccaatcct 180
gtcacctctg actaagggga ttttaggatt tgtgttcacg ctcaccgtgc ccagtgagcg 240
aggactgcag cgtagacgct ttgtccaaaa tgcccttaat gggaacgggg atccaaataa 300
catggacaaa gcagttaaac tgtataggaa gctcaagagg gagataacat tccatggggc 360
caaagaaatc tcactcagtt attctgctgg tgcacttgcc agttgtatgg gcctcatata 420
caacaggatg ggggctgtga ccactgaagt ggcatttggc ctggtatgtg caacctgtga 480
acagattgct gactcccagc atcggtctca taggcaaatg gtgacaacaa ccaacccact 540
aatcagacat gagaacagaa tggttttagc cagcactaca gctaaggcta tggagcaaat 600
ggctggatcg agtgagcaag cagcagaggc catggaggtt gctagtcagg ctaggcaaat 660
ggtgcaagcg atgagaacca ttgggactca tcctagctcc agtgctggtc tgaaaaatga 720
tcttcttgaa aatttgcagg cctatcagaa acgaatgggg gtgcagatgc aacggttcaa 780
gtgatcctct cgctattgcc gcaaatatca ttgggatctt gcacttgata ttgtggattc 840
ttgatcgtct ttttttcaaa tgcatttacc gtcgctttaa atacggactg aaaggagggc 900
cttctacgga aggagtgcca aagtctatga gggaagaata tcgaaaggaa cagcagagtg 960
ctgtggatgc tgacgatggt cattttgtca gcatagagct ggagtaaaaa actaccttgt 1020
ttctact 1027
<210>36
<211>1788
<212>DNA
<213>人工序列
<220>
<223>克隆体
<400>36
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgaaa gtaaaactac tggtcctgtt atgcacattt 120
acagctacat atgcagacac aatatgtata ggctaccatg ctaacaactc gaccgacact 180
gttgacacag tacttgaaaa gaatgtgaca gtgacacact ctgtcaacct gcttgagaac 240
agtcacaatg gaaaactatg tctattaaaa ggaatagccc cactacaatt gggtaattgc 300
agcgttgccg ggtggatctt aggaaaccca gaatgcgaat tactgatttc caaggagtca 360
tggtcctaca ttgtagaaaa accaaatcct gagaatggaa catgttaccc agggcatttc 420
gctgactatg aggaactgag ggagcaattg agttcagtat cttcatttga gaggttcgaa 480
atattcccca aagaaagctc atggcccaac cacaccgtaa ccggagtgtc agcatcatgc 540
tcccataatg gggaaagcag tttttacaga aatttgctat ggctgacggg gaagaatggt 600
ttgtacccaa acctgagcaa gtcctatgca aacaacaaag aaaaagaagt ccttgtacta 660
tggggtgttc atcacccgcc aaacataggt gaccaaaagg ccctctatca tacagaaaat 720
gcttatgtct ctgtagtgtc ttcacattat agcagaaaat tcaccccaga aatagccaaa 780
agacccaaag taagagatca agaaggaaga atcaattact actggactct gcttgaaccc 840
ggggatacaa taatatttga ggcaaatgga aatctaatag cgccaagata tgctttcgca 900
ctgagtagag gctttggatc aggaatcatc aactcaaatg caccaatgga taaatgtgat 960
gcgaagtgcc aaacacctca gggagctata aacagcagtc ttcctttcca gaacgtacac 1020
ccagtcacaa taggagagtg tccaaagtat gtcaggagtg caaaattaag gatggttaca 1080
ggactaagga acatcccatc cattcaatcc agaggtttgt ttggagccat tgccggtttc 1140
attgaagggg ggtggactgg aatggtagat ggttggtatg gttatcatca tcagaatgag 1200
caaggatctg gctatgctgc agatcaaaaa agcacacaaa atgccattaa tgggattaca 1260
aacaaggtca attctgtaat tgagaaaatg aacactcaat tcacagcagt gggcaaagag 1320
ttcaacaaat tggaaagaag gatggaaaac ttgaataaaa aagttgatga tgggtttata 1380
gacatttgga catataatgc agaactgttg gttctactgg aaaatgaaag gactttggat 1440
ttccatgact ccaatgtgaa gaatctgtat gagaaagtaa aaagccagtt aaagaataat 1500
gctaaagaaa taggaaatgg gtgttttgag ttctatcaca agtgtaacga tgaatgcatg 1560
gagagtgtaa agaatggaac ttatgactat ccaaaatatt ccgaagaatc aaagttaaac 1620
agggagaaaa ttgatggagt gaaattggaa tcaatgggag tctatcagat tctggcgatc 1680
tactcaacag tcgccagttc tctggttctt ttggtctccc tgggggcaat cagcttctgg 1740
atgtgttcca atgggtcttt acagtgtaga atatgcatct aagagctc 1788
<210>37
<211>1788
<212>DNA
<213>人工序列
<220>
<223>克隆体
<400>37
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgaaa gtaaaactac tggtcctgtt atgcacattt 120
acagctacat atgcagacac aatatgtata ggctaccatg ccaacaactc aaccgacact 180
gttgacacag tacttgagaa gaatgtgaca gtgacacact ctgtcaacct gcttgaggac 240
agtcacaatg gaaaattatg tctattaaaa ggaatagccc cactacaatt gggtaattgc 300
agcgttgccg gatggatctt aggaaaccca gaatgcgaat tactgatttc cagggaatca 360
tggtcctaca ttgtagaaaa accaaatcct gagaatggaa catgttaccc agggcatttc 420
gccgactatg aggaactgag ggagcaattg agttcagtat cttcatttga gagattcgaa 480
atattcccca aagaaagctc atggcccaac cacaccacaa ccggagtatc agcatcatgc 540
tcccataatg gggaaagcag tttttacaaa aatttgctat ggctgacggg gaagaatggt 600
ttgtacccaa acctgagcaa gtcctatgca aacaacaaag agaaagaagt ccttgtacta 660
tggggtgttc atcacccgcc taacataggt gaccaaaggg ctctctatca taaagaaaat 720
gcttatgtct ctgtagtgtc ttcacattat agcagaaaat tcaccccaga aatagccaaa 780
agacccaaag taagagatca agaaggaaga atcaactact actggactct acttgaaccc 840
ggggatacaa taatatttga ggcaaatgga aatctaatag cgccaagata tgctttcgca 900
ctgagtagag gctttggatc aggaatcatc aactcaaatg caccaatgga tgaatgtgat 960
gcgaagtgcc aaacacctca gggagctata aacagcagtc ttcctttcca gaatgtacac 1020
cctgtcacaa taggagagtg tccaaagtat gtcaggagtg caaaattaag gatggttaca 1080
ggactaagga acatcccatc cattcaatcc agaggtttgt ttggagccat tgccggtttc 1140
attgaagggg ggtggactgg aatggtagat ggttggtatg gttatcatca tcagaatgag 1200
caaggatctg gctatgctgc agatcaaaaa agcacacaaa atgccattaa tgggattaca 1260
aacaaggtca attctgtaat tgagaaaatg aacactcaat tcacagctgt gggcaaagag 1320
ttcaacaaat tggaaagaag gatggaaaac ttaaataaaa aagttgatga tgggtttata 1380
gacatttgga catataatgc agaattgttg gttctactgg aaaatgaaag gactttggat 1440
ttccatgact ccaatgtgaa gaatctgtat gagaaagtaa aaagccaatt aaagaataat 1500
gccaaagaaa taggaaatgg gtgttttgag ttctatcata agtgtaacga tgaatgcatg 1560
gagagtgtaa aaaatggaac ttatgactat ccaaaatatt ccgaagaatc aaagttaaac 1620
agggagaaaa ttgatggagt gaaattggaa tcaatgggag tctatcagat tctggcgatc 1680
tactcaacag tcgccagttc tctggttctt ttggtctccc tgggggcaat cagcttctgg 1740
atgtgttcca atgggtcttt gcagtgtaga atatgcatct gagagctc 1788
<210>38
<211>1791
<212>DNA
<213>人工序列
<220>
<223>克隆体
<400>38
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgaag actatcattg ctttgagcta cattctatgt 120
ctggttttca ctcaaaaact tcccggaaat gacaacagca cggcaacgct gtgccttggg 180
caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgacca aattgaagtt 240
actaatgcta ctgagctggt tcagagttcc tcaacaggtg aaatatgcga cagtcctcat 300
cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 360
gatggcttcc aaaataagaa atgggacctt tttgttgaac gcagcaaagc ctacagcaac 420
tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 480
acactggagt ttaacaatga aagtttcaat tggactggag tcactcaaaa cggaacaagc 540
tctgcttgca taaggagatc taataacagt ttctttagta gattgaattg gttgacccac 600
ttaaaattca aatacccagc attgaacgtg actatgccaa acaatgaaaa atttgacaaa 660
ttgtacattt ggggggttca ccacccgggt acggacaatg accaaatctt cctgtatgct 720
caagcatcag gaagaatcac agtctctacc aaaagaagcc aacaaactgt aatcccgaat 780
atcggatcta gacccagagt aaggaatatc cccagcagaa taagcatcta ttggacaata 840
gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 900
tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 960
tgcaattctg aatgcatcac tccaaacgga agcattccca atgacaaacc attccaaaat 1020
gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg 1080
gcaacaggga tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatcgcg 1140
ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtatggttt caggcatcaa 1200
aattctgagg gaataggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1260
atcaatggga agctgaatag gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1320
aaagagttct cagaagtcga agggagaatc caggaccttg agaaatatgt tgaggacacc 1380
aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1440
attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1500
gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1560
tgcataggat caatcagaaa tggaacttat gaccacgatg tatacagaga tgaagcatta 1620
aacaaccggt tccagatcaa gggcgttgag ctgaagtcag gatacaaaga ttggatacta 1680
tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1740
tgggcctgcc aaaaaggcaa cattaggtgc aacatttgca tttgagagct c 1791
<210>39
<211>1791
<212>DNA
<213>人工序列
<220>
<223>克隆体
<400>39
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgaag actatcattg ctttgagcta cattctatgt 120
ctggttttca ctcaaaaact tcccggaaat gacaacagca cggcaacgct gtgccttggg 180
caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgacca aattgaagtt 240
actaatgcta ctgagctggt tcagagttcc tcaacaggtg gaatatgcga cagtcctcat 300
cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 360
gatggcttcc aaaataagaa atgggacctt tttgttgaac gcagcaaagc ctacagcaac 420
tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 480
acactggagt ttaacgatga aagtttcaat tggactggag tcactcaaaa tggaacaagc 540
tctgcttgca aaaggagatc taataacagt ttctttagta gattgaattg gttgacccac 600
ttaaaattca aatacccagc attgaacgtg actatgccaa acaatgaaaa atttgacaaa 660
ttgtacattt ggggggttca ccacccgggt acggacaatg accaaatctt cctgcatgct 720
caagcatcag gaagaatcac agtctctacc aaaagaagcc aacaaactgt aatcccgaat 780
atcggatcta gacccagaat aaggaatatc cccagcagaa taagcatcta ttggacaata 840
gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 900
tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 960
tgcaattctg aatgcatcac tccaaatgga agcattccca atgacaaacc atttcaaaat 1020
gtaaacagga tcacatatgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg 1080
gcaacaggga tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatcgcg 1140
ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1200
aattctgagg gaataggaca agcagcagat ctcaaaagca ctcaagcagc aatcaatcaa 1260
atcaatggga agctgaatag gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1320
aaagagttct cagaagtaga agggagaatc caggacctcg agaaatatgt tgaggacact 1380
aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1440
attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa gaacaaagaa gcaactgagg 1500
gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1560
tgcataggat caatcagaaa tggaacttat gaccatgatg tatacagaga tgaagcatta 1620
aacaaccggt tccagatcaa aggcgttgag ctgaagtcag gatacaaaga ttggatacta 1680
tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1740
tgggcctgcc aaaaaggcaa cattaggtgc aacatttgca tttgagagct c 1791
<210>40
<211>1848
<212>DNA
<213>人工序列
<220>
<223>克隆体
<400>40
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgaag gcaataattg tactactcat ggtagtaaca 120
tccaatgcag atcgaatctg cactgggata acatcgtcaa actcaccaca tgttgtcaaa 180
actgctactc aaggggaggt caatgtgact ggtgtaatac cactgacaac aacacccacc 240
aaatctcatt ttgcaaatct caaaggaaca gaaaccagag ggaaactatg cccaaaatgc 300
ctcaactgca cagatctgga cgtggccttg ggcagaccaa aatgcacggg gaacataccc 360
tcggcaagag tttcaatact ccatgaagtc agacctgtta catctgggtg ctttcctata 420
atgcacgaca gaacaaaaat tagacagctg cctaaacttc tcagaggata cgaacatatc 480
aggttatcaa ctcataacgt tatcaatgca gaaaatgcac caggaggacc ctacaaaatt 540
ggaacctcag ggtcttgccc taacgttacc aatggaaacg gatttttcgc aacaatggct 600
tgggccgtcc caaaaaacga caacaacaaa acagcaacaa attcattaac aatagaagta 660
ccatacattt gtacagaagg agaagaccaa attaccgttt gggggttcca ctctgataac 720
gaaacccaaa tggcaaagct ctatggggac tcaaagcccc agaagttcac ctcatctgcc 780
aacggagtga ccacacatta cgtttcacag attggtggct tcccaaatca aacagaagac 840
ggaggactac cacaaagcgg tagaattgtt gttgattaca tggtgcaaaa atctgggaaa 900
acaggaacaa ttacctatca aagaggtatt ttattgcctc aaaaagtgtg gtgcgcaagt 960
ggcaggagca aggtaataaa aggatcgttg cctttaattg gagaagcaga ttgcctccac 1020
gaaaaatacg gtggattaaa caaaagcaag ccttactaca caggggaaca tgcaaaggcc 1080
ataggaaatt gcccaatatg ggtgaaaaca cccttgaagc tggccaatgg aaccaaatat 1140
agacctcctg caaaactatt aaaggaaagg ggtttcttcg gagctattgc tggtttctta 1200
gaaggaggat gggaaggaat gattgcaggt tggcacggat acacatccca tggggcacat 1260
ggagtagcgg tggcagcaga ccttaagagc actcaagagg ccataaacaa gataacaaaa 1320
aatctcaact ctttgagtga gctggaagta aagaatcttc aaagactaag cggtgccatg 1380
gatgaactcc acaacgaaat actagaacta gacgagaaag tggatgatct cagagctgat 1440
acaataagct cacaaataga actcgcagtc ctgctttcca atgaaggaat aataaacagt 1500
gaagatgagc atctcttggc gcttgaaaga aagctgaaga aaatgctggg cccctctgct 1560
gtagagatag ggaatggatg ctttgaaacc aaacacaagt gcaaccagac ctgtctcgac 1620
agaatagctg ctggtacctt tgatgcagga gaattttctc tccccacttt tgattcactg 1680
aatattactg ctgcatcttt aaatgacgat ggattggata atcatactat actgctttac 1740
tactcaactg ctgcctccag tttggctgta acattgatga tagctatctt tgttgtttat 1800
atggtctcca gagacaatgt ttcttgctcc atctgtctat aagagctc 1848
<210>41
<211>1845
<212>DNA
<213>人工序列
<220>
<223>克隆体
<400>41
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgaag gcaataattg tactactcat ggtagtaaca 120
tccaatgcag atcgaatctg cactggaata acatcttcaa actcacctca tgtggtcaaa 180
acagccactc aaggggaggt caatgtgact ggtgtgatac cactaacaac aacaccaaca 240
aaatcttatt ttgcaaatct caaaggaaca aggaccagag ggaaactatg cccagactgt 300
ctcaactgca cagatctgga tgtggctttg ggcagaccaa tgtgtgtggg gaccacacct 360
tcggcgaagg cttcaatact ccacgaagtc aaacctgtta catccgggtg ctttcctata 420
atgcacgaca gaacaaaaat caggcaacta cccaatcttc tcagaggata tgaaaatatc 480
aggctatcaa cccaaaacgt catcgatgcg gaaaaggcac caggaggacc ctacagactt 540
ggaacctcag gatcttgccc taacgctacc agtaagagcg gatttttcgc aacaatggct 600
tgggctgtcc caaaggacaa caacaaaaat gcaacgaacc cactaacagt agaagtacca 660
tacatttgta cagaagggga agaccaaatc actgtttggg ggttccattc agataacaaa 720
acccaaatga agaacctcta tggagactca aatcctcaaa agttcacctc atctgctaat 780
ggagtaacca cacactatgt ttctcagatt ggcagcttcc cagatcaaac agaagacgga 840
ggactaccac aaagcggcag gattgttgtt gattacatga tgcaaaaacc tgggaaaaca 900
ggaacaattg tctaccaaag aggtgttttg ttgcctcaaa aggtgtggtg cgcgagtggc 960
aggagcaaag taataaaagg gtccttgcct ttaattggtg aagcagattg ccttcatgaa 1020
aaatacggtg gattaaacaa aagcaagcct tactacacag gagaacatgc aaaagccata 1080
ggaaattgcc caatatgggt gaaaacacct ttgaagctcg ccaatggaac caaatataga 1140
cctcctgcaa aactattaaa ggaaaggggt ttcttcggag ctattgctgg tttcctagaa 1200
ggaggatggg aaggaatgat tgcaggctgg cacggataca catctcacgg agcacatgga 1260
gtggcagtgg cggcggacct taagagtacg caagaagcta taaacaagat aacaaaaaat 1320
ctcaattctt tgagtgagct agaagtaaag aatcttcaaa gactaagtgg tgccatggat 1380
gaactccaca acgaaatact cgagctggat gagaaagtgg atgatctcag agctgacact 1440
ataagctcgc aaatagaact tgcagtcttg ctttccaacg aaggaataat aaacagtgaa 1500
gatgagcatc tattggcact tgagagaaaa ctaaagaaaa tgctgggtcc ctctgctgta 1560
gagataggaa atggatgctt cgaaaccaaa cacaagtgca accagacctg cttagacagg 1620
atagctgctg gcacctttaa tgcaggagaa ttttctctcc ccacttttga ttcactgaac 1680
attactgctg catctttaaa tgatgatgga ttggataacc atactatact gctctattac 1740
tcaactgctg cttctagttt ggctgtaaca ttgatgctag ctatttttat tgtttatatg 1800
gtctccagag acaacgtttc atgctccatc tgtctataag agctc 1845
<210>42
<211>1779
<212>DNA
<213>人工序列
<220>
<223>克隆体
<400>42
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatggcc atcatttatc taattctcct gttcacagca 120
gtgagagggg accaaatatg cattggatac catgccaata attccacaga gaaggtcgac 180
acaattctag agcggaacgt cactgtgact catgccaagg acattcttga gaagacccat 240
aacggaaagt tatgcaaact aaacggaatc cctccacttg aactagggga ctgtagcatt 300
gccggatggc tccttggaaa tccagaatgt gataggcttc taagtgtgcc agaatggtcc 360
tatataatgg agaaagaaaa cccgagagac ggtttgtgtt atccaggcag cttcaatgat 420
tatgaagaat tgaaacatct cctcagcagc gtgaaacatt tcgagaaagt aaagattctg 480
cccaaagata gatggacaca gcatacaaca actggaggtt cacgggcctg cgcggtgtct 540
ggtaatccat cattcttcag gaacatggtc tggctgacaa agaaagaatc aaattatccg 600
gttgccaaag gatcgtacaa caatacaagc ggagaacaaa tgctaataat ttggggggtg 660
caccatccca atgatgagac agaacaaaga acattgtacc agaatgtggg aacctatgtt 720
tccgtaggca catcaacatt gaacaaaagg tcaaccccag acatagcaac aaggcctaaa 780
gtgaatggac taggaagtag aatggagttc tcttggaccc tattggatat gtgggacacc 840
ataaattttg agagtactgg taatctaatt gcaccagagt atggattcaa aatatcgaaa 900
agaggtagtt cagggatcat gaaaacagaa ggaacacttg agaactgtga gaccaaatgc 960
caaactcctt tgggagcaat aaatacaaca ttgccttttc acaatgtcca cccactgaca 1020
ataggtgagt gccccaaata tgtaaaatcg gagaagttgg tcttagcaac aggactaagg 1080
aatgttcccc agattgaatc aagaggattg tttggggcaa tagctggttt tatagaagga 1140
ggatggcaag gaatggttga tggttggtat ggataccatc acagcaatga ccagggatca 1200
gggtatgcag cagacaaaga atccactcaa aaggcatttg atggaatcac caacaaggta 1260
aattctgtga ttgaaaagat gaacacccaa tttgaagctg ttgggaaaga gttcagtaac 1320
ttagagagaa gactggagaa cttgaacaaa aagatggaag acgggtttct agatgtgtgg 1380
acatacaatg ctgagcttct agttctgatg gaaaatgaga ggacacttga ctttcatgat 1440
tctaatgtca agaatctgta tgataaagtc agaatgcagc tgagagacaa cgtcaaagaa 1500
ctaggaaatg gatgttttga attttatcac aaatgtgatg atgaatgcat gaatagtgtg 1560
aaaaacggga cgtatgatta tcccaagtat gaagaagagt ctaaactaaa tagaaatgaa 1620
atcaaagggg taaaattgag cagcatgggg gtttatcaaa tccttgccat ttatgctaca 1680
gtagcaggtt ctctgtcact ggcaatcatg atggctggga tctctttctg gatgtgctcc 1740
aacgggtctc tgcagtgcag gatctgcata tgagagctc 1779
<210>43
<211>1794
<212>DNA
<213>人工序列
<220>
<223>克隆体
<400>43
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatggag aaaatagtgc ttcttcttgc aatagtcagc 120
cttgttaaaa gtgatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt 180
gacacaataa tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 240
cacaacggga agctctgcga tctagatgga gtgaagcctc tgattttaag agattgtagt 300
gtagctggat ggctcctcgg aaacccaatg tgtgacgagt tcatcaatgt gccggaatgg 360
tcttacatag tggagaaggc caacccagcc aatgacctct gttacccagg gaatttcaac 420
gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcagatc 480
atccccaaaa gttcttggtc cgatcatgaa gcctcatcag gggtcagctc agcatgtcca 540
taccagggaa cgccctcctt tttcagaaat gtggtatggc ttatcaaaaa gaacaataca 600
tacccaacaa taaagagaag ctacaataat accaaccagg aagatctttt gatactgtgg 660
gggattcatc attctaatga tgcggcagag cagacaaagc tctatcaaaa cccaaccacc 720
tatatttccg ttgggacatc aacactaaac cagagattgg taccaaaaat agctactaga 780
tccaaagtaa acgggcaaag tggaaggatg gatttcttct ggacaatttt aaaaccgaat 840
gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 900
gtcaagaaag gggactcagc aattgttaaa agtgaagtgg aatatggtaa ctgcaataca 960
aagtgtcaaa ctccaatagg ggcgataaac tctagtatgc cattccacaa catacaccct 1020
ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca aattagtcct tgcgactggg 1080
ctcagaaata gtcctctaag agaaagaaga agaaaaagag gactatttgg agctatagca 1140
gggtttatag agggaggatg gcagggaatg gtagatggtt ggtatgggta ccaccatagc 1200
aatgagcagg ggagtgggta cgctgcagac aaagaatcca ctcaaaaggc aatagatgga 1260
gtcaccaata aggtcaactc gatcattgac aaaatgaaca ctcagtttga ggccgttgga 1320
agggaattta ataacttaga aaggagaata gagaatttaa acaagaaaat ggaagacgga 1380
ttcctagatg tctggactta taatgctgaa cttctggttc tcatggaaaa tgagagaact 1440
ctagacttcc atgattcaaa tgtcaagaac ctttacgaca aggtccgact acagcttagg 1500
gataatgcaa aggagctggg taacggttgt ttcgagttct atcacaaatg tgataatgaa 1560
tgtatggaaa gtgtaagaaa cggaacgtat gactacccgc agtattcaga agaagcaaga 1620
ttaaaaagag aggaaataag tggagtaaaa ttggaatcaa taggaactta ccaaatactg 1680
tcaatttatt caacagttgc gagttctcta gcactggcaa tcatggtggc tggtctatct 1740
ttgtggatgt gctccaatgg gtcgttacaa tgcagaattt gcatttaaga gctc 1794
<210>44
<211>1797
<212>DNA
<213>人工序列
<220>
<223>克隆体
<400>44
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatggag aaaatagtgc ttctttttgc aatagtcagt 120
cttgttaaaa gtgatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt 180
gacacaataa tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 240
cacaatggga agctctgcga tctagatgga gtgaagcctc taattttgag agattgtagt 300
gtagctggat ggctcctcgg aaacccaatg tgtgacgagt tcatcaatgt gccggaatgg 360
tcttacatag tggagaaggc caatccagtc aatgacctct gttacccagg ggatttcaat 420
gactatgaag aattgaaaca cctattgagc agaataaacc attttgagaa aattcagatc 480
atccccaaaa gttcttggtc cagtcatgaa gcctcattgg gggtcagctc agcatgtcca 540
taccagggaa agtcctcctt tttcagaaat gtggtatggc ttatcaaaaa gaacagtaca 600
tacccaacaa taaagaggag ctacaataat accaaccaag aagatctttt ggtactgtgg 660
gggattcacc atcctaatga tgcggcagag cagacaaagc tctatcaaaa cccaaccacc 720
tatatttccg ttgggacatc tacactaaac cagagattgg taccaagaat agctactaga 780
tccaaagtaa acgggcaaag tggaaggatg gagttcttct ggacaatttt aaaaccgaat 840
gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 900
gtcaagaaag gggactcaac aattatgaaa agtgaattgg aatatggtaa ctgcaatacc 960
aagtgtcaaa ctccaatggg ggcgataaac tctagcatgc cattccacaa tatacaccct 1020
ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca gattagtcct tgcgactggg 1080
ctcagaaata gccctcaaag agagagaaga agaaaaaaga gaggattatt tggagctata 1140
gcaggtttta tagagggagg atggcaggga atggtagatg gttggtatgg gtaccaccat 1200
agcaacgagc aggggagtgg gtacgctgca gacaaagaat ccactcaaaa ggcaatagat 1260
ggagtcacca ataaggtcaa ctcgattatt gacaaaatga acactcagtt tgaggccgtt 1320
ggaagggaat ttaacaactt agaaaggaga atagagaatt taaacaagaa gatggaagac 1380
gggttcctag atgtctggac ttataatgct gaacttctag ttctcatgga aaacgagaga 1440
actctagact ttcatgactc aaatgtcaag aacctttacg acaaggtccg actacagctt 1500
agggataatg caaaggagct gggtaacggt tgtttcgagt tctatcataa atgtgataat 1560
gaatgtatgg aaagtgtaag aaacggaacg tatgactacc cgcagtattc agaagaagca 1620
agactaaaaa gagaggaaat aagtggagta aaattggaat caataggaat ttaccaaata 1680
ttgtcaattt attctacagt ggccagctcc ctagcactgg caatcatggt agctggtcta 1740
tccttatgga tgtgctccaa tgggtcgtta caatgcagaa tttgcattta agagctc 1797
<210>45
<211>1791
<212>DNA
<213>人工序列
<220>
<223>克隆体
<400>45
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgatt gcaatcattg taatagcaat actggcagca 120
gccggaaagt cagacaagat ctgcattggg tatcatgcca acaattcaac aacacaggta 180
gatacgatac ttgagaagaa tgtgactgtc acacactcaa ttgaattgct ggaaaatcag 240
aaggaagaaa gattctgcaa gatattgaac aaggcccctc tcgacttaag ggaatgtacc 300
atagagggtt ggatcttggg gaatccccaa tgcgacctat tgcttggtga tcaaagctgg 360
tcatacattg tggaaagacc tactgctcaa aacgggatct gctacccagg aaccttaaat 420
gaggtagaag aactgagggc acttattgga tcaggagaaa gggtagagag atttgagatg 480
tttccccaaa gcacctggca aggagttgac accaacagtg gaacaacaag atcctgccct 540
tattctactg gtgcgtcttt ctacagaaac ctcctatgga taataaaaac caagacagca 600
gaatatccag taattaaggg aatttacaac aacactggaa cccagccaat cctctatttc 660
tggggtgtgc atcatcctcc taacaccgac gagcaagata ctctgtatgg ctctggtgat 720
cgatacgtta gaatgggaac tgaaagcatg aattttgcca agagtccgga aattgcggca 780
aggcctgctg tgaatggaca aagaggcaga attgattatt attggtcggt tttaaaacca 840
ggggaaacct tgaatgtgga atctaatgga aatctaatcg ccccttggta tgcatacaaa 900
tttgtcaaca caaatagtaa aggagccgtc ttcaggtcag atttaccaat cgagaactgc 960
gatgccacat gccagactat tgcaggggtt ctaaggacca ataaaacatt tcagaatgtg 1020
agtcccctgt ggataggaga atgtcccaaa tacgtgaaaa gtgaaagtct gaggcttgca 1080
actggactaa gaaatgttcc acagattgaa actagaggac tcttcggagc tattgcaggg 1140
tttattgaag gaggatggac tgggatgata gatgggtggt atggctatca ccatgaaaat 1200
tctcaagggt caggatatgc agcagacaga gaaagcactc aaaaggctgt aaacagaatt 1260
acaaataagg tcaattccat catcaacaaa atgaacacac aatttgaagc tgtcgatcac 1320
gaattttcaa atctggagag gagaattgac aatctgaaca aaagaatgca agatggattt 1380
ctggatgttt ggacatacaa tgctgaactg ttggttcttc ttgaaaacga aagaacacta 1440
gacatgcatg acgcaaatgt gaagaaccta catgaaaagg tcaaatcaca actaagggac 1500
aatgctacga tcttagggaa tggttgcttt gaattttggc ataagtgtga caatgaatgc 1560
atagagtctg tcaaaaatgg tacatatgac tatcccaaat accagactga aagcaaatta 1620
aacaggctaa aaatagaatc agtaaagcta gagaaccttg gtgtgtatca aattcttgcc 1680
atttatagta cggtatcgag cagcctagtg ttggtagggc tgatcatggc aatgggtctt 1740
tggatgtgtt caaatggttc aatgcagtgc aggatatgta tataagagct c 1791
<210>46
<211>1803
<212>DNA
<213>人工序列
<220>
<223>克隆体
<400>46
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatgaac actcaaattc taatattagc cacttcggca 120
ttcttctatg tacgtgcaga taaaatctgc ctaggacatc atgctgtgtc taatggaacc 180
aaagtagaca cccttactga aaaaggaata gaagttgtca atgcaacaga aacagttgaa 240
caaacaaaca tccctaagat ctgctcaaaa ggaaaacaga ctgttgacct tggtcaatgt 300
ggattactag ggaccgttat tggtcctccc caatgtgacc aatttcttga gttctctgct 360
aatttaatag ttgaaagaag ggaaggtaat gacatttgtt atccaggcaa atttgacaat 420
gaagaaacat tgagaaaaat actcagaaaa tccggaggaa ttaaaaagga gaatatggga 480
ttcacatata ccggagtgag aaccaatgga gagactagcg catgtagaag gtcaagatct 540
tccttttatg cagagatgaa atggcttcta tccagcacag acaatgggac atttccacaa 600
atgacaaagt cctacaagaa cactaagaag gtaccagctc tgataatctg gggaatccac 660
cactcaggat caactactga acagactaga ttatatggaa gtgggaataa attgataaca 720
gtttggagtt ccaaatacca acaatctttt gtcccaaatc ctggaccaag accgcaaatg 780
aatggtcaat caggaagaat tgactttcac tggctgatgc tagatcccaa tgatactgtc 840
actttcagtt ttaatggggc ctttatagca cctgaccgcg ccagttttct aagaggtaaa 900
tctctaggaa tccaaagtga tgcacaactt gacaataatt gtgaaggtga atgctatcat 960
attggaggta ctataattag caacttgccc tttcaaaaca ttaatagtag ggcaatcgga 1020
aaatgcccca gatacgtgaa gcagaagagc ttaatgctag caacaggaat gaaaaatgtt 1080
cctgaagctc ctgcacataa acaactaact catcacatgc gcaaaaaaag aggtttattt 1140
ggtgcaatag caggattcat tgaaaatggg tgggaaggat taatagacgg atggtatgga 1200
tataagcatc agaatgcaca aggagaaggg actgctgcag actacaaaag tacacaatct 1260
gctatcaacc aaataaccgg aaaattgaac agactaatag aaaaaaccaa ccagcaattc 1320
gaactaatag ataatgagtt caatgaaata gaaaaacaaa ttggcaatgt tattaactgg 1380
actagagatt ctatcatcga agtatggtca tataatgcag agttcctcgt agcagtggag 1440
aatcaacaca ctattgattt aactgactca gaaatgaaca aactatatga aaaggtaaga 1500
agacaactga gagaaaatgc tgaggaagat ggtaatggct gttttgaaat attccaccaa 1560
tgtgacaatg attgcatggc cagcattaga aacaacacat atgaccataa aaaatacaga 1620
aaagaggcaa tacaaaacag aatccagatt gacgcagtaa agttgagcag tggttacaaa 1680
gatataatac tttggtttag cttcggggca tcatgtttct tatttcttgc cattgcaatg 1740
ggtcttgttt tcatatgtat aaaaaatgga aacatgcggt gcactatttg tatataagag 1800
ctc 1803
<210>47
<211>1773
<212>DNA
<213>人工序列
<220>
<223>克隆体
<400>47
cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60
attaattaat catcttgaga gaaaatggaa acaatatcac taataactat actactagta 120
gtaacagcaa gcaatgcaga taaaatctgc atcggccacc agtcaacaaa ctccacagaa 180
actgtggaca cgctaacaga aaccaatgtt cctgtgacac atgccaaaga attgctccac 240
acagagcata atggaatgct gtgtgcaaca agcctgggac atcccctcat tctagacaca 300
tgcactattg aaggactagt ctatggcaac ccttcttgtg acctgctgtt gggaggaaga 360
gaatggtcct acatcgtcga aagatcatca gctgtaaatg gaacgtgtta ccctgggaat 420
gtagaaaacc tagaggaact caggacactt tttagttccg ctagttccta ccaaagaatc 480
caaatcttcc cagacacaac ctggaatgtg acttacactg gaacaagcag agcatgttca 540
ggttcattct acaggagtat gagatggctg actcaaaaga gcggttttta ccctgttcaa 600
gacgcccaat acacaaataa caggggaaag agcattcttt tcgtgtgggg catacatcac 660
ccacccacct ataccgagca aacaaatttg tacataagaa acgacacaac aacaagcgtg 720
acaacagaag atttgaatag gaccttcaaa ccagtgatag ggccaaggcc ccttgtcaat 780
ggtctgcagg gaagaattga ttattattgg tcggtactaa aaccaggcca aacattgcga 840
gtacgatcca atgggaatct aattgctcca tggtatggac acgttctttc aggagggagc 900
catggaagaa tcctgaagac tgatttaaaa ggtggtaatt gtgtagtgca atgtcagact 960
gaaaaaggtg gcttaaacag tacattgcca ttccacaata tcagtaaata tgcatttgga 1020
acctgcccca aatatgtaag agttaatagt ctcaaactgg cagtcggtct gaggaacgtg 1080
cctgctagat caagtagagg actatttgga gccatagctg gattcataga aggaggttgg 1140
ccaggactag tcgctggctg gtatggtttc cagcattcaa atgatcaagg ggttggtatg 1200
gctgcagata gggattcaac tcaaaaggca attgataaaa taacatccaa ggtgaataat 1260
atagtcgaca agatgaacaa gcaatatgaa ataattgatc atgaatttag tgaggttgaa 1320
actagactca atatgatcaa taataagatt gatgaccaaa tacaagacgt atgggcatat 1380
aatgcagaat tgctagtact acttgaaaat caaaaaacac tcgatgagca tgatgcgaac 1440
gtgaacaatc tatataacaa ggtgaagagg gcactgggct ccaatgctat ggaagatggg 1500
aaaggctgtt tcgagctata ccataaatgt gatgatcagt gcatggaaac aattcggaac 1560
gggacctata ataggagaaa gtatagagag gaatcaagac tagaaaggca gaaaatagag 1620
ggggttaagc tggaatctga gggaacttac aaaatcctca ccatttattc gactgtcgcc 1680
tcatctcttg tgcttgcaat ggggtttgct gccttcctgt tctgggccat gtccaatgga 1740
tcttgcagat gcaacatttg tatataagag ctc 1773
<210>48
<211>565
<212>PRT
<213>人工序列
<220>
<223>克隆体
<400>48
Met Lys Val Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr
1 5 10 15
Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr
20 25 30
Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn
35 40 45
Leu Leu Glu Asn Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile
50 55 60
Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly
65 70 75 80
Asn Pro Glu Cys Glu Leu Leu Ile Ser Lys Glu Ser Trp Ser Tyr Ile
85 90 95
Val Glu Lys Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly His Phe
100 105 110
Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe
115 120 125
Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr
130 135 140
Val Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Glu Ser Ser Phe
145 150 155 160
Tyr Arg Asn Leu Leu Trp LeuT hr Gly Lys Asn Gly Leu Tyr Pro Asn
165 170 175
Leu Ser Lys Ser Tyr Ala Asn Asn Lys Glu Lys Glu Val Leu Val Leu
180 185 190
Trp Gly Val His His Pro Pro Asn Ile Gly Asp Gln Lys Ala Leu Tyr
195 200 205
His Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg
210 215 220
Lys Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu
225 230 235 240
Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile
245 250 255
Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Arg Tyr Ala Phe Ala
260 265 270
Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Asn Ser Asn Ala Pro Met
275 280 285
Asp Lys Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser
290 295 300
Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro
305 310 315 320
Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn
325 330 335
Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
340 345 350
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His
355 360 365
His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr
370 375 380
Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu
385 390 395 400
Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu
405 410 415
Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Ile
420 425 430
Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu
435 440 445
Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys
450 455 460
Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys
465 470 475 480
Phe Glu Phe Tyr His Lys Cys Asn Asp Glu Cys Met Glu Ser Val Lys
485 490 495
Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn
500 505 510
Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln
515 520 525
Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val
530 535 540
Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln
545 550 555 560
Cys Arg Ile Cys Ile
565
<210>49
<211>565
<212>PRT
<213>人工序列
<220>
<223>克隆体
<400>49
Met Lys Val Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr
1 5 10 15
Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr
20 25 30
Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn
35 40 45
Leu Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile
50 55 60
Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly
65 70 75 80
Asn Pro Glu Cys Glu Leu Leu Ile Ser Arg Glu Ser Trp Ser Tyr Ile
85 90 95
Val Glu Lys Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly His Phe
100 105 110
Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe
115 120 125
Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr
130 135 140
Thr Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Glu Ser Ser Phe
145 150 155 160
Tyr Lys Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn
165 170 175
Leu Ser Lys Ser Tyr Ala Asn Asn Lys Glu Lys Glu Val Leu Val Leu
180 185 190
Trp Gly Val His His Pro Pro Asn Ile Gly Asp Gln Arg Ala Leu Tyr
195 200 205
His Lys Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg
210 215 220
Lys Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu
225 230 235 240
Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile
245 250 255
Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Arg Tyr Ala Phe Ala
260 265 270
Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Asn Ser Asn Ala Pro Met
275 280 285
Asp Glu Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser
290 295 300
Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro
305 310 315 320
Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn
325 330 335
Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
340 345 350
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His
355 360 365
His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr
370 375 380
Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu
385 390 395 400
Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu
405 410 415
Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Ile
420 425 430
Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu
435 440 445
Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys
450 455 460
Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys
465 470 475 480
Phe Glu Phe Tyr His Lys Cys Asn Asp Glu Cys Met Glu Ser Val Lys
485 490 495
Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn
500 505 510
Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln
515 520 525
Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val
530 535 540
Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln
545 550 555 560
Cys Arg Ile Cys Ile
565
<210>50
<211>566
<212>PRT
<213>人工序列
<220>
<223>克隆体
<400>50
Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Leu Cys Leu Val Phe Thr
1 5 10 15
Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly
20 25 30
His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp
35 40 45
Gln Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ser Ser Thr
50 55 60
Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys
65 70 75 80
Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln
85 90 95
Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn
100 105 110
Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val
115 120 125
Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp Thr
130 135 140
Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser Asn
145 150 155 160
Asn Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Lys Phe Lys
165 170 175
Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Lys Phe Asp Lys
180 185 190
Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Asn Asp Gln Ile
195 200 205
Phe Leu Tyr Ala Gln Ala Ser Gly Arg Ile Thr Val Ser Thr Lys Arg
210 215 220
Ser Gln Gln Thr Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Val Arg
225 230 235 240
Asn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly
245 250 255
Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly
260 265 270
Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala
275 280 285
Pro Ile Gly Lys Cys Asn Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile
290 295 300
Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala
305 310 315 320
Cys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly Met
325 330 335
Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala
340 345 350
Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly
355 360 365
Phe Arg His Gln Asn Ser Glu Gly Ile Gly Gln Ala Ala Asp Leu Lys
370 375 380
Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu
385 390 395 400
Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser
405 410 415
Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr
420 425 430
Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu
435 440 445
Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe
450 455 460
Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn
465 470 475 480
Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser
485 490 495
Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu
500 505 510
Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys
515 520 525
Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys
530 535 540
Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile
545 550 555 560
Arg Cys Asn Ile Cys Ile
565
<210>51
<211>566
<212>PRT
<213>人工序列
<220>
<223>克隆体
<400>51
Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Leu Cys Leu Val Phe Thr
1 5 10 15
Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly
20 25 30
His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp
35 40 45
Gln Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ser Ser Thr
50 55 60
Gly Gly Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys
65 70 75 80
Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln
85 90 95
Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn
100 105 110
Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val
115 120 125
Ala Ser Ser Gly Thr Leu Glu Phe Asn Asp Glu Ser Phe Asn Trp Thr
130 135 140
Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Lys Arg Arg Ser Asn
145 150 155 160
Asn Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Lys Phe Lys
165 170 175
Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Lys Phe Asp Lys
180 185 190
Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Asn Asp Gln Ile
195 200 205
Phe Leu His Ala Gln Ala Ser Gly Arg Ile Thr Val Ser Thr Lys Arg
210 215 220
Ser Gln Gln Thr Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg
225 230 235 240
Asn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly
245 250 255
Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly
260 265 270
Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala
275 280 285
Pro Ile Gly Lys Cys Asn Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile
290 295 300
Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala
305 310 315 320
Cys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly Met
325 330 335
Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala
340 345 350
Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly
355 360 365
Phe Arg His Gln Asn Ser Glu Gly Ile Gly Gln Ala Ala Asp Leu Lys
370 375 380
Ser Thr Gln Ala Ala Ile Asn Gln Ile Asn Gly Lys Leu Asn Arg Leu
385 390 395 400
Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser
405 410 415
Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr
420 425 430
Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu
435 440 445
Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe
450 455 460
Glu Arg Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn
465 470 475 480
Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser
485 490 495
Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu
500 505 510
Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys
515 520 525
Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys
530 535 540
Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile
545 550 555 560
Arg Cys Asn Ile Cys Ile
565
<210>52
<211>585
<212>PRT
<213>人工序列
<220>
<223>克隆体
<400>52
Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp
1 5 10 15
Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys
20 25 30
Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr
35 40 45
Thr Thr Pro Thr Lys Ser His Phe Ala Asn Leu Lys Gly Thr Glu Thr
50 55 60
Arg Gly Lys Leu Cys Pro Lys Cys Leu Asn Cys Thr Asp Leu Asp Val
65 70 75 80
Ala Leu Gly Arg Pro Lys Cys Thr Gly Asn Ile Pro Ser Ala Arg Val
85 90 95
Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro Ile
100 105 110
Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Lys Leu Leu Arg Gly
115 120 125
Tyr Glu His Ile Arg Leu Ser Thr His Asn Val Ile Asn Ala Glu Asn
130 135 140
Ala Pro Gly Gly Pro Tyr Lys Ile Gly Thr Ser Gly Ser Cys Pro Asn
145 150 155 160
Val Thr Asn Gly Asn Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro
165 170 175
Lys Asn Asp Asn Asn Lys Thr Ala Thr Asn Ser Leu Thr Ile Glu Val
180 185 190
Pro Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe
195 200 205
His Ser Asp Asn Glu Thr Gln Met Ala Lys Leu Tyr Gly Asp Ser Lys
210 215 220
Pro Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val
225 230 235 240
Ser Gln Ile Gly Gly Phe Pro Asn Gln Thr Glu Asp Gly Gly Leu Pro
245 250 255
Gln Ser Gly Arg Ile Val Val Asp Tyr Met Val Gln Lys Ser Gly Lys
260 265 270
Thr Gly Thr Ile Thr Tyr Gln Arg Gly Ile Leu Leu Pro Gln Lys Val
275 280 285
Trp Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu
290 295 300
Ile Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys
305 310 315 320
Ser Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys
325 330 335
Pro Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr
340 345 350
Arg Pro Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala Ile
355 360 365
Ala Gly Phe Leu Glu Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His
370 375 380
Gly Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu
385 390 395 400
Lys Ser Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser
405 410 415
Leu Ser Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met
420 425 430
Asp Glu Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp
435 440 445
Leu Arg Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu
450 455 460
Ser Asn Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu
465 470 475 480
Glu Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu Ile Gly
485 490 495
Asn Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp
500 505 510
Arg Ile Ala Ala Gly Thr Phe Asp Ala Gly Glu Phe Ser Leu Pro Thr
515 520 525
Phe Asp Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu
530 535 540
Asp Asn His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu
545 550 555 560
Ala Val Thr Leu Met Ile Ala Ile Phe Val Val Tyr Met Val Ser Arg
565 570 575
Asp Asn Val Ser Cys Ser Ile Cys Leu
580 585
<210>53
<211>584
<212>PRT
<213>人工序列
<220>
<223>克隆体
<400>53
Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp
1 5 10 15
Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys
20 25 30
Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr
35 40 45
Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg Thr
50 55 60
Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp Val
65 70 75 80
Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys Ala
85 90 95
Ser Ile Leu His Glu Val Lys Pro Val Thr Ser Gly Cys Phe Pro Ile
100 105 110
Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg Gly
115 120 125
Tyr Glu Asn Ile Arg Leu Ser Thr Gln Asn Val Ile Asp Ala Glu Lys
130 135 140
Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro Asn
145 150 155 160
Ala Thr Ser Lys Ser Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro
165 170 175
Lys Asp Asn Asn Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val Pro
180 185 190
Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe His
195 200 205
Ser Asp Asn Lys Thr Gln Met Lys Asn Leu Tyr Gly Asp Ser Asn Pro
210 215 220
Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val Ser
225 230 235 240
Gln Ile Gly Ser Phe Pro Asp Gln Thr Glu Asp Gly Gly Leu Pro Gln
245 250 255
Ser Gly Arg Ile Val Val Asp Tyr Met Met Gln Lys Pro Gly Lys Thr
260 265 270
Gly Thr Ile Val Tyr Gln Arg Gly Val Leu Leu Pro Gln Lys Val Trp
275 280 285
Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu Ile
290 295 300
Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys Ser
305 310 315 320
Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys Pro
325 330 335
Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg
340 345 350
Pro Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala Ile Ala
355 360 365
Gly Phe Leu Glu Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His Gly
370 375 380
Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu Lys
385 390 395 400
Ser Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser Leu
405 410 415
Ser Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met Asp
420 425 430
Glu Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp Leu
435 440 445
Arg Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu Ser
450 455 460
Asn Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu Glu
465 470 475 480
Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu Ile Gly Asn
485 490 495
Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp Arg
500 505 510
Ile Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr Phe
515 520 525
Asp Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu Asp
530 535 540
Asn His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu Ala
545 550 555 560
Val Thr Leu Met Leu Ala Ile Phe Ile Val Tyr Met Val Ser Arg Asp
565 570 575
Asn Val Ser Cys Ser Ile Cys Leu
580
<210>54
<211>562
<212>PRT
<213>人工序列
<220>
<223>克隆体
<400>54
Met Ala Ile Ile Tyr Leu Ile Leu Leu Phe Thr Ala Val Arg Gly Asp
1 5 10 15
Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Lys Val Asp
20 25 30
Thr Ile Leu Glu Arg Asn Val Thr Val Thr His Ala Lys Asp Ile Leu
35 40 45
Glu Lys Thr His Asn Gly Lys Leu Cys Lys Leu Asn Gly Ile Pro Pro
50 55 60
Leu Glu Leu Gly Asp Cys Ser Ile Ala Gly Trp Leu Leu Gly Asn Pro
65 70 75 80
Glu Cys Asp Arg Leu Leu Ser Val Pro Glu Trp Ser Tyr Ile Met Glu
85 90 95
Lys Glu Asn Pro Arg Asp Gly Leu Cys Tyr Pro Gly Ser Phe Asn Asp
100 105 110
Tyr Glu Glu Leu Lys His Leu Leu Ser Ser Val Lys His Phe Glu Lys
115 120 125
Val Lys Ile Leu Pro Lys Asp Arg Trp Thr Gln His Thr Thr Thr Gly
130 135 140
Gly Ser Arg Ala Cys Ala Val Ser Gly Asn Pro Ser Phe Phe Arg Asn
145 150 155 160
Met Val Trp Leu Thr Lys Lys Glu Ser Asn Tyr Pro Val Ala Lys Gly
165 170 175
Ser Tyr Asn Asn Thr Ser Gly Glu Gln Met Leu Ile Ile Trp Gly Val
180 185 190
His His Pro Asn Asp Glu Thr Glu Gln Arg Thr Leu Tyr Gln Asn Val
195 200 205
Gly Thr Tyr Val Ser Val Gly Thr Ser Thr Leu Asn Lys Arg Ser Thr
210 215 220
Pro Asp Ile Ala Thr Arg Pro Lys Val Asn Gly Leu Gly Ser Arg Met
225 230 235 240
Glu Phe Ser Trp Thr Leu Leu Asp Met Trp Asp Thr Ile Asn Phe Glu
245 250 255
Ser Thr Gly Asn Leu Ile Ala Pro Glu Tyr Gly Phe Lys Ile Ser Lys
260 265 270
Arg Gly Ser Ser Gly Ile Met Lys Thr Glu Gly Thr Leu Glu Asn Cys
275 280 285
Glu Thr Lys Cys Gln Thr Pro Leu Gly Ala Ile Asn Thr Thr Leu Pro
290 295 300
Phe His Asn Val His Pro Leu Thr Ile Gly Glu Cys Pro Lys Tyr Val
305 310 315 320
Lys Ser Glu Lys Leu Val Leu Ala Thr Gly Leu Arg Asn Val Pro Gln
325 330 335
Ile Glu Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly
340 345 350
Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn
355 360 365
Asp Gln Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Lys Ala
370 375 380
Phe Asp Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn
385 390 395 400
Thr Gln Phe Glu Ala Val Gly Lys Glu Phe Ser Asn Leu Glu Arg Arg
405 410 415
Leu Glu Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp
420 425 430
Thr Tyr Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu
435 440 445
Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Met
450 455 460
Gln Leu Arg Asp Asn Val Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe
465 470 475 480
Tyr His Lys Cys Asp Asp Glu Cys Met Asn Ser Val Lys Asn Gly Thr
485 490 495
Tyr Asp Tyr Pro Lys Tyr Glu Glu Glu Ser Lys Leu Asn Arg Asn Glu
500 505 510
Ile Lys Gly Val Lys Leu Ser Ser Met Gly Val Tyr Gln Ile Leu Ala
515 520 525
Ile Tyr Ala Thr Val Ala Gly Ser Leu Ser Leu Ala Ile Met Met Ala
530 535 540
Gly Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile
545 550 555 560
Cys Ile
<210>55
<211>567
<212>PRT
<213>人工序列
<220>
<223>克隆体
<400>55
Met Glu Lys Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser
1 5 10 15
Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val
20 25 30
Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile
35 40 45
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys
50 55 60
Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn
65 70 75 80
Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val
85 90 95
Glu Lys Ala Asn Pro Ala Asn Asp Leu Cys Tyr Pro Gly Asn Phe Asn
100 105 110
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu
115 120 125
Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser
130 135 140
Ser Gly Val Ser Ser Ala Cys Pro Tyr Gln Gly Thr Pro Ser Phe Phe
145 150 155 160
Arg Asn Val Val Trp Leu Ile Lys Lys Asn Asn Thr Tyr Pro Thr Ile
165 170 175
Lys Arg Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Ile Leu Trp
180 185 190
Gly Ile His His Ser Asn Asp Ala Ala Glu Gln Thr Lys Leu Tyr Gln
195 200 205
Asn Pro Thr Thr Tyr Ile Ser Val Gly Thr Ser Thr Leu Asn Gln Arg
210 215 220
Leu Val Pro Lys Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly
225 230 235 240
Arg Met Asp Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn
245 250 255
Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile
260 265 270
Val Lys Lys Gly Asp Ser Ala Ile Val Lys Ser Glu Val Glu Tyr Gly
275 280 285
Asn Cys Asn Thr Lys Cys Gln Thr Pro Ile Gly Ala Ile Asn Ser Ser
290 295 300
Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys
305 310 315 320
Tyr Val Lys Ser Asn Lys Leu Val Leu Ala Thr Gly Leu Arg Asn Ser
325 330 335
Pro Leu Arg Glu Arg Arg Arg Lys Arg Gly Leu Phe Gly Ala Ile Ala
340 345 350
Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly
355 360 365
Tyr His His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys Glu
370 375 380
Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser Ile
385 390 395 400
Ile Asp Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe Asn
405 410 415
Asn Leu Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp Gly
420 425 430
Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met Glu
435 440 445
Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr
450 455 460
Asp Lys Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly Asn
465 470 475 480
Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu Ser
485 490 495
Val Arg Asn Gly Thr Tyr Asp Tyr Pro Gln Tyr Ser Glu Glu Ala Arg
500 505 510
Leu Lys Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly Thr
515 520 525
Tyr Gln Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala Leu
530 535 540
Ala Ile Met Val Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly Ser
545 550 555 560
Leu Gln Cys Arg Ile Cys Ile
565
<210>56
<211>568
<212>PRT
<213>人工序列
<220>
<223>克隆体
<400>56
Met Glu Lys Ile Val Leu Leu Phe Ala Ile Val Ser Leu Val Lys Ser
1 5 10 15
Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val
20 25 30
Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile
35 40 45
Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys
50 55 60
Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn
65 70 75 80
Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val
85 90 95
Glu Lys Ala Asn Pro Val Asn Asp Leu Cys Tyr Pro Gly Asp Phe Asn
100 105 110
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu
115 120 125
Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Ser His Glu Ala Ser
130 135 140
Leu Gly Val Ser Ser Ala Cys Pro Tyr Gln Gly Lys Ser Ser Phe Phe
145 150 155 160
Arg Asn Val Val Trp Leu Ile Lys Lys Asn Ser Thr Tyr Pro Thr Ile
165 170 175
Lys Arg Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Val Leu Trp
180 185 190
Gly Ile His His Pro Asn Asp Ala Ala GluGln Thr Lys Leu Tyr Gln
195 200 205
Asn Pro Thr Thr Tyr Ile Ser Val Gly Thr Ser Thr Leu Asn Gln Arg
210 215 220
Leu Val Pro Arg Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly
225 230 235 240
Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn
245 250 255
Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile
260 265 270
Val Lys Lys Gly Asp Ser Thr Ile Met Lys Ser Glu Leu Glu Tyr Gly
275 280 285
Asn Cys Asn Thr Lys Cys Gln Thr Pro Met Gly Ala Ile Asn Ser Ser
290 295 300
Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys
305 310 315 320
Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser
325 330 335
Pro Gln Arg Glu Arg Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile
340 345 350
Ala Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr
355 360 365
Gly Tyr His His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys
370 375 380
Glu Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser
385 390 395 400
Ile Ile Asp Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe
405 410 415
Asn Asn Leu Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp
420 425 430
Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met
435 440 445
Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu
450 455 460
Tyr Asp Lys Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly
465 470 475 480
Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu
485 490 495
Ser Val Arg Asn Gly Thr Tyr Asp Tyr Pro Gln Tyr Ser Glu Glu Ala
500 505 510
Arg Leu Lys Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly
515 520 525
Ile Tyr Gln Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala
530 535 540
Leu Ala Ile Met Val Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly
545 550 555 560
Ser Leu Gln Cys Arg Ile Cys Ile
565
<210>57
<211>566
<212>PRT
<213>人工序列
<220>
<223>克隆体
<400>57
Met Ile Ala Ile Ile Val Ile Ala Ile Leu Ala Ala Ala Gly Lys Ser
1 5 10 15
Asp Lys Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Thr Gln Val
20 25 30
Asp Thr Ile Leu Glu Lys Asn Val Thr Val Thr His Ser Ile Glu Leu
35 40 45
Leu Glu Asn Gln Lys Glu Glu Arg Phe Cys Lys Ile Leu Asn Lys Ala
50 55 60
Pro Leu Asp Leu Arg Glu Cys Thr Ile Glu Gly Trp Ile Leu Gly Asn
65 70 75 80
Pro Gln Cys Asp Leu Leu Leu Gly Asp Gln Ser Trp Ser Tyr Ile Val
85 90 95
Glu Arg Pro Thr Ala Gln Asn Gly Ile Cys Tyr Pro Gly Thr Leu Asn
100 105 110
Glu Val Glu Glu Leu Arg Ala Leu Ile Gly Ser Gly Glu Arg Val Glu
115 120 125
Arg Phe Glu Met Phe Pro Gln Ser Thr Trp Gln Gly Val Asp Thr Asn
130 135 140
Ser Gly Thr Thr Arg Ser Cys Pro Tyr Ser Thr Gly Ala Ser Phe Tyr
145 150 155 160
Arg Asn Leu Leu Trp Ile Ile Lys Thr Lys Thr Ala Glu Tyr Pro Val
165 170 175
Ile Lys Gly Ile Tyr Asn Asn Thr Gly Thr Gln Pro Ile Leu Tyr Phe
180 185 190
Trp Gly Val His His Pro Pro Asn Thr Asp Glu Gln Asp Thr Leu Tyr
195 200 205
Gly Ser Gly Asp Arg Tyr Val Arg Met Gly Thr Glu Ser Met Asn Phe
210 215 220
Ala Lys Ser Pro Glu Ile Ala Ala Arg Pro Ala Val Asn Gly Gln Arg
225 230 235 240
Gly Arg Ile Asp Tyr Tyr Trp Ser Val Leu Lys Pro Gly Glu Thr Leu
245 250 255
Asn Val Glu Ser Asn Gly Asn Leu Ile Ala Pro Trp Tyr Ala Tyr Lys
260 265 270
Phe Val Asn Thr Asn Ser Lys Gly Ala Val Phe Arg Ser Asp Leu Pro
275 280 285
Ile Glu Asn Cys Asp Ala Thr Cys Gln Thr Ile Ala Gly Val Leu Arg
290 295 300
Thr Asn Lys Thr Phe Gln Asn Val Ser Pro Leu Trp Ile Gly Glu Cys
305 310 315 320
Pro Lys Tyr Val Lys Ser Glu Ser Leu Arg Leu Ala Thr Gly Leu Arg
325 330 335
Asn Val Pro Gln Ile Glu Thr Arg Gly Leu Phe Gly Ala Ile Ala Gly
340 345 350
Phe Ile Glu Gly Gly Trp Thr Gly Met Ile Asp Gly Trp Tyr Gly Tyr
355 360 365
His His Glu Asn Ser Gln Gly Ser Gly Tyr Ala Ala Asp Arg Glu Ser
370 375 380
Thr Gln Lys Ala Val Asn Arg Ile Thr Asn Lys Val Asn Ser Ile Ile
385 390 395 400
Asn Lys Met Asn Thr Gln Phe Glu Ala Val Asp His Glu Phe Ser Asn
405 410 415
Leu Glu Arg Arg Ile Asp Asn Leu Asn Lys Arg Met Gln Asp Gly Phe
420 425 430
Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn
435 440 445
Glu Arg Thr Leu Asp Met His Asp Ala Asn Val Lys Asn Leu His Glu
450 455 460
Lys Val Lys Ser Gln Leu Arg Asp Asn Ala Thr Ile Leu Gly Asn Gly
465 470 475 480
Cys Phe Glu Phe Trp His Lys Cys Asp Asn Glu Cys Ile Glu Ser Val
485 490 495
Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Gln Thr Glu Ser Lys Leu
500 505 510
Asn Arg Leu Lys Ile Glu Ser Val Lys Leu Glu Asn Leu Gly Val Tyr
515 520 525
Gln Ile Leu Ala Ile Tyr Ser Thr Val Ser Ser Ser Leu Val Leu Val
530 535 540
Gly Leu Ile Met Ala Met Gly Leu Trp Met Cys Ser Asn Gly Ser Met
545 550 555 560
Gln Cys Arg Ile Cys Ile
565
<210>58
<211>570
<212>PRT
<213>人工序列
<220>
<223>克隆体
<400>58
Met Asn Thr Gln Ile Leu Ile Leu Ala Thr Ser Ala Phe Phe Tyr Val
1 5 10 15
Arg Ala Asp Lys Ile Cys Leu Gly His His Ala Val Ser Asn Gly Thr
20 25 30
Lys Val Asp Thr Leu Thr Glu Lys Gly Ile Glu Val Val Asn Ala Thr
35 40 45
Glu Thr Val Glu Gln Thr Asn Ile Pro Lys Ile Cys Ser Lys Gly Lys
50 55 60
Gln Thr Val Asp Leu Gly Gln Cys Gly Leu Leu Gly Thr Val Ile Gly
65 70 75 80
Pro Pro Gln Cys Asp Gln Phe Leu Glu Phe Ser Ala Asn Leu Ile Val
85 90 95
Glu Arg Arg Glu Gly Asn Asp Ile Cys Tyr Pro Gly Lys Phe Asp Asn
100 105 110
Glu Glu Thr Leu Arg Lys Ile Leu Arg Lys Ser Gly Gly Ile Lys Lys
115 120 125
Glu Asn Met Gly Phe Thr Tyr Thr Gly Val Arg Thr Asn Gly Glu Thr
130 135 140
Ser Ala Cys Arg Arg Ser Arg Ser Ser Phe Tyr Ala Glu Met Lys Trp
145 150 155 160
Leu Leu Ser Ser Thr Asp Asn Gly Thr Phe Pro Gln Met Thr Lys Ser
165 170 175
Tyr Lys Asn Thr Lys Lys Val Pro Ala Leu Ile Ile Trp Gly Ile His
180 185 190
His Ser Gly Ser Thr Thr Glu Gln Thr Arg Leu Tyr Gly Ser Gly Asn
195 200 205
Lys Leu Ile Thr Val Trp Ser Ser Lys Tyr Gln Gln Ser Phe Val Pro
210 215 220
Asn Pro Gly Pro Arg Pro Gln Met Asn Gly Gln Ser Gly Arg Ile Asp
225 230 235 240
Phe His Trp Leu Met Leu Asp Pro Asn Asp Thr Val Thr Phe Ser Phe
245 250 255
Asn Gly Ala Phe Ile Ala Pro Asp Arg Ala Ser Phe Leu Arg Gly Lys
260 265 270
Ser Leu Gly Ile Gln Ser Asp Ala Gln Leu Asp Asn Asn Cys Glu Gly
275 280 285
Glu Cys Tyr His Ile Gly Gly Thr Ile Ile Ser Asn Leu Pro Phe Gln
290 295 300
Asn Ile Asn Ser Arg Ala Ile Gly Lys Cys Pro Arg Tyr Val Lys Gln
305 310 315 320
Lys Ser Leu Met Leu Ala Thr Gly Met Lys Asn Val Pro Glu Ala Pro
325 330 335
Ala His Lys Gln Leu Thr His His Met Arg Lys Lys Arg Gly Leu Phe
340 345 350
Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu Gly Leu Ile Asp
355 360 365
Gly Trp Tyr Gly Tyr Lys His Gln Asn Ala Gln Gly Glu Gly Thr Ala
370 375 380
Ala Asp Tyr Lys Ser Thr Gln Ser Ala Ile Asn Gln Ile Thr Gly Lys
385 390 395 400
Leu Asn Arg Leu Ile Glu Lys Thr Asn Gln Gln Phe Glu Leu Ile Asp
405 410 415
Asn Glu Phe Asn Glu Ile Glu Lys Gln Ile Gly Asn ValIle Asn Trp
420 425 430
Thr Arg Asp Ser Ile Ile Glu Val Trp Ser Tyr Asn Ala Glu Phe Leu
435 440 445
Val Ala Val Glu Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met
450 455 460
Asn Lys Leu Tyr Glu Lys Val Arg Arg Gln Leu Arg Glu Asn Ala Glu
465 470 475 480
Glu Asp Gly Asn Gly Cys Phe Glu Ile Phe His Gln Cys Asp Asn Asp
485 490 495
Cys Met Ala Ser Ile Arg Asn Asn Thr Tyr Asp His Lys Lys Tyr Arg
500 505 510
Lys Glu Ala Ile Gln Asn Arg Ile Gln Ile Asp Ala Val Lys Leu Ser
515 520 525
Ser Gly Tyr Lys Asp Ile Ile Leu Trp Phe Ser Phe Gly Ala Ser Cys
530 535 540
Phe Leu Phe Leu Ala Ile Ala Met Gly Leu Val Phe Ile Cys Ile Lys
545 550 555 560
Asn Gly Asn Met Arg Cys Thr Ile Cys Ile
565 570
<210>59
<211>560
<212>PRT
<213>人工序列
<220>
<223>克隆体
<400>59
Met Glu Thr Ile Ser Leu Ile Thr Ile Leu Leu Val Val Thr Ala Ser
1 5 10 15
Asn Ala Asp Lys Ile Cys Ile Gly His Gln Ser Thr Asn Ser Thr Glu
20 25 30
Thr Val Asp Thr Leu Thr Glu Thr Asn Val Pro Val Thr His Ala Lys
35 40 45
Glu Leu Leu His Thr Glu His Asn Gly Met Leu Cys Ala Thr Ser Leu
50 55 60
Gly His Pro Leu Ile Leu Asp Thr Cys Thr Ile Glu Gly Leu Val Tyr
65 70 75 80
Gly Asn Pro Ser Cys Asp Leu Leu Leu Gly Gly Arg Glu Trp Ser Tyr
85 90 95
Ile Val Glu Arg Ser Ser Ala Val Asn Gly Thr Cys Tyr Pro Gly Asn
100 105 110
Val Glu Asn Leu Glu Glu Leu Arg Thr Leu Phe Ser Ser Ala Ser Ser
115 120 125
Tyr Gln Arg Ile Gln Ile Phe Pro Asp Thr Thr Trp Asn Val Thr Tyr
130 135 140
Thr Gly Thr Ser Arg Ala Cys Ser Gly Ser Phe Tyr Arg Ser Met Arg
145 150 155 160
Trp Leu Thr Gln Lys Ser Gly Phe Tyr Pro Val Gln Asp Ala Gln Tyr
165 170 175
Thr Asn Asn Arg Gly Lys Ser Ile Leu Phe Val Trp Gly Ile His His
180 185 190
Pro Pro Thr Tyr Thr Glu Gln Thr Asn Leu Tyr Ile Arg Asn Asp Thr
195 200 205
Thr Thr Ser Val Thr Thr Glu Asp Leu Asn Arg Thr Phe Lys Pro Val
210 215 220
Ile Gly Pro Arg Pro Leu Val Asn Gly Leu Gln Gly Arg Ile Asp Tyr
225 230 235 240
Tyr Trp Ser Val Leu Lys Pro Gly Gln Thr Leu Arg Val Arg Ser Asn
245 250 255
Gly Asn Leu Ile Ala Pro Trp Tyr Gly His Val Leu Ser Gly Gly Ser
260 265 270
His Gly Arg Ile Leu Lys Thr Asp Leu Lys Gly Gly Asn Cys Val Val
275 280 285
Gln Cys Gln Thr Glu Lys Gly Gly Leu Asn Ser Thr Leu Pro Phe His
290 295 300
Asn Ile Ser Lys Tyr Ala Phe Gly Thr Cys Pro Lys Tyr Val Arg Val
305 310 315 320
Asn Ser Leu Lys Leu Ala Val Gly Leu Arg Asn Val Pro Ala Arg Ser
325 330 335
Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp
340 345 350
Pro Gly Leu Val Ala Gly Trp Tyr Gly Phe Gln His Ser Asn Asp Gln
355 360 365
Gly Val Gly Met Ala Ala Asp Arg Asp Ser Thr Gln Lys Ala Ile Asp
370 375 380
Lys Ile Thr Ser Lys Val Asn Asn Ile Val Asp Lys Met Asn Lys Gln
385 390 395 400
Tyr Glu Ile Ile Asp His Glu Phe Ser Glu Val Glu Thr Arg Leu Asn
405 410 415
Met Ile Asn Asn Lys Ile Asp Asp Gln Ile Gln Asp Val Trp Ala Tyr
420 425 430
Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Gln Lys Thr Leu Asp Glu
435 440 445
His Asp Ala Asn Val Asn Asn Leu Tyr Asn Lys Val Lys Arg Ala Leu
450 455 460
Gly Ser Asn Ala Met Glu Asp Gly Lys Gly Cys Phe Glu Leu Tyr His
465 470 475 480
Lys Cys Asp Asp Gln Cys Met Glu Thr Ile Arg Asn Gly Thr Tyr Asn
485 490 495
Arg Arg Lys Tyr Arg Glu Glu Ser Arg Leu Glu Arg Gln Lys Ile Glu
500 505 510
Gly Val Lys Leu Glu Ser Glu Gly Thr Tyr Lys Ile Leu Thr Ile Tyr
515 520 525
Ser Thr Val Ala Ser Ser Leu Val Leu Ala Met Gly Phe Ala Ala Phe
530 535 540
Leu Phe Trp Ala Met Ser Asn Gly Ser Cys Arg Cys Asn Ile Cys Ile
545 550 555 560
<210>60
<211>3111
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>60
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tggagaaaat agtgcttctt 1020
cttgcaatag tcagtcttgt taaaagtgat cagatttgca ttggttacca tgcaaacaat 1080
tcaacagagc aggttgacac aatcatggaa aagaacgtta ctgttacaca tgcccaagac 1140
atactggaaa agacacacaa cgggaagctc tgcgatctag atggagtgaa gcctctaatt 1200
ttaagagatt gtagtgtagc tggatggctc ctcgggaacc caatgtgtga cgaattcatc 1260
aatgtaccgg aatggtctta catagtggag aaggccaatc caaccaatga cctctgttac 1320
ccagggagtt tcaacgacta tgaagaactg aaacacctat tgagcagaat aaaccatttt 1380
gagaaaattc aaatcatccc caaaagttct tggtccgatc atgaagcctc atcaggagtt 1440
agctcagcat gtccatacct gggaagtccc tcctttttta gaaatgtggt atggcttatc 1500
aaaaagaaca gtacataccc aacaataaag aaaagctaca ataataccaa ccaagaggat 1560
cttttggtac tgtggggaat tcaccatcct aatgatgcgg cagagcagac aaggctatat 1620
caaaacccaa ccacctatat ttccattggg acatcaacac taaaccagag attggtacca 1680
aaaatagcta ctagatccaa agtaaacggg caaagtggaa ggatggagtt cttctggaca 1740
attttaaaac ctaatgatgc aatcaacttc gagagtaatg gaaatttcat tgctccagaa 1800
tatgcataca aaattgtcaa gaaaggggac tcagcaatta tgaaaagtga attggaatat 1860
ggtaactgca acaccaagtg tcaaactcca atgggggcga taaactctag tatgccattc 1920
cacaacatac accctctcac catcggggaa tgccccaaat atgtgaaatc aaacagatta 1980
gtccttgcaa cagggctcag aaatagccct caaagagaga gcagaagaaa aaagagagga 2040
ctatttggag ctatagcagg ttttatagag ggaggatggc agggaatggt agatggttgg 2100
tatgggtacc accatagcaa tgagcagggg agtgggtacg ctgcagacaa agaatccact 2160
caaaaggcaa tagatggagt caccaataag gtcaactcaa tcattgacaa aatgaacact 2220
cagtttgagg ccgttggaag ggaatttaat aacttagaaa ggagaataga gaatttaaac 2280
aagaagatgg aagacgggtt tctagatgtc tggacttata atgccgaact tctggttctc 2340
atggaaaatg agagaactct agactttcat gactcaaatg ttaagaacct ctacgacaag 2400
gtccgactac agcttaggga taatgcaaag gagctgggta acggttgttt cgagttctat 2460
cacaaatgtg ataatgaatg tatggaaagt ataagaaacg gaacgtacaa ctatccgcag 2520
tattcagaag aagcaagatt aaaaagagag gaaataagtg gggtaaaatt ggaatcaata 2580
ggaacttacc aaatactgtc aatttattca acagtggcga gttccctagc actggcaatc 2640
atgatggctg gtctatcttt atggatgtgc tccaatggat cgttacaatg cagaatttgc 2700
atttaagagc tctaagttaa aatgcttctt cgtctcctat ttataatatg gtttgttatt 2760
gttaattttg ttcttgtaga agagcttaat taatcgttgt tgttatgaaa tactatttgt 2820
atgagatgaa ctggtgtaat gtaattcatt tacataagtg gagtcagaat cagaatgttt 2880
cctccataac taactagaca tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac 2940
taaaattgaa catcttttgc cacaacttta taagtggtta atatagctca aatatatggt 3000
caagttcaat agattaataa tggaaatatc agttatcgaa attcattaac aatcaactta 3060
acgttattaa ctactaattt tatatcatcc cctttgataa atgatagtac a 3111
<210>61
<211>3123
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>61
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt 1020
ttcggcttat tgttttctct tcttgtgttg gttccttctc agatcttcgc tgacacaata 1080
tgtataggct accatgccaa caactcaacc gacactgttg acacagtact tgagaagaat 1140
gtgacagtga cacactctgt caacctactt gaggacagtc acaatggaaa actatgtcta 1200
ctaaaaggaa tagccccact acaattgggt aattgcagcg ttgccggatg gatcttagga 1260
aacccagaat gcgaattact gatttccaag gaatcatggt cctacattgt agaaacacca 1320
aatcctgaga atggaacatg ttacccaggg tatttcgccg actatgagga actgagggag 1380
caattgagtt cagtatcttc atttgagaga ttcgaaatat tccccaaaga aagctcatgg 1440
cccaaccaca ccgtaaccgg agtatcagca tcatgctccc ataatgggaa aagcagtttt 1500
tacagaaatt tgctatggct gacggggaag aatggtttgt acccaaacct gagcaagtcc 1560
tatgtaaaca acaaagagaa agaagtcctt gtactatggg gtgttcatca cccgcctaac 1620
atagggaacc aaagggcact ctatcataca gaaaatgctt atgtctctgt agtgtcttca 1680
cattatagca gaagattcac cccagaaata gccaaaagac ccaaagtaag agatcaggaa 1740
ggaagaatca actactactg gactctgctg gaacctgggg atacaataat atttgaggca 1800
aatggaaatc taatagcgcc atggtatgct tttgcactga gtagaggctt tggatcagga 1860
atcatcacct caaatgcacc aatggatgaa tgtgatgcga agtgtcaaac acctcaggga 1920
gctataaaca gcagtcttcc tttccagaat gtacacccag tcacaatagg agagtgtcca 1980
aagtatgtca ggagtgcaaa attaaggatg gttacaggac taaggaacat cccatccatt 2040
caatccagag gtttgtttgg agccattgcc ggtttcattg aaggggggtg gactggaatg 2100
gtagatgggt ggtatggtta tcatcatcag aatgagcaag gatctggcta tgctgcagat 2160
caaaaaagta cacaaaatgc cattaacggg attacaaaca aggtcaattc tgtaattgag 2220
aaaatgaaca ctcaattcac agctgtgggc aaagagttca acaaattgga aagaaggatg 2280
gaaaacttaa ataaaaaagt tgatgatggg tttctagaca tttggacata taatgcagaa 2340
ttgttggttc tactggaaaa tgaaaggact ttggatttcc atgactccaa tgtgaagaat 2400
ctgtatgaga aagtaaaaag ccaattaaag aataatgcca aagaaatagg aaacgggtgt 2460
tttgagttct atcacaagtg taacaatgaa tgcatggaga gtgtgaaaaa tggtacctat 2520
gactatccaa aatattccga agaatcaaag ttaaacaggg agaaaattga tggagtgaaa 2580
ttggaatcaa tgggagtata ccagattctg gcgatctact caactgtcgc cagttccctg 2640
gttcttttgg tctccctggg ggcaatcagc ttctggatgt gttccaatgg gtctttgcag 2700
tgtagaatat gcatctaaga gctctaagtt aaaatgcttc ttcgtctcct atttataata 2760
tggtttgtta ttgttaattt tgttcttgta gaagagctta attaatcgtt gttgttatga 2820
aatactattt gtatgagatg aactggtgta atgtaattca tttacataag tggagtcaga 2880
atcagaatgt ttcctccata actaactaga catgaagacc tgccgcgtac aattgtctta 2940
tatttgaaca actaaaattg aacatctttt gccacaactt tataagtggt taatatagct 3000
caaatatatg gtcaagttca atagattaat aatggaaata tcagttatcg aaattcatta 3060
acaatcaact taacgttatt aactactaat tttatatcat cccctttgat aaatgatagt 3120
aca 3123
<210>62
<211>3088
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>62
ctggtatatt tatatgttgt caaataactc aaaaaccata aaagtttaag ttagcaagtg 60
tgtacatttt tacttgaaca aaaatattca cctactactg ttataaatca ttattaaaca 120
ttagagtaaa gaaatatgga tgataagaac aagagtagtg atattttgac aacaattttg 180
ttgcaacatt tgagaaaatt ttgttgttct ctcttttcat tggtcaaaaa caatagagag 240
agaaaaagga agagggagaa taaaaacata atgtgagtat gagagagaaa gttgtacaaa 300
agttgtacca aaatagttgt acaaatatca ttgaggaatt tgacaaaagc tacacaaata 360
agggttaatt gctgtaaata aataaggatg acgcattaga gagatgtacc attagagaat 420
ttttggcaag tcattaaaaa gaaagaataa attattttta aaattaaaag ttgagtcatt 480
tgattaaaca tgtgattatt taatgaattg atgaaagagt tggattaaag ttgtattagt 540
aattagaatt tggtgtcaaa tttaatttga catttgatct tttcctatat attgccccat 600
agagtcagtt aactcatttt tatatttcat agatcaaata agagaaataa cggtatatta 660
atccctccaa aaaaaaaaaa cggtatattt actaaaaaat ctaagccacg taggaggata 720
acaggatccc cgtaggagga taacatccaa tccaaccaat cacaacaatc ctgatgagat 780
aacccacttt aagcccacgc atctgtggca catctacatt atctaaatca cacattcttc 840
cacacatctg agccacacaa aaaccaatcc acatctttat cacccattct ataaaaaatc 900
acactttgtg agtctacact ttgattccct tcaaacacat acaaagagaa gagactaatt 960
aattaattaa tcatcttgag agaaaatgaa agtaaaacta ctggtcctgt tatgcacatt 1020
tacagctaca tatgcagaca caatatgtat aggctaccat gctaacaact cgaccgacac 1080
tgttgacaca gtacttgaaa agaatgtgac agtgacacac tctgtcaacc tgcttgagaa 1140
cagtcacaat ggaaaactat gtctattaaa aggaatagcc ccactacaat tgggtaattg 1200
cagcgttgcc gggtggatct taggaaaccc agaatgcgaa ttactgattt ccaaggagtc 1260
atggtcctac attgtagaaa aaccaaatcc tgagaatgga acatgttacc cagggcattt 1320
cgctgactat gaggaactga gggagcaatt gagttcagta tcttcatttg agaggttcga 1380
aatattcccc aaagaaagct catggcccaa ccacaccgta accggagtgt cagcatcatg 1440
ctcccataat ggggaaagca gtttttacag aaatttgcta tggctgacgg ggaagaatgg 1500
tttgtaccca aacctgagca agtcctatgc aaacaacaaa gaaaaagaag tccttgtact 1560
atggggtgtt catcacccgc caaacatagg tgaccaaaag gccctctatc atacagaaaa 1620
tgcttatgtc tctgtagtgt cttcacatta tagcagaaaa ttcaccccag aaatagccaa 1680
aagacccaaa gtaagagatc aagaaggaag aatcaattac tactggactc tgcttgaacc 1740
cggggataca ataatatttg aggcaaatgg aaatctaata gcgccaagat atgctttcgc 1800
actgagtaga ggctttggat caggaatcat caactcaaat gcaccaatgg ataaatgtga 1860
tgcgaagtgc caaacacctc agggagctat aaacagcagt cttcctttcc agaacgtaca 1920
cccagtcaca ataggagagt gtccaaagta tgtcaggagt gcaaaattaa ggatggttac 1980
aggactaagg aacatcccat ccattcaatc cagaggtttg tttggagcca ttgccggttt 2040
cattgaaggg gggtggactg gaatggtaga tggttggtat ggttatcatc atcagaatga 2100
gcaaggatct ggctatgctg cagatcaaaa aagcacacaa aatgccatta atgggattac 2160
aaacaaggtc aattctgtaa ttgagaaaat gaacactcaa ttcacagcag tgggcaaaga 2220
gttcaacaaa ttggaaagaa ggatggaaaa cttgaataaa aaagttgatg atgggtttat 2280
agacatttgg acatataatg cagaactgtt ggttctactg gaaaatgaaa ggactttgga 2340
tttccatgac tccaatgtga agaatctgta tgagaaagta aaaagccagt taaagaataa 2400
tgctaaagaa ataggaaatg ggtgttttga gttctatcac aagtgtaacg atgaatgcat 2460
ggagagtgta aagaatggaa cttatgacta tccaaaatat tccgaagaat caaagttaaa 2520
cagggagaaa attgatggag tgaaattgga atcaatggga gtctatcaga ttctggcgat 2580
ctactcaaca gtcgccagtt ctctggttct tttggtctcc ctgggggcaa tcagcttctg 2640
gatgtgttcc aatgggtctt tacagtgtag aatatgcatc taagagctct aagttaaaat 2700
gcttcttcgt ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga 2760
gcttaattaa tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta 2820
attcatttac ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga 2880
agacctgccg cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac 2940
aactttataa gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg 3000
aaatatcagt tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat 3060
atcatcccct ttgataaatg atagtaca 3088
<210>63
<211>3102
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>63
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tgaaagtaaa actactggtc 1020
ctgttatgca catttacagc tacatatgca gacacaatat gtataggcta ccatgccaac 1080
aactcaaccg acactgttga cacagtactt gagaagaatg tgacagtgac acactctgtc 1140
aacctgcttg aggacagtca caatggaaaa ttatgtctat taaaaggaat agccccacta 1200
caattgggta attgcagcgt tgccggatgg atcttaggaa acccagaatg cgaattactg 1260
atttccaggg aatcatggtc ctacattgta gaaaaaccaa atcctgagaa tggaacatgt 1320
tacccagggc atttcgccga ctatgaggaa ctgagggagc aattgagttc agtatcttca 1380
tttgagagat tcgaaatatt ccccaaagaa agctcatggc ccaaccacac cacaaccgga 1440
gtatcagcat catgctccca taatggggaa agcagttttt acaaaaattt gctatggctg 1500
acggggaaga atggtttgta cccaaacctg agcaagtcct atgcaaacaa caaagagaaa 1560
gaagtccttg tactatgggg tgttcatcac ccgcctaaca taggtgacca aagggctctc 1620
tatcataaag aaaatgctta tgtctctgta gtgtcttcac attatagcag aaaattcacc 1680
ccagaaatag ccaaaagacc caaagtaaga gatcaagaag gaagaatcaa ctactactgg 1740
actctacttg aacccgggga tacaataata tttgaggcaa atggaaatct aatagcgcca 1800
agatatgctt tcgcactgag tagaggcttt ggatcaggaa tcatcaactc aaatgcacca 1860
atggatgaat gtgatgcgaa gtgccaaaca cctcagggag ctataaacag cagtcttcct 1920
ttccagaatg tacaccctgt cacaatagga gagtgtccaa agtatgtcag gagtgcaaaa 1980
ttaaggatgg ttacaggact aaggaacatc ccatccattc aatccagagg tttgtttgga 2040
gccattgccg gtttcattga aggggggtgg actggaatgg tagatggttg gtatggttat 2100
catcatcaga atgagcaagg atctggctat gctgcagatc aaaaaagcac acaaaatgcc 2160
attaatggga ttacaaacaa ggtcaattct gtaattgaga aaatgaacac tcaattcaca 2220
gctgtgggca aagagttcaa caaattggaa agaaggatgg aaaacttaaa taaaaaagtt 2280
gatgatgggt ttatagacat ttggacatat aatgcagaat tgttggttct actggaaaat 2340
gaaaggactt tggatttcca tgactccaat gtgaagaatc tgtatgagaa agtaaaaagc 2400
caattaaaga ataatgccaa agaaatagga aatgggtgtt ttgagttcta tcataagtgt 2460
aacgatgaat gcatggagag tgtaaaaaat ggaacttatg actatccaaa atattccgaa 2520
gaatcaaagt taaacaggga gaaaattgat ggagtgaaat tggaatcaat gggagtctat 2580
cagattctgg cgatctactc aacagtcgcc agttctctgg ttcttttggt ctccctgggg 2640
gcaatcagct tctggatgtg ttccaatggg tctttgcagt gtagaatatg catctgagag 2700
ctctaagtta aaatgcttct tcgtctccta tttataatat ggtttgttat tgttaatttt 2760
gttcttgtag aagagcttaa ttaatcgttg ttgttatgaa atactatttg tatgagatga 2820
actggtgtaa tgtaattcat ttacataagt ggagtcagaa tcagaatgtt tcctccataa 2880
ctaactagac atgaagacct gccgcgtaca attgtcttat atttgaacaa ctaaaattga 2940
acatcttttg ccacaacttt ataagtggtt aatatagctc aaatatatgg tcaagttcaa 3000
tagattaata atggaaatat cagttatcga aattcattaa caatcaactt aacgttatta 3060
actactaatt ttatatcatc ccctttgata aatgatagta ca 3102
<210>64
<211>3093
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>64
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tggccatcat ttatctaatt 1020
ctcctgttca cagcagtgag aggggaccaa atatgcattg gataccatgc caataattcc 1080
acagagaagg tcgacacaat tctagagcgg aacgtcactg tgactcatgc caaggacatt 1140
cttgagaaga cccataacgg aaagttatgc aaactaaacg gaatccctcc acttgaacta 1200
ggggactgta gcattgccgg atggctcctt ggaaatccag aatgtgatag gcttctaagt 1260
gtgccagaat ggtcctatat aatggagaaa gaaaacccga gagacggttt gtgttatcca 1320
ggcagcttca atgattatga agaattgaaa catctcctca gcagcgtgaa acatttcgag 1380
aaagtaaaga ttctgcccaa agatagatgg acacagcata caacaactgg aggttcacgg 1440
gcctgcgcgg tgtctggtaa tccatcattc ttcaggaaca tggtctggct gacaaagaaa 1500
gaatcaaatt atccggttgc caaaggatcg tacaacaata caagcggaga acaaatgcta 1560
ataatttggg gggtgcacca tcccaatgat gagacagaac aaagaacatt gtaccagaat 1620
gtgggaacct atgtttccgt aggcacatca acattgaaca aaaggtcaac cccagacata 1680
gcaacaaggc ctaaagtgaa tggactagga agtagaatgg agttctcttg gaccctattg 1740
gatatgtggg acaccataaa ttttgagagt actggtaatc taattgcacc agagtatgga 1800
ttcaaaatat cgaaaagagg tagttcaggg atcatgaaaa cagaaggaac acttgagaac 1860
tgtgagacca aatgccaaac tcctttggga gcaataaata caacattgcc ttttcacaat 1920
gtccacccac tgacaatagg tgagtgcccc aaatatgtaa aatcggagaa gttggtctta 1980
gcaacaggac taaggaatgt tccccagatt gaatcaagag gattgtttgg ggcaatagct 2040
ggttttatag aaggaggatg gcaaggaatg gttgatggtt ggtatggata ccatcacagc 2100
aatgaccagg gatcagggta tgcagcagac aaagaatcca ctcaaaaggc atttgatgga 2160
atcaccaaca aggtaaattc tgtgattgaa aagatgaaca cccaatttga agctgttggg 2220
aaagagttca gtaacttaga gagaagactg gagaacttga acaaaaagat ggaagacggg 2280
tttctagatg tgtggacata caatgctgag cttctagttc tgatggaaaa tgagaggaca 2340
cttgactttc atgattctaa tgtcaagaat ctgtatgata aagtcagaat gcagctgaga 2400
gacaacgtca aagaactagg aaatggatgt tttgaatttt atcacaaatg tgatgatgaa 2460
tgcatgaata gtgtgaaaaa cgggacgtat gattatccca agtatgaaga agagtctaaa 2520
ctaaatagaa atgaaatcaa aggggtaaaa ttgagcagca tgggggttta tcaaatcctt 2580
gccatttatg ctacagtagc aggttctctg tcactggcaa tcatgatggc tgggatctct 2640
ttctggatgt gctccaacgg gtctctgcag tgcaggatct gcatatgaga gctctaagtt 2700
aaaatgcttc ttcgtctcct atttataata tggtttgtta ttgttaattt tgttcttgta 2760
gaagagctta attaatcgtt gttgttatga aatactattt gtatgagatg aactggtgta 2820
atgtaattca tttacataag tggagtcaga atcagaatgt ttcctccata actaactaga 2880
catgaagacc tgccgcgtac aattgtctta tatttgaaca actaaaattg aacatctttt 2940
gccacaactt tataagtggt taatatagct caaatatatg gtcaagttca atagattaat 3000
aatggaaata tcagttatcg aaattcatta acaatcaact taacgttatt aactactaat 3060
tttatatcat cccctttgat aaatgatagt aca 3093
<210>65
<211>3108
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>65
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tggagaaaat agtgcttctt 1020
cttgcaatag tcagccttgt taaaagtgat cagatttgca ttggttacca tgcaaacaac 1080
tcgacagagc aggttgacac aataatggaa aagaacgtta ctgttacaca tgcccaagac 1140
atactggaaa agacacacaa cgggaagctc tgcgatctag atggagtgaa gcctctgatt 1200
ttaagagatt gtagtgtagc tggatggctc ctcggaaacc caatgtgtga cgagttcatc 1260
aatgtgccgg aatggtctta catagtggag aaggccaacc cagccaatga cctctgttac 1320
ccagggaatt tcaacgacta tgaagaactg aaacacctat tgagcagaat aaaccatttt 1380
gagaaaattc agatcatccc caaaagttct tggtccgatc atgaagcctc atcaggggtc 1440
agctcagcat gtccatacca gggaacgccc tcctttttca gaaatgtggt atggcttatc 1500
aaaaagaaca atacataccc aacaataaag agaagctaca ataataccaa ccaggaagat 1560
cttttgatac tgtgggggat tcatcattct aatgatgcgg cagagcagac aaagctctat 1620
caaaacccaa ccacctatat ttccgttggg acatcaacac taaaccagag attggtacca 1680
aaaatagcta ctagatccaa agtaaacggg caaagtggaa ggatggattt cttctggaca 1740
attttaaaac cgaatgatgc aatcaacttc gagagtaatg gaaatttcat tgctccagaa 1800
tatgcataca aaattgtcaa gaaaggggac tcagcaattg ttaaaagtga agtggaatat 1860
ggtaactgca atacaaagtg tcaaactcca ataggggcga taaactctag tatgccattc 1920
cacaacatac accctctcac catcggggaa tgccccaaat atgtgaaatc aaacaaatta 1980
gtccttgcga ctgggctcag aaatagtcct ctaagagaaa gaagaagaaa aagaggacta 2040
tttggagcta tagcagggtt tatagaggga ggatggcagg gaatggtaga tggttggtat 2100
gggtaccacc atagcaatga gcaggggagt gggtacgctg cagacaaaga atccactcaa 2160
aaggcaatag atggagtcac caataaggtc aactcgatca ttgacaaaat gaacactcag 2220
tttgaggccg ttggaaggga atttaataac ttagaaagga gaatagagaa tttaaacaag 2280
aaaatggaag acggattcct agatgtctgg acttataatg ctgaacttct ggttctcatg 2340
gaaaatgaga gaactctaga cttccatgat tcaaatgtca agaaccttta cgacaaggtc 2400
cgactacagc ttagggataa tgcaaaggag ctgggtaacg gttgtttcga gttctatcac 2460
aaatgtgata atgaatgtat ggaaagtgta agaaacggaa cgtatgacta cccgcagtat 2520
tcagaagaag caagattaaa aagagaggaa ataagtggag taaaattgga atcaatagga 2580
acttaccaaa tactgtcaat ttattcaaca gttgcgagtt ctctagcact ggcaatcatg 2640
gtggctggtc tatctttgtg gatgtgctcc aatgggtcgt tacaatgcag aatttgcatt 2700
taagagctct aagttaaaat gcttcttcgt ctcctattta taatatggtt tgttattgtt 2760
aattttgttc ttgtagaaga gcttaattaa tcgttgttgt tatgaaatac tatttgtatg 2820
agatgaactg gtgtaatgta attcatttac ataagtggag tcagaatcag aatgtttcct 2880
ccataactaa ctagacatga agacctgccg cgtacaattg tcttatattt gaacaactaa 2940
aattgaacat cttttgccac aactttataa gtggttaata tagctcaaat atatggtcaa 3000
gttcaataga ttaataatgg aaatatcagt tatcgaaatt cattaacaat caacttaacg 3060
ttattaacta ctaattttat atcatcccct ttgataaatg atagtaca 3108
<210>66
<211>3111
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>66
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tggagaaaat agtgcttctt 1020
tttgcaatag tcagtcttgt taaaagtgat cagatttgca ttggttacca tgcaaacaac 1080
tcgacagagc aggttgacac aataatggaa aagaacgtta ctgttacaca tgcccaagac 1140
atactggaaa agacacacaa tgggaagctc tgcgatctag atggagtgaa gcctctaatt 1200
ttgagagatt gtagtgtagc tggatggctc ctcggaaacc caatgtgtga cgagttcatc 1260
aatgtgccgg aatggtctta catagtggag aaggccaatc cagtcaatga cctctgttac 1320
ccaggggatt tcaatgacta tgaagaattg aaacacctat tgagcagaat aaaccatttt 1380
gagaaaattc agatcatccc caaaagttct tggtccagtc atgaagcctc attgggggtc 1440
agctcagcat gtccatacca gggaaagtcc tcctttttca gaaatgtggt atggcttatc 1500
aaaaagaaca gtacataccc aacaataaag aggagctaca ataataccaa ccaagaagat 1560
cttttggtac tgtgggggat tcaccatcct aatgatgcgg cagagcagac aaagctctat 1620
caaaacccaa ccacctatat ttccgttggg acatctacac taaaccagag attggtacca 1680
agaatagcta ctagatccaa agtaaacggg caaagtggaa ggatggagtt cttctggaca 1740
attttaaaac cgaatgatgc aatcaacttc gagagtaatg gaaatttcat tgctccagaa 1800
tatgcataca aaattgtcaa gaaaggggac tcaacaatta tgaaaagtga attggaatat 1860
ggtaactgca ataccaagtg tcaaactcca atgggggcga taaactctag catgccattc 1920
cacaatatac accctctcac catcggggaa tgccccaaat atgtgaaatc aaacagatta 1980
gtccttgcga ctgggctcag aaatagccct caaagagaga gaagaagaaa aaagagagga 2040
ttatttggag ctatagcagg ttttatagag ggaggatggc agggaatggt agatggttgg 2100
tatgggtacc accatagcaa cgagcagggg agtgggtacg ctgcagacaa agaatccact 2160
caaaaggcaa tagatggagt caccaataag gtcaactcga ttattgacaa aatgaacact 2220
cagtttgagg ccgttggaag ggaatttaac aacttagaaa ggagaataga gaatttaaac 2280
aagaagatgg aagacgggtt cctagatgtc tggacttata atgctgaact tctagttctc 2340
atggaaaacg agagaactct agactttcat gactcaaatg tcaagaacct ttacgacaag 2400
gtccgactac agcttaggga taatgcaaag gagctgggta acggttgttt cgagttctat 2460
cataaatgtg ataatgaatg tatggaaagt gtaagaaacg gaacgtatga ctacccgcag 2520
tattcagaag aagcaagact aaaaagagag gaaataagtg gagtaaaatt ggaatcaata 2580
ggaatttacc aaatattgtc aatttattct acagtggcca gctccctagc actggcaatc 2640
atggtagctg gtctatcctt atggatgtgc tccaatgggt cgttacaatg cagaatttgc 2700
atttaagagc tctaagttaa aatgcttctt cgtctcctat ttataatatg gtttgttatt 2760
gttaattttg ttcttgtaga agagcttaat taatcgttgt tgttatgaaa tactatttgt 2820
atgagatgaa ctggtgtaat gtaattcatt tacataagtg gagtcagaat cagaatgttt 2880
cctccataac taactagaca tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac 2940
taaaattgaa catcttttgc cacaacttta taagtggtta atatagctca aatatatggt 3000
caagttcaat agattaataa tggaaatatc agttatcgaa attcattaac aatcaactta 3060
acgttattaa ctactaattt tatatcatcc cctttgataa atgatagtac a 3111
<210>67
<211>3105
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>67
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tgattgcaat cattgtaata 1020
gcaatactgg cagcagccgg aaagtcagac aagatctgca ttgggtatca tgccaacaat 1080
tcaacaacac aggtagatac gatacttgag aagaatgtga ctgtcacaca ctcaattgaa 1140
ttgctggaaa atcagaagga agaaagattc tgcaagatat tgaacaaggc ccctctcgac 1200
ttaagggaat gtaccataga gggttggatc ttggggaatc cccaatgcga cctattgctt 1260
ggtgatcaaa gctggtcata cattgtggaa agacctactg ctcaaaacgg gatctgctac 1320
ccaggaacct taaatgaggt agaagaactg agggcactta ttggatcagg agaaagggta 1380
gagagatttg agatgtttcc ccaaagcacc tggcaaggag ttgacaccaa cagtggaaca 1440
acaagatcct gcccttattc tactggtgcg tctttctaca gaaacctcct atggataata 1500
aaaaccaaga cagcagaata tccagtaatt aagggaattt acaacaacac tggaacccag 1560
ccaatcctct atttctgggg tgtgcatcat cctcctaaca ccgacgagca agatactctg 1620
tatggctctg gtgatcgata cgttagaatg ggaactgaaa gcatgaattt tgccaagagt 1680
ccggaaattg cggcaaggcc tgctgtgaat ggacaaagag gcagaattga ttattattgg 1740
tcggttttaa aaccagggga aaccttgaat gtggaatcta atggaaatct aatcgcccct 1800
tggtatgcat acaaatttgt caacacaaat agtaaaggag ccgtcttcag gtcagattta 1860
ccaatcgaga actgcgatgc cacatgccag actattgcag gggttctaag gaccaataaa 1920
acatttcaga atgtgagtcc cctgtggata ggagaatgtc ccaaatacgt gaaaagtgaa 1980
agtctgaggc ttgcaactgg actaagaaat gttccacaga ttgaaactag aggactcttc 2040
ggagctattg cagggtttat tgaaggagga tggactggga tgatagatgg gtggtatggc 2100
tatcaccatg aaaattctca agggtcagga tatgcagcag acagagaaag cactcaaaag 2160
gctgtaaaca gaattacaaa taaggtcaat tccatcatca acaaaatgaa cacacaattt 2220
gaagctgtcg atcacgaatt ttcaaatctg gagaggagaa ttgacaatct gaacaaaaga 2280
atgcaagatg gatttctgga tgtttggaca tacaatgctg aactgttggt tcttcttgaa 2340
aacgaaagaa cactagacat gcatgacgca aatgtgaaga acctacatga aaaggtcaaa 2400
tcacaactaa gggacaatgc tacgatctta gggaatggtt gctttgaatt ttggcataag 2460
tgtgacaatg aatgcataga gtctgtcaaa aatggtacat atgactatcc caaataccag 2520
actgaaagca aattaaacag gctaaaaata gaatcagtaa agctagagaa ccttggtgtg 2580
tatcaaattc ttgccattta tagtacggta tcgagcagcc tagtgttggt agggctgatc 2640
atggcaatgg gtctttggat gtgttcaaat ggttcaatgc agtgcaggat atgtatataa 2700
gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt tattgttaat 2760
tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat ttgtatgaga 2820
tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat gtttcctcca 2880
taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa caactaaaat 2940
tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata tggtcaagtt 3000
caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa cttaacgtta 3060
ttaactacta attttatatc atcccctttg ataaatgata gtaca 3105
<210>68
<211>3087
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>68
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tggaaacaat atcactaata 1020
actatactac tagtagtaac agcaagcaat gcagataaaa tctgcatcgg ccaccagtca 1080
acaaactcca cagaaactgt ggacacgcta acagaaacca atgttcctgt gacacatgcc 1140
aaagaattgc tccacacaga gcataatgga atgctgtgtg caacaagcct gggacatccc 1200
ctcattctag acacatgcac tattgaagga ctagtctatg gcaacccttc ttgtgacctg 1260
ctgttgggag gaagagaatg gtcctacatc gtcgaaagat catcagctgt aaatggaacg 1320
tgttaccctg ggaatgtaga aaacctagag gaactcagga cactttttag ttccgctagt 1380
tcctaccaaa gaatccaaat cttcccagac acaacctgga atgtgactta cactggaaca 1440
agcagagcat gttcaggttc attctacagg agtatgagat ggctgactca aaagagcggt 1500
ttttaccctg ttcaagacgc ccaatacaca aataacaggg gaaagagcat tcttttcgtg 1560
tggggcatac atcacccacc cacctatacc gagcaaacaa atttgtacat aagaaacgac 1620
acaacaacaa gcgtgacaac agaagatttg aataggacct tcaaaccagt gatagggcca 1680
aggccccttg tcaatggtct gcagggaaga attgattatt attggtcggt actaaaacca 1740
ggccaaacat tgcgagtacg atccaatggg aatctaattg ctccatggta tggacacgtt 1800
ctttcaggag ggagccatgg aagaatcctg aagactgatt taaaaggtgg taattgtgta 1860
gtgcaatgtc agactgaaaa aggtggctta aacagtacat tgccattcca caatatcagt 1920
aaatatgcat ttggaacctg ccccaaatat gtaagagtta atagtctcaa actggcagtc 1980
ggtctgagga acgtgcctgc tagatcaagt agaggactat ttggagccat agctggattc 2040
atagaaggag gttggccagg actagtcgct ggctggtatg gtttccagca ttcaaatgat 2100
caaggggttg gtatggctgc agatagggat tcaactcaaa aggcaattga taaaataaca 2160
tccaaggtga ataatatagt cgacaagatg aacaagcaat atgaaataat tgatcatgaa 2220
tttagtgagg ttgaaactag actcaatatg atcaataata agattgatga ccaaatacaa 2280
gacgtatggg catataatgc agaattgcta gtactacttg aaaatcaaaa aacactcgat 2340
gagcatgatg cgaacgtgaa caatctatat aacaaggtga agagggcact gggctccaat 2400
gctatggaag atgggaaagg ctgtttcgag ctataccata aatgtgatga tcagtgcatg 2460
gaaacaattc ggaacgggac ctataatagg agaaagtata gagaggaatc aagactagaa 2520
aggcagaaaa tagagggggt taagctggaa tctgagggaa cttacaaaat cctcaccatt 2580
tattcgactg tcgcctcatc tcttgtgctt gcaatggggt ttgctgcctt cctgttctgg 2640
gccatgtcca atggatcttg cagatgcaac atttgtatat aagagctcta agttaaaatg 2700
cttcttcgtc tcctatttat aatatggttt gttattgtta attttgttct tgtagaagag 2760
cttaattaat cgttgttgtt atgaaatact atttgtatga gatgaactgg tgtaatgtaa 2820
ttcatttaca taagtggagt cagaatcaga atgtttcctc cataactaac tagacatgaa 2880
gacctgccgc gtacaattgt cttatatttg aacaactaaa attgaacatc ttttgccaca 2940
actttataag tggttaatat agctcaaata tatggtcaag ttcaatagat taataatgga 3000
aatatcagtt atcgaaattc attaacaatc aacttaacgt tattaactac taattttata 3060
tcatcccctt tgataaatga tagtaca 3087
<210>69
<211>3105
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>69
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tgaagactat cattgctttg 1020
agctacattc tatgtctggt tttcactcaa aaacttcccg gaaatgacaa cagcacggca 1080
acgctgtgcc ttgggcacca tgcagtacca aacggaacga tagtgaaaac aatcacgaat 1140
gaccaaattg aagttactaa tgctactgag ctggttcaga gttcctcaac aggtgaaata 1200
tgcgacagtc ctcatcagat ccttgatgga gaaaactgca cactaataga tgctctattg 1260
ggagaccctc agtgtgatgg cttccaaaat aagaaatggg acctttttgt tgaacgcagc 1320
aaagcctaca gcaactgtta cccttatgat gtgccggatt atgcctccct taggtcacta 1380
gttgcctcat ccggcacact ggagtttaac aatgaaagtt tcaattggac tggagtcact 1440
caaaacggaa caagctctgc ttgcataagg agatctaata acagtttctt tagtagattg 1500
aattggttga cccacttaaa attcaaatac ccagcattga acgtgactat gccaaacaat 1560
gaaaaatttg acaaattgta catttggggg gttcaccacc cgggtacgga caatgaccaa 1620
atcttcctgt atgctcaagc atcaggaaga atcacagtct ctaccaaaag aagccaacaa 1680
actgtaatcc cgaatatcgg atctagaccc agagtaagga atatccccag cagaataagc 1740
atctattgga caatagtaaa accgggagac atacttttga ttaacagcac agggaatcta 1800
attgctccta ggggttactt caaaatacga agtgggaaaa gctcaataat gagatcagat 1860
gcacccattg gcaaatgcaa ttctgaatgc atcactccaa acggaagcat tcccaatgac 1920
aaaccattcc aaaatgtaaa caggatcaca tacggggcct gtcccagata tgttaagcaa 1980
aacactctga aattggcaac agggatgcga aatgtaccag agaaacaaac tagaggcata 2040
tttggcgcaa tcgcgggttt catagaaaat ggttgggagg gaatggtgga tggttggtat 2100
ggtttcaggc atcaaaattc tgagggaata ggacaagcag cagatctcaa aagcactcaa 2160
gcagcaatcg atcaaatcaa tgggaagctg aataggttga tcgggaaaac caacgagaaa 2220
ttccatcaga ttgaaaaaga gttctcagaa gtcgaaggga gaatccagga ccttgagaaa 2280
tatgttgagg acaccaaaat agatctctgg tcatacaacg cggagcttct tgttgccctg 2340
gagaaccaac atacaattga tctaactgac tcagaaatga acaaactgtt tgaaaaaaca 2400
aagaagcaac tgagggaaaa tgctgaggat atgggcaatg gttgtttcaa aatataccac 2460
aaatgtgaca atgcctgcat aggatcaatc agaaatggaa cttatgacca cgatgtatac 2520
agagatgaag cattaaacaa ccggttccag atcaagggcg ttgagctgaa gtcaggatac 2580
aaagattgga tactatggat ttcctttgcc atatcatgtt ttttgctttg tgttgctttg 2640
ttggggttca tcatgtgggc ctgccaaaaa ggcaacatta ggtgcaacat ttgcatttga 2700
gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt tattgttaat 2760
tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat ttgtatgaga 2820
tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat gtttcctcca 2880
taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa caactaaaat 2940
tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata tggtcaagtt 3000
caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa cttaacgtta 3060
ttaactacta attttatatc atcccctttg ataaatgata gtaca 3105
<210>70
<211>3105
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>70
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tgaagactat cattgctttg 1020
agctacattc tatgtctggt tttcactcaa aaacttcccg gaaatgacaa cagcacggca 1080
acgctgtgcc ttgggcacca tgcagtacca aacggaacga tagtgaaaac aatcacgaat 1140
gaccaaattg aagttactaa tgctactgag ctggttcaga gttcctcaac aggtggaata 1200
tgcgacagtc ctcatcagat ccttgatgga gaaaactgca cactaataga tgctctattg 1260
ggagaccctc agtgtgatgg cttccaaaat aagaaatggg acctttttgt tgaacgcagc 1320
aaagcctaca gcaactgtta cccttatgat gtgccggatt atgcctccct taggtcacta 1380
gttgcctcat ccggcacact ggagtttaac gatgaaagtt tcaattggac tggagtcact 1440
caaaatggaa caagctctgc ttgcaaaagg agatctaata acagtttctt tagtagattg 1500
aattggttga cccacttaaa attcaaatac ccagcattga acgtgactat gccaaacaat 1560
gaaaaatttg acaaattgta catttggggg gttcaccacc cgggtacgga caatgaccaa 1620
atcttcctgc atgctcaagc atcaggaaga atcacagtct ctaccaaaag aagccaacaa 1680
actgtaatcc cgaatatcgg atctagaccc agaataagga atatccccag cagaataagc 1740
atctattgga caatagtaaa accgggagac atacttttga ttaacagcac agggaatcta 1800
attgctccta ggggttactt caaaatacga agtgggaaaa gctcaataat gagatcagat 1860
gcacccattg gcaaatgcaa ttctgaatgc atcactccaa atggaagcat tcccaatgac 1920
aaaccatttc aaaatgtaaa caggatcaca tatggggcct gtcccagata tgttaagcaa 1980
aacactctga aattggcaac agggatgcga aatgtaccag agaaacaaac tagaggcata 2040
tttggcgcaa tcgcgggttt catagaaaat ggttgggagg gaatggtgga tggttggtac 2100
ggtttcaggc atcaaaattc tgagggaata ggacaagcag cagatctcaa aagcactcaa 2160
gcagcaatca atcaaatcaa tgggaagctg aataggttga tcgggaaaac caacgagaaa 2220
ttccatcaga ttgaaaaaga gttctcagaa gtagaaggga gaatccagga cctcgagaaa 2280
tatgttgagg acactaaaat agatctctgg tcatacaacg cggagcttct tgttgccctg 2340
gagaaccaac atacaattga tctaactgac tcagaaatga acaaactgtt tgaaagaaca 2400
aagaagcaac tgagggaaaa tgctgaggat atgggcaatg gttgtttcaa aatataccac 2460
aaatgtgaca atgcctgcat aggatcaatc agaaatggaa cttatgacca tgatgtatac 2520
agagatgaag cattaaacaa ccggttccag atcaaaggcg ttgagctgaa gtcaggatac 2580
aaagattgga tactatggat ttcctttgcc atatcatgtt ttttgctttg tgttgctttg 2640
ttggggttca tcatgtgggc ctgccaaaaa ggcaacatta ggtgcaacat ttgcatttga 2700
gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt tattgttaat 2760
tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat ttgtatgaga 2820
tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat gtttcctcca 2880
taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa caactaaaat 2940
tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata tggtcaagtt 3000
caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa cttaacgtta 3060
ttaactacta attttatatc atcccctttg ataaatgata gtaca 3105
<210>71
<211>3117
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>71
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tgaacactca aattctaata 1020
ttagccactt cggcattctt ctatgtacgt gcagataaaa tctgcctagg acatcatgct 1080
gtgtctaatg gaaccaaagt agacaccctt actgaaaaag gaatagaagt tgtcaatgca 1140
acagaaacag ttgaacaaac aaacatccct aagatctgct caaaaggaaa acagactgtt 1200
gaccttggtc aatgtggatt actagggacc gttattggtc ctccccaatg tgaccaattt 1260
cttgagttct ctgctaattt aatagttgaa agaagggaag gtaatgacat ttgttatcca 1320
ggcaaatttg acaatgaaga aacattgaga aaaatactca gaaaatccgg aggaattaaa 1380
aaggagaata tgggattcac atataccgga gtgagaacca atggagagac tagcgcatgt 1440
agaaggtcaa gatcttcctt ttatgcagag atgaaatggc ttctatccag cacagacaat 1500
gggacatttc cacaaatgac aaagtcctac aagaacacta agaaggtacc agctctgata 1560
atctggggaa tccaccactc aggatcaact actgaacaga ctagattata tggaagtggg 1620
aataaattga taacagtttg gagttccaaa taccaacaat cttttgtccc aaatcctgga 1680
ccaagaccgc aaatgaatgg tcaatcagga agaattgact ttcactggct gatgctagat 1740
cccaatgata ctgtcacttt cagttttaat ggggccttta tagcacctga ccgcgccagt 1800
tttctaagag gtaaatctct aggaatccaa agtgatgcac aacttgacaa taattgtgaa 1860
ggtgaatgct atcatattgg aggtactata attagcaact tgccctttca aaacattaat 1920
agtagggcaa tcggaaaatg ccccagatac gtgaagcaga agagcttaat gctagcaaca 1980
ggaatgaaaa atgttcctga agctcctgca cataaacaac taactcatca catgcgcaaa 2040
aaaagaggtt tatttggtgc aatagcagga ttcattgaaa atgggtggga aggattaata 2100
gacggatggt atggatataa gcatcagaat gcacaaggag aagggactgc tgcagactac 2160
aaaagtacac aatctgctat caaccaaata accggaaaat tgaacagact aatagaaaaa 2220
accaaccagc aattcgaact aatagataat gagttcaatg aaatagaaaa acaaattggc 2280
aatgttatta actggactag agattctatc atcgaagtat ggtcatataa tgcagagttc 2340
ctcgtagcag tggagaatca acacactatt gatttaactg actcagaaat gaacaaacta 2400
tatgaaaagg taagaagaca actgagagaa aatgctgagg aagatggtaa tggctgtttt 2460
gaaatattcc accaatgtga caatgattgc atggccagca ttagaaacaa cacatatgac 2520
cataaaaaat acagaaaaga ggcaatacaa aacagaatcc agattgacgc agtaaagttg 2580
agcagtggtt acaaagatat aatactttgg tttagcttcg gggcatcatg tttcttattt 2640
cttgccattg caatgggtct tgttttcata tgtataaaaa atggaaacat gcggtgcact 2700
atttgtatat aagagctcta agttaaaatg cttcttcgtc tcctatttat aatatggttt 2760
gttattgtta attttgttct tgtagaagag cttaattaat cgttgttgtt atgaaatact 2820
atttgtatga gatgaactgg tgtaatgtaa ttcatttaca taagtggagt cagaatcaga 2880
atgtttcctc cataactaac tagacatgaa gacctgccgc gtacaattgt cttatatttg 2940
aacaactaaa attgaacatc ttttgccaca actttataag tggttaatat agctcaaata 3000
tatggtcaag ttcaatagat taataatgga aatatcagtt atcgaaattc attaacaatc 3060
aacttaacgt tattaactac taattttata tcatcccctt tgataaatga tagtaca 3117
<210>72
<211>3162
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>72
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tgaaggcaat aattgtacta 1020
ctcatggtag taacatccaa tgcagatcga atctgcactg ggataacatc gtcaaactca 1080
ccacatgttg tcaaaactgc tactcaaggg gaggtcaatg tgactggtgt aataccactg 1140
acaacaacac ccaccaaatc tcattttgca aatctcaaag gaacagaaac cagagggaaa 1200
ctatgcccaa aatgcctcaa ctgcacagat ctggacgtgg ccttgggcag accaaaatgc 1260
acggggaaca taccctcggc aagagtttca atactccatg aagtcagacc tgttacatct 1320
gggtgctttc ctataatgca cgacagaaca aaaattagac agctgcctaa acttctcaga 1380
ggatacgaac atatcaggtt atcaactcat aacgttatca atgcagaaaa tgcaccagga 1440
ggaccctaca aaattggaac ctcagggtct tgccctaacg ttaccaatgg aaacggattt 1500
ttcgcaacaa tggcttgggc cgtcccaaaa aacgacaaca acaaaacagc aacaaattca 1560
ttaacaatag aagtaccata catttgtaca gaaggagaag accaaattac cgtttggggg 1620
ttccactctg ataacgaaac ccaaatggca aagctctatg gggactcaaa gccccagaag 1680
ttcacctcat ctgccaacgg agtgaccaca cattacgttt cacagattgg tggcttccca 1740
aatcaaacag aagacggagg actaccacaa agcggtagaa ttgttgttga ttacatggtg 1800
caaaaatctg ggaaaacagg aacaattacc tatcaaagag gtattttatt gcctcaaaaa 1860
gtgtggtgcg caagtggcag gagcaaggta ataaaaggat cgttgccttt aattggagaa 1920
gcagattgcc tccacgaaaa atacggtgga ttaaacaaaa gcaagcctta ctacacaggg 1980
gaacatgcaa aggccatagg aaattgccca atatgggtga aaacaccctt gaagctggcc 2040
aatggaacca aatatagacc tcctgcaaaa ctattaaagg aaaggggttt cttcggagct 2100
attgctggtt tcttagaagg aggatgggaa ggaatgattg caggttggca cggatacaca 2160
tcccatgggg cacatggagt agcggtggca gcagacctta agagcactca agaggccata 2220
aacaagataa caaaaaatct caactctttg agtgagctgg aagtaaagaa tcttcaaaga 2280
ctaagcggtg ccatggatga actccacaac gaaatactag aactagacga gaaagtggat 2340
gatctcagag ctgatacaat aagctcacaa atagaactcg cagtcctgct ttccaatgaa 2400
ggaataataa acagtgaaga tgagcatctc ttggcgcttg aaagaaagct gaagaaaatg 2460
ctgggcccct ctgctgtaga gatagggaat ggatgctttg aaaccaaaca caagtgcaac 2520
cagacctgtc tcgacagaat agctgctggt acctttgatg caggagaatt ttctctcccc 2580
acttttgatt cactgaatat tactgctgca tctttaaatg acgatggatt ggataatcat 2640
actatactgc tttactactc aactgctgcc tccagtttgg ctgtaacatt gatgatagct 2700
atctttgttg tttatatggt ctccagagac aatgtttctt gctccatctg tctataagag 2760
ctctaagtta aaatgcttct tcgtctccta tttataatat ggtttgttat tgttaatttt 2820
gttcttgtag aagagcttaa ttaatcgttg ttgttatgaa atactatttg tatgagatga 2880
actggtgtaa tgtaattcat ttacataagt ggagtcagaa tcagaatgtt tcctccataa 2940
ctaactagac atgaagacct gccgcgtaca attgtcttat atttgaacaa ctaaaattga 3000
acatcttttg ccacaacttt ataagtggtt aatatagctc aaatatatgg tcaagttcaa 3060
tagattaata atggaaatat cagttatcga aattcattaa caatcaactt aacgttatta 3120
actactaatt ttatatcatc ccctttgata aatgatagta ca 3162
<210>73
<211>3159
<212>DNA
<213>人工序列
<220>
<223>表达盒
<400>73
agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60
taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120
atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180
tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240
aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300
gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360
aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420
taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480
aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540
aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600
atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660
ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720
cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780
aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840
atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900
ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960
agaagagact aattaattaa ttaatcatct tgagagaaaa tgaaggcaat aattgtacta 1020
ctcatggtag taacatccaa tgcagatcga atctgcactg gaataacatc ttcaaactca 1080
cctcatgtgg tcaaaacagc cactcaaggg gaggtcaatg tgactggtgt gataccacta 1140
acaacaacac caacaaaatc ttattttgca aatctcaaag gaacaaggac cagagggaaa 1200
ctatgcccag actgtctcaa ctgcacagat ctggatgtgg ctttgggcag accaatgtgt 1260
gtggggacca caccttcggc gaaggcttca atactccacg aagtcaaacc tgttacatcc 1320
gggtgctttc ctataatgca cgacagaaca aaaatcaggc aactacccaa tcttctcaga 1380
ggatatgaaa atatcaggct atcaacccaa aacgtcatcg atgcggaaaa ggcaccagga 1440
ggaccctaca gacttggaac ctcaggatct tgccctaacg ctaccagtaa gagcggattt 1500
ttcgcaacaa tggcttgggc tgtcccaaag gacaacaaca aaaatgcaac gaacccacta 1560
acagtagaag taccatacat ttgtacagaa ggggaagacc aaatcactgt ttgggggttc 1620
cattcagata acaaaaccca aatgaagaac ctctatggag actcaaatcc tcaaaagttc 1680
acctcatctg ctaatggagt aaccacacac tatgtttctc agattggcag cttcccagat 1740
caaacagaag acggaggact accacaaagc ggcaggattg ttgttgatta catgatgcaa 1800
aaacctggga aaacaggaac aattgtctac caaagaggtg ttttgttgcc tcaaaaggtg 1860
tggtgcgcga gtggcaggag caaagtaata aaagggtcct tgcctttaat tggtgaagca 1920
gattgccttc atgaaaaata cggtggatta aacaaaagca agccttacta cacaggagaa 1980
catgcaaaag ccataggaaa ttgcccaata tgggtgaaaa cacctttgaa gctcgccaat 2040
ggaaccaaat atagacctcc tgcaaaacta ttaaaggaaa ggggtttctt cggagctatt 2100
gctggtttcc tagaaggagg atgggaagga atgattgcag gctggcacgg atacacatct 2160
cacggagcac atggagtggc agtggcggcg gaccttaaga gtacgcaaga agctataaac 2220
aagataacaa aaaatctcaa ttctttgagt gagctagaag taaagaatct tcaaagacta 2280
agtggtgcca tggatgaact ccacaacgaa atactcgagc tggatgagaa agtggatgat 2340
ctcagagctg acactataag ctcgcaaata gaacttgcag tcttgctttc caacgaagga 2400
ataataaaca gtgaagatga gcatctattg gcacttgaga gaaaactaaa gaaaatgctg 2460
ggtccctctg ctgtagagat aggaaatgga tgcttcgaaa ccaaacacaa gtgcaaccag 2520
acctgcttag acaggatagc tgctggcacc tttaatgcag gagaattttc tctccccact 2580
tttgattcac tgaacattac tgctgcatct ttaaatgatg atggattgga taaccatact 2640
atactgctct attactcaac tgctgcttct agtttggctg taacattgat gctagctatt 2700
tttattgttt atatggtctc cagagacaac gtttcatgct ccatctgtct ataagagctc 2760
taagttaaaa tgcttcttcg tctcctattt ataatatggt ttgttattgt taattttgtt 2820
cttgtagaag agcttaatta atcgttgttg ttatgaaata ctatttgtat gagatgaact 2880
ggtgtaatgt aattcattta cataagtgga gtcagaatca gaatgtttcc tccataacta 2940
actagacatg aagacctgcc gcgtacaatt gtcttatatt tgaacaacta aaattgaaca 3000
tcttttgcca caactttata agtggttaat atagctcaaa tatatggtca agttcaatag 3060
attaataatg gaaatatcag ttatcgaaat tcattaacaa tcaacttaac gttattaact 3120
actaatttta tatcatcccc tttgataaat gatagtaca 3159
<210>74
<211>565
<212>PRT
<213>人工序列
<220>
<223>共有序列
<220>
<221>misc_feature
<222>(3)..(3)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(52)..(52)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(90)..(90)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(99)..(99)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(111)..(111)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(145)..(145)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(157)..(157)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(162)..(162)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(182)..(182)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(203)..(203)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(205)..(205)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(210)..(210)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(225)..(225)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(268)..(268)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(283)..(283)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(290)..(290)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(432)..(432)
<223>X氨基酸可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(489)..(489)
<223>X氨基酸可以是任意天然氨基酸
<400>74
Met Lys Xaa Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr
1 5 10 15
Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr
20 25 30
Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn
35 40 45
Leu Leu Glu Xaa Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile
50 55 60
Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly
65 70 75 80
Asn Pro Glu Cys Glu Leu Leu Ile Ser Xaa Glu Ser Trp Ser Tyr Ile
85 90 95
Val Glu Xaa Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Xaa Phe
100 105 110
Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe
115 120 125
Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr
130 135 140
Xaa Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Xaa Ser Ser Phe
145 150 155 160
Tyr Xaa Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn
165 170 175
Leu Ser Lys Ser Tyr Xaa Asn Asn Lys Glu Lys Glu Val Leu Val Leu
180 185 190
Trp Gly Val His His Pro Pro Asn Ile Gly Xaa Gln Xaa Ala Leu Tyr
195 200 205
His Xaa Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg
210 215 220
Xaa Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu
225 230 235 240
Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile
245 250 255
Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Xaa Tyr Ala Phe Ala
260 265 270
Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Xaa Ser Asn Ala Pro Met
275 280 285
Asp Xaa Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser
290 295 300
Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro
305 310 315 320
Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn
325 330 335
Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
340 345 350
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His
355 360 365
His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr
370 375 380
Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu
385 390 395 400
Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu
405 410 415
Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Xaa
420 425 430
Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu
435 440 445
Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys
450 455 460
Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys
465 470 475 480
Phe Glu Phe Tyr His Lys Cys Asn Xaa Glu Cys Met Glu Ser Val Lys
485 490 495
Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn
500 505 510
Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln
515 520 525
Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val
530 535 540
Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln
545 550 555 560
Cys Arg Ile Cys Ile
565
<210>75
<211>565
<212>PRT
<213>流感病毒
<400>75
Met Lys Ala Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr
1 5 10 15
Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr
20 25 30
Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn
35 40 45
Leu Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile
50 55 60
Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly
65 70 75 80
Asn Pro Glu Cys Glu Leu Leu Ile Ser Lys Glu Ser Trp Ser Tyr Ile
85 90 95
Val Glu Thr Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Tyr Phe
100 105 110
Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe
115 120 125
Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr
130 135 140
Val Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Lys Ser Ser Phe
145 150 155 160
Tyr Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn
165 170 175
Leu Ser Lys Ser Tyr Val Asn Asn Lys Glu Lys Glu Val Leu Val Leu
180 185 190
Trp Gly Val His His Pro Pro Asn Ile Gly Asn Gln Arg Ala Leu Tyr
195 200 205
His Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg
210 215 220
Arg Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu
225 230 235 240
Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile
245 250 255
Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Trp Tyr Ala Phe Ala
260 265 270
Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Thr Ser Asn Ala Pro Met
275 280 285
Asp Glu Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser
290 295 300
Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro
305 310 315 320
Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn
325 330 335
Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe
340 345 350
Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His
355 360 365
His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr
370 375 380
Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu
385 390 395 400
Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu
405 410 415
Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu
420 425 430
Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu
435 440 445
Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys
450 455 460
Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys
465 470 475 480
Phe Glu Phe Tyr His Lys Cys Asn Asn Glu Cys Met Glu Ser Val Lys
485 490 495
Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn
500 505 510
Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln
515 520 525
Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val
530 535 540
Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln
545 550 555 560
Cys Arg Ile Cys Ile
565
<210>76
<211>252
<212>PRT
<213>流感病毒
<400>76
Met Ser Leu Leu Thr Glu Val Glu Thr Tyr Val Leu Ser Ile Ile Pro
1 5 10 15
ser Gly Pro Leu Lys Ala Glu Ile Ala Gln Arg Leu Glu Asp Val Phe
20 25 30
Ala Gly Lys Asn Thr Asp Leu Glu Val Leu Met Glu Trp Leu Lys Thr
35 40 45
Arg Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe
50 55 60
Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Gln Arg Arg Arg Phe Val
65 70 75 80
Gln Asn Ala Leu Asn Gly Asn Gly Asp Pro Asn Asn Met Asp Lys Ala
85 90 95
Val Lys Leu Tyr Arg Lys Leu Lys Arg Glu Ile Thr Phe His Gly Ala
100 105 110
Lys Glu Ile Ser Leu Ser Tyr Ser Ala Gly Ala Leu Ala Ser Cys Met
115 120 125
Gly Leu Ile Tyr Asn Arg Met Gly Ala Val Thr Thr Glu Val Ala Phe
130 135 140
Gly Leu Val Cys Ala Thr Cys Glu Gln Ile Ala Asp Ser Gln His Arg
145 150 155 160
Ser His Arg Gln Met Val Thr Thr Thr Asn Pro Leu Ile Arg His Glu
165 170 175
Asn Arg Met Val Leu Ala Ser Thr Thr Ala Lys Ala Met Glu Gln Met
180 185 190
Ala Gly Ser Ser Glu Gln Ala Ala Glu Ala Met Glu Val Ala Ser Gln
195 200 205
Ala Arg Gln Met Val Gln Ala Met Arg Thr Ile Gly Thr His Pro Ser
210 215 220
Ser Ser Ala Gly Leu Lys Asn Asp Leu Leu Glu Asn Leu Gln Ala Tyr
225 230 235 240
Gln Lys Arg Met Gly Val Gln Met Gln Arg Phe Lys
245 250
机译: 包含植物内产生的血凝素的流感病毒样颗粒(VLPS)
机译: 包含植物内产生的血凝素的流感病毒样颗粒(vlps)
机译: 包含植物内产生的血凝素的流感病毒样颗粒(vlps)