首页> 中国专利> 来源于酵母的新型细胞壁锚定蛋白及其基因和使用其的细胞表面表达系统

来源于酵母的新型细胞壁锚定蛋白及其基因和使用其的细胞表面表达系统

摘要

本发明提供了衍生自酵母的新的细胞壁锚定蛋白,其基因以及使用其粘连多肽到酵母细胞壁的遗传方法。尤其是,本发明提供了新型的GPI(糖基磷脂酰肌醇)-锚定蛋白基因,SED1,GAS1,TIP1,和CWP1,及其蛋白质,PIR2细胞壁蛋白基因及其蛋白质,其衍生于多形汉逊酵母,以及使用它们将外源的酶或者多肽固定到微生物细胞的细胞壁的细胞表面表达系统。此外,本发明提供了细胞表面表达系统,其使用衍生自包括多形汉逊酵母和酿酒酵母的酵母WSC1基因及其蛋白,和衍生自Saccharomyces diastaticus的STA1基因及其蛋白。本发明的细胞表面表达系统可以通过粘连所需的蛋白到该细胞表面起到生物催化剂的固定作用,并且提供一种通过文库筛选改变靶蛋白特征如结合亲和性和稳定性的手段。

著录项

  • 公开/公告号CN1454258A

    专利类型发明专利

  • 公开/公告日2003-11-05

    原文格式PDF

  • 申请/专利权人 韩国生命工学研究院;

    申请/专利号CN00819780.6

  • 发明设计人 崔毅星;孙廷薰;金素影;

    申请日2000-07-27

  • 分类号C12N15/52;

  • 代理机构11021 中科专利商标代理有限责任公司;

  • 代理人程金山

  • 地址 韩国大田广域市

  • 入库时间 2023-12-17 15:01:15

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-09-18

    未缴年费专利权终止 IPC(主分类):C12N15/52 授权公告日:20080130 终止日期:20120727 申请日:20000727

    专利权的终止

  • 2008-01-30

    授权

    授权

  • 2004-01-14

    实质审查的生效

    实质审查的生效

  • 2003-11-05

    公开

    公开

说明书

                       发明领域

本发明涉及来源于酵母的新型细胞壁锚定蛋白及其基因和使用其的表面表达系统。更具体地说,本发明涉及使用四种来源于多形汉逊酵母(Hansenula polymorpha)的GPI(糖基磷脂酰肌醇)-锚定蛋白,HpSed1p,HpGas1p,HpTip1p和HpCwp1p,及来源于多形汉逊酵母的细胞壁蛋白HpPir2p在多形汉逊酵母和其他酵母的细胞表面表达外源蛋白的表面表达系统。另外,本发明涉及使用来源于多形汉逊酵母的HpWSC1和来源于Saccharomyces diastaticus的STA1编码的蛋白在多形汉逊酵母和其他酵母的细胞壁表面表达外源蛋白的表面表达系统。

                   发明的背景技术

由于在细胞表面表达蛋白具有多种用途,如包括生产新型疫苗、筛选各种抗原和抗体、在细胞表面固定化有用的酶类等。因此,近年来,对在单细胞生物,如噬菌体、细菌和酵母表面表达期望得到的蛋白进行了活跃的研究。

首先,在细胞表面表达外源蛋白应用于筛选抗原决定簇和抗原性决定多肽片段,并以疫苗的稳定生产为目的。在此之前,是通过从随机突变病原体库中筛选具有稳定连续滴度的突变体来生产疫苗的。但是以这种传统方式生产的疫苗在对人或动物口腔途径给药时可能会丢失抗原性。已进行了很多努力来克服这些问题,如使用细胞表面展示的活性口腔疫苗。

在细胞表面表达抗原蛋白的策略中,内源性细胞表面蛋白是用来指导这些蛋白表达在细胞表面的。例如,将编码细胞表面蛋白的基因与编码抗原蛋白的基因融合,然后将得到的重组基因导入革兰氏阴性细菌中,从而在细胞表面表达融合蛋白。这种以融合蛋白作为介体的抗原蛋白可作为有效抗原引发免疫反应。特别是由于存在于革兰氏阴性细菌细胞膜上的脂多糖(LPS)可以增强这种表达在细胞表面的融合蛋白的抗原性,所以革兰氏阴性细菌非常适于实现上述目的。

通常分泌或表达在细胞表面的蛋白在其一级序列上带有分泌信号,以使新生蛋白穿过细胞质膜。为了在革兰氏阴性细菌细胞表面表达,蛋白需跨过细胞质膜和周质空间,然后插入外膜中以穿过外膜。在细菌中,有几种酶和毒素具有分泌信号和(或)指导蛋白定位的定位信号。因此,利用这些分泌信号或定位信号,并带有合适的启动子,可以成功地实现外源蛋白在细胞表面的定位。

迄今为止,已对利用革兰氏阴性细菌的表面蛋白在细胞表面表达外源蛋白进行了广泛尝试。用于外源蛋白定位的表面蛋白主要分为外膜蛋白、脂蛋白、分泌蛋白和细胞表面器官蛋白。

革兰氏阴性细菌中已知的外膜蛋白LamB,PhoE和OmpA已用于在细胞表面生产外源蛋白。当使用外膜蛋白时,由于外源蛋白必须嵌入伸出细胞表面的环中,因此外源蛋白的大小会受到限制。而且由于嵌入的外源蛋白C和N末端需要在三维结构上彼此紧邻,因此如果二末端的距离相距很大时,需用连接肽将其拉在一起。

实际上,在使用LamB或PhoE时,当嵌入的外源多肽大于等于50-60个氨基酸,则由于位阻效应很难构建成稳定的膜蛋白。(Charbit等,J.Immunol.,1997,139,1658-1664;Agterberg等,Vaccine,1990,8,85-91)。为了解决这个问题,尝试使用了正确定位所必须的最小的定位信号OmpA片段。例如,成功地在细胞表面表达了连接在OmpA C末端的β-内酰氨酶。蛋白从细胞质到外膜的转移由融合在OmpA N末端大肠杆菌脂蛋白Lpp的信号序列来完成。(Francisco等,Proc.Natl.Acad.Sci.USA,1992,489,2713-2717)。

如上所述,用细菌外膜蛋白在细胞表面展示外源蛋白需要在基因水平上将外源蛋白与合适的外膜蛋白连接起来,从而形成可穿过细胞质膜的融合蛋白,并能够稳定地插入到外膜中。合适的表面锚定基序是满足以下要求的外膜蛋白:1)具有一个分泌信号,允许融合蛋白穿过细胞质膜;2)具有一个定位信号,允许融合蛋白锚定在外膜里;3)在外膜大量表达;和4)与蛋白大小无关,可稳定表达。迄今为止,还没有找到满足以上所有要求的表面定位基序。

与此同时,脂蛋白也已用作表面定位基序。特别是来源于大肠杆菌的脂蛋白非常有用,因为它可通过N末端分泌信号穿过内膜,并通过其末端的L-半胱氨酸以共价键直接与外膜或内膜的脂类连接。来源于大肠杆菌的脂蛋白Lpp,其N末端与外膜相连,而C末端与细胞壁肽聚糖相连,因此它与外膜蛋白A融合后可用于在大肠杆菌表面分泌和转运外源蛋白。(OmpA,Francisco等,Proc.Natl.Acad.Sci.USA,1992,489,2713-2717)。另一个用于外源蛋白表面表达的脂蛋白是TraT。据报道,TraT已用于在大肠杆菌表面表达多肽,如脊髓灰质炎病毒C3抗原决定簇(Felici等,J.Mol.Biol.,1991,222,301-310)。另外,虽然与肽聚糖连接的脂蛋白(PAL)其功能还没有阐述清楚,但已用于重组抗体的表面表达(Fuchs等,Bio/Technology,1991,9,1369-1372)。在这种情况下,PAL的C末端与肽聚糖相连,而N末端与暴露在细胞表面的重组抗体融合。

能够穿过外膜的分泌蛋白也可用作表面锚定基序,但在革兰氏阴性细菌中没有得到很好的发展。只有一些蛋白在辅助蛋白的帮助下具有分泌机制。例如,Klebsiella oxytoca分泌的脂蛋白--普鲁兰酶通过脂类与其N末端连接锚定在外膜上,而且在生长稳定期完全分泌到培养基中。Komacker等试图利用普鲁兰酶N末端片段在细胞表面表达β-内酰氨酶,但表达的普鲁兰酶-β-内酰氨酶融合蛋白在短期的锚定后又释放到细胞培养基中。当使用周质空间蛋白--碱性磷酸酶作为定位蛋白时,则不能实现表面表达。因为碱性磷酸酶的分泌至少需要14个蛋白才能够实现,所以它的功能表达是很困难的。(Komacker等,Mol.Microl.,1990,4,1101-1109)。

Neisseria是一种具有一个非常有趣的分泌系统的病原微生物,来源于该菌的IgA蛋白酶C末端的β-结构域具有分泌信号,该信号指导N末端蛋白酶结构域分泌到细胞表面。该蛋白酶在锚定到外膜上后又通过自身的催化水解分泌到培养基中。12kDa的霍乱毒素B亚基已利用IgA蛋白酶的β-亚基进行了表面表达。(Klauser等,EMBO J.,1990,9,1991-1999)。但由于在转移过程中发生蛋白折叠,从而阻止了融合蛋白的分泌。

来源于革兰氏阴性细菌细胞表面器官的蛋白,如鞭毛、菌毛和纤毛蛋白,也可用作表面锚定基序。例如,鞭毛丝的亚基蛋白--鞭毛蛋白已用于进行霍乱毒素B亚基和B型肝炎病毒多肽的稳定表面表达,这些表达的蛋白可与其相应抗体进行强烈反应(Newton等,Science,1989,244,70-72)。当使用纤毛亚基蛋白--纤毛蛋白时,只能对小分子肽进行成功表达(Hedegaard等,Gene,1980,85,115-124)。

已尝试用革兰氏阳性和阴性细菌的表面蛋白作为表面锚定基序,在革兰氏阳性细菌中进行表面表达(Samuelson等,J.Bacterial.,1995,177,1470-1476)。包含80个氨基酸残基的疟疾红内期抗原和来源于Streptococcus并与白蛋白相连的蛋白G在革兰氏阳性细菌细胞表面得到有效表达,所使用的表面表达系统包括由来源于Staphylococcus aureus的蛋白A作为表面锚定基序,及来源于Staphylococcus hyicus的脂肪酶分泌信号。

由于对革兰氏阳性和阴性细菌中表面表达的广泛研究,各种表面表达系统已在美国、欧洲和日本得到发展并申请了专利。在过去的三年里,已发布了8个关于表面表达系统的专利,其中使用革兰氏阴性细菌外膜蛋白的案例有5个(WO9504069,WO9324636,WO9310214,EP603672和US5356797),使用细胞表面器官菌毛的案例有1个(WO9410330),使用细胞表面脂蛋白的案例有1个(WO9504079)。

由于大肠杆菌易培养,而且其基因结构了解得很清楚,因此它是最普遍应用于外源蛋白生产的细菌宿主。但在通常条件下,外源蛋白并不能很好地分泌到培养基中。另外,当外源蛋白过量表达时会在细胞中聚集为包含体。因此它们的纯化需要一个再折叠过程来溶解包含体,从而导致产量的重大损失。而且,由于大肠杆菌会产生对人体有害的内毒素,因此在纯化时重组蛋白有可能被毒素污染。

相比较而言,由于酵母在自身细胞内分泌系统的调控下能够很容易地将蛋白以活性形式分泌到培养基中,而且其调控方式与高等真核生物相同,因此它已被用作宿主通过基因工程技术来生产有用的外源蛋白。

自从1981年干扰素的生产后(Hitzeman等,1981,nature,293;717-722),酵母已被广泛用于生产外源蛋白。另外,不仅酵母的重组蛋白已被美国FDA批准为对人体是安全的,而且酵母中大部分基因表达的调控机制也已经了解清楚(Strathern等,酵母的分子生物学,代谢和基因表达(TheMolecular Biology of the Yeast Saccharomyces,Metabolism and GeneExpression),Cold Spring Harbor Laboratory,N.Y,1982)。因此,酵母系统具有几个重要的优势来生产外源蛋白。例如,在酵母中表达的蛋白对人体是安全的,细胞外分泌使其与在动物或人细胞中表达的蛋白一样具有高特异活性。另外,与大肠杆菌相比,在酵母中产生的蛋白其纯化过程比较简单,不需要通过再折叠过程以获得活性形式,因此产量高。特别是目前对酿酒酵母的表面表达进行了广泛研究。几年前,外源蛋白在酵母中的表面表达主要集中在以一种典型的细胞壁蛋白--α-凝集素作为表面锚定基序(Schreuder等,Yeast,1993,9,399)上。近年来,关于表面锚定基序的研究已延伸到各种细胞壁蛋白。首先,随着酿酒酵母基因组计划的完成,已广泛进行了通过保守序列分析来筛选表面锚定蛋白的研究(Hamada等,Mol.Gen.Genet.,1998,258,53)。用这些表面蛋白作为表面锚定基序,已将包括α-半乳糖苷酶、葡糖淀粉酶、脂肪酶和角质酶在内的各种酶在酿酒酵母细胞表面进行了稳定表达。另外,对各种酶进行的细胞表面表达可以发展许多有用的工业生物催化剂(Murai等,Appl.Microbiol.Biotechnol.,1999,51,65)。以α-凝集素作为锚定基序的表面表达系统已由Invitrogen公司开发并商品化。另外,酵母是一种真核微生物,通常对人体无害,已作为宿主广泛应用于生产食品或药品原料。例如,对B型肝炎病毒抗原(HbsAg)进行酵母细胞表面表达用于生产活性疫苗(Schreuder等,Vaccine,1996,14,383)。

如上所述,已在世界范围内进行细胞壁蛋白的活跃的研究,但仅限于对酿酒酵母的研究。目前,对其他酵母,如白色念珠菌(Candida albican)的研究刚刚起步。因此,迫切需要研究在产业上有用的酵母中的表面蛋白及其表面表达。由于迄今已进行研究的介导蛋白是利用糖基磷脂酰肌醇-锚进行表面锚定,因此感兴趣的蛋白必须与锚定蛋白在其羧基末端相连。然而,有些蛋白在这种条件下不能表现出完全活性,这是酵母表面表达系统的一个缺点。

                         发明概要

导致本发明的原因是本发明人关于外源蛋白细胞外转运的深入全面研究,发现衍生自一种工业上有用的甲醇-同化型酵母多形汉逊酵母的表面蛋白在构建表面表达系统和开发生物催化剂应用系统方面十分有效。本发明所建立的表面表达系统能够在细胞表面稳定地表达感兴趣的蛋白,因此在各个领域具有多种用途,包括生物催化剂的固定化和酶、抗原、抗体等蛋白的大规模生产等。

因此,本发明的一个目的是解决前述或其他的现有技术中所面临的问题,并提供将在宿主中表达的外源多肽输出到宿主的分离区的系统及其应用。

本发明的另一个目的是提供一种来源于多形汉逊酵母的新型表面锚定蛋白及其基因。

本发明的进一步目的是提供一个由完全或部分的表面蛋白作为外源多肽或蛋白表面表达的介体的表面表达系统。

本发明更进一步目的是提供从多形汉逊酵母分离的表达介体蛋白及其编码基因,该蛋白可与要在细胞表面表达的蛋白的氨基末端融合。

本发明的再一个目的是提供一个表面表达系统,该系统使用的是可与要表达的蛋白的氨基末端融合的完全或部分表达介体蛋白。

本发明的再一个目的是提供一个表面表达系统,该系统使用的是已知的来源于Saccharomyces diastaticus和多形汉逊酵母的完全或部分的表面蛋白。

根据本发明的一个方面,提供了分离的DNA序列,包括SEQ.ID.NO:1所代表的碱基序列HpSED1,SEQ.ID.NO:4所代表的碱基序列HpRIR2,SEQ.ID.NO:5所代表的碱基序列HpGAS1,SEQ.ID.NO:6所代表的碱基序列HpTIP1,及SEQ.ID.NO:7所代表的碱基序列HpCWP1,它们都编码多形汉逊酵母的细胞壁蛋白,及其DNA同系物(homologues)。

根据本发明的另一个方面,提供了新型的具有重组载体的大肠杆菌菌株,这些载体包含碱基序列HpSED1的4kb EcoRI片段,碱基序列HpPIR2的5.5kb SalI片段,碱基序列HpGAS1的3kb PstI片段,碱基序列HpTIP1的3.5kb XbaI片段及碱基序列HpCWP1的6kb SalI片段。

根据本发明的进一步的方面,提供了表面表达系统,其中用来源于Saccharomyces diastaticus的碱基序列HpSED1,HpPIR2,HpGAS1,HpTIP1,HpCWP1,STA1,来源于多形汉逊酵母的碱基序列HpWSC1和来源于酿酒酵母的碱基序列WSC1或它们的部分片段来表达介体蛋白,其将外源蛋白定位在细胞表面。此处,对本发明有用的是真核细胞,可从酵母属种及霉菌属种中选择,酵母包括念珠菌属种,杀德氏酵母属种(Debaryomycesspp.),汉逊酵母属种,克鲁维酵母菌属种,毕赤氏酵母属种(Pichia spp.),裂殖酵母属种,Yarrowia spp.,Saccharomyces spp.;霉菌包括曲霉属种,青霉属种,和根霉属种(Rhizopus spp.)。

                     附图的简要描述

本发明以上及其他目的、特征和其他优点将会通过以下结合附图的详细描述而更被清楚地理解,其中:

图1所示的是Southern blot分析结果的照片,用BamHI(泳道3),EcoRI(泳道4),PstI(泳道5),XbaI(泳道6)处理的多形汉逊酵母得到的各DNA片段和酿酒酵母基因组的EcoRI酶切片段(泳道1)和分子量标准(泳道2),在该各DNA片段与探针SED1基因杂交后的结果。

图2a所示的是Southern blot分析的照片,多形汉逊酵母基因组被ClaI(泳道1),EcoRI(泳道2),HindIII(泳道3),SalI(泳道4),XhoI(泳道6)处理后得到的DNA片段,以及分子量标准(泳道6)和酿酒酵母基因组的EcoRI酶切片段(泳道7)与探针CWP2基因杂交后的结果。

图2b所示的是Southern blot分析的照片,多形汉逊酵母基因组被以下各种酶处理,得到的DNA片段与探针TIR1基因杂交的结果如下:BamHI(泳道1),ClaI(泳道2),EcoRI(泳道3),HindIII(泳道4),PstI(泳道5),XbaI(泳道6),XhoI(泳道7),泳道8为分子量标准,和酿酒酵母基因组的EcoRI酶切片段。

图3所示的是Southern blot分析的照片,多形汉逊酵母基因组被各种酶处理后,得到的DNA片段与探针GAS1基因杂交的结果如下:ClaI(泳道1),HindIII(泳道2),SalI(泳道3),XhoI(泳道4),BamHI(泳道7),EcoRI(泳道8),PstI(泳道9),和XbaI(泳道10),泳道5和6为分子量标准。

图4所示的是Southern blot分析的照片,多形汉逊酵母基因组被各种酶处理后,得到的DNA片段与探针TIP1基因杂交的结果如下:BamHI(泳道1),EcoRI(泳道2),ClaI(泳道3),PstI(泳道4),XbaI(泳道5),XhoI(泳道6),EcoRI(泳道9),XbaI(泳道10),XhoI(泳道11),泳道7和12为分子量标准,泳道8为酿酒酵母基因组的EcoRI酶切片段。

图5所示的是Southern blot分析的照片,多形汉逊酵母基因组被各种酶处理后,得到的DNA片段与探针CWP1基因杂交的结果如下:ClaI(泳道1),HindIII(泳道2),PstI(泳道3),SalI(泳道4),和XhoI(泳道5)。

图6所示的是在多形汉逊酵母细胞表面表达CMCase的表面表达载体示意图,包括GAPDH启动子(pGAPDH),杀伤毒素的信号序列(KTsig)及带有终止密码子的CMCase基因(Term)。

图7所示的柱状图是根据表面表达介体在多形汉逊酵母细胞表面检测到的CMCase活性。

图8所示的图表是在具有表面表达介体的多形汉逊酵母菌株细胞表面检测到的CMCase活性,并对培养时间作图。

图9所示的是在多形汉逊酵母细胞表面表达HpPir2p蛋白的表面表达载体示意图,包括GAPDH启动子(pGAPDH),杀伤毒素的信号序列(KTsig),带有终止密码子的CMCase基因(Term)及与杀伤毒素信号序列(KTsig)氨基末端融合的全长PIR2(Pir-N)或与CMCase基因羧基末端融合的PIR2部分片段(Pir-C)。

图10a所示的是Wsc1p蛋白的结构域及其细胞定位位点的示意图。

图10b所示的是在多形汉逊酵母细胞表面表达外源蛋白的表面表达载体示意图,其中插入的是几个截短的HpWSC1基因片段,缺失半胱氨酸基序或跨膜结构域或二者均缺失,及编码全长HpWsc1p的完整HpWSC1基因。

图11所示的照片是在使用表达介体(Tip40,GasF,CwpF和Wsc-ct)和不使用表达介体(GOD*)的多形汉逊酵母菌株中根据平板活性测定法检测的葡萄糖氧化酶活性。

图12所示的是FACS分析结果,多形汉逊酵母菌株(白色):通过使用表面表达介体如CwpF(图片A),Tip40(图片B),GasF(图片C),和Wsc-ct(图片D)葡萄糖氧化酶在其上表达,和野生型(灰色)。

图13所示的是用STA1基因在酿酒酵母细胞表面表达外源蛋白的表面表达系统示意图,构建其的载体包括仅仅信号序列(STASS),信号序列和八肽序列(STASS-8)两者,信号序列、八肽序列和苏氨酸/丝氨酸-富集区(STASS-8-TS),信号序列和苏氨酸/丝氨酸-富集区(STASS-TS),信号序列和α-凝集素(STASS-CMC-Agalc),和信号序列、八肽和α-凝集素(STASS-8-CMC-Agalc),以及CMCase基因作为报告基因。

图14所示的图表是根据平板活性测定法自酿酒酵母菌株检测到的CMCase活性,这些菌株仅含信号序列(SS),含信号序列和八肽序列(SS-8),含信号序列、八肽序列和苏氨酸/丝氨酸-富集区(SS-8-TS),和含信号序列和苏氨酸/丝氨酸-富集区(SS-TS)。

图15所示的是酿酒酵母菌株FACS分析结果,在该菌株上CMCase通过使用表面表达载体得到表达(灰色),和野生型(白色)。

                发明的详细描述

本发明所建立的系统可将外源多肽从其在其中表达的酵母细胞输出到该酵母细胞的分离的区域,可应用于可再生的整细胞生物催化剂。

为了绕过与工业生产中已应用于重组蛋白生产的酿酒酵母有关的问题,用一种与Pichia pastoris一样的甲醇营养性酵母多形汉逊酵母进行重组蛋白表达的研究。由于多形汉逊酵母的细胞壁结构仍是未知的,因此在本发明中对介导外源蛋白输出到细胞表面的蛋白编码基因进行了筛选和克隆。而且将克隆的基因与编码感兴趣的蛋白的基因融合,构建新型的能够在酵母细胞表面表达外源蛋白的表面表达系统。

因此,本发明涉及编码多形汉逊酵母细胞壁蛋白的基因。

经鉴定,多形汉逊酵母的细胞壁蛋白与酿酒酵母的细胞壁蛋白具有非常相同的特征。编码已知为细胞壁蛋白的Cwp1p(GenBank D37975,van derVaart等,J.Bacteriol.,1995,177,3104),Cwp2p(GenBank Z28096,Van derVaart等,J.Bacteriol.,1995,177,3104),Sed1p(GenBank X66838,Seidel,J.andW.Tanner,Yeast,1997,13,3104),Tir1p(GenBank X12775),和Tip1p(GenBankM71216,Van der Vaart等,J.Bacteriol.,1995,177,3104),及已知为细胞质膜蛋白的Gas1p(GenBank X53424,Benghezal等,J.Cell Biol.,1995,130,1333)的基因被用于从多形汉逊酵母基因组中寻找相应的基因。

(1)分离多形汉逊酵母的HpSED1基因

由长1,017bp的SED1基因编码的Sed1p是一个包含338个氨基酸残基的蛋白质,它是酿酒酵母在稳定期时细胞壁中的主要蛋白。

用酿酒酵母的SED1基因片段作为探针,从多形汉逊酵母基因组中获得一个4kb EcoRI片段(如图1),并将其插入载体中。将多形汉逊酵母的SED1同源基因片段命名为HpSED1,鉴定其碱基序列为SEQ.ID.NO:1,其编码的开放阅读框包含131个氨基酸残基,序列为SEQ.ID.NO:11。多形汉逊酵母的HpSED1基因片段比酿酒酵母的SED1短很多。但多形汉逊酵母的HpSED1编码的HpSed1p与酿酒酵母有相同的氨基酸重复序列,表现出相似的苏氨酸/丝氨酸-富积结构,并有58.4%的氨基酸同源性。另外,多形汉逊酵母的HpSed1p似乎具有一个17个氨基酸的信号序列,以及一个推测的GPI锚定信号在其羧基末端。一个新型的大肠杆菌转化体于2000年7月11日保藏在韩国生物科学与生物技术研究所(KRIBB)的韩国典型微生物保藏中心,该菌株带有包含HpSED1基因的4kbEcoRI片段的重组载体,其保藏号为KCTC 0825BP。

(2)分离多形汉逊酵母的HpPIR2基因

由长765bp的TIR1基因编码的Tir1p是一个在酿酒酵母细胞壁发现的包含254个氨基酸残基的蛋白质。该蛋白具有高度的N-糖基化,富含丝氨酸/丙氨酸,在厌氧条件下良好地表达。

用酿酒酵母的TIR1基因片段作为探针,从多形汉逊酵母基因组中获得一个5kb ClaI片段(如图2b),并将其插入载体中。DNA序列分析表明ClaI片段的ORF与酿酒酵母的PIR2基因(GenBank D13741,Toh-e等,Yeast,1993,9,481)有51.2%的同源性。

在酿酒酵母蛋白中,除α-凝集素外,包含92个氨基酸的Cwp2p是最有效的表面锚(anchor)(van der Vaart等,Appl.Environ.Microbiol.,1997,63,615)。在本发明中,用酿酒酵母CWP2基因作为探针从多形汉逊酵母基因组得到一个5.5kb SalI片段(如图2a),通过DNA测序鉴定,该片段与通过TIR1克隆的ClaI片段是相同的片段。已报道蛋白Cwp2p和Tir1p均包含序列为SEQ.ID.NO:2的重复氨基酸序列,命名为PIR1/2/3重复,与Pir2p蛋白有很高同源性。

已知PIR2编码的酿酒酵母的Pir2p可通过碱处理从细胞壁中释放出来,通常具有一个Kex2切点,并此蛋白通过与GPI(糖基磷酸肌醇)锚定蛋白不同的方式锚定在细胞壁上,不能通过葡聚糖酶处理释放出来(Toh-e等,Yeast,1993,9,481)。对碱处理后从多形汉逊酵母细胞壁释放出来的主要细胞壁蛋白N末端氨基酸分析表明,该蛋白与HpPir2p多肽在kex2p切点之后具有相同的氨基酸序列,序列为SEQ.ID.NO:3。因此认为从多形汉逊酵母获得的HpPIR2基因是编码定位于细胞壁上的HpPir2p的基因。多形汉逊酵母的HpPir2p由长1,014bp,序列为SEQ.ID.NO:4的基因编码,包含337个氨基酸,并具有PIR1/2/3重复。该蛋白具有一个18个氨基酸的信号序列,并在68位氨基酸处具有Kex2p切点。一个新型的具有包含多形汉逊酵母HpPIR2基因的5.5kb SalI片段的重组载体的大肠杆菌转化体于2000年7月11日保藏在韩国生物科学和生物技术研究所(KRIBB)的韩国典型微生物保藏中心保藏号为KCTC 0827BP。

(3)分离多形汉逊酵母的HpGAS1基因

由长1,680bp的GAS1基因编码的Gas1p包含254个氨基酸,并与酿酒酵母的细胞膜相连。但是它的氨基末端暴露在外部,并穿过细胞壁。

在本发明中,用酿酒酵母的GAS1基因片段作为探针,从多形汉逊酵母基因组中获得一个3kb PstI片段(如图3),并将其插入载体中。DNA序列分析表明其ORF与酿酒酵母的Gas1p有70.7%的同源性,并被命名为HpGas1p。多形汉逊酵母的HpGas1p包含537个氨基酸,序列为SEQ.ID.NO:14,由序列为SEQ.ID.NO:5的长1,614bp的基因编码。多形汉逊酵母的Gas1p也具有一个18个氨基酸的信号序列,但GPI锚定信号与酿酒酵母不同。一个新型的具有包含多形汉逊酵母HpGAS1基因3kb PstI片段的重组载体的大肠杆菌转化体于2000年7月11日保藏在韩国生物科学和生物技术研究所(KRIBB)的韩国典型微生物保藏中心保藏号为KCTC0828BP。

(4)分离多形汉逊酵母的HpTIP1基因

由长633bp的酿酒酵母TIP1基因编码的Tip1p是一个包含210个氨基酸的GPI锚定蛋白,与Tir1p具有高同源性,Tip1p由冷休克诱导表达。

在本发明中,用酿酒酵母TIP1基因片段作为探针,从多形汉逊酵母基因组中获得一个3.5kb XbaI片段(如图4),并将其插入载体中。DNA序列分析表明其ORF包含序列为SEQ.ID.NO:6的长852bp的基因,编码283个氨基酸,序列为SEQ.ID.NO:13,。一个新型的具有包含多形汉逊酵母HpTIP1基因3.5kb XbaI片段的重组载体的大肠杆菌转化体于2000年7月11日保藏在韩国生物科学和生物技术研究所(KRIBB)的韩国典型微生物保藏中心保藏号为KCTC 0824BP。

(5)分离多形汉逊酵母的HpCWP1基因

Cwp1p是一个典型的GPI锚定蛋白,由长720bp的酿酒酵母CWP1基因编码,包含239个氨基酸。

在本发明中,用酿酒酵母的CWP1基因片段作为探针,从多形汉逊酵母基因组中获得一个6kbSalI片段(如图5),并将其插入载体中。DNA序列分析表明其推测的ORF有序列为SEQ.ID.NO:7的246bp序列,将其命名为HpCWP1,即使该蛋白与酿酒酵母的CWP1同源性低。另外,推测序列为SEQ.ID.NO:15的HpCwp1p具有一个15个氨基酸的分泌信号及一个GPI锚定信号。一个新型的具有包含编码多形汉逊酵母HpCwp1p的6kb SalI基因片段的重组载体的大肠杆菌转化体于2000年7月11日保藏在韩国生物科学和生物技术研究所(KRIBB)的韩国典型微生物保藏中心保藏号为KCTC 0826BP。

(6)分离多形汉逊酵母的HpWSC1基因

Wsc1p是负责应力反应的蛋白,它锚定在酿酒酵母细胞膜上。据报道该应力反应蛋白具有一个羧基末端跨膜结构域,一个可穿过细胞壁的丝氨酸/苏氨酸富集区,及一个暴露在外部,以检测外部信号的氨基末端半胱氨酸基序(Verna等,Proc.Natl.Acad.Sci.USA,1997,94,13804)。

根据以下事实,即当绿色荧光蛋白(GFP)作为Wsc1p的融合伴侣表达时,可在细胞表面观察到荧光,推测Wsc1p的氨基末端可作为表面表达介体。在分离多形汉逊酵母LEU2基因的过程中,HpWSC1基因由Agaphonov等获得(Agaphonov等,Yeast,1994,10,509,GenBank U00889)。DNA测序分析表明多形汉逊酵母的HpWSC1基因包含序列为SEQ.ID.NO:8的长1,110bp的序列,并编码373个氨基酸序列。推测由多形汉逊酵母中分离的HpWSC1基因所编码的蛋白是一种锚定机制不同于GPI锚定蛋白的细胞表面蛋白,可通过与外源蛋白氨基末端区域融合而应用于开发表面表达系统。

按照本发明的实施方案,提供了来源于多形汉逊酵母的细胞壁蛋白基因,HpSED1,HpPIR2,HpGAS1,HpTIP1,和HpCWP1,及一个膜蛋白基因HpWSC1基因,包含这些基因的载体,及用这些载体转化的细胞。

而且本发明涉及利用从多形汉逊酵母中分离的新型细胞壁蛋白作为外源蛋白的表面表达的介体的表面表达系统。

按照本发明的另一个实施方案,提供了利用从多形汉逊酵母中分离的GPI锚定蛋白作为外源蛋白的表面表达的介体的表面表达系统。

认为可作为介体基因用于表面表达系统,将4个推测的GPI锚定蛋白基因从多形汉逊酵母中克隆出来。根据本发明,对每个介体所构建的表面表达系统,均由来源于Bacillus subtilis(Park等,Agric.Biol.Chem.,1991,55,441)的羧甲基纤维素酶(以下称为“CMCase”)作为报告蛋白。

此处,GAPDH启动子(Sohn等,Appl.Microbiol.Biotechnol.,1999,51,800)和杀伤毒素信号序列(Sor,F.and Fukuhara,Curr.Genet.,1985,9,147)均插入到表达载体中。然后将CMCase基因符合读框地融合以便构建CMCase表面表达载体,其能够在GAPDH启动子的控制下表达CMCase。将4个推测的GPI锚定蛋白基因,HpCWP1,HpGAS1,HpTIP1和HpSED1基因片段,分别插入到表面表达载体CMCase的羧基末端,从而构建成CMCase表面表达载体。根据GPI锚定基序位于羧基末端40个氨基酸中的事实(van der Vaart等,Appl.Environ.Microbiol.,1997,63,615),也用编码每个介体羧基末端40个氨基酸的核酸节段构建了CMCase表面表达载体。将所有这些表面表达载体导入多形汉逊酵母(Hill等,Nucl.Acids Res.,1991,19,5791)后,培养获得的转化体,并在其上清和整个细胞级分中测定CMCase活性。

与其中无信号序列或无介体基因融合的对照载体相比较,其中插入各介体基因的表达载体在整个细胞级分(fractions)中的CMCase活性显著提高,这说明CMCase被各个介体输送到细胞表面(如表1)。特别是,发现HpTip1p,HpGas1p和HpCwp1p比其他介体将CMCase转运到细胞表面的效率更高(如图7)。

尽管大多数细胞在达到稳定期时CMCase活性下降,但发现用HpCwp1p作为表面锚的细胞的CMCase活性,虽然在稳定期有所降低,但在整个培养期其活性都保持很高。因此表明HpCwp1p在所检测的蛋白中是最稳定的介体(如图8)。

按照本发明进一步的实施方案,提供了使用从多形汉逊酵母中分离的非GPI锚定蛋白作为介体,对外源蛋白进行表面表达的表面表达系统。

在该实施方案的一个版本中,编码不同于GPI锚定蛋白的细胞壁蛋白的HpPIR2基因用于构建表面表达系统。

与GPI锚定蛋白相比较,Pir2p蛋白通过其丝氨酸/苏氨酸富集区的高度O-糖基化与存在于细胞壁上的聚糖从而锚定在细胞壁中。因此,Pir2p蛋白在仅水解多聚糖的酶作用下并不从细胞壁释放,但当用可切断所有糖基化的碱处理时,能够从细胞壁上释放。在本发明中,构建了利用HpPir2p蛋白羧基-和氨基-末端区的表面表达系统。测定作为报告蛋白的CMCase的活性,以估计来源于HpPir2p的介体的锚定能力。(如图9)。

当HpPir2蛋白的羧基-末端区作为介体时,获得的CMCase活性与无介体的CMCase基因表达时的活性几乎相同。相反,当用HpPir2蛋白氨基末端区作为锚定介体时,不仅在上清中检测到CMCase活性,而且在整个细胞级分中也检测到活性(如表2)。据报道Pir2p蛋白通过体内的过量表达而分泌到培养基中(Russo等,Proc.Natl.Acad.Sci.USA,1992,89,3671)。因此,在整个细胞级分中检测到的CMCase活性是由于酶锚定在细胞壁上造成的。

因此,HpPir2p蛋白可锚定在细胞壁中,因而可用作表面表达介体。Pir2p蛋白好于传统GPI锚定蛋白的优势在于连接到目的蛋白的氨基末端到其羧基末端。 

在实施方案的另一个版本中,编码不同于GPI锚定蛋白的跨膜蛋白的WSC1基因用于构建表面表达系统。

如图10a所示,Wsc1p蛋白包括将蛋白锚定在细胞膜中的跨膜结构域、贯穿细胞壁的丝氨酸/苏氨酸富集区及存在于胞外空间的氨基末端半胱氨酸基序(Verna et al.,Proc.Natl.Sci.USA,1997,13804)。

为了用HpWsc1p建立表面表达系统,几个截短的HpWSC1基因片段,缺失半胱氨酸基序或跨膜结构域,或二者均缺失,插入到CMCase表达载体中(如图10b),并分析了CMCase活性。

只有当融合蛋白中存在跨膜结构域时,CMCase才不会进行分泌,而是附着在细胞上。但是,尽管跨膜结构域存在,如果不存在半胱氨酸基序,也不能在整个细胞级分中检测到CMCase活性。该结果可能来自以下事实:即CMCase不能充分暴露在细胞表面。对照而言,当跨膜结构域缺失时,大部分CMCase活性在上清中检测到。另外,半胱氨酸基序在CMCase分泌中起到附加作用(如表3)。

因此,来源于HpWsc1p的介体必须具有半胱氨酸基序和跨膜结构域二者,为了锚定效率。在本发明中,建议将HpWsc1p作为一种新型的介体用于蛋白的表面表达。

依据本发明的再一个实施方案,提供了使用HpTip1p,HpGas1p和HpCwp1p,及HpWsc1p将葡萄糖氧化酶输出到细胞表面的表面表达系统。

葡萄糖氧化酶是一种来源于Aspergillus niger的黄素酶,包含两个相同的多肽链亚基。在多形汉逊酵母中表达时,已知该酶会进行高度(hyper)糖基化。

当葡萄糖氧化酶在锚定介体如HpTip1p、HpGas1p、HpCwp1p和HpWsc1p存在下表达时,发现该酶在平板上的活性圈(Hodgkins等,Yeast,1993,9,625)比分泌的酶小(如图11)。

在使用锚定介体的所有情况中,均通过FACS(荧光激活细胞分选仪)分析对荧光细胞进行了观察,结果表明葡萄糖氧化酶得到表达并锚定在细胞表面。另外,在所有菌株中,整个细胞级分比上清检测到更高的葡萄糖氧化酶活性。当使用HpCwp1p时,对大量细胞的荧光进行检测,结果表明HpCwp1p具有卓越的细胞壁锚定活性。而且发现HpTip1p的40个氨基酸的片段可在细胞表面有效表达蛋白(如图12)。在HpGas1p和HpWsc1p介导下,可检测到能证明细胞壁锚定活性的荧光,但是低水平。但即使在这种情况下,如果将底物渗入细胞壁,似乎在酶的活性的检测中毫无问题。

因此,根据本发明,不仅发现HpCwp1p在GPI锚定蛋白中是最有效的表面表达介体,而且表明HpPir2p和HpWsc1p蛋白可作为新型的表达介体。

在此处,针对本发明所用的是真核细胞,选自酵母属种及霉菌属种,酵母属种包括念珠菌属种,杀德氏酵母属种(Debaryomyces spp.),汉逊酵母属种,克鲁维酵母菌属种,毕赤氏酵母属种(Pichia spp.),裂殖酵母属种,Yarrowia spp.,Saccharomyces spp.;霉菌包括曲霉属种,青霉属种,和根霉属种(Rhizopus spp.)。

根据本发明的另一个实施方案,提供了由来源于Saccharomycesdiastaticus的葡糖淀粉酶基因STA1构建的表面表达系统。

来源于Saccharomyces diastaticus的葡糖淀粉酶长2,337bp,序列为SEQ.ID.No:9,该酶分泌到胞外空间,对胞外淀粉进行水解。该酶的氨基酸序列分析表明在氨基末端区具有一个信号序列(SS),并具有一个苏氨酸/丝氨酸富集(TS-富集)区,该区包含占总的氨基酸残基的55%的量的苏氨酸和丝氨酸残基。信号序列和苏氨酸/丝氨酸富集区通过序列为SEQ.ID.NO:10的八肽相互连接。尽管该八肽在定向蛋白到外部的过程中起作用,苏氨酸/丝氨酸富集区负责支持蛋白穿过细胞壁,因此其作用就像锚定介体一样(Venturini等,Mol.Microbiol.,1997,23,997;Yamashita,I.,Agric.Biol.Chem.,1989,53,483;Yamashita等,Agric.Biol.Chem.,1984,48,1611)。

图13所示的是利用STA1基因所构建的表面表达系统的载体示意图,如图所示,表面表达系统是用仅含信号序列,含信号序列和八肽序列,含信号序列、八肽序列和苏氨酸/丝氨酸富集区,含信号序列和α-凝集素,含信号序列、八肽和α-凝集素,并以CMCase基因作为报告基因的载体进行构建的。

通过pNPC(p-硝基苯基β-D-cellobiocide)法(Deshpande等,Anal.Biochem.,1984,138,481)的测定,当仅使用信号序列时,大部分CMCase分泌到胞外,而不锚定在细胞壁上。相反,当使用经八肽与信号序列相连的苏氨酸/丝氨酸富集区时,在上清中CMCase活性很低,而在整个细胞级分中活性很高。平板活性测定法验证了相同的结果。当仅含信号序列时,在菌落周围出现大环,这说明CMCase大部分分泌到细胞外。苏氨酸/丝氨酸富集区的存在阻碍了酶的分泌,这可被其菌落周围形成小环所证明(如表4及图14)。

另外,通过FACS分析检测了具有苏氨酸/丝氨酸富集区的细胞的荧光,结果表明CMCase存在于细胞表面(如图15)。

用葡糖淀粉酶基因构建表面表达系统时,葡糖淀粉酶或其结构域可与目的蛋白的氨基末端融合。这样,该系统解决了由于介体与羧基末端融合,从而使目的蛋白羧基末端活性结构域受到防碍的问题。

因此,根据靶蛋白的性质,此处描述的介体可以开发能够表达各种类型的靶蛋白的表面表达系统。

                      实施例

通过下面实施例对本发明实际和目前优选实施方案进行举例说明。

但是,要理解的是,基于本发明的公开内容,本领域的普通技术人员在本发明所限定的宗旨和范围内可对本发明进行改进和修改。实施例1从多形汉逊酵母中分离编码细胞壁表达蛋白的基因

来源于多形汉逊酵母DL1(ATCC 26012)并用于克隆的菌株DL1-L(Δleu2)从NPO Biotechnologia(莫斯科,俄罗斯)获得。用不能穿过细胞壁的生物素标记对细胞壁蛋白分布(profile)分析,结果表明该菌株具有与酿酒酵母非常类似的表面蛋白的分布。用编码酿酒酵母葡聚糖酶可提取的细胞壁蛋白的基因,对来自多形汉逊酵母的细胞壁蛋白进行克隆。

为了从多形汉逊酵母中分离细胞壁蛋白基因,首先从酿酒酵母中获得了已知编码细胞壁表达蛋白Cwp1p(GenBank D37975,van der Vaart等,J.Bacteriol.,1995,177,3104),Cwp2p(GenBank Z28096,van der Vaart等,J.Bacteriol.,1995,177,3104),Sed1p(GenBank X66838,Seidel,J.and W.Tanner,Yeast,1997,13,3104),Tir1p(GenBank X12775),和Tip1p(GenBank M71216,van der Vaart等,J.Bacteriol.,1995,177,3104),及已知作为细胞质膜蛋白Gas1p(GenBank X53424,Benghezal等,J.Cell Biol.,1995,130,1333)的基因。据报道,由于这些蛋白的羧基末端经过GPI锚与β-1,6-糖苷相连,从而可通过葡聚糖酶处理将这些蛋白从细胞壁上分离出来(Kapteyn等,Biochim.Biophys.Act.,1999,1426,373;Kolla等,J.Biol.Chem.,1997,272,17762)。用这些基因作为探针,对多形汉逊酵母基因组进行southern blot分析。当用酿酒酵母Cwp1p基因作为探针时,没有从多形汉逊酵母基因组DNA中得到清晰的信号。推断这可能是因为该基因在二菌株间同源性较低。而其他4个基因均观察到清晰的信号。相应的DNA片段从基因库中进行了克隆。<1-1>分离多形汉逊酵母的HpSED1基因

为了从多形汉逊酵母中分离SED1同系物,根据Klenow片段方法,对酿酒酵母SED1基因的开放阅读框通过DIG标记系统(BoehringerMannheim)进行标记,并用作Southernblot分析的探针。在42℃及30%甲酰氨溶液中杂交,并对获得的信号进行检测。

Southern blot分析结果如图1所示。可在4kb EcoRI片段中检测到信号。从胶中对4kb附近的DNA进行洗脱,然后将DNA片段从EcoRI位点插入到pBluescript II SK(+)中构建基因库。在同样的条件下,对基因库进行southern blot分析,以获得可与探针杂交并插入DNA片段的重组载体。对命名为HpSED1的DNA序列分析表明:4kb DNA片段具有序列为SEQ.ID.NO:1的碱基序列,并具有一个包含131个氨基酸序列为SEQ.ID.NO:11的开放阅读框。已知多形汉逊酵母HpSED1基因比酿酒酵母相应基因更短,但具有相同的氨基酸重复序列及苏氨酸/丝氨酸富集区,而且二者同源性为58.4%。另外,PSORT II预测系统分析表明,多形汉逊酵母HpSed1p具有一个17个氨基酸的信号序列,羧基末端具有一个GPI锚定信号。一个新型的具有其中插入了包含多形汉逊酵母HpSED1基因的4kb EcoR1片段的重组载体的大肠杆菌转化体于2000年7月11日保藏在韩国生物科学和生物技术研究所(KRIBB)的韩国典型微生物保藏中心保藏号为KCTC 0825BP。<1-2>分离多形汉逊酵母的HpPIR2基因

为了从多形汉逊酵母中分离TIR1同系物,根据Klenow片段方法对酿酒酵母TIR1基因的开放阅读框通过DIG标记系统(Boehringer Mannheim)进行标记,并用作Southern blot分析的探针。在42℃及30%甲酰氨溶液中杂交,并对获得的信号进行检测。

Southern blot分析结果如图2b所示。可在5kb ClaI片段中检测到信号(泳道9)。从胶中对4kb附近的DNA进行洗脱,然后将DNA片段从ClaI位点插入到pBluescript II SK(+)中构建基因库。使用<1-1>中同样的方法,获得与探针杂交的包含5kb ClaI DNA片段的重组载体。对该5kb ClaI DNA序列分析表明其ORF与酿酒酵母的Pir2p具有51.2%同源性。

为了从多形汉逊酵母a中克隆CWP2同系物,根据Klenow片段方法对酿酒酵母CWP2基因的开放阅读框通过DIG标记系统进行标记,作为杂交探针。Southern杂交在42℃及30%甲酰氨溶液中进行,检测信号。Southern blot分析结果如图2a所示。可在5.5kb SalI片段中检测到信号。通过对DNA测序分析,该5.5kbSalI片段与ClaI片段的序列相同。在Cwp2p和Tir1p两种蛋白中,都发现含有序列为SEQ.ID.NO:2的重复氨基酸序列,称为PIR1/2/3重复序列。据推断,这些重复序列与多形汉逊酵母的HpPIR2基因有很高的同源性,因此当探针与HpPIR2杂交时可能有信号产生。为了排除这种可能性,使用缺失重复序列的基因作为探针进行southern blot分析,但并没有获得清晰的信号。

对于从酿酒酵母中分离获得的PIR2基因编码的蛋白——Pir2p蛋白,有报道指出它可以通过碱处理方式从细胞壁中释放出来,但不能通过葡聚糖酶处理来释放,这意味着该蛋白以一种不同于GPI(糖基磷脂酰肌醇)锚定蛋白的形式锚定到细胞壁上,而且该蛋白含有一个Kex2切点(Toh-e等,Yeast,1993,9,481)。使用30mM氢氧化钠处理多形汉逊酵母细胞壁后,对所获得的主要细胞壁蛋白进行N末端氨基酸分析(Mrsa等,Yeast,13,1145-1154,1997),结果表明具有序列为SEQ.ID.NO:3,并与HpPir2p kex2切点后多肽相同的氨基酸序列。因此推断从多形汉逊酵母获得的HpPIR2基因所编码的HpPir2p蛋白可转移到细胞壁上。

多形汉逊酵母的Pir2p蛋白由一个长1,014bp,序列为SEQ.ID.NO:4的基因编码,该蛋白包含337个氨基酸,并具有PIR1/2/3重复,其序列为SEQ.ID.NO:12。该蛋白具有一个18个氨基酸的信号序列,并在68位残基处有一个Kex2切点。一个新型的用其中插入了多形汉逊酵母HpPIR2基因的5.5kb SalI片段的重组载体转化的大肠杆菌转化体于2000年7月11日保藏在韩国生物科学和生物技术研究所(KRIBB)的韩国典型微生物保藏中心保藏号为KCTC 0827BP。<1-3>分离多形汉逊酵母的HpGAS1基因

根据Klenow片段方法对酿酒酵母GAS1基因通过DIG标记系统(Boehringer Mannheim)进行标记,并用作Southern blot分析的探针。在42℃及30%甲酰氨溶液中杂交,并对获得的信号进行检测。

在1.6kb SalI片段中检测到信号。为了鉴定基因的全长,用其他限制性内切酶处理基因组,并在42℃及30%甲酰氨溶液中与同样的探针进行杂交。如图3所示,在3kb PstI片段检测到信号。将命名为HpGAS1PstI片段克隆并从PstI位点插入到pBluescript II SK(+)中构建重组载体。重组载体的DNA序列分析表明多形汉逊酵母的HpGas1p由一个长1614bp,序列为SEQ.ID.NO:5的基因编码,包含序列为SEQ.ID.NO:14的537个氨基酸,并与酿酒酵母Gas1p的同源性高达70.7%。另外,也发现多形汉逊酵母的HpGas1p具有一个18个氨基酸的分泌信号序列,但GPI锚定信号与酿酒酵母不同。

一个新型的具有包含多形汉逊酵母HpGAS1基因的3kb PstI片段的重组载体的大肠杆菌转化体于2000年7月11日保藏在韩国生物科学和生物技术研究所(KRIBB)的韩国典型微生物保藏中心保藏号为KCTC0828BP。<1-4>分离多形汉逊酵母的HpTIP1基因

根据Klenow片段方法对酿酒酵母TIP1基因的开放阅读框通过DIG标记系统(Boehringer Mannheim)进行标记,并用作Southern blot分析的探针来筛选多形汉逊酵母TIP1同系物。在42℃及30%甲酰氨溶液中杂交,并对获得的信号进行检测。    

Southern blot分析结果如图4所示。可在3.5kb XbaI片段中检测到一个明显的信号。将命名为HpTIP1的3.5kb片段在XbaI位点插入到pBluescript II SK(+)构建重组载体。重组载体DNA序列分析表明克隆的基因长852bp,序列为SEQ.ID.NO:6,编码一个序列为SEQ.ID.NO:13的具有283氨基酸的蛋白。一个新型的具有包含多形汉逊酵母HpTIP1基因的3.5kb XbaI片段的重组载体的大肠杆菌转化体于2000年7月11日保藏在韩国生物科学和生物技术研究所(KRIBB)的韩国典型微生物保藏中心保藏号为KCTC 0824BP。<1-5>分离多形汉逊酵母的HpCWP1基因

根据Klenow片段方法对酿酒酵母CWP1基因的开放阅读框通过DIG标记系统(Boehringer Mannheim)进行标记,并用作Southern blot分析的探针来筛选多形汉逊酵母CWP1同系物。在42℃及30%甲酰氨溶液中杂交,并对信号进行检测。

如图5所示,可检测到几个较弱的信号,在各信号中,命名为HpCWP1的6kb SalI片段信号最强,将其在SalI位点插入到pBluescript II SK(+)构建重组载体。DNA序列分析表明重组载体中的克隆基因长246bp,其序列为SEQ.ID.NO:7的开放阅读框与酿酒酵母Cwp1p同源性很低。另外,根据POSRT II预测程序表明,其序列为SEQ.ID.NO:15的氨基酸序列具有一个15个氨基酸的分泌信号序列及GPI锚定信号。一个新型的具有包含编码多形汉逊酵母HpCwp1p的6kb SalI片段的重组载体的大肠杆菌转化体于2000年7月11日保藏在韩国生物科学和生物技术研究所(KRIBB)的韩国典型微生物保藏中心保藏号为KCTC 0826BP。<1-6>分离多形汉逊酵母的HpWSC1基因

根据以下事实:当绿色荧光蛋白(GFP)作为Wsc1p融合部分表达时,可在细胞表面观察到荧光,从而推测出Wsc1p的氨基末端结构域可作为表面表达介体。

在分离多形汉逊酵母的LEU2基因的过程中,HpWSC1基因由Agaphonov等获得(Agaphonov等,Yeast,1994,10,509,GenBank U00889)。DNA序列分析表明多形汉逊酵母HpWSC1基因由1,110bp,序列为SEQ.ID.NO:8的序列构成,编码一个373个氨基酸的序列。由分离自多形汉逊酵母的HpWSC1基因编码的蛋白是一个在锚定机理上不同于GPI-锚定蛋白的细胞表面蛋白,并且可通过其氨基末端结构域用于开发表面表达系统。实施例2:使用自多形汉逊酵母中分离的细胞壁蛋白的表面表达系统<2-1>构建表面表达系统

构建其中实施例1自多形汉逊酵母中分离的4个GPI锚定蛋白基因和HpWSC1基因用作为外源蛋白的表面表达的介体基因的表面表达系统。来源于Bacillus subtilis的CMCase基因(Park等,Agric.Biol.Chem.,1991,55,441)作为报告基因,与每个介体基因一起用于表面表达系统。

此处,GAPDH启动子(Sohn等,Appl.Microbiol.Biotechnol.,1999,51,800)和杀伤毒素信号序列(Sor,F.and Fukuhara,Curr.Genet.,1985,9,147)插入到AMIpL1载体(Agaphonov等,Yeast,1999,15,541)中。然后将CMCase基因符合读框地融合,从而得到CMCase表面表达载体,并被命名为pGKCMCF,它可以在GAPDH启动子控制下表达CMCase,如图6所示。通过PCR获得对应于从31位甘氨酸到355位天冬氨酸的氨基酸序列的CMCase基因序列,并将其连接到表达载体中的杀伤毒素信号序列的下游。如图6所示,介体基因插入到在限制性内切酶BamHI/HindIII识别位点之间的CMCase基因羧基区。另外,设计表达载体具有一个ARS,HARS36,它可以指导载体整合到宿主细胞染色体的端粒区,从而能够比较表面锚定蛋白的转移效率(Sohn等,J.Bacteriol.,1996,178,4420)。

4个推测的GPI锚定蛋白基因,HpCWP1,HpGAS1,HpTIP1和HpSED1基因片段用合适的引物对从重组载体上通过PCR扩增得到,所用的引物对被设计为对PCR产物提供BamHI和HindIII位点。扩增的推测GPI锚定蛋白基因在CMCase基因的羧基末端区中的BamHI/HindIII位点插入到表达载体pGK CMCF中,从构建HpCWP1,HpGAS1,HpTIP1和HpSED1的CMCase表面表达载体,并分别命名为CwpF,GasF,TipF和SedF。

用包含BamHI/HindIII位点的引物对,通过PCR扩增得到4个各自编码每种蛋白40个羧基末端氨基酸的核酸片段,将其分别插入到表达载体中,构建CMCase表面表达载体,并分别命名为Cwp40,Gas40,Tip40和Sed40。

已知来自酿酒酵母的GPI-锚定蛋白Cwp2p具有卓越的锚定效率,为了对表面锚定效率进行比较,通过PCR合成编码Cwp2p的羧基末端92个氨基酸序列的DNA片段,并将其插入到相同的载体中,以便构建Cwp2p的CMCase表面表达载体,命名为ScCwp2,作为对照。

包含该介体蛋白基因的CMCase表面表达载体转化到多形汉逊酵母DL1-L(Hill等,Nucl.Acids Res.,1991,19,5791)中,并在不含亮氨酸的基本合成培养基(2%葡萄糖,0.67%无氨基酸的酵母氮碱(base),各种合适浓度的氨基酸)上筛选转化子。<2-2>测定表面锚定的CMCase活性

将每个筛选的克隆接种到YPD培养基(2%葡萄糖,2%蛋白胨,1%酵母膏)中,在37℃培养18小时,然后根据DNS(二硝基水杨酸)法(G.L.Miller,Anal,Biochem.,1959,31,426)测定上清和整个细胞级分的CMCase活性。

为了检测CMCase活性,通过离心将培养液分为上清和整个细胞级分。整个细胞级分用醋酸缓冲液(10mM醋酸缓冲液,pH5.0)洗2次后,再溶于相同的缓冲液中。所得的悬浮液加入1%CMC(羧甲基纤维素)溶液中,55℃温育30分钟。然后在DNS溶液中煮沸5分钟终止反应。550nm测定吸收值。结果如下表1所示。CMCase酶活性单位定义为U,1U表示的是在1分钟内从CMC释放1μmole葡萄糖的酶活性的量。

                       表1

         根据锚定介体的CMCase的表面表达活性

            上清中的活性整个细胞级分中的活性

   锚定介体

               (U/ml)             (U/ml)

    Sed40       0.40               0.059

    SedF        0.41               0.030

    Tip40       0.92               0.090

    TipF        0.45               0.024

    Gas40       0.19               0.010

    GasF        0.61               0.080

    Cwp40       1.10               0.150

    CwpF        0.65               0.110

    MCMC        0.14               0.003

    CMC*       1.92               0.000

    ScCwp2      0.15               0.020

    DL1         0.00               0.000MCMC:带有无分泌信号序列的CMCase表达载体的转化体。CMC*:带有具有分泌信号序列、CMCase基因,并由终止密码子代替锚定介体的CMCase表达载体的转化体。DL1:没有表达载体的野生型细胞。

 在上清级分中,可观察到高的CMCase活性。据信这是因为CMCase在GAPDH启动子调控下表达的太多而不能正确锚定到细胞表面的事实而造成的。而且,由于用作为CMCase活性测定的底物的CMC分子量较大,所以锚定到细胞中的酶不能有效接近CMC。与那些用对照载体(缺失分泌信号序列的MCMC,及无介体基因的CMC)转化的菌株相比,用包含介体基因的载体转化的菌株在整个细胞级分中表现出明显改进的CMCase活性,因此表明CMCase被每个介体输出到细胞表面。另外发现,在包含Tip40,GasF,Cwp40p和CwpF的转化体中,CMCase转移到细胞表面的效率比包含其他介体的菌株高,如图7所示。

根据培养时间对CMCase活性进行监测,结果如图8所示。当到达稳定期时,大多数细胞的CMCase活性趋向于降低。但发现带有含有HpCWP1基因的表面表达载体的细胞在整个细胞级分中的CMCase活性在整个培养期均保持很高,虽然在稳定期也有所降低。因此推断HpCwp1p是所有检测蛋白中最稳定的介体,如图8所示。

从上面所得的数据可知,在从多形汉逊酵母中分离的4种新型GPI-锚定蛋白中,鉴定出HpCwp1p具有更高的表面表达效率和稳定性。实施例3:使用HpPir2p的表面表达系统<3-1>构建表面表达系统

构建其中用HpPIR2基因作为外源蛋白的表面表达的介体并以CMCase作为报告蛋白的表面表达载体,该HpPIR2基因编码的细胞壁表达蛋白不同于GPI锚定蛋白。如图9所示,将CMCase融合在HpPir2p的二末端之任一,以确定HpPir2p蛋白的哪一部分对在细胞壁上表达靶蛋白是有用的。

为了利用HpPir2p羧基末端与目的蛋白融合,通过PCR合成了一个基因片段,该片段编码从HpPir2p蛋白的Kex2切点到其终止密码子的序列,并将该片段在限制酶切位点(BamHI/HindIII)处插入到实施例2所构建的表达载体pGK CMCF中,得到的重组表达载体,命名为Pir-C。对HpPir2p的氨基末端而言,将杀伤毒素信号序列从表达载体pGK CMCF中删除,并用编码HpPir2p的自起始密码子蛋氨酸到终止密码子的全长开放阅读框的基因片段代替,以使HpPIR2基因直接与CMCase的氨基末端融合。得到的表面表达载体命名为Pir-N。表达载体转化多形汉逊酵母,随后以上述相同的方式筛选转化子。<3-2>表面锚定的CMCase的活性测定

将实施例3-1所筛选的转化子在YPD培养基中培养后,测定其CMCase活性。结果如下表2所示。

                         表2    

使用HpPir2p作为表面表达介体的多形汉逊酵母的CMCase活性

   介体    上清中的活性(U/ml)     整个细胞级分中的活性(U/ml)

  Pir-C#1        3.33                       0.010

  Pir-C#2        2.80                       0.009

  Pir-N#1        1.83                       0.080

  Pir-N#2        1.86                       0.084

  CMC*          2.53                       0.000

如表2所示,当用HpPir2p蛋白的羧基末端区作为介体(Pir-C)时,测定的CMCase活性与用具有终止密码子的CMCase基因时几乎相同,这说明HpPir2p蛋白的羧基末端区完全没有表面锚定能力。并且,CMCase活性不受插入HpPir2p蛋白的影响。相反,当用HpPir2p蛋白氨基末端区作为介体时(Pir-N),不仅在上清检测到CMCase活性,而且也在整个细胞级分中检测到CMCase活性,这说明CMCase在细胞壁上表达。

因此,HpPir2p蛋白锚定在细胞壁上,并且因此可用作表面表达介体。与传统GPI锚定蛋白相比,HpPir2p蛋白的优势在于将靶蛋白的氨基末端与其羧基末端进行连接。该锚定蛋白可用于避免当目的蛋白在其羧基末端区具有活性位点时发生的活性损失的问题。实施例4:使用HpWsc1p的表面表达系统<4-1>构建表面表达系统

如图10a所示,HpWsc1p蛋白由一个将该蛋白锚定在细胞膜上的跨膜结构域,一个穿过细胞壁的丝氨酸/苏氨酸富集区,及一个存在于胞外空间起检测外部信号作用的氨基末端半胱氨酸基序构成(Verna等,Proc.Natl.Sci.USA,1997,13804)。

在该实施例中,HpWSC1基因用来构建表面表达系统。此处,CMCase融合到HpWsc1p氨基末端并且作为暴露在细胞表面的报告蛋白。

为了鉴定哪个结构域负责在细胞壁上的锚定,用设计有BamHI/HindIII位点的引物对通过PCR合成截短的HpWSC1基因片段。将4个截短的HpWSC1基因片段,缺失半胱氨酸基序(wsc-t)或跨膜结构域(Wsc-c),和二者均缺失(Wsc-o),及完整的编码全长HpWSC1的WSC1基因(Wsc-ct),在BamHI/HindIII位点插入到质粒载体中(如图10b)。将重组载体转化入多形汉逊酵母DL1-L,随后以上述相同的方式筛选转化子。<4-2>测定表面锚定的CMCase活性

筛选的转化子在YPD肉汤中培养18小时后,根据DNS法测定其CMCase活性,结果如下表3所示。

                          表3

使用HpWsc1p作为表达介体的多形汉逊酵母菌株的CMCase活性

    表达介体  上清中的活性    整个细胞级分中的活性

                (U/ml)             (U/ml)

     Wsc-c       0.90               0.002

     Wsc-ct      0.35               0.069

     Wsc-o       2.40               0.003

     Wsc-t       0.04               0.006

     CMC*       2.54               0.000

     DL1         0.00               0.000

如表3所示,只有当跨膜结构域存在于融合蛋白中时(Wsc-ct,Wsc-t),CMCase不进行分泌,而保持附着在细胞上。但如果缺失半胱氨酸基序(Wsc-o,Wsc-t),即使存在跨膜结构域,在全细胞级分中也没有检测到CMCase活性。该结果被认为是由于CMCase没有充分地暴露在细胞表面的事实造成的。相反,当跨膜结构域缺失时(Wsc-o,Wsc-c),大部分CMCase活性存在于上清中。另外发现,半胱氨酸基序对CMCase分泌的做附加的贡献。

因此,来源于HpWsc1p的介体必须同时具有半胱氨酸基序和跨膜结构域才能进行有效锚定。由于在整个细胞级分中检测到的活性与GPI锚定蛋白几乎相同,这说明HpWsc1p可作为一个新型介体,用于在细胞表面表达蛋白。实施例5:葡萄糖氧化酶的表面表达系统<5-1>构建表面表达系统

在检测的介体蛋白中,对3个GPI锚定蛋白,HpTip1p(Tip40),HpGas1p(GasF)和HpCwp1p(CwpF),及HpWsc1p(Wsc-ct)进行了葡萄糖氧化酶的表面表达的检测。对葡萄糖氧化酶的表面表达而言,通过PCR合成葡糖淀粉酶信号序列及葡萄糖氧化酶基因,并将其彼此融合后克隆到pBluescript II SK(+)中。包含表达介体基因的pGK CMCF载体用EcoRI和BamHI进行处理,以除去杀伤毒素信号序列和CMCase基因,然后插入葡萄糖氧化酶表达盒,从而得到表面表达载体pGA GOD。用该载体转化入多形汉逊酵母DL1-L,然后用与上述CMCase相同的方式筛选转化子。<5-2>表面锚定的葡萄糖氧化酶的活性测定

将实施例5-1中筛选的转化子转移到YPD平板培养基上,用过氧化物酶和O-联茴香胺根据平板活性测定法(Hodgkins等,Yeast,1993,9,625)测定葡萄糖氧化酶活性。如图11所示,用锚定介体(Tip40,GasF,CwpF和Wsc-ct)表达的葡萄糖氧化酶比不含它们(GOD*)的产生一个更小的葡萄糖氧化酶活性圈。

在YPD培养基上培养后,对通过平板活性检测法检出的在细胞表面具有葡萄糖氧化酶活性的转化子进行FACS分析,并以野生型作为对照。FACS结果如图12。此处,培养后的细胞用磷酸盐缓冲液(PBS,pH6.5)洗2次,然后悬浮在含有1%BSA(小牛血清白蛋白)的PBS中。悬浮液中加入葡萄糖氧化酶抗体(Accurate Chemicals),冰上放置1小时,然后细胞用同样的缓冲液洗涤3次并重悬。向悬浮液中加入二抗(FITC-标记的抗兔抗体,Sigma),并在冰上温育30分钟,然后用同样的缓冲液洗涤细胞3次。

在所有使用锚定介体的情况下,均可通过FACS分析(荧光活化细胞分选仪)观察到荧光细胞,表明葡萄糖氧化酶得到表达并锚定在细胞表面。而且,所有菌株在整个细胞级分中检测到的葡萄糖氧化酶活性均高于上清中的活性。总之,发现表面锚定的葡萄糖氧化酶活性与CMCase得到的结果是一致的。当使用CwpF时,可在大量细胞中检测到荧光,表明CwpF具有卓越的细胞壁锚定活性。而且通过FACS分析还发现,Tip40可在细胞表面有效表达蛋白(Fig.12)。在GasF和Wsc-tc介导下,可检测到作为细胞壁锚定证据的荧光,但水平低,就我们所知,其原因是GasF和Wsc-tc均为细胞质膜膜蛋白,从而与其他介体相比较,它们在细胞表面的暴露较弱。但即使在这种情况下,如果将底物渗入到细胞壁中,则该酶的活性检测似乎毫无问题。

综合考虑使用各种介体将两种酶锚定在细胞壁上的测定结果,证明HpCwp1p在GPI锚定蛋白中是最有效的表面锚定介体,而提示HpPir2p和HpWsc1p蛋白可作为新型的表面锚定介体。实施例6:使用葡糖淀粉酶基因的表面表达系统<6-1>构建表面表达系统

对一种已知细胞壁蛋白作为表达介体的有效性进行了调查。获得来源于Saccharomyces diastaticus的葡糖淀粉酶基因STA1,并研究其构建在酿酒酵母中的表面表达系统的有效性。

用合适的引物通过PCR合成各种截短的STA1基因片段,并在EcoRI和SmaI位点插入到pBluescript II SK(+)中。通过DNA测序鉴定克隆。重组载体用EcoRI和HindIII消化,以插入酿酒酵母GAPDH启动子。插入后得到的重组载体用KpnI和EheI消化,以得到各种STA1基因与GAPDH融合的片段,并将它们在KpnI/PstI位点插入到表达载体YEp352(Hill等,Yeast,1986,2,163)中,从而得到CMCase表面表达载体。

参照图13所示的是使用STA1基因构建的表面表达系统示意图。如图所示,表面表达系统是由各种载体构建的,这些载体仅含有信号序列(STASS),含有信号序列和八肽序列(STASS-8),含有信号序列、八肽序列和苏氨酸/丝氨酸富集区(STASS-8-TS),含有信号序列和苏氨酸/丝氨酸富集区(STASS-TS),含有信号序列和α-凝集素(STASS-CMC-Agalc),含有信号序列、八肽序列和α-凝集素(STASS-8-CMC-Agalc),并以CMCase基因作为报告基因。通过PCR合成CMCase基因,用SmaI/PstI酶切并插入到表达载体中。得到的表达载体转化酿酒酵母L3262,然后在不含尿嘧啶的基础平板培养基上筛选具有表达载体的转化子。<6-2>表面锚定的CMCase的活性测定

将实施例6-1中筛选的转化子在YPD培养基中30℃培养48小时,测定CMCase活性。通过pNPC(p-苯硝基β-D-cellobiocide)法(Deschpande等,Anal.Biochem.,1984,138,481)测定CMCase活性。每个转化子的培养液通过离心分为上清和整个细胞级分。细胞用PBS洗涤3次并重悬在PBS中。悬浮液与2.5mM pNPC溶液混合,在37℃温育1小时,然后加入等体积2%碳酸钠(Na2CO3)终止反应。在410nm测定吸收值,结果如下表4所示。在表4中,CMCase酶活性定义为U,1U定义为在1分钟释放1μmole pNP的酶活性量。

                         表4

                 酿酒酵母中的CMCase活性

                              ss-    ss8-   ssts-   ss8ts-

                              CMC    CMC    CMC     CMC

      上清中的活性(U/l)       339    389    189     145

    整个细胞级分中的活件(U/l) 13.6   14.5   12      128

      整个细胞级分中的活性

                              3.9    3.6    37      47

      上清中的活性(%)

如表4所示,当仅使用信号序列时(SS-CMC),大部分CMCase分泌到胞外,不锚定在细胞壁上。相反,当使用直接与信号序列相连的苏氨酸/丝氨酸富集区(SS-TS-CMC)或通过八肽序列与信号序列相连的苏氨酸/丝氨酸富集区(SS-8-TS-CMC)时,在上清中检测到的酶活性低,而在整个细胞级分中高。

平板活性测定证实了同样的结果,如图14。仅有信号序列时(SS),由于大部分表达的酶分泌到胞外,从而在菌落周围形成很大的圈。相反,当苏氨酸/丝氨酸富集区存在时,在菌落周围形成小的圈,这证明苏氨酸/丝氨酸富集区阻碍了酶的分泌。

为了确定CMCase转移到细胞表面,通过与多形汉逊酵母中同样的方式对CMCase进行了FACS分析。结果如图15。如FACS图表所观察到的,在含有苏氨酸/丝氨酸富集区的细胞中可检测到荧光,表明CMCase存在于细胞表面。同时,在CMCase与α-凝集素羧基末端融合后,通过测定CMCase活性来检测表面锚定能力。但在这种情况下,不比仅使用苏氨酸/丝氨酸富集区时检测到的CMCase活性高。因此,鉴定出STA1基因中单独的苏氨酸/丝氨酸富集区可作为良好的表面锚定介体。

因此,当用于构建表面表达系统时,葡糖淀粉酶或它的结构域可融合在靶蛋白的氨基末端。从而,这些系统可克服由于介体融合在羧基末端而造成靶蛋白的羧基末端活性结构域受到防碍时引起的各种问题。因此,此处描述的介体可根据靶蛋白的性质开发各种能够表达各种类型的靶蛋白的表面表达系统,。

               工业适用性

如上所述,来源于工业上有用的甲醇营养性酵母多形汉逊酵母的表面表达蛋白可用于高效构建表面表达系统及开发生物催化剂应用系统。因为本发明所建立的表面表达系统可生产工业上有用的生物材料,如酶、抗原、抗体等,而且可提供工业生产工具如固定化生物催化剂,因此它们在各种工业,包括医药工业、食品工业和化学和生化工业等具有无数的应用价值。

本发明已用举例说明的方式进行了描述,应理解所用的术语在本质上是描述性的而不是限制性的。根据上述技术,可对本发明进行许多改进和变化。因此,应理解,在所附的权利要求范围中,本发明可以以除了具体描述的方式外的其它方式实施。

                   生物材料国际保藏

保藏人韩国生命工学研究院地址韩国大田保藏日2000年7月11日在该国际保藏机构保藏。保藏号KCTC 0824BP微生物分类命名大肠杆菌DH5@/HpTIP1国际保藏单位名称韩国典型培养物保藏中心

                   生物材料国际保藏

保藏人韩国生命工学研究院地址韩国大田保藏日2000年7月11日在该国际保藏机构保藏。保藏号KCTC 0825BP微生物分类命名大肠杆菌DH5@/HpSED1国际保藏单位名称韩国典型培养物保藏中心

                    生物材料国际保藏

保藏人韩国生命工学研究院地址韩国大田保藏日2000年7月11日在该国际保藏机构保藏。保藏号KCTC 0826BP微生物分类命名大肠杆菌DH5@/HpCWP1国际保藏单位名称韩国典型培养物保藏中心

                    生物材料国际保藏

保藏人韩国生命工学研究院地址韩国大田保藏日2000年7月11日在该国际保藏机构保藏。保藏号KCTC 0827BP微生物分类命名大肠杆菌DH5@/HpPIR2国际保藏单位名称韩国典型培养物保藏中心

                   生物材料国际保藏

保藏人韩国生命工学研究院地址韩国大田保藏日2000年7月11日在该国际保藏机构保藏。保藏号KCTC 0828P微生物分类命名大肠杆菌DH5@/HpGAS1国际保藏单位名称韩国典型培养物保藏中心

                   序  列  表

                    Pc0300-1序列表<110>韩国生命工学研究院<120>来源于酵母的新型细胞壁锚定蛋白及其基因和细胞表面表达系统<130>0FPO-07-20<160>15<170>KopatentIn 1.55<210>1<211>396<212>DNA<213>多形汉逊酵母<400>1atgcaattca gaactttggc tccacttgct ttggcttccg ctgctttcgc tgcttactct     60aacggcaccg tctccaccat tacttacgag accaccgttt ctgaggtcgt tactgctttg    120actacctact gcccagaagc cacctctatc gtcaccaacg gaaagaccta cactgtcact    180ggtgccacca ccttgaccat caccgactgc ccatgcacta agaagaaggt catcaccacc    240accactgtca ccaccatccc agctaaatct tccactgctg cttcctctgt tgctgcttcc    300tctgctccag tcatctccac tgccgagaac gctggtgcta aggttggtgc tgctggtttg    360gctgcccttg ccggtgctgc tgctttcttg ctctaa                              396<210>2<211>9<212>PRT<213>多形汉逊酵母<400>2Ser Gln Ile Gly Asp Gly Gln Ile Gln  1               5<210>3<211>13<212>PRT<213>多形汉逊酵母<400>3

                         Pc0300-1Gly Val Val Xaa Gln Ile Gly Asp Gly Gln Ile Gln Ala  1               5                  10<210>4<211>1014<212>DNA<213>多形汉逊酵母<400>4atgaagttca catcctcgct cgctgccatc agtttggcct ccaacgcatt cgctgcctat      60gttggctcta cctactggac taccatgacc ccatcctaca ccctggatgg tgctctgact     120agctactcgg ctactttcgg tattgctgtt gaaccactag agaccagttc ctcggtttcc     180gcctctctca acgttgagaa aagacaggtt gtttctcaaa ttggtgatgg tcaaattcag     240gctaccacga acaccgagaa agaaacctcc aaatcctcta cttctactgc cgcagctgtt     300gtgtcgcaaa tcacggacgg tcaaatccaa gccaccactg ccaccaccac ctcttcttca     360tcgagctcca agaagactgc cgcagctgtt gtcactcaaa ttggsgacgg tcaaatccaa     420gctaccacct ccacttcttc caagagcact gctgctgacg ttgttaccca aatcggcgat     480ggtcagatcc aagccaccag caagtcgtca tccacttcca ctgctgctga cgttgtgtct     540cagatcactg acggccagat ccaagctacc accagcacca aggcctcttc tgccaccacc     600agcggtgtga tctcccagat ctccgacggt caaatccagg catcttccac cgcttcttcg     660aagacctcca ccgcttcctc atccactgca actggagact acgtcacctc tgtgtcctgt     720aagaaggagg gtgctctggc catgactttg aaggacggta tcctgtatga ctcggaggga     780agaattggct ctatcgttgc taacagacaa ttccaattcg acggtcctcc accacaagct     840ggtgccatct atgctgacgg atggtccatt tccccagacg gatacctggc cattggtaac     900gacaccatat tctaccagtg tctgtcgggc accttctaca acttgtacga ccagtcgatt     960ggaggccaat gtaataaggt ccacttgaag gctgtcgagt tggtcgactg ttag          1014<210>5<211>1614<212>DNA<213>多形汉逊酵母

                        Pc0300-1<400>5atgcagctaa aatctatcct ctcgctcacg ggcctgctct ccaccacgct ggctctgcct       60accattgacg tggtgtccaa caagttcttc tattcgaaca acgggtccca attctacgtc      120aaaggtgtcg cgtaccagaa gaacacagaa aatgctaccg acgacgcaac ttatgtcgat      180ccgctcgctg acgaagattc gtgcaagaga gacatcccgt acttacagaa ccttggcatc      240aatgttatcc gggtgtatgc agtcgatgcc tccaaggacc acgacggatg catgtctctg      300ctcgaggatg ctggaatcta tgtgatctcc gatctttcga ccccaaacga gtcgatcgag      360accaccagtc cgtcctggac tgtcgatctg tacaacagat atgccacggt gatcgatatg      420ttccaaagct acgacaacgt gctcggcttt tttgcaggta atgaggttat caccaacaag      480accaacagtg acgctgctcc gttcgtcaag gccgctatca gagacatgaa gcagtacatg      540aaggacaaca actacagaga cattccgatc ggctactcgg ccaacgacga tgccaacacc      600agagttccgt ctgcggacta cttctcctgt ggaaacgacg acgtcaaggc agacttttac      660ggtatcaaca tgtacgagtg gtgtggaaat gccacgttct caagctccgg ctacgaggcg      720agaacgaagg aattttccaa tttgacgatc ccgatctttt tctcagagta cggttgcaac      780agcgtcaagc cacgtgagtt cacagaggtg caagctatct actccgatga aatgacagac      840gtttggtccg gcggtatcgt gtacatgtac ttccaggaag agaacgacta cggcctcgtt      900tccatcaaag acaatgctgt ctcgactttg ggcgactaca ctaacctcaa gagtgagctc      960gcgaaaatta gccctaccac ggcgtctgcc tctgctgcat cgcagtctgc cacagaattg     1020agttgtccaa ccagccagag caactggaag gcatccacag accttcctcc aactccaaat     1080gaggccgtgt gcgactgtct tgagtcgtcg ctcaaatgtg tcgtctccga cagcgtcgac     1140tccgacgact acggcgactt cttcggtatc gtctgcgatc tcaccgactg ttctcaaatt     1200tccaccagcg gcagtaacgg ctcctacggc gcatactcgt actgctcagc caaggacaag     1260ctttcgttcc tgctcaacaa atactacgag gaacaggact ccaactcgtc ggcttgcgac     1320ttcagcggct ctgcctcgct caataccaac ggctcgacag catccagctg ctcttcctta     1380ttgagctctg cctcggcctc tccatcggcc actggctcct caaactcctc ccctgcatct     1440

                       Pc0300-1ggctccggct ctagttccgg ctccagctcc ggctctggct ccagcagctc cagctcctcg    1500tcgtcgtctg ccggcgcggg tgtcaacgct gtcccattgt cggccccaca attgggcctg    1560ctctccttgt tctccacctt cttcttgggc ggactctcct acatctttat ctag          1614<210>6<211>852<212>DNA<213>多形汉逊酵母<400>6atgctctcgt ttaaaactct ttgcgctaca gctttcgctc ttactgccgt ttctgctgcc     60cctcaggctg acccatttgc ttttgctaat gcaatcggac ttccagttgc agcagaggca    120acttacgctt gtcatgcctc ttgtggttac gctattttag ctgctcgtca atgttcccca    180actggctccg aggacgctaa ctacaactcc acctgtctgt gtgcttccga cagtcaattc    240ttgtcctacg tcccagcctg ccttgactgt ggatggtgtc tgtggagtga ctacggatcc    300ttcttgacct ctgctttggc tgaatgtcac accaacaccc agccaactgg tactacttgt    360gccccaagca ctgctcaagc cgctgctacc tcttctgttg ctgctgcagc cagtgaagtc    420tcttcttcgt cggctgctgc ttcttcaact caggctgccg ctgctgcttc cacttctgct    480gctgcctcga ctgaggccac tacttccgct gctgctgctg ctacttcttc ctctgaggct    540gctagctcat ctgcccatgt tcatagccat gctgctgagt ccacctccgc tgttgagtcc    600acttccgctg ctcactccca tgctgctgag tcgagctccg ctgctcattc ccatgctgtc    660gaatccagct ccgctgctca tgttcattcc catgccgccg aatccagctc cgctgctcac    720agccacgctg ctggatctag ctccgctgca tccaactcta gtggacatat ctccactttc    780tcgggagctg gtgctaaact cgccgttgga gccggagccg gtattgtcgg tcttgcagct    840ctgcttatgt aa                                                        852<210>7<211>246<212>DNA<213>多形汉逊酵母

                        Pc0300-1<400>7atgtcctggc ttacactatt ggtgacgcca gcggttctgc tgcctttcta ctctgctctg     60tacgagaaaa ctgctgcagc tcagtcttct cagtactcta gcagccctgc agctgtctct    120tcaagaagct ctgcagctgc ctcttctagt gccaaaattg ctacttacga gggtgctgct    180gccgagaatg ttgctaaggt cggcatgggt gctttgctgt cgggaatggc cgttcttctt    240atgtaa                                                               246<210>8<211>1119<212>DNA<213>多形汉逊酵母<220><221>misc_feature<222>(43)..(294)<223>半胱氨酸基序<220><221>misc_feature<222>(760)..(873)<223>跨膜结构域<400>8atgagattcg gtgtcgtatt cgtgatcacc caagtcctag cagactttac gtatttaggt     60tgctacagct cggatgccat ttccggcttg accaagaagg actcgtacac atggcagagc    120tccagccatt gcacggagca gtgttcggga cacgcagttg ctgcattgat caacggccag    180gactgttatt gcggagacga cgtaccttcg gacaaccccg acggctcgtg cacaacgtcc    240tgcactggtt atcccatgga gaagtgtggt ggtagcgact cttattccgt ctatgttgac    300gagtctgagg aaaacgacga cgacagttcg tcggcgcagt cgtcgcactc gtccacagac    360gatgccactt ccacctcctc cacctccacc acctcctcct ccagttccag tctgtccagc    420tcctcaacat cgtcttcctc caagcaaagt tcctccccac agagctccac catgtcttcc    480acagactcgt ctccaacgtc ctcaagtctg tccgctagct cgactacaac aagctcgatt    540tcgtcctttt ctttctccca gagctcgtcg tcgtcttcaa ccacctcttc gtccacaccc    600

                      Pc0300-1tcatccgaat cagtgcggat aactacgtcc gtttcacctg gaaacatgca gacctcgatc     660atctacatca cgcagtccgt cgctacagcc acctcggcgt cggctgccgc gtcgtcctca     720agtgcctcga gcgccaacaa caggtccacg gggctcagca agggcgcgaa ggccggaatc     780gctgtcgggt cgatcctcgg agctttgctg ctcttgggac tcctgctcct gttcctgttt     840tggcgcagac gccagcgcga cgacagagac aaccttagcg aaaagcgcgc atccagcatt     900ttggcgtcgt cttcccgtca gcctccagct ggctcgcgag gtgcggcagc aggaatcgga     960gccaaccgca ttcggattca tgtccgagga cgacagactg gacatgccgg gcacgtcgag    1020acggttcagc gacggttcgt tgccgggacg ctgccgctgg agccgcggtg ccgccgaata    1080gtgcccgaca ggaggtttgc gggtggtaaa cccagatct                           1119<210>9<211>2337<212>DNA<213>多形汉逊酵母<220><221>misc_feature<222>(1)..(96)<223>分泌信号序列<220><221>misc_feature<222>(97)..(120)<223>八肽<220><221>misc_feature<222>(121)..(882)<223>丝氨酸/苏氨酸富积结构域<400>9atggtaggcc tcaaaaatcc atatacgcac actatgcaaa gaccatttct actcgcttat     60ttggtccttt cgcttctatt taactcagct ttgggttttc caactgcact agttcctaga    120ggatcctcct ctagcaacat cacttcctcc ggtccatctt caactccatt cagctctgct    180actgaaagct tttctactgg cactactgtc actccatcat catccaaata ccctggcagt    240

                             Pc0300-1aaaacagaaa cttctgtttc ttctacaacc gaaactacca ttgttccaac tacaactacg      300acttctgtca taacaccatc aacaaccact attaccacta cggtttgctc tacaggaaca      360aactctgccg gtgaaactac ttctggatgc tctccaaaga ccattacaac tactgttcca      420tgttcaacca gtccaagcga aaccgcatcg gaatcaacaa ccacttcacc taccacacct      480gtaactacag ttgtctcaac caccgtcgtt actactgagt attctactag tacaaaacaa      540ggtggtgaaa ttacaactac atttgtcacc aaaaacattc caaccactta cctaactaca      600attgctccaa cttcatcagt cactacggtt accaatttca ccccaaccac tattactact      660acggtttgct ctacaggaac aaactctgcc ggtgaaacta cctctggatg ctctccaaag      720actgtcacaa caactgttcc ttgttcaact ggtactggcg aatacactac tgaagctacc      780gcccctgtta caacagctgt cacaaccacc gttgttacca ctgaatcctc tacgggtact      840aactccgctg gtaagacgac aactagttac acaacaaagt ctgtaccaac cacctatgta      900tttgactttg gcaagggcat tctcgatcaa agctgcggcg gtgtattttc aaacaacggc      960tcttcgcaag tgcagctgcg ggatgtagtc ttgatgaatg ggacagtggt atacgattca     1020aacggcgctt gggacagtag tgcgctggag gagtggctcc agcgacagaa aaaagtttcc     1080atcgaaagaa tatttgaaaa tattgggccc agcgccgtgt atccgtctat tttgcctggg     1140gtcgtgattg cgtcaccatc gcaaacgcat ccagactact tctaccaatg gataagggac     1200agcgcgttga cgataaacag tattgtctct cattctgcgg acccggcaat agagacgtta     1260ttgcagtacc tgaacgtttc attccacttg caaagaacca acaacacatt gggcgctggc     1320attggttaca ctaacgatac agtggctttg ggagacccta agtggaacgt cgacaacacg     1380gctttcacgg aaccttgggg tcgtcctcaa aacgatggcc ctgctcttcg aagcattgcc     1440atcttaaaaa tcatcgacta catcaagcaa tctggcactg atctgggggc caagtaccca     1500ttccagtcca ccgcagatat ctttgatgat attgtacgtt gggacctgag gttcattatt     1560gaccactgga attcttccgg atttgatcta tgggaggaag tcaatggcat gcatttcttt     1620actttactgg tacaactgtc tgcagtggac aggtcgctgt cgtattttaa cgcctcagaa     1680cggtcgtctc cctttgttga agaattgcgt cagacacgcc gggacatctc caagttttta     1740

                              Pc0300-1gtggaccctg cgaatgggtt tatcaacggc aagtacaatt atattgttga gacacccatg    1800attgccgaca cattgagatc cggactggac atatccactt tattagctgc gaacaccgtc    1860cacgatgcgc catctgcttc ccatcttccg ttcgatatca atgaccctgc cgtcctgaac    1920acgttgcacc atttgatgtt gcacatgcgt tcgatatacc ccatcaacga tagctccaaa    1980aatgcaacgg gtattgccct gggccggtat cctgaggacg tatatgatgg atatggcgtt    2040ggcgagggaa atccctgggt cctggccacg tgtgccgctt caacaacgct ttatcagctc    2100atttacagac acatctctga gcagcatgac ttggttgtcc caatgaacaa cgattgttcg    2160aacgcatttt ggagcgagct ggtattctcc aacctcacga ctttgggaaa tgacgaaggc    2220tatttgattt tggagttcaa tacacctgcc ttcaatcaaa ccatacaaaa aatcttccaa    2280ctagctgatt cattcttggt caagctgaaa gccacgtggg aacagacggg gaactaa       2337<210>10<211>8<212>PRT<213>Saccharomyces diastaticus<400>10Phe Pro Thr Ala Leu Val Pro Arg  1               5  <210>11<211>131<212>PRT<213>多形汉逊酵母<400>11Met Gln Phe Arg Thr Leu Ala Pro Leu Ala Leu Ala Ser Ala Ala Phe  1               5                  10                  15Ala Ala Tyr Ser Asn Gly Thr Val Ser Thr Ile Thr Tyr Glu Thr Thr

         20                  25                  30Val Ser Glu Val Val Thr Ala Leu Thr Thr Tyr Cys Pro Glu Ala Thr

     35                  40                  45Ser Ile Val Thr Asn Gly Lys Thr Tyr Thr Val Thr Gly Ala Thr Thr

 50                  55                  60

                             Pc0300-1Leu Thr Ile Thr Asp Cys Pro Cys Thr Lys Lys Lys Val Ile Thr Thr 65                  70              75                      80Thr Thr Val Thr Thr Ile Pro Ala Lys Ser Ser Thr Ala Ala Ser Ser

         85                      90                  95Val Ala Ala Ser Ser Ala Pro Val Ile Ser Thr Ala Glu Asn Ala Gly

        100                 105                 110Ala Lys Val Gly Ala Ala Gly Leu Ala Ala Leu Ala Gly Ala Ala Ala

    115                 120                 125Phe Leu Leu

130<210>12<211>337<212>PRT<213>多形汉逊酵母<400>12Met Lys Phe Thr Ser Ser Leu Ala Ala Ile Ser Leu Ala Ser Asn Ala  1               5                  10                  15Phe Ala Ala Tyr Val Gly Ser Thr Tyr Trp Thr Thr Met Thr Pro Ser

         20                  25                  30Tyr Thr Leu Asp Gly Ala Leu Thr Ser Tyr Ser Ala Thr Phe Gly Ile

     35                  40                  45Ala Val Glu Pro Leu Glu Thr Ser Ser Ser Val Ser Ala Ser Leu Asn

 50                  55                  60Val Glu Lys Arg Gln Val Val Ser Gln Ile Gly Asp Gly Gln Ile Gln 65                  70                  75                  80Ala Thr Thr Asn Thr Glu Lys Glu Thr Ser Lys Ser Ser Thr Ser Thr

             85                  90                  95Ala Ala Ala Val Val Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala Thr

        100                 105                 110Thr Ala Thr Thr Thr Ser Ser Ser Ser Ser Ser Lys Lys Thr Ala Ala

    115                 120                 125Ala Val Val Thr Gln Ile Gly Asp Gly Gln Ile Gln Ala Thr Thr Ser

130                 135                 140

                         Pc0300-1Thr Ser Ser Lys Ser Thr Ala Ala Asp Val Val Thr Gln Ile Gly Asp145                 150                 155                 160Gly Gln Ile Gln Ala Thr Ser Lys Ser Ser Ser Thr Ser Thr Ala Ala

            165                 170                 175Asp Val Val Ser Gln Ile Thr Asp Gly Gln Ile Gln Ala Thr Thr Ser

        180                 185                 190Thr Lys Ala Ser Ser Ala Thr Thr Ser Gly Val Ile Ser Gln Ile Ser

    195                 200                 205Asp Gly Gln Ile Gln Ala Ser Ser Thr Ala Ser Ser Lys Thr Ser Thr

210                 215                 220Ala Ser Ser Ser Thr Ala Thr Gly Asp Tyr Val Thr Ser Val Ser Cys225                 230                 235                 240Lys Lys Glu Gly Ala Leu Ala Met Thr Leu Lys Asp Gly Ile Leu Tyr

            245                 250                 255Asp Ser Glu Gly Arg Ile Gly Ser Ile Val Ala Asn Arg Gln Phe Gln

        260                 265                 270Phe Asp Gly Pro Pro Pro Gln Ala Gly Ala Ile Tyr Ala Asp Gly Trp

    275                 280                 285Ser Ile Ser Pro Asp Gly Tyr Leu Ala Ile Gly Asn Asp Thr Ile Phe

290                 295                 300Tyr Gln Cys Leu Ser Gly Thr Phe Tyr Asn Leu Tyr Asp Gln Ser Ile305                 310                 315                 320Gly Gly Gln Cys Asn Lys Val His Leu Lys Ala Val Glu Leu Val Asp

            325                 330                 335Cys<210>13<211>283<212>PRT<213>多形汉逊酵母<400>13    Met Leu Ser Phe Lys Thr Leu Cys Ala Thr Ala Phe Ala Leu Thr Ala  1               5                  10                  15

                        Pc0300-1Val Ser Ala Ala Pro Gln Ala Asp Pro Phe Ala Phe Ala Asn Ala Ile

         20                  25                  30Gly Leu Pro Val Ala Ala Glu Ala Thr Tyr Ala Cys His Ala Ser Cys

     35                  40                  45Gly Tyr Ala Ile Leu Ala Ala Arg Gln Cys Ser Pro Thr Gly Ser Glu

 50                  55                  60Asp Ala Asn Tyr Asn Ser Thr Cys Leu Cys Ala Ser Asp Ser Gln Phe 65                  70                  75                  80Leu Ser Tyr Val Pro Ala Cys Leu Asp Cys Gly Trp Cys Leu Trp Ser

             85                  90                  95Asp Tyr Gly Ser Phe Leu Thr Ser Ala Leu Ala Glu Cys His Thr Asn

        100                 105                 110Thr Gln Pro Thr Gly Thr Thr Cys Ala Pro Ser Thr Ala Gln Ala Ala

    115                 120                 125Ala Thr Ser Ser Val Ala Ala Ala Ala Ser Glu Val Ser Ser Ser Ser

130                 135                 140Ala Ala Ala Ser Ser Thr Gln Ala Ala Ala Ala Ala Ser Thr Ser Ala145                 150                 155                 160Ala Ala Ser Thr Glu Ala Thr Thr Ser Ala Ala Ala Ala Ala Thr Ser

            165                 170                 175Ser Ser Glu Ala Ala Ser Ser Ser Ala His Val His Ser His Ala Ala

        180                 185                 190Glu Ser Thr Ser Ala Val Glu Ser Thr Ser Ala Ala His Ser His Ala

    195                 200                 205Ala Glu Ser Ser Ser Ala Ala His Ser His Ala Val Glu Ser Ser Ser

210                 215                 220Ala Ala His Val His Ser His Ala Ala Glu Ser Ser Ser Ala Ala His225                 230                 235                 240Ser His Ala Ala Gly Ser Ser Ser Ala Ala Ser Asn Ser Ser Gly His

            245                 250                 255Ile Ser Thr Phe Ser Gly Ala Gly Ala Lys Leu Ala Val Gly Ala Gly

        260                 265                 270

                          Pc0300-1Ala Gly Ile Val Gly Leu Ala Ala Leu Leu Met

    275                 280<210>14<211>537<212>PRT<213>多形汉逊酵母<400>14Met Gln Leu Lys Ser Ile Leu Ser Leu Thr Gly Leu Leu Ser Thr Thr  1               5                  10                  15  Leu Ala Leu Pro Thr Ile Asp Val Val Ser Asn Lys Phe Phe Tyr Ser

         20                  25                  30Asn Asn Gly Ser Gln Phe Tyr Val Lys Gly Val Ala Tyr Gln Lys Asn

     35                  40                  45Thr Glu Asn Ala Thr Asp Asp Ala Thr Tyr Val Asp Pro Leu Ala Asp

 50                  55                  60Glu Asp Ser Cys Lys Arg Asp Ile Pro Tyr Leu Gln Asn Leu Gly Ile 65                  70                  75                  80Asn Val Ile Arg Val Tyr Ala Val Asp Ala Ser Lys Asp His Asp Gly

             85                  90                  95Cys Met Ser Leu Leu Glu Asp Ala Gly Ile Tyr Val Ile Ser Asp Leu

        100                 105                 110Ser Thr Pro Asn Glu Ser Ile Glu Thr Thr Ser Pro Ser Trp Thr Val

    115                 120                 125Asp Leu Tyr Asn Arg Tyr Ala Thr Val Ile Asp Met Phe Gln Ser Tyr

130                 135                 140Asp Asn Val Leu Gly Phe Phe Ala Gly Asn Glu Val Ile Thr Asn Lys145                 150                 155                 160Thr Asn Ser Asp Ala Ala Pro Phe Val Lys Ala Ala Ile Arg Asp Met

            165                 170                 175Lys Gln Tyr Met Lys Asp Asn Asn Tyr Arg Asp Ile Pro Ile Gly Tyr

        180                 185                 190Ser Ala Asn Asp Asp Ala Asn Thr Arg Val Pro Ser Ala Asp Tyr Phe

    195                 200                 205

                         Pc0300-1Ser Cys Gly Asn Asp Asp Val Lys Ala Asp Phe Tyr Gly Ile Asn Met

210                 215                 220Tyr Glu Trp Cys Gly Asn Ala Thr Phe Ser Ser Ser Gly Tyr Glu Ala225                 230                 235                 240Arg Thr Lys Glu Phe Ser Asn Leu Thr Ile Pro Ile Phe Phe Ser Glu

            245                 250                 255Tyr Gly Cys Asn Ser Val Lys Pro Arg Glu Phe Thr Glu Val Gln Ala

        260                 265                 270Ile Tyr Ser Asp Glu Met Thr Asp Val Trp Ser Gly Gly Ile Val Tyr

    275                 280                 285Met Tyr Phe Gln Glu Glu Asn Asp Tyr Gly Leu Val Ser Ile Lys Asp

290                 295                 300    Asn Ala Val Ser Thr Leu Gly Asp Tyr Thr Asn Leu Lys Ser Glu Leu305                 310                 315                 320Ala Lys Ile Ser Pro Thr Thr Ala Ser Ala Ser Ala Ala Ser Gln Ser

            325                 330                 335Ala Thr Glu Leu Ser Cys Pro Thr Ser Gln Ser Asn Trp Lys Ala Ser

        340                 345                 350Thr Asp Leu Pro Pro Thr Pro Asn Glu Ala Val Cys Asp Cys Leu Glu

    355                 360                 365Ser Ser Leu Lys Cys Val Val Ser Asp Ser Val Asp Ser Asp Asp Tyr

370                 375                 380Gly Asp Phe Phe Gly Ile Val Cys Asp Leu Thr Asp Cys Ser Gln Ile385                 390                 395                 400Ser Thr Ser Gly Ser Asn Gly Ser Tyr Gly Ala Tyr Ser Tyr Cys Ser

            405                 410                 415Ala Lys Asp Lys Leu Ser Phe Leu Leu Asn Lys Tyr Tyr Glu Glu Gln

        420                 425                 430Asp Ser Asn Ser Ser Ala Cys Asp Phe Ser Gly Ser Ala Ser Leu Asn

    435                 440                 445Thr Asn Gly Ser Thr Ala Ser Ser Cys Ser Ser Leu Leu Ser Ser Ala

450                 455                 460Ser Ala Ser Pro Ser Ala Thr Gly Ser Ser Asn Ser Ser Pro Ala Ser

                             Pc0300-1465                 470                 475                 480Gly Ser Gly Ser Ser Ser Gly Ser Ser Ser Gly Ser Gly Ser Ser Ser

            485                 490                 495Ser Ser Ser Ser Ser Ser Ser Ala Gly Ala Gly Val Asn Ala Val Pro

        500                 505                 510Leu Ser Ala Pro Gln Leu Gly Leu Leu Ser Leu Phe Ser Thr Phe Phe

    515                 520                 525Leu Gly Gly Leu Ser Tyr Ile Phe Ile

530                 535<210>15<211>81<212>PRT<213>多形汉逊酵母<400>15Met Ser Trp Leu Thr Leu Leu Val Thr Pro Ala Val Leu Leu Pro Phe  1               5                  10                  15Tyr Ser Ala Leu Tyr Glu Lys Thr Ala Ala Ala Gln Ser Ser Gln Tyr

         20                  25                  30Ser Ser Ser Pro Ala Ala Val Ser Ser Arg Ser Ser Ala Ala Ala Ser

     35                  40                  45Ser Ser Ala Lys Ile Ala Thr Tyr Glu Gly Ala Ala Ala Glu Asn Val

 50                  55                  60Ala Lys Val Gly Met Gly Ala Leu Leu Ser Gly Met Ala Val Leu Leu 65                  70                  75                  80Met1

权利要求书

(按照条约第19条的修改)

1.来源于多形汉逊酵母的由SEQ.ID.NO:1表示的新型细胞壁蛋白基因HpSED1及其同系物。

2.一种新型的由权利要求1的HpSED1基因编码的由SEQ.ID.NO:11代表的细胞壁蛋白HpSed1p及其同源体。

3.由包含权利要求1的HpSED1基因的4kb EcoRI片段的重组载体转化的大肠杆菌转化体(保藏号KCTC 0825BP)。

4.来源于多形汉逊酵母的由SEQ.ID.NO:4代表的新型细胞壁蛋白基因HpPIR2及其同系物。

5.一种新型的由权利要求4的HpPIR2基因编码的由SEQ.ID.NO:12表示的细胞壁蛋白HpPir2p及其同源体。

6.由包含权利要求4的HpPIR2基因的5.5kb SalI片段的重组载体转化的大肠杆菌转化体(保藏号KCTC 0827BP)。

7.来源于多形汉逊酵母的由SEQ.ID.NO:5代表的新型细胞壁蛋白基因HpGAS1及其同系物。

8.一种新型的由权利要求7的HpGAS1基因编码的由SEQ.ID.NO:14代表的细胞壁蛋白HpGas1p及其同源体。

9.由包含权利要求7的HpGAS1基因的3kb PstI片段的重组载体转化的大肠杆菌转化体(保藏号KCTC 0828BP)。

10.来源于多形汉逊酵母的由SEQ.ID.NO:6表示的新型细胞壁蛋白基因HpTIP1及其同系物。

11.一种新型的由权利要求10的HpTIP1基因编码的由SEQ.ID.NO:13表示的细胞壁蛋白HpTip1p及其同源体。

12.由包含权利要求10的HpTIP1基因的3.5kb XbaI片段的重组载体转化的大肠杆菌转化体(保藏号KCTC 0824BP)。

13.来源于多形汉逊酵母的由SEQ.ID.NO:7代表的新型细胞壁蛋白基因HpCWP1及其同系物。

14.一种新型的由权利要求13的HpCWP1基因编码的由SEQ.ID.NO:15代表的细胞壁蛋白HpCwp1p及其同源体。

15.由包含权利要求13的HpCWP1基因的6kb SalI片段的重组载体转化的大肠杆菌转化体(保藏号KCTC 0826BP)。

16.在细胞表面表达外源多肽或蛋白的表面表达系统,其中由权利要求1、4、7、10和13的DNA序列,其同系物或部分的片段所编码的多肽或其部分的片段被用作表达介体,将外源多肽或蛋白定位在细胞表面。

17.在细胞表面表达外源多肽或蛋白的表面表达系统,其中由来源于Saccharomyces diastaticus的含有由SEQ.ID.NO:9代表的碱基序列STA1或其部分片段的分离的DNA所编码的多肽或其部分片段被用作表达介体,将外源多肽或蛋白定位在细胞表面。

18.在细胞表面表达外源多肽或蛋白的表面表达系统,其中由来源于多形汉逊酵母的含有SEQ.ID.NO:8所代表的碱基序列的HpWSC1所编码的多肽或其部分的片段,或由来源于酿酒酵母的碱基序列WSC1所编码的多肽或其部分的片段被用作表达介体,将外源多肽或蛋白定位在细胞表面。

19.权利要求16到18中的任何一项的表面表达系统,其中的细胞是选自酵母种和霉菌种的种,酵母种包括念珠菌属种,杀德氏酵母属种,汉逊酵母属种,克鲁维酵母菌属种,毕赤氏酵母属种,裂殖酵母属种,Yarrowia spp.,Saccharomyces spp.;霉菌种包括曲霉属种,青霉属种,和根霉属种。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号