首页> 中国专利> 骆驼凝乳酶原突变蛋白及其编码基因和应用

骆驼凝乳酶原突变蛋白及其编码基因和应用

摘要

本发明公开了骆驼凝乳酶原突变蛋白及其编码基因和应用。所述骆驼凝乳酶原突变蛋白的氨基酸序列为SEQ ID No.1‑4所示,其编码基因的核苷酸序列分别为SEQ ID No.5‑8所示。本发明在骆驼凝乳酶原的自切割前导肽区域设计并分别突变四个氨基酸位点产生四个N‑糖基化保守序列,分别将其进行分泌表达时,突变点的区域分别形成一个N‑糖基化保守位点,使重组骆驼凝乳酶原的分泌表达水平显著提高,同时这些位点突变并不影响前导肽的自切割活性,且突变位点不在成熟蛋白上,因此不影响凝乳酶的凝乳活性。本发明骆驼凝乳酶原突变蛋白编码基因在毕赤酵母菌株中的表达量显著提升,在无需改变发酵生产工艺的条件下有效降低生产成本。

著录项

  • 公开/公告号CN113801867A

    专利类型发明专利

  • 公开/公告日2021-12-17

    原文格式PDF

  • 申请/专利权人 中国农业科学院生物技术研究所;

    申请/专利号CN202111365704.5

  • 申请日2021-11-18

  • 分类号C12N9/64(20060101);C12N15/57(20060101);C12N15/81(20060101);C12N1/19(20060101);C12R1/84(20060101);

  • 代理机构11598 北京思元知识产权代理事务所(普通合伙);

  • 代理人余光军

  • 地址 100081 北京市海淀区中关村南大街12号中国农科院生物所

  • 入库时间 2023-06-19 13:45:04

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-01-04

    实质审查的生效 IPC(主分类):C12N 9/64 专利申请号:2021113657045 申请日:20211118

    实质审查的生效

说明书

技术领域

本发明涉及凝乳酶突变蛋白及其应用,尤其涉及骆驼凝乳酶原突变蛋白及其编码基因,本发明进一步涉及骆驼凝乳酶原突变蛋白编码基因在制备重组骆驼凝乳酶中的应用,属于骆驼凝乳酶原突变蛋白及其应用领域。

背景技术

凝乳酶(EC3.4.23.4)属于天冬氨酸蛋白酶家族,主要来源于未断奶哺乳动物的胃黏膜细胞,能够特异性的切割K-酪蛋白中Phe

随着世界范围内凝乳酶消耗量的增加,通过宰杀幼年哺乳动物提取凝乳酶的传统方法已不能满足需求,因此,利用转基因的方法获得重组动物凝乳酶成为工业凝乳酶的重要来源。微生物表达的牛凝乳酶是商业化应用最为广泛的重组动物凝乳酶,其它重组表达的凝乳酶还包括水牛、山羊、羔羊和骆驼等来源的,这些凝乳酶的氨基酸序列具有一定的同源性,分子量在35kDa到45kDa之间,但他们的作用底物具有一定的特异性,例如牛凝乳酶不能作用于骆驼奶,但骆驼凝乳酶既可以作用于骆驼奶,也可以作用于牛奶。在哺乳动物体内,凝乳酶都以凝乳酶原的形式分泌到胃中,在胃液的酸性环境下,凝乳酶原通过自我剪切去掉N端的前导肽而自我激活,产生凝乳活性。研究表明,牛凝乳酶原在pH2.0条件下,能够自我剪切掉N-端42个氨基酸,生成成熟的凝乳酶。在重组表达的情况下,前导肽对于活性是必须的,重组表达的成熟凝乳酶没有活性。重组的凝乳酶原需经过体外酸性-中和处理后才能够完成自我剪切过程并转变成具凝乳活性的成熟凝乳酶。

Stefan等人的研究(Stefan R. Kappeler et.al. Characterization ofrecombinant camel chymosin reveals superior properties for the coagulation ofbovine and camel milk. Biochemical and Biophysical Research Communications.2006, 342:647-654.)表明,骆驼凝乳酶(camel chymosin)的凝乳活性比牛凝乳酶高70%,而且其非特异性的蛋白酶活性只有牛凝乳酶的20%,并具有更高的温度稳定性,在奶酪制作的后熟阶段更不易产生苦味。虽然骆驼凝乳酶原基因已经在黑曲霉中获得重组表达,但就工业生产中所要求的高密度发酵、高效的纯化方法来说,毕赤酵母更具优势,在工业生产发酵条件下,毕赤酵母菌体密度可达到每升发酵液130g干细胞以上,同时,相对于丝状真菌来说,它的胞外分泌蛋白少,更利于分泌型表达产物的提纯。本发明人前期已首次利用毕赤酵母重组表达骆驼凝乳酶(Nan Wang et.al. Expression and characterization of camelchymosin in Pichia pastoris. Protein Expression and Purification, 2015,111:75-81.),骆驼凝乳酶原蛋白全长365个氨基酸,N端42个氨基酸为前导肽序列,理论分子量为40kD,但由于在其142位和333位分别含有一个N-糖基化位点,在酵母重组表达时大部分会被糖基化,因此,在SDS-PAGE或Western-blot检测时,常出现两条目的条带,其中主带为糖基化的凝乳酶原,分子量为42~45kD,另外还可能出现一条较弱的条带,为未糖基化的蛋白,分子量为40kD。在中试发酵罐发酵条件下,酵母密码子优化的骆驼凝乳酶原基因在毕赤酵母中的表达量约为300mg/L,但就目前的分泌表达量来说,产业化的生产成本仍然较高,因此,在保持凝乳酶活性的前提下,提高凝乳酶的分泌表达量,降低生产成本,对于骆驼凝乳酶的产业化应用具有重要意义。

毕赤酵母表达系统作为应用的最为广泛的工业微生物,其兼具原核和真核表达系统的优点,包括:1)毕赤酵母为单细胞生物,遗传操作相对简单;2)能够对外源蛋白进行翻译后修饰,有利于外源蛋白形成生物活性形式;3)能够在廉价的无机盐培养基中高密度发酵,工业化生产成本低;4)细胞自身及分泌产物对人畜无害;5)毕赤酵母自身胞外分泌蛋白少,采用分泌表达策略利于后续蛋白纯化步骤。尽管毕赤酵母表达系统有诸多优势,但不同外源蛋白的分泌表达量差异很大,多数外源蛋白的表达水平不能满足工业生产的需求。国内外研究人员尝试了多种途径提高外源蛋白的表达量,例如对外源基因进行酵母偏爱密码子优化、提高外源基因整合入酵母基因组上的拷贝数、与高表达蛋白融合表达以及优化发酵条件等,虽然上述方法使某些外源蛋白的表达量得到了一定的改善,但这些表达策略似乎只针对某一特定的外源蛋白起作用,许多外源蛋白的表达量并不能通过上述方法获得提高。导致外源蛋白表达量巨大差异的原因始终没有明确而详细的阐述。这一问题也是限制毕赤酵母表达系统进一步扩大应用范围的主要瓶颈之一。几十年来,为突破这一瓶颈,研究者就有关外源蛋白在毕赤酵母中分泌表达的分子机制进行了大量研究。目前,主要认为限制外源蛋白分泌表达量的关键因素是位于内质网中的各种蛋白质质量监控系统,这些监控系统主要包括糖蛋白质量监控系统(N-glycan-dependent ER quality control system)、UPR(unfolded protein response)、ERAD(ER associated degradation)等。糖基化是真核生物蛋白质最常见的翻译后修饰形式,毕赤酵母糖基化修饰分为O-糖基化和N-糖基化,其中N-糖基化修饰是最主要的糖基化形式。对N-糖蛋白这一大类外源蛋白在毕赤酵母中的表达量进行研究具有广泛而重要的意义。真核生物的N-糖基化,糖链和蛋白质相连接的氨基酸序列是保守的,即糖链特异性的连接到序列Asn-Xxx-Ser/Thr(Xxx不能为Pro)的Asn上。近年来,越来越多的研究发现,不同的N-糖基化位置和数量对外源糖蛋白在毕赤酵母中的分泌水平具有显著的影响。尽管目前研究表明N-糖基化可能会对外源蛋白的表达量产生影响,但这种影响具体会产生何种效果并不能提前预知,其影响机制尚未阐明。

发明内容

本发明的目的之一是对野生型骆驼凝乳酶原进行突变获得在毕赤酵母中高效分泌表达的骆驼凝乳酶原突变蛋白及其编码基因;

本发明的目的之二是提供含有所述骆驼凝乳酶原突变蛋白编码基因的重组表达载体以及含有该重组表达载体的宿主细胞;

本发明的目的之三是将所述的骆驼凝乳酶原突变蛋白及其编码基因应用于制备重组骆驼凝乳酶。

本发明的上述目的主要是通过以下技术方案来实现的:

本发明的一方面是提供了骆驼凝乳酶原突变蛋白mchy,该突变蛋白是将野生型骆驼凝乳酶原的前导肽区域第34位丙氨酸突变为天冬酰胺后得到的突变蛋白,其氨基酸序列为SEQ ID No.1所示;或将野生型骆驼凝乳酶原的前导肽区域第35缬氨酸突变为天冬酰胺后得到的突变蛋白,其氨基酸序列为SEQ ID No.2所示;或将野生型骆驼凝乳酶原的前导肽区域第38位赖氨酸突变为天冬酰胺后得到的突变蛋白,其氨基酸序列为SEQ ID No.3所示;或将野生型骆驼凝乳酶原的前导肽区域第39位酪氨酸突变为天冬酰胺后得到的突变蛋白,其氨基酸序列为SEQ ID No.4所示;所得到的突变蛋白分别形成一个N-糖基化保守位点(该N-糖基化保守位点分别为34Aln-35Val-36Ser、35Aln-36Ser-37Ser、38Aln-39Tyr-40Ser或39Aln-40Ser -41Ser)。

本发明在骆驼凝乳酶原前导肽区域的不同位置(即,第11、26、34、35、38、39位)设计和添加N-糖基化位点,发现第34、35、38、39位的氨基酸糖基化可以显著地提高表达量,其中第34位糖基化的表达量最高,这些糖基化位点的引入不影响前导肽的自切割活性,且这些突变位点不在成熟蛋白上,因此对凝乳酶活性没有影响。

本发明的另一方面是提供了所述骆驼凝乳酶原突变蛋白mchy的编码基因,这些编码基因的核苷酸序列可以是将野生型骆驼凝乳酶原第34位的丙氨酸的密码子突变为天冬酰胺的密码子,或将野生型骆驼凝乳酶原第35缬氨酸的密码子突变为天冬酰胺的密码子,或将野生型骆驼凝乳酶原第38位赖氨酸的密码子突变为天冬酰胺的密码子,或将野生型骆驼凝乳酶原第39位酪氨酸的密码子突变为天冬酰胺的密码子,优选的,该天冬酰胺的密码子可以是AAC,或者是能够翻译成天冬酰胺的所有偏好性的密码子。

作为本发明一种优选的具体实施方案,氨基酸序列为SEQ ID No.1所示的骆驼凝乳酶原突变蛋白mchy的编码基因的核苷酸序列为SEQ ID No.5所示;氨基酸序列为SEQ IDNo.2所示的骆驼凝乳酶原突变蛋白mchy的编码基因的核苷酸序列为SEQ ID No.6所示;氨基酸序列为SEQ ID No.3所示的骆驼凝乳酶原突变蛋白mchy的编码基因的核苷酸序列为SEQ ID No.7所示;氨基酸序列为SEQ ID No.4所示的骆驼凝乳酶原突变蛋白mchy的编码基因的核苷酸序列为SEQ ID No.8所示。

本发明进一步提供了含有骆驼凝乳酶原突变蛋白mchy的编码基因的重组表达载体以及含有该重组表达载体的宿主细胞;所述重组表达载体可以是原核重组表达载体或重组真核表达载体,譬如,将骆驼凝乳酶原突变蛋白mchy的编码基因可操作的与原核表达载体或真核表达载体相连接得到重组原核表达载体或重组真核表达载体。

作为本发明一种较佳的具体实施方案,所述的重组表达载体优选为重组毕赤酵母表达载体;作为本发明一种优选的具体实施方案,本发明提供了一种携带有骆驼凝乳酶原突变蛋白mchy的编码基因的重组毕赤酵母表达载体的构建方法,包括:将凝乳酶原突变蛋白mchy的编码基因(包括chy34、或chy35、或chy38、或chy39)可操作的与毕赤酵母表达载体pPIC9K相连接,获得重组表达载体mchy-9K;其中,为便于检测和后期纯化,将编码基因mchy的5’端添加His-Tag,然后通过KEX2(AAAAGA)与α因子信号肽连接,α因子信号肽和mchy融合蛋白的基因位于乙醇氧化酶1(AOX1)启动子和终止子之间,使mchy基因能够在酵母宿主中通过甲醇诱导分泌表达。

所述的宿主细胞可以是大肠杆菌细胞或酵母细胞,优选为酵母细胞,更优选为毕赤酵母 (

本发明进一步将该骆驼凝乳酶原突变蛋白mchy的编码基因转化到毕赤酵母中,获得了骆驼凝乳酶原分泌表达量显著提高的毕赤酵母工程菌株。

本发明还提供了一种制备重组骆驼凝乳酶的方法,包括:将骆驼凝乳酶原突变蛋白mchy的编码基因可操作的与表达载体相连接得到重组表达载体;将所述重组表达载体转化宿主细胞,得到重组菌株;培养重组菌株,诱导重组骆驼凝乳酶的表达,回收并纯化所表达的重组骆驼凝乳酶,即得;其中,所述重组表达载体是重组真核表达载体,优选为重组毕赤酵母表达载体;所述的宿主细胞优选为酵母细胞,最优选为毕赤酵母(

本发明在骆驼凝乳酶原的自切割前导肽区域,设计并分别突变四个氨基酸位点,使其分别产生一个N-糖基化保守序列,在利用毕赤酵母重组分泌表达时,该位点发生N-糖基化,使重组骆驼凝乳酶原的分泌表达水平显著提高,同时该位点突变并不影响前导肽的自切割活性,且突变位点不在成熟蛋白上,因此不影响凝乳酶的凝乳活性。本发明所获得的毕赤酵母工程菌株,在相同的发酵培养条件下,重组骆驼凝乳酶原的表达量显著提高,具有更高的产业化应用前景。与表达野生型骆驼凝乳酶原的毕赤酵母相比,本发明所研制的突变体骆驼凝乳酶原酵母工程菌株可以显著的提高凝乳酶原的表达量,在无需改变发酵生产工艺的条件下,降低生产成本。

除非另外定义,否则本文所用的所有技术及科学术语都具有与本发明所属领域的普通技术人员通常所了解相同的含义。

术语“多核苷酸”或“核苷酸”意指单股或双股形式的脱氧核糖核苷酸、脱氧核糖核苷、核糖核苷或核糖核苷酸及其聚合物。除非特定限制,否则所述术语涵盖含有天然核苷酸的已知类似物的核酸,所述类似物具有类似于参考核酸的结合特性并以类似于天然产生的核苷酸的方式进行代谢。除非另外特定限制,否则所述术语也意指寡核苷酸类似物,其包括PNA(肽核酸)、在反义技术中所用的DNA类似物(硫代磷酸酯、磷酰胺酸酯等)。除非另外指定,否则特定核酸序列也隐含地涵盖其保守修饰的变异体(包括(但不限于)简并密码子取代)和互补序列以及明确指定的序列。特定而言,可通过产生其中一个或一个以上所选(或所有)密码子的第3位经混合碱基和/或脱氧肌苷残基取代的序列来实现简并密码子取代(Batzer等人, Nucleic Acid Res. 19:5081 (1991);Ohtsuka等人, J. Biol. Chem.260:2605-2608 (1985); 和Cassol等人, (1992);Rossolini等人, Mol Cell. Probes 8:91-98 (1994))。

术语“多肽”、“肽”和“蛋白”在本文中互换使用以意指氨基酸残基的聚合物。即,针对多肽的描述同样适用于描述肽和描述蛋白,且反之亦然。所述术语适用于天然产生氨基酸聚合物以及其中一个或一个以上氨基酸残基为非天然编码氨基酸的氨基酸聚合物。如本文中所使用,所述术语涵盖任何长度的氨基酸链,其包括全长蛋白(即抗原),其中氨基酸残基经由共价肽键连接。

术语“重组宿主细胞株”或“宿主细胞”意指包含本发明多核苷酸的细胞,而不管使用何种方法进行插入以产生重组宿主细胞,例如直接摄取、转导、f配对或所属领域中已知的其它方法。外源性多核苷酸可保持为例如质粒的非整合载体或者可整合入宿主基因组中。宿主细胞可为原核细胞或真核细胞,宿主细胞还可为单子叶或双子叶植物细胞。

术语“转化”指将异源性DNA序列引入到宿主细胞或有机体的方法。

术语“表达”指内源性基因或转基因在宿主细胞中的转录和/或翻译。

附图说明

图1 含有mchy(指chy11、chy26、chy34、chy35、chy38、chy39)基因的毕赤酵母表达载体mchy-9K的质粒图谱;mchy-9K基因以AOX1启动子和终止子构建表达框,在mchy基因的5’端添加His-Tag,并通过KEX2信号肽切割位点与α因子信号肽连接,用于使mchy蛋白分泌到胞外。

图2 重组菌株mchy-9K-GS115的基因组PCR鉴定;以重组菌株mchy-9K-GS115的基因组为模板,PCR扩增mchy基因片段,PCR产物用琼脂糖凝胶电泳检测;M:DNA分子量Marker;mchy(指 chy11、chy26、chy34、chy35、chy38或chy39):目的条带;CK:阴性对照,即以空载体转化酵母菌株的基因组为模板,经PCR后的扩增产物。

图3 重组蛋白mchy的Western-blot鉴定;wild:骆驼凝乳酶原基因在毕赤酵母宿主中的分泌表达鉴定; chy11、chy26、chy34、chy35、chy38、chy39:前导肽第11、26、34、35、38、39位发生糖基化突变的骆驼凝乳酶原基因在毕赤酵母宿主中的分泌表达鉴定;M:蛋白分子量Marker。

图4 ELISA比较重组菌株mchy-9K-GS115与chy-9K-GS115的分泌表达量;wild:骆驼凝乳酶原基因在毕赤酵母宿主中的分泌表达量; chy11、chy26、chy34、chy35、chy38、chy39:前导肽第11、26、34、35、38或39位发生糖基化突变的骆驼凝乳酶原基因在毕赤酵母宿主中的分泌表达量。

图5 重组蛋白mchy的凝乳酶活测定;酸碱处理后重组蛋白wild、chy11、chy26、chy34、chy35、chy38、chy39和阴性对照,即以空载体转化酵母菌株的发酵液上清的凝乳活性。

具体实施方式

以下结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。

实施例1 骆驼凝乳酶mchy的突变基因的设计与合成

根据野生型骆驼凝乳酶基因序列,将其进行酵母密码子优化,并将前导肽氨基酸序列的第11、26、34、35、38或39位的密码子分别突变为天冬酰胺的密码子AAC,28位的亮氨酸密码子突变为苏氨酸的密码子ACC,使11、26、34、35、38、39分别形成一个保守的N-糖基化位点。根据突变mchy基因序列人工合成基因,基因合成由生物公司完成,将该突变基因克隆至PUC57大肠杆菌克隆载体中。

实施例2携带有突变骆驼凝乳酶原基因毕赤酵母重组表达载体mchy-9K的构建

以实施例1构建的携带有突变mchy(包括chy11、chy26、chy34、chy35、chy38、chy39)基因的PUC57质粒为模板,以F和R为引物,PCR扩增mchy基因片段:

F引物序列为:

AACTCGAGAAAAGACACCATCACCATCACCACTCCGGTATCACCAGAATCC;

R引物序列为:

AAGCGGCCGCTTAGATGGCCTTGGCCAAACCG;

其中,在F引物中添加了

PCR反应条件为:94℃预变性1min,94℃变性30sec,56℃退火30sec,72℃延伸2min,30个循环,72℃延伸10min。

PCR产物经琼脂糖凝胶回收后与T载体连接,转化大肠杆菌克隆感受态细胞,将获得的阳性单克隆经测序正确后,提取质粒,用

实施例3 突变骆驼凝乳酶重组菌株mchy-9K-GS115的构建

将20μg的实施例2构建的表达载体mchy-9K用

PCR扩增产物用琼脂糖凝胶电泳检测的结果图2所示,经G418筛选的酵母转化子含有目的基因,该转化子即为突变体骆驼凝乳酶毕赤酵母工程菌株mchy-9K-GS115。

另外,采用相同的方法,经相同浓度的G418筛选及PCR鉴定,获得可分泌表达野生型骆驼凝乳酶原的毕赤酵母工程菌株chy-9K-GS115,为保证两种工程菌株具有相同的外源基因拷贝数,所筛选的chy-9K-GS115同样可抗0.5 mg/mLG418。

试验例1重组菌株mchy-9K-GS115的蛋白表达鉴定和酶活测定试验

将实施例3构建的重组菌株mchy-9K-GS115接种于50mL的YPD液体培养基中,28℃,200r/min振荡培养48h,离心收集菌体,改换为YPM液体培养基[1% 酵母提取物,2% 酪蛋白胨,1% 甲醇(w/v)],先用YPM液体培养基洗菌体2次,再重悬于50mL的YPM液体培养基中,继续培养72h后,离心收集上清,采用相同的方法,制得野生型骆驼凝乳酶的酵母发酵液上清,将七组上清进行Western-blot检测,经SDS-PAGE后,恒流400mA转PVDF膜1h,随后将膜置于TBST缓冲液(北京庄盟国际生物基因科技有限公司,货号:ZS405-3)中洗膜3次,每次5min,再将膜置于含有3%脱脂奶粉的TBST中在37℃封闭1h,然后加入anti-His antibody(Abcam,货号:ab18184)进行一抗孵育(1:1000),1h后用TBST洗膜3次,每次5min,再用碱性磷酸酶标记的二抗(Abcam,货号:ab6729)于37℃孵育1h(1:3000),TBST洗膜3次后,加入适量BCIP/NBT(北京酷来博科技有限公司,货号:SK20301)显色。

试验结果如图3所示,wild和mchy-9K-GS115菌株的发酵液上清具有明显的特异性条带,分子量在40kD-70kD之间,其中chy34、chy35、chy38、chy39d的分子量显著增大,表明前导肽区域这些位置增加的糖基化位点在酵母中发生了糖基化,进而分子量增大。

为精确比较突变体和野生型凝乳酶原在毕赤酵母中的分泌表达量,对两组上清进行ELISA检测,首先将100μL上清与等体积底物缓冲液(20mM碳酸钠缓冲液,pH 9.6)混合加入到96孔酶标板中,37℃包被1h,用PBST洗板3次,一抗(Abcam,货号:ab18184)结合1h,洗板3次后,二抗(Abcam,货号:ab6729)结合1h,同样洗板3次后,加入100μL显色底物PNPP显色,在405nm测定吸光值。

检测结果如图4所示,chy34菌株的表达量显著高于wild菌株,另外chy35、chy38、chy39的表达量也显著增加,而chy11和chy26的表达量升高的不显著。显著性差异分析采用SPSS软件Duncan法, ***表示差异显著,P<0.001,n=3。

测定凝乳酶的凝乳活性的方法是将发酵液上清用1M的HCl调解pH值至2,37℃静置30min,再加入适量1M的NaOH调解pH值至5.5,取500μL13%的脱脂奶粉溶液(用10mM磷酸缓冲液配置,pH5.5)于2mL离心管中,再加入10μL经酸-碱处理的发酵液上清,37℃静置30分钟,观察凝乳现象,结果如图5所示,wild和所有突变体均具有凝乳活性,表明前导肽所有突变位置发生糖基化突变后,仍可以完成自我切割。

序列表

<110> 中国农业科学院生物技术研究所

<120> 骆驼凝乳酶原突变蛋白及其编码基因和应用

<130> BJ-2002-210901A-L

<160> 8

<170> SIPOSequenceListing 1.0

<210> 1

<211> 365

<212> PRT

<213> Artifical sequence

<400> 1

Ser Gly Ile Thr Arg Ile Pro Leu His Lys Gly Lys Thr Leu Arg Lys

1 5 10 15

Ala Leu Lys Glu Arg Gly Leu Leu Glu Asp Phe Leu Gln Arg Gln Gln

20 25 30

Tyr Asn Val Ser Ser Lys Tyr Ser Ser Leu Gly Lys Val Ala Arg Glu

35 40 45

Pro Leu Thr Ser Tyr Leu Asp Ser Gln Tyr Phe Gly Lys Ile Tyr Ile

50 55 60

Gly Thr Pro Pro Gln Glu Phe Thr Val Val Phe Asp Thr Gly Ser Ser

65 70 75 80

Asp Leu Trp Val Pro Ser Ile Tyr Cys Lys Ser Asn Val Cys Lys Asn

85 90 95

His His Arg Phe Asp Pro Arg Lys Ser Ser Thr Phe Arg Asn Leu Gly

100 105 110

Lys Pro Leu Ser Ile His Tyr Gly Thr Gly Ser Met Glu Gly Phe Leu

115 120 125

Gly Tyr Asp Thr Val Thr Val Ser Asn Ile Val Asp Pro Asn Gln Thr

130 135 140

Val Gly Leu Ser Thr Glu Gln Pro Gly Glu Val Phe Thr Tyr Ser Glu

145 150 155 160

Phe Asp Gly Ile Leu Gly Leu Ala Tyr Pro Ser Leu Ala Ser Glu Tyr

165 170 175

Ser Val Pro Val Phe Asp Asn Met Met Asp Arg His Leu Val Ala Arg

180 185 190

Asp Leu Phe Ser Val Tyr Met Asp Arg Asn Gly Gln Gly Ser Met Leu

195 200 205

Thr Leu Gly Ala Ile Asp Pro Ser Tyr Tyr Thr Gly Ser Leu His Trp

210 215 220

Val Pro Val Thr Leu Gln Gln Tyr Trp Gln Phe Thr Val Asp Ser Val

225 230 235 240

Thr Ile Asn Gly Val Ala Val Ala Cys Val Gly Gly Cys Gln Ala Ile

245 250 255

Leu Asp Thr Gly Thr Ser Val Leu Phe Gly Pro Ser Ser Asp Ile Leu

260 265 270

Lys Ile Gln Met Ala Ile Gly Ala Thr Glu Asn Arg Tyr Gly Glu Phe

275 280 285

Asp Val Asn Cys Gly Asn Leu Arg Ser Met Pro Thr Val Val Phe Glu

290 295 300

Ile Asn Gly Arg Asp Tyr Pro Leu Ser Pro Ser Ala Tyr Thr Ser Lys

305 310 315 320

Asp Gln Gly Phe Cys Thr Ser Gly Phe Gln Gly Asp Asn Asn Ser Glu

325 330 335

Leu Trp Ile Leu Gly Asp Val Phe Ile Arg Glu Tyr Tyr Ser Val Phe

340 345 350

Asp Arg Ala Asn Asn Arg Val Gly Leu Ala Lys Ala Ile

355 360 365

<210> 2

<211> 365

<212> PRT

<213> Artifical sequence

<400> 2

Ser Gly Ile Thr Arg Ile Pro Leu His Lys Gly Lys Thr Leu Arg Lys

1 5 10 15

Ala Leu Lys Glu Arg Gly Leu Leu Glu Asp Phe Leu Gln Arg Gln Gln

20 25 30

Tyr Ala Asn Ser Ser Lys Tyr Ser Ser Leu Gly Lys Val Ala Arg Glu

35 40 45

Pro Leu Thr Ser Tyr Leu Asp Ser Gln Tyr Phe Gly Lys Ile Tyr Ile

50 55 60

Gly Thr Pro Pro Gln Glu Phe Thr Val Val Phe Asp Thr Gly Ser Ser

65 70 75 80

Asp Leu Trp Val Pro Ser Ile Tyr Cys Lys Ser Asn Val Cys Lys Asn

85 90 95

His His Arg Phe Asp Pro Arg Lys Ser Ser Thr Phe Arg Asn Leu Gly

100 105 110

Lys Pro Leu Ser Ile His Tyr Gly Thr Gly Ser Met Glu Gly Phe Leu

115 120 125

Gly Tyr Asp Thr Val Thr Val Ser Asn Ile Val Asp Pro Asn Gln Thr

130 135 140

Val Gly Leu Ser Thr Glu Gln Pro Gly Glu Val Phe Thr Tyr Ser Glu

145 150 155 160

Phe Asp Gly Ile Leu Gly Leu Ala Tyr Pro Ser Leu Ala Ser Glu Tyr

165 170 175

Ser Val Pro Val Phe Asp Asn Met Met Asp Arg His Leu Val Ala Arg

180 185 190

Asp Leu Phe Ser Val Tyr Met Asp Arg Asn Gly Gln Gly Ser Met Leu

195 200 205

Thr Leu Gly Ala Ile Asp Pro Ser Tyr Tyr Thr Gly Ser Leu His Trp

210 215 220

Val Pro Val Thr Leu Gln Gln Tyr Trp Gln Phe Thr Val Asp Ser Val

225 230 235 240

Thr Ile Asn Gly Val Ala Val Ala Cys Val Gly Gly Cys Gln Ala Ile

245 250 255

Leu Asp Thr Gly Thr Ser Val Leu Phe Gly Pro Ser Ser Asp Ile Leu

260 265 270

Lys Ile Gln Met Ala Ile Gly Ala Thr Glu Asn Arg Tyr Gly Glu Phe

275 280 285

Asp Val Asn Cys Gly Asn Leu Arg Ser Met Pro Thr Val Val Phe Glu

290 295 300

Ile Asn Gly Arg Asp Tyr Pro Leu Ser Pro Ser Ala Tyr Thr Ser Lys

305 310 315 320

Asp Gln Gly Phe Cys Thr Ser Gly Phe Gln Gly Asp Asn Asn Ser Glu

325 330 335

Leu Trp Ile Leu Gly Asp Val Phe Ile Arg Glu Tyr Tyr Ser Val Phe

340 345 350

Asp Arg Ala Asn Asn Arg Val Gly Leu Ala Lys Ala Ile

355 360 365

<210> 3

<211> 365

<212> PRT

<213> Artifical sequence

<400> 3

Ser Gly Ile Thr Arg Ile Pro Leu His Lys Gly Lys Thr Leu Arg Lys

1 5 10 15

Ala Leu Lys Glu Arg Gly Leu Leu Glu Asp Phe Leu Gln Arg Gln Gln

20 25 30

Tyr Ala Val Ser Ser Asn Tyr Ser Ser Leu Gly Lys Val Ala Arg Glu

35 40 45

Pro Leu Thr Ser Tyr Leu Asp Ser Gln Tyr Phe Gly Lys Ile Tyr Ile

50 55 60

Gly Thr Pro Pro Gln Glu Phe Thr Val Val Phe Asp Thr Gly Ser Ser

65 70 75 80

Asp Leu Trp Val Pro Ser Ile Tyr Cys Lys Ser Asn Val Cys Lys Asn

85 90 95

His His Arg Phe Asp Pro Arg Lys Ser Ser Thr Phe Arg Asn Leu Gly

100 105 110

Lys Pro Leu Ser Ile His Tyr Gly Thr Gly Ser Met Glu Gly Phe Leu

115 120 125

Gly Tyr Asp Thr Val Thr Val Ser Asn Ile Val Asp Pro Asn Gln Thr

130 135 140

Val Gly Leu Ser Thr Glu Gln Pro Gly Glu Val Phe Thr Tyr Ser Glu

145 150 155 160

Phe Asp Gly Ile Leu Gly Leu Ala Tyr Pro Ser Leu Ala Ser Glu Tyr

165 170 175

Ser Val Pro Val Phe Asp Asn Met Met Asp Arg His Leu Val Ala Arg

180 185 190

Asp Leu Phe Ser Val Tyr Met Asp Arg Asn Gly Gln Gly Ser Met Leu

195 200 205

Thr Leu Gly Ala Ile Asp Pro Ser Tyr Tyr Thr Gly Ser Leu His Trp

210 215 220

Val Pro Val Thr Leu Gln Gln Tyr Trp Gln Phe Thr Val Asp Ser Val

225 230 235 240

Thr Ile Asn Gly Val Ala Val Ala Cys Val Gly Gly Cys Gln Ala Ile

245 250 255

Leu Asp Thr Gly Thr Ser Val Leu Phe Gly Pro Ser Ser Asp Ile Leu

260 265 270

Lys Ile Gln Met Ala Ile Gly Ala Thr Glu Asn Arg Tyr Gly Glu Phe

275 280 285

Asp Val Asn Cys Gly Asn Leu Arg Ser Met Pro Thr Val Val Phe Glu

290 295 300

Ile Asn Gly Arg Asp Tyr Pro Leu Ser Pro Ser Ala Tyr Thr Ser Lys

305 310 315 320

Asp Gln Gly Phe Cys Thr Ser Gly Phe Gln Gly Asp Asn Asn Ser Glu

325 330 335

Leu Trp Ile Leu Gly Asp Val Phe Ile Arg Glu Tyr Tyr Ser Val Phe

340 345 350

Asp Arg Ala Asn Asn Arg Val Gly Leu Ala Lys Ala Ile

355 360 365

<210> 4

<211> 365

<212> PRT

<213> Artifical sequence

<400> 4

Ser Gly Ile Thr Arg Ile Pro Leu His Lys Gly Lys Thr Leu Arg Lys

1 5 10 15

Ala Leu Lys Glu Arg Gly Leu Leu Glu Asp Phe Leu Gln Arg Gln Gln

20 25 30

Tyr Ala Val Ser Ser Lys Asn Ser Ser Leu Gly Lys Val Ala Arg Glu

35 40 45

Pro Leu Thr Ser Tyr Leu Asp Ser Gln Tyr Phe Gly Lys Ile Tyr Ile

50 55 60

Gly Thr Pro Pro Gln Glu Phe Thr Val Val Phe Asp Thr Gly Ser Ser

65 70 75 80

Asp Leu Trp Val Pro Ser Ile Tyr Cys Lys Ser Asn Val Cys Lys Asn

85 90 95

His His Arg Phe Asp Pro Arg Lys Ser Ser Thr Phe Arg Asn Leu Gly

100 105 110

Lys Pro Leu Ser Ile His Tyr Gly Thr Gly Ser Met Glu Gly Phe Leu

115 120 125

Gly Tyr Asp Thr Val Thr Val Ser Asn Ile Val Asp Pro Asn Gln Thr

130 135 140

Val Gly Leu Ser Thr Glu Gln Pro Gly Glu Val Phe Thr Tyr Ser Glu

145 150 155 160

Phe Asp Gly Ile Leu Gly Leu Ala Tyr Pro Ser Leu Ala Ser Glu Tyr

165 170 175

Ser Val Pro Val Phe Asp Asn Met Met Asp Arg His Leu Val Ala Arg

180 185 190

Asp Leu Phe Ser Val Tyr Met Asp Arg Asn Gly Gln Gly Ser Met Leu

195 200 205

Thr Leu Gly Ala Ile Asp Pro Ser Tyr Tyr Thr Gly Ser Leu His Trp

210 215 220

Val Pro Val Thr Leu Gln Gln Tyr Trp Gln Phe Thr Val Asp Ser Val

225 230 235 240

Thr Ile Asn Gly Val Ala Val Ala Cys Val Gly Gly Cys Gln Ala Ile

245 250 255

Leu Asp Thr Gly Thr Ser Val Leu Phe Gly Pro Ser Ser Asp Ile Leu

260 265 270

Lys Ile Gln Met Ala Ile Gly Ala Thr Glu Asn Arg Tyr Gly Glu Phe

275 280 285

Asp Val Asn Cys Gly Asn Leu Arg Ser Met Pro Thr Val Val Phe Glu

290 295 300

Ile Asn Gly Arg Asp Tyr Pro Leu Ser Pro Ser Ala Tyr Thr Ser Lys

305 310 315 320

Asp Gln Gly Phe Cys Thr Ser Gly Phe Gln Gly Asp Asn Asn Ser Glu

325 330 335

Leu Trp Ile Leu Gly Asp Val Phe Ile Arg Glu Tyr Tyr Ser Val Phe

340 345 350

Asp Arg Ala Asn Asn Arg Val Gly Leu Ala Lys Ala Ile

355 360 365

<210> 5

<211> 1098

<212> DNA

<213> Artifical sequence

<400> 5

tccggtatca ccagaatccc attgcacaag ggtaagacct tgagaaaggc tttgaaggag 60

agaggtttgt tggaggactt cttgcaaaga caacaataca acgtctcctc caagtactcc 120

tccttgggta aggtcgccag agagccattg acctcctact tggactccca atacttcggt 180

aagatttaca tcggtactcc accacaagag ttcaccgtcg tcttcgacac tggttcctcc 240

gacttgtggg tcccatccat ctactgtaag tccaacgtct gtaagaacca ccacagattc 300

gacccaagaa agtcctccac cttcagaaac ttgggtaagc cattgtccat ccactacggt 360

actggttcta tggagggttt cttgggttac gacaccgtca ccgtctccaa catcgtcgat 420

ccaaaccaaa ccgtcggttt gtccaccgag caaccaggtg aggtcttcac ctactccgag 480

ttcgacggta tcttgggttt ggcctaccca tccttggcct ccgagtactc cgtcccagtc 540

ttcgacaaca tgatggacag acacttggtc gccagagact tgttctccgt ttacatggac 600

agaaacggtc aaggttccat gttgaccttg ggtgccatcg acccatctta ctacactggt 660

tctttgcatt gggttccagt tactttgcaa caatactggc aatttactgt tgattctgtc 720

accatcaacg gtgtcgccgt cgcctgtgtc ggtggttgtc aagccatctt ggacaccggt 780

acttccgtct tgttcggtcc atcctccgac atcttgaaga tccaaatggc catcggtgcc 840

accgagaaca gatacggtga gttcgacgtc aactgtggta acttgagatc catgccaacc 900

gtcgtcttcg agatcaacgg tagagactac ccattgtccc catctgctta cacttctaag 960

gaccaaggtt tctgtacttc tggtttccaa ggtgacaaca actccgagtt gtggatcttg 1020

ggtgacgtct tcatcagaga gtactactcc gtcttcgaca gagccaacaa cagagtcggt 1080

ttggccaagg ccatctaa 1098

<210> 6

<211> 1098

<212> DNA

<213> Artifical sequence

<400> 6

tccggtatca ccagaatccc attgcacaag ggtaagacct tgagaaaggc tttgaaggag 60

agaggtttgt tggaggactt cttgcaaaga caacaatacg tcaactcctc caagtactcc 120

tccttgggta aggtcgccag agagccattg acctcctact tggactccca atacttcggt 180

aagatttaca tcggtactcc accacaagag ttcaccgtcg tcttcgacac tggttcctcc 240

gacttgtggg tcccatccat ctactgtaag tccaacgtct gtaagaacca ccacagattc 300

gacccaagaa agtcctccac cttcagaaac ttgggtaagc cattgtccat ccactacggt 360

actggttcta tggagggttt cttgggttac gacaccgtca ccgtctccaa catcgtcgat 420

ccaaaccaaa ccgtcggttt gtccaccgag caaccaggtg aggtcttcac ctactccgag 480

ttcgacggta tcttgggttt ggcctaccca tccttggcct ccgagtactc cgtcccagtc 540

ttcgacaaca tgatggacag acacttggtc gccagagact tgttctccgt ttacatggac 600

agaaacggtc aaggttccat gttgaccttg ggtgccatcg acccatctta ctacactggt 660

tctttgcatt gggttccagt tactttgcaa caatactggc aatttactgt tgattctgtc 720

accatcaacg gtgtcgccgt cgcctgtgtc ggtggttgtc aagccatctt ggacaccggt 780

acttccgtct tgttcggtcc atcctccgac atcttgaaga tccaaatggc catcggtgcc 840

accgagaaca gatacggtga gttcgacgtc aactgtggta acttgagatc catgccaacc 900

gtcgtcttcg agatcaacgg tagagactac ccattgtccc catctgctta cacttctaag 960

gaccaaggtt tctgtacttc tggtttccaa ggtgacaaca actccgagtt gtggatcttg 1020

ggtgacgtct tcatcagaga gtactactcc gtcttcgaca gagccaacaa cagagtcggt 1080

ttggccaagg ccatctaa 1098

<210> 7

<211> 1098

<212> DNA

<213> Artifical sequence

<400> 7

tccggtatca ccagaatccc attgcacaag ggtaagacct tgagaaaggc tttgaaggag 60

agaggtttgt tggaggactt cttgcaaaga caacaatacg tcgcttcctc caactactcc 120

tccttgggta aggtcgccag agagccattg acctcctact tggactccca atacttcggt 180

aagatttaca tcggtactcc accacaagag ttcaccgtcg tcttcgacac tggttcctcc 240

gacttgtggg tcccatccat ctactgtaag tccaacgtct gtaagaacca ccacagattc 300

gacccaagaa agtcctccac cttcagaaac ttgggtaagc cattgtccat ccactacggt 360

actggttcta tggagggttt cttgggttac gacaccgtca ccgtctccaa catcgtcgat 420

ccaaaccaaa ccgtcggttt gtccaccgag caaccaggtg aggtcttcac ctactccgag 480

ttcgacggta tcttgggttt ggcctaccca tccttggcct ccgagtactc cgtcccagtc 540

ttcgacaaca tgatggacag acacttggtc gccagagact tgttctccgt ttacatggac 600

agaaacggtc aaggttccat gttgaccttg ggtgccatcg acccatctta ctacactggt 660

tctttgcatt gggttccagt tactttgcaa caatactggc aatttactgt tgattctgtc 720

accatcaacg gtgtcgccgt cgcctgtgtc ggtggttgtc aagccatctt ggacaccggt 780

acttccgtct tgttcggtcc atcctccgac atcttgaaga tccaaatggc catcggtgcc 840

accgagaaca gatacggtga gttcgacgtc aactgtggta acttgagatc catgccaacc 900

gtcgtcttcg agatcaacgg tagagactac ccattgtccc catctgctta cacttctaag 960

gaccaaggtt tctgtacttc tggtttccaa ggtgacaaca actccgagtt gtggatcttg 1020

ggtgacgtct tcatcagaga gtactactcc gtcttcgaca gagccaacaa cagagtcggt 1080

ttggccaagg ccatctaa 1098

<210> 8

<211> 1098

<212> DNA

<213> Artifical sequence

<400> 8

tccggtatca ccagaatccc attgcacaag ggtaagacct tgagaaaggc tttgaaggag 60

agaggtttgt tggaggactt cttgcaaaga caacaatacg tcgcttcctc caagaactcc 120

tccttgggta aggtcgccag agagccattg acctcctact tggactccca atacttcggt 180

aagatttaca tcggtactcc accacaagag ttcaccgtcg tcttcgacac tggttcctcc 240

gacttgtggg tcccatccat ctactgtaag tccaacgtct gtaagaacca ccacagattc 300

gacccaagaa agtcctccac cttcagaaac ttgggtaagc cattgtccat ccactacggt 360

actggttcta tggagggttt cttgggttac gacaccgtca ccgtctccaa catcgtcgat 420

ccaaaccaaa ccgtcggttt gtccaccgag caaccaggtg aggtcttcac ctactccgag 480

ttcgacggta tcttgggttt ggcctaccca tccttggcct ccgagtactc cgtcccagtc 540

ttcgacaaca tgatggacag acacttggtc gccagagact tgttctccgt ttacatggac 600

agaaacggtc aaggttccat gttgaccttg ggtgccatcg acccatctta ctacactggt 660

tctttgcatt gggttccagt tactttgcaa caatactggc aatttactgt tgattctgtc 720

accatcaacg gtgtcgccgt cgcctgtgtc ggtggttgtc aagccatctt ggacaccggt 780

acttccgtct tgttcggtcc atcctccgac atcttgaaga tccaaatggc catcggtgcc 840

accgagaaca gatacggtga gttcgacgtc aactgtggta acttgagatc catgccaacc 900

gtcgtcttcg agatcaacgg tagagactac ccattgtccc catctgctta cacttctaag 960

gaccaaggtt tctgtacttc tggtttccaa ggtgacaaca actccgagtt gtggatcttg 1020

ggtgacgtct tcatcagaga gtactactcc gtcttcgaca gagccaacaa cagagtcggt 1080

ttggccaagg ccatctaa 1098

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号