首页> 中国专利> 通过使用转录因子来增加蛋白质表达的手段和方法

通过使用转录因子来增加蛋白质表达的手段和方法

摘要

本发明属于重组生物技术领域,特别属于蛋白质表达领域。本发明一般涉及一种通过过表达编码本发明的至少一种转录因子(优选Msn4/2)的至少一种多核苷酸来增加真核宿主细胞(优先酵母菌)中目标蛋白(POI)的产量的方法。本发明进一步涉及一种用于制备POI的重组真核宿主细胞,其中所述宿主细胞被工程化以过表达编码至少一种转录因子的至少一种多核苷酸,以及所述宿主细胞用于制备POI的用途。

著录项

说明书

本申请要求于2018年6月27日提交的欧洲专利申请No.18 180 164.8的优先权的权益,该申请的内容以引用的方式全文并入本文用于全部目的。

技术领域

本发明属于重组生物技术领域,特别属于蛋白质表达领域。本发明一般涉及一种通过过表达编码本发明的至少一种转录因子(优选Msn4/2)的至少一种多核苷酸来增加真核宿主细胞(优选酵母菌)中目标蛋白(POI)的产量的方法。本发明进一步涉及一种用于制备POI的重组真核宿主细胞,其中所述宿主细胞被工程化以过表达编码至少一种转录因子的至少一种多核苷酸,以及所述宿主细胞用于制备POI的用途。

背景技术

已经采用原核和真核宿主完成了目标蛋白(POI)的成功生产。最突出的实例是如大肠杆菌(Escherichia coli)的细菌,如酿酒酵母(Saccharomyces cerevisiae)、巴斯德毕赤酵母(Pichia pastoris)或多形汉森酵母(Hansenula polymorpha)的酵母菌,如泡盛曲霉(Aspergillus awamori)或里氏木霉(Trichoderma reesei)的丝状真菌,或如CHO细胞的哺乳动物细胞。虽然某些蛋白质产量容易以高效率实现,但是很多其它蛋白质仅以相对低的水平生产。

一般而言,异源蛋白质合成可受到不同水平的限制。可能的限制是靶蛋白的转录和翻译、蛋白质折叠和(若适用)分泌、二硫键形成和糖基化以及聚集和降解。通过利用强启动子或增加异源基因的拷贝数可以增强转录。然而,这些措施明显达到了平台期,表明转录下游的其它瓶颈限制了表达。

宿主细胞中高水平的蛋白质产量可在一个或多个不同步骤如折叠、二硫键的形成、糖基化、细胞内转运或从细胞中释放时受到限制。基于目前本领域最先进的知识,甚至当宿主生物体的全部基因组的DNA序列可获得时,许多涉及的机制仍然不能被完全理解且不能预测。此外,以高产量产生重组蛋白的细胞的表型可以是降低的生长速率、降低的生物质形成和整体降低的细胞适应性。

在本领域中进行了各种尝试以期改善目标蛋白的产量,比如使应促进蛋白质折叠、氨基酸的外部补充等的分子伴侣过表达。

然而,仍然需要改善宿主细胞生产和/或分泌目标蛋白的能力的方法。本发明要解决的技术问题是满足这种需要。

上述技术问题的方案是提供手段(比如工程化的宿主细胞)、应用所述手段的方法和用途以通过在所述宿主细胞中过表达编码至少一种转录因子的至少一种多核苷酸从而增加真核宿主细胞中重组目标蛋白的产量。这些手段、方法和用途将在本文中详述、在权利要求中列出、在实施例中示例性阐述并在附图中说明。

因此,本发明提供增加重组蛋白在宿主细胞中的产量的新方法和用途,所述方法和用途是简单且有效的并适用于在工业方法中使用。本发明还提供实现上述目的的宿主细胞。

必须指出的是,除非上下文另有明确说明,本文所用单数形式“一(a)”、“一种(an)”和“所述/该(the)”包括所提及的复数且反之亦然。因此,例如,提及的“一种宿主细胞”或“一种方法”分别包括一种或多种此类宿主细胞或方法,并且提及的“所述方法”包括本领域普通技术人员已知的可被修饰或置换的等效步骤和方法。类似地,例如,提及的“方法(methods)”或“宿主细胞(host cells)”分别包括“一种宿主细胞”或“一种方法”。

除非另有说明,一系列元素之前的术语“至少”将被理解为是指该系列中的每一元素。本领域技术人员将承认或仅采用常规实验能够确定,本文所述的本发明的具体实施方案的许多等效方案。本发明旨在涵盖这种等效方案。

术语“和/或”无论在本文何处使用均包括“和”、“或”和“由所述术语连接的元素的全部或任意其它组合”的含义。例如,A、B和/或C的含义是A、B、C、A+B、A+C、B+C和A+B+C。

本文所用术语“约(about)”或“大约(approximately)”意指在给定值或范围的20%内,优选地10%内,和更优选地5%内。其还包括具体数目,如,约20包括20。

术语“少于”、“多于”或“大于”包括具体数目。例如,少于20意指≤20,多于20意指≥20。

本说明书及权利要求或项目全文中,除非上下文有其它要求,词语“包括/包含(comprise)”以及诸如“包括/包含(comprises)”和“包括/包含(comprising)”的变形词语将被理解为意指包括陈述的整数(或步骤)或整数(或步骤)的集合。其并不排除任何其它的整数(或步骤)或整数(或步骤)的集合。当本文使用时,术语“包括/包含(comprising)”能够以术语“含有(containing)”、“由…组成(composed of)”、“包含(including)”、“具有(having)”或“携带(carrying)”替换,且反之亦然,比如术语“具有(having)”能够以术语“包括/包含(comprising)”替换。当本文使用时,“由…组成”排除了未在权利要求/项目中规定的任何整数或步骤。当本文使用时,“本质上由…组成”并不排除实质上不影响权利要求/项目的基本特征和新特征的整数或步骤。

另外,在描述本发明的代表性实施方案时,本说明书可能将本发明的方法和/或过程体现为特定的步骤顺序。然而,就方法或过程并不依赖于本文所陈述的特定步骤顺序来说,该方法或过程不应限于所描述的特定步骤顺序。本领域的普通技术人员能够理解,其他步骤的顺序也是可能的。因此,在本说明书中所描述的步骤的具体顺序,不应被解释为对权利要求的限制。此外,涉及本发明的方法和/或过程的权利要求也不应被限制于以所记载次序的其步骤的操作,而且本领域的技术人员能够容易地理解,这些顺序可以是变化的并且仍然被包含在本发明的精神和范围之内。

应该理解的是,本发明并不限于本文所述的具体的方法学、方案、材料、试剂和物质等。本文所使用的名词只用于描述特定实施方案的目的,其并不意在限定本发明的范围,本发明的范围仅由权利要求/项目限定。

本说明书全文所引用的所有的出版物和专利(包括所有的专利、专利申请、科学出版物、制造商的说明书、指导书等),无论在前还是在后,均以其全文通过引入并入本文。本文无任何内容能被解释为承认本发明无权凭借在先发明而早于这样的公开内容。就通过引入并入的材料与本说明书矛盾或不一致来说,本说明书将取代任何这样的材料。

发明内容

本发明人的发现是相当令人惊讶的,因为就直到本发明之前的所有知识而言,本发明的转录因子与增加真核宿主细胞(特别是真菌宿主细胞)中目标蛋白的产量无关。

本发明包含一种增加真核宿主细胞中重组目标蛋白的产量的方法,所述方法包括在所述宿主细胞中过表达编码至少一种转录因子的至少一种多核苷酸,由此与不过表达编码所述转录因子的多核苷酸的宿主细胞相比,使所述重组目标蛋白的产量增加,其中所述转录因子至少包含:a)DNA结合结构域,其包含:i)SEQ ID NO:1所示的氨基酸序列,或ii)SEQ ID NO:1所示的氨基酸序列的功能同系物,其与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性,和b)激活结构域。

本发明的方法可包括:

i)将所述宿主细胞工程化以过表达编码至少一种转录因子的至少一种多核苷酸,所述转录因子至少包含:

a)DNA结合结构域,其包含:

a1)SEQ ID NO:1所示的氨基酸序列,或

a2)SEQ ID NO:1所示的氨基酸序列的功能同系物,其与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性,和

b)激活结构域,

ii)将所述宿主细胞工程化以包含编码所述目标蛋白的多核苷酸,

iii)在适宜条件下培养所述宿主细胞以过表达所述编码至少一种转录因子的至少一种多核苷酸并过表达所述目标蛋白,可选地

iv)从细胞培养物中分离所述目标蛋白,和可选地

v)纯化所述目标蛋白。

此外,本发明设想一种通过真核宿主细胞制备重组目标蛋白的方法,所述方法包括:

i)提供被工程化以过表达编码至少一种转录因子的至少一种多核苷酸的宿主细胞,其中所述宿主细胞进一步包含编码目标蛋白的多核苷酸,其中所述转录因子至少包含:

a)DNA结合结构域,其包含:

a1)SEQ ID NO:1所示的氨基酸序列,或

a2)SEQ ID NO:1所示的氨基酸序列的功能同系物,其与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性,和

b)激活结构域,

ii)在适宜条件下培养所述宿主细胞以过表达所述编码至少一种转录因子的至少一种多核苷酸并过表达所述目标蛋白,可选地

iii)从细胞培养物中分离所述目标蛋白,和可选地

iv)纯化所述目标蛋白,和可选地

v)修饰所述目标蛋白,和可选地

vi)配制所述目标蛋白。

本发明的方法可包括与工程化之前的宿主细胞相比,所述转录因子的过表达使模型蛋白scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14)的产量增加。

进一步地,本发明还可包含本发明的方法,其中将所述编码至少一种转录因子的多核苷酸整合在所述宿主细胞的基因组中或包含在未整合至所述宿主细胞的基因组中的载体或质粒中。

本发明还可涵盖本发明的方法,其中所述真核宿主细胞为真菌宿主细胞,优选地为选自巴斯德毕赤酵母(Pichia pastoris)(syn.Komagataella spp)、多形汉森酵母(Hansenula polymorpha)(syn.H.angusta)、里氏木霉(Trichoderma reesei)、黑曲霉(Aspergillus niger)、酿酒酵母(Saccharomyces cerevisiae)、乳酸克鲁维酵母(Kluyveromyces lactis)、解脂耶氏酵母(Yarrowia lipolytica)、甲醇毕赤酵母(Pichiamethanolica)、博伊丁假丝酵母(Candida boidinii)、孔玛氏酵母属种(Komagataellaspp.)和粟酒裂殖酵母(Schizosaccharomyces pombe)的酵母宿主细胞。已将多形汉森酵母重新分类为Ogataeas属(Yamada等,1994.Biosci Biotechnol Biochem.58(7):1245-57)。Ogataea angusta、Ogataea polymorpha和Ogataea parapolymorpha是近期彼此分开的近缘物种(Kurtzman等,2011.Antonie Van Leeuwenhoek.100(3):455-62)。

本发明还设想本发明的方法,其中所述重组目标蛋白为酶、治疗性蛋白、食品添加剂或饲料添加剂。

另外,本发明还可包含本发明的方法,所述方法进一步包括在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码至少一种ER辅助蛋白的至少一种多核苷酸。

优选地,所述ER辅助蛋白具有SEQ ID NO:28所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:28所示的氨基酸序列具有至少70%的序列同一性。

本发明考虑的可以是本发明的方法,所述方法进一步包括在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码至少两种ER辅助蛋白的至少两种多核苷酸。

优选地,第一ER辅助蛋白具有SEQ ID NO:28所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:28所示的氨基酸序列具有至少70%的序列同一性,和第二ER辅助蛋白可具有:

i)SEQ ID NO:37所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ IDNO:37所示的氨基酸序列具有至少25%的序列同一性,或

ii)SEQ ID NO:47所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ IDNO:47所示的氨基酸序列具有至少20%的序列同一性。

可选地第三ER辅助蛋白具有SEQ ID NO:55所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:55所示的氨基酸序列具有至少25%的序列同一性。

此外,本发明可包含本发明的方法,所述方法进一步包括在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码一种另外的转录因子的至少一种多核苷酸。

优选地,所述另外的转录因子至少包含:

a)DNA结合结构域,其包含:

a1)SEQ ID NO:65所示的氨基酸序列,或

a2)SEQ ID NO:65所示的氨基酸序列的功能同系物,其与SEQ ID NO:65所示的氨基酸序列具有至少50%的序列同一性,和

b)激活结构域。

本发明还包含一种用于制备目标蛋白的重组真核宿主细胞,其中所述宿主细胞被工程化以过表达编码至少一种转录因子的至少一种多核苷酸,其中所述转录因子至少包含:

a)DNA结合结构域,其包含:

i)SEQ ID NO:1所示的氨基酸序列,或

ii)SEQ ID NO:1所示的氨基酸序列的功能同系物,其与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性,和

b)激活结构域。

本发明还考虑上述重组真核宿主细胞用于制备重组目标蛋白的用途。

附图说明

图1:在小规模筛选培养中vHH分泌(效价和产量)的改善。

在小规模筛选中使巴斯德毕赤酵母中vHH分泌增加的过表达基因或基因组合的概述。在括号内的基因或基因组合的下列示出了用于工程化宿主细胞以过表达这些基因或基因组合的一种或多种质粒。小规模筛选的倍数改变值是多达20个克隆/转化体的算术平均值。

图2:在分批进料生物反应器培养中vHH分泌(效价和产量)的改善。

在分批进料培养中使巴斯德毕赤酵母中vHH分泌增加的过表达基因或基因组合的概述。在括号内的基因或基因组合的下列示出了用于工程化宿主细胞以过表达这些基因或基因组合的一种或多种质粒。分批进料培养的倍数改变值是单个选定克隆的倍数改变值。

图3:在小规模筛选培养中scFv分泌(效价和产量)的改善。

在小规模筛选中使巴斯德毕赤酵母中scFv分泌增加的过表达基因或基因组合的概述。在括号内的基因或基因组合的下列示出了用于工程化宿主细胞以过表达这些基因或基因组合的一种或多种质粒。小规模筛选的倍数改变值是多达20个克隆/转化体的算术平均值。

图4:在分批进料生物反应器培养中scFv分泌(效价和产量)的改善。

在分批进料培养中使巴斯德毕赤酵母中scFv分泌增加的过表达基因或基因组合的概述。在括号内的基因或基因组合的下列示出了用于工程化宿主细胞以过表达这些基因或基因组合的一种或多种质粒。分批进料培养的倍数改变值是单个选定克隆的倍数改变值。

图5:在分批进料生物反应器培养中,通过过表达来自其他物种的MSN2/4同系物来改善scFv分泌(效价和产量)。

图6:不同来源的Msn4p转录因子的比对概述。

锌指的蛋白结构基序清楚地显示出强的保守性(图6中的方框),其被称为酿酒酵母中得到充分表征的转录因子Msn4p和Msn2p的DNA结合结构域(ScMsn4/2)。

图7:Msn4-样C

图8:巴斯德毕赤酵母MSN4/2的序列比对。

通过采用EMBOSS Needle算法的整体配对序列比对来评估巴斯德毕赤酵母的全长Msn4p与其它生物体的各同系物的配对序列相似性/同一性。还研究了巴斯德毕赤酵母的Msn4p的DNA-结合结构域与其它生物体的各同系物的DNA-结合结构域的配对序列相似性/同一性。

图9:与巴斯德毕赤酵母KAR2的序列同一性。

采用BLASTp评估序列同一性。

图10:与巴斯德毕赤酵母LHS1的序列同一性。

采用BLASTp评估序列同一性。

图11:与巴斯德毕赤酵母SIL1的序列同一性。

采用BLASTp评估序列同一性。

图12:与巴斯德毕赤酵母ERJ5的序列同一性。

采用BLASTp评估序列同一性。

图13:巴斯德毕赤酵母HAC1的序列比对。

通过采用EMBOSS Needle算法的整体配对序列比对来评估巴斯德毕赤酵母的全长Hac1p与其它生物体的各同系物的配对序列相似性/同一性。还研究了巴斯德毕赤酵母的Hac1p的DNA-结合结构域与其它生物体的各同系物的DNA-结合结构域的配对序列相似性/同一性。

图14:与MSN4/2-DNA结合结构域的共有序列的序列同一性。

通过采用EMBOSS Needle算法的整体配对序列比对研究了Msn4p/Msn2p的DNA结合结构域(DBD)的共有序列与其它生物体的各同系物的DNA-结合结构域的配对序列相似性/同一性。

本发明部分地基于这一惊人的发现,即发现本文所述的至少一种转录因子的过表达使重组目标蛋白的产量增加。特别地,本发明包含一种增加真核宿主细胞中重组目标蛋白的产量的方法,所述方法包括在所述宿主细胞中过表达编码本发明的至少一种转录因子的至少一种多核苷酸,由此与不过表达编码所述转录因子的多核苷酸的宿主细胞相比,使所述重组目标蛋白的产量增加。

术语“增加宿主细胞中重组目标蛋白的产量”意指与在相同培养条件下表达相同目标蛋白(POI)但是不含被过表达的编码转录因子的多核苷酸或未被工程化以过表达编码转录因子的多核苷酸的相同细胞相比,POI的产量增加了。

在本上下文中,术语“产量”是指本文所述的POI或模型蛋白、特别是scFv即单链可变片段(SEQ ID NO:13)和vHH(或VHHV)即单结构域抗体片段(SEQ ID NO.14)的量,其分别是例如从工程化宿主细胞中收获的,并且增加的产量可归因于宿主细胞内生产的量增加或由宿主细胞分泌的POI增加。术语“产量”还指每细胞本文所述的POI或模型蛋白的量并可以以mg POI/g宿主细胞的生物质(以干细胞重量或湿细胞重量来度量)表示。当本文使用时,术语“效价”类似地指生产的POI或模型蛋白的量,以mg POI/L培养上清液或全细胞培养液(broth)表示。本发明还可包含一种增加重组目标蛋白的效价的方法,其中使本发明的转录因子在真核宿主细胞中过表达。当从工程化宿主细胞中获得的产量与从工程化之前的宿主细胞(即从未工程化的宿主细胞)中获得的产量相比较时,可以测定产量的增加。优选地,当将“产量”用于本文所述的模型蛋白的上下文中时,其是按照实施例3、4和5的描述测定的。例如,术语“产量”可以指整个浸入培养(submersion cultivation)中一定量生物质产生的POI的量。在该培养中,重组POI可以在细胞内产生并积累或分泌到培养上清液中。术语“增加宿主细胞中重组目标蛋白的产量”是指使细胞内产生的或由细胞产生的POI的量增加和/或使从细胞中分泌的POI的量增加。

如本领域技术人员将理解的,已经表明本发明的转录因子的过表达使POI(特别是重组POI)的产量以及效价增加。

如本文所用的术语“目标蛋白”(POI)通常指任何蛋白,但优选地指“异源蛋白”或“重组蛋白”,优选地指模型蛋白scFv(SEQ ID NO:13)和/或vHH(SEQ ID NO.14)。本发明的POI的具体实例在本文其他地方指出。如本文所用,“重组(的)”是指通过人为干预的遗传材料的改变。通常,重组是指通过分子生物学(重组DNA技术)方法(包括克隆和重组)对病毒、细胞、质粒或载体中DNA或RNA的操作。典型地可以参考重组蛋白与天然存在的对应物(“野生型”)如何相区别来描述重组蛋白。优选地,由本发明的真核宿主细胞表达的重组目标蛋白来自不同的生物体。优选地,POI不是转录因子,即所述转录因子与POI不同。重组蛋白还可以是同源蛋白。在该情况下,通过遗传操作将一个或多个拷贝的编码同源蛋白的多核苷酸引入宿主细胞中。

术语“表达多核苷酸”是指当将多核苷酸转录成mRNA且将mRNA翻译成多肽时。术语“过表达”通常是指大于参考标准品(如在相同培养条件下的未被工程化以过表达编码蛋白的多核苷酸的相同宿主细胞)显示的表达水平的任何量。在本发明中术语“过表达(的)”是指基因产物或多肽以高于宿主细胞遗传改变之前的或在限定条件下未被遗传改变的相当的宿主中的相同基因产物或多肽的表达的水平表达。在本发明中,包含SEQ ID NO:15-27中任一个所示的氨基酸序列的转录因子或其功能同系物过表达。若宿主细胞不包含给定基因产物,将该基因产物引入所述宿主细胞用于表达是可能的;在这种情况下,术语“过表达”包括任何可检测的表达。在优选的实施方案中,“过表达”意指如下所述的“工程化以过表达”。对于本文所述的与“过表达”有关的任何实施方案均可以考虑此类优选的实施方案。

如本文所用的“多核苷酸”是指任意长度的聚合非分支形式的核苷酸(核糖核苷酸或脱氧核糖核苷酸或它们的组合)。优选地,多核苷酸是指任意长度的聚合非分支形式的脱氧核糖核苷酸。在此,核苷酸由戊糖(脱氧核糖)、含氮碱基(腺嘌呤、鸟嘌呤、胞嘧啶或胸腺嘧啶)和磷酸基组成。术语“多核苷酸”、“核酸序列”在本文可互换使用。

如本文所用,术语“编码至少一种转录因子的至少一种多核苷酸”是指编码一种转录因子的一种多核苷酸,编码两种转录因子的两种多核苷酸,编码三种转录因子的三种多核苷酸,编码四种转录因子的四种多核苷酸等。优选地,本发明包含编码一种转录因子的一种多核苷酸。更优选地,本发明包含编码一种转录因子的一种多核苷酸和编码一种另外的转录因子的一种多核苷酸。

术语“转录因子”是指一种蛋白质,其通过(优选地以其DNA结合结构域)结合至特定的DNA序列来控制遗传信息从DNA向信使RNA的转录速率。它们的功能是调节和/或激活基因,以便确保这些基因在正确的时间并以正确的量在正确的细胞中表达。例如,转录因子可以响应于诸如饥饿或热休克的刺激而启动特定基因的转录。在本发明中,Msn4p转录因子是指包含DNA结合结构域的SEQ ID NO:15-27和是指这类转录因子,它们包含SEQ ID NO:1所示的氨基酸序列或SEQ ID NO:1所示的氨基酸序列的功能同系物以及任意激活结构域(如:本发明的转录因子或如本文其他地方所述的任何物种的其他转录因子的合成的、病毒的或激活结构域),所述功能同系物与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与本文所述的SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性,优选地所述激活结构域可示于SEQ ID NO:83。根据技术人员的知识可以实施并可以以任何顺序实施本文所述的本发明的转录因子的所述DNA结合结构域与任意激活结构域的排布。本发明的转录因子的DNA结合结构域可以由技术人员在C-或N-末端,优选在C-末端排布。在进一步的实施方案中,也可将本发明的合成形式的转录因子(如:synMSN4)用在本发明中(比如SEQ ID NO:27)。合成形式的转录因子可包括合成的DNA结合结构域(比如SEQ ID NO:12)。此外,本发明的合成形式的转录因子可包括任意激活结构域(如:本发明的转录因子或如本文其他地方所述的任何物种的其他转录因子的合成的、病毒的或激活结构域),优选地所述激活结构域可示于SEQ ID NO:84。再次,根据技术人员的知识可以实施并可以以任何顺序实施本文所述的本发明的转录因子的所述DNA结合结构域与任意激活结构域的排布。本发明的合成的转录因子的DNA结合结构域可以由技术人员在C-或N-末端,优选在C-末端排布。

在本发明中,转录因子是指Msn4/2蛋白(Msn4/2p或MSN4/2)。Msn4p是经历了全基因组复制事件的酵母菌(比如酿酒酵母及其近亲)中的Msn2p的同系物。大多数其他酵母菌和真菌物种仅含有Msn-型转录因子,并且这些物种中的这些转录因子无法合理区分。由于此功能冗余,这些转录因子可以成为Msn2或Msn4或Msn4/2。由于具有高度同源性,因此Msn4p与Msn2p极有可能是可互换的,即转录因子是冗余的。Msn2-与Msn4-依赖性表达之间无本质区别,且Msn4p和Msn2p的结构是非常相似的。巴斯毕赤酵母仅具有一个同系物,名为Msn4p。此外,在若干其它酵母菌中,Msn4/2仅有一个同系物,可能具有不同的名称。在黑曲霉中,Msn4/2的同系物称为Seb1。在酿酒酵母中,Msn4/2的同系物称为Com2。

MSN4(比如MSN2)编码调节一般应激反应的转录因子。在酿酒酵母中,Msn4p(比如Msn2p)通过位于C-末端的Msn4p(比如Msn2p)锌指结合结构域与位于~200个基因的启动子中的STRE元件(5'-CCCCT-3')结合来调控这些基因的表达以响应多种应激,包括热休克、渗透压休克、氧化应激、低pH、葡萄糖饥饿、山梨酸和高乙醇浓度。在它们的N-末端,Msn4p(比如Msn2p)含有转录活化结构域和核输出序列(nuclear export sequence)。此外,Msn4p(比如Msn2p)包含核定位信号,其被PKA磷酸化抑制并被蛋白磷酸酶1去磷酸化激活。在非应激条件下,Msn4p(比如Msn2p)位于细胞质中。细胞质定位部分地受TOR信号传导的调节。在应激条件下,Msn4p(比如Msn2p)被过度磷酸化,重新定位到细胞核,然后展示出周期性的核-质穿梭行为。

优选地,本发明的转录因子包含SEQ ID NOs:15-27所示的氨基酸序列。

迄今为止,还没有发现转录因子Msn4p参与增加重组POI的产量/效价,或者通常参与真核宿主细胞的重组POI的分泌。因此,令人惊讶的是,在本发明中,在真核宿主细胞中Msn4p的过表达增加了重组POI的产量/效价。

在本发明中,转录因子最初是从巴斯德毕赤酵母(Komagataella phaffi)CBS7435菌株(CBS-KNAW菌种保藏)中分离的。可以设想,转录因子可以在广泛的宿主细胞中过表达。因此,转录因子序列可以取自或衍生自其它原核生物或真核生物,而不是采用种或属的天然序列,优选地,转录因子序列可以取自或衍生自真菌宿主细胞,更优选地取自或衍生自比如巴斯德毕赤酵母(syn.Komagataella spp)、多形汉森酵母(syn.H.angusta)、里氏木霉、黑曲霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、甲醇毕赤酵母、博伊丁假丝酵母、孔玛氏酵母属种和粟酒裂殖酵母的酵母宿主细胞。优选地,转录因子衍生自巴斯德毕赤酵母(Komagataella spp)、酿酒酵母、解脂耶氏酵母或黑曲霉,更优选地,衍生自巴斯德毕赤酵母(Komagataella spp)。此外,可以使用本发明的转录因子的合成形式。如本文所用,Komagataella spp包含Komagataella属的全部种。在优选的实施方案中,转录因子衍生自Komagataella pastoris、Komagataella pseudopastoris或Komagataella phaffii。在甚至更优选的实施方案中,转录因子衍生自Komagataella pastoris或Komagataellaphaffii。

优选地,在本发明的方法、重组宿主细胞和重组宿主细胞的用途中使用的转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母、特别是Komagataella phaffi或Komagataella pastoris的Msn4p的DNA结合结构域)。因此优选地,本发明的方法、重组宿主细胞和用途在巴斯德毕赤酵母(Komagataella spp)中过表达转录因子,所述转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含SEQ ID NO:1所示的氨基酸序列。还优选地,所述至少包括包含SEQ ID NO:1所示的氨基酸序列的DNA结合结构域和激活结构域的转录因子在多形汉森酵母、里氏木霉、黑曲霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、甲醇毕赤酵母、博伊丁假丝酵母、孔玛氏酵母属种或粟酒裂殖酵母中过表达。

在本发明的方法、重组宿主细胞和重组宿主细胞的用途中使用的转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)的功能同系物。此外,本发明还考虑在本发明的方法、重组宿主细胞和重组宿主细胞的用途中使用的转录因子,所述转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)的功能同系物。优选地,在本发明的方法、重组宿主细胞和重组宿主细胞的用途中使用的转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)的功能同系物。因此,本发明的方法、重组宿主细胞和用途可进一步包括在巴斯德毕赤酵母中过表达转录因子,所述转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQID NO:87所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的氨基酸序列的功能同系物。因此,本发明的方法、重组宿主细胞和用途可进一步包括在多形汉森酵母、里氏木霉、黑曲霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、甲醇毕赤酵母、博伊丁假丝酵母、孔玛氏酵母属种或粟酒裂殖酵母中过表达转录因子,所述转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的氨基酸序列的功能同系物。

优选地,与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的氨基酸序列的功能同系物具有SEQ ID NOs:2、3、4、5、6、7、8、9、10、11和12所示的氨基酸序列。

因此,本发明的方法、重组宿主细胞和用途可进一步包括过表达转录因子,所述转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含SEQ ID NOs:1、2、3、4、5、6、7、8、9、10、11和12所示的氨基酸序列。

另外,本发明的方法、重组宿主细胞和用途可进一步涵盖在巴斯德毕赤酵母中过表达转录因子,所述转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含SEQ ID NOs:1、2、3、4、5、6、7、8、9、10、11和12所示的氨基酸序列。因此,本发明的方法、重组宿主细胞和用途可包括在多形汉森酵母、里氏木霉、黑曲霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、甲醇毕赤酵母、博伊丁假丝酵母、孔玛氏酵母属种或粟酒裂殖酵母中过表达转录因子,所述转录因子至少包含DNA结合结构域和激活结构域,所述DNA结合结构域包含SEQ ID NOs:1、2、3、4、5、6、7、8、9、10、11和12所示的氨基酸序列。

如本文所用的“DNA结合结构域”或“结合结构域”是指与转录因子所调控基因的DNA结合的转录因子的结构域。优选地,本发明的DNA结合结构域选自SEQ ID NOs:1或与SEQID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的氨基酸序列的功能同系物(比如SEQ ID NOs:2、3、4、5、6、7、8、9、10、11和12)。最优选地为SEQ ID NO:1所示的DNA结合结构域。因此,本发明还可包含SEQ ID NO:12所示的合成的DNA结合结构域。

如本文所用,SEQ ID NO:87是指MSN4/2-样C

其中位置10处的K可以与R互换;

位置11处的R可以与K互换;

位置15处的Xaa可以是Q或S;

位置19处的K可以与R互换;

位置22处的Xaa可以是任何天然存在的氨基酸;

位置25处的Xaa可以是V或L;

位置27处的S可以与T互换;

位置28处的Xaa可以是任何天然存在的氨基酸;

位置30处的K可以与R互换;

位置33处的Xaa可以是任何天然存在的氨基酸;

位置35-36处的Xaa可以是任何天然存在的氨基酸;

位置38处的Xaa可以是任何天然存在的氨基酸;

位置40处的K可以与R互换;

位置44处的S可以与T互换;

位置48处的Xaa可以是任何天然存在的氨基酸;

位置52处的R可以与K互换。

粗体字母是高度保守的,

如本文所用,本发明的转录因子的或转录因子的结合结构域的“同源物”或“同系物”意指在其一级、二级或三级结构的相应位置处具有相同或保守性残基的多肽。该术语还延伸至编码同源多肽的两个或更多个核苷酸序列。当此类同系物作为转录因子的功能或作为转录因子的结合结构域的功能被验证时,该同系物称为“功能同系物”。功能同系物与其所源自的转录因子或转录因子的结合结构域履行相同或基本相同的功能。在核苷酸序列的情况下,“功能同系物”优选意指具有与原始核苷酸序列不同的序列的核苷酸序列,但是由于简并遗传密码的使用,该核苷酸序列仍然编码相同的氨基酸序列。可以通过置换蛋白质、特别是转录因子或转录因子的结合结构域的一个或多个氨基酸来获得蛋白质、特别是转录因子或转录因子的结合结构域的功能同系物,这种氨基酸置换保留了蛋白质、特别是转录因子或转录因子的结合结构域的功能。特别地,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性和/或与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约60%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约61%的氨基酸序列同一性和与SEQID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ IDNO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约62%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约63%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约64%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约65%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ IDNO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约66%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约67%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约68%的氨基酸序列同一性和与SEQ IDNO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ IDNO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约69%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约70%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约71%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约72%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ IDNO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约73%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约74%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约75%的氨基酸序列同一性和与SEQ IDNO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ IDNO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约76%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约77%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约78%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约79%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ IDNO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约80%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约81%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约82%的氨基酸序列同一性和与SEQ IDNO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ IDNO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约83%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约84%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约85%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约86%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ IDNO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约87%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约88%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约89%的氨基酸序列同一性和与SEQ IDNO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ IDNO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约90%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约91%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约92%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约93%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ IDNO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约94%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约95%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约96%的氨基酸序列同一性和与SEQ IDNO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ IDNO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约97%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约98%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有至少约99%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。在一些实施方案中,SEQ ID NO:1所示的氨基酸序列的功能同系物与SEQ ID NO:1所示的氨基酸序列(巴斯德毕赤酵母的Msn4p的DNA结合结构域)具有约100%的氨基酸序列同一性和与SEQ ID NO:87所示的氨基酸序列(共有序列)具有至少约60%,比如至少61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的氨基酸序列同一性。

一般而言,可采用本领域已知的任何诱变程序,如定点诱变、合成基因构建、半合成基因构建、随机诱变、改组(shuffling)等等,来制备同系物。定点诱变是一项在编码亲本的多核苷酸上的一个或多个限定位点处引入一个或多个(如若干)突变的技术。可以通过涉及包含所需突变的寡核苷酸引物的应用的PCR在体外完成定点诱变。还可通过盒式诱变在体外来实施定点诱变,所述盒式诱变涉及通过限制性酶在包含编码亲本的多核苷酸的质粒中的位点上的切割和随后在该多核苷酸上的包含所述突变的寡核苷酸的连接。通常,消化所述质粒和所述寡核苷酸的限制性酶是相同的,从而允许质粒的粘性末端和插入物彼此相连。参见,如Scherer和Davis,1979,Proc.Natl.Acad.Sci.USA 76:4949-4955;和Barton等,1990,Nucleic Acids Res.18:7349-4966。还可通过本领域已知的方法在体内完成定点诱变。参见,如美国专利申请公开文本No.2004/0171 154;Storici等,2001,NatureBiotechnol.19:773-776;Kren等,1998,Nat.Med.4:285-290;和Calissano和Macino,1996,Fungal Genet.Newslett.43:15-16。合成基因构建需要体外合成设计的多核苷酸分子来编码目标多肽。可利用多种技术,如由Tian等(2004,Nature 432:1050-1054)描述的基于多路微芯片的技术及其中将寡核苷酸合成并装配至电流可编程的微流体芯片(photo-programmable microfluidic chip)上的类似技术,来实施基因合成。采用已知的诱变、重组和/或改组的方法,随后是相关的筛选程序,如由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413或WO 95/22625公开的那些,可以完成并测试单个或多个氨基酸置换、缺失和/或插入。其它可用的方法包括易出错(error-prone)PCR、噬菌体展示(如,Lowman等,1991,Biochemistry30:10832-10837;美国专利No.5,223,409;WO 92/06204)和定区域诱变(Derbyshire等,1986,Gene 46:145;Ner等,1988,DNA 7:127)。可以将诱变/改组方法与高通量、自动筛选方法组合,以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,NatureBiotechnology 17:893-896)。可自宿主细胞中回收编码活性多肽的诱变的DNA分子并采用本领域已知的标准方法对其快速测序。这些方法允许快速确定单个氨基酸残基在多肽中的重要性。通过将合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组的各个方面组合来完成半合成基因构建。半合成构建以利用合成的多核苷酸片段的过程与PCR技术组合为特征。因此,限定区域的基因可以被从头合成,而其它区域可以采用位点特异性诱变引物扩增,而还有其它区域可以经受易出错PCR或无错PCR扩增。然后,将多核苷酸子序列改组。可选地,可以从天然来源,如通过筛选其它生物的cDNA文库,或通过在核酸数据库中进行同源性搜索获得同系物,优选地为近亲或相关生物的同系物,所述近亲或相关生物比如Komagataella pastoris、Komagataella pseudopastoris或Komagataella phaffii、孔玛氏酵母属种(Komagataella spp.)、多形汉森酵母、里氏木霉、黑曲霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、甲醇毕赤酵母、博伊丁假丝酵母、孔玛氏酵母属种(Komagataellaspp.)或粟酒裂殖酵母。因此,SEQ ID NOs:2-12为SEQ ID NO:1所示的转录因子的结合结构域的功能同系物,和SEQ ID NOs:16-27为SEQ ID NO:15所示的转录因子的功能同系物。

如本文所公开的与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性的SEQ ID NO:1所示的DNA结合结构域的氨基酸序列的同系物(比如SEQ ID NOs:2、3、4、5、6、7、8、9、10、11和12)的功能,或与SEQ ID NO:15所示的氨基酸序列具有至少11%的序列同一性的SEQ ID NO:15所示的转录因子的氨基酸序列的同系物(比如SEQ ID Nos:16、17、18、19、20、21、22、23、24、25、26、27)的功能,或与SEQ ID NO:65所示的氨基酸序列具有至少50%的序列同一性的SEQID NO:65所示的另外的转录因子的DNA结合结构域的氨基酸序列的同系物(比如SEQ IDNOs:66-73)的功能,或与SEQ ID NO:74所示的氨基酸序列具有至少20%的序列同一性的SEQ ID NO:74所示的另外的转录因子的氨基酸序列的同系物的功能可以通过如下测定:提供表达盒,该表达盒中已经插入了包含SEQ ID NO:1所示的DNA结合结构域的氨基酸序列的同系物和激活结构域(如SEQ ID NO:83或84等)以及核定位信号(NLS)(如SEQ ID NO:85或86等)的转录因子,或包含SEQ ID NO:65所示的DNA结合结构域的氨基酸序列的同系物和激活结构域以及核定位信号(NLS)的另外的转录因子,或SEQ ID NO:15所示的转录因子的氨基酸序列的同系物或SEQ ID NO:74所示的转录因子的氨基酸序列的同系物,转化携带编码测试蛋白(比如实施例部分所用的模型蛋白之一或另一POI)的序列的宿主细胞,以及确定在相同条件下模型蛋白或POI的产量差异。

术语“氨基酸”是指天然存在的和合成的氨基酸,以及以与天然存在的氨基酸类似的方式发挥功能的氨基酸类似物(analog)和氨基酸模拟物(mimetic)。天然存在的氨基酸是由遗传密码编码的那些,以及之后修饰的那些氨基酸,如羟脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物是指与天然存在的氨基酸具有相同的基础化学结构的化合物,即,将碳连接至氢、羧基、氨基和R基,如高丝氨酸、正亮氨酸、蛋氨酸亚砜、蛋氨酸甲基锍。这些类似物具有修饰的R基(如正亮氨酸)或修饰的肽骨架,但是保留与天然存在的氨基酸相同的基础化学结构。氨基酸模拟物是指具有与氨基酸的一般化学结构不同的结构、但是以与天然存在的氨基酸类似的方式发挥功能的化学化合物。

“序列同一性”或“%同一性”是指使用标准化算法比对的至少两个多肽或多核苷酸序列之间的残基匹配的百分数。为了使两个序列之间的比对最佳,这种算法可以以标准化的和可重现的方式在被比较的序列中插入空位(gap),因此达到两个序列的更加有意义的比较。本发明中使用的序列同一性是指至少两个多肽序列(氨基酸序列)之间具有相同氨基酸的百分数。本发明中所列的序列相似性是指至少两个多肽序列(氨基酸序列)之间具有相似氨基酸(按照其侧链和电荷分组)的百分数。对于本发明的目的,采用NCBI BLAST程序2.2.29版本(2014年1月6日)(Altschul等,Nucleic Acids Res.(1997)25:3389-3402)测定两个氨基酸序列或核苷酸序列之间的序列同一性。可以采用设定如下参数的blastp测定两个氨基酸序列的序列同一性:矩阵:BLOSUM62,字长:3;期望值:10;空位成本:存在=11,延伸=1;过滤=低复杂性失活的;组合调整(Compositional adjustment):有条件的组合评分矩阵调整。对于本发明的目的,采用设定如下示例性参数的blastn的NCBI BLAST程序2.2.29版本(2014年1月6日)测定两个核苷酸序列之间的序列同一性:字长:28;期望值:10;空位成本:线性;过滤=低复杂性激活的;匹配/失配得分:1,-2。对于本发明的目的,还可采用BLAST和EMBOSS Needle算法测定两个氨基酸序列或核苷酸序列之间的序列同一性。通过采用EMBOSS Needle算法的所述整体配对序列比对来评估DNA结合结构域的序列同一性。将采用默认设置(矩阵:BLOSUM62;空位开放:10;空位延伸:0.5;末端空位罚分:错(false);末端空位开放:10;末端空位延伸:0.5)的EMBOSS Needle webserver(https://www.ebi.ac.uk/Tools/psa/emboss_needle/)用于配对蛋白序列比对。EMBOSS Needle读取两个输入序列,并将它们的最佳整体序列比对写入文件。其采用Needleman-Wunsch比对算法在两个序列的整体长度上寻找最佳比对(包括空位)。通过BLAST确定与巴斯德毕赤酵母KAR2、LHS1、SIL1和ERJ5的序列同一性。

如本文所用,术语“激活结构域”是指任何能够激活转录的结构域。作为激活结构域,可以将本领域技术人员已知的来自任何生物体的任何转录因子的每个激活结构域用在本发明中。优选地,对于本发明的转录因子,可以使用本文中任何限定物种的本发明的转录因子的任何激活结构域,优选地使用SEQ ID NO:83所示的激活结构域。对于另外的转录因子,也可以使用本文中任何限定物种的另外的转录因子的任何激活结构域。在进一步的实施方案中,也可以将合成的(比如SEQ ID NO:84)或病毒(如VP64)激活结构域用在本发明中以用于本发明的转录因子或用于另外的转录因子。可以通过本领域已知的方法,如通过允许检测活酵母细胞中的相互作用蛋白的酵母-2-杂交(Y2H)技术,来测量激活结构域的功能。因此,在本发明的方法、重组宿主细胞和用途中使用的转录因子至少包含DNA结合结构域和激活结构域。可优选SEQ ID NO:83或SEQ ID NO:84所示的激活结构域。还预期可以使用来自功能同系物的激活结构域。具体用于巴斯德毕赤酵母的MSN4的激活结构域可以是SEQ ID NO:83的一部分。

本发明进一步提供一种增加宿主细胞中重组目标蛋白的产量的方法,所述方法包括:i)将所述宿主细胞工程化以过表达编码本发明的至少一种转录因子的至少一种多核苷酸,所述转录因子至少包含DNA结合结构域和激活结构域,ii)将所述宿主细胞工程化以包含编码所述目标蛋白的多核苷酸,iii)在适宜条件下培养所述宿主细胞以过表达所述编码至少一种转录因子的至少一种多核苷酸并过表达所述目标蛋白,可选地iv)从细胞培养物中分离所述目标蛋白,和可选地v)纯化所述目标蛋白。

应注意,在(i)和(ii)陈述的步骤不必以所陈述的顺序实施。可以首先实施在(ii)陈述的步骤,然后实施(i)。在步骤(i)中,可以将所述宿主细胞工程化以过表达编码本发明的至少一种转录因子的至少一种多核苷酸,所述转录因子包含DNA结合结构域,所述DNA结合结构域包含SEQ ID NO:1所示的氨基酸或SEQ ID NO:1所示的氨基酸序列的功能同系物,所述功能同系物与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQID NO:87所示的氨基酸序列的具有至少60%的序列同一性。

当宿主细胞被“工程化以过表达”给定蛋白时,操作该宿主细胞以使得该宿主细胞具有表达、优选地过表达本发明的转录因子或其功能同系物的能力,由此与操作之前的相同条件下的宿主细胞相比,给定蛋白如POI或模型蛋白的表达增加。在一个实施方案中,“工程化以过表达”暗指对宿主细胞进行遗传改变以便增加蛋白的表达,如将细胞(有意地)基因工程化以过表达此类蛋白。

当将“工程化之前”或“操作之前”用于本发明的宿主细胞的上下文中时,是指这种宿主细胞没有被使用编码本发明的转录因子或其功能同系物的多核苷酸工程化。因此,所述术语还指不过表达编码本发明的转录因子或其功能同系物的多核苷酸的宿主细胞或没有被工程化以过表达编码本发明的转录因子或其功能同系物的多核苷酸的宿主细胞。因此,“工程化之前的宿主细胞”或“操作之前的宿主细胞”或“不过表达编码转录因子的多核苷酸的宿主细胞”是一种不过表达编码本发明的转录因子或其功能同系物的多核苷酸的宿主细胞或一种未工程化以过表达编码本发明的转录因子或其功能同系物的宿主细胞。此外,“工程化之前的宿主细胞”或“操作之前的宿主细胞”或“不过表达编码转录因子的多核苷酸的宿主细胞”是与其比较所述重组目标蛋白的产量增加但未过表达编码本发明的转录因子或其功能同系物的多核苷酸或未工程化以过表达编码本发明的转录因子或其功能同系物的多核苷酸的相同的宿主细胞。

如本文所用的术语“将所述宿主细胞工程化以包含编码所述目标蛋白的多核苷酸”意指用编码目标蛋白的多核苷酸装备本发明的宿主细胞,即,本发明的宿主细胞被工程化以包含编码目标蛋白的多核苷酸。这可以通过如转化或转染或用于将多核苷酸引入宿主细胞的任何其它本领域已知的适宜技术来实现。

本领域技术人员熟知用于操作如编码转录因子和/或POI的多核苷酸序列、启动子、增强子、前导区(leader)等的程序,如J.Sambrook等,Molecular Cloning:ALaboratory Manual(3rd edition),Cold Spring Harbor Laboratory,Cold SpringHarbor Laboratory Press,New York(2001)描述的。

可通过多种手段,如通过同源重组或通过采用特异性靶向在整合位点处的序列的混合重组酶(hybrid recombinase),将外源或靶多核苷酸(如编码过表达的转录因子或POI的多核苷酸)插入染色体中。典型地,上述外源或靶多核苷酸存在于载体(“插入载体”)中。典型地,在用于同源重组之前,这些载体是环状的和线性的。作为一种选择,所述外源或靶多核苷酸可以是之后被重组至宿主细胞中的通过融合PCR连接的DNA片段或合成构建的DNA片段。除了同源臂之外,载体还含有适于选择或筛选的标记、复制起点和其它元件。还可以使用实现随机或非靶向整合的异源重组。异源重组是指DNA分子与显著不同的序列之间的重组。本领域已知重组的方法,例如在Boer等,Appl Microbiol Biotechnol(2007)77:513–523中描述的。对于酵母细胞的遗传操作还可参考Primrose和Twyman的Principles ofGene Manipulation and Genomics(第七版,Blackwell Publishing2006)。

编码过表达的转录因子和/或POI的多核苷酸还可存在于表达载体上。这些载体是本领域已知的。在表达载体中,启动子置于编码异源蛋白的基因的上游,并调控所述基因的表达。由于多克隆载体的多克隆位点,其是特别有用的。对于表达,通常将启动子置于多克隆位点的上游。既可通过首先制备含有编码转录因子和/或POI的完整DNA序列的DNA构建体,并随后将这一构建体插入适宜的表达载体中,也可以通过顺序地插入含有个体元件(如,DNA结合结构域,激活结构域)遗传信息的DNA片段,然后连接,来构建用于编码转录因子和/或POI的多核苷酸的整合的载体。作为片段的限制和连接的替代,可把基于附着位点(att)的重组方法和重组酶用于将DNA序列插入载体中。这些方法由例如Landy(1989)Ann.Rev.Biochem.58:913-949描述,并是本领域技术人员已知的。

可通过将包含靶多核苷酸序列的载体或质粒引入细胞来获得根据本发明的宿主细胞。本领域熟知用于转染或转化真核细胞或者转化原核细胞的技术。这些技术可以包括脂质囊泡介导的摄取、热休克介导的摄取、磷酸钙介导的转染(磷酸钙/DNA共沉淀)、病毒感染(特别是使用经修饰的病毒诸如例如经修饰的腺病毒)、显微注射和电穿孔。对于原核转化,技术可以包括热休克介导的摄取、与完整细胞的细菌原生质体融合、显微注射和电穿孔。用于植物转化的技术包括土壤杆菌(Agrobacterium)介导的转移(诸如通过根瘤土壤杆菌(A.tumefaciens))、被快速推进的钨或金微弹、电穿孔、显微注射和聚乙二醇介导的摄取。DNA可以是单链的或双链的、线性的或环状的、松弛的或超螺旋的DNA。对于用于转染哺乳动物细胞的多种技术,参见例如Keown等(1990)Processes in Enzymology185:527-537。

短语“在适宜条件下培养所述宿主细胞以过表达所述编码至少一种转录因子的至少一种多核苷酸并过表达所述目标蛋白”是指在适合或足够获得所需化合物(POI)生产或获得或过表达本发明的转录因子的条件(如温度、压力、pH、诱导、生长速率、培养基、持续时间等)下维持和/或生长(growing)真核宿主细胞。

通过用转录因子基因和/或POI基因转化获得的根据本发明的宿主细胞可优选首先在这样的条件下培养,所述条件允许宿主细胞在没有表达重组蛋白的负担下高效生长至大的细胞数量。当细胞准备进行POI表达时,选择并优化适宜的培养条件以产生POI。

作为示例,使用针对一种或多种转录因子和一种或多种POI的不同启动子和/或拷贝和/或整合位点,可关于与一种或多种POI的表达有关的时间点和诱导强度来控制一种或多种转录因子的表达。例如,在POI表达的诱导之前,可首先表达转录因子。这样做具有如下优势:在POI翻译开始时所述转录因子已经存在。可选地,可在同一时间诱导转录因子和一种或多种POI。

可使用一施加诱导刺激就会被激活的诱导型启动子来指导在该启动子控制下的基因的转录。在有诱导刺激的生长条件下,细胞通常比在正常条件下生长得慢,但因为培养物已经在前一阶段生长至大的细胞数量,培养系统整体产生大量的重组蛋白。诱导刺激优选是适当试剂(如针对AOX-启动子的甲醇)的添加或适当营养物(如针对MET3-启动子的甲硫氨酸)的消耗。此外,乙醇、甲胺、镉或铜的添加以及热或渗透压增加剂也可诱导启动子依赖性表达,所述启动子可操作地与转录因子和一种或多种POI连接。

优选将根据本发明的宿主在生物反应器中在优化的生长条件下培养以获得至少1g/L、更优选至少10g/L细胞干重、更优选至少50g/L细胞干重的细胞密度。不仅在实验室规模中,而且在中试或工业规模中,实现这样的生物分子产量是有益的。

根据本发明,由于至少一种转录因子的过表达,即使当生物质保持较低时,仍可高产量地获得POI。因此高单位产量(specific yield)以mg POI/g干生物质衡量,在实验室、中试和工业规模中达到1至200的范围,如50至200,如100至200是可行的。当与无至少一种转录因子过表达情况下的产物表达相比时,根据本发明的生产宿主细胞的单位产量优选提供至少1.1倍,更优选至少1.2倍,至少1.3或至少1.4倍的增加,在一些情况下可以显示超过2倍的增加。

通过使用标准试验,如ELISA、活性检验、HPLC、表面等离子体共振(Biacore)、蛋白质印迹、毛细管电泳(Caliper)或SDS-Page,通过测量细胞培养上清液或细胞匀浆化后的细胞的细胞匀浆中目标蛋白的效价来测试根据本发明的宿主细胞的表达/分泌能力或产量。

优选将宿主细胞培养在含有合适碳源的矿物质培养基中,由此进一步显著地简化分离过程。作为示例,所述矿物质培养基含有可利用碳源(例如葡萄糖、甘油或甲醇)、含有常量元素(macro element)(钾、镁、钙、铵、氯化物、硫酸盐、磷酸盐)和痕量元素(铜、碘、锰、钼酸盐、钴、锌和铁盐以及硼酸)的盐。

在酵母细胞的情况下,可以用上述一种或多种表达载体中的一种或多种转化所述细胞,使这些细胞交配(mated)以形成二倍体菌株,并在被修饰为适合诱导启动子、选择转化体或扩增编码所需序列的基因的常规营养培养基中培养。本领域已知许多适于酵母菌生长的最低限度培养基。根据需要,可向这些培养基的任一种中补充盐(如氯化钠、钙、镁和磷酸盐)、缓冲液(如HEPES、柠檬酸和磷酸盐缓冲液)、核苷(如腺嘌呤和胸腺嘧啶)、抗生素、痕量元素、维生素和葡萄糖或等效能源。还可包括以适当浓度的任何其它必须的补充物,这是本领域技术人员已知的。所述培养条件(如温度、pH等)是之前与被选择用于表达的宿主细胞一起使用的条件,并且是普通技术人员已知的。针对其它类型宿主细胞的细胞培养条件也是已知的并可由技术人员容易地确定。对各种微生物的培养基的描述例如涵盖在美国生物学会(American Society for Bacteriology)的“Manual of Methods for GeneralBacteriology”手册(华盛顿D.C,USA,1981)中。

可以通过常规的培养方法,例如静止培养、试管培养、振荡培养(例如旋转振荡培养、摇瓶培养等)、掺气旋动培养(aeration spinner culture)或发酵,优选地连续或间歇地在液体培养基中培养(例如维持和/或生长)宿主细胞。在一些实施方案中,在摇瓶或深孔板中培养细胞。在另一些实施方案中,在生物反应器中(例如在生物反应器培养过程中)培养细胞。培养过程包括、但不限于,分批培养、分批进料培养和连续培养方法。术语“分批过程”和“分批培养”是指一个封闭的系统,该系统中的培养基组成、营养物、补充添加剂等在培养开始时已设定,并在培养期间不经受改变;但是,可尝试控制如pH和氧浓度的因素来阻止过度培养基酸化和/或细胞死亡。术语“分批进料过程”和“分批进料培养”是指具有以下例外的一种分批培养:随着培养的进行,添加(例如,以增量或连续方式添加)一种或多种底物或补充物。术语“连续过程”和“连续培养”是指一种系统,在该系统中将限定的培养基连续地添加至生物反应器,并同时将等量的用过的或“条件化”的培养基移除,例如用于回收所需产物。已经开发了多种这样的过程并且这些过程是本领域熟知的。

在一些实施方案中,将宿主细胞培养约12至24小时,在另一些实施方案中,将宿主细胞培养约24至36小时,约36至48小时,约48至72小时,约72至96小时,约96至120小时,约120至144小时,或培养持续时间大于144小时。在又一些实施方案中,培养持续一段足以达到POI的所需生产产量的时间。

上述提及的方法可进一步包括分离表达的POI的步骤。若所述POI是从细胞中分泌出来的,则该POI可采用现有技术从培养基中分离并纯化。POI从细胞中分泌出来通常是优选的,因为产物可以从培养上清液中回收,而不是从当细胞被破坏以释放胞内蛋白时产生的复杂蛋白混合物中回收。蛋白酶抑制剂,如苯基甲基磺酰氟(PMSF),在抑制纯化过程中的蛋白质降解可能是有益的,且可包括抗生素以阻止外来污染物的生长。可采用本领域已知的方法将组合物浓缩、过滤、透析等。可以采用分离器或管式离心机使发酵/培养后的细胞培养物离心,从而将细胞与培养物上清液分离。然后可以通过使用正切流动过滤将上清液过滤浓缩。可选地,培养的宿主细胞也可以通过超声波或机械法(如高压均质)、酶法或化学法来破裂以得到含有所需POI的细胞提取物,从该细胞提取物中可以分离和纯化到POI。

用于获得POI的分离和纯化方法可以基于利用溶解度差异的方法,比如盐析、溶剂沉淀、热沉淀;利用分子量差异的方法,比如尺寸排阻色谱、超滤和凝胶电泳;利用电荷差异的方法,比如离子交换色谱;利用特异亲和性的方法,比如亲和色谱;利用疏水性差异的方法,比如疏水相互作用色谱和反相高效液相色谱;利用等电点差异的方法,比如可以使用等电点聚集;以及利用某些氨基酸的方法,比如IMAC(固定金属离子亲和色谱)。如果将POI表达为失活的可溶性包涵体,则需要使该溶解性包涵体重新折叠。

分离和纯化的POI可以通过常规方法,比如蛋白质印迹或对POI活性的特异性检验来鉴定。纯化POI的结构可以通过氨基酸分析、氨基-末端肽测序、一级结构分析(例如通过质谱)、RP-HPLC、离子交换HPLC、ELISA等来确定。优选可以大量和高纯度水平获得POI,这样即可满足作为药物组合物中的活性成分或者作为饲料或食品添加剂的必要要求。

如本文所用,术语“分离的”是指处于自然界中未出现的形式或环境的物质。分离的物质的非限制性实例包括:(1)任何非天然存在的物质;(2)至少部分地从其在自然界中相关的天然存在的成分中的一种或多种或全部中取出的任何物质,包括但不限于任何酶、变体、核酸、蛋白质、肽或辅助因子;(3)相对于自然界中发现的物质,经由人工修饰的任何物质,如从mRNA制备的cDNA;或(4)通过相对于其天然相关的其他组分增加物质的量来修饰的任何物质(如,在宿主细胞中的重组生产;编码所述物质的基因的多个拷贝;和使用与编码所述物质的基因天然相关的启动子相比更强的启动子)。

本发明进一步提供一种通过真核宿主细胞制备重组目标蛋白的方法,所述方法包括:(i)提供被工程化以过表达编码至少一种转录因子的至少一种多核苷酸的宿主细胞,其中所述宿主细胞进一步包含编码目标蛋白的多核苷酸,其中本发明的转录因子至少包含DNA结合结构域和激活结构域,(ii)在适宜条件下培养所述宿主细胞以过表达所述编码至少一种转录因子或其功能同系物的至少一种多核苷酸并过表达所述目标蛋白,和可选地(iii)从细胞培养物中分离所述目标蛋白,和可选地(iv)纯化所述目标蛋白,和可选地(v)修饰所述目标蛋白,和可选地(vi)配制所述目标蛋白。

优选地,在步骤(i)中,将所述宿主细胞工程化以过表达编码本发明的至少一种转录因子的至少一种多核苷酸,所述转录因子包含DNA结合结构域,所述DNA结合结构域包含SEQ ID NO:1所示的氨基酸序列或SEQ ID NO:1所示的氨基酸序列的功能同系物,所述功能同系物与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性。

在本上下文中,本文所用术语“通过真核宿主细胞或在真核宿主细胞中制备重组目标蛋白”意指可以通过采用真核宿主细胞以形成重组宿主细胞来制备重组目标蛋白。由此,该真核宿主细胞可在细胞内部产生重组目标蛋白并使重组POI保持在细胞内部(细胞内的)或将该重组POI分泌至在其中培养宿主细胞的培养基中(细胞外的)。因此,可以从所述细胞培养基(细胞培养物的上清液)中或从细胞匀浆化后的细胞的细胞匀浆中分离所述POI。

在本上下文中,术语“修饰所述目标蛋白”意指该POI是经化学修饰的。本领域已知许多修饰蛋白的方法。可以将蛋白质与碳水化合物或脂质偶联。可以将POI PEG化(将POI与聚乙二醇化学偶联)或HES化(将POI与羟乙基淀粉化学偶联)以延长半衰期。还可将POI与其它部分,比如针对如人血清白蛋白的亲和结构域偶联,以延长半衰期。还可以通过蛋白酶或在水解条件下处理POI以进行剪切(cleavage),以从预序列形成活性成分或切下标签(比如用于纯化的亲和标签)。还可以将POI与其他部分,例如毒素、放射性部分或任何其它部分偶联。可以在形成二聚体、三聚体等的条件下进一步处理POI。

此外,术语“配制所述目标蛋白”是指使POI处于这样的条件下,在该条件下POI可以长时间存储。本领域已知许多不同方法均可用于稳定蛋白质。通过在纯化和/或修饰后交换其中存在POI的缓冲液,可以将POI置于它在其中更稳定的条件下。可以使用本领域已知的不同缓冲物质和添加剂,如蔗糖、温和的洗涤剂、稳定剂等。也可以通过冻干从而使POI稳定。对于一些POI,可以通过形成POI与脂质或脂蛋白的复合物(比如人工合成多聚物(polyplex)等)来进行配制。也可以将一些蛋白质与其它蛋白质共同配制。

与工程化之前的宿主细胞相比,在本发明的方法、重组宿主细胞和用途中使用的本发明的所述Msn4p转录因子(参见SEQ ID NOs:15-27)的过表达可以使模型蛋白scFv(SEQID NO.13)和/或vHH(SEQ ID NO.14)的产量增加。可以使上述模型蛋白的产量增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。如本文所用,术语“0%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%等”是指“1-倍、1.1-倍、1.2-倍、1.3-倍、1.4-倍、1.5-倍、1.6-倍、1.7-倍、1.8-倍、1.9-倍、2-倍、3-倍、4-倍、5-倍、6-倍等”。后缀“-倍”是指倍数。“1倍”表示一个整体,“2倍”表示两倍,“3倍”表示三倍。与工程化之前的宿主细胞相比,本发明的巴斯德毕赤酵母的天然转录因子Msn4p的过表达可使模型蛋白(优选scFv(SEQ ID NO.13))的产量增加至少10%,如20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。与工程化之前的宿主细胞相比,本发明的合成的转录因子synMsn4p的过表达可使模型蛋白(优选vHH(SEQ ID NO.14))的产量增加至少10%,如20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。

优选地将编码在本发明的方法、重组宿主细胞和用途中使用的转录因子的多核苷酸和/或编码在本发明的方法、重组宿主细胞和用途中使用的POI的多核苷酸整合至所述宿主细胞的基因组中。术语“基因组”通常是指以DNA(或对于某些病毒物种以RNA)编码的生物体的全部遗传信息。基因组可存在于染色体中、质粒或载体中或两者兼有。优选地,将编码转录因子的多核苷酸整合至所述细胞的染色体中。

可以通过将相关基因各自连接(ligating)至一个载体中,使编码转录因子和POI的多核苷酸重组于所述宿主细胞中。可以构建携带所述基因的单一载体,或两个单独的载体,其中一个携带转录因子基因而另一个携带POI基因。可通过采用一种或多种所述载体转化宿主细胞,将这些基因整合至所述宿主细胞的基因组中。在一些实施方案中,将编码POI的基因整合在所述基因组中,而将编码转录因子的基因整合在质粒或载体中。在一些实施方案中,将编码转录因子的基因整合在所述基因组中,而将编码POI的基因整合在质粒或载体中。在一些实施方案中,将编码POI和转录因子的基因均整合在所述基因组中。在一些实施方案中,将编码POI和转录因子的基因整合在质粒或载体中。若采用编码POI的多个基因,则可将编码POI的一些基因整合在所述基因组中,而将另一些基因整合在相同或不同的质粒或载体中。若采用编码转录因子的多个基因,则可将编码转录因子的一些基因整合在所述基因组中,而将另一些基因整合在相同或不同的质粒或载体中。

可以将编码转录因子或其功能同系物的多核苷酸整合在其天然基因座上。“天然基因座”是指在特定染色体上的位置,其中编码转录因子的多核苷酸位于例如编码本发明的转录因子的基因的天然基因座。然而,在另一个实施方案中,存在于宿主细胞的基因组中的编码转录因子的多核苷酸未在它们的天然基因座上,而是被异位地整合。术语“异位的整合”是指在微生物基因组中不是其通常染色体基因座的位点处的核酸的插入,即预定的或随机的整合。在另一个实施方案中,可以将编码转录因子或其功能同系物的多核苷酸整合在其天然基因座上和异位地整合。

对于酵母细胞,可以将编码转录因子的多核苷酸和/或编码POI的多核苷酸插入所需的基因位,比如但不限于AOX1、GAP、ENO1、TEF、HIS4(Zamir等,Proc.NatL Acad.Sci.USA(1981)78(6):3496-3500)、HO(Voth等,Nucleic Acids Res.2001June 15;29(12):e59)、TYR1(Mirisola等,Yeast 2007;24:761–766)、His3、Leu2、Ura3(Taxis等,BioTechniques(2006)40:73-78)、Lys2、ADE2、TRP1、GAL1、ADH1、RGI1或核糖体RNA基因座。

在其它实施方案中,可以将编码至少一种转录因子的多核苷酸和/或编码POI的多核苷酸整合在质粒或载体中。术语“质粒”和“载体”包括自主复制的核苷酸序列以及基因组整合的核苷酸序列。技术人员能够依据所使用的宿主细胞选用合适的质粒或载体。

优选地,所述质粒是真核表达载体,优选为酵母表达载体。

质粒可用于在适宜的宿主生物体中克隆的重组核苷酸序列(即重组基因)的转录和它们mRNA的翻译。质粒还可用于通过本领域已知的方法,如J.Sambrook等,MolecularCloning:A Laboratory Manual(3rd edition),Cold Spring Harbor Laboratory,ColdSpring Harbor Laboratory Press,New York(2001)描述的方法,将靶多核苷酸整合至宿主细胞基因组中。“质粒”通常包括用于自主复制的起点、选择标记、多个限制性酶切割位点、适宜的启动子序列和转录终止子,所述组份可操作地连接在一起。将编码多肽的目标序列可操作地连接至在宿主细胞中提供多肽表达的转录和翻译调控序列。

当核酸被置于与相同核酸分子上的另一核酸序列的功能关系中时,该核酸是“可操作地连接”的。例如,当启动子能够作用于重组基因的编码序列的表达时,该启动子与该重组基因的编码序列是可操作地连接的。

在每个细菌细胞中,大多数质粒以仅一个拷贝存在。但是,一些质粒以较多拷贝数存在。例如,对于大肠杆菌的每条染色体,质粒ColE1通常以10至20个质粒拷贝存在。如果质粒中包含本发明的核苷酸序列,则每个宿主细胞中,该质粒可具有1-10、10-20、20-30、30-100或更多的拷贝数。使用高拷贝数的质粒,可以通过细胞过表达转录因子。

本领域技术人员已知大量适宜的质粒或载体,并且很多质粒或载体是商购可获得的。Sambrook等编辑,Molecular Cloning:A Laboratory Manual(2nd Ed.),Vols.1-3,Cold Spring Harbor Laboratory(1989),和Ausubel等编辑,Current Protocols inMolecular Biology,John Wiley&Sons,Inc.,New York(1997)中提供了适宜的载体的实例。

本发明的载体或质粒涵盖包含端粒(telomeric)、着丝粒(centromeric)和复制的起点(复制起点)序列的酵母人工染色体,所述酵母人工染色体是指可以被遗传修饰为含有异源DNA序列(如,大到3000kb的DNA序列)的DNA构建体。

本发明的载体或质粒还涵盖包含复制的起点序列(Ori)并可包含一个或多个解旋酶(如parA、parB和parC)的细菌人工染色体(BAC),所述细菌人工染色体是指可以被遗传修饰为含有异源DNA序列(如,大到300kb的DNA序列)的DNA构建体。

将酵母作为宿主的质粒的实例包括YIp型载体、YEp型载体、YRp型载体、YCp型载体(在如Romanos等,1992,Yeast.8(6):423-488中描述了Yxp载体)、pGPD-2(在Bitter等,1984,Gene,32:263-274中进行了描述)、pYES、pAO815、pGAPZ、pGAPZα、pHIL-D2、pHIL-S1、pPIC3.5K、pPIC9K、pPICZ、pPICZα、pPIC3K、pPINK-HC、pPINK-LC(均可自Thermo FisherScientific/Invitrogen获得)、pHWO10(在Waterham等,1997,Gene,186:37-44中进行了描述)、pPZeoR、pPKanR、pPUZZLE和比如pPM2d、pPM2aK21或pPM2eH21的pPUZZLE-衍生物(在Stadlmayr等,2010,J Biotechnol.150(4):519-29.;Marx等,2009,FEMS Yeast Res.9(8):1260-70.中进行了描述);GoldenPiCS系统(由骨架BB1、BB2和BB3aK/BB3eH/BB3rN组成);pJ-载体(如pJAN、pJAG、pJAZ及其衍生物;均可自BioGrammatics,Inc获得)、pJexpress-载体、pD902、pD905、pD915、pD912及其衍生物、pD12xx、pJ12xx(均可自ATUM/DNA2.0获得)、pRG质粒(在Gnügge等,2016,Yeast 33:83–98中进行了描述)2μm质粒(在如Ludwig等,1993,Gene 132(1):33-40中进行了描述)。这些载体是已知的,并且例如描述在Cregg等,MolBiotechnol.(2000)16(1):23-52或Ahmad等,2014.,Appl Microbiol Biotechnol.98(12):5301-17中。通过例如由Lee等,2015,ACS Synth Biol.4(9):975-986;Agmon等,2015,ACSSynth.Biol.,4(7):853–859或Wagner和Alper,2016,Fungal Genet Biol.89:126-136描述的先进的模块化克隆技术可以容易地产生其他合适的载体。另外,这些以及其它适宜的载体还可以自Addgene,Cambridge,MA,USA获得。

优选地,将GoldenPiCS系统的BB1质粒用于通过采用特异性限制性酶引入本发明的转录因子的基因片段(表1)。然后如Prielhofer等,2017所述,可以将携带各自编码序列的组装的BB1进一步在GoldenPiCS系统中进行处理以创建所需的BB3整合质粒。

编码在本发明的方法、重组宿主细胞和用途中使用的至少一种转录因子的多核苷酸可编码异源或同源转录因子。

如本文所用,术语“异源(的)”意指源自具有不同基因组背景的细胞或生物体(优选酵母)或合成序列。因此,“异源转录因子”是源自外源(或物种,例如酿酒酵母的Msn4p或synMsn4p)的一种,并将其用于除外源以外的来源(或物种,例如巴斯德毕赤酵母)中。术语“同源(的)”意指源自具有相同基因组背景的相同细胞或生物体。因此,“同源转录因子”是源自相同来源(或物种,例如巴斯德毕赤酵母的Msn4p)的一种,并将其用于相同的来源(或物种,例如巴斯德毕赤酵母)。

一般而言,可通过如下详细描述的本领域技术人员已知的任何方法实现过表达。可通过提高基因的转录/翻译,如通过提高所述基因的拷贝数或者改变或修饰调控序列来实现过表达。例如,可以通过引入一个或多个拷贝的与调控序列(如启动子)可操作地连接的编码转录因子或其功能同系物的多核苷酸序列,实现过表达。例如,为了达到高表达水平,可将所述基因可操作地连接至强的组成型启动子。这种启动子可以是内源性启动子或重组启动子。可选地,可以将调控序列移除从而使表达变为组成型的。人们可以用增加基因表达的或导致基因组成型表达的异源启动子替换给定基因的天然启动子。例如,与工程化之前的并在相同条件下培养的宿主细胞相比,所述宿主细胞可以大于10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%或大于300%过表达转录因子。此外,还可通过以下方式实现过表达,例如修饰特定基因的染色体位置;改变与特定基因相邻的核酸序列,所述特定基因如核糖体结合位点或转录终止子;修饰与所述基因的转录和/或与所述基因产物的翻译相关的蛋白(如,调控蛋白、抑制子、增强子、转录激活因子等等);或任何其它本领域常规的使特定基因表达失调的常规技术(包括但不限于,反义核酸分子的应用,例如以阻断阻遏蛋白的表达,或者缺失或突变通常抑制需要过表达的基因的表达的转录因子的基因)。延长mRNA的寿命也可提高表达水平。例如,某些终止子区可用于延长mRNA的半衰期(Yamanishi等,Biosci.Biotechnol.Biochem.(2011)75:2234和US 2013/0244243)。若包括多个拷贝的基因,这些基因既可以位于可变拷贝数的质粒中,也可以是在染色体中整合的并扩增的。若所述宿主细胞不包含编码转录因子的基因,则可以将该基因引入宿主细胞用于表达。此时,“过表达”是指采用本领域技术人员已知的任何方法表达所述基因产物。

本领域技术人员将在Martin等(Bio/Technology 5,137-146(1987))、Guerrero等(Gene 138,35-41(1994))、Tsuchiya和Morinaga(Bio/Technology 6,428-430(1988))、Eikmanns等(Gene 102,93-98(1991))、EP 0 472 869、US 4,601,893、Schwarzer和

因此,可以通过交换或修饰与编码异源转录因子的多核苷酸可操作地连接的调控序列来实现编码在本发明的方法、重组宿主细胞和用途中使用的异源转录因子的所述多核苷酸的过表达。在本上下文中,“调控序列(元件)”是核酸分子的片段,其能够增加或降低生物体内特定基因的表达。正调控序列能够增加表达,而负调控序列能够降低表达。调控序列(元件)包括例如启动子、增强子、沉默子、多腺苷酸化信号、转录终止子(终止子序列)、编码序列,内部核糖体进入位点(IRES)等。正调控序列可包括但不限于增强子。负调控序列可包括但不限于沉默子。在本上下文中提及交换调控序列,是指用更有效的终止子序列交换所述异源转录因子的天然终止子序列,或用密码子优化的编码序列交换所述异源转录因子的编码序列(所述密码子优化根据所述宿主细胞的密码子选择(codon-usage)进行),或用更有效的调控元件交换所述异源转录因子的天然正调控元件。

可以通过将处于启动子控制下的一个或多个拷贝的编码异源转录因子的多核苷酸引入宿主细胞,来进一步实现编码在本发明的方法、重组宿主细胞和用途中使用的异源转录因子的多核苷酸的过表达。

本文所用术语“启动子”是指有助于特定基因的转录的区域。与无启动子存在时所表达的重组产物的量相比,启动子通常使从核苷酸序列表达的重组产物的量增加。可利用源自一个生物体的启动子来增强从源自另一生物体的序列的重组产物表达。可以通过采用本领域已知的方法的同源重组来将启动子整合至宿主细胞染色体中(如,Datsenko等,Proc.Natl.Acad.Sci.U.S.A.,97(12):6640-6645(2000))。此外,一个启动子元件能够增加串联连接的多个序列所表达的产物的量。因此,一个启动子元件能够增强一种或多种重组产物的表达。可以通过启动子的转录效率来评估启动子活性。可通过测量从该启动子的mRNA转录的量来直接地测定启动子活性,如通过RNA印迹法、定量PCR,或通过测量自该启动子表达的基因产物的量来间接地测定启动子活性。

启动子可以是“诱导型启动子”或“组成型启动子”。“诱导型启动子”是指可以被某些因子的存在或缺少诱导的启动子,“组成型启动子”是指允许启动子的一种或多种相关基因连续转录的不受诱导而始终具有活性的启动子。

在优选的实施方案中,编码转录因子的核苷酸序列和编码POI的核苷酸序列的转录均被诱导型启动子驱动。在另一优选的实施方案中,编码转录因子的核苷酸序列和编码POI的核苷酸序列的转录均被组成型启动子驱动。在还一优选的实施方案中,编码转录因子的核苷酸序列的转录被组成型启动子驱动,编码POI的核苷酸序列的转录被诱导型启动子驱动。在另又一优选的实施方案中,编码转录因子的核苷酸序列的转录被诱导型启动子驱动,编码POI的核苷酸序列的转录被组成型启动子驱动。例如,编码转录因子的核苷酸序列的转录可以被组成型GAP启动子驱动,编码POI的核苷酸序列的转录可以被诱导型AOX启动子驱动。在一个实施方案中,就启动子活性、启动子调控和/或表达行为,编码转录因子和POI的核苷酸序列的转录被相同的启动子或相似的启动子驱动。在另一实施方案中,就启动子活性、启动子调控和/或表达行为,编码转录因子和POI的核苷酸序列的转录被不同的启动子驱动。

在Mattanovich等,Methods Mol.Biol.(2012)824:329-58中描述了与酵母宿主细胞一起使用的适宜的启动子序列,包括如磷酸丙糖异构酶(TPI)、3-磷酸甘油酸激酶(PGK)、葡萄糖-6-磷酸异构酶(PGI)、甘油醛-3-磷酸脱氢酶(GAPDH或GAP)的糖酵解酶及其变体的启动子,乳糖酶(LAC)和半乳糖苷酶(GAL)的启动子、翻译延伸因子启动子(PTEF),和巴斯德毕赤酵母烯醇化酶1(ENO1)、磷酸丙糖异构酶(TPI)、核糖体亚基蛋白(PRPS2、PRPS7、PRPS31、PRPL1)的启动子,醇氧化酶启动子(AOX)或其具有修饰特性的变体,甲醛脱氢酶启动子(FLD),异柠檬酸裂合酶启动子(ICL),α-酮异己酸脱羧酶启动子(THI),热休克蛋白家族成员(SSA1、HSP90、KAR2)、6-磷酸葡糖酸脱氢酶(GND1)、磷酸甘油酸变位酶(GPM1)、转酮酶(TKL1)、磷脂酰肌醇合成酶(PIS1)、铁-O2-氧化还原酶(ferro-O2-oxidoreductase)(FET3)、高亲和力铁通透酶(FTR1)、抑制性碱性磷酸酶(PHO8)、N-肉豆蔻酰基转移酶(NMT1)、信息素应答转录因子(MCM1)、泛素(UBI4)、单链DNA核酸内切酶(RAD2)的启动子、线粒体内膜的主要ADP/ATP载体的启动子(PET9)(WO2008/128701)和甲酸脱氢酶(FMD)启动子。Prielhofer等,2017(BMC Syst Biol.11(1):123.)、Gasser等,2015(Microb CellFact.14:196.)、Portela等,2017.(ACS Synth Biol.6(3):471-484.)或Vogl等,2016(ACSSynth Biol.5(2):172-86.)描述了其它适宜的启动子。AOX启动子可被甲醇诱导和被如葡萄糖抑制。

适宜的启动子的进一步实例包括酿酒酵母烯醇化酶(ENO-1)、半乳糖激酶(GAL1)、醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)、丙糖磷酸异构酶(TPI)、金属硫蛋白(CUP1)、3-磷酸甘油酸激酶(PGK)的启动子和麦芽糖酶基因启动子(MAL)。

Romanos等,1992,Yeast 8:423-488描述了酵母宿主细胞的其它有用启动子。

本发明的异源转录因子(如synMsn4p)的每个编码序均可以与GAP启动子组合至整合质粒(优选BB3)中。

可以通过使用驱动编码同源转录因子的多核苷酸表达的启动子来实现编码在本发明的方法、重组宿主细胞和用途中使用的同源转录因子的所述多核苷酸的过表达。为了实现高表达水平,可以用另一个更强的启动子替换可操作地连接至内源性同源转录因子的内源性/天然启动子。这种启动子可以是诱导型的或组成型的。可以通过采用本领域已知的方法的突变或同源重组来实施内源性启动子的修饰和/或替换。

本发明的同源转录因子(如若在巴斯德毕赤酵母中表达,为巴斯德毕赤酵母的天然Msn4p)的每个编码序均可以与强组成型或诱导型启动子(比如GAP启动子、pTHI11、pSBH17或pPOR1等)组合至整合质粒(比如BB3)中。

可通过本领域已知的其它方法,例如通过如Marx等,2008(Marx,H.,Mattanovich,D.和Sauer,M.Microb Cell Fact 7(2008):23)和Pan等,2011(Pan等,FEMS Yeast Res.(2011)May;(3):292-8)描述的遗传修饰转录因子的内源性调控区域来实现编码转录因子的多核苷酸的过表达,这种方法包括,例如增加转录因子表达的重组启动子的整合。转化描述于Cregg等,(1985)Mol.Cell.Biol.5:3376-3385。

因此,本发明可包括,进一步通过交换或修饰可操作地连接至编码同源转录因子的多核苷酸的调控序列来实现编码在本发明的方法、重组宿主细胞和用途中使用的同源转录因子的所述多核苷酸的过表达。

在本上下文中提及交换调控序列,是指例如用更有效的终止子序列交换所述同源转录因子的天然终止子序列,或用密码子优化的编码序列交换所述同源转录因子的编码序列(所述密码子优化根据所述宿主细胞的密码子选择进行),或用更有效的正调控元件交换所述同源转录因子的天然正调控元件。

如在本上下文使用的,术语“修饰调控序列”意指另一正调控序列的添加或负调控序列的缺失。因此,修饰调控序列是指引入/添加所述同源/异源转录因子(元件)的天然表达盒中不存在的另一正调控序列,或使所述同源/异源转录因子的天然表达盒中通常存在的负调控序列(元件)缺失。天然表达盒是指编码蛋白质的序列,其包括参与所述蛋白质表达的负或正调控的5'和3'侧翼序列,比如启动子、终止子、多腺苷酸化信号等,其天然存在于细胞中且不是人利用重组基因技术人工产生的。可能存在异源以及同源天然表达盒。如果将来自一个物种的表达盒转移到另一物种并且仍然导致由所述天然表达盒编码的蛋白质的表达,则将该天然表达盒看作是异源天然表达盒。

可以通过将处于启动子控制下的一个或多个拷贝的编码同源转录因子的多核苷酸引入宿主细胞,来进一步实现编码在本发明的方法、重组宿主细胞和用途中使用的同源转录因子的多核苷酸的过表达。

编码在本发明的方法、重组宿主细胞和用途中使用的至少一种转录因子的多核苷酸的过表达通过如下实现:i)用与编码同源转录因子的多核苷酸可操作地连接的不同启动子(如更强的启动子)交换所述同源转录因子的天然启动子,ii)用更有效的终止子序列交换所述异源和/或同源转录因子的天然终止子序列,iii)用密码子优化的编码序列(比如优化了mRNA稳定性或半衰期或使用最频繁的密码子等)交换所述异源和/或同源转录因子的编码序列,所述密码子优化根据所述宿主细胞的密码子选择进行,iv)用更有效的调控元件交换所述异源和/或同源转录因子的天然正调控元件,v)引入另一正调控元件,所述正调控元件不存在于所述同源转录因子的天然表达盒中,vi)使负调控元件缺失,所述负调控元件通常存在于所述同源转录因子的天然表达盒中,或vii)引入一个或多个拷贝的编码异源和/或同源转录因子的多核苷酸,或其组合。

本发明可进一步包括在本发明的方法、重组宿主细胞和用途中使用的转录因子,所述转录因子包含SEQ ID NOs:15-27所示的氨基酸序列或SEQ ID NO:15所示的氨基酸序列的功能同系物,所述功能同系物与SEQ ID NO:15所示的氨基酸序列具有至少11%的序列同一性。在进一步的实施方案中,本发明可进一步包括在本发明的方法、重组宿主细胞和用途中使用的转录因子,所述转录因子包含SEQ ID NOs:15-27所示的氨基酸序列或SEQ IDNO:15所示的氨基酸序列的功能同系物,所述功能同系物与SEQ ID NO:15所示的氨基酸序列具有至少11%,比如15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%或甚至100%的序列同一性。

在本发明的方法、重组宿主细胞和用途中使用的转录因子可另外包含任何核定位信号(NLS)。因此,本发明的转录因子可包含如本文其它地方所述的DNA结合结构域、本文其它地方所述的任何激活结构域以及任何NLS。在具体上下文中的任何NLS可包括本文所述的合成NLS(比如SEQ ID NO:86)或病毒NLS或本发明的转录因子或任何物种的其它蛋白的NLS。NLS是一种“标记”蛋白质的氨基酸序列,该蛋白质通过核转运进入细胞核。典型地,NLS由暴露于蛋白质表面的带正电荷的赖氨酸或精氨酸的一个或多个短序列组成。优选地将SEQ ID NO:85(预测的巴斯德毕赤酵母的Msn4p的NLS:EPRKKETKQRKRAK;根据SeqNLS的最佳预测(得分>0.89);http://mleg.cse.sc.edu/seqNLS/MainProcess.cgi)或SEQ ID NO:86(synMsn4p的NLS:PKKKRKV)所示的氨基酸序列用作本发明的NLS。

核定位信号可以是同源或异源NLS。在本上下文中,术语“异源NLS”是指源自外源(或物种,例如源自酿酒酵母的NLS或人NLS,还参见Weninger等,2015.FEMS Yeast Res.15:7)的NLS或合成序列,并将其用于除外源以外的来源(或物种,例如巴斯德毕赤酵母)中。术语“同源NLS”是源自相同来源(或物种,如巴斯德毕赤酵母的NLS)的一种,并将其用于相同的来源(或物种,如巴斯德毕赤酵母)。

本发明可进一步包括在本发明的方法、重组宿主细胞和用途中使用的转录因子,其中所述转录因子不刺激用于表达目的蛋白的启动子。由此,其意味着本发明的转录因子对POI的启动子无影响。相反,它对除POI以外的其他蛋白质的启动子有影响。在本上下文中,术语“不刺激”或“无刺激”意指完全不影响POI的启动子或对POI的启动子有轻微影响,由此导致POI的产量少量增加约10%或更少,比如所述POI的产量增加1%、2%、3%、4%、5%、6%、7%、8%、9%或10%。

本发明的方法、重组宿主细胞和用途采用真核细胞作为宿主细胞。如本文所用,“宿主细胞”是指能够表达蛋白质和可选地能够分泌蛋白质的细胞。此类宿主细胞应用在本发明的方法中。基于此目的,对于过表达编码至少一种转录因子的至少一种多核苷酸的宿主细胞,编码所述转录因子的多核苷酸序列存在于该细胞中或被引入了该细胞中。真核细胞的实例包括、但不限于:脊椎动物细胞、哺乳动物细胞、人细胞、动物细胞、无脊椎动物细胞、植物细胞、线虫细胞、昆虫细胞、干细胞、真菌细胞或酵母细胞。

优选地,真核宿主细胞为真菌细胞。更优选地为酵母宿主细胞。酵母细胞的实例包括但不限于:酵母属(如酿酒酵母、克鲁维酵母(Saccharomyces kluyveri)、葡萄汁酵母菌(Saccharomyces uvarum))、Komagataella属(Komagataella pastoris、Komagataellapseudopastoris或Komagataella phaffii)、克鲁维酵母属(如,乳酸克鲁维酵母、马克思克鲁维酵母(Kluyveromyces marxianus))、假丝酵母属(如产朊假丝酵母(Candina utilis)、可可假丝酵母(Candida cacaoi))、地霉属(如,发酵地霉(Geotrichum fermentans))以及多形汉森酵母和解脂耶氏酵母。

在优选的实施方案中,毕赤酵母属是特别感兴趣的。毕赤酵母属包含许多种,包括巴斯德毕赤酵母(Pichia pastoris)种、甲醇毕赤酵母(Pichia methanolica)种、克鲁维毕赤酵母(Pichia kluyveri)种和安格斯毕赤酵母(Pichia angusta)种。最优选的是巴斯德毕赤酵母种。

已将前巴斯德毕赤酵母种分类并重新命名为Komagataella pastoris、Komagataella phaffii和Komagataella pseudopastoris。因此巴斯德毕赤酵母与Komagataella pastoris、Komagataella phaffii和Komagataella pseudopastoris是同义词。

用于本发明的巴斯德毕赤酵母菌株的实例是X33及其亚型GS115、KM71、KM71H;CBS7435(mut+)及其亚型CBS7435 mut

根据进一步优选的实施方案,酵母宿主细胞选自巴斯德毕赤酵母(Komagataellaspp)、多形汉森酵母、里氏木霉、黑曲霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、甲醇毕赤酵母、博伊丁假丝酵母、孔玛氏酵母属种(Komagataella spp)和粟酒裂殖酵母(Schizosaccharomyces pombe)。这些酵母菌株可从细胞储存库比如American TissueCulture Collection(ATCC)、德国布伦瑞克的“Deutsche Sammlung von Mikroorganismenund Zellkulturen”(DSMZ)或荷兰乌特勒支的Dutch“Centraalbureau voorSchimmelcultures”(CBS)处获得。

本发明进一步包括在本发明的方法、重组宿主细胞和用途中使用的重组目标蛋白可以是酶。优选的酶是可用于如制备洗涤剂、淀粉、燃料、纺织品、纸浆和纸、油、个人护理产品或如烘烤、有机合成等工业应用的那些(参见Kirk等,Current Opinion inBiotechnology(2002)13:345-351)。

本发明进一步包括重组目标蛋白可以是治疗性蛋白。POI可以是但不限于适合作为如抗原结合蛋白的生物制药物质的蛋白,比如本文更详细描述的例如抗体或抗体片段、或抗体衍生的骨架、单结构域抗体及其衍生物,其它非抗体衍生亲和骨架,比如抗体模拟物、生长因子、激素、疫苗等。

这些治疗性蛋白包括但不限于:胰岛素、胰岛素样生长因子、hGH、tPA、细胞因子,如诸如IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、IL-14、IL-15、IL-16、IL-17、IL-18的白细胞介素、干扰素(IFN)α、IFNβ、IFNγ、IFNω或IFNτ、肿瘤坏死因子(TNF)TNFα和TNFβ、TRAIL;G-CSF、GM-CSF、M-CSF、MCP-1和VEGF。

治疗性蛋白的进一步实例包括凝血因子(VII、VIII、IX)、镰刀菌属碱性蛋白酶、降钙素、CD4受体达贝泊汀(darbepoetin)、DNA酶(囊性纤维化)、促红细胞生成素、eutropin(人生长激素衍生物)、促卵泡激素(促滤泡素)、明胶、胰高血糖素、葡糖脑苷脂酶(戈谢病)、源自黑曲霉(A.niger)的葡糖淀粉酶、源自黑曲霉的葡萄糖氧化酶、促性腺激素、生长因子(GCSF、GMCSF)、生长激素(生长激素(somatotropine))、乙肝疫苗、水蛭素、人抗体片段、人载脂蛋白AI、人降钙素前体、人胶原酶IV、人表皮生长因子、人胰岛素样生长因子、人白细胞介素6、人层粘连蛋白、人前脱脂蛋白AI、人血清白蛋白、胰岛素、胰岛素和突变蛋白、胰岛素、干扰素α和突变蛋白、干扰素β、干扰素γ(突变蛋白)、白细胞介素2、促黄体生成激素、单克隆抗体5T4、小鼠胶原蛋白、OP-1(成骨的,神经保护因子)、奥普瑞白介素(白细胞介素11-激动剂)、有机磷酸水解酶(organophosphohydrolase)、PDGF-激动剂、肌醇六磷酸酶、血小板衍化生长因子(PDGF)、重组血纤溶酶原激活剂G、葡萄球菌激酶、干细胞因子、破伤风毒素片段C、组织型纤溶酶原激活物和肿瘤坏死因子(参见Schmidt,Appl MicrobiolBiotechnol(2004)65:363-372)。

优选地,治疗性蛋白是抗原结合蛋白。更优选地,治疗性蛋白包含抗体、抗体片段或抗体模拟物。甚至更优选地,治疗性蛋白是抗体或抗体片段。

在优选的实施方案中,所述蛋白是抗体片段。术语“抗体”旨在包括含有具有适合并识别表位的特异性形状的分子结构的任何多肽链,其中一个或多个非共价结合相互作用稳定该分子结构与所述表位之间的复合物。原型的抗体分子是免疫球蛋白,且来自所有来源(如人、啮齿动物、兔、牛、羊、猪、狗、其它哺乳动物、鸡、其它禽类等)的所有类型的免疫球蛋白(IgG、IgM、IgA、IgE、IgD、IgY等)都被认为是“抗体”。例如,抗体片段可包括但不限于:Fv(一种包含VL和VH的分子)、单链Fv(scFV)(一种包含由肽连接子连接的VL和VH的分子)、Fab、Fab'、F(ab')

目标蛋白可进一步为食品添加剂。食品添加剂是如在食品、饲料或化妆品中使用的用作营养的、膳食的(dietary)、消化的、补充剂的蛋白。所述食品可以是,例如,肉汤、甜点、谷物棒、糕饼(confectionery)、运动饮料、膳食产品或其他营养产品。“食品”是指旨在或适合用于人食用、摄入、消化的任何天然或人工饮食膳食等或这些膳食的组份。

目标蛋白可进一步为饲料添加剂。可用作饲料添加剂的酶的实例包括植酸酶、木聚糖酶和β-葡聚糖酶。

本发明的方法、重组宿主细胞和用途可进一步包括在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码至少一种ER辅助蛋白的至少一种多核苷酸。在本上下文中,术语“ER”是指“内质网”。优选地,通过进一步在所述宿主细胞中过表达编码至少一种ER辅助蛋白的至少一种多核苷酸,使与过表达编码至少一种转录因子的至少一种多核苷酸但不过表达编码至少一种ER辅助蛋白的至少一种多核苷酸的宿主细胞相比,重组目标蛋白的产量增加。

如本文所用,术语“编码至少一种ER辅助蛋白的至少一种多核苷酸”意指编码一种ER辅助蛋白的一种多核苷酸,编码至少两种ER辅助蛋白的两种多核苷酸,编码三种ER辅助蛋白的三种多核苷酸等。

术语“ER辅助蛋白”是指伴侣分子、辅助伴侣分子和/或核苷酸交换因子。本文所用术语“伴侣分子”是指协助其他多肽的折叠、解折叠、装配或解装配的多肽。伴侣分子是指这样的蛋白质,其参与新翻译的真核胞质蛋白和分泌蛋白的正确折叠或解折叠和转运。有许多不同的伴侣分子家族,每个家族以不同的方式协助蛋白质折叠。有ER伴侣分子和胞质伴侣分子。

酵母细胞中的胞质伴侣分子包括但不限于Ssa1p、Ssa2p、Ssa3p、Ssa4p、Ssb1p、Ssb2p、Sse1p、Sse2p,它们是指Hsp70系统。Ssa1-4p参与新合成蛋白质的折叠以及中间蛋白质向ER和线粒体的转运。Ssb1p和Ssb2p参与核糖体结合的初生链的折叠,Sse1p和Sse2p作为Ssap和Ssbp的核苷酸交换因子。Ydj1p和Sis1p属于酵母中的Hsp40系统,它们作为辅助伴侣分子与触发Ssa1-4p水解ATP的非天然多肽相互作用,并参与跨膜的蛋白质运输。Snl1p、Fes1p、Cns1p是Ssa1-4p的其他辅助伴侣分子(Chang等,Cell 128(2007))。在本上下文中,术语“辅助伴侣分子”是指在蛋白质折叠和其他功能上协助伴侣分子的蛋白质。辅助伴侣分子是非受辅者结合分子(non-client binding molecule),其协助由Hsp70和Hsp90介导的蛋白质折叠。

酵母细胞中ER伴侣分子包括但不限于例如Kar2p,其是指Hsp70系统或Pdi1p。Kar2p参与蛋白质向ER的易位,与未装配/错误折叠的ER蛋白亚基结合并调节未折叠的蛋白应答(UPR)。Kar2p与其辅助伴侣分子(比如Lhs1p、Sil1p、Erj5p、Sec63p、Scj1p、Jem1p或本领域已知的其它种类)相互作用。Lhs1p和Sil1p是指Kar2p的核苷酸交换因子,并属于Hsp70系统(Chang等,Cell 128(2007))。在本上下文中,术语“核苷酸交换因子”是指一种刺激核苷二磷酸(ADP、GDP)交换(替换)为与其他蛋白质(优选伴侣分子)结合的核苷三磷酸(ATP、GTP)的蛋白质。Erj5p、Sec63和Scj1属于Hsp40型蛋白这一组。例如,Erj5p是具有J结构域的I型膜蛋白;其是保持内质网的折叠能力所需要的;非必需的ERJ5基因的缺失会导致组成型地诱导的未折叠蛋白应答(Mehnert等,Molecular biology of the cell,26(2014))。

可以将取自巴斯德毕赤酵母(Komagataella pastoris或Komagataellaphaffii)、多形汉森酵母、里氏木霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、博伊丁假丝酵母、黑曲霉,优选地取自巴斯德毕赤酵母(Komagataella pastoris或Komagataellaphaffii)的至少一种ER辅助蛋白用于另外的过表达或用于工程化宿主细胞以另外地过表达。还可以将来自其他真核物种的最接近的同系物用作所述至少一种ER辅助蛋白。

优选地,另外地在所述宿主细胞中过表达的本发明的所述ER辅助蛋白具有SEQ IDNO:28所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:28所示的氨基酸序列(巴斯德毕赤酵母的Kar2p)具有至少70%,比如至少71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的序列同一性。优选地,SEQ ID NO:28的功能同系物为SEQ ID NOs:29-36。因此,另外地在所述宿主细胞中过表达的本发明的所述ER辅助蛋白具有SEQ ID NOs:28-36所示的氨基酸序列。优选具有SEQ IDNO:28所示的氨基酸序列的ER辅助蛋白。优选地,所述辅助蛋白与上文所提及的本发明的转录因子不同且与目标蛋白不同。

当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则可以将编码另外的ER辅助蛋白的多核苷酸整合在同一载体或质粒中处于同一启动子控制下或处于不同启动子控制下(Msn4p处于一个启动子控制下,而Kar2p处于不同启动子控制下)。当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则可以将编码另外的ER辅助蛋白的多核苷酸同时或连续地(一个接一个)整合在不同的载体或质粒中。如果可以将编码至少一种转录因子的多核苷酸和编码另外的ER辅助蛋白的多核苷酸引入不同的载体或质粒,则优选使用仅携带至少一种转录因子的一个质粒和携带用于至少一种另外的ER辅助蛋白的过表达盒的另一质粒。

当通过载体或质粒引入一个或多个拷贝的处于启动子控制下的编码至少一种转录因子的多核苷酸时,则可以将编码另外的ER辅助蛋白的多核苷酸整合在同一载体或质粒中并处于同一启动子控制下或处于不同启动子控制下(一个或多个拷贝的Msn4p处于一个启动子控制下,而一个或多个拷贝的Kar2p处于不同启动子控制下)。当通过载体或质粒引入一个或多个拷贝的处于启动子控制下的编码至少一种转录因子的多核苷酸时,则可以将编码另外的ER辅助蛋白的多核苷酸同时或连续地(一个接一个)整合在不同的载体或质粒中。

据推测,另外的ER辅助蛋白的过表达可确保POI在ER中正确折叠,由此甚至进一步增加POI的产量。

与工程化之前的宿主细胞相比,本发明的所述Msn4p转录因子和所述第一Kar2p辅助蛋白的过表达可以使模型蛋白的产量增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500。与工程化之前的宿主细胞相比,本发明的巴斯德毕赤酵母的天然(同系物)转录因子Msn4p和巴斯德毕赤酵母的所述第一ER辅助蛋白Kar2p的过表达可以使模型蛋白(优选vHH(SEQ ID NO:14))的产量增加至少40%,比如50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。与工程化之前的宿主细胞相比,本发明的合成转录因子synMsn4p和巴斯德毕赤酵母的所述第一ER辅助蛋白Kar2p的过表达可以使模型蛋白(优选vHH(SEQ ID NO:14))的产量增加至少30%,比如40%、50%、60%、70%、80%、90%、100、120、130、140%、150%、160%、170%、180%、190%、200%、250%、300%、350%、400%或500%。

本发明的方法、重组宿主细胞和用途可进一步包含在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码至少两种ER辅助蛋白的至少两种多核苷酸。

若本发明提及两种另外的ER辅助蛋白,这意味着“第一ER辅助蛋白”和“第二ER辅助蛋白”。若本发明提及三种另外的ER辅助蛋白,这意味着“第一ER辅助蛋白”、“第二ER辅助蛋白”和“第三ER辅助蛋白”。优选地,与过表达编码至少一种转录因子的至少一种多核苷酸但不进一步过表达编码至少两种ER辅助蛋白的至少两种多核苷酸的宿主细胞相比,通过在所述宿主细胞中进一步过表达编码至少两种ER辅助蛋白的至少两种多核苷酸,所述重组目标蛋白的产量增加。还优选的是,与过表达编码至少一种转录因子的至少一种多核苷酸且过表达编码至少一种另外的ER辅助蛋白的至少一种多核苷酸但不过表达编码至少两种ER辅助蛋白的至少两种多核苷酸的宿主细胞相比,通过在所述宿主细胞中进一步过表达编码至少两种ER辅助蛋白的至少两种多核苷酸,所述重组目标蛋白的产量增加。

优选地,所述第一ER辅助蛋白具有如上所述的SEQ ID NO:28所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:28所示的氨基酸序列(巴斯德毕赤酵母的Kar2p)具有至少70%,比如71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的序列同一性。优选地,在所述转录因子之外另外过表达的作为第一ER辅助蛋白的SEQ ID NO:28的功能同系物为SEQ ID NOs:29-36。因此,在所述宿主细胞中另外过表达的本发明的所述第一ER辅助蛋白具有SEQ ID NOs:28-36所示的氨基酸序列。优选将SEQ ID NO:28用作第一ER辅助蛋白。

优选地,第二ER辅助蛋白具有SEQ ID NO:37所示的氨基酸序列或其功能同系物,所述功能同系物与SEQ ID NO:37所示的氨基酸序列(巴斯德毕赤酵母的Lhs1p)具有至少25%,比如26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的序列同一性。因此,本发明包含本发明的转录因子与根据SEQ ID NO:28(巴斯德毕赤酵母的Kar2p)的第一辅助蛋白或其功能同系物和根据SEQ ID NO:37(巴斯德毕赤酵母的Lhs1p)的第二辅助蛋白或其功能同系物的组合的过表达。优选地,在所述转录因子和所述第一ER辅助蛋白之外另外过表达的作为第二ER辅助蛋白的SEQ ID NO:37的功能同系物为SEQ ID NOs:38-46。

可以将取自巴斯德毕赤酵母(Komagataella pastoris或Komagataellaphaffii)、多形汉森酵母、里氏木霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、博伊丁假丝酵母、粟酒裂殖酵母、黑曲霉,优选地取自巴斯德毕赤酵母(Komagataella pastoris或Komagataella phaffii)的具有SEQ ID NO:37所示的氨基酸序列或其功能同系物的第二ER辅助蛋白用于另外的过表达或用于工程化宿主细胞以另外地过表达。

与工程化之前的宿主细胞相比,本发明的所述Msn4p转录因子和所述第一Kar2p辅助蛋白和所述第二Lhs1p辅助蛋白的过表达可使模型蛋白(优选scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14))的产量增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。与工程化之前的宿主细胞相比,本发明的巴斯德毕赤酵母的天然转录因子Msn4p和巴斯德毕赤酵母的所述第一ER辅助蛋白Kar2p和巴斯德毕赤酵母的所述第二辅助蛋白Lhs1p的过表达可使模型蛋白(优选vHH(SEQ ID NO.14))的产量增加至少60%,比如70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。与工程化之前的宿主细胞相比,本发明的合成转录因子synMsn4p和巴斯德毕赤酵母的所述第一ER辅助蛋白Kar2p和巴斯德毕赤酵母的所述第二辅助蛋白Lhs1p的过表达可使模型蛋白(优选scFv(SEQID NO.13))的产量增加至少80%,比如90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。

本发明包含本发明的转录因子与根据SEQ ID NO:28的第一辅助蛋白或其功能同系物和根据SEQ ID NO:47的另一第二ER辅助蛋白或其功能同系物的组合的另一种过表达。

优选地,其它第二ER辅助蛋白具有SEQ ID NO:47所示的氨基酸序列或其同系物,其中所述同系物与SEQ ID NO:47所示的氨基酸序列(巴斯德毕赤酵母的Sil1p)具有至少20%,比如21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的序列同一性。优选地,在所述转录因子和所述第一ER辅助蛋白之外另外过表达的作为其它第二ER辅助蛋白的SEQ ID NO:47的功能同系物为SEQ ID NOs:48-56。

可以将取自巴斯德毕赤酵母(Komagataella pastoris或Komagataellaphaffii)、多形汉森酵母、里氏木霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、博伊丁假丝酵母,优选地取自巴斯德毕赤酵母(Komagataella pastoris或Komagataella phaffii)的具有SEQ ID NO:47所示的氨基酸序列或其功能同系物的第二辅助蛋白用于另外的过表达或用于工程化宿主细胞以另外地过表达。还可以将来自其他真核物种的最接近的同系物用作所述至少一种ER辅助蛋白。具有SEQ ID NO:47所示的氨基酸序列或其功能同系物。

与工程化之前的宿主细胞相比,本发明的所述Msn4p转录因子和所述第一Kar2p辅助蛋白以及所述第二Sil1p辅助蛋白的过表达可以使模型蛋白(优选scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14))的产量增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。

当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则可以将编码另外两种ER辅助蛋白的多核苷酸整合在同一载体或质粒中并处于同一启动子控制下或处于不同启动子控制下(a)Msn4p处于一个启动子控制下,Kar2p处于不同启动子控制下,而Lhs1p或Sil1p处于另一不同启动子控制下;b)Msn4p和Kar2p处于同一启动子控制下,而Lhs1p或Sil1p处于不同启动子控制下;或c)Msn4p处于一个启动子控制下,而Kar2p和Lhs1p或Sil1p处于另一启动子控制下)。当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则可以将编码另外两种ER辅助蛋白的多核苷酸(一个多核苷酸编码第一ER辅助蛋白,另一多核苷酸编码第二ER辅助蛋白)同时或连续地(一个接一个)整合在单独的载体或质粒中(一个载体/质粒包含编码至少一种转录因子的多核苷酸,另一载体/质粒包含编码第一和第二ER辅助蛋白的多核苷酸)。作为实例,如果可以将编码至少一种转录因子的多核苷酸和编码另外至少两种ER辅助蛋白的多核苷酸引入单独的载体或质粒,则可以使用仅携带处于启动子控制下的至少一种转录因子的整合质粒BB3和携带另外两种ER辅助蛋白(比如处于一个启动子控制下的Kar2p和处于另一启动子控制下的Lhs1p或Sil1p)的另一整合质粒BB3。

当通过载体或质粒引入一个或多个拷贝的处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将编码一个或多个拷贝的至少两种另外的ER辅助蛋白的多核苷酸整合在同一载体或质粒中并处于同一启动子控制下或处于不同启动子控制下(a)一个或多个拷贝的Msn4p处于一个启动子控制下,一个或多个拷贝的Kar2p处于不同启动子控制下,而一个或多个拷贝的Lhs1p或Sil1p处于另一不同启动子控制下;b)一个或多个拷贝的Msn4p和Kar2p处于同一启动子控制下,而一个或多个拷贝的Lhs1p或Sil1p处于不同启动子控制下;或c)一个或多个拷贝的Msn4p处于一个启动子控制下,而一个或多个拷贝的Kar2p和Lhs1p或Sil1p处于另一启动子控制下)。当通过载体或质粒引入一个或多个拷贝的处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将一个或多个拷贝的编码另外两种ER辅助蛋白的多核苷酸(一个多核苷酸编码第一ER辅助蛋白,另一多核苷酸编码第二ER辅助蛋白)同时或连续地(一个接一个)整合在另一不同的载体或质粒中(一个载体/质粒包含编码至少一种转录因子的多核苷酸,另一载体/质粒包含编码第一和第二ER辅助蛋白的多核苷酸)。

两种另外的ER辅助蛋白(Kar2p和Lhs1p或Kar2p和Sil1p)的过表达可确保POI在ER中正确折叠,由此甚至进一步增加POI的产量/效价。在该实施方案中,当折叠POI时,所述第二辅助蛋白(如Lhs1p或Sil1p)可以作为辅助伴侣分子与第一ER辅助蛋白(比如Kar2p)相互作用。

通过本领域技术人员已知的任何手段实现所述另外的ER辅助蛋白(比如Kar2p、Lhs1p或Sil1p)的过表达或工程化所述宿主细胞以过表达另外的ER辅助蛋白(比如Kar2p、Lhs1p或Sil1p),正如本文之前针对本发明的同源转录因子或针对本发明的异源转录因子所描述的。

本发明包含本发明的转录因子与根据SEQ ID NO:28的第一ER辅助蛋白或其功能同系物和根据SEQ ID NO:37/SEQ ID NO:47的另一第二ER辅助蛋白或其功能同系物和可选地根据SEQ ID NO:55的第三ER辅助蛋白或其功能同系物的组合的另一种过表达。

优选地,所述第三ER辅助蛋白具有SEQ ID NO:55所示的氨基酸序列或其功能同系物,其中所述同系物与SEQ ID NO:55所示的氨基酸序列(巴斯德毕赤酵母的Erj5p)具有至少25%,比如26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的序列同一性。优选地,在所述转录因子、所述第一ER辅助蛋白和所述第二ER辅助蛋白之外另外过表达的第三ER辅助蛋白SEQ ID NO:55的功能同系物为SEQ IDNOs:56-64。

具有SEQ ID NO:55所示的氨基酸序列的第三ER辅助蛋白或其功能同系物取自巴斯德毕赤酵母(Komagataella pastoris或Komagataella phaffii)、多形汉森酵母、里氏木霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、博伊丁假丝酵母、粟酒裂殖酵母、黑曲霉,优选地取自巴斯德毕赤酵母(Komagataella pastoris或Komagataella phaffii)。

当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将编码另外三种ER辅助蛋白的多核苷酸整合在同一载体或质粒中并处于同一启动子控制下或处于不同启动子控制下。当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将编码另外三种ER辅助蛋白的多核苷酸(一个多核苷酸编码第一ER辅助蛋白,另一多核苷酸编码第二ER辅助蛋白和再一多核苷酸编码第三ER辅助蛋白)同时或连续地(一个接一个)整合在另一不同的载体或质粒中(一个载体/质粒包含编码至少一种转录因子的多核苷酸,另一载体/质粒包含编码第一、第二和第三ER辅助蛋白的多核苷酸)。示例性地,如果可以将编码至少一种转录因子的多核苷酸和编码另外三种ER辅助蛋白的多核苷酸引入不同的载体或质粒,则可以使用仅携带处于启动子控制下的至少一种转录因子的整合质粒BB3和携带另外三种ER辅助蛋白(比如处于一个启动子控制下的Kar2p和处于另一启动子控制下的Lhs1p或Sil1p和处于再另一启动子控制下的Erj5p)的另一整合质粒BB3。

当通过载体或质粒引入一个或多个拷贝的处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将编码一个或多个拷贝的另外三种ER辅助蛋白的多核苷酸整合在同一载体或质粒中并处于同一启动子控制下或处于不同启动子控制下。当通过载体或质粒引入处于启动子控制下的一个或多个拷贝的编码至少一种(同源或异源)转录因子的多核苷酸时,则将一个或多个拷贝的编码另外三种ER辅助蛋白的多核苷酸(一个多核苷酸编码第一ER辅助蛋白,另一多核苷酸编码第二ER辅助蛋白和再一多核苷酸编码第三ER辅助蛋白)同时或连续地(一个接一个)整合在另一不同的载体或质粒中(一个载体/质粒包含编码至少一种转录因子的多核苷酸,另一载体/质粒包含编码第一、第二和第三ER辅助蛋白的多核苷酸)。

与工程化之前的宿主细胞相比,本发明的所述Msn4p转录因子和所述第一Kar2p辅助蛋白和所述第二Lhs1p辅助蛋白和所述第三Erj5p辅助蛋白的过表达可以使模型蛋白(优选scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14))的产量增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。与工程化之前的宿主细胞相比,本发明的巴斯德毕赤酵母的天然转录因子Msn4p和巴斯德毕赤酵母的所述第一ER辅助蛋白Kar2p和巴斯德毕赤酵母的所述第二ER辅助蛋白Lhs1p和巴斯德毕赤酵母的所述第三ER辅助蛋白Erj5p的过表达可以使模型蛋白(优选vHH(SEQ ID NO.14))的产量增加至少110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。与工程化之前的宿主细胞相比,本发明的合成转录因子synMsn4p和巴斯德毕赤酵母的所述第一ER辅助蛋白Kar2p和巴斯德毕赤酵母的所述第二ER辅助蛋白Lhs1p和巴斯德毕赤酵母的所述第三ER辅助蛋白Erj5p的过表达可以使模型蛋白(优选vHH(SEQ ID NO.14))的产量增加至少70%,比如80%、90%、100%、110%、120%、130%、140%、150%、160、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。

与工程化之前的宿主细胞相比,本发明的所述Msn4p转录因子和所述第一Kar2p辅助蛋白和所述第二Lhs1p辅助蛋白和所述第三Erj5p辅助蛋白的过表达可以使模型蛋白scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14)的产量增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。

本发明的方法、重组宿主细胞和用途可进一步包括在所述宿主细胞中过表达或工程化所述宿主细胞以过表达编码一种另外的转录因子的至少一种多核苷酸。因此,所述宿主细胞过表达编码本发明的至少一种转录因子的至少一种多核苷酸和编码一种另外的转录因子的至少一种多核苷酸。优选地,与过表达编码至少一种转录因子的至少一种多核苷酸但不过表达编码至少一种另外的转录因子的至少一种多核苷酸的宿主细胞相比,通过在所述宿主细胞中进一步过表达编码至少一种另外的转录因子的至少一种多核苷酸,所述重组目标蛋白的产量增加。

另外的转录因子最初是从巴斯德毕赤酵母(Komagataella phaffi)CBS7435菌株(CBS-KNAW菌种保藏)中分离的。设想转录因子可以在广泛的宿主细胞中过表达。因此,转录因子序列可以取自或衍生自其它原核生物或真核生物,而不是采用种或属的天然序列,优选地,将取自巴斯德毕赤酵母(Komagataella pastoris或Komagataella phaffii)、多形汉森酵母、里氏木霉、酿酒酵母、乳酸克鲁维酵母、解脂耶氏酵母、博伊丁假丝酵母和黑曲霉的转录因子用于另外的过表达或用于工程化宿主细胞以另外地过表达。

在本发明中,另外的Hac1转录因子是指包含DNA结合结构域的SEQ ID NO:74-82,所述DNA结合结构域包含SEQ ID NO:65所示的氨基酸序列或SEQ ID NO:65所示的氨基酸序列的功能同系物以及任何激活结构域(合成的、病毒的或如本文其他地方所述的任何物种的另外的转录因子的激活结构域),所述功能同系物与SEQ ID NO:65所示的氨基酸序列具有至少50%的序列同一性。根据技术人员的知识可以实施和可以以任何顺序实施本文所述的另外的它转录因子的所述DNA结合结构域和任何激活结构域的排布。

优选地,另外的转录因子至少包含DNA结合结构域和激活结构域,其中所述DNA结合结构域包含SEQ ID NO:65所示的氨基酸序列(巴斯德毕赤酵母的Hac1p的DNA结合结构域)。

优选地,所述另外的转录因子至少包含DNA结合结构域和激活结构域,其中所述DNA结合结构域包含SEQ ID NO:65所示的氨基酸序列的功能同系物,所述功能同系物与SEQID NO:65所示的氨基酸序列具有至少50%,比如至少51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或甚至100%的序列同一性。

优选地,与SEQ ID NO:65所示的氨基酸序列具有至少50%的序列同一性的SEQ IDNO:65所示的氨基酸序列的功能同系物为SEQ ID NOs:66-73。

因此,本发明的方法、重组宿主细胞和用途可进一步包括过表达另外的转录因子,所述另外的转录因子包含至少一种含有SEQ ID NOs:65-73所示的氨基酸序列的DNA结合结构域和激活结构域。

HAC1编码参与未折叠蛋白应答的碱性亮氨酸拉链(bZIP)家族的转录因子(Mori K等,Genes Cells 1(9):803-17,1996,和Cox JS和Water P,Cell87(3):391-404,1996)。热应激、药物处理、分泌蛋白中的突变或野生型分泌蛋白的过表达可以导致未折叠蛋白在ER中聚积,从而触发未折叠蛋白应答(UPR)。HAC1在正常生长条件下不是必需的,但在触发UPR的条件下是必需的。Hac1p与UPR调控的基因(如KAR2、PDI1、EUG1、FKB2)的启动子中被称为UPR元件(UPRE)的DNA序列结合。Hac1p的丰度由HAC1 mRNA的剪切调控。与未剪切的转录本相比,剪切的HAC1 mRNA的翻译效率更高。Hac1p诱导编码ER伴侣分子(如Kar2p)的基因的转录,例如参与UPR。UPR的关键特征是增加了编码可溶性ER驻留蛋白(包括例如ER伴侣分子)的基因的转录。此外,Hac1p增加了蛋白质折叠所需的ER驻留蛋白的合成。

当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将编码另外的转录因子的多核苷酸整合在同一载体或质粒中并处于同一启动子控制下或处于不同启动子控制下(Msn4p处于一个启动子控制下的,Hac1p处于不同启动子控制下)。若可以将编码至少一种转录因子的多核苷酸和编码另外的转录因子的多核苷酸引入同一载体或质粒,则优选使用整合质粒BB3,其中编码至少一种转录因子的多核苷酸处于一个启动子控制下,而编码至少一种另外的转录因子的多核苷酸处于不同启动子控制下。当通过载体或质粒引入处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将编码另外的转录因子的多核苷酸同时或连续地(一个接一个)整合在不同的载体或质粒中。作为实例,若可以将编码至少一种转录因子的多核苷酸和编码另外的转录因子的多核苷酸引入不同的载体或质粒中,则可以使用仅携带至少一种转录因子的整合质粒BB3和仅携带至少一种另外的转录因子的另一整合质粒BB3。

当通过载体或质粒引入一个或多个拷贝的处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将一个或多个拷贝的编码另外的转录因子的多核苷酸整合在同一载体或质粒中并处于同一启动子控制下或处于不同启动子控制下(一个或多个拷贝的Msn4p处于一个启动子控制下,一个或多个拷贝的Hac1p处于不同启动子控制下)。当通过载体或质粒引入一个或多个拷贝的处于启动子控制下的编码至少一种转录因子的多核苷酸时,则将一个或多个拷贝的编码另外的转录因子的多核苷酸同时或连续地(一个接一个)整合在不同的载体或质粒中。

另外的转录因子的过表达可导致ER伴侣分子(例如作为UPR的关键特征的Kar2p)的过表达,由此甚至进一步增加POI的产量。

与工程化之前的宿主细胞相比,本发明的所述Msn4p转录因子和所述Hac1p另外的转录因子的过表达可以使模型蛋白scFv(SEQ ID NO.13)和/或vHH(SEQ ID NO.14)的产量增加至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、110%、120%、130%、140%、150%、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500。与工程化之前的宿主细胞相比,本发明的巴斯德毕赤酵母的天然转录因子Msn4p和巴斯德毕赤酵母的所述Hac1p另外的转录因子的过表达可以使模型蛋白(优选vHH(SEQ ID NO:14))的产量增加至少60%,比如70%、80%、90%、100%、110%、120%、130%、140%、150、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。与工程化之前的宿主细胞相比,本发明的合成的转录因子synMsn4p和巴斯德毕赤酵母的所述Hac1p另外的转录因子的过表达可以使模型蛋白(优选vHH(SEQ ID NO:14))的产量增加至少80%,比如90%、100%、110%、120%、130%、140%、150、160%、170%、180%、190%、200%、210%、220%、230%、240%、250%、260%、270%、280%、290%、300%、310%、320%、330%、340%、350%、360%、370%、380%、390%、400%、410%、420%、430%、440%、450%、460%、470%、480%、490%或500%。

所述编码至少一种另外的转录因子的至少一种多核苷酸编码异源或同源另外的转录因子。如上文针对本发明的同源转录因子或针对本发明的异源转录因子所讨论的实现所述另外的转录因子(Hac1p)的过表达或工程化宿主细胞以过表达所述另外的转录因子(Hac1p)。

在本发明的方法、重组宿主细胞和用途中使用的另外的转录因子可包含SEQ IDNOs:74-82所示的氨基酸序列或SEQ ID NO:74所示的氨基酸序列的功能同系物,所述功能同系物与SEQ ID NO:74所示的氨基酸序列具有至少20%的序列同一性。在进一步的实施方案中,在本发明的方法、重组宿主细胞和用途中使用的另外的转录因子可包含SEQ ID NOs:74-82所示的氨基酸序列或SEQ ID NO:74所示的氨基酸序列的功能同系物,所述功能同系物与SEQ ID NO:74所示的氨基酸序列具有至少20%,比如25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%或甚至100%的序列同一性。所述另外的转录因子可另外地包含核定位信号(NLS)。

本发明进一步设想一种增加真核宿主细胞的重组目标蛋白的分泌的方法,所述方法包括在所述宿主细胞中过表达编码至少一种转录因子的至少一种多核苷酸,由此与不过表达编码所述转录因子的多核苷酸的宿主细胞相比,使所述重组目标蛋白的产量增加,其中所述转录因子至少包含含有SEQ ID NO:1所示的氨基酸序列的DNA结合结构域和激活结构域。

此外,本发明进一步设想一种增加真核宿主细胞的重组目标蛋白的分泌的方法,所述方法包括在所述宿主细胞中过表达编码至少一种转录因子的至少一种多核苷酸,由此与不过表达编码所述转录因子的多核苷酸的宿主细胞相比,使所述重组目标蛋白的产量增加,其中所述转录因子至少包含含有SEQ ID NO:1所示的氨基酸序列的功能同系物的DNA结合结构域和激活结构域,所述功能同系物与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQ ID NO:87所示的氨基酸序列具有至少60%的序列同一性。

本发明还提供一种用于制备目标蛋白的重组真核宿主细胞,其中所述宿主细胞被工程化以过表达编码至少一种转录因子的至少一种多核苷酸。

优选地,本发明提供一种用于制备目标蛋白的重组真核宿主细胞,其中所述宿主细胞被工程化以过表达编码至少一种转录因子的至少一种多核苷酸,其中所述转录因子至少包含DNA结合结构域和激活结构域,其中所述DNA结合结构域包含SEQ ID NO:1所示的氨基酸序列。

此外,本发明提供一种用于制备目标蛋白的重组真核宿主细胞,其中所述宿主细胞被工程化以过表达编码至少一种转录因子的至少一种多核苷酸,其中所述转录因子至少包含含有SEQ ID NO:1所示的氨基酸序列的功能同系物的DNA结合结构域和激活结构域,所述功能同系物与SEQ ID NO:1所示的氨基酸序列具有至少60%的序列同一性和/或与SEQID NO:87所示的氨基酸序列具有至少60%的序列同一性。

“重组细胞”或“重组宿主细胞”是指这样一种细胞或宿主细胞,所述细胞或宿主细胞已经被遗传改变从而包含了对所述细胞而言为非天然的核酸序列。

本发明进一步涵盖所述重组真核宿主细胞用于制备重组目标蛋白的用途。可将宿主细胞有利地用于引入编码一个或多个POI的多肽,并随后可在合适的条件下培养以表达POI。

实施例

提出下述实施例以向本领域普通技术人员提供如何制备和使用本发明的完整公开和描述,并且下述实施例不是要限制被认为是本发明的且权利要求中限定的内容的范围。已经尝试保证所使用的数字(例如量、温度、浓度等)的准确性,但应该允许一些实验误差和偏差。除非另外说明,份是重量份,分子量是平均分子量,温度是摄氏度,并且压力是大气压或接近大气压。

以下实施例将证明,基于它/它们的过表达,新鉴定的辅助蛋白分别增加了重组蛋白的效价(以mg/L表示的每体积的产物)和产量(以mg/g生物质表示的每生物质的产物,生物质以干细胞重量或湿细胞重量来度量)。作为实例,在巴斯德毕赤酵母中重组抗体单链可变片段(scFv,vHH)的产量增加。在振荡培养(在摇瓶或深孔板中进行)和实验室规模的分批进料培养中显示出了积极作用。

将巴斯德毕赤酵母CBS7435mut

在电穿孔(采用描述于Gasser等,2013.Future Microbiol.8(2):191-208中的标准的转化方案)至巴斯德毕赤酵母中之前,分别采用AvrII限制性酶(针对pPM2d_pGAP)或PmeI限制性酶(针对pPM2d_pAOX)将质粒线性化。在含有100μg/mL博来霉素(Zeocin)的YPD板(每升:10g酵母提取物、20g蛋白胨、20g葡萄糖、20g琼脂-琼脂)上实施阳性转化体的筛选。

将全部转化方法的单一菌落(总共~120)自转化板中挑选至96-深孔板的单个孔中。在初始生长阶段产生生物质后,通过补充含甲醇的培养基制剂(总共4次)来诱导始自AOX1启动子的表达。从第一次甲醇诱导开始72小时后,将所有深孔板离心,并将所有孔的上清液收集到储备(stock)微量滴定板中以待后续分析。在初始生长阶段后的指定时间点(即每天两次,共2天)补充葡萄糖,以继续始自GAP启动子的表达。从初始接种开始总共经过110小时后,如上所述收获培养物。

将在小规模筛选(实施例3)和分批进料培养(实施例4)中具有最高生产能力的克隆选为基础生产菌株以用于进一步的工程化。将克隆CBS7435 mut

为了研究对scFv和vHH分泌的阳性作用,在两个基础生产菌株:CBS7435 mut

a)所选择的潜在分泌辅助基因的扩增和克隆的一般方案

将选择用于过表达的基因通过PCR(

表1列出了使用限制性酶BsaI将其引入GoldenPiCS系统的BB1所需的基因片段。然后如Prielhofer等,2017所述,可以将携带各自编码序列的组装的BB1进一步在GoldenPiCS系统中进行处理以创建所需的BB3整合质粒。带下划线的核苷酸标记了创建GoldenPiCS兼容基因片段所需的第一个正向和最后一个反向引物,起始密码子和终止密码子用粗体标记。

b)创建天然的和合成的MSN4过表达菌株

将一个沉默突变引入巴斯德毕赤酵母MSN4的天然编码序列中以移除BsaI限制性位点。将该编码序列引入GoldenPiCS系统的BB1。通过将转录激活结构域(VP64)和核定位(SV40)序列与来自核苷酸编号883至1071的MSN4的天然DNA结合结构域融合来装配合成的MSN4编码序列。通过与Nicholls等,2004(Eukaryot Cell.doi:10.1128/EC.3.5.1111–1123.2004)公开的氨基酸序列的序列同源性来识别DNA结合结构域。将该合成的编码序列(synMSN4)引入GoldenPiCS系统的BB1。分别从酿酒酵母CEN.PK、黑曲霉CBS513.88和解脂耶氏酵母DSMZ的基因组DNA扩增酿酒酵母MSN2、酿酒酵母MSN4、黑曲霉MSN4同系物Seb1和解脂耶氏酵母MSN4同系物,并将它们引入BB1中。

将每个MSN4编码序列与甘油醛-3-磷酸脱氢酶(GAP)启动子和酿酒酵母CYC1转录终止子组合到整合质粒BB3rN中(如针对天然巴斯德毕赤酵母MSN4的189_BB3rN或142_BB3eH)。还将巴斯德毕赤酵母MSN4与THI11启动子和IDP1终止子(253_BB3eH)或POR1启动子和IDP1终止子(254_BB3eH)组合。另外地将synMSN4编码序列与THI11启动子(Landes等,2016.Biotechnol Bioeng.doi:10.1002/bit.26041)和IDP1转录终止子(258_BB3eH)或SBH17启动子和TDH3终止子(191_BB3aK)组合。还将synMSN4编码序列与GAP启动子和TDH3转录终止子组合至整合质粒208_BB3aK中。在将整合质粒用于转化基础生产菌株之前,采用AscI限制性酶将全部质粒线性化。在小规模筛选中确定过表达MSN4或合成MSN4的克隆的效价和产量(每湿细胞重量的效价)并将其与亲本基础生产菌株比较(实施例3)。

c)创建(合成的)MSN4+KAR2过表达菌株

将仅含有KAR2的过表达盒装配在整合质粒BB3eH(219_BB3eH)中。该质粒源自将BB1质粒与KAR2编码序列和GAP启动子以及RPS3终止子组合。

在用实施例2b的相应质粒转化,并进一步用SmaI线性化的KAR2整合质粒219_BB3eH转化后,根据在小规模筛选(实施例3)中确定的产物产量来选择过表达MSN4或合成MSN4的最佳克隆。最终产生了具有两个不同的过表达盒的克隆,所述两个过表达盒是通过用两个不同的整合质粒进行两个顺序转化而引入的。

d)创建(合成的)MSN4+HAC1(i)过表达菌株

通过移除根据Guerfal等2010(Microb Cell Fact.doi:10.1186/1475-2859-9-49)的自核苷酸编号857至1178的可选的内含子来创建HAC1(i)编码序列的诱导(i)形式。将该编码序列引入BB1。另外地将密码子优化的HAC1(i)序列用于Hac1(i)的过表达。进一步将其与启动子FDH1和终止子RPL2A组合在BB2质粒中。其它BB2构建体包含在MDH3启动子和RPL2A终止子,或ADH2启动子和RPL2A终止子控制下的HAC1。

通过将实施例2d的BB2与含有MSN4表达盒的BB2质粒(实施例2b)组合来创建处于不用启动子控制下的携带MSN4+HAC1(i)组合的整合质粒243_BB3eH、253_BB3eH、254_BB3eH和257_BB3eH。通过采用仅携带MSN4(189_BB3rN)的整合质粒BB3rN与具有FDH1启动子和RPL2A终止子的仅携带HAC1(i)的整合质粒BB3eH(234_BB3eH)顺序转化来产生相同的组合。对于在整合质粒(258_BB3eH)中携带synMSN4+HAC1(i)组合的质粒,将实施例2d的BB2与这样一种BB2质粒组合,该种BB2质粒衍生自与THI11启动子和IDP1转录终止子组合的具有synMSN4的BB1质粒(实施例2b)。在将其用于转化基础生产菌株之前,用限制性酶SmaI将两个整合质粒线性化。

e)创建(合成的)MSN4+KAR2和/或LHS1、(合成的)MSN4+KAR2和/或SIL、(合成的)MSN4+KAR2+LHS1或SIL1和ERJ5过表达菌株

将KAR2(需要7个沉默突变)、LHS1(需要1个沉默突变)、SIL1(无突变)和ERJ5(需要1个沉默突变)的编码序列引入GoldenPiCS系统的BB1中。整合质粒219_BB3eH含有具有GAP启动子和RPS3转录终止子的KAR2。将KAR2与LHS1组合的过表达装配在整合质粒174_BB3eH中,该整合质粒衍生自两个BB2;一个BB2含有具有GAP启动子和RPS3转录终止子的KAR2,和另一个BB2含有具有POR1启动子和IDP1转录终止子的LHS1。将KAR2与SIL1组合的过表达装配在整合质粒078_BB3eH中,该整合质粒衍生自两个BB2;一个BB2含有具有GAP启动子和RPS3转录终止子的KAR2,和另一个BB2含有具有POR1启动子和IDP1转录终止子的SIL1。将KAR2与LHS1和ERJ5组合的过表达装配在整合质粒052_BB3eH中,该整合质粒衍生自三个BB2;第一个BB2含有具有GAP启动子和酿酒酵母CYC1转录终止子的KAR2,第二个BB2含有具有POR1启动子和IDP1转录终止子的LHS1,和第三个BB2含有具有MDH3启动子和TDH1转录终止子的ERJ5。

在用实施例2b的相应质粒转化,并进一步用上文提及的相应SmaI线性化的BB3eH整合质粒转化后,根据在小规模筛选(实施例3)中确定的产量(每生物质的效价)来选择最佳克隆。最终产生了具有两个不同的过表达盒的克隆,所述两个过表达盒是通过用两个不同的整合质粒进行两个顺序转化而引入的。

在小规模筛选中,在转化后测试每个过表达组合的多达20个转化体。通过比较上清液中转化体的scFv或vHH效价、其湿细胞重量(离心且移除上清液后的生物质)以及其scFv或vHH产量(每湿细胞重量的效价)与相应亲本基础生产菌株的上述参数来评估转化体。对于每个过表达组合,确定效价、产量和湿细胞重量的平均倍数改变以评估分泌的改善。通过如下计算效价、产量和湿细胞重量的平均倍数改变:用全部转化体的效价、产量和湿细胞重量的算数平均值除以在同一深孔板上培养的基础生产菌株的四个生物重复的效价、产量和湿细胞重量的算数平均值。

a)scFv或vHH生产菌株的小规模筛选培养

将巴斯德毕赤酵母克隆的单一菌落接种于2mL含有10g/L葡萄糖和50μg/mL博来霉素(Zeocin),或50μg/mL博来霉素和500μg/mL G418和/或200μg/mL潮霉素和/或100μg/mL诺尔丝菌素(根据工程化菌株的整合质粒确定)的YP-培养基(10g/L酵母提取物,20g/L蛋白胨),并在25℃下生长过夜。将这些培养物转移到2mL补充有葡萄糖饲料片(Kuhner,Switzerland;CAT#SMFB63319)或x%的酶(m2p培养基发展试剂盒)的合成筛选培养基M2或ASMv6(在下面给出培养基的组成)中,并于25℃下以280rpm在24深孔板中温育1至25小时。将这些培养物的等分试样(对应于终OD

每升合成筛选培养基M2含有:22.0g柠檬酸一水合物、3.15g(NH

每升合成筛选培养基ASMv6含有:44.0g柠檬酸一水合物、12.60g(NH

b)SDS-PAGE&蛋白质印迹分析

采用

采用化学发光Super Signal West Chemiluminescent Substrate(ThermoScientific)进行HRP缀合物的检测。

c)通过微流体毛细管电泳(mCE)进行定量

将‘LabChip GX/GXII System’(PerkinElmer)用于培养上清液中分泌的蛋白效价的定量分析。使用消耗品‘Protein Express Lab Chip’(760499,PerkinElmer)和‘ProteinExpress Reagent Kit’(CLS960008,PerkinElmer)。简言之,使用基于微流体的电泳系统,对所有培养上清液的若干μL进行荧光标记,并根据蛋白质大小进行分析。内标物使得能够以kDa为单位进行大小的大致分配,以及大致估计检测到的信号的浓度。

在小规模筛选培养(实施例3)后,选择工程化菌株的克隆(实施例2)。通过分批进料生物反应器培养以更大的培养体积进一步评估选择的克隆。验证了小规模筛选中的分泌改善,这种改善也出现在分批进料生物反应器培养中。

a)分批进料生物反应器培养的方案

将相应的菌株接种到装有50mL YPhyG的宽颈、带挡板(baffled)、有盖的300mL振荡摇瓶中,并在28℃下以110rpm振荡过夜(预培养物1)。从预培养物1中以OD

分批进料在0.8L工作体积的生物反应器(Minifors,Infors,Switzerland)中进行。将所有生物反应器(装有400mL pH约为5.5的BSM-培养基)从预培养物2分别接种至OD600为2.0。一般而言,巴斯德毕赤酵母在甘油上生长以产生生物质,并且所述培养物随后经受甘油进料,随后是甲醇进料。

在初始分批阶段,将温度设定为28℃。在开始生产阶段之前的最后一小时期间,将其降至24℃并在整个剩余过程中保持在该水平,同时pH降至5.0并保持在该水平。将整个过程(级联控制:搅拌器,流量,氧补充)的氧饱和度设定为30%。以700至1200rpm施加搅拌并选择1.0-2.0L/min的流量范围(空气)。使用25%铵实现pH为5.0的控制。根据需要通过加入消泡剂Glanapon 2000控制发泡。

在分批阶段,生成生物质(μ~0.30/h)直至约110-120g/L的湿细胞重量(WCW)。经典的分批阶段(生物质产生)将持续约14小时。以由方程2.6+0.3*t(g/h)定义的速率进行甘油进料,因此在8小时内补充了总共30g甘油(60%)。第一个取样点选为20小时(0小时诱导时间)。

在接下来的18个小时(从过程时间20至38小时),使用甘油/甲醇混合进料:以由方程2.5+0.13*t(g/h)定义的甘油进料速度,提供66g甘油(60%),和以由方程0.72+0.05*t(g/h)定义的甲醇进料速度,添加21g甲醇。

在接下来的72-74小时(从过程时间38至110-112小时),以由方程2.2+0.016*t(g/L)定义的进料速度进料甲醇。

YphyG预培养基(每升)含有:20g植物蛋白胨-蛋白胨,10g Bacto-酵母提取物,20g甘油

分批培养基:修饰的基础盐培养基(BSM)(每升)含有:13.5mL H

PTM1痕量元素(每升)含有:0.2g生物素、6.0g CuSO

进料-溶液甘油(每kg)含有:600g甘油、12mL PTM1

进料-溶液甲醇含有:纯甲醇。

b)分批进料生物反应器培养的样品分析

采用以下程序,在多个时间点取样:将取样的培养液(broth)(用注射器)的第一个3mL弃去。将1mL的新鲜采集样品(3-5mL)转移至1.5mL离心管中,并在13,200rpm(16,100g)下旋转5分钟。将上清液迅速转移至一个单独的小瓶中并储存在4℃下或冷冻直至分析。

将1mL的培养液在去皮的Eppendorf小瓶中以13,200rpm(16,100g)离心5分钟,然后将所得的上清液准确地移除。将小瓶称重(精确度0.1mg),并减去空瓶的皮重以获得湿细胞重量。

采用针对BSA或纯化标准材料(scR-GG-6xHIS和vHH-GG-6xHIS)的mCE(微流体毛细管电泳,GXII,Perkin-Elmer)分析每个生物反应器培养的各个采样点的上清液。

参照相应未工程化的基础生产菌株(实施例1),通过效价和产量倍数改变值衡量分泌改善。

a)通过单独过表达转录因子或过表达与辅助基因的组合的转录因子来改善vHH蛋白分泌产量-结果来自小规模筛选

图1列出了在小规模筛选(实施例3)中,增加巴斯德毕赤酵母中vHH分泌的过表达的基因或基因组合。小规模筛选的倍数改变值为高达20个克隆/转化体的算数平均值(参见实施例3)。

通过转录因子Msn4的过表达使vHH的分泌增加(图1)。天然和合成的Msn4变体均可使vHH的效价和产量增加至相似水平。出乎意料的是,单独伴侣分子Kar2或与辅助伴侣分子Lhs1组合的伴侣分子Kar2的过表达未增加vHH分泌。仅当它们与转录因子Msn4或synMsn4共过表达时,才观察到vHH效价和产量增加。Hsp40蛋白(例如Erj5)的进一步共表达导致vHH分泌的进一步增加。

Msn4或synMsn4与Hac1的共表达也导致vHH分泌增强,并且超过单个Hac1的过表达。由此,无论两个转录因子是从同一载体表达还是从两个单独的载体表达,均独立获得相似的增强水平。此外,当将不同的启动子对用于两种转录因子的表达时,也没有显著差异。

b)通过单独过表达转录因子或过表达与辅助基因组合的转录因子来改善vHH蛋白分泌产量-结果来自分批进料生物反应器培养

图2列出了在分批进料培养(实施例4)中,增加巴斯德毕赤酵母中vHH分泌的过表达的基因或基因组合。分批进料培养的倍数改变值为单个选择的克隆的倍数改变值。

在筛选中观察到的过表达转录Msn4对重组蛋白生产的积极影响也被受控的生物反应器培养证实(图2)。与筛选中一样,Msn4或synMsn4与伴侣分子或其他转录因子的组合过表达显著超过了仅过表达后者因子的菌株的性能。关于对vHH分泌的有益效果,在天然和合成形式的Msn4的过表达之间未见明显差异。

c)通过单独过表达转录因子或过表达与辅助基因的组合的转录因子来改善scFv蛋白分泌产量-结果来自小规模筛选

图3列出了在小规模筛选(实施例3)中,增加巴斯德毕赤酵母中scFv分泌的过表达的基因或基因组合。小规模筛选的倍数改变值为高达20个克隆/转化体的算数平均值(参见实施例3)。

Msn4的过表达也增强了scFv的分泌水平,scFv代表了另一模型POI(图3)。与对于vHH一样,通过将Msn4或synMsn4过表达与伴侣分子(如单独的Kar2或与Lhs1组合的Kar2)的过表达组合使得分泌产量和效价进一步增强,并超过了由Kar2和Lhs1过表达但无Msn4获得的改善。Msn4或synMsn4与Hac1过表达的组合也对scFv分泌产生阳性作用。

d)通过单独过表达转录因子或过表达与辅助基因的组合的转录因子来改善scFv蛋白分泌产量-结果来自分批进料生物反应器培养。

图4列出了在分批进料培养(实施例4)中,增加巴斯德毕赤酵母中vHH分泌的过表达的基因或基因组合。分批进料培养的倍数改变值为单个选择的克隆的倍数改变值。

同样对于第二种重组模型蛋白,在受控的类似过程的生物反应器条件下证实了在筛选中获得的结果(图4)。与野生型生产菌株(亲本)相比,单独的Msn4的过表达改善了scFv效价和产量。与单独的伴侣分子或单独的Hac1的过表达相比,Msn4与伴侣分子或其他转录因子(比如Hac1)的共过表达刺激了scFv分泌。

e)在分批进料生物反应器培养中通过过表达来自其它物种的MSN2/4同系物来改善scFv分泌(效价和产量)

图5列出了在分批进料培养(实施例4)中,增加巴斯德毕赤酵母中scFv分泌的过表达的MSN2/4同系物。分批进料培养的倍数改变值为单个选择的克隆的倍数改变值。

来自酿酒酵母的两个Msn4同系物的过表达对scFv分泌具有阳性作用(图5),这证实了来自其他物种的同系物也对巴斯德毕赤酵母中的蛋白分泌具有阳性作用。结合来自天然Msn4巴斯德毕赤酵母和合成Msn4变体的结果,这也表明靶向的Msn4过表达在其他生产宿主中保持了改善重组蛋白产量的作用,并强调了我们方法的广泛适用性。

由于酿酒酵母是真核细胞最重要的模型生物,因此MSN2/4的功能知识来源于酿酒酵母。在这种情况下,值得一提的是酿酒酵母经历了全基因组复制(WGD)。这导致酿酒酵母的基因组中具有许多基因的非常相似的拷贝。冗余的转录因子Msn2p和Msn4p就是这种情况。由于这种功能冗余,这些转录因子通常被称为MSN2/4。其他酵母的蛋白质的功能描述来自模型生物酿酒酵母的实验。例如,巴斯德毕赤酵母没有进行WGD,因此仅有一个同系物Msn4p。因为酿酒酵母中Msn2p和Msn4p之间基本上没有功能上的区别,因此在其他酵母中无法合理区分这些转录因子。

采用软件CLC Main Workbench(QIAGEN Bioinformatics)进行比对,且该比对可见于图6。图6的虚线框高亮显示了唯一的强保守性区域,它由锌指的蛋白结构基序组成。这是酿酒酵母中得到充分表征的转录因子Msn4p和Msn2p(ScMSN4/2)的已知DNA结合结构域,很可能可用于在其他生物中发挥相同的功能(Nicholls等,2004)。

酿酒酵母的MSN2/4中的锌指具有C

MSN4-样C

通过EMBOSS Needle算法的整体配对序列比对研究了巴斯德毕赤酵母的全长Msn4p与其它生物体的各同系物之间的配对序列相似性/同一性。还研究了巴斯德毕赤酵母的Msn4p的DNA结合结构域与其它生物体的各同系物的DNA结合结构域的配对序列相似性/同一性。将采用默认设置(矩阵:BLOSUM62;空位开放:10;空位延伸:0.5;末端空位罚分:错(false);末端空位开放:10;末端空位延伸:0.5)的EMBOSS Needle webserver(https://www.ebi.ac.uk/Tools/psa/emboss_needle/)用于配对蛋白序列比对。EMBOSS Needle读取两个输入序列,并将它们的最佳整体序列比对写入文件。其采用Needleman-Wunsch比对算法在两个序列的整体长度上寻找最佳比对(包括空位)。

将同一性结果列于图8。如所预期的,全长Msn4的整体序列同一性显示出远低于仅DNA结合结构域的保守性。

还通过EMBOSS Needle算法的整体配对序列比对研究了Msn4p/Msn2p的DNA-结合结构域(DBD)的共有序列与其它生物体的各同系物的DNA-结合结构域的配对序列相似性/同一性(参见图14)。

采用软件CLC Main Workbench(QIAGEN Bioinformatics)进行比对。

研究了巴斯德毕赤酵母的全长Hac1p或其DNA结合结构域与其它生物体的各同系物的配对序列相似性/同一性。通过EMBOSS Needle算法的整体配对序列比对评估了整体相似性/同一性(图13)。

序列表

<110> 贝林格尔•英格海姆RCV两合公司

瓦利多根股份有限公司

隆萨有限公司

<120> 通过使用转录因子来增加蛋白质表达的手段和方法

<130> LC20310015P

<150> EP 18 180 164.8

<151> 2018-06-27

<160> 121

<170> PatentIn version 3.5

<210> 1

<211> 54

<212> PRT

<213> Komagataella phaffii / Komagataella pastoris

<400> 1

Lys Gln Phe Arg Cys Thr Asp Cys Ser Arg Arg Phe Arg Arg Ser Glu

1 5 10 15

His Leu Lys Arg His His Arg Ser Val His Ser Asn Glu Arg Pro Phe

20 25 30

His Cys Ala His Cys Asp Lys Arg Phe Ser Arg Ser Asp Asn Leu Ser

35 40 45

Gln His Leu Arg Thr His

50

<210> 2

<211> 54

<212> PRT

<213> 解脂耶氏酵母

<400> 2

Lys Thr Phe Val Cys Thr His Cys Gln Arg Arg Phe Arg Arg Gln Glu

1 5 10 15

His Leu Lys Arg His Phe Arg Ser Leu His Thr Arg Glu Lys Pro Phe

20 25 30

Asn Cys Asp Thr Cys Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ala

35 40 45

Gln His Met Arg Thr His

50

<210> 3

<211> 54

<212> PRT

<213> 里氏木霉

<400> 3

Lys Thr Phe Val Cys Asp Leu Cys Asn Arg Arg Phe Arg Arg Gln Glu

1 5 10 15

His Leu Lys Arg His Tyr Arg Ser Leu His Thr Gln Glu Lys Pro Phe

20 25 30

Glu Cys Asn Glu Cys Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ala

35 40 45

Gln His Ala Arg Thr His

50

<210> 4

<211> 53

<212> PRT

<213> 粟酒裂殖酵母

<400> 4

Lys Ser Phe Val Cys Pro Glu Cys Ser Lys Lys Phe Lys Arg Ser Glu

1 5 10 15

His Leu Arg Arg His Ile Arg Ser Leu His Thr Ser Glu Lys Pro Phe

20 25 30

Val Cys Ile Cys Gly Lys Arg Phe Ser Arg Arg Asp Asn Leu Arg Gln

35 40 45

His Glu Arg Leu His

50

<210> 5

<211> 54

<212> PRT

<213> 酿酒酵母

<400> 5

Lys Pro Phe Lys Cys Lys Asp Cys Glu Lys Ala Phe Arg Arg Ser Glu

1 5 10 15

His Leu Lys Arg His Ile Arg Ser Val His Ser Thr Glu Arg Pro Phe

20 25 30

Ala Cys Met Phe Cys Glu Lys Lys Phe Ser Arg Ser Asp Asn Leu Ser

35 40 45

Gln His Leu Lys Thr His

50

<210> 6

<211> 54

<212> PRT

<213> 酿酒酵母

<400> 6

Lys Pro Phe His Cys His Ile Cys Pro Lys Ser Phe Lys Arg Ser Glu

1 5 10 15

His Leu Lys Arg His Val Arg Ser Val His Ser Asn Glu Arg Pro Phe

20 25 30

Ala Cys His Ile Cys Asp Lys Lys Phe Ser Arg Ser Asp Asn Leu Ser

35 40 45

Gln His Ile Lys Thr His

50

<210> 7

<211> 54

<212> PRT

<213> 乳酸克鲁维酵母

<400> 7

Lys Pro Phe Lys Cys Asp Gln Cys Asn Lys Thr Phe Arg Arg Ser Glu

1 5 10 15

His Leu Lys Arg His Val Arg Ser Val His Ser Thr Glu Arg Pro Phe

20 25 30

His Cys Gln Phe Cys Asp Lys Lys Phe Ser Arg Ser Asp Asn Leu Ser

35 40 45

Gln His Leu Lys Thr His

50

<210> 8

<211> 54

<212> PRT

<213> 乳酸克鲁维酵母

<400> 8

Lys Pro Phe Gly Cys Glu Tyr Cys Asp Arg Arg Phe Lys Arg Gln Glu

1 5 10 15

His Leu Lys Arg His Ile Arg Ser Leu His Ile Cys Glu Lys Pro Tyr

20 25 30

Gly Cys His Leu Cys Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ser

35 40 45

Gln His Leu Lys Thr His

50

<210> 9

<211> 54

<212> PRT

<213> 博伊丁假丝酵母

<400> 9

Lys Pro Phe Arg Cys Ser Leu Cys Glu Lys Ser Phe Lys Arg Gln Glu

1 5 10 15

His Leu Lys Arg His His Arg Ser Val His Ser Gly Glu Lys Pro His

20 25 30

Ile Cys Gln Thr Cys Asp Lys Arg Phe Ser Arg Thr Asp Asn Leu Ala

35 40 45

Gln His Leu Arg Thr His

50

<210> 10

<211> 54

<212> PRT

<213> 黑曲霉

<400> 10

Lys Thr Phe Val Cys Thr Leu Cys Ser Arg Arg Phe Arg Arg Gln Glu

1 5 10 15

His Leu Lys Arg His Tyr Arg Ser Leu His Thr Gln Asp Lys Pro Phe

20 25 30

Glu Cys Asn Glu Cys Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ala

35 40 45

Gln His Ala Arg Thr His

50

<210> 11

<211> 54

<212> PRT

<213> 酿酒酵母

<400> 11

Lys Gln Phe Gly Cys Glu Phe Cys Asp Arg Arg Phe Lys Arg Gln Glu

1 5 10 15

His Leu Lys Arg His Val Arg Ser Leu His Met Cys Glu Lys Pro Phe

20 25 30

Thr Cys His Ile Cys Asn Lys Asn Phe Ser Arg Ser Asp Asn Leu Asn

35 40 45

Gln His Val Lys Thr His

50

<210> 12

<211> 57

<212> PRT

<213> 人工序列

<220>

<223> synMSN4

<400> 12

Lys Gln Phe Arg Cys Thr Asp Cys Ser Arg Arg Phe Arg Arg Ser Glu

1 5 10 15

His Leu Lys Arg His His Arg Ser Val His Ser Asn Glu Arg Pro Phe

20 25 30

His Cys Ala His Cys Asp Lys Arg Phe Ser Arg Ser Asp Asn Leu Ser

35 40 45

Gln His Leu Arg Thr His Arg Lys Gln

50 55

<210> 13

<211> 341

<212> PRT

<213> 人工序列

<220>

<223> scFv

<400> 13

Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser

1 5 10 15

Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln

20 25 30

Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe

35 40 45

Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu

50 55 60

Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val

65 70 75 80

Ser Leu Glu Lys Arg Gln Glu Gln Leu Met Glu Ser Gly Gly Gly Leu

85 90 95

Val Thr Leu Gly Gly Ser Leu Lys Leu Ser Cys Lys Ala Ser Gly Ile

100 105 110

Asp Phe Ser His Tyr Gly Ile Ser Trp Val Arg Gln Ala Pro Gly Lys

115 120 125

Gly Leu Glu Trp Ile Ala Tyr Ile Tyr Pro Asn Tyr Gly Ser Val Asp

130 135 140

Tyr Ala Ser Trp Val Asn Gly Arg Phe Thr Ile Ser Leu Asp Asn Ala

145 150 155 160

Gln Asn Thr Val Phe Leu Gln Met Ile Ser Leu Thr Ala Ala Asp Thr

165 170 175

Ala Thr Tyr Phe Cys Ala Arg Asp Arg Gly Tyr Tyr Ser Gly Ser Arg

180 185 190

Gly Thr Arg Leu Asp Leu Trp Gly Gln Gly Thr Leu Val Thr Ile Ser

195 200 205

Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

210 215 220

Glu Leu Val Met Thr Gln Thr Pro Pro Ser Leu Ser Ala Ser Val Gly

225 230 235 240

Glu Thr Val Arg Ile Arg Cys Leu Ala Ser Glu Phe Leu Phe Asn Gly

245 250 255

Val Ser Trp Tyr Gln Gln Lys Pro Gly Lys Pro Pro Lys Phe Leu Ile

260 265 270

Ser Gly Ala Ser Asn Leu Glu Ser Gly Val Pro Pro Arg Phe Ser Gly

275 280 285

Ser Gly Ser Gly Thr Asp Tyr Thr Leu Thr Ile Gly Gly Val Gln Ala

290 295 300

Glu Asp Val Ala Thr Tyr Tyr Cys Leu Gly Gly Tyr Ser Gly Ser Ser

305 310 315 320

Gly Leu Thr Phe Gly Ala Gly Thr Asn Val Glu Ile Lys Gly Gly His

325 330 335

His His His His His

340

<210> 14

<211> 362

<212> PRT

<213> 人工序列

<220>

<223> VHH

<400> 14

Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser

1 5 10 15

Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln

20 25 30

Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe

35 40 45

Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu

50 55 60

Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val

65 70 75 80

Ser Leu Glu Lys Arg Gln Val Gln Leu Gln Glu Ser Gly Gly Gly Leu

85 90 95

Val Gln Ala Gly Gly Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Arg

100 105 110

Thr Phe Thr Ser Phe Ala Met Gly Trp Phe Arg Gln Ala Pro Gly Lys

115 120 125

Glu Arg Glu Phe Val Ala Ser Ile Ser Arg Ser Gly Thr Leu Thr Arg

130 135 140

Tyr Ala Asp Ser Ala Lys Gly Arg Phe Thr Ile Ser Val Asp Asn Ala

145 150 155 160

Lys Asn Thr Val Ser Leu Gln Met Asp Asn Leu Asn Pro Asp Asp Thr

165 170 175

Ala Val Tyr Tyr Cys Ala Ala Asp Leu His Arg Pro Tyr Gly Pro Gly

180 185 190

Thr Gln Arg Ser Asp Glu Tyr Asp Ser Trp Gly Gln Gly Thr Gln Val

195 200 205

Thr Val Ser Ser Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly

210 215 220

Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Glu

225 230 235 240

Val Gln Leu Val Glu Ser Gly Gly Ala Leu Val Gln Pro Gly Gly Ser

245 250 255

Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Pro Val Asn Arg Tyr Ser

260 265 270

Met Arg Trp Tyr Arg Gln Ala Pro Gly Lys Glu Arg Glu Trp Val Ala

275 280 285

Gly Met Ser Ser Ala Gly Asp Arg Ser Ser Tyr Glu Asp Ser Val Lys

290 295 300

Gly Arg Phe Thr Ile Ser Arg Asp Asp Ala Arg Asn Thr Val Tyr Leu

305 310 315 320

Gln Met Asn Ser Leu Lys Pro Glu Asp Thr Ala Val Tyr Tyr Cys Asn

325 330 335

Val Asn Val Gly Phe Glu Tyr Trp Gly Gln Gly Thr Gln Val Thr Val

340 345 350

Ser Ser Gly Gly His His His His His His

355 360

<210> 15

<211> 356

<212> PRT

<213> Komagataella phaffii

<400> 15

Met Ser Thr Thr Lys Pro Met Gln Val Leu Ala Pro Asp Leu Thr Glu

1 5 10 15

Thr Pro Lys Thr Tyr Ser Leu Gly Val His Leu Gly Lys Gly Lys Asp

20 25 30

Lys Leu Gln Asp Pro Thr Glu Leu Tyr Ser Met Ile Leu Asp Gly Met

35 40 45

Asp His Ser Gln Leu Asn Ser Phe Ile Asn Asp Gln Leu Asn Leu Gly

50 55 60

Ser Leu Arg Leu Pro Ala Asn Pro Pro Ala Ala Ser Gly Ala Lys Arg

65 70 75 80

Gly Ala Asn Val Ser Ser Ile Asn Met Asp Asp Leu Gln Thr Phe Asp

85 90 95

Phe Asn Phe Asp Tyr Glu Arg Asp Ser Ser Pro Leu Glu Leu Asn Met

100 105 110

Asp Ser Gln Ser Leu Met Phe Ser Ser Pro Glu Lys Ala Pro Cys Gly

115 120 125

Ser Leu Pro Ser Gln His Gln Pro His Ser Gln Val Ala Ala Ala Gln

130 135 140

Gly Thr Thr Ile Asn Pro Arg Gln Leu Ser Thr Ser Ser Ala Ser Ser

145 150 155 160

Phe Val Ser Ser Asp Phe Asp Val Asp Ser Leu Leu Ala Asp Glu Tyr

165 170 175

Ala Glu Lys Leu Glu Tyr Gly Ala Ile Ser Ser Ala Ser Ser Ser Ile

180 185 190

Cys Ser Asn Ser Val Leu Pro Ser Gln Gly Val Thr Ser Gln His Ser

195 200 205

Ser Pro Ile Glu Gln Arg Pro Arg Val Gly Asn Ser Lys Arg Leu Ser

210 215 220

Asp Phe Trp Met Gln Asp Glu Ala Val Thr Ala Ile Ser Thr Trp Leu

225 230 235 240

Lys Ala Glu Ile Pro Ser Ser Leu Ala Thr Pro Ala Pro Thr Val Thr

245 250 255

Gln Ile Ser Ser Pro Ser Leu Ser Thr Pro Glu Pro Arg Lys Lys Glu

260 265 270

Thr Lys Gln Arg Lys Arg Ala Lys Ser Ile Asp Thr Asn Glu Arg Ser

275 280 285

Glu Gln Val Ala Ala Ser Asn Ser Asp Asp Glu Lys Gln Phe Arg Cys

290 295 300

Thr Asp Cys Ser Arg Arg Phe Arg Arg Ser Glu His Leu Lys Arg His

305 310 315 320

His Arg Ser Val His Ser Asn Glu Arg Pro Phe His Cys Ala His Cys

325 330 335

Asp Lys Arg Phe Ser Arg Ser Asp Asn Leu Ser Gln His Leu Arg Thr

340 345 350

His Arg Lys Gln

355

<210> 16

<211> 357

<212> PRT

<213> Komagataella pastoris

<400> 16

Met Ser Thr Thr Lys Pro Met Gln Val Leu Ala Pro Asp Leu Thr Glu

1 5 10 15

Thr Pro Lys Thr Tyr Ser Leu Gly Val His Leu Gly Lys Gly Lys Asp

20 25 30

Lys Leu Gln Asp Pro Thr Glu Leu Tyr Ser Met Ile Leu Asp Gly Met

35 40 45

Asp His Ser Gln Leu Asn Ser Phe Ile Asn Asp Gln Leu Asn Leu Gly

50 55 60

Ser Leu Arg Leu Pro Ala Asn Pro Pro Ala Ala Gly Gly Ala Lys Arg

65 70 75 80

Gly Ala Asn Val Ser Ser Ile Asn Met Asp Asp Leu Gln Thr Phe Asp

85 90 95

Phe Asn Phe Asp Tyr Glu Arg Asp Ser Ser Pro Leu Glu Leu Asn Met

100 105 110

Asp Ser Gln Thr Leu Leu Phe Ser Ser Pro Glu Lys Ala Pro Pro Cys

115 120 125

Gly Ser Leu Pro Ser Gln His Gln Pro His Ser Gln Gly Ala Ala Ala

130 135 140

Gln Gly Thr Thr Ile Asn Pro Arg Gln Leu Ser Thr Ser Ser Ala Ser

145 150 155 160

Ser Phe Val Ser Ser Asp Phe Asp Val Asp Ser Leu Leu Ala Glu Glu

165 170 175

Tyr Ala Glu Lys Leu Glu Tyr Gly Ala Ile Ser Ser Ala Ser Ser Ser

180 185 190

Ile Cys Ser Asn Ser Val Leu Pro Asn Gln Gly Val Thr Ser Gln His

195 200 205

Ser Ser Pro Ile Glu Gln Arg Pro Arg Val Gly Asn Ser Lys Arg Leu

210 215 220

Ser Asp Phe Trp Met Gln Asp Glu Ala Val Thr Ala Ile Ser Thr Trp

225 230 235 240

Leu Lys Ala Glu Ile Pro Ser Ser Leu Ala Thr Pro Ala Pro Thr Val

245 250 255

Thr Lys Ile Ser Ser Pro Thr Leu Ser Thr Pro Glu Pro Arg Lys Lys

260 265 270

Glu Thr Lys Gln Arg Lys Arg Ala Lys Ser Ile Asp Thr Asn Glu Arg

275 280 285

Ser Glu Gln Val Ala Ala Ser Gly Ser Asp Asp Glu Lys Gln Phe Arg

290 295 300

Cys Thr Asp Cys Ser Arg Arg Phe Arg Arg Ser Glu His Leu Lys Arg

305 310 315 320

His His Arg Ser Val His Ser Asn Glu Arg Pro Phe His Cys Ala His

325 330 335

Cys Asp Lys Arg Phe Ser Arg Ser Asp Asn Leu Ser Gln His Leu Arg

340 345 350

Thr His Arg Lys Gln

355

<210> 17

<211> 285

<212> PRT

<213> 解脂耶氏酵母

<400> 17

Met Asp Leu Glu Leu Glu Ile Pro Val Leu His Ser Met Asp Ser His

1 5 10 15

His Gln Val Val Asp Ser His Arg Leu Ala Gln Gln Gln Phe Gln Tyr

20 25 30

Gln Gln Ile His Met Leu Gln Gln Thr Leu Ser Gln Gln Tyr Pro His

35 40 45

Thr Pro Ser Thr Thr Pro Pro Ile Tyr Met Leu Ser Pro Ala Asp Tyr

50 55 60

Glu Lys Asp Ala Val Ser Ile Ser Pro Val Met Leu Trp Pro Pro Ser

65 70 75 80

Ala His Ser Gln Ala Ser Tyr His Tyr Glu Met Pro Ser Val Ile Ser

85 90 95

Pro Ser Pro Ser Pro Thr Arg Ser Phe Cys Asn Pro Arg Glu Leu Glu

100 105 110

Val Gln Asp Glu Leu Glu Gln Leu Glu Gln Gln Pro Ala Ala Leu Ser

115 120 125

Val Glu His Leu Phe Asp Ile Glu Asn Ser Ser Ile Glu Tyr Ala His

130 135 140

Asp Glu Leu His Asp Thr Ser Ser Cys Ser Asp Ser Gln Ser Ser Phe

145 150 155 160

Ser Pro Gln Gln Ser Pro Ala Ser Pro Ala Ser Thr Tyr Ser Pro Leu

165 170 175

Glu Asp Glu Phe Leu Asn Leu Ala Gly Ser Glu Leu Lys Ser Glu Pro

180 185 190

Ser Ala Asp Asp Glu Lys Asp Asp Val Asp Thr Glu Leu Pro Gln Gln

195 200 205

Pro Glu Ile Ile Ile Pro Val Ser Cys Arg Gly Arg Lys Pro Ser Ile

210 215 220

Asp Asp Ser Lys Lys Thr Phe Val Cys Thr His Cys Gln Arg Arg Phe

225 230 235 240

Arg Arg Gln Glu His Leu Lys Arg His Phe Arg Ser Leu His Thr Arg

245 250 255

Glu Lys Pro Phe Asn Cys Asp Thr Cys Gly Lys Lys Phe Ser Arg Ser

260 265 270

Asp Asn Leu Ala Gln His Met Arg Thr His Pro Arg Asp

275 280 285

<210> 18

<211> 534

<212> PRT

<213> 里氏木霉

<400> 18

Met Asp Gly Met Met Ser Gln Pro Met Gly Gln Gln Ala Phe Tyr Phe

1 5 10 15

Tyr Asn His Glu His Lys Met Ser Pro Arg Gln Val Ile Phe Ala Gln

20 25 30

Gln Met Ala Ala Tyr Gln Met Met Pro Ser Leu Pro Pro Thr Pro Met

35 40 45

Tyr Ser Arg Pro Asn Ser Ser Cys Ser Gln Pro Pro Thr Leu Tyr Ser

50 55 60

Asn Gly Pro Ser Val Met Thr Pro Thr Ser Thr Pro Pro Leu Ser Ser

65 70 75 80

Arg Lys Pro Met Leu Val Asp Thr Glu Phe Gly Asp Asn Pro Tyr Phe

85 90 95

Pro Ser Thr Pro Pro Leu Ser Ala Ser Gly Ser Thr Val Gly Ser Pro

100 105 110

Lys Ala Cys Asp Met Leu Gln Thr Pro Met Asn Pro Met Phe Ser Gly

115 120 125

Leu Glu Gly Ile Ala Ile Lys Asp Ser Ile Asp Ala Thr Glu Ser Leu

130 135 140

Val Leu Asp Trp Ala Ser Ile Ala Ser Pro Pro Leu Ser Pro Val Tyr

145 150 155 160

Leu Gln Ser Gln Thr Ser Ser Gly Lys Val Pro Ser Leu Thr Ser Ser

165 170 175

Pro Ser Asp Met Leu Ser Thr Thr Ala Ser Cys Pro Ser Leu Ser Pro

180 185 190

Ser Pro Thr Pro Tyr Ala Arg Ser Val Thr Ser Glu His Asp Val Asp

195 200 205

Phe Cys Asp Pro Arg Asn Leu Thr Val Ser Val Gly Ser Asn Pro Thr

210 215 220

Leu Ala Pro Glu Phe Thr Leu Leu Ala Asp Asp Ile Lys Gly Glu Pro

225 230 235 240

Leu Pro Thr Ala Ala Gln Pro Ser Phe Asp Phe Asn Pro Ala Leu Pro

245 250 255

Ser Gly Leu Pro Thr Phe Glu Asp Phe Ser Asp Leu Glu Ser Glu Ala

260 265 270

Asp Phe Ser Ser Leu Val Asn Leu Gly Glu Ile Asn Pro Val Asp Ile

275 280 285

Ser Arg Pro Arg Ala Cys Thr Gly Ser Ser Val Val Ser Leu Gly His

290 295 300

Gly Ser Phe Ile Gly Asp Glu Asp Leu Ser Phe Asp Asp Glu Ala Phe

305 310 315 320

His Phe Pro Ser Leu Pro Ser Pro Thr Ser Ser Val Asp Phe Cys Asp

325 330 335

Val His Gln Asp Lys Arg Gln Lys Lys Asp Arg Lys Glu Ala Lys Pro

340 345 350

Val Met Asn Ser Ala Ala Gly Gly Ser Gln Ser Gly Asn Glu Gln Ala

355 360 365

Gly Ala Thr Glu Ala Ala Ser Ala Ala Ser Asp Ser Asn Ala Ser Ser

370 375 380

Ala Ser Asp Glu Pro Ser Ser Ser Met Pro Ala Pro Thr Asn Arg Arg

385 390 395 400

Gly Arg Lys Gln Ser Leu Thr Glu Asp Pro Ser Lys Thr Phe Val Cys

405 410 415

Asp Leu Cys Asn Arg Arg Phe Arg Arg Gln Glu His Leu Lys Arg His

420 425 430

Tyr Arg Ser Leu His Thr Gln Glu Lys Pro Phe Glu Cys Asn Glu Cys

435 440 445

Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ala Gln His Ala Arg Thr

450 455 460

His Ser Gly Gly Ala Ile Val Met Asn Leu Ile Glu Glu Ser Ser Glu

465 470 475 480

Val Pro Ala Tyr Asp Gly Ser Met Met Ala Gly Pro Val Gly Asp Asp

485 490 495

Tyr Ser Thr Tyr Gly Lys Val Leu Phe Gln Ile Ala Ser Glu Ile Pro

500 505 510

Gly Ser Ala Ser Glu Leu Ser Ser Glu Glu Gly Glu Gln Gly Lys Lys

515 520 525

Lys Arg Lys Arg Ser Asp

530

<210> 19

<211> 582

<212> PRT

<213> 粟酒裂殖酵母

<400> 19

Met Val Phe Phe Pro Glu Ala Met Pro Leu Val Thr Leu Ser Glu Arg

1 5 10 15

Met Val Pro Gln Val Asn Thr Ser Pro Phe Ala Pro Ala Gln Ser Ser

20 25 30

Ser Pro Leu Pro Ser Asn Ser Cys Arg Glu Tyr Ser Leu Pro Ser His

35 40 45

Pro Ser Thr His Asn Ser Ser Val Ala Tyr Val Asp Ser Gln Asp Asn

50 55 60

Lys Pro Pro Leu Val Ser Thr Leu His Phe Ser Leu Ala Pro Ser Leu

65 70 75 80

Ser Pro Ser Ser Ala Gln Ser His Asn Thr Ala Leu Ile Thr Glu Pro

85 90 95

Leu Thr Ser Phe Ile Gly Gly Thr Ser Gln Tyr Pro Ser Ala Ser Phe

100 105 110

Ser Thr Ser Gln His Pro Ser Gln Val Tyr Asn Asp Gly Ser Thr Leu

115 120 125

Asn Ser Asn Asn Thr Thr Gln Gln Leu Asn Asn Asn Asn Gly Phe Gln

130 135 140

Pro Pro Pro Gln Asn Pro Gly Ile Ser Lys Ser Arg Ile Ala Gln Tyr

145 150 155 160

His Gln Pro Ser Gln Thr Tyr Asp Asp Thr Val Asp Ser Ser Phe Tyr

165 170 175

Asp Trp Tyr Lys Ala Gly Ala Gln His Asn Leu Ala Pro Pro Gln Ser

180 185 190

Ser His Thr Glu Ala Ser Gln Gly Tyr Met Tyr Ser Thr Asn Thr Ala

195 200 205

His Asp Ala Thr Asp Ile Pro Ser Ser Phe Asn Phe Tyr Asn Thr Gln

210 215 220

Ala Ser Thr Ala Pro Asn Pro Gln Glu Ile Asn Tyr Gln Trp Ser His

225 230 235 240

Glu Tyr Arg Pro His Thr Gln Tyr Gln Asn Asn Leu Leu Arg Ala Gln

245 250 255

Pro Asn Val Asn Cys Glu Asn Phe Pro Thr Thr Val Pro Asn Tyr Pro

260 265 270

Phe Gln Gln Pro Ser Tyr Asn Pro Asn Ala Leu Val Pro Ser Tyr Thr

275 280 285

Thr Leu Val Ser Gln Leu Pro Pro Ser Pro Cys Leu Thr Val Ser Ser

290 295 300

Gly Pro Leu Ser Thr Ala Ser Ser Ile Pro Ser Asn Cys Ser Cys Pro

305 310 315 320

Ser Val Lys Ser Ser Gly Pro Ser Tyr His Ala Glu Gln Glu Val Asn

325 330 335

Val Asn Ser Tyr Asn Gly Gly Ile Pro Ser Thr Ser Tyr Asn Asp Thr

340 345 350

Pro Gln Gln Ser Val Thr Gly Ser Tyr Asn Ser Gly Glu Thr Met Ser

355 360 365

Thr Tyr Leu Asn Gln Thr Asn Thr Ser Gly Arg Ser Pro Asn Ser Met

370 375 380

Glu Ala Thr Glu Gln Ile Gly Thr Ile Gly Thr Asp Gly Ser Met Lys

385 390 395 400

Arg Arg Lys Arg Arg Gln Pro Ser Asn Arg Lys Thr Ser Val Pro Arg

405 410 415

Ser Pro Gly Gly Lys Ser Phe Val Cys Pro Glu Cys Ser Lys Lys Phe

420 425 430

Lys Arg Ser Glu His Leu Arg Arg His Ile Arg Ser Leu His Thr Ser

435 440 445

Glu Lys Pro Phe Val Cys Ile Cys Gly Lys Arg Phe Ser Arg Arg Asp

450 455 460

Asn Leu Arg Gln His Glu Arg Leu His Val Asn Ala Ser Pro Arg Leu

465 470 475 480

Ala Cys Phe Phe Gln Pro Ser Gly Tyr Tyr Ser Ser Gly Ala Pro Gly

485 490 495

Ala Pro Val Gln Pro Gln Lys Pro Ile Glu Asp Leu Asn Lys Ile Pro

500 505 510

Ile Asn Gln Gly Met Asp Ser Ser Gln Ile Glu Asn Thr Asn Leu Met

515 520 525

Leu Ser Ser Gln Arg Pro Leu Ser Gln Gln Ile Val Pro Glu Ile Ala

530 535 540

Ala Tyr Pro Asn Ser Ile Arg Pro Glu Leu Leu Ser Lys Leu Pro Val

545 550 555 560

Gln Thr Pro Asn Gln Lys Met Pro Leu Met Asn Pro Met His Gln Tyr

565 570 575

Gln Pro Tyr Pro Ser Ser

580

<210> 20

<211> 630

<212> PRT

<213> 酿酒酵母

<400> 20

Met Leu Val Phe Gly Pro Asn Ser Ser Phe Val Arg His Ala Asn Lys

1 5 10 15

Lys Gln Glu Asp Ser Ser Ile Met Asn Glu Pro Asn Gly Leu Met Asp

20 25 30

Pro Val Leu Ser Thr Thr Asn Val Ser Ala Thr Ser Ser Asn Asp Asn

35 40 45

Ser Ala Asn Asn Ser Ile Ser Ser Pro Glu Tyr Thr Phe Gly Gln Phe

50 55 60

Ser Met Asp Ser Pro His Arg Thr Asp Ala Thr Asn Thr Pro Ile Leu

65 70 75 80

Thr Ala Thr Thr Asn Thr Thr Ala Asn Asn Ser Leu Met Asn Leu Lys

85 90 95

Asp Thr Ala Ser Leu Ala Thr Asn Trp Lys Trp Lys Asn Ser Asn Asn

100 105 110

Ala Gln Phe Val Asn Asp Gly Glu Lys Gln Ser Ser Asn Ala Asn Gly

115 120 125

Lys Lys Asn Gly Gly Asp Lys Ile Tyr Ser Ser Val Ala Thr Pro Gln

130 135 140

Ala Leu Asn Asp Glu Leu Lys Asn Leu Glu Gln Leu Glu Lys Val Phe

145 150 155 160

Ser Pro Met Asn Pro Ile Asn Asp Ser His Phe Asn Glu Asn Ile Glu

165 170 175

Leu Ser Pro His Gln His Ala Thr Ser Pro Lys Thr Asn Leu Leu Glu

180 185 190

Ala Glu Pro Ser Ile Tyr Ser Asn Leu Phe Leu Asp Ala Arg Leu Pro

195 200 205

Asn Asn Ala Asn Ser Thr Thr Gly Leu Asn Asp Asn Asp Tyr Asn Leu

210 215 220

Asp Asp Thr Asn Asn Asp Asn Thr Asn Ser Met Gln Ser Ile Leu Glu

225 230 235 240

Asp Phe Val Ser Ser Glu Glu Ala Leu Lys Phe Met Pro Asp Ala Gly

245 250 255

Arg Asp Ala Arg Arg Tyr Ser Glu Val Val Thr Ser Ser Phe Pro Ser

260 265 270

Met Thr Asp Ser Arg Asn Ser Ile Ser His Ser Ile Glu Phe Trp Asn

275 280 285

Leu Asn His Lys Asn Ser Ser Asn Ser Lys Pro Thr Gln Gln Ile Ile

290 295 300

Pro Glu Gly Thr Ala Thr Thr Glu Arg Arg Gly Ser Thr Ile Ser Pro

305 310 315 320

Thr Thr Thr Ile Asn Asn Ser Asn Pro Asn Phe Lys Leu Leu Asp His

325 330 335

Asp Val Ser Gln Ala Leu Ser Gly Tyr Ser Met Asp Phe Ser Lys Asp

340 345 350

Ser Gly Ile Thr Lys Pro Lys Ser Ile Ser Ser Ser Leu Asn Arg Ile

355 360 365

Ser His Ser Ser Ser Thr Thr Arg Gln Gln Arg Ala Ser Leu Pro Leu

370 375 380

Ile His Asp Ile Glu Ser Phe Ala Asn Asp Ser Val Met Ala Asn Pro

385 390 395 400

Leu Ser Asp Ser Ala Ser Phe Leu Ser Glu Glu Asn Glu Asp Asp Ala

405 410 415

Phe Gly Ala Leu Asn Tyr Asn Ser Leu Asp Ala Thr Thr Met Ser Ala

420 425 430

Phe Asp Asn Asn Val Asp Pro Phe Asn Ile Leu Lys Ser Ser Pro Ala

435 440 445

Gln Asp Gln Gln Phe Ile Lys Pro Ser Met Met Leu Ser Asp Asn Ala

450 455 460

Ser Ala Ala Ala Lys Leu Ala Thr Ser Gly Val Asp Asn Ile Thr Pro

465 470 475 480

Thr Pro Ala Phe Gln Arg Arg Ser Tyr Asp Ile Ser Met Asn Ser Ser

485 490 495

Phe Lys Ile Leu Pro Thr Ser Gln Ala His His Ala Ala Gln His His

500 505 510

Gln Gln Gln Pro Thr Lys Gln Ala Thr Val Ser Pro Asn Thr Arg Arg

515 520 525

Arg Lys Ser Ser Ser Val Thr Leu Ser Pro Thr Ile Ser His Asn Asn

530 535 540

Asn Asn Gly Lys Val Pro Val Gln Pro Arg Lys Arg Lys Ser Ile Thr

545 550 555 560

Thr Ile Asp Pro Asn Asn Tyr Asp Lys Asn Lys Pro Phe Lys Cys Lys

565 570 575

Asp Cys Glu Lys Ala Phe Arg Arg Ser Glu His Leu Lys Arg His Ile

580 585 590

Arg Ser Val His Ser Thr Glu Arg Pro Phe Ala Cys Met Phe Cys Glu

595 600 605

Lys Lys Phe Ser Arg Ser Asp Asn Leu Ser Gln His Leu Lys Thr His

610 615 620

Lys Lys His Gly Asp Phe

625 630

<210> 21

<211> 704

<212> PRT

<213> 酿酒酵母

<400> 21

Met Thr Val Asp His Asp Phe Asn Ser Glu Asp Ile Leu Phe Pro Ile

1 5 10 15

Glu Ser Met Ser Ser Ile Gln Tyr Val Glu Asn Asn Asn Pro Asn Asn

20 25 30

Ile Asn Asn Asp Val Ile Pro Tyr Ser Leu Asp Ile Lys Asn Thr Val

35 40 45

Leu Asp Ser Ala Asp Leu Asn Asp Ile Gln Asn Gln Glu Thr Ser Leu

50 55 60

Asn Leu Gly Leu Pro Pro Leu Ser Phe Asp Ser Pro Leu Pro Val Thr

65 70 75 80

Glu Thr Ile Pro Ser Thr Thr Asp Asn Ser Leu His Leu Lys Ala Asp

85 90 95

Ser Asn Lys Asn Arg Asp Ala Arg Thr Ile Glu Asn Asp Ser Glu Ile

100 105 110

Lys Ser Thr Asn Asn Ala Ser Gly Ser Gly Ala Asn Gln Tyr Thr Thr

115 120 125

Leu Thr Ser Pro Tyr Pro Met Asn Asp Ile Leu Tyr Asn Met Asn Asn

130 135 140

Pro Leu Gln Ser Pro Ser Pro Ser Ser Val Pro Gln Asn Pro Thr Ile

145 150 155 160

Asn Pro Pro Ile Asn Thr Ala Ser Asn Glu Thr Asn Leu Ser Pro Gln

165 170 175

Thr Ser Asn Gly Asn Glu Thr Leu Ile Ser Pro Arg Ala Gln Gln His

180 185 190

Thr Ser Ile Lys Asp Asn Arg Leu Ser Leu Pro Asn Gly Ala Asn Ser

195 200 205

Asn Leu Phe Ile Asp Thr Asn Pro Asn Asn Leu Asn Glu Lys Leu Arg

210 215 220

Asn Gln Leu Asn Ser Asp Thr Asn Ser Tyr Ser Asn Ser Ile Ser Asn

225 230 235 240

Ser Asn Ser Asn Ser Thr Gly Asn Leu Asn Ser Ser Tyr Phe Asn Ser

245 250 255

Leu Asn Ile Asp Ser Met Leu Asp Asp Tyr Val Ser Ser Asp Leu Leu

260 265 270

Leu Asn Asp Asp Asp Asp Asp Thr Asn Leu Ser Arg Arg Arg Phe Ser

275 280 285

Asp Val Ile Thr Asn Gln Phe Pro Ser Met Thr Asn Ser Arg Asn Ser

290 295 300

Ile Ser His Ser Leu Asp Leu Trp Asn His Pro Lys Ile Asn Pro Ser

305 310 315 320

Asn Arg Asn Thr Asn Leu Asn Ile Thr Thr Asn Ser Thr Ser Ser Ser

325 330 335

Asn Ala Ser Pro Asn Thr Thr Thr Met Asn Ala Asn Ala Asp Ser Asn

340 345 350

Ile Ala Gly Asn Pro Lys Asn Asn Asp Ala Thr Ile Asp Asn Glu Leu

355 360 365

Thr Gln Ile Leu Asn Glu Tyr Asn Met Asn Phe Asn Asp Asn Leu Gly

370 375 380

Thr Ser Thr Ser Gly Lys Asn Lys Ser Ala Cys Pro Ser Ser Phe Asp

385 390 395 400

Ala Asn Ala Met Thr Lys Ile Asn Pro Ser Gln Gln Leu Gln Gln Gln

405 410 415

Leu Asn Arg Val Gln His Lys Gln Leu Thr Ser Ser His Asn Asn Ser

420 425 430

Ser Thr Asn Met Lys Ser Phe Asn Ser Asp Leu Tyr Ser Arg Arg Gln

435 440 445

Arg Ala Ser Leu Pro Ile Ile Asp Asp Ser Leu Ser Tyr Asp Leu Val

450 455 460

Asn Lys Gln Asp Glu Asp Pro Lys Asn Asp Met Leu Pro Asn Ser Asn

465 470 475 480

Leu Ser Ser Ser Gln Gln Phe Ile Lys Pro Ser Met Ile Leu Ser Asp

485 490 495

Asn Ala Ser Val Ile Ala Lys Val Ala Thr Thr Gly Leu Ser Asn Asp

500 505 510

Met Pro Phe Leu Thr Glu Glu Gly Glu Gln Asn Ala Asn Ser Thr Pro

515 520 525

Asn Phe Asp Leu Ser Ile Thr Gln Met Asn Met Ala Pro Leu Ser Pro

530 535 540

Ala Ser Ser Ser Ser Thr Ser Leu Ala Thr Asn His Phe Tyr His His

545 550 555 560

Phe Pro Gln Gln Gly His His Thr Met Asn Ser Lys Ile Gly Ser Ser

565 570 575

Leu Arg Arg Arg Lys Ser Ala Val Pro Leu Met Gly Thr Val Pro Leu

580 585 590

Thr Asn Gln Gln Asn Asn Ile Ser Ser Ser Ser Val Asn Ser Thr Gly

595 600 605

Asn Gly Ala Gly Val Thr Lys Glu Arg Arg Pro Ser Tyr Arg Arg Lys

610 615 620

Ser Met Thr Pro Ser Arg Arg Ser Ser Val Val Ile Glu Ser Thr Lys

625 630 635 640

Glu Leu Glu Glu Lys Pro Phe His Cys His Ile Cys Pro Lys Ser Phe

645 650 655

Lys Arg Ser Glu His Leu Lys Arg His Val Arg Ser Val His Ser Asn

660 665 670

Glu Arg Pro Phe Ala Cys His Ile Cys Asp Lys Lys Phe Ser Arg Ser

675 680 685

Asp Asn Leu Ser Gln His Ile Lys Thr His Lys Lys His Gly Asp Ile

690 695 700

<210> 22

<211> 694

<212> PRT

<213> 乳酸克鲁维酵母

<400> 22

Met Ala Leu Gly Arg Tyr Glu Ser Gly Asn Arg Gly Ser Tyr Thr Ser

1 5 10 15

Glu Asn Ser Leu Asp Ile Arg Asn Asp Ser Val Ser Thr Asn Tyr Gly

20 25 30

Asp Lys Val Ala Thr Glu Pro Thr Leu Gly Tyr Thr Arg Arg Asn Glu

35 40 45

Ser Thr Gly Ser Thr Pro Pro Ala Val Arg Asn Val Lys Arg Glu Thr

50 55 60

Leu Gln Asn Asn Met Gly Ser Thr Pro Thr Glu Leu Asn Asp Phe Leu

65 70 75 80

Ala Met Leu Asp Asp Lys Thr Thr Tyr Ser Glu Val Val Gln Ser Ala

85 90 95

Glu Pro Arg Leu Gly Phe Glu Asp Arg Gln Lys Ser Thr Glu Tyr His

100 105 110

Thr Gly Ser Glu Leu Ser Gly Asn Ser Asn Gly Ile Ala Leu Ser Gly

115 120 125

Ser Pro Val Asp Ser Tyr Pro Asn Ser Gln Lys Ile Ser Asn His Ser

130 135 140

Ser Arg Asn Asn Thr Leu Asn Tyr Ser Pro Asn Ile Glu Pro Ser Val

145 150 155 160

Met Ser Val Gly Thr Leu Ser Pro Gln Val Ala Asp Ile Ser Ser Arg

165 170 175

Lys Asn Ser Thr Val Gly Asn Ser Leu Asn Ser Asn Ser Ile Gln Glu

180 185 190

Phe Leu Asn Gln Ile Asp Leu Ser His Ser Glu Glu Gln Tyr Ile Asn

195 200 205

Pro Tyr Leu Leu Asn Lys Glu Ser Tyr Ser Thr Asn Asn Asn Thr Asn

210 215 220

Asn Gly His Asn Ser Phe Glu Val Thr His Ser Asp Ser Leu Phe Met

225 230 235 240

Asp Ser Gly Ala Asp Ala Glu Ala Glu Asp His Gly Glu Leu Asn Gln

245 250 255

Leu Asn Glu Asn Pro Leu Leu Leu Asp Asp Val Thr Val Ser Pro Asn

260 265 270

Pro Thr Ser Asp Asp Arg Arg Arg Met Ser Glu Val Val Asn Gly Asn

275 280 285

Ile Ala Tyr Pro Ala His Ser Arg Gly Ser Ile Ser His Gln Val Asp

290 295 300

Phe Trp Asn Leu Gly Ser Gly Asn Pro Ile Ser Ser Asn Gln Asn Gln

305 310 315 320

Ser Ser Asn Ser Gln Val Gln Gln Asp Asn Asn Ser Glu Leu Phe Asp

325 330 335

Leu Met Ser Phe Lys Asn Lys Gly Arg Gln His Leu Gln Gln Gln Leu

340 345 350

Gln Gln Gln Gln Gln Gln Ala Gln Leu Gln Ser Gln Met His Arg Gln

355 360 365

Gln Ile Gln Gln Arg Gln Gln His Gln Gln Gln Gln Ser Gln Gln Arg

370 375 380

His Ser Ala Phe Lys Ile Asp Asn Glu Leu Thr Gln Leu Leu Asn Ala

385 390 395 400

Tyr Asn Met Thr Gln Ser Asn Leu Pro Ser Asn Gly Ser Asn Ile Asn

405 410 415

Thr Asn Lys Leu Arg Thr Gly Ser Phe Thr Gln Ser Asn Val Lys Arg

420 425 430

Ser Asn Ser Ser Asn Gln Glu Ala His Asn Arg Val Gly Lys Gln Arg

435 440 445

Tyr Ser Met Ser Leu Leu Asp Gly Asn Gln Asp Val Ile Ser Lys Leu

450 455 460

Tyr Gly Asp Met Thr Arg Asn Gly Leu Ser Trp Glu Asn Ala Ile Ile

465 470 475 480

Ser Asp Asp Glu Glu Asp Pro Glu Asp His Glu Asp Ala Leu Arg Leu

485 490 495

Arg Arg Lys Ser Ala Leu Asn Arg Ser Thr Gln Val Ala Ser Gln Asn

500 505 510

Pro Thr Glu Thr Ser Ser Ser Gly Arg Phe Ile Ser Pro Gln Leu Leu

515 520 525

Asn Asn Asp Pro Leu Leu Glu Thr Gln Ile Ser Thr Ser Gln Thr Ser

530 535 540

Leu Gly Leu Asp Arg Ala Gly Leu Asn Phe Lys Leu Asn Leu Pro Ile

545 550 555 560

Thr Asn Pro Glu Ala Leu Ile Gly Ser Ser Gln Pro Asp Val Gln Thr

565 570 575

Leu Asn Val Tyr Ser Glu Ser Asn Val Leu Pro Thr Ser Ala Gln Ser

580 585 590

Thr Thr Thr Lys Lys Lys Arg Ser Ser Met Ser Lys Ser Lys Gly Pro

595 600 605

Lys Ser Thr Ser Pro Met Asp Glu Glu Glu Lys Pro Phe Lys Cys Asp

610 615 620

Gln Cys Asn Lys Thr Phe Arg Arg Ser Glu His Leu Lys Arg His Val

625 630 635 640

Arg Ser Val His Ser Thr Glu Arg Pro Phe His Cys Gln Phe Cys Asp

645 650 655

Lys Lys Phe Ser Arg Ser Asp Asn Leu Ser Gln His Leu Lys Thr His

660 665 670

Lys Lys His Gly Asp Ile Thr Glu Leu Pro Pro Pro Arg Arg Val Thr

675 680 685

Asn Ser Ser Asn Lys His

690

<210> 23

<211> 474

<212> PRT

<213> 乳酸克鲁维酵母

<400> 23

Met Asn Pro Thr Met Tyr Gln Asn Asp Phe Val Thr Ile Ser Gln Glu

1 5 10 15

Thr Leu Arg Asp Gly Thr Met Phe Asn Leu Gln Leu Lys Arg Thr Pro

20 25 30

Pro Ala Asp Asn Met Asp Asn Ser Asn Ile Gly Ala Asn Lys Tyr Asn

35 40 45

Gln Trp Gln Phe Asp Tyr Glu Glu Gln Glu Leu Ser Asn Asp Leu Thr

50 55 60

Gly Lys Thr Leu Glu Asp Glu Ile Phe Ser Phe Gln Gln Gly Thr Ser

65 70 75 80

Ile Arg Ala Met Gly Asp Asp Ile Arg Arg Leu Ser Ile Ser Glu Tyr

85 90 95

His Arg Asp Asp Pro Met Tyr Tyr Glu Tyr Glu Phe Phe Asn Lys Asp

100 105 110

Val Met Asn Gly Ser Ser Ser Arg Val Gly Asn Leu Gly Gly Met Gly

115 120 125

Ser Ser Arg Ser Gly Ser Val Phe Ser Asp Glu Asp Asn Glu Phe Asp

130 135 140

Ile Asp Met Asp Gln Glu Ser Ile Phe Val Asn Val Gly Ser Lys Ser

145 150 155 160

Val Asn Asp Ala Thr Gln Thr Val Pro His Thr Thr Asn Ser Met Ala

165 170 175

Leu Leu Leu Ser Gly Leu Asp Glu Asp Val Ser Met Asn Leu Asp Leu

180 185 190

Asp Asp Glu Asn Asp Gly Thr Gly Asn Ser Gly Val Lys Lys Leu Phe

195 200 205

Lys Leu Asn Lys Met Phe Arg Asn Asn Asn Asn Arg Asp Leu Ile Ser

210 215 220

Asp Asp Glu Pro Gln Gln Ile Phe Lys Lys Lys Tyr Phe Trp Ser Arg

225 230 235 240

Lys Pro Thr Val Pro Ile Leu Arg Asn Ser Glu Pro Val Ser Thr Ser

245 250 255

His Gly Ala Gly Leu Pro His Ala His Ala Glu His Ala Pro Ala Thr

260 265 270

Val Ser Ser His Asn Ala Glu Phe Asp Asp Asp Glu Met Thr Asp Val

275 280 285

Glu Thr Gly Asn Pro Ser Met Ala Ala Ala Ile Val Asn Pro Ile Lys

290 295 300

Leu Leu Ala Thr Gly Glu Thr Lys Asn Asp Ser Asp Leu Ile Thr Leu

305 310 315 320

Ser Ser His Ser Thr Lys Ile Asn Ser Leu Glu Pro Asp Leu Ile Leu

325 330 335

Ser Ser Asn Ser Ser Ile Met Ser Ala Val Lys Lys Asn Thr Thr Gly

340 345 350

Ser Arg Ser Ile Ser Ser Ala Ser Ser Ser Leu Leu Ser Pro Pro Pro

355 360 365

Met Val Gln Val Lys Lys Ala Glu Ser Leu Ser Leu Ala Lys Val Ile

370 375 380

Ser Ser Lys Asp Ser Ile Ser Thr Ile Ile Lys Lys Gln Gln Gly Val

385 390 395 400

Pro Lys Thr Arg Gly Arg Lys Pro Ser Pro Ile Leu Asp Ala Ser Lys

405 410 415

Pro Phe Gly Cys Glu Tyr Cys Asp Arg Arg Phe Lys Arg Gln Glu His

420 425 430

Leu Lys Arg His Ile Arg Ser Leu His Ile Cys Glu Lys Pro Tyr Gly

435 440 445

Cys His Leu Cys Gly Lys Lys Phe Ser Arg Ser Asp Asn Leu Ser Gln

450 455 460

His Leu Lys Thr His Thr His Glu Asp Lys

465 470

<210> 24

<211> 1008

<212> PRT

<213> 博伊丁假丝酵母

<400> 24

Met Asn Thr Thr Thr Thr Pro Asn Ser Asn Ser Ser Ser Ser Ser Asn

1 5 10 15

Asn Ser Ile Gly Met Gly Ile Asn Thr Gly Asn Ser Glu Leu Leu Ser

20 25 30

Phe Thr Gln Ser Ile Leu Ser Ser Ser Thr Ser Asp Val Val Ser Asp

35 40 45

Ser Gly Thr Ile Leu Ser Asp Ser Val Ser Thr Ile Lys Asn Tyr Asn

50 55 60

Ile Thr Asn Asn Asn Asn Asn Lys Asn Asn Asn Asn Asn Thr Asn Thr

65 70 75 80

Pro Ser Pro Asn Asn Asn Tyr Lys Leu Ser Asp Thr Tyr Asn Tyr Asn

85 90 95

Thr Asn Thr Ile Pro Asn Asn Thr Ser Tyr Asn Leu Asp Pro Met Ser

100 105 110

Asn Ser Asn Ser Gln Asn Thr Asn Thr Thr Ser Ala Asp Asp Thr Asp

115 120 125

Leu Tyr Ser Ala Ala Ile Gly Ser Val Ser Asn Ser Asn Lys Thr Ile

130 135 140

Thr Thr Asn Asn Asn Asn Asn Ile Asn Asn Asn Asn Lys Leu Asp Tyr

145 150 155 160

Glu Asp Leu Asn Val Leu Ile Asn Tyr Asp Leu Glu Ser Ile Asn Cys

165 170 175

Leu Ala Asp Gln Gln Pro Arg Asp Lys Asp Met Asn Ile Ile Asp Leu

180 185 190

Phe Cys Asp Leu Ala Thr Ser Asn Asp Asn Ile Val Thr Asn Met Ala

195 200 205

Asp Asn Val Ser Ile Thr Asn Thr Ile Thr Thr Asn Asn Thr Ser Thr

210 215 220

Thr Asn Thr Pro Thr Asp Leu Asn Leu Asn Pro Val Phe Gln Thr Phe

225 230 235 240

Pro Ser Pro Ser Ser Val Asn Thr Lys Gln Phe Val His Pro Gln Ser

245 250 255

Ile Arg Lys Ser Asn Lys Gln Phe Ser Ser Gln Tyr His Val Gln Tyr

260 265 270

Ser Pro Gln Gln Gln Gln Gln Gln Leu Gln Gln Leu Gln Phe Gln Gln

275 280 285

Leu Gln Ala Gln Leu Lys Ile Gln Ser Gln Leu Glu Thr His Leu Gln

290 295 300

Gln Gln His Gln Gln Gln Ser Gln Leu Gln Ser Gln Gln Ser Leu Glu

305 310 315 320

Asn Gly Asn Phe Pro Ile Phe Asp Ser Phe Ser Asn Asp Leu Ser Lys

325 330 335

Thr Leu Pro Ser Ala Thr Thr Pro Val Leu Gln Gln Gln Gln Gln Gln

340 345 350

Gln Leu Gln Gln Gln His Leu Gln Gln Gln Ala His Ile Phe Thr Gly

355 360 365

Ser Thr Ser Pro Gly Tyr Thr Pro Ser Leu Leu Ser Gly Ser Asn Phe

370 375 380

Ser Val Ser Ser Lys Arg Ser Ser Phe Ser Ser Asn Ser Asn Asp Ser

385 390 395 400

Pro Asn Pro Asn Pro Tyr His Gln Leu Ser Lys Leu Asn Pro Ser Thr

405 410 415

Asn Asn Asn Asn Thr Asn Ile Asn Ile Asn Gln Ile Ile Ala Asn Glu

420 425 430

Asn Thr Ser Leu Thr Thr Ala Ser Pro Asp Leu Phe Ser Lys Ala Tyr

435 440 445

Met Leu Asp Asp Met Asp Pro Ser Gln Gln Lys Tyr Gln His Gln Arg

450 455 460

Ala Ser Ser Ser Ser Ser Thr Thr Ile Thr Pro Thr Leu Pro Gly Thr

465 470 475 480

Asn Ser Ser Ser Ser Phe Ala Phe Thr Tyr Thr Asp Asp Leu Asp Arg

485 490 495

Leu Arg Lys Glu Ala Glu Leu Asp His Phe Asp Thr Asn Thr Ala Lys

500 505 510

Asp Ala Ile Ile Ser Asn Asn Gln Lys Phe Pro Ser Leu Arg Tyr Pro

515 520 525

Tyr Leu Ser Ser Ile Ile Thr Asn Lys Lys Asn Tyr Asp Arg Thr Ile

530 535 540

Asn Pro Arg Glu Ile Ile Ser Asp Tyr Ser Val Leu Thr Ala Pro Asn

545 550 555 560

Ser Thr Thr Ser Pro Asn Asp Leu Gln Ser Leu Lys Asn Asn Pro Leu

565 570 575

Ile Ser Asn Phe Asp Ser Asn Ala Ser Lys Leu Leu Asp Asn Glu Asn

580 585 590

Glu Ser Val Lys Ser Leu Phe Asn Gln Ser Phe Ala Phe Gly Glu Phe

595 600 605

Asp Gln Thr Ser Asn Asn Asn Ser Ser Thr Thr Ser Asn Asn Asn Thr

610 615 620

Thr Asn Gly Asn Asn Ser Phe Tyr Ser Gly Asn Phe Thr Ala Glu Leu

625 630 635 640

Arg Ser Asn Ser Asn Asn Thr Asn Gln Leu Phe Asn Ala Ile Arg Lys

645 650 655

Asn Pro Asp Leu Trp Asn Ser Tyr Asn Met Asp Asn Asn Asn Asn Asp

660 665 670

Asn Ala Ala Asp Arg Ser Asp Ser Asn Ser Lys Pro Val Met Val Asn

675 680 685

Asn Lys Pro Leu Ile Ser Pro Ser Leu Pro Ser Ser Ser Ser Val Ser

690 695 700

Ser Val Val Ser Ser Val Val Pro Lys Asn Ala Asp Pro Asn Cys Leu

705 710 715 720

Leu Thr Pro Asn Thr Ser Thr Ser Asn Ile Ser Ser Pro Ile Pro Pro

725 730 735

Ser Gln Leu Ser Thr Asn Thr Ser Ser Gly Ser Asn Ser Gln Tyr Ala

740 745 750

Val Asn Leu Gln His Arg Lys Arg Tyr Ser Thr Ser Ser Ile Ile Thr

755 760 765

Asp His Leu Thr Gly Thr Thr Gly Ile Thr Ala Pro Asn Thr Ser His

770 775 780

Pro Asn Arg Ile Ile Asn Pro Arg Ser Arg Ser Arg Ser Arg Ser Arg

785 790 795 800

His Gly Ser Phe Ala Ser Val Ser Asn Glu Arg Pro Thr Leu Ala Leu

805 810 815

Ile Asn Ser Asn Ser Thr Asn Ser Ile Val Asn Ser Asn Asn Ser Ser

820 825 830

Ser Ser Ile Lys Lys Leu Ser His Gly Ser Ile Asn Ser Ser Val Thr

835 840 845

Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Asn Asn Ser Ser

850 855 860

Lys Lys Arg Thr Lys Ser Leu Glu Ile Gln Ser Ile Ser Ser Val Asn

865 870 875 880

Ile Arg Asn Ser Leu Leu Ala Ser Leu Lys Gly Asn Pro Ile Asp Glu

885 890 895

Ser Pro Phe Asp Val Glu Asn Ser Asn Ser Gly Gly Gly Gly Asn Ser

900 905 910

Met Ala Gly Gly Gly Ile Thr Arg Leu Arg Ala Ser Ser Gly Ser Thr

915 920 925

Ser Ser Arg Arg Ser Ser Ser Ser Asn Thr Asp Ala Asn Ser Ser Gly

930 935 940

Ile Gly Leu Asp Asp Gly Phe Lys Pro Phe Arg Cys Ser Leu Cys Glu

945 950 955 960

Lys Ser Phe Lys Arg Gln Glu His Leu Lys Arg His His Arg Ser Val

965 970 975

His Ser Gly Glu Lys Pro His Ile Cys Gln Thr Cys Asp Lys Arg Phe

980 985 990

Ser Arg Thr Asp Asn Leu Ala Gln His Leu Arg Thr His Arg Asn Arg

995 1000 1005

<210> 25

<211> 612

<212> PRT

<213> 黑曲霉

<400> 25

Met Asp Gly Thr Tyr Thr Met Ala Pro Thr Ser Val Gln Gly Gln Pro

1 5 10 15

Ser Phe Ala Tyr Tyr Ala Asp Ser Gln Gln Arg Gln His Phe Thr Ser

20 25 30

His Pro Ser Asp Met Gln Ser Tyr Tyr Gly Gln Val Gln Ala Phe Gln

35 40 45

Gln Gln Pro Gln His Cys Met Pro Glu Gln Gln Thr Leu Tyr Thr Ala

50 55 60

Pro Leu Met Asn Met His Gln Met Ala Thr Thr Asn Ala Phe Arg Gly

65 70 75 80

Ala Met Asn Met Thr Pro Ile Ala Ser Pro Gln Pro Ser His Leu Lys

85 90 95

Pro Thr Ile Val Val Gln Gln Gly Ser Pro Ala Leu Met Pro Leu Asp

100 105 110

Thr Arg Phe Val Gly Asn Asp Tyr Tyr Ala Phe Pro Ser Thr Pro Pro

115 120 125

Leu Ser Thr Ala Gly Ser Ser Ile Ser Ser Pro Pro Ser Thr Ser Gly

130 135 140

Thr Leu His Thr Pro Ile Asn Asp Ser Phe Phe Ala Phe Glu Lys Val

145 150 155 160

Glu Gly Val Lys Glu Gly Cys Glu Gly Asp Val His Ala Glu Ile Leu

165 170 175

Ala Asn Ala Asp Trp Ala Arg Ser Asp Ser Pro Pro Leu Thr Pro Val

180 185 190

Phe Ile His Pro Pro Ser Leu Thr Ala Ser Gln Thr Ser Glu Leu Leu

195 200 205

Ser Ala His Ser Ser Cys Pro Ser Leu Ser Pro Ser Pro Ser Pro Val

210 215 220

Val Pro Thr Phe Val Ala Gln Pro Gln Gly Leu Pro Thr Glu Gln Ser

225 230 235 240

Ser Ser Asp Phe Cys Asp Pro Arg Gln Leu Thr Val Glu Ser Ser Ile

245 250 255

Asn Ala Thr Pro Ala Glu Leu Pro Pro Leu Pro Thr Leu Ser Cys Asp

260 265 270

Asp Glu Glu Pro Arg Val Val Leu Gly Ser Glu Ala Val Thr Leu Pro

275 280 285

Val His Glu Thr Leu Ser Pro Ala Phe Thr Cys Ser Ser Ser Glu Asp

290 295 300

Pro Leu Ser Ser Leu Pro Thr Phe Asp Ser Phe Ser Asp Leu Asp Ser

305 310 315 320

Glu Asp Glu Phe Val Asn Arg Leu Val Asp Phe Pro Pro Ser Gly Asn

325 330 335

Ala Tyr Tyr Leu Gly Glu Lys Arg Gln Arg Val Gly Thr Thr Tyr Pro

340 345 350

Leu Glu Glu Glu Glu Phe Phe Ser Glu Gln Ser Phe Asp Glu Ser Asp

355 360 365

Glu Gln Asp Leu Ser Gln Ser Ser Leu Pro Tyr Leu Gly Ser His Asp

370 375 380

Phe Thr Gly Val Gln Thr Asn Ile Asn Glu Ala Ser Glu Glu Met Gly

385 390 395 400

Asn Lys Lys Arg Asn Asn Arg Lys Ser Leu Lys Arg Ala Ser Thr Ser

405 410 415

Asp Ser Glu Thr Asp Ser Ile Ser Lys Lys Ser Gln Pro Ser Ile Asn

420 425 430

Ser Arg Ala Thr Ser Thr Glu Thr Asn Ala Ser Thr Pro Gln Thr Val

435 440 445

Gln Ala Arg His Asn Ser Asp Ala His Ser Ser Cys Ala Ser Glu Ala

450 455 460

Pro Ala Ala Pro Val Ser Val Asn Arg Arg Gly Arg Lys Gln Ser Leu

465 470 475 480

Thr Asp Asp Pro Ser Lys Thr Phe Val Cys Thr Leu Cys Ser Arg Arg

485 490 495

Phe Arg Arg Gln Glu His Leu Lys Arg His Tyr Arg Ser Leu His Thr

500 505 510

Gln Asp Lys Pro Phe Glu Cys Asn Glu Cys Gly Lys Lys Phe Ser Arg

515 520 525

Ser Asp Asn Leu Ala Gln His Ala Arg Thr His Ala Gly Gly Ser Val

530 535 540

Val Met Gly Val Ile Asp Thr Gly Asn Ala Thr Pro Pro Thr Pro Tyr

545 550 555 560

Glu Glu Arg Asp Pro Ser Thr Leu Gly Asn Val Leu Tyr Glu Ala Ala

565 570 575

Asn Ala Ala Ala Thr Lys Ser Thr Thr Ser Glu Ser Asp Glu Ser Ser

580 585 590

Ser Asp Ser Pro Val Ala Asp Arg Arg Ala Pro Lys Lys Arg Lys Arg

595 600 605

Asp Ser Asp Ala

610

<210> 26

<211> 443

<212> PRT

<213> 酿酒酵母

<400> 26

Met Ser Leu Tyr Pro Leu Gln Arg Phe Glu Ser Asn Asp Thr Val Phe

1 5 10 15

Ser Tyr Thr Leu Asn Ser Lys Thr Glu Leu Phe Asn Glu Ser Arg Asn

20 25 30

Asn Asp Lys Gln His Phe Thr Leu Gln Leu Ile Pro Asn Ala Asn Ala

35 40 45

Asn Ala Lys Glu Ile Asp Asn Asn Asn Val Glu Ile Ile Asn Asp Leu

50 55 60

Thr Gly Asn Thr Ile Val Asp Asn Cys Val Thr Thr Ala Thr Ser Ser

65 70 75 80

Asn Gln Leu Glu Arg Arg Leu Ser Ile Ser Asp Tyr Arg Thr Glu Asn

85 90 95

Gly Asn Tyr Tyr Glu Tyr Glu Phe Phe Gly Arg Arg Glu Leu Asn Glu

100 105 110

Pro Leu Phe Asn Asn Asp Ile Val Glu Asn Asp Asp Asp Ile Asp Leu

115 120 125

Asn Asn Glu Ser Asp Val Leu Met Val Ser Asp Asp Glu Leu Glu Val

130 135 140

Asn Glu Arg Phe Ser Phe Leu Lys Gln Gln Pro Leu Asp Gly Leu Asn

145 150 155 160

Arg Ile Ser Ser Thr Asn Asn Leu Lys Asn Leu Glu Ile His Glu Phe

165 170 175

Ile Ile Asp Pro Thr Glu Asn Ile Asp Asp Glu Leu Glu Asp Ser Phe

180 185 190

Thr Thr Val Pro Gln Ser Lys Lys Lys Val Arg Asp Tyr Phe Lys Leu

195 200 205

Asn Ile Phe Gly Ser Ser Ser Ser Ser Asn Asn Asn Ser Asn Ser Leu

210 215 220

Gly Cys Glu Pro Ile Gln Thr Glu Asn Ser Ser Ser Gln Lys Met Phe

225 230 235 240

Lys Asn Arg Phe Phe Arg Ser Arg Lys Ser Thr Leu Ile Lys Ser Leu

245 250 255

Pro Leu Glu Gln Glu Asn Glu Val Leu Ile Asn Ser Gly Phe Asp Val

260 265 270

Ser Ser Asn Glu Glu Ser Asp Glu Ser Asp His Ala Ile Ile Asn Pro

275 280 285

Leu Lys Leu Val Gly Asn Asn Lys Asp Ile Ser Thr Gln Ser Ile Ala

290 295 300

Lys Thr Thr Asn Pro Phe Lys Ser Gly Ser Asp Phe Lys Met Ile Glu

305 310 315 320

Pro Val Ser Lys Phe Ser Asn Asp Ser Arg Lys Asp Leu Leu Ala Ala

325 330 335

Ile Ser Glu Pro Ser Ser Ser Pro Ser Pro Ser Ala Pro Ser Pro Ser

340 345 350

Val Gln Ser Ser Ser Ser Ser His Gly Leu Val Val Arg Lys Lys Thr

355 360 365

Gly Ser Met Gln Lys Thr Arg Gly Arg Lys Pro Ser Leu Ile Pro Asp

370 375 380

Ala Ser Lys Gln Phe Gly Cys Glu Phe Cys Asp Arg Arg Phe Lys Arg

385 390 395 400

Gln Glu His Leu Lys Arg His Val Arg Ser Leu His Met Cys Glu Lys

405 410 415

Pro Phe Thr Cys His Ile Cys Asn Lys Asn Phe Ser Arg Ser Asp Asn

420 425 430

Leu Asn Gln His Val Lys Thr His Ala Ser Leu

435 440

<210> 27

<211> 144

<212> PRT

<213> 人工序列

<220>

<223> synMSN4

<400> 27

Met Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr Pro

1 5 10 15

Lys Lys Lys Arg Lys Val Gly Gly Gly Gly Ser Asp Ala Leu Asp Asp

20 25 30

Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu

35 40 45

Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu

50 55 60

Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Gly Gly

65 70 75 80

Gly Ser Asn Ser Asp Asp Glu Lys Gln Phe Arg Cys Thr Asp Cys Ser

85 90 95

Arg Arg Phe Arg Arg Ser Glu His Leu Lys Arg His His Arg Ser Val

100 105 110

His Ser Asn Glu Arg Pro Phe His Cys Ala His Cys Asp Lys Arg Phe

115 120 125

Ser Arg Ser Asp Asn Leu Ser Gln His Leu Arg Thr His Arg Lys Gln

130 135 140

<210> 28

<211> 678

<212> PRT

<213> Komagataella phaffii

<400> 28

Met Leu Ser Leu Lys Pro Ser Trp Leu Thr Leu Ala Ala Leu Met Tyr

1 5 10 15

Ala Met Leu Leu Val Val Val Pro Phe Ala Lys Pro Val Arg Ala Asp

20 25 30

Asp Val Glu Ser Tyr Gly Thr Val Ile Gly Ile Asp Leu Gly Thr Thr

35 40 45

Tyr Ser Cys Val Gly Val Met Lys Ser Gly Arg Val Glu Ile Leu Ala

50 55 60

Asn Asp Gln Gly Asn Arg Ile Thr Pro Ser Tyr Val Ser Phe Thr Glu

65 70 75 80

Asp Glu Arg Leu Val Gly Asp Ala Ala Lys Asn Leu Ala Ala Ser Asn

85 90 95

Pro Lys Asn Thr Ile Phe Asp Ile Lys Arg Leu Ile Gly Met Lys Tyr

100 105 110

Asp Ala Pro Glu Val Gln Arg Asp Leu Lys Arg Leu Pro Tyr Thr Val

115 120 125

Lys Ser Lys Asn Gly Gln Pro Val Val Ser Val Glu Tyr Lys Gly Glu

130 135 140

Glu Lys Ser Phe Thr Pro Glu Glu Ile Ser Ala Met Val Leu Gly Lys

145 150 155 160

Met Lys Leu Ile Ala Glu Asp Tyr Leu Gly Lys Lys Val Thr His Ala

165 170 175

Val Val Thr Val Pro Ala Tyr Phe Asn Asp Ala Gln Arg Gln Ala Thr

180 185 190

Lys Asp Ala Gly Leu Ile Ala Gly Leu Thr Val Leu Arg Ile Val Asn

195 200 205

Glu Pro Thr Ala Ala Ala Leu Ala Tyr Gly Leu Asp Lys Thr Gly Glu

210 215 220

Glu Arg Gln Ile Ile Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp Val

225 230 235 240

Ser Leu Leu Ser Ile Glu Gly Gly Ala Phe Glu Val Leu Ala Thr Ala

245 250 255

Gly Asp Thr His Leu Gly Gly Glu Asp Phe Asp Tyr Arg Val Val Arg

260 265 270

His Phe Val Lys Ile Phe Lys Lys Lys His Asn Ile Asp Ile Ser Asn

275 280 285

Asn Asp Lys Ala Leu Gly Lys Leu Lys Arg Glu Val Glu Lys Ala Lys

290 295 300

Arg Thr Leu Ser Ser Gln Met Thr Thr Arg Ile Glu Ile Asp Ser Phe

305 310 315 320

Val Asp Gly Ile Asp Phe Ser Glu Gln Leu Ser Arg Ala Lys Phe Glu

325 330 335

Glu Ile Asn Ile Glu Leu Phe Lys Lys Thr Leu Lys Pro Val Glu Gln

340 345 350

Val Leu Lys Asp Ala Gly Val Lys Lys Ser Glu Ile Asp Asp Ile Val

355 360 365

Leu Val Gly Gly Ser Thr Arg Ile Pro Lys Val Gln Gln Leu Leu Glu

370 375 380

Asp Tyr Phe Asp Gly Lys Lys Ala Ser Lys Gly Ile Asn Pro Asp Glu

385 390 395 400

Ala Val Ala Tyr Gly Ala Ala Val Gln Ala Gly Val Leu Ser Gly Glu

405 410 415

Glu Gly Val Asp Asp Ile Val Leu Leu Asp Val Asn Pro Leu Thr Leu

420 425 430

Gly Ile Glu Thr Thr Gly Gly Val Met Thr Thr Leu Ile Asn Arg Asn

435 440 445

Thr Ala Ile Pro Thr Lys Lys Ser Gln Ile Phe Ser Thr Ala Ala Asp

450 455 460

Asn Gln Pro Thr Val Leu Ile Gln Val Tyr Glu Gly Glu Arg Ala Leu

465 470 475 480

Ala Lys Asp Asn Asn Leu Leu Gly Lys Phe Glu Leu Thr Gly Ile Pro

485 490 495

Pro Ala Pro Arg Gly Thr Pro Gln Val Glu Val Thr Phe Val Leu Asp

500 505 510

Ala Asn Gly Ile Leu Lys Val Ser Ala Thr Asp Lys Gly Thr Gly Lys

515 520 525

Ser Glu Ser Ile Thr Ile Asn Asn Asp Arg Gly Arg Leu Ser Lys Glu

530 535 540

Glu Val Asp Arg Met Val Glu Glu Ala Glu Lys Tyr Ala Ala Glu Asp

545 550 555 560

Ala Ala Leu Arg Glu Lys Ile Glu Ala Arg Asn Ala Leu Glu Asn Tyr

565 570 575

Ala His Ser Leu Arg Asn Gln Val Thr Asp Asp Ser Glu Thr Gly Leu

580 585 590

Gly Ser Lys Leu Asp Glu Asp Asp Lys Glu Thr Leu Thr Asp Ala Ile

595 600 605

Lys Asp Thr Leu Glu Phe Leu Glu Asp Asn Phe Asp Thr Ala Thr Lys

610 615 620

Glu Glu Leu Asp Glu Gln Arg Glu Lys Leu Ser Lys Ile Ala Tyr Pro

625 630 635 640

Ile Thr Ser Lys Leu Tyr Gly Ala Pro Glu Gly Gly Thr Pro Pro Gly

645 650 655

Gly Gln Gly Phe Asp Asp Asp Asp Gly Asp Phe Asp Tyr Asp Tyr Asp

660 665 670

Tyr Asp His Asp Glu Leu

675

<210> 29

<211> 677

<212> PRT

<213> Komagataella pastoris

<400> 29

Met Gln Ser Leu Lys Pro Ser Trp Leu Thr Leu Ala Ala Leu Leu Tyr

1 5 10 15

Ala Met Leu Met Val Val Val Pro Phe Ala Lys Pro Val Arg Ala Asp

20 25 30

Asp Val Glu Ser Tyr Gly Thr Val Ile Gly Ile Asp Leu Gly Thr Thr

35 40 45

Tyr Ser Cys Val Gly Val Met Lys Ser Gly Arg Val Glu Ile Leu Ala

50 55 60

Asn Asp Gln Gly Asn Arg Ile Thr Pro Ser Tyr Val Ser Phe Thr Glu

65 70 75 80

Asp Glu Arg Leu Val Gly Asp Ala Ala Lys Asn Leu Ala Ala Ser Asn

85 90 95

Pro Lys Asn Thr Ile Phe Asp Ile Lys Arg Leu Ile Gly Met Lys Phe

100 105 110

Asp Ser Pro Glu Val Gln Arg Asp Leu Lys Arg Leu Pro Tyr Ser Val

115 120 125

Lys Ser Lys Asn Gly Gln Pro Ile Val Ser Val Glu Tyr Lys Gly Glu

130 135 140

Glu Lys Ser Phe Thr Pro Glu Glu Ile Ser Ala Met Val Leu Gly Lys

145 150 155 160

Met Lys Leu Ile Ala Glu Asp Tyr Leu Gly Lys Lys Val Thr His Ala

165 170 175

Val Val Thr Val Pro Ala Tyr Phe Asn Asp Ala Gln Arg Gln Ala Thr

180 185 190

Lys Asp Ala Gly Leu Ile Ala Gly Leu Thr Val Leu Arg Ile Val Asn

195 200 205

Glu Pro Thr Ala Ala Ala Leu Ala Tyr Gly Leu Asp Lys Thr Gly Glu

210 215 220

Glu Arg Gln Ile Ile Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp Val

225 230 235 240

Ser Leu Leu Ser Ile Glu Gly Gly Ala Phe Glu Val Leu Ala Thr Ala

245 250 255

Gly Asp Thr His Leu Gly Gly Glu Asp Phe Asp Tyr Arg Val Val Arg

260 265 270

His Phe Val Lys Ile Phe Lys Lys Lys His Asn Ile Asp Ile Ser Asp

275 280 285

Asn Asp Lys Ala Leu Gly Lys Leu Lys Arg Glu Val Glu Lys Ala Lys

290 295 300

Arg Thr Leu Ser Ser Gln Met Thr Thr Arg Ile Glu Ile Asp Ser Phe

305 310 315 320

Val Asp Gly Ile Asp Phe Ser Glu Gln Leu Ser Arg Ala Lys Phe Glu

325 330 335

Glu Ile Asn Ile Glu Leu Phe Lys Lys Thr Leu Lys Pro Val Glu Gln

340 345 350

Val Leu Lys Asp Ala Gly Val Lys Lys Ser Glu Ile Asp Asp Ile Val

355 360 365

Leu Val Gly Gly Ser Thr Arg Ile Pro Lys Val Gln Gln Leu Leu Glu

370 375 380

Asp Phe Phe Asp Gly Lys Lys Ala Ser Lys Gly Ile Asn Pro Asp Glu

385 390 395 400

Ala Val Ala Tyr Gly Ala Ala Val Gln Ala Gly Val Leu Ser Gly Glu

405 410 415

Glu Gly Val Asp Asp Ile Val Leu Leu Asp Val Asn Pro Leu Thr Leu

420 425 430

Gly Ile Glu Thr Thr Gly Gly Val Met Thr Thr Leu Ile Asn Arg Asn

435 440 445

Thr Ala Ile Pro Thr Lys Lys Ser Gln Ile Phe Ser Thr Ala Ala Asp

450 455 460

Asn Gln Pro Thr Val Leu Ile Gln Val Tyr Glu Gly Glu Arg Ala Leu

465 470 475 480

Ala Lys Asp Asn Asn Leu Leu Gly Lys Phe Glu Leu Thr Gly Ile Pro

485 490 495

Pro Ala Pro Arg Gly Thr Pro Gln Val Glu Val Thr Phe Val Leu Asp

500 505 510

Ala Asn Gly Ile Leu Lys Val Ser Ala Thr Asp Lys Gly Thr Gly Lys

515 520 525

Ser Glu Ser Ile Thr Ile Asn Asn Asp Arg Gly Arg Leu Ser Lys Glu

530 535 540

Glu Val Asp Arg Met Val Glu Glu Ala Glu Lys Tyr Ala Ala Glu Asp

545 550 555 560

Ala Ala Leu Arg Glu Lys Ile Glu Ala Arg Asn Ala Leu Glu Asn Tyr

565 570 575

Ala His Ser Leu Arg Asn Gln Val Thr Asp Asp Ser Glu Thr Gly Leu

580 585 590

Gly Ser Lys Leu Asp Glu Asp Asp Lys Glu Thr Leu Thr Asp Ala Ile

595 600 605

Lys Asp Thr Leu Glu Phe Leu Glu Asp Asn Phe Asp Thr Ala Thr Lys

610 615 620

Glu Glu Leu Asp Glu Gln Arg Glu Lys Leu Ser Lys Ile Ala Tyr Pro

625 630 635 640

Ile Thr Ser Lys Leu Tyr Gly Ala Pro Glu Gly Gly Ala Pro Pro Gly

645 650 655

Gln Gly Phe Asp Asp Asp Asp Gly Asp Phe Asp Tyr Asp Tyr Asp Tyr

660 665 670

Asp His Asp Glu Leu

675

<210> 30

<211> 670

<212> PRT

<213> 解脂耶氏酵母

<400> 30

Met Lys Phe Ser Met Pro Ser Trp Gly Val Val Phe Tyr Ala Leu Leu

1 5 10 15

Val Cys Leu Leu Pro Phe Leu Ser Lys Ala Gly Val Gln Ala Asp Asp

20 25 30

Val Asp Ser Tyr Gly Thr Val Ile Gly Ile Asp Leu Gly Thr Thr Tyr

35 40 45

Ser Cys Val Gly Val Met Lys Gly Gly Arg Val Glu Ile Leu Ala Asn

50 55 60

Asp Gln Gly Ser Arg Ile Thr Pro Ser Tyr Val Ala Phe Thr Glu Asp

65 70 75 80

Glu Arg Leu Val Gly Asp Ala Ala Lys Asn Gln Ala Ala Asn Asn Pro

85 90 95

Phe Asn Thr Ile Phe Asp Ile Lys Arg Leu Ile Gly Leu Lys Tyr Lys

100 105 110

Asp Glu Ser Val Gln Arg Asp Ile Lys His Phe Pro Tyr Lys Val Lys

115 120 125

Asn Lys Asp Gly Lys Pro Val Val Val Val Glu Thr Lys Gly Glu Lys

130 135 140

Lys Thr Tyr Thr Pro Glu Glu Ile Ser Ala Met Ile Leu Thr Lys Met

145 150 155 160

Lys Asp Ile Ala Gln Asp Tyr Leu Gly Lys Lys Val Thr His Ala Val

165 170 175

Val Thr Val Pro Ala Tyr Phe Asn Asp Ala Gln Arg Gln Ala Thr Lys

180 185 190

Asp Ala Gly Ile Ile Ala Gly Leu Asn Val Leu Arg Ile Val Asn Glu

195 200 205

Pro Thr Ala Ala Ala Ile Ala Tyr Gly Leu Asp His Thr Asp Asp Glu

210 215 220

Lys Gln Ile Val Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp Val Ser

225 230 235 240

Leu Leu Ser Ile Glu Ser Gly Val Phe Glu Val Leu Ala Thr Ala Gly

245 250 255

Asp Thr His Leu Gly Gly Glu Asp Phe Asp Tyr Arg Val Ile Lys His

260 265 270

Phe Val Lys Gln Tyr Asn Lys Lys His Asp Val Asp Ile Thr Lys Asn

275 280 285

Ala Lys Thr Ile Gly Lys Leu Lys Arg Glu Val Glu Lys Ala Lys Arg

290 295 300

Thr Leu Ser Ser Gln Met Ser Thr Arg Ile Glu Ile Glu Ser Phe Phe

305 310 315 320

Asp Gly Glu Asp Phe Ser Glu Thr Leu Thr Arg Ala Lys Phe Glu Glu

325 330 335

Leu Asn Ile Asp Leu Phe Lys Arg Thr Leu Lys Pro Val Glu Gln Val

340 345 350

Leu Lys Asp Ser Gly Val Lys Lys Glu Asp Val His Asp Ile Val Leu

355 360 365

Val Gly Gly Ser Thr Arg Ile Pro Lys Val Gln Glu Leu Leu Glu Lys

370 375 380

Phe Phe Asp Gly Lys Lys Ala Ser Lys Gly Ile Asn Pro Asp Glu Ala

385 390 395 400

Val Ala Tyr Gly Ala Ala Val Gln Ala Gly Val Leu Ser Gly Glu Asp

405 410 415

Gly Val Glu Asp Ile Val Leu Leu Asp Val Asn Pro Leu Thr Leu Gly

420 425 430

Ile Glu Thr Thr Gly Gly Val Met Thr Lys Leu Ile Asn Arg Asn Thr

435 440 445

Asn Ile Pro Thr Lys Lys Ser Gln Ile Phe Ser Thr Ala Val Asp Asn

450 455 460

Gln Ser Thr Val Leu Ile Gln Val Phe Glu Gly Glu Arg Thr Met Ser

465 470 475 480

Lys Asp Asn Asn Leu Leu Gly Lys Phe Glu Leu Lys Gly Ile Pro Pro

485 490 495

Ala Pro Arg Gly Val Pro Gln Ile Glu Val Thr Phe Glu Leu Asp Ala

500 505 510

Asn Gly Ile Leu Arg Val Thr Ala His Asp Lys Gly Thr Gly Lys Ser

515 520 525

Glu Thr Ile Thr Ile Thr Asn Asp Lys Gly Arg Leu Ser Lys Asp Glu

530 535 540

Ile Glu Arg Met Val Glu Glu Ala Glu Arg Phe Ala Glu Glu Asp Ala

545 550 555 560

Leu Ile Arg Glu Thr Ile Glu Ala Lys Asn Ser Leu Glu Asn Tyr Ala

565 570 575

His Ser Leu Arg Asn Gln Val Ala Asp Lys Ser Gly Leu Gly Gly Lys

580 585 590

Ile Ser Ala Asp Asp Lys Glu Ala Leu Asn Asp Ala Val Thr Glu Thr

595 600 605

Leu Glu Trp Leu Glu Ala Asn Ser Val Ser Ala Thr Lys Glu Asp Phe

610 615 620

Glu Glu Lys Lys Glu Ala Leu Ser Ala Ile Ala Tyr Pro Ile Thr Ser

625 630 635 640

Lys Ile Tyr Glu Gly Gly Glu Gly Gly Asp Glu Ser Asn Asp Gly Gly

645 650 655

Phe Tyr Ala Asp Asp Asp Glu Ala Pro Phe His Asp Glu Leu

660 665 670

<210> 31

<211> 664

<212> PRT

<213> 里氏木霉

<400> 31

Met Ala Arg Ser Arg Ser Ser Leu Ala Leu Gly Leu Gly Leu Leu Cys

1 5 10 15

Trp Ile Thr Leu Leu Phe Ala Pro Leu Ala Phe Val Gly Lys Ala Asn

20 25 30

Ala Ala Ser Asp Asp Ala Asp Asn Tyr Gly Thr Val Ile Gly Ile Asp

35 40 45

Leu Gly Thr Thr Tyr Ser Cys Val Gly Val Met Gln Lys Gly Lys Val

50 55 60

Glu Ile Leu Val Asn Asp Gln Gly Asn Arg Ile Thr Pro Ser Tyr Val

65 70 75 80

Ala Phe Thr Asp Glu Glu Arg Leu Val Gly Asp Ser Ala Lys Asn Gln

85 90 95

Ala Ala Ala Asn Pro Thr Asn Thr Val Tyr Asp Val Lys Arg Leu Ile

100 105 110

Gly Arg Lys Phe Asp Glu Lys Glu Ile Gln Ala Asp Ile Lys His Phe

115 120 125

Pro Tyr Lys Val Ile Glu Lys Asn Gly Lys Pro Val Val Gln Val Gln

130 135 140

Val Asn Gly Gln Lys Lys Gln Phe Thr Pro Glu Glu Ile Ser Ala Met

145 150 155 160

Ile Leu Gly Lys Met Lys Glu Val Ala Glu Ser Tyr Leu Gly Lys Lys

165 170 175

Val Thr His Ala Val Val Thr Val Pro Ala Tyr Phe Asn Asp Asn Gln

180 185 190

Arg Gln Ala Thr Lys Asp Ala Gly Thr Ile Ala Gly Leu Asn Val Leu

195 200 205

Arg Ile Val Asn Glu Pro Thr Ala Ala Ala Ile Ala Tyr Gly Leu Asp

210 215 220

Lys Thr Asp Gly Glu Arg Gln Ile Ile Val Tyr Asp Leu Gly Gly Gly

225 230 235 240

Thr Phe Asp Val Ser Leu Leu Ser Ile Asp Asn Gly Val Phe Glu Val

245 250 255

Leu Ala Thr Ala Gly Asp Thr His Leu Gly Gly Glu Asp Phe Asp Gln

260 265 270

Arg Ile Ile Asn Tyr Leu Ala Lys Ala Tyr Asn Lys Lys Asn Asn Val

275 280 285

Asp Ile Ser Lys Asp Leu Lys Ala Met Gly Lys Leu Lys Arg Glu Ala

290 295 300

Glu Lys Ala Lys Arg Thr Leu Ser Ser Gln Met Ser Thr Arg Ile Glu

305 310 315 320

Ile Glu Ala Phe Phe Glu Gly Asn Asp Phe Ser Glu Thr Leu Thr Arg

325 330 335

Ala Lys Phe Glu Glu Leu Asn Met Asp Leu Phe Lys Lys Thr Leu Lys

340 345 350

Pro Val Glu Gln Val Leu Lys Asp Ala Asn Val Lys Lys Ser Glu Val

355 360 365

Asp Asp Ile Val Leu Val Gly Gly Ser Thr Arg Ile Pro Lys Val Gln

370 375 380

Ser Leu Ile Glu Glu Tyr Phe Asn Gly Lys Lys Ala Ser Lys Gly Ile

385 390 395 400

Asn Pro Asp Glu Ala Val Ala Phe Gly Ala Ala Val Gln Ala Gly Val

405 410 415

Leu Ser Gly Glu Glu Gly Thr Asp Asp Ile Val Leu Met Asp Val Asn

420 425 430

Pro Leu Thr Leu Gly Ile Glu Thr Thr Gly Gly Val Met Thr Lys Leu

435 440 445

Ile Pro Arg Asn Thr Pro Ile Pro Thr Arg Lys Ser Gln Ile Phe Ser

450 455 460

Thr Ala Ala Asp Asn Gln Pro Val Val Leu Ile Gln Val Phe Glu Gly

465 470 475 480

Glu Arg Ser Met Thr Lys Asp Asn Asn Leu Leu Gly Lys Phe Glu Leu

485 490 495

Thr Gly Ile Pro Pro Ala Pro Arg Gly Val Pro Gln Ile Glu Val Ser

500 505 510

Phe Glu Leu Asp Ala Asn Gly Ile Leu Lys Val Ser Ala His Asp Lys

515 520 525

Gly Thr Gly Lys Gln Glu Ser Ile Thr Ile Thr Asn Asp Lys Gly Arg

530 535 540

Leu Thr Gln Glu Glu Ile Asp Arg Met Val Ala Glu Ala Glu Lys Phe

545 550 555 560

Ala Glu Glu Asp Lys Ala Thr Arg Glu Arg Ile Glu Ala Arg Asn Gly

565 570 575

Leu Glu Asn Tyr Ala Phe Ser Leu Lys Asn Gln Val Asn Asp Glu Glu

580 585 590

Gly Leu Gly Gly Lys Ile Asp Glu Glu Asp Lys Glu Thr Ile Leu Asp

595 600 605

Ala Val Lys Glu Ala Thr Glu Trp Leu Glu Glu Asn Gly Ala Asp Ala

610 615 620

Thr Thr Glu Asp Phe Glu Glu Gln Lys Glu Lys Leu Ser Asn Val Ala

625 630 635 640

Tyr Pro Ile Thr Ser Lys Met Tyr Gln Gly Ala Gly Gly Ser Glu Asp

645 650 655

Asp Gly Asp Phe His Asp Glu Leu

660

<210> 32

<211> 682

<212> PRT

<213> 酿酒酵母

<400> 32

Met Phe Phe Asn Arg Leu Ser Ala Gly Lys Leu Leu Val Pro Leu Ser

1 5 10 15

Val Val Leu Tyr Ala Leu Phe Val Val Ile Leu Pro Leu Gln Asn Ser

20 25 30

Phe His Ser Ser Asn Val Leu Val Arg Gly Ala Asp Asp Val Glu Asn

35 40 45

Tyr Gly Thr Val Ile Gly Ile Asp Leu Gly Thr Thr Tyr Ser Cys Val

50 55 60

Ala Val Met Lys Asn Gly Lys Thr Glu Ile Leu Ala Asn Glu Gln Gly

65 70 75 80

Asn Arg Ile Thr Pro Ser Tyr Val Ala Phe Thr Asp Asp Glu Arg Leu

85 90 95

Ile Gly Asp Ala Ala Lys Asn Gln Val Ala Ala Asn Pro Gln Asn Thr

100 105 110

Ile Phe Asp Ile Lys Arg Leu Ile Gly Leu Lys Tyr Asn Asp Arg Ser

115 120 125

Val Gln Lys Asp Ile Lys His Leu Pro Phe Asn Val Val Asn Lys Asp

130 135 140

Gly Lys Pro Ala Val Glu Val Ser Val Lys Gly Glu Lys Lys Val Phe

145 150 155 160

Thr Pro Glu Glu Ile Ser Gly Met Ile Leu Gly Lys Met Lys Gln Ile

165 170 175

Ala Glu Asp Tyr Leu Gly Thr Lys Val Thr His Ala Val Val Thr Val

180 185 190

Pro Ala Tyr Phe Asn Asp Ala Gln Arg Gln Ala Thr Lys Asp Ala Gly

195 200 205

Thr Ile Ala Gly Leu Asn Val Leu Arg Ile Val Asn Glu Pro Thr Ala

210 215 220

Ala Ala Ile Ala Tyr Gly Leu Asp Lys Ser Asp Lys Glu His Gln Ile

225 230 235 240

Ile Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp Val Ser Leu Leu Ser

245 250 255

Ile Glu Asn Gly Val Phe Glu Val Gln Ala Thr Ser Gly Asp Thr His

260 265 270

Leu Gly Gly Glu Asp Phe Asp Tyr Lys Ile Val Arg Gln Leu Ile Lys

275 280 285

Ala Phe Lys Lys Lys His Gly Ile Asp Val Ser Asp Asn Asn Lys Ala

290 295 300

Leu Ala Lys Leu Lys Arg Glu Ala Glu Lys Ala Lys Arg Ala Leu Ser

305 310 315 320

Ser Gln Met Ser Thr Arg Ile Glu Ile Asp Ser Phe Val Asp Gly Ile

325 330 335

Asp Leu Ser Glu Thr Leu Thr Arg Ala Lys Phe Glu Glu Leu Asn Leu

340 345 350

Asp Leu Phe Lys Lys Thr Leu Lys Pro Val Glu Lys Val Leu Gln Asp

355 360 365

Ser Gly Leu Glu Lys Lys Asp Val Asp Asp Ile Val Leu Val Gly Gly

370 375 380

Ser Thr Arg Ile Pro Lys Val Gln Gln Leu Leu Glu Ser Tyr Phe Asp

385 390 395 400

Gly Lys Lys Ala Ser Lys Gly Ile Asn Pro Asp Glu Ala Val Ala Tyr

405 410 415

Gly Ala Ala Val Gln Ala Gly Val Leu Ser Gly Glu Glu Gly Val Glu

420 425 430

Asp Ile Val Leu Leu Asp Val Asn Ala Leu Thr Leu Gly Ile Glu Thr

435 440 445

Thr Gly Gly Val Met Thr Pro Leu Ile Lys Arg Asn Thr Ala Ile Pro

450 455 460

Thr Lys Lys Ser Gln Ile Phe Ser Thr Ala Val Asp Asn Gln Pro Thr

465 470 475 480

Val Met Ile Lys Val Tyr Glu Gly Glu Arg Ala Met Ser Lys Asp Asn

485 490 495

Asn Leu Leu Gly Lys Phe Glu Leu Thr Gly Ile Pro Pro Ala Pro Arg

500 505 510

Gly Val Pro Gln Ile Glu Val Thr Phe Ala Leu Asp Ala Asn Gly Ile

515 520 525

Leu Lys Val Ser Ala Thr Asp Lys Gly Thr Gly Lys Ser Glu Ser Ile

530 535 540

Thr Ile Thr Asn Asp Lys Gly Arg Leu Thr Gln Glu Glu Ile Asp Arg

545 550 555 560

Met Val Glu Glu Ala Glu Lys Phe Ala Ser Glu Asp Ala Ser Ile Lys

565 570 575

Ala Lys Val Glu Ser Arg Asn Lys Leu Glu Asn Tyr Ala His Ser Leu

580 585 590

Lys Asn Gln Val Asn Gly Asp Leu Gly Glu Lys Leu Glu Glu Glu Asp

595 600 605

Lys Glu Thr Leu Leu Asp Ala Ala Asn Asp Val Leu Glu Trp Leu Asp

610 615 620

Asp Asn Phe Glu Thr Ala Ile Ala Glu Asp Phe Asp Glu Lys Phe Glu

625 630 635 640

Ser Leu Ser Lys Val Ala Tyr Pro Ile Thr Ser Lys Leu Tyr Gly Gly

645 650 655

Ala Asp Gly Ser Gly Ala Ala Asp Tyr Asp Asp Glu Asp Glu Asp Asp

660 665 670

Asp Gly Asp Tyr Phe Glu His Asp Glu Leu

675 680

<210> 33

<211> 679

<212> PRT

<213> 乳酸克鲁维酵母

<400> 33

Met Phe Ser Ala Arg Lys Ser Ser Val Gly Trp Leu Val Ser Ser Leu

1 5 10 15

Ala Val Phe Tyr Val Leu Leu Ala Val Ile Met Pro Ile Ala Leu Thr

20 25 30

Gly Ser Gln Ser Ser Arg Val Val Ala Arg Ala Ala Glu Asp His Glu

35 40 45

Asp Tyr Gly Thr Val Ile Gly Ile Asp Leu Gly Thr Thr Tyr Ser Cys

50 55 60

Val Ala Val Met Lys Asn Gly Lys Thr Glu Ile Leu Ala Asn Glu Gln

65 70 75 80

Gly Asn Arg Ile Thr Pro Ser Tyr Val Ser Phe Thr Asp Asp Glu Arg

85 90 95

Leu Ile Gly Asp Ala Ala Lys Asn Gln Ala Ala Ser Asn Pro Lys Asn

100 105 110

Thr Ile Phe Asp Ile Lys Arg Leu Ile Gly Leu Gln Tyr Asn Asp Pro

115 120 125

Thr Val Gln Arg Asp Ile Lys His Leu Pro Tyr Thr Val Val Asn Lys

130 135 140

Gly Asn Lys Pro Tyr Val Glu Val Thr Val Lys Gly Glu Lys Lys Glu

145 150 155 160

Phe Thr Pro Glu Glu Val Ser Gly Met Ile Leu Gly Lys Met Lys Gln

165 170 175

Ile Ala Glu Asp Tyr Leu Gly Lys Lys Val Thr His Ala Val Val Thr

180 185 190

Val Pro Ala Tyr Phe Asn Asp Ala Gln Arg Gln Ala Thr Lys Asp Ala

195 200 205

Gly Ala Ile Ala Gly Leu Asn Ile Leu Arg Ile Val Asn Glu Pro Thr

210 215 220

Ala Ala Ala Ile Ala Tyr Gly Leu Asp Lys Thr Glu Asp Glu His Gln

225 230 235 240

Ile Ile Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp Val Ser Leu Leu

245 250 255

Ser Ile Glu Asn Gly Val Phe Glu Val Gln Ala Thr Ala Gly Asp Thr

260 265 270

His Leu Gly Gly Glu Asp Phe Asp Tyr Lys Leu Val Arg His Phe Ala

275 280 285

Gln Leu Phe Gln Lys Lys His Asp Leu Asp Val Thr Lys Asn Asp Lys

290 295 300

Ala Met Ala Lys Leu Lys Arg Glu Ala Glu Lys Ala Lys Arg Ser Leu

305 310 315 320

Ser Ser Gln Thr Ser Thr Arg Ile Glu Ile Asp Ser Phe Phe Asn Gly

325 330 335

Ile Asp Phe Ser Glu Thr Leu Thr Arg Ala Lys Phe Glu Glu Leu Asn

340 345 350

Leu Ala Leu Phe Lys Lys Thr Leu Lys Pro Val Glu Lys Val Leu Lys

355 360 365

Asp Ser Gly Leu Gln Lys Glu Asp Ile Asp Asp Ile Val Leu Val Gly

370 375 380

Gly Ser Thr Arg Ile Pro Lys Val Gln Gln Leu Leu Glu Lys Phe Phe

385 390 395 400

Asn Gly Lys Lys Ala Ser Lys Gly Ile Asn Pro Asp Glu Ala Val Ala

405 410 415

Tyr Gly Ala Ala Val Gln Ala Gly Val Leu Ser Gly Glu Glu Gly Val

420 425 430

Glu Asp Ile Val Leu Leu Asp Val Asn Ala Leu Thr Leu Gly Ile Glu

435 440 445

Thr Thr Gly Gly Val Met Thr Pro Leu Ile Lys Arg Asn Thr Ala Ile

450 455 460

Pro Thr Lys Lys Ser Gln Ile Phe Ser Thr Ala Val Asp Asn Gln Lys

465 470 475 480

Ala Val Arg Ile Gln Val Tyr Glu Gly Glu Arg Ala Met Val Lys Asp

485 490 495

Asn Asn Leu Leu Gly Asn Phe Glu Leu Ser Asp Ile Arg Ala Ala Pro

500 505 510

Arg Gly Val Pro Gln Ile Glu Val Thr Phe Ala Leu Asp Ala Asn Gly

515 520 525

Ile Leu Thr Val Ser Ala Thr Asp Lys Asp Thr Gly Lys Ser Glu Ser

530 535 540

Ile Thr Ile Ala Asn Asp Lys Gly Arg Leu Ser Gln Asp Asp Ile Asp

545 550 555 560

Arg Met Val Glu Glu Ala Glu Lys Tyr Ala Ala Glu Asp Ala Lys Phe

565 570 575

Lys Ala Lys Ser Glu Ala Arg Asn Thr Phe Glu Asn Phe Val His Tyr

580 585 590

Val Lys Asn Ser Val Asn Gly Glu Leu Ala Glu Ile Met Asp Glu Asp

595 600 605

Asp Lys Glu Thr Val Leu Asp Asn Val Asn Glu Ser Leu Glu Trp Leu

610 615 620

Glu Asp Asn Ser Asp Val Ala Glu Ala Glu Asp Phe Glu Glu Lys Met

625 630 635 640

Ala Ser Phe Lys Glu Ser Val Glu Pro Ile Leu Ala Lys Ala Ser Ala

645 650 655

Ser Gln Gly Ser Thr Ser Gly Glu Gly Phe Glu Asp Glu Asp Asp Asp

660 665 670

Asp Tyr Phe Asp Asp Glu Leu

675

<210> 34

<211> 670

<212> PRT

<213> 博伊丁假丝酵母

<400> 34

Met Leu Lys Phe Asn Arg Ser Phe Ile Ala Ser Leu Ala Ile Leu Tyr

1 5 10 15

Ser Leu Leu Leu Ile Ile Val Pro Leu Leu Ser Gln Gln Ala His Ala

20 25 30

Glu Asp Glu His Glu Thr Tyr Gly Thr Val Ile Gly Ile Asp Leu Gly

35 40 45

Thr Thr Tyr Ser Cys Val Gly Val Met Lys Ser Gly Lys Val Glu Ile

50 55 60

Leu Ala Asn Asp Gln Gly Asn Arg Ile Thr Pro Ser Tyr Val Ala Phe

65 70 75 80

Thr Asp Glu Glu Arg Leu Val Gly Asp Ala Ala Lys Asn Gln Ala Pro

85 90 95

Ser Asn Pro His Asn Thr Ile Phe Asp Ile Lys Arg Leu Ile Gly His

100 105 110

Ser Tyr Ser Asp Lys Val Val Gln Thr Glu Lys Lys His Leu Pro Tyr

115 120 125

Asn Ile Ile Glu Lys Gln Gly Lys Pro Ala Val Glu Val Lys Phe Gln

130 135 140

Asn Glu Leu Lys Val Phe Thr Pro Glu Glu Ile Ser Ser Met Ile Leu

145 150 155 160

Gly Lys Met Lys Gln Ile Ala Glu Asp Tyr Leu Gly Lys Lys Val Thr

165 170 175

His Ala Val Val Thr Val Pro Ala Tyr Phe Asn Asp Ala Gln Arg Gln

180 185 190

Ala Thr Lys Asp Ala Gly Thr Ile Ala Gly Leu Asn Val Leu Arg Ile

195 200 205

Val Asn Glu Pro Thr Ala Ala Ala Ile Ala Tyr Gly Leu Asp Lys Glu

210 215 220

Gly Glu Arg Gln Ile Ile Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp

225 230 235 240

Val Ser Leu Leu Ala Ile Glu Asn Gly Val Phe Glu Val Leu Ser Thr

245 250 255

Ser Gly Asp Thr His Leu Gly Gly Glu Asp Phe Asp Phe Arg Val Val

260 265 270

Arg His Phe Ser Lys Ile Phe Lys Lys Lys His Asn Ile Asp Ile Ser

275 280 285

Asp Asn Ala Lys Ala Ile Ser Lys Leu Lys Arg Glu Val Glu Lys Ala

290 295 300

Lys Arg Thr Leu Ser Thr Gln Met Ser Thr Arg Ile Glu Ile Asp Ser

305 310 315 320

Phe Val Asp Gly Ile Asp Phe Ser Glu Thr Leu Ser Arg Ala Lys Phe

325 330 335

Glu Glu Ile Asn Ile Glu Leu Phe Lys Lys Thr Leu Lys Pro Val Gln

340 345 350

Gln Val Leu Asp Asp Ala Gly Leu Lys Ala Ala Glu Ile Asp Asp Ile

355 360 365

Val Leu Val Gly Gly Ser Thr Arg Ile Pro Lys Val Gln Glu Ile Leu

370 375 380

Glu Asn Phe Phe Ser Gly Lys Lys Ala Thr Lys Gly Ile Asn Pro Asp

385 390 395 400

Glu Ala Val Ala Tyr Gly Ala Ala Val Gln Ala Gly Ile Leu Ser Gly

405 410 415

Ser Glu Gly Ala Ser Asp Val Val Leu Ile Asp Val Asn Pro Leu Thr

420 425 430

Leu Gly Ile Glu Thr Thr Gly Asn Val Met Thr Thr Leu Ile Lys Arg

435 440 445

Asn Thr Pro Ile Pro Thr Lys Lys Thr Gln Val Phe Ser Thr Ala Val

450 455 460

Asp Asn Gln Asp Thr Val Leu Ile Lys Val Tyr Glu Gly Glu Arg Ala

465 470 475 480

Met Ser Thr Asp Asn Asn Leu Leu Gly Ser Phe Glu Leu Lys Gly Ile

485 490 495

Pro Pro Ala Pro Lys Gly Ser Pro Gln Ile Glu Val Thr Phe Ser Leu

500 505 510

Asp Val Asn Gly Ile Leu Arg Val Ser Ala Thr Asp Lys Ser Thr Gly

515 520 525

Lys Ser Asn Ser Ile Thr Ile Ser Asn Asp His Gly Arg Leu Ser Lys

530 535 540

Glu Glu Ile Asp Lys Met Val Glu Asp Gly Glu Lys Tyr Ala Glu Gln

545 550 555 560

Asp Lys Leu Phe Arg Glu Lys Ile Glu Ala Lys Asn Asp Leu Glu Lys

565 570 575

Tyr Ala Leu Gly Leu Lys Thr Gln Leu Ala Asp Glu Ser Val Ala Glu

580 585 590

Lys Leu Ala Glu Asp Glu Ile Glu Thr Val Leu Asp Ala Val Lys Glu

595 600 605

Ala Leu Glu Phe Ile Asp Glu Asn Glu Asp Ala Thr Thr Glu Asp Tyr

610 615 620

Ser Glu Gln Lys Glu Lys Leu Ile Lys Ile Ala Ser Pro Ile Thr Thr

625 630 635 640

Lys Leu Phe Met Gln Pro Gln Gly Gly Glu Ser Ala Asp Glu Asp Asp

645 650 655

Glu Asp Phe Asp Asp Asp Tyr Asp Tyr Gly His Asp Glu Leu

660 665 670

<210> 35

<211> 672

<212> PRT

<213> 黑曲霉

<400> 35

Met Ala Arg Ile Ser His Gln Gly Ala Ala Lys Pro Phe Thr Ala Trp

1 5 10 15

Thr Thr Ile Phe Tyr Leu Leu Leu Val Phe Ile Ala Pro Leu Ala Phe

20 25 30

Phe Gly Thr Ala His Ala Gln Asp Glu Thr Ser Pro Gln Glu Ser Tyr

35 40 45

Gly Thr Val Ile Gly Ile Asp Leu Gly Thr Thr Tyr Ser Cys Val Gly

50 55 60

Val Met Gln Asn Gly Lys Val Glu Ile Leu Val Asn Asp Gln Gly Asn

65 70 75 80

Arg Ile Thr Pro Ser Tyr Val Ala Phe Thr Asp Glu Glu Arg Leu Val

85 90 95

Gly Asp Ala Ala Lys Asn Gln Tyr Ala Ala Asn Pro Arg Arg Thr Ile

100 105 110

Phe Asp Ile Lys Arg Leu Ile Gly Arg Lys Phe Asp Asp Lys Asp Val

115 120 125

Gln Lys Asp Ala Lys His Phe Pro Tyr Lys Val Val Asn Lys Asp Gly

130 135 140

Lys Pro His Val Lys Val Asp Val Asn Gln Thr Pro Lys Thr Leu Thr

145 150 155 160

Pro Glu Glu Val Ser Ala Met Val Leu Gly Lys Met Lys Glu Ile Ala

165 170 175

Glu Gly Tyr Leu Gly Lys Lys Val Thr His Ala Val Val Thr Val Pro

180 185 190

Ala Tyr Phe Asn Asp Ala Gln Arg Gln Ala Thr Lys Asp Ala Gly Thr

195 200 205

Ile Ala Gly Leu Asn Val Leu Arg Val Val Asn Glu Pro Thr Ala Ala

210 215 220

Ala Ile Ala Tyr Gly Leu Asp Lys Thr Gly Asp Glu Arg Gln Val Ile

225 230 235 240

Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp Val Ser Leu Leu Ser Ile

245 250 255

Asp Asn Gly Val Phe Glu Val Leu Ala Thr Ala Gly Asp Thr His Leu

260 265 270

Gly Gly Glu Asp Phe Asp Gln Arg Val Met Asp His Phe Val Lys Leu

275 280 285

Tyr Asn Lys Lys Asn Asn Val Asp Val Thr Lys Asp Leu Lys Ala Met

290 295 300

Gly Lys Leu Lys Arg Glu Val Glu Lys Ala Lys Arg Thr Leu Ser Ser

305 310 315 320

Gln Met Ser Thr Arg Ile Glu Ile Glu Ala Phe His Asn Gly Glu Asp

325 330 335

Phe Ser Glu Thr Leu Thr Arg Ala Lys Phe Glu Glu Leu Asn Met Asp

340 345 350

Leu Phe Lys Lys Thr Leu Lys Pro Val Glu Gln Val Leu Lys Asp Ala

355 360 365

Lys Val Lys Lys Ser Glu Val Asp Asp Ile Val Leu Val Gly Gly Ser

370 375 380

Thr Arg Ile Pro Lys Val Gln Ala Leu Leu Glu Glu Phe Phe Gly Gly

385 390 395 400

Lys Lys Ala Ser Lys Gly Ile Asn Pro Asp Glu Ala Val Ala Phe Gly

405 410 415

Ala Ala Val Gln Gly Gly Val Leu Ser Gly Glu Glu Gly Thr Gly Asp

420 425 430

Val Val Leu Met Asp Val Asn Pro Leu Thr Leu Gly Ile Glu Thr Thr

435 440 445

Gly Gly Val Met Thr Lys Leu Ile Pro Arg Asn Thr Val Ile Pro Thr

450 455 460

Arg Lys Ser Gln Ile Phe Ser Thr Ala Ala Asp Asn Gln Pro Thr Val

465 470 475 480

Leu Ile Gln Val Tyr Glu Gly Glu Arg Ser Leu Thr Lys Asp Asn Asn

485 490 495

Leu Leu Gly Lys Phe Glu Leu Thr Gly Ile Pro Pro Ala Pro Arg Gly

500 505 510

Val Pro Gln Ile Glu Val Ser Phe Asp Leu Asp Ala Asn Gly Ile Leu

515 520 525

Lys Val His Ala Ser Asp Lys Gly Thr Gly Lys Ala Glu Ser Ile Thr

530 535 540

Ile Thr Asn Asp Lys Gly Arg Leu Ser Gln Glu Glu Ile Asp Arg Met

545 550 555 560

Val Ala Glu Ala Glu Glu Phe Ala Glu Glu Asp Lys Ala Ile Lys Ala

565 570 575

Lys Ile Glu Ala Arg Asn Thr Leu Glu Asn Tyr Ala Phe Ser Leu Lys

580 585 590

Asn Gln Val Asn Asp Glu Asn Gly Leu Gly Gly Gln Ile Asp Glu Asp

595 600 605

Asp Lys Gln Thr Ile Leu Asp Ala Val Lys Glu Val Thr Glu Trp Leu

610 615 620

Glu Asp Asn Ala Ala Thr Ala Thr Thr Glu Asp Phe Glu Glu Gln Lys

625 630 635 640

Glu Gln Leu Ser Asn Val Ala Tyr Pro Ile Thr Ser Lys Leu Tyr Gly

645 650 655

Ser Ala Pro Ala Asp Glu Asp Asp Glu Pro Ser Gly His Asp Glu Leu

660 665 670

<210> 36

<211> 665

<212> PRT

<213> Ogataea polymorpha

<400> 36

Met Leu Thr Phe Asn Lys Ser Val Val Ser Cys Ala Ala Ile Ile Tyr

1 5 10 15

Ala Leu Leu Leu Val Val Leu Pro Leu Thr Thr Gln Gln Phe Val Lys

20 25 30

Ala Glu Ser Asn Glu Asn Tyr Gly Thr Val Ile Gly Ile Asp Leu Gly

35 40 45

Thr Thr Tyr Ser Cys Val Gly Val Met Lys Ala Gly Arg Val Glu Ile

50 55 60

Ile Pro Asn Asp Gln Gly Asn Arg Ile Thr Pro Ser Tyr Val Ala Phe

65 70 75 80

Thr Glu Asp Glu Arg Leu Val Gly Asp Ala Ala Lys Asn Gln Ile Ala

85 90 95

Ser Asn Pro Thr Asn Thr Ile Phe Asp Ile Lys Arg Leu Ile Gly His

100 105 110

Arg Phe Asp Asp Lys Val Ile Gln Lys Glu Ile Lys His Leu Pro Tyr

115 120 125

Lys Val Lys Asp Gln Asp Gly Arg Pro Val Val Glu Ala Lys Val Asn

130 135 140

Gly Glu Leu Lys Thr Phe Thr Ala Glu Glu Ile Ser Ala Met Ile Leu

145 150 155 160

Gly Lys Met Lys Gln Ile Ala Glu Asp Tyr Leu Gly Lys Lys Val Thr

165 170 175

His Ala Val Val Thr Val Pro Ala Tyr Phe Asn Asp Ala Gln Arg Gln

180 185 190

Ala Thr Lys Asp Ala Gly Thr Ile Ala Gly Leu Glu Val Leu Arg Ile

195 200 205

Val Asn Glu Pro Thr Ala Ala Ala Ile Ala Tyr Gly Leu Asp Lys Thr

210 215 220

Asp Glu Glu Lys His Ile Ile Val Tyr Asp Leu Gly Gly Gly Thr Phe

225 230 235 240

Asp Val Ser Leu Leu Thr Ile Ala Gly Gly Ala Phe Glu Val Leu Ala

245 250 255

Thr Ala Gly Asp Thr His Leu Gly Gly Glu Asp Phe Asp Tyr Arg Val

260 265 270

Val Arg His Phe Ile Lys Val Phe Lys Lys Lys His Gly Ile Asp Ile

275 280 285

Ser Asp Asn Ser Lys Ala Leu Ala Lys Leu Lys Arg Glu Val Glu Lys

290 295 300

Ala Lys Arg Thr Leu Ser Ser Gln Met Ser Thr Arg Ile Glu Ile Asp

305 310 315 320

Ser Phe Val Asp Gly Ile Asp Phe Ser Glu Ser Leu Ser Arg Ala Lys

325 330 335

Phe Glu Glu Leu Asn Met Asp Leu Phe Lys Lys Thr Leu Lys Pro Val

340 345 350

Gln Gln Val Leu Asp Asp Ala Lys Met Lys Pro Asp Glu Ile Asp Asp

355 360 365

Val Val Phe Val Gly Gly Ser Thr Arg Ile Pro Lys Val Gln Glu Leu

370 375 380

Ile Glu Asn Phe Phe Asn Gly Lys Lys Ile Ser Lys Gly Ile Asn Pro

385 390 395 400

Asp Glu Ala Val Ala Phe Gly Ala Ala Val Gln Gly Gly Val Leu Ser

405 410 415

Gly Glu Glu Gly Val Glu Asp Ile Val Leu Ile Asp Val Asn Pro Leu

420 425 430

Thr Leu Gly Ile Glu Thr Ser Gly Gly Val Met Thr Thr Leu Ile Lys

435 440 445

Arg Asn Thr Pro Ile Pro Thr Gln Lys Ser Gln Ile Phe Ser Thr Ala

450 455 460

Ala Asp Asn Gln Pro Val Val Leu Ile Gln Val Tyr Glu Gly Glu Arg

465 470 475 480

Ala Met Ala Lys Asp Asn Asn Leu Leu Gly Lys Phe Glu Leu Thr Gly

485 490 495

Ile Pro Pro Ala Pro Arg Gly Val Pro Gln Ile Glu Val Thr Phe Thr

500 505 510

Leu Asp Ser Asn Gly Ile Leu Lys Val Ser Ala Thr Asp Lys Gly Thr

515 520 525

Gly Lys Ser Asn Ser Ile Thr Ile Thr Asn Asp Lys Gly Arg Leu Ser

530 535 540

Lys Glu Glu Ile Glu Lys Lys Ile Glu Glu Ala Glu Lys Phe Ala Gln

545 550 555 560

Gln Asp Lys Glu Leu Arg Glu Lys Val Glu Ser Arg Asn Ala Leu Glu

565 570 575

Asn Tyr Ala His Ser Leu Lys Asn Gln Ala Asn Asp Glu Asn Gly Phe

580 585 590

Gly Ala Lys Leu Glu Glu Asp Asp Lys Glu Thr Leu Leu Asp Ala Ile

595 600 605

Asn Glu Ala Leu Glu Phe Leu Glu Asp Asn Phe Asp Thr Ala Thr Lys

610 615 620

Asp Glu Phe Asp Glu Gln Lys Glu Lys Leu Ser Lys Val Ala Tyr Pro

625 630 635 640

Ile Thr Ser Lys Leu Tyr Asp Ala Pro Pro Thr Ser Asp Glu Glu Asp

645 650 655

Glu Asp Asp Trp Asp His Asp Glu Leu

660 665

<210> 37

<211> 894

<212> PRT

<213> Komagataella phaffii

<400> 37

Met Arg Thr Gln Lys Ile Val Thr Val Leu Cys Leu Leu Leu Asn Thr

1 5 10 15

Val Leu Gly Ala Leu Leu Gly Ile Asp Tyr Gly Gln Glu Phe Thr Lys

20 25 30

Ala Val Leu Val Ala Pro Gly Val Pro Phe Glu Val Ile Leu Thr Pro

35 40 45

Asp Ser Lys Arg Lys Asp Asn Ser Met Met Ala Ile Lys Glu Asn Ser

50 55 60

Lys Gly Glu Ile Glu Arg Tyr Tyr Gly Ser Ser Ala Ser Ser Val Cys

65 70 75 80

Ile Arg Asn Pro Glu Thr Cys Leu Asn His Leu Lys Ser Leu Ile Gly

85 90 95

Val Ser Ile Asp Asp Val Ser Thr Ile Asp Tyr Lys Lys Tyr His Ser

100 105 110

Gly Ala Glu Met Val Pro Ser Lys Asn Asn Arg Asn Thr Val Ala Phe

115 120 125

Lys Leu Gly Ser Ser Val Tyr Pro Val Glu Glu Ile Leu Ala Met Ser

130 135 140

Leu Asp Asp Ile Lys Ser Arg Ala Glu Asp His Leu Lys His Ala Val

145 150 155 160

Pro Gly Ser Tyr Ser Val Ile Ser Asp Ala Val Ile Thr Val Pro Thr

165 170 175

Phe Phe Thr Gln Ser Gln Arg Leu Ala Leu Lys Asp Ala Ala Glu Ile

180 185 190

Ser Gly Leu Lys Val Val Gly Leu Val Asp Asp Gly Ile Ser Val Ala

195 200 205

Val Asn Tyr Ala Ser Ser Arg Gln Phe Asn Gly Asp Lys Gln Tyr His

210 215 220

Met Ile Tyr Asp Met Gly Ala Gly Ser Leu Gln Ala Thr Leu Val Ser

225 230 235 240

Ile Ser Ser Ser Asp Asp Gly Gly Ile Val Ile Asp Val Glu Ala Ile

245 250 255

Ala Tyr Asp Lys Ser Leu Gly Gly Gln Leu Phe Thr Gln Ser Val Tyr

260 265 270

Asp Ile Leu Leu Gln Lys Phe Leu Ser Glu His Pro Ser Phe Ser Glu

275 280 285

Ser Asp Phe Asn Lys Asn Ser Lys Ser Met Ser Lys Leu Trp Gln Ala

290 295 300

Ala Glu Lys Ala Lys Thr Ile Leu Ser Ala Asn Thr Asp Thr Arg Val

305 310 315 320

Ser Val Glu Ser Leu Tyr Asn Asp Ile Asp Phe Arg Ala Thr Ile Ala

325 330 335

Arg Asp Glu Phe Glu Asp Tyr Asn Ala Glu His Val His Arg Ile Thr

340 345 350

Ala Pro Ile Ile Glu Ala Leu Ser His Pro Leu Asn Gly Asn Leu Thr

355 360 365

Ser Pro Phe Pro Leu Thr Ser Leu Ser Ser Val Ile Leu Thr Gly Gly

370 375 380

Ser Thr Arg Val Pro Met Val Lys Lys His Leu Glu Ser Leu Leu Gly

385 390 395 400

Ser Glu Leu Ile Ala Lys Asn Val Asn Ala Asp Glu Ser Ala Val Phe

405 410 415

Gly Ser Thr Leu Arg Gly Val Thr Leu Ser Gln Met Phe Lys Ala Lys

420 425 430

Gln Met Thr Val Asn Glu Arg Ser Val Tyr Asp Tyr Cys Leu Lys Val

435 440 445

Gly Ser Ser Glu Ile Asn Val Phe Pro Val Gly Thr Pro Leu Ala Thr

450 455 460

Lys Lys Val Val Glu Leu Glu Asn Val Asp Ser Glu Asn Gln Leu Thr

465 470 475 480

Ile Gly Leu Tyr Glu Asn Gly Gln Leu Phe Ala Ser His Glu Val Thr

485 490 495

Asp Leu Lys Lys Ser Ile Lys Ser Leu Thr Gln Glu Gly Lys Glu Cys

500 505 510

Ser Asn Ile Asn Tyr Glu Ala Thr Val Glu Leu Ser Glu Ser Arg Leu

515 520 525

Leu Ser Leu Thr Arg Leu Gln Ala Lys Cys Ala Asp Glu Ala Glu Tyr

530 535 540

Leu Pro Pro Val Asp Thr Glu Ser Glu Asp Thr Lys Ser Glu Asn Ser

545 550 555 560

Thr Thr Ser Glu Thr Ile Glu Lys Pro Asn Lys Lys Leu Phe Tyr Pro

565 570 575

Val Thr Ile Pro Thr Gln Leu Lys Ser Val His Val Lys Pro Met Gly

580 585 590

Ser Ser Thr Lys Val Ser Ser Ser Leu Lys Ile Lys Glu Leu Asn Lys

595 600 605

Lys Asp Ala Val Lys Arg Ser Ile Glu Glu Leu Lys Asn Gln Leu Glu

610 615 620

Ser Lys Leu Tyr Arg Val Arg Ser Tyr Leu Glu Asp Glu Glu Val Val

625 630 635 640

Glu Lys Gly Pro Ala Ser Gln Val Glu Ala Leu Ser Thr Leu Val Ala

645 650 655

Glu Asn Leu Glu Trp Leu Asp Tyr Asp Ser Asp Asp Ala Ser Ala Lys

660 665 670

Asp Ile Arg Glu Lys Leu Asn Ser Val Ser Asp Ser Val Ala Phe Ile

675 680 685

Lys Ser Tyr Ile Asp Leu Asn Asp Val Thr Phe Asp Asn Asn Leu Phe

690 695 700

Thr Thr Ile Tyr Asn Thr Thr Leu Asn Ser Met Gln Asn Val Gln Glu

705 710 715 720

Leu Met Leu Asn Met Ser Glu Asp Ala Leu Ser Leu Met Gln Gln Tyr

725 730 735

Glu Lys Glu Gly Leu Asp Phe Ala Lys Glu Ser Gln Lys Ile Lys Ile

740 745 750

Lys Ser Pro Pro Leu Ser Asp Lys Glu Leu Asp Asn Leu Phe Asn Thr

755 760 765

Val Thr Glu Lys Leu Glu His Val Arg Met Leu Thr Glu Lys Asp Thr

770 775 780

Ile Ser Asp Leu Pro Arg Glu Glu Leu Phe Lys Leu Tyr Gln Glu Leu

785 790 795 800

Gln Asn Tyr Ser Ser Arg Phe Glu Ala Ile Met Ala Ser Leu Glu Asp

805 810 815

Val His Ser Gln Arg Ile Asn Arg Leu Thr Asp Lys Leu Arg Lys His

820 825 830

Ile Glu Arg Val Ser Asn Glu Ala Leu Lys Ala Ala Leu Lys Glu Ala

835 840 845

Lys Arg Gln Gln Glu Glu Glu Lys Ser His Glu Gln Asn Glu Gly Glu

850 855 860

Glu Gln Ser Ser Ala Ser Thr Ser His Thr Asn Glu Asp Ile Glu Glu

865 870 875 880

Pro Ser Glu Ser Pro Lys Val Gln Thr Ser His Asp Glu Leu

885 890

<210> 38

<211> 880

<212> PRT

<213> Komagataella pastoris

<400> 38

Met Lys Thr Gln Lys Ile Val Thr Leu Leu Cys Leu Leu Leu Ser Asn

1 5 10 15

Val Leu Gly Ala Leu Leu Gly Ile Asp Tyr Gly Gln Glu Phe Thr Lys

20 25 30

Ala Val Leu Val Ala Pro Gly Val Pro Phe Glu Val Ile Leu Thr Pro

35 40 45

Asp Ser Lys Arg Lys Asp Asn Ser Met Met Ala Ile Lys Glu Asn Phe

50 55 60

Lys Gly Glu Ile Glu Arg Tyr Tyr Gly Ser Ala Ala Ser Ser Val Cys

65 70 75 80

Ile Arg Asn Pro Glu Ala Cys Leu Asn His Leu Lys Ser Leu Ile Gly

85 90 95

Val Pro Ile Asp Asp Val Ser Thr Ile Glu Tyr Lys Lys Tyr His Ser

100 105 110

Gly Ala Glu Leu Val Pro Ser Lys Asn Asn Arg Asn Thr Val Ala Phe

115 120 125

Asn Leu Gly Ser Ser Val Tyr Pro Val Glu Glu Ile Leu Ala Met Ser

130 135 140

Leu Asp Asp Ile Lys Ser Arg Ala Glu Asp His Leu Lys His Ala Val

145 150 155 160

Pro Gly Ser Tyr Ser Val Ile Asn Asp Ala Val Ile Thr Val Pro Thr

165 170 175

Phe Phe Thr Gln Ser Gln Arg Leu Ala Leu Lys Asp Ala Ala Glu Ile

180 185 190

Ser Gly Leu Lys Val Val Gly Leu Val Asp Asp Gly Ile Ser Val Ala

195 200 205

Val Asn Tyr Ala Ser Ser Arg Gln Phe Asp Gly Asn Lys Gln Tyr His

210 215 220

Met Ile Tyr Asp Met Gly Ala Gly Ser Leu Gln Ala Thr Leu Val Ser

225 230 235 240

Ile Ser Ser Asn Glu Asp Gly Gly Ile Phe Ile Asp Val Glu Ala Ile

245 250 255

Ala Tyr Asp Asn Ser Leu Gly Gly Gln Leu Phe Thr Gln Ser Val Tyr

260 265 270

Asp Ile Leu Leu Gln Lys Phe Leu Ser Glu His Pro Ser Phe Ser Glu

275 280 285

Ser Asp Phe Asn Lys Asn Ser Lys Ser Met Ser Lys Leu Trp Gln Ser

290 295 300

Ala Glu Lys Ala Lys Thr Ile Leu Ser Ala Asn Thr Asp Thr Arg Val

305 310 315 320

Ser Val Glu Ser Leu Tyr Asn Asp Ile Asp Phe Arg Thr Thr Ile Thr

325 330 335

Arg Asp Glu Phe Glu Asp Tyr Asn Ala Glu His Val His Arg Ile Thr

340 345 350

Ala Pro Ile Ile Glu Ala Leu Ser His Pro Leu Asn Glu Asn Leu Thr

355 360 365

Ser Pro Phe Pro Leu Thr Ser Leu Ser Ser Val Ile Leu Thr Gly Gly

370 375 380

Ser Thr Arg Val Pro Met Val Lys Lys His Leu Glu Ser Leu Leu Gly

385 390 395 400

Ser Glu Leu Ile Ala Lys Asn Val Asn Ala Asp Glu Ser Ala Val Phe

405 410 415

Gly Ser Thr Leu Arg Gly Val Thr Leu Ser Gln Met Phe Lys Ala Arg

420 425 430

Gln Met Thr Val Asn Glu Arg Ser Val Tyr Asp Tyr Cys Val Lys Val

435 440 445

Gly Ser Ser Glu Ile Asn Val Phe Pro Val Gly Thr Pro Leu Asp Thr

450 455 460

Lys Lys Val Val Glu Leu Glu Asn Val Asp Asn Gly Asn Gln Leu Thr

465 470 475 480

Val Gly Leu Tyr Glu Asn Gly His Leu Phe Ala Asn Gln Glu Val Ser

485 490 495

Asp Leu Lys Lys Ser Ile Lys Ser Leu Thr Gln Glu Gly Lys Glu Cys

500 505 510

Ser Asn Ile Ile Tyr Glu Ala Thr Phe Glu Leu Ser Glu Ser Arg Leu

515 520 525

Phe Ser Leu Thr Arg Leu Gln Ala Lys Cys Ala Asp Lys Val Glu Ser

530 535 540

Leu Pro Pro Val Asp Thr Glu Ser Asp Asp Ala Lys Ser Glu Asn Ser

545 550 555 560

Thr Ser Ser Glu Asn Thr Glu Lys Ser Asn Lys Lys Leu Phe Tyr Pro

565 570 575

Val Thr Ile Pro Thr Gln Leu Lys Phe Val His Val Lys Pro Met Gly

580 585 590

Ser Ser Thr Lys Ile Ser Ser Ser Leu Lys Ile Lys Glu Leu Asn Lys

595 600 605

Lys Asp Ala Val Lys Arg Ser Ile Glu Glu Leu Lys Asn Gln Leu Glu

610 615 620

Ser Lys Leu Tyr Arg Val Arg Ser Tyr Leu Glu Asp Glu Gln Val Val

625 630 635 640

Gln Lys Gly Pro Ala Ser Gln Val Glu Ala Leu Ser Thr Gln Val Ala

645 650 655

Glu Asn Leu Glu Trp Leu Asp Tyr Asp Ser Asp Asp Ala Ser Ala Lys

660 665 670

Asp Ile Arg Asp Lys Leu Asn Phe Val Ser Glu Ser Val Ser Phe Ile

675 680 685

Lys Asn Tyr Ile Asp Leu Ser Asp Val Thr Leu Asp Asn Asn Leu Phe

690 695 700

Thr Met Ile Tyr Asn Thr Thr Ser Asn Ser Met Gln Asn Val Gln Glu

705 710 715 720

Leu Met Leu Asn Met Ser Glu Asp Ala Leu Ser Leu Met Gln Gln Tyr

725 730 735

Glu Lys Glu Gly Leu Asp Phe Ala Lys Glu Ser Gln Lys Ile Lys Ile

740 745 750

Lys Ser Pro Pro Leu Ser Asp Lys Glu Leu Asp Gly Leu Phe Asn Val

755 760 765

Val Thr Glu Lys Leu Glu Tyr Val Arg Thr Leu Thr Glu Glu Asp Gly

770 775 780

Ile Val Gly Leu Pro Arg Glu Glu Leu Phe Lys Leu Tyr Gln Glu Leu

785 790 795 800

Gln Asn Tyr Ser Ser Arg Phe Glu Glu Ile Met Thr Ser Leu Lys Asp

805 810 815

Val His Ser Gln Arg Ile Asn Arg Leu Thr Asp Lys Leu Asn Lys His

820 825 830

Ile Glu Arg Val Asn Asn Glu Ala Leu Lys Ala Ala Leu Lys Glu Ala

835 840 845

Lys Arg Gln Gln Glu Glu Glu Lys Ser His Glu Gln Asn Asp Glu Glu

850 855 860

Glu Gln Gly Ser Ser Ser Thr Ser His Thr Lys Ala Glu Thr Glu Glu

865 870 875 880

<210> 39

<211> 1007

<212> PRT

<213> 解脂耶氏酵母

<400> 39

Met Lys Val Ala His Ile Ile Gln Leu Ala Ala Met Val Ala Thr Ala

1 5 10 15

Leu Ala Ala Val Leu Ala Ile Asp Tyr Gly Gln Glu Tyr Thr Lys Ala

20 25 30

Ala Leu Leu Ser Pro Gly Ile Asn Phe Glu Ile Val Leu Thr Gln Asp

35 40 45

Ser Lys Arg Lys Gln Pro Ser Ala Ile Gly Phe Lys Gly Lys Ala Asp

50 55 60

Ser Lys Phe Gly Leu Glu Arg Val Tyr Gly Ser Pro Ala Val Leu Met

65 70 75 80

Glu Pro Arg Phe Pro Ser Asp Val Val Leu Tyr His Lys Arg Leu Leu

85 90 95

Gly Gly Arg Pro Lys Leu Asp Asn Pro Asn Tyr Lys Glu Tyr Thr Gln

100 105 110

Met Arg Pro Ala Cys Met Ala Val Pro Ser Asn Ser Ser Arg Ser Ala

115 120 125

Ile Ala Phe Gln Val Lys Asp Ser Glu Trp Ser Ala Glu Glu Leu Leu

130 135 140

Ala Met Gln Ile Ser Asp Ile Lys Ser Arg Ala Asp Asp Met Leu Lys

145 150 155 160

Thr Gln Ser Lys Ser Asn Thr Asp Thr Val Lys Asp Val Val Met Thr

165 170 175

Val Pro Pro His Phe Thr His Ser Gln Arg Leu Ala Leu Ala Asp Ala

180 185 190

Val Asp Leu Ala Gly Leu Lys Leu Ile Ala Leu Val Ser Asp Gly Thr

195 200 205

Ala Thr Ala Val Asn Tyr Val Ser Thr Arg Lys Phe Thr Asp Glu Lys

210 215 220

Glu Tyr His Val Val Tyr Asp Met Gly Ala Gly Ser Ala Ser Ala Thr

225 230 235 240

Leu Phe Ser Val Gln Asp Val Asn Gly Thr Pro Val Ile Asp Ile Glu

245 250 255

Gly Val Gly Tyr Asp Glu Ala Leu Ala Gly Gln Asp Met Thr Asn Met

260 265 270

Met Val Lys Ile Leu Ala Ala Ser Phe Met Glu Gln Asn Lys Asp Lys

275 280 285

Val Gln Leu Gln Thr Phe Ile Arg Asp Val Lys Ala Ala Ala Lys Leu

290 295 300

Trp Lys Glu Ala Glu Arg Ala Lys Ala Ile Leu Ser Ala Asn Gln Glu

305 310 315 320

Val Ser Val Ser Ile Glu Ala Val His Asn Gly Ile Asp Phe Lys Thr

325 330 335

Thr Val Thr Arg Asp Asp Tyr Val Arg Ser Ile Glu Lys Ile Ser Thr

340 345 350

Arg Leu Asn Gly Pro Leu Glu Lys Ala Leu Ala Gly Phe Ala Asp Ser

355 360 365

Pro Val Ala Leu Lys Asp Val Lys Ser Val Ile Leu Thr Gly Gly Val

370 375 380

Thr Arg Thr Pro Val Ile Gln Glu Lys Leu Lys Glu Leu Leu Gly Asp

385 390 395 400

Val Pro Ile Ser Lys Asn Val Asn Thr Asp Glu Ser Ile Val Leu Gly

405 410 415

Ser Leu Leu Arg Gly Val Gly Ile Ser Ser Ile Phe Lys Ser Arg Asp

420 425 430

Ile Lys Val Ile Asp Arg Thr Pro His Glu Phe Asp Leu Arg Leu Asp

435 440 445

Val Leu Gly Ala Lys Asp Glu Ile Leu Arg Ser Glu Lys Ala Asn Val

450 455 460

Phe Ser Lys Gly Ala Ala Gln Gly Glu Ser Val Val Ser Lys Leu Asp

465 470 475 480

Ile Ser Glu Ile Gly Asn Ala Asn Leu Tyr Leu Leu Glu Asp Gly Asp

485 490 495

Ser Phe Val Arg Leu Asp Val Arg Asp Met Asp Ala Ile Lys Lys Glu

500 505 510

Leu Asn Cys Glu Lys Ser Ala Glu Leu His Val Pro Phe Asp Leu Thr

515 520 525

Leu Ser Gly Thr Ile Lys Val Gly Lys Ala Lys Val Val Cys Lys Gly

530 535 540

Gly Asp Ala Glu Ala Asp Ala Glu Val Thr Val Asp Asp Pro Val Glu

545 550 555 560

Asp Val Val Val Glu Glu Glu Val Val Glu Gly Glu Thr Val Glu Gly

565 570 575

Asp Ala Lys Ala Ala Lys Asp Ser Lys Asp Ser Lys Asp Ser Lys Lys

580 585 590

Ala Ser Lys Lys Val Asp Thr Ser Arg Tyr Val Pro His Lys Thr Arg

595 600 605

Phe Val Gly Thr Lys Pro Leu Thr Ser Ala Ala Lys Leu Lys Ile Ser

610 615 620

Gly His Leu Arg Ser Leu Ala Arg Lys Asp Ala Glu Arg Leu Ala Thr

625 630 635 640

Ser Asp Ala Ala Asn Lys Leu Glu Ser Thr Ile Tyr His Ile Lys His

645 650 655

Leu Ile Glu Asp Ala Val Asp Gln Asp Lys Val Ala Asp Ile Lys Lys

660 665 670

Lys Ile Glu Asp Ala Ala Ala Trp Phe Glu Glu Asp Gly Leu Thr Ala

675 680 685

Gly Ile Gln Glu Leu Thr Glu Lys Leu Ser Val Val Gln Pro Leu Glu

690 695 700

Asp Phe Phe Lys Thr Ala Gly Glu Ala Ile Ala Asp Lys Ala Thr Ala

705 710 715 720

Ala Ala Ser Ala Ala Gly Glu Phe Val Asp Gln Ala Ala Ala Ala Ala

725 730 735

Gly Val Lys Ala Gly Glu Ala Ala Asp Ala Ala Lys Gly Ala Ala Asp

740 745 750

Ala Ala Gly Lys Lys Ala Lys Lys Ala Lys Lys Ala Ala Gly Lys Ala

755 760 765

Ala Ser Gln Ala Glu Glu Asp Val Leu Asp Gln Leu Lys Asp Ala Asn

770 775 780

Asp Leu Ile Lys Asn Ile Ala Gln Leu Ala Arg Glu Ser Gly Asn Asp

785 790 795 800

Val Pro Ser Glu Glu Asp Ile Glu Arg Glu Met Lys Arg Ala Ala Glu

805 810 815

Gly Gly Asp Ser Ser Asp Ser Ala Asp Leu Ser Gly His Leu Glu Thr

820 825 830

Leu Met Gly Leu Gln Asp Met Leu Asn Glu Leu Asn Gly Gly Glu Ala

835 840 845

Pro Ser Ala Pro Gly Leu Asp Val Thr Ala Ile Ala Gly Ile Thr Arg

850 855 860

Thr Ile Gln Arg Leu Ser Asp Lys Leu Thr Glu Leu Gly Thr Pro Pro

865 870 875 880

Lys Asp Glu Asp Asp Met Phe Arg Met Leu Gly Ile Asp Pro Gln Thr

885 890 895

Phe His Lys Phe Ser Glu Glu Ala Phe Glu Asp Gln Ala Ser Pro Ala

900 905 910

Asp Gln Leu Met Asp Ser Ile Gly Phe Leu Gln Gln Val Leu Ala Gln

915 920 925

Asp Glu Ser Pro Asp Pro Ala Ala Leu Glu Lys Met Arg Ala Asn Ile

930 935 940

Ala Glu Arg Gln Glu Arg Ile Ala Lys Val Ala Glu Val Ala Glu Arg

945 950 955 960

Asn Gln Lys Arg Gln Ile Ala Ala Leu Glu Asn Met Leu Lys Asn Ala

965 970 975

Glu Lys Thr Ile Asp Ile Ser Ile Tyr Asn Leu Lys Gln Gln Ala Pro

980 985 990

Lys Thr Ala Ser Val Glu Asp Lys Lys Ala Glu His Asp Glu Leu

995 1000 1005

<210> 40

<211> 985

<212> PRT

<213> 里氏木霉

<400> 40

Arg Lys Ser Pro Leu Leu Lys Leu Leu Gly Ala Ala Phe Leu Phe Ser

1 5 10 15

Thr Asn Val Leu Ala Ile Ser Ala Val Leu Gly Val Asp Leu Gly Thr

20 25 30

Glu Tyr Ile Lys Ala Ala Leu Val Lys Pro Gly Ile Pro Leu Glu Ile

35 40 45

Val Leu Thr Lys Asp Ser Arg Arg Lys Glu Thr Ser Ala Val Ala Phe

50 55 60

Lys Pro Ala Lys Gly Ala Leu Pro Glu Gly Gln Tyr Pro Glu Arg Ser

65 70 75 80

Tyr Gly Ala Asp Ala Met Ala Leu Ala Ala Arg Phe Pro Gly Glu Val

85 90 95

Tyr Pro Asn Leu Lys Pro Leu Leu Gly Leu Pro Val Gly Asp Ala Ile

100 105 110

Val Gln Glu Tyr Ala Ala Arg His Pro Ala Leu Lys Leu Gln Ala His

115 120 125

Pro Thr Arg Gly Thr Ala Ala Phe Lys Thr Glu Thr Leu Ser Pro Glu

130 135 140

Glu Glu Ala Trp Met Val Glu Glu Leu Leu Ala Met Glu Leu Gln Ser

145 150 155 160

Ile Gln Lys Asn Ala Glu Val Thr Ala Gly Gly Asp Ser Ser Ile Arg

165 170 175

Ser Ile Val Leu Thr Val Pro Pro Phe Tyr Thr Ile Glu Glu Lys Arg

180 185 190

Ala Leu Gln Met Ala Ala Glu Leu Ala Gly Phe Lys Val Leu Ser Leu

195 200 205

Val Ser Asp Gly Leu Ala Val Gly Leu Asn Tyr Ala Thr Ser Arg Gln

210 215 220

Phe Pro Asn Ile Asn Glu Gly Ala Lys Pro Glu Tyr His Leu Val Phe

225 230 235 240

Asp Met Gly Ala Gly Ser Thr Thr Ala Thr Val Met Arg Phe Gln Ser

245 250 255

Arg Thr Val Lys Asp Val Gly Lys Phe Asn Lys Thr Val Gln Glu Ile

260 265 270

Gln Val Leu Gly Ser Gly Trp Asp Arg Thr Leu Gly Gly Asp Ser Leu

275 280 285

Asn Ser Leu Ile Ile Asp Asp Met Ile Ala Gln Phe Val Glu Ser Lys

290 295 300

Gly Ala Gln Lys Ile Ser Ala Thr Ala Glu Gln Val Gln Ser His Gly

305 310 315 320

Arg Ala Val Ala Lys Leu Ser Lys Glu Ala Glu Arg Leu Arg His Val

325 330 335

Leu Ser Ala Asn Gln Asn Thr Gln Ala Ser Phe Glu Gly Leu Tyr Glu

340 345 350

Asp Val Asp Phe Lys Tyr Lys Ile Ser Arg Ala Asp Phe Glu Thr Met

355 360 365

Ala Lys Ala His Val Glu Arg Val Asn Ala Ala Ile Lys Asp Ala Leu

370 375 380

Lys Ala Ala Asn Leu Glu Ile Gly Asp Leu Thr Ser Val Ile Leu His

385 390 395 400

Gly Gly Ala Thr Arg Thr Pro Phe Val Arg Glu Ala Ile Glu Lys Ala

405 410 415

Leu Gly Ser Gly Asp Lys Ile Arg Thr Asn Val Asn Ser Asp Glu Ala

420 425 430

Ala Val Phe Gly Ala Ala Phe Arg Ala Ala Glu Leu Ser Pro Ser Phe

435 440 445

Arg Val Lys Glu Ile Arg Ile Ser Glu Gly Ala Asn Tyr Ala Ala Gly

450 455 460

Ile Thr Trp Lys Ala Ala Asn Gly Lys Val His Arg Gln Arg Leu Trp

465 470 475 480

Thr Ala Pro Ser Pro Leu Gly Gly Pro Ala Lys Glu Ile Thr Phe Thr

485 490 495

Glu Gln Glu Asp Phe Thr Gly Leu Phe Tyr Gln Gln Val Asp Thr Glu

500 505 510

Asp Lys Pro Val Lys Ser Phe Ser Thr Lys Asn Leu Thr Ala Ser Val

515 520 525

Ala Ala Leu Lys Glu Lys Tyr Pro Thr Cys Ala Asp Thr Gly Val Gln

530 535 540

Phe Lys Ala Ala Ala Lys Leu Arg Thr Glu Asn Gly Glu Val Ala Ile

545 550 555 560

Val Lys Ala Phe Val Glu Cys Glu Ala Glu Val Val Glu Lys Glu Gly

565 570 575

Phe Val Asp Gly Val Lys Asn Leu Phe Gly Phe Gly Lys Lys Asp Gln

580 585 590

Lys Pro Leu Ala Glu Gly Gly Asp Lys Asp Ser Ala Asp Ala Ser Ala

595 600 605

Asp Ser Glu Ala Glu Thr Glu Glu Ala Ser Ser Ala Thr Lys Ser Ser

610 615 620

Ser Ser Thr Ser Thr Thr Lys Ser Gly Asp Ala Ala Glu Ser Thr Glu

625 630 635 640

Ala Ala Lys Glu Val Lys Lys Lys Gln Leu Val Ser Ile Pro Val Glu

645 650 655

Val Thr Leu Glu Lys Ala Gly Ile Pro Gln Leu Thr Lys Ala Glu Trp

660 665 670

Thr Lys Ala Lys Asp Arg Leu Lys Ala Phe Ala Ala Ser Asp Lys Ala

675 680 685

Arg Leu Gln Arg Glu Glu Ala Leu Asn Gln Leu Glu Ala Phe Thr Tyr

690 695 700

Lys Val Arg Asp Leu Val Asp Asn Glu Ala Phe Ile Ser Ala Ser Thr

705 710 715 720

Glu Ala Glu Arg Gln Thr Leu Ser Glu Lys Ala Ser Glu Ala Ser Asp

725 730 735

Trp Leu Tyr Glu Glu Gly Asp Ser Ala Thr Lys Asp Asp Phe Val Ala

740 745 750

Lys Leu Lys Ala Leu Gln Asp Leu Val Ala Pro Ile Gln Asn Arg Leu

755 760 765

Asp Glu Ala Glu Lys Arg Pro Gly Leu Ile Ser Asp Leu Arg Asn Ile

770 775 780

Leu Asn Thr Thr Asn Val Phe Ile Asp Thr Val Arg Gly Gln Ile Ala

785 790 795 800

Ala Tyr Asp Glu Trp Lys Ser Thr Ala Ser Ala Lys Ser Ala Glu Ser

805 810 815

Ala Thr Ser Ser Ala Ala Ala Glu Ala Thr Thr Asn Asp Phe Glu Gly

820 825 830

Leu Glu Asp Glu Asp Asp Ser Pro Lys Glu Ala Glu Glu Lys Pro Val

835 840 845

Pro Glu Lys Val Val Pro Pro Leu His Asn Ser Glu Glu Ile Asp Thr

850 855 860

Leu Glu Val Leu Tyr Lys Glu Thr Leu Glu Trp Leu Asn Lys Leu Glu

865 870 875 880

Arg Gln Gln Ala Asp Val Pro Leu Thr Glu Glu Pro Val Leu Val Val

885 890 895

Ser Glu Leu Val Ala Arg Arg Asp Ala Leu Asp Lys Ala Ser Leu Asp

900 905 910

Leu Ala Leu Lys Ser Tyr Thr Gln Tyr Gln Lys Asn Lys Pro Lys Lys

915 920 925

Pro Thr Lys Ser Lys Lys Ala Lys Lys Gln Asp Lys Thr Lys Ser Ala

930 935 940

Asp Lys Ala Gly Pro Thr Phe Glu Phe Pro Glu Gly Ser Val Pro Leu

945 950 955 960

Ser Gly Glu Glu Leu Glu Glu Leu Val Lys Lys Tyr Met Lys Glu Glu

965 970 975

Glu Glu Thr Arg Arg Gln Ala Glu Gly

980 985

<210> 41

<211> 848

<212> PRT

<213> 粟酒裂殖酵母

<400> 41

Met Lys Arg Ser Val Leu Thr Ile Ile Leu Phe Phe Ser Cys Gln Phe

1 5 10 15

Trp His Ala Phe Ala Ser Ser Val Leu Ala Ile Asp Tyr Gly Thr Glu

20 25 30

Trp Thr Lys Ala Ala Leu Ile Lys Pro Gly Ile Pro Leu Glu Ile Val

35 40 45

Leu Thr Lys Asp Thr Arg Arg Lys Glu Gln Ser Ala Val Ala Phe Lys

50 55 60

Gly Asn Glu Arg Ile Phe Gly Val Asp Ala Ser Asn Leu Ala Thr Arg

65 70 75 80

Phe Pro Ala His Ser Ile Arg Asn Val Lys Glu Leu Leu Asp Thr Ala

85 90 95

Gly Leu Glu Ser Val Leu Val Gln Lys Tyr Gln Ser Ser Tyr Pro Ala

100 105 110

Ile Gln Leu Val Glu Asn Glu Glu Thr Thr Ser Gly Ile Ser Phe Val

115 120 125

Ile Ser Asp Glu Glu Asn Tyr Ser Leu Glu Glu Ile Ile Ala Met Thr

130 135 140

Met Glu His Tyr Ile Ser Leu Ala Glu Glu Met Ala His Glu Lys Ile

145 150 155 160

Thr Asp Leu Val Leu Thr Val Pro Pro His Phe Asn Glu Leu Gln Arg

165 170 175

Ser Ile Leu Leu Glu Ala Ala Arg Ile Leu Asn Lys His Val Leu Ala

180 185 190

Leu Ile Asp Asp Asn Val Ala Val Ala Ile Glu Tyr Ser Leu Ser Arg

195 200 205

Ser Phe Ser Thr Asp Pro Thr Tyr Asn Ile Ile Tyr Asp Ser Gly Ser

210 215 220

Gly Ser Thr Ser Ala Thr Val Ile Ser Phe Asp Thr Val Glu Gly Ser

225 230 235 240

Ser Leu Gly Lys Lys Gln Asn Ile Thr Arg Ile Arg Ala Leu Ala Ser

245 250 255

Gly Phe Thr Leu Lys Leu Ser Gly Asn Glu Ile Asn Arg Lys Leu Ile

260 265 270

Gly Phe Met Lys Asn Ser Phe Tyr Gln Lys His Gly Ile Asp Leu Ser

275 280 285

His Asn His Arg Ala Leu Ala Arg Leu Glu Lys Glu Ala Leu Arg Val

290 295 300

Lys His Ile Leu Ser Ala Asn Ser Glu Ala Ile Ala Ser Ile Glu Glu

305 310 315 320

Leu Ala Asp Gly Ile Asp Phe Arg Leu Lys Ile Thr Arg Ser Val Leu

325 330 335

Glu Ser Leu Cys Lys Asp Met Glu Asp Ala Ala Val Glu Pro Ile Asn

340 345 350

Lys Ala Leu Lys Lys Ala Asn Leu Thr Phe Ser Glu Ile Asn Ser Ile

355 360 365

Ile Leu Phe Gly Gly Ala Ser Arg Ile Pro Phe Ile Gln Ser Thr Leu

370 375 380

Ala Asp Tyr Val Ser Ser Asp Lys Ile Ser Lys Asn Val Asn Ala Asp

385 390 395 400

Glu Ala Ser Val Lys Gly Ala Ala Phe Tyr Gly Ala Ser Leu Thr Lys

405 410 415

Ser Phe Arg Val Lys Pro Leu Ile Val Gln Asp Ile Ile Asn Tyr Pro

420 425 430

Tyr Leu Leu Ser Leu Gly Thr Ser Glu Tyr Ile Val Ala Leu Pro Asp

435 440 445

Ser Thr Pro Tyr Gly Met Gln His Asn Val Thr Ile His Asn Val Ser

450 455 460

Thr Ile Gly Lys His Pro Ser Phe Pro Leu Ser Asn Asn Gly Glu Leu

465 470 475 480

Ile Gly Glu Phe Thr Leu Ser Asn Ile Thr Asp Val Glu Lys Val Cys

485 490 495

Ala Cys Ser Asn Lys Asn Ile Gln Ile Ser Phe Ser Ser Asp Arg Thr

500 505 510

Lys Gly Ile Leu Val Pro Leu Ser Ala Ile Met Thr Cys Glu His Gly

515 520 525

Glu Leu Ser Ser Lys His Lys Leu Gly Asp Arg Val Lys Ser Leu Phe

530 535 540

Gly Ser His Asp Glu Ser Gly Leu Arg Asn Asn Glu Ser Tyr Pro Ile

545 550 555 560

Gly Phe Thr Tyr Lys Lys Tyr Gly Glu Met Ser Asp Asn Ala Leu Arg

565 570 575

Leu Ala Ser Ala Lys Leu Glu Arg Arg Leu Gln Ile Asp Lys Ser Lys

580 585 590

Ala Ala His Asp Asn Ala Leu Asn Glu Leu Glu Thr Leu Leu Tyr Arg

595 600 605

Ala Gln Ala Met Val Asp Asp Asp Glu Phe Leu Glu Phe Ala Asn Pro

610 615 620

Glu Glu Thr Lys Ile Leu Lys Asn Asp Ser Val Glu Ser Tyr Asp Trp

625 630 635 640

Leu Ile Glu Tyr Gly Ser Gln Ser Pro Thr Ser Glu Val Thr Asp Arg

645 650 655

Tyr Lys Lys Leu Asp Asp Thr Leu Lys Ser Ile Ser Phe Arg Phe Asp

660 665 670

Gln Ala Lys Gln Phe Asn Thr Ser Leu Glu Asn Phe Lys Asn Ala Leu

675 680 685

Glu Arg Ala Glu Ser Leu Leu Thr Asn Phe Asp Val Pro Asp Tyr Pro

690 695 700

Leu Asn Val Tyr Asp Glu Lys Asp Val Lys Arg Val Asn Ser Leu Arg

705 710 715 720

Gly Thr Ser Tyr Lys Lys Leu Gly Asn Gln Tyr Tyr Asn Asp Thr Gln

725 730 735

Trp Leu Lys Asp Asn Leu Asp Ser His Leu Ser His Thr Leu Ser Glu

740 745 750

Asp Pro Leu Ile Lys Val Glu Glu Leu Glu Glu Lys Ala Lys Arg Leu

755 760 765

Gln Glu Leu Thr Tyr Glu Tyr Leu Arg Arg Ser Leu Gln Gln Pro Lys

770 775 780

Leu Lys Ala Lys Lys Gly Ala Ser Ser Ser Ser Thr Ala Glu Ser Lys

785 790 795 800

Val Glu Asp Glu Thr Phe Thr Asn Asp Ile Glu Pro Thr Thr Ala Leu

805 810 815

Asn Ser Thr Ser Thr Gln Glu Thr Glu Lys Ser Arg Ala Ser Val Thr

820 825 830

Gln Arg Pro Ser Ser Leu Gln Gln Glu Ile Asp Asp Ser Asp Glu Leu

835 840 845

<210> 42

<211> 881

<212> PRT

<213> 酿酒酵母

<400> 42

Met Arg Asn Val Leu Arg Leu Leu Phe Leu Thr Ala Phe Val Ala Ile

1 5 10 15

Gly Ser Leu Ala Ala Val Leu Gly Val Asp Tyr Gly Gln Gln Asn Ile

20 25 30

Lys Ala Ile Val Val Ser Pro Gln Ala Pro Leu Glu Leu Val Leu Thr

35 40 45

Pro Glu Ala Lys Arg Lys Glu Ile Ser Gly Leu Ser Ile Lys Arg Leu

50 55 60

Pro Gly Tyr Gly Lys Asp Asp Pro Asn Gly Ile Glu Arg Ile Tyr Gly

65 70 75 80

Ser Ala Val Gly Ser Leu Ala Thr Arg Phe Pro Gln Asn Thr Leu Leu

85 90 95

His Leu Lys Pro Leu Leu Gly Lys Ser Leu Glu Asp Glu Thr Thr Val

100 105 110

Thr Leu Tyr Ser Lys Gln His Pro Gly Leu Glu Met Val Ser Thr Asn

115 120 125

Arg Ser Thr Ile Ala Phe Leu Val Asp Asn Val Glu Tyr Pro Leu Glu

130 135 140

Glu Leu Val Ala Met Asn Val Gln Glu Ile Ala Asn Arg Ala Asn Ser

145 150 155 160

Leu Leu Lys Asp Arg Asp Ala Arg Thr Glu Asp Phe Val Asn Lys Met

165 170 175

Ser Phe Thr Ile Pro Asp Phe Phe Asp Gln His Gln Arg Lys Ala Leu

180 185 190

Leu Asp Ala Ser Ser Ile Thr Thr Gly Ile Glu Glu Thr Tyr Leu Val

195 200 205

Ser Glu Gly Met Ser Val Ala Val Asn Phe Val Leu Lys Gln Arg Gln

210 215 220

Phe Pro Pro Gly Glu Gln Gln His Tyr Ile Val Tyr Asp Met Gly Ser

225 230 235 240

Gly Ser Ile Lys Ala Ser Met Phe Ser Ile Leu Gln Pro Glu Asp Thr

245 250 255

Thr Gln Pro Val Thr Ile Glu Phe Glu Gly Tyr Gly Tyr Asn Pro His

260 265 270

Leu Gly Gly Ala Lys Phe Thr Met Asp Ile Gly Ser Leu Ile Glu Asn

275 280 285

Lys Phe Leu Glu Thr His Pro Ala Ile Arg Thr Asp Glu Leu His Ala

290 295 300

Asn Pro Lys Ala Leu Ala Lys Ile Asn Gln Ala Ala Glu Lys Ala Lys

305 310 315 320

Leu Ile Leu Ser Ala Asn Ser Glu Ala Ser Ile Asn Ile Glu Ser Leu

325 330 335

Ile Asn Asp Ile Asp Phe Arg Thr Ser Ile Thr Arg Gln Glu Phe Glu

340 345 350

Glu Phe Ile Ala Asp Ser Leu Leu Asp Ile Val Lys Pro Ile Asn Asp

355 360 365

Ala Val Thr Lys Gln Phe Gly Gly Tyr Gly Thr Asn Leu Pro Glu Ile

370 375 380

Asn Gly Val Ile Leu Ala Gly Gly Ser Ser Arg Ile Pro Ile Val Gln

385 390 395 400

Asp Gln Leu Ile Lys Leu Val Ser Glu Glu Lys Val Leu Arg Asn Val

405 410 415

Asn Ala Asp Glu Ser Ala Val Asn Gly Val Val Met Arg Gly Ile Lys

420 425 430

Leu Ser Asn Ser Phe Lys Thr Lys Pro Leu Asn Val Val Asp Arg Ser

435 440 445

Val Asn Thr Tyr Ser Phe Lys Leu Ser Asn Glu Ser Glu Leu Tyr Asp

450 455 460

Val Phe Thr Arg Gly Ser Ala Tyr Pro Asn Lys Thr Ser Ile Leu Thr

465 470 475 480

Asn Thr Thr Asp Ser Ile Pro Asn Asn Phe Thr Ile Asp Leu Phe Glu

485 490 495

Asn Gly Lys Leu Phe Glu Thr Ile Thr Val Asn Ser Gly Ala Ile Lys

500 505 510

Asn Ser Tyr Ser Ser Asp Lys Cys Ser Ser Gly Val Ala Tyr Asn Ile

515 520 525

Thr Phe Asp Leu Ser Ser Asp Arg Leu Phe Ser Ile Gln Glu Val Asn

530 535 540

Cys Ile Cys Gln Ser Glu Asn Asp Ile Gly Asn Ser Lys Gln Ile Lys

545 550 555 560

Asn Lys Gly Ser Arg Leu Ala Phe Thr Ser Glu Asp Val Glu Ile Lys

565 570 575

Arg Leu Ser Pro Ser Glu Arg Ser Arg Leu His Glu His Ile Lys Leu

580 585 590

Leu Asp Lys Gln Asp Lys Glu Arg Phe Gln Phe Gln Glu Asn Leu Asn

595 600 605

Val Leu Glu Ser Asn Leu Tyr Asp Ala Arg Asn Leu Leu Met Asp Asp

610 615 620

Glu Val Met Gln Asn Gly Pro Lys Ser Gln Val Glu Glu Leu Ser Glu

625 630 635 640

Met Val Lys Val Tyr Leu Asp Trp Leu Glu Asp Ala Ser Phe Asp Thr

645 650 655

Asp Pro Glu Asp Ile Val Ser Arg Ile Arg Glu Ile Gly Ile Leu Lys

660 665 670

Lys Lys Ile Glu Leu Tyr Met Asp Ser Ala Lys Glu Pro Leu Asn Ser

675 680 685

Gln Gln Phe Lys Gly Met Leu Glu Glu Gly His Lys Leu Leu Gln Ala

690 695 700

Ile Glu Thr His Lys Asn Thr Val Glu Glu Phe Leu Ser Gln Phe Glu

705 710 715 720

Thr Glu Phe Ala Asp Thr Ile Asp Asn Val Arg Glu Glu Phe Lys Lys

725 730 735

Ile Lys Gln Pro Ala Tyr Val Ser Lys Ala Leu Ser Thr Trp Glu Glu

740 745 750

Thr Leu Thr Ser Phe Lys Asn Ser Ile Ser Glu Ile Glu Lys Phe Leu

755 760 765

Ala Lys Asn Leu Phe Gly Glu Asp Leu Arg Glu His Leu Phe Glu Ile

770 775 780

Lys Leu Gln Phe Asp Met Tyr Arg Thr Lys Leu Glu Glu Lys Leu Arg

785 790 795 800

Leu Ile Lys Ser Gly Asp Glu Ser Arg Leu Asn Glu Ile Lys Lys Leu

805 810 815

His Leu Arg Asn Phe Arg Leu Gln Lys Arg Lys Glu Glu Lys Leu Lys

820 825 830

Arg Lys Leu Glu Gln Glu Lys Ser Arg Asn Asn Asn Glu Thr Glu Ser

835 840 845

Thr Val Ile Asn Ser Ala Asp Asp Lys Thr Thr Ile Val Asn Asp Lys

850 855 860

Thr Thr Glu Ser Asn Pro Ser Ser Glu Glu Asp Ile Leu His Asp Glu

865 870 875 880

Leu

<210> 43

<211> 863

<212> PRT

<213> 乳酸克鲁维酵母

<400> 43

Met Arg Ile Val Phe Trp Phe Leu Leu Ala Ile Gln Ser Leu Thr Thr

1 5 10 15

Cys Phe Ala Ala Val Val Gly Leu Asp Phe Gly Thr His Tyr Val Lys

20 25 30

Glu Met Val Val Ser Leu Lys Ala Pro Leu Glu Ile Val Leu Asn Pro

35 40 45

Glu Ser Lys Arg Lys Asp Ala Ser Ala Leu Ala Ile Arg Ser Trp Asp

50 55 60

Ser Gln Asn Tyr Leu Glu Arg Phe Tyr Gly Ser Ser Ala Val Ala Leu

65 70 75 80

Ala Thr Arg Phe Pro Ser Thr Thr Phe Met His Leu Lys Ser Leu Leu

85 90 95

Gly Lys His Tyr Glu Asp Asn Leu Phe Tyr Tyr His Arg Glu His Pro

100 105 110

Gly Leu Glu Phe Val Asn Asp Ala Ser Arg Asn Ala Ile Ala Phe Glu

115 120 125

Ile Asp Thr Asn Thr Thr Leu Ser Val Glu Glu Leu Val Ser Met Asn

130 135 140

Leu Lys Gln Tyr Met Glu Arg Ala Asn Gln Leu Leu Lys Glu Ser Asp

145 150 155 160

Asp Ser Asp Asn Val Lys Ser Val Ala Ile Ala Ile Pro Glu Tyr Phe

165 170 175

Ser Gln Glu Gln Arg Ala Ala Leu Leu Asp Ala Thr Tyr Leu Ala Gly

180 185 190

Ile Gly Gln Thr Tyr Leu Cys Asn Asp Ala Ile Ala Val Ala Ile Asp

195 200 205

Tyr Ala Ser Lys Gln Lys Ser Phe Pro Ala Gly Lys Pro Asn Tyr His

210 215 220

Val Ile Tyr Asp Met Gly Ala Gly Ser Thr Thr Ala Ser Leu Ile Ser

225 230 235 240

Ile Leu Gln Pro Glu Asn Ile Thr Leu Pro Leu Arg Ile Glu Phe Leu

245 250 255

Gly Tyr Gly His Thr Glu Ser Leu Ser Gly Ser Val Leu Ser Leu Ala

260 265 270

Ile Val Asp Leu Leu Glu Asn Asp Phe Leu Glu Ser Asn Pro Asn Ile

275 280 285

Arg Thr Glu Gln Phe Glu Ser Asp Ala Ser Ala Lys Ala Lys Leu Val

290 295 300

Gln Ala Ala Glu Lys Ala Lys Leu Val Leu Ser Ala Asn Ser Asp Ala

305 310 315 320

Ser Ile Ser Ile Glu Ser Leu Tyr His Asp Leu Asp Phe Lys Thr Thr

325 330 335

Ile Thr Arg Ala Lys Phe Glu Glu Phe Val Ala Glu Leu Gln Ser Val

340 345 350

Val Ile Glu Pro Ile Leu Ser Thr Leu Glu Ser Pro Leu Asn Gly Lys

355 360 365

Ala Leu Asn Val Lys Asp Leu Asp Ser Val Ile Leu Thr Gly Gly Ser

370 375 380

Thr Arg Val Pro Phe Val Lys Lys Gln Leu Glu Asn His Leu Gly Ala

385 390 395 400

Ser Leu Ile Ser Lys Asn Val Asn Ser Asp Glu Ser Ala Val Asn Gly

405 410 415

Ala Ala Ile Arg Gly Val Gln Leu Ser Lys Glu Phe Lys Thr Arg Pro

420 425 430

Met Lys Val Ile Asp Arg Thr Thr His Ser Phe Gly Phe Ser Ile Gln

435 440 445

Asn Thr Asn Ile Ser Lys Leu Val Phe Asp Ala Gly Ser Glu Tyr Pro

450 455 460

Lys Glu Ile Asn Leu Gln Leu Pro Gly Met Glu Leu Lys Asp Thr Val

465 470 475 480

Leu Lys Ile Asp Leu Thr Glu Asp Glu Arg Val Phe Lys Thr Ile Phe

485 490 495

Ala Asp Val Asp Ser Lys Leu Gln Ser Ser Ser Leu Ser Asn Cys Ser

500 505 510

Thr Ala Val Thr Tyr Asn Val Thr Leu Ser Leu Asn Thr Asp Gln Val

515 520 525

Phe Asp Val Gln Ser Val Val Ala Ser Cys Leu Thr His Glu Glu Val

530 535 540

Pro Thr Gly Thr Glu Lys Glu His Lys Arg Thr Val Ser Glu His Ile

545 550 555 560

Gln Lys His Pro Ile Pro His Thr Val Glu Phe Thr Cys Val Lys Pro

565 570 575

Leu Ser Asn Thr Glu Lys Lys Glu Arg Phe Asn Lys Leu His Lys Trp

580 585 590

Asp Gln Lys Asp Lys Leu Leu Leu Glu Arg Gln Arg Leu Leu Asn Asp

595 600 605

Leu Glu Ala Ser Leu Tyr Ala Ala Arg Glu Leu Val Glu Asp Ala Lys

610 615 620

Glu Leu Glu Thr Pro Pro Thr Ser Tyr Ile Gln Gln Leu Glu Asn Met

625 630 635 640

Ile Thr Gln Tyr Leu Glu Phe Val Asp Asp Pro Ser Ser Leu Arg Thr

645 650 655

Lys Asn Ile Lys Thr Met Lys Ser Asn Leu Ala Glu Leu Gln Gln Arg

660 665 670

Leu Glu Ile Tyr Met Asp Arg Asp Asn Lys Gln Leu Asp Val Glu Gly

675 680 685

Phe Arg Ala Leu Phe Asp Lys Gly Glu Lys Tyr Leu Glu Leu Leu Ser

690 695 700

Lys Ile Gln Gln Lys Ser Leu Ser Glu Leu Ser Pro Leu Asn Lys Asn

705 710 715 720

Phe Glu Ser Leu Gly Leu Asn Val Ser Glu Glu Tyr Thr Lys Val Lys

725 730 735

Pro Pro Lys Ser Lys Thr Val Pro Phe Glu Ile Leu Asn Gly Thr Ile

740 745 750

Asp Leu Leu His Ser Gln Leu Lys His Ile Arg Asp Ile Ile Glu Asp

755 760 765

Asn Asn Ser Thr Tyr Ala Ile Glu Asp Leu Phe Glu Gln Lys Leu Glu

770 775 780

Val Asp Ser Leu Tyr Glu Lys Ile Glu Leu Leu Val Lys Lys Ile Arg

785 790 795 800

Ala Glu His Lys Tyr Arg Leu Lys Leu Leu Gln Ser Val Tyr Asp Arg

805 810 815

Arg Leu Thr Ala Gln Lys Arg Glu Gln Glu Ile Ala Lys Glu Ala Gln

820 825 830

Gln Ala Asp Gly Glu Asn Asn Asp Ser Ile Lys Thr Met Glu Glu Glu

835 840 845

Ser Ile Glu Glu His Glu Asp Ala Asn Phe Glu Gln Asp Glu Leu

850 855 860

<210> 44

<211> 903

<212> PRT

<213> 博伊丁假丝酵母

<400> 44

Met Lys Leu Phe Asn Gln Ile Ile Cys Ile Leu Ala Ile Ile Ser Pro

1 5 10 15

Ile Leu Ala Ser Ile Leu Gly Ile Asp Phe Gly Gln Gln Phe Thr Lys

20 25 30

Ser Ala Leu Leu Gly Pro Gly Val Asn Phe Glu Ile Leu Leu Thr Val

35 40 45

Asp Ser Lys Arg Lys Asp Ile Ser Gly Leu Ala Met Ala Ile Ala Pro

50 55 60

Asn Ser Asn Asn Glu Ile Gln Arg Ser Phe Gly Ser Ser Ser Leu Ser

65 70 75 80

Thr Cys Val Lys Asn Pro Gln Ala Cys Phe Thr Ser Phe Lys Ser Leu

85 90 95

Leu Gly Lys Ala Ile Asp Asp Glu Ser Thr Thr Gln Leu Tyr Leu Lys

100 105 110

Ser His Pro Gly Ile Glu Leu Ala Pro Ala Asn Tyr Ser Arg Asn Thr

115 120 125

Ile Asp Phe Lys Tyr Asn His Asp Ser Tyr Pro Val Glu Glu Ile Leu

130 135 140

Ala Met Tyr Phe Arg Asp Ile Lys Ser Arg Ala Asp Asp Tyr Leu Gly

145 150 155 160

Asp His Ala Ser Pro Gly Tyr Thr Lys Val Gln Lys Thr Ala Ile Thr

165 170 175

Val Pro Gly Phe Phe Asn Gln Ala Gln Arg Arg Ala Ile Leu Asp Ala

180 185 190

Ala Glu Ile Ala Gly Leu Asp Val Val Ser Leu Val Asp Asp Gly Ile

195 200 205

Ala Ile Ala Ala Glu Tyr Ala Ser Ser Arg Ala Phe Glu Ile Glu Lys

210 215 220

Glu Tyr His Leu Ile Tyr Asp Met Gly Ala Gly Ser Thr Lys Ala Thr

225 230 235 240

Leu Val Ser Phe Ser Gln Asn Asn Ser Asp Ile Ser Ile Val Asn Glu

245 250 255

Gly Tyr Gly Phe Asp Glu Thr Leu Gly Gly Glu Leu Leu Thr Asn Ser

260 265 270

Ile Lys Glu Leu Leu Ile Ser Lys Phe Leu Ala Ala Asn Pro Lys Val

275 280 285

Lys Ile Ser Asp Phe Leu Ser Asn Ser Arg Ala Ile Thr Arg Leu Leu

290 295 300

Gln Ser Ala Glu Lys Ala Lys Ser Val Leu Ser Ala Asn Thr Glu Thr

305 310 315 320

Arg Val Ser Ile Glu Asn Ile Tyr Asn Glu Ile Asp Phe Lys Thr Thr

325 330 335

Ile Thr Arg Ala Glu Tyr Glu Glu Ile Asn Ser Pro Ile Met Glu Arg

340 345 350

Ile Thr Ala Pro Ile Leu Lys Ala Ile Gln Ser Asn Ser Glu Arg Arg

355 360 365

Asp Ser Glu Asp Glu Asp Gln Pro Glu Ile Thr Leu Lys Asp Ile Lys

370 375 380

Ser Val Ile Leu Ala Gly Gly Ser Thr Arg Val Pro Phe Val Gln Arg

385 390 395 400

His Leu Ile Ser Leu Val Gly Glu Asp Val Ile Ser Lys Asn Val Asn

405 410 415

Ala Asp Glu Ala Ala Val Leu Gly Thr Thr Leu Arg Gly Val Gln Ile

420 425 430

Ser Gly Leu Phe Arg Ser Lys Arg Met Thr Val Val Glu Ser Thr Thr

435 440 445

Asn Asp Phe Cys Tyr Lys Ile Val Ser Asn Glu Leu Asp Glu Lys Asp

450 455 460

Ser Asn Leu Val Thr Val Phe Pro Val Asn Ala Lys Ile Asn Ser Lys

465 470 475 480

Lys Ser Val Lys Leu Asn Gln Leu Lys Asp Thr Phe Ser Asp Phe Glu

485 490 495

Leu Asp Phe Tyr Ser Asn Gly Glu Phe Ile Ser Gln Ala Asn Ile Ser

500 505 510

Pro Ser Glu Lys Phe Asp Asn Lys Leu Cys Thr Asn Gly Thr Ser Tyr

515 520 525

Ile Ala Arg Leu Glu Leu Asp Asn Ser Gly Leu Ala Ser Leu Thr Ser

530 535 540

Val Asp Gln Phe Cys Tyr Phe Glu Lys Ile Thr Lys Leu Ala Asn Asn

545 550 555 560

Ser Thr Glu Thr Asp Glu Thr Asp Lys Thr Ser Ser Lys Thr Ser Glu

565 570 575

Glu Glu Ala Ala Thr Thr Ser Ile Ala Ser Lys Lys Glu Lys Leu Glu

580 585 590

Pro Lys Ile Lys Tyr Pro Tyr Ile Arg Pro Met Gly Val Ser Thr Lys

595 600 605

Lys Ile Cys Lys Asn Arg Ile Ser Lys Leu Asp Thr Lys Asp Ala Val

610 615 620

Arg Ile Glu Lys Ala Thr Thr Val Asn Lys Leu Glu Ala Ile Leu Tyr

625 630 635 640

Ser Leu Arg Ser His Leu Asp Glu Asp Glu Ile Ala Glu Phe Val Asn

645 650 655

Ser Lys Ser Thr Phe Ile Asp Asp Ile Ser Thr Phe Val Lys Glu Asn

660 665 670

Leu Glu Trp Leu Glu Glu Thr Tyr Gln Leu Pro Asp Leu Glu Val Ile

675 680 685

Gln Ser Lys Leu Glu Ala Ala Thr Lys Lys Val Ser Asp Ile Lys Glu

690 695 700

Phe Thr Arg Val His Lys Ser Leu Arg Asp Ser Glu Phe Tyr Lys Asn

705 710 715 720

Met Thr Thr Ile Ser Asn Glu Ala Met Phe Gly Ile Gln Asp Phe Leu

725 730 735

Leu Thr Met Ser Glu Asp Leu Thr Ser Ile His Thr Asn Tyr Thr Met

740 745 750

Ala Gly Val Asp Ile Asn Glu Ala Asn Lys Lys Ile Glu Val Met Thr

755 760 765

Asn Pro Phe Asp Glu Ala Thr Ile Lys Glu His Phe Asp Ala Leu Gly

770 775 780

Glu Leu Leu Asp Lys Ile Lys Thr Leu Thr Glu Asp Glu Asp Val Leu

785 790 795 800

Ala Glu Lys Ser Ile Asp Tyr Leu Phe Gln Leu Phe Lys Asp Val Val

805 810 815

Lys Glu Leu Glu Val Leu Thr Lys Ile Lys Asn Val Leu Val Arg Ile

820 825 830

His Thr Lys Arg Ile Thr Lys Leu Gln Glu Tyr Leu Val Lys Gln Leu

835 840 845

Lys Lys Lys Leu Lys Ala Glu Arg Lys Ser Lys Ser Lys Ala Ser Ser

850 855 860

Lys Ser Ala Lys Ser Glu Glu Glu Val Thr Thr Thr Ser Ile Ala Pro

865 870 875 880

Glu Asn Thr Asp Ser Ser Asn Ala Ser Asp Ser Ser Ser Asp Ser Ser

885 890 895

Thr Val Gln Lys Asp Glu Leu

900

<210> 45

<211> 1000

<212> PRT

<213> 黑曲霉

<400> 45

Met Ala Pro Gly Ser Gln Arg Arg Pro Tyr Ala Ser Leu Thr Ser Leu

1 5 10 15

Pro Val Leu Ser Leu Ile Leu Pro Phe Leu Leu Phe Val Leu Ser Phe

20 25 30

Pro Ala Pro Ala Ala Ala Ala Gly Ser Ala Val Leu Gly Ile Asp Val

35 40 45

Gly Thr Glu Tyr Leu Lys Ala Thr Leu Val Lys Pro Gly Ile Pro Leu

50 55 60

Glu Ile Val Leu Thr Lys Asp Ser Lys Arg Lys Glu Ser Ala Ala Val

65 70 75 80

Ala Phe Lys Pro Thr Arg Glu Ala Asp Ala Ser Phe Pro Glu Arg Phe

85 90 95

Tyr Gly Gly Asp Ala Leu Ala Leu Ala Ala Arg Tyr Pro Asp Asp Val

100 105 110

Tyr Ser Asn Leu Lys Thr Leu Leu Gly Leu Pro Phe Asp Ala Asp Asn

115 120 125

Glu Leu Ile Lys Ser Phe His Ser Arg Tyr Pro Ala Leu Arg Leu Glu

130 135 140

Glu Ala Pro Gly Asp Arg Gly Thr Val Gly Leu Arg Ser Asn Arg Leu

145 150 155 160

Gly Glu Ala Glu Arg Lys Asp Ala Phe Leu Ile Glu Glu Ile Leu Ala

165 170 175

Met Gln Leu Lys Gln Ile Lys Ala Asn Ala Asp Thr Leu Ala Gly Lys

180 185 190

Gly Ser Asp Ile Thr Asp Ala Val Ile Thr Tyr Pro Ser Phe Tyr Thr

195 200 205

Ala Ala Glu Lys Arg Ser Leu Glu Leu Ala Ala Glu Leu Ala Gly Leu

210 215 220

Asn Val Asp Ala Phe Ile Ser Asp Asn Leu Ala Val Gly Leu Asn Tyr

225 230 235 240

Ala Thr Ser Arg Thr Phe Pro Ser Val Ser Asp Gly Gln Arg Pro Glu

245 250 255

Tyr His Ile Val Tyr Asp Met Gly Ala Gly Ser Thr Thr Ala Ser Val

260 265 270

Leu Arg Phe Gln Ser Arg Ser Val Lys Asp Val Gly Arg Phe Asn Lys

275 280 285

Thr Val Gln Glu Val Gln Val Leu Gly Thr Gly Trp Asp Lys Thr Leu

290 295 300

Gly Gly Asp Ala Leu Asn Asp Leu Ile Val Gln Asp Met Ile Ala Ser

305 310 315 320

Leu Val Glu Glu Lys Lys Leu Lys Asp Arg Val Ser Pro Ala Asp Val

325 330 335

Gln Ala His Gly Lys Thr Met Ala Arg Leu Trp Lys Asp Ala Glu Lys

340 345 350

Ala Arg Gln Val Leu Ser Ala Asn Thr Glu Thr Gly Ala Ser Phe Glu

355 360 365

Ser Leu Tyr Glu Glu Asp Leu Asn Phe Lys Tyr Arg Val Thr Arg Ala

370 375 380

Lys Phe Glu Glu Leu Ala Glu Gln His Ile Ala Arg Val Gly Lys Pro

385 390 395 400

Leu Glu Gln Ala Leu Glu Ala Ala Gly Leu Gln Leu Ser Asp Ile Asp

405 410 415

Ser Val Ile Leu His Gly Gly Ala Ile Arg Thr Pro Phe Val Gln Lys

420 425 430

Glu Leu Glu Arg Val Cys Gly Ser Ala Asn Lys Ile Arg Thr Ser Val

435 440 445

Asn Ala Asp Glu Ala Ala Val Phe Gly Ala Ala Phe Lys Gly Ala Ala

450 455 460

Leu Ser Pro Ser Phe Arg Val Lys Asp Ile Arg Ala Ser Asp Ala Ser

465 470 475 480

Ser Tyr Ala Val Val Leu Lys Trp Asp Ser Glu Ser Lys Glu Arg Lys

485 490 495

Gln Lys Leu Phe Thr Pro Thr Ser Gln Val Gly Pro Glu Lys Gln Val

500 505 510

Thr Val Lys Asn Leu Asp Asp Phe Glu Phe Ser Phe Tyr His Gln Ile

515 520 525

Pro Val Asp Gly Asn Val Val Glu Ser Pro Ile Leu Gly Val Lys Thr

530 535 540

Gln Asn Leu Thr Ala Ser Val Ala Lys Leu Lys Glu Asp Phe Gly Cys

545 550 555 560

Thr Ala Ala Asn Ile Thr Thr Lys Phe Ala Ile Arg Leu Ser Pro Val

565 570 575

Asp Gly Leu Pro Glu Val Ala Ser Gly Thr Val Ser Cys Glu Val Glu

580 585 590

Ser Ala Lys Lys Gly Ser Val Val Glu Gly Val Lys Gly Phe Phe Gly

595 600 605

Leu Gly Asn Lys Asp Glu Gln Val Pro Leu Gly Glu Glu Gly Glu Pro

610 615 620

Ser Glu Ser Ile Thr Leu Glu Pro Glu Glu Pro Gln Ala Ala Thr Thr

625 630 635 640

Ser Ser Ala Asp Asp Ala Thr Ser Thr Thr Ser Ala Lys Glu Ser Lys

645 650 655

Lys Ser Thr Pro Ala Thr Lys Leu Glu Ser Ile Ser Ile Ser Phe Thr

660 665 670

Ser Ser Pro Leu Gly Ile Pro Ala Pro Thr Glu Ala Glu Leu Ala Arg

675 680 685

Ile Lys Ser Arg Leu Ala Ala Phe Asp Ala Ser Asp Arg Glu Arg Ala

690 695 700

Leu Arg Glu Glu Ala Leu Asn Glu Leu Glu Ser Phe Ile Tyr Arg Ser

705 710 715 720

Arg Asp Leu Val Asp Asp Glu Glu Phe Ala Lys Val Val Lys Pro Glu

725 730 735

Gln Leu Thr Thr Leu Gln Glu Arg Ala Ser Glu Ala Ser Asp Trp Leu

740 745 750

Tyr Gly Asp Gly Asp Asp Ala Lys Thr Ala Asp Phe Arg Ala Lys Leu

755 760 765

Lys Ser Leu Arg Glu Ile Val Asp Pro Ala Leu Lys Arg Lys Lys Glu

770 775 780

Asn Ala Glu Arg Pro Ala Arg Val Glu Leu Leu Gln Gln Val Leu Lys

785 790 795 800

Asn Ala Lys Ser Val Ile Asp Val Met Glu Gln Gln Ile Gln Gln Asp

805 810 815

Glu Asp Leu Tyr Ser Ser Val Thr Ala Ser Ser Ser Ser Ser Ser Thr

820 825 830

Ala Thr Glu Ser Ser Thr Ser Ser Ser Thr Thr Thr Gly Ser Ser Ser

835 840 845

Ser Val Asp Leu Asp Glu Asp Pro Tyr Ala Thr Thr Ser Thr Ser Ser

850 855 860

Thr Thr Lys Thr Ala Ser Ala Thr Thr Thr Pro Lys Pro Ser Gly Pro

865 870 875 880

Lys Tyr Ser Ile Phe Gln Pro Tyr Asp Leu Thr Ser Leu Ser Lys Thr

885 890 895

Tyr Glu Ser Thr Asn Thr Trp Phe Glu Thr Gln Leu Ala Leu Gln Glu

900 905 910

Gln Leu Thr Met Thr Asp Asp Pro Ala Leu Pro Val Ala Glu Leu Asp

915 920 925

Thr Arg Leu Lys Glu Leu Glu Arg Val Leu Asn Arg Ile Tyr Asp Lys

930 935 940

Met Gly Ala Ala Ala Ala Lys Ser Gly Lys Glu Gln Ser Lys Lys Asn

945 950 955 960

Asn Asn Asn Asn Gly Lys Ser Ser Lys Lys Glu Lys Ala Lys Ala Gln

965 970 975

Glu Glu Gln Lys Lys Pro Ala Lys Glu Glu Glu Gln Lys Asp Asp Lys

980 985 990

Lys Ala Asn Arg Lys Asp Glu Leu

995 1000

<210> 46

<211> 798

<212> PRT

<213> Ogataea polymorpha

<400> 46

Met Lys Val Leu Gly Leu Val Ala Leu Ile Phe Ile Ile Val Gln Gly

1 5 10 15

Trp Ala Ser Leu Leu Ala Ile Asp Phe Gly Gln Asp Tyr Ser Lys Ala

20 25 30

Ala Leu Val Ala Pro Gly Val Ala Phe Asp Leu Val Leu Thr Asp Glu

35 40 45

Ala Lys Arg Lys His Gln Ser Gly Val Ala Ile Ser Ala Lys Asp Gly

50 55 60

Glu Ile Glu Arg Lys Phe Asn Ser His Ala Leu Ser Ala Cys Thr Arg

65 70 75 80

Ser Pro Gln Ser Cys Phe Phe Glu Leu Lys Ser Leu Ile Gly Arg Gln

85 90 95

Ile Asp Glu Pro Gln Val Thr Arg Phe Glu Lys Lys Tyr Arg Gly Val

100 105 110

Lys Ile Val Pro Ala Ser Ser Gln Arg Arg Thr Val Ala Phe Asp Val

115 120 125

Asp Gly Gln Val Tyr Leu Leu Glu Glu Val Leu Gly Met Val Leu Glu

130 135 140

Glu Ile Lys Lys Arg Ala Glu Leu His Trp Asp Gln Thr Leu Gly Gly

145 150 155 160

Gly Ser Ser Asn Thr Ile Ser Asp Val Val Leu Ser Val Pro Asp Phe

165 170 175

Leu Asp Gln Ala Gln Arg Thr Ala Leu Val Asp Ala Ala Glu Ile Ala

180 185 190

Gly Leu Asn Val Val Ala Leu Ile Asp Asp Gly Ile Ala Val Ala Leu

195 200 205

Asn Tyr Ala Ser Thr Arg Asp Phe Glu Gln Lys Gln Tyr His Val Ile

210 215 220

Tyr Asp Val Gly Ala Gly Ser Thr Lys Ala Thr Leu Val Ser Phe Ser

225 230 235 240

Lys Asp Asn Glu Thr Leu Arg Val Glu Asn Glu Gly Tyr Gly Tyr Asp

245 250 255

Glu Thr Phe Gly Gly Asn Leu Phe Thr Glu Ser Leu Gln Ala Ile Ile

260 265 270

Glu Asp Lys Phe Leu Ala Gln Thr Lys Ile Lys Pro Glu Thr Leu Trp

275 280 285

Ser Asp Ala Arg Ala Met Asn Arg Leu Trp Gln Ser Ala Glu Lys Ala

290 295 300

Lys Leu Val Leu Ser Ala Asn Ser Glu Thr Lys Val Ser Val Glu Ser

305 310 315 320

Leu Ile Asn Asp Ile Asp Leu Lys Val Val Val Ser Arg Asp Glu Phe

325 330 335

Glu Glu Tyr Met Thr Glu His Met Asp Arg Ile Val Ala Pro Leu Ala

340 345 350

Ala Ala Met Gly Asp Arg Lys Val Glu Ser Val Ile Leu Ala Gly Gly

355 360 365

Ser Thr Arg Val Pro Phe Val Gln Lys His Leu Val Lys Tyr Leu Gly

370 375 380

Gly Asp Glu Leu Leu Ser Lys Asn Val Asn Ala Asp Glu Ala Ala Val

385 390 395 400

Phe Gly Thr Leu Leu Gly Gly Ile Ser Val Ser Gly Lys Phe Arg Thr

405 410 415

Arg Pro Ile Glu Leu Val Gln His Ala Ser Arg Asn Phe Glu Leu Ala

420 425 430

Ala Gly Gly His Met Thr Val Val Phe Asn Glu Thr Thr Ala Ser Arg

435 440 445

Glu Ala Val Val Ala Leu Pro Gly Leu Lys Asp Thr Phe Gly Glu Val

450 455 460

Gln Val Asp Leu Phe Glu Ala Gly Gln Leu Phe Ala Gln Tyr Lys Phe

465 470 475 480

Lys Asn Glu Leu Asn Ser Thr Val Cys Pro Asn Gly Val Glu Tyr Leu

485 490 495

Ala Asn Cys Thr Leu Asp Pro Arg Lys Leu Phe Leu Leu His Ser Leu

500 505 510

Glu Ala Val Cys Ala Gly Asp Gly Ala Val Arg Ser Ser Leu Thr Ala

515 520 525

Lys Pro Leu His Pro Gly Tyr Lys Pro Leu Gly Ser Leu Ala Lys Tyr

530 535 540

Gln Ser Ala Ser Lys Leu Arg Ser Leu Thr Asn Gln Asp Lys Gln Arg

545 550 555 560

Gln Gln Arg Asp Ala Leu Ile Asn Ser Leu Glu Ala Ser Leu Tyr Asp

565 570 575

Leu Arg Ser Tyr Thr Glu Asp Glu Asn Val Val Ala Asn Gly Pro Ser

580 585 590

Ser Met Val Arg Ala Ala Arg Glu Met Val Ser Glu Leu Leu Glu Trp

595 600 605

Leu Glu Asp Val Pro Ala Lys Ala Thr Val Lys Asp Ile Gln Glu Lys

610 615 620

Tyr Asp Asp Val Arg Val Met Arg Ile Lys Leu Glu Thr Leu Val Asn

625 630 635 640

His Gly Asp Arg Leu Leu Ser Leu Ala Glu Phe Thr Arg Leu Lys Glu

645 650 655

Lys Ala Leu Glu Thr Met Tyr Lys Leu Gln Asp Phe Met Val Val Met

660 665 670

Ser Gln Asp Ala Leu Ser Leu Lys Ala Asn Phe Thr Glu Leu Gly Leu

675 680 685

Asp Phe Glu Glu Ala Asn Arg Arg Val Lys Val Lys Val Pro Glu Val

690 695 700

Asp Glu Gln Glu Leu Glu Gln Arg Met Lys Arg Ile Ser Asp Phe Val

705 710 715 720

Gly Val Val Asp His Phe Glu Thr His Lys Asp Glu Ile Glu Thr Lys

725 730 735

Asp Arg Glu Thr Leu Phe Glu Leu Arg Glu Thr Val Leu Glu Glu Leu

740 745 750

Lys Gln Val Gln Ser Thr Tyr Arg Ala Leu Lys Gln Ala His Glu Lys

755 760 765

Arg Val Arg Gly Leu Lys Glu Gln Leu Lys Lys Ala Asp Lys Lys Ala

770 775 780

Asp Lys Thr Gln Glu Ala Glu Pro Ser Gly His Asp Glu Leu

785 790 795

<210> 47

<211> 372

<212> PRT

<213> Komagataella phaffii

<400> 47

Met Lys Val Thr Leu Ser Val Leu Ala Ile Ala Ser Gln Leu Val Arg

1 5 10 15

Ile Val Cys Ser Glu Gly Glu Asn Ile Cys Ile Gly Asp Gln Cys Tyr

20 25 30

Pro Lys Asn Phe Glu Pro Asp Lys Glu Trp Lys Pro Val Gln Glu Gly

35 40 45

Gln Ile Ile Pro Pro Gly Ser His Val Arg Met Asp Phe Asn Thr His

50 55 60

Gln Arg Glu Ala Lys Leu Val Glu Glu Asn Glu Asp Ile Asp Pro Ser

65 70 75 80

Ser Leu Gly Val Ala Val Val Asp Ser Thr Gly Ser Phe Ala Asp Asp

85 90 95

Gln Ser Leu Glu Lys Ile Glu Gly Leu Ser Met Glu Gln Leu Asp Glu

100 105 110

Lys Leu Glu Glu Leu Ile Glu Leu Ser His Asp Tyr Glu Tyr Gly Ser

115 120 125

Asp Ile Ile Leu Ser Asp Gln Tyr Ile Phe Gly Val Ala Gly Leu Val

130 135 140

Pro Thr Lys Thr Lys Phe Thr Ser Glu Leu Lys Glu Lys Ala Leu Arg

145 150 155 160

Ile Val Gly Ser Cys Leu Arg Asn Asn Ala Asp Ala Val Glu Lys Leu

165 170 175

Leu Gly Thr Val Pro Asn Thr Ile Thr Ile Gln Phe Met Ser Asn Leu

180 185 190

Val Gly Lys Val Asn Ser Thr Gly Glu Asn Val Asp Ser Val Glu Gln

195 200 205

Lys Arg Ile Leu Ser Ile Ile Gly Ala Val Ile Pro Phe Lys Ile Gly

210 215 220

Lys Val Leu Phe Glu Ala Cys Ser Gly Thr Gln Lys Leu Leu Leu Ser

225 230 235 240

Leu Asp Lys Leu Glu Ser Ser Val Gln Leu Arg Gly Tyr Gln Met Leu

245 250 255

Asp Asp Phe Ile His His Pro Glu Glu Glu Leu Leu Ser Ser Leu Thr

260 265 270

Ala Lys Glu Arg Leu Val Lys His Ile Glu Leu Ile Gln Ser Phe Phe

275 280 285

Ala Ser Gly Lys His Ser Leu Asp Ile Ala Ile Asn Arg Glu Leu Phe

290 295 300

Thr Arg Leu Ile Ala Leu Arg Thr Asn Leu Glu Ser Ala Asn Pro Asn

305 310 315 320

Leu Cys Lys Pro Ser Thr Asp Phe Leu Asn Trp Leu Ile Asp Glu Ile

325 330 335

Glu Ala Thr Lys Asp Thr Asp Pro His Phe Ser Lys Glu Leu Lys His

340 345 350

Leu Arg Phe Glu Leu Phe Gly Asn Pro Leu Ala Ser Arg Lys Gly Phe

355 360 365

Ser Asp Glu Leu

370

<210> 48

<211> 379

<212> PRT

<213> Komagataella pastoris

<400> 48

Met Pro Lys Thr Leu Ser Ser Met Lys Val Ser Leu Ser Val Leu Ala

1 5 10 15

Ile Ala Thr Gln Leu Val Arg Ile Val Cys Ser Glu Glu Glu Asn Ile

20 25 30

Cys Ile Gly Asp Gln Cys Tyr Pro Lys Asn Phe Glu Pro Asp Lys Glu

35 40 45

Trp Lys Pro Val Gln Glu Gly Gln Ile Ile Pro Pro Gly Ser His Val

50 55 60

Arg Met Asp Phe Asn Thr His Gln Arg Glu Ala Lys Leu Val Asp Glu

65 70 75 80

Asn Asp Asp Ile Asp Ser Ser Leu Met Gly Val Ala Val Val Asp Ala

85 90 95

Thr Asp Thr Phe Ala Asp Asp His Ser Leu Glu Lys Ile Ile Gly Leu

100 105 110

Ser Val Ser Gln Leu Asp Glu Lys Leu Glu Glu Leu Val Glu Leu Ser

115 120 125

His Asp Tyr Glu Tyr Gly Ser Asp Ile Ile Leu Asn Asp Gln Tyr Ile

130 135 140

Ile Gly Val Ala Gly Leu Val Pro Thr Lys Thr Gln Phe Ala Ser Glu

145 150 155 160

Leu Lys Glu Lys Ala Leu Arg Ile Val Gly Ser Cys Leu Arg Asn Asn

165 170 175

Ala Asp Ala Val Glu Lys Leu Leu Gly Thr Val Pro Asn Thr Ile Thr

180 185 190

Ile Glu Phe Ile Ser Asn Leu Val Gly Lys Val Asn Thr Thr Glu Glu

195 200 205

Asn Val Asp Pro Val Glu Gln Lys Arg Ile Leu Ser Ile Ile Gly Ala

210 215 220

Ile Ile Pro Phe Asn Ile Gly Lys Val Leu Phe Glu Ala Cys Phe Gly

225 230 235 240

Thr Gln Lys Leu Leu Leu Ser Leu Asp Lys Leu Asp Asp Ser Val Gln

245 250 255

Leu Lys Ala Tyr Gln Val Leu Asp Asp Phe Ile His His Pro Gln Glu

260 265 270

Glu Leu Leu Ser Ser Leu Thr Glu Lys Glu Arg Leu Val Lys His Ile

275 280 285

Glu Leu Ile Gln Ser Phe Phe Ala Ser Gly Lys His Ser Leu His Glu

290 295 300

Ala Ile Asn Arg Glu Leu Phe Ser Arg Leu Val Ala Leu Arg Ser Asp

305 310 315 320

Leu Glu Ser Thr Ser Thr Asn Leu Cys Thr Pro Ser Thr Asp Phe Leu

325 330 335

Asn Trp Leu Ile Asp Glu Ile Glu Ala Thr Lys Glu Val Asn Pro His

340 345 350

Phe Ser Gln Glu Leu Lys His Leu Arg Phe Glu Phe Phe Gly Asn Pro

355 360 365

Leu Ala Ser Arg Lys Gly Phe Ser Asp Glu Leu

370 375

<210> 49

<211> 426

<212> PRT

<213> 解脂耶氏酵母

<400> 49

Met Lys Phe Ser Lys Thr Leu Leu Leu Ala Leu Val Ala Gly Ala Leu

1 5 10 15

Ala Lys Gly Glu Asp Glu Ile Cys Arg Val Glu Lys Asn Ser Gly Lys

20 25 30

Glu Ile Cys Tyr Pro Lys Val Phe Val Pro Thr Glu Glu Trp Gln Val

35 40 45

Val Trp Pro Asp Gln Val Ile Pro Ala Gly Leu His Val Arg Met Asp

50 55 60

Tyr Glu Asn Gly Val Lys Glu Ala Lys Ile Asn Asp Pro Asn Glu Glu

65 70 75 80

Val Glu Gly Val Ala Val Ala Val Gly Glu Glu Val Pro Glu Gly Glu

85 90 95

Val Val Ile Glu Asp Leu Thr Glu Glu Asn Gly Asp Glu Gly Ile Ser

100 105 110

Ala Asn Glu Lys Val Gln Arg Ala Ile Glu Lys Ala Ile Lys Glu Lys

115 120 125

Arg Ile Lys Glu Gly His Lys Pro Asn Pro Asn Ile Pro Glu Ser Asp

130 135 140

His Gln Thr Phe Ser Asp Ala Val Ala Ala Leu Arg Asp Tyr Lys Val

145 150 155 160

Asn Gly Gln Ala Ala Met Leu Pro Ile Ala Leu Ser Gln Leu Glu Glu

165 170 175

Leu Ser His Glu Ile Asp Phe Gly Ile Ala Leu Ser Asp Val Asp Pro

180 185 190

Leu Asn Ala Leu Leu Gln Ile Leu Glu Asp Ala Lys Val Asp Val Glu

195 200 205

Ser Lys Ile Met Ala Ala Arg Thr Ile Gly Ala Ser Leu Arg Asn Asn

210 215 220

Pro His Ala Leu Asp Lys Val Ile Asn Ser Lys Val Asp Leu Val Lys

225 230 235 240

Ser Leu Leu Asp Asp Leu Ala Gln Ser Ser Lys Glu Lys Ala Asp Lys

245 250 255

Leu Ser Ser Ser Leu Val Tyr Ala Leu Ser Ala Val Leu Lys Thr Pro

260 265 270

Glu Thr Val Thr Arg Phe Val Asp Leu His Gly Gly Asp Thr Leu Arg

275 280 285

Gln Leu Tyr Glu Thr Gly Ser Asp Asp Val Lys Gly Arg Val Ser Thr

290 295 300

Leu Ile Glu Asp Val Leu Ala Thr Pro Asp Leu His Asn Asp Phe Ser

305 310 315 320

Ser Ile Thr Gly Ala Val Lys Lys Arg Ser Ala Asn Trp Trp Glu Asp

325 330 335

Glu Leu Lys Glu Trp Ser Gly Val Phe Gln Arg Ser Leu Pro Ser Lys

340 345 350

Leu Ser Ser Lys Val Lys Ser Lys Val Tyr Thr Ser Leu Ala Ala Ile

355 360 365

Arg Arg Asn Phe Arg Glu Ser Val Asp Val Ser Glu Glu Phe Leu Glu

370 375 380

Trp Leu Asp His Pro Lys Lys Ala Ala Ala Glu Ile Gly Asp Asp Leu

385 390 395 400

Val Lys Leu Ile Lys Gln Asp Arg Gly Glu Leu Trp Gly Asn Ala Lys

405 410 415

Ala Arg Lys Tyr Asp Ala Arg Asp Glu Leu

420 425

<210> 50

<211> 406

<212> PRT

<213> 里氏木霉

<400> 50

Met Arg Pro Leu Ala Leu Ile Phe Ala Leu Ile Leu Gly Leu Leu Leu

1 5 10 15

Cys Leu Ala Ala Pro Ala Thr Ala Ser Ser Ser Ser Ser Gln His Ser

20 25 30

Pro Gln Ala Ala Ser Asp Glu Ser Asp Leu Ile Cys His Thr Ser Asn

35 40 45

Pro Asp Glu Cys Tyr Pro Arg Val Phe Val Pro Thr His Glu Phe Gln

50 55 60

Pro Val His Asp Asp Gln Gln Leu Pro Asn Gly Leu His Val Arg Leu

65 70 75 80

Asn Ile Trp Thr Gly Gln Lys Glu Ala Lys Ile Asn Val Pro Asp Glu

85 90 95

Ala Asn Pro Asp Leu Asp Gly Leu Pro Val Asp Gln Ala Val Val Leu

100 105 110

Val Asp Gln Glu Gln Pro Glu Ile Ile Gln Ile Pro Lys Gly Ala Pro

115 120 125

Lys Tyr Asp Asn Val Gly Lys Ile Lys Glu Pro Ala Gln Glu Gly Asp

130 135 140

Ala Gln Thr Glu Ala Ile Ala Phe Ala Glu Thr Phe Asn Met Leu Lys

145 150 155 160

Thr Gly Lys Ser Pro Ser Ala Glu Glu Phe Asp Asn Gly Leu Glu Gly

165 170 175

Leu Glu Glu Leu Ser His Asp Ile Tyr Tyr Gly Leu Lys Ile Thr Glu

180 185 190

Asp Ala Asp Val Val Lys Ala Leu Phe Cys Leu Met Gly Ala Arg Asp

195 200 205

Gly Asp Ala Ser Glu Gly Ala Thr Pro Arg Asp Gln Gln Ala Ala Ala

210 215 220

Ile Leu Ala Gly Ala Leu Ser Asn Asn Pro Ser Ala Leu Ala Glu Ile

225 230 235 240

Ala Lys Ile Trp Pro Glu Leu Leu Asp Ser Ser Cys Pro Arg Asp Gly

245 250 255

Ala Thr Ile Ser Asp Arg Phe Tyr Gln Asp Thr Val Ser Val Ala Asp

260 265 270

Ser Pro Ala Lys Val Lys Ala Ala Val Ser Ala Ile Asn Gly Leu Ile

275 280 285

Lys Asp Gly Ala Ile Arg Lys Gln Phe Leu Glu Asn Ser Gly Met Lys

290 295 300

Gln Leu Leu Ser Val Leu Cys Gln Glu Lys Pro Glu Trp Ala Gly Ala

305 310 315 320

Gln Arg Lys Val Ala Gln Leu Val Leu Asp Thr Phe Leu Asp Glu Asp

325 330 335

Met Gly Ala Gln Leu Gly Gln Trp Pro Arg Gly Lys Ala Ser Asn Asn

340 345 350

Gly Val Cys Ala Ala Pro Glu Thr Ala Leu Asp Asp Gly Cys Trp Asp

355 360 365

Tyr His Ala Asp Arg Met Val Lys Leu His Gly Thr Pro Trp Ser Lys

370 375 380

Glu Leu Lys Gln Arg Leu Gly Asp Ala Arg Lys Ala Asn Ser Lys Leu

385 390 395 400

Pro Asp His Gly Glu Leu

405

<210> 51

<211> 421

<212> PRT

<213> 酿酒酵母

<400> 51

Met Val Arg Ile Leu Pro Ile Ile Leu Ser Ala Leu Ser Ser Lys Leu

1 5 10 15

Val Ala Ser Thr Ile Leu His Ser Ser Ile His Ser Val Pro Ser Gly

20 25 30

Gly Glu Ile Ile Ser Ala Glu Asp Leu Lys Glu Leu Glu Ile Ser Gly

35 40 45

Asn Ser Ile Cys Val Asp Asn Arg Cys Tyr Pro Lys Ile Phe Glu Pro

50 55 60

Arg His Asp Trp Gln Pro Ile Leu Pro Gly Gln Glu Leu Pro Gly Gly

65 70 75 80

Leu Asp Ile Arg Ile Asn Met Asp Thr Gly Leu Lys Glu Ala Lys Leu

85 90 95

Asn Asp Glu Lys Asn Val Gly Asp Asn Gly Ser His Glu Leu Ile Val

100 105 110

Ser Ser Glu Asp Met Lys Ala Ser Pro Gly Asp Tyr Glu Phe Ser Ser

115 120 125

Asp Phe Lys Glu Met Arg Asn Ile Ile Asp Ser Asn Pro Thr Leu Ser

130 135 140

Ser Gln Asp Ile Ala Arg Leu Glu Asp Ser Phe Asp Arg Ile Met Glu

145 150 155 160

Phe Ala His Asp Tyr Lys His Gly Tyr Lys Ile Ile Thr His Glu Phe

165 170 175

Ala Leu Leu Ala Asn Leu Ser Leu Asn Glu Asn Leu Pro Leu Thr Leu

180 185 190

Arg Glu Leu Ser Thr Arg Val Ile Thr Ser Cys Leu Arg Asn Asn Pro

195 200 205

Pro Val Val Glu Phe Ile Asn Glu Ser Phe Pro Asn Phe Lys Ser Lys

210 215 220

Ile Met Ala Ala Leu Ser Asn Leu Asn Asp Ser Asn His Arg Ser Ser

225 230 235 240

Asn Ile Leu Ile Lys Arg Tyr Leu Ser Ile Leu Asn Glu Leu Pro Val

245 250 255

Thr Ser Glu Asp Leu Pro Ile Tyr Ser Thr Val Val Leu Gln Asn Val

260 265 270

Tyr Glu Arg Asn Asn Lys Asp Lys Gln Leu Gln Ile Lys Val Leu Glu

275 280 285

Leu Ile Ser Lys Ile Leu Lys Ala Asp Met Tyr Glu Asn Asp Asp Thr

290 295 300

Asn Leu Ile Leu Phe Lys Arg Asn Ala Glu Asn Trp Ser Ser Asn Leu

305 310 315 320

Gln Glu Trp Ala Asn Glu Phe Gln Glu Met Val Gln Asn Lys Ser Ile

325 330 335

Asp Glu Leu His Thr Arg Thr Phe Phe Asp Thr Leu Tyr Asn Leu Lys

340 345 350

Lys Ile Phe Lys Ser Asp Ile Thr Ile Asn Lys Gly Phe Leu Asn Trp

355 360 365

Leu Ala Gln Gln Cys Lys Ala Arg Gln Ser Asn Leu Asp Asn Gly Leu

370 375 380

Gln Glu Arg Asp Thr Glu Gln Asp Ser Phe Asp Lys Lys Leu Ile Asp

385 390 395 400

Ser Arg His Leu Ile Phe Gly Asn Pro Met Ala His Arg Ile Lys Asn

405 410 415

Phe Arg Asp Glu Leu

420

<210> 52

<211> 490

<212> PRT

<213> 乳酸克鲁维酵母

<400> 52

Met Arg Val Lys Cys Val Asn Arg Ala Ile Tyr Val Leu Thr Val Leu

1 5 10 15

Leu Phe Ser Arg Leu Val Val Ser Gln Val Val Leu Thr Pro Ser Asn

20 25 30

Ser Asn Ala Asp Pro Lys Gln Lys Asp Thr Ala Asn Thr Val Ala Ala

35 40 45

Val Glu Ala Asn Asn Asp Ala Asn Ile Ala Lys Lys Asp Ala Glu Ser

50 55 60

Asp Leu Val Ile Gly Asp His Leu Val Cys Asn Thr Lys Glu Cys Tyr

65 70 75 80

Pro Ile Gly Phe Val Pro Ser Thr Glu Trp Lys Glu Ile Arg Pro Gly

85 90 95

Gln Arg Leu Pro Pro Gly Leu Asp Ile Arg Val Ser Leu Glu Lys Gly

100 105 110

Val Arg Glu Ala Lys Leu Pro Glu Pro Gly Ser Glu Asn Ile Gly Asn

115 120 125

Glu Glu Glu Asp Val Lys Gly Leu Val Leu Gly Ala Glu Gly Ser Thr

130 135 140

Leu Ser Glu Ser Glu Leu Lys Glu Thr Ser Glu Asp Leu Glu Asn Glu

145 150 155 160

Gln Ser Gly Phe Lys Leu Asn Asn Ala Glu Lys Glu Ser Asp Ile Leu

165 170 175

Gln Gln Glu Thr Asp Leu Lys Ile Ala Val Ser Asp Asn Ala Glu Ala

180 185 190

Thr Ser Asn Glu Pro Ala Gly His Glu Phe Ser Glu Asp Phe Ala Lys

195 200 205

Ile Lys Ser Leu Met Gln Ser Pro Asp Glu Lys Thr Trp Glu Glu Val

210 215 220

Glu Thr Leu Leu Asp Asp Leu Val Glu Phe Ala His Asp Tyr Lys Lys

225 230 235 240

Gly Phe Lys Ile Leu Ser Asn Glu Phe Glu Leu Leu Glu Tyr Leu Ser

245 250 255

Phe Asn Asp Thr Leu Ser Ile Gln Ile Arg Glu Leu Ala Ala Arg Ile

260 265 270

Ile Val Ser Ser Leu Arg Asn Asn Pro Pro Ser Ile Asp Phe Val Asn

275 280 285

Glu Lys Tyr Pro Gln Thr Thr Phe Lys Leu Cys Glu His Leu Ser Glu

290 295 300

Leu Gln Ala Ser Gln Gly Ser Lys Leu Leu Ile Lys Arg Phe Leu Ser

305 310 315 320

Ile Leu Asp Val Leu Leu Ser Arg Thr Glu Tyr Val Ser Ile Lys Asp

325 330 335

Asp Val Leu Trp Arg Leu Tyr Gln Ile Glu Asp Pro Ser Ser Lys Ile

340 345 350

Lys Ile Leu Glu Ile Ile Ala Lys Phe Tyr Asn Glu Lys Asn Glu Gln

355 360 365

Val Ile Asp Thr Val Gln Gln Asp Met Lys Thr Val Gln Lys Trp Val

370 375 380

Asn Glu Leu Thr Thr Ile Ile Gln Thr Pro Glu Leu Asp Glu Leu His

385 390 395 400

Leu Arg Ser Phe Phe His Cys Ile Ser Phe Ile Lys Thr Arg Phe Lys

405 410 415

Asn Arg Val Lys Ile Asp Ser Asp Phe Leu Asn Trp Leu Ile Asp Glu

420 425 430

Ile Glu Val Arg Asn Glu Lys Ser Lys Asp Asp Ile Tyr Lys Arg Asp

435 440 445

Val Asp Gln Leu Glu Phe Asp Asn Gln Leu Ala Lys Ser Arg His Ala

450 455 460

Val Phe Gly Asn Pro Asn Ala Ala Arg Leu Lys Glu Arg Leu Phe Asp

465 470 475 480

Asp Asp Asp Thr Leu Ile Ala Asp Glu Leu

485 490

<210> 53

<211> 505

<212> PRT

<213> 博伊丁假丝酵母

<400> 53

Met Lys Phe Glu Phe Ser Leu Leu Val Leu Ile Phe Ser Lys Leu Leu

1 5 10 15

Val Ala Ala Asn Thr Ala Gly Gly Asp Met Val Cys Pro Asp Asp Asn

20 25 30

Pro Asp Asn Cys Tyr Pro Lys Ile Phe Val Pro Thr Asn Glu Trp Gln

35 40 45

Glu Ile Lys Pro Glu Gln His Ile Pro Ala Gly Leu His Val Arg Met

50 55 60

Asn Ile Glu Asn Met Gly Arg Glu Ala Lys Leu Pro Glu Lys Ser Ser

65 70 75 80

Asn Ser Gln Ile Asn Lys Asp Ile Gln Ala Val Ala Val Asp Leu Gly

85 90 95

Gly Asp Ala Ala Asp Asn Gly Gly Asp Val Asn Asn Ala Val Val Ala

100 105 110

Val Gly Glu Val His Asp Ala Glu Glu Asn Ile Lys Val Glu Asn Gly

115 120 125

Asn Gly Gln Gly Asn Lys Lys Ser Asn Gly Ser Arg Gly Lys Pro Ala

130 135 140

Pro Gly Glu Leu Leu Asn Ala Leu Lys Gly Val Glu Glu Phe Leu Asn

145 150 155 160

Asn Asp Arg Thr Asp Asn Val Glu Gly Leu Met Gly Tyr Leu Glu Ile

165 170 175

Leu Asp Asp Leu Ser His Asp Ile Asp Tyr Gly Val Asp Ile Ser Lys

180 185 190

Asn Pro Met Ser Leu Ile Gln Leu Thr Gly Ile Tyr Thr Phe Glu Gln

195 200 205

Pro Asp Ile Tyr Glu Thr Lys Leu Lys Gly Lys Thr Thr Asp Ser Leu

210 215 220

Lys Ile Gln Asp Met Ser Met Arg Val Leu Ser Ser Thr Ile Arg Asn

225 230 235 240

Asn Asp Glu Ala Leu Asp Asn Ile Val Glu Leu Phe Asn Gly Ser Lys

245 250 255

Asp Lys Leu Tyr Lys Val Ile Met Glu Lys Leu Glu Lys Leu Asn Asn

260 265 270

Asn Ser Phe Glu Asn Ile Ile Gln Arg Arg Arg Leu Gly Leu Leu Asn

275 280 285

Ser Ile Leu Gly His Glu Glu Ile Ala Ser Ser Phe Cys Cys Leu Ser

290 295 300

Asn Asp Leu Thr Leu Leu His Leu Tyr Ser Lys Ile Thr Asp Lys Glu

305 310 315 320

Ser Lys Ala Lys Ile Ile Asn Ile Leu His Asp Leu Arg Ile Ala Pro

325 330 335

Asp Tyr Cys His Ser Glu Asn Ile Val Asn Leu Ser Pro Gln Asp Ile

340 345 350

Gln Asp Ser Leu Gln Leu Lys Lys Arg Tyr Gln Asp Asp Asn Leu Asn

355 360 365

Ile Ser Glu Ser Val Ile Val Asp Glu Glu Asp Glu Glu Ala Phe Gly

370 375 380

Asp Ile Thr Asp Val Asp Leu Lys Tyr Ser Ile Val Ala Gln Arg Met

385 390 395 400

Leu Arg Lys Tyr Gly Leu Ile Ser Asn Tyr Lys Ala Arg Glu Ile Leu

405 410 415

Gln Asp Leu Ile Asp Leu Lys Asn Asn Lys Lys Asn Ser Leu Lys Ile

420 425 430

Ser Ser Arg Phe Leu Asn Trp Met Glu Tyr Gln Ile Asp Gln Val Lys

435 440 445

Gln Leu Asn Asn Asn Leu Ser Gly Ser Asn Asn Gln Asp Asp Asp Asn

450 455 460

Gln Gln Arg Phe Thr Ile Glu Ser Arg Asp Gly Glu Arg Asp Tyr Leu

465 470 475 480

Asp Tyr Leu Ile Val Ala Arg His Glu Val Phe Gly Asn Ser His Ala

485 490 495

Gly Arg Lys Ala Ser Ala Asp Glu Leu

500 505

<210> 54

<211> 356

<212> PRT

<213> Ogataea parapolymorpha

<400> 54

Met Leu Cys Leu Leu Leu Phe Gly Gly Val Ser Leu Ala Lys Leu Ile

1 5 10 15

Cys Pro Asp Pro Asn Pro Leu Asn Cys Tyr Pro Glu Leu Phe Glu Pro

20 25 30

Ser Thr Asp Trp Lys Pro Val Lys Glu Gly Gln Ile Ile Pro Gly Gly

35 40 45

Leu Asp Ile Arg Leu Asn Ile Asp Thr Leu Glu Arg Glu Ala Lys Leu

50 55 60

Thr Gly Asn Ser Gln Pro Asn Glu Asn Gly Ala Val Ile Val Pro Glu

65 70 75 80

Asp Ile Met Glu Leu Asp Glu Glu Gln Asn Leu Ser Glu Ala Leu Arg

85 90 95

Tyr Leu Ser Lys Phe Val Asp His Gly Val Gly Asp Ser Ala Thr Leu

100 105 110

Leu Arg Lys Leu Glu Phe Ile Ser Glu Met Ser Ser Asp Ser Asp Tyr

115 120 125

Gly Val Asp Thr Met Gln Tyr Ile Gln Pro Leu Ile Arg Leu Ser Gly

130 135 140

Leu Tyr Gly Glu Glu Gly Leu Lys Gln Ile Asp Asp Glu Asn Arg Asp

145 150 155 160

Glu Ile Arg Glu Leu Ala Thr Ile Ile Leu Ala Ser Ser Leu Arg Asn

165 170 175

Asn Pro Glu Ala Gln Arg Lys Phe Leu Gln Tyr Phe Ser Asp Pro Met

180 185 190

Asp Phe Val Asp His Leu Thr Ala Lys Ile Gln Asn Asp Val Leu Leu

195 200 205

Arg Arg Arg Leu Gly Ile Leu Gly Ser Leu Leu Asn Ser Gly Ser Leu

210 215 220

Ile Asp Gly Phe Glu Ser Ile Lys Lys Lys Leu Leu Ile Leu Tyr Pro

225 230 235 240

Gln Leu Glu Asn Gln Ala Thr Lys Gln Arg Leu Met His Ile Ile Ser

245 250 255

Asp Ile Thr Gly Asp Val Glu Asp Glu Asp Met Asp Arg Gln Phe Ala

260 265 270

Asn Ile Ala Gln Asp Thr Leu Ile Asp Gln Lys Ala Leu Asp Asp Gly

275 280 285

Thr Leu Thr Leu Leu Asp Glu Leu Lys Lys Leu Lys Leu Asn Asn Arg

290 295 300

Asn Leu Phe Lys Ala Lys Ser Glu Phe Leu Glu Trp Leu Asn Val Arg

305 310 315 320

Met Glu Ala Leu Lys Ala Ala Lys Asp Pro Lys Leu Glu Glu Phe Arg

325 330 335

Ser Leu Arg His Glu Ile Phe Gly Asn Pro Lys Ala Met Arg Lys Ser

340 345 350

Tyr Asp Glu Leu

355

<210> 55

<211> 299

<212> PRT

<213> Komagataella phaffii

<400> 55

Met Lys Leu His Leu Val Ile Leu Cys Leu Ile Thr Ala Val Tyr Cys

1 5 10 15

Phe Ser Ala Val Asp Arg Glu Ile Phe Gln Leu Asn His Glu Leu Arg

20 25 30

Gln Glu Tyr Gly Asp Asn Phe Asn Phe Tyr Glu Trp Leu Lys Leu Pro

35 40 45

Lys Gly Pro Ser Ser Thr Phe Glu Asp Ile Asp Asn Ala Tyr Lys Lys

50 55 60

Leu Ser Arg Lys Leu His Pro Asp Lys Ile Arg Gln Lys Lys Leu Ser

65 70 75 80

Gln Glu Gln Phe Glu Gln Leu Lys Lys Lys Ala Thr Glu Arg Tyr Gln

85 90 95

Gln Leu Ser Ala Val Gly Ser Ile Leu Arg Ser Glu Ser Lys Glu Arg

100 105 110

Tyr Asp Tyr Phe Val Lys His Gly Phe Pro Val Tyr Lys Gly Asn Asp

115 120 125

Tyr Thr Tyr Ala Lys Phe Arg Pro Ser Val Leu Leu Thr Ile Phe Ile

130 135 140

Leu Phe Ala Leu Ala Thr Leu Thr His Phe Val Phe Ile Arg Leu Ser

145 150 155 160

Ala Val Gln Ser Arg Lys Arg Leu Ser Ser Leu Ile Glu Glu Asn Lys

165 170 175

Gln Leu Ala Trp Pro Gln Gly Val Gln Asp Val Thr Gln Val Lys Asp

180 185 190

Val Lys Val Tyr Asn Glu His Leu Arg Lys Trp Phe Leu Val Cys Phe

195 200 205

Asp Gly Ser Val His Tyr Val Glu Asn Asp Lys Thr Phe His Val Asp

210 215 220

Pro Glu Glu Val Glu Leu Pro Ser Trp Gln Asp Thr Leu Pro Gly Lys

225 230 235 240

Leu Ile Val Lys Leu Ile Pro Gln Leu Ala Arg Lys Pro Arg Ser Pro

245 250 255

Lys Glu Ile Lys Lys Glu Asn Leu Asp Asp Lys Thr Arg Lys Thr Lys

260 265 270

Lys Pro Thr Gly Asp Ser Lys Thr Leu Pro Asn Gly Lys Thr Ile Tyr

275 280 285

Lys Ala Thr Lys Ser Gly Gly Arg Arg Arg Lys

290 295

<210> 56

<211> 299

<212> PRT

<213> Komagataella pastoris

<400> 56

Met Lys Leu His Leu Val Ile Leu Cys Leu Ile Thr Ala Val Tyr Cys

1 5 10 15

Phe Ser Ala Val Asp Arg Glu Ile Phe Gln Leu Asn His Glu Leu Arg

20 25 30

Gln Glu Phe Gly Asp Asn Phe Asn Phe Tyr Glu Trp Leu Lys Leu Pro

35 40 45

Lys Gly Pro Ser Ser Thr Phe Glu Asp Ile Asp Asn Ala Tyr Lys Lys

50 55 60

Leu Ser Arg Lys Leu His Pro Asp Lys Val Arg Gln Lys Lys Leu Ser

65 70 75 80

Gln Gln Gln Phe Gln Gln Leu Lys Lys Lys Ala Thr Glu Arg Tyr Gln

85 90 95

Gln Leu Ser Ala Val Gly Ser Ile Leu Arg Ser Glu Ser Lys Glu Arg

100 105 110

Tyr Asp Tyr Phe Leu Lys His Gly Phe Pro Val Tyr Lys Gly Asn Asp

115 120 125

Tyr Thr Tyr Ala Lys Phe Arg Pro Ser Val Leu Ile Thr Val Phe Ile

130 135 140

Leu Phe Ala Leu Ala Thr Leu Thr His Phe Val Phe Ile Arg Leu Ser

145 150 155 160

Ala Val Gln Ser Arg Lys Arg Leu Ser Ser Leu Ile Glu Glu Asn Lys

165 170 175

Gln Leu Ala Trp Pro Gln Gly Val Gln Asp Val Thr Lys Val Lys Asp

180 185 190

Val Lys Val Tyr Asn Glu His Leu Arg Lys Trp Phe Leu Val Cys Phe

195 200 205

Asp Gly Ser Val His Tyr Val Glu Asn Asp Lys Thr Tyr His Val Asp

210 215 220

Pro Glu Glu Val Glu Leu Pro Ser Trp Gln Asp Ser Leu Pro Gly Lys

225 230 235 240

Val Ile Val Arg Leu Ile Pro Gln Leu Ala Lys Lys Pro Arg Pro Pro

245 250 255

Lys Glu Thr Lys Lys Glu Asp Leu Asp Glu Lys Ser Lys Lys Thr Lys

260 265 270

Lys Pro Thr Gly Asp Ser Lys Thr Leu Pro Asn Gly Lys Thr Ile Tyr

275 280 285

Lys Ala Thr Lys Ser Gly Gly Arg Arg Arg Lys

290 295

<210> 57

<211> 287

<212> PRT

<213> 解脂耶氏酵母

<400> 57

Met Lys Phe Ser Ile Ile Phe Leu Val Thr Leu Phe Ala Leu Val Phe

1 5 10 15

Ala Gln Gly Gly Asn Gln Trp Ser Lys Glu Asp Arg Glu Ile Phe Asp

20 25 30

Leu Asn Leu Ala Val Gln Lys Asp Leu Asn Pro Asp Asn Ser Lys Pro

35 40 45

Val Ser Phe Tyr Gln Trp Leu Asp Thr Glu Arg Lys Ala Ser Val Asp

50 55 60

Glu Val Thr Lys Ser Tyr Arg Lys Leu Ser Arg Gln Leu His Pro Asp

65 70 75 80

Lys Asn Arg Lys Val Pro Gly Ala Thr Asp Arg Phe Thr Arg Leu Gly

85 90 95

Leu Val Tyr Lys Ile Leu Ile Asn Lys Asp Leu Arg Lys Arg Tyr Asp

100 105 110

Phe Tyr Leu Lys Asn Gly Phe Pro Arg Glu Gly Glu Asn Gly Glu Phe

115 120 125

Val Phe Lys Arg Phe Lys Pro Gly Val Gly Phe Ala Leu Phe Val Leu

130 135 140

Tyr Phe Leu Ile Gly Leu Gly Ser Tyr Val Val Lys Tyr Leu Asn Ala

145 150 155 160

Lys Lys Ile Lys Ser Thr Ile Glu Arg Val Glu Arg Glu Val Arg Lys

165 170 175

Glu Ala Ser Arg Lys Asn Gly Val Arg Leu Pro Ala Thr Thr Asp Val

180 185 190

Ile Val Asp Gly Arg Gln Tyr Cys Tyr Tyr Asn Thr Gly Glu Ile His

195 200 205

Leu Val Asp Thr Asp Asn Asn Ile Glu His Pro Ile Ser Ser Gln Gly

210 215 220

Val Glu Met Pro Gly Ile Lys Asp Ser Leu Trp Val Thr Leu Pro Val

225 230 235 240

Ala Leu Phe Asn Leu Val Lys Pro Lys Ser Ala Ala Glu Lys Ala Glu

245 250 255

Glu Ala Lys Ile Gln Gln Glu Lys Glu Ala Lys Glu Glu Arg Glu Arg

260 265 270

Pro Lys Pro Lys Ala Ala Thr Lys Val Gly Gly Arg Arg Arg Lys

275 280 285

<210> 58

<211> 414

<212> PRT

<213> 里氏木霉

<400> 58

Met Lys Ile Glu Tyr Leu Val Val Gly Val Leu Ser Leu Leu Thr Pro

1 5 10 15

Leu Ala Ala Ala Trp Ser Lys Glu Asp Arg Glu Ile Phe Arg Ile Arg

20 25 30

Asp Glu Ile Ala Ala His Glu Ser Asp Pro Ala Ala Ser Phe Tyr Asp

35 40 45

Ile Leu Gly Val Thr Pro Ser Ala Ser Gln Asp Asp Ile Asn Lys Ala

50 55 60

Tyr Arg Lys Lys Ser Arg Ser Leu His Pro Asp Lys Val Lys Gln Gln

65 70 75 80

Leu Arg Ala Glu Lys Ala Gln Ala Asp Lys Lys Lys Gly Ala Gly Gly

85 90 95

Gly Ser Ala Ala Ser Ser Ser Lys Gly Pro Thr Gln Ala Glu Ile Arg

100 105 110

Lys Ala Val Lys Glu Ala Ser Glu Arg Gln Ala Arg Leu Ser Leu Ile

115 120 125

Ala Asn Ile Leu Arg Gly Pro Ala Arg Asp Arg Tyr Asp His Phe Leu

130 135 140

Ala Asn Gly Phe Pro Leu Trp Lys Gly Thr Asp Tyr Tyr Tyr Asn Arg

145 150 155 160

Tyr Arg Pro Gly Leu Gly Thr Val Leu Val Gly Val Phe Met Met Gly

165 170 175

Gly Gly Ala Ile His Tyr Leu Ala Leu Tyr Met Ser Trp Lys Arg Gln

180 185 190

Arg Glu Phe Val Glu Arg Tyr Val Thr Phe Ala Arg Asn Ala Ala Trp

195 200 205

Gly Asn Asp Ala Gly Ile Pro Gly Val Asp Ala Met Pro Ala Pro Ala

210 215 220

Pro Ala Pro Ala Pro Glu Glu Asp Glu Ala Ala Ala Pro Ala Gln Pro

225 230 235 240

Arg Asn Arg Arg Glu Arg Arg Met Gln Glu Lys Glu Thr Arg Lys Asp

245 250 255

Asp Gly Lys Ser Ser Lys Lys Ala Arg Lys Ala Val Thr Ser Lys Ser

260 265 270

Ser Ser Ser Ala Pro Thr Pro Thr Gly Ala Arg Lys Arg Val Val Ala

275 280 285

Glu Asn Gly Lys Ile Leu Val Val Asp Ser Gln Gly Asp Val Phe Leu

290 295 300

Glu Glu Glu Asp Glu Glu Gly Asn Val Asn Glu Phe Leu Leu Asp Pro

305 310 315 320

Asn Glu Leu Leu Gln Pro Thr Phe Lys Asp Thr Ala Val Val Arg Val

325 330 335

Pro Val Trp Val Phe Arg Ser Thr Val Gly Arg Phe Leu Pro Lys Gly

340 345 350

Ala Ala Gln Ala Glu Ala Glu Glu Thr His Glu Glu Asp Ser Asp Ala

355 360 365

Ala Gln Asn Thr Pro Pro Ser Ser Glu Ser Ala Gly Asp Asp Phe Glu

370 375 380

Ile Leu Asp Lys Ser Thr Asp Ser Leu Ser Lys Val Lys Thr Ser Gly

385 390 395 400

Ala Gln Gln Gly Lys Ala Thr Lys Arg Lys Thr Thr Lys Lys

405 410

<210> 59

<211> 303

<212> PRT

<213> 粟酒裂殖酵母

<400> 59

Met Ser Arg Ile Phe Ile Leu Leu Leu Leu Phe Gly Val Cys Leu Ala

1 5 10 15

Trp Thr Ser Ser Asp Leu Glu Ile Phe Arg Val Val Asp Ser Leu Lys

20 25 30

Ser Ile Leu Lys Asn Lys Ala Thr Phe Tyr Glu Leu Leu Glu Val Pro

35 40 45

Thr Lys Ala Ser Ile Lys Glu Ile Asn Arg Ala Tyr Arg Lys Lys Ser

50 55 60

Ile Leu Tyr His Pro Asp Lys Asn Pro Lys Ser Lys Glu Leu Tyr Thr

65 70 75 80

Leu Leu Gly Leu Ile Val Asn Ile Leu Arg Asn Thr Glu Thr Arg Lys

85 90 95

Arg Tyr Asp Tyr Phe Leu Lys Asn Gly Phe Pro Arg Trp Lys Gly Thr

100 105 110

Gly Tyr Leu Tyr Ser Arg Tyr Arg Pro Gly Leu Gly Ala Val Leu Val

115 120 125

Leu Leu Phe Leu Leu Ile Ser Ile Ala His Phe Val Met Leu Val Ile

130 135 140

Ser Ser Lys Arg Gln Lys Lys Ile Met Gln Asp His Ile Asp Ile Ala

145 150 155 160

Arg Gln His Glu Ser Tyr Ala Thr Ser Ala Arg Gly Ser Lys Arg Ile

165 170 175

Val Gln Val Pro Gly Gly Arg Arg Ile Tyr Thr Val Asp Ser Ile Thr

180 185 190

Gly Gln Val Cys Ile Leu Asp Pro Ser Ser Asn Ile Glu Tyr Leu Val

195 200 205

Ser Pro Asp Ser Val Ala Ser Val Lys Ile Ser Asp Thr Phe Phe Tyr

210 215 220

Arg Leu Pro Arg Phe Ile Val Trp Asn Ala Phe Gly Arg Trp Phe Ala

225 230 235 240

Arg Ala Pro Ala Ser Ser Glu Asp Thr Asp Ser Asp Gly Gln Met Glu

245 250 255

Asp Glu Glu Lys Ser Asp Ser Val His Lys Ser Ser Phe Ser Ser Pro

260 265 270

Ser Lys Lys Glu Ala Ser Ile Lys Ala Gly Lys Arg Arg Met Lys Arg

275 280 285

Arg Ala Asn Arg Ile Pro Leu Ser Lys Asn Thr Asn Arg Glu Asn

290 295 300

<210> 60

<211> 295

<212> PRT

<213> 酿酒酵母

<400> 60

Met Asn Gly Tyr Trp Lys Pro Ala Leu Val Val Leu Gly Leu Val Ser

1 5 10 15

Leu Ser Tyr Ala Phe Thr Thr Ile Glu Thr Glu Ile Phe Gln Leu Gln

20 25 30

Asn Glu Ile Ser Thr Lys Tyr Gly Pro Asp Met Asn Phe Tyr Lys Phe

35 40 45

Leu Lys Leu Pro Lys Leu Gln Asn Ser Ser Thr Lys Glu Ile Thr Lys

50 55 60

Asn Leu Arg Lys Leu Ser Lys Lys Tyr His Pro Asp Lys Asn Pro Lys

65 70 75 80

Tyr Arg Lys Leu Tyr Glu Arg Leu Asn Leu Ala Thr Gln Ile Leu Ser

85 90 95

Asn Ser Ser Asn Arg Lys Ile Tyr Asp Tyr Tyr Leu Gln Asn Gly Phe

100 105 110

Pro Asn Tyr Asp Phe His Lys Gly Gly Phe Tyr Phe Ser Arg Met Lys

115 120 125

Pro Lys Thr Trp Phe Leu Leu Ala Phe Ile Trp Ile Val Val Asn Ile

130 135 140

Gly Gln Tyr Ile Ile Ser Ile Ile Gln Tyr Arg Ser Gln Arg Ser Arg

145 150 155 160

Ile Glu Asn Phe Ile Ser Gln Cys Lys Gln Gln Asp Asp Thr Asn Gly

165 170 175

Leu Gly Val Lys Gln Leu Thr Phe Lys Gln His Glu Lys Asp Glu Gly

180 185 190

Lys Ser Leu Val Val Arg Phe Ser Asp Val Tyr Val Val Glu Pro Asp

195 200 205

Gly Ser Glu Thr Leu Ile Ser Pro Asp Thr Leu Asp Lys Pro Ser Val

210 215 220

Lys Asn Cys Leu Phe Trp Arg Ile Pro Ala Ser Val Trp Asn Met Thr

225 230 235 240

Phe Gly Lys Ser Val Gly Ser Ala Gly Lys Glu Glu Ile Ile Thr Asp

245 250 255

Ser Lys Lys Tyr Asp Gly Asn Gln Thr Lys Lys Gly Asn Lys Val Lys

260 265 270

Lys Gly Ser Ala Lys Lys Gly Gln Lys Lys Met Glu Leu Pro Asn Gly

275 280 285

Lys Val Ile Tyr Ser Arg Lys

290 295

<210> 61

<211> 277

<212> PRT

<213> 乳酸克鲁维酵母

<400> 61

Met Leu Ser Ser Ser Arg Pro Val Thr Tyr Ala Leu Phe Leu Ser Leu

1 5 10 15

Phe Ala Ala Val Ala Tyr Cys Phe Thr Arg Asp Glu Ile Glu Ile Phe

20 25 30

Gln Leu Gln Gln Glu Leu His Thr Lys Tyr Gly Ser Asn Met Asp Phe

35 40 45

Tyr Gln Phe Leu Lys Leu Pro Lys Leu Lys Gln Ser Thr Ser Ala Glu

50 55 60

Ile Thr Lys Asn Phe Lys Lys Leu Ala Lys Lys Tyr His Pro Asp Lys

65 70 75 80

Asn Pro Lys Tyr Arg Lys Leu Tyr Glu Arg Ile Asn Leu Ile Thr Lys

85 90 95

Leu Leu Ser Asp Glu Gly His Arg Lys Thr Tyr Asp Tyr Tyr Leu Lys

100 105 110

Asn Gly Phe Pro Lys Tyr Asp Tyr Lys Lys Gly Gly Phe Phe Phe Asn

115 120 125

Arg Val Thr Pro Ser Val Trp Phe Thr Phe Phe Phe Leu Tyr Val Leu

130 135 140

Ala Gly Val Ile His Leu Val Leu Leu Lys Leu His Asn Asn Ala Asn

145 150 155 160

Lys Lys Arg Ile Glu Asn Phe Val Ala Lys Val Arg Glu Gln Asp Thr

165 170 175

Thr Asn Ser Leu Gly Glu Ser Lys Leu Val Phe Lys Glu Ser Glu Asp

180 185 190

Ser Glu Asp Lys Gln Leu Leu Val Arg Phe Gly Glu Val Phe Val Ile

195 200 205

Gln Pro Asp Glu Ser Leu Ala Lys Ile Ser Thr Asp Asp Ile Ile Asp

210 215 220

Pro Gly Ile Asn Asp Thr Leu Leu Val Lys Leu Pro Lys Trp Ile Trp

225 230 235 240

Asn Lys Thr Leu Gly Lys Phe Ile Asn Ile Gly Thr Ser Lys Ser Gln

245 250 255

Gln Pro Asn Lys Gly Ser Pro Asn Lys Asn Lys Arg Asn Ser Lys Ile

260 265 270

Asn Ser Lys Ala Gln

275

<210> 62

<211> 404

<212> PRT

<213> 博伊丁假丝酵母

<400> 62

Met Arg Ser Phe Lys Ile Ile Phe Phe Val Leu Ala Phe Phe Thr Ala

1 5 10 15

Ile Ala Leu Cys Trp Thr His Glu Asp Ile Glu Ile Phe Glu Ile Asn

20 25 30

Glu Ser Leu Lys Lys Glu Thr Lys Asp Pro Glu Met Asn Phe Tyr Lys

35 40 45

Tyr Leu Asn Leu Pro Ser Gly Pro Lys Ser Ser Tyr Asp Gln Ile Ser

50 55 60

Arg Ala Phe Lys Lys Leu Ser Arg Lys Tyr His Pro Asp Lys Tyr Lys

65 70 75 80

Pro Asp Phe Asn Asn Asp Glu Lys Thr Ile Asn Lys Gln Lys Lys Asn

85 90 95

Trp Glu Lys Arg Phe Gln Asn Ile Gly Ala Ile Ala Glu Ile Leu Arg

100 105 110

Ser Glu Asn Lys Asp Arg Tyr Asp Phe Phe Tyr Lys Asn Gly Phe Pro

115 120 125

Thr Ile Asn Asp Glu Asn Glu Tyr Val Tyr Asn Lys Tyr Arg Pro Ser

130 135 140

Phe Leu Ile Thr Leu Ala Val Ile Phe Val Ile Ile Ser Val Leu His

145 150 155 160

Phe Ile Val Ile Lys Ser Asn Asn Thr Gln Gln Arg Gln Arg Ile Glu

165 170 175

Ser Leu Ile Asn Glu Ile Lys Thr Arg Ala Phe Gly Asn Gly Thr Pro

180 185 190

Thr Asp Phe Lys Asp Arg Lys Val Tyr His Asp Gly Leu Asp Lys Tyr

195 200 205

Phe Val Ala Lys Phe Asp Gly Ser Val Tyr Leu Leu Asp Glu Ser His

210 215 220

Leu Ser Ser Gly Thr Pro Ile Glu Glu Leu Ser Pro Glu Glu Ile Asp

225 230 235 240

Lys Ile Glu Met Gln Arg His Gly Tyr Asn Gly Pro Lys Leu Ala Lys

245 250 255

Gly Val Phe Tyr Tyr Lys Asp Asp Thr Tyr Lys Asn Arg Arg Thr Arg

260 265 270

Arg Ser Glu Leu Lys His Gly Ser Asp Glu Asp Glu Asp Val Leu Leu

275 280 285

Gln Met Ser Val Asp Glu Val Pro Leu Val Thr Leu Lys Asp Met Leu

290 295 300

Phe Ile Arg Phe Leu Ser Ser Ile Tyr Asn Thr Thr Leu Glu Arg Leu

305 310 315 320

Ile Pro Lys Ser Gln Pro Glu Thr Glu Thr Ser Gly Ser Lys Lys Lys

325 330 335

Thr Ile Pro Thr Thr Lys Ser Lys Asp Ser Thr Thr Glu Glu Asp Phe

340 345 350

Glu Ile Leu Asn Leu Glu Asp Ala Asn Pro Asp Ser Asn Glu Thr Ser

355 360 365

Lys Ser Ser Lys Glu Ala Asn Thr Val Leu Gly Ser Lys Thr Lys Lys

370 375 380

Thr Ser Ser Gly Glu Lys Lys Val Leu Pro Asn Gly Gln Val Ile Tyr

385 390 395 400

Ser Arg Lys Lys

<210> 63

<211> 397

<212> PRT

<213> 黑曲霉

<400> 63

Met Lys Ser Ile Ala Leu Arg Leu Phe Val Phe Val Ala Leu Ile Val

1 5 10 15

Leu Ala Ala Ala Trp Thr Lys Glu Asp Tyr Glu Ile Phe Arg Leu Asn

20 25 30

Asp Glu Leu Ala Ala Ala Glu Gly Pro Asn Val Thr Phe Tyr Asp Phe

35 40 45

Leu Gly Ala Lys Pro Asn Ala Asn Gln Asp Glu Leu Ser Lys Ala Tyr

50 55 60

Arg Gln Lys Ser Arg Leu Leu His Pro Asp Lys Val Lys Arg Ser Phe

65 70 75 80

Ile Ala Asn Ser Ser Lys Asp Lys Ser Arg Ser Lys Ser Ser Lys Ser

85 90 95

Gly Val His Val Asn Gln Gly Pro Ser Lys Arg Glu Ile Ala Ala Ala

100 105 110

Val Lys Glu Ala His Glu Arg Ser Ala Arg Leu Asn Thr Val Ala Asn

115 120 125

Ile Leu Arg Gly Pro Gly Arg Glu Arg Tyr Asp His Phe Leu Lys Asn

130 135 140

Gly Phe Pro Lys Trp Lys Gly Thr Gly Tyr Tyr Tyr Ser Arg Phe Arg

145 150 155 160

Pro Gly Leu Gly Ser Val Leu Ile Gly Leu Phe Leu Val Phe Gly Gly

165 170 175

Gly Ala His Tyr Ala Ala Leu Val Leu Gly Trp Lys Arg Gln Arg Glu

180 185 190

Phe Val Asp Arg Tyr Ile Arg Gln Ala Arg Arg Ala Ala Trp Gly Asp

195 200 205

Glu Ser Gly Val Arg Gly Ile Pro Gly Leu Asp Gly Ala Ser Ala Pro

210 215 220

Ala Pro Thr Pro Ala Pro Ala Pro Glu Pro Glu Gln Ser Ala Met Pro

225 230 235 240

Met Asn Arg Arg Gln Lys Arg Met Met Asp Arg Glu Asn Arg Lys Glu

245 250 255

Gly Lys Lys Gly Gly Arg Ala Ala Ser Arg Asn Ser Gly Thr Ala Thr

260 265 270

Pro Thr Ser Glu Pro Gln Met Glu Pro Ser Gly Glu Arg Lys Lys Val

275 280 285

Ile Ala Glu Asn Gly Lys Val Leu Ile Val Asp Ser Leu Gly Asn Val

290 295 300

Phe Leu Glu Glu Glu Thr Glu Asp Gly Glu Arg Gln Glu Phe Leu Leu

305 310 315 320

Asp Val Asp Glu Ile Gln Arg Pro Thr Ile Arg Asp Thr Leu Val Phe

325 330 335

Arg Leu Pro Gly Trp Val Tyr Ser Lys Thr Val Gly Arg Leu Leu Gly

340 345 350

Ser Ser Asn Ala Val Asn Ser Gly Ala Glu Ser Glu Glu Glu Pro Ser

355 360 365

Glu Ile Val Glu Glu Ser Thr Glu Gly Ala Ala Ser Ser Ala Arg Ser

370 375 380

Ser Lys Ala Arg Arg Arg Gly Lys Arg Ser Gln Arg Ser

385 390 395

<210> 64

<211> 323

<212> PRT

<213> Ogataea parapolymorpha

<400> 64

Met Arg Leu Leu Phe Trp Leu Ala Ile Phe Ser Ala Thr Val Phe Ala

1 5 10 15

Ala Trp Ser Ala Glu Asp Leu Glu Ile Phe Lys Leu Gln His Glu Leu

20 25 30

Val Lys Asp Thr Lys Lys Glu Thr Asn Phe Tyr Glu Tyr Leu Gly Leu

35 40 45

Ser Asn Gly Pro Lys Ala Ser Tyr Asp Glu Ile Asn Lys Ala Tyr Lys

50 55 60

Lys Met Ser Arg Lys Leu His Pro Asp Lys Val Arg Arg Lys Glu Gly

65 70 75 80

Met Ser Gln Lys Ala Phe Glu Arg Arg Lys Lys Ala Ala Glu Gln Arg

85 90 95

Phe Gln Arg Leu Ser Leu Ile Gly Thr Ile Leu Arg Gly Glu Arg Lys

100 105 110

Glu Arg Tyr Asp Tyr Tyr Leu Lys His Gly Phe Pro Ala Tyr Thr Gly

115 120 125

Thr Gly Phe Ala Leu Ser Lys Phe Arg Pro Gly Pro Val Leu Ala Leu

130 135 140

Val Val Val Val Val Leu Phe Ser Ala Val His Tyr Ile Met Leu Lys

145 150 155 160

Leu Asn Thr Gln Gln Lys Arg Lys Arg Val Glu Ser Leu Ile Asn Asp

165 170 175

Leu Lys Ala Lys Ala Phe Gly Pro Ser Met Leu Pro Gly Thr Asn Phe

180 185 190

Ser Asp Gln Arg Val Ala His Met Asp Lys Leu Phe Val Val Lys Phe

195 200 205

Asp Gly Ser Val Trp Leu Val Asp Lys Glu Leu Lys Glu Gly Glu Asp

210 215 220

Tyr Ile Val Asp Glu Asp Gly Arg Gln Ile Phe Arg Val Glu Ala Glu

225 230 235 240

Pro Lys Asn Arg Lys Gln Arg Arg Ala Lys Lys Asp Lys Asp Glu Val

245 250 255

Leu Leu Pro Val Thr Pro Asp Asp Val Glu Glu Val Thr Trp Arg Asp

260 265 270

Thr Leu Val Val Arg Phe Val Leu Trp Ala Ile Ser Lys Leu Glu Lys

275 280 285

Lys Pro Lys Thr His Asp Lys Ala Asp Lys Gly Thr Ile Arg Arg Leu

290 295 300

Pro Asn Gly Lys Val Lys Lys Val Arg Pro Thr Gly Glu Asn Gly Glu

305 310 315 320

Lys Asn Lys

<210> 65

<211> 53

<212> PRT

<213> Komagataella phaffii

<400> 65

Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser

1 5 10 15

Arg Glu Lys Lys Arg Arg His Val Glu Phe Leu Glu Asn His Val Val

20 25 30

Asp Leu Glu Ser Ala Leu Gln Glu Ser Ala Lys Ala Thr Asn Lys Leu

35 40 45

Lys Glu Ile Gln Asp

50

<210> 66

<211> 53

<212> PRT

<213> Komagataella pastoris

<400> 66

Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser

1 5 10 15

Arg Glu Lys Lys Arg Arg His Val Glu Phe Leu Glu Asn His Val Val

20 25 30

Asp Leu Glu Ser Ala Leu Gln Glu Ser Ala Lys Ala Thr Asn Lys Leu

35 40 45

Lys Gln Ile Gln Asp

50

<210> 67

<211> 45

<212> PRT

<213> 解脂耶氏酵母

<400> 67

Arg Arg Ile Glu Arg Ile Met Arg Asn Arg Gln Ala Ala His Ala Ser

1 5 10 15

Arg Glu Lys Lys Arg Arg His Leu Glu Asp Leu Glu Lys Lys Cys Ser

20 25 30

Glu Leu Ser Ser Glu Asn Asn Asp Leu His His Gln Val

35 40 45

<210> 68

<211> 53

<212> PRT

<213> 里氏木霉

<400> 68

Arg Arg Val Glu Arg Val Leu Arg Asn Arg Arg Ala Ala Gln Ser Ser

1 5 10 15

Arg Glu Arg Lys Arg Leu Glu Val Glu Ala Leu Glu Lys Arg Asn Lys

20 25 30

Glu Leu Glu Thr Leu Leu Ile Asn Val Gln Lys Thr Asn Leu Ile Leu

35 40 45

Val Glu Glu Leu Asn

50

<210> 69

<211> 51

<212> PRT

<213> 酿酒酵母

<400> 69

Arg Arg Ile Glu Arg Ile Leu Arg Asn Arg Arg Ala Ala His Gln Ser

1 5 10 15

Arg Glu Lys Lys Arg Leu His Leu Gln Tyr Leu Glu Arg Lys Cys Ser

20 25 30

Leu Leu Glu Asn Leu Leu Asn Ser Val Asn Leu Glu Lys Leu Ala Asp

35 40 45

His Glu Asp

50

<210> 70

<211> 46

<212> PRT

<213> 乳酸克鲁维酵母

<400> 70

Arg Arg Ile Glu Arg Ile Leu Arg Asn Arg Arg Ala Ala His Gln Ser

1 5 10 15

Arg Glu Lys Lys Arg Leu His Val Gln Arg Leu Glu Glu Lys Cys His

20 25 30

Leu Leu Glu Gly Ile Leu Lys Met Val Asp Leu Asp Ile Leu

35 40 45

<210> 71

<211> 48

<212> PRT

<213> 博伊丁假丝酵母

<400> 71

Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser

1 5 10 15

Arg Glu Lys Lys Arg Lys His Val Glu Tyr Leu Glu Leu Tyr Val Asn

20 25 30

Asn Leu Glu Asn Gly Ile Lys Asn Tyr Ile Ser Asn Gln Glu Lys Leu

35 40 45

<210> 72

<211> 53

<212> PRT

<213> 黑曲霉

<400> 72

Arg Arg Ile Glu Arg Val Leu Arg Asn Arg Ala Ala Ala Gln Thr Ser

1 5 10 15

Arg Glu Arg Lys Arg Leu Glu Met Glu Lys Leu Glu Asn Glu Lys Ile

20 25 30

Gln Met Glu Gln Gln Asn Gln Phe Leu Leu Gln Arg Leu Ser Gln Met

35 40 45

Glu Ala Glu Asn Asn

50

<210> 73

<211> 39

<212> PRT

<213> Ogataea angusta

<400> 73

Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser

1 5 10 15

Arg Glu Lys Lys Arg Arg His Val Glu Tyr Leu Glu Asn Tyr Val Thr

20 25 30

Asp Leu Glu Ser Ala Leu Ala

35

<210> 74

<211> 331

<212> PRT

<213> Komagataella phaffii

<400> 74

Met Pro Val Asp Ser Ser His Lys Thr Ala Ser Pro Leu Pro Pro Arg

1 5 10 15

Lys Arg Ala Lys Thr Glu Glu Glu Lys Glu Gln Arg Arg Val Glu Arg

20 25 30

Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser Arg Glu Lys Lys Arg

35 40 45

Arg His Val Glu Phe Leu Glu Asn His Val Val Asp Leu Glu Ser Ala

50 55 60

Leu Gln Glu Ser Ala Lys Ala Thr Asn Lys Leu Lys Glu Ile Gln Asp

65 70 75 80

Ile Ile Val Ser Arg Leu Glu Ala Leu Gly Gly Thr Val Ser Asp Leu

85 90 95

Asp Leu Thr Val Pro Glu Val Asp Phe Pro Lys Ser Ser Asp Leu Glu

100 105 110

Pro Met Ser Asp Leu Ser Thr Ser Ser Lys Ser Glu Lys Ala Ser Thr

115 120 125

Ser Thr Arg Arg Ser Leu Thr Glu Asp Leu Asp Glu Asp Asp Val Ala

130 135 140

Glu Tyr Asp Asp Glu Glu Glu Asp Glu Glu Leu Pro Arg Lys Met Lys

145 150 155 160

Val Leu Asn Asp Lys Asn Lys Ser Thr Ser Ile Lys Gln Glu Lys Leu

165 170 175

Asn Glu Leu Pro Ser Pro Leu Ser Ser Asp Phe Ser Asp Val Asp Glu

180 185 190

Glu Lys Ser Thr Leu Thr His Leu Lys Leu Gln Gln Gln Gln Gln Gln

195 200 205

Pro Val Asp Asn Tyr Val Ser Thr Pro Leu Ser Leu Pro Glu Asp Ser

210 215 220

Val Asp Phe Ile Asn Pro Gly Asn Leu Lys Ile Glu Ser Asp Glu Asn

225 230 235 240

Phe Leu Leu Ser Ser Asn Thr Leu Gln Ile Lys His Glu Asn Asp Thr

245 250 255

Asp Tyr Ile Thr Thr Ala Pro Ser Gly Ser Ile Asn Asp Phe Phe Asn

260 265 270

Ser Tyr Asp Ile Ser Glu Ser Asn Arg Leu His His Pro Ala Val Met

275 280 285

Thr Asp Ser Ser Leu His Ile Thr Ala Gly Ser Ile Gly Phe Phe Ser

290 295 300

Leu Ile Gly Gly Gly Glu Ser Ser Val Ala Gly Arg Arg Ser Ser Val

305 310 315 320

Gly Thr Tyr Gln Leu Thr Cys Ile Ala Ile Arg

325 330

<210> 75

<211> 330

<212> PRT

<213> Komagataella pastoris

<400> 75

Met Pro Val Asp Ser Ser His Lys Ile Ala Ser Pro Leu Pro Pro Arg

1 5 10 15

Lys Arg Ala Lys Thr Glu Glu Glu Lys Glu Gln Arg Arg Val Glu Arg

20 25 30

Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser Arg Glu Lys Lys Arg

35 40 45

Arg His Val Glu Phe Leu Glu Asn His Val Val Asp Leu Glu Ser Ala

50 55 60

Leu Gln Glu Ser Ala Lys Ala Thr Asn Lys Leu Lys Gln Ile Gln Asp

65 70 75 80

Ile Ile Val Ser Arg Leu Glu Ala Leu Gly Gly Thr Val Ser Asp Leu

85 90 95

Asp Leu Ala Val Pro Glu Val Asp Phe Pro Lys Phe Ser Asp Leu Glu

100 105 110

Leu Ser Thr Asp Leu Ser Ser Ser Thr Lys Ser Glu Lys Ala Ser Thr

115 120 125

Ser Thr Cys Arg Ser Ser Thr Glu Asp Leu Asp Glu Asp Gly Val Ala

130 135 140

Glu Tyr Asp Asp Glu Glu Asp Glu Glu Leu Pro Arg Lys Lys Asn Val

145 150 155 160

Leu Asn Asp Lys Ser Lys Asn Arg Thr Ile Lys Gln Glu Lys Leu Asn

165 170 175

Glu Leu Pro Ser Pro Leu Ser Ser Asp Phe Ser Asp Val Asp Glu Glu

180 185 190

Lys Ser Thr Leu Thr His Phe Gln Leu Gln Gln Gln Gln Gln Gln Gln

195 200 205

Pro Val Asp Asn Tyr Val Ser Thr Pro Leu Ser Leu Pro Glu Asp Ser

210 215 220

Ile Asp Phe Ile Asn Pro Gly Ser Leu Lys Ile Glu Ser Asp Glu Asn

225 230 235 240

Phe Leu Leu Gly Ser Ser Thr Leu Gln Ile Lys His Glu Asn Asp Thr

245 250 255

Glu Tyr Ile Pro Thr Ala Pro Ser Gly Ser Ile Asn Asp Phe Phe Asn

260 265 270

Ser Tyr Asp Ile Ser Glu Ser Asn Arg Leu His His Pro Ala Val Met

275 280 285

Thr Asp Ser Ser Leu His Thr Thr Ala Gly Ser Ile Gly Phe Phe Ser

290 295 300

Leu Ile Arg Gly Lys Ser Phe Val Val Gly Arg Arg Ser Ser Val Gly

305 310 315 320

Val Tyr Gln Leu Thr Cys Ile Ala Ile Arg

325 330

<210> 76

<211> 299

<212> PRT

<213> 解脂耶氏酵母

<400> 76

Met Ser Ile Lys Arg Glu Glu Ser Phe Thr Pro Thr Pro Glu Asp Leu

1 5 10 15

Gly Ser Pro Leu Thr Ala Asp Ser Pro Gly Ser Pro Glu Ser Gly Asp

20 25 30

Lys Arg Lys Lys Asp Leu Thr Leu Pro Leu Pro Ala Gly Ala Leu Pro

35 40 45

Pro Arg Lys Arg Ala Lys Thr Glu Asn Glu Lys Glu Gln Arg Arg Ile

50 55 60

Glu Arg Ile Met Arg Asn Arg Gln Ala Ala His Ala Ser Arg Glu Lys

65 70 75 80

Lys Arg Arg His Leu Glu Asp Leu Glu Lys Lys Cys Ser Glu Leu Ser

85 90 95

Ser Glu Asn Asn Asp Leu His His Gln Val Thr Glu Ser Lys Lys Thr

100 105 110

Asn Met His Leu Met Glu Gln His Tyr Ser Leu Val Ala Lys Leu Gln

115 120 125

Gln Leu Ser Ser Leu Val Asn Met Ala Lys Ser Ser Gly Ala Leu Ala

130 135 140

Gly Val Asp Val Pro Asp Met Ser Asp Val Ser Met Ala Pro Lys Leu

145 150 155 160

Glu Met Pro Thr Ala Ala Pro Ser Gln Pro Met Gly Leu Ala Ser Ala

165 170 175

Pro Thr Leu Phe Asn His Asp Asn Glu Thr Val Val Pro Asp Ser Pro

180 185 190

Ile Val Lys Thr Glu Glu Val Asp Ser Thr Asn Phe Leu Leu His Thr

195 200 205

Glu Ser Ser Ser Pro Pro Glu Leu Ala Glu Ser Thr Gly Ser Gly Ser

210 215 220

Pro Ser Ser Thr Leu Ser Cys Asp Glu Thr Asp Tyr Leu Val Asp Arg

225 230 235 240

Ala Arg His Pro Ala Val Met Thr Val Ala Thr Thr Asp Gln Gln Arg

245 250 255

Arg His Lys Ile Ser Phe Ser Ser Arg Thr Ser Pro Leu Thr Thr Ser

260 265 270

Leu Asp Cys Met Asp Cys Arg Met Thr Ser Pro Cys Leu Lys Thr Thr

275 280 285

Ser Ser Leu Pro Ser Thr Thr Leu Leu Leu Ile

290 295

<210> 77

<211> 451

<212> PRT

<213> 里氏木霉

<400> 77

Met Ala Phe Gln Gln Ser Ser Pro Leu Val Lys Phe Glu Ala Ser Pro

1 5 10 15

Ala Glu Ser Phe Leu Ser Ala Pro Gly Asp Asn Phe Thr Ser Leu Phe

20 25 30

Ala Asp Ser Thr Pro Ser Thr Leu Asn Pro Arg Asp Met Met Thr Pro

35 40 45

Asp Ser Val Ala Asp Ile Asp Ser Arg Leu Ser Val Ile Pro Glu Ser

50 55 60

Gln Asp Ala Glu Asp Asp Glu Ser His Ser Thr Ser Ala Thr Ala Pro

65 70 75 80

Ser Thr Ser Glu Lys Lys Pro Val Lys Lys Arg Lys Ser Trp Gly Gln

85 90 95

Val Leu Pro Glu Pro Lys Thr Asn Leu Pro Pro Arg Lys Arg Ala Lys

100 105 110

Thr Glu Asp Glu Lys Glu Gln Arg Arg Val Glu Arg Val Leu Arg Asn

115 120 125

Arg Arg Ala Ala Gln Ser Ser Arg Glu Arg Lys Arg Leu Glu Val Glu

130 135 140

Ala Leu Glu Lys Arg Asn Lys Glu Leu Glu Thr Leu Leu Ile Asn Val

145 150 155 160

Gln Lys Thr Asn Leu Ile Leu Val Glu Glu Leu Asn Arg Phe Arg Arg

165 170 175

Ser Ser Gly Val Val Thr Arg Ser Ser Ser Pro Leu Asp Ser Leu Gln

180 185 190

Asp Ser Ile Thr Leu Ser Gln Gln Leu Phe Gly Ser Arg Asp Gly Gln

195 200 205

Thr Met Ser Asn Pro Glu Gln Ser Leu Met Asp Gln Ile Met Arg Ser

210 215 220

Ala Ala Asn Pro Thr Val Asn Pro Ala Ser Leu Ser Pro Ser Leu Pro

225 230 235 240

Pro Ile Ser Asp Lys Glu Phe Gln Thr Lys Glu Glu Asp Glu Glu Gln

245 250 255

Ala Asp Glu Asp Glu Glu Met Glu Gln Thr Trp His Glu Thr Lys Glu

260 265 270

Ala Ala Ala Ala Lys Glu Lys Asn Ser Lys Gln Ser Arg Val Ser Thr

275 280 285

Asp Ser Thr Gln Arg Pro Ala Val Ser Ile Gly Gly Asp Ala Ala Val

290 295 300

Pro Val Phe Ser Asp Asp Ala Gly Ala Asn Cys Leu Gly Leu Asp Pro

305 310 315 320

Val His Gln Asp Asp Gly Pro Phe Ser Ile Gly His Ser Phe Gly Leu

325 330 335

Ser Ala Ala Leu Asp Ala Asp Arg Tyr Leu Leu Glu Ser Gln Leu Leu

340 345 350

Ala Ser Pro Asn Ala Ser Thr Val Asp Asp Asp Tyr Leu Ala Gly Asp

355 360 365

Ser Ala Ala Cys Phe Thr Asn Pro Leu Pro Ser Asp Tyr Asp Phe Asp

370 375 380

Ile Asn Asp Phe Leu Thr Asp Asp Ala Asn His Ala Ala Tyr Asp Ile

385 390 395 400

Val Ala Ala Ser Asn Tyr Ala Ala Ala Asp Arg Glu Leu Asp Leu Glu

405 410 415

Ile His Asp Pro Glu Asn Gln Ile Pro Ser Arg His Ser Ile Gln Gln

420 425 430

Pro Gln Ser Gly Ala Ser Ser His Gly Cys Asp Asp Gly Gly Ile Ala

435 440 445

Val Gly Val

450

<210> 78

<211> 238

<212> PRT

<213> 酿酒酵母

<400> 78

Met Glu Met Thr Asp Phe Glu Leu Thr Ser Asn Ser Gln Ser Asn Leu

1 5 10 15

Ala Ile Pro Thr Asn Phe Lys Ser Thr Leu Pro Pro Arg Lys Arg Ala

20 25 30

Lys Thr Lys Glu Glu Lys Glu Gln Arg Arg Ile Glu Arg Ile Leu Arg

35 40 45

Asn Arg Arg Ala Ala His Gln Ser Arg Glu Lys Lys Arg Leu His Leu

50 55 60

Gln Tyr Leu Glu Arg Lys Cys Ser Leu Leu Glu Asn Leu Leu Asn Ser

65 70 75 80

Val Asn Leu Glu Lys Leu Ala Asp His Glu Asp Ala Leu Thr Cys Ser

85 90 95

His Asp Ala Phe Val Ala Ser Leu Asp Glu Tyr Arg Asp Phe Gln Ser

100 105 110

Thr Arg Gly Ala Ser Leu Asp Thr Arg Ala Ser Ser His Ser Ser Ser

115 120 125

Asp Thr Phe Thr Pro Ser Pro Leu Asn Cys Thr Met Glu Pro Ala Thr

130 135 140

Leu Ser Pro Lys Ser Met Arg Asp Ser Ala Ser Asp Gln Glu Thr Ser

145 150 155 160

Trp Glu Leu Gln Met Phe Lys Thr Glu Asn Val Pro Glu Ser Thr Thr

165 170 175

Leu Pro Ala Val Asp Asn Asn Asn Leu Phe Asp Ala Val Ala Ser Pro

180 185 190

Leu Ala Asp Pro Leu Cys Asp Asp Ile Ala Gly Asn Ser Leu Pro Phe

195 200 205

Asp Asn Ser Ile Asp Leu Asp Asn Trp Arg Asn Pro Glu Ala Gln Ser

210 215 220

Gly Leu Asn Ser Phe Glu Leu Asn Asp Phe Phe Ile Thr Ser

225 230 235

<210> 79

<211> 273

<212> PRT

<213> 乳酸克鲁维酵母

<400> 79

Met Thr Gly Lys Asn Ser Val Ser Asp Ile Pro Val Asn Phe Lys Pro

1 5 10 15

Thr Leu Pro Pro Arg Lys Arg Ala Lys Thr Gln Glu Glu Lys Glu Gln

20 25 30

Arg Arg Ile Glu Arg Ile Leu Arg Asn Arg Arg Ala Ala His Gln Ser

35 40 45

Arg Glu Lys Lys Arg Leu His Val Gln Arg Leu Glu Glu Lys Cys His

50 55 60

Leu Leu Glu Gly Ile Leu Lys Met Val Asp Leu Asp Ile Leu Ser Glu

65 70 75 80

Asn Asn Ala Lys Leu Ser Gly Met Val Glu Gln Trp Arg Glu Met Gln

85 90 95

Val Ser Asp Ser Gly Ser Ile Ser Ser His Asp Ser Asn Thr Gly Met

100 105 110

Leu Asp Ser Pro Glu Ser Leu Thr Ser Ser Pro Asp Lys Lys Asp His

115 120 125

Tyr Ser His Ser Ser His Ser Thr Ser Ile Ser Ser Ser Ser Ser Ser

130 135 140

Ser Ser Pro Ser Asn Leu Pro His Gly Met Val Thr Asp Asn Gly Met

145 150 155 160

Leu Asp Glu Asp Asn Asn Ser Leu Asn Tyr Ile Leu Gly Gln Gln Asn

165 170 175

Tyr Gln Leu Ser Ser Thr Pro Val Val Lys Leu Glu Glu Asp His Ser

180 185 190

Met Leu Leu Glu Asn Asn Gly Asp Ala Asp Leu Asn Asp Val Gly Ile

195 200 205

Ser Phe Ile Ala Glu Asp Gly Thr Asn Ser Asp Asn Lys Asn Ile Asp

210 215 220

Met Arg Asn Gln Glu Thr Gly Glu Gly Trp Asn Leu Leu Leu Thr Val

225 230 235 240

Pro Pro Glu Leu Asn Ser Asp Leu Ser Glu Leu Glu Pro Ser Asp Ile

245 250 255

Ile Ser Pro Ile Gly Leu Asp Thr Trp Arg Asn Pro Ala Val Ile Val

260 265 270

Thr

<210> 80

<211> 351

<212> PRT

<213> 博伊丁假丝酵母

<400> 80

Met Ser Leu Ser Asn Thr Pro Ser Ser Pro Asp Asn Ile Ser Asn Val

1 5 10 15

Ser Ala Ser Leu Ile Ser Ser Asn Leu Lys Gly Lys Thr Asp Glu Leu

20 25 30

Leu Lys Ser Ala Ser Ala Ile Gly Leu Leu Pro Pro Arg Lys Arg Ala

35 40 45

Lys Thr Ala Glu Glu Lys Glu Gln Arg Arg Val Glu Arg Ile Leu Arg

50 55 60

Asn Arg Arg Ala Ala His Ala Ser Arg Glu Lys Lys Arg Lys His Val

65 70 75 80

Glu Tyr Leu Glu Leu Tyr Val Asn Asn Leu Glu Asn Gly Ile Lys Asn

85 90 95

Tyr Ile Ser Asn Gln Glu Lys Leu Ile Asn Phe Gln Ser Leu Leu Ile

100 105 110

Ala Lys Leu Lys Val Ala Asn Val Asp Ile Ser Asp Ile Asp Leu Ser

115 120 125

Thr Cys Thr Asn Ile Asp Ile Val Ser Ile Glu Lys Pro Glu Cys Leu

130 135 140

Asn Tyr Ser Pro Asn Ser Ser Ser Lys Lys Asn Lys Lys Ser Ser Ser

145 150 155 160

Asp Asp Glu Glu Glu Glu Asp Asp Asp Asp Asp Asp Glu Asp Asp Glu

165 170 175

Asp Asp Asn Val Glu Leu Lys His Lys Ser Asn Ser Gln Lys Gln Gln

180 185 190

Gln Gln Gln Gln Lys Glu Tyr Lys Glu Val Glu Gln Ser Thr Lys Gln

195 200 205

Asp Glu Ser Lys Thr Ser Asn Gln Gln Gln Glu Gln Glu Gln Glu Gln

210 215 220

Glu Gln Val Ser Thr Pro Lys Ala Glu Leu Thr Gln Gln Leu Ser Asp

225 230 235 240

Pro Thr Met Asp Met Lys Phe Lys Ser Ala Val Lys Leu Glu Asp Val

245 250 255

Asn Gln Leu Pro Gln Asp Gln Tyr Leu Met Ser Pro Pro Asn Thr Glu

260 265 270

Ser Pro Arg Lys Phe Ile Leu Asp Ser Ser Asn Ile Asn Lys Asp Tyr

275 280 285

Thr His Ile Phe Val Gly Asp Asp Leu Leu Phe Asn Asn Asp Leu Gln

290 295 300

Leu Cys Ser Asp Ser Leu Lys Gln Gln Glu Leu Asn Val Pro Asn Ile

305 310 315 320

Glu Asn Ile Ile Ser Asp Tyr Ser Leu Asp Ser Met Asn Asp Leu Asn

325 330 335

Ala Tyr Asn Arg Leu His His Pro Ala Ala Met Val Gln Arg Tyr

340 345 350

<210> 81

<211> 342

<212> PRT

<213> 黑曲霉

<400> 81

Met Met Glu Glu Ala Phe Ser Pro Val Asp Ser Leu Ala Gly Ser Pro

1 5 10 15

Thr Pro Glu Leu Pro Leu Leu Thr Val Ser Pro Ala Asp Thr Ser Leu

20 25 30

Asp Asp Ser Ser Val Gln Ala Gly Glu Thr Lys Ala Glu Glu Lys Lys

35 40 45

Pro Val Lys Lys Arg Lys Ser Trp Gly Gln Glu Leu Pro Val Pro Lys

50 55 60

Thr Asn Leu Pro Pro Arg Lys Arg Ala Lys Thr Glu Asp Glu Lys Glu

65 70 75 80

Gln Arg Arg Ile Glu Arg Val Leu Arg Asn Arg Ala Ala Ala Gln Thr

85 90 95

Ser Arg Glu Arg Lys Arg Leu Glu Met Glu Lys Leu Glu Asn Glu Lys

100 105 110

Ile Gln Met Glu Gln Gln Asn Gln Phe Leu Leu Gln Arg Leu Ser Gln

115 120 125

Met Glu Ala Glu Asn Asn Arg Leu Asn Gln Gln Val Ala Gln Leu Ser

130 135 140

Ala Glu Val Arg Gly Ser Arg Gly Asn Thr Pro Lys Pro Gly Ser Pro

145 150 155 160

Val Ser Ala Ser Pro Thr Leu Thr Pro Thr Leu Phe Lys Gln Glu Arg

165 170 175

Asp Glu Ile Pro Leu Glu Arg Ile Pro Phe Pro Thr Pro Ser Ile Thr

180 185 190

Asp Tyr Ser Pro Thr Leu Arg Pro Ser Thr Leu Ala Glu Ser Ser Asp

195 200 205

Val Thr Gln His Pro Ala Val Ser Val Ala Gly Leu Glu Gly Glu Gly

210 215 220

Ser Ala Leu Ser Leu Phe Asp Val Gly Ser Asn Pro Glu Pro His Ala

225 230 235 240

Ala Asp Asp Leu Ala Ala Pro Leu Ser Asp Asp Asp Phe His Arg Leu

245 250 255

Phe Asn Val Asp Ser Pro Val Gly Ser Asp Ser Ser Val Leu Glu Asp

260 265 270

Gly Phe Ala Phe Asp Val Leu Asp Gly Gly Asp Leu Ser Ala Phe Pro

275 280 285

Phe Asp Ser Met Val Asp Phe Asp Pro Glu Ser Val Gly Phe Glu Gly

290 295 300

Ile Glu Pro Pro His Gly Leu Pro Asp Glu Thr Ser Arg Gln Thr Ser

305 310 315 320

Ser Val Gln Pro Ser Leu Gly Ala Ser Thr Ser Arg Cys Asp Gly Gln

325 330 335

Gly Ile Ala Ala Gly Cys

340

<210> 82

<211> 325

<212> PRT

<213> Ogataea angusta

<400> 82

Met Thr Ala Leu Asn Ser Ser Val Gln His Gln Glu Val Ser Ser Asp

1 5 10 15

Leu Pro Phe Gly Thr Leu Pro Pro Arg Lys Arg Ala Lys Thr Glu Glu

20 25 30

Glu Lys Glu Gln Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala

35 40 45

Ala His Ala Ser Arg Glu Lys Lys Arg Arg His Val Glu Tyr Leu Glu

50 55 60

Asn Tyr Val Thr Asp Leu Glu Ser Ala Leu Ala Thr His Glu Gly Asn

65 70 75 80

Tyr Arg Lys Met Ala Lys Ile Gln Ser Ser Leu Ile Ser Leu Leu Ser

85 90 95

Glu His Gly Ile Asp Tyr Ser Ser Val Asp Leu Ala Val Glu Pro Cys

100 105 110

Pro Lys Val Glu Arg Pro Glu Gly Leu Glu Leu Thr Gly Ser Ile Pro

115 120 125

Val Lys Lys Gln Lys Ile Ala Ser Ala Lys Ser Pro Lys Ser Leu Ser

130 135 140

Arg Lys Ser Lys Ser Glu Ile Pro Ser Pro Ser Phe Asp Glu Asn Ile

145 150 155 160

Phe Ser Glu Glu Glu Asn Glu His Asp Asp Gly Ile Glu Glu Tyr Gly

165 170 175

Lys Ala Gly Gln Glu Ala Thr Glu Ala Pro Ser Leu Ser His Asn Arg

180 185 190

Lys Arg Lys Ala Gln Asp Ala Tyr Ile Ser Pro Pro Gly Ser Thr Ser

195 200 205

Pro Ser Lys Leu Lys Leu Glu Glu Asp Glu Arg Ile Ser Lys His Glu

210 215 220

Tyr Ser Asn Leu Phe Asp Asp Thr Asp Asp Ile Phe Pro Ser Glu Lys

225 230 235 240

Ser Ser Ser Leu Glu Leu Tyr Lys Gln Asp Asp Leu Thr Met Ala Ser

245 250 255

Phe Val Lys Gln Glu Glu Glu Glu Met Val Pro Phe Val Lys Gln Glu

260 265 270

Asp Glu Phe Lys Phe Pro Asp Ser Gly Phe Asn Ala Asp Asp Cys His

275 280 285

Leu Ile Gln Val Glu Asp Leu Cys Ser Phe Asn Ser Val His His Pro

290 295 300

Ala Ala Ala Pro Leu Thr Ala Glu Ser Ile Asp Asn His Phe Glu Phe

305 310 315 320

Asp Asp Tyr Leu Ser

325

<210> 83

<211> 223

<212> PRT

<213> 巴斯德毕赤酵母

<400> 83

Met Ser Thr Thr Lys Pro Met Gln Val Leu Ala Pro Asp Leu Thr Glu

1 5 10 15

Thr Pro Lys Thr Tyr Ser Leu Gly Val His Leu Gly Lys Gly Lys Asp

20 25 30

Lys Leu Gln Asp Pro Thr Glu Leu Tyr Ser Met Ile Leu Asp Gly Met

35 40 45

Asp His Ser Gln Leu Asn Ser Phe Ile Asn Asp Gln Leu Asn Leu Gly

50 55 60

Ser Leu Arg Leu Pro Ala Asn Pro Pro Ala Ala Ser Gly Ala Lys Arg

65 70 75 80

Gly Ala Asn Val Ser Ser Ile Asn Met Asp Asp Leu Gln Thr Phe Asp

85 90 95

Phe Asn Phe Asp Tyr Glu Arg Asp Ser Ser Pro Leu Glu Leu Asn Met

100 105 110

Asp Ser Gln Ser Leu Met Phe Ser Ser Pro Glu Lys Ala Pro Cys Gly

115 120 125

Ser Leu Pro Ser Gln His Gln Pro His Ser Gln Val Ala Ala Ala Gln

130 135 140

Gly Thr Thr Ile Asn Pro Arg Gln Leu Ser Thr Ser Ser Ala Ser Ser

145 150 155 160

Phe Val Ser Ser Asp Phe Asp Val Asp Ser Leu Leu Ala Asp Glu Tyr

165 170 175

Ala Glu Lys Leu Glu Tyr Gly Ala Ile Ser Ser Ala Ser Ser Ser Ile

180 185 190

Cys Ser Asn Ser Val Leu Pro Ser Gln Gly Val Thr Ser Gln His Ser

195 200 205

Ser Pro Ile Glu Gln Arg Pro Arg Val Gly Asn Ser Lys Arg Leu

210 215 220

<210> 84

<211> 42

<212> PRT

<213> 人工序列

<220>

<223> synthetic transcription activator domain (VP64)

<400> 84

Gly Gly Gly Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu

1 5 10 15

Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp

20 25 30

Ala Leu Asp Asp Phe Asp Leu Asp Met Leu

35 40

<210> 85

<211> 14

<212> PRT

<213> 巴斯德毕赤酵母

<400> 85

Glu Pro Arg Lys Lys Glu Thr Lys Gln Arg Lys Arg Ala Lys

1 5 10

<210> 86

<211> 7

<212> PRT

<213> 人工序列

<220>

<223> nuclear localization signal of synMSN4

<400> 86

Pro Lys Lys Lys Arg Lys Val

1 5

<210> 87

<211> 54

<212> PRT

<213> 人工序列

<220>

<223> 共有序列

<220>

<221> MISC_FEATURE

<222> (10)..(10)

<223> 位置10处的K可以与R互换

<220>

<221> MISC_FEATURE

<222> (11)..(11)

<223> 位置11处的R可以与K互换

<220>

<221> MISC_FEATURE

<222> (15)..(15)

<223> Xaa可以是Q或S

<220>

<221> MISC_FEATURE

<222> (19)..(19)

<223> 位置19处的K可以与R互换

<220>

<221> misc_feature

<222> (22)..(22)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> MISC_FEATURE

<222> (25)..(25)

<223> Xaa可是是V或L

<220>

<221> MISC_FEATURE

<222> (27)..(27)

<223> 位置27处的S可以与T互换

<220>

<221> misc_feature

<222> (28)..(28)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> MISC_FEATURE

<222> (30)..(30)

<223> 位置30处的K可以与R互换

<220>

<221> misc_feature

<222> (33)..(33)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> misc_feature

<222> (35)..(36)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> misc_feature

<222> (38)..(38)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> MISC_FEATURE

<222> (40)..(40)

<223> 位置40处的K可以与R互换

<220>

<221> MISC_FEATURE

<222> (44)..(44)

<223> 位置44处的S可以与T互换

<220>

<221> misc_feature

<222> (48)..(48)

<223> Xaa可以是任何天然存在的氨基酸

<220>

<221> MISC_FEATURE

<222> (52)..(52)

<223> 位置52处的R可以与K互换

<400> 87

Lys Pro Phe Val Cys Thr Leu Cys Ser Lys Arg Phe Arg Arg Xaa Glu

1 5 10 15

His Leu Lys Arg His Xaa Arg Ser Xaa His Ser Xaa Glu Lys Pro Phe

20 25 30

Xaa Cys Xaa Xaa Cys Xaa Lys Lys Phe Ser Arg Ser Asp Asn Leu Xaa

35 40 45

Gln His Leu Arg Thr His

50

<210> 88

<211> 1098

<212> DNA

<213> 巴斯德毕赤酵母

<400> 88

gataggtctc tcatgtctac aacaaaacca atgcaggtgt tagccccgga ccttactgag 60

acaccaaaga catattcgtt aggtgtccat ttggggaaag gcaaggacaa actccaggat 120

ccgacagaac tctactcgat gatcctagat ggaatggatc actcacagct caattctttt 180

attaacgatc agttgaactt gggatcattg cgcttgccgg cgaatcctcc tgctgcaagt 240

ggtgctaaac ggggtgcaaa tgtcagttct atcaacatgg atgatttaca aacgtttgat 300

ttcaactttg attacgaacg ggattcatcg ccgctagaat tgaacatgga ttctcaatct 360

ttgatgtttt cctctccaga gaaagctccc tgtggctcct tgccgtctca gcatcagcct 420

cactctcagg tcgcagccgc acagggaact accatcaatc caaggcagtt atccacatct 480

tctgccagta gctttgtatc ttcggatttt gatgttgatt cactcctggc agacgagtac 540

gctgagaaac tagaatatgg agccatatca tctgcctcat cttccatctg ttcgaattct 600

gttcttccta gccagggcgt aacttcgcaa catagctctc ctatagaaca aagacctcgt 660

gtgggaaatt ccaaacgctt gagtgatttt tggatgcagg acgaagctgt cactgccatt 720

tccacctggc tcaaagctga aataccttcc tccttggcta cgccggctcc tacagtcaca 780

caaataagta gtcccagcct tagcacccca gagccaagga agaaagaaac aaaacaaaga 840

aagagggcaa agtccataga cacgaatgag cgatctgaac aagtagcagc ttctaattca 900

gatgatgaaa agcaattccg ctgcacggat tgcagtagac gcttccgcag atcagaacac 960

ctgaaacgac atcataggtc tgttcattct aacgaaaggc cgttccattg tgctcactgt 1020

gataaacggt tctcaagaag cgacaacttg tcgcagcatc tacgtactca ccgtaagcag 1080

tgagcttaga gacctatc 1098

<210> 89

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物PP7435_Chr2-0555

<400> 89

gataggtctc tcatgtctac aacaaaacca atgcag 36

<210> 90

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物PP7435_Chr2-0555反向

<400> 90

gataggtctc taagctcact gcttacggtg agtac 35

<210> 91

<211> 469

<212> DNA

<213> 人工序列

<220>

<223> synMSN4

<400> 91

gatctaggtc tcacatgggt aagccaattc ctaacccatt gttgggtttg gattctactc 60

caaaaaagaa gagaaaggtt ggtggaggtg gatctgatgc ccttgacgat tttgacttgg 120

acatgttggg ttctgacgct ttggatgact ttgatcttga tatgcttggt tccgacgctc 180

tagatgattt cgacttggat atgctgggat ccgatgcctt ggacgatttc gacttggata 240

tgttgggtgg aggtggatct aattcagatg atgaaaagca attccgctgc acggattgca 300

gtagacgctt ccgcagatca gaacacctga aacgacatca taggtctgtt cattctaacg 360

aaaggccgtt ccattgtgct cactgtgata aacggttctc aagaagcgac aacttgtcgc 420

agcatctacg tactcaccgt aagcagtgat aggcttcgag accaatgac 469

<210> 92

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物syMSN4

<400> 92

gatctaggtc tcacatgggt aagccaattc ctaacc 36

<210> 93

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物synMSN4反向

<400> 93

gtcattggtc tcgaagccta tcactgctta cggtgag 37

<210> 94

<211> 2142

<212> DNA

<213> 酿酒酵母

<400> 94

gataggtctc gcatgacggt cgaccatgat ttcaatagcg aagatatttt attccccata 60

gaaagcatga gtagtataca atacgtggag aataataacc caaataatat taacaacgat 120

gttatcccgt attctctaga tatcaaaaac actgtcttag atagtgcgga tctcaatgac 180

attcaaaatc aagaaacttc actgaatttg gggcttcctc cactatcttt cgactctcca 240

ctgcccgtaa cggaaacgat accatccact accgataaca gcttgcattt gaaagctgat 300

agcaacaaaa atcgcgatgc aagaactatt gaaaatgata gtgaaattaa gagtactaat 360

aatgctagtg gctctggggc aaatcaatac acaactctta cttcacctta tcctatgaac 420

gacattttgt acaacatgaa caatccgtta caatcaccgt caccttcatc ggtacctcaa 480

aatccgacta taaatcctcc cataaataca gcaagtaacg aaactaattt atcgcctcaa 540

acttcaaatg gtaatgaaac tcttatatct cctcgagccc aacaacatac gtccattaaa 600

gataatcgtc tgtccttacc taatggtgct aattcgaatc ttttcattga cactaaccca 660

aacaatttga acgaaaaact aagaaatcaa ttgaactcag atacaaattc atattctaac 720

tccatttcta attcaaactc caattctacg ggtaatttaa attccagtta ttttaattca 780

ctgaacatag actccatgct agatgattac gtttctagtg atctcttatt gaatgatgat 840

gatgatgaca ctaatttatc acgccgaaga tttagcgacg ttataacaaa ccaatttccg 900

tcaatgacaa attcgaggaa ttctatttct cactctttgg acctttggaa ccatccgaaa 960

attaatccaa gcaatagaaa tacaaatctc aatatcacta ctaattctac ctcaagttcc 1020

aatgcaagtc cgaataccac tactatgaac gcaaatgcag actcaaatat tgctggcaac 1080

ccgaaaaaca atgacgctac catagacaat gagttgacac agattcttaa cgaatataat 1140

atgaacttca acgataattt gggcacatcc acttctggca agaacaaatc tgcttgccca 1200

agttcttttg atgccaatgc tatgacaaag ataaatccaa gtcagcaatt acagcaacag 1260

ctaaaccgag ttcaacacaa gcagctcacc tcgtcacata ataacagtag cactaacatg 1320

aaatccttca acagcgatct ttattcaaga aggcaaagag cttctttacc cataatcgat 1380

gattcactaa gctacgacct ggttaataag caggatgaag atcccaagaa cgatatgctg 1440

ccgaattcaa atttgagttc atctcaacaa tttatcaaac cgtctatgat tctttcagac 1500

aatgcgtccg ttattgcgaa agtggcgact acaggcttga gtaatgatat gccatttttg 1560

acagaggaag gtgaacaaaa tgctaattct actccaaatt tcgatctttc catcactcaa 1620

atgaatatgg ctccattatc gcctgcatca tcatcctcca cgtctcttgc aacaaatcat 1680

ttctatcacc atttcccaca gcagggtcac cataccatga actctaaaat cggttcttcc 1740

cttcggaggc ggaagtctgc tgtgcctttg atgggtacgg tgccgcttac aaatcaacaa 1800

aataatataa gcagtagtag tgtcaactca actggcaatg gtgctggggt tacgaaggaa 1860

agaaggccaa gttacaggag aaaatcaatg acaccgtcca gaagatcaag tgtcgtaata 1920

gaatcaacaa aggaactcga ggagaaaccg ttccactgtc acatttgtcc caagagcttt 1980

aagcgcagcg aacatttgaa aaggcatgtg agatctgttc actctaacga acgaccattt 2040

gcttgtcaca tatgcgataa gaaatttagt agaagcgata atttgtcgca acacatcaag 2100

actcataaaa aacatggaga catttaagct tggagaccta tc 2142

<210> 95

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物YMR037C

<400> 95

gataggtctc gcatgacggt cgaccatg 28

<210> 96

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物YMR037C反向

<400> 96

gataggtctc caagcttaaa tgtctccatg ttttttatga gt 42

<210> 97

<211> 1920

<212> DNA

<213> 酿酒酵母

<400> 97

gactggtctc acatgctagt ctttggacct aatagtagtt tcgttcgtca cgcaaacaag 60

aaacaagaag attcgtctat aatgaacgag ccaaacggat tgatggaccc ggtattgagc 120

acaaccaacg tttctgctac ttcttctaat gacaattctg cgaacaatag catatcttcg 180

ccggaatata cctttggtca attctcaatg gattctccgc atagaacgga cgccactaat 240

actccaattt taacagcgac aactaatacg actgctaata atagtttaat gaatttaaag 300

gataccgcca gtttagctac caactggaag tggaaaaatt ccaataacgc acagttcgtg 360

aatgacggtg agaaacaaag cagtaatgct aatggtaaga aaaatggtgg tgataagata 420

tatagttcag tagccacccc tcaagcttta aatgacgaat tgaaaaactt ggagcaacta 480

gaaaaggtat tttctccaat gaatcctatc aatgacagtc attttaatga aaatatagaa 540

ttatcgccac accaacatgc aacttctccc aagacaaacc ttcttgaggc agaaccttca 600

atatattcca atttgtttct agatgctagg ttaccaaaca acgccaacag tacaacagga 660

ttgaacgaca atgattataa tctagacgat accaataatg ataatactaa tagcatgcaa 720

tcaatcttag aggattttgt atcttcagaa gaagcattga agttcatgcc ggacgctggt 780

cgcgacgcaa gaagatacag cgaggtggtt acctcttcct ttccttctat gacggattct 840

agaaattcga tctctcattc gatagagttt tggaatctca atcacaaaaa tagtagcaac 900

agtaaaccca ctcaacaaat tatccctgaa ggtactgcca ctactgagag gcgtggatca 960

accatttcac ctactaccac tataaacaac tctaatccaa acttcaaatt attagatcat 1020

gacgtttctc aagctctgag cggttatagt atggattttt ctaaggactc tggtataaca 1080

aagccaaaaa gcatttcctc ttctttaaat cgcatctccc atagcagtag caccacaagg 1140

caacagcgtg cctctttgcc cttaattcat gatattgaat cttttgcaaa tgattcggtg 1200

atggcaaatc ctctgtctga ttccgcatca tttctttcag aagaaaatga agatgatgct 1260

tttggtgcgc taaattacaa tagcttagat gcaaccacaa tgtcggcatt cgacaataac 1320

gtagacccct tcaacattct caagtcatct ccggctcagg atcaacagtt tatcaaaccc 1380

tctatgatgt tgtcggataa tgcctctgct gccgctaaat tggcgacttc tggtgttgat 1440

aatatcacac ctacaccagc tttccaaaga agaagctatg atatctcgat gaactcttcg 1500

ttcaaaatac ttcctactag tcaagctcac catgcagctc aacatcatca acaacaacct 1560

actaaacagg caacggtaag cccaaacaca agaagaagaa agtcgtcaag tgttacttta 1620

agtccaacta tttctcataa caacaacaat ggtaaggttc ctgtccaacc tcggaaaagg 1680

aaatctatta ctaccattga ccccaacaac tacgataaaa ataaaccttt caagtgtaaa 1740

gactgtgaga aggcattcag acgcagtgag cacttgaaaa ggcatataag atccgttcat 1800

tcaacggaac gcccttttgc ttgtatgttc tgtgagaaaa aattcagtag aagtgacaat 1860

ttatcacaac atctaaaaac tcacaaaaag cacggtgatt tttgagcttg gagacctatc 1920

<210> 98

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物YKL062W

<400> 98

gactggtctc acatgctagt ctttggacct aatagtag 38

<210> 99

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物YKL062W反向

<400> 99

gataggtctc caagctcaaa aatcaccgtg ctt 33

<210> 100

<211> 885

<212> DNA

<213> 解脂耶氏酵母

<400> 100

gataggtctc acatggacct cgaattggaa attcccgtct tgcattccat ggactcgcac 60

caccaggtgg tggactccca cagactggca cagcaacagt tccagtacca gcagatccac 120

atgctgcagc agacgctgtc acagcagtac ccccacaccc catccaccac accccccatt 180

tacatgctgt cgcctgcgga ctacgagaag gacgccgttt ccatctcacc ggtaatgctg 240

tggcccccct cggcccactc ccaggcctct taccattacg agatgccctc cgttatctcg 300

ccatctcctt ctcccactag atccttctgt aatccgagag agctggaggt tcaggacgag 360

ctcgagcagc ttgaacagca gcccgccgct ctctccgtcg aacatctgtt tgacattgag 420

aactcatcga tcgagtatgc acacgacgag ctgcatgaca cctcttcgtg ctccgactcg 480

cagtcgagct tttcccctca gcagtcccct gcctccccgg cctccactta ctcgcctctc 540

gaggacgagt ttctcaactt ggctggatcc gagttgaaga gcgagcccag cgcggacgac 600

gagaaggatg atgtggacac ggagcttccc cagcagcccg agatcatcat ccctgtgtcg 660

tgccgaggcc gaaagccgtc catcgacgac tccaaaaaga cttttgtctg cacccactgc 720

cagcgtcggt tccggcgcca ggagcatctc aagcgacatt tccgatccct acacactcga 780

gagaagcctt tcaactgcga cacgtgcggc aagaagtttt ctcggtcgga caatctcgcc 840

cagcatatgc gtacgcatcc tcgggactag gctttgagac cagtc 885

<210> 101

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物YALI0B21582

<400> 101

gataggtctc acatggacct cgaattgga 29

<210> 102

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物YALI0B21582反向

<400> 102

gactggtctc aaagcctagt cccgaggatg c 31

<210> 103

<211> 2001

<212> DNA

<213> 黑曲霉

<400> 103

gataggtctc acatggacgg aacatacacc atggcaccta cttcggtgca aggtcaacca 60

tcatttgcat actacgctga ttcgcagcaa agacaacatt tcaccagcca cccctcagat 120

atgcagtcat actatggcca agtgcaggcc ttccagcaac aaccacagca ctgcatgccg 180

gagcagcaga cactctacac tgcccctctc atgaacatgc accagatggc taccaccaat 240

gccttccgtg gtgccatgaa catgactccc attgcctctc ctcagccgtc acacctcaag 300

cccacaattg ttgtgcagca gggctctccc gccctgatgc ctctggacac gaggttcgtc 360

ggtaacgact actacgcatt cccctccacc ccaccactct ccacagctgg aagctctatc 420

agcagcccgc cttctaccag cggcaccctt cacaccccga tcaatgacag cttcttcgct 480

ttcgagaagg tggaaggtgt caaggaggga tgcgagggag acgtccatgc agagattctg 540

gccaatgctg actgggcccg gtctgactcg ccgcctctta cacctggtaa gtcattatct 600

aacccgatgt ccctttttta catggttgca agataggctg cagggagtgg gtgcagccaa 660

cggaaaaggc acggggccgg gcatctaggg ttgtacaggg agactaactc gacttgttct 720

agtgttcatc catccgcctt ccctcaccgc cagccaaaca tccgagcttc tgtcagcgca 780

cagctcttgc ccatcccttt ccccatcgcc atctcccgtg gtccccacat tcgttgccca 840

gcctcaaggt ctgccgaccg agcagtccag ctccgacttc tgtgaccccc gtcagctgac 900

ggttgagtcc tccatcaatg ccacccctgc tgagctgccg cctctgccca cgctctcctg 960

cgatgacgag gagcctcggg tggttctggg cagcgaggcc gtgacccttc ctgtccatga 1020

aaccctctct cccgccttca cctgctcctc ttcggaggac cctctcagca gcctgccgac 1080

ctttgacagc ttctcggacc tggactcgga agatgaattc gtcaaccgcc tggtcgactt 1140

cccccctagt ggcaatgcct actacttggg tgagaagagg cagcgcgtgg gaacgacata 1200

cccccttgag gaagaggaat tcttcagtga gcagagcttc gacgagtctg acgagcaaga 1260

tctctctcag tccagtctcc cttacctggg aagccacgac ttcactggcg tccagacgaa 1320

catcaatgaa gcttcggaag agatgggcaa caagaagagg aacaaccgca agtcgctgaa 1380

gcgggctagt acctcggaca gcgaaacgga ttcgattagc aagaagtcgc agccttcgat 1440

caacagccgt gccaccagca ctgagacaaa cgcctcgaca ccccagactg tccaggcccg 1500

ccacaactcc gatgcgcatt cgtcgtgcgc ttctgaggct cctgctgccc ccgtctcggt 1560

caaccgacgc ggtcgtaagc agtccctgac ggatgacccc tccaagacct tcgtgtgcac 1620

cctctgctcc cgtcgcttcc gtcgccaaga gcacctcaag cgtcactacc gctctctcca 1680

cactcaggac aagcctttcg agtgcaatga gtgcggtaag aagttctcgc ggagcgataa 1740

ccttgcgcag cacgctcgca ctcatgcggg tggctctgtc gtgatgggcg tcatcgacac 1800

cggcaatgcg accccgccaa ccccctatga agaacgagat cccagtacgc tgggaaatgt 1860

tctctacgag gccgccaacg ccgccgctac caagtccaca accagtgagt cggatgagag 1920

ttcctctgac tcgccggttg ccgaccgacg ggcgcccaag aagcgcaagc gcgacagcga 1980

tgcctaggct tggagaccat c 2001

<210> 104

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物An04g03980

<400> 104

gataggtctc acatggacgg aacatacacc 30

<210> 105

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物An04g03980反向

<400> 105

gatggtctcc aagcctaggc atcgctgtc 29

<210> 106

<211> 2068

<212> DNA

<213> 巴斯德毕赤酵母

<400> 106

gatctaggtc tcccatgctg tcgttaaaac catcttggct gactttggcg gcattaatgt 60

atgccatgct attggtcgta gtgccatttg ctaaacctgt tagagctgac gatgtcgaat 120

cttatggaac agtgattggt atcgatttgg gtaccacgta ctcttgtgtc ggtgtgatga 180

agtcgggtcg tgtagaaatt cttgctaatg accaaggtaa cagaatcact ccttcctacg 240

ttagtttcac tgaagatgag agactggttg gtgatgctgc taagaactta gctgcttcta 300

acccaaaaaa caccatcttt gatattaaga gattgatcgg tatgaagtat gatgccccag 360

aggtccaaag agacttgaag cgtctgcctt acactgtcaa gagcaagaac ggccaacctg 420

tcgtttctgt cgagtacaag ggtgaggaga agtctttcac tcctgaggag atttccgcca 480

tggtcttggg taagatgaag ttgatcgctg aggactactt aggaaagaaa gtcactcatg 540

ctgtcgttac cgttccagcc tacttcaacg acgctcaacg tcaagccact aaggatgccg 600

gtctaatcgc cggtttgact gttctgagaa ttgtgaacga gcctaccgcc gctgcccttg 660

cttacggttt ggacaagact ggtgaggaaa gacagatcat cgtctacgac ttgggtggag 720

gaaccttcga tgtttctctg ctttctattg agggtggtgc tttcgaggtt cttgctaccg 780

ccggtgacac ccacttgggt ggtgaggact ttgactacag agttgttcgc cacttcgtta 840

agattttcaa gaagaagcat aacattgaca tcagcaacaa tgataaggct ttaggtaagc 900

tgaagagaga ggtcgaaaag gccaagcgta ctttgtcctc ccagatgact accagaattg 960

agattgactc tttcgtcgac ggtatcgact tctctgagca actgtctaga gctaagtttg 1020

aggagatcaa cattgaatta ttcaagaaaa cactgaaacc agttgaacaa gtcctcaaag 1080

acgctggtgt caagaaatct gaaattgatg acattgtctt ggttggtggt tctaccagaa 1140

ttccaaaggt tcaacaatta ttggaggatt actttgacgg aaagaaggct tctaagggaa 1200

ttaacccaga tgaagctgtc gcatacggtg ctgctgttca ggctggtgtt ttgtctggtg 1260

aggaaggtgt cgatgacatc gtcttgcttg atgtgaaccc cctaactctg ggtatcgaga 1320

ctactggtgg cgttatgact accttaatca acagaaacac tgctatccca actaagaaat 1380

ctcaaatttt ctccactgct gctgacaacc agccaactgt gttgattcaa gtttatgagg 1440

gtgagagagc cttggctaag gacaacaact tgcttggtaa attcgagctg actggtattc 1500

caccagctcc aagaggtact cctcaagttg aggttacttt tgttttagac gctaacggaa 1560

ttttgaaggt gtctgccacc gataagggaa ctggaaaatc cgagtccatc accatcaaca 1620

atgatcgtgg tagattgtcc aaggaggagg ttgaccgtat ggttgaagag gccgagaagt 1680

acgccgctga ggatgctgca ctaagagaaa agattgaggc tagaaacgct ctggagaact 1740

acgctcattc ccttaggaac caagttactg atgactctga aaccgggctt ggttctaaat 1800

tggacgagga cgacaaagag acattgacag atgccatcaa agatacccta gagttcttgg 1860

aagataactt cgacaccgca accaaggaag aattagacga acaaagagaa aagctttcca 1920

agattgctta cccaatcact tctaagctat acggtgctcc agagggtggt actccacctg 1980

gtggtcaagg ttttgacgat gatgatggag actttgacta cgactatgac tatgatcatg 2040

atgagttgta agcttggaga ccaatgac 2068

<210> 107

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物PP7435_Chr2-1167

<400> 107

gatctaggtc tcccatgctg tcgttaaaac catct 35

<210> 108

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物PP7435_Chr2-1167反向

<400> 108

gtcattggtc tccaagctta caactcatca tgatcatagt catag 45

<210> 109

<211> 949

<212> DNA

<213> 巴斯德毕赤酵母

<400> 109

gatctaggtc tcacatgccc gtagattctt ctcataagac agctagccca cttccacctc 60

gtaaaagagc aaagacggaa gaagaaaagg agcagcgtcg agtggaacgt atcctacgta 120

ataggagagc ggcccatgct tccagagaga agaaacgtag acacgttgaa tttctggaaa 180

accacgtcgt cgacctggaa tctgcacttc aagaatcagc caaagccact aacaagttga 240

aagaaataca agatatcatt gtttcaaggt tggaagcctt aggtggtacc gtctcagatt 300

tggatttaac agttccggaa gtcgattttc ccaaatcttc tgatttggaa cccatgtctg 360

atctctcaac ttcttcgaaa tcggagaaag catctacatc cactcgcaga tctttgactg 420

aggatctgga cgaagatgac gtcgctgaat atgacgacga agaagaggac gaagagttac 480

ccaggaaaat gaaagtctta aacgacaaaa acaagagcac atctatcaag caggagaagt 540

tgaatgaact tccatctcct ttgtcatccg atttttcaga cgtagatgaa gaaaagtcaa 600

ctctcacaca tttaaagttg caacagcaac aacaacaacc agtagacaat tatgtttcta 660

ctcctttgag tctgccggag gattcagttg attttattaa cccaggtaac ttaaaaatag 720

agtccgatga gaacttcttg ttgagttcaa atactttaca aataaaacac gaaaatgaca 780

ccgactacat tactacagct ccatcaggtt ccatcaatga tttttttaat tcttatgaca 840

ttagcgagtc gaatcggttg catcatccag cagcaccatt taccgctaat gcatttgatt 900

taaatgactt tgtattcttc caggaatagt aggcttcgag accaatgac 949

<210> 110

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物PP7435_Chr1-0700

<400> 110

gatctaggtc tcacatgccc gtagattctt ctc 33

<210> 111

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物PP7435_Chr1-0700反向

<400> 111

gtcattggtc tcgaagccta ctattcctgg aagaatacaa ag 42

<210> 112

<211> 918

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的HAC1

<400> 112

atgccagttg atagttcgca caagactgct tctccactgc cacctagaaa gagagctaag 60

actgaggagg aaaaggagca acgtagagtc gagagaatcc tgagaaaccg tagagccgct 120

cacgcctcta gagagaaaaa gagaaggcat gttgaatttc ttgaaaacca cgtcgtcgat 180

ctcgaatctg cccttcaaga gtcagctaaa gctaccaaca agctaaagga aattcaagac 240

attatcgtat ctagactgga ggcacttggt ggtactgttt ctgacctgga tcttacagtt 300

ccagaagttg acttcccaaa atccagtgat ctagaaccta tgtctgatct atctacctca 360

agcaagtctg agaaggcaag cacgtcaacc agacgttccc taactgagga cctggacgaa 420

gatgatgtcg ctgaatacga tgacgaggag gaggatgagg aactgcctag aaaaatgaag 480

gttcttaacg acaaaaacaa gtctacctct atcaaacagg aaaagctcaa cgaactccca 540

tcccctctct cttccgactt ctccgacgtg gacgaggaaa agtctacttt gacccacctg 600

aagttgcaac aacaacagca acaacctgtt gacaactatg tctccactcc tctctcactc 660

ccagaggact cggttgactt catcaacccc ggtaacctta agattgaatc tgacgagaac 720

ttccttctat cctctaatac cttacagatt aagcatgaaa atgatactga ctacattact 780

accgctccat ccggatctat caatgacttc ttcaattctt acgacatttc tgagtccaac 840

agattgcacc acccagctgc accttttaca gccaacgctt ttgacctaaa cgacttcgtg 900

tttttccagg agtaatag 918

<210> 113

<211> 2716

<212> DNA

<213> 巴斯德毕赤酵母

<400> 113

gatctaggtc tcccatgaga acacaaaaga tagtaacagt actttgtttg ctactaaata 60

ctgtgcttgg agctctgttg ggcatcgatt atggtcaaga gtttactaag gctgtcctag 120

tggctcctgg tgtccctttt gaagttatct tgactccaga ctccaaacgt aaagataatt 180

caatgatggc catcaaggaa aattccaaag gtgaaattga gagatattat ggatcctcag 240

ctagttctgt ttgtatcaga aaccctgaaa cttgcttgaa tcatctgaag tcattgatag 300

gtgtttcaat tgatgacgtt tcaactatag attacaagaa gtaccattca ggtgctgaga 360

tggttccatc caaaaataac aggaacacgg ttgcctttaa gttgggctct tctgtatatc 420

ctgtagaaga gatacttgct atgagtttag atgacattaa atctagagct gaagatcatt 480

taaaacacgc ggtgccaggt tcctattcag ttatcagtga tgctgtcatc acagtaccca 540

ctttttttac ccaatcgcaa agactggcct tgaaagatgc tgccgaaatt agtggcttaa 600

aagtcgttgg cttggttgat gacggtatat ctgtggccgt taactatgcc tcttcaaggc 660

agttcaatgg agacaaacaa tatcatatga tctatgacat gggggctggt tctttacagg 720

cgactttggt ttctatatct tccagtgatg atggtggaat tgttattgat gtagaggcta 780

ttgcctatga caagtcgctg ggaggccagt tgttcacaca atctgtttat gacatccttt 840

tgcagaagtt cttgtctgag catccttcct ttagcgagtc cgacttcaac aagaatagta 900

aatctatgtc aaaactttgg caagcggctg aaaaggcaaa gacaattttg agtgcaaaca 960

ctgacacaag agtttccgtt gaatccttat acaatgacat tgactttaga gccacaatag 1020

caagagacga attcgaagat tacaatgcag agcatgttca taggatcact gctcctatca 1080

tcgaggcctt aagtcatcca ttgaatggga atctgacgtc accttttcca ctgaccagtt 1140

taagttcagt aattctcaca ggcgggtcaa caagagtgcc gatggtgaaa aagcacctag 1200

aatctttgct aggatctgaa ttgattgcaa agaatgttaa cgctgatgag tcagccgttt 1260

ttggttctac tctccgtggt gtaactttat cgcaaatgtt caaagcgaaa cagatgaccg 1320

taaatgaaag aagtgtatat gactattgcc taaaagttgg ttcttcagag ataaacgtgt 1380

tcccagttgg cacccctctt gctactaaga aagtggtcga gctggaaaat gtagacagtg 1440

agaaccagct cacgattggg ctctacgaga acggacaatt gtttgccagt catgaggtta 1500

cagacctcaa gaagagtatc aaatctctaa ctcaagaagg taaagagtgt tctaatatta 1560

attacgaggc tacagtcgag ttatctgaga gcagattgct ttctttaact cgtctgcagg 1620

ccaaatgtgc tgacgaggct gaatatttac ctcctgtgga cacagagtct gaggatacta 1680

aatctgaaaa ctcaactact agtgagacta ttgaaaaacc aaacaagaag ctattctatc 1740

ctgtgactat acctactcaa ctgaaatccg ttcacgtgaa accaatgggg tcctctacca 1800

aggtatcttc atctttgaaa atcaaggagt tgaacaagaa ggatgctgta aagagatcga 1860

tcgaagaatt gaagaatcag ctggaatcga aattataccg cgtgcgctcg tatttagagg 1920

atgaggaagt ggttgaaaaa gggccagcat cacaagttga ggctttgtca acactggttg 1980

ctgagaatct tgagtggttg gactatgata gcgacgatgc atcagcaaaa gatatcaggg 2040

aaaaactaaa ttctgtgtca gatagtgttg ccttcatcaa gagctacatt gatctgaacg 2100

atgtcacttt tgataataat cttttcacta cgatttacaa cactacttta aactccatgc 2160

aaaatgttca agaactaatg ttaaacatga gtgaggatgc tctgagttta atgcagcagt 2220

atgagaagga aggtttagac ttcgccaaag aaagtcaaaa gatcaaaata aaatctcctc 2280

ctttatcaga caaagagctt gataatctct ttaacactgt taccgaaaag ttagagcatg 2340

tcagaatgtt gactgaaaag gacactataa gtgatttgcc tagagaggag ctttttaagc 2400

tgtatcaaga attgcagaac tactcttccc gatttgaagc aatcatggcc agtttggaag 2460

atgtacactc tcaaagaatc aaccgtttga cagacaagtt acgcaaacat attgaaaggg 2520

tgagcaatga agcattgaag gcagctctca aggaagctaa acgtcaacaa gaggaggaaa 2580

aaagccacga gcagaatgag ggagaagagc aaagttctgc ttccacttct cacactaatg 2640

aagatataga ggaaccatca gaatcgccta aggttcaaac atcccatgat gagttgtaag 2700

cttggagacc aatgac 2716

<210> 114

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物PP7435_Chr1-0059

<400> 114

gatctaggtc tcccatgaga acacaaaaga tagtaacagt ac 42

<210> 115

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物PP7435_Chr1-0059反向

<400> 115

gtcattggtc tccaagctta caactcatca tgggatgttt 40

<210> 116

<211> 1150

<212> DNA

<213> 巴斯德毕赤酵母

<400> 116

gatctaggtc tcccatgaaa gtgacattat ctgtgttagc tattgcctcc caattggtta 60

gaatcgtttg ttcggaagga gaaaatatct gcataggtga ccagtgctat ccgaagaatt 120

ttgaacctga caaggagtgg aaacctgttc aggaaggcca gattatccct ccaggatcac 180

acgtaagaat ggactttaat acacaccaga gagaggcaaa actggtggaa gagaatgagg 240

atatagaccc ctcatcattg ggagtggctg tagtggattc caccggttcg tttgctgatg 300

atcaatcttt ggaaaagatt gagggacttt ccatggaaca actagatgag aagttagaag 360

aactgattga gctttcccat gactacgagt acggatcaga cataatcttg agtgatcagt 420

atatttttgg agtagccggg ctagttccta ctaagacaaa gtttacttct gagttgaagg 480

aaaaggcctt gagaattgtc ggatcatgct tgagaaacaa tgccgatgcg gtagagaaac 540

tactgggaac tgttccaaat actataacca tacaattcat gtcaaaccta gtgggtaaag 600

taaattccac tggagagaat gttgactctg ttgaacagaa acgaatcctt tcaattattg 660

gagctgttat tcctttcaaa attggaaagg tattgtttga agcttgttcg ggaacgcaga 720

agctattact atccttggat aaactggaaa gttcagttca actgagagga taccaaatgt 780

tggacgactt cattcatcac cctgaagagg aacttctctc ttcattgaca gcaaaggaac 840

gattagtaaa gcatattgag ttgattcaat cattttttgc atcaggaaag cattctcttg 900

atatagcaat aaatcgtgag ttattcacta ggctgattgc cttacgaacc aatttagaat 960

ctgccaatcc aaatctatgt aaaccatcaa ctgacttttt gaactggctg atcgacgaaa 1020

ttgaagctac gaaagatacc gatccacact tttcaaaaga gcttaaacat ttacgttttg 1080

aactttttgg gaacccattg gcatctagga aaggtttctc cgatgagtta taagcttgga 1140

gaccaatgac 1150

<210> 117

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物PP7435_Chr1-0550

<400> 117

gatctaggtc tcccatgaaa gtgacattat ctgtgttagc 40

<210> 118

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物PP7435_Chr1-0550反向

<400> 118

gtcattggtc tccaagctta taactcatcg gagaaacctt tc 42

<210> 119

<211> 931

<212> DNA

<213> 巴斯德毕赤酵母

<400> 119

gatctaggtc tcccatgaaa ctacaccttg tgattctctg tttgatcact gctgtctact 60

gtttcagtgc tgttgacaga gaaatctttc agctcaacca tgaattacgc caggaatacg 120

gagataattt taatttctat gaatggttga agcttccaaa aggtccctcg tccacgtttg 180

aagatatcga caacgcgtac aagaaactat cccgtaagtt acaccccgat aagataagac 240

agaagaaact atcccaggaa caatttgagc aattgaagaa aaaggctacc gaaagatacc 300

aacaattgag tgctgtggga tccatcttaa gatccgagag caaagagcgt tacgattatt 360

ttgtcaaaca tggattccca gtctataaag gtaacgatta cacctatgcc aagtttagac 420

catccgtttt gctcacaatt ttcatccttt ttgcgttagc tacgttaacc cactttgtct 480

ttatcagatt gtcggccgtg caatctagaa aaagactgag ttcgttgata gaggagaaca 540

aacagctggc ttggccacaa ggtgttcaag atgtcactca agtgaaggac gtcaaagtct 600

ataacgaaca tctacgtaaa tggtttttgg tatgtttcga cggatccgtt cattatgtgg 660

agaacgataa aaccttccat gttgatccgg aagaagttga actcccatct tggcaggaca 720

ctcttccagg taaattaata gtcaagctga taccccagct tgctagaaag ccacgatctc 780

caaaggagat caagaaggaa aatttagatg ataaaaccag aaagacaaaa aaacctacag 840

gggattccaa aactttacct aacggtaaaa ccatttataa agctaccaaa tccggtggac 900

gtagaaggaa ataagcttgg agaccaatga c 931

<210> 120

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物PP7435_Chr1-0136

<400> 120

gatctaggtc tcccatgaaa ctacaccttg tgattctc 38

<210> 121

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸引物PP7435_Chr1-0136反向

<400> 121

gtcattggtc tccaagctta tttccttcta cgtccacc 38

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号