首页> 中国专利> 丝状真菌领域的新的表达调节序列和表达产物

丝状真菌领域的新的表达调节序列和表达产物

摘要

本发明涉及相应于金孢子菌糖基水解酶家族7和10的新蛋白质,它们与SEQ ID NO:2和4的氨基酸序列分别呈70%和75%的最小氨基酸相同性,以及涉及相应于金孢子菌磷酸甘油醛脱氢酶的蛋白质,其与SEQ ID NO:6所示的部分氨基酸序列呈至少86%的氨基酸相同性。本发明还涉及编码这些蛋白质的核酸序列,特别是调节相应基因表达的启动子序列。用于表达这些基因的优选宿主是真菌,特别是金孢子菌菌株。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-04-05

    未缴年费专利权终止 IPC(主分类):C12N15/56 授权公告日:20080924 终止日期:20180417 申请日:20010417

    专利权的终止

  • 2016-11-02

    专利权的转移 IPC(主分类):C12N15/56 登记生效日:20161010 变更前: 变更后: 申请日:20010417

    专利申请权、专利权的转移

  • 2009-08-05

    专利申请权、专利权的转移(专利权的转移) 变更前: 变更后: 登记生效日:20090626 申请日:20010417

    专利申请权、专利权的转移(专利权的转移)

  • 2008-09-24

    授权

    授权

  • 2004-01-21

    发明专利申请公开说明书更正 卷:19 号:33 页码:扉页 更正项目:发明人 误:科尔内利娅·玛丽亚|约翰娜·范泽尔 正:科尔内利娅·玛丽亚·约翰娜·范泽尔 申请日:20010417

    发明专利申请公开说明书更正

  • 2004-01-21

    发明专利公报更正更正 卷:19 号:33 页码:236 更正项目:发明人 误:科尔内利娅·玛丽亚|约翰娜·范泽尔 正:科尔内利娅·玛丽亚·约翰娜·范泽尔 申请日:20010417

    发明专利公报更正

  • 2003-10-29

    实质审查的生效

    实质审查的生效

  • 2003-08-13

    公开

    公开

查看全部

说明书

发明领域

本发明涉及衍生自丝状真菌,尤其衍生自金孢子菌属(Chrysosporium)菌株的新酶,本发明还涉及这些酶的编码序列和表达调节序列。本发明是1999年10月6日提请的WO 00/20555(PCT/NL99/00618)的延伸,该申请在本申请优先权日前未公布。这一文献在此并入参考。

发明背景

现有技术领域已经揭示了许多基因表达的宿主和转化方法。经常提及的是细菌,如大肠杆菌。然而大肠杆菌是一种不能分泌一些蛋白质或多肽的微生物,因此不能在工业水平用作生产蛋白质或多肽的宿主细胞。对于大肠杆菌以及普遍对于细菌而言,另一个缺点是原核生物不能提供许多真核蛋白或多肽以活性形式生产所需的额外的修饰。蛋白质的糖基化和正确折叠例如是保证产生活性蛋白质或多肽所需的加工。为保证这种加工,人们有时使用哺乳动物细胞;然而,这种细胞的缺点是它们通常难以保持而且需要昂贵的培养基。这种转化系统因此在工业水平生产蛋白质和多肽中是不适用的。它们可适用于需求量相对较少的高价药物,但肯定对工业酶的生产不适用。

已经揭示许多真菌表达系统,例如黑曲霉,泡盛曲霉(Aspergillusawamori),构巢曲霉(Aspergillus nidulans),Trichoderma reesei。许多其它系统由于各种原因未发现可被广泛接受或使用。一般而言,理想的宿主必须符合以下标准的大部分:

-理想的宿主必须易于使用价格低廉的培养基发酵。

-理想的宿主必须有效使用培养基。

-理想的宿主必须高产量地生产蛋白质或多肽,即必须表现出高的蛋白质/生物量比。

-理想的宿主应该能够有效分泌蛋白质或多肽。

-理想的宿主必须保证所需要的蛋白质或多肽易于分离和纯化。

-理想的宿主必须对所需要的蛋白质或多肽进行加工,以使它们以不需要另外活化或修饰步骤的活性形式被生产出来。

-理想的宿主应该易于被转化。

-理想的宿主应该使用广泛范围的表达调控元件从而确保易于运用和多功能性。

-理想的宿主应该使用易于选择并且用起来很便宜的标记。

-理想的宿主应该产生稳定的转化体。

-理想的宿主应该允许在对所表达出的蛋白质或多肽无害的条件下培养,如低粘性、低剪切等。

WO 96/02563以及Novo Nordisk的美国专利5602004、5604129和5695985叙述了曲霉属和木霉属真菌系统的缺陷,并且提出其它真菌的培养条件或许会更适于大规模生产蛋白质。转化的培养物的唯一的例子是嗜热毁丝霉(Myceliophthora thermophila)、阿拉巴门支顶孢(Acremonium alabamense)、土生梭孢霉(Thielavia terrestris)和嗜纤维素孢子丝菌(Sporotrichum cellulophilum)。据报道孢子丝菌属菌株在对其它菌株不造成同样结果的发酵条件下裂解并且产生绿色素。也描述了土生梭孢霉的一种由于形态学而被选择的不形成孢子的突变体。但是其也指出梭孢霉属和支顶孢属(由此所使用的支顶孢属菌株是所使用的梭孢霉属菌株的未完成体)的原生质体效率很低并且潮霉素不是一种有用的选择标记。许多其它真菌也凭借其形态而被认为是潜在有用的但未叙述它们的转化情况。这些真菌菌株是Corynascus、嗜热子囊菌属、毛壳属、节霉属、柱顶孢霉和Talaromyces。转化的宿主因为所引入的Humicola木聚糖酶产量很低而被提及,梭孢霉属的产量最低;但是,这些信息不很明确并且实际上能够推断梭孢霉属是最佳的实施方案。对这些参考菌株的命名是基于1994年ATCC对工业真菌命名的基础之上的。因而很明显未能获得高程度的异源表达并且实际上在假定的形态学和表达程度之间不存在正相关。即使可以得出一些相关性,页很可能是负相关。根据1996年的ATCC真菌分类,嗜热孢子丝菌ATCC 20493是一种嗜热毁丝霉菌株。现在这个菌株仍然被鉴定为嗜热毁丝霉。从这些最近的说明中可以明显看出本技术领域的不可预知性。

Novo Nordisk的WO 97/26330提出了一种获得用于生产异源多肽的具有改进特征的丝状真菌亲本细胞突变体的方法。此方法包含首先发现一个特定的形态学改变,然后评价转化体是否比亲本菌株生产出更多的异源多肽。仅就链孢属A3/5菌株和米曲霉举例说明了此方法。此方法建议可适用于曲霉、木霉、梭孢霉、镰孢霉、链孢霉、支顶孢属、Tolyplocadium、Humicola、柱顶孢属、毁丝霉属或毛霉属的真菌。如上所述,由于本技术领域的不可预知性以及所引用申请的方法的不可预知性,尚未提出一种带有合理的成功预期的普遍适用的方法。

在WO 00/20555中,我们已经阐述了一种替代性真菌表达系统,这种系统简便使用满足上述需要的上述曲霉和木霉。这个新系统提供了另外的优点,即转化率高于通常使用的Trichoderma reesei系统。另外,所述培养条件提供了对多肽产物的附加益处。

发明详述

我们现在阐述了一些工业上令人感兴趣的衍生自金孢子菌株的酶,及全序列信息。我们还阐述了衍生自金孢子菌菌株用于表达同源和异源基因的新启动子系统。

本发明特别涉及通过其氨基酸序列鉴别的糖基水解酶的家族7(例如纤维二糖水解酶)和家族10(例如木聚糖酶),及磷酸甘油醛脱氢酶,以及衍生自这些酶蛋白的肽,和编码这些肽和蛋白质的核酸序列,以及特别涉及与这些基因相关的调节序列。

特别地,本发明涉及上述三类分离或重组的酶蛋白或其活性部分,包括具有如下进一步说明的和权利要求中所述的至少一定程度序列相同性的突变体,以及编码这些蛋白质或其一部分的核酸序列,和/或调节其表达的核酸序列。这些酶尤其是:(1)糖基水解酶家族7(纤维二糖水解酶,CBH1),其与SEQ ID NO:2序列具有至少75%,优选至少80%或者至少85%的氨基酸相同性;(2)糖基水解酶家族10(内切木聚糖酶XYL1),其与SEQ ID NO:4的序列具有至少70%,优选至少75%或者至少80%氨基酸相同性;(3)磷酸甘油醛脱氢酶(GPD1),其与SEQ ID NO:6序列具有至少86%,优选至少90%或至少93%氨基酸相同性。具有SEQ ID NO:2、4和6的至少20个、优选至少30个连续氨基酸的多肽和编码这些多肽的核酸序列也是本发明优选的一部分。相应的核苷酸序列分别示为SEQ ID No:1(cbh1)、3(xyl1)和5(gpd1)。

所述重组的酶可以包含基本上完整的蛋白质,或者具有至少部分酶活性的截短的蛋白质。这种截短的部分可以是催化结构域,或其至少大约75%的氨基酸。例如,本发明的CBH1催化结构域包含SEQ ID NO:2的第20-495位氨基酸序列,本发明的XYL1的催化结构域包含SEQ ID NO:4的第54-384位氨基酸序列。所述催化结构域可以或不与源自另一种蛋白质的信号序列和/或来自另一种酶蛋白的碳水化合物结合结构域组合。或者,本发明所述酶(CBH1和XYL1)的纤维素结合结构域可以融合于其它酶蛋白的催化结构域。

本发明的核酸序列可以是完整蛋白质编码区或寡核苷酸,或者优选是表达调节序列。寡核苷酸还可以用作探针以鉴别相当于但非相同于SEQ ID NO:1,3和5基因的基因;当达到本文所限定的相同性百分比时,这些基因以及其编码和非编码部分及其表达产物,也是本发明的一部分。寡核苷酸的长度优选是15-75个核苷酸,更优选20-50个核苷酸。

本发明还涉及一种表达系统(表达盒),其包含与编码另一种感兴趣蛋白质的基因融合的所述三类蛋白质中任一蛋白质的一个表达调节区域(包括一个启动子),或者与另一种表达调节区域融合的这些蛋白质中任一蛋白质的一个编码区域,或者这些新蛋白质的表达调节区域和蛋白质编码区域。所述表达调节区域包含至少60%,优选至少70%或者80%的SEQ ID NO:1,3和5的5’非编码区域,和/或来自这些5’非编码区的至少20个,尤其至少40个连续核苷酸序列。相似地衍生自本发明所述基因3′非编码区的终止序列,不论是否与同源或异源基因组合,在表达盒中也是有用的。

本发明的多核苷酸和寡核苷酸可以与SEQ ID NO:1,3或5的相应序列具有最小的序列相同性,或者在严格杂交条件下与这些给定的序列杂交。严格杂交条件是本领域已知的那些条件,例如在6×SSC(20×SSC/1000ml:175.3g NaCI,107.1g五水柠檬酸钠,pH7.0),0.1%SDS,0.05%焦磷酸钠,5×Denhardt’s溶液和20ug/ml变性鲱精DNA中,在56℃杂交18-24小时,随后在56℃在5×SSC,0.1%SDS中洗两次,每次30分钟,及在56℃在2×SSC,0.1%SSC中洗两次,每次30分钟。

这些表达系统可以包含于金孢子菌宿主,如Chrysosporiumlucknowense宿主中,或者在另一种非真菌宿主或者优选真菌宿主中。其它真菌宿主例如是其它金孢子菌菌种或菌株,镰孢属(Fusarium),曲霉属等。这种宿主有利的是不会自身地,固有地或由于培养条件导致产生相当于感兴趣蛋白质的一种蛋白质,以便于回收相应的蛋白质。

在本说明书和所附权利要求中提及的“多肽”或“肽”或“感兴趣多肽”或“感兴趣肽”,是指本发明表达系统的产物,这个术语还包括蛋白质,即具有特定功能和/或二级和/或三级结构的多肽。本发明说明书中提及氨基酸相同性百分比时,这种相同性涉及完整蛋白质或通过起始和结束的氨基酸数目定义的一特殊部分,相同性百分比是通过常规使用的BLAST序列对比程序测定。

在WO 00/20555所述的真菌表达系统中,培养基的pH可以是中性或碱性的,因此不再使生产的蛋白质或多肽经历侵蚀性和潜在灭活性酸性pH。在所述蛋白质或多肽更好地适于酸性环境的情况下,也可以在酸性环境下培养,如pH为4。可以在pH4.0-10.0之间进行合适的培养。然而优选中性至碱性pH,因为宿主在这种pH如pH6-9之间表现为较好生长。在一些情况下,在pH8以上而且甚至在高如pH10的碱性pH中生长也是一种良好的选择。这种宿主菌株的培养温度对一些类型的所产生的多肽的稳定性也是有益的。所述培养温度适于在23-43℃。明显地,这样的条件对生产哺乳动物多肽而言是特别感兴趣的。所选择的温度依赖于培养成本效率和所述多肽或培养菌株的敏感性。

也已经确定生物量与粘性之间的关系并且所产生的蛋白量对于金孢子菌宿主也是非常有利的。已经将Trichoderma longibrachiatum(以前认为是T.reesei)和黑曲霉进行了比较。在它们各自优化条件下,Trichoderma longibrachiatum的生物量是2.5-5克/升,黑曲霉的生物量是5-10克/升,金孢子菌宿主的生物量是0.5-1克/升,因此,这样比商业上所用的菌株改良了5-10倍。本发明涉及包含编码异源蛋白质或多肽的核酸序列的表达系统,所述核酸序列可操纵地连于下述的一个表达调节区域,并任选地连接于一个分泌信号编码序列和/或一个载体蛋白编码序列。优选地,本发明的重组菌株分泌感兴趣多肽。这将避免破坏细胞以分离感兴趣多肽的必要性,而且还使表达产物被宿主细胞的其它成分降解的风险降至最低。

可根据由Burgess出版公司1972年出版的Barnett和Hunter所著的《举例说明的半知真菌属》(第三版)一书中的形态学知识对金孢子菌属真菌进行准确地描述。其它提供关于金孢子菌属真菌分类的详细资料的来源有例如Sutton分类法(Van Oorschot,C.A.N(1980)“金孢子菌属及相关属的修订版”,荷兰Baarn CBS的真菌学研究第20期1-36页)。CBS是布达佩斯条约的菌种保藏机构之一。根据这些教科书,金孢子菌属真菌是属于丝孢目丛梗孢科的一种。以下菌株是金孢子菌,但金孢子菌非限于这些菌株:C.botryoides,C.carmichaelii,C.crassitunicatum,C.europae,C.evolceannui,C.farinicola,C.fastidium,C.filiforme,C.georgiae,C.globiferum,C.globiferum var.articulatum,C.globiferum var.niveum,C.hirundo,C.hispanicum,C.holmii,C indicum,C inops,C.keratinophilum,C kreiselii,C kuzurovianum,C lignorum,C lobatum,C lucknowense,C.lucknowenseGarg 27K,C.medium,C.medium var.spissescens,C.mephiticum,C.merdarium,C.merdarium var.roseum,C.minor,C.pannicola,C.parvum,C.parvum var.crescens,C.pilosum,C.pseudomerdarium,C.pyriformis,C.queenslandicum,C.sigleri,C.sulfureum,C.synchronum,C.tropicum,C.undulatum,C.vallenarense,C.vespertilium,C.zonatum。

C.lucknowense构成了金孢子菌属的一个种,由于它天然高产纤维素酶蛋白(WO 98/15633和相关的美国专利5811381),所以我们对其尤其感兴趣。Chrysosporium lucknowense的特征如下:

在沙氏葡萄糖琼脂培养基上生长14天后菌落直径达到55毫米,呈奶油色,毡状蓬松;中心致密并且3到5毫米厚;边缘清晰、规则并且有伞缘;颜色从淡黄色到奶油色。菌丝是无色透明和表面光滑的并且薄壁,很少分枝。气生菌丝通常是能育的并且密集分隔,大约1到3.5毫米宽;水下菌丝是不能育的,大约1到4.5毫米宽,较薄的菌丝通常被扭曲。分生孢子通常是顶孢子和侧生孢子,大多数是无梗的或位于短的频繁出现的圆锥形突起上或短侧枝上。分生孢子是单生的但相互之间靠得很近;在一个菌丝细胞上生有1到4个分生孢子,近于无色,薄壁或壁光滑,大多数近球形,也有棍棒状和倒卵形的,单细胞,2.5-11×1.5-6μm大小,带有较宽的基板芽痕(1-2微米)。无居间分生孢子,也无厚垣孢子存在。Chrysosporiumlucknowense菌株的例子有ATCC44006,CBS251.72,CBS143.77和CBS272.77等,在WO 98/15633和相关的美国专利5811381中提供了其它的例子。

从此菌种中分离得到了一株具有更高的产纤维素酶能力的菌株。内部命名为C1菌株,此菌株根据布达佩斯条约于1996年8月29日保藏于位于莫斯科Bakrushina街8号邮编为113184的俄罗斯微生物保藏中心,其保藏编号为VKM F-3500D。此菌株被命名为Chrysosporium lucknowense Garg 27K。C1菌株的特征如下:

在马铃薯葡萄糖琼脂培养基上生长7天菌落直径达到大约55-66毫米;乳白色,毡状。中心厚度为2-3微米厚,边缘清晰,规则并且有伞缘;菌落颜色淡奶油色;菌丝是无色透明,壁光滑,薄壁,很少分枝。气生菌丝是能育的,分隔,大约2-3毫米宽;水下菌丝是不能育的。分生孢子是顶孢子或侧生孢子;无梗或位于短侧枝上。分生孢子是单生的但相互之间靠得很近;近于无色,薄壁切光滑,近球形,棍棒状或倒卵形,单细胞,4-10微米大小。无厚垣孢子,也无居间分生孢子存在。

在WO 98/15633、美国专利5811381和美国专利6,015,707中描述了分离C1菌株的方法。那些来源于金孢子菌属前体菌株包括已经自然诱变或人工诱变的菌株也在金孢子菌属的定义范围之内。金孢子菌属突变体可以通过诱导诱变,特别是通过组合辐射诱变和化学诱变而获得。

例如C1菌株经紫外线照射产生了UV13-6菌株,UV13-6菌株进一步经N-甲基-N’-硝基-亚硝基胍的诱变产生了NG7c-19菌株。NG7c-19菌株经紫外线照射突变导致生成UV18-25菌株。在这一突变过程中在液体培养基中或培养皿上以及显微镜下培养物的形态学特征变化很大。随着连续诱变,作为金孢子菌属特征的在培养皿上菌落呈绒毛状或毡状生长的形态学特征逐渐丧失,最后得到一个扁平的无光泽的菌落。野生型菌株在某些培养基中产生棕色色素的现象在突变株中也不是很明显。显著的是UV18-25突变株在液体培养基中的粘性要比野生型C1菌株和UV13-6和NG7c-19突变株低得多。在所有菌株都维持金孢子菌属总显微特征的情况下,经连续突变后菌丝体变窄,并且UV18-25菌株可以明显观察到断裂菌丝。菌丝体断裂可能是引起UV18-25菌株相关的低粘度的原因。每个诱变步骤之后菌株形成孢子的能力降低。以上表明金孢子菌属的每一菌株与上面的形态学定义都有一定的偏差。此外,每一突变步骤之后纤维素酶和细胞外蛋白的产量增加了,但一些突变导致蛋白酶表达降低。真菌分类学标准可以从例如CBS、VKMF和ATCC处得到。称为金孢子菌株C1,菌株UV13-6,菌株NG7C-19和菌株UV18-25的这些菌株,根据布达佩斯条约已经保藏在莫斯科的俄罗斯微生物保藏中心(VKM)。野生型C1菌株保藏号为VKM F-3500 D,保藏日期为1996年8月29日,C1 UV13-6突变体保藏号为VKM F-3632 D(02-09-1998),C1 NG7c-19突变体保藏号为VKM F3633 D(02-09-1998)及C1 UV 18-25突变体保藏号为VKM F-3631 D(02-09-1998)。

优选使用本领域已知的一些非毒性金孢子菌株,因为这样可降低大规模生产所造成的环境问题及使生产步骤简便与降低成本一体化。

表达调节区域是用于表达的宿主金孢子菌属菌株所识别的一段DNA序列。它含有一段与编码待表达的多肽的核酸序列可操作连接的启动子序列。启动子的连接使得待表达序列起始密码子的相对位置可以表达。密码子序列可以是组成型的或诱导型的。任何能够允许金孢子菌属菌株多肽表达的表达调节序列或其组合形式均包括在本发明中。表达调节序列优选是真菌表达调节区例如子囊菌调节区域。合适的真菌表达调节区域来自于下列真菌菌属任何之一表达调节区域:曲霉属、木霉属、金孢子菌属、汉逊酵母属、毛霉属、毕赤酵母属、链孢霉属、Tolyplocadium、根毛霉属、镰孢霉属、青霉属、酵母属、Talaromyces或其另外的有性形式如裸壳孢属、Hypocrea等,例如来自木霉的纤维二糖水解酶启动子,来自曲霉的葡糖淀粉酶启动子、甘油醛磷酸脱氢酶启动子、醇脱氢酶A和醇脱氢酶R启动子、TAKA淀粉酶启动子,来自链孢霉的磷酸甘油酸和交叉旁路控制启动子,来自曼赫根毛霉的天冬氨酸蛋白激酶启动子、脂酶启动子和来自变灰青霉的β-半乳糖苷酶启动子。来自与宿主菌株同属的表达调节序列尤其适合,这是因为它很可能特别适应特定的宿主。因此,优选的表达调节序列是来自金孢子菌属真菌的表达调节序列。

优选应用能在选择的宿主内高表达的表达调节区域。这优选是一个来自于本发明的金孢子菌的表达调节区域。其也可以是一个来自于异源宿主的高表达调节区域,如本领域众所周知的。因此要大量表达的蛋白质和因此为本发明提供合适的表达调节序列的特定的例子不仅仅局限于疏水蛋白、蛋白酶、淀粉酶、木聚糖酶、果胶酶、酯酶、β-半乳糖苷酶、纤维素酶(例如内切葡聚糖酶;纤维二糖水解酶)和多聚半乳糖醛酸酶。已经明确在固体状态下以及水下发酵条件下都可以高表达。评价这些蛋白质产生和产量的方法是本领域所众所周知的,例如Sigma和Megazyme公司的产品目录里有无数的例子。Megezyme公司位于爱尔兰Wicklow县的Bray商业区内。Sigma公司在全世界范围内有许多分支机构例如密苏里州圣路易丝市的14508信箱。对于纤维素酶的分析我们使用商用分析方法如羧甲基纤维素酶分析法、内粘度计分析法、微晶纤维素酶分析法、β-葡萄糖酶分析法、RBB羧甲基纤维素酶分析法、Cellazyme C分析法。另外的方法是本领域熟练技术人员众所周知的并且可以从关于这个主题的一般文献中查到,这些信息引入本文做参考。我们参考“酶学方法1995第一卷直至1998第297-299卷”作为例子。为确保宿主能够很好地识别我们应用了金孢子菌属真菌的启动子序列。

我们已经发现在金孢子菌属真菌中异源表达调节序列像天然的金孢子菌属真菌序列一样有效地工作。这就允许众所周知的构建物和载体被用于转化金孢子菌属真菌以及为在这种新的表达和分泌宿主中构建高表达的载体提供众多其他的可能性。例如可以使用如Christiansen等在Bio/Technol 6:1419-1422(1998)中所描述的标准的曲霉转化技术。其它文献例如美国专利4816405,5198345,5503991,5364770和5578463,EP-B-215.594(也用于木霉)中提供了曲霉转化载体的详细资料,这些文献以及它们的内容引入本文做参考。由于已经明确金孢子菌属真菌可以以极高水平表达纤维素酶,所以这些蛋白的表达调节区域是优选的。我们把前面提到的保藏的金孢子菌属真菌作为特定的例子。

与含有和待表达的多肽可操作连接的核酸表达调节区域的金孢子菌属突变株一样,含有来自金孢子菌属真菌,优选来自Chrysosporium lucknowense的核酸表达调节区域或其衍生物的核酸构建体组成了本发明的一个单独的实施方案。这样的合适的核酸构建体是与纤维素酶或木聚糖酶表达,优选与纤维二糖水解酶,或者磷酸甘油醛脱氢酶表达有关的金孢子菌属真菌的表达调节区域,如下详述。本发明的核酸序列可适当地得自金孢子菌菌株,这种菌株在说明书的另一部分中定义。可以确定启动子序列的方式有很多,而且是本领域所熟知的。在相关基因起始处ATG密码子的上游区域进行核酸酶缺失实验可以提供这种序列。另外例如分析共有序列也可以发现感兴趣的基因。使用杂交和扩增方法,本领域技术人员可以容易得出相应的启动子序列。

通过克隆相应基因这种方式鉴定了C1内切葡聚糖酶的启动子序列。本发明的优选的启动子是55kDa的纤维二糖水解酶(CBH1)启动子和30kDa的木聚糖酶(Xyl1)启动子和磷酸甘油醛脱氢酶启动子,因为这些酶通过它们自己的启动子高水平地表达。相应的启动子序列通过克隆以直截了当的方式鉴别的,如WO 00/20555所述,分别使用SEQ ID NO:1(针对CBH1)和SEQ ID NO:3(针对Xyl1)提供的序列信息。金孢子菌的碳水化合物降解酶的启动子,尤其C1启动子,可以有利地用于在宿主生物体中表达所需的多肽,尤其在真菌或其它微生物宿主生物体中。与SEQ ID NO.1和3和5,或与金孢子菌属其它基因序列具有至少65%,优选至少70%,最优选至少75%核苷酸序列相同性的启动子序列也是本发明的一部分。

本发明的重组菌株和核酸序列的特别的实施方案参见实施例。关于重组菌株,也参见现有技术,如叙述高表达的启动子序列特别是那些在真菌例如曲霉和木霉中提供高表达的启动子序列。现有技术中提供了许多可用于曲霉的表达调节区域,如Novo的美国专利5252726和Unilever的美国专利5705358。这些内容引入文中做参考。

疏水蛋白基因是一个高表达的真菌基因。因此提示疏水蛋白基因,优选来自金孢子菌属真菌的疏水蛋白基因的启动子序列可能适合于在本发明合适的实施方案中用做表达调节序列。本领域已经公开了Trichoderma reesei和Trichoderma harzianum疏水蛋白的基因序列以及烟曲霉和构巢曲霉的基因序列,相关的序列信息引入文中做参考(Munoz等,现代遗传学1997,32(3):225-230;Nakari-SetalaT等,欧洲生物化学杂志1996,15:235(1-2):248-255;M.Parta等,传染免疫学1994 62(10):4389-4395和Stringer M.A.等,分子微生物学1995,16(1):33-44)。利用这些序列信息,本领域熟练技术人员使用上面已经提到的标准技术就可以很容易地得到金孢子菌属真菌疏水蛋白基因的表达调节序列。本发明的金孢子菌属重组菌株包含与编码感兴趣的多肽的序列可操作连接的疏水蛋白调控区。

表达调节序列也可以另外包含增强子或沉默子。这些也是本领域众所周知的并且它们通常都位于离启动子有一段距离的地方。表达调节序列也可以包含带有激活剂结合位点和阻遏蛋白结合位点的启动子。在一些情况下也可以修饰这些位点以消除这种类型的调控。已经描述了带有creA位点的丝状真菌启动子。可以突变这样的creA位点确保阻抑葡萄糖,通常情况下去除未突变的creA位点可导致这种结果。Gist Brocades的WO 94/13820举例说明了这种原理。使用这样的启动子可以使由核酸序列所编码的多肽的表达能够在葡萄糖存在的情况下受此启动子调节。WO 97/09438中也说明了此原理。带有或不带有creA位点的这些启动子都可以使用。creA位点已经被突变的突变株可被用做本发明的重组菌株的表达调节序列,这样它所调节的核酸序列就可以在葡萄糖存在的情况下表达。这些金孢子菌属真菌启动子可以以WO 97/09438中所例证的类似方式脱阻抑。creA位点是本领域众所周知的。另外,可以在阻遏系统带有突变例如creA基因本身突变的宿主菌株中应用带有creA结合位点的启动子,因此尽管此菌株带有creA结合位点,它仍然可以在有葡萄糖存在的情况下产生蛋白质或多肽。

终止子序列也是表达调节序列,它们与待表达基因的3’端可操作连接。任何真菌终止子在本发明的金孢子菌属真菌中都是有功能的,例如构巢曲霉trpC终止子(1),黑曲霉α-葡糖苷酶终止子(2)、黑曲霉葡糖淀粉酶终止子(3)、曼赫氏毛霉羧基蛋白酶终止子(美国专利5578463)和T.reesei纤维二糖水解酶终止子。天然的金孢子菌终止子序列如CBH1终止子在金孢子菌属真菌中也是有功能的并且是合适的。

用于本发明的合适的金孢子菌属真菌重组株的待表达的核酸序列与编码信号序列氨基酸序列的核酸序列可操作连接。信号序列是与待表达多肽的氨基酸序列可操作连接从而使之分泌到宿主真菌外的氨基酸序列。这样的信号序列可以是正常与异源多肽相结合的,也可以是宿主本身的。它也可以对宿主和多肽来说都是异源的。编码信号序列的核酸序列必须位于读码框内以允许信号序列和异源多肽的翻译。任何一种能够使金孢子菌属真菌分泌多肽的信号序列均包括在本发明内。合适的这样的序列是真菌的信号序列,优选子囊菌信号序列。

合适的信号序列的例子通常可以来自酵母或下列特定的真菌菌属的任何之一:曲霉、木霉、金孢子菌属、毕赤酵母、链孢霉、根毛霉、Humicola、汉逊酵母、毛霉、Tolyplocadium、镰孢霉、青霉、酵母属、Talaromyces或其另外的有性形式如裸壳孢属、Hypocrea等。特别有用的信号序列通常与下列蛋白质天然结合:纤维二糖水解酶、内切葡聚糖酶、β-半乳糖苷酶、木聚糖酶、果胶酶、酯酶、疏水蛋白、蛋白酶或淀粉酶。例如曲霉或Humicola的淀粉酶(4)、米曲霉的TAKA淀粉酶、黑曲霉的α淀粉酶、毛霉的羧基肽酶(美国专利5578463)、曼赫氏根毛霉的脂酶、木霉的纤维二糖水解酶(5)、变灰青霉的β-半乳糖苷酶以及酵母的α交配因子。

或者,信号序列可以来自于芽孢杆菌的淀粉酶或枯草蛋白酶基因。来自与宿主菌株同属的信号序列是最合适的,这是因为它很可能特异性适应宿主菌株,因此优选的信号序列是金孢子菌属真菌的信号序列,特别是上述金孢子菌C1菌株、UV13-6菌株、NG7C-19菌株和UV18-25菌株的信号序列。来自于丝状真菌、酵母和细菌的信号序列也是有用的。非真菌来源的信号序列也是有用的,特别是来自于细菌、植物和哺乳动物的信号序列。

根据本发明任何一个实施方案所用的重组的金孢子菌属真菌可另外包含一个选择标记。这样的选择标记将允许易于挑选转化的或转染的细胞。选择标记通常编码一种基因产物,此基因产物对未转化的菌株提供了一种异源的特定类型的抗性。这可以是对重金属、抗生素和杀虫剂的抗性。原养型对于非抗生素品种来说也是一种有用的选择标记。当着眼于这种产物更快或较不复杂的调控将感兴趣的蛋白质或多肽用于食品或药物中时,优选非抗生素选择标记。GRAS指标常常用于这样的标记。本领域熟练技术人员可用许多这样的标记。例如FDA提供了一系列这样的标记。最常用的选择标记来自于赋予抗药性或减轻营养缺陷的amdS(乙酰胺酶)、hph(潮霉素磷酸转移酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、trpC(色氨酸合酶)、argB(鸟氨酸氨甲酰基转移酶)、sC(硫酸腺嘌呤转移酶)、bar(膦丝菌素乙酰转移酶)、glufosinate抗性、niaD(硝酸还原酶)、博来霉素抗性基因,更特别的是Sh ble、磺酰脲抗性如乙酰乳酸合成酶ilv1突变。也可以通过共转化选择,其中选择标记在另一个载体上或与编码感兴趣的多肽的多肽编码序列在同一个核酸片段上。

本文中所用的术语异源多肽是指通常情况下不被本发明用于表达的金孢子菌属真菌表达和分泌的蛋白质或多肽。多肽可以是植物或动物(脊椎动物或无脊椎动物)起源的例如哺乳动物、鱼、昆虫或微生物起源的,但限制条件是此多肽不能出现在宿主菌株中。哺乳动物包括人。微生物包含病毒、细菌、古细菌和真菌即丝状真菌和酵母。伯杰氏细菌鉴定手册提供了许多系列的细菌和古细菌。为药物应用的目的优先选择人体蛋白,因此构成本发明优选的实施方案的重组宿主是其中带有人体起源的多肽的宿主。为例如食品生产的目的,合适的异源多肽是动物、植物或藻类起源的。因此,这些实施方案也是本发明合适的实施例。其他有用的实施方案也包括细菌、酵母、病毒、古细菌和真菌任何之一起源的异源多肽。真菌起源的多肽是最优选的。

本发明的合适的实施方案包含带有合适的密码子使用的异源核酸序列。这样的序列编码其所起源的宿主的天然的氨基酸序列,但具有不同核酸序列,即某些密码子已经被其他编码相同氨基酸的密码子替换以使之更易于被用于表达的宿主菌株所使用的核酸序列。这可导致异源核酸序列的更好地表达。对于本领域熟练技术人员来说这是很普通的。这种合适的密码子可以在已知的真菌密码子使用对应于非真菌的密码子使用的基础上得到。它也可以更特异地适应于金孢子菌属真菌本身的密码子使用。相似之处是所观察到的木霉、Humicola和曲霉的密码子使用可以在不改变密码子的情况下进行这些有机体之间的序列交换。关于这些真菌密码子使用的详细资料是本领域熟练技术人员可利用的,并且引入本文做参考。

本发明不仅仅局限于上面所提到的金孢子菌属真菌菌株,也包括含有编码金孢子菌属真菌菌株同源蛋白的核酸序列的重组菌株,所述的核酸序列与一表达调节区可操作连接并且所述的重组菌株比相应的非重组菌株在同样的条件下产生更多的所述的蛋白。所感兴趣的同源多肽优选是中性或碱性酶如在本文其它地方已经描述的水解酶、蛋白酶或碳水化合物降解酶。多肽也可以是酸性的。优选的重组菌株比非重组菌株表达更多量的多肽。所有提到的关于异源多肽的评论也同样适用于同源多肽纤维素酶。

因此,本发明也包括微生物基因工程菌株,其中所引入的序列是金孢子菌属起源的。但是,由于以下原因例如用于转化或转染金孢子菌属真菌的核酸序列中存在异源序列,由于存在编码所感兴趣的多肽的核酸序列的多拷贝这个事实或由于在同等条件下所表达的多肽的量多于非工程菌这个事实或由于在通常不表达的条件下发生表达这个事实,工程菌可以与原始自然菌株区分开来。后一情况可以是在与非重组菌相反的条件下诱导型启动子调节所感兴趣的序列或着是另外的因子诱导表达的结果。本发明涉及通过使用经典的基因工程或基因工程方法而获得的菌株。

本发明的表达系统和含有其的重组菌株可以含有一段编码选自下列物质的核酸序列:碳水化合物降解酶(纤维素酶、木聚糖酶、甘露聚糖酶、甘露糖酶、果胶酶、淀粉酶例如葡糖淀粉酶、α淀粉酶、α和β半乳糖苷酶、α和β葡(萄)糖苷酶、β葡聚糖酶、几丁质酶、聚N-乙酰葡糖胺酶)、蛋白酶(内切蛋白酶、氨基蛋白酶、氨基和羧基肽酶、角蛋白酶)、其它水解酶(脂酶、酯酶、植酸酶)、氧化还原酶(过氧化氢酶、葡萄糖氧化酶)和转移酶(转谷氨酰胺酶、转糖基酶、异构酶和转化酶)。

本发明所要表达的最令人感兴趣的产物是纤维素酶、木聚糖酶、果胶酶、脂肪酶和蛋白酶。其中纤维素酶和木聚糖酶切割β-1,4键,纤维素酶包含内切葡聚糖酶,纤维二糖水解酶和β-葡糖苷酶。这些蛋白质在本领域已知的各种工业方法中均是非常有用的。特别是纤维素酶,例如我们提及的WO 98/15633阐述了纤维二糖水解酶和内切葡聚糖酶的使用。所述WO 98/15633的内容在此并入参考。

本发明的重组体,其包含编码感兴趣多肽的核酸序列,该序列编码一种在酸性pH下即pH低于6,甚至pH低于5.5,更适合甚至pH低于5和甚至pH4或低于pH4的情况下失活或不稳定的蛋白质或多肽。这是一个特别令人感兴趣的实施方案,因为通常披露的真菌表达系统并不是在中性到碱性的条件下培养而是在酸性条件下培养的。因此,本发明的这个系统提供了一种表达在酸性pH下易于失活或不稳定的蛋白质或多肽的安全的真菌表达系统。

正如在本发明任一实施方案中所详细说明的那样,一个更为特别的重组菌株被认为是本发明的一个优选的实施方案,其中编码感兴趣多肽的核酸序列编码一种在pH5以上,优选中性或碱性pH(即大于7)和/或在pH大于6的情况下具有最佳活性和/或稳定性的蛋白质或多肽。在这样的pH值下最佳活性大于50%,大于70%甚至大于90%被认为是特别有用的实施方案。在培养条件下所表达的多肽在此条件下没有必要必须有活性,由于其活性形式可能对宿主有损害,所以实际上在其失活的条件下培养对它也是有利的。但是,蛋白质或多肽在此培养条件下必须稳定。稳定可以是热稳定。它也可以是针对某些组合物或化学制品的稳定,例如存在于组合物中或生产过程中或在所感兴趣的蛋白质或多肽的应用中。在含有纤维素酶或脂酶等的去垢剂组合物中的LAS是通常对蛋白质有损害的化学制品的例子。在应用中使用时间可能从短到长不等,因此对于每次应用来说稳定性的时间长短可能不同。熟练技术人员在各种情况的基础上将能够确保正确的条件。我们可以使用商用分析方法来确定不同的酶产物的最佳活性。例如Sigma和Megazyme公司的产品目录上有这些分析方法。在本叙述的其它地方也都提到了特定的实施例。制造商提供了应用指导。

一种金孢子菌属菌株适合被所要表达的感兴趣的序列转化或转染且这种菌株生物量相当低。我们已经发现当培养至发酵的末尾阶段粘度值为200-600cP时金孢子菌属真菌菌株的生物量比T.reesei低2-3倍,当在相应条件下培养至粘度值为1500-2000cP时其生物量比黑曲霉低10-20倍,即它们各自最佳的培养条件能够提供高水平的表达。这一表达水平极大地超过了这两个商用菌株并且其生物量和粘度值相当低。这意味着这个金孢子菌属菌株的表达产量要比黑曲霉和T.reesei高许多。这样的一株转化的或转染的金孢子菌属真菌菌株构成了本发明的一个合适的实施方案。

我们发现在上面所叙述的条件下金孢子菌属C1菌株(18-25)的生物量是0.5-1.0克/升,而T.reesei的生物量是2.5-5.0克/升,黑曲霉的生物量是5-10克/升。在实施例中我们提供了这个过程的详细资料。

在本发明的一个合适的实施方案中本发明的金孢子菌属真菌重组菌株所产生的蛋白质或多肽的量至少应该等同于由UV13-6或C-19菌株所产生的摩尔每升纤维素酶的量,最优选的情况是至少应该等同于或高于由UV18-25菌株在相应条件或相同条件即在它们各自最佳的培养条件下产生的纤维素酶的量。

我们也发现当使用显示UV18-25菌丝体形态的金孢子菌属菌株即短的菌丝体片段时表达和分泌率非常高。因此本发明的重组菌株优选显示这样的形态。但是本发明也包括显示这种新的和创造性特征的非重组菌株或其它金孢子菌属真菌的工程菌株。本发明也包括在本发明任一实施方案中所描述的与C1菌株相比进一步表现出在相同的发酵条件下产生孢子能力降低,优选低于UV13-6菌株产孢能力,优选低于NG7C-19菌株产孢能力,优选低于UV18-25菌株产孢能力的金孢子菌属真菌重组菌株。本发明也包括在本发明任一实施方案中所描述的在相同的发酵条件下显示出与C1菌株相比,优选与UV13-6,NG7C-19和UV18-25菌株相比至少是其蛋白质产量与生物量比的金孢子菌属真菌重组菌株。但是,本发明同样也包括或与其它任一实施方案结合显示这种新的和创造性特征的非重组菌株或其它金孢子菌属真菌的工程菌株。

本发明的另一个吸引人的实施方案也包括在相应或等同的发酵条件下显示出粘度值比NG7C-19菌株低,优选比UV18-25菌株低的金孢子菌属真菌重组菌株。但是,本发明同样也包括显示这种新的和创造性特征的非重组菌株或其它金孢子菌属真菌的工程菌株。我们已经确定在它们各自的最佳培养条件下发酵过程的末期阶段UV18-25培养物的粘度值为10cP,而T.reesei的粘度值为200-600cP,黑曲霉的粘度值为1500-2000cP。在实施例中提供了这些测量过程。

在许多情况下粘度值可以通过视觉监测。物质的流动性变化程度很大,它可以呈近乎固体状、酱状或液体状。粘性也很容易通过使用运动粘性管的Brookfield旋转粘度计、降珠粘度计或杯形粘度计确定。这样的低粘度值培养物每个时间单位和每个细胞的产量比已知的高粘度值的商业培养物要高。

对本发明的这些低粘度的培养物进行处理是有利的,特别是当放大培养时。本发明的低粘度的金孢子菌属菌株在体积大至150000升的培养物中表现得非常好。因此任何一个体积至150000升的培养都是本发明的有用的实施方案。使用本发明的菌株任何其它传统体积大小的发酵也应该能够很好地实施。其后的原因是在大规模生产中出现的问题随着聚集物的形成菌丝体太致密和/或不均匀分布。其结果是培养基在培养过程中不能被有效利用,因此导致生产过程低效,特别是在大规模发酵即体积大于150000升的情况下。通气或混合导致了氧气和营养饥饿因此降低了产物生物量的浓度和减少了培养过程中的多肽产量和/或导致发酵时间延长。此外,在商业发酵过程中高粘度和高剪切是我们所不希望发生的,并且在现在的商业发酵过程中它们是生产限制因素。从这一点上来说使用本发明的金孢子菌属菌株可以克服所有这些负面特征,因为此菌株比商用T.reesei、黑曲霉和米曲霉显示出更好的特征即蛋白质生产水平较高、更好的粘度特征和生物量数值。

根据本发明的任何一个上面提到的实施方案的金孢子菌属菌株被认为是本发明最有用的实施方案,所述的菌株进一步呈现能生产选自上面所提到的碳水化合物降解酶、蛋白酶、其它水解酶、氧化还原酶和转移酶的一种或多种真菌酶。特别是纤维素酶、木聚糖酶、果胶酶、脂酶和蛋白酶是最令人感兴趣的产物。但是作为本发明的实施方案,生产一种或多种在中性或碱性优选碱性条件下显示出最佳活性和/或稳定性的真菌酶的金孢子菌属菌株也是有用的,所述的酶选自碳水化合物降解酶、水解酶和蛋白酶,优选水解酶和碳水化合物降解酶。在非重组金孢子菌属菌株中,这种酶合适地是像WO98/15633所公开的那些除纤维素酶以外的酶。我们所特别感兴趣的酶是木聚糖酶、蛋白酶、酯酶、α半乳糖苷酶、β半乳糖苷酶、β葡聚糖酶和果胶酶。这些酶不仅仅限于上面所提到的酶。本文中关于稳定性和活性的讨论也同样用于此处。

本发明也包括生产所感兴趣的多肽的方法,所述方法包括在使所述多肽表达及优选分泌的条件下,培养本发明任何实施方案中的一种宿主菌株(例如真菌如金孢子菌,曲霉,木霉,汉逊酵母,毛霉,毕赤酵母,链孢霉,Tolypocladium,Rhizomucor,镰孢,青霉或细菌或其它微生物),并回收随后产生的相应多肽。

当提到蛋白质或多肽时,天然蛋白质的变种或突变体例如替换、插入或确实突变体被包括在显示非突变体活性的蛋白或多肽中。相应的核酸序列也是如此。通过基因改组、蛋白质工程和定向进化定点突变和随机突变等方法可以得到这样的多肽、变种或突变体。美国专利5223409、5780279和5770356提供了定向进化的方法。利用这些方法例如通过易错聚合酶链反应进行基因改组可在任何细胞类型中产生随机突变的基因序列库。每一基因都带有分泌区和一固定区,从而使产物蛋白分泌出来并且固着在宿主表面。随后创造此特定蛋白生物活性所必须的条件。经过许多循环之后最终导致具有所希望特征的终基因产生。换一句话说一个加速的定向进化过程。美国专利5763192也叙述了通过合成的多聚核苷酸偶联随机产生序列,将其引入宿主中随后选择具有预先设定特点的宿主细胞而获得DNA、RNA、肽、多肽或蛋白质的方法。

本发明方法的另一种应用是在“定向进化”方法中,在其中产生新的蛋白质编码DNA序列,在宿主细胞中表达所编码的蛋白质,并且突变那些编码具有所需特性的蛋白质的序列,并再次表达。将此方法重复多次直至获得具有所需特性的蛋白质。例如可以通过基因改组,蛋白质工程,易错PCR,定点诱变,和组合的和随机诱变等方法,可以产生编码外源蛋白质的新DNA序列。美国专利5,223,409,5,780,279和5,770,356提供了定向进化的教导。也见于Kuchner和Arnold,生物技术趋势15:523-530(1997);Schmidt-Dannert和Arnold,生物技术趋势17ru35-136(1999);Arnold和Volkov,生物化学通用观点3:54-59(1999);Zhao等,工业微生物学和生物技术手册,第二版,(Demain和Davies编辑)pp.597-604,ASM出版社,华盛顿DC,1999;Arnold和Wintrode,生物技术百科全书,:发酵,生物催化和生物分离(Flickinger和Drew编辑)pp.971-987,JohnWiley & Sons,纽约1999;及Minshull和Stemmer,生物化学通用观点3:284-290。

组合诱变的应用见于Hu等,生物化学1998,37:10006-10015所揭示。美国专利5,763,192阐述了通过随机产生合成的序列,将其导入宿主中,并选择具有所需特性的宿主细胞的获得蛋白质编码DNA序列的一种新方法。影响人工基因重组(DNA改组)的方法包括随机引发重组(Z.Shao等,核酸研究26:681-683(1998)),交错延伸方法(H.Zhao等,自然生物技术16:258-262(1998)),和异源双链重组(A.Volkov等,核酸研究27:e18(1999))。易错PCR是另一种方法(Song和Rhee,应用环境微生物学66:890-894(2000))。

在定向进化方法中有两种普遍应用的进行选择步骤的方法。在一个方法中,感兴趣的蛋白质活性对于宿主细胞的存活是关键的。例如,如果所需的活性是在pH8是活性的纤维素酶,那么可以将纤维素酶基因突变并导入所述宿主细胞中。用纤维素作为唯一碳源培养所述转化体,并且逐渐提高pH,直至剩余一少部分存活者。将来自存活者的突变的纤维素酶基因,其大概编码在较高pH是活性的纤维素酶,进行另一次突变循环,并重复进行这个方法直至获得在pH8可以在纤维素上生长的转化体。可同样进化酶的耐热变体,通过重复进行基因突变和高温培养宿主细胞而进化(Liao等,美国科学院院报83:576-580(1986);Giver等,美国科学院院报95:12809-12813(1998)。

作为大规模平行“最适者生存”方法的一种替代方法是系列筛选。在这个方法中,各个转化体是通过传统方法筛选的,如指示培养基上生长的集落周围的澄清区或有色区的观测,比色或荧光测定酶分析,免疫分析,结合分析等。见例如Joo等,自然399:670-673(1999),其中通过循环进行突变和筛选而进化不需要NADH作为辅因子的细胞色素P450单加氧酶;May等,自然18:317-320(2000),其中以相似方式进化反向立体选择性的一种乙内酰脲酶;及Miyazaki等,分子生物学杂志297:1015-1026(2000),其中进化了一种耐热枯草杆菌蛋白酶。

标准的克隆和蛋白质或多肽分离技术可以用于获得所需的序列信息。部分已知序列可以用作探针以分离其它属和菌株中的其它同源物。编码特殊酶活性的核酸序列可以用于筛选例如一个金孢子菌文库。本领域技术人员能意识到何种杂交条件是适当的。核酸杂交、构建文库和克隆技术的常规方法见于Sambrook等(编辑)(1989),分子克隆实验手册,冷泉港出版社,Plainview,纽约和Ausubel等(编辑),分子生物学通用方法(1987),John Wiley和Sons,纽约。相关的信息也可见于后来的手册和专利,以及来自本领域各种商购的试剂盒。

在另外的一个实施方案中,所述的方法包含在允许蛋白质或多肽或其前体表达和优选分泌的条件下培养菌株,随后分离所产生的多肽并且任选将前体经过另外的分离和纯化步骤以得到所感兴趣的多肽。这样的方法可能包含将前体裂解为感兴趣的多肽或前体的合适的步骤。当一分泌的蛋白质载体和感兴趣的多肽由一个蛋白酶位点连接时,可使用Kex-2样蛋白酶、任一基本氨基酸配对的蛋白酶或Kex-2蛋白酶裂解。本领域熟练技术人员能够很容易地找到Kex-2样蛋白酶序列,因为现有一致序列的详细资料可以利用并且已经公开了许多其它的序列如弗林蛋白酶。

根据本发明任一实施方案生产多肽的方法,培养的合适pH值大于5,优选5-10,更优选6-9。在此方法中合适的培养温度是25-43℃,优选30-40℃。在此方法中所使用的菌株非常合适地是重组金孢子菌属菌株或其它真菌或非真菌菌株。本发明的这种方法可进一步以制备本发明的重组菌株为前提。合适条件的选择取决于待表达的多肽的性质,并且在本领域熟练技术人员的正常工作之内。

生产本发明重组菌株的方法也是本发明的一部分。此方法包含向合适的宿主菌株稳定引入一段编码异源或同源多肽的核酸片段,所述的核酸序列与一表达调节区域可操作连接,所述的引入以一种已知的转化丝状真菌的形式发生。如上所述有无数的参考文献可以利用,本文只引用了其中一小部分。所提供的信息足够使本领域熟练技术人员毫不费力地施行此方法。此方法包含引入一核酸序列,去包含在本发明重组菌株的各种不同的实施方案中所描述的任一核酸元件或去组合。

例如核酸的引入是通过原生质体转化的方法实现的。在实施例中详细叙述了此方法。正如在本领域其它丝状真菌中所描述的那样,也可以使用另外的原生质体或球芽转化技术。这些方法的详细细节可在许多引用的参考文献中找到,因此这些文献引入本文做参考。本发明合适的方法包含使用非重组菌株作为引入所希望的编码感兴趣多肽的核酸序列的起始材料。

本发明也包括生产金孢子菌属的酶的方法,所述的方法包含在pH值大于5,优选5-10,更优选6-9,6-7.5,7.5-9合适的中性和碱性pH范围的培养基中或培养基上培养金孢子菌属菌株或其它菌株。

通常来说,本发明进一步包含生产表现出中性或碱性最佳活性和/或稳定性,优选碱性最佳活性和/或稳定性的酶的方法。在本文的其它地方已经提供了优选的pH范围和相应的最佳活性以及测量活性的分析方法。如上所述,酶应选自碳水化合物降解酶、蛋白酶、其它水解酶、氧化还原酶和转移酶,所述的方法包含培养用编码相应的酶的核酸片段转化或转染的宿主细胞。金孢子菌属的酶是这样的合适的酶。合适的类似的方法包含生产特别是如纤维素酶、木聚糖酶、果胶酶、脂酶和蛋白酶,其中纤维素酶和木聚糖酶带有β-1,4-键,并且纤维素酶包含内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。本发明的方法可包含培养本发明的含有编码上述的这些酶的核酸的金孢子菌属宿主。本发明的合适的非重组金孢子菌属菌株主要生产碳水化合物降解酶、水解酶和蛋白酶。在这种情况下合适的酶是除纤维素酶以外的其它酶。分离方法等同于在WO 98/15633中所叙述的方法,此方法引入本文做参考。

本发明也包括由本发明所产生的酶。本发明也包括可从本发明的非重组金孢子菌属菌株中分离的金孢子菌属起源的酶。它们表现出前述的稳定性、活性特点。合适的是它们在LAS存在时也很稳定。特别要求保护的是具有前述活性稳定性特征的等电点为4-9.5的蛋白酶,分子量为25-95kD的蛋白酶;等电点为4.0-9.5的木聚糖酶,分子量为25-65kD的木聚糖酶;等电点为3.5-6.5的内切葡聚糖酶,分子量为25-55kD的内切葡聚糖酶;等电点为4-4.5的β-葡糖苷酶和α、β-半乳糖苷酶,分子量为45-50kD的β-葡糖苷酶和α、β-半乳糖苷酶;等电点为4-5的纤维二糖水解酶,分子量为45-75kD的纤维二糖水解酶例如等电点为4.5,分子量为55kD;等电点为4.0-5.0的多聚半乳糖醛酸酶,分子量为60-70kD如65kD的多聚半乳糖醛酸酶;等电点为4-5的酯酶,分子量为95-105kD的酯酶。分子量是通过SDS-PAGE电泳确定的。非重组酶即天然的酶是除在WO 98/15633中所公开的纤维素酶以外的其它酶。具有上面所提到的组合等电点和分子量的酶也包括在内。

本发明也涉及由本发明的突变(重组)菌株所(过量)产生的非蛋白质产物。这样的非蛋白质产物包括基础代谢产物如有机酸、氨基酸和次级代谢产物如抗生素,例如青霉素和头孢菌素。这些产物是组合几种生化途径的结果,涉及一些目的真菌基因。真菌的基础和次级代谢产物和在真菌中产生这些代谢产物的过程是本领域众所周知的。MatteyM在有机酸的产生,现代生物技术评论12,87-132(1992)一文中描述了基础代谢产物产生的例子。Penalva等在真菌中青霉素生物合成的优化,生物技术趋势16,483-489(1998)一文中描述了次级代谢产物产生的例子。

实施例对比转化金孢子菌、木霉和TOLYPOCLADIUM GEODES的实施例

在两种培养基(pH6.8的GS培养基和pH6.8的Pridham琼脂(PA)培养基)上测试了两株未转化的金孢子菌属C1菌株和一株T.reesei参考菌株。在培养了7天的PDA培养皿上收获孢子以检测其抗生素抗性水平。选择性培养皿置于32℃孵育并于第2、4和5天后测量其数值。发现C1菌株NG7C-19和UV18-25很明显对腐草霉素和潮霉素的基础抗性水平很低。这个抗性水平等同于常用的T.reesei实验室参考菌株的抗性水平。因此,很明显这两种标准的真菌选择标记可以很好地应用于金孢子菌属菌株。其它标准的真菌选择标记所带来的问题应该不会出现。

在50微克/毫升时成功地选择出了Sh ble(腐草霉素抗性)转化的金孢子菌属菌株。这也是用于T.reesei的选择水平,因此表明在金孢子菌属中可以很容易地达到差示选择。150微克/毫升时,上面的讨论同样适用于带有潮霉素抗性的转化菌株。

在普遍使用的真菌转化技术的基础上原生质体转化技术被用于金孢子菌属真菌。在一个直径为90毫米的PDA培养皿上所有的孢子被收获到8毫升的IC1培养液中并转移入带有50毫升IC1培养液的摇瓶中,35℃、200转/分钟孵育15小时。然后对培养物离心,沉淀用MnP溶液洗涤,然后重悬于10毫升MnP和10毫克/毫升的C3Caylase的溶液中并于35℃振荡(150转/分钟)孵育30分钟。

过滤溶液,滤液3500转/分钟离心10分钟。用10毫升的MnPCa2+溶液洗涤沉淀。然后于25℃再离心10分钟后加入50微升冷PMC溶液。混合物置于冰浴30分钟后加入2.5毫升PMC溶液。室温15分钟后,500微升处理的原生质体与3毫升MnR Soft混合并立即涂布于含有选择因子腐草霉素或潮霉素的MnR培养皿上。30℃孵育5天后分析转化体(48小时以后肉眼可见克隆),使用10微克pAN8-119参考质粒来测定转化效率。结果见下表1。

表1:转化效率(使用10μg的参照质粒pAN8-1)

    T.reesei  NG7C-19  UV18-25       存活力    106/200μl  5×106/200μl  5×106/200μl  每200μl的转化体    2500  104  104  每106活细胞的转化体    2500  2000  2000

金孢子菌转化体的存活力比木霉的好。所述菌株的转化能力相当,因此在一个实验中获得的金孢子菌转化体数目是T.reesei的4倍。因此金孢子菌转化系统不仅比得上常用的T.reesei系统,而且比其更好。这种改良尤其可以用于比pAN8-1的转化效力低的载体。这种低效力转化载体例如是生产非真菌蛋白质的蛋白质载体,其一般产生少10倍的转化体。

使用同源的金孢子菌蛋白质编码序列和异源的蛋白质编码序列构建了许多其它的转化和表达载体,以用于用金孢子菌进行的转化实验中。

表达系统例如包括一个金孢子菌木聚糖酶Xyl1启动子片段,其连接于木聚糖酶开放读框框架中的一个木聚糖酶信号序列,后接一个木聚糖酶终止子序列。通过与一个选择载体共转染而选择转化体。

另一个实例是Chrysosporium lucknowense纤维二糖水解酶启动子,其连接于青霉内切葡聚糖酶3开放读框框架中青霉内切葡聚糖酶3信号序列,后接金孢子菌纤维二糖水解酶终止子序列。另外,这个载体携带另一个表达盒,其具有一个选择标记,即乙酰胺酶S基因(AmdS基因)。

另一个实例包括金孢子菌甘油醛-3-磷酸脱氢酶1启动子,其连接于黑曲霉葡糖淀粉酶信号序列和融合于人白细胞介素6开放读框的葡糖淀粉酶开放读框。另外,这个载体携带另一个表达盒,其具有一个选择标记即AmdS基因。

再一个实例是构巢曲霉甘油醛-3-磷酸脱氢酶A启动子,其连接于内切葡聚糖酶5开放读框,后接一个构巢曲霉终止子序列。金孢子菌转化体的异源和同源表达实施例

对C1菌株(NG7C-19和/或UV18-25)分泌各种异源蛋白质的能力进行测试:所述异源蛋白质是一种细菌蛋白质(Streptoalloteichushindustanus腐草霉素抗性蛋白,Sh ble),一种真菌蛋白质(Trichodermareesei木聚糖酶II,XYN2)和一种人体蛋白质(人溶菌酶HLZ)。C1分泌的Trichoderma reesei木聚糖酶II(XYN2)

将C1菌株UV18-25用质粒pUT1064和pUT1065转化。pUT1064具有以下两种真菌表达盒:

第一种表达盒可以选择腐草霉素抗性转化体:

-Neurospora crassa交叉途径控制基因1(cpc-1)启动子14

-Streptoalloteichus hindustanus腐草霉素抗性基因Sh ble4

-构巢曲霉色氨酸合酶(trpC)终止子5

第二种表达盒是产生木聚糖酶的表达盒:

-T.reesei菌株TR2 cbh1启动子15

-T.reesei菌株TR2 xyn2基因(包括其信号序列)16

-T.reesei菌株TR2 cbh1终止子15

所述载体还携带来自质粒pUC196的一个大肠杆菌复制起点。所述质粒的详图见于图1。

pUT1065具有以下真菌表达盒:

-构巢曲霉甘油醛-3-磷酸脱氢酶(gpdA)启动子2

-合成的T.reesei纤维二糖水解酶I(cbh1)信号序列1,3

-用作载体蛋白10的S.hindustanus腐草霉素抗性基因Sh ble4

-一种接头肽(SGERK),其特征在于一个类KEX2蛋白酶裂解位点1

-T.reesei菌株TR2xyn2基因(没有信号序列)16

-构巢曲霉色氨酸合酶(trpC)终止子5

所述载体还携带β-内酰胺酶基因(bla)和一个来自质粒pUC186的大肠杆菌复制起点。所述质粒的详图见于图2。

将C1原生质体根据以上实施例中所述相同方法用质粒pUT1064或pUT1065C转化。质粒pUT1065中的融合蛋白(Sh ble∷XYN2)具有腐草霉素抗性功能,因此易于选择C1转化体。另外,腐草霉素抗性水平与xyn2表达水平大致相关。在pUT1064中,xyn2是与其自身信号序列一起克隆的。

对C1转化体(腐草霉素抗性克隆)产生的木聚糖酶通过以下木聚糖酶活性试验进行分析:将初级转化体用牙签挑至GS+腐草霉素(5ug/ml)平板上(确证抗性),并也置于XYLAN平板上(通过透明区观测17检测木聚糖酶活性)。将平板在32℃生长5天。将每个有效的克隆在XYLAN平板上亚克隆。将每个转化体的两个亚克隆用于接种PDA平板,以获得孢子开始进行液体培养。将在IC1+5g/l邻苯二甲酸钾中的液体培养物在27℃生长5天(以180rpm振荡)。然后,将培养物离心(5000g,10分钟)。从这些样品中,通过Miller等所述DNS方法测定木聚糖酶活性。

表2:在C1(最佳生产菌)中活性XYN2的生产水平

培养物培养基中的活性  木聚糖酶II浓度培养物培养基中的木聚    糖酶II比活性   未转化的UV18-25     3.9U./ml  3.8U./mg总蛋白质UV 18-25∷1064克隆7-1     4.7U./ml  4.7U./mg总蛋白质UV 18-25∷1064克隆7-2     4.4U./ml  4.3U./mg总蛋白质UV 18-25∷1065克隆1-1     29.7U./ml  25.6U./mg总蛋白质UV 18-25∷1065克隆1-2     30.8U./ml  39.4U./mg总蛋白质

这些数据示出:

1)实施例2中的1-4点得以证实。

2)C1可以用作分泌异源真菌蛋白的宿主。

实施例附录:培养基

转化培养基:

Mandels Base:                           MnP培养基:

KH2PO4      2.0g/l                    Mandels Base加上

(NH4)2SO4  1.4g/l                    肽胨1g/l

MgSO4·7H2O 0.3g/l                    MES 2g/l

CaCl2        0.3g/l                    蔗糖100g/l

少量元素      1.0ml/l                   调整pH至5

MnR                                     MnP CA2+

MnP+蔗糖      130g/l                    MnP培养基+

酵母提取物  2.5g/l         CaCl2·2H2O 50mM

葡萄糖      2.5g/l         调整pH至6.5

琼脂        15g/l

MnR Soft:仅加7.5g/l琼脂的MnR

MPC:

CaCl2     50mM         pH5.8

MOPS       10mM

PEG        40%

用于选择和培养

GS:

葡萄糖      10/gl

Biosoyase   5g/l    [Merieux]

琼脂        15g/l   pH应为6.8

PDA:

马铃薯右旋糖琼脂  39g/l    [Difco]

                           pH应为5.5

MPG:

Mandels Base加上

K.Phtalate                  5g/l

葡萄糖                      30g/l

酵母提取物                  5g/l

补加50μg/ml腐草霉素或100-150μg/ml潮霉素的再生培养基(MnR)用于选择转化体。补加5μg/ml腐草霉素的GS培养基用于证实抗生素抗性。

PDA是一种用于快速生长和良好形成孢子的完全培养基。用1/20的孢子悬浮液(来自一个90mm的PDA平板的所有孢子在5ml0.1%Tween中)接种液体培养基。将这种培养物在27℃在摇瓶中生长(200rpm)。C1基因和CBHI,XYLI和GPD基因表达序列的分离及定性构建UV18-25的BlueSTAR基因文库

将UV18-25的染色体DNA用Sau3A部分消化,分离12-15kb的片段,并连接于克隆载体BlueSTAR的一个BamHI位点中。对20%的连接混合物进行包装,产生一个4.6×104个独立克隆的基因文库。将此文库倍增,并贮存于4℃和-80℃。其它连接混合物也贮存于4℃。筛选UV18-25的基因文库以分离cbh1,xyl1和gpd1基因

为分离不同的基因,将每个探针以合计7.5×104个独立BlueSTAR噬菌体双份杂交。用cbh1和xyl1的PCR片段(如WO00/20555所述),在同源条件下(65℃;0.2×SSC)进行杂交,及用黑曲霉的gpd1基因在异源条件下(53℃;0.5×SSC)进行杂交。阳性信号的数目示于表3。将阳性克隆再筛选,并针对每个克隆使用两种不同的噬菌体进行进一步实验。将不同克隆的DNA通过限制分析加以分析,以确定分离自每个基因的不同克隆数目(结果示于表3)。针对这3种基因的每一种,分离4-6个不同克隆,我们推断所述初级基因文库(4-5×104个克隆)代表大约5倍的UV18-25基因组。从这个结果中,我们推断UV18-25的完整基因组以9×103个克隆表示。基于13kb的平均基因组插入体,表明一个120Mb大小的基因组,其是曲霉基因组大小的3倍。

用针对所述质粒上存在的基因的特异性引物(基于预先从分离的PCR片段中确定的序列),和pBlueSTAR多接头中存在的T7和T3引物进行PCR反应,我们能确定基因在众多克隆中的位置。对于每个基因,使用一个质粒以确定所述基因的序列。表3:用UV18-25的PCR片段筛选UV18-25基因文库的7.5×104个噬菌体以获得cbh1基因和xyl1基因(同源条件)和黑曲霉(A.niger)的gpdA基因(异源条件)。使用DNA分离和限制分析测定不同克隆的数目。

  基因第一次筛选阳性数再次筛选阳性数  不同克隆用于测序的克隆  cbh1       8      7     4    pCBH7  xyl1       9      6     5    PXy15  gpd1       12      12     6    PGPD4
克隆的基因的序列分析

针对cbh1,xyl1和gpd1基因,序列测定的结果分别示于SEQ IDNo:1,3和5。推导的蛋白质氨基酸序列示于SEQ ID No:2,4和6。所述蛋白质的一些性质见于表4。应提及的是翻译起始位点和内含子的位置基于与来自相同家族的基因的同源性(即纸上遗传学)而定。CBH1

从CBH1的氨基酸序列中,我们推断所述蛋白质的大小大约为63kDa,而且在所述蛋白质的C末端部分存在一个纤维素结合结构域(CBD)。令人感兴趣地,在分离的55kD的主要蛋白质中未发现有存在CBD的迹象。然而,在所述编码的CBH1蛋白(SEQ ID No.1,2)中存在来自这个55kD主要蛋白的分离的肽,证实所述55kD的蛋白质是由克隆的基因编码的。对这些结果的一种可能的解释是所述55kD的蛋白质是缺失CBD的CBH1蛋白的一种截短形式。

所述纤维二糖水解酶CBH1具有抗MUF-纤维二糖苷,MUF-乳糖苷,FP和微晶纤维素的活性,还具有抗对硝基苯基β-葡糖苷,纤维二糖和对硝基苯基乳糖苷的活性。其对于MUF纤维二糖苷的活性由纤维二糖抑制,抑制常数为0.4mM。对于MUF纤维二糖苷的Michaelis常数为0.14mM,对于MUF乳糖苷的Michaelis常数为4mM,对于CMC为3.6g/l。最适宜的pH为4.5-7。在pH8保持50%对于CMC的最大活性和80%对于RBB-CMC的活性。在pH5-8内在25小时温育期间保持70-80%活性。最适宜的温度是60-70℃。CBH1是纤维二糖水解酶7家族的一个成员。相应的CBH启动子,是本发明的一个优选实施方案,示为SEQ ID No.1。Xyl1

从Xyl1的氨基酸序列中,我们推断在这个蛋白质的N末端也存在一个CBD(即直接附于信号序列或与其有少于5个氨基酸的间隔)。在文献中,已知具有CBD的木聚糖酶很少(Fusariumoxysporum,Humicola grisea和Neocallimastix patriciarum)。估计Xyl1蛋白的大小为43kD,而且从源于这个蛋白质的一个30kD的木聚糖酶中分离到一些肽(SEQ ID No.3,4)。一些分离的肽在编码序列中不能发现。这可以表明在UV 18-25中存在另一种木聚糖酶。在先前的分析中,未发现在此30kDa蛋白质中有存在CBD的迹象。从这些结果中,我们推测蛋白质的CBD通过蛋白酶解而裂解掉。对这个推测进行进一步分析(通过测定如下不同的C1菌株中不同蛋白质的活性,N末端序列和大小而分析:C1野生型,NG7C,UV13-6,UV18-25和UV18-25的蛋白酶突变体)。CBD是否存在对酶活性的作用也进行更详细分析。

可以考虑全长基因在各种C1宿主中的过表达情况。

存在一个纤维素结合结构域(CBD)是这种酶的一个特征。具有一个N末端CBD的唯一其它已知家族10糖酵解酶(木聚糖酶)是Fusarium oxysporum XylF。Chrysosporium lucknowense Xyl1蛋白的CBD具有以下序列:WGQCG GQGWT GPTTC VSGAV CQFVNDWYSQ CV(SEQ ID No.4的22-53位氨基酸)。这个序列与美国专利5763254(Novo)所述CBD共有序列不一致。美国专利5763254的CBD共有序列是:W/Y-G/A-Q-C-G G-Q/I/N-G/N-W/F/Y-S/T/N/QG-P/A/C-T/R/K-T/C/N-C X-X-G/P-S/T/F/L/A/--T/K C-V/T/R/E/K-K/Q/A-Q/I-N Q/D/A-W/F/Y-Y-Y/S/H/A-Q C-L/I/Q/V/T,其中W/Y意味着W或Y等,X意味着任何氨基酸,-意味着不存在氨基酸。在Xyl1中存在与最简并共有序列的4处不同,在上述序列7中以下划线表示。本发明因此涉及N末端CBD不同于这个共有的CBD且不同于Fusarium oxysporum木聚糖酶的木聚糖酶。更特别地,本发明的木聚糖酶的CBD与上述序列7具有至少55%,尤其至少65%,优选至少75%相同性。优选地,所述CBD在第23位含有氨基酸Phe,Tyr和Trp之一,或至少如下这四种氨基酸之一:在第20位含有Val氨基酸、在第22位含有Gln,在第23位含有Phe,及在第24位含有Val。优选的序列包含Cys-Xaa-Phe,Xaa-Phe-Val,Cys-Xaa-Phe-Val,Cys-Gln-Phe,Val-Cys-Xaa-Phe,Gln-Phe-Val,Gln-Trp-Val,Gln-Tyr-Val,Val-Cys-Gln,Val-Cys-Gln-Phe,和Val-Cys-Xaa-Phe-Val,其中Xaa是任何氨基酸或优选是Val,Thr,Arg,Glu,Gln或Lys,或者最优选是Gln或Glu。

所述木聚糖酶不具有MUF纤维二糖酶活性,而且因此是一种真木聚糖酶。其在pH5-8的广泛范围内具有高度活性,在pH9-10保持65%的最大活性,其是木聚糖酶F家族的一个成员。相应的木聚糖酶启动子,其是本发明的一个优选实施方案,示于SEQ ID No.3。对于桦树木聚糖的Michaelis常数是4,对于30kD木聚糖酶为2g/l。最适温度高,等于木聚糖酶的70℃。Gpd1

gpd1基因的C末端部分的DNA序列未确定。这个基因的启动子序列是本发明的一个优选实施方案,示于SEQ ID No.5。

通过Northern分析研究金孢子菌四种基因的表达水平。将C.lucknowense的各种菌株在33℃生长于含有药基及纤维素和乳糖的丰富培养基(培养基1),或含有药基和葡萄糖的丰富培养基(培养基2)中。在48小时后,收获菌丝体并分离RNA。将所述RNA用4种不同的探针杂交:EG5,EG6,Xyl1和CBH。在曝光后,将Northern印迹剥离,并用核糖体L3的探针再杂交,以对照印迹上mRNA的数量。在培养基1中,大多数菌株示出对CBH的极高应答,及对Xyl1的高度应答;在培养基2中,一半菌株示出对所有基因高度应答,另一半示出低应答。从这些数据中推导的表达强度顺序是CBH>XylI>EG5>EG6。

C.lucknowense的蛋白质Xyl1与基因库DATABASE中其最接近的同源物具有67%相同性(72%同源性)(表4)。CBH1蛋白与其相关的Humicola grisea同源物的的强同源性(74%相同性/82%同源性)值得注意。还应指出的是在所有情况中,最接近的同源物源自Fusarium,Humicola或其它核菌(Sordariamycetous)真菌(表4),而金孢子菌属于NCBI数据库中的不整子囊菌(Eurotiomycetous)真菌(表4)。因此本发明还涉及包含一个CBD的聚糖水解酶,尤其纤维二糖水解酶和木聚糖酶,所述CBD衍生自不整子囊菌真菌。

表4:本发明的CBHI,Xyl1和GPD1的结构和对比数据

 糖苷酶 家族 从C1 分离氨基酸数内含子 说明相关序列(%相同性/%同源性CBH1 7 70kD 55kD526(63kD)1 CBDHumicola grisea(74/82)(CBH1:P15828)Fusarium oxysporum(58/68)(CBH:P46238)Neurospora crassa(60/69)(CBH1:P38676)XYL1 10 30kD333(43kD)3 CBDFusarium oxysporum(67/72)(XylF:P46239)Penicillium simplissicum(63/72)(XylF:P56588)Aspergillus aculeatus(61/70)(XylF:O59859)GPD1 - -不完整2+? -Podospora anserina(85/89)(GPD:P32637)Neurospora crassa(80/86)(GPD:U67457)Cryphonectria parasitica(80/85)(GPD:P19089)

附图描述

图1是pUT1064图。

图2是pUT1065图。

参考文献(其内容在此并入参考)

1.Calmels T.P.,Martin F.,Durand H.和Tiraby G.(1991),在真菌中分泌蛋白质过程中的蛋白酶解情况,生物技术杂志17(1):p.51-66。

2.Punt P.J.,Dingemanse M.A.,Jacobs-Meijsing B.J.,Pouwels P.H.,和van den Hondel C.A.(1988),分离和定性Aspergillus nidulans的三磷酸甘油醛脱氢酶基因,基因69(1):p.49-57。

3.Shoemaker S.,Schweickart V.,Ladner M.,Gelfand D.,Kwok S.,Myambo K.,和Innis M.(1983),衍生自Trichoderma reesei菌株L27的外纤维二糖水解酶I的分子克隆,生物/技术10:691-696。

4.Drocourt D.,Calmels T.,Reynes J.P.,Baron M.,和Tiraby G.(1990),转化腐草霉素抗性低等和高等真核细胞的Streptoalloteichushindustanus ble基因的表达盒,核酸研究18(13):p.4009。

5.Mullaney E.J.,Hamer J.E.,Roberti K.A.,Yelton M.M.,和Timberlake W.E.(1985),来自Aspergillus nidulans的trpC基因的初级结构,分子基因遗传199(1):p37-45。

6.Yanisch-Perron C.,Vieira J.,和Messing J.(1987),改良的M13噬菌体克隆载体和宿主菌株:M13mp18和pUC19载体的核苷酸序列,基因33:103-119。

7.Durand H.,Baron M.,Calmels T.,和Tiraby G.(1988),应用于Trichoderma reesei的传统和分子遗传学以选择改良的分解纤维素的工业菌株,纤维素酶降解的生物化学和遗传学,J.P.Aubert编辑,学术出版社,p135-151。

8.Lowry O.H.,Rosebrough N.J.,Farr A.L.,and Randall R.J.(1951),用thefolin苯酚试剂测定蛋白质,生物化学杂志193:265-275。

9.Parriche M.,Bousson J.C.,Baron M.,and Tiraby G.,在丝状真菌中产生异源蛋白质分泌系统,第三版,欧洲真菌遗传学会议,1996.Miinster,德国。

10.Baron M.,Tiraby G.,Calmels T.,Parriche M.,和Durand H.(1992),通过Tolypocladium geodes真菌融合于Sh ble腐草霉素抗性蛋白的人溶菌酶的有效分泌,生物技术杂志24(3):p253-266。

11.Jeenes D.J.,Marczinke B.,MacKenzie D.A.,和Archer D.B.(1993),从黑曲霉中分泌异源蛋白质的一种截短的葡糖淀粉酶基因,FEMS微生物学通信107(2-3):p.267-271。

12.Stone P.J.,Makoff A.J.,Parish J.H.,和Radford A.(1993),neurospora-crassa葡糖淀粉酶基因的克隆和序列分析,现代遗传学24(3):p.205-211。

13.Morsky P.(1983),用微球菌lysodeikticus细胞对溶菌酶进行浊度测定:反应条件的复试,分析生物化学128:77-85。

14.Paluh J.L.,Orbach M.J.,Legerton T.L.,和Yanofsky C.(1988),Neurospora crassa的交叉途径控制基因cpc-1,其编码类似于酵母GCN4的蛋白质和致癌基因v jun编码的蛋白质的DNA结合结构域,美国科学院院报85(11):p3728-32。

15.Nakari T.,Onnela M.L.,Ilmen M.,Nevalainen K.,和Penttil M.(1994),在存在葡萄糖的情况下激活的真菌启动子,WO 94/04673,Alko。

16.Torronen A.,Mach R.L.,Messner R.,Gonzalez R.,KalkkinenN.,Harkki A.,和Kubicek C.P.(1992),来自Trichoderma reesei的两种主要的木聚糖酶:对这两种酶和基因的定性,生物技术(NY)10(11):p1461-5。

17.Farkas V.(1985),检测生产纤维素酶和木聚糖酶的微生物的新培养基,FEMS微生物学通信28:137-140。

18.Miller G.L.(1959),使用二硝基水杨酸试剂测定还原糖,分析化学31:426-428。

19.Punt P.J.,Mattem I.E.,van den Hondel C.A.M.J.J.(1988),授予腐草霉素抗性的曲霉菌转化载体,真菌遗传学时事通讯35,25-30。

                             序列表SEQ ID No.1:

包括启动子和终止子序列的完整金孢子菌CBH1基因的DNA序列和氨基酸序列。启动子序列(1-1779),终止子序列(3427-4451)和内含子序列(2179-2256)以小写字母示出。aaggtatccgatttggggaacgtcgatgaaagtattgcaaaagtgacgagagttgcgcaa  60ctaactcgctgccgaagaagctgcggaagaaagagaacaccgaaagtggaataacgttac 120ggatgtcctgacctcaaagttgaaaccagcccttcctgctctatttgggaaagcggcttg 180cccttgaatgcgctgcactgtggcacgactaccagtgatcgggaggagcaaactaccctg 240gtccgttccttggtggggcggcactaggcccaacttagggtgatcggaggtcgatgccgc 300ggtcctcgttggtctgggctcttctcatttcccggtttgcaccccccgttgcacctgctg 360atcgcccgccaacgccgatgaggttgcgcccagaccgacaatcaccgcggctgcattccc 420aagtatattgaagatggcaccaggtacccggttttgcgtcccagtcgtttggtgccaaat 480ttgggagtttttgagcctcaagatctggggaaatcgacctcaacttccatacaagttaaa 540gtcgcacacacggcgagttccacgaagagacacatttttttctgaaggcctctctccccg 600cacatcagaaaccaccaaataccaagactgcagaagccggggtaagtgggccaccgggac 660tacactaaaatgcggggagaagcgagatccgttgcgaagggaagggatggggtgtgctgc 720ggctttctccgctctcgtgcgccttttgcttgaatctagtgtacaccagggtaggctccg 780aaggagtatctacggcagcgctgttcgtgctgcgttgagagtcagggcggagacgagcag 840gcgacaggagcctcgcaccggcacttcggatcgcatttgcgcggagcgtcaaatacgctc 900ttctgcggtcatcagagagcatcgtgaaccaaggttcttccgcagggcggcctgggcttc 960gcagagtcgcactcggcggacgccttccgtgtcacccctgataacctggctgccgcgccc 1020agactcctccaatgaggtgtgtggttgccctcgccgacccttcagcaaccttaatcgctt 1080ccatcgcacggctccacgtcctcgaacgatgccctcagtccgtgcccggccgtggcaacc 1140ataacgtgacatcgccgcccagcctactagccgctatcgaccggttaggcttgtcaccgc 1200agcgcccattctccatcgggcctctactctgatccacctcacccaccgcaagcactagcg 1260agcctcaccagagtgcaagcgacacgacccgcttggcccttcgtccttgactatctccca 1320gacctcttgccatcttgccgacgccgcccccttttttttctcctccccctgccggcaggt 1380cggtggccccagtcccgagatggcattgctccgttgtccatgacgacccatcattcgatg 1140gctgactggcacactcgtcttgtttgagcatcgacggcccgcggcccgtctcccacggta 1500cggaacctcgttgtacagtacctctcgtaatgatacccaacaccggggccgagcgctggg 1560agggcggcgttcccgagaagccgggaaggcggctggccggctgacctttgtgacttggcg 1620atggatgcggccatggagaatgtccgtccgaagcgacgcgacaattagcctggctaccat 1680cgatataaattgggtgattcccagctcttgatgggcgtgtcttctgcctggcagccctcg  1740tcttcagatcaagcaactgtgtgctgatcctcttccgccATGTACGCCAAGTTCGCGACC  1800

                                    M  Y  A  K  F  A  TCTCGCCGCCCTTGTGGCTGGCGCCGCTGCTCAGAACGCCTGCACTCTGACCGCTGAGAAC  1860 L  A  A  L  V  A  G  A  A  A  Q  N  A  C  T  L  T  A  E  NCACCCCTCGCTGACGTGGTCCAAGTGCACGTCTGGCGGCAGCTGCACCAGCGTCCAGGGT  1920 H  P  S  L  T  W  S  K  C  T  S  G  G  S  C  T  S  V  Q  GTCCATCACCATCGACGCCAACTGGCGGTGGACTCACCGGACCGATAGCGCCACCAACTGC  1980 S  I  T  I  D  A  N  W  R  W  T  H  R  T  D  S  A  T  N  CTACGAGGGCAACAAGTGGGATACTTCGTACTGCAGCGATGGTCCTTCTTGCGCCTCCAAG  2040 Y  E  G  N  K  W  D  T  S  Y  C  S  D  G  P  S  C  A  S  KTGCTGCATCGACGGCGCTGACTACTCGAGCACCTATGGCATCACCACGAGCGGTAACTCC  2100 C  C  I  D  G  A  D  Y  S  S  T  Y  G  I  T  T  S  G  N  SCTGAACCTCAAGTTCGTCACCAAGGGCCAGTACTCGACCAACATCGGCTCGCGTACCTAC  2160 L  N  L  K  F  V  T  K  G  Q  Y  S  T  N  I  G  S  R  T  YCTGATGGAGAGCGACACCAAGTACCAGAgtaagttcctctcgcacccggccgccgggaga  2220 L  M  E  S  D  T  K  Y  Q  MtgatggcgcccagcccgctgacgcgaatgacacaGTGTTCCAGCTCCTCGGCAACGAGTT  2280

                                  F  Q  L  L  G  N  E  FCACCTTCGATGTCGACGTCTCCAACCTCGGCTGCGGCCTCAATGGCGCCCTCTACTTCGT  2340 T  F  D  V  D  V  S  N  L  G  C  G  L  N  G  A  L  Y  F  VGTCCATGGATGCCGATGGTGGCATGTCCAAGTACTCGGGCAACAAGGCAGGTGCCAAGTA  2400 S  M  D  A  D  G  G  M  S  K  Y  S  G  N  K  A  G  A  K  YCGGTACCGGCTACTGTGATTCTCAGTGCCCCCGCGACCTCAAGTTCATCAACGGCGAGGC  2460 G  T  G  Y  C  D  S  Q  C  P  R  D  L  K  F  I  N  G  E  ACAACGTAGAGAACTGGCAGAGCTCGACCAACGATGCCAACGCCGGCACGGGCAAGTACGG  2520 N  V  E  N  W  Q  S  S  T  N  D  A  N  A  G  T  G  K  Y  GCAGCTGCTGCTCCGAGATGGACGTCTGGGAGGCCAACAACATGGCCGCCGCCTTCACTCC  2580 S  C  C  S  E  M  D  V  W  E  A  N  N  M  A  A  A  F  T  PCCACCCTTGCACCGTGATCGGCCAGTCGCGCTGCGAGGGCGACTCGTGCGGCGGTACCTA  2640 H  P  C  W  V  I  G  Q  S  R  C  E  G  D  S  C  G  G  T  YCAGCACCGACCGCTATGCCGGCATCTGCGACCCCGACGGATGCGACTTCAACTCGTACCG  2700 S  T  D  R  Y  A  G  I  C  D  P  D  G  C  D  F  N  S  Y  RCCAGGGCAACAAGACCTTCTACGGCAAGGGCATGACGGTCGACACGACCAAGAAGATCAC  2760 Q  G  N  K  T  F  Y  G  K  G  M  T  V  D  T  T  K  K  I  TGGTCGTCACCCAGTTCCTCAAGAACTCGGCCGGCGAGCTCTCCGAGATCAAGCGGTTCTA  2820 V  V  T  Q  F  L  K  N  S  A  G  E  L  S  E  I  K  R  F  YCGTCCAGAACGGCAAGGTCATCCCCAACTCCGAGTCCACCATCCCGGGCGTCGAGGGCAA  2880 V  Q  N  G  K  V  I  P  N  S  E  S  T  I  P  G  V  E  G  NCTCCATCACCCAGGACTGGTGCGACCGCCAGAAGGCCGCCTTCGGCGACGTGACCGACTT  2940 S  I  T  Q  D  W  C  D  R  Q  K  A  A  F  G  D  V  T  D  ?NCAGGACAAGGGCGGCATGGTCCAGATGGGCAAGGCCCTCGCGGGGCCCATGGTCCTCGT  3000  Q  D  K  G  G  M  V  Q  M  G  K  A  L  A  G  P  M  V  L  VCATGTCCATCTGGGACGACCACGCCGTCAACATGCTCTGGCTCGACTCCACCTGGCCCAT  3060  M  S  I  W  D  D  H  A  V  N  M  L  W  L  D  S  T  W  P  ICGACGGCGCCGGCAAGCCGGGCGCCGAGCGCGGTGCCTGCCCCACCACCTCGGGCGTCCC  3120  D  G  A  G  K  P  G  A  E  R  G  A  C  P  T  T  S  G  V  PCGCTGAGGTCGAGGCCGAGGCCCCCAACTCCAACGTCATCTTCTCCAACATCCGCTTCGG  3180  A  E  V  E  A  E  A  P  N  S  N  V  I  F  S  N  I  R  F  GCCCCATCGGCTCCACCGTCTCCGGCCTGCCCGACGGCGGCAGCGGCAACCCCAACCCGCC  3240  P  I  G  S  T  V  S  G  L  P  D  G  G  S  G  N  P  N  P  PCGTCAGCTCGTCCACCCCGGTCCCCTCCTCGTCCACCACATCCTCCGGTTCCTCCGGCCC  3300  V  S  S  S  T  P  V  P  S  S  S  T  T  S  S  G  S  S  G  PGACTGGCGGCACGGGTGTCGCTAAGCACTATGAGCAATGCGGAGGAATCGGGTTCACTGG  3360  T  G  G  T  G  V  A  K  H  Y  E  Q  C  G  G  I  G  F  T  GCCCTACCCAGTGCGAGAGCCCCTACACTTGCACCAAGCTGAATGACTGGTACTCGCAGTG  3420  P  T  Q  C  E  S  P  Y  T  C  T  K  L  N  D  W  Y  S  Q  CCCTGTAAacgaacctctctgaaggaggttctgagacacgcgcgattcttctgtatatagt  3480  L  *tttatttttcactctggagtgcttcgctccaccagtacataaaccttttttttcacgtaa  3540caaaatggcttcttttcagaccatgtgaaccatcttgatgccttgacctcttcagttctc  3600actttaacgtagttcgcgttagtctgtatgtcccagttgcatgtagttgagataaatacc  3660cctggaagtgggtctgggcctttgtgggacggagccctctttctgtggtctggagagccc  3720gctctctaccgcctaccttcttaccacagtacactactcacacattgctgaactgaccca  3780tcataccgtactttatcctgttaattcgtggtgctgtcgactattctatttgctcaaatg  3840gagagcacattcatcggcgcagggatacacggtttatggaccccaagagtgtaaggacta  3900ttattagtaatattatatgcctctaggcgccttaacttcaacaggcgagcactactaatc  3960aacttttggtagacccaattacaaacgaccatacgtgccggaaattttgggattccgtcc  4020gctctccccaaccaagctagaagaggcaacgaacagccaatcccggtgctaattaaatta  4080tatggttcattttttttaaaaaaattttttcttcccattttcctctcgcttttctttttc  4140gcatcgtagttgatcaaagtccaagtcaagcgagctatttgtgctatagctcggtggcta  4200taatcagtacagcttagagaggctgtaaaggtatgataccacagcagtattcgcgctata  4260agcggcactcctagactaattgttacggtctacagaagtaggtaataaaagcgttaattg  4320ttctaaatactagaggcacttagagaagctatctaaatatatattgaccctagcttatta  4380tccctattagtaagttagttagctctaacctatagatagccaaatgctataataggtacc  4440agggttcaaaa 4451SEQ ID No:2:

完整金孢子菌CBH1蛋白的氨基酸序列。推定的信号肽(1-19)以斜体字示出,纤维素结合结构域(496-526)以粗体下划线示出。 CTLTAENHPS LTWSKCTSGG SCTSVQGSIT   50IDANWRWTHR TDSATNCYEG NKWDTSYCSD GPSCASKCCI DGADYSSTYG               100ITTSGNSLNL KFVTKGQYST NIGSRTYLME SDTKYQMFQL LGNEFTFDVD               150VSNLGCGLNG ALYFVSMDAD GGMSKYSGNK AGAKYGTGYC DSQCPRDLKF               200INGEANVENW QSSTNDANAG TGKYGSCCSE MDVWEANNMA AAFTPHPC?V              250IGQSRCEGDS CGGTYSTDRY AGICDPDGCD FNSYRQGNKT FYGKGMTVDT               300TKKITVVTQF LKNSAGELSE IKRFYVQNGK VIPNSESTIP GVEGNSITQD               350WCDRQKAAFG DVTD?QDKGG MVQMGKALAG PMVLVMSIWD DHAVNMLWLD              400STWPIDGAGK PGAERGACPT TSGVPAEVEA EAPNSNVIFS NIRFGPIGST               450VSGLPDGGSG NPNPPVSSST PVPSSSTTSS GSSGPTGGTG VAKHY          500 *  526SEQ ID No.3

包括启动子和终止子序列的完整金孢子菌Xyl1基因的DNA序列。启动子序列(1-969),终止子序列(2428-3030(3028))和内含子序列(1043-1116,1181-1332(1331),1596(1595)-1674(1672))以小写字母示出。tcatcaacttggcgtttggatgtactaatattacacgtcgtttgcnnagcggagtctgtg   60tcatctccgtggggtcgggtgctccagacgacgcttcgggccgatcctgaattcgggaag  120gaaacggttcggctaatcaggtcctctaaaatataacgaagcactacagagggagttcct  180cagaggacatcgtatcaaccgaagaacgaagcgccgaaaggactgatcaaaacaggagta  240ggtagggatgtgtgagtacctaaactttccatacctgacataaaatcatcatggtgcttc  300agacctgtttgatgaggcgagggcggaggccgcattgtattttcgttccttccttctttt  360tgttagtatatctnagggttccatcgtaaaatggaatcttccagctctactagtaattag  420aacaatagttctgatgtcgtgcgccaagctttttcagatgactgccaaaaacccatcatg  480ggtatggacaaaagcagtaatcggagtcacaacgccgcattttccttcatgatttccgtc  540aaccggagaggtcggaggaggactccggccacatgtgatgcgaagaagtacatggcgcca  600tggttctaacctcttatagtctgaaaatgcgcggaggccagcgaagccaagcccgggaac  660cgttcttgtcatggtttcagtattgtttcgctaaacattctatccgattcgcgataggtg  720cggctgccaccgaaggttgtatccttaaagctttggtaagtacggagtacggaaatggaa  780acgcgccgcagtcctggttccatcggtatcctccgcatgctccgccaaaaaaagaaaacc  840cgggtatgtttacaaaggatataagagacaagatgcaccacccgcccccttcccatctgc  900cggttgcccacgtcgccgtcgactgcttgtccgcttcctacctgcagcctctttcagaga  960ccatcaaacATGCGTACTCTTACGTTCGTGCTGGCAGCCGCCCCGGTGGCTGTGCTTGCC  1020

      M  R  T  L  T  F  V  L  A  A  A  P  V  A  V  L  ACAATCTCCTCTGTGGGGCCAGTgtatgtaattgccttactcggaaaatagtcaccactag  1080 Q  S  P  L  W  G  Q  CagggacttaagctcactacttcctgtttcacaatagGCGGCGGTCAAGGCTGGACAGGTC  1140

                                   G  G  Q  G  W  T  GCCACGACCTGCGTTTCtGGCGCAGTATGCCAATTCGTCAAgtcagtaactgcttttatt   1200P  T  T  C  V  S  G  A  V  C  Q  F  V  Ntctttcctctctgggattacgatttcgttttgcacttagcttggttctgcatttcattgt  1260tgtattgttctctttttgtgtgtgagaggttttattaccacctaaaggccatttgctaac  1320aaatctccccagTGACTGGTACTCCCAATGCGTGCCCGGATCGAGCAACCCTCCTACGGG  1380

          D  W  Y  S  Q  C  V  P  G  S  S  N  P  P  T  GCACCACCAGCAGCACCACTGGAAGCACCCCGGCTCCTACTGGCGGCGGCGGCAGCGGAAC  1440  T  T  S  S  T  T  G  S  T  P  A  P  T  G  G  G  G  S  G  TCGGCCTCCACGACAAATTCAAGGCCAAGGGCAAGCTCTACTTCGGAACCGAGATCGATCA  1500  G  L  H  D  K  F  K  A  K  G  K  L  Y  F  G  T  E  I  D  HCTACCATCTCAACAACAATGCCTTGACCAACATTGTCAAGAAAGACTTTGGTCAAGTCAC  1560  Y  H  L  N  N  N  A  L  T  N  I  V  K  K  D  F  G  Q  V  TTCACGAGAACAGCTTGAAGTGGGATGCTACTGAGCgtgagtgacctctcctccttctccc  1620  H  E  N  S  L  K  W  D  A  T  E  PgacaataatagataattacgagccggttcgaggctgacattgcgcgattctagCGAGCC   1680

                                                  S  RGCAATCAATTCAACTTTGCCAACGCCGACGCGGTTGTCAACTTTGCCCAGGCCAACGGCA  1740 N  Q  F  N  F  A  N  A  D  A  V  V  N  F  A  Q  A  N  G  KAGCTCATCCGCGGCCACACCCTCCTCTGGCACTCTCAGCTGCCGCAGTGGGTGCAGAACA  1800 L  I  R  G  H  T  L  L  W  H  S  Q  L  P  Q  W  V  Q  N  ITCAACGACCGCAACACCTTGACCCAGGTCATCGAGAACCACGTCACCACCCTTGTCACTC  1860 N  D  R  N  T  L  T  Q  V  I  E  N  H  V  T  T  L  V  T  RGCTACAAGGGCAAGATCCTCCACTGGGACGTCGTTAACGAGATCTTTGCCGAGGACGGCT  1920 Y  K  G  K  I  L  H  W  D  V  V  N  E  I  F  A  E  D  G  SCGCTCCGCGACAGCGTCTTCAGCCGCGTCCTCGGCGAGGACTTTGTCGGCATCGCCTTCC  1980 L  R  D  S  V  F  S  R  V  L  G  E  D  F  V  G  I  A  F  RGCGCCGCCCGCGCCGCCGATCCCAACGCCAAGCTCTACATCAACGACTACAACCTCGACA  2040 A  A  R  A  A  D  P  N  A  K  L  Y  I  N  D  Y  N  L  D  ITTGCCAACTACGCCAAGGTGACCCGGGGCATGGTCGAGAAGGTCAACAAGTGGATCGCCC  2100 A  N  Y  A  K  V  T  R  G  M  V  E  K  V  N  K  W  I  A  QAGGGCATCCCGATCGACGGCATCGGCACCCAGTGCCACCTGGCCGGGCCCGGCGGGTGGA  2160 G  I  P  I  D  G  I  G  T  Q  C  H  L  A  G  P  G  G  W  NACACGGCCGCCGGCGTCCCCGACGCCCTCAAGGCCCTCGCCGCGGCCAACGTCAAGGAGA  2220 T  A  A  G  V  P  D  A  L  K  A  L  A  A  A  N  V  K  E  ITCGCCATCACCGAGCTCGACATCGCCGGCGCCTCCGCCAACGACTACCTCACCGTCATGA  2280 A  I  T  E  L  D  I  A  G  A  S  A  N  D  Y  L  T  V  M  NACGCCTGCCTCCAGGTCTCCAAGTGCGTCGGCATCACCGTCTGGGGCGTCTCTGACAAGG  2340 A  C  L  Q  V  S  K  C  V  G  I  T  V  W  G  V  S  D  K  DACAGCTGGAGGTCGAGCAGCAACCCGCTCCTCTTCGACAGCAACTACCAGCCAAAGGCGG  2400 S  W  R  S  S  S  N  P  L  L  F  D  S  N  Y  Q  P  K  A  ACATACAATGCTCTGATTAATGCCTTGTAAgaggaggtatattatttttagaggcaatgaa  2460 Y  N  A  L  I  N  A  L  *gctaggaggaaagaggggaagtgaggtaattagctaggacaggcaaatctagcagcaatt  2520ataagtcaacactatataaaatattcctataatggcttgtgcttcggtgtgcaaaaaaaa  2580aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaactcaaaaacaaaaatgatccaacatgatt  2640cgaaatggcgaccttgcaaatgcacacctcagataataccactatacaatacaccttaaa  2700tggcacctaaatccatttgtctgcggtcatagacggggcttaagaagcctgggatgcagg  2760tgtcgatgcaagggttacgtcagtgtatgatatgagtatgaaccatgctgtctgggtaat  2820tctccactttccctccccttacgactcttcgggtgtgcctctctagaaagtcgactcctg  2880gcgcctcagatcgccctttggctctgttcggtacaatgacgtccgctggtttcttccaaa  2940gaccaggtatttctcccgtggcaacaaagaataccaaatacctatatcgaaccgtagtct  3000tctgataattagatgtctctcaaggcgcgg  3030SEQ ID No.4

完整金孢子菌Xyl1蛋白的氨基酸序列。信号肽(1-20)以斜体字示出,纤维素结合结构域(22-53)以粗体下划线示出。1   51  PGSSNPP TGTTSSTTGS TPAPTGGGGS GTGLHDKFKA KGKLYFGTEI101  DHYHLNNNAL TNIVKKDFGQ VTENSLKWDA TEPSRNQFNF ANADAVVNFA151  QANGKLIRGH TLLWHSQLPQ WVQNINDRNT LTQVIENHVT TLVTRYKGKI201  LHWDVVNEIF AEDGSLRDSV FSRVLGEDFV GIAFRAARAA DPNAKLYIND251  YNLDIANYAK VTRGMVEKVN KWIAQGIPID GIGTQCHLAG PGGWNTAAGV301  PDALKALAAA NVKEIAITEL DIAGASANDY LTVMNACLQV SKCVGITVWG351  VSDKDSWRSS SNPLLFDSNY QPKAAYNALI NAL*SEQ ID No:5

包括启动子序列的部分金孢子菌GPD1基因的DNA序列。启动子序列(1-1555)和内含子序列(1682-1781)以小写字母示出。基因的3′末端未示出。tgagcagcaatgagcagcaatgagcattcctgggccaccgagtctgagtgccagtacgga  60gtatcgtacttcgtaccggggtttgatttggtgacggtgcttttcacctctcgatgcccg 120aaatcgggtctaagctgagtttgatcaaatatgtgactccaacatcgcccccttcggcaa 180accccgtcgacacgtgtgtcatccttccattgcaagcgatcactcgcagggcgtgacgat 240gaacgagatttttgcccggaccgattcgcggatatagcggcagccgaccagccctaccac 300actgatggccgtgtcactagtgtatgctcccagaaccgcaagcatacactgggcaatgct 360tggtatgcagttgaggcagctttatgtttccatacccttccacttcggctcggggactcg 420gcggggtcgcggaagtttgacggcagccgtcgggccttaggccgagattaccgtggttgt 480ggcccagttttagccgttcccgtccgtttcctaccggaccatgattttcgtgaaccattg 540caatcccgaagcgcatttccgacgttaaggagttacctccgctgcccagaattcatgatc 600gtggccggctcaaggcagcgtggcggggcatccgtgtcaagctcccaggaggaggtgcgc 660gatttcaaatccgggccaaaacaggccaagactggctggccaaaaaaaggagcgtagacg 720gcccgggacatcggacgtcagctcgcagccacccaaaaccggtccgatctactcgcttac 780tgtggtagttcaggtacttttgagtagtaaaaacgctacggcagggccggggggttcccc 840ggtgacggaggtgcctctgcggtggcgaacatcccacgcactctcgagctacggtgacac 900ctcgtgtcctgttggtcttgcaatgctggggcggcaggaaatgcgtcgcgctcctcccgg 960ccaagacctaaaacagacagcgccgcaaagtcgctcactagcaccgcgaaacgaagatgc 1020cccacctcaacgcaatctgtgatgcaagcaattgggaaggctcaccccacctcagcgagg 1080ggctcaaccatttttattatcagctcatgccaccacaacatgactgttttctttccttgc 1140tcatcccacatttgacaaaaatcgtcgattaatctctttccatacaggccgtccgcgctc 1200tgataaccacataaaagtctcttcagtcaacagctcaaagctccctcatccctccaggta 1260agcagccaaagagctcccccacggaccccgcactgcctcatcccgcctgtatcggacctg 1320cgcgacccagcagagaatcccaaacctttgctgcttgctgcccggttccggactgagctg 1380caacccaagcctttaaaaagcttttcccttctcccacggtgtcaactctgtcctatccct 1440ccgacatccgttgagctcaacaactccccgaaccttttaccccgcgccgagctacccctc 1500catcaaaccaccctgacagctcgctcactcacctccccacatcacagaaatcaaaATGAC 1560

                                                    M  T  -TATCAAGGTCGGCATCAACGGTTTCGGCCGTATCGGCCGTATCGTCTTCCGCAACTCCAT 1620  I  K  V  G  I  N  G  F  G  R  I  G  R  I  V  F  R  N  S  I  -CGAGCACTCGGATGTCGAGATCGTTGCCGTCAACGACCCCTTCATTGAGCCCAAGTACGC 1680  E  H  S -D  V  E  I  V  A  V  N  D  P  F  I  E  P  K  Y  A  -Tgtaagtagttttttttttccttcctcgcgttctttcctgttccatcgacagtacgagat 1740GatcttgcaggcggatcggagctaaccgcgattgtcgtacagGAGTACATGCTCAAGTAT 1800

                                       E  Y  M  L  K  Y   -GACTCGACCCACGGTATCTTCAACGGCACCATCGCCGTCGAGGGCAACGACCTCATTGTC 1860 D  S  T  H  G  I  F  N  G  T  I  A  V  E  G  N  D  L  I  V   -AACGGCAAGAGGGTCAAGTTCTACACTGAGCGGGMCCCCGCCAACATTCCCTGGARGGAA 1920 N  G  K  R  V  K  F  Y  T  E  R  ? P  A  N  I  P  W  ? E   -ACTGGTGCCGAGTACATMRTCGAGTCGACCGGTGTGTTCACCAMCACCSAGAAGGCTAGC 1980 T  G  A  E  Y  I  ? E  S  T  G  V  F  T  ? T  ? K  A  S   -GCCCACCTCAAGGGCGGCGCCAAGCGCGTCATCATCTCTGCTCCCTCGGCCGATGCCCCC 2040 A  H  L  K  G  G  A  K  R  V  I  I  S  A  P  S  A  D  A  P   -ATGTACGTCATGGGCGTCAACGAGAAGACCTACGACGGCAAGGCCCAGGTCATCTCTAAC 2100 M  Y  V  M  G  V  N  E  K  T  Y  D  G  K  A  Q  V  I  S  N   -GCCTCGTGCACCACCAACTGCCTGGCTCCCCTCGCCAAGGTCATCCACGACAAGTTCGGC 2160 A  S  C  T  T  N  C  L  A  P  L  A  K  V  I  H  D  K  F  G   -CTCGTTGAGGGTCTCATGACCACCGTCCACTCCTACACTGCCACCCAGAAGACCGTCGAT 2220 L  V  E  G  L  M  T  T  V  H  S  Y  T  A  T  Q  K  T  V  D   -GGTCCCTCTGCCAAGGACTGGCGTGGTGGCCGTGGTGCTGCTCAGAACATCATCCCCAGC 2280 G  P  S  A  K  D  W  R  G  G  R  G  A  A  Q  N  I  I  P  S   -AGCACTGGCGCCGCCAAGGCCGTCGGCAAGGTCATCCCTGAGCTCAACGGCAAGCTCACC 2340 S  T  G  A  A  K  A  V  G  K  V  I  P  E  L  N  G  K  L  T   -GGCATGTCCCTCCGTGTCCCCACCCCCAACGTTTCCGTTGTCGACCTCACCTGCCGCCTC 2400 G  M  S  L  R  V  P  T  P  N  V  S  V  V  D  L  T  C  R  L   -GAGAAGGAGGCTACCTACGACGACATCAAGGCCGCCATCAAGGAGGCCGCCGCCGGCCCC 2460 E  K  E  A  T  Y  D  D  I  K  A  A  I  K  E  A  A  A  G  P   -CTCAAGGgtgagttatctggttcctttttttttttttggagaacgacacatgctgataaa 2520 L  K  GacccagGCATCCTCGACTACACTGAGG 2547

   I  L  D  Y  T  ESEQ ID No.6

部分金孢子菌GPD1蛋白的氨基酸序列(在该序列中没有C末端)。MTIKVGINGF   GRIGRIVFRN  SIEHSDVEIV  AVNDPFIEPK  YAEYMLKYDSTHGIFNGTIA   VEGNDLIVNG  KRVKFYTER? PANIPW?ETG AEYI?ESTGVFT?T?KASAH LKGGAKRVII  SAPSADAPMY  VMGVNEKTYD  GKAQVISNASCTTNCLAPLA   KVIHDKFGLV  EGLMTTVHSY  TATQKTVDGP  SAKDWRGGRGAAQNIIPSST   GAAKAVGKVI  PELNGKLTGM  SLRVPTPNVS  VVDLTCRLEKEATYDDIKAA   IKEAAAGPLK  GILDYTE

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号