首页> 中国专利> 包含蛋白质生产率提高表型的突变和遗传修饰的丝状真菌菌株及其方法

包含蛋白质生产率提高表型的突变和遗传修饰的丝状真菌菌株及其方法

摘要

本发明的菌株和本公开的方法涉及丝状真菌中的遗传修饰,所述遗传修饰产生包含蛋白质生产率提高表型的丝状真菌的变体菌株。更具体地,如本文所呈现、描述和举例说明,包含蛋白质生产率提高表型的丝状真菌的此类变体菌株非常适用于在深层培养中生长,诸如用于大规模生产用于商业应用的目的蛋白。

著录项

  • 公开/公告号CN112654704A

    专利类型发明专利

  • 公开/公告日2021-04-13

    原文格式PDF

  • 申请/专利权人 丹尼斯科美国公司;

    申请/专利号CN201980049956.1

  • 发明设计人 R·J·普莱特二世;

    申请日2019-07-25

  • 分类号C12N9/42(20060101);

  • 代理机构11247 北京市中咨律师事务所;

  • 代理人陈迎春;黄革生

  • 地址 美国加利福尼亚州

  • 入库时间 2023-06-19 10:35:20

说明书

技术领域

本公开总体上涉及生物学、遗传学、分子生物学、丝状真菌、工业蛋白生产等领域。更特别地,本发明的菌株和本公开的方法涉及丝状真菌中的遗传修饰,所述遗传修饰产生包含蛋白质生产率提高表型的丝状真菌的变体菌株。更具体地,如本文所呈现、描述和举例说明,包含蛋白质生产率提高表型的丝状真菌的此类变体菌株非常适用于在深层培养中生长,诸如用于大规模生产用于商业应用的目的蛋白。

相关申请的交叉引用

本申请要求2018年7月30日提交的美国临时专利申请序列号62/711,846的优先权,所述美国临时专利申请通过引用以其全文特此并入。

序列表的引用

名为“NB41504-WO-PCT_SequenceListing.txt”的文本文件序列表的电子提交的内容创建于2019年7月24日,并且大小为160KB,其通过引用以其全文特此并入。

背景技术

丝状真菌(例如,曲霉属(Aspergillus)物种、青霉属(Penicillium)物种、篮状菌属(Talaromyces)物种、镰刀菌属(Fusarium)物种、毁丝霉属(Myceliophthora)物种、脉孢菌属(Neurospora)物种、木霉属(Trichoderma)物种等)能够表达高水平的天然(内源)和异源蛋白,从而使其非常适用于大规模生产用于工业和/或商业应用(诸如药物应用、动物健康应用、食品应用、饮料应用等)的蛋白质(例如,酶)和/或代谢物。丝状真菌典型地在生物反应器(发酵罐)中的菌丝体深层培养中生长,所述生物反应器经调节以将氧气和营养素引入并分配到培养基(即,培养肉汤)中。例如,已知丝状真菌里氏木霉(Trichoderma reesei/T.reesei;真菌红褐肉座菌(Hypocrea jecorina)的无性型)是纤维素酶的有效生产者(例如,参见PCT国际公开号W0 1998/15619、WO 2005/028636、WO 2006/074005、WO 1992/06221、WO 1992/06209、WO 1992/06183和WO 2002/12465)。

因此,丝状真菌由于其生产如下蛋白质的能力而被利用,这些蛋白质在生产诸如纤维素(衍生的)乙醇、纺织品加工品、谷物加工品、洗涤剂、纤维、食品添加剂、饲料添加剂等的商品中是有价值的。例如,在此类真菌宿主菌株中重组基因表达是生产蛋白质(即,用于工业和商业目的)的常见方法,并且因此,真菌宿主菌株的蛋白质生产率改进是蛋白质生产成本的重要经济因素。因此,如本领域技术人员所理解,用于提高丝状真菌菌株中蛋白质产生的此类组合物和方法具有重要的商业意义。

如本文所述,本公开通常涉及包含蛋白质生产率提高/增加表型的遗传修饰的丝状真菌菌株,其解决了本领域中此类持续且未满足的需求。

发明内容

本文描述了与具有蛋白质生产率增加表型的丝状真菌有关的菌株、细胞、方法、构建体等。因此,本公开的某些实施例涉及衍生自亲代细胞的修饰的子囊菌门(Ascomycota)细胞,其中所述修饰的细胞包含编码变体LOV蛋白的多核苷酸序列,所述变体LOV蛋白与SEQID NO:2、SEQ ID NO:4、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基,其中例如当在相同条件下发酵/培养时,所述修饰的细胞相对于所述亲代细胞包含蛋白质生产率提高表型。在某些实施例中,所述亲代细胞包含编码天然LOV蛋白的野生型多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在相关实施例中,所述真菌细胞还包含编码目的蛋白(POI)的异源多核苷酸。在其他实施例中,所述细胞还包含编码SEQ ID NO:19的NIK1(M743T)蛋白的多核苷酸。在某些其他实施例中,所述修饰的细胞还包含至少一种遗传修饰,所述遗传修饰缺失、破坏或减少了选自由MPG1 SFB3、SEB1、CRZ1、TSP2、SSB7和GAS1组成的组的蛋白质的表达/产生。

在其他实施例中,所述子囊菌门细胞选自木霉属物种、曲霉属物种、镰刀菌属物种、青霉属物种、假丝酵母属(Candida)物种、金孢霉属(Chrysosporium)物种、头孢霉属(Cephalosporium)物种、篮状菌属物种、脉孢菌属物种和毁丝霉属物种。

因此,在某些实施例中,亲代曲霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:11或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在另一个实施例中,亲代青霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:12或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。在其他实施例中,亲代篮状菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:13或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在另一个实施例中,亲代镰刀菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:14或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在某些其他实施例中,亲代毁丝霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:15或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在其他实施例中,亲代脉孢菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:16或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在另一个实施例中,亲代假丝酵母属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在某些其他实施例中,亲代木霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:2或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在其他实施例中,目的蛋白由本公开的修饰的细胞产生并且从其纯化。

在其他实施例中,本公开涉及衍生自包含野生型多核苷酸序列的亲代细胞的修饰的子囊菌门细胞,所述野生型多核苷酸序列在严格杂交条件下与编码SEQ ID NO:2、SEQ IDNO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ IDNO:17或SEQ ID NO:18的天然LOV蛋白的核酸序列杂交,且所述天然LOV蛋白在对应于SEQID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基,其中所述修饰的细胞包含修饰的多核苷酸序列,所述修饰的多核苷酸序列在严格杂交条件下与编码SEQ ID NO:2、SEQID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQID NO:17或SEQ ID NO:18的LOV蛋白的核酸序列杂交,且所述LOV蛋白在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基。在某些实施例中,所述细胞还包含编码目的蛋白的异源多核苷酸。在另一个实施例中,所述细胞还包含编码SEQ ID NO:19的NIK1(M743T)蛋白的多核苷酸构建体。在其他实施例中,所述细胞还包含至少一种遗传修饰,所述遗传修饰缺失、破坏或减少了选自由MPG1 SFB3、SEB1、CRZ1、TSP2、SSB7和GAS1组成的组的蛋白质的表达/产生。

在某些其他实施例中,所述子囊菌门细胞选自木霉属物种、曲霉属物种、镰刀菌属物种、青霉属物种、假丝酵母属物种、金孢霉属物种、头孢霉属物种、篮状菌属物种、脉孢菌属物种和毁丝霉属物种。

在某些实施例中,所述亲代曲霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:11或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在其他实施例中,所述亲代青霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:12或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在另一个实施例中,所述亲代篮状菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:13或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在某些其他实施例中,所述亲代镰刀菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:14或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在另一个实施例中,亲代毁丝霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:15或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在其他实施例中,亲代脉孢菌属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:16或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在某些其他实施例中,亲代假丝酵母属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。

在其他实施例中,亲代木霉属物种细胞包含编码天然LOV蛋白的多核苷酸序列,所述天然LOV蛋白与SEQ ID NO:2或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQID NO:2的位置813的氨基酸序列位置处包含苏氨酸(T)残基。其他实施例涉及由本公开的修饰的细胞产生的目的蛋白。

本公开的某些其他实施例涉及一种载体,所述载体包含编码变体LOV蛋白的多核苷酸,所述变体LOV蛋白与SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基。

在其他实施例中,本公开涉及一种编码变体LOV蛋白的多核苷酸,所述变体LOV蛋白与SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基。

在另一个实施例中,本公开涉及一种编码变体LOV蛋白的多核苷酸,其中编码所述变体蛋白的所述多核苷酸在严格杂交条件下与编码SEQ ID NO:2、SEQ ID NO:11、SEQ IDNO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQID NO:18的LOV蛋白的核酸序列杂交,且所述LOV蛋白在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基。

在其他实施例中,本公开涉及一种衍生自亲代菌株的突变木霉属菌株,其中所述突变菌株包含编码LOV变体蛋白的基因,所述LOV变体蛋白与SEQ ID NO:4或SEQ ID NO:18具有至少50%序列同一性并且在对应于SEQ ID NO:4的位置813的序列位置处包含赖氨酸(K)残基。在某些实施例中,相对于所述亲代菌株,所述突变菌株包含蛋白质生产率提高表型。在其他实施例中,所述突变菌株还包含编码SEQ ID NO:19的NIK1(M743T)蛋白的多核苷酸构建体。在其他实施例中,所述突变菌株还包含一种遗传修饰,所述遗传修饰缺失、破坏或减少了编码选自由MPG1 SFB3、SEB1、CRZ1、TSP2、SSB7和GAS1组成的组的至少一种蛋白质的基因的表达/产生。因此,某些相关实施例涉及一种由所述突变菌株产生的目的蛋白。

本公开的其他实施例涉及用于构建包含蛋白质生产率提高表型的修饰的子囊菌门细胞的方法,所述方法包括(i)获得包含野生型lov基因的亲代细胞,所述lov基因在严格杂交条件下与编码SEQ ID NO:2、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:16、SEQ ID NO:17或SEQ ID NO:18的LOV蛋白的核酸序列杂交,(ii)修饰步骤(i)的亲代细胞以产生包含编码LOV(变体)蛋白的基因的修饰的细胞,所述LOV(变体)蛋白在对应于SEQ ID NO:2的位置813的氨基酸序列位置处包含赖氨酸(K)残基,以及(iii)分离步骤(ii)的修饰的细胞,其中所述修饰的细胞相对于所述亲代细胞包含蛋白质生产率提高表型。

在其他实施例中,本公开涉及一种用于构建包含蛋白质生产率提高表型的修饰的子囊菌门细胞的方法,所述方法包括:(i)获得亲代子囊菌门细胞并将编码LOV变体蛋白的多核苷酸构建体引入所述细胞中,所述LOV变体蛋白在对应于SEQ ID NO:4的位置813的氨基酸序列位置处包含赖氨酸(K)残基,和(ii)分离步骤(i)的修饰的细胞,其中所述修饰的细胞相对于所述亲代细胞包含蛋白质生产率提高表型。

因此,如本文所阐述和描述,本公开的各种实施例通常涉及包含蛋白质生产率提高表型的丝状真菌的变体菌株,所述变体菌株非常适用于在深层培养中生长,诸如用于大规模生产用于商业应用的目的蛋白。

生物学序列简述

SEQ ID NO:1是编码SEQ ID NO:2的(天然)LOV蛋白的野生型木霉属物种lov基因的核酸序列。

SEQ ID NO:2是由SEQ ID NO:1编码的(天然)LOV蛋白的氨基酸序列。

SEQ ID NO:3是编码SEQ ID NO:4的(变体)T813K(取代的)LOV蛋白的名为“lov(T813K)”的木霉属物种突变等位基因的核酸序列。

SEQ ID NO:4是由SEQ ID NO:3编码的(变体)T813K(取代的)LOV蛋白的氨基酸序列。

SEQ ID NO:5是木霉属物种MPG1蛋白的氨基酸序列。

SEQ ID NO:6是木霉属物种SEB1蛋白的氨基酸序列。

SEQ ID NO:7是木霉属物种SFB3蛋白的氨基酸序列。

SEQ ID NO:8是木霉属物种CRZ1蛋白的氨基酸序列。

SEQ ID NO:9是木霉属物种GAS1蛋白的氨基酸序列。

SEQ ID NO:10是木霉属物种TPS2蛋白的氨基酸序列。

SEQ ID NO:11是曲霉属物种LOV蛋白直系同源物的氨基酸序列。

SEQ ID NO:12是青霉属物种LOV蛋白直系同源物的氨基酸序列。

SEQ ID NO:13是篮状菌属物种LOV蛋白直系同源物的氨基酸序列。

SEQ ID NO:14是镰刀菌属物种LOV蛋白直系同源物的氨基酸序列。

SEQ ID NO:15是毁丝霉属物种LOV蛋白直系同源物的氨基酸序列。

SEQ ID NO:16是脉孢菌属物种LOV蛋白直系同源物的氨基酸序列。

SEQ ID NO:17是假丝酵母属物种LOV蛋白直系同源物的氨基酸序列。

SEQ ID NO:18包含木霉属物种(天然)LOV蛋白(SEQ ID NO:2)的C末端氨基酸残基位置500-894。

SEQ ID NO:19是变体木霉属组氨酸激酶(NIK1)的氨基酸序列,其在SEQ ID NO:19的氨基酸(残基)位置743处包含甲硫氨酸(M)至苏氨酸(T)取代。将编码SEQ ID NO:19的变体NIK1组氨酸激酶的基因命名为“nik1(M743T)”。

SEQ ID NO:20是编码SEQ ID NO:21的天然SSB7蛋白的野生型里氏木霉ssb7基因的核酸序列。

SEQ ID NO:21是由SEQ ID NO:20编码的天然里氏木霉SSB7蛋白的氨基酸序列。

SEQ ID NO:22是等位基因ssb7(fs)的核酸序列,所述核酸序列在外显子2中包含G缺失(ΔG),从而产生移码(fs)突变,并且在ssb7基因最后一个内含子前包含提前终止密码子。

SEQ ID NO:23是由SEQ ID NO:22的等位基因ssb7(fs)编码的变体SSB7蛋白的氨基酸序列。

SEQ ID NO:23是哈茨木霉(Trichoderma harzianum)LOV蛋白直系同源物的氨基酸序列。

附图说明

图1显示了表达葡糖淀粉酶的B7ms1(亲代)菌株(图1,灰色数据点/灰色线)和突变株衍生的(子代)B7ms1-SF12菌株(图1,黑色数据点/黑色线)的供给糖的总蛋白产率的比较。因此,评价了这些表达葡糖淀粉酶(GA)的菌株(包含mpg1和seb1基因的粘度降低突变)在发酵罐中的蛋白质生产率。图例显示了每种品系类型的菌株名称(基因型参见表1),其后括号中的是所述菌株中的lov等位基因。如图1所示,B7ms1-SF12(子代)菌株(图1,黑色线;即,包含突变lov(T813K)等位基因)相对于B7ms1(亲代)菌株(图1,灰色线;即,包含野生型lov基因)具有蛋白质生产率提高表型。例如,如图1所呈现,当存在lov(T813K)突变时,供给糖的蛋白质产率提高了44%。

图2是说明LOV蛋白的氨基酸保守性的图示。更具体地,图2是六百九十一(691)个盘菌亚门(Pezizomycotina)同源物的Geneious多序列比对的图示。在图2的底部是表示木霉属LOV蛋白的氨基酸序列的框,其中如果氨基酸(残基)在大于99%的比对序列中保守,则以黑色阴影框呈现(或否则为灰色)。LOV残基编号(SEQ ID NO:2)呈现在序列图示上方。如图2所呈现,在木霉属LOV中或在大于2%的多序列比对序列中存在的氨基酸序列缺口以灰色阴影线呈现。LOV(XP_006967324.1)的公共GenBank序列中的注释在序列图示下方显示为灰色框。如LOV的GenBank条目中所注释,假定活性位点残基在序列图示下方显示为黑色框。用淡灰色框注释菌株B7ms1-SF12中用赖氨酸(K)取代苏氨酸(T)813残基。还绘制了平均疏水性和等电点(

图3呈现了全纤维素酶生产T4ms菌株(灰色线)和包含工程化的lov(T813K)等位基因的突变株衍生T4mls(黑色线)在发酵罐中的供给糖的总蛋白产率的比较。更特别地,图3呈现了在较低细胞密度(LCD,虚线,圆圈)和较高细胞密度(HCD,实线,方块)两种发酵条件下这些菌株的供给糖的总蛋白产率。图例显示了发酵条件(LCD相对于HCD),其后是菌株名称(基因型参见表1),并且括号中显示了存在的lov等位基因。因此,如图3所示,在LCD(虚线,圆圈)和HCD(实线,方块)两种发酵条件下,T4mls菌株(图3,黑色线;即,包含突变lov(T813K)等位基因)相对于T4ms菌株(图3,灰色线;即,包含野生型lov基因)均具有蛋白质生产率提高表型。例如,如图3所呈现,当存在lov(T813K)突变时,供给糖的蛋白质产率提高了42%(LCD)和32%(HCD)。

图4呈现了具有野生型lov等位基因(灰色线)的全纤维素酶生产菌株T4m(实线,方块)和T4s(虚线,圆圈)以及分别包含工程化的lov(dis)等位基因(黑色线)的其突变衍生物T4ml+(实线,方块)和T4sl+(虚线,圆圈)在发酵罐中的供给糖的总蛋白产率的比较。图例显示了每种品系类型的菌株名称(基因型参见表1),其后括号中显示的是所述菌株中的lov等位基因。如图4所呈现,T4ml+和T4sl+(子代)菌株(图4,黑色线;即,包含突变lov(dis)等位基因)相对于其T4m和T4s(亲代)菌株(图4,灰色线;即,包含野生型lov基因)不具有蛋白质生产率提高表型。

图5呈现了具有lov(T813K)等位基因、lov(dis)等位基因或野生型lov(+)等位基因且具有各种标记插入位点的菌株在摇瓶发酵中的相对总蛋白滴度的比较。更特别地,评价了全纤维素酶生产菌株在摇瓶中相对于平行操作的T4菌株和T4m菌株的总蛋白滴度。将发酵中的具有各种标记插入位点的菌株与野生型lov(+)等位基因(图5,最淡的灰色条)、突变lov(T813K)等位基因(图5,中等灰色条)或lov(dis)等位基因(图5,最深的灰色条)比较。因此,在所有评价的标记插入位点中,当存在lov(T813K)等位基因时,总蛋白滴度增加。然而,在lov基因本身(lov(dis)等位基因)中插入pyr4(图5,菌株“41G”)或pyr2标记(菌株T4和T4m)显示相对滴度没有显著改进。

图6显示了全纤维素酶生产T4mp菌株(图6,灰色数据点/灰色线)和lov(T813K)突变T4mlp菌株(图6,黑色数据点/黑色线)的供给糖的总蛋白产率的比较。因此,评价了这些全纤维素酶表达菌株在发酵罐中的蛋白质生产率。图例显示了每种品系类型的菌株名称(基因型参见表1),其后括号中的是所述菌株中的lov等位基因。如图6所示,T4mlp菌株(图6,黑色线;即,包含突变lov(T813K)等位基因)相对于T4mp(亲代)菌株(图6,灰色线;即,包含野生型lov基因)具有蛋白质生产率提高表型。例如,如图6所呈现,当存在lov(T813K)突变时,供给糖的蛋白质产率提高了28%。

图7呈现了木霉属物种(天然)LOV蛋白(SEQ ID NO:2)与七(7)个不同子囊菌门LOV直系同源物比对的Clustal W(1.83)多序列比对。例如,Clustal比对中使用的八(8)个蛋白质序列如图7A-图7B中所示(SEQ ID NO:2和SEQ ID NO:11-17),并且其Clustal比对如图7C-图7F中所示。更特别地,如图7C-图7F所呈现,将木霉菌物种(天然)LOV蛋白(SEQ ID NO:2;标记为“2”,以粗体大写的残基显示)与以下比对:曲霉属物种LOV蛋白直系同源物(SEQID NO:11,标记为“11”)、青霉属物种LOV蛋白直系同源物(SEQ ID NO:12,标记为“12”)、篮状菌属物种LOV蛋白直系同源物(SEQ ID NO:13,标记为“13”)、镰刀菌属物种LOV蛋白直系同源物(SEQ ID NO:14,标记为“14”)、毁丝霉属物种LOV蛋白直系同源物(SEQ ID NO:15,标记为“15”)、脉孢菌属物种LOV蛋白直系同源物(SEQ ID NO:16,标记为“16”)和假丝酵母属物种LOV蛋白直系同源物(SEQ ID NO:17,标记为“17”)。如图7C-图7F(即,在比对的氨基残基下方)中所示,星号“*”指示具有单个完全保守残基的位置,冒号“:”指示强类似特性(即,在Gonnet PAM 250矩阵中得分>0.5)的组之间的保守性,并且句号“.”指示弱类似特性(即,在Gonnet PAM 250矩阵中得分<0.5)的组之间的保守性。高度保守的苏氨酸(T)氨基酸在图7F中以粗体带下划线的

图8呈现了使用(天然)木霉属物种LOV蛋白序列(SEQ ID NO:2)的C末端残基位置500-894(SEQ ID NO:18)通过BLAST蛋白比对(NCBI;Blastp套件)进行的氨基酸序列比对。例如,如图8A-图8G所呈现,SEQ ID NO:18包含木霉属物种(天然)LOV蛋白的C末端氨基酸序列(即,包含394个氨基酸残基位置,所述位置对应于SEQ ID NO:2的氨基酸残基位置500-894),其中残基位置813处高度保守的苏氨酸(T)氨基酸(T

具体实施方式

如本文阐述和描述,本公开解决了丝状真菌蛋白生产及其方法领域中某些持续存在且未满足的需求,包括但不限于丝状真菌的如下遗传修饰,所述遗传修饰产生包含蛋白质生产率提高表型的丝状真菌的变体菌株。更具体地,如本文所呈现、描述和举例说明,包含蛋白质生产率提高表型的丝状真菌的此类变体菌株非常适用于在深层培养中生长,诸如用于大规模生产用于商业应用的目的蛋白。

I.定义

在详细地描述本发明的菌株和方法之前,为了清楚起见定义以下术语。未定义的术语应当符合相关领域中所使用的常规含义。除非另有定义,本文使用的所有技术和科学术语具有与本发明组合物和方法所属领域的普通技术人员通常理解的相同含义。

用于如本文所述操作、构建和使用的丝状真菌细胞通常来自子囊菌门盘菌亚门(Pezizomycotina),特别是具有营养菌丝状态的真菌。此类生物体包括用于生产商业上重要的工业和药物蛋白的丝状真菌细胞,包括但不限于木霉属物种、曲霉属物种、镰刀菌属物种、青霉属物种、金孢属(Chrysosporium)物种、头孢霉属(Cephalosporium)物种、篮状菌属物种、疣青霉属(Geosmithia)物种、脉孢菌属物种、毁丝霉属物种等。例如,在某些实施例中,丝状真菌细胞及其菌株包括但不限于里氏木霉(先前分类为长枝木霉(Trichodermalongibrachiatum)和红褐肉座菌(Hypocrea jecorina))、黑曲霉(Aspergillus niger)、烟曲霉(Aspergillus fumigatus)、解乌头酸曲霉(Aspergillus itaconicus)、米曲霉(Aspergillus oryzae)、构巢曲霉(Aspergillus nidulans)、土曲霉(Aspergillusterreus)、酱油曲霉(Aspergillus sojae)、日本曲霉(Aspergillus japonicus)、粗糙脉孢菌(Neurospora crassa)、绳状青霉(Penicillium funiculosum)、产黄青霉(Penicilliumchrysogenum)、埃默森篮状菌(埃默森疣青霉)(Talaromyces(Geosmithia)emersonii)、腐皮镰刀菌(Fusarium venenatum)、嗜热毁丝霉菌(Myceliophthora thermophila)、勒克诺金孢菌(Chrysosporium lucknowense)(C1)等。

如本文所用,为便于描述,术语和短语诸如“一种或多种丝状真菌菌株”、“一种或多种真菌菌株”、“一种或多种丝状真菌细胞”、“一种或多种丝状真菌细胞”,“一种或多种真菌细胞”等可以互换使用,并且不欲限制本公开的范围。

在某些实施例中,用于如本文所述操作、构建和使用的丝状真菌细胞通常来自子囊菌门盘菌亚门,特别是具有营养菌丝状态并且包含lov基因(或一种或多种lov基因同源物)的真菌。

如本文所用,诸如“亲代细胞”、“亲代真菌细胞”、“亲代菌株”、“亲代真菌菌株”、“丝状真菌细胞的亲代菌株”、“参考菌株”等的短语可以互换使用,并且是指“未修饰的”亲代丝状真菌细胞。例如,“丝状真菌细胞的亲代菌株”是指丝状真菌的任何细胞或菌株,其中“亲代”细胞的基因组被修饰或可修饰(例如,通过仅引入亲代细胞的一种遗传修饰)以产生丝状真菌细胞的变体(子代)菌株,使得“亲代”和“子代”细胞仅一种遗传修饰不同。

如本文所用,诸如“变体细胞”、“子代细胞”、“变体菌株”、“子代菌株”、“变体或子代真菌菌株”、“丝状真菌细胞的变体或子代菌株”等的短语可以互换使用,并且是指来源于(即,获自或可获自)丝状真菌细胞的亲代(或参考)菌株的丝状真菌细胞的变体菌株,其中变体菌株仅包含亲代菌株中不存在的一种遗传修饰,因此,通过比较,“亲代”与“变体”菌株之间的表型差异可以归因于所述一种遗传修饰。换句话说,除了“引入”变体菌株的单一遗传修饰之外,亲代与变体菌株在其他方面是同基因的。因此,在本公开中,亲代和变体菌株可以被描述为具有某些特征,诸如遗传修饰、表达表型、形态表型等;然而,熟练的技术人员将理解,从技术上讲,是亲代或变体菌株的细胞具有此类特征,且为方便起见提及“菌株”。

在某些实施例中,未修饰的(亲代)细胞可以被称为“对照细胞”或“参考细胞”,特别是当与来源于其的遗传修饰的(变体/子代)细胞比较(相比)时。

如本文所用,术语“野生型”和“天然的”可互换使用,并是指天然发现的基因、蛋白、蛋白混合物或菌株。

如本文所用,本公开的某些里氏木霉菌株/细胞已按下表1所述命名/缩写。

表1

里氏木霉菌株和遗传修饰

如本文所用,粘度降低的木霉属菌株“B7ms1”是表达葡糖淀粉酶的菌株,所述菌株在国际PCT公开号WO 2012/145584(通过引用以其全文并入本文)中被称为“Morph TrGA77B7Δmpg1Δseb1”。

如本文所用,基因组坐标(例如,支架序列16上之425393)和蛋白质识别号(PID,例如,PID 50212)参考由美国能源部联合基因组研究所(Department of Energy JointGenome Institute,JGI)产生的里氏木霉QM6a基因组序列组装的版本2(The GenomePortal of the Department of Energy Joint Genome Institute[美国能源部联合基因组研究所的基因组门户],Grigoriev等人,Nucleic Acids Res[核酸研究]2012年1月;40(数据库特辑):D26-32.doi:10.1093/nar/gkr947)。JGI装配的支架序列的序列也已经以核苷酸登录号GL985056.1至GL985132.1保藏在GenBank(国家生物技术中心,The NationalCenter for Biotechnology)中。

如本文所用,名为“B7ms1-SF12”的突变(变体)木霉属菌株(衍生自B7ms1亲代菌株)包含蛋白质生产率增加表型(即,相对于B7ms1(亲代)菌株)。更特别地,木霉属B7ms1-SF12菌株中鉴别的突变改变了名为LOV的蛋白质(即,预测的蛋白质PID 50212;SEQ ID NO:2)的编码序列,其中在(突变)B7ms1-SF12菌株中,(天然)LOV蛋白(SEQ ID NO:2)的残基位置813处高度保守的苏氨酸(T)氨基酸(T813)被赖氨酸取代(T→K813)(即,T813K取代,例如,比较SEQ ID NO:2位置813与SEQ ID NO:4位置813)。例如,如以下实例部分中所述,菌株B7ms1-SF12中的lov突变等位基因在支架序列16上425393处包含由G(鸟嘌呤)变为T(胸腺嘧啶)的单个核苷酸变化,从而在编码的LOV(变体)蛋白(SEQ ID NO:4)中产生“T813K”取代,其在SEQ ID NO:4的氨基酸位置813处包含赖氨酸(K)(与SEQ ID NO:2的天然LOV蛋白相对比,所述天然LOV蛋白在氨基酸位置813处包含苏氨酸(T);SEQ ID NO:2)。

如本文所用,名为“T4”的木霉属菌株如国际PCT公开号WO 2016/130523(通过引用以其全文并入本文)中所述,通过掺入nik1(M743T)突变和化学诱变衍生自木霉属菌株RL-P37。

如本文所用,名为“nik1(M743T)”的等位基因包含编码变体组氨酸激酶(NIK1;SEQID NO:19)的突变组氨酸激酶基因(nik1),所述变体组氨酸激酶在SEQ ID NO:19的氨基酸(残基)位置743处包含甲硫氨酸(M)至苏氨酸(T)取代。

如本文所用,名为“T4_pyr2”的木霉属菌株通过使pyr2基因突变和功能缺失衍生自木霉属菌株T4,因此pyr2基因可用作转化选择标记。

如本文所用,名为“T4m”的木霉属菌株衍生自菌株T4,其中菌株T4m包含mpg1基因突变(Δmpg1)和nik1(M743T)基因。因此,菌株T4m包含编码天然lov蛋白(SEQ ID NO:2)的野生型lov等位基因(即,等位基因lov(+))。

如本文所用,名为“T4m_pyr2”的木霉属菌株衍生自菌株T4m,其中菌株T4m_pyr2包含mpg1基因突变(Δmpg1)、nik1(M743T)基因和无功能的pyr2基因。

如本文所用,名为“T4ml+”的木霉属菌株衍生自菌株T4m_pyr2,其中菌株T4ml+包含mpg1基因突变(Δmpg1)和等位基因lov(dis)。

如本文所用,名为“T4ml”的木霉属菌株衍生自菌株T4ml+,其中菌株T4ml包含nik1(M743T)、mpg1基因突变(Δmpg1)、等位基因lov(T813K)和无功能的pyr2基因。

如本文所用,名为“T4mls”的木霉属菌株衍生自菌株T4ml,其中菌株T4mls包含nik1(M743T)、mpg1和seb1基因双重突变(Δmpg1;Δseb1)和等位基因lov(T813K)。

如本文所用,名为“T4ms”的木霉属菌株衍生自菌株T4m,其中菌株T4ms包含nik1(M743T)以及mpg1和seb1基因双重突变(Δmpg1;Δseb1)。

如本文所用,名为“T4s”的木霉属菌株衍生自菌株T4,其中菌株T4s包含nik1(M743T)和seb1基因突变(Δseb1)。

如本文所用,名为“T4s_pyr2”的木霉属菌株衍生自菌株T4s,其中菌株T4s_pyr2包含nik1(M743T)、seb1基因突变(Δseb1)和无功能的pyr2基因。

如本文所用,名为“T4sl+”的木霉属菌株衍生自菌株T4s_pyr2,其中菌株T4sl+包含nik1(M743T)、seb1基因突变(Δseb1)和等位基因lov(dis)。

如本文所用,名为“T4sl”的木霉属菌株衍生自菌株T4sl+,其中菌株T4sl包含nik1(M743T)、seb1基因突变(Δseb1)、等位基因lov(T813K)和无功能的pyr2基因。

如本文所用,名为“T4l+”的木霉属菌株衍生自菌株T4_pyr2,其中菌株T4l+包含nik1(M743T)和等位基因lov(dis)。

如本文所用,名为“41G”的木霉属菌株诱变衍生自菌株T4,其中菌株4lG包含nik1(M743T)和(野生型)lov(+)等位基因。

如本文所用,名为“41G_pyr4”的木霉属菌株衍生自菌株41G,其中菌株4lG_pyr4包含nik1(M743T)、(野生型)lov(+)等位基因并缺失了pyr4基因。

如本文所用,名为“41Gl+”的木霉属菌株衍生自菌株4lG_pyr4,其中菌株4lGl+包含nik1(M743T)和等位基因lov(dis)。

如本文所用,名为“T4mc”的木霉属菌株衍生自菌株T4m_pyr2,其中菌株T4mc包含nik1(M743T)、Δmpg1、位点C的pyr2+插入和野生型lov(+)等位基因。

如本文所用,名为“T4mlc”的木霉属菌株衍生自菌株T4ml,其中菌株T4mlc包含nik1(M743T)、Δmpg1、位点C的pyr2+插入和等位基因lov(T813K)。

如本文所用,名为“T4md”的木霉属菌株衍生自菌株T4m_pyr2,其中菌株T4md包含nik1(M743T)、Δmpg1、位点B的pyr2+插入和野生型lov(+)等位基因。

如本文所用,名为“T4mld”的木霉属菌株衍生自菌株T4ml,其中菌株T4mld包含nik1(M743T)、Δmpg1、位点B的pyr2+插入和等位基因lov(T813K)。

如本文所用,名为“T4mp”的木霉属菌株衍生自菌株T4m_pyr2,其中菌株T4mp包含nik1(M743T)、Δmpg1、位点A的pyr2+插入和野生型lov(+)等位基因。

如本文所用,名为“T4mlp”的木霉属菌株衍生自菌株T4ml,其中菌株T4mlp包含nik1(M743T)、Δmpg1、位点A的pyr2+插入和等位基因lov(T813K)。

如本文所用,名为“T4sp”的木霉属菌株衍生自菌株T4s_pyr2,其中菌株T4sp包含nik1(M743T)、Δseb1、位点A的pyr2+插入和野生型lov(+)等位基因。

如本文所用,名为“T4slp”的木霉属菌株衍生自菌株T4sl,其中菌株T4slp包含nik1(M743T)、Δseb1、位点A的pyr2+插入和等位基因lov(T813K)。

如本文所用,“葡糖淀粉酶(GA)构建体”或“GA构建体”编码PCT公开号WO 2012/145584(特别通过引用以其全文并入本文)中描述的葡糖淀粉酶。

如本文所用,“等位基因lov(+)”包含编码天然LOV蛋白(例如,SEQ ID NO:2)的野生型lov DNA序列。

如本文所用,“等位基因lov(T813K)”包含突变的(lov)DNA序列(如上所述,在菌株B7ms1-SF12中鉴别),所述DNA序列编码包含“T813K”取代的变体LOV蛋白(上述SEQ ID NO:4)。

如本文所用,“等位基因lov(dis)”包含lov基因的破坏,其中将可选择标记pyr2或pyr4整合到lov编码序列中,如下文在实例3中进一步描述。

如本文所用,“全纤维素酶菌株”是指木霉属菌株,其中自然分泌组尚未通过遗传工程化主要纤维素酶基因而改变。

如本文所用,编码目的蛋白的“内源(或天然)丝状真菌基因”包括但不限于如本领域技术人员所已知和理解的编码糖苷水解酶(GH)家族酶(例如像EC No.3.2.1.1-3.2.1.206)的内源(丝状真菌)基因,编码蛋白酶、酯酶、脂肪酶等的内源基因。

因此,如本文一般描述,在等效于SEQ ID NO:4的(变体)LOV蛋白的位置813的氨基酸(残基)位置处,用赖氨酸(K)取代苏氨酸(T)氨基酸(T→K取代)已经在本文中鉴别为观察到的蛋白质生产率(增加)表型的原因。例如,在相同条件下发酵/培养时,本文公开的包含编码(突变)B7ms1-SF12菌株T

如本文所用,使用SEQ ID NO:2的天然木霉属物种LOV蛋白的氨基酸残基编号(位置)对“给定氨基酸序列”中氨基酸残基的“位置”进行编号。例如,对于短语“在对应于SEQID NO:2的位置813的序列位置处包含苏氨酸(T)残基”和“在对应于SEQ ID NO:2的位置813的序列位置处包含赖氨酸(K)残基”,使用天然(木霉属物种)LOV蛋白的氨基酸序列(SEQ IDNO:2)作为参考(亲代)蛋白序列。

例如,如图7C-图7F中所示,可以使用本文所述的比对算法(和/或本领域已知的比对算法)将本文所述的给定氨基酸序列与天然木霉属物种LOV蛋白氨基酸序列(SEQ ID NO:2)比对,并且给定氨基酸序列中与天然序列中的氨基酸残基比对(优选最佳比对)的氨基酸残基可以方便地通过参考LOV序列中的对应氨基酸残基来编号。因此,图7呈现了标记为序列“2”的天然木霉属物种LOV蛋白(SEQ ID NO:2)与来自如下各种(子囊菌门)丝状真菌的LOV蛋白直系同源物的多序列比对,诸如标记为序列“12”的曲霉属物种(SEQ ID NO:12)、标记为序列“13”的青霉属物种(SEQ ID NO:13)、标记为序列“14”的篮状菌属物种(SEQ IDNO:14)、标记为序列“15”的镰刀菌属物种(SEQ ID NO:15)、标记为序列“16”的毁丝霉属物种(SEQ ID NO:16)、标记为序列“17”的脉孢菌属物种(SEQ ID NO:17)以及标记为序列“18”的假丝酵母属物种(SEQ ID NO:18)。

同样,为了与木霉属物种LOV蛋白(SEQ ID NO:2)的一级(1°)序列建立序列同源性或序列同一性,本领域技术人员可以使用本领域技术人员已知的序列比对算法、软件及其方法容易地将SEQ ID NO:2的一级序列与一种或多种候选LOV蛋白(直系同源物)序列进行比较。因此,在比对保守残基,允许进行必要的插入和缺失以维持比对(即,避免通过任意缺失和插入消除保守残基)后,定义了等效于子囊菌门LOV蛋白一级序列中特定氨基酸的残基。保守残基的比对优选应该保留此类残基的100%。然而,大于98%、95%、90%、85%、80%、75%、70%、50%或至少45%的保守残基的比对也足以定义等效残基。

因此,如本文所用,在对应(或等效)于SEQ ID NO:2的位置813的氨基酸(残基)位置处,用赖氨酸(K)氨基酸取代苏氨酸(T)氨基酸(T

如本文所用,术语“基因”与术语“等位基因”同义,是指编码和指导蛋白或RNA表达的核酸。丝状真菌的营养体形式通常是单倍体,因此指定基因的单拷贝(即单个等位基因)足以赋予特定表型。

如本文所用,术语“多肽”和“蛋白质”(和/或其各自的复数形式)可互换地用来指包含通过肽键连接的氨基酸残基的任何长度的聚合物。本文中使用用于氨基酸残基的常规一字母或三字母代码。聚合物可以是线性的或支化的,它可以包含修饰的氨基酸,并且它可以被非氨基酸中断。这些术语还包括天然地修饰的或通过干预而修饰的氨基酸聚合物;例如,通过二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作或修饰,如与标记组分偶联。所述定义内还包括例如含有一种或多种氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。

如本文所用,术语“衍生多肽/蛋白”是指通过以下衍生的或可衍生的蛋白:向一个或多个N-末端和C-末端中的一个或两个添加一个或多个氨基酸,在氨基酸序列中一个或多个不同位点处取代一个或多个氨基酸,在蛋白的一端或两端或者在氨基酸序列的一个或多个位点处缺失一个或多个氨基酸,和/或在氨基酸序列中一个或多个位点处插入一个或多个氨基酸。蛋白衍生物的制备可以通过修饰编码天然蛋白的DNA序列、将该DNA序列转化到合适的宿主中、以及表达修饰的DNA序列以形成衍生蛋白来实现。

相关的(和衍生)蛋白包括“变体蛋白”。变体蛋白通过在少量氨基酸残基处的取代、缺失和/或插入而不同于参考/亲代蛋白(例如,野生型蛋白)。变体与亲代蛋白之间的不同氨基酸残基的数量可以是一个或多个,例如,1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、或更多个氨基酸残基。变体蛋白与参考蛋白可以共有至少约50%、至少约60%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或甚至至少约99%、或更多氨基酸序列同一性。变体蛋白也可以与参考蛋白在选择的基序、结构域、表位、保守区域等方面不同。

如本文所用,术语“类似序列”是指蛋白内提供与目的蛋白(即,典型地目的原始蛋白)类似的功能、三级结构和/或保守残基的序列。例如,在含有α-螺旋或β-折叠结构的表位区域中,类似序列中的置换氨基酸优选保持相同的特定结构。所述术语还指核苷酸序列以及氨基酸序列。在一些实施例中,开发了类似序列以使得氨基酸的置换产生显示类似或改进功能的变体酶。在一些实施例中,目的蛋白中氨基酸的三级结构和/或保守残基位于目的区段或片段处或附近。因此,当目的区段或片段含有例如α-螺旋或β-折叠结构时,置换氨基酸优选维持所述特定结构。

如本文所使用的,术语“同源蛋白”是指与参考蛋白具有相似活性和/或结构的蛋白。这并不旨在表示同源物必定在进化上相关。因此,其旨在表示所述术语涵盖从不同生物体获得的相同、类似或相应(即,在结构和功能方面)的一种或多种蛋白。在一些实施例中,期望鉴别与参考蛋白具有类似的四级、三级和/或一级结构的同源物。

序列之间的同源性程度可以使用本领域已知的任何合适的方法确定(参见,例如,Smith和Waterman,1981;Needleman和Wunsch,1970;Pearson和Lipman,1988;威斯康星遗传学软件包(Wisconsin Genetics Software Package)(威斯康星州麦迪逊市的遗传学电脑集团(Genetics Computer Group,Madison,WI))中的程序,诸如GAP、BESTFIT、FASTA和TFASTA;和Devereux等人,1984)。

例如,PILEUP是确定序列同源性水平的有用程序。PILEUP使用渐进的、两两比对创建了来自一组相关序列的多重序列比对。它还可以绘制显示用于创建所述比对的聚类关系的一个树。PILEUP使用Feng和Doolittle(1987)的渐进比对方法的简化。所述方法类似于Higgins和Sharp(1989)所述的方法。有用的PILEUP参数包括为3.00的默认空位权重,为0.10的默认空位长度权重,以及加权的末端空位。有用算法的另一个实例是Altschul等人,1990和Karlin等人,1993描述的BLAST算法。一种特别有用的BLAST程序是WU-BLAST-2程序(参见,例如,Altschul等人,1996)。参数“W”、“T”、以及“X”确定了所述比对的灵敏度与速度。所述BLAST程序使用字长(W)11、BLOSUM62得分矩阵(参见,例如,Henikoff和Henikoff,1989)比对(B)50、期望值(E)10、M'5、N'-4以及两条链的比较作为默认值。

如本文所使用的,在至少两个核酸或多肽的上下文中,短语“基本上相似”和“基本上相同”典型地意指多核苷酸或多肽包含与参考(即,野生型)序列相比具有至少约70%同一性、至少约75%同一性、至少约80%同一性、至少约85%同一性、至少约90%同一性、至少约91%同一性、至少约92%同一性、至少约93%同一性、至少约94%同一性、至少约95%同一性、至少约96%同一性、至少约97%同一性、至少约98%同一性、或甚至至少约99%同一性、或更高同一性的序列。可以使用已知的程序(诸如BLAST、ALIGN和CLUSTAL)使用标准参数确定序列同一性。(参见,例如,Altschul等人,1990;Henikoff等人,1989;Karlin等人,1993;和Higgins等人,1988)。用于执行BLAST分析的软件可通过美国国家生物技术信息中心(National Center for Biotechnology Information)公开地获得。此外,可以使用FASTA搜索数据库(Pearson等人,1988)。两种多肽基本上相同的一个指示是第一多肽与第二多肽具有免疫交叉反应性。典型地,差别在于保守氨基酸取代的多肽具有免疫交叉反应性。因此,多肽与第二多肽基本上相同,例如,其中两个肽仅相差保守取代。两个核酸序列基本上相同的另一个指示是两个分子在严格条件下(例如,在中等至高严格性的范围内)彼此杂交。

如本文所用,“核酸”是指核苷酸或多核苷酸序列及其片段或部分,以及基因组或合成来源的DNA、cDNA和RNA,其可能是双链或单链,无论代表正义或反义链。

如本文所用,术语“表达”是指来源于本公开的核酸分子的正义(mRNA)或反义RNA的转录和稳定积累。表达也可指将mRNA翻译成多肽。因此,术语“表达”包括涉及多肽产生的任何步骤,这些步骤包括但不限于转录、转录后修饰、翻译、翻译后修饰、分泌等。

如本文所用,组合术语“表达/产生”,如诸如“丝状真菌细胞的变体菌株表达/产生‘增加’量的目的蛋白(POI)”(即,相对于亲代细胞)的短语中所用,所述术语“表达/产生”意欲包括参与在本公开的此类变体丝状真菌菌株中表达和产生蛋白质的任何步骤。

在某些实施例中,包含“序列同源性”的编码LOV蛋白的基因、多核苷酸或核酸序列是指如下的DNA或RNA(核酸)序列,其与相应的核酸序列(与所述序列进行比较)具有极小序列差异,并且保留了与相应的核酸序列(与所述序列进行比较)基本上相同的生物学功能。例如,在某些实施例中,与编码LOV蛋白的基因、多核苷酸或核酸具有相当大序列同源性的核酸序列如本文中所述通过鉴别编码的基因产物(LOV蛋白)来评定。

在某些其他实施例中,使用核酸杂交方法确定/鉴别与编码LOV蛋白的基因、多核苷酸或核酸具有序列同源性的基因、多核苷酸或核酸序列。例如,在某些实施例中,与编码LOV蛋白(例如,SEQ ID NO:2)的基因具有相当大序列同源性的DNA/RNA序列通过此种DNA/RNA序列在严格条件下与本公开的指定核酸序列杂交的能力来鉴别。

如本文所用,“在严格条件下杂交”旨在描述用于杂交和洗涤的条件,在所述条件下彼此显著相同或同源的核苷酸序列保持彼此杂交。此类严格条件是本领域技术人员熟知的(参见,例如,Ausubel等人,1995;Sambrook等人,1989)。例如,在某些实施例中,严格杂交条件的非限制性实例包括在约65℃-70℃下在4X氯化钠/柠檬酸钠(SSC)中杂交(或在约42℃-50℃下在4×SSC加50%甲酰胺中杂交),随后在约65℃-70℃下用1×SSC洗涤一次或多次。同样,高度严格杂交条件的非限制性实例包括在约65℃-70℃下在1×SSC中杂交(或在约42℃-50℃下在4×SSC加50%甲酰胺中杂交),随后在约65℃-70℃下用0.3×SSC洗涤一次或多次。因此,高度严格杂交条件包括在约50℃-60℃下在4×SSC中杂交(或可替代地,在约40℃-45℃下在6×SSC加50%甲酰胺中杂交),随后在约50℃-60℃下用2×SSC洗涤一次或多次。本公开还意欲涵盖在上述值中间的范围,例如在65℃-70℃下或在42℃-50℃下。在某些实施例中,在杂交和洗涤缓冲液中可以用SSPE(1×SSPE为0.15M NaCl,10mM NaH2PO4和1.25mM EDTA,pH 7.4)取代SSC(1×SSPE为0.15M NaCl和15mM柠檬酸钠);杂交完成后,每次进行洗涤15分钟。预期长度小于50个碱基对的杂交体的杂交温度应比杂交体的解链温度(T

因此,如上文一般性阐述,本公开的某些实施例涉及丝状真菌细胞的变体菌株,所述变体菌株包含编码LOV蛋白的基因的遗传修饰。如本文所用,术语“修饰”和“遗传修饰”可以互换使用,并且包括但不限于:(a)基因中一个或多个核苷酸的引入、取代或去除,或基因转录或翻译所需的调控元件中一个或多个核苷酸的引入、取代或去除,(b)基因破坏,(c)基因转化,(d)基因缺失,(e)基因(例如,反义RNA、siRNA、miRNA等)的下调,(f)本文公开的任何一个或多个基因的特异性诱变(包括但不限于基于CRISPR/Cas9的诱变)和/或(g)随机诱变。

如本文所用,包含遗传修饰的丝状真菌的变体菌株包括但不限于编码本文公开的LOV蛋白的基因的遗传修饰。因此,如下文进一步详细描述,各种分子生物学方法是本领域技术人员熟知的并且可用于产生/构建丝状真菌细胞的此类变体菌株。

如本文所用,“编码蛋白质的基因中一个或多个核苷酸的引入、取代或去除”,此类遗传修饰包括基因编码序列(即,外显子)和非编码插入(内含子)序列。

如本文所用,“基因的破坏”、“基因破坏”、“基因的灭活”和“基因灭活”可互换地使用,并且广泛地指基本上破坏/灭活靶基因的任何遗传修饰。基因破坏的示例性方法包括但不限于基因任何部分(包括多肽编码序列(CDS)、启动子、增强子或另外的调控元件)的完全或部分缺失或其诱变,其中诱变涵盖取代、插入、缺失、倒置及其任何组合和变化,其破坏/灭活一个或多个靶基因并基本上减少或阻止功能基因产物的表达/产生。在本公开的某些实施例中,此类基因破坏阻止宿主细胞表达/产生编码的lov基因产物。

在某些实施例中,使用已建立的基因编辑技术,诸如CRISPR/Cas9基因编辑、锌指核酸酶(ZFN)基因编辑、转录活化因子样效应子核酸酶编辑(TALEN)、归巢(大型)核酸酶编辑等,对编码LOV蛋白的基因、多核苷酸或核酸序列进行遗传修饰。

在其他实施例中,丝状真菌的变体菌株通过基因转化的过程(例如,参见Iglesias和Trautner,1983)构建(即,遗传修饰)。

在其他实施例中,通过如下方法对由本公开的子囊菌门细胞表达/产生的目的蛋白(例如,内源POI或异源POI)进行检测、鉴别、测量、测定等:蛋白定量方法、基因转录方法、mRNA翻译方法等,包括但不限于蛋白迁移/迁移率(SDS-PAGE)、质谱、HPLC、尺寸排阻、超速离心沉降速度分析、转录组学、蛋白组学、荧光标签、表位标签、荧光蛋白(GFP、RFP等)嵌合体/杂交体等。

如本文所用,功能上和/或结构上类似的蛋白被认为是“相关的蛋白”。此类相关的蛋白可以来源于不同属和/或物种的生物体,或甚至不同纲的生物体(例如,细菌和真菌)。相关的蛋白还涵盖通过一级序列分析确定的、通过二级或三级结构分析确定的、或者通过免疫交叉反应性确定的同源物和/或直系同源物。

如本文所使用的术语“启动子”是指能够控制编码序列或功能性RNA表达的核酸序列。通常,编码序列位于启动子序列3'(下游)。启动子能以其整体来自天然基因,或者由来自自然界中发现的不同启动子的不同元件构成,或甚至包含合成的核酸区段。本领域技术人员应该理解,不同启动子可以在不同细胞类型中、或在不同发育阶段、或响应于不同环境条件或生理条件来指导基因表达。引起基因在大多数细胞类型中表达的启动子大多数时候通常被称为“组成型启动子”。进一步认识到,由于在大多数情况下还不能完全确定调控序列的确切边界,不同长度的DNA片段可具有相同的启动子活性。

如本文所使用的术语“有效地连接”是指核酸序列在单个核酸片段上的缔合,这样使得一个核酸片段的功能受到另一个影响。例如,当能够实现该编码序列的表达(即编码序列在启动子的转录控制下)时,启动子与该编码序列(例如ORF)有效地连接。编码序列可以在正义或反义方向上有效地连接到调控序列上。当核酸置于与另一个核酸序列的功能关系时,所述核酸与另一个核酸序列“有效地连接”。例如,如果编码分泌性前导子(即信号肽)的DNA表达为参与多肽分泌的前蛋白,那么所述编码分泌性前导子的DNA有效地连接到所述多肽的DNA;如果启动子或增强子影响编码序列的转录,那么所述启动子或增强子有效地连接到所述序列;或者如果核糖体结合位点被定位以便促进翻译,那么所述核糖体结合位点有效地连接到编码序列。通常,“有效地连接”意指被连接的DNA序列是连续的,并且在分泌性前导子的情况下,是连续的并且处于阅读相中。然而,增强子不必需是连续的。通过在方便的限制位点处连接来实现连接。如果这样的位点不存在,则按照常规实践使用这些合成的寡核苷酸衔接子或接头。

如本文所定义,“合适的调控序列”是指位于编码序列的上游(5'非编码序列)、内部或下游(3'非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性或翻译的核苷酸序列。调控序列可以包括启动子、翻译前导序列、RNA加工位点、效应子结合位点和茎环结构。

如本文中所定义,如短语诸如“向真菌细胞中引入”至少一种多核苷酸可读框(ORF)或其基因或其载体中所使用的术语“引入”,包括本领域中已知用于将多核苷酸引入细胞中的方法,包括但不限于原生质体融合、自然或人工转化(例如,氯化钙、电穿孔)、转导、转染等。

如本文所用,“转化的”或“转化”指通过使用重组DNA技术转化的细胞。转化典型地通过将一个或多个核苷酸序列(例如,多核苷酸、ORF或基因)插入细胞中而发生。所插入的核苷酸序列可以是异源核苷酸序列(即,在待转化的细胞中不是天然存在的序列)。

如本文所用,“转化”是指将外源DNA引入宿主细胞中,使得DNA保持为染色体整合体或自我复制的染色体外载体。如本文所用,“转化DNA”、“转化序列”和“DNA构建体”是指用于将序列引入宿主细胞中的DNA。可以通过PCR或任何其他合适的技术在体外产生DNA。在一些实施例中,转化DNA包含输入序列,而在其他实施例中,其还包含同源盒侧翼的输入序列。在又另一个实施例中,转化DNA包含添加到末端的其他非同源序列(即,填充序列或侧翼)。末端可以闭合,这样使得转化DNA形成闭环,诸如像,插入载体中。

如本文所用,“输入序列”是指引入真菌细胞染色体中的DNA序列。在一些实施例中,输入序列是DNA构建体的一部分。在其他实施例中,输入序列编码一种或多种目的蛋白。在一些实施例中,输入序列包含可以或可以不存在于待转化的细胞的基因组中的序列(即,它可以是同源或异源序列)。在一些实施例中,输入序列编码一种或多种目的蛋白、基因、和/或突变的或修饰的基因。在可替代的实施例中,该输入序列编码功能性野生型基因或操纵子、功能性突变基因或操纵子、或非功能基因或操纵子。在一些实施例中,输入序列是插入基因中以破坏基因功能的非功能序列。在另一个实施例中,输入序列包括选择性标记。在一个另外的实施例中,输入序列包括两个同源盒。

如本文所用,“同源盒”是指与真菌细胞染色体中的序列同源的核酸序列。更具体地,根据本发明,同源盒是上游或下游区,所述上游或下游区与被缺失、破坏、灭活的、下调等的基因或基因的一部分的直接侧翼编码区具有约80%与100%之间的序列同一性、约90%与100%之间的序列同一性、或约95%与100%之间的序列同一性。这些序列指导了在真菌细胞染色体中,DNA构建体的整合位置,并且指导了真菌细胞染色体的哪部分被输入序列替代。尽管不欲限制本公开,但同源盒可以包括约1个碱基对(bp)至200千碱基(kb)。优选地,同源盒包括约1bp与10.0kb之间;1bp与5.0kb之间;1bp与2.5kb之间;1bp与1.0kb之间、和0.25kb与2.5kb之间。同源盒还可以包括约10.0kb、5.0kb、2.5kb、2.0kb、1.5kb、1.0kb、0.5kb、0.25kb和0.1kb。在一些实施例中,选择性标记的5'和3'端在同源盒侧翼,其中所述同源盒包含紧密位于基因的编码区侧翼的核酸序列。

如本文所用,术语“编码可选择标记的核苷酸序列”是指核苷酸序列,所述核苷酸序列能够在宿主细胞中表达并且其中可选择标记的表达赋予含有表达的基因的细胞在不存在对应的选择性试剂或缺乏必需营养素的情况下生长的能力。

如本文所用,术语“可选择标记”和“选择性标记”是指能够在宿主细胞中表达的核酸(例如,基因),其允许容易地选择含有载体的那些宿主。此类可选择标记的实例包括但不限于抗微生物剂。因此,术语“可选择标记”是指提供宿主细胞已经摄取了输入性目的DNA或者已经发生了一些其他反应的指示的基因。典型地,可选择标记是赋予宿主细胞抗微生物抗性或代谢优势的基因,以允许在转化期间将包含外源DNA的细胞与未接受任何外源序列的细胞区分开来。

如本文所定义,宿主细胞“基因组”、真菌细胞“基因组”或丝状真菌细胞“基因组”包括染色体基因和染色体外基因。

如本文所用,术语“质粒”、“载体”和“盒”是指染色体外元件,其通常携带典型地不是细胞的中心代谢的一部分的基因,并且通常呈环状双链DNA分子的形式。此类元件可以是来源于任何来源的单链或双链DNA或RNA的线性或环状自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中许多核苷酸序列已连接或重组到单一结构中,该单一结构能够将针对选定基因产物的启动子片段和DNA序列连同适当3'未翻译序列引入到细胞中。

如本文所用,术语“载体”是指可以在细胞中复制(传播)并且可以携带新基因或DNA片段(例如,“输入序列”)到细胞中的任何核酸。因此,该术语是指设计用于在不同宿主细胞之间转移的核酸构建体。载体包括病毒、噬菌体、前病毒、质粒、噬菌粒、转座子和人工染色体诸如YAC(酵母人工染色体)、BAC(细菌人工染色体)、PLAC(植物人工染色体)等,其为“附加体”(即,自主复制)或可以整合到宿主细胞的染色体中。

如本文所用,“转化盒”是指包含基因(或其ORF),并且具有除促进特定宿主细胞的转化的基因外的元件的特定载体。

“表达载体”是指具有在细胞中并入并表达异源DNA的能力的载体。许多原核和真核表达载体可商购获得并且是本领域技术人员熟知的。合适的表达载体的选择在本领域技术人员的知识范围内。

如本文所用,术语“表达盒”和“表达载体”是指重组或合成产生的具有允许特定核酸在靶细胞中转录的一系列特定核酸元件的核酸构建体(即,这些是载体或载体元件,如上所述)。重组表达盒可以整合在质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段中。典型地,表达载体的重组表达盒部分包括,除了其他序列之外,待转录的核酸序列和启动子。在一些实施例中,DNA构建体还包括一系列允许靶细胞中特定核酸转录的特定核酸元件。在某些实施例中,本公开的DNA构建体包含如本文所定义的选择性标记和灭活的染色体或基因或DNA区段。

如本文所用,“靶向载体”是一种载体,所述载体包括与所述靶向载体转化的宿主细胞的染色体中的区同源的多核苷酸序列并且可以驱动所述区的同源重组。例如,靶向载体可用于通过同源重组将遗传修饰引入宿主细胞染色体中。在一些实施例中,靶向载体包含其他非同源序列,例如添加到末端的其他非同源序列(即,填充序列或侧翼序列)。末端可以闭合,这样使得靶向载体形成闭环,诸如像,插入载体中。

如本文所用,包含“蛋白质生产率提高表型”的变体细胞(或菌株)包括但不限于包含体积生产率提高/增加的变体细胞(或菌株)、包含碳转化效率提高/增加的变体细胞(或菌株)、蛋白质产率提高/增加的变体细胞(或菌株)、比蛋白质生产率提高/增加的变体细胞(或菌株)等。例如,在某些实施例中,包含蛋白质生产率提高表型的变体细胞或菌株每克供给糖表达/产生至少0.1%或更多的总蛋白(g)(相对于亲代菌株),其中供给糖可以以生产阶段期间(即,供给开始后)添加到发酵罐中的糖的质量表示。

如本文所定义,短语“蛋白质生产率提高表型”和“蛋白质生产率增加表型”可以互换使用。

如本文所用,当描述未修饰的(亲代)细胞相对于修饰的(变体/子代)细胞的“蛋白质生产率提高/增加表型”时,应理解“亲代”和“变体”细胞在相同条件(例如,相同条件诸如培养基、温度、pH等)下生长/培养/发酵。类似地,当描述在未修饰的(亲代)细胞中“表达/产生”目的蛋白(POI)相对于在修饰的(变体/子代)细胞中“表达/产生”相同POI时,应理解“亲代”和“变体”细胞在基本上相同条件(例如,相同条件诸如培养基、温度、pH等)下生长/培养/发酵。

如本文所用,“有氧发酵”是指在氧气存在下生长。

如本文所用,术语“肉汤”、“细胞肉汤”、“发酵肉汤”和/或“培养肉汤”可以互换使用,并且总体上指液体(深层)培养中的(i)发酵(培养)培养基和(ii)细胞。

如本文所用,术语“细胞团”是指液体(深层)培养中存在的细胞组分(包括完整和裂解的细胞)。细胞团可以干细胞重量(DCW)或湿细胞重量(WCW)表示。

如本文所用,丝状真菌细胞的“粘度降低”菌株是指如下修饰的(子代)菌株,所述修饰的(子代)菌株产生的细胞肉汤与亲代菌株产生的等效细胞肉汤相比具有降低的粘度(即,对剪切应力或拉伸应力的抗性降低)。例如,等效细胞肉汤通常具有相当的细胞团。国际PCT公开号WO 2012/027580、WO 2012/145596、WO 2012/145596和WO 2012/145592,以及国际PCT申请序列号PCT/US 2019/27590(每个文献均特别通过引用以其全文并入本文)中详细描述了用于构建粘度降低的丝状真菌菌株的方法和用于比较其粘度的方法。

因此,在某些实施例中,本公开的变体菌株(例如,包含编码等位基因lov(T813K)的遗传修饰的变体菌株)包含蛋白质生产率提高/增加表型,所述变体菌株还包含编码MPG1、SFB3、SEB1、CRZ1、GAS1、TPS2和/或SSB7蛋白的基因的遗传修饰。

如本文所用,木霉属物种“MPG1蛋白”包含SEQ ID NO:5的氨基酸序列(如国际PCT公开号WO 2012/145584中所述,所述案通过引用以其全文并入本文)。

如本文所用,木霉属物种“SEB1蛋白”包含SEQ ID NO:6的氨基酸序列(如国际PCT公开号WO 2012/145595中所述,所述案通过引用以其全文并入本文)。

如本文所用,木霉属物种“SFB3蛋白”包含SEQ ID NO:7的氨基酸序列(如国际PCT公开号WO 2012/027580中所述,所述案通过引用以其全文并入本文)。

如本文所用,木霉属物种“CRZ1蛋白”包含SEQ ID NO:8的氨基酸序列(如国际PCT公开号WO 2012/145596中所述,所述案通过引用以其全文并入本文)。

如本文所用,木霉属物种“GAS1蛋白”包含SEQ ID NO:9的氨基酸序列(如国际PCT公开号WO 2012/145596和WO 2012/145592中所述,所述案各自通过引用以其全文并入本文)。

如本文所用,木霉属物种“TSP2蛋白”包含SEQ ID NO:10的氨基酸序列(如国际PCT公开号WO 2012/145598中所述,所述案通过引用以其全文并入本文)。

如本文所用,野生型“ssb7基因”编码天然“SSB7蛋白”,所述蛋白描述于2019年4月16日提交的国际PCT申请序列号PCT/US2019/27590中。例如,野生型里氏木霉“ssb7基因”(SEQ ID NO:20)编码SEQ ID NO:21的天然“SSB7蛋白”。

如本文所用,“等位基因ssb7(fs)”(SEQ ID NO:22)编码SEQ ID NO:23的变体SSB7蛋白,如国际PCT申请序列号PCT/US2019/27590中所述(特别通过引用以其全文并入本文)。

II.包含蛋白质生产率提高表型的丝状真菌菌株

如上文一般性阐述以及下文实例部分中进一步描述,本公开的某些实施例涉及衍生自亲代菌株的丝状真菌的突变和遗传修饰的(变体)菌株。更特别地,某些实施例涉及丝状真菌的突变和遗传修饰的(变体)菌株(及其方法),其中此类菌株包含蛋白质生产率提高表型,诸如改进的体积效率、较高的比生产率、改进的碳源产率、降低的生物反应器(发酵罐)操作成本等。

更特别地,如以下实例1中进一步描述,鉴别、分离了一株突变(子代)木霉属菌株并命名为“B7ms1-SF12”,所述(突变)菌株在发酵罐中的供给糖的蛋白质产率相对于其所衍生的亲代菌株(B7ms1)高40%(例如,参见图1)。随后对突变B7ms1-SF12菌株进行了基因组序列分析和遗传分析,以鉴别其中引起B7ms1-SF12(突变)菌株的观察到的(生产率增加)表型的一种或多种基因的一种或多种突变。更具体地,确定了所鉴别的突变能改变SEQ IDNO:2的(天然)LOV蛋白的编码序列,其中(天然)LOV蛋白(SEQ ID NO:2)的氨基酸(残基)位置813处高度保守的苏氨酸(T)(T813)突变(取代)为SEQ ID NO:4的(变体)LOV蛋白的位置813处的赖氨酸(813K)(即,T813K取代;例如,参见图2)。

科学文献和相关技术的评述指示,文献中尚未对任何生物体的LOV蛋白(SEQ IDNO:2)和/或相关LOV蛋白直系同源物(例如,SEQ ID NO:11-17)的功能表征进行描述。然而,如本公开的实例1中一般性阐述,保守结构域分析(NCBI)鉴别出与糖基转移酶家族2组(pfam13632,E值3.25x10-44,例如参见图2中的“Glyco trans 2 3”远相关的(保守)区域。例如,原核蛋白的此(糖基转移酶)家族成员包括推定的葡糖基转移酶,其参与细菌荚膜生物合成(PFAM)。更特别地,具有(糖基转移酶)家族2组结构域的真菌蛋白“ZtGT2”,其与木霉属PID 79396直系同源(即,其不是LOV,PID 50212),对于在固体表面上的菌丝生长是重要的(King等人,2017)。

最令人惊讶的是,LOV蛋白在担子菌门和子囊菌门的丝状真菌中广泛保守。例如,在NCBI非冗余数据库的最前面的BLASTp搜索结果中,在木霉属和大多数与工业相关的丝状真菌所属的盘菌亚门中,(天然)LOV蛋白位置813处的苏氨酸(T)(即,如本文所公开,其突变为赖氨酸(K)是有益的)是高度保守的(691/691;100%)。例如,来自这691个盘菌亚门同源物的Geneious多序列比对(www.geneious.com,Geneious 11.0,Biomatters有限公司)的图示如图2所呈现。同样,在MUSCLE多序列比对(Genetic软件包)中,在前1,000个BLASTp命中中,氨基酸残基位置813在975/1000(97.5%)的命中中相同(即,残基T813),其中残基位置813从未出现赖氨酸(K)(即,本文所述的引起蛋白质生产率提高的取代在BLASTp鉴别的前1000个直系同源物中未发现)。

因此,为进一步验证lov(T813K)等位基因是观察到的蛋白质生产率提高表型的原因,将lov(T813K)突变引入名为“T4”(例如,参见表1)的不同里氏木霉菌株谱系中,其中B7ms1和T4亲代谱系均为木霉属菌株RL-P37的不同菌株改进程序的诱变衍生物(Sheir-Neiss等人,1984;Montenecourt,1987)。例如,T4菌株与B7ms1菌株的显著不同之处在于T4菌株表达其(内源)纤维素酶天然混合物,并包含增加总蛋白产生的nik1(M743T)突变(例如,参见国际PCT公开号WO 2016/130523)。同样,类似于实例1中所阐述的B7ms1谱系的观察结果,包含lov(T813K)等位基因的T4谱系(菌株)(例如,参见实例2和实例4)的供给糖的总蛋白产率相对于包含野生型lov(+)等位基因的同基因菌株平均提高34%。

另外,为进一步证明lov(T813K)等位基因对于改进真菌菌株蛋白质生产率表型的效用,申请人在其他三个方便的基因组位置(即,名为位点A-C;也请参见实例4,表1和表2)整合了pyr2标记。例如,在摇瓶中评价了这些不同菌株的蛋白质产生,其中在所有此类情况下,lov(T813K)突变的存在相对于包含野生型lov(+)等位基因的原本同基因(亲代)菌株改进了总蛋白产生。

III.分子生物学

如上文一般性描述,本公开的某些实施例涉及衍生自亲代菌株的丝状真菌的突变和遗传修饰的(变体)菌株。更特别地,某些实施例涉及丝状真菌的突变和遗传修饰的(变体)菌株(及其方法),其中此类菌株包含蛋白质生产率提高表型,诸如改进的体积效率、较高的比生产率、改进的碳源产率、降低的生物反应器(发酵罐)操作成本等。

因此,本公开的某些实施例涉及衍生自亲代木霉属菌株(例如,亲代B7ms1)的突变(子代)木霉属菌株(例如,突变B7ms1-SF12),其中所述突变体(子代)木霉属菌株包含编码变体LOV蛋白的突变lov基因,所述变体LOV蛋白在对应于SEQ ID NO:4的氨基酸残基位置813的氨基酸位置处包含赖氨酸(K)残基。

因此,本公开的某些其他实施例涉及衍生自本文所述的亲代菌株的丝状真菌的遗传修饰菌株(下文的“变体”菌株)。例如,在某些实施例中,丝状真菌的变体菌株包含编码变体LOV蛋白的修饰的lov基因(或其修饰的多核苷酸序列),所述变体LOV蛋白与SEQ ID NO:2(即,天然LOV蛋白序列)具有序列同源性,并且所述丝状真菌的变体菌株在对应于SEQ IDNO:4的氨基酸位置813的氨基酸序列位置处包含赖氨酸(K)残基。

因此,在某些实施例中,本公开的变体菌株包含编码LOV蛋白的修饰的lov基因(或其修饰的多核苷酸序列),所述LOV蛋白与SEQ ID NO:2(或SEQ ID NO:4)的LOV蛋白具有至少约50%至约100%序列同源性并且在对应于SEQ ID NO:4的氨基酸位置813的氨基酸序列位置处包含赖氨酸(K)残基。在某些实施例中,本公开的变体菌株包含编码LOV蛋白的修饰的lov基因(或其修饰的多核苷酸序列),所述LOV蛋白与SEQ ID NO:2(或SEQ ID NO:4)的LOV蛋白具有至少约50%至约100%序列同一性,并且在对应于SEQ ID NO:4的氨基酸位置813的氨基酸序列位置处包含赖氨酸(K)残基。

因此,在其他实施例中,本公开的变体菌株包含编码LOV蛋白的修饰的lov基因(或其修饰的多核苷酸序列),所述LOV蛋白与SEQ ID NO:2或SEQ ID NO:4具有至少约50%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约55%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约60%序列同源性或同一性,与SEQ ID NO:2或SEQID NO:4具有至少约65%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约70%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约75%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约80%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约85%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约90%序列同源性或同一性,与SEQ ID NO:2或SEQ ID NO:4具有至少约95%序列同源性或同一性,或与SEQ ID NO:2或SEQ ID NO:4具有高达且为约100%序列同源性或同一性,并且在对应于SEQ ID NO:4的氨基酸位置813的氨基酸序列位置处包含赖氨酸(K)残基。

因此,在某些实施例中,丝状真菌的变体菌株至少包含将等位基因lov(T813K)引入菌株中的遗传修饰。例如,在某些实施例中,丝状真菌的变体菌株可以包含如下遗传修饰,其包括但不限于:(a)引入、取代或去除基因(或ORF或其多核苷酸)中的一个或多个核苷酸,或者引入、取代或去除基因的转录或翻译所需的调控元件中的一个或多个核苷酸,(b)基因破坏,(c)基因转化,(d)基因缺失,(e)基因下调,(f)特异性诱变和/或(g)随机诱变。在其他实施例中,包含等位基因lov(T813K)的丝状真菌的变体菌株还包含编码如本文所述的NIK1蛋白、SSB7蛋白、MPG1蛋白、SFB3蛋白、SEB1蛋白、CRZ1蛋白、TSP2蛋白和/或GAS1蛋白的基因的一个或多个遗传修饰。

因此,在某些实施例中,可以通过基因缺失以消除给定基因产物(例如,LOV(+)、NIK1、SSB7、MPG1 SFB3、SEB1、CRZ1、TSP2、GAS1、内源(背景)蛋白酶、纤维素酶等)的表达/产生来构建包含遗传修饰的丝状真菌的变体菌株。在其他实施例中,可以通过部分基因缺失消除(或减少)给定基因产物的表达/产生来构建包含遗传修饰的丝状真菌的变体菌株。例如,在某些实施例中,修饰的丝状真菌菌株可以包含基因的部分缺失,其中部分缺失包括基因编码序列的任何部分的部分缺失。例如,在某些实施例中,此类变体菌株不表达/产生所编码蛋白质,或者此类变体菌株表达/产生减少量的所编码蛋白质(相对于亲代菌株),其中“减少”量的所编码蛋白质可以如本文所述进行测量、检测、测定等。

因此,如在实例部分中一般性阐述和描述,本领域技术人员可以进行以下遗传修饰(及在此部分中描述的其分子生物学方法),并通过参考本公开的一个或多个氨基酸序列(SEQ ID NO:2、4、11-19)和/或核酸序列(SEQ ID NO:1和2)来构建其此类(变体)丝状真菌菌株。

例如,基因缺失技术能够部分或完全去除基因,从而消除或减少蛋白质的表达/产生,和/或从而消除或减少所编码蛋白质的表达/产生。在此类方法中,基因的缺失可以通过使用整合质粒/载体进行同源重组来完成,所述整合质粒/载体已构建成连续含有基因侧翼的5'和3'区。可以将连续的5'和3'区例如在整合质粒/载体上在与可选择标记结合下引入丝状真菌细胞中以允许质粒整合在细胞中。

在其他实施例中,丝状真菌的变体菌株包含破坏或灭活编码本公开蛋白质的基因的遗传修饰。基因破坏/灭活的示例性方法包括破坏基因的任何部分,包括多肽编码序列(CDS)、启动子、增强子或另一种调控元件,所述破坏包括取代、插入、缺失、倒置及其组合和其变体。因此,在某些实施例中,通过基因破坏技术构建丝状真菌的变体菌株。基因破坏技术的非限制性实例包括向本公开的一个或多个基因中插入(整合)含有与所述基因同源的核酸片段的整合质粒,这将产生同源区域的重复,并在重复区域之间掺入(插入)载体DNA。

因此,在某些其他非限制性实例中,基因破坏技术包括向基因中插入含有与所述基因同源的核酸片段的整合质粒,这将产生同源区域的重复,并在重复区域之间掺入(插入)载体DNA,其中插入的载体DNA将例如基因的启动子与蛋白质编码区分开,或中断(破坏)基因的编码或非编码序列。因此,破坏性构建体可以是伴有与基因同源的5'和3'区的可选择标记基因(例如,pyr2;参见实例)。可选择标记使得能够鉴别含有破坏的基因的转化体。因此,在某些实施例中,基因破坏包括如下基因控制元件的修饰,诸如启动子、核糖体结合位点(RBS)、非翻译区(UTR)、密码子改变等。

在其他实施例中,通过引入、取代或去除基因或其转录或翻译所需的调控元件中的一个或多个核苷酸来构建(即,遗传修饰)丝状真菌的变体菌株。例如,可以插入或去除核苷酸,以便引入终止密码子,去除起始密码子或使开放阅读框(ORF)移码。此种修饰可以根据本领域中已知的方法,通过定点诱变或PCR产生的诱变来完成(例如,参见Botstein和Shortle,1985;Lo等人,1985;Higuchi等人,1988;Shimada,1996;Ho等人,1989;Horton等人,1989以及Sarkar和Sommer,1990)。同样,可以通过用编码等位基因lov(T813K)的位置813赖氨酸的核苷酸取代编码野生型lov(+)基因的位置813苏氨酸的核苷酸来构建包含本文所述的T813K取代的等位基因lov(T813K)。

在其他实施例中,丝状真菌的变体菌株通过基因转化的过程(例如,参见Iglesias和Trautner,1983)构建(即,遗传修饰)。例如,在基因转化方法中,将对应于靶基因的核酸序列在体外诱变以产生缺陷核酸序列,然后将所述核酸序列转化到亲代细胞中以产生包含缺陷基因的变体细胞。通过同源重组,缺陷核酸序列替换内源基因。可能是需要的,缺陷基因或基因片段也编码可用于选择含有缺陷基因的转化体的标记。例如,可以将缺陷基因与可选择标记结合引入非复制或温度敏感的质粒上。通过在不允许质粒复制的条件下选择标记来实现质粒整合的选择。选择导致基因替换的第二次重组事件是通过检查菌落损失可选择标记和获得突变基因来实现的(Perego,1993)。

在其他实施例中,丝状真菌的变体菌株通过建立的反义(基因沉默)技术,使用与基因的核酸序列互补的核苷酸序列来构建(Parish和Stoker,1997)。更具体地,可以通过引入与基因的核酸序列互补的核苷酸序列来减少(下调)或消除丝状真菌菌株的基因的表达,所述核苷酸序列在细胞中转录并且能够与细胞中产生的mRNA杂交。在允许互补的反义核苷酸序列与mRNA杂交的条件下,由此降低或消除了所翻译的蛋白的量。此类反义方法包括但不限于RNA干扰(RNAi)、小干扰RNA(siRNA)、微小RNA(miRNA)、反义寡核苷酸等,所有这些都是本领域技术人员熟知的。

在其他实施例中,使用本领域中熟知的方法(包括但不限于化学诱变(参见,例如,Hopwood,1970)和转座(参见,例如,Youngman等人,1983)),通过随机或特异性诱变构建(即,遗传修饰)丝状真菌的变体菌株。可以通过对亲代细胞进行诱变并筛选其中基因表达已经减少或消除的突变细胞来进行基因的修饰。例如,本领域技术人员可以容易地更改和/或修改本文实例部分中阐述的筛选方法,以鉴别包含粘度降低表型的丝状真菌细胞的此类(诱变的)变体菌株。

诱变可以是特异性或随机的,可以通过例如使用合适的物理或化学诱变剂进行、通过使用合适的寡核苷酸进行或通过将所述DNA序列经受PCR产生的诱变来进行。此外,诱变可通过使用这些诱变方法的任意组合来进行。适用于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、N-甲基-N'-亚硝基胍(NTG)、邻甲基羟胺、亚硝酸、乙基甲磺酸(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。当使用这些试剂时,典型地通过如下方法来进行诱变:在合适的条件下在选择的诱变剂的存在下孵育待诱变的亲代细胞,并选择表现出基因表达降低或无基因表达的突变细胞。

例如,本文所公开的一个或多个基因的此类遗传修饰可以降低基因启动子的效率,降低增强子的效率,干扰基因mRNA的剪接或编辑,干扰基因mRNA的翻译,将终止密码子引入基因编码序列以阻止全长蛋白的翻译,改变蛋白的编码序列以产生活性较低或无活性的蛋白,减少与其他核蛋白组分的蛋白相互作用,改变蛋白的编码序列以产生较不稳定的蛋白或靶向蛋白以进行破坏,或导致蛋白错误折叠或被错误修饰(例如,通过糖基化),或干扰蛋白的细胞运输。

在某些其他实施例中,借助于位点特异性基因编辑技术构建(即,遗传修饰的)丝状真菌的变体菌株。例如,在某些实施例中,通过使用转录活化因子如内切核酸酶(TALEN)、锌指核酸内切酶(ZFN)、归巢(大型)核酸内切酶等来构建(即,遗传修饰)丝状真菌的变体菌株。更特别地,借助于ZFN基因编辑、TALEN基因编辑、归巢(大型)内切核酸酶等对基因中待修饰的部分(例如,编码区、非编码区、前导序列、前肽序列、信号序列、转录终止子、转录活化因子或表达编码区所要的其他调控元件)进行遗传修饰,所述修饰方法是本领域技术人员熟知并且可得到的。

因此,在某些实施例中,借助于CRISPR/Cas9编辑构建(即,遗传修饰)丝状真菌的变体菌株。更具体地,本领域中描述了并且熟知用CRISPR/Cas9系统进行真菌基因组修饰的组合物和方法(例如,参见,国际PCT公开号:WO 2016/100571、WO 2016/100568、WO 2016/100272、WO 2016/100562等)。例如,编码天然LOV蛋白的基因可以借助于核酸指导的内切核酸酶进行遗传修饰,所述核酸指导的内切核酸酶通过结合指导RNA(例如,Cas9)或指导DNA(例如,NgAgo)找到其靶DNA,这将内切核酸酶募集到DNA上的靶序列上,其中所述内切核酸酶可以在DNA中产生单链或双链断裂。此靶向DNA断裂成为DNA修复的底物,并且可以与提供的编辑模板重组以破坏或缺失所述基因。例如,编码核酸指导的内切核酸酶的基因(例如,来自化脓链球菌(S.pyogenes)的Cas9或编码Cas9核酸酶的密码子优化的基因)与丝状真菌细胞中的活性启动子和丝状真菌细胞中的活性终止子有效连接,从而产生丝状真菌Cas9表达盒。同样地,本领域技术人员容易鉴别目的基因特有的一个或多个靶位点。

例如,为了构造编码gRNA的针对目的基因内的靶位点的DNA构建体,可变的靶向结构域(VT)将包含为(PAM)前间区序列邻近基序(TGG)5'的靶位点的核苷酸,所述核苷酸与编码化脓链球菌Cas9的Cas9内切核酸酶识别结构域(CER)的DNA融合。组合编码VT结构域的DNA和编码CER结构域的DNA,从而产生编码gRNA的DNA。因此,通过将编码gRNA的DNA有效连接到丝状真菌细胞中的活性启动子和丝状真菌细胞中的活性终止子来产生gRNA的丝状真菌表达盒。

在某些实施例中,由内切核酸酶诱导的DNA断裂用输入序列修复/替换。例如,为了精确修复由上述Cas9表达盒和gRNA表达盒产生的DNA断裂,提供核苷酸编辑模板,使得细胞的DNA修复机构可以利用编辑模板。例如,靶基因的约500bp 5'可以与靶基因的约500bp 3'融合以产生编辑模板,所述模板由丝状真菌宿主的机构用于修复由RGEN(RNA指导的内切核酸酶)产生的DNA断裂。

可以使用许多不同的方法(例如,原生质体融合、电穿孔、自然感受态或诱导感受态)将Cas9表达盒、gRNA表达盒和编辑模板共同递送至丝状真菌细胞。通过用正向和反向引物扩增靶基因座,通过PCR来筛选转化的细胞。这些引物可以扩增野生型基因座或已经由RGEN编辑的修饰的基因座。然后使用测序引物对这些片段进行测序以鉴别编辑的菌落。

IV.目的蛋白

如前述部分中简要陈述,本发明的菌株和方法可用于在丝状真菌的深层培养中生产商业上重要的蛋白。本公开的目的蛋白(POI)可以是任何内源或异源蛋白,并且其可以是此种POI的变体。蛋白可以含有一个或多个二硫桥键,或者是其功能形式是单体或多聚体的蛋白,即蛋白具有四级结构并且由多个相同(同源的)或不相同的(异源的)亚基构成,其中POI或其变体POI优选是具有目的特性的POI。

在某些实施例中,丝状真菌的变体菌株相对于(未修饰的)亲代菌株表现出增加的蛋白质滴度,其中蛋白质滴度定义为每体积的蛋白质量(g/L)。例如,可以通过本领域已知的方法(例如,ELISA、HPLC、Bradford测定、LC/MS等)来测量滴度。因此,在某些实施例中,相比于未修饰的(亲代)细胞,丝状真菌的变体菌株包含至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多的蛋白质滴度增加。

在某些实施例中,丝状真菌的变体菌株相对于(未修饰的)亲代菌株表现出增加的体积生产率,其中体积生产率定义为发酵期间每公称体积(L)生物反应器每总发酵时间产生的蛋白质的量(g)。例如,可以通过本领域已知的方法(例如,ELISA、HPLC、Bradford测定、LC/MS等)来测量体积生产率。因此,在某些实施例中,与未修饰的(亲代)细胞相比,丝状真菌的变体菌株包含至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多的体积生产率增加。

在某些其他实施例中,丝状真菌的变体菌株表现出增加的总蛋白产率,其中总蛋白产率定义为相对于(未修饰的)亲代菌株每克碳水化合物供给产生的蛋白质的量(g)。因此,如本文所用,可以使用以下等式计算总蛋白产率(g/g):

Y

其中“Y

总蛋白产率也可以描述为碳转化效率/碳产率,例如,以供给的碳中掺入总蛋白中的百分比(%)的形式描述。因此,在某些实施例中,丝状真菌的变体菌株包含相对于(未修饰的)亲代菌株增加的碳转化效率(例如,供给的碳中掺入总蛋白中的百分比(%)的增加)。在某些实施例中,修饰的菌株的碳转化效率的增加(即,相对于亲代菌株)为与未修饰的(亲代)细胞相比增加至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多。

在某些实施例中,丝状真菌的变体菌株相对于(未修饰的)亲代菌株表现出增加的POI的比生产率(Qp)。例如,比生产率(Qp)的检测是用于评价蛋白质产生的合适方法。比生产率(Qp)可以使用以下等式确定:

“Qp=gP/gDCW·hr”

其中,“gP”是罐中产生的蛋白质的克数;“gDCW”是罐中的干细胞重量(DCW)的克数,并且“hr”是从接种时间开始的几小时内的发酵时间,其包括生产时间以及生长时间。因此,在某些实施例中,与未修饰的(亲代)细胞相比,丝状真菌的变体菌株包含至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多的比生产率(Qp)增加。

在某些实施例中,POI或其变体POI选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖苷水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂解酶、甘露聚糖酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶及其组合。

在某些实施例中,POI或其变体POI选自如下酶学委员会(EC)编号,所述酶学委员会(EC)编号选自由EC 1、EC 2、EC 3、EC 4、EC 5或EC 6组成的组。

例如,在某些实施例中,POI是氧化还原酶,所述氧化还原酶包括但不限于选自以下的EC1(氧化还原酶)酶:EC 1.10.3.2(例如,漆酶)、EC 1.10.3.3(例如,L-抗坏血酸氧化酶)、EC 1.1.1.1(例如,醇脱氢酶)、EC 1.11.1.10(例如,氯化物过氧化物酶)、EC1.11.1.17(例如,过氧化物酶)、EC 1.1.1.27(例如,L-乳酸脱氢酶)、EC 1.1.1.47(例如,葡萄糖1-脱氢酶)、EC 1.1.3.X(例如,葡萄糖氧化酶)、EC 1.1.3.10(例如,吡喃糖氧化酶)、EC1.13.11.X(例如,双加氧酶)、EC 1.13.11.12(例如,亚油酸13S-脂氧合酶)、EC 1.1.3.13(例如,醇氧化酶)、EC 1.14.14.1(例如,单加氧酶)、EC 1.14.18.1(例如,单酚单加氧酶(monophenol monooxigenase))、EC 1.15.1.1(例如,超氧化物歧化酶)、EC 1.1.5.9(先前,EC 1.1.99.10,例如,葡萄糖脱氢酶)、EC 1.1.99.18(例如,纤维二糖脱氢酶)、EC1.1.99.29(例如,吡喃糖脱氢酶)、EC 1.2.1.X(例如,脂肪酸还原酶)、EC 1.2.1.10(例如,乙醛脱氢酶)、EC 1.5.3.X(例如,果糖基胺还原酶)、EC 1.8.1.X(例如,二硫还原酶)和EC1.8.3.2(例如,硫醇氧化酶)。

在某些实施例中,POI是转移酶,所述转移酶包括但不限于选自以下的EC 2(转移酶)酶:EC 2.3.2.13(例如,转谷氨酰胺酶)、EC 2.4.1.X(例如,己糖基转移酶)、EC2.4.1.40(例如,交替蔗糖酶(alternasucrase))、EC 2.4.1.18(例如,1,4α-葡聚糖分支酶)、EC 2.4.1.19(例如,环麦芽糖糊精葡聚糖转移酶)、EC 2.4.1.2(例如,糊精葡聚糖酶)、EC 2.4.1.20(例如,纤维二糖磷酸化酶)、EC 2.4.1.25(例如,4-α-葡聚糖转移酶)、EC2.4.1.333(例如,1,2-β-低聚葡糖磷酸转移酶)、EC 2.4.1.4(例如,淀粉蔗糖酶)、EC2.4.1.5(例如,葡聚糖蔗糖酶)、EC 2.4.1.69(例如,半乳糖苷2-α-L-岩藻糖基转移酶)、EC2.4.1.9(例如,菊粉蔗糖酶(inulosucrase))、EC 2.7.1.17(例如,木酮糖激酶)、EC2.7.7.89(原名EC 3.1.4.15,例如,[谷氨酰氨合成酶]-腺苷-L-酪氨酸磷酸化酶)、EC2.7.9.4(例如,α葡聚糖激酶)和EC 2.7.9.5(例如,磷酸葡聚糖激酶)。

在其他实施例中,POI是水解酶,所述水解酶包括但不限于选自以下的EC 3(水解酶)酶:EC 3.1.X.X(例如,酯酶)、EC 3.1.1.1(例如,果胶酶)、EC 3.1.1.14(例如,叶绿素酶)、EC 3.1.1.20(例如,鞣酸酶)、EC 3.1.1.23(例如,甘油酯酰基水解酶)、EC 3.1.1.26(例如,半乳糖脂酶)、EC 3.1.1.32(例如,磷脂酶A1)、EC 3.1.1.4(例如,磷脂酶A2)、EC3.1.1.6(例如,乙酰酯酶)、EC 3.1.1.72(例如,乙酰木聚糖酯酶)、EC 3.1.1.73(例如,阿魏酸酯酶)、EC 3.1.1.74(例如,角质酶)、EC 3.1.1.86(例如,鼠李糖半乳糖醛酸乙酰酯酶)、EC 3.1.1.87(例如,伏马菌素B1酯酶)、EC 3.1.26.5(例如,核糖核酸酶P)、EC 3.1.3.X(例如,磷酸单酯水解酶)、EC 3.1.30.1(例如,曲霉核酸酶S1)、EC 3.1.30.2(例如,粘质沙雷氏菌(Serratia marcescens)核酸酶)、EC 3.1.3.1(例如,碱性磷酸酶)、EC 3.1.3.2(例如,酸性磷酸酶)、EC 3.1.3.8(例如,3-植酸酶)、EC 3.1.4.1(例如,磷酸二酯酶I)、EC 3.1.4.11(例如,磷脂酰肌醇磷脂酶C)、EC 3.1.4.3(例如,磷脂酶C)、EC 3.1.4.4(例如,磷脂酶D)、EC3.1.6.1(例如,芳基硫酸酯酶)、EC 3.1.8.2(例如,二异丙基-氟磷酸酶)、EC 3.2.1.10(例如,寡-1,6-葡糖苷酶)、EC 3.2.1.101(例如,甘露聚糖内切-1,6-α-甘露糖苷酶)、EC3.2.1.11(例如,α-1,6-葡聚糖-6-葡聚糖水解酶)、EC 3.2.1.131(例如,木聚糖α-1,2-葡糖醛酸苷酶(glucuronosidase))、EC 3.2.1.132(例如,壳聚糖N-乙酰葡糖胺基水解酶)、EC3.2.1.139(例如,α-葡糖醛酸糖苷酶(glucuronidase))、EC 3.2.1.14(例如,几丁质酶)、EC3.2.1.151(例如,木葡聚糖特异性内切-β-1,4-葡聚糖酶)、EC 3.2.1.155(例如,木葡聚糖特异性外切-β-1,4-葡聚糖酶)、EC 3.2.1.164(例如,半乳聚糖内切-1,6-β-半乳糖苷酶)、EC 3.2.1.17(例如,溶菌酶)、EC 3.2.1.171(例如,鼠李半乳糖醛酸聚糖水解酶)、EC3.2.1.174(例如,鼠李半乳糖醛酸聚糖鼠李糖水解酶)、EC 3.2.1.2(例如,β-淀粉酶)、EC3.2.1.20(例如,α-葡糖苷酶)、EC 3.2.1.22(例如,α-半乳糖苷酶)、EC 3.2.1.25(例如,β-甘露糖苷酶)、EC 3.2.1.26(例如,β-果糖呋喃糖苷酶)、EC 3.2.1.37(例如,木聚糖1,4-β-木糖苷酶)、EC 3.2.1.39(例如,葡聚糖内切-1,3-β-D-葡糖苷酶)、EC 3.2.1.40(例如,α-L-鼠李糖苷酶)、EC 3.2.1.51(例如,α-L-岩藻糖苷酶)、EC 3.2.1.52(例如,β-N-乙酰己糖胺酶)、EC 3.2.1.55(例如,α-N-阿拉伯呋喃糖苷酶)、EC 3.2.1.58(例如,葡聚糖1,3-β-葡糖苷酶)、EC 3.2.1.59(例如,葡聚糖内切-1,3-α-葡糖苷酶)、EC 3.2.1.67(例如,半乳聚糖1,4-α-半乳糖醛酸酶)、EC 3.2.1.68(例如,异淀粉酶)、EC 3.2.1.7(例如,1-β-D-果聚糖果糖水解酶)、EC 3.2.1.74(例如,葡聚糖1,4-β-葡糖苷酶)、EC 3.2.1.75(例如,葡聚糖内切-1,6-β-葡糖苷酶)、EC 3.2.1.77(例如,甘露聚糖1,2-(1,3)-α-甘露糖苷酶)、EC 3.2.1.80(例如,果聚糖β-果糖苷酶)、EC 3.2.1.82(例如,外切-聚-α-半乳糖醛酸苷酶)、EC 3.2.1.83(例如,κ-角叉菜胶酶)、EC 3.2.1.89(例如,阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶)、EC3.2.1.91(例如,纤维素1,4-β-纤维二糖糖苷酶)、EC 3.2.1.96(例如,甘露糖基-糖蛋白内切-β-N-乙酰葡糖胺糖苷酶)、EC 3.2.1.99(例如,阿拉伯聚糖内切-1,5-α-L-阿拉伯糖苷酶)、EC 3.4.X.X(例如,肽酶)、EC 3.4.11.X(例如,氨肽酶)、EC 3.4.11.1(例如,亮氨酰氨肽酶)、EC 3.4.11.18(例如,甲硫氨酰氨肽酶)、EC 3.4.13.9(例如,Xaa-Pro二肽酶)、EC3.4.14.5(例如,二肽基-肽酶IV)、EC 3.4.16.X(例如,丝氨酸型羧肽酶)、EC 3.4.16.5(例如,羧肽酶C)、EC 3.4.19.3(例如,焦谷氨酰肽酶I)、EC 3.4.21.X(例如,丝氨酸内肽酶)、EC3.4.21.1(例如,胰凝乳蛋白酶)、EC 3.4.21.19(例如,谷氨酰内肽酶)、EC 3.4.21.26(例如,脯氨酰寡肽酶)、EC 3.4.21.4(例如,胰蛋白酶)、EC 3.4.21.5(例如,凝血酶)、EC3.4.21.63(例如,蜂蜜曲霉蛋白酶)、EC 3.4.21.65(例如,热霉菌素)、EC 3.4.21.80(例如,链霉菌素A)、EC 3.4.22.X(例如,半胱氨酸内肽酶)、EC 3.4.22.14(例如,肌动蛋白)、EC3.4.22.2(例如,木瓜蛋白酶)、EC 3.4.22.3(例如,无花果蛋白酶)、EC 3.4.22.32(例如,茎菠萝蛋白酶)、EC 3.4.22.33(例如,水果菠萝蛋白酶)、EC 3.4.22.6(例如,木瓜凝乳蛋白酶)、EC 3.4.23.1(例如,胃蛋白酶A)、EC 3.4.23.2(例如,胃蛋白酶B)、EC 3.4.23.22(例如,栗疫霉胃蛋白酶)、EC 3.4.23.23(例如,毛霉胃蛋白酶)、EC 3.4.23.3(例如,胃蛋白酶)、EC 3.4.24.X(例如,金属内肽酶)、EC 3.4.24.39(例如,氘代溶素(deuterolysin))、EC3.4.24.40(例如,粘质沙雷氏菌酶)、EC 3.5.1.1(例如,天冬酰胺酶)、EC 3.5.1.11(例如,青霉素酰胺酶)、EC 3.5.1.14(例如,N-酰基-脂族-L-氨基酸酰胺水解酶)、EC 3.5.1.2(例如,L-谷氨酰胺酰胺水解酶)、EC 3.5.1.28(例如,N-乙酰胞壁酰-L-丙氨酸酰胺酶)、EC3.5.1.4(例如,酰胺酶)、EC 3.5.1.44(例如,蛋白-L-谷氨酰胺酰胺水解酶)、EC 3.5.1.5(例如,脲酶)、EC 3.5.1.52(例如,肽-N(4)-(N-乙酰基-β-葡糖胺基)天冬酰胺酰胺酶)、EC3.5.1.81(例如,N-酰基-D-氨基酸脱酰基酶)、EC 3.5.4.6(例如,AMP脱氨酶)和EC 3.5.5.1(例如,腈水解酶)。

在其他实施例中,POI是裂解酶,所述裂解酶包括但不限于选自以下的EC 4(裂解酶)酶:EC 4.1.2.10(例如,扁桃腈裂解酶)、EC 4.1.3.3(例如,N-乙酰神经氨酸裂解酶)、EC4.2.1.1(例如,碳酸脱水酶)、EC 4.2.2.-(例如,鼠李半乳糖醛酸聚糖裂解酶)、EC4.2.2.10(例如,果胶裂解酶)、EC 4.2.2.22(例如,果胶三糖-裂解酶)、EC 4.2.2.23(例如,鼠李半乳糖醛酸聚糖内切裂解酶)和EC 4.2.2.3(例如,甘露糖醛特异性海藻酸裂解酶)。

在某些其他实施例中,POI是异构酶,所述异构酶包括但不限于选自以下的EC 5(异构酶)酶:EC 5.1.3.3(例如,醛糖1-差向异构酶)、EC 5.1.3.30(例如,D-阿洛酮糖3-差向异构酶)、EC 5.4.99.11(例如,异麦芽酮糖合酶)和EC 5.4.99.15(例如,(1→4)-α-D-葡聚糖1-α-D-葡糖基变位酶)。

在又其他实施例中,POI是连接酶,所述连接酶包括但不限于选自以下的EC 6(连接酶)酶:EC 6.2.1.12(例如,4-香豆酸:辅酶A连接酶)和EC 6.3.2.28(例如,L-氨基酸α-连接酶)。

鉴于本说明书和以下实例,本发明的菌株和方法的这些和其他方面以及实施例对于技术人员是显而易见的。

实例

根据以下实例可以进一步理解本公开的某些方面,所述实例不应被解释为限制性的。材料和方法的修改对本领域技术人员而言是显而易见的。

实例1

lov基因被鉴别为丝状真菌蛋白质产生增加的原因

A.概述

在本实例中,特别开发了名为“B7ms1”的粘度降低的木霉属菌株,即表达葡糖淀粉酶(GA)的构建体,以降低在摇瓶条件下成球的倾向。更特别地,鉴别、分离了B7ms1的突变株(菌株),并命名为“B7ms1-SF12”。(突变)B7ms1-SF12菌株在发酵罐中的供给糖的蛋白质产率相对于B7ms1(亲代)菌株高40%(例如,参见图1)。

因此,如本文所述,对B7ms1-SF12(突变)菌株进行了基因组序列分析和遗传分析,以鉴别其中引起B7ms1-SF12(突变)菌株的观察到的(生产率增加)表型的一种或多种基因的一种或多种个突变。如本文所公开,确定了所鉴别的突变能改变(天然)LOV蛋白的编码序列,其中(天然)LOV蛋白(SEQ ID NO:2)的氨基酸(残基)位置813处高度保守的苏氨酸(T)(T813)改变(取代)为(变体)LOV蛋白的位置813处的赖氨酸(813K)(SEQ ID NO:4,即,T813K取代)(参见图2)。

B.开发策略

丝状真菌物种(例如木霉属物种、曲霉属物种、镰刀菌属物种、青霉属物种、金孢霉属物种、头孢霉属物种、篮状菌属物种、疣青霉属物种、脉孢菌属物种、毁丝霉属物种等)是在用于商业/工业发酵时通常产生浓稠的粘性发酵肉汤的有氧真菌。高发酵(肉汤)粘度典型地会降低溶氧(DO)的转移,从而限制细胞团量,并降低在此类有氧丝状真菌发酵中可达到的体积生产率。例如,粘度降低的丝状真菌突变株的分离得到产生粘度较低的发酵肉汤的突变菌株/细胞,其中使用此类粘度降低的菌株/细胞的发酵可以利用更多的细胞团,从而增加蛋白质生产率(例如,参见申请人国际PCT公开号WO 2012/145584、WO 2012/027580、WO 2012/145595、WO 2012/145596和WO 2012/145592)。更特别地,当申请人开始组合某些粘度降低的突变以产生其粘度进一步降低的菌株时,惊讶地观察到,其某些粘度(降低)的组合(即,突变)似乎更倾向于在摇瓶测定中形成菌丝体球。

更特别地,如本文所设想,如果观察到的在摇瓶中形成菌丝体球的倾向增加可以放大至发酵罐,则申请人寻求借助于定向开发实验来减轻上述成球表型。例如,在不希望受任何特定理论、作用机制或方式约束的情况下,本文设想形成菌丝体球的此种倾向可能不利地影响蛋白质的产生和/或此类蛋白质的下游加工。因此,申请人合理地认为,可以产生、筛选并分离这些菌株的“开发的”突变株,其中此类开发的菌株包含在摇瓶、发酵罐、生物反应器等中降低的菌丝体成球倾向。

例如,使木霉属菌株B7ms1的培养物在含有完全复合培养基的摇瓶中生长12-24小时,然后通过70微米(μm)的筛子。根据细胞密度,使用流通液接种新鲜培养基,或者将整个流通液转移到新鲜的摇瓶中。孵育后,连续数周重复所述过程,偶尔采集样品,然后将其铺板以分离可能的突变株。根据摇瓶形态的总体变化(例如,摇瓶形态的变化,包括但不限于成球或菌丝体结块)(单独地)对分离株进行视觉筛选。另外测试了在摇瓶中具有较均匀生长的那些分离株在摇瓶中,然后在发酵罐中的蛋白质产生。

C.木霉属突变菌株B7ms1-SF12的分离和表征

在上述开发方案中,申请人分离了一株名为“B7ms1-SF12”的突变菌株,其中(突变)B7ms1-SF12菌株相对于(亲代)B7ms1菌株在摇瓶中表现出较高的蛋白质产生(数据未显示)。因此,与对上述成球表型的任何影响无关,提高宿主菌株的蛋白质产生表型的任何一种或多种突变在其降低发酵/蛋白质生产成本的潜力方面均具有特殊价值。

因此,测定了(亲代)B7ms1菌株和自发突变(子代)菌株B7ms1-SF12在发酵罐中的总蛋白产生。使这些菌株在深层(液体培养)中在相同条件下生长,并且在14L发酵罐中比较了其供给糖的总蛋白产率。如图1所呈现,突变B7ms1-SF12菌株(图1;黑色线/黑色方块)显示相对于(亲代)B7ms1菌株,供给糖的产率改进增加了44%(图1;灰色线/灰色方块)。

简言之,将每种菌株的孢子分别添加到具有侧面和底部挡板两者的3L烧瓶中的500mL培养基中。使培养物在振荡培养箱中在34℃下在基本培养基中生长48小时。48小时后,将每个烧瓶的内含物分别添加到含有9.5L培养基的14L发酵罐中,所述培养基含有4.7g/L KHPO、1.0g/L MgSO

D.木霉突变菌株B7ms1-SF12的成因性lov(T813K)突变的鉴别

申请人对(亲代)B7ms1菌株和(突变)B7ms1-SF12(子代)菌株的基因组进行了测序,从而鉴别出两(2)种新突变,这些突变预计会改变B7ms1-SF12基因组中的编码序列,这些突变中的单独任一种(或组合)可能为观察到的蛋白质生产率(改进)表型所必需。更特别地,为了确定/鉴别这些突变中的哪些是重要的,通过用编码每个野生型基因座的DNA转化(突变)B7ms1-SF12菌株来使用互补分析。例如,仅一种基因座在转化时互补了突变表型,所述基因座被称为lov。lov基因编码预测的蛋白质PID 50212(SEQ ID NO:2),其中在(突变)B7ms1-SF12菌株中,lov突变体(等位基因)在支架序列16上425393处包含由G(鸟嘌呤)变为T(胸腺嘧啶)的单个核苷酸变化,从而在编码的LOV(变体)蛋白(SEQ ID NO:4)中产生氨基酸取代T813K,所述突变等位基因在本文中称为等位基因“lov(T813K)”,并且天然(野生型)等位基因在本文中称为“lov(+)”。

文献中尚未对任何生物体的LOV蛋白或LOV蛋白直系同源物的功能表征进行描述。如本文所述,保守结构域分析(NCBI)鉴别出与糖基转移酶家族2组(pfam13632,E值3.25x10-44,例如参见图2中的“Glyco trans 2 3”远相关的(保守)区域。例如,原核蛋白的此(糖基转移酶)家族成员包括推定的葡糖基转移酶,其参与细菌荚膜生物合成(PFAM)。更特别地,具有(糖基转移酶)家族2组结构域的真菌蛋白“ZtGT2”,其与木霉属PID 79396直系同源(即,其不是LOV,PID 50212),对于在固体表面上的菌丝生长是重要的(King等人,2017)。

最令人惊讶的是,LOV蛋白在担子菌门和子囊菌门的丝状真菌中广泛保守。例如,在NCBI非冗余数据库的最前面的BLASTp搜索结果中,在木霉属和大多数与工业相关的丝状真菌所属的盘菌亚门中,(天然)LOV蛋白位置813处的苏氨酸(T)(即,如本文所公开,其突变为赖氨酸(K)是有益的)是高度保守的(691/691;100%)。来自这691个盘菌亚门同源物的Geneious多序列比对(www.geneious.com,Geneious 11.0,Biomatters有限公司)的图示如图2所呈现。同样,在MUSCLE多序列比对(Genetic软件包)中,在前1,000个BLASTp命中中,残基位置813在975/1000(97.5%)的命中中相同(即,T813),其中残基813从未出现赖氨酸(K)(即,本文所述的引起蛋白质生产率提高的取代在BLASTp鉴别的前1000个直系同源物中未发现)。尽管保守的位置和突变可用于改进真菌蛋白的产生,但是T813残基不在Genebank中先前注释的任何区域内(图2)。LOV蛋白是木霉属基因组中此类蛋白质的唯一预测成员,而许多基因组具有超过一种预测成员。

实例2

在粘度降低的菌株中靶向引入lov(T813K)等位基因增加了发酵罐中的蛋白质生产率

A.概述

为了进一步验证lov(T813K)等位基因是观察到的蛋白质生产率改进的原因,将lov(T813K)突变引入不同的里氏木霉菌株谱系(本文中称为“T4”)中。B7ms1(实例1)和T4谱系均为来自木霉属菌株RL-P37的不同菌株改进程序的诱变衍生物(Sheir-Neiss等人,1984;Montenecourt,1987)。T4菌株与B7ms1的显著不同之处在于,T4菌株表达纤维素酶的天然混合物,并含有增加总蛋白产生的nik1(M743T)突变(US20180037919)。与先前B7ms1谱系(实例1)一样,在存在或不存在lov(T813K)等位基因的两种T4谱系中产生了粘度降低的双重突变株(Δmpg1;Δseb1)。例如,在发酵罐中,包含lov(T813K)等位基因的T4Δmpg1;Δseb1菌株的供给糖的总蛋白产率平均高37%。

B.用pyr4或pyr2选择标记构建包含lov破坏盒的质粒

使用标准分子生物学程序制备木霉属lov破坏盒质粒,其中相关领域的技术人员可以根据本文公开的信息容易地重建此质粒。所述质粒包括具有1.6Kb同源盒的DNA序列,所述同源盒与对应于支架序列16426947至425393的DNA序列(左侧翼)相同。左侧翼的最后一个核苷酸引入了单个核苷酸由G变为T的突变,所述突变对应于(突变)B7ms1-SF12菌株中鉴别的突变(实例1)。质粒中还包括具有1.5Kb同源盒的DNA序列,所述同源盒与对应于支架序列16 425392至423880的DNA序列(右侧翼)相同。设计这些序列以靶向lov基因,并用插入的盒序列替换左翼与右翼之间的基因组的核苷酸(支架序列16,425393)。

此等插入(盒)序列包括来自里氏木霉的pyr4选择标记(pRATT308)或来自阿特罗德木霉(Trichoderma atroviride)的pyr2选择标记(pRATT312)。紧邻选择标记下游的是具有0.5Kb区域的DNA序列(重复序列),所述区域与左侧翼的最3'0.5Kb区域同源。这些重复序列预期会促进选择标记的后续缺失,从而使得可以在将来的菌株开发中使用此标记,并在编码LOV(T813K)蛋白(SEQ ID NO:4)的LOV基因中留下单个核苷酸由G变为T的突变(支架序列16,425393)作为仅有的新靶向基因组修饰。

C.开发具有lov(T813K)等位基因的T4衍生菌株

基本上如美国专利号9,725,727(通过引用以其全文并入本文)中所述开发了T4菌株的衍生物,所述衍生物在本文中命名为菌株“T4m”和“T4m_pyr2”,其包含基因mpg1的降低粘度的破坏(Δmpg1)。因此,使用PEG介导的转化,用来自pRATT312(pyr2选择标记)的lov破坏盒转化T4m_pyr2菌株(Δmpg1;pyr2),并铺在含有1.2M山梨糖醇的Vogel基本培养基(Vogel,1956)上,以基于由pyr2标记获得的尿苷原养型来选择候选株。木霉属转化是众所周知的,并且在本领域中已有描述(例如,参见美国专利号5,246,853)。分离出单独的转化体,并通过转移到Vogel基本培养基中进行繁殖。使用本领域技术人员已知的方法按照以下指南,使用PCR分析鉴别lov破坏盒通过同源重组整合在lov基因座处的转化体。

仅重组细胞的亚组可以成功地利用同源侧翼正确地靶向目的基因的破坏,因此可能需要筛选许多转化体来鉴别具有所需事件的转化体。可以使用PCR来测试哪些重组细胞具有所需的靶向破坏。必须设计在每个同源盒区域内扩增的引物,其中一个引物在可选择标记内距最接近末端大于100bp的位置起始,并且其他引物在相邻基因组序列内超出同源盒区域的末端大于100bp的位置起始。可能含有正确的靶向破坏的细胞将成功建立跨越破坏盒左侧翼和右侧翼的PCR产物,而失败的转化事件将不会产生预期大小的产物。在此阶段,培养物可能是转化细胞和未转化细胞的混合物,因此可能需要纯化步骤。可以通过PCR针对跨越破坏位点的短PCR产物的缺失测试培养物的纯化。

更特别地,鉴别、分离了一株此种包含lov基因的pyr2破坏的T4m衍生菌株,并命名为“T4ml+”(即,与编码特定T813K取代的等位基因lov(T813K)相对比,其包含等位基因lov(dis))。因此,为了产生包含特定lov(T813K)等位基因的菌株,将菌株T4ml+(包含lov(dis)等位基因)的孢子悬浮液铺在含有5-氟乳清酸(FOA)的培养基上,以选择如下衍生菌株,其中在插入的选择标记侧翼的重复区域之间存在自发重组,并伴随选择标记自基因组缺失。分离尿苷营养缺陷型,并且通过PCR以测试选择标记的缺失,并对PCR产物进行测序以证实lov(T813K)等位基因的存在来分析。以此方式产生了一种包含lov(T813K)等位基因的菌株,并且在本文中称为“T4ml”。为了恢复嘧啶原养型以进行发酵罐评价,使T4ml和T4m_pyr2两种菌株的pyr2标记靶向粘度降低基因座seb1,基本上如美国专利号9,725,727所述,从而得到本文中称为“T4mls”(包含lov(T813K)等位基因)和“T4ms”(包含lov(+)等位基因)的菌株。

D.包含lov(T813K)等位基因的T4衍生菌株的发酵罐评价

因此,如实例1中所述,在发酵罐中评价了菌株T4mls(包含lov(T813K)等位基因)和T4ms(包含lov(+)等位基因)。另外,通过调节进料开始前提供的葡萄糖的量来在相对于实例1较低的细胞密度发酵下评价T4mls和T4ms菌株,以确保用lov(T813K)等位基因观察到的蛋白质产生表型不限于较高细胞密度发酵。如图3所示,在较低细胞密度(LCD;图3,T4mls,黑色圆圈/黑色虚线;T4ms,灰色圆圈/灰色虚线)发酵条件与较高细胞密度(HCD;图3,T4mls,黑色方块/黑色实线;T4ms,灰色方块/灰色实线)发酵条件下,当存在lov(T813K)等位基因时,供给糖的蛋白质产率分别增加42%和32%。

实例3

通过插入未能在发酵罐中改进生产率的pyr2选择标记来靶向破坏lov基因

A.概述

鉴于(天然)LOV蛋白(SEQ ID NO:2)的残基813位置处的苏氨酸(T)氨基酸高度保守,以会阻断LOV蛋白的表达/产生的任何方式破坏所述基因座似乎有可能也改进菌株的生产率。为了测试此假设,在发酵罐中比较了具有和不具有lov(dis)等位基因的真菌菌株,其中将pyr2选择标记插入lov基因中以破坏LOV蛋白表达。令人惊讶地,lov(dis)等位基因未改进发酵罐中的产生。

B.具有lov(dis)等位基因的菌株的发酵罐评价

T4m和T4ml+菌株的开发如上在实例2中所述。菌株T4ml+是T4m的衍生物,其中将pyr2标记插入菌株T4m_pyr2的lov编码序列中。在相同条件下评价14L发酵罐中的T4m和T4ml+菌株,所述发酵罐与实例1中所述基本上相同,但处于较低的细胞密度发酵下,这通过调节进料开始前提供的葡萄糖的量获得。

基本上如美国专利号9,725,727中所述开发了T4的衍生物,所述衍生物命名为“T4s”和“T4s_pyr2”(包含基因seb1的粘度降低破坏)。类似于实例2中对于菌株T4m_pyr2所述,将lov(dis)等位基因引入T4s_pyr2中,以产生菌株T4sl+。因此,在相同条件下,在2L生物反应器中评价了T4s和T4sl+菌株。具体地,对于2L生物反应器,为了产生种子培养物,将每种菌株的孢子分别添加到250mL烧瓶中的50mL柠檬酸盐基本培养基中。将培养物在振荡培养箱中在30℃和170rpm下生长48h。48小时后,用种子培养物接种调节至pH 3.5的145.6mL的50%葡萄糖和0.6g/kg的CaCl

实例4

在其他真菌菌株中靶向引进lov(T813K)等位基因改进了蛋白质生产率

A.概述

在实例2中,通过在seb1基因座处整合pyr2标记来恢复伴随等位基因lov(T813K)产生和标记缺失产生的pyr2营养缺陷型。因此,早已在实例1和实例2中,在总是同时含有mpg1和seb1粘度突变的菌株中例证了用lov(T813K)等位基因观察到的蛋白质产生的改进。为了证明lov(T813K)等位基因用于改进菌株生产率的更一般应用,将pyr2标记整合到三个其他方便的基因组位置处:位点A、位点B和位点C。在摇瓶中评价了这些不同菌株的蛋白质产生,其中在所有情况下,lov(T813K)突变的存在相对于具有野生型lov(+)等位基因的同基因菌株改进了总蛋白产生。相反地,包含lov(dis)突变的菌株在摇瓶中的蛋白质产生未显示出显著改进。

B.通过在不同基因组位置靶向整合pyr2选择标记,在T4ml和T4sl中恢复嘧啶营养缺陷型

使用本领域技术人员已知的方法,用将pyr2靶向整合到名为位点A-C的三个方便基因组位置的盒独立地转化具有或不具有lov(T318K)等位基因的菌株。简言之,在用pyr2盒进行PEG介导的转化后,将原生质体铺在含有1.2M山梨糖醇的Vogel基本培养基上,以基于由pyr2标记获得的尿苷原养型选择候选基因。分离出单独的转化体,并通过转移到Vogel基本培养基中进行繁殖。使用PCR分析鉴别pyr2盒整合在预期基因组位置处的转化子。孢子纯化后,进行进一步PCR分析以确保正确地发生整合并且转化体是同核的。

因此,将pyr2标记整合在pyr2突变菌株T4m_pyr2(lov(+))和T4ml(Δmpg1;lov(T318K))中位点A、位点B和位点C处,这在实例2中进行了描述(参见表1)。同样,将pyr2标记整合在突变菌株T4s_pyr2(Δseb1;lov(+))和T4sl(Δseb1;lov(T318K))中位点A处,这在实例3中进行了描述。另外,如实例2中所述分别使用质粒pRATT312和pRATT308将破坏等位基因lov(dis)添加到全纤维素酶菌株T4_pyr2(pyr2;lov(+))和41G_pyr4(pyr4;lov(+))中。

C.具有和不具有lov(T813K)或lov(dis)等位基因的菌株的摇瓶评价

在摇瓶发酵中评价了菌株的蛋白质产生。表1列出了所评价的菌株。在测试的所有遗传背景中,当存在lov(T813K)等位基因时,总蛋白滴度增加。但是,用pyr4(41G)或pyr2标记(T4和T4m)破坏lov基因lov(dis)等位基因未显示相对滴度显著改进。

液体限定(LD)培养基(例如,参见美国专利号8,455,631)含有以下组分。酪蛋白氨基酸,9g/L;(NH

为了产生种子培养物,将每种菌株的孢子分别添加到250mL烧瓶中的50mL的YEG(5g/L酵母提取物、22g/L葡萄糖、H

如图5所示,除了上文例证的在生物反应器中的T4ms背景(实例2)之外,当lov(T813K)突变存在于T4mc(位点C)、T4md(位点B)、T4mp(位点A)和T4sp(位点A)背景中时,蛋白质滴度增加。相反地,包含破坏lov基因(即,等位基因lov(dis))的pyr2标记或pyr4标记的插入的遗传背景41G、T4和T4m未显示在摇瓶中蛋白质产生显著改进。

D.具有和不具有lov(T813K)等位基因的菌株T4mp的发酵罐评价

如实例1所述,进一步在14L发酵罐中评价了这些菌株T4mp和T4mlp(在位点A处插入pyr2)中的一个对,但在较低的细胞密度下。如图6所示,在lov(T813K)等位基因存在下,此遗传背景显示供给糖的总蛋白产率增加了28%。

参考文献

PCT申请序列号PCT/US 2019/27590

PCT国际公开号WO 1992/06183

PCT国际公开号WO 1992/06209

PCT国际公开号WO 1992/06221

PCT国际公开号WO 1998/15619

PCT国际公开号WO 2002/12465

PCT国际公开号WO 2005/028636

PCT国际公开号WO 2006/074005

PCT国际公开号WO 2012/027580

PCT国际公开号WO 2012/145584

PCT国际公开号WO 2012/145592

PCT国际公开号WO 2012/145595

PCT国际公开号WO 2012/145596

PCT国际公开号WO 2012/145598

PCT国际公开号WO 2016/100272

PCT国际公开号WO 2016/100562

PCT国际公开号WO 2016/100568

PCT国际公开号WO 2016/100571

PCT国际公开号WO 2016/130523

美国专利号5,246,853

美国专利号8,455,631

美国专利号9,725,727

美国专利公开号US 2018/0037919

Altschul et al.,J.Mol.Biol.215:403-10,1990.

Altschul et al.,Meth.Enzymol.266:460-80,1996.

Ausubel et al.,“Current Protocols in Molecular Biology”,Eds.,JohnWiley&Sons,Inc.,1995,sections 2,4 and 6.

Botstein and Shortle,Science 229:4719,1985.

Church and Gilbert,“Genomic Sequencing”,PNAS,U.S.A.,81,1991-1995,1984.

Devereux et al.,Nucleic Acids Res.12:387-95,1984.

Henikoff and Henikoff,Proc.Natl.Acad.Sci.USA 89:10915,1989.

Higgins and Sharp,CABIOS 5:151-53,1989.

Higgins et al.,Gene 73:237-244,1998.

Higuchi et al.,Nucleic Acids Research 16:7351,1988.

Ho et al.,Gene 77:61,1989.

Hopwood,The Isolation of Mutants in Methods in Microbiology(J.R.Norris and D.W.Ribbons,eds.)pp 363-433,Academic Press,New York,1970.

Horton et al.,Gene 77:61,1989.

Iglesias and Trautner,Molecular General Genetics 189:73-76,1983.

Karlin et al.,Proc.Natl.Acad.Sci.USA 90:5873-87,1993.

King et al.,“A conserved fungal glycosyltransferase facilitatespathogenesis of plants by enabling hyphal growth on solid surfaces”,PLoSPathology,13(10),1-26,2017.

Lo et al.,Proceedings of the National Academy of Sciences USA 81:2285,1985.

Montenecourt B.S.,Can.,1-20,1987.

Needleman and Wunsch,J.Mol.Biol.,48:443,1970.

Parish and Stoker,FEMS Microbiology Letters 154:151-157,1997.

Perego,1993,In A.L.Sonneshein,J.A.Hoch,and R.Losick,editors,Bacillussubtilis and Other Gram-Positive Bacteria,Chapter 42,American Society ofMicrobiology,Washington,D.C.

Sambrook et al.,“Molecular Cloning:A Laboratory Manual”,Cold SpringHarbor Press,Cold Spring Harbor,N.Y.(1989),chapters 7,9 and 11.

Sarkar and Sommer,BioTechniques 8:404,1990.

Sheir-Neiss et al.,Appl.Microbiol.Biotechnology,20:46-53,1984.

Shimada,Meth.Mol.Biol.57:157;1996.

Smith and Waterman,Adv.Appl.Math.2:482,1981.

The Genome Portal of the Department of Energy Joint Genome Institute,I.V.Grigoriev,H.Nordberg,I.Shabalov,A.Aerts,M.Cantor,D.Goodstein,A.Kuo,S.Minovitsky,R.Nikitin,R.A.Ohm,R.Otillar,A.Poliakov,I.Ratnere,R.Riley,T.Smirnova,D.Rokhsar,and I.Dubchak,Nucleic Acids Res.,2011 0:gkr947v1-gkr947.

Vogel,Microbiol.Genet.Bull.13:42-43,1956.

Wisconsin Genetics Software Package(Genetics Computer Group,Madison,WI)

Youngman et al.,Proc.Natl.Acad.Sci.USA 80:2305-2309,1983.

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号