公开/公告号CN101146907A
专利类型发明专利
公开/公告日2008-03-19
原文格式PDF
申请/专利权人 金克克国际有限公司;
申请/专利号CN200680009221.9
发明设计人 王华明;
申请日2006-04-11
分类号C12N1/15;C12N15/80;C12N15/52;C07K14/38;
代理机构北京纪凯知识产权代理有限公司;
代理人赵蓉民
地址 美国加利福尼亚州
入库时间 2023-12-17 19:54:11
法律状态公告日
法律状态信息
法律状态
2023-03-17
未缴年费专利权终止 IPC(主分类):C12N 1/15 专利号:ZL2006800092219 申请日:20060411 授权公告日:20150408
专利权的终止
2015-04-08
授权
授权
2008-06-04
实质审查的生效
实质审查的生效
2008-03-19
公开
公开
技术领域
[001]本发明提供了细胞,所述细胞已进行过遗传学操作,从而具有改变的生产表达蛋白的能力。具体而言,本发明涉及丝状真菌微生物,例如曲霉属种(Aspergillus species),其中一种或多种染色体基因已被失活,优选地,其中一种或多种染色体基因从曲霉属染色体缺失。
背景技术
[002]遗传工程已可以改进用作工业生物反应器、细胞工厂和在食品发酵中使用的微生物。特别地,丝状真菌(如曲霉属(Aspergillus)种和木霉属(Trichoderma)种)和某些细菌(如杆菌(Bacillus)种)产生和分泌大量有用的蛋白质和代谢产物(Bio/Technol.5:369-376,713-719和1301-1304[1987],和Zukowski,″Productionof commercially valuable products,″In:Doi and McGlouglin(eds.)Biology of Bacilli:Applications to Industry,Butterworth-Heinemann,Stoneham.Mass pp 311-337[1992])。重要的生产酶包括包括:葡糖淀粉酶、α-淀粉酶、纤维素酶、中性蛋白酶和碱性(或丝氨酸)蛋白酶,和包括激素和抗体在内的重要生产蛋白。然而,在有些宿主细胞中蛋白质降解和修饰的发生,提供了蛋白质生产的主要障碍,尽管对在丝状真菌宿主细胞中蛋白质生产的理解有所进展,但是仍旧需要提高重要蛋白质的表达的方法。
[003]因而,本发明的目标是提供具有蛋白质降解基因和蛋白质修饰基因缺陷的曲霉属菌株,其可被用于异源或同源目标蛋白的更有效的生产。
发明概述
[004]本发明涉及在蛋白质降解和修饰中可能涉及的基因的失活(例如,蛋白酶基因、内质网(ER)降解途径(degradation pathway)基因和糖基化基因)。在一些实施方式中,基因失活是不可回复的失活,结果导致被称为失活突变体的遗传工程微生物细胞。在一些实施方式中,失活突变体具有改变的产生感兴趣的表达蛋白的能力。
[005]一方面,本发明涉及包括一种或多种不可回复的失活染色体基因的曲霉属失活突变体,所述失活染色体基因选自derA、derB、htmA、mnn9、mnn10、ochA、dpp4、dpp5、pepAa、pepAb、pepAc、pepAd和pepF,其组合以及其同源序列。在一些实施方式中,失活突变体将进一步包括不可回复的失活染色体基因,其选自pepB、pepC、pepD、其组合和其同源序列。在其它的实施方式中,曲霉属失活突变体是黑曲霉(A.niger)失活突变体。在进一步的实施方式中,失活突变体进一步包括编码异源目标蛋白质的多核苷酸。在另外的实施方式中,目标蛋白质为酶、蛋白酶抑制剂或抗体或其片段。在其它的实施方式中,当曲霉属失活突变体和亲代菌株在基本相同的生长条件下培养时,与相应的亲代曲霉属菌株相比,曲霉属失活突变体具有增强的目标蛋白质表达水平。在进一步的实施方式中,所述一种或多种失活染色体基因已被剔除或者所述一种或多种失活染色体基因已在蛋白编码区被破坏。
[006]在第二方面,本发明涉及在曲霉属失活突变体中产生目标蛋白质的方法,其包括a)获得能够产生目标蛋白质的曲霉属失活突变体,其中所述的曲霉属失活突变体具有至少一种不可回复的失活染色体基因,所述基因选自derA、derB、htmA、mnn9、mnn10、ochA、dpp4、dpp5、pepAa、pepAb、pepAc、pepAd和pepF,其基因片段以及其同源序列;b)在所述的目标蛋白质被表达的条件下,生长所述的曲霉属失活突变体;和c)回收目标蛋白质。在一些实施方式中,与所述的目标蛋白质在相应的亲代曲霉属中的表达相比,所述的目标蛋白质在失活突变体中的表达被增强。在一些实施方式中,两种染色体基因被失活。在另外的实施方式中,曲霉属失活突变体进一步包括失活染色体基因,所述基因选自pepB、pepC、pepD和其组合以及其同源序列。在另外的实施方式中,目标蛋白质为酶、蛋白酶抑制剂或抗体或其片段。在一些优选的实施方式中,目标蛋白质是异源蛋白质,在其它的实施方式中,目标蛋白质是同源蛋白质。
[007]在第三方面,本发明涉及编码下述蛋白质序列的DNA序列,所述蛋白质序列为DERA、DERB、HTMA、MNN9、MNN10、OCHA、DPP4、Dpp5、PEPAa、PEPAb、PEPAc和PEPAd以及其功能上的同源序列。
[008]在第四方面,本发明涉及包含基因derA、derB、htmA、mnn9、mnn10、ochA、dpp4、dpp5、pepAa、pepAb、pepAc和pepAd的DNA序列。
[009]在第五方面,本发明涉及制造重组丝状真菌细胞的方法,包括将DNA构建物引入丝状真菌细胞,该DNA构建物与选自derA、derB、htmA、mnn9、mnn10、ochA、dpp4、dpp5、pepAa、pepAb、pepAc、pepAd、pepF或其功能性同源序列的染色体基因进行重组,其中所述染色体基因被失活。在一个实施方式中,失活基因被剔除,在另一个实施方式中,失活基因被破坏。
附图说明
[010]图1A-B列出了基因组曲霉属derADNA序列(SEQ ID NO:1)。
[011]图2列出了推定的DERA蛋白质序列(SEQ ID NO:2)
[012]图3A-B列出了基因组曲霉属derB DNA序列(SEQ ID NO:3)。
[013]图4列出了推定的DERB蛋白质序列(SEQ ID NO:4)
[014]图5A-E列出了基因组曲霉属htmA DNA序列(SEQ ID NO:5)。
[015]图6列出了推定的HTMA蛋白质序列(SEQ ID NO:6)
[016]图7A-D列出了基因组曲霉属mnn9 DNA序列(SEQ ID NO:7)。
[017]图8列出了推定的MNN9蛋白质序列(SEQ ID NO:8)
[018]图9A-C列出了基因组曲霉属mnn10 DNA序列(SEQ ID NO:9)。
[019]图10列出了推定的MNN10蛋白质序列(SEQ ID NO:10)
[020]图11A-E列出了基因组曲霉属ochADNA序列(SEQ ID NO:11)。
[021]图12列出了推定的OCHA蛋白质序列(SEQ ID NO:12)
[022]图13A-C列出了基因组曲霉属dpp4 DNA序列(SEQ ID NO:13)。
[023]图14列出了推定的DPP4蛋白质序列(SEQ ID NO:14)
[024]图15A-B列出基因组曲霉属dpp5 DNA序列(SEQ ID NO:15)。
[025]图16列出了推定的DPP5蛋白质序列(SEQ ID NO:16)
[026]图17A-B列出基因组曲霉属pepAaDNA序列(SEQ ID NO:17)。
[027]图18列出了推定的PEPAa蛋白质序列(SEQ ID NO:18)
[028]图19A-C列出了基因组曲霉属pepAb DNA序列(SEQ ID NO:19)。
[029]图20列出了推定的PEPAb蛋白质序列(SEQ ID NO:20)
[030]图21A-B列出了基因组曲霉属pepAd DNA序列(SEQ ID NO:21)。
[031]图22列出了推定的PEPAd蛋白质序列(SEQ ID NO:22)
[032]图23A-C列出了基因组曲霉属pepF DNA序列(SEQ ID NO:23)。
[033]图24列出了推定的PEPF蛋白质序列(SEQ ID NO:24)。
[034]图25A-B列出了基因组曲霉属pepB DNA序列(SEQ ID NO:25)。
[035]图26列出了推定的PEPB蛋白质序列(SEQ ID NO:26)。
[036]图27A-D列出了基因组曲霉属pepC DNA序列(SEQ ID NO:27)。
[037]图28列出了推定的PEPC蛋白质序列(SEQ ID NO:28)。
[038]图29A-B列出了基因组曲霉属pepD DNA序列(SEQ ID NO:29)。
[039]图30列出了推定的PEPD蛋白质序列(SEQ ID NO:30)。
[040]图31A-C列出了基因组曲霉属pepAc DNA序列(SEQ ID NO:31)。
[041]图32列出了推定的PEPAc蛋白质序列(SEQ ID NO:32)。
[042]图33阐述了用于制备根据本发明的失活突变体的一般性克隆策略。图33A阐述了制造基因缺失的策略,在该策略中使用载体pMW1-ΔderA造成derA基因缺失。进一步的细节在实施例1a中阐述。图33B阐述了使用载体pBS-破坏(ochA)在基因的蛋白质编码区造成破坏的策略,如在实施例1f中针对ochA所详述的。
[043]图34描绘了通过在琼脂糖凝胶上的分离而对PCR片段进行的分析,所述PCR片段产生自由黑曲霉的失活突变体提取的全细胞DNA。基因mnn9代表了通过剔除(缺失)进行的失活(图34A),其中泳道1代表了DNA分子量标记,泳道3代表了包括mnn9基因的亲本对照,泳道7代表了mnn9基因缺失的失活菌株。基因ochA代表了通过破坏(disruption)进行的失活(图34B),其中泳道1代表了DNA分子量标记,泳道3代表了包括ochA基因的亲本对照,泳道7代表了ochA基因缺失的失活菌株。基因组DNA从基因被缺失或基因被破坏的菌株中提取。对于基因缺失或基因破坏,设计了两种引物;一种引物位于潮霉素基因的编码区(Phph,SEQ ID NO:37),使用的另一种是每一种基因的特异性引物(见SEQ IDNOs:38、43、48、53、58、61、67、70、73、76、79、84、89、92和95)。如果基因被缺失或破坏,则检验到特定的PCR产物。当来自亲本对照菌株的DNA作为PCR模板时,则不检测到条带。
发明详述
[044]本发明提供了具有一种或多种失活基因的重组真菌细胞。在一些实施方式中,真菌细胞已被进行遗传学操作以便具有改变的生产表达蛋白的能力。具体而言,本发明涉及丝状真菌细胞,例如具有增强的目标蛋白质表达的曲霉属细胞,其中一种或多种染色体基因已被失活。在一些优选的实施方式中,所述一种或多种染色体基因已从曲霉属染色体剔除,在另外的实施方式中,所述一种或多种染色体基因已在蛋白质编码区被破坏。
定义
[045]本文引用的所有的专利和出版物,包括在这些专利和出版物中公开的所有序列,被清楚地引入作为参考。除非在本文另有限定,本文使用的所用技术和科学术语,具有与本发明所属的领域中的普通技术人员普遍理解的含义相同的含义(见,例如Singleton et al.,DICTIONARY OF MICROBIOLOGY ANDMOLECULAR BIOLOGY,2D ED.,John Wiley and Sons,New York[1994]和Haleand Marham.THE HARPER COLLINS DICTIONARY OF BIOLOGY,HarperPerennial,NY[1991],它们都为技术人员提供了本文使用的许多术语的一般释义)。尽管任何相似或等同于本文描述的方法和材料的那些方法和材料,也可在实践中使用或用于测试本发明,但优选的方法和材料被描述。数字范围包括了界定该范围的数字。如本文中使用的,单数“一”、“一个”和“该”(“a”、“an”和“the”)包括复数含义,除非上下文清楚地另有指明。因此,例如,谈及一个(a)“宿主细胞”时,包括多个这样的宿主细胞。
[046]除非另有说明,分别地,核酸被从左到右以5’到3’的方向书写;氨基酸序列从左到右以氨基到羧基的方向书写。本文提供的标题不是对本发明的多个方面或实施方式的限制,这些方面或实施方式通过参考整个说明书,可以被理解。因而,下面紧接着定义的术语通过参考整个说明书而被更充分地定义。
[0471如本文使用,“失活突变体”(inactivated mutant)或“失活菌株”(inactivated strain)(例如曲霉属失活突变体)指本发明所包括的具有一种或多种失活基因的遗传工程重组宿主细胞。该术语包括其后代(子代)。在一些实施方式中,失活是基因缺失的结果,这些失活突变体有时被称为缺失突变体。在其它的实施方式中,失活是蛋白质编码序列遭破坏(disruption)的结果,这些失活突变体有时被称为破坏突变体。在一些实施方式中,失活是不可回复的。在一些实施方式中,不可回复是指这样的菌株,其将以低于10-7的频率自然回复为亲代菌株。在一些实施方式中,失活将导致这样的细胞,其不具有可检测到的与失活基因相应的基因或基因产物的活性。
[048]“相应的亲代菌株”(corresponding parent strain)指衍生出失活突变体的宿主菌株(例如,起源的和/或野生型的菌株)。
[049]术语“失活”(inactivation)包括任意方法,其可阻止derA、derB、htmA、mnn9、mnn10、ochA、dpp4、dpp5、pepAa、pepAb、pepAc、pepAd、pepF、pepB、pepC、pepD基因、其片段或其同源物中的一种或多种的功能表达,其中所述基因或基因产物不能实施其已知的功能。基因失活的手段包括缺失、蛋白编码序列的破坏、插入、添加、突变、基因沉默(例如RNAi基因反义)和类似情况。
[050]如本文使用,“蛋白编码区”(protein-coding region)指编码蛋白质氨基酸序列的基因区。
[051]如本文使用,“氨基酸”指肽或蛋白质序列或其部分。术语“蛋白质”、“肽”和“多肽”可以互相交换使用。
[052]如本文使用,术语“异源蛋白质”指不会自然出现在宿主细胞中的蛋白质或多肽。
[053]如本文使用,“同源蛋白质”或“内源性蛋白质”指自然出现在细胞中或在细胞中天然的蛋白质或多肽。
[054]如本文使用,“宿主细胞”或“宿主菌株”指这样的细胞,其有能力作为新引入的DNA序列的宿主或表达载体。在本发明的优选的实施方式中,宿主细胞为曲霉属某种。
[055]如本文使用,术语“曲霉属”(the genus Aspergillus)包括在属“曲霉属”中的所有种,如本领域技术人员已知的,包括但不限定于黑曲霉(A.niger)、米曲霉(A.oryzae)、泡盛曲霉(A.awamori)、河内曲霉(A.kawachi)和构巢曲霉(A.nidulans)。
[056]如本文使用,“核酸”指核苷酸或多核苷酸序列,及其片段或部分,以及基因组起源或合成起源的DNA、cDNA和RNA,其可以是双链的或单链的,无论其表现为有义链还是反义链。可以理解,作为遗传密码的简并性的结果,多种核苷酸序列可编码一个给定的蛋白质。
[057]如本文使用,术语“基因”指在产生多肽链中所涉及的DNA的染色体片段,其可以包括或者可以不包括在编码区之前和之后的区域(例如,启动子、终止子、5’非翻译序列(5’UTR)或前导(leader)序列和3’非翻译序列(3’UTR)或尾随(trailer)序列,以及在各个编码片段(外显子)之间的间插序列(内含子))。
[058]如本文使用,术语“载体”指可在细胞内复制并且可以将新的基因或DNA片段带入细胞的任意核酸。因此,该术语指被设计用来在不同宿主细胞之间进行转移的核酸构建物。“表达载体”指能够将异源DNA片段引入外来细胞并且将其表达的载体。许多原核表达载体和真核表达载体是商业上可获得的。恰当的表达载体的选择在本领域技术人员的知识范围内。
[059]如本文使用,术语“DNA构建物”、“表达盒”和“表达载体”指重组或合成产生的核酸构建物,其带有一连串特定的核酸成分,这些特定的核酸成分允许特定的核酸在靶细胞中转录(即,这些是载体或载体元件,如上所述)。重组体表达盒可被引入质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段。典型地,表达载体的重组表达盒部分包括将被转录的核酸序列、启动子和终止子,以及其它序列。在一些实施方式中,DNA构建物也包括一连串特定的核酸成分,其允许特定的核酸在靶细胞中转录。在一些实施方式中,本发明的DNA构建物包括选择标记。
[060]如本文使用的,“转化DNA”、“转化序列”和“DNA构建物”指被用来将序列引入宿主细胞或生物体的DNA。该DNA可在体外用PCR或其它合适的技术产生。在一些实施方式中,转化DNA包括引入的(incoming)序列,而在其它实施方式中,转化DNA进一步包括两侧为同源盒的引入序列。在进一步的实施方式中,转化DNA包括被加在末端的其它非同源序列(即填充(stuffer)序列或侧翼)。末端可以闭合,这样,转化DNA形成闭合环,例如,插入到载体内。
[061]如本文使用,术语“质粒”指被用作克隆载体的环状双链(ds)DNA构建物,并且其在许多细菌和一些真核细胞中形成染色体外自复制遗传元件。在一些实施方式中,质粒被整合到宿主细胞的基因组中。
[062]如本文使用,术语“分离的”和“纯化的”指核酸或氨基酸(或其它成分),其被从至少一种与其天然相联系的成分中除去。
[063]如本文使用,术语“增强的表达”被广泛理解为包括感兴趣蛋白质的增强的产生。增强的表达是指该表达高于在相应的亲代菌株中的正常表达水平,所述亲代菌株没有根据本文的教导进行改变,但是其在基本相同的生长条件下生长。
[064]如本文使用,术语“表达”指这样的过程,通过该过程,基于基因的核酸序列,多肽被生产。所述过程包括转录和翻译。在优选的实施方式中,所述过程也包括分泌。
[065]如本文使用,在将核酸序列引入细胞的上下文中,术语“引入”指适合将核酸序列转入细胞的任意方法。
[066]如本文使用,术语“转化的”和“稳定转化的”指这样的细胞,该细胞具有整合入其基因组或作为附加体质粒(episomal plasmid)的非天然(异源)多核苷酸序列,所述附加体质粒至少保持两代。
[067]如本文使用,“引入序列(incoming sequence)”指被引入到宿主细胞染色体的DNA序列。在一些实施方式中,引入序列是DNA构建物的一部分。在一些实施方式中,引入序列编码一种或多种目标蛋白。在另外的实施方式中,引入序列包括可以已经存在于或还没有存在于将被转化的细胞的基因组中的序列(即,其可以是同源或异源的序列)。在一些实施方式中,引入序列包括功能性或非功能性基因和/或突变或修饰的基因。在优选的实施方式中,引入序列包括选自derA、derB、htmA、mnn9、mnn10、ochA、dpp4、dpp5、pepAAa、pepAb、pepAc、pepAd、pepF、pepB、pepC、pepD、其片段和其同源序列的基因。在另一个实施方式中,引入序列包括选择标记。在进一步的实施方式中,引入序列包括两个同源盒。在一些实施方式中,引入序列编码至少一种感兴趣的异源蛋白质。
[068]如本文使用,“同源盒”指核酸序列,其与曲霉属染色体中的序列同源。更具体而言,同源盒为上游或下游区域,其与根据本发明待失活的基因或部分基因紧邻的两侧编码区域,具有大约80%至100%之间的序列同一性,大约90%至100%之间的序列同一性,或者大约95%至100%之间的序列同一性。这些序列指导DNA构建物或引入序列被整合入染色体中的何处,并且指导哪一部分染色体被DNA构建物或引入序列所取代。不是意图限制本发明,同源盒可包括大约1个碱基对(bp)至200千碱基(kb)。优选地,同源盒包括大约1bp至10.0kb;1bp至5.0kb;1bp至2.5kb;1bp至1.0kb;和0.25kb至2.5kb。同源盒也可包括大约10.0kb、5.0kb、2.5kb、2.0kb、1.5kb、1.0kb、0.5kb、0.25kb和0.1kb。在一些实施方式中,同源盒位于选择标记的5’端和3’端的两侧,其中所述同源盒包括紧靠基因编码区的两侧的核酸序列。
[069]如本文使用,术语“可选择标记”和“选择标记”指能在宿主细胞中表达的核酸(例如基因),其使得可以容易地选择那些包含所述标记的宿主。因此,术语“可选择标记”指提供指示的基因,其指示宿主细胞已经吸收了感兴趣的引入DNA或者指示一些其它的反应已经发生。典型地,可选择标记是基因,其赋予宿主细胞抗微生物剂抗性或代谢优势,以允许包含外源DNA的细胞与在转化期间没有接受任何外源序列的细胞分辨出来。“驻留可选择标记”(residing selectable marker)是位于将被转化的微生物的染色体上的标记。驻留可选择标记编码与在转化DNA构建物上的可选择标记不同的基因。选择标记对本领域的技术人员是众所周知的。如前面指出的,优选地,所述标记为抗微生物剂抗性标记(例如ampR;phleoR;specR;kanR;eryR;tetR;cmpR;hygroR和neoR;见,例如Guerot-Fleury,Gene,167:335-337[1995];Palmeros et al.,Gene 247:255-264[2000]和Trieu-Cuot etal.,Gene,23:331-341[1983])。可与本发明一起使用的其它标记包括但不限于,营养缺陷型标记,例如色氨酸、pyrG和amdS;和检测标记,例如β-半乳糖苷酶。
[070]如本文使用,术语“启动子”指核酸序列,其行使指导下游基因转录的功能。在优选的实施方式中,所述启动子适合于表达预期基因的宿主细胞。启动子,与其它转录和翻译调控核酸序列(也称为“控制序列”)一起,是表达特定基因所必需的。通常而言,转录和翻译调控序列包括但不限于,启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列以及增强子或激活子序列。
[071]当核酸被置于与其它核酸序列的功能关系中时,该核酸是“可操作连接的”。例如,如果编码促分泌引导序列(即,信号肽)的DNA被表达为参与多肽分泌的前蛋白(preprotein),那么该DNA便被可操作连接到编码所述多肽的DNA;如果启动子或增强子影响序列的转录,那么其被可操作连接到编码序列;或者如果核糖体结合位点被设置以有助于翻译,那么该核糖体结合位点被可操作连接到编码序列。一般来说,“可操作连接的”指,被连接的DNA序列是邻近的,并且,在促分泌引导序列的情况下,被连接的DNA序列是邻近的且处于相同的阅读框(reading phase)。然而,增强子不必是邻近的。通过在方便的限制性位点的连接作用(ligation)来完成连接。如果这样的位点不存在,合成的寡核苷酸适体或连接子依照传统实践被使用。
[072]如本文使用,“同源基因”指来自不同但通常相关的种类的一对基因,其彼此相对应,并且彼此相同或非常相似。该术语包括由于物种形成(即新物种的发生)而分离的基因(例如直向同源基因),以及由于基因复制而分离的基因(例如共生同源基因)。在优选的实施方式中,同源基因是功能相关的。
[073]如本文使用,“直向同源物”和“直向同源基因”指在不同物种的基因,它们是通过物种形成从共同的祖先基因(即同源基因)进化来的。典型地,直向同源物在进化的过程中保留了相同的功能。直向同源物的鉴别在新测序的基因组中基因功能的可靠预测中是有用的。
[074]如本文使用,“共生同源物”和“共生同源基因”指在基因组中由于复制而关联的基因。直向同源物在进化的过程中保持了相同的功能时,而共生同源物进化出新的功能,尽管一些功能通常是与原来的功能相关的。共生同源基因的实例包括但不限于编码胰蛋白酶、胰凝乳蛋白酶、弹性蛋白酶和凝血酶的基因,所述酶都是丝氨酸蛋白酶并且在相同的物种里一起出现。
[075]如本文使用,“同源性”指序列相似或相同,优选相同。使用在本领域已知的标准技术(见,例如Smith and Waterman,Adv.Appl.Math.,2:482[1981];Needleman and Wunsch,J.Mol.Biol.,48:443[1970];Pearson and Lipman,Proc.Natl.Acad.Sci.USA 85:2444[1988];在Wisconsin Genetics Software Package(GeneticsComputer Group,Madison,WI)中的程序例如GAP、BESTFIT、FASTA和TFASTA;和Devereux et al.,Nucl.Acid Res.,12:387-395[1984]),确定这种同源性。
[076]如本文使用,“同源序列”指核酸或多肽序列,当其与目标核酸或多肽序列进行最佳的比对以便比较时,具有下列程度的序列同一性:至少100%、至少99%、至少98%、至少97%、至少96%、至少95%、至少94%、至少93%、至少92%、至少91%、至少90%、至少88%、至少85%、至少80%、至少75%、至少70%或至少60%。在一些实施方式中,同源序列具有80%到100%之间的序列同一性,在另外的实施方式中,具有90%到100%之间的序列同一性,在更优选的实施方式中,具有95%到100%之间的序列同一性。功能性同源序列指相应的基因或蛋白质以与目标基因或蛋白质相同的方式发挥功能。
[077]有用的算法的一个实例是PILEUP。PILEUP使用渐进(progressive)、成对的比对从一组相关序列中产生多序列联配。它也可以作出树图,其显示了用来产生联配的群集(clustering)关系。PILEUP使用简化了的Feng和Doolittle(Fengand Doolittle,J.Mol.Evol.,35:351-360[1987])渐进对比方法。该方法与Higgins和Sharp(Higgins and Sharp,CABIOS 5:151-153[1989])描述的方法相似。有用的PILEUP参数包括缺省的空位(gap)加权3.00,缺省的空位长度加权0.10和加权的末端空位。
[078]有用的算法的另一个实例是Altschul等(Altschul et al.,J.Mol.Biol.,215:403-410,[1990]和Karlin et al.,Proc.Natl.Acad.Sci.USA 90:5873-5787[1993])描述的BLAST算法。特别有用的BLAST程序是WU-BLAST-2程序(见,Altschulet al.,Meth.Enzymol.,266:460-480[1996])。WU-BLAST-2使用几个研究参数,其中大多数被设定为默认值。可调整的参数按照下列数值设定:重叠范围(overlapspan)=1、重叠分数(overlap fraction)=0.125、字串阈值(word threshold)(T)=11。HSP S和HSP S2参数是动态数值,其可以根据具体序列的组成和检索目标序列的具体数据库的组成,由程序自身确定。然而,数值可被调整以增加灵敏度。匹配的相同残基的数目除以被比对的区域中“较长”序列的总残基数,便确定了氨基酸序列同一性的百分比数值。所述“较长”序列是在比对区具有最多实际残基的序列(WU-BLAST-2为了最大化比对分值而引入的空位是不计的)。
[079]如本文使用,术语“杂交”指这样的过程,通过该过程核酸的链通过碱基配对结合到互补链上,如本领域已知的。
[080]如果核酸序列和参照核酸序列,在中度到高度严格的杂交和洗涤条件下,特异性地彼此杂交,该核酸序列被认为“选择性地杂交”到参照核酸序列上。杂交条件基于核酸结合复合体或探针的解链温度(Tm)。例如,“最大严格性”典型的发生在大约Tm-5℃(探针Tm以下5℃);“高度严格性”在Tm以下大约5-10℃;“中度严格性”在探针Tm以下大约10-20℃;“低度严格性”在Tm以下大约20-25℃。功能上,最大严格条件可被用来鉴别与杂交探针具有严格同一性或接近严格同一性的序列;而中度或低度严格杂交可被用来鉴别或检测多核苷酸序列同源物。
[081]中度和高度严格杂交条件在本领域是众所周知的。高度严格条件的实例包括在大约42℃、在50%甲酰胺、5X SSC、5X Denhardt′s溶液、0.5%SDS和100μg/ml变性载体DNA中杂交,然后在2X SSC和0.5%SDS中在室温下洗涤两次,在0.1X SSC和0.5%SDS中在42℃再洗涤两次。中度严格条件的实例包括在37℃、在包含20%甲酰胺、5X SSC(150mM NaCl、15mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5X Denhardt's溶液、10%硫酸葡聚糖和20mg/ml变性剪切的鲑精DNA的溶液中温育过夜,然后在1X SSC中在大约37-50℃洗涤滤膜。本领域技术人员知道如何调整温度、离子强度等,这对于适应例如探针长度等因素是必需的。
[082]如本文使用,“重组的”包括表示这样的细胞或载体,其已经通过引入异源核酸序列而被修饰,或者表示细胞是衍生自如此修饰的细胞。因此,例如,重组细胞表达没有在细胞的天然(非重组)形式中以相同形式找到的基因,或者由于人类有意的干预,重组细胞表达以另外的方式异常表达、不足表达、过度表达或根本不表达的天然基因。“重组”(recombination)、“重组”(recombining)或产生“重组的”核酸通常是将两个或多个核酸片段装配,其中所述装配产生嵌合基因。
[083]在一个可选择的实施方式中,转化DNA序列包括同源盒,没有引入序列的存在。在该实施方式中,预期缺失在两个同源盒之间的内源DNA序列。而且,在一些实施方式中,转化序列是野生型的,而在另外的实施方式中,转化序列是突变或修饰的序列。另外,在一些实施方式中,转化序列是同源的,而在另外的实施方式中,转化序列是异源的。
[084]如本文使用,术语“靶序列”指在宿主细胞中编码这样的序列的DNA序列,预期引入序列将在这样的序列处插入到宿主细胞基因组。在一些实施方式中,靶序列编码功能性野生型基因或操纵子,而在其它的实施方式中,靶序列编码功能突变基因或操纵子,或者编码非功能性的基因或操纵子。
[085]如本文使用,“侧翼序列”指在被讨论序列的上游或下游的任意序列(例如,对于基因A-B-C,A和C基因序列位于基因B的两侧)。在优选的实施方式中,同源盒位于引入序列两侧的每一侧。在另外的实施方式中,引入序列和同源盒构成一个单元,填充序列位于所述单元两侧的每一侧。在一些实施方式中,侧翼序列仅仅存在于一侧(3’或5’),而在优选的实施方式中,其存在于序列两侧的每一侧上。每一个同源盒的序列与曲霉属染色体的序列同源。这些序列指导新的构建物整合到曲霉属染色体中的哪里,并且指导曲霉属染色体的哪一部分被引入序列所取代。在一些实施方式中,这些序列指导新的构建物整合到曲霉属染色体中的哪里,而没有任何一部分染色体被引入序列所取代。在优选的实施方式中,包含一部分失活染色体片段的多核苷酸序列位于选择标记的5’端和3’端的两侧。在一些实施方式中,侧翼序列仅存在于一侧(3’或5’),而在优选的实施方式中,其存在于序列两侧的每一侧上。
[086]如本文使用,术语“引物”指寡核苷酸,无论是作为纯化的限制性消化产物天然出现的,或者是合成产生的,当被置于与核酸链互补的引物延伸产物的合成被诱导的条件下(即,在存在核苷酸和诱导剂例如DNA聚合酶时,以及在适当的温度和pH下)时,该寡核苷酸可作为引发合成的起点。引物优选单链以获得最大效率的扩增。优选地,引物为寡脱氧核糖核苷酸。
[087]如本文使用,术语“聚合酶链反应”(“PCR”)指美国专利第4,683,195、4,683,202和4,965,188号的方法,其在这里引入作为参考。
[088]如本文使用,术语“限制性内切核酸酶”和“限制性酶”指细菌酶,其每一个在特异性核苷酸序列上或在其附近切割双链DNA。
[089]“限制性位点”指被特定限制性内切核酸酶识别和切割的核苷酸序列,并且限制性位点通常是用于插入DNA片段的位点。在本发明某些实施方式中,限制性位点被设计到选择标记中,以及被设计到DNA构建物的5’和3’端。
[090]如本文使用,“菌株存活力”指增殖活力。在优选的实施方式中,在实验室条件下,染色体基因的失活不会严重影响失活突变体的分裂和存活。
[091]如本文使用,术语“染色体整合”指引入序列被引入宿主细胞(例如曲霉属)染色体的过程。引入(转化)DNA的同源区与染色体的同源区联配。随后,同源盒之间的序列通过双交换,被引入序列所取代(即同源重组)。
[092]“同源重组”指在两个DNA分子之间或成对染色体之间在相同或接近相同的核苷酸序列位点上,交换DNA片段。在优选的实施方式中,染色体整合是通过同源重组进行的。
优选的实施方式
[093]本发明提供能生产感兴趣的蛋白的失活突变体(例如缺失突变体和破坏突变体)。具体而言,本发明涉及重组丝状真菌微生物,例如具有改变的目标蛋白表达的曲霉菌种,其中一种或多种染色体基因已被失活,优选地,其中一种或多种染色体基因已从曲霉属染色体上剔除,或者其中一种或多种染色体基因的蛋白编码区已被破坏。实际上,本发明提供了用于剔除单一或多种基因的方法。在优选的实施方式中,这样的剔除提供了好处,例如提高了目标蛋白质的生产。
失活基因
[094]如上面指出的,本发明包括涉及单一或多种基因失活的实施方式。在一些实施方式中,基因失活是基因缺失或基因破坏。在一些实施方式中,失活是不可回复的。
[095]根据本发明将被失活的基因包括但不限于涉及蛋白质降解或蛋白质修饰的那些基因,例如ER降解途径中的蛋白质、蛋白酶基因,例如分泌的丝氨酸和天冬氨酸蛋白酶基因、糖基化基因和糖蛋白降解基因。在一些实施方式中,将被失活的染色体基因包括一种或多种下列的基因:derA、derB、htmA、mnn9、mnn10、ochA、dpp4、dpp5、pepF、pepAa、pepAb、pepAc和pepAd;或者与其具有至少99%、至少98%、至少97%、至少96%、至少95%、至少94%、至少93%、至少92%、至少91%、至少90%、至少88%、至少85%、至少80%、至少70%或至少60%的序列同一性的功能性同源序列。
[096]关于根据本发明将被失活的基因,derA和derB基因被认为在ER降解途径中行使作用。ER降解途径的酶包括ER驻留蛋白,例如在错误折叠蛋白从ER到胞质的易位中所涉及的蛋白,以及非ER驻留蛋白,例如遍在蛋白缀合酶,其以错误折叠蛋白为靶标以进行蛋白酶体降解(Bonifacino and Weissman[1998] Ann.Rev.Cell.Biol.14:19-57)。htmA、mnn9、mnn10和ochA基因被认为在糖蛋白修饰中行使作用。糖蛋白修饰酶是修饰寡糖分子的酶,所述寡糖分子被加入到蛋白质上的氨基酸残基。dpp4、dpp5、pepF、pepAa、pepAb、pepAc、pepAd、pepB、pepC和pepD基因被认为是蛋白酶。蛋白酶是蛋白降解酶,其催化蛋白质的水解切割。更具体而言,蛋白酶是切割肽键的酶。在一些实施方式中,蛋白酶基因是天冬氨酸蛋白酶(例如pepAa、pepAb、pepAc、pepAd和pepB)。具有酶促活化的天冬氨酸蛋白酶,是在其活性位点包括天冬氨酸残基的那些酶或其片段(Kosta,V (Ed)ASPARTIC PROTEINASES AND THEIR INHIBITORS,Walter de Gruyter,NY pp 27-40;151-161 and 163-177)。在另外的实施方式中,蛋白酶基因是二肽酰肽酶(例如dpp4和dpp5)。在另外的实施方式中,蛋白酶基因是丝氨酸羧肽酶(例如pepF),在另外的实施方式中,蛋白酶基因是丝氨酸蛋白酶(例如pepC和pepD)。
[097]在一些实施方式中,失活基因将包括两种或多种(例如两种、三种或四种)根据本发明的失活基因。在其它的实施方式中,失活基因将包括至少一种上述的基因和选自pepB、pepC、pepD、其组合和与其具有至少99%、至少98%、至少97%、至少96%、至少95%、至少94%、至少93%、至少92%、至少91%、至少90%、至少88%、至少85%、至少80%、至少70%或至少60%的序列同一性的功能性同源序列的基因。
[098]在其它的实施方式中,失活基因将包括上面列举的基因中的任何一种和失活的pepA基因或其同源序列,例如在Berka等,[1990]Gene 86:153-162、美国专利5,840,570和美国专利6,509,171公开的aspergillopesins。
[099]并不打算用任何方式限制本发明,将被失活的基因包括下列组合和其功能性同源基因:(a)mnn9和mnn10;(b)mnn9和ochA;(c)mnn9、mnn10和ochA;(d)dpp4和dpp5;(e)dpp4、dpp5和pepA;(f)pepAa和pepAb;(g)pepAa、pepAb和pepAc;(h)pepAa和pepAc;(i)pepAa、pepAb、pepAc和pepB;(j)pepAa、pepAb、pepAc和pepC;(k)pepAa、pepAb、pepAc和pepD;(I)pepB、pepC、pepD和pepF;(m)pepAa、pepAb和pepAc;和n)dpp4、dpp5和mnn9。进一步的实施方式包括上述组合(a-n)中的任意一种和失活的pepA基因或其同源基因。
[100]在一些实施方式中,曲霉属的这些基因的DNA编码序列被提供在SEQID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29和SEQ ID NO:31。如上面指出的,预期在丝状真菌细胞中发现的功能性同源基因,将在本发明中有用。在一些实施方式中,功能性同源基因将与上面列举的序列中的任何一种具有至少80%的序列同一性。
[101]用于确定宿主细胞中的同源序列的方法在本领域是已知的,方法包括使用本文公开的核酸序列构建寡核苷酸探针,所述探针与被编码的蛋白的大约6到20个氨基酸相对应。然后,该探针可被用来克隆同源的蛋白降解基因。使用适当的限制性酶分离和消化丝状真菌宿主基因组DNA。分离片段,并按照标准方法使用从蛋白质降解序列制备的寡核苷酸探针探测片段。分离对应于通过与寡核苷酸探针杂交而被鉴定出的DNA片段的片段,将该片段连接到适当的载体,然后转化到宿主中以产生DNA克隆。
[102]在另外的实施方式中,DNA编码选自下列的蛋白序列:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30和SEQ ID NO:32,以及其功能性同源序列。在一些实施方式中,功能性同源序列将是在丝状真菌细胞(即曲霉属)中找到的蛋白,并且与上面列举序列的任何一个具有至少95%的序列同一性。在一些实施方式中,功能性同源序列将在黑曲霉或米曲霉中找到,并且将与上面列举序列的任何一个具有至少90%或具有至少95%的序列同一性。在其它的实施方式中,通过一个或多个保守的氨基酸取代,蛋白序列将与上面列举序列的任何一个有所不同,所述保守的氨基酸取代例如但不限于下列组:甘氨酸和丙氨酸;缬氨酸、异亮氨酸和亮氨酸;天冬氨酸和谷氨酸;天冬酰胺和谷氨酰胺;丝氨酸和苏氨酸;色氨酸、酪氨酸和苯丙氨酸;以及赖氨酸和精氨酸。失活的方法和用来失活染色体基因的DNA构建物的一般性构建
[103]在一些实施方式中,本发明包括包含了引入序列的DNA构建物。该DNA构建物被在体外进行组装,然后构建物被直接克隆入感受态宿主(例如曲霉属宿主),这样,DNA构建物整合入宿主染色体。例如,PCR融合和/或连接可被用来在体外组装DNA构建物。在一些实施方式中,DNA构建物是非质粒构建物,而在另外的实施方式中,DNA构建体被并入载体(例如质粒)。在一些实施方式中,使用环状质粒。在优选的实施方式中,设计环状质粒以便使用适当的限制性酶(即,不会破坏DNA构建物的酶)。因此,线性质粒在本发明中可用。
[104]在一些实施方式中,引入序列包括derA、derB、htmA、mnn9、mnn10、ochA、dpp4、dpp5、pepAa、pepAb、pepAc、pepAd、pepF、pepC、pepB、pepD基因、其基因片段、其同源序列;或者临近的染色体编码区侧翼序列。同源序列为这样的核酸序列,其与上面列举的序列之一具有功能相似性,并且其与derA、derB、htmA、mnn9、mnn10、ochA、dpp4、dpp5、pepAa、pepAb、pepAc、pepAd、pepF、pepB、pepC、pepD基因或其基因片段具有至少99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、88%、85%、80%、70%或60%的序列同一性。
[105]在一些实施方式中,其中基因组DNA是已知的,通过两个PCR反应克隆出将被缺失的基因的5’侧翼片段和3’侧翼片段,在所述基因被破坏的实施方式中,通过一个PCR反应克隆所述DNA片段。
[106]在一些实施反式中,编码区侧翼序列包括大约1bp到2500bp的范围;大约1bp到1500bp的范围;大约1bp到1000bp的范围;大约1bp到500bp的范围和大约1bp到250bp的范围。构成编码区侧翼序列的核酸序列的数目,在基因编码序列的每一端可以是不同的。例如,在一些实施方式中,编码序列的5’端包括25bp以下,编码序列的3’端包括100bp以上。
[107]在一些实施方式中,引入序列包括选择标记,其5’端和3’端的两侧为基因序列的片段。在另外的实施方式中,当包括选择标记和基因、基因片段或其同源序列的DNA构建物被转化入宿主细胞时,选择标记的位置致使该基因没有它原本应有的功能。在一些实施方式中,引入序列包括位于基因启动子区的选择标记。在另外的实施方式中,引入序列包括位于基因启动子区之后的选择标记。在又一个另外的实施方式中,引入序列包括位于基因编码区的选择标记。在进一步的实施方式中,引入序列包括选择标记,同源盒位于该选择标记的两侧的每一边。在又进一步的实施方式中,引入序列包括中断编码序列的转录和/或翻译的序列。在另外的实施方式中,DNA构建物包括被设计在该构建物上游和下游端的限制性位点。
[108]无论DNA构建物是被并入载体或者是在不存在质粒DNA的情况下使用,DNA构建物被用来转化微生物,其导致了失活突变体,优选地,所述突变体具有稳定和不可回复的染色体基因失活。用来连接DNA构建物和将其插入适当的载体的方法在本领域是众所周知的。通常通过在方便的限制性位点的连接作用来完成连接。如果这类位点不存在,那么合成的寡核苷酸连接子依照传统实践被使用(见,Sambrook(1989)supra,and Bennett and Lasure,MORE GENEMANIPULATIONS IN FUNGI,Academic Press,San Diego(1991)pp 70-76)。另地,可以使用已知的重组技术构建载体(例如,Invitrogen Life Technologies.GatewayTechnology)。可在本发明的实践中使用的适当的表达载体和/或整合载体的实例被提供在Sambrook et al.,(1989)supra,Ausubel(1987)supra,van den Hondel et al.(1991)in Bennett and Lasure(Eds.)MORE GENE MANIPULATIONS IN FUNGI,Academic Press pp.396-428和美国专利第5,874,276号。特别有用的载体包括pFB6、pBR322、pUC18、pUC100和pENTR/D。
[109]在一些实施方式中,DNA构建物的至少一个拷贝被整合到宿主染色体。在一些实施方式中,本发明的一种或多种DNA构建物被用来转化宿主细胞。例如,一种DNA构建物可被用来失活derA基因,而另一种构建物可被用来失活derB基因。当然,本发明考虑和提供了另外的组合。
[110]失活通过任合适合的手段发生,包括在所述核酸基因序列中进行删除、取代(例如突变)、中断和/或插入,以及基因沉默机制,例如RNA干扰(RNAi)。在一个实施方式中,失活基因的表达产物是截短的蛋白质,其在蛋白质的生物活性上具有相应的改变。在优选的实施方式中,失活导致了基因生物活性的丢失。在一些实施方式中,相比相应的亲代菌株中的相同基因或功能性同源基因的生物活性,重组真菌细胞中的失活基因的生物活性将在25%以下(例如20%、15%、10%、5%和2%)。
[111]在一些优选的实施方式中,通过缺失,实现失活,在其它优选的实施方式中,通过基因的蛋白编码区的破坏,实现失活。在一些实施方式中,通过同源重组使基因失活。如本文使用,基因的“缺失”指全部编码序列的缺失、部分编码序列的缺失或包括侧翼区域的编码序列的缺失。只要留在染色体中的序列致使基因功能失活,那么所述缺失可以是部分的。在优选的实施方式中,缺失突变体包括一种或多种基因的缺失,这样导致了稳定且不可回复的缺失。编码序列的侧翼区域可以在5’和3’端包括大约1bp到大约500bp。侧翼区域可大于500bp,但侧翼区域优选不在根据本发明可被失活或剔除的区域中包括其它的基因。最终结果是,缺失的基因是有效地非功能性的。简单地说,“缺失(剔除)”被定义为核苷酸或氨基酸序列的变化,其中一个或多个核苷酸或氨基酸残基分别被除去(即,不存在)。并不打算限制用来失活的方法,在一些实施方式中,derA、derB、htmA、mnn9、mnn10、pepC和pepB和功能性同源基因可以通过剔除而被失活。
[112]“破坏(disruption)”是在核苷酸或氨基酸序列中的变化,当与亲代或自然发生的序列比较时,其分别导致了一个或多个核苷酸或氨基酸残基的添加。在一些实施方式中,破坏可以是在体外通过限制性酶位点将标记基因插入到蛋白编码区。编码序列的侧翼区域可以在5’和3’端包括大约1bp到大约500bp。侧翼区域可大于500bp,但是优选地在该区域不包括其它基因。DNA构建物与宿主染色体的同源序列联配,并且在双交换事件中,基因的翻译或转录被破坏。例如,包含基因或基因编码序列的一部分和选择标记的质粒与ochA染色体基因联配。在一些实施方式中,选择标记位于基因编码序列内或在与基因分开的质粒部分上。将载体整合入宿主染色体,并且通过将标记插入到编码序列来失活该基因。并不打算限制用来失活的方法,在一些实施方式中,这种方法可以使ochA、dpp4、dpp5、pepAa、pepAb、pepAc、pepAd、pepF、pepD和功能性同源序列失活。
[113]“插入”或“添加”是在核酸或氨基酸序列中的变化,其中,当与内源染色体序列或蛋白质产物比较时,一个或多个核苷酸或氨基酸残基已被添加。在一些实施方式中,使用质粒作为载体,在单交换事件中进行的插入导致了失活。例如,将载体整合入宿主细胞染色体,并且通过在基因的蛋白质编码序列或者在基因的调控区插入载体,使该基因失活。
[114]在可选择的实施方式中,由于基因的突变产生了失活。突变基因的方法在本领域是众所周知的,包括但不限于定点突变、随机突变的产生和缺口双链体方法(见例如美国专利第4,760,025号;Moring et al.,Biotech.2:646[1984];andKramer et al.,Nucleic Acids Res.,12:9441[1984])。
宿主细胞
[115]在本发明中,宿主细胞优选丝状真菌细胞(见,Alexopoulos,C.J.(1962),INTRODUCTORY MYCOLOGY,Wiley,New York),优选的丝状真菌细胞包括曲霉属某种(例如米曲霉、黑曲霉、泡盛曲霉、构巢曲霉、酱油曲霉(A.sojae)、日本曲霉(A.japonicus)、河内曲霉(A.kawachi)和棘孢曲霉(A.aculeatus));根霉属某种(Rhizopus sp.)、木霉属某种(Trichoderma sp.)(例如里氏木霉(Trichodermareesei)(以前被分类为长枝木霉(T.longibrachiatum),现在也称为红褐肉座菌(hypocrea jecorina))、绿色木霉(Trichoderma viride)、康氏木霉(Trichodermakoningii)和哈茨木霉(Trichoderma harzianums)))和毛霉属某种(Mucor sp.)(例如米黑毛霉(M miehei)和微小根毛霉(M pusillus))。最优选的宿主细胞为黑曲霉细胞。在一些实施方式中,黑曲霉特定的菌株包括ATCC 22342(NRRL 3112)、ATCC 44733和ATCC 14331和从其衍生的菌株。在一些实施方式中,宿主细胞是能表达异源基因的细胞。宿主细胞可以是重组细胞,其包括异源蛋白。在另外的实施方式中,宿主是这样的细胞,其过表达已被引入细胞的蛋白质。在一些实施方式中,宿主菌株是一个或多个基因有缺陷的突变菌株,所述基因,例如,相应于除本文公开的蛋白酶基因之外的蛋白酶基因的基因。例如,优选的宿主为黑曲霉,其中,编码主要分泌的天冬氨酰蛋白酶例如aspergillopepsin的基因已被剔除(美国专利第5,840,570号和第6,509,171号)。
确定基因失活的方法
[116]本领域的技术人员可使用多种方法来确定基因是否已被失活。并不打算限制本发明,一种可以使用的方法为被Zhu(Zhu et al.,Acat Mycologica Sinica13:34-40[1994])描述的苯酚/氯仿方法。简言之,在该方法中,基因组DNA被用作进行PCR反应的模板。设计引物,这样,一种引物与选择标记基因(例如潮霉素抗性标记基因,hph)退火,另一引物与在基因3’端的距离DNA同源片段的3’端远处的序列退火。当失活突变体的基因组DNA被用作PCR反应模板时,失活突变体将产生特定的PCR产物,与之相反,当相应的亲代菌株(具有非失活基因)基因组DNA被用作模板时,将不会产生PCR片段。另外,失活突变体的PCR片段可经过DNA测序来确认失活基因的情况。其它可用的方法包括包括Southern分析,可参考Sambrook(1989)supra。
感兴趣的蛋白(目标蛋白)
[117]在一些实施方式中,本发明包括的失活突变体将过表达目标同源蛋白质,在另外的实施方式中,本发明包括的失活突变体将表达目标异源蛋白质。
[118]在一些实施方式中,目标蛋白质是细胞内的,而在另外的实施方式中,目标蛋白是分泌多肽。另外,目标蛋白可以是融合蛋白或杂合蛋白。优选的多肽包括酶,其包括但不限于选自淀粉分解酶、蛋白水解酶、细胞裂解酶、氧化还原酶和植物细胞壁降解酶的酶。更具体而言,这些酶包括但不限于淀粉酶、葡糖淀粉酶、蛋白酶、木聚糖酶、脂肪酶、漆酶、酚氧化酶、氧化酶、角质酶、纤维素酶、半纤维素酶、酯酶、过氧化物酶(perioxidase)、过氧化氢酶、葡萄糖氧化酶、肌醇六磷酸酶、果胶酶、葡萄糖苷酶、异构酶、转移酶、半乳糖苷酶和几丁质酶。特别优选的酶包括但不限于淀粉酶、葡糖淀粉酶、蛋白酶、酚氧化酶、纤维素酶、半纤维素酶、葡萄糖氧化酶和肌醇六磷酸酶。在本发明一些特别优选的实施方式中,目标多肽是蛋白酶、纤维素酶、葡糖淀粉酶或淀粉酶。这些酶在本领域是众所周知的。
[119]在一些实施方式中,目标蛋白是分泌多肽,其被融合到信号肽(即在将被分泌的蛋白质上的氨基端延伸)。几乎所有的分泌蛋白都使用氨基端的蛋白质延伸,其在前体蛋白质向膜的靶向和其跨膜的转移中起关键的作用。该延伸通过信号肽酶,在膜转移期间或者膜转移之后马上进行蛋白水解而除去。
[120]在本发明的一些实施方式中,目的多肽是这样的蛋白质,例如蛋白酶抑制剂,其抑制蛋白酶的作用。蛋白酶抑制剂在本领域是众所周知的,例如属于丝氨酸蛋白酶抑制剂家族的蛋白酶抑制剂,已知它们可抑制胰蛋白酶(trysin)、组织蛋白酶G、凝血酶和组织激肽释放酶。特别优选的蛋白酶抑制剂包括Bowman-Birk抑制剂和大豆胰蛋白酶抑制剂(见,Birk,Int.J.Pept Protein Res.25:113-131[1985];Kennedy,Am.J.Clin.Neutr.68:1406S-1412S[1998]and Billingset al.,Proc.Natl.Acad.Sci.89:3120-3124[1992])。
[121]在本发明的一些实施方式中,目的多肽选自激素、抗体、生长因子、受体、细胞因子等等。本发明包括的激素包括但不限于,促滤泡素、促黄体激素、促肾上腺皮质素释放因子、促生长素抑制素、促性腺激素、血管加压素、催产素、促红细胞生成素、胰岛素和类似物。生长因子包括但不限于血小板衍生生长因子、胰岛素样生长因子、表皮生长因子、神经生长因子、成纤维细胞生长因子、转化生长因子、细胞因子例如白介素(例如IL-1到IL-13)、干扰素、集落刺激因子和类似物。抗体包括但不限于,从预期可产生抗体的任意物种中直接获得的免疫球蛋白。另外,本发明包括修饰的抗体。本发明也包括多克隆和单克隆抗体。在特别优选的实施方式中,抗体或其片段是人源化的抗体,例如抗-p185Her2和HulD10-。
[122]在进一步的实施方式中,编码目标蛋白的核酸被可操作连接到适当的启动子,其在真菌宿主细胞中表现出转录活性。启动子可来自编码与宿主细胞同源或异源的蛋白的基因。启动子可以是截短启动子或者杂合启动子。进一步,启动子可以是诱导型启动子。优选地,启动子可用于木霉属宿主或曲霉属宿主中。启动子的适当的非限制性实例包括cbh1、cbh2、egl1、egl2、xyn1和amy。在一个实施方式中,启动子是相对于宿主细胞为天然的启动子。有用的启动子的其它实例包括来自下列基因的启动子:泡盛曲霉和黑曲霉葡糖淀粉酶基因(glaA)(Nunberg et al.,(1984)Mol.Cell Biol.4:2306-2315 and Boel et al.,(1984)EMBO J.3:1581-1585);米曲霉TAKA淀粉酶;米黑根酶天冬氨酸蛋白酶;黑曲霉中性α-淀粉酶;黑曲霉酸稳定α-淀粉酶;里氏木霉xln1和纤维二糖水解酶1基因启动子(EPA 137280A1),以及其突变的、截短的和杂合的启动子。
[123]在一些优选实施方式中,多肽编码序列被可操作连接到指导编码多肽进入细胞分泌途径的信号序列。编码序列的5’端可天然地包括,按翻译阅读框与编码分泌多肽的编码区片段天然连接的信号序列。编码信号序列的DNA优选那些与将被表达的多肽天然连接的DNA。优选地,信号序列由黑曲霉α-淀粉酶、黑曲霉中性淀粉酶或黑曲霉葡糖淀粉酶编码。在一些实施方式中,信号序列是可操作连接到cdh1启动子的木霉cdh1信号序列。
真菌细胞的转化
[124]将DNA构建物或载体引入宿主细胞包括下列技术,例如转化;电穿孔;核微注射;转导;转染(例如,脂转染调节的转染和DEAE-Dextrin介导的转染);用磷酸钙温育沉淀DNA;使用DNA包被的微射弹进行高速轰击;农杆菌介导的转化和原生质体融合。一般的转化技术在本领域是已知的(见,例如Ausubel et al.,(1987),supra,chapter 9;and Sambrook(1989)supra,Campbell et al.,(1989)Curr.Genet.16:53-56 and THE BIOTECHNOLOGY OF FILAMENTOUS FUNGI,Chap.6.Eds.Finkelstein and Ball(1992)Butterworth and Heinenmann)。异源蛋白在木霉中的表达描述在美国专利第6,022,725号;美国专利第6,268,328号;Harkki et al.(1991);Enzyme Microb.Technol.13:227-233;Harkki et al.,(1989)Bio Technol.7:596-603;EP244,234;EP 215,594;and Nevalainen et al.,″The Molecular Biology of Trichodermaand its Application to the Expression of Both Homologous and Heterologous Genes”,inMOLECULAR INDUSTRIAL MYCOLOGY,Eds.Leong and Berka,Marcel DekkerInc.,NY(1992)pp.129-148)。对于曲霉属菌株的转化,也参考Cao等,(2000)Sci.9:991-1001和美国专利第6,509,171号。然后使用已知的技术纯化转化子。
细胞培养
[125]真菌细胞可以在传统的培养基中生长。用于转化细胞的培养基可被改性为适合用于活化启动子和选择转化子。具体的培养条件,例如温度、pH和类似条件,对本领域的技术人员是明显的。优选的培养条件可在科学文献例如Sambrook,(1982)supra以及从美国典型培养物保藏中心(American Type Culture Collection)找到。另外,用于生产异源蛋白质的发酵过程,在本领域是已知的。例如,可以使用固体培养或浸没培养生产蛋白质,包括分批、补料分批和连续流动工艺。发酵温度可以稍微变化,但是对于丝状真菌例如黑曲霉,温度通常在大约20℃到40℃的范围内,通常优选的在大约28℃到37℃的范围内,这取决于所选择的微生物菌株。含水微生物发酵物(发酵混合物)的pH范围应该在大约2.0到8.0的典型范围内。对于丝状真菌,pH通常在大约2.5到8.0的范围内;对于黑曲霉,pH通常在大约4.0到6.0的范围内,优选地在大约4.5到5.5的范围内。发酵混合物在发酵罐里的平均存留时间可以有极大的变化,这部分取决于发酵温度和所使用的培养物,但通常平均存留时间在大约24到500小时的范围内,优选地,目前在大约20到400小时。尽管目前优选在15L Biolafitte(Saint-Germain-en-Laye,France)中操作,但是使用的发酵罐的类型不是关键的。
确定表达蛋白的活性的方法
[126]各种用于检测和测量细胞内和细胞外表达的多肽活性的方法,对本领域的普通技术人员是已知的。用于确定在宿主细胞内目标蛋白分泌水平和检测表达蛋白的方法,包括使用免疫测定,所述免疫测定使用蛋白特异性的多克隆抗体或单克隆抗体。实例包括酶联免疫吸附分析(ELISA)、放射免疫测定(RIA)、荧光免疫测定(FIA)和荧光活化细胞分捡(fluorescent activated cell sorting,FACS)。然而,其它的方法对本领域技术人员是已知的,它们可以用于评估目标蛋白(见,例如Hampton et al.,SEROLOGICAL METHODS,ALABORATORY MANUAL,APSPress,St.Paul,MN[1990];and Maddox et al.,J.Exp.Med.,158:1211[1983])。在一些优选的实施方式中,目标蛋白的表达和/或分泌在失活突变体中得到增强。在一些实施方式中,相对于相应的亲代菌株,失活突变体中目标蛋白的产生多至少100%、至少95%、至少90%、至少80%、至少70%、至少60%、至少50%、至少40%、至少30%、至少20%、至少15%、至少10%、至少5%和至少2%。
蛋白回收
[127]一旦需要的蛋白被表达,并且任选地,被分泌,目标蛋白可被回收并进一步纯化。从发酵肉汤回收和纯化目标蛋白可通过在本领域本身已知的方法进行。通常,发酵肉汤包括细胞碎片以及需要的蛋白产品,所述细胞碎片包括细胞、各种悬浮固体和其它的生物材料污染物。
[128]用于此类除去的适当方法包括传统的固液分离技术,例如离心、过滤、透析、微过滤、旋转真空过滤或其它已知的方法,以产生无细胞的滤液。在使用技术例如超滤、蒸发或沉淀进行结晶之前,可优选进一步浓缩发酵肉汤或无细胞滤液。
[129]可以依靠盐来沉淀上清液或滤液的蛋白质成分,然后利用各种层析方法进行纯化,例如离子交换层析、亲和层析或本领域已知的类似技术。当被表达的期望多肽被分泌时,多肽可从生长培养基中纯化。优选地,在多肽纯化之前,从培养基中除去表达宿主细胞(例如通过离心)。
[130]当被表达的重组期望多肽不从宿主细胞中分泌时,优选地,宿主细胞被碎解,多肽被释放到含水“提取物”中,这是纯化的第一阶段。优选地,在细胞碎解之前,从培养基收集表达宿主细胞(例如通过离心)。
[131]本领域技术人员,通过参考下列的实施例,可以更充分地理解实施本发明的方式和方法,这些实施例并不打算以任何方式限制本发明或其涉及的权利要求的范围。
实验
[132]提供下列的实施例以便证明和进一步阐明本发明的某些优选实施方式和方面,它们不被理解为是对其范围的限制。
[133]在下面的实验公开内容中,使用下列缩写:℃(摄氏度);H2O(水);dH2O(去离子水);HCl(盐酸);aa(氨基酸);bp(碱基对);kb(千碱基对);kD(千道尔顿);gm(克);μg(微克);mg(毫克);μl(微升);ml(毫升);mm(毫米);μm(微米);M(摩尔浓度);mM(毫摩尔浓度);μM(微摩尔浓度);MW(分子量);sec(秒);min(s)(分钟);hr(s)(小时);NaCl(氯化钠);PBS(磷酸缓冲盐溶液[150mM NaCl,10mM磷酸钠缓冲液,pH 7.2]);PCR(聚合酶链反应);SDS(十二烷基硫酸钠);w/v(质量比体积);v/v(体积比体积);ATCC(美国典型培养物保藏中心(American Type Culture Collection),Rockville,MD);BD BioSciences(以前的CLONTECH Laboratories,Palo Alto,CA);Invitrogen(Invitrogen Corp.,San Diego,CA);和Sigma(Sigma Chemical Co.,St.Louis,MO)。
[134]下面表1阐明了在实施例中使用以使相应的基因失活的引物(和它们的序列鉴定情况)。
表1
实施例1
曲霉属缺失构建物和菌株的产生
[135]使用在内质网(ER)降解[Der1基因(M.Knop et al,[1996]EMBO J.15:753-763),Der2基因(Hiller et al,[1996]Science 273:1725-1728)和Htm1基因(C.Jakob et al,[2001]EMBO report 21:423-430)]和糖基化[(Mnn9基因(Yip et al.,[1994]Proc.Natl Acad.Sci.91:2723-2727,Mnn10(Dean et al.,[1996]Glycobiol.6:73-81和Ochl(Nakayama et al.[1992]EMBO J 11:2511-2519)]中被涉及的已知酵母基因去检索曲霉属基因组序列数据库以找出同源基因。基于基因的注释,ddp4和ddp5基因是来自曲霉属基因组序列数据库。使用黑曲霉pepA基因(Berka et al.[1990]Gene86:153-162)去检索曲霉属基因组序列数据库以找出同源基因(pepAa、pepAb、pepAc和pepAd)。黑曲霉pepB(Inoue et al.[1991]J.Biol.Chem 266:19484-19489);pepC(Frederick et al.,[1993]Gene 125:57-64);pepD(Jarai et al.,[1994]Gene 139:51-57)和pepF(van den Hombergh et al.,[1994]Gene 151:73-79)可在公共数据库中找到。
a.derA基因的缺失
[136]图1(SEQ ID NO:1)列出了曲霉属derA基因的2400bp基因组DNA序列,图2(SEQ ID NO:2)列出了由图1的derA基因组DNA翻译的246个氨基酸的序列。
[137]为了构建缺失质粒,设计了两对PCR引物。第一对PCR引物扩增基因的启动子区域,它们作为SEQ ID NO:33(P1a)和SEQ ID NO:34(P2a)被表示在表1中。第二对PCR引物扩增基因的终止子区域,它们作为SEQ ID NO:35(T1a)和SEQID NO:36(T2a)被表示在表1中。在PCR中使用下列条件扩增终止子片段DNA序列(T1):在94℃加热PCR管3分钟以使模板DNA变性。然后运行PCR反应:在94℃下1分钟,57℃下1分钟和72℃下1分30秒,重复30遍该循环。最后,在该管于4℃下温育之前,将PCR反应在72℃延伸10分钟。然后,用T4 DNA聚合酶填充T1片段的末端,然后,用限制性酶(BamH1)切割。然后,将该修饰的PCR片段克隆到pMW1(Ulrich Kuck et al.,[1989]Appl.Micorbiol.Biotechnol.31:358-365),从而构建质粒pMW1-T1(derA)。
[138]用两种引物(SEQ ID NO:3和SEQ ID NO:4),使用与T1片段相同的条件,在PCR反应中扩增启动子DNA序列(P1片段)。然后,用T4 DNA聚合酶填充P1片段的末端,用限制性酶Sall切割。然后,将该修饰的PCR片段克隆到pMW1-T1(derA),从而产生pMW1-ΔderA。通过限制性酶消化来分析该质粒,以确定其身份。通过两种限制性酶消化(HapI和NruI)使质粒线性化。
[139]使用消化的DNA片段去转化AP-4黑曲霉菌株的衍生株(Ward et al.[1993]Appli.Microbiol.Biotechnol 39:738-743),其包括在葡糖淀粉酶启动子和终止子控制下表达Tramete versicolor漆酶的表达质粒。
[140]图33A阐明了用来制备如本文详细描述的和提供的实施例中使用的缺失质粒的一般策略。
[141]被使用的转化方案是对Campbell方法(Campbell et at.1989.Curr.Genet.16:53-56)的修改,其中β-D-甜素酶(glucinase)G(InterSpex Products,Inc.San Mateo,CA)被用来产生原生质体,并且将pH调节到5.5。所有的溶液和培养基高压灭菌或通过0.2微米滤器过滤灭菌。使用苯酚/氯仿方法(Zhu et al.1993.Nucleic Acid Res.21:5279-80)从转化体中提取DNA。通过使用两种引物SEQ ID NO:37(Phph)和SEQ ID NO:38(Pt-outa)的PCR来检测缺失菌株,当来自缺失菌株的DNA被用作PCR扩增的模板时,其产生了1064bp的特异的PCR产物,而当DNA来自亲代菌株时,没有条带被观察到(图34)。
b.derB基因的缺失
[142]图3(SEQ ID NO:3)列出了曲霉属derB基因的2673bp基因组DNA序列,图4(SEQ ID NO:4)列出了由图3的derB基因组DNA翻译的166个氨基酸的序列。如上面实施例1a所描述地构建缺失质粒,其中具有下列的差异。
[143]被用来扩增启动子区域的第一对PCR引物,在表1中被指定为SEQ IDNO:39 (P1b)和SEQ ID NO:40(P2b)。被用来扩增终止子区域的第二对引物,在表1中被指定为SEQ ID NO:41(T1b)和SEQ ID NO:42(T2b)。在该实施例中,用T4DNA聚合酶填充T2片段的末端,然后,用限制性酶(BamH1)切割。然后,将修饰的PCR片段克隆到pMW1中,构建质粒pMW1-T2(derB)。使用与P1片段相同的条件,在PCR反应中扩增P2片段。然后,用T4 DNA聚合酶填充P2片段的末端,用限制性酶SalI切割。
[144]将该修饰的PCR片段克隆到pMW1-T2(derB),产生pMW1-ΔderB。按照在上面实施例1a中所描述的,通过限制性酶分析该质粒。通过两种限制性酶消化(HapI和EcoRV),使质粒线性化。
[145]如在上面实施例1A中描述的,使用消化的DNA片段去转化黑曲霉,并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:43(Pt-outb)的PCR,检测缺失菌株,当来自缺失菌株的DNA用作PCR扩增的模板时,其产生了694bp的特异的PCR产物,而当DNA来自亲代菌株时,没有条带被观察到。然而,野生型条带也从所述缺失菌株中被鉴定出来。
c. htmA基因的缺失
[146]图5(SEQ ID NO:5)列出了曲霉属htmA基因的7000bp基因组DNA序列,图6(SEQ ID NO:4)列出了由图5的htmA基因组DNA翻译的1076个氨基酸的序列。如上面实施例1a所描述地构建缺失质粒,其中具有下列的差异。
[147]被用来扩增启动子区域的第一对PCR引物,在表1中被指定为SEQ IDNO:44(P1c)和SEQ ID NO:45(P2c)。被用来扩增终止子区域的第二对引物,在表1中被指定为SEQ ID NO:46(T1c)和SEQ ID NO:47(T2c)。在该实施例中,使用与P1和T1片段相同的条件在PCR反应中扩增P3和T3片段。用T4 DNA聚合酶填充T3片段的末端,然后用限制性酶(BamHI)切割。然后,将修饰的PCR片段克隆到pMW1中,构建质粒pMW1-T3(htmA)。用T4 DNA聚合酶填充P3片段的末端,用限制性酶XhoI切割。将该修饰的PCR片段克隆到pMW1-T3(htmA)中,产生pMW1-ΔhtmA。按照在上面实施例1a中所描述的,通过限制性酶分析该质粒。通过两种限制性酶消化(HapI和EcoRV),使质粒线性化。
[148]如在上面实施例1a中描述的,使用消化的DNA片段去转化黑曲霉GAP3-4(Ward et al.[1993] Appl.Microbiol.Biotechnol.39:738-743),并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:48(Pt-outc)的PCR检测缺失菌株,当来自缺失菌株的DNA用作为PCR扩增的模板时,其产生了1497bp的特异的PCR产物,而当DNA来自亲代菌株时,没有条带被观察到。
d.mnn9基因的缺失
[149]图7(SEQ ID NO:7)列出了曲霉属mnn9基因的4947bp基因组DNA序列,图8(SEQ ID NO:8)列出了由图7的mnn9基因组DNA翻译的369个氨基酸的序列。如上面实施例1a所描述地构建缺失质粒,其中具有下列的差异。
[150]被用来扩增启动子区域的第一对PCR引物,在表1中被指定为SEQ IDNO:49(P1d)和SEQ ID NO:50(P2d)。被用来扩增终止子区域的第二对引物,在表1中被指定为SEQ ID NO:51(T1d)和SEQ ID NO:52(T2d)。
[151]在该实施例中,用T4 DNA聚合酶填充P4片段的末端,然后,用限制性酶(SalI)切割。然后,将修饰的PCR片段克隆到pMW1中,构建质粒pMW1-P4(mnn9)。用T4 DNA聚合酶填充T4片段的末端,然后,用限制性酶(BamHI)切割。然后,将该修饰的PCR片段克隆到pMW1-P(mnn9),产生质粒pMW1-Δmnn9。按照在上面实施例1a中所描述的,通过限制性酶分析该质粒。通过两种限制性酶(HapI和NruI)使质粒线性化。
[152]如在上面实施例1a中描述的,使用消化的DNA片段去转化黑曲霉,并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:53(Pt-outd)的PCR来检测缺失菌株,当来自缺失菌株的DNA用作PCR扩增的模板时,其产生了1330bp的特异的PCR产物(图34A,第7泳道)。当DNA来自亲代菌株时,没有条带被观察到(图34A,第3泳道)。
e.mnn10基因的缺失
[153]图9(SEQ ID NO:9)列出了曲霉属mnn10基因的4524bp基因组DNA序列,图10(SEQ ID NO:10)列出了由图9的mnn10基因组DNA翻译的466个氨基酸的序列。如上面实施例1a所描述地构建缺失质粒,其中具有下列的差异。
[154]被用来扩增启动子区域的第一对PCR引物,在表1中被指定为SEQ IDNO:54 (P1e)和SEQ ID NO:55(P2e)。被用来扩增终止子区域的第二对引物,在表1中被指定为SEQ ID NO:56(T1e)和SEQ ID NO:57(T2e)。
[155]在该实施例中,用T4 DNA聚合酶填充P5片段的末端,然后,用限制性酶(SphI)切割。然后,将修饰的PCR片段克隆到pMW1,构建质粒pMW1-P5(mnn10)。用T4 DNA聚合酶填充T5片段的末端,然后,用限制性酶(BamHI)切割。将该修饰的PCR片段克隆到pMW1-P5(mnn10)中,产生pMW1-Δmnn10。按照在上面实施例1a中所描述的,通过限制性酶分析该质粒。通过两种限制性酶(NruI和EcoRV)使质粒线性化。
[156]如在上面实施例1a中描述的,使用消化的DNA片段去转化黑曲霉,并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:53(Pt-oute)的PCR来检测缺失菌株,当来自缺失菌株的DNA用作PCR扩增的模板时,其产生了1295bp的特异的PCR产物,而当DNA来自亲代菌株时,没有条带被观察到。
f.ochA基因的破坏
[157]图11(SEQ ID NO:11)列出了曲霉属ochA基因的6724bp基因组DNA序列,图12(SEQ ID NO:12)列出了由图11的ochA基因组DNA翻译的380个氨基酸的序列。如上面实施例1a所描述地构建破坏质粒(disruption plasmids),其中具有下列的差异。
[158]被用来扩增启动子区域的PCR引物,在表1中被指定为SEQ ID NO:59(Pf),被用来扩增终止子区域的PCR引物,在表1中被指定为SEQ ID NO:60(Tf)。使用这些引物,扩增包括80bp启动子区和624bp终止子区的ochA基因编码区。在PCR反应中,使用下列条件扩增命名为W6片段的DNA序列:在94℃加热PCR管4分钟以使模板DNA变性,然后运行PCR反应:在94℃下1分钟,55℃下2分钟和72℃下1分30秒,并且重复30遍该循环。在该管于4℃温育之前,所述PCR反应在72℃延伸10分钟。将产生的1787bp PCR片段W6克隆到pBS-T,一种衍生自pBlue-script的TA载体(Tian Wei Biotech.Co.Ltd),以构建质粒pBS-W6(ochA)。将包含潮霉素抗性基因的DNA片段插入到ochA基因的编码区的EcoRV位点,以产生pBS-破坏ochA。通过限制性酶(HapI)消化使质粒线性化。
[159]图33B阐明了用来制造如本文详细描述的和提供的实施例中使用的破坏质粒的一般策略。
[160]如在上面实施例1a中描述的,使用消化的DNA片段去转化黑曲霉,并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:61(Pt-outf)的PCR检测缺失菌株,当来自破坏菌株的DNA用作PCR扩增的模板时,产生了1336bp的特异性的PCR产物(图34B,第7泳道),而当DNA来自亲代菌株时,没有条带被观察到(图34B,第3泳道)。
g.dpp4基因的破坏
[161]图13(SEQ ID NO:13)列出了曲霉属ddp4基因的3989bp基因组DNA序列,图14(SEQ ID NO:14)列出了由图13的ddp4基因组DNA翻译的915个氨基酸的序列。如上面实施例1f所描述地构建破坏质粒,其中具有下列的差异。
[162]被用来扩增启动子区域的PCR引物,在表1中被指定为SEQ ID NO:62(Pg),被用来扩增终止子区域的PCR引物,在表1中被指定为SEQ ID NO:63(Tg)。使用这些引物,扩增ddp4基因的编码区(817-3663)的950-3356bp区域。
[163]将产生的2407bp PCR片段W7克隆到pBS-T中,以构建质粒pBS-W7(ddp4)。将包含潮霉素抗性基因的DNA片段插入到dpp4基因的编码区的EcoRI-EcoRI(2175-2257bp)位点,以产生pBS-破坏dpp4。通过限制性酶消化(NruI)使质粒线性化。
[164]如在上面实施例1a中描述的,使用消化的DNA片段去转化黑曲霉,并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:64(Pt-outg)的PCR检测缺失菌株,当来自破坏菌株的DNA用作PCR扩增的模板时,其产生了1191bp的特异性的PCR产物,而当DNA来自亲代菌株时,没有条带被观察到。
h.dpp5基因的破坏
[165]图15(SEQ ID NO:15)列出了曲霉属ddp5基因的2647bp基因组DNA序列,图16(SEQ ID NO:16)列出了由图15的ddp5基因组DNA翻译的726个氨基酸的序列。如上面实施例1f所描述地构建破坏质粒,其中具有下列的差异。
[166]被用来扩增启动子区域的PCR引物,在表1中被指定为SEQ ID NO:65(Ph),被用来扩增终止子区域的引物,在表1中被指定为SEQ ID NO:66(Th)。
[167]使用这些引物,扩增ddp5基因的编码区(1-2647bp)的195-2490bp区域。将产生的2295bp PCR片段W8克隆到pBS-T中,来构建质粒pBS-W8(ddp5)。将包含潮霉素抗性基因的DNA片段插入到dpp5基因的编码区的Bglll位点以产生pBS-破坏dpp5。通过限制性酶(EcoRV)消化使质粒线性化。
[164]如在上面实施例1a中描述的,使用消化的DNA片段去转化黑曲霉,并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:67(Pt-outh)的PCR检测缺失菌株,当来自破坏菌株的DNA作为模板进行PCR扩增时,其产生了1282bp的特异的PCR产物,而当DNA来自亲代菌株时,没有条带被观察到。
i.pApAa基因的破坏
[169]图17(SEQ ID NO:17)列出了曲霉属pepAa基因的2777bp基因组DNA序列,图18(SEQ ID NO:18)列出了由图17的pepAa基因组DNA翻译的394个氨基酸的序列。
[170]被用来扩增启动子区域的PCR引物,在表1中被指定为SEQ ID NO:68(Pi),被用来扩增终止子区域的引物,在表1中被指定为SEQ ID NO:69(Ti)。
[171]使用这些引物,扩增pepAa基因的编码区、一些启动子区域(355bp)和一些终止子区域(326bp)。被命名为W9片段的该DNA序列在PCR反应中被扩增,如上面实施例1f所描述的,但具有下列的差异。
[172]将产生的1920bp PCR片段W9克隆到pBS-T,以构建质粒pBS-W9(pepAa)。将包含潮霉素抗性基因的DNA片段插入到pepAa基因的编码区的BstB1位点,以产生pBS-破坏pepAa。通过限制性酶(HpaI)消化使质粒线性化。
[173]如在上面实施例1a中描述的,使用消化的DNA片段去转化黑曲霉,并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:70(Pt-outi)的PCR检测缺失菌株,当使用来自破坏菌株的DNA作为模板进行PCR扩增时,其产生了1140bp的特异性的PCR产物,而当DNA来自亲代菌株时,没有条带被观察到。
j. pepAb基因的破坏
[174]图19(SEQ ID NO:19)列出了曲霉属pepAb基因的3854bp基因组DNA序列,图20(SEQ ID NO:20)列出了由图19的pepAb基因组DNA翻译的417个氨基酸的序列。
[175]被用来扩增启动子区域的PCR引物,在表1中被指定为SEQ ID NO:71(Pj),被用来扩增终止子区域的引物,在表1中被指定为SEQ ID NO:72(Tj)。
[176]使用这些引物,扩增pepAb基因的编码区和一些启动子区域(1025bp)。被命名为W10片段的该DNA序列在PCR反应中被扩增,如上面实施例1f所描述的,但具有下列的差异。
[177]将产生的2170bp PCR片段W10克隆到pBS-T中,来构建质粒pBS-W10(pepAb)。将包含潮霉素抗性基因的DNA片段插入到pepAb基因的编码区的Eco47III位点以产生pBS-破坏pepAb。通过限制性酶(HpaI)消化使质粒线性化。
[178]如在上面实施例1a中描述的,使用消化的DNA片段去转化黑曲霉,并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:73(Pt-outj)的PCR检测缺失菌株,当使用来自破坏菌株的DNA作为模板进行PCR扩增时,其产生了1191bp的特异性的PCR产物,而当DNA来自亲代菌株时,没有条带被观察到。
k.pepAd基因的破坏
[179]图21(SEQ ID NO:21)列出了曲霉属pepAd基因的2411bp基因组DNA序列,图22(SEQ ID NO:22)列出了由图21的pepAd基因组DNA翻译的480个氨基酸的序列。
[180]被用来扩增启动子区域的PCR引物,在表1中被指定为SEQ ID NO:74(Pk),被用来扩增终止子区域的引物,在表1中被指定为SEQ ID NO:75(Tk)。
[181]使用这些引物,扩增1443bp pepAd基因的1201bp的编码区和一些启动子区域(858bp)。被命名为W11片段的该DNA序列在PCR反应中被扩增,如上面实施例1f所描述的,但具有下列的差异。
[182]将产生的2059bp(23-2081bp)PCR片段W11克隆到pBS-T中,来构建质粒pBS-W11(pepAd)。将包含潮霉素抗性基因的DNA片段插入到pepAd基因的编码区的AauI位点以产生pBS-破坏pepAd。通过限制性酶(HpaI)消化使质粒线性化。
[183]如在上面实施例1a中描述的,使用消化的DNA片段去转化黑曲霉,并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:76(Pt-outh)的PCR检测缺失菌株,当使用来自破坏菌株的DNA作为模板进行PCR扩增时,其产生了1086bp的特异性的PCR产物,而当DNA来自亲代菌株时,没有条带被观察到。
l.pepF基因的破坏
[184]图23(SEQ ID NO:23)列出了曲霉属pepF基因的3525bp基因组DNA序列,图24(SEQ ID NO:24)列出了由图23的pepF基因组DNA翻译的531个氨基酸的序列。如上面实施例1f所描述地构建破坏质粒,其中具有下列的差异。
[185]被用来扩增启动子区域的PCR引物,在表1中被指定为SEQ ID NO:77(Pl),被用来扩增终止子区域的引物,在表1中被指定为SEQ ID NO:78(Tl)。
[186]使用这些引物,扩增pepF基因的编码区和一些启动子区域(1058bp)。被命名为W12片段的该DNA序列在PCR反应中被扩增,如上面实施例1f所描述。
[187]将产生的2350bp PCR片段W12克隆到pBS-T中,来构建质粒pBS-W12(pepF)。将包含潮霉素抗性基因的DNA片段插入到pepF基因的编码区的NruI位点以产生pBS-破坏pepF。通过限制性酶(HpaI)消化使质粒线性化。
[188]如在上面实施例1a中描述的,使用消化的DNA片段去转化黑曲霉,并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:79(Pt-outl)的PCR检测缺失菌株,当使用来自破坏菌株的DNA作为模板进行PCR扩增时,其产生了1231bp的特异性的PCR产物,而当DNA来自亲代菌株时,没有条带被观察到。
m.pepB基因的缺失
[189]图25(SEQ ID NO:25)列出了曲霉属pepB基因的3000bp基因组DNA序列,图26(SEQ ID NO:26)列出了由图25的pepB基因组DNA翻译的282个氨基酸的序列。如上面实施例1a所描述地构建缺失质粒,其中具有下列的差异。
[190]被用来扩增启动子区域的第一对PCR引物,在表1中被指定为SEQ IDNO:80(P1m)和SEQ ID NO:81(P2m)。被用来扩增终止子区域的第二对引物,在表1中被指定为SEQ ID NO:82(T1m)和SEQ ID NO:83(T2m)。
[191]在该实施例中,用T4 DNA聚合酶填充P13片段的末端,然后,用限制性酶(SalI)切割。然后,将修饰的PCR片段克隆到pMW1以构建质粒pMW1-P13(pepB)。用T4 DNA聚合酶填充T13片段的末端。然后,将该修饰的PCR片段克隆到pMW1-P13(pepB),产生质粒pMW1-ΔpepB。按照在上面实施例1a中所描述的,通过限制性酶分析该质粒。通过限制性酶(HpaI)消化使质粒线性化。
[192]如在上面实施例1a中描述的,使用消化的DNA片段去转化黑曲霉,并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:84(Pt-outm)的PCR检测缺失菌株,当使用来自缺失菌株的DNA作为模板进行PCR扩增时,其产生了1357bp的特异的PCR产物,而当DNA来自亲代菌株时,没有条带被观察到。
n. pepC基因的缺失
[193]图27(SEQ ID NO:27)列出了曲霉属pepC基因的3220bp基因组DNA序列,图28(SEQ ID NO:28)列出了由图27的pepC基因组DNA翻译的533个氨基酸的序列。如上面实施例1a所描述地构建缺失质粒,其中具有下列的差异。
[194]被用来扩增启动子区域的第一对PCR引物,在表1中被指定为SEQ IDNO:85(P1n)和SEQ ID NO:86(P2n)。被用来扩增终止子区域的第二对引物,在表1中被指定为SEQ ID NO:87(T1n)和SEQ ID NO:88(T2n)。
[195]在该实施例中,用T4 DNA聚合酶填充T14片段的末端,然后用限制性酶(BamHI)切割。然后,将修饰的PCR片段克隆到pMW1中,构建质粒pMW1-T14(pepC)。用T4 DNA聚合酶填充P14片段的末端,然后用限制性酶(SalI)切割。然后,将该修饰的PCR片段克隆到pMW1-P14(pepC),产生pMW1-ΔpepC。按照在上面实施例1a中所描述的,通过限制性酶分析该质粒。通过两种限制性酶(HpaI和EcoRV)消化使质粒线性化。
[196]如在上面实施例1a中描述的,使用消化的DNA片段去转化黑曲霉菌株GAP3-4(Ward et al.[1993]Appl.Microbiol.Biotechnol.39:738-743),并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:89(Pt-outn)的PCR检测缺失菌株,当使用来自缺失菌株的DNA作为模板进行PCR扩增时,其产生了1054bp的特异的PCR产物,而当DNA来自亲代菌株时,没有条带被观察到。
o.pepD基因的破坏
[197]图29(SEQ ID NO:29)列出了曲霉属pepD基因的2993bp基因组DNA序列,图30(SEQ ID NO:30)列出了由图29的pepD基因组DNA翻译的416个氨基酸的序列。如上面实施例1f所描述地构建破坏质粒,其中具有下列的差异。
[198]被用来扩增启动子区域的PCR引物,在表1中被指定为SEQ ID NO:90(Po),被用来扩增终止子区域的引物,在表1中被指定为SEQ ID NO:91(To)。
[199]使用这些引物,扩增pepD基因的编码区、一些启动子区域(392bp)和终止子区域(521bp)。在PCR反应中,如上面实施例1f所描述地,扩增被命名为W15片段的该DNA序列。将产生的2317bp PCR片段W15克隆到pBS-T中,构建质粒pBS-W15(pepD)。将包含潮霉素抗性基因的DNA片段插入到pepD基因的编码区的BstBI位点以产生pBS-破坏pepD。通过限制性酶消化(StuI)使质粒线性化。
[200]如在上面实施例1f中描述的,使用消化的DNA片段去转化黑曲霉,并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:92(Pt-outo)的PCR检测破坏菌株,当使用来自破坏菌株的DNA作为模板进行PCR扩增时,其产生了1334bp的特异性的PCR产物,而当DNA来自亲代菌株时,没有条带被观察到。
p. pepAc基因的破坏
[201]图31(SEQ ID NO:31)列出了曲霉属pepAc基因的4531bp基因组DNA序列,图32(SEQ ID NO:32)列出了由图31的pepAc基因组DNA翻译的453个氨基酸的序列。如上面实施例1f所描述地构建破坏质粒,其中具有下列的差异。
[202]被用来扩增启动子区域的PCR引物,在表1中被指定为SEQ ID NO:93(Pp),被用来扩增终止子区域的引物,在表1中被指定为SEQ ID NO:94(Tp)。
[203]使用这些引物,扩增pepAc基因的编码区、一些启动子区域(789bp)和一些终止子区域(509bp)。在PCR反应中,扩增被命名为W16片段的DNA序列。
[204]将产生的2753bp PCR片段W16克隆到pBS-T中,构建质粒pBS-W16(pepAc)。将包含潮霉素抗性基因的DNA片段插入到pepAc基因的编码区的EcoRV位点以产生pBS-破坏pepAc。通过限制性酶(HpaI)消化使质粒线性化。
[205]如在上面实施例1f中描述的,使用消化的DNA片段去转化黑曲霉,并从转化体中提取DNA。通过使用两种引物SEQ ID NO:37和SEQ ID NO:95(Pt-outp)的PCR检测破坏菌株,当使用来自破坏菌株的DNA作为模板进行PCR扩增时,其产生了1520bp的特异性的PCR产物,而当DNA来自亲代菌株时,没有条带被观察到。
实施例2
失活的双缺失突变体
a.dpp4和d5的破坏
[206]为了构建dpp4(amdS)缺失质粒,将包含amdS基因的2.7kb DNA片段插入到质粒pBS-W7(dpp4)的ddp4基因编码区(位置:950到3356)的EcoRV-EcoRV位点(位置:2175到2256),产生质粒pBS-破坏ddp4(amdS)。通过限制性酶消化对质粒进行分析以确认该质粒的身份。通过限制性酶消化(NruI)使质粒线性化。使用消化的DNA片段去转化黑曲霉菌株(Δdpp5-19),该菌株在葡糖淀粉酶启动子和终止子的控制下表达Tramete漆酶并携带破坏的dpp5基因(如在实施例1h中所描述的)。通过PCR使用两对引物来检测双缺失菌株。第一对的两个引物每一个分别与染色体DNA上的amdS基因和W7片段3’下游退火,当来自dpp4缺失菌株的DNA作为模板进行PCR扩增时,其产生了1224bp的特异性的PCR产物,而当DNA来自受体菌株时,没有条带被观察到。
引物:
Pout(dpp4)5’┄TCTGGATAGAAATGCAAATCGTAG┄3’SEQ ID NO:64
PamdS 5’┄TTTCCAGTCTAGACACGTATAACGGC┄3’SEQ ID NO:96
第二对引物与最初用于检测单dpp5缺失菌株的引物相同(SEQ ID NOs:37和67)。双缺失菌株和其对照菌株被用于漆酶生产和全蛋白质生产。
b.mnn9和ochA的破坏
[207]为了构建mnn9(amdS)缺失质粒,将包含amdS基因的2.7kb DNA片段插入到pMW1-Δmnn9(amdS片段直接取代hph片段),产生质粒pMW1-破坏mnn9(amdS)。通过限制性酶消化对质粒进行分析以确认该质粒的身份。通过限制性酶消化(AsuII-NruI)使质粒线性化。使用消化的DNA片段去转化黑曲霉菌株(ΔochA-23),该菌株在葡糖淀粉酶启动子和终止子的控制下表达Tramete漆酶并携带破坏的ochA基因,如在实施例1f中所描述。通过PCR使用两对引物检测双缺失菌株。第一对的两个引物每一个分别与染色体DNA上的amdS基因和3’下游T4片段退火,当来自mnn9缺失菌株的DNA用作模板进行PCR扩增时,其产生了1380bp的特异性的PCR产物,而当DNA来自受体菌株(recipient strain)时,没有条带被观察到。
引物:
Pout(mnn9)5’┄GATATCAACCTCAGCGTCAAATTGG┄3’SEQ ID NO:53
PamdS 5’┄TTTCC AGTCT AGACA CGTAT AACGGC┄3’SEQ ID NO:97
第二对引物与最初用于检测单ochA缺失菌株的引物相同(SEQ ID NOs:37和61)。然后,双缺失菌株和其对照菌株被用于漆酶生产和全蛋白质生产。
实施例3
失活突变体用于生产异源蛋白质
[208]为了阐明使用根据本发明的失活突变体的优势,将亲代(野生型)中的漆酶生产量与在上述实施例1和2中描述的失活突变体中的漆酶生产量进行了比较。
[209]使用250ml挡板瓶,以摇瓶培养物进行分析,所述挡板瓶中包含50ml本领域已知的适合漆酶产生的生长培养基(Promosoy)。菌株在摇瓶中生长120小时。按照标准的分析方法,测量漆酶活性,所述分析方法是基于在醋酸钠缓冲液(pH 4.6)中氧对ABTS、2,2’-azino-二(3-乙基苯并噻唑啉-6-磺酸酯)的氧化。用含有ABTS的醋酸钠缓冲液(SIGMA)在37℃温育培养物肉汤30分钟,并在OD420nm光密度下测量产生的颜色。相对于相应的亲代菌株,测量失活菌株产生的漆酶水平。结果在表2A和2B中示出。使用描述于Lowry,et al.,[1951]J.Biol.Chem.193:265-275中的Folin苯酚方法测量细胞外总蛋白,结果在表2A中示出。
表2A-单失活
表2B-多种失活
机译: 基因失活的突变体,蛋白质产生改变
机译: 基因失活的突变体,蛋白质产生改变
机译: 基因失活的突变体,蛋白质产生改变