首页> 中国专利> 酮醇酸还原异构酶及其使用方法

酮醇酸还原异构酶及其使用方法

摘要

本文提供了具有酮醇酸还原异构酶活性的多肽以及包含此类多肽的微生物宿主细胞。本文所提供的多肽可用于生物合成途径中,包括但不限于异丁醇生物合成途径。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-06-19

    授权

    授权

  • 2015-06-10

    实质审查的生效 IPC(主分类):C12N9/04 申请日:20130510

    实质审查的生效

  • 2015-05-13

    公开

    公开

说明书

政府许可权利

本发明是在根据美国能源部批准的协议DE-AR0000006的政府支持下 作出的。政府拥有本发明中的某些权利。

技术领域

本发明涉及包含酮醇酸还原异构酶活性的多肽、编码此类多肽的多核 苷酸、包含此类多核苷酸和多肽的宿主细胞、和使用此类组合物的方法。

相关专利申请的交叉引用

本专利申请涉及并要求提交于2012年5月11日的美国临时专利申请 号61/645,832和提交于2013年3月15日的美国临时专利申请号61/787,480 的优先权,上述文献均全文以引用方式并入本文。

引用经由Efs-Web以电子方式递交的序列表

以电子方式同此提交的序列表的内容(文件名: 20130510_CL5631WOPCT_SEQLIST.txt;大小:1,319,613字节;创建日 期:2013年5月10日)全文以引用方式并入本文。

背景技术

酮醇酸还原异构酶(KARI)参与缬氨酸和异亮氨酸的生物性生产。 KARI酶还已被显示对于利用工程化的微生物生产异丁醇的途径是有用的 (美国专利7,851,188和7,993,889)。此类微生物能够被用于从植物来源 的底物生产异丁醇。

虽然用于异丁醇的化学合成的方法是已知的(羰基合成、一氧化碳的 催化氢化(Ullmann′s Encyclopedia of Industrial Chemistry,第6版,2003, Wiley-VCH Verlag GmbH and Co.,Weinheim,Germany,第5卷,第716- 719页)和甲醇与正丙醇的格尔伯特缩合(Carlini等人,J.Molec.Catal.A. Chem.220:215-220,2004),但这些工艺利用来源于石油化学品的起始材 料,通常是昂贵的。此外,异丁醇的化学合成不具有环境优势(诸如使温 室气体排放最小化)的潜能。用植物来源的原材料生产异丁醇将代表本领 域的进步。

能够利用还原型烟酰胺腺嘌呤二核苷酸(NADH)的KARI酶能够在 通常使用的微生物细胞中利用通过现有的糖酵解途径和其他代谢途径产生 的NADH,并可导致改善的异丁醇生产。美国专利8,129,162和美国专利申 请公开2010/0197519A1描述了具有利用辅因子(NADH)的不同能力的 KARI酶的生成。然而,本领域仍然存在对具有适用于诸如异丁醇生物合成 途径的生产途径的KARI活性的替代性多肽的需求。

发明内容

本文提供了具有酮醇酸还原异构酶活性的多肽,其中在对应于SEQ ID  NO:2的52的位点处的氨基酸是D或E,并且其中所述多肽在下列区域中 的一个中包含至少一种取代:在分子间二聚体界面区域、结构域间界面区 域、N-结构域表面螺旋区域、疏水性桥区域、或C-末端尾区域中的至少一 个处,其中所述至少一种取代是在对应于SEQ ID NO:2的I13、V53、 A68、A69、A71、G72、V76、S86、L88、K99、Y113、N114、V117、 I127、I152、S157、V171、M238、Y239、E264、N267、A268、Q272、 R275、A277、R280、Y286、I291、S292、A295、M301、R306、S322、 A329、K335或A336的位点处。在实施例中,所述多肽在位点L33、P47、 F50、F61、I80或V156中的至少一个处还包含取代。在实施例中,所述多 肽包含与SEQ ID NO:2至少约80%、至少约85%、至少约90%、至少约 95%、至少约99%的同一性。

本文提供了多肽变体,所述多肽变体包含与SEQ ID NO:1或SEQ ID  NO:2至少约80%的同一性、至少约85%、至少约90%、至少约95%、或 至少约99%的同一性和在下列位点中的至少一个处的取代:Y286、I152、 S322、S292、I291、I13、P47、F50、V53、A268、V76、A336、L88、 A71、G72、M301、Y239、Y113、N114、A329、A69、A295、E264、 R280、S157、M238、Q272、K335、K99、R275或R306。在实施例中,所 述多肽具有酮醇酸还原异构酶活性。

因此,本文提供了包含下列的多肽:(a)SEQ ID NO:3、4、5、6、7、 8、9、10、11、12、13、14、15、16、17、18、20、22、23、24、25、 26、27、28、29、33、34、35、36、37、38、39、40、41、42、43、44、 45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、 61、62、63、64、65、66、67、68、69、70、71、72、74、75、76、77、 78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、 94、95、96、97、99、100、101、102、103、104、105、106、107、108、 109、110、111、112、113、114、116、118、119、120、121、123、124、 128、129、131、132、133、134、136、137、138、139、140、141、142、 143、144、146、147、148、149、150、151、152、153、154、155、157、 159、160、161、346、350、351、352、353、354、355、356、357、358、 359、360、361、362、363、364、365、366、367、368、369、370、371、 372、373、374、375、376、377、378、379、380、381或382的氨基酸序 列;(b)与SEQ ID NO:3、4、5、6、7、8、9、10、11、12、13、14、15、 16、17、18、20、22、23、24、25、26、27、28、29、33、34、35、36、 37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、 53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、 69、70、71、72、74、75、76、77、78、79、80、81、82、83、84、85、 86、87、88、89、90、91、92、93、94、95、96、97、99、100、101、 102、103、104、105、106、107、108、109、110、111、112、113、114、 116、118、119、120、121、123、124、128、129、131、132、133、134、 136、137、138、139、140、141、142、143、144、146、147、148、149、 150、151、152、153、154、155、157、159、160、161、346、350、351、 352、353、354、355、356、357、358、359、360、361、362、363、364、 365、366、367、368、369、370、371、372、373、374、375、376、377、 378、379、380、381或382至少约95%或至少约99%的同一性;或(c)(a)或 (b)的活性片段。在一些实施例中,微生物宿主细胞包含此类多肽。在一些 实施例中,此类微生物宿主细胞产生异丁醇。

本文提供的多肽包括具有酮醇酸还原异构酶活性且包含与SEQ ID NO: 2至少约85%、至少约95%、或至少约99%的同一性以及下列取代中的至 少一种的多肽:Y286F、A336R、I152V、S322A、S292A、I291V、或它们 的组合;或此类多肽的活性片段。在实施例中,所述多肽还包含下列取代 中的至少一种:I13L、P47Y、F50A、V53A、A268E、V76I、A336G、 L88V、或它们的组合。在实施例中,多肽包含与SEQ ID NO:3、4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、20、22、23、24、 25、26、27、28或29 95%或至少约99%的同一性。

本文提供的多肽包括具有酮醇酸还原异构酶活性且包含与SEQ ID NO: 2至少约85%、至少约95%、或至少约99%的同一性以及下列取代中的至 少一种的多肽:Y286F、A71K、G72W、A336R、I152V、A268T、 A329E、或它们的组合;或此类多肽的活性片段。在实施例中,多肽包含 与SEQ ID NO:33、34、35、36、37、38、39、40、41、42、43、44、45、 46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、 62、63或64至少约95%或至少约99%的同一性。

本文提供的多肽包括具有酮醇酸还原异构酶活性且包含与SEQ ID NO: 41至少约85%、至少约95%、或至少约99%的同一性以及下列取代中的至 少一种的多肽:M301I、Y239H、Y113F、S322A、A71K、N114G、 A329R、A69T、N114S、G72W、A295V、E264K、R280D、A329E、 S157T、M238I、Q272T、K335M、R280H、或它们的组合;或此类多肽的 活性片段。在实施例中,多肽包含与SEQ ID NO:99、100、101、102、 103、104、105、106、107、108、109、110、111、112、113、114、116、 118、119、120、121、123、124、128、129、131、132、133、134、136、 137、138、139、140、141、142、143、144、146、147、148、149、150、 151、152、153、154、155、157、159、160或161至少约95%或至少约 99%的同一性。在实施例中,具有酮醇酸还原异构酶活性的多肽包含SEQ  ID NO:365、366、157、159、154、377、367、123、42或41的氨基酸序 列。

本文提供的多肽包括具有酮醇酸还原异构酶活性且包含与SEQ ID NO: 346至少约85%、至少约95%、或至少约99%的同一性以及下列取代中的 至少一种的多肽:A68E、I152V、Y286F、和A336R。

与SEQ ID NO:2或野生型酮醇酸还原异构酶相比,本文提供的多肽还 可提高生物合成途径的生产能力。生产能力的提高可包括所述途径的步骤 的性能(诸如由酮醇酸还原异构酶催化的反应的速率)的提高和/或对抑制 的敏感性或底物竞争的降低。与诸如SEQ ID NO:2的不具有本文所述的修 饰的多肽相比,生产能力的提高还可表现为产物收率的提高,例如提高的 异丁醇生产。生产能力的提高可以为大约至少约1%、2%、3%、4%、 5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%,40%、 45%、50%至约100%。

在实施例中,在本文提供的多肽中,在对应于SEQ ID NO:2的位点52 的位点处的氨基酸是D或E。在实施例中,在对应于SEQ ID NO:2的位点 24的位点处的氨基酸是F;在对应于SEQ ID NO:2的位点33的位点处的 氨基酸是L;在对应于SEQ ID NO:2的位点47的位点处的氨基酸是P;在 对应于SEQ ID NO:2的位点50的位点处的氨基酸是F;在对应于SEQ ID  NO:2的位点61的位点处的氨基酸是F;在对应于SEQ ID NO:2的位点80 的位点处的氨基酸是I;并且在对应于SEQ ID NO:2的位点156的位点处 的氨基酸是V。

本文还提供了编码此类多肽的多核苷酸。本文还提供了包含此类多核 苷酸的重组微生物宿主细胞。本文还提供了包含此类多肽的重组微生物宿 主细胞。

本文提供了包含394、396、398、399、400、401、402、403、404、 405、406、407、408、410、412、413、414、415、416、417、418、419、 422、423、424、425、426、427、428、429、430、431、432、433、434、 435、436、437、438、439、440、441、442、443、444、445、446、447、 448、449、450、451、452、453、454、455、456、457、458、459、460、 461、462、463、464、465、466、467、468、469、470、471、472、473、 474、475、476、477、478、479、480、481、482、483、484、485、486、 487、488、489、490、491、492、493、494、495、496、497、498、499、 500、501、502、503、504、506、508、510、511、513、514、518、519、 521、522、523、524、525、526、527、528、529、530、531、532、533、 534、536、537、538、539、540、541、542、543、544、545、547、549、 550、551、552、553、554、555、556、557、558、559、560、561、562、 563、564、565、566、567、568、569、570、571、572、573、574、575、 576、577、579、580、581、582或583的序列的多核苷酸。在实施例中, 本文提供的多核苷酸包含SEQ ID NO:393、394、395、396、397、398、 399、400、401、402、403、404、405、406、407、408、409、410、411、 412、413、414、415、416、417、418、419、420、421、422、423、424、 425、426、427、428、429、430、431、432、433、434、435、436、437、 438、439、440、441、442、443、444、445、446、447、448、449、450、 451、452、453、454、455、456、457、458、459、460、461、462、463、 464、465、466、467、468、469、470、471、472、473、474、475、476、 477、478、479、480、481、482、483、484、485、486、487、488、489、 490、491、492、493、494、495、496、497、498、499、500、501、502、 503、504、505、506、507、508、509、510、511、512、513、514、515、 516、517、518、519、520、521、522、523、524、525、526、527、528、 529、530、531、532、533、534、535、536、537、538、539、540、541、 542、543、544、545、546、547、548、549、550、551、552、553、554、 555、556、557、558、559、560、561、562、563、564、565、566、567、 568、569、570、571、572、573、574、575、576、577、578、579、580、 581、582、583或584的序列。在实施例中,本文提供的多核苷酸包含SEQ  ID NO:567、568、549、544、579、569、513、432或431的序列。本文还 提供了包含本文提供的多核苷酸的重组宿主细胞。

在一些实施例中,微生物宿主细胞还包含降低的或消除的乙酰乳酸还 原酶活性。在实施例中,宿主细胞还包含fra2中的至少一个缺失、突变、 和/或取代。在实施例中,宿主细胞还包含下列底物至产物的转化:丙酮酸 至乙酰乳酸的转化;乙酰乳酸至2,3-二羟基异戊酸的转化;2,3-二羟基异戊 酸至α-酮异戊酸;α-酮异戊酸至异丁醛;以及异丁醛至异丁醇。在实施例 中,具有酮醇酸还原异构酶活性的所述多肽选自SEQ ID No:11、41、和 42。在实施例中,具有酮醇酸还原异构酶活性的所述多肽包含SEQ ID NO: 365、366、157、159、154、377、367、123、42或41的氨基酸序列。在实 施例中,所述宿主细胞是酵母宿主细胞。在实施例中,所述宿主细胞是酿 酒酵母(Saccharomyces cerevisiae)。

本文还提供了用于将乙酰乳酸转化为二羟基异戊酸的方法,所述方法 包括提供所述多肽。本文还提供了用于将乙酰乳酸转化为二羟基异戊酸的 方法,所述方法包括提供包含所提供的多肽的微生物宿主细胞;以及使所 述多肽与乙酰乳酸接触,其中产生二羟基异戊酸。本文还提供了生产选自 异丁醇、泛酸盐、缬氨酸、亮氨酸、异亮氨酸、3,3-苹果酸二甲酯、和2- 甲基-1-丁醇的产物的方法,所述方法包括:提供本文提供的重组宿主细 胞,其中所述重组宿主细胞包含产物生物合成途径;以及使所述微生物宿 主细胞在产物由此被生产的条件下与碳底物接触。在实施例中,所述接触 的至少一部分是在厌氧条件下发生。

附图说明

图1-示出了四种不同的异丁醇生物合成途径。标记为“a”、“b”、 “c”、“d”、“e”、“f”、“g”、“h”、“i”、“j”和“k”的步骤 表示下文所述的底物至产物的转化。

图2显示了来自荧光假单胞菌(Pseudomonas fluorescens) (“PF5”;SEQ ID NO:1)的KARI及其变体(“JEA1”;SEQ ID  NO:2;描述于美国专利申请公布2010/0197519中,该文献以引用方式并 入本文)的氨基酸序列的比对。

图3是pLH556(pHR81-PIlv5-Pf5.KARI)(SEQ ID NO:162)的质粒 图谱。质粒pLH556包含针对酵母的2微米复制起点、针对大肠杆菌(E. coli)的pBR322起点、针对在酵母中的维持的Leu2和Ura3营养缺陷型标 记基因、针对在大肠杆菌(E.coli)中的维持的氨苄青霉素抗性标记基因、 和克隆在PmeI和SfiI限制性位点之间的KARI开放阅读框。KARI启动子 是ilv5p,KARI终止子是ilv5t。

图4是pBP915(SEQ ID NO:163)的质粒图谱。质粒pBP915包含针 对酵母的2微米复制起点、针对大肠杆菌(E.coli)的pMB1起点、和针对 噬菌体F1的F1起点。其包含针对在酵母中的维持的His3营养缺陷型标记 基因、和针对在大肠杆菌(E.coli)中的维持的氨苄青霉素抗性标记基因。 来自变异链球菌(S.mutans)菌株UA159的IlvD(DHAD)基因被克隆在 AflII和NotI限制性位点之间。ilvD启动子是FBAp,ilvD终止子是FBAt。 还存在马醇脱氢酶基因,其具有GPMp启动子和ADHt终止子。

图5是pBP2090(pHR81-PIlv5p.K9D3.TEF1(M4)p.ilvD)载体(SEQ  ID NO:164)的质粒图谱。质粒pBP2090包含针对酵母的2微米复制起 点、针对大肠杆菌(E.coli)的pBR322起点、针对在酵母中的维持的Leu2 和Ura3营养缺陷型标记基因、针对在大肠杆菌(E.coli)中的维持的氨苄 青霉素抗性标记基因、和克隆在PmeI和SfiI限制性位点之间的KARI开放 阅读框。KARI启动子是ilv5p,KARI终止子是ilv5t。该质粒还包含克隆在 AflII和NotI限制性位点之间的来自变异链球菌(S.mutans)菌株UA159的 IlvD(DHAD)基因。ilvD启动子是经修饰的TEF1启动子 (TEF1(M4)p),ilvD终止子是FBAt。

图6示出了异丁醇生物合成途径。步骤“a”表示丙酮酸至乙酰乳酸的 转化。步骤“b”表示乙酰乳酸至DHIV的转化。步骤“c”表示二羟基异 戊酸(DHIV)至酮异戊酸(KIV)的转化。步骤“d”表示KIV至异丁醛 的转化。步骤“e”表示异丁醛至异丁醇的转化。步骤“f”表示乙酰乳酸至 2,3-二羟基-2-甲基丁酸(DHMB)的转化。

图7是在所指示的实例中与作为SEQ ID NO:163给出的质粒联合使用 的载体的示例(SEQ ID NO:347;包含针对KARI变体65139的编码序列) 的质粒图谱。该质粒与图3中所示的质粒相似,但Ura3基因被一个沉默突 变修饰,以消除其中的BsmBI位点。

图8是在所指示的实例中使用的载体的示例(SEQ ID NO:349;包含 针对KARI变体76437“R9E8”的编码序列)的质粒图谱。该质粒与图5 中所示的质粒相似,但Ura3基因被一个沉默突变修饰,以消除其中的 BsmBI位点。

图9示出了Pf5 KARI二聚体的同源性模型。在单体中的一个中示出 (箭头)了位点I13、I152和S157。

图10示出了Pf5 KARI的同源性模型,仅单体A。显示了N-结构域 (残基1-181)和C-结构域(残基182-327)。在图10A中,显示了分子间 二聚体界面中的位点M238、Y239、E264、N267、A268、Q272、A277、 R280、Y286、I291、S292、M301、S322的位置。在图10B中,显示了结 构域间界面区域中的位点Y113、N114、N114、I291、S292、和A295的位 置。

图11A示出了模型化的核苷酸结合区域的部分,P47、P50、V53、 T80、和L88的位点。图11B示出了N-结构域的表面上两个短转折(位点 64-73)的α螺旋上的位点68、69、71和72。该模型中的残基76通过疏水 相互作用与残基70的侧链相互作用。该短螺旋的N-末端部分被包装为与模 型化的核苷酸结合区域的残基47部分的主链相对。

图12示出了N-结构域疏水性桥区域中的位点C33、L61、I127、 I152、和V171。

具体实施方式

除非另有定义,否则本文所用的所有科技术语的含义与本发明所属领 域的普通技术人员通常理解的一样。如发生矛盾,以本专利申请(包括其 定义)为准。此外,除非上下文另有所需,单数术语将包括复数并且复数 术语将包括单数。本文提及的所有公布、专利和其他参考文献出于各种目 的全文以引用方式并入本文,如同每一单独的公布或专利申请均特定且个 别地以引用方式并入一样,除非仅专利或专利申请的特定部分被提及以引 用方式并入本文。

下文公开了合适的方法和材料,虽然在本发明的实施或试验过程中也 可以使用与本文所公开的那些类似或等同的方法和材料。材料、方法和实 例仅是例示性的并且不旨在进行限制。根据发明具体实施方式和权利要 求,本发明的其他特点和优点将显而易见。

为了进一步明确本发明,提供下列术语、缩写和定义。

应当理解,“来源于”在关于本文所公开的多肽时涵盖了基于所指示 的生物中存在的KARI的氨基酸序列合成的序列以及直接从所述生物的遗 传物质克隆的那些。

如本文所用,术语“包含”、“包括”、“具有”、“含有”或它们 的任何其他变型将被理解为是指包括指定的整数或整数组但不排除任何其 它整数或整数组并且旨在是非排他性的或端值开放性的。例如,包含一系 列元素的组合物、混合物、工艺、方法、制品或设备不必仅限于那些元 素,而可以包括其它未明确列出的元素,或此类组合物、混合物、工艺、 方法、制品或设备固有的元素。此外,除非另外相反指明,否则“或”是 指包含性的或,而不是指排它性的或。例如,以下中任一者均满足条件A 或B:A是真的(或存在的)且B是假的(或不存在的)、A是假的(或 不存在的)且B是真的(或存在的)、以及A和B都是真的(或存在 的)。

如本文所用,如整个说明书和权利要求中所使用的,术语“由...组 成”或诸如“由...组成的”的变型指示包括任何列举的整数或整数组,但 是没有另外的整数或整数组能够被加入到指定的方法、结构、或组合物 中。

如本文所用,如整个说明书和权利要求中所使用的,术语“基本上 由...组成”或诸如“基本上由...组成的”变型指示包括任何列举的整数或 整数组,并且任选地包括未显著改变指定的方法、结构或组合物的基本或 新颖特性的任何列举的整数或整数组。参见M.P.E.P.§2111.03。

同样,涉及元素或组分实例(即次数)的数目在本发明元素或组分前 的不定冠词“一个”或“一种”旨在是非限制性的。因此,应将“一个” 或“一种”理解为包括一个或至少一个,并且元素或组分的词语单数形式 也包括复数指代,除非有数字明显表示单数。

如本文所用,术语“发明”或“本发明”是非限制性术语,并且不旨 在指本发明的任何单独实施例,而是涵盖如(所提出的或以后所修订的和 补充的)权利要求中或本说明书中所述的所有可能的实施例。

如本文所用,修饰本发明的成分或反应物的量使用的术语“约”是指 可以通过例如以下方式而发生的用数字表示的量的变化:在真实世界中用 于产生浓缩物或溶液的一般测量和液体处理操作;通过这些操作中非故意 的误差;用于制备组合物或执行方法的成分的制造、来源或纯度中的差 异;等。术语“约”还包括由于产生自特定起始混合物的组合物的不同平 衡条件而不同的量。无论是否通过术语”约”来修饰,权利要求包括量的 等同量。在一个实施例中,术语“约”指在报告数值的10%范围内,或在 报告数值的5%范围内。

术语“异丁醇生物合成途径”是指产生异丁醇的酶途径。例如,某些 异丁醇生物合成途径公开于美国专利7,851,188中,该文献全文以引用方式 并入本文。某些异丁醇生物合成途径在图1中示出并如本文所述。有时 “异丁醇生物合成途径”与“异丁醇生产途径”同义地使用。

本文所用术语“丁醇”是指2-丁醇、1-丁醇、异丁醇或它们的混合 物。异丁醇也被称为2-甲基-1-丙醇。

包含“工程化的醇生产途径”(诸如工程化的丁醇或异丁醇生产途 径)的重组宿主细胞是指包含经修饰的途径的宿主细胞,该途径以与宿主 细胞中通常存在的途径不同的方式生产醇。此类差异包括生产通常宿主细 胞不生产的醇,或者提高产量或更有效地生产。

如本文所用,术语“异源的生物合成途径”是指用于生产产物的酶途 径,在其中酶中的至少一种不是对于包含该生物合成途径的宿主细胞而言 内源性的。

如本文所用,术语“提取剂”是指能够用于从发酵液体培养基中提取 丁醇的一种或多种溶剂。

如本文所用,术语“有效滴度”是指每升发酵培养基通过发酵产生的 特定醇(例如丁醇)的总量。丁醇的总量包括:(i)发酵培养基中的丁醇 量;(ii)由有机萃取剂回收的丁醇量;以及(iii)如果利用汽提,由气相回 收的丁醇量。

如本文所用,术语“有效速率”是指每升发酵培养基通过发酵每小时 产生的丁醇的总量。

如本文所用,术语“有效收率”是指生物催化剂消耗每单位可发酵碳 底物产生的丁醇的量。

如本文所用,术语“分离”与“回收”同义,是指从初始混合物中去 除化合物以获得纯度或浓度比初始混合物中的化合物纯度或浓度更高的化 合物。

如本文所用,术语“水相”是指通过使发酵液体培养基接触与水不混 溶的有机提取剂而获得的两相混合物中的水相。在本文所述包括发酵提取 的方法的一个实施例中,术语“发酵液体培养基”具体地指在双相发酵提 取中的水相。

如本文所用,术语“有机相”是指通过使发酵液体培养基接触与水不 混溶的有机提取剂而获得的双相混合物中的非水相。

如本文所用,术语“PDC-”、“PDC敲除”、或“PDC-KO”是指具 有灭活或降低编码丙酮酸脱羧酶(PDC)的基因的表达的基因修饰,从而 使该细胞基本上或完全缺乏丙酮酸脱羧酶酶活性的细胞。如果所述细胞具 有多于一种的表达的(活性的)PDC基因,则活性PDC基因中的每个能够 被灭活或具有最小的表达从而产生PDC-细胞。

术语“多核苷酸”旨在包括单数的核酸以及复数的核酸,并且是指核 酸分子或构建体,例如,信使RNA(mRNA)或质粒DNA(pDNA)。多 核苷酸能够包含全长cDNA序列的核苷酸序列,或其片段,包括非翻译的 5′和3′端序列和编码序列。所述多核苷酸能够由任何多核糖核酸或多脱氧核 糖核酸构成,其可为非改性的RNA或DNA,或改性的RNA或DNA。例 如,多核苷酸能够由如下构成:单链和双链DNA(DNA即为单链和双链区 域的混合物);单链和双链RNA(RNA即为单链和双链区域的混合物); 包含DNA和RNA的杂合分子,其可为单链或,更典型地双链或单链和双 链区域的混合物。“多核苷酸”包含了化学地、酶促地、或代谢地改性的 形式。

多核苷酸序列可意为“分离的”,其中它已从其天然的环境中移除。 例如,包含在载体中的编码具有二羟酸脱水酶活性多肽或多肽片段的异源 性多核苷酸,出于本发明的目的可被认为是分离的。分离的多核苷酸的另 一个例子包括维持在异源宿主细胞中的重组多核苷酸或溶液中的经纯化的 (部分地或基本上)多核苷酸。根据本发明分离的多核苷酸或核酸还包括 此类合成生产的分子。DNA聚合物形式的分离的多核苷酸片段可以由 cDNA、基因组DNA或合成DNA中的一个或多个片段构成。

术语“NAD(P)H消耗测定法”是指用于确定KARI酶的特异性活性的 酶测定法,包括从酶反应测量KARI辅因子,NAD(P)H的消失。此类测定 描述于Aulabaugh和Schloss,Biochemistry 29:2824-2830,1990中,该文献 全文以引用方式并入本文。

术语“NAD(P)H”是指NADH或NADPH。

“KARI”是酮醇酸还原异构酶的缩写。

术语“紧邻”当指KARI酶的各种氨基酸残基相对于NADPH的腺苷 2′-磷酸酯的位置时,是指所述酶的结构的三维模型中位于与该酶结合的 NADPH的腺苷2′-磷酸酯的磷原子约内的氨基酸。

术语“酮醇酸还原异构酶”(缩写为“KARI”)和“乙酰羟酸异构还 原酶”将可互换使用,并指能够催化(S)-乙酰乳酸至2,3-二羟基异戊酸的反 应、被分类为EC编号EC 1.1.1.86(Enzyme Nomenclature 1992,Academic  Press,San Diego)的酶。KARI存在于多种生物体中,跨物种的氨基酸序列 比较已经揭示该酶具有两种类型:短型(I类)存在于真菌和大多数细菌 中,长型(II类)一般存在于植物中。I类KARI通常具有介于330-340个 之间的氨基酸残基。长型KARI酶具有约490个氨基酸残基。然而,一些 细菌诸如大肠杆菌(Escherichia coli)具有长型酶,其中所述氨基酸序列略 为不同于存在于植物中的氨基酸序列。KARI由ilvC基因编码,是基本培 养基中大肠杆菌(E.coli)和其他细菌生长的必需酶。II类KARI一般由 225个残基的N-末端结构域和287个残基的C-末端结构域组成。包含辅因 子结合位点的N-末端结构域具有αβ结构,类似于存在于其他吡啶核苷酸依 赖的氧化还原酶中的结构域。C-末端结构域基本上完全由α螺旋组成。

KARI描述于例如美国专利7,910,342和8,129,162以及美国专利申请公 布2010/0197519中,全部这些文献均全文以引用方式并入本文。

酮醇酸还原异构酶(KARI)在用于利用工程化的微生物生产异丁醇的 途径中是有用的(美国专利7,851,188和7,993,889,这些文献全文以引用方 式并入本文)。

能够利用NADH的KARI能够在通常使用的微生物细胞中利用通过现 有的糖酵解途径和其他代谢途径产生的NADH,并可导致改善的异丁醇生 产。Rane等人(Arch.Biochem.Biophys.,338:83-89,1997)讨论了从大肠杆 菌(E.coli.)分离的酮醇酸还原异构酶的辅因子转换。美国专利申请公布 2009/0163376和2010/0197519(上述文献中的每一个均全文以引用方式并 入本文)描述了能够使用NADH的KARI酶的变体。美国专利申请公布 2010/0143997(该文献全文以引用方式并入本文)描述了具有改善的针对 NADH的KM值的大肠杆菌(E.coli.)变体。

术语“酮醇酸还原异构酶活性”和“KARI活性”是指催化(S)-乙酰乳 酸至2,3-二羟基异戊酸的底物至产物的转化的能力。

术语“乙酰乳酸合酶”是指催化丙酮酸至乙酰乳酸和CO2的转化的 酶。乙酰乳酸具有两种立体异构体((R)和(S));该酶偏好由生物系 统产生的(S)-异构体。已知的某些乙酰乳酸合酶为EC编号2.2.1.6 (Enzyme Nomenclature 1992,Academic Press,San Diego)。这些酶可得 自多种来源,包括但不限于枯草芽孢杆菌(Bacillus subtilis)(SEQ ID NO: 165)、肺炎克雷伯氏菌(Klebsiella pneumoniae)(SEQ ID NO:166)和乳 酸乳球菌(Lactococcus lactis)。

术语“乙酰羟酸脱水酶”是指催化2,3-二羟基异戊酸至α-酮异戊酸的 转化的酶。已知的某些乙酰羟酸脱水酶为EC编号4.2.1.9。这些酶可得自多 种微生物,包括但不限于大肠杆菌(E.coli)、啤酒酵母(S.cerevisiae)、 海沼甲烷球菌(M.maripaludis)、枯草芽孢杆菌(B.subtilis)、乳酸乳球 菌(Lactococcus lactis)(SEQ ID NO:167)、和变异链球菌 (Streptococcus mutans)(SEQ ID NO:168)。

术语“支链α-酮酸脱羧酶”指催化α-酮异戊酸至异丁醛和CO2的转化 的酶。已知的某些支链α-酮酸脱羧酶为EC编号4.1.1.72,并且可得自多种 来源,包括但不限于乳酸乳球菌(Lactococcus lactis)(SEQ ID NO: 169)、鼠伤寒沙门氏菌(Salmonella typhimurium)、丙酮丁醇梭菌 (Clostridium acetobutylicum)、溶酪大球菌(Macrococcus caseolyticus) (SEQ ID NO:171)和格氏李斯特菌(Listeria grayi)(SEQ ID NO:170)

术语“支链醇脱氢酶”是指催化异丁醛转化为异丁醇的酶。已知的某 些支链醇脱氢酶为EC编号1.1.1.265,但是所述酶也能够被归类为其他醇脱 氢酶(具体地讲,EC 1.1.1.1或1.1.1.2)。这些酶利用NADH(还原型烟 酰胺腺嘌呤二核苷酸)和/或NADPH作为电子供体,并可得自多种来源, 包括但不限于啤酒酵母(S.cerevisiae)、大肠杆菌(E.coli)、丙酮丁醇梭 菌(C.acetobutylicum)、印度拜叶林克氏菌(B.indica)(SEQ ID NO: 173)、木糖氧化无色杆菌(A.xylosoxidans)(SEQ ID NO:172)。

如本文所用,“DHMB”是指2,3-二羟基-2-丁酸甲酯。DHMB包括具 有2S,3S构型的“快DHMB”,和具有2S,3R构型的“慢DHMB”。参见 Kaneko等人,Phytochemistry 39:115-120(1995),该文献全文以引用方 式并入本文,并将快DHMB称为angliceric酸,将慢DHMB称为tigliceric 酸。

如本文所用,“降低的活性”是指与导致该降低的活性的变化之前相 同多肽的生物活性相比,该已知的多肽的生物活性的任何可测量的下降。 此类变化可包括多肽或编码多肽的多核苷酸的修饰,如本文所述。本文所 公开的多肽的降低的活性能够通过本领域熟知的和/或本文所公开的方法测 定。

如本文所用,“消除的活性”是指与导致该消除的活性的变化之前相 同多肽的生物活性相比,该已知的多肽的生物活性的完全消失。此类变化 可包括多肽或编码多肽的多核苷酸的修饰,如本文所述。消除的活性包括 与导致该消除的活性的变化之前相同多肽的生物活性相比,该多肽的不能 被测量到的生物活性。本文所公开的多肽的消除的活性能够通过本领域熟 知的和/或本文所公开的方法测定。

术语“碳底物”或“可发酵的碳底物”是指能够由本发明的宿主生物 代谢的碳源,和尤其是选自:单糖、低聚糖、多糖、和单碳底物或它们的 混合物的碳源。本文提供了碳底物的非限制性例子,包括但不限于单糖、 低聚糖、多糖、乙醇、乳酸盐、琥珀酸盐、甘油、二氧化碳、甲醇、葡萄 糖、果糖、蔗糖、木糖、阿拉伯糖、右旋糖、或它们的混合物。其它碳底 物可包括乙醇、乳酸盐、琥珀酸盐或甘油。

如本文所用,“发酵液体培养基”是指水、糖(可发酵碳源)、溶解 的固体(当存在时)、产生醇的微生物、产物醇及发酵容器内具有的所有 其他物质组分的混合物,其中产物醇通过在微生物存在的情况下使糖反应 生成醇、水和二氧化碳(CO2)而制得。有时,如本文所用,术语“发酵培 养基”和“发酵混合物”可与“发酵液体培养基”同义使用。

如本文所用的“生物质”是指包含可水解的淀粉的天然产物,其提供 了可发酵的糖,包括任何纤维素或木质纤维素材料,以及包含纤维素的材 料,并任选地还包括半纤维素、木质素、淀粉、低聚糖、二糖、和/或单 糖。生物质还可包含附加组分,诸如蛋白质和/或脂质。生物质能够来源于 单一来源,或生物质可包括来源于多于一种来源的混合物。例如,生物质 可包括玉米棒和玉米秸秆的混合物,或草和叶片的混合物。生物质包括但 不限于生物能作物、农业残余物、市政固体垃圾、工业固体垃圾、来自造 纸的淤渣、庭院垃圾、木材和林业垃圾。生物质的例子包括但不限于:玉 米粒、玉米棒、作物残余物诸如玉米壳、玉米秸秆、草、小麦、裸麦、小 麦秸秆、大麦、大麦秸秆、干草、稻秆、柳枝稷、废纸、甘蔗渣、高粱、 大豆、从谷物的研磨获得的组分、树、枝、根、叶、木屑、锯末、灌木和 灌丛、蔬菜、水果、花、动物粪肥、以及它们的混合物。

如本文所用,“原料”意为包含可发酵碳源的产物。合适的原料包括 但不限于裸麦、小麦、玉米、甘蔗、以及它们的混合物。

本文所用术语“有氧条件”是指有氧气存在下的生长条件。通常,氧 气通过搅拌培养基,使得发生与空气的气体交换而被替换。

如本文所用,术语“微氧条件”是指具有低水平的氧气(即低于正常 的大气氧气水平)的生长条件。“微氧条件”包括在其中培养基在被微生 物接种时不一定不含氧气,但是存在于培养基中的氧气被消耗并且其通过 气体交换的替换被限制(例如通过限制搅拌和/或与大气环境隔绝地密封容 器)的条件。

本文所用术语“厌氧条件”是指不存在氧气的生长条件。

术语“分离的核酸分子”、“分离的核酸片段”和“遗传构建体”将 可互换地使用,并将指单链或双链的RNA或DNA的聚合物,任选地包含 合成的、非天然的或改变的核苷酸碱基。DNA聚合物形式的分离的核酸片 段可由cDNA、基因组DNA或合成DNA中的一个或多个片段构成。

术语“氨基酸”是指蛋白质或多肽的基本化学结构单元。在本文中使 用下列缩写来表示具体的氨基酸:

术语“基因”指能够被表达为特定蛋白质的核酸片段,其任选包括编 码序列前的调控序列(5′非编码序列)和编码序列后的调控序列(3′非编码 序列)。“天然基因”是指天然存在的具有其自己的调控序列的基因。 “嵌合基因”指不是天然基因的任何基因,包含在天然情况下不是一起存 在的调控序列和编码序列。因此,嵌合基因可包含源于不同来源的调控序 列和编码序列,或者包含源于同一来源但以不同于天然存在的方式排列的 调控序列和编码序列。“内源性基因”指在微生物基因组中处于其天然位 置的天然基因。“外来”基因是指正常情况下不存在于宿主微生物中,而 是通过基因转移被引入宿主微生物内的基因。外来基因可以包括插入到非 天然微生物内的天然基因,或嵌合基因。“转基因”是已通过转化方法被 引入基因组内的基因。

如本文所用,“天然的”是指多核苷酸、基因或多肽的形式与天然存 在的一样,带有其自身的调控序列(如果存在调控序列)。

如本文所用,术语“编码序列”或“编码区”是指编码特定氨基酸序 列的DNA序列。“合适的调控序列”指位于编码序列的上游(5′非编码序 列)、编码序列内或编码序列下游(3′非编码序列)的核苷酸序列,并且其 可影响相关编码序列的转录、RNA加工或稳定性或者翻译。调控序列可包 括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位 点、效应子结合位点和茎-环结构。

如本文所用,“内源性的”是指多核苷酸、基因或多肽在其在生物体 中或生物体的基因组中的天然位置的天然形式。“内源性多核苷酸”包括 在其在生物体的基因组中的天然位置的天然多核苷酸。“内源性基因”包 括在其在生物体的基因组中的天然位置的天然基因。“内源性多肽”包括 从位于生物体基因组内其天然位置的天然多肽或基因转录并翻译的、在生 物体内位于其天然位置的天然多肽。

术语“异源性的”当用于指多核苷酸、基因、或多肽时是指通常不存 在于宿主生物中的多核苷酸、基因、或多肽。“异源性的”也包括以不同 于对应的天然基因的形式(例如,不在所述生物体基因组中的天然位置 上)被重新引入源生物体的天然的编码区、或它的一部分。异源性多核苷 酸或基因能够通过例如基因转移的方式被引入宿主生物。异源性基因可包 括具有被重新引入天然宿主的非天然调控区的天然编码区。例如,异源性 基因可包括被重新引入至天然宿主的天然编码区,其为包括非天然的调控 区的嵌合基因的一部分。“异源性多肽”包括天然多肽,其以不同于对应 的天然多肽的形式被重新引入源生物体。

“转基因”是已通过转化方法被引入基因组内的基因。

如本文所用,术语“修饰”是指本文所公开的多核苷酸的改变,所述 改变导致由所述多核苷酸编码的多肽活性降低或被消除,以及本文所公开 的多肽的改变,所述改变导致该多肽活性降低或被消除。此类改变能改通 过本领域熟知的方法实现,包括但不限于缺失、突变(例如,自发诱变、 随机诱变、由增变基因导致的诱变、或转座诱变)、取代、插入、下调、 改变细胞定位、改变多核苷酸或多肽的状态(例如,甲基化、磷酸化或泛 素化)、去除辅因子、反义RNA/DNA的引入、干扰RNA/DNA的引入、 化学修饰、共价修饰、用UV或X-射线照射、同源重组、有丝分裂重组、 启动子替换法、和/或它们的组合。通过将特定多核苷酸或多肽的序列与同 源的多核苷酸或多肽(例如酵母或细菌的)的序列进行比较,并使高度同 源区域(保守区域)或共有序列中进行的修饰的数量最大化,能够发现用 以确定哪些核苷酸或氨基酸残基能够被修饰的指导。

“调控序列”是指位于编码序列上游(5′非编码序列)、内部、或下 游(3′非编码序列),并且能影响相关的编码序列的转录、RNA加工或 RNA稳定性、或翻译的核苷酸序列。调控序列可包括启动子、增强子、操 作子、抑制子、转录终止信号、翻译前导序列、内含子、聚腺苷酸化识别 序列、RNA加工位点、效应子结合位点和茎-环结构。

术语“启动子”是指能够控制编码序列或功能性RNA的表达的核酸序 列。一般来讲,编码序列位于启动子序列的3′端。启动子可来源于天然基 因的全部、或由来源于天然存在的不同启动子的不同元件构成、或甚至包 含合成的核酸片段。本领域内的技术人员应当理解,不同的启动子可以在 不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境 条件或生理条件而指导基因的表达。导致基因在大多数细胞类型中在大多 数时候表达的启动子通常被称为“组成型启动子”。在另一方面,“诱导 型启动子”导致基因在该启动子被诱导或被启动子特异性的信号或分子开 启时被表达。还应认识到因为在大多数情况下还不能完全确定调控序列的 确切范围,不同长度的DNA片段可具有相同的启动子活性。例如,应当理 解,“FBA1启动子”可被用于指来源于FBA1基因的启动子区的片段。

如本文所用,术语“终止子”是指位于编码序列下游的DNA序列。这 包括聚腺苷酸化识别序列以及编码能够影响mRNA加工或基因表达的调控 信号的其他序列。通常聚腺苷酸化信号的特征在于影响多腺苷酸片添加到 mRNA前体的3′端。3′区可影响相关编码序列的转录、RNA加工或稳定性 或翻译。已经认识到,因为在大多数情况下还不能完全确定调控序列的确 切范围,不同长度的DNA片段可具有相同的终止子活性。例如,应当理 解,“CYC1终止子”可用于指来源于CYC1基因的终止子区的片段。

术语“可操作地连接”指单个核酸片段上的核酸序列的关联,使得其 中一种核酸序列的功能受到另一种核酸序列的影响。例如,当启动子能够 影响编码序列的表达(即,该编码序列受到该启动子的转录控制)时,则 该启动子与该编码序列可操作地连接。编码序列可以按有义或反义的取向 可操作地连接至调控序列。

如本文所用,术语“表达”指来源于本发明的核酸片段的有义RNA (mRNA)或反义RNA的转录和稳定积聚。表达也可指将mRNA翻译成多 肽。

如本文所用,术语“过表达”是指比相同的或相关的基因的内源性表 达更高的表达。如果异源性基因的表达比能与之相比的内源性基因的表达 更高,则所述异源性基因是过表达的。术语过表达是指在宿主细胞中核酸 或蛋白水平的增加。因此,可通过增加宿主细胞中内源性的序列的转录或 翻译水平、或在宿主细胞中引入异源性序列导致过表达。也可通过增加核 酸或蛋白序列的稳定性导致过表达。

如本文所用,术语“转化”是指将核酸片段转移至宿主微生物的基因 组内,导致基因稳定遗传。包含转化的核酸片段的宿主微生物被称为“转 基因”或“重组”或“转化的”微生物。

术语“质粒”、“载体”和“盒”指通常携带有不属于细胞中央代谢 的部分的基因的染色体外元件,并且常常是环状双链DNA片段的形式。此 类元件可以是源于任何来源的自主复制序列、基因组整合序列、噬菌体或 者单链或双链DNA或RNA的核苷酸序列(线性或环状的),其中多个核 苷酸序列已接合或重组进入独特的构建体中,所述独特的构建体能够将所 选基因产物的启动子片段和DNA序列与相应的3′端非翻译序列一起引入细 胞中。“转化盒”指含有外来基因并且除了该外来基因外还具有有利于转 化特定宿主细胞转化的元件的特定载体。“表达盒”指包含外来基因并且 除该外来基因以外还具有使得该基因在外来宿主中的表达增强的元件的特 定载体。

如本文所用,术语“密码子简并性”指允许核苷酸序列在不影响所编 码的多肽的氨基酸序列的情况下发生变化的遗传密码的性质。技术人员非 常了解具体宿主细胞在使用核苷酸密码子以规定给定氨基酸时所表现出的 “密码子偏倚性”。因此,当合成基因用以改善在宿主细胞中的表达时, 期望对基因进行设计,使得其密码子使用频率接近该宿主细胞优选的密码 子使用频率。

如它是指用于转化各种宿主的基因或核酸分子的编码区域,术语“密 码子优化的”是指在基因或核酸分子的编码区域中的密码子改变,反映了 在没有改变DNA编码的多肽情况下宿主生物典型的密码子使用情况。此类 优化包括将至少一个、或多于一个、或显著的数目的密码子替换为在那种 生物体中使用频率更高的一个或多个密码子。

包含编码任何多肽链的氨基酸的密码子的核苷酸序列中的偏差,允许 编码该基因的序列中的变型。由于每一密码子由三个核苷酸组成,而组成 DNA的核苷酸限于四种特异性碱基,因此存在64种可能的核苷酸组合, 其中有61种编码氨基酸(其余三种密码子编码结束翻译的信号)。本文将 示出哪些密码子编码哪些氨基酸的“遗传密码”重制为表1。因此,许多氨 基酸被分配了多于一种的密码子。例如,氨基酸丙氨酸和脯氨酸由四种三 联体编码,丝氨酸和精氨酸由六种三联体编码,而色氨酸和甲硫氨酸仅由 一种三联体编码。这种简并性允许DNA碱基组成在宽泛范围内变化而不会 改变由该DNA编码的蛋白质的氨基酸序列。

表1.标准遗传密码

对于使用特定密码子来编码特定氨基酸向延伸中的肽链中的插入,许 多生物表现出偏好。密码子偏好、或密码子偏好性、生物体间密码子使用 的差异是遗传密码子的简并性造成的,在许多生物体中有很详细的记录。 密码子偏好性经常与信使RNA(mRNA)的翻译效率相关联,所述翻译效 率反过来据信依赖于,特别是,被翻译的密码子的特性和特定转运RNA (tRNA)分子的可用性。选定的tRNA在细胞中的优势一般而言反映了在 肽的合成中最频繁使用的密码子。因此,能够基于密码子优化对基因进行 加工,以使基因在给定生物中的表达最优化。

考虑到对于多种多样的动物、植物和微生物物种存在大量的基因序 列,计算密码子使用的相对频率是可能的。密码子使用表是易得的,例如 在www.kazusa.or.jp/codon/(2008年3月20日访问)提供的“密码子使用 数据库”,并且这些表格可以在多个方面进行调整。参见Nakamura,Y.等 人,Nucl.Acids Res.28:292(2000)。从GenBank Release 128.0[2002年2 月15日]计算的酵母的密码子使用表被重制为下文的表2B。该表使用 mRNA命名,因此,该表使用存在于RNA中的尿嘧啶(U),而不是存在 于DNA中的胸腺嘧啶(T)。表2经过了调整,使得对于每个氨基酸计算 了频率,而非全部64个密码子。

表2.酿酒酵母(Saccharomyces cerevisiae)的密码子使用表

氨基酸 密码子 数量 频率/千 Phe UUU 170666 26.1 Phe UUC 120510 18.4

通过利用该表或类似的表,本领域的普通技术人员能够将这些频率应 用于任何给定的多肽序列,并产生密码子优化的编码所述多肽的编码区的 核酸片段,但其使用针对给定的物种优化的密码子。

以优化的频率随机分配密码子来编码给定的多肽序列,能够通过计算 每种氨基酸的密码子频率,然后随机地为多肽序列分配密码子而人工地实 现。另外,多种算法和计算机软件程序是本领域的普通技术人员易得的。 例如,可从DNAstar,Inc.,Madison,WI获得的Lasergene软件包中的 “EditSeq”功能,可从InforMax,Inc.,Bethesda,MD获得的VectorNTI 套件中的“backtranslation”功能,以及可从Accelrys,Inc.,San Diego, CA获得的GCG-Wisconsin软件包中的“backtranslate”功能。此外,多种 用于对编码区序列进行密码子优化的资源是可公开获得的,例如 www.entelechon.com/bioinformatics/backtranslation.php?lang=eng(2008年4 月15日访问)的“backtranslation”功能,和可在 http://bioinfo.pbi.nrc.ca:8090/EMBOSS/index.html(2002年7月9日访问)的 “backtranseq”功能。构建基本的算法来基于给定的频率分配密码子也能够 由本领域的普通技术人员用基本的数学函数实现。

密码子优化的编码区也可通过本领域的技术人员已知的多个方法进行 设计,包括诸如“synthetic gene designer” (userpages.umbc.edu/~wug1/codon/sgd/,2012年3月19日访问)的软件 包。

当在合适的温度和溶液离子强度条件下单链形式的核酸片段可以退火 至另一核酸片段时,多核苷酸或核酸片段“可杂交”至另一核酸片段,诸 如cDNA、基因组DNA或RNA分子。杂交和洗涤条件为人们所熟知,并 且示例于Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular Cloning:A  Laboratory Manual,第2版,Cold Spring Harbor Laboratory:Cold Spring  Harbor,NY(1989),尤其是在该文献第11章和表11.1(全文以引用方式 并入本文)中进行了例示。温度和离子强度条件确定了杂交的“严格 性”。可调节严格性条件以筛选中度相似的片段(诸如来自远缘生物的同 源序列),至高度相似的片段(诸如从近缘生物复制功能酶的基因)。杂 交后的洗涤确定严格性条件。一组条件使用一系列洗涤,开始是6X SSC、 0.5%SDS在室温下洗涤15分钟,然后用2X SSC、0.5%SDS在45℃下重 复30分钟,再用0.2X SSC、0.5%SDS在50℃下重复洗涤两次,每次30分 钟。另一组严格性条件采用更高的温度,其中洗涤与上述洗涤相同,不同 的是最后两次在0.2X SSC、0.5%SDS中洗涤30分钟时的温度被增加至60 ℃。另一组高严格性条件使用最后两次洗涤在65℃下用0.1X SSC、0.1% SDS进行。例如,另一组严格性条件包括在0.1X SSC、0.1%SDS中在65 ℃下杂交并用2X SSC、0.1%SDS洗涤,随后用0.1X SSC、0.1%SDS洗 涤。

杂交需要两种核酸含有互补序列,但取决于杂交的严格性,碱基之间 可能会发生错配。用于使核酸杂交的合适的严格性取决于核酸的长度和互 补的程度,它们为本领域熟知的变量。两条核苷酸序列之间的相似性或同 源性程度越高,具有那些序列的核酸的杂交体的Tm值就越大。核酸杂交 的相对稳定性(对应较高的Tm)按下列顺序依次降低:RNA:RNA、 DNA:RNA、DNA:DNA。就长度大于100个核苷酸的杂交体而言,已经获 得了计算Tm的公式(参见Sambrook等人,同上,9.509.51)。对于与较 短核酸(即寡核苷酸)的杂交,错配的位置变得更重要,而且寡核苷酸的 长度决定了其特异性(参见Sambrook等人,同上,11.711.8)。在一个实 施例中,可杂交核酸的长度为至少约10个核苷酸。在一个实施例中,可杂 交核酸的最短长度为至少约15个核苷酸;至少约20个核苷酸;或者长度 为至少约30个核苷酸。此外,技术人员将认识到,必要时可根据诸如探针 长度之类的因素来调节温度和洗涤溶液的盐浓度。

如本文所用,术语“多肽”旨在涵盖单数的“多肽”以及复数的“多 肽”,并指由单体(氨基酸)通过酰胺键(也被称为肽键)线性连接组成 的分子。术语“多肽”是指任何两个或更多个氨基酸的一条或多条链,并 且不涉及产物的特定长度。因此,“肽”、“二肽”、“三肽”、“寡 肽”、“蛋白质”、“氨基酸链”、或其它任何用于指由两个或更多个氨 基酸组成的一条链或多条链的术语,都包括在“多肽”的定义内,并且术 语“多肽”可用于取代或与这些术语中任一项互换使用。多肽可来源于天 然生物源或由重组技术产生,但不一定是由指定的核酸序列翻译的。它可 由任何方式生成,包括通过化学合成方式。适用于多肽合成的方法是本领 域已知的。

以“分离的”多肽或片段形式的变体和其衍生物意为不在其自然环境 下的多肽。不需要特别的纯化水平。例如,分离的多肽能够从它原生的或 天然的环境中去除。据认为在宿主细胞中表达的重组多肽和蛋白质进行分 离用于本发明目的,即为原生的或重组的多肽,其已通过任何合适的技术 分离、分馏、或部分或基本上纯化。

如本文所用,术语“变体”和“突变体”是同义的,是指通过利用例 如重组DNA技术(诸如诱变)产生的一个或多个氨基酸插入、缺失、突 变、和取代,而不同于具体地列出的多肽的多肽。通过将特定多肽的序列 与同源的多肽(例如酵母或细菌的)的序列进行比较,并使高度同源区域 (保守区域)中进行的氨基酸序列改变的数量最小化,或通过用共有序列 代替氨基酸,能够发现用以确定哪些氨基酸残基可以被替代、添加、或缺 失而不会破坏所关注的活性的指导。

如本文所用,“工程化的多肽”是指合成的,即以某些方式不同于天 然存在的多肽的多肽。

另选地,编码这些相同或相似的多肽的重组多核苷酸变体可以被合 成,或通过利用遗传密码中的“冗余”进行选择。各种密码子取代,如产 生各种限制性位点的沉默变化,可引入以优化克隆到用于表达的质粒载体 或病毒载体。多核苷酸序列的突变可以体现在被添加至多肽以修饰所述多 肽的任何部分的特性的其他肽的多肽或结构域之中。例如,突变能用于降 低或消除靶蛋白质的表达,并且包括但不限于整个基因或基因的一部分的 缺失、基因中DNA片段的插入(在启动子区或编码区),因此所述蛋白质 不表达或以低水平表达;在编码区域引入突变即增加终止密码子或框移使 得功能蛋白质不表达;以及在编码区域引入一个或多个突变以改变氨基 酸,因此表达不具备功能的或较少酶活性的蛋白质。

氨基酸“取代”可为一个氨基酸替换为另一个具有相似结构和/或化学 性质的氨基酸的结果,即保守的氨基酸替换,或可为一个氨基酸替换为另 一个具有不同结构和/或化学性质的氨基酸的结果,即非保守的氨基酸替 换。“保守的”氨基酸取代可以基于所涉及的残基在极性、电荷、溶解 度、疏水性、亲水性、或两亲性性质方面的相似性实现。例如,非极性 (疏水性)氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯 丙氨酸、色氨酸和甲硫氨酸;极性的中性氨基酸包括甘氨酸、丝氨酸、苏 氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺;带正电的(碱性)氨基 酸包括精氨酸、赖氨酸和组氨酸;而带负电的(酸性)氨基酸包括天冬氨 酸和谷氨酸。另选地,“非保守的”氨基酸取代可以通过选择任何这些氨 基酸在极性、电荷、溶解度、疏水性、亲水性、或两亲性性质方面的差异 实现。“插入”或“缺失”可在重组蛋白质结构上或功能上耐受的变型范 围之内。通过系统地利用重组DNA技术产生多肽分子中的氨基酸的插入、 缺失、或取代,并检测所得重组变体的活性,可以以实验方法确定所允许 的变型。

氨基酸或核苷酸序列的“基本部分”是指这样的部分,该部分包括的 多肽的氨基酸序列或基因的核苷酸序列足以推定地鉴定所述多肽或基因, 所述鉴定或者可以由本领域技术人员通过人工评价序列来完成,或者可以 利用诸如BLAST(Altschul,S.F.等人,J.Mol.Biol.,215:403-410 (1993))的算法通过计算机自动序列比对和鉴定来完成。一般来讲,为 了推定地鉴定多肽或核酸序列是否与已知的蛋白质或基因同源,需要有十 个或更多的连续氨基酸或者三十个或更多的核苷酸的序列。此外,对于核 苷酸序列,包含20-30个连续的核苷酸的基因特异性寡核苷酸探针可用于序 列依赖性的基因鉴定(如Southern杂交)和基因分离(如细菌菌落或噬菌 斑的原位杂交)的方法中。此外,12-15个碱基的短寡核苷酸可在PCR中 用作扩增引物,以获得包含该引物的特定核酸片段。因此,核苷酸序列的 “基本部分”包含的序列足以特异性地鉴定和/或分离包含该序列的核酸片 段。本说明书教导了编码特定蛋白质的完整氨基酸和核苷酸序列。利用本 文所报道的序列的有益效果,技术人员现在可以利用本发明所公开序列的 全部或基本部分,以用于本领域技术人员已知的目的。因此,本发明包括 如所附的序列表中报道的完整序列,以及如上文所定义的这些序列的基本 部分。

术语“互补”用于描述核苷酸碱基之间能够彼此杂交的关系。例如, 就DNA而言,腺嘌呤是与胸腺嘧啶互补的而胞嘧啶是与鸟嘌呤互补的,而 就RNA而言,腺嘌呤是与尿嘧啶互补的,而胞嘧啶是与鸟嘌呤互补的。

术语“百分比同一性”如本领域已知是指通过比较多个序列测定的、 两个或更多个多肽序列或两个或更多个多核苷酸序列之间的关系。本领域 中“同一性”也意为多肽或多核苷酸序列之间的序列关联度,视情况而 定,如由此类序列串间的匹配来测定。“同一性”和“相似性”可容易地 通过已知方法计算出来,所述的方法包括但不限于下列文献中所描述的那 些:1.)Computational Molecular Biology(Lesk,A.M.编辑)Oxford  University:NY(1988);2.)Biocomputing:Informatics and Genome Projects (Smith,D.W.编辑)Academic:NY(1993);3.)Computer Analysis of  Sequence Data,部分I(Griffin,A.M.和Griffin,H.G.编辑)Humania:NJ (1994);4.)Sequence Analysis in Molecular Biology(von Heinje,G.编 辑)Academic(1987);以及5.)Sequence Analysis Primer(Gribskov,M. 和Devereux,J.,Eds.)Stockton:NY(1991)。

设计确定同一性的方法来给出待测试序列之间的最佳匹配。确定同一 性和相似性的方法在可公开获得的计算机程序中被编成了代码。序列比对 和同一性百分比计算可以用LASERGENE生物信息学计算软件包 (LASERGENE bioinformatics computing suite(DNASTAR Inc.,Madison, WI))中的MegAlignTM程序进行。序列的多重比对使用“Clustal比对方 法”进行,该方法涵盖若干个不同的算法,包括对应于称为Clustal V的比 对方法的“Clustal V比对方法”(描述于Higgins和Sharp,CABIOS. 5:151-153(1989);Higgins,D.G.等人,Comput.Appl.Biosci.,8:189-191 (1992))中,并且可以在LASERGENE生物信息学计算软件包 (DNASTAR Inc.)中的MegAlignTM程序中找到的比对方法。对于多重比 对,默认值对应于GAP PENALTY=10以及GAP LENGTH PENALTY=10。 用Clustal方法进行成对比对和蛋白质序列的百分比同一性计算的默认参数 为KTUPLE=1、GAP PENALTY=3、WINDOW=5和DIAGONALS  SAVED=5。对于核酸,这些参数为KTUPLE=2、GAP PENALTY=5、 WINDOW=4以及DIAGONALS SAVED=4。在使用Clustal V程序进行序列 比对后,通过查看同一程序中的“序列距离”表格有可能获得“百分比同 一性”。另外,也可以使用“Clustal W比对方法”,该方法对应于称为 Clustal W的比对方法(描述于Higgins和Sharp,CABIOS.5:151-153 (1989);Higgins,D.G.等人,Comput.Appl.Biosci.8:189-191(1992)) 并且可以在LASERGENE生物信息学计算软件包(DNASTAR Inc.)中的 MegAlignTM v6.1程序中找到的比对方法。用于多重比对的默认参数(GAP  PENALTY=10、GAP LENGTH PENALTY=0.2、Delay Divergen Seqs(%) =30、DNA Transition Weight=0.5、Protein Weight Matrix=Gonnet Series以及 DNA Weight Matrix=IUB)。在使用Clustal W程序进行序列比对后,通过 查看在同一程序中的“序列距离”表有可能获得“百分比同一性”。

本领域的技术人员充分理解许多水平的序列同一性对鉴定多肽有用, 其中此类多肽具有相同或相似的功能或活性,或对描述相应的多核苷酸有 用。有用的同一性百分比示例包括但不限于:55%、60%、65%、70%、 75%、80%、85%、90%、或95%、或从55%至100%的任何整数百分比在 描述本发明时能够是可用的,诸如55%、56%、57%、58%、59%、60%、 61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、 72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%或99%。合适的多核苷酸片段不仅具有上述 同源性,而且通常包含具有至少50个核苷酸、至少100个核苷酸、至少 150个核苷酸、至少200个核苷酸、或至少250个核苷酸的多核苷酸。此 外,具有上述同源性的合适的多核苷酸片段编码具有至少50个氨基酸、至 少100个氨基酸、至少150个氨基酸、至少200个氨基酸、或至少250个氨 基酸的多肽。多核苷酸能够使用本领域中已知的方法克隆或合成。

术语“序列分析软件”指可用于分析核苷酸或氨基酸序列的任何计算 机算法或软件程序。“序列分析软件”可商购获得或独立开发。典型的序 列分析软件包括但不限于:1.)GCG程序套件(Wisconsin Package Version  9.0,Genetics Computer Group(GCG),Madison,WI);2.)BLASTP, BLASTN,BLASTX(Altschul等人,J.Mol.Biol.,215:403-410 (1990));3.)DNASTAR(DNASTAR,Inc.Madison,WI);4.) Sequencher(Gene Codes Corporation,Ann Arbor,MI);以及5.)结合了 Smith-Waterman算法的FASTA程序(W.R.Pearson,Comput.Methods  Genome Res.,[Proc.Int.Symp.](1994),Meeting Date 1992,111-20.编 辑:Suhai,Sandor,Plenum:New York,NY)。在本专利申请的上下文中 应当理解,使用序列分析软件进行分析时,除非另外指明,否则分析结果 将基于所参考程序的“默认值”。如本文所用,“默认值”是指在首次初 始化软件时软件最初加载的任何值或参数的设定。

本文使用的标准重组DNA和分子克隆技术是本领域所熟知的,并且在 如下文献中有所描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T., Molecular Cloning:A Laboratory Manual,第二版,Cold Spring Harbor  Laboratory Press,Cold Spring Harbor,NY(1989)(下文称为 “Maniatis”);以及Silhavy,T.J.,Bennan,M.L.和Enquist,L. W., Experiments with Gene Fusions,Cold Spring Harbor Laboratory Press,Cold  Spring Harbor,NY(1984);以及Ausubel,F.M.等人,Current Protocols  in Molecular Biology,Greene Publishing Assoc.和Wiley-Interscience出版 (1987)。此处所用的另外的方法参见Methods in Enzymology,第194 卷,Guide to Yeast Genetics and Molecular and Cell Biology(部分A, 2004,Christine Guthrie和Gerald R.Fink(编辑),Elsevier Academic  Press,San Diego,CA)。其它的分子工具和技术是本领域已知的,包括通 过重叠延伸聚合酶链反应(PCR)的接合(Yu等人(2004)Fungal Genet. Biol.41:973-981),对于酿酒酵母(Saccharomyces cerevisiae)URA3基因 座突变的阳性选择(Boeke,J.D.等人(1984)Mol.Gen.Genet.197,345- 346;M A Romanos等人,Nucleic Acids Res.1991年1月11日;19(1): 187)、cre-lox位点特异性重组系统以及突变型lox位点和FLP底物突变 (Sauer,B.(1987)Mol Cell Biol 7:2087-2096;Senecoff等人(1988) Journal of Molecular Biology,第201卷,第2期,第405-421页;Albert等 人(1995)The Plant Journal.第7卷,第4期,第649-659页),“无缝” 基因缺失(Akada等人(2006)Yeast,23(5):399-405),和空位修复 方法(Ma等人,Genetics 58:201-216;1981)。

对本文所公开的重组宿主细胞的基因操纵能够利用标准基因技术和筛 选进行,并且能够在任何适合基因操纵的宿主细胞中完成(Methods in  Yeast Genetics,2005,Cold Spring Harbor Laboratory Press,Cold Spring  Harbor,NY,第201-202页)。

在实施例中,本文所公开的重组宿主细胞可以为可用于基因修饰和重 组基因表达的任何酵母或真菌宿主,包括本文其他地方所提及的那些酵 母。在其它实施例中,重组宿主细胞能够可以为伊萨酵母属 (Issatchenkia)、接合酵母属(Zygosaccharomyces)、酵母属 (Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、德克酵母属 (Dekkera)、球拟酵母属(Torulopsis)、酒香酵母属(Brettanomyces)、 有孢圆酵母属(Torulaspora)、汉逊酵母属(Hanseniaspora)、克鲁维酵 母属(Kluveromyces)、耶氏酵母属(Yarrowia)的成员以及假丝酵母属 (Candida)的一些菌种。

有利于生物合成途径的具有KARI活性的多肽

美国专利申请公布2010/0197519A1描述了适用于异丁醇生产的荧光假 单胞菌(Pseudomonas fluorescens)KARI酶的变体,包括被显示为具有比 野生型酶更低的针对辅因子NADH的KM的变体“JEA1”(SEQ ID NO: 2)。

如本文的实例中所展示的,本发明提供了JEA1的变体,据信所述 JEA1的变体尤其适用于包含异丁醇生物合成途径的重组微生物宿主细胞 (包括诸如酿酒酵母(S.cerevisiae)的酵母细胞)中和在厌氧条件下利用 此类宿主细胞的方法中。如此,本文提供的变体在包含KARI活性催化的 底物至产物转化的其他生物合成途径中也可以是可用的。

基于实例中给出的结果,在SEQ ID NO:2的下列位点中的一个或多 个、两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个 或更多个、七个或更多个、或八个或更多个处的取代产生了适用于包含异 丁醇生物合成途径的重组宿主细胞中的多肽:Y286、I152、S322、S292、 I291、I13、P47、F50、V53、A268、V76、A336、L88、A71、G72、 M301、Y239、Y113、N114、A329、A69、A295、E264、R280、S157、 M238、Q272、K335、K99、R275、R306。

在实施例中,在这些位点的取代包括但不限于实例中展示的那些: Y286F、A336R、I152V、S322A、S292A、I291V、I13L、P47Y、F50A、 V53A、A268E、V76I、A336G、L88V、A71K、G72W、I152V、A268T、 A329E、M301I、Y239H、Y113F、S322A、N114G、A329R、A69T、 N114S、A295V、E264K、R280D、S157T、M238I、Q272T、K335M、 R280H、K99N、R275K、R306K或它们的组合。

取代的组合可包括但不限于实例1-5、表9、11、13、15、和17中展 示的那些。如所展示的,取代的某些组合适用于包含异丁醇生物合成途径 的重组微生物宿主细胞。

例如,如实例2中所示,合适的组合是Y286、A336、和I152。实例 中展示了具有在这些位点处的取代的示例性变体。在实施例中,在这些位 点处的取代是Y286F、A336R、和I152V。另一种合适的组合是A68、 I152、Y286和A336。在实施例中,在这些位点处的取代是A68E、 I152V、Y286F、和A336R。包含这些取代的一种示例性变体作为SEQ ID  NO:346(“R8-SOG1_y2”)被给出。

其他组合包含在下列位点中的一个或多个处的取代:A69、A71、 Y113、M238、Y239、M301、A322或A329。此类组合的示例示出在实例 5中。

在实施例中,对于本文提供的变体,包括在I152、Y286和A336以及 任选的A68包含取代的变体,取代可选自表3中针对所指示的位点以 “X”标识的那些:

表3:KARI变体的取代

氨基酸 位点152 位点286 位点336 A,Ala X X X C,Cys X X X D,Asp X - X E,Glu X - X F,Phe X X X G,Gly X - X H,His X X X I,Ile X X X K,Lys X - X L,Leu X - X M,Met X X X N,Asn X - X P,Pro X - X Q,Gln X - X R,Arg X - X S,Ser X - X T,Thr X - X V,Val X - X W,Trp X X X Y,Tyr X X X

利用本公开,本领域的技术人员能够容易地在任何所指示的位点 (Y286、I152、S322、S292、I291、I13、P47、F50、V53、A268、V76、 A336、L88、A71、G72、M301、Y239、Y113、N114、A329、A69、 A295、E264、R280、S157、M238、Q272、K335、K99、R275、和R306) 制造和使用另外的取代,以产生另外的变体。生成此类变体的方法展示于 本文中(参见实例6)和/或是本领域中已知的,如下文所述。在一个实施 例中,基于本文例示的序列进行了保守取代。在另一个实施例中,全部的 氨基酸或氨基酸的子集在给定的位点被取代,并针对活性被筛选。

在实施例中,在本文提供的多肽中:在对应于SEQ ID NO:2的位点24 的位点处的氨基酸是F;在对应于SEQ ID NO:2的位点33的位点处的氨基 酸是L;在对应于SEQ ID NO:2的位点47的位点处的氨基酸是P;在对应 于SEQ ID NO:2的位点50的位点处的氨基酸是F;在对应于SEQ ID NO:2 的位点61的位点处的氨基酸是F;在对应于SEQ ID NO:2的位点80的位 点处的氨基酸是I;并且在对应于SEQ ID NO:2的位点156的位点处的氨 基酸是V。

应当理解,利用本领域中可用的结构和序列信息的组合,能够构建包 含KARI活性和与所例示的序列具有小于100%的同一性的多肽用于在异丁 醇或其他生物合成途径中。例如,已经以分辨率解开了大肠杆菌(E. coli)KARI酶的晶体结构(Tyagi,等人,Protein Sci.,14:3089-3100, 2005),以及铜绿假单胞菌(P.aeruginosa)KARI(Ahn,等人,J.Mol. Biol.,328:505-515,2003)和来自菠菜的KARI酶(Biou V.,等人,The  EMBO Journal,16:3405-3415,1997)的结构。此外,利用具有以实验方式 验证的功能的25种KARI蛋白质的氨基酸序列制备的KARI序型HMM描 述于美国专利8,129,162中。所述KARI来自于荧光假单胞菌 (Pseudomonas fluorescens)Pf-5、硫磺矿硫化叶菌(Sulfolobus  solfataricus)P2、耐超高温热棒菌(Pyrobaculum aerophilum)菌株IM2、 盐碱古菌(Natronomonas pharaonis)DSM2160、枯草芽抱杆菌枯草亚种菌 株168(Bacillus subtilis subsp.subtilis str.168)、谷氨酸棒状杆菌 (Corynebacterium glutamicum)ATCC13032、莫氏褐螺菌(Phaeospririlum  molischianum)、青枯罗尔斯通氏菌(Ralstonia solanacearum)GMI1000、 运动发酵单胞菌运动亚种ZM4(Zymomonas mobilis subsp.mobilis ZM4)、 Alkalilimnicola ehrlichei MLHE-、红嘴鸥弯曲杆菌(Campylobacter lari) RM2100、水油海杆菌(Marinobacter aquaeolei)VT8、Psychrobacter  arcticus 273_4、Hahella chejuensts KCTC 2396、脱氮硫杆菌(Thiobacillus  denitrificans)ATCC 25259、维涅兰德固氮菌(Azotobacter vinelandii) AvOP、丁香假单胞菌丁香致病变型B728a(Pseudomonas syringae pv. syringae B728a)、丁香假单胞菌番茄致病变型菌株DC3000(Pseudomonas  syringae pv.tomato str.DC3000)、恶臭假单胞菌(Pseudomonas putida) KT2440、嗜虫假单胞菌(Pseudomonas entomophila)L48、门多萨假单胞 菌(Pseudomonas mendocina)ymp、铜绿假单胞菌(Pseudomonas  aeruginosa)PAO1、蜡状芽孢杆菌(Bacillus cereus)ATCC10987、以及菠 菜(Spinacia oleracea)。利用HMMER软件包中的hmmsearch程序,以 <10-3的E值符合KARI序型HMM(描述于美国专利8,129,162中,并且其 全文以引用方式并入本文)的任何蛋白质预期是功能性的KARI。

如图9-12中所示,利用PF5 KARI的同源性建模,本文所公开的取代 位点能够按照它们的结构性位置被分组,如美国专利8,129,162中所公开 的。如在其中所公开的,基于与PF5 KARI具有92%氨基酸序列同一性的 铜绿假单胞菌(P.aeruginosa)PAO1-KARI的晶体结构,建立了结合了 NADPH、乙酰乳酸和镁离子的PF5-KARI的结构(PDB ID 1NP3,Ahn H.J. 等人,J.Mol.Biol.,328,505-515,2003)。PAO1-KARI结构是同十二聚 体,并且每一十二聚体由具有大量二聚体界面的六个同二聚体组成。KARI 的活性位点位于上述二聚体界面内。生物学组件是通过六个同二聚体定位 在四面体的边缘上,产生具有23点群对称性的高度对称的十二聚体而形成 的。简单起见,对于PF5-KARI的同源性模型,仅构建了二聚体单元(单 体A和单体B),因为活性位点位于同二聚体界面内。

利用DeepView/Swiss PDB查看器(Guex,N.和Peitsch,M.C. Electrophoresis 18:2714-2723,1997),基于PAO1-KARI的单体A和单体B 的坐标和PF5-KARI的序列,构建了PF5-KARI二聚体的模型。然后将该模 型输入Silicon Graphics系统上的程序O(Jones,T.A.等人,Acta Crystallogr. A 47,110-119,1991),用于进一步修改。

PAO1-KARI的结构在其活性位点内不具有辅因子、底物或抑制剂或 镁。因此,在乙酰乳酸结合位点内具有镁离子、NADPH和抑制剂(N-羟 基-N-异丙基草酰胺盐)的菠菜KARI结构(PDB ID lyve,Biou V.等人, The EMBO Journal,16:3405-3415,1997.)被用于在活性位点内对这些分子 建模。植物KARI与PF5-或PAO1 KARI均具有非常小的序列同一性 (<20%氨基酸序列同一性),然而在这两种KARI酶的活性位点区域内的 结构是非常相似的。为了重叠这两种KARI结构的活性位点,程序O中的 命令LSQ_ext、LSQ_improve、LSQ_mol被用于排列菠菜KARI的单体A至 PF5 KARI模型的单体A的活性位点。提取了结合在菠菜KARI的活性位点 内的NADPH、两个镁离子和抑制剂的坐标,并整合进PF5 KARI的分子 A。通过应用由程序计算的从单体A至单体B的转化运算符,针对PF5 KARI的单体B生成了这些分子的一组坐标。

由于在PAO1 KARI晶体结构的活性位点中没有辅因子,辅因子结合位 点中的磷酸结合环区域(PAO1 KARI中的残基44-45,菠菜KARI中的残 基157-170)的结构在这两者之间是非常不同的。为了对辅因子结合的形式 建模,PF5-KARI磷酸结合环(44-55)的模型被1yve(157-170)的所替换。 利用程序O中的mutate_replace命令,将这两者之间侧链的任何差异转化为 PF5-KARI序列中的那些,并手动地调整了替换的侧链的构象。利用程序 CNX(ACCELRYS San Diego CA,Burnger,A.T.和Warren,G.L.,Acta  Crystallogr.,D 54,905-921,1998)对整个NADPH/Mg/抑制剂结合的二聚体 PF5-KARI模型进行了一轮能量最小化,然后用底物乙酰乳酸(AL)在模 型中替换了抑制剂。手动地调整了AL的构象,以有利于氢化物在NADPH 的烟酰胺的C4和底物之间的转移。在该模型上没有进行另外的能量最小 化。

在该模型中没有看到C-末端尾(328-338),并且其在被用于构建Pf5- KARI的同源性模型的晶体结构PDB代码1np3中是混乱的。C-末端尾已被 示出对于催化过程中辅因子和底物的结合是重要的(JMB(2009)389,167- 182Leung&Guddat)。下列位点位于C-末端尾区域中:A329、K335、 A336。

如图10中所示出的,位点M238、Y239、E264、N267、A268、 Q272、A277、R280、Y286、I291、S292、M301、S322与分子间二聚体界 面区域相关联,而位点Y113、N114、I291、S292、和A295与结构域间界 面区域相关联。

位点P47、P50、V53、T80、和L88是模型化的核苷酸结合区域的部 分(图11A)。位点68、69、71和72与N-结构域表面螺旋相关联(位点 64-73;图11B)。

位点C33、L61、1127、I152、和V171在N-结构域疏水性桥区域中, 示出在图12中。

因此,本文提供了在分子间二聚体界面区域、结构域间界面区域、核 苷酸结合区域、N-结构域表面螺旋区域、疏水性桥区域、和C-末端尾区域 中的至少一个中包含取代的变体。在实施例中,本文提供的变体包含核苷 酸结合区域中的取代和下列区域中的至少一个、至少两个、或至少三个中 的取代:分子间二聚体界面区域、结构域间界面区域、N-结构域表面螺旋 区域、疏水性桥区域、或C-末端尾区域。

使用本文所公开的和本领域可获得的序列,在技术人员所熟知的文献 和生物信息学数据库中能够鉴定其他多核苷酸、基因和/或多肽的序列。例 如,通过用本文提供的多核苷酸或多肽序列对可公开获得的数据库的 BLAST检索,能够鉴定此类序列。在此类方法中,同一性能够基于Clustal  W比对方法,采用GAP PENALTY=10,GAP LENGTH PENALTY=0.1 的默认参数和Gonnet 250系列的蛋白质权重矩阵。

另外,本文所公开的多核苷酸或多肽序列能够用于鉴定其他天然的 KARI同系物。例如,每个本文所公开的编码KARI的核酸片段能够用于分 离编码同源蛋白的基因。使用序列依赖性规程分离同源基因是本领域熟知 的。序列依赖性规程的例子包括但不限于:(1)核酸杂交方法;(2) DNA和RNA扩增方法,这可通过核酸扩增技术的多种用法来举例说明[如 聚合酶链反应(PCR),Mullis等人,美国专利4,683,202;连接酶链反应 (LCR),Tabor等人,Proc.Acad.Sci.USA 82:1074(1985);或链置换扩 增反应(SDA),Walker等人,Proc.Natl.Acad.Sci.U.S.A.,89:392 (1992)];和(3)文库构建和互补筛选方法。

应当理解,利用本公开以及本文和/或本领域中可获得的序列和结构信 息,本领域的普通技术人员还能够生成本文提供的多肽的活性片段,例 如,通过在N-端或C-端截短本文提供的多肽并确认KARI活性。

因此,本文提供了具有SEQ ID NO:3、4、5、6、7、8、9、10、11、 12、13、14、15、16、17、18、20、22、23、24、25、26、27、28、29、 33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、 49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、 99、100、101、102、103、104、105、106、107、108、109、110、111、 112、113、114、116、118、119、120、121、123、124、128、129、131、 132、133、134、136、137、138、139、140、141、142、143、144、146、 147、148、149、150、151、152、153、154、155、157、159、160、161或 346的氨基酸序列或与上述氨基酸序列具有至少约90%的同一性、至少约 95%的同一性、至少约99%的同一性的多肽或它们的活性片段。

变体的生成

本文所述的变体可通过本领域中已知的任何方法生成。本领域中已知 的用于定点诱变的方法包括,例如,(Agilent,Santa Clara, CA)和(Affymetrix/USB,Santa Clara,CA)。本领域中已知的 用于随机位点诱变的方法包括,例如,易错PCR(例如,Bloom等人, BMC Biol.2007,5:29,doi:10.1186/1741-7007-5-29.)或(Agilent,Santa Clara,CA)、暴露于化学诱变剂(例如,甲磺酸乙酯)或 紫外线、在PCR中使用经修饰的核苷酸(例如,Wong等人,Nucleic Acids  Res.2004,32:3,e26.)、和使用特殊的增变株。本领域中已知的用于DNA 重组或“改组”的方法包括,例如,随机片段化和重装配(例如,Stemmer 1994Proc.Natl.Acad.Sci.USA 91:22,10747-10751.)、异源双链修复(例 如,Volkov等人,Nucleic Acids Res.199927:18,e18.)、交错延伸(例 如,Zhao等人,Nat.Biotechnol.,1998,16:3,258-261.)、非配对引物改组 (例如,Milano等人,美国专利#:7,879,582)、定点重组(例如,Hiraga 等人,J.Mol.Biol.2003,330:2,287-296.)、以及合成改组(例如,Ness等 人,Nat.Biotechnol.,2002,20,1251-1255.)。用于蛋白质变体文库构建的 其他方法包括,例如,环状变换(circular permutation)(例如,Guntas等 人,PLoS One.2012,7(4):e35998)、和DNA化学合成。

利用本公开,本领域的技术人员能够容易地制备和使用本文提供的变 体以及具有与它们小于100%的同一性(如上文所述)的变体。

KARI活性

本文所述的多肽包括具有KARI活性的那些。使用本领域中描述的方 法(例如,在美国专利8,129,162中,该文献以引用方式并入本文),通过 测定乙酰乳酸至2,3-二羟基异戊酸的酶促转化,能够确认KARI活性。例 如,在上述转化之后可以使用酶标仪(诸如来自Molecular Device (Sunnyvale,Calif))在340nm测量辅因子NADPH或NADH从反应中的消 失。

KARI活性还可以通过在包含编码催化图1的步骤a、c、d、和e中给 出的底物至产物转化的多肽的多核苷酸的宿主细胞中表达给定的KARI,并 测量异丁醇的生产而被确认,如本文所描述和展示的(参见实例)。另选 地,KARI活性可通过测量在KARI催化的底物至产物的转化的下游的生物 合成途径中的中间产物的产生而被确认。同样,使用类似的策略并确认在 KARI催化的底物至产物的转化的下游的生物合成途径产物或中间产物的产 生,包含其他生物合成途径的底物至产物的转化的宿主细胞也能够用于确 认KARI活性。

异丁醇生产的确认

异丁醇在培养基中的存在和/或浓度能够通过本领域中已知的多种方法 (参见,例如,美国专利7,851,188,该文献全文以引用方式并入本文)被 测定。例如,一种特异性的使用Shodex SH-1011柱和Shodex SHG保护柱 (二者均可购自Waters Corporation(Milford,Mass.))并配有折射率(RI) 检测的高效液相色谱(HPLC)方法。用0.01M H2SO4作为流动相,以 0.5mL/min流速和50℃的柱温实现色谱分离。在所使用的条件下异丁醇的 保留时间为46.6分钟。

另选地,气相色谱法(GC)是可用的。例如,特异性的GC方法利用 HP-INNOWax柱(30m×0.53mm内径,1μm膜厚度,Agilent Technologies (Wilmington,DE)),配有火焰离子化检测器(FID)。载气为氦气,流速 为4.5mL/分钟,在150℃用恒定顶压测量;注射分流比在200℃为1∶25; 炉温为45℃1分钟,以10℃/分钟从45℃升温至220℃,并在220℃保持5 分钟;并且FID检测在240℃、26mL/分钟的氦气补气条件下使用。异丁醇 的保留时间为4.5分钟。

DHMB的减少

DHMB在包含异丁醇生物合成途径的宿主细胞中的产生表明并不是所 述途径中的全部底物均被转化为所期望的产物。因此,收率降低了。此 外,DHMB能够对产物的生产具有抑制性效应。例如,DHMB能够降低生 物合成途径中的酶的活性或在发酵期间对酵母生长和/或生产能力具有其他 抑制效应。因此,本文所述的方法提供了在发酵期间减少DHMB的方法。 所述方法包括减少DHMB的产生的方法和从发酵组合物中除去DHMB的 方法两者。

减少DHMB的产生

在本文所述的一些实施例中,重组宿主细胞能够包含降低的或被消除 的使乙酰乳酸转化为DHMB的能力。宿主细胞使乙酰乳酸转化为DHMB 的能力能够被降低或消除,例如,通过对编码具有乙酰乳酸还原酶活性的 多肽的多核苷酸或基因的修饰或分裂,或对具有乙酰乳酸还原酶活性的多 肽的修饰或分裂。在其它实施例中,所述重组宿主细胞能够在编码具有乙 酰乳酸还原酶活性的多肽的内源性多核苷酸或基因中或在具有乙酰乳酸还 原酶活性的内源性多肽中包含缺失、突变、和/或取代。此类修饰、分裂、 缺失、突变、和/或取代能够导致乙酰乳酸还原酶活性被降低、基本上被消 除、或被消除。在本发明的一些实施例中,所述生物合成途径的产物以与 相同的产物在不包含降低的或被消除的使乙酰乳酸转化为DHMB的能力的 重组宿主细胞中的生产相比更高的收率或量被生产。

因此,所述产物可以为包含异丁醇的组合物,所述组合物基本上不含 DHMB或不含DHMB。在一些实施例中,包含丁醇的组合物包含不超过约 5mM、约4mM、约3mM、约2mM、约1mM、约0.5mM、约0.4mM、约 0.3mM的DHMB、或约0.2mM的DHMB。

在本文所公开的具有对乙酰乳酸还原酶活性的所述修饰的重组宿主细 胞中,涉及乙酰乳酸至不是DHMB的底物的转化的生物合成途径的任何产 物能够以更高的效果被生产。此类产物包括但不限于丁醇,例如异丁醇、 2-丁醇、和BDO,以及支链氨基酸。

在一些实施例中,所述宿主细胞在编码具有乙酰乳酸还原酶活性的多 肽的至少一种内源性多核苷酸中,包含至少一个缺失、突变、和/或取代。 在一些实施例中,所述宿主细胞在编码具有乙酰乳酸还原酶活性的多肽的 至少两种内源性多核苷酸中的每一种中,包含至少一个缺失、突变、和/或 取代。

在一些实施例中,具有乙酰乳酸还原酶活性的多肽能够催化乙酰乳酸 至DHMB的转化。在一些实施例中,具有乙酰乳酸还原酶活性的多肽能够 催化乙酰乳酸至2S,3S-DHMB(快DHMB)和/或2S,3R-DHMB(慢 DHMB)的还原。

表4:在酿酒酵母(Saccharomyces cerevisiae)中具有乙酰乳酸还原酶活性的多肽和多核苷酸

在一些实施例中,乙酰乳酸至DHMB的转化在重组宿主细胞中是降低 的、基本上被消除的、或被消除的。在一些实施例中,具有乙酰乳酸还原 酶活性的多肽选自:YMR226C、YER081W、YIL074C、YBR006W、 YPL275W、YOL059W、YIR036C、YPL061W、YPL088W、YCR105W、 YOR375C、和YDR541C。在一些实施例中,具有乙酰乳酸还原酶活性的多 肽是包含表4中所列的序列或具有与表4中所列的多肽序列至少约70%、 至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、或至 少约99%的同一性的序列的多肽。在一些实施例中,具有乙酰乳酸还原酶 活性的多肽是由表4中所列的多核苷酸序列或具有与表4中所列的多核苷 酸序列至少约70%、至少约75%、至少约80%、至少约85%、至少约 90%、至少约95%、或至少约99%的同一性的序列编码的多肽。

表5:示例性YMR226C酵母同系物

在一些实施例中,具有乙酰乳酸还原酶活性的多肽是YMR226C或 YMR226C的同系物。因此,在一些实施例中,具有乙酰乳酸还原酶活性的 多肽是包含表5中所列的序列或具有与表5中所列的多肽序列至少约 70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约 95%、或至少约99%的同一性的序列的多肽。在一些实施例中,具有乙酰 乳酸还原酶活性的多肽是由表5中所列的多核苷酸序列或具有与表5中所 列的多核苷酸序列至少约70%、至少约75%、至少约80%、至少约85%、 至少约90%、至少约95%、或至少约99%的同一性的序列编码的多肽。

能够使乙酰乳酸转化为DHMB的乙酰乳酸还原酶能够被鉴定,例如, 通过针对乙酰乳酸消耗的变化、DHMB生产的变化、DHIV生产的变化、 或其他下游产物(例如,丁醇)生产的变化筛选基因改变的酵母。

鉴定参与DHMB生产的基因的一种途径包括测量由酵母敲除文库中的 各种酵母菌株产生的DHMB的量。敲除文库是可用的,例如,Open (Thermo Fisher Scientific,Waltham,MA的一个部门)。在该 方法中,DHMB生产的降低指示被敲除的基因起着提高DHMB生产的作 用,而DHMB生产的升高指示被敲除的基因起着降低DHMB生产的作 用。

敲除(“KO”)文库能够被用于针对在DHMB合成中的参与鉴定候 选基因的两种方式包括:(1)DHMB和DHIV在生长期间中从内源性底物 (乙酰乳酸和NADPH或NADH)在培养物内的积累能够在来自培养物的 样品中被分析。这些样品能够被置于热(80-100℃)水浴中10-20分钟,或 被稀释在溶液中,例如将杀死细胞并使其通透化的2%甲酸。在任何处理之 后,小分子将在离心(5分钟,1100×g)后存在于上清液中。能够将对照 菌株(例如BY4743)的DHMB/DHIV比率与不同的KO衍生物的进行比 较,在具有特别低的DHMB/DHIV比率的任何菌株中缺失的基因能够编码 乙酰乳酸还原酶(ALR)。(2)DHMB和/或DHIV在体外从外源底物(乙 酰乳酸和NADH和/或NADPH)形成的速率能够在按时间取自被透化的细 胞的悬浮液并以上文所述方式之一被灭活的样品中被测量。由于用于 DHMB和DHIV合成的底物是相同的,这使得能够测量样品中ALR和 KARI活性的相对水平。

鉴定参与DHMB生产的基因的另一种途径包括测量由酵母过表达文库 中的各种酵母菌株产生的DHMB的量。过表达文库是可用的,例如,Open (Thermo Fisher Scientific,Waltham,MA的一个部门)。在该 方法中,DHMB生产的降低指示被过表达的基因起着降低DHMB生产的作 用,而DHMB生产的升高指示被过表达的基因起着提高DHMB生产的作 用。

鉴定参与DHMB生产的基因的另一种途径是对产生DHMB的酵母菌 株进行生物化学分析。例如,产生DHMB的细胞能够被分裂。该分裂能够 在低pH和低温下进行。细胞裂解物能够被分离至级分中,例如,通过添加 硫酸铵或本领域的技术人员已知的其他技术,并且所得的级分能够针对酶 活性被测定。例如,所述级分能够针对使乙酰乳酸转化为DHMB的能力被 测定。具有酶活性的级分能够通过本领域中已知的用于纯化和浓缩酶的方 法(例如,渗析和色谱分离)被处理。当达到足够的纯度和浓度时,酶能 够被测序,并且编码能够使乙酰乳酸转化为DHMB的乙酰乳酸还原酶的相 应基因能够被鉴定。

此外,由于乙酰乳酸至DHMB的还原在酵母中发生,而不以相同的程 度在大肠杆菌(E.coli)中发生,在酵母中表达而不在大肠杆菌中表达的乙 酰乳酸还原酶能够被选择用于筛选。所选择的酶能够在酵母或其他蛋白质 表达系统中被表达,并针对使乙酰乳酸转化为DHMB的能力被筛选。

能够催化乙酰乳酸至DHMB的转化的酶能够通过对乙酰乳酸水平的测 定、对DHMB水平的测定、对DHIV水平的测定、或对DHIV至丁醇的转 化中的任何下游产物(包括异丁醇)的测定而被筛选。

DHMB能够使用本领域的技术人员已知的任何方法被测量。例如, DHMB能够通过本领域的技术人员已知的方法或本文提供的实例中所述的 技术被分离和定量。例如,DHMB能够使用液相色谱-质谱法、液相色谱- 核磁共振(NMR)法、薄层色谱法、和/或带有UV/Vis检测的HPLC被分 离和定量。

在实施例中,本文所公开的所选择的乙酰乳酸还原酶多核苷酸、基因 和/或多肽能够被修饰或分裂。许多合适的方法是本领域的普通技术人员已 知的,包括针对乙醛脱氢酶(上文)所描述的那些。

在本文所公开的重组宿主细胞中用以降低或消除乙酰乳酸还原酶活性 的对乙酰乳酸还原酶的修饰能够使用本领域已知的方法来确认。例如,能 够利用PCR筛选来测定编码乙酰乳酸还原酶的多核苷酸序列的存在或不存 在。乙酰乳酸还原酶活性的降低也能够基于乙酰乳酸至DHMB的转化的减 少被测定。乙酰乳酸还原酶活性的降低还能够基于DHMB的生产的减少被 测定。乙酰乳酸还原酶活性的降低还能够基于丁醇的生产的升高被测定。

因此,在一些实施例中,能够生产丁醇的酵母产生不超过约5mM、约 4mM、约3mM、约2mM、约1mM、约0.9mM、约0.8mM.、约0.7mM、 约0.6mM、约0.5mM、约0.4mM或约0.3mM的DHMB。在一些实施例 中,生产丁醇的酵母产生不超过约5mM、约4mM、约3mM、约2mM、约 1mM、约0.9mM、约0.8mM.、约0.7mM、约0.6mM、约0.5mM、约 0.4mM或约0.3mM的DHMB。在一些实施例中,生产丁醇的酵母产生不超 过约0.2mM或0.2mM的DHMB。

在一些实施例中,当在发酵条件下被培养至少约50小时时,能够生产 丁醇的酵母产生不超过约10mM的DHMB。在一些实施例中,当在发酵条 件下被培养至少约20小时、至少约25小时、至少约30小时、至少约35小 时、至少约40小时、至少约45小时、或至少约50小时时,能够生产丁醇 的酵母产生不超过约5mM的DHMB。在一些实施例中,当在发酵条件下 被培养至少约5小时、至少约10小时、至少约15小时、至少约20小时、 至少约25小时、至少约30小时、至少约35小时、至少约40小时、至少约 45小时、或至少约50小时时,能够生产丁醇的酵母产生不超过约3mM的 DHMB。在一些实施例中,当在发酵条件下被培养至少约1小时、至少约5 小时、至少约10小时、至少约15小时、至少约20小时、至少约25小时、 至少约30小时、至少约35小时、至少约40小时、至少约45小时、或至少 约50小时时,能够生产丁醇的酵母产生不超过约1mM的DHMB。在一些 实施例中,当在发酵条件下被培养至少约1小时、至少约5小时、至少约 10小时、至少约15小时、至少约20小时、至少约25小时、至少约30小 时、至少约35小时、至少约40小时、至少约45小时、或至少约50小时 时,能够生产丁醇的酵母产生不超过约0.5mM的DHMB。

在一些实施例中,当在发酵条件下被培养相同时间长度时,在编码乙 酰乳酸还原酶的内源性多核苷酸中包含至少一个缺失、突变、和/或取代的 酵母产生不超过约0.5倍、约0.4倍、约0.3倍、约0.2倍、约0.1倍、约 0.05倍的量的DHMB,所述DHMB是由包含编码乙酰乳酸还原酶的内源性 多核苷酸的酵母所产生的。

在一些实施例中,能够生产丁醇的酵母产生至少约5mM、至少约 6mM、至少约7mM、至少约8mM、至少约9mM、或至少约10mM的量的 DHIV。

在一些实施例中,能够生产丁醇的酵母产生的DHIV的量至少大约为 所产生的DHMB的量。在一些实施例中,能够生产丁醇的酵母产生的 DHIV的量是所产生的DHMB的量的至少约两倍、约三倍、约五倍、约十 倍、约15倍、约20倍、约25倍、约30倍、约35倍、约40倍、约45 倍、或约50倍。

在一些实施例中,能够生产丁醇的酵母以与DHMB产生的速率至少约 相等的速率产生DHIV。在一些实施例中,能够生产丁醇的酵母以DHMB 产生的速率的至少约两倍、约三倍、约五倍、约十倍、约15倍、约20 倍、约25倍、约30倍、约35倍、约40倍、约45倍、或约50倍的速率产 生DHIV。

在一些实施例中,能够生产丁醇的酵母每摩尔消耗的葡萄糖产生小于 0.010摩尔的DHMB。在一些实施例中,酵母每摩尔消耗的葡萄糖产生小于 约0.009、小于约0.008、小于约0.007、小于约0.006、或小于约0.005摩尔 的DHMB。在一些实施例中,酵母每摩尔消耗的葡萄糖产生小于约0.004、 小于约0.003、小于约0.002、或小于约0.001摩尔的DHMB。

在一些实施例中,乙酰乳酸还原酶活性被化学手段抑制。例如,乙酰 乳酸还原酶能够使用其他已知的底物而被抑制,例如Fujisawa等人所列的 那些,包括L-丝氨酸、D-丝氨酸、2-甲基-DL-丝氨酸、D-苏氨酸、L-别苏 氨酸、L-3-羟基异丁酸、D-3-羟基异丁酸、3-羟基丙酸、L-3-羟基丁酸、和 D-3-羟基丁酸(Biochimica et Biophysica Acta 1645:89-94(2003),该文献全 文以引用方式并入本文)。

DHMB的去除

在本文所述的其它实施例中,DHMB的减少能够通过从发酵中去除 DHMB实现。如此,本文还描述了具有降低的DHMB浓度的发酵。DHMB 的去除能够导致,例如,更高纯度的产物、或需要更少的加工来达到所期 望的纯度的产物。因此,本文还提供了包含具有提高的纯度的生物合成途 径的产物(诸如乙醇或丁醇)的组合物。

DHMB能够在发酵过程中或发酵过程之后被去除,并且能够通过本领 域中已知的任何方法被去除。DHMB能够通过,例如被提取至有机相或反 应性提取而被去除。

在一些实施例中,发酵液体培养基包含小于约0.5mM的DHMB。在一 些实施例中,发酵液体培养基在约5小时、约10小时、约15小时、约20 小时、约25小时、约30小时、约35小时、约40小时、约45小时、或约 50小时的发酵之后包含小于约1.0mM的DHMB。在一些实施例中,发酵 液体培养基在约20小时、约25小时、约30小时、约35小时、约40小 时、约45小时、或约50小时的发酵之后包含小于约5.0mM的DHMB。

生物合成途径

虽然本文所示的KARI变体据信适用于异丁醇的生产,据设想本文所 公开的KARI可用于利用了由KARI活性催化的底物至产物的转化(诸如乙 酰乳酸至2,3-二羟基异戊酸或2-乙酰-2-羟基丁酸酯至2,3-二羟基-3-甲基戊 酸酯)的任何生物合成途径中。此类途径包括但不限于用于生产泛酸、缬 氨酸、亮氨酸、异亮氨酸或3,3-苹果酸二甲酯的途径。

某些合适的异丁醇生物合成途径公开于美国专利7,851,188和 7,993,889中,上述每一文献全文以引用方式并入本文。在图1中提供了所 公开的异丁醇生物合成途径的图表。如美国专利7,851,188中所述,示例性 异丁醇生物合成途径中的步骤包括下列转化:

-丙酮酸至乙酰乳酸(参见图1,其中途径的步骤a),例如由乙酰 乳酸合酶(ALS)催化,

-乙酰乳酸至2,3-二羟基异戊酸(参见图1,其中途径的步骤b),例 如由乙酰羟酸异构还原酶(KARI)催化;

-2,3-二羟基异戊酸至2-酮异戊酸(参见图1,其中途径的步骤c), 例如由乙酰羟酸脱水酶(也称为二羟酸脱水酶(DHAD))催化;

-2-酮异戊酸至异丁醛(参见图1,其中途径的步骤d),例如由支链 2-酮酸脱羧酶催化;以及

-异丁醛向异丁醇(参见图1,其中途径的步骤e),例如由支链醇 脱氢酶催化。

在另一个实施例中,异丁醇生物合成途径包括下列底物至产物的转 化:

-丙酮酸至乙酰乳酸的转化,其可被例如乙酰乳酸合酶催化;

-乙酰乳酸至2,3-二羟基异戊酸,其可被例如酮醇酸还原异构酶 (KARI)催化;

-2,3-二羟基异戊酸至α-酮异戊酸,其可被例如二羟基酸脱水酶催 化;

-α-酮异戊酸至缬氨酸的转化,其可被例如转氨酶或缬氨酸脱氢酶催 化;

-缬氨酸至异丁胺的转化,其可被例如缬氨酸脱羧酶催化;

-异丁胺至异丁醛的转化,其可被例如ω转氨酶催化;以及,

-异丁醛至异丁醇的转化,其可被例如支链醇脱氢酶催化。

在另一个实施例中,异丁醇生物合成途径包括下列底物至产物的转 化:

-丙酮酸至乙酰乳酸的转化,其可被例如乙酰乳酸合酶催化;

-乙酰乳酸至2,3-二羟基异戊酸的转化,其可被例如乙酰羟酸还原异 构酶催化;

-2,3-二羟基异戊酸至α-酮异戊酸的转化,其可被例如乙酰羟酸脱水 酶催化;

-α-酮异戊酸至异丁酰-CoA的转化,其可被例如支链酮酸脱氢酶催 化;

-异丁酰-CoA至异丁醛的转化,其可被例如乙酰化乙醛脱氢酶催 化;以及,

-异丁醛至异丁醇的转化,其可被例如支链醇脱氢酶催化。

在另一个实施例中,异丁醇生物合成途径包括如图1中步骤k、g、和 e所示的底物至产物的转化。

在另一个实施例中,包括由KARI催化的底物至产物转化的途径是包 括下列底物至产物的转化的泛酸生物合成途径:

丙酮酸至乙酰乳酸,其可被例如乙酰乳酸合酶催化;

-乙酰乳酸至2,3-二羟基异戊酸,其可被例如酮醇酸还原异构酶 (KARI)催化;

-2,3-二羟基异戊酸至α-酮异戊酸,其可被例如二羟酸脱水酶 (DHAD)催化;

-α-酮异戊酸至2-脱氢泛酸,其可被例如3-甲基-2-氧丁酸羟甲基转移 酶(panB;其可被分类为EC 2.1.2.11)催化;

-2-脱氢泛酸至(R)-泛酸,其可被例如2-脱氢泛酸2-还原酶(panE; 其可被分类为EC 1.1.1.169)催化

-(R)-泛酸至(R)-泛酸酯,其可被例如泛酸-β-丙氨酸连接酶(panC; 其可被分类为EC 6.3.2.1)催化;

在另一个实施例中,包括由KARI催化的底物至产物转化的途径是包 括下列底物至产物的转化的缬氨酸生物合成途径:

丙酮酸至乙酰乳酸,其可被例如乙酰乳酸合酶催化;

-乙酰乳酸至2,3-二羟基异戊酸,其可被例如酮醇酸还原异构酶 (KARI)催化;

-2,3-二羟基异戊酸至α-酮异戊酸,其可被例如二羟酸脱水酶 (DHAD)催化;

-α-酮异戊酸至缬氨酸,其可被例如支链氨基转移酶(ilvE(BAT); 其可被分类为EC 2.6.1.42)催化。

在另一个实施例中,包括由KARI催化的底物至产物转化的途径是包 括下列底物至产物的转化的异亮氨酸生物合成途径:

-丙酮酸和α-酮丁酸至2-乙酰-2-羟基丁酸酯,其可被例如乙酰乳酸合 酶催化;

-2-乙酰-2-羟基丁酸酯至2,3-二羟基-3-甲基戊酸酯,其可被例如 KARI催化;

-2,3-二羟基-3-甲基戊酸酯至3-甲基-2-氧代-戊酸酯,其可被例如 DHAD催化;

-3-甲基-2-氧代-戊酸酯至异亮氨酸,其可被例如支链氨基转移酶 (ilvE(BAT);其可被分类为EC 2.6.1.42)催化。

在另一个实施例中,包括由KARI催化的底物至产物转化的途径是包 括下列底物至产物的转化的亮氨酸生物合成途径:

-丙酮酸至乙酰乳酸,其可被例如乙酰乳酸合酶催化;

-乙酰乳酸至2,3-二羟基异戊酸,其可被例如酮醇酸还原异构酶 (KARI)催化;

-2,3-二羟基异戊酸至α-酮异戊酸,其可被例如二羟酸脱水酶 (DHAD)催化;

-α-酮异戊酸至2-异丙基苹果酸,其可被例如2-异丙基苹果酸合酶 (leuA,其可被分类为EC 2.3.3.13)催化;

-2-异丙基苹果酸至2-马来酸异丙酯,其可被例如3-异丙基苹果酸脱 水酶(leu1;其可被分类为EC 4.2.1.33)催化;

-2-马来酸异丙酯至3-异丙基苹果酸,其可被例如3-异丙基苹果酸脱 水酶(leu1;其可被分类为EC 4.2.1.33)催化;

-3-异丙基苹果酸至2-异丙基-3-氧代琥珀酸酯,其可被例如3-异丙基 苹果酸脱氢酶(leuB;其可被分类为EC 1.1.1.85)催化;

-2-异丙基-3-氧代琥珀酸酯至4-甲基-2-氧代戊酸酯(自发反应);以 及

-4-甲基-2-氧代戊酸酯至亮氨酸,其可被例如支链氨基转移酶(ilvE (BAT);其可被分类为EC 2.6.1.42)催化

在另一个实施例中,包括由KARI催化的底物至产物转化的途径是包 括下列底物至产物的转化的3,3-苹果酸二甲酯生物合成途径:

-丙酮酸至乙酰乳酸,其可被例如乙酰乳酸合酶催化;

-乙酰乳酸至2,3-二羟基异戊酸,其可被例如酮醇酸还原异构酶 (KARI)催化;

-2,3-二羟基异戊酸至α-酮异戊酸,其可被例如二羟酸脱水酶 (DHAD)催化;

-α-酮异戊酸至(R)-3,3苹果酸二甲酯,其可被例如苹果酸二甲酯脱氢 酶(DMMD;其可被分类为1.1.1.84)催化。

能够用于某些上述的底物至产物转化以及用于另外的异丁醇途径的那 些的基因和多肽是本领域中可用的。例如,描述于美国专利申请公布 2007/0092957和PCT公布WO 2011/019894中,上述文献均全文以引用方 式并入本文。全文以引用方式并入本文的美国专利申请公布2011/019894、 2007/0092957、2010/0081154描述了二羟酸脱水酶,包括来自乳酸乳球菌 (Lactococcus lactis)和变异链球菌(Streptococcus mutans)的那些。酮异 戊酸脱羧酶包括来源于乳酸乳球菌(Lactococcus lactis)、溶酪大球菌 (Macrococcus caseolyticus)(SEQ ID NO:171)和格氏李斯特菌(Listeria  grayi)(SEQ ID NO:170)的那些。美国专利申请公布2009/0269823和美 国申请公布2011/0269199(均全文以引用方式并入)描述了醇脱氢酶,包 括利用NADH作为辅因子的那些。醇脱氢酶包括来自木糖氧化无色杆菌 (Achromobacter xylosoxidans)的SadB。另外的醇脱氢酶包括马肝脏ADH 和印度拜叶林克氏菌(Beijerinkia indica)ADH。醇脱氢酶包括利用NADH 作为辅因子的那些。在一个实施例中,异丁醇生物合成途径包括a)酮醇酸 还原异构酶,其具有针对NADH的小于约300μM、小于约100μM、小于约 50μM、小于约20μM或小于约10μM的KM;b)醇脱氢酶,其利用NADH 作为辅因子;或c)a)和b)两者。

WO 2011/019894和美国专利申请公布2011/019894、2007/0092957、 2010/0081154(上述文献全文以引用方式并入本文)描述了合适的二羟酸脱 水酶。提高DHAD活性的方法描述于,例如,美国专利申请公布 2010/0081173和2012/0064561A1中,上述文献全文以引用方式并入本文。

能够使用的另外的基因能被本领域技术人员通过生物信息学或使用本 领域所熟知的方法鉴定。

另外在美国专利申请公布US 2007/0092957 A1(该文献全文以引用方 式并入本文)中描述了用于利用所公开的异丁醇生物合成途径的异丁醇生 产的嵌合基因的构建和细菌与酵母的基因工程改造。此类构建和工程化改 造方法能够被本领域的普通技术人员容易地用于构建包括由KARI活性催 化的底物至产物转化的本文所公开的和/或本领域已知的其他途径。

合适的酮醇酸还原异构酶(KARI)描述于本文其他地方。在一些实施 例中,所述KARI酶具有至少约0.1微摩尔/min/mg、至少约0.2微摩尔 /min/mg、至少约0.3微摩尔/min/mg、至少约0.4微摩尔/min/mg、至少约 0.5微摩尔/min/mg、至少约0.6微摩尔/min/mg、至少约0.7微摩尔 /min/mg、至少约0.8微摩尔/min/mg、至少约0.9微摩尔/min/mg、至少约 1.0微摩尔/min/mg、或至少约1.1微摩尔/min/mg的特异性活性。催化乙酰 乳酸至2,3-二羟基异戊酸的底物至产物转化的合适的多肽包括具有针对 NADH的小于约300μM、小于约100μM、小于约50μM、小于约25μM、 或小于约10μM的KM的那些。

修饰

丙酮酸脱羧酶基因的功能性缺失已被用于提高用于生物合成产物途径 中的丙酮酸的可用性。例如,美国专利申请公布US 2007/0031950 A1(该 文献全文以引用方式并入本文)公开了带有一种或多种丙酮酸脱羧酶基因 的分裂并且表达D-乳酸脱氢酶基因的酵母菌株,其被用于生产D-乳酸。美 国专利申请公布U.S.2005/0059136 A1(该文献全文以引用方式并入本文) 公开了不具有丙酮酸脱羧酶活性的葡萄糖耐受的两种碳源不依赖的(GCSI) 酵母菌株,它们能够具有外源性乳酸脱氢酶基因。Nevoigt和Stahl(Yeast 12:1331-1337(1996))描述了减少的丙酮酸脱羧酶和增多的NAD-依赖 的甘油3-磷酸脱氢酶在酿酒酵母中对甘油收率的影响。美国专利申请公布 2009/0305363(该文献全文以引用方式并入本文)公开了通过工程化酵母以 表达定位于细胞溶胶的乙酰乳酸合酶并且基本消除丙酮酸脱羧酶活性而提 高丙酮酸至乙酰乳酸的转化。

在本发明的实施例中,本文所公开的重组宿主细胞能够包含在编码具 有丙酮酸脱羧酶(PDC)活性的多肽的内源性多核苷酸中的修饰,或在具 有PDC活性的内源性多肽中的修饰。在实施例中,本文所公开的重组宿主 细胞能够具有编码PDC的多核苷酸、基因和/或多肽的修饰或分裂。在实施 例中,重组宿主细胞在编码具有PDC活性的多肽的内源性多核苷酸或基因 中,或在具有PDC活性的内源性多肽中,包含缺失、突变、和/或取代。此 类修饰、分裂、缺失、突变、和/或替换能够导致PDC活性被降低或消除, 导致(例如)PDC基因敲除(PDC-KO)表型。

在本发明的实施例中,本文所公开的重组宿主细胞的内源性丙酮酸脱 羧酶活性将丙酮酸转化为乙醛,乙醛能够随后被转化为乙醇或通过乙酸转 化为乙酰-CoA。在其它实施例中,重组宿主细胞是包含一个编码丙酮酸脱 羧酶的基因的乳酸克鲁维酵母(Kluyveromyces lactis)、包含一个编码丙酮 酸脱羧酶的基因的光滑假丝酵母(Candida glabrata)、或包含一个编码丙 酮酸脱羧酶的基因的粟酒裂殖酵母(Schizosaccharomyces pombe)。

在其它实施例中,所述重组宿主细胞是包含由PDC1、PDC5和PDC6 基因编码的丙酮酸脱羧酶的三种同功酶以及丙酮酸脱羧酶调节基因PDC2 的酿酒酵母(Saccharomyces cerevisiae)。在酿酒酵母中的非限制性示例 中,所述PDC1和PDC5基因,或所述PDC1、PDC5和PDC6基因是被分 裂的。在酿酒酵母(S.cerevisiae)中的另一个非限制性示例中,丙酮酸脱 羧酶活性能够通过分裂PDC2调节基因而被降低。在酿酒酵母(S. cerevisiae)的另一个非限制性示例中,编码丙酮酸脱羧酶蛋白质的多核苷 酸或基因可以为被分裂的,所述蛋白质诸如与PDC1、PDC2、PDC5、和/ 或PDC6具有约70%至约75%、约75%至约80%、约80%至约85%、约 85%至约90%、约90%至约95%、约96%、约97%、约98%、或约99%的 序列同一性的那些。

在实施例中,具有PDC活性的多肽或编码具有PDC活性的多核苷酸 或基因对应于酶学委员会编号EC 4.1.1.1。在其他实施例中,本文所公开的 重组宿主细胞的PDC基因在所使用的发酵条件下不是活性的,因此此类基 因将不需要被修饰或灭活。

具有由于丙酮酸脱羧酶编码基因的分裂导致的降低的丙酮酸脱羧酶活 性的重组宿主细胞的例子已被报道,诸如Flikweert等人(Yeast(1996) 12:247-257)报道的糖酵母属(Saccharomyces)、Bianchi等人(Mol. Microbiol.(1996)19(1):27-36)报道的克鲁维酵母属 (Kluyveromyces)、以及Hohmann(Mol.Gen.Genet.(1993)241:657-666) 报道的调节基因的分裂。糖酵母(Saccharomyces)菌株不具有丙酮酸脱羧 酶活性,它们可得自ATCC,具有Accession#200027和#200028。

能够在本文所公开的重组宿主细胞中作为修饰或灭活的靶标的PDC多 核苷酸、基因、和/或多肽的例子包括但不限于下列的表6中的那些。

表6:丙酮酸脱羧酶靶基因编码区和蛋白质

能够在本文所公开的重组宿主细胞中作为修饰或灭活的靶标的PDC多 核苷酸、基因和多肽的其他示例包括但不限于与表6的序列中任何一个具 有至少约70%至约75%、约75%至约80%、约80%至约85%、约85%至约 90%、约90%至约95%、约96%、约97%、约98%、或约99%序列同一性 的PDC多核苷酸、基因、和/或多肽,其中此类多核苷酸或基因调控元件或 此类多肽具有PDC活性。能够在本文所公开的重组宿主细胞中作为修饰或 灭活的靶标的PDC多核苷酸、基因和多肽的另外的其他示例包括但不限于 表6的序列中的任何一个的活性变体、片段或衍生物,其中此类多核苷酸 或基因调控元件或此类多肽具有PDC活性。

在实施例中,编码本文所公开的或本领域已知的PDC序列的多核苷 酸、基因、和/或多肽能够被修饰,如上文就乙醛脱氢酶所公开的。在其它 实施例中,编码PDC的多核苷酸、基因、和/或多肽能够被用于鉴定另外的 PDC多核苷酸、基因、和/或多肽序列,或用于鉴定其他细胞中的PDC同 系物,如上文就乙酰乳酸脱氢酶所公开的。此类PDC编码序列能够在,例 如,文献中、和/或技术人员熟知的生物信息学数据库中被鉴定。例如,利 用生物信息学在其他的细胞类型中对PDC编码序列的鉴定,能够通过用已 知的PDC编码DNA和多肽序列(诸如本文所提供的那些)对可公开获得 的数据库进行BLAST(如上文所述)检索而实现。同一性基于Clustal W 比对方法,所述方法采用GAP PENALTY=10、GAP LENGTH  PENALTY=0.1的默认参数和Gonnet 250系列的蛋白质权重矩阵。

在本文所公开的重组宿主细胞中用以降低或消除PDC活性的对PDC 的修饰能够使用本领域已知的方法来确认。例如,通过使用采用该基因序 列外部的引物的PCR筛选、或通过使用针对丙酮酸脱羧酶基因序列设计的 探针的Southern印迹,能够确认特定丙酮酸脱羧酶的分裂。另选地,能够 利用诸如气相色谱法或HPLC的分析方法来针对乙醛和/或乙醇的降低的或 被消除的生产来筛选菌株。

己糖激酶2基因的功能性缺失已被用于减少葡萄糖阻遏作用和提高用 于生物合成途径的丙酮酸的可用性。例如,国际公布WO 2000/061722A1 (该文献全文以引用方式并入本文)公开了通过有氧地培养具有一个或多 个功能性缺失的己糖激酶2基因或类似物的酵母来生产酵母生物质。此 外,Rossell等人(Yeast Research 8:155-164(2008))发现带有己糖激酶 2基因的缺失的酿酒酵母(Saccharomyces cerevisiae)表现出发酵能力(以 在糖过量且厌氧的条件下二氧化碳生产的特定比率定义)75%的降低。在 经受饥饿后,其发酵能力与不含己糖激酶2基因缺失的菌株的能力相似。 Diderich等人(Applied and Environmental Microbiology 67:1587-1593 (2001))发现带有己糖激酶2基因的缺失的酿酒酵母具有较低的丙酮酸 脱羧酶活性。

在实施例中,本文所公开的重组宿主细胞能够包含在编码具有己糖激 酶2活性的多肽的内源性多核苷酸中的修饰,和/或在具有己糖激酶2活性 的多肽中的修饰。在实施例中,本文所公开的重组宿主细胞能够具有编码 己糖激酶2的多核苷酸、基因和或多肽的修饰或分裂。在实施例中,重组 宿主细胞在编码具有己糖激酶2活性的多肽的内源性多核苷酸或基因中, 或在具有己糖激酶2活性的内源性多肽中,包含缺失、突变、和/或取代。 此类修饰、分裂、缺失、突变、和/或取代能够导致降低的或消除的己糖激 酶2活性,导致例如,己糖激酶2敲除(HXK2-KO)表型。在实施例中, 所述宿主细胞包含如美国专利申请公布2011/0124060A1或2012/0015416 A1中所述的修饰,上述文献全文以引用方式并入本文。

在实施例中,具有己糖激酶2活性的多肽能够催化己糖至己糖-6-磷酸 的转化、和/或能够催化D-葡萄糖至D-葡萄糖6-磷酸、D-果糖至D-果糖6- 磷酸、和/或D-甘露糖至D-甘露糖6-磷酸的转化。在其它实施例中,具有 己糖激酶2活性的多核苷酸、基因或多肽能够对应于酶学委员会编号EC 2.7.1.1。

在本发明的实施例中,重组宿主细胞可以为酿酒酵母(S. cerevisiae),并且具有己糖激酶2活性的多核苷酸、基因或多肽可以为 HXK2。在其它实施例中,重组宿主细胞可以为乳酸克鲁维酵母(K. lactis),并且具有己糖激酶2活性的多核苷酸、基因或多肽可以为 RAG5。在其它实施例中,重组宿主细胞可以为多形汉逊酵母(H. polymorpha),并且具有己糖激酶2活性的多核苷酸、基因或多肽可以为 HPGLK1。在其它实施例中,重组宿主细胞可以为粟酒裂殖酵母(S. pombe),并且具有己糖激酶2活性的多核苷酸、基因或多肽可以为 HXK2。

能够在本文所公开的重组宿主细胞中作为修饰或灭活的靶标的己糖激 酶2多核苷酸、基因、和或多肽的例子包括但不限于下列的表7中的那 些。

表7:己糖激酶2靶基因编码区和蛋白质

能够在本文所公开的重组宿主细胞中作为修饰或灭活的靶标的己糖激 酶2多核苷酸、基因和多肽的其他示例包括但不限于与表9的序列中的任 何一个具有至少约70%至约75%、约75%至约80%、约80%至约85%、约 85%至约90%、约90%至约95%、约96%、约97%、约98%、或约99%序 列同一性的己糖激酶2多核苷酸、基因、和/或多肽,其中此类多核苷酸或 基因编码或此类多肽具有己糖激酶2活性。能够在本文所公开的重组宿主 细胞中作为修饰或灭活的靶标的己糖激酶2多核苷酸、基因和多肽的另外 的其他示例包括但不限于表7的序列中的任何一个的活性变体、片段或衍 生物,其中此类多核苷酸或基因编码或此类多肽具有己糖激酶2活性。

在实施例中,编码本文所公开的或本领域已知的己糖激酶2序列的多 核苷酸、基因、和/或多肽能够被修饰或分裂,如上文就乙醛脱氢酶所公开 的。在其它实施例中,编码己糖激酶2的多核苷酸、基因和/或多肽能够被 用于鉴定另外的己糖激酶2多核苷酸、基因和/或多肽序列,或用于鉴定其 他细胞中的己糖激酶2同系物,如上文就乙醛脱氢酶所公开的。此类己糖 激酶2编码序列能够在,例如,文献中和/或技术人员熟知的生物信息学数 据库中被鉴定。例如,利用生物信息学在其他的细胞类型中对己糖激酶2 编码序列的鉴定,能够通过用已知的己糖激酶2编码DNA和多肽序列(诸 如本文所提供的那些)对可公开获得的数据库进行BLAST(如上文所述) 检索而实现。同一性基于Clustal W比对方法,所述方法采用GAP  PENALTY=10、GAP LENGTH PENALTY=0.1的默认参数和Gonnet 250系 列的蛋白质权重矩阵。

在本文所公开的重组宿主细胞中用以降低或消除己糖激酶2活性的对 己糖激酶的修饰能够使用本领域已知的方法来确认。例如,能够通过利用 己糖激酶2基因外部的引物的PCR筛选、或通过使用针对己糖激酶2基因 序列设计的探针的Southern印迹,确认己糖激酶2的分裂。另选地,能够 在包含葡萄糖的培养基上针对提高的生物质收率检测推定的己糖激酶2敲 除菌株。

能够用于本文提供的细胞中的另外的修饰的示例包括降低甘油-3-磷酸 脱氢酶的活性和/或破坏编码具有丙酮酸脱羧酶活性的多肽的至少一个基因 或分裂编码控制丙酮酸脱羧酶基因表达的调控元件的至少一个基因的修 饰,如美国专利申请公布2009/0305363(全文以引用方式并入本文)所 述,以及提供了通过Entner-Doudoroff途径的增加的碳流量或降低等价平衡 的修饰,如美国专利申请公布2010/0120105(全文以引用方式并入本文) 所述。其他修饰包括整合至少一种多核苷酸,所述多核苷酸编码催化利用 丙酮酸的生物合成途径中一个步骤的多肽,如美国专利申请公布WO 2012/033832所述,该文献全文以引用方式并入本文。在其中该酵母生产的 宿主细胞是pdc-的具有降低葡萄糖抑制的效应的基因修饰,其描述于美国 专利申请公布US 2011/0124060,该文献全文以引用方式并入本文。

美国专利申请公布20120064561A1(该文献全文以引用方式并入本 文)公开了重组宿主细胞,所述重组宿主细胞包含(a)编码具有二羟酸脱水 酶活性的多肽的至少一种异源性多核苷酸;和(b)(i)在编码影响Fe-S 簇生物合成的多肽的内源性基因中的至少一个缺失、突变、和/或取代;和/ 或(ii)编码影响Fe-S簇生物合成的多肽的至少一种异源性多核苷酸。在 实施例中,所述影响Fe-S簇生物合成的多肽是由AFT1、AFT2、FRA2、 GRX3或CCC1编码的。在实施例中,所述影响Fe-S簇生物合成的多肽为 组成型突变体AFT1L99A、AFT1L102A、AFT1C291F、或AFT1C293F。

另外,宿主细胞可包含编码具有磷酸转酮酶活性的多肽的异源性多核 苷酸和/或编码具有磷酸转乙酰酶活性的多肽的异源性多核苷酸,诸如,例 如由SEQ ID NO:262和263编码的那些,以及如PCT专利申请公布WO 2011/159853和美国专利申请公布20120156735A1中所述,上述文献全文以 引用方式并入本文。

用于异丁醇生产的微生物宿主

用于异丁醇生产的微生物宿主能够选自细菌、蓝细菌、丝状真菌和酵 母。用于生产丁醇的微生物宿主将是异丁醇耐受性的,使得收率不受丁醇 毒性的限制。尽管已从产溶剂梭菌(solventogenic Clostridia)中分离了丁 醇耐受性突变体,但有关其他潜在可用的细菌菌株的丁醇耐受性方面的信 息几乎没有。关于细菌中醇耐受性的比较的大部分研究表明,丁醇的毒性 大于乙醇(de Cavalho等人,Microsc.Res.Tech.,64:215-22,2004)并且 (Kabelitz,等人,FEMS Microbiol.Lett.,220:223-227,2003,Tomas,等 人,J.Bacteriol.,186:2006-2018,2004)报导称丙酮丁醇梭菌(Clostridium  acetobutylicum)在发酵期间的1-丁醇收率能够受1-丁醇毒性限制。1-丁醇 对丙酮丁醇梭菌(Clostridium acetobutylicum)的主要影响是破坏膜功能 (Hermann等人,Appl.Environ.Microbiol.,50:1238-1243,1985)。

选择用于生产异丁醇的微生物宿主应该是异丁醇耐受性的,并应能将 碳水化合物转化为异丁醇。选择合适微生物宿主的标准包括如下:对异丁 醇的固有耐受性、对葡萄糖的高利用率、用于基因操纵的遗传工具的可用 性、以及生成稳定的染色体改变的能力。

具有异丁醇耐受性的合适宿主菌株能够通过基于菌株的固有耐受性进 行的筛选而被鉴定。微生物对异丁醇的固有耐受性可以通过测定在基本培 养基中生长时造成生长率50%抑制的异丁醇浓度(IC50)来测量。IC50值 可以利用本领域已知的方法来测定。例如,可让所关注的微生物在多种量 的异丁醇存在下生长,并且通过测量在600纳米(OD600)处的光密度来 监测生长速率。倍增时间可以从生长曲线的对数部分计算并用作生长速率 的量度。产生50%生长抑制的异丁醇的浓度可以从生长抑制百分比对异丁 醇浓度的图表来确定。在一个实施例中,所述宿主菌株具有大于约0.5%的 就异丁醇而言的IC50

用于异丁醇生产的微生物宿主还应以高速率利用葡萄糖。大多数微生 物能够代谢碳水化合物。然而,某些环境微生物不能高效代谢碳水化合 物,因此它们将不是合适的宿主。

从基因方面修饰宿主的能力对任何重组微生物的产生来说十分关键。 基因转移技术的模式可以是电穿孔、接合、转导或自然转化。可利用广泛 的宿主接合型质粒和药物抗性标记。基于可在宿主中起作用的抗生素抗性 标记的性质,针对该宿主微生物来定制克隆载体。

还必须操纵微生物宿主以通过缺失多种基因而使竞争碳流的途径失 活。这就需要转座子或染色体整合载体的可用性以引导失活。另外,生产 宿主应能经受化学诱变以使得能得到改善异丁醇固有耐受性的突变体。

基于上述标准,用于生产异丁醇的合适的微生物宿主包括但不限于: 梭菌属(Clostridium)、发酵单胞菌属(Zymomonas)、埃希氏菌属 (Escherichia)、沙门氏菌属(Salmonella)、红球菌属(Rhodococcus)、 假单胞菌属(Pseudomonas)、芽孢杆菌属(Bacillus)、弧菌属 (Vibrio)、乳杆菌属(Lactobacillus)、肠球菌属(Enterococcus)、产碱 杆菌属(Alcaligenes)、克雷伯氏菌属(Klebsiella)、类芽胞杆菌属 (Paenibacillus)、节杆菌属(Arthrobacter)、棒状杆菌属 (Corynebacterium)、短杆菌属(Brevibacterium)、毕赤酵母属 (Pichia)、假丝酵母属(Candida)、伊萨酵母属(Issatchenkia)、汉逊 酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、和糖酵母属 (Saccharomyces)的成员。合适的宿主包括:大肠杆菌(Escherichia  coli)、真养产碱杆菌(Alcaligenes eutrophus)、地衣芽孢杆菌(Bacillus  licheniformis)、浸麻类芽孢杆菌(Paenibacillus macerans)、红平红球菌 (Rhodococcus erythropolis)、恶臭假单胞菌(Pseudomonas putida)、植 物乳杆菌(Lactobacillus plantarum)、屎肠球菌(Enterococcus faecium)、 鹑鸡肠球菌(Enterococcus gallinarium)、粪肠球菌(Enterococcus  faecalis)、枯草芽孢杆菌(Bacillus subtilis)和酿酒酵母(Saccharomyces  cerevisiae)。在一些实施例中,所述宿主细胞是酿酒酵母。酿酒酵母是本 领域已知的并且可购自多种来源,包括但不限于美国典型培养物保藏中心 (American Type Culture Collection(Rockville,MD))、荷兰微生物菌种 保藏中心(Centraalbureau voor Schimmelcultures(CBS))真菌生物多样性 中心,LeSaffre,Gert Strand AB,Ferm Solutions,North American  Bioproducts,Martrex,和Lallemand。酿酒酵母(S.cerevisiae)包括但不限 于BY4741、CEN.PK 113-7D、Ethanol酵母、Ferm ProTM酵母、Bio- XR酵母、Gert Strand Prestige Batch Turbo alcohol酵母、Gert Strand  Pot Distillers酵母、Gert Strand Distillers Turbo酵母、FerMaxTM Green酵母、 FerMaxTM Gold酵母、酵母、BG-1、PE-2、CAT-1、CBS7959、 CBS7960和CBS7961。

生产宿主的构建

可以使用本领域熟知的技术来构建含有必需基因的重组微生物,所述 必需基因将编码用于将可发酵碳底物转化为丁醇的酶途径。如上所述,在 本发明中,编码本发明的异丁醇生物合成途径中的一个的酶的基因能够从 多种来源分离,所述酶例如乙酰乳酸合酶、乙酰羟酸还原异构酶、乙酰羟 酸脱水酶、支链α-酮酸脱羧酶、和支链醇脱氢酶。

从基因组中获得所需基因的方法是分子生物学领域中常用并且为人所 熟知的。例如,如果基因的序列已知,则可以通过限制性内切酶消化来产 生合适的基因组文库并且可以用与所需基因序列互补的探针来筛选。一旦 分离了序列之后,即可以用标准的引物引导的扩增方法诸如聚合酶链反应 (美国专利4,683,202)来扩增DNA,以获得适于使用合适载体转化的量的 DNA。用于优化密码子以在异源宿主细胞内表达的工具很容易得到。一些 密码子优化工具可基于宿主微生物的GC含量获得。

一旦鉴定并分离了相关途径的基因之后,即可将它们通过本领域中已 知的方法转化到合适的表达宿主内。用于转化多种宿主细胞的载体或盒是 常见的,并且可从以下公司商购获得:诸如(Madison, WI)、Invitrogen Corp.(Carlsbad,CA)、Stratagene(La Jolla,CA)和 New England Biolabs,Inc.(Beverly,MA)。通常,载体或盒包含指导相 关基因转录和翻译的序列、选择性标记和允许自主复制或染色体整合的序 列。合适的载体包含含有转录起始控制的基因5′区域和控制转录终止的 DNA片段3′区域。两种控制区域均可来源于与所转化的宿主细胞同源的基 因,尽管应当理解,此类控制区还能够来源于对被选择作为生产宿主的具 体物种而言非天然的基因。

可用于驱动相关途径编码区在所需宿主细胞中表达的起始控制区或启 动子有许多,并且为本领域技术人员所熟悉。事实上,任何能够驱动这些 遗传因子(包括在实例中使用的那些)的启动子均适用于本发明,包括但 不限于:CYC1、HIS3、GAL1、GAL10、ADH1、PGK、PHO5、GAPDH、 ADC1、TRP1、URA3、LEU2、ENO、TPI(可用于在糖酵母属 (Saccharomyces)中表达);AOX1(可用于在毕赤酵母属(Pichia)中表 达);和lac、ara、tet、trp、lPL、lPR、T7、tac、和trc(用于在大肠杆菌 (Escherichia coli)、产碱杆菌属(Alcaligenes)、和假单胞菌属 (Pseudomonas)中表达)以及amy、apr、npr启动子和用于在枯草芽孢杆 菌(Bacillus subtilis)、地衣芽孢杆菌(Bacillus licheniformis)、和浸麻类 芽孢杆菌(Paenibacillus macerans)中表达的多种噬菌体启动子。就酵母重 组宿主细胞而言,多种启动子能够被用于构建基因的表达盒,包括但不限 于下列适用于酵母中的组成型启动子:FBA1、TDH3(GPD)、ADH1、 ILV5和GPM1;和下列适用于在酵母中的诱导型启动子:GAL1、 GAL10、OLE1、和CUP1。其他酵母启动子包括杂合启动子UAS(PGK1)- FBA1p(SEQ ID NO:264)、UAS(PGK1)-ENO2p(SEQ ID NO: 265)、UAS(FBA1)-PDC1p(SEQ ID NO:266)、UAS(PGK1)- PDC1p(SEQ ID NO:267)、和UAS(PGK)-OLE1p(SEQ ID NO: 268)。

启动子、转录终止子、和编码区可被克隆进酵母2μ质粒并被转化到酵 母细胞中(Ludwig等人,Gene,132:33-40,1993;美国专利申请公布 20080261861A1)。

通过改变转录水平(诸如通过选择原生或人工启动子)可实现调节给 定宿主中基因表达量。此外,诸如使用启动子文库以实现所需的基因转录 水平的技术是本领域所熟知的。可使用本领域已知的技术生成此类文库, 例如,通过在基因盒前克隆随机cDNA片段(Goh等人(2002)AEM 99, 17025)、通过调节存在于在启动子内的调控序列(Ligr等人(2006) Genetics 172,2113)、或通过诱变已知启动子序列(Alper等人(2005) PNAS,12678;Nevoigt等人(2006)AEM72,5266)。

终止控制区也可来源于对宿主天然的各种基因。任选地,终止位点可 以是非必需的或可包括在内。

某些载体能够在广泛的宿主细菌中复制并可通过接合进行转移。可利 用完全并注解的序列pRK404和三个相关载体-pRK437、pRK442和pRK442 (H)。这些衍生物已被证明是在革兰氏阴性菌中进行基因操纵的有用工具 (Scott等人,Plasmid,50:74-79,2003)。广宿主范围的IncP4质粒 RSF1010的若干质粒衍生物也可获得,其具有在一系列革兰氏阴性菌中发 挥功能的启动子。质粒pAYC36和pAYC37具有连同多个克隆位点一起的 活性启动子,使得在革兰氏阴性菌中的异源性基因能够表达。

染色体基因置换工具也可广泛获得。例如,广宿主范围的复制子 pWV101的热敏性变体已被修饰,以构建可用于在一系列革兰氏阳性菌内 实现基因置换的质粒pVE6002(Maguin等人,J.Bacteriol.,174:5633-5638, 1992)。此外,体外转座体可得自商业来源(诸如),用以 在各种基因组中产生随机突变。

丁醇生物合成途径在多种微生物宿主中的表达更详细地描述于下文 中。

丁醇生物合成途径在大肠杆菌(E.coli)中的表达

可用于转化大肠杆菌(E.coli)的载体或试剂盒是常见的并且可以从上 文所列公司商购获得。例如,异丁醇生物合成途径的基因可从多种来源分 离、克隆到经修饰的pUC19载体中并转化进大肠杆菌(E.coli)NM522 中。

丁醇生物合成途径在红平红球菌(Rhodococcus erythropolis)中的表达

一系列大肠杆菌(E.coli)-红球菌(Rhodococcus)穿梭载体可用于在 红平红球菌(R.erythropolis)中表达,所述穿梭载体包括但不限于 pRhBR17和pDA71(Kostichka等人,Appl.Microbiol.Biotechnol.,62:61-68, 2003)。另外,一系列启动子可用于异源性基因在红平红球菌(R. erythropolis)中表达(Nakashima等人,Appl.Environ.Microbiol.,70:5557- 5568,2004和Tao等人,Appl.Microbiol.Biotechnol.,68:346-354,2005)。 红平红球菌(R.erythropolis)染色体基因中的靶向基因分裂可以利用Tao 等人(同上)和Brans等人(Appl.Environ.Microbiol.,66:2029-2036, 2000)所述的方法产生。

首先可以将如上文所述的产生异丁醇所需的异源性基因克隆至pDA71 或pRhBR71内,并转化进大肠杆菌(E.coli)中。然后,可以通过电穿孔 将载体转化进红平红球菌(R.erythropolis)中,如Kostichka等人(同上) 所述。所述重组体可在含有葡萄糖的合成培养基中生长,并随后可利用本 领域已知的方法来产生异丁醇。

丁醇生物合成途径在枯草芽孢杆菌(B.subtilis)中的表达

枯草芽孢杆菌中基因表达及突变产生的方法也是本领域所熟知的。例 如,异丁醇生物合成途径的基因可从多种来源被分离、克隆到经修饰的 pUC19载体中并转化进枯草芽孢杆菌(Bacillus subtilis)BEl010中。另 外,可将异丁醇生物合成途径的五个基因分离成两个操纵子用于表达。可 将该途径的三个基因(bubB、ilvD和kivD)整合进枯草芽孢杆菌(Bacillus  subtilis)BEl010的染色体中(Payne等人,J.Bacteriol.,173,2278-2282, 1991)。可将剩余的两个基因(ilvC和bdhB)克隆到表达载体中并转化进携 带整合的异丁醇基因的芽孢杆菌菌株中。

丁醇生物合成途径在地衣芽孢杆菌(B.licheniformis)中的表达

在枯草芽孢杆菌(B.subtilis)中复制的大多数质粒和穿梭载体可用于 通过原生质体转化或电穿孔来转化地衣芽孢杆菌(B.licheniformis)。异丁 醇的生产所需的基因能够被克隆进质粒pBE20或pBE60衍生物中 (Nagarajan等人,Gene,114:121-126,1992)。转化地衣芽孢杆菌(B. licheniformis)的方法是本领域已知的(Fleming等人,Appl.Environ. Microbiol.,61:3775-3780,1995)。所构建的用于在枯草芽孢杆菌(B. subtilis)中表达的质粒可以被转化进地衣芽孢杆菌(B.licheniformis)中以 产生可生产异丁醇的重组微生物宿主。

丁醇生物合成途径在浸麻类芽孢杆菌(Paenibacillus macerans)中的表

可按照上面关于在枯草芽孢杆菌(B.subtilis)中表达的描述来构建质 粒,并通过原生质体转化法将该质粒用于转化浸麻类芽孢杆菌 (Paenibacillus macerans),以产生可生产异丁醇的重组微生物宿主。

丁醇生物合成途径在真养产碱杆菌(罗尔斯通菌(Ralstonia))(Alcaligenes eutrophus)中的表达

用于在真养产碱杆菌(Alcaligenes eutrophus)中进行基因表达和产生 突变的方法是本领域内已知的(Taghavi等人,Appl.Environ.Microbiol.,60: 3585-3591,1994)。可以将用于异丁醇生物合成途径的基因克隆进上述任 何广宿主范围载体中的任何一个中,并通过电穿孔以生成生产异丁醇的重 组体。产碱杆菌属(Alcaligenes)中的聚羟基丁酸酯途径已被详细描述,多 种修饰真养产碱杆菌(Alcaligenes eutrophus)基因组的基因技术是已知 的,并且这些工具可以应用于工程化异丁醇生物合成途径。

丁醇生物合成途径在恶臭假单胞菌(Pseudomonas putida)中的表达

用于在恶臭假单胞菌(Pseudomonas putida)中表达基因的方法是本领 域中已知的(参见,例如,Ben-Bassat等人,美国专利6,586,229,该文献 以引用方式并入本文)。丁醇途径的基因能够被插入pPCU18中,并且这 种连接DNA能够被电穿孔进电感受态的恶臭假单胞菌(Pseudomonas  putida)DOT-T1C5aAR1细胞中,以生成生产异丁醇的重组体。

丁醇生物合成途径在酿酒酵母(Saccharomyces cerevisiae)中的表达

用于酿酒酵母(Saccharomyces cerevisiae)中基因表达的方法是本领域 已知的(例如,Methods in Enzymology,第194卷,Guide to Yeast Geneticsand Molecular and Cell Biology,Part A,2004,Christine Guthrie和Gerald  R.Fink,编辑,Elsevier Academic Press,San Diego,CA)。酵母中的基因表 达通常需要在受关注的基因前的启动子和转录终止子。多种酵母启动子, 包括本文的实例中所使用的那些,能够被用于构建用于编码异丁醇生物合 成途径的基因的表达盒,包括但不限于组成型启动子FBA、GPD、 ADH1、和GPM,以及诱导型启动子GAL1、GAL10、和CUP1。合适的转 录终止子包括但不限于FBAt、GPDt、GPMt、ERG10t、GAL1t、CYC1、 和ADH1。例如,合适的启动子、转录终止子、和异丁醇生物合成途径的 基因能够被克隆进大肠杆菌(E.coli)-酵母穿梭载体,并转化进酵母细 胞,如美国专利申请公布20100129886中所述。这些载体允许菌株在大肠 杆菌和酵母菌株中繁殖。通常,载体包含选择性标记和在所期望的宿主中 允许自主复制或染色体整合的序列。在酵母中通常使用的质粒是穿梭载体 pRS423、pRS424、pRS425和pRS426(美国典型培养物保藏中心, Rockville,MD),它们包含大肠杆菌(E.coli)复制起点(例如, pMB1)、酵母2μ复制起点,以及用于营养选择的标记。用于这四种载体 的选择性标记是His3(载体pRS423)、Trp1(载体pRS424)、Leu2(载 体pRS425)和Ura3(载体pRS426)。具有编码所关注的多肽的基因的表 达载体的构建,能够通过标准分子克隆技术在大肠杆菌(E.coli)中或者通 过缺口修复重组方法在酵母中进行。

缺口修复克隆方法利用了酵母中高效的同源重组。通常,酵母载体 DNA被消化(例如,在其多克隆位点),以在其序列中产生“缺口”。生 成了多个所关注的插入DNA,所述插入DNA在5′和3′端包含≥21bp的序 列,这些序列彼此依次重叠,并且与载体DNA的5′和3′末端重叠。例如, 为构建“基因X”的酵母表达载体,选择了用于表达盒的酵母启动子和酵 母终止子。从酵母基因组DNA扩增了上述启动子和终止子,从基因X的来 源生物PCR扩增了基因X或从包含基因X序列的克隆载体获得了基因X。 在线性化载体的5′端与启动子序列之间、启动子与基因X之间、基因X与 终止子序列之间、以及终止子与线性化载体的3′端之间,有至少21bp的重 叠序列。然后,带“缺口”的载体和插入DNA被共转化到酵母菌株中,并 在包含适当化合物混合物的培养基上铺板,所述混合物允许质粒上营养选 择标记的互补作用。正确的插入组合的存在能够使用由所选择的细胞制备 的质粒DNA通过PCR作图确认。然后可将从酵母分离的质粒DNA(通常 浓度较低)转化到大肠杆菌菌株中,例如TOP10,然后通过小量抽提和限 制性作图以进一步验证所述质粒构建体。最后,能够通过序列分析验证构 建体。

与缺口修复技术一样,向酵母基因组中的整合同样利用了酵母中的同 源重组系统。通常,利用高保真度DNA聚合酶和引物,包含编码区加上控 制元件(启动子和终止子)和营养缺陷型标记的盒被PCR扩增,其中所述 引物与所述盒杂交,并且包含与期望插入发生的基因组区域的5′和3′区同 源的40-70个碱基对的序列。然后,PCR产物被转化到酵母中,并在包含 适当化合物混合物的培养基上铺板,所述混合物允许对整合的营养缺陷型 标记的选择。例如,为整合基因X到染色体位置Y中,所述启动子-编码区 X-终止子构建体是由质粒DNA构建体聚合酶链反应扩增的,并通过SOE 聚合酶链反应或一般的限制性消化和克隆接合到营养缺陷型标记(如 URA3)。使用包含与酵母染色体上位置“Y”的5′和3′区同源的40-70bp的 引物序列,PCR扩增了包含启动子-编码区X-终止子-URA3区域的完整的 盒。PCR产物被转化到酵母中,并在不含尿嘧啶的生长培养基上进行选 择。通过菌落PCR或通过对染色体DNA的直接测序能够验证转化体。

丁醇生物合成途径在植物乳杆菌(Lactobacillus plantarum)中的表达

乳杆菌属(Lactobacillus)属于乳杆菌科(Lactobacillales),并且用于 转化枯草芽孢杆菌(Bacillus subtilis)和链球菌属(Streptococcus)的许多 质粒及载体可用于转化乳杆菌属(Lactobacillus)。合适载体的非限制性例 子包括pAMβ1及其衍生物(Renault等人,Gene 183:175-182,1996);和 (O′Sullivan等人,Gene,137:227-231,1993);pMBB1和pHW800, pMBB1的衍生物(Wyckoff等人,Appl.Environ.Microbiol.,62:1481-1486, 1996);pMG1,一种接合质粒(Tanimoto等人,J.Bacteriol.,184:5800- 5804,2002);pNZ9520(Kleerebezem等人,Appl.Environ.Microbiol.,63: 4581-4584,1997);pAM401(Fujimoto等人,Appl.Environ.Microbiol.,67: 1262-1267,2001);和pAT392(Arthur等人,Antimicrob.Agents  Chemother.,38:1899-1903,1994)。若干来源于植物乳杆菌(Lactobacillus  plantarum)的质粒也已被报道(vanKranenburg R.等人,Appl.Environ. Microbiol.,71:1223-1230,2005)。

丁醇生物合成途径在多种肠球菌属(Enterococcus)菌种(屎肠球菌(E.faecium)、鹑鸡肠球菌(E.gallinarium)、和粪肠球菌(E.faecalis))中的表达

肠球菌属(Enterococcus)属于乳杆菌科(Lactobacillales),上述用于 转化乳酸杆菌(Lactobacilli)、杆菌(Bacilli)和链球菌(Streptococci)菌 种的多种质粒和载体可用于肠球菌属(Enterococcus)菌种。合适载体的非 限制性例子包括pAMβ1及其衍生物(Renault等人,Gene,183:175-182, 1996);和O′Sullivan等人,Gene,137:227-231,1993);pMBB1和 pHW800,pMBB1的衍生物(Wyckoff等人Appl.Environ.Microbiol.,62: 1481-1486,1996);pMG1,一种接合质粒(Tanimoto等人,J.Bacteriol., 184:5800-5804,2002);pNZ9520(Kleerebezem等人,Appl.Environ. Microbiol.,63:4581-4584,1997);pAM401(Fujimoto等人,Appl.Environ. Microbiol.,67:1262-1267,2001);和pAT392(Arthur等人,Antimicrob. Agents Chemother.,38:,1899-1903,1994)。还可以使用采用来自乳球菌属 (Lactococcus)的nisA基因的用于粪肠球菌(E.faecalis)的表达载体 (Eichenbaum等人,Appl.Environ.Microbiol.,64:2763-2769,1998)。另 外,可以使用用于在屎肠球菌(E.faecium)染色体中进行基因置换的载体 (Nallaapareddy等人,Appl.Environ.Microbiol.,72:334-345,2006)。

发酵培养基

本发明中的发酵培养基必须含有合适的碳底物。合适的底物可包括但 不限于:单糖,诸如葡萄糖和果糖;低聚糖,诸如乳糖、麦芽糖、半乳 糖、蔗糖;多糖,诸如淀粉、纤维素或它们的混合物;以及来自可再生原 料的未纯化混合物,诸如干酪乳清渗透物、玉米浆、糖用甜菜糖蜜及大麦 麦芽。另外,碳底物也可以是已被证明可以被代谢转化为关键生化中间体 的诸如二氧化碳的一碳底物或甲醇。除一和二碳底物之外,甲基营养微生 物还已知利用多种其它包含碳的化合物诸如甲胺、葡糖胺和多种氨基酸用 于代谢活动。例如,甲基营养酵母已知可利用来自甲胺的碳来形成海藻糖 或甘油(Bellion等人,Microb.Growth C1Compd.,[Int.Symp.],7th (1993),415-32.(eds):Murrell,J.Collin;Kelly,Don P.Publisher: Intercept,Andover,UK)。相似地,假丝酵母属(Candida)的多种菌种 将会代谢丙氨酸或油酸(Sulter等人,Arch.Microbiol.,153:485-489, 1990)。因此,预期本发明中所利用的碳源可涵盖各种含碳底物并将仅受 限于微生物的选择。

尽管预期全部上文提及的碳底物以及它们的混合物均适用于本发明, 在一些实施例中,所述碳底物是葡萄糖、果糖、和蔗糖,或对于经修饰以 利用C5糖类的酵母细胞是这些与C5糖类如木糖和/或阿拉伯糖的混合物。 蔗糖能够来源于可再生的糖源诸如甘蔗、甜菜、木薯、甜高粱、以及它们 的混合物。葡萄糖和右旋糖可通过淀粉基原料包括谷物诸如玉米、小麦、 裸麦、大麦、燕麦、以及它们的混合物的糖化来源于可再生的谷物来源。 此外,可发酵的糖类可通过预处理和糖化过程来源于可再生的纤维素的或 木质纤维素的生物质,例如,如美国专利申请公布2007/0031918 A1中所 述,该文献全文以引用方式并入本文。生物质是指任何纤维素或木质纤维 素材料,并包括包含纤维素的材料,以及任选地还包含半纤维素、木质 素、淀粉、低聚糖和/或单糖的材料。生物质也可包含附加组分如蛋白质和/ 或脂质。生物质可来源于单一来源,或生物质可包括来源于多于一种来源 的混合物;例如,生物质可包括玉米芯和玉米秸秆的混合物,或草和叶片 的混合物。生物质包括但不限于生物能作物、农业残余物、市政固体垃 圾、工业固体垃圾、来自造纸的淤渣、庭院垃圾、木材和林业垃圾。生物 质的例子包括但不限于:玉米粒、玉米芯、作物残余如玉米壳、玉米秸 秆、玉米纤维、草、小麦、小麦秸秆、大麦、大麦秸秆、干草、稻秆、柳 枝稷、废纸、甘蔗渣、高粱、大豆、获取自谷物、树、枝、根、叶、木 屑、锯末、灌木和灌丛、蔬菜、水果、花和动物粪肥、以及它们的混合物 的研磨物的组分。

除了合适的碳源外,发酵培养基还必须含有本领域技术人员已知的适 于培养物生长并促进本文所述的丁醇生产所必需的酶途径的矿物质、盐、 辅因子、缓冲剂和其他组分。

培养条件

通常,细胞在约20℃至约40℃范围内的温度下在适当的培养基中生 长。本发明中的合适的生长培养基是普通的商业制备的培养基,诸如Luria  Bertani(LB)液体培养基、沙氏葡糖(SD)液体培养基或酵母培养基 (YM)液体培养基、或包含酵母氮源基础、硫酸铵和右旋糖(作为碳/能 源)的液体培养基,或YPD培养基——蛋白胨、酵母提取物和右旋糖以大 多数酿酒酵母(Saccharomyces cerevistae)菌株生长的最适比例混合的共混 物。其他确定的或合成的生长培养基也能够被使用,微生物学或发酵科学 领域的技术人员将知道用于具体微生物生长的合适培养基。已知可以直接 或间接调节分解代谢物阻遏的试剂,如环腺苷2′,3′-单磷酸(cAMP),也可 以掺入发酵培养基中。

适于发酵的pH范围是介于pH5.0至pH9.0之间,其中pH6.0至pH8.0 优选作为起始条件。酵母的发酵适合的pH范围通常是介于约pH3.0至约 pH9.0之间。在一个实施例中,约pH5.0至约pH8.0被用于初始条件。其 他微生物的发酵适合的pH范围是介于约pH3.0至约pH7.5之间。在一个 实施例中,约pH4.5至约pH6.5被用于初始条件。

发酵能够在有氧或厌氧条件下进行。在一个实施例中,厌氧或微氧条 件被用于发酵。

工业分批和连续发酵

本发明的方法可采用分批发酵方法。经典的分批发酵是封闭体系,在 其中培养基的组成在发酵开始时被设定,并且在发酵期间中不受人工改 变。因此,在发酵开始时,用期望的一种或多种微生物对培养基进行接 种,在不向系统添加任何物质的情况下进行发酵。然而,通常来说,“分 批”发酵是指碳源的添加是分批的,但经常试图控制诸如pH和氧浓度之类 的因素。在分批系统中,系统的代谢产物和生物质组成持续改变直至发酵 结束时。在分批培养物内,细胞缓慢通过静态延滞期到达高速生长对数 期,并最后达到稳定期,此时生长速率减缓或终止。如果不加以处理,稳 定期中的细胞将最终死亡。通常,对数期中的细胞负责产生大部分终产物 或中间产物。

标准的分批系统的变型是补料-分批体系。补料-分批发酵方法也适用 于本发明,并且包括典型的分批系统,不同之处在于底物随着发酵过程递 增地被添加。在分解代谢物阻遏往往抑制细胞的代谢作用以及其中期望培 养基中具有有限量的底物时,补料分批式系统是可用的。补料分批式系统 中的实际底物浓度难于测量并因而可根据一些可测量因素诸如pH、溶解氧 以及废气诸如CO2的分压进行评估。分批发酵和补料-分批发酵在本领域内 是常用的且是本领域所熟知的,并且例子可见于如下文献:Thomas  D.Brock,Biotechnology:A Textbook of Industrial Microbiology,第二版, (1989),Sinauer Associates,Inc.,Sunderland,MA或Deshpande,Mukund (Appl.Biochem.Biotechnol.,36:227,1992),以引用方式并入本文。

尽管本发明是以分批模式进行,但预期该方法将可适用于连续发酵方 法。连续发酵是一种开放式系统,其中将设定好的发酵培养基连续加入生 物反应器中,并同时移出等量条件培养基用于加工。连续发酵一般而言使 培养物维持在恒定的高密度,其中细胞主要处于对数期生长。

连续发酵允许调节一种因素或任意数目的因素,这些因素影响细胞生 长或终产物浓度。例如,一种方法将维持限制性营养物质诸如碳源或氮水 平处于固定速率并允许所有其它参数适度。在其它系统中,影响生长的多 个因素能够连续改变,而通过培养基浊度测量的细胞浓度保持恒定。连续 系统力求维持稳态的生长条件,并因而在发酵过程中由于培养基被取出而 导致的细胞损失必须与细胞的生长率保持平衡。调节用于连续发酵过程的 营养物质和生长因子的方法以及使产物形成的速率最大化的技术是工业微 生物学领域中为人们所熟知的,Brock详述了多种方法,参见上文。

预期可采用分批发酵、补料分批发酵或采用连续发酵工艺来实施本发 明,并且任何已知的发酵模式均将适用。另外,预期可以将细胞固定在基 底上而作为完整的细胞催化剂并让其经受发酵条件以生产异丁醇。

用于从发酵培养基中分离丁醇的方法

对于ABE发酵使用本领域已知的方法,生物生产的丁醇可从发酵培养 基中分离(参见例如,Durre,Appl.Microbiol.Biotechnol.,49:639-648 (1998),Groot等人,Process.Biochem.27:61-75(1992),以及其中的参 考文献)。例如,能够通过离心、过滤、滗析等方法从发酵培养基中去除 固体。然后,可使用诸如蒸馏、共沸蒸馏、液-液萃取、吸附、汽提、膜蒸 发、或全蒸发的方法从发酵培养基中分离丁醇。

因为丁醇与水形成低沸点的共沸混合物,蒸馏可被用于分离混合物直 至其共沸组成。蒸馏能够与其他分离方法组合使用以分离共沸物。能够与 蒸馏组合使用以分离并纯化丁醇的方法包括但不限于滗析、液-液萃取、吸 附和基于膜的技术。另外,可使用夹带剂(参见例如Doherty和Malone, Conceptual Design of Distillation Systems,McGraw Hill,New York,2001) 采用共沸蒸馏来分离丁醇。

丁醇-水混合物形成非均相共沸物,从而能够组合使用蒸馏和滗析以分 离并纯化丁醇。在该方法中,包含丁醇的发酵液体培养基被蒸馏至接近共 沸组成。然后,冷凝共沸混合物,通过滗析从发酵培养基分离丁醇。滗析 后的含水相能够作为回流返回至第一蒸馏塔。富丁醇的滗析有机相可通过 在第二蒸馏塔中蒸馏进一步被纯化。

也可从发酵培养基中组合使用液-液萃取和蒸馏分离丁醇。在该方法 中,使用液-液萃取用合适溶剂从发酵液体培养基中萃取丁醇。然后蒸馏包 含丁醇的有机相以从溶剂中分离丁醇。

蒸馏与吸附组合也可用于从发酵培养基中分离丁醇。在该方法中,蒸 馏包含丁醇的发酵液体培养基使其接近共沸组成,然后使用吸附剂移除剩 余的水,诸如分子筛(Aden等人,Lignocellulosic Biomass to Ethanol  Process Design and Economics Utilizing Co-Current Dilute Acid Prehydrolysis  and Enzymatic Hydrolysis for Corn Stover,Report NREL/TP-510-32438, National Renewable Energy Laboratory,2002年6月)。

此外,可组合使用蒸馏和全蒸发以从发酵培养基中分离和纯化丁醇。 在该方法中,蒸馏包含丁醇的发酵液体培养基使其接近共沸组成,然后用 全蒸发通过亲水性膜移除剩余的水(Guo等人,J.Membr.Sci.245,199-210 (2004))。

原位产物移除(ISPR)(也被称为提取发酵)可用于从生产其的发酵 容器中移除丁醇(或其它发酵性醇),从而使微生物以高收率生产丁醇。 本领域已经描述过的一种用于移除发酵性醇的ISPR方法是液-液萃取。一 般来讲,就丁醇发酵而言,例如,使包含微生物的发酵培养基在丁醇浓度 达到毒性水平之前的时间与有机提取剂接触。所述有机提取剂和所述发酵 培养基形成两相混合物。所述丁醇分配至有机提取剂相,降低了在包含微 生物的水相中的浓度,从而限制了微生物在抑制性的丁醇中的暴露。

可进行液-液萃取例如按照美国专利申请公布2009/0305370中所述的方 法进行,其公开内容全文以并入本文。美国专利申请公布2009/0305370描 述了用于生产丁醇和采用液-液萃取从发酵液体培养基中回收丁醇的方法, 所述方法包括以下步骤:使发酵液体培养基与水不混溶的提取剂接触,以 形成包含水相和有机相的两相混合物。通常,提取剂可以为有机提取剂, 其选自饱和的、单不饱和的、多不饱和的(以及它们的混合物)C12-C22脂 肪醇、C12-C22脂肪酸、C12-C22脂肪酸的酯、C12-C22脂肪醛、以及它们的混 合物。用于ISPR的一种或多种提取剂可以为非醇提取剂。ISPR提取剂可 以为外源有机提取剂诸如油醇、二十二醇、鲸蜡醇、月桂醇、肉豆蔻醇、 硬脂醇、1-十一烷醇、油酸、月桂酸、肉豆蔻酸、硬脂酸、肉豆蔻酸甲 酯、油酸甲酯、十一烷醛、月桂醛、20-甲基十一烷醛、以及它们的混合 物。

在一些实施例中,酯能够通过使醇在发酵液体培养基中与羧酸(例 如,脂肪酸)和能够酯化所述醇与所述羧酸的催化剂接触而形成,如PCT 专利申请公布WO/2011/159998和美国专利申请公布20120156738中所述, 上述文献全文以引用方式并入本文。在此类实施例中,所述羧酸可作为醇 酯被分配至其中的ISPR提取剂。羧酸可被供应至发酵容器和/或来源于供 应进料至发酵容器的可发酵的碳的生物质。所述原料中存在的脂质可被催 化水解为羧酸,并且相同的催化剂(例如,酶)可使所述羧酸与醇酯化。 催化剂能够在发酵之前被供应至原料,或者能够在原料的供应之前或与其 同时地被供应至发酵容器。当所述催化剂被供应至发酵容器中时,可通过 将所述脂类水解为羧酸并且基本上同时发生羧酸与发酵容器中存在的丁醇 的酯化,从而获得醇酯。羧酸和/或并非来源于所述原料的天然的油也可被 进料至发酵容器,所述天然的油被水解为羧酸。任何未与所述醇酯化的羧 酸均可作为ISPR提取剂的一部分。包含醇酯的提取剂能够与发酵培养基分 离,并且能够从提取剂中回收醇。提取剂能够被再循环至发酵容器。因 此,就丁醇生产而言,例如,丁醇至酯的转化可降低发酵培养基中的游离 丁醇浓度,保护微生物免受提高的丁醇浓度的毒性影响。此外,未分级的 谷物可被用作原料而不从其中分离脂质,因为脂质可被催化水解为羧酸, 从而降低了脂质在ISPR提取剂中积累的速率。

原位产物移除能够在分批模式或连续模式中进行。在连续模式的原位 产物移除中,产物被连续地从反应器中移出。在分批模式的原位产物移除 中,一定体积的有机提取剂被添加至发酵容器,并且提取剂在过程期间不 被移出。对于原位产物移除,有机提取剂能够在发酵开始时与发酵培养基 接触,形成两相的发酵培养基。另选地,有机提取剂能够在微生物已达到 所期望的生长的量(这能够通过测量培养物的光密度确定)之后与发酵培 养基接触。另外,有机提取剂能够在发酵培养基中的产物醇水平达到预先 选定的水平时与发酵培养基接触。就根据本发明的一些实施例的丁醇生产 而言,羧酸提取剂能够在丁醇浓度达到毒性水平之前的时间与发酵培养基 接触,以使丁醇与羧酸酯化以产生丁醇酯,并从而降低发酵容器中的丁醇 浓度。然后,包含酯的有机相能够在达到所期望的丁醇酯有效滴度之后被 从发酵容器移出(并从组成水相的发酵液体培养基分离)。在一些实施例 中,包含酯的有机相在发酵容器中的可用的可发酵糖的发酵基本上完成之 后被从水相分离。

实例

菌株的构建

表8:在实例中引用的菌株

PNY1528的构建(PNY2211中整合了hADH)

通过与PCR产物的同源重组产生了缺失/整合,所述PCR产物包含与 靶区域的上游和下游同源的区域和用于选择转化体的URA3基因的。通过 同源重组移除了URA3基因,以产生无痕缺失/整合。

YPRCΔ15缺失和马肝脏adh整合

缺失了YPRCΔ15基因座并替换为针对在酿酒酵母(Saccharomyces  cerevisiae)中的表达经密码子优化的马肝脏adh基因,其连接有来自酿酒 酵母(Saccharomyces cerevisiae)的PDC5启动子区域(538bp)和来自酿 酒酵母(Saccharomyces cerevisiae)的ADH1终止子区域(316bp)。用于 YPRCΔ15缺失-P[PDC5]-adh_HL(y)-ADH1t整合的无痕盒被首先克隆进 质粒pUC19-URA3MCS。

使用Phusion High Fidelity PCR Master Mix(New England BioLabs, IpsWich,MA)和CEN.PK 113-7D基因组DNA作为模板,扩增片段A-B- U-C,用Gentra Puregene Yeast/Bact kit(Qiagen;Valencia,CA)制备。 YPRCΔ15片段A扩增自基因组DNA,所用引物为oBP622(SEQ ID NO: 269),其包含KpnI限制性位点,和引物oBP623(SEQ ID NO:270),其 包含与YPRCΔ15片段B的5′端同源的5′尾。YPRCΔ15片段B扩增自基因 组DNA,所用引物为oBP624(SEQ ID NO:271),其包含与YPRCΔ15片 段A的3′端同源的5′尾,和引物oBP625(SEQ ID NO:272),其包含FseI 限制性位点。用PCR Purification kit(Qiagen)纯化PCR产物。YPRCΔ15 片段A-YPRCΔ15片段B通过重叠PCR生成,通过混合YPRCΔ15片段A 和YPRCΔ15片段B PCR产物并用引物oBP622(SEQ ID NO:269)和 oBP625(SEQ ID NO:272)扩增。所得的PCR产物用KpnI和FseI消化, 用T4 DNA连接酶连接至用适当的酶消化后的pUC19-URA3MCS的对应位 点中。YPRCΔ15片段C扩增自基因组DNA,所用引物为oBP626(SEQ ID  NO:273),其包含NotI限制性位点,和引物oBP627(SEQ ID NO: 274),其包含PacI限制性位点。用NotI和PacI消化了YPRCΔ15片段C PCR产物,并用T4 DNA连接酶连接至包含YPRCΔ15片段AB的质粒的对 应位点中。使用引物HY21(SEQ ID NO:275),其包含AscI限制性位 点,和引物HY24(SEQ ID NO:276),其包含与adh_Hl(y)的5′端同源 的5′尾,从CEN.PK 113-7D基因组DNA扩增了PDC5启动子区域。adh_Hl (y)-ADH1t扩增自pBP915(SEQ ID NO:279),所用引物为HY25 (SEQ ID NO:277),其包含与P[PDC5]的3′端同源的5′尾,和引物HY4 (SEQ ID NO:278),其包含Pmel限制性位点。用PCR Purification kit (Qiagen)纯化PCR产物。P[PDC5]-adh_HL(y)-ADH1t通过重叠PCR 生成,通过混合P[PDC5]和adh_HL(y)-ADH1t PCR产物并用引物HY21 (SEQ ID NO:275)和HY4(SEQ ID NO:278)进行扩增。用AscI和PmeI 消化了所得的PCR产物,并用T4 DNA连接酶连接至包含YPRCΔ15片段 ABC的质粒的对应位点中。从所得的质粒扩增了整个整合盒,扩增使用引 物oBP622(SEQ ID NO:269)和oBP627(SEQ ID NO:274)进行。

制备了PNY2211的感受态细胞,并使用Frozen-EZ Yeast  Transformation II kit(Zymo Research;Orange,CA),用YPRCΔ15缺失- P[PDC5]-adh_HL(y)-ADH1t整合盒PCR产物进行了转化。转化混合物在 30℃铺板到不含尿嘧啶补充有1%的乙醇的合成完全培养基上。使用引物 URA3-end F(SEQ ID NO:280)和oBP637(SEQ ID NO:283),通过PCR 筛选了转化体。正确的转化体生长于YPE(1%乙醇)中,并在30℃铺板到 补充了1%乙醇并包含5-氟-乳清酸(0.1%)的合成完全培养基上以选择失 去了URA3标记的分离株。使用外部引物oBP636(SEQ ID NO:281)和 oBP637(SEQ ID NO:282)和用YeaStar Genomic DNA kit(Zymo  Research)制备的基因组DNA,通过PCR确认了YPRCΔ15的缺失和 P[PDC5]-adh_HL(y)-ADH1t的整合。选择了下列基因型的正确的分离株用 于进一步修饰:CEN.PK 113-7D MATa ura3Δ::loxP his3Δpdc6Δ pdc1Δ::P[PDC1]-DHAD|ilvD_Sm-PDC1t-P[FBA1]-ALS|alsS_Bs-CYC1t  pdc5Δ::P[PDC5]-ADH|sadB_Ax-PDC5t gpd2Δ::loxP fra2Δadh1Δ::UAS (PGK1)P[FBA1]-kivD_L1(y)-ADH1t yprcΔ15Δ::P[PDC5]-ADH|adh_Hl- ADH1t。

马肝脏adh在fra2Δ的整合

经过密码子优化以在酿酒酵母(Saccharomyces cerevisiae)中表达的马 肝脏adh基因,与来自酿酒酵母(Saccharomyces cerevisiae)的PDC1启动 子区(870bp)和来自酿酒酵母(Saccharomyces cerevisiae)的ADH1终止 子区(316bp)一起被整合进fra2缺失的位点。用于fra2Δ-P[PDC1]- adh_HL(y)-ADH1t整合的无痕盒被首先克隆进质粒pUC19-URA3MCS。

使用Phusion High Fidelity PCR Master Mix(New England BioLabs, Ipswich,MA)和CEN.PK 113-7D基因组DNA作为模板,扩增片段A-B- U-C,用Gentra Puregene Yeast/Bact kit(Qiagen;Valencia,CA)制备。使 用引物oBP695(SEQ ID NO:287),其包含NotI限制性位点,和引物 oBP696(SEQ ID NO:288),其包含PacI限制性位点,由基因组DNA扩 增fra2Δ片段C。用NotI和PacI消化了fra2Δ片段C PCR产物,并用T4 DNA连接酶连接至pUC19-URA3MCS的对应位点中。从基因组DNA扩增 了fra2Δ片段B,所用引物为oBP693(SEQ ID NO:285),其包含PmeI限 制性位点,和引物oBP694(SEQ ID NO:286),其包含FseI限制性位点。 用PmeI和FseI消化了所得的PCR产物,并用T4 DNA连接酶连接至用适 当的酶消化后的包含fra2Δ片段C的质粒的对应位点中。从基因组DNA扩 增了fra2Δ片段A,所用引物为oBP691(SEQ ID NO:283),其包含 BamHI和AsiSI限制性位点,和引物oBP692(SEQ ID NO:284),其包含 AscI和SwaI限制性位点。用BamHI和AscI消化了fra2Δ片段A PCR产 物,并用T4 DNA连接酶连接至用适当的酶消化后的包含fra2Δ片段BC的 质粒的对应位点中。从CEN.PK 113-7D基因组DNA扩增了PDC1启动子 区,所用引物为HY16(SEQ ID NO:289),其包含AscI限制性位点,和 引物HY19(SEQ ID NO:290),其包含与adh_Hl(y)的5′端同源的5′ 尾。adh_Hl(y)-ADH1t扩增自pBP915,所用引物为HY20(SEQ ID NO: 291),其包含与P[PDC1]的3′端同源的5′尾,和引物HY4(SEQ ID NO: 278),其包含Pmel限制性位点。用PCR Purification kit(Qiagen)纯化 PCR产物。P[PDC1]-adh_HL(y)-ADH1t通过重叠PCR生成,通过混合 P[PDC1]和adh_HL(y)-ADH1t PCR产物并用引物HY16(SEQ ID NO: 289)和HY4(SEQ ID NO:278)进行扩增。用AscI和PmeI消化了所得的 PCR产物,并用T4 DNA连接酶连接至包含fra2Δ片段ABC的质粒的对应 位点中。使用引物oBP691(SEQ ID NO:283)和oBP696(SEQ ID NO: 288),从所得的质粒扩增了整个整合盒。

制备了具有整合在YPRCΔ15的adh_Hl(y)的PNY2211变体的感受态 细胞,并使用Frozen-EZ Yeast Transformation II kit(Zymo Research),用 fra2Δ-P[PDC1]-adh_HL(y)-ADH1t整合盒PCR产物进行了转化。转化混 合物在30℃铺板到不含尿嘧啶补充有1%的乙醇的合成完全培养基上。使 用引物URA3-end F(SEQ ID NO:280)和oBP731(SEQ ID NO:293),通 过PCR筛选了转化体。正确的转化体生长于YPE(1%乙醇)中,并在30 ℃铺板到补充有1%乙醇并包含5-氟-乳清酸(0.1%)的合成完全培养基上 以选择失去了URA3标记的分离株。通过使用内部引物HY31(SEQ ID NO: 294)和外部引物oBP731(SEQ ID NO:293)的菌落PCR和使用外部引物 oBP730(SEQ ID NO:292)和oBP731(SEQ ID NO:293)的PCR,利用用 YeaStar Genomic DNA kit(Zymo Research)制备的基因组DNA确认了 P[PDC1]-adh_HL(y)-ADH1t的整合。具有下列基因型的正确的分离株被命 名为PNY1528:CEN.PK 113-7D MATa ura3Δ::loxP his3Δ pdc6Δ pdc1Δ::P[PDC1]-DHAD|ilvD_Sm-PDC1t-P[FBA1]-ALS|alsS_Bs-CYC1t  pdc5Δ::P[PDC5]-ADH|sadB_Ax-PDC5t gpd2Δ::loxP fra2Δ::P[PDC1]- ADH|adh_Hl-ADH1t adh1Δ::UAS(PGK1)P[FBA1]-kivD_L1(y)-ADH1t  yprcΔ15Δ::P[PDC5]-ADH|adh_Hl-ADH1t。

PNY2237(无痕YMR226c缺失)

使用PCR扩增的2.0kb线性无痕缺失盒,通过同源重组从酿酒酵母 (S.cerevisiae)菌株PNY1528缺失了基因YMR226c。所述盒构建自拼接 的PCR扩增的片段,包含作为选择性标记的连同其天然启动子和终止子一 起的URA3基因、用以促进缺失盒的整合和天然插入序列的移除的侧接了 YMR226c基因染色体座位的上游和下游的同源序列、和用以促进URA3标 记的重组和移除的重复序列。用正向和反向PCR引物(N1251和N1252, 分别为SEQ ID NO:295和296)扩增了来源于pLA33的1,208bp URA3表 达盒(pUC19::loxP-URA3-loxP(SEQ ID NO:303))。用正向和反向引物 (N1253和N1254,分别为SEQ ID NO:297和298),从酿酒酵母(S. cerevisiae)菌株PNY2211(上文)的基因组DNA制备物扩增了具有3′ URA3重叠序列标签的250bp下游同源序列。用正向和反向PCR引物 (N1255和N1256,分别为SEQ ID NO:299和300),从酿酒酵母(S. cerevisiae)菌株PNY2211的基因组DNA制备物扩增了具有5′URA3重叠 序列标签的250bp重复序列。用正向和反向PCR引物(N1257和N1258, 分别为SEQ ID NO:301和302),从酿酒酵母(S.cerevisiae)菌株 PNY2211的基因组DNA制备物扩增了具有5′重复重叠序列标签的250bp上 游同源序列。

将约1.5μg经PCR扩增的盒转化到用ZYMO Research Frozen Yeast  Transformation Kit制备为感受态的菌株PNY1528(上文)中,将转化混合 物铺板在SE 1.0%-尿嘧啶上,并在30℃温育,以选择具有整合的 ymr226cΔ::URA3盒的细胞。在72至96小时后显现的转化体随后被短划线 接种在相同的培养基上,并在30℃下温育24至48小时。通过PCR针对 ymr226cΔ::URA3筛选了短的菌痕,使用了与侧接的向内的染色体特异性引 物(N1239,SEQ ID NO:310)配对的5′向外的URA3缺失盒特异性的内部 引物(N1249,SEQ ID NO:312)和与侧接的向内的染色体特异性引物 (N1242,SEQ ID NO:311)配对的3′向外的URA3缺失盒特异性引物 (N1250,SEQ ID NO:313)。阳性的PNY1528 ymr226cΔ::URA3 PCR筛选 产生分别为598和726bp的5′和3′PCR产物。

挑取了三个阳性的PNY1528 ymr226cΔ::URA3菌落,并在YPE 1%培 养基中培养过夜,其中的100μL被铺板在YPE 1%+5-FOA上,用于移除 标记。使用5′和3′染色体特异性引物(N1239和N1242),针对标记的失去 PCR筛选了24至48小时后显现的菌落。阳性的PNY1528 ymr226cΔ无标 记PCR筛选产生801bp的PCR产物。获得了多个菌落,并将一个命名为 PNY2237。

PNY2238和PNY2243(ALD6缺失菌株)

设计了载体,用于以Cre-lox可再循环的URA3选择标记替换ALD6编 码序列。通过PCR扩增了ALD6的5′和3′序列(引物对分别为N1179和 N1180以及N1181和N1182;分别为SEQ ID NO:304、305、306、和 307)。在将这些片段克隆进TOPO载体(Invitrogen,目录号K2875-J10) 并测序(M13正向(SEQ ID NO:314)和反向(SEQ ID NO:315)引物)之 后,分别地将5′和3′侧翼在EcoRI和SphI位点克隆进pLA33 (pUC19::loxP::URA3::loxP)(SEQ ID NO:303)。每一连接反应被转化进 大肠杆菌(E.coli)Stbl3细胞中,并在LB Amp平板上温育,以选择转化 体。通过PCR确认了序列的正确插入(引物M13正向(SEQ ID NO:314) 和N1180(SEQ ID NO:305)以及M13反向(SEQ ID NO:315)和N1181 (SEQ ID NO:306,分别地)。

用AhdI将上文所述的载体(pUC19::a1d6Δ::loxP-URA3-loxP)线性 化,并使用标准的乙酸锂方法(不同的是细胞与DNA的温育延长至2.5小 时)转化到PNY1528和PNY2237中。通过在不含尿嘧啶并提供了1%乙醇 作为碳源的合成完全培养基上铺板,获得了转化体。通过PCR筛选了点种 的转化体,以确认缺失/整合,所用引物为N1212(SEQ ID NO:308)和 N1180(5′端)(SEQ ID NO:305)以及N1181(SEQ ID NO:306)和 N1213(SEQ ID NO:309)(3′端)。使用组氨酸标记选择,将携带Cre重 组酶的质粒(pRS423::GAL1p-Cre=SEQ ID No.324)转化到所述菌株中。 在补充有0.5%半乳糖的YPE上使转化体传代。针对对5-FOA的抗性 (URA3标记的丢失)和针对组氨酸营养缺陷型(Cre质粒的丢失)筛选菌 落。通过PCR确认了URA3基因通过侧翼loxP位点的正确去除(引物 N1262和N1263,分别为SEQ ID NO:316和317)。另外,ALD6基因内部 的引物(N1230和N1231;分别为SEQ ID NO:322和323),被用于确保 不存在局部二倍体。最后,通过PCR筛选了a1d6Δ::loxP克隆,以确认没有 发生ura3Δ::loxP(N1228和N1229,SEQ ID NO:320和321)和 gpd2Δ::loxP(N1223和N1225,SEQ ID NO:318和319)之间的易位。从对 PNY1528的转化体的筛选中鉴定了两个阳性克隆。克隆B被命名为 PNY2243。从对PNY2237的转化体的筛选中鉴定了三个阳性克隆。针对小 规模的异丁醇生产评估了克隆E和K(下文)。尽管大多数参数在统计上 是相同的,选择了克隆E(PNY2238)用于进一步开发。

菌株PNY2259的构建

本实例的目的是描述用于用kivD_Lg(y)在adh1Δ基因座替换 PNY2238中的kivD_L1(y)染色体拷贝的构建体的组件。

通过与包含与靶区域的上游和下游同源的区域和用于选择转化体的 URA3基因的PCR产物的同源重组,产生了缺失/整合。通过同源重组移除 了URA3基因,以产生无痕缺失/整合。用于整合kivD_Lg(y)的质粒来源 于为将UAS(PGK1)P[FBA1]-kivD_L1(y)整合进酿酒酵母 (Saccharomyces cerevisiae)的ADH1基因座而构建的质粒。用于将UAS (PGK1)P[FBA1]-kivD_L1(y)整合进ADH1基因座的质粒的构建描述于 下文中。质粒被构建在pUC19-URA3MCS中。

ADH1缺失/UAS(PGK1)P[FBA1]-kivD_L1(y)整合质粒的构建

扩增来自乳酸乳球菌(Lactococcus lactis)的经过密码子优化以在酿酒 酵母中表达的kivD编码区,kivD_L1(y),使用pLH468(SEQ ID NO: 335)作为模板,所用引物为oBP562(SEQ ID NO:325),其包含PmeI限 制性位点,和引物oBP563(SEQ ID NO:326),其包含与ADH1片段B的 5′端同源的5′尾。ADH1片段B扩增自酿酒酵母(Saccharomyces  cerevisiae)CEN.PK 113-7D基因组DNA,所用引物为oBP564(SEQ ID  NO:327),其包含与kivD_L1(y)的3′端同源的5′尾,和引物oBP565 (SEQ ID NO:328),其包含FseI限制性位点。用PCR Purification kit (Qiagen;Valencia,CA)纯化PCR产物。kivD_L1(y)-ADH1片段B通 过重叠PCR生成,通过混合kivD_L1(y)和ADH1片段B PCR产物并用 引物oBP562(SEQ ID NO:325)和oBP565(SEQ ID NO:328)进行扩增。 所得的PCR产物用PmeI和FseI消化,并用T4DNA连接酶连接至用适当的 酶消化后的pUC19-URA3MCS的对应位点中。ADH1片段A扩增自基因组 DNA,所用引物为oBP505(SEQ ID NO:329),其包含SacI限制性位点, 和引物oBP506(SEQ ID NO:330),其包含AscI限制性位点。用SacI和 AscI消化了ADH1片段APCR产物,并用T4 DNA连接酶连接至包含 kivD_L1(y)-ADH1片段B的质粒的对应位点中。从基因组DNA扩增了 ADH1片段C,扩增使用的引物为oBP507(SEQ ID NO:331),其包含 PacI限制性位点,和引物oBP508(SEQ ID NO:332),其包含SalI限制性 位点。用PacI和SalI消化了ADH1片段CPCR产物,并用T4 DNA连接酶 连接至包含ADH1片段A-kivD_L1(y)-ADH1片段B的质粒的对应位点中。 杂合启动子UAS(PGK1)-PFBA1(SEQ ID NO:264)扩增自载体pRS316-UAS (PGK1)-PFBA1-GUS,所用引物为oBP674(SEQ ID NO:333),其包含 AscI限制性位点,和引物oBP675(SEQ ID NO:334),其包含Pmel限制 性位点。用AscI和PmeI消化了UAS(PGK1)-PFBA1PCR产物,并用T4 DNA连接酶连接至包含kivD_L1(y)-ADH1片段ABC的质粒的对应位点 中以生成pBP1181。

pBP1716和pBP1719的构建

从ADH1缺失/UAS(PGK1)P[FBA1]-kivD_L1(y)整合质粒 pBP1181移除了kivD_L1(y)。用PmeI和FseI消化了质粒,在琼脂糖凝胶 上纯化了大的DNA片段,然后用凝胶提取试剂盒(Qiagen)提取。ADH1 片段B扩增自pBP1181,所用引物为oBP821(SEQ ID NO:336),其包含 PmeI限制性位点,和引物oBP484(SEQ ID NO:337),其包含FseI限制性 位点。用PmeI和FseI消化了ADH1片段B PCR产物,并用T4 DNA连接 酶连接至上述凝胶纯化的DNA大片段的对应位点中。对应于kivD_L1(y) 的3′500bp的PCR片段被克隆进所得的载体,用于PNY1528中kivD_L1 (y)的定向缺失。从pBP1181扩增所述片段,所用引物为oBP822(SEQ  ID NO:338),其包含NotI限制性位点,和引物oBP823(SEQ ID NO: 339),其包含PacI限制性位点。用NotI和PacI消化了所述片段,并用T4 DNA连接酶连接至用适当限制性酶消化后的具有kivD_L1(y)缺失的上述 质粒中URA3下游的对应位点中。所得的质粒被命名为pBP1716。

由DNA2.0(Menlo Park,CA)合成了来自格氏李斯特菌(Listeria  grayi)经密码子优化以在酿酒酵母中表达的kivD编码区(SEQ ID NO: 340),kivD_Lg(y)。kivD_Lg(y)的扩增使用了引物oBP828(SEQ ID  NO:341),其包含PmeI限制性位点,和引物oBP829(SEQ ID  NO:342),其包含Pmel限制性位点。所得的PCR产物用PmeI消化,并用 T4 DNA连接酶连接至用适当的酶消化后的pBP1716中的对应位点中。用 引物FBAp-F(SEQ ID NO:343)和oBP829(SEQ ID NO:342),通过 PCR检查了所克隆的基因的取向。具有正确取向的kivD_Lg(y)的分离株 被命名为pBP1719。

菌株PNY2259的构建

从pBP1719扩增了kivD_L1(y)缺失/kivD_Lg(y)整合盒,所用引 物为oBP505(SEQ ID NO:329)和oBP823(SEQ ID NO:339)。制备了 PNY2238的感受态细胞并使用Frozen-EZ Yeast Transformation II kit(Zymo  Research;Orange,CA),用上述PCR产物转化。转化混合物在30C铺板 到不含尿嘧啶并补充有1%乙醇的合成完全培养基上。通过 PCR(JumpStart(TM)REDTaq(c)ReadyMix(TM)筛选了转化体菌株,所用引 物为Ura3-end F(SEQ ID NO:280)和HY-50(SEQ ID NO:344)。转化 体生长于YPE(1%乙醇)中,并在30C铺板到补充有1%EtOH并包含5- 氟-乳清酸(0.1%)的合成完全培养基上以选择失去了URA3标记的分离 株。通过PCR确认了kivD_L1(y)的缺失和kivD_Lg(y)的整合,所用 引物为HY-50和oBP834(SEQ ID NO:345)。在相同的基因座包含 kivD_Lg(y)并从与PNY2238中的kivD_L1(y)相同的启动子表达的一个 正确的分离株被命名为PNY2259。

菌株PNY1556的构建

在此描述的是用于用kivD_Lg(y)在adh1Δ基因座替换PNY1528中 的kivD_L1(y)的染色体拷贝的构建体的组件,和表达kivD_Lg(y)基因的 菌株PNY1556的构建。缺失/整合是通过用包含与靶区域上游和下游具有同 源性的区域的PCR产物和用于转化体选择的URA3基因进行的同源重组产 生的,如上文中所描述的。用于整合kivD_Lg(y)的质粒来源于为将UAS (PGK1)P[FBA1]-kivD_L1(y)整合进酿酒酵母的ADH1基因座而构建的 质粒。用于将UAS(PGK1)P[FBA1]-kivD_L1(y)整合进ADH1基因座的 质粒的构建描述于下文中。质粒被构建在pUC19-URA3MCS中。

ADH1缺失/UAS(PGK1)P[FBA1]-kivD_L1(y)整合质粒的构建

扩增来自乳酸乳球菌(Lactococcus lactis)的经过密码子优化以在酿酒 酵母(Saccharomyces cerevisiae)中表达的kivD编码区,kivD_L1(y), 使用pLH468(SEQ ID NO:129)作为模板,所用引物为oBP562(SEQ ID  NO:384),其包含PmeI限制性位点,和引物oBP563(SEQ ID  NO:385),其包含与ADH1片段B的5′端同源的5′尾。ADH 1片段B扩增 自酿酒酵母(Saccharomyces cerevisiae)CEN.PK 113-7D基因组DNA,所 用引物为oBP564(SEQ ID NO:386),其包含与kivD_L1(y)的3′端同源 的5′尾,和引物oBP565(SEQ ID NO:387),其包含FseI限制性位点。用 PCR Purification kit(Qiagen;Valencia,CA)纯化PCR产物。kivD_L1 (y)-ADH1片段B通过重叠PCR生成,通过混合kivD_L1(y)和ADH1 片段B PCR产物并用引物oBP562(SEQ ID NO:384)和oBP565(SEQ ID  NO 387)进行扩增。所得的PCR产物用PmeI和FseI消化,并用T4DNA 连接酶连接至用适当的酶消化后的pUC19-URA3MCS的对应位点中。 ADH1片段A扩增自基因组DNA,所用引物为oBP505(SEQ ID NO: 329),其包含SacI限制性位点,和引物oBP506(SEQ ID NO:330),其 包含AscI限制性位点。用SacI和AscI消化了ADH1片段A PCR产物,并 用T4 DNA连接酶连接至包含kivD_L1(y)-ADH1片段B的质粒的对应位点 中。从基因组DNA扩增了ADH1片段C,扩增使用的引物为oBP507 (SEQ ID NO:331),其包含PacI限制性位点,和引物oBP508(SEQ ID  NO:332),其包含SalI限制性位点。用PacI和SalI消化了ADH1片段C  PCR产物,并用T4 DNA连接酶连接至包含ADH1片段A-kivD_L1(y)- ADH1片段B的质粒的对应位点中。从载体pRS316-UAS(PGK1)-PFBA1- GUS(SEQ ID NO:389)扩增了杂合启动子UAS(PGK1)-PFBA1,所用引物 为oBP674(SEQ ID NO:333),其包含AscI限制性位点,和引物oBP675 (SEQ ID NO:334),其包含Pmel限制性位点。用AscI和PmeI消化了 UAS(PGK1)-PFBA1PCR产物,并用T4 DNA连接酶连接至包含kivD_L1 (y)-ADH1片段ABC的质粒的对应位点中以生成pBP1181。

从ADH1缺失/UAS(PGK1)P[FBA1]-kivD_L1(y)整合质粒 pBP1181移除了kivD_L1(y)。用PmeI和FseI消化了质粒,在琼脂糖凝胶 上纯化了大的DNA片段,然后用凝胶提取试剂盒(Qiagen)提取。ADH1 片段B扩增自pBP1181,所用引物为oBP821(SEQ ID NO:336),其包含 PmeI限制性位点,和引物oBP484(SEQ ID NO:337),其包含FseI限制性 位点。用PmeI和FseI消化了ADH1片段B PCR产物,并用T4 DNA连接 酶连接至上述凝胶纯化的DNA大片段的对应位点中。对应于kivD_L1(y) 的3’500bp的PCR片段被克隆进所得的载体,用于PNY1528中kivD_L1 (y)的定向缺失。从pBP1181扩增所述片段,使用引物oBP822(SEQ ID  NO:338),其包含NotI限制性位点,和引物oBP823(SEQ ID NO: 339),其包含PacI限制性位点。用NotI和PacI消化了所述片段,并用T4 DNA连接酶连接至用适当限制性酶消化后的具有kivD_L1(y)缺失的上述 质粒中URA3下游的对应位点中。所得的质粒被命名为pBP1716。

由DNA2.0(Menlo Park,CA)合成了来自格氏李斯特菌(Listeria  grayi)经密码子优化以在酿酒酵母(Saccharomyces cerevisiae)中表达的 kivD编码区(SEQ ID NO:390),kivD_Lg(y)。kivD_Lg(y)的扩增使 用了引物oBP828(SEQ ID NO:341),其包含PmeI限制性位点,和引物 oBP829(SEQ ID NO:342),其包含Pmel限制性位点。所得的PCR产物用 PmeI消化,并用T4 DNA连接酶连接至用适当的酶消化后的pBP1716中的 相应位点。用引物FBAp-F(SEQ ID NO:343)和oBP829(SEQ ID NO: 342),通过PCR检查了所克隆的基因的取向。具有正确取向的kivD_Lg (y)的分离株被命名为pBP1719。

从pBP1719扩增了kivD_L1(y)缺失/kivD_Lg(y)整合盒,所用引 物为oBP505(SEQ ID NO:329)和oBP823(SEQ ID NO:339)。制备了 PNY1528的感受态细胞并使用Frozen-EZ Yeast Transformation II kit(Zymo  Research;Orange,CA),用上述PCR产物转化。转化混合物在30C铺板 到不含尿嘧啶并补充有1%乙醇的合成完全培养基上。转化体生长于YPE (1%乙醇)中,并在30C铺板到补充有1%EtOH并包含5-氟-乳清酸 (0.1%)的合成完全培养基上以选择失去了URA3标记的分离株。通过 PCR确认了kivD_L1(y)的缺失和kivD_Lg(y)的整合,使用了引物 oBP674(SEQ ID NO:333)和oBP830(SEQ ID NO:391)和用YeaStar  Genomic DNA kit(Zymo Research)制备的基因组DNA。正确的分离株在 相同的基因座包含kivD_Lg(y)并从与PNY1528中的kivD_L1(y)相同 的启动子表达,并被命名为PNY1556。

用于实例1-4的一般方法

用质粒转化酵母

如下文所述制备了将用包含KARI的质粒转化的酵母菌株感受态细胞 的等分试样。对于KARI和DHAD基因在独立的质粒上的情况,首先从携 带着包含DHAD质粒(例如pBP915)的细胞制备了感受态细胞。然后用 包含KARI的质粒转化这些感受态细胞。

用来自新鲜点种的平板的一接种环的细胞接种了10mL生长培养基 (对于无质粒的酵母是YPE,对于携带包含DHAD的质粒如pBP915的酵 母是SE-His)。将培养物在30℃摇动过夜。用比色杯分光光度计测量了过 夜培养物的OD600nm,并用计算的量的细胞以0.2的初始OD600nm接种了后续 的30mL培养物。生长培养基对于无质粒的酵母是YPE,或者对于携带包 含DHAD的质粒诸如pBP915的酵母是SE-His。在30℃摇动包含上述 30mL培养物的烧瓶约8小时,直到OD600nm达到约0.7至1.0。在吊桶式转 子中以4000rpm离心25mL的培养物10分钟。弃去上清液,并将沉淀物重 悬在10mL的EZ 1溶液(来自Frozen-EZ Yeast Transformation II Kit,目录 号#T2001,Zymo Research,Orange,Califomia)中。如上文所述离心细胞并 弃去上清液。将沉淀物重悬在1.75mL EZ 2溶液(Zymo Research)中,并 分装在微量离心管中用于冷冻。感受态细胞的等分试样被置于两个同心的 泡沫聚苯乙烯盒中,以延长冷冻过程。将组件置于-80℃冷冻机中。在不少 于12小时之后,将所述等分试样从同心的泡沫聚苯乙烯盒中取出,置入标 准的冷冻盒中。

如下所述用质粒转化了酵母细胞:对于将要转化的每种质粒,将8μL (300-400ng)的质粒DNA溶液分配在1.5mL微量离心管中。在冰上使冷 冻的感受态酵母细胞的等分试样解冻。将20μL的解冻的感受态酵母细胞添 加至每一管,并用移液管将其与DNA混合。将200μL的EZ 3溶液(Zymo  Research)添加至每一管,并用移液管吸打混合。在30℃温育混合物约2 小时,每30-45分钟间歇地涡旋混合。将150μL的每种转化混合物涂布在 SE-Ura或SE-Ura-His平板(对于实验中的质粒而言适当的)上。将平板 密封在顶部自封塑料袋中并于30℃温育,直到菌落出现。

酵母培养条件

有氧培养培养基:具有2g/l乙醇的SE-Ura培养基(或者对于2-质粒 体系实验而言是SE-Ura-His)。

厌氧培养培养基:具有30g/l葡萄糖和1g/l乙醇的SEG-Ura(或者对于 2-质粒体系实验而言是SEG-Ura-His),补充有10mg/l麦角固醇、50mM  MES缓冲剂(pH5.5)、30mg/l硫胺素、和30mg/l烟酸。

48-孔平板:Axygen目录号#P-5ML-48-C-S,5ml/孔总体积,培养物体 积为1.5ml/孔。

对于有氧培养,用可渗透的粘合剂膜覆盖平板。在30℃以225rpm摇 动平板。对于厌氧培养,通过在厌氧室中平衡2小时,对用可渗透的膜覆 盖的新鲜接种的平板清除了氧气。然后将平板的覆盖物更换为带粘性的铝 覆盖物,并将每一平板与新鲜的氧气清除剂包一起置入气密性的塑料盒 中。从厌氧室中取出整个组件(密封的气密性塑料盒中的平板和氧气清除 剂包)并在30℃以225rpm摇动。

实验规程

将SE-Ura或SE-Ura-His琼脂平板(对于所使用的菌株中的质粒适 当的)上的单个的酵母菌落划线接种在相同类型的新鲜琼脂平板上,并于 30℃温育,直到生长出致密的细胞斑。用这些细胞的接种环接种了48-孔平 板中的液体预培养物,用于初始的有氧培养。摇动过夜后,通过将每一孔 中的0.15ml转移至平底96-孔板中并用Molecular Devices酶标仪测量每一 孔在600nm的吸光度,测量了每一培养物孔的OD600。将基于以实验方式 确定的校准线的线性转化应用于这些酶标仪测量的光密度,以将它们转化 为就基于比色杯的分光光度计而言可比较的吸光度值。

将每一有氧预培养孔的经计算的部分接种至具有1.5ml厌氧培养培养 基的新鲜的48-孔平板的相应孔中,以达到0.2(以比色杯分光光度计吸光 度单位计)的初始OD600。在接种新鲜平板的过程中,离心有氧预培养平 板,从每一孔移除了上清液,并将每一孔中的细胞重悬在新鲜的厌氧培养 培养基中,以使从一次培养至下一次培养的代谢物残留最少化。根据实 验,摇动上述厌氧培养平板2-3天。通过HPLC(具有质谱检测器或折光率 检测器)测量了培养物上清液中的异丁醇浓度。

从第一次厌氧培养发起了后续的厌氧培养(“传代周期#2″)如下所 述:将每一厌氧预培养孔的经计算的部分接种至具有1.5ml厌氧培养培养基 的新鲜的48-孔平板的相应孔中,以达到0.2(以比色杯分光光度计单位 计)的初始OD600。在接种新鲜平板的过程中,离心生长平板,从每一孔 移除了上清液,并将每一孔中的细胞重悬在新鲜的厌氧培养培养基中,以 使从一次传代周期至下一次的代谢物残留最少化。根据实验,摇动后续的 (第二周期)厌氧培养平板2-3天。通过HPLC测量了培养物上清液中的异 丁醇浓度,如上文所述。

对于实例1-5,菌株和生长培养基的细节如下:

实例1:用两种质粒转化PNY2204:1)基于SEQ ID NO:162的KARI 质粒和2)作为SEQ ID NO:163给出的质粒,用于变异链球菌(S.mutans) DHAD的表达,并且生长培养基不含尿嘧啶和组氨酸。

实例2:用两种质粒(SEQ ID NO:163和基于SEQ ID NO:162的 KARI变体质粒)转化PNY2238,生长培养基不含尿嘧啶和组氨酸。

实例3:用两种质粒(SEQ ID NO:163和基于SEQ ID NO:162的 KARI变体质粒,如实例1)转化PNY2238,生长培养基不含尿嘧啶和组氨 酸。

实例4:用单种质粒转化PNY2259,生长培养基不含尿嘧啶。

实例5:用单种质粒转化PNYl556,生长培养基不含尿嘧啶。

为了生成用于以两种质粒(上文)转化的菌株的KARI变体质粒,由 DNA 2.0(Menlo Park,CA)生成了KARI变体的编码序列,并亚克隆进基 于SEQ ID NO:162的经修饰的载体。所得的KARI变体质粒(包含KARI 变体65139的编码序列;图7)的示例作为SEQ ID NO:347给出。此类 KARI变体质粒与作为SEQ ID NO:163给出的质粒组合使用,如上文所 述。

为了生成单一质粒,由DNA 2.0(Menlo Park,CA)生成了KARI变体 的编码序列,并亚克隆进经修饰的“单一质粒载体”(SEQ ID NO:162, 图3;经修饰的质粒序列作为SEQ ID NO:348给出),替换了K9D3 KARI 编码区。所得的质粒(用于表达KARI变体SEQ ID NO:159,“76437”也 被称为“R9E8”)的示例作为SEQ ID NO:349给出,图8。

实例1

异丁醇生产途径中生成和测试的变体

表9:KARI变体

表10:测量的异丁醇滴度(来自PNY2204,厌氧传代#2)

实例2

异丁醇生产途径中生成和测试的变体

表11:KARI变体

表12:测量的异丁醇滴度(来自PNY2238,厌氧传代#2)

实例3

异丁醇生产途径中生成和测试的变体

表13:KARI变体

表14:测量的异丁醇滴度(来自PNY2238,厌氧传代#2)

实例4

异丁醇生产途径中生成和测试的变体

表15:KARI变体

表16:测量的异丁醇滴度(来自PNY2259)

实例5

用于异丁醇生产的变体

如关于实例4所述生成并测试了表17中提供的变体,不同的是菌株是 PNY1556(用单一质粒转化的,如上文所述)。厌氧周期1和2为3天时 长,周期3为2天时长。结果在表18中给出。

表17:KARI变体

表18:测量的异丁醇滴度

实例6

通过对残基152、286、336的位点饱和度鉴定合适的取代

在亲本变体R8-SOG1_y2(氨基酸SEQ ID NO:346;核酸SEQ ID NO: 383)的位点152、286、和336处单个地构建并测试了全部20种氨基酸。 上述亲本变体是具有取代A68E、I152V、Y286F、和A336R的JEA1。

一般方法与应用于实例1-4的是相同的。使用了双质粒体系,KARI在 基于pLH556的质粒上,DHAD在pBP915上。酵母菌株是PNY2259。

定点诱变和向基于pLH556的载体中的亚克隆

通过使用诱变引物的重叠-延伸PCR,对位点152进行了诱变。通过酵 母缺口-修复克隆,将KARI插入序列亚克隆进pLH556(移除了KARI)。 通过DNA测序(Sanger方法,ABI Prism 3730xl DNA Analyzer)确认了所 得的质粒的KARI部分和侧翼区的序列。

使用QuikChangeII试剂盒(Agilent)对位点286和336进行了诱变; 位点286在pCR2.1载体(Invitrogen)中,位点336在TOPO Blunt载体 (Invitrogen)中。在Invitrogen载体中对KARI变体测序,然后通过标准的 连接反应亚克隆至pLH556的PmeI和SfiI限制性位点。在pLH556载体中 再次通过测序确认了KARI插入序列。

在下表中将所得的60种变体表征为功能性的(F,定义为支持为亲本 的平均值的至少10%的平均酵母异丁醇生产)或非功能性的(NF,定义为 不支持为亲本的平均值的至少10%的平均酵母异丁醇生产)。

在第二个表中提供了定量数据(占亲本异丁醇滴度的百分比)。数据 基于第一个厌氧传代周期。

表19:取代

氨基酸 位点152(F/NF) 位点286(F/NF) 位点336(F/NF) A,Ala F F F C,Cys F F F D,Asp F NF F E,Glu F NF F

氨基酸 位点152(F/NF) 位点286(F/NF) 位点336(F/NF) F,Phe F F F G,Gly F NF F H,His F F F I,Ile F F F K,Lys F NF F L,Leu F NF F M,Met F F F N,Asn F NF F P,Pro F NF F Q,Gln F NF F R,Arg F NF F S,Ser F NF F T,Thr F NF F V,Val F NF F W,Trp F F F Y,Tyr F F F

表20:用于表24中的取代的定量数据(表示为占亲本的平均异丁醇滴度的百分比)-第一厌氧周期

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号