首页> 中国专利> 用于高效生成瑞鲍迪苷的甜叶菊异贝壳杉烯酸羟化酶变体

用于高效生成瑞鲍迪苷的甜叶菊异贝壳杉烯酸羟化酶变体

摘要

本发明提供了用于在宿主细胞中改进生成甜菊糖苷类化合物的组合物和方法。在一些实施方案,对所述宿主细胞进行遗传修饰以包含编码甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶的异源核苷酸序列。在一些实施方案,所述宿主细胞还包含一种或多种异源核苷酸序列,所述一种或多种异源核苷酸序列编码能够在所述宿主细胞中生成一种或多种甜菊糖苷的途径的其他酶。本发明所述的组合物和方法提供了异源生成甜菊糖苷类化合物(包括但不限于瑞鲍迪苷D和瑞鲍迪苷M)的有效途径。

著录项

说明书

1.发明领域

本发明涉及某些异贝壳杉烯酸羟化酶(KAH),包含所述异贝壳杉烯酸羟化酶的组合物,包含所述异贝壳杉烯酸羟化酶的宿主细胞,以及其用于生成甜菊醇(steviol)和/或瑞鲍迪苷(包括瑞鲍迪苷D和瑞鲍迪苷M)的方法。

2.发明背景

需要源自天然来源的零热量甜味剂来限制高糖消耗(例如,糖尿病类和肥胖症)的不良影响。瑞鲍迪苷M(RebM)是由甜叶菊植物(S.rebaudiana Bertoni)生成的许多甜味化合物之一。在所有的瑞鲍迪苷中,RebM具有最高的效力(比蔗糖甜约200-300倍),口感最纯净。然而,RebM仅由甜叶菊植物少量生成,并且仅占甜菊糖苷(steviol glycoside)总含量的一小部分(<1.0%),Ohta etal.,2010,J.Appl.Glycosci.,57,199-209(2010)。因此,希望使用生物技术途径来生成RebM,从而使其能够大量且高纯度地生成。

为了使用生物技术经济地生成产品,从原料到产品的生物转化中的每个步骤需具有高转化效率(理想地>90%)。在我们生成RebM的酵母工程中,我们在RebM的途径早期便发现了生物合成步骤的局限性,所述途径可将异贝壳杉烯酸(kaurenoic acid)转化为甜菊醇(图1)。

在植物甜叶菊(Stevia rebaudiana)中发现了异贝壳杉烯酸羟化酶(KAH),其通常用于由植物激素前体异贝壳杉烯酸生成C20类异戊二烯类甜菊醇。即使甜叶菊(S.rebaudiana)可积累多达叶干重的约15%的甜菊糖苷类化合物,但通过KAH酶的通量可能并非商业生产酵母中大批量RebM生成所必需的。常规而言,来自甜叶菊(Steviarebaudiana)的野生型KAH酶(Sr.KAH)已被用于在经工程改造以生成RebM的酵母中将异贝壳杉烯酸转化为甜菊醇。

为了高效且高纯度地生成RebM,需要能够高效生成甜菊醇的改进酶。本发明提供的组合物和方法满足了此种需求,并且还提供了相关优点。

3.发明摘要

本发明提供了改进的将异贝壳杉烯酸转化为甜菊醇的组合物和方法。所述这些组合物和方法部分基于能够以非常高的效率将异贝壳杉烯酸转化为甜菊醇的某些异贝壳杉烯酸羟化酶(KAH)的生成。假设市场对RebM的需求为每年50亿吨,即使使用新的KAH进行菌株性能方面的适度改进(例如,改进了10%),则也可能在未来节省超过一千万美元的生产成本。

本发明所述的某些KAH还能够生成含有很少或不含残留异贝壳杉烯酸的甜菊醇。因此,在某些实施方案,本发明所述的组合物和方法可降低下游加工成本以得到具有高产量甜菊糖苷类化合物(例如RebM)的组合物。

一方面,本发明提供了经遗传修饰的宿主细胞及其用于生成工业上有用的化合物的方法。一方面,本发明提供了经遗传修饰的宿主细胞,其包含:编码本发明提供的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶的异源核酸。在一些实施方案,所述经遗传修饰的宿主细胞进一步包含能够生成甜菊醇和/或甜菊糖苷类化合物的一种或多种酶促途径。在某些实施方案,所述经遗传修饰的宿主细胞能够以大于50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、或98%的效率将异贝壳杉烯酸转化为甜菊醇。

另一方面,本发明提供了生成异源甜菊糖苷的方法,所述方法包含:在适于制备所述异源甜菊糖苷化合物的条件下,在含有碳源的培养基中培养本发明提供的经遗传修饰的宿主细胞群,所述经遗传修饰的宿主细胞群能够生成本发明所述的异源甜菊糖苷;和从所述培养基回收所述甜菊糖苷。在一些实施方案,所述异源甜菊糖苷选自由RebD和RebM组成的组。

另一方面,本发明提供了生成RebD的方法,所述方法包含:在适于制备所述RebD的条件下,在含有碳源的培养基中培养本发明提供的能够生成本发明所述RebD的经遗传修饰的宿主细胞群;和从所述培养基回收所述RebD。

另一方面,本发明提供了生成RebM的方法,所述方法包含:在适于制备所述RebM的条件下,在含有碳源的培养基中培养本发明提供的能够生成本发明所述RebM的经遗传修饰的宿主细胞群;和从所述培养基回收所述RebM。

另一方面,本发明提供了生成甜菊醇的方法,所述方法包含:在适于形成甜菊醇的条件下,使异贝壳杉烯酸与本发明所述的异贝壳杉烯酸羟化酶接触,所述异贝壳杉烯酸羟化酶能够将异贝壳杉烯酸转化为甜菊醇。

在一些实施方案,所述宿主细胞是酵母细胞。在一些实施方案,所述酵母是酿酒酵母(Saccharomyces cerevisiae)。在一些实施方案,所述宿主细胞以高效率生成RebD或RebM。在一些实施方案,与不含本发明提供的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽的酵母细胞相比,所述宿主细胞生成增加量的RebD或RebM。

4.附图简要说明

图1提供了由原生酵母代谢产物法呢基焦磷酸(FPP)到瑞鲍迪苷M(RebM)的酶促途径。图中描绘了香叶基香叶基焦磷酸(GGPP)、柯巴基焦磷酸(CPP)和几种瑞鲍迪苷(Reb)。

图2提供了“着陆垫(landing pad)”设计的示意图,所述着陆垫设计用于插入单独的KAH酶以筛选酵母中异贝壳杉烯酸到甜菊醇的转化。

图3提供了Sr.KAH突变体,每个突变体包含单个氨基酸变化,所述突变体具有比野生型Sr.KAH等位基因高至少一个标准偏差的活性。Y轴代表由Sr.KAH变体生成的19-糖苷(菌株1)或Reb M(菌株2)与野生型Sr.KAH生成的19-糖苷或Reb M的比值。

图4提供了导致酵母菌株中体内活性从4.3倍提高到6.3倍的Sr.KAH蛋白突变的组合;在菌株3背景中测定Sr.KAH活性。Y轴是突变型Sr.KAH等位基因相对于野生型Sr.KAH的相对倍数增加;野生型Sr.KAH活性归一化为1。

图5提供了改进的KAH突变体,其与野生型Sr.KAH相比,可导致底物异贝壳杉烯酸减少,这表明具有提高活性的Sr.KAH等位基因可将更多的底物转化为甜菊醇。

图6提供了在第一层(Tier 1)筛选中测得的简并密码子库突变体相对于Sr.KAH突变体#3等位基因的体内KAH活性,如实施例7所述,使用总甜菊糖苷类化合物的滴度(μM)。

5.具体实施方式

5.1术语定义

本发明使用的术语“异源的/异源性/异源”是指通常在自然界中不存在的物质。术语“异源核苷酸序列”是指自然界中在给定细胞中通常不存在的核苷酸序列。因此,异源核苷酸序列可以是:(a)相对于其宿主细胞是外源的(即,对所述细胞而言是“外源的”);(b)天然存在于所述宿主细胞中(即“内源性/內源的/內源”),但在所述细胞中以非天然量存在(即,比所述宿主细胞中天然存在的量更多或更少);或(c)天然存在于所述宿主细胞中,但位于其天然基因座之外。

另一方面,本发明使用的术语“原生的/天然的”或“内源的/内源性/內源”涉及分子,特别是酶和核酸,表示在它们起源或在自然界中发现的生物体中表达的分子。应理解,原生酶或原生多核苷酸的表达可在重组微生物中进行修饰。

本发明使用的术语“亲本细胞”是指与本发明公开的经遗传修饰的宿主细胞具有相同遗传背景的细胞,除了其不包含工程化到所述经修饰的宿主细胞中的一种或多种特定遗传修饰,譬如,选自由以下组成的组的一种或多种修饰:甜菊醇途径的酶的异源表达,甜菊糖苷途径的酶的异源表达,香叶基香叶基焦磷酸合酶的异源表达,柯巴基焦磷酸合酶的异源表达,贝壳杉烯合酶的异源表达,贝壳杉烯氧化酶(例如,豌豆(Pisum sativum)贝壳杉烯氧化酶)的异源表达,甜菊醇合酶(异贝壳杉烯酸羟化酶)的异源表达,细胞色素P450还原酶的异源表达,UGT74G1的异源表达,UGT76G1的异源表达,UGT85C2的异源表达,UGT91D的异源表达,和UGT40087或其变体的异源表达。

本发明使用的术语“天然存在的”是指天然存在的那些物质。譬如,存在于生物体中的异贝壳杉烯酸羟化酶是天然存在的异贝壳杉烯酸羟化酶,其可从自然界中的来源分离得到并且在实验室中未被人有意修饰。相反,本发明使用的术语“非天然存在的”是指在自然界中未发现但通过人为干预生成的那些物质。

术语“培养基”是指培养基和/或发酵培养基。

术语“发酵组合物”是指组合物,所述组合物包含经遗传修饰的宿主细胞和由所述经遗传修饰的宿主细胞生成的产物或代谢物。发酵组合物的实例是全细胞培养液,其可以是容器(例如,烧瓶、平板或发酵罐)的全部内容物,包括细胞、水相和由所述经遗传修饰的宿主细胞生成的化合物。

本发明使用的术语“生成量”通常是指由本发明提供的经遗传修饰的宿主细胞生成的甜菊醇或甜菊糖苷的量。在一些实施方案,生成量表示为由所述宿主细胞生成的甜菊醇或甜菊糖苷的产量。在其他实施方案,生成量表示为生成所述甜菊醇或甜菊糖苷时所述宿主细胞的生产率。

本发明使用的术语“生产率/生产力”是指由宿主细胞生成甜菊醇或甜菊糖苷的量,表示为每单位量的发酵液中生成的甜菊醇或甜菊糖苷的量(按重量计),其中所述宿主细胞根据时间(每小时)进行培养(按体积计)。

本发明使用的术语“产量/产率”是指由宿主细胞生成的甜菊醇或甜菊糖苷的量,表示为宿主细胞消耗的每单位量的碳源生成的甜菊醇或甜菊糖苷的量,按重量计。

本发明使用的术语化合物(例如,RebM、甜菊糖苷类化合物或其他化合物)的“不可检测水平”是指化合物的水平/含量太低而不能通过标准技术来测定和/或分析所述化合物。譬如,所述术语包括由本领域已知分析方法无法检测到的化合物的水平。

术语“贝壳杉烯(kaurene)”是指化合物贝壳杉烯,包括贝壳杉烯的任何立体异构体。在特定实施方案,所述术语是指在本领域中称为内根-贝壳杉烯的对映异构体。在特定实施方案,所述术语是指具有以下结构的化合物:

术语“贝壳杉烯醇(kaurenol)”是指化合物贝壳杉烯醇,包括贝壳杉烯醇的任何立体异构体。在特定实施方案,所述术语是指在本领域中称为内根-贝壳杉烯醇的对映异构体。在特定实施方案,所述术语是指具有以下结构的化合物:

术语“贝壳杉烯醛(kaurenal)”是指化合物贝壳杉烯醛,包括贝壳杉烯醛的任何立体异构体。在特定实施方案,所述术语是指在本领域中称为内根-贝壳杉烯醛的对映异构体。在特定实施方案,所述术语是指具有以下结构的化合物:

术语“贝壳杉烯酸/异贝壳杉烯酸(kaurenoic acid)”是指化合物异贝壳杉烯酸,包括异贝壳杉烯酸的任何立体异构体。在特定实施方案,所述术语是指在本领域中称为内根-异贝壳杉烯酸的对映异构体。在特定实施方案,所述术语是指具有以下结构的化合物:

术语“甜菊醇(steviol)”是指化合物甜菊醇,包括甜菊醇的任何立体异构体。在特定实施方案,所述术语是指具有以下结构的化合物:

本发明使用的术语“甜菊糖苷/甜菊醇糖苷/甜菊糖苷类化合物(steviolglycoside(s))”是指甜菊醇的糖苷,包括但不限于,天然存在的甜菊糖苷类化合物,例如天然存在的甜菊单糖苷、甜菊双糖苷、甜茶苷、杜克苷B、杜克苷A、瑞鲍迪苷B、瑞鲍迪苷G、甜菊苷(stevioside)、瑞鲍迪苷C、瑞鲍迪苷F、瑞鲍迪苷A、瑞鲍迪苷I、瑞鲍迪苷E、瑞鲍迪苷H、瑞鲍迪苷L、瑞鲍迪苷K、瑞鲍迪苷J、瑞鲍迪苷M、瑞鲍迪苷D、瑞鲍迪苷N、瑞鲍迪苷O,合成甜菊糖苷类化合物例如酶促糖基化的甜菊糖苷类化合物,及其组合。

本发明使用的术语“变体”是指通过氨基酸插入、缺失、突变和/或置换而不同于具体列举的“参考”多肽(例如,野生型序列)的多肽,但保留与所述参考多肽基本相似的活性。在一些实施方案,所述变体通过重组DNA技术或通过诱变而产生。在一些实施方案,变体多肽与其参考多肽的不同之处在于一个碱基残基置换另一个碱基残基(即,Arg置换Lys),一个疏水残基置换另一个疏水残基(即,Leu置换Ile),或一个芳香族残基置换另一个芳香族残基(即,Phe置换Tyr)等。在一些实施方案,变体包括类似物,其中实现保守置换导致所述参考序列的基本结构类似。此类保守置换的实例包括但不限于,谷氨酸置换天冬氨酸,反之亦然;谷氨酰胺置换天冬酰胺,反之亦然;丝氨酸置换苏氨酸,反之亦然;赖氨酸置换精氨酸,反之亦然;或者任何异亮氨酸、缬氨酸或亮氨酸之间的彼此置换。

在上下文中或两个或更多个核酸或蛋白质序列中,本发明使用的术语“序列同一性”或“同一性百分比”是指两个或更多个序列或子序列是相同,或所述序列或子序列具有特定百分比的相同氨基酸残基或核苷酸。譬如,当进行比较和比对以在比较窗口上进行最大对应,或者使用序列比较算法或通过手动比对和目视检查进行测定的指定区域时,所述序列可在所述指定区域与参考序列具有至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或更高的同一性。譬如,通过计算所述序列中相同核苷酸(或氨基酸残基)的数量除以总核苷酸(或氨基酸残基)的长度减去任何空位(gap)的长度的比值来确定同一性百分比。

为方便起见,可使用本领域已知的计算机程序和数学算法来确定两个序列之间的同一性程度。计算序列同一性百分比的此类算法通常考虑所述比较区域上的序列空位和错配。用于比较和比对序列的程序,如Clustal W(序列比对W)(Thompson etal.,(1994)Nucleic Acids Res.,22:4673-4680),ALIGN(Myers et al.,(1988)CABIOS,4:11-17),FASTA(Pearson etal.,(1988)PNAS,85:2444-2448;Pearson(1990),Methods Enzymol.,183:63-98),以及空位的BLAST(Altschul et al.,(1997)Nucleic Acids Res.,25:3389-3402),均可用于此目的。所述BLAST或BLAST 2.0(Altschul et al.,J.Mol.Biol.215:403-10,1990)可从若干来源得到,包括国家生物信息中心(NCBI)和因特网,用于与序列分析程序BLASTP、BLASTN、BLASTX、TBLASTN和TBLASTX结合使用。更多信息可从NCBI网站上获悉。

在一些实施方案,序列比对和同一性百分比计算可使用BLAST程序采用其标准默认参数来确定。对于核苷酸序列比对和序列同一性计算,BLASTN程序可以其默认参数(空位开放罚分(Gap opening penalty)=5,空位延伸罚分(Gap extension penalty)=2,核匹配(Nucleic match)=2,核不匹配(Nucleic mismatch)=-3,期望值(Expectation value)=10.0,字大小(Word size)=11,查询范围中的最大匹配数=0)进行使用。对于多肽序列比对和序列同一性计算,BLASTP程序可以其默认参数(比对矩阵(Alignment matrix)=BLOSUM62;空位损失(Gap costs):存在(Existence)=11,扩展(Extension)=1;组成调整(Compositional adjustments)=条件组成得分(Conditional compositional score),矩阵调整;期望值=10.0;字大小(Word size)=6;查询范围中的最大匹配数=0)进行使用。或者,使用以下程序和参数:克隆管理组件(Clone Manager Suite)的比对加强版(AlignPlus)软件,版本5(Sci-Ed软件);DNA比较:总体比较(Global comparison),标准线性评分矩阵(Standard Linear Scoring matrix),不匹配罚分=2,开放空位罚分=4,延伸空位罚分=1。氨基酸比较:总体比较,BLOSUM 62评分矩阵。在本发明所述的实施方案中,使用BLASTN或BLASTP程序使用其默认参数来计算序列同一性。在本发明所述的实施方案中,使用Clustal W使用建议的默认参数进行两个或更多个序列的序列比对(Dealign输入序列:否;Mbed样聚类引导树(Mbed-like clustering guide-tree):是;Mbed样聚类迭代(Mbed-like clustering iteration):是;组合迭代次数:默认(0);最大引导树迭代次数(Maxguide tree iterations):默认;最大HMM迭代次数:默认;指令(Order):输入(input))。

5.2异贝壳杉烯酸羟化酶多肽、核酸及宿主细胞

一方面,本发明提供了经修饰的异贝壳杉烯酸羟化酶多肽,其与野生型异贝壳杉烯酸羟化酶多肽相比,包括一个或多个氨基酸残基的修饰。在某些实施方案,所述野生型异贝壳杉烯酸羟化酶是甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶,即Sr.KAH。在某些实施方案,所述野生型异贝壳杉烯酸羟化酶多肽具有SEQ ID NO:1提供的氨基酸序列。在某些实施方案,可通过相对于SEQ ID NO:1的标准比对技术,包括本发明所述的那些,来确定实际残基编号。在特定实施方案,本发明提供了编码所述多肽的核酸。在特定实施方案,所述多肽保留作为异贝壳杉烯酸羟化酶的活性,以将异贝壳杉烯酸转化为甜菊醇。在优选实施方案,例如,与Sr.KAH相比,所述经修饰的异贝壳杉烯酸羟化酶多肽具有改善的活性。

本发明还提供了包含一种或多种本发明所提供的异贝壳杉烯酸羟化酶多肽或核酸的宿主细胞。在某些实施方案,所述宿主细胞可由作为起始物料的异贝壳杉烯酸生成甜菊醇。在特定实施方案,所述宿主细胞可由培养基中的碳源生成甜菊醇。在特定实施方案,所述宿主细胞可由培养基中的碳源生成甜菊醇,并可由所述甜菊醇进一步生成RebA或RebD。在特定实施方案,所述宿主细胞可进一步由所述RebD生成瑞鲍迪苷M(RebM)。

在某些实施方案,本发明提供了异贝壳杉烯酸羟化酶多肽,其包含下列突变中的1、2、3、4、5、6、7、8、9、10、或11个:I166R、I153L、S158D、G306L、L232D、I333V、I350L、V316L、G447V、和M308L。在某些实施方案,所述多肽的残基编号均根据SEQ ID NO:1。在某些实施方案,本发明提供了与SEQ ID NO:1同源并包含1、2、3、4、5、6、7、8、9、10、或11个下列突变的多肽:I166R、I153L、S158D、G306L、L232D、I333V、I350L、V316L、G447V、和M308L。在任一前述实施方案,所述多肽包含异源氨基端结构域。

在某些实施方案,本发明提供了与SEQ ID NO:1同源的多肽,其提供了与SEQ IDNO:1相关的残基编号,其中可通过相对于SEQ ID NO:1的标准比对技术,包括本发明所述的那些,来确定实际残基编号。

在某些实施方案,本发明提供了包含下列突变的异贝壳杉烯酸羟化酶多肽:I166R和I333V。在某些实施方案,所述残基编号均根据SEQ ID NO:1。

在某些实施方案,本发明提供了包含下列突变的异贝壳杉烯酸羟化酶多肽:I166R、I350L、和G447V。在某些实施方案,所述残基编号均根据SEQ ID NO:1。

在某些实施方案,本发明提供了包含下列突变的异贝壳杉烯酸羟化酶多肽:I153L、S158D、I166R、L232D、I333V、和I350L。在某些实施方案,所述残基编号均根据SEQ IDNO:1。

在任一前述实施方案,本发明提供的异贝壳杉烯酸羟化酶多肽进一步包含选自下列的一个或多个突变:E492C、M427A、G306D、V333C、D191L、I40S、L445I、S114A、D191Y、D191F、L497R、G306L、N29G、T167G、T164S、Q415H、T89A、L13D、R258T、和L13V。在某些实施方案,所述残基编号均根据SEQ ID NO:1。

在任一前述实施方案,本发明提供的异贝壳杉烯酸羟化酶多肽进一步包含选自下列的一个或多个突变:L13D、R258F、和L13V。在某些实施方案,所述残基编号均根据SEQ IDNO:1。

在某些实施方案,本发明提供了异贝壳杉烯酸羟化酶多肽,其包含下列突变:S158D、G306L、和I350L。在某些实施方案,所述残基编号均根据SEQ ID NO:1。

在某些实施方案,本发明提供了异贝壳杉烯酸羟化酶多肽,其包含下列突变:G306L、V316L、I350L、和G447V。在某些实施方案,所述残基编号均根据SEQ ID NO:1。

在某些实施方案,本发明提供了异贝壳杉烯酸羟化酶多肽,其包含下列突变:G306L、V316L、I333V、和I350L。在某些实施方案,所述残基编号均根据SEQ ID NO:1。

在某些实施方案,本发明提供了异贝壳杉烯酸羟化酶多肽,其包含下列突变:S158D、I166R、L232D、G306L、和I333V。在某些实施方案,所述残基编号均根据SEQ ID NO:1。

在某些实施方案,本发明提供了异贝壳杉烯酸羟化酶多肽,其包含下列突变:L232D、G306L、V316L、I333V、和I350L。在某些实施方案,所述残基编号均根据SEQ ID NO:1。

在某些实施方案,本发明提供了异贝壳杉烯酸羟化酶多肽,其包含下列突变:I166R、L232D、G306L、和I350L。在某些实施方案,所述残基编号均根据SEQ ID NO:1。

在某些实施方案,本发明提供了异贝壳杉烯酸羟化酶多肽,其包含下列突变:S158D、I166R、G306L、M308L、V316L、和I350L。在某些实施方案,所述残基编号均根据SEQ IDNO:1。

在某些实施方案,本发明提供了异贝壳杉烯酸羟化酶多肽,其包含下列突变中的至少一个:Y62H、T164R、L76V、Q415L、A60Y、S182C、T167N、Y52H、R266D、T167H、I153L、K100L、G306C、Q120N、L232H、I333V、G351R、L232S、I166S、W447C、I443Y、I166N、N355Y、L232D、S158D、A442G、G306N、V316L、M308L、G447F、G306I、G306V、I350L、G447V、I166R、和G306L。在某些实施方案,所述残基编号均根据SEQ ID NO:1。

在某些实施方案,本发明提供了任一前述实施方案所示的异贝壳杉烯酸羟化酶多肽,其进一步包含下列突变中的至少一个:E492C、M427A、G306D、V333C、D191L、I40S、L445I、S114A、D191Y、D191F、L497R、G306L、N29G、T167G、T164S、Q415H、T89A、L13D、R258T、和L13V。在某些实施方案,所述残基编号均根据SEQ ID NO:1。

在某些实施方案,本发明提供了嵌合异贝壳杉烯酸羟化酶多肽,其包含甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶的催化结构域和内质网(ER)结合蛋白的N端跨膜结构域,其中所述N端跨膜结构域共价连接至所述催化结构域。在进一步的实施方案,所述嵌合异贝壳杉烯酸水解酶多肽进一步包含下列突变中的至少一个:Y62H、T164R、L76V、Q415L、A60Y、S182C、T167N、Y52H、R266D、T167H、I153L、K100L、G306C、Q120N、L232H、I333V、G351R、L232S、I166S、W447C、I443Y、I166N、N355Y、L232D、S158D、A442G、G306N、V316L、M308L、G447F、G306I、G306V、I350L、G447V、I166R、和G306L。在某些实施方案,所述残基编号均根据SEQ ID NO:1。

在某些实施方案,本发明提供了嵌合异贝壳杉烯酸羟化酶多肽,其包含甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶的催化结构域和ATR2的N端跨膜结构域,其中所述N端跨膜结构域共价连接至所述催化结构域。

在某些实施方案,本发明提供了嵌合异贝壳杉烯酸羟化酶多肽,其包含甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶的催化结构域以及ATR2的N端跨膜结构域,其中所述催化结构域包含甜叶菊异贝壳杉烯酸羟化酶的第23至500位氨基酸,其中所述N端结构域包含第1至72位氨基酸,和其中所述N端跨膜结构域共价连接至所述催化结构域。在某些实施方案,所述嵌合异贝壳杉烯酸羟化酶的N端结构域包含SEQ ID No.22的第1至72位氨基酸。在某些实施方案,所述催化结构域包含SEQ ID No.1的第23至500位氨基酸。

在某些实施方案,本发明提供的催化结构域包含甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶的第5至500位氨基酸。

在某些实施方案,本发明提供的催化结构域包含甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶的第23至500位氨基酸。

在某些实施方案,本发明提供的催化结构域包含甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶的第47至500位氨基酸。

在某些实施方案,所述嵌合异贝壳杉烯酸羟化酶多肽的N端结构域包含拟南芥(Arabidopsis thaliana)ATR2蛋白的第1至72位氨基酸。在某些实施方案,所述N端结构域包含SEQ ID No.22的第1至72位氨基酸。

在某些实施方案,所述嵌合异贝壳杉烯酸羟化酶多肽的N端结构域包含拟南芥(Arabidopsis thaliana)ATR2蛋白的第1至50位氨基酸。在某些实施方案,所述N端结构域包含SEQ ID No.22的第1至50位氨基酸。

在任一前述实施方案,所述嵌合异贝壳杉烯酸羟化酶多肽进一步包含位于下列异贝壳杉烯酸羟化酶位置处的至少一个突变:E492C、M427A、G306D、V333C、D191L、I40S、L445I、S114A、D191Y、D191F、L497R、G306L、N29G、T167G、T164S、Q415H、T89A、L13D、R258T、和L13V,其根据SEQ ID NO.1。

在某些实施方案,本发明提供了异贝壳杉烯酸羟化酶多肽,其包含异源氨基端结构域。在某些实施方案,包含异源氨基端结构域的异贝壳杉烯酸羟化酶多肽亦称为嵌合异贝壳杉烯酸羟化酶多肽。

在某些实施方案,本发明提供了被异源氨基端结构域置换的异贝壳杉烯酸羟化酶多肽的经置换的氨基端区段。在一些实施方案,根据SEQ ID NO:1的残基位置,本发明提供的所述经置换的氨基端区段(去除的区段)包含来自全长异贝壳杉烯酸羟化酶多肽的N端的4、22或46个氨基酸。在一些实施方案,根据SEQ ID NO:1的残基位置,本发明提供的所述经置换的氨基端区段包含来自异贝壳杉烯酸羟化酶多肽的N端的1至4位氨基酸的缺失。在一些实施方案,根据SEQ ID NO:1的残基位置,本发明提供的所述经置换的氨基端区段包含来自异贝壳杉烯酸羟化酶多肽的N端的1至5位氨基酸的缺失。在一些实施方案,根据SEQ IDNO:1的残基位置,本发明提供的所述经置换的氨基端区段包含来自异贝壳杉烯酸羟化酶多肽的N端的1至10位氨基酸的缺失。在一些实施方案,根据SEQ ID NO:1的残基位置,本发明提供的所述经置换的氨基端区段包含来自异贝壳杉烯酸羟化酶多肽的N端的1至15位氨基酸的缺失。在一些实施方案,根据SEQ ID NO:1的残基位置,本发明提供的所述经置换的氨基端区段包含来自异贝壳杉烯酸羟化酶多肽的N端的1至20位氨基酸的缺失。在一些实施方案,根据SEQ ID NO:1的残基位置,本发明提供的所述经置换的氨基端区段包含来自异贝壳杉烯酸羟化酶多肽的N端的1至22位氨基酸的缺失。在一些实施方案,根据SEQ ID NO:1的残基位置,本发明提供的所述经置换的氨基端区段包含来自异贝壳杉烯酸羟化酶多肽的N端的1至25位氨基酸的缺失。在一些实施方案,根据SEQ ID NO:1的残基位置,本发明提供的所述经置换的氨基端区段包含来自异贝壳杉烯酸羟化酶多肽的N端的1至30位氨基酸的缺失。在一些实施方案,根据SEQ ID NO:1的残基位置,本发明提供的所述经置换的氨基端区段包含来自异贝壳杉烯酸羟化酶多肽的N端的1至35位氨基酸的缺失。在一些实施方案,根据SEQID NO:1的残基位置,本发明提供的所述经置换的氨基端区段包含来自异贝壳杉烯酸羟化酶多肽的N端的1至40位氨基酸的缺失。在一些实施方案,根据SEQ ID NO:1的残基位置,本发明提供的所述经置换的氨基端区段包含来自异贝壳杉烯酸羟化酶多肽的N端的1至45位氨基酸的缺失。在一些实施方案,根据SEQ ID NO:1的残基位置,本发明提供的所述经置换的氨基端区段包含来自异贝壳杉烯酸羟化酶多肽的N端的1至46位氨基酸的缺失。

在一些实施方案,本发明提供的所述经置换的异源氨基端结构域(添加的区段)来自异源蛋白质。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域是内质网(ER)结合蛋白的N端跨膜结构域。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域来自ATR2(拟南芥(Arabidopsis thaliana)细胞色素P450还原酶),Aa.CPR(青蒿(Artemisia annua)),Sr.KO(甜叶菊(Stevia rebaudiana)贝壳杉烯氧化酶),ERG11(酿酒酵母(Saccharomyces cerevisiae)膜蛋白),ALG11(酿酒酵母膜蛋白),SEC66(酿酒酵母膜蛋白),NUS1(酿酒酵母膜蛋白),RCR1(酿酒酵母膜蛋白),或UBP1(酿酒酵母膜蛋白)。

在某些实施方案,所述异源氨基端区段选自SEQ ID NO:33至SEQ ID NO:40中任一个的氨基端。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至10位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至20位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至23位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至25位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至30位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至35位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至40位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至45位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至50位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至51位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至52位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至55位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至60位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至62位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至65位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至66位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至70位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至72位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至75位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至80位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至85位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至90位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至95位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至100位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至105位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至110位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至115位氨基酸。在一些实施方案,本发明提供的所述经置换的异源氨基端结构域包含异源蛋白质的第1至119位氨基酸。

在某些实施方案,本发明提供了异贝壳杉烯酸羟化酶多肽,其包含异源氨基端区段。在某些实施方案,异贝壳杉烯酸羟化酶多肽的氨基端区段被异源氨基端结构域置换。在一些实施方案,所述经置换的氨基端区段(去除的区段)具有4-42个氨基酸。在一些实施方案,所述经置换的氨基端区段具有4、22、38或42个氨基酸。在一些实施方案,所述异源氨基端区段(添加的区段,替换所述去除的区段)来自ATR2(拟南芥(Arabidopsis thaliana)细胞色素P450还原酶),CYP816(来自檀香(Santalum album)的细胞色素P450),或Sr.KO(甜叶菊(Stevia rebaudiana)贝壳杉烯氧化酶)。在某些实施方案,所述异源氨基端区段选自SEQID NO:2至SEQ ID NO:6中任一个的氨基端区段。在某些实施方案,22个氨基端氨基酸被SEQID NO:2的氨基端区段置换。在某些实施方案,4个氨基端氨基酸被SEQ ID NO:3的氨基端区段置换。在某些实施方案,42个氨基端氨基酸被SEQ ID NO:4的氨基端区段置换。在某些实施方案,4个氨基端氨基酸被SEQ ID NO:5的氨基端区段置换。在某些实施方案,38个氨基端氨基酸被SEQ ID NO:6的氨基端区段置换。在某些实施方案,本段落的任何置换均可与上述一种或多种突变中的任一种进行组合。

在某些实施方案,根据上述实施方案的异贝壳杉烯酸羟化酶多肽生成的甜菊醇和甜菊糖苷类化合物比根据SEQ ID NO:1的野生型甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽生成的甜菊醇和甜菊糖苷类化合物多至少1.5倍、至少2.0倍、至少2.5倍、至少3.0倍、至少3.5倍、至少4.0倍、至少4.5倍、至少5.0倍、至少5.5倍、或至少6.0倍。

在某些实施方案,所述经修饰的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽能够高效地将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述经修饰的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽能够以大于30%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述经修饰的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽能够以大于35%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述经修饰的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽能够以大于40%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述经修饰的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽能够以大于50%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述经修饰的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽能够以大于60%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述经修饰的甜叶菊(Steviarebaudiana)异贝壳杉烯酸羟化酶多肽能够以大于70%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述经修饰的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽能够以大于80%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述经修饰的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽能够以大于90%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述经修饰的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽能够以大于95%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述经修饰的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽能够以大于60%、65%、70%、75%、80%、85%、90%、或95%的效率将异贝壳杉烯酸转化为甜菊醇。

在某些实施方案,所述宿主细胞能够以大于30%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述宿主细胞能够以大于35%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述宿主细胞能够以大于40%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述宿主细胞能够以大于45%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述宿主细胞能够以大于50%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述宿主细胞能够以大于55%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述宿主细胞能够以大于58%的效率将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,所述宿主细胞能够以大于60%、65%、70%、75%、80%、85%、90%、或95%的效率将异贝壳杉烯酸转化为甜菊醇。

转化效率可通过本领域技术人员显而易见的任何技术进行测定。在某些实施方案,转化效率可通过在适于形成甜菊醇的条件下,使异贝壳杉烯酸与酶或宿主细胞接触来测定。效率可通过将所生成的甜菊醇的摩尔量与所得组合物中异贝壳杉烯酸的总量进行比较来测定。效率还可通过将所得组合物中的甜菊醇和甜菊醇的下游产物的总量与异贝壳杉烯酸、甜菊醇、以及甜菊醇的下游产物的总量进行比较来测定。

在某些实施方案,本发明提供了宿主细胞,其包含异贝壳杉烯酸羟化酶多肽,所述异贝壳杉烯酸羟化酶多肽包含本发明所述的氨基酸序列且能够将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,本发明提供了宿主细胞,其包含异贝壳杉烯酸羟化酶多肽,所述异贝壳杉烯酸羟化酶多肽包含本发明所述的氨基酸序列且能够氧化异贝壳杉烯酸的第13位。在某些实施方案,本发明提供了宿主细胞,其包含异贝壳杉烯酸羟化酶多肽,所述异贝壳杉烯酸羟化酶多肽能够以大于30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、或97%的效率将异贝壳杉烯酸转化为甜菊醇,和其中所述异贝壳杉烯酸羟化酶多肽包含与SEQ ID NO:1的氨基酸序列具有至少95%序列同一性的氨基酸序列。

在本发明所述实施方案中,任何合适的方法均可用于确定两个多肽的相应氨基酸位置或相应环路(loop)位置。在某些实施方案,异贝壳杉烯酸羟化酶多肽和参考序列SEQID NO:1的所述序列均可采用Clustal(W或Omega)使用其默认参数进行比对。在其他实施方案,异贝壳杉烯酸羟化酶多肽和参考序列SEQ ID NO:1的所述序列均可采用结构比对进行比对,例如SWISS-MODEL,其是蛋白质结构同源性建模服务器,可通过ExPASy网络服务器或DeepView(Swiss Pdb-Viewer)程序访问。

尽管宿主细胞的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽或任何变体甜叶菊异贝壳杉烯酸羟化酶多肽接受异贝壳杉烯酸作为底物,但所述异贝壳杉烯酸的来源可以是本领域技术人员认为合适的任何来源。在某些实施方案,所述甜叶菊(Steviarebaudiana)异贝壳杉烯酸羟化酶多肽或任何变体甜叶菊异贝壳杉烯酸羟化酶多肽可与异贝壳杉烯酸接触。在某些实施方案,所述甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽或任何变体甜叶菊异贝壳杉烯酸羟化酶多肽可与包含异贝壳杉烯酸的组合物接触。在某些实施方案,所述组合物衍生自或源自分离自甜叶菊(Stevia rebaudiana)叶的天然产物。在某些实施方案,所述组合物是微生物衍生或来源的。在某些实施方案,可使宿主细胞与包含一种或多种碳源的组合物接触。

在某些实施方案,可采用本领域已知的任何合适的方法来筛选适合催化所需反应的任何甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽。譬如,合适的变体甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽可通过以下方式进行体内测定:表达编码变体甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽的异源核酸,并筛选细胞,所述细胞生成能够在底物的所需位置(例如,异贝壳杉烯酸的C-13位)催化氧化的功能性甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽。示例性筛选方法在以下实施例中描述。在另一个实施例,合适的变体甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽可通过使变体甜叶菊异贝壳杉烯酸羟化酶多肽与底物(例如异贝壳杉烯酸)接触来进行体外筛选。在此实施例中,测定甜菊醇或甜菊糖苷(例如RebD)的存在可用作确定甜叶菊(Steviarebaudiana)异贝壳杉烯酸羟化酶多肽是否为合适的酶的试验。可通过LC-MS或本领域其他已知方法来分析所述反应。参见,例如WO2013/022989。

在某些实施方案,如果变体甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶多肽能够在体内以大于30%、40%、50%、60%、70%、80%、90%、95%、96%、或97%的效率将异贝壳杉烯酸转化为甜菊醇,则认为所述变体甜叶菊异贝壳杉烯酸羟化酶多肽适合于将异贝壳杉烯酸转化为甜菊醇。

在有利的实施方案中,宿主细胞可包含能够制备异贝壳杉烯酸的一种或多种酶促途径,所述途径可单独使用或一同使用。如本发明所述,宿主细胞包含本发明提供的甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶,其能够将异贝壳杉烯酸转化为甜菊醇。在某些实施方案,宿主细胞还包含能够将法呢基焦磷酸转化为香叶基香叶基焦磷酸的一种或多种酶。在某些实施方案,宿主细胞还包含能够将香叶基香叶基焦磷酸转化为柯巴基焦磷酸的一种或多种酶。在某些实施方案,宿主细胞还包含能够将柯巴基焦磷酸转化为贝壳杉烯的一种或多种酶。在某些实施方案,宿主细胞还包含能够将贝壳杉烯转化为异贝壳杉烯酸的一种或多种酶。在某些实施方案,宿主细胞还包含能够将甜菊醇转化为一种或多种甜菊糖苷的一种或多种酶。在某些实施方案,宿主细胞还包含能够一同将甜菊醇转化为RebA的1、2、3、4或更多种酶。在某些实施方案,宿主细胞还包含能够将RebA转化为RebD的一种或多种酶。在某些实施方案,宿主细胞还包含能够将RebD转化为RebM的一种或多种酶。有用的酶和编码所述酶的核酸均是本领域技术人员已知的。特别有用的酶和核酸均描述于以下章节中,并进一步描述于例如US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188、WO2016/038095A2和US 2016/0198748A1中。

在进一步的实施方案,所述宿主细胞还包含能够从碳源制备香叶基香叶基焦磷酸的一种或多种酶。所述这些包括DXP途径的酶类和MEV途径的酶类。有用的酶和编码所述酶的核酸均是本领域技术人员已知的。每种途径的示例性酶类描述于以下章节中,并进一步描述于例如US 2016/0177341A1中。

在某些实施方案,所述宿主细胞包含选自由以下组成的组的一种或多种或所有类异戊二烯途径酶:(a)使两分子乙酰辅酶A缩合形成乙酰乙酰辅酶A的酶(例如,乙酰辅酶A硫解酶);(b)使乙酰乙酰辅酶A与另一分子乙酰辅酶A缩合形成3-羟基-3-甲基戊二酰-辅酶A(HMG-CoA)的酶(例如,HMG-CoA合酶);(c)使HMG-CoA转化为甲羟戊酸的酶(例如,HMG-CoA还原酶);(d)使甲羟戊酸转化为甲羟戊酸5-磷酸的酶(例如,甲羟戊酸激酶);(e)使甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸的酶(例如,磷酸甲羟戊酸激酶);(f)使甲羟戊酸5-焦磷酸转化为异戊烯二磷酸(IPP)的酶(例如,甲羟戊酸焦磷酸脱羧酶);(g)使IPP转化为二甲基烯丙基焦磷酸(DMAPP)的酶(例如,IPP异构酶);(h)可缩合IPP和/或DMAPP分子以形成含有五个以上碳原子的聚异戊二烯基化合物的聚异戊二烯基合酶;(i)使IPP与DMAPP缩合形成香叶基焦磷酸(GPP)的酶(例如,GPP合酶);(j)使两分子IPP与一分子DMAPP缩合的酶(例如,FPP合酶);(k)使IPP与GPP缩合形成法呢基焦磷酸(FPP)的酶(例如,FPP合酶);(l)使IPP与DMAPP缩合形成香叶基香叶基焦磷酸(GGPP)的酶;和(m)使IPP与FPP缩合形成GGPP的酶。

在某些实施方案,所述另外的酶是原生或天然的。在有利的实施方案中,所述另外的酶是异源的。在某些实施方案,两种或两种以上的酶可在一种多肽中进行组合。

5.3细胞菌株

可用于本发明提供的组合物和方法的宿主细胞包括古细菌细胞、原核细胞或真核细胞。

合适的原核宿主包括但不限于,多种革兰氏阳性、革兰氏阴性或革兰氏变种细菌中的任一种。实例包括但不限于,属于以下属的细胞:土壤杆菌属(Agrobacterium),脂环酸芽孢杆菌属(Alicyclobacillus),鱼腥藻属(Anabaena),蓝细菌属(Anacystis),节细菌属(Arthrobacter),固氮菌属(Azobacter),芽孢杆菌属(Bacillus),短杆菌属(Brevibacterium),着色菌属(Chromatium),梭菌属(Clostridium),棒状杆菌属(Corynebacterium),肠杆菌属(Enterobacter),欧文氏菌属(Erwinia),埃希氏杆菌属(Escherichia),乳酸杆菌属(Lactobacillus),乳球菌属(Lactococcus),中慢生根瘤菌属(Mesorhizobium),甲基杆菌属(Methylobacterium),细杆菌属(Microbacterium),席藻属(Phormidium),假单胞菌属(Pseudomonas),红细菌属(Rhodobacter),红假单胞菌属(Rhodopseudomonas),红螺菌属(Rhodospirillum),红球菌属(Rhodococcus),沙门氏菌属(Salmonella),栅藻属(Scenedesmun),沙雷氏菌属(Serratia),志贺氏菌属(Shigella),葡萄球菌属(Staphlococcus),链霉菌属(Strepromyces),聚球蓝细菌属(Synnecoccus)和发酵单胞菌属(Zymomonas)。原核菌株的实例包括但不限于:枯草芽孢杆菌(Bacillussubtilis),解淀粉芽孢杆菌(Bacillus amyloliquefacines),产氨短杆菌(Brevibacterium ammoniagenes),嗜氨短杆菌(Brevibacterium immariophilum),拜氏梭菌(Clostridium beigerinckii),阪崎肠杆菌(Enterobactersakazakii),大肠杆菌(Escherichia coli),乳酸乳球菌(Lactococcus lactis),百脉根中生根瘤菌(Mesorhizobium loti),绿脓假单胞菌(Pseudomonas aeruginosa),迈氏假单胞菌(Pseudomonas mevalonii),普迪卡假单胞菌(Pseudomonaspudica),荚膜红细菌(Rhodobactercapsulatus),类球红细菌(Rhodobactersphaeroides),深红红螺菌(Rhodospirillum rubrum),肠道沙门氏菌(Salmonella enterica),伤寒沙门氏菌(Salmonella typhi),鼠伤寒沙门氏菌(Salmonella typhimurium),痢疾志贺氏菌(Shigella dysenteriae),福氏志贺菌(Shigellaflexneri),宋内志贺菌(Shigellasonne)和金黄色葡萄球菌(Staphylococcus aureus)。在特定实施方案,所述宿主细胞是大肠杆菌(Escherichia coli)细胞。

合适的古细菌宿主包括但不限于属于以下属的细胞:气火菌属(Aeropyrum),古球菌属(Archaeglobus),盐杆菌属(Halobacterium),产甲烷球菌属(Methanococcus),甲烷杆菌属(Methanobacterium),火球菌属(Pyrococcus),硫化叶菌属(Sulfolobus),和热原体属(Thermoplasma)。古细菌菌株的实例包括但不限于:闪烁古生球菌(Archaeoglobusfulgidus),盐杆菌属(Halobacterium sp.),詹氏甲烷球菌(Methanococcusjannaschii),嗜热自养甲烷杆菌(Methanobacteriumthermoautotrophicum),嗜酸热原体(Thermoplasma acidophilum),火山热原体(Thermoplasma volcanium),掘越氏热球菌(Pyrococcus horikoshii),深海火球菌(Pyrococcus abyssi),和敏捷气热菌(Aeropyrum pernix)。

合适的真核宿主包括但不限于真菌细胞、藻类细胞、昆虫细胞和植物细胞。在一些实施方案,可用于本发明方法的酵母包括已被微生物保藏中心(例如,IFO、ATCC等)保藏并属于以下属的酵母:芽孢酵母属(Aciculoconidium),神食酵母属(Ambrosiozyma),节束酵母属(Arthroascus),Arxiozyma,阿舒囊霉属(Ashbya),Babjevia,本森顿酵母属(Bensingtonia),Botryoascus,Botryozyma,酒香酵母属(Brettanomyces),布勒掷孢酵母属(Bullera),布勒担孢酵母属(Bulleromyces),假丝酵母属(Candida),固囊酵母属(Citeromyces),棒孢酵母属(Clavispora),隐球菌属(Cryptococcus),产黑色素酵母属(Cystofilobasidium),德巴利氏酵母属(Debaryomyces),德克酵母属(Dekkara),拟双足囊菌属(Dipodascopsis),双足囊菌属(Dipodascus),Eeniella,Endomycopsella,Eremascus,假囊酵母属(Eremothecium),担孢酵母属(Erythrobasidium),Fellomyces,线黑粉酵母属(Filobasidium),耐碱酵母属(Galactomyces),地丝菌属(Geotrichum),季氏酵母属(Guilliermondella),有孢汉逊酵母属(Hanseniaspora),汉逊酵母属(Hansenula),Hasegawaea,胶珊瑚属(Holtermannia),Hormoascus,生丝毕赤酵母属(Hyphopichia),伊萨酵母属(Issatchenkia),克勒克酵母属(Kloeckera),孢克勒克酵母属(Kloeckeraspora),克鲁维酵母属(Kluyveromyces),Kondoa,Kuraishia,克氏担孢酵母属(Kurtzmanomyces),白冬孢酵母属(Leucosporidium),油脂酵母属(Lipomyces),路德酵母属(Lodderomyces),马拉色氏霉菌属(Malassezia),梅奇酵母属(Metschnikowia),木拉克酵母属(Mrakia),油脂酵母属无性属(Myxozyma),拿逊酵母属(Nadsonia),Nakazawaea,针孢酵母属(Nematospora),甲醇诱导型酵母属(Ogataea),卵孢酵母属(Oosporidium),管囊酵母属(Pachysolen),厚壁孢酵母(Phachytichospora),法夫酵母属(Phaffia),毕赤酵母属(Pichia),红冬孢酵母属(Rhodosporidium),红酵母属(Rhodotorula),酵母属(Saccharomyces),类酵母属(Saccharomycodes),覆膜孢酵母属(Saccharomycopsis),齐藤酵母属(Saitoella),Sakaguchia,Saturnospora,裂芽酵母孢子菌属(Schizoblastosporion),裂殖酵母属(Schizosaccharomyces),许旺酵母属(Schwanniomyces),锁掷酵母属(Sporidiobolus),掷孢酵母属(Sporobolomyces),原孢酵母属(Sporopachydermia),冠孢酵母属(Stephanoascus),梗孢酵母属(Sterigmatomyces),拟梗孢酵母属(Sterigmatosporidium),Symbiotaphrina,合轴酵母属(Sympodiomyces),Sympodiomycopsis,有孢圆酵母属(Torulaspora),Trichosporiella,毛孢子菌属(Trichosporon),三角酵母属(Trigonopsis),Tsuchiyaea,Udeniomyces,Waltomyces,威克酵母属(Wickerhamia),拟威克酵母属(Wickerhamiella),拟威尔酵母属(Williopsis),Yamadazyma,耶氏酵母属(Yarrowia),接合囊酵母属(Zygoascus),接合酵母属(Zygosaccharomyces),接合拟威尔酵母属(Zygowilliopsis),和Zygozyma等等。

在一些实施方案,所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae),巴斯德毕赤酵母(Pichiapastoris),粟酒裂殖酵母(Schizosaccharomycespombe),布鲁赛尔德克酵母(Dekkera bruxellensis),乳酸克鲁维酵母(Kruyveromyces lactis,此前称为乳酸酵母(Saccharomyces lactis)),马克斯克鲁维酵母(Kluveromyces marxianus),食腺嘌呤芽生葡萄孢酵母(Arxula adeninivorans),或多形汉逊酵母(Hansenulapolymorpha)(现称为安格斯毕赤酵母(Pichia angusta))。在一些实施方案,所述宿主微生物是假丝酵母属(Candida)的菌株,例如解脂假丝酵母(Candida lipolytica),吉利蒙假丝酵母(Candidaguilliermondii),克鲁斯假丝酵母(Candida krusei),假热带假丝酵母(Candidapseudotropicalis)或产朊假丝酵母(Candida utilis)的菌株。

在特定实施方案,所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae)。在一些实施方案,所述宿主是酿酒酵母(Saccharomyces cerevisiae)的菌株,所述酿酒酵母的菌株是选自由贝克氏(Baker’s)酵母、CBS 7959、CBS 7960、CBS 7961、CBS 7962、CBS7963、CBS 7964、IZ-1904、TA、BG-1、CR-1、SA-1、M-26、Y-904、PE-2、PE-5、VR-1、BR-1、BR-2、ME-2、VR-2、MA-3、MA-4、CAT-1、CB-1、NR-1、BT-1、和AL-1组成的组。在一些实施方案,所述宿主微生物是酿酒酵母(Saccharomyces cerevisiae)的菌株,所述酿酒酵母的菌株是选自由PE-2、CAT-1、VR-1、BG-1、CR-1、和SA-1组成的组。在特定实施方案,酿酒酵母(Saccharomyces cerevisiae)的菌株是PE-2。在另一特定实施方案,酿酒酵母(Saccharomyces cerevisiae)的菌株是CAT-1。在另一特定实施方案,酿酒酵母(Saccharomyces cerevisiae)的菌株是BG-1。

在一些实施方案,所述宿主微生物是适于工业发酵的微生物。在特定实施方案,所述微生物适应于在高溶剂浓度、高温、扩大的底物利用率、营养限制、由糖和盐引起的渗透应力、酸度、亚硫酸盐和细菌污染、或其组合下存活,所述这些是公认的工业发酵环境的应激条件。

5.4甜菊醇和甜菊糖苷生物合成途径

在一些实施方案,通过工程化所述细胞以表达编码所述途径的一种或多种酶的多核苷酸和/或多肽,在本发明提供的经遗传修饰的宿主细胞中激活甜菊醇生物合成途径和/或甜菊糖苷生物合成途径。图1示出了示例性甜菊醇生物合成途径。

因此,在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有香叶基香叶基焦磷酸合酶(GGPPS)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有柯巴基焦磷酸合酶或内根-柯巴基二磷酸合酶(CDPS;也称为内根-柯巴基焦磷酸合酶或CPS)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有贝壳杉烯合酶(KS;也称为内根-贝壳杉烯合酶)活性。在特定实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有本发明所述的贝壳杉烯氧化酶(KO;也称为内根-贝壳杉烯19-氧化酶)活性。在特定实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,根据本发明提供的实施方案,所述多肽具有异贝壳杉烯酸羟化酶多肽(KAH;也称为甜菊醇合酶)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源多核苷酸,所述多肽具有细胞色素P450还原酶(CPR)活性。

在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UGT74G1活性的多肽的异源多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UGT76G1活性的多肽的异源多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UGT85C2活性的多肽的异源多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UGT91D活性的多肽的异源多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有UGT

在某些实施方案,所述宿主细胞包含变体酶。在某些实施方案,相对于相关多肽,所述变体可包含多达15、10、9、8、7、6、5、4、3、2或1个氨基酸置换。在某些实施方案,相对于参考多肽,所述变体可包含多达15、10、9、8、7、6、5、4、3、2或1个保守氨基酸置换。在某些实施方案,可针对所述宿主细胞优化本发明所述的任何核酸,例如进行密码子优化。

以下描述了甜菊醇生物合成途径和/或甜菊糖苷生物合成途径的示例性核酸和酶。

5.4.1香叶基香叶基焦磷酸合酶(GGPPS)

香叶基香叶基焦磷酸合酶(EC 2.5.1.29)催化法呢基焦磷酸转化为香叶基香叶基焦磷酸。酶的示例性实例包括甜叶菊(Stevia rebaudiana,登录号ABD92926),藤仓赤霉(Gibberella fujikuroi,登录号CAA75568),小家鼠(Mus musculus,登录号AAH69913),假微型海链藻(Thalassiosira pseudonana,登录号XP_002288339),棒状链霉菌(Streptomyces clavuligerus,登录号ZP_05004570),嗜酸热硫化叶菌(Sulfulobusacidocaldarius,登录号BAA43200),聚球藻属(Synechococcus sp.,登录号ABC98596),拟南芥(Arabidopsis thaliana,登录号NP_195399),和三孢布拉霉(Blakeslea trispora,登录号AFC92798.1)的那些酶,以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些GGPPS核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些GGPPS酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。

5.4.2柯巴基焦磷酸合酶(CDPS)

柯巴基焦磷酸合酶(EC 5.5.1.13)催化香叶基香叶基焦磷酸转化为柯巴基焦磷酸。酶的示例性实例包括甜叶菊(Stevia rebaudiana,登录号AAB87091),棒状链霉菌(Streptomyces clavuligerus,登录号EDY51667),慢生型大豆根瘤菌(Bradyrhizobiumjaponicum,登录号AAC28895.1),玉米(Zea mays,登录号AY562490),拟南芥(Arabidopsisthaliana,登录号NM_116512),和稻(Oryza sativa,登录号Q5MQ85.1)的那些酶,以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些CDPS核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些CDPS酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。

5.4.3贝壳杉烯合酶(KS)

贝壳杉烯合酶(EC 4.2.3.19)催化柯巴基焦磷酸转化为贝壳杉烯和二磷酸。酶的示例性实例包括慢生型大豆根瘤菌(Bradyrhizobium japonicum,登录号AAC28895.1),暗球腔菌属(Phaeosphaeria sp.,登录号O13284),拟南芥(Arabidopsis thaliana,登录号Q9SAK2),和白云杉(Picea glauca,登录号ADB55711.1)的那些酶,以及US2014/0329281A1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些KS核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些KS酶中的至少一种具有至少80%、85%、85%、90%、或95%序列同一性的多肽。

5.4.4双功能柯巴基焦磷酸合酶(CDPS)和贝壳杉烯合酶(KS)

还可使用CDPS-KS双功能酶(EC 5.5.1.13和EC 4.2.3.19)。酶的示例性实例包括桃拟茎点霉(Phomopsis amygdali,登录号BAG30962),小立碗藓(Physcomitrella patens,登录号BAF61135),和藤仓赤霉(Gibberella fujikuroi,登录号Q9UVY5.1)的那些酶,以及US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些CDPS-KS核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些CDPS-KS酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。

5.4.5内根-贝壳杉烯氧化酶(KO)

内根-贝壳杉烯氧化酶(EC 1.14.13.78;本发明也称为贝壳杉烯氧化酶)催化将贝壳杉烯转化为异贝壳杉烯酸。酶的示例性实例包括稻(Oryza sativa,登录号Q5Z5R4),藤仓赤霉(Gibberella fujikuroi,登录号O94142),拟南芥(Arabidopsis thaliana,登录号Q93ZB2),甜叶菊(Stevia rebaudiana,登录号AAQ63464.1),豌豆(Pisum sativum,Uniprot号Q6XAF4)的那些酶,以及US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188和WO2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些KO核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些KO酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。

5.4.6甜菊醇合酶(KAH)

本发明提供了经修饰的甜菊醇合酶或异贝壳杉烯酸羟化酶(KAH),(EC1.14.13.79)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。

5.4.7细胞色素P450还原酶(CPR)

细胞色素P450还原酶(EC 1.6.2.4)对于上述KO和/或KAH的活性是必需的。酶的示例性实例包括甜叶菊(Stevia rebaudiana,登录号ABB88839),拟南芥(Arabidopsisthaliana,登录号NP_194183),藤仓赤霉(Gibberella fujikuroi,登录号CAE09055),青蒿(Artemisia annua,登录号ABC47946.1)的那些酶,以及US 2014/0329281A1、US 2014/0357588A1、US 2015/0159188和WO 2016/038095A2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些CPR核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些CPR酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。

5.4.8 UDP糖基转移酶74G1(UGT74G1)

UGT74G1能够作为尿苷5'-二磷酸葡糖基:甜菊醇19-COOH转移酶起作用和作为尿苷5'-二磷酸葡糖基:甜菊醇-13-O-葡糖苷19-COOH转移酶起作用。如图1所示,UGT74G1能够将甜菊醇转化为19-糖苷。UGT74G1还能够将甜菊单糖苷转化为甜茶苷。UGT74G1还可将甜菊双糖苷转化为甜菊苷。酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如,Richman etal.,2005,PlantJ.41:56-67和US 2014/0329281和WO 2016/038095A2以及登录号AAR06920.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些UGT74G1核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些UGT74G1酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。

5.4.9 UDP糖基转移酶76G1(UGT76G1)

UGT76G1能够将葡萄糖基团部分转移至受体分子(即甜菊醇1,2-糖苷)的C-13-O-葡萄糖的C-3'处。因此,UGT76G1能够作为尿苷5'-二磷酸葡糖基:甜菊醇13-O-1,2葡糖苷C-3'葡萄糖基转移酶起作用和作为尿苷5'-二磷酸葡糖基:甜菊醇-19-O-葡萄糖、13-O-1,2双糖苷C-3'葡萄糖基转移酶起作用。UGT76G1能够将甜菊双糖苷转化为RebB。UGT76G1还能够将甜菊苷转化为RebA。UGT76G1还能够将RebD转化为RebM。酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如,Richman etal.,2005,PlantJ.41:56-67和US 2014/0329281A1和WO 2016/038095A2以及登录号AAR06912.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些UGT76G1核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些UGT76G1酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。

5.4.10 UDP糖基转移酶85C2(UGT85C2)

UGT85C2能够作为尿苷5'-二磷酸葡糖基:甜菊醇13-OH转移酶起作用和作为尿苷5'-二磷酸葡糖基:甜菊醇-19-O-葡糖苷13-OH转移酶起作用。UGT85C2能够将甜菊醇转化为甜菊单糖苷,并还能够将19-糖苷转化为甜茶苷。酶的示例性实例包括甜叶菊(Steviarebaudiana)的那些酶(例如Richman et al.,2005,PlantJ.41:56-67和US 2014/0329281A1、WO 2016/038095A2以及登录号AAR06916.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些UGT85C2核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在一些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些UGT85C2酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。

5.4.11 UDP-糖基转移酶91D(UGT91D)

UGT91D能够作为尿苷5'-二磷酸葡糖基:甜菊醇-13-O-葡糖苷转移酶起作用,将葡萄糖基团部分转移至受体分子(甜菊醇-13-O-葡萄糖苷(甜菊单糖苷))的13-O-葡萄糖的C-2'处,以生成甜菊双糖苷。UGT91D还能够作为尿苷5'-二磷酸葡糖基:甜茶苷转移酶起作用,将葡萄糖基团部分转移至受体分子(甜茶苷)的13-O-葡萄糖的C-2'处,以提供甜菊苷。UGT91D也称为UGT91D2、UGT91D2e或UGT91D-like3。UGT91D酶的示例性实例包括甜叶菊(Stevia rebaudiana)的那些酶(例如,登录号为ACE87855.1的UGT序列,以及US2014/0329281A1,WO2016/038095A2和SEQ ID NO:7描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些UGT91D核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些UGT91D酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。

5.4.12能够将RebA转化为RebD的尿苷二磷酸依赖性糖基转移酶(UGT

尿苷二磷酸依赖性糖基转移酶(UGT

5.5 MEV途径生成FPP和/或GGPP

在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含MEV途径的一种或多种异源酶,其可用于形成FPP和/或GGPP。在一些实施方案,所述MEV途径的一种或多种酶包含使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使乙酰乙酰-CoA与乙酰-CoA缩合以形成HMG-CoA的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使HMG-CoA转化为甲羟戊酸的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使甲羟戊酸磷酸化为甲羟戊酸5-磷酸的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使甲羟戊酸5-焦磷酸转化为异戊烯焦磷酸的酶。在一些实施方案,所述MEV途径的一种或多种酶包含使异戊烯焦磷酸转化为二甲基烯丙基二磷酸的酶。

在一些实施方案,所述MEV途径的一种或多种酶选自由乙酰-CoA硫解酶,乙酰乙酰-CoA合酶,HMG-CoA合酶,HMG-CoA还原酶,甲羟戊酸激酶,磷酸甲羟戊酸激酶,甲羟戊酸焦磷酸脱羧酶,和异戊基二磷酸:二甲基烯丙基二磷酸异构酶(IDI或IPP异构酶)组成的组。在一些实施方案,关于能够催化形成乙酰乙酰-CoA的所述MEV途径的酶,所述经遗传修饰的宿主细胞包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶,例如乙酰-CoA硫解酶;或者使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶,例如乙酰乙酰-CoA合酶。在一些实施方案,所述经遗传修饰的宿主细胞包含使两分子乙酰-CoA缩合以形成乙酰乙酰-CoA的酶,例如乙酰-CoA硫解酶;和使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA的酶,例如乙酰乙酰-CoA合酶。

在一些实施方案,所述宿主细胞包含编码所述MEV途径的一种以上酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的两种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含一种或多种异源核苷酸序列,所述一种或多种异源核苷酸序列编码可将HMG-CoA转化为甲羟戊酸的酶和可将甲羟戊酸转化为甲羟戊酸5-磷酸的酶。在一些实施方案,所述宿主细胞包含编码所述MEV途径的三种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的四种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的五种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的六种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的七种酶的一种或多种异源核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述MEV途径的所有酶的多种异源核酸。

在一些实施方案,所述经遗传修饰的宿主细胞还包含编码酶的异源核酸,所述酶可将异戊烯焦磷酸(IPP)转化为二甲基烯丙基焦磷酸(DMAPP)。在一些实施方案,所述经遗传修饰的宿主细胞还包含编码酶的异源核酸,所述酶可使IPP和/或DMAPP分子缩合以形成聚异戊二烯基化合物。在一些实施方案,所述经遗传修饰的宿主细胞还包含编码酶的异源核酸,所述酶可修饰IPP或聚异戊二烯基以形成类异戊二烯化合物,例如FPP。

5.5.1乙酰-CoA转化为乙酰乙酰-CoA

在一些实施方案,所述经遗传修饰的宿主细胞包含编码酶的异源核苷酸序列,所述酶可使两分子的乙酰辅酶A缩合以形成乙酰乙酰-CoA,例如乙酰-CoA硫解酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(NC_000913REGION(区域):2324131.2325315;大肠杆菌(Escherichia coli)),(D49362;脱氮副球菌(Paracoccus denitrificans))和(L20428;酿酒酵母(Saccharomyces cerevisiae))。

乙酰-CoA硫解酶催化两分子乙酰-CoA的可逆缩合反应以生成乙酰乙酰-CoA,但此反应在热力学上是不利的;乙酰乙酰-CoA硫解作用优于乙酰乙酰-CoA合成作用。乙酰乙酰-CoA合酶(AACS)(或者称为乙酰-CoA:丙二酰-CoA酰基转移酶;EC 2.3.1.194)使乙酰-CoA与丙二酰-CoA缩合以形成乙酰乙酰-CoA。与乙酰-CoA硫解酶相反,由于丙二酰-CoA的相关脱羧反应,AACS催化的乙酰乙酰-CoA合成基本上是能量有利的反应。此外,AACS对乙酰乙酰-CoA未表现出硫解活性,因此所述反应是不可逆的。

在包含乙酰-CoA硫解酶和异源性ADA和/或磷酸转乙酰酶(PTA)的宿主细胞中,有利于乙酰乙酰-CoA硫解的乙酰-CoA硫解酶催化的可逆反应可导致大的乙酰-CoA库。鉴于ADA的可逆活性,此乙酰-CoA库可反过来驱动ADA朝向将乙酰-CoA转化为乙醛的逆向反应,从而减少了ADA对乙酰-CoA生成提供的益处。类似地,PTA的活性是可逆的,因此,大的乙酰-CoA库可驱使PTA朝向将乙酰-CoA转化为乙酰磷酸的逆向反应。因此,在一些实施方案,为了提供对乙酰-CoA的强拉力以驱动ADA和PTA的正向反应,本发明提供的经遗传修饰的宿主细胞的所述MEV途径利用乙酰乙酰-CoA合酶使乙酰-CoA和丙二酰-CoA形成乙酰乙酰-CoA。

在一些实施方案,AACS是来自链霉菌属(Streptomyces sp.)菌株CL190(Okamuraet al.,Proc Natl Acad Sci USA 107(25):11265-70(2010))。链霉菌属(Streptomycessp.)菌株CL190的代表性AACS核苷酸序列包括登录号AB540131.1。链霉菌属(Streptomycessp.)菌株CL190的代表性AACS蛋白质序列包括登录号D7URV0、BAJ10048。可用于本发明提供的组合物和方法的其他乙酰乙酰-CoA合酶包括但不限于,链霉菌属(Streptomyces sp.)(AB183750;KO-3988BAD86806);无环链霉菌(S.anulatus)菌株9663(FN178498;CAX48662);链霉菌属KO-3988(AB212624;BAE78983);游动放线菌属(Actinoplanes sp.)A40644(AB113568;BAD07381);链霉菌属C(NZ_ACEW010000640;ZP_05511702);达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)DSM 43111(NZ_ABUI01000023;ZP_04335288);溃疡分枝杆菌(Mycobacterium ulcerans)Agy99(NC_008611;YP_907152);海鱼分枝杆菌(Mycobacterium marinum)M(NC_010612;YP_001851502);链霉菌属Mg1(NZ_DS570501;ZP_05002626);链霉菌属AA4(NZ_ACEV01000037;ZP_05478992);玫瑰孢链霉菌(S.roseosporus)NRRL 15998(NZ_ABYB01000295;ZP_04696763);链霉菌属ACTE(NZ_ADFD01000030;ZP_06275834);产绿色链霉菌(S.viridochromogenes)DSM40736(NZ_ACEZ01000031;ZP_05529691);弗兰克氏菌属(Frankia sp.)CcI3(NC_007777;YP_480101);巴西诺卡菌(Nocardia brasiliensis)(NC_018681;YP_006812440.1);和Austwickiachelonae放线菌(Austwickia chelonae)(NZ_BAGZ01000005;ZP_10950493.1)。其他合适的乙酰乙酰-CoA合酶包括美国专利申请公开号2010/0285549和2011/0281315中描述的那些,其内容通过引用其整体并入本发明。

也可用于本发明提供的组合物和方法的乙酰乙酰-CoA合酶包括那些被称为本发明所述的任何乙酰乙酰-CoA合酶的“衍生物”的分子。此种“衍生物”具有以下特征:(1)它与本发明所述的任何乙酰乙酰-CoA合酶具有基本同源性;和(2)能够催化乙酰-CoA与丙二酰-CoA的不可逆缩合反应以生成乙酰乙酰-CoA。如果衍生物的氨基酸序列与乙酰乙酰-CoA合酶的氨基酸序列为至少80%、更优选至少90%、最优选至少95%相同,则称乙酰乙酰-CoA合酶的衍生物与乙酰乙酰-CoA合酶具有“基本同源性”。

5.5.2乙酰乙酰-CoA转化为HMG-CoA

在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可使乙酰乙酰-CoA与另一分子的乙酰-CoA缩合以形成3-羟基-3-甲基戊二酰-CoA(HMG-CoA),例如HMG-CoA合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(NC_001145.补体19061.20536;酿酒酵母),(X96617;酿酒酵母),(X83882;拟南芥),(AB037907;griseola北里孢菌(Kitasatospora griseola)),(BT007302;智人(Homo sapiens)),和(NC_002758,基因座标签为SAV2546,GeneID(基因ID)为1122571;金黄色葡萄球菌(Staphylococcusaureus))。

5.5.3 HMG-CoA转化为甲羟戊酸

在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可使HMG-CoA转化为甲羟戊酸,例如HMG-CoA还原酶。在一些实施方案,HMG-CoA还原酶是使用NADH的羟甲基戊二酰-CoA还原酶-CoA还原酶。HMG-CoA还原酶(EC 1.1.1.34;EC 1.1.1.88)催化(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸,并可以分为两类,I类和II类HMGr(HMG-CoA还原酶)。I类包括来自真核生物和大多数古细菌的酶,II类包括某些原核生物和古细菌的HMG-CoA还原酶。除了序列的差异外,两类酶在其辅因子特异性方面也不同。与仅使用NADPH的I类酶不同,II类HMG-CoA还原酶在区分NADPH和NADH的能力方面不同。参见,例如Hedl etal.,Journal of Bacteriology 186(7):1927-1932(2004)。选择的II类HMG-CoA还原酶的辅因子特异性提供如下。

选择的II类HMG-CoA还原酶的辅因子特异性

用于本发明提供的组合物和方法的有用的HMG-CoA还原酶包括能够利用NADH作为辅因子的HMG-CoA还原酶,例如来自迈氏假单胞菌(P.mevalonii),闪烁古生球菌(A.fulgidus)或金黄色葡萄球菌(S.aureus)的HMG-CoA还原酶。在特定实施方案,所述HMG-CoA还原酶仅能够利用NADH作为辅因子,例如来自迈氏假单胞菌(P.mevalonii),波美罗伊硅杆菌(S.pomeroyi)或食酸代尔夫特菌(D.acidovorans)的HMG-CoA还原酶。

在一些实施方案,使用NADH的HMG-CoA还原酶来自迈氏假单胞菌(Pseudomonasmevalonii)。先前已描述了编码HMG-CoA还原酶(EC 1.1.1.88)的迈氏假单胞菌(Pseudomonas mevalonii)的野生型mvaA基因的序列。参见Beach and Rodwell,J.Bacteriol.171:2994-3001(1989)。迈氏假单胞菌(Pseudomonas mevalonii)的代表性mvaA核苷酸序列包括登录号M24015。迈氏假单胞菌(Pseudomonas mevalonii)的代表性HMG-CoA还原酶蛋白质序列包括登录号AAA25837、P13702、MVAA_PSEMV。

在一些实施方案,使用NADH的HMG-CoA还原酶来自波美罗伊硅杆菌(Silicibacterpomeroyi)。波美罗伊硅杆菌(Silicibacter pomeroyi)的代表性HMG-CoA还原酶核苷酸序列包括登录号NC_006569.1。波美罗伊硅杆菌(Silicibacter pomeroyi)的代表性HMG-CoA还原酶蛋白质序列包括登录号YP_164994。

在一些实施方案,所述使用NADH的HMG-CoA还原酶来自食酸代尔夫特菌(Delftiaacidovorans)。食酸代尔夫特菌(Delftia acidovorans)的代表性HMG-CoA还原酶核苷酸序列包括NC_010002REGION:补体(319980..321269)。食酸代尔夫特菌(Delftiaacidovorans)的代表性HMG-CoA还原酶蛋白质序列包括登录号YP_001561318。

在一些实施方案,所述使用NADH的HMG-CoA还原酶来自马铃薯(Solanumtuberosum)(Crane etal.,J.Plant Physiol.159:1301-1307(2002))。

在本发明提供的组合物和方法中还可采用的使用NADH的HMG-CoA还原酶包括那些被称为任何本发明所述的使用NADH的HMG-CoA还原酶的“衍生物”的分子,例如来自迈氏假单胞菌(P.mevalonii),波美罗伊硅杆菌(S.pomeroyi)和食酸代尔夫特菌(D.acidovorans)的使用NADH的HMG-CoA还原酶的“衍生物”的分子。此种“衍生物”具有以下特征:(1)它与任何本发明所述的使用NADH的HMG-CoA还原酶具有基本同源性;和(2)能够催化(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸,同时优先使用NADH作为辅因子。如果所述衍生物的氨基酸序列与使用NADH的HMG-CoA还原酶的氨基酸序列为至少80%,更优选至少90%,最优选至少95%相同,则称使用NADH的HMG-CoA还原酶的衍生物与使用NADH的HMG-CoA还原酶具有“基本同源性”。

本发明使用的短语“使用NADH/NADH-使用的”是指所述使用NADH的HMG-CoA还原酶对NADH作为辅因子相对NADPH作为辅因子具有选择性,譬如,通过证明对NADH的比活性高于对NADPH的比活性。在一些实施方案,对作为辅因子的NADH的选择性表示为k

在一些实施方案,所述使用NADH的HMG-CoA还原酶被设计为对NADH相较NAPDH具有选择性,例如,通过辅因子结合口袋的定点诱变来设计。工程化设计NADH选择性的方法记载在Watanabe et al.,Microbiology 153:3044-3054(2007)中,用于确定HMG-CoA还原酶的辅因子特异性的方法记载在Kim et al.,Protein Sci.9:1226-1234(2000)中,其内容均通过引用其整体并入本发明。

在一些实施方案,所述使用NADH的HMG-CoA还原酶衍生自天然包含甲羟戊酸降解途径的宿主物种,例如,使作为其唯一碳源的甲羟戊酸分解代谢的宿主物种。在所述这些实施方案中,所述使用NADH的HMG-CoA还原酶,其通常催化在其原生宿主细胞内的内化的(R)-甲羟戊酸氧化酰化为(S)-HMG-CoA,用于催化所述逆向反应,即,在包含甲羟戊酸生物合成途径的经遗传修饰的宿主细胞中,使(S)-HMG-CoA还原脱酰为(R)-甲羟戊酸。能够在甲羟戊酸作为其唯一碳源上生长的原核生物已记载在:Anderson et al.,J.Bacteriol,171(12):6468-6472(1989);Beach et al.,J.Bacteriol.171:2994-3001(1989);Bensch et al.,J.Biol.Chem.245:3755-3762;Fimongnari et al.,Biochemistry 4:2086-2090(1965);Siddiqi etal.,Biochem.Biophys.Res.Commun.8:110-113(1962);Siddiqi et al.,J.Bacteriol.93:207-214(1967);和Takatsuji et al.,Biochem.Biophys.Res.Commun.110:187-193(1983)中,其内容均通过引用其整体并入本发明。

在本发明提供的组合物和方法的一些实施方案中,所述宿主细胞包含使用NADH的HMGR(HMG-CoA还原酶)和使用NADPH的HMG-CoA还原酶。编码使用NADPH的HMG-CoA还原酶的核苷酸序列的示例性实例包括但不限于:(NM_206548;黑腹果蝇(Drosophilamelanogaster)),(NC_002758,基因座标签为SAV2545,基因ID(GeneID)为1122570;金黄色葡萄球菌(Staphylococcus aureus)),(AB015627;链霉菌属(Streptomyces sp.)KO3988),(AX128213,提供编码截短的HMG-CoA还原酶的序列;酿酒酵母(Saccharomycescerevisiae)),和(NC_001145:补体(115734.118898;酿酒酵母(Saccharomycescerevisiae))。

5.5.4甲羟戊酸转化为甲羟戊酸-5-磷酸

在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将甲羟戊酸转化为甲羟戊酸5-磷酸,例如甲羟戊酸激酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(L77688;拟南芥(Arabidopsis thaliana)),和(X55875;酿酒酵母(Saccharomyces cerevisiae))。

5.5.5甲羟戊酸-5-磷酸转化为甲羟戊酸-5-焦磷酸

在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸,例如磷酸甲羟戊酸激酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(AF429385;巴西橡胶树(Hevea brasiliensis)),(NM_006556;智人(Homo sapiens)),和(NC_001145.补体712315.713670;酿酒酵母(Saccharomyces cerevisiae))。

5.5.6甲羟戊酸-5-焦磷酸转化为IPP

在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将甲羟戊酸5-焦磷酸转化为异戊烯焦磷酸(IPP),例如甲羟戊酸焦磷酸脱羧酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(X97557;酿酒酵母(Saccharomyces cerevisiae)),(AF290095;屎肠球菌(Enterococcus faecium)),和(U49260;智人(Homo sapiens))。

5.5.7 IPP转化为DMAPP

在一些实施方案,所述宿主细胞还包含编码酶的异源核苷酸序列,所述酶可将通过MEV途径生成的IPP转化为二甲基烯丙基焦磷酸(DMAPP),例如IPP异构酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(NC_000913,3031087.3031635;大肠杆菌(Escherichia coli)),和(AF082326;雨生红球藻(Haematococcus pluvialis))。

5.5.8聚异戊二烯合酶

在一些实施方案,所述宿主细胞还包含编码聚异戊二烯合酶的异源核苷酸序列,所述聚异戊二烯合酶可使IPP和/或DMAPP分子缩合以形成含有多于5个碳的聚异戊二烯基化合物。

在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将一分子IPP与一分子DMAPP缩合以形成一分子香叶基焦磷酸(“GPP”),例如GPP合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(AF513111;巨冷杉(Abies grandis)),(AF513112;巨冷杉),(AF513113;巨冷杉),(AY534686;金鱼草(Antirrhinum majus)),(AY534687;金鱼草),(Y17376;拟南芥(Arabidopsis thaliana)),(AE016877,基因座AP11092;蜡样芽胞杆菌(Bacillus cereus);ATCC 14579),(AJ243739;甜橙(Citrussinensis)),(AY534745;仙女扇(Clarkia breweri)),(AY953508;齿小蠹(Ips pini)),(DQ286930;番茄(Lycopersicon esculentum)),(AF182828;胡椒薄荷(Mentha xpiperita)),(AF182827;胡椒薄荷),(MPI249453;胡椒薄荷),(PZE431697,基因座CAD24425;玉米黄质副球菌(Paracoccus zeaxanthinifaciens)),(AY866498;胡黄连(Picrorhiza kurrooa)),(AY351862;葡萄(Vitis vinifera)),和(AF203881,基因座AAF12843;运动发酵单胞菌(Zymomonas mobilis))。

在一些实施方案,所述宿主细胞包含编码酶的异源核苷酸序列,所述酶可将两分子IPP与一分子DMAPP缩合,或者将IPP分子添加至GPP分子中,以形成法呢基焦磷酸(“FPP”)分子,例如FPP合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(ATU80605;拟南芥),(ATHFPS2R;拟南芥),(AAU36376;青蒿(Artemisia annua)),(AF461050;普通牛(Bostaurus)),(D00694;大肠杆菌K-12),(AE009951,基因座AAL95523;具核梭杆菌具核亚种(Fusobacterium nucleatum subsp.nucleatum)ATCC25586),(GFFPPSGEN;藤仓赤霉(Gibberella fujikuroi)),(CP000009,基因座AAW60034;氧化葡萄糖杆菌(Gluconobacteroxydans)621H),(AF019892;向日葵(Helianthus annuus)),(HUMFAPS;智人(Homosapiens)),(KLPFPSQCR;乳酸克鲁维酵母(Kluyveromyces lactis)),(LAU15777;白羽扇豆(Lupinus albus)),(LAU20771;白羽扇豆),(AF309508;小家鼠(Mus musculus)),(NCFPPSGEN;粗糙脉孢菌(Neurospora crassa)),(PAFPS1;灰白银胶菊(Partheniumargentatum)),(PAFPS2;灰白银胶菊),(RATFAPS;褐家鼠(Rattus norvegicus)),(YSCFPP;酿酒酵母),(D89104;粟酒裂殖酵母(Schizosaccharomycespombe)),(CP000003,基因座AAT87386;酿脓链球菌(Streptococcus pyogenes)),(CP000017,基因座AAZ51849;酿脓链球菌),(NC_008022,基因座YP_598856;酿脓链球菌MGAS10270),(NC_008023,基因座YP_600845;酿脓链球菌MGAS2096),(NC_008024,基因座YP_602832;酿脓链球菌MGAS10750),(MZEFPS;玉米(Zea mays)),(AE000657,基因座AAC06913;风产液菌(Aquifex aeolicus)VF5),(NM_202836;拟南芥),(D84432,基因座BAA12575;枯草芽孢杆菌(Bacillussubtilis)),(U12678,基因座AAC28894;慢生型大豆根瘤菌(Bradyrhizobium japonicum)USDA 110),(BACFDPS;嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)),(NC_002940,基因座NP_873754;杜克雷嗜血杆菌(Haemophilus ducreyi)35000HP),(L42023,基因座AAC23087;流感嗜血杆菌(Haemophilus influenzae)RdKW20),(J05262;智人(Homosapiens)),(YP_395294;沙克乳酸杆菌沙克亚种(Lactobacillus sakei subsp.sakei)23K),(NC_005823,基因座YP_000273;Copenhageni str.Fiocruz钩端螺旋体血清变型(Leptospira interrogans serovar Copenhageni str.Fiocruz)L1-130),(AB003187;藤黄微球菌(Micrococcus luteus)),(NC_002946,基因座YP_208768;淋病奈瑟氏菌(Neisseria gonorrhoeae)FA 1090),(U00090,基因座AAB91752;根瘤菌属(Rhizobiumsp.)NGR234),(J05091;酿酒酵母),(CP000031,基因座AAV93568;Silicibacter pomeroyiDSS-3),(AE008481,基因座AAK99890;肺炎链球菌(Streptococcus pneumoniae)R6),和(NC_004556,基因座NP 779706;木质部难养菌特曼库拉1(Xylella fastidiosaTemecula1)。

在一些实施方案,所述宿主细胞还包含编码酶的异源核苷酸序列,所述酶可将IPP和DMAPP或IPP和FPP进行结合以形成香叶基香叶基焦磷酸(“GGPP”)。编码此种酶的核苷酸序列的示例性实例包括但不限于:(ATHGERPYRS;拟南芥),(BT005328;拟南芥),(NM_119845;拟南芥),(NZ_AAJM01000380,基因座ZP_00743052;苏云金芽孢杆菌血清变型(Bacillus thuringiensis serovar israelensis),ATCC 35646sq1563),(CRGGPPS;长春花(Catharanthus roseus)),(NZ_AABF02000074,基因座ZP_00144509;具核梭杆菌文森特亚种(Fusobacterium nucleatum subsp.vincentii),ATCC 49256),(GFGGPPSGN;藤仓赤霉(Gibberella fujikuroi)),(AY371321;银杏(Ginkgo biloba)),(AB055496;巴西橡胶树(Hevea brasiliensis)),(AB017971;智人(Homo sapiens)),(MCI276129;卢西坦毛霉(Mucor circinelloidesf.lusitanicus)),(AB016044;小家鼠(Mus musculus)),(AABX01000298,基因座NCU01427;粗糙脉孢菌(Neurospora crassa)),(NCU20940;粗糙脉孢菌),(NZ_AAKL01000008,基因座ZP_00943566;青枯雷尔氏菌(Ralstonia solanacearum)UW551),(AB118238;褐家鼠(Rattus norvegicus)),(SCU31632;酿酒酵母),(AB016095;细长聚球藻(Synechococcus elongates)),(SAGGPS;白芥子(Sinapis alba)),(SSOGDS;嗜酸热硫化叶菌(Sulfolobus acidocaldarius)),(NC_007759,基因座YP_461832;aciditrophicus互养菌(Syntrophus aciditrophicus)SB),(NC_006840,基因座YP_204095;费氏弧菌(Vibrio fischeri)ES114),(NM_112315;拟南芥),(ERWCRTE;成团泛菌(Pantoea agglomerans)),(D90087,基因座BAA14124;菠萝泛菌(Pantoea ananatis)),(X52291,基因座CAA36538;荚膜红细菌(Rhodobacter capsulatus)),(AF195122,基因座AAF24294;类球红细菌(Rhodobacter sphaeroides)),和(NC_004350,基因座NP_721015;变异链球菌(Streptococcus mutans)UA159)。

虽然上文描述了甲羟戊酸途径的酶的实例,但在某些实施方案,所述DXP途径的酶在本发明所述的宿主细胞、组合物和方法中可用作生成DMAPP和IPP的替代途径或另外的途径。所述DXP途径的酶以及编码所述酶的核酸是本领域公知的并已在现有技术例如WO2012/135591A2中进行表征。

5.6生成甜菊糖苷类化合物的方法

另一方面,本发明提供了生成甜菊糖苷的方法,所述方法包含以下步骤:(a)在适于制备甜菊糖苷化合物的条件下,在含有碳源的培养基中培养能够生成所述甜菊糖苷的任何本发明所述的经遗传修饰的宿主细胞群;和(b)从所述培养基回收所述甜菊糖苷化合物。

在一些实施方案,与不包含一种或多种修饰的亲本细胞相比,或者与仅包含所述经遗传修饰的宿主细胞的一种或多种修饰的子集,但在遗传上是相同的亲本细胞相比,所述经遗传修饰的宿主细胞生成增加量的甜菊糖苷。在一些实施方案,所述增加的量为至少1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、或大于100%,例如,以产量、生成量、生产率计,或以克/升细胞培养物,毫克/克干细胞重量计,或者基于每单位体积的细胞培养物,基于每单位干细胞重量,基于每单位时间的每单位体积的细胞培养物,或基于每单位时间的每单位干细胞重量计,进行测定。

在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其大于约1克/升发酵培养基。在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其大于约5克/升发酵培养基。在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其大于约10克/升发酵培养基。在一些实施方案,所述甜菊糖苷以从约10至约50克/升细胞培养物,从约10至约15克/升细胞培养物,超过约15克/升细胞培养物,超过约20克/升细胞培养物,超过约25克/升细胞培养物,超过约30克/升细胞培养物的量生成。

在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其大于约50毫克每克干细胞重量。在一些此类实施方案中,所述甜菊糖苷以从约50至约1500毫克,超过约100毫克,超过约150毫克,超过约200毫克,超过约250毫克,超过约500毫克,超过约750毫克,或超过约1000毫克每克干细胞重量的量生成。

在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位体积细胞培养物。

在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位干细胞重量。

在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位时间的每单位体积细胞培养物。

在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位时间的每单位干细胞重量。

在大多实施方案中,所述宿主细胞生成的升高水平的甜菊糖苷是在诱导化合物存在下进行诱导。在不存在所述诱导化合物情况下,可容易地操作此种宿主细胞。然后加入所述诱导化合物以诱导所述宿主细胞生成升高水平的甜菊糖苷。在其他实施方案,通过改变培养条件,例如改变生长温度、培养基成分等,可诱导所述宿主细胞生成升高水平的甜菊糖苷。

5.7培养基和培养条件

用于微生物培养物的维持和生长的物料和方法是微生物学或发酵科学领域的技术人员所熟知的(参见,例如Bailey et al.,Biochemical Engineering Fundamentals,second edition,McGraw Hill,New York,1986)。根据宿主细胞、发酵和过程/方法的特定要求,必须考虑适当的培养基,pH值,温度,以及需氧、微需氧或厌氧条件的要求。

本发明提供的生成甜菊糖苷类化合物的方法可在合适的容器(包括但不限于细胞培养板、微量滴定板、烧瓶或发酵罐)中于合适的培养基(例如,含或不含泛酸补充)中进行。此外,所述方法可以本领域已知的任何发酵规模进行,以支持微生物产物的工业生产。可使用任何合适的发酵罐,包括搅拌槽式发酵罐,气升式发酵罐,气泡式发酵罐,或其任何组合。在利用酿酒酵母(Saccharomyces cerevisiae)作为宿主细胞的特定实施方案中,菌株可在发酵罐中生长,详细记载如Kosaric,et al,Ullmann's Encyclopedia of IndustrialChemistry,Sixth Edition,Volume 12,pages 398-473,Wiley-VCH Verlag GmbH&Co.KDaA,Weinheim,Germany中所述。

在一些实施方案,所述培养基是其中能够生成甜菊糖苷的经遗传修饰的微生物可以存活,即保持生长和活力的任何培养基。在一些实施方案,所述培养基是包含可同化的碳源、氮源和磷源(phosphate source)的水性培养基。此种培养基还可包括适当的盐类、矿物质类、金属类和其他营养物类。在一些实施方案,将所述碳源和每种必需细胞营养物增量地或连续地添加到发酵培养基中,并将每种所需营养物通过使细胞生长,譬如,根据基于将碳源转化成生物量的细胞的代谢或呼吸功能的预定细胞生长曲线,保持在基本有效同化所需的最低水平。

用于培养微生物的合适条件和合适的培养基是本领域熟知的。在一些实施方案,所述合适的培养基补充有一种或多种另外的试剂,例如诱导物(例如,当编码基因产物的一个或多个核苷酸序列受诱导型启动子的控制时),阻抑物(例如,当编码基因产物的一个或多个核苷酸序列受阻抑型启动子的控制时),或选择剂(例如,选择包含所述遗传修饰的微生物的抗生素)。

在一些实施方案,所述碳源是单糖(简单糖)、二糖、多糖、不可发酵的碳源、或其一种或多种组合。合适的单糖的非限制性实例包括葡萄糖、半乳糖、甘露糖、果糖、木糖、核糖、和其组合。合适的二糖的非限制性实例包括蔗糖、乳糖、麦芽糖、海藻糖、纤维二糖、和其组合。合适的多糖的非限制性实例包括淀粉、糖原、纤维素、几丁质、和其组合。合适的不可发酵碳源的非限制性实例包括乙酸盐和甘油。

所述培养基中碳源(例如葡萄糖)的浓度足以促进细胞生长,但不能高到抑制所用微生物的生长。通常,培养物采用碳源(例如葡萄糖)进行,所述碳源以达到所需生长水平和所需生物量的水平进行添加。在其他实施方案,所述培养基中碳源(例如葡萄糖)的浓度大于约1g/L,优选大于约2g/L,更优选大于约5g/L。此外,所述培养基中碳源(例如葡萄糖)的浓度通常小于约100g/L,优选小于约50g/L,更优选小于约20g/L。应当注意,对培养组分浓度的提及可以指初始和/或正在进行的组分浓度。在一些案例中,可能需要在培养期间使所述培养基耗尽碳源。

可用于合适培养基的可同化氮的来源包括但不限于简单氮源、有机氮源和复合氮源。此类氮源包括无水氨,铵盐类,以及动物、植物和/或微生物来源的物质。合适的氮源包括但不限于,蛋白质水解产物类,微生物生物质水解产物类,蛋白胨,酵母提取物,硫酸铵,尿素和氨基酸类。通常,所述培养基中所述氮源的浓度大于约0.1g/L,优选大于约0.25g/L,更优选大于约1.0g/L。然而,超过一定浓度,向所述培养基中添加氮源对于微生物的生长是不利的。因此,所述培养基中所述氮源的浓度小于约20g/L,优选小于约10g/L,更优选小于约5g/L。此外,在一些实施例中,可能需要在培养期间使所述培养基耗尽所述氮源。

有效的培养基可含有其他化合物,例如无机盐类、维生素类、痕量金属类、或生长促进剂类。此类其他化合物也可存在于有效培养基中的碳源、氮源或矿物源中,或者可特异性地添加至所述培养基中。

所述培养基还可含有合适的磷源。此类磷源包括无机磷源和有机磷源。优选的磷源包括但不限于磷酸盐类,例如单或二元磷酸钠和单或二元磷酸钾、磷酸铵、和其混合物。通常,所述培养基中磷酸盐的浓度大于约1.0g/L,优选大于约2.0g/L,更优选大于约5.0g/L。然而,超过一定浓度,向所述培养基中添加磷酸盐对于微生物的生长是不利的。因此,所述培养基中所述磷酸盐的浓度通常小于约20g/L,优选小于约15g/L,更优选小于约10g/L。

合适的培养基还可包括镁源,优选地以生理学上可接受的盐的形式,例如七水合硫酸镁,尽管可使用浓度为贡献相似量的镁的其他镁源。通常,所述培养基中镁的浓度大于约0.5g/L,优选大于约1.0g/L,更优选大于约2.0g/L。然而,超过一定浓度,向所述培养基中添加镁对于微生物的生长是不利的。因此,所述培养基中镁的浓度通常小于约10g/L,优选小于约5g/L,更优选小于约3g/L。此外,在一些实施例中,可能需要在培养期间使所述培养基耗尽镁源。

在一些实施方案,所述培养基还可包含生物学上可接受的螯合剂,例如二水合柠檬酸三钠。在此类实施例中,所述培养基中螯合剂的浓度大于约0.2g/L,优选大于约0.5g/L,更优选大于约1g/L。然而,超过一定浓度,向所述培养基中添加螯合剂对于微生物的生长是不利的。因此,所述培养基中螯合剂的浓度通常小于约10g/L,优选小于约5g/L,更优选小于约2g/L。

所述培养基最初还可包括生物学上可接受的酸或碱以维持所述培养基的所需pH值。生物学上可接受的酸包括但不限于,盐酸、硫酸、硝酸、磷酸、和其混合物。生物学上可接受的碱包括但不限于,氢氧化铵、氢氧化钠、氢氧化钾、和其混合物。在一些实施方案,使用的碱是氢氧化铵。

所述培养基还可包括生物学上可接受的钙源,包括但不限于氯化钙。通常,所述培养基中所述钙源(例如氯化钙二水合物)的浓度在约5mg/L至约2000mg/L的范围内,优选在约20mg/L至约1000mg/L的范围内,更优选在约50mg/L至约500mg/L的范围内。

所述培养基还可包括氯化钠。通常,所述培养基中氯化钠的浓度在约0.1g/L至约5g/L的范围内,优选在约1g/L至约4g/L的范围内,更优选在约2g/L至约4g/L的范围内。

在一些实施方案,所述培养基还可包含痕量金属。此类痕量金属可作为储备溶液添加至所述培养基中,为方便起见,可与培养基的其余部分分开制备。通常,添加至所述培养基中的此痕量金属溶液的量大于约1mL/L,优选大于约5mL/L,更优选大于约10mL/L。然而,超过一定浓度,向所述培养基中添加痕量金属对于微生物的生长是不利的。因此,添加至所述培养基中的此痕量金属溶液的量通常小于约100mL/L,优选小于约50mL/L,更优选小于约30mL/L。应注意的是,除了在储备溶液中添加痕量金属之外,各个组分可单独进行添加,各自在与上述痕量金属溶液范围所规定的组分的量相对应的范围内。

在一些实施方案,所述培养基可包括其他维生素类,例如泛酸、生物素、钙、泛酸盐、肌醇、吡哆醇-HCl和硫胺素-HCl。此类维生素可作为储备溶液添加至所述培养基中,为方便起见,可与培养基的其余部分分开制备。然而,超过一定浓度,向所述培养基中添加维生素类不利于微生物的生长。

本发明所述的发酵方法可以常规培养模式进行,所述培养模式包括但不限于分批、补料分批、细胞再循环、连续和半连续。在一些实施方案,所述发酵以补料分批模式进行。在此类案例中,所述培养基中的一些组分在培养期间被耗尽,所述组分包括在发酵的生成阶段期间的泛酸。在一些实施方案,所述培养物可在开始时(例如,生成阶段)补充相对高浓度的此类组分,使得在需要添加之前支持生长和/或甜菊糖苷生成一段时间。所述这些组分的优选范围在整个培养过程中通过添加来维持,所述添加以培养物耗尽的水平进行添加。可通过例如定期对培养基取样并测定浓度来监测所述培养基中组分的水平。或者,一旦开发出标准培养程序,所述添加可在整个培养期间的特定时间对应于已知水平以一定时间间隔进行。如本领域技术人员将认识到的,随着所述培养基的细胞密度增加,培养期间营养物的消耗速率亦将增加。此外,为了避免将外来微生物引入培养基中,可使用本领域已知的无菌添加方法进行添加。此外,在培养期间可加入少量消泡剂。

所述培养基的温度可以是适于经遗传修饰的细胞生长和/或甜菊糖苷生成的任何温度。譬如,在用接种物接种培养基之前,所述培养基可置于并保持在约20℃至约45℃的温度范围,优选保持在约25℃至约40℃的温度范围,更优选保持在约28℃至约32℃的温度范围。

可通过向所述培养基中添加酸或碱来控制所述培养基的pH值。在此类案例中,当氨用于控制pH时,其也方便地用作所述培养基中的氮源。优选地,所述pH值保持在约3.0至约8.0,更优选保持在约3.5至约7.0,最优选保持在约4.0至约6.5。

在一些实施方案,在培养期间监测所述培养基的碳源浓度,例如葡萄糖浓度。可使用已知技术监测所述培养基的葡萄糖浓度,例如,采用葡萄糖氧化酶试验或高压液相色谱,其可用于监测上清液(例如,所述培养基的无细胞组分)中的葡萄糖浓度。所述碳源浓度通常保持低于发生细胞生长抑制的水平。虽然此浓度可能因生物体而异,但对于葡萄糖作为碳源,细胞生长抑制发生在葡萄糖浓度大于约60g/L时,并可通过试验容易地确定。因此,当葡萄糖用作碳源时,优选将葡萄糖加入发酵罐中并保持在检测限以下。或者,所述培养基中的葡萄糖浓度维持在约1g/L至约100g/L的范围内,更优选地维持在约2g/L至约50g/L的范围内,更优选地维持在约5g/L至约20g/L的范围内。尽管通过添加例如基本上纯的葡萄糖溶液,可将所述碳源浓度维持在所需水平,但通过添加初始培养基的等分试样来维持所述培养基的所述碳源浓度是可接受的,并且可能是优选的。使用初始培养基的等分试样是可取的,因为可同时维持所述培养基中其他营养物(例如,氮源和磷源)的浓度。同样,通过添加痕量金属溶液的等份试样,亦可在所述培养基中维持所述痕量金属浓度。

其他合适的发酵培养基和方法记载在例如WO 2016/196321中。

5.8发酵组合物

另一方面,本发明提供了发酵组合物,其包含本发明所述的经遗传修饰的宿主细胞和由所述经遗传修饰的宿主细胞生成的甜菊糖苷类化合物。所述发酵组合物可进一步包含培养基。在某些实施方案,所述发酵组合物包含经遗传修饰的宿主细胞,和进一步包含RebA、RebD和RebM。在某些实施方案,本发明提供的发酵组合物包含RebM,作为由所述经遗传修饰的宿主细胞生成的甜菊糖苷类化合物的主要组分。在某些实施方案,所述发酵组合物包含RebA:RebD:RebM比例为至少1:7:50的RebA、RebD和RebM。在某些实施方案,所述发酵组合物包含RebA:RebD:RebM比例为至少1:7:50至1:100:1000的RebA、RebD和RebM。在某些实施方案,所述发酵组合物包含RebA:RebD:RebM比例为至少1:7:50至1:200:2000。在某些实施方案,所述RebA、RebD和RebM的比例是基于与所述经遗传修饰的宿主细胞和所述培养基相关的甜菊糖苷类化合物的总含量。在某些实施方案,所述RebA、RebD和RebM的比例是基于所述培养基中甜菊糖苷类化合物的总含量。在某些实施方案,所述RebA、RebD和RebM的比例是基于与所述经遗传修饰的宿主细胞相关的甜菊糖苷类化合物的总含量。

在某些实施方案,本发明提供的发酵组合物包含不可检测水平的RebM2。在某些实施方案,本发明提供的发酵组合物包含不可检测水平的非天然存在的甜菊糖苷类化合物。

5.9甜菊糖苷类化合物的回收

一旦甜菊糖苷由所述宿主细胞生成,便可使用本领域已知的任何合适的分离和纯化方法将其回收或分离用于后续应用。在一些实施方案,通过离心将包含甜菊糖苷的澄清水相从发酵物分离得到。在其他实施方案,通过将破乳剂添加至发酵反应中,将包含甜菊糖苷的澄清水相从发酵物分离得到。破乳剂的示例性实例包括絮凝剂类和凝结剂类。

在所述这些细胞中生成的甜菊糖苷可存在于培养物上清液中和/或与所述宿主细胞结合。在甜菊糖苷与宿主细胞结合的实施方案中,所述甜菊糖苷的回收可包括改善甜菊糖苷从细胞中释放的方法。在一些实施方案,这可采取用热水或缓冲液处理,有或没有表面活性剂,有或没有添加缓冲剂或盐的方式来清洗细胞的形式。在一些实施方案,所述温度是认为适合释放甜菊糖苷类化合物的任何温度。在一些实施方案,所述温度是从40℃至95℃;或从60℃至90℃;或从75℃到85℃的范围。在一些实施方案,所述温度是40℃、45℃、50℃、55℃、65℃、70℃、75℃、80℃、85℃、90℃、或95℃。在一些实施方案,物理或化学细胞破坏可用于增强甜菊糖苷类化合物从宿主细胞释放。或者和/或随后,可使用分离单元操作来回收所述培养基中的甜菊糖苷,所述分离单元操作包括但不限于,溶剂萃取法、膜澄清法、膜浓缩法、吸附法、色谱法、蒸发法、化学衍生化法、结晶法和干燥法。

5.10制备经遗传修饰的细胞的方法

本发明还提供了用于生成宿主细胞的方法,所述宿主细胞经遗传工程改造以包含一种或多种上述修饰,例如,编码甜叶菊(Stevia rebaudiana)异贝壳杉烯酸羟化酶和/或生物合成途径酶(例如用于甜菊糖苷化合物的生物合成途径酶)的一种或多种异源核酸。异源酶在宿主细胞中的表达可通过在所述宿主细胞中引入包含编码所述酶的核苷酸序列的核酸来实现,所述核酸受允许在所述宿主细胞中表达的调节元件的控制。在一些实施方案,所述核酸是染色体外质粒。在其他实施方案,所述核酸是染色体整合载体,其可将所述核苷酸序列整合到所述宿主细胞的染色体中。在其他实施方案,所述核酸是线性双链DNA片段,其可通过同源性将核苷酸序列整合到宿主细胞的染色体中。

可通过本领域技术人员已知的任何方法,且不限于这些方法,将编码这些蛋白质的核酸引入所述宿主细胞中(参见,例如Hinnen et al.(1978)Proc.Natl.Acad.Sci.USA75:1292-3;Cregg et al.(1985)Mol.Cell.Biol.5:3376-3385;Goeddel et al.eds,1990,Methods in Enzymology,vol.185,Academic Press,Inc.,CA;Krieger,1990,GeneTransfer and Expression--A Laboratory Manual,Stockton Press,NY;Sambrook etal.,1989,Molecular Cloning--A Laboratory Manual,Cold Spring HarborLaboratory,NY;和Ausubel etal.,eds.,CurrentEdition,Current Protocols inMolecular Biology,Greene Publishing Associates and Wiley Interscience,NY)。示例性技术包括但不限于原生质球法、电穿孔法、PEG1000介导的转化、和乙酸锂或氯化锂介导的转化。

可通过修饰编码所述酶的基因的转录来改变宿主细胞中酶的量。其可通过例如以下方式来实现:通过修饰编码所述酶的所述核苷酸序列的拷贝数(例如,通过使用包含所述核苷酸序列的更高或更低拷贝数的表达载体,或通过将所述核苷酸序列另外的拷贝引入所述宿主细胞的基因组中,或通过删除或破坏所述宿主细胞基因组中的所述核苷酸序列),通过改变操纵子的多顺反子mRNA上的编码序列的顺序或将操纵子分解成各自具有其自身控制元件的单个基因,或通过增加核苷酸序列可操作连接的启动子或操纵子的强度。或者,此外,可通过修饰编码所述酶的mRNA的翻译水平来改变宿主细胞中酶的拷贝数。其可通过譬如以下方式来实现:通过修饰mRNA的稳定性,修饰核糖体结合位点的序列,修饰核糖体结合位点与酶编码序列的起始密码子之间的距离或序列,修饰位于酶编码区起始密码子“上游”或邻接5'侧的整个顺反子间区,使用发夹和特化序列稳定mRNA转录物的3'端,修饰酶的密码子用法,改变用于酶的生物合成的稀有密码子tRNA的表达,和/或通过例如突变其编码序列来提高酶的稳定性。

宿主细胞中酶的活性可以多种方式改变,包括但不限于,表达所述酶的经修饰形式(其在宿主细胞中表现出增加或降低的溶解度);表达所述酶的经改变形式(其缺乏通过其抑制所述酶的活性的结构域);表达所述酶的经修饰形式(其具有较高或较低Kcat或较低或较高Km的底物);或表达所述酶的经改变形式(其或多或少受到所述途径中另一分子的反馈或前馈调节的影响)。

在一些实施方案,用于经遗传修饰的宿主细胞的核酸包含一种或多种选择标记,所述选择标记可用于选择转化的宿主细胞和对所述宿主细胞施加选择性压力以维持外源DNA。

在一些实施方案,所述选择标记是抗生素抗性标记。抗生素抗性标记的示例性实例包括但不限于,BLA、NAT1、PAT、AUR1-C、PDR4、SMR1、CAT、小鼠dhfr、HPH、DSDA、KAN

在一些实施方案,所述选择标记拯救所述经遗传修饰的微生物中的营养缺陷型(例如,营养性营养缺陷型)。在此类实施方案中,亲本微生物包含一种或多种基因产物中的功能性破坏,所述一种或多种基因产物在氨基酸或核苷酸生物合成途径中起作用,并且当无功能性时使得亲本细胞无法在不补充一种或多种营养物的培养基中生长。此类基因产物包括但不限于酵母中的HIS3、LEU2、LYS1、LYS2、MET15、TRP1、ADE2、和URA3基因产物。然后可通过用编码所述经破坏的基因产物的功能性拷贝的表达载体或染色体整合构建体来转化亲本细胞,从而拯救营养缺陷型表型,并可基于所述亲本细胞的所述营养缺陷型表型的缺失来选择生成的经遗传修饰的宿主细胞。利用URA3、TRP1和LYS2基因作为选择标记具有显著的优势,因为正选择和负选择均是可能的。通过URA3、TRP1和LYS2突变的营养缺陷型互补进行正选择,而负选择则是基于特异性抑制剂,即5-氟-乳清酸(FOA)、5-氟邻氨基苯甲酸、和氨基己二酸(aAA),其分别阻止原养型菌株生长但分别使URA3、TRP1和LYS2突变体生长。在其他实施方案,所述选择标记拯救可通过已知选择方法鉴定的其他非致死性缺陷或表型。

本发明描述了可用于本发明公开的方法、组合物和生物体的特定基因和蛋白质;然而,人们将认识到这些基因的绝对同一性是不必要的。譬如,可对包含编码多肽或酶的序列的特定基因或多核苷酸进行变化并筛选活性。通常,此类变化包括保守突变和沉默突变。可使用本领域已知的方法筛选此类经修饰或经突变的多核苷酸和多肽以表达功能性酶。

由于遗传密码的固有简并性,编码基本上相同或功能等同的多肽的其他多核苷酸也可用于克隆和表达编码此类酶的多核苷酸。

如本领域技术人员将理解的,修饰编码序列以增强其在特定宿主中的表达可能是有利的。所述遗传密码是冗余的,具有64个可能的密码子,但大多数生物体通常使用这些密码子的子集。在物种中最常使用的密码子称为最佳密码子,而那些未经常使用的密码子被分类为稀有密码子或低使用率密码子。在有时被称为“密码子优化”或“控制物种密码子偏性”的过程中,密码子可被置换以反映所述宿主的优选密码子用法。可使用密码子用法表容易地确定其他宿主细胞的密码子优化,或者可使用商业上可获得的软件,例如来自Integrated DNA Technologies的CodonOp(www.idtdna.com/CodonOptfrom)进行密码子优化。

可制备含有由特定原核或真核宿主优选的密码子的优化编码序列(Murray etal.,1989,Nucl Acids Res.17:477-508),例如,与由非优化序列生成的转录物相比,以提高翻译速率或以生成具有期望性质(例如更长的半衰期)的重组RNA转录物。还可修饰翻译终止密码子以反映宿主偏好。譬如,酿酒酵母和哺乳动物的典型终止密码子分别是UAA和UGA。单子叶植物类的典型终止密码子是UGA,而昆虫和大肠杆菌通常使用UAA作为终止密码子(Dalphin et al.,1996,Nucl Acids Res.24:216-8)。

本领域技术人员将认识到,由于遗传密码的简并性质,可使用与其核苷酸序列不同的多种DNA分子来编码本发明给定的酶。引用编码上述生物合成酶的原生DNA序列在本发明中仅用于说明本发明的实施方案,并且本发明包括任何序列的DNA分子,所述序列编码本发明方法中所用酶的多肽和蛋白质的氨基酸序列。以类似的方式,多肽通常可在其氨基酸序列中耐受一个或多个氨基酸置换、缺失和插入,而不会损失或显著损失所需活性。本发明包括具有与本发明所述特定蛋白质不同的氨基酸序列的此类多肽,只要所述经修饰的多肽或变体多肽具有所述参考多肽的酶促合成代谢活性或分解代谢活性即可。此外,由本发明所示的DNA序列编码的氨基酸序列仅阐明了本发明的实施方案。

此外,可用于本发明提供的组合物和方法的酶的同源物均包含在本发明公开内容中。在一些实施方案,当氨基酸序列具有至少约30%、40%、50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性时,两种蛋白质(或所述蛋白质的区域)基本上是同源的。为了确定两个氨基酸序列或两个核酸序列的同一性百分比,比对所述序列以达到最佳比较目的(例如,为了最佳比对,可在第一和第二氨基酸或核酸序列中的一个或两个中引入空位,并且为了比较目的,可忽略非同源序列)。在一个实施方案,为比较目的而比对的参考序列的长度为所述参考序列长度的至少30%,通常至少40%,更通常至少50%,甚至更通常至少60%,甚至更通常至少70%、80%、90%、100%。然后比较相应氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当所述第一序列中的位置被与所述第二序列中的相应位置的相同氨基酸残基或核苷酸占据时,那么所述分子在此位置均是相同的(本发明使用的氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)。两个序列之间的同一性百分比是所述序列共有的相同位置的数量的函数,考虑到空位的数量和每个空位的长度,需引入这些空位以实现所述两个序列的最佳比对。

当“同源/同源性”用于提及蛋白质或肽时,将认识到不相同的残基位置通常因保守氨基酸置换而不同。“保守氨基酸置换”是其中氨基酸残基被具有相似化学性质(例如,电荷或疏水性)的侧链(R基团)的另一氨基酸残基置换的氨基酸置换。通常,保守氨基酸置换不会显著改变蛋白质的功能特性。在通过保守置换使两个或两个以上氨基酸序列彼此不同的情况下,可以向上调节序列同一性百分比或同源性程度以校正所述置换的保守性质。进行此种调节的方法是本领域技术人员所熟知的(参见,例如Pearson W.R.,1994,Methodsin Mol Biol 25:365-89)。

以下六组各自含有彼此保守置换的氨基酸:1)丝氨酸(S),苏氨酸(T);2)天冬氨酸(D),谷氨酸(E);3)天冬酰胺(N),谷氨酰胺(Q);4)精氨酸(R),赖氨酸(K);5)异亮氨酸(I),亮氨酸(L),丙氨酸(A),缬氨酸(V);和6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W)。

通常使用序列分析软件来测定多肽的序列同源性,其也称为序列同一性百分比。用于将分子序列与含有来自不同生物体的大量序列的数据库进行比较的典型算法是计算机程序BLAST。当搜索含有来自大量不同生物体的序列的数据库时,通常对氨基酸序列进行比较。

此外,编码前述酶(或本发明提及的任何其他酶类(或控制或调节其表达的任何调节元件))的任何基因可通过遗传/蛋白质工程技术进行优化,例如本领域普通技术人员已知的定向进化或合理诱变。此种作用使本领域普通技术人员能够优化所述酶在酵母中的表达和活性。

此外,编码所述这些酶的基因可从其他真菌和细菌物种中鉴定得到,并且可表达对此途径的调节。多种生物体可作为所述这些酶的来源,包括但不限于,酵母属(Saccharomyces spp.),包括酿酒酵母(S.cerevisiae)和葡萄汁酵母(S.uvarum);克鲁维酵母菌属(Kluyveromyces spp.),包括耐热克鲁维酵母(K.thermotolerans),乳酸克鲁维酵母(K.lactis),和马克斯克鲁维酵母(K.marxianus);毕赤酵母属(Pichia spp.);汉逊酵母属(Hansenula spp.),包括多形汉逊酵母(H.polymorpha);假丝酵母属(Candida spp.);丝孢酵母属(Trichosporon spp.);接合糖酵母属(Yamadazyma spp.),包括树干接合糖酵母(Y.spp.Stipitis),球有孢圆酵母(Torulaspora pretoriensis),东方伊萨酵母(Issatchenkia orientalis);裂殖酵母属(Schizosaccharomyces spp.),包括粟酒裂殖酵母(S.pombe);隐球酵母属(Cryptococcus spp.);曲霉属(Aspergillus spp.);脉孢菌属(Neurospora spp.);或黑粉菌属(Ustilago spp.)。来自厌氧真菌的基因来源包括但不限于,梨囊鞭菌属(Piromycesspp.),根囊鞭菌属(Orpinomyces spp.),或新美鞭菌属(Neocallimastixspp.)。可用的原核酶的来源包括但不限于,大肠杆菌(Escherichiacoli),运动发酵单胞菌(Zymomonas mobilis),金黄色葡萄球菌(Staphylococcusaureus),芽孢杆菌属(Bacillus spp.),梭菌属(Clostridium spp.),棒状杆菌属(Corynebacterium spp.),假单胞菌属(Pseudomonas spp.),乳球菌属(Lactococcusspp.),肠杆菌属(Enterobacter spp.)和沙门氏菌属(Salmonella spp.)。

本领域技术人员已知的技术可适于鉴定其他同源基因和同源酶。通常,类似基因和/或类似酶可通过功能分析进行鉴定,并具有功能相似性。本领域技术人员已知的技术可适用于鉴定类似基因和类似酶。譬如,为了鉴定同源或类似的UDP糖基转移酶,KAH,或任何生物合成途径基因、蛋白质、或酶,技术可包括但不限于使用基于目的基因/酶的公开序列的引物进行PCR,或通过使用设计用于扩增目的基因中的保守区域的简并引物进行简并PCR,来克隆基因。此外,本领域技术人员可使用技术来鉴定具有功能同源性或相似性的同源或类似的基因、蛋白质、或酶。技术包括通过针对所述活性的体外酶测定法来检测细胞或细胞培养物中酶的催化活性(例如,如本发明所述或如Kiritani,K.,Branched-ChainAmino Acids Methods Enzymology,1970中所述),然后通过纯化技术来分离具有所述活性的酶,通过诸如埃德曼(Edman)降解等技术确定所述酶的所述蛋白质序列,设计可能的核酸序列的PCR引物,通过PCR来扩增所述DNA序列,以及克隆所述核酸序列。为了鉴定同源或类似基因和/或同源或类似酶、类似基因和/或类似酶或蛋白质,技术还包括将关于候选基因或酶的数据同诸如BRENDA、KEGG或MetaCYC的数据库进行比较。可根据本发明的教导,在上述数据库中鉴定候选基因或酶。

6.实施例

实施例1:酵母培养条件

在优化的乙酸锂转化中,使用标准分子生物学技术将各DNA构建体整合到酿酒酵母(Saccharomyces cerevisiae)(CEN.PK113-7D)中。简言之,细胞在30℃、振摇(200rpm)的酵母提取物蛋白胨右旋糖(YPD)培养基中生长过夜,在100mL YPD中稀释至OD600为0.1,然后生长至OD600为0.6–0.8。对于每次转化,通过离心收获5mL培养物,在5mL无菌水中清洗,再次离心,重悬于1mL100mM乙酸锂中,并转移至微量离心管中。将细胞离心(13,000xg)30s,除去上清液,并将细胞重悬于由240μL 50%PEG、36μL 1M乙酸锂、10μL煮鲑鱼精DNA和74μL供体DNA组成的转化混合物中。对于需要表达核酸内切酶F-Cph1的转化,供体DNA包括携带F-CphI基因的质粒,所述F-CphI基因在酵母TDH3启动子下表达。以此种方式表达的F-CphI核酸内切酶切割了在宿主菌株中工程改造的特异性识别位点,以促进目的靶基因的整合。在42℃下热激40分钟后,将细胞在YPD培养基中回收过夜,然后铺板到选择性培养基上。DNA整合通过菌落PCR确证,其中使用了对所述整合具有特异性的引物。

实施例2:能够高通量生成法呢基焦磷酸(FPP)和类异戊二烯法呢烯的基础菌株(base strain)的生成

通过在原生GAL启动子的控制下表达甲羟戊酸途径的基因,从野生型酿酒酵母菌株(CEN.PK113-7D)产生法呢烯生成菌株。此菌株包含来自酿酒酵母的以下染色体整合的甲羟戊酸途径基因:乙酰-CoA硫解酶,HMG-CoA合酶,HMG-CoA还原酶,甲羟戊酸激酶,磷酸甲羟戊酸激酶,甲羟戊酸焦磷酸脱羧酶,和IPP:DMAPP异构酶。此外,所述菌株还包含来自青蒿(Artemisia annua)的法呢烯合酶的多个拷贝,亦受原生GAL1或GAL10启动子的控制。使用公开可获得的或其他合适的算法对本发明所述的所有异源基因进行密码子优化。所述菌株还包含GAL80基因的缺失,编码鲨烯合酶的ERG9基因通过用酵母基因MET3的启动子替换所述原生启动子而进行下调。在美国专利号8,415,136和美国专利号8,236,512中记载了生成酿酒酵母菌株的方法的实例,所述菌株可高通量生成类异戊二烯类化合物,其全部内容并入本发明。

实施例3:构建用于快速筛选新的异贝壳杉烯酸羟化酶P450酶的一系列菌株

图1示出了由FPP到Reb M的示例性生物合成途径,其具有异贝壳杉烯酸中间体。通过将香叶基-香叶基-焦磷酸合酶(GGPPS)的六个拷贝整合到基因组中,然后将柯巴基-焦磷酸合酶的一个拷贝以及贝壳杉烯合酶的四个拷贝整合到基因组中,将上述法呢烯基础菌株进一步工程化,以高通量生成C20类异戊二烯贝壳杉烯。随后,从菌株中去除法呢烯合酶的所有拷贝,并确证所述菌株生成了内根-贝壳杉烯而没有法呢烯。

异贝壳杉烯酸羟化酶(KAH)是细胞色素P450酶,其催化异贝壳杉烯酸的氧化以生成甜菊醇(参见图1),所述甜菊醇对于生成Reb M是必需的。为了筛选酿酒酵母体内KAH活性的新型P450酶,制备了几种菌株,这些菌株除了缺少KAH基因的任何拷贝外,包含生成Reb M所需的所有基因。表1列出了所有使用的Reb M途径基因和启动子。包含表1中所述的所有基因的菌株主要生成异贝壳杉烯酸,其是KAH的底物。

表1.用于将FPP转化为Reb M的酶的基因、启动子和氨基酸序列

*前65个氨基酸被单个蛋氨酸替换

为了测定酿酒酵母中体内KAH变体的活性,最初构建了第一筛选菌株,所述菌株除了缺乏KAH基因的任何拷贝外,包含生成单糖基化甜菊醇代谢产物19-糖苷所需的所有基因(表1和图1)。相反,其包含着陆垫(landing pad),以允许快速插入KAH变体(图2)。所述着陆垫由构建体任一端上位于选择的酵母基因座上游和下游基因组区域(上游基因座和下游基因座)的500bp靶向基因座的DNA序列组成,从而在将所述着陆垫整合入酵母染色体时删除了所述基因座。在内部,所述着陆垫包含启动子(Promoter),其可以是GAL1、GAL3或酵母GAL调节子的任何其他启动子,以及位于核酸内切酶识别位点(F-CphI)侧翼的选择的酵母终止子(Terminator)。Sr.KAH(SEQ ID NO:1)的DNA变体与表达核酸内切酶F-CphI的质粒一起用于转化菌株,所述质粒切割识别序列,在着陆垫上产生双链断裂,并促进Sr.KAH DNA变体在所述位点处的同源重组。

通过引入额外的基因以最终包含生成Reb M的所有所需基因,第二筛选菌株由缺少功能性KAH基因的所述第一筛选菌株衍生得到(表1和图1)。同第一筛选菌株一样,所述第二筛选菌株缺少KAH基因的任何拷贝,而是包含可切割的着陆垫(图2)。

生成了具有与所述第二筛选菌株相同工程化的第三筛选菌株,除了用Ps.KO(SEQID NO:10)替换Sr.KO。Ps.KO酶记载在PCT/US2018/046359(PISUM SATIVUM KAURENEOXIDASE FOR HIGH EFFICIENCY PRODUCTION OF REBAUDIOSIDES,于2018年8月10日提交)中,并且在将贝壳杉烯转化为异贝壳杉烯酸方面更具活性(图1)。因此,第三筛选菌株具有更高的通向异贝壳杉烯酸(KAH P450的底物)的碳通量。所述第二和第三筛选菌株均被称为缺少功能性KAH基因的Reb M生成酵母。

实施例4:酵母培养条件

将经验证含有预期的KAH基因的酵母菌落挑选到含有鸟种培养基(Bird SeedMedia,BSM,最初由van Hoek et al.,Biotechnology and Bioengineering 68(5),2000,pp.517-523记载)的96孔微量滴定板中,所述鸟种培养基(Bird SeedMedia)含有20g/L蔗糖、37.5g/L硫酸铵、以及1至5g/L赖氨酸。将细胞于30℃下在高容量微量滴定板孵化器中,于1000rpm和80%湿度下振摇培养3天,直至所述培养物耗尽碳。通过从饱和培养物中取14.4μL并稀释至360μL新鲜培养基中,将生长饱和的培养物传代培养至含有BSM的新鲜平板中,所述BMS含有40g/L蔗糖、150g/L硫酸铵、以及1g/L赖氨酸。在提取和分析之前,将所述生成培养基中的细胞于30℃下在高容量微量滴定板振荡器中,于1000rpm和80%湿度下再培养3天。

实施例5:用于分析从法呢醇到瑞鲍迪苷M的途径中间体的酵母样品制备条件

为了提取由细胞生成的所有甜菊糖苷类化合物(参见图1),在培养完成后,将全细胞培养液(whole cell broth)用628μL 100%乙醇稀释,用箔密封件进行密封,并在1250rpm下振摇30s。将314μL水直接添加至每个孔中以稀释所述提取液。将板短暂离心以使固体沉淀。将198μL的含有0.48mg/L瑞鲍迪苷N(用作内标)的50:50乙醇:水转移至新的250μL测定板,并将2μL培养物/乙醇混合物添加至测定板中。将板用箔密封件进行密封以进行分析。

为了提取由细胞制备的法呢醇到甜菊醇的途径中间体(参见图1),在培养完成后,将全细胞培养液用100μL 100%甲醇和500μL 100%乙酸乙酯稀释,用箔密封件进行密封,并在1000rpm下振摇30分钟,以将目的分析物提取到乙酸乙酯中。将混合物离心以使任何固体沉淀。将150μL乙酸乙酯层添加至新的1.1mL检测板中,并将150μL新鲜乙酸乙酯层添加至检测板中,然后进行GC-FID分析。

实施例6:分析方法

针对甜菊糖苷类化合物测定的样品通过具有RapidFire 365系统自动进样器和C8柱的质谱仪(Agilent 6470-QQQ)进行分析。

表2.RapidFire 365系统配置

表3.6470-QQQ MS方法配置

利用来自质谱仪的色谱图的峰面积,采用真实标准品来生成校准曲线。相关化合物的摩尔比是通过采用真实标准品通过外部校准对每种化合物的摩尔量进行定量,然后取适当的比例来确定。

采用AgilentDB-17MS(20mx 0.18mmx 0.18μm,P/N 121-4722),通过带有火焰离子化检测的气相色谱法(GC-FID,Agilent 7890A),以分流比为50的分流模式,对甜菊糖苷类化合物上游的样品(即,法呢醇至甜菊醇,图1)进行分析。采用以下温度和流量梯度:

表4.温度梯度

表5.流量梯度

每种分析物通过保留时间进行鉴定,由真实标准品测定。色谱图中的峰面积用于生成校准曲线。通过采用真实标准品通过外部校准对每种化合物的摩尔量进行定量,然后取适当的比例,确定了贝壳杉烯(kaurene)、贝壳杉烯醇(kaurenol)、贝壳杉烯醛(kaurenal)、异贝壳杉烯酸(kaurenoic acid)和甜菊醇(steviol)的摩尔比。

实施例7:通过定点饱和诱变进行甜叶菊异贝壳杉烯酸羟化酶的进化

在本实施例中,提供了P450酶(来自植物甜叶菊(Stevia rebaudiana)的异贝壳杉烯酸羟化酶,Sr.KAH)的活性数据,以及可提高在酿酒酵母体内表达的Sr.KAH活性的特定突变,以生成甜菊糖苷类化合物和Reb M。

KAH是细胞色素P450酶,可催化将异贝壳杉烯酸氧化为甜菊醇(图1),这对于形成Reb M是必需的。Sr.KAH中的每个氨基酸残基均突变为12个不同的氨基酸(R、N、D、C、G、H、I、L、F、S、Y和V),所述氨基酸由简并密码子NDT编码,其中N代表任一(核苷酸腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶);D代表腺嘌呤、鸟嘌呤和胸腺嘧啶;T代表胸腺嘧啶。Sr.KAH基因变体的NDT库采用在所需位置包含NDT简并密码子的引物通过PCR进行构建。每个PCR产物均包含基因变体的混合物,以便在对应于单个蛋白质残基的特定位置编码12个可能的不同氨基酸。在每个PCR产物中,Sr.KAH基因变体库的两端均与40bp的序列相接,所述序列分别与掺入酿酒酵母宿主菌株的特定基因座处的着陆垫的启动子(在基因的5'处)区和终止子(在基因的3'处)区同源(见图2)。

为了测定在酿酒酵母体内第一轮位点饱和诱变中产生的KAH变体的活性,突变的Sr.KAH变体用于转化19-糖苷生成酵母或Reb M生成酵母,其均缺少功能性KAH基因。野生型Sr.KAH用作对照。在最初的第1层(Tier 1)筛选中,分别以19-糖苷滴度或Reb M滴度测定了体内KAH活性。在第1层(Tier1)筛选中,针对每个突变的密码子位置筛选了24个分离株,在N=1时覆盖率是2倍。

对于在所述19-糖苷生成酵母中进行的筛选,通过将由含有Sr.KAH突变体等位基因的菌株生成的19-糖苷的量归一化为由含有野生型Sr.KAH等位基因的菌株生成的19-糖苷的量,来计算每个突变的效果。对于在所述Reb M生成酵母中进行的筛选,提取由菌株生成的所有甜菊糖苷类化合物,并通过质谱法进行测定。计算所有甜菊糖苷类化合物的总量(以μM计);此测定值称为“甜菊醇当量”。通过将含有Sr.KAH突变体等位基因的菌株的甜菊醇当量归一化为含有野生型Sr.KAH等位基因的菌株的甜菊醇当量,来计算突变的效果。

在获悉似乎可增加体内Sr.KAH酶活性的第1层(Tier 1)筛选中突变后,采用与上述相同的计算方法,对含有特定目的突变体的菌株进行更高程度的复制(N=12),以进行第二层(Tier 2)筛选,从而确证其改善。所得Sr.KAH突变体,其每个均具有单个氨基酸变化,其活性比野生型Sr.KAH等位基因高至少一个标准差,图3和表6中报道了其甜菊醇当量相对于野生型亲本Sr.KAH等位基因的提高倍数。例如,与野生型Sr.KAH菌株相比,如果突变体菌株的活性高2倍(2x),则所测得的甜菊糖苷类化合物的生成量(甜菊醇当量)翻倍(或多100%)。与野生型Sr.KAH相比,定点饱和诱变NDT库中的最佳突变体(G306L)可提高体内KAH活性2.7倍。

表6.改良的Sr.KAH等位基因:相关的氨基酸变化和相对于野生型Sr.KAH活性的提高倍数

实施例8:改善Sr.KAH活性的单一突变的组合库

从独特的NDT库目标候选中选择两组各12个突变,以构建完整的阶乘组合库。每组包含9个相同的突变以及每组有3个独特的突变。所述第一组合库包含以下突变:K100L、Q120N、I153L、S158D、I166R、L232D、G306L、V316L、I333V、I350L、A442G、G447V;和所述第二个库包含以下突变:S158D、I166R、L232D、G306L、M308L、V316L、I333V、I350L、N355Y、A442G、I443Y、G447V。设计所述这些库以在12个突变中创建所有可能的组合,以找到使得体内Sr.KAH活性最高的组合。基因是由定制的gBlocks(Integrated DNA Technologies,Inc.)的混合物组装而成,在每个片段的末端均有重叠的同源性,使得所述片段顺序重叠;将所有片段组装在一起便重新构成了完整长度的KAH等位基因。末端5'片段和3'片段亦与缺少功能性KAH基因的Reb M生成酵母中的着陆垫序列的启动子和终止子具有同源性。将所述片段转化到酵母中,并依靠内源同源重组将所述片段组装在一起。

在Reb M生成酵母中以2倍覆盖率筛选第一层(Tier 1)组合库DNA。将来自组合库筛选的前10个KAH等位基因进行PCR扩增,并将所述DNA用于转化Reb M生成酵母,作为N=4复制下的第二层(Tier 2)确证。最简单、改良的KAH组合变体在I166R和I333V处包含两个突变,其与野生型Sr.KAH相比,提高了4.3倍。与野生型Sr.KAH相比,最优组合KAH突变体将总甜菊醇的生成量提高了5倍和6.3倍(图4和表7)。氨基酸置换的最佳组合(在Reb M生成酵母中,与野生型Sr.KAH相比提高了6.3倍)包含以下突变:S158D、I166R、G306L、M308L、V316L和I350L。

与野生型Sr.KAH相比,改良的KAH突变体显示出底物异贝壳杉烯酸减少(图5),再次证明具有提高活性的Sr.KAH等位基因可将更多的底物转化为甜菊醇,从而增加了体内酵母中Reb M的生成量。在图5中,将异贝壳杉烯酸的量归一化为含有野生型Sr.KAH(100%)的菌株中的量。含有改良的Sr.KAH等位基因的酵母中异贝壳杉烯酸水平降低显示为野生型Sr.KAH中异贝壳杉烯酸水平的百分比。活性提高最多的Sr.KAH等位基因所具有的异贝壳杉烯酸水平是在野生型Sr.KAH菌株中观察到的异贝壳杉烯酸含量的40%。

表7.改良的Sr.KAH等位基因,相对于野生型Sr.KAH活性的提高倍数以及相关的氨基酸变化

实施例9:N端结构域交换以改善野生型Sr.KAH的体内活性

本实施例提供了表现出提高活性的具有经置换的N端结构域的经修饰的异贝壳杉烯酸羟化酶多肽。

异贝壳杉烯酸羟化酶是细胞色素P450酶。大多数真核P450是膜结合蛋白,与膜相关的细胞色素P450酶的高级结构域结构高度保守。植物细胞色素P450酶通过介导膜靶向的大约30-50个氨基酸的长N端多肽链掺入内质网(ER)。P450酶的催化结构域面向内质网的细胞质侧。插入ER膜的N端区域终止于大约20个氨基酸残基的疏水延伸末端,并位于催化结构域之前。通常含有带正电荷残基的短区域将催化结构域连接至结构保守的P450折叠的N端的富含脯氨酸的保守基序。N端靶向ER的结构域不太可能与催化结构域紧密相关,并且N端结构域并非功能所必需的。然而,P450催化结构域与ER膜之间的相互作用对于蛋白质活性很重要。譬如,与ER膜的相互作用可促进疏水性底物由膜转移至催化位点,还可使蛋白质定向以促进与细胞色素P450还原酶(CPR)的相互作用,这对于活性是必需的。

虽然无意于受任何操作理论的束缚,但我们发现将P450蛋白的ER相关N端与其他N端跨膜结构域交换可改善异源表达植物P450在酿酒酵母中的活性。交换N端跨膜结构域不应干扰ER靶向,也不应改变催化结构域的特异性,但可能有助于异源蛋白质的ER定位和/或可能改变蛋白质构象以改善催化结构域与ER膜的相互作用。后一种效应可能导致同ER结合底物或同ER结合CPR的相互作用得到改善。

本实施例提供了来自植物甜叶菊(Srvia rebaudiana)的野生型异贝壳杉烯酸羟化酶(Sr.KAH)的活性数据,其中原生N端跨膜结构域与其他ER结合蛋白(包括但不限于,其他细胞色素P450酶和细胞色素P450还原酶(CPR))的N端跨膜结构域进行交换。

为了制备嵌合蛋白质,将野生型Sr.KAH和候选ER结合蛋白在各个位置截短,例如(1)富含脯氨酸的区域,(2)由TMHMM服务器(网址为www.cbs.dtu.dk/services/TMHMM/)预测的跨膜结构域位点,(3)大约嵌入N端氨基酸编号为30-50周围的带正电荷的残基,或(4)基于序列比对。然后将来自候选蛋白质的N端区域添加至包含催化结构域的所述截短Sr.KAH蛋白质。

为了筛选活性,使用嵌合蛋白质的基因来转化缺少上述功能性KAH基因的Reb M生成酵母;将野生型Sr.KAH(SEQ ID NO:1,其对应于EP 3009508中的序列识别号164)用作对照。

使用两种单独的方法来计算KAH P450功能。第一种是采用嵌合蛋白质在细胞中生成的Reb M总量与采用野生型Sr.KAH在细胞中生成的Reb M总量的比值。第二种计算P450功能的方法是,与采用野生型Sr.KAH在细胞中生成的总甜菊糖苷类化合物的总量(以μM计)相比,采用嵌合蛋白质在细胞中生成的所有甜菊糖苷类化合物的总量(以μM计)。后一种“甜菊醇当量”的度量更为准确,因为其可以计算出细胞中生成的所有甜菊醇,即使有些中间体残留下来并且没有全部转化为RebM。

每个嵌合体通过其与野生型Sr.KAH的总甜菊醇当量比进行排序。相对于野生型Sr.KAH,植物CPR ATR2和植物甜叶菊贝壳杉烯氧化酶(Sr.KO)的N端结构域均表现出相等或提高的活性(表8)。

表8.由N端结构域交换产生的野生型Sr.KAH衍生物的改良等位基因,相对于野生型Sr.KAH活性的提高倍数,以及相关的氨基酸变化

实施例10:N端结构域交换以改善Sr.KAH,突变体#10的最佳进化变体的体内活性

在实施例8中,在最佳改良的组合Sr.KAH变体中发现的氨基酸突变,突变体#10,与实施例9、表8中的3个N端结构域交换进行组合,从而增加了总甜菊醇当量。完全按照实施例9所述制备嵌合体,只是使用实施例8的突变体#10的DNA序列代替野生型Sr.KAH DNA序列。Sr.KAH突变体#10中的所有突变均保留在所得N端结构域交换的嵌合体中。含有所述经进化的氨基酸突变的新的嵌合基因被转化到Reb M生成酵母中。所述经进化的Sr.KAH突变体#10用作实验对照。完全按照实施例9中所述,计算N端结构域交换对Sr.KAH突变体#10活性的影响。将来自青蒿(Aa.CPR)和拟南芥(ATR2)的两个基因CPR的N端序列与N端被截短的Sr.KAH突变体#10融合,使得KAH酶促活性提高了60%(表9)。

表9.由N端结构域交换产生的进化Sr.KAH突变体#10的等位基因,相对于Sr.KAH突变体#10活性的提高倍数,以及相关的氨基酸变化

实施例11:N端结构域交换以改善Sr.KAH,突变体#3的进化变体的体内活性

为了测试是否可利用实施例9和10中鉴定的有益N端结构域交换来改善其他Sr.KAH变体的活性,将来自另一改良变体Sr.KAH突变体#3(实施例8)的有益氨基酸突变与实施例10中鉴定的两个最佳N端结构域交换进行组合。将所得嵌合基因用于转化缺少功能性KAH基因的Reb M生成酵母,并分析了Reb M和总甜菊糖苷类化合物的滴度(表10)。将来自青蒿(Aa.CPR)和拟南芥(ATR2)的两个基因CPR的N端序列与22个氨基酸的N端被截短的Sr.KAH突变体#3融合,使得在此菌株背景中提高了约25%。

表10.由N端结构域交换产生的进化Sr.KAH突变体#3的等位基因,相对于Sr.KAH突变体#3活性的提高倍数,以及相关的氨基酸变化

实施例12:原生酵母ER蛋白的N端结构域交换以提高Sr.KAH突变体#10的进化变体的体内活性

在实施例10和11中,衍生自Aa.CPR和ATR2的两个有益跨膜结构域所共有的拓扑特征之一是大约50个氨基酸长的序列,其预计位于第一跨膜螺旋之前的内质网(ER)管腔内部。在膜菌群数据库(可从membranome.org/获悉)中记载的酿酒酵母有15种蛋白质,均在其N端具有单螺旋跨膜结构域。使用TMHMM服务器(可从www.cbs.dtu.dk/services/TMHMM/获悉)扫描这15个蛋白序列,发现了几种此类N端序列,其类似于Aa.CPR和ATR2跨膜结构域所共有的模式。所述这些包括ERG11(1a:80a),ERG11(1a:51a),ALG11(1a:45a),SEC66(1a:50a),NUS1(1a:119a),RCR1(1a:62a),和UBP1(1a:52a)。

创建了这些N端,原生酵母序列N端被截短的Sr.KAH突变体#10的融合体。将嵌合基因序列插入缺少功能性KAH基因的Reb M生成酵母中,并按照实施例8所述,分析了Reb M和总甜菊糖苷类化合物的滴度。

在所测试的7个嵌合基因中,与Sr.KAH突变体#10相比,包含SEC66(1a:50a)和UBP1(1a:52a)的两个嵌合体提高了约20%。三个N端序列(ERG11(1a:80a)、NUS1(1a:119a)和RCR1(1a:62a))显然破坏了KAH的功能,而两个(ALG11(1a:45a)和ERG11(1a:51a))则对活性无明显影响(表11)。

表11.源自原生酵母N端结构域交换的进化Sr.KAH突变体#10的等位基因,相对于Sr.KAH突变体#10活性的提高倍数,以及相关的氨基酸变化

重要的是,实施例9、10、11和12的结果表明,当在异源宿主中表达P450酶时,交换细胞色素P450酶的N端(ER相关蛋白结构域)可改善细胞色素P450酶的活性。

实施例13:通过定点饱和诱变进一步改善Sr.KAH突变体#3

为了进一步提高Sr.KAH突变体#3的活性(实施例8),施加了另一轮定点饱和诱变,并分离了具有更高活性的将异贝壳杉烯酸转化为甜菊醇的突变体(图1)。将Sr.KAH突变体#3序列中175个选定位置(E2、A3、S4、Y5、L6、Y7、I8、I10、L11、L12、L13、L14、A15、S16、Y17、L18、F19、T20、T21、Q22、L23、R24、R25、K26、S27、A28、N29、L30、F35、S37、I38、I40、I41、H43、L46、L47、K49、Y52、T54、K57、I58、A60、Y62、L66、Q67、L68、L70、G71、Y72、R74、L76、S80、P81、S82、E85、C87、T89、N91、V93、I94、F95、N97、K100、L102、K105、I106、V107、T110、S114、S116、D119、Q120、N123、V127、S129、I130、I132、V135、H136、N139、D143、R145、N149、R150、L151、L153、R157、D158、S160、S161、T164、L165、R166、T167、V168、L172、L174、I177、S182、D191、R192、S215、G218、I223、L227、V229、K230、D232、K235、I237、G249、R258、G259、A260、K261、V262、G263、K264、G265、R266、G295、G306、M308、V316、V333、N336、I339、I344、G345、L350、G351、N355、S373、A374、S379、N382、I383、G386、L389、V391、H397、T408、Q415、G416、L417、G419、T420、R421、D422、G423、F424、K425、L426、M427、S431、G432、R433、G440、A442、I443、L445、G447、M448、V453、V462、L473、V484、P489、S491、E492、T494、N495、L496、L497、和S498)各自突变为由简并密码子NNT编码的15个不同氨基酸(A、C、D、F、G、H、I、L、N、P、R、S--由两个密码子编码--、T、V、和Y),其中N代表任何核苷酸腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶,T代表胸腺嘧啶。如实施例7所述,Sr.KAH基因变体的NNT库采用在所需位置包含NNT简并密码子的引物通过PCR来构建,并用于转化缺少功能性KAH基因的Reb M生成酵母,以整合在着陆垫上用于表达KAH。

如实施例7所述,使用总甜菊糖苷类化合物(μM)的滴度,在第1层(Tier 1)筛选中相对于Sr.KAH突变体#3等位基因测定了NNT库突变体的体内KAH活性。针对蛋白质序列中的每个突变位置筛选了39个分离株,每个独特的变体在N=1时覆盖率为约2.5倍。在发现Sr.KAH突变体#3的突变似乎增加了体内酶活性后,采用与实施例7中所述相同的计算方法,对含有特定目的突变体的菌株进行更高程度的复制(N=10),以进行第二层(Tier 2)筛选,从而确证其改善。图6和表12中报告了与Sr.KAH突变体#3相比,NNT衍生的突变体Sr.KAH等位基因的所产生活性的增加倍数。

表12.改良的Sr.KAH突变体#3等位基因:相关的氨基酸变化以及相对于Sr.KAH突变体#3活性的提高倍数

已鉴定出可使活性提高的20种突变,相对于Sr.KAH突变体#3,其活性提高范围为17%至4倍。与Sr.KAH突变体#3(已比野生型Sr.KAH突变体提高了5倍,实施例8)相比,此定点饱和诱变NNT库(L13V)产生的最佳突变体可提高体内KAH活性4.3倍。有趣的是,此保守突变(亮氨酸和缬氨酸均具有小型疏水性侧链)位于蛋白质的N端,其中通过结构域交换的改变对蛋白质活性具有显著影响(实施例9-12)。另一个有益的突变,N29G,亦属于Sr.KAH的N端结构域。同样有趣的是,改善野生型Sr.KAH活性的突变组成(实施例7)与改善Sr.KAH突变体#3活性的突变组成(本实施例)是非常不同的。突变体#3与野生型Sr.KAH有6个氨基酸不同,其中G306L是对此两种酶变体均有益的唯一突变:野生型的排名最高,而Sr.KAH的突变体#3的排名第9。

本说明书中引用的所有出版物、专利和专利申请均通过引用并入本发明,如同每个单独的出版物或专利申请被具体和单独地指出通过引用并入。尽管出于清楚理解的目的,已通过举例说明和示例的方式对权利要求书进行了详细描述,但根据本发明教导,对于本领域普通技术人员而言将显而易见的是,在不脱离所附权利要求书的精神或范围的情况下,可对其进行某些改变/变化以及修改/修饰。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号