首页> 中国专利> 用于合成色胺和色胺类似物的衍生物的生物催化剂和方法

用于合成色胺和色胺类似物的衍生物的生物催化剂和方法

摘要

本公开内容提供了用于产生胺的工程化转氨酶多肽、编码该工程化转氨酶的多核苷酸、能够表达该工程化转氨酶的宿主细胞、以及使用该工程化转氨酶制备在产生活性药物试剂中有用的化合物的方法。本公开内容提供了具有转氨酶活性的工程化多肽、编码该多肽的多核苷酸、制备该多肽的方法、和使用该多肽用于将酮底物生物催化转化为胺产物的方法。本发明的酶已被工程化为具有与河流弧菌(Vibrio fluvialis)的天然存在的转氨酶的氨基酸序列相比的一个或更多个残基差异。特别是,本公开内容的转氨酶已被工程化为从其相应的前手性酮底物有效形成手性色胺衍生物。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-06-30

    授权

    授权

  • 2015-05-06

    实质审查的生效 IPC(主分类):C12N9/10 申请日:20130322

    实质审查的生效

  • 2015-04-08

    公开

    公开

说明书

1.技术领域

本公开内容涉及转氨酶生物催化剂以及使用该生物催化剂制备色胺 和色胺类似物的衍生物的方法。

2.对序列表、表格或计算机程序的引用

序列表的正式文本作为ASCII格式文本文件与说明书经EFS-Web同时 被提交,文件名为“CX2-105USP1_ST25.txt”,创建日期为2012年3月23 日,且大小为457,542千字节。经EFS-Web提交的序列表为本说明书的一 部分,并且通过引用以其整体并入本文。

3.背景

色胺类化合物具有核心通式

色胺和色胺类似物的衍生物,诸如同质色胺(homotryptamine),可对胺 上的α-碳、β-碳和吲哚环进行取代。因为此类衍生物与神经递质血清素和 褪黑激素在结构上相似,许多具有精神活性属性。例如,5-羟基-N,N-二甲 基色胺、N,N-二甲基色胺、4-羟基-N,N-二甲基色胺、5-甲氧基-α-甲基色胺、 α-甲基色胺、和α-乙基色胺具有致幻性质并在美国被规定为列表1管制物 质(Schedule 1Controlled Substances)。色胺、色胺类似物及其衍生物还形 成了许多药物化合物的骨架,例如致幻剂麦角酰二乙胺(LSD)、抗疟原虫 药螺吲哚酮(Yeung等人,2010,J Med Chem.53:5155–5164),痛觉螺环己烷 衍生物(美国专利公布号20100240897),以及法尼酯X受体拮抗剂氮杂卓 并吲哚(azepinoindole)衍生物(美国专利公布号20100173824)。

在α-碳处具有取代基的色胺衍生物,例如α-甲基色胺、或以及α-乙基 色胺,导致手性中心,并且这些对映体已显示了展示不同的生物活性。例 如,α-甲基色胺的S-异构体显示比R-异构体更大的效力(参见,例如,D.B. Repke等人,1976,J Heterocycl Chem.13:775)。具有手性α-甲基色胺或α- 甲基同质色胺组分的抗疟原虫药螺吲哚酮的不同异构体,也显示不同的效 力,例如(1R,3S)异构体显示比(1R,3R)异构体更高的抗疟原虫活性(参见上 述Yeung;WO2009/132921):

制备手性α-碳取代的色胺和色胺类似物,诸如α-甲基色胺和α-甲基同 质色胺,可采用分离/隔离期望的异构体或使用采用手性起始化合物用于不 对称合成的化学合成途径。后者的示例是合成抗疟原虫药螺吲哚酮,其可 使用D-色氨醇作为起始化合物用于合成手性中间体S-α-甲基色胺(上述 Yeung等人)。

用于制备手性化合物的其他一般方法包括与保留手性的无手性试剂 连续反应,使用掺入了对映体纯的手性中心的试剂或催化剂以转换对映体 为具有不同反应性的非对映体,使用化学手性催化剂以及手性助剂化合 物。

分离并隔离对映体可以是费时的,而化学不对称合成策略可受限于分 子可经历的可能反应,需要苛刻的反应条件和/或复杂的合成路线。实例是 D-色氨醇在合成螺吲哚酮中的可用性,其由于其合成需要的复杂的合成步 骤而受限。因此,期望开发用于制备α-取代的色胺及结构上相关的类似物 的合成方法,该方法使用温和条件,导致期望的手性化合物的高对映体过 量,具有起始原料至期望的产物的高转化,并且是成本有效的。

4.概述

本公开内容提供了具有转氨酶活性的工程化多肽、编码该多肽的多核 苷酸、制备该多肽的方法、以及使用该多肽用于生物催化转化酮底物为胺 产物的方法。与河流弧菌(Vibrio fluvialis)的天然存在的转氨酶的氨基酸序 列(SEQ ID NO:2)和具有增强的溶剂稳定性和热稳定性的参考工程化转氨 酶的氨基酸序列(SEQ ID NO:4)相比,本发明的酶已被工程化为具有一个或 更多个残基差异,其中残基差异存在于影响以下各种酶特性的残基位置 上:包括活性、立体选择性、稳定性、表达、和产物耐受性,以及其他。 特别地,本公开内容的转氨酶已被工程化为从其相应的前手性酮底物有效 形成手性色胺衍生物。因此,本文公开的工程化多肽展示了在从相应的前 手性酮底物形成色胺衍生物中,特别是在底物化合物(2),1-(1H-5-氟-6-氯- 吲哚-3-基)丙-2-酮向产物化合物(1),(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺 的转化中,增加的活性、溶剂稳定性和热稳定性、增加的产物耐受性、以 及高立体选择性,以及其他,

因此,在一个方面,本公开内容提供了具有转氨酶活性的工程化多肽, 其中该工程化多肽包括具有与SEQ ID NO:2或4的至少80%同一性和与 SEQ ID NO:4相比在选自以下的残基位置上的一个或更多个残基差异的氨 基酸序列:X14;X26;X31;X33;X41;X47;X57;X70;X86;X88; X107;X132;X148;X163;X168;X173;X203;X250;X284;X314; X315;X324;X346;X395;X398;X400;X417;X419;X423;X448; 和X451,其中在残基位置X31;X57;X86;X163;X168;X314;X324; X398;和X417处的残基差异选自:X31S;X57Y;X86D;X163I;X163L; X163R;X163V;X168S;X314N;X324H;X398L;X398V;X398W;和 X417M。

在一些实施方案中,在残基位置X14;X26;X33;X41;X47;X70; X88;X107;X132;X148;X173;X203;X250;X284;X315;X346; X395;X400;X419;X423;X448;和X451处的残基差异选自X14V; X26R;X33T;X41L;X47N;X70A;X88A;X88L;X107P;X132F; X148Q;X148R;X173A;X203S;X250A;X284A;X315G;X346L;X395P; X400G;X419S;X423I;X448E;和X451D。

如本文所提供,在一些实施方案中,公开的残基差异可单独或以各种 组合被用于产生具有改进的酶特性的工程化多肽。在本文详细的说明书中 提供了关于残基差异的选择和对酶特性的影响的指导。在一些实施方案 中,工程化转氨酶多肽包括具有与参考序列SEQ ID NO:4的至少80%序列 同一性和与SEQ ID NO:4相比在选自以下的残基位置上至少一个残基差异 的氨基酸序列:X14、X86、X163、或X400。在一些实施方案中,氨基酸 序列具有在位置X163上的至少一个残基差异,其中氨基酸残基选自I、L、 R和V。

在一些实施方案中,工程化转氨酶多肽包括具有与SEQ ID NO:4相比 选自以下的残基差异的组合的氨基酸序列:(a)X14V和X163I/L/R/V;(b) X86D和X400G;(c)X57F/Y和X163I/L/R/V;(d)X57F/Y和X398L/V/W; (e)X14V、X113L/V、X163I/L/R/V、X284A、和X424V;以及(f)X31S、 X57F/Y、X163I/L/R/V、X315G、X346L、和X398L/V/W。

在一些实施方案中,工程化转氨酶多肽包括具有与SEQ ID NO:4相比 选自以下的残基差异的组合的氨基酸序列:(a)X14V、X113L、X163L、 X284A、和X424V;(b)X14V、X26R、X163L、X284A、和X400G;(c)X14V、 X26R、X88L、和X113L;(d)X57F、X163L、X168K、X314N、X315G、 X346L、和X398V;(e)X14V、X163L、X173A、X400G、和X420N;(f)X14V、 X113L、X163L、和X284A;(g)X14V、X26R、X163L、X284A、和X400G; 以及(h)X14V、X33T、X57F、X113L、和X163L。

在一些实施方案中,工程化转氨酶多肽能够在适当的反应条件下以至 少90%对映体过量将底物化合物(2),1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-酮转 化为产物化合物(1),(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺。

在一些实施方案中,工程化转氨酶多肽在将底物化合物(2)转化为产物 化合物(1)中具有SEQ ID NO:4的至少1.2倍活性,其中氨基酸序列包括选 自以下的一个或更多个残基差异:X14V、X26R;X31S;X33T;X41L; X70A;X86D;X88A/L;X163I/L;X284A;和X419S。在一些实施方案 中,工程化转氨酶多肽在将底物化合物(2)转化为产物化合物(1)中具有SEQ  ID NO:4的至少5倍活性,其中氨基酸序列包括选自以下的一个或更多个 残基差异:X14V、X26R;X33T;X88A/L;X163I/L;和X284A。

在一些实施方案中,与SEQ ID NO:4相比,工程化转氨酶多肽在在适 当的反应条件下将底物化合物(2)转化为产物化合物(1)中具有对产物化合 物(1)抑制的至少1.2倍增加的耐受性,其中氨基酸序列包括选自以下的一 个或更多个残基差异:X26R;X70A;X86D;X88A/L;X132F;X163L; X315G;X395P;X398L;和X419S。在一些实施方案中,与SEQ ID NO:4 相比,工程化转氨酶多肽在在适当的反应条件下将底物化合物(2)转化为产 物化合物(1)中具有对产物化合物(1)抑制的至少5倍增加的耐受性,其中氨 基酸序列包括选自以下的一个或更多个残基差异:X26R;X88L;和X163L。

在一些实施方案中,工程化转氨酶多肽可具有在其他残基位置上的另 外的残基差异。在一些实施方案中,工程化转氨酶可具有与SEQ ID NO:2 或4相比的1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9 个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25 个、1-30个、1-35个、1-40个、1-45个、或1-50个另外的残基差异。在 一些实施方案中,工程化转氨酶可具有1个、2个、3个、4个、5个、6 个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、 17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、 30个、35个、40个、45个、或50个另外的残基差异。在一些实施方案 中,氨基酸序列另外具有与SEQ ID NO:2或4相比的1个、2个、3个、4 个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、 15个、16个、18个、20个、21个、22个、23个、24个、或25个残基 差异。

在表2A和2B、以及实施例中公开了掺入残基差异、包括其各种组合、 并具有改进的特性(例如,能够在适当的反应条件下以至少90%对映体过 量将化合物(2)转化为化合物(1))的示例性工程化多肽。氨基酸序列提供于 序列表中并且包括SEQ ID NO:6、8、10、12、14、16、18、20、22、24、 26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、 58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、 90、92、94、96、98、100、102、104、106、108、110、112、114、116、 118、120、122、124、126、128、130、132、134、136、138、140、142、 144、146、148、150、152、和154。

在另一个方面,本公开内容提供了编码具有转氨酶活性的工程化多肽 的多核苷酸、以及包含该多核苷酸的表达载体、和能够表达编码工程化多 肽的多核苷酸的宿主细胞。示例性多核苷酸序列提供于通过引用并入本文 的序列表中并且包括SEQ ID NO:5、7、9、11、13、15、17、19、21、23、 25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、 57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、 89、91、93、95、97、99、101、103、105、107、109、111、113、115、 117、119、121、123、125、127、129、131、133、135、137、139、141、 143、145、147、149、151、和153。

在一些实施方案中,本公开内容还提供了制造工程化转氨酶多肽的方 法,其中该方法可包括在适合于表达多肽的条件下培养能够表达编码工程 化转氨酶多肽的多核苷酸的宿主细胞。在一些实施方案中,制造工程化转 氨酶多肽的方法还可包括:(a)合成编码多肽的多核苷酸,所述多肽包括选 自以下的氨基酸序列:SEQ ID NO:6、8、10、12、14、16、18、20、22、 24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、 56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、 88、90、92、94、96、98、100、102、104、106、108、110、112、114、 116、118、120、122、124、126、128、130、132、134、136、138、140、 142、144、146、148、150、152、和154,并且具有与SEQ ID NO:4相比 在选自以下的残基位置上的一个或更多个残基差异:X14;X26;X31;X33; X41;X47;X57;X70;X86;X88;X107;X132;X148;X163;X168; X173;X203;X250;X284;X314;X315;X324;X346;X395;X398; X400;X417;X419;X423;X448;和X451,其中在残基位置X31;X57; X86;X163;X168;X314;X324;X398;和X417上的残基差异选自: X31S;X57Y;X86D;X163I;X163L;X163R;X163V;X168S;X314N; X324H;X398L;X398V;X398W;和X417M;以及(b)表达由多核苷酸编 码的转氨酶多肽。如以上所注,在残基位置X14;X26;X33;X41;X47; X70;X88;X107;X132;X148;X173;X203;X250;X284;X315;X346; X395;X400;X419;X423;X448;和X451上的残基差异可选自X14V; X26R;X33T;X41L;X47N;X70A;X88A;X88L;X107P;X132F; X148Q;X148R;X173A;X203S;X250A;X284A;X315G;X346L;X395P; X400G;X419S;X423I;X448E;和X451D。如在详细描述中进一步提供 的,在合成多核苷酸期间可掺入另外的变异,以制备在表达的氨基酸序列 中具有相应差异的工程化转氨酶。

在另一个方面,工程化转氨酶多肽可被用于从其相应的酮底物制备色 胺和色胺类似物的各种衍生物,诸如取代的同质色胺的方法中。因此,在 一些实施方案中,工程化转氨酶多肽可被用于将式(II)的底物化合物转化为 式(I)的产物化合物的方法中,如下所示:

其中

R1选自由以下组成的组:氢、羧基、羧基(C1-C6)烷基、任选地取代 的(C1-C6)烷基、任选地取代的(C2-C6)烯基、任选地取代的烷氧基羰 基、任选地取代的芳基羰基、任选地取代的芳基磺酰基、和保护基团;

R2选自由以下组成的组:氢、氧代、卤代、羟基、氨基、硫代、任选 地取代的(C1-C6)烷基、(C1-C6)烷基氨基、(C1-C6)二烷基氨基、(C1-C6) 烷基硫代、(C1-C6)烷基磺酰基、(C1-C6)烷基亚磺酰基、和任选地取代 的(C1-C6)烷氧基;

R4、R6和R7各自彼此独立地选自由以下组成的组:氢、卤代、羟基、 氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6) 烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、 任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、 任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰 基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、 任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、 任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选 地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选 地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧 基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地 取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰 基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选 地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基 (C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;

R5选自由以下组成的组:氢、卤代、羟基、氨基、羧基、氰基、硝基、 硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的 (C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6) 二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6) 烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、 (C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、 氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、 任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地 取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任 选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳 基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选 地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基 亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、 烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺 酰基(C1-C6)烷基、或与R4一起形成5至8元任选地取代的环烷基或任 选地取代的杂环;

R8选自由以下组成的组:任选地取代的(C1-C6)烷基、任选地取代的 (C1-C6)烷氧基、任选地取代的环烷基、任选地取代的杂环烷基、任选地 取代的芳基、和任选地取代的杂芳基、或与R2一起形成任选地取代的5 至8元环烷基或杂环;以及

n是1或2;

条件是

(a)当R2是氢时,则以下的至少一个适用:

(i)R1不是氢、甲基、4-(甲氧基)苯基羰基-、4-(三氟甲氧基) 苯磺酰基-、3-溴苯基羰基-、3-氨基丙基、或3-(甲基羰基氨基)丙基-;

(ii)R4和R7各自彼此独立地不是氢或氯;

(iii)R5不是氢、羟基、甲基、甲氧基、氟、氯、三氟甲基、或氰基;

(iv)R6不是氢、羟基、甲氧基、氟或氯;或

(v)R8不是甲基、乙基、羟甲基、或三氟甲基-;以及

(b)当n是1,R2和R8一起形成环己基环,并且R1、R4、R6、和R7是氢时,则R5不是氟。

因此,在一些实施方案中,用于制备结构式(I)的化合物的方法可包括 在适当的反应条件下在胺供体的存在下,使结构式(II)的化合物与本公开内 容的任何工程化转氨酶接触。

在一些实施方案中,转氨酶的立体选择性可被用于制备在以*标记的 碳原子上具有指定的立体化学的式(IS)的手性化合物,

其中R1、R2、R4、R5、R6、R7、R8和n如以上所定义,并且

其中式(IS)的化合物以对映体过量来形成。在方法的一些实施方案 中,式(IS)的化合物可以以至少90%、91%、92%、93%、94%、95%、96%、 97%、98%、99%或更大的对映体过量来形成。

在一些实施方案中,工程化转氨酶多肽可被用于将式(IIb)的底物化合 物转化为结构式(Ib)的产物化合物的方法中,如下所示:

其中,

Z选自由以下组成的组:O、S、NH、或-(CH2)m-、其中m为0、1、2 或3;

R1选自由以下组成的组:氢、羧基、羧基(C1-C6)烷基、任选地取代 的(C1-C6)烷基、任选地取代的(C2-C6)烯基、任选地取代的烷氧基羰 基、任选地取代的芳基羰基、任选地取代的芳基磺酰基、和保护基团;

R4、R5、R6和R7各自彼此独立地选自由以下组成的组:氢、卤代、 羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟 基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6) 烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6) 烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6) 烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基 羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代 的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂 芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基 硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取 代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧 基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的 杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基 羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳 基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;

条件是当Z为-(CH2)m-,m为1,并且R1、R4、R6和R7为氢时,则 R5不是氟。

因此,在一些实施方案中,制备结构式(Ib)的化合物的方法可包括在 适当的反应条件下在胺供体的存在下,使结构式(IIb)的化合物与本公开内 容的任何工程化转氨酶接触。

在一些实施方案中,转氨酶的立体选择性可被用于制备在以*标记的 碳原子上具有指定的立体化学的式(IbS)的手性化合物,

其中Z、R1、R4、R5、R6、和R7如以上所定义,并且其中式(IbS) 的化合物以对映体过量来形成。在方法的一些实施方案中,式(IbS)的化合 物可以以至少90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更大的对映体过量来形成。

如本文所提供,使用工程化转氨酶的方法可在适当的反应条件的范围 下来进行,反应条件包括胺供体、pH、温度、缓冲液、溶剂系统、底物载 量、多肽载量、辅因子载量、压力、和反应时间的范围,以及其他。

在一些实施方案中,用于氨基转移方法的适当的反应条件可包括:(a) 以约5g/L至200g/L的底物载量;(b)约0.1至50g/L的工程化转氨酶多肽; (c)约0.1至4M的异丙胺(IPM);(d)约0.1至10g/L的磷酸吡哆醛(PLP)辅 因子;(e)约6至9的pH;以及(f)约30℃至60℃的温度。

在一些实施方案中,用于氨基转移方法的适当的反应条件可包括:(a) 以约5至约20g/L的底物载量;(b)约0.05至2g/L的工程化转氨酶多肽; (c)约1至10%v/v的PEG200;(d)约1至2M的异丙胺(IPM);(e)约0.1至 1g/L的磷酸吡哆醛(PLP)辅因子;(f)约0.1至约0.5M的三乙醇胺(TEA); (g)约6至8的pH;以及(h)约45℃至55℃的温度。

在一些实施方案中,用于氨基转移方法的适当的反应条件可包括:(a) 约25至约100g/L的底物载量;(b)约0.5至10g/L的转氨酶多肽;(c)约1 至10%v/v的PEG200;(d)约1至2M的异丙胺(IPM);(e)约0.1至1g/L 的磷酸吡哆醛(PLP)辅因子;(f)约0.1至约0.5M的三乙醇胺;(g)约6至8 的pH;以及(h)约45℃至55℃的温度。

关于选择工程化转氨酶、制备生物催化剂、选择酶底物、以及进行方 法的参数的指导进一步被描述于以下的详细说明中。

5.详述

除非上下文另外清楚地指明,否则如该说明书和所附的权利要求书中 使用的单数形式“一(a)”、“一(an)”和“该(the)”包括复数指示物。因此,例如, 提及“一种多肽”包括多于一种多肽。

类似地,“包括(comprise)”、“包括(comprises)”、“包括(comprising)”、 “包括(include)”、“包括(includes)”、和“包括(including)”是可互换 的,且不意图为限制性的。

还应理解的是,当各个实施方案的描述使用术语“包括(comprising)” 时,本领域技术人员将理解,在一些特定情况下,一种实施方案可替代地 利用措辞“基本上由…组成”或“由…组成”来描述。

应理解的是,上述的一般说明,包括附图和以下详述两者都只是示例 性和说明性的,而不是限制本公开内容。

本文所用的章节标题仅用于组织目的,且不应当被解释为限制所描述 的主题。

5.1缩写

用于遗传编码的氨基酸的缩写是常规的,并如下:

当使用三字母缩写时,除非前面明确加有“L”或“D”或从使用缩写的上 下文明显,否则氨基酸可为关于α-碳(Cα)成L-构型或D-构型。例如,尽管 “Ala”表示丙氨酸,而没有指明关于α-碳的构型,但“D-Ala”与“L-Ala”分别 表示D-丙氨酸与L-丙氨酸。当使用单字母缩写时,大写字母表示关于α- 碳的L-构型的氨基酸,而小写字母表示关于α-碳的D-构型的氨基酸。例 如,“A”表示L-丙氨酸而“a”表示D-丙氨酸。当多肽序列被呈现为一串单字 母或三字母缩写(或其混合)时,根据通常惯例,序列以氨基(N)至羧 基(C)方向呈现。

用于基因编码的核苷的缩写是常规的,并且是如下:腺苷(A);鸟苷(G); 胞苷(C);胸苷(T);以及尿苷(U)。除非特别描绘,否则缩写的核苷可为核 糖核苷或2’-脱氧核糖核苷。核苷可以单个计或以聚集体计被指定为核糖核 苷或2’-脱氧核糖核苷。当核酸序列被呈现为一串单字母缩写时,根据通常 惯例,序列以5’至3’方向呈现,且没有显示磷酸盐。

5.2定义

关于本公开内容,除非另外具体指明,否则本文的说明书中使用的技 术术语和科学术语将具有本领域普通技术人员通常理解的含义。因此,以 下术语意为具有以下含义。

“蛋白”、“多肽”和“肽”在本文中可互换使用,表示通过酰胺键共价连 接的至少两个氨基酸的聚合物,而不论长度或翻译后修饰(例如,糖基化、 磷酸化、脂化、肉豆蔻化(myristilation)、泛素化等等)。在这一定义中包 括D-氨基酸和L-氨基酸,以及D-氨基酸和L-氨基酸的混合物。

“多核苷酸”或“核酸”是指共价地连接在一起的两个或更多个核苷。多 核苷酸可完全由核糖核苷(即,RNA)组成,完全由2’-脱氧核糖核苷酸 (即,DNA)组成或由核糖核苷和2’-脱氧核糖核苷的混合物组成。尽管 核苷将通常通过标准磷酸二酯键合连接在一起,但多核苷酸可包括一个或 多个非标准的键合。多核苷酸可以是单链的或双链的,或可包括单链区和 双链区两者。此外,虽然多核苷酸将通常由天然存在的编码核碱基(即, 腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶)组成,但其可包括一个或 更多个修饰的和/或合成的核碱基,诸如,例如,肌苷、黄嘌呤、次黄嘌呤 等。优选地,这种修饰的或合成的核碱基将为编码核碱基。

“转氨酶”或“氨基转移酶”在本文可互换使用,以指具有从伯胺将氨基 (NH2)转移至受体分子的羰基(C=O)的酶促能力的多肽。如本文所用的转氨 酶包括天然存在的(野生型)转氨酶以及由人工操作产生的非天然存在的 工程化多肽。

“氨基受体”和“胺受体”、“酮底物”、“酮基”、和“酮”在本文可互换使用 以指接受来自供体胺的氨基基团的羰基(酮基、或酮)化合物。在一些实 施方案中,氨基受体是以下通式的分子,

其中,Rα与Rβ中的每一个当独立地被采用时,是烷基、环烷基、杂 环烷基、芳基或杂芳基,其可以是未被取代的或用一个或更多个酶学上可 接受的基团取代的。Rα可在结构或手性上与Rβ相同或不同。在一些实施 方案中,Rα与Rβ,一起可形成为未被取代的、取代的或稠合至其他环的环。 氨基受体包括酮基羧酸和链烷酮(酮)。典型的酮基羧酸是α-酮基羧酸诸 如乙醛酸、丙酮酸、草酰乙酸和类似的酮基羧酸,以及这些酸的盐。氨基 受体还包括由其他酶或全细胞进程转化为氨基受体的物质,诸如富马酸 (其可被转化为草酰乙酸)、葡萄糖(其可被转化为丙酮酸盐)、乳酸盐、 马来酸以及其他。可被使用的氨基受体包括,通过举例的方式而非限制, 3,4-二氢萘-1(2H)-酮、1-苯基丁-2-酮、3,3-二甲基丁-2-酮、辛-2-酮、3-氧代 丁酸乙酯、4-苯基丁-2-酮、1-(4-溴苯基)乙酮、2-甲基-环己酮、7-甲氧 基-2-四氢萘酮、1-羟基丁-2-酮、丙酮酸、苯乙酮、3’-羟基苯乙酮、2-甲氧 基-5-氟苯乙酮、乙酰丙酸、1-苯基丙-1-酮、1-(4-溴苯基)丙-1-酮、1-(4- 硝基苯基)丙-1-酮、1-苯基丙-2-酮、2-氧代-3-甲基丁酸、1-(3-三氟甲基 苯基)丙-1-酮、羟基丙酮、甲氧基氧基丙酮(methoxyoxypropanone)、1- 苯基丁-1-酮、1-(2,5-二甲氧基-4-甲基苯基)丁-2-酮、1-(4-羟基苯基) 丁-3-酮、2-乙酰基萘、苯基丙酮酸、2-酮戊二酸和2-酮丁二酸,包括可能 的(R)和(S)单异构体二者。

“氨基供体”或“胺供体”是指向氨基受体给予氨基,因此成为羰基物质 的氨基化合物。在一些实施方案中,氨基供体是以下通式的分子,

其中,Rε与Rδ中的每一个当独立地被采用时,是烷基、环烷基、杂环 烷基、芳基或杂芳基,其是未被取代的或用一个或更多个酶学上非抑制基 团取代的。Rε可在结构或手性上与Rδ相同或不同。在一些实施方案中,Rε与Rδ,一起可形成为未被取代的、取代的或稠合至其他环的环。可使用的 典型的氨基供体包括手性与非手性氨基酸、以及手性与非手性胺。可使用 的氨基供体包括,通过举例的方式而非限制,异丙胺(也称为2-氨基丙烷)、 α-苯乙胺(也称为1-苯乙胺)以及其对映异构体(S)-1-苯乙胺与(R)-1-苯乙 胺、2-氨基-4-苯基丁烷、甘氨酸、L-谷氨酸、L-谷氨酸盐、谷氨酸单钠、 L-丙氨酸、D-丙氨酸、D,L-丙氨酸、L-天冬氨酸、L-赖氨酸、D,L-鸟氨酸、 β-丙氨酸、牛磺酸、正辛胺、环己胺、1,4-丁二胺(也被称为腐胺)、1,6- 己二胺、6-氨基己酸、4-氨基丁酸、酪胺和苄胺、2-氨基丁烷、2-氨基-1- 丁醇、1-氨基-1-苯基乙烷、1-氨基-1-(2-甲氧基-5-氟苯基)乙烷、1-氨基 -1-苯基丙烷、1-氨基-1-(4-羟基苯基)丙烷、1-氨基-1-(4-溴苯基)丙烷、 1-氨基-1-(4-硝基苯基)丙烷、1-苯基-2-氨基丙烷、1-(3-三氟甲基苯基) -2-氨基丙烷、2-氨基丙醇、1-氨基-1-苯基丁烷、1-苯基-2-氨基丁烷、1-(2,5- 二甲氧基-4-甲基苯基)-2-氨基丁烷、1-苯基-3-氨基丁烷、1-(4-羟基苯基) -3-氨基丁烷、1-氨基-2-甲基环戊烷、1-氨基-3-甲基环戊烷、1-氨基-2-甲基 环己烷、1-氨基-1-(2-萘基)乙烷、3-甲基环戊胺、2-甲基环戊胺、2-乙基 环戊胺、2-甲基环己胺、3-甲基环己胺、1-氨基四氢化萘、2-氨基四氢化萘、 2-氨基-5-甲氧基四氢化萘和1-氨基茚满,包括可能的(R)和(S)单异构体二 者且包括该胺的所有可能的盐。

“手性胺”是指通式Rα-CH(NH2)-Rβ的胺并且以其最广泛的意义在本文 中使用,包括多种不同和混合的官能类型的脂族和脂环族化合物,特征在 于与仲碳原子结合的伯氨基的存在,该仲碳原子除了氢原子之外还携带(i) 形成手性环状结构的二价基团,或(ii)在结构或手性上彼此不同的两个取代 基(除了氢)。形成手性环状结构的二价基团包括,例如,2-甲基丁烷-1,4- 二基、戊烷-1,4-二基、己烷-1,4-二基、己烷-1,5-二基、2-甲基戊烷-1,5-二 基。在仲碳原子上的两种不同的取代基(上述Rα和Rβ)还可广泛地变化,且 包括烷基、芳烷基、芳基、卤代、羟基、低级烷基、低级烷氧基、低级烷 基硫、环烷基、羧基、烷氧羰基(carbalkoxy)、氨基甲酰基、单(低级烷 基)取代的氨基甲酰基和二(低级烷基)取代的氨基甲酰基、三氟甲基、 苯基、硝基、氨基、单(低级烷基)取代的氨基和二(低级烷基)取代的 氨基、烷基磺酰基、芳基磺酰基、烷基甲酰胺基、芳基甲酰胺基等,以及 由前述基团取代的烷基、芳烷基或芳基。

“吡哆醛磷酸”、“PLP”、“吡哆醛-5’-磷酸”、“PYP”和“P5P”在本文中可 互换使用以指在转氨酶反应中充当辅酶的化合物。在一些实施方案中,吡 哆醛磷酸由结构1-(4’-甲酰基-3’-羟基-2’-甲基-5’-吡啶基)甲氧基膦酸定 义,CAS号[54-47-7]。吡哆醛-5’-磷酸可通过吡哆醇(也被称为维生素B6) 的磷酸化和氧化在体内产生。在使用转氨酶类的氨基转移反应中,氨基供 体的胺基被转移到辅酶以产生酮基副产物,同时吡哆醛-5’-磷酸被转化成 磷酸吡哆胺。吡哆醛-5’-磷酸通过与不同的酮基化合物(氨基受体)反应而被 再生。胺基从磷酸吡哆胺向氨基受体的转移产生胺并再生辅酶。在一些实 施方案中,吡哆醛-5’-磷酸可以被维生素B6家族的其它成员代替,包括吡 哆醇(PN)、吡哆醛(PL)、吡哆胺(PM),和它们的磷酸化的对应物;磷酸吡 哆醇(PNP)和磷酸吡哆胺(PMP)。

“编码序列”是指编码蛋白的氨基酸序列的核酸部分(例如,基因)。

“天然存在的”或“野生型”是指在自然界发现的形式。例如,天然存在 的或野生型多肽或多核苷酸序列是生物体中存在的序列,其可从天然来源 分离且未通过人为操纵而被有意识地修改。

当关于例如细胞、核酸或多肽使用时,“重组的”或“工程化的”或“非天 然存在的”指如下材料或与该材料的自然或天然形式相应的材料:已经以天 然本来不存在的方式被修饰或与其相同但由合成的材料产生或衍生和/或 通过使用重组技术操作产生。非限制性实例包括,表达在细胞的天然(非 重组的)形式中未发现的基因或表达另外以不同的水平被表达的天然基因 的重组细胞以及其他。

“序列同一性的百分比”和“同源性百分比”在本文可互换使用以指多核 苷酸和多肽之间的对比,并通过跨比较窗比较两条最佳比对的序列来确 定,其中多核苷酸或多肽序列在比较窗中的部分参考序列相比可以包括添 加或缺失(即,缺口),以用于两条序列的最佳比对。百分比可以如下计 算:通过确定两个序列中出现相同的核酸碱基或氨基酸残基的位置的数 目,以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数 目,并将结果乘以100以得到序列同一性的百分比。可选地,百分比可以 如下计算:通过确定两个序列中出现相同的核酸碱基或氨基酸残基或者核 酸碱基或氨基酸残基与缺口对齐的位置的数目,以产生匹配位置的数目, 将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到 序列同一性的百分比。本领域的技术人员理解,存在许多可用于比对两个 序列的已建立的算法。用于比较的最佳序列比对可如下进行,例如,通过 Smith和Waterman,1981,Adv.Appl.Math.2:482的局部同源性算法,通 过Needleman和Wunsch,1970,J.Mol.Biol.48:443的同源性比对算法, 通过Pearson和Lipman,1988,Proc.Natl.Acad.Sci.USA 85:2444的相似 度检索方法,通过这些算法的计算机实现(在GCG Wisconsin软件包中的 GAP、BESTFIT、FASTA和TFASTA),或通过目测(通常参见,Current  Protocols in Molecular Biology,F.M.Ausubel等人编著,Current Protocols,a  joint venture between Greene Publishing Associates,Inc.and John Wiley &  Sons,Inc.,(1995增刊)(Ausubel))。适合用于确定序列同一性百分比和序列 相似性的算法的实例是BLAST和BLAST 2.0算法,其被分别描述于 Altschul等人,1990,J.Mol.Biol.215:403-410以及Altschul等人,1977, Nucleic Acids Res.3389-3402中。用于进行BLAST分析的软件为通过美国 国家生物技术信息中心网站公共可获得的。这一算法包括首先通过识别查 询序列(query sequence)中具有长度W的短字来确定高评分序列对(HSP), 当其与数据库序列中相同长度的字比对时,所述短字匹配或满足某个正值 阈值评分T。T被称为邻近字评分阈值(Altschul等人,如上述)。这些最初 的邻近字匹配(word hit)用作启动检索的种子以找到更长的包括它们的 HSP。然后字匹配沿着每个序列的两个方向延伸到累积比对评分不能增加 的程度。对于核苷酸序列,累积评分使用参数M(用于一对匹配残基的奖 励评分;总是>0)和N(用于错配残基的惩罚评分;总是<0)来计算。对 于氨基酸序列,使用评分矩阵以计算累积评分。当发生以下情况时字匹配 在每个方向的延伸停止:累积比对评分从其最大获得的值下降了量X时; 由于一个或多个负评分残基比对的累积,累积评分变成零或以下时;或达 到任一序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速 度。BLASTN程序(对于核苷酸序列)使用11的字长(W)、10的期望值(E)、 M=5、N=-4、以及两个链的比较作为缺省参数。对于氨基酸序列,BLASTP 程序使用3的字长(W)、10的期望值(E),和BLOSUM62评分矩阵作为缺 省(参见Henikoff和Henikoff,1989,Proc Natl Acad Sci USA 89:10915)。序 列比对与%序列同一性的示例性确定可使用GCG Wisconsin软件包 (Accelrys、Madison WI)中的BESTFIT或GAP程序,使用提供的缺省参数。

“参考序列”是指用作序列比较的基础的确定序列。参考序列可以是更 大序列的子集,例如,全长基因或多肽序列的区段。通常,参考序列为至 少20个核苷酸或氨基酸残基的长度,至少25个残基的长度,至少50个 残基的长度,或核酸或多肽的全长。因为两种多核苷酸或多肽可以各自(1) 包括两个序列之间相似的序列(即,完整序列的一部分),且(2)还可包括 在两种序列之间不同的序列,所以两种(或更多种)多核苷酸或多肽之间的 序列比较通常通过在“比较窗”内比较两种多核苷酸或多肽的序列来进行, 以确定和比较具有序列相似性的局部区域。在一些实施方案中,“参考序列” 可基于基本氨基酸序列,其中参考序列为可在基本序列中具有一个或更多 个变化的序列。例如,“基于SEQ ID NO:4、在相应于X14的残基处具有 缬氨酸的参考序列”或X14V是指在SEQ ID NO:4中X14处相应的残基(是 酪氨酸)已经改变成缬氨酸的参考序列。

“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性片 段,其中序列可与至少20个连续的核苷酸或氨基酸的参考序列进行比较, 并且其中在比较窗中序列的一部分与用于两个序列的最佳比对的参考序 列相比,可以包括20%或更少的添加或缺失(即,空位)。比较窗可以比 20个连续的残基更长,并任选地包括30、40、50、100或更长的窗。

“基本同一性”指以下的多核苷酸或多肽序列,其与参考序列相比,在 至少20个残基位置的比较窗内,经常在至少30-50个残基的比较窗内,具 有至少80%序列同一性、至少85%同一性和89%至95%序列同一性、更通 常至少99%序列同一性,其中序列同一性百分比通过在比较窗内比较参考 序列与包括总计参考序列的20%或更少的缺失或添加的序列来计算。在应 用于多肽的特定的实施方式中,术语“基本同一性”指当最佳比对时,如通 过程序GAP或BESTFIT使用缺省空位权重,两种多肽序列共有至少80% 的序列同一性,优选地至少89%的序列同一性,至少95%的序列同一性或 更多(例如99%的序列同一性)。优选地,不相同的残基位置通过保守的 氨基酸取代而不同。

当在给定的氨基酸或多核苷酸序列编号的上下文中使用时,“对应于”、 “关于”或“相对于”指当给定的氨基酸或多核苷酸序列与指定的参考序列相 比时,参考序列的残基编号。换言之,给定的聚合物的残基数目或残基位 置关于参考序列被指定,而不是通过给定的氨基酸或多核苷酸序列内的残 基的实际的数字位置被指定。例如,给定的氨基酸序列,如工程化转氨酶 的氨基酸序列,可以通过引入空位以优化两个序列之间的残基匹配,与参 考序列比对。在这些情况中,虽然存在空位,给定的氨基酸或多核苷酸序 列中残基的编号是关于与其比对的参考序列作出。

“氨基酸差异”或“残基差异”是指相对于参考序列中在相应位置上的氨 基酸残基,在多肽序列的位置上的氨基酸残基中的变化。氨基酸差异的位 置通常在本文中称为“Xn”,其中n是指残基差异基于其的参考序列中的相 应位置。例如,“与SEQ ID NO:4相比在位置X14上的残基差异”是指相 应于SEQ ID NO:4的位置14的多肽位置上的氨基酸残基的变化。因此, 如果SEQ ID NO:4的参考多肽在位置14上具有酪氨酸,那么“与SEQ ID  NO:4相比在位置X14上的残基差异”,在相应于SEQ ID NO:4的位置14 的多肽位置上的酪氨酸以外的任何残基的氨基酸置换。在本文大多数情况 下,位置上的特定氨基酸残基差异表示为“XnY”,其中“Xn”指定如上所述 的相应位置,且“Y”是工程化多肽中发现的氨基酸的单字母标识符(即, 与参考多肽相比的不同残基)。在一些实施方案中,当多于一个氨基酸可 出现在特定残基位置中时,备选的氨基酸可以形式XnY/Z列出,其中Y 和Z表示替代的氨基酸残基。在一些情况下(例如,在表2A和2B中), 本公开内容还提供了由常规表示法“AnB”表示的特定氨基酸差异,其中A 是参考序列中残基的单字母标识符,“n”是参考序列中的残基位置的数目, 且B是工程化多肽的序列中的残基置换的单字母标识符。此外,在一些情 况下,本公开内容的多肽相对于参考序列可包括一个或更多个氨基酸残基 差异,这由相对于参考序列做出变化的一列特定位置指示。

“保守氨基酸置换”指用具有相似侧链的不同残基置换残基,并且因此, 通常涉及用在相同或相似定义类别的氨基酸内的氨基酸置换多肽中的氨 基酸。通过示例的方式而非限制,具有脂族侧链的氨基酸可被另一个脂族 氨基酸置换,例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有羟基侧链 的氨基酸被具有羟基侧链的另一个氨基酸置换,例如,丝氨酸和苏氨酸; 具有芳香族侧链的氨基酸被具有芳香族侧链的另一个氨基酸置换,例如, 苯丙氨酸、酪氨酸、色氨酸和组氨酸;具有碱性侧链的氨基酸被具有碱性 侧链的另一个氨基酸置换,例如,赖氨酸和精氨酸;具有酸性侧链的氨基 酸被具有酸性侧链的另一个氨基酸置换,例如,天冬氨酸或谷氨酸;且疏 水性氨基酸或亲水性氨基酸分别被另一个疏水性氨基酸或亲水性氨基酸 置换。示例性保守置换被提供在下面的表1中。

表1

“非保守置换”是指用具有显著差异侧链性质的氨基酸置换多肽中的氨 基酸。非保守置换可以利用限定组之间,而不是它们之内的氨基酸,并影 响(a)置换的区域中肽骨架的结构(例如,脯氨酸置换甘氨酸)(b)电荷或疏 水性,或(c)侧链的体积。通过示例的方式而非限制,示例性的非保守置换 可以是酸性氨基酸被碱性或脂族氨基酸置换;芳香族氨基酸被小氨基酸置 换;以及亲水性氨基酸被疏水性氨基酸置换。

“缺失”是指通过从参考多肽去除一个或多个氨基酸而对多肽进行的修 饰。缺失可以包括除去1个或多个氨基酸、2个或更多个氨基酸、5个或 更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或 更多个氨基酸、多至组成参考酶的氨基酸总数的10%、或多至氨基酸总数 的20%,同时保留酶活性和/或保留工程化转氨酶的改进特性。缺失可以涉 及多肽的内部和/或端部。在各个实施方案中,缺失可以包括连续的区段或 可以是不连续的。

“插入”是指通过向参考多肽添加一个或多个氨基酸而对多肽进行的修 饰。在一些实施方案中,改进的工程化转氨酶类包括一个或多个氨基酸插 入天然存在的转氨酶多肽,以及一个或多个氨基酸插入其它改进的转氨酶 多肽。插入可以是在多肽的内部或到羧基或氨基末端。如本文所用的插入 包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段或由参考多 肽中的一个或更多个氨基酸分隔。

如本文所用的“片段”是指如下多肽:所述多肽具有氨基端和/或羧基端 缺失,但剩余的氨基酸序列与该序列中相应位置相同。片段可以是至少14 个氨基酸长、至少20个氨基酸长、至少50个氨基酸长或更长,以及多至 全长转氨酶多肽,例如SEQ ID NO:2的多肽或SEQ ID NO:34的工程化转 氨酶的70%、80%、90%、95%、98%和99%。

“分离的多肽”是指如下多肽:所述多肽与其天然伴随的其它污染物, 例如,蛋白、脂质和多核苷酸基本上分离。术语包括已从它们天然存在环 境或表达系统(例如,宿主细胞或体外合成)中除去或纯化的多肽。改进 的转氨酶类可以存在于细胞内,存在于细胞培养基中,或以各种形式制备, 诸如溶解产物或分离的制剂。因此,在一些实施方案中,改进的转氨酶类 可以是分离的多肽。

“基本上纯的多肽”是指如下组合物,在所述组合物中多肽物质是存在 的优势物质(即,在摩尔基础或重量基础上,它比在该组合物中的任何其 它个体大分子物质更丰富),并且当目标物质构成存在的大分子物质的按 摩尔或%重量计至少约50%时,一般是基本上纯化的组合物。一般而言, 基本上纯的转氨酶组合物将构成该组合物中存在的所有大分子物质的按 摩尔或%重量计约60%或更多、约70%或更多、约80%或更多、约90%或 更多、约95%或更多以及约98%或更多。在一些实施方案中,将目标物质 纯化至基本的均一性(即,通过常规检测方法不能在组合物中检测出污染 物质),其中组合物基本上由单一大分子物质组成。溶剂物质、小分子(<500 道尔顿)、以及元素离子物质不被认为是大分子物质。在一些实施方案中, 分离的改进的转氨酶多肽是基本上纯的多肽组合物。

“立体选择性”是指在化学反应或酶促反应中一种立体异构体比另一种 立体异构体优先形成。立体选择性可以是部分的,其中一种立体异构体的 形成优于另一种立体异构体的形成,或立体选择性可以是完全的,其中只 形成一种立体异构体。当立体异构体是对映体时,立体选择性被称为对映 体选择性,即一种对映体在两种对映体的总和中的分数(通常被报告为百 分比)。它在本领域通常可选择地被报告为(通常为百分比)对映体过量 (e.e.),其根据以下式计算[主要对映体-次要对映体]/[主要对映体+次要对 映体]。当立体异构体是非对映异构体时,立体选择性被称为非对映选择性, 即一种非对映体在两种非对映体的混合物中的分数(通常被报告为百分 比),通常可选择地报告为非对映体过量(d.e.)。对映体过量和非对映体过 量是立体异构体过量的类型。

“高立体选择性”是指能够将底物例如化合物(2)转化为其对应的具有 至少约85%立体异构体过量的手性胺产物例如化合物(1)的化学或酶促反 应。

“改进的酶特性”是指相比于参考转氨酶表现出任何酶特性的改进的转 氨酶多肽。对于本文描述的工程转化氨酶多肽,通常对野生型转氨酶进行 比较,虽然在一些实施方案中,参考转氨酶可以是另一工程化转氨酶。期 望改进的酶特性包括,但不限于,酶活性(其可以底物的转化百分比的方 式被表示)、热稳定性、溶剂稳定性、pH活性特征、辅因子需求、对抑制 剂的耐受性(例如,底物或产物抑制)、和立体选择性(包括对映体选择 性)。

“增加的酶活性”是指工程化转氨酶多肽的改进特性,其可被表示为与 参考转氨酶相比,增加的比活性(例如,产生的产物/时间/重量蛋白),或 底物至产物的增加的转化率百分比(例如,在指定的时间段使用指定量的 转氨酶,起始量的底物至产物的转化率百分比)。确定酶活性的示例性方 法被提供于实施例中。可影响与酶活性相关的任何特性,包括经典的酶特 性Km、Vmax或kcat,它们的改变能够导致增加的酶活性。酶活性的改进可 以是从相应的野生型转氨酶的酶活性的约1.2倍,到相比于天然存在的转 氨酶或从其衍生转氨酶多肽的另一种工程化转氨酶的多达2倍、5倍、10 倍、20倍、25倍、50倍、75倍、100倍或更大的酶活性。转氨酶活性可 通过标准测定中的任何一个来测量,诸如通过监测反应物或产物的分光光 度法性质中的变化。在一些实施方案中,产生的产物的量可以通过高效液 相色谱法(HPLC)分离结合诸如o-酞二醛(OPA)衍生化后的UV吸光度或荧 光检测来测量。使用确定的酶制剂、在设定条件下的确定的测定(defined  assay)、和一种或更多种确定的底物进行酶活性的比较,如本文进一步详 细地描述的。通常,当比较溶解产物时,细胞的数目和测定的蛋白的量被 确定,并使用相同的表达系统和相同的宿主细胞以将由宿主细胞产生的和 溶解产物中存在的酶的量的变化最小化。

“转化率”是指底物至相应的产物的酶促转化率。“转化率百分比”是指 在指定条件下一段时间内被转化为产物的底物的百分比。因此,转氨酶多 肽的“酶活性”或“活性”可表示为底物至产物的“转化率百分比”。

“热稳定的”是指与野生型酶相比,转氨酶多肽在暴露于高温(例如, 40℃-80℃)持续一段时间(例如,0.5-24小时)之后维持相似活性(例如, 大于60%至80%)。

“溶剂稳定的”指与野生型酶相比,转氨酶多肽在暴露于不同浓度(例如 5-99%)的溶剂(乙醇、异丙醇、二甲基亚砜(DMSO)、四氢呋喃、2-甲基四 氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)持续一段时间(例如0.5-24 小时)之后维持相似的活性(多于例如60%至80%)。

“热且溶剂稳定的”指热稳定的且溶剂稳定的转氨酶多肽。

本文使用的“严格杂交”指核酸杂交体在其下稳定的条件。如本领域技 术人员已知,杂交体的稳定性通过杂交体的熔化温度(Tm)反映。大体上, 杂交体的稳定性是离子强度、温度、G/C含量和离液剂存在的函数。使用 预测熔化温度的已知的方法可以计算多核苷酸的Tm值(参见例如Baldino 等人,Methods Enzymology 168:761-777;Bolton等人,1962,Proc.Natl.Acad. Sci.USA 48:1390;Bresslauer等人,1986,Proc.Natl.Acad.Sci USA  83:8893-8897;Freier等人,1986,Proc.Natl.Acad.Sci USA 83:9373-9377; Kierzek等人,Biochemistry 25:7840-7846;Rychlik等人,1990,Nucleic Acids  Res 18:6409-6412(勘误,1991,Nucleic Acids Res 19:698);Sambrook等人, 上文);Suggs等人,1981,于Developmental Biology Using Purified Genes (Brown等人,编),683-693页,Academic Press;和Wetmur,1991,Crit Rev  Biochem Mol Biol 26:227-259.所有出版物通过引用并入本文)。在一些实施 方式中,多核苷酸编码本文公开的多肽并且在定义的条件下,诸如适度地 严格的或高度严格的条件下与编码本公开内容的工程化转氨酶的序列的 互补序列杂交。

“杂交严格性”涉及核酸杂交中的杂交条件,诸如洗涤条件。通常,杂 交反应在较低严格性的条件下进行,随后是不同的但较高严格性的洗涤。 术语“中度地严格杂交”指允许靶-DNA结合以下互补的核酸的条件,所述 互补的核酸具有与靶DNA约60%的同一性、优选地约75%的同一性、约 85%的同一性,与靶-多核苷酸的大于约90%的同一性。示例性中度严格的 条件是等同于以下的条件:在50%甲酰胺、5×Denhart溶液、5×SSPE、0.2% SDS中在42℃杂交,随后在0.2×SSPE、0.2%SDS中在42℃洗涤。“高度 严格的杂交”通常指以下的条件:偏离对于定义的多核苷酸序列在溶液条件 下确定的热熔化温度Tm约10℃或更少。在一些实施方式中,高度严格的 条件指以下的条件,其仅允许在0.018M NaCl在65℃形成稳定的杂交体的 那些核酸序列的杂交(即,如果杂交体在0.018M NaCl在65℃是不稳定的, 其将在高度严格的条件下是不稳定的,如本文所考虑)。可以例如通过以 下提供高度严格条件:在与50%甲酰胺、5×Denhart溶液、5×SSPE、0.2% SDS在42℃等同的条件杂交,随后在0.1×SSPE和0.1%SDS在65℃洗涤。 另一高度严格的条件是在与以下等同的条件中杂交:在包含0.1%(w:v) SDS的5X SSC中在65℃杂交并在包含0.1%SDS的0.1x SSC中在65℃洗 涤。其他高度严格的杂交条件,以及中度地严格的条件是以上引用的文献 中描述的。

“异源的”多核苷酸指通过实验技术被引入宿主细胞的任何多核苷酸, 且包括从宿主细胞取出,接受实验处理并然后再引入宿主细胞的多核苷 酸。

“密码子优化”指编码蛋白的多核苷酸的密码子变化为具体的生物体中 优先使用的那些,以使编码的蛋白在受关注的生物体中被有效地表达。尽 管遗传密码是简并的,即大多数氨基酸由称为“同义的(synonyms)”或“同 义(synonymous)”密码子的几个密码子表示,但熟知的是:具体的生物 体的密码子使用是非随机的并且偏向特定的密码子三联体。对于给定的基 因、共同功能或遗传起源的基因、高度表达的蛋白对低拷贝数(low copy  number)蛋白、和生物体基因组的聚集蛋白编码区、这一密码子使用偏好 可以更高。在一些实施方案中,编码转氨酶的多核苷酸可以为表达选择的 宿主生物体的最佳生产而进行密码子优化。

“优选地、最佳的、高度密码子使用偏好密码子”互换地指以下的密码 子,其以比编码相同的氨基酸的其它密码子更高的频率在蛋白编码区中被 使用。优选的密码子可以根据单个基因、共同功能或起源的一组基因、高 度表达的基因中的密码子使用、整个生物体的聚集蛋白编码区中的密码子 频率、相关的生物体的聚集蛋白编码区中的密码子频率、或其组合确定。 频率随着基因表达水平增加的密码子通常是用于表达的最佳密码子。已知 多种方法用于确定特定的生物体中的密码子频率(例如密码子使用、相对 的同义密码子的使用)和密码子偏好,包括多变量分析,例如,使用聚类 分析或对应分析,和基因中使用的密码子的有效数目(参见GCG  CodonPreference,Genetics Computer Group Wisconsin Package;CodonW, John Peden,University of Nottingham;McInerney,J.O,1998,Bioinformatics  14:372-73;Stenico等人,1994,Nucleic Acids Res.222437-46;Wright,F., 1990,Gene 87:23-29)。对于增长的生物体列表密码子使用表是可获得的(参 见,例如,Wada等人,1992,Nucleic Acids Res.20:2111-2118;Nakamura 等人,2000,Nucl.Acids Res.28:292;Duret,等人,如上述;Henaut和Danchin, “Escherichia coli and Salmonella,”1996,Neidhardt,等人编,ASM Press, Washington D.C.,2047-2066页。用于获得密码子使用的数据来源可以依赖 于能够编码蛋白的任何可获得的核苷酸序列。这些数据集合包括实际上已 知编码表达的蛋白(例如完整的蛋白编码序列-CDS)、表达的序列标签 (ESTS)、或预测的基因组序列的编码区的核酸序列(参见,例如,Mount, D.,Bioinformatics:Sequence and Genome Analysis,第8章,Cold Spring  Harbor Laboratory Press,Cold Spring Harbor,N.Y.,2001;Uberbacher,E. C.,1996,Methods Enzymol.266:259-281;Tiwari等,1997,Comput.Appl. Biosci.13:263-270)。

“控制序列”在本文被定义为包括对于本公开内容的多核苷酸和/或多 肽的表达是必需的或有利的所有组分。对于编码多肽的核酸序列,每个控 制序列可以是天然的或外来的。这些控制序列包括但不限于:前导序列 (leader)、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止 子。控制序列至少包括启动子、和转录和翻译终止信号。控制序列可以与 连接子一起被提供,以用于引入促进控制序列与编码多肽的核酸序列的编 码区域的连接的特定的限制位点。

“可操作地连接”在本文被定义为以下的构型,其中控制序列被适当地 置于(即,处于功能性关系)与受关注的多核苷酸有关的位置以使控制序 列指导或调节受关注的多核苷酸和/或多肽的表达。

“启动子序列”指被宿主细胞识别用于受关注的多核苷酸诸如编码序列 的表达的核酸序列。启动子序列包含转录控制序列,其介导受关注的多核 苷酸的表达。启动子可以是在选择的宿主细胞中显示转录活性的任何核酸 序列,其包括突变体、截短的和杂合启动子,并且可以获自编码对于宿主 细胞同源的或异源的细胞外或细胞内多肽的基因。

“适当的反应条件”是指在生物催化反应溶液中的那些条件(例如,酶 载量、底物载量、辅因子载量、温度、pH、缓冲液、共溶剂等的范围), 在上述条件下本公开内容的转氨酶多肽能够将底物化合物转化为产物化 合物(例如,将化合物(2)转化为化合物(1))。示例性的“适当的反应条件” 被提供在详细说明中,并通过实施例说明。

“载量”,诸如在“化合物载量”或“酶载量”或“辅因子载量”中是指在反 应开始时反应混合物中组分的浓度或量。

在生物催化剂介导的方法的上下文中的“底物”是指由生物催化剂作用 的化合物或分子。例如,在本文中所公开的方法中的转氨酶生物催化剂的 示例性底物是化合物(2)。

在生物催化剂介导的方法的上下文中的“产物”是指由生物催化剂的作 用产生的化合物或分子。例如,在本文中所公开的方法中的转氨酶生物催 化剂的示例性产物是化合物(1)。

“烷基(alkyl)”是指1个至18个(含)碳原子,直链的或支链的,更 优选地1个至8个(含)碳原子,且最优选地1个至6个(含)碳原子的 饱和烃基。具有指定数目的碳原子的烷基被表示在括号中,例如,(C1-C6) 烷基是指1个至6个碳原子的烷基。低级烷基是指(C1-C6)烷基。

“烯基”是指包含至少一个双键,但任选地包含多于一个双键的2个至 12个(含)碳原子的直链或支链的基团。

“炔基”是指含有至少一个三键,但任选地含有多于一个三键,并且另 外任选地含有一个或多个双键部分的2个至12个(含)碳原子的直链或 支链的基团。

“杂烷基”、“杂烯基”和“杂炔基”是指其中一个或更多个碳原子各自独 立地被相同或不同的杂原子或杂原子基团代替的如本文所定义的烷基、烯 基和炔基。可代替碳原子的杂原子和/或杂原子基团包括,但不限于,-O-、 -S-、-S-O-、-NRγ-、-PH-、-S(O)-、-S(O)2-、-S(O)NRγ-、-S(O)2NRγ-以及类 似的,包括其组合,其中每一Rγ独立地选自氢、烷基、杂烷基、环烷基、 杂环基、芳基、杂芳基、以及其他适当的取代基。

“芳基”是指具有单环(例如,苯基)或多个稠环(例如,萘基或蒽基) 的6个至12个(含)碳原子的不饱和芳香族碳环基团。示例性芳基包括 苯基、吡啶基、萘基以及类似的。

“芳基烷基”是指被芳基取代的烷基,即芳基-烷基-基团,优选地具有 在烷基部分的1个至6个(含)碳原子和在芳基部分的6个至12个(含) 碳原子。此类芳基烷基基团由苯甲基、苯乙基以及类似的举例说明。

“芳基烯基”是指被芳基取代的烯基,即,芳基-烯基-基团,优选地具 有在烯基部分的2个至6个(含)碳原子和在芳基部分的6个至12个(含) 碳原子。

“芳基炔基”是指被芳基取代的炔基,即,芳基-炔基-基团,优选具有 在炔基部分的2个至6个碳原子(含)和在芳基部分的6个至12个(含) 碳原子。

“环烷基”是指具有可任选地被1个至3个烷基基团取代的单环或多个 稠环的3个至12个(含)碳原子的环状烷基基团。示例性的环烷基基团 包括,但不限于,单环结构诸如环丙基、环丁基、环戊基、环辛基、1-甲 基环丙基、2-甲基环戊基、2-甲基环辛基以及类似的,或多环结构,包括 桥环系统,诸如金刚烷基以及类似的。

“环烷基烷基”是指被环烷基取代的烷基,即,环烷基-烷基-基团,优 选具有在烷基部分中的1个至6个(含)碳原子和在环烷基部分中的3个 至12个(含)碳原子。此类环烷基烷基基团由环丙基甲基、环己基乙基 以及类似的举例说明。

“环烷基烯基”是指被环烷基取代的烯基,即,环烷基-烯基-基团,优 选具有在烯基部分中的2个至6个(含)碳原子和在环烷基部分中的3个 至12个(含)碳原子。

“环烷基炔基”是指被环烷基取代的炔基,即,环烷基-炔基-基团,优 选具有在炔基部分中的2个至6个(含)碳原子和在环烷基部分中的3个 至12个(含)碳原子。

“氨基”是指基团-NH2。取代的氨基是指基团-NHRη、NRηRη和NRηRηRη, 其中各Rη独立地选自取代的或未被取代的烷基、环烷基、环杂烷基、烷氧 基、芳基、杂芳基、杂芳基烷基、酰基、烷氧基羰基、硫烷基、亚磺酰基、 磺酰基,以及类似的。典型的氨基基团包括但不限于二甲基氨基、二乙基 氨基、三甲基铵、三乙基铵、甲基磺酰基氨基(methylysulfonylamino)、呋 喃基-氧基-磺氨基以及类似的。

“烷基氨基”是指-NHRζ基团,其中Rζ是烷基、N-氧化物衍生物、或其 保护的衍生物,例如,甲氨基、乙氨基、正丙氨基、异丙基氨基、正丁基 氨基、异丁基氨基、叔丁基氨基、或甲氨基-N-氧化物以及类似的。

“芳基氨基”是指NHRλ,其中Rλ是芳基基团,其可任选地被取代。

“杂芳基氨基”是指NHRσ,其中Rσ是杂芳基基团,其可任选地被取代。

“氨基烷基”是指其中氢原子中的一个或更多个被氨基,包括取代的氨 基,取代的烷基基团。

“氧代”是指=O。

“氧基”是指二价基团-O-,其可具有各种取代基以形成不同的氧基基 团,包括醚和酯。

“烷氧基(alkoxy)”或“烷氧基(alkyloxy)”在本文可互换使用以指基 团–ORζ,其中Rζ是烷基基团,包括任选取代的烷基基团,如本文还所定 义的。

“芳氧基”是指–ORλ,其中Rλ是芳基基团,其可任选地被取代。

“杂芳基氧基”是指-ORσ,其中Rσ是杂芳基基团,其可任选地被取代。

“羧基”是指-COOH。

“羧基烷基”是指被羧基基团取代的烷基。

“羰基”是指-C(O)-,其可具有多种取代基以形成不同的羰基基团,包 括酸、酰基卤、醛、酰胺、酯和酮。

“烷基羰基”是指-C(O)Rζ,其中Rζ是烷基基团,其可任选地被取代。

“芳基羰基”是指-C(O)Rλ,其中Rλ是芳基基团,其可任选地被取代。

“杂芳基羰基”是指-C(O)Rσ,其中Rσ是杂芳基基团,其可任选地被取 代。

“烷氧基羰基”是指-C(O)ORζ,其中Rζ是烷基基团,其可任选地被取代。

“芳基氧基羰基”是指-C(O)ORλ,其中Rλ是芳基基团,其可任选地被取 代。

“杂芳基氧基羰基”是指-C(O)ORσ,其中Rσ是杂芳基基团,其可任选地 被取代。

“芳基烷氧基羰基”是指-C(O)ORρ,其中Rρ为芳基-烷基-基团,其可任 选地被取代。

“烷基羰基氧基”是指–OC(O)-Rζ,其中R是烷基基团,其可任选地被 取代。

“芳基羰基氧基”是指-OC(O)Rλ,其中R是芳基基团,其可任选地被取 代。

“杂芳基烷氧基羰基”是指-C(O)ORω,其中Rω是杂芳基烷基基团,其 可任选地被取代。

“杂芳基羰基氧基”是指-OC(O)Rσ,其中Rσ是杂芳基基团,其可任选地 被取代。

“氨基羰基”是指-C(O)NH2。取代的氨基羰基是指-C(O)NRηRη,其中氨 基NRηRη如本文所定义。

“氨基羰基烷基”是指被氨基羰基基团取代的烷基。

“卤素”或“卤代”是指氟、氯、溴和碘。

“卤代烷基”是指被一个或更多个卤素取代的烷基基团。如此,术语“卤 代烷基”意指包括单卤代烷基、二卤代烷基、三卤代烷基等,直至全卤代烷 基。例如,表述“(C1C2)卤代烷基”包括1-氟甲基、二氟甲基、三氟甲基、 1-氟乙基、1,1-二氟乙基、1,2-二氟乙基、1,1,1三氟乙基、全氟乙基等。

“羟基”是指-OH。

“羟基烷基”是指被一个或更多个羟基基团取代的烷基。

“氰基”是指-CN。

“硝基”是指-NO2

“硫代”或“硫烷基”是指-SH。取代的硫代或硫烷基是指-S-Rη,其中Rη是烷基、芳基或其他适当的取代基。

“烷基硫代”是指-SRζ,其中Rζ是烷基,其可任选地被取代。典型的烷 基硫代基团包括,但不限于,甲基硫代、乙基硫代、正丙基硫代,以及类 似的。

“芳基硫代”是指-SRλ,其中Rλ是芳基,其可任选地被取代。典型的芳 基硫代基团包括,但不限于,苯基硫代、(4-甲基苯基)硫代、吡啶基硫代, 以及类似的。

“杂芳基硫代”是指-SRσ,其中Rσ是杂芳基,其可任选地被取代。.

“磺酰基”是指-SO2-。取代的磺酰基是指-SO2-Rη,其中Rη是烷基、芳 基或其他适合的取代基。

“烷基磺酰基”是指-SO2-Rζ,其中Rζ是烷基,其可任选地被取代。典型 的烷基磺酰基基团包括,但不限于,甲基磺酰基、乙基磺酰基、正丙基磺 酰基,以及类似的。

“芳基磺酰基”是指-SO2-Rλ,其中Rλ是芳基,其可任选地被取代。典 型的芳基磺酰基基团包括,但不限于,苯基磺酰基、(4-甲基苯基)磺酰基、 吡啶基磺酰基,以及类似的。

“杂芳基磺酰基”是指-SO2-Rσ,其中Rσ是杂芳基基团,其可任选地被 取代。

“亚磺酰基”是指-SO-。.取代的亚磺酰基是指-SO-Rη,其中Rη是烷基、 芳基或其他适合的取代基。

“烷基亚磺酰基”是指-SO-Rζ,其中Rζ是烷基,其可任选地被取代。典 型的烷基亚磺酰基基团包括,但不限于,甲基亚磺酰基、乙基亚磺酰基、 正丙基亚磺酰基,以及类似的。

“芳基亚磺酰基”是指-SO-Rλ,其中Rλ是芳基,其可任选地被取代。典 型的芳基亚磺酰基基团包括,但不限于,苯基亚磺酰基、(4-甲基苯基)亚 磺酰基、吡啶基亚磺酰基,以及类似的。

“杂芳基亚磺酰基”是指-SO-Rσ,其中Rσ是杂芳基基团,其可任选地被 取代。

“烷基氨基磺酰基烷基”是指被烷基-NH-SO2-基团取代的烷基。

“芳基磺酰基烷基”是指被芳基-SO2-基团取代的烷基。

“杂芳基磺酰基烷基”是指被杂芳基-SO2-基团取代的烷基。

“氨基磺酰基”是指-SO2NH2。取代的氨基磺酰基是指-SO2NRδRδ,其中 氨基基团-NRηRη如本文所定义。

“杂芳基”是指1个至10个(含)碳原子和在环内的选自氧、氮和硫的 1个至4个(含)杂原子的芳族杂环基团。此类杂芳基基团可具有单个环 (例如,吡啶基或呋喃基)或多个稠环(例如,吲哚嗪基或苯并噻吩基)。

“杂芳基烷基”是指被杂芳基取代的烷基,即,杂芳基-烷基-基团,优 选具有在烷基部分中的1个至6个(含)碳原子和在杂芳基部分中的5个 至12个(含)环原子。此类杂芳基烷基基团由吡啶基甲基以及类似的举 例说明。

“杂芳基烯基”是指被杂芳基取代的烯基,即,杂芳基-烯基-基团,优 选具有在烯基部分中的2个至6个(含)碳原子和在杂芳基部分中的5个 至12个(含)环原子。

“杂芳基炔基”是指被杂芳基取代的炔基,即,杂芳基-炔基-基团,优 选具有在炔基部分中的2个至6个(含)碳原子和在杂芳基部分中的5个 至12个(含)环原子。

“杂环”、“杂环的”和可互换的“杂环烃基”是指具有单环或多个稠环,2 个至10个(含)碳环原子和在环内的选自氮、硫或氧的1个至4个(含) 杂环原子的饱和或不饱和的基团。此类杂环基团可具有单环(例如,哌啶 基或四氢呋喃基)或多个稠环(例如,吲哚啉基、二氢苯并呋喃或奎宁环 基)。杂环的实例包括,但不限于,呋喃、噻吩、噻唑、噁唑、吡咯、咪 唑、吡唑、吡啶、吡嗪、嘧啶、哒嗪、吲嗪、异吲哚、吲哚、吲唑、嘌呤、 喹嗪、异喹啉、喹啉、酞嗪、萘基吡啶、喹噁啉、喹唑啉、噌啉、蝶啶、 咔唑、咔啉、菲啶、吖啶、菲咯啉、异噻唑、吩嗪、异噁唑、吩噁嗪、吩 噻嗪、咪唑烷、咪唑啉、哌啶、哌嗪、吡咯烷、二氢吲哚以及类似的。

“杂环烷基烷基”是指被杂环烷基取代的烷基,即,杂环烷基-烷基-基 团,优选具有在烷基部分中的1个至6个(含)碳原子和在杂环烷基部分 中的3个至12个(含)环原子。

“杂环烷基烯基”是指被杂环烷基取代的烯基,即,杂环烷基-烯基-基 团,优选具有在烯基部分中的2个至6个(含)碳原子和在杂环烷基部分 中的3个至12个(含)环原子。

“杂环烷基炔基”是指被杂环烷基取代的炔基,即,杂环烷基-炔基-基 团,优选具有在炔基部分中的2个至6个(含)碳原子和在杂环烷基部分 中的3个至12个(含)环原子。

“元环”意指包括任何环状结构。术语“元”之前的数字表示构成该环的 骨架原子的数目。因此,例如,环己基、吡啶、吡喃和噻喃是6元环而环 戊基、吡咯、呋喃和噻吩是5元环。

“离去基团”通常是指在化学反应中能够被另一个原子或部分替换的任 何原子或部分。更具体地,离去基团是指容易被亲核体(例如,胺、硫醇、 醇或氰化物)替换和取代的原子或部分。此类离去基团是众所周知的,且 包括羧酸盐、N-羟基琥珀酰亚胺(“NHS”)、N-羟基苯并三唑、卤素(氟、 氯、溴或碘)和烷氧基基团。离去基团的非限制性特征和实例可见于例如 Organic Chemistry,第2版,Francis Carey(1992),328-331页;Introduction to  Organic Chemistry,第2版,Andrew Streitwieser and Clayton Heathcock (1981),169-171页;以及Organic Chemistry,第5版,John McMurry, Brooks/Cole Publishing(2000),398和408页;所有这些都通过引用并入本 文。

除非另有说明,否则在上述基团中由氢占据的位置可被取代基进一步 取代,所述取代基的示例为,但不限于,羟基、氧代、硝基、甲氧基、乙 氧基、烷氧基、取代的烷氧基、三氟甲氧基、卤代烷氧基、氟、氯、溴、 碘、卤代、甲基、乙基、丙基、丁基、烷基、烯基、炔基、取代的烷基、 三氟甲基、卤代烷基、羟烷基、烷氧基烷基、硫代、烷基硫代、酰基、羧 基、烷氧基羰基、甲酰氨基、取代的甲酰氨基、烷基磺酰基、烷基亚磺酰 基、烷基磺酰基氨基、磺酰氨基、取代的磺酰氨基、氰基、氨基、取代的 氨基、烷基氨基、二烷基氨基、氨基烷基、酰氨基、脒基、氨基肟基 (amidoximo)、羟基草氨酰基(hydroxamoyl)、苯基、芳基、取代的芳基、 芳氧基、芳基烷基、芳基烯基、芳基炔基、吡啶基、咪唑基、杂芳基、取 代的杂芳基、杂芳基氧基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环丙 基、环丁基、环戊基、环己基、环烷基、环烯基、环烷基烷基、取代的环 烷基、环烷氧基、吡咯烷基、哌啶基、吗啉代、杂环、(杂环)氧基和(杂 环)烷基;且优选的杂原子是氧、氮和硫。应理解,当这些取代基上存在 开放化合价时,它们可被烷基、环烷基、芳基、杂芳基和/或杂环基团进一 步取代,当碳上存在这些开放化合价时,它们可被卤素和被氧键合取代基、 氮键合取代基或硫键合取代基进一步取代,并且当多个这样的开放化合价 存在时,这些基团可通过直接形成键或通过与新的杂原子,优选氧、氮或 硫,形成键而被结合以形成环。还应理解,可以进行上述取代,只要用取 代基取代氢不向本公开内容的分子引入不可接受的不稳定性,并且在其他 方面是化学上合理的。

“任选的”或“任选地”是指随后描述的事件或情况可以发生或可以不发 生,并且该描述包括其中所述事件或情况发生的情形和其中所述事件或情 况不发生的情形。本领域普通技术人员将理解,对于描述为含有一个或更 多个任选的取代基的任何分子,仅意在包括立体上实际的和/或合成上可行 的化合物。“任选地取代的”是指在化学基团的术语或系列中的所有其后的 修饰词。例如,在术语“任选地取代的芳基烷基”中,分子的“烷基”部分和“芳 基”部分可以被取代或可以不被取代,并且对于系列“任选地取代的烷基、 环烷基、芳基和杂芳基”,该烷基、环烷基、芳基和杂芳基基团,独立于其 他,可以被取代或可以不被取代。

“保护基团”是指当连接到分子中的反应性官能团时掩蔽、减少或阻止 该官能团的反应性的原子团。通常,保护基团可在合成过程中根据需要被 选择性地除去。保护基团的实例可见于Wuts和Greene,“Greene’s Protective  Groups in Organic Synthesis,”第4版,Wiley Interscience(2006),以及Harrison 等人,Compendium of Synthetic Organic Methods,第1-8卷,1971-1996,John  Wiley&Sons,NY。可以具有保护基团的官能团包括但不限于,羟基、氨 基和羧基。代表性的氨基保护基团包括但不限于,甲酰基、乙酰基、三氟 乙酰基、苄基、苄氧羰基(“CBZ”)、叔丁氧羰基(“Boc”)、三甲基甲硅烷基 (“TMS”)、2-三甲基甲硅烷基-乙烷磺酰基(“SES”)、三苯甲基和取代的三苯 甲基、烯丙氧基羰基、9-芴基甲基氧基羰基(“FMOC”)、硝基-藜芦氧基羰 基(“NVOC”)以及类似的。

如本文所用的“多元醇”是指包含多个羟基基团的化合物。关于聚合物, 多元醇包括具有羟基官能团的聚合物。示例性聚合多元醇包括,通过举例 的方式并非限制,聚醚和聚酯,例如,聚乙二醇、聚丙二醇、聚(四亚甲 基)二醇和聚四氢呋喃。

5.3工程化转氨酶多肽

本公开内容提供了具有转氨酶活性的工程化多肽、编码多肽的多核苷 酸、以及使用该多肽的方法。当上文描述涉及多肽时,应理解,其还描述 了编码该多肽的多核苷酸。

氨基转移酶,还称为转氨酶,催化氨基从氨基供体底物的伯胺向氨基 受体分子的羰基(例如,酮基或醛基)转移。氨基转移酶已被从各种生物体, 诸如反硝化产碱菌(Alcaligenes denitrificans)、支气管败血性博德特氏菌 (Bordetella bronchiseptica)、副百日咳博德特氏菌(Bordetella parapertussis)、 马耳他布鲁氏菌(Brucella melitensis)、鼻疽伯克霍尔德氏菌(Burkholderia  malle)、类鼻疽伯克霍尔德氏菌(Burkholderia pseudomallei)、青紫色素杆菌 (Chromobacterium violaceum)、Oceanicola granulosus HTCC2516、海洋杆菌 (Oceanobacter sp.)RED65、海洋螺菌(Oceanospirillum sp.)MED92、恶 臭假单胞菌(Pseudomonas putida)、青枯雷尔氏菌(Ralstonia solanacearum)、 苜蓿根瘤菌(Rhizobium meliloti)、根瘤菌(Rhizobium sp.)菌株NGR234、 河流弧菌(Vibrio fluvialis)、苏云金杆菌(Bacillus thuringensis)和肺炎克雷伯 氏菌(Klebsiella pneumoniae)中鉴定(Shin等人,2001,Biosci.Biotechnol. Biochem.65:1782-1788)。

转氨酶通过利用转氨酶以立体特异性方式进行反应的能力而有用于 外消旋胺的手性拆分,即一种对映体优先转化为相应的酮,由此产生富含 另一种对映体的混合物(参见,例如,Koselewski等人,2009,Org.Lett. 11(21):4810-2)。转氨酶在酮向相应的胺转化中的立体选择性,还使这些酶 在由相应的酮化合物不对称合成光学纯的胺中是有用的(参见,例如, 等人,Biocatalytic Routes to Optically Active Amines,”Chem.Cat. Chem.1(1):42-51;Zua和Hua,2009,Biotechnol J.4(10):1420-31)。

来自河流弧菌的ω-转氨酶.(ω-VfT)表现出对于手性胺的(S)-对映体的高 对映选择性并且具有对于手性芳香胺的独特的底物特异性(Shin和Kim, 2001,J.Org.Chem.67:2848-2853)。ω-VfT的高对映选择性已被应用于胺的 手性拆分(H.Yun,等人,2004,Biotechnol.Bioeng.87:772–778;Shin和Kim, 1997,Biotechnol.Bioeng.55:348–358;M.等人,2008,Adv.Synth. Catal.350:802–807)。该酶还已被用于使用前手性酮底物不对称合成光学纯 胺。然而,不对称合成中的限制不利于逆反应的平衡(Shin和Kim,1999, Biotechnol.Bioeng.65,206–211);通过胺产物抑制ω-VfT酶(Shin等人,2001, Biotechnol Bioeng 73:179–187;Yun和Kim,2008,Biosci. Biotechnol.Biochem.72(11):3030-3033);对具有大侧链的氨基受体,诸如芳 族基团的低活性(Shin和Kim,2002,J.Org.Chem.67:2848-2853);以及低的 酶稳定性(上述Yun和Kim)。

具有对脂族酮的增加的抗性的源自河流弧菌的转氨酶的工程化转氨 酶描述于Yun等人,2005,Appl Environ Micriobiol.71(8):4220–4224)中,而 具有变宽的氨基供体底物特异性的ω-VfT描述于Cho等人,2008, Biotechnol Bioeng.99(2):275-84中。通过引用并入本文的专利出版物 WO2010081053和US20100209981描述了具有对温度和/或有机溶剂的增 加的稳定性、并且结构上朝向不同氨基受体分子的酶活性的工程化ω-VfT。 通过引用并入本文的专利出版物WO2011159910描述了对以对映体过量将 底物3’-对羟基苯乙酮转化为产物(S)-3-(1-氨基乙基)-苯酚而优化的工程化 ω-VfT。

本公开内容涉及源自河流弧菌(V.fluvialis)的工程化转氨酶多肽,其有 效地介导吲哚上的烷基羰基烷基或羰基烷基基团转化为相应的胺。显著 地,本公开内容鉴定了转氨酶多肽中增加酶活性、对映体选择性、稳定性 和对产物抑制的耐受性的氨基酸残基位置及相应突变。在一些实施方案 中,工程化转氨酶能够在适当的反应条件下在氨基供体的存在下将底物化 合物(2),1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-酮,有效地转化为产物化合物(1), (S)-1-(1H-5-6-氯-吲哚-3-基)丙-2-胺,其中以化合物(1b),(R)-1-(1H-5-6- 氯-吲哚-3-基)丙-2-胺的对映体过量产生了(S)-1-(1H-5-6-氯-吲哚-3-基)丙 -2-胺(如方案1中所示)。

在一些实施方案中,多肽是与SEQ ID NO:2的野生型河流弧菌多肽、 或另一种工程化多肽,例如SEQ ID NO:4相比的用于改进的特性而工程化 的非天然存在的转氨酶。适于将1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-酮有效 地转化为(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺的这些工程化转氨酶多肽, 具有与SEQ ID NO:2的氨基酸序列或参考工程化转氨酶多肽,诸如SEQ ID  NO:4的参考多肽相比的一个或更多个残基差异。残基差异与包括以下的酶 特性的增强相关:酶活性、酶稳定性、和对产物胺抑制的抗性。

在一些实施方案中,工程化转氨酶多肽显示用与野生型或参考工程化 酶相比的相同量的酶在限定的时间内以对映体过量在将底物1-(1H-5-氟-6- 氯-吲哚-3-基)丙-2-酮转化为产物(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺 产物中的增强的活性。在一些实施方案中,工程化转氨酶多肽在适当的反 应条件下具有与由SEQ ID NO:4呈现的多肽相比的至少约1.2倍、1.5倍、 2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、或50倍或更多倍 的活性。

在一些实施方案中,与野生型或参考工程化酶相比,工程化转氨酶多 肽具有对转化反应中使用的温度和/或溶剂的增加的稳定性。在一些实施方 案中,工程化转氨酶多肽在适当的反应条件下具有与SEQ ID NO:4的多肽 相比的至少约1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更多倍的 稳定性。

在一些实施方案中,与野生型或参考工程化酶相比,工程化转氨酶多 肽具有对产物胺(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺抑制的增强的耐受 性或抗性。在一些实施方案中,与由SEQ ID NO:4呈现的多肽相比,工程 化转氨酶多肽在适当的反应条件下具有对1-(1H-5-氟-6-氯-吲哚-3-基)丙 -2-胺,特别是(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺抑制的至少约1.2倍、 1.5倍、2倍、3倍、4倍、5倍、或更多倍的增强的抗性,如以下进一步 描述的。

在一些实施方案中,工程化转氨酶多肽能够在适当的反应条件下以相 比于(R)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺大于90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99.5或更大的对映体过量将底物1-(1H-5- 氟-6-氯-吲哚-3-基)丙-2-酮转化为(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺。

在一些实施方案中,工程化转氨酶多肽能够在适当的反应条件下以相 对于SEQ ID NO:4的参考多肽对底物存在的增加的耐受性将底物化合物 (2)转化为化合物(1)。因此,在一些实施方案中,工程化转氨酶多肽能够在 适当的反应条件下在约72h或更短、约48h或更短、约36h或更短、或 约24h更短的反应时间内,以至少约至少约50%、至少约60%、至少约 70%、至少约80%、至少约90%、至少约95%、至少约98%、或至少约99% 的转化率百分比在以下的底物载量浓度下将底物化合物(2)转化为产物化 合物(1):至少约1g/L、约5g/L、约10g/L、约20g/L、约30g/L、约40g/L、 约50g/L、约70g/L、约100g/L、约125g/L、约150g/L、约175g/L或 约200g/L或更多。

工程化多肽的以上描述的改进特性在其下进行转化的适当的反应条 件可关于多肽、底物、辅因子、缓冲液、共溶剂的浓度或量、pH和/或包 括温度及反应时间的条件来确定,如在以下和实施例中进一步描述的。

与其改进特性相关的示例性工程化多肽包括与SEQ ID NO:2相比在以 下残基位置上的一个或更多个残基差异:X9;X14;X18;X21;X26;X31; X33;X41;X45;X47;X57;X70;X86;X88;X107;X113;X132; X133;X146;X147;X148;X153;X163;X168;X173;X177;X203; X211;X233T;X235;X244;X250;X284;X294;X314;X315;X318; X323;X324;X324;X346;X383;X391;X395;X398;X400;X417; X419;X420;X423;X424;X427;X448;和X451。与改进特性相关的 这些位置的每一个上的特定氨基酸差异包括:X9T;X14V;X18A;X21H; X26R;X31M;X31S;X33T;X41L;X45H;X47N;X57F;X57Y;X70A; X86D;X86Y;X88A;X88L;X107P;X113L;X113V;X132F;X133R; X146L;X147K;X148Q;X148R;X153S;X163F;X163I;X163L;X163R; X163V;X168K;X168S;X173A;X177L;X203S;X211K;X233T;X235P; X244T;X250A;X284A;X294V;X314N;X315G;X318D;X323T; X324G;X324H;X346L;X383V;X391A;X395P;X398L;X398V;X398W; X400G;X417M;X419S;X420N;X423I;X424V;X424A;X427Y;X448E; 和X451D。

与由SEQ ID NO:4呈现的工程化转氨酶相比,该残基差异包括以下残 基位置上的那些:X14;X26;X31;X33;X41;X47;X57;X70;X86; X88;X107;X113;X132;X148;X163;X168;X173;X203;X250; X284;X314;X315;X324;X346;X395;X398;X400;X417;X419; X420;X423;X424;X448;和X451。在这些位置上的特定氨基酸差异包 括:X14V;X26R;X31S;X33T;X41L;X47N;X57F;X57Y;X70A; X86D;X88A;X88L;X107P;X113L;X113V;X132F;X148Q;X148R; X163I;X163L;X163R;X163V;X168K;X168S;X173A;X203S;X250A; X284A;X314N;X315G;X324H;X346L;X395P;X398L;X398V;X398W; X400G;X417M;X419S;X420N;X423I;X424V;X448E;和X451D。 虽然与SEQ ID NO:4相比,残基差异还发生在残基位置X153和X383上, 但这些差异表现对SEQ ID NO:2的野生型序列上存在的氨基酸残基的回 复,表明在残基位置X153上氨基酸S与V之间和在残基位置X383上氨 基酸A与V之间的互变现象对工程化酶特性没有显著有害效应。

本公开内容的示例性非天然存在(或工程化)转氨酶多肽的结构与功 能信息示于以下表2A和2B中。奇数序列标识符(即,“SEQ ID NO”)是指 编码由偶数的SEQ ID NO提供的氨基酸序列的核苷酸序列,并且该序列被 提供在伴随该公开内容的电子序列表文件中,该序列表文件在此通过引用 并入本文。氨基酸残基差异是基于与SEQ ID NO:4的参考序列比较,SEQ  ID NO:4的参考多肽序列为相对于SEQ ID NO:2具有以下24个氨基酸残 基差异的源自野生型ω-VfT多肽的工程化转氨酶:A9T;G18A;D21H; V31M;N45H;F86Y;A133R;R146L;W147K;V153S;K163F;V177L; R211K;P233T;A235P;P244T;M294V;P318D;A323T;S324G;A383V; T391A;C424A;和F427Y。各工程化多肽相对于SEQ ID NO:4的参考多 肽的活性,在设定的时间段和温度内,在被用作初级筛选的高通量(HTP) 测定中作为将酮底物1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-酮向产物胺化合物 (S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺的转化确定。表2A中的HTP测定 值,使用大肠杆菌(E.coli)澄清细胞溶解产物以~200μL体积/孔的96孔板 格式,根据如表和实施例中标注的测定反应条件来确定。在某些情况下, 使用摇瓶粉(SFP)和/或下游处理(DSP)粉测定作为次级筛选以评估工程化 转氨酶的特性,其的结果提供于表2B中。SFP和DSP形式提供工程化多 肽的更纯的粉制品。例如,SFP制品中的工程化转氨酶是总蛋白的约30%, 而DSP制品可包含总蛋白的约80%的工程化转氨酶。

活性水平(即,“+”“++”,等)被如下定义:“+”指示对于工程化转氨酶 多肽SEQ ID NO:6至14,与SEQ ID NO:4的活性相比的1.2倍或更大的 活性,并且对于工程化转氨酶多肽SEQ ID NO:16至154,与SEQ ID NO: 8的活性相比的1.2倍或更大的活性。“++”的活性水平指示对于工程化转 氨酶多肽SEQ ID NO:6-14,与SEQ ID NO:4的活性相比的5倍或更大的 活性,并且对于工程化转氨酶多肽SEQ ID NO:16至154,与SEQ ID NO:8 的活性相比的5倍或更大的活性。对产物抑制的耐受性数据(即,产物耐 受性)通过以下来获得:在测定中包括产物(S)-1-(1H-5-氟-6-氯-吲哚-3-基) 丙-2-胺的以下量,以及与在相同条件下参考酶的量的活性比较:14g/L用 于分析SEQ ID NO.6至14的工程化转氨酶多肽,且16g/L用于分析SEQ ID  NO.16至154的工程化转氨酶多肽。稳定性的评价通过比较两个不同温度 55℃和50℃下的活性来做出。

表2A:使用HTP制品的工程化多肽和相对酶改进

表2B:使用摇瓶和DSP制品的工程化多肽和相对酶改进

从示例性多肽的检查,酶特性中的改进与相比于SEQ ID NO:4在以下 残基位置上的残基差异相关:X14;X26;X31;X33;X41;X47;X57; X70;X86;X88;X107;X113;X132;X148;X163;X168;X173;X203; X250;X284;X314;X315;X324;X346;X395;X398;X400;X417; X419;X420;X423;X424;X448;和X451。与改进的特性相关的这些 位置的每一个上的具体残基差异包括:X14V;X26R;X31S;X33T;X41L; X47N;X57F;X57Y;X70A;X86D;X88A;X88L;X107P;X113L; X113V;X132F;X148Q;X148R;X163I;X163L;X163R;X163V;X168K; X168S;X173A;X203S;X250A;X284A;X314N;X315G;X324H;X346L; X395P;X398L;X398V;X398W;X400G;X417M;X419S;X420N; X423I;X424V;X448E;和X451D。

与相比于SEQ ID NO:4在以上残基位置上的残基差异相关的特定酶特 性包括,酶活性、稳定性、和产品耐受性,以及其他。酶活性中的改进与 以下残基位置上的残基差异相关:X14;X26;X31;X33;X41;X57; X70;X86;X88;X163;X168;X284;X314;X417;X419;X420;和 X424。酶稳定性中的改进与以下残基位置上的残基差异相关:X14;X26; X31;X33;X41;X57;X70;X86;X88;X163;X168;X284;X314; X324;X417;X419;X420;X423;和X424。对产物抑制的耐受性(即, 产物耐受性)中的改进与以下残基位置上的残基差异相关:X26;X70; X86;X88;X113;X132;X163;X168;X314;X315;X395;X398;X417; 和X419。如本领域技术人员将理解的,在前述残基位置上的残基差异对酶 对映体选择性没有显著有害效应,维持对于化合物(1)大于90%ee,并且通 常导致等于或大于99%ee的对映体选择性。因此,前述残基位置上的残基 残基,可以单独或以各种组合用于产生具有期望的改进的特性的工程化转 氨酶多肽,期望的改进的特性包括酶活性、立体选择性、稳定性、底物耐 受性、和对产物抑制的耐受性,以及其他。

根据本文提供的指导,进一步设想,以下的示例性工程化多肽的任何 一种:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、28、30、 32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、 64、66、68、70、72、74、76、78、80、82、84、86、88、96、98、102、 104、106、108、110、114、116、122、124、126、128、130、132、136、 138、140、142、144、146、148、150、152、和154可用作用于合成其他 工程化转氨酶多肽的起始氨基酸序列,例如,通过添加来自表2A和2B中 的其他多肽以及本文描述的其他残基位置的各种氨基酸差异的新组合通 过随后几轮进化。进一步的改进可通过包括在贯穿前几轮的进化中已被保 持为不变的残基位置上的氨基酸差异而产生。

因此,在一些实施方案中,具有转氨酶活性的工程化多肽能够以与 SEQ ID NO:4相比的改进的特性将底物化合物(2),1-(1H-5-氟-6-氯-吲哚-3- 基)丙-2-酮转化为产物化合物(1),(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2- 胺,包括具有与参考序列SEQ ID NO:2至少80%、85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更 多序列同一性以及与SEQ ID NO:4相比在选自以下的残基位置上的一个或 更多个残基差异的氨基酸序列:X14;X26;X31;X33;X41;X47;X57; X70;X86;X88;X107;X132;X148;X163;X168;X173;X203;X250; X284;X314;X315;X324;X346;X395;X398;X400;X417;X419; X423;X448;和X451,其中在残基位置X31;X57;X86;X163;X168; X314;X324;X398;和X417上的残基差异选自:X31S;X57Y;X86D; X163I;X163L;X163R;X163V;X168S;X314N;X324H;X398L;X398V; X398W;和X417M。

在一些实施方案中,具有与SEQ ID NO:4相比改进的特性的工程化转 氨酶多肽包括具有与参考序列SEQ ID NO:4至少80%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或更多序列同一性以及与SEQ ID NO:4相比在选自以下的残基位置上的一 个或更多个残基差异的氨基酸序列:X14;X26;X31;X33;X41;X47; X57;X70;X86;X88;X107;X132;X148;X163;X168;X173;X203; X250;X284;X314;X315;X324;X346;X395;X398;X400;X417; X419;X423;X448;和X451,其中在残基位置X31;X57;X86;X163; X168;X314;X324;X398;和X417上的残基差异选自:X31S;X57Y; X86D;X163I;X163L;X163R;X163V;X168S;X314N;X324H;X398L; X398V;X398W;和X417M。在一些实施方案中,工程化转氨酶多肽能够 以本文描述的改进的对映体选择性,例如,≥90%ee将底物化合物(2)转化 为产物化合物(1)。

在一些实施方案中,具有与SEQ ID NO:4相比改进的特性的转氨酶活 性的工程化多肽包括具有与选自以下的参考序列至少80%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更多同一性的氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、 18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、 50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、 82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、 112、114、116、118、120、122、124、126、128、130、132、134、136、 138、140、142、144、146、148、150、152、和154,以及与SEQ ID NO:4 相比的选自以下的残基位置上的一个或更多个残基差异:X14;X26;X31; X33;X41;X47;X57;X70;X86;X88;X107;X132;X148;X163; X168;X173;X203;X250;X284;X314;X315;X324;X346;X395; X398;X400;X417;X419;X423;X448;和X451,其中在残基位置X31; X57;X86;X163;X168;X314;X324;X398;和X417上的残基差异选 自:X31S;X57Y;X86D;X163I;X163L;X163R;X163V;X168S;X314N; X324H;X398L;X398V;X398W;和X417M。在一些实施方案中,参考 序列选自SEQ ID NO:4、8、14、16、132、134、和146。在一些实施方案 中,参考序列是SEQ ID NO:4。在一些实施方案中,参考序列是SEQ ID  NO:8。在一些实施方案中,参考序列是SEQ ID NO:134。在一些实施方案 中,参考序列是SEQ ID NO:146。

在一些实施方案中,具有转氨酶活性的工程化多肽具有包括选自以下 的序列的氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、 22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、 54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、 86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、 116、118、120、122、124、126、128、130、132、134、136、138、140、 142、144、146、148、150、152、和154,并且具有与SEQ ID NO:4相比 的选自以下的残基位置上的一个或更多个残基差异:X14;X26;X31;X33; X41;X47;X57;X70;X86;X88;X107;X132;X148;X163;X168; X173;X203;X250;X284;X314;X315;X324;X346;X395;X398; X400;X417;X419;X423;X448;和X451,其中在残基位置X31;X57; X86;X163;X168;X314;X324;X398;和X417上的残基差异选自: X31S;X57Y;X86D;X163I;X163L;X163R;X163V;X168S;X314N; X324H;X398L;X398V;X398W;和X417M。在一些实施方案中,氨基 酸序列选自SEQ ID NO:4、8、14、16、132、134、和146。在一些实施方 案中,氨基酸序列是SEQ ID NO:4。在一些实施方案中,氨基酸序列是SEQ  ID NO:8。在一些实施方案中,氨基酸序列是SEQ ID NO:134。在一些实施 方案中,氨基酸序列是SEQ ID NO:146。

在一些实施方案中,在残基位置X14;X26;X33;X41;X47;X70; X88;X107;X132;X148;X173;X203;X250;X284;X315;X346; X395;X400;X419;X423;X448;和X451上的残基差异选自X14V; X26R;X33T;X41L;X47N;X70A;X88A;X88L;X107P;X132F; X148Q;X148R;X173A;X203S;X250A;X284A;X315G;X346L;X395P; X400G;X419S;X423I;X448E;和X451D。

因此,在一些实施方案中,展示一种或更多种本文描述的改进特性的 工程化转氨酶多肽可包括具有与参考序列的氨基酸序列同一性,如以上描 述的,以及与SEQ ID NO:4相比选自以下的一个或更多个残基差异的氨基 酸序列:X14V;X26R;X31S;X33T;X41L;X47N;X57Y;X70A;X86D; X88A;X88L;X107P;X132F;X148Q;X148R;X163I;X163L;X163R; X163V;X168S;X173A;X203S;X250A;X284A;X314N;X315G;X324H; X346L;X395P;X398L;X398V;X398W;X400G;X417M;X419S; X423I;X448E;和X451D。

在一些实施方案中,以上具有与SEQ ID NO:4相比在残基位置X14; X26;X31;X33;X41;X47;X57;X70;X86;X88;X107;X132;X148; X163;X168;X173;X203;X250;X284;X314;X315;X324;X346; X395;X398;X400;X417;X419;X423;X448;和X451上的一个或更 多个残基差异的工程化转氨酶多肽还可包括与SEQ ID NO:4相比选自以下 的一个或更多个残基差异:X57F;X113L;X113V;X168K;X420N;和 X424V。

在一些实施方案中,工程化转氨酶具有包括与SEQ ID NO:4相比选自 以下的至少一个或更多个残基差异的氨基酸序列:X86D;X284A;和 X400G。在一些实施方案中,残基差异包括至少X86D。在一些实施方案 中,残基差异包括至少X400G。

在一些实施方案中,工程化转氨酶具有包括与SEQ ID NO:4相比选自 以下的至少一个或更多个残基差异的氨基酸序列:X14V;X26R;X31S; X163I/L/R/V;X315G;和X398L/V/W。在一些实施方案中,残基差异包 括至少X14V。在一些实施方案中,残基差异包括至少X163I/L/R/V。在一 些实施方案中,残基差异包括至少X398L/V/W。

在一些实施方案中,工程化转氨酶多肽包括具有与SEQ ID NO:4相比 选自以下的残基差异的至少一个组合的氨基酸序列:X14V和 X163I/L/V/H/R;X86D和X400G;X57F/Y和X163I/L/R/V;X57F/Y和 X398L/V/W;X14V、X113L/V、X163I/L/R/V、X284A、和X424V;和X31S、 X57F/Y、X163I/L/V/H/R、X315G、X346L、和X398V/L/W。

在一些实施方案中,工程化转氨酶多肽包括具有与SEQ ID NO:4相比 选自以下的残基差异的至少一个组合的氨基酸序列:X14V、X113L、 X163L、X284A、和X424V;X14V、X26R、X163L、X284A、和X400G; X14V、X26R、X88L、和X113L;X57F、X163L、X168K、X314N、X315G、 X346L、和X398V;X14V、X163L、X173A、X400G、和X420N;X14V、 X113L、X163L、和X284A;X14V、X26R、X163L、X284A、和X400G; 和X14V、X33T、X57F、X113L、和X163L。

如本领域技术人员将理解的,在一些实施方案中,被选择的以上残基 差异的一个或组合在工程化转氨酶中作为核心序列(或特征)可以是保守 的,并且在其他残基位置上的另外的残基差异掺入进该核心序列以产生具 有改进特性的另外的工程化转氨酶多肽。因此,应理解,对于包含以上残 基差异的一个或子集的任何工程化转氨酶,本公开内容涵盖包括残基差异 的一个或子集、以及在本文公开的其他残基位置上的另外的一个或更多个 残基差异的其他工程化转氨酶。通过示例的方式而非限制,包含残基位置 X163上的残基差异的工程化转氨酶,还可在以下其他残基位置上掺入一个 或更多个残基差异:例如X14;X26;X31;X33;X41;X47;X57;X70; X86;X88;X107;X132;X148;X168;X173;X203;X250;X284;X314; X315;X324;X346;X395;X398;X400;X417;X419;X423;X448; 和X451。另一个实例是包含残基位置X14上的残基差异的工程化转氨酶, 其还可在以下其他残基位置上包含一个或更多个残基差异:例如X26; X31;X33;X41;X47;X57;X70;X86;X88;X107;X132;X148; X163;X168;X173;X203;X250;X284;X314;X315;X324;X346; X395;X398;X400;X417;X419;X423;X448;和X451。对于每个前 述实施方案,工程化转氨酶还可包括选自以下的另外的残基差异:X57F; X113L;X113V;X168K;X420N;和X424V。

在一些实施方案中,工程化转氨酶多肽能够以相对于SEQ ID NO:4 的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、 20倍、30倍、40倍、50倍或更多的活性将底物化合物(2)转化为产物化合 物(1)。在一些实施方案中,能够以相对于SEQ ID NO:4的参考多肽的活 性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、 40倍、50倍或更多的活性将底物化合物(2)转化为产物化合物(1)的工程化 转氨酶多肽包括具有与SEQ ID NO:4相比选自以下的一个或更多个残基差 异的氨基酸序列:X14V、X26R;X31S;X33T;X41L;X70A;X86D; X88A/L;X163I/L;X284A;和X419S。

在一些实施方案中,能够以相对于SEQ ID NO:4的活性的至少1.2倍 将底物化合物(2)转化为产物化合物(1)的工程化转氨酶多肽包括选自以下 的氨基酸序列:SEQ ID NO:6、8、10、12、14、16、22、24、28、30、32、 48、52、56、62、64、66、68、86、88、90、92、98、100、104、106、 108、110、112、114、116、118、124、126、128、132、134、136、142、 144、148、和154。

在一些实施方案中,工程化转氨酶多肽能够以相对于SEQ ID NO:4 的活性的至少5倍将底物化合物(2)转化为产物化合物(1),并且包括具有选 自以下的一个或更多个残基差异的氨基酸序列:X14V、X26R;X33T; X88A/L;X163I/L;和X284A。

在一些实施方案中,能够以相对于SEQ ID NO:4的活性的至少5倍将 底物化合物(2)转化为产物化合物(1)的工程化转氨酶多肽包括选自以下的 氨基酸序列:SEQ ID NO:6、8、10、14、16、22、24、28、30、32、48、 52、56、62、64、86、88、90、92、98、100、104、106、108、110、112、 114、116、118、124、126、128、132、134、136、142、144、148、和154。

如以上所提及,在一些实施方案中,与野生型或参考工程化酶(例如, SEQ ID NO;4)相比,工程化转氨酶多肽展示对产物胺(S)-1-(1H-5-氟-6-氯- 吲哚-3-基)丙-2-胺抑制的增强的耐受性或抗性。对产物抑制的耐受性或抗 性(即,产物耐受性)的改进的特性可通过以下来测量:在产物化合物的 存在下测量进化的酶的活性并比较其与在相同反应条件下在产物化合物 的存在下对照酶的活性。对产物抑制的耐受性可通过增加的酶活性的倍数 来评估。使用标准生物化学技术诸如HPLC分析,减去来自预添加的产物 胺的背景,可进行测量酶活性。在一些实施方案中,在将化合物(2)转化为 化合物(1)中,与由SEQ ID NO:4呈现的多肽相比,工程化转氨酶多肽具有 对1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺,特别是(S)-1-(1H-5-氟-6-氯-吲哚-3- 基)丙-2-胺抑制的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、或更多倍 的耐受性。通常,对产物化合物抑制的增加的耐受性或抗性可在HTP测定 条件下在14g/L或16g/L的化合物(1)的存在下来测量,如表2A和2B以 及实施例中描述的。在一些实施方案中,具有对1-(1H-5-氟-6-氯-吲哚-3- 基)丙-2-胺抑制的至少1.2倍或更大的耐受性的工程化转氨酶多肽包括具 有与SEQ ID NO:4相比选自以下的一个或更多个残基差异的氨基酸序列: X26R;X70A;X86D;X88A/L;X132F;X163L;X315G;X395P;X398L; 和X419S。

在一些实施方案中,具有对1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺,特 别是(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺抑制的至少1.2倍或更大的耐 受性的工程化转氨酶多肽包括选自以下的氨基酸序列:SEQ ID NO:6、12、 16、18、22、24、26、28、30、32、34、36、38、40、42、46、48、52、 54、56、58、60、62、74、76、98、122、124、130、132、134、138、140、 144、146、和152。

在一些实施方案中,工程化转氨酶多肽具有对1-(1H-5-氟-6-氯-吲哚-3- 基)丙-2-胺,特别是(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺抑制的至少5 倍或更大的耐受性,并且包括具有与SEQ ID NO:4相比选自以下的一个或 更多个残基差异的氨基酸序列:X26R;X88L;和X163L。

在一些实施方案中,具有对1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺,特 别是(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺抑制的至少5倍或更大的耐受 性的工程化转氨酶多肽包括具有选自以下残基差异的至少一个组合的氨 基酸序列:X14V、X113L、X163L、X284A、和X424V;X14V、X26R、 X163L、X284A、和X400G;X14V、X26R、X88L、和X113L;X57F、 X163L、X168K、X314N、X315G、X346L、和X398V;X14V、X163L、 X173A、X400G、和X420N;X14V、X113L、X163L、和X284A;X14V、 X26R、X163L、X284A、和X400G;和X14V、X33T、X57F、X113L、和 X163L。

在一些实施方案中,具有对1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺抑制 的至少5倍或更大的耐受性的工程化转氨酶多肽,与SEQ ID NO:4相比, 包括选自以下的氨基酸序列:SEQ ID NO:16、124、132、134、140、和146。

在一些实施方案中,与SEQ ID NO:4的参考工程化转氨酶相比,工程 化转氨酶多肽具有对转化反应中使用的温度和/或溶剂的增加的稳定性。在 一些实施方案中,工程化转氨酶多肽具有在适当的反应条件下至少1.2倍、 1.5倍、2倍、3倍、4倍、5倍、10倍或更多倍的稳定性,例如在HTP测 定条件下55℃下的活性与50℃下的活性相比。在一些实施方案中,具有 与SEQ ID NO:4的多肽相比的至少1.2倍增加的稳定性的工程化转氨酶多 肽包括具有与SEQ ID NO:4相比选自以下的一个或更多个残基差异的氨基 酸序列:X14V;X26R;X31S;X33T;X41L;X70A;X86D;X88A/L; X163I/L/R/V;X284A;X324H;X419S;和X423I。

在一些实施方案中,具有与SEQ ID NO:4的多肽相比的至少1.2倍增 加的稳定性的工程化转氨酶多肽包括选自以下的氨基酸序列:6、8、12、 16、18、20、22、24、28、30、32、34、36、38、40、42、44、46、48、 50、52、56、60、62、64、66、68、70、72、74、76、78、80、82、84、 86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、 116、118、120、122、124、126、128、132、134、136、142、144、146、 148、150、152、和154。

在一些实施方案中,工程化转氨酶多肽能够在HTP测定条件、摇瓶测 定条件、或DSP测定条件下,以约100g/L、约50g/L、或约25g/L的底 物载量,在72h或更短、48h或更短、或24h或更短内将至少90%或更 多、91%或更多、92%或更多、93%或更多、94%或更多、或95%或更多的 化合物(2)转化为化合物(1)。在一些实施方案中,工程化转氨酶多肽能够在 50℃下在HTP测定条件以约25g/L的底物载量在24或更短内将至少90% 或更多的化合物(2)转化为化合物(1)。在一些实施方案中,能够在50℃下 在HTP测定条件以约25g/L的底物载量在24或更短内将至少90%或更多 的化合物(2)转化为化合物(1)的工程化转氨酶多肽包括选自以下的氨基酸 序列:124、132、134、140、144、和146。

在一些实施方案中,具有转氨酶活性,特别是将底物化合物(2)转化为 产物化合物(1)的工程化多肽具有包括选自以下序列的氨基酸序列:SEQ ID  NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、 38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、 70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、 102、104、106、108、110、112、114、116、118、120、122、124、126、 128、130、132、134、136、138、140、142、144、146、148、150、152、 和154。

在一些实施方案中,具有转氨酶活性的工程化转氨酶包括具有与以下 的序列之一至少80%、85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列:SEQ ID  NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、 38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、 70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、 102、104、106、108、110、112、114、116、118、120、122、124、126、 128、130、132、134、136、138、140、142、144、146、148、150、152、 和154,并且与SEQ ID NO:4相比的氨基酸残基差异存在于以下的任何一 个中:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、 64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、 96、98、100、102、104、106、108、110、112、114、116、118、120、122、 124、126、128、130、132、134、136、138、140、142、144、146、148、 150、152、和154,如提供于表2A和2B中。

除以上指定的残基位置之外,本文所公开的任何工程化转氨酶多肽还 可包括相对于SEQ ID NO:2或4,在其他残基位置即,除以下残基位置外 的残基位置的其他残基差异:X9;X14;X18;X21;X26;X31;X33; X41;X45;X47;X57;X70;X86;X88;X107;X113;X132;X133; X146;X147;X148;X153;X163;X168;X173;X177;X203;X211; X233;X235;X244;X250;X284;X294;X314;X315;X318;X323; X324;X346;X383;X391;X395;X398;X400;X417;X419;X420; X423;X424;X427;X448;和X451。在这些其他残基位置上的残基差异 提供氨基酸序列的另外变体而没有不利地影响多肽进行转氨酶反应的,诸 如以对映体过量将化合物(2)转化为化合物(1)的能力。因此,在一些实施方 案中,除了选自以下的工程化转氨酶多肽的任何一个的氨基酸残基差异之 外:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、 64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、 96、98、100、102、104、106、108、110、112、114、116、118、120、122、 124、126、128、130、132、134、136、138、140、142、144、146、148、 150、152、和154,序列还可包括与SEQ ID NO:4相比在其他氨基酸残基 位置上的1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、 1-10个、1-11个、1-12个、1-14个、1-15个、1-16个、1-18个、1-20个、 1-22个、1-24个、1-26个、1-30个、1-35个、1-40个、1-45个、或1-50 个残基差异。在一些实施方案中,与参考序列相比,氨基酸残基差异的数 目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、 11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、 21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、 或50个残基位置。在这些其他位置上的残基差异可包括保守的变化或非 保守的变化。在一些实施方案中,与SEQ ID NO:2的野生型转氨酶多肽或 SEQ ID NO:4的工程化转氨酶多肽相比,残基差异可包括保守的取代和非 保守的取代。

相对于SEQ ID NO:2的野生型序列,在其他位置上的氨基酸残基差异 以及这些差异对酶功能的效应对于其他工程化转氨酶多肽在专利出版物 WO2010081053、US20100209981、和WO2011159910;Yun等人,2005,Appl  Environ Micriobiol.,71(8):4220–4224);以及Cho等人,2008,Biotechnol  Bioeng.99(2):275-84中描述,其全部通过引用并入本文。因此,在一些实 施方案中,与SEQ ID NO:2或4的序列相比的一个或更多个氨基酸差异还 可在选自以下的残基位置上被引入本公开内容的工程化转氨酶多肽:X4; X6;X12;X18;X30;X44;X56;X81;X82;X85;X95;X112;X122; X127;X130;X157;X164;X166;X167;X174;X181;X208;X228; X253;X256;X272;X285;X286;X293;X297;X302;X311;X312; X316;X317;X319;X320;X321;X332;X385;X407;X408;X409; X415;X418;X431;X434;X438;X444;和X446。特别是,在前述位 置上的氨基酸残基可选自以下:X4R/Q/L;X6R/I/N;X12A/G/K; X18A/V/L/I;X30A;X44A;X56V;X81D;X82H;X85A/S/V/T/N/C/G; X95T;X112I;X122E;X127L;X130G/M/A/V/L/I;X157T; X164N/Q/S/T/G/M/A/V/L/I;X166S;X167K/R;X174E/D;X181R;X208I; X228G/T;X253M;X256A;X272A;X285H;X286N/Q/S/T;X293N/Q/S/T; X297A;X302K;X311V;X312D/E;X316K/H/P;X317L/M/Y; X319Q/G/M/N/V;X320A/K;X321L/M/I;X332N/Q/S/T;X385R;X407S; X408A;X409G;X415M/L;X418V/N/Q/S/T;X431D;X434V;X438L; X444V;和X446V。对这些残基位置上的氨基酸残基的选择以及其对期望 的酶特性的效应的教导可参见引用的文献。

在一些实施方案中,本公开内容还提供了包括本文描述的任何工程化 多肽的片段的工程化转氨酶多肽,该片段保留了该工程化转氨酶的功能活 性和/或改进特性。因此,在一些实施方案中,本公开内容提供了具有转氨 酶活性,诸如在适当的反应条件下将化合物(2)转化为化合物(1)的多肽片 段,其中该片段包括本公开内容的工程化转氨酶多肽的全长氨基酸序列的 至少约80%、90%、95%、96%、97%、98%、或99%,工程化转氨酶多肽 诸如选自以下的示例性工程化转氨酶多肽:6、8、10、12、14、16、18、 20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、 52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、 84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、 114、116、118、120、122、124、126、128、130、132、134、136、138、 140、142、144、146、148、150、152、和154。

在一些实施方案中,工程化转氨酶多肽可具有包括本文描述的工程化 转氨酶多肽中的任一个的缺失的氨基酸序列,诸如以下的示例性工程化多 肽:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、 64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、 96、98、100、102、104、106、108、110、112、114、116、118、120、122、 124、126、128、130、132、134、136、138、140、142、144、146、148、 150、152、和154。因此,对于本公开内容的工程化转氨酶多肽的每个和 每一个实施方案,氨基酸序列可包括转氨酶多肽的一个或更多个氨基酸、 2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或 更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多 个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多至氨基酸 的总数的10%、多至氨基酸的总数的10%、多至氨基酸的总数的20%、或 多至氨基酸的总数的30%的缺失,其中保留了本文描述的工程化转氨酶的 相关功能活性和/或改进特性。在一些实施方案中,缺失可包括1-2个、1-3 个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、 1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、 1-40个、1-45个、或1-50个氨基酸残基。在一些实施方案中,缺失的数 目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、 11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、 21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、 或50个氨基酸残基。在一些实施方案中,缺失可以包括1个、2个、3个、 4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、 15个、16个、18个、20个、21个、22个、23个、24个、或25个氨基 酸残基的缺失。

在一些实施方案中,本文的工程化转氨酶多肽可具有与本文描述的工 程化转氨酶多肽中的任何一个相比包括插入的氨基酸序列,工程化转氨酶 多肽诸如以下的示例性工程化多肽:SEQ ID NO:6、8、10、12、14、16、 18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、 50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、 82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、 112、114、116、118、120、122、124、126、128、130、132、134、136、 138、140、142、144、146、148、150、152、和154。因此,对于本公开 内容的转氨酶多肽的每个和每一个实施方案,插入可包括一个或更多个氨 基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、 5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个 或更多个氨基酸、15个或更多个氨基酸、20个或更多个氨基酸、30个或 更多个氨基酸、40个或更多个氨基酸、或50个或更多个氨基酸,其中保 留了本文描述的工程化转氨酶的相关功能活性和/或改进特性。插入可以是 在转氨酶多肽的氨基末端或羧基末端、或内部部分。

在一些实施方案中,本文的工程化转氨酶多肽可具有包括选自以下序 列的氨基酸序列:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、 26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、 58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、 90、92、94、96、98、100、102、104、106、108、110、112、114、116、 118、120、122、124、126、128、130、132、134、136、138、140、142、 144、146、148、150、152、和154,和任选地一个或数个(例如,多达3 个、4个、5个或多达10个)氨基酸残基缺失、插入和/或取代。在一些实 施方案中,氨基酸序列任选地具有1-2个、1-3个、1-4个、1-5个、1-6个、 1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23 个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个、或1-50个氨 基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具 有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、 12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、 22个、23个、24个、25个、30个、30个、35个、40个、45个、或50 个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选 地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11 个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23 个、24个、或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中, 取代可以是保守的或非保守的取代。

在一些实施方案中,本公开内容提供了具有转氨酶活性的工程化多 肽,其多肽包括具有与选自以下序列的至少80%、85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99% 同一性的氨基酸序列:SEQ ID NO:6、8、10、12、14、16、18、20、22、 24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、 56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、 88、90、92、94、96、98、100、102、104、106、108、110、112、114、 116、118、120、122、124、126、128、130、132、134、136、138、140、 142、144、146、148、150、152、和154,条件是,该氨基酸序列与公开 于以下的示例性工程化转氨酶多肽氨基酸序列的任一种不同(也就是,该氨 基酸序列不包括公开于以下的示例性工程化转氨酶多肽氨基酸序列的任 一种):专利申请出版物WO2010081053、US20100209981、和 WO2011159910;Yun等人,2005,Appl Environ Micriobiol., 71(8):4220–4224);以及Cho等人,2008,Biotechnol Bioeng.99(2):275-84; 其全部通过引用并入本文。

在上述实施方案中,用于工程化多肽的适当的反应条件可以是表2A 和2B中所描述的那些条件。因此,在一些实施方案中,适当的反应条件 是HTP测定条件,该条件包括:10g/L(44.4mM)化合物(2);1mM吡哆醛 -5-磷酸(PLP);2M异丙胺(IPM),pH 7;100mM三乙醇胺(TEA),pH 7; 5%v/v PEG 200;10μL的HTP溶解产物;以及50℃持续24h。

在一些实施方案中,适当的反应条件是对摇瓶粉(SFP)测定描述的那些 条件,该条件包括:25g/L、50或100g/L化合物(2);1mM吡哆醛-5-磷 酸(PLP);2M异丙胺(IPM),pH 7;5%v/v PEG200;100mM三乙醇胺(TEA), pH 7;2g/L来自包含转氨酶的摇瓶制品的蛋白;以及50℃持续24h。

在一些实施方案中,适当的反应条件是对下游处理粉(DSP)测定描述 的那些条件,该条件包括:25g/L、50或100g/L化合物(2);1mM吡哆醛 -5-磷酸(PLP);2M异丙胺(IPM),pH 7;5%v/v PEG200;100mM三乙醇 胺(TEA),pH 7;2g/L来自包含转氨酶的DSP制品的蛋白;以及50℃持 续24h。

这些前述反应条件和转氨酶多肽的使用的指导提供于表2A和2B及实 施例以及其他中。

在一些实施方案中,本公开内容的多肽可以是融合多肽的形式,其中 工程化多肽与其他多肽融合,所述其他多肽诸如通过举例的方式而非限 制,抗体标签(例如,myc表位)、纯化序列(例如,用于结合至金属的 His标签)和细胞定位信号(例如,分泌信号)。因此,本文描述的工程化 多肽可与其它多肽融合或不与其它多肽融合使用。

应理解的是,本文描述的多肽不限于遗传编码的氨基酸。除了遗传编 码的氨基酸以外,本文描述的多肽可完全或部分包括天然存在的和/或合成 的非编码氨基酸。本文描述的多肽可包括的某些常见非编码氨基酸包括但 不限于:遗传编码的氨基酸的D-立体异构体;2,3-二氨基丙酸(Dpr);α- 氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);N-甲基甘氨 酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨 酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘氨酸 (Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2- 氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯 丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸 (Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf); 3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf); 3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨酸(Ocf); 3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf); 3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸 (Paf);4-碘苯丙氨酸(Pif);4-氨甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨 酸(Opef);3,4-二氯苯丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4- 二氟苯丙氨酸(Mpff);吡啶-2-基丙氨酸(2pAla);吡啶-3-基丙氨酸(3pAla); 吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(1nAla);萘-2-基丙氨酸(2nAla); 噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla); 呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸 (hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(sAla);蒽基丙氨酸(aAla); 3,3-二苯丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4- 四氢异喹啉-3-羧酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso); N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe); 磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸 (hGlu);1-氨基环戊-(2或3)-烯-4羧酸;哌可酸(PA);氮杂环丁烷-3- 羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aOly);炔丙基甘氨 酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu);高 缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰赖氨酸 (AcLys);2,4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨 酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟基脯氨酸(Hyp) 和高脯氨酸(hPro)。本文描述的多肽可包括的另外的非编码氨基酸对本领 域技术人员将是明显的(参见,例如,在Fasman,1989,CRC Practical  Handbook of Biochemistry and Molecular Biology,CRC Press,Boca Raton, FL,在第3-70页及其中引用的参考文献中提供的多种氨基酸,全部参考文 献通过引用并入本文)。这些氨基酸可以是以L-构型或D-构型。

本领域技术人员将认识到,带有侧链保护基的氨基酸或残基也可以构 成本文所描述的多肽。在这种情况下属于芳香族类别的这些受保护的氨基 酸的非限制性实例包括(在括号中列出的保护基)但不限于:Arg(tos)、 Cys(甲苄基)、Cys(硝基吡啶次磺酰基)、Glu(δ-苄基酯)、Gln(呫吨基)、 Asn(N-δ-呫吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、 Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。

本文所述的多肽可包括的构型上受限制的非编码氨基酸包括但不限 于,N-甲基氨基酸(L-构型);1-氨基酸环戊-(2或3)-烯-4-羧酸;哌可酸; 氮杂环丁烷-3-羧酸;高脯氨酸(hPro);以及1-氨基环戊烷-3-羧酸。

在一些实施方案中,工程化转氨酶多肽可被提供在固体支持物上,诸 如膜、树脂、固体载体(solid carrier)、或其他固相材料。固体支持物可以 包括有机聚合物如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚乙烯氧和聚 丙烯酰胺以及其共聚物和接枝物。固体支持物还可以是无机的,诸如玻璃、 二氧化硅、可控孔度玻璃(CPG)、反相二氧化硅或金属诸如金或铂。固体 支持物的结构可呈珠、球、粒子、颗粒、凝胶、膜或表面的形式。表面可 以是平面的、基本上平面的或非平面的。固体支持物可以是多孔的或非多 孔的,并且可以具有溶胀的或非溶胀的性质。固体支持物可以被配置成孔、 凹部或其它容器、器皿(vessel)、特征(feature)或位置(location)的形 式。

在一些实施方案中,本公开内容的具有转氨酶活性的工程化多肽可被 固定在固体支持物上,使得它们保留它们的相对于SEQ ID NO:4的参考多 肽改进的活性、立体选择性、和/或其他改进特性。在这样的实施方案中, 固定的多肽可促进式(II)的底物化合物或其他适当的底物生物催化转化为 式(I)的产物化合物或相应的产物(例如,如本文描述的方案1和2中所示 的),并且在反应完全后很容易保留(例如,通过保留在其上固定多肽的 珠),并且然后在后续反应中再利用或回收。这样的固定的酶的方法允许 更高的效率和成本降低。因此,进一步设想,使用本公开内容的工程化转 氨酶多肽的方法中的任一种,可使用结合或固定在固体支持物上的相同的 工程化转氨酶多肽来进行。

酶固定的方法是本领域中熟知的。可非共价地或共价地结合工程化转 氨酶多肽。用于缀合和固定酶至固体支持物(例如,树脂、膜、珠、玻璃 等等)的各种方法是本领域熟知的并描述于例如:Yi等人,“Covalent  immobilization ofω-transaminase from Vibrio fluvialis JS17on chitosan  beads,”Process Biochemistry 42(5):895-898(May 2007);Martin等人, “Characterization of free and immobilized(S)-aminotransferase for  acetophenone production,”Applied Microbiology and Biotechnology  76(4):843-851(Sept.2007);Koszelewski等人,“Immobilization of  ω-transaminases by encapsulation in a sol-gel/celite matrix,”Journal of  Molecular Catalysis B:Enzymatic,63:39-44(Apr.2010);Truppo等人, “Development of an Improved Immobilized CAL-B for the Enzymatic  Resolution of a Key Intermediate to Odanacatib,”Organic Process Research &  Development,published online:dx.doi.org/10.1021/op200157c;Hermanson, G.T.,Bioconjugate Techniques,Second Edition,Academic Press(2008);Mateo 等人,“Epoxy sepabeads:a novel epoxy support for stabilization of industrial  enzymes via very intense multipoint covalent attachment,”Biotechnology  Progress 18(3):629-34(2002);以及Bioconjugation Protocols:Strategies and  Methods,In Methods in Molecular Biology,C.M.Niemeyer编著,Humana  Press(2004);其每个的公开内容通过引用并入本文。可用于固定本公开内 容的工程化转氨酶的固体支持物包括但不限于,包括以下的珠或树脂:具 有环氧官能团的聚甲基丙烯酸酯、具有氨基环氧官能团的聚甲基丙烯酸 酯、具有十八烷基官能团的苯乙烯/DVB共聚物或聚甲基丙烯酸酯。可用 于固定本公开内容的工程化转氨酶的示例性固体支持物包括但不限于,壳 聚糖珠、Eupergit C和SEPABEAD(Mitsubishi),包括以下不同类型的 SEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119和EXE120。

在一些实施方案中,工程化多肽可以是各种形式,例如,诸如分离的 制剂,作为基本上纯的酶、用编码酶的基因转化的整个细胞、和/或作为细 胞提取物和/或此类细胞的溶解产物。酶可以冻干、喷雾干燥、沉淀、或为 粗糊料的形式,如以下进一步讨论的。

在一些实施方案中,本文描述的多肽可以试剂盒的形式被提供。试剂 盒中的酶可以单独地存在或作为多种酶存在。试剂盒还可包括用于进行酶 促反应的试剂、用于评估酶活性的底物、以及用于检测产物的试剂。试剂 盒还可包括试剂分配器和试剂盒的使用说明书。

在一些实施方案中,多肽可以以阵列的形式被提供在固体支持物上, 其中多肽被布置在定位上不同的位置中。阵列可用于测试用于被多肽转化 的各种底物化合物。多种支持物可以配置在阵列上的不同的位置,这对于 试剂的机器人递送或通过检测方法和/或仪器是可寻址的。用于缀合基质, 例如膜、珠、玻璃等等的各种方法描述于Hermanson,G.T.,Bioconjugate  Techniques,第2版,Academic Press;(2008),以及Bioconjugation Protocols: Strategies and Methods,In Methods in Molecular Biology,C.M.Niemeyer编 著,Humana Press(2004),以及其他;这些的公开内容通过引用并入本文。

在一些实施方案中,本公开内容的试剂盒包括以下的阵列,其包括在 不同的可寻址的位置的本文公开的多种不同的工程化酮还原酶多肽,其中 不同的多肽是参考序列的不同的变体,各自具有至少一种不同的改进的酶 性质。包括多种工程化多肽的这样的阵列和它们的使用方法被描述在例如 WO2009008908中。

5.4编码工程化多肽的多核苷酸、表达载体和宿主细胞

在另一个方面,本公开内容提供编码本文描述的工程化转氨酶多肽的 多核苷酸。多核苷酸可与控制基因表达的一个或更多个异源的调节序列可 操作地连接,以产生能够表达多肽的重组的多核苷酸。包含编码工程化转 氨酶的异源的多核苷酸的表达构建体可被引入适当的宿主细胞以表达相 应的转氨酶多肽。

如对本领域技术人员将是明显的,蛋白序列的可用性和相应于各种氨 基酸的密码子的知识提供了对能够编码该主题多肽的所有多核苷酸的描 述。遗传密码的简并性,其中相同氨基酸由替代的或同义的密码子编码, 允许极大数目的核酸被制出,所有这些核酸编码改进的转氨酶。因此,具 有具体的氨基酸序列的知识后,本领域技术人员能够以不改变蛋白的氨基 酸序列的方式通过仅仅变更序列的一个或更多个密码子来制出任何许多 的不同核酸。在这点上,本公开内容明确涵盖可通过选择基于可能的密码 子选择的组合制出的编码本文描述的多肽的多核苷酸的每种和每一种可 能的变体,并且所有这些变体将被认为针对本文描述的任何多肽被明确地 公开,所述本文描述的任何多肽包括在表2A和2B中呈现的以及作为以下 通过引用并入本文的序列表中公开的氨基酸序列:SEQ ID NO:6、8、10、 12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、 44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、 76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、 106、108、110、112、114、116、118、120、122、124、126、128、130、 132、134、136、138、140、142、144、146、148、150、152、和154。

在各种实施方案中,密码子被优选地选择以适合在其中产生蛋白的宿 主细胞。例如,细菌中使用的优选的密码子被用于在细菌中表达;酵母中 使用的优选的密码子被用于酵母中的表达;并且哺乳动物中使用的优选的 密码子被用于哺乳动物细胞中的表达。在一些实施方案中,所有密码子不 需要被替换以优化转氨酶的密码子使用,因为天然序列将包括优选的密码 子并且因为优选的密码子的使用对于所有氨基酸残基可能不是必需的。因 此,编码转氨酶的密码子优化的多核苷酸可以在全长编码区域的约40%、 50%、60%、70%、80%或大于90%的密码子位置包括优选的密码子。

在一些实施方案中,如上所述,多核苷酸编码具有本文公开的特性, 特别是与SEQ ID NO:4相比以改进特性将底物化合物(2)转化为产物化合 物(1)的能力的转氨酶活性的工程化多肽,其中多肽包括与选自以下的参考 序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列: SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、 32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、 64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、 96、98、100、102、104、106、108、110、112、114、116、118、120、122、 124、126、128、130、132、134、136、138、140、142、144、146、148、 150、152、和154,以及与SEQ ID NO:4相比在选自以下的残基位置上的 一个或更多个残基差异:X14;X26;X31;X33;X41;X47;X57;X70; X86;X88;X107;X132;X148;X163;X168;X173;X203;X250;X284; X314;X315;X324;X346;X395;X398;X400;X417;X419;X423; X448;和X451,其中在残基位置X31;X57;X86;X163;X168;X314; X324;X398;和X417上的残基差异选自:X31S;X57Y;X86D;X163I; X163L;X163R;X163V;X168S;X314N;X324H;X398L;X398V;X398W; 和X417M。在一些实施方案中,参考序列选自SEQ ID NO:4、8、14、16、 132、134、和146。在一些实施方案中,参考序列是SEQ ID NO:4。在一 些实施方案中,参考序列是SEQ ID NO:8。在一些实施方案中,参考序列 是SEQ ID NO:134。在一些实施方案中,参考序列是SEQ ID NO:146。

在一些实施方案中,多核苷酸编码具有本文公开的特性的转氨酶活性 的工程化多肽,其中多肽包括与参考序列SEQ ID NO:2或4具有至少80%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、 97%、98%、99%或更多序列同一性以及与SEQ ID NO:4相比在选自以下 的残基位置上的一个或更多个残基差异的氨基酸序列:X14;X26;X31; X33;X41;X47;X57;X70;X86;X88;X107;X132;X148;X163; X168;X173;X203;X250;X284;X314;X315;X324;X346;X395; X398;X400;X417;X419;X423;X448;和X451,其中在残基位置X31; X57;X86;X163;X168;X314;X324;X398;和X417上的残基差异选 自:X31S;X57Y;X86D;X163I;X163L;X163R;X163V;X168S;X314N; X324H;X398L;X398V;X398W;和X417M。

在一些实施方案中,多核苷酸编码具有转氨酶活性的工程化多肽,其 中多肽包括与参考序列SEQ ID NO:2或4具有至少80%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或更多序列同一性以及与SEQ ID NO:4相比在选自以下的残基差异的至少 一个组合的氨基酸序列:X14V和X163I/L/R/V;X86D和X400G;X57F/Y 和X163I/L/R/V;X57F/Y和X398L/V/W;X14V、X113L/V、X163I/L/R/V、 X284A、和X424V;和X31S、X57F/Y、X163I/L/R/V、X315G、X346L、 和X398L/V/W。在一些实施方案中,残基差异的组合选自:X14V、X113L、 X163L、X284A、和X424V;X14V、X26R、X163L、X284A、和X400G; X14V、X26R、X88L、和X113L;X57F、X163L、X168K、X314N、X315G、 X346L、和X398V;X14V、X163L、X173A、X400G、和X420N;X14V、 X113L、X163L、和X284A;X14V、X26R、X163L、X284A、和X400G; 和X14V、X33T、X57F、X113L、和X163L。

在一些实施方案中,多核苷酸编码具有转氨酶活性的工程化多肽,其 中多肽包括与选自以下的任何一个的参考多肽具有至少80%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 或99%同一性的氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、18、 20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、 52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、 84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、 114、116、118、120、122、124、126、128、130、132、134、136、138、 140、142、144、146、148、150、152、和154,条件是氨基酸序列包括与 SEQ ID NO:4相比包含在以下的任何一个多肽序列中的残基差异的集合 的任何一个:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、 28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、 60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、 92、94、96、98、100、102、104、106、108、110、112、114、116、118、 120、122、124、126、128、130、132、134、136、138、140、142、144、 146、148、150、152、和154,如列于表2A和2B中。

在一些实施方案中,编码工程化转氨酶的多核苷酸包括选自以下的多 核苷酸序列:SEQ ID NO:5、7、9、11、13、15、17、19、21、23、25、 27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、 59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、 91、93、95、97、99、101、103、105、107、109、111、113、115、117、 119、121、123、125、127、129、131、133、135、137、139、141、143、 145、147、149、151、和153。

在一些实施方案中,多核苷酸能够在高度严格条件下与选自以下的参 考多核苷酸序列或其互补序列杂交:SEQ ID NO:5、7、9、11、13、15、 17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、 49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、 81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、 111、113、115、117、119、121、123、125、127、129、131、133、135、 137、139、141、143、145、147、149、151、和153,并且编码具有本文 描述的一种或更多种改进特性的转氨酶活性的多肽。在一些实施方案中, 能够在高度严格条件下杂交的多核苷酸编码包括氨基酸序列的转氨酶多 肽,所述氨基酸序列具有与SEQ ID NO:4相比在选自以下的残基位置上的 一个或更多个残基差异:X14;X26;X31;X33;X41;X47;X57;X70; X86;X88;X107;X132;X148;X163;X168;X173;X203;X250;X284; X314;X315;X324;X346;X395;X398;X400;X417;X419;X423; X448;和X451,其中在残基位置X31;X57;X86;X163;X168;X314; X324;X398;和X417上的残基差异选自:X31S;X57Y;X86D;X163I; X163L;X163R;X163V;X168S;X314N;X324H;X398L;X398V;X398W; 和X417M。

在一些实施方案中,多核苷酸编码本文描述的多肽,但具有在核苷酸 水平上与编码工程化转氨酶的参考多肽约80%或更多序列同一性,约80%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、 97%、98%、或99%或更多序列同一性。在一些实施方案中,参考多核苷 酸序列选自SEQ ID NO:5、7、9、11、13、15、17、19、21、23、25、27、 29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、 61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、 93、95、97、99、101、103、105、107、109、111、113、115、117、119、 121、123、125、127、129、131、133、135、137、139、141、143、145、 147、149、151、和153。

编码本文中任何工程化转氨酶多肽的分离的多核苷酸可以以多种方 式操作以提供多肽的表达。在一些实施方案中,编码多肽的多核苷酸可以 被提供为表达载体,其中存在一个或更多个控制序列以调控多核苷酸和/ 或多肽的表达。取决于表达载体,所分离的多核苷酸在其插入载体中之前 的操作可以是令人期望的或必要的。利用重组DNA方法修饰多核苷酸和 核酸序列的技术是本领域熟知的。在Sambrook等人,2001,Molecular  Cloning:A Laboratory Manual,第3版,Cold Spring Harbor Laboratory Press; 以及Current Protocols in Molecular Biology,Ausubel.F.编著,Greene Pub. Associates,1998,更新至2006中提供了指导。

在一些实施方案中,控制序列包括启动子、前导序列、多腺苷酸化序 列、前肽序列、信号肽序列、和转录终止子以及其他。适合的启动子可基 于使用的宿主细胞来选择。对于细菌宿主细胞,用于指导本公开内容的核 酸构建体的转录的适合的启动子包括获自以下的启动子:大肠杆菌lac操 纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂酶基因(dagA)、枯草芽 孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus  licheniformis)α-淀粉酶基因(amyL)、嗜热芽孢杆菌(Bacillus  stearothermophilus)淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus  amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因 (penP)、枯草芽孢杆菌xylA和xylB基因和原核的β-内酰胺酶基因 (Villa-Kamaroff等人,1978,Proc.Natl Acad.Sci.USA 75:3727-3731),以 及tac启动子(DeBoer等人,1983,Proc.Natl Acad.Sci.USA 80:21-25)。用 于丝状真菌宿主细胞的示例性启动子,包括获自以下基因的启动子:米曲 霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei) 天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳 定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、 米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲 霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum) 胰蛋白酶样蛋白酶(WO 96/00787)以及NA2-tpi启动子(来自黑曲霉中性α- 淀粉酶和米曲霉磷酸丙糖异构酶的基因的启动子的杂合体)和其突变的、 截短的和杂合的启动子。示例性酵母细胞启动子可来自以下基因可来自以 下基因:酿酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、酿酒酵 母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶 (ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶。用于酵母宿主细胞的其它有 用的启动子由Romanos等人,1992,Yeast 8:423-488描述。

控制序列还可以是适当的转录终止子序列,转录终止子序列是由宿主 细胞识别以终止转录的序列。终止子序列可操作地连接到编码多肽的核酸 序列的3’末端。在选择的宿主细胞中有功能的任何终止子可用于本发明中。 例如,用于丝状真菌宿主细胞的示例性转录终止子可以获自以下的基因: 米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、 黑曲霉α-葡糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的 示例性终止子可以获自以下的基因:酿酒酵母烯醇化酶、酿酒酵母细胞色 素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他 有用的终止子由上述Romanos等人,1992描述。

控制序列还可以是适当的前导序列,mRNA的非翻译区,其对于由宿 主细胞翻译是重要的。前导序列可操作地连接到编码多肽的核酸序列的5’ 末端。可使用在选择的宿主细胞中有功能的前导序列。用于丝状真菌宿主 细胞的示例性前导序列获自以下的基因:米曲霉TAKA淀粉酶和构巢曲霉 磷酸丙糖异构酶。用于酵母宿主细胞的适当的前导序列获自以下的基因: 酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油激酶、酿酒酵母α因子 和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

控制序列还可以是多腺苷酸序列,所述多腺苷酸序列是可操作地连接 到核酸序列的3’末端的序列,并且当转录时,被宿主细胞识别为将聚腺苷 残基加到转录的mRNA的信号。在选择的宿主细胞中有功能的任何多腺苷 酸序列可用于本发明中。用于丝状真菌宿主细胞的示例性多腺苷酸序列可 以获自以下的基因:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉 邻氨基苯甲酸合成酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α葡糖苷酶。 用于酵母宿主细胞的有用的多腺苷酸序列由Guo和Sherman,1995,Mol  Cell Bio 15:5983-5990描述。

控制序列还可以是信号肽编码区,其编码与多肽的氨基末端连接的氨 基酸序列并将编码的多肽引导入细胞的分泌通路。核酸序列的编码序列的 5’末端可以本身包括信号肽编码区,其与编码分泌的多肽的编码区的区段 以翻译读码框天然地连接。可选地,编码序列的5’末端可以包含对于编码 序列是外来的信号肽编码区。将表达的多肽引导入选择的宿主细胞的分泌 通路的任何信号肽编码区可以被用于表达工程化多肽。对细菌宿主细胞有 效的信号肽编码区是获自以下的基因的信号肽编码区:芽孢杆菌(Bacillus) NClB 11837生麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌 枯草蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶 (nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva, 1993,Microbiol Rev 57:109-137描述。对丝状真菌宿主细胞有效的信号肽 编码区可以是获自以下的基因的信号肽编码区:米曲霉TAKA淀粉酶、黑 曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异 腐质霉(Humicola insolens)纤维素酶和柔毛腐质霉(Humicola lanuginosa) 脂肪酶。对酵母宿主细胞有用的信号肽可以来自酿酒酵母α因子和酿酒酵 母转化酶的基因。

控制序列还可以是前肽编码区,其编码定位在多肽的氨基末端的氨基 酸序列。产生的多肽称为前酶(pro-enzyme)或前多肽(或在一些情况中 称为酶原(zymogen))。通过从前多肽催化或自动催化裂解前肽,前多肽 可以被转化成成熟的活性多肽。前肽编码区可以获自以下的基因:枯草芽 孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因 子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora  thermophila)乳糖酶(WO 95/33836)。当信号肽和前肽区均存在于多肽的氨 基末端时,前肽区定位为紧邻多肽的氨基末端并且信号肽区定位为紧邻前 肽区的氨基末端。

加入调节序列也可以是期望的,调节序列允许关于宿主细胞的生长调 节多肽的表达。调节系统的实例是引起响应化学或物理刺激物,包括调节 化合物的存在,而开启或关闭基因的表达的那些调节系统。在原核宿主细 胞中,适当的调节序列包括lac、tac和trp操纵子系统。在酵母宿主细胞中, 适当的调节系统包括,作为实例的ADH2系统或GAL1系统。在丝状真菌 中,适当的调节序列包括TAKAα-淀粉酶启动子、黑曲霉葡萄糖淀粉酶启 动子和米曲霉葡萄糖淀粉酶启动子。

在另一方面,本公开内容还涉及重组表达载体,取决于其将被引入的 宿主的类型,重组表达载体包括编码工程化转氨酶多肽的多核苷酸、和一 种或更多种表达调节区诸如启动子和终止子、复制起点等。以上描述的各 种核酸和控制序列可连接在一起以产生重组表达载体,其可包括一个或更 多个方便的限制位点以允许编码多肽的核酸序列在这些位点的插入或置 换。可选地,本公开内容的核酸序列可通过将核酸序列或包括所述序列的 核酸构建体插入用于表达的适当的表达载体来表达。在产生表达载体时, 编码序列位于载体中以使编码序列与用于表达的适当的控制序列可操作 地连接。

重组表达载体可以是任何载体(例如,质粒或病毒),其可以方便地 经历重组DNA程序并且可以引起多核苷酸序列的表达。载体的选择将通 常取决于载体与载体将被引入的宿主细胞的相容性。载体可以是线性的或 闭合的环状质粒。

表达载体可以是自主复制载体,即,作为染色体外的实体存在的载体, 其复制独立于染色体复制,自主复制载体例如质粒、染色体外元件、微型 染色体或人工染色体。载体可包含用于保证自身复制的任何工具(means)。 可选地,载体可以是当被引入宿主细胞时,被整合进入基因组并与其被整 合进入的染色体一起复制的载体。此外,可以使用单一载体或质粒或一起 包括待引入宿主细胞的基因组的总DNA的两种或更多种载体或质粒,或 转座子。

表达载体优选地包含一个或更多个可选择的标记物,其使得容易选择 转化细胞。可选择的标记物是基因,其产物提供杀生物剂或病毒抗性、对 重金属的抗性、营养缺陷型的原养型以及类似性质。细菌的可选择的标记 物的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素 抗性如氨苄西林、卡那霉素、氯霉素(实施例1)或四环素抗性的标记物。 用于酵母宿主细胞的适当的标记物是ADE2、HIS3、LEU2、LYS2、MET3、 TRP1和URA3。用于丝状真菌宿主细胞的可选择的标记物包括但不限于: amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草胺膦乙酰基转移酶)、 hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱 羧酶)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合成酶)以及其等同物。 用于曲霉细胞的实施方案包括构巢曲霉或米曲霉的amdS和pyrG基因和吸 水链霉菌(Streptomyces hygroscopicus)的bar基因。

在另一个方面,本公开内容提供了包括编码本公开内容的工程化转氨 酶多肽的多核苷酸的宿主细胞,该多核苷酸与用于在该宿主细胞中表达转 氨酶的一个或更多个控制序列可操作地连接。在表达由本发明的表达载体 编码的多肽中使用的宿主细胞是本领域熟知的并且包括但不限于:细菌细 胞,诸如大肠杆菌、河流弧菌、链霉菌属和鼠伤寒沙门氏菌(Salmonella  typhimurium)的细胞;真菌细胞,诸如酵母细胞(例如,酿酒酵母或巴斯 德毕赤酵母(Pichia pastoris)(ATCC保藏号201178));昆虫细胞诸如果 蝇S2细胞和夜蛾(Spodoptera)Sf9细胞;动物细胞诸如CHO、COS、BHK、 293和Bowes黑色素瘤细胞;以及植物细胞。示例性宿主细胞是大肠杆菌 W3110(ΔfhuA)和BL21。

因此,在另一方面,本公开内容提供了制造工程化转氨酶多肽的方法, 其中该方法可包括在适合于表达多肽的条件下培养能够表达编码工程化 转氨酶多肽的多核苷酸的宿主细胞。方法还可包括分离的或纯化表达的转 氨酶多肽,如本文描述的。

用于以上描述的宿主细胞的适当培养基和生长条件是本领域熟知的。 可通过本领域已知的多种方法将用于表达转氨酶的多核苷酸引入细胞中。 技术包括电穿孔、生物射弹粒子轰击、脂质体介导的转染、氯化钙转染和 原生质体融合以及其他。

对于本文中的实施方案,可使用本领域技术人员使用的方法获得工程 化多肽及相应的多核苷酸。编码河流弧菌的野生型多肽的亲本多核苷酸序 列已被描述于Shin等人,2003,Appl.Microbiol.Biotechnol. 61(5-6):463-471,并且产生具有改进的稳定性和底物识别特性的工程化转 氨酶多肽的方法被公开于专利申请出版物WO2010081053和 US20100209981中,其通过引用并入本文。

具有本文公开的特性的工程化转氨酶可通过使编码天然存在的或工 程化转氨酶的多核苷酸经历诱变和/或定向进化方法而获得,如以上所讨论 的。示例性的定向进化技术是诱变和/或DNA改组,如Stemmer,1994, Proc Natl Acad Sci USA 91:10747-10751;WO 95/22625;WO 97/0078;WO  97/35966;WO 98/27230;WO 00/42651;WO 01/75767和美国专利6,537,746 中所描述。可以使用的其它定向进化程序包括交错延伸过程(StEP)、体外 重组(Zhao等人,1998,Nat.Biotechnol.16:258–261)、诱变PCR(Caldwell 等人,1994,PCR Methods Appl.3:S136-S140)、和盒式诱变(Black等人, 1996,Proc Natl Acad Sci USA 93:3525-3529)以及其他。可用于本文目的 的诱变和定向进化技术也被描述在以下文献中:Ling等人,1997,Anal. Biochem.254(2):157-78;Dale等人,1996,“Oligonucleotide-directed random  mutagenesis using the phosphorothioate method”,于Methods Mol. Biol.57:369-74;Smith,1985,Ann.Rev.Genet.19:423-462;Botstein等人, 1985,Science 229:1193-1201;Carter,1986,Biochem.J.237:1-7;Kramer 等人,1984,Cell,38:879-887;Wells等人,1985,Gene 34:315-323;Minshull 等人,1999,Curr Opin Chem Biol 3:284-290;Christians等人,1999,Nature  Biotech 17:259-264;Crameri等人,1998,Nature 391:288-291;Crameri等 人,1997,Nature Biotech 15:436-438;Zhang等人,1997,Proc Natl Acad Sci  USA 94:45-4-4509;Crameri等人,1996,Nature Biotech 14:315-319; Stemmer,1994,Nature 370:389-391;Stemmer,1994,Proc Natl Acad Sci USA  91:10747-10751;WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230; WO 00/42651;WO 01/75767和美国专利号6,537,746。所有出版物通过引 用并入本文。

可对诱变处理后获得的克隆筛选具有期望的改进的酶特性的工程化 转氨酶。例如,当期望的改进的酶特性是热稳定性时,可以在使酶制剂经 历定义的温度并测量热处理之后剩余的酶活性的量之后测量酶活性。然后 包含编码转氨酶的多核苷酸的克隆被分离,测序以鉴定核苷酸序列变化 (如果有的话),并且用于在宿主细胞中表达酶。在产物胺的例如以OPA 衍生化之后使用标准生物化学技术,诸如HPLC分析,可进行测量来自表 达文库的酶活性。

当工程化多肽的序列是已知的时,编码酶的多核苷酸可根据已知的合 成方法通过标准的固相方法被制备。在一些实施方案中,多至约100个碱 基的片段可以被单独地合成,然后连接(例如,通过酶或化学连接方法或 聚合酶介导的方法)以形成任何期望的连续序列。例如,使用例如由 Beaucage等人,1981,Tet Lett 22:1859-69描述的经典的亚磷酰胺法或由 Matthes等人,1984,EMBO J.3:801-05描述的方法,例如,如通常在自动 化合成方法中所实践的,本文公开的多核苷酸和寡核苷酸可通过化学合成 被制备。根据亚磷酰胺方法,寡核苷酸被例如在自动化DNA合成器中合 成,纯化,退火,连接和克隆入适当的载体。

因此,在一些实施方案中,用于制备工程化转氨酶多肽的方法可包括: (a)合成编码多肽的多核苷酸,所述多肽包括选自以下的氨基酸序列:SEQ  ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、 36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、 68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、 100、102、104、106、108、110、112、114、116、118、120、122、124、 126、128、130、132、134、136、138、140、142、144、146、148、150、 152、和154,并且具有与SEQ ID NO:4相比在选自以下的残基位置上的一 个或更多个残基差异:X14;X26;X31;X33;X41;X47;X57;X70; X86;X88;X107;X132;X148;X163;X168;X173;X203;X250;X284; X314;X315;X324;X346;X395;X398;X400;X417;X419;X423; X448;和X451,其中在残基位置X31;X57;X86;X163;X168;X314; X324;X398;和X417上的残基差异选自:X31S;X57Y;X86D;X163I; X163L;X163R;X163V;X168S;X314N;X324H;X398L;X398V;X398W; 和X417M;以及(b)表达由多核苷酸编码的转氨酶多肽。

在该方法的一些实施方案中,在残基位置X14;X26;X33;X41;X47; X70;X88;X107;X132;X148;X173;X203;X250;X284;X315;X346; X395;X400;X419;X423;X448;和X451上的残基差异选自X14V; X26R;X33T;X41L;X47N;X70A;X88A;X88L;X107P;X132F; X148Q;X148R;X173A;X203S;X250A;X284A;X315G;X346L;X395P; X400G;X419S;X423I;X448E;和X451D。

在该方法的一些实施方案中,氨基酸序列还包括选自以下的一个或更 多个残基差异:X57F;X113L;X113V;X168K;X420N;和X424V。

在该方法的一些实施方案中,由多核苷酸编码的氨基酸序列可任选地 具有一个或数个(例如,多达3个、4个、5个、或多达10个)氨基酸残 基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1-2 个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15 个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35 个、1-40个、1-45个、或1-50个氨基酸残基缺失、插入和/或取代。在一 些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6 个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、 17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、 30个、35个、40个、45个、或50个氨基酸残基缺失、插入和/或取代。 在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、 6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16 个、18个、20个、21个、22个、23个、24个、或25个氨基酸残基缺失、 插入和/或取代。在一些实施方案中,取代可以是保守的或非保守的取代。

表达的工程化转氨酶可通过本文描述的任何测定条件来测量在将化 合物(2)转化至化合物(1)中期望的改进的特性,例如,活性、对映体选择性、 稳定性、和产物耐受性。

在一些实施方案中,在宿主细胞中表达的任何工程化转氨酶可以使用 任何一种或更多种熟知的蛋白纯化方法从细胞和或培养介质回收,方法包 括,溶菌酶处理、声处理、过滤、盐析、超速离心和色谱法以及其他。用 于裂解和从细菌诸如大肠杆菌高效提取蛋白的适合的溶液被提供于表2A 和实施例中,并且还是例如从St.Louis MO的Sigma-Aldrich以商标名 CelLytic BTM商业上可获得的。

用于分离转氨酶多肽的色谱方法包括,反相色谱法、高效液相色谱法、 离子交换色谱法、凝胶电泳和亲和色谱法以及其他。用于纯化具体的酶的 条件将部分地取决于如净电荷、疏水性、亲水性、分子量、分子形状等因 素,并且对于本领域技术人员将是显然的。

在一些实施方案中,亲和技术可被用于分离改进的转氨酶。对于亲和 色谱纯化,可使用特异性结合转氨酶多肽的任何抗体。对于抗体的产生, 各种宿主动物,包括但不限于:兔、小鼠、大鼠等,可通过注射转氨酶多 肽或其片段而被免疫。借助侧链官能团或连接到侧链官能团的连接子,转 氨酶多肽或片段可被连接到适合的载体,诸如BSA。

5.7使用工程化转氨酶的方法

在另一方面,本文描述的转氨酶可被用于进行转氨酶反应的方法中, 其中将来自氨基供体的氨基基团转移至氨基受体,例如酮底物,以产生胺。 前手性酮受体的使用可导致以对映体过量产生手性胺。通常,用于进行转 氨反应的方法包括在适于将氨基受体转化为胺的反应条件下使氨基供体 和氨基受体接触本公开内容的工程化转氨酶多肽或与之温育。

在一些实施方案中,转氨酶可被用于将式(II)的底物化合物转化为式(I) 的产物化合物,如方案2中所示:

其中

R1选自由以下组成的组:氢、羧基、羧基(C1-C6)烷基、任选地取代 的(C1-C6)烷基、任选地取代的(C2-C6)烯基、任选地取代的烷氧基羰 基、任选地取代的芳基羰基、任选地取代的芳基磺酰基、和保护基团;

R2选自由以下组成的组:氢、氧代、卤代、羟基、氨基、硫代、任选 地取代的(C1-C6)烷基、(C1-C6)烷基氨基、(C1-C6)二烷基氨基、(C1-C6) 烷基硫代、(C1-C6)烷基磺酰基、(C1-C6)烷基亚磺酰基、和任选地取代 的(C1-C6)烷氧基;

R4、R6和R7各自彼此独立地选自由以下组成的组:氢、卤代、羟基、 氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6) 烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、 任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、 任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰 基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、 任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、 任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选 地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选 地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧 基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地 取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰 基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选 地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基 (C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;

R5选自由以下组成的组:氢、卤代、羟基、氨基、羧基、氰基、硝基、 硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的 (C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6) 二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6) 烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、 (C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、 氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、 任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地 取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任 选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳 基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选 地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基 亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、 烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺 酰基(C1-C6)烷基、或与R4一起形成5至8元任选地取代的环烷基或任 选地取代的杂环;

R8选自由以下组成的组:任选地取代的(C1-C6)烷基、任选地取代的 (C1-C6)烷氧基、任选地取代的环烷基、任选地取代的杂环烷基、任选地 取代的芳基、和任选地取代的杂芳基、或与R2一起形成任选地取代的5 至8元环烷基或杂环;以及

n是1或2;

条件是

(a)当R2是氢,则以下的至少一个适用:

(i)R1不是氢、甲基、4-(甲氧基)苯基羰基-、4-(三氟甲氧基)苯磺 酰基-、3-溴苯基羰基-、3-氨基丙基、或3-(甲基羰基氨基)丙基-;

(ii)R4和R7各自彼此独立地不是氢或氯;

(iii)R5不是氢、羟基、甲基、甲氧基、氟、氯、三氟甲基、或氰基;

(iv)R6不是氢、羟基、甲氧基、氟或氯;或

(v)R8不是甲基、乙基、羟甲基、羧基、甲基氧基羰基、乙基氧基羰 基、或三氟甲基-;以及

(b)当n是1,R2和R8一起形成环己基环,并且R1、R4、R6、和R7是氢时,则R5不是氟。

在一些实施方案中,以上式(I)的产物化合物,并因此相应的酮底物, 即以下式(II)的化合物,具有以下条件:

(a)当R2是氢,则以下的至少一个适用:

(i)R1不是氢、甲基、4-(甲氧基)苯基羰基-、4-(三氟甲氧基)苯磺 酰基-、3-溴苯基羰基-、3-氨基丙基、或3-(甲基羰基氨基)丙基-;

(ii)R4和R7各自彼此独立地不是氢或氯;

(iii)R5不是氢、羟基、甲基、甲氧基、氟、氯、三氟甲基、或氰基;

(iv)R6不是氢、羟基、甲氧基、氟或氯;或

(v)R8不是甲基、乙基、羟甲基、或三氟甲基-;以及

(b)当n是1,R2和R8一起形成环己基环,并且R1、R4、R6、和R7是氢时,则R5不是氟。

因此,明确排除式(I)的化合物,并因此相应的酮底物,即,以下式(II) 的化合物,是式(I)的化合物,其中

R1是氢、甲基、或

4-(甲氧基)苯基羰基-

4-(三氟甲氧基)苯磺酰基-

3-溴苯基羰基-

3-氨基丙基

3-(甲基羰基氨基)丙基-

R4和R7各自彼此独立地是氢或氯;

R5为氢、羟基、甲基、甲氧基、氟、氯、三氟甲基、或氰基;

R6是氢、羟基、甲氧基、氟、或氯;

R8是氢、甲基、乙基、羟甲基、羧基、甲基氧基羰基(-CO2CH3)、乙 基氧基羰基-(-CO2CH2CH3)、或三氟甲基;以及

n是1或2。

因此,在一些实施方案中,用于制备产物化合物(I)的方法可包括在适 当的反应条件下在氨基供体的存在下,使式(II)的底物化合物与本文公开的 工程化转氨酶多肽接触

其中

R1、R2、R4、R5、R6、R7、R8和n如以上所定义。

在该方法的一些实施方案中,式(I)的化合物包括在以*标记的碳原子 上具有指定的立体化学的式(IS)的化合物,

其中式(IS)的化合物以对映体过量来形成。在一些实施方案中,式(IS) 的化合物以至少90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更大的对映体过量来形成。

在该方法的一些实施方案中,以上式(I)的化合物包括式(Ia)的化合物,

其中

R1选自由以下组成的组:氢、羧基、羧基(C1-C6)烷基、任选地取代 的(C1-C6)烷基、任选地取代的(C2-C6)烯基、任选地取代的烷氧基羰 基、任选地取代的芳基羰基、任选地取代的芳基磺酰基、和保护基团;

R2选自由以下组成的组:氢、氧代、卤代、羟基、氨基、(C1-C6)烷基 氨基、(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基、和任选地取代的 (C1-C6)烷氧基;

R4、R6和R7各自彼此独立地选自由以下组成的组:氢、卤代、羟基、 羟基(C1-C6)烷基、氨基、(C1-C6)烷基氨基、(C1-C6)二烷基氨基、氰基、硝 基、磺酰基、氨基羰基、氨基羰基(C1-C6)烷基、(C1-C6)烷基氨基、羧基、 羧基(C1-C6)烷基、任选地取代的(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、 任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选 地取代的杂芳基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、 和杂芳基磺酰基(C1-C6)烷基;

R5选自由以下组成的组:氢、卤代、羟基、羟基(C1-C6)烷基、氨基、 (C1-C6)烷基氨基、(C1-C6)二烷基氨基、氰基、硝基、磺酰基、氨基羰基、 氨基羰基(C1-C6)烷基、(C1-C6)烷基氨基、羧基、羧基(C1-C6)烷基、任选地 取代的(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的环烷基、 任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、烷基 氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6) 烷基,或与R4一起形成5至7元任选地取代的环烷基或任选地取代的杂环;

R8选自由以下组成的组:任选地取代的(C1-C6)烷基、任选地取代的 (C1-C6)烷氧基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取 代的芳基和任选地取代的杂芳基;

条件是当R2是氢,则以下的至少一个适用:

(i)R1不是氢、甲基、4-(甲氧基)苯基羰基-、4-(三氟甲氧基)苯磺 酰基-、3-溴苯基羰基-、3-氨基丙基、或3-(甲基羰基氨基)丙基-;

(ii)R4和R7各自彼此独立地不是氢或氯;

(iii)R5不是氢、羟基、甲基、甲氧基、氟、氯、三氟甲基、或氰基;

(iv)R6不是氢、羟基、甲氧基、氟或氯;或

(v)R8不是甲基、乙基、羟甲基-、或三氟甲基-。

因此,在一些实施方案中,用于制备式(Ia)的化合物的方法可包括在 适当的反应条件下在氨基供体的存在下,使式(IIa)的化合物与本文公开的 工程化转氨酶多肽接触

其中R1、R2、R4、R5、R6、R7、和R8如以上所定义。

在该方法的一些实施方案中,式(Ia)的化合物包括在以*标记的碳原子 上具有指定的立体化学的式(IaS)的化合物

其中化合物(IaS)以对映体过量来形成。在一些实施方案中,式(IaS) 的化合物以至少90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或更大的对映体过量来形成。

在该方法的一些实施方案中,以上式(I)的化合物包括式(Ia1)的化合物

其中

R1选自由以下组成的组:氢和(C1-C6)烷基;

R2选自由以下组成的组:氢、卤代、和(C1-C6)烷基;

R4、R5、R6、和R7各自彼此独立地选自由以下组成的组:氢、卤代、 羟基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、(C1-C6)烷基;氨基、 (C1-C6)烷基氨基、和(C1-C6)二烷基氨基;以及

R9选自由以下组成的组:卤代、羟基、羟基(C1-C6)烷基、氨基、(C1-C6) 烷基氨基、和(C1-C6)二烷基氨基;

条件是当R2是氢,则以下的至少一个适用:

(i)R1不是氢或甲基;

(ii)R4和R7各自彼此独立地不是氢或氯;

(iii)R5不是氢、羟基、甲基、甲氧基、氟、氯、或三氟甲基;

(iv)R6不是氢、羟基、甲氧基、氟或氯;或

(v)R9不是羟基。

因此,在一些实施方案中,用于制备式(Ia1)的化合物的方法可包括在 适当的反应条件下在氨基供体的存在下,使式(IIa1)的化合物与本文公开的 工程化转氨酶多肽接触

其中

R1、R2、R4、R5、R6、R7、和R9如以上所定义。

在该方法的一些实施方案中,式(Ia)的化合物包括式(Ia2)的化合物

其中

L是离去基团;

R10的每次出现彼此独立地选自由以下组成的组:卤代、羟基、氨基、 羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6) 烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、 任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、 任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰 基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、 任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、 任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选 地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选 地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧 基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地 取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰 基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选 地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基 (C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;

k为从3至5的整数;

n是1或2;以及

w是从0至4的整数。

在式(Ia2)的化合物的一些实施方案中,R10选自由以下组成的组:卤 代、羟基、羟基(C1-C6)烷基;氨基、(C1-C6)烷基氨基、(C1-C6)二烷基氨基、 任选地取代的(C1-C6)烷基;任选地取代的(C1-C6)烷氧基、烷基氨基磺酰基 (C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基。

因此,在一些实施方案中,用于制备式(Ia2)的化合物的方法可包括在 适当的反应条件下在氨基供体的存在下,使式(IIa2)的化合物与本文公开的 工程化转氨酶多肽接触,

其中

L、R10、k、n和w如以上所定义。

离去基团L可包括可被亲核的氨基取代的任何适当的基团。在一些实 施方案中,L选自氯、溴、烷氧基、芳氧基、烷基羰基氧基、芳基羰基氧 基、烷基硫代、芳基硫代、和-OPO3。在一些实施方案中,L是烷氧基, 其中烷基基团选自任选地取代的甲基、乙基、正丙基、正丁基、异丁基、 仲丁基、和叔丁基。在一些实施方案中,L是氯或溴。在一些实施方案中, k是3、4、或5。

如在方案3中所示,离去基团L在式((Ia2)的产物化合物中的存在允 许用于制备结构式(Ia3)的包含氮的杂环的产物化合物的环化:

在转氨酶反应的反应条件下,离去基团的适当选择允许直接形成结构 式(Ia3)的化合物,由此提供用于合成杂环的简易方法。在结构式(IIa2)的 范围内的各种底物化合物可被使用以制备结构式(Ia2)的相应产物化合物, 然后结构式(Ia2)的相应产物化合物用作用于制备结构式(Ia3)的范围内的 杂环的中间体。

在一些实施方案中,式(Ia3)的化合物包括式(Ia3’)的化合物,其可通过 使式(IIa2’)的化合物与本公开内容的转氨酶接触以制备式(Ia2’)的产物化 合物来制备,如方案4中所示:

其中L、R10、n和w如对于式(Ia2)的化合物所定义的。在一些实施方 案中,L是氯或溴。

环化式(Ia2’)的化合物产生式(Ia3’)的化合物。在一些实施方案中,环 化可在转氨酶反应的反应条件下进行,或在一些实施方案中,在转氨酶反 应结束后单独进行。

在该方法的一些实施方案中,式(I)的化合物包括式(Ib)的化合物,

其中

Z选自由以下组成的组:O、S、NH或-(CH2)m-,其中m是0、1、2 或3;

R1选自由以下组成的组:氢、羧基、羧基(C1-C6)烷基、任选地取代 的(C1-C6)烷基、任选地取代的(C2-C6)烯基、任选地取代的烷氧基羰 基、任选地取代的芳基羰基、任选地取代的芳基磺酰基、和保护基团;

R4、R5、R6和R7各自彼此独立地选自由以下组成的组:氢、卤代、 羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟 基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6) 烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6) 烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6) 烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基 羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代 的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂 芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基 硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取 代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧 基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的 杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基 羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳 基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;

条件是当Z为-(CH2)m-,m是1,且R1、R4、R6和R7是氢,则R5不 是氟。

在用于制备式(IIb)的化合物的方法的一些实施方案中,Z是-(CH2)m-, 其中m是1。

因此,在一些实施方案中,用于制备式(Ib)的化合物的方法包括在适 当的反应条件下在氨基供体的存在下,使式(IIb)的化合物与本公开内容的 工程化转氨酶多肽接触,

其中

Z、R1、R4、R5、R6、和R7如以上所定义。

在方法的一些实施方案中,式(Ib)的化合物包括在以*标记的碳原子上 具有指定的立体化学的式(IbS)的化合物,

其中化合物(IbS)以对映体过量来形成。在一些实施方案中,化合物 (IbS)以至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或更大的对映体过量来形成。

在该方法的一些实施方案中,式(Ib)的化合物包括式(Ib1)的化合物,

其中

R1选自由以下组成的组:氢、羧基(C1-C6)烷基、和(C1-C6)烷基;

R11的每次出现彼此独立地选自由以下组成的组:氯、溴、碘、羟基、 氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6) 烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、 任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、 任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰 基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、 任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、 任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选 地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选 地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧 基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地 取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰 基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选 地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基 (C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;以及

w为从0至4的整数。

在式(Ib1)的化合物的一些实施方案中,R11选自由以下组成的组:氨 基、氨基羰基、和氨基羰基(C1-C6)烷基。

因此,用于制备式(Ib1)的化合物的方法包括在适当的反应条件下在氨 基供体的存在下,使式(Ib1)的底物化合物与本公开内容的工程化转氨酶多 肽接触,

其中

R1、R11和w如以上所定义。

在方法的一些实施方案中,产物化合物可选自表3中的结构,其中胺 化合物(即,Ia3、Ia4、Ia5、Ia6、Ia7、Ia8、Ia9、Ia10、Ia11、Ia12、Ia13、 Ib2、Ib3、Ib4、Ib5或Ib6)可在适当的反应条件下通过使相应氨基受体 底物化合物(即,IIa3、IIa4、IIa5、IIa6、IIa7、IIa8、IIa9、IIa10、IIa11、 IIa12、IIa13、IIb2、IIb3、IIb4、IIb5或IIb6)与本文公开的工程化转氨 酶接触来制备。

表3

鉴于工程化酶的立体选择性,在一些实施方案中,该方法可被用于以 对映体过量制备表3中的在以*指示的碳上具有立体化学的手性胺化合物 (即,Ia3S、Ia4S、Ia5S、Ia6S、Ia7S、Ia8S、Ia9S、Ia10S、Ia11S、Ia12S、 Ia13S、Ib2S、Ib3S、Ib4S、Ib5S、或Ib6S)。在一些实施方案中,特定手 性化合物可以以至少90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%或更大的对映体过量来制备。

在一些实施方案中,工程转氨酶可被用于以对映体过量制备具有指示 的立体化学的式(1)的化合物,

因此,在一些实施方案中,用于以对映体过量制备式(1)的化合物的方法包 括在适当的反应条件下在氨基供体的存在下,使式(2)的化合物与本文描述 的工程化转氨酶多肽接触。

在该方法的一些实施方案中,式(1)的化合物可以以至少90%、91%、 92%、93%、94%、95%、96%、97%、98%、99%或更大的对映体过量来 形成。

对于本文中的实施方案,前手性酮底物化合物商购可得或可使用技术 人员可得的方法被合成。例如,1-(1H-吲哚-3-基)-丙-2-酮和4-(1H-吲哚-3- 基)-丁-2-酮商购可得。取代的酮底物可基于现有技术,例如WO2009132921 和Pradhan等人,2005,Synthetic Comm.35:913-922中描述的方法来合成。 用于合成吲哚上具有取代的酮底物的示例性方法示于方案5中,其中R5是R6是氢或卤素(例如,R5是F且R6是Cl):

在方案5中,取代的吲哚与三氯氧磷反应以产生吲哚-3-醛,然后将吲 哚-3-醛用硝基乙烷转化为取代的3-(2-硝基-丙烯基)-IH-吲哚。硝基烯氧化 水解为相应的酮用Fe-HCl来完成(参见上述Pradhan)。备选地,硝基烯可 被三烷基硼氢化物还原,并且将所得氮酸酯水解以产生酮(参见,例如, Kabalka等人,1999,Tetrahedron 46(21):7443-7457.

用于制备吲哚上具有取代的酮底物的另一种示例性方法示于方案6 中:

在方案6中,取代的吲哚在碳酸钾的存在下与氯乙酸乙酯反应以形成 取代的乙基-3-吲哚乙酸(参见,例如,Kumar等人,2010,Oriental J Chem. 26(2):455-466)。吲哚氮的保护随后是使用N,O-二甲基羟基胺向Weinreb 酰胺的转化。用格氏试剂(Grignard reagent)CH3-MgBr或有机锂试剂CH3-Li 的随后处理产生相应受保护的酮。基于酸的去保护产生5,6-取代的1-(1H- 吲哚-3-基)-丙-2-酮。

对于前述方法,可使用本文描述的任何工程化转氨酶。通过示例的方 法而非限制,在一些实施方案中,该方法可使用包括氨基酸序列的工程化 转氨酶多肽,所述氨基酸序列具有与选自以下的参考序列至少80%、85%、 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%或更多同一性:SEQ ID NO:4、6、8、10、12、14、16、18、20、 22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、 54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、 86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、 116、118、120、122、124、126、128、130、132、134、136、138、140、 142、144、146、148、150、152、和154,以及与SEQ ID NO:4相比在选 自以下的残基位置上的一个或更多个残基差异:X14;X26;X31;X33; X41;X47;X57;X70;X86;X88;X107;X132;X148;X163;X168; X173;X203;X250;X284;X314;X315;X324;X346;X395;X398; X400;X417;X419;X423;X448;和X451,其中在残基位置X31;X57; X86;X163;X168;X314;X324;X398;和X417上的残基差异选自: X31S;X57Y;X86D;X163I;X163L;X163R;X163V;X168S;X314N; X324H;X398L;X398V;X398W;和X417M。在一些实施方案中,参考 序列选自SEQ ID NO:4、8、14、16、132、134、和146。在一些实施方案 中,参考序列是SEQ ID NO:4。在一些实施方案中,参考序列是SEQ ID  NO:8。在一些实施方案中,参考序列是SEQ ID NO:134。在一些实施方案 中,参考序列是SEQ ID NO:146。

在该方法的一些实施方案中,以上具有与SEQ ID NO:4相比在残基位 置X14;X26;X31;X33;X41;X47;X57;X70;X86;X88;X107; X132;X148;X163;X168;X173;X203;X250;X284;X314;X315; X324;X346;X395;X398;X400;X417;X419;X423;X448;和X451 上的一个或更多个残基差异的工程化转氨酶多肽还可包括与SEQ ID NO:4 相比选自以下的一个或更多个残基差异:X57F;X113L;X113V;X168K; X420N;和X424V。

在一些实施方案中,能够进行本文中方法的示例性转氨酶可为包括选 自以下氨基酸序列的多肽:SEQ ID NO:6、8、10、12、14、16、18、20、 22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、 54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、 86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、 116、118、120、122、124、126、128、130、132、134、136、138、140、 142、144、146、148、150、152、和154。关于工程化转氨酶的选择和使 用的指导提供于本文的说明书中,例如表2和实施例。

在本文中的实施方案中并在实施例中所示,可使用的适当的反应条件 的各种范围,包括但不限于,氨基供体、pH、温度、缓冲液、溶剂系统、 底物载量、多肽载量、辅因子载量、压力、和反应时间的范围。用于使用 本文所述的工程化转氨酶多肽进行用于将底物化合物生物催化转化为产 物化合物的方法的另外的适当的反应条件可根据本文提供的指导易于通 过常规实验来优化,常规实验包括但不限于:使工程化转氨酶多肽与底物 化合物在浓度、pH、温度、溶剂条件的实验反应条件下接触,并检测产物 化合物。

在本文的一些实施方案中,转氨酶多肽使用氨基供体以形成产物化合 物。在一些实施方案中,在反应条件中的氨基供体可选自异丙胺(本文中 还称为“IPM”),腐胺、L-赖氨酸、α-苯乙胺、D-丙氨酸、L-丙氨酸、或D,L- 丙氨酸、或D,L-鸟氨酸。在一些实施方案中,氨基供体选自IPM、腐胺、 L-赖氨酸、D-丙氨酸或L-丙氨酸。在一些实施方案中,氨基供体是IPM。 在一些实施方案中,适当的反应条件包括氨基供体,特别是以以下浓度存 在的IPM:至少约0.1至约3M、0.2至约2.5M、约0.5至约2M或约1 至约2M。在一些实施方案中,氨基供体以以下浓度存在:约0.1、0.2、 0.3、0.4、0.5、0.6、0.7、0.8、1、1.5、2、2.5或3M。更高浓度的氨基供 体,例如IPM可被用于将平衡移向胺产物形成。

使用工程化转氨酶多肽的适当的反应条件通常还包括辅因子。用于本 文转氨酶有用的辅因子包括,但不限于,吡哆醛-5’-磷酸(还称为吡哆醛 磷酸、PLP、P5P)、吡哆醇(PN)、吡哆醛(PL)、吡哆胺(PM)、和它们 的磷酸化的对应物磷酸吡哆醇(PNP)、和磷酸吡哆胺(PMP)。在一些实 施方案中,辅因子PLP天然存在于细胞提取物,并且不需要被补充。在该 方法的一些实施方案中,适当的反应条件包括例如,当使用部分纯化的或 纯化的转氨酶时,加入至酶反应混合物中的外源性辅因子。在一些实施方 案中,适当的反应条件可以包括选自PLP、PN、PL、PM、PNP、和PMP 的辅因子以以下浓度的存在:约0.1g/L至约10g/L、约0.2g/L至约5g/L、 约0.5g/L至约2.5g/L。在一些实施方案中,反应条件包括以下的PLP浓 度:约0.1g/L或更少、0.2g/L或更少、0.5g/L或更少、1g/L或更少、2.5 g/L或更少、5g/L或更少、或10g/L或更少。在一些实施方案中,辅因子 可在反应开始时被添加和/或另外的辅因子在反应过程中被添加。

考虑到例如,产物化合物的需要量、底物浓度对酶活性的影响、酶在 反应条件下的稳定性、以及底物至产物的转化率百分比,在反应混合物中 的底物化合物可以被改变。在一些实施方案中,适当的反应条件包括以下 的底物化合物载量:至少约0.5至约200g/L、1至约200g/L、约5至约 150g/L、约10至约100g/L、约20至约100g/L、或约50至约100g/L。 在一些实施方案中,适当的反应条件包括以下的底物化合物载量:至少约 0.5g/L、至少约1g/L、至少约5g/L、至少约10g/L、至少约15g/L、至少 约20g/L、至少约30g/L、至少约50g/L、至少约75g/L、至少约100g/L、 至少约150g/L或至少约200g/L、或甚至更大。本文中提供的底物载量的 值是基于化合物(2)的分子量,然而还设想,等摩尔量的化合物(2)的各种水 合物和盐还可在方法中被使用。此外,由式(II)涵盖的底物化合物,包括式 (IIa)和(IIb)的化合物,还可根据针对化合物(2)使用的量以适当的量被使 用。

在进行本文描述的反应时,工程化转氨酶多肽可以以纯化的酶、用编 码酶的基因转化的整个细胞、和/或作为细胞提取物和/或此类细胞的溶解 产物被添加到反应混合物中。用编码工程化转氨酶的基因转化的整个细胞 或其细胞提取物、溶解产物和分离的酶可以多种不同的形式被使用,包括 固体(例如冻干的、喷雾干燥的以及类似的)或半固体(例如,粗糊料)。 细胞提取物或细胞溶解产物可通过沉淀(硫酸铵、聚乙烯亚胺、热处理或 类似方法),随后脱盐程序,之后冻干(例如,超滤、渗析以及类似的) 来部分地纯化。任何细胞制品可通过使用已知的交联剂,诸如例如戊二醛 交联而被稳定或固定至固相材料(例如,Eupergit C以及类似的)。

编码工程化转氨酶多肽的基因可被单独地转化进入宿主细胞或一起 转化进入同一宿主细胞。例如,在一些实施方案中,宿主细胞的一个集合 可用编码一种工程化转氨酶多肽的基因转化并且另一集合可用编码另一 工程化转氨酶多肽的基因转化。转化的细胞的两个集合可在反应混合物中 以整个细胞的形式或以从其得到的溶解产物或提取物的形式一起被使用。 在其他实施方式中,宿主细胞可用编码多个工程化转氨酶多塔的基因转 化。在一些实施方式中,工程化多肽可以分泌的多肽的形式被表达并且包 含分泌的多肽的培养介质可以被用于转氨酶反应。

本文公开的工程化转氨酶多肽的活性和/或立体选择性的改进,提供了 其中较高转化率百分比可用较低浓度的工程化多肽实现的方法。在方法的 一些实施方案中,适当的反应条件包括以下的工程化多肽浓度:约0.01至 约50g/L、约0.05至约50g/L、约0.1至约40g/L、约1至约40g/L、约2 至约40g/L、约5至约40g/L、约5至约30g/L、约0.1至约10g/L、约 0.5至约10g/L、约1至约10g/L、约0.1至约5g/L、约0.5至约5g/L、 或约0.1至约2g/L。在一些实施方案中,转氨酶多肽浓度为约0.01、0.05、 0.1、0.2、0.5、1、2、5、10、15、20、25、30、35、40或50g/L。

在氨基转移反应的过程中,反应混合物的pH可以变化。反应混合物 的pH可以被维持在期望的pH或在期望的pH范围内。这可通过在反应的 过程之前和/或期间加入酸或碱来实现。可选地,pH可以通过使用缓冲液 来控制。因此,在一些实施方案中,反应条件包括缓冲液。用于维持期望 的pH范围的适当的缓冲液是本领域已知的且包括,通过举例的方式而非 限制,硼酸盐缓冲液、碳酸盐缓冲液、磷酸盐缓冲液、三乙醇胺缓冲液(TEA) 和类似缓冲液。在一些实施方案中,缓冲液是硼酸盐。在方法的一些实施 方案中,适当的反应条件包括TEA的缓冲溶液,其中TEA浓度是从约0.01 至约0.4M、0.05至约0.4M、0.1至约0.3M、或约0.1至约0.2M。在一 些实施方案中,反应条件包括以下的TEA浓度:约0.01、0.02、0.03、0.04、 0.05、0.07、0.1、0.12、0.14、0.16、0.18、0.2、0.3、或0.4M。在一些实 施方案中,反应条件包括水作为适当的溶剂,没有缓冲液存在。

在方法的一些实施方案中,反应条件可包括适当的pH。期望的pH或 期望的pH范围可通过使用酸或碱、适当的缓冲液、或缓冲液和酸或碱添 加的组合来维持。反应混合物的pH可在反应的过程之前和/或期间被控制。 在一些实施方案中,适当的反应条件包括从约6至约12的溶液pH、从约 6至约10的pH、从约6至约8的pH、从约7至约10的pH、从约7至约 9的pH、或从约7至约8的pH。在一些实施方案中,反应条件包括约6、 6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、11.5或12的溶液pH。

在本文方法的实施方案中,例如,考虑到:在较高的温度下增加的反 应速率、以及在反应时间段期间酶的活性,适当的温度可用于反应条件。 例如,本公开内容的工程化多肽具有相对于天然存在的转氨酶多肽例如 SEQ ID NO:2的野生型多肽增加的稳定性,这允许工程化多肽以较高的温 度使用,用于增加的转化率和改进的底物可溶性特性。因此,在一些实施 方案中,适当的反应条件包括以下的温度:约10℃至约70℃、约10℃至 约65℃、约15℃至约60℃、约20℃至约60℃、约20℃至约55℃、约30℃ 至约55℃、或约40℃至约50℃。在一些实施方案中,适当的反应条件包 括约10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、 60℃、65℃、或70℃的温度。在一些实施方案中,酶促反应过程中的温度 可在整个反应过程中保持在一个温度,或在反应期间被调节遍及温度分 布。

本文方法一般在溶剂中进行。适当的溶剂包括水、缓冲水溶液、有机 溶剂、聚合溶剂、和/或共溶剂系统,其通常包括含水溶剂、有机溶剂和/ 或聚合溶剂。含水溶剂(水或含水的共溶剂系统)可以是pH缓冲的或无 缓冲的。在一些实施方案中,方法通常在包括有机溶剂(例如,乙醇、异 丙醇(IPA)、二甲基亚砜(DMSO)、乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、 辛烷、甲基叔丁基醚(MTBE)、甲苯以及类似物)、离子或极性溶剂(例 如,1-乙基4-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑鎓四氟硼酸盐、 1-丁基-3-甲基咪唑鎓六氟磷酸盐、甘油、聚乙二醇以及类似物)的含水共 溶剂系统中进行。在一些实施方案中,共溶剂可以是极性溶剂,诸如多元 醇、二甲亚砜、DMSO、或低级醇。含水共溶剂系统的非含水共溶剂组分 可以是与含水组分易混溶的,提供单一的液相,或可以是与含水组分部分 地易混溶的或不易混溶的,提供两个液相。示例性含水共溶剂系统可包括 水和选自有机溶剂、极性溶剂、和多元醇溶剂的一种或更多种共溶剂。通 常,选择含水共溶剂系统的共溶剂组分使得其在反应条件下不会不利地使 转氨酶失活。适当的共溶剂系统可通过使用酶活性测定,诸如本文描述的 那些,用界定的感兴趣的底物在候选溶剂系统中测量特定的工程化转氨酶 的酶促活性来容易地确定。

在方法的一些实施方案中,适当的反应条件包括含水的共溶剂,其中 该共溶剂包括聚合多元醇溶剂。适当的多元醇溶剂的实例包括,通过举例 的方式而非限制,聚乙二醇、聚乙二醇甲醚、二甘醇二甲醚、三甘醇二甲 醚、和聚丙二醇。在一些实施方案中,含水共溶剂包括聚乙二醇,其以不 同的分子量可用。特别有用的是较低分子量聚乙二醇,诸如PEG200至 PEG600。因此,在一些实施方案中,含水共溶剂包括约1%至约40%v/v、 约1%至约40%v/v、约2%至约40%v/v、约5%至约40%v/v、约2%至约 30%v/v、5%至约30%v/v、1%至约20%v/v、约2%至约20%v/v、约5% 至约20%v/v、约1%至约10%v/v、约2%至约10%v/v的PEG200。在一 些实施方案中,适当的反应条件包括含水共溶剂,该含水共溶剂以以下包 括PEG200:约1%、2%、5%、10%、15%、20%;25%;30%;35%;35% 或约40%v/v。

在方法的一些实施方案中,适当的反应条件包括含水的共溶剂,其中 该共溶剂以以下包括DMSO:约1%至约80%(v/v)、约1至约70%(v/v)、 约2%至约60%(v/v)、约5%至约40%(v/v)、10%至约40%(v/v)、10%至约 30%(v/v)、或约10%至约20%(v/v)。在方法的一些实施方案中,适当的反 应条件包括含水共溶剂,该含水共溶剂以以下包括DMSO:至少约1%、 5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、 65%、70%、75%、或80%(v/v)。

用于转氨基反应的反应物的量将一般取决于期望的产物的量、和伴随 地使用的转氨酶底物的量而不同。本领域普通技术人员将容易地理解如何 改变这些量以使它们适合期望的水平的生产率和生产规模。

在一些实施方案中,加入反应物的顺序不是关键的。可在相同的时间 将反应物一起加到溶剂中(例如单相溶剂、双相含水共溶剂系统以及类似 物),或可选地,反应物中的一些可以被单独地添加,并且一些反应物在 不同的时间点一起添加。例如,辅因子、转氨酶和转氨酶底物可以被先加 到溶剂中。

可以多种不同的形式,包括粉末(例如冻干的、喷雾干燥的和类似粉 末),溶液,乳液,悬浮液和类似形式向反应提供固体反应物(例如酶、 盐、底物化合物等)。使用本领域普通技术人员已知的方法和装置可容易 地冻干或喷雾干燥反应物。例如,蛋白溶液可在-80℃以小份冷冻,然后加 到预冷的冻干室中,随后应用真空。

当含水的共溶剂系统被使用时,为了改进混合效率,转氨酶和辅因子 可被首先加入并混合进入水相。然后可加入有机相并混合,随后加入转氨 酶底物。可选地,在加入水相之前,转氨酶底物可以在有机相中预混合。

通常允许转氨反应进行直到酮底物向胺产物的进一步转化不随反应 时间显著变化,例如小于10%的底物被转化,或小于5%的底物被转化)。 在一些实施方案中,允许反应进行直到存在底物酮向产物胺的完全或接近 完全的转化。底物向产物转化可以使用已知的方法通过检测底物和/或产物 来监测。适合的方法包括气相色谱法、HPLC和类似方法。反应混合物中 产生的手性胺产物的转化收率通常大于约50%,还可大于约60%,还可大 于约70%,还可大于约80%,还可大于90%并且还可大于约97%。在一些 实施方案中,用于在适当的反应条件下使用工程化转氨酶多肽制备化合物 (2)的方法导致在约48h或更短、约36h或更短、约24h或更短、或甚至 更短的时间内将至少约91%、92%、93%、94%、95%、96%、97%、98%、 99%或更大量酮底物,例如式(II)的化合物,转化至胺产物化合物例如式(I) 的化合物。

在方法的一些实施方案中,适当的反应条件包括至少约20g/L、30g/L、 40g/L、50g/L、60g/L、70g/L、100g/L、或更多的底物载量,并且其中 该方法导致在约48h或更短、约36h或更短、约24h或更短内将至少约 91%、92%、93%、94%、95%、96%、97%、98%、99%或更大量的底物 化合物转化至产物化合物。

当在适当的反应条件下在该方法中使用时,本公开内容的工程化转氨 酶多肽导致以至少90%、91%、92%、93%、94%、95%、97%、98、99%、 99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、或99.9%. e.e的手性胺的对映体过量。

在方法的另外的实施方案中,适当的反应条件可包括反应溶液的初始 底物载量,然后该反应溶液被多肽接触。然后该反应溶液还随着时间以至 少约1g/L/h、至少约2g/L/h、至少约4g/L/h、至少约6g/L/h、或更高的 速率补充另外的底物化合物作为连续增加物。因此,根据这些适当的反应 条件,添加多肽至具有至少约20g/L、30g/L、或40g/L的初始底物载量 的溶液。多肽的该添加然后随后是以约2g/L/h、4g/L/h、或4g/L/h的速 率连续添加另外的底物至溶液,直到达到至少约30g/L、40g/L、50g/L、 60g/L、70g/L、100g/L、150g/L、200g/L或更多的高的多的最终底物载 量。因此,在方法的一些实施方案中,适当的反应条件包括将多肽添加至 具有至少约20g/L、30g/L、或40g/L的初始底物载量的溶液中,然后以 约2g/L/h、4g/L/h、或6g/L/h的速率添加另外的底物至溶液中,直到达 到至少约30g/L、40g/L、50g/L、60g/L、70g/L、100g/L或更多的最终 底物载量。该底物补充反应条件允许获得更高底物载量,同时维持高速率 将酮底物向胺产物至少约91%、92%、93%、94%、95%、96%、97%、98%、 99%或更大的转化。在方法的一些实施方案中,在以至少约0.5M、至少约 1.0M、至少约2.5M、至少约5M、至少约7.5M、至少约10.0M的浓度 包含异丙胺或乙酸异丙胺的溶液中添加另外的底物。

在方法的一些实施方案中,转氨反应可包括以下适当的反应条件:(a) 以约5g/L至200g/L的底物载量;(b)约0.1至50g/L的转氨酶多肽;(c) 约0.1至4M的异丙胺(IPM);(d)约0.1至10g/L的磷酸吡哆醛(PLP)辅因 子;(e)约6至9的pH;以及(f)约30℃至60℃的温度。

在方法的一些实施方案中,转氨反应可包括以下适当的反应条件:(a) 以约5至约20g/L的底物载量;(b)约0.05至2g/L的转氨酶多肽;(c)约1 至10%v/v的PEG200;(d)约1至2M的异丙胺(IPM);(e)约0.1至1g/L 的磷酸吡哆醛(PLP)辅因子;(f)约0.1至约0.5M的三乙醇胺(TEA);(g)约 6至8的pH;以及(h)约45℃至55℃的温度。

在方法的一些实施方案中,转氨反应可包括以下适当的反应条件:(a) 约25至约100g/L的底物载量;(b)约0.5至10g/L的转氨酶多肽;(c)约1 至10%v/v的PEG200;(d)约1至2M的异丙胺(IPM);(e)约0.1至1g/L 的磷酸吡哆醛(PLP)辅因子;(f)约0.1至约0.5M的三乙醇胺;(g)约6至8 的pH;以及(h)约45℃至55℃的温度。

在一些实施方案中,进行另外的反应组分或另外的技术以补充反应条 件。这些可包括采取措施以稳定或阻止酶的失活、减少产物抑制、和/或使 反应平衡向产物胺形成转移。

因此,在用于制备胺,诸如手性胺的方法的一些实施方案中,可添加 另外的量的氨基受体(达到饱和)和/或可连续地从反应混合物中除去形成 的氨基受体(酮)。例如,溶剂桥或两相共溶剂系统可被用于除去提取液 的胺产物,并且由此减少胺产物的抑制,且还将平衡移向产物形成(参见, 例如,Yun和Kim,2008,Biosci.Biotechnol.Biochem.72(11):3030-3033)。

在方法的一些实施方案中,适当的反应条件包括还原型辅因子、烟酰 胺腺嘌呤二核苷酸(NADH)的存在,其可用来限制转氨酶的失活(参见例 如,van Ophem等人,1998,Biochemistry 37(9):2879-88)。在这样的实施 方案中,当NADH存在时,辅因子再生系统,诸如葡萄糖脱氢酶(GDH) 和葡萄糖或甲酸脱氢酶和甲酸盐可被用于再生反应介质中的NADH。

在一些实施方案中,方法还可包括当氨基基团被转移到氨基受体时, 除去从氨基供体形成的羰基副产物。此类原位除去可降低逆反应的速率, 使得正向反应占优势,并且更多底物然后被转化为产物。羰基副产物的除 去可以以许多方式进行。当氨基供体是氨基酸,诸如丙氨酸时,羰基副产 物是酮酸,可通过与过氧化物反应而被除去(参见,例如,美国 2008/0213845,通过引用并入本文)。可使用的过氧化物包括过氧化氢;过 氧酸类(过酸)诸如过乙酸(CH3CO3H)、三氟过乙酸和间氯过氧苯甲酸; 有机过氧化物诸如叔丁基过氧化物((CH3)3COOH)或其他选择性氧化剂 诸如四丙基高钌酸铵、MnO2、KMnO4、四氧化钌和相关化合物以及其他。 可选地,丙酮酸盐的去除可通过利用乳酸脱氢酶将其还原为乳酸盐来实 现,以将平衡转向产物胺(参见,例如,Koszelewski等人,2008,Adv.Syn. Catal.350:2761-2766)。丙酮酸盐的去除还可通过利用丙酮酸脱羧酶(参见, 例如,等人,2008,Chem BioChem 9:363-365)或乙酰乳酸合酶(参 见,例如,上述Yun和Kim)将其脱羧来实现。

可选地,在氨基酸用作氨基供体的实施方案中,酮酸羰基副产物可通 过使用适当的脱氢酶例如氨基酸脱氢酶在氨基供体诸如氨的存在下与氨 和NADH反应来再循环为氨基酸,从而补充氨基供体。

在一些实施方案中,当氨基供体的选择产生具有比水的蒸气压高的蒸 气压的羰基副产物(例如,低沸点副产物诸如挥发性有机羰基化合物)时, 羰基副产物可通过用非反应性气体喷射反应溶液,或通过施加真空来降低 反应压力,并除去气相中存在的羰基副产物来除去。非反应性气体是不与 反应组分起反应的任何气体。各种非反应性气体包括氮气和稀有气体(例 如,惰性气体)。在一些实施方案中,非反应性气体是氮气。在一些实施 方案中,该方法中使用的氨基供体是异丙胺(IPM),其在向氨基受体转移氨 基之后形成羰基副产物丙酮。丙酮可通过用氮气喷射或向反应溶液施加真 空,并通过丙酮阱诸如冷凝器或其他冷阱从气相除去丙酮来除去。可选地, 丙酮可通过使用转氨酶还原为异丙醇来除去。

在以上除去羰基副产物的方法的一些实施方案中,在氨基转移反应期 间可加入相应氨基供体以补充氨基供体和/或维持反应的pH。补充氨基供 体还将平衡转移向产物形成,由此增加底物向产物的转化率。因此,在氨 基供体是异丙胺并且丙酮产物被原位除去的一些实施方案中,可向溶液加 入异丙胺以补充丙酮除去期间失去的氨基供体并维持反应的pH。

在另外的实施方案中,任何以上描述的用于将底物化合物转化为产物 化合物的方法还可包括选自以下的一种或更多种步骤:产物化合物的提 取、分离、纯化、和结晶。用于从通过以上公开的方法产生的生物催化反 应混合物中提取、分离、纯化、和/或结晶产物胺的方法、技术和试验方案 是普通技术人员已知的和/或通过常规实验可获得的。另外,例证性的方法 在下面的实施例中提供。

本公开内容的各种特征和实施方案在以下代表性实施例中被说明,代 表性实施例意图是说明性的而非限制性的。

6.实施例

实施例1:工程化转氨酶多肽的合成、优化和筛选

基因合成与优化:编码来自SEQ ID NO:2的河流弧菌的经报道的野生 型ω-转氨酶多肽的多核苷酸序列被密码子优化并合成为SEQ ID NO:1的 基因。将SEQ ID NO:1的合成的基因克隆进入pCK110900载体系统(参见 例如,美国专利申请公布20060195947,该申请在此通过应用并入本文)并 且随后于大肠杆菌W3110fhuA中表达。大肠杆菌W3110在lac启动子的 控制下表达转氨酶多肽作为细胞内蛋白。编码SEQ ID NO:4的工程化转氨 酶多肽的多核苷酸(SEQ ID NO:3)通过定向进化密码子优化的基因SEQ ID  NO:1来获得。相对于SEQ ID NO:2,SEQ ID NO:4的多肽具有24个氨基 酸残基差异(A9T;G18A;D21H;V31M;N45H;F86Y;A133R;R146L; W147K;V153S;K163F;V177L;R211K;P233T;A235P;P244T;M294V; P318D;A323T;S324G;A383V;T391A;C424A;和F427Y)。该合成的 基因SEQ ID NO:3(编码SEQ ID NO:4的多肽)被用作起始骨架用于使 用定向进化的标准方法经由通过基因合成的迭代变体文库产生,随后筛选 和测序匹配(hits)来进一步优化以产生编码能够以相对于SEQ ID NO:2 和4的多肽的增强的酶特性将化合物(2)转化为化合物(1)的工程化转氨酶 的基因。所得的工程化转氨酶多肽序列和特定突变及相对活性列于表2A 中。

实施例2:生产工程化转氨酶

工程化转氨酶多肽在宿主大肠杆菌W3110中作为在lac启动子的控制 下表达的细胞内蛋白产生。多肽主要累积为可溶性的细胞溶质的活性酶 (soluble cytosolic active enzyme)。摇瓶程序用于产生工程化多肽粉,其可 在本文公开的活性测定或生物催化方法中使用。

高通量生长与表达。细胞被挑选并在30℃,200rpm,85%湿度的培养 条件下在包含1%葡萄糖和30μg/ml氯霉素(CAM)的LB培养基中生长 过夜。将过夜生长的20μl等分部分转移至包含380μl的包含30μg/ml  CAM、1mM IPTG的2xYT生长培养基的深孔板,且在30℃,200rpm, 和85%湿度下温育持续~18h。传代培养TB培养基由TB培养基(380μl/ 孔)、30μg/ml CAM、和1mM IPTG组成。细胞培养物以4000rpm、4℃ 离心10min,并丢弃培养基。将细胞团块再悬浮在250或400μl溶解缓冲 液(0.1M三乙醇胺(TEA)缓冲液、pH 9.0,包含400μg/ml PMBS和500 μg/ml溶菌酶)中,如以下所述。

生产摇瓶粉(SFP)。摇瓶程序用于产生在本文公开的二次筛选测定或生 物催化方法中使用的工程化转氨酶多肽粉。摇瓶粉(SFP)包括大约30%总蛋 白并因此提供与HTP测定中使用的细胞溶解产物相比更纯化的工程化酶 制剂。将包含编码感兴趣的工程化转氨酶的质粒的大肠杆菌的单菌落接种 到包含30μg/ml氯霉素和1%葡萄糖的50mL Luria Bertani肉汤中。细胞在 培养箱(incubator)中在30℃下以250rpm摇动生长过夜(至少16小时)。 将培养物稀释到1升烧瓶中包含30μg/ml氯霉素的250mL Terrific Broth (12g/L细菌用胰蛋白胨、24g/L酵母提取物、4mL/L甘油、65mM磷酸 钾,pH 7.0、1mM MgSO4)中,至600nm的光密度(OD600)为0.2,并 允许在30℃生长。当培养物的OD600是0.6至0.8时,通过加入异丙基-β-D- 硫代半乳糖苷(“IPTG”)至终浓度1mM来诱导转氨酶基因的表达。然后 培养持续过夜(至少16小时)。通过离心(5000rpm、15min、4℃)收获 细胞,并丢弃上清液。将细胞团块用等体积的冷(4℃)100mM三乙醇胺 (氯化物)缓冲液,pH 7.0再悬浮,并如以上通过离心来收获。洗涤的细 胞再悬浮于两体积的冷三乙醇胺(氯化物)缓冲液中,并且以12,000psi 经过French Press两次,同时保持在4℃。通过离心(9000rpm、45分钟、 4℃)除去细胞碎片。收集澄清的溶解产物上清液,并储存在-20℃。冷冻 的澄清溶解产物的冷冻干燥提供了粗制转氨酶多肽的干摇瓶粉。可选地, 细胞团块(洗涤前或洗涤后)可储存在4℃或-80℃。

生产下游处理(DSP)粉。DSP包括大约80%总蛋白并因此提供与高 通量测定中使用的细胞溶解产物相比更纯化的工程化转氨酶制剂。用于生 产DSP粉的工程化转氨酶的较大规模(~100-120g)发酵可作为短分批进 行,随后根据标准生物加工方法通过进料分批法进行。简言之,通过添加 IPTG至1mM的最终浓度来诱导转氨酶表达。在发酵之后,收获细胞,并 将其再悬浮在100mM三乙醇胺-H2SO4缓冲液中,然后通过匀化而被机械 破裂。细胞碎片和核酸用聚乙烯亚胺(PEI)絮凝,并通过离心使悬浮液 澄清。使用切向横流超滤膜浓缩所产生的澄清上清液以除去盐和水。然后 浓缩的和部分纯化的酶浓缩物可在冷冻干燥器中干燥并被包装(例如,在 聚乙烯容器中)。

实施例3:分析程序

HTP反应的HPLC分析:对淬灭反应的等分部分在以下条件下进行 HPLC分析。

化合物(2)至化合物(1)的转化由产生的色谱图来如下确定:

转化率(%)=产物面积/(产物面积+底物面积x 0.73)x 100%

5mL和100mL规模反应的HPLC分析:对淬灭反应的等分部分在以 下条件下进行HPLC分析。

化合物(2)至化合物(1)的转化由色谱图来如下确定:

转化率(%)=产品面积/(产物面积+底物面积x 0.73)x 100%

确定产物手性纯度(%ee):化合物(1)的手性纯度或对映体过量使用以 下条件通过HPLC来评估。

确定产物纯度:产物纯度使用以下条件通过HPLC来确定。

实施例4:高通量(HTP)筛选用于将化合物(2)转化至化合物(1)的转氨 酶

HTP筛选测定:用于指导变体的主要筛选的高通量筛选在96孔板中 使用细胞溶解产物在以下测定条件下进行:10g/L化合物(2);1mM吡哆 醛磷酸(PLP);2M异丙胺(IPM),pH 7.0;0.1M三乙醇胺(TEA),pH 7; 5%v/v PEG200;10μL溶解产物;和50℃或55℃。

为了制备溶解产物,细胞如以上所述生长在96孔板中,并且溶解产 物通过分配250μL(用于第1轮)或400μL(用于第2轮)的溶解缓冲液 (1mg/mL溶菌酶、0.5mg/mL硫酸多粘菌素B、1mM PLP、0.1M三乙醇 胺(TEA),pH 7.0)进入各孔来制备。将板密封、振摇2h,并且然后以4,000 rpm、4℃离心20min以沉淀细胞碎片。

将10μL的贮备底物溶液(200g/L溶解于PEG200中的化合物(2))添 加至96孔板的各孔,随后是180μL的异丙胺(IPM)/吡哆醛磷酸(PLP)的贮 备溶液(100mM TEA中的2.2M IPM和1.06mM PLP,pH 7.0)。为了评 估对产物化合物(1)抑制的耐受性,将化合物(1)添加至反应混合物至最终 14g/L用于第1轮测定并且16g/L用于第2轮测定。反应通过添加10μL 的细胞溶解产物/孔来启动。将板密封,并在50℃或55℃下以震摇温育24 h。反应用600μL的乙腈来淬灭,并且样品通过HPLC来检查,如实施例 3中所述的。

实施例5:用于在5mL规模中将化合物(2)转化为化合物(1)的方法

如下进行5ml规模反应。将0.75mL(或在10%v/v PEG 200浓度的 情况下0.5mL)的100mM TEA buffer(pH 7.0)添加至配备了十字形的磁性 搅拌棒的20mL玻璃小瓶中。将2mL的5M IPM·HCl贮备溶液添加至小 瓶,随后是1mL的5mM PLP贮备溶液。以500rpm搅动(磁搅动)混合 物。然后使用1M NaOH溶液将混合物的pH调整至7。然后将固体底物 125mg(或250mg对于50g/L,或500mg对于100g/L浓度)添加至小瓶。 然后将0.25mL(或0.5mL对于10%v/v)PEG 200添加至混合物。组分的终 浓度为:25g/L(或50或100g/L)的化合物(2);1mM PLP;2M IPM;5%v/v (或10%)PEG 200;2g/L转氨酶制品;和100mM TEA,pH 7.0。然后将 混合物搅动并加热至50℃。

反应通过添加1mL的酶贮备溶液(10g/L)来启动。在不同的时间点采 取20μL的等分部分并用750μL甲醇稀释,且通过HPLC进行分析。24h 后,反应混合物用5mL乙腈来淬灭,并通过HPLC分析样品以获得最终% 转化。

实施例6:用于在100mL规模中将化合物(2)转化为化合物(1)的方法

如下进行100ml规模反应。将15mL的100mM TEA缓冲液(pH 7) 添加至具有锚形搅拌叶的250mL圆底烧瓶中。将40mL的5M IPM·HCl 贮备溶液添加至圆底烧瓶,随后是20mL的5mM PLP贮备溶液。以100 rpm搅拌混合物(顶置式搅拌),并使用10M NaOH将pH调整至7。然后 伴随搅拌经~5min将固体底物化合物(2)添加至圆底烧瓶。然后添加 PEG200(5mL),并将混合物加热至50℃。然后添加20mL的酶贮备溶液(10 g/L)以启动反应。以200rpm搅动(顶置式搅动)反应。在不同的时间点 采取20μL的等分部分并用750μL甲醇稀释,且通过HPLC进行分析。在 某些情况下,24h后,反应混合物用100mL乙腈来淬灭,并通过HPLC 分析样品以获得最终%转化。最终反应条件为:底物化合物(2),25g/L(或 50或100g/L);1mM PLP;2M IPM;5%v/v PEG200;2g/L的转氨酶; 和100mM TEA,pH 7。底物至产物的转化通过HPLC进行分析,如实施 例3中所述。

产物处理:在以上描述的条件下反应24h后,将反应混合物冷却至室 温,并然后通过具有滤纸片(Whatman 1,孔径11μm)的标准G4烧结玻璃 漏斗过滤。用20mL去离子水冲洗圆底烧瓶,然后将其通过同一漏斗过滤。 用20mL去离子水洗涤过滤的滤饼两次。使用5M HCl溶液将滤液的pH 从6.8调整至3。然后将滤液转移进入分液漏斗并用100mL MTBE进行萃 取。允许两相混合物分离。丢弃包含未反应底物和杂质的MTBE层。将水 层转移进入烧杯,并添加100mL MTBE。使用10M NaOH溶液将水层的 pH从3调整至10。将混合物转移进入分液漏斗并且使相分离。然后用100 mL MTBE萃取水层直到产物不存在于水层(~三次萃取)。将来自萃取的 MTBE相合并并使用旋转蒸发器蒸干。将粗制产物在真空下进一步干燥48 h。

在本申请中引用的所有出版物、专利、专利申请和其他文件出于所有 目的均通过引用以其整体并入本文,其程度如同分别指出将每个单独的出 版物、专利、专利申请或其它文件出于所有目的通过引用并入一样。

尽管已经阐释和描述了各种具体实施方案,但应理解可以作出各种改 变而不背离本发明的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号