首页> 中国专利> 用于非核糖体肽合成酶和聚酮合成酶的适配器系统

用于非核糖体肽合成酶和聚酮合成酶的适配器系统

摘要

本发明涉及用于表达非核糖体肽合成酶(NRPS)、聚酮合成酶(PKS)或NRPS/PKS杂合合成酶的系统。NRPS、PKS或它们的杂合体是大型多结构域蛋白质或多结构域复合物,其用于生产肽的表达通常会造成困难。因此,本发明涉及用于表达酶片段的系统,所述酶片段可以通过特异性引入的蛋白质‑蛋白质相互作用在翻译后组装而形成功能性多酶复合物。本发明公开了这种组件的蛋白质片段以及它们的编码核酸。还公开了本发明蛋白质片段的载体系统及其用于制备功能性NRPS/PKS酶复合物的用途。

著录项

  • 公开/公告号CN114829591A

    专利类型发明专利

  • 公开/公告日2022-07-29

    原文格式PDF

  • 申请/专利权人 法兰克福大学;

    申请/专利号CN202080089042.0

  • 申请日2020-11-12

  • 分类号C12N9/00(2006.01);

  • 代理机构广州文冠倪律知识产权代理事务所(普通合伙) 44348;广州文冠倪律知识产权代理事务所(普通合伙) 44348;

  • 代理人何锦标;张玉颖

  • 地址 德国法兰克福市

  • 入库时间 2023-06-19 16:11:11

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-11-15

    实质审查的生效 IPC(主分类):C12N 9/00 专利申请号:2020800890420 申请日:20201112

    实质审查的生效

说明书

技术领域

本发明涉及用于表达非核糖体肽合成酶(nichtribosomale Peptidsynthetasen,NRPS)、聚酮合成酶(Polyketidsynthasen,PKS)或NRPS/PKS杂合合成酶的系统。NRPS、PKS或它们的杂合体是大型多结构域蛋白质或多结构域复合物,其用于生产肽的表达通常会造成困难。因此,本发明涉及用于表达酶片段的系统,所述酶片段可以通过特异性引入的蛋白质-蛋白质相互作用在翻译后组装而形成功能性多酶复合物。本发明公开了这种组件的蛋白质片段以及它们的编码核酸。还公开了本发明蛋白质片段的载体系统及其用于制备功能性NRPS/PKS酶复合物的用途。

说明

非核糖体肽(NRP)是由非核糖体肽合成酶(NRPS)产生的肽,具有很大的结构多样性,其特征尤其是环状的、分支的或其他复杂的一级结构(Caradec et al., 2014;Cabocheet al., 2010)。由于其结构复杂性,其中许多分子表现出治疗特性,包括抗生素、免疫抑制或抗癌作用模式(Finking und Marahiel, 2004;Felnagle et al., 2008)。因此,它们不仅是新药物的来源,而且用作药物试剂的基本结构(Cane et al., 1998)。为此,天然物质通常通过半合成进行化学修饰,半合成是一种结合生物合成和有机合成的过程(Kirschning und Hahn, 2012)。或者,也可以通过重新编程负责合成的NRPS来产生新的NRP。为此,合成酶的模块化结构经常被开发和基因改造。文献中已知一些成功重新编程NRPS的例子(Schneider et al., 1998;Chiocchini et al., 2006)。然而,这些合成酶的生产率通常受到严重限制(Suo, 2005)。

NRP的结构和功能多样性是D-氨基酸(Aminosäuren,AS)、杂环元素或N-甲基化侧链以及添加脂肪、糖和卤素的结果(Hur et al., 2012)。具有这种结构特性的NRP的例子例如是带有杂环的杆菌肽和弧菌素,或特征在于掺入D-AS的环孢菌素A和短杆菌素A。另一方面,达托霉素是一种乙酰化肽,由于其脂肪酸,具有很强的抗菌作用;而Balhimycin和丁香霉素是卤代NRP的例子,具有抗菌和抗真菌特性。

SYNZIP是异种特异性合成卷曲螺旋(coiled coil),可实现受控的蛋白质相互作用,并用于合成生物学。卷曲螺旋通常由两个、三个或四个两亲的20-50个AS长的α螺旋组成,它们形成交织在一起的左手超螺旋。它们是许多蛋白质的结构基序,并且也出现在例如人类bZIP转录因子的亮氨酸拉链区域中。卷曲螺旋的特征在于七联体模式(abcdefg)

SYNZIP最初是为与人类bZIP转录因子(TF)的亮氨酸拉链区域的异种特异性相互作用而开发的。为此,基于计算机构建了48种人工肽,随后研究了它们与这些肽的相互作用(Grigoryan et al., 2009)。另一方面,在进一步的研究中,还测试了这些肽与彼此的相互作用。为此,Reinke等人进行了蛋白质微阵列测定,其中对所有48种人工卷曲螺旋以及7种进一步的人类bZIP的卷曲螺旋进行了相互测试(图1)。从测定结果中,选择了27对(23种合成的(即SYNZIP 1-23)和3种人类bZIP结构),它们显示出强烈的异种特异性相互作用,并同时显示出低同种特异性相互作用。如图1A所示,肽参与至少1到最多7种相互作用,并且在某些情况下可以形成不同的网络(图1B)。这些的示例是线性、环形、分支和正交网络(Thompson et al., 2012)。此外,从a-a'位置上的Asn-Asn配对得出的结论是,大多数配对必须是平行异二聚体(Reinke et al., 2010)。

国际公开号WO 2019/138117描述了一种用于组装和修饰NRPS的系统。该系统使用新颖的、精确定义的构建块(单元),其中包含缩合子结构域。这种策略能够有效组合称为交换单元(eXchange Unit,XU2.0)的组件,而不管它们对随后的NRPS腺苷酸化结构域的自然发生特异性如何。WO 2019/138117的系统能够简单地组装具有合成具有任何氨基酸序列的肽的活性的NRPS,而不受天然存在的NRPS单元的限制。该系统还使得可以用根据本发明的XU2.0交换天然NRPS构建块,由此产生修饰的肽。尽管该系统允许XU2.0单元的简单组合,但它仍然需要在开放阅读框(ORF)中表达组装的NRPS蛋白。这会导致问题,尤其是在NRP较长的情况下。

因此,本发明的目的是生产NRPS模块或子模块(或结构域),例如来自WO 2019/138117的XU2.0单元,其是高效且灵活地重组的。

发明简述

一般而言,通过简要描述,本发明的主要方面可以描述如下:

在第一方面,本发明涉及一种蛋白质或蛋白质片段,其至少包含非核糖体肽合成酶(NRPS)、聚酮合成酶(PKS)或NRPS/PKS杂合合成酶的第一结构域或部分结构域(第一PKS-NRPS结构域),其中所述蛋白质或蛋白质片段具有包含第一结合结构域的N末端或C末端,并且其中该第一结合结构域优选分别代表所述蛋白质或蛋白质片段的N末端或C末端,并且其中所述第一结合结构域的特征在于能够与至少一个相应的第二结合结构域进入特异性蛋白质-蛋白质结合的特性。

在第二方面,本发明涉及一种分离的核酸构建体,其包含第一编码区,该第一编码区具有编码第一方面的蛋白质或蛋白质片段的核酸序列。

在第三方面,本发明涉及一种用于产生功能性NRPS或PKS的载体系统,其中所述载体系统包含至少一个根据第二方面的核酸构建体,并且其中所述至少一个核酸构建体适合于表达至少两种根据第一方面的蛋白质或蛋白质片段,并且其中所述至少两种蛋白质或蛋白质片段是不同的并且一起形成功能性NRPS、PKS或NRPS/PKS杂合体。

在第四方面,本发明涉及一种用于产生功能性(完整)NRPS或PKS的方法,包括至少使根据第一方面的第一蛋白质或蛋白质片段与根据第一方面的第二蛋白质或蛋白质片段接触,其中第一蛋白质或蛋白质片段具有末端第一结合结构域,并且其中第二蛋白质或蛋白质片段具有末端第二结合结构域而非末端第一结合结构域。

发明详述

本发明的元素如下所述。这些元素通过具体实施方案进行描述。然而,不言而喻,本发明的元素可以以任何方式和以任何数量彼此组合以获得另外的实施方案。各种描述的示例和优选实施方案不应被解释为将本发明仅限制于明确描述的实施方案或示例。本公开应当被理解为描述和包括将两个或更多个明确描述的实施方案或元素彼此组合,或者将一个或多个明确描述的实施方案与任意数量的公开和/或优选的元素组合的实施方案。此外,除非上下文或技术上下文另有说明或许可,否则本申请中描述的所有元素的所有排列和组合应视为由本申请的描述所公开。

术语“部分结构域”或“部分C或C/E结构域”或“子结构域”或类似术语,是指编码NRPS-PKS结构域或其不完整(非全长)的蛋白质序列的核酸序列。在本文中,该术语应理解为表示与全长结构域相比,部分结构域具有全长结构域的连续序列的至少20%、优选30%或40%或更多的连续比例。因此,部分结构域相对于全长结构域的序列的连续部分(至少20%、优选30%或40%或更多)具有非常高程度的序列同一性(90%和更多)。例如,该表达描述了不包含NRPS-C或C/E结构域的供体和受体位点的C或C/E结构域序列。NRPS的部分结构域具有例如100或更多、150或更多、或约200个氨基酸的序列长度。

“集合(Zusammenstellung)”是指多个结构域。多个NRPS/PKS组件包括完整的NRPS-PKS。一个或多个多肽可以包含模块。模块组合然后组合催化更长的肽。在一个实例中,模块可以包含C结构域(缩合结构域)、A结构域(腺苷酸化结构域)和肽基载体蛋白结构域。

有关A结构域、C结构域、双结构域、结构域-结构域接口和完整模块的更多结构信息,可以参见Conti et al. (1997)、Sundlov et al. (2013)、Samel et al. (2007)、Tanovic et al. (2008)、Strieker and Marahiel (2010)、Mitchell et al. (2012)以及Tan et al. (2015)。

“起始模块”是指可以将第一个单体转移到另一个模块(例如,扩展或最终模块)的N末端模块。在某些情况下,该另外的模块不是第二模块,而是C末端方向的后续模块之一(例如在诺卡霉素NRPS的情况下)。在NRPS的情况下,起始模块包括例如A(腺苷酸化)结构域和PCP(肽基载体蛋白)或T(硫醇化)结构域。起始模块还可以包含起始C结构域和/或E结构域(差向异构化结构域)。在PKS中,可能的起始模块由AT结构域(乙酰转移酶)和ACP结构域(酰基载体蛋白)组成。起始模块优选位于“装配线”的第一个模块的多肽的氨基末端。每个装配线优选地包含起始模块。

术语“延伸模块”或“延长模块”是指将供体单体添加到受体单体或受体聚合物中,从而延长肽链的模块。延伸模块可以包含C(缩合)、Cy(杂环化)、E、C/E、MT(甲基转移酶)、A-MT(组合的腺苷酸化和甲基化结构域)、Ox(氧化酶)或Re(还原酶)结构域;A结构域;或T结构域。延伸结构域可以进一步包含额外的E、Re、DH(脱水)、MT、NMet(N-甲基化)、AMT(氨基转移酶)或Cy结构域。此外,延伸模块可以是PKS来源的并且可以包含各个结构域(酮合酶(KS)、酰基转移酶(AT)、酮还原酶(KR)、脱水酶(DH)、烯酰还原酶(ER)、硫醇化(T))。

“终止模块”是指从装配线中释放或解耦分子(例如,NRP、PK或其组合)的模块。该分子可以例如通过水解或环化而被释放。终止模块可以包含TE(硫酯酶)、Cterm(末端C结构域)或Re结构域。终止模块优选位于NRPS或PKS多肽的羧基末端。终止模块可进一步包含额外的酶活性(例如寡聚酶活性)。

“结构域”是指具有一种或多种特定酶活性的多肽序列或较大多肽序列的片段(即,C/E结构域在结构域中具有C和E功能或另一种保守功能(即,作为ACP或T结构域的结合功能)。因此,单个多肽可以包含多个结构域。多个结构域可以形成模块。结构域的例子是C(缩合)、Cy(杂环化)、A(腺苷酸化)、T(硫醇化)、TE(硫酯酶)、E(差向异构化)、C/E(缩合/差向异构化)、MT(甲基转移酶)、Ox(氧化酶)、Re(还原酶)、KS(酮合酶)、AT(酰基转移酶)、KR(酮还原酶)、DH(脱水酶)和ER(烯酰还原酶)。

“非核糖体合成肽”、“非核糖体肽”或“NRP”是指任何不是由核糖体产生的多肽。NRP可以是线性的、环状的或分支的,并且可以含有蛋白质天然或非天然氨基酸,或它们的任何组合。NRP包括在某种组装线或装配线(=酶系统的模块化特征,可以将构建块逐渐添加到最终产品中)中生产的肽。

“聚酮(化合物)”是指包含多个酮单元的化合物。

“非核糖体肽合成酶”或“非核糖体肽合酶”或“NRPS”是指一种多肽或一组相互作用的多肽,它们产生非核糖体肽,因此可以在没有核糖体成分的情况下催化肽键的形成。“聚酮合酶”(PKS)是指不需要核糖体成分而产生聚酮化合物的多肽或一组多肽。

“非核糖体肽合成酶/聚酮合成酶杂合体”或“非核糖体肽合成酶和聚酮合成酶的杂合体”或“NRPS/PKS杂合体”或“NRPS和PKS的杂合体”或“PKS和NRPS的杂合体”和其他相应的表述是指包含NRPS和PKS的任何结构域或模块的酶系统。这种杂合体催化天然杂合体物质的合成。

“结构变化”是指与参考结构相比,化学键(例如共价键或非共价键)发生的任何变化。

“突变”是指核酸序列发生变化,使得该核酸序列编码的氨基酸序列与天然存在的序列相比至少有一个氨基酸变化。突变可以但不限于是插入、缺失、移码突变或错义突变。该术语还描述了由突变核酸序列编码的蛋白质。

“变体”是与参考序列具有至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、或99%序列同一性的多肽或多核苷酸。序列同一性通常使用序列分析软件测量(例如,来自Genetics Computer Group, Biotechnologiezentrum der UniversitätWisconsin, 1710 University Avenue, Madison, Wisconsin, USA). 53705的序列分析软件包,程序:BLAST、BESTFIT、gap或PILEUP/PRETTYBOX)。这种类型的软件通过将同源度分配给各种取代、缺失和/或其他修饰(取代/评分矩阵:例如PAM、Blosum、GONET、JTT)来匹配相同或相似的序列。

在第一方面,本发明涉及一种蛋白质或蛋白质片段,其至少包含非核糖体肽合成酶(NRPS)、聚酮合成酶(PKS)或NRPS/PKS杂合合成酶的第一结构域或部分结构域(第一PKS-NRPS结构域),其中所述蛋白质或蛋白质片段具有包含第一结合结构域的N末端或C末端,并且其中该第一结合结构域优选分别代表所述蛋白质或蛋白质片段的N末端或C末端,并且其中所述第一结合结构域的特征在于能够与至少一个相应的第二结合结构域进入特异性蛋白质-蛋白质结合的特性。

在本公开的意义上,蛋白质或蛋白质片段优选是包含这样的氨基酸序列的多肽,所述氨基酸序列与NRPS/PKS的连续部分及其一个或多个模块以及其蛋白质部分具有高序列同一性。

在本申请的上下文中,术语“结合结构域”旨在表示能够与其他多肽序列形成特异性或非特异性共价或非共价键的多肽元件、结构域或序列。在一个具体实施方案中,第二结合结构域是内源性NRPS/PKS序列,其能够例如并且优选与根据本发明的SYNZIP相互作用。对于本发明的目的,优选与其他相应的结合结构域发生特异性结合相互作用的结合结构域。在本发明的上下文中,这些也称为蛋白质相互作用结构域(PID)。例如,这些可以是负责蛋白质同二聚体或异二聚体形成的多肽结构域。这些类型的结构域例如是卷曲螺旋结构域、CH3结构域和亮氨酸拉链结构域。特别优选所谓的SYNZIP结构域。

卷曲螺旋蛋白相互作用结构域是本领域已知的。用于创建此类PID的计算机程序的若干非限制性实施例包括SOCKET(例如,如Walshaw & Woolfson, J. Mol. Gen. Biol,2001; 307 (5), 1427–1450中所述,可在布里斯托大学伍尔夫森集团的网站上获得)、COILS(例如,如Lupas et al., Science. 1991; 252: 1162-1164中所述并通过引用并入本公开,可从ch. EMBnet.org网站获得)、PAIRCOIL(例如,如Berger et al., Proc Natl.Acad. Sci. UNITED STATES OF AMERICA. 1995; 92, 8259-8263中所述,可从群组csail.mit.edu/cb/paircoil/cgi-bin/paircoil.cgi获得)以及 MULTICOIL(例如由Wolfet al., Protein Sci. 1997; 6: 1179-1189描述,可从群组csail.mit.edu/cb/multicoil/cgi-bin/multicoil cgi网站获得。

在一些实施方案中,形成卷曲螺旋的PID是Müller et al., Methods Enzymol.2000; 328, 261(其通过引用整体并入本公开)在表I中描述的那些PID。例如,形成卷曲螺旋的PID包含亮氨酸拉链(例如,如在蛋白质GCN4、Fos、Jun、C/EBP及其变体或突变体中)、肽“Velcro”(例如,如O'Shea et al., Curr Biol. 1993;3(10): 658-67所述)、E-Coil/K-Coil(例如,如Tripet et al., Protein Eng. 1996; 9, 1029所述)和WinZip-A2和WinZip-Bl(例如,Arndt et al., Structure. 2002; (9): 1235-48所述)。

在一些实施方案中,形成卷曲螺旋的PID是称为SYNZIP的异种特异性合成卷曲螺旋肽,例如SYNZIP 1-22。Thompson KE, et al: "SYNZIP protein interaction toolbox:in vitro and in vivo specifications of heterospecific coiled-coil interactiondomains." (ACS Synth Biol. 2012 Apr 20;1(4): 118-29.)(该文件通过引用整体并入本公开)公开了SYNZIP 1-22的详细信息。在一些实施方案中,在C或N末端融合到NRPS-PKS结构域或子结构域的PID是SYNZIP 17(NEKEELKSKKKAELRNRIEQLKQKREQLKQKIANLRKEIEAYK,SEQ ID NO: 1)和/或SYNZIP 18(SIAATLENDLARLENARLEKDIANLAKLEREEAYEAYEAYEF,SEQ IDNO: 2)。可以在本发明的上下文中用作结合结构域对的SYNZIP的其他组合列于图1的矩阵中。

在一些实施方案中,本公开所考虑的PID包括在多伦多西奈山医院(Mount SinaiHospital)的Tony Pawson博士的网站上公开的那些。例如,PID包括14-3-3结构域、ADF结构域、ANK重复、ARM重复、amphiphysin的bar结构域、BEACH结构域、Bcl-2同源结构域(BH)(例如BH1、BH2、BH3、BH4)、BIR结构域、BRCT结构域、溴区结构域、BTB/POZ结构域、CI结构域、C2结构域、半胱天冬酶募集结构域(CARD)、具有网格蛋白组件的淋巴髓样(CALM)结构域、钙调蛋白同源(CH)结构域、染色质组织修饰剂(CHROMO/Chr)结构域、CUE结构域、死亡(DD)结构域、死亡效应子(DED)结构域、DEP结构域、Dbl同源(DH)结构域、EF手(EFh)结构域、Epsl5同源(EH)结构域、epsin NH2末端同源(ENTH)结构域、Ena/Vasp同源结构域1(EVH1结构域)、F-Box结构域、FERM结构域、FF结构域、Formin同源结构域2(FH2)、Forkhead相关结构域(FH)、FYVE(Fab-1、YGL023、Vps27和EEA1结构域、GAT(GGA和Toml)结构域、Gelsolin/Severin/Villin同源(GEL)结构域、GLUE(来自EAP45中的革兰样泛素结合结构域)结构域、GRAM(来自葡糖基转移酶)、Rab样结构域、GTP酶激活剂和肌管蛋白结构域、GRIP结构域、甘氨酸-酪氨酸-苯丙氨酸结构域(GYF)、HEAT结构域(来自亨廷顿,延伸因子3,PR65/A,TOR)、HECT结构域(与E6-AP羧基末端结构域同源)、IQ结构域、LIM结构域、富含亮氨酸的重复结构域(LRR结构域)、恶性脑肿瘤结构域(MBT结构域)、Mad同源1结构域(MH1结构域)、MH2结构域、MIU结构域(来自与泛素相互作用的基序)、NZF结构域(Npl4锌指)结构域、PAS结构域(Per-ARNT-Sim结构域)、Phox和Beml结构域(PB1结构域)、PDZ结构域(来自postsynaptischer Dichte 95,PSD-85; große Scheiben, Dig; Zonula occludens-1, ZO-1)ns、Pleckstrin同源结构域(PH结构域)、Polo Box结构域、磷酸酪氨酸结合结构域(PTB结构域)、Pumilio结构域(Puf结构域)、PWWP结构域、Phox同源结构域(PX结构域)、RGS结构域(G蛋白信号传导的调节子)、RING指结构域、SAM结构域(无菌Alpha基序)、影子染色质(Schatten-Chromo)结构域(CSD或SC结构域)、Src同源2结构域(SH2结构域)、Src同源3结构域(SH3结构域)、SOCS结构域(来自细胞因子信号通路抑制因子)、SPRY结构域、START(类固醇生成急性调节蛋白(StAR)相关脂质转移的)结构域、SWIRM结构域、Toll/11-1受体(TIR)结构域、四肽重复(TPR)基序结构域、TRAF结构域、SNARE结构域(可溶性NSF结合蛋白受体(SMAP受体)的)(例如T-SNARE)、Tubby结构域、Tudor结构域、泛素相关结构域(UBA)、UEV结构域(泛素E2变体)、泛素相互作用基序(UIM)结构域、Hippel-Lindau肿瘤抑制蛋白的β结构域(VHLP)、VHS结构域(Vps27p、Hrs和STAM的)、WD40重复结构域和WW结构域。

PID可以通过或不通过接头连接到根据本发明的蛋白质或蛋白质片段的C或N末端。不言而喻,任何PID和任何接头都可以与本发明的方面兼容。在一些实施方案中,接头是柔性的。接头可以由氨基酸组成。在一些实施方案中,接头由1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或超过50个氨基酸组成。在一些实施方案中,接头由5-7个氨基酸组成。在一些实施方案中,接头是例如Gly-Ser接头。

根据本发明的蛋白质或蛋白质片段优选包含SYNZIP作为第一和/或第二结合结构域,其中SYNZIP选自SYNZIP 1-23,优选选自SYNZIP 1、2、17、18或19。在一些实施方案中,优选这样的蛋白质或蛋白质片段,其中与第一结合结构域相反的末端包含第三结合结构域,并且其中第三结合结构域的特征在于能够进入与至少一个相应的第四结合结构域的特异性蛋白质-蛋白质结合的特性。优选地,第一和第二结合结构域不能与第三和第四结合结构域结合。通过这样的结构,可以根据本发明产生NRPS/PKS蛋白质,其由三个或更多个单独的多肽(根据本发明的蛋白质或蛋白质片段)组成。

在优选的实施方案中,与原始序列相比,来自Thompson KE等人的SYNZIP序列在C末端和/或N末端可以具有截短(Verkürzung)。这种截短理想地位于N和/或C末端,即与原始序列相比,氨基酸在N或C末端被移除,而剩余的序列不改变。在优选的实施方案中,SYNZIP的至少7个、优选至少10个氨基酸总是保留。在本发明上下文中使用的SYNZIP对的情况下,根据本发明,两个SYNZIP或者只有一个SYNZIP可以以截短的形式存在。

截短优选涉及1至15个氨基酸并且可以发生在C和/或N末端。更短的SYNZIP使组装的NRPS更接近天然构型,因为在正常情况下的连接点包含少得多的氨基酸。更优选地,截短的长度为1至10个氨基酸。例如,NRPS SYNZIP序列的N末端的截短可以涉及9个氨基酸,而NRPS SYNZIP序列的C末端的截短包括2个氨基酸。这在图16中对SYNZIP对SZ1和SZ2或SZ19和SZ2进行了说明。但是,SYNZIP序列的截短不得导致SYNZIP对的配对属性的损失。

还优选的是,第一和第二结合结构域可以与第三或第四结合结构域选择性地(gezielt)结合,从而可以形成肽混合物。

与蛋白质或蛋白质片段有关的术语“端/末端”是指氨基酸聚合物的相应末端。游离氨基端称为“N末端”,游离羧基端称为“C末端”。如果一个特征,例如序列或结构域或其他元件,排列在N末端或C末端,这意味着相应的特征构成了整个蛋白质的最后一个N末端或C末端部分,因此表示N末端或C末端。

在一个具体实施方案中,根据本发明的蛋白质或蛋白质片段进一步包含至少一个、优选两个、三个或四个或更多个另外的PKS和/或NRPS结构域,其中所述另外的PKS和/或NRPS结构域以直接功能排列(direkter funktioneller Anordnung)的方式排列在第一PKS-NRPS结构域旁边。直接功能排列意味着这些结构域可以在空间上进行肽或肽/聚酮化合物的NRPS/PKS合成。

在一个优选的实施方案中,蛋白质或蛋白质片段不包含至少一个相应的第二结合结构域。在该实施方案中,第二结合结构域位于根据本发明的第二蛋白质或蛋白质片段中,从而根据本发明的第一和第二、优选还有其他的蛋白质或蛋白质片段然后形成一组根据本发明的蛋白质或蛋白质片段。根据本发明的这组蛋白质或蛋白质片段被设计成使得功能性NRPS或PKS或其杂合体可以通过结合结构域的方式的特异性或非特异性结合在翻译后组装。

在本发明的一个优选实施方案中,第一结合域以这样的方式排列在末端,使得与对应的第二结合结构域的特异性或非特异性介导的相互作用/结合在正常条件下是可能的。在这种情况下,第二结合结构域将存在于根据本发明的第二蛋白质或蛋白质片段中。在这种情况下,NRPS/PKS结构域的组成将在本发明的第一和第二蛋白质或蛋白质片段中不同。

根据本发明的第一PKS-NRPS结构域或部分结构域选自本领域技术人员已知的任何NRPS和/或PKS结构域。这些优选选自A结构域、C结构域、C/E结构域、E结构域、C

根据权利要求12或13所述的蛋白质或蛋白质片段,其中所述第三结合结构域通过接头序列与所述蛋白质或蛋白质片段偶联。

前述权利要求中任一项所述的蛋白质或蛋白质片段,其中第一结合结构域与第二结合结构域的结合是非共价结合。

在第二方面,本发明涉及一种分离的核酸构建体,其包含第一编码区,所述第一编码区具有编码第一方面的蛋白质或蛋白质片段的核酸序列。

术语“核酸”是指天然的、半合成的或完全合成的以及修饰的由脱氧核糖核苷酸和/或核糖核苷酸和/或修饰的核苷酸组成的核酸分子,例如“肽核酸”(PNA)、“锁定的核酸”(LNA)或“硫代磷酸酯”。也可能存在核苷酸间磷酸酯和核糖或糖组分的其他修饰。

所谓的“编码区”是指本发明的核酸构建体中的序列元件,其根据遗传密码编码可表达的蛋白质。

在本发明的核酸构建体的一个实施方案中,第一编码区与表达启动子可操作地连接。表达启动子表示启动RNA转录所必需并且优选足够的核酸元件。这些元件是本领域技术人员已知的。根据表达系统,可以选择这样的启动子。

在另一个实施方案中,本发明的核酸构建体包含第二编码区,该第二编码区具有编码根据本发明的蛋白质或蛋白质片段的核酸序列,并且其中第一编码区和第二编码区编码不相同的根据本发明的蛋白质或蛋白质片段。

在另一个实施方案中,本发明的核酸构建体可以包含一个或多个其他元件,用于蛋白质或蛋白质片段的重组表达或表达强度或时间的控制。

在第三方面,本发明涉及用于产生功能性NRPS或PKS或NRPS-PKS杂合体的载体系统,其中所述载体系统包含至少一个根据第二方面的核酸构建体,并且其中所述至少一个核酸构建体适合于表达至少两种根据第一方面的蛋白质或蛋白质片段,并且其中所述至少两种蛋白质或蛋白质片段是不同的并且一起形成功能性NRPS、PKS或NRPS/PKS杂合体。因此,所述至少两种蛋白质或蛋白质片段可以通过一个或两个核酸构建体表达,或者如果它们是根据本发明的三种或更多种蛋白质或蛋白质片段,则它们通过一个、两个或三个核酸构建体表达。以此类推。本发明的载体系统仅需要作为整体提供足够的编码区,以表达所需数量的根据本发明的蛋白质或蛋白质片段。

本发明的载体系统的一个优选实施方案涉及这样一种载体系统,其中可以通过核酸构建体表达的至少两种蛋白质或蛋白质片段通过第一和/或第二结合结构域之间的结合形成功能性NRPS、PKS或NRPS/PKS杂合体。这意味着根据本发明的载体系统至少部分包含那些能够通过结合结构域形成功能性NRPS/PKS的可表达的蛋白质或蛋白质片段。

优选地,功能性NRPS、PKS或NRPS/PKS杂合体可以合成线性肽、环状肽、线性聚酮化合物、环状聚酮化合物、线性肽-聚酮化合物或环状肽-聚酮化合物。

在进一步的实施方案中,优选载体系统包含核酸构建体,其适合于表达至少三种或更多种根据本发明的蛋白质或蛋白质片段,或者其中所述三种或更多种蛋白质或蛋白质片段中的至少两种一起形成功能性NRPS、PKS或NRPS/PKS杂合体。此外,所述至少三种蛋白质或蛋白质片段可以一起形成功能性NRPS、PKS或NRPS/PKS杂合体,其中功能性NRPS或PKS是通过以下方式形成的:通过使第一结合结构域与第二结合结构域结合,并使第三结合结构域与第四结合结构域结合,使蛋白质或蛋白质片段彼此结合。在这种情况下,可能更优选的是,第一蛋白质或蛋白质片段具有末端第一结合结构域和相反的末端第三结合结构域,并且第二蛋白质或蛋白质片段具有末端第二结合结构域,以及第三蛋白质或蛋白质片段具有末端第四结合结构域。

本发明的优选载体系统被设计成使得用于组装根据本发明的NRPS/PKS的结合结构域被布置成位于NRPS/PKS结构域之间。结合结构域的优选排列,特别是SYNZIP的优选排列,可以在实施例中找到,并且仅以中间方式概括了所公开的掺入SYNZIP的位置。

在第四个方面,本发明涉及一种用于产生功能性(完整)NRPS或PKS、或NRPS/PKS杂合体的方法,包括至少使根据第一方面的第一蛋白质或蛋白质片段与根据第一方面的第二蛋白质或蛋白质片段接触,其中所述第一蛋白质或蛋白质片段具有末端第一结合结构域,并且其中所述第二蛋白质或蛋白质片段具有末端第二结合结构域而非末端第一结合结构域。作为进一步的步骤,该方法可以包括通过至少一个本发明的核酸构建体重组表达所述第一和/或第二蛋白质或蛋白质片段。

此处使用的术语“(本)发明”、“根据本发明”和类似术语旨在指代所描述和/或要求保护的发明的所有方面、要素和实施方案。

如在本公开中使用的,术语“包括”旨在被解释为包括“包含”和“由……组成”,其中这两个含义是特别旨在的,因此代表根据本发明的单独公开的实施方案。术语“和/或”被理解为对所指示的两个特征或组件中的每一个的具体公开(有或没有另一个)。例如,“A和/或B”应被理解为对(i)A、(ii)B和(iii)A和B中的每一个的具体公开,就好像在此单独公开一样。在本发明的上下文中,术语“大致”和“大约”表示本领域技术人员应该在框架内理解的准确度区间,以仍然确保所讨论的特征的技术效果。当指代单个名词时使用不定冠词或特定冠词,例如“一个/一种”或“所述”,这种使用包括该名词的复数,除非另有明确说明。

不言而喻,本发明的教导的应用可以应用于特定的问题或环境,并且本发明的变体或附加特征(例如进一步的方面和实施方案)的包括在本领域普通技术人员的能力范围内并且根据本文所包含的教导。

除非上下文另有要求,否则上述特征的描述和定义不限于本发明的任何特定方面或实施方案,并且同样适用于所描述的所有方面和实施方案。

本文引用的所有参考文献、专利和出版物均在此全文引用。

鉴于上述情况,应注意本发明还涉及以下详细且标号的主题:

主题1:一种蛋白质或蛋白质片段,其至少包含非核糖体肽合成酶(NRPS)、聚酮合成酶(PKS)或NRPS/PKS杂合合成酶的第一结构域或部分结构域(第一PKS-NRPS结构域),其中所述蛋白质或蛋白质片段具有包含第一结合结构域的N末端或C末端,并且其中该第一结合结构域优选分别代表所述蛋白质或蛋白质片段的N末端或C末端,并且其中所述第一结合结构域的特征在于能够与至少一个相应的第二结合结构域进入特异性蛋白质-蛋白质结合的特性。

主题2:根据主题1所述的蛋白质或蛋白质片段,其进一步包含至少一个、优选两个、三个或四个或更多个另外的PKS-NRPS结构域,其中所述另外的PKS-NRPS结构域以直接功能排列的方式排列在所述第一PKS-NRPS结构域旁边。

主题3:根据主题1或2所述的蛋白质或蛋白质片段,其中所述蛋白质或蛋白质片段不包含所述至少一个相应的第二结合结构域。

主题4:根据主题1至3中任一项所述的蛋白质或蛋白质片段,其中第一结合结构域以这样的方式排列在末端,使得与相应的第二结合结构域的特异性或非特异性介导的相互作用/结合在正常条件下是可能的。

主题5:根据主题1至4中任一项所述的蛋白质或蛋白质片段,其中所述第一PKS-NRPS结构域或部分结构域选自A结构域、A-MT结构域、C结构域、C/E结构域、E结构域、C

主题6:根据主题1至5中任一项所述的蛋白质或蛋白质片段,其至少包含A或A-MT结构域、C结构域和/或E结构域或C/E结构域或Cy结构域、以及T结构域,优选地其中所述蛋白质或蛋白质片段具有至少一个NRPS-PKS延伸模块。

主题7:根据主题1至6中任一项所述的蛋白质或蛋白质片段,其中所述结合结构域是蛋白质序列,优选是介导特异性蛋白质-蛋白质结合的蛋白质结构域。

主题8:根据主题1至7中任一项所述的蛋白质或蛋白质片段,其中所述结合结构域包含卷曲螺旋结构域。

主题9:根据主题8所述的蛋白质或蛋白质片段,其中所述结合结构域包含合成卷曲螺旋结构域(SYNZIP)。

主题10:根据主题9所述的蛋白质或蛋白质片段,其中所述SYNZIP选自SYNZIP 1-23,优选选自SYNZIP 1、2、17、18或19。所述蛋白质或蛋白质片段在与第一结合结构域相反的末端包含第三结合结构域,其中第三结合结构域的特征在于能够与至少一个相应的第四结合结构域进入特异性蛋白质-蛋白质结合的特性。

主题11:根据主题11所述的蛋白质或蛋白质片段,其中第一和第二结合结构域不能结合第三和第四结合结构域。

主题12:根据主题11所述的蛋白质或蛋白质片段,其中第一和第二结合结构域能够选择性地结合第三或第四结合结构域,以形成肽混合物。

主题13:根据主题1至12中任一项所述的蛋白质或蛋白质片段,其中第一结合结构域通过接头序列与第一PKS-NRPS结构域连接。

主题14:根据主题12或13所述的蛋白质或蛋白质片段,其中第三结合结构域通过接头序列与蛋白质或蛋白质片段偶联。

主题15:根据前述主题中的一项所述的蛋白质或蛋白质片段,其中第一结合结构域与第二结合结构域的结合是非共价结合。

主题16:一种分离的核酸构建体,其包含第一编码区,所述第一编码区具有编码主题1至15中任一项所述的蛋白质或蛋白质片段的核酸序列。

主题17:根据主题16所述的分离的核酸构建体,其中第一编码区与表达启动子可操作地连接。

主题18:根据主题16或17所述的分离的核酸构建体,其进一步包含具有编码主题1至15中任一项所述的蛋白质或蛋白质片段的核酸序列的第二编码区,其中第一编码区和第二个编码区编码不相同的蛋白质或蛋白质片段。

主题19:根据主题1至18中任一项所述的分离的核酸构建体,其包含用于重组表达蛋白质或蛋白质片段的其他元件。

主题20:一种用于产生功能性NRPS或PKS的载体系统,其中所述载体系统包含至少一个根据主题16至20中任一项所述的核酸构建体,并且其中所述至少一个核酸构建体适合于表达至少两种根据主题1至15中任一项所述的蛋白质或蛋白质片段,并且其中所述至少两种蛋白质或蛋白质片段是不同的并且一起形成功能性NRPS、PKS或NRPS/PKS杂合体。

主题21:根据主题20所述的载体系统,其中所述至少两种蛋白质或蛋白质片段通过第一和第二结合结构域的结合而形成功能性NRPS、PKS或NRPS/PKS杂合体。

主题22:根据主题20或21所述的载体系统,其中功能性NRPS、PKS或NRPS/PKS杂合体可以合成线性肽、环状肽、线性聚酮化合物、环状聚酮化合物、线性肽-聚酮化合物或环状肽-聚酮化合物。

主题23:根据主题20至22中任一项所述的载体系统,其中所述载体系统包含适于表达至少三种或更多种根据主题1至15中任一项所述的蛋白质或蛋白质片段的核酸构建体,或者其中所述三种或更多种蛋白质或蛋白质片段中的至少两种一起形成功能性NRPS、PKS或NRPS/PKS杂合体。

主题24:根据主题23所述的载体系统,其中所述至少三种蛋白质或蛋白质片段一起形成功能性NRPS、PKS或NRPS/PKS杂合体,其中通过将第一结合结构域与第二结合结构域结合并将第三结合结构域与第四结合结构域结合,使所述蛋白质或蛋白质片段彼此结合,从而形成所述功能性NRPS或PKS。

主题25:根据主题23或24所述的载体系统,其中第一蛋白质或蛋白质片段具有末端第一结合结构域和相反的末端第三结合结构域,并且其中第二蛋白质或蛋白质片段具有末端第二结合结构域,并且其中第三蛋白质或蛋白质片段具有末端第四结合结构域。

主题26:一种用于产生功能性(完整)NRPS或PKS的方法,包括至少使根据主题1至15中任一项所述的第一蛋白质或蛋白质片段与根据主题1至1至15中任一项所述的第二蛋白质或蛋白质片段接触,其中第一蛋白质或蛋白质片段具有末端第一结合结构域,并且其中第二蛋白质或蛋白质片段具有末端第二结合结构域而非末端第一结合结构域。

主题27:根据主题26所述的方法,其中所述接触包括通过至少一个根据主题16至19中任一项所述的核酸构建体重组表达所述第一和/或第二蛋白质或蛋白质片段。

附图和序列的简要描述

附图显示了:

图1:显示了SYNZIP相互作用伙伴和可能的网络。A)形成特异性相互作用对的26种肽的蛋白质微阵列分析结果。固定在微阵列表面上的肽显示在行中。溶液中的荧光标记的肽排列在列中。根据阵列评分(如右图所示),黑点表示强荧光信号(0-0.2),白点表示弱荧光信号(>1.0)。红色对角线表示不存在同种特异性相互作用。显示阵列评分≤0.2的相互作用以绿色突出显示。强相互作用伙伴的数量显示在下栏(Reinke et al., 2010)。B)显示了可能的SYNZIP相互作用网络:1. 线性网络 2. 环形网络 3. 分支网络和 4. 正交网络与相应的SYNZIP编号。虚线表示弱相互作用,实线表示强相互作用。星号突出显示了SYZIP17和SYNZIP18之间的反平行相互作用(Thompson et al., 2012)。

图2:显示了用于生产新型肽的AmbS杂合体的构建。A:来自AmbS(黑色)和GxpS(红色)的XU的NRPS杂合体(NRPS-3a和NRPS-3b)的示意图。从三次测量得到的肽7、8和9的相关的相对肽产量以百分比显示。符号代表结构域:圆圈,A结构域;矩形,T结构域;三角形,C结构域;菱形,C/E结构域;C末端的小圆圈,TE结构域。螺旋线代表SZ:橙色,SZ17;绿色,SZ18。B:产生的肽的结构。

图3:显示了用于生产新型肽的SzeS杂合体的构建。A:来自SzeS(绿色)和GxpS(红色)的XU的NRPS杂合体(NRPS-4a和NRPS-4b)和共价连接的杂合体(NRPS-4c)的示意图。从三次测量得到的肽10和11的相关的相对肽产量以百分比显示。符号代表结构域:圆圈,A结构域;矩形,T结构域;三角形,C结构域或FT结构域;菱形,C/E结构域;C末端的小圆圈,TE结构域。螺旋线代表SZ:橙色,SZ17;绿色,SZ18。B:产生的肽的结构。

图4:显示了用于生产新型肽的XldS杂合体的构建。A:来自XldS(绿松石色)和GxpS(红色)的XU的NRPS杂合体(NRPS-5a和NRPS-5b)的示意图。从三次测量得到的肽12、13、14和15的相关的相对肽产量以百分比显示。符号代表结构域:圆圈,A结构域;矩形,T结构域;三角形,C结构域;菱形,C/E结构域;C末端的小圆圈,TE结构域。螺旋线代表SZ:橙色,SZ17;绿色,SZ18。B:产生的肽的结构。

图5:显示了基于XtpS的各种切割位点和SZ寡聚状态的概念证明。在T-C(NRPS-13)、A-T(NRPS-14)和C-A(NRPS-15和 NRPS-16)中分开的XtpS(浅绿色)以及具有不同的SZ寡聚状态的构建体(NRPS-15和NRPS-16)的示意图。WT-XtpS(NRPS-1)用作参考。从三次测量得到的肽1和2的相对产量以WT水平的百分比给出。符号代表结构域:圆圈,A结构域;矩形,T结构域;三角形,C结构域;菱形,C/E结构域;C末端的小圆圈,TE结构域。螺旋线代表SZ:橙色,SZ17;绿色,SZ18,黄色:SZ19。

图6:显示了SZ对A-T分开的XtpS的生产的影响。没有N末端SZ(NRPS-14b)、没有C末端SZ(NRPS-14c)和没有两个SZ(NRPS-14d)的三个对照实验的示意图,以及具有两个SZ(NRPS-14a)的构建体的示意图。WT-XtpS(NRPS-1)用作参考。从三次测量得到的肽1和2的相对产量以WT水平的百分比给出。符号代表结构域:圆圈,A结构域;矩形,T结构域;三角形,C结构域;菱形,C/E结构域;C末端的小圆圈,TE结构域。螺旋线代表SZ:橙色,SZ17;绿色,SZ18。

图7:显示了SZ对C-A(SZ19/18)分开的XtpS的生产的影响。没有N末端SZ(NRPS-16b)、没有C末端SZ(NRPS-16c)和没有两个SZ(NRPS-16d)的三个对照实验的示意图,以及具有两个SZ的构建体(NRPS-16a)的示意图。WT-XtpS(NRPS-1)用作参考。从三次测量得到的肽1和2的相对产量以WT水平的百分比给出。符号代表结构域:圆圈,A结构域;矩形,T结构域;三角形,C结构域;菱形,C/E结构域;C末端的小圆圈,TE结构域。螺旋线代表SZ:黄色,SZ19;绿色,SZ18。

图8:显示了GS接头对C-A(SZ17/18)分开的XtpS的产生的影响。没有GS接头(NRPS-15a)和具有10个AS长的GS接头(NRPS-15b)、8个AS长的GS接头(NRPS-15c)和4个AS长的GS接头(NRPS-15d)(在第一个XtpS部分的C末端和SZ 17之间引入)的构建体的示意图。WT-XtpS(NRPS-1)用作参考。从三次测量得到的肽1和2的相对产量以WT水平的百分比给出。符号代表结构域:圆圈,A结构域;矩形,T结构域;三角形,C结构域;菱形,C/E结构域;C末端的小圆圈,TE结构域。螺旋线代表SZ:橙色,SZ17;绿色,SZ18。

图9:显示了三部分XtpS的生产率。在T-C(NRPS-17a)和A-T(NRPS-18a)接头中分开的XtpS和相应的阴性对照(NRPS-18b)的示意图。WT-XtpS(NRPS-1)用作参考。从三次测量得到的肽1和2的相对产量以WT水平的百分比给出。符号代表结构域:圆圈,A结构域;矩形,T结构域;三角形,C结构域;菱形,C/E结构域;C末端的小圆圈,TE结构域。螺旋线代表SZ:橙色,SZ17;绿色,SZ18;深蓝色:SZ1;浅蓝色:SZ2。

图10:显示了三部分GxpS的生产率。A:在A-T接头中分开的GxpS(NRPS-20)的示意图。WT-GxpS(NRPS-2)用作参考。从三次测量得到的肽3、4、5和6的相对产量以WT水平的百分比给出。符号代表结构域:圆圈,A结构域;矩形,T结构域;三角形,C结构域;菱形,C/E结构域;C末端的小圆圈,TE结构域。螺旋线代表SZ:橙色,SZ17;绿色,SZ18;深蓝色:SZ1;浅蓝色:SZ2。B:产生的肽的结构。

图11显示了用于生产新型肽的XtpS的重编程。A:杂合体NRPS-23b和NRPS-23c的示意图,它们是通过用GxpS(红色)和SzeS(绿色)三结构域替代XtpS(浅绿色)三结构域而产生的。从三次测量中得到的肽16a/b、17a、18和19a/b的相对产量以与WT(NRPS-1)相比标准化的百分比显示。还显示了XtpS(NRPS-18)的三部分划分。符号代表结构域:圆圈,A结构域;矩形,T结构域;三角形,C结构域;菱形,C/E结构域;C末端的小圆圈,TE结构域。螺旋线代表SZ:橙色,SZ17;绿色,SZ18;深蓝色:SZ1;浅蓝色:SZ2。B:产生的肽的结构。

图12显示了用于生产新型肽的GxpS的重编程。A:杂合体NRPS-24a和NRPS-24c的示意图,它们是通过用XtpS(浅绿色)和SzeS(绿色)三结构域替代GxpS(红色)三结构域而产生的。从三次测量中得到的肽20、21a/b、22、23a/b、24、25、3和2的相对产量以与WT(NRPS-2)相比的百分比显示。还显示了GxpS(NRPS-20)的三部分划分。符号代表结构域:圆圈,A结构域;矩形,T结构域;三角形,C结构域;菱形,C/E结构域;C末端的小圆圈,TE结构域。螺旋线代表SZ:橙色,SZ17;绿色,SZ18;深蓝色:SZ1;浅蓝色:SZ2。B:产生的肽的结构。

图13:显示了用于生产新型肽的XtpS杂合体的设计。A:杂合体NRPS-26和NRPS-27的示意图,它们分别由GxpS(红色)和SzeS(绿色)以及XtpS(浅绿色)的部分产生。从三次测量中得到的肽20、22和26的相关的相对肽产量以百分比显示。还显示了XtpS(NRPS-18)的三部分划分。符号代表结构域:圆圈,A结构域;矩形,T结构域;三角形,C结构域或FT结构域;菱形,C/E结构域;C末端的小圆圈,TE结构域。螺旋线代表SZ:橙色,SZ17;绿色,SZ18;深蓝色:SZ1;浅蓝色:SZ2。B:产生的肽的结构。

图14:显示了用于生产新型肽的GxpS杂合体的设计。A:杂合体NRPS-28和NRPS-29的示意图,它们分别由XtpS(浅绿色)和SzeS(绿色)和GxpS(红色)的部分产生。从三次测量中得到的肽16a/b、27、17a/b、28a/b、18、19、29、30、31a/b和32的相关的相对肽产量以百分比显示。还显示了GxpS(NRPS-20)的三部分划分。符号代表结构域:圆圈,A结构域;矩形,T结构域;三角形,C结构域或FT结构域;菱形,C/E结构域;C末端的小圆圈,TE结构域。螺旋线代表SZ:橙色,SZ17;绿色,SZ18;深蓝色:SZ1;浅蓝色:SZ2。B:产生的肽的结构。

图15:显示了NRPS和PKS模块的杂合体的划分。由杂合体产生的物质是glidobactin A(见结构)。NRPS GlbD在A和T结构域之间用SZ分开。符号代表结构域:圆圈,A结构域;矩形,T结构域;三角形,C结构域;GlbB中的PKS结构域根据其功能命名。螺旋线代表SZ:浅灰色,SZ17;深灰色,SZ18。

图16:显示了优选的实施方案,其中Synzpi变体SZ1和SZ2(A)或SZ2和SZ19(B)的序列在每种情况下在N末端被截短。被截短但仍具有完整功能的Synzip导致NRPS内的肽产量提高。

序列显示了:

SEQ ID No. 1和2:SYNZIP序列

SEQ ID No. 3和5:用于插入根据本发明的结合结构域的优选序列基序

SEQ ID No. 6至30:本申请中产生的NRPS肽的肽序列。

实施例

本发明的某些方面和实施方案现在将通过实施例的方式并参考本文所阐述的描述、附图和表格来说明。本发明的材料、方法、用途和其他方面的这些实施例仅是代表性的,不应被理解为限制性的。

实施例显示了:

实施例1:基于XU概念的NRPS的SYNZIP介导的从头设计

这项工作最初涉及基于XU概念的NRPS的从头构建和新型肽的生产。通过将SYNZIP对17/18引入C-A接头的保守WNATE基序中,应从两个系统构建杂合NRP。反平行SZ对应作为不同合成酶之间的非共价介质。由于解离常数(Kd)< 10 nM,SZ17和SZ18彼此具有很强的亲和力(Thompson et al., 2017),因此几乎所有共价键的特性都存在。通过将AmbS、SzeS和XldS的前两个XU与GxpS的后三个XU组合,应生成NRPS杂合体。将SZ17添加到AmbS、SzeS和XldS的C末端,并将SZ18添加到GxpS的N末端。至于Bozhüyük等人建立的规则,其需要考虑C结构域特异性,观察到前两个杂合体(AmbS-GxpS和Sze-GxpS)的特异性,但没有观察到最后一个杂合体(XldS-GxpS)的特异性。

实施例2:质粒构建和GxpS杂合体在大肠杆菌DH10B::mtaA中的异源表达

首先使用来自

在随后的HPLC-MS分析中(见2.5.2),对将会由杂合系统产生的肽的质量进行了搜索。因此,对于由AmbS和GxpS的部分组成的杂合体NRPS-3a,搜索了

对于由SzeS的前两个XU和GxpS的后三个XU组成的第二个杂合体NRPS-4a,在记录的HPLC-MS中搜索数据,苯丙氨酸衍生物10(formyl-1TflL)的

最终,由XldS和GxpS的部分组成的第三种杂合体(NRPS-5a)的HPLC-MS数据显示产生了最为预期的衍生物(图4)。由于XldS的C1结构域允许在肽的N末端掺入C13、C14或C15FS,所以第三个GxpS A结构域的混杂导致六种可能的衍生物,

实施例3:SYNZIP介导的NRPS重建的策略

以上,基于XU概念,选择C-A接头的保守WNATE基序(SEQ ID NO: 3)作为优选的切割位点。这个切割位点由Bozhüyük等人从

此外,应比较两种不同的SYNZIP寡聚化状态,这意味着与SZ结合的XtpS亚基在空间上要么接近,要么相距更远。原则上,两个方向都可以通过平行和反平行SZ来实现。然而,只有蛋白质相距更远的构象是可行的。原因是在将NRPS系统一分为二后,SZ只能附加到蛋白质的两个末端(第一个NRPS部分的C末端和第二个NRPS部分的N末端),而不是四个可能的末端(第一个蛋白质部分的N末端和C末端和第二个蛋白质部分的N末端和C末端)。然而,通过引入SZ19和SZ18的功能反转形式,紧密的方向似乎是可能的。然而,该对没有被Thompson等人表征(仅SZ19与SZ18的正向形式),因此缺少Kd值、相互作用伙伴等数据。最终,反平行SZ对17/18用于宽构象,而平行SZ对19/18用于紧密构象。

对于在T-C和A-T接头中分开的XtpS(NRPS-13和NRPS-14,切割位点见3.2),在每种情况下都有两个质粒,pNA2(xtpS_A1-T2_SZ17)和pNA3(SZ18_xtpS_C3-TE),以及pNA4(xtpS_A1-A2_SZ17)和pNA5(SZ18_xtpS_T2-TE),组装并一起转化进大肠杆菌DH10B::mtaA中。相反,质粒pJW61(xtpS_A1-C3_SZ17)和pJW62(SZ18_xtpS_A3-TE)用于表示C-A接头中的切割位点。此外,对于在C-A接头中分开的NRPS-16,C末端SZ17被SZ19替换,而N末端SZ18反向保持不变。野生型XtpS(NRPS-1)的产量用作参考。所有构建体的生产培养物一式三份同时制备,并通过HPLC-MS检查1和2的合成。

由于缺少标准品而无法进行绝对定量,因此对峰面积进行了相对评估(图5)。与由图5中的相对值所预期的不同,基于绝对肽产率,线性肽1没有以与环状肽2几乎相同的量形成,而仅为约0.1%。这个结果仅仅是因为线性肽的电离更好,在考虑相对值时必须考虑到这一点。测量结果表明,环状产物2(m/z值为411.31 [M+H+])的产量,以及在大多数情况下线性肽1(m/z值为429.31 [M+H+])的产量,对于所有构建体都可以检测到(图5)。在T-C(NRPS-13)和A-T(NRPS-14)接头中分开的构建体产生2的产量最高,相对于WT为约80%,而在C-A中分开的两种构建体(NRPS-15和NRPS-16)显示显著更低的产量,为27%(NRPS-15)和13%(NRPS-16)。NRPS-14以可忽略不计的更低的水平比NRPS-13更好地产生线性肽(1),而NRPS-16显示完全没有产生1。

实施例5:SYNZIP对A-T分开的XtpS的生产的影响

对A-T分开的构建体NRPS-14a检验了SZ对1和2的生产的影响(图6)。在组装pNA11(xtpS_A1-A2)和pNA12(xtpS_T2-TE)之后,进行了对照实验,其中第一种情况中N末端被排除在外(NRPS-14b),第二种情况中C末端被排除在外(NRPS-14c),在第三种情况中两个SZ都被排除在外(NRPS-14c)(图6)。为此目的,克隆了质粒pNA12(xtpS_T2-TE)和pNA11(XtpS_A1-A2),其每一个都缺少SZ17和SZ18的序列。HPLC-MS数据的结果如图6所示。A-T分开的构建体的阴性对照(NRPS-14b、NRPS-14c和NRPS-14d)显示环状产物2的产量非常低,约为WT水平的3-10%,并且绝对没有线性肽1的产量。总体而言,与NRPS-14a相比,对照显示生产率下降≥90%(图6)。此外,NRPS-14a以WT水平的104%和81%产生肽2和1。

实施例6:SYNZIP对A-C(SZ19/18)分开的XtpS的生产的影响

对具有SZ对19/18的A-C分开的构建体也进行了相同的对照实验。由于该构建体已经显示出具有两个SZ的低产量(图5),因此对于进行的三个对照实验(图7),可能仅检测到非常低的产量或没有产量的2和1。HPLC-MS测量数据的相对分析显示,对照实验NRPS-16b和NRPS-16d没有肽产生;NRPS-16c仅显示非常低产量的2,为WT水平的3.2%。相对于具有两个SZ的构建体(NRPS-16a),对照NRPS-16c显示环状肽2的产量减少了80%。

实施例7:GS接头对A-C(SZ17/18)分开的XtpS的生产的影响

由于与T-C(NRPS-13,图5)和A-T(NRPS-14,图5)分开的XtpS构建体相比,C-A(NRPS-15,图5)分开的构建体显示出显著较差的生产率,因此将不同长度的GS接头引入在第一个XtpS部分的C末端和SZ17之间,目的是提高生产率。由于根据Bozhüyük等人发表的用于构建重编程NRPS的XU概念,删除了保守的WNATE基序的10个AS,并且图8所示的C-A构建体(NRPS-15)也发生了同样的情况,因此开始了引入十个AS长的GS接头。这是通过组装来自pJW61(A1-C3_SZ17)的质粒pNA8(xtpS_A1-C3_GS(10)_SZ17)来实现的。此外,构建了另外两个质粒pNA9(xtpS_A1-C3_GS(8)_SZ17)和pNA10(xtpS_A1-C3_GS(4)_SZ17),它们编码8个和4个AS长的GS接头。对HPLC-MS测量数据的评估表明,与没有接头的构建体相比,具有GS接头的所有构建体(NRPS-15b、NRPS-15c、NRPS-15d)的产量更好。总体而言,引入接头导致环状肽2的生产率平均提高约37%,线性肽1的生产率平均提高约26%。此外,对于所有具有GS接头的构建体,都以接近WT水平产生了环状产物2。

实施例7:概念证明:三部分XtpS系统的生产率

由于将XtpS分为两部分对于每个优选位置都是成功的,因此下一步是将系统在两个位置进行拆分。为此,引入了另一个SYNZIP对(SZ1和SZ2),它不与SZ17和SZ18通信,从而形成所谓的正交网络。由于Kd值< 10 nM,SZ1和SZ2,以及SZ17和SZ18,彼此都显示出非常强的亲和力。此外,仅选择A-T和T-C接头区域作为三部分分开的位置,其被证明是通过NRPS-13和NRPS-14产生最佳产量的最有利位置(图5)。因此,产生了两个构建体(NRPS-17a和NRPS-18a),其每一个都通过将两个SZ对分别引入接头区域T-C和A-T而被分开。详细来说,将SZ分别引入第二个和第三个T-C接头或第二个和第三个A-T接头。总共四个质粒,即pNA17(SZ18_xtpS_C3-T3_SZ1)和pNA18(SZ2_xtpS_C4-TE)被克隆用于T-C中的划分,pNA15(SZ18_xtpS_T2-A3_SZ1)和pNA16(xtpS_SZ2_T3-TE)被克隆用于A-T区域中的划分。此外,组装没有SZ的质粒作为阴性对照。这导致pNA19(xtpS_T2-A3)和pNA20(xtpS_T3-TE)用于A-T划分的阴性对照(NRPS-18b,图9)。

对于三部分构建体NRPS-17a和NRPS-18a两者,可以确定线性肽1和环状肽2的产生(图9)。与NRPS-18a相比,NRPS-17a以二倍的量(2)到三倍以上的量(1)产生肽。因此,2分别被确定为71.7%和32.2%,1分别被确定为25.6%和7.3%。此外,A-T分开的系统的阴性对照(NRPS-18b)显示没有产生肽。

实施例8:SYNZIP介导的三结构域交换用于构建杂合NRPS

除了XtpS之外,GxpS(NRPS-20)也被分成三部分(图10),产生了XldS和SzeS的三结构域片段。然后,系统的所得三结构域片段应在进一步的实验中相互结合,以生产新型肽。从四个系统的所有A-T和T-C接头区域的序列比对来看,A-T接头的切割位点(见3.2,系统内和系统之间的序列基序的轻微变化)证明是更有利的切割位点(切割位点的序列基序更保守)。因此,只有A-T接头中的切割位点用于显示的所有其他构建体。这意味着不应再考虑下游C结构域的底物特异性(如在XU概念中),而应考虑上游C结构域的底物特异性。除了XtpS之外,NRPS-23还包含GxpS和SzeS的部分(图11)。在检查了三部分NRPS-18、NRPS-23b和NRPS-23c的生产率后,互换了三结构域。

实施例9:其他三部分系统的生产率

为了构建分为三个部分的GxpS(NRPS-18)和SzeS(NRPS-19)系统,在每种情况中克隆了一组三个质粒。这产生了质粒pNA26(gxpS_A1-A2_SZ17)、pNA27(SZ18_gxpS_T2-A3_SZ1)和pNA28(SZ2_gxpS_T3-TE)以及pNA29(szeS_C1-A2_SZ17)、pNA30(szeS_T2-A3_SZ1)和pNA31(SZ2_szeS_T3-TE),各自在大肠杆菌DH10B::mtaA中联合转化。

对于NRPS-20(三部分GxpS),在每种情况下都可以确定所有四种衍生物3、4、5和6,m/z值为586.40 [M+H +]、600.41 [M + H +]、552.41 [M + H +]和566.43 [M+H+](图10)。然而,与WT-NRPS(NRPS-2)相比,生产率大大降低。仅生产了5.2%的3,仅生产了10.8%的4,仅生产了约14%的5和6(图10)。

实施例10:三结构域交换生产新型肽

所描述的NRPS基于三个质粒的划分使系统的操作变得简单。在实验实施中,代替原来的质粒,替换了一个或两个质粒并在新的载体中一起转化到各自的表达菌株中。然后,各种NRPS之间的翻译后通讯由人工亮氨酸拉链介导。因此,例如,XtpS组的第二个质粒可以被GxpS组的第二个质粒替换,从而构建新的杂合系统。总的来说,这项工作中产生的质粒允许构建50种杂合合成酶。在以下实施例中,描述了其中的8个。

第一个三结构域交换应该允许将Xtp的第二个缬氨酸替换为苯丙氨酸。在实验实施中,代替pNA15质粒,质粒pNA27和pNA30与pNA4和pNA16一起转化到大肠杆菌DH10B::mtaA中,从而能够产生杂合体NRPS-23b和NRPS-23c(图11)。

HPLC-MS分析的相对评估显示预期用于NRPS-23b和NRPS-23c的肽(图11)。因此,通过NRPS-23b检测线性形式(16、17)和环状形式(18、19)的苯丙氨酸衍生物和亮氨酸衍生物两者。此外,在肽16和19的EIC中,每种情况下也有双峰,它们具有不同的保留时间,但在MS2光谱中显示出相同的分块。由此得出结论,肽以立体异构体的形式出现并相应地在不同时间洗脱。由于非天然蛋白质-蛋白质界面仅存在于杂合体NRPS-23b的最后一个C/E结构域,因此推断上游AS以两种构象出现。在16和19的例子中,它们在每种情况下是AS苯丙氨酸和亮氨酸。然而,尚未研究实际影响哪个AS,因此仍不清楚。此外,NRPS-23c产生了肽16和18,正如已经由NRPS-23b产生的那样。肽16再次出现双峰,因此假定为立体异构体16a和16b。对于异构体的相对评估,增加了峰面积。

最高频率检测到的肽是线性肽16a/b(在两种杂合体中)和17,它们的生产量几乎相同,均为94.4%-100%(图11)。第4节讨论了电离对线性肽的频率的影响。总体而言,NRPS-23b和NRPS-23c两种杂合体都显示出相似产量的肽16a/b和18,其中分别以94.4%和100%生产了16a/b,分别以19.1%和24.8%生产了18。此外,对于由NRPS-23b生产的苯丙氨酸衍生物(16a/b和18)和亮氨酸衍生物(17a和19a/b),也可以确定非常相似的值。

在第二个三结构域交换中,应将Gxps的苯丙氨酸替换为缬氨酸(来自Xtp)或苯丙氨酸(来自Sze)。通过在每种情况下用pNA15和pNA30代替pNA27,产生了杂合体NRPS-24a和NRPS-24c(图12)。

测量数据的相关分析表明,可以确定NRPS-22a和NRPS-22c的肽产量。两种杂合体均产生线性和环状形式的缬氨酸衍生物(20、22、24和3)和亮氨酸衍生物(21a/b、23、25和4)(图12)。杂合体NRPS-24a最常产生的肽是环状缬氨酸衍生物22。相对于22,检测到线性形式(20)为34.7%。此外,环状形式的亮氨酸衍生物(23)以62.9%产生,其量低于22。线性肽21的相对值为20.9%,被检测为立体异构体(21a和21b)。与NRPS-24a相比,NRPS-24c的产量总体较差。因此,与22相比,环状缬氨酸衍生物3以66.1%生产,而环状亮氨酸衍生物4的相对值仅检测到16.3%。此外,在NRPS-22c中,检测到线性肽24和25为13.4%和2.7%,比环状肽的量更少。肽的结构如图12B所示。通过相应质粒的进一步组合可以相应地获得进一步的新型肽,如图14和14所示。

此外,生成了图15中所示的PKS和NRPS模块的杂合体,这导致了glidobactin肽的完整合成。为此,对GlbD用SZ17/SZ18在A-T之间分开。在每种情况下没有一个或没有两个SZ的阴性对照中,几乎没有glidobactin A产生。

在实施例的上下文中使用了以下质粒:

序列表

<110> 法兰克福大学

<120> 用于非核糖体肽合成酶和聚酮合成酶的适配器系统

<130> U30947WO

<150> EP19208603.1

<151> 2019-11-12

<160> 30

<170> PatentIn version 3.5

<210> 1

<211> 42

<212> PRT

<213> 人工序列

<220>

<223> SYNZIP 17

<400> 1

Asn Glu Lys Glu Glu Leu Lys Ser Lys Lys Ala Glu Leu Arg Asn Arg

1 5 10 15

Ile Glu Gln Leu Lys Gln Lys Arg Glu Gln Leu Lys Gln Lys Ile Ala

20 25 30

Asn Leu Arg Lys Glu Ile Glu Ala Tyr Lys

35 40

<210> 2

<211> 42

<212> PRT

<213> 人工序列

<220>

<223> SYNZIP 18

<400> 2

Ser Ile Ala Ala Thr Leu Glu Asn Asp Leu Ala Arg Leu Glu Asn Ala

1 5 10 15

Arg Leu Glu Lys Asp Ile Ala Asn Leu Ala Lys Leu Glu Arg Glu Glu

20 25 30

Ala Tyr Glu Ala Tyr Glu Ala Tyr Glu Phe

35 40

<210> 3

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> NRPS连接基序

<400> 3

Trp Asn Ala Thr Glu

1 5

<210> 4

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> 序列基序

<400> 4

Arg Val Leu Pro

1

<210> 5

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> 连接基序

<400> 5

Val Tyr Ala Ala Pro

1 5

<210> 6

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 6

Ser Gln Phe Leu Leu

1 5

<210> 7

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 7

Ser Gln Leu Leu Leu

1 5

<210> 8

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 8

Leu Thr Phe Leu Leu

1 5

<210> 9

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 9

Leu Thr Leu Leu Leu

1 5

<210> 10

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 10

Gln Asn Phe Leu Leu

1 5

<210> 11

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 11

Gln Asn Leu Leu Leu

1 5

<210> 12

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 12

Val Leu Val Val

1

<210> 13

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 13

Val Leu Phe Leu Leu

1 5

<210> 14

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 14

Leu Leu Phe Leu Leu

1 5

<210> 15

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 15

Val Leu Leu Leu Leu

1 5

<210> 16

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 16

Leu Leu Leu Leu Leu

1 5

<210> 17

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 17

Val Leu Phe Val

1

<210> 18

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 18

Val Leu Leu Val

1

<210> 19

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 19

Val Leu Val Leu Leu

1 5

<210> 20

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 20

Leu Leu Val Leu Leu

1 5

<210> 21

<211> 5

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 21

Val Leu Val Leu Leu

1 5

<210> 22

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 22

Val Leu Val Val Tyr Trp

1 5

<210> 23

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 23

Val Leu Phe Val

1

<210> 24

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 24

Leu Leu Phe Val

1

<210> 25

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 25

Val Leu Leu Val

1

<210> 26

<211> 4

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 26

Leu Leu Leu Val

1

<210> 27

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 27

Val Leu Phe Val Tyr Trp

1 5

<210> 28

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 28

Leu Leu Phe Val Tyr Trp

1 5

<210> 29

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 29

Val Leu Leu Val Tyr Trp

1 5

<210> 30

<211> 6

<212> PRT

<213> 人工序列

<220>

<223> NRPS肽序列

<400> 30

Leu Leu Leu Val Tyr Trp

1 5

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号