首页> 中国专利> 用于无质粒产生目的蛋白的诱导型表达系统

用于无质粒产生目的蛋白的诱导型表达系统

摘要

公开了一种用于在原核宿主中产生目的蛋白(POI)的基于基因组的表达系统,所述表达系统至少包含RNA聚合酶(RNAP)基因;编码POI的基因,所述基因包含编码序列,与所述编码序列可操作地连接的启动子,其中所述启动子由从所述RNAP基因表达的RNAP识别,和所述启动子的序列内的至少一个lac操纵基因(lacO);以及编码lac阻遏蛋白(LacI)的lacI基因,所述lacI基因包含编码序列、与所述lacI编码序列可操作地连接的lacI启动子,其中所述lacI启动子是野生型lacI启动子或增加LacI表达的lacI启动子;其中所述POI的表达率由结合LacI的诱导剂调节。

著录项

  • 公开/公告号CN112689676A

    专利类型发明专利

  • 公开/公告日2021-04-20

    原文格式PDF

  • 申请/专利权人 勃林格殷格翰RCV两合公司;

    申请/专利号CN201980059545.0

  • 申请日2019-09-11

  • 分类号C12N15/63(20060101);C12N15/70(20060101);

  • 代理机构11494 北京坤瑞律师事务所;

  • 代理人封新琴

  • 地址 奥地利维也纳

  • 入库时间 2023-06-19 10:40:10

说明书

技术领域

本发明涉及用于在原核宿主中表达目的蛋白的无质粒诱导型系统的领域。本发明还涉及使用此类系统在原核宿主中产生目的蛋白的方法。

背景技术

在工业蛋白质生产过程中,基因调节是重要的前提。转录率由启动子和RNA聚合酶(RNAP)的相互作用控制。对这种相互作用的理解和外部调节对于提供过程控制和产品产量和质量的优化是必要的。降低启动子强度可能是有益的,特别是对于具有挑战性的蛋白质,如抗体片段、膜蛋白或毒性蛋白(1-3)。可溶且正确折叠蛋白的最终产物产量通常不直接由启动子系统的强度决定,而是由肽链的进一步加工决定,如转位到周质和正确的二硫键形成。

最突出且研究得最好的遗传调节机制是lac操纵子(4)。在野生型大肠杆菌(E.coli)中,lac抑制物(LacI)形成与lac操纵基因序列(lacO)结合并阻遏lacZYA操纵子转录的同四聚体(5)。在乳糖或不可代谢的异丙基β-D-1-硫代吡喃半乳糖苷(IPTG)的存在下,LacI的结构发生改变,并且不能再与lac操纵基因结合,从而导致诱导转录。lac操纵基因位点是具有反向重复对称性的DNA序列(6)。

对称性越高,LacI与操纵基因序列的结合亲和力越大。发现人工完全对称的lacO(sym-lacO)以最大亲和力结合LacI(7),而表现出近似对称性的三个野生型操纵基因lacO1、lacO2和lacO3显示出较低亲和力,从而导致以下顺序:sym-lacO>lacO1>lacO2>lacO3(8)。LacI通过DNA环化机制同时与主操纵基因lacO1以及lacO2或lacO3结合(9)。lacO2位于lacO1下游401bp,而lacO3位于lacO1上游仅92bp(10)。lacO2的作用仍不清楚,因为对阻遏的主要贡献来自lacO1和lacO3的DNA环化,因为它们更接近(8)。此外,当lacO1和lacO3被LacI结合时,阻止了LacI本身的产生。lacI基因的3'端与lacO3重叠。在阻遏状态下,lacI的转录产生截短的mRNA,其被细胞快速降解。由于这种自动调节,LacI四聚体的浓度在诱导的细胞中为约40个分子,并且在非诱导的细胞中为约15个分子(11)。

存在LacI阻遏蛋白和pLacI启动子的几种突变体。Penumetcha等人测试了阻遏物和启动子突变体的各种组合,试图发现在转录中渗漏性降低的系统。他们报告了野生型LacI阻遏蛋白与pLacI

Oehler等人测试了大肠杆菌(Escherichia coli)的染色体lac操纵子的全部三个lac操纵基因的系统破坏对Lac阻遏物阻遏的影响,并且报告了lac操纵子的三个操纵基因在阻遏中合作(35)。

四聚体Lac阻遏物可以同时与同一DNA分子上的两个lac操纵基因结合,从而包括形成DNA环。Müller等人报告了随着操纵基因间DNA长度的减少,阻遏显著增加(36)。

已测试了将lac操纵基因放置在相对于噬菌体T7 RNA聚合酶启动子的不同位置处的影响。转录可以被lac阻遏物强烈阻遏,所述阻遏物与RNA起点下游15个碱基对的操纵基因结合(37)。

WO 2003/050240A2公开了用于在宿主细胞中产生靶蛋白的表达系统,所述表达系统包含编码T7 RNA聚合酶的同源整合基因和编码靶蛋白的非整合基因。

lac调节机制的最早应用之一是pET系统,所述系统当今是用于重组蛋白生产的最广泛使用的大肠杆菌表达系统(12,13)。此系统是基于T7噬菌体衍生的T7 RNAP与强T7启动子的特异性相互作用。噬菌体λ的重组酶功能用于将T7 RNA聚合酶基因定点插入大肠杆菌基因组中。T7 RNAP的表达由lacUV5启动子控制,所述启动子是乳糖启动子的对分解代谢阻遏不敏感的变体。添加IPTG诱导T7 RNAP的高水平表达,所述T7 RNAP进而转录在T7启动子控制下的靶基因。此正交表达系统为可以在大肠杆菌中高效产生的重组蛋白提供了非常高的产物滴度。然而,T7表达系统的超常强度(特别是如果与高拷贝数质粒组合的话)对宿主细胞施加极端的代谢负荷。当目的基因编码具有挑战性的蛋白质时,应力和代谢负担往往导致产量降低、生产周期缩短,甚至细胞死亡(14,15)。

质粒介导的应力效应(如高基因剂量和抗生素抗性基因的转录)可以通过将目的基因(GOI)(即编码目的蛋白的基因)整合到宿主基因组中来克服(16,17)。

WO 2008/142028 A1公开了用于产生目的蛋白的方法,其中将编码目的蛋白的DNA在预先选择的位点处整合到细菌细胞基因组中。

Striedner等人公开了基于T7的无质粒大肠杆菌表达系统,其中将靶基因位点特异性整合到宿主的基因组中(17)。

基因组整合的基于T7的表达系统提供了显著的优势。与基于质粒的表达系统相比,在生产过程期间不存在质粒介导的代谢负荷和基因剂量的变化。然而,T7 RNA聚合酶(RNAP)在长期生产条件下容易发生突变。Striedner等人(17)在恒化器培养中证明了这一点,其中T7 RNAP的突变导致非生产细胞群更快生长,并且因此导致产物产量的大量损失。

因此,在本领域中显然需要改进的诱导型表达系统,其导致改进的表达率、低基础表达和在细胞水平上表达率的真正可调谐性,即使在低诱导物浓度下。

发明内容

本发明的目的是提供改进的诱导型系统,其具有改进的目的蛋白表达率控制和用于无质粒产生目的蛋白的非常低的基础表达。

本发明解决了所述问题。

根据本发明,提供了一种用于在原核宿主中产生目的蛋白的基于基因组的表达系统,所述表达系统至少包含

a)RNA聚合酶(RNAP)基因,

b)用于表达目的蛋白的基因,所述基因包含

-编码所述目的蛋白的编码序列,

-与所述编码序列可操作地连接的启动子,其中所述启动子被由a)表达的RNAP识别,和

-所述启动子序列内的至少一个lac操纵基因(lacO);以及

c)用于表达lac阻遏蛋白(LacI)的lacI基因,所述lacI基因包含

-lacI编码序列,

-与所述lacI编码序列可操作地连接的lacI启动子,其中所述lacI启动子选自野生型lacI和增加lacI表达的lacI启动子;

其中所述目的蛋白的表达率由结合LacI的诱导剂调节。

根据具体实施方案,提供了一种用于在原核宿主中产生目的蛋白的基于基因组的表达系统,所述表达系统至少包含

a)RNA聚合酶(RNAP)基因,

b)用于表达目的蛋白的基因,所述基因包含

-编码所述目的蛋白的编码序列,

-与所述编码序列可操作地连接的启动子,其中所述启动子被由a)表达的RNAP识别,和

-所述启动子序列内的lac操纵基因(lacO),优选lacO1;以及

c)用于表达lac阻遏蛋白(LacI)的lacI基因,所述lacI基因包含

-lacI编码序列

-与所述lacI编码序列可操作地连接的lacI启动子,其中所述lacI启动子是增加lacI表达的lacI启动子,优选地它是lacI

其中所述目的蛋白的表达率由结合LacI的诱导剂调节。

具体地,用于表达目的蛋白的基因含有一个在与所述编码序列可操作地连接的启动子序列内的lacO,并且所述lacI启动子是增加LacI表达的启动子。

根据另一个具体实施方案,提供了一种用于在原核宿主中产生目的蛋白的基于基因组的表达系统,所述表达系统至少包含

a)RNA聚合酶(RNAP)基因,

b)用于表达目的蛋白的基因,所述基因包含

-编码所述目的蛋白的编码序列,

-与所述编码序列可操作地连接的启动子,其中所述启动子被由a)表达的RNAP识别,和

-至少两个间隔至少92bp、特别是94bp的lac操纵基因(lacO),其中一个lacO在所述启动子的序列内,并且另一个lacO在所述启动子的上游;以及

c)用于表达lac阻遏蛋白(LacI)的lacI基因,所述lacI基因包含

-lacI编码序列

-与所述lacI编码序列可操作地连接的lacI启动子,其中所述lacI启动子是野生型lacI启动子;

其中所述目的蛋白的表达率由结合LacI的诱导剂调节。

根据替代实施方案,提供了一种用于在原核宿主中无质粒产生目的蛋白的诱导型系统,所述诱导型系统至少包含

a)所述宿主的染色体中的RNA聚合酶(RNAP)基因,

b)用于表达目的蛋白的基因,所述基因包含

-编码所述目的蛋白的编码序列,

-与所述编码序列可操作地连接的启动子,其中所述启动子被由a)表达的RNAP识别,和

-所述启动子序列内的至少一个lac操纵基因(lacO);以及

c)用于表达lac阻遏蛋白(lacI)的lacI基因,所述lacI基因包含

-lacI编码序列,

-与所述lacI编码序列可操作地连接的lacI启动子,其中所述lacI启动子选自野生型lacI和增加lacI表达的lacI启动子;

其中lacI对b)的一个或多个lacO的亲和力低于lacI对所述宿主的内源lac操纵子的lac操纵基因lacO1和lacO3的亲和力,并且其中所述目的蛋白的表达率由结合LacI的诱导剂调节。

根据另一个实施方案,提供了一种用于在原核宿主中无质粒产生目的蛋白的诱导型系统,所述诱导型系统至少包含

a)所述宿主的染色体中的RNA聚合酶(RNAP)基因,

b)用于表达目的蛋白的基因,所述基因包含

-编码所述目的蛋白的编码序列,

-与所述编码序列可操作地连接的启动子,其中所述启动子被由a)表达的RNAP识别,和

-所述启动子序列内的lac操纵基因(lacO),优选lacO1;以及

c)用于表达lac阻遏蛋白(lacI)的lacI基因,所述lacI基因包含

-lacI编码序列

-与所述lacI编码序列可操作地连接的lacI启动子,其中所述lacI启动子是增加lacI表达的lacI启动子,优选地它是lacI

其中lacI对b)的一个lacO的亲和力低于lacI对所述宿主的内源lac操纵子的lac操纵基因lacO1和lacO3的亲和力,并且其中所述目的蛋白的表达率由结合LacI的诱导剂调节。

根据本发明的另一个具体实施方案,提供了一种用于在原核宿主中无质粒产生目的蛋白的诱导型系统,所述诱导型系统至少包含

a)所述宿主的染色体中的RNA聚合酶(RNAP)基因,

b)用于表达目的蛋白的基因,所述基因包含

-编码所述目的蛋白的编码序列,

-与所述编码序列可操作地连接的启动子,其中所述启动子被由a)表达的RNAP识别,和

-至少两个间隔至少92bp的lac操纵基因(lacO),其中一个lacO在所述启动子的序列内,并且另一个lacO在所述启动子的上游;以及

c)用于表达lac阻遏蛋白(lacI)的lacI基因,所述lacI基因包含

-lacI编码序列

-与所述lacI编码序列可操作地连接的lacI启动子,其中所述lacI启动子是野生型lacI启动子;

其中lacI对b)的至少两个lacO的亲和力低于lacI对所述宿主的内源lac操纵子的lac操纵基因lacO1和lacO3的亲和力,并且其中所述目的蛋白的表达率由结合LacI的诱导剂调节。

具体地,所述原核宿主是大肠杆菌(Escherichia coli/E.coli)。具体地,所述宿主是大肠杆菌菌株BL21或K-12。

具体地,所述RNAP是对所述宿主而言同源的RNAP,具体地是σ

具体地,与编码所述目的蛋白的编码序列可操作地连接的启动子选自T5、T5

根据本文所述的诱导型系统的优选实施方案,所述lacI启动子是与野生型宿主相比增加LacI表达的启动子,所述野生型宿主是lacI

优选地,编码所述目的蛋白的基因包含选自lacO1、lacO2或lacO3及其任何组合的至少一个lacO。具体地,编码所述目的蛋白的基因包含两个lacO,优选lacO1和lacO1或lacO1和lacO2或lacO1和lacO3。

具体地,编码所述目的蛋白的基因中包含的至少一个lac操纵基因是lacO1(SEQID NO:3)、lacO2(SEQ ID NO:4)或lacO3(SEQ ID NO:5)。

具体地,所述至少一个lac操纵基因是lacO1、lacO2或lacO3的具有至少65%序列同一性的功能变体或者完全对称的lacO。具体地,所述lac操纵基因是lacO1、lacO2或lacO3的功能变体,所述功能变体与野生型lacO1、lacO2或lacO3具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%或95%序列同一性。根据替代方案,lacO1、lacO2或lacO3的功能变体包含1、2、3、4或5个点突变或者1、2、3、4或5个碱基对(bp)的缺失。

具体地,与编码所述目的蛋白的编码序列可操作地连接的所述启动子包含初始转录序列(ITS),优选天然T7A1初始转录序列(SEQ ID NO:2)。

根据本文提供的系统,所述目的蛋白的表达率由结合LacI的诱导剂调节。具体地,LacI与所述至少一个lacO结合,从而阻遏编码所述目的蛋白的基因的转录。具体地,在添加能够结合LacI的诱导剂后,LacI与所述至少一个lacO的相互作用被阻止,从而导致诱导编码所述目的蛋白的基因的转录。

具体地,所述诱导剂选自异丙基硫代半乳糖苷(IPTG)、乳糖、甲基-β-D-硫代半乳糖苷、苯基-β-D-半乳糖和邻硝基苯基-β-半乳糖苷(ONPG)。

具体地,与表达所述目的蛋白的编码序列可操作地连接的启动子包含初始转录序列,优选天然T7A1初始转录序列。具体地,所述初始转录序列不限于T7A1的ITS,并且可以是本领域技术人员已知的任何ITS。

根据本文提供的诱导型系统的具体实施方案,用于表达目的蛋白的基因含有一个在与天然T7A1初始转录序列(SEQ ID NO:2)和所述编码序列可操作地连接的启动子序列内的lacO1操纵基因,并且其中所述LacI启动子是lacI

根据本文提供的诱导型系统的另一个具体实施方案,所述目的基因含有两个间隔至少约92或94个碱基对(bp),优选间隔至少约103、105、114、116、125、127、136、138或149bp的lac操纵基因,其中一个lac操纵基因位于与所述编码序列可操作地连接的启动子序列内,并且第二个lac操纵子在所述启动子的上游。

具体地,编码所述目的蛋白的基因是异源基因。具体地,对所述原核宿主而言异源的所述基因是引入所述宿主中的重组基因。

根据另一个具体实施方案,编码所述目的蛋白的基因是同源基因。具体地,对所述原核宿主而言同源的所述基因包含编码所述目的蛋白的编码序列;与所述编码序列可操作地连接的启动子,其中所述启动子被由所述宿主的染色体中的基因表达的RNAP识别;以及所述启动子序列内的至少一个lac操纵基因(lacO)。

具体地,对所述原核宿主而言同源的所述基因是引入所述宿主中的重组基因。根据又另一个具体实施方案,通过用本文所述的启动子替换对所述基因而言内源的启动子来修饰对所述原核宿主而言同源的所述基因。替换还可以意味着整合本文所述的启动子,使得它与所述宿主细胞的染色体/基因组中的内源同源基因/多肽可操作地连接,其中所述内源同源基因/多肽的天然存在的启动子被所述天然存在的启动子内的至少一个点突变灭活。具体地,用本文所述的启动子替换对所述基因而言内源的启动子,本文所述的启动子在所述启动子的序列内包含至少一个lacO,优选至少两个lacO,其中一个lacO在所述启动子的序列内,并且第二个lacO在所述启动子的上游。具体地,lacI对替换编码所述目的蛋白的基因的内源启动子的启动子的一个或多个lacO的亲和力低于LacI对内源lac操纵子的lacO1和lacO3的亲和力。

具体地,与用于表达目的蛋白的基因的编码序列可操作地连接的启动子是重组启动子。具体地,所述启动子不是野生型lac启动子,然而,它可以是lac启动子的变体。在本文所述的启动子是lac启动子的变体的情况下,它在其序列内包含至少一个lacO,具体地,它在-10与-35启动子元件之间的序列内包含至少一个lacO。

本文还提供了一种使用本文所述的诱导型系统在原核宿主中无质粒产生目的蛋白的方法,所述方法包括以下步骤:

a)培养所述宿主细胞并通过添加诱导剂诱导目的基因的表达,

b)收获所述目的蛋白,以及

c)分离和纯化所述目的蛋白,以及任选地

d)修饰所述目的蛋白,以及

e)配制所述目的蛋白。

根据本文所述的系统的具体实施方案,用于产生所述目的蛋白的基因和/或用于产生lac阻遏蛋白的lacI基因包含在至少一个表达盒中。优选地,使用所述表达盒来将用于产生所述目的蛋白的基因和/或用于产生lac阻遏蛋白的lacI基因整合到所述原核宿主的染色体中。

本文还提供了一种表达盒,所述表达盒包含被配置为产生至少一种异源目的蛋白的至少一个异源基因,所述目的基因包括

a)编码所述一种或多种目的蛋白的一个或多个编码序列,

b)与所述编码序列可操作地连接的启动子,以及

c)与所述启动子可操作地连接的至少一个lac操纵基因(lacO)。

具体地,LacI对所述表达盒中包含的至少一个lacO的亲和力低于LacI对宿主细胞的lac操纵子的lac操纵基因lacO1和lacO3的亲和力。优选地,所述lac操纵子是对所述宿主细胞而言内源的lac操纵子。

根据本文提供的表达盒的具体实施方案,被配置为产生至少一种异源目的蛋白的异源基因包括两个间隔至少92或94bp的lac操纵基因,其中一个lac操纵基因位于所述启动子的序列内,并且第二个lac操纵基因在所述启动子的上游。优选地,所述两个lac操纵基因间隔至少约92至134bp,优选地,它们间隔至少约103、105、114、116、125或136或138或149bp。具体地,所述两个lac操纵基因间隔92、94、103、105、114、116、125、136、138或149bp。

根据本文提供的表达盒的具体实施方案,被配置为产生至少一种异源目的蛋白的异源基因包含与所述编码序列和天然T7A1初始转录序列(SEQ ID NO:2)可操作地连接的启动子序列内的lacO1操纵基因。具体地,所述表达盒还包含异源lacI启动子,其是lacI

本文还提供了一种使用本文所述的表达盒以制造规模在原核宿主中无质粒产生目的蛋白的方法,所述方法包括以下步骤:

a)将所述表达盒整合到所述原核宿主的染色体中,

b)培养所述宿主细胞并通过添加诱导剂诱导目的基因的表达,

c)收获目的蛋白,以及

d)分离和纯化所述目的蛋白,以及任选地

e)修饰所述目的蛋白,以及

f)配制所述目的蛋白。

根据本文提供的方法和系统的具体实施方案,所述原核宿主含有整合在附着位点,优选attTn7、lacZ、recA、tufa或attnB位点处的表达盒。

附图说明

图1:整合盒的方案。GFPmut3.1的表达受七种不同的启动子/操纵基因组合的控制。将T7表达系统用作参考。将盒克隆到pET30a-cer载体(用圆括号指定)中或整合到BL21基因组(B)resp.BL21

图2:不同启动子/操纵基因组合在未诱导的(0mM IPTG)和诱导的(0.5mM IPTG)条件下的启动子活性。使用报告物GFPmut3.1的荧光(y轴)来表征基因组整合的表达系统(A)和基于质粒的表达系统(B)。克隆到pET30a-cer载体中的整合盒用圆括号指定,整合到BL21基因组(B)resp.BL21Q(如实施例1所述)(BQ)的attTN7位点中的整合盒用方括号指定。

图3:在补料分批样微量滴定培养中,通过GFP在线荧光过程(y轴)表示的lac操纵基因对GFP表达和GFP表达的可调谐性的影响。垂直虚线表示诱导时间。A–D:由三个lacO(B<3lacO-T5>)(A)、两个lacO(B<2lacO-T5>)(B)、一个lacO(B<1lacO-T5>)(C)和一个lacO/lacI

图4:用不同水平的诱导剂控制重组基因表达。B<2lacO-A1>、BQ<1lacO-A1>和B3中的GFPmut3.1表达的流式细胞术分析。

图5:在天然lac操纵子(顶部)和目的基因(底部)上的lac操纵基因结合位点的方案。目的基因的启动子由一个lac操纵基因(A)或两个间隔62bp的lac操纵基因(B)调节。

图6:本文提及的SEQ ID NO。

图7:重组表达率控制对LacI浓度的影响。使(A)BL21野生型细胞(泳道1-3)和B<2lacO-A1>(泳道4-6)在没有IPTG(泳道1和4)、有0.01mM IPTG(泳道2和5)和有0.5mM IPTG(泳道3和6)的情况下生长。通过SDS-PAGE分离约1.2x10

图8:在碳限制指数补料分批培养期间,B3的过程特征和产物形成动力学。在1.5L

图9:在碳限制指数补料分批培养期间,BQ的过程特征和产物形成动力学。在1.5L

具体实施方式

除非另有指示或定义,否则本文所用的所有术语均具有其在本领域中的通常含义,这对于技术人员将是清楚的。例如参考标准手册,如Sambrook等人,“MolecularCloning:A Laboratory Manual”(第2版),第1-3卷,Cold Spring Harbor LaboratoryPress(1989);Lewin,“Genes IV”,Oxford University Press,New York,(1990);以及Janeway等人“Immunobiology”(第5版或更近的版本),Garland Science,New York,2001。

如本文所用的术语“包含”、“含有”、“具有”和“包括”可以同义使用,并且应当理解为开放性定义,从而允许另外的成员或部分或要素。“组成”被认为是最接近的定义,而没有组成定义特征的另外的要素。因此,“包含”的范围更广,并且含有“组成”的定义。

如本文所用的术语“约”是指相同的值或与给定值相差+/-5%的值。

基因组整合的(即无质粒)表达系统提供了显著的优势。与基于质粒的表达系统相比,在生产过程期间不存在质粒介导的代谢负荷和基因剂量的变化。然而,采用依赖于在诱导型启动子控制下的T7 RNA聚合酶的强T7启动子的基于T7的表达系统领域的当前现状仍存在相当大的缺陷。T7表达系统的强度对宿主细胞施加极端的代谢负荷。当目的基因编码具有挑战性的蛋白质时,应力和代谢负担往往导致产量降低、生产周期缩短,甚至细胞死亡。此外,T7表达系统是渗漏的,因为它显示出显著的基础表达,并且T7 RNA聚合酶在长期生产条件下容易发生突变。

本文提供的无质粒诱导型表达系统具有深厚的优势,即表达率在单细胞水平上是可调谐的,它表现出非常低的基础表达,并且在重组蛋白产生方面是非常高效的。此外,它提供了对表达率的真正控制、可忽略不计的基础表达以及即使在低诱导物浓度下的高表达率,这对产生具有挑战性的蛋白质特别有利。

如本文所用的术语“无质粒”或“基于基因组”是指目的蛋白在原核宿主中的表达系统,其中用于表达目的蛋白的基因位于宿主的基因组中。具体地,所述基因是位于原核宿主染色体上的内源同源基因,或者是整合到原核宿主染色体中的重组异源或同源基因。

根据具体实施方案,使用包含所述基因的一个或多个表达盒,将用于表达目的蛋白的基因和任选地用于表达lac阻遏蛋白的lacI基因或重组lacI启动子整合到宿主的基因组中。

具体地,将另外的重组异源或同源基因(如编码RNA聚合酶的基因或编码辅助蛋白的基因)引入原核宿主中。所述另外的重组异源或同源基因可以引入宿主的染色体中,或者可以存在于宿主细胞中的质粒上。

与“表达盒(expression cartridge)”或简单的“盒(cartridge)”同义使用的术语“表达盒(expression cassette)”或简单的“盒(cassette)”是指待整合到原核生物基因组(如细菌基因组)中的线性或圆形DNA构建体。整合的结果是,表达宿主细胞具有整合的表达盒。优选地,盒是线性DNA构建体,其基本上包含启动子、目的基因、紧靠目的基因上游的Shine-Dalgarno(SD)序列(也称为核糖体结合位点(RBS))和两个末端侧翼区,所述末端侧翼区与基因组区同源并使得能够进行同源重组。另外,盒可以含有其他序列,例如像编码抗生素选择标记、原养选择标记或荧光标记的序列,编码代谢基因的标记,改进蛋白质表达的基因或使得能够在整合后去除某些序列(例如抗生素抗性基因)的两个翻转酶识别靶位点(FRT)。

通过本领域已知的方法合成和扩增表达盒,在线性盒的情况下,通常通过标准聚合酶链反应PCR进行合成和扩增。由于线性盒通常更容易构建,因此它们优选用于获得在本文提供的系统和方法中使用的表达宿主细胞。此外,使用线性表达盒提供的优势是,可以通过盒的侧翼同源区的相应设计自由地选择基因组整合位点。因此,线性表达盒的整合允许关于基因组区的更大可变性。

表达载体包含本文所述的表达盒,并且另外任选地包含与基因组整合位点同源的侧翼区、多个限制性内切酶切割位点、初始转录序列(ITS)和转录终止子,以及任选地一种或多种可选择标记(例如,氨基酸合成基因或赋予对抗生素(如氨苄青霉素、卡那霉素、氯霉素或链霉素)的抗性的基因),所述组分可操作地连接在一起。常见类型的载体是“质粒”,其通常是双链DNA的自含分子,可以容易地接受另外的(外来的)DNA,并且可以容易地引入合适的宿主细胞中。具体地,术语“载体”或“质粒”是指这样的媒介物,通过它可以将DNA或RNA序列(例如外来基因)引入宿主细胞中,从而转化宿主并促进所引入序列的表达(例如转录和翻译)。

如本文所用,术语“原核宿主”是指任何细菌宿主,特别地它是指细菌宿主细胞。原则上,除下文详述的某些特定要求外,对细菌宿主细胞的选择没有限制。细菌宿主细胞可以是真细菌(革兰氏阳性或革兰氏阴性)或古细菌,只要它们允许用于插入目的基因(有利地用于位点特异性整合)的遗传操作即可。优选地,细菌宿主细胞允许以制造规模培养。优选地,宿主细胞具有允许培养到高细胞密度的特性。已证实适用于重组工业蛋白质产生的细菌宿主细胞的例子是大肠杆菌、枯草芽孢杆菌(Bacillus subtilis)、荧光假单胞菌(Pseudomonas fluorescens)以及其变体和乳酸乳球菌(Lactococcus lactis)菌株。优选地,宿主细胞是大肠杆菌细胞。

对宿主细胞的一个要求是它包含这样的RNA聚合酶,其可以与控制编码目的蛋白的基因的启动子结合。

在某些实施方案中,考虑到选择,宿主细胞在其基因组中携带标记基因。

考虑到位点特异性基因插入,对宿主细胞的另一个要求是,它含有至少一个基因组区(编码或任何非编码功能或非功能区或具有未知功能的区域),所述区域的序列已知,并且可以被破坏或以其他方式操纵以允许插入异源序列,而对细胞无害。

关于整合基因座,本发明中使用的表达系统允许广泛的可变性。原则上,可以选择具有已知序列的任何基因座,条件是序列的功能是可有可无的,或者是必需的,可以被补充(例如在营养缺陷型的情况下)。

目的基因向细菌基因组中的整合可以通过常规方法来实现,例如通过使用含有与染色体上特定位点同源的侧翼序列的线性盒,如例如在(30)中针对attTn7位点所述。此外,使用线性表达盒提供的优势是,可以通过盒的侧翼同源区的相应设计自由地选择基因组整合位点。因此,线性表达盒的整合允许关于基因组区的更大可变性。在优选实施方案中,线性盒的整合是在如attB位点或attTn7位点等附着位点处,所述位点是已被充分证实的整合位点。可用于本发明的其他整合方法的例子(但不限于)是例如基于Red/ET重组的那些方法,例如(31)中所述。可替代地,可以首先将表达盒整合到中间供体宿主细胞的基因组中,然后通过P1噬菌体的转导可以将其转移到宿主细胞中,例如(32)中所述。本文使用的整合方法不限于上述例子;而是可以使用本领域已知的任何整合方法。

用于获得表达宿主细胞的整合方法不限于在基因组中的一个位点处整合一个目的基因;它们允许关于整合位点和表达盒两者的可变性。举例来说,可以插入多于一个目的基因,即可以将在相同或不同启动子控制下的两个或更多个相同或不同序列整合到基因组上的一个或多个不同基因座中。举例来说,它允许形成异二聚体复合物的两种不同蛋白质的表达。异二聚体蛋白由两个单独表达的蛋白质亚基(例如单克隆抗体或抗体片段的重链和轻链)组成。

尽管本发明允许无质粒产生目的蛋白,但不排除在表达宿主细胞中可能存在携带除了目的基因之外的待表达序列(例如辅助蛋白和/或重组蛋白)的质粒。优选地,应当注意在此类实施方案中,本发明的优势不应当被质粒的存在所否定,即质粒应当以低拷贝数存在并且不应当向细胞施加代谢负担。

将一个或多个重组基因整合到基因组中导致每个细胞具有离散的和预先定义数量的目的基因。在插入一个基因拷贝的本发明的实施方案中,与伴随着高达几百个拷贝数的基于质粒的表达相比,此数量通常为一个(除了在细胞含有多于一个染色体或基因组的情况下,因为它在细胞分裂期间瞬时发生)。在本发明方法中使用的表达系统中,通过减轻来自质粒复制的宿主代谢,细胞合成能力的增加部分被用于重组蛋白产生。

特别的优势在于本文所述的诱导型表达系统关于诱导水平没有限制。这意味着系统不能被“过度诱导”,因为这经常发生在基于质粒的系统中,或采用强启动子的系统(如T7表达系统)中。由于基于基因组的表达系统允许对蛋白质表达的精确控制,因此与取决于或依赖于良好控制的表达的表达靶向途径组合是特别有利的。在优选实施方案中,本发明的方法包括使目的蛋白从细菌细胞质分泌(排泄)到周质和/或培养基中。此实施方案的优势是优化且持续的蛋白质分泌率,与现有技术的分泌系统相比,从而产生更高滴度的分泌蛋白质。具体地,这可以通过融合在目的蛋白N末端的信号肽/编码信号肽的核苷酸序列来实现,所述信号肽将目的蛋白导向宿主的转运体,引起易位进入宿主的周质内并被宿主的信号肽酶切割。可以使用本领域已知的任何信号肽,如但不限于ompA-、pelB、malE-、phoA-、dsbA-、lysC-、lolB-、pyrL-前导肽。

如本文所用,术语“RNA聚合酶(RNAP)基因”是指表达RNAP的基因,所述基因包含在原核宿主的基因组中,例如质粒或染色体中。优选地,所述基因表达对原核宿主而言内源的RNAP。

在细菌中,相同的酶催化mRNA和非编码RNA(ncRNA)的合成。RNAP是大分子;核心酶具有五个亚基(约400kDa)。为了结合启动子,RNAP核心与转录起始因子西格玛(σ)缔合以形成RNA聚合酶全酶。西格玛降低了RNAP对非特异性DNA的亲和力,同时增加了对启动子的特异性,从而允许转录在正确的位点处启动。因此,完整的全酶具有6个亚基(约450kDa)。核心酶负责与模板DNA结合以合成RNA,其由σ因子补充以形成全酶,所述全酶识别启动子序列,从而开始启动子特异性转录。

根据优选实施方案,本文所述的系统的原核宿主细胞是大肠杆菌细胞,并且RNAP是对大肠杆菌而言内源的RNAP,最优选地它是σ

术语“表达”是按以下方式理解的。含有表达产物(例如像如本文所述的重组蛋白)的所需编码序列和控制序列(例如像可操作连接的启动子)的核酸分子可以用于表达目的。用这些序列转化或转染的宿主能够产生编码的蛋白质。为了实现转化,表达系统可以包括在载体中;然而,最优选地,将相关DNA整合到宿主染色体中。

如本文所用的术语“基因”是指至少包含启动子DNA(任选地包括操纵基因DNA)和编码特定多肽或蛋白质的特定氨基酸序列的编码DNA的DNA序列。启动子DNA是启动、调节或以其他方式介导或控制编码DNA表达的DNA序列。启动子DNA和编码DNA可以来自同一基因或来自不同基因,并且可以来自相同或不同的生物体。

如本文所用的术语“重组”意当意指“由遗传工程制备或是遗传工程的结果”。具体地,重组宿主包含重组表达载体或克隆载体,或者它已被遗传工程化以含有重组核酸序列,特别是采用对宿主而言外来的核苷酸序列。通过在宿主中表达相应的重组核酸来产生重组蛋白。

关于目的蛋白(POI),没有限制。更具体地,蛋白质可以是不天然存在于宿主细胞中的多肽,即异源蛋白,或者对宿主细胞而言可以是天然的,即宿主细胞的同源蛋白,但是例如在通过重组技术将编码同源POI的核酸序列的一个或多个拷贝整合到宿主细胞的基因组或染色体中时产生,或者通过重组修饰控制编码POI的基因表达的启动子序列而产生。POI可以是单体、二聚体或多聚体,它可以是同聚体或异聚体。

可以通过本发明的方法产生的蛋白质的例子是但不限于酶、调节蛋白、受体、肽,例如肽激素、细胞因子、膜或转运蛋白。目的蛋白还可以是用于接种的抗原、疫苗、抗原结合蛋白、免疫刺激蛋白、过敏原、全长抗体或抗体片段或衍生物。抗体衍生物可以是例如单链可变片段(scFv)、Fab片段或单结构域抗体。

编码目的蛋白的DNA分子也被称为“目的基因”。具体地,目的基因包括编码目的蛋白的DNA序列、与编码序列可操作地连接的启动子和启动子序列内的至少一个lac操纵基因。

此外,编码POI的目的基因可以是天然存在的DNA序列或非天然DNA序列。一个或多个目的基因可以在如本文所述的一个启动子的控制下。可替代地,每个目的基因都在一个启动子下。目的基因可以均在同一表达盒上,或者在多个表达盒上。可以按任何方式修饰POI。修饰的非限制性例子可以是翻译后修饰位点的插入或缺失,靶向信号(例如:前导肽)的插入或缺失,与便于纯化或检测的标签、蛋白质或蛋白质片段的融合,影响稳定性变化或溶解度变化的突变或本领域已知的任何其他修饰。在本发明的某些实施方案中,重组蛋白是生物药物产品,其可以是适用于哺乳动物的治疗或预防目的的任何蛋白质。

如本文所用的术语“启动子”是指允许RNA聚合酶结合和转录启动的表达控制元件。具体地,与如本文所述的目的基因可操作地连接的启动子在其序列内包含至少一个lac操纵基因。具体地,所述至少一个lac操纵基因位于-10与-35元件之间,所述元件优选地位于转录起点之前的10和35个核苷酸(-10和-35),如图1所例示。

lac启动子是lac操纵子的启动子,所述启动子控制三个lac基因lacZ、lacY和lacA的转录。野生型lac启动子在其序列内不包含lac操纵基因,因为它在-10与-35启动子元件之间不包含lacO。优选地,在本文所述的诱导型表达系统中,lac启动子是包含内源lac操纵基因的内源lac启动子。根据具体实施方案,对内源lac启动子的一个或多个lac操纵基因进行遗传修饰以增加其与lac阻遏分子LacI的结合亲和力。具体地,对它们进行遗传修饰,使得它们对lac阻遏分子LacI的亲和力大于与目的基因可操作地连接的启动子的lac操纵基因的亲和力。

如本文所用的lacI启动子是与lacI基因的编码序列可操作地连接的启动子。具体地,本文所述的诱导型系统包括野生型lacI启动子或增加LacI表达的经遗传修饰的lacI启动子,如本文所述的示例性lacI

与编码如本文所述的目的蛋白的基因可操作地连接的启动子可以是由宿主染色体中包含的RNAP基因编码的RNAP识别的任何诱导型启动子。

根据本发明的某些实施方案,目的基因可以在以下启动子的控制下:lac、lacUV5、tac或trc启动子;lac或lacUV5启动子;T5启动子(Gentz和Bujard,1985),如T5

根据具体实施方案,本文所述的启动子(其与编码目的蛋白的序列可操作地连接)在其序列内包含lacO。在细菌中,启动子的序列通常含有两个短序列元件,其在野生型启动子中通常在转录起始位点上游大约10和35个核苷酸。这些序列在许多细菌菌株中是保守的。例如,在-10个核苷酸处的序列(也称为-10元件)通常具有共有序列TATAAT(SEQ ID NO:34),并且在-35处的序列(也称为-35元件)具有共有序列TTGACA(SEQ ID NO:35)。上述共有序列虽然平均而言是保守的,但并非发现在所有启动子中均完整。平均而言,在任何给定启动子中,仅发现每个共有序列中的6个碱基对中的3至4个。迄今为止,很少有天然启动子被鉴定出在-10和-35元件两者处都具有完整的共有序列。具体地,具有完全保守的-10和-35元件的人工启动子转录的频率低于与共有序列具有少量错配的那些启动子。

具体地,本文所述的启动子在-10与-35元件之间包含至少一个lacO。

与“诱导物(inductor)”同义使用的术语“诱导剂(inducer)”是指能够通过直接或间接调节启动子活性而导致诱导转录的因子。具体地,如本文所用,诱导剂是能够结合lac阻遏分子并抑制其与可操作地连接到目的基因的启动子相互作用的任何因子。优选地,本文使用的诱导剂是异丙基硫代半乳糖苷(IPTG)、乳糖、甲基-β-D-硫代半乳糖苷、苯基-β-D-半乳糖或邻硝基苯基-β-半乳糖苷(ONPG)。

对进行蛋白质表达诱导的模式没有限制。举例来说,诱导物可以作为单个或多个团料或者通过连续进料来添加,后者也被称为“诱导物给料(进料)”。对诱导发生的时间点没有限制。可以在开始培养时或在开始连续营养物进料时或在开始进料后(迟于)添加诱导物。可以通过将诱导物包含在培养基中或者通过单独进料来完成诱导物进料。诱导物进料的优势在于它允许控制诱导物剂量,即它允许在生产系统中维持每恒定数量目的基因的限定或恒定量的诱导物的剂量。例如,诱导物进料允许与生物质成比例的诱导物剂量,从而导致诱导物与生物质的比率恒定。诱导物剂量可以基于的生物质单位可以是例如细胞干重(CDW)、湿细胞重量(WCW)、光密度、总细胞数(TCN;每体积细胞)或菌落形成单位(每体积CFU)或与生物质成比例的在线监测信号(例如荧光、浊度、光散射、介电容量、废气中的二氧化碳浓度等)。本质上,本发明的方法允许每个与生物质成比例的任何参数或信号的诱导物的精确剂量,而不管信号是离线还是在线测量的。由于每个生物质单位的目的基因的数量是限定且恒定的(每个细胞一个或多个基因),因此这种诱导模式的结果是每个目的基因的诱导物的剂量是恒定的。作为另一个优势,可以通过实验确定和优化相对于生物质量的诱导物量的精确和最佳剂量。

可能没有必要通过分析方法来确定实际的生物质水平。例如,以基于先前培养(历史生物质数据)的量添加诱导物可能就足够了。在另一个实施方案中,可以优选地添加如理论计算或预测的每一个生物质单位的诱导物的量。例如,对于基于进料的培养(如补料分批或连续的),熟知的是给料培养基中一个单位的限制生长的组分(通常是碳源)将产生一定量的生物质。

优选地,以范围为0.005mM至1mM、甚至更优选0.01mM至0.5mM的浓度使用诱导剂。具体地,IPTG的浓度在1-100μmol/g CDW的范围内。

如本文所提供的,在本文所述的诱导型表达系统中使用的宿主包含lac操纵子(优选野生型lac操纵子)和lacI基因。

如本文所提及,内源lac操纵子含有三个基因:lacZ、lacY和lacA。这些基因在一个启动子的控制下作为单一mRNA转录。除了这三个基因之外,lac操纵子还包含lac启动子和lac操纵基因lacO1、lacO2和lacO3。lac启动子是RNA聚合酶的结合位点。lac操纵基因是由lac阻遏蛋白结合的负调节位点。操纵基因与启动子重叠,并且当lac阻遏蛋白被结合时,RNA聚合酶不能与启动子结合并开始转录。根据具体实施方案,对内源lac操纵子进行修饰以增加LacI对lac操纵基因lacO1、lacO2或lacO3中的至少一个的结合亲和力。具体地,对lac操纵基因lacO1、lacO2或lacO3中的至少一个进行修饰,即内源lac操纵子包含lacO1、lacO2和/或lacO3的对LacI的亲和力增加的功能变体。

如本文所用,术语“lacI基因”是指用于表达lac阻遏蛋白(也称为lac抑制物(LacI))的基因,或其与lacI(SEQ ID NO:26)具有至少30%序列同一性的任何功能变体。具体地,所述基因包含lacI编码序列、与lacI编码序列可操作地连接的lacI启动子,其中lacI启动子选自野生型lacI启动子和增加lacI表达的lacI启动子。具体地,lacI基因表达LacI或其功能活性变体,所述变体与LacI(SEQ ID NO:27)包含至少40%、50%、60%、70%、80%或90%序列同一性。具体地,增加LacI表达的lacI启动子是强启动子,其使LacI表达增加至少1.5、2、2.5或5倍,优选10倍或更多。具体地,它使LacI表达增加至少20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍或甚至100倍。本文提供的诱导型系统的示例性实施方案包含lacI

在野生型大肠杆菌中,lac阻遏蛋白形成与lac操纵基因序列(lacO)结合并阻遏lacZYA操纵子转录的同四聚体。在乳糖或不可代谢的异丙基β-D-1-硫代吡喃半乳糖苷(IPTG)的存在下,LacI改变其结构,并且不能再与lac操纵基因结合,从而导致诱导转录。lac操纵基因位点是具有反向重复对称性的DNA序列。

对称性越高,LacI与操纵基因序列的结合亲和力越大。发现人工完全对称的lacO(sym-lacO)以最大亲和力结合LacI,而表现出近似对称性的三个野生型操纵基因lacO1、lacO2和lacO3显示出较低亲和力,从而导致关于对LacI的亲和力出现以下顺序:sym-lacO>lacO1>lacO2>lacO3。LacI通过DNA环化机制同时与主操纵基因lacO1以及lacO2或lacO3结合。LacO2位于lacO1下游401bp,而lacO3位于lacO1上游仅92bp。对阻遏的主要贡献来自lacO1和lacO3的DNA环化,因为它们更接近。此外,当lacO1和lacO3被LacI结合时,阻止了LacI本身的产生。lacI基因的3'端与lacO3重叠。在阻遏状态下,lacI的转录产生截短的mRNA,其被细胞快速降解。由于这种自动调节,LacI四聚体的浓度在诱导的细胞中为约40个分子,并且在非诱导的细胞中为约15个分子。

lac操纵基因的序列是本领域熟知的。示例性lac操纵基因序列由SEQ ID NO:3-5提供。

本文公开的核酸或多肽序列(特别是lacO1、lacO2和lacO3)的合适变体是具有与序列所对应的核酸或多肽相同类型的活性(而不考虑活性程度)的功能变体。可以根据以下实施例中描述的测定和根据本领域已知的方法来测试此类活性。

术语“功能变体”或功能活性变体还包括天然存在的等位基因变体以及突变体或任何其他非天然存在的变体。如本领域已知的,等位基因变体是核酸或肽的替代形式,其特征在于具有基本上不改变核酸或多肽的生物学功能的一个或多个核苷酸或氨基酸的取代、缺失或添加。

功能变体可以通过多肽或核苷酸序列中的序列改变(例如通过一个或多个点突变)来获得,其中当与本发明组合使用时,序列改变保留了或改进了未经改变的多肽或核苷酸序列的功能。此类序列改变可以包括但不限于(保守的)取代、添加、缺失、突变和插入。

点突变特别地被理解为多核苷酸的工程化,其导致氨基酸序列的表达,所述氨基酸序列与非工程化氨基酸序列的不同之处在于对不同氨基酸的一个或多个单个(非连续的)或双氨基酸的取代或交换、缺失或5插入。

lacO1操纵基因的示例性功能变体是野生型lacO1的2个碱基对截短的版本lacO*(SEQ ID NO:6),所述版本在其5'端包含2bp的缺失。

转录率控制(也称为蛋白质生产的精细调谐或“可调谐性”)在生物加工方面是高度相关的。生物过程被设计成最大限度地利用细胞在最长周期期间的合成能力,从而产生正确折叠和加工的蛋白质。但是,已知强表达系统(例如像T7表达系统)表现出“全或无”行为,其中部分诱导的培养物中表达水平的降低是完全诱导的和非诱导的细胞亚群形成的结果。通过本文所述的诱导型表达系统解决了这样的问题,所述系统允许可调谐性,特别是单细胞可调谐性。在本文所述的诱导型表达系统中,LacI对与目的基因可操作地连接的启动子的至少一个lacO的亲和力低于LacI对宿主的内源lac操纵子的lac操纵基因lacO1和lacO3的亲和力。如果LacI与目的基因(GOI)处的至少一个lacO的结合常数(K

然而,在本文所述的诱导型表达系统中,LacI与目的基因(GOI)处的至少一个lacO的结合常数(K

如本文所用,术语“亲和力”或“结合亲和力”是指配体与受体之间的缔合强度,如由解离和/或缔合常数所定义。解离常数(K

通常,结合剂被认为是解离常数为至少K

在本文所述的诱导型表达系统中,LacI对目的基因的一个或多个lacO的结合亲和力低于LacI对内源lac操纵子的lac操纵基因lacO1和lacO3的亲和力。具体地,lacI以至少K

具体地,通过亲和力ELISA测定来确定结合亲和力。在某些实施方案中,通过BIAcore、ForteBio或MSD测定来确定结合亲和力。在某些实施方案中,通过动力学方法来确定结合亲和力。在某些实施方案中,通过平衡/溶液方法来确定结合亲和力。本领域技术人员可以确定适当的参数以确定配体对某一分子的结合亲和力。结合亲和力可以由本领域技术人员常规地确定。

如本文所述的“序列同一性”或“百分比(%)氨基酸序列同一性”定义为在比对序列并且必要时引入空位以实现最大百分比序列同一性,并且不考虑任何保守性取代作为序列同一性的一部分之后,候选序列中与待比较的特定核苷酸或多肽序列(“亲本序列”)中的核苷酸或氨基酸残基相同的核苷酸或氨基酸残基的百分比。本领域技术人员可以确定用于测量比对的适当参数,包括为了在被比较的序列的全长上实现最大比对所需要的任何算法。

如本文所用的术语“可操作地连接”是指在单个核酸分子(即载体)上的核苷酸序列的缔合,其方式使得一个或多个核苷酸序列的功能受到存在于所述核酸分子上的至少一个其他核苷酸序列的影响。例如,当启动子能够影响编码目的蛋白的编码序列的表达时,所述启动子与该编码序列可操作地连接。具体地,彼此可操作地连接的此类核酸可以直接连接,即在它们之间没有另外的元件或核酸序列,或者可以与间隔序列或它们之间的其他序列间接连接。具体地,在lac操纵基因与启动子可操作地连接的上下文中,是指lac操纵基因调节启动子在特定条件下控制编码序列表达的能力的能力。如当lac阻遏蛋白与其结合时,lac操纵基因抑制目的基因的启动子依赖性表达的能力。

如本文关于核苷酸或氨基酸序列或蛋白质所用的术语“异源”是指这样的化合物,其对于给定宿主细胞而言是外来的,即“外源的”,如未在自然界中被发现;或者其在给定宿主细胞中被天然发现,例如是“内源的”,然而,在异源构建体的上下文中,例如采用异源核酸,因此是“非天然存在的”。如内源发现的异源核苷酸序列也可以在细胞中以非天然的(例如,大于预期的或大于天然发现的)量产生。异源核苷酸序列或包含异源核苷酸序列的核酸可能在序列上不同于内源核苷酸序列,但是编码与内源发现的相同蛋白质。具体地,异源核苷酸序列是在自然界中未发现与宿主细胞处于相同关系(即,“非天然相关”)的那些核苷酸序列。任何重组或人工核苷酸序列都被理解为是异源的。异源多核苷酸或核酸分子的例子包括与启动子非天然相关的核苷酸序列,例如以获得杂合启动子,或与编码序列可操作地连接,如本文所述。结果,可以获得杂合或嵌合多核苷酸。异源化合物的另一个例子是与转录控制元件(例如,启动子)可操作地连接的POI编码多核苷酸或基因,内源的天然存在的POI编码序列通常不与所述转录控制元件可操作地连接。

本发明此外包括以下项:

1.一种用于在原核宿主中产生目的蛋白(POI)的基于基因组的表达系统,所述表达系统至少包含

a)RNA聚合酶(RNAP)基因,

b)编码POI的基因,所述基因包含

-编码序列,

-与所述编码序列可操作地连接的启动子,其中所述启动子被由a)表达的RNAP识别,和

-所述启动子序列内的至少一个lac操纵基因(lacO);以及

c)用于表达lac阻遏蛋白(LacI)的lacI基因,所述lacI基因包含

-lacI编码序列,

-与所述lacI编码序列可操作地连接的lacI启动子,其中所述lacI启动子是野生型lacI启动子或增加LacI表达的lacI启动子;

其中所述目的蛋白的表达率由结合LacI的诱导剂调节。

2.根据项1所述的基于基因组的表达系统,其中编码POI的所述基因含有(i)在所述启动子的序列内的一个lacO,或(ii)在所述启动子的序列内的一个lacO和在所述第一lacO上游的一个lacO。

3.根据项1或2所述的基于基因组的表达系统,其中编码POI的所述基因含有在所述启动子的序列内的一个lacO,并且所述lacI启动子是增加LacI表达的启动子。

4.根据项1至3中任一项所述的基于基因组的表达系统,其中编码POI的所述基因含有在所述启动子的序列内的一个lacO和在所述第一lacO上游的一个lacO,并且所述lacI启动子是增加LacI表达的启动子。

5.根据项1至4中任一项所述的基于基因组的表达系统,其中所述原核宿主是大肠杆菌(Escherichia coli/E.coli)。

6.根据项1至5中任一项所述的基于基因组的表达系统,其中所述宿主是大肠杆菌菌株BL21或K-12。

7.根据项1至6中任一项所述的基于基因组的表达系统,其中所述RNAP是异源或同源RNAP,优选地所述RNAP是对所述宿主而言同源的RNAP,具体地其是大肠杆菌RNA聚合酶,优选σ

8.根据项1至7中任一项所述的基于基因组的表达系统,其中根据项1所述的b)中的启动子选自T5、T5

9.根据项1至8中任一项所述的基于基因组的表达系统,其中所述lacI启动子是增加LacI表达的lacI启动子,其是lacI

10.根据项1至9中任一项所述的基于基因组的表达系统,其中所述lac操纵基因是lacO1(SEQ ID NO:3)、lacO2(SEQ ID NO:4)或lacO3(SEQ ID NO:5)。

11.根据项10所述的基于基因组的表达系统,其中所述lac操纵基因是lacO1、lacO2或lacO3的具有至少65%序列同一性的功能变体或者完全对称的lacO。

12.根据项1至11中任一项所述的基于基因组的表达系统,其中与编码所述目的蛋白的编码序列可操作地连接的所述启动子包含初始转录序列(ITS),优选天然T7A1初始转录序列(SEQ ID NO:2)。

13.根据项1至12中任一项所述的基于基因组的表达系统,其中所述诱导剂选自异丙基硫代半乳糖苷(IPTG)、乳糖、甲基-β-D-硫代半乳糖苷、苯基-β-D-半乳糖和邻硝基苯基-β-半乳糖苷(ONPG)。

14.根据项1至13中任一项所述的基于基因组的表达系统,其中用于表达目的蛋白的所述基因含有一个在与所述编码序列和所述天然T7A1初始转录序列(SEQ ID NO:2)可操作地连接的启动子序列内的lacO1操纵基因,并且其中所述lacI启动子是lacI

15.根据项1至14中任一项所述的基于基因组的表达系统,其中所述目的基因含有两个间隔至少92或94个碱基对(bp),优选间隔103、105、114、116、125、127、134、136、138或149bp的lac操纵基因,其中一个lac操纵基因位于与所述编码序列可操作地连接的启动子序列内,并且第二个lac操纵基因在所述启动子的上游。

16.根据项1至15中任一项所述的基于基因组的表达系统,其中编码所述目的蛋白的基因是异源基因。

17.根据项1至16中任一项所述的系统,其中对所述原核宿主的lac操纵子的至少一个lac操纵基因进行遗传修饰以增加其对所述lac阻遏分子LacI的结合亲和力。

18.一种使用根据项1至17中任一项所述的基于基因组的表达系统在原核宿主中无质粒产生目的蛋白的方法,所述方法包括以下步骤:

a)通过添加诱导剂诱导编码所述POI的基因的表达,

b)收获所述POI,

c)分离和纯化所述POI,以及任选地

d)修饰,以及

e)配制所述POI。

19.一种包含被配置为产生至少一种异源POI的至少一个异源基因的表达盒,所述异源基因包括

a)编码所述一种或多种POI的一个或多个编码序列,

b)与所述一个或多个编码序列可操作地连接的启动子,以及

c)所述启动子序列内的至少一个lac操纵基因(lacO);

其中LacI对c)的lacO的亲和力低于LacI对宿主细胞的内源lac操纵子的lac操纵基因lacO1和lacO3的亲和力。

20.根据项19所述的表达盒,其中被配置为产生至少一种异源目的蛋白的异源基因包括两个间隔至少92或94bp的lac操纵基因,其中一个lac操纵基因位于所述启动子的序列内,并且第二个lac操纵基因在所述启动子的上游。

21.根据项19或20所述的表达盒,所述表达盒还包含异源lacI启动子,其是lacI

22.根据项19至21中任一项所述的表达盒,其中被配置为产生至少一种异源POI的异源基因包含与所述编码序列和天然T7A1初始转录序列(SEQ ID NO:2)可操作地连接的启动子序列内的lacO1操纵基因。

23.一种使用根据项19至22中任一项所述的表达盒以制造规模在原核宿主中无质粒产生目的蛋白的方法,所述方法包括以下步骤:

a.将所述表达盒整合到所述原核宿主的染色体中,

b.通过添加诱导剂诱导编码所述POI的基因的表达,

c.收获所述POI,

d.分离和纯化所述POI,以及任选地

e.修饰,以及

f.配制所述POI。

24.一种用于在原核宿主中无质粒产生目的蛋白(POI)的诱导型系统,所述诱导型系统至少包含

a)所述宿主的染色体中的RNA聚合酶(RNAP)基因,

b)编码POI的基因,所述基因包含

-编码序列,

-与所述编码序列可操作地连接的启动子,其中所述启动子被由a)表达的RNAP识别,和

-所述启动子序列内的至少一个lac操纵基因(lacO);以及

c)编码lac阻遏蛋白(LacI)的lacI基因,所述lacI基因包含

-lacI编码序列,

-与所述lacI编码序列可操作地连接的lacI启动子,其中所述lacI启动子是野生型lacI启动子或增加LacI表达的lacI启动子;

其中LacI对b)的一个或多个lacO的亲和力低于lacI对所述宿主的内源lac操纵子的lac操纵基因lacO1和lacO3的亲和力,并且其中所述POI的表达率由结合LacI的诱导剂调节。

25.根据项24所述的系统,其中对所述原核宿主的lac操纵子的至少一个lac操纵基因进行遗传修饰以增加其对所述lac阻遏分子LacI的结合亲和力。

本文所述的例子是对本发明的说明,而不旨在是对本发明的限制。已根据本发明描述了本发明的不同实施方案。在不脱离本发明的精神和范围的情况下,可以对本文所述和说明的技术进行许多修改和改变。因此,应当理解,所述例子仅是说明性的,而不是限制本发明的范围。

实施例1:概述和本文实施例中使用的材料与方法。

本工作的目的是研究由σ

菌株和培养条件。大肠杆菌K-12NEB5-α[fhuA2Δ(argF-lacZ)U169 phoA gln V44Φ80Δ(lacZ)M15 gyrA96 recA1 relA1 endA1 thi-1hsdR17]从New England Biolabs(美国马萨诸塞州)获得并用于所有克隆程序。在大肠杆菌BL21[fhuA2[lon]ompT gal[dcm]ΔhsdS](New England Biolabs,美国马萨诸塞州)的attTN7位点处,将线性DNA盒整合到细菌染色体中。对于参考实验,用相应的质粒转化相同的菌株。将可溶性蛋白GFPmut3.1用作重组模式蛋白(19)。

根据Sambrook等人(24)进行基本的克隆方法,如限制性内切酶(REN)消化、琼脂糖凝胶电泳(AGE)、大肠杆菌质粒的连接和转化。

出于克隆目的,使细胞常规地在M9ZB培养基中生长,在SOC培养基中回收,并铺在M9ZB琼脂上。使用以下抗生素浓度:氨苄青霉素(Amp)100μg/ml或30μg/ml、卡那霉素(Kan)50μg/ml或30μg/ml以及氯霉素(Cm)20μg/ml或10μg/ml,分别用于基于质粒的和无质粒的表达系统。

培养条件

如由

对于补料分批发酵,使细胞在配备有标准控制单元的1.5L(1.2L工作体积,0.4L最小体积)

当培养物(在0.6L分批培养基中生长至6g细胞干质量(CDM))进入静止期时,模拟进料。将用指数碳限制底物给料的补料分批方案用于在2.5倍增时间内提供0.1/h的恒定生长速率。根据指数生长算法x-x0

菌株

BL21

为了将lacI

使用突出端PCR技术从pET30a中扩增pBR322 ori和lacI基因,以便添加在lacI启动子内的C->T突变以及限制性位点KpnI(5')和BamHI(3')。使用以下引物:KpnI-pBR322-for和BamHI-laciq-rev。

根据制造商的手册,使用

如由Sharan等人(26)所描述,整合到细菌染色体中发生在携带pSIM5质粒的大肠杆菌BL21(New England

根据制造商的手册,使用One

将引物AmpStop用于对经扩增DNA整合盒进行测序。

BL21Q::TN7<1lacOA1-GFPmut3.1-tZ>-简称为:BQ<1lacO-A1>

T7

根据制造商的手册,使用

如由Sharan等人(26)所描述,整合到细菌染色体中发生在携带pSIM5质粒的大肠杆菌BL21

将以下引物用于筛选阳性克隆:TN7/1_ext和TN7/2_ext。

将引物seq_MCS-for和seq_MCS-rev用于对经扩增DNA整合盒进行测序。

BL21Q::TN7<1lacOT5-GFPmut3.1-tZ>-简称为:BQ<1lacO-T5>

序列T5

BL21::TN7<2lacOA1-GFPmut3.1-tZ>和BL21::TN7<2lacOT5-GFPmut3.1-tZ>-简称为:B<2lacO-A1>和B<2lacO-T5>

除了由lacI

整合到细菌染色体中发生在大肠杆菌BL21(New England

如先前所述地进行线性DNA盒的扩增和筛选。

启动子/操纵基因组合的构建和表征。

根据Sambrook等人(24)进行基本的克隆方法,如限制性内切酶(REN)消化、琼脂糖凝胶电泳(AGE)、大肠杆菌质粒的连接和转化。为了将lacI

GFPmut3.1离线表达分析和定量

根据Reischer等人(28),通过ELISA对重组GFPmut3.1进行了定量。如先前所述(29)进行SDS-PAGE分析。

流式细胞术

使用Gallios流式细胞仪(Beckman Coulter,美国加利福尼亚州)来确定产生GFPmut3.1的细胞的分数。在诱导后12h收获细胞,并且然后在PBS中稀释1/2025。在488nm下使用OPSL蓝宝石激光器激发GFPmut3.1荧光,并且随后通过使用FL1通道(505-545)测量发射。以约300个事件/秒记录每个样品15000个细胞的数据,并且用Kaluza分析软件(BeckmanCoulter)进行分析。

LacI蛋白质印迹和定量

如先前所述(29),通过SDS-PAGE分离从约1.2x10

表1.在实施例中使用的引物。下划线:突出端引物的结合部分,斜体:突出端,粗体大写字母:限制性位点,小写字母:lacO1,粗体小写字母:FRT位点,下划线粗体大写字母:lacI

表2.在实施例中使用的

表3.在实施例中使用的启动子序列。经由SphI和NdeI限制性位点将启动子序列克隆到pET30a-cer质粒中。斜体大写字母:限制性位点,小写字母:lac操纵基因,下划线:核心启动子序列,斜体粗体大写字母:-35和-10启动子元件,斜体粗体小写字母:核糖体结合位点,粗体大写字母:+1T7A1+20初始转录序列。

实施例2:宿主RNAP依赖性启动子/操纵基因组合的生产力

已知T7表达系统提供高表达率,甚至由整合到大肠杆菌基因组中的单个靶基因拷贝。首先,在相同的实验装置中测试σ

在所有启动子/操纵基因组合中,细胞均能够在微量滴定发酵中的12小时生产期期间维持生长。μ=0.05h

在基于质粒的表达系统中,除了B(3lacO-T5)之外,所有启动子/操纵基因组合的GFPmut3.1的在线荧光测量结果在与T7表达系统相似的范围内。(图2B)。这些结果通过SDS-PAGE分析得到证实。然而,在基因组整合的表达系统中,可以观察到相应启动子/操纵基因组合的相当明显的差异(图2A)。与T5表达系统相比,GFPmut3.1产量在A1表达系统中高1.5倍。在基因组整合的T7表达系统中,GFP基因表达的诱导导致145rfu和约135mg/g可溶性GFPmut3.1的比产物浓度(Y

观察到的B(3lacO-T5)和B<3lacO-T5>的生产力下降可能是由于初始转录序列(ITS)处完全对称的lac操纵基因(sym-lacO)(7),其影响启动子逃逸并且因此影响生产力(21)。这种影响在基于质粒的3lacO-T5表达系统中不太明显,在其中高质粒拷贝数补偿了启动子活性的降低。然而,由于在无质粒表达系统中,启动子活性相当低,因此对于A1启动子,三lacO版本被排除。对于一个和两个lacO启动子/操纵基因组合,sym-lacO被A1启动子的天然ITS(+1-+20)替换。这导致在T5启动子的情况下生产力提高了2.4倍。然而,lacO结合位点的减少必然导致基础表达增加。

实施例3:宿主RNAP依赖性表达系统中的基础表达

对于具有挑战性的蛋白质,即使低基础表达也可能对宿主代谢产生不利影响。有时质粒或整合盒的转化会导致毒性,并且很难获得转化体。因此,基因调节的紧密性是表达系统的重要质量标准。

在基于质粒的系统中,由一个lac操纵基因(1lacO)控制的启动子在约10rfu水平下(特别是在C限制条件下)显示出最高的基础表达。添加第二个lacO(2lacO)或通过引入lacI

实施例4:重组基因表达率的控制

转录率控制(也称为蛋白质生产的精细调谐或“可调谐性”)在生物加工方面是高度相关的。最佳生物过程被设计成最大限度地利用细胞在最长周期期间的合成能力,从而产生正确折叠和加工的蛋白质。根据所需产物的物理特性和代谢要求,转录率必须进行调整,以符合RNA稳定性、翻译效率、折叠、转运以及系统内的所有其他相互作用。

为了评估本文所述的启动子/操纵基因组合的可调谐性,测试了一系列不同IPTG水平的补料分批样微量滴定培养物,并且与无质粒T7表达系统进行了比较。使用0.005、0.01和0.5mM IPTG单脉冲进行诱导。使用在线荧光测量和终点流式细胞术分析来表征不同启动子/操纵基因组合。

在给定的诱导剂浓度下,由一个用于基因调节的lacO控制的表达系统不仅表现出最高的基础表达,而且表现出GFPmut3.1表达的最不明显的分级(图3C、F)。尽管具有两个lacO的启动子显示出足够低的基础表达,但它们在较低诱导剂浓度下产生的显著较少(图3B、E)。启动子/操纵基因组合3lacO-T5和2lacO-A1导致重组GFP在一定时间后完全停止生产,与诱导剂浓度无关(图3A、E)。在仅具有一个lacO的启动子/操纵基因组合中没有观察到这种行为。由一个lacO(lacI

然而,已知T7表达系统表现出“全或无”行为,其中部分诱导的培养物中表达水平的降低是完全诱导的和非诱导的细胞亚群形成的结果,如(22)中所综述。为了回答问题,如果在宿主RNAP依赖性表达系统中单个细胞的可调谐性是可能的,则对所有启动子/操纵基因组合进行流式细胞术分析。如图4所示,基因组整合的T7表达系统在部分诱导的培养物中没有表现出同质群体。事实上,发现了完全诱导的、部分诱导的和未诱导的细胞的混合物,特别是在非常低的诱导剂浓度下。在B<2lacO-A1>表达系统中,流式细胞术分析揭示了生产和非生产细胞的两个不同亚群(图4),因为这些表达系统停止了它们的生产力,但仍继续生长。在B<3lacO-T5>中也观察到了这种行为。这对于BQ<1lacO-A1>是不同的,在其中在任何给定的IPTG浓度下,GFP的诱导产生同质群体(图4)。

基于这些发现,当被部分诱导时,所有其他表达系统的生产力完全停止似乎与lac抑制物的自动调节相关。lac操纵子由3个lacO结合位点调节(图5A)。LacI分子与lacO1和lacO3或lacO1和lacO2结合。lacO3与lacI基因的3'端重叠。LacI与lacO1和lacO3的结合导致DNA的环形成,并且产生截短的lacI mRNA分子,其被细胞消化。这导致在完全诱导的细胞中恒定水平为约40个分子,并且在非诱导的细胞中为约15个分子。

如果LacI与目的基因(GOI)处的lacO的结合常数(K

为了支持这一假设,比较了自动调节对B<2lacO-A1>和BL21野生型(BL21-wt)细胞的LacI水平的影响。使用蛋白质印迹分析估计了非诱导的、部分诱导的和完全诱导的细胞的LacI含量。对条带强度进行了定量,并且用细胞数进行了归一化(图7)。

在完全诱导的BL21野生型细胞中,LacI分子的量是未诱导的BL21野生型细胞的3.5倍。用0.01mM IPTG进行部分诱导仅导致增加0.3倍。在完全诱导的BL21-wt细胞中3.5的倍数变化符合Semsey等人的结果,他们在不存在诱导剂的情况下测量到平均每个细胞有15个LacI分子,并且在完全诱导的细胞中测量到约40个分子(11)。在B<2lacO-A1>中,与BL21野生型相比,非诱导的和部分诱导的细胞的LacI量明显更高。相对于BL21-wt,在不存在诱导剂的情况下,LacI产量是2.3倍,并且在部分诱导的细胞中是2.7倍。在完全诱导的细胞中,LacI产量是4.0倍,这与完全诱导的野生型BL21一致。

虽然添加0.01mM IPTG会导致GFPmut3.1表达几乎是最大值的一半(图3),但它对LacI水平几乎没有影响。显然,LacI仍能够与lac操纵子中的lacO1/lacO3结合,因此在这些条件下维持其自动调节。除此之外,与强T7

仅在由两个或三个lac操纵基因控制的基因组整合的宿主RNAP依赖性表达系统中观察到LacI自动调节的影响。然而,在基于质粒的宿主RNAP依赖性表达系统中或在常规的T7表达系统中没有观察到这种影响。其原因可以从lac操纵基因对LacI浓度的平衡中看出。T7表达系统在其DE3溶源体内含有另一个lacI基因序列,因此理论上每个细胞的LacI浓度加倍。在本工作中使用的基于质粒的表达系统是基于编码另一个lacI基因序列的pET质粒系统。这进而产生了另外15-20个lacI基因序列,这取决于质粒拷贝数。然而,在基于质粒的表达系统中也可以观察到LacI自动调节对部分诱导的细胞的影响,如在来自FujifilmDiosynth Biotechnologies(美国北卡罗来纳州)的大肠杆菌pAVEway

考虑到lac抑制物的自动调节,可以成功地鉴定出启动子/操纵基因组合,所述组合即使在低诱导物浓度下也能满足所需特性,如高表达率、可忽略不计的基础表达和对表达率的真正控制,而不会完全停止生产力。

结论

大肠杆菌中的转录调节因其是重组蛋白生产过程中的第一步而备受关注。转录控制允许细胞将其资源分配给重组蛋白的生产,并且紧密且可调谐的控制对于成功的生物过程是必不可少的。本文证明,在无质粒表达系统中,lac操纵子的调节元件必须很好地平衡以控制宿主RNAP依赖性启动子。三个lac操纵基因将基础表达降低至可忽略不计的量,但是也降低了重组产生率。初始转录序列(ITS)中的完全对称的lacO阻碍了RNAP的启动子逃逸。如由Hsu等人所示,T7A1的野生型ITS表现出嘌呤的富集以及一种最佳启动子逃逸特性(21)。

仅含有一个lacO的启动子表现出相当高的启动子强度,但是也表现出较高的系统泄漏性。在含有两个lacO的启动子/操纵基因组合中,位于GOI位点62bp距离处的两个lacO1对阻遏分子表现出非常强的结合亲和力,并且因此阻止导致部分诱导的细胞的生产力完全停止的lacI自动调节。然而,通过使用不太对称的lacO(如lacO3或lacO2)或通过改变它们之间的距离,可以降低结合亲和力(参见实施例5)。

如本文所证明的,一个lacO与由lacI

重要的是,与T7表达系统相比,本文所述的诱导型系统显示出显著提高的表达率、降低的基础表达和真正的可调谐性(参见例如图3和图4)。本文所述的诱导型表达系统满足高效表达系统所需的所有所需特性,如高表达率、可忽略不计的基础表达和即使在低诱导剂浓度下也可无级调节的对表达率的真正控制。

实施例5:在包含两个lacO的诱导型表达系统中重组基因表达率的控制。

菌株:BL21::TN7<2lacO.xxA1-GFPmut3.1-tZ>和BL21::TN7<2lacO.xxT5-GFPmut3.1-tZ>-简称为:B<2lacO.xx-A1>和B<2lacO.xx-T5>

为了添加与第一个lacO1的距离大于62bp的第二个lacO1序列,分别使用模板pETk1lacOA1tZ.c-GFPmut3.1或pETk1lacOT5tZ.c-GFPmut3.1进行突出端PCR。这两个lacO1操纵基因间隔92、103、114或125bp。正向引物2lacO.92-for、2lacO.103-for、2lacO.114-for和2lacO.125-for含有lac操纵基因和限制性位点SphI(5'),反向引物(2lacO-rev)含有限制性位点NdeI(3')。将新质粒指定为pETk2lacO.92A1tZ.c-GFPmut3.1、pETk2lacO.103A1tZ.c-GFPmut3.1、pETk2lacO.114A1tZ.c-GFPmut3.1、pETk2lacO.125A1tZ.c-GFPmut3.1和pETk2lacO.92T5tZ.c-GFPmut3.1、pETk2lacO.103T5tZ.c-GFPmut3.1、pETk2lacO.114T5tZ.c-GFPmut3.1、pETk2lacO.125T5tZ.c-GFPmut3.1。

整合到细菌染色体中发生在大肠杆菌BL21(New England

如上所述地进行线性DNA盒的扩增和筛选。

实施例6:在补料分批培养中使用BQ<1lacO-A1>进行Fab生产

基于T7的表达系统显示出即使来自单个拷贝也足以实现高表达率的独特强度。对于具有在宿主RNAP特异性启动子控制下的GOI单拷贝的系统,预期表达率显著降低。因此,当重组蛋白必须以高水平产生时,此类系统将不具有竞争力。对于抗体片段和其他具有挑战性的蛋白质,情况则不同,其中最终产物产量肯定不是由启动子系统的强度决定的,而是由目前尚未确定的原因决定的。为了研究这些方面,选择BQ<1lacO-A1>表达系统用于产生前导物/Fab组合dsbA/FTN2(dFTN2),并且与产生相同前导物/Fab组合的B3进行了比较。使细胞以补料分批模式生长,其恒定的生长速率为0.1/h确定培养基给料。在实验中,将待产生的细胞干重的量预先定义为40gCDW。通过10μmol/g CDW的IPTG单脉冲在给料开始后以0.5倍增诱导重组基因表达。

图8和图9中的结果以每细胞干重的重组Fab的总比含量(mg/g)给出,这是在发酵上清液中测得的细胞外Fab和细胞Fab的总和。在基于T7的系统中(图8),诱导dFTN2表达导致诱导后11小时的最大细胞Fab浓度为1.8mg/g,并且在发酵结束时下降至0.7mg/g(图8,空心菱形)。在此时期,细胞外Fab从几乎0mg/g增加至2.2mg/g(图8,空心三角形)。这导致诱导后15小时的最大总Fab浓度为3.5mg/g,其在发酵结束时下降至2.1mg/g(图8,黑点)。发酵上清液中细胞外Fab的增加可以归因于细胞裂解,这可以通过测量发酵上清液中的DNA含量来验证。

用BQ<1lacO-A1>表达系统进行的相同实验产生了显著改进的结果(图9)。在整个发酵期间,细胞Fab的含量可以维持在2.5mg/g(图9,空心菱形)。在发酵结束时,细胞外Fab含量增加至2.4mg/g(图9,空心三角形)。这导致在发酵结束时,最大总Fab浓度为4.7mg/g(图9,黑点)。尽管1lacO-A1的相对启动子强度与T7相比为约30%,但此表达系统产生的总Fab量直到给料开始后15小时与强T7表达系统相同,并且在发酵结束时超过T7系统2倍。这些结果明确地表明,降低启动子强度可以有益于产生具有挑战性的蛋白质,因为它降低了细胞的代谢负担和应激诱导的蛋白质水解。

1.Angius,F.,Ilioaia,O.,Amrani,A.,Suisse,A.,Rosset,L.,Legrand,A.,Abou-Hamdan,A.,Uzan,M.,Zito,F.,and Miroux,B.(2018)A novel regulation mechanism ofthe T7 RNA polymerase based expression system improves overproduction andfolding of membrane proteins,Scientific reports 8,8572.

2.Chia-Chang Hsu,O.R.T.T.a.T.W.O.(2015)Periplasmic expression in andrelease of Fab fragments from Escherichia coli using stress minimization,Journal of Chemical Technology&Biotechnology 91.

3.Saida,F.,Uzan,M.,Odaert,B.,and Bontems,F.(2006)Expression of highlytoxic genes in E.coli:special strategies and genetic tools,Current protein&peptide science 7,47-56.

4.Riggs,A.D.,and Bourgeois,S.(1968)On the assay,isolation andcharacterization of the lac repressor,J Mol Biol 34,361-364.

5.Barkley,M.D.,Riggs,A.D.,Jobe,A.,and Burgeois,S.(1975)Interaction ofeffecting ligands with lac repressor and repressor-operator complex,Biochemistry 14,1700-1712.

6.Oehler,S.,Eismann,E.R.,Kramer,H.,and Muller-Hill,B.(1990)The threeoperators of the lac operon cooperate in repression,EMBO J 9,973-979.

7.Sadler,J.R.,Sasmor,H.,and Betz,J.L.(1983)A perfectly symmetric lacoperator binds the lac repressor very tightly,Proc Natl Acad Sci U S A 80,6785-6789.

8.Oehler,S.,Amouyal,M.,Kolkhof,P.,von Wilcken-Bergmann,B.,and Müller-Hill,B.(1994)Quality and position of the three lac operators of E.coli defineefficiency of repression,EMBO J 13,3348-3355.

9.Mossing,M.C.,and Record,M.T.,Jr.(1986)Upstream operators enhancerepression of the lac promoter,Science 233,889-892.

10.Reznikoff,W.S.,Winter,R.B.,and Hurley,C.K.(1974)The location ofthe repressor binding sites in the lac operon,Proc Natl Acad Sci U S A 71,2314-2318.

11.Semsey,S.,Jauffred,L.,Csiszovszki,Z.,Erdossy,J.,Steger,V.,Hansen,S.,and Krishna,S.(2013)The effect of LacI autoregulation on the performanceof the lactose utilization system in Escherichia coli,Nucleic Acids Res 41,6381-6390.

12.Rosano,G.L.,and Ceccarelli,E.A.(2014)Recombinant proteinexpression in Escherichia coli:advances and challenges,Frontiers inmicrobiology 5,172.

13.Studier,F.W.,and Moffatt,B.A.(1986)Use of bacteriophage T7 RNApolymerase to direct selective high-level expression of cloned genes,J MolBiol189,113-130.

14.Mairhofer,J.,Scharl,T.,Marisch,K.,Cserjan-Puschmann,M.,andStriedner,G.(2013)Comparative transcription profiling and in-depthcharacterization of plasmid-based and plasmid-free Escherichia coliexpression systems under production conditions,Applied and environmentalmicrobiology79,3802-3812.

15.Glick,B.R.(1995)Metabolic load and heterologous gene expression,Biotechnology advances 13,247-261.

16.Marchand,I.,Nicholson,A.W.,and Dreyfus,M.(2001)High-levelautoenhanced expression of a single-copy gene in Escherichia coli:overproduction of bacteriophage T7 protein kinase directed by T7 late geneticelements,Gene 262,231-238.

17.Striedner,G.,Pfaffenzeller,I.,Markus,L.,Nemecek,S.,Grabherr,R.,andBayer,K.(2010)Plasmid-free T7-based Escherichia coli expression systems,Biotechnology and bioengineering 105,786-794.

18.Lanzer,M.,and Bujard,H.(1988)Promoters largely determine theefficiency of repressor action,Proc Natl Acad Sci U S A 85,8973-8977.

19.Cormack,B.P.,Valdivia,R.H.,and Falkow,S.(1996)FACS-optimizedmutants of the green fluorescent protein(GFP),Gene 173,33-38.

20.Deuschle,U.,Kammerer,W.,Gentz,R.,and Bujard,H.(1986)Promoters ofEscherichia coli:a hierarchy of in vivo strength indicates alternatestructures,EMBO J 5,2987-2994.

21.Hsu,L.M.,Cobb,I.M.,Ozmore,J.R.,Khoo,M.,Nahm,G.,Xia,L.,Bao,Y.,andAhn,C.(2006)Initial transcribed sequence mutations specifically affectpromoter escape properties,Biochemistry 45,8841-8854.

22.Marschall,L.,Sagmeister,P.,and Herwig,C.(2017)Tunable recombinantprotein expression in E.coli:promoter systems and genetic constraints,Appliedmicrobiology and biotechnology 101,501-512.

23.Toeroek,C.,Cserjan-Puschmann,M.,Bayer,K.,and Striedner,G.(2015)Fed-batch like cultivation in a micro-bioreactor:screening conditionsrelevant for Escherichia coli based production processes,SpringerPlus 4,490.

24.Green,J.F.S.a.M.R.(2012)Molecular Cloning:A Laboratory Manual,Vol.4,Cold Spring Harbor Laboratory Press,U.S.

25.Mullerhill,B.,Crapo,L.,and Gilbert,W.(1968)Mutants That Make MoreLac Repressor,P Natl Acad Sci USA 59,1259-+.

26.Sharan,S.K.,Thomason,L.C.,Kuznetsov,S.G.,and Court,D.L.(2009)Recombineering:a homologous recombination-based method of geneticengineering,Nat Protoc 4,206-223.

27.Mairhofer,J.,Wittwer,A.,Cserjan-Puschmann,M.,and Striedner,G.(2015)Preventing T7 RNA polymerase read-through transcription-A synthetictermination signal capable of improving bioprocess stability,ACS Synth Biol4,265-273.

28.Reischer,H.,Schotola,I.,Striedner,G.,Potschacher,F.,and Bayer,K.(2004)Evaluation of the GFP signal and its aptitude for novel on-linemonitoring strategies of recombinant fermentation processes,Journal ofbiotechnology 108,115-125.

29.Laemmli,U.K.(1970)Cleavage of structural proteins during theassembly of the head of bacteriophage T4,Nature 227,680-685.

30.Waddell et al.,Tn&transposition:Recognition of the attTn7 targetsequence,Proc.Natl.Acad.Sci.USA(1989),vol.86,pp.3958-3962.

31.Muyrers,J.P.P.Zhang,Y.and Stewart A.F.Introducing

32.Sternberg N and Hoess R.The molecular genetics of bacteriophageP1.Annu Rev.Genet.1983;17 123-54.

33.Gentz and Bujard,Promoters Recognized by Escherichia coli RNAPolymerase Selected by Functions:Highly Efficient Promoters fromBacteriophage T5,Journal of Bacteriology,1985,164(1):70-77.

34.Penumetcha et al.,Improving the Lac system for synthetic biology,BIOS:A Quarterly Journal of Biology,2010,81(1):7-15.

35.Oehler et al.,The three operators of the lac operon cooperate inrepression,EMBO Journal,1990,9(4):973-979.

36.Müller et al.,Repression of lac Promoter as a Function ofDistance,Phase and Quality of an Auxiliary lac Operator,J.Mol.Biol.,1996,257:21-29.

37.Dubendorff and Studier,Controlling Basal Expression in anInducible T7 Expression System by Blocking the Target T7 Promoter with lacRepressor,J.Mol.Biol.,1991,2019:45-59.

38.Hawley and McClure,Compilation and analysis of Escherichia colipromoter DNA sequences,Nucleic Acids Research,1983,11(8):2237-2255.

序列表

<110> 勃林格殷格翰RCV两合公司

<120> 用于无质粒产生目的蛋白的诱导型表达系统

<130> BI001P

<160> 35

<170> PatentIn version 3.5

<210> 1

<211> 53

<212> DNA

<213> 人工序列

<220>

<223> 启动子序列

<400> 1

cgggcgctat catgccatac cgcgaaaggt tttgcaccat tcgatggtgt ccg 53

<210> 2

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> ITS序列

<400> 2

atcgagaggg acacggcgaa 20

<210> 3

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> lacO1序列

<400> 3

aattgtgagc ggataacaat t 21

<210> 4

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> lacO2序列

<400> 4

aaatgtgagc gagtaacaac c 21

<210> 5

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> lacO3序列

<400> 5

ggcagtgagc gcaacgcaat t 21

<210> 6

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 截短的lacO1序列

<400> 6

ttgtgagcgg ataacaatt 19

<210> 7

<211> 72

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 7

caagtcggat ccgatgaagt tcctattctc tagaaagtat aggaacttcc agaaaaaaag 60

gatctcaaga ag 72

<210> 8

<211> 75

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 8

acggggtcgg tacccctgaa gttcctatac tttctagaga ataggaactt cgttagcaat 60

ttaactgtga taaac 75

<210> 9

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 9

aggggtaccg accccgtaga aaagatcaaa ggatc 35

<210> 10

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 10

atcggatccg acatcccgga caccatcgaa tggtgcaaaa c 41

<210> 11

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 11

cgttactggt ttcacattca ccac 24

<210> 12

<211> 75

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 12

cgcaggctat tctggtggcc ggaaggcgaa gcggcatgca tttacgttga cctttgatct 60

tttctacggg gtcgg 75

<210> 13

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 13

cgtaaaaatg cgctcaggtc aaattcag 28

<210> 14

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 14

cagatcgaag aaggggttga atcgc 25

<210> 15

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 15

tcaggcaact atggatgaac 20

<210> 16

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 16

agatgacggt ttgtcacatg gagttggcag gatgtttgat taaaaacata gtagtaggtt 60

gaggccgttg 70

<210> 17

<211> 74

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 17

cagccgcgta acctggcaaa atcggttacg gttgagtaat aaatggatgc gaagatcctt 60

tgatcttttc tacg 74

<210> 18

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 18

accggcgcag ggaagg 16

<210> 19

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 19

tggcgctaat tgatgccg 18

<210> 20

<211> 68

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 20

gtgcatgctt acacgtactt agtcgctgaa aattgtgagc ggataacaat tccataccca 60

cgccgaaa 68

<210> 21

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 21

ctttgctcat atgtatatct ccttc 25

<210> 22

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 22

gtagtaggtt gaggccgttg 20

<210> 23

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物序列

<400> 23

cggatatagt tcctcctttc ag 22

<210> 24

<211> 173

<212> DNA

<213> 人工序列

<220>

<223> 基因片段序列

<400> 24

gaatggtgca tgcaaggaga tggcgcccaa cagtcccccg gccacggggc ctgccaccat 60

acccacgccg aaacaagatc ataaaaaatt tatttgcttt gtgagcggat aacaattata 120

atagattcat cgagagggac acggcgaact ctagaacgga tatagtcctt cag 173

<210> 25

<211> 174

<212> DNA

<213> 人工序列

<220>

<223> 基因片段序列

<400> 25

gaatggtgca tgcaaggaga tggcgcccaa cagtcccccg gccacggggc ctgccaccat 60

acccacgccg aaacaagttt atcaaaaaga gtgttgactt gtgagcggat aacaatgata 120

cttagattca tcgagaggga cacggcgaac tctagaacgg atatagtcct tcag 174

<210> 26

<211> 960

<212> DNA

<213> 人工序列

<220>

<223> LacI

<400> 26

atggcggagc tgaattacat tcccaaccgc gtggcacaac aactggcggg caaacagtcg 60

ttgctgattg gcgttgccac ctccagtctg gccctgcacg cgccgtcgca aattgtcgcg 120

gcgattaaat ctcgcgccga tcaactgggt gccagcgtgg tggtgtcgat ggtagaacga 180

agcggcgtcg aagcctgtaa agcggcggtg cacaatcttc tcgcgcaacg cgtcagtggg 240

ctgatcatta actatccgct ggatgaccag gatgccattg ctgtggaagc tgcctgcact 300

aatgttccgg cgttatttct tgatgtctct gaccagacac ccatcaacag tattattttc 360

tcccatgaag acggtacgcg actgggcgtg gagcatctgg tcgcattggg tcaccagcaa 420

atcgcgctgt tagcgggccc attaagttct gtctcggcgc gtctgcgtct ggctggctgg 480

cataaatatc tcactcgcaa tcaaattcag ccgatagcgg aacgggaagg cgactggagt 540

gccatgtccg gttttcaaca aaccatgcaa atgctgaatg agggcatcgt tcccactgcg 600

atgctggttg ccaacgatca gatggcgctg ggcgcaatgc gcgccattac cgagtccggg 660

ctgcgcgttg gtgcggatat ctcggtagtg ggatacgacg ataccgaaga cagctcatgt 720

tatatcccgc cgttaaccac catcaaacag gattttcgcc tgctggggca aaccagcgtg 780

gaccgcttgc tgcaactctc tcagggccag gcggtgaagg gcaatcagct gttgcccgtc 840

tcactggtga aaagaaaaac caccctggcg cccaatacgc aaaccgcctc tccccgcgcg 900

ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag cgggcagtga 960

<210> 27

<211> 319

<212> PRT

<213> 人工序列

<220>

<223> LacI

<400> 27

Met Ala Glu Leu Asn Tyr Ile Pro Asn Arg Val Ala Gln Gln Leu Ala

1 5 10 15

Gly Lys Gln Ser Leu Leu Ile Gly Val Ala Thr Ser Ser Leu Ala Leu

20 25 30

His Ala Pro Ser Gln Ile Val Ala Ala Ile Lys Ser Arg Ala Asp Gln

35 40 45

Leu Gly Ala Ser Val Val Val Ser Met Val Glu Arg Ser Gly Val Glu

50 55 60

Ala Cys Lys Ala Ala Val His Asn Leu Leu Ala Gln Arg Val Ser Gly

65 70 75 80

Leu Ile Ile Asn Tyr Pro Leu Asp Asp Gln Asp Ala Ile Ala Val Glu

85 90 95

Ala Ala Cys Thr Asn Val Pro Ala Leu Phe Leu Asp Val Ser Asp Gln

100 105 110

Thr Pro Ile Asn Ser Ile Ile Phe Ser His Glu Asp Gly Thr Arg Leu

115 120 125

Gly Val Glu His Leu Val Ala Leu Gly His Gln Gln Ile Ala Leu Leu

130 135 140

Ala Gly Pro Leu Ser Ser Val Ser Ala Arg Leu Arg Leu Ala Gly Trp

145 150 155 160

His Lys Tyr Leu Thr Arg Asn Gln Ile Gln Pro Ile Ala Glu Arg Glu

165 170 175

Gly Asp Trp Ser Ala Met Ser Gly Phe Gln Gln Thr Met Gln Met Leu

180 185 190

Asn Glu Gly Ile Val Pro Thr Ala Met Leu Val Ala Asn Asp Gln Met

195 200 205

Ala Leu Gly Ala Met Arg Ala Ile Thr Glu Ser Gly Leu Arg Val Gly

210 215 220

Ala Asp Ile Ser Val Val Gly Tyr Asp Asp Thr Glu Asp Ser Ser Cys

225 230 235 240

Tyr Ile Pro Pro Leu Thr Thr Ile Lys Gln Asp Phe Arg Leu Leu Gly

245 250 255

Gln Thr Ser Val Asp Arg Leu Leu Gln Leu Ser Gln Gly Gln Ala Val

260 265 270

Lys Gly Asn Gln Leu Leu Pro Val Ser Leu Val Lys Arg Lys Thr Thr

275 280 285

Leu Ala Pro Asn Thr Gln Thr Ala Ser Pro Arg Ala Leu Ala Asp Ser

290 295 300

Leu Met Gln Leu Ala Arg Gln Val Ser Arg Leu Glu Ser Gly Gln

305 310 315

<210> 28

<211> 201

<212> DNA

<213> 人工序列

<220>

<223> 启动子

<400> 28

gcatgcttac acgtacttag tcgctgaaaa ttgtgagcgg ataacaatta cgagcttcat 60

gcacagttaa atcataaaaa atttatttgc tttgtgagcg gataacaatt ataatatgtg 120

gaattgtgag cgctcacaat tccacaacgg tttccctcta gaaataattt tgtttaactt 180

taagaaggag atatacatat g 201

<210> 29

<211> 187

<212> DNA

<213> 人工序列

<220>

<223> 启动子

<400> 29

gcatgcttac acgtacttag tcgctgaaaa ttgtgagcgg ataacaattc catacccacg 60

ccgaaacaag atcataaaaa atttatttgc tttgtgagcg gataacaatt ataatagatt 120

catcgagagg gacacggcga actctagaaa taattttgtt taactttaag aaggagatat 180

acatatg 187

<210> 30

<211> 187

<212> DNA

<213> 人工序列

<220>

<223> 启动子

<400> 30

gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac catacccacg 60

ccgaaacaag atcataaaaa atttatttgc tttgtgagcg gataacaatt ataatagatt 120

catcgagagg gacacggcga actctagaaa taattttgtt taactttaag aaggagatat 180

acatatg 187

<210> 31

<211> 187

<212> DNA

<213> 人工序列

<220>

<223> 启动子

<400> 31

gcatgcttac acgtacttag tcgctgaaaa ttgtgagcgg ataacaattc catacccacg 60

ccgaaacaag atcataaaaa agagtgttga cttgtgagcg gataacaatg atacttgatt 120

catcgagagg gacacggcga actctagaaa taattttgtt taactttaag aaggagatat 180

acatatg 187

<210> 32

<211> 188

<212> DNA

<213> 人工序列

<220>

<223> 启动子

<400> 32

gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac catacccacg 60

ccgaaacaag tttatcaaaa agagtgttga cttgtgagcg gataacaatg atacttagat 120

tcatcgagag ggacacggcg aactctagaa ataattttgt ttaactttaa gaaggagata 180

tacatatg 188

<210> 33

<211> 308

<212> DNA

<213> 人工序列

<220>

<223> 启动子

<400> 33

gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac catacccacg 60

ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc ggtgatgtcg 120

gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac gatgcgtccg 180

gcgtagagga tcgagatcga tctcgatccc gcgaaattaa tacgactcac tataggggaa 240

ttgtgagcgg ataacaattc ccctctagaa ataattttgt ttaactttaa gaaggagata 300

tacatatg 308

<210> 34

<211> 6

<212> DNA

<213> 人工序列

<220>

<223> 共有序列

<400> 34

tataat 6

<210> 35

<211> 6

<212> DNA

<213> 人工序列

<220>

<223> 共有序列

<400> 35

ttgaca 6

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号