首页> 中国专利> 遗传修饰的噬菌体及其用途

遗传修饰的噬菌体及其用途

摘要

本发明涉及遗传修饰的噬菌体及其在生产目的生物分子的方法中的用途。

著录项

  • 公开/公告号CN103797113A

    专利类型发明专利

  • 公开/公告日2014-05-14

    原文格式PDF

  • 申请/专利权人 德尔菲遗传学公司;

    申请/专利号CN201280042917.7

  • 发明设计人 C·斯派尔;

    申请日2012-07-06

  • 分类号C12N7/00;C12N15/70;

  • 代理机构北京安信方达知识产权代理有限公司;

  • 代理人陈建芳

  • 地址 比利时哥斯利

  • 入库时间 2023-12-17 00:20:51

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-08-10

    授权

    授权

  • 2014-07-02

    实质审查的生效 IPC(主分类):C12N7/00 申请日:20120706

    实质审查的生效

  • 2014-05-14

    公开

    公开

说明书

技术领域

本发明涉及在生物学系统中生产目的生物分子的领域。具体而言,本发明 涉及遗传修饰的噬菌体,及其为避免对培养基肉汤和/或细菌裂解物的噬菌体污 染的用途。

背景技术

细菌细胞是用于生产生物分子尤其是靶蛋白质的首选系统。除了其它优点 之外,细菌系统容易使用并且可以在有限的培养体积中快速生产大量的蛋白质。

最广泛且经常使用的细菌系统之一是噬菌体T7表达系统。该细菌系统描述 于US4,952,496中。在该系统中,编码靶蛋白的基因被置于T7启动子控制下, 并被转化进入到包含整合的λDE3溶原噬菌体的细菌宿主中,常常是大肠杆菌(E. coli)中。λDE3溶原噬菌体携带着编码处于lacUV5启动子控制下的T7RNA聚 合酶的基因。当在包含IPTG的培养基中培养时,T7RNA聚合酶的表达被诱导, 并且使得靶蛋白表达。

由于T7RNA聚合酶基因(T7基因1)被整合到Int基因序列内,λDE3噬菌 体在其进入到溶菌期的能力方面具有缺陷。然而,在一些蛋白质的生产过程中 并且在任何其它噬菌体缺乏下观察到细菌裂解,表明DE3噬菌体可以恢复其裂 解特性。细菌裂解以及更甚者培养基肉汤中感染性噬菌体的存在很成问题,因 为(i)它使得所生产的靶蛋白在一些应用中诸如例如药物应用中的使用大打折 扣,(ii)为了去除任何微量噬菌体的去污染过程需要生产线的关闭和培养批次的 完全更新,以及(iii)其极大降低重组蛋白的产率。

使用噬菌体的备选方法也有所描述:

WO03/050240描述了用于在宿主细胞中生产靶蛋白的表达系统,包含使用 同源重组所整合的编码T7RNA聚合酶的基因。然而,由于T7RNA聚合酶基 因的大小,以及由于同源重组不易于在所有大肠杆菌菌株中进行的事实(如Phue 等,Biotechnology and Bioengineering,101,831-836,2008中所提及), WO03/050240的系统难以实施。因此,携带T7RNA聚合酶整合的转化细胞的 数量仍然非常低或者得不到这些细胞。此外,使用同源重组时必需使用选择标 记,以筛选包含T7RNA聚合酶基因整合的细菌。该标记对于另外的筛选步骤 不是可用的并且对于菌株的最终使用是不希望有的。例如,常常使用的选择标 记是抗生素抗性基因,但是推荐在生物药物生产中避免使用这些基因。因此, 为了从该菌株中去除抗生素抗性基因需要额外的步骤,并且这不一定能够实现。

WO2008/139153描述了另一表达系统,其中宿主细胞以包含T7RNA聚合 酶表达盒的质粒转化。然而,由于使用质粒,宿主细胞必须维持在选择条件下 以确保它们仍然包含质粒。此外,质粒会频繁进行重组,这有损表达系统。

因此,需要生产目的生物分子的新方法,其中,当使用噬菌体时,培养物 在生长或者蛋白质生产过程中不被感染性噬菌体污染或者不被无意裂解。

因此本发明提供遗传修饰的噬菌体,其在培养过程中不会恢复其裂解特性, 由此使得目的生物分子的生产中无噬菌体污染。

发明内容

本发明的一个目标是遗传修饰的噬菌体,其中

-表达系统被插入,

-S和/或R基因被灭活。

在本发明的一个实施方案中,Int和/或Xis基因被灭活。

本发明的另一个目标是遗传修饰的噬菌体,其中

-表达系统被插入,

-S、R和/或Q基因被灭活,和

-Int和/或Xis基因被灭活。

在本发明的另一个实施方案中,Rz基因被灭活。

在本发明的另一个实施方案中,表达系统被插入并且Int基因、Xis基因以 及R、S和Rz基因被灭活。

在本发明的另一个实施方案中,表达系统被插入并且Int基因、Xis基因以 及Q、R、S和Rz基因被灭活。

在本发明的另一个实施方案中,表达系统是T7表达系统。

在本发明的另一个实施方案中,噬菌体是λ噬菌体、434噬菌体、phi80噬 菌体、phi81噬菌体、HK97噬菌体、P21噬菌体。

在本发明的另一个实施方案中,如上所述的遗传修饰的噬菌体具有SEQ ID  NO:10的序列。在本发明的另一个实施方案中,如上所述的遗传修饰的噬菌体 是噬菌体P11至P53中之一。

本发明的另一个目标是包含如上所述的遗传修饰的噬菌体和辅助噬菌体的 试剂盒。

本发明的另一个目标是包含如上所述的遗传修饰的噬菌体的宿主细胞。

在本发明的一个实施方案中,宿主细胞是肠杆菌(enterobacteria),优选大 肠杆菌(E.Coli),更优选BL21。

在本发明的另一个实施方案中,如上所述的宿主细胞还包含基因tonA、 galK、araB、araA、lon、ompT、rcsA、hsdR、mrr、endA和recA中的至少一个 基因的灭活。

在本发明的另一个实施方案中,如上所述的宿主细胞包含ccdb基因的插入。

本发明的另一个目标是包含如上所述的宿主细胞和含ccdA基因的质粒的试 剂盒。

本发明的另一个目标是用于制备如上所述的宿主细胞的方法,包括以如上 所述的遗传修饰的噬菌体感染宿主细胞。

本发明的另一个目标是用于生产目的生物分子的方法,包括

-培养包含根据权利要求1至7任一项的遗传修饰的噬菌体和目的生物分 子的核酸序列的宿主细胞,

-收集所述目的生物分子。

具体实施方式

本发明涉及遗传修饰的噬菌体,其中噬菌体恢复其裂解特性的能力被限制。

发明人致力于对噬菌体的遗传修饰。令人意外的是,发明人证明,不可能 使被整合噬菌体的所有病毒序列缺失,因为在该情况下被感染细菌的生存力严 重受损。具体而言,发明人证明,包含ral基因和N基因编码序列的DNA片段 的缺失会导致宿主细胞死亡(见实施例)。该结果是令人意外的,因为并不知道ral 和N基因参与到溶原状态中;N基因仅仅被描述为是裂解生长所必需的。相反, 在溶原状态中,噬菌体的阻抑物,被称为CI或C2,阻断N和ral的表达。

因此,本发明涉及遗传修饰的噬菌体,其中

-表达系统被插入,和

-至少Int、Xis、R、S、Q和Rz基因中之一被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且R基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Int基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Xis基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S和Int基因被灭 活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S和Xis基因被灭 活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S和R基因被灭 活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S和Rz基因被灭 活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S和Q基因被灭 活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且R和Rz基因被灭 活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且R和Int基因被灭 活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且R和Xis基因被灭 活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且R和Q基因被灭 活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q和Rz基因被灭 活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q和Int基因被灭 活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q和Xis基因被 灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、Int和Xis基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、Int和Rz基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、Int和R基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、Xis和Rz基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、Xis和R基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、R和Rz基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、R和Q基因被 灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、Q和Rz基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、Q和Int基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、Q和Xis基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且R、Int和Xis基 因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且R、Int和Rz基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且R、Xis和Rz基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且R、Q和Rz基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且R、Xis和Q基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且R、Int和Q基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q、Int和Rz基因 被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q、Int和Xis基 因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q、Xis和Rz基 因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、Int、Xis和Rz 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、Int、Xis和R 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、Int、R和Rz 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、R、Xis和Rz 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且R、Rz、Xis和Int 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q、R、Rz和S 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q、R、Rz和Int 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q、R、S和Int 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q、Rz、S和Int 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q、R、Rz和Xis 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q、R、S和Xis 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q、Rz、S和Xis 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q、R、Int和Xis 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q、Rz、Int和Xis 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且Q、S、Int和Xis 基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、R、Rz、Xis 和Int基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、R、Q、Rz和 Xis基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、R、Q、Rz和 Int基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、R、Q、Xis和 Int基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、Q、Rz、Xis 和Int基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且R、Q、Rz、Xis 和Int基因被灭活。

在一个实施方案中,遗传修饰的噬菌体包含表达系统并且S、R、Q、Rz、 Xis和Int基因被灭活。

可以用于本发明的噬菌体实例包括,但不限于,λ噬菌体、λ样(lambda-like) 和λ形(lambdoid)噬菌体。λ噬菌体也称作大肠杆菌噬菌体λ,它是感染大肠杆 菌的病毒。λ是温和噬菌体。λ样噬菌体组成一个特征为具有非收缩性长尾的噬 菌体和古细菌病毒家族。λ形噬菌体是λ噬菌体的天然亲缘物。它们当中大多 数在大肠杆菌上生长,但是极少数来源于其它的宿主细胞,诸如,例如鼠伤寒 沙门氏菌(Salmonella typhimurium)。这些噬菌体具有与λ相同的基因顺序。

可以在本发明中使用的λ样和λ形噬菌体的实例包括,但不限于,大肠杆 菌噬菌体434、phi80、phi81、HK97、P21和P22。

在一个实施方案中,噬菌体是λ(肠杆菌噬菌体λ,登录号NC_001416)。λ 噬菌体的基因组组织示于下表1中。

表1

在本发明中,残基在λ噬菌体序列内的位置与NC_001416有关。

在另一个实施方案中,噬菌体是λDE3(登录号EU078592)。λDE3噬菌体 是修饰的λ噬菌体D69,其包含处于lacUV5启动子控制下的编码T7RNA聚合 酶的基因。被序列携带的基因的列表以及它们的位置示于下表2中。

表2

在本发明中,残基在λDE3噬菌体序列内的位置与EU078592有关。

如本文所使用,“表达系统”指由与用于系统转录的额外片段有效连接的编码 核酸序列的片段组成的线性或者环状DNA分子。

额外片段包括启动子和终止密码子序列。表达系统还可以包含一个或更多 个复制起点、一个或更多个选择标记和编码核糖体结合位点的序列。

“有效连接”意思是指,片段如此排列以致于按照预定的那样起作用,例如转 录一旦在启动子处开始,它就会通过编码的序列至终止密码子。

本发明目的中的“启动子”是允许RNA聚合酶结合并起始转录的表达控制元 件。

在本发明的一个实施方案中,核酸序列处于“强”启动子控制下。强启动子一 方面由启动子序列与RNA聚合酶(通常是天然存在的相应RNA聚合酶)的高 结合亲和性表征,另一方面由该RNA聚合酶形成mRNA的速率表征。

在一个优选的实施方案中,核酸序列处于“诱导型启动子”控制下。“诱导型 启动子”是可以通过外部因素调节的启动子,所述外部因素例如诱导因子(也称作 “诱导物”)分子的存在或者阻抑物分子的缺乏,或者物理因素如升高的或降低的 温度、渗透性或pH值。Makrides等(Microbiological Reviews,1996,(60)3:512-538) 综述了不同启动子和各自的诱导原理。可以在本发明中使用的诱导型启动子实 例包括,但不限于tac或trc启动子、lac或lacUV5启动子(均可以通过乳糖或其 类似物IPTG(异丙基巯基-β-D-半乳糖苷)诱导)、可紧密调节的araBAD启动子 (PBAD;Guzman等,1995,可通过阿拉伯糖诱导)、trp启动子(可通过添加β- 吲哚丙烯酸或者色氨酸饥饿诱导,可通过加入色氨酸抑制)、λ启动子pL(λ)(通 过升高温度诱导)、phoA启动子(可通过磷酸盐饥饿诱导)、PprpB(用丙酸盐诱导) 或者适宜用于重组蛋白表达的其它启动子,它们均使用大肠杆菌RNA聚合酶。

在诱导型启动子当中有一些显示“渗漏”表达表现。此类启动子(所谓的“渗漏 启动子”)原则上是可诱导的,但是还显示出在没有外部诱导时有基础表达。在非 诱导条件下显示渗漏表达的诱导型启动子可能与组成型启动子具有相似的表现 (即它们稳定地且连续地有活性,或者由于某些培养条件它们可以被活化或者增 强)。渗漏启动子可能对于连续操作的培养过程特别有用。渗漏启动子实例是T7 启动子和trp启动子。

在本发明的一个实施方案中,启动子还可以是组成型的,即控制表达的启 动子,所述控制表达一方面无需诱导或者另一方面无需阻抑可能性。由此以某 一水平连续且稳定表达。例如,强组成型HCD启动子(Poo等,Biotechnology  Letters,2002,24:1185-1189;Jeong等,Protein expression and purification,2004, 36:150-156)可应用于组成型表达。

在一个实施方案中,表达系统包含编码诱导目的生物分子表达的蛋白质的 核酸序列。有利地,目的生物分子的表达在特定条件下诸如例如在筛选条件下 被诱导。

此类核酸序列实例包括,但不限于,编码T7RNA聚合酶的基因T7基因1。 在该例中,T7RNA聚合酶的表达诱导置于T7启动子控制下的目的生物分子的 表达。

优选地,表达系统是T7表达系统。T7表达系统描述于US4,952,496中,其 通过援引并入本文。T7达系统包含来自T7噬菌体的DNA片段,该片段包含 T7RNA聚合酶的全部编码序列(即T7基因1)。T7基因1的任何天然活性启动 子被去除,并且在该编码序列的前面插入诱导型lacUV5启动子。lacUV5启动 子通过向培养基中添加IPTG而被诱导。

根据另一个实施方案,表达系统包含目的生物分子的核酸序列。

关于目的生物分子,对其没有限制。它原则上可以是任何氨基酸序列、核 酸序列,诸如,例如,DNA或RNA。

氨基酸序列实例包括待以制造规模生产的多肽、蛋白质或肽,例如工业生 物分子或者治疗性生物分子。

可以通过本发明方法生产的生物分子的实例为,但不限于,酶、调节蛋白、 受体、肽例如肽类激素、细胞因子、膜蛋白或转运蛋白。

目的生物分子还可以是用于疫苗接种的抗原、疫苗、抗原结合蛋白、免疫 刺激蛋白、变应原、全长抗体或抗体片段或者衍生物。抗体衍生物可以选自单 链抗体、(scFv)、Fab片段、Fv片段、单域抗体(VH或VL片段)、域抗体如骆驼 科动物(camelid)单域抗体(VHH,纳米抗体)或者例如Andersen和Reilly(Current  Opinion in Biotechnology,2004,15:456-462)或者Holliger和Hudson(Nature  Biotechnology,2005(23)9:1126-1136)中描述的其它抗体形式。

本发明中的目的生物分子还可以是例如在致病性病毒如乙肝病毒、丙肝病 毒、I-HV、流感病毒等的基因组中编码的蛋白质(病毒抗原),例如外壳蛋白、核 心蛋白、蛋白酶、逆转录酶、整合酶等;生长因子诸如血小板衍生生长因子 (PDGF)、干细胞生长因子(SCF)、肝细胞生长因子(HGF)、转化生长因子(TGF)、 神经生长因子(NGF)、表皮生长因子(EGF)、成纤维细胞生长因子(FGF)、胰岛素 样生长因子(IGF)等等;细胞因子诸如肿瘤坏死因子、干扰素、白细胞介素等等; 造血因子诸如促红细胞生成素、粒细胞集落刺激因子、粒细胞-巨噬细胞集落刺 激因子、巨噬细胞集落刺激因子、血小板生成素等等;肽类激素诸如促黄体生 成激素释放因子(LB-RH)、促甲状腺激素释放激素(TRH)、胰岛素、促生长素抑 制素、生长激素、促乳素、促肾上腺皮质激素(ACTH)、促黑素细胞激素(MSH)、 促甲状腺激素(TSH)、促黄体激素(LU)、促滤泡激素(FSH)、血管升压素、氧化 毒素、降钙素、甲状旁腺激素(PTH)、胰高血糖素、促胃液素、促胰液素、促胰 酶素、缩胆囊素、血管紧张素、人胎盘催乳激素、人绒毛膜促性腺激素(HCG)、 蛙皮素、促胃动素等等;镇痛肽诸如脑啡肽、内啡肽、强啡肽、京都啡肽等等; 酶类诸如超氧化物歧化酶(SOD)、尿激酶、组织型纤溶酶原激活物(TPA)、天冬 酰胺酶、激肽释放酶等等;肽神经递质诸如铃蟾肽、神经降压肽(neutrotensin)、 缓激肽、P物质、阿尔茨海默淀粉样肽(AD)、SODl、早老素1和2、肾素、 Dsynuclein、淀粉状蛋白A、淀粉状蛋白P、活化素、抗-HER-2、铃蟾肽、脑啡 肽酶、蛋白酶抑制剂、治疗性酶、D l-抗胰蛋白酶、哺乳动物胰蛋白酶抑制剂、 哺乳动物胰腺胰蛋白酶抑制剂、降钙素、心脏肥大因子、心肌营养蛋白 (cardiotrophin)(诸如心肌营养蛋白-1)、CD蛋白(诸如CD-3、CD-4、CD-8和 CD-19)、CFTR、CTNF、DNA酶、人绒毛膜促性腺激素、小鼠促性腺激素相关 肽、细胞因子、运甲状腺素蛋白、糊精、脂蛋白、淋巴因子、溶菌酶、生长激 素(包括人生长激素)、牛生长激素、生长激素释放因子、甲状旁腺激素、促甲状 腺激素、生长因子、脑衍生的神经营养生长因子、表皮生长因子(EGF)、成纤维 细胞生长因子(诸如D FGF和D FGF)、胰岛素样生长因子-I和-II、 des(l-3)-IGF-I(脑IGF-I)、胰岛素样生长因子结合蛋白、神经生长因子(诸如NGF- D)、血小板衍生生长因子(PDGF)、血管内皮生长因子(VEGF)、生长激素受体或 生长因子受体、转化生长因子(TGF)(诸如TGF-D、TGF-D1、TGF-D2、TGF-D3、 TGF-D4或TGF-D5)、神经营养因子(诸如神经营养蛋白-3、-4、-5、或-6)、凝 溶胶蛋白、胰高血糖素、激肽释放酶、缪勒管抑制物质、神经营养因子、p53、 蛋白A或D、松弛素原(prorelaxin)、松弛素A-链、松弛素B-链、类风湿因子、 视紫红质、血清白蛋白(诸如人血清白蛋白)、抑制素、胰岛素、胰岛素链、胰岛 素A-链、胰岛素D–链、胰岛素受体、胰岛素原、促黄体激素、整联蛋白、白 细胞介素(IL)(诸如IL-1至IL-10、IL-12、IL-13)、促红细胞生成素、血小板生成 素、微纤维蛋白、促滤泡激素、凝血因子(诸如因子VIIIC、因子IX、组织因子、 和von Willebrands因子)、抗凝因子(诸如蛋白C、心房利钠因子、肺表面活性剂)、 纤溶酶原激活物(诸如人组织型纤溶酶原激活物或尿激酶)、凝血酶、肿瘤坏死因 子-D或D、D-酮酸脱氢酶、地址素、骨形态发生蛋白(BMP)、胶原、集落刺激 因子(CSF)(诸如M-CSF、GM-CSF和G-CSF)、衰变加速因子、归巢受体、干扰 素(诸如干扰素-α、-γ和-β)、角蛋白、骨诱导因子、PRNP、调节蛋白、超氧化物 歧化酶、表面膜蛋白、转运蛋白、T-细胞受体、抗原诸如gpl20(HIb)免疫毒素、 心房利钠肽、精囊外分泌蛋白、D2-微球蛋白、PrP、降钙素原、共济失调蛋白1、 共济失调蛋白2、共济失调蛋白3、共济失调蛋白6、共济失调蛋白7、亨廷 顿蛋白、雄激素受体、CREB结合蛋白、gpl20、p300、CREB、API、ras、NFAT、 jun、fos、齿状红核苍白球肌萎缩症相关蛋白(dentatorubral pallidoluysian  atrophy-associated protein)、微生物蛋白(例如麦芽糖结合蛋白、ABC转运体、 谷胱甘肽S转移酶、硫氧还蛋白、D-内酰胺酶)、绿色荧光蛋白、红色荧光蛋白、 酶诸如超氧化物歧化酶、天冬酰胺酶、精氨酸酶、精氨酸脱氨酶、腺苷脱氨酶、 核糖核酸酶、过氧化氢酶、尿酸酶、胆红素氧化酶、胰蛋白酶、木瓜蛋白酶、 碱性磷酸酶、β-葡糖醛酸酶、嘌呤核苷磷酸化酶或者巴曲酶、阿片样物质例如内 啡肽、脑啡肽或者非天然阿片样物质、激素或神经肽例如降钙素、胰高血糖素、 促胃液素、促肾上腺皮质激素(ACTH)、缩胆囊素、促黄体激素、促性腺激素释 放激素、绒毛膜促性腺激素、促肾上腺皮质激素释放因子、血管升压素、催产 素、抗利尿激素、甲状腺刺激激素、促甲状腺激素释放激素、松弛素、促乳素、 肽YY、神经肽Y、胰多肽、瘦蛋白、CART(可卡因和安非他明调节的转录物)、 CART相关肽、围脂滴蛋白(perilipin)、黑皮质素(促黑素细胞激素)诸如MC-4、 黑色素聚集激素、利钠肽、肾上腺髓质素、内皮缩血管肽、促胰液素、糊精、 血管活性肠肽(VIP)、垂体腺苷酸环化酶激活肽(PACAP)、铃蟾肽、铃蟾肽样肽、 胸腺素、肝素结合蛋白、可溶性CD4、下丘脑释放因子和褪黑激素或其功能类 似物。在本发明的另一个实施方案中,靶蛋白可以是加工酶诸如蛋白酶(例如肠 激酶、半胱天冬酶、胰蛋白酶样丝氨酸蛋白酶)、脂肪酶、磷酸酶、糖基水解酶(例 如甘露糖苷酶、木糖苷酶、岩藻糖苷酶)、激酶、一氧化酶或二氧化酶、过氧化 物酶、转谷氨酰胺酶、羧肽酶、酰胺酶、酯酶、和磷酸酶…

对于这些哺乳动物多肽的优选来源包括人、牛、马、猪、狼和啮齿类来源, 其中人蛋白质是特别优选的。

本发明的目的生物分子还包括上述蛋白质的变异体。这些变异体包括,例 如,与上述蛋白质具有相同活性并且包含在上述蛋白质的氨基酸序列中具有一 个或更多个缺失氨基酸、替代氨基酸、插入氨基酸和/或添加氨基酸的氨基酸序 列的蛋白质。此类蛋白质可以是例如与上述蛋白质具有相同活性并且包含在上 述蛋白质的氨基酸序列中具有一个或更多个缺失氨基酸、替代氨基酸、插入氨 基酸和/或添加氨基酸的氨基酸序列的蛋白质。选自缺失、替代、插入和添加的 两种或者更多种不同类型的修饰可以同时进行。

本发明的目的生物分子还包括上述蛋白质的“部分肽”。蛋白质的部分肽可以 是例如包含在其中上述蛋白质的部分氨基酸序列连续的氨基酸序列的部分肽, 其中所述部分肽优选与所述蛋白质具有相同的活性。此种部分肽可以是例如具 有包含上述蛋白质的氨基酸序列中至少20个氨基酸残基并且优选至少50个氨 基酸残基的氨基酸序列的多肽。该多肽优选包含对应于与上述蛋白质的活性有 关的区域的氨基酸序列。此外,在本发明中使用的部分肽还可以是如通过对该 多肽修饰得到的部分肽,其中1个或多个氨基酸残基(例如约1至20个,更优选 约1至10个,并且甚至更优选约1至5个)从其氨基酸序列中缺失、被替换到其 氨基酸序列中、被插入到其氨基酸序列中和/或被添加到其氨基酸序列中。在本 发明中使用的部分肽还可以用作抗体生产的抗原。

在本发明的一个实施方案中,目的生物分子选自人生长激素、人胰岛素、 促滤泡激素、因子VIII、红细胞生成素、粒细胞集落刺激因子、α-半乳糖苷酶A、 α-L-艾杜糖苷酸酶(alpha-L-iduronidase)、N-乙酰半乳糖胺-4-硫酸酯酶、阿法 链道酶α、组织纤溶酶原激活物、葡糖脑苷脂酶、干扰素、胰岛素样生长因子1、 牛生长激素、猪生长激素、牛凝乳酶、和乙型肝炎病毒包膜蛋白。

目的生物分子还包括在周质中已经经历翻译后和输出后修饰诸如环化、糖 基化、磷酸化、甲基化、氧化、脱水、蛋白酶切的修饰多肽或者蛋白质。

在一个实施方案中,目的生物分子是用于将细胞外基质中的生物分子(本文 称作“细胞外生物分子”)代谢的酶。在一个实施方案中,细胞外生物分子包括多 糖或脂质。在本发明的一个实施方案中,多糖包括藻酸盐、果胶、纤维素、纤 维二糖、昆布多糖、或其混合物。在本发明的一个实施方案中,脂质包括脂肪 酸、糖脂、甜菜碱脂、甘油脂、磷脂、甘油磷脂、鞘脂、固醇脂、异戍烯醇脂、 糖脂、聚酮、或其混合物。在本发明的一个实施方案中,目的生物分子是将多 糖转化成单糖、寡糖或者两者的酶。

在本发明的一个实施方案中,目的生物分子是将脂质转化成脂肪酸、单糖 或者两者的酶。在本发明的一个实施方案中,单糖或寡糖是褐藻胶寡糖 (oligoalginate)、甘露糖醛酸酯、古罗糖醛酸(guluronate)、甘露醇、a-酮酸、 4-脱氧-L-赤型-己酮糖糖醛酸(4-deoxy-L-hexoselulose urinate,DEHU)、2-酮-3-脱 氧D-葡糖酸酯(KDG)、葡萄糖、葡糖醛酸酯、半乳糖醛酸酯、半乳糖、木糖、 阿拉伯糖、或者甘露糖。在本发明的一个实施方案中,脂肪酸是14:0、反式-14、 16:0、16:ln-7、反式-16、16:2n-6、18:0、18:ln-9、18:2n-6、18:3n-6、18:3n-3、 18:4n-3、20:0、20:2n-6、20:3n-6、20:4n-3、20:4n-6、或者20:5n-3。

在本发明的一个实施方案中,目的生物分子是将细胞外生物分子转化成商 品化学品的酶。在本发明的一个实施方案中,商品化学品是乙醇、丁醇、或生 物柴油。在本发明的一个实施方案中,生物柴油是脂肪酸、脂肪酸酯或者萜类 化合物。

如本文所使用,术语“被灭活”指在转录或者翻译水平阻断或者阻抑基因表 达。优选地,术语“被灭活”指基因转录被阻抑。

根据本发明,基因灭活可以是由于基因突变或者表达系统插入到基因的编 码序列内。

在本发明目的中,术语“突变”指遗传序列的稳定改变。本发明中可以导致基 因灭活的突变实例包括,但不限于,点突变、插入、缺失和扩增或基因重复。

优选地,突变是缺失。术语“缺失”本文所使用意思是指基因的丢失或缺乏, 优选基因的全部丢失或缺乏。更优选地,缺失在所缺失基因起始密码子处或之 前开始,并且在所缺失基因终止密码子处或之后结束。

在本发明的一个实施方案中,S基因被灭活。S基因编码穴蛋白(holin)(S105) 和抗穴蛋白(S107)两种蛋白。穴蛋白触发膜中孔的形成。穴蛋白对于由R基因所 编码的内溶素的释放是必需的。相反,抗穴蛋白蛋白抑制S105孔形成。根据一 个实施方案,S基因具有序列SEQ ID NO:1。在另一个实施方案中,S基因的序 列呈现出与SEQ ID NO:1具有至少70%、至少75%、至少80%、至少85%、至 少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、 至少97%、至少98%、并且甚至更优选至少99%的序列同一性。

S基因可包含保守序列修饰,该修饰指没有明显影响或者改变S蛋白质功能 的氨基酸修饰。此类保守修饰包括氨基酸替代、添加和缺失。修饰可以通过本 领域内已知的标准技术诸如位点定向诱变和PCR介导的诱变引入到S基因序列 内。保守氨基酸替代有代表性地是其中氨基酸残基被具有相似物理化学特性侧 链的氨基酸残基替换的那些。S蛋白质的修饰序列可以包含一个、两个、三个、 四个或更多个的氨基酸插入、缺失或替代。当进行替代时,优选的替代将是保 守性修饰。具有相似侧链的氨基酸残基家族在本领域中已经定义。这些家族包 括具有碱性侧链(例如赖氨酸、精氨酸、组氨酸)、酸性侧链(例如天冬氨酸、谷 氨酸)、不带电的极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、 酪氨酸、半胱氨酸、色氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮 氨酸、脯氨酸、苯丙氨酸、甲硫氨酸)、β-分支侧链(例如苏氨酸、缬氨酸、异亮 氨酸)和芳香族侧链(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。因此, S蛋白质的序列内的一个或更多个氨基酸残基可以用来自相同侧链家族的其它 氨基酸残基替换,并且可以通过与序列SEQ ID NO:1所编码的S蛋白质相比较 而检验修饰的S蛋白质所保留的功能(即本文所述的特性)。

当在两个或者更多个多肽序列之间的关系中使用时,术语“同一性”或者“同 一的/相同的”指多肽之间的序列亲缘关系程度,如通过两个或更多个氨基酸残基 串之间匹配数量所确定。“同一性”测量通过特定数学模型或者计算机程序(即“算 法”)计算的具有缺口比对(如果有)的较小的两个或更多个序列之间相同匹配的 百分数。相关多肽的同一性可以通过已知方法容易地计算。此类方法包括,但 不限于,在Computational Molecular Biology,Lesk,A.M.编,Oxford University  Press,New York,1988;Biocomputing:Informatics5and Genome Projects,Smith, D.W.编,Academic Press,New York,1993;Computer Analysis of Sequence Data, Part1,Griffin,A.M.和Griffin,H.G.编,Humana Press,New Jersey,1994; Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987; Sequence Analysis Primer,Gribskov,M.和Devereux,J.编,M.Stockton Press, New York,1991;以及Carillo等,SIAM J.Applied Math.48,1073(1988)中所 述的那些。确定同一性的优选方法被设计成给出所测试序列之间的最大匹配。 确定同一性的方法描述于公众可用的计算机程序中。用于确定两个序列之间同 一性的优选的计算机程序方法包括GCG程序包,包括GAP(Devereux等,Nucl. Acid.Res.\2,387(1984);Genetics Computer Group,University of Wisconsin, Madison,Wis.)、BLASTP、BLASTN、和FASTA(Altschul等,J.MoI.Biol.215, 403-410(1990))。BLASTX程序公众可从美国国立生物技术信息中心(the National  Center for Biotechnology Information,NCBI)和其它来源(BLAST Manual, Altschul等NCB/NLM/NIH Bethesda,Md.20894;Altschul等,同上)获得。众 所周知的Smith Waterman算法也可以用于确定同一性。

在另一个实施方案中,R基因被灭活。R蛋白质是内溶素:该转糖基酶降解 宿主细胞壁的胞壁质。根据一个实施方案,R基因具有序列SEQ ID NO:2。在 另一实施方案中,R基因序列呈现出与SEQ ID NO:2具有至少70%、至少75%、 至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、 至少95%、至少96%、至少97%、至少98%、并且甚至更优选至少99%的序列 同一性。

R基因可包含如上所述的保守序列修饰,该修饰指没有明显影响或者改变R 蛋白质功能的氨基酸修饰。R蛋白质的修饰序列可包含一个、两个、三个、四个 或者更多个的氨基酸插入、缺失或者替代。因此,R蛋白质序列内的一个或更 多个氨基酸残基可以用来自同一侧链家族的另外的氨基酸残基替换,并且可以 通过与序列SEQ ID NO:2所编码R蛋白质相比较检验修饰的R蛋白质保留的功 能(即本文所述的特性)。

在另一个实施方案中,Rz基因被灭活。Rz蛋白质属于spanin家族。该蛋白 质参与溶菌期期间宿主细胞外膜的破裂。根据一个实施方案,Rz基因具有序列 SEQ ID NO:3。在另一个实施方案中,Rz基因的序列呈现出与SEQ ID NO:3 具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少 92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、并 且甚至更优选至少99%的序列同一性。

Rz基因可包含如上所述的保守序列修饰,该修饰指没有明显影响或者改变 Rz蛋白质功能的氨基酸修饰。Rz蛋白质的修饰序列可包含一个、两个、三个、 四个或者更多个的氨基酸插入、缺失或者替代。因此,Rz蛋白质序列内的一个 或更多个氨基酸残基可以用来自同一侧链家族的另外的氨基酸残基替换,并且 可以通过与序列SEQ ID NO:3所编码Rz蛋白质相比较检验修饰的Rz蛋白质保 留的功能(即本文所述的特性)。

在另一个实施方案中,Q基因被灭活。Q蛋白质是晚期基因调节物:Q蛋白 质是从用于转录λDNA的整个“晚期”区的启动子合成RNA的抗终止子。根据一 个实施方案,Q基因具有序列SEQ ID NO:35。在另一个实施方案中,Q基因的 序列呈现出与SEQ ID NO:35具有至少70%、至少75%、至少80%、至少85%、 至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、 至少97%、至少98%、并且甚至更优选至少99%的序列同一性。

Q基因可包含如上所述的保守序列修饰,该修饰指没有明显影响或者改变Q 蛋白质功能的氨基酸修饰。Q蛋白质的修饰序列可包含一个、两个、三个、四 个或者更多个的氨基酸插入、缺失或者替代。因此,Q蛋白质序列内的一个或 更多个氨基酸残基可以用来自同一侧链家族的另外的氨基酸残基替换,并且可 以通过与序列SEQ ID NO:35所编码Q蛋白质相比较检验修饰的Q蛋白质保留 的功能(即本文所述的特性)。

在另一个实施方案中,包含S基因编码序列的核酸片段被缺失。根据本发 明,所述核酸片段不包含ral基因的编码序列(SEQ ID NO:4)和/或N基因的编码 序列(SEQ ID NO:5)。因此,根据一个实施方案,当噬菌体是λ时,残基33930 和35582之间的区域不被缺失。

根据另一个实施方案,当噬菌体是λ(DE3)时,残基10813和11391之间的 区域不被缺失。

优选地,所述核酸片段不包含N和C2的编码序列(SEQ ID NO:6),以及C2 启动子的调节序列。为了确保C2的调节序列不被缺失,待缺失的片段可以在下 一个基因即Cro基因的起始密码子ATG处开始。

更优选地,所述核酸片段不包含ral、N和C2的编码序列(SEQ ID NO:6), 以及C2启动子的调节序列。

C2基因编码阻抑物蛋白,该蛋白对于维持溶原状态是重要的。该基因在其 它几个λ形噬菌体的序列中也称作cI。在λ噬菌体中,ral、N和cI基因的编码 序列为从残基33930至38040或者从残基33930至38022。在λDE3噬菌体中, ral、N、C2基因的编码序列为从残基10813至12436。

在一个实施方案中,所述缺失核酸片段的长度为从30kb至300b,优选从 5kb至500b。在另一个实施方案中,所述缺失核酸片段的长度是30kb、25kb、 20kb、15kb、10kb、9kb、8kb、7kb、6kb、5kb、4kb、3kb、2kb、1kb、 750b、500b。

根据一个实施方案,当噬菌体是λ时,缺失的核酸片段在从位置35582至 位置45186(优选从38041至45186或者从38023至45186)范围的一个位置处 开始,并且在从位置45510至位置48502范围的一个位置处结束。

根据另一个实施方案,当噬菌体是λDE3时,缺失的核酸片段在从位置 11392至位置16764(优选从12437至位置16764)范围的一个位置处开始,并 且在从17088至42925范围的一个位置处结束。

在另一个实施方案中,待缺失的核酸片段包含至少S和R基因的编码序列。 根据一个实施方案,当噬菌体是λ时,核酸片段在从位置35582至位置45186 (优选从38041至45186或者从38023至45186)范围的一个位置处开始,并且 在从位置45970至位置48502范围的一个位置处结束。在另一个实施方案中, 当噬菌体是λDE3时,核酸片段在从位置11392至位置16764(优选从12437 至位置16764)范围的一个位置处开始,并且在从17548和42925范围的一个位 置处结束。

在另一个实施方案中,待缺失的核酸片段包含至少S、R和Rz基因的编码 序列。根据一个实施方案,当噬菌体是λ时,核酸片段在从位置35582至位置 45186(优选从38041至45186或者从38023至45186)范围的一个位置处开始。 根据该实施方案,片段可以在位置46428至位置46458范围的一个位置处结束。 仍然根据该实施方案,核酸片段可以在从46428至48502范围的一个位置处结 束。

根据另一个实施方案,当噬菌体是λDE3时,核酸片段在从位置11392至 位置16764(优选从12437至位置16764)范围的一个位置处开始。根据该实施 方案,片段可以在从位置18006和18036范围的一个位置处结束。仍然根据该 实施方案,核酸片段可以在从位置18006至24496范围的一个位置处结束。仍 然根据该实施方案,核酸片段可以在从位置18006至42925范围的一个位置处 结束。

根据另一个实施方案,待缺失的核酸片段包含至少R基因的编码序列。

根据一个实施方案,当噬菌体是λ时,核酸片段在从位置35582至位置45493 (优选从位置38041或38022至位置45493)范围的一个位置处开始。根据该实 施方案,待缺失的核酸片段可以在从45970至位置48502范围的一个位置处结 束。

根据另一个实施方案,当噬菌体是λDE3时,核酸片段在从位置11392至 位置17071(优选从位置12437至位置17071)范围的一个位置处开始。根据该 实施方案,待缺失的核酸片段可以在从17548至位置24496范围的一个位置处 结束。仍然根据该实施方案,待缺失的核酸片段可以在从17548至位置42925 范围的一个位置处结束。

根据另一个实施方案,待缺失的核酸片段包含至少R和Rz基因的编码序列。

根据一个实施方案,当噬菌体是λ时,核酸片段在从位置35582至位置45493 (优选从位置38041或38022至位置45493)范围的一个位置处开始。根据该实 施方案,待缺失的核酸片段可以在从46428至位置46458范围的一个位置处结 束。仍然根据该实施方案,待缺失的核酸片段可以在从46428至位置48502范 围的一个位置处结束。

根据另一个实施方案,当噬菌体是λDE3时,核酸序列在从位置11392至 位置17071(优选从位置12437至位置17071)范围的一个位置处开始。根据该 实施方案,待缺失的核酸片段可以在从18006至位置18330范围的一个位置处 结束。仍然根据该实施方案,待缺失的核酸片段可以在从18006至位置24496 范围的一个位置处结束。仍然根据该实施方案,待缺失的核酸片段可以在从 18006至位置42925范围的一个位置处结束。

根据另一个实施方案,待缺失的核酸片段包含至少Q基因的编码序列。

根据一个实施方案,当噬菌体是λ时,缺失的核酸片段在从位置35582至 位置43886(优选从38041至43886或者从38023至43886)范围的一个位置处 开始,并且在从位置44510至位置48502范围的一个位置处结束。

根据另一个实施方案,当噬菌体是λDE3时,缺失的核酸片段在从位置 11392至位置15464(优选从12437至位置15464)范围的一个位置处开始,并 且在从16088和42925范围的一个位置处结束。

根据另一个实施方案,待缺失的核酸片段包含至少Q和S基因的编码序列。

根据一个实施方案,当噬菌体是λ时,缺失的核酸片段在从位置35582至 位置43886(优选从38041至43886或者从38023至43886)范围的一个位置处 开始,并且在从位置45510至位置48502范围的一个位置处结束。

根据另一个实施方案,当噬菌体是λDE3时,缺失的核酸片段在从位置 11392至位置15464(优选从12437至位置15464)范围的一个位置处开始,并 且在从17088和42925范围的一个位置处结束。

根据另一个实施方案,待缺失的核酸片段包含至少Q、S和R基因的编码序 列。

根据一个实施方案,当噬菌体是λ时,缺失的核酸片段在从位置35582至 位置43886(优选从38041至43886或者从38023至43886)范围的一个位置处 开始,并且在从位置45970至位置48502范围的一个位置处结束。

根据另一个实施方案,当噬菌体是λDE3时,缺失的核酸片段在从位置 11392至位置15464(优选从12437至位置15464)范围的一个位置处开始,并 且在从17548和42925范围的一个位置处结束。

根据另一个实施方案,待缺失的核酸片段包含至少Q、S、R和Rz基因的编 码序列。

根据一个实施方案,当噬菌体是λ时,缺失的核酸片段在从位置35582至 位置43886(优选从38041至43886或者从38023至43886)范围的一个位置处 开始,并且在从位置46428至位置48502范围的一个位置处结束。

根据另一个实施方案,当噬菌体是λDE3时,缺失的核酸片段在从位置 11392至位置15464(优选从12437至位置15464)范围的一个位置处开始,并 且在从18006和42925范围的一个位置处结束。

在一个实施方案中,Int基因被灭活。Int蛋白质负责切下噬菌体基因组并将 其插入到宿主基因组中。根据一个实施方案,Int基因具有序列SEQ ID NO:7。 在另一个实施方案中,Int基因的序列呈现出与SEQ ID NO:7具有至少70%、至 少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、 至少94%、至少95%、至少96%、至少97%、至少98%、并且甚至更优选至少 99%的序列同一性。

Int基因可包含如上所述的保守序列修饰,该修饰指没有明显影响或者改变 Int蛋白质功能的氨基酸修饰。Int蛋白质的修饰序列可包含一个、两个、三个、 四个或者更多个的氨基酸插入、缺失或者替代。因此,Int蛋白质序列内的一个 或更多个氨基酸残基可以用来自同一侧链家族的另外的氨基酸残基替换,并且 可以通过与序列SEQ ID NO:7所编码Int蛋白质相比较检验修饰的Int蛋白质保 留的功能(即本文所述的特性)。

在一个实施方案中,Xis基因被灭活。Xis蛋白质是切除酶,其参与将λ噬 菌体DNA从细菌宿主染色体切下的过程中。根据一个实施方案,Xis基因具有 序列SEQ ID NO:8。在另一个实施方案中,Xis基因的序列呈现出与SEQ ID NO: 8具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至 少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、 并且甚至更优选至少99%的序列同一性。

Xis基因可包含如上所述的保守序列修饰,该修饰指没有明显影响或者改变 Xis蛋白质功能的氨基酸修饰。Xis蛋白质的修饰序列可包含一个、两个、三个、 四个或者更多个的氨基酸插入、缺失或者替代。因此,Xis蛋白质序列内的一个 或更多个氨基酸残基可以用来自同一侧链家族的另外的氨基酸残基替换,并且 可以通过与序列SEQ ID NO:8所编码Xis蛋白质相比较检验修饰的Xis蛋白质 保留的功能(即本文所述的特性)。

在一个实施方案中,包含Int基因编码序列的核酸片段被缺失。根据一个实 施方案,噬菌体是λ并且待缺失的核酸片段包含从位置27812至28882的残基。 根据另一个实施方案,噬菌体是λ并且待缺失的核酸序列在从位置1至位置 27812范围的一个位置处开始;并且在从28882至33929范围的一个位置处结束。

在一个实施方案中,包含Xis基因编码序列的核酸片段被缺失。

根据一个实施方案,噬菌体是λ并且待缺失的核酸片段包含从位置28860 至29078的残基。根据另一个实施方案,噬菌体是λ并且片段从位置1至位置 28860范围的一个位置处开始,并且在从位置29078至位置33929范围的一个位 置处结束。

根据另一个实施方案,噬菌体是DE3并且缺失的核酸包含从位置5586至 5804的残基。根据另一个实施方案,待缺失的片段在从位置1至位置5586范围 的一个位置处开始,并且在从位置5804至位置10812范围的一个位置处结束。

在一个实施方案中,包含Xis和Int基因编码序列的核酸片段被缺失。根据 一个实施方案,噬菌体是λ并且待缺失的核酸片段包含从位置27812至29078 的残基。根据另一个实施方案,噬菌体是λ并且待缺失的核酸片段在从位置1 至位置27812范围的一个位置处开始;并且在从位置29078至33929范围的一 个位置处结束。

在本发明的一个实施方案中,本发明的遗传修饰噬菌体的kil基因也被灭活。 根据一个实施方案,kil基因具有序列SEQ ID NO:36。在另一个实施方案中,kil 基因呈现出与SEQ ID NO:36具有至少70、75、80、85、90、91、92、93、94、 95、96、97、98、更优选至少99%的序列同一性。优选地,kil基因的编码序列 被缺失。

根据一个实施方案,噬菌体是λ并且缺失的核酸片段包含从位置33187至 33331的残基。

根据另一个实施方案,噬菌体是DE3并且缺失的核酸包含从位置9913至 10057的残基。

根据一个实施方案,attP序列未从本发明噬菌体序列中缺失。attP序列是 SEQ ID NO:9。attP序列位于λ噬菌体序列中从位置27586至27817,和λDE3噬 菌体基因组中从位置42788至42925和从1至94(噬菌体基因组是环状的,因此 attP序列是持续的)。

在本发明的一个实施方案中,遗传修饰噬菌体包含attP序列和C2基因序列。 在另一个实施方案中,遗传修饰噬菌体由attP序列和C2基因序列组成。

根据一个优选的实施方案,本发明的一个遗传修饰噬菌体P11具有序列SEQ  ID NO:10,并且是(DE3)ΔS-C,Δxis-ea10(DE3指其中T7RNA聚合酶基因已经整 合到int基因序列内的λ噬菌体DE3)。所述的修饰噬菌体P11对应于其中基因 S、R、Rz、Xis和Int的编码序列被缺失的序列NC_001416。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P12对应于其中基因 Int和S的编码序列被缺失的序列NC_001416(P12的一个实例是序列DE3ΔS, Δxis-ea10)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P13对应于其中基因 S、R、Rz、Q、Xis和Int的编码序列被缺失的序列NC_001416(P13的一个实例 是序列DE3ΔS-C,Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P14对应于其中基因R 和Int的编码序列被缺失的序列NC_001416(P14的一个实例是序列DE3ΔR)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P15对应于其中基因Q 和Int的编码序列被缺失的序列NC_001416(P15的一个实例是序列DE3ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P16对应于其中基因S 和Xis的编码序列被缺失的序列NC_001416(P16的一个实例是序列NC_001416 ΔS,Δxis-ea10)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P17对应于其中基因R 和Xis的编码序列被缺失的序列NC_001416(P17的一个实例是序列NC_001416 ΔR,Δxis-ea10)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P18对应于其中基因Q 和Xis的编码序列被缺失的序列NC_001416(P18的一个实例是序列NC_001416 Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体p19对应于其中基因 R、Rz和Int的编码序列被缺失的序列NC_001416(P19的一个实例是序列DE3 ΔR,ΔRz)。

根据另一个实施方案、本发明的一个遗传修饰噬菌体P20对应于其中基因 S、Rz和Int的编码序列被缺失的序列NC_001416(P20的一个实例是序列DE3 ΔS,ΔRz)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P21对应于其中基因 Rz、Q和Int的编码序列被缺失的序列NC_001416(P21的一个实例是序列DE3 ΔRz,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P22对应于其中基因 S、Q和Int的编码序列被缺失的序列NC_001416(P22的一个实例是序列DE3 ΔS,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P23对应于其中基因 R、Q、和Int的编码序列被缺失的序列NC_001416(P23的一个实例是序列DE3 ΔR,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P24对应于其中基因 S、R和Int的编码序列被缺失的序列NC_001416(P24的一个实例是序列DE3 ΔS,ΔR)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P25对应于其中基因 R、Rz和Xis的编码序列被缺失的序列NC_001416(P25的一个实例是序列 NC_001416ΔR,Δxis-ea10,ΔRz)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P26对应于其中基因 S、Rz和Xis的编码序列被缺失的序列NC_001416(P26的一个实例是序列 NC_001416ΔS,Δxis-ea10,ΔRz)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P27对应于其中基因 Q、Rz和Xis的编码序列被缺失的序列NC_001416(P27的一个实例是序列 NC_001416ΔRz,Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P28对应于其中基因 S、Q和Xis的编码序列被缺失的序列NC_001416(P28的一个实例是序列 NC_001416ΔS,Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P29对应于其中基因 R、Q和Xis的编码序列被缺失的序列NC_001416(P29的一个实例是序列 NC_001416ΔR,Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P30对应于其中基因 R、S和Xis的编码序列被缺失的序列NC_001416(P30的一个实例是序列 NC_001416ΔS,Δxis-ea10,ΔR)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P31对应于其中基因 R、Xis和Int的编码序列被缺失的序列NC_001416(P31的一个实例是序列DE3 ΔR,Δxis-ea10)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P32对应于其中基因 S、Xis和Int的编码序列被缺失的序列NC_001416(P32的一个实例是序列DE3 ΔS,Δxis-ea10)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P33对应于其中基因 Q、Xis和Int的编码序列被缺失的序列NC_001416(P33的一个实例是序列DE3 Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P34对应于其中基因 S、R、Xis和Int的编码序列被缺失的序列NC_001416(P34的一个实例是序列 DE3ΔS,Δxis-ea10,ΔR)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P35对应于其中基因 R、Q、Xis和Int的编码序列被缺失的序列NC_001416(P35的一个实例是序列 DE3ΔR,Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P36对应于其中基因 S、Q、Xis和Int的编码序列被缺失的序列NC_001416(P36的一个实例是序列 DE3ΔS,Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P37对应于其中基因 R、Rz、Xis和Int的编码序列被缺失的序列NC_001416(P37的一个实例是序列 DE3ΔR,Δxis-ea10,ΔRz)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P38对应于其中基因 S、Rz、Xis和Int的编码序列被缺失的序列NC_001416(P38的一个实例是序列 DE3ΔS,Δxis-ea10,ΔRz)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P39对应于其中基因 Rz、Q、Xis和Int的编码序列被缺失的序列NC_001416(P39的一个实例是序列 DE3ΔRz,Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P40对应于其中基因 S、R、Q和Int的编码序列被缺失的序列NC_001416(P40的一个实例是序列DE3 ΔS,ΔR,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P41对应于其中基因 S、R、Rz和Int的编码序列被缺失的序列NC_001416(P41的一个实例是序列 DE3ΔS-C)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P42对应于其中基因 R、Rz、Q和Int的编码序列被缺失的序列NC_001416(P42的一个实例是序列 DE3ΔR,ΔRz,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P43对应于其中基因 S、Rz、Q和Int的编码序列被缺失的序列NC_001416(P43的一个实例是序列 DE3ΔS,ΔRz,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P44对应于其中基因 S、R、Q和Xis的编码序列被缺失的序列NC_001416(P44的一个实例是序列 NC_001416ΔS,ΔR,Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P45对应于其中基因 S、R、Rz和Xis的编码序列被缺失的序列NC_001416(P45的一个实例是序列 NC_001416ΔS-C,Δxis-ea10)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P46对应于其中基因 R、Rz、Q和Xis的编码序列被缺失的序列NC_001416(P46的一个实例是序列 NC_001416ΔR,ΔRz,Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P47对应于其中基因 S、Rz、Q和Xis的编码序列被缺失的序列NC_001416(P47的一个实例是序列 NC_001416ΔS,ΔRz,Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P48对应于其中基因 S、R、Q、Xis和Int的编码序列被缺失的序列NC_001416(P48的一个实例是序 列DE3ΔS,ΔR,Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P49对应于其中基因 S、Rz、Q、Xis和Int的编码序列被缺失的序列NC_001416(P49的一个实例是序 列DE3ΔS,ΔRz,Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P50对应于其中基因 R、Rz、Q、Xis和Int的编码序列被缺失的序列NC_001416(P50的一个实例是 序列DE3ΔR,ΔRz,Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P51对应于其中基因 S、R、Q、Rz和Int的编码序列被缺失的序列NC_001416(P51的一个实例是序 列DE3ΔS-C,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P52对应于其中基因 S、R、Rz、Q和Xis的编码序列被缺失的序列NC_001416(P52的一个实例是序 列NC_001416ΔS-C,Δxis-ea10,ΔQ)。

根据另一个实施方案,本发明的一个遗传修饰噬菌体P53对应于其中基因 Q、Xis和Int的编码序列被缺失的序列NC_001415(P53的一个实例是序列DE3 Δxis-ea10,ΔQ)。

本发明还涉及生产本发明的修饰噬菌体的方法,其中所述方法包括至少两 个基因缺失步骤。

在一个实施方案中,本发明的方法使用整合入宿主细胞基因组内的噬菌体 开展。

在一个实施方案中,宿主细胞是微生物,优选原核生物,更优选细菌,更 优选革兰氏阴性细菌。有利地,根据当前适用的分类法,宿主细胞是来自肠杆 菌科(Enterobacteriacea)的细菌。如果分类法发生改变,则技术人员将知道如何 适应分类法的改变以推出可以在本发明中使用的菌株。来自肠杆菌科的细菌实 例包括,但不限于,属于埃希氏菌属(Escherichia)、肠杆菌属(Enterobacter)、欧 文氏菌属(Erwinia)、克雷伯氏菌属(Klebsiella)、泛菌属(Pantoea)、光杆菌属 (Photorhabdus)、普罗威登斯菌属(Providencia)、沙门菌属(Salmonella)、沙雷菌 属(Serratia)、志贺氏菌属(Shigella)、摩根菌属(Morganella)和耶尔森菌属(Yersinia) 的细菌。根据一个优选的实施方案,宿主细胞属于埃希氏菌属,并且更优选宿 主细胞是大肠杆菌(Escherichia coli)。

用于从整合的噬菌体中缺失基因的方法是本领域技术人员众所周知的。此 类方法的实例包括,但不限于使用λRed-编码基因:exo、bet和gam的同源重组 (也称作重组工程)。还可以使用来自原噬菌体Rac的对应的recE和recT基因。 基因exo和recE编码产生3’突出端的5’-3’外切核酸酶。Bet和recT基因编码这 样的配对蛋白(或者也称作退火蛋白),该配对蛋白(或者也称作退火蛋白) 结合该3’突出端并介导两个互补DNA序列之间的退火和同源重组。gam基因编 码大肠杆菌RecBCD外切核酸酶的抑制剂并且因此保护目的线性DNA片段。 数位研究者,包括Datsenko和Wanner(PNAS97-12,6640-6645,2000)以及Stewart 等(WO0104288)深入描述了重组工程方法。该方法的原理是产生(例如通过PCR 扩增)包含待整合片段和两个重组臂的DNA片段。这些臂与待灭活基因的毗连 区同源。它们将用于靶向插入目的片段。可以使用包含20至60个核苷酸的同 源臂的引物通过PCR产生这种DNA片段。

本发明还涉及包含本发明的遗传修饰的噬菌体的宿主细胞。在一个优选的 实施方案中,本发明的宿主细胞包含整合入其基因组内的遗传修饰的噬菌体。

在一个实施方案中,宿主细胞是微生物,优选原核生物,更优选细菌,更 优选革兰氏阴性细菌。有利地,根据当前适用的分类法,宿主细胞是来自肠杆 菌科的细菌。如果分类法发生改变,则技术人员将知道如何适应分类法的改变 以推出可以在本发明中使用的菌株。来自肠杆菌科的细菌包括,但不限于,属 于埃希氏菌属(Escherichia)、肠杆菌属(Enterobacter)、欧文氏菌属(Erwinia)、克 雷伯氏菌属(Klebsiella)、泛菌属(Pantoea)、光杆菌属(Photorhabdus)、普罗威登 斯菌属(Providencia)、沙门菌属(Salmonella)、沙雷菌属(Serratia)、志贺氏菌属 (Shigella)、摩根菌属(Morganella)和耶尔森菌属(Yersinia)的细菌。根据一个优选 的实施方案,宿主细胞属于埃希氏菌属,并且更优选宿主细胞是大肠杆菌 (Escherichia coli)。可以在本发明中使用的大肠杆菌菌株实例包括,但不限于, 从大肠杆菌K-12、大肠杆菌B或者大肠杆菌W衍生的菌株,诸如,例如MG1655、 W3110、DG1、DG2、Top10、DH10B、DH5alpha、HMS174、BL21、BL21(DE3)、 HMS174(DE3)、BL21(DE3)pLysS、BL21(DE3)pLysE。

在一个实施方案中,宿主细胞的基因可以被灭活。

在一个实施方案中,基因tonA(也称作fhuA,SEQ ID NO:11)被灭活。 TonA/FhuA蛋白质是噬菌体T1、T5和Phi80的受体。

在一个实施方案中,基因galK(SEQ ID NO:12)被灭活。该基因的缺失使得 对于通过基于同源重组的方法的基因缺失可以使用galK阳性/阴性选择。

在一个实施方案中,基因araB(SEQ ID NO:13)被灭活。在另一个实施方案 中,基因araA(SEQ ID NO:14)被灭活。araB和/或araA的灭活对于在宿主细胞 内使用启动子PBAD(可通过阿拉伯糖诱导)是推荐的。

在一个实施方案中,基因lon(SEQ ID NO:15)和/或基因ompT(SEQ ID NO: 16)被灭活。Lon蛋白质是ATP依赖性蛋白酶。OmpT蛋白质是外膜蛋白酶。优 选地,基因lon和ompT被灭活。

在一个实施方案中,基因rcsA(SEQ ID NO:17)被灭活。蛋白质RcsA是荚 膜合成的正调节物,荚膜被Lon蛋白酶降解。

在一个实施方案中,基因hsdR(SEQ ID NO:18)和/或基因mrr(SEQ ID NO: 19)被灭活。HsdR和Mrr蛋白质是具有不同特异性的限制性酶。优选地,基因 hsdR和mrr两者均被灭活。

在一个实施方案中,基因endA(SEQ ID NO:20)和/或基因recA(SEQ ID NO: 21)被灭活。EndA是DNA特异性的内切核酸酶。RecA是具有蛋白酶和核酸酶 活性的重组蛋白。优选地,基因endA和recA两者均被灭活。

在本发明的一个实施方案中,至少基因tonA、galK、araB、araA、lon、ompT、 rcsA、hsdR、mrr、endA和recA之一被灭活。优选地,所灭活基因被缺失。

在一个优选的实施方案中,基因tonA、galK、araB、lon、ompT、rcsA、hsdR、 mrr、endA和recA被灭活。优选地,基因tonA、galK、araB、lon、ompT、rcsA、 hsdR、mrr、endA和recA被灭活。

在本发明的一个实施方案中,本发明的宿主细胞以编码毒性分子的核酸序 列转化,如US2004/0115811中所述。编码毒性分子的核酸序列的存在将使得可 以选择已经整合有目的基因和编码针对毒性分子的功能性解毒蛋白质的核苷酸 序列的重组克隆,其中所述重组克隆是在其被整合进入基因组中包含编码所述 毒性分子的核苷酸序列的宿主细胞之后存活的克隆。

根据本发明的一个优选的实施方案,解毒蛋白质和毒性分子分别是抗毒蛋 白和毒蛋白。所述的抗毒蛋白或毒蛋白可以是天然或者人为性有毒的并影响细 胞(优选原核生物细胞)的一个或更多个关键功能和可能导致杀死细胞的野生型 蛋白质或者修饰蛋白质。

解毒蛋白质和毒性分子优选选自如US2004/0115811中所述的CcdA/CcdB 蛋白质、Kis/Kid蛋白质、Phd/Doc蛋白质、RelB/relE蛋白质、PasB(或PasC)/PasA 蛋白质、mazF/mazE蛋白质,或者质粒来源或者非质粒来源的任何其他抗毒分 子/毒分子对。毒性分子还可以是天然或者人为具有毒性的并且影响(原核生物) 细胞的一个或者更多个关键功能的毒素蛋白。基因sacB编码的蛋白质(来自解 淀粉芽孢杆菌(Bacillus amylolique-faciens))、蛋白质GpE、蛋白质GATA-1和蛋 白质Crp是此类毒性分子的其它实例。基因sacB编码果聚糖蔗糖酶,其催化蔗 糖水解成对大肠杆菌具有毒性的产物(Pierce等Proc.Natl.Acad.Sci.,第89卷, 第6期(1992),第2056-2060页)。蛋白质GpE由来自噬菌体[phi]X174的E基因 编码,该基因包含六个独特的限制酶切位点并编码gpE,并且引起大肠杆菌细胞 裂解(Heinrich等,Gene,第42(3)卷(1986),第345-349页)。蛋白质GATA-1已 经由Trudel等(Biotechniques1996,第20(4)卷,第684-693页)描述。蛋白质 Crp已经由Schlieper等(Anal.Biochem.1998,第257(2)卷,第203-209页)描述。

针对所述毒性分子的解毒蛋白质是能够减少或抑制相应毒性分子对细胞(优 选原核生物细胞)影响的任何蛋白质,其中所述毒性分子由所述细胞产生。

根据一个优选的实施方案,本发明的宿主细胞包含编码蛋白质CcdB的核酸 序列。ccdB基因具有序列SEQ ID NO:22。

本发明还涉及包含如上所述的编码毒蛋白的基因被插入其中的宿主细胞、 和携带编码抗毒蛋白的基因的核酸序列的质粒的试剂盒。抗毒蛋白在宿主细胞 内的表达是维持宿主细胞生存力所必需的。在一个优选的实施方案中,毒蛋白 由ccdB基因编码,并且抗毒蛋白由ccdA基因(SEQ ID NO:23)编码。

根据本发明的一个实施方案,试剂盒的质粒还可包含或者可被修饰成还包 含目的生物分子的核酸序列。

本发明还涉及用于制备如上所述宿主细胞的方法。

在一个实施方案中,本发明的方法包括以本发明的遗传修饰的噬菌体感染 宿主细胞的步骤。在本发明的一个实施方案中,所述感染步骤包括使用辅助噬 菌体。在本发明目的中,术语“辅助噬菌体”指用于弥补另一噬菌体的缺失或灭活 的噬菌体。辅助噬菌体将提供另一噬菌体丧失的功能,以便能够感染细菌或者 制备噬菌体液。通常,辅助噬菌体自身不能够形成溶原,因为它是cI阴性的(其 不具有阻抑物并且因此是烈性的)。

使用辅助噬菌体以噬菌体感染宿主细胞的方法是本领域众所周知的。第一 步是制备裂解物并且第二步是溶原化。简言之,使用如“Molecular cloning:a  laboratory manual”,Sambrook等(2001,ISBN978-087969577-4)或“Large-and  Small-Scale Preparation of Bacteriophage lambda lysate and DNA”,Su等, BioTechniques25:44-46(1998年7月)中所述的标准方法制备辅助噬菌体的细菌 裂解物。在噬菌体诱导(最常用UV照射或者其中溶原体经历DNA损伤或者宿 主SOS反应或者Cro产生的任何状态)以激起裂解周期后使用相同的原理,并使 用辅助噬菌体以提供丧失的功能来开展目的噬菌体的制备。作为辅助噬菌体的 备选方案是使用编码丧失功能的质粒。

接着,将噬菌体裂解物与靶细菌混合,并铺板于LB板上以获得溶原体(如 来自Novagen的λDE3溶原化试剂盒User Protocol TB031中所述或者一个备选 方法描述于Studier和Moffat,Journal of Molecular Biology,1986,189:113-130 中)。选择噬菌体可以用于专门选择包含目的噬菌体的细菌。这种选择噬菌体是 具有与目的噬菌体相同免疫性的烈性噬菌体。因此,选择噬菌体不能够形成噬 菌斑或者杀死目的噬菌体的细菌溶原体,因为该噬菌体产生cI阻抑物(在DE3λ 噬菌体中也称作C2)。

因此,本发明还涉及包含如上所述的本发明的修饰噬菌体和辅助噬菌体的 试剂盒。辅助噬菌体实例包括,但不限于,辅助噬菌体B10或者具有与目的噬 菌体不同免疫性的任何其它λ形噬菌体(例如具有免疫性的噬菌体434、80等)。 一些辅助噬菌体以及对它们的操作在文献包括Haldimann和Wanner(Journal of  Bacteriology,183,6384-6393,2001)中有深入描述。

在一个实施方案中,用于制备本发明宿主细胞的方法还包括缺失步骤,其 中宿主细胞的核酸序列被缺失。用于基因序列缺失的方法是技术人员众所周知 的。更有效的方法是λRed-编码基因或者来自原噬菌体Rac的recE和recT基因 介导的同源重组方法。如上所述,该方法由数名研究者,包括Datsenko和Wanner (PNAS97-12,6640-6645,2000)以及Stewart等(WO0104288)深入描述。使用 具有与待灭活基因毗连区同源的20至60个核苷酸的延长部分的引物产生PCR 产物。由于仅小量的细菌会有效重组目的片段,因此必需具有强的选择标记物 以筛选它。抗生素标记物可以用于筛选重组体:修饰的引物用于扩增抗生素抗 性基因。在重组基因的转化和活化之后,在含合适抗生素的培养基上筛选重组 细菌。在该情况下,靶向基因被抗生素抗性基因代替。为了在下一次缺失中使 用相同的策略,必需在第二步过程中去除该抗生素抗性基因。如Datsenko和 Wanner中所述,可以使用侧翼为FRT(FLP识别靶点)位点的抗生素抗性基因。 然后使用编码FLP重组酶的辅助质粒清除抗性基因。抗生素抗性基因通过该位 点特异性重组酶被去除,但是该方法留下痕迹:在抗生素抗性基因去除后仍然 存在一个位点特异性重组位点。

为了避免存在该位点,更优选地,本发明方法使用galK作为标记基因。galK 选择的原理描述于Warming等(Nucleic acid research,2005,33(4))中。该方法 使用galK作为第一次重组(插入)期间的阳性选择标记物(在含半乳糖的基本培养 基上生长)。在第二个同源重组步骤过程中实现该标记物的去除。在该步骤过程 中,galK用作含2-脱氧-半乳糖(DOG)的基本培养基上的阴性选择标记物。galK 基因产物半乳糖激酶催化半乳糖降解途径中的第一步。半乳糖激酶还有效催化 DOG半乳糖类似物的磷酸化。该反应的产物不能够被进一步代谢,这导致毒性 分子(2-脱氧-半乳糖-1-磷酸)的积累。该方法的益处是避免在靶基因缺失和选择 标记物去除后存在特异性重组位点。

本发明还涉及用于产生目的生物分子的方法,包括

-培养包含本发明的遗传修饰的噬菌体和目的生物分子的核酸序列的宿主 细胞,

-收集该目的生物分子。

在本发明的一个实施方案中,目的生物分子的核酸序列包含于遗传修饰的 噬菌体的表达系统内。根据该实施方案,目的生物分子的生产是直接的,即来 自表达系统的基因表达,例如通过在其中表达系统内包含的启动子被诱导的培 养基中培养。

在本发明的另一个实施方案中,遗传修饰的噬菌体表达系统包含处于lac 启动子、优选地lacUV5启动子控制下的T7RNA聚合酶的核酸序列。根据该实 施方案,用于生产目的生物分子的方法包含以下述的质粒转化宿主细胞,所述 质粒包含处于T7启动子控制下的目的生物分子的核酸序列。从T7启动子的表 达处于对T7启动子在T7RNA聚合酶控制下,而T7RNA聚合酶对T7启动子 严格特异,即T7启动子只能被噬菌体T7RNA聚合酶利用。当向培养基中加入 IPTG时,T7RNA聚合酶通过从lac启动子转录而表达,并且使得可以表达目的 生物分子。

在本发明目的中,术语“T7启动子”包括噬菌体T7基因组中存在的启动子, 以及具有介导通过T7RNA聚合酶转录的能力的此类启动子的共有序列和变体。 噬菌体T7包含7个不同的启动子序列,它们均包含高度保守的核苷酸序列。

根据一个优选的实施方案,包含目的生物分子的核酸序列的质粒还包含 ccdA核酸序列,并且宿主细胞包含整合入其基因组内的ccdB序列。因此,仅包 含该质粒的重组克隆增殖。

根据一个实施方案,目的生物分子被宿主细胞分泌到发酵肉汤中。根据该 实施方案,目的生物分子可以容易地从发酵肉汤中收集。

根据另一个实施方案,目的生物分子不被宿主细胞分泌到发酵肉汤中。用 于收集细胞内目的生物分子的方法是本领域众所周知的。此类方法的实例包括, 但不限于,使用三氯乙酸(TCA)或含十二烷基硫酸钠(SDS)的裂解缓冲液收集变 性状态的总的细胞质蛋白质,或者使用超声、弗细胞压碎器或在压力下破碎细 菌的等效装置收集天然(非变性)状态的总的细胞质蛋白质。接着,使用特别的方 法(包括但不限于使用亲和柱或者离子交换柱)纯化目的蛋白质。

附图说明

图1:用考马斯兰染色着色的SDS-Page凝胶图片,显示目的蛋白质的产生。 1和6:分子量大小;2:诱导前的[pScherry1]M11DE3沉淀物;3:诱导后的 [pScherry1]M11DE3沉淀物;4:诱导前的[pScherry1]HMS174DE3沉淀物;5:诱 导后的[pScherry1]HMS174DE3沉淀物。箭头处用于指出目的蛋白质。

实施例

本发明还通过下列实施例进一步说明。

实施例1:xis、exo、bet、gam、kil、cIII、N和ral基因的缺失

a)xis DNA区缺失和被galK替换

首先,使用引物XisgalKstart(5’ GGGGGTAAATCCCGGCGCTCATGACTTCGCCTTCTTCCCAGAATTCCTGTTGAC  AATTA3’,EQ ID NO:24)和XisgalK stop(5’ GTTCTGATTATTGGAAATCTTCTTTGCCCTCCAGTGTGAGCAGCACTGTCCTGCT  CCTTG3',SEQ ID NO:25)通过聚合酶链式反应(PCR)在pGalK质粒上扩 增galK基因。这些引物在5’端包含与DNA靶相同的40个碱基的序列(斜体)。 这些40个碱基的序列是重组臂。3’端设计成用于扩增galK基因及其组成型启动 子。通过PCR扩增的DNA片段(1315bp)靶向基因xis、exo、bet、gam、kil和cIII (5133bp的DNA片段):在同源重组过程中这些基因被galK基因及其启动子替 换。根据Datsenko和Wanner(PNAS97-12,6640-6645,2000)制备携带T7(DE3) 原噬菌体和pKD46质粒的电感受态细菌。接着,根据标准程序将扩增的galK片 段电穿孔进入这些细菌中(每次电穿孔使用200ng DNA片段)。加入SOC培养基 并且将细菌于37℃培养1小时。接着,用M9基础培养基(Sambrook等(2001, ISBN978-087969577-4))洗涤细菌两次(离心,去除培养基,加入新鲜培养基和 重悬浮)并且铺板于含M9基础培养基和1%半乳糖的细菌平板上。平板于37℃ 培养1天或2天。

下一步是细菌筛选:使用Xis1 (5'GTCTTCAAGTGGAGCATCAG3',SEQ TD NO:26)和Xis4 (5'ACCAGGACTATCCGTATGAC3',SEQ ID NO:27)引物直接在菌落上 开展PCR筛选。5774bp DNA片段的扩增对应着非修饰染色体(非重组菌落),相 反,1955bp DNA片段的扩增对应着重组染色体。选择可以扩增出1955bp DNA 片段的细菌并且并且在选择平板(添加1%半乳糖的M9基因培养基)上划线接种 两次以纯化它并去除可能的未修饰的染色体拷贝。在纯化步骤结束时开展PCR 筛选一次以上并且选择3个可以扩增出1955bp DNA片段的细菌。对应于这些细 菌的扩增出的DNA片段使用相同的引物测序以确认DNA重组和Xis DNA区 (xis、exo、bet、gam、kil和cIII基因)缺失。

b)GalK去除

包含大的重组臂(350bp和343bp)的DNA片段通过PCR构建以去除galK 和N和ral基因。第一个臂通过使用Xis1和Xis2 (5'CCAAACGGAACAGATGAAGAAGGCGAAGTCATGAG3',SEQ TD NO:28)引物 在含T7(DE3)原噬菌体的细菌菌落上扩增。扩增了365个碱基的DNA片段。第 二个臂也通过使用Xis3(5’ GACTTCGCCTTCTTCATCTGTTCCGTTTGGCTTCC3',SEQ ID NO:29)和 Xis6(5'GTAATGGAAAGCTGGTAGTCG3',SEQ ID NO:30)引物在相同细 菌上PCR开展扩增。扩增了358个碱基的DNA片段。两个重组臂均在琼脂糖 凝胶电泳之后纯化。Xis2和Xis3引物被设计成产生包含30个碱基对的相同序 列的DNA片段。该序列用于在使用Xis1和Xis6引物的第三次PCR中连接两个 重组臂。产生了693bp的DNA片段。将该DNA片段电穿孔进入如上选择的并 且携带pKD46质粒的细菌内(如Datsenko和Wanner中所述制备的)。加入SOC 培养基并将细菌于37℃培养1小时。接着,用M9培养基洗涤细菌两次并且铺 板于含M9培养基并补充有0.2%甘油和1%DOG的选择平板上。将平板于37℃ 培养2天。通过使用Xis5 (5'CAGCCGTAAGTCTTGATCTC3’SEQ ID NO:31)和Xis7 (5'CAGCAGGCATGATCCAAGAG3',SEQ ID NO:32)引物的PCR筛选出 数个菌落。通常获得对应着未修饰DNA染色体的3246bp扩增物,而不是对应 着修饰染色体的1122bp扩增物。完全且独立地重复实验三次,但没有成功:没 有得到包含所希望缺失的细菌。

因此,我们决定仅去除GalK片段而留下N和ral基因。包含重组臂的DNA 片段如上所述使用针对第一个重组臂(365bp)的Xis,1Xis2b(5’ TTTGCCCTCCAGTGTGAAGAAGGCGAAGTCATGAG3',SEQ ID NO:33)和针对第 二个重组臂(384bp)的Xis8 (5’CTCATGACTTCGCCTTCTTCACACTGGAGGGCAAAGAAG,SEQ ID NO:34)和 Xis4产生。使用Xis1和Xis4引物开展连接PCR并且产生714bp的DNA片段。 将该片段如上所述电穿孔入选择的并携带pKD46质粒的细菌中。将细菌铺板于 包含DOG的相同选择平板上并且于37℃培养2天。使用Xis5和Xis6引物开展 PCR筛选。选择并纯化展现出1770bp扩增物(而不是对应于未修饰染色体的 3010bp扩增物)的细菌。DNA片段使用Xis5和Xis6引物测序并且显示正确去除 了galK基因。该重组仅开展了一次,因为立刻得到了细菌。

这些结果显示使用同源重组不可能与N和ral基因一起去除galK。然而, 使用完全相同的方法我们能够单独去除galK。

总之,我们证明N和ral基因的去除导致细菌死亡,这是没有预料到的。

实施例2:使用MG1655的蛋白质表达

为了测试根据本发明构建的菌株的蛋白质生产效率,使用称作M11(DE3) 的细菌开展小规模表达测试。该菌株的基因型是MG1655ΔgalK,ΔrcsA,Δlon, ΔhsdR-mrr,ΔfhuA,ΔendA,ΔrecA,ΔaraB,ΔompT,λ-DE3(T7pol,Δxis-ea10, ΔS-C)。由于MG1655是大肠杆菌K-12,将其与在蛋白质生产领域中用作标准的 并且称作HSM174(DE3)(基因型:recA1,hsdR,λ-DE3,(Rif R))的另一K-12菌 株相比较。两个菌株均以pSCherry1质粒DNA(Delphi Genetics,比利时)转化。 该质粒编码处于T7启动子控制下的容易检测的(通过眼睛观察,呈红色)称作 “cherry”的蛋白质。

用于使用IPTG的小规模表达的方案:

1)装有10ml LB培养基的两个锥形瓶分别用两者均携带pSCherry1质粒的 HMS174(DE3)和M11(DE3)的单个菌落接种,并于30℃培养过夜。

2)两个装有新鲜培养基的新烧瓶以1ml过夜培养物接种,并且于37℃摇动 培养直到OD600达到0.6。

3)从每一烧瓶取出样品(1ml)并离心。丢弃培养基并将沉淀物置于冰上。样 品为非诱导对照。为了诱导剩余培养物中的蛋白质表达,向两个烧瓶中加入 IPTG(异丙基β-D-1-硫代吡喃半乳糖苷,90μl新鲜的100mM母液),以达到1mM 的终浓度。将两个烧瓶继续培养4小时。

4)在诱导期间结束时,对于每一培养物测量600nm下的光密度(对于 M11(DE3)为1.09,并且对于HMS174(DE3)为1.13)。将每一烧瓶的1ml样品于 4℃下以最大速度(13000g)离心10分钟。观察到由于Cherry蛋白质的表达沉淀 物是红色的。丢弃上清液并且加入100μl水将细菌重悬。还加入100μl“裂解”缓 冲液(100mM DTT,2%SDS,80mM Tris-HCl,pH6.8,0.006%溴酚蓝,15%甘 油)以裂解细菌。非诱导样品以相同的方案处理,例外的是仅使用60μl水和60μl 裂解缓冲液(根据样品的光密度)。

5)将样品于70℃-100℃加热(10分钟)以重悬所有的蛋白质并使蛋白质变性。

6)将10μl的每一样品加载到12%SDS-PAGE凝胶上并在100Volt下迁移 2小时。

7)迁移之后,用考马斯兰染色将蛋白质着色。

如图1中所示,两个菌株均能够生产目的蛋白质(Cherry蛋白质,箭头所指 示),但是使用M11(DE3)的产量是使用HMS174(DE3)的大约5至10倍。实验开 展两次,得到完全相同的结果。

实施例3:使用BL21(DE3)的蛋白质表达

根据实施例1构建缺失Δxis-ea10和/或ΔS-C的BL21(DE3)菌株。ΔS-C缺失 单独或者与Δxis-ea10缺失组合插入到细菌的染色体中(在缺失int基因并编码T7 RNA聚合酶的λDE3中)。因此构建了两个BL21(DE3)衍生物:BL21(DE3)ΔS-C 和BL21(DE3)Δxis-ea10,ΔS-C。通过对修饰区的PCR扩增确认缺失并将该区域 测序。根据理论序列,该测序步骤确认存在相应的缺失。接着,根据实施例2 测试所构建的细菌使用编码cherry蛋白质(pSCherry1和pSSC-Cherry1,Delphi  Genetics)的2个不同质粒的蛋白质表达。结果清楚地显示编码cherry蛋白质的 cherry基因的过表达。该蛋白质通过眼睛和根据SDS-PAGE分析被容易地检测。

因此我们推断这些细菌能够过量生产蛋白质而没有因为λDE3噬菌体而引 起的不需要的细菌裂解的危险,这是因为该噬菌体至少缺失编码噬菌体切除和 细菌裂解所必需功能的int、S、R和Rz基因。

由于蛋白质表达期间的细菌裂解依赖于数个参数包括生长条件、过表达的 蛋白质等等,我们设计了模型菌株以证明由于特定基因缺失所构建的菌株可抵 抗裂解。在λ噬菌体中,需要CI阻抑物的组成型表达以阻抑裂解发生并维持原 噬菌体的溶原状态。该阻抑物的突变体(CI857)是众所周知的,因为其具有热敏感 性的能力:在30℃下,突变的阻抑物具有完全的活性并且其维持溶原状态。然 而,在更高温度下(37℃至42℃),CI857不是有效的并且其诱导λ噬菌体的裂解 状态。构建了携带该CI857突变和根据本发明的缺失的菌株:BL21(DE3)ΔS-C对 应于含P41的BL21菌株;BL21(DE3)Δxis-ea10和ΔS-C对应于含P11的BL21 菌株;BL21(DE3)Δxis-ea10,ΔS-C和ΔQ对应于含P13的BL21菌株;BL21(DE3) ΔQ对应于含P15的BL21菌株;并且BL21(DE3)Δxis-ea10和ΔQ对应于含P53 的BL21菌株。

通过将温度改变至42℃,诱导了裂解状态。对于本发明的菌株没有观察到 裂解。此外,我们观察到,与对照相比,对于本发明的菌株目的蛋白质(cherry 蛋白质)的生产量得到改善。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号