首页> 中国专利> 使用具有被打断的葡糖脱氢酶基因(GMS 01)的微生物来生产生物质的工艺

使用具有被打断的葡糖脱氢酶基因(GMS 01)的微生物来生产生物质的工艺

摘要

本发明涉及经遗传工程改造的微生物,其被改造来增加从碳源(例如葡萄糖)生产生物质的产率和效率。本发明还提供了产生此类微生物的方法。本发明还涉及包含下述基因的多核苷酸序列,所述基因编码涉及诸如葡萄糖的碳源向生物质的生物转化的蛋白质。本发明还涉及:包含该新颖基因的全长多核苷酸序列的多核苷酸及其片段,所述多核苷酸编码的新颖的多肽及其片段,以及它们的功能等同物。本发明还包括使用多核苷酸和经修饰的多核苷酸序列转化宿主微生物的方法,由此产生具有降低的碳源转移的微生物,即从碳源(例如葡萄糖)进行的生物质生产的产率和/或效率更高。

著录项

  • 公开/公告号CN101341250A

    专利类型发明专利

  • 公开/公告日2009-01-07

    原文格式PDF

  • 申请/专利权人 帝斯曼知识产权资产管理有限公司;

    申请/专利号CN200680033031.0

  • 发明设计人 新城雅子;

    申请日2006-09-07

  • 分类号C12N15/53;C12N9/04;C12P1/04;

  • 代理机构北京东方亿思知识产权代理有限责任公司;

  • 代理人肖善强

  • 地址 荷兰海尔伦

  • 入库时间 2023-12-17 21:15:08

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-08-28

    未缴年费专利权终止 IPC(主分类):C12N15/53 授权公告日:20130320 终止日期:20170907 申请日:20060907

    专利权的终止

  • 2013-03-20

    授权

    授权

  • 2009-02-25

    实质审查的生效

    实质审查的生效

  • 2009-01-07

    公开

    公开

说明书

本发明涉及经遗传工程改造的微生物,其被改造来增加从碳源(例如 葡萄糖)生产生物质(biomass)的产率和效率。本发明还提供了产生此类 微生物的方法。本发明还涉及包含下述基因的多核苷酸序列,所述基因编 码涉及碳源生物转化,例如葡萄糖向生物质的生物转化的蛋白质。本发明 还涉及:包含该新颖基因的全长多核苷酸序列的多核苷酸及其片段,所述 多核苷酸编码的新颖的多肽及其片段,以及它们的功能等同物。本发明还 包括使用多核苷酸和经修饰的多核苷酸序列转化宿主微生物的方法,由此 产生具有降低的碳源转移(diversion)的微生物,即从碳源(例如葡萄 糖)进行的生物质生产的产率和/或效率更高。

碳源的生物转化可能涉及很多不同代谢途径,以及涉及若干酶促步 骤,以产生生物质,其中,酶可位于宿主细胞的胞质溶胶中、膜上或周质 空间中。此外,转运蛋白也可能在碳源向生物质的高效转化中具有重要作 用。

例如,在乙酸细菌(其是专性需氧的革兰氏阴性微生物,属于 Acetobacter、Gluconobacter和Gluconacetobacter属)的情况下,这些微生 物能通过与膜结合的D-葡糖脱氢酶在周质膜水平上将D-葡萄糖氧化成D- 葡萄糖酸盐/酯,并将D-葡萄糖酸盐/酯转运进胞质溶胶。然后通过葡萄糖 酸激酶将D-葡萄糖酸盐/酯磷酸化为D-葡萄糖酸盐/酯-6-磷酸盐/酯。除此 之外,人们相信,D-葡萄糖可被直接转运进胞质溶胶,然后通过胞质溶胶 中的NAD(P)-依赖性D-葡萄糖脱氢酶将其转化为D-葡萄糖酸盐/酯。此 外,转运进胞质溶胶的D-葡萄糖还可先被磷酸化为D-葡萄糖-6-磷酸盐/ 酯,然后再被脱氢成D-葡萄糖酸盐/酯-6-磷酸盐/酯。D-葡萄糖酸盐/酯-6- 磷酸盐/酯可进入磷酸戊糖途径,其被进一步代谢,产生以NAD(P)H形式 存在的还原能量和生长及维持所必需的三羧基化合物。

在葡萄糖代谢中具有活性的蛋白质,尤其是酶,在本文中被称为涉及 葡萄糖代谢系统(Glucose Metabolization System)。此类蛋白质在本文中 被缩写为GMS蛋白,其在碳源(例如葡萄糖)向生物质的直接代谢或生 物转化中发挥作用。

但是,此类生物转化的一个缺点在于,碳源或中间产物通过所述生物 转化过程转移,使得,例如,下一个(酶促)步骤不能以最优方式进行, 导致损失了可获得的用于向生物质的转化的碳底物材料,以及由此导致的 能量(以例如ATP或NADPH的形式存在)损失。在例如葡萄糖向生物质 的生物转化的情况下,该损失可能是由于将葡萄糖或其中间产物转运出胞 质溶胶导致的,或者是使用葡萄糖或得到的中间产物作为不导致产生生物 质的其它途径的底物而导致的。

本发明的一个目的是提供被改造的微生物,是以下述方式对其进行改 造的,所述方式使得经过碳源(例如葡萄糖)的生物转化的碳源转移被改 变,例如,通过降低碳源转移,从而从此类碳源生产更高产量和/或产率的 生物质。

令人吃惊地,现已发现,GMS蛋白或此类蛋白的具有针对或涉及碳源 (例如,葡萄糖)生物转化的活性的亚基在对生物质的生产中具有重要作 用。

在一种实施方式中,本发明的GMS蛋白选自氧化还原酶[EC 1],优选 选自在供体的CH-OH上发挥作用的氧化还原酶[EC 1.1],更优选选自用 NAD+或NADP+作为受体的氧化还原酶[EC 1.1.1]以及具有醌或类似化合物 受体的氧化还原酶[EC 1.1.5],最优选是NADP依赖性葡糖脱氢酶[EC 1.1.1.47]和PQQ依赖性葡糖脱氢酶[EC 1.1.5.2],或者,本发明的GMS蛋 白选自转移酶[EC 2],优选地,转移含磷基团的转移酶[EC 2.7],更优选 地,具有醇基团受体的磷酸转移酶[EC 2.7.1],最优选地,葡萄糖酸激酶 [EC 2.7.1.12]。

此外,GMS蛋白或此类蛋白的具有针对或涉及碳源(例如,葡萄糖) 向生物质的生物转化的活性的亚基可选自与膜结合的PQQ依赖性D-葡糖 脱氢酶,NAD(P)-依赖性D-葡糖脱氢酶,胞质D-葡糖激酶,具有针对或涉 及D-葡萄糖酸盐/酯同化的活性的酶或酶亚基,例如与膜结合的FAD依赖 性D-葡萄糖酸盐/酯脱氢酶(形成2-酮基-D-葡萄糖酸盐/酯),与膜结合的 PQQ依赖性D-葡萄糖酸盐/酯脱氢酶(形成5-酮基-D-葡萄糖酸盐/酯), 胞质D-葡萄糖酸盐/酯脱氢酶,具有针对或涉及2KD同化的活性的酶或酶 亚基,例如与膜结合的FAD依赖性2-酮基-D-葡萄糖酸盐/酯脱氢酶, NAD(P)-依赖性葡糖-1-脱氢酶,含核黄素的葡萄糖酸盐/酯-2-脱氢酶,葡萄 糖酸盐/酯-5-脱氢酶(5-酮基-D-葡萄糖酸盐/酯还原酶)和胞质NAD(P)-依 赖性2-酮基-D-葡萄糖酸盐/酯脱氢酶构成的组。

特别地,现已发现,具有下述核苷酸序列的多核苷酸编码的GMS蛋 白在碳源(例如,葡萄糖)向生物质的生物转化中具有重要作用,该核苷 酸序列能在优选高度严谨条件下与SEQ ID NO:1所示的序列杂交。现还 已发现,通过在微生物(例如Gluconobacter)中对根据本发明的此类核苷 酸进行遗传改变,可很大程度地提高所述微生物所述生物转化的的效率, 导致,例如,从碳源(例如,葡萄糖)到生物质的更高的产量和/或产率。

随后,本发明涉及选自下述组的多核苷酸或此类多核苷酸的互补链, 所述组由:

(a)编码包含根据SEQ ID NO:2的氨基酸序列的多肽的多核苷酸;

(b)包含根据SEQ ID NO:1的核苷酸序列的多核苷酸;

(c)包含下述核苷酸序列的多核苷酸,所述核苷酸序列可使用来自 微生物的基因组DNA作为模板,并使用根据SEQ ID NO:3和SEQ ID NO:4的引物组,通过核酸扩增(例如聚合酶链式反应)来获得;

(d)多核苷酸,其包含编码被(a)至(c)中任一项的多核苷酸编码 的多肽的片段或衍生物的核苷酸序列,其中,在所述衍生物中,一个或多 个氨基酸残基较之所述多肽被保守取代,并且,所述片段或衍生物具有氧 化还原酶[EC 1],优选在供体的CH-OH上发挥作用的氧化还原酶[EC 1.1] (GMS01)的活性;

(e)编码氧化还原酶[EC 1],优选在供体的CH-OH上发挥作用的氧 化还原酶[EC 1.1](GMS01)的多核苷酸,其互补链能在严谨条件下与 (a)至(d)中任一项所定义的多核苷酸互补;以及

(f)编码氧化还原酶[EC 1],优选在供体的CH-OH上发挥作用的氧 化还原酶[EC 1.1](GMS01)的多核苷酸,其与(a)至(d)中任一项所 定义的多核苷酸至少70%相同,例如85%、90%或95%相同;

构成。

我们发现,本文中描述的SEQ ID NO:2示出的从Gluconobacter oxydans DSM 17078分离的GMS蛋白是特别有用的GMS蛋白,因为编码 所述GMS蛋白的基因看起来在微生物(特别是细菌,例如乙酸细菌,例 如Gluconobacter,Acetobacter和Gluconacetobacter)中碳源(例如葡萄 糖)向生物质的生物转化中发挥关键作用。因此,本发明涉及编码根据 SEQ ID NO:2的多肽的多核苷酸。该蛋白可由SEQ ID NO:1示出的核 苷酸序列编码。本发明因此还涉及包含根据SEQ ID NO:1的核苷酸序列 的多核苷酸。

上文确定的核苷酸序列和氨基酸序列被用作为“查询序列”,以便用 来自National Center for Biotechnology[NCBI]的BLAST或Blast2程序(版 本2)针对数据库PRO SW-SwissProt(完全发布版本加上增加的更新)进 行搜索。根据这些搜索结果,将根据SEQ ID NO:1的GMS01多核苷酸 标注为编码具有与膜结合的PQQ-依赖性葡糖脱氢酶活性的蛋白。

可使用cDNA、mRNA或基因组DNA作为模板,使用合适的寡核苷 酸引物(例如根据SEQ ID NO:3和SEQ ID NO:4的核苷酸引物),按 照标准PCR扩增技术,通过核酸扩增来获得根据本发明的核酸。由此扩增 出的核酸可被克隆进合适的载体,并通过DNA序列分析对其进行表征。

用于反应的模板可以是通过对从已知包含或怀疑包含根据本发明的多 核苷酸的菌株制备的mRNA进行逆转录获得的cDNA。PCR产物可被亚克 隆和测序,以确保扩增出的序列代表本文所述的新的核酸序列或其功能等 同物的序列。

然后可通过多种已知方法,用PCR片段分离全长cDNA克隆。例 如,可标记扩增出的片段,用其筛选噬菌体或粘粒(cosmid)cDNA文 库。或者,经标记的片段可用于筛选基因组文库。

因此,本发明涉及包含下述核苷酸序列的多核苷酸,所述核苷酸序列 可使用来自微生物的基因组DNA作为模板,并使用根据SEQ ID NO:3 和SEQ ID NO:4的引物组,通过核酸扩增(例如聚合酶链式反应)来获 得。

本发明还涉及下述多核苷酸,其包含编码本文所述的多核苷酸编码的 多肽的片段或衍生物的核苷酸序列,其中,在所述衍生物中,一个或多个 氨基酸残基较之所述多肽被保守取代,并且,所述片段或衍生物具有 GMS多肽(优选地,GMS01多肽)的活性。

本发明还涉及下述多核苷酸,其编码GMS多肽(优选地,GMS01多 肽),其互补链能在严谨条件下与本文定义的多核苷酸互补。

本发明还涉及下述多核苷酸,其与本文定义的多核苷酸至少70%相 同,并且其编码GMS多肽;本发明还涉及是上文定义的多核苷酸的互补 链的多核苷酸。

本发明还涉及可用于扩增或探测根据本发明的DNA以及用于鉴定也 携带此类基因的相关微生物种或科的引物、探针和片段。

本发明还涉及包括本发明多核苷酸的载体和用所述多核苷酸或所述载 体遗传工程改造过的微生物。

本发明还涉及生产能表达上文定义的多核苷酸编码的多肽的微生物和 上文定义的多核苷酸编码的多肽的工艺。

本发明还涉及下述微生物,其中,GMS多肽(优选地,GMS01多 肽)的活性降低或消失,使得从通过从碳源(例如葡萄糖)的生物转化生 产的生物质的产率和/或产量增加。

可转化为生物质的合适碳源可以例如是葡萄糖或选自下述碳源,所述 碳源的同化导致葡萄糖(特别是D-葡萄糖)形成,它们例如是蔗糖、麦芽 糖、淀粉、纤维素、纤维二糖、乳糖、异麦芽糖、葡聚糖、海藻糖或其混 合物。

技术人员将知道如何使GMS蛋白(优选地,GMS01蛋白)的活性降 低或消失。这例如可以通过使GMS蛋白(优选地,GMS01蛋白)的比活 性减少或消失来完成,或者通过对宿主生物进行遗传修饰来完成,所述遗 传修饰以较之野生型生物产生更少或不产生GMS蛋白(优选地,GMS01 蛋白)的拷贝的方式来进行。

在下述说明书中,将对达到此目的(即,通过使GMS01蛋白的活性 降低或消失,增加通过从碳源(例如葡萄糖)的生物转化生产的生物质的 产率和/或产量)的方案进行详细描述。在进行必要修正后,这些方案可应 用于其它GMS蛋白。

为获得产生更少拷贝的或不产生GMS01基因和/或蛋白的生物所进行 的修饰包括:使用弱启动子,或者对GMS01基因(的部分)或其调控元 件加以突变(例如,插入、缺失或点突变)。使GMS01蛋白比活性降低 或消失也可通过本领域已知的方法来完成。此类方法可包括对GMS01基 因(的部分)的突变(例如,插入、缺失或点突变)。

本领域中还已知可以通过将GMS01蛋白与特定抑制剂相接触或与能 与GMS01蛋白发生特异性相互作用的其它物质相接触,来使给定蛋白质 活性降低或消失。为鉴定出此类特定抑制剂,可表达GMS01蛋白,并对 存在怀疑能抑制GMS01蛋白活性的化合物时的活性加以测试。可能的抑 制用化合物可例如是针对GMS01蛋白的单克隆抗体或多克隆抗体。此类 抗体可通过对合适的实验动物进行常规免疫方案来获得。

本发明可以在携带有GMS01基因或其同源体的任何微生物中进行。 合适的微生物可选自酵母、藻类和细菌构成的组,它们可以是野生型菌株 或通过标准的诱变方法和选择方法获得的突变体菌株以及重组菌株。此类 酵母的例子可以是,例如,Candida、Saccharomyces、 Zygosaccharomyces、Schizosaccharomyces或Kluyveromyces。此类藻类的例 子可以是,例如,Chlorella。此类细菌的例子可以是,例如, Gluconobacter、Acetobacter、Gluconacetobacter、Ketogulonicigenium、 Pantoea、Pseudomonas(例如,Pseudomonas putida)和Escherichia(例如 Escherichia coil)。优选的是Gluconobacter或Acetobacter aceti,例如,G. oxydans、G.cerinus、G.frateurii、A.aceti subsp.xylinum或A.aceti subsp. orleanus,优选地,G.oxydans DSM 17078。已按照《布达佩斯条约》,于 2005年1月26日将Gluconobacter oxydans DSM 17078(以前称作 Gluconobacter oxydans N44-1)保藏至Deutsche Sammlung von Mikroorganismen und Zellkulturen(DSMZ),Mascheroder Weg 1B,D-38124 Braunschweig,Germany。

可用于本发明的微生物可被公众从不同来源获得,例如,Deutsche Sammlung von Mikroorganismen und Zellkulturen(DSMZ),Mascheroder Weg 1B,D-38124 Braunschweig,Germany、American Type Culture Collection (ATCC),P.O.Box 1549,Manassas,VA 20108 USA或Culture Collection Division,NITE Biological Resource Center,2-5-8,Kazusakamatari,Kisarazu- shi,Chiba,292-0818,Japan(以前是Institue for Fermentation,Osaka(IFO), 17-85,Juso-honmachi 2-chome,Yodogawa-ku,Osaka 532-8686,Japan)。保 存到IFO的优选的细菌的例子例如是Gluconobacter oxydans(以前被称为 G.melanogenus)IFO3293、Gluconobacter oxydans(以前被称为G. melanogenus)IFO3292、Gluconobacter oxydans(以前被称为G. rubiginosus)IFO3244、Gluconobacter frateurii(以前被称为G.industrius) IFO3260、Gluconobacter cerinus IFO3266、Gluconobacter oxydans IFO3287 和Acetobacter aceti subsp.orleanus IFO3259,上述这些都于1954年4月5 日被保藏;1975年10月22日保藏的Acetobacter aceti subsp.xylinum IFO 13693和1977年12月8日保藏的Acetobacter aceti subsp.xylinum IFO 13773。菌株Acetobacter sp.ATCC 15164也是优选细菌的例子,其被保藏 于ATCC。菌株Gluconobacter oxydans(以前被称为G.melanogenus) N44-1是优选细菌的另一个例子,其是菌株IFO 3293的衍生物,在 Sugisawa et al.,Agric,Biol.Chem.54:1201-1209,1990中对其有所描述。

本发明的微生物可在DNA水平或蛋白质水平上携带其它修饰(见上 文所述),只要此类修饰对从底物(例如葡萄糖)生产生物质的产率、产 量和/或效率具有直接影响即可。此类其它修饰可以例如影响编码上文所述 的氧化还原酶或异构酶的其它基因,特别是,编码NAD(P)-葡糖脱氢酶、 PQQ依赖性葡糖脱氢酶、FAD依赖性葡萄糖酸盐/酯-2-脱氢酶、NAD(P)- 葡萄糖酸盐/酯-2-脱氢酶、葡萄糖酸盐/酯-5-脱氢酶、2-酮基葡萄糖酸盐/酯 脱氢酶、2,5-二酮基葡萄糖酸盐/酯脱氢酶、葡萄糖酸盐/酯氧化酶、磷酸葡 糖异构酶的基因,或编码涉及磷酸戊糖途径的其它酶,例如,6-磷酸葡萄 糖酸盐/酯脱氢酶、6-磷酸葡糖内酯酶、核酮糖-5-磷酸盐/酯3-差向异构 酶、转醛醇酶或转酮醇酶的基因,或者编码将磷酸戊糖途径与其它碳代谢 途径连起来的酶,例如6-磷酸葡萄糖酸盐/酯脱水酶、果糖-1,6-二磷酸盐/ 酯或磷酸果糖激酶的基因。进行此类修饰的方法是本领域已知的,一些例 子在本文中有进一步描述。

根据本发明的另一目的,提供了本文定义的多核苷酸或者已用此类多 核苷酸进行过遗传工程改造的微生物在从碳源高效生产生物质中的用途。

本发明还涉及在微生物中表达内源基因的工艺,涉及在微生物中生产 上文定义的多肽的工艺,以及生产能在给定碳源(例如葡萄糖)上生长的 微生物的工艺。所有这些工艺都可包含改变微生物的步骤,其中,本文中 使用的“改变”包括下述工艺,该工艺以使得生物质的产率和/或生产能力 较之野生型生物有所提高的方式来进行“遗传改变”或“改变细胞培养基 的组成和/或改变用于培养的方法”。本文中使用的“生物质的提高的产 率”表示较之野生型微生物(即,没有被遗传改变的微生物)而言增加至 少5%、10%、25%、30%、40%、50%、75%、100%、200%或者甚至超过 500%,这取决于用于生长的碳源。

术语“遗传工程改造”或“遗传改变”表示对活的生物体中遗传物质 结构的科学改变。这包括生产和使用重组DNA。更特别地,这用于描述 来自天然存在的生物而经遗传工程改造或修饰的生物。遗传工程改造可通 过本领域已知的多种方法来进行,例如,基因替换,基因扩增,基因打 断,使用质粒、病毒或其它载体进行的转化、转染。经遗传修饰的生物, 例如,经遗传修饰的微生物通常还被称作重组生物,例如重组微生物。本 发明的有利的实施方式通过从属权利要求而显而易见。根据本发明的教 导,本领域技术人员将明白本发明的上述和其它方面以及上述和其它实施 方式。

通过对从Gluconobacter oxydans DSM 17078获得的基因组克隆进行测 序,来测定包含编码GMS01蛋白的SEQ ID NO:1的核苷酸序列的基因 的序列。

本发明还涉及编码SEQ ID NO:2所示的GMS01多肽的至少一个生 物活性片段或衍生物的多核苷酸。

本文中使用的“生物活性片段或衍生物”表示保留有与SEQ ID NO: 2所示的多肽基本相同的生物功能或活性的多肽。生物活性的例子可以例 如是酶活、信号传递活性或抗体反应活性。术语“相同的生物功能”或 “功能等同物”在本文中使用时表示蛋白质与SEQ ID NO:2所示的多肽 具有基本相同的生物活性,例如,酶活性、信号传递活性或者抗体反应活 性。

本发明的多肽和多核苷酸优选以经分离的形式提供,优选地,被纯化 至均质。

术语“经分离的”表示:物质被移出其原来的环境(例如,如果其天 然存在的话,就是天然环境)。例如,活的微生物中存在的天然存在的多 核苷酸或多肽不是经分离的,但与天然系统中的一些或全部共存物质分开 的同样的多核苷酸或多肽就是经分离的。此类多核苷酸可以是载体的一部 分和/或此类多核苷酸或多肽可以是组合物的一部分,但仍然是经分离的, 因为此类载体或组合物并非其天然环境的一部分。

本文中使用的经分离的多核苷酸或核酸可以是这样的DNA或RNA, 它们与从中获得该多核苷酸或核酸的生物的天然存在的基因组中紧密相邻 的两条编码序列(5’末端一条,3’末端一条)并非紧密相邻。因此,在一 种实施方式中,核酸包括与编码序列紧密相邻的5’非编码(例如,启动 子)序列的一些或全部。术语“经分离的多核苷酸”因此包括,例如,加 入到载体中、加入到自主复制质粒或病毒中,或者加入到原核生物或真核 生物的基因组DNA中的重组DNA,或者作为独立于其它序列的单独分子 (例如,通过PCR或限制性内切酶处理产生的cDNA或基因组DNA片 段)存在的重组DNA。其还包括是杂合体基因的一部分的重组DNA,所 述基因编码基本不含细胞物质、病毒物质或培养基(当通过重组DNA技 术生产时)或化学前体或其它化学物质(当通过化学方式合成时)的额外 多肽。此外,“经分离的核酸片段”是这样的核酸片段:其天然并不作为 片段存在,并且将不会在天然状态被发现。

本文中使用的术语“多核苷酸”、“基因”和“重组基因”指可与染 色体DNA分离开的、包括编码蛋白质(例如,G.oxydans DSM 17078 GMS蛋白)的开放读码框的核酸分子。多核苷酸可包括,例如,SEQ ID NO:1所示的多核苷酸序列或其片段以及基因序列上游或下游的区域,所 述区域可包括,例如,对于由其获得的多肽的适当表达和稳定来说重要的 启动子区域、调控子区域和终止子区域。

基因可包括编码序列、非编码序列(例如,位于基因编码区域3’末端 和5’末端的非翻译序列)和调控序列。此外,基因指本文定义的经分离的 核酸分子。技术人员还将理解,导致GMS蛋白氨基酸序列的变化的DNA 序列多态性可存在于种群(population)中,例如,Gluconobacter oxydans 种群中。GMS01基因中的此类遗传多态性可由于天然变异存在于种群的 个体间,或者存在于不同种群的细胞中。典型地,此类天然变异可导致 GMS01基因核苷酸序列中1-5%的变化度。作为天然变异结果的、并且不 会改变GMS蛋白的功能活性的GMS01中的任何以及全部此类核苷酸变 异和由此得到的氨基酸多态性也包括在本发明的范围内。

本文中使用的术语“多核苷酸”或“核酸分子”意欲包括DNA分子 (例如,cDNA或基因组DNA)和RNA分子(例如mRNA)以及使用核 苷酸类似物产生的DNA或RNA的类似物。核酸分子可以是单链或双链 的,但优选是双链DNA。可使用寡核苷酸类似物或衍生物(例如,肌苷 或磷硫酰核苷酸)来合成核酸。此类寡核苷酸可用于:例如,制备具有改 变的碱基配对能力或增加的对核酸酶的抗性的核酸。

本文中提供的序列信息不应被狭义理解为需要包括进被错误鉴定的碱 基。本文公开的特定序列可以很容易地用于从能将给定碳源(例如葡萄 糖)转化为生物质的微生物(特别是Gluconobacter oxydans,优选地, Gluconobacter oxydans DSM 17078)中分离出完整基因,随后可容易地对 该基因进行进一步的序列分析,由此鉴定出测序错误。

除非特别指明,本文中通过对DNA分子进行测序来确定的所有核苷 酸序列都是用自动DNA测序仪测定的,并且,本文测定的DNA分子编码 的多肽的所有氨基酸序列都是通过对按照上文所述测定的DNA序列进行 翻译来推测的。因此,如本领域所已知的,对由该自动方法所测定的任何 DNA序列而言,本文所测定的任何核苷酸序列都可能含有一些错误。典型 地,通过自动方法测出的核苷酸序列与被测序的DNA分子的实际核苷酸 序列至少大约90%同源,更典型地,至少大约95%至至少大约99.9%相 同。通过其它方法,包括本领域内公知的人工DNA测序方法,可对实际 序列进行更为精确的测定。也如本领域所已知的,测得的核苷酸序列中较 之实际序列的单个插入或缺失将会导致核苷酸序列翻译中的读码框位移, 使得:从此类插入或缺失的点开始,测得的核苷酸序列编码的预计氨基酸 序列完全不同于被测序的DNA分子实际编码的氨基酸序列。

本领域技术人员能鉴定出此类被错误鉴定的碱基,并且知道如何改正 此类错误。

根据本发明的核酸分子可以仅包含本发明提供的核酸序列(例如, SEQ ID NO:1示出的序列)的一部分或片段,例如,可用作为探针或引 物的片段(例如SEQ ID NO:3或SEQ ID NO:4)或编码根据本发明的蛋 白的一部分的片段。从对GMS 01基因的克隆测定的核苷酸序列允许产生 被设计来鉴定和/或克隆GMS 01家族其它成员以及来自其它物种的GMS 01同源体的探针和引物。典型地,该探针/引物包含基本纯化的寡核苷 酸,其典型地包含与SEQ ID NO:1所示的核苷酸序列或其片段或衍生物 的至少大约12或15个、优选大约18或20个、更优选大约22或25个、 进一步更优选大约30、35、40、45、50、55、60、65或75个或更多个连 续核苷酸杂交(优选地,在高度严谨条件下杂交)的核苷酸序列区域。

还可通过聚合酶链式反应(PCR),使用基于本文含有的序列信息设 计的合成寡核苷酸引物,分离出包含SEQ ID NO:1的核苷酸序列的全部 或一部分的核酸分子。

可按照标准PCR扩增技术,用cDNA、mRNA或者基因组DNA作为 模板,使用合适的寡核苷酸引物,来扩增本发明的核酸。由此扩增的核酸 可被克隆进合适的载体,并通过DNA序列分析加以表征。

根据本发明的多核苷酸的片段还可包含不编码功能多肽的多核苷酸。 此类多核苷酸可作为探针或引物用于PCR反应。

不管其编码功能或非功能多肽,根据本发明的核酸都可用作为杂交探 针或聚合酶链式反应(PCR)引物。不编码具有GMS01活性的多肽的本 发明核酸分子的用途包括:(1)从cDNA文库(例如来自除 Gluconobacter oxydans外的其它生物)分离编码本发明蛋白的基因或其等 位变体,以及(2)用于探测特定细胞中所述蛋白的mRNA的表达的 Northern印迹分析,或(3)用于消除和/或改变同源GMS01基因在所述 其它生物中的功能或活性。

基于本文提供的核苷酸序列的探针可用于检测编码同样或同源蛋白 (例如,其它生物中的)的转录本或基因组序列。可基于其与本文公开的 G.xoydans GMS01核酸的同源性,使用G.oxydans DNA或其一部分作为 杂交探针,按照标准杂交技术,优选在高度严谨杂交条件下,分离出对应 于本发明的G.xoydans GMS01 DNA的天然变体或非G.oxydans同源体的 核酸分子,它们也包括在本发明内。

在优选的实施方式中,探针还包含与其附着的标记基团,例如,标记 基团可以是放射性同位素、荧光化合物、酶或酶的辅助因子。

例如,可使用基于本文教导的核苷酸序列设计的两套简并寡核苷酸引 物库,进行PCR来分离同源基因序列。

用于反应的模板可以是通过对从已知能表达或怀疑能表达根据本发明 的多核苷酸的菌株制备的mRNA进行逆转录获得的cDNA。PCR产物可被 亚克隆及测序,以确保扩增出的序列代表本文所述的新的核酸序列或其功 能等同物的序列。

然后可通过多种已知方法,用PCR片段分离全长cDNA克隆。例 如,可标记扩增出的片段,用其筛选噬菌体或粘粒cDNA文库。或者,经 标记的片段可用于筛选基因组文库。

PCR技术还可用于从其它生物分离全长cDNA。例如,可按照标准方 案,从合适的细胞或组织来源分离RNA。可在RNA上进行逆转录反应, 其中使用与扩增片段的5’最末端具有特异性的寡核苷酸引物,以引导第一 链合成。

然后可使用标准的末端转移酶反应,对得到的RNA/DNA杂交体“加 尾”(例如,用鸟嘌呤),可用RNaseH消化杂交体,然后可(例如,用 poly-C引物)引导第二链合成。由此,可容易地分离扩增的片段上游的 cDNA序列。关于有用的克隆策略的综述,参见,例如上文所述的 Sambrook et al.和上文所述的Ausubel et al.。

此外,编码GMS01家族其它成员、具有与根据SEQ ID NO:1的核 苷酸序列不同的核苷酸序列的核酸也在本发明的范围内。此外,编码来自 其它物种的GMS01蛋白、具有与SEQ ID NO:1示出的核苷酸序列不同 的核苷酸序列的核酸也在本发明的范围内。

本发明还涉及经分离的多核苷酸,其可在严谨条件下(优选地,高度 严谨条件下)与本发明的多核苷酸(例如,SEQ ID NO:1所示的多核苷 酸)杂交。有利地,此类多核苷酸可从能将给定的碳源(例如葡萄糖)转 化为生物质的微生物(特别是Gluconobacter oxydans,优选地, Gluconobacter oxydans DSM 17078)中获得。

本文中用到的术语“杂交”被用来描述杂交和洗涤,在所述杂交和洗 涤条件下,典型地,互相之间同源性为至少约50%、至少约60%、至少约 70%、更优选为至少约80%、进一步优选为至少约85%到90%、最优选为 至少95%的核苷酸序列保持相互杂交的状态。

在一种实施方式中,本发明的核酸与SEQ ID NO:1所示的核酸序列 或其互补序列至少40%、45%、50%、55%、60%、65%、70%、75%、 80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%同源或更同源。

此类杂交条件的一个优选的非限制的例子是在6x氯化钠/柠檬酸钠 (SSC)中,大约45℃下杂交,随后在1x SSC、0.1%SDS中,50℃下进 行一次或多次洗涤,洗涤优选在55℃下,更优选在60℃下,进一步优选 在65℃下进行。

高度严谨条件包括,例如,在溶液中,例如含或不含100μg/ml的鲑 鱼精DNA的DigEasyHyb溶液(Roche Diagnostics GmbH)中,或包含 50%甲酰胺、5x SSC(150mM NaCl、15mM柠檬酸三钠)、0.02%十二 烷基磺酸钠、0.1%N-月桂酰肌氨酸和2%封闭试剂(Roche Diagnostics GmbH)的溶液中,使用地高辛(DIG)标记的DNA探针(例如通过用 Roche Diagnostics GmbH,68298 Mannheim,Germany的DIG标记系统来制 备的)在42℃温育2小时至4天,接着在2x SSC和0.1%SDS中,于室 温下,洗两次膜,每次5至15分钟,然后在65-68℃,于0.5x SSC和 0.1%SDS或0.1x SSC和0.1%SDS中洗两次,每次15-30分钟。

优选地,与本发明的核苷酸序列杂交(优选在高度严谨条件下杂交) 的本发明的经分离的核酸对应于天然存在的核酸分子。本文中使用的“天 然存在的”核酸分子指具有天然存在的核苷酸序列的RNA或DNA分子 (例如,编码天然蛋白质)。在一种实施方式中,核酸编码天然的G. oxydans GMS01蛋白。

技术人员知道何种条件适合用于严谨杂交条件及高度严谨杂交条件。 本领域中易于获得关于此类条件的其它指导,例如,在Sambrook et al., 1989,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Press, N.Y.;和Ausubel et al.(eds.),1995,Current Protocols in Molecular Biology, (John Wiley & Sons,N.Y.)中。当然,仅与poly(A)序列(例如mRNA的3’ 末端poly(A)区)或仅与T(或U)残基的互补性延伸区段(stretch)杂交 的多核苷酸将不会被包括在用于与本发明核酸的一部分特异性杂交的本发 明多核苷酸中,因为此类多核苷酸将与任何含有poly(A)延伸区段的核酸 分子或其互补序列(例如,实际上是任何双链的cDNA克隆)杂交。

采用典型手段,可以对从其它生物,例如能将给定碳源(例如葡萄 糖)转化为生物质的微生物(特别是其它Gluconobacter物种)构建的基因 组DNA或cDNA文库进行筛选。

例如,可以通过Northern印迹分析来对Gluconobacter的菌株进行筛 选获得同源多核苷酸。在探测到与本发明多核苷酸同源的转录本之后,可 以利用本领域技术人员公知的标准技术,由分离自合适菌株的RNA来构 建cDNA文库。或者,可以使用能与本发明多核苷酸杂交的探针来对全基 因组DNA文库进行筛选。

可使用标准的分子生物学技术以及本文提供的序列信息,来分离本发 明的核酸序列,例如SEQ ID NO:1所示的核酸分子或其片段或衍生物。 例如,可使用标准杂交和克隆技术(例如,Sambrook,J.,Fritsh,E.F.,和 Maniatis,T.Molecular Cloning:A Laboratory Manual.2nd,ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor, NY,1989所述),使用SEQ ID NO:1所示的核酸分子的全部或一部分作 为杂交探针,分离根据本发明的核酸分子。

此外,可通过标准合成技术(例如,使用自动DNA合成仪)来制备 对应于本发明的核苷酸序列的寡核苷酸或可与本发明的核苷酸序列杂交的 寡核苷酸。

术语“同源性”或“相同性百分比”在本文中可互换使用。就本发明 的目的而言,在此定义:为确定两条氨基酸序列或两条核酸序列的相同性 百分比,本着最优比较的目的(例如,可以在第一条氨基酸序列或核苷酸 序列上引入缺口,以与第二条氨基酸序列或核苷酸序列达到最佳的比 对),对序列进行比对。然后对相应氨基酸位置或核苷酸位置上的氨基酸 残基或核苷酸进行比较。如果第一条序列上某位置的氨基酸残基或核苷酸 与第二条序列上相应位置的相同,那么这些分子在此位置就是相同的。两 条序列间的相同性百分比是所述序列共有的相同位置的数量的函数(即, %相同性=相同位置的数量/位置(即重叠位置)总数x100)。优选地, 这两条序列长度相同。

技术人员会知道有若干计算机程序可被用于确定两条序列间的同源 性。例如,可以使用数学算法来完成对序列的比对和对两条序列间相同性 百分比的确定。在一种优选的实施方式中,使用Needleman和Wunsch(J. Mol.Biol.(48):444-453(1970))算法来确定两条氨基酸序列间的相同性百 分比,所述算法已被合并到GCG软件包(可从http://www.accelrys.com获 得)的GAP程序中,其中使用Blossom 62矩阵或PAM250矩阵,缺口权 重为16、14、12、10、8、6或4,长度权重为1、2、3、4、5或6。技术 人员会意识到:上述的所有不同参数将导致有细微区别的结果,但是使用 不同算法时两条序列的总体%相同性不会有显著改变。

在又一种实施方式中,使用GCG软件包(可从 http://www.accelrys.com获得)的GAP程序来确定两条核苷酸序列间的相 同性百分比,其中使用NWSgapdna.CMP矩阵,缺口权重为40、50、60、 70或80,长度权重为1、2、3、4、5或6。在另一种实施方式中,使用E. Meyers和W.Miller(CABIOS,4:11-17(1989))的算法来确定两条氨基酸 序列或核苷酸序列的相同性百分比,所述算法已被合并到ALIGN程序 (2.0版)(可从http://vega.igh.cnrs.fr/bin/align-guess.cgi获得)中,其中 使用PAM120权重残基表,缺口长度惩罚(penalty)为12,缺口惩罚为 4。

本发明的核酸和蛋白质序列可以进一步地被用作“查询序列”来进行 针对公众数据库的搜索,例如,去鉴定相关序列或家族中其它成员。可以 使用Altschul,et al.(1990)J.Mol.Biol.215:403-10的BLASTN和BLASTX 程序(2.0版)来进行此类搜索。可以用BLASTN程序,以分数=100,字 长(word length)=12来进行BLAST核苷酸搜索,以获得与本发明的核 酸分子同源的核苷酸序列。可以用BLASTX程序,以分数=50,字长=3 来进行BLAST蛋白质搜索,以获得与本发明的蛋白质分子同源的氨基酸 序列。本着比较的目的,为获得有缺口的比对,可以利用Altschul et al., (1997)Nucleic Acids Res.25(17):3389-3402中描述的Gapped BLAST。当利 用BLAST和Gapped BLAST程序时,可以使用各个程序(例如BLASTX 和BLASTN)的缺省参数。见http://www.ncbi.nlm.nih.gov

在另一种优选的实施方式中,本发明的经分离的核酸分子包含是本发 明的核苷酸序列(例如,SEQ ID NO:1所示的序列)的互补序列的核酸 分子。与本文公开的核苷酸序列互补的核酸分子是这样的序列:其与SEQ ID NO:1所示的核苷酸序列足够互补,从而其可与所述核苷酸序列杂 交,由此形成稳定的双链体(duplex)。

在另一种优选的实施方式中,SEQ ID NO:1所示的本发明的核酸或 其互补序列含有至少一处突变,所述突变导致基因产物具有经修饰的功能/ 活性。所述至少一处突变可通过本文所述的方法引入。在一个方面,所述 至少一处突变导致产生这样的GMS01蛋白:其功能和/或活性较之野生型 副本而言被部分或全部破坏。用于引入此类突变的方法是本领域公知的。

本文中使用的术语——活性的“降低”包括:减少生产生物中一种或 多种多肽的活性,所述多肽是本文所述的相应的多核苷酸编码的。本领域 中可获得用于降低给定蛋白(在本文的情况下是GMS01蛋白)活性的多 种方法。通常,可减少蛋白质的比活性或者可以减少蛋白质的拷贝数。

为协助这种减少,对应于本文所述多核苷酸的基因的拷贝数可被减 少,例如,通过基因的欠表达(underexpressed)或者对基因的打断来实 现。如果基因的转录水平较之野生型基因降低,所述基因就被说成是“欠 表达”。这可以通过例如Northern印迹杂交分析来测量,Northern印迹杂 交分析对作为基因表达指示的mRNA的量进行定量。在本文中,如果产生 的mRNA的量较之野生型基因产生的mRNA的量减少了至少1%、2%、 5%、10%、25%、50%、75%、100%、200%或者甚至超过500%,那么该 基因就是欠表达的。或者,可使用弱启动子来指导多核苷酸的表达。在另 一种实施方式中,基因上游的启动子、调控区域和/或核糖体结合位点可被 改变,以获得对表达的负调。还可以通过减少信使RNA的相对半寿期来 降低表达。在另一种实施方式中,还可以通过在多肽氨基酸序列中利用能 减少活性的一处或多处突变来减少多肽自身的活性。例如,改变多肽与其 相应底物的亲和性可导致活性降低。类似地,可减少肽的相对半寿期。在 基因表达降低或者活性降低的情况下,可通过改变细胞培养基的组成和/或 用于培养的方法来达成这种降低。本文中使用的“降低的表达”或“降低 的活性”表示较之野生型蛋白、多核苷酸、基因、或多核苷酸或多肽被降 低之前存在的蛋白的活性和/或浓度而言,至少5%、10%、25%、50%、 75%、100%、200%或者甚至超过500%的减少。还可通过将蛋白与其活性 的特异性或一般性抑制剂相接触来降低GMS01蛋白的活性。术语“降低 的活性”、“减少的或消失的活性”在本文中可互换使用。

本发明的另一方面涉及载体,所述载体含有编码本发明蛋白质的核酸 或其功能等同物或一部分。在本文中使用的术语“载体”指能运送连接到 其上的另一个核酸分子的核酸分子。一种载体类型是“质粒”,“质粒” 指环状的双链DNA环,另外的DNA片断可以连接到所述的环上。另一种 载体的类型是病毒载体,其中,另外的DNA片断可以连接到病毒基因组 中。某些载体能在其被引入的宿主细胞中进行自主复制(例如,具有细菌 的复制起点的细菌载体)。其它载体在被引入宿主细胞之后就被整合进宿 主细胞的基因组中,因此它们与宿主基因组一同复制。

此外,某些载体能指导将与其可操作地连接的基因的表达。此类载体 在本文中被称为“表达载体”。通常,用于重组DNA技术的表达载体通 常是质粒的形式。术语“质粒”和“载体”在本文中可互换使用,因为质 粒是最常用的载体形式。但是,本发明意欲包括表达载体的此类其它形 式,例如病毒载体(例如,复制缺陷型逆转录病毒、腺病毒和腺相关病 毒),它们提供等同的功能。

本发明的重组表达载体包含本发明的核酸,所述核酸存在的形式适合 于该核酸在宿主细胞中的表达,这意味着该重组表达载体包括一段或多段 调控序列,所述调控序列是基于将用于表达的宿主细胞来选择的,其被可 操作地连接到将要表达的核酸序列上。在重组表达载体中,“可操作地连 接”被用来表示:人们感兴趣的核苷酸序列被连接到调控序列上,所述的 连接以允许该核苷酸序列表达(例如,在体外转录/翻译系统中表达,或者 当载体被引入宿主细胞中时,在该宿主细胞中的表达)的方式进行。术语 “调控序列”将包括启动子、增强子和其它表达控制元件(例如,弱化 子)。例如,在Goeddel;Gene Expression Technology:Methods in Enzymology 185,Academic Press,San Diego,CA(1990)中对此类调控序列进 行了描述。调控序列包括在很多种宿主细胞中指导核苷酸序列的组成型或 诱导型表达的调控序列,也包括仅在某些宿主细胞中指导核苷酸序列表达 的调控序列(例如,组织特异性调控序列)。本领域的技术人员将意识 到,对表达载体的设计可能取决于以下因素:例如:对将被转化的宿主细 胞的选择,期望获得的蛋白质的表达水平等。本发明的表达载体可以被引 入宿主细胞,由此生产本文所述的核酸编码的蛋白质或肽,其包括但不限 于:本文所述的核酸编码的突变体蛋白、其片段、其变体或功能等同物以 及融合蛋白,例如,GMS01蛋白、GMS01蛋白的突变体形式、融合蛋白 等。

为了在合适的微生物中表达GMS01蛋白,可对本发明的重组表达载 体加以设计。例如,根据本发明的蛋白可在细菌细胞中表达,例如,在属 于Gluconobacter、Gluconacetobacter或Acetobacter属的菌株中表达。在本 发明中有用的表达载体包括源自染色体、游离体和病毒的载体,例如源自 细菌质粒、噬菌体的载体和源自上述物质的组合的载体,例如源自质粒和 噬菌体遗传元件的载体,例如粘粒和噬菌粒(phagemid)。

DNA插入应当被可操作地连接到合适的启动子上,启动子可以是组成 型启动子或可诱导的启动子。技术人员知道如何选择合适的启动子。表达 构建体可以含有用于转录起始、终止的位点,还可在转录区域含有核糖体 结合位点,以用于翻译。由构建体表达的成熟转录本的编码部分可优选包 括处于起点的起始密码子,以及恰当地定位于待翻译的多肽末尾的终止密 码子。

可通过传统的转化或转染技术将载体DNA引入合适的宿主细胞。本 文中使用的术语“转化”、“转桥联(transconjugation)”和“转染”意 指本领域内已知的、用于将外源核酸(例如DNA)引入到宿主细胞中的 多种技术,包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、转 导、感染、脂质转染、阳离子脂介导的转染或电穿孔。用于对宿主细胞进 行转化和转染的合适方法可在Sambrook,et al.(上文所述的),Davis et al., Basic Methods in Molecular Biology(1986)及其它实验手册中找到。

为对已将外源DNA整合进它们基因组的细胞进行鉴定和选择,通 常,将编码选择标记(例如,对抗生素的抗性)的基因与感兴趣的基因一 起引入宿主细胞。优选的选择标记包括赋予对药物(例如卡纳霉素、四环 素、氨苄青霉素和链霉素)抗性的那些。编码选择标记的核酸优选在与编 码根据本发明的蛋白的载体相同的载体上引入宿主细胞,或者其可在单独 的载体上引入,该载体例如是自杀性载体,其不能在宿主细胞中复制。可 通过药物选择鉴定出经过引入的核酸稳定转染的细胞(例如,已合并有选 择标记基因的细胞将存活,而其它细胞会死亡)。

本发明还提供了经分离的多肽,其具有SEQ ID NO:2所示的氨基酸 序列或可通过在合适的宿主中表达本发明的多核苷酸(例如,SEQ ID NO:1所示的多核苷酸序列)获得的氨基酸序列。

根据本发明的多肽可仅含对SEQ ID NO:2所示的氨基酸序列中一个 或多个氨基酸的保守取代,或对非关键氨基酸的取代、插入或缺失。因 此,非关键氨基酸是SEQ ID NO:2所示的氨基酸序列中可被改变、且不 会对生物功能造成实质性影响的残基。例如,在本发明的蛋白质之间保守 的氨基酸残基被预计为对改变特别不敏感。此外,在根据本发明的蛋白质 和其它GMS01蛋白之间保守的氨基酸也可能对改变不太敏感。

术语“保守取代”用于表示下述取代,其中,氨基酸残基被具有相似 侧链的氨基酸残基所取代。这些家族是本领域已知的,其包括具有碱性侧 链(例如,赖氨酸、精氨酸和组氨酸)、酸性侧链(例如,天冬氨酸和谷 氨酸)、不带电荷的极性侧链(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝 氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(例如,丙氨酸、缬氨 酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、带 beta支链侧链(例如,苏氨酸、缬氨酸、异亮氨酸)和芳香族侧链(例 如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。

如上所述,本发明的多核苷酸可用于对合适的宿主细胞进行遗传工程 改造,使其在碳源(例如葡萄糖)向生物质的生物转化中更好且更有效, 即,降低生物转化过程期间的碳源转移。

根据本发明,提供了经遗传工程改造/重组产生的宿主细胞(也被称为 重组细胞或经转化细胞),其携带有此类经修饰的多核苷酸,其中,相连 的蛋白的功能较之野生型细胞而言被显著修饰,使得从碳源(例如葡萄 糖)对生物质的生产的产率和/或生产能力被提高。宿主细胞可选自能将给 定的碳源(例如葡萄糖)转化为生物质的微生物,特别是Gluconobacter oxydans,优选地,G.oxydans DSM 17078。

“经转化细胞”或“重组细胞”是已通过重组DNA技术向其(或其 祖先细胞)中引入了根据本发明的核酸的细胞,或者是其中GMS01蛋白 的活性已被降低和/或消失的细胞。合适的宿主细胞包括能将给定碳源(例 如葡萄糖)转化为生物质的微生物的细胞。特别地,其包括来自 Pseudomonas、Pantoea、Escherichia、Corynebacterium、 Ketogulonicigenium属的菌株,以及乙酸细菌,例如Gluconobacter、 Acetobacter或Gluconacetobacter,优选地,Acetobacter sp.、Acetobacter aceti、Gluconobacter frateurii、Gluconobacter cerinus、Gluconobacter thailandicus、Gluconobacter oxydans,更优选地,G.oxydans,最优选地, G.oxydans DSM 17078。

为提高某重组宿主细胞对生物质的生产,即,降低生物转化过程期间 碳底物的转移,可在该生物中抑制GMS01基因的表达,这例如通过靶向 与GMS01核苷酸序列的调控区域(例如,GMS01启动子和/或增强子) 互补的核苷酸序列,以形成三螺旋结构,阻止靶细胞中GMS01基因的转 录来实现。一般而言,见Helene,C.(1991)Anticancer DrugDes.6(6):569- 84;Helene,C.et al.(1992)Ann.N.Y Acad Sci.660:27-36和Maher,L.J. (1992)Bioassays 14(12):807-15。

还可通过对GMS 01基因加以修饰来抑制或阻止基因表达,例如,通 过向GMS01基因中引入一处或多处突变来实现,其中所述突变导致产生 较之野生型蛋白而言功能显著降低的GMS01蛋白。

因此,在另一种实施方式中,从SEQ ID NO:1所示的多核苷酸或其 等同物获得携带至少一处突变的多核苷酸。

本文中使用的突变可以是导致功能更弱或更不稳定的多肽(例如,功 能更弱或更不稳定的GMS01基因产物)的任何突变。这可包括,例如, 在微生物基因组中的下述改变:其干扰了GMS01的合成,或者导致GMS 01蛋白以改变的氨基酸序列表达,该改变使得该蛋白的功能较之具有未被 改变的氨基酸序列的野生型副本而言被完全或部分破坏。干扰可在转录水 平、翻译水平或翻译后水平上发生。

微生物基因组中的改变可例如通过单交叉重组或双交叉重组用含有改 变的DNA序列替换野生型DNA序列来进行。为了能方便地选择出基因组 被改变的微生物转化子,该改变可以例如是编码抗生素抗性基因的DNA 序列,或者编码补足微生物可能的营养缺陷型的基因的DNA序列。突变 可包括但不限于:缺失-插入突变。

还可通过下述方法获得微生物基因组中导致功能更弱或没有功能的多 肽的改变:使用例如化学诱变剂、辐射或转座子对微生物基因组进行随机 诱变,以及选择或筛选出是生物质的更好的或更有效的生产菌株的突变 体。用于筛选和选择的标准方法是技术人员已知的。

在一种特定实施方式中,需要敲除本发明的GMS01基因,即,其 中,当引入合适的宿主细胞时,其基因表达被人工遏制,以提高对生物质 产的产率和/或效率。用于提供敲除的方法以及提供携带此类被遏制基因的 微生物的方法是本领域公知的。可通过缺失掉基因或其调控区域的至少一 部分,来诱导对内源GMS01基因的遏制。本文中使用的“对基因表达的 遏制”包括完全遏制和部分遏制,以及在特定条件下的遏制,还包括对两 个等位基因中任何一个的表达的遏制。

为制造其中GMS01基因的表达被人工遏制的敲除微生物,首先可克 隆GMS01基因,然后可使用该基因来构建用于同源重组的载体,以在靶 标微生物中失活内源GMS01基因。用于同源重组的载体含有设计来使靶 标微生物中内源GMS01基因失活的核酸序列。此核酸序列可以是:例 如,含有至少部分缺失突变的GMS01基因或其调控区域(例如,将被失 活的基因侧翼存在的区域(顺式情况下)或单独存在的(反式情况下)) 的核酸序列,或者其可以是含有其它基因的GMS01基因或其调控区域。 优选地,选择还可用作为标记发挥作用的基因作为将被插入进GMS01基 因或其调控区域的基因。将使用的插入基因包括,例如,前文定义的药物 抗性基因。对于基因可插入到GMS01基因中的位置没有特别限制,只要 在该位置的插入能导致对靶标中内源GMS01基因表达的遏制即可。为避 免插入的极性作用,可通过使用例如sacB系统,或通过长侧翼同源性 PCR来引入同框沉默缺失。这些技术是本领域技术人员公知的。

用于GMS01蛋白的上述诱变策略可导致生物质的产率和/或产量增 加。这些策略的列出并不意味着限制;对这些诱变策略的变化对于本领域 普通技术人员来说将是显而易见的。可通过这些机制,用本发明的核酸和 蛋白质分子产生出微生物,例如表达经突变GMS01核酸和蛋白分子的 Gluconobacter oxydans或细菌的相关菌株,使得对从碳源(例如葡萄糖) 对生物质的生产的产率、效率和/或生产能力被提高。

可使用本领域技术人员已知的多种方法来测量生物质浓度,例如,测 量例如600nm的波长下各细胞悬浮液的光密度(OD600),或者测量干或 湿细胞物质浓度,或者通过对各细胞悬浮液的细胞数量进行计数来实现。 此类测量方法是本领域已知的。因此,可例如在孔径为例如0.45μm的经 干燥配衡(tared)的硝酸纤维素滤膜(在其上过滤培养液)上测量细胞干 重(CDW)[g/l]。用水洗滤膜之后,再次测定经干燥滤膜的重量,按照下 式计算CDW:

CDW=m(培养液过滤之后,经干燥的滤膜)-m(在培养液过滤之 前经干燥的滤膜)

在本发明的一个方面,提供了能进行此类提高的生物转化的微生物 (特别是Gluconobacter、Gluconacetobacter和Acetobacter属的)。当通过 本文所述的方法进行测量时,发现这些生物具有提高的从碳源(例如,葡 萄糖)生产生物质的能力。这可以通过增加GMS多肽(优选地,GMS01 多肽)的活性来获得。当在24小时的培养时间后根据该方法进行测量 时,从碳源(例如葡萄糖)生产的生物质的产率可以是大约0.1g或更多 干生物质/g碳源,优选地,大约0.2g或更多干生物质/g碳源,或者甚至 大约0.3g或更多干生物质/g碳源,例如,大约0.4g、0.5g、0.6g、0.7g 或0.8g或1.0g或更多干生物质/g碳源。优选地,碳源是葡萄糖。

携带有例如经修饰的GMS01基因并且能以显著更高的产率、生产能 力和/或效率从碳源(例如葡萄糖)生产生物质的重组微生物可在需氧条件 下被培养于补充有合适营养物的水性培养基中。培养可以以,例如,分 批、补料分批、半连续或连续模式来进行。培养时间可以例如随所用的宿 主、pH、温度和营养培养基而变化,以分批或补料分批模式进行时,其优 选为大约1天至大约10天之间。培养可进行于大约4.0至大约9.0的pH 下,优选地,大约5.0至大约8.0。用于进行培养的优选的温度范围为大约 13℃至大约36℃,优选地,大约18℃至大约33℃。通常,除了用作为 主要碳源的例如D-葡萄糖之外,培养基可以含有其它可被吸收的碳源,例 如,甘油、D-甘露醇、D-山梨糖醇、L-山梨糖、赤藻糖醇、核糖醇、木糖 醇、阿糖醇、肌醇、半乳糖醇、D-核糖、D-果糖、蔗糖和乙醇,优选地, D-山梨糖醇、D-甘露醇、D-果糖、甘油和乙醇;以及含有可消化的氮源, 例如,有机物质,例如,蛋白胨、酵母提取物和氨基酸。多种无机物质也 可被用作为氮源,例如,硝酸盐和铵盐。此外,生长培养基通常含有无机 盐,例如,硫酸镁、硫酸锰、磷酸钾和碳酸钙。

本文所述的核酸分子、多肽、载体、引物和重组微生物可用于下述方 法中的一种或多种:鉴定Gluconobacter oxydans以及相关的生物;绘制与 Gluconobacter oxydans相关的生物的基因组图谱;对感兴趣的 Gluconobacter oxydans序列进行鉴定和定位;进化研究;测定功能所需的 GMS01蛋白区域;调节GMS01蛋白活性或功能;调节GMS途径的活 性;以及调节从碳源(例如葡萄糖)对生物质的细胞内生产。

本发明提供了筛选能调节GMS01蛋白活性的分子的方法,这种调节 或者通过与蛋白本身或底物或GMS01蛋白的结合伴侣的相互作用或者通 过调节本发明的GMS01核酸分子的转录或翻译来实现。在此类方法中, 将表达一种或多种本发明的GMS01蛋白的微生物与一种或多种测试化合 物接触,并评估每种测试化合物对于GMS01蛋白表达水平或活性的影 响。

可通过技术人员公知的方法来测定GMS蛋白的生物活性、酶活性或 其它活性,所述方法例如:在存在其底物、电子受体或供体(包括吩嗪硫 酸甲酯(PMS)、二氯苯酚-吲哚苯酚(DCIP)、NAD、NADH、NADP、 NADPH,可通过光度、色度或荧光方法对其消耗进行直接或间接测量) 以及其它可能与活性的发展相关的无机组分的情况下,温育含有GMS蛋 白的膜级分(membrane fraction)。因此,例如,可在下述试验中测量与 膜结合的D-葡糖脱氢酶的活性,所述试验中,在存在pH6的磷酸盐缓冲 液、D-葡萄糖和人工电子受体DCIP和PMS的情况下,温育含有该酶的膜 级分。可在600nm处测量DCIP的消耗速率,其与膜级分中存在的D-葡 糖脱氢酶活性直接成正比。

因此,本发明涉及本文所述的多核苷酸、多肽、载体、引物和重组微 生物在生产生物质(即,碳源(例如葡萄糖)向生物质的生物转化)中的 用途。在一种优选的实施方式中,本文所述的经修饰的多核苷酸、多肽、 载体和重组微生物用于提高对所述生物质生产的产率、生产能力和/或效 率。

术语“产量”或“生产能力”是本领域已知的,其包括在给定的时间 和给定的培养体积中从给定量或浓度的碳源(例如葡萄糖)形成的生物质 浓度(例如,每升每小时的kg产物)。术语“生产效率”包括:获得的 特定水平的生产所需要的时间(例如,细胞达到产物的特定速率输出所需 时间有多长)。术语“产率”是本领域已知的,其包括碳源向生物质转化 的效率。这通常写作,例如,kg生物质/kg碳源。“增加生物质的产率和/ 或产量”表示,给定的时间中给定量的培养物中生物质的增加。通过测量 培养基中生物质浓度的增加和碳源浓度的减少,可以计算出基于所消耗的 碳源的生物质产率;即通过生物转化给定重量的碳源(例如葡萄糖)获得 的生物质重量,其被定义为对消耗的每kg碳源而言的kg生物质。为了确 定碳源的消耗量,可以用本领域已知的方法(例如HPLC)测定生长培养 基中剩余碳源的重量。可以用本领域已知的方法(例如在600nm处的光 密度或测量样品干重)测定生物质的增加。

术语“生物合成”或“生物合成途径”是本领域已知的,其包括:通 过细胞,以可能是多步骤且被高度调控的过程,从中间产物化合物对化合 物/产物(优选地,有机化合物)的合成。术语“生物转化”是本领域已知 的,其包括:通过涉及到一种或多种酶和/或转运蛋白的一个或多个生物合 成步骤获得的碳源(例如葡萄糖)向产物(即生物质)的转化。措辞“代 谢”是本领域已知的,其包括对生物中发生的生化反应的总称。然后,特 定化合物的代谢(例如,氨基酸(例如甘氨酸)的代谢)包含细胞中与该 化合物相关的总的生物合成、修饰和降解途径。措辞“转运”或“运入” 是本领域已知的,其包括一种或多种分子在协助下移动经过该分子本来不 能经过或不能高效经过的细胞膜。

在一种优选的实施方式中,本发明涉及从碳源(例如葡萄糖)生产生 物质的方法,其中,将上文所述的经修饰多核苷酸序列引入合适的微生 物,在允许以高生产能力、产率和/或效率生产生物质的条件下培养重组微 生物。

根据本发明的携带有例如经修饰的GMS基因(特别是经修饰的GMS 01基因)并且能以显著更高的产率/生产能力和/或效率从碳源(例如葡萄 糖)生产生物质的重组微生物可有利地用于多种应用。一种特别合适的应 用是用于生产维生素C和/或其中间产物例如2-酮基-L-古洛糖酸(2- KGA)的方法。

因此,本发明的一个方面是提供生产维生素C和/或2-KGA的方法, 其中,将根据本发明的核苷酸或上文所述的经修饰多核苷酸序列引入上文 所述的合适的微生物(其中,合适的碳源,例如葡萄糖被高效转化为生物 质),在允许以高生产能力、产率和/或效率生产维生素C和/或2-KGA的 条件下培养重组微生物,从培养基中分离产生的发酵产物,以及可选地, 进一步纯化。

用于生产(1)生物质和(2)维生素C和/或2-KGA的碳源可以是相 同的或可以不同。在一种优选的实施方式中,用于生产生物质的碳源不同 于用于直接生产维生素C和/或2-KGA的碳源。这两种不同碳源可同时或 顺序使用,其中,第一种碳源将用于生产生物质,然后可用该生物质将第 二种碳源转化为维生素C和/或2-KGA。

可直接转化为维生素C和/或2-KGA的合适碳源是可选自D-葡萄糖或 D-山梨糖醇代谢途径,例如,D-葡萄糖、D-山梨糖醇、L-山梨糖、L-山梨 糖酮、D-葡萄糖酸盐/酯、2-酮基-D-葡萄糖酸盐/酯,或2,5-二酮基-葡萄糖 酸盐/酯或其混合物。优选地,底物选自,例如,D-葡萄糖、D-山梨糖醇、 L-山梨糖、L-山梨糖酮或其混合物,更优选地,选自D-葡萄糖、D-山梨糖 醇、L-山梨糖或其混合物,以及最优选地,选自D-山梨糖醇、L-山梨糖或 其混合物。

本文中使用的维生素C可以是水溶液中发现的L-抗坏血酸的任何化学 形式,例如未离解的、以其游离酸形式存在的或离解为阴离子的。L-抗坏 血酸的溶解的盐形式的特征为:在通常发现于发酵上清液中的任何种类的 阳离子(例如,钾、钠、铵或钙)存在时的阴离子。还包括在内的可以有 L-抗坏血酸的游离酸形式的经过分离的晶体。另一方面,用其相应的盐的 名称来命名L-抗坏血酸的盐形式的经过分离的晶体,即抗坏血酸钠、抗坏 血酸钾、抗坏血酸钙等。

在使用微生物进行上述工艺的方面,将合适的碳源转化为维生素C和/ 或2-KGA表示,通过微生物进行对碳源的转化,得到维生素C和/或2- KGA,即,碳源可被直接转化为维生素C和/或2-KGA。在允许从所述碳 源进行此类转化的条件下培养所述微生物,这是技术人员已知的。

本文中用于使用微生物进行的上述工艺的培养基可以是用来生产维生 素C和/或2-KGA的任何合适培养基。典型地,培养基是包含例如盐、底 物并具有一定pH的水性培养基。

术语“直接转化”等意指微生物能通过一个或多个生物转化步骤将某 碳源转化为特定的产物,而无需任何额外的化学转化步骤。例如,术语 “将D-山梨糖醇直接转化为维生素C”意在描述下述过程,其中,微生物 生产维生素C,并且,其中,D-山梨糖醇作为碳源提供,而无需中间产物 化学转化步骤。能直接发酵维生素C的单种微生物是优选的。

将通过下述实施例进一步阐述本发明,所述实施例不应被理解为起限 制作用。本文提到的所有参考文献、专利申请、专利和公开的专利申请的 内容都通过引用并入本文。

实施例

实施例1  用于生物质和葡萄糖测定的分析方法

为测定生物质产量,在含有25g/l甘露糖醇、5.0g/l酵母提取物 (Difco)、3.0g/l细菌蛋白胨(Difco)和15g/l琼脂的MB琼脂上于27℃ 对G.oxydans的细胞进行3天的培养。将细胞重新悬浮于10%甘油(每平 板10ml)中,分装为1ml的小份试样,贮存于-80℃。

用1ml小份试样接种带挡板500ml摇瓶,瓶中有100ml No.5培养 基,其含有50g/l D-葡萄糖、0.5g/l甘油、15g/l酵母提取物(Difco)、 2.5g MgSO4·7H2O、0.3g/l KH2PO4、15g/l CaCO3和1滴消泡剂,在 30℃和180rpm下于摇床上培养48小时。使用Spectronic 4001/N分光光 度计来测定600nm处的光密度(OD600),然后用该培养基接种同样的 No.5培养基的摇瓶,使得第二瓶中的起始OD600为0.25。然后在30℃和 180rpm下对第二瓶进行另外80小时的培养,每12小时取3ml样品来分 析生物质和葡萄糖浓度,分析按照下文所述进行:

通过测量样品干重来测定生物质产量。将反应管在40℃于真空下预 先干燥48小时,测量空管重量[w1]。加入样品,测定总的管重[w2]。加入 0.1ml 18.5%HCl,以溶解CaCO3。随后在13000rpm下对管离心3分钟。 弃去上清液,加入0.5ml水,重新悬浮沉淀。再次在13000rpm对管进行 3分钟离心,弃去上清液。在40℃于真空下对管进行48小时干燥,再次 对含有沉淀的管进行称重[w3]。样品中生物质浓度[B]按照下式计算:

(w3-w1)/(w2-w1)×1000=生物质浓度[g/kg]

用具有与LiChrospher-100-RP18,5μm预柱(Merck,Darmstadt, Germany)组合的Aminex-HPX-78H(300x7.8mm)柱(Biorad,Reinach, Switzerland),在Hewlett-Packard 1100仪器上,通过HPLC来测量葡萄糖 的浓度或量[G]。移动相为0.004 M硫酸,以0.6ml/分钟的流速泵出。用折 射率探测器来监测信号。基于峰面积应用外部标准校正。

产率,即给定时间后从D-葡萄糖的转化获得的生物质的量(干重[g生 物质/g D-葡萄糖])按照下式来计算,其中,(t1)定义了在培养期间或终点 (例如,24或48小时后)测量的生物质和D-葡萄糖的各自的浓度,(t0) 定义了在培养开始时的各自的浓度(见上文):

[B(t1)-B(t0)]/[G(t1)-G(t0)]=基于消耗的葡萄糖的生物质产率[g/g]

定体积的生物质生产能力[g/kg/h],即,每升培养液每单位时间生产的 生物质的量,按照下式来计算:

[B(t1)-B(t0)]/(t0-t1)=定体积的生物质生产能力[g/kg/h]

实施例2  制备染色体DNA以及通过PCR扩增DNA片段

在由25g/l甘露糖醇、5g/l酵母提取物(Difco)和3g/l细菌蛋白胨 (Difco)构成的液体甘露糖醇培养基(MB)中,于30℃对 Gluconobacter oxydans DSM 17078的细胞进行一天的培养,通过Sambrook et al(1989)″Molecular Cloning:A Laboratory Manual/Second Edition″,Cold Spring Harbor Laboratory Press所述的方法,从培养的细胞制备 Gluconobacter oxydans DSM 17078的染色体DNA。

使用按照上文所述制备的染色体DNA以及一组引物-Pf(SEQ ID NO:3)和Pr(SEQ ID NO:4),通过PCR来制备DNA片段。按照厂 商说明书,用Expand High Fidelity PCR试剂盒(Roche Diagnostics)和10 ng染色体DNA以100μl的总体积来进行反应,获得了含有GMS01 DNA 序列(SEQ ID NO:1)的PCR产物。从反应体系中回收PCR产物,并验 证了其正确序列。

实施例3  在G.oxydans DSM 17078中打断GMS01基因

将实施例2中获得的PCR产物克隆进E.coli载体pCR2.1-TOPO,用 于转化E.coli TG1,获得携带有pCR2.1-GMS01的Apr转化子。

然后,用连接酶将分离自pUC-4K(Amersham Bioscience,编号No. X06404)的Kmr盒插入目标基因的限制性位点之一,用得到的连接产物去 转化E.coli TG1,获得携带有pCR2.1-GMS01::Km的Apr Kmr转化子。用 选自载体部分的多克隆位点的两种限制性酶来消化从转化子制备的 pCR2.1-GMS01::Km质粒。通过电穿孔,用得到的DNA片段转化G. oxydans DSM 17078,得到基因打断子,G.oxydans DSM 17078-GMS 01::Km。

实施例4  在液体培养物中从D-葡萄糖来生产生物质

按照上文所述培养G.oxydans DSM 17078和G.oxydans DSM 17078- GMS01::km,测定所产生的生物质的产率以及定体积的生物质生产能力 (见实施例1),其中(t1)=24小时。结果示于表1中。

表1.从D-葡萄糖生产生物质

菌株 基于消耗的葡萄糖 的生物质产率[g/g] 定体积的生物质 生产能力[g/kg/h] G.oxydans DSM 17078     0.032     0.052 G.oxydans DSM 17078-GMS 01::km     0.24     0.109

实施例5 GMS01基因和等同物在其它生物中的存在

可通过简单的DNA杂交实验来测定其它生物(而非本文前面公开的 那些,例如表2中提到的生物)中SEQ ID NO:1和/或等同物的存在。

在含有5g/l细菌蛋白胨(Difco)、5g/l酵母提取物(Difco)、5g/l 葡萄糖、5g/l甘露糖醇、1g/l MgSO4·7H2O、5ml/l乙醇和15g/l琼脂的 No.350培养基上,于27℃,对菌株Acetobacter aceti subsp.xylinum IFO 13693和IFO13773进行3天的培养。在含有25g/l甘露糖醇、5g/l酵母提 取物(Difco)、3g/l细菌蛋白胨(Difco)和18g/l琼脂(Difco)的甘露 糖醇培养基(MB)型琼脂培养基上,于27℃,对所有其它Acetobacter、 Gluconacetobacter菌株和所有Gluconobacter菌株进行3天的培养。在 Luria Broth琼脂培养基上培养E.coli K-12。在厂商推荐的培养基上或者按 照本领域已知的方法培养其它菌株/细胞。按照例如Sambrook et al,1989, ″Molecular Cloning:A Laboratory Manual/Second Edition″,Cold Spring Harbor Laboratory Press所述,从合适的生物(例如表2提到的)提取基因 组DNA。

用限制性酶(例如EcoRI或HindIII)消化基因组DNA制备物,通过 琼脂糖凝胶电泳(1%琼脂糖)分离出1μg的DNA片段。用0.25N HCl 对凝胶进行15分钟的处理,接着再用0.5N NaOH处理30分钟,然后按 照厂商说明书,用Vacuum Blotter Model 785(BIO-RAD Laboratories AG, Switzerland)将凝胶印到硝酸纤维素或尼龙膜上。然后用得到的印迹与含 有探针(例如具有SEQ ID NO:1序列的DNA片段,或含有SEQ ID NO:1序列的部分或全部的DNA片段)的溶液接触或杂交,以从测试生 物中探测阳性DNA片段。可按照实施例1,用PCR-DIG标记试剂盒 (Roche Diagnostics)和引物组SEQ ID NO:3和SEQ ID NO:4来制备 DIG标记的探针,例如SEQ ID NO:1。此印迹杂交结果示于表2中。

杂交可在严谨条件或高度严谨条件下进行。此类条件的一个优选的非 限制性的例子是在6x氯化钠/柠檬酸钠(SSC)中,大约45℃下杂交,随 后在1x SSC、0.1%SDS中,50℃下进行一次或多次洗涤,洗涤优选在 55℃下,更优选在60℃下,进一步优选在65℃下进行。高度严谨条件包 括,例如,在溶液中,例如在含或不含100μg/ml的鲑鱼精DNA的 DigEasyHyb溶液(Roche Diagnostics GmbH)的溶液中,或包含50%甲酰 胺、5x SSC(150mM NaCl、15mM柠檬酸三钠)、0.02%十二烷基磺酸 钠、0.1%N-月桂酰肌氨酸和2%封闭试剂(Roche Diagnostics GmbH)的 溶液中,于42℃温育2小时至4天,接着在2x SSC和0.1%SDS中,于 室温下,洗两次膜,每次5至15分钟,然后在65-68℃,于0.5x SSC和 0.1%SDS或0.1x SSC和0.1%SDS中洗两次,每次15-30分钟。为检测出 与探针DNA具有较低相同性的DNA片段,最后的洗涤步骤可在较低温度 (例如50-65℃)进行较短的洗涤时间(例如1-15分钟)。

可通过本领域公知的PCR方法,对表2所示各生物中阳性信号对应的 基因加以克隆,这使用此生物的基因组DNA与合适的引物组(例如, SEQ ID NO:3和SEQ ID NO:4)在实施例1所述条件下进行,或者按照 这样进行:每个反应使用5至100 ng基因组DNA(总体积50μl)。可用 Expand High Fidelity PCR系统(Roche Diagnostics),采用下述反应条 件:94℃ 2分钟;30个循环的(i)94℃ 15秒的变性步骤,(ii)60℃ 30 秒的退火步骤,(iii)72℃ 0.5至5分钟(取决于目标DNA长度,1分钟 /1kb)的合成步骤;72℃延伸7分钟。或者,可以用简并引物来进行 PCR,对简并引物的设计可基于SEQ ID NO:2或基于作为共有序列的氨 基酸序列(通过对由序列搜索程序(例如BLASTP,或当核苷酸序列被用 作“查询序列”时,BLASTX)获得的若干氨基酸序列进行比对选出 的),以找到与SEQ ID NO:2的蛋白相似的蛋白。对使用简并引物进行 的PCR而言,第二个退火步骤的温度(见上文)可被降低至55℃,或者 甚至50-45℃。此实验的结果如表2所示。

通过琼脂糖凝胶电泳来分离PCR反应的样品,在用例如溴化乙啶染色 后,用透照器(transilluminator)来观察条带,从凝胶对条带进行分离,验 证正确的序列。

上文提到的共有序列可以是属于若干蛋白质结构域/家族数据库的某些 类的氨基酸序列,所述数据库例如PROSITE(蛋白质家族和结构域的数据 库)、COGs(直向同源体组的簇)、CDD(保守结构域数据库)、pfam (多重序列比对和隐Markov模型的大集合,覆盖很多常见的蛋白质结构 域和家族)。一旦可从含有此类数据库的结构域或家族的蛋白中选出与本 发明的蛋白具有相同/相近功能的某些蛋白,即可使用蛋白序列或其核苷酸 序列(当可从公众数据库获得时)通过PCR来扩增编码该蛋白的对应 DNA。下述生物体可进一步提供可用作为本发明备选基因的基因: Burkholderia xenovorans LB400、Acinetobacter calcoaceticus LMD79.41、 Mesorhizobium loti MAFF303099、Sinorhizobium meliloti 1021。

实施例6在其它生物中打断GMS01基因和等同物,用于生产生物质

为提高合适的微生物中从碳源(例如葡萄糖)进行的生物质生产,可 按照关于G.oxydans DSM 17078中的GMS01基因所述的方法(见实施例 2),破坏GMS01基因和等同物(例如,实施例5中获得的PCR产物, 其在本文中被称为基因X),以产生携带基因GMS01等同基因::Km的敲 除突变体。用于产生此类敲除突变体的合适的宿主细胞可选自,例如,表 2列出的Gluconobacter菌株,特别是G.oxydans IFO3292、G.oxydans IFO ATCC 621H、G.oxydans IFO12528、G.oxydans IFO3291、G.oxydans IFO 3255、G.oxydans IFO3244、G.cerinus IFO3266、G.frateurii IFO3260、G. oxydans IFO3287、Acetobacter aceti subsp.orleanus IFO3259、Acetobacter aceti subsp.xylinum IFO13693、Acetobacter aceti subsp.xylinum IFO13773 和Acetobacter sp.ATCC 15164。

敲除突变体,例如,敲除突变体G.oxydans IFO3292-GMS01等同基 因::Km可以按照下文所述来产生:将实施例5所述从G.oxydans IFO3292 获得的PCR产物克隆进E.coli载体pCR2.1-TOPO,并用于转化E.coli TG1,以获得携带pCR2.1-基因X的Apr转化子。然后,用连接酶将从 pUC-4K(Amersham Bioscience,编号X06404)分离的Kmr盒插入目标基 因的限制性位点之一,用得到的连接产物转化E.coli TG1,以获得携带 pCR2.1-基因X::Km的AprKmr转化子。用选自载体部分的多克隆位点的 两种限制性酶消化从转化子制备的pCR2.1-基因X::Km质粒,以分离出含 有基因X::Km的DNA片段。通过电穿孔用得到的DNA片段转化携带有 基因X的宿主菌株,以获得携带有GMS01等同基因::Km的基因打断子 (disruptant)。

可产生进一步的修饰,包括对所述菌株中涉及将碳源(例如葡萄糖) 转化为生物质的基因进行的修饰,以提高此类菌株的生物质产量。

按照实施例4,使用敲除突变体的细胞(例如G.oxydans IFO3292- GMS01等同基因::Km的细胞)和对应的野生型菌株(例如G.oxydans IFO3292)进行从碳源(例如葡萄糖)到生物质的生产。

在用5%葡萄糖作为碳源的反应中,较之野生型菌株而言,突变体菌 株生产的生物质可至少超过250%。

表2:其它生物体中GMS01基因的等同物

菌株   信号1   信号2   信号3 G.oxydans DSM 17078     +     +     + G.oxydans IFO3293     +     +     + G.oxydans IFO3292     +     +     + G.oxydans ATCC621H     +     +     + G.oxydans IFO12528     +     +     + G.oxydans G624     +     +     + G.oxydans T-100     +     +     + G.oxydans IFO3291     +     +     + G.oxydans IFO3255     +     +     + G.oxydans ATCC9937     +     +     + G.oxydans IFO3244     +     +     + G.cerinus IFO3266     +     +     + G.frateurii IFO3260     +     +     + G.oxydans IFO3287     +     +     + Acetobacter aceti subsp.orleanus IFO3259     +     -     + Acetobacter aceti subsp.xylinum IFO13693     +     -     + Acetobacter aceti subsp.xylinum IFO13773     +     -     + Acetobacter sp.ATCC15164     +     -     + G.thailandicus NBRC100600     +     +     + Gluconacetobacter liquefaciens ATCC14835     +     +     + Gluconacetobacter polyoxogenes NBI1028     +     +     + Gluconacetobacter diazotrophicus ATCC49037     +     +     + Gluconacetobacter europaeus DSM6160     +     +     + Acetobacter aceti1023     +     -     + Acetobacter pasteurianus NCI1193     +     -     + Pseudomonas putida ATCC21812     +     -     + Pseudomonas aeroginosa PAO1     +     -     + Pseudomonas fluorescens DSM50106     +     -     + Pseudomonas syringae B728a     +     -     +

Rhodopseudomonas palustris CGA009     + -     + Pantoea citrea 1056R     + -     + E.coli K12     + -     + Saccharomyces cerevisiae     - -     - Aspergillus niger     - -     - 小鼠     - -     -

信号1:在使用不同菌株的基因组DNA,用SEQ ID NO:1作为经标记探 针进行的印迹杂交试验上对DNA的探测。信号2:使用引物对SEQ ID NO:3和SEQ ID NO:4在PCR反应中对不同菌株DNA的探测。信号 3:使用简并引物进行的PCR反应中对不同菌株DNA的探测。更多解释 参见文本。

序列表

<110>帝斯曼知识产权资产管理有限公司

<120>新颖的基因GMS01

<130>24613

<160>4

<170>PatentIn version 3.2

<210>1

<211>2427

<212>DNA

<213>Gluconobacter oxydans DSM 17078

<400>1

atgagcacaa catcccggcc agggctctgg gccctgatta cggccgcggt attcgcgctt    60

tgcggcgcga tccttaccgt tggcggcgca tgggtcgctg ccatcggcgg ccctctctat    120

tatgtcatcc ttggcctggc acttctcgcc acggctttcc tctcattccg gcgcaacccg    180

gctgccctct acctgttcgc agtcgtcgtc ttcggaacgg tcatctggga actcaccatt    240

gtcggtctcg acatctgggc cctgatcccg cgctcggaca tcgtcatcat cctcggcatc    300

tggctgctgc tgccgttcgt ctcccgccag atcggcggca cgcggacgac cgtcctgccg    360

ctcgccggcg ccgttggcgt tgcggttctg gccctgttcg ccagcctctt caccgacccg    420

catgacatca gcggcgaact gccgacgcag atcgcaaacg cctcccccgc cgacccggac    480

aacgtcccgg ccagcgaatg gcacgcttat ggtcgtacgc aggccggtga ccgctggtcc    540

ccgctgaacc agatcaacgc gtccaacgtc agcaacctca aggtcgcatg gcatatccac    600

accaaggata tgatgaactc caacgacccg ggcgaagcga cgaacgaagc gaccccgatc    660

gagttcaaca acacgcttta tatgtgctcg ctgcaccaga agctgtttgc ggttgatggt    720

gccaccggta acgtcaagtg ggtctacgat ccgaagctcc agatcaaccc tggcttccag    780

catctgacct gccgtggcgt cagcttccac gaaacgccgg ccaatgccac ggattccgat    840

ggcaatcccg ctccgacgga ctgcgccaag cgcatcatcc tgccggtcaa tgatggccgt    900

ctggttgaag tcgatgccga cacgggcaag acctgctccg gcttcggcaa caatggcgag    960

atcgatctgc gcgttccgaa ccagccctac acgacgcccg gccagtatga gccgacgtcc    1020

ccgccggtca tcacggacaa gctgatcatc gccaacagcg ccatcaccga taacggttcg    1080

gtcaagcagg cttcgggcgc cacgcaggca ttcgacgtct acaccggcaa gcgcgtctgg    1140

gtgttcgatg cgtccaaccc ggatccgaac cagcttccgg atgacagcca ccctgtcttc    1200

cacccgaact ccccgaactc ctggatcgtg tcgtcctacg acaggaatct gaacctcgtg    1260

tacatcccga tgggcgtggg tactcccgac cagtggggcg gtgaccgcac gaaggattcc    1320

gagcgtttcg ctccgggtat cgtcgcgctg aacgccgata cgggcaagct cgcctggttc    1380

taccagaccg ttcatcacga tctgtgggac atggacgttc cgtcccagcc gagccttgtg    1440

gacgtaacgc agaaggacgg cacgcttgtt ccggccatct acgctccgac caagaccggc    1500

gacatcttcg tcctcgaccg tcgtaccggc aaggaaatcg tcccggctcc ggaaaccccg    1560

gttccccagg gcgccgctcc gggcgatcac accagcccga cccagccgat gtcgcagctg    1620

accctgcgtc cgaagaaccc gctgaacgac tccgatatct ggggcggcac gatcttcgac    1680

cagatgttct gcagcatcta tttccacaga ctgcgctacg aaggcccctt cacgccgccg    1740

tcgctcaagg gttcgctcat cttcccgggc gatctgggaa tgttcgaatg gggcggtctg    1800

gccgtcgatc cgcagcgtca ggtggctttc gccaacccga tctccctgcc gttcgtctcc    1860

cagcttgttc cccgtggacc gggcaacccg ctctggcctg aaaaggacgc caagggcacg    1920

ggtggtgaaa ccggcctgca gcacaactat ggcattccgt atgccgtcaa cctgcatccg    1980

ttcctggatc cggtgctgct gccgttcggc atcaagatgc cgtgccgcac gccgccctgg    2040

ggctatgtcg ccggtattga cctgaagacc aacaaggtcg tctggcagca ccgcaacggc    2100

accctgcgtg actccatgta tggcagctcc ctgccgatcc cgctgccgcc gatcaagatc    2160

ggtgtcccga gcctcggtgg cccgctctcc acggctggca acctcggctt cctgacggcg    2220

tccatggatt actacatccg tgcgtacaac ctgacgacgg gcaaagtgct gtggcaggac    2280

cgcctgccgg ctggtgccca ggcaacgccg atcacctatg cgatcaacgg caagcagtac    2340

atcgtaacct atgcaggcgg acacaactcg ttcccgaccc gcatgggcga cgacatcatc    2400

gcctacgccc tgcccgatca gaaatga                                        2427

<210>2

<211>808

<212>PRT

<213>Gluconobacter oxydans DSM 17078

<400>2

Met Ser Thr Thr Ser Arg Pro Gly Leu Trp Ala Leu Ile Thr Ala Ala

1               5                   10                  15

Val Phe Ala Leu Cys Gly Ala Ile Leu Thr Val Gly Gly Ala Trp Val

            20                  25                  30

Ala Ala Ile Gly Gly Pro Leu Tyr Tyr Val Ile Lau Gly Leu Ala Leu

        35                  40                  45

Leu Ala Thr Ala Phe Leu Ser Phe Arg Arg Asn Pro Ala Ala Leu Tyr

    50                  55                  60

Leu Phe Ala Val Val Val Phe Gly Thr Val Ile Trp Glu Leu Thr Ile

65                  70                  75                  80

Val Gly Leu Asp Ile Trp Ala Leu Ile Pro Arg Ser Asp Ile Val Ile

                85                  90                  95

Ile Leu Gly Ile Trp Leu Leu Leu Pro Phe Val Ser Arg Gln Ile Gly

            100                 105                 110

Gly Thr Arg Thr Thr Val Leu Pro Leu Ala Gly Ala Val Gly Val Ala

        115                 120                 125

Val Leu Ala Leu Phe Ala Ser Leu Phe Thr Asp Pro His Asp Ile Ser

    130                 135                 140

Gly Glu Leu Pro Thr Gln Ile Ala Asn Ala Ser Pro Ala Asp Pro Asp

145                 150                 155                 160

Asn Val Pro Ala Ser Glu Trp His Ala Tyr Gly Arg Thr Gln Ala Gly

                165                 170                 175

Asp Arg Trp Ser Pro Leu Asn Gln Ile Asn Ala Ser Asn Val Ser Asn

            180                 185                 l90

Leu Lys Val Ala Trp His Ile His Thr Lys Asp Met Met Asn Ser Asn

        195                 200                 205

Asp Pro Gly Glu Ala Thr Asn Glu Ala Thr Pro Ile Glu Phe Asn Asn

    210                 215                 220

Thr Leu Tyr Met Cys Ser Leu His Gln Lys Leu Phe Ala Val Asp Gly

225                 230                 235                 240

Ala Thr Gly Asn Val Lys Trp Val Tyr Asp Pro Lys Leu Gln Ile Asn

                245                 250                 255

Pro Gly Phe Gln His Leu Thr Cys Arg Gly Val Ser Phe His Glu Thr

            260                 265                 270

Pro Ala Asn Ala Thr Asp Ser Asp Gly Asn Pro Ala Pro Thr Asp Cys

        275                 280                 285

Ala Lys Arg Ile Ile Leu Pro Val Asn Asp Gly Arg Leu Val Glu Val

    290                 295                 300

Asp Ala Asp Thr Gly Lys Thr Cys Ser Gly Phe Gly Asn Asn Gly Glu

305                 310                 315                 320

Ile Asp Leu Arg Val Pro Asr Gln Pro Tyr Thr Thr Pro Gly Gln Tyr

                325                 330                 335

Glu Pro Thr Ser Pro Pro Val Ile Thr Asp Lys Leu Ile Ile Ala Asn

            340                 345                 350

Ser Ala Ile Thr Asp Asn Gly Ser Val Lys Gln Ala Ser Gly Ala Thr

        355                 360                 365

Gln Ala Phe Asp Val Tyr Thr Gly Lys Arg Val Trp Val Phe Asp Ala

    370                 375                 380

Ser Asn Pro Asp Pro Asn Gln Leu Pro Asp Asp Ser His Pro Val Phe

385                 390                 395                400

His Pro Asn Ser Pro Asn Ser Trp Ile Val Ser Ser Tyr Asp Arg Asn

                405                 410                 415

Leu Asn Leu Val Tyr Ile Pro Met Gly Val Gly Thr Pro Asp Gln Trp

            420                 425                 430

Gly Gly Asp Arg Thr Lys Asp Ser Glu Arg Phe Ala Pro Gly Ile Val

        435                 440                 445

Ala Leu Asn Ala Asp Thr Gly Lys Leu Ala Trp Phe Tyr Gln Thr Val

    450                 455                 460

His His Asp Leu Trp Asp Met Asp Val Pro Ser Gln Pro Ser Leu Val

465                 470                 475                 480

Asp Val Thr Gln Lys Asp Gly Thr Leu Val Pro Ala Ile Tyr Ala Pro

                485                  490                495

Thr Lys Thr Gly Asp Ile Phe Val Leu Asp Arg Arg Thr Gly Lys Glu

            500                 505                 5l0

Ile Val Pro Ala Pro Glu Thr Pro Val Pro Gln Gly Ala Ala Pro Gly

        515                 520                 525

Asp His Thr Ser Pro Thr Gln Pro Met Ser Gln Leu Thr Leu Arg Pro

    530                 535                 540

Lys Asn Pro Leu Asn Asp Ser Asp Ile Trp Gly Gly Thr Ile Phe Asp

545                 550                 555                 560

Gln Met Phe Cys Ser Ile Tyr Phe His Arg Leu Arg Tyr Glu Gly Pro

                565                 570                 575

Phe Thr Pro Pro Ser Leu Lys Gly Ser Leu Ile Phe Pro Gly Asp Leu

            580                 585                 590

Gly Met Phe Glu Trp Gly Gly Leu Ala Val Asp Pro Gln Arg Gln Val

        595                 600                 605

Ala Phe Ala Asn Pro Ile Ser Leu Pro Phe Val Ser Gln Leu Val Pro

    6l0                 615                 620

Arg Gly Pro Gly Asn Pro Leu Trp Pro Glu Lys Asp Ala Lys Gly Thr

625                 630                 635                 640

Gly Gly Glu Thr Gly Leu Gln His Asn Tyr Gly Ile Pro Tyr Ala Val

                645                 650                 655

Asn Leu His Pro Phe Leu Asp Pro Val Leu Leu Pro Phe Gly Ile Lys

            660                 665                 670

Met Pro Cys Arg Thr Pro Pro Trp Gly Tyr Val Ala Gly Ile Asp Leu

        675                 680                 685

Lys Thr Asn Lys Val Val Trp Gln His Arg Asn Gly Thr Leu Arg Asp

    690                 695                 700

Ser Met Tyr Gly Ser Ser Leu Pro Ile Pro Leu Pro Pro Ile Lys Ile

705                 710                 715                 720

Gly Val Pro Ser Leu Gly Gly Pro Leu Ser Thr Ala Gly Asn Leu Gly

                725                 730                 735

Phe Leu Thr Ala Ser Met Asp Tyr Tyr Ile Arg Ala Tyr Asn Leu Thr

            740                 745                 750

Thr Gly Lys Val Leu Trp Gln Asp Arg Leu Pro Ala Gly Ala Gln Ala

        755                 760                 765

Thr Pro Ile Thr Tyr Ala Ile Asn Gly Lys Gln Tyr Ile Val Thr Tyr

    770                 775                 780

Ala Gly Gly His Asn Ser Phe Pro Thr Arg Met Gly Asp Asp Ile Ile

785                 790                 795                 800

Ala Tyr Ala Leu Pro Asp Gln Lys

                805

<210>3

<211>20

<212>DNA

<213>人工

<220>

<223>引物

<400>3

atgagcacaa catcccggcc    20

<210>4

<211>20

<212>DNA

<213>人工

<220>

<223>引物

<400>4

tcatttctga tcgggcaggg    20

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号