首页> 中国专利> L-氨基酸生产菌以及L-氨基酸的生产方法

L-氨基酸生产菌以及L-氨基酸的生产方法

摘要

在培养基中培养具有L-半胱氨酸等氨基酸生产能力、且经过修饰从而携带了具有特定突变的yeaS基因的属于肠杆菌科的细菌,使L-氨基酸在培养基中生成积累,并从该培养基收集L-氨基酸,从而生产L-氨基酸。

著录项

  • 公开/公告号CN101864465A

    专利类型发明专利

  • 公开/公告日2010-10-20

    原文格式PDF

  • 申请/专利权人 味之素株式会社;

    申请/专利号CN201010114678.4

  • 发明设计人 宅见和浩;野中源;

    申请日2010-02-20

  • 分类号C12P13/04;C12P13/12;C12P13/06;C12P13/08;C12P13/24;C12P13/14;C12P13/10;C12P13/22;C12N1/21;C12N15/31;C12R1/01;C12R1/19;

  • 代理机构北京市柳沈律师事务所;

  • 代理人封新琴

  • 地址 日本东京都

  • 入库时间 2023-12-18 01:00:57

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-12-24

    授权

    授权

  • 2011-12-14

    实质审查的生效 IPC(主分类):C12P13/04 申请日:20100220

    实质审查的生效

  • 2010-10-20

    公开

    公开

说明书

技术领域

本发明涉及L-半胱氨酸等L-氨基酸的生产方法,具体来说涉及适于生产L-氨基酸的细菌,以及使用该细菌的L-氨基酸生产方法。L-氨基酸在调味品、食品添加剂、饲料添加剂、化学产品、医药品等多种领域中被利用。

背景技术

L-氨基酸是通过使用属于短杆菌属、棒状杆菌属、埃希氏菌属等的微生物的发酵方法来进行工业生产的。在这些生产方法中,使用从自然界分离的菌株或者该菌株的人工突变株,并且还使用通过重组DNA技术进行修饰从而增加了碱性L-氨基酸生物合成酶的活性的微生物等(专利文献1~9)。

此外,例如,L-半胱氨酸可以通过从毛发、角、羽毛等含有角蛋白质的物质中提取而获得,或者以DL-2-氨噻唑啉-4-羧酸为前体通过细菌酶转化而获得。此外,还计划使用新型酶通过固定化酶方法大量生产L-半胱氨酸。

还尝试通过使用细菌的发酵方法来生产L-半胱氨酸。例如,本发明人公开的使用下述埃希氏菌属细菌的L-半胱氨酸的生产方法,所述埃希氏菌属细菌的L-半胱氨酸分解系统受到了抑制、且降低了L-半胱氨酸的反馈抑制并且携带了丝氨酸乙酰转移酶(serine acetyltransferase(EC 2.3.1.30),下面也称为“SAT”)(专利文献11)。此外,作为通过抑制L-半胱氨酸分解系统从而提高了L-半胱氨酸生产能力的细菌,已知的有使胱硫醚-β-裂解酶(专利文献11)、色氨酸酶(专利文献12)、O-乙酰丝氨酸巯基水解酶(专利文献13)的活性降低或缺失的棒状杆菌型细菌或埃希氏属细菌。同样地,还已知使用下述细菌的L-半胱氨酸制造方法,所述细菌中,利用编码降低了L-半胱氨酸反馈抑制并具有特定突变的SAT的DNA序列,使L-半胱氨酸物质代谢摆脱了调控(专利文献14)。

还已知编码YdeD蛋白质的ydeD基因(非专利文献1)以及编码YfiK蛋白质的yfiK基因(专利文献15)与L-半胱氨酸途径的代谢产物的分泌有关。此外,已知通过增强作为编码适于排出针对细胞的有毒物质的蛋白质的基因的mar-基因座、acr-基因座、cmr-基因座、mex-基因座、bmr-基因座、qacA-基因位点(专利文献16)、或emrAB、emrKY、yojIH、acrEF、bcr或者cusA基因(专利文献17)的表达来提高L-半胱氨酸生产能力的技术。

另一方面,已经报道了使用过量表达了下述基因的细菌来生产L-半胱氨酸的方法,所述基因为编码优选使抗生物质或对细菌有毒性的物质直接从细胞放出的蛋白质的基因(专利文献18)。

此外,不仅是L-半胱氨酸,还已知对于提高细菌的L-氨基酸的生产力而言,可以通过提高L-氨基酸的分泌蛋白质的表达来实现。对于棒状杆菌型细菌,已有报道称,通过增强命名为lysE的L-赖氨酸分泌载体的表达量,可以提高L-赖氨酸的生产(专利文献19)。此外,对于埃希氏菌属细菌,已知几种预测为氨基酸分泌载体的膜蛋白质。例如,报道了通过增加命名为rhtB的基因的拷贝数,可以提高对于高浓度L-高丝氨酸、L-苏氨酸、L-丙氨酸、L-缬氨酸以及L-异亮氨酸的抗性,因此预测该基因产物为这些L-氨基酸的分泌载体(专利文献19)。

已经有报道称,yeaS基因被推测为属于上述rhtB基因家族的膜蛋白质,通过增强该基因表达量,与对照株相比也可以提高对于高浓度的L-苏氨酸、L-高丝氨酸、L-赖氨酸、L-谷氨酸、L-组氨酸、L-脯氨酸、α-氨基丁酸的抗性,通过在L-氨基酸生产菌中增强该基因的表达量,提高了L-缬氨酸、L-异亮氨酸、L-丙氨酸、L-脯氨酸、以及L-组氨酸的生产力(专利文献20)。

如上所述,通过增强yeaS基因的表达量,可以研究其对各种氨基酸生产的效果(非专利文献2),但对于使L-氨基酸生产力提高的yeaS基因的突变尚属未知。

现有技术文献

专利文献

专利文献1欧洲专利公开EP0643135B

专利文献2欧洲专利公开EP0733712B

专利文献3欧洲专利公开EP1477565A

专利文献4欧洲专利公开EP0796912A

专利文献5欧洲专利公开EP0837134A

专利文献6国际公开WO01/53459

专利文献7欧洲专利公开EP1170376A

专利文献8国际公开WO2005/010175

专利文献9国际公开WO96/17930

专利文献10国际公开WO2006/013807

专利文献11特开平11-155571号

专利文献12特开2003-169668

专利文献13特开2005-245311

专利文献14特表2000-504926

专利文献15特开2004-49237

专利文献16美国专利第5972663号

专利文献17特开2005-287333

专利文献18特开平11-56381号

专利文献19特开2000-189180

专利文献20欧洲专利申请公开第1013765A1

非专利文献

非专利文献1Dabler et al.,Mol.Microbiol.36.1101-1112(2000)

非专利文献2Kutukova et al.,FEBS Lett.579.4629-4634(2005)

发明内容

发明所要解决的问题

本发明的课题是:开发使细菌L-氨基酸生产能力提高的新型技术,提供L-氨基酸生产菌、以及使用该细菌的L-氨基酸的生产方法。

解决问题的方法

本发明人等为了解决上述问题进行了深入研究,结果发现通过向yeaS基因导入特定的突变,可以提高L-氨基酸的生产能力,从而完成了本发明。

即,本发明如下所述。

(1).一种生产L-氨基酸的方法,其特征在于,在培养基中培养具有L-氨基酸生产能力、且经过了修饰从而携带具有选自下述(I)~(III)中的突变的突变型yeaS基因的属于肠肝菌科的细菌,并从该培养基收集L-氨基酸:

(I)在yeaS基因编码的蛋白质中,第28位的苏氨酸残基被苏氨酸以外的氨基酸所取代的突变,

(II)在yeaS基因编码的蛋白质中,第137位的苯丙氨酸残基被苯丙氨酸以外的氨基酸所取代的突变,

(III)在yeaS基因编码的蛋白质中,第188位的亮氨酸残基被亮氨酸以外的氨基酸所取代的突变;

其中,没有所述突变的yeaS基因编码下述(A)或(B)中的任一种蛋白质:

(A)具有SEQ ID NO:2中所示的氨基酸序列的蛋白质,或

(B)具有在SEQ ID NO:2中所示的氨基酸序列中取代、缺失、插入或添加1~10个氨基酸而得到的氨基酸序列、且具有当在肠杆菌中的表达增强时使得L-半胱氨酸生产能力与非修饰株相比有所提高的活性的蛋白质。

(2).上述的方法,其中,没有所述突变的yeaS基因为下述(a)或(b)的DNA:

(a)具有SEQ ID NO:1中所示的碱基序列的基因,或,

(b)与SEQ ID NO:1中所示的碱基序列的互补序列或能够由该互补序列制备的探针在严格条件下杂交、并且编码具有当在肠杆菌中的表达增强时使得L-半胱氨酸生产能力与非修饰株相比有所提高的活性的蛋白质的DNA。

(3).上述的方法,其中所述(I)~(III)的突变分别为下述(i)~(iii)的突变:

(i)第28位的苏氨酸残基被天冬酰胺所取代的突变,

(ii)第137位的苯丙氨酸残基被丝氨酸、谷氨酰胺、丙氨酸、组氨酸、半胱氨酸以及甘氨酸中的任一种所取代的突变,

(iii)第188位的亮氨酸残基被谷氨酰胺所取代的突变。

(4).上述的方法,其中所述细菌携带具有所述(ii)的突变的突变型yeaS基因,且在该基因编码的蛋白质中第137位的苯丙氨酸残基被丝氨酸或谷氨酰胺所取代。

(5).上述的方法,其中,所述L-氨基酸选自L-半胱氨酸、L-亮氨酸、L-苏氨酸、L-丝氨酸、L-甲硫氨酸、L-组氨酸、L-缬氨酸、L-谷氨酸、L-精氨酸、L-异亮氨酸、L-苯丙氨酸、L-酪氨酸、L-色氨酸、L-脯氨酸。

(6).上述的方法,其中,所述L-氨基酸为L-半胱氨酸。

(7).上述的方法,其中,所述细菌经过修饰从而增强了L-半胱氨酸生物合成系统酶的活性。

(8).上述的方法,其中,所述细菌经过修饰从而增强了丝氨酸乙酰转移酶活性。

(9).上述的方法,其中,所述细菌携带降低了由L-半胱氨酸导致的反馈抑制的突变型丝氨酸乙酰转移酶。

(10).上述的方法,其中,所述细菌为泛菌属细菌。

(11).上述的方法,其中,所述细菌为Pantoea ananatis。

(12).上述的方法,其中,所述细菌为大肠杆菌。

(13).一种属于肠肝菌科的细菌,其具有L-氨基酸生产能力,并且经过了修饰从而携带具有选自下述(I)~(III)中的突变的突变型yeaS基因:

(I)在yeaS基因编码的蛋白质中第28位的苏氨酸残基被苏氨酸以外的氨基酸所取代的突变,

(II)在yeaS基因编码的蛋白质中第137位的苯丙氨酸残基被苯丙氨酸以外的氨基酸所取代的突变,

(III)在yeaS基因编码的蛋白质中第188位的亮氨酸残基被亮氨酸以外的氨基酸所取代的突变;

其中,没有所述突变的yeaS基因编码下述(A)或(B)中的任一种蛋白质:

(A)具有SEQ ID NO:2中所示的氨基酸序列的蛋白质,或

(B)具有在SEQ ID NO:2中所示的氨基酸序列中取代、缺失、插入或添加1~10个氨基酸而得到的氨基酸序列、并且具有当在肠杆菌中的表达增强时使得L-半胱氨酸生产能力与非修饰株相比有所提高的活性的蛋白质。

(14).权利要求13的细菌,其中,所述L-氨基酸为L-半胱氨酸。

(15).一种DNA,其编码具有选自下述(I)~(III)的突变的下述(A)或(B)中的任一种蛋白质:

(A)具有SEQ ID NO:2中所示的氨基酸序列的蛋白质,或

(B)具有在SEQ ID NO:2中所示的氨基酸序列中取代、缺失、插入或添加1~10个氨基酸而得到的氨基酸序列、并且具有当在肠杆菌中的表达增强时使得L-半胱氨酸生产能力与非修饰株相比有所提高的活性的蛋白质;

(I)在yeaS基因编码的蛋白质中第28位的苏氨酸残基被苏氨酸以外的氨基酸所取代的突变,

(II)在yeaS基因编码的蛋白质中第137位的苯丙氨酸残基被苯丙氨酸以外的氨基酸所取代的突变,

(III)在yeaS基因编码的蛋白质中第188位的亮氨酸残基被亮氨酸以外的氨基酸所取代的突变。

发明效果

通过本发明可以提高属于肠杆菌科的细菌的L-氨基酸生产力。此外,通过使用本发明的细菌,可以更高效地发酵生产L-氨基酸。

此外,通过本发明,可以提供编码具有使得宿主细胞的L-氨基酸生产力与非修饰株相比提高的活性的蛋白质的新基因。

附图说明

图1显示启动子Pnlp序列的图。

图2显示E.coli MG1655的YeaSF137S强化株的半胱氨酸抗性(生长繁育曲线)的图,○表示野生型,●表示F137S突变。

图3显示P.ananatis的YeaSWT以及YeaSF137S强化株的培养液中氨基酸浓度的图。

图4显示E.coli的YeaSWT以及YeaSF137S强化株的培养液中氨基酸浓度的图。

发明的具体实施方式

<1>本发明的细菌

本发明的细菌为具有L-氨基酸生产能力,并且经过修饰从而携带了具有特定突变的突变型yeaS基因的细菌。

对于L-氨基酸的种类没有特殊限制,可以列举出L-赖氨酸、L-鸟氨酸、L-精氨酸、L-组氨酸、L-瓜氨酸等碱性氨基酸,L-异亮氨酸、L-丙氨酸、L-缬氨酸、L-亮氨酸、L-甘氨酸等脂肪族氨基酸,L-苏氨酸、L-丝氨酸等羟基单氨基羧酸形式的氨基酸,L-脯氨酸等环式氨基酸,L-苯丙氨酸、L-酪氨酸、L-色氨酸等芳香族氨基酸,L-半胱氨酸、L-胱氨酸、L-甲硫氨酸等含硫氨基酸,L-谷氨酸、L-天冬氨酸、L-谷氨酰胺、L-天冬酰胺等等酸性氨基酸,优选L-半胱氨酸、L-亮氨酸、L-苏氨酸、L-丝氨酸、L-甲硫氨酸、L-组氨酸、L-缬氨酸、L-谷氨酸、L-精氨酸、L-异亮氨酸、L-苯丙氨酸、L-酪氨酸、L-色氨酸以及L-脯氨酸,特别优选L-半胱氨酸。本发明的细菌可以具有2种以上氨基酸的生产能力。

此外,本发明中的L-氨基酸是指游离体的L-氨基酸以及/或者其盐,例如包括硫酸盐、盐酸盐、碳酸盐、铵盐、钠盐、钾盐。

L-氨基酸的生产能力是指,当在培养基中培养本发明的细菌时,在培养基中或者菌体内生成L-氨基酸,并且积累达到可以从培养基中或者菌体中回收的水平的能力。此外,具有L-氨基酸生产能力的细菌是指,与野生株或者亲本株相比可以生产更多L-氨基酸并在培养基中积累的细菌,优选可以生产并在培养基中积累0.2g/L以上,更优选为0.3g/L,特别优选为0.4g/L以上的L-氨基酸的细菌。

当L-氨基酸为L-半胱氨酸时,细菌生产的L-半胱氨酸在培养基中通过二硫键一部分转化为L-胱氨酸。此外,如下述一样,有时L-半胱氨酸通过和培养基中含有的硫代硫酸反应生成S-硫代半胱氨酸(Szczepkowski T.W.,Nature,vol.182(1958))。进一步,细菌的细胞内生成的L-半胱氨酸有时还和细胞中存在的酮或醛,例如与丙酮酸缩合,以硫代半酮缩醇(ヘミチオケタ一ル,hemithioketal)为中间体生成噻唑烷(チアゾリジン,thiazolidine)衍生物(参考日本专利第2992010)。这些噻唑烷衍生物以及硫代半酮缩醇有时作为平衡混合物存在。因此,L-半胱氨酸生产能力,不仅限于在培养基中或者菌体内积累L-半胱氨酸的能力,是指除L-半胱氨酸之外,还包括L-胱氨酸、或者它们的衍生物,例如S-硫代半胱氨酸、噻唑烷衍生物、或者硫代半酮缩醇、或者它们的混合物在培养基中的积累能力。此外,对于在本发明的方法中生产的“L-半胱氨酸”没有特殊限制,是指还原性L-半胱氨酸、L-胱氨酸、或者上述的这些衍生物、或者它们的混合物。

作为具有L氨基酸生产能力的细菌,可以为天然具有L-氨基酸生产能力的细菌,但也可以是如下所述的细菌:通过利用突变方法、重组DNA技术经过修饰而具有了-L氨基酸生产能力的细菌。

作为在本发明中使用的细菌,只要是具有L-半胱氨酸生产能力的细菌即可,没有特殊限制,可以是属于埃希氏菌属、肠杆菌属、泛菌属、克雷伯氏菌属、沙雷氏菌属、欧文氏菌属、沙门氏菌属、摩根氏菌属等肠肝菌科的细菌。具体地说,可以使用按照NCBI(美国国家生物技术信息中心,National Center for Biotechnology Information)数据库中记载的分类属于肠杆菌科的细菌(http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgiyyid=91347)。作为用于修饰的肠杆菌科的亲本株,其中优选使用埃希氏菌属细菌、肠杆菌属细菌、泛菌属细菌、欧文氏菌属、肠杆菌属、或克雷伯氏菌属。

对于埃希氏菌属细菌的亲本株,没有特别限制,具体而言,可以使用Neidhardt等的著作(Backmann,B.J.1996.Derivations and Genotypes of somemutant derivatives of Escherichia coli K-12,p.2460-2488.Table 1.In F.D.Neidhardt(ed.),Escherichia coli and Salmonella Cellular and MolecularBiology/Second Edition,American Society for Microbiology Press,Washington,D.C.)列出的细菌。在这些细菌中,例如可列举大肠杆菌。作为大肠杆菌,具体地可列举源自原型野生型K12菌株的大肠杆菌W3110(ATCC 27325)和大肠杆菌MG1655(ATCC 47076)。

这些菌株可从例如美国典型培养物保藏中心(地址12301 ParklawnDrive,Rockville,Maryland 20852 P.O.Box 1549,Manassas,VA 20108,UnitedStates of America)通过分售获得。即,对每种菌株都给予了登录号,可以使用这些号码通过分售获得菌株(参考http://www.atcc.org/)。美国典型培养物保藏中心的目录中列出了每种菌株的对应登录号。

肠杆菌属细菌的实例可以列举出成团肠杆菌(Enterobacteragglomerans)和产气肠杆菌(Enterobacter aerogenes)等、泛菌属细菌的实例可以列举出Pantoea ananatis。而且,近年来,成团肠杆菌根据其16S rRNA的碱基序列的解析,被重新分类为成团泛菌(Pantoea agglomerans)或Pantoea ananatis(Pantoea ananatis)、斯氏泛菌(Pantoea stewartii)。在本发明中,只要是被分类为肠杆菌科的细菌,无论是属于肠杆菌属或者泛菌属中任一属的细菌均可。

特别地,泛菌属细菌、欧文氏菌属细菌和肠杆菌属细菌是分类为γ-变形细菌(γ-Proteobacteria)的细菌,它们在分类学上的亲缘关系非常近(J GenAppl Microbiol 1997 Dec;43(6)355-361、International Journal of SystematicBacteriology,Oct.1997,p1061-1067)。近年来,依据DNA-DNA杂交实验等,属于肠杆菌属的细菌中,有些被重新分类为成团泛菌(Pantoeaagglomerans)或Pantoea dispersa等(International Journal of SystematicBacteriology,July 1989;39(3).p.337-345)。此外,属于欧文氏菌属的细菌中,有些被重新分类为Pantoea ananas、斯氏泛菌(Pantoea stewartii)(参考International Journal of Systematic Bacteriology,Jan 1993;43(1).p.162-173)。

肠杆菌属细菌的实例包括成团肠杆菌(Enterobacter agglomerans)和产气肠杆菌(Enterobacter aerogenes)。具体地,可以使用欧州专利申请公开952221号说明书示例的菌株。作为肠杆菌属的代表性菌株,可以列举出成团肠杆菌ATCC12287株。

作为泛菌属细菌的代表性菌株,可以列举出Pantoea ananatis、斯氏泛菌(Pantoea stewartii)、成团泛菌、柠檬泛菌(Pantoea citrea)。作为Pantoeaananatis具体地可以列举出Pantoea ananatis AJ13355株、SC17株、以及SC17(0)株。SC17株是以作为低pH下能够在含L-谷氨酸和碳源的培养基中增殖的菌株从静冈县磐田市的土壤中分离出来的菌株AJ13355(FERMBP-6614)为起始,作为粘液质低生产突变菌株选择出来的菌株(美国专利第6,596,517号)。SC17(0)株是为了对Pantoea ananatis进行基因破坏,而构建的作为对λRed基因产物具有抗性的菌株(WO2008/075483)。SC17株已于平成21年2月4日(2009年)保藏于产业技术综合研究所专利生物保藏中心(地址:邮政编码305-8566茨城县筑波市东1丁目1番地1中央第6),并给予保藏号FERM ABP-11091。此外,SC17(0)株已于2005年9月21日保藏在俄罗斯国立工业微生物保藏中心(Russian National Collection of IndustrialMicroorganisms(VKPM),GNII Genetika)(地址:Russia,117545 Moscow,1Dorozhny proezd.1),保藏号为VKPM B-9246。

Pantoea ananatis AJ13355株已于平成10年(1998年)2月19日保藏于通产省工业技术院生命工学工业技术研究所(现名称为产业技术综合研究所专利生物保藏中心,地址:邮政编码305-8566茨城县筑波市东1丁目1番地1中央第6),保藏号为FERM P-16644,并于平成11年(1999年)1月11日转为基于布达佩斯条约的国际保藏,并给予保藏号FERM BP-6614。而且,该菌株在分离时被鉴定为成团肠杆菌(Enterobacter agglomerans),并当作成团肠杆菌AJ13355进行了保藏。但是,近年来,基于16S rRNA核苷酸序列分析等,其被重新分类为Pantoea ananatis。

作为欧文氏菌属细菌,可以列举出解淀粉欧文氏菌(Erwinia amylovora)、胡萝卜软腐欧文氏菌(Erwinia carotovora);作为克雷伯氏菌属细菌,可以列举出植生克雷伯氏菌(Klebsiella planticola)。

(L-氨基酸生产能力的赋予或增强)

为了给细菌赋予L-氨基酸生产能力,可以使用在棒状杆菌型细菌或埃希氏菌属细菌等氨基酸生产菌的选育中沿用至今的方法,如获取营养缺陷突变体、类似物抗性菌株或代谢调节突变菌株,创建L-氨基酸生物合成系统酶表达增强的重组菌株等等(参见《アミノ酸発酵》,(株)学会出版中心,1986年5月30日第一版发行,第77-100页)。这里,在L-氨基酸生产菌的选育中,被赋予的营养缺陷性、类似物抗性或代谢调节突变等性质可以是单独一种,也可以是两种或者三种以上。此外,表达被增强的L-氨基酸生物合成系统酶可以是单独一种,也可以是两种或三种以上。另外,可以将营养缺陷突变、类似物抗性或代谢调节突变等性质的赋予与生物合成系统酶的增强组合进行。

具有L-氨基酸生产能力的营养缺陷突变体菌株、L-氨基酸类似物抗性菌株或代谢调节突变菌株可如下获得:对亲本菌株或野生型菌株施以常规突变处理,即X-射线或UV照射或用诱变剂例如N-甲基-N’-硝基-N-亚硝基胍(NTG)或者甲磺酸乙酯(EMS)等处理;其后,从所得的突变菌株中选择显示营养缺陷性、类似物抗性或代谢调节突变并且还具有L-氨基酸生产能力的菌株。

此外,可以通过进行基因重组来增强酶活性从而赋予或增强L-氨基酸生产能力。酶活性的增强,可以列举出例如通过修饰细菌从而增强编码与L-氨基酸的生物合成相关的基因的表达的方法。作为增强基因的表达的方法,可以这样来实现:导入扩增的质粒,所述扩增的质粒是将包含这些基因的DNA片段导入适当的质粒,例如至少包含负责质粒在微生物内的复制增殖功能的基因的质粒载体而形成的;或者,通过接合、基因转移等使这些基因在染色体上多拷贝化;抑或在这些基因的启动子区域导入突变(参考国际公开小册子WO95/34672号)。

当向上述扩增质粒或者染色体上导入目的基因时,用于表达这些基因的启动子可以是能够在属于肠杆菌科的细菌中发挥功能的任何启动子,可以是所使用的基因自身的启动子,也可以是经修饰的启动子。也可以通过适当地选择在属于肠杆菌科的细菌中强力发挥功能的启动子,或者通过使启动子的-35、-10区域与共有序列接近,来进行基因表达量的调节。如上所述的增强酶基因表达的方法,在WO00/18935号小册子、欧洲专利申请公开1010755号说明书等中有记载。

下面,对于给细菌赋予L-氨基酸生产能力的具体方法、以及被赋予了L-氨基酸生产能力的细菌进行举例说明。

L-半胱氨酸生产菌

L-半胱氨酸生产菌以及用于衍生L-半胱氨酸生产菌的亲本株的实例可以列举出、但不限于下述属于埃希氏菌属的菌株,如用编码反馈抑制抗性的丝氨酸乙酰转移酶(SAT)的多种cysE等位基因转化的大肠杆菌JM15(美国专利第6,218,168号),具有编码适于向细胞分泌有毒物质的蛋白质的过表达基因的大肠杆菌W3110(美国专利第5,972,663号),半胱氨酸脱巯基酶(cysteine desulfohydrase)活性减少的大肠杆菌菌株(特开平11-155571号公报);由cysB基因编码的半胱氨酸调节子的正向转录调控物活性增强的大肠杆菌W3110(WO01/27307)等。本发明的细菌为经过修饰而携带了具有特定突变的yeaS基因的细菌。如下所述,yeaS基因编码的蛋白质(下面,也称为“YeaS蛋白质”)被推测为具有将L-半胱氨酸等L-氨基酸分泌到细胞外的活性。

在大肠杆菌中,作为具有分泌L-半胱氨酸活性的公知的蛋白质,已知了如上所述的由ydeD编码的蛋白质(特开2002-233384)、由yfiK编码的蛋白质(特开2004-49237)、由emrAB、emrKY、yojIH、acrEF、bcr、cusA各基因编码的蛋白质(特开平2005-287333)。除了使细菌携带突变型yeaS基因之外,还可以增强它们的反馈抑制抗性的SAT的活性、L-半胱氨酸分泌蛋白质的活性。

下面,作为赋予L-半胱氨酸生产能力的方法,对增强L-半胱氨酸生物合成酶活性的方法进行说明。

作为L-半胱氨酸生物合成酶,可以列举出例如,丝氨酸乙酰转移酶(SAT)。在属于肠杆菌科的细菌的细胞内增强SAT活性,可以通过增加编码SAT基因的拷贝数、或者通过修饰编码SAT基因的启动子等表达调节序列来实现。例如,将编码SAT的基因片段,与在属于肠杆菌科的细菌中发挥功能的载体、优选多拷贝型载体连接制作重组DNA,并将其转化导入到属于肠杆菌科的宿主细菌中即可。更为具体地,可以适用与后述的yeaS基因同样的方法。

SAT基因可以任选埃希氏菌属细菌来源的基因以及其他生物来源的基因使用。作为大肠杆菌的编码的SAT基因,从野生株以及L-半胱氨酸分泌突变株中克隆了cysE,从而得知其碱基序列(Denk,D.and Boeck,A.,J.General Microbiol.,133,515-525(1987))。因此,使用基于该基因序列(SEQ IDNO:3)制成的引物,以埃希氏菌属细菌的染色体DNA为模板进行PCR,可以获得SAT基因(参考特开平11-155571号)。其他生物的编码SAT的基因也可以同样地获得。通过上述方法得到的SAT基因,也可以像上述那样进行表达增强。

而且,当在SAT基因的表达中存在“L-半胱氨酸反馈抑制”等抑制机理时,通过修饰表达调节序列或与抑制相关的基因从而使该抑制机制变为非敏感性的,也可以增强SAT基因的表达。

例如,通过在属于肠杆菌科的细菌中携带降低或解除了L-半胱氨酸反馈抑制的SAT(下面,也称为“突变型SAT”),可以使SAT活性升高。作为突变型SAT,可以列举出具有下述突变的SAT:用赖氨酸残基以及亮氨酸残基以外的氨基酸残基取代相当于野生型SAT(SEQ ID NO:4)的第256位的甲硫氨酸残基的氨基酸残基的突变,或者从相当于第256位的甲硫氨酸残基开始缺失C末端侧的区域的突变。作为所述赖氨酸残基以及亮氨酸残基以外的氨基酸残基,可以列举出,在通常构成蛋白质的氨基酸中,除甲硫氨酸残基、赖氨酸残基以及亮氨酸残基以外的17种氨基酸残基。可以列举出更优选为异亮氨酸残基或者谷氨酸残基。作为向野生型SAT基因中导入所期望的突变的方法,可以列举出定点突变。作为突变型SAT基因,已知编码大肠杆菌的突变型SAT的突变型cysE(参考WO 97/15673号国际公开小册子、特开平11-155571号)。携带了含有编码由谷氨酸残基取代第256位的甲硫氨酸残基的突变型SAT的突变型cysE的质粒pCEM256E的大肠杆菌JM39-8菌株(大肠杆菌JM39-8(pCEM256E)、内部编号:AJ13391),已经于平成9年(1997年)11月20日保藏于工业技术院生命工学工业技术研究所(邮政编码305日本茨城县筑波市东1丁目1番地3号),保藏号为FERMP-16527,并于2002年7月8日转为基于布达佩斯条约的国际保藏,并给予保藏号FERM BP-8112。

在本发明中,“对L-半胱氨酸反馈抑制为非敏感性”既可以指如上所述的通过修饰而使得对L-半胱氨酸的反馈抑制变为非敏感性,也可以指原本就不受反馈抑制。已知拟南芥(Arabidopsis thaliana)的SAT为不受L-半胱氨酸反馈抑制,在本发明中优选使用。作为含有拟南芥来源的SAT基因的质粒,已知的有pEAS-m(FEMS Microbiol.Lett.,179(1999)453-459)。

此外,通过增强编码硫酸盐/硫代硫酸盐输送系统蛋白质群的cysPTWAM基因簇的表达,也可以提高L-半胱氨酸的生产能力(特开2005-137369号公报、EP1528108号说明书)。

此外,硫化物通过分别由cysK以及cysM基因编码的O-乙酰丝氨酸(巯基)-裂解酶-A或者B催化的反应而被导入O-乙酰基-L-丝氨酸,从而产生L-半胱氨酸。因此,通过增强编码这些酶的基因的表达也可以提高L-半胱氨酸的生产能力。

用于增强目的基因的表达的修饰,可以例如,利用基因重组技术,通过提高细胞内的目的基因的拷贝数来进行。例如,将含有目的基因的DNA片段,与在宿主细菌内发挥功能的载体、优选多拷贝型载体连接从而制成重组DNA,并将其导入细菌进行转化即可。

另一方面,目的基因的拷贝数的提高,可以通过使目的基因在细菌的染色体DNA上以多拷贝存在而实现。向细菌染色体DNA上导入目的基因可以利用后面针对突变型yeaS基因描述的方法。

另外,目的基因表达的增强,除了上述增大基因拷贝数之外,通过如在国际公开00/18935号小册子中记载的方法也可以实现:将染色体DNA上或者质粒上的yeaS基因的启动子等表达调节序列替换成强力的;或扩增增强目的基因的表达的调节子;或者缺失或弱化降低目的基因表达的调节子。作为使目的基因表达降低的调节子,已知的有Lrp蛋白质等(Kutukova et al.,FEBS Lett.579.4629-4634(2005))。作为强启动子,已知的有例如lac启动子、trp启动子、trc启动子等。此外,通过向目的基因的启动子领域内导入碱基取代等,还可以修饰得到更强的启动子。通过这些启动子取代或者修饰可以强化目的基因的表达。启动子强度的评价方法和强启动子的例子记载于Goldstein和Doi的论文(Goldstein,M.A.and Doi R.H.1995.Prokaryoticpromoters in biotechnology.Biotechnol.Annu.Rev.,1,105-128)等中。而且,对表达调节序列的修饰也可以与提高目的基因拷贝数的方法进行聚合。此外为了提高目的基因产物的生成,也可以在目的基因的翻译起始点附近导入突变从而提高翻译效率,也可以将其与增强目的基因的表达相组合。

对于目的基因表达的提高而言,可以通过将由该基因转录的mRNA的量与野生株、或者非修饰株相比较来进行确认。作为评价mRNA的量的方法,可以列举出Northern杂交、RT-PCR等(Sambrook,J.,et al.,MolecularCloning A Laboratory Manual/Third Edition,Cold spring Harbor LaboratoryPress,Cold spring Harbor(USA),2001)。

使用抗体的蛋白质印记(Western blot)可以对目的基因产物量的增加进行确认(上述Molecular Cloning)。

此外,通过抑制L-半胱氨酸分解系统,可以提高L-半胱氨酸的生产能力。抑制L-半胱氨酸分解系统是指,细胞内的L-半胱氨酸的分解活性与野生株或者亲本株等非修饰株相比有降低。作为承担L-半胱氨酸分解系统的蛋白质,已知的有胱硫醚-β-裂解酶(metC产物、特开平11-155571号,Chandraet.al.,Biochemistry,21(1982)3064-3069)、色氨酸酶(tnaA产物、特开2003-169668,(Austin Newton et.al.,J.Biol.Chem.240(1965)1211-1218))、O-乙酰丝氨酸巯基水解酶B(cysM基因产物、特开2005-245311)、以及malY基因产物(特开2005-245311)。通过使这些蛋白质的活性降低,从而提高L-半胱氨酸的生产能力。

使蛋白质的活性降低的修饰,例如,可以通过降低编码该蛋白质的基因的表达来实现。具体来说例如,通过使染色体上的基因的编码区域的一部分或者全部缺损,可以降低所述蛋白质的细胞内的活性。此外,通过修饰基因的启动子或shine-dalgarno(SD)序列等表达调节序列等,也可以降低基因的表达。此外,对表达调节序列以外的非翻译区的修饰也可以降低基因的表达量。而且,还可以缺失包括染色体上的基因的前后序列的整个基因。此外,所述修饰还可以这样完成:通过向染色体上的目标基因的编码区域导入氨基酸取代(错义突变)、或者导入终止密码子(无义突变)、或者导入添加或缺失一~二个核苷酸的移码突变(Journal of biological Chemistry272:8611-8617(1997),Proceedings of the National Academy of Sciences,USA955511-5515(1998),Journal of Biological Chemistry 266,20833-20839(1991))。

此外,只要是可以使目的蛋白质的活性降低的修饰即可,也可以是通过X射线或紫外线照射、或者N-甲基-N’-硝基-N-亚硝基胍等突变剂进行的常规突变处理引起的修饰。

就表达调节序列的修饰而言,优选为1个核苷酸以上,更优选为2个核苷酸以上,特别优选为3个核苷酸以上。此外,在缺失编码区域时,只要目标蛋白质的功能降低或缺失即可,缺失的区域可以是N末端区域、内部区域、C末端区域中的任何区域,也可以是整个编码区域。通常,缺失的区域较长能够切实地使基因失活。此外,优选的是缺失区域的上游或下游的读码框不一致。

在目标基因的编码区域中插入其他序列时,可以为基因的任何区域,但插入的序列较长时能够切实地使基因失活。插入部位的前后序列优选读码框不一致。对于其他序列没有特殊限制,只要是能够降低或缺损编码的目的蛋白质的功能即可,可以列举例如携带抗生素抗性基因或对L-半胱氨酸生产有用的基因的转座子等。

L-苏氨酸生产菌

作为具有L-苏氨酸生产能力的微生物优选实例可以列举出增强了L-苏氨酸生物合成系统酶的1种或2种以上的活性的细菌。作为L-苏氨酸生物合成系统酶,可以列举出天冬氨酸激酶III(lysC)、天冬氨酸半醛脱氢酶基因(asd)、thr操纵子所编码的天冬氨酸激酶I基因(thrA)、高丝氨酸激酶基因(thrB)、苏氨酸合酶(thrC)、天冬氨酸氨基转移酶(天冬氨酸转氨酶)(aspC)。括号里为该基因的缩略符号(下文中也同样)。这些酶中特别优选天冬氨酸半醛脱氢酶、天冬氨酸激酶I、高丝氨酸激酶、天冬氨酸氨基转移酶基因以及苏氨酸合酶。也可以将L-苏氨酸生物合成系统基因导入苏氨酸分解受到抑制的埃希氏属细菌中。作为苏氨酸分解受到抑制的埃希氏菌属细菌,例如可以列举出苏氨酸脱氢酶活性缺损的TDH-6菌株(特开2001-346578号)。

L-苏氨酸生物合成系统酶的活性受最终产物L-苏氨酸的抑制。因此,为了构建L-苏氨酸生产菌,优选对L-苏氨酸生产菌合成系统进行修饰以使所述酶不受L-苏氨酸的反馈抑制。上述thrA、thrB和thrC基因组成苏氨酸操纵子,苏氨酸操纵子形成弱化子(attenuator)结构,苏氨酸操纵子的表达受到培养液中异亮氨酸和苏氨酸的抑制,并且表达受到弱化作用的抑制。可通过去除弱化区中的前导序列或弱化子来实现弱化作用的消除或降低(Lynn,S.P.,Burton,W.S.,Donohue,T.J.,Gould,R.M.,Gumport,R.I.,andGardner,J.F.J.Mol.Biol.194:59-69(1987);国际公开第02/26993号小册子;国际公开第2005/049808号小册子)。

苏氨酸操纵子的上游存在天然启动子,可用非天然启动子将其取代(参考WO98/04715号小册子),也可以构建苏氨酸操纵子使得苏氨酸生物合成的相关的基因的表达受到λ噬菌体的阻遏物(repressor)和启动子的调控(参考欧洲专利第0593792号说明书)。此外,为了对细菌进行修饰使其不受L-苏氨酸的反馈抑制,可以通过选择对α-氨基-β-羟基戊酸(AHV)有抗性的菌株来获得。

对于如上所述经修饰而不受L-苏氨酸的反馈抑制的苏氨酸操纵子而言,优选的是其在宿主内的拷贝数升高,或者是将其连接于强启动子而增加表达量。除了通过使用质粒的扩增来增加拷贝数,还可以通过使用转座子、Mu噬菌体等向基因组上转入苏氨酸操纵子来提高拷贝数。

理想的是,除了L-苏氨酸生物合成系统酶之外,还增强糖酵解系统、TCA、以及和呼吸链中涉及的基因、调控这些基因表达的基因、和糖摄取基因。这些在L-苏氨酸生产中有效的基因的实例可以列举出,转氢酶基因(pntAB)(欧洲专利733712号说明)、磷酸烯醇丙酮酸羧化酶基因(pepC)(国际公开95/06114号小册子)、磷酸烯醇丙酮酸合酶基因(pps)(欧洲专利877090号说明书)、棒状杆菌型细菌或者芽孢杆菌属细菌的丙酮酸羧化酶基因(国际公开99/18228号小册子、欧洲申请公开1092776号说明书)。

此外,强化赋予L-苏氨酸抗性的基因、赋予L-高丝氨酸抗性的基因的表达,或对宿主赋予L-苏氨酸抗性、L-高丝氨酸抗性,也是合适的。作为赋予抗性的基因的实例,可以列举出rhtA基因(Res.Microbiol.154:123-135(2003))、rhtB基因(欧洲专利申请公开第0994190号说明书)、rhtC基因(欧洲专利申请公开第1013765号说明书)、yfiK、yeaS基因(欧洲专利申请公开第1016710号说明书)。此外关于对宿主赋予L-苏氨酸抗性的方法,可以参考欧洲专利申请公开第0994190号说明书、国际公开第90/04636号小册子中所记载的方法。

L-苏氨酸生产菌或用于衍生L-苏氨酸生产菌的亲本株的实例,可以列举出下述属于埃希氏菌属的菌株,但并仅限于下述菌株:大肠杆菌TDH-6/pVIC40(VKPM B-3996)(美国专利第5,175,107号、美国专利第5,705,371号)、大肠杆菌472T23/pYN7(ATCC 98081)(美国专利第5,631,157号)、大肠杆菌NRRL-21593(美国专利第5,939,307号)、大肠杆菌FERMBP-3756(美国专利第5,474,918号)、大肠杆菌FERM BP-3519以及FERMBP-3520(美国专利第5,376,538号)、大肠杆菌MG442(Gusyatiner et al.,Genetika(俄语),14,947-956(1978))、大肠杆菌VL643以及VL2055(EP1149911A)等。

TDH-6菌株缺损thrC基因,是蔗糖同化型,此外其ilvA基因具有泄露(leaky)突变。此外该菌株的rhtA基因也有突变,该突变赋予了对高浓度的苏氨酸或高丝氨酸的抗性。B-3996菌株携带pVIC40质粒,且该pVIC40是通过将含有突变的thrA基因的thrA*BC操纵子插入到由RSF1010获得的载体中而获得。这种突变的thrA基因编码的天冬氨酸激酶高丝氨酸脱氢酶I的苏氨酸反馈抑制基本上已被解除。B-3996菌株于1987年11月19日被保藏于All-Union Scientific Center of Antibiotics(全联盟抗生素科学中心)(Nagatinskaya Street 3-A,117105 Moscow,Russia),保藏号为RIA 1867。此外,该菌株于1987年4月7日被保藏于俄罗斯国立工业微生物保藏中心(VKPM)(1 Dorozhny proezd.,1 Moscow 117545,Russia),保藏号为B-3996。

大肠杆菌VKPM B-5318(EP 0593792B)也可以作为L-苏氨酸生产菌或者用于衍生L-苏氨酸生产菌的亲本株使用。B-5318菌株是非异亮氨酸营养缺陷型的,并且其质粒pVIC40中的苏氨酸操作子的调控区域被温度敏感的λ噬菌体阻遏物和PR启动子所取代。VKPM B-5318在1990年5月3日国际保藏于俄罗斯国立工业微生物保藏中心(VKPM,1Dorozhny proezd.,1Moscow 117545,Russia),保藏号为VKPM B-5318。

编码大肠杆菌天冬氨酸激酶高丝氨酸脱氢酶I的thrA基因已经阐明(核苷酸编号337~2799,GenBank登录号NC_000913.2,gi:49175990)。thrA基因位于大肠杆菌K-12染色体上thrL基因和thrB基因之间。编码大肠杆菌高丝氨酸激酶的thrB基因已经阐明(核苷酸编号2801~3733,GenBank登录号NC_000913.2,gi:49175990)。thrB基因位于大肠杆菌K-12染色体上的thrA基因和thrC基因之间。编码大肠杆菌苏氨酸合酶的thrC基因已经阐明(核苷酸编号3734~5020,GenBank登录号NC_000913.2,gi:49175990)。thrC基因位于大肠杆菌K-12染色体上thrB基因和yaaX开放阅读框之间。这3个基因均作为单独的一个苏氨酸操纵子发挥功能。为增加苏氨酸操纵子的表达,优选从操纵子中将影响转录的弱化子区域去除(WO2005/049808,WO2003/097839)。

编码对苏氨酸的反馈抑制有抗性的天冬氨酸激酶高丝氨酸脱氢酶I的突变thrA基因,以及thrB基因和thrC基因,可以作为一个操纵子从熟知的pVIC40质粒中获得,该质粒存在与苏氨酸生产株大肠杆菌VKPM B-3996中。有关pVIC40质粒在美国专利第5,705,371中有详细的记载。

rhtA基因存在于大肠杆菌染色体上的18分钟处,并靠近编码谷氨酰胺转运系统的成分的glnHPQ操纵子。rhtA基因与ORF1(ybiF基因,核苷酸编号764~1651,GenBank登录号AAA218541,gi:440181)相同,位于pexB与ompX基因之间。已将表达由ORF1编码的蛋白质的单位命名为rhtA基因(rht:对高丝氨酸和苏氨酸有抗性)。此外,已经证明了rhtA23突变是在相对于ATG起始密码子的-1位置上的G→A取代(ABSTRACTS of the 17thInternational Congress of Biochemistry and Molecular Biology in conjugationwith Annual Meeting of the American Society for Biochemistry and MolecularBiology,San Francisco,California August 24-29,1997,abstract No.457,EP1013765A)。

大肠杆菌的asd基因已经阐明(核苷酸编号3572511~3571408,GenBank登录号NC_000913.1,gi:16131307),且可以利用根据该基因的碱基序列制备的引物通过PCR获得(参考White,T.J.et al.,Trends Genet.,5,185(1989))。其他微生物的asd基因也可以通过相同的方法获得。

此外,大肠杆菌的aspC基因已经阐明(核苷酸编号983742~984932,GenBank登录号NC_000913.1,gi:16128895),且可以通过PCR获得。其他微生物的aspC基因也可以通过相同的方法获得。

L-赖氨酸生产菌

属于埃希氏菌属的L-赖氨酸生产菌的实例可以列举出对L-赖氨酸类似物具有抗性的突变株。L-赖氨酸类似物可抑制属于埃希氏菌属的细菌的生长,但是这种抑制在当L-赖氨酸共存于培养基中时会被全部或部分解除。L-赖氨酸类似物的实例可以列举出、但不限于,氧代赖氨酸,赖氨酸氧肟酸(lysine hydroxamate),S-(2-氨乙基)-L-半胱氨酸(AEC),γ-甲基赖氨酸,α-氯代己内酰胺等。将属于埃希氏菌属的细菌进行常规的人工诱变处理可以得到对这些赖氨酸类似物具有抗性的突变株。可用于L-赖氨酸生产的菌株的具体实例可以列举出大肠杆菌AJ11442(参考FERM BP-1543,NRRL B-12185;参见美国专利第4,346,170号)和大肠杆菌VL611。在这些微生物中,L-赖氨酸对天冬氨酸激酶的反馈抑制已被解除。

作为L-赖氨酸生产菌或用于衍生L-赖氨酸生产菌的亲本株,可以列举出L-赖氨酸生物合成系统酶的1种或者2种以上的活性被增强的菌株。作为涉及的酶可以列举出,但不限于:二氢吡啶二羧酸合酶(dapA)、天冬氨酸激酶(lysC)、二氢吡啶二羧酸还原酶(dapB)、二氨基庚二酸脱羧酶(lysA)、二氨基庚二酸脱氢酶(ddh)(美国专利第6,040,160号)、磷酸烯醇丙酮酸羧化酶(ppc)、天冬氨酸氨基转移酶(aspC)、二氨基庚二酸差向异构酶(dapF)、天冬氨酸半醛脱氢酶(asd)、四氢吡啶二羧酸琥珀酰酶(dapD)(tetrahydrodipicolinicacid succinylase)、琥珀酰二氨基庚二酸脱酰酶(dapE)(succinyl di amino pimelic acid deacylase)以及天冬氨酸酶基因(aspA)(EP1253195A)。在这些酶中,特别优选为二氢吡啶二羧酸还原酶、二氨基庚二酸脱羧酶、二氨基庚二酸脱氢酶、磷酸烯醇丙酮酸羧化酶、天冬氨酸氨基转移酶、二氨基庚二酸差向异构酶、天冬氨酸半醛脱氢酶、四氢吡啶二羧酸琥珀酰酶、以及琥珀酰二氨基庚二酸脱酰酶。此外,可以增加在亲本株中下述基因的表达水平:与能量效率相关的基因(cyo)(EP 1170376A)、编码烟酰胺核苷酸转氢酶的基因(pntAB)(美国专利第5,830,716号)、ybjE基因(WO2005/073390)、或它们的组合。

作为用于衍生L-氨基酸生产菌的亲本株的例子,可以列举催化通过从L-氨基酸生物合成途径分支而生成L-赖氨酸以外的化合物的反应的酶的活性减少或者缺损的菌株。作为催化通过从L-赖氨酸生物合成途径分支而生成L-赖氨酸之外的化合物的反应的酶的例子,可以列举出高丝氨酸脱氢酶、赖氨酸脱羧酶(美国专利第5,827,698号)、和苹果酸酶(WO2005/010175)。

对于酶活性的降低而言,可以通过例如、使染色体上的目标酶基因的编码区域的一部分或者全部缺损、以及向编码区域中插入其他序列来实现。这样的手段也称为基因破坏。此外,通过修饰目标基因的启动子或shine-dalgarno(SD)序列等表达调节序列等来降低目标基因的表达,也可以使该基因失活。表达的降低中包括转录的降低和翻译的降低。此外,对表达调节序列以外的非翻译区的修饰也可以降低基因表达量。

而且,还可以缺失包括染色体上的目标基因的前后序列的整个目标基因。此外,所述目标基因的失活还可以这样完成:通过向染色体上的目标基因的编码区域导入氨基酸取代(错义突变)、或者导入终止密码子(无义突变)、或者导入添加或缺失一~二个核苷酸的移码突变(Journal of biologicalChemistry 272:8611-8617(1997),Proceedings of the National Academy ofSciences,USA 955511-5515(1998),Journal of Biological Chemistry 266,20833-20839(1991))。

可以举出大肠杆菌WC196ΔcadAΔldcC/pCABD2作为优选的L-赖氨酸生产菌株(WO2006/078039)。该菌株为从WC196菌株出发,破坏其编码赖氨酸脱羧酶的cadA以及ldcC基因,并向其导入含有赖氨酸生物合成系统基因的pCABD2质粒(美国专利第6,040,160号)而构建的菌株。WC196菌株为从来源于大肠杆菌K-12的W3110菌株获取的菌株,该菌株为用突变型lysC基因取代W3110菌株的染色体上的野生型lysC基因后,并通过赋予以AEC抗性而培育的菌株(美国专利5,827,698),该突变型lysC基因为编码用异亮氨酸取代了第352位的苏氨酸从而解除了L-赖氨酸的反馈抑制的天冬氨酸激酶III的突变型lysC基因(美国专利第5,661,012号)。WC196菌株被命名为大肠杆菌AJ13069,并于1994年12月6日保藏在工业技术院生命工学工业技术研究所(现为独立行政法人产业技术综合研究所专利微生物保藏中心,邮编305-8566,日本茨城县筑波市东1丁目1番地1中央第6),保藏号为FERM P-14690。其后根据布达佩斯条约的规定于1995年9月29日转为国际保藏,并赋予保藏号FERM BP-5252(美国专利第5,827,698号)。WC196ΔcadAΔldcC本身也为优选的L-赖氨酸生产菌株。WC196ΔcadAΔldcC被命名为AJ110692,于2008年10月7日在独立行政法人产业技术综合研究所专利微生物保藏中心(邮编305-8566,日本茨城县筑波市东1丁目1番地1中央第6)进行国际保藏,并赋予保藏号FERM BP-11027。

pCABD2为含有下述基因的质粒:编码具有解除了L-赖氨酸反馈抑制的突变的编码大肠杆菌来源的二氢吡啶二羧酸合成酶(DDPS)的突变型dapA基因、编码具有解除了L-赖氨酸反馈抑制的突变的来源于大肠杆菌的天冬氨酸激酶III的突变型lysC基因、编码大肠杆菌来源的二氢吡啶二羧酸还原酶的dapB基因、编码乳发酵短杆菌来源的二氨基庚二酸脱氢酶的ddh基因(国际公开第WO95/16042、WO01/53459号小册子)。

L-亮氨酸生产菌

L-亮氨酸生产菌或者用于衍生L-亮氨酸生产菌的亲本株的实例可以列举出、但不限于下述属于埃希氏菌属的菌株,如对亮氨酸有抗性的大肠杆菌菌株(例如,菌株57(VKPM B-7386,美国专利第6,124,121号))或对亮氨酸类似物(包括β-2-噻吩基丙氨酸、3-羟基亮氨酸、4-偶氮亮氨酸、5,5,5-三氟亮氨酸等)有抗性的大肠杆菌菌株(特公昭62-34397号和特开平8-70879号)、通过WO96/06926中描述的基因工程方法获得的大肠杆菌菌株;大肠杆菌H-9068(特开平8-70879号)等。

可以通过增加涉及L-亮氨酸生物合成的一种以上的基因的表达来改进本发明中使用的细菌。这些基因的实例可优选列举以编码解除了L-亮氨酸反馈抑制的异丙基苹果酸合酶的突变leuA基因(美国专利第6,403,342号)为代表的、leuABCD操纵子中的基因。此外,可以通过增加编码从细菌细胞分泌L-氨基酸的蛋白质的一种以上的基因的表达来改进本发明中使用的细菌。这类基因的实例包括b2682和b2683基因(ygaZH基因)(EP1239041A2)。

L-组氨酸生产菌

L-组氨酸生产菌或者用于衍生L-组氨酸生产菌的亲本株的实例可以列举出,但不限于下述属于埃希氏菌属的菌株,如大肠杆菌24菌株(VKPMB-5945,RU2003677);大肠杆菌80菌株(VKPM B-7270,RU2119536);大肠杆菌NRRL B-12116-B12121(美国专利第4,388,405号);大肠杆菌H-9342(FERM BP-6675)和H-9343(FERM BP-6676)(美国专利第6,344,347号);大肠杆菌H-9341(FERM BP-6674)(EP1085087);大肠杆菌AI80/pFM201(美国专利第6,258,554号)等。

L-组氨酸生产菌或者用于衍生L-组氨酸生产菌的亲本株的实例还可以列举出,编码L-组氨酸生物合成系统酶的一种以上的基因的表达增加的菌株。作为涉及的基因,可以列举出,ATP磷酸核糖基转移酶基因(hisG)、磷酸核糖基AMP环化水解酶基因(hisI)、磷酸核糖基AMP环化水解酶基因(hisI)、磷酸核糖基亚氨甲基-5-氨基咪唑氨甲酰核糖核苷酸异构酶基因(hisA)、酰胺转移酶基因(hisH)、组氨醇磷酸氨基转移酶基因(hisC)、组氨醇磷酸酶基因(hisB)、组氨醇脱氢酶基因(hisD)等。

已知hisG和hisBHAFI编码的L-组氨酸生物合成酶被L-组氨酸所抑制,因此还可以通过向ATP磷酸核糖基转移酶基因(hisG)中导入诱导对反馈抑制有抗性的突变来有效地增加生产L-组氨酸的能力(俄罗斯专利2003677和2119536)。

具有L-组氨酸生产能力的菌株具体实例可以列举出FERM-P 5038和5048,已经向其中导入了携带编码L-组氨酸生物合成酶的DNA的载体(特开昭56-005099号),导入了用于氨基酸输送的基因的大肠杆菌菌株(EP1016710A),赋予了磺胺胍、DL-1,2,4-三唑-3-丙氨酸和链霉素抗性的大肠杆菌80菌株(VKPM B-7270,俄罗斯专利2119536)等。

L-谷氨酸生产菌

L-谷氨酸生产菌或者用于衍生L-谷氨酸生产菌的亲本株的实例,可以列举出,但不限于大肠杆菌VL334thrC+(EP 1172433)等属于埃希氏菌属的菌株。大肠杆菌VL334(VKPM B-1641)是L-异亮氨酸和L-苏氨酸营养缺陷型菌株,并且在thrC和ilvA基因有突变(美国专利4,278,765)。利用可在野生型大肠杆菌菌株K12(VKPM B-7)细胞中增殖的噬菌体P1,通过常规转化方法来转移thrC基因的野生型等位基因。结果,获得了L-异亮氨酸营养缺陷型的L-谷氨酸生产菌VL334thrC+(VKPM B-8961)。

L-谷氨酸生产菌或者用于衍生L-谷氨酸生产菌的亲本株的实例,可以列举出,但不限于下述菌株,所述菌株为L-谷氨酸生物合成系统酶的1种或者2种以上的活性被增强的菌株。涉及的基因的实例可以列举出,谷氨酸脱氢酶(gdhA)、谷氨酰胺合酶(glnA)、谷氨酸合酶(gltAB)、异柠檬酸脱氢酶(icdA)、顺乌头酸水合酶(acnA,acnB)、柠檬酸合酶(gltA)、甲基柠檬酸合酶(prpC)、磷酸烯醇丙酮酸羧化酶(ppc)、丙酮酸脱氢酶(aceEF,lpdA)、丙酮酸激酶(pykA,pykF)、磷酸烯醇丙酮酸合酶(ppsA)、烯醇化酶(eno)、磷酸甘油变位酶(pgmA,pgmI)、磷酸甘油酸激酶(pgk)、甘油醛-3-磷酸脱氢酶(gapA)、丙糖磷酸异构酶(tpiA)、果糖二磷酸醛缩酶(fbp)、磷酸果糖激酶(pfkA,pfkB)、葡糖磷酸异构酶(pgi)等。这些酶中,优选谷氨酸脱氢酶、柠檬酸合酶、磷酸烯醇丙酮酸羧化酶以及甲基柠檬酸合酶。

经修饰而增加了柠檬酸合成酶(citrate synthetase)基因、磷酸烯醇丙酮酸羧化酶基因和/或谷氨酸脱氢酶基因的表达的菌株的实例可以列举出在EP1078989A、EP955368A和EP952221A中公开的那些菌株。

L-谷氨酸生产菌或用于衍生L-谷氨酸生产菌的亲本株的实例可以列举出如下菌株,该菌株为减少或缺损催化从L-谷氨酸生物合成途径中分支并合成L-谷氨酸以外的化合物的酶的活性的菌株。作为这样的酶的实例,可以列举出,异柠檬酸裂合酶(aceA)、α-酮戊二酸脱氢酶(sucA)、磷酸乙酰转移酶(pta)、乙酸激酶(ack)、乙酰羟酸合酶(ilvG)、乙酰乳酸合酶(ilvI)、甲酸乙酰转移酶(pfl)、乳酸脱氢酶(ldh)、谷氨酸脱羧酶(gadAB)等。α-酮戊二酸脱氢酶活性的缺损、以及α-酮戊二酸脱氢酶活性的降低的属于埃希氏菌属的细菌、以及获得这些细菌的方法在美国专利第5,378,616号以及第5,573,945号中有所记载。

作为具体实例可以列举出下述细菌。

大肠杆菌W3110sucA::Kmr

大肠杆菌AJ12624(FERM BP-3853)

大肠杆菌AJ12628(FERM BP-3854)

大肠杆菌AJ12949(FERM BP-4881)

大肠杆菌W3110sucA::Kmr是通过破坏大肠杆菌W3110的α-酮戊二酸脱氢酶基因(下面,也称为“sucA基因”)而得到的菌株。该菌株的α-酮戊二酸脱氢酶完全缺损。

L-谷氨酸生产菌的其他实例还可以列举出属于埃希氏菌属,并且具有对天冬氨酸代谢拮抗物的抗性的细菌。这些菌株也可以是α-酮戊二酸脱氢酶缺损的菌株,可以列举出,例如大肠杆菌AJ13199(FERM BP-5807)(美国专利第5,908,768号)、进一步降低了L-谷氨酸分解能力的FERM P-12379(美国专利第5,393,671号);AJ13138(FERM BP-5565)(美国专利第6,110,714号)等。

作为Pantoea ananatis的L-谷氨酸生产菌的实例,可以列举出Pantoeaananatis AJ13355株。该菌株是作为低pH下能够在含有L-谷氨酸和碳源的培养基中增殖的菌株从静冈县磐田市的土壤中分离出来的菌株。Pantoeaananatis AJ13355株已于1998年2月19日保藏于独立行政法人产业技术综合研究所专利生物保藏中心(地址:邮政编码305-8566日本茨城县筑波市东1丁目1番地1中央第6),保藏号为FERM P-16644,并于1999年1月11日转为基于布达佩斯条约的国际保藏,并给予保藏号FERM BP-6614。而且,该菌株在分离时被鉴定为成团肠杆菌(Enterobacter agglomerans),并当作成团肠杆菌AJ13355进行了保藏。但是,近年来,基于16S rRNA核苷酸序列分析等,该细菌被重新分类为Pantoea ananatis。

此外,作为Pantoea ananatis的L-谷氨酸生产菌,可以列举出α-酮戊二酸脱氢酶(αKGDH)活性缺损、或者αKGDH活性降低的属于泛菌属的细菌。作为这样的菌株有:AJ13355和αKGDH-E1亚基基因(sucA)缺损而得到的菌株AJ13356(美国专利第6,331,419号),以及从AJ13355株中作为粘液质低生产突变菌株选择出来的SC17株来源的sucA基因缺损株SC17sucA(美国专利第6,596,517号)。AJ13355株已于1998年2月19日保藏于工业技术院生命工学工业技术研究所(现为产业技术综合研究所专利生物保藏中心,邮政编码305-8566茨城县筑波市东1丁目1番地1中央第6),保藏号为FERMP-16645,并于1999年1月11日转为基于布达佩斯条约的国际保藏,并给予保藏号FERM BP-6616。AJ13355以及AJ13356在上述的保藏机构中是作为Enterobacter agglomerans保藏的,但在本说明书中,记载为Pantoeaananatis。此外,SC17sucA株的内部编号为AJ417株,已于2004年2月26日保藏于产业技术综合研究所专利生物保藏中心,保藏号FERM BP-08646。

此外,作为Pantoea ananatis的L-谷氨酸生产菌,可以列举出SC17sucA/RSFCPG+pSTVCB菌株、AJ13601菌株、NP106菌株以及NA1菌株。SC17sucA/RSFCPG+pSTVCB株是在SC17sucA株中导入了包含大肠杆菌来源的柠檬酸合酶基因(gltA)、磷酸烯醇丙酮酸羧化酶基因(ppsA)和谷氨酸脱氢酶基因(gdhA)的质粒RSFCPG,以及导入了包含乳发酵短杆菌来源的柠檬酸合酶基因(gltA)的质粒pSTVCB而得到的菌株。AJ13601菌株是从该SC17sucA/RSFCPG+pSTVCB株中作为低pH下显示出对高浓度L-谷氨酸的抗性的菌株而选择出的菌株。此外,NP106株是如实施例所述那样,质粒RSFCPG+pSTVCB从AJ13601株脱落而得到的菌株。AJ13601菌株已于1999年8月18日保藏于独立行政法人产业技术综合研究所专利生物保藏中心(地址:邮政编码305-8566日本茨城县筑波市东1丁目1番地1中央第6),保藏号为FERM P-17516,并于2000年7月6日转为基于布达佩斯条约的国际保藏,并给予保藏号FERM BP-7207。

L-苯丙氨酸生产菌

L-苯丙氨酸生产菌或者用于衍生L-苯丙氨酸生产菌的亲本株的实例,可以列举出,但不限于下述属于埃希氏菌属的菌株,分支酸变位酶-预苯酸脱氢酶以及酪氨酸阻遏物缺损的E.coli AJ12739(tyrA::Tn10,tyrR)(VKPMB-8197)(WO03/044191),携带了编码解除了反馈抑制的分支酸变位酶-预苯酸脱氢酶的突变型pheA34基因的E.coli HW1089(ATCC 55371)(美国专利第5,354,672号),E.coli MWEC101-b(KR8903681)、E.coli NRRL B-12141、NRRL B-12145、NRRL B-12146以及NRRL B-12147(美国专利第4,407,952号)等。此外,也可以使用携带了编码解除了反馈抑制的分支酸变位酶-预苯酸脱氢酶基因的大肠杆菌K-12[W3110(tyrA)/pPHAB](FERM BP-3566)、大肠杆菌K-12[W3110(tyrA)/pPHAD](FERM BP-12659)、大肠杆菌K-12[W3110(tyrA)/pPHATerm](FERM BP-12662)以及AJ 12604和命名为大肠杆菌K-12[W3110(tyrA)/pBR-aroG4,pACMAB](FERM BP-3579)作为亲本株(EP 488424B1)。此外,此外,还可使用由yedA基因或yddG基因编码的蛋白质的活性增加的属于埃希氏菌属的L-苯丙氨酸生产菌(美国专利申请公开2003/0148473A1以及2003/0157667A1、WO03/044192)。

L-色氨酸生产菌

L-色氨酸生产菌和用于衍生L-色氨酸生产菌的亲本株的实例,可以列举出,但不限于下述属于埃希氏菌属的菌株,如大肠杆菌JP4735/pMU3028(DSM10122)和JP6015/pMU91(DSM10123),其色氨酰-tRNA合成酶缺损,该酶由突变的trpS基因编码(美国专利第5,756,345号);大肠杆菌SV164(pGH5),其具有编码对丝氨酸反馈抑制有抗性的磷酸甘油酸脱氢酶的serA等位基因和编码对色氨酸反馈抑制有抗性的邻氨基苯甲酸合酶(anthranilate synthase)的trpE等位基因(美国专利第6,180,373号);色氨酸酶缺陷的大肠杆菌AGX17(pGX44)(NRRL B-12263)和AGX6(pGX50)aroP(NRRL B-12264)(美国专利第4,371,614号);磷酸烯醇丙酮酸的生产能力增加的大肠杆菌AGX17/pGX50,pACKG4-pps(WO9708333,美国专利第6,319,696号)等。还可以使用由yedA基因或yddG基因编码的蛋白质活性增强的属于埃希氏菌属的L-色氨酸生产菌(美国专利申请公开2003/0148473A1和2003/0157667A1)。

L-色氨酸生产菌和用于衍生L-色氨酸生产菌的亲本株的实例还可以列举出下述菌株,该菌株的从邻氨基苯甲酸合酶(trpE)、磷酸甘油酸脱氢酶(serA)、3-脱氧-D-阿拉伯庚酮醛酸-7-磷酸合酶(3-デオキシ-D-アラビノヘプツロン酸-7-リン酸シンタ一ゼ)(aroG)、3-脱氢奎宁酸合酶(aroB)、莽草酸脱氢酶(aroE)、莽草酸激酶(aroL)、5-烯醇丙酮酰莽草酸3-磷酸合酶(5-enolpyruvylshikimate 3-phosphate synthase)(aroA)和分支酸合酶(aroC)、预苯酸脱水酶、分支酸变位酶以及色氨酸合酶(trpAB)中选择1种或2种以上的酶的活性被增强。预苯酸脱水酶以及分支酸变位酶作为2个功能酶(CM-PD),由pheA基因编码。在这些酶中,特别优选磷酸甘油酸脱氢酶、3-脱氧-D-阿拉伯庚酮醛酸-7-磷酸合酶、3-脱氢奎宁酸合酶、莽草酸脱水酶、莽草酸激酶、5-烯醇丙酮酰莽草酸3-磷酸合酶、分支酸合酶、预苯酸脱水酶、分支酸变位酶-预苯酸脱氢酶。邻氨基苯甲酸合酶和磷酸甘油酸脱氢酶两者均受L-色氨酸和L-丝氨酸的反馈抑制,因此也可以向这些酶中导入使反馈抑制解除的突变。具有此类突变的菌株的具体实例包括具有脱敏的邻氨基苯甲酸合酶的大肠杆菌SV164菌株和通过将质粒pGH5(WO 94/08031)转入大肠杆菌SV164获得的菌株,所述质粒pGH5包含突变的serA基因,该突变的serA基因编码反馈抑制被解除了的磷酸甘油酸脱氢酶。

L-色氨酸生产菌或者用于衍生L-色氨酸生产菌的亲本株的实例还可以列举出,导入了色氨酸操纵子的菌株,所述色氨酸操纵子包含编码抑制解除型邻氨基苯甲酸合酶的基因(特开昭57-71397号,特开昭62-244382号,美国专利4,371,614)。此外,可以也通过增加色氨酸操纵子(trpBA)中编码色氨酸合酶的基因的表达来赋予L-色氨酸生产能力。色氨酸合酶由α和β亚基组成,这两种亚基分别由trpA和trpB编码。另外,还可以通过增强异柠檬酸裂解酶-苹果酸合酶操纵子的表达来改进L-色氨酸生产能力(WO2005/103275)。

L-脯氨酸生产菌

L-脯氨酸生产菌或者用于衍生L-脯氨酸生产菌的亲本株的实例,可以列举出,但不限于下述埃希氏菌属的菌株,如ilvA基因缺陷并且能够产生L-脯氨酸的大肠杆菌702ilvA(VKPM B-8012)(EP 1172433)等。

可以通过增强涉及L-脯氨酸生物合成的1种以上的基因的表达来改进本发明中使用的细菌。用于L-脯氨酸生产菌的优选基因的实例可以列举出,编码解除了L-脯氨酸反馈抑制的谷氨酸激酶的proB基因(德国专利第3127361号)。此外,可以通过增加编码从细菌细胞分泌L-氨基酸的蛋白质的1种以上的基因的表达来改进本发明中使用的细菌。这些基因包括b2682和b2683基因(ygaZH基因)(EP1239041A2)。

具有L-脯氨酸生产能力的属于埃希氏菌属的细菌的实例:NRRLB-12403和NRRL B-12404(英国专利第2075056号),VKPM B-8012(俄罗斯专利申请2000124295),德国专利第3127361中描述的质粒突变体,Bloom F.R.等(The 15th Miami Winter Symposium,1983,p.34,等)。

L-精氨酸生产菌

L-精氨酸生产菌或用于衍生L-精氨酸生产菌的亲本株,可以列举出,但不限于下述属于埃希氏菌属的菌株,如大肠杆菌237菌株(VKPM B-7925)(美国专利申请公开2002/058315A1),及携带了突变的N-乙酰谷氨酸合酶(N-acetylglutamate synthase)的衍生菌株(俄罗斯专利申请第2001112869号),大肠杆菌382菌株(VKPM B-7926)(EP1170358A1),导入了编码N-乙酰谷氨酸合成酶(N-acetylglutamate synthetase)的argA基因的精氨酸生产株(EP1170361A1)等。

L-精氨酸生产菌或用于衍生L-精氨酸生产菌的亲本株,可以列举出,编码L-精氨酸生物合成酶的1种以上基因的表达增加的菌株。涉及的基因的实例可以列举出N-乙酰谷氨酰磷酸还原酶基因(argC)、鸟氨酸乙酰转移酶基因(argJ)、N-乙酰谷氨酸激酶基因(argB)、乙酰鸟氨酸转氨酶基因(argD)、鸟氨酸氨甲酰基转移酶基因(argF)、精氨琥珀酸合成酶基因(argG)、精氨琥珀酸裂合酶基因(argH)和氨甲酰基磷酸合成酶基因(carAB)。

L-缬氨酸生产菌

L-缬氨酸生产菌或用于衍生L-缬氨酸生产菌的亲本株的实例可以列举出,但不限于经修饰而过量表达ilvGMEDA操纵子的菌株(美国专利第5,998,178号)。优选将衰减所需的ilvGMEDA操纵子的区域移除以使操纵子的表达不会被产生的L-缬氨酸所削弱。此外,优选将操纵子中的ilvA基因破坏从而降低苏氨酸脱氨酶的活性。

L-缬氨酸生产菌或用于衍生L-缬氨酸生产菌的亲本株的实例还可以列举出,具有氨酰t-RNA合成酶突变的突变株(美国专利第5,658,766号)。例如,可以使用大肠杆菌VL1970,该菌株在编码异亮氨酸tRNA合成酶的ileS基因中具有突变。已将大肠杆菌VL1970在1988年6月24日保藏在俄罗斯国立工业微生物保藏中心(VKPM)(1Dorozhny Proezd.,1Moscow117545,Russia),保藏号为VKPM B-4411。

此外,还可以使用生长需要硫辛酸(lipoic acid)的突变株和/或缺乏H+-ATP酶的突变株(WO96/06926)作为亲本株。

L-异亮氨酸生产菌

L-异亮氨酸生产菌或用于衍生L-异亮氨酸生产菌的亲本株的实例可以列举出、但不限于对6-二甲基氨基嘌呤有抗性的突变株(特开平5-304969号),对异亮氨酸类似物如硫代异亮氨酸(thiaisoleucine)和异亮氨酸氧肟酸具有抗性的突变株,以及对DL-乙硫氨酸(DL-ethionine)和/或精氨酸氧肟酸具有抗性的突变株(特开平5-130882号)。此外,还可以使用以编码涉及L-异亮氨酸生物合成的蛋白质(如苏氨酸脱氨酶、乙酰羟酸合酶(acetohydroxate synthase)等)的基因转化的重组菌株(特开平2-458号,FR0356739,和美国专利第5,998,178号)作为亲本株。

L-酪氨酸生产菌

作为酪氨酸生产菌的例子,可以列举出具有不受酪氨酸抑制的脱敏型预苯酸脱水酶基因(tyrA)的埃希氏菌属细菌(欧洲专利申请公开1616940号公报)。

为了提高本发明中使用的细菌的甘油同化型,可以弱化glpR基因的表达(EP1715056),也可以强化glpA、glpB、glpC、glpD、glpE、glpF、glpG、glpK、glpQ、glpT、glpX、tpiA、gldA、dhaK、dhaL、dhaM、dhaR、fsa以及talC基因等甘油代谢基因(EP1715055A)的表达。

(突变型yeaS基因)

本发明的细菌可以通过修饰如上所述具有L-氨基酸生产能力的属于肠杆菌科的细菌,从而使其携带具有特定突变的突变型yeaS基因而获得。但是,也可以在对细菌进行上述修饰后,赋予其L-氨基酸生产能力。对于“特定的突变”将在后面进行描述。将不具有所述特定突变的yeaS基因称为“野生型yeaS基因”。对于不具有所述特定突变的yeaS基因,只要具有增强其在肠杆菌中的表达时、能够使L-半胱氨酸的生产能力与非修饰株相比有所提高的活性即可,即使有其他的突变,也称为野生型yeaS基因。

下面,针对于yeaS基因进行说明。

作为本发明的yeaS基因,具体地可以列举出含有SEQ ID NO:1中所示的碱基序列的基因。SEQ ID NO:1表示的是大肠杆菌的野生型yeaS基因的碱基序列。此外,SEQ ID NO:1表示了该基因编码的氨基酸序列。

已知通过增强yeaS基因的表达,可以提高各种氨基酸的生产能力(FEBSLett.579.4629-4634(2005)),但是对于L-半胱氨酸和yeaS基因之间的关系尚属未知。本发明人发现通过增强yeaS基因的表达,可以提高L-半胱氨酸的生产能力。

yeaS基因,只要编码具有下述活性的蛋白质即可,所述活性是指:当增强该蛋白质在肠杆菌中的表达时,与非修饰株相比,能够使L-氨基酸生产能力提高。yeaS基因也可以为编码具有在上述氨基酸序列中,在1个或数个位置上取代、缺失、插入或添加1个或者数个氨基酸而得到的氨基酸序列的蛋白质的基因。在这种情况下,增强在肠杆菌中的表达时与非修饰株相比使L-氨基酸生产能力提高的活性的含义是指,与取代、缺失、插入或添加1个或数个氨基酸之前的蛋白质相比,保持了70%以上的活性,优选保持了80%以上,更优选保持了90%以上的活性。而且,上述“1个或数个”根据氨基酸残基在蛋白质的立体结构中的位置或者氨基酸残基的种类有所不同,但具体来说优选为1~20个、更优选为1~10个,更为优选为1~5个。

上述的1个或数个氨基酸的取代、缺失、插入或者添加为可以正常维持蛋白质的功能的保守突变。保守突变的代表为保守取代。保守取代是指,当取代部位为芳香族氨基酸时,在Phe、Trp、Tyr之间相互取代;当取代部位为疏水性氨基酸时,在Leu、Ile、Val间之间相互取代;当为极性氨基酸时,在Gln、Asn之间相互取代;当为碱性氨基酸时,在Lys、Arg、His之间相互取代;当为酸性氨基酸时,在Asp、Glu之间相互取代;当为具有羟基的氨基酸时,为在Ser、Thr之间相互取代的突变。可视为保守取代的取代具体的可以列举出,用Ser或Thr取代Ala、用Gln、His或Lys取代Arg、用Glu、Gln、Lys、His或Asp取代Asn、用Asn、Glu或Gln取代Asp、用Ser或Ala取代Cys、用Asn、Glu、Lys、His、Asp或Arg取代Gln、用Gly、Asn、Gln、Lys或Asp取代Glu、用Pro取代Gly、用Asn、Lys、Gln、Arg或Tyr取代His、用Leu、Met、Val或Phe的取代Ile、用Ile、Met、Val或Phe取代Leu、用Asn、Glu、Gln、His或Arg取代Lys、用Ile、Leu、Val或Phe取代Met、用Trp、Tyr、Met、Ile或Leu取代Phe、用Thr或Ala取代Ser、用Ser或Ala的取代Thr、用Phe或Tyr的取代Trp、用His、Phe或Trp取代Tyr、以及用Met、Ile或Leu的取代Val。此外,就上述这样的氨基酸的取代、缺失、插入、添加或者倒位等而言,还包括因基因来源的细菌的个体差异、种间差异等情况而天然发生的突变(mutant或variant)而产生的那些取代、缺失、插入、添加或者倒位。

作为编码保持提高宿主细胞的L-氨基酸生产能力的活性、且具有取代、缺失、插入或添加1个或者数个氨基酸而得到的氨基酸序列的YeaS蛋白质的基因,具体来说,可以列举出,编码具有选自下述突变中的1种或2种以上突变的YeaS蛋白质等的基因,所述突变是指:在SEQ ID NO:2中,具第11位的色氨酸残基被甘氨酸取代的突变、第33位的赖氨酸残基被精氨酸取代的突变、第52位的异亮氨酸残基被缬氨酸取代的突变、第59位的苯丙氨酸残基被丝氨酸取代的突变、第60位的亮氨酸残基被谷氨酰胺取代的突变、第65位的缬氨酸残基被谷氨酸取代的突变、第72位苏氨酸残基被丙氨酸取代的突变、第77位天冬酰胺残基被丝氨酸取代的突变、第85位苯丙氨酸残基被异亮氨酸取代的突变、第86位酪氨酸残基被苯丙氨酸取代。这些突变,在下述的实施例2中被推定为没有使活性降低的沉默突变。此外,保守突变并不仅限于上述突变,如实施例2所示的一样,从人为的向yeaS基因内导入随机突变而得到的突变体中,也可以获得编码下述YeaS蛋白质的基因,该YeaS蛋白质维持了增强在肠杆菌中的表达时使L-氨基酸生产能力提高的活性、且具有1个或数个氨基酸被取代而得到的氨基酸序列。

此外,也可以为下述蛋白质,该蛋白质与具有上述这样的保守突变的基因编码的氨基酸序列全体相比,具有80%以上的同源性,优选具有90%以上、更优选具有95%以上、更为优选具有97%以上、特别优选具有99%以上的同源性,且增强其在肠杆菌中的表达时与非修饰株相比具有使L-半胱氨酸生产能力提高的活性。编码上述这样的与yeaS具有同源性的蛋白质的基因(yeaS同源物)的序列信息,可以以上述大肠杆菌菌株的野生型yeaS基因作为提问序列,使用BLAST检索或FASTA检索,从公开的数据库中容易地获取,可以通过使用基于该公知的基因序列作成的寡核苷酸作为引物获得yeaS同源物。而且,在本说明书中,“同源性(homoloyg)”有些情况下是指“同一性(identity)”。

此外,yeaS基因只要编码具有增强其在肠杆菌中的表达时与非修饰株相比具有使L-氨基酸生产能力提高的活性的蛋白质即可,还可以为与上述碱基序列互补的序列、或者能够由该碱基序列制备的探针在严格条件下杂交的基因。“严格条件”可以列举出下述条件,例如在60℃,1×SSC、0.1%SDS优选0.1×SSC、0.1%SDS相当的盐浓度下,洗涤1次优选2~3次的条件。

上述杂交用探针也可以为基因的互补序列的一部分。这样的探针,可以以基于公知的基因序列制得的寡核苷酸为引物,以包含这样的碱基序列的DNA片段为模板,通过PCR反应来制备。当作为探针使用300bp左右长度的DNA片段时,上述杂交的洗涤条件可以列举出为50℃、2×SSC、0.1%SDS。

就增加在肠杆菌中的表达时与非修饰株相比具有使L-氨基酸生产能力提高的活性而言,是指赋予下述能力的活性,所述能力为增加了在肠杆菌中的表达时,与非修饰株,例如与野生株或亲本株相比,可以生产更多数量的L-氨基酸,例如L-半胱氨酸,并在培养基中积累的能力,优选赋予可以积累高达0.1g/L以上、更优选高达0.2g/L以上、特别优选高达0.3g/L以上L-氨基酸的能力的活性。

是否具有增加在肠杆菌中的表达时与非修饰株相比具有使L-氨基酸生产能力提高的活性,可以通过下述方法确认,基于野生株或亲本株制作使编码该蛋白质的基因的表达增强的细菌,将其在培养基中培养,并定量培养基中积累的L-氨基酸的量。L-氨基酸为L-半胱氨酸时,野生株或亲本株可以列举出在大肠杆菌MG1655菌株中使编码解除了反馈抑制的突变型SAT基因增强了的菌株。

为了得知是否具有增加在肠杆菌中的表达时与非修饰株相比具有使L-氨基酸生产能力提高的活性,也可以通过该基因的表达被增强了的细菌在含有比野生株或亲本株浓度更高的L-氨基酸的培养基中的生长繁育比野生株或亲本株的生长繁育更为良好来确认,即,通过调查L-氨基酸抗性来容易地得到确认。L-氨基酸为L-半胱氨酸时,具体来说,可以在含有0.1~10mM左右的L-半胱氨酸的培养基中接种细菌,在10小时~120小时后的适当时间测定菌落的直径,通过该数值大于野生株或亲本株进行确认。本发明人等发现与非修饰株相比使宿主细胞的L-半胱氨酸生产能力提高的活性与L-半胱氨酸抗性之间具有相当的相关关系。

在所述突变型yeaS基因中的“特定突变”是指,具体来说从下述(I)~(III)中选择的突变。

(I)在yeaS基因编码的蛋白质中,第28位的苏氨酸残基被苏氨酸以外的氨基酸所取代的突变,

(II)在yeaS基因编码的蛋白质中,第137位的苯丙氨酸残基被苯丙氨酸以外的氨基酸所取代的突变,

(III)在yeaS基因编码的蛋白质中,第188位的亮氨酸残基被亮氨酸以外的氨基酸所取代的突变。

所述(I)~(III)的突变,具体来说,可以分别举出下述(i)~(iii)的突变。

(i)第28位的苏氨酸残基被天冬酰酰胺所取代的突变,

(ii)第137位的苯丙氨酸残基被丝氨酸、谷氨酰胺、丙氨酸、组氨酸、半胱氨酸以及甘氨酸中任一个所取代的突变,

(iii)第188位的亮氨酸残基被谷氨酰胺所取代的突变。

突变可以为上述任1种突变,也可以为任意的2种、或3种突变的组合。

特别优选的所述突变为,所述(ii)的突变中的第137位的苯丙氨酸残基被丝氨酸或谷氨酰胺所取代的突变。

所述(I)~(III)的突变中的第28位、第137位或第188位是指,不一定总是表示从yeaS基因编码的蛋白质(YeaSN)的N末端起算的绝对位置,有时还表示相对于SEQ ID NO:2中记载的氨基酸序列的相对位置。例如,在含有SEQ ID NO:2所示的氨基酸序列的YeaS蛋白质中,当第28位的N末端侧的位置发生一个氨基酸残基缺失时,所述第28位就变成了27位。在这样情况下,第27位的氨基酸残基在本发明中仍然是“第28位”的氨基酸残基。氨基酸取代的绝对位置,可以通过将对象的YeaS蛋白质的氨基酸序列和SEQ ID NO:2的氨基酸序列进行比对来决定。

向yeaS基因中导入(I)~(III)的各种突变可以通过下述方法实现,例如,通过定点突变法或重叠延伸法(overlap extension)等,向野生型YeaS基因的对应突变的密码子导入指定突变来实现。突变后的密码子只要是编码指定的氨基酸的密码子即可,没有特殊的限制,但优选使用在目的肠杆菌中使用频率较高的密码子。

向细菌的染色体上的yeaS基因中导入选自所述(I)~(III)中的突变,可以通过使含有突变点的突变型yeaS基因或其片段与染色体上的相当于yeaS基因的部分进行取代来进行。此外,也可以将突变型yeaS基因或含有该基因的载体转化到细菌中。在这种情况下,突变型yeaS基因可以携带在染色体上,也可以携带在质粒上。此外,染色体上的野生型yeaS基因可以是保持不变的,也可以为缺损的。

此外,细菌携带的突变型yeaS基因,可以为1个拷贝,也可以为2个拷贝或以上。并且,用于使突变型yeaS基因表达的启动子可以为野生型yeaS基因的启动子,也可以为其他启动子,例如lac启动子、trp启动子、trc启动子等。

作为用于转化的质粒,可以列举出能够在使用的微生物中自主复制的质粒。例如,作为在属于肠杆菌科的微生物中可以自主复制的质粒,可以列举出pUC19、pUC18、pBR322、RSF1010、pHSG299、pHSG298、pHSG399、pHSG398、pSTV28、pSTV29、pTWV228、pTWV229(pHSG、pSTV、pTWV可从TAKARABio公司获得),pMW119、pMW118、pMW219、pMW218(pMW可从NIIPONGENE公司获得)等。此外,作为棒状杆菌型细菌用的质粒,可以列举出pAM330(特开昭58-67699号公报)、pHM1519(特开昭58-77895号公报)、pSFK6(参考特开2000-262288号公报)、pVK7(美国专利申请公开说明书2003-0175912)、pAJ655、pAJ611、pAJ1844(特开昭58-192900号公报)、pCG1(特开昭57-134500号公报)、pCG2(特开昭58-35197号公报)、pCG4、pCG11(特开昭57-183799号公报)、pHK4(特开平5-7491号公报)等。

作为转化方法,可以举出例如:基于大肠杆菌K-12而报道的,用氯化钙处理受体菌细胞来增加DNA的透过性的方法(Mandel,M.和Higa,A.,J.Mol.Biol.1970,53,159-162),或者基于枯草芽孢杆菌而报道的,由处于增殖阶段的细胞制备感受态细胞并导入DNA的方法(如Duncan,C.H.,Wilson,G.A.和Young,F.E..,1997.Gene 1:153-167)。或者,也可以利用基于枯草杆菌、放线菌类和酵母而已知的,将DNA受体菌的细胞制备成容易导入重组DNA的原生质体或原生质球的状态,再将重组DNA导入DNA受体菌的方法(Chang,S.和Choen,S.N.,1979.Mol.Gen.Genet.168:111-115;Bibb,M.J.,Ward,J.M.和Hopwood,O.A.1978.Nature 274:398-400;Hinnen,A.,Hicks,J.B.和Fink,G.R.1978.Proc.Natl.Acad.Sci.USA 75:1929-1933)。此外,采用电脉冲法(特开平2-207791号公报)也能够进行微生物的转化。

此外,向细菌中导入突变型yeaS基因,可以像下面就突变型yeaS基因所描述的那样,通过向宿主微生物的染色体上导入而实现。为了向微生物的染色体上导入突变型yeaS基因,可以通过使用转座子或Mini-Mu向染色体上随机导入的方法(特开平2-109985号公报、US5,882,888EP805867B1),或者利用在染色体DNA上多拷贝存在的序列作为靶标,通过同源重组来进行。作为在染色体DNA上多拷贝存在的序列,可以利用重复DNA(repetitiveDNA)、存在于转座元件端部的反向重复序列。或者,可以通过采用Red驱动整合法(WO2005/010175)将目的基因导入到染色体上。此外,还可以使用P1噬菌体等噬菌体进行转导,或者利用接合转移载体将目的基因导入到染色体上。此外,如在WO03/040373中所记载的一样,还可以以生产目的物质时不必须的基因作为靶标导入突变型yeaS基因。在这样的方法中可以向靶标序列上1个拷贝或多个拷贝地导入突变型yeaS基因。

染色体上转移了目的基因的确认,可以通过使用具有与目的基因或其中的一部分相互补的序列的探针进行Southern杂交,或使用基于目的基因的序列制备的引物通过PCR等进行确认。

<2>本发明的L-氨基酸的生产方法

在培养基中培养通过上述方法得到的本发明的细菌,并通过从该培养基中采集L-氨基酸,可以生产L-氨基酸。L-氨基酸也可以为L-氨基酸的衍生物。当L-氨基酸为L-半胱氨酸时,作为L-半胱氨酸的衍生物,可以列举出上述的S-硫代半胱氨酸、噻唑烷衍生物、相当于该噻唑烷衍生物的硫代半酮缩醇等。

作为使用的培养基,可以列举出含有碳源、氮源、硫源、无机离子以及需要的其他有机成分的通常的培养基。

作为碳源,可以使用葡萄糖、果糖、蔗糖、甘油、糖蜜、淀粉水解物等糖类、富马酸、柠檬酸、琥珀酸等有机酸类。

作为氮源,可以使用硫酸铵、氯化铵、磷酸铵等无机铵盐、大豆水解物等有机氮、氨气、氨水等。

作为硫源,可以列举出硫酸盐、亚硫酸盐、硫化物、连二亚硫酸盐、硫代硫酸盐等无机硫化物。

作为有机微量营养源,优选适量含有维生素B1等必需物质或者酵母提取物等。除此之外,根据需要可以少量添加磷酸钾、硫酸镁、铁离子、锰离子等。

培养在需氧的条件下进行30~90小时较好,培养温度为25℃~37℃,且优选将培养中的pH控制在5~8的范围内。此外,可以使用无机或者有机的酸性或者碱性物质,以及氨气等来调节pH值。

就培养结束后从培养基溶液中采集L-氨基酸而言,在本发明中不需要特别的方法。本发明中采集出的L-氨基酸除了含有作为目标的L-氨基酸之外,还可以含有微生物菌体、培养基成分、水分以及微生物的代谢副产物等。采集的L-氨基酸的纯度为50%以上,优选为85%以上,特别优选为95%以上(US5,431,933,JP1214636B,US4,956,471,US4,777,051,US4946654,US5,840358,US6,238,714,US2005/0025878)。

可以通过组合已经公知的离子交换树脂法(Nagai,H.et al.:SeparationScience and Technology,39(16),3691-3710)、膜分离法(特开平9-164323号、特开平9-173792号)、晶析法(WO2008/078448、WO2008/078646)、以及其他的方法采集L-氨基酸。

通过上述方法得到的L-半胱氨酸,可以用来生产L-半胱氨酸的衍生物。作为L-半胱氨酸的衍生物包含甲基半胱氨酸、乙基半胱氨酸、羧甲基半胱氨酸(carbocysteine)、硫代半胱氨酸、乙酰半胱氨酸等。

此外,当L-半胱氨酸的噻唑烷衍生物在培养基中积累时,通过使噻唑烷衍生物和L-半胱氨酸之间的反应平衡向L-半胱氨酸一侧移动,可以生产得到L-半胱氨酸。此外,当S-硫代半胱氨酸在培养基中积累时,例如可以使用二硫苏糖醇等还原剂通过进行还原转化得到L-半胱氨酸。

实施例

以下,针对于本发明的实施例进行更具体的说明。

(实施例1)通过强化野生型YeaS使得L-半胱氨酸生产增加的效果

为了研究由于增强了在P.ananatis中野生型yeaS基因的表达而对于L-半胱氨酸生产产生的影响,构建了导入了编码突变型SAT的基因cysE5(美国专利申请第20050112731号)、且提高了yeaS基因的拷贝数的菌株。

首先,构建了用于构建上述菌株的质粒。其方法如下所示。

以大肠杆菌MG1655(ATCC No.47076)的染色体DNA为模板,使用P1(agctgagtcg acccccagga aaaattggtt aataac:SEQ ID NO:20)以及P2(agctgagcatgcttccaact gcgctaatga cgc:SEQ ID NO:21)作为引物,通过PCR获得了含有nlpD基因的启动子区域(以下,将野生型nlpD基因启动子记为“Pnlp0”)约300bp的DNA片段。在上述引物的5’末端和3’末端分别设计了限制性内切酶SalI以及PaeI的位点。PCR循环如下所述:95℃3分钟后,95℃60秒、50℃30秒、72℃40秒循环2次,94℃20秒、55℃20秒、72℃15秒循环25次,最后在72℃下5分钟。用SalI以及PaeI处理得到的片段,并将其插入到pMIV-5JS(特开2008-99668)的SalI-PaeI位点中,得到pMIV-Pnlp0质粒。在该质粒pMIV-Pnlp0中插入的Pnlp0启动子的PaeI-SalI片段的碱基序列如SEQ ID NO:5所示。

随后,以MG1655的染色体DNA为模板,使用P3(agctgatcta gaaaacagaatttgcctggc ggc:SEQ ID NO:22)和P4(agctgaggat ccaggaagag tttgtagaaa cgc:SEQ ID NO:23)作为引物,通过PCR获得了含有rrnB基因的终止子区域约300bp的DNA片段。在上述引物的5’末端分别设计了限制性内切酶XbaI以及BamHI的位点。PCR循环如下所述:95℃3分钟后,95℃60秒、50℃30秒、72℃40秒循环2次,94℃20秒、59℃20秒、72℃15秒循环25次,最后在72℃下5分钟。用XbaI以及BamHI处理得到的片段,并将其插入到pMIV-Pnlp0的XbaI-BamHI位点处从而得到pMIV-Pnlp0-ter质粒。

接下来,以MG1655的染色体DNA为模板,使用P5(agctgagtcg acgtgttcgctgaatacggg gt:SEQ ID NO:24)以及P6(agctgatcta gagaaagcat caggattgca gc:SEQ ID NO:25)作为引物,通过PCR获得了含有yeaS基因的约700bp的DNA片段。在上述引物的5’末端分别设计了限制性内切酶SalI以及XbaI的位点。PCR循环如下所述:95℃3分钟后,95℃60秒、50℃30秒、72℃40秒循环2次,94℃20秒、55℃20秒、72℃15秒循环25次,最后在72℃下5分钟。用SalI以及XbaI处理得到的片段,并将其插入到pMIV-Pnlp0-ter的SalI-XbaI位点处从而得到pMIV-Pnlp0-YeaS3质粒。由此,在pMIV-5JS载体上,构建了按照nlpD启动子、yeaS基因以及rrnB终止子的顺序连接的yeaS的表达单元。

为了通过修饰nlpD启动子的-10区域来得到更强的启动子,采用下述方法进行了-10区域的随机化。在nlpD启动子区域(图1)中存在两个推测为起启动子功能的区域,在图中分别由pnlp1和pnlp2表示。以质粒pMIV-Pnlp0为模板,使用P1以及P7(atcgtgaaga tcttttccag tgttnannag ggtgccttgc acggtnatnangtcactgg(“n-”表示可以为a,t,g,c中的任意一种),SEQ ID NO:26)作为引物,通过PCR获得了将包含于nlpD启动子的3’末端侧的-10区域(记为-10(Pnlp1))随机化而得的DNA片段(图1)。PCR循环如下所述:95℃3分钟后,95℃60秒、50℃30秒、72℃40秒循环2次,94℃20秒、60℃20秒、72℃15秒循环25次,最后在72℃下5分钟。

另一方面,同样地以质粒pMIV-Pnlp0为模板,使用P2以及P8(tggaaaagatcttcannnnn cgctgacctg cg(“n-”表示可以为a,t,g,c中的任意一种),SEQ IDNO:27)作为引物,通过PCR获得了将包含于nlpD启动子的5’末端侧的-10区域(记为-10(Pnlp2))随机化而得的DNA片段(图1)。PCR循环如下所述:95℃3分钟后,95℃60秒、50℃30秒、72℃40秒循环2次,94℃20秒、60℃20秒、72℃15秒循环25次,最后在72℃下5分钟。

可以通过在引物P7和P8上设计的BglII位点将得到的3’末端侧和5’末端侧的片段连接,并可以构建2个-10领域被随机化的完整nlpD启动子。以该片段为模板,使用P1以及P2作为引物,通过PCR获得了修饰型完整nlpD启动子的DNA片段。PCR循环如下所述:95℃3分钟后,95℃60秒、50℃30秒、72℃40秒循环2次,94℃20秒、60℃20秒、72℃15秒循环12次,最后在72℃下5分钟。

用在引物的5’末端上设计的限制性内切酶SalI以及PaeI处理扩增的片段,并通过将其插入到同样地用SalI以及PaeI处理的质粒pMIV-Pnlp0-YeaS3中,将质粒上的野生型nlpD启动子部位(Pnlp0)替换成突变型Pnlp。从其中选择了具有如图1所示的启动子序列(Pnlp8)的质粒,并将其命名为pMIV-Pnlp8-YeaS7。插入在该质粒中的Pnlp8启动子的PaeI-SalI片段的碱基序列如SEQ ID NO:6所示。同样地,将含有突变的nlpD启动子区域的DNA片段插入到用SalI以及PaeI处理了的质粒pMIV-Pnlp0-ter上,从而将该质粒上的nlpD启动子部位(Pnlp0的部分)替换为突变型Pnlp。将其中的一个质粒命名为pMIV-Pnlp23-ter。该质粒中插入的Pnlp23启动子的PaeI-SalI片段的碱基序列如SEQ ID NO:7所示。

随后,从pMW-Pomp-cysE5(WO2005007841)中,用PaeI、SacI将Pomp-cysE5盒(cassette)的部分切出,插入到pMIV-5JS的相同位点处,从而构建了pMIV-Pomp-CysE5。pMW-Pomp-cysE5为将编码连接于ompC基因启动子的突变型SAT的基因cysE5插入到pMW118中而得到的质粒。从pACYC184(GenBank/EMBL登录号X06403、可从NIIPONGENE公司获得)上,用XbaI、Eco88I将四环素抗性基因切出,将该基因片段通过克列诺片段(Klenow fragment)处理后,插入到pMIV-Pomp-CysE5的PvuI位点处,从而构建了pMT-Pomp-CysE5。接下来,用HindIII酶切pMIV-Pnlp8-YeaS7,并通过克列诺片段进行平滑末端化后,用NcoI进行酶切,将含有Pnlp8-YeaS-rrnB终止子的盒和氯霉素抗性标记的片段切出。将该片段和,同样以pMIV-5JS为骨架(backbone)的pMT-Pomp-CysE5的SmaI、NcoI酶切片段相连接,从而构建了pMT-EY2。pMT-EY2为在一个质粒上具有Pnlp8-YeaS-rrnB终止子盒和Pomp-CysE5盒的质粒。

为了研究增强野生型yeaS基因的表达对L-半胱氨酸生产所产生的效果,将按照上述方法构建的pMT-Pomp-CysE5和pMT-EY2导入P.ananatisSC17菌株(美国专利6596517),并对得到的转化菌株的L-半胱氨酸生产能力进行了评价。

在培养中使用了L-半胱氨酸生产培养基(组成:15g/L硫酸铵,1.5g/L磷酸二氢钾,1g/L硫酸镁七水合物,0.1g/L胰蛋白质胨,0.05g/L酵母提取物,0.1g/L氯化钠,20g/L碳酸钙,40g/L葡萄糖,20mg/L四环素)。

L-半胱氨酸生产培养按照下述规程进行。将SC17/pMT-PompCysE5菌株和SC17/pMT-EY2菌株在LB琼脂培养基上涂开,在34℃下进行过夜预培养,之后用接种环挑取平板的八分之一的菌体,并接种到已经放入大试管(内径23mm、长度20cm)的2mL的L-半胱氨酸培养基中,在220-230rpm下在32℃下进行振动培养,2天后结束培养。对培养基中产生的L-半胱氨酸的定量,通过Gaitonde,M.K.(Biochem J.1967Aug;104(2):627-33.)记载的方法进行。如表1所示,可以得知增强yeaS基因的表达,具有使L-半胱氨酸的生产量增加的效果。此外,在此定量的L-半胱氨酸除了L-半胱氨酸之外,还包括L-胱氨酸或它们的衍生物,例如S-硫代半胱氨酸、噻唑烷衍生物或者硫代半酮缩醇、或者它们的混合物,以下如果没有特别的记载,则通过本方法定量的L-半胱氨酸均具有相同含义。

[表1]

表1在SC17菌株中强化yeaS的效果

(实施例2)获得突变型yeaS基因和L-半胱氨酸生产增加效果

下面,为了获得与野生型YeaS相比使宿主细胞的L-半胱氨酸生产能力提高的活性较高的突变体,通过易错(error-prone)PCR人为地向yeaS基因内导入随机突变。

(1)yeaS的易错PCR和突变导入文库的制作

首先,对于向yeaS基因中导入1~3个突变的易错PCR的条件,在现有知识(Evert Bokma et al.,(2006)FEBS Letters 580:5339-5343、Zao et al.,(1998)Nat Biotechnol Mar;16(3):258-61)的基础上进行研究。DNA聚合酶使用taqpolymerase(QIAGEN公司制造),反应液组成为10mM Tris-HCl(pH8.3)、50mMKCl、7mM MgCl2、0.2mM dGTP,dATP、1mM dCTP,dTTP以及12.5μM MnCl2。引物使用了分别添加了NcoI位点和PstI位点的P9(catgccatgg tcgctgaatacggggttctg,SEQ ID NO:28)和P10(aactgcagtc aggattgcag cgtcgcc,SEQ ID NO:29),通过94℃5分钟后,94℃30秒、50℃45秒、72℃45秒循环50次,最后在72℃下7分钟的PCR循环进行扩增。将反应液分装于16个独立的PCR管中进行反应,从而使得突变没有偏向。

用NcoI和PstI酶切扩增得到的片段,将其与通过同样的酶处理的pTrc99-Kmr相连接,并转化到大肠杆菌JM109菌株中。此外,pTrc99-Kmr为按照下述方法制备的质粒,该质粒为用DraI限制性内切酶处理pTrc99A(GenBank/EMBL登录号M22744,可以从Amershanm Bioscience公司获得),将氨苄青霉素抗性基因除去,并在该位置上插入卡那霉素抗性基因的质粒。以pACYC177((GenBank/EMBL登录号X06402、可从NIIPONGENE公司获得))为模板,使用P11(aaagccacgt tgtgtctcaa aatc,SEQ IDNO:30)和P12(ggtgttgctg actcatacca ggc,SEQ ID NO:31)作为引物,通过94℃1分钟后,94℃30秒、55℃30秒、72℃75秒循环30次、最后在72℃下5分钟的PCR程序进行扩增从而获得卡那霉素抗性基因。

将上述转化体在含有25mg/L的卡那霉素的LB琼脂培养基上筛选,以从得到的菌落中随机挑选的菌株为模板,使用P13(gacaattaat catccggctc g,SEQ ID NO:32)和P14(tttatcagac cgcttctgcg,SEQ ID NO:33)作为引物,进行94℃5分钟后,98℃5秒、60℃10秒、72℃45秒循环30次,最后在72℃下2分钟的PCR程序,对转化菌株中携带导入突变的yeaS进行了确认。将平板上的全部菌落取下来,通过WizardR Plus MidiprepsDNA纯化系统(WizardR Plus Midipreps DNA purification System)(Promega公司)回收质粒,得到文库。

(2)以L-半胱氨酸抗性为指标筛选突变型yeaS

利用电穿孔法将得到的文库导入MG1655中,并涂布在分别含有3mM、6mM的L-半胱氨酸的M9选择平板(12.8g/L磷酸氢二钠七水合物、3.0g/L磷酸二氢钾、0.5g/L氯化钠、1.0g/L氯化铵、2mM硫酸镁、0.4%葡萄糖、0.1mM氯化钾、25mg/L卡那霉素、1.5%琼脂糖)上。将该选择平板放置在37℃下经过2晚培养后,在含有6mM的L-半胱氨酸的M9选择平板上得到不足100个抗性菌株,在含有3mM的L-半胱氨酸的M9选择平板上得到200~300个抗性菌株。从含有6mM的L-半胱氨酸的平板上获得的菌落中分离出单菌落80株、以及从含有3mL的L-半胱氨酸的平板上得到的菌落中分离出12株单菌落,并将这些菌落作为模板,使用P13和P14作为引物,通过94℃5分钟后,98℃5秒、60℃10秒、72℃45秒循环30次,最后在72℃下2分钟的PCR程序对质粒上的含有yeaS基因区域的DNA片段进行扩增。用作为测序引物的P13对这些片段的碱基序列进行测序,确认yeaS基因内的突变导入部位。将碱基序列可读的克隆中重复的克隆分组之后,从有代表性的克隆中提取出质粒,并将其导入到下述L-半胱氨酸生产菌中,进行培养评价。得到的克隆中,有相当一部分包含了T28N突变,获得了许多如表2所示那样的导入了T28N的同时还导入了其他突变的2重、3重突变菌株。此外,也获得了多株包含F137S突变的克隆。另外也获得了单独具有L188Q突变的克隆。

(3)为了确认突变型yeaS的效果而构建L-半胱氨酸生产菌-1(向P.ananatis SC17菌株中导入了cysE5、突变型yeaS)

上述的pMT-EY2具备来源于pMIV-5JS(特开2008-99668)的Mu噬菌体附着位点(attachment site)。由于该质粒和具有Mu转座酶(Mu transposase)的辅助质粒pMH10(Zimenkov D.et al.,Biotechnologiya(俄语),6,1-22(2004))可以在同一细胞内共存,因此可以将该质粒pMT-EY2上以被Mu噬菌体的附着位点夹持的形式存在的含有氯霉素抗性标记的PompC-cysE5-Pnlp8-YeaS-rrnB终止子盒,插入到P.ananatis SC17(美国专利6596517)菌株的染色体上。而且,由于在质粒pMT-EY2上存在的氯霉素抗性标记具有夹在2个λ噬菌体的辅助位点(λattR和λattL)之间的结构,因此通过后述的方法可以将氯霉素抗性标记除去。

首先,将通过电穿孔向SC17菌株中导入了pMH10而得到的菌株,在含有20mg/L卡那霉素的LB琼脂培养基上,在30℃下过夜培养来进行了选择。将得到的转化菌株在30℃下培养,并进一步通过电穿孔向该菌株中导入pMT-E2。将用pMH10和pMT-EY2这两者转化的菌株,在42℃,20分钟的条件下进行热击,之后在含有20mg/L氯霉素的LB琼脂培养基上筛选氯霉素抗性菌株的菌落。此时培养温度为39℃。通过上述方法,获得约50个克隆,通过分别在LB琼脂培养基上在39℃下培养48小时,进行pMH10以及pMT-EY2的消除(curing)。通过在染色体上插入了盒来显示出氯霉素抗性,且消除了两个质粒后的结果获得了对卡那霉素以及氨苄青霉素显示敏感性的菌株。随后,以该菌株的染色体DNA为模板,使用P1和P6作为引物通过PCR,确认了得到的菌株的染色体上目的盒的插入。得到的全部克隆分别命名为EY01~EY50,并进行EY01~EY50的L-半胱氨酸生产培养。培养使用上述实施例1所示的方法。结果,筛选出L-半胱氨酸生产量最多的克隆EY19菌株。

通过来源于λ噬菌体的切出系统除去EY19菌株中导入的氯霉素抗性标记。具体来说,将携带了λ噬菌体的Int-Xis基因的pMT-Int-Xis2(WO2005/010175)转化到EY19菌株中,从得到的转化菌株中获得了显示氯霉素敏感性的EY19(s)菌株。

(4)为了确认突变型yeaS的效果而构建L-半胱氨酸生产菌-2(由EY19(s)菌株制作cysPTWA基因表达强化菌株)

接下来,为了强化cysPTWA基因的表达,将染色体上的在cysPTWA基因簇上游存在的启动子,替换为上述的强启动子Pnlp8。首先以pMIV-Pnlp8-YeaS7为模板,使用P1以及P2通过PCR获得含有nlp8启动子的约300bp的DNA片段。PCR循环如下所述:95℃3分钟后,95℃60秒、50℃30秒、72℃40秒循环2次,94℃20秒、59℃20秒、72℃15秒循环20次,最后在72℃下5分钟。

将扩增得到的含有nlp8启动子的DNA片段利用克列诺片段处理后插入到用XbaI酶切后通过克列诺片段处理的质粒pMW118-(λatt L-KmR-λattR)(WO2006/093322A2)上,从而得到了质粒pMW-Km-Pnlp8。将pMW-Km-Pnlp8作为模板使用,并使用引物P15(tccgctcacg atttttttca tcgctggtaaggtcatttat cccccaggaa aaattggtta,SEQ ID NO:34)以及P16(tttcacaccg ctcaaccgcagggcataacc ggcccttgaa gcctgctttt ttatactaag ttg,SEQ ID NO:35)进行PCR,扩增得到含有Km-Pnlp8盒的约1.6kb的DNA片段。此时的PCR循环如下所述:95℃3分钟后,95℃60秒、50℃30秒、72℃40秒循环2次,94℃20秒、54℃20秒、72℃90秒循环30次,最后在72℃下5分钟。在两个引物上设计有为了通过λ依赖整合(被称为“Red-driven integration”的方法(Proc.Natl.Acad.Sci.USA,2000,vol.97,No.12,p6640-6645))而插入目的片段的染色体上的靶标的序列(这种情况下为cysPTWA启动子附近的序列)。因此,在将得到的DNA片段通过该λ依赖整合插入到目的菌株中时,在染色体上的cysPTWA基因的邻近前方插入了Km-Pnlp8,从而形成了在nlp8启动子上连接了cysPTWA基因的结构。在SEQ ID NO:12中显示了cysPTWA基因簇的碱基序列,在SEQ ID NO:13~15中显示了cysP、cysT、cysW各基因编码的氨基酸序列。SEQ ID NO:16、17分别显示了cysA基因的碱基序列,以及该基因编码的氨基酸序列。

P.ananatis SC17(0)/RSF-Red-TER菌株是用于使λ依赖整合效果更好地进行的宿主菌株,该菌株中导入了在对λRed基因产物具有抗性的P.ananatis菌株SC17(0)菌株中表达λ的gam、bet以及exo各基因(以下称为“λRed基因”)的辅助质粒RSF-Red-TER(WO2008/075483)。SC17(0)株于2005年9月21保藏于俄罗斯国立工业微生物保藏中心(Russian NationalCollection of Industrial Microorganisms(VKPM),GNII Genetika)(地址:Russia,1175451 Moscow,1Dorozhny proezd.1),保藏号VKPM B-9246。此外,该质粒RSF-Red-TER的构建方法在WO2008/075483中有详细地记载。

在添加用于诱导λRed基因的表达的IPTG的条件下培养上述SC17(0)/RSF-Red-TER菌株,制备了电穿孔用的细胞。通过电穿孔向这些细胞中导入了上述的目的DNA片段,以卡那霉素抗性为指标,通过λ依赖整合,获得了在cysPTWA基因上游插入了nlp8启动子的重组菌株。以获得的菌株的染色体DNA为模板,使用P17(ctttgtccct ttagtgaagg,SEQ ID NO:36)和P18(agctgatcta gaagctgact cgagttaatg gcctcccaga cgac,SEQ ID NO:37)作为引物,通过PCR反应,确认形成了目标的Km-Pnlp8-cysPTWA结构,并将该菌株命名为SC17(0)-Pnlp8-PTWA菌株。

接下来,纯化SC17(0)-Pnlp8-PTWA菌株的染色体DNA,将10μg该染色体DNA通过电穿孔法导入到EY19(s)菌株中,获得卡那霉素抗性菌株。以得到的菌株的染色体DNA为模板,使用P17、P18作为引物利用PCR进行扩增,从而确认了在EY19(s)菌株的染色体上导入了Km-Pnlp8-cysPTWA结构。将通过上述方法获得的菌株命名为EYP197菌株。进一步,使用上述的pMT-Int-Xis2,将卡那霉素抗性标记从染色体上除去,将变为卡那霉素敏感性的菌株命名为EYP197(s)菌株。

(5)为了确认突变型yeaS的效果而构建L-半胱氨酸生产菌-3(由EYP197(s)菌株制作携带了突变型3-磷酸甘油酸脱氢酶(phosphoglyceratedehydrogenase)(serA348)基因的菌株)

作为向L-半胱氨酸生产菌导入的3-磷酸甘油酸脱氢酶,通过下述的方法构建了serA348基因,该基因是编码来源于Pantoea ananatis的3-磷酸甘油酸脱氢酶的基因,其编码用丙氨酸取代了第348位的天冬酰胺残基的突变型酶(N348A)(J.Biol.Chem.1996;271(38):23235-8)。

Pantoea ananatis来源的野生型serA基因的序列如SEQ ID NO:10所示。为了得到导入了上述突变的serA基因的3’侧的DNA片段,进行下述操作,以SC17菌株染色体DNA为模板,使用P19(agctgagtcg acatggcaaa ggtatcactggaa,SEQ ID NO:38)和P20(gagaacgccc gggcgggctt cgtgaatatg cagc,SEQ IDNO:39)作为引物进行PCR(95℃3分钟后,95℃60秒、50℃30秒、72℃40秒循环2次,94℃20秒、60℃20秒、72℃60秒循环25次,最后在72℃下5分钟)。接下来,为了同样地获得导入了突变的5’侧的DNA片段,以SC17菌株染色体DNA为模板,使用P21(agctgatcta gacgtgggat cagtaaagca gg,SEQID NO:40)和P22(aaaaccgccc gggcgttctc ac,SEQ ID NO:41)作为引物进行PCR(95℃3分钟后,95℃60秒、50℃30秒、72℃40秒循环2次,94℃20秒、60℃20秒、72℃20秒循环20次,最后在72℃下5分钟)。通过限制性内切酶SmaI处理得到的两个PCR片段之后,通过DNA连接酶进行连接,得到含有目的突变(N348A)的突变型serA基因全长的DNA片段。以该DNA片段为模板,使用P19和P21作为引物,进行PCR扩增((95℃3分钟后,95℃60秒、50℃30秒、72℃40秒循环2次,94℃20秒、60℃20秒、72℃75秒循环15次,最后在72℃下5分钟)。利用SalI、XbaI处理在P19和P21引物上设计的SalI、XbaI限制性内切酶位点之后,将其插入到同样用SalI、XbaI处理的pMIV-Pnlp8-ter中,制得pMIV-Pnlp8-serA348。

构建的pMIV-Pnlp8-serA348上携带了来源于pMIV-5JS(特开2008-99668)的Mu附着位点。如果使用该质粒,则如上所述,通过使用具有Mu转座酶的辅助质粒pMH10,可以将含有氯霉素抗性标记的Pnlp8-serA348-rrnB终止子盒插入到P.ananatis SC17菌株的染色体上。在SC17(0)菌株中导入了质粒pMIV-Pnlp8-serA348以及pMH10,获得了在染色体上插入了Pnlp8-serA348-rrnB终止子盒的菌株。使用引物P1、P21通过PCR反应,确认了目的盒存在于细胞中。针对得到的50个克隆,测定细胞提取液中的3-磷酸甘油酸脱氢酶的活性,筛选活性最高的菌株,将其命名为SC17int-serA348菌株。接下来,将10μg的SC17int-serA348染色体DNA通过电穿孔导入到EYP197(s)菌株中,获得了氯霉素抗性菌株,使用引物P1、P21通过PCR反应,确认了在EYP197(s)菌株的染色体上与氯霉素抗性标记一起导入了Pnlp8-serA348的结构。将这样得到的菌株命名为EYPS1976菌株。

通过上述的使用pMT-Int-Xis2的标记除去方法,将氯霉素抗性标记除去,并将变为氯霉素敏感性的菌株命名为EYPS1976(s)菌株。

(6)为了确认突变型yeaS的效果而构建L-半胱氨酸生产菌-4(由EYPS1976(s)菌株制作携带了O-乙酰-L-丝氨酸-巯基水解酶-B(cysM)基因的菌株)

首先,为了在适当强度的启动子上克隆cysM基因,制作了新启动子。首先,以P.ananatis SC17菌株的基因组为模板,获得了含有nlpD基因的启动子区域约180bp的DNA片段。使用引物P23(agctgaaagc ttgcatgcacgcgtggcgat ctggcctgac tgc,SEQ ID NO:42)和P24(agctgagtcg accccgtggtggcaaccttt aaaaaactg,SEQ ID NO:43),在上述引物的5’末端分别设计了限制性内切酶SalI以及PaeI位点。PCR循环如下所述:95℃5分钟后,94℃20秒、59℃20秒、72℃20秒循环27次,最后在72℃下5分钟。

在SEQ ID NO:14中显示了大肠杆菌cysM基因的碱基序列,在SEQ IDNO:15中显示了该基因编码的氨基酸序列。

使用SalI以及PaeI处理得到的DNA片段,并将其插入到同样用SalI以及PaeI处理的pMIV-Pnlp0-ter中,获得了pMIV-Pnlp4-ter。在该质粒pMIV-Pnlp4-ter中插入的启动子Pnlp4的PaeI-SalI片段的碱基序列如SEQ IDNO:8中所示。同样地,以质粒pMIV-Pnlp4-ter为模板,使用引物P23以及P25(agctgagtcg acnnngtggt ggcaaccttt aaaaaactg(“n-”表示可以为a,t,g,c中的任意一种),SEQ ID NO:44),通过PCR(95℃5分钟后,94℃20秒、59℃20秒、72℃20秒循环27次,最后在72℃下5分钟),制得了在nlpD启动子5’末端侧含有的-7~-9区域被随机化的DNA片段,用SalI以及PaeI处理,并将其插入到用同样的酶处理后的pMIV-Pnlp0-ter中,从而得到pMIV-Pnlp1-ter。在该pMIV-Pnlp1质粒中插入的Pnlp1启动子的PaeI-SalI片段的碱基序列如SEQ ID NO:9所示。-7~-9区域表示从nlpD启动子的转录起始位点起5’侧的第7个碱基到第9个碱基的位置。

在上述的载体中整合了由大肠杆菌MG1655菌株克隆的cysM基因。具体来说,以大肠杆菌MG1655菌株的基因组为模板,使用引物P26(agctgagtcgacgtgagtac attagaacaa acaat,SEQ ID NO:45)和P27(agctgatcta gaagtctccgatgctattaa tcc,SEQ ID NO:46)通过PCR(95℃5分钟后,98℃5秒、50℃10秒、72℃60秒循环30次,最后在72℃下2分钟)进行扩增。利用SalI、XbaI限制性内切酶处理这样得到的DNA片段,并将其插入到用相同的酶处理的pMIV-Pnlp4-ter以及pMIV-Pnlp1-ter中,从而制得pMIV-Pnlp4-CysM和pMIV-Pnlp1-CysM。

使用上述构建的pMIV-Pnlp4-CysM和pMIV-Pnlp1-CysM,通过使用上述的pMH10的方法,分别获得了在SC17菌株的染色体上插入了含有cysM基因的盒的菌株。将通过上述方法制得的菌株命名为SC17int-4M和SC17int-1M,并从各菌株中提取染色体DNA。将10μg该染色体DNA通过电穿孔导入到EYP1976(s)菌株中,获得了氯霉素抗性株。将上述制得的菌株分别命名为EYPSint-4M、EYPSint-1M,通过上述的使用pMT-Int-Xis2的标记除去方法,进行氯霉素抗性标记的去除,将变为氯霉素敏感性的菌株命名为EYPSint-4M(s)、EYPSint-1M(s)菌株。

(7)突变型yeaS对L-半胱氨酸生产带来的影响

向如上所述制得的L-半胱氨酸生产菌EYPSint1M(s)中,从上述实施例2、(2)中得到的突变型yeaS基因中选择几种,导入到到此为止构建的L-半胱氨酸生产菌中,进行L-半胱氨酸生产培养。将评价对象菌株在LB琼脂培养基上涂开,在34℃下进行过夜预培养,用10μL大小的接种环(NUNC公司制造)从平板上挑取约7平方厘米范围的菌体,并按照培养开始时刻的菌体量基本相同的方式接种到已经放入大试管(内径23mm、长度20cm)的2mL的L-半胱氨酸培养基(组成:15g/L硫酸铵,1.5g/L磷酸二氢钾,1g/L硫酸镁七水合物,0.1mg/L硫胺盐酸盐,1.7mg/L硫酸亚铁七水合物,0.15mg/L钼酸钠二水合物,0.7mg/L氯化钴六水合物,1.6mg/L氯化锰四水合物,0.3mg/L硫酸锌七水合物,0.25mg/L硫酸铜水合物,0.6g/L胰蛋白胨,0.3g/L酵母提取物,0.6g/L氯化钠,20g/L碳酸钙,135mg/L L-组氨酸盐酸盐一水合物,4g/L硫代硫酸钠,2mg/L吡哆醇盐酸盐,20g/L葡萄糖,20mg/L卡那霉素,1mM IPTG)中。

在32℃下进行振动培养,葡萄糖消耗用尽的时刻终止培养(约15~19小时),定量在培养基中生产的L-半胱氨酸。表2中的测试No.1、2为进行了3~5次的平行实验,测试No.3为单一实验,并分别独立的进行了2回。结果得到的L-半胱氨酸生产量的平均值和标准偏差如表2所示。上述通过筛选系统得到的突变体,在L-半胱氨酸的生产培养中也是有效的。从结果可知,至少第28位、第188位上的突变可以单独地具有效果。此外,在L-半胱氨酸生产能力提高的多个菌株中发现了含有第137位突变(F137S)的3重突变。由此,可以认为F137S可以单独地与提高L-半胱氨酸的生产能力相关。此外,从各种解析可知,可以认为在第11位、33位、52位、59位、60位、65位、72位、77位、85位以及86位上的突变为不会使YeaS蛋白质的活性降低的沉默突变。

[表2]

表2筛选得到的菌株的培养评价

(8)在yeaS基因中导入代表突变,以及对突变导入菌株在液体培养基中的L-半胱氨酸抗性评价

将第137位的苯丙氨酸被丝氨酸所取代的F137S突变单独地导入yeaS基因,通过将突变型基因加载于pSTV29(TAKARABio公司),对该突变单独的效果进行研究。

通过重叠(overlap)PCR,制作组合了目的突变和yeaS自身的启动子、终止子的载体。首先,设计含有突变的引物P28(cgataaactg tacgaaagacgacacataga ac,SEQ ID NO:47),同时使用P29(cgcggatcca gtggtcattt agtgc,SEQ ID NO:48)作为引物,以大肠杆菌MG1655的基因组为模板,通过PCR扩增得到DNA‘片段1’。此外PCR程序为94℃5分钟后,98℃5秒、55℃10秒、72℃45秒循环30次、,最后在72℃下2分钟。随后,使用P9和P30(cgcggatcct gtgggatttg aagcatcc,SEQ ID NO:49),进行程序为94℃5分钟后,98℃5秒、55℃10秒、72℃60秒循环30次,最后在72℃下2分钟的PCR反应,扩增得到DNA‘片段2’。对于得到的各片段,在琼脂糖凝胶电泳后将条带切出,进行纯化。将DNA‘片段1’和DNA‘片段2’混合并稀释10倍后作为模板,使用引物P29和P30,进行94℃5分钟后,98℃5秒、55℃10秒、72℃1分钟10秒循环30次,最后在72℃下2分钟的PCR反应,与上述相同,在琼脂糖凝胶电泳后纯化扩增的DNA片段。

使用BamHI酶切纯化产物和载体pSTV29之后,对载体使用CIAP(TAKARABio公司)进行末端去磷酸化处理后,将它们连接,并将得到的质粒转化到JM109中。从转化子中提取质粒,得到了携带了突变型yeaS基因的pSTV-YeaSF137S,其中该突变型yeaS基因编码第137位的苯丙氨酸残基被丝氨酸所取代的YeaS。此外,作为对照,构建了结构与该pSTV-YeaSF137S相同的携带了野生型yeaS基因的pSTV-YeaSWT。但是,由于不需要导入突变,因此省略了制作‘片段1’和‘片段2’的步骤,以大肠杆菌MG1655的基因组为模板,以P29和P30为引物通过PCR方法获得了含有yeaS基因的片段。

接下来,确认了突变型yeaS基因导入菌株在液体培养基中的L-半胱氨酸抗性。向大肠杆菌MG1655中转化pSTV-YeaSWT和pSTV-YeaSF137S,制得了MG1655/pSTV-YeaSWT和MG1655/pSTV-YeaSF137S。将各菌株接种于含有25mg/L氯霉素和0.4%葡萄糖的M9培养基(Sambrook et al.,Molecularcloning,3rd edition,2001 Cold Spring Harbor Laboratory Press)中,在37℃下培养24小时获得种子培养液。将该种子培养液按1/50的接种量接种于新准备的M9培养基中。在37℃下培养14小时后,测定这些菌的在660nm处的吸光度(OD660)。调整所有试验菌株的菌浓度,使得与其中OD660最小的试验菌株的OD660相匹配,之后接种于已经装入含有200μM的L-半胱氨酸的M9培养基的L字型试管中,接种量为1/100。将该L-字型试管设置在自动OD测定培养装置(BIO-PHOTORECORDER TN-1506(ADVANTEC公司))中,每10分钟测定OD660并由此观察生长繁育情况。从而,通过判断在上述培养基中开始生长繁育的早晚,评价各试验菌株的L-半胱氨酸抗性的不同。在该培养中,L-半胱氨酸的抗性越高,OD660越早开始上升,抗性越低则OD660越晚开始上升,即表观上无法确认生长繁育的时间(lag)将变长。该生长繁育曲线如图2所示。如图2所示的一样,具有F137S突变的YeaS(YeaSF137S)与野生型YeaS(YeaSWT)相比,OD660值较早开始上升,说明其被赋予了L-半胱氨酸抗性。

(9)YeaSF137S对L-半胱氨酸生产的影响

在含有L-半胱氨酸的M9培养基中,为了确认YeaSF137S强化菌株的L-半胱氨酸生产能力,该YeaSF137S强化菌株比YeaSWT强化菌株显示了更高的L-半胱氨酸抗性,构建了连接有更强的Pnlp8启动子支配下的编码YeaSF137S的基因的质粒。将该质粒导入到L-半胱氨酸生产菌EYPSint-4M中,确认L-半胱氨酸生产的效果。首先,以pSTV-YeaSWT、pSTV-YeaSF137S为模板,使用P31(aagtcgacgt gttcgctgaa tacggggttc tg,SEQ ID NO:50)、P32(aatctagatc aggattgcag cgtcgcc,SEQ ID NO:51)作为引物,进行程序为94℃5分钟后,98℃5秒、60℃10秒、72℃60秒循环30次,最后在72℃下2分钟的PCR反应,扩增了在5’端和3’端上分别添加了SalI和XbaI的yeaSWT基因片段以及yeaSF137S基因片段。并与上述的pMIV-Pnlp8一起,进行SalI和XbaI酶切,并连接,将连接反应物转化到JM109中。从各转化子中提取各质粒,并导入L-半胱氨酸生产菌株EYPSint-4M(s)中,分别得到了EYPSint-4M/pMIV-Pnlp8-YeaSWT、EYPSint-4M/pMIV-Pnlp8-YeaSF137S。此外,作为对照也制作了仅导入载体的EYPSint-4M/pMIV-5JS,按照上述(3)中所述的方法进行试管培养评价。但是,将葡萄糖浓度变更为40g/L,并且变更为不添加IPTG。

结果如表3所示。可知:使用YeaSWT强化仅使L-半胱氨酸些许增加,而通过YeaSF137S强化却大幅提高了L-半胱氨酸的生产。也就是说,可以认为YeaSF137S与以往的YeaSWT相比,大幅地提高了与非修饰株相比使宿主细胞的L-半胱氨酸生产能力提高的活性。

[表3]

表3在半胱氨酸生产菌株中强化YeaSWT以及YeaSF137S的效果

(10)YeaSF137S对大肠杆菌L-半胱氨酸生产的影响

对在大肠杆菌(E.coli)中yeaS基因表达增强的效果进行了研究。

首先,构建携带了突变型cysE基因的质粒。具体来说,如特开2005-137369中记载的pACYC-DES构建方法,其中省略了携带编码不受丝氨酸反馈抑制的磷酸甘油酸脱氢酶脱氢酶的突变型serA5基因(美国专利第6,180,373号中所述)的步骤,构建了质粒pACYC-DE1。该pACYC-DES为携带了上述突变型serA5、编码反馈抑制被解除了的突变型SAT基因的cysEX基因,以及编码L-半胱氨酸、乙酰丝氨酸分泌因子的ydeD基因(US5972663A)的质粒,与此相对在本次构建的pACYC-DE1中,不含有serA5,而携带了cysEX以及ydeD。各基因的表达均使用ompA启动子。

如下述所示,预计YeaS与L-半胱氨酸的分泌相关,但在对YeaSF137S的效果进行评价时,考虑到L-半胱氨酸的分泌因子ydeD产物可能会提高背景值。因此,为了确认YeaSF137S的实际效果,使pACYC-DE1中的ydeD基因缺损。用MnuI处理pACYC-DE1,并通过自连接,构建了使ydeD基因ORF内侧约330bp缺损的质粒。由此,使作为L-半胱氨酸分泌因子发挥功能的YdeD不表达,该仅搭载了CysEX的质粒命名为pACYC-E1。将该质粒pACYC-E1转化到大肠杆菌MG1655中,制得了MG1655/pACYC-E1菌株。将该MG1655/pACYC-E1菌株作为宿主,将搭载了野生型yeaS基因的质粒pMIV-Pnlp8-yeaSWT、搭载了突变型yeaS基因的质粒pMIV-Pnlp8-yeaS137、以及作为对照的pMIV-5JS,分别通过电穿孔导法导入到该宿主中。按照与实施例1所示的方法相同的条件,通过试管培养对得到的菌株的L-半胱氨酸生产进行研究(表4)。此外,在试管培养中,对各菌株分别进行了4组平行实验,表中显示的是其平均值。可以得知由于yeaS基因以及突变型yeaS基因的表达量的增强,提高了在具有L-半胱氨酸生产能力的大肠杆菌中的L-半胱氨酸的生产量。即,确认了yeaS基因产物即使对于具有L-半胱氨酸生产能力的大肠杆菌,也可以显示出与非修饰株相比使宿主细胞的L-半胱氨酸生产能力提高的活性。

[表4]

表4在大肠杆菌半胱氨酸生产菌株中强化YeaSWT以及YeaSF137S的效果

(11)YeaSF137S的特性解析

从到此为止的结果可以明确YeaSF137S对于L-半胱氨酸的生产是有用的。作为理由,可以考虑是由于提高了L-半胱氨酸的分泌能力,但为了研究对其他氨基酸分泌能力的影响,用0.1N盐酸稀释将上述的EYPSint-4M/pMIV-5JS、EYPSint-4M/pMIV-Pnlp8-YeaSWT、EYPSint-4M/pMIV-Pnlp8-YeaSF137S共计3株菌株的试管培养后的培养基各3个样品稀释20倍,并利用氨基酸分析器(L-8500(日立制作所制造))对各种L-氨基酸进行定量。结果如图3所示。与YeaSWT相比,YeaSF137S分泌了各种L-氨基酸,特别是分泌的L-亮氨酸从21mg/L增加到656mg/L。从上述内容可知,通过用丝氨酸取代YeaS的第137位的苯丙氨酸残基,不仅可以促进L-半胱氨酸在培养基中的积累,还可以促进L-亮氨酸、L-苏氨酸、L-丝氨酸、甘氨酸、L-丙氨酸、L-胱氨酸、L-甲硫氨酸、L-组氨酸、L-缬氨酸等等其他氨基酸的积累。因此,可以推测YeaSF137S也可以促进上述这些氨基酸的分泌。因此,YeaSF137S对于这些氨基酸的发酵生产是有利的。

此外,对于大肠杆菌MG1655,同样地制作了导入了pMIV-5JS、pMIV-Pnlp8-YeaSWT、pMIV-Pnlp8-YeaSF137S的菌株,并在与EYPSint-4M(s)的培养相同的条件下,进行试管培养,并对该培养基进行了与上述相同的氨基酸分析。结果如图4所示。对于大肠杆菌,YeaSF137S也可以促进甘氨酸、L-甲硫氨酸、L-亮氨酸、L-组氨酸、L-丙氨酸、L-胱氨酸、L-缬氨酸、以及L-谷氨酸的积累,从而对于这些氨基酸的发酵生产是有利的。

(12)对于YeaS的第137位被其他氨基酸残基所取代的效果的研究

当YeaS的第137位的苯丙氨酸残基被丝氨酸以外的其他氨基酸所取代时,研究了其对L-半胱氨酸生产产生的影响。首先,以pMIV-Pnlp8-YeaS为模板,使用引物P33(aaacgtgagg aaatacctgg,SEQ ID NO:52)和P34(cgataaactg tacgaannnc gacacataga ac(“n-”表示可以为a,t,g,c中的任意一种),SEQ ID NO:53),通过PCR扩增了DNA‘片段1’。此外,PCR程序为94℃5分后,98℃5秒、60℃10秒、72℃1分钟循环30次,最后在72℃下1分钟。此外,同样地使用P31和P32在该循环下扩增了DNA‘片段2’。将‘片段1’和‘片段2’混合并稀释10倍后作为模板,使用P32和P33作为引物通过上述程序进行重叠PCR,将得到的DNA片段纯化后,用SalI和XbaI处理,并将其导入到用同样的酶处理后的上述pMIV-Pnlp23载体中,制得了pMIV-Pnlp23-YeaSF137*。通过测序确认,将搭载了突变型yeaS基因的质粒通过电穿孔法导入到大肠杆菌MG1655菌株中,其中该突变型yeaS基因为导入了第137位的苯丙氨酸被丝氨酸以外的其他氨基酸所取代的突变的突变型yeaS基因,并将上述菌株平铺在按照与上述同样的方法制作的含有1mM的L-半胱氨酸的M9选择平板上,并在37℃下培养,研究L-半胱氨酸抗性。

结果,以苯丙氨酸(WT)为基准对L-半胱氨酸抗性进行评价,发现除丝氨酸(S)以外的谷氨酰胺(Q)、丙氨酸(A)、组氨酸(H)、半胱氨酸(C)、甘氨酸(G)的取代体也可以提高对L-半胱氨酸的抗性水平。特别是谷氨酰胺取代体(F137Q)的L-半胱氨酸抗性非常强。

在此,用SalI和XbaI处理pMIV-Pnlp23-YeaSF137Q,并将其插入到由同样的酶处理的pMIV-Pnlp8中,制作了连接有在pnlp8支配下的yeaSF137Q的pMIV-Pnlp8-YeaSF137Q。对其进行P.ananatis的L-半胱氨酸生产培养。作为对象,使用导入了pMIV-Pnlp8-YeaSWT、或pMIV-Pnlp8-YeaSF137S的EYPSint-1M(s)。该结果如表5所示。对于第137位的苯丙氨酸被谷氨酰胺所取代的突变型YeaS(YeaSF137Q)而言,可以知道其与非修饰株相比使宿主细胞的L-半胱氨酸生产能力提高的活性,比野生型YeaS有所提高。

[表5]

表5在半胱氨酸生产菌株中强化YeaSWT、YeaSF137S以及YeaSF137Q的效果

如上所示,可以得知增加突变型yeaS的表达量引起的L-半胱氨酸抗性的获得与L-半胱氨酸生产量的增加之间的关联性。这一点可以认为是由于L-半胱氨酸的抗性提高促进了L-半胱氨酸向细胞外的分泌。由此,可以认为在含有L-半胱氨酸的M9选择平板上具有了L-半胱氨酸抗性提高的效果的、第137位的苯丙氨酸被丙氨酸、组氨酸、半胱氨酸、或者甘氨酸所取代的各突变型yeaS也同样具有使L-半胱氨酸生产提高的效果。为了验证上述结论,可以通过下述方法进行确认:按照与构建上述pMIV-Pnlp8-YeaSF137Q的相同的方法,制作pMIV-Pnlp8-YeaSF137A、pMIV-Pnlp8-YeaSF137H、pMIV-Pnlp8-YeaSF137C、以及pMIV-Pnlp8-YeaSF137G,并将它们导入到EYPSint-1M(s)中并进行L-半胱氨酸生产培养。

(序列表说明)

SEQ ID NO:1:野生型yeaS基因的碱基序列

SEQ ID NO:2:野生型YeaS的氨基酸序列

SEQ ID NO:3:野生型cysE基因的碱基序列

SEQ ID NO:4:野生型cysE编码的丝氨酸乙酰转移酶的氨基酸序列

SEQ ID NO:5:Pnlp0的碱基序列

SEQ ID NO:6:Pnlp8的碱基序列

SEQ ID NO:7:Pnlp23的碱基序列

SEQ ID NO:8:Pnlp4的碱基序列

SEQ ID NO:9:Pnlp1的碱基序列

SEQ ID NO:10:Pantoea ananatis野生型serA基因的碱基序列

SEQ ID NO:11:Pantoea ananatis野生型serA基因编码的氨基酸序列

SEQ ID NO:12:cysPTWA基因簇的碱基序列

SEQ ID NO:13:cysP基因编码的氨基酸序列

SEQ ID NO:14:cysT基因编码的氨基酸序列

SEQ ID NO:15:cysW基因编码的氨基酸序列

SEQ ID NO:16:cysA基因的碱基序列

SEQ ID NO:17:cysA基因编码的氨基酸序列

SEQ ID NO:18:cysM基因的碱基序列

SEQ ID NO:19:cysM基因编码的氨基酸序列

SEQ ID NO:20~53:引物P1~P34

序列表

<110>味之素株式会社(Ajinomoto Co.,Inc.)

<120>L-氨基酸生产菌以及L-氨基酸的生产方法

<130>OP-C9375

<150>JP2009-032835

<151>2009-02-16

<160>53

<170>PatentIn vetsion 3.5

<210>1

<211>1039

<212>DNA

<213>大肠杆菌

<220>

<221>CDS

<222>(201)..(839)

<400>1

tgcggataac ggtagaattt ttacgccagt attttgccga gcactacccg aatttttcac  60

tggagcatgc ctgattaatg attcaattat cgggttgata tcaggttaaa acctgatttt  120

ctcctttcta agccgctaca gattggttag catattcacc tttaatcgcg catgatcgaa  180

agataattaa agaggttaat gtg ttc gct gaa tac ggg gtt ctg aat tac tgg  233

                      Val Phe Ala Glu Tyr Gly Val Leu Asn Tyr Trp

                      1               5                   10

acc tat ctg gtt ggg gcc att ttt att gtg ttg gtg cca ggg cca aat    281

Thr Tyr Leu Val Gly Ala Ile Phe Ile Val Leu Val Pro Gly Pro Asn

            15                  20                  25

acc ctg ttt gta ctc aaa aat agc gtc agt agc ggt atg aaa ggc ggt    329

Thr Leu Phe Val Leu Lys Asn Ser Val Ser Ser Gly Met Lys Gly Gly

        30                  35                  40

tat ctt gcg gcc tgc ggt gta ttt att ggc gat gcg gta ttg atg ttt    377

Tyr Leu Ala Ala Cys Gly Val Phe Ile Gly Asp Ala Val Leu Met Phe

    45                  50                  55

ctg gca tgg gct gga gtg gcg aca tta att aag acc acc ccg ata tta    425

Leu Ala Trp Ala Gly Val Ala Thr Leu Ile Lys Thr Thr Pro Ile Leu

60                  65                  70                  75

ttc aac att gta cgt tat ctt ggt gcg ttt tat ttg ctc tat ctg ggg    473

Phe Asn Ile Val Arg Tyr Leu Gly Ala Phe Tyr Leu Leu Tyr Leu Gly

                80                  85                  90

agt aaa att ctt tac gcg acc ctg aag ggt aaa aat agc gag gcc aaa    521

Ser Lys Ile Leu Tyr Ala Thr Leu Lys Gly Lys Asn Ser Glu Ala Lys

            95                 100                 105

tcc gat gag ccc caa tac ggt gct att ttt aaa cgc gcg tta att ttg    569

Ser Asp Glu Pro Gln Tyr Gly Ala Ile Phe Lys Arg Ala Leu Ile Leu

        110                 115                 120

agc ctg act aat ccg aaa gcc att ttg ttc tat gtg tcg ttt ttc gta    617

Ser Leu Thr Asn Pro Lys Ala Ile Leu Phe Tyr Val Ser Phe Phe Val

    125                 130                 135

cag ttt atc gat gtt aat gcc cca cat acg gga att tca ttc ttt att    665

Gln Phe Ile Asp Val Asn Ala Pro His Thr Gly Ile Ser Phe Phe Ile

140                 145                 150                 155

ctg gcg gcg acg ctg gaa ctg gtg agt ttc tgc tat ttg agc ttc ctg    713

Leu Ala Ala Thr Leu Glu Leu Val Ser Phe Cys Tyr Leu Ser Phe Leu

                160                 165                 170

att ata tct ggt gct ttt gtc acg cag tac ata cgt acc aaa aag aaa    761

Ile Ile Ser Gly Ala Phe Val Thr Gln Tyr Ile Arg Thr Lys Lys Lys

            175                 180                 185

ctg gct aaa gtt ggc aac tca ctg att ggt ttg atg ttc gtg ggt ttc    809

Leu Ala Lys Val Gly Asn Ser Leu Ile Gly Leu Met Phe Val Gly Phe

        190                 195                 200

gct gcc cga ctg gcg acg ctg caa tcc tgatgctttcagc ccgcgttgtc       859

Ala Ala Arg Leu Ala Thr Leu Gln Ser

    205                 210

gcgggcttcc catctataat cctccctgat tcttcgctga tatggtgcta aaaagtaacc  919

aataaatggt atttaaaatg caaattatca ggcgtaccct gaaacggctg gaataaaccg    979

ttttcagcgc attcaccgaa ggagggaaaa ggatgcttca aatcccacag aattatattc    1039

<210>2

<211>212

<212>PRT

<213>大肠杆菌

<400>2

Val Phe Ala Glu Tyr Gly Val Leu Asn Tyr Trp Thr Tyr Leu Val Gly

1               5                   10                  15

Ala Ile Phe Ile Val Leu Val Pro Gly Pro Asn Thr Leu Phe Val Leu

            20                  25                  30

Lys Asn Ser Val Ser Ser Gly Met Lys Gly Gly Tyr Leu Ala Ala Cys

        35                  40                  45

Gly Val Phe Ile Gly Asp Ala Val Leu Met Phe Leu Ala Trp Ala Gly

    50                  55                  60

Val Ala Thr Leu Ile Lys Thr Thr Pro Ile Leu Phe Asn Ile Val Arg

65                  70                  75                  80

Tyr Leu Gly Ala Phe Tyr Leu Leu Tyr Leu Gly Ser Lys Ile Leu Tyr

                85                  90                  95

Ala Thr Leu Lys Gly Lys Asn Ser Glu Ala Lys Ser Asp Glu Pro Gln

            100                 105                 110

Tyr Gly Ala Ile Phe Lys Arg Ala Leu Ile Leu Ser Leu Thr Asn Pro

        115                 120                 125

Lys Ala Ile Leu Phe Tyr Val Ser Phe Phe Val Gln Phe Ile Asp Val

    130                 135                 140

Asn Ala Pro His Thr Gly Ile Ser Phe Phe Ile Leu Ala Ala Thr Leu

145                 150                 155                 160

Glu Leu Val Ser Phe Cys Tyr Leu Ser Phe Leu Ile Ile Ser Gly Ala

                165                 170                 175

Phe Val Thr Gln Tyr Ile Arg Thr Lys Lys Lys Leu Ala Lys Val Gly

            180                 185                 190

Asn Ser Leu Ile Gly Leu Met Phe Val Gly Phe Ala Ala Arg Leu Ala

        195                 200                 205

Thr Leu Gln Ser

    210

<210>3

<211>1422

<212>DNA

<213>大肠杆菌

<220>

<221>CDS

<222>(301)..(1119)

<400>3

tcggtcaggg catggatgta caaagcgcgc aggagaagat tggtcaggtg gtggaaggct  60

accgcaatac gaaagaagtc cgcgaactgg cgcatcgctt cggcgttgaa atgccaataa  120

ccgaggaaat ttatcaagta ttatattgcg gaaaaaacgc gcgcgaggca gcattgactt  180

tactaggtcg tgcacgcaag gacgagcgca gcagccacta accccaggga acctttgtta  240

ccgctatgac ccggcccgcg cagaacgggc cggtcattat ctcatcgtgt ggagtaagca  300

atg tcg tgt gaa gaa ctg gaa att gtc tgg aac aat att aaa gcc gaa    348

Met Ser Cys Glu Glu Leu Glu Ile Val Trp Asn Asn Ile Lys Ala Glu

1               5                   10                  15

gcc aga acg ctg gcg gac tgt gag cca atg ctg gcc agt ttt tac cac    396

Ala Arg Thr Leu Ala Asp Cys Glu Pro Met Leu Ala Ser Phe Tyr His

            20                  25                  30

gcg acg cta ctc aag cac gaa aac ctt ggc agt gca ctg agc tac atg    444

Ala Thr Leu Leu Lys His Glu Asn Leu Gly Ser Ala Leu Ser Tyr Met

        35                  40                  45

ctg gcg aac aag ctg tca tcg cca att atg cct gct att gct atc cgt    492

Leu Ala Asn Lys Leu Ser Ser Pro Ile Met Pro Ala Ile Ala Ile Arg

    50                  55                  60

gaa gtg gtg gaa gaa gcc tac gcc gct gac ccg gaa atg atc gcc tct    540

Glu Val Val Glu Glu Ala Tyr Ala Ala Asp Pro Glu Met Ile Ala Ser

65                  70                  75                  80

gcg gcc tgt gat att cag gcg gtg cgt acc cgc gac ccg gca gtc gat    588

Ala Ala Cys Asp Ile Gln Ala Val Arg Thr Arg Asp Pro Ala Val Asp

                85                  90                  95

aaa tac tca acc ccg ttg tta tac ctg aag ggt ttt cat gcc ttg cag    636

Lys Tyr Ser Thr Pro Leu Leu Tyr Leu Lys Gly Phe His Ala Leu Gln

            100                 105                 110

gcc tat cgc atc ggt cac tgg ttg tgg aat cag ggg cgt cgc gca ctg    684

Ala Tyr Arg Ile Gly His Trp Leu Trp Asn Gln Gly Arg Arg Ala Leu

        115                 120                 125

gca atc ttt ctg caa aac cag gtt tct gtg acg ttc cag gtc gat att    732

Ala Ile Phe Leu Gln Asn Gln Val Ser Val Thr Phe Gln Val Asp Ile

    130                 135                 140

cac ccg gca gca aaa att ggt cgc ggt atc atg ctt gac cac gcg aca    780

His Pro Ala Ala Lys Ile Gly Arg Gly Ile Met Leu Asp His Ala Thr

145                 150                 155                 160

ggc atc gtc gtt ggt gaa acg gcg gtg att gaa aac gac gta tcg att    828

Gly Ile Val Val Gly Glu Thr Ala Val Ile Glu Asn Asp Val Ser Ile

                165                 170                 175

ctg caa tct gtg acg ctt ggc ggt acg ggt aaa tct ggt ggt gac cgt    876

Leu Gln Ser Val Thr Leu Gly Gly Thr Gly Lys Ser Gly Gly Asp Arg

            180                 185                 190

cac ccg aaa att cgt gaa ggt gtg atg att ggc gcg ggc gcg aaa atc    924

His Pro Lys Ile Arg Glu Gly Val Met Ile Gly Ala Gly Ala Lys Ile

        195                 200                 205

ctc ggc aat att gaa gtt ggg cgc ggc gcg aag att ggc gca ggt tcc    972

Leu Gly Asn Ile Glu Val Gly Arg Gly Ala Lys Ile Gly Ala Gly Ser

    210                 215                 220

gtg gtg ctg caa ccg gtg ccg ccg cat acc acc gcc gct ggc gtt ccg    1020

Val Val Leu Gln Pro Val Pro Pro His Thr Thr Ala Ala Gly Val Pro

225                 230                 235                 240

gct cgt att gtc ggt aaa cca gac agc gat aag cca tca atg gat atg    1068

Ala Arg Ile Val Gly Lys Pro Asp Ser Asp Lys Pro Ser Met Asp Met

                245                 250                 255

gac cag cat ttc aac ggt att aac cat aca ttt gag tat ggg gat ggg    1116

Asp Gln His Phe Asn Gly Ile Asn His Thr Phe Glu Tyr Gly Asp Gly

            260                 265                 270

atc taatgtcctg tgatcgtgcc ggatgcgatg taatcatcta tccggcctac         1169

Ile

agtaactaat ctctcaatac cgctcccgga taccccaact gccgccaggc ttcatacacc  1229

actaccgaca ccgcattgga cagattcatg ctgcggctgt ccggcaccat cggaatgcga  1289

attttttgtt cagcgggcag ggcatcaaga atgctcgctg gcaggccgcg tgtttccggg  1349

ccgaacatca gataatcgcc atcctgatag cttacggcgc tgtgagcagg tgtacctttc  1409

gtggtgaggg cga                                                     1422

<210>4

<211>273

<212>PRT

<213>大肠杆菌

<400>4

Met Ser Cys Glu Glu Leu Glu Ile Val Trp Asn Asn Ile Lys Ala Glu

1               5                   10                  15

Ala Arg Thr Leu Ala Asp Cys Glu Pro Met Leu Ala Ser Phe Tyr His

            20                  25                  30

Ala Thr Leu Leu Lys His Glu Asn Leu Gly Ser Ala Leu Ser Tyr Met

        35                  40                  45

Leu Ala Asn Lys Leu Ser Ser Pro Ile Met Pro Ala Ile Ala Ile Arg

    50                  55                  60

Glu Val Val Glu Glu Ala Tyr Ala Ala Asp Pro Glu Met Ile Ala Ser

65                  70                  75                  80

Ala Ala Cys Asp Ile Gln Ala Val Arg Thr Arg Asp Pro Ala Val Asp

                85                  90                  95

Lys Tyr Ser Thr Pro Leu Leu Tyr Leu Lys Gly Phe His Ala Leu Gln

            100                 105                 110

Ala Tyr Arg Ile Gly His Trp Leu Trp Asn Gln Gly Arg Arg Ala Leu

        115                 120                 125

Ala Ile Phe Leu Gln Asn Gln Val Ser Val Thr Phe Gln Val Asp Ile

    130                 135                 140

His Pro Ala Ala Lys Ile Gly Arg Gly Ile Met Leu Asp His Ala Thr

145                 150                 155                 160

Gly Ile Val Val Gly Glu Thr Ala Val Ile Glu Asn Asp Val Ser Ile

                165                 170                 175

Leu Gln Ser Val Thr Leu Gly Gly Thr Gly Lys Ser Gly Gly Asp Arg

            180                 185                 190

His Pro Lys Ile Arg Glu Gly Val Met Ile Gly Ala Gly Ala Lys Ile

        195                 200                 205

Leu Gly Asn Ile Glu Val Gly Arg Gly Ala Lys Ile Gly Ala Gly Ser

    210                 215                 220

Val Val Leu Gln Pro Val Pro Pro His Thr Thr Ala Ala Gly Val Pro

225                 230                 235                 240

Ala Arg Ile Val Gly Lys Pro Asp Ser Asp Lys Pro Ser Met Asp Met

                245                 250                 255

Asp Gln His Phe Asn Gly Ile Asn His Thr Phe Glu Tyr Gly Asp Gly

            260                 265                 270

Ile

<210>5

<211>313

<212>DNA

<213>大肠杆菌

<400>5

gcatgcttcc aactgcgcta atgacgcagc tggacgaagg cgggattctc gtcttacccg    60

taggggagga gcaccagtat ttgaaacggg tgcgtcgtcg gggaggcgaa tttattatcg    120

ataccgtgga ggccgtgcgc tttgtccctt tagtgaaggg tgagctggct taaaacgtga    180

ggaaatacct ggatttttcc tggttatttt gccgcaggtc agcgtatcgt gaacatcttt    240

tccagtgttc agtagggtgc cttgcacggt aattatgtca ctggttatta accaattttt    300

cctgggggtc gac                                                       313

<210>6

<211>312

<212>DNA

<213>人工序列

<220>

<223>突变体nlpD启动子

<400>6

gcatgcttcc aactgcgcta atgacgcagc tggacgaagg cgggattctc gtcttacccg    60

taggggagga gcaccagtat ttgaaacggg tgcgtcgtcg gggaggcgaa tttattatcg    120

ataccgtgga ggccgtgcgc tttgtccctt tagtgaaggg tgagctggct taaaacgtga    180

ggaaatacct ggatttttcc tggttatttt gccgcaggtc agcgtataat gaagatcttt    240

tccagtgttg acaagggtcc ttgcacggtt ataatgtcac tggttattaa ccaatttttc    300

ctgggggtcg ac                                                        312

<210>7

<211>313

<212>DNA

<213>人工序列

<220>

<223>突变体nlpD启动子

<400>7

gcatgcttcc aactgcgcta atgacgcagc tggacgaagg cgggattctc gtcttacccg    60

taggggagga gcaccagtat ttgaaacggg tgcgtcgtcg gggaggcgaa tttattatcg    120

ataccgtgga ggccgtgcgc tttgtccctt tagtgaaggg tgagctggct taaaacgtga    180

ggaaatacct ggatttttcc tggttatttt gccgcaggtc agcgtataat gaagatcttt    240

tccagtgttc agtagggtgc cttgcacggt tataatgtca ctggttatta accaattttt    300

cctgggggtc gac                                                       313

<210>8

<211>192

<212>DNA

<213>人工序列

<220>

<223>突变体nlpD启动子

<400>8

gcatgcacgc gtggcgatct ggcctgactg ccttgttagc atttcttcat aactgtttca    60

tggaatcagg tagttgatat tgctactatc cagttcattc aacgaaaatc cagcgtttaa    120

cgtgccgcac agtgtattgt gctggtgaga cgagtaagtc agttttttaa aggttgccac    180

cacggggtcg ac                                                        192

<210>9

<211>192

<212>DNA

<213>人工序列

<220>

<223>突变体nlpD启动子

<400>9

gcatgcacgc gtggcgatct ggcctgactg ccttgttagc atttcttcat aactgtttca    60

tggaatcagg tagttgatat tgctactatc cagttcattc aacgaaaatc cagcgtttaa    120

cgtgccgcac agtgtattgt gctggtgaga cgagtaagtc agttttttaa aggttgccac    180

cacggagtcg ac                                                        192

<210>10

<211>1779

<212>DNA

<213>Pantoea ananatis

<220>

<221>CDS

<222>(301)..(1536)

<400>10

gtcaaaaccc tcaaaaaata aagcaccggg cgcacaacag ggcgcccgct ttttttgatt  60

taaaaaaact tttctcacca ggctgaaatt tggtgactta tgtcacataa ccgtcatcgg  120

cagcgggttc gttcttctcg atgcggccaa cccacgattt tgtctggcaa agtacgtcct  180

ctgagccctg ceatgctggc ggtcaggcaa tcgtttgtat tgccgcaggc gatttttttg  240

atattttgac agacggctga ctgcgttcag tcctcgttga attctgaata gggttgggaa  300

atg gca aag gta tca ctg gaa aaa gac aaa att aag ttc ctg ctg gtg    348

Met Ala Lys Val Ser Leu Glu Lys Asp Lys Ile Lys Phe Leu Leu Val

1               5                   10                  15

gaa ggt gtc cat cag agc gcg ctg gaa aat ctt cgt gct gca ggt tac    396

Glu Gly Val His Gln Ser Ala Leu Glu Asn Leu Arg Ala Ala Gly Tyr

            20                  25                  30

acc aat att gaa ttc cac aaa ggc gca ctg gat gcc gag gcg tta aaa    444

Thr Asn Ile Glu Phe His Lys Gly Ala Leu Asp Ala Glu Ala Leu Lys

        35                  40                  45

gct tcc gct cgc gat gcg cat ttt atc ggt atc cgt tcc cgt tcc caa    492

Ala Ser Ala Arg Asp Ala His Phe Ile Gly Ile Arg Ser Arg Ser Gln

    50                  55                  60

ctg acc gaa gag att ttt gcc gct gca gaa aaa ctg gta gcg gtg ggc    540

Leu Thr Glu Glu Ile Phe Ala Ala Ala Glu Lys Leu Val Ala Val Gly

65                  70                  75                  80

tgt ttc tgt atc gga acg aat cag gtt gat tta aat gcc gca gcg aaa    588

Cys Phe Cys Ile Gly Thr Asn Gln Val Asp Leu Asn Ala Ala Ala Lys

                85                  90                  95

cgc ggt atc ccg gtt ttt aac gca cct ttc tca aat acg cgc tct gtg    636

Arg Gly Ile Pro Val Phe Asn Ala Pro Phe Ser Asn Thr Arg Ser Val

            100                 105                 110

gcc gag ctg gtt att ggc gag atg ctg ctg atg ctg cgc ggt gtt ccg    684

Ala Glu Leu Val Ile Gly Glu Met Leu Leu Met Leu Arg Gly Val Pro

        115                 120                 125

gaa gcg aat gcc aaa gcg cac cgt ggt atc tgg aat aaa atc gcc aaa    732

Glu Ala Asn Ala Lys Ala His Arg Gly Ile Trp Asn Lys Ile Ala Lys

    130                 135                 140

ggc tct ttt gaa gcg cgc ggt aaa aag ctg ggt atc att ggc tat ggc    780

Gly Ser Phe Glu Ala Arg Gly Lys Lys Leu Gly Ile Ile Gly Tyr Gly

145                 150                 155                 160

cat atc ggt atg caa ctg ggc gtg ctg gca gaa agt ctg ggc atg cac    828

His Ile Gly Met Gln Leu Gly Val Leu Ala Glu Ser Leu Gly Met His

                165                 170                 175

gtt tac ttc tat gac atc gaa aac aag ctg ccg ttg ggc aac gca tca    876

Val Tyr Phe Tyr Asp Ile Glu Asn Lys Leu Pro Leu Gly Asn Ala Ser

            180                 185                 190

cag gtt cgt agc ctg acg cag ttg cta aat atg agt gac gtt gtc agc    924

Gln Val Arg Ser Leu Thr Gln Leu Leu Asn Met Ser Asp Val Val Ser

        195                 200                 205

ctg cat gtc ccg gaa acc gcc tct acg caa aat atg att tct gcc aat    972

Leu His Val Pro Glu Thr Ala Ser Thr Gln Asn Met Ile Ser Ala Asn

    210                 215                 220

gag ctg gct cag atg aag cct ggc ggc ctg ctg ata aat gcc tca cgc    1020

Glu Leu Ala Gln Met Lys Pro Gly Gly Leu Leu Ile Asn Ala Ser Arg

225                 230                 235                 240

ggc acc gtg gta gat att cct gct ttg tgc gaa gcg ctg gcc agc aag    1068

Gly Thr Val Val Asp Ile Pro Ala Leu Cys Glu Ala Leu Ala Ser Lys

                245                 250                 255

cag gtt ggt ggc gct gcg att gat gtg ttc cct gta gag ccg gcg acc    1116

Gln Val Gly Gly Ala Ala Ile Asp Val Phe Pro Val Glu Pro Ala Thr

            260                 265                 270

aac agc gat ccg ttt gtt tcc cca ctg agc gaa ttc gac aac gtt atc    1164

Asn Ser Asp Pro Phe Val Ser Pro Leu Ser Glu Phe Asp Asn Val Ile

        275                 280                 285

ctg acg ccg cac atc ggg gga tcg acg gaa gaa gct cag gag aat atc    1212

Leu Thr Pro His Ile Gly Gly Ser Thr Glu Glu Ala Gln Glu Asn Ile

    290                 295                 300

ggg att gaa gtc gcg ggc aag ctg gcg aaa tat tcg gat aac ggt tca    1260

Gly Ile Glu Val Ala Gly Lys Leu Ala Lys Tyr Ser Asp Asn Gly Ser

305                 310                 315                 320

acg ctg tcc gcc gtc aat ttc ccg gaa gtg tca ttg ccg atg cac ggc    1308

Thr Leu Ser Ala Val Asn Phe Pro Glu Val Ser Leu Pro Met His Gly

                325                 330                 335

att agc gcc agt cgt ctg ctg cat att cac gaa aac cgt ccg ggc gtt    1356

Ile Ser Ala Ser Arg Leu Leu His Ile His Glu Asn Arg Pro Gly Val

            340                 345                 350

ctc acc gcg atc aac cag att ttc gct gaa caa ggc atc aac att gcc    1404

Leu Thr Ala Ile Asn Gln Ile Phe Ala Glu Gln Gly Ile Asn Ile Ala

        355                 360                 365

gct cag tac ctg caa acc tct ccg atg atg ggt tat gtg gtc atc gac    1452

Ala Gln Tyr Leu Gln Thr Ser Pro Met Met Gly Tyr Val Val Ile Asp

    370                 375                 380

att gat gct gag cac gaa ctg gca gag aaa gct ctg caa ctg atg aag    1500

Ile Asp Ala Glu His Glu Leu Ala Glu Lys Ala Leu Gln Leu Met Lys

385                 390                 395                 400

gcg att ccg gga acg att cgc gcc cgc ctg ctt tac tgatcccacg         1546

Ala Ile Pro Gly Thr Ile Arg Ala Arg Leu Leu Tyr

                405                 410

ctgtcaccta cccgggcaca caagcatgcc cgggtttatt catcccatag ccacagtttt  1606

gatggcgtca gcacggccgg caaaggaatg tcccacgccg ctgtaggcag cgcgtcaacc  1666

cgctgacagt catgagcgat gcccaccggt aaaaacccat gctgtttcca gttctgtaag  1726

gtgcgatcgt agaagccgcc ccccattcct aaacgctgtc cggcgcgatc gaa         1779

<210>11

<211>412

<212>PRT

<213>Pantoea ananatis

<400>11

Met Ala Lys Val Ser Leu Glu Lys Asp Lys Ile Lys Phe Leu Leu Val

1               5                   10                  15

Glu Gly Val His Gln Ser Ala Leu Glu Asn Leu Arg Ala Ala Gly Tyr

20                  25                  30

Thr Asn Ile Glu Phe His Lys Gly Ala Leu Asp Ala Glu Ala Leu Lys

35                  40                  45

Ala Ser Ala Arg Asp Ala His Phe Ile Gly Ile Arg Ser Arg Ser Gln

50                  55                  60

Leu Thr Glu Glu Ile Phe Ala Ala Ala Glu Lys Leu Val Ala Val Gly

65                  70                  75                  80

Cys Phe Cys Ile Gly Thr Asn Gln Val Asp Leu Asn Ala Ala Ala Lys

                85                  90                  95

Arg Gly Ile Pro Val Phe Asn Ala Pro Phe Ser Asn Thr Arg Ser Val

            100                 105                 110

Ala Glu Leu Val Ile Gly Glu Met Leu Leu Met Leu Arg Gly Val Pro

        115                 120                 125

Glu Ala Asn Ala Lys Ala His Arg Gly Ile Trp Asn Lys Ile Ala Lys

    130                 135                 140

Gly Ser Phe Glu Ala Arg Gly Lys Lys Leu Gly Ile Ile Gly Tyr Gly

145                 150                 155                 160

His Ile Gly Met Gln Leu Gly Val Leu Ala Glu Ser Leu Gly Met His

                165                 170                 175

Val Tyr Phe Tyr Asp Ile Glu Asn Lys Leu Pro Leu Gly Asn Ala Ser

            180                 185                 190

Gln Val Arg Ser Leu Thr Gln Leu Leu Asn Met Ser Asp Val Val Ser

        195                 200                 205

Leu His Val Pro Glu Thr Ala Ser Thr Gln Asn Met Ile Ser Ala Asn

    210                 215                 220

Glu Leu Ala Gln Met Lys Pro Gly Gly Leu Leu Ile Asn Ala Ser Arg

225                 230                 235                 240

Gly Thr Val Val Asp Ile Pro Ala Leu Cys Glu Ala Leu Ala Ser Lys

                245                 250                 255

Gln Val Gly Gly Ala Ala Ile Asp Val Phe Pro Val Glu Pro Ala Thr

            260                 265                 270

Asn Ser Asp Pro Phe Val Ser Pro Leu Ser Glu Phe Asp Asn Val Ile

        275                 280                 285

Leu Thr Pro His Ile Gly Gly Ser Thr Glu Glu Ala Gln Glu Asn Ile

    290                 295                 300

Gly Ile Glu Val Ala Gly Lys Leu Ala Lys Tyr Ser Asp Asn Gly Ser

305                 310                 315                 320

Thr Leu Ser Ala Val Asn Phe Pro Glu Val Ser Leu Pro Met His Gly

                325                 330                 335

Ile Ser Ala Ser Arg Leu Leu His Ile His Glu Asn Arg Pro Gly Val

            340                 345                 350

Leu Thr Ala Ile Asn Gln Ile Phe Ala Glu Gln Gly Ile Asn Ile Ala

        355                 360                 365

Ala Gln Tyr Leu Gln Thr Ser Pro Met Met Gly Tyr Val Val Ile Asp

    370                 375                 380

Ile Asp Ala Glu His Glu Leu Ala Glu Lys Ala Leu Gln Leu Met Lys

385                 390                 395                 400

Ala Ile Pro Gly Thr Ile Arg Ala Arg Leu Leu Tyr

                405                 410

<210>12

<211>4403

<212>DNA

<213>Pantoea ananatis

<220>

<221>CDS

<222>(301)..(1311)

<220>

<221>CDS

<222>(1317)..(2147)

<220>

<221>CDS

<222>(2150)..(3022)

<400>12

tacagcggaa cctggcacgg gccagaaggg ttgatgccgt cggatgacac actcaagagc  60

tggacgctca gcaaaattgt ctggcagcgc taagtctttt ttcacaccgc tcaaccgcag  120

ggcataaccg gccctgcgcg tccaattctg tttttcgtct gtcttttccc gccgccttat  180

gcctttttcg actttgaaat cagcaaacga tatataaaac cgttacgggt ttacgctgag  240

ttataaataa actgctgtat ctgcagatga gatctgcatc aaatttcctc agggtgaacc  300

atg acc tta cca gcg atg aaa aaa atc gtg agc gga ctc gca ctg tcg    348

Met Thr Leu Pro Ala Met Lys Lys Ile Val Ser Gly Leu Ala Leu Ser

1               5                   10                  15

ctg agt ctg gcc ggt gcc gca aac gcg acc gag ctg ttg aac agc tct    396

Leu Ser Leu Ala Gly Ala Ala Asn Ala Thr Glu Leu Leu Asn Ser Ser

            20                  25                  30

tac gat gtc gca cgt gaa tta ttt gtc gcc ctg aat gcg cct ttt gtc    444

Tyr Asp Val Ala Arg Glu Leu Phe Val Ala Leu Asn Ala Pro Phe Val

        35                  40                  45

agc cag tgg gat gcc agc cat cct gac gac aag ctg acc att aag atg    492

Ser Gln Trp Asp Ala Ser His Pro Asp Asp Lys Leu Thr Ile Lys Met

    50                  55                  60

tcc cat gcc ggg tca tcc aaa cag gcg ctg gcg atc ctg caa ggc ctg    540

Ser His Ala Gly Ser Ser Lys Gln Ala Leu Ala Ile Leu Gln Gly Leu

65                  70                  75                  80

cgt gcc gat gtg gtg acc tat aac cag gtc acc gat gtg cag gtg ctg    588

Arg Ala Asp Val Val Thr Tyr Asn Gln Val Thr Asp Val Gln Val Leu

                85                  90                  95

cac gat aaa ggc aaa ctg atc cct gcc gac tgg caa acc cgc ctg ccg    636

His Asp Lys Gly Lys Leu Ile Pro Ala Asp Trp Gln Thr Arg Leu Pro

            100                 105                 110

aat aac agt tcg ccg ttt tac tcc acc atg gcg ttc ctg gtg cgc aag    684

Asn Asn Ser Ser Pro Phe Tyr Ser Thr Met Ala Phe Leu Val Arg Lys

        115                 120                 125

gga aac cca aag cag att cac gac tgg tcc gat tta acc cgt gac gat    732

Gly Asn Pro Lys Gln Ile His Asp Trp Ser Asp Leu Thr Arg Asp Asp

    130                 135                 140

gtg aag ctg att ttt cct aat ccc aaa acc tcg ggc aac gga cgt tat    780

Val Lys Leu Ile Phe Pro Asn Pro Lys Thr Ser Gly Asn Gly Arg Tyr

145                 150                 155                 160

acc tat ctt gct gcc tgg ggc gcc gcc agc aac act gac ggg ggc gat    828

Thr Tyr Leu Ala Ala Trp Gly Ala Ala Ser Asn Thr Asp Gly Gly Asp

                165                 170                 175

cag gct aaa acc cgc gct ttt atg aca aaa ttt ctg aaa aat gtt gaa    876

Gln Ala Lys Thr Arg Ala Phe Met Thr Lys Phe Leu Lys Asn Val Glu

            180                 185                 190

gtc ttc gat acc ggt ggc cga ggt gct acg acc acc ttt gct gaa cgc    924

Val Phe Asp Thr Gly Gly Arg Gly Ala Thr Thr Thr Phe Ala Glu Arg

        195                 200                 205

ggt ctg ggc gat gtg ttg atc agt ttt gag tct gaa gtg aat aac atc    972

Gly Leu Gly Asp Val Leu Ile Ser Phe Glu Ser Glu Val Asn Asn Ile

    210                 215                 220

cgc aac cag tac ggc aaa gac gac tac gaa gtc gtg gtg cct aaa acc    1020

Arg Asn Gln Tyr Gly Lys Asp Asp Tyr Glu Val Val Val Pro Lys Thr

225                 230                 235                 240

gat att ctc gcg gag ttt ccc gtt gcc tgg gta gat aaa aac gtc gag    1068

Asp Ile Leu Ala Glu Phe Pro Val Ala Trp Val Asp Lys Asn Val Glu

                245                 250                 255

cag aat aaa aca gcc gat gca gcg aaa gcc tat ctg acc tgg ctg tat    1116

Gln Asn Lys Thr Ala Asp Ala Ala Lys Ala Tyr Leu Thr Trp Leu Tyr

            260                 265                 270

tct cct gcg gcg cag aaa att att acg gat ttc tat tac cgc gtg aac    1164

Ser Pro Ala Ala Gln Lys Ile Ile Thr Asp Phe Tyr Tyr Arg Val Asn

        275                 280                 285

aat ccg cag tta atg gcg cag caa aaa gcc cgt ttt cct gcc acg aac    1212

Asn Pro Gln Leu Met Ala Gln Gln Lys Ala Arg Phe Pro Ala Thr Asn

    290                 295                 300

ctg ttt cgt gtt gaa gac att ttt ggc ggc tgg gat aac gtg atg aaa    1260

Leu Phe Arg Val Glu Asp Ile Phe Gly Gly Trp Asp Asn Val Met Lys

305                 310                 315                 320

acc cat ttc gcc agc ggt ggc gag cta gac cag tta tta gcg gcg ggg    1308

Thr His Phe Ala Ser Gly Gly Glu Leu Asp Gln Leu Leu Ala Ala Gly

                325                 330                 335

cgg tgatc atg ttt gca gcc agc caa aaa cgc gtc ctg ccc ggt ttc ggt  1358

Arg       Met Phe Ala Ala Ser Gln Lys Arg Val Leu Pro Gly Phe Gly

                  340                 345                 350

ctc agc ctg ggc acc agc ctg ctc ttt acc tgt ctg gtg ctg ctg ctg    1406

Leu Ser Leu Gly Thr Ser Leu Leu Phe Thr Cys Leu Val Leu Leu Leu

            355                 360                 365

cca atc agc gca ctg att atg cag ctg tcg cag atg acg ttg cag caa    1454

Pro Ile Ser Ala Leu Ile Met Gln Leu Ser Gln Met Thr Leu Gln Gln

        370                 375                 380

tac tgg gac gtg gtc acc aat ccg cag ctc atc gcg gcc tat aag gtc    1502

Tyr Trp Asp Val Val Thr Asn Pro Gln Leu Ile Ala Ala Tyr Lys Val

    385                 390                 395

acg ctg ctg tcg gcc ggt gtg gcc tca ctg ttt aat gcc gta ttc ggc    1550

Thr Leu Leu Ser Ala Gly Val Ala Ser Leu Phe Asn Ala Val Phe Gly

400                 405                 410                 415

atg tta atg gcg tgg atc tta acg cgt tac cgt ttt ccg ggc cgc acg    1598

Met Leu Met Ala Trp Ile Leu Thr Arg Tyr Arg Phe Pro Gly Arg Thr

                420                 425                 430

ctg ctc gat ggt ctg atg gat ctg ccg ttt gcg ctg ccg acc gcg gtt    1646

Leu Leu Asp Gly Leu Met Asp Leu Pro Phe Ala Leu Pro Thr Ala Val

            435                 440                 445

gct ggc ctg acg ctg gcc ggt ctg ttt tcc gtg aac ggc tgg tac gga    1694

Ala Gly Leu Thr Leu Ala Gly Leu Phe Ser Val Asn Gly Trp Tyr Gly

        450                 455                 460

caa tgg ttc gcg cat ttt gat atc aag atc tcc tat acc tgg atc ggt    1742

Gln Trp Phe Ala His Phe Asp Ile Lys Ile Ser Tyr Thr Trp Ile Gly

    465                 470                 475

atc gcg ctc gcg atg gcc ttc acc agt att ccg ttt gtg gtg cgt acc    1790

Ile Ala Leu Ala Met Ala Phe Thr Ser Ile Pro Phe Val Val Arg Thr

480                 485                 490                 495

gtg cag ccg gtg ctg gaa gag ctg ggg cct gaa tat gag gaa gcg gct    1838

Val Gln Pro Val Leu Glu Glu Leu Gly Pro Glu Tyr Glu Glu Ala Ala

                500                 505                 510

caa acg ctg ggc gcc acg ccc tgg cag agc ttc cgc cgg gtc gtt ctg    1886

Gln Thr Leu Gly Ala Thr Pro Trp Gln Ser Phe Arg Arg Val Val Leu

            515                 520                 525

cct gaa gtg gca ccg gcc tta ctt gcg ggc acc gcg ctg tcg ttt acc    1934

Pro Glu Val Ala Pro Ala Leu Leu Ala Gly Thr Ala Leu Ser Phe Thr

        530                 535                 540

cgc agc ctg ggc gag ttt ggt gcg gta atc ttt att gcc ggc aac atc    1982

Arg Ser Leu Gly Glu Phe Gly Ala Val Ile Phe Ile Ala Gly Asn Ile

    545                 550                 555

gct tgg aaa acc gaa gtg acc tcg ctg atg atc ttc gtg cgc ctg cag    2030

Ala Trp Lys Thr Glu Val Thr Ser Leu Met Ile Phe Val Arg Leu Gln

560                 565                 570                 575

gag ttt gac tat ccg gca gcc agc gcc att gcc tcg gtc att ctg gcg    2078

Glu Phe Asp Tyr Pro Ala Ala Ser Ala Ile Ala Ser Val Ile Leu Ala

                580                 585                 590

gca tca ctg ctg tta ctt ttc gct atc aat acc tta caa agc cgc ttt    2126

Ala Ser Leu Leu Leu Leu Phe Ala Ile Asn Thr Leu Gln Ser Arg Phe

            595                 600                 605

ggt cgt cgt ctg gga ggc cat ta atg gca gag att tcg caa ctc aat     2173

Gly Arg Arg Leu Gly Gly His    Met Ala Glu Ile Ser Gln Leu Asn

        610                    615                 620

cat gcc gac cgc cag cct gtt aac tgg gcc aag tgg ctg ctt att ggt    2221

His Ala Asp Arg Gln Pro Val Asn Trp Ala Lys Trp Leu Leu Ile Gly

        625                 630                 635

att ggt gcg ctg ata tcc ttg ctg ctg ctg gtc gtg ccg atg gtg tcc    2269

Ile Gly Ala Leu Ile Ser Leu Leu Leu Leu Val Val Pro Met Val Ser

    640                 645                 650

atc ttc tgg gag gcc ctg cat aaa gga ctg ggc gtc acc tta agt aat    2317

Ile Phe Trp Glu Ala Leu His Lys Gly Leu Gly Val Thr Leu Ser Asn

655                 660                 665                 670

ctg acc gac agc gac atg ctc cat gcc ata tgg ctc acg gtg ctg gtc    2365

Leu Thr Asp Ser Asp Met Leu His Ala Ile Trp Leu Thr Val Leu Val

                675                 680                 685

gca ttg att acc gtg ccg gtg aat tta gtg ttc ggc acg ctg ctg gcc    2413

Ala Leu Ile Thr Val Pro Val Asn Leu Val Phe Gly Thr Leu Leu Ala

            690                 695                 700

tgg ctg gtg aca cgc ttt acc ttt ccg gga cgt cag ctg ctt ttg acg    2461

Trp Leu Val Thr Arg Phe Thr Phe Pro Gly Arg Gln Leu Leu Leu Thr

        705                 710                 715

ctg ttc gat att ccc ttt gcg gta tcg cct gtg gtc gcc ggt ctg atg    2509

Leu Phe Asp Ile Pro Phe Ala Val Ser Pro Val Val Ala Gly Leu Met

    720                 725                 730

tat ctc ctg ttc tgg ggc att aac ggc ccg gcg ggc ggc tgg ctg gat    2557

Tyr Leu Leu Phe Trp Gly Ile Asn Gly Pro Ala Gly Gly Trp Leu Asp

735                 740                 745                 750

gcc cat aat att cag gtg atg ttc tcc tgg cct ggc atg gtg ctg gtc    2605

Ala His Asn Ile Gln Val Met Phe Ser Trp Pro Gly Met Val Leu Val

                755                 760                 765

acc gtc ttc gtt acc tgt ccg ttt gtg gtg cgc gaa ctg gtg ccg gtg    2653

Thr Val Phe Val Thr Cys Pro Phe Val Val Arg Glu Leu Val Pro Val

            770                 775                 780

atg ctg agc cag ggc agt cat gaa gat gaa gcc gcg gtg ctg tta ggt    2701

Met Leu Ser Gln Gly Ser His Glu Asp Glu Ala Ala Val Leu Leu Gly

        785                 790                 795

gcc tcg ggc tgg cag atg ttc cgt cgc gtg acg ctg ccg aat att cgc    2749

Ala Ser Gly Trp Gln Met Phe Arg Arg Val Thr Leu Pro Asn Ile Arg

    800                 805                 810

tgg gcc atg ctg tat ggc gtc gtg ctg acc aac gcc cgc gcg att ggt    2797

Trp Ala Met Leu Tyr Gly Val Val Leu Thr Asn Ala Arg Ala Ile Gly

815                 820                 825                 830

gag ttt ggc gcg gtt tcc gtg gtt tcg ggt tct att cgc ggt gaa acc      2845

Glu Phe Gly Ala Val Ser Val Val Ser Gly Ser Ile Arg Gly Glu Thr

                835                 840                 845

tac act tta ccg ctt cag gtt gaa tta ctg cat cag gat tac aac acg      2893

Tyr Thr Leu Pro Leu Gln Val Glu Leu Leu His Gln Asp Tyr Asn Thr

            850                 855                 860

gtg ggc gcc ttt act gcc gca gcc tta ctg acc gtg atg gca atc gtg      2941

Val Gly Ala Phe Thr Ala Ala Ala Leu Leu Thr Val Met Ala Ile Val

        865                 870                 875

acg ctg ttt ctg aaa agc att gtg caa tgg cgt tta gag caa cag cac      2989

Thr Leu Phe Leu Lys Ser Ile Val Gln Trp Arg Leu Glu Gln Gln His

    880                 885                 890

aaa cgc ctg caa ctg gag gac aat cat gag cat tgagattaac cagatcaaca    3042

Lys Arg Leu Gln Leu Glu Asp Asn His Glu His

895                 900                 905

aatcctttgg tcgcacagcg gtgctgaacg atatctcact ggatattcct tctggccaga    3102

tggtggcctt actggggccg tccggttccg gtaaaaccac gctgctgcgc atcattgctg    3162

gactggaaca tcagaacagc ggtcagattc gttttcacga ccacgatgtc agccgcctgc    3222

acgcccgcga tcgccaggtc ggatttgtct tccagcacta tgcgctgttc cgtcatatga    3282

cggtcttcga caatattgcc tttggcctga ccgtgctgcc gcgccgtgag cgtccgtcca    3342

gtgcggaaat taaaaaacgc gtcacgcgcc tgctggagat ggtgcagctt tcccatctgg    3402

cgaaccgttt cccggcccag ctttcgggag ggcagaagca gcgcgtcgcg ctggcaagag    3462

ccctggccgt ggaaccgcaa atcctgttgc tggatgagcc ctttggtgcg ctggacgctc    3522

aggtgcgtaa agagctgcgc cgttggttac gtcagctgca cgaagaattg aagttcacca    3582

gcgtgttcgt cacccacgat caggaagagg cgatggaagt ggccgatcgc gtggtggtga    3642

tgagccaggg cagcatcgaa caggtgggga cgccggatga agtctggcgc gatcccgcca    3702

cgcgcttcgt gctggaattc ctgggtgagg ttaaccgctt cgacggtgaa gtgcatggtt    3762

ctcagttcca tgtcggggcg caccactggc cgttaggcta tacctctgca catcagggcg    3822

cggtcgatct gttcctgcgc ccgtgggaaa tcgacgtttc gcgcagaagt agcctggaaa    3882

cgccgctgcc cgttcaggtc ttagaagtga gtcctcgtgg tcacttctgg cagctggtgg    3942

tgcagccaac gggatggcag agcgagccct tctcgctggt ctttgacggt gaacagaccg    4002

cgccgttgcg cggcgagcgc ctgttcgtgg ggctgcagca ggccagactg taccagggcg    4062

cgacaccgtt acgggcggtt gcctttgcac acagcgcctg ataggttgag tgaatgttaa    4122

acgcccggag gcgcttcccg cgatccgggc tttttaatgg caaggtttgt aacctgtaga    4182

cctgataaga cgcgcaagcg tcgcatcagg caacaccacg tatggataga gatcgtgagt    4242

acattagaac aaacaatagg caatacgcct ctggtgaagt tgcagcgaat ggggccggat    4302

aacggcagtg aagtgtggtt aaaactggaa ggcaataacc cggcaggttc ggtgaaagat    4362

cgtgcggcac tttcgatgat cgtcgaggcg gaaaagcgcg g                        4403

<210>13

<211>337

<212>PRT

<213>Pantoea ananatis

<400>13

Met Thr Leu Pro Ala Met Lys Lys Ile Val Ser Gly Leu Ala Leu Ser

1               5                   10                  15

Leu Ser Leu Ala Gly Ala Ala Asn Ala Thr Glu Leu Leu Asn Ser Ser

            20                  25                  30

Tyr Asp Val Ala Arg Glu Leu Phe Val Ala Leu Asn Ala Pro Phe Val

        35                  40                  45

Ser Gln Trp Asp Ala Ser His Pro Asp Asp Lys Leu Thr Ile Lys Met

    50                  55                  60

Ser His Ala Gly Ser Ser Lys Gln Ala Leu Ala Ile Leu Gln Gly Leu

65                  70                  75                  80

Arg Ala Asp Val Val Thr Tyr Asn Gln Val Thr Asp Val Gln Val Leu

                85                  90                  95

His Asp Lys Gly Lys Leu Ile Pro Ala Asp Trp Gln Thr Arg Leu Pro

            100                 105                 110

Asn Asn Ser Ser Pro Phe Tyr Ser Thr Met Ala Phe Leu Val Arg Lys

        115                 120                 125

Gly Asn Pro Lys Gln Ile His Asp Trp Ser Asp Leu Thr Arg Asp Asp

    130                 135                 140

Val Lys Leu Ile Phe Pro Asn Pro Lys Thr Ser Gly Asn Gly Arg Tyr

145                 150                 155                 160

Thr Tyr Leu Ala Ala Trp Gly Ala Ala Ser Asn Thr Asp Gly Gly Asp

                165                 170                 175

Gln Ala Lys Thr Arg Ala Phe Met Thr Lys Phe Leu Lys Asn Val Glu

            180                 185                 190

Val Phe Asp Thr Gly Gly Arg Gly Ala Thr Thr Thr Phe Ala Glu Arg

        195                 200                 205

Gly Leu Gly Asp Val Leu Ile Ser Phe Glu Ser Glu Val Asn Asn Ile

    210                 215                 220

Arg Asn Gln Tyr Gly Lys Asp Asp Tyr Glu Val Val Val Pro Lys Thr

225                 230                 235                 240

Asp Ile Leu Ala Glu Phe Pro Val Ala Trp Val Asp Lys Asn Val Glu

                245                 250                 255

Gln Asn Lys Thr Ala Asp Ala Ala Lys Ala Tyr Leu Thr Trp Leu Tyr

            260                 265                 270

Ser Pro Ala Ala Gln Lys Ile Ile Thr Asp Phe Tyr Tyr Arg Val Asn

        275                 280                 285

Asn Pro Gln Leu Met Ala Gln Gln Lys Ala Arg Phe Pro Ala Thr Asn

    290                 295                 300

Leu Phe Arg Val Glu Asp Ile Phe Gly Gly Trp Asp Asn Val Met Lys

305                 310                 315                 320

Thr His Phe Ala Ser Gly Gly Glu Leu Asp Gln Leu Leu Ala Ala Gly

                325                 330                 335

Arg

<210>14

<211>277

<212>PRT

<213>Pantoea ananatis

<400>14

Met Phe Ala Ala Ser Gln Lys Arg Val Leu Pro Gly Phe Gly Leu Ser

1               5                   10                  15

Leu Gly Thr Ser Leu Leu Phe Thr Cys Leu Val Leu Leu Leu Pro Ile

            20                  25                  30

Ser Ala Leu Ile Met Gln Leu Ser Gln Met Thr Leu Gln Gln Tyr Trp

        35                  40                  45

Asp Val Val Thr Asn Pro Gln Leu Ile Ala Ala Tyr Lys Val Thr Leu

    50                  55                  60

Leu Ser Ala Gly Val Ala Ser Leu Phe Asn Ala Val Phe Gly Met Leu

65                  70                  75                  80

Met Ala Trp Ile Leu Thr Arg Tyr Arg Phe Pro Gly Arg Thr Leu Leu

                85                  90                  95

Asp Gly Leu Met Asp Leu Pro Phe Ala Leu Pro Thr Ala Val Ala Gly

            100                 105                 110

Leu Thr Leu Ala Gly Leu Phe Ser Val Asn Gly Trp Tyr Gly Gln Trp

        115                 120                 125

Phe Ala His Phe Asp Ile Lys Ile Ser Tyr Thr Trp Ile Gly Ile Ala

    130                 135                 140

Leu Ala Met Ala Phe Thr Ser Ile Pro Phe Val Val Arg Thr Val Gln

145                 150                 155                 160

Pro Val Leu Glu Glu Leu Gly Pro Glu Tyr Glu Glu Ala Ala Gln Thr

                165                 170                 175

Leu Gly Ala Thr Pro Trp Gln Ser Phe Arg Arg Val Val Leu Pro Glu

            180                 185                 190

Val Ala Pro Ala Leu Leu Ala Gly Thr Ala Leu Ser Phe Thr Arg Ser

        195                 200                 205

Leu Gly Glu Phe Gly Ala Val Ile Phe Ile Ala Gly Asn Ile Ala Trp

    210                 215                 220

Lys Thr Glu Val Thr Ser Leu Met Ile Phe Val Arg Leu Gln Glu Phe

225                 230                 235                 240

Asp Tyr Pro Ala Ala Ser Ala Ile Ala Ser Val Ile Leu Ala Ala Ser

                245                 250                 255

Leu Leu Leu Leu Phe Ala Ile Asn Thr Leu Gln Ser Arg Phe Gly Arg

            260                 265                 270

Arg Leu Gly Gly His

        275

<210>15

<211>291

<212>PRT

<213>Pantoea ananatis

<400>15

Met Ala Glu Ile Ser Gln Leu Asn His Ala Asp Arg Gln Pro Val Asn

1               5                   10                  15

Trp Ala Lys Trp Leu Leu Ile Gly Ile Gly Ala Leu Ile Ser Leu Leu

            20                  25                  30

Leu Leu Val Val Pro Met Val Ser Ile Phe Trp Glu Ala Leu His Lys

        35                  40                  45

Gly Leu Gly Val Thr Leu Ser Asn Leu Thr Asp Ser Asp Met Leu His

    50                  55                  60

Ala Ile Trp Leu Thr Val Leu Val Ala Leu Ile Thr Val Pro Val Asn

65                  70                  75                  80

Leu Val Phe Gly Thr Leu Leu Ala Trp Leu Val Thr Arg Phe Thr Phe

                85                  90                  95

Pro Gly Arg Gln Leu Leu Leu Thr Leu Phe Asp Ile Pro Phe Ala Val

            100                 105                 110

Ser Pro Val Val Ala Gly Leu Met Tyr Leu Leu Phe Trp Gly Ile Asn

        115                 120                 125

Gly Pro Ala Gly Gly Trp Leu Asp Ala His Asn Ile Gln Val Met Phe

    130                 135                 140

Ser Trp Pro Gly Met Val Leu Val Thr Val Phe Val Thr Cys Pro Phe

145                 150                 155                 160

Val Val Arg Glu Leu Val Pro Val Met Leu Ser Gln Gly Ser His Glu

                165                 170                 175

Asp Glu Ala Ala Val Leu Leu Gly Ala Ser Gly Trp Gln Met Phe Arg

            180                 185                 190

Arg Val Thr Leu Pro Asn Ile Arg Trp Ala Met Leu Tyr Gly Val Val

        195                 200                 205

Leu Thr Asn Ala Arg Ala Ile Gly Glu Phe Gly Ala Val Ser Val Val

    210                 215                 220

Ser Gly Ser Ile Arg Gly Glu Thr Tyr Thr Leu Pro Leu Gln Val Glu

225                 230                 235                 240

Leu Leu His Gln Asp Tyr Asn Thr Val Gly Ala Phe Thr Ala Ala Ala

                245                 250                 255

Leu Leu Thr Val Met Ala Ile Val Thr Leu Phe Leu Lys Ser Ile Val

            260                 265                 270

Gln Trp Arg Leu Glu Gln Gln His Lys Arg Leu Gln Leu Glu Asp Asn

        275                 280                 285

His Glu His

    290

<210>16

<211>1403

<212>DNA

<213>Pantoea ananatis

<220>

<221>CDS

<222>(15)..(1103)

<400>16

actggaggac aatc atg agc att gag att aac cag atc aac aaa tcc ttt    50

                Met Ser Ile Glu Ile Asn Gln Ile Asn Lys Ser Phe

                1               5                   10

ggt cgc aca gcg gtg ctg aac gat atc tca ctg gat att cct tct ggc    98

Gly Arg Thr Ala Val Leu Asn Asp Ile Ser Leu Asp Ile Pro Ser Gly

        15                  20                  25

cag atg gtg gcc tta ctg ggg ccg tcc ggt tcc ggt aaa acc acg ctg    146

Gln Met Val Ala Leu Leu Gly Pro Ser Gly Ser Gly Lys Thr Thr Leu

    30                  35                  40

ctg cgc atc att gct gga ctg gaa cat cag aac agc ggt cag att cgt    194

Leu Arg Ile Ile Ala Gly Leu Glu His Gln Asn Ser Gly Gln Ile Arg

45                  50                  55                  60

ttt cac gac cac gat gtc agc cgc ctg cac gcc cgc gat cgc cag gtc    242

Phe His Asp His Asp Val Ser Arg Leu His Ala Arg Asp Arg Gln Val

                65                  70                  75

gga ttt gtc ttc cag cac tat gcg ctg ttc cgt cat atg acg gtc ttc    290

Gly Phe Val Phe Gln His Tyr Ala Leu Phe Arg His Met Thr Val Phe

            80                  85                  90

gac aat att gcc ttt ggc ctg acc gtg ctg ccg cgc cgt gag cgt ccg    338

Asp Asn Ile Ala Phe Gly Leu Thr Val Leu Pro Arg Arg Glu Arg Pro

        95                  100                 105

tcc agt gcg gaa att aaa aaa cgc gtc acg cgc ctg ctg gag atg gtg    386

Ser Ser Ala Glu Ile Lys Lys Arg Val Thr Arg Leu Leu Glu Met Val

    110                 115                 120

cag ctt tcc cat ctg gcg aac cgt ttc ccg gcc cag ctt tcg gga ggg    434

Gln Leu Ser His Leu Ala Asn Arg Phe Pro Ala Gln Leu Ser Gly Gly

125                 130                 135                 140

cag aag cag cgc gtc gcg ctg gca aga gcc ctg gcc gtg gaa ccg caa    482

Gln Lys Gln Arg Val Ala Leu Ala Arg Ala Leu Ala Val Glu Pro Gln

                145                 150                 155

atc ctg ttg ctg gat gag ccc ttt ggt gcg ctg gac gct cag gtg cgt    530

Ile Leu Leu Leu Asp Glu Pro Phe Gly Ala Leu Asp Ala Gln Val Arg

            160                 165                 170

aaa gag ctg cgc cgt tgg tta cgt cag ctg cac gaa gaa ttg aag ttc    578

Lys Glu Leu Arg Arg Trp Leu Arg Gln Leu His Glu Glu Leu Lys Phe

        175                 180                 185

acc agc gtg ttc gtc acc cac gat cag gaa gag gcg atg gaa gtg gcc    626

Thr Ser Val Phe Val Thr His Asp Gln Glu Glu Ala Met Glu Val Ala

    190                 195                 200

gat cgc gtg gtg gtg atg agc cag ggc agc atc gaa cag gtg ggg acg    674

Asp Arg Val Val Val Met Ser Gln Gly Ser Ile Glu Gln Val Gly Thr

205                 210                 215                 220

ccg gat gaa gtc tgg cgc gat ccc gcc acg cgc ttc gtg ctg gaa ttc    722

Pro Asp Glu Val Trp Arg Asp Pro Ala Thr Arg Phe Val Leu Glu Phe

                225                 230                 235

ctg ggt gag gtt aac cgc ttc gac ggt gaa gtg cat ggt tct cag ttc    770

Leu Gly Glu Val Asn Arg Phe Asp Gly Glu Val His Gly Ser Gln Phe

            240                 245                 250

cat gtc ggg gcg cac cac tgg ccg tta ggc tat acc tct gca cat cag    818

His Val Gly Ala His His Trp Pro Leu Gly Tyr Thr Ser Ala His Gln

        255                 260                 265

ggc gcg gtc gat ctg ttc ctg cgc ccg tgg gaa atc gac gtt tcg cgc    866

Gly Ala Val Asp Leu Phe Leu Arg Pro Trp Glu Ile Asp Val Ser Arg

    270                 275                 280

aga agt agc ctg gaa acg ccg ctg ccc gtt cag gtc tta gaa gtg agt    914

Arg Ser Ser Leu Glu Thr Pro Leu Pro Val Gln Val Leu Glu Val Ser

285                 290                 295                 300

cct cgt ggt cac ttc tgg cag ctg gtg gtg cag cca acg gga tgg cag    962

Pro Arg Gly His Phe Trp Gln Leu Val Val Gln Pro Thr Gly Trp Gln

                305                 310                 315

agc gag ccc ttc tcg ctg gtc ttt gac ggt gaa cag acc gcg ccg ttg    1010

Ser Glu Pro Phe Ser Leu Val Phe Asp Gly Glu Gln Thr Ala Pro Leu

            320                 325                 330

cgc ggc gag cgc ctg ttc gtg ggg ctg cag cag gcc aga ctg tac cag    1058

Arg Gly Glu Arg Leu Phe Val Gly Leu Gln Gln Ala Arg Leu Tyr Gln

        335                 340                 345

ggc gcg aca ccg tta cgg gcg gtt gcc ttt gca cac agc gcc tga        1103

Gly Ala Thr Pro Leu Arg Ala Val Ala Phe Ala His Ser Ala

    350                 355                 360

taggttgagt gaatgttaaa cgcccggagg cgcttcccgc gatccgggct ttttaatggc  1163

aaggtttgta acctgtagac ctgataagac gcgcaagcgt cgcatcaggc aacaccacgt  1223

atggatagag atcgtgagta cattagaaca aacaataggc aatacgcctc tggtgaagtt  1283

gcagcgaatg gggccggata acggcagtga agtgtggtta aaactggaag gcaataaccc  1343

ggcaggttcg gtgaaagatc gtgcggcact ttcgatgatc gtcgaggcgg aaaagcgcgg  1403

<210>17

<211>362

<212>PRT

<213>Pantoea ananatis

<400>17

Met Ser Ile Glu Ile Asn Gln Ile Asn Lys Ser Phe Gly Arg Thr Ala

1               5                   10                  15

Val Leu Asn Asp Ile Ser Leu Asp Ile Pro Ser Gly Gln Met Val Ala

            20                  25                  30

Leu Leu Gly Pro Ser Gly Ser Gly Lys Thr Thr Leu Leu Arg Ile Ile

        35                  40                  45

Ala Gly Leu Glu His Gln Asn Ser Gly Gln Ile Arg Phe His Asp His

    50                  55                  60

Asp Val Ser Arg Leu His Ala Arg Asp Arg Gln Val Gly Phe Val Phe

65                  70                  75                  80

Gln His Tyr Ala Leu Phe Arg His Met Thr Val Phe Asp Asn Ile Ala

                85                  90                  95

Phe Gly Leu Thr Val Leu Pro Arg Arg Glu Arg Pro Ser Ser Ala Glu

            100                 105                 110

Ile Lys Lys Arg Val Thr Arg Leu Leu Glu Met Val Gln Leu Ser His

        115                 120                 125

Leu Ala Asn Arg Phe Pro Ala Gln Leu Ser Gly Gly Gln Lys Gln Arg

    130                 135                 140

Val Ala Leu Ala Arg Ala Leu Ala Val Glu Pro Gln Ile Leu Leu Leu

145                 150                 155                 160

Asp Glu Pro Phe Gly Ala Leu Asp Ala Gln Val Arg Lys Glu Leu Arg

                165                 170                 175

Arg Trp Leu Arg Gln Leu His Glu Glu Leu Lys Phe Thr Ser Val Phe

            180                 185                 190

Val Thr His Asp Gln Glu Glu Ala Met Glu Val Ala Asp Arg Val Val

        195                 200                 205

Val Met Ser Gln Gly Ser Ile Glu Gln Val Gly Thr Pro Asp Glu Val

    210                 215                 220

Trp Arg Asp Pro Ala Thr Arg Phe Val Leu Glu Phe Leu Gly Glu Val

225                 230                 235                 240

Asn Arg Phe Asp Gly Glu Val His Gly Ser Gln Phe His Val Gly Ala

                245                 250                 255

His His Trp Pro Leu Gly Tyr Thr Ser Ala His Gln Gly Ala Val Asp

            260                 265                 270

Leu Phe Leu Arg Pro Trp Glu Ile Asp Val Ser Arg Arg Ser Ser Leu

        275                 280                 285

Glu Thr Pro Leu Pro Val Gln Val Leu Glu Val Ser Pro Arg Gly His

    290                 295                 300

Phe Trp Gln Leu Val Val Gln Pro Thr Gly Trp Gln Ser Glu Pro Phe

305                 310                 315                 320

Ser Leu Val Phe Asp Gly Glu Gln Thr Ala Pro Leu Arg Gly Glu Arg

                325                 330                 335

Leu Phe Val Gly Leu Gln Gln Ala Arg Leu Tyr Gln Gly Ala Thr Pro

            340                 345                 350

Leu Arg Ala Val Ala Phe Ala His Ser Ala

        355                 360

<210>18

<211>1512

<212>DNA

<213>人工序列

<220>

<223>引物

<220>

<221>CDS

<222>(301)..(1212)

<400>18

agccgctggg gtggtacaac gaaccgctga cggtcgtgat gcatggcgac gatgccccgc  60

agcgtggcga gcgtttattc gttggtctgc aacatgcgcg gctgtataac ggcgacgagc  120

gtatcgaaac ccgcgatgag gaacttgctc tcgcacaaag cgcctgatag gttgagtgaa  180

tgttaaacgc ccggaggcgc ttcccgcgat ccgggctttt taatggcaag gtttgtaacc  240

tgtagacctg ataagacgcg caagcgtcgc atcaggcaac accacgtatg gatagagatc  300

gtg agt aca tta gaa caa aca ata ggc aat acg cct ctg gtg aag ttg    348

Val Ser Thr Leu Glu Gln Thr Ile Gly Asn Thr Pro Leu Val Lys Leu

1               5                   10                  15

cag cga atg ggg ccg gat aac ggc agt gaa gtg tgg tta aaa ctg gaa    396

Gln Arg Met Gly Pro Asp Asn Gly Ser Glu Val Trp Leu Lys Leu Glu

            20                  25                  30

ggc aat aac ccg gca ggt tcg gtg aaa gat cgt gcg gca ctt tcg atg    444

Gly Asn Asn Pro Ala Gly Ser Val Lys Asp Arg Ala Ala Leu Ser Met

        35                  40                  45

atc gtc gag gcg gaa aag cgc ggg gaa att aaa ccg ggt gat gtc tta    492

Ile Val Glu Ala Glu Lys Arg Gly Glu Ile Lys Pro Gly Asp Val Leu

    50                  55                  60

atc gaa gcc acc agt ggt aac acc ggc att gcg ctg gca atg att gcc    540

Ile Glu Ala Thr Ser Gly Asn Thr Gly Ile Ala Leu Ala Met Ile Ala

65                  70                  75                  80

gcg ctg aaa ggc tat cgc atg aaa ttg ctg atg ccc gac aac atg agc    588

Ala Leu Lys Gly Tyr Arg Met Lys Leu Leu Met Pro Asp Asn Met Ser

                85                  90                  95

cag gaa cgc cgt gcg gcg atg cgt gct tat ggt gcg gaa ctg att ctt    636

Gln Glu Arg Arg Ala Ala Met Arg Ala Tyr Gly Ala Glu Leu Ile Leu

            100                 105                 110

gtc acc aaa gag cag ggc atg gaa ggt gcg cgc gat ctg gcg ctg gag    684

Val Thr Lys Glu Gln Gly Met Glu Gly Ala Arg Asp Leu Ala Leu Glu

        115                 120                 125

atg gcg aat cgt ggc gaa gga aag ctg ctc gat cag ttc aat aat ccc    732

Met Ala Asn Arg Gly Glu Gly Lys Leu Leu Asp Gln Phe Asn Asn Pro

    130                 135                 140

gat aac cct tat gcg cat tac acc acc act ggg ccg gaa atc tgg cag    780

Asp Asn Pro Tyr Ala His Tyr Thr Thr Thr Gly Pro Glu Ile Trp Gln

145                 150                 155                 160

caa acc ggc ggg cgc atc act cat ttt gtc tcc agc atg ggg acg acc    828

Gln Thr Gly Gly Arg Ile Thr His Phe Val Ser Ser Met Gly Thr Thr

                165                 170                 175

ggc act atc acc ggc gtc tca cgc ttt atg cgc gaa caa tcc aaa ccg    876

Gly Thr Ile Thr Gly Val Ser Arg Phe Met Arg Glu Gln Ser Lys Pro

            180                 185                 190

gtg acc att gtc ggc ctg caa ccg gaa gag ggc agc agc att ccc ggc    924

Val Thr Ile Val Gly Leu Gln Pro Glu Glu Gly Ser Ser Ile Pro Gly

        195                 200                 205

att cgc cgc tgg cct acg gaa tat ctg ccg ggg att ttc aac gct tct    972

Ile Arg Arg Trp Pro Thr Glu Tyr Leu Pro Gly Ile Phe Asn Ala Ser

    210                 215                 220

ctg gtg gat gag gtg ctg gat att cat cag cgc gat gcg gaa aac acc    1020

Leu Val Asp Glu Val Leu Asp Ile His Gln Arg Asp Ala Glu Asn Thr

225                 230                 235                 240

atg cgc gaa ctg gcg gtg cgg gaa gga ata ttc tgt ggc gtc agc tcc    1068

Met Arg Glu Leu Ala Val Arg Glu Gly Ile Phe Cys Gly Val Ser Ser

                245                 250                 255

ggc ggc gcg gtt gcc gga gca ctg cgg gtg gca aaa gct aac cct gac    1116

Gly Gly Ala Val Ala Gly Ala Leu Arg Val Ala Lys Ala Asn Pro Asp

            260                 265                 270

gcg gtg gtg gtg gcg atc atc tgc gat cgt ggc gat cgc tac ctt tct    1164

Ala Val Val Val Ala Ile Ile Cys Asp Arg Gly Asp Arg Tyr Leu Ser

        275                 280                 285

acc ggg gtg ttt ggg gaa gag cat ttt agc cag ggg gcg ggg att taa    1212

Thr Gly Val Phe Gly Glu Glu His Phe Ser Gln Gly Ala Gly Ile

    290                 295                 300

ggattaatag catcggagac tgatgacaaa cgcaaaactg cctgatgcgc tacgcttatc  1272

aggcctacaa ggtttctgca atatattgaa ttagcacgat tttgtaggcc ggataaggcg  1332

tttacgccgc atccggcata aacaaagcgc acttttttaa cagttgttgc tgccgacaaa  1392

tgcagtattt aattttcgtg aggaaacgcc gtaaggtcat caatcatttt ttgaagtatt  1452

ggtgagtcct gaccgtcacc ccattgaaga atttttgcgg taagctgatg acgcgctagt  1512

<210>19

<211>303

<212>PRT

<213>人工序列

<220>

<223>合成构建体

<400>19

Val Ser Thr Leu Glu Gln Thr Ile Gly Asn Thr Pro Leu Val Lys Leu

1               5                   10                  15

Gln Arg Met Gly Pro Asp Asn Gly Ser Glu Val Trp Leu Lys Leu Glu

            20                  25                  30

Gly Asn Asn Pro Ala Gly Ser Val Lys Asp Arg Ala Ala Leu Ser Met

        35                  40                  45

Ile Val Glu Ala Glu Lys Arg Gly Glu Ile Lys Pro Gly Asp Val Leu

    50                  55                  60

Ile Glu Ala Thr Ser Gly Asn Thr Gly Ile Ala Leu Ala Met Ile Ala

65                  70                  75                  80

Ala Leu Lys Gly Tyr Arg Met Lys Leu Leu Met Pro Asp Asn Met Ser

                85                  90                  95

Gln Glu Arg Arg Ala Ala Met Arg Ala Tyr Gly Ala Glu Leu Ile Leu

            100                 105                 110

Val Thr Lys Glu Gln Gly Met Glu Gly Ala Arg Asp Leu Ala Leu Glu

        115                 120                 125

Met Ala Asn Arg Gly Glu Gly Lys Leu Leu Asp Gln Phe Asn Asn Pro

    130                 135                 140

Asp Asn Pro Tyr Ala His Tyr Thr Thr Thr Gly Pro Glu Ile Trp Gln

145                 150                 155                 160

Gln Thr Gly Gly Arg Ile Thr His Phe Val Ser Ser Met Gly Thr Thr

                165                 170                 175

Gly Thr Ile Thr Gly Val Ser Arg Phe Met Arg Glu Gln Ser Lys Pro

            180                 185                 190

Val Thr Ile Val Gly Leu Gln Pro Glu Glu Gly Ser Ser Ile Pro Gly

        195                 200                 205

Ile Arg Arg Trp Pro Thr Glu Tyr Leu Pro Gly Ile Phe Asn Ala Ser

    210                 215                 220

Leu Val Asp Glu Val Leu Asp Ile His Gln Arg Asp Ala Glu Asn Thr

225                 230                 235                 240

Met Arg Glu Leu Ala Val Arg Glu Gly Ile Phe Cys Gly Val Ser Ser

                245                 250                 255

Gly Gly Ala Val Ala Gly Ala Leu Arg Val Ala Lys Ala Asn Pro Asp

            260                 265                 270

Ala Val Val Val Ala Ile Ile Cys Asp Arg Gly Asp Arg Tyr Leu Ser

        275                 280                 285

Thr Gly Val Phe Gly Glu Glu His Phe Ser Gln Gly Ala Gly Ile

    290                 295                 300

<210>20

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物P1

<400>20

agctgagtcg acccccagga aaaat tggtt aataac                                  36

<210>21

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物P2

<400>21

agctgagcat gcttccaact gcgctaatga cgc                                      33

<210>22

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物P3

<400>22

agctgatcta gaaaacagaa tttgcctggc ggc                                      33

<210>23

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物P4

<400>23

agctgaggat ccaggaagag tttgtagaaa cgc                                      33

<210>24

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物P5

<400>24

agctgagtcg acgtgttcgc tgaatacggg gt                                    32

<210>25

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物P6

<400>25

agctgatcta gagaaagcat caggattgca gc                                    32

<210>26

<211>59

<212>DNA

<213>人工序列

<220>

<223>引物P7

<220>

<221>misc_feature

<222>(25)..(25)

<223>n为a,c,g或t

<220>

<221>misc_feature

<222>(27)..(28)

<223>n为a,c,g或t

<220>

<221>misc_feature

<222>(46)..(46)

<223>n为a,c,g或t

<220>

<221>misc_feature

<222>(49)..(49)

<223>n为a,c,g或t

<220>

<221>misc_feature

<222>(51)..(51)

<223>n为a,c,g或t

<400>26

atcgtgaaga tcttttccag tgttnannag ggtgccttgc acggtnatna ngtcactgg       59

<210>27

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物P8

<220>

<221>misc_feature

<222>(16)..(20)

<223>n为a,c,g或t

<400>27

tggaaaagat cttcannnnn cgctgacctg cg                                    32

<210>28

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物P9

<400>28

catgccatgg tcgctgaata cggggttctg                                       30

<210>29

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物P10

<400>29

aactgcagtc aggattgcag cgtcgcc                                          27

<210>30

<211>24

<212>DNA

<213>人工序列

<220>

<223>引物P11

<400>30

aaagccacgt tgtgtctcaa aatc                                             24

<210>31

<211>23

<212>DNA

<213>人工序列

<220>

<223>引物P12

<400>31

ggtgttgctg actcatacca ggc                                              23

<210>32

<211>21

<212>DNA

<213>人工序列

<220>

<223>引物P13

<400>32

gacaattaat catccggctc g                                                21

<210>33

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物P14

<400>33

tttatcagac cgcttctgcg                                                20

<210>34

<211>60

<212>DNA

<213>人工序列

<220>

<223>引物P15

<400>34

tccgctcacg atttttttca tcgctggtaa ggtcatttat cccccaggaa aaattggtta    60

<210>35

<211>63

<212>DNA

<213>人工序列

<220>

<223>引物P16

<400>35

tttcacaccg ctcaaccgca gggcataacc ggcccttgaa gcctgctttt ttatactaag    60

ttg                                                                  63

<210>36

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物P17

<400>36

ctttgtccct ttagtgaagg                                                20

<210>37

<211>44

<212>DNA

<213>人工序列

<220>

<223>引物P18

<400>37

agctgatcta gaagctgact cgagttaatg gcctcccaga cgac                     44

<210>38

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物P19

<400>38

agctgagtcg acatggcaaa ggtatcactg gaa                                 33

<210>39

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物P20

<400>39

gagaacgccc gggcgggctt cgtgaatatg cagc                               34

<210>40

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物P21

<400>40

agctgatcta gacgtgggat cagtaaagca gg                                 32

<210>41

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物P22

<400>41

aaaaccgccc gggcgttctc ac                                            22

<210>42

<211>43

<212>DNA

<213>人工序列

<220>

<223>引物P23

<400>42

agctgaaagc ttgcatgcac gcgtggcgat ctggcctgac tgc                     43

<210>43

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物P24

<400>43

agctgagtcg accccgtggt ggcaaccttt aaaaaactg                          39

<210>44

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物P25

<220>

<221>misc_feature

<222>(13)..(15)

<223>n为a,c,g或t

<400>44

agctgagtcg acnnngtggt ggcaaccttt aaaaaactg                          39

<210>45

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物P26

<400>45

agctgagtcg acgtgagtac attagaacaa acaat                                    35

<210>46

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物P27

<400>46

agctgatcta gaagtctccg atgctattaa tcc                                      33

<210>47

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物P28

<400>47

cgataaactg tacgaaagac gacacataga ac                                       32

<210>48

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物P29

<400>48

cgcggatcca gtggtcattt agtgc                                               25

<210>49

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物P30

<400>49

cgcggatcct gtgggatttg aagcatcc                                            28

<210>50

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物P31

<400>50

aagtcgacgt gttcgctgaa tacggggttc tg                                       32

<210>51

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物P32

<400>51

aatctagatc aggattgcag cgtcgcc                                            27

<210>52

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物P33

<400>52

aaacgtgagg aaatacctgg                                                    20

<210>53

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物P34

<220>

<221>misc_feature

<222>(17)..(19)

<223>n为a,c,g或t

<400>53

cgataaactg tacgaannnc gacacataga ac                                      32

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号