首页> 中国专利> 从2-脱氢-3-脱氧-D-葡糖酸生产2‘-脱氧核苷和2‘-脱氧核苷前体

从2-脱氢-3-脱氧-D-葡糖酸生产2‘-脱氧核苷和2‘-脱氧核苷前体

摘要

本发明涉及使用2-脱氢-3-脱氧-D-葡糖酸(通常缩写为KDG)或它的盐作为原料,制备2′-脱氧核苷化合物或2′-脱氧核苷前体的方法。许多2′-脱氧核苷和它们的类似物可作为生产抗病毒剂、抗癌剂或反义试剂的合成原料或药物配方使用。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-23

    未缴年费专利权终止 IPC(主分类):C07H7/027 授权公告日:20080528 终止日期:20190624 申请日:20040624

    专利权的终止

  • 2008-05-28

    授权

    授权

  • 2007-01-17

    发明专利申请公布说明书更正更正 卷:22 号:37 页码:扉页 更正项目:优先权 误:缺少优先权第二条 正:2003.12.02EP03027750.3 申请日:20040624

    发明专利申请公布说明书更正

  • 2006-11-08

    实质审查的生效

    实质审查的生效

  • 2006-09-13

    公开

    公开

说明书

本发明涉及使用2-脱氢-3-脱氧-D-葡糖酸(通常缩写为KDG)或它的盐作为原料,制备2′-脱氧核苷化合物或2′-脱氧核苷前体的方法。许多2′-脱氧核苷和它们的类似物可作为生产抗病毒剂、抗癌剂或反义试剂的合成或药物制剂原料使用。

更具体地,本发明涉及一种方法,其中对KDG或KDG的衍生物进行脱羧基步骤,以去除KDG的原始羧基。在一个优选的实施方案中,在根据本发明的方法中使用的KDG是从D-葡糖酸(盐)或D-葡糖胺(盐)酶促生产的。

包含2-脱氧-D-核糖的2′-脱氧核苷和2′-脱氧核苷前体可用作合成或药物制剂原料,例如,在抗病毒剂和抗癌剂的生产中。2′-脱氧核苷或其衍生物和2′-脱氧核苷前体也可用作治疗性反义分子的研究、诊断和合成的试剂。

在现有技术的一种方法中,从睾丸(WO 99/49074)或酵母或鱼精子等生物材料,通过酶促剪切DNA而生成脱氧核苷。但是,该方法有几个缺点,尤其是难以得到足够数量和质量的原料。

2-脱氧-D-核糖的主要生产方法目前包括化学水解DNA。在该情况下,脱氧核糖基部分源自核糖核苷酸还原酶活性。尚未公开从KDG合成2-脱氧-D-核糖。

在大多数活细胞中,脱氧核糖核苷是由核苷酸代谢的“补救途径”来源的。在核糖核苷酸还原酶催化下,通过将核糖基团还原成核糖核苷二磷酸盐或三磷酸盐,得到脱氧核糖核苷的脱氧核糖基团。但是,脱氧核糖基团不被回收,而是通过下面的中心代谢反应降解成D-甘油醛-3-磷酸和乙醛:

●通过能编码胸苷磷酸化酶(deoA)、嘌呤核苷磷酸化酶(deoD)、尿苷磷酸化酶(udp)或黄苷磷酸化酶(xapA)的基因的产物介导的磷酸解作用,将脱氧核苷剪切成脱氧核糖-1-磷酸和核碱基,

●通过脱氧核糖磷酸变位酶(deoB)催化的反应,将脱氧核糖-1-磷酸转化成脱氧核糖-5-磷酸,

●通过脱氧核糖-5-磷酸醛缩酶(deoC)催化的反应,将其进一步降解成D-甘油醛-3-磷酸和乙醛。

已经证实,deo酶也能体外催化逆向合成代谢反应:在有纯化的大肠杆菌或植物乳杆菌(Lactobacillus plantarum)脱氧核糖醛缩酶存在的情况下,可以体外地从乙醛和D-甘油醛-3-磷酸得到脱氧核糖-5-磷酸(Rosen等,J.Biol.Chem.,240,(1964),1517-1524;Pricer,J.Biol.Chem.,235,(1960),1292-1298)。使用乙醛和甘油醛作为酶底物也可以得到脱氧核糖,但是产率非常低(Barbas,J.Am.Chem.Soc.112(1990),2013-2014)。

专利申请WO 01/14566公开了通过在一锅反应(one-pot reaction)中的deo操纵子的3种酶(即脱氧核糖醛缩酶、脱氧核变位酶和磷酸化酶(胸苷或嘌呤核苷磷酸化酶))的组合活性,使用甘油醛-3-磷酸、乙醛和核碱基作为起始底物,从脱氧核糖-1-磷酸酶促合成脱氧核苷。通过酶促方法,可以从果糖-1,6-二磷酸得到D-甘油醛-3-磷酸。

专利申请EP 1179598公开了磷酸化酶在从脱氧核糖-1-磷酸和核碱基开始酶促生产脱氧核苷中的应用。通过磷酸盐沉淀,可以提高脱氧核苷合成的产率。

但是,与它们的生物学功能相比,使用反向工作的deo操纵子的酶的方法表现出较低的产率,这表明它们的应用有严重缺陷。

考虑到目前使用的生产脱氧核苷和脱氧核苷前体的方法的上述缺点,本发明的一个目的是,提供从便宜的市售化合物开始生物合成生产脱氧核苷和脱氧核苷前体的手段和方法,无需依赖于不可靠的自然资源。

更具体地,需要生产脱氧核苷和脱氧核苷前体的替代方法,其能有效地和经济地合成脱氧核糖核苷,从而消除现有技术方法的缺点。

本发明涉及从2-脱氢-3-脱氧-D-葡糖酸(KDG)或它的盐开始生产2′-脱氧核苷和其前体的方法,其包括脱羧基步骤。

更具体地,该方法可以用于生产作为2′-脱氧核苷前体的2-脱氧-D-核糖(DRI)以及合成上多用途的DRI的烯胺衍生物。

通过直接反应KDG或它的盐,或KDG的衍生物,通常是剪切KDG的C1-C2键,进行脱羧基步骤。

在本发明的一个实施方案中,KDG或它的一种盐经历(氧化)脱羧基作用,生成2-脱氧-D-核糖酸(DRN)或它的盐,其本身被进一步转化成2-脱氧-D-核糖(DRI)或2-脱氧-D-核糖醇(DRL)。

在本发明的另一个实施方案中,通过使KDG或它的盐与胺反应,发生脱羧基作用,产生烯胺衍生物。通过水解,可以将该高能烯胺衍生物进一步转化成DRI。

在本发明的另一个实施方案中,使用3-脱氧-D-葡糖酸(DGN)或它的盐和/或3-脱氧-D-甘露糖酸(DMN)或它的盐作为KDG的衍生物,进行(氧化)脱羧基作用,生成DRI。通过还原KDG,可生产DGN和DMN的混合物。优选地,通过与过氧化氢的反应,进行脱羧基作用。

在本发明的另一个实施方案中,对3-脱氧-D-氨基葡糖酸(DGM)或它的盐和/或3-脱氧-D-甘露氨酸(DMM)或它的盐进行(氧化)脱羧基作用,生成DRI。通过还原性胺化作用,可以从KDG生产DGM和DMM的混合物。

本发明的另一个方面是制备上述方法中使用的KDG或它的盐的方便的、且成本较低的方法。该方法从D-葡糖酸(盐)或D-氨基葡糖酸(盐)开始,并使用重组酶。本发明提供了一种新的能编码具有D-葡糖酸脱水酶活性的多肽的核苷酸序列和编码具有D-氨基葡糖酸(盐)脱氨酶活性的多肽的核苷酸序列。

在本发明的方法中使用的原料是下面式(I)所示的KDG或它的一种盐,或其被保护的衍生物,其中在位置4,5和/或6处的一个或多个羟基被本领域已知的保护基团所保护。

如本文所使用的,术语″2′-脱氧核苷″涉及2′-脱氧核糖核苷,它是N-糖苷,且其中核碱基或核碱基类似物的碱性N-原子结合到2-脱氧-D-核糖或它的一种衍生物的异头碳原子上。合适的核碱基的实例是腺嘌呤,胞嘧啶,鸟嘌呤,胸腺嘧啶,尿嘧啶,2,6-二氨基嘌呤,和次黄嘌呤。核碱基类似物的实例是5-氮杂胞嘧啶,2-氯-腺嘌呤,5-碘-胞嘧啶,8-氮杂-鸟嘌呤,5-碘-尿嘧啶,5-溴-尿嘧啶,5-氟-尿嘧啶,5-乙基-尿嘧啶和5-三氟甲基-尿嘧啶。

如本文所使用的,术语″2′-脱氧核苷前体″涉及可以通过本领域已知的方法容易地转化成2′-脱氧核苷的化合物。优选的2′-脱氧核苷前体是2-脱氧-D-核糖(DRI)或可以转化成2′-脱氧核苷的2-脱氧-D-核糖基团的碳水化合物,例如,在现有技术中建立的那些,例如1-磷酸-2-脱氧-D-核糖,5-磷酸-2-脱氧-D-核糖,以及本发明建立的那些,例如2-脱氧-D-核糖醇,2-脱氧-D-核糖酸,2-脱氧-D-核糖-1,4-内酯,1-N-吗啉代-3,4,5-三羟基-戊烯-1,和它们的衍生物。

本发明的方法包括这样的方法,其中直接对KDG或它的盐或者源自KDG的化合物进行脱羧基步骤。优选的KDG衍生物是3-脱氧-D-葡糖酸,3-脱氧-D-甘露糖酸,3-脱氧-D-氨基葡糖酸和3-脱氧-D-甘露胺酸以及它们各自的盐。

另外,KDG和它的盐或它们的被保护形式(其中在位置4,5和/或6处的一个或多个羟基被本领域已知的用于该目的的保护基团保护)也是合适的进行本发明脱羧基反应的原料。除非另有说明,在下面的说明书中提及的KDG都包括KDG的被保护形式,如同提及KDG衍生物时也意图包括这些衍生物的被保护形式一样。类似地,提及在本发明的方法中得到的产物时均意在包括这些产物的被保护形式。优选的用于本发明目的的保护基团是这样的,它们能以醋酸酯、苯甲酸酯、烯丙醚、苯甲基醚、三苯甲基醚、叔丁基二甲基甲硅烷基(TBDMS)醚、亚异丙基或亚苄基缩醛形式代替相应的羟基。

应当明白,根据本发明的实施方案的合适反应条件,包含在用作反应物或作为产物得到的的有机酸中的羧基可以是质子化的形式或它们的盐形式,或可以平衡地存在。这些酸的示例性盐是这样的,其具有金属或铵离子作为抗衡离子,尤其是碱金属离子,例如钠和/或钾。

大多数本发明所述的碳水化合物和它们的衍生物以几种环状形式存在,但是出于简化的原因,已经将它们表示为开链式。应当明白,本发明包括所有这样的同分异构的或互变异构的形式。

在本发明的第一个实施方案中,使KDG或它的盐与过氧化氢反应,并经历向式(II)化合物2-脱氧-D-核糖酸(DRN)或它的盐的(氧化)脱羧基作用。

可以进一步将该产物转化成式(IV)代表的2-脱氧-D-核糖醇(DRL)

或式(III)代表的2-脱氧-D-核糖(DRI),

DRN、DRL、尤其是DRI均是优选的用于本发明目的的2′-脱氧核苷前体。可以直接地或通过作为中间体的DRL,进行DRN向DRI的转化。

优选地,如实施例5所述,通过2-脱氢-3-脱氧-D-葡糖酸钠或钾的水溶液与过氧化氢在室温下的氧化脱羧基作用,进行DRN的制备。通过2-酮醛糖酸的氧化脱羧基作用制备醛糖酸的一般方法,记载在专利EP 1 038 860 A1中。

优选地,如实施例6所述,在80巴的压力下,在130℃的温度下,在碳上的铑催化剂作用下,通过2-脱氧-D-核糖内酯水溶液的氢化,进行DRL的制备。通过将2-脱氧-D-核糖酸盐(DRN盐)转化成2-脱氧-D-核糖酸(其与水溶液中的内酯形式处于平衡),可以容易地制备出2-脱氧-D-核糖内酯(Han,Tetrahedron.1993.49,349-362;Han,Tetrahedron Asymmetry.1994.5,2535-62)。

优选地,通过2-脱氧-D-核糖醇(DLR)的氧化,例如利用吡啶中的氧化铬,进行2-脱氧-D-核糖(DRI)的制备。

在本发明的另一个实施方案中,通过使(KDG)或它的盐与含氨基的试剂Y-H反应,发生脱羧基作用,生成式(V)化合物。

或它的相应反式异构体或其受保护形式,作为2′-脱氧核苷前体。Y-H代表着胺,它含有结合到氨基的氮上的氢原子H。

在本发明的一个优选的实施方案中,由Y-H代表的含氨基的试剂是线性的或环状的仲胺;具有β-羰基的伯胺,优选3-氨基-2-吲哚酮(indolinone),发现其能有效地实现α-酮酸的脱羧基作用(Hanson,J.Chem.Education,1987,591-595)。在每种情况下,式(V)中的-Y代表着源自这些含氨基的试剂的相应含氮残基。

优选地,式(V)化合物代表着通过以线性的或环状的仲胺作为Y-H的反应生成的烯胺。

优选的环状仲胺是吗啉,吡咯烷,哌啶,或N-甲基哌嗪;优选的非环状胺是式R1-NH-R2的那些,其中R1和R2独立地代表1-8个、优选1-4个碳原子的线性或分支烷基。特别优选地,二乙基胺作为非环状胺。

特别优选地,吗啉作为环状胺。

式(V)化合物或它的反式异构体或其被保护形式可以进一步与Z-H反应,其中H代表着氢原子,且Z代表着离去基团,以生成式(VI)化合物

或它的对应反式异构体或其被保护形式,作为2′-脱氧核苷前体。Z-H优选地是水,在该情况下,式(VI)化合物是DRI或其被保护形式(酮-烯醇-互变异构现象)。

优选地,使用如实施例7所述的方法,在回流下,通过使苯中的KDG与胺(例如吗啉)反应,制备式(V)化合物,生成1-N-吗啉代-3,4,5-三羟基-戊烯-1。酸催化的用水水解生成2-脱氧-D-核糖(DRI)。

Stamos(Tetrahedron Lett.23(1982),459-462)描述了从携带β-氢的α-氧代羧酸通过烯胺生成醛的一般途径。制备和水解烯胺的其它方法已经记载在其它地方(Stork,J.Am.Chem.Soc.85(1963),207-222;Stamhuis,J.Org.Chem.30(1965),2156-2160)。

在本发明的另一个实施方案中,将KDG或它的盐转化成式(VII)代表的3-脱氧-D-葡糖酸(DGN)和/或3-脱氧-D-甘露糖酸(DMN)或这些化合物的盐

使从该反应得到的产物经历(氧化性)脱羧基作用,优选地使用过氧化氢,生成DRI。通过还原,从KDG或它的盐生产出DGN和DMN或它们的盐的混合物。

优选地,使用Weissbach(J.Biol.Chem.234(1959),705-709)中针对2-酮-3-脱氧庚酸所述的方法,通过在室温用硼氢化钠非立体选择性地还原在水中的2-脱氢-3-脱氧-D-葡糖酸,随后如例如美国专利3,312,683;Richards J.Chem.Soc.(1954),3638-3640;SowdenJ.Am.Chem.Soc.76(1954),3541-3542所述,用过氧化氢对3-脱氧-D-葡糖酸盐(酯)和3-脱氧-D-甘露糖酸盐(酯)(mannonate)进行氧化脱羧基作用,制备2-脱氧-D-核糖(DRI)。

在另一个优选的实施方案中,在6巴的压力下,在室温,用6%mol阮内镍催化剂或氧化铂氢化水溶液中的2-脱氢-3-脱氧-D-葡糖酸盐(酯),制备出DGN和DMN的混合物。

在本发明的另一个实施方案中,将KDG或它的盐转化成式(VIII)代表的3-脱氧-D-氨基葡糖酸(DGM)或3-脱氧-D-甘露糖胺酸(DMM)或这些化合物的盐

使由该反应得到的产物经历(氧化性)脱羧基作用,优选地使用茚三酮,生成DRI。通过还原性胺化作用,从KDG或它的盐生产DGM和DMM或它们的盐的混合物。

优选地,通过在室温用氨和氰基硼氢化钠非立体选择性地还原性胺化在水溶液中的2-脱氢-3-脱氧-D-葡糖酸钠或钾,随后使用Shelton(J.Am.Chem.Soc.118(1996),2117-2125;和Borch,J.Am.Chem.Soc.93(1971),2897;Durrwachter,J.Am.Chem.Soc.108(1986),7812referenced therein)中针对2-脱氧-D-阿洛糖的合成所述的方法,用茚三酮对3-脱氧-D-2-氨基葡糖酸(盐)和3-脱氧-D-2-甘露糖胺酸(盐)进行氧化脱羧基作用,制备2-脱氧-D-核糖。

另外,本发明提供了一种生产式(III)化合物(2-脱氧-D-核糖)的方法,这是通过在单个步骤中,转化式(I)化合物或它的一种盐(KDG)而实现的。优选地,该转化是通过酶促催化作用实现的。该转化优选地由酮酸脱羧酶催化。优选的酮酸脱羧酶是硫胺素焦磷酸(TPP)依赖性的酮酸脱羧酶。TPP依赖性的酮酸脱羧酶的实例是丙酮酸脱羧酶(EC4.1.1.1),苯甲酰基甲酸脱羧酶(EC 4.1.1.7),吲哚丙酮酸脱羧酶(EC4.1.1.74),膦酰基丙酮酸脱羧酶,磺基丙酮酸脱羧酶(EC 4.1.1.79),草酰-辅酶A脱羧酶(EC 4.1.1.8),氧代戊二酸脱羧酶(EC 4.1.1.71)或苯基丙酮酸脱羧酶(EC 4.1.1.43)。已经证实,来自不同生物的酮酸脱羧酶(例如,丙酮酸脱羧酶)可以将KDG转化成2-脱氧--D-核糖(见实施例8-12)。原则上,在本发明中可以使用任何酮酸脱羧酶。

在根据本发明的方法的优选的实施方案中,使用具有丙酮酸脱羧酶活性的酶,将KDG转化成2-脱氧-D-核糖。

丙酮酸脱羧酶能催化下面的反应:

已经表征了几种丙酮酸脱羧酶(PDC)和对应的pdc基因,例如来自运动发酵单胞菌(Zymomonas mobilis)的PDC(Genbank登记号AAD19711;Neale等,J.Bacteriol.1987,169:1024-1028),来自酿酒酵母(Saccharomyces cerevisiae)的PDC(Genbank登记号NP013145;Candy等,J.Gen.Microbiol.1991,137:2811-2815),来自巴氏醋杆菌(Acetobacter pasteurianus)的PDC(Genbank登记号AAM21208;Raj等,Arch.Microbiol.2001,176:443-451),来自棕榈发酵细菌(Zymobacter palmae)的PDC(Genbank登记号AAM49566;Raj等,Appl.Environ.Microbiol.2002,68:2869-2876),来自胃八叠球菌(Sarcina ventriculi)的PDC(Genbank登记号AAL18557;Lowe等,J.Gen.Microbiol.1992,138:803-807)。许多其它的丙酮酸脱羧酶好像也存在于植物、真菌和细菌中,如在这些生物中存在与已确立的pdc基因享有序列同源性的基因所证实的。这些推定的丙酮酸脱羧酶的实例是:

来自植物的PDC:

拟南芥(Arabidopsis thaliana)(Genbank登记号T48155)

稗草(Echinochloa crus-gall)(Genbank登记号AAM18119)

水稻(Oryza sativa)(Genbank登记号NP922014)

米根霉(Rhizopus oryzae)(Genbank登记号AAM73540)

百脉根(Lotus corniculatus)(Genbank登记号AAO72533)

玉米(Zea mays)(Genbank登记号BAA03354)

豌豆(Pisum sativum)(Genbank登记号CAA91445)

青豆(Garden pea)(Genbank登记号S65470)

烟草(Nicotiana tabaccum)(Genbank登记号CAA57447)

马铃薯(Solanum tuberosum)(Genbank登记号BAC23043)

草莓(Fragaria ananassa)(Genbank登记号AAL37492)

香瓜(Cucumis melo)(Genbank登记号AAL33553)

葡萄(Vitis vinifera)(Genbank登记号AAG22488)

来自真菌的PDC:

甘蔗(Saccharum officinarum)(Genbank登记号CAB61763)

米曲霉(Aspergillus orizae)(Genbank登记号AAD16178)

寄生曲霉(Aspergillus parasiticus)(Genbank登记号P51844)

酿酒酵母(Saccharomyces cerevisiae)(Genbank登记号NP013145)

金针菇(Flammulina velutipes)(Genbank登记号AAR00231)

Saccharomyces kluyveri(Genbank登记号AAP75899)

粟酒裂殖酵母(Schizosaccharomyces pombe)(Genbank登记号CAB75873)

光滑假丝酵母(Candida glabrata)(Genbank登记号AAN77243)

粗糙链孢霉(Neurospora crassa)(Genbank登记号JN0782)

Pichia stipis(Genbank登记号AAC03164)

乳酸克鲁维酵母(Kuyveromyces lactis)(Genbank登记号CAA61155)

Emericella nidulans(Genbank登记号AAB63012)

来自原核生物的PDC:

牛分枝杆菌(Mycobacterium bovis)(Genbank登记号CAD93738)

麻风分枝杆菌(Mycobacterium leprae)(Genbank登记号CAC31122)

结核分枝杆菌(Mycobacterium tuberculosis)(Genbank登记号NP215368)

穿透枝原体(Mycoplasma penetrans)(Genbank登记号NP758077)

丙酮丁醇梭菌(Clostridium acetobutylicum)(Genbank登记号NP149189)

巴氏醋杆菌(Acetobacter pasteurianus)(Genbank登记号AAM21208)

棕榈发酵细菌(Zymobacter palmae)(Genbank登记号AAM49566)

运动发酵单胞菌(Zymomonas mobilis)(Genbank登记号AAD19711)

胃八叠球菌(Sarcina ventriculi)(Genbank登记号AAL18557)

点型念珠蓝细菌(Nostoc punctiforme)(Genbank登记号ZP00110850)

可以通过过表达对应基因的重组微生物容易地生成这样的酶。编码TPP依赖性的酮酸脱羧酶的基因的实例是来自运动发酵单胞菌的pdc(Genbank登记号AF124349),来自酿酒酵母的pdc(Genbank登记号NC001144),来自巴氏醋杆菌的pdc(Genbank登记号AF368435),来自Zymobacter palmae的pdc(Genbank登记号AF474145),来自胃八叠球菌的pdc(Genbank登记号AF354297)。在Genbank中可以发现与上列推定的丙酮酸脱羧酶对应的其它pdc基因。

在一个优选的实施方案中,丙酮酸脱羧酶是真核生物源的,更优选地,它来自酵母,且最优选地,它来自酿酒酵母。

在一个特别优选的实施方案中,丙酮酸脱羧酶来自酿酒酵母的丙酮酸脱羧酶,其具有如SEQ ID NO:21所示的氨基酸序列(也见GenBank登记号NP013145)。

在另一个优选的实施方案中,丙酮酸脱羧酶是原核生物源的,更优选来自发酵单胞菌属的生物,最优选来自运动发酵单胞菌。在一个特别优选的实施方案中,丙酮酸脱羧酶来自运动发酵单胞菌的丙酮酸脱羧酶,其具有如SEQ ID NO:19所示的氨基酸序列(也见GenBank登记号AAD 19711)。

在另一个优选的实施方案中,所述原核生物的丙酮酸脱羧酶来自醋杆菌属的生物,更优选来自巴氏醋杆菌。特别优选的丙酮酸脱羧酶是具有如SEQ ID NO:25所示氨基酸序列的巴氏醋杆菌酶(也见GenBank登记号AAM21208)。

在另一个优选的实施方案中,丙酮酸盐脱羧酶来自发酵单胞菌属的生物,更优选来自棕榈发酵细菌(Zymobacter palmae)。

特别优选的是具有如SEQ ID NO:29所示氨基酸序列的来自zlv棕榈发酵细菌的丙酮酸脱羧酶(也见GenBank登记号AAM49566)。

在另一个优选的根据本发明方法的实施方案中,使用具有苯甲酰基甲酸脱羧酶活性的酶将KDG转化成2-脱氧-D-核糖。

苯甲酰基甲酸脱羧酶催化下面的反应:

已经表征了来自恶臭假单胞菌的苯甲酰基甲酸脱羧酶(BDC)(Genbank登记号AAC15502;Tsou等,Biochemistry.1990,29:9856-9862)以及对应的基因mdlC(Genbank登记号AY143338)。已经证实,该酶能将2-酮-4,5-二羟基戊酸的D和L异构体转化成各自的3,4-二羟基丁醛异构体(Niu等,J.Am.Chem.Soc.125(2003),12998-12999)。许多其它的苯甲酰基甲酸脱羧酶好像也存在于细菌和古细菌中,如这些生物中存在与编码确立的BDC的基因享有序列同源性的基因所证实的。这样推定的苯甲酰基甲酸脱羧酶的实例是:

来自细菌的BDC:

铜绿假单胞菌(Pseudomonas aeruginosa)(Genbank登记号NP253588)

血色红假单胞菌(Rhodopseudomonas palustris)(Genbank登记号NP_946955)

天蓝色链霉菌(Streptomyces coelicolor)(Genbank登记号NP_631486)

青色素杆菌(Chromobacterium violaceum)(Genbank登记号NP_902771)

大豆慢生根瘤菌(Bradyrhizobium japonicum)(Genbank登记号NP_774243)

来自古细菌的BDC:

硫磺矿硫化叶菌(Sulfolobus solfataricus)(Genbank登记号NP_343070)

嗜酸热原体(Thermoplasma acidophilum)(Genbank登记号NP_393976)

火山热原体(Thermoplasma volcanium)(Genbank登记号NP_111716)

可以由过表达对应的bdc基因的重组微生物容易地生成这样的酶。在与上列推定的苯甲酰基甲酸脱羧酶对应的Genbank中,可以发现这样的基因。

可以在根据本发明的方法中使用的硫胺依赖性脱羧酶的另一个实例是膦酰基丙酮酸脱羧酶。已经表征了几种膦酰基丙酮酸脱羧酶(PPD)以及对应的基因,例如来自脆弱拟杆菌(Bacteroides fragilis)的PPD(Genbank登记号AAG26466;Zhang等,J.Biol.Chem.2003,278:41302-41308),来自威德摩尔链球菌(Streptomyces wedmorensis)的PPD(Genbank登记号BAA32496;Nakashita等,J.Antibiot.1997,50:212-219)。许多其它的膦酰基丙酮酸脱羧酶好像也存在于细菌中,如在这些生物中存在与编码确立的PPD的基因享有序列同源性的基因所证实的。这样推定的膦酰基丙酮酸脱羧酶的实例是:来自多形拟杆菌(Bacteroides thetaiotaomicron)的PPD(Genbank登记号NP 810632),来自东方拟无枝酸菌(Amycolatopsis orientais)的PPD(Genbank登记号CAB45023),来自破伤风梭菌(Clostridium tetani)E88的PPD(Genbank登记号NP_782297),来自绿色产色链霉菌(Streptomycesviridochromogene)的PPD(Genbank登记号CAA74722),来自吸水链霉菌(Streptomyces hygroscopicus)的PPD(Genbank登记号BAA07055),来自天蓝色链霉菌A3的PPD(Genbank登记号NP733715),来自利尿链霉菌(Streptomyces rishiriensis)的PPD(Genbank登记号AAG29796),来自百日咳杆菌(Bordetella pertussis)的PPD(Genbank登记号CAE 41214)。可以由过表达对应基因的重组微生物容易地生成这样的酶。

可以在根据本发明的方法中使用的硫胺素依赖性脱羧酶的另一个实例是磺基丙酮酸脱羧酶。已经表征了由2个亚基ComD(Genbank登记号P58415)和ComE(Genbank登记号P58416)组成的来自詹氏甲烷球菌(Methanococcus jannaschii)的磺基丙酮酸脱羧酶(SPD)(Graupner等,J.Bacteriol.2000.182:4862-4867)以及对应的基因。许多其它的磺基丙酮酸脱羧酶好像也存在于古细菌和细菌中,如这些生物中存在与编码确立的SPD的基因享有序列同源性的基因所证实的。

可以在根据本发明的方法中使用的硫胺素依赖性脱羧酶的另一个实例是吲哚丙酮酸脱羧酶。已经表征了几种吲哚丙酮酸脱羧酶(IPD)以及对应的基因,例如来自阴沟肠杆菌(Enterobacter cloacae)的IPD(Genbank登记号BAA14242;Scutz等,2003,Eur.J.Biochem.270:2322-2331),来自巴西固氮螺菌(Azospirillum brasilense)的IPD(Genbank登记号AAC36886;Costacurta等,Mol.Gen.Genet.1994,243:463-472),来自草生欧文氏菌(Erwinia herbicola)的IPD(Genbank登记号AAB06571;Brandi等,Appl.Environ.Microbioi.1996,62:4121-4128)。许多其它的吲哚丙酮酸脱羧酶好像也存在于细菌中,如这些生物中存在与编码确立的IPD的基因享有序列同源性的基因所证实的。

可以在根据本发明的方法中使用的硫胺素依赖性脱羧酶的另一个实例是苯基丙酮酸脱羧酶。已经表征了来自酵母的苯基丙酮酸脱羧酶(Genbank登记号NP010668;Vuralhan等,Appl.Environ.Microbiol.2003,69:4534-41)以及对应的基因ARO10(Genbank登记号NC001136)。

在根据本发明的方法的优选实施方案中,通过酶促反应实现脱羧基步骤,通过加酸,将pH值调节至pH5至pH9,优选pH6至pH8。原则上,所有合适的酸都可以用于该目的。优选的酸是HCl,H2SO4,D-葡糖酸或2-脱氢-3-脱氧-D-葡糖酸。

本发明的另一个方面是通过重组酶的应用,从D-葡糖酸(GCN)或D-氨基葡糖酸制备KDG的方便的、且成本低廉的方法。

在本发明的方法的优选的实施方案中,在一个初步步骤中,通过D-葡糖酸脱水酶活性的应用,从D-葡糖酸盐生产式(I)化合物。优选的盐是D-葡糖酸钾或钠。优选地,该D-葡糖酸脱水酶由包含选自下述的核苷酸序列的多核苷酸编码:

(a)编码包含SEQ ID NO:2所示氨基酸序列的多肽的核苷酸序列;

(b)包含SEQ ID NO:1所示编码序列的核苷酸序列;

(c)核苷酸序列编码由(a)或(b)所示核苷酸序列编码的片段的核苷酸序列;

(d)与(a)至(c)中任一项的核苷酸序列杂交的核苷酸序列;和

(e)由于遗传密码的简并性而不同于(d)所示核苷酸序列的核苷酸序列。

根据下面的反应,使用D-葡糖酸脱水酶进行KDG或它的盐的酶促合成:通过消除一分子水,将D-葡糖酸转化成KDG。已经在不同的细菌物种中表征了D-葡糖酸脱水酶的活性,例如在产碱杆菌属(Kersters,Methods in Enzymology 42(1975),301-304);巴氏固氮梭菌,(Gottschalk,Methods in Enzymology 90(1982),283-287);嗜酸热原体(Budgen,FEBS Letters 196(1986),207-210)和硫磺矿硫化叶菌(Nicolaus,Biotechnology Letters 8(7)(1986),497-500)。通过筛选几种收集菌的D-葡糖酸脱水酶活性,鉴别出了优选的D-葡糖酸脱水酶。从根癌土壤杆菌菌株C58的基因组文库中选择出了编码D-葡糖酸脱水酶的基因,被命名为gcnD,将其进一步插入优化表达的多拷贝载体中。已经证实,来自过表达gcnD基因的大肠杆菌细胞的粗提物会催化D-葡糖酸完全转化成KDG(见实施例2)。

在本发明的方法的另一个优选的实施方案中,通过D-氨基葡糖酸脱氨酶活性的应用,在初步步骤中从D-氨基葡糖酸生产式(I)化合物。优选地,D-氨基葡糖酸脱氨酶由包含选自下述的核苷酸序列的多核苷酸编码:

(f)编码包含SEQ ID NO:4所示氨基酸序列的多肽的核苷酸序列;

(g)包含SEQ ID NO:3所示编码序列的核苷酸序列;

(h)编码由(a)或(b)所示核苷酸序列编码的片段的核苷酸序列;

(i)与(a)至(c)中任一项的核苷酸序列杂交的核苷酸序列;和

(j)由于遗传密码的简并性而不同于(d)所示核苷酸序列的核苷酸序列。

根据下面的反应,使用D-氨基葡糖酸脱氨酶进行KDG或它的盐的酶促合成:通过消除一分子水和一分子氨,将D-氨基葡糖酸转化成KDG。已经在不同的细菌种中表征了D-氨基葡糖酸脱氨酶的活性,例如在荧光假单胞菌(Pseudomonas fluorescens)(Iwamoto,Agric.Biol.Chem.53(1989),2563-2569)、放射形土壤杆菌(Agrobacterium radiobacter)(Iwamoto,FEBS Letters 104(1979),131-134;Iwamoto,J.Biochem.91(1982),283-289)中,且证实了它需要Mn2+离子(Iwamoto,Biosci.Biotech.Biochem.59(1995),408-411)。

通过筛选几种收集菌的D-氨基葡糖酸脱氨酶活性,鉴别出了优选的D-氨基葡糖酸脱氨酶。通过克隆推定为D-丝氨酸脱氨酶的基因,从根癌土壤杆菌菌株C58分离出了编码D-氨基葡糖酸脱氨酶的命名为gmaA的基因。将gmaA基因进一步插入优化表达的多拷贝载体中。已经证实,来自过表达gmaA基因的大肠杆菌细胞的粗提物会催化D-氨基葡糖酸向KDG的转化(见实施例4)。

在优选的实施方案中,本发明涉及通过酶促反应,从D-葡糖酸或D-氨基葡糖酸开始生产式III化合物、尤其是2-脱氧-D-核糖的方法,在该方法中,在第一步中,如上所述将D-葡糖酸或D-氨基葡糖酸转化成KDG,在第二步中,如上所述将KDG转化成2-脱氧-D-核糖。

因而,通过D-葡糖酸脱水酶的应用,可以实现D-葡糖酸向KDG的酶促转化。通过D-氨基葡糖酸脱氨酶的应用,可以实现D-氨基葡糖酸向KDG的酶促转化。关于优选的实施方案,上面所述同样适用。通过酮酸脱羧酶的应用,可以实现得到的KDG向2-脱氧-D-核糖的酶促转化。关于优选的实施方案,上面所述同样适用。

使用表达对应酶的细胞的细胞提取物,或者使用纯化的或部分纯化的酶,可以体外进行酶促二步方法,将D-葡糖酸或D-氨基葡糖酸经过KDG转化成2-脱氧-D-核糖。所述酶可以是在生物中自然表达的酶,或者可以重组地生产它们。制备和分离对应的(重组的)酶的方法是本领域的技术人员众所周知的。

在优选的实施方案中,体内进行将D-葡糖酸或D-氨基葡糖酸经过KDG转化成2-脱氧-D-核糖的酶促二步方法,即使用合适的能表达所需酶活性的生物体。该生物体可以是任意种类的生物,优选地,它是细胞,例如植物、动物、真菌细胞或细菌细胞。最优选地,使用真菌或细菌细胞。优选的真菌是酵母,例如酿酒酵母;优选的细菌细胞是例如大肠杆菌,运动发酵单胞菌,棕榈发酵细菌,巴氏醋杆菌,醋酸钙不动杆菌,根癌土壤杆菌和枯草芽孢杆菌。所述生物体可以是已经内源地表达所述酶促活性之一的生物,所述的酶促活性即生产KDG的D-葡糖酸脱水酶或D-氨基葡糖酸脱氨酶,或者将KDG转化成2-脱氧-D-核糖的酮酸脱羧酶,并且其中由于编码对应酶的对应外源核酸分子的导入而表达了各自的其它酶促活性。或者,该生物体也可以是不能自然地表达将D-葡糖酸或D-氨基葡糖酸转化成KDG、并进一步转化成2-脱氧-D-核糖所需要的酶活性的生物,其中已经导入了分别编码D-葡糖酸脱水酶或D-氨基葡糖酸脱氨酶和酮酸脱羧酶的对应外来核酸分子。

在一个特别优选的实施方案中,该生物体是不能表达KDG激酶(kdgK)活性的生物。这样的酶活性会导致KDG向KDPG的磷酸化,后者继而被醛缩酶剪切成丙酮酸和甘油醛-磷酸,由此使KDG转向不同的不需要的代谢途径。在根据本发明的方法中,可以使用不能自然地表达kdgK基因的生物体。如果使用的生物体自然表达kdgK,本领域的技术人员熟知生产这种生物体的突变体或变体(其中对应的kdgK基因被灭活)的方法和方式。

如果使用表达用于将D-葡糖酸转化成KDG的D-葡糖酸脱水酶和用于将KDG转化成2-脱氧-D-核糖的酮酸脱羧酶的生物体体内进行所述的根据本发明的方法,这具有一个优点,即可以提供D-葡糖酸作为用于培养生物体的培养基中的底物。该生物体会吸收D-葡糖酸,并转化成2-脱氧-D-核糖。

在另一个特别优选的实施方案中,该生物体是不表达KDG醛缩酶(由大肠杆菌中的eda基因编码)活性的生物体。这样的酶活性会导致KDG被剪切成丙酮酸和甘油醛,由此使KDG转向不同的、并非所需要的代谢途径。在根据本发明的方法中,可以使用不自然地表达eda基因的生物体。如果使用的生物体表达eda基因,本领域的技术人员熟知生产这种生物体的突变体或变体(其中对应的eda基因被灭活)的方式和方法。

在另一个特别优选的实施方案中,该生物体是不表达2-脱氧-D-核糖醛缩酶(由大肠杆菌中的deoC基因编码)活性的生物体。这样的酶活性会导致2-脱氧-D-核糖被剪切成乙醛和甘油醛,由此使2-脱氧-D-核糖转向不同的、并非所需要的代谢途径。在根据本发明的方法中,可以使用不自然地表达deoC基因的生物体。如果使用的生物体表达deoC基因,本领域的技术人员熟知生产这种生物体的突变体或变体(其中对应的deoC基因被灭活)的方式和方法。例如,已经报道了大肠杆菌的deoC突变体(Valentin-Hansen,EMBO J.1(1982),317-322)以及缺失大肠杆菌中的deo操纵子的方法(Kaminski,J.Biol.Chem.277(2002),14400-14407;Valentin-Hansen,Molec.Gen.基因t.159(1978),191-202)。

本发明也涉及由于D-葡糖酸脱水酶的表达而能将D-葡糖酸酶促地转化成KDG和/或由于D-氨基葡糖酸脱氨酶的表达而能将D-氨基葡糖酸酶促地转化成KDG、并且另外能通过酮酸脱羧酶催化的脱羧基反应而将KDG酶促地转化成2-脱氧-D-核糖的生物体。该生物体原则上可以是任意合适的生物体,优选地,它是细胞,例如植物细胞、动物细胞、真菌细胞或细菌细胞。更优选地,它是真菌或细菌细胞。优选的真菌是酵母,例如酿酒酵母。优选的细菌是大肠杆菌,运动发酵单胞菌,棕榈发酵细菌,巴氏醋杆菌,醋酸钙不动杆菌(Acinetobactercalcoaceticus),根癌土壤杆菌(Agrobacterium tumefaciens)和枯草芽孢杆菌。一方面,所述生物体是已经内源地表达D-葡糖酸脱水酶或D-氨基葡糖酸脱氨酶的生物体,其中已经导入了编码酮酸脱羧酶的外来核酸分子,所述的酮酸脱羧酶能催化KDG向2-脱氧-D-核糖的脱羧基作用。关于优选的酮酸脱羧酶的实施方案,前面所述同样适用。

另一方面,所述生物体是已经表达能通过脱羧基反应而将KDG转化成2-脱氧-D-核糖的酮酸脱羧酶的生物体,但是其不会自然地表达D-葡糖酸盐脱水酶或D-氨基葡糖酸脱氨酶,其中已经导入了编码D-葡糖酸脱水酶和/或编码D-葡糖胺脱氨酶的外来核酸分子。即,可以遗传地修饰该生物体,使其表达D-葡糖酸脱水酶或D-氨基葡糖酸脱氨酶或这两种酶。

另一方面,所述生物体是不能自然地表达D-葡糖酸脱水酶、D-氨基葡糖酸脱氨酶和酮酸脱羧酶的生物体,所述的酮酸脱羧酶能通过脱羧基作用将KDG转化成2-脱氧-D-核糖,且其中已经导入了编码D-葡糖酸脱水酶或D-氨基葡糖酸脱氨酶或二者的外来核酸分子以及编码能通过脱羧基作用将KDG转化成2-脱氧-D-核糖的酮酸脱羧酶的核酸分子。

关于待在根据本发明的生物体中表达的D-葡糖酸脱水酶、D-葡糖胺脱氨酶和酮酸脱羧酶的优选实施方案,上面针对本发明的方法已经阐述的那些同样适用。

在一个特别优选的实施方案中,根据本发明的生物体并不表达KDG激酶(kdgK)活性。它可以是不能自然地表达kdgK的生物体,或者它可以是能自然地表达kdgK、但是其中对应的基因已经被灭活(例如通过基因破坏或本领域的普通技术人员众所周知的其它合适的方法)的生物体。

本发明还涉及具有酮酸脱羧酶活性的酶或编码这种酶的多核苷酸在将KDG转化成2-脱氧-D-核糖的方法中的应用。关于优选的实施方案,上面根据本发明的方法已经阐述的那些同样适用。

这些和其它实施方案公开在、且包含在本发明的说明书和实施例中。在上面或下面引用的任何文献中公开的内容都在这里并入本申请中。使用例如电子设施,可以从公共图书馆得到关于要根据本发明采用的方法、用途和化合物中的任一项的其它文献。例如,可以使用公共数据库″Medline″,它可以在因特网上得到,例如在http://www.ncbi.nem.nlh.gov/PubMed/medline.html。本领域的普通技术人员已知其它数据库和地址,例如http://www.ncbi.nlm.nih.gov/,http://www.infobiogen.fr/,http://www.fmi.ch/biology/research-_tools.html,http://www.tigr.org/,也可以使用例如http://www.google.de得到。

Berks,TIBTECH 12(1994),352-364提供了关于生物技术专利信息的综述和可用于追溯搜索和最近资料通报的相关专利信息资源的调查。

另外,当在本文中出现时,术语″和/或″包括“和”、“或”以及“所述术语涉及的要素的所有或任意其它组合”的含义。

实施例

实施例1:从根癌土壤杆菌菌株C58(CIP 104333)克隆编码D-葡糖酸脱水酶的基因

从Institut Pasteur Collection(CIP,Paris,France)得到根癌土壤杆菌菌株C58(CIP 104333)。提取染色体DNA,并使用下述引物,根据标准方法,通过PCR扩增D-葡糖酸脱水酶基因:

5′-CCCTTAATTAATGACGACATCTGATAATCTTC-3′,见SEQ IDNO 5;

5′-TTTGCGGCCGCTTAGTGGTTATCGCGCGGC-3′,见SEQ IDNO 6;

5′-CCCGGTACCATGACGACATCTGATAATCTTC-3′,见SEQ IDNO 7;

将使用SEQ ID NO 5和SEQ ID NO 6所述的2个引物扩增第一个DNA片段连接进事先用PacI和NotI消化过的pUC18-衍生载体中,生成质粒pVDM80。将使用SEQ ID NO 6和SEQ ID NO 7所述的2个引物扩增的第二个DNA片段连接进事先用KpnI和NotI消化过的pET29a载体(Novagen)中,生成质粒pVDM82。克隆的基因的核苷酸序列如SEQ ID NO 1所示,由该基因编码的多肽的序列如SEQ ID NO2所示。

实施例2:在大肠杆菌中表达D-葡糖酸脱水酶活性以及从D-葡糖酸制备2-脱氢-3-脱氧-D-葡糖酸

使用如实施例1所述构建的pVDM82质粒转化大肠杆菌BL21的感受态细胞,生成菌株+1289。在30℃,在含有30mg/l卡那霉素的Luria-Bertani(LB)培养基(Difco)中培养菌株+1289,直到OD值(600nm)达到0.6。然后,加入异丙基-β-D-硫代吡喃型半乳糖苷(IPTG),至0.5mM终浓度。进一步培养2小时30分钟后,离心收集细胞,用20mM磷酸钠缓冲液pH7.2洗涤1次。通过将约5g细胞悬浮到含有10000单位溶菌酶(Ready-Lyse,Epicentre,Madison,Wisconsin)和1mM EDTA的10ml Tris-HCl 50mM pH8.5缓冲液中,并在30℃孵育悬浮液15分钟,制备细胞提取物。然后,将10000千单位脱氧核糖核酸酶I(DNase I,Sigma)以及5mM MgCl2加入制品中,在30℃孵育另外的15分钟。在使用前,将这样得到的细胞提取物冷冻保藏在-20℃。

混合1.5ml细胞提取物与2M D-葡糖酸钠或钾,至总体积10ml。在已经将pH调节至8.5后,在37℃孵育该制品。通过在孵育递增的时间后分析等分试样追踪2-脱氢-3-脱氧-D-葡糖酸(KDG)合成。将这些等分试样的几个稀释部分置于二氧化硅平板上,并在下面的溶剂系统中进行色谱:异丙醇/水(90/10)。用对茴香醛显色后,检测到了KDG(Rf约0.40)的黄斑。

另外,如Mac Gee(J.Biol.Chem.1954.210,617-626)所述,使用基于盐酸氨基脲反应的分光光度实验,对KDG进行了定量。典型地,在孵育30小时后,并使用分光光度实验,KDG浓度范围为1.5至2M。

这样得到的2-脱氢-3-脱氧-D-葡糖酸钠或钾溶液可以原样用于进一步的合成步骤。使用公开的方法(Bender,Anal.Biochem.1974.61,275-279),也可以从这样的溶液制备出2-脱氢-3-脱氧-D-葡糖酸。通过将1当量的HCl加入2-脱氢-3-脱氧-D-葡糖酸钾溶液中,然后蒸发,也可以得到2-脱氢-3-脱氧-D-葡糖酸和KCl的混合物的粗制品。

实施例3:从根癌土壤杆菌菌株C58(CIP 104333)克隆编码D-氨基葡糖酸脱氨酶的基因

从Institut Pasteur Collection(CIP,Paris,France)得到根癌土壤杆菌菌株C58(CIP 104333)。提取染色体DNA,并使用下述引物,根据标准方法,通过PCR扩增D-氨基葡糖酸脱氨酶基因:

5′CCCTTAATTAATGCAGTCTTCTTCAGCTCTTC-3′,见SEQ IDNO 8;

5′-TTTGCGGCCGCCTAGTGAAAGAAGGTTGTGTAGAT-3′,见SEQ ID NO 9;

5′-AAATCATGACTATGCAGTCTTCTTCAGCTCTTCG-3′,见SEQID NO 10;

5′-TATAGATCTCTAGTGAAAGAAGGTTGTGTAGAT-3′,见SEQID NO 11;

将使用SEQ ID NO 8和SEQ ID NO 9所述的2个引物扩增的第一个DNA片段连接进事先用PacI和NotI消化过的pUC18-衍生的载体中,生成质粒pKDGb1。将使用SEQ ID NO 10和SEQ ID NO 11所述的2个引物扩增的第二个DNA片段连接进事先用BspH1和BglII消化过的pQE60载体(Qiagen)中,生成质粒pEP18。所克隆的基因的核苷酸序列如SEQ ID NO 3所示,由该基因编码的多肽的序列如SEQ ID NO4所示。

实施例4:在大肠杆菌中表达D-氨基葡糖酸脱氨酶和从D-氨基葡糖酸制备2-脱氢-3-脱氧-D-葡糖酸

使用如实施例1所述构建的pEP18质粒和pREP4(Qiagen)转化大肠杆菌MG1655的感受态细胞,生成菌株+1068。在37℃,在含有30mg/l卡那霉素和100mg/l氨苄青霉素的LB培养基中培养菌株+1068,直到OD值(600nm)达到0.6。然后,加入IPTG至0.5mM终浓度。进一步培养2小时30分钟后,离心收集细胞,用20mM磷酸钠缓冲液pH7.2洗涤1次。使用实施例2所述的方法制备细胞提取物。

混合2ml细胞提取物与100mM D-氨基葡糖酸钠或钾和0.1mM磷酸吡哆醛,至总体积5ml。在已经将pH调节至7.5后,在37℃孵育该制品。

使用实施例2所述的方法追踪2-脱氢-3-脱氧-D-葡糖酸(KDG)合成的进程。典型地,在孵育30小时后,使用实施例2所述的分光光度实验,KDG浓度范围为50至100mM。

实施例5:从2-脱氢-3-脱氧-D-葡糖酸制备2-脱氧-D-ribonate

在25℃,将0.5ml 31%过氧化氢溶液加入5ml 1M 2-脱氢-3-脱氧-D-葡糖酸钾(KDG)溶液中。通过观察二氧化碳的释放形成的起泡和通过使用如实施例2所述的薄层色谱方法观察KDG的消失,追踪KDG脱羧基化的进展。典型地,在反应3小时后,残余KDG的浓度小于10mM。

实施例6:从2-脱氧-D-核糖内酯(ribonolactone)制备2-脱氧-D-核糖醇

将0.2g铑(5%,在碳上)催化剂加入按照Deriaz(J.Chem.Soc.(1949),1879-1883)中针对2-脱氧-L-核糖内酯的合成所述的方法制备的1g 2-脱氧-D-核糖内酯的水溶液中。在130℃,在80巴压力下,进行2-脱氧-D-核糖内酯的氢化。过滤反应化合物后,蒸发所得到的溶液。将残余物溶于乙酸乙酯中,并通过二氧化硅柱上的色谱进一步纯化。真空去除溶剂,得到黄色油状物(产率85%)。这样得到的化合物与如Rabow(J.Am.Chem.Soc.122(1999),3196-3203)所述通过还原2-脱氧-D-核糖得到的2-脱氧-D-核糖醇相同。

实施例7:从2-脱氢-3-脱氧-D-葡糖酸制备1-N-吗啉代-3,4,5-三羟基戊烯-1

将2g 2-脱氢-3-脱氧-D-葡糖酸悬浮于150ml苯中。将1.1ml吗啉和100mg对甲苯磺酸加入悬浮液中,回流反应混合物3小时。蒸馏去除该反应产生的水。倾析出苯。收集粘附到罐上的固体化合物,用丙酮洗涤,并干燥。使用甲醇在氯仿中的梯度,通过二氧化硅柱上的柱色谱进一步纯化存在于该产品中的主要化合物(产率40%)。收集含有1-N-吗啉代-3,4,5-三羟基戊烯-1的级分,真空去除溶剂。

1H-NMR(D2O):δ=3.15ppm(4H,t,吗啉),3.8ppm(4H,t,吗啉),3.4-4ppm,(4H,m,5a-H,5b-H,4-H,3-H),6.3和6.8ppm(2H,2d,1-H和2-H,J=4Hz)。

实施例8:从运动发酵单胞菌克隆编码丙酮酸脱羧酶的基因

从Institut Pasteur Collection(CIP,Paris,France)得到运动发酵单胞菌菌株B-806(CIP 102538T)。提取染色体DNA,并使用下述引物,根据标准方法,通过PCR扩增丙酮酸脱羧酶基因:

5′-GCGTTAATTAATGAGTTATACTGTCGGTACC-3′,见SEQ IDNO 12;

5′-TATGCGGCCGCTTAGAGGAGCTTGTTAACAGG-3′,见SEQID NO 13;

将使用SEQ ID NO 12和SEQ ID NO 13所述的2个引物扩增的DNA片段连接进事先用PacI和NotI消化过的pSP100或pEVL5(分别是pUC18-衍生的或pQE70-衍生的载体,如下所述)中,分别生成质粒pEVL107和质粒pEVL420。所克隆的基因的核苷酸序列以及编码的对应多肽的序列可以在GenBank(登记号AF124349)中找到,分别如SEQ ID NO:18和SEQ ID NO:19所示。

使用标准方法,将核糖体结合位点、PacI和NotI限制位点导入事先用EcoRI和BamHI消化过的pUC18载体中,得到质粒pSP100。pSP100的完整的核苷酸序列如SEQ ID NO 14所示。

使用标准方法,将核糖体结合位点、PacI和NotI限制位点导入事先用EcoRI和BamHI消化过的pQE70载体(Qiagen)中,得到质粒pEVL5。pEVL5的完整的核苷酸序列如SEQ ID NO 15所示。

实施例9:从酿酒酵母克隆编码丙酮酸脱羧酶的基因

提取酿酒酵母菌株S288C(ATCC 204508)的染色体DNA,并使用下述引物,根据标准方法,通过PCR扩增丙酮酸脱羧酶基因:

5′-ATATTTAATTAATGTCTGAAATTACTTTGG-3′,见SEQ ID NO16;

5′-ATATGCGGCCGCTTATTGCTTAGCGTTGGT-3′,见SEQ IDNO 17;

将使用SEQ ID NO 16和SEQ ID NO 17所述的2个引物扩增的DNA片段连接进事先用PacI和NotI消化过的pSP100或pEVL5(分别是pUC18-衍生的或pQE70-衍生的载体,如实施例8所述)中,分别生成质粒pVDM61和质粒pEVL419。所克隆的基因的核苷酸序列以及编码的对应多肽的序列可以在GenBank(登记号NC001144)中找到,分别如SEQ ID NO:20和SEQ ID NO:21所示。

实施例10:在大肠杆菌中表达丙酮酸脱羧酶活性以及从2-脱氢-3-脱氧-D-葡糖酸酶促合成2-脱氧-D-核糖

丙酮酸脱羧酶的表达和无细胞提取物的制备

使用pEVL107或pVDM61(如实施例8和9所述构建的)转化大肠杆菌MG1655的感受态细胞,分别生成菌株+1735和菌株+844。在37℃,在含有100mg/l氨苄青霉素的Luria-Bertani(LB)培养基(Difco)中培养这些菌株,直到OD值(600nm)达到1.5左右。

使用pEVL420或pEVL419(如实施例8和9所述构建的)转化携带pREP4质粒(Qiagen)的大肠杆菌MG1655的感受态细胞,分别生成菌株+3150和+3148。在37℃,在含有100mg/l氨苄青霉素和30mg/l卡那霉素的Luria-Bertani(LB)培养基(Difco)中培养这些菌株,直到OD值(600nm)达到0.6。然后,加入异丙基-β-D-硫代吡喃型半乳糖苷(IPTG)至0.5mM终浓度。进一步培养2小时30分钟后,离心收集细胞,用20mM磷酸钠缓冲液pH7.2洗涤1次。

对于每种菌株,使用与实施例2所述相同的方法制备无细胞的提取物。然后,使粗制的无细胞提取物穿过用50mM Tris-醋酸盐缓冲液pH6平衡的PD-10柱(Amersham),并保藏在-20℃。

从2-脱氢-3-脱氧-D-葡糖酸酶促合成2-脱氧-D-核糖

在1.5ml总体积的50mM tris-醋酸盐缓冲液pH6中,将1.0ml无细胞提取物与20mM 2-脱氢-3-脱氧-D-葡糖酸钠、0.5mM硫胺素焦磷酸盐和5mM MgCl2混合。通过分析在37℃孵育递增的时间后所取的等分试样,追踪2-脱氧-D-核糖(DRI)合成的进程。将约1ul每种等分试样(事先已经通过蒸发浓缩了5倍)置于二氧化硅平板上,并在下面的溶剂系统中进行色谱:丁醇/三乙胺/水(10/2/5)。当使用菌株+3150或+3148的无细胞提取物时,在孵育65小时后,用苔黑酚显色后检测到了DRI(Rf约0.50)的蓝斑。浓缩含有与DRI相对应的斑点的粗制品,使其穿过用异丙醇平衡的1.5ml二氧化硅柱。合并含有所期望的DRI化合物的级分,浓缩,并通过质谱分析得到的样品。这一分析的结果证实了分离的化合物与DRI是一致的,以及由来自运动发酵单胞菌(Zymomonas mobilis)或酿酒酵母的丙酮酸脱羧酶催化的从KDG生产DRI。

实施例11:从巴氏醋杆菌克隆编码丙酮酸脱羧酶的基因,所编码的丙酮酸脱羧酶活性在大肠杆菌中的表达,和从2-脱氢-3-脱氧-D-葡糖酸酶促合成2-脱氧-D-核糖

从DSMZ Collection(Deutsche Sammlung von Mikroorganismenund Zellkulturen GmbH,Braunschweig,Germany)得到巴氏醋杆菌菌株NCIB 8618(DSMZ 2347)。从细胞提取染色体DNA,并使用下述引物,根据标准方法,通过PCR扩增丙酮酸脱羧酶基因:

5′-TCTTTAATTAATGGGTTGTCCGTCATTCATATA-3′,见SEQID NO 22;

5′-CTAAAGCTTTTAGGCCAGAGTGGTCTTGCGCG-3′,见SEQID NO 23;,将使用SEQ ID NO 22和SEQ ID NO 23所述的2个引物扩增的DNA片段连接进事先用PacI和NotI消化过的pSP100或pEVL5(分别是pUC18-衍生的或pQE70-衍生的载体,如实施例8所述),分别生成质粒pEVL541和质粒pEVL560。所克隆的基因的核苷酸序列SEQ IDNO 24以及编码的对应多肽的序列SEQ ID NO 25可以在GenBank(登记号AF368435)中找到。

用pEVL541转化了大肠杆菌MG1655菌株的感受态细胞,生成菌株+3559。用pEVL560转化携带pREP4质粒(Qiagen)的大肠杆菌MG1655菌株的感受态细胞,生成菌株+3924。如实施例10所述,培养这些菌株,并制备无细胞的提取物。如实施例10所述,将无细胞的提取物与KDG一起孵育,追踪2-脱氧-D-核糖(DRI)合成的进程。观察到与DRI对应的斑点,表明来自巴氏醋杆菌的丙酮酸脱羧酶能将KDG脱羧基成DRI。

实施例12:从棕榈发酵细菌克隆编码丙酮酸脱羧酶的基因,编码的丙酮酸脱羧酶活性在大肠杆菌中的表达,和从2-脱氢-3-脱氧-D-葡糖酸酶促合成2-脱氧-D-核糖

从DSMZ Collection(Deutsche Sammlung von Mikroorganismenund Zellkulturen GmbH,Braunschweig,Germany)得到了棕榈发酵细菌菌株T109(DSMZ10491)。从细胞提取染色体DNA,并使用下述引物,根据标准方法,通过PCR扩增丙酮酸脱羧酶基因:

5′-ATCTTAATTAATGTATACCGTTGGTATGTACT-3′,见SEQ IDNO 26;

5′-TATGCGGCCGCTTACGCTTGTGGTTTGCGAGAGT-3′,见SEQ ID NO 27;

将使用SEQ ID NO 26和SEQ ID NO 27所述的2个引物扩增的DNA片段连接进事先用PacI和NotI消化过的pSP100或pEVL5(分别是pUC18-衍生的或pQE70-衍生的载体,如实施例8所述),分别生成质粒pEVL546和质粒pEVL561。所克隆的基因的核苷酸序列以及编码的对应多肽的序列分别如SEQ ID NO:28和29所述,且可以在GenBank(登记号AF474145)中找到。

用pEVL546转化了大肠杆菌MG1655菌株的感受态细胞,生成菌株+3568。用pEVL560转化携带pREP4质粒(Qiagen)的大肠杆菌MG1655菌株感受态细胞,生成菌株+3923。如实施例10所述,培养这些菌株,并制备无细胞提取物。如实施例10所述,将无细胞提取物与KDG一起孵育,并追踪2-脱氧-D-核糖(DRI)合成的进程。观察到了与DRI对应的斑点,表明来自棕榈发酵细菌的丙酮酸脱羧酶能将KDG脱羧化成DRI。

实施例13:从恶臭假单胞菌克隆编码苯甲酰基甲酸脱羧酶的基因,所编码的苯甲酰基甲酸脱羧酶活性在大肠杆菌中的表达,和从2-脱氢-3-脱氧-D-葡糖酸酶促合成2-脱氧-D-核糖

从DSMZ Collection(Deutsche Sammlung von Mikroorganismenund Zellkulturen GmbH,Braunschweig,Germany)得到了恶臭假单胞菌菌株Migula(DSMZ 291)。从细胞提取染色体DNA,并使用下述引物,根据标准方法,通过PCR扩增苯甲酰基甲酸脱羧酶基因:

5′-CTATTAATTAATGGCTTCGGTACACGGCACCA-3′,见SEQID NO 30;

5′-TATGCGGCCGCTTACTTCACCGGGCTTACGGTGC-3′,见SEQ ID NO 31;

将使用SEQ ID NO 30和SEQ ID NO 31所述的2个引物扩增的DNA片段连接进事先用PacI和NotI消化过的pSP100或pEVL5(分别是pUC18-衍生的或pQE70-衍生的载体,如实施例8所述),分别生成质粒pEVL681和质粒pEVL670。所克隆的基因的核苷酸序列SEQ IDNO 32以及编码的对应多肽的序列SEQ ID NO 33可以在GenBank(登记号AY143338)中找到。

用pEVL681转化大肠杆菌MG1655菌株的感受态细胞,生成菌株+4050。用pEVL670转化携带pREP4质粒(Qiagen)的大肠杆菌MG1655菌株感受态细胞,生成菌株+3927。如实施例10所述,培养这些菌株,并制备无细胞提取物。如实施例10所述,将无细胞提取物与KDG一起孵育,并追踪2-脱氧-D-核糖(DRI)合成的进程。观察到了与DRI对应的斑点,表明来自恶臭假单胞菌的苯甲酰基甲酸脱羧酶能将KDG脱羧化成DRI。

酶促合成制备2-脱氧-D-核糖

在0.5ml总体积的80mM磷酸钾缓冲液pH6中,将100ul来自菌株+3927的无细胞提取物(含有2.5mg细菌蛋白)与300mM 2-脱氢-3-脱氧-D-葡糖酸钠、0.5mM硫胺素焦磷酸盐和5mM MgCl2混合。在孵育16和40小时后,向孵育混合物中加入数微升HCl 2N溶液,直到pH值达到6。分析在37℃孵育递增的时间后取出的等分试样,追踪2-脱氧-D-核糖(DRI)合成的进程。将约1ul每种等分试样置于二氧化硅平板上,并如实施例10所述进行色谱。通过与标准溶液进行对比,估计2-脱氧-D-核糖的浓度为约200mM。对粗制混合物的13CNMR分析证实了从2-脱氢-3-脱氧-D-葡糖酸盐形成的化合物是2-脱氧-D-核糖,且2-脱氧-D-核糖的浓度接近25g/l。在相同的条件下进行了另一个制备性酶促合成,但是在孵育阶段没有加入酸。在那些条件下,2-脱氧-D-核糖的浓度接近10g/l,远低于前面的控制pH、并规则地调整到pH6的实验所达到的浓度。

实施例14.从D-葡糖酸酶促合成2-脱氧-D-核糖

使用由根癌土壤杆菌的gcnD基因编码的D-葡糖酸脱水酶和来自运动发酵单胞菌的丙酮酸脱羧酶,如下实现了从D-葡糖酸单点酶促合成2-脱氧-D-核糖:

在0.5ml 50mM N-(2-羟乙基)哌嗪-N′-(2-乙烷磺酸)(HEPES)缓冲液pH7中,将分别如实施例2和实施例10所述制备的50ul来自菌株+1289的无细胞提取物(含有1.5mg细菌蛋白)和400ul来自菌株+3150的无细胞提取物(超滤浓缩后,含有17mg细菌蛋白)与50mMD-葡糖酸钾、0.5mM硫胺素焦磷酸盐和5mM MgCl2一起混合。在37℃孵育递增的时间后取出等分试样,进行分析,追踪2-脱氧-D-核糖(DRI)合成的进程。孵育18小时后,将约1ul孵育混合物置于二氧化硅平板上,并如实施例10所述进行色谱。通过与标准溶液进行对比,估计2-脱氧-D-核糖的浓度为约1g/l。

                              序列表

<110>Evologic S.A.

     Maliere Technologies SociétéCivile

     Rhodia Chimie

     Marliere,Phillipe

<120>克隆葡糖酸脱水酶gcnD基因

<130>G 3111 PCT S3

<160>33

<170>PatentIn version 3.1

<210>1

<211>1812

<212>DNA

<213>根癌土壤杆菌(Agrobacterium tumefaciens)

<220>

<221>CDS

<222>(1)..(1809)

<223>

<400>1

atg acg aca tct gat aat ctt cct gca act cag ggc aag ctc cgt tcg     48

Met Thr Thr Ser Asp Asn Leu Pro Ala Thr Gln Gly Lys Leu Arg Ser

1               5                   10                  15

cgc gcc tgg ttc gac aac cca gcc aat gcg gac atg acc gcg ctt tat     96

Arg Ala Trp Phe Asp Asn Pro Ala Asn Ala Asp Met Thr Ala Leu Tyr

            20                  25                  30

ctc gag cgt tac atg aac ttc ggt ctc agc cag gcc gag ctt cag tcc    144

Leu Glu Arg Tyr Met Asn Phe Gly Leu Ser Gln Ala Glu Leu Gln Ser

        35                  40                  45

gac cgc ccg att atc ggt att gcg cag acc ggt tcc gac ctt tcg ccc      192

Asp Arg Pro Ile Ile Gly Ile Ala Gln Thr Gly Ser Asp Leu Ser Pro

    50                  55                  60

tgc aac cgt cat cat ctg gaa ctc gcc aac cgt ctg cgt gaa ggc att      240

Cys Asn Arg His His Leu Glu Leu Ala Asn Arg Leu Arg Glu Gly Ile

65                  70                  75                  80

cgt gaa gcc ggc ggc atc gcc atc gaa ttc ccg gtg cat ccg atc cag      288

Arg Glu Ala Gly Gly Ile Ala Ile Glu Phe Pro Val His Pro Ile Gln

                85                  90                  95

gaa acc ggt aag cgt ccg aca gcg ggc ctt gat cgc aac ctg gct tac      336

Glu Thr Gly Lys Arg Pro Thr Ala Gly Leu Asp Arg Asn Leu Ala Tyr

            100                 105                 110

ctc ggc ctc gtg gaa gtg ctt tat ggc tat ccg ctc gac ggc gtt gtt      384

Leu Gly Leu Val Glu Val Leu Tyr Gly Tyr Pro Leu Asp Gly Val Val

        115                 120                 125

ctg acc atc ggc tgc gac aag acc acg cct gcc tgt ctt atg gcg gcg      432

Leu Thr Ile Gly Cys Asp Lys Thr Thr Pro Ala Cys Leu Met Ala Ala

    130                 135                 140

gcc acc gtc aac att ccg gcc atc gcc ctt tcc gtc ggt ccc atg ctg      480

Ala Thr Val Asn Ile Pro Ala Ile Ala Leu Ser Val Gly Pro Met Leu

145                 150                 155                 160

aac ggc tgg ttc cgc ggt gag cgc acc ggt tcc ggc acc atc gtc tgg      528

Asn Gly Trp Phe Arg Gly Glu Arg Thr Gly Ser Gly Thr Ile Val Trp

                165                 170                 175

aag gcc cgc gaa ctg ctg gcg aag ggc gag atc gat tac cag ggc ttc      576

Lys Ala Arg Glu Leu Leu Ala Lys Gly Glu Ile Asp Tyr Gln Gly Phe

            180                 185                 190

gtc aag ctc gtt gcc tcg tct gcc ccg tcc acc ggc tat tgc aac acc      624

Val Lys Leu Val Ala Ser Ser Ala Pro Ser Thr Gly Tyr Cys Asn Thr

        195                 200                 205

atg ggc acg gca aca acc atg aac tcg ctc gcc gaa gcg ctc ggc atg      672

Met Gly Thr Ala Thr Thr Met Asn Ser Leu Ala Glu Ala Leu Gly Met

 210                 215                 220

cag ctt ccc ggc tcc gcc gcc att ccg gcg cct tac cgt gac cgt cag      720

Gln Leu Pro Gly Ser Ala Ala Ile Pro Ala Pro Tyr Arg Asp Arg Gln

225                 230                 235                 240

gaa gtc tct tac ctc acc ggc ctg cgc atc gtc gac atg gtc agg gaa      768

Glu Val Ser Tyr Leu Thr Gly Leu Arg Ile Val Asp Met Val Arg Glu

                245                 250                 255

gac ctg aaa cca tca gac atc atg acc aag gat gcc ttc atc aac gcc      816

Asp Leu Lys Pro Ser Asp Ile Met Thr Lys Asp Ala Phe Ile Asn Ala

            260                 265                 270

atc cgc gtt aat tcg gcg atc ggc ggt tcc acc aac gcg ccg atc cat      864

Ile Arg Val Asn Ser Ala Ile Gly Gly Ser Thr Asn Ala Pro Ile His

        275                 280                 285

cta aac ggc ctt gcc cgc cat gtc ggc gtc gag ctg acg gtg gat gac      912

Leu Asn Gly Leu Ala Arg His Val Gly Val Glu Leu Thr Val Asp Asp

    290                 295                 300

tgg cag acc tat ggc gaa gac gtg ccg ctg ctc gtc aac ctg cag ccg      960

Trp Gln Thr Tyr Gly Glu Asp Val Pro Leu Leu Val Asn Leu Gln Pro

305                 310                 315                 320

gca ggc gaa tat ctc ggc gag gac tat tac cat gcc ggc ggc gtt ccc     1008

Ala Gly Glu Tyr Leu Gly Glu Asp Tyr Tyr His Ala Gly Gly Val Pro

                325                 330                 335

gct gtc gtc aat cag ctg atg acc caa ggg ctg atc atg gaa gac gcc     1056

Ala Val Val Asn Gln Leu Met Thr Gln Gly Leu Ile Met Glu Asp Ala

            340                 345                 350

atg acc gtc aac ggc aag acc atc ggc gac aat tgc cgt ggc gcg atc     1104

Met Thr Val Asn Gly Lys Thr Ile Gly Asp Asn Cys Arg Gly Ala Ile

        355                 360                 365

atc gaa gac gag aag gtc atc cgc ccc tat gag cag ccg ctc aag gag     1152

Ile Glu Asp Glu Lys Val Ile Arg Pro Tyr Glu Gln Pro Leu Lys Glu

    370                 375                 380

cgt gcc ggc ttc cgc gtt ctg cgc ggc aat ctg ttc tcc tcg gcc atc     1200

Arg Ala Gly Phe Arg Val Leu Arg Gly Asn Leu Phe Ser Ser Ala Ile

385                 390                 395                 400

atg aag aca agc gtg att tcg gaa gaa ttc cgc ggt cgt tac ctc tcc     1248

Met Lys Thr Ser Val Ile Ser Glu Glu Phe Arg Gly Arg Tyr Leu Ser

                405                 410                 415

aac cct gat gat ccg gaa gcc ttc gaa ggc cgc gcc gtg gtg ttc gat     1296

Asn Pro Asp Asp Pro Glu Ala Phe Glu Gly Arg Ala Val Val Phe Asp

            420                 425                 430

ggt ccg gag gat tac cat cat cgc atc gac gat ccg tcg ctt ggc atc     1344

Gly Pro Glu Asp Tyr His His Arg Ile Asp Asp Pro Ser Leu Gly Ile

        435                 440                 445

gac gcc aac acc gtc ctg ttc atg cgc ggc gcc ggt ccg atc ggt tac     1392

Asp Ala Asn Thr Val Leu Phe Met Arg Gly Ala Gly Pro Ile Gly Tyr

    450                 455                 460

ccg ggc gca gcg gaa gtg gtg aac atg cgc gcg ccg gat tac ctt ctg     1440

Pro Gly Ala Ala Glu Val Val Asn Met Arg Ala Pro Asp Tyr Leu Leu

465                 470                 475                 480

aag caa ggc gtc agt tcg ctg ccc tgc atc ggc gat ggc cgc cag tcc     1488

Lys Gln Gly Val Ser Ser Leu Pro Cys Ile Gly Asp Gly Arg Gln Ser

                485                 490                 495

ggc acg tcg ggc agc cca tcc atc ctc aat gcc tcg ccg gaa gcg gcg     1536

Gly Thr Ser Gly Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ala Ala

            500                 505                 510

gcc ggc ggc ggt ctg tct att ctg cag acg ggt gac cgc gtc cgc atc     1584

Ala Gly Gly Gly Leu Ser Ile Leu Gln Thr Gly Asp Arg Val Arg Ile

        515                 520                 525

gat gtg ggc cgc ggc aag gcc gat atc ctg ata tca ggt gaa gag ctc    1632

Asp Val Gly Arg Gly Lys Ala Asp Ile Leu Ile Ser Gly Glu Glu Leu

    530                 535                 540

gcc aag cgt tac gag gcg ctg gca gct cag ggc ggt tat aag ttc ccc    1680

Ala Lys Arg Tyr Glu Ala Leu Ala Ala Gln Gly Gly Tyr Lys Phe Pro

545                 550                 555                 560

gac cac cag acg ccg tgg cag gaa atc cag cgc ggt atc gtc agc cag    1728

Asp His Gln Thr Pro Trp Gln Glu Ile Gln Arg Gly Ile Val Ser Gln

                565                 570                 575

atg gaa acc ggc gcg gtt ctg gaa ccg gcc gta aag tat cag cgc atc    1776

Met Glu Thr Gly Ala Val Leu Glu Pro Ala Val Lys Tyr Gln Arg Ile

            580                 585                 590

gcc cag acc aag ggc ctg ccg cgc gat aac cac tga                    1812

Ala Gln Thr Lys Gly Leu Pro Arg Asp Asn His

        595                 600

<210>2

<211>603

<212>PRT

<213>根癌土壤杆菌

<400>2

Met Thr Thr Ser Asp Asn Leu Pro Ala Thr Gln Gly Lys Leu Arg Ser

1               5                   10                  15

Arg Ala Trp Phe Asp Asn Pro Ala Asn Ala Asp Met Thr Ala Leu Tyr

            20                  25                  30

Leu Glu Arg Tyr Met Asn Phe Gly Leu Ser Gln Ala Glu Leu Gln Ser

         35                  40                  45

Asp Arg Pro Ile Ile Gly Ile Ala Gln Thr Gly Ser Asp Leu Ser Pro

    50                  55                  60

Cys Asn Arg His His Leu Glu Leu Ala Asn Arg Leu Arg Glu Gly Ile

65                  70                  75                  80

Arg Glu Ala Gly Gly Ile Ala Ile Glu Phe Pro Val His Pro Ile Gln

                85                  90                  95

Glu Thr Gly Lys Arg Pro Thr Ala Gly Leu Asp Arg Ash Leu Ala Tyr

            100                 105                 110

Leu Gly Leu Val Glu Val Leu Tyr Gly Tyr Pro Leu Asp Gly Val Val

        115                 120                 125

Leu Thr Ile Gly Cys Asp Lys Thr Thr Pro Ala Cys Leu Met Ala Ala

    130                 135                 140

Ala Thr Val Asn Ile Pro Ala Ile Ala Leu Ser Val Gly Pro Met Leu

145                 150                 155                 160

Asn Gly Trp Phe Arg Gly Glu Arg Thr Gly Ser Gly Thr Ile Val Trp

                165                 170                 175

Lys Ala Arg Glu Leu Leu Ala Lys Gly Glu Ile Asp Tyr Gln Gly Phe

            180                 185                 190

Val Lys Leu Val Ala Ser Ser Ala Pro Ser Thr Gly Tyr Cys Asn Thr

        195                 200                 205

Met Gly Thr Ala Thr Thr Met Asn Ser Leu Ala Glu Ala Leu Gly Met

    210                 215                 220

Gln Leu Pro Gly Ser Ala Ala Ile Pro Ala Pro Tyr Arg Asp Arg Gln

225                 230                 235                 240

Glu Val Ser Tyr Leu Thr Gly Leu Arg Ile Val Asp Met Val Arg Glu

                245                 250                 255

Asp Leu Lys Pro Ser Asp Ile Met Thr Lys Asp Ala Phe Ile Asn Ala

            260                 265                 270

Ile Arg Val Asn Ser Ala Ile Gly Gly Ser Thr Asn Ala Pro Ile His

        275                 280                 285

Leu Asn Gly Leu Ala Arg His Val Gly Val Glu Leu Thr Val Asp Asp

    290                 295                 300

Trp Gln Thr Tyr Gly Glu Asp Val Pro Leu Leu Val Asn Leu Gln Pro

305                 310                 315                 320

Ala Gly Glu Tyr Leu Gly Glu Asp Tyr Tyr His Ala Gly Gly Val Pro

                325                 330                 335

Ala Val Val Asn Gln Leu Met Thr Gln Gly Leu Ile Met Glu Asp Ala

            340                 345                 350

Met Thr Val Asn Gly Lys Thr Ile Gly Asp Asn Cys Arg Gly Ala Ile

        355                 360                 365

Ile Glu Asp Glu Lys Val Ile Arg Pro Tyr Glu Gln Pro Leu Lys Glu

    370                 375                 380

Arg Ala Gly Phe Arg Val Leu Arg Gly Asn Leu Phe Ser Ser Ala Ile

385                 390                 395                 400

Met Lys Thr Ser Val Ile Ser Glu Glu Phe Arg Gly Arg Tyr Leu Ser

                405                 410                 415

Asn Pro Asp Asp Pro Glu Ala Phe Glu Gly Arg Ala Val Val Phe Asp

            420                 425                 430

Gly Pro Glu Asp Tyr His His Arg Ile Asp Asp Pro Ser Leu Gly Ile

        435                 440                 445

Asp Ala Asn Thr Val Leu Phe Met Arg Gly Ala Gly Pro Ile Gly Tyr

    450                 455                 460

Pro Gly Ala Ala Glu Val Val Asn Met Arg Ala Pro Asp Tyr Leu Leu

465                 470                 475                 480

Lys Gln Gly Val Ser Ser Leu Pro Cys Ile Gly Asp Gly Arg Gln Ser

                485                 490                 495

Gly Thr Ser Gly Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ala Ala

            500                 505                 510

Ala Gly Gly Gly Leu Ser Ile Leu Gln Thr Gly Asp Arg Val Arg Ile

        515                 520                 525

Asp Val Gly Arg Gly Lys Ala Asp Ile Leu Ile Ser Gly Glu Glu Leu

    530                 535                 540

Ala Lys Arg Tyr Glu Ala Leu Ala Ala Gln Gly Gly Tyr Lys Phe Pro

545                 550                 555                 560

Asp His Gln Thr Pro Trp Gln Glu Ile Gln Arg Gly Ile Val Ser Gln

                565                 570                 575

Met Glu Thr Gly Ala Val Leu Glu Pro Ala Val Lys Tyr Gln Arg Ile

            580                 585                 590

Ala Gln Thr Lys Gly Leu Pro Arg Asp Asn His

        595                 600

<210>3

<211>1272

<212>DNA

<213>根癌土壤杆菌

<220>

<221>CDS

<222>(1)..(1269)

<223>

<400>3

atg cag tct tct tca gct ctt cgg caa tca acc ggc gat cag tcg gaa       48

Met Gln Ser Ser Ser Ala Leu Arg Gln Ser Thr Gly Asp Gln Ser Glu

1               5                   10                  15

tac cat gcc cag tcg aat atg atc ggc tct agc ccg gcg gac ggt ttg       96

Tyr His Ala Gln Ser Asn Met Ile Gly Ser Ser Pro Ala Asp Gly Leu

            20                  25                  30

ctc gca ttg ccg ctt ctg acc gtc gat ctt gcc gtc tat cgc ggt aat      144

Leu Ala Leu Pro Leu Leu Thr Val Asp Leu Ala Val Tyr Arg Gly Asn

        35                  40                  45

cgg gat cgc ttt ctt gcg ctt gtc tcg gcc cat gga gcg aag gcg gct      192

Arg Asp Arg Phe Leu Ala Leu Val Ser Ala His Gly Ala Lys Ala Ala

    50                  55                  60

cca cat gcc aag acg ccg atg tgc ccg gag atc gcg atc gat ctg att      240

Pro His Ala Lys Thr Pro Met Cys Pro Glu Ile Ala Ile Asp Leu Ile

65                  70                  75                  80

gaa gcc ggt gcc tgg ggc gcg acg gtc gcc gat ctc ttc cag gcg gaa      288

Glu Ala Gly Ala Trp Gly Ala Thr Val Ala Asp Leu Phe Gln Ala Glu

                85                  90                  95

gtc ctg ctc aag gcc ggc gtg tcg aac ata ttg atc gcc aac cag atc      336

Val Leu Leu Lys Ala Gly Val Ser Asn Ile Leu Ile Ala Asn Gln Ile

            100                 105                 110

ggc gga ttg aca tcc gcc aga cgc cta cgc atg ctc gca gat gct ttt      384

Gly Gly Leu Thr Ser Ala Arg Arg Leu Arg Met Leu Ala Asp Ala Phe

        115                 120                 125

ccg aaa gcc gag att atc tgc tgt gtc gat tct gtt cag gcc tcg gcc      432

Pro Lys Ala Glu Ile Ile Cys Cys Val Asp Ser Val Gln Ala Ser Ala

    130                 135                 140

aat ctg gtt cag gcc ttt caa ggg cgt gtg gat gcc cca ttc aag gtc      480

Asn Leu Val Gln Ala Phe Gln Gly Arg Val Asp Ala Pro Phe Lys Val

145                 150                 155                 160

ttc atc gaa gtc ggt gtc ggc cgc act ggc gcc cgt acg ttg aat gtt      528

Phe Ile Glu Val Gly Val Gly Arg Thr Gly Ala Arg Thr Leu Asn Val

                165                 170                 175

gca aag gat atc atc gac acc atc tcg aca agt gca gaa atc gta ctg      576

Ala Lys Asp Ile Ile Asp Thr Ile Ser Thr Ser Ala Glu Ile Val Leu

            180                 185                 190

gcc ggt gtg tcg acc tat gaa ggc tcc gtc tcc ggg gaa acg tcg gaa      624

Ala Gly Val Ser Thr Tyr Glu Gly Ser Val Ser Gly Glu Thr Ser Glu

        195                 200                 205

gca ctc gat gca aac atg gcg gcc ctg ttc gat ctc ctg acc gac agt      672

Ala Leu Asp Ala Asn Met Ala Ala Leu Phe Asp Leu Leu Thr Asp Ser

    210                 215                 220

ctt gca tcg ata cgc gaa aaa gat ccc ggg cgc ccg cta acg gtt tca      720

Leu Ala Ser Ile Arg Glu Lys Asp Pro Gly Arg Pro Leu Thr Val Ser

225                 230                 235                 240

gcc ggc ggt tcg atc cat ttc gac cgc gtg ctc gcg gcg ctt gtg ccc      768

Ala Gly Gly Ser Ile His Phe Asp Arg Val Leu Ala Ala Leu Val Pro

                245                 250                 255

gtt tgc gag gcg gat ggc aat gcg acg ttg ttg ctg cgc agc ggc gcc      816

Val Cys Glu Ala Asp Gly Asn Ala Thr Leu Leu Leu Arg Ser Gly Ala

            260                 265                 270

atc ttc ttc tct gat cac ggt gta tat cag cgc ggt ttc cag gca gtc      864

Ile Phe Phe Ser Asp His Gly Val Tyr Gln Arg Gly Phe Gln Ala Val

        275                 280                 285

gac gcc cgc aac cta ctc gca tcc ggc aag gtt gtc ttc aag gca tcc      912

Asp Ala Arg Asn Leu Leu Ala Ser Gly Lys Val Val Phe Lys Ala Ser

    290                 295                 300

gag gca ttt cag ccc tca atg cga atc tgg gcg gag gtc atc tcc gtt      960

Glu Ala Phe Gln Pro Ser Met Arg Ile Trp Ala Glu Val Ile Ser Val

305                 310                 315                 320

cct gag ccg ggg ctg gcg atc gtc ggc atg ggc atg cgg gat gta tcg     1008

Pro Glu Pro Gly Leu Ala Ile Val Gly Met Gly Met Arg Asp Val Ser

                325                 330                 335

ttc gat cag gac ctg ccc gtg gcg ctt cgg ctc cat agg gac gga cat     1056

Phe Asp Gln Asp Leu Pro Val Ala Leu Arg Leu His Arg Asp Gly His

            340                 345                 350

ctg gtc gaa gct gat ctc tct tca tcc gcg aag gtc ggc aag ctc aat    1104

Leu Val Glu Ala Asp Leu Ser Ser Ser Ala Lys Val Gly Lys Leu Asn

        355                 360                 365

gac cag cat gcc ttc ttg tcc ttc ggg aac ggc agc agt ctg gca atc    1152

Asp Gln His Ala Phe Leu Ser Phe Gly Asn Gly Ser Ser Leu Ala Ile

    370                 375                 380

ggc gat gtc ata gaa ttc ggc atc tcg cat ccc tgc acg tgc ttc gat    1200

Gly Asp Val Ile Glu Phe Gly Ile Ser His Pro Cys Thr Cys Phe Asp

385                 390                 395                 400

cgc tgg cgc gtc ttt cac gga atc gat gga tca ggc cgg atc cag cgc    1248

Arg Trp Arg Val Phe His Gly Ile Asp Gly Ser Gly Arg Ile Gln Arg

                405                 410                 415

atc tac aca acc ttc ttt cac tag                                    1272

Ile Tyr Thr Thr Phe Phe His

            420

<210>4

<211>423

<212>PRT

<213>根癌土壤杆菌

<400>4

Met Gln Ser Ser Ser Ala Leu Arg Gln Ser Thr Gly Asp Gln Ser Glu

1               5                   10                  15

Tyr His Ala Gln Ser Asn Met Ile Gly Ser Ser Pro Ala Asp Gly Leu

            20                  25                  30

Leu Ala Leu Pro Leu Leu Thr Val Asp Leu Ala Val Tyr Arg Gly Asn

        35                  40                  45

Arg Asp Arg Phe Leu Ala Leu Val Ser Ala His Gly Ala Lys Ala Ala

    50                  55                  60

Pro His Ala Lys Thr Pro Met Cys Pro Glu Ile Ala Ile Asp Leu Ile

65                  70                  75                  80

Glu Ala Gly Ala Trp Gly Ala Thr Val Ala Asp Leu Phe Gln Ala Glu

                85                  90                  95

Val Leu Leu Lys Ala Gly Val Ser Asn Ile Leu Ile Ala Asn Gln Ile

            100                 105                 110

Gly Gly Leu Thr Ser Ala Arg Arg Leu Arg Met Leu Ala Asp Ala Phe

        115                 120                 125

Pro Lys Ala Glu Ile Ile Cys Cys Val Asp Ser Val Gln Ala Ser Ala

    130                 135                 140

Asn Leu Val Gln Ala Phe Gln Gly Arg Val Asp Ala Pro Phe Lys Val

145                 150                 155                 160

Phe Ile Glu Val Gly Val Gly Arg Thr Gly Ala Arg Thr Leu Asn Val

                165                 170                 175

Ala Lys Asp Ile Ile Asp Thr Ile Ser Thr Ser Ala Glu Ile Val Leu

            180                 185                 190

Ala Gly Val Ser Thr Tyr Glu Gly Ser Val Ser Gly Glu Thr Ser Glu

        195                 200                 205

Ala Leu Asp Ala Asn Met Ala Ala Leu Phe Asp Leu Leu Thr Asp Ser

    210                 215                 220

Leu Ala Ser Ile Arg Glu Lys Asp Pro Gly Arg Pro Leu Thr Val Ser

225                 230                 235                 240

Ala Gly Gly Ser Ile His Phe Asp Arg Val Leu Ala Ala Leu Val Pro

                245                 250                 255

Val Cys Glu Ala Asp Gly Asn Ala Thr Leu Leu Leu Arg Ser Gly Ala

            260                 265                 270

Ile Phe Phe Ser Asp His Gly Val Tyr Gln Arg Gly Phe Gln Ala Val

        275                 280                 285

Asp Ala Arg Asn Leu Leu Ala Ser Gly Lys Val Val Phe Lys Ala Ser

    290                 295                 300

Glu Ala Phe Gln Pro Ser Met Arg Ile Trp Ala Glu Val Ile Ser Val

305                 310                 315                 320

Pro Glu Pro Gly Leu Ala Ile Val Gly Met Gly Met Arg Asp Val Ser

                325                 330                 335

Phe Asp Gln Asp Leu Pro Val Ala Leu Arg Leu His Arg Asp Gly His

            340                 345                 350

Leu Val Glu Ala Asp Leu Ser Ser Ser Ala Lys Val Gly Lys Leu Asn

        355                 360                 365

Asp Gln His Ala Phe Leu Ser Phe Gly Asn Gly Ser Ser Leu Ala Ile

    370                 375                 380

Gly Asp Val Ile Glu Phe Gly Ile Ser His Pro Cys Thr Cys Phe Asp

385                 390                 395                 400

Arg Trp Arg Val Phe His Gly Ile Asp Gly Ser Gly Arg Ile Gln Arg

                405                 410                 415

Ile Tyr Thr Thr Phe Phe His

            420

<210>5

<211>32

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>5

cccttaatta atgacgacat ctgataatct tc                                  32

<210>6

<211>30

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>6

tttgcggccg cttagtggtt atcgcgcggc                                     30

<210>7

<211>31

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>7

cccggtacca tgacgacatc tgataatctt c                                   31

<210>8

<211>32

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>8

cccttaatta atgcagtctt cttcagctct tc                                  32

<210>9

<211>35

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>9

tttgcggccg cctagtgaaa gaaggttgtg tagat                               35

<210>10

<211>34

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>10

aaatcatgac tatgcagtct tcttcagctc ttcg                                34

<210>11

<211>33

<212>DNA

<213>人工序列

<220>

<223>寡核苷酸引物

<400>11

tatagatctc tagtgaaaga aggttgtgta gat                                 33

<210>12

<211>31

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>12

gcgttaatta atgagttata ctgtcggtac c                                   31

<210>13

<211>32

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>13

tatgcggccg cttagaggag cttgttaaca gg                                  32

<210>14

<211>2665

<212>DNA

<213>载体

<400>14

gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt     60

cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt    120

tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat    180

aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt    240

ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg    300

ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga    360

tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc    420

tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac    480

actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg    540

gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca    600

acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg    660

gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg    720

acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg    780

gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag    840

ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg    900

gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct    960

cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac   1020

agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact   1080

catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga   1140

tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt    1200

cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct    1260

gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc    1320

taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc    1380

ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc    1440

tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg    1500

ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt    1560

cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg    1620

agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg    1680

gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt    1740

atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag    1800

gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt    1860

gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta    1920

ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt    1980

cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc    2040

cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca    2100

acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc    2160

cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg    2220

accatgatta cgaattcgag gttaattaac cccgcggccg caagcttggc actggccgtc    2280

gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca    2340

catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa    2400

cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct tacgcatctg    2460

tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga tgccgcatag    2520

ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc    2580

ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt    2640

tcaccgtcat caccgaaacg cgcga                                          2665

<210>15

<211>3433

<212>DNA

<213>载体

<400>15

ctcgagaaat cataaaaaat ttatttgctt tgtgagcgga taacaattat aatagattca      60

attgtgagcg gataacaatt tcacacagaa ttcttaaaga ggagaaatta attaaccccg     120

cggccgcgga tccagatctc atcaccatca ccatcactaa gcttaattag ctgagcttgg     180

actcctgttg atagatccag taatgacctc agaactccat ctggatttgt tcagaacgct     240

cggttgccgc cgggcgtttt ttattggtga gaatccaagc tagcttggcg agattttcag     300

gagctaagga agctaaaatg gagaaaaaaa tcactggata taccaccgtt gatatatccc     360

aatggcatcg taaagaacat tttgaggcat ttcagtcagt tgctcaatgt acctataacc     420

agaccgttca gctggatatt acggcctttt taaagaccgt aaagaaaaat aagcacaagt     480

tttatccggc ctttattcac attcttgccc gcctgatgaa tgctcatccg gaatttcgta     540

tggcaatgaa agacggtgag ctggtgatat gggatagtgt tcacccttgt tacaccgttt     600

tccatgagca aactgaaacg ttttcatcgc tctggagtga ataccacgac gatttccggc     660

agtttctaca catatattcg caagatgtgg cgtgttacgg tgaaaacctg gcctatttcc     720

ctaaagggtt tattgagaat atgtttttcg tctcagccaa tccctgggtg agtttcacca     780

gttttgattt aaacgtggcc aatatggaca acttcttcgc ccccgttttc accatgggca     840

aatattatac gcaaggcgac aaggtgctga tgccgctggc gattcaggtt catcatgccg     900

tttgtgatgg cttccatgtc ggcagaatgc ttaatgaatt acaacagtac tgcgatgagt     960

ggcagggcgg ggcgtaattt ttttaaggca gttattggtg cccttaaacg cctggggtaa    1020

tgactctcta gcttgaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt    1080

cgttttatct gttgtttgtc ggtgaacgct ctcctgagta ggacaaatcc gccctctaga    1140

gctgcctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga    1200

cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag    1260

cgggtgttgg cgggtgtcgg ggcgcagcca tgacccagtc acgtagcgat agcggagtgt    1320

atactggctt aactatgcgg catcagagca gattgtactg agagtgcacc atatgcggtg    1380

tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt ccgcttcctc    1440

gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa    1500

ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa    1560

aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct    1620

ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac    1680

aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc    1740

gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc    1800

tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg    1860

tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga    1920

gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag    1980

cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta    2040

cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag    2100

agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg    2160

caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac    2220

ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc    2280

aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag    2340

tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc    2400

agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac    2460

gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc    2520

accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg    2580

tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag    2640

tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc    2700

acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac    2760

atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag    2820

aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac    2880

tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg    2940

agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc    3000

gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact    3060

ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg    3120

atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa    3180

tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt    3240

tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg    3300

tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga    3360

cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc    3420

ctttcgtctt cac                                                       3433

<210>16

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>16

atatttaatt aatgtctgaa attactttgg                                     30

<210>17

<211>30

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>17

atatgcggcc gcttattgct tagcgttggt                                     30

<210>18

<211>1707

<212>DNA

<213>运动发酵单胞菌(Zymomonas mobilis)

<220>

<221>CDS

<222>(1)..(1707)

<223>

<400>18

atg agt tat act gtc ggt acc tat tta gcg gag cgg ctt gtc cag att       48

Met Ser Tyr Thr Val Gly Thr Tyr Leu Ala Glu Arg Leu Val Gln Ile

1               5                   10                  15

ggt ctc aag cat cac ttc gca gtc gcg ggc gac tac aac ctc gtc ctt       96

Gly Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu

            20                  25                  30

ctt gac aac ctg ctt ttg aac aaa aac atg gag cag gtt tat tgc tgt      144

Leu Asp Asn Leu Leu Leu Asn Lys Asn Met Glu Gln Val Tyr Cys Cys

        35                  40                  45

aac gaa ctg aac tgc ggt ttc agt gca gaa ggt tat gct cgt gcc aaa      192

Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Lys

    50                  55                  60

ggc gca gca gca gcc gtc gtt acc tac agc gtc ggt gcg ctt tcc gca      240

Gly Ala Ala Ala Ala Val Val Thr Tyr Ser Val Gly Ala Leu Set Ala

65                  70                  75                  80

ttt gat gct atc ggt ggc gcc tat gca gaa aac ctt ccg gtt atc ctg      288

Phe Asp Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu

                85                  90                  95

atc tcc ggt gct ccg aac aac aat gat cac gct gct ggt cac gtg ttg      336

Ile Ser Gly Ala Pro Asn Asn Asn Asp His Ala Ala Gly His Val Leu

            100                 105                 110

cat cac gct ctt ggc aaa acc gac tat cac tat cag ttg gaa atg gcc      384

His His Ala Leu Gly Lys Thr Asp Tyr His Tyr Gln Leu Glu Met Ala

        115                 120                 125

aag aac atc acg gcc gcc gct gaa gcg att tac acc ccg gaa gaa gct      432

Lys Asn Ile Thr Ala Ala Ala Glu Ala Ile Tyr Thr Pro Glu Glu Ala

    130                 135                 140

ccg gct aaa atc gat cac gtg att aaa act gct ctt cgt gag aag aag      480

Pro Ala Lys Ile Asp His Val Ile Lys Thr Ala Leu Arg Glu Lys Lys

145                 150                 155                 160

ccg gtt tat ctc gaa atc gct tgc aac att gct tcc atg ccc tgc gcc      528

Pro Val Tyr Leu Glu Ile Ala Cys Asn Ile Ala Ser Met Pro Cys Ala

                165                 170                 175

gct cct gga ccg gca agc gca ttg ttc aat gac gaa gcc agc gac gaa      576

Ala Pro Gly Pro Ala Ser Ala Leu Phe Asn Asp Glu Ala Ser Asp Glu

            180                 185                 190

gct tct ttg aat gca gcg gtt gaa gaa acc ctg aaa ttc atc gcc aac      624

Ala Ser Leu Asn Ala Ala Val Glu Glu Thr Leu Lys Phe Ile Ala Asn

        195                 200                 205

cgc gac aaa gtt gcc gtc ctc gtc ggc agc aag ctg cgc gca gct ggt      672

Arg Asp Lys Val Ala Val Leu Val Gly Ser Lys Leu Arg Ala Ala Gly

    210                 215                 220

gct gaa gaa gct gct gtc aaa ttt gct gat gct ctc ggt ggc gca gtt      720

Ala Glu Glu Ala Ala Val Lys Phe Ala Asp Ala Leu Gly Gly Ala Val

225                 230                 235                 240

gct acc atg gct gct gca aaa agc ttc ttc cca gaa gaa aac ccg cat      768

Ala Thr Met Ala Ala Ala Lys Ser Phe Phe Pro Glu Glu Asn Pro His

                245                 250                 255

tac atc ggc acc tca tgg ggt gaa gtc agc tat ccg ggc gtt gaa aag      816

Tyr Ile Gly Thr Ser Trp Gly Glu Val Ser Tyr Pro Gly Val Glu Lys

            260                 265                 270

acg atg aaa gaa gcc gat gcg gtt atc gct ctg gct cct gtc ttc aac      864

Thr Met Lys Glu Ala Asp Ala Val Ile Ala Leu Ala Pro Val Phe Asn

        275                 280                 285

gac tac tcc acc act ggt tgg acg gat att cct gat cct aag aaa ctg      912

Asp Tyr Ser Thr Thr Gly Trp Thr Asp Ile Pro Asp Pro Lys Lys Leu

    290                 295                 300

gtt ctc gct gaa ccg cgt tct gtc gtc gtt aac ggc att cgc ttc ccc      960

Val Leu Ala Glu Pro Arg Ser Val Val Val Asn Gly Ile Arg Phe Pro

305                 310                315                 320

agc gtc cat ctg aaa gac tat ctg acc cgt ttg gct cag aaa gtt tcc     1008

Ser Val His Leu Lys Asp Tyr Leu Thr Arg Leu Ala Gln Lys Val Ser

                325                 330                 335

aag aaa acc ggt gca ttg gac ttc ttc aaa tcc ctc aat gca ggt gaa     1056

Lys Lys Thr Gly Ala Leu Asp Phe Phe Lys Ser Leu Asn Ala Gly Glu

            340                 345                 350

ctg aag aaa gcc gct ccg gct gat ccg agt gct ccg ttg gtc aac gca     1104

Leu Lys Lys Ala Ala Pro Ala Asp Pro Ser Ala Pro Leu Val Asn Ala

        355                 360                 365

gaa atc gcc cgt cag gtc gaa gct ctt ctg acc ccg aac acg acg gtt     1152

Glu Ile Ala Arg Gln Val Glu Ala Leu Leu Thr Pro Asn Thr Thr Val

    370                 375                 380

att gct gaa acc ggt gac tct tgg ttc aat gct cag cgc atg aag ctc     1200

Ile Ala Glu Thr Gly Asp Ser Trp Phe Asn Ala Gln Arg Met Lys Leu

385                 390                 395                 400

ccg aac ggt gct cgc gtt gaa tat gaa atg cag tgg ggt cac att ggt     1248

Pro Asn Gly Ala Arg Val Glu Tyr Glu Met Gln Trp Gly His Ile Gly

                405                 410                 415

tgg tcc gtt cct gcc gcc ttc ggt tat gcc gtc ggt gct ccg gaa cgt     1296

Trp Ser Val Pro Ala Ala Phe Gly Tyr Ala Val Gly Ala Pro Glu Arg

            420                 425                 430

cgc aac atc ctc atg gtt ggt gat ggt tcc ttc cag ctg acg gct cag     1344

Arg Asn Ile Leu Met Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln

        435                 440                 445

gaa gtc gct cag atg gtt cgc ctg aaa ctg ccg gtt atc atc ttc ttg     1392

Glu Val Ala Gln Met Val Arg Leu Lys Leu Pro Val Ile Ile Phe Leu

    450                 455                 460

atc aat aac tat ggt tac acc atc gaa gtt atg atc cat gat ggt ccg     1440

Ile Asn Asn Tyr Gly Tyr Thr Ile Glu Val Met Ile His Asp Gly Pro

465                 470                 475                 480

tac aac aac atc aag aac tgg gat tat gcc ggt ctg atg gaa gtg ttc     1488

Tyr Asn Asn Ile Lys Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe

                485                 490                 495

aac ggt aac ggt ggt tat gac agc ggt gct ggt aaa ggc ctg aag gct     1536

Asn Gly Asn Gly Gly Tyr Asp Ser Gly Ala Gly Lys Gly Leu Lys Ala

            500                 505                 510

aaa acc ggt ggc gaa ctg gca gaa gct atc aag gtt gct ctg gca aac     1584

Lys Thr Gly Gly Glu Leu Ala Glu Ala Ile Lys Val Ala Leu Ala Asn

        515                 520                 525

acc gac ggc cca acc ctg atc gaa tgc ttc atc ggt cgt gaa gac tgc     1632

Thr Asp Gly Pro Thr Leu Ile Glu Cys Phe Ile Gly Arg Glu Asp Cys

    530                 535                 540

act gaa gaa ttg gtc aaa tgg ggt aag cgc gtt gct gcc gcc aac agc     1680

Thr Glu Glu Leu Val Lys Trp Gly Lys Arg Val Ala Ala Ala Asn Ser

545                 550                 555                 560

cgt aag cct gtt aac aag ctc ctc tag                                 1707

Arg Lys Pro Val Asn Lys Leu Leu

                565

<210>19

<211>568

<212>PRT

<213>运动发酵单胞菌

<400>19

Met Ser Tyr Thr Val Gly Thr Tyr Leu Ala Glu Arg Leu Val Gln Ile

1               5                   10                  15

Gly Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu

            20                  25                  30

Leu Asp Asn Leu Leu Leu Asn Lys Asn Met Glu Gln Val Tyr Cys Cys

        35                  40                  45

Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Lys

    50                  55                  60

Gly Ala Ala Ala Ala Val Val Thr Tyr Ser Val Gly Ala Leu Ser Ala

65                  70                  75                  80

Phe Asp Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu

                85                  90                  95

Ile Ser Gly Ala Pro Asn Asn Asn Asp His Ala Ala Gly His Val Leu

            100                 105                 110

His His Ala Leu Gly Lys Thr Asp Tyr His Tyr Gln Leu Glu Met Ala

        115                 120                 125

Lys Asn Ile Thr Ala Ala Ala Glu Ala Ile Tyr Thr Pro Glu Glu Ala

    130                 135                 140

Pro Ala Lys Ile Asp His Val Ile Lys Thr Ala Leu Arg Glu Lys Lys

145                 150                 155                 160

Pro Val Tyr Leu Glu Ile Ala Cys Asn Ile Ala Ser Met Pro Cys Ala

                165                 170                 175

Ala Pro Gly Pro Ala Ser Ala Leu Phe Asn Asp Glu Ala Ser Asp Glu

            180                 185                 190

Ala Ser Leu Asn Ala Ala Val Glu Glu Thr Leu Lys Phe Ile Ala Asn

        195                 200                 205

Arg Asp Lys Val Ala Val Leu Val Gly Ser Lys Leu Arg Ala Ala Gly

    210                 215                 220

Ala Glu Glu Ala Ala Val Lys Phe Ala Asp Ala Leu Gly Gly Ala Val

225                 230                 235                 240

Ala Thr Met Ala Ala Ala Lys Ser Phe Phe Pro Glu Glu Asn Pro His

                245                 250                 255

Tyr Ile Gly Thr Ser Trp Gly Glu Val Ser Tyr Pro Gly Val Glu Lys

            260                 265                 270

Thr Met Lys Glu Ala Asp Ala Val Ile Ala Leu Ala Pro Val Phe Asn

        275                 280                 285

Asp Tyr Ser Thr Thr Gly Trp Thr Asp Ile Pro Asp Pro Lys Lys Leu

    290                 295                 300

Val Leu Ala Glu Pro Arg Ser Val Val Val Asn Gly Ile Arg Phe Pro

305                 310                 315                 320

Ser Val His Leu Lys Asp Tyr Leu Thr Arg Leu Ala Gln Lys Val Ser

                325                 330                 335

Lys Lys Thr Gly Ala Leu Asp Phe Phe Lys Ser Leu Asn Ala Gly Glu

            340                 345                 350

Leu Lys Lys Ala Ala Pro Ala Asp Pro Ser Ala Pro Leu Val Asn Ala

        355                 360                 365

Glu Ile Ala Arg Gln Val Glu Ala Leu Leu Thr Pro Asn Thr Thr Val

    370                 375                 380

Ile Ala Glu Thr Gly Asp Ser Trp Phe Asn Ala Gln Arg Met Lys Leu

385                 390                 395                 400

Pro Asn Gly Ala Arg Val Glu Tyr Glu Met Gln Trp Gly His Ile Gly

                405                 410                 415

Trp Ser Val Pro Ala Ala Phe Gly Tyr Ala Val Gly Ala Pro Glu Arg

            420                 425                 430

Arg Asn Ile Leu Met Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln

        435                 440                 445

Glu Val Ala Gln Met Val Arg Leu Lys Leu Pro Val Ile Ile Phe Leu

    450                 455                 460

Ile Asn Asn Tyr Gly Tyr Thr Ile Glu Val Met Ile His Asp Gly Pro

465                 470                 475                 480

Tyr Asn Asn Ile Lys Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe

                485                 490                 495

Asn Gly Asn Gly Gly Tyr Asp Ser Gly Ala Gly Lys Gly Leu Lys Ala

            500                 505                 510

Lys Thr Gly Gly Glu Leu Ala Glu Ala Ile Lys Val Ala Leu Ala Asn

        515                 520                 525

Thr Asp Gly Pro Thr Leu Ile Glu Cys Phe Ile Gly Arg Glu Asp Cys

    530                 535                 540

Thr Glu Glu Leu Val Lys Trp Gly Lys Arg Val Ala Ala Ala Asn Ser

545                 550                 555                 560

Arg Lys Pro Val Asn Lys Leu Leu

                565

<210>20

<211>1692

<212>DNA

<213>酿酒酵母(Saccharomyces cerevisiae)

<220>

<221>CDS

<222>(1)..(1692)

<223>

<400>20

atg tct gaa att act ttg ggt aaa tat ttg ttc gaa aga tta aag caa     48

Met Ser Glu Ile Thr Leu Gly Lys Tyr Leu Phe Glu Arg Leu Lys Gln

1               5                   10                  15

gtc aac gtt aac acc gtt ttc ggt ttg cca ggt gac ttc aac ttg tcc     96

Val Asn Val Asn Thr Val Phe Gly Leu Pro Gly Asp Phe Asn Leu Ser

            20                  25                  30

ttg ttg gac aag atc tac gaa gtt gaa ggt atg aga tgg gct ggt aac    144

Leu Leu Asp Lys Ile Tyr Glu Val Glu Gly Met Arg Trp Ala Gly Asn

        35                  40                  45

gcc aac gaa ttg aac gct gct tac gcc gct gat ggt tac gct cgt atc    192

Ala Asn Glu Leu Asn Ala Ala Tyr Ala Ala Asp Gly Tyr Ala Arg Ile

    50                  55                  60

aag ggt atg tct tgt atc atc acc acc ttc ggt gtc ggt gaa ttg tct    240

Lys Gly Met Ser Cys Ile Ile Thr Thr Phe Gly Val Gly Glu Leu Ser

65                  70                  75                  80

gct ttg aac ggt att gcc ggt tct tac gct gaa cac gtc ggt gtt ttg    288

Ala Leu Asn Gly Ile Ala Gly Ser Tyr Ala Glu His Val Gly Val Leu

                85                  90                  95

cac gtt gtt ggt gtc cca tcc atc tct gct caa gct aag caa ttg ttg    336

His Val Val Gly Val Pro Ser Ile Ser Ala Gln Ala Lys Gln Leu Leu

            100                 105                 110

ttg cac cac acc ttg ggt aac ggt gac ttc act gtt ttc cac aga atg    384

Leu His His Thr Leu Gly Asn Gly Asp Phe Thr Val Phe His Arg Met

        115                 120                 125

tct gcc aac att tct gaa acc act gct atg atc act gac att gct acc      432

Ser Ala Asn Ile Ser Glu Thr Thr Ala Met Ile Thr Asp Ile Ala Thr

    130                 135                 140

gcc cca gct gaa att gac aga tgt atc aga acc act tac gtc acc caa      480

Ala Pro Ala Glu Ile Asp Arg Cys Ile Arg Thr Thr Tyr Val Thr Gln

145                 150                 155                 160

aga cca gtc tac tta ggt ttg cca gct aac ttg gtc gac ttg aac gtc      528

Arg Pro Val Tyr Leu Gly Leu Pro Ala Asn Leu Val Asp Leu Asn Val

                165                 170                 175

cca gct aag ttg ttg caa act cca att gac atg tct ttg aag cca aac      576

Pro Ala Lys Leu Leu Gln Thr Pro Ile Asp Met Ser Leu Lys Pro Asn

            180                 185                 190

gat gct gaa tcc gaa aag gaa gtc att gac acc atc ttg gct ttg gtc      624

Asp Ala Glu Ser Glu Lys Glu Val Ile Asp Thr Ile Leu Ala Leu Val

        195                 200                 205

aag gat gct aag aac cca gtt atc ttg gct gat gct tgt tgt tcc aga      672

Lys Asp Ala Lys Asn Pro Val Ile Leu Ala Asp Ala Cys Cys Ser Arg

    210                 215                 220

cac gac gtc aag gct gaa act aag aag ttg att gac ttg act caa ttc      720

His Asp Val Lys Ala Glu Thr Lys Lys Leu Ile Asp Leu Thr Gln Phe

225                 230                 235                 240

cca gct ttc gtc acc cca atg ggt aag ggt tcc att gac gaa caa cac      768

Pro Ala Phe Val Thr Pro Met Gly Lys Gly Ser Ile Asp Glu Gln His

                245                 250                 255

cca aga tac ggt ggt gtt tac gtc ggt acc ttg tcc aag cca gaa gtt      816

Pro Arg Tyr Gly Gly Val Tyr Val Gly Thr Leu Ser Lys Pro Glu Val

            260                 265                 270

aag gaa gcc gtt gaa tct gct gac ttg att ttg tct gtc ggt gct ttg      864

Lys Glu Ala Val Glu Ser Ala Asp Leu Ile Leu Ser Val Gly Ala Leu

        275                 280                 285

ttg tct gat ttc aac acc ggt tct ttc tct tac tct tac aag acc aag      912

Leu Ser Asp Phe Asn Thr Gly Ser Phe Ser Tyr Ser Tyr Lys Thr Lys

    290                 295                 300

aac att gtc gaa ttc cac tcc gac cac atg aag atc aga aac gcc act      960

Asn Ile Val Glu Phe His Ser Asp His Met Lys Ile Arg Asn Ala Thr

305                 310                 315                 320

ttc cca ggt gtc caa atg aaa ttc gtt ttg caa aag ttg ttg acc act     1008

Phe Pro Gly Val Gln Met Lys Phe Val Leu Gln Lys Leu Leu Thr Thr

                325                 330                 335

att gct gac gcc gct aag ggt tac aag cca gtt gct gtc cca gct aga     1056

Ile Ala Asp Ala Ala Lys Gly Tyr Lys Pro Val Ala Val Pro Ala Arg

            340                 345                 350

act cca gct aac gct gct gtc cca gct tct acc cca ttg aag caa gaa     1104

Thr Pro Ala Asn Ala Ala Val Pro Ala Ser Thr Pro Leu Lys Gln Glu

        355                 360                 365

tgg atg tgg aac caa ttg ggt aac ttc ttg caa gaa ggt gat gtt gtc     1152

Trp Met Trp Asn Gln Leu Gly Asn Phe Leu Gln Glu Gly Asp Val Val

    370                 375                 380

att gct gaa acc ggt acc tcc gct ttc ggt atc aac caa acc act ttc     1200

Ile Ala Glu Thr Gly Thr Ser Ala Phe Gly Ile Asn Gln Thr Thr Phe

385                 390                 395                 400

cca aac aac acc tac ggt atc tct caa gtc tta tgg ggt tcc att ggt     1248

Pro Asn Asn Thr Tyr Gly Ile Ser Gln Val Leu Trp Gly Ser Ile Gly

                405                 410                 415

ttc acc act ggt gct acc ttg ggt gct gct ttc gct gct gaa gaa att     1296

Phe Thr Thr Gly Ala Thr Leu Gly Ala Ala Phe Ala Ala Glu Glu Ile

            420                 425                 430

gat cca aag aag aga gtt atc tta ttc att ggt gac ggt tct ttg caa     1344

Asp Pro Lys Lys Arg Val Ile Leu Phe Ile Gly Asp Gly Ser Leu Gln

        435                 440                 445

ttg act gtt caa gaa atc tcc acc atg atc aga tgg ggc ttg aag cca     1392

Leu Thr Val Gln Glu Ile Ser Thr Met Ile Arg Trp Gly Leu Lys Pro

    450                 455                 460

tac ttg ttc gtc ttg aac aac gat ggt tac acc att gaa aag ttg att     1440

Tyr Leu Phe Val Leu Asn Asn Asp Gly Tyr Thr Ile Glu Lys Leu Ile

465                 470                 475                 480

cac ggt cca aag gct caa tac aac gaa att caa ggt tgg gac cac cta     1488

His Gly Pro Lys Ala Gln Tyr Asn Glu Ile Gln Gly Trp Asp His Leu

                485                 490                 495

tcc ttg ttg cca act ttc ggt gct aag gac tat gaa acc cac aga gtc     1536

Ser Leu Leu Pro Thr Phe Gly Ala Lys Asp Tyr Glu Thr His Arg Val

            500                 505                 510

gct acc acc ggt gaa tgg gac aag ttg acc caa gac aag tct ttc aac     1584

Ala Thr Thr Gly Glu Trp Asp Lys Leu Thr Gln Asp Lys Ser Phe Asn

        515                 520                 525

gac aac tct aag atc aga atg att gaa atc atg ttg cca gtc ttc gat     1632

Asp Asn Ser Lys Ile Arg Met Ile Glu Ile Met Leu Pro Val Phe Asp

    530                 535                 540

gct cca caa aac ttg gtt gaa caa gct aag ttg act gct gct acc aac     1680

Ala Pro Gln Asn Leu Val Glu Gln Ala Lys Leu Thr Ala Ala Thr Asn

545                 550                 555                 560

gct aag caa taa                                                     1692

Ala Lys Gln

<210>21

<211>563

<212>PRT

<213>酿酒酵母

<400>21

Met Ser Glu Ile Thr Leu Gly Lys Tyr Leu Phe Glu Arg Leu Lys Gln

1               5                   10                  15

Val Asn Val Asn Thr Val Phe Gly Leu Pro Gly Asp Phe Asn Leu Ser

            20                  25                  30

Leu Leu Asp Lys Ile Tyr Glu Val Glu Gly Met Arg Trp Ala Gly Asn

        35                  40                  45

Ala Asn Glu Leu Asn Ala Ala Tyr Ala Ala Asp Gly Tyr Ala Arg Ile

    50                  55                  60

Lys Gly Met Ser Cys Ile Ile Thr Thr Phe Gly Val Gly Glu Leu Ser

65                  70                  75                  80

Ala Leu Asn Gly Ile Ala Gly Ser Tyr Ala Glu His Val Gly Val Leu

                85                  90                  95

His Val Val Gly Val Pro Ser Ile Ser Ala Gln Ala Lys Gln Leu Leu

            100                 105                 110

Leu His His Thr Leu Gly Asn Gly Asp Phe Thr Val Phe His Arg Met

        115                 120                 125

Ser Ala Asn Ile Ser Glu Thr Thr Ala Met Ile Thr Asp Ile Ala Thr

    130                 135                 140

Ala Pro Ala Glu Ile Asp Arg Cys Ile Arg Thr Thr Tyr Val Thr Gln

145                 150                 155                 160

Arg Pro Val Tyr Leu Gly Leu Pro Ala Asn Leu Val Asp Leu Asn Val

                165                 170                 175

Pro Ala Lys Leu Leu Gln Thr Pro Ile Asp Met Ser Leu Lys Pro Asn

            180                 185                 190

Asp Ala Glu Ser Glu Lys Glu Val Ile Asp Thr Ile Leu Ala Leu Val

        195                 200                 205

Lys Asp Ala Lys Asn Pro Val Ile Leu Ala Asp Ala Cys Cys Ser Arg

    210                 215                 220

His Asp Val Lys Ala Glu Thr Lys Lys Leu Ile Asp Leu Thr Gln Phe

225                 230                 235                 240

Pro Ala Phe Val Thr Pro Met Gly Lys Gly Ser Ile Asp Glu Gln His

                245                 250                 255

Pro Arg Tyr Gly Gly Val Tyr Val Gly Thr Leu Ser Lys Pro Glu Val

            260                 265                 270

Lys Glu Ala Val Glu Ser Ala Asp Leu Ile Leu Ser Val Gly Ala Leu

        275                 280                 285

Leu Ser Asp Phe Asn Thr Gly Ser Phe Ser Tyr Ser Tyr Lys Thr Lys

    290                 295                 300

Asn Ile Val Glu Phe His Ser Asp His Met Lys Ile Arg Asn Ala Thr

305                 310                 315                 320

Phe Pro Gly Val Gln Met Lys Phe Val Leu Gln Lys Leu Leu Thr Thr

                325                 330                 335

Ile Ala Asp Ala Ala Lys Gly Tyr Lys Pro Val Ala Val Pro Ala Arg

            340                 345                 350

Thr Pro Ala Asn Ala Ala Val Pro Ala Ser Thr Pro Leu Lys Gln Glu

        355                 360                 365

Trp Met Trp Asn Gln Leu Gly Asn Phe Leu Gln Glu Gly Asp Val Val

    370                 375                 380

Ile Ala Glu Thr Gly Thr Ser Ala Phe Gly Ile Asn Gln Thr Thr Phe

385                 390                 395                 400

Pro Asn Asn Thr Tyr Gly Ile Ser Gln Val Leu Trp Gly Ser Ile Gly

                405                 410                 415

Phe Thr Thr Gly Ala Thr Leu Gly Ala Ala Phe Ala Ala Glu Glu Ile

            420                 425                 430

Asp Pro Lys Lys Arg Val Ile Leu Phe Ile Gly Asp Gly Ser Leu Gln

        435                 440                 445

Leu Thr Val Gln Glu Ile Ser Thr Met Ile Arg Trp Gly Leu Lys Pro

    450                 455                 460

Tyr Leu Phe Val Leu Asn Asn Asp Gly Tyr Thr Ile Glu Lys Leu Ile

465                 470                 475                 480

His Gly Pro Lys Ala Gln Tyr Asn Glu Ile Gln Gly Trp Asp His Leu

                485                 490                 495

Ser Leu Leu Pro Thr Phe Gly Ala Lys Asp Tyr Glu Thr His Arg Val

            500                 505                 510

Ala Thr Thr Gly Glu Trp Asp Lys Leu Thr Gln Asp Lys Ser Phe Asn

        515                 520                 525

Asp Asn Ser Lys Ile Arg Met Ile Glu Ile Met Leu Pro Val Phe Asp

    530                 535                 540

Ala Pro Gln Asn Leu Val Glu Gln Ala Lys Leu Thr Ala Ala Thr Asn

545                 550                 555                 560

Ala Lys Gln

<210>22

<211>33

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>22

tctttaatta atgggttgtc cgtcattcat ata                                 33

<210>23

<211>32

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>23

ctaaagcttt taggccagag tggtcttgcg cg                                  32

<210>24

<211>1674

<212>DNA

<213>巴氏醋杆菌(Acetobacter pasteurianus)

<220>

<221>CDS

<222>(1)..(1674)

<223>

<400>24

gtg acc tat act gtt ggc atg tat ctt gca gaa cgc ctt gta cag atc     48

Val Thr Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Val Gln Ile

1               5                   10                  15

ggg ctg aag cat cac ttc gcc gtg ggc ggc gac tac aat ctc gtt ctt     96

Gly Leu Lys His His Phe Ala Val Gly Gly Asp Tyr Asn Leu Val Leu

            20                  25                  30

ctg gat cag ttg ctc ctc aac aag gac atg aaa cag atc tat tgc tgc    144

Leu Asp Gln Leu Leu Leu Asn Lys Asp Met Lys Gln Ile Tyr Cys Cys

        35                  40                  45

aat gag ttg aac tgt ggc ttc agc gcg gaa ggc tac gcc cgt tct aac    192

Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ser Asn

    50                  55                  60

ggg gct gcg gca gcg gtt gtc acc ttc agc gtt ggc gcc att tcc gcc    240

Gly Ala Ala Ala Ala Val Val Thr Phe Ser Val Gly Ala Ile Ser Ala

65                  70                  75                  80

atg aac gcc ctc ggc ggc gcc tat gcc gaa aac ctg ccg gtt atc ctg    288

Met Asn Ala Leu Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu

                85                  90                  95

att tcc ggc gcg ccc aac agc aat gat cag ggc aca ggt cat atc ctg    336

Ile Ser Gly Ala Pro Asn Ser Asn Asp Gln Gly Thr Gly His Ile Leu

            100                 105                 110

cat cac aca atc ggc aag acg gat tac agc tac cag ctt gaa atg gcc      384

His His Thr Ile Gly Lys Thr Asp Tyr Ser Tyr Gln Leu Glu Met Ala

        115                 120                 125

cgt cag gtc acc tgt gcc gcc gaa agc att acc gac gct cac tcc gcc      432

Arg Gln Val Thr Cys Ala Ala Glu Ser Ile Thr Asp Ala His Ser Ala

    130                 135                 140

ccg gcc aag att gac cac gtc att cgc acg gcg ctg cgc gag cgt aag      480

Pro Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys

145                 150                 155                 160

ccg gcc tat ctg gac atc gcg tgc aac att gcc tcc gag ccc tgc gtg      528

Pro Ala Tyr Leu Asp Ile Ala Cys Asn Ile Ala Ser Glu Pro Cys Val

                165                 170                 175

cgg cct ggc cct gtc agc agc ctg ctg tcc gag cct gaa atc gac cac      576

Arg Pro Gly Pro Val Ser Ser Leu Leu Ser Glu Pro Glu Ile Asp His

            180                 185                 190

acg agc ctg aag gcc gca gtg gac gcc acg gtt gcc ttg ctg aaa aat      624

Thr Ser Leu Lys Ala Ala Val Asp Ala Thr Val Ala Leu Leu Lys Asn

        195                 200                 205

cgg cca gcc ccc gtc atg ctg ctg ggc agc aag ctg cgg gcc gcc aac      672

Arg Pro Ala Pro Val Met Leu Leu Gly Ser Lys Leu Arg Ala Ala Asn

    210                 215                 220

gca ctg gcc gca acc gaa acg ctg gca gac aag ctg caa tgc gcg gtg      720

Ala Leu Ala Ala Thr Glu Thr Leu Ala Asp Lys Leu Gln Cys Ala Val

225                 230                 235                 240

acc atc atg gcg gcc gcg aaa ggc ttt ttc ccc gaa gac cac gcg ggt      768

Thr Ile Met Ala Ala Ala Lys Gly Phe Phe Pro Glu Asp His Ala Gly

                245                 250                 255

ttc cgc ggc ctg tac tgg ggc gaa gtc tcg aac ccc ggc gtg cag gaa      816

Phe Arg Gly Leu Tyr Trp Gly Glu Val Ser Asn Pro Gly Val Gln Glu

            260                 265                 270

ctg gtg gag acc tcc gac gca ctg ctg tgc atc gcc ccc gta ttc aac      864

Leu Val Glu Thr Ser Asp Ala Leu Leu Cys Ile Ala Pro Val Phe Asn

        275                 280                 285

gac tat tca aca gtc ggc tgg tcg ggc atg ccc aag ggc ccc aat gtg      912

Asp Tyr Ser Thr Val Gly Trp Ser Gly Met Pro Lys Gly Pro Asn Val

    290                 295                 300

att ctg gct gag ccc gac cgc gta acg gtc gat ggc cgc gcc tat gac      960

Ile Leu Ala Glu Pro Asp Arg Val Thr Val Asp Gly Arg Ala Tyr Asp

305                 310                 315                 320

ggc ttt acc ctg cgc gcc ttc ctg cag gct ctg gcg gaa aaa gcc ccc     1008

Gly Phe Thr Leu Arg Ala Phe Leu Gln Ala Leu Ala Glu Lys Ala Pro

                325                 330                 335

gcg cgc ccg gcc tcc gca cag aaa agc agc gtc ccg acg tgc tcg ctc     1056

Ala Arg Pro Ala Ser Ala Gln Lys Ser Ser Val Pro Thr Cys Ser Leu

            340                 345                 350

acc gcg aca tcc gat gaa gcc ggt ctg acg aat gac gaa atc gtc cgt     1104

Thr Ala Thr Ser Asp Glu Ala Gly Leu Thr Asn Asp Glu Ile Val Arg

        355                 360                 365

cat atc aac gcc ctg ctg aca tca aac acg acg ctg gtg gca gaa acc     1152

His Ile Asn Ala Leu Leu Thr Ser Asn Thr Thr Leu Val Ala Glu Thr

    370                 375                 380

ggc gat tca tgg ttc aat gcc atg cgc atg acc ctg gcc ggt gcg cgc     1200

Gly Asp Ser Trp Phe Asn Ala Met Arg Met Thr Leu Ala Gly Ala Arg

385                 390                 395                 400

gtg gaa ctg gaa atg cag tgg ggc cat atc ggc tgg tcc gtg ccc tcc     1248

Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser

                405                 410                 415

gcg ttc ggc aat gcc atg ggc tcg cag gac cgc cag cat gtg gtg atg     1296

Ala Phe Gly Asn Ala Met Gly Ser Gln Asp Arg Gln His Val Val Met

            420                 425                 430

gta ggc gat ggc tcc ttc cag ctt acc gcg cag gaa gtg gct cag atg     1344

Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met

        435                 440                 445

gtg cgc tac gaa ctg ccc gtc att atc ttt ctg atc aac aac cgt ggc     1392

Val Arg Tyr Glu Leu Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly

    450                 455                 460

tat gtc att gaa atc gcc att cat gac ggc ccg tac aac tat atc aag     1440

Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys

465                 470                 475                 480

aac tgg gat tac gcc ggc ctg atg gaa gtc ttc aac gcc gga gaa ggc     1488

Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe Asn Ala Gly Glu Gly

                485                 490                 495

cat gga ctt ggc ctg aaa gcc acc acc ccg aag gaa ctg aca gaa gcc     1536

His Gly Leu Gly Leu Lys Ala Thr Thr Pro Lys Glu Leu Thr Glu Ala

            500                 505                 510

atc gcc agg gca aaa gcc aat acc cgc ggc ccg acg ctg atc gaa tgc     1584

Ile Ala Arg Ala Lys Ala Asn Thr Arg Gly Pro Thr Leu Ile Glu Cys

        515                 520                 525

cag atc gac cgc acg gac tgc acg gat atg ctg gtt caa tgg ggc cgc     1632

Gln Ile Asp Arg Thr Asp Cys Thr Asp Met Leu Val Gln Trp Gly Arg

    530                 535                 540

aag gtt gcc tca acc aac gcg cgc aag acc act ctg gcc tga             1674

Lys Val Ala Ser Thr Asn Ala Arg Lys Thr Thr Leu Ala

545                 550                 555

<210>25

<211>557

<212>PRT

<213>巴氏醋杆菌

<400>25

Val Thr Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Val Gln Ile

1               5                   10                  15

Gly Leu Lys His His Phe Ala Val Gly Gly Asp Tyr Asn Leu Val Leu

            20                  25                  30

Leu Asp Gln Leu Leu Leu Asn Lys Asp Met Lys Gln Ile Tyr Cys Cys

        35                  40                  45

Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ser Asn

    50                  55                  60

Gly Ala Ala Ala Ala Val Val Thr Phe Ser Val Gly Ala Ile Ser Ala

65                  70                  75                  80

Met Asn Ala Leu Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu

                85                  90                  95

Ile Ser Gly Ala Pro Asn Ser Asn Asp Gln Gly Thr Gly His Ile Leu

            100                 105                 110

His His Thr Ile Gly Lys Thr Asp Tyr Ser Tyr Gln Leu Glu Met Ala

        115                 120                 125

Arg Gln Val Thr Cys Ala Ala Glu Ser Ile Thr Asp Ala His Ser Ala

    130                 135                 140

Pro Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys

145                 150                 155                 160

Pro Ala Tyr Leu Asp Ile Ala Cys Asn Ile Ala Ser Glu Pro Cys Val

                165                 170                 175

Arg Pro Gly Pro Val Ser Ser Leu Leu Ser Glu Pro Glu Ile Asp His

            180                 185                 190

Thr Ser Leu Lys Ala Ala Val Asp Ala Thr Val Ala Leu Leu Lys Asn

        195                 200                 205

Arg Pro Ala Pro Val Met Leu Leu Gly Ser Lys Leu Arg Ala Ala Asn

    210                 215                 220

Ala Leu Ala Ala Thr Glu Thr Leu Ala Asp Lys Leu Gln Cys Ala Val

225                 230                 235                 240

Thr Ile Met Ala Ala Ala Lys Gly Phe Phe Pro Glu Asp His Ala Gly

                245                 250                 255

Phe Arg Gly Leu Tyr Trp Gly Glu Val Ser Asn Pro Gly Val Gln Glu

            260                 265                 270

Leu Val Glu Thr Ser Asp Ala Leu Leu Cys Ile Ala Pro Val Phe Asn

        275                 280                 285

Asp Tyr Ser Thr Val Gly Trp Ser Gly Met Pro Lys Gly Pro Asn Val

    290                 295                 300

Ile Leu Ala Glu Pro Asp Arg Val Thr Val Asp Gly Arg Ala Tyr Asp

305                 310                 315                 320

Gly Phe Thr Leu Arg Ala Phe Leu Gln Ala Leu Ala Glu Lys Ala Pro

                325                 330                 335

Ala Arg Pro Ala Ser Ala Gln Lys Ser Ser Val Pro Thr Cys Ser Leu

            340                 345                 350

Thr Ala Thr Ser Asp Glu Ala Gly Leu Thr Asn Asp Glu Ile Val Arg

        355                 360                 365

His Ile Asn Ala Leu Leu Thr Ser Asn Thr Thr Leu Val Ala Glu Thr

    370                 375                 380

Gly Asp Ser Trp Phe Asn Ala Met Arg Met Thr Leu Ala Gly Ala Arg

385                 390                 395                 400

Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser

                405                 410                 415

Ala Phe Gly Asn Ala Met Gly Ser Gln Asp Arg Gln His Val Val Met

            420                 425                 430

Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met

        435                 440                 445

Val Arg Tyr Glu Leu Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly

    450                 455                 460

Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys

465                 470                 475                 480

Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe Asn Ala Gly Glu Gly

                485                 490                 495

His Gly Leu Gly Leu Lys Ala Thr Thr Pro Lys Glu Leu Thr Glu Ala

            500                 505                 510

Ile Ala Arg Ala Lys Ala Asn Thr Arg Gly Pro Thr Leu Ile Glu Cys

        515                 520                 525

Gln Ile Asp Arg Thr Asp Cys Thr Asp Met Leu Val Gln Trp Gly Arg

    530                 535                 540

Lys Val Ala Ser Thr Asn Ala Arg Lys Thr Thr Leu Ala

545                 550                 555

<210>26

<211>32

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>26

atcttaatta atgtataccg ttggtatgta ct                                  32

<210>27

<211>34

<212>DNA

<213>人工序列

<220>

<223>人工序列

<400>27

tatgcggccg cttacgcttg tggtttgcga gagt                                34

<210>28

<211>1671

<212>DNA

<213>棕榈发酵细菌(Zymobacter palmae)

<220>

<221>CDS

<222>(1)..(1671)

<223>

<400>28

atg tat acc gtt ggt atg tac ttg gca gaa cgc cta gcc cag atc ggc     48

Met Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Ala Gln Ile Gly

1               5                   10                  15

ctg aaa cac cac ttt gcc gtg gcc ggt gac tac aac ctg gtg ttg ctt     96

Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu Leu

            20                  25                  30

gat cag ctc ctg ctg aac aaa gac atg gag cag gtc tac tgc tgt aac    144

Asp Gln Leu Leu Leu Asn Lys Asp Met Glu Gln Val Tyr Cys Cys Asn

        35                  40                  45

gaa ctt aac tgc ggc ttt agc gcc gaa ggt tac gct cgt gca cgt ggt    192

Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Arg Gly

    50                  55                  60

gcc gcc gct gcc atc gtc acg ttc agc gta ggt gct atc tct gca atg    240

Ala Ala Ala Ala Ile Val Thr Phe Ser Val Gly Ala Ile Ser Ala Met

65                  70                  75                  80

aac gcc atc ggt ggc gcc tat gca gaa aac ctg ccg gtc atc ctg atc    288

Asn Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu Ile

                85                  90                  95

tct ggc tca ccg aac acc aat gac tac ggc aca ggc cac atc ctg cac    336

Ser Gly Ser Pro Asn Thr Asn Asp Tyr Gly Thr Gly His Ile Leu His

            100                 105                 110

cac acc att ggt act act gac tat aac tat cag ctg gaa atg gta aaa    384

His Thr Ile Gly Thr Thr Asp Tyr Asn Tyr Gln Leu Glu Met Val Lys

        115                 120                 125

cac gtt acc tgc gca cgt gaa agc atc gtt tct gcc gaa gaa gca ccg      432

His Val Thr Cys Ala Arg Glu Ser Ile Val Ser Ala Glu Glu Ala Pro

    130                 135                 140

gca aaa atc gac cac gtc atc cgt acg gct cta cgt gaa cgc aaa ccg      480

Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys Pro

145                 150                 155                 160

gct tat ctg gaa atc gca tgc aac gtc gct ggc gct gaa tgt gtt cgt      528

Ala Tyr Leu Glu Ile Ala Cys Asn Val Ala Gly Ala Glu Cys Val Arg

                165                 170                 175

ccg ggc ccg atc aat agc ctg ctg cgt gaa ctc gaa gtt gac cag acc      576

Pro Gly Pro Ile Asn Ser Leu Leu Arg Glu Leu Glu Val Asp Gln Thr

            180                 185                 190

agt gtc act gcc gct gta gat gcc gcc gta gaa tgg ctg cag gac cgc      624

Ser Val Thr Ala Ala Val Asp Ala Ala Val Glu Trp Leu Gln Asp Arg

        195                 200                 205

cag aac gtc gtc atg ctg gtc ggt agc aaa ctg cgt gcc gct gcc gct      672

Gln Asn Val Val Met Leu Val Gly Ser Lys Leu Arg Ala Ala Ala Ala

    210                 215                 220

gaa aaa cag gct gtt gcc cta gcg gac cgc ctg ggc tgc gct gtc acg      720

Glu Lys Gln Ala Val Ala Leu Ala Asp Arg Leu Gly Cys Ala Val Thr

225                 230                 235                 240

atc atg gct gcc gaa aaa ggc ttc ttc ccg gaa gat cat ccg aac ttc      768

Ile Met Ala Ala Glu Lys Gly Phe Phe Pro Glu Asp His Pro Asn Phe

                245                 250                 255

cgc ggc ctg tac tgg ggt gaa gtc agc tcc gaa ggt gca cag gaa ctg      816

Arg Gly Leu Tyr Trp Gly Glu Val Ser Ser Glu Gly Ala Gln Glu Leu

            260                 265                 270

gtt gaa aac gcc gat gcc atc ctg tgt ctg gca ccg gta ttc aac gac      864

Val Glu Asn Ala Asp Ala Ile Leu Cys Leu Ala Pro Val Phe Asn Asp

        275                 280                 285

tat gct acc gtt ggc tgg aac tcc tgg ccg aaa ggc gac aat gtc atg      912

Tyr Ala Thr Val Gly Trp Asn Ser Trp Pro Lys Gly Asp Asn Val Met

    290                 295                 300

gtc atg gac acc gac cgc gtc act ttc gca gga cag tcc ttc gaa ggt      960

Val Met Asp Thr Asp Arg Val Thr Phe Ala Gly Gln Ser Phe Glu Gly

305                 310                 315                 320

ctg tca ttg agc acc ttc gcc gca gca ctg gct gag aaa gca cct tct     1008

Leu Ser Leu Ser Thr Phe Ala Ala Ala Leu Ala Glu Lys Ala Pro Ser

                325                 330                 335

cgc ccg gca acg act caa ggc act caa gca ccg gta ctg ggt att gag     1056

Arg Pro Ala Thr Thr Gln Gly Thr Gln Ala Pro Val Leu Gly Ile Glu

            340                 345                 350

gcc gca gag ccc aat gca ccg ctg acc aat gac gaa atg acg cgt cag     1104

Ala Ala Glu Pro Asn Ala Pro Leu Thr Asn Asp Glu Met Thr Arg Gln

        355                 360                 365

atc cag tcg ctg atc act tcc gac act act ctg aca gca gaa aca ggt    1152

Ile Gln Ser Leu Ile Thr Ser Asp Thr Thr Leu Thr Ala Glu Thr Gly

    370                 375                 380

gac tct tgg ttc aac gct tct cgc atg ccg att cct ggc ggt gct cgt    1200

Asp Ser Trp Phe Asn Ala Ser Arg Met Pro Ile Pro Gly Gly Ala Arg

385                 390                 395                 400

gtc gaa ctg gaa atg caa tgg ggt cat atc ggt tgg tcc gta cct tct    1248

Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser

                405                 410                 415

gca ttc ggt aac gcc gtt ggt tct ccg gag cgt cgc cac atc atg atg    1296

Ala Phe Gly Asn Ala Val Gly Ser Pro Glu Arg Arg His Ile Met Met

            420                 425                 430

gtc ggt gat ggc tct ttc cag ctg act gct caa gaa gtt gct cag atg    1344

Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met

        435                 440                 445

atc cgc tat gaa atc ccg gtc atc atc ttc ctg atc aac aac cgc ggt    1392

Ile Arg Tyr Glu Ile Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly

    450                 455                 460

tac gtc atc gaa atc gct atc cat gac ggc cct tac aac tac atc aaa    1440

Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys

465                 470                 475                 480

aac tgg aac tac gct ggc ctg atc gac gtc ttc aat gac gaa gat ggt    1488

Asn Trp Asn Tyr Ala Gly Leu Ile Asp Val Phe Asn Asp Glu Asp Gly

                485                 490                 495

cat ggc ctg ggt ctg aaa gct tct act ggt gca gaa cta gaa ggc gct    1536

His Gly Leu Gly Leu Lys Ala Ser Thr Gly Ala Glu Leu Glu Gly Ala

            500                 505                 510

atc aag aaa gca ctc gac aat cgt cgc ggt ccg acg ctg atc gaa tgt    1584

Ile Lys Lys Ala Leu Asp Asn Arg Arg Gly Pro Thr Leu Ile Glu Cys

        515                 520                 525

aac atc gct cag gac gac tgc act gaa acc ctg att gct tgg ggt aaa    1632

Asn Ile Ala Gln Asp Asp Cys Thr Glu Thr Leu Ile Ala Trp Gly Lys

    530                 535                 540

cgt gta gca gct acc aac tct cgc aaa cca caa gcg taa                1671

Arg Val Ala Ala Thr Asn Ser Arg Lys Pro Gln Ala

545                 550                 555

<210>29

<211>556

<212>PRT

<213>棕榈发酵细菌

<400>29

Met Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Ala Gln Ile Gly

1               5                   10                  15

Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu Leu

            20                  25                  30

Asp Gln Leu Leu Leu Asn Lys Asp Met Glu Gln Val Tyr Cys Cys Asn

        35                  40                  45

Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Arg Gly

    50                  55                  60

Ala Ala Ala Ala Ile Val Thr Phe Ser Val Gly Ala Ile Ser Ala Met

65                  70                  75                  80

Asn Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu Ile

                85                  90                  95

Ser Gly Ser Pro Asn Thr Asn Asp Tyr Gly Thr Gly His Ile Leu His

            100                 105                 110

His Thr Ile Gly Thr Thr Asp Tyr Asn Tyr Gln Leu Glu Met Val Lys

        115                 120                 125

His Val Thr Cys Ala Arg Glu Ser Ile Val Ser Ala Glu Glu Ala Pro

    130                 135                 140

Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys Pro

145                 150                 155                 160

Ala Tyr Leu Glu Ile Ala Cys Asn Val Ala Gly Ala Glu Cys Val Arg

                165                 170                 175

Pro Gly Pro Ile Asn Ser Leu Leu Arg Glu Leu Glu Val Asp Gln Thr

            180                 185                 190

Ser Val Thr Ala Ala Val Asp Ala Ala Val Glu Trp Leu Gln Asp Arg

        195                 200                 205

Gln Asn Val Val Met Leu Val Gly Ser Lys Leu Arg Ala Ala Ala Ala

    210                 215                 220

Glu Lys Gln Ala Val Ala Leu Ala Asp Arg Leu Gly Cys Ala Val Thr

225                 230                 235                 240

Ile Met Ala Ala Glu Lys Gly Phe Phe Pro Glu Asp His Pro Asn Phe

                245                 250                 255

Arg Gly Leu Tyr Trp Gly Glu Val Ser Ser Glu Gly Ala Gln Glu Leu

            260                 265                 270

Val Glu Asn Ala Asp Ala Ile Leu Cys Leu Ala Pro Val Phe Asn Asp

        275                 280                 285

Tyr Ala Thr Val Gly Trp Asn Ser Trp Pro Lys Gly Asp Asn Val Met

    290                 295                 300

Val Met Asp Thr Asp Arg Val Thr Phe Ala Gly Gln Ser Phe Glu Gly

305                 310                 315                 320

Leu Ser Leu Ser Thr Phe Ala Ala Ala Leu Ala Glu Lys Ala Pro Ser

                325                 330                 335

Arg Pro Ala Thr Thr Gln Gly Thr Gln Ala Pro Val Leu Gly Ile Glu

            340                 345                 350

Ala Ala Glu Pro Asn Ala Pro Leu Thr Asn Asp Glu Met Thr Arg Gln

        355                 360                 365

Ile Gln Ser Leu Ile Thr Ser Asp Thr Thr Leu Thr Ala Glu Thr Gly

    370                 375                 380

Asp Ser Trp Phe Asn Ala Ser Arg Met Pro Ile Pro Gly Gly Ala Arg

385                 390                 395                 400

Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser

                405                 410                 415

Ala Phe Gly Asn Ala Val Gly Ser Pro Glu Arg Arg His Ile Met Met

            420                 425                 430

Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met

        435                 440                 445

Ile Arg Tyr Glu Ile Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly

    450                 455                 460

Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys

465                 470                 475                 480

Asn Trp Asn Tyr Ala Gly Leu Ile Asp Val Phe Asn Asp Glu Asp Gly

                485                 490                 495

His Gly Leu Gly Leu Lys Ala Ser Thr Gly Ala Glu Leu Glu Gly Ala

            500                 505                 510

Ile Lys Lys Ala Leu Asp Asn Arg Arg Gly Pro Thr Leu Ile Glu Cys

        515                 520                 525

Asn Ile Ala Gln Asp Asp Cys Thr Glu Thr Leu Ile Ala Trp Gly Lys

    530                 535                 540

Arg Val Ala Ala Thr Asn Ser Arg Lys Pro Gln Ala

545                 550                 555

<210>30

<211>32

<212>DNA

<213>人工序列

<400>30

ctattaatta atggcttcgg tacacggcac ca                                  32

<210>31

<211>34

<212>DNA

<213>人工序列

<400>31

tatgcggccg cttacttcac cgggcttacg gtgc                                34

<210>32

<211>1587

<212>DNA

<213>恶臭假单胞菌(Pseudomonas putida)

<220>

<221>CDS

<222>(1)..(1584)

<223>

<400>32

atg gct tcg gta cac ggc acc aca tac gaa ctc ttg cga cgt caa ggc       48

Met Ala Ser Val His Gly Thr Thr Tyr Glu Leu Leu Arg Arg Gln Gly

1               5                   10                  15

atc gat acg gtc ttc ggc aat cct ggc tcg aac gag ctc ccg ttt ttg       96

Ile Asp Thr Val Phe Gly Asn Pro Gly Ser Asn Glu Leu Pro Phe Leu

            20                  25                  30

aag gac ttt cca gag gac ttt cga tac atc ctg gct ttg cag gaa gcg      144

Lys Asp Phe Pro Glu Asp Phe Arg Tyr Ile Leu Ala Leu Gln Glu Ala

        35                  40                  45

tgt gtg gtg ggc att gca gac ggc tat gcg caa gcc agt cgg aag ccg      192

Cys Val Val Gly Ile Ala Asp Gly Tyr Ala Gln Ala Ser Arg Lys Pro

    50                  55                  60

gct ttc att aac ctg cat tct gct gct ggt acc ggc aat gct atg ggt      240

Ala Phe Ile Asn Leu His Ser Ala Ala Gly Thr Gly Asn Ala Met Gly

65                  70                  75                  80

gca ctc agt aac gcc tgg aac tca cat tcc ccg ctg atc gtc act gcc      288

Ala Leu Ser Asn Ala Trp Asn Ser His Ser Pro Leu Ile Val Thr Ala

                85                  90                  95

ggc cag cag acc agg gcg atg att ggc gtt gaa gct ctg ctg acc aac      336

Gly Gln Gln Thr Arg Ala Met Ile Gly Val Glu Ala Leu Leu Thr Asn

            100                 105                 110

gtc gat gcc gcc aac ctg cca cga cca ctt gtc aaa tgg agc tac gag      384

Val Asp Ala Ala Asn Leu Pro Arg Pro Leu Val Lys Trp Ser Tyr Glu

        115                 120                 125

ccc gca agc gca gca gaa gtc cct cat gcg atg agc agg gct atc cat      432

Pro Ala Ser Ala Ala Glu Val Pro His Ala Met Ser Arg Ala Ile His

    130                 135                 140

atg gca agc atg gcg cca caa ggc cct gtc tat ctt tcg gtg cca tat      480

Met Ala Ser Met Ala Pro Gln Gly Pro Val Tyr Leu Ser Val Pro Tyr

145                 150                 155                 160

gac gat tgg gat aag gat gct gat cct cag tcc cac cac ctt ttt gat      528

Asp Asp Trp Asp Lys Asp Ala Asp Pro Gln Ser His His Leu Phe Asp

                165                 170                 175

cgc cat gtc agt tca tca gta cgc ctg aac gac cag gat ctc gat att      576

Arg His Val Ser Ser Ser Val Arg Leu Asn Asp Gln Asp Leu Asp Ile

            180                 185                 190

ctg gtg aaa gct ctc aac agc gca tcc aac ccg gcg atc gtc ctg ggc      624

Leu Val Lys Ala Leu Asn Ser Ala Ser Asn Pro Ala Ile Val Leu Gly

        195                 200                 205

ccg gac gtc gac gca gca aat gcg aac gca gac tgc gtc atg ttg gcc      672

Pro Asp Val Asp Ala Ala Asn Ala Asn Ala Asp Cys Val Met Leu Ala

    210                 215                 220

gaa cgc ctc aaa gct ccg gtt tgg gtt gcg cca tcc gct cca cgc tgc      720

Glu Arg Leu Lys Ala Pro Val Trp Val Ala Pro Ser Ala Pro Arg Cys

225                 230                 235                 240

cca ttc cct acc cgt cat cct tgc ttc cgt gga ttg atg cca gct ggc      768

Pro Phe Pro Thr Arg His Pro Cys Phe Arg Gly Leu Met Pro Ala Gly

                245                 250                 255

atc gca gcg att tct cag ctg ctc gaa ggt cac gat gtg gtt ttg gta      816

Ile Ala Ala Ile Ser Gln Leu Leu Glu Gly His Asp Val Val Leu Val

            260                 265                 270

atc ggc gct cca gtg ttc cgt tac cac caa tac gac cca ggt caa tat      864

Ile Gly Ala Pro Val Phe Arg Tyr His Gln Tyr Asp Pro Gly Gln Tyr

        275                 280                 285

ctc aaa cct ggc acg cga ttg att tcg gtg acc tgc gac ccg ctc gaa      912

Leu Lys Pro Gly Thr Arg Leu Ile Ser Val Thr Cys Asp Pro Leu Glu

    290                 295                 300

gct gca cgc gcg cca atg ggc gat gcg atc gtg gca gac att ggt gcg      960

Ala Ala Arg Ala Pro Met Gly Asp Ala Ile Val Ala Asp Ile Gly Ala

305                 310                 315                 320

atg gct agc gct ctt gcc aac ttg gtt gaa gag agc agc cgc cag ctc     1008

Met Ala Ser Ala Leu Ala Asn Leu Val Glu Glu Ser Ser Arg Gln Leu

                325                 330                 335

cca act gca gct ccg gaa ccc gcg aag gtt gac caa gac gct ggc cga     1056

Pro Thr Ala Ala Pro Glu Pro Ala Lys Val Asp Gln Asp Ala Gly Arg

            340                 345                 350

ctt cac cca gag aca gtg ttc gac aca ctg aac gac atg gcc ccg gag     1104

Leu His Pro Glu Thr Val Phe Asp Thr Leu Asn Asp Met Ala Pro Glu

        355                 360                 365

aat gcg att tac ctg aac gag tcg act tca acg acc gcc caa atg tgg     1152

Asn Ala Ile Tyr Leu Asn Glu Ser Thr Ser Thr Thr Ala Gln Met Trp

    370                 375                 380

cag cgc ctg aac atg cgc aac cct ggt agc tac tac ttc tgt gca gct     1200

Gln Arg Leu Asn Met Arg Asn Pro Gly Ser Tyr Tyr Phe Cys Ala Ala

385                 390                 395                 400

ggc gga ctg ggc ttc gcc ctg cct gca gca att ggc gtt caa ctc gca     1248

Gly Gly Leu Gly Phe Ala Leu Pro Ala Ala Ile Gly Val Gln Leu Ala

                405                 410                 415

gaa ccc gag cga caa gtc atc gcc gtc att ggc gac gga tcg gcg aac     1296

Glu Pro Glu Arg Gln Val Ile Ala Val Ile Gly Asp Gly Ser Ala Asn

            420                 425                 430

tac agc att agt gcg ttg tgg act gca gct cag tac aac atc ccc act     1344

Tyr Ser Ile Ser Ala Leu Trp Thr Ala Ala Gln Tyr Asn Ile Pro Thr

        435                 440                 445

atc ttc gtg atc atg aac aac ggc acc tac ggt gcg ttg cga tgg ttt     1392

Ile Phe Val Ile Met Asn Asn Gly Thr Tyr Gly Ala Leu Arg Trp Phe

    450                 455                 460

gcc ggc gtt ctc gaa gca gaa aac gtt cct ggg ctg gat gtg cca ggg     1440

Ala Gly Val Leu Glu Ala Glu Asn Val Pro Gly Leu Asp Val Pro Gly

465                 470                 475                 480

atc gac ttc cgc gca ctc gcc aag ggc tat ggt gtc caa gcg ctg aaa     1488

Ile Asp Phe Arg Ala Leu Ala Lys Gly Tyr Gly Val Gln Ala Leu Lys

                485                 490                 495

gcc gac aac ctt gag cag ctc aag ggt tcg cta caa gaa gcg ctt tct     1536

Ala Asp Asn Leu Glu Gln Leu Lys Gly Ser Leu Gln Glu Ala Leu Ser

            500                 505                 510

gcc aaa ggc ccg gta ctt atc gaa gta agc acc gta agc ccg gtg aag     1584

Ala Lys Gly Pro Val Leu Ile Glu Val Ser Thr Val Ser Pro Val Lys

        515                 520                 525

tga                                                                 1587

<210>33

<211>528

<212>PRT

<213>恶臭假单胞菌

<400>33

Met Ala Ser Val His Gly Thr Thr Tyr Glu Leu Leu Arg Arg Gln Gly

1               5                   10                  15

Ile Asp Thr Val Phe Gly Asn Pro Gly Ser Asn Glu Leu Pro Phe Leu

            20                  25                  30

Lys Asp Phe Pro Glu Asp Phe Arg Tyr Ile Leu Ala Leu Gln Glu Ala

        35                  40                  45

Cys Val Val Gly Ile Ala Asp Gly Tyr Ala Gln Ala Ser Arg Lys Pro

    50                  55                  60

Ala Phe Ile Asn Leu His Ser Ala Ala Gly Thr Gly Asn Ala Met Gly

65                  70                  75                  80

Ala Leu Ser Asn Ala Trp Asn Ser His Ser Pro Leu Ile Val Thr Ala

                85                  90                  95

Gly Gln Gln Thr Arg Ala Met Ile Gly Val Glu Ala Leu Leu Thr Asn

            100                 105                 110

Val Asp Ala Ala Asn Leu Pro Arg Pro Leu Val Lys Trp Ser Tyr Glu

        115                 120                 125

Pro Ala Ser Ala Ala Glu Val Pro His Ala Met Ser Arg Ala Ile His

    130                 135                 140

Met Ala Ser Met Ala Pro Gln Gly Pro Val Tyr Leu Ser Val Pro Tyr

145                 150                 155                 160

Asp Asp Trp Asp Lys Asp Ala Asp Pro Gln Ser His His Leu Phe Asp

                165                 170                 175

Arg His Val Ser Ser Ser Val Arg Leu Asn Asp Gln Asp Leu Asp Ile

            180                 185                 190

Leu Val Lys Ala Leu Asn Ser Ala Ser Asn Pro Ala Ile Val Leu Gly

        195                 200                 205

Pro Asp Val Asp Ala Ala Asn Ala Asn Ala Asp Cys Val Met Leu Ala

    210                 215                 220

Glu Arg Leu Lys Ala Pro Val Trp Val Ala Pro Ser Ala Pro Arg Cys

225                 230                 235                 240

Pro Phe Pro Thr Arg His Pro Cys Phe Arg Gly Leu Met Pro Ala Gly

                245                 250                 255

Ile Ala Ala Ile Ser Gln Leu Leu Glu Gly His Asp Val Val Leu Val

            260                 265                 270

Ile Gly Ala Pro Val Phe Arg Tyr His Gln Tyr Asp Pro Gly Gln Tyr

        275                 280                 285

Leu Lys Pro Gly Thr Arg Leu Ile Ser Val Thr Cys Asp Pro Leu Glu

    290                 295                 300

Ala Ala Arg Ala Pro Met Gly Asp Ala Ile Val Ala Asp Ile Gly Ala

305                 310                 315                 320

Met Ala Ser Ala Leu Ala Asn Leu Val Glu Glu Ser Ser Arg Gln Leu

                325                 330                 335

Pro Thr Ala Ala Pro Glu Pro Ala Lys Val Asp Gln Asp Ala Gly Arg

            340                 345                 350

Leu His Pro Glu Thr Val Phe Asp Thr Leu Asn Asp Met Ala Pro Glu

        355                 360                 365

Asn Ala Ile Tyr Leu Asn Glu Ser Thr Ser Thr Thr Ala Gln Met Trp

    370                 375                 380

Gln Arg Leu Asn Met Arg Asn Pro Gly Ser Tyr Tyr Phe Cys Ala Ala

385                 390                 395                 400

Gly Gly Leu Gly Phe Ala Leu Pro Ala Ala Ile Gly Val Gln Leu Ala

                405                 410                 415

Glu Pro Glu Arg Gln Val Ile Ala Val Ile Gly Asp Gly Ser Ala Asn

            420                 425                 430

Tyr Ser Ile Ser Ala Leu Trp Thr Ala Ala Gln Tyr Asn Ile Pro Thr

        435                 440                 445

Ile Phe Val Ile Met Asn Asn Gly Thr Tyr Gly Ala Leu Arg Trp Phe

    450                 455                 460

Ala Gly Val Leu Glu Ala Glu Asn Val Pro Gly Leu Asp Val Pro Gly

465                 470                 475                 480

Ile Asp Phe Arg Ala Leu Ala Lys Gly Tyr Gly Val Gln Ala Leu Lys

                485                 490                 495

Ala Asp Asn Leu Glu Gln Leu Lys Gly Ser Leu Gln Glu Ala Leu Ser

            500                 505                 510

Ala Lys Gly Pro Val Leu Ile Glu Val Ser Thr Val Ser Pro Val Lys

        515                 520                 525

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号