法律状态公告日
法律状态信息
法律状态
2020-06-23
未缴年费专利权终止 IPC(主分类):C07H7/027 授权公告日:20080528 终止日期:20190624 申请日:20040624
专利权的终止
2008-05-28
授权
授权
2007-01-17
发明专利申请公布说明书更正更正 卷:22 号:37 页码:扉页 更正项目:优先权 误:缺少优先权第二条 正:2003.12.02EP03027750.3 申请日:20040624
发明专利申请公布说明书更正
2006-11-08
实质审查的生效
实质审查的生效
2006-09-13
公开
公开
本发明涉及使用2-脱氢-3-脱氧-D-葡糖酸(通常缩写为KDG)或它的盐作为原料,制备2′-脱氧核苷化合物或2′-脱氧核苷前体的方法。许多2′-脱氧核苷和它们的类似物可作为生产抗病毒剂、抗癌剂或反义试剂的合成或药物制剂原料使用。
更具体地,本发明涉及一种方法,其中对KDG或KDG的衍生物进行脱羧基步骤,以去除KDG的原始羧基。在一个优选的实施方案中,在根据本发明的方法中使用的KDG是从D-葡糖酸(盐)或D-葡糖胺(盐)酶促生产的。
包含2-脱氧-D-核糖的2′-脱氧核苷和2′-脱氧核苷前体可用作合成或药物制剂原料,例如,在抗病毒剂和抗癌剂的生产中。2′-脱氧核苷或其衍生物和2′-脱氧核苷前体也可用作治疗性反义分子的研究、诊断和合成的试剂。
在现有技术的一种方法中,从睾丸(WO 99/49074)或酵母或鱼精子等生物材料,通过酶促剪切DNA而生成脱氧核苷。但是,该方法有几个缺点,尤其是难以得到足够数量和质量的原料。
2-脱氧-D-核糖的主要生产方法目前包括化学水解DNA。在该情况下,脱氧核糖基部分源自核糖核苷酸还原酶活性。尚未公开从KDG合成2-脱氧-D-核糖。
在大多数活细胞中,脱氧核糖核苷是由核苷酸代谢的“补救途径”来源的。在核糖核苷酸还原酶催化下,通过将核糖基团还原成核糖核苷二磷酸盐或三磷酸盐,得到脱氧核糖核苷的脱氧核糖基团。但是,脱氧核糖基团不被回收,而是通过下面的中心代谢反应降解成D-甘油醛-3-磷酸和乙醛:
●通过能编码胸苷磷酸化酶(deoA)、嘌呤核苷磷酸化酶(deoD)、尿苷磷酸化酶(udp)或黄苷磷酸化酶(xapA)的基因的产物介导的磷酸解作用,将脱氧核苷剪切成脱氧核糖-1-磷酸和核碱基,
●通过脱氧核糖磷酸变位酶(deoB)催化的反应,将脱氧核糖-1-磷酸转化成脱氧核糖-5-磷酸,
●通过脱氧核糖-5-磷酸醛缩酶(deoC)催化的反应,将其进一步降解成D-甘油醛-3-磷酸和乙醛。
已经证实,deo酶也能体外催化逆向合成代谢反应:在有纯化的大肠杆菌或植物乳杆菌(Lactobacillus plantarum)脱氧核糖醛缩酶存在的情况下,可以体外地从乙醛和D-甘油醛-3-磷酸得到脱氧核糖-5-磷酸(Rosen等,J.Biol.Chem.,240,(1964),1517-1524;Pricer,J.Biol.Chem.,235,(1960),1292-1298)。使用乙醛和甘油醛作为酶底物也可以得到脱氧核糖,但是产率非常低(Barbas,J.Am.Chem.Soc.112(1990),2013-2014)。
专利申请WO 01/14566公开了通过在一锅反应(one-pot reaction)中的deo操纵子的3种酶(即脱氧核糖醛缩酶、脱氧核变位酶和磷酸化酶(胸苷或嘌呤核苷磷酸化酶))的组合活性,使用甘油醛-3-磷酸、乙醛和核碱基作为起始底物,从脱氧核糖-1-磷酸酶促合成脱氧核苷。通过酶促方法,可以从果糖-1,6-二磷酸得到D-甘油醛-3-磷酸。
专利申请EP 1179598公开了磷酸化酶在从脱氧核糖-1-磷酸和核碱基开始酶促生产脱氧核苷中的应用。通过磷酸盐沉淀,可以提高脱氧核苷合成的产率。
但是,与它们的生物学功能相比,使用反向工作的deo操纵子的酶的方法表现出较低的产率,这表明它们的应用有严重缺陷。
考虑到目前使用的生产脱氧核苷和脱氧核苷前体的方法的上述缺点,本发明的一个目的是,提供从便宜的市售化合物开始生物合成生产脱氧核苷和脱氧核苷前体的手段和方法,无需依赖于不可靠的自然资源。
更具体地,需要生产脱氧核苷和脱氧核苷前体的替代方法,其能有效地和经济地合成脱氧核糖核苷,从而消除现有技术方法的缺点。
本发明涉及从2-脱氢-3-脱氧-D-葡糖酸(KDG)或它的盐开始生产2′-脱氧核苷和其前体的方法,其包括脱羧基步骤。
更具体地,该方法可以用于生产作为2′-脱氧核苷前体的2-脱氧-D-核糖(DRI)以及合成上多用途的DRI的烯胺衍生物。
通过直接反应KDG或它的盐,或KDG的衍生物,通常是剪切KDG的C1-C2键,进行脱羧基步骤。
在本发明的一个实施方案中,KDG或它的一种盐经历(氧化)脱羧基作用,生成2-脱氧-D-核糖酸(DRN)或它的盐,其本身被进一步转化成2-脱氧-D-核糖(DRI)或2-脱氧-D-核糖醇(DRL)。
在本发明的另一个实施方案中,通过使KDG或它的盐与胺反应,发生脱羧基作用,产生烯胺衍生物。通过水解,可以将该高能烯胺衍生物进一步转化成DRI。
在本发明的另一个实施方案中,使用3-脱氧-D-葡糖酸(DGN)或它的盐和/或3-脱氧-D-甘露糖酸(DMN)或它的盐作为KDG的衍生物,进行(氧化)脱羧基作用,生成DRI。通过还原KDG,可生产DGN和DMN的混合物。优选地,通过与过氧化氢的反应,进行脱羧基作用。
在本发明的另一个实施方案中,对3-脱氧-D-氨基葡糖酸(DGM)或它的盐和/或3-脱氧-D-甘露氨酸(DMM)或它的盐进行(氧化)脱羧基作用,生成DRI。通过还原性胺化作用,可以从KDG生产DGM和DMM的混合物。
本发明的另一个方面是制备上述方法中使用的KDG或它的盐的方便的、且成本较低的方法。该方法从D-葡糖酸(盐)或D-氨基葡糖酸(盐)开始,并使用重组酶。本发明提供了一种新的能编码具有D-葡糖酸脱水酶活性的多肽的核苷酸序列和编码具有D-氨基葡糖酸(盐)脱氨酶活性的多肽的核苷酸序列。
在本发明的方法中使用的原料是下面式(I)所示的KDG或它的一种盐,或其被保护的衍生物,其中在位置4,5和/或6处的一个或多个羟基被本领域已知的保护基团所保护。
如本文所使用的,术语″2′-脱氧核苷″涉及2′-脱氧核糖核苷,它是N-糖苷,且其中核碱基或核碱基类似物的碱性N-原子结合到2-脱氧-D-核糖或它的一种衍生物的异头碳原子上。合适的核碱基的实例是腺嘌呤,胞嘧啶,鸟嘌呤,胸腺嘧啶,尿嘧啶,2,6-二氨基嘌呤,和次黄嘌呤。核碱基类似物的实例是5-氮杂胞嘧啶,2-氯-腺嘌呤,5-碘-胞嘧啶,8-氮杂-鸟嘌呤,5-碘-尿嘧啶,5-溴-尿嘧啶,5-氟-尿嘧啶,5-乙基-尿嘧啶和5-三氟甲基-尿嘧啶。
如本文所使用的,术语″2′-脱氧核苷前体″涉及可以通过本领域已知的方法容易地转化成2′-脱氧核苷的化合物。优选的2′-脱氧核苷前体是2-脱氧-D-核糖(DRI)或可以转化成2′-脱氧核苷的2-脱氧-D-核糖基团的碳水化合物,例如,在现有技术中建立的那些,例如1-磷酸-2-脱氧-D-核糖,5-磷酸-2-脱氧-D-核糖,以及本发明建立的那些,例如2-脱氧-D-核糖醇,2-脱氧-D-核糖酸,2-脱氧-D-核糖-1,4-内酯,1-N-吗啉代-3,4,5-三羟基-戊烯-1,和它们的衍生物。
本发明的方法包括这样的方法,其中直接对KDG或它的盐或者源自KDG的化合物进行脱羧基步骤。优选的KDG衍生物是3-脱氧-D-葡糖酸,3-脱氧-D-甘露糖酸,3-脱氧-D-氨基葡糖酸和3-脱氧-D-甘露胺酸以及它们各自的盐。
另外,KDG和它的盐或它们的被保护形式(其中在位置4,5和/或6处的一个或多个羟基被本领域已知的用于该目的的保护基团保护)也是合适的进行本发明脱羧基反应的原料。除非另有说明,在下面的说明书中提及的KDG都包括KDG的被保护形式,如同提及KDG衍生物时也意图包括这些衍生物的被保护形式一样。类似地,提及在本发明的方法中得到的产物时均意在包括这些产物的被保护形式。优选的用于本发明目的的保护基团是这样的,它们能以醋酸酯、苯甲酸酯、烯丙醚、苯甲基醚、三苯甲基醚、叔丁基二甲基甲硅烷基(TBDMS)醚、亚异丙基或亚苄基缩醛形式代替相应的羟基。
应当明白,根据本发明的实施方案的合适反应条件,包含在用作反应物或作为产物得到的的有机酸中的羧基可以是质子化的形式或它们的盐形式,或可以平衡地存在。这些酸的示例性盐是这样的,其具有金属或铵离子作为抗衡离子,尤其是碱金属离子,例如钠和/或钾。
大多数本发明所述的碳水化合物和它们的衍生物以几种环状形式存在,但是出于简化的原因,已经将它们表示为开链式。应当明白,本发明包括所有这样的同分异构的或互变异构的形式。
在本发明的第一个实施方案中,使KDG或它的盐与过氧化氢反应,并经历向式(II)化合物2-脱氧-D-核糖酸(DRN)或它的盐的(氧化)脱羧基作用。
可以进一步将该产物转化成式(IV)代表的2-脱氧-D-核糖醇(DRL)
或式(III)代表的2-脱氧-D-核糖(DRI),
DRN、DRL、尤其是DRI均是优选的用于本发明目的的2′-脱氧核苷前体。可以直接地或通过作为中间体的DRL,进行DRN向DRI的转化。
优选地,如实施例5所述,通过2-脱氢-3-脱氧-D-葡糖酸钠或钾的水溶液与过氧化氢在室温下的氧化脱羧基作用,进行DRN的制备。通过2-酮醛糖酸的氧化脱羧基作用制备醛糖酸的一般方法,记载在专利EP 1 038 860 A1中。
优选地,如实施例6所述,在80巴的压力下,在130℃的温度下,在碳上的铑催化剂作用下,通过2-脱氧-D-核糖内酯水溶液的氢化,进行DRL的制备。通过将2-脱氧-D-核糖酸盐(DRN盐)转化成2-脱氧-D-核糖酸(其与水溶液中的内酯形式处于平衡),可以容易地制备出2-脱氧-D-核糖内酯(Han,Tetrahedron.1993.49,349-362;Han,Tetrahedron Asymmetry.1994.5,2535-62)。
优选地,通过2-脱氧-D-核糖醇(DLR)的氧化,例如利用吡啶中的氧化铬,进行2-脱氧-D-核糖(DRI)的制备。
在本发明的另一个实施方案中,通过使(KDG)或它的盐与含氨基的试剂Y-H反应,发生脱羧基作用,生成式(V)化合物。
或它的相应反式异构体或其受保护形式,作为2′-脱氧核苷前体。Y-H代表着胺,它含有结合到氨基的氮上的氢原子H。
在本发明的一个优选的实施方案中,由Y-H代表的含氨基的试剂是线性的或环状的仲胺;具有β-羰基的伯胺,优选3-氨基-2-吲哚酮(indolinone),发现其能有效地实现α-酮酸的脱羧基作用(Hanson,J.Chem.Education,1987,591-595)。在每种情况下,式(V)中的-Y代表着源自这些含氨基的试剂的相应含氮残基。
优选地,式(V)化合物代表着通过以线性的或环状的仲胺作为Y-H的反应生成的烯胺。
优选的环状仲胺是吗啉,吡咯烷,哌啶,或N-甲基哌嗪;优选的非环状胺是式R1-NH-R2的那些,其中R1和R2独立地代表1-8个、优选1-4个碳原子的线性或分支烷基。特别优选地,二乙基胺作为非环状胺。
特别优选地,吗啉作为环状胺。
式(V)化合物或它的反式异构体或其被保护形式可以进一步与Z-H反应,其中H代表着氢原子,且Z代表着离去基团,以生成式(VI)化合物
或它的对应反式异构体或其被保护形式,作为2′-脱氧核苷前体。Z-H优选地是水,在该情况下,式(VI)化合物是DRI或其被保护形式(酮-烯醇-互变异构现象)。
优选地,使用如实施例7所述的方法,在回流下,通过使苯中的KDG与胺(例如吗啉)反应,制备式(V)化合物,生成1-N-吗啉代-3,4,5-三羟基-戊烯-1。酸催化的用水水解生成2-脱氧-D-核糖(DRI)。
Stamos(Tetrahedron Lett.23(1982),459-462)描述了从携带β-氢的α-氧代羧酸通过烯胺生成醛的一般途径。制备和水解烯胺的其它方法已经记载在其它地方(Stork,J.Am.Chem.Soc.85(1963),207-222;Stamhuis,J.Org.Chem.30(1965),2156-2160)。
在本发明的另一个实施方案中,将KDG或它的盐转化成式(VII)代表的3-脱氧-D-葡糖酸(DGN)和/或3-脱氧-D-甘露糖酸(DMN)或这些化合物的盐
使从该反应得到的产物经历(氧化性)脱羧基作用,优选地使用过氧化氢,生成DRI。通过还原,从KDG或它的盐生产出DGN和DMN或它们的盐的混合物。
优选地,使用Weissbach(J.Biol.Chem.234(1959),705-709)中针对2-酮-3-脱氧庚酸所述的方法,通过在室温用硼氢化钠非立体选择性地还原在水中的2-脱氢-3-脱氧-D-葡糖酸,随后如例如美国专利3,312,683;Richards J.Chem.Soc.(1954),3638-3640;SowdenJ.Am.Chem.Soc.76(1954),3541-3542所述,用过氧化氢对3-脱氧-D-葡糖酸盐(酯)和3-脱氧-D-甘露糖酸盐(酯)(mannonate)进行氧化脱羧基作用,制备2-脱氧-D-核糖(DRI)。
在另一个优选的实施方案中,在6巴的压力下,在室温,用6%mol阮内镍催化剂或氧化铂氢化水溶液中的2-脱氢-3-脱氧-D-葡糖酸盐(酯),制备出DGN和DMN的混合物。
在本发明的另一个实施方案中,将KDG或它的盐转化成式(VIII)代表的3-脱氧-D-氨基葡糖酸(DGM)或3-脱氧-D-甘露糖胺酸(DMM)或这些化合物的盐
使由该反应得到的产物经历(氧化性)脱羧基作用,优选地使用茚三酮,生成DRI。通过还原性胺化作用,从KDG或它的盐生产DGM和DMM或它们的盐的混合物。
优选地,通过在室温用氨和氰基硼氢化钠非立体选择性地还原性胺化在水溶液中的2-脱氢-3-脱氧-D-葡糖酸钠或钾,随后使用Shelton(J.Am.Chem.Soc.118(1996),2117-2125;和Borch,J.Am.Chem.Soc.93(1971),2897;Durrwachter,J.Am.Chem.Soc.108(1986),7812referenced therein)中针对2-脱氧-D-阿洛糖的合成所述的方法,用茚三酮对3-脱氧-D-2-氨基葡糖酸(盐)和3-脱氧-D-2-甘露糖胺酸(盐)进行氧化脱羧基作用,制备2-脱氧-D-核糖。
另外,本发明提供了一种生产式(III)化合物(2-脱氧-D-核糖)的方法,这是通过在单个步骤中,转化式(I)化合物或它的一种盐(KDG)而实现的。优选地,该转化是通过酶促催化作用实现的。该转化优选地由酮酸脱羧酶催化。优选的酮酸脱羧酶是硫胺素焦磷酸(TPP)依赖性的酮酸脱羧酶。TPP依赖性的酮酸脱羧酶的实例是丙酮酸脱羧酶(EC4.1.1.1),苯甲酰基甲酸脱羧酶(EC 4.1.1.7),吲哚丙酮酸脱羧酶(EC4.1.1.74),膦酰基丙酮酸脱羧酶,磺基丙酮酸脱羧酶(EC 4.1.1.79),草酰-辅酶A脱羧酶(EC 4.1.1.8),氧代戊二酸脱羧酶(EC 4.1.1.71)或苯基丙酮酸脱羧酶(EC 4.1.1.43)。已经证实,来自不同生物的酮酸脱羧酶(例如,丙酮酸脱羧酶)可以将KDG转化成2-脱氧--D-核糖(见实施例8-12)。原则上,在本发明中可以使用任何酮酸脱羧酶。
在根据本发明的方法的优选的实施方案中,使用具有丙酮酸脱羧酶活性的酶,将KDG转化成2-脱氧-D-核糖。
丙酮酸脱羧酶能催化下面的反应:
已经表征了几种丙酮酸脱羧酶(PDC)和对应的pdc基因,例如来自运动发酵单胞菌(Zymomonas mobilis)的PDC(Genbank登记号AAD19711;Neale等,J.Bacteriol.1987,169:1024-1028),来自酿酒酵母(Saccharomyces cerevisiae)的PDC(Genbank登记号NP013145;Candy等,J.Gen.Microbiol.1991,137:2811-2815),来自巴氏醋杆菌(Acetobacter pasteurianus)的PDC(Genbank登记号AAM21208;Raj等,Arch.Microbiol.2001,176:443-451),来自棕榈发酵细菌(Zymobacter palmae)的PDC(Genbank登记号AAM49566;Raj等,Appl.Environ.Microbiol.2002,68:2869-2876),来自胃八叠球菌(Sarcina ventriculi)的PDC(Genbank登记号AAL18557;Lowe等,J.Gen.Microbiol.1992,138:803-807)。许多其它的丙酮酸脱羧酶好像也存在于植物、真菌和细菌中,如在这些生物中存在与已确立的pdc基因享有序列同源性的基因所证实的。这些推定的丙酮酸脱羧酶的实例是:
来自植物的PDC:
拟南芥(Arabidopsis thaliana)(Genbank登记号T48155)
稗草(Echinochloa crus-gall)(Genbank登记号AAM18119)
水稻(Oryza sativa)(Genbank登记号NP922014)
米根霉(Rhizopus oryzae)(Genbank登记号AAM73540)
百脉根(Lotus corniculatus)(Genbank登记号AAO72533)
玉米(Zea mays)(Genbank登记号BAA03354)
豌豆(Pisum sativum)(Genbank登记号CAA91445)
青豆(Garden pea)(Genbank登记号S65470)
烟草(Nicotiana tabaccum)(Genbank登记号CAA57447)
马铃薯(Solanum tuberosum)(Genbank登记号BAC23043)
草莓(Fragaria ananassa)(Genbank登记号AAL37492)
香瓜(Cucumis melo)(Genbank登记号AAL33553)
葡萄(Vitis vinifera)(Genbank登记号AAG22488)
来自真菌的PDC:
甘蔗(Saccharum officinarum)(Genbank登记号CAB61763)
米曲霉(Aspergillus orizae)(Genbank登记号AAD16178)
寄生曲霉(Aspergillus parasiticus)(Genbank登记号P51844)
酿酒酵母(Saccharomyces cerevisiae)(Genbank登记号NP013145)
金针菇(Flammulina velutipes)(Genbank登记号AAR00231)
Saccharomyces kluyveri(Genbank登记号AAP75899)
粟酒裂殖酵母(Schizosaccharomyces pombe)(Genbank登记号CAB75873)
光滑假丝酵母(Candida glabrata)(Genbank登记号AAN77243)
粗糙链孢霉(Neurospora crassa)(Genbank登记号JN0782)
Pichia stipis(Genbank登记号AAC03164)
乳酸克鲁维酵母(Kuyveromyces lactis)(Genbank登记号CAA61155)
Emericella nidulans(Genbank登记号AAB63012)
来自原核生物的PDC:
牛分枝杆菌(Mycobacterium bovis)(Genbank登记号CAD93738)
麻风分枝杆菌(Mycobacterium leprae)(Genbank登记号CAC31122)
结核分枝杆菌(Mycobacterium tuberculosis)(Genbank登记号NP215368)
穿透枝原体(Mycoplasma penetrans)(Genbank登记号NP758077)
丙酮丁醇梭菌(Clostridium acetobutylicum)(Genbank登记号NP149189)
巴氏醋杆菌(Acetobacter pasteurianus)(Genbank登记号AAM21208)
棕榈发酵细菌(Zymobacter palmae)(Genbank登记号AAM49566)
运动发酵单胞菌(Zymomonas mobilis)(Genbank登记号AAD19711)
胃八叠球菌(Sarcina ventriculi)(Genbank登记号AAL18557)
点型念珠蓝细菌(Nostoc punctiforme)(Genbank登记号ZP00110850)
可以通过过表达对应基因的重组微生物容易地生成这样的酶。编码TPP依赖性的酮酸脱羧酶的基因的实例是来自运动发酵单胞菌的pdc(Genbank登记号AF124349),来自酿酒酵母的pdc(Genbank登记号NC001144),来自巴氏醋杆菌的pdc(Genbank登记号AF368435),来自Zymobacter palmae的pdc(Genbank登记号AF474145),来自胃八叠球菌的pdc(Genbank登记号AF354297)。在Genbank中可以发现与上列推定的丙酮酸脱羧酶对应的其它pdc基因。
在一个优选的实施方案中,丙酮酸脱羧酶是真核生物源的,更优选地,它来自酵母,且最优选地,它来自酿酒酵母。
在一个特别优选的实施方案中,丙酮酸脱羧酶来自酿酒酵母的丙酮酸脱羧酶,其具有如SEQ ID NO:21所示的氨基酸序列(也见GenBank登记号NP013145)。
在另一个优选的实施方案中,丙酮酸脱羧酶是原核生物源的,更优选来自发酵单胞菌属的生物,最优选来自运动发酵单胞菌。在一个特别优选的实施方案中,丙酮酸脱羧酶来自运动发酵单胞菌的丙酮酸脱羧酶,其具有如SEQ ID NO:19所示的氨基酸序列(也见GenBank登记号AAD 19711)。
在另一个优选的实施方案中,所述原核生物的丙酮酸脱羧酶来自醋杆菌属的生物,更优选来自巴氏醋杆菌。特别优选的丙酮酸脱羧酶是具有如SEQ ID NO:25所示氨基酸序列的巴氏醋杆菌酶(也见GenBank登记号AAM21208)。
在另一个优选的实施方案中,丙酮酸盐脱羧酶来自发酵单胞菌属的生物,更优选来自棕榈发酵细菌(Zymobacter palmae)。
特别优选的是具有如SEQ ID NO:29所示氨基酸序列的来自zlv棕榈发酵细菌的丙酮酸脱羧酶(也见GenBank登记号AAM49566)。
在另一个优选的根据本发明方法的实施方案中,使用具有苯甲酰基甲酸脱羧酶活性的酶将KDG转化成2-脱氧-D-核糖。
苯甲酰基甲酸脱羧酶催化下面的反应:
已经表征了来自恶臭假单胞菌的苯甲酰基甲酸脱羧酶(BDC)(Genbank登记号AAC15502;Tsou等,Biochemistry.1990,29:9856-9862)以及对应的基因mdlC(Genbank登记号AY143338)。已经证实,该酶能将2-酮-4,5-二羟基戊酸的D和L异构体转化成各自的3,4-二羟基丁醛异构体(Niu等,J.Am.Chem.Soc.125(2003),12998-12999)。许多其它的苯甲酰基甲酸脱羧酶好像也存在于细菌和古细菌中,如这些生物中存在与编码确立的BDC的基因享有序列同源性的基因所证实的。这样推定的苯甲酰基甲酸脱羧酶的实例是:
来自细菌的BDC:
铜绿假单胞菌(Pseudomonas aeruginosa)(Genbank登记号NP253588)
血色红假单胞菌(Rhodopseudomonas palustris)(Genbank登记号NP_946955)
天蓝色链霉菌(Streptomyces coelicolor)(Genbank登记号NP_631486)
青色素杆菌(Chromobacterium violaceum)(Genbank登记号NP_902771)
大豆慢生根瘤菌(Bradyrhizobium japonicum)(Genbank登记号NP_774243)
来自古细菌的BDC:
硫磺矿硫化叶菌(Sulfolobus solfataricus)(Genbank登记号NP_343070)
嗜酸热原体(Thermoplasma acidophilum)(Genbank登记号NP_393976)
火山热原体(Thermoplasma volcanium)(Genbank登记号NP_111716)
可以由过表达对应的bdc基因的重组微生物容易地生成这样的酶。在与上列推定的苯甲酰基甲酸脱羧酶对应的Genbank中,可以发现这样的基因。
可以在根据本发明的方法中使用的硫胺依赖性脱羧酶的另一个实例是膦酰基丙酮酸脱羧酶。已经表征了几种膦酰基丙酮酸脱羧酶(PPD)以及对应的基因,例如来自脆弱拟杆菌(Bacteroides fragilis)的PPD(Genbank登记号AAG26466;Zhang等,J.Biol.Chem.2003,278:41302-41308),来自威德摩尔链球菌(Streptomyces wedmorensis)的PPD(Genbank登记号BAA32496;Nakashita等,J.Antibiot.1997,50:212-219)。许多其它的膦酰基丙酮酸脱羧酶好像也存在于细菌中,如在这些生物中存在与编码确立的PPD的基因享有序列同源性的基因所证实的。这样推定的膦酰基丙酮酸脱羧酶的实例是:来自多形拟杆菌(Bacteroides thetaiotaomicron)的PPD(Genbank登记号NP 810632),来自东方拟无枝酸菌(Amycolatopsis orientais)的PPD(Genbank登记号CAB45023),来自破伤风梭菌(Clostridium tetani)E88的PPD(Genbank登记号NP_782297),来自绿色产色链霉菌(Streptomycesviridochromogene)的PPD(Genbank登记号CAA74722),来自吸水链霉菌(Streptomyces hygroscopicus)的PPD(Genbank登记号BAA07055),来自天蓝色链霉菌A3的PPD(Genbank登记号NP733715),来自利尿链霉菌(Streptomyces rishiriensis)的PPD(Genbank登记号AAG29796),来自百日咳杆菌(Bordetella pertussis)的PPD(Genbank登记号CAE 41214)。可以由过表达对应基因的重组微生物容易地生成这样的酶。
可以在根据本发明的方法中使用的硫胺素依赖性脱羧酶的另一个实例是磺基丙酮酸脱羧酶。已经表征了由2个亚基ComD(Genbank登记号P58415)和ComE(Genbank登记号P58416)组成的来自詹氏甲烷球菌(Methanococcus jannaschii)的磺基丙酮酸脱羧酶(SPD)(Graupner等,J.Bacteriol.2000.182:4862-4867)以及对应的基因。许多其它的磺基丙酮酸脱羧酶好像也存在于古细菌和细菌中,如这些生物中存在与编码确立的SPD的基因享有序列同源性的基因所证实的。
可以在根据本发明的方法中使用的硫胺素依赖性脱羧酶的另一个实例是吲哚丙酮酸脱羧酶。已经表征了几种吲哚丙酮酸脱羧酶(IPD)以及对应的基因,例如来自阴沟肠杆菌(Enterobacter cloacae)的IPD(Genbank登记号BAA14242;Scutz等,2003,Eur.J.Biochem.270:2322-2331),来自巴西固氮螺菌(Azospirillum brasilense)的IPD(Genbank登记号AAC36886;Costacurta等,Mol.Gen.Genet.1994,243:463-472),来自草生欧文氏菌(Erwinia herbicola)的IPD(Genbank登记号AAB06571;Brandi等,Appl.Environ.Microbioi.1996,62:4121-4128)。许多其它的吲哚丙酮酸脱羧酶好像也存在于细菌中,如这些生物中存在与编码确立的IPD的基因享有序列同源性的基因所证实的。
可以在根据本发明的方法中使用的硫胺素依赖性脱羧酶的另一个实例是苯基丙酮酸脱羧酶。已经表征了来自酵母的苯基丙酮酸脱羧酶(Genbank登记号NP010668;Vuralhan等,Appl.Environ.Microbiol.2003,69:4534-41)以及对应的基因ARO10(Genbank登记号NC001136)。
在根据本发明的方法的优选实施方案中,通过酶促反应实现脱羧基步骤,通过加酸,将pH值调节至pH5至pH9,优选pH6至pH8。原则上,所有合适的酸都可以用于该目的。优选的酸是HCl,H2SO4,D-葡糖酸或2-脱氢-3-脱氧-D-葡糖酸。
本发明的另一个方面是通过重组酶的应用,从D-葡糖酸(GCN)或D-氨基葡糖酸制备KDG的方便的、且成本低廉的方法。
在本发明的方法的优选的实施方案中,在一个初步步骤中,通过D-葡糖酸脱水酶活性的应用,从D-葡糖酸盐生产式(I)化合物。优选的盐是D-葡糖酸钾或钠。优选地,该D-葡糖酸脱水酶由包含选自下述的核苷酸序列的多核苷酸编码:
(a)编码包含SEQ ID NO:2所示氨基酸序列的多肽的核苷酸序列;
(b)包含SEQ ID NO:1所示编码序列的核苷酸序列;
(c)核苷酸序列编码由(a)或(b)所示核苷酸序列编码的片段的核苷酸序列;
(d)与(a)至(c)中任一项的核苷酸序列杂交的核苷酸序列;和
(e)由于遗传密码的简并性而不同于(d)所示核苷酸序列的核苷酸序列。
根据下面的反应,使用D-葡糖酸脱水酶进行KDG或它的盐的酶促合成:通过消除一分子水,将D-葡糖酸转化成KDG。已经在不同的细菌物种中表征了D-葡糖酸脱水酶的活性,例如在产碱杆菌属(Kersters,Methods in Enzymology 42(1975),301-304);巴氏固氮梭菌,(Gottschalk,Methods in Enzymology 90(1982),283-287);嗜酸热原体(Budgen,FEBS Letters 196(1986),207-210)和硫磺矿硫化叶菌(Nicolaus,Biotechnology Letters 8(7)(1986),497-500)。通过筛选几种收集菌的D-葡糖酸脱水酶活性,鉴别出了优选的D-葡糖酸脱水酶。从根癌土壤杆菌菌株C58的基因组文库中选择出了编码D-葡糖酸脱水酶的基因,被命名为gcnD,将其进一步插入优化表达的多拷贝载体中。已经证实,来自过表达gcnD基因的大肠杆菌细胞的粗提物会催化D-葡糖酸完全转化成KDG(见实施例2)。
在本发明的方法的另一个优选的实施方案中,通过D-氨基葡糖酸脱氨酶活性的应用,在初步步骤中从D-氨基葡糖酸生产式(I)化合物。优选地,D-氨基葡糖酸脱氨酶由包含选自下述的核苷酸序列的多核苷酸编码:
(f)编码包含SEQ ID NO:4所示氨基酸序列的多肽的核苷酸序列;
(g)包含SEQ ID NO:3所示编码序列的核苷酸序列;
(h)编码由(a)或(b)所示核苷酸序列编码的片段的核苷酸序列;
(i)与(a)至(c)中任一项的核苷酸序列杂交的核苷酸序列;和
(j)由于遗传密码的简并性而不同于(d)所示核苷酸序列的核苷酸序列。
根据下面的反应,使用D-氨基葡糖酸脱氨酶进行KDG或它的盐的酶促合成:通过消除一分子水和一分子氨,将D-氨基葡糖酸转化成KDG。已经在不同的细菌种中表征了D-氨基葡糖酸脱氨酶的活性,例如在荧光假单胞菌(Pseudomonas fluorescens)(Iwamoto,Agric.Biol.Chem.53(1989),2563-2569)、放射形土壤杆菌(Agrobacterium radiobacter)(Iwamoto,FEBS Letters 104(1979),131-134;Iwamoto,J.Biochem.91(1982),283-289)中,且证实了它需要Mn2+离子(Iwamoto,Biosci.Biotech.Biochem.59(1995),408-411)。
通过筛选几种收集菌的D-氨基葡糖酸脱氨酶活性,鉴别出了优选的D-氨基葡糖酸脱氨酶。通过克隆推定为D-丝氨酸脱氨酶的基因,从根癌土壤杆菌菌株C58分离出了编码D-氨基葡糖酸脱氨酶的命名为gmaA的基因。将gmaA基因进一步插入优化表达的多拷贝载体中。已经证实,来自过表达gmaA基因的大肠杆菌细胞的粗提物会催化D-氨基葡糖酸向KDG的转化(见实施例4)。
在优选的实施方案中,本发明涉及通过酶促反应,从D-葡糖酸或D-氨基葡糖酸开始生产式III化合物、尤其是2-脱氧-D-核糖的方法,在该方法中,在第一步中,如上所述将D-葡糖酸或D-氨基葡糖酸转化成KDG,在第二步中,如上所述将KDG转化成2-脱氧-D-核糖。
因而,通过D-葡糖酸脱水酶的应用,可以实现D-葡糖酸向KDG的酶促转化。通过D-氨基葡糖酸脱氨酶的应用,可以实现D-氨基葡糖酸向KDG的酶促转化。关于优选的实施方案,上面所述同样适用。通过酮酸脱羧酶的应用,可以实现得到的KDG向2-脱氧-D-核糖的酶促转化。关于优选的实施方案,上面所述同样适用。
使用表达对应酶的细胞的细胞提取物,或者使用纯化的或部分纯化的酶,可以体外进行酶促二步方法,将D-葡糖酸或D-氨基葡糖酸经过KDG转化成2-脱氧-D-核糖。所述酶可以是在生物中自然表达的酶,或者可以重组地生产它们。制备和分离对应的(重组的)酶的方法是本领域的技术人员众所周知的。
在优选的实施方案中,体内进行将D-葡糖酸或D-氨基葡糖酸经过KDG转化成2-脱氧-D-核糖的酶促二步方法,即使用合适的能表达所需酶活性的生物体。该生物体可以是任意种类的生物,优选地,它是细胞,例如植物、动物、真菌细胞或细菌细胞。最优选地,使用真菌或细菌细胞。优选的真菌是酵母,例如酿酒酵母;优选的细菌细胞是例如大肠杆菌,运动发酵单胞菌,棕榈发酵细菌,巴氏醋杆菌,醋酸钙不动杆菌,根癌土壤杆菌和枯草芽孢杆菌。所述生物体可以是已经内源地表达所述酶促活性之一的生物,所述的酶促活性即生产KDG的D-葡糖酸脱水酶或D-氨基葡糖酸脱氨酶,或者将KDG转化成2-脱氧-D-核糖的酮酸脱羧酶,并且其中由于编码对应酶的对应外源核酸分子的导入而表达了各自的其它酶促活性。或者,该生物体也可以是不能自然地表达将D-葡糖酸或D-氨基葡糖酸转化成KDG、并进一步转化成2-脱氧-D-核糖所需要的酶活性的生物,其中已经导入了分别编码D-葡糖酸脱水酶或D-氨基葡糖酸脱氨酶和酮酸脱羧酶的对应外来核酸分子。
在一个特别优选的实施方案中,该生物体是不能表达KDG激酶(kdgK)活性的生物。这样的酶活性会导致KDG向KDPG的磷酸化,后者继而被醛缩酶剪切成丙酮酸和甘油醛-磷酸,由此使KDG转向不同的不需要的代谢途径。在根据本发明的方法中,可以使用不能自然地表达kdgK基因的生物体。如果使用的生物体自然表达kdgK,本领域的技术人员熟知生产这种生物体的突变体或变体(其中对应的kdgK基因被灭活)的方法和方式。
如果使用表达用于将D-葡糖酸转化成KDG的D-葡糖酸脱水酶和用于将KDG转化成2-脱氧-D-核糖的酮酸脱羧酶的生物体体内进行所述的根据本发明的方法,这具有一个优点,即可以提供D-葡糖酸作为用于培养生物体的培养基中的底物。该生物体会吸收D-葡糖酸,并转化成2-脱氧-D-核糖。
在另一个特别优选的实施方案中,该生物体是不表达KDG醛缩酶(由大肠杆菌中的eda基因编码)活性的生物体。这样的酶活性会导致KDG被剪切成丙酮酸和甘油醛,由此使KDG转向不同的、并非所需要的代谢途径。在根据本发明的方法中,可以使用不自然地表达eda基因的生物体。如果使用的生物体表达eda基因,本领域的技术人员熟知生产这种生物体的突变体或变体(其中对应的eda基因被灭活)的方式和方法。
在另一个特别优选的实施方案中,该生物体是不表达2-脱氧-D-核糖醛缩酶(由大肠杆菌中的deoC基因编码)活性的生物体。这样的酶活性会导致2-脱氧-D-核糖被剪切成乙醛和甘油醛,由此使2-脱氧-D-核糖转向不同的、并非所需要的代谢途径。在根据本发明的方法中,可以使用不自然地表达deoC基因的生物体。如果使用的生物体表达deoC基因,本领域的技术人员熟知生产这种生物体的突变体或变体(其中对应的deoC基因被灭活)的方式和方法。例如,已经报道了大肠杆菌的deoC突变体(Valentin-Hansen,EMBO J.1(1982),317-322)以及缺失大肠杆菌中的deo操纵子的方法(Kaminski,J.Biol.Chem.277(2002),14400-14407;Valentin-Hansen,Molec.Gen.基因t.159(1978),191-202)。
本发明也涉及由于D-葡糖酸脱水酶的表达而能将D-葡糖酸酶促地转化成KDG和/或由于D-氨基葡糖酸脱氨酶的表达而能将D-氨基葡糖酸酶促地转化成KDG、并且另外能通过酮酸脱羧酶催化的脱羧基反应而将KDG酶促地转化成2-脱氧-D-核糖的生物体。该生物体原则上可以是任意合适的生物体,优选地,它是细胞,例如植物细胞、动物细胞、真菌细胞或细菌细胞。更优选地,它是真菌或细菌细胞。优选的真菌是酵母,例如酿酒酵母。优选的细菌是大肠杆菌,运动发酵单胞菌,棕榈发酵细菌,巴氏醋杆菌,醋酸钙不动杆菌(Acinetobactercalcoaceticus),根癌土壤杆菌(Agrobacterium tumefaciens)和枯草芽孢杆菌。一方面,所述生物体是已经内源地表达D-葡糖酸脱水酶或D-氨基葡糖酸脱氨酶的生物体,其中已经导入了编码酮酸脱羧酶的外来核酸分子,所述的酮酸脱羧酶能催化KDG向2-脱氧-D-核糖的脱羧基作用。关于优选的酮酸脱羧酶的实施方案,前面所述同样适用。
另一方面,所述生物体是已经表达能通过脱羧基反应而将KDG转化成2-脱氧-D-核糖的酮酸脱羧酶的生物体,但是其不会自然地表达D-葡糖酸盐脱水酶或D-氨基葡糖酸脱氨酶,其中已经导入了编码D-葡糖酸脱水酶和/或编码D-葡糖胺脱氨酶的外来核酸分子。即,可以遗传地修饰该生物体,使其表达D-葡糖酸脱水酶或D-氨基葡糖酸脱氨酶或这两种酶。
另一方面,所述生物体是不能自然地表达D-葡糖酸脱水酶、D-氨基葡糖酸脱氨酶和酮酸脱羧酶的生物体,所述的酮酸脱羧酶能通过脱羧基作用将KDG转化成2-脱氧-D-核糖,且其中已经导入了编码D-葡糖酸脱水酶或D-氨基葡糖酸脱氨酶或二者的外来核酸分子以及编码能通过脱羧基作用将KDG转化成2-脱氧-D-核糖的酮酸脱羧酶的核酸分子。
关于待在根据本发明的生物体中表达的D-葡糖酸脱水酶、D-葡糖胺脱氨酶和酮酸脱羧酶的优选实施方案,上面针对本发明的方法已经阐述的那些同样适用。
在一个特别优选的实施方案中,根据本发明的生物体并不表达KDG激酶(kdgK)活性。它可以是不能自然地表达kdgK的生物体,或者它可以是能自然地表达kdgK、但是其中对应的基因已经被灭活(例如通过基因破坏或本领域的普通技术人员众所周知的其它合适的方法)的生物体。
本发明还涉及具有酮酸脱羧酶活性的酶或编码这种酶的多核苷酸在将KDG转化成2-脱氧-D-核糖的方法中的应用。关于优选的实施方案,上面根据本发明的方法已经阐述的那些同样适用。
这些和其它实施方案公开在、且包含在本发明的说明书和实施例中。在上面或下面引用的任何文献中公开的内容都在这里并入本申请中。使用例如电子设施,可以从公共图书馆得到关于要根据本发明采用的方法、用途和化合物中的任一项的其它文献。例如,可以使用公共数据库″Medline″,它可以在因特网上得到,例如在http://www.ncbi.nem.nlh.gov/PubMed/medline.html。本领域的普通技术人员已知其它数据库和地址,例如http://www.ncbi.nlm.nih.gov/,http://www.infobiogen.fr/,http://www.fmi.ch/biology/research-_tools.html,http://www.tigr.org/,也可以使用例如http://www.google.de得到。
Berks,TIBTECH 12(1994),352-364提供了关于生物技术专利信息的综述和可用于追溯搜索和最近资料通报的相关专利信息资源的调查。
另外,当在本文中出现时,术语″和/或″包括“和”、“或”以及“所述术语涉及的要素的所有或任意其它组合”的含义。
实施例
实施例1:从根癌土壤杆菌菌株C58(CIP 104333)克隆编码D-葡糖酸脱水酶的基因
从Institut Pasteur Collection(CIP,Paris,France)得到根癌土壤杆菌菌株C58(CIP 104333)。提取染色体DNA,并使用下述引物,根据标准方法,通过PCR扩增D-葡糖酸脱水酶基因:
5′-CCCTTAATTAATGACGACATCTGATAATCTTC-3′,见SEQ IDNO 5;
5′-TTTGCGGCCGCTTAGTGGTTATCGCGCGGC-3′,见SEQ IDNO 6;
5′-CCCGGTACCATGACGACATCTGATAATCTTC-3′,见SEQ IDNO 7;
将使用SEQ ID NO 5和SEQ ID NO 6所述的2个引物扩增第一个DNA片段连接进事先用PacI和NotI消化过的pUC18-衍生载体中,生成质粒pVDM80。将使用SEQ ID NO 6和SEQ ID NO 7所述的2个引物扩增的第二个DNA片段连接进事先用KpnI和NotI消化过的pET29a载体(Novagen)中,生成质粒pVDM82。克隆的基因的核苷酸序列如SEQ ID NO 1所示,由该基因编码的多肽的序列如SEQ ID NO2所示。
实施例2:在大肠杆菌中表达D-葡糖酸脱水酶活性以及从D-葡糖酸制备2-脱氢-3-脱氧-D-葡糖酸
使用如实施例1所述构建的pVDM82质粒转化大肠杆菌BL21的感受态细胞,生成菌株+1289。在30℃,在含有30mg/l卡那霉素的Luria-Bertani(LB)培养基(Difco)中培养菌株+1289,直到OD值(600nm)达到0.6。然后,加入异丙基-β-D-硫代吡喃型半乳糖苷(IPTG),至0.5mM终浓度。进一步培养2小时30分钟后,离心收集细胞,用20mM磷酸钠缓冲液pH7.2洗涤1次。通过将约5g细胞悬浮到含有10000单位溶菌酶(Ready-Lyse,Epicentre,Madison,Wisconsin)和1mM EDTA的10ml Tris-HCl 50mM pH8.5缓冲液中,并在30℃孵育悬浮液15分钟,制备细胞提取物。然后,将10000千单位脱氧核糖核酸酶I(DNase I,Sigma)以及5mM MgCl2加入制品中,在30℃孵育另外的15分钟。在使用前,将这样得到的细胞提取物冷冻保藏在-20℃。
混合1.5ml细胞提取物与2M D-葡糖酸钠或钾,至总体积10ml。在已经将pH调节至8.5后,在37℃孵育该制品。通过在孵育递增的时间后分析等分试样追踪2-脱氢-3-脱氧-D-葡糖酸(KDG)合成。将这些等分试样的几个稀释部分置于二氧化硅平板上,并在下面的溶剂系统中进行色谱:异丙醇/水(90/10)。用对茴香醛显色后,检测到了KDG(Rf约0.40)的黄斑。
另外,如Mac Gee(J.Biol.Chem.1954.210,617-626)所述,使用基于盐酸氨基脲反应的分光光度实验,对KDG进行了定量。典型地,在孵育30小时后,并使用分光光度实验,KDG浓度范围为1.5至2M。
这样得到的2-脱氢-3-脱氧-D-葡糖酸钠或钾溶液可以原样用于进一步的合成步骤。使用公开的方法(Bender,Anal.Biochem.1974.61,275-279),也可以从这样的溶液制备出2-脱氢-3-脱氧-D-葡糖酸。通过将1当量的HCl加入2-脱氢-3-脱氧-D-葡糖酸钾溶液中,然后蒸发,也可以得到2-脱氢-3-脱氧-D-葡糖酸和KCl的混合物的粗制品。
实施例3:从根癌土壤杆菌菌株C58(CIP 104333)克隆编码D-氨基葡糖酸脱氨酶的基因
从Institut Pasteur Collection(CIP,Paris,France)得到根癌土壤杆菌菌株C58(CIP 104333)。提取染色体DNA,并使用下述引物,根据标准方法,通过PCR扩增D-氨基葡糖酸脱氨酶基因:
5′CCCTTAATTAATGCAGTCTTCTTCAGCTCTTC-3′,见SEQ IDNO 8;
5′-TTTGCGGCCGCCTAGTGAAAGAAGGTTGTGTAGAT-3′,见SEQ ID NO 9;
5′-AAATCATGACTATGCAGTCTTCTTCAGCTCTTCG-3′,见SEQID NO 10;
5′-TATAGATCTCTAGTGAAAGAAGGTTGTGTAGAT-3′,见SEQID NO 11;
将使用SEQ ID NO 8和SEQ ID NO 9所述的2个引物扩增的第一个DNA片段连接进事先用PacI和NotI消化过的pUC18-衍生的载体中,生成质粒pKDGb1。将使用SEQ ID NO 10和SEQ ID NO 11所述的2个引物扩增的第二个DNA片段连接进事先用BspH1和BglII消化过的pQE60载体(Qiagen)中,生成质粒pEP18。所克隆的基因的核苷酸序列如SEQ ID NO 3所示,由该基因编码的多肽的序列如SEQ ID NO4所示。
实施例4:在大肠杆菌中表达D-氨基葡糖酸脱氨酶和从D-氨基葡糖酸制备2-脱氢-3-脱氧-D-葡糖酸
使用如实施例1所述构建的pEP18质粒和pREP4(Qiagen)转化大肠杆菌MG1655的感受态细胞,生成菌株+1068。在37℃,在含有30mg/l卡那霉素和100mg/l氨苄青霉素的LB培养基中培养菌株+1068,直到OD值(600nm)达到0.6。然后,加入IPTG至0.5mM终浓度。进一步培养2小时30分钟后,离心收集细胞,用20mM磷酸钠缓冲液pH7.2洗涤1次。使用实施例2所述的方法制备细胞提取物。
混合2ml细胞提取物与100mM D-氨基葡糖酸钠或钾和0.1mM磷酸吡哆醛,至总体积5ml。在已经将pH调节至7.5后,在37℃孵育该制品。
使用实施例2所述的方法追踪2-脱氢-3-脱氧-D-葡糖酸(KDG)合成的进程。典型地,在孵育30小时后,使用实施例2所述的分光光度实验,KDG浓度范围为50至100mM。
实施例5:从2-脱氢-3-脱氧-D-葡糖酸制备2-脱氧-D-ribonate
在25℃,将0.5ml 31%过氧化氢溶液加入5ml 1M 2-脱氢-3-脱氧-D-葡糖酸钾(KDG)溶液中。通过观察二氧化碳的释放形成的起泡和通过使用如实施例2所述的薄层色谱方法观察KDG的消失,追踪KDG脱羧基化的进展。典型地,在反应3小时后,残余KDG的浓度小于10mM。
实施例6:从2-脱氧-D-核糖内酯(ribonolactone)制备2-脱氧-D-核糖醇
将0.2g铑(5%,在碳上)催化剂加入按照Deriaz(J.Chem.Soc.(1949),1879-1883)中针对2-脱氧-L-核糖内酯的合成所述的方法制备的1g 2-脱氧-D-核糖内酯的水溶液中。在130℃,在80巴压力下,进行2-脱氧-D-核糖内酯的氢化。过滤反应化合物后,蒸发所得到的溶液。将残余物溶于乙酸乙酯中,并通过二氧化硅柱上的色谱进一步纯化。真空去除溶剂,得到黄色油状物(产率85%)。这样得到的化合物与如Rabow(J.Am.Chem.Soc.122(1999),3196-3203)所述通过还原2-脱氧-D-核糖得到的2-脱氧-D-核糖醇相同。
实施例7:从2-脱氢-3-脱氧-D-葡糖酸制备1-N-吗啉代-3,4,5-三羟基戊烯-1
将2g 2-脱氢-3-脱氧-D-葡糖酸悬浮于150ml苯中。将1.1ml吗啉和100mg对甲苯磺酸加入悬浮液中,回流反应混合物3小时。蒸馏去除该反应产生的水。倾析出苯。收集粘附到罐上的固体化合物,用丙酮洗涤,并干燥。使用甲醇在氯仿中的梯度,通过二氧化硅柱上的柱色谱进一步纯化存在于该产品中的主要化合物(产率40%)。收集含有1-N-吗啉代-3,4,5-三羟基戊烯-1的级分,真空去除溶剂。
1H-NMR(D2O):δ=3.15ppm(4H,t,吗啉),3.8ppm(4H,t,吗啉),3.4-4ppm,(4H,m,5a-H,5b-H,4-H,3-H),6.3和6.8ppm(2H,2d,1-H和2-H,J=4Hz)。
实施例8:从运动发酵单胞菌克隆编码丙酮酸脱羧酶的基因
从Institut Pasteur Collection(CIP,Paris,France)得到运动发酵单胞菌菌株B-806(CIP 102538T)。提取染色体DNA,并使用下述引物,根据标准方法,通过PCR扩增丙酮酸脱羧酶基因:
5′-GCGTTAATTAATGAGTTATACTGTCGGTACC-3′,见SEQ IDNO 12;
5′-TATGCGGCCGCTTAGAGGAGCTTGTTAACAGG-3′,见SEQID NO 13;
将使用SEQ ID NO 12和SEQ ID NO 13所述的2个引物扩增的DNA片段连接进事先用PacI和NotI消化过的pSP100或pEVL5(分别是pUC18-衍生的或pQE70-衍生的载体,如下所述)中,分别生成质粒pEVL107和质粒pEVL420。所克隆的基因的核苷酸序列以及编码的对应多肽的序列可以在GenBank(登记号AF124349)中找到,分别如SEQ ID NO:18和SEQ ID NO:19所示。
使用标准方法,将核糖体结合位点、PacI和NotI限制位点导入事先用EcoRI和BamHI消化过的pUC18载体中,得到质粒pSP100。pSP100的完整的核苷酸序列如SEQ ID NO 14所示。
使用标准方法,将核糖体结合位点、PacI和NotI限制位点导入事先用EcoRI和BamHI消化过的pQE70载体(Qiagen)中,得到质粒pEVL5。pEVL5的完整的核苷酸序列如SEQ ID NO 15所示。
实施例9:从酿酒酵母克隆编码丙酮酸脱羧酶的基因
提取酿酒酵母菌株S288C(ATCC 204508)的染色体DNA,并使用下述引物,根据标准方法,通过PCR扩增丙酮酸脱羧酶基因:
5′-ATATTTAATTAATGTCTGAAATTACTTTGG-3′,见SEQ ID NO16;
5′-ATATGCGGCCGCTTATTGCTTAGCGTTGGT-3′,见SEQ IDNO 17;
将使用SEQ ID NO 16和SEQ ID NO 17所述的2个引物扩增的DNA片段连接进事先用PacI和NotI消化过的pSP100或pEVL5(分别是pUC18-衍生的或pQE70-衍生的载体,如实施例8所述)中,分别生成质粒pVDM61和质粒pEVL419。所克隆的基因的核苷酸序列以及编码的对应多肽的序列可以在GenBank(登记号NC001144)中找到,分别如SEQ ID NO:20和SEQ ID NO:21所示。
实施例10:在大肠杆菌中表达丙酮酸脱羧酶活性以及从2-脱氢-3-脱氧-D-葡糖酸酶促合成2-脱氧-D-核糖
丙酮酸脱羧酶的表达和无细胞提取物的制备
使用pEVL107或pVDM61(如实施例8和9所述构建的)转化大肠杆菌MG1655的感受态细胞,分别生成菌株+1735和菌株+844。在37℃,在含有100mg/l氨苄青霉素的Luria-Bertani(LB)培养基(Difco)中培养这些菌株,直到OD值(600nm)达到1.5左右。
使用pEVL420或pEVL419(如实施例8和9所述构建的)转化携带pREP4质粒(Qiagen)的大肠杆菌MG1655的感受态细胞,分别生成菌株+3150和+3148。在37℃,在含有100mg/l氨苄青霉素和30mg/l卡那霉素的Luria-Bertani(LB)培养基(Difco)中培养这些菌株,直到OD值(600nm)达到0.6。然后,加入异丙基-β-D-硫代吡喃型半乳糖苷(IPTG)至0.5mM终浓度。进一步培养2小时30分钟后,离心收集细胞,用20mM磷酸钠缓冲液pH7.2洗涤1次。
对于每种菌株,使用与实施例2所述相同的方法制备无细胞的提取物。然后,使粗制的无细胞提取物穿过用50mM Tris-醋酸盐缓冲液pH6平衡的PD-10柱(Amersham),并保藏在-20℃。
从2-脱氢-3-脱氧-D-葡糖酸酶促合成2-脱氧-D-核糖
在1.5ml总体积的50mM tris-醋酸盐缓冲液pH6中,将1.0ml无细胞提取物与20mM 2-脱氢-3-脱氧-D-葡糖酸钠、0.5mM硫胺素焦磷酸盐和5mM MgCl2混合。通过分析在37℃孵育递增的时间后所取的等分试样,追踪2-脱氧-D-核糖(DRI)合成的进程。将约1ul每种等分试样(事先已经通过蒸发浓缩了5倍)置于二氧化硅平板上,并在下面的溶剂系统中进行色谱:丁醇/三乙胺/水(10/2/5)。当使用菌株+3150或+3148的无细胞提取物时,在孵育65小时后,用苔黑酚显色后检测到了DRI(Rf约0.50)的蓝斑。浓缩含有与DRI相对应的斑点的粗制品,使其穿过用异丙醇平衡的1.5ml二氧化硅柱。合并含有所期望的DRI化合物的级分,浓缩,并通过质谱分析得到的样品。这一分析的结果证实了分离的化合物与DRI是一致的,以及由来自运动发酵单胞菌(Zymomonas mobilis)或酿酒酵母的丙酮酸脱羧酶催化的从KDG生产DRI。
实施例11:从巴氏醋杆菌克隆编码丙酮酸脱羧酶的基因,所编码的丙酮酸脱羧酶活性在大肠杆菌中的表达,和从2-脱氢-3-脱氧-D-葡糖酸酶促合成2-脱氧-D-核糖
从DSMZ Collection(Deutsche Sammlung von Mikroorganismenund Zellkulturen GmbH,Braunschweig,Germany)得到巴氏醋杆菌菌株NCIB 8618(DSMZ 2347)。从细胞提取染色体DNA,并使用下述引物,根据标准方法,通过PCR扩增丙酮酸脱羧酶基因:
5′-TCTTTAATTAATGGGTTGTCCGTCATTCATATA-3′,见SEQID NO 22;
5′-CTAAAGCTTTTAGGCCAGAGTGGTCTTGCGCG-3′,见SEQID NO 23;,将使用SEQ ID NO 22和SEQ ID NO 23所述的2个引物扩增的DNA片段连接进事先用PacI和NotI消化过的pSP100或pEVL5(分别是pUC18-衍生的或pQE70-衍生的载体,如实施例8所述),分别生成质粒pEVL541和质粒pEVL560。所克隆的基因的核苷酸序列SEQ IDNO 24以及编码的对应多肽的序列SEQ ID NO 25可以在GenBank(登记号AF368435)中找到。
用pEVL541转化了大肠杆菌MG1655菌株的感受态细胞,生成菌株+3559。用pEVL560转化携带pREP4质粒(Qiagen)的大肠杆菌MG1655菌株的感受态细胞,生成菌株+3924。如实施例10所述,培养这些菌株,并制备无细胞的提取物。如实施例10所述,将无细胞的提取物与KDG一起孵育,追踪2-脱氧-D-核糖(DRI)合成的进程。观察到与DRI对应的斑点,表明来自巴氏醋杆菌的丙酮酸脱羧酶能将KDG脱羧基成DRI。
实施例12:从棕榈发酵细菌克隆编码丙酮酸脱羧酶的基因,编码的丙酮酸脱羧酶活性在大肠杆菌中的表达,和从2-脱氢-3-脱氧-D-葡糖酸酶促合成2-脱氧-D-核糖
从DSMZ Collection(Deutsche Sammlung von Mikroorganismenund Zellkulturen GmbH,Braunschweig,Germany)得到了棕榈发酵细菌菌株T109(DSMZ10491)。从细胞提取染色体DNA,并使用下述引物,根据标准方法,通过PCR扩增丙酮酸脱羧酶基因:
5′-ATCTTAATTAATGTATACCGTTGGTATGTACT-3′,见SEQ IDNO 26;
5′-TATGCGGCCGCTTACGCTTGTGGTTTGCGAGAGT-3′,见SEQ ID NO 27;
将使用SEQ ID NO 26和SEQ ID NO 27所述的2个引物扩增的DNA片段连接进事先用PacI和NotI消化过的pSP100或pEVL5(分别是pUC18-衍生的或pQE70-衍生的载体,如实施例8所述),分别生成质粒pEVL546和质粒pEVL561。所克隆的基因的核苷酸序列以及编码的对应多肽的序列分别如SEQ ID NO:28和29所述,且可以在GenBank(登记号AF474145)中找到。
用pEVL546转化了大肠杆菌MG1655菌株的感受态细胞,生成菌株+3568。用pEVL560转化携带pREP4质粒(Qiagen)的大肠杆菌MG1655菌株感受态细胞,生成菌株+3923。如实施例10所述,培养这些菌株,并制备无细胞提取物。如实施例10所述,将无细胞提取物与KDG一起孵育,并追踪2-脱氧-D-核糖(DRI)合成的进程。观察到了与DRI对应的斑点,表明来自棕榈发酵细菌的丙酮酸脱羧酶能将KDG脱羧化成DRI。
实施例13:从恶臭假单胞菌克隆编码苯甲酰基甲酸脱羧酶的基因,所编码的苯甲酰基甲酸脱羧酶活性在大肠杆菌中的表达,和从2-脱氢-3-脱氧-D-葡糖酸酶促合成2-脱氧-D-核糖
从DSMZ Collection(Deutsche Sammlung von Mikroorganismenund Zellkulturen GmbH,Braunschweig,Germany)得到了恶臭假单胞菌菌株Migula(DSMZ 291)。从细胞提取染色体DNA,并使用下述引物,根据标准方法,通过PCR扩增苯甲酰基甲酸脱羧酶基因:
5′-CTATTAATTAATGGCTTCGGTACACGGCACCA-3′,见SEQID NO 30;
5′-TATGCGGCCGCTTACTTCACCGGGCTTACGGTGC-3′,见SEQ ID NO 31;
将使用SEQ ID NO 30和SEQ ID NO 31所述的2个引物扩增的DNA片段连接进事先用PacI和NotI消化过的pSP100或pEVL5(分别是pUC18-衍生的或pQE70-衍生的载体,如实施例8所述),分别生成质粒pEVL681和质粒pEVL670。所克隆的基因的核苷酸序列SEQ IDNO 32以及编码的对应多肽的序列SEQ ID NO 33可以在GenBank(登记号AY143338)中找到。
用pEVL681转化大肠杆菌MG1655菌株的感受态细胞,生成菌株+4050。用pEVL670转化携带pREP4质粒(Qiagen)的大肠杆菌MG1655菌株感受态细胞,生成菌株+3927。如实施例10所述,培养这些菌株,并制备无细胞提取物。如实施例10所述,将无细胞提取物与KDG一起孵育,并追踪2-脱氧-D-核糖(DRI)合成的进程。观察到了与DRI对应的斑点,表明来自恶臭假单胞菌的苯甲酰基甲酸脱羧酶能将KDG脱羧化成DRI。
酶促合成制备2-脱氧-D-核糖
在0.5ml总体积的80mM磷酸钾缓冲液pH6中,将100ul来自菌株+3927的无细胞提取物(含有2.5mg细菌蛋白)与300mM 2-脱氢-3-脱氧-D-葡糖酸钠、0.5mM硫胺素焦磷酸盐和5mM MgCl2混合。在孵育16和40小时后,向孵育混合物中加入数微升HCl 2N溶液,直到pH值达到6。分析在37℃孵育递增的时间后取出的等分试样,追踪2-脱氧-D-核糖(DRI)合成的进程。将约1ul每种等分试样置于二氧化硅平板上,并如实施例10所述进行色谱。通过与标准溶液进行对比,估计2-脱氧-D-核糖的浓度为约200mM。对粗制混合物的13CNMR分析证实了从2-脱氢-3-脱氧-D-葡糖酸盐形成的化合物是2-脱氧-D-核糖,且2-脱氧-D-核糖的浓度接近25g/l。在相同的条件下进行了另一个制备性酶促合成,但是在孵育阶段没有加入酸。在那些条件下,2-脱氧-D-核糖的浓度接近10g/l,远低于前面的控制pH、并规则地调整到pH6的实验所达到的浓度。
实施例14.从D-葡糖酸酶促合成2-脱氧-D-核糖
使用由根癌土壤杆菌的gcnD基因编码的D-葡糖酸脱水酶和来自运动发酵单胞菌的丙酮酸脱羧酶,如下实现了从D-葡糖酸单点酶促合成2-脱氧-D-核糖:
在0.5ml 50mM N-(2-羟乙基)哌嗪-N′-(2-乙烷磺酸)(HEPES)缓冲液pH7中,将分别如实施例2和实施例10所述制备的50ul来自菌株+1289的无细胞提取物(含有1.5mg细菌蛋白)和400ul来自菌株+3150的无细胞提取物(超滤浓缩后,含有17mg细菌蛋白)与50mMD-葡糖酸钾、0.5mM硫胺素焦磷酸盐和5mM MgCl2一起混合。在37℃孵育递增的时间后取出等分试样,进行分析,追踪2-脱氧-D-核糖(DRI)合成的进程。孵育18小时后,将约1ul孵育混合物置于二氧化硅平板上,并如实施例10所述进行色谱。通过与标准溶液进行对比,估计2-脱氧-D-核糖的浓度为约1g/l。
序列表
<110>Evologic S.A.
Maliere Technologies SociétéCivile
Rhodia Chimie
Marliere,Phillipe
<120>克隆葡糖酸脱水酶gcnD基因
<130>G 3111 PCT S3
<160>33
<170>PatentIn version 3.1
<210>1
<211>1812
<212>DNA
<213>根癌土壤杆菌(Agrobacterium tumefaciens)
<220>
<221>CDS
<222>(1)..(1809)
<223>
<400>1
atg acg aca tct gat aat ctt cct gca act cag ggc aag ctc cgt tcg 48
Met Thr Thr Ser Asp Asn Leu Pro Ala Thr Gln Gly Lys Leu Arg Ser
1 5 10 15
cgc gcc tgg ttc gac aac cca gcc aat gcg gac atg acc gcg ctt tat 96
Arg Ala Trp Phe Asp Asn Pro Ala Asn Ala Asp Met Thr Ala Leu Tyr
20 25 30
ctc gag cgt tac atg aac ttc ggt ctc agc cag gcc gag ctt cag tcc 144
Leu Glu Arg Tyr Met Asn Phe Gly Leu Ser Gln Ala Glu Leu Gln Ser
35 40 45
gac cgc ccg att atc ggt att gcg cag acc ggt tcc gac ctt tcg ccc 192
Asp Arg Pro Ile Ile Gly Ile Ala Gln Thr Gly Ser Asp Leu Ser Pro
50 55 60
tgc aac cgt cat cat ctg gaa ctc gcc aac cgt ctg cgt gaa ggc att 240
Cys Asn Arg His His Leu Glu Leu Ala Asn Arg Leu Arg Glu Gly Ile
65 70 75 80
cgt gaa gcc ggc ggc atc gcc atc gaa ttc ccg gtg cat ccg atc cag 288
Arg Glu Ala Gly Gly Ile Ala Ile Glu Phe Pro Val His Pro Ile Gln
85 90 95
gaa acc ggt aag cgt ccg aca gcg ggc ctt gat cgc aac ctg gct tac 336
Glu Thr Gly Lys Arg Pro Thr Ala Gly Leu Asp Arg Asn Leu Ala Tyr
100 105 110
ctc ggc ctc gtg gaa gtg ctt tat ggc tat ccg ctc gac ggc gtt gtt 384
Leu Gly Leu Val Glu Val Leu Tyr Gly Tyr Pro Leu Asp Gly Val Val
115 120 125
ctg acc atc ggc tgc gac aag acc acg cct gcc tgt ctt atg gcg gcg 432
Leu Thr Ile Gly Cys Asp Lys Thr Thr Pro Ala Cys Leu Met Ala Ala
130 135 140
gcc acc gtc aac att ccg gcc atc gcc ctt tcc gtc ggt ccc atg ctg 480
Ala Thr Val Asn Ile Pro Ala Ile Ala Leu Ser Val Gly Pro Met Leu
145 150 155 160
aac ggc tgg ttc cgc ggt gag cgc acc ggt tcc ggc acc atc gtc tgg 528
Asn Gly Trp Phe Arg Gly Glu Arg Thr Gly Ser Gly Thr Ile Val Trp
165 170 175
aag gcc cgc gaa ctg ctg gcg aag ggc gag atc gat tac cag ggc ttc 576
Lys Ala Arg Glu Leu Leu Ala Lys Gly Glu Ile Asp Tyr Gln Gly Phe
180 185 190
gtc aag ctc gtt gcc tcg tct gcc ccg tcc acc ggc tat tgc aac acc 624
Val Lys Leu Val Ala Ser Ser Ala Pro Ser Thr Gly Tyr Cys Asn Thr
195 200 205
atg ggc acg gca aca acc atg aac tcg ctc gcc gaa gcg ctc ggc atg 672
Met Gly Thr Ala Thr Thr Met Asn Ser Leu Ala Glu Ala Leu Gly Met
210 215 220
cag ctt ccc ggc tcc gcc gcc att ccg gcg cct tac cgt gac cgt cag 720
Gln Leu Pro Gly Ser Ala Ala Ile Pro Ala Pro Tyr Arg Asp Arg Gln
225 230 235 240
gaa gtc tct tac ctc acc ggc ctg cgc atc gtc gac atg gtc agg gaa 768
Glu Val Ser Tyr Leu Thr Gly Leu Arg Ile Val Asp Met Val Arg Glu
245 250 255
gac ctg aaa cca tca gac atc atg acc aag gat gcc ttc atc aac gcc 816
Asp Leu Lys Pro Ser Asp Ile Met Thr Lys Asp Ala Phe Ile Asn Ala
260 265 270
atc cgc gtt aat tcg gcg atc ggc ggt tcc acc aac gcg ccg atc cat 864
Ile Arg Val Asn Ser Ala Ile Gly Gly Ser Thr Asn Ala Pro Ile His
275 280 285
cta aac ggc ctt gcc cgc cat gtc ggc gtc gag ctg acg gtg gat gac 912
Leu Asn Gly Leu Ala Arg His Val Gly Val Glu Leu Thr Val Asp Asp
290 295 300
tgg cag acc tat ggc gaa gac gtg ccg ctg ctc gtc aac ctg cag ccg 960
Trp Gln Thr Tyr Gly Glu Asp Val Pro Leu Leu Val Asn Leu Gln Pro
305 310 315 320
gca ggc gaa tat ctc ggc gag gac tat tac cat gcc ggc ggc gtt ccc 1008
Ala Gly Glu Tyr Leu Gly Glu Asp Tyr Tyr His Ala Gly Gly Val Pro
325 330 335
gct gtc gtc aat cag ctg atg acc caa ggg ctg atc atg gaa gac gcc 1056
Ala Val Val Asn Gln Leu Met Thr Gln Gly Leu Ile Met Glu Asp Ala
340 345 350
atg acc gtc aac ggc aag acc atc ggc gac aat tgc cgt ggc gcg atc 1104
Met Thr Val Asn Gly Lys Thr Ile Gly Asp Asn Cys Arg Gly Ala Ile
355 360 365
atc gaa gac gag aag gtc atc cgc ccc tat gag cag ccg ctc aag gag 1152
Ile Glu Asp Glu Lys Val Ile Arg Pro Tyr Glu Gln Pro Leu Lys Glu
370 375 380
cgt gcc ggc ttc cgc gtt ctg cgc ggc aat ctg ttc tcc tcg gcc atc 1200
Arg Ala Gly Phe Arg Val Leu Arg Gly Asn Leu Phe Ser Ser Ala Ile
385 390 395 400
atg aag aca agc gtg att tcg gaa gaa ttc cgc ggt cgt tac ctc tcc 1248
Met Lys Thr Ser Val Ile Ser Glu Glu Phe Arg Gly Arg Tyr Leu Ser
405 410 415
aac cct gat gat ccg gaa gcc ttc gaa ggc cgc gcc gtg gtg ttc gat 1296
Asn Pro Asp Asp Pro Glu Ala Phe Glu Gly Arg Ala Val Val Phe Asp
420 425 430
ggt ccg gag gat tac cat cat cgc atc gac gat ccg tcg ctt ggc atc 1344
Gly Pro Glu Asp Tyr His His Arg Ile Asp Asp Pro Ser Leu Gly Ile
435 440 445
gac gcc aac acc gtc ctg ttc atg cgc ggc gcc ggt ccg atc ggt tac 1392
Asp Ala Asn Thr Val Leu Phe Met Arg Gly Ala Gly Pro Ile Gly Tyr
450 455 460
ccg ggc gca gcg gaa gtg gtg aac atg cgc gcg ccg gat tac ctt ctg 1440
Pro Gly Ala Ala Glu Val Val Asn Met Arg Ala Pro Asp Tyr Leu Leu
465 470 475 480
aag caa ggc gtc agt tcg ctg ccc tgc atc ggc gat ggc cgc cag tcc 1488
Lys Gln Gly Val Ser Ser Leu Pro Cys Ile Gly Asp Gly Arg Gln Ser
485 490 495
ggc acg tcg ggc agc cca tcc atc ctc aat gcc tcg ccg gaa gcg gcg 1536
Gly Thr Ser Gly Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ala Ala
500 505 510
gcc ggc ggc ggt ctg tct att ctg cag acg ggt gac cgc gtc cgc atc 1584
Ala Gly Gly Gly Leu Ser Ile Leu Gln Thr Gly Asp Arg Val Arg Ile
515 520 525
gat gtg ggc cgc ggc aag gcc gat atc ctg ata tca ggt gaa gag ctc 1632
Asp Val Gly Arg Gly Lys Ala Asp Ile Leu Ile Ser Gly Glu Glu Leu
530 535 540
gcc aag cgt tac gag gcg ctg gca gct cag ggc ggt tat aag ttc ccc 1680
Ala Lys Arg Tyr Glu Ala Leu Ala Ala Gln Gly Gly Tyr Lys Phe Pro
545 550 555 560
gac cac cag acg ccg tgg cag gaa atc cag cgc ggt atc gtc agc cag 1728
Asp His Gln Thr Pro Trp Gln Glu Ile Gln Arg Gly Ile Val Ser Gln
565 570 575
atg gaa acc ggc gcg gtt ctg gaa ccg gcc gta aag tat cag cgc atc 1776
Met Glu Thr Gly Ala Val Leu Glu Pro Ala Val Lys Tyr Gln Arg Ile
580 585 590
gcc cag acc aag ggc ctg ccg cgc gat aac cac tga 1812
Ala Gln Thr Lys Gly Leu Pro Arg Asp Asn His
595 600
<210>2
<211>603
<212>PRT
<213>根癌土壤杆菌
<400>2
Met Thr Thr Ser Asp Asn Leu Pro Ala Thr Gln Gly Lys Leu Arg Ser
1 5 10 15
Arg Ala Trp Phe Asp Asn Pro Ala Asn Ala Asp Met Thr Ala Leu Tyr
20 25 30
Leu Glu Arg Tyr Met Asn Phe Gly Leu Ser Gln Ala Glu Leu Gln Ser
35 40 45
Asp Arg Pro Ile Ile Gly Ile Ala Gln Thr Gly Ser Asp Leu Ser Pro
50 55 60
Cys Asn Arg His His Leu Glu Leu Ala Asn Arg Leu Arg Glu Gly Ile
65 70 75 80
Arg Glu Ala Gly Gly Ile Ala Ile Glu Phe Pro Val His Pro Ile Gln
85 90 95
Glu Thr Gly Lys Arg Pro Thr Ala Gly Leu Asp Arg Ash Leu Ala Tyr
100 105 110
Leu Gly Leu Val Glu Val Leu Tyr Gly Tyr Pro Leu Asp Gly Val Val
115 120 125
Leu Thr Ile Gly Cys Asp Lys Thr Thr Pro Ala Cys Leu Met Ala Ala
130 135 140
Ala Thr Val Asn Ile Pro Ala Ile Ala Leu Ser Val Gly Pro Met Leu
145 150 155 160
Asn Gly Trp Phe Arg Gly Glu Arg Thr Gly Ser Gly Thr Ile Val Trp
165 170 175
Lys Ala Arg Glu Leu Leu Ala Lys Gly Glu Ile Asp Tyr Gln Gly Phe
180 185 190
Val Lys Leu Val Ala Ser Ser Ala Pro Ser Thr Gly Tyr Cys Asn Thr
195 200 205
Met Gly Thr Ala Thr Thr Met Asn Ser Leu Ala Glu Ala Leu Gly Met
210 215 220
Gln Leu Pro Gly Ser Ala Ala Ile Pro Ala Pro Tyr Arg Asp Arg Gln
225 230 235 240
Glu Val Ser Tyr Leu Thr Gly Leu Arg Ile Val Asp Met Val Arg Glu
245 250 255
Asp Leu Lys Pro Ser Asp Ile Met Thr Lys Asp Ala Phe Ile Asn Ala
260 265 270
Ile Arg Val Asn Ser Ala Ile Gly Gly Ser Thr Asn Ala Pro Ile His
275 280 285
Leu Asn Gly Leu Ala Arg His Val Gly Val Glu Leu Thr Val Asp Asp
290 295 300
Trp Gln Thr Tyr Gly Glu Asp Val Pro Leu Leu Val Asn Leu Gln Pro
305 310 315 320
Ala Gly Glu Tyr Leu Gly Glu Asp Tyr Tyr His Ala Gly Gly Val Pro
325 330 335
Ala Val Val Asn Gln Leu Met Thr Gln Gly Leu Ile Met Glu Asp Ala
340 345 350
Met Thr Val Asn Gly Lys Thr Ile Gly Asp Asn Cys Arg Gly Ala Ile
355 360 365
Ile Glu Asp Glu Lys Val Ile Arg Pro Tyr Glu Gln Pro Leu Lys Glu
370 375 380
Arg Ala Gly Phe Arg Val Leu Arg Gly Asn Leu Phe Ser Ser Ala Ile
385 390 395 400
Met Lys Thr Ser Val Ile Ser Glu Glu Phe Arg Gly Arg Tyr Leu Ser
405 410 415
Asn Pro Asp Asp Pro Glu Ala Phe Glu Gly Arg Ala Val Val Phe Asp
420 425 430
Gly Pro Glu Asp Tyr His His Arg Ile Asp Asp Pro Ser Leu Gly Ile
435 440 445
Asp Ala Asn Thr Val Leu Phe Met Arg Gly Ala Gly Pro Ile Gly Tyr
450 455 460
Pro Gly Ala Ala Glu Val Val Asn Met Arg Ala Pro Asp Tyr Leu Leu
465 470 475 480
Lys Gln Gly Val Ser Ser Leu Pro Cys Ile Gly Asp Gly Arg Gln Ser
485 490 495
Gly Thr Ser Gly Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ala Ala
500 505 510
Ala Gly Gly Gly Leu Ser Ile Leu Gln Thr Gly Asp Arg Val Arg Ile
515 520 525
Asp Val Gly Arg Gly Lys Ala Asp Ile Leu Ile Ser Gly Glu Glu Leu
530 535 540
Ala Lys Arg Tyr Glu Ala Leu Ala Ala Gln Gly Gly Tyr Lys Phe Pro
545 550 555 560
Asp His Gln Thr Pro Trp Gln Glu Ile Gln Arg Gly Ile Val Ser Gln
565 570 575
Met Glu Thr Gly Ala Val Leu Glu Pro Ala Val Lys Tyr Gln Arg Ile
580 585 590
Ala Gln Thr Lys Gly Leu Pro Arg Asp Asn His
595 600
<210>3
<211>1272
<212>DNA
<213>根癌土壤杆菌
<220>
<221>CDS
<222>(1)..(1269)
<223>
<400>3
atg cag tct tct tca gct ctt cgg caa tca acc ggc gat cag tcg gaa 48
Met Gln Ser Ser Ser Ala Leu Arg Gln Ser Thr Gly Asp Gln Ser Glu
1 5 10 15
tac cat gcc cag tcg aat atg atc ggc tct agc ccg gcg gac ggt ttg 96
Tyr His Ala Gln Ser Asn Met Ile Gly Ser Ser Pro Ala Asp Gly Leu
20 25 30
ctc gca ttg ccg ctt ctg acc gtc gat ctt gcc gtc tat cgc ggt aat 144
Leu Ala Leu Pro Leu Leu Thr Val Asp Leu Ala Val Tyr Arg Gly Asn
35 40 45
cgg gat cgc ttt ctt gcg ctt gtc tcg gcc cat gga gcg aag gcg gct 192
Arg Asp Arg Phe Leu Ala Leu Val Ser Ala His Gly Ala Lys Ala Ala
50 55 60
cca cat gcc aag acg ccg atg tgc ccg gag atc gcg atc gat ctg att 240
Pro His Ala Lys Thr Pro Met Cys Pro Glu Ile Ala Ile Asp Leu Ile
65 70 75 80
gaa gcc ggt gcc tgg ggc gcg acg gtc gcc gat ctc ttc cag gcg gaa 288
Glu Ala Gly Ala Trp Gly Ala Thr Val Ala Asp Leu Phe Gln Ala Glu
85 90 95
gtc ctg ctc aag gcc ggc gtg tcg aac ata ttg atc gcc aac cag atc 336
Val Leu Leu Lys Ala Gly Val Ser Asn Ile Leu Ile Ala Asn Gln Ile
100 105 110
ggc gga ttg aca tcc gcc aga cgc cta cgc atg ctc gca gat gct ttt 384
Gly Gly Leu Thr Ser Ala Arg Arg Leu Arg Met Leu Ala Asp Ala Phe
115 120 125
ccg aaa gcc gag att atc tgc tgt gtc gat tct gtt cag gcc tcg gcc 432
Pro Lys Ala Glu Ile Ile Cys Cys Val Asp Ser Val Gln Ala Ser Ala
130 135 140
aat ctg gtt cag gcc ttt caa ggg cgt gtg gat gcc cca ttc aag gtc 480
Asn Leu Val Gln Ala Phe Gln Gly Arg Val Asp Ala Pro Phe Lys Val
145 150 155 160
ttc atc gaa gtc ggt gtc ggc cgc act ggc gcc cgt acg ttg aat gtt 528
Phe Ile Glu Val Gly Val Gly Arg Thr Gly Ala Arg Thr Leu Asn Val
165 170 175
gca aag gat atc atc gac acc atc tcg aca agt gca gaa atc gta ctg 576
Ala Lys Asp Ile Ile Asp Thr Ile Ser Thr Ser Ala Glu Ile Val Leu
180 185 190
gcc ggt gtg tcg acc tat gaa ggc tcc gtc tcc ggg gaa acg tcg gaa 624
Ala Gly Val Ser Thr Tyr Glu Gly Ser Val Ser Gly Glu Thr Ser Glu
195 200 205
gca ctc gat gca aac atg gcg gcc ctg ttc gat ctc ctg acc gac agt 672
Ala Leu Asp Ala Asn Met Ala Ala Leu Phe Asp Leu Leu Thr Asp Ser
210 215 220
ctt gca tcg ata cgc gaa aaa gat ccc ggg cgc ccg cta acg gtt tca 720
Leu Ala Ser Ile Arg Glu Lys Asp Pro Gly Arg Pro Leu Thr Val Ser
225 230 235 240
gcc ggc ggt tcg atc cat ttc gac cgc gtg ctc gcg gcg ctt gtg ccc 768
Ala Gly Gly Ser Ile His Phe Asp Arg Val Leu Ala Ala Leu Val Pro
245 250 255
gtt tgc gag gcg gat ggc aat gcg acg ttg ttg ctg cgc agc ggc gcc 816
Val Cys Glu Ala Asp Gly Asn Ala Thr Leu Leu Leu Arg Ser Gly Ala
260 265 270
atc ttc ttc tct gat cac ggt gta tat cag cgc ggt ttc cag gca gtc 864
Ile Phe Phe Ser Asp His Gly Val Tyr Gln Arg Gly Phe Gln Ala Val
275 280 285
gac gcc cgc aac cta ctc gca tcc ggc aag gtt gtc ttc aag gca tcc 912
Asp Ala Arg Asn Leu Leu Ala Ser Gly Lys Val Val Phe Lys Ala Ser
290 295 300
gag gca ttt cag ccc tca atg cga atc tgg gcg gag gtc atc tcc gtt 960
Glu Ala Phe Gln Pro Ser Met Arg Ile Trp Ala Glu Val Ile Ser Val
305 310 315 320
cct gag ccg ggg ctg gcg atc gtc ggc atg ggc atg cgg gat gta tcg 1008
Pro Glu Pro Gly Leu Ala Ile Val Gly Met Gly Met Arg Asp Val Ser
325 330 335
ttc gat cag gac ctg ccc gtg gcg ctt cgg ctc cat agg gac gga cat 1056
Phe Asp Gln Asp Leu Pro Val Ala Leu Arg Leu His Arg Asp Gly His
340 345 350
ctg gtc gaa gct gat ctc tct tca tcc gcg aag gtc ggc aag ctc aat 1104
Leu Val Glu Ala Asp Leu Ser Ser Ser Ala Lys Val Gly Lys Leu Asn
355 360 365
gac cag cat gcc ttc ttg tcc ttc ggg aac ggc agc agt ctg gca atc 1152
Asp Gln His Ala Phe Leu Ser Phe Gly Asn Gly Ser Ser Leu Ala Ile
370 375 380
ggc gat gtc ata gaa ttc ggc atc tcg cat ccc tgc acg tgc ttc gat 1200
Gly Asp Val Ile Glu Phe Gly Ile Ser His Pro Cys Thr Cys Phe Asp
385 390 395 400
cgc tgg cgc gtc ttt cac gga atc gat gga tca ggc cgg atc cag cgc 1248
Arg Trp Arg Val Phe His Gly Ile Asp Gly Ser Gly Arg Ile Gln Arg
405 410 415
atc tac aca acc ttc ttt cac tag 1272
Ile Tyr Thr Thr Phe Phe His
420
<210>4
<211>423
<212>PRT
<213>根癌土壤杆菌
<400>4
Met Gln Ser Ser Ser Ala Leu Arg Gln Ser Thr Gly Asp Gln Ser Glu
1 5 10 15
Tyr His Ala Gln Ser Asn Met Ile Gly Ser Ser Pro Ala Asp Gly Leu
20 25 30
Leu Ala Leu Pro Leu Leu Thr Val Asp Leu Ala Val Tyr Arg Gly Asn
35 40 45
Arg Asp Arg Phe Leu Ala Leu Val Ser Ala His Gly Ala Lys Ala Ala
50 55 60
Pro His Ala Lys Thr Pro Met Cys Pro Glu Ile Ala Ile Asp Leu Ile
65 70 75 80
Glu Ala Gly Ala Trp Gly Ala Thr Val Ala Asp Leu Phe Gln Ala Glu
85 90 95
Val Leu Leu Lys Ala Gly Val Ser Asn Ile Leu Ile Ala Asn Gln Ile
100 105 110
Gly Gly Leu Thr Ser Ala Arg Arg Leu Arg Met Leu Ala Asp Ala Phe
115 120 125
Pro Lys Ala Glu Ile Ile Cys Cys Val Asp Ser Val Gln Ala Ser Ala
130 135 140
Asn Leu Val Gln Ala Phe Gln Gly Arg Val Asp Ala Pro Phe Lys Val
145 150 155 160
Phe Ile Glu Val Gly Val Gly Arg Thr Gly Ala Arg Thr Leu Asn Val
165 170 175
Ala Lys Asp Ile Ile Asp Thr Ile Ser Thr Ser Ala Glu Ile Val Leu
180 185 190
Ala Gly Val Ser Thr Tyr Glu Gly Ser Val Ser Gly Glu Thr Ser Glu
195 200 205
Ala Leu Asp Ala Asn Met Ala Ala Leu Phe Asp Leu Leu Thr Asp Ser
210 215 220
Leu Ala Ser Ile Arg Glu Lys Asp Pro Gly Arg Pro Leu Thr Val Ser
225 230 235 240
Ala Gly Gly Ser Ile His Phe Asp Arg Val Leu Ala Ala Leu Val Pro
245 250 255
Val Cys Glu Ala Asp Gly Asn Ala Thr Leu Leu Leu Arg Ser Gly Ala
260 265 270
Ile Phe Phe Ser Asp His Gly Val Tyr Gln Arg Gly Phe Gln Ala Val
275 280 285
Asp Ala Arg Asn Leu Leu Ala Ser Gly Lys Val Val Phe Lys Ala Ser
290 295 300
Glu Ala Phe Gln Pro Ser Met Arg Ile Trp Ala Glu Val Ile Ser Val
305 310 315 320
Pro Glu Pro Gly Leu Ala Ile Val Gly Met Gly Met Arg Asp Val Ser
325 330 335
Phe Asp Gln Asp Leu Pro Val Ala Leu Arg Leu His Arg Asp Gly His
340 345 350
Leu Val Glu Ala Asp Leu Ser Ser Ser Ala Lys Val Gly Lys Leu Asn
355 360 365
Asp Gln His Ala Phe Leu Ser Phe Gly Asn Gly Ser Ser Leu Ala Ile
370 375 380
Gly Asp Val Ile Glu Phe Gly Ile Ser His Pro Cys Thr Cys Phe Asp
385 390 395 400
Arg Trp Arg Val Phe His Gly Ile Asp Gly Ser Gly Arg Ile Gln Arg
405 410 415
Ile Tyr Thr Thr Phe Phe His
420
<210>5
<211>32
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>5
cccttaatta atgacgacat ctgataatct tc 32
<210>6
<211>30
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>6
tttgcggccg cttagtggtt atcgcgcggc 30
<210>7
<211>31
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>7
cccggtacca tgacgacatc tgataatctt c 31
<210>8
<211>32
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>8
cccttaatta atgcagtctt cttcagctct tc 32
<210>9
<211>35
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>9
tttgcggccg cctagtgaaa gaaggttgtg tagat 35
<210>10
<211>34
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>10
aaatcatgac tatgcagtct tcttcagctc ttcg 34
<210>11
<211>33
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸引物
<400>11
tatagatctc tagtgaaaga aggttgtgta gat 33
<210>12
<211>31
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>12
gcgttaatta atgagttata ctgtcggtac c 31
<210>13
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>13
tatgcggccg cttagaggag cttgttaaca gg 32
<210>14
<211>2665
<212>DNA
<213>载体
<400>14
gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60
cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt 120
tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat 180
aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt 240
ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg 300
ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga 360
tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc 420
tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac 480
actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg 540
gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca 600
acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg 660
gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg 720
acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg 780
gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag 840
ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg 900
gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct 960
cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1020
agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080
catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140
tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt 1200
cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct 1260
gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc 1320
taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc 1380
ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc 1440
tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg 1500
ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt 1560
cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg 1620
agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg 1680
gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt 1740
atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag 1800
gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt 1860
gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta 1920
ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt 1980
cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 2040
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 2100
acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc 2160
cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg 2220
accatgatta cgaattcgag gttaattaac cccgcggccg caagcttggc actggccgtc 2280
gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca 2340
catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa 2400
cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct tacgcatctg 2460
tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga tgccgcatag 2520
ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc 2580
ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt 2640
tcaccgtcat caccgaaacg cgcga 2665
<210>15
<211>3433
<212>DNA
<213>载体
<400>15
ctcgagaaat cataaaaaat ttatttgctt tgtgagcgga taacaattat aatagattca 60
attgtgagcg gataacaatt tcacacagaa ttcttaaaga ggagaaatta attaaccccg 120
cggccgcgga tccagatctc atcaccatca ccatcactaa gcttaattag ctgagcttgg 180
actcctgttg atagatccag taatgacctc agaactccat ctggatttgt tcagaacgct 240
cggttgccgc cgggcgtttt ttattggtga gaatccaagc tagcttggcg agattttcag 300
gagctaagga agctaaaatg gagaaaaaaa tcactggata taccaccgtt gatatatccc 360
aatggcatcg taaagaacat tttgaggcat ttcagtcagt tgctcaatgt acctataacc 420
agaccgttca gctggatatt acggcctttt taaagaccgt aaagaaaaat aagcacaagt 480
tttatccggc ctttattcac attcttgccc gcctgatgaa tgctcatccg gaatttcgta 540
tggcaatgaa agacggtgag ctggtgatat gggatagtgt tcacccttgt tacaccgttt 600
tccatgagca aactgaaacg ttttcatcgc tctggagtga ataccacgac gatttccggc 660
agtttctaca catatattcg caagatgtgg cgtgttacgg tgaaaacctg gcctatttcc 720
ctaaagggtt tattgagaat atgtttttcg tctcagccaa tccctgggtg agtttcacca 780
gttttgattt aaacgtggcc aatatggaca acttcttcgc ccccgttttc accatgggca 840
aatattatac gcaaggcgac aaggtgctga tgccgctggc gattcaggtt catcatgccg 900
tttgtgatgg cttccatgtc ggcagaatgc ttaatgaatt acaacagtac tgcgatgagt 960
ggcagggcgg ggcgtaattt ttttaaggca gttattggtg cccttaaacg cctggggtaa 1020
tgactctcta gcttgaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt 1080
cgttttatct gttgtttgtc ggtgaacgct ctcctgagta ggacaaatcc gccctctaga 1140
gctgcctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga 1200
cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag 1260
cgggtgttgg cgggtgtcgg ggcgcagcca tgacccagtc acgtagcgat agcggagtgt 1320
atactggctt aactatgcgg catcagagca gattgtactg agagtgcacc atatgcggtg 1380
tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt ccgcttcctc 1440
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 1500
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 1560
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 1620
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 1680
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 1740
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 1800
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 1860
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 1920
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 1980
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 2040
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 2100
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 2160
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 2220
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 2280
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 2340
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 2400
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 2460
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 2520
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 2580
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 2640
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 2700
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 2760
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 2820
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 2880
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 2940
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 3000
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 3060
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 3120
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 3180
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 3240
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 3300
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 3360
cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 3420
ctttcgtctt cac 3433
<210>16
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>16
atatttaatt aatgtctgaa attactttgg 30
<210>17
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>17
atatgcggcc gcttattgct tagcgttggt 30
<210>18
<211>1707
<212>DNA
<213>运动发酵单胞菌(Zymomonas mobilis)
<220>
<221>CDS
<222>(1)..(1707)
<223>
<400>18
atg agt tat act gtc ggt acc tat tta gcg gag cgg ctt gtc cag att 48
Met Ser Tyr Thr Val Gly Thr Tyr Leu Ala Glu Arg Leu Val Gln Ile
1 5 10 15
ggt ctc aag cat cac ttc gca gtc gcg ggc gac tac aac ctc gtc ctt 96
Gly Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu
20 25 30
ctt gac aac ctg ctt ttg aac aaa aac atg gag cag gtt tat tgc tgt 144
Leu Asp Asn Leu Leu Leu Asn Lys Asn Met Glu Gln Val Tyr Cys Cys
35 40 45
aac gaa ctg aac tgc ggt ttc agt gca gaa ggt tat gct cgt gcc aaa 192
Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Lys
50 55 60
ggc gca gca gca gcc gtc gtt acc tac agc gtc ggt gcg ctt tcc gca 240
Gly Ala Ala Ala Ala Val Val Thr Tyr Ser Val Gly Ala Leu Set Ala
65 70 75 80
ttt gat gct atc ggt ggc gcc tat gca gaa aac ctt ccg gtt atc ctg 288
Phe Asp Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu
85 90 95
atc tcc ggt gct ccg aac aac aat gat cac gct gct ggt cac gtg ttg 336
Ile Ser Gly Ala Pro Asn Asn Asn Asp His Ala Ala Gly His Val Leu
100 105 110
cat cac gct ctt ggc aaa acc gac tat cac tat cag ttg gaa atg gcc 384
His His Ala Leu Gly Lys Thr Asp Tyr His Tyr Gln Leu Glu Met Ala
115 120 125
aag aac atc acg gcc gcc gct gaa gcg att tac acc ccg gaa gaa gct 432
Lys Asn Ile Thr Ala Ala Ala Glu Ala Ile Tyr Thr Pro Glu Glu Ala
130 135 140
ccg gct aaa atc gat cac gtg att aaa act gct ctt cgt gag aag aag 480
Pro Ala Lys Ile Asp His Val Ile Lys Thr Ala Leu Arg Glu Lys Lys
145 150 155 160
ccg gtt tat ctc gaa atc gct tgc aac att gct tcc atg ccc tgc gcc 528
Pro Val Tyr Leu Glu Ile Ala Cys Asn Ile Ala Ser Met Pro Cys Ala
165 170 175
gct cct gga ccg gca agc gca ttg ttc aat gac gaa gcc agc gac gaa 576
Ala Pro Gly Pro Ala Ser Ala Leu Phe Asn Asp Glu Ala Ser Asp Glu
180 185 190
gct tct ttg aat gca gcg gtt gaa gaa acc ctg aaa ttc atc gcc aac 624
Ala Ser Leu Asn Ala Ala Val Glu Glu Thr Leu Lys Phe Ile Ala Asn
195 200 205
cgc gac aaa gtt gcc gtc ctc gtc ggc agc aag ctg cgc gca gct ggt 672
Arg Asp Lys Val Ala Val Leu Val Gly Ser Lys Leu Arg Ala Ala Gly
210 215 220
gct gaa gaa gct gct gtc aaa ttt gct gat gct ctc ggt ggc gca gtt 720
Ala Glu Glu Ala Ala Val Lys Phe Ala Asp Ala Leu Gly Gly Ala Val
225 230 235 240
gct acc atg gct gct gca aaa agc ttc ttc cca gaa gaa aac ccg cat 768
Ala Thr Met Ala Ala Ala Lys Ser Phe Phe Pro Glu Glu Asn Pro His
245 250 255
tac atc ggc acc tca tgg ggt gaa gtc agc tat ccg ggc gtt gaa aag 816
Tyr Ile Gly Thr Ser Trp Gly Glu Val Ser Tyr Pro Gly Val Glu Lys
260 265 270
acg atg aaa gaa gcc gat gcg gtt atc gct ctg gct cct gtc ttc aac 864
Thr Met Lys Glu Ala Asp Ala Val Ile Ala Leu Ala Pro Val Phe Asn
275 280 285
gac tac tcc acc act ggt tgg acg gat att cct gat cct aag aaa ctg 912
Asp Tyr Ser Thr Thr Gly Trp Thr Asp Ile Pro Asp Pro Lys Lys Leu
290 295 300
gtt ctc gct gaa ccg cgt tct gtc gtc gtt aac ggc att cgc ttc ccc 960
Val Leu Ala Glu Pro Arg Ser Val Val Val Asn Gly Ile Arg Phe Pro
305 310 315 320
agc gtc cat ctg aaa gac tat ctg acc cgt ttg gct cag aaa gtt tcc 1008
Ser Val His Leu Lys Asp Tyr Leu Thr Arg Leu Ala Gln Lys Val Ser
325 330 335
aag aaa acc ggt gca ttg gac ttc ttc aaa tcc ctc aat gca ggt gaa 1056
Lys Lys Thr Gly Ala Leu Asp Phe Phe Lys Ser Leu Asn Ala Gly Glu
340 345 350
ctg aag aaa gcc gct ccg gct gat ccg agt gct ccg ttg gtc aac gca 1104
Leu Lys Lys Ala Ala Pro Ala Asp Pro Ser Ala Pro Leu Val Asn Ala
355 360 365
gaa atc gcc cgt cag gtc gaa gct ctt ctg acc ccg aac acg acg gtt 1152
Glu Ile Ala Arg Gln Val Glu Ala Leu Leu Thr Pro Asn Thr Thr Val
370 375 380
att gct gaa acc ggt gac tct tgg ttc aat gct cag cgc atg aag ctc 1200
Ile Ala Glu Thr Gly Asp Ser Trp Phe Asn Ala Gln Arg Met Lys Leu
385 390 395 400
ccg aac ggt gct cgc gtt gaa tat gaa atg cag tgg ggt cac att ggt 1248
Pro Asn Gly Ala Arg Val Glu Tyr Glu Met Gln Trp Gly His Ile Gly
405 410 415
tgg tcc gtt cct gcc gcc ttc ggt tat gcc gtc ggt gct ccg gaa cgt 1296
Trp Ser Val Pro Ala Ala Phe Gly Tyr Ala Val Gly Ala Pro Glu Arg
420 425 430
cgc aac atc ctc atg gtt ggt gat ggt tcc ttc cag ctg acg gct cag 1344
Arg Asn Ile Leu Met Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln
435 440 445
gaa gtc gct cag atg gtt cgc ctg aaa ctg ccg gtt atc atc ttc ttg 1392
Glu Val Ala Gln Met Val Arg Leu Lys Leu Pro Val Ile Ile Phe Leu
450 455 460
atc aat aac tat ggt tac acc atc gaa gtt atg atc cat gat ggt ccg 1440
Ile Asn Asn Tyr Gly Tyr Thr Ile Glu Val Met Ile His Asp Gly Pro
465 470 475 480
tac aac aac atc aag aac tgg gat tat gcc ggt ctg atg gaa gtg ttc 1488
Tyr Asn Asn Ile Lys Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe
485 490 495
aac ggt aac ggt ggt tat gac agc ggt gct ggt aaa ggc ctg aag gct 1536
Asn Gly Asn Gly Gly Tyr Asp Ser Gly Ala Gly Lys Gly Leu Lys Ala
500 505 510
aaa acc ggt ggc gaa ctg gca gaa gct atc aag gtt gct ctg gca aac 1584
Lys Thr Gly Gly Glu Leu Ala Glu Ala Ile Lys Val Ala Leu Ala Asn
515 520 525
acc gac ggc cca acc ctg atc gaa tgc ttc atc ggt cgt gaa gac tgc 1632
Thr Asp Gly Pro Thr Leu Ile Glu Cys Phe Ile Gly Arg Glu Asp Cys
530 535 540
act gaa gaa ttg gtc aaa tgg ggt aag cgc gtt gct gcc gcc aac agc 1680
Thr Glu Glu Leu Val Lys Trp Gly Lys Arg Val Ala Ala Ala Asn Ser
545 550 555 560
cgt aag cct gtt aac aag ctc ctc tag 1707
Arg Lys Pro Val Asn Lys Leu Leu
565
<210>19
<211>568
<212>PRT
<213>运动发酵单胞菌
<400>19
Met Ser Tyr Thr Val Gly Thr Tyr Leu Ala Glu Arg Leu Val Gln Ile
1 5 10 15
Gly Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu
20 25 30
Leu Asp Asn Leu Leu Leu Asn Lys Asn Met Glu Gln Val Tyr Cys Cys
35 40 45
Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Lys
50 55 60
Gly Ala Ala Ala Ala Val Val Thr Tyr Ser Val Gly Ala Leu Ser Ala
65 70 75 80
Phe Asp Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu
85 90 95
Ile Ser Gly Ala Pro Asn Asn Asn Asp His Ala Ala Gly His Val Leu
100 105 110
His His Ala Leu Gly Lys Thr Asp Tyr His Tyr Gln Leu Glu Met Ala
115 120 125
Lys Asn Ile Thr Ala Ala Ala Glu Ala Ile Tyr Thr Pro Glu Glu Ala
130 135 140
Pro Ala Lys Ile Asp His Val Ile Lys Thr Ala Leu Arg Glu Lys Lys
145 150 155 160
Pro Val Tyr Leu Glu Ile Ala Cys Asn Ile Ala Ser Met Pro Cys Ala
165 170 175
Ala Pro Gly Pro Ala Ser Ala Leu Phe Asn Asp Glu Ala Ser Asp Glu
180 185 190
Ala Ser Leu Asn Ala Ala Val Glu Glu Thr Leu Lys Phe Ile Ala Asn
195 200 205
Arg Asp Lys Val Ala Val Leu Val Gly Ser Lys Leu Arg Ala Ala Gly
210 215 220
Ala Glu Glu Ala Ala Val Lys Phe Ala Asp Ala Leu Gly Gly Ala Val
225 230 235 240
Ala Thr Met Ala Ala Ala Lys Ser Phe Phe Pro Glu Glu Asn Pro His
245 250 255
Tyr Ile Gly Thr Ser Trp Gly Glu Val Ser Tyr Pro Gly Val Glu Lys
260 265 270
Thr Met Lys Glu Ala Asp Ala Val Ile Ala Leu Ala Pro Val Phe Asn
275 280 285
Asp Tyr Ser Thr Thr Gly Trp Thr Asp Ile Pro Asp Pro Lys Lys Leu
290 295 300
Val Leu Ala Glu Pro Arg Ser Val Val Val Asn Gly Ile Arg Phe Pro
305 310 315 320
Ser Val His Leu Lys Asp Tyr Leu Thr Arg Leu Ala Gln Lys Val Ser
325 330 335
Lys Lys Thr Gly Ala Leu Asp Phe Phe Lys Ser Leu Asn Ala Gly Glu
340 345 350
Leu Lys Lys Ala Ala Pro Ala Asp Pro Ser Ala Pro Leu Val Asn Ala
355 360 365
Glu Ile Ala Arg Gln Val Glu Ala Leu Leu Thr Pro Asn Thr Thr Val
370 375 380
Ile Ala Glu Thr Gly Asp Ser Trp Phe Asn Ala Gln Arg Met Lys Leu
385 390 395 400
Pro Asn Gly Ala Arg Val Glu Tyr Glu Met Gln Trp Gly His Ile Gly
405 410 415
Trp Ser Val Pro Ala Ala Phe Gly Tyr Ala Val Gly Ala Pro Glu Arg
420 425 430
Arg Asn Ile Leu Met Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln
435 440 445
Glu Val Ala Gln Met Val Arg Leu Lys Leu Pro Val Ile Ile Phe Leu
450 455 460
Ile Asn Asn Tyr Gly Tyr Thr Ile Glu Val Met Ile His Asp Gly Pro
465 470 475 480
Tyr Asn Asn Ile Lys Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe
485 490 495
Asn Gly Asn Gly Gly Tyr Asp Ser Gly Ala Gly Lys Gly Leu Lys Ala
500 505 510
Lys Thr Gly Gly Glu Leu Ala Glu Ala Ile Lys Val Ala Leu Ala Asn
515 520 525
Thr Asp Gly Pro Thr Leu Ile Glu Cys Phe Ile Gly Arg Glu Asp Cys
530 535 540
Thr Glu Glu Leu Val Lys Trp Gly Lys Arg Val Ala Ala Ala Asn Ser
545 550 555 560
Arg Lys Pro Val Asn Lys Leu Leu
565
<210>20
<211>1692
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<220>
<221>CDS
<222>(1)..(1692)
<223>
<400>20
atg tct gaa att act ttg ggt aaa tat ttg ttc gaa aga tta aag caa 48
Met Ser Glu Ile Thr Leu Gly Lys Tyr Leu Phe Glu Arg Leu Lys Gln
1 5 10 15
gtc aac gtt aac acc gtt ttc ggt ttg cca ggt gac ttc aac ttg tcc 96
Val Asn Val Asn Thr Val Phe Gly Leu Pro Gly Asp Phe Asn Leu Ser
20 25 30
ttg ttg gac aag atc tac gaa gtt gaa ggt atg aga tgg gct ggt aac 144
Leu Leu Asp Lys Ile Tyr Glu Val Glu Gly Met Arg Trp Ala Gly Asn
35 40 45
gcc aac gaa ttg aac gct gct tac gcc gct gat ggt tac gct cgt atc 192
Ala Asn Glu Leu Asn Ala Ala Tyr Ala Ala Asp Gly Tyr Ala Arg Ile
50 55 60
aag ggt atg tct tgt atc atc acc acc ttc ggt gtc ggt gaa ttg tct 240
Lys Gly Met Ser Cys Ile Ile Thr Thr Phe Gly Val Gly Glu Leu Ser
65 70 75 80
gct ttg aac ggt att gcc ggt tct tac gct gaa cac gtc ggt gtt ttg 288
Ala Leu Asn Gly Ile Ala Gly Ser Tyr Ala Glu His Val Gly Val Leu
85 90 95
cac gtt gtt ggt gtc cca tcc atc tct gct caa gct aag caa ttg ttg 336
His Val Val Gly Val Pro Ser Ile Ser Ala Gln Ala Lys Gln Leu Leu
100 105 110
ttg cac cac acc ttg ggt aac ggt gac ttc act gtt ttc cac aga atg 384
Leu His His Thr Leu Gly Asn Gly Asp Phe Thr Val Phe His Arg Met
115 120 125
tct gcc aac att tct gaa acc act gct atg atc act gac att gct acc 432
Ser Ala Asn Ile Ser Glu Thr Thr Ala Met Ile Thr Asp Ile Ala Thr
130 135 140
gcc cca gct gaa att gac aga tgt atc aga acc act tac gtc acc caa 480
Ala Pro Ala Glu Ile Asp Arg Cys Ile Arg Thr Thr Tyr Val Thr Gln
145 150 155 160
aga cca gtc tac tta ggt ttg cca gct aac ttg gtc gac ttg aac gtc 528
Arg Pro Val Tyr Leu Gly Leu Pro Ala Asn Leu Val Asp Leu Asn Val
165 170 175
cca gct aag ttg ttg caa act cca att gac atg tct ttg aag cca aac 576
Pro Ala Lys Leu Leu Gln Thr Pro Ile Asp Met Ser Leu Lys Pro Asn
180 185 190
gat gct gaa tcc gaa aag gaa gtc att gac acc atc ttg gct ttg gtc 624
Asp Ala Glu Ser Glu Lys Glu Val Ile Asp Thr Ile Leu Ala Leu Val
195 200 205
aag gat gct aag aac cca gtt atc ttg gct gat gct tgt tgt tcc aga 672
Lys Asp Ala Lys Asn Pro Val Ile Leu Ala Asp Ala Cys Cys Ser Arg
210 215 220
cac gac gtc aag gct gaa act aag aag ttg att gac ttg act caa ttc 720
His Asp Val Lys Ala Glu Thr Lys Lys Leu Ile Asp Leu Thr Gln Phe
225 230 235 240
cca gct ttc gtc acc cca atg ggt aag ggt tcc att gac gaa caa cac 768
Pro Ala Phe Val Thr Pro Met Gly Lys Gly Ser Ile Asp Glu Gln His
245 250 255
cca aga tac ggt ggt gtt tac gtc ggt acc ttg tcc aag cca gaa gtt 816
Pro Arg Tyr Gly Gly Val Tyr Val Gly Thr Leu Ser Lys Pro Glu Val
260 265 270
aag gaa gcc gtt gaa tct gct gac ttg att ttg tct gtc ggt gct ttg 864
Lys Glu Ala Val Glu Ser Ala Asp Leu Ile Leu Ser Val Gly Ala Leu
275 280 285
ttg tct gat ttc aac acc ggt tct ttc tct tac tct tac aag acc aag 912
Leu Ser Asp Phe Asn Thr Gly Ser Phe Ser Tyr Ser Tyr Lys Thr Lys
290 295 300
aac att gtc gaa ttc cac tcc gac cac atg aag atc aga aac gcc act 960
Asn Ile Val Glu Phe His Ser Asp His Met Lys Ile Arg Asn Ala Thr
305 310 315 320
ttc cca ggt gtc caa atg aaa ttc gtt ttg caa aag ttg ttg acc act 1008
Phe Pro Gly Val Gln Met Lys Phe Val Leu Gln Lys Leu Leu Thr Thr
325 330 335
att gct gac gcc gct aag ggt tac aag cca gtt gct gtc cca gct aga 1056
Ile Ala Asp Ala Ala Lys Gly Tyr Lys Pro Val Ala Val Pro Ala Arg
340 345 350
act cca gct aac gct gct gtc cca gct tct acc cca ttg aag caa gaa 1104
Thr Pro Ala Asn Ala Ala Val Pro Ala Ser Thr Pro Leu Lys Gln Glu
355 360 365
tgg atg tgg aac caa ttg ggt aac ttc ttg caa gaa ggt gat gtt gtc 1152
Trp Met Trp Asn Gln Leu Gly Asn Phe Leu Gln Glu Gly Asp Val Val
370 375 380
att gct gaa acc ggt acc tcc gct ttc ggt atc aac caa acc act ttc 1200
Ile Ala Glu Thr Gly Thr Ser Ala Phe Gly Ile Asn Gln Thr Thr Phe
385 390 395 400
cca aac aac acc tac ggt atc tct caa gtc tta tgg ggt tcc att ggt 1248
Pro Asn Asn Thr Tyr Gly Ile Ser Gln Val Leu Trp Gly Ser Ile Gly
405 410 415
ttc acc act ggt gct acc ttg ggt gct gct ttc gct gct gaa gaa att 1296
Phe Thr Thr Gly Ala Thr Leu Gly Ala Ala Phe Ala Ala Glu Glu Ile
420 425 430
gat cca aag aag aga gtt atc tta ttc att ggt gac ggt tct ttg caa 1344
Asp Pro Lys Lys Arg Val Ile Leu Phe Ile Gly Asp Gly Ser Leu Gln
435 440 445
ttg act gtt caa gaa atc tcc acc atg atc aga tgg ggc ttg aag cca 1392
Leu Thr Val Gln Glu Ile Ser Thr Met Ile Arg Trp Gly Leu Lys Pro
450 455 460
tac ttg ttc gtc ttg aac aac gat ggt tac acc att gaa aag ttg att 1440
Tyr Leu Phe Val Leu Asn Asn Asp Gly Tyr Thr Ile Glu Lys Leu Ile
465 470 475 480
cac ggt cca aag gct caa tac aac gaa att caa ggt tgg gac cac cta 1488
His Gly Pro Lys Ala Gln Tyr Asn Glu Ile Gln Gly Trp Asp His Leu
485 490 495
tcc ttg ttg cca act ttc ggt gct aag gac tat gaa acc cac aga gtc 1536
Ser Leu Leu Pro Thr Phe Gly Ala Lys Asp Tyr Glu Thr His Arg Val
500 505 510
gct acc acc ggt gaa tgg gac aag ttg acc caa gac aag tct ttc aac 1584
Ala Thr Thr Gly Glu Trp Asp Lys Leu Thr Gln Asp Lys Ser Phe Asn
515 520 525
gac aac tct aag atc aga atg att gaa atc atg ttg cca gtc ttc gat 1632
Asp Asn Ser Lys Ile Arg Met Ile Glu Ile Met Leu Pro Val Phe Asp
530 535 540
gct cca caa aac ttg gtt gaa caa gct aag ttg act gct gct acc aac 1680
Ala Pro Gln Asn Leu Val Glu Gln Ala Lys Leu Thr Ala Ala Thr Asn
545 550 555 560
gct aag caa taa 1692
Ala Lys Gln
<210>21
<211>563
<212>PRT
<213>酿酒酵母
<400>21
Met Ser Glu Ile Thr Leu Gly Lys Tyr Leu Phe Glu Arg Leu Lys Gln
1 5 10 15
Val Asn Val Asn Thr Val Phe Gly Leu Pro Gly Asp Phe Asn Leu Ser
20 25 30
Leu Leu Asp Lys Ile Tyr Glu Val Glu Gly Met Arg Trp Ala Gly Asn
35 40 45
Ala Asn Glu Leu Asn Ala Ala Tyr Ala Ala Asp Gly Tyr Ala Arg Ile
50 55 60
Lys Gly Met Ser Cys Ile Ile Thr Thr Phe Gly Val Gly Glu Leu Ser
65 70 75 80
Ala Leu Asn Gly Ile Ala Gly Ser Tyr Ala Glu His Val Gly Val Leu
85 90 95
His Val Val Gly Val Pro Ser Ile Ser Ala Gln Ala Lys Gln Leu Leu
100 105 110
Leu His His Thr Leu Gly Asn Gly Asp Phe Thr Val Phe His Arg Met
115 120 125
Ser Ala Asn Ile Ser Glu Thr Thr Ala Met Ile Thr Asp Ile Ala Thr
130 135 140
Ala Pro Ala Glu Ile Asp Arg Cys Ile Arg Thr Thr Tyr Val Thr Gln
145 150 155 160
Arg Pro Val Tyr Leu Gly Leu Pro Ala Asn Leu Val Asp Leu Asn Val
165 170 175
Pro Ala Lys Leu Leu Gln Thr Pro Ile Asp Met Ser Leu Lys Pro Asn
180 185 190
Asp Ala Glu Ser Glu Lys Glu Val Ile Asp Thr Ile Leu Ala Leu Val
195 200 205
Lys Asp Ala Lys Asn Pro Val Ile Leu Ala Asp Ala Cys Cys Ser Arg
210 215 220
His Asp Val Lys Ala Glu Thr Lys Lys Leu Ile Asp Leu Thr Gln Phe
225 230 235 240
Pro Ala Phe Val Thr Pro Met Gly Lys Gly Ser Ile Asp Glu Gln His
245 250 255
Pro Arg Tyr Gly Gly Val Tyr Val Gly Thr Leu Ser Lys Pro Glu Val
260 265 270
Lys Glu Ala Val Glu Ser Ala Asp Leu Ile Leu Ser Val Gly Ala Leu
275 280 285
Leu Ser Asp Phe Asn Thr Gly Ser Phe Ser Tyr Ser Tyr Lys Thr Lys
290 295 300
Asn Ile Val Glu Phe His Ser Asp His Met Lys Ile Arg Asn Ala Thr
305 310 315 320
Phe Pro Gly Val Gln Met Lys Phe Val Leu Gln Lys Leu Leu Thr Thr
325 330 335
Ile Ala Asp Ala Ala Lys Gly Tyr Lys Pro Val Ala Val Pro Ala Arg
340 345 350
Thr Pro Ala Asn Ala Ala Val Pro Ala Ser Thr Pro Leu Lys Gln Glu
355 360 365
Trp Met Trp Asn Gln Leu Gly Asn Phe Leu Gln Glu Gly Asp Val Val
370 375 380
Ile Ala Glu Thr Gly Thr Ser Ala Phe Gly Ile Asn Gln Thr Thr Phe
385 390 395 400
Pro Asn Asn Thr Tyr Gly Ile Ser Gln Val Leu Trp Gly Ser Ile Gly
405 410 415
Phe Thr Thr Gly Ala Thr Leu Gly Ala Ala Phe Ala Ala Glu Glu Ile
420 425 430
Asp Pro Lys Lys Arg Val Ile Leu Phe Ile Gly Asp Gly Ser Leu Gln
435 440 445
Leu Thr Val Gln Glu Ile Ser Thr Met Ile Arg Trp Gly Leu Lys Pro
450 455 460
Tyr Leu Phe Val Leu Asn Asn Asp Gly Tyr Thr Ile Glu Lys Leu Ile
465 470 475 480
His Gly Pro Lys Ala Gln Tyr Asn Glu Ile Gln Gly Trp Asp His Leu
485 490 495
Ser Leu Leu Pro Thr Phe Gly Ala Lys Asp Tyr Glu Thr His Arg Val
500 505 510
Ala Thr Thr Gly Glu Trp Asp Lys Leu Thr Gln Asp Lys Ser Phe Asn
515 520 525
Asp Asn Ser Lys Ile Arg Met Ile Glu Ile Met Leu Pro Val Phe Asp
530 535 540
Ala Pro Gln Asn Leu Val Glu Gln Ala Lys Leu Thr Ala Ala Thr Asn
545 550 555 560
Ala Lys Gln
<210>22
<211>33
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>22
tctttaatta atgggttgtc cgtcattcat ata 33
<210>23
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>23
ctaaagcttt taggccagag tggtcttgcg cg 32
<210>24
<211>1674
<212>DNA
<213>巴氏醋杆菌(Acetobacter pasteurianus)
<220>
<221>CDS
<222>(1)..(1674)
<223>
<400>24
gtg acc tat act gtt ggc atg tat ctt gca gaa cgc ctt gta cag atc 48
Val Thr Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Val Gln Ile
1 5 10 15
ggg ctg aag cat cac ttc gcc gtg ggc ggc gac tac aat ctc gtt ctt 96
Gly Leu Lys His His Phe Ala Val Gly Gly Asp Tyr Asn Leu Val Leu
20 25 30
ctg gat cag ttg ctc ctc aac aag gac atg aaa cag atc tat tgc tgc 144
Leu Asp Gln Leu Leu Leu Asn Lys Asp Met Lys Gln Ile Tyr Cys Cys
35 40 45
aat gag ttg aac tgt ggc ttc agc gcg gaa ggc tac gcc cgt tct aac 192
Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ser Asn
50 55 60
ggg gct gcg gca gcg gtt gtc acc ttc agc gtt ggc gcc att tcc gcc 240
Gly Ala Ala Ala Ala Val Val Thr Phe Ser Val Gly Ala Ile Ser Ala
65 70 75 80
atg aac gcc ctc ggc ggc gcc tat gcc gaa aac ctg ccg gtt atc ctg 288
Met Asn Ala Leu Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu
85 90 95
att tcc ggc gcg ccc aac agc aat gat cag ggc aca ggt cat atc ctg 336
Ile Ser Gly Ala Pro Asn Ser Asn Asp Gln Gly Thr Gly His Ile Leu
100 105 110
cat cac aca atc ggc aag acg gat tac agc tac cag ctt gaa atg gcc 384
His His Thr Ile Gly Lys Thr Asp Tyr Ser Tyr Gln Leu Glu Met Ala
115 120 125
cgt cag gtc acc tgt gcc gcc gaa agc att acc gac gct cac tcc gcc 432
Arg Gln Val Thr Cys Ala Ala Glu Ser Ile Thr Asp Ala His Ser Ala
130 135 140
ccg gcc aag att gac cac gtc att cgc acg gcg ctg cgc gag cgt aag 480
Pro Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys
145 150 155 160
ccg gcc tat ctg gac atc gcg tgc aac att gcc tcc gag ccc tgc gtg 528
Pro Ala Tyr Leu Asp Ile Ala Cys Asn Ile Ala Ser Glu Pro Cys Val
165 170 175
cgg cct ggc cct gtc agc agc ctg ctg tcc gag cct gaa atc gac cac 576
Arg Pro Gly Pro Val Ser Ser Leu Leu Ser Glu Pro Glu Ile Asp His
180 185 190
acg agc ctg aag gcc gca gtg gac gcc acg gtt gcc ttg ctg aaa aat 624
Thr Ser Leu Lys Ala Ala Val Asp Ala Thr Val Ala Leu Leu Lys Asn
195 200 205
cgg cca gcc ccc gtc atg ctg ctg ggc agc aag ctg cgg gcc gcc aac 672
Arg Pro Ala Pro Val Met Leu Leu Gly Ser Lys Leu Arg Ala Ala Asn
210 215 220
gca ctg gcc gca acc gaa acg ctg gca gac aag ctg caa tgc gcg gtg 720
Ala Leu Ala Ala Thr Glu Thr Leu Ala Asp Lys Leu Gln Cys Ala Val
225 230 235 240
acc atc atg gcg gcc gcg aaa ggc ttt ttc ccc gaa gac cac gcg ggt 768
Thr Ile Met Ala Ala Ala Lys Gly Phe Phe Pro Glu Asp His Ala Gly
245 250 255
ttc cgc ggc ctg tac tgg ggc gaa gtc tcg aac ccc ggc gtg cag gaa 816
Phe Arg Gly Leu Tyr Trp Gly Glu Val Ser Asn Pro Gly Val Gln Glu
260 265 270
ctg gtg gag acc tcc gac gca ctg ctg tgc atc gcc ccc gta ttc aac 864
Leu Val Glu Thr Ser Asp Ala Leu Leu Cys Ile Ala Pro Val Phe Asn
275 280 285
gac tat tca aca gtc ggc tgg tcg ggc atg ccc aag ggc ccc aat gtg 912
Asp Tyr Ser Thr Val Gly Trp Ser Gly Met Pro Lys Gly Pro Asn Val
290 295 300
att ctg gct gag ccc gac cgc gta acg gtc gat ggc cgc gcc tat gac 960
Ile Leu Ala Glu Pro Asp Arg Val Thr Val Asp Gly Arg Ala Tyr Asp
305 310 315 320
ggc ttt acc ctg cgc gcc ttc ctg cag gct ctg gcg gaa aaa gcc ccc 1008
Gly Phe Thr Leu Arg Ala Phe Leu Gln Ala Leu Ala Glu Lys Ala Pro
325 330 335
gcg cgc ccg gcc tcc gca cag aaa agc agc gtc ccg acg tgc tcg ctc 1056
Ala Arg Pro Ala Ser Ala Gln Lys Ser Ser Val Pro Thr Cys Ser Leu
340 345 350
acc gcg aca tcc gat gaa gcc ggt ctg acg aat gac gaa atc gtc cgt 1104
Thr Ala Thr Ser Asp Glu Ala Gly Leu Thr Asn Asp Glu Ile Val Arg
355 360 365
cat atc aac gcc ctg ctg aca tca aac acg acg ctg gtg gca gaa acc 1152
His Ile Asn Ala Leu Leu Thr Ser Asn Thr Thr Leu Val Ala Glu Thr
370 375 380
ggc gat tca tgg ttc aat gcc atg cgc atg acc ctg gcc ggt gcg cgc 1200
Gly Asp Ser Trp Phe Asn Ala Met Arg Met Thr Leu Ala Gly Ala Arg
385 390 395 400
gtg gaa ctg gaa atg cag tgg ggc cat atc ggc tgg tcc gtg ccc tcc 1248
Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser
405 410 415
gcg ttc ggc aat gcc atg ggc tcg cag gac cgc cag cat gtg gtg atg 1296
Ala Phe Gly Asn Ala Met Gly Ser Gln Asp Arg Gln His Val Val Met
420 425 430
gta ggc gat ggc tcc ttc cag ctt acc gcg cag gaa gtg gct cag atg 1344
Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met
435 440 445
gtg cgc tac gaa ctg ccc gtc att atc ttt ctg atc aac aac cgt ggc 1392
Val Arg Tyr Glu Leu Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly
450 455 460
tat gtc att gaa atc gcc att cat gac ggc ccg tac aac tat atc aag 1440
Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys
465 470 475 480
aac tgg gat tac gcc ggc ctg atg gaa gtc ttc aac gcc gga gaa ggc 1488
Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe Asn Ala Gly Glu Gly
485 490 495
cat gga ctt ggc ctg aaa gcc acc acc ccg aag gaa ctg aca gaa gcc 1536
His Gly Leu Gly Leu Lys Ala Thr Thr Pro Lys Glu Leu Thr Glu Ala
500 505 510
atc gcc agg gca aaa gcc aat acc cgc ggc ccg acg ctg atc gaa tgc 1584
Ile Ala Arg Ala Lys Ala Asn Thr Arg Gly Pro Thr Leu Ile Glu Cys
515 520 525
cag atc gac cgc acg gac tgc acg gat atg ctg gtt caa tgg ggc cgc 1632
Gln Ile Asp Arg Thr Asp Cys Thr Asp Met Leu Val Gln Trp Gly Arg
530 535 540
aag gtt gcc tca acc aac gcg cgc aag acc act ctg gcc tga 1674
Lys Val Ala Ser Thr Asn Ala Arg Lys Thr Thr Leu Ala
545 550 555
<210>25
<211>557
<212>PRT
<213>巴氏醋杆菌
<400>25
Val Thr Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Val Gln Ile
1 5 10 15
Gly Leu Lys His His Phe Ala Val Gly Gly Asp Tyr Asn Leu Val Leu
20 25 30
Leu Asp Gln Leu Leu Leu Asn Lys Asp Met Lys Gln Ile Tyr Cys Cys
35 40 45
Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ser Asn
50 55 60
Gly Ala Ala Ala Ala Val Val Thr Phe Ser Val Gly Ala Ile Ser Ala
65 70 75 80
Met Asn Ala Leu Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu
85 90 95
Ile Ser Gly Ala Pro Asn Ser Asn Asp Gln Gly Thr Gly His Ile Leu
100 105 110
His His Thr Ile Gly Lys Thr Asp Tyr Ser Tyr Gln Leu Glu Met Ala
115 120 125
Arg Gln Val Thr Cys Ala Ala Glu Ser Ile Thr Asp Ala His Ser Ala
130 135 140
Pro Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys
145 150 155 160
Pro Ala Tyr Leu Asp Ile Ala Cys Asn Ile Ala Ser Glu Pro Cys Val
165 170 175
Arg Pro Gly Pro Val Ser Ser Leu Leu Ser Glu Pro Glu Ile Asp His
180 185 190
Thr Ser Leu Lys Ala Ala Val Asp Ala Thr Val Ala Leu Leu Lys Asn
195 200 205
Arg Pro Ala Pro Val Met Leu Leu Gly Ser Lys Leu Arg Ala Ala Asn
210 215 220
Ala Leu Ala Ala Thr Glu Thr Leu Ala Asp Lys Leu Gln Cys Ala Val
225 230 235 240
Thr Ile Met Ala Ala Ala Lys Gly Phe Phe Pro Glu Asp His Ala Gly
245 250 255
Phe Arg Gly Leu Tyr Trp Gly Glu Val Ser Asn Pro Gly Val Gln Glu
260 265 270
Leu Val Glu Thr Ser Asp Ala Leu Leu Cys Ile Ala Pro Val Phe Asn
275 280 285
Asp Tyr Ser Thr Val Gly Trp Ser Gly Met Pro Lys Gly Pro Asn Val
290 295 300
Ile Leu Ala Glu Pro Asp Arg Val Thr Val Asp Gly Arg Ala Tyr Asp
305 310 315 320
Gly Phe Thr Leu Arg Ala Phe Leu Gln Ala Leu Ala Glu Lys Ala Pro
325 330 335
Ala Arg Pro Ala Ser Ala Gln Lys Ser Ser Val Pro Thr Cys Ser Leu
340 345 350
Thr Ala Thr Ser Asp Glu Ala Gly Leu Thr Asn Asp Glu Ile Val Arg
355 360 365
His Ile Asn Ala Leu Leu Thr Ser Asn Thr Thr Leu Val Ala Glu Thr
370 375 380
Gly Asp Ser Trp Phe Asn Ala Met Arg Met Thr Leu Ala Gly Ala Arg
385 390 395 400
Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser
405 410 415
Ala Phe Gly Asn Ala Met Gly Ser Gln Asp Arg Gln His Val Val Met
420 425 430
Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met
435 440 445
Val Arg Tyr Glu Leu Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly
450 455 460
Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys
465 470 475 480
Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe Asn Ala Gly Glu Gly
485 490 495
His Gly Leu Gly Leu Lys Ala Thr Thr Pro Lys Glu Leu Thr Glu Ala
500 505 510
Ile Ala Arg Ala Lys Ala Asn Thr Arg Gly Pro Thr Leu Ile Glu Cys
515 520 525
Gln Ile Asp Arg Thr Asp Cys Thr Asp Met Leu Val Gln Trp Gly Arg
530 535 540
Lys Val Ala Ser Thr Asn Ala Arg Lys Thr Thr Leu Ala
545 550 555
<210>26
<211>32
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>26
atcttaatta atgtataccg ttggtatgta ct 32
<210>27
<211>34
<212>DNA
<213>人工序列
<220>
<223>人工序列
<400>27
tatgcggccg cttacgcttg tggtttgcga gagt 34
<210>28
<211>1671
<212>DNA
<213>棕榈发酵细菌(Zymobacter palmae)
<220>
<221>CDS
<222>(1)..(1671)
<223>
<400>28
atg tat acc gtt ggt atg tac ttg gca gaa cgc cta gcc cag atc ggc 48
Met Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Ala Gln Ile Gly
1 5 10 15
ctg aaa cac cac ttt gcc gtg gcc ggt gac tac aac ctg gtg ttg ctt 96
Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu Leu
20 25 30
gat cag ctc ctg ctg aac aaa gac atg gag cag gtc tac tgc tgt aac 144
Asp Gln Leu Leu Leu Asn Lys Asp Met Glu Gln Val Tyr Cys Cys Asn
35 40 45
gaa ctt aac tgc ggc ttt agc gcc gaa ggt tac gct cgt gca cgt ggt 192
Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Arg Gly
50 55 60
gcc gcc gct gcc atc gtc acg ttc agc gta ggt gct atc tct gca atg 240
Ala Ala Ala Ala Ile Val Thr Phe Ser Val Gly Ala Ile Ser Ala Met
65 70 75 80
aac gcc atc ggt ggc gcc tat gca gaa aac ctg ccg gtc atc ctg atc 288
Asn Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu Ile
85 90 95
tct ggc tca ccg aac acc aat gac tac ggc aca ggc cac atc ctg cac 336
Ser Gly Ser Pro Asn Thr Asn Asp Tyr Gly Thr Gly His Ile Leu His
100 105 110
cac acc att ggt act act gac tat aac tat cag ctg gaa atg gta aaa 384
His Thr Ile Gly Thr Thr Asp Tyr Asn Tyr Gln Leu Glu Met Val Lys
115 120 125
cac gtt acc tgc gca cgt gaa agc atc gtt tct gcc gaa gaa gca ccg 432
His Val Thr Cys Ala Arg Glu Ser Ile Val Ser Ala Glu Glu Ala Pro
130 135 140
gca aaa atc gac cac gtc atc cgt acg gct cta cgt gaa cgc aaa ccg 480
Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys Pro
145 150 155 160
gct tat ctg gaa atc gca tgc aac gtc gct ggc gct gaa tgt gtt cgt 528
Ala Tyr Leu Glu Ile Ala Cys Asn Val Ala Gly Ala Glu Cys Val Arg
165 170 175
ccg ggc ccg atc aat agc ctg ctg cgt gaa ctc gaa gtt gac cag acc 576
Pro Gly Pro Ile Asn Ser Leu Leu Arg Glu Leu Glu Val Asp Gln Thr
180 185 190
agt gtc act gcc gct gta gat gcc gcc gta gaa tgg ctg cag gac cgc 624
Ser Val Thr Ala Ala Val Asp Ala Ala Val Glu Trp Leu Gln Asp Arg
195 200 205
cag aac gtc gtc atg ctg gtc ggt agc aaa ctg cgt gcc gct gcc gct 672
Gln Asn Val Val Met Leu Val Gly Ser Lys Leu Arg Ala Ala Ala Ala
210 215 220
gaa aaa cag gct gtt gcc cta gcg gac cgc ctg ggc tgc gct gtc acg 720
Glu Lys Gln Ala Val Ala Leu Ala Asp Arg Leu Gly Cys Ala Val Thr
225 230 235 240
atc atg gct gcc gaa aaa ggc ttc ttc ccg gaa gat cat ccg aac ttc 768
Ile Met Ala Ala Glu Lys Gly Phe Phe Pro Glu Asp His Pro Asn Phe
245 250 255
cgc ggc ctg tac tgg ggt gaa gtc agc tcc gaa ggt gca cag gaa ctg 816
Arg Gly Leu Tyr Trp Gly Glu Val Ser Ser Glu Gly Ala Gln Glu Leu
260 265 270
gtt gaa aac gcc gat gcc atc ctg tgt ctg gca ccg gta ttc aac gac 864
Val Glu Asn Ala Asp Ala Ile Leu Cys Leu Ala Pro Val Phe Asn Asp
275 280 285
tat gct acc gtt ggc tgg aac tcc tgg ccg aaa ggc gac aat gtc atg 912
Tyr Ala Thr Val Gly Trp Asn Ser Trp Pro Lys Gly Asp Asn Val Met
290 295 300
gtc atg gac acc gac cgc gtc act ttc gca gga cag tcc ttc gaa ggt 960
Val Met Asp Thr Asp Arg Val Thr Phe Ala Gly Gln Ser Phe Glu Gly
305 310 315 320
ctg tca ttg agc acc ttc gcc gca gca ctg gct gag aaa gca cct tct 1008
Leu Ser Leu Ser Thr Phe Ala Ala Ala Leu Ala Glu Lys Ala Pro Ser
325 330 335
cgc ccg gca acg act caa ggc act caa gca ccg gta ctg ggt att gag 1056
Arg Pro Ala Thr Thr Gln Gly Thr Gln Ala Pro Val Leu Gly Ile Glu
340 345 350
gcc gca gag ccc aat gca ccg ctg acc aat gac gaa atg acg cgt cag 1104
Ala Ala Glu Pro Asn Ala Pro Leu Thr Asn Asp Glu Met Thr Arg Gln
355 360 365
atc cag tcg ctg atc act tcc gac act act ctg aca gca gaa aca ggt 1152
Ile Gln Ser Leu Ile Thr Ser Asp Thr Thr Leu Thr Ala Glu Thr Gly
370 375 380
gac tct tgg ttc aac gct tct cgc atg ccg att cct ggc ggt gct cgt 1200
Asp Ser Trp Phe Asn Ala Ser Arg Met Pro Ile Pro Gly Gly Ala Arg
385 390 395 400
gtc gaa ctg gaa atg caa tgg ggt cat atc ggt tgg tcc gta cct tct 1248
Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser
405 410 415
gca ttc ggt aac gcc gtt ggt tct ccg gag cgt cgc cac atc atg atg 1296
Ala Phe Gly Asn Ala Val Gly Ser Pro Glu Arg Arg His Ile Met Met
420 425 430
gtc ggt gat ggc tct ttc cag ctg act gct caa gaa gtt gct cag atg 1344
Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met
435 440 445
atc cgc tat gaa atc ccg gtc atc atc ttc ctg atc aac aac cgc ggt 1392
Ile Arg Tyr Glu Ile Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly
450 455 460
tac gtc atc gaa atc gct atc cat gac ggc cct tac aac tac atc aaa 1440
Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys
465 470 475 480
aac tgg aac tac gct ggc ctg atc gac gtc ttc aat gac gaa gat ggt 1488
Asn Trp Asn Tyr Ala Gly Leu Ile Asp Val Phe Asn Asp Glu Asp Gly
485 490 495
cat ggc ctg ggt ctg aaa gct tct act ggt gca gaa cta gaa ggc gct 1536
His Gly Leu Gly Leu Lys Ala Ser Thr Gly Ala Glu Leu Glu Gly Ala
500 505 510
atc aag aaa gca ctc gac aat cgt cgc ggt ccg acg ctg atc gaa tgt 1584
Ile Lys Lys Ala Leu Asp Asn Arg Arg Gly Pro Thr Leu Ile Glu Cys
515 520 525
aac atc gct cag gac gac tgc act gaa acc ctg att gct tgg ggt aaa 1632
Asn Ile Ala Gln Asp Asp Cys Thr Glu Thr Leu Ile Ala Trp Gly Lys
530 535 540
cgt gta gca gct acc aac tct cgc aaa cca caa gcg taa 1671
Arg Val Ala Ala Thr Asn Ser Arg Lys Pro Gln Ala
545 550 555
<210>29
<211>556
<212>PRT
<213>棕榈发酵细菌
<400>29
Met Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Ala Gln Ile Gly
1 5 10 15
Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu Leu
20 25 30
Asp Gln Leu Leu Leu Asn Lys Asp Met Glu Gln Val Tyr Cys Cys Asn
35 40 45
Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Arg Gly
50 55 60
Ala Ala Ala Ala Ile Val Thr Phe Ser Val Gly Ala Ile Ser Ala Met
65 70 75 80
Asn Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu Ile
85 90 95
Ser Gly Ser Pro Asn Thr Asn Asp Tyr Gly Thr Gly His Ile Leu His
100 105 110
His Thr Ile Gly Thr Thr Asp Tyr Asn Tyr Gln Leu Glu Met Val Lys
115 120 125
His Val Thr Cys Ala Arg Glu Ser Ile Val Ser Ala Glu Glu Ala Pro
130 135 140
Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys Pro
145 150 155 160
Ala Tyr Leu Glu Ile Ala Cys Asn Val Ala Gly Ala Glu Cys Val Arg
165 170 175
Pro Gly Pro Ile Asn Ser Leu Leu Arg Glu Leu Glu Val Asp Gln Thr
180 185 190
Ser Val Thr Ala Ala Val Asp Ala Ala Val Glu Trp Leu Gln Asp Arg
195 200 205
Gln Asn Val Val Met Leu Val Gly Ser Lys Leu Arg Ala Ala Ala Ala
210 215 220
Glu Lys Gln Ala Val Ala Leu Ala Asp Arg Leu Gly Cys Ala Val Thr
225 230 235 240
Ile Met Ala Ala Glu Lys Gly Phe Phe Pro Glu Asp His Pro Asn Phe
245 250 255
Arg Gly Leu Tyr Trp Gly Glu Val Ser Ser Glu Gly Ala Gln Glu Leu
260 265 270
Val Glu Asn Ala Asp Ala Ile Leu Cys Leu Ala Pro Val Phe Asn Asp
275 280 285
Tyr Ala Thr Val Gly Trp Asn Ser Trp Pro Lys Gly Asp Asn Val Met
290 295 300
Val Met Asp Thr Asp Arg Val Thr Phe Ala Gly Gln Ser Phe Glu Gly
305 310 315 320
Leu Ser Leu Ser Thr Phe Ala Ala Ala Leu Ala Glu Lys Ala Pro Ser
325 330 335
Arg Pro Ala Thr Thr Gln Gly Thr Gln Ala Pro Val Leu Gly Ile Glu
340 345 350
Ala Ala Glu Pro Asn Ala Pro Leu Thr Asn Asp Glu Met Thr Arg Gln
355 360 365
Ile Gln Ser Leu Ile Thr Ser Asp Thr Thr Leu Thr Ala Glu Thr Gly
370 375 380
Asp Ser Trp Phe Asn Ala Ser Arg Met Pro Ile Pro Gly Gly Ala Arg
385 390 395 400
Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser
405 410 415
Ala Phe Gly Asn Ala Val Gly Ser Pro Glu Arg Arg His Ile Met Met
420 425 430
Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met
435 440 445
Ile Arg Tyr Glu Ile Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly
450 455 460
Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys
465 470 475 480
Asn Trp Asn Tyr Ala Gly Leu Ile Asp Val Phe Asn Asp Glu Asp Gly
485 490 495
His Gly Leu Gly Leu Lys Ala Ser Thr Gly Ala Glu Leu Glu Gly Ala
500 505 510
Ile Lys Lys Ala Leu Asp Asn Arg Arg Gly Pro Thr Leu Ile Glu Cys
515 520 525
Asn Ile Ala Gln Asp Asp Cys Thr Glu Thr Leu Ile Ala Trp Gly Lys
530 535 540
Arg Val Ala Ala Thr Asn Ser Arg Lys Pro Gln Ala
545 550 555
<210>30
<211>32
<212>DNA
<213>人工序列
<400>30
ctattaatta atggcttcgg tacacggcac ca 32
<210>31
<211>34
<212>DNA
<213>人工序列
<400>31
tatgcggccg cttacttcac cgggcttacg gtgc 34
<210>32
<211>1587
<212>DNA
<213>恶臭假单胞菌(Pseudomonas putida)
<220>
<221>CDS
<222>(1)..(1584)
<223>
<400>32
atg gct tcg gta cac ggc acc aca tac gaa ctc ttg cga cgt caa ggc 48
Met Ala Ser Val His Gly Thr Thr Tyr Glu Leu Leu Arg Arg Gln Gly
1 5 10 15
atc gat acg gtc ttc ggc aat cct ggc tcg aac gag ctc ccg ttt ttg 96
Ile Asp Thr Val Phe Gly Asn Pro Gly Ser Asn Glu Leu Pro Phe Leu
20 25 30
aag gac ttt cca gag gac ttt cga tac atc ctg gct ttg cag gaa gcg 144
Lys Asp Phe Pro Glu Asp Phe Arg Tyr Ile Leu Ala Leu Gln Glu Ala
35 40 45
tgt gtg gtg ggc att gca gac ggc tat gcg caa gcc agt cgg aag ccg 192
Cys Val Val Gly Ile Ala Asp Gly Tyr Ala Gln Ala Ser Arg Lys Pro
50 55 60
gct ttc att aac ctg cat tct gct gct ggt acc ggc aat gct atg ggt 240
Ala Phe Ile Asn Leu His Ser Ala Ala Gly Thr Gly Asn Ala Met Gly
65 70 75 80
gca ctc agt aac gcc tgg aac tca cat tcc ccg ctg atc gtc act gcc 288
Ala Leu Ser Asn Ala Trp Asn Ser His Ser Pro Leu Ile Val Thr Ala
85 90 95
ggc cag cag acc agg gcg atg att ggc gtt gaa gct ctg ctg acc aac 336
Gly Gln Gln Thr Arg Ala Met Ile Gly Val Glu Ala Leu Leu Thr Asn
100 105 110
gtc gat gcc gcc aac ctg cca cga cca ctt gtc aaa tgg agc tac gag 384
Val Asp Ala Ala Asn Leu Pro Arg Pro Leu Val Lys Trp Ser Tyr Glu
115 120 125
ccc gca agc gca gca gaa gtc cct cat gcg atg agc agg gct atc cat 432
Pro Ala Ser Ala Ala Glu Val Pro His Ala Met Ser Arg Ala Ile His
130 135 140
atg gca agc atg gcg cca caa ggc cct gtc tat ctt tcg gtg cca tat 480
Met Ala Ser Met Ala Pro Gln Gly Pro Val Tyr Leu Ser Val Pro Tyr
145 150 155 160
gac gat tgg gat aag gat gct gat cct cag tcc cac cac ctt ttt gat 528
Asp Asp Trp Asp Lys Asp Ala Asp Pro Gln Ser His His Leu Phe Asp
165 170 175
cgc cat gtc agt tca tca gta cgc ctg aac gac cag gat ctc gat att 576
Arg His Val Ser Ser Ser Val Arg Leu Asn Asp Gln Asp Leu Asp Ile
180 185 190
ctg gtg aaa gct ctc aac agc gca tcc aac ccg gcg atc gtc ctg ggc 624
Leu Val Lys Ala Leu Asn Ser Ala Ser Asn Pro Ala Ile Val Leu Gly
195 200 205
ccg gac gtc gac gca gca aat gcg aac gca gac tgc gtc atg ttg gcc 672
Pro Asp Val Asp Ala Ala Asn Ala Asn Ala Asp Cys Val Met Leu Ala
210 215 220
gaa cgc ctc aaa gct ccg gtt tgg gtt gcg cca tcc gct cca cgc tgc 720
Glu Arg Leu Lys Ala Pro Val Trp Val Ala Pro Ser Ala Pro Arg Cys
225 230 235 240
cca ttc cct acc cgt cat cct tgc ttc cgt gga ttg atg cca gct ggc 768
Pro Phe Pro Thr Arg His Pro Cys Phe Arg Gly Leu Met Pro Ala Gly
245 250 255
atc gca gcg att tct cag ctg ctc gaa ggt cac gat gtg gtt ttg gta 816
Ile Ala Ala Ile Ser Gln Leu Leu Glu Gly His Asp Val Val Leu Val
260 265 270
atc ggc gct cca gtg ttc cgt tac cac caa tac gac cca ggt caa tat 864
Ile Gly Ala Pro Val Phe Arg Tyr His Gln Tyr Asp Pro Gly Gln Tyr
275 280 285
ctc aaa cct ggc acg cga ttg att tcg gtg acc tgc gac ccg ctc gaa 912
Leu Lys Pro Gly Thr Arg Leu Ile Ser Val Thr Cys Asp Pro Leu Glu
290 295 300
gct gca cgc gcg cca atg ggc gat gcg atc gtg gca gac att ggt gcg 960
Ala Ala Arg Ala Pro Met Gly Asp Ala Ile Val Ala Asp Ile Gly Ala
305 310 315 320
atg gct agc gct ctt gcc aac ttg gtt gaa gag agc agc cgc cag ctc 1008
Met Ala Ser Ala Leu Ala Asn Leu Val Glu Glu Ser Ser Arg Gln Leu
325 330 335
cca act gca gct ccg gaa ccc gcg aag gtt gac caa gac gct ggc cga 1056
Pro Thr Ala Ala Pro Glu Pro Ala Lys Val Asp Gln Asp Ala Gly Arg
340 345 350
ctt cac cca gag aca gtg ttc gac aca ctg aac gac atg gcc ccg gag 1104
Leu His Pro Glu Thr Val Phe Asp Thr Leu Asn Asp Met Ala Pro Glu
355 360 365
aat gcg att tac ctg aac gag tcg act tca acg acc gcc caa atg tgg 1152
Asn Ala Ile Tyr Leu Asn Glu Ser Thr Ser Thr Thr Ala Gln Met Trp
370 375 380
cag cgc ctg aac atg cgc aac cct ggt agc tac tac ttc tgt gca gct 1200
Gln Arg Leu Asn Met Arg Asn Pro Gly Ser Tyr Tyr Phe Cys Ala Ala
385 390 395 400
ggc gga ctg ggc ttc gcc ctg cct gca gca att ggc gtt caa ctc gca 1248
Gly Gly Leu Gly Phe Ala Leu Pro Ala Ala Ile Gly Val Gln Leu Ala
405 410 415
gaa ccc gag cga caa gtc atc gcc gtc att ggc gac gga tcg gcg aac 1296
Glu Pro Glu Arg Gln Val Ile Ala Val Ile Gly Asp Gly Ser Ala Asn
420 425 430
tac agc att agt gcg ttg tgg act gca gct cag tac aac atc ccc act 1344
Tyr Ser Ile Ser Ala Leu Trp Thr Ala Ala Gln Tyr Asn Ile Pro Thr
435 440 445
atc ttc gtg atc atg aac aac ggc acc tac ggt gcg ttg cga tgg ttt 1392
Ile Phe Val Ile Met Asn Asn Gly Thr Tyr Gly Ala Leu Arg Trp Phe
450 455 460
gcc ggc gtt ctc gaa gca gaa aac gtt cct ggg ctg gat gtg cca ggg 1440
Ala Gly Val Leu Glu Ala Glu Asn Val Pro Gly Leu Asp Val Pro Gly
465 470 475 480
atc gac ttc cgc gca ctc gcc aag ggc tat ggt gtc caa gcg ctg aaa 1488
Ile Asp Phe Arg Ala Leu Ala Lys Gly Tyr Gly Val Gln Ala Leu Lys
485 490 495
gcc gac aac ctt gag cag ctc aag ggt tcg cta caa gaa gcg ctt tct 1536
Ala Asp Asn Leu Glu Gln Leu Lys Gly Ser Leu Gln Glu Ala Leu Ser
500 505 510
gcc aaa ggc ccg gta ctt atc gaa gta agc acc gta agc ccg gtg aag 1584
Ala Lys Gly Pro Val Leu Ile Glu Val Ser Thr Val Ser Pro Val Lys
515 520 525
tga 1587
<210>33
<211>528
<212>PRT
<213>恶臭假单胞菌
<400>33
Met Ala Ser Val His Gly Thr Thr Tyr Glu Leu Leu Arg Arg Gln Gly
1 5 10 15
Ile Asp Thr Val Phe Gly Asn Pro Gly Ser Asn Glu Leu Pro Phe Leu
20 25 30
Lys Asp Phe Pro Glu Asp Phe Arg Tyr Ile Leu Ala Leu Gln Glu Ala
35 40 45
Cys Val Val Gly Ile Ala Asp Gly Tyr Ala Gln Ala Ser Arg Lys Pro
50 55 60
Ala Phe Ile Asn Leu His Ser Ala Ala Gly Thr Gly Asn Ala Met Gly
65 70 75 80
Ala Leu Ser Asn Ala Trp Asn Ser His Ser Pro Leu Ile Val Thr Ala
85 90 95
Gly Gln Gln Thr Arg Ala Met Ile Gly Val Glu Ala Leu Leu Thr Asn
100 105 110
Val Asp Ala Ala Asn Leu Pro Arg Pro Leu Val Lys Trp Ser Tyr Glu
115 120 125
Pro Ala Ser Ala Ala Glu Val Pro His Ala Met Ser Arg Ala Ile His
130 135 140
Met Ala Ser Met Ala Pro Gln Gly Pro Val Tyr Leu Ser Val Pro Tyr
145 150 155 160
Asp Asp Trp Asp Lys Asp Ala Asp Pro Gln Ser His His Leu Phe Asp
165 170 175
Arg His Val Ser Ser Ser Val Arg Leu Asn Asp Gln Asp Leu Asp Ile
180 185 190
Leu Val Lys Ala Leu Asn Ser Ala Ser Asn Pro Ala Ile Val Leu Gly
195 200 205
Pro Asp Val Asp Ala Ala Asn Ala Asn Ala Asp Cys Val Met Leu Ala
210 215 220
Glu Arg Leu Lys Ala Pro Val Trp Val Ala Pro Ser Ala Pro Arg Cys
225 230 235 240
Pro Phe Pro Thr Arg His Pro Cys Phe Arg Gly Leu Met Pro Ala Gly
245 250 255
Ile Ala Ala Ile Ser Gln Leu Leu Glu Gly His Asp Val Val Leu Val
260 265 270
Ile Gly Ala Pro Val Phe Arg Tyr His Gln Tyr Asp Pro Gly Gln Tyr
275 280 285
Leu Lys Pro Gly Thr Arg Leu Ile Ser Val Thr Cys Asp Pro Leu Glu
290 295 300
Ala Ala Arg Ala Pro Met Gly Asp Ala Ile Val Ala Asp Ile Gly Ala
305 310 315 320
Met Ala Ser Ala Leu Ala Asn Leu Val Glu Glu Ser Ser Arg Gln Leu
325 330 335
Pro Thr Ala Ala Pro Glu Pro Ala Lys Val Asp Gln Asp Ala Gly Arg
340 345 350
Leu His Pro Glu Thr Val Phe Asp Thr Leu Asn Asp Met Ala Pro Glu
355 360 365
Asn Ala Ile Tyr Leu Asn Glu Ser Thr Ser Thr Thr Ala Gln Met Trp
370 375 380
Gln Arg Leu Asn Met Arg Asn Pro Gly Ser Tyr Tyr Phe Cys Ala Ala
385 390 395 400
Gly Gly Leu Gly Phe Ala Leu Pro Ala Ala Ile Gly Val Gln Leu Ala
405 410 415
Glu Pro Glu Arg Gln Val Ile Ala Val Ile Gly Asp Gly Ser Ala Asn
420 425 430
Tyr Ser Ile Ser Ala Leu Trp Thr Ala Ala Gln Tyr Asn Ile Pro Thr
435 440 445
Ile Phe Val Ile Met Asn Asn Gly Thr Tyr Gly Ala Leu Arg Trp Phe
450 455 460
Ala Gly Val Leu Glu Ala Glu Asn Val Pro Gly Leu Asp Val Pro Gly
465 470 475 480
Ile Asp Phe Arg Ala Leu Ala Lys Gly Tyr Gly Val Gln Ala Leu Lys
485 490 495
Ala Asp Asn Leu Glu Gln Leu Lys Gly Ser Leu Gln Glu Ala Leu Ser
500 505 510
Ala Lys Gly Pro Val Leu Ile Glu Val Ser Thr Val Ser Pro Val Lys
515 520 525
机译: 由2-脱氢-3-脱氧葡萄糖酸酯-D-和2'-脱氧核苷生产2'-脱氧核苷前体
机译: 由2-脱氢-3-脱氧葡萄糖酸酯-D-和2'-脱氧核苷生产2'-脱氧核苷前体
机译: 2-脱氢-3-脱氧-D-葡萄糖酸2'-脱氧核苷和2'-脱氧核苷前体的产生