首页> 中国专利> 适于改变油质酵母中多不饱和脂肪酸水平的△12去饱和酶

适于改变油质酵母中多不饱和脂肪酸水平的△12去饱和酶

摘要

本发明涉及能够催化油酸向亚油酸(LA;18:2)转化的真菌Δ12脂肪酸去饱和酶。描述了编码所述去饱和酶的核酸序列、与其杂交的DNA构建体,和表达水平增加的所述去饱和酶的重组宿主微生物。本文还描述了通过过表达Δ12脂肪酸去饱和酶增加产生特定ω-3和ω-6脂肪酸的方法。

著录项

  • 公开/公告号CN1878785A

    专利类型发明专利

  • 公开/公告日2006-12-13

    原文格式PDF

  • 申请/专利权人 纳幕尔杜邦公司;

    申请/专利号CN200480033338.1

  • 发明设计人 N·S·亚达夫;Q·Q·朱;H·张;

    申请日2004-11-12

  • 分类号C07H21/04;C12N1/14;

  • 代理机构中国专利代理(香港)有限公司;

  • 代理人程淼

  • 地址 美国特拉华州威尔明顿

  • 入库时间 2023-12-17 17:59:48

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-01-05

    未缴年费专利权终止 IPC(主分类):C12N15/53 授权公告日:20100929 终止日期:20161112 申请日:20041112

    专利权的终止

  • 2010-09-29

    授权

    授权

  • 2007-02-07

    实质审查的生效

    实质审查的生效

  • 2006-12-13

    公开

    公开

说明书

本申请要求2003年11月12日提交的美国临时申请号60/519191和2004年5月13日提交的美国临时申请号60/570,679的利益。

                        发明领域

本发明是生物技术领域。更具体地,本发明设计鉴定编码Δ12脂肪酸去饱和酶的核酸片段,所述酶可用于破坏或者增强油质微生物,如油质酵母中多不饱和脂肪酸的产生。

                        发明背景

很久就认识到某些多不饱和脂肪酸,或者PUFA,是健康细胞的重要生物组分。例如,认识到此类PUFA为:

·“必需”脂肪酶,其不能在哺乳动物中从头合成,必须在食物中获得或者通过亚油酸(LA)或者α-亚麻酸(ALA)的进一步去饱和和延长得到;

·细胞的质膜成分,其中他们可以以诸如磷脂或者甘油三酯的形式发现;

·对于本身发育,尤其在正发育的婴儿脑中,和对于组织形成和修复是必须的;和

·在哺乳动物中重要的一些生物活性类花生酸的前体,包括前列环素、类花生酸、白三烯和前列腺素。

在20世纪70年代,Greenland Eskimos的观察将心脏病的低发病率和长链ω-3 PUFAs的大量摄入联系起来(Dyerberg,J.等人,Amer.J.Clin Nutr.28:958-966(1975);Dyerberg,J.等人,Lancet 2(8081):117-119(July 15,1978))。更近的研究已经证实了ω-3 PUFAs的心血管保护作用(Shimokawa,H.,World Rev NutrDiet,88:100-108(2001);von Schacky,C.,和Dyerberg,J.,World Rev Nutr Diet,88:90-99(2001))。此外,已经发现一些病症响应ω-3脂肪酸的治疗,所述病症为诸如血管成形术后再狭窄率、炎症和类风湿性关节炎、哮喘、银屑病和湿疹的症状。已经表明γ-亚麻酸(GLA,一种ω-6 PUFA)降低与压力相关的血压升高和改善算术测验的表现。已经表明GLA和二同型-γ-亚麻酸(DGLA,另一种ω-6 PUFA)抑制血小板聚集、导致血管舒张、降低胆固醇水平和抑制血管壁平滑肌和纤维组织的增殖(Brenner等人,Adv.Exp.Med.Biol.83:85-101(1976))。已经表明GLA或者DGLA单独或者与二十碳五烯酸(EPA,一种ω-3 PUFA)联合施用减少或者预防非甾体抗炎药导致的胃肠道出血和其他副作用(U.S.4,666,701)。此外,已经表明GLA和DGLA预防或者治疗子宫内膜异位和月经前期综合征(U.S.4,758,592)和治疗病毒感染后的肌痛性脑脊髓炎和慢性疲劳(U.S.5,116,871)。其他证据表明PUFAs可能涉及钙代谢的调节,提示它们可用于治疗或者预防骨质疏松和肾和尿道结石。最后,PUFAs可以用于治疗癌症和糖尿病(U.S.4,826,877;Horrobin等人,Am.J.Clin.Nutr.57(Suppl.):732S-737S(1993))。

PUFAs通常分成两种主要类别(由ω-6和ω-3脂肪酸组成),所述类别通过必需脂肪酸LA和ALA的去饱和和延长得到。尽管存在来自天然途径的多种通过商业途径可以获得的PUFAs[例如,月见草、琉璃苣和黑加仑的种子;丝状真菌(被孢霉属,Mortierella),Porphyridium(红藻),鱼油和海洋浮游生物(Cyclotella,Nitzschia,Crypthecodinium)],但是这些生产方法具有一些缺点。首先,天然来源如鱼和植物倾向于具有高度异质的油组分。因此,从这些来源得到的油需要多方面纯化以分离或者富集一种或多种所希望的PUFAs。天然来源在有效性方面也受到不可控制的波动性(例如,由于天然、痰病或者对于鱼原料,由于过度捕捞);并且,产生PUFAs的作物通常与开发用于食物生产的杂交作物在经济上没有竞争性。天然产生PUFAs的一些生物(例如,Porphyridium,被孢霉属)的大规模发酵也可能是昂贵和/或难以在商业规模上培养。

由于上述限制,已经进行了大量工作以:1)开发容易经济生产的PUFAs的重组来源;和2)修饰脂肪酸生物合成途径以能够产生所希望的PUFAs。例如,在过去几年里已经在分离、克隆和操作来自多种生物的脂肪酸去饱和酶和延伸酶(elongase)基因中取得了进展。这些基因序列的知识提供了在不天然产生PUFAs的新的宿主生物中产生所希望的脂肪酸和/或脂肪酸组合物的前景。文献报导了在酿酒酵母(Saccharomyces cerevisiae)中的许多实例,如:Domergue,F.,等人(Eur.J.Biochem.269:4105-4113(2002)),其中,将来自海洋硅藻(Phaeodactylum tricornutum)的两种去饱和酶克隆到酿酒酵母中,导致产生EPA;Beaudoin F.,等人(Proc.Natl.Acad.Sci.U.S.A.97(12):6421-6(2000)),其中使用来自秀丽隐杆线虫(Caenorhabditis elegans)的基因,在酿酒酵母中重构ω-3和ω-6PUFA生物合成途径;Dyer,J.M.,等人(Appl.Eniv.Microbiol.,59:224-230(2002)),其中在酿酒酵母中表达植物脂肪酸去饱和酶(FAD2和FAD3),和U.S.6,136,574(Knutzon等人,AbbottLaboratories),其中将来自Brassica napus的一种去饱和酶和来自真菌Mortierella alpina的两种去饱和酶克隆到酿酒酵母中,导致产生LA、GLA、ALA和STA。然而,仍然需要适宜的微生物系统,在所述系统中可以表达这些类型的基因以提供一种或多种PUFAs的经济量的商业生产。此外,需要富含特定PUFAs的油,特别是EPA和DHA。

以前未调查作为PUFAs的生产平台的一类微生物是油质酵母。这些生物积累高达它们的干细胞重量的80%的油。生长具有高油含量的油质酵母的技术是成熟的(例如,见EP 0 005 277Bl;Ratledge,C.,Prog.Ind.Microbiol.16:119-206(1982)),并且与商业微藻发酵生产ω-3-或ω-6 PUFAs相比可以提供成本优势。完整酵母细胞还可以代表封装富含ω-3或ω-6 PUFA的油用于功能性食物和动物饲料补充物的方便的方法。

尽管具有上述优点,但是多数油质酵母天然缺乏ω-3和ω-6PUFA,因为这些生物中天然产生的PUFAs通常局限于18:2脂肪酸(较不常见地;18:3脂肪酸)。从而,待解决的问题是开发积累富含ω-3和/或ω-6脂肪酸的油。为此,不仅必需引入允许在油质酵母中合成和积累ω-3和/或ω-6脂肪酸的所需要的去饱和酶和延伸酶,而且必需增加18:2底物(即,LA)的有效性。通常,该底物的有效性受到Δ12去饱和酶的活性的控制,Δ12去饱和酶催化油酸向LA的转化。

在公共文献中公开了多种已知的Δ12去饱和酶,它们的一些来自真菌来源(例如,高山被孢霉(Mortierella alpina)、Emericellanidulans、鲁西毛霉(Mucor rouxii))。还未知这些去饱和酶可以有效改变油质酵母中的脂肪酸组成,尽管例如,高山被孢霉去饱和酶以前已经在非油质酵母酿酒酵母中表达并且能够积累18:2(Sakuradani E.,等人,Eur J Biochem.261(3):812-20(1999))。WO 2003/099216描述了来自粗糙脉孢霉(Neurosporacrassa)和灰葡萄孢(Botrytis cinerea)的Δ12去饱和酶。在酿酒酵母中的随后表达证实了粗糙脉孢霉能够将油酸转化成18:2;然而,该反应的百分数底物转化为仅68%(计算为([18:2]/[18:1+18:2])*100)。从而,需要鉴定和分离编码Δ12去饱和酶的基因,所述Δ12去饱和酶能够支持在产油宿主生物(例如,油质酵母)中产生高水平18:2(LA)以用于生产PUFAs。

通过从真菌串珠镰孢(Fusarium moniliforme)分离编码Δ12去饱和酶的基因并阐明当在油质酵母中表达是将油酸转化成18:2(LA)的令人惊奇的有效转化,申请人解决了所陈述的问题。此外,在构巢曲霉(Aspergillus nidulans)、黄曲霉(Aspergillus flavus)、烟曲霉(Aspergillus fumigatus)、Magnaporthe grisea,粗糙脉孢霉和禾本科镰孢(Fusarium graminearium)中已经鉴定了该Δ12去饱和酶的直向同源物(ortholog)。

                        发明概述

本发明涉及从镰孢菌(Fusarium)分离的编码Δ12去饱和酶的基因,其用于操作生物化学途径,导致产生ω-3和ω-6脂肪酸。因此,本发明提供了编码真菌Δ12去饱和酶的分离的核酸片段,其选自由:

(a)分离的核酸片段,其编码如SEQ ID NO:4中给出的氨基酸序列;

(b)分离的核酸片段,其与(a)在下面的条件下杂交:0.1X SSC,0.1%SDS,65℃和用2X SSC,0.1%SDS,然后用0.1X SSC,0.1%SDS洗涤;或者

(c)分离的核酸片段,其与(a)或者(b)互补,

构成的组。

在一个特定实施方案中,本发明提供了分离的核酸片段,其包含第一种核苷酸序列,该核苷酸序列编码Δ12去饱和酶,基于Clustal比对方法与具有SEQ ID NO:3中给出的序列的核酸片段比较时具有至少89.2%同一性;

或者第二种核苷酸序列,其包含第一种核苷酸序列的互补序列。

类似地,本发明提供了分离的核酸片段,其包含编码至少477个氨基酸的Δ12去饱和酶的第一种核苷酸序列,所述Δ12去饱和酶基于Clustal比对方法与具有SEQ ID NO:4中给出的序列的多肽比较时具有至少95%同一性;

或者第二种核苷酸序列,其包含第一种核苷酸序列的互补序列。

类似地,本发明提供了本发明的分离的核酸编码的多肽以及这些核酸的遗传嵌合体和包含该遗传嵌合体的经转化的宿主细胞。

在另一实施方案中,本发明提供了得到编码Δ12去饱和酶的核酸片段的方法,其包括:

(a)用本发明的核酸序列探测基因组文库;

(b)鉴定与本发明的核酸片段杂交的DNA克隆;和

(c)对包含步骤(b)中鉴定的基因组片段测序,

其中所测序的基因组片段编码Δ12去饱和酶。

类似地,本发明提供了得到编码Δ12去饱和酶的核酸片段的方法,其包括:

(a)合成对应于SEQ ID NOs:4,8,12,16,20,21和22中给出的序列的部分的至少一种寡核苷酸引物;和

(b)使用步骤(a)的寡核苷酸引物扩增克隆载体中存在的插入片段;

其中所扩增的插入片段编码Δ12去饱和酶的氨基酸序列的一部分。

在另一实施方案中,本发明提供了产生亚油酸的方法,其包括:

a)提供油质酵母,其包含:

(i)编码具有Δ12去饱和酶活性的真菌多肽的分离的核酸,所述多肽当基于Clustal比对方法与具有SEQ ID NO:4中给出的序列的多肽比较时具有至少56.3%同一性;和

(ii)油酸来源;

b)在其中嵌合去饱和酶基因表达并且油酸转化成亚油酸的条件下生长步骤(a)的酵母;和

c)任选回收步骤(b)的亚油酸。

类似地,本发明提供了产生ω-3或ω-6多不饱和脂肪酸的方法,其包括:

a)提供油质酵母,其包含:

(i)编码具有Δ12去饱和酶活性的蛋白质的分离的核酸片段,所述蛋白质当基于Clustal比对方法与具有SEQ ID NO:4中给出的序列的多肽比较时具有至少56.3%同一性;和

(ii)编码功能ω-3/ω-6脂肪酸生物合成途径的基因;

b)提供包含油酸的去饱和酶底物的来源;和

c)将(a)的油质酵母与(b)的去饱和酶底物在其中产生多不饱和脂肪酸的条件下接触;和

d)任选回收步骤(c)的多不饱和脂肪酸。

此外,本发明提供了通过本发明的方法产生的微生物油。

                   附图简述和序列描述

图1显示了油质酵母中脂质积累的生物化学机制的示意图。

图2阐明了ω-3和ω-6脂肪酸生物合成途径。

图3阐明了构建用于在Yarrowia lipolytica中基因表达的质粒载体pY5。

图4显示了使用Megalign DNASTAR软件产生的来自不同丝状真菌(即,构巢曲霉、串珠镰孢、禾本科镰孢、Magnaporthe grisea和粗糙脉孢霉)的与Yarrowia lipolyticaΔ12去饱和酶具有同源性的蛋白质的系统树。

图5显示了使用ClustalW分析(DNASTAR软件的Megalign程序),对来自不同丝状真菌(即,构巢曲霉、串珠镰孢、禾本科镰孢、Magnaporthe grisea和粗糙脉孢霉)的与Yarrowia lipolyticaΔ12去饱和酶具有同源性的蛋白质之间的逐对比较(%同一性)。

图6显示了使用ClustalW分析(DNASTAR软件的Megalign程序),对来自不同丝状真菌的与Yarrowia lipolytica Δ12去饱和酶具有同源性的蛋白质和来自一些其他真菌和非真菌物种的Δ12去饱和酶蛋白质之间的逐对比较(%同一性)。

图7提供了pKUNF12T6E的质粒图。

从下面的详细描述和所附序列描述可以更完全地理解本发明,所述序列描述形成本申请的一部分。

下面的序列符合37C.F.R.§1.821-1.825(“Requirements forPatent Applications Containing Nucleotide Sequences and/orAmino Acid Sequence Disclosures-the Sequence Rules”)并且与世界知识产权组织(WIPO)标准ST.25(1998)和EPO和PCT的序列表要求(5.2和49.5(a-bis)条,和Section 208和Annex C of theAdministrative Instructions)一致。用于核苷酸和氨基酸序列数据的符号和格式符合37C.F.R.§1.822中给出的条例。

SEQ ID NOs:1-22,51和52是表1中鉴定的ORFs编码基因或者蛋白质。

                                  表1

                   去饱和酶基因和蛋白质SEQ ID号概述

  描述  ORF核酸  SEQ ID NO.  蛋白质  SEQ ID NO.  串珠镰孢亚家族1去饱和酶(Δ15/Δ12  去饱和酶)  1  (1209bp)  2  (402AA)  串珠镰孢亚家族2去饱和酶(Δ12去饱和  酶)  3  (1434bp)  4  (477AA)  构巢曲霉亚家族1去饱和酶(Δ15去饱和  酶)  5  (1206bp)  6  (401AA)  构巢曲霉亚家族2去饱和酶(Δ12去饱和  酶)  7  (1416bp)  8  (471AA)  Magnaporthe grisea亚家族1去饱和  酶(Δ15去饱和酶)  9  (1185bp)  10  (394AA)  Magnaporthe grisea亚家族2去饱和  酶(Δ12去饱和酶)  11  (1656bp)  12  (551AA)  粗糙脉孢霉亚家族1去饱和酶(Δ15去饱  和酶)  13  (1290bp)  14  (429AA)  粗糙脉孢霉亚家族2去饱和酶(Δ12去饱  和酶)  15  (1446bp)  16  (481AA)  禾本科镰孢亚家族1去饱和酶(Δ15去  饱和酶)  17  (1212bp)  18  (403AA)

表1(续)

  禾本科镰孢亚家族2去饱和酶(Δ12去  饱和酶)  19  (1371bp)  20  (456AA)  烟曲霉亚家族2去饱和酶(Δ12去饱和  酶)  --  21  (424AA)  黄曲霉亚家族2去饱和酶(Δ12去饱和  酶)  --  22  (466AA)  Yarrowia lipolytica Δ12去饱和酶  51  (1936bp)  52  (419AA)

SEQ ID NOs:23和24分别是引物TEF 5’和TEF 3’,它们用于分离TEF启动子。

SEQ ID NOs:25和26分别是用于分离XPR2转录终止子的引物XPR5’和XPR 3’。

SEQ ID NOs:27-38对应于用于质粒构造的引物YL5、YL6、YL9、YL10、YL7、YL8、YL3、YL4、YL1、YL2、YL61和YL62。

SEQ ID NOs:39和41分别是用于分离Yarrowia lipolytica Δ12去饱和酶基因的鉴定为P73和P76的简并引物。

SEQ ID NOs:40和42分别是对应于简并引物P73和P76的简并引物P73和P76的氨基酸共有序列。

SEQ ID NOs:43-46分别对应于用于天然Yarrowia lipolyticaΔ12去饱和酶基因的定向破坏的引物P99、P100、P101和P102。

SEQ ID NOs:47-50分别对应于筛选所破坏的Y.lipolytica Δ12去饱和酶基因的定向整合的引物P119、P120、P121和P122。

SEQ ID NOs:53和54分别对应于扩增全长Y.lipolytica Δ12去饱和酶编码区的引物P147和P148。

SEQ ID NOs:55和56分别对应于扩增全长串珠镰孢Δ12去饱和酶编码区的引物P194和P195。

SEQ ID NO:57提供了质粒pKUNF12T6E的DNA序列。

SEQ ID NO:58对应于Yarrowia lipolytica FBAIN启动子区。

SEQ ID NO:59是经密码子优化用于在Y.lipolytica中表达的来自高山被孢霉的合成的延伸酶1基因的957bp核苷酸序列,而SEQ IDNO:60是对应的318个氨基酸的序列。

SEQ ID NO:61是经密码子优化用于在Y.lipolytica中表达的来自高山被孢霉的合成的Δ6去饱和酶基因的1374bp核苷酸序列,而SEQ ID NO:62是对应的457个氨基酸的序列。

SEQ ID NO:63对应于Yarrowia lipolytica FBA启动子区。

SEQ ID NO:64是经密码子优化用于在Y.lipolytica中表达的来自Thraustochytrium aureum的合成的延伸酶2基因的819bp核苷酸序列,而SEQ ID NO:65是对应的272个氨基酸的序列。

SEQ ID NO:66对应于最适在Yarrowia sp中表达的密码子优化的翻译起始位点。

                        发明详述

根据主题发明,申请人已经分离并证实了编码Δ12去饱和酶的串珠镰孢(Fusarium moniliforme)基因的身份并鉴定了它的在其他真菌中的直向同源物。此外,提供了允许修饰长链多不饱和脂肪酸(PUFA)含量和油质酵母如Yarrowia lipolytica的组分的方法和组合物。

本发明涉及新的Δ12去饱和酶和其编码基因,所述基因可以用于操作用于产生健康PUFAs的生物化学途径。从而,主题发明发现了许多应用。通过本文公开的方法产生的PUFAs或者其衍生物可以用作饮食替代品或者补充物,尤其婴儿配方,用于经历静脉内营养法的患者或者用于预防或者治疗营养不良。备选地,所纯化的PUFAs(或者其衍生物)可以掺入到所配制的烹调油、脂肪或者人造黄油中,从而在正常使用中,受者将接受所希望量的饮食补充。PUFAs还可以掺入到婴儿配方、营养补充品或者其他食品中并且可以用作抗炎剂或者胆固醇降低剂。任选地,组合物可以用于药物用途(人或者兽)。在该情况中,PUFAs通常经口施用但是可以通过任意途径施用,只要通过所述途径PUFAs可以被成功地吸收,所述途径为例如肠胃外(例如,皮下、肌内或者静脉内)、直肠、阴道或者局部(例如,作为皮肤软膏剂或者洗剂)。

用通过重组方法产生的PUFAs补充人或者动物可以导致所加入的PUFAs以及它们的代谢物的水平增加。例如,用花生四烯酸治疗不仅导致ARA水平增加,而且导致ARA的下游产物,如前列腺素的水平增加。复杂调节机制使得希望组合多种PUFAs,或者加入PUFAs的不同缀合物,以便防止、控制或者克服此类机制以实现个体中特定PUFAs的所希望的水平。

                           定义

在本公开中,使用了许多术语和缩写。提供了下面的定义。

“可该框”缩写为ORF。

“聚合酶链式反应”缩写为PCR。

“美国典型培养物保藏中心”缩写为ATCC。

“多不饱和脂肪酸”缩写为PUFA(s)。

术语“串珠镰孢”与“Fusarium verticillioides”同义。

术语“脂肪酸”指约C12到C22的不同链长的长链脂族酸(链烷酸)(尽管更长和更短的链长是已知的)。主要的链长为C16到C22。脂肪酸的结构由简单标记系统“X:Y”代表,其中X是特定脂肪酸中碳原子总数,Y是双键数。

通常,将脂肪酸分类为饱和或不饱和的。术语“饱和脂肪酸”指在它们的碳主链之间没有“双键”。相比,“不饱和脂肪酸”具有“双键”以及它们的碳主链(其最通常为顺式构型)。“单不饱和脂肪酸”沿着碳主链具有仅一个“双键”(例如,对于棕榈油酸(16:1)和油酸(18:1)通常在第9个和第10个碳原子之间),而“多不饱和脂肪酸”(或者“PUFAs”)沿着碳主链具有至少两个双键(例如,对于亚油酸(18:2)为第9和第10个和第12和第13个碳原子之间);对于α-亚麻酸(18:3)为第9和第10、第12和第13和第15和第16个碳原子之间)。

可以将“PUFAs”分类成两个主要家族(根据最接近脂肪酸碳链的甲基末端的第一个双键的位置(n))。从而,“ω-6脂肪酸”(ω-6或n-6)具有距离该分子的ω(甲基)末端6个碳原子的第一个不饱和的双键和额外具有共两个或多个双键,每个随后的不饱和出现朝向该分子的羧基末端的3个额外的碳原子。相比,“ω-3脂肪酸”(ω-3或n-3)具有距离分子的ω末端三个碳原子的第一个不饱和双键并且额外具有共三个或多个双键,每个随后的不饱和出现朝向该分子的羧基末端的3个额外的碳原子。

对于本发明,将使用ω参照系统指出碳原子数、双键数目和与ω碳最接近的双键的位置,从ω碳(其对于该目的编号为1)的计数。该命名在下面的表2中标题为“Shorthand Notation”的列中显示。该表达剩余内容总结了ω-3和ω-6脂肪酸的普通名、将用于说明书全文的缩写和每种化合物的“化学名”。

                          表2

                   多不饱和脂肪酸的命名

 普通名  缩写  化学名  Shorthand  Notation 亚油酸  LA  顺式-9,12-十八碳二烯酸  18:2ω-6 γ亚麻酸  GLA  顺式-6,9,12-十八碳三  烯酸  18:3ω-6 二十碳二烯酸  EDA  顺式-11,14-二十碳二  烯酸  20:2ω-6 二同型-γ亚油酸  DGLA  顺式-8,11,14-二十碳  三烯酸  20:3ω-6 花生四烯酸  ARA  顺式-5,8,11,14-二  十碳四烯酸  20:4ω-6 α亚麻酸  ALA  顺式-9,12,15-十八碳  三烯酸  18:3ω-3 十八碳四烯酸  STA  顺式-6,9,12,15-十  八碳四烯酸  18:4ω-3 二十碳三烯酸  ETrA  顺式-1,14,17-二十碳  三烯酸  20:3ω-3 二十碳四烯酸  ETA  顺式-8,11,14,17-二  十碳四烯酸  20:4ω-3 二十碳五烯酸  EPA  顺式-5,8,11,14,17-  二十碳五烯酸  20:5ω-3 二十二碳五烯酸  DPA  顺式-7,10,13,16,  19-二十二碳五烯酸  22:5ω-3 二十二碳六烯酸  DHA  顺式-4,7,10,13,16,  19-二十二碳六烯酸  22:6ω-3

术语“基本上脂肪酸”指特定PUFA,个体为了生存必须摄入该PUFA,不能从头合成该特定必需脂肪酸。亚油酸(18:2,ω-6)和亚麻酸(18:3,ω-3)脂肪酸是“必需脂肪酸”,因为人不能合成它们并且必须从他们的饮食得到它们。

术语“脂肪”指在25℃为固体并且通常是饱和的脂类物质。

术语“油”指在25℃为液态并且通常是不饱和的脂类物质。在一些藻类、油质酵母和丝状真菌的油中发现了PUFA。“微生物油”或者“单细胞油”为由微生物在它们的寿命中天然产生的油。此类油可以含有长链PUFA。

术语“PUFA生物合成途径酶”指与PUFA的生物合成相关的下列酶的任一种(和编码所述酶的基因),包括:Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ12去饱和酶、aΔ15去饱和酶、Δ17去饱和酶、Δ9去饱和酶、Δ8去饱和酶和/或延伸酶。

术语“ω-3/ω-6脂肪酸生物合成途径”指一组基因,其当在适当条件下表达是编码催化产生ω-3和ω-6脂肪酸的一种或两种的酶。通常,涉及ω-3/ω-6脂肪酸生物合成途径的基因编码一些或者所有下面的酶:Δ12去饱和酶、Δ6去饱和酶,延伸酶、Δ5去饱和酶、Δ17去饱和酶,Δ15去饱和酶、Δ9去饱和酶、Δ8去饱和酶和Δ4去饱和酶。代表性途径在图2中阐明,提供了油酸通过多种中间物向DHA的转化,该图阐明了怎样可以从普通来源产生ω-3和ω-6脂肪酸。该途径自然地分成两个部分,其中一个部分将产生ω-3脂肪酸和其他部分,另一部分仅产生ω-6脂肪酸。仅产生ω-3脂肪酸的部分将在本文中称作ω-3脂肪酸生物合成途径,而仅产生ω-6脂肪酸的部分将在本文中称作ω-6脂肪酸生物合成途径。

本文所用术语“功能的”在ω-3/ω-6脂肪酸生物合成途径的上下文中表示该途径中一些(或者所有)基因表达活性酶。将理解“ω-3/ω-6脂肪酸生物合成途径”或者“功能ω-3/ω-6脂肪酸生物合成途径”不暗含上面段落中所列的所有基因都是需要的,因为许多脂肪酸产物将仅需要表达该途径基因的亚组。

术语“去饱和酶”指在一种或多种脂肪酸中去饱和,即引入双键以产生单-或者多不饱和脂肪酸的多肽。尽管在说明书全文中参考特定脂肪酸时使用ω参照系统,但是使用Δ系统通过从底物的羧基末端计数指出去饱和酶的活性更加方便。本文中尤其重要的是Δ12去饱和酶,其去饱和从分子的羧基末端编号的第12到第13个碳原子之间的脂肪酸并且催化油酸向LA的转化。与本公开相关的其他去饱和酶包括:Δ15去饱和酶,其催化LA向ALA的转化;Δ17去饱和酶,其催化DGLA向ETA和/或ARA向EPA的转化;Δ6去饱和酶,其催化LA向GLA和/或ALA向STA的转化;Δ5去饱和酶,其催化DGLA向ARA和/或ETA向EPA的转化;Δ4去饱和酶,其催化DPA向DHA的转化;Δ8去饱和酶,其催化EDA向DGLA和/或ETrA向ETA的转化;和Δ9去饱和酶,其催化棕榈酸向棕榈油酸(16:1)和/或硬脂酸向油酸(18:1)转化。在本领域中,Δ15和Δ17去饱和酶还偶然称作“omega-3去饱和酶”,“w-3去饱和酶”,和/或“ω-3去饱和酶”。一些去饱和酶对两种或多种底物(例如,Saprolegnia diclina Δ17去饱和酶的底物,包括ARA和DGLA,而秀丽隐杆线虫ω-3去饱和酶的底物包括LA和GLA)。

术语“具有与Yarrowia lipolytica.Δ12去饱和酶同源性的蛋白质”指在本文中鉴定为SEQ ID NOs:2、4、6、8、10、12、14、16、18、20、21和22并且具有与本文中鉴定为SEQ ID NO:52(在共同待决的美国专利申请10/840325中表征,此处将该专利完整引入作为参考)的Y.lipolytica去饱和酶具有同源性的蛋白质。系统进化分析法确定,这些蛋白质(即,SEQ ID NOs:2、4、6、8、10、12、14、16、18、20、21和22)聚簇成两种不同的亚家族,在本文中称作“亚家族1”和“亚家族2”。特别地,亚家族1蛋白质似乎编码Δ15去饱和酶(即,SEQ ID NOs:2、6、10、14和18;见共同待决的美国临时申请60/519191,将其完整引入本文作为参考)。相比,亚家族2蛋白质编码如此处表征的具有Δ12去饱和酶活性(即,SEQ ID NOs:4、8、12、16、20、21和22)的蛋白质。

术语“转化效率”和“底物转化百分数”指特定酶(例如,去饱和酶或延伸酶)可以将底物转化成产物的效率。根据下面的公式测量转化效率:([产物]/[底物+产物])*100,其中,“产物”包括直接产物和该产物所来源的途径中的所有产物。在本申请中,希望鉴定特征是当在油质酵母宿主中表达时具有高底物转化百分数的那些Δ12去饱和酶;从而,例如,优选向LA的转化效率为至少70%,至少80%的向LA的转化效率是尤其适宜的,至少85%的向LA的转化效率是最优选的。

术语“延伸酶”指可以延伸脂肪酸碳链以产生酸的多肽,所述酸比延伸酶所作用的脂肪酸底物长2个碳。该延伸过程以多步机制与脂肪酸合酶联合作用,其中CoA是酰基载体(Lassner等人,The PlantCell 8:281-292(1996))。简言之,丙二酸单酰辅酶A与长链酰基辅酶A缩合产生CO2和β-酮酰基-CoA(其中酰基部分已经被延长2个碳原子)。随后反应包括还原成β-羟基酰基-CoA,脱水成烯酰辅酶A,和再次还原产生延伸的酰基-CoA。延伸酶催化的反应的实例是GLA向DGLA,STA向ETA,和EPA向DPA的转化。因此,延伸酶可以具有不同特异性。例如,C16/18延伸酶将优选为C16底物,C18/20延伸酶将优选C18底物,C20/22延伸酶将优选C20底物。以相似的方式,Δ9延伸酶能够催化LA和ALA分别向EDA和ETrA的转化。

术语“油质的”指倾向于以脂质的形式保存它们的能源的那些生物(Weete,In:Fungal Lipid Biochemistry,2nd ed.,Plenum,1980)。这些包括油料种子植物(例如,大豆、玉米、红花、向日葵、芸苔、油菜籽、亚麻、玉米和报春花)和微生物(例如,破囊壶菌(Thraustochytrium sp.,)、Schizochytrium sp.,被孢霉(Mortierella sp.)和某些油质酵母)。

术语“油质酵母”指分类为可以产油的酵母的那些微生物。通常,油质微生物的细胞油或者甘油三酯含量遵循S形曲线,其中脂质浓度增加直到晚对数或者早静止生长期的最大值,然后在晚静止和死亡期期间逐渐减少(Yongmanitchai和Ward,Appl.Environ.Microbiol.57:419-25(1991))。油质微生物积累超过它们的干重的约25%的油是常见的。油质酵母的实例包括,但不限于下面的属:Yarrowia,假丝酵母属(Candida)、红酵母属(Rhodotorula)、红冬孢酵母属(Rhodosporidium)、隐球菌属(Cryptococcus)、毛孢子菌属(Trichosporon)和油脂酵母属(Lipomyces)。

术语“可发酵的碳底物”指微生物将代谢以产生能量的碳源。本发明的典型的碳底物包括,但不限于:单糖、寡糖、多糖、烃类、脂肪酸、脂肪酸酯、甘油单酯、二氧化碳、甲醇、甲醛、甲酸和含碳胺。

术语“密码子优化的”当涉及用于转化多种宿主的核酸片段的基因或者编码区时,指改变核酸分子的基因或者编码区中的密码子以反映宿主生物的典型的密码子选择而不改变DNA编码的多肽。

本文所用的“分离的核酸片段”是单链或者双链RNA或者DNA聚合物,其任选含有合成的、非天然或者改变的核苷酸碱基。DNA聚合物形式的分离的核酸片段可以包含cDNA、基因组DNA或者合成DNA的一个或多个片段。

当核酸片段的单链形式能够与另一种核酸片段在适宜的温度和溶液离子强度条件下退火时,所述核酸片段与所述另一种核酸片段,如cDNA、基因组DNA或者RNA分子是“可杂交的”。杂交和洗涤条件是公知的并且在Sambrook,J.,Fritsch,E.F.and Maniatis,T.Molecular Cloning:A Laboratory Manual,2nd ed.,Cold SpringHarbor Laboratory:Cold Spring Harbor,NY(1989),尤其第11章和表11.1中例证。温度条件和离子强度的条件决定杂交的“严格性”。可以调节严格条件以从中等相似的片段(如来自远相关生物的同源序列)筛选高度相似的片段(如来自近相关生物的一式两份的功能酶)。杂交后洗涤决定严格条件。一组优选条件使用一些列洗涤,其以6X SSC,0.5%SDS在室温下15分钟开始,然后用0.2X SSC,0.5%SDS在50℃30分钟重复两次。一组更优选的严格条件使用更高的温度,其中洗涤与上面的相同,只是最后两次在0.2X SSC,0.5%SDS30分钟洗涤的温度增加到60℃。另一组优选的高度严格条件使用在0.1X SSC,0.1%SDS中65℃下最后两次洗涤。额外组的严格条件包括例如,在0.1X SSC,0.1%SDS,65℃杂交和用2X SSC,0.1%SDS然后用0.1X SSC,0.1%SDS洗涤。

杂交需要两种核酸含有互补序列,尽管取决于杂交的严格性,但是碱基之间的错配是可能的。杂交的核酸分子的适宜严格性取决于核酸的长度和互补程度——本领域公知的变量。两种核酸序列之间相似性或者同源性程度越大,具有那些序列的核酸的杂交分子的Tm值越大。核酸杂交的相对稳定性(对应于较高的Tm)以下面的顺序减小:RNA:RNA,DNA:RNA,DNA:DNA。对于长度大于100个核苷酸的杂交分子,已经推导了计算Tm的方程(见Sambrook等人,上文,9.50-9.51)。对于与较短核酸,即寡核苷酸的杂交,错配的位置变得重要,并且寡核苷酸的长度决定了它的特异性(见,Sambrook等人,上文,11.7-11.8)。在一个实施方案中,可杂交的核酸的长度为至少约10个核苷酸。优选地,可杂交的核酸的最小长度为至少约15个核苷酸,更优选至少约20个核苷酸;最优选地,长度为至少约30个核苷酸。此外,技术人员将认识到如必要,可以根据诸如探针长度的因子调节温度和洗涤溶液盐浓度。

氨基酸或者核苷酸序列的“实质部分”是包含包含多肽的氨基酸序列或者基因的核苷酸序列的足够部分的部分,推定所述部分鉴定该多肽或者基因,所述鉴定可以通过由本领域技术人员通过序列的手工评价或者通过计算机自动化的序列比较进行和使用诸如BLAST(BasicLocal Alignment Search Tool;Altschul,S.F.,等人,J.Mol.Biol.215:403-410(1993))的算法鉴定。通常,为了假定鉴定与已知蛋白质或者基因同源的多肽或者核酸序列,10或更多连续氨基酸或者30或更多核苷酸的序列是必要的。此外,关于核苷酸序列,包含20-30个连续核苷酸的基因特异的寡核苷酸探针可以用于基因鉴定(例如,DNA杂交)和分离(例如,细菌菌落或者噬菌体噬菌斑的原位杂交)的依赖序列的方法。此外,12-15个碱基的短寡核苷酸可以用作PCR中的扩增引物以便得到包含引物的特定核酸片段。因此,核苷酸序列的“实质部分”包含足够序列以特异鉴定和/或分离包含所述序列的核酸片段。本说明书教导了编码特定真菌蛋白质的完整氨基酸和核苷酸序列。技术人员拥有本文所报导的益处,现在可以为了本领域技术人员已知的目的使用所公开序列的所有或者实质部分。因此,本发明包含如所附序列表中报导的完整序列,以及如上面定义的那些序列的实质部分。

术语“互补的”用于描述能够相互杂交的核苷酸碱基之间的关系。例如,关于DNA,腺苷与胸苷互补,胞苷与鸟苷互补。因此,本发明还包括与所附序列表中报导的完整序列互补的分离的核酸片段,以及那些实质上相似的核酸序列。

如本领域已知的术语“同一性百分数”是如通过比较序列确定的两种或多种多肽序列或者两种或多种多核苷酸序列之间的关系。在本领域中,“同一性”还指多肽或者多核苷酸序列之间的序列相关性程度,根据具体情况而定,如通过此类序列的字符串之间的匹配决定。“同一性”和“相似性”可以通过已知方法容易地计算,所述方法包括但不限于如下文献中描述的:1.)Computational MolecularBiology(Lesk,A.M.,Ed.)Oxford University:NY(1988);2.)Biocomputing:Informatics and Genome Projects(Smith,D.W.,Ed.)Academic:NY(1993);3.)Computer Analysis ofSequence Data,Part I(Griffin,A.M.,and Griffin,H.G.,Eds.)Humania:NJ(1994);4.)Sequence Analysis in Molecular Biology(von Heinje,G.,Ed.)Academic(1987);and 5.)SequenceAnalysis Primet(Gribskov,M.and Devereux,J.,Eds.)Stockton:NY(1991)。设计确定同一性的优选方法以得到所测试序列之间的最佳匹配。确定同一性和相似性的方法在公众可利用的计算机程序中编码。序列比对和同一性百分数计算可以用LASERGENE生物信息学计算套件(DNASTAR Inc.,Madison,WI)的Megalign程序进行。除非另外说明,序列的多重比对使用Clustal比对方法(Higgins和Sharp,CABIOS.5:151-153(1989)),使用默认参数(GAP PENALTY=10,GAPLENGTH PENALTY=10)进行。使用Clustal方法进行逐对比对的默认参数为KTUPLE 1,GAP PENALTY=3,WINDOW=5和DIAGONALS SAVED=5。

适宜的核酸片段(本发明的分离的多核苷酸)编码与本文报导的氨基酸序列具有至少约70%同一性,优选约75%同一性,更优选约80%同一性的多肽。优选的核酸片段编码与本文报导的氨基酸序列具有约85%同一性的氨基酸序列。更优选的核酸片段编码与本文报导的氨基酸序列具有约90%同一性的氨基酸序列。更优选的为编码与本文报导的氨基酸序列具有约95%同一性的氨基酸序列。适宜的核酸片段不仅具有上面的同源性而且通常编码具有至少50个氨基酸,优选至少100个氨基酸,更优选至少150个氨基酸,更优选至少200个氨基酸,最优选至少250个氨基酸的多肽。

术语“同源性”指序列之间的关系,所述序列中存在一定程度的相似,其通常是由于从共同的祖先序列演化。同源序列可以具有基因的、结构的、功能的和/或行为的性质而具有同源性。术语“直向同源物”或者“直向同源序列”在本文指其中物种形成后序列趋异的关系(即,不同物种中的同源序列从物种形成期间的共同祖先基因产生)。相比,术语“共生同源的”指一个物种内由于基因复制引起的同源序列。本领域技术人员将熟悉鉴定同源、直向同源和共生同源序列所需的技术。

“密码子简并”指遗传密码中的性质,其允许改变核苷酸序列而不影响所编码的多肽的氨基酸序列。本领域技术人员熟知核苷酸密码子选择中特定宿主细胞显示出的“密码子偏爱”以指定给定氨基酸。因此,当合成用于在宿主细胞中提高表达的基因时,希望设计该基因使得它的密码子选择频率接近该宿主细胞的优选密码子选择的频率。

“化学合成的”当涉及DNA序列时,指在体外装配组分核苷酸。DNA的手工化学合成可以使用成熟的方法完成;或者自动化化学合成可以使用许多通过商业途径可获得的机器来进行。使用本领域技术人员公知的步骤,可以从化学合成的寡核苷酸构件装配“合成基因”。这些构件连接并退火形成基因片段,其然后酶促装配以构造完整基因。因此,可以基于核苷酸序列的优化以反映宿主细胞的密码子偏爱来定制基因用于最佳基因表达。技术人员明白如果密码子选择偏向宿主喜爱的那些密码子,那么可能进行成功的基因表达。可以基于来自宿主的基因的考察确定优选的密码子,其中所述基因的序列信息是可得的。

“基因”指表达特定蛋白质的核酸片段,并且可以指仅编码区或者可以包括编码序列前(5’-非编码序列)和之后(3’非编码序列)的调节序列。“天然基因”指在自然中发现的基因与其自己的调节序列。“嵌合基因”指不是天然基因的任意基因,其包含未在自然界中发现在一起的调节序列和编码序列。因此,嵌合基因可以包含不同的来源的调节序列和编码序列,或者来自相同来源,但是以不同于在自然中发现的方式排列的调节序列和编码序列。“内源基因”指位于生物的基因组中它的天然位置中的天然基因。“外源”基因指通过基因转移导入宿主生物的基因。外源基因可以包含导入非天然生物的天然基因、导入天然宿主内的新位置的天然基因,或者嵌合基因。“转基因”是通过转化方法导入基因组中的基因。“密码子优化的基因”是这样的基因,将其密码子选择频率设计成模拟宿主细胞的优选密码子选择的频率。

“编码序列”指编码特定氨基酸序列的DNA序列。“适宜的调节序列”指位于编码序列的上游(5’非编码序列)、内部或者下游(3’非编码序列)并且影响相关编码序列的转录、RNA加工或者稳定性,或者翻译的核苷酸序列。调节序列可以包括启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎环结构。

“启动子”指能够控制编码序列或者功能RNA的表达的DNA序列。通常,编码序列位于启动子序列的3’。启动子可以完整地来自天然基因,或者可以由来自自然界中发现的不同启动子的不同元件组成,或者甚至包含合成的DNA片段。本领域技术人员发现不同启动子可以指导基因在不同组织或者细胞类型,或者在不同发育阶段中,或者应答不同环境或者生理条件表达。导致基因在多数细胞类型中在多数时间表达的启动子通常称作“组成型启动子”。还认识到因为在多数情况中,调节序列的确切边界还没有被完全限定,所以不同长度的DNA片段可能具有相同启动子活性。

术语“3’非编码序列”和“转录终止子”指位于编码序列下游的DNA序列。这包括多腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。多腺苷酸化信号通常的特征是影响多腺苷酸序列向mRNA前体的3’末端的加入。3’区可以影响相关编码序列的转录、mRNA加工或稳定性,或者翻译。

“RNA转录物”指DNA的RNA聚合酶催化的转录产生的产物。当RNA转录物是DNA序列完全互补拷贝时,它称作初级转录物,或者它可以是来自初级转录物的转录后加工的RNA序列并且称作成熟RNA。“信使RNA”或者“mRNA”指没有内含子并且可以由细胞翻译成蛋白质的RNA。“cDNA”指与mRNA互补或者来自mRNA的双链DNA。“有义”RNA指包括mRNA并且可以因此由细胞翻译成蛋白质的RNA转录物。“反义RNA”指与靶初级转录物或者mRNA的所有或者部分互补并且阻断靶基因的表达的RNA转录物(U.S.5,107,065;WO 99/28508)。反义RNA的互补性可以是与特定基因转录物的任意部分,即在5’非编码序列、3’非编码序列或者编码序列处互补。“功能RNA”指没有翻译然而对细胞过程具有影响的反义RNA、核酶RNA或者其他RNA。

术语“可操作地连接”指一个核酸片段上核酸序列的结合使得一个核酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达(即,编码序列处于启动子的转录控制下)时,启动子可操作地连接编码序列。编码序列可以以有义或者反义方向可操作地连接调节序列。

本文所用术语“表达”指来自本发明的核酸片段的有义(mRNA)或者反义RNA的转录和稳定积累。表达还可以指mRNA翻译成多肽。

“成熟”蛋白质指翻译后加工的多肽;即已经从初级转录产物除去任何前肽的多肽。“前体”蛋白质指mRNA翻译的初级产物;即仍然存在前肽。前肽可以是(但是不限于)细胞内定位信号。

“转化”指将核酸片段转移到宿主生物,导致基因稳定的遗传。核酸片段可以是例如自主复制的质粒;或者它可以整合到宿主生物的基因组中。含有所转化的核酸片段的宿主生物称作“转基因的”或者“重组的”或者“转化的”生物。

术语“质粒”、“载体”和“盒”指染色体外元件,其通常携带不是细胞的中心代谢部分的基因,并且通常为环形双链DNA片段的形式。此类元件可以是来自任意来源的线性或环状的单链或者双链DNA或者RNA的自主复制的序列、基因组整合序列、噬菌体或者核苷酸序列,其中许多核苷酸序列已经连接或者重组成独特的结构,其能够例如,将启动子片段和所选基因产物的DNA序列以及合适的3’非翻译序列导入细胞中。“转化盒”指特定载体,其含有外源基因并且具有除了外源基因之外的元件,所述元件方便转化特定宿主细胞。“表达盒”指特定载体,其含有外源基因和除了该外源基因之外的元件,所述元件允许该基因在外来宿主中增强的表达。

术语“同源重组”指两个DNA分子之间DNA片段的交换(在交换期间)。被交换的片段的侧翼是两个DNA分子之间相同核苷酸序列的位点(即,“同源区”)。术语“同源区”指核酸片段上的核苷酸序列段,其参与相互同源的核酸片段的同源重组。当同源区具有至少约10bp长度,优选具有至少约50bp长度时,通常将发生同源重组。通常,意在用于重组的片段含有至少两个同源区,其中希望靶基因破坏和替换。

术语“序列分析软件”指可用于分析核苷酸或者氨基酸序列的任意计算机算法或者软件程序。“序列分析软件”可以通过商业途径获得或者独立开发。通常,序列分析软件将包括,但不限于:1)GCG程序套包(Wisconsin Package版本9.0,Genetics Computer Group(GCG),Madison,WI);2.)BLASTP,BLASTN,BLASTX(Altschul等人,J.Mol.Biol.215:403-410(1990));3.)DNASTAR(DNASTAR,Inc.Madison,WI);4.)Sequencher(Gene Codes Corporation,AnnArbor,MI);和5.)FASTA程序,其整合Smith-Waterman算法(W.R.Pearson,Comput.Methods Genome Res.,[Proc.Int.Symp.](1994),Meeting Date 1992,111-20.Editor(s):Suhai,Sandor.Plenum:New York,NY)。在本申请的上下文内,将理解除非另外指出,当使用序列分析软件进行分析时,分析的结果将基于所参考程序的“默认值”。本文所用的“默认值”将指当软件首次初始化时最初加载的任何一组值或者参数。

用于本文的标准重组DNA和分子克隆技术是本领域公知的并且由Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular Cloning:A Laboratory Manual,第二版,Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1989)(下文中,“Maniatis”);Silhavy,T.J.,Bennan,M.L.和Enquist,L.W.,Experiments with GeneFusions,Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1984);和Ausubel,F.M.等人,Current Protocols inMolecular Biology,published by Greene Publishing Assoc.andWiley-Interscience(1987)描述。

脂肪酸的微生物生物合成

通常,油质微生物中脂质积累由对生长培养基中存在的总的碳氮比率引发(图1)。当细胞耗尽可利用的氮供应(例如,当碳氮比率大于约40)时,细胞腺苷一磷酸(AMP)的耗尽导致线粒体中AMP-依赖的异柠檬酸脱氢酶活性的停止,将柠檬酸转运到胞质溶胶中,和随后由ATP-柠檬酸裂合酶切割以产生乙酰辅酶A。乙酰辅酶A是脂肪酸的从头生物合成的基本构件。尽管可以有效代谢以产生乙酰辅酶A的任意化合物都可以用作脂肪酸的前体,但是葡萄糖是该类型反应中的主要来源(图1)。葡萄糖通过糖酵解转化成丙酮酸,丙酮酸然后被转运到线粒体中,在线粒体中丙酮酸可以由丙酮酸脱氢酶(“PD”)转化成乙酰辅酶A。因为乙酰辅酶A不能通过线粒体膜直接转运到细胞质中,所以来自乙酰辅酶A的两个碳与草酰乙酸缩合产生柠檬酸(由柠檬酸合成酶催化)。柠檬酸直接转运到细胞质中,在细胞质中它被ATP-柠檬酸裂合酶切割以再生乙酰辅酶A和草酰乙酸。草酰乙酸通过转化成苹果酸再次进入三羧酸循环。

丙二酸单酰辅酶A的合成是脂肪酸生物合成的首先进行的步骤,它发生在细胞质中。由乙酰辅酶A羧化酶(“ACC”)对乙酰辅酶A的羧化产生丙二酸单酰辅酶A。脂肪酸合成由多酶脂肪酸合成酶复合体(“FAS”)催化并且通过8个二碳片段(来自乙酰辅酶A的乙酰基)的缩合形成16碳饱和脂肪酸棕榈酸。更具体地,FAS催化一系列7次反应,其包括下面的(Smith,S.FASEB J.,8(15):1248-59(1994)):

1.乙酰辅酶A和丙二酸单酰辅酶A转移到FAS的酰基载体蛋白质(ACP)。然后乙酰基转移到丙二酰基,形成β-酮丁酰基-ACP并释放CO2

2.β-酮丁酰基-ACP经历还原(通过β-酮酰基还原酶)和脱水(通过β-羟基酰基脱水酶)形成反式-单不饱和的脂肪酰基。

3.双键由NADPH还原,产生比最初的饱和脂肪酰基长2个碳的饱和脂肪酰基。然后再生该丁酰基与新的丙二酰基缩合和重复延伸步骤的能力。

4.当脂肪酰基变成长16个碳时,硫酯酶活性将其水解,释放游离棕榈酸。

棕榈酸(16:0)是更长链饱和和不饱和脂肪酸(例如,硬脂酸(18:0),棕榈油酸(16:1)和油酸(18:1))通过内质网膜中存在的延伸酶和去饱和酶的作用的前体。棕榈酸和硬脂酸(作为辅酶A和/和ACP酯)通过Δ9去饱和酶的作用分别转化成它们的不饱和衍生物棕榈油酸(16:1)和油酸(18:1)。

通过两分子的乙酰辅酶A与甘油-3-磷酸的酯化产生1,2-二酰基甘油磷酸(通常称作磷脂酸)形成三酰基甘油(脂肪酸的主要储存单位)(图1)。然后由磷脂酸磷酸酶除去磷酸产生1,2-二酰基甘油。当加入第三种脂肪酸,例如,通过二酰基甘油-酰基转移酶的作用形成三酰基甘油。

ω脂肪酸的生物合成

简言之,将LA转化成GLA、DGLA和ARA(ω-6途径)和将ALA转化成STA、ETA、EPA、DPA和DHA(ω-3途径)的代谢过程包括通过加入两个碳单位和通过加入双健对分子去饱和延伸碳链(图2)。这序列存在于内质网膜中的一系列专门的去饱和和延伸酶。

ω-6脂肪酸

油酸通过Δ12去饱和酶的作用首先转化成ω-6脂肪酸。随后ω-6脂肪酸如下产生:1)LA通过Δ6去饱和酶转化成GLA;2)GLA通过延伸酶的作用转化成DGLA;和3)DGLA通过Δ5去饱和酶的作用转化成ARA。

ω-3脂肪酸

亚油酸(LA)通过Δ15去饱和酶的作用首先转化成ω-3脂肪酸。随后,ω-3脂肪酸以相似于ω-6脂肪酸的一系列步骤产生。特别地:1)ALA通过Δ6去饱和酶的活性转化成STA;2)STA通过延伸酶的活性转化成ETA;和3)ETA通过Δ5去饱和酶的活性转化成EPA。备选地,可以通过Δ17去饱和酶的活性分别从DGLA和ARA产生ETA和EPA。EPA可以通过延伸酶和Δ4去饱和酶的活性进一步转化成DHA。

在备选实施方案中,Δ9延伸酶能够催化LA和ALA分别向EDA和ETrA的转化。Δ8去饱和酶然后将这些产物分别转化成DGLA和ETA。

参与ω脂肪酸产生的基因

许多微生物,包括藻类、细菌、霉和酵母可以在细胞代谢的普通过程中合成PUFAs和ω脂肪酸。尤其充分研究的是真菌,包括Schizochytrium aggregatm,破囊壶菌属的种和Morteriellaalpin。此外,许多甲藻(甲藻纲)天然产生高浓度PUFA。同样的,通过遗传方法已经鉴定了参与油产生的多种基因并且这些基因的一些的DNA序列可以公开得到(非限制性实例在下表3中显示):

                     表3

       参与PUFA产生的一些可公开得到的基因

 Genbank检索号  描述 AY131238  Argania spinosa Δ6去饱和酶 Y055118  Echium pitardii var.pitardii Δ6去饱  和酶 AY055117  Echium gentianoides Δ6去饱和酶 AF296076  鲁西毛霉Δ6去饱和酶 AF007561  Borago officinalis Δ6去饱和酶 L11421  Synechocystis sp.Δ6去饱和酶 NM_031344  大鼠(Rattus norvegicus)Δ6脂肪酸去  饱和酶 AF465283, AF465281, AF110510  高山被孢霉Δ6脂肪酸去饱和酶 AF465282  深黄被孢霉(Mortierella isabellina)  Δ6脂肪酸去饱和酶 AF419296  畸雌腐霉(Pythium irregulare)Δ6脂  肪酸去饱和酶 AB052086  卷枝毛霉(Mucor circinelloides)Δ6  脂肪酸去饱和酶的D6d mRNA AJ250735  Ceratodon purpureus Δ6脂肪酸去饱和酶  的mRNA AF126799  人(Homo sapiens)Δ6脂肪酸去饱和酶 AF126798  小鼠(Mus musculus)Δ6脂肪酸去饱和酶 AF199596, AF226273  人Δ5去饱和酶 AF320509  大鼠肝脏Δ5去饱和酶 AB072976  小鼠Δ5去饱和酶的D5D mRNA AF489588  破囊壶菌属ATCC21685Δ5脂肪酸去饱和酶

                          表3续

             参与PUFA产生的一些可公开得到的基因

 AJ510244  大雄疫霉(Phytophthora megasperma)Δ5  脂肪酸去饱和酶的mRNA AF419297  畸雌腐霉Δ5脂肪酸去饱和酶 AF07879  秀丽隐杆线虫Δ5脂肪酸去饱和酶 AF067654  高山被孢霉Δ5脂肪酸去饱和酶 AB022097  盘基网柄菌(Dictyostelium  discoideum)Δ5脂肪酸去饱和酶的mRNA AF489589.1  破囊壶菌属ATCC21685Δ4脂肪酸去饱和酶 AX464731  高山被孢霉延伸酶基因(也见WO  00/12720) AAG36933  构巢裸孢壳(Emericella nidulans)油酸  Δ12去饱和酶 AF110509, AB020033  高山被孢霉Δ12脂肪酸去饱和酶mRNA AAL13300  高山被孢霉Δ12脂肪酸去饱和酶 AF417244  高山被孢霉ATCC 16266Δ12脂肪酸去饱和  酶基因 AF161219  鲁西毛霉(Mucor rouxii)Δ12去饱和酶  mRNA X86736  Spiruline platensis Δ12去饱和酶 Genbank检索号  描述 AF240777  秀丽隐杆线虫Δ12去饱和酶 AB007640  Chlamydomonas reinhardtii Δ12去饱和  酶 AB075526  普通小球藻(Chlorella vulgaris)Δ12  去饱和酶 AP002063  拟南芥(Arabidopsis thaliana)微粒体  Δ12去饱和酶

                      表3续

          参与PUFA产生的一些可公开得到的基因

  NP_441622,  BAA18302,  BAA02924  Synechocystis sp.PCC 6803Δ15去饱和  酶  AAL36934  Perilla frutescens Δ15去饱和酶  AF338466  Acheta domesticus Δ9去饱和酶3mRNA  AF438199  Picea glauca去饱和酶Δ9(Des9)mRNA  E11368  鱼腥藻属(Anabaena)Δ9去饱和酶  E11367  Synechocystis Δ9去饱和酶  D83185  Pichia angusta Δ9脂肪酸去饱和酶DNA  U90417  Synechococcus vulcanus Δ9酰基脂质脂  肪酸去饱和酶(desC)基因  AF085500  高山被孢霉Δ9去饱和酶mRNA  AY504633  构巢裸孢壳Δ9硬脂酸去饱和酶(sdeB)基  因  NM_069854  秀丽隐杆线虫必需脂肪酸去饱和酶,硬脂  酰辅酶A去饱和酶(39.1kD)(fat-6)完  整mRNA  AF230693  甘蓝(Brassica oleracea)栽培种Rapid  Cycling硬脂酰-ACP去饱和酶(Δ9-BO-1)  基因,外显子序列  AX464731  高山被孢霉延伸酶基因(也见WO  02/08401)  NM_119617  拟南芥脂肪酸延伸酶1(FAE1)  (At4g34520)mRNA  NM_134255  小鼠ELOVL家族成员5,长链脂肪酸的延伸  (酵母)(Elov15),mRNA  NM_134383  大鼠脂肪酸延伸酶2(rELO2),mRNA  NM_134382  大鼠脂肪酸延伸酶1(rELO1),mRNA  NM_068396,  NM_068392,  NM_070713,  NM_068746,  NM_064685  秀丽隐杆线虫脂肪酸ELOngation(elo-  6),(elo-5),(elo-2),(elo-3),和  (elo-9)mRNA

此外,专利文献提供了许多参与油产生的基因的额外的DNA序列(和/或关于一些上面基因的细节和它们的分离方法)。见,例如,U.S.5,968,809(Δ6去饱和酶s);U.S.5,972,664和U.S.6,075,183(Δ5去饱和酶s);WO 91/13972和U.S.5,057,419(Δ9去饱和酶s);U.S.2003/0196217A1(Δ17去饱和酶s);WO 02/090493(Δ4去饱和酶s);WO 93/11245和WO 03/099216(Δ15去饱和酶s);WO 00/12720和U.S.2002/0139974A1(延伸酶)。这些专利和申请的每一个都完整引入本文作为参考。

本文中尤其重要的是Δ12去饱和酶,更具体地,适于在油质酵母(例如,Yarrowia lipolytica)中异源表达的Δ12去饱和酶。一些Δ12去饱和酶(即,Glycine max、Brassica napus、拟南芥、蓖麻(Ricinus communis)、玉米(Zea mays);粗糙脉孢霉、灰葡萄孢)的序列在WO 94/11516和WO 03/099216中公开。

此外,最近分离和表征了天然Yarrowia lipolytica Δ12脂肪酸去饱和酶(见,共同待决的美国专利申请10/840325,将其完整引入作为参考;也参加本文的实施例2和3,和SEQ ID NOs:51和52)。简言之,使用简并PCR引物通过PCR从Yarrowia lipolytica克隆了部分推定的Δ12去饱和酶DNA片段。使用所产生的片段对内源Yarrowialipolytica Δ12去饱和酶基因的定向破坏在所破坏的菌株中产生水平增加的18:1和没有可检测的18:2,从而证实除去了天然Δ12去饱和酶活性。随后,使用质粒拯救分离的所整合质粒侧翼的基因组DNA序列并装配了全长Yarrowia lipolytica Δ12去饱和酶基因(SEQ IDNO:51)。该序列包括1257个碱基的可该框(SEQ ID NO:51的核苷酸+283到+1539),而所推导的编码氨基酸序列长为419个残基(SEQ IDNO:52)。该Δ12去饱和酶的过表达适于增加油酸向LA的底物转化百分数(计算为([18:2]/[18:1+18:2])*100),从而它从野生型细胞中的59%增加到所转化的宿主细胞中的74%。尽管这些宿主细胞内LA的增加的可用性,但是希望得到甚至更大的底物库,其适于能够在Y.lipolytica转化细胞中高水平产生多种ω-3和/或ω-6 PUFAs。从而,具有高水平Δ12去饱和酶活性的异源蛋白质的表达在工程化生物的途径中是有益的。

许多因素影响具有Δ12去饱和酶活性的特定多肽的选择,所述多肽将在宿主细胞中表达以产生PUFAs(任选联合其他去饱和酶和延伸酶)。取决于宿主细胞,底物的有效性,和目的终产物、一些多肽是重要的;然而,对选择具有去饱和酶活性的特定多肽的考虑包括所述多肽的底物特异性,而不管所述多肽或者其组分是限速酶,该去饱和酶是所希望的PUFA的合成必需的,和/或该多肽需要辅因子。所表达的多肽优选具有于它在宿主细胞中的位置的生物化学环境相容。例如,所述多肽可以必须与宿主细胞中的其他酶竞争底物。因此,在确定给定多肽用于修饰给定宿主细胞中PUFA产生的适宜性中,考虑所述多肽的KM和比活的分析。用于具体宿主细胞的多肽是在目的宿主细胞中存在的生物化学条件下有功能的多肽,但是另外可以是具有能够修饰所希望的脂肪酸(即,油酸)的Δ12去饱和酶活性的任意多肽。从而,所述序列可以来自任意来源,例如,从天然来源分离(来自细菌、藻类、真菌、植物、动物等等),通过半合成途径产生或者从头合成。

对于本发明,然而,最希望具有Δ12去饱和酶活性的多肽当在所希望的宿主细胞中表达时具有至少约70%的转化效率,其中至少约80%的转化效率尤其合适,至少约85%的转化效率是最优选的。

鉴定新的真菌Δ12去饱和酶

使用Yarrowia lipolytica Δ12去饱和酶蛋白质序列(SEQ IDNO:52)作为查询序列,通过序列比较在本文中鉴定了来自串珠镰孢的新的Δ12去饱和酶。特别地,用Yarrowia查询序列搜索串珠镰孢菌株M-8114的专有的DuPont已表达序列标志(EST)文库(E.I.du Pont deNemours and Co.,Inc.,Wilmington,DE)的推定的编码的蛋白质序列。这导致鉴定了两种同源序列Fm1(SEQ ID NO:2)和Fm2(SEQ IDNO:4),它们分别由核苷酸序列SEQ ID NOs:1和3编码。

还将Yarrowia Δ12去饱和酶序列用作针对一些丝状真菌的公共数据库的查询序列;特别地,在构巢曲霉(SEQ ID NOs:6 and 8)、Magnaporthe grisea(SEQ ID NOs:10和12)、粗糙脉孢霉(SEQ IDNOs:14和16)、禾本科镰孢(SEQ ID NOs:18和20)、烟曲霉(SEQ IDNO:21)和黄曲霉(SEQ ID NO:22)中鉴定了同源蛋白质序列。使用Clustal W(slow,accurate,Gonnet option;Thompson等人Nucleic Acids Res.22:4673-4680(1994))的方法,基于这些序列(即,SEQ ID NOs:2,4,6,8,10,12,14,16,18,20,21和22)的比较的随后的种系发生和同源性分析揭示具有与Yarrowia Δ12去饱和酶的同源性的蛋白质的两个不同的“亚家族”。特别地,“亚家族1”的所有蛋白质(SEQ ID NOs:2,6,10,14和18)相互具有至少46.2%同一性,并且与“亚家族2”的蛋白质(SEQ ID NOs:4,8,12,16,20,21和22)具有小于39.6%的同一性(图4和5;Clustal比对方法(上文))。亚家族2的蛋白质相互具有至少56.3%同一性(见实施例4)。

因为Yarrowia仅能合成18:2(但不是18:3),而多数上述丝状真菌可以合成18:2和ALA,并且因为Yarrowia具有一种Δ12去饱和酶而多数丝状真菌具有与Yarrowia Δ12去饱和酶的两种同源物,所以本申请人推测这些生物中去饱和酶的亚家族之一代表Δ12去饱和酶,另一个亚家族代表Δ15去饱和酶。通过使用表达分析测定了两个亚家族的每一个内代表性蛋白质的活性检验了该假说。特别地,Fm1和Mg1在Yarrowia lipolytica中表达并且发现它们编码Δ15去饱和酶(见共同待决的美国临时申请60/519191);类似地,2003年12月4日的公开WO 03/099216提示本文鉴定的序列,因为亚家族1粗糙脉孢霉和构巢曲霉序列具有Δ15去饱和酶活性。相比,Fm2如本文描述的在Y.lipolytica中表达并且经表征为Δ12去饱和酶。亚家族2粗糙脉孢霉序列的Δ12去饱和酶活性在WO 03/099216中类似地得到证实。

使用Clustal比对方法(Thompson等人,Nucleic Acids Res.22:4673-4680(1994))将串珠镰孢Δ12去饱和酶推导的氨基酸序列(SEQ ID NO:4)与公共数据库序列比较。从而,串珠镰孢Δ12去饱和酶氨基酸序列基于百分数同一性最相似于本文中以SEQ ID NO:20提供的禾本科镰孢Δ12去饱和酶(在477个氨基酸长度上95%同一性)。更优选的氨基酸片段与本文的序列至少约96%同一,而97%-98%同一的那些序列是尤其适宜的,最优选约99%同一的那些序列。

以相似方式,使用Clustal比对方法,将串珠镰孢Δ12去饱和酶核苷酸碱基序列与公共数据库的比较揭示最相似的已知核酸序列(禾本科镰孢基因组计划中的重叠群1.233;本文的SEQ ID NO:19)与本文报导的串珠镰孢Δ12去饱和酶的核酸序列(SEQ ID NO:3)至少89.2%同一。对应于当前ORF的优选Δ12去饱和酶编码核酸序列为编码活性蛋白质并且与编码本文报导的串珠镰孢Δ12去饱和酶的核酸序列具有至少约89%-90%同一性的那些序列,其中具有91%-95%同一性的那些序列尤其合适,具有大于95%同一性的那些序列最优选。

同源物的鉴定和分离

本发明的Δ12去饱和酶核酸片段可以用于鉴定和分离编码来自相同或者其他细菌、藻类、真菌或者植物种类的同源蛋白质的基因。

鉴定技术

例如,本文描述的串珠镰孢Δ12去饱和酶的氨基酸或者核苷酸序列的实质部分可以用于推定性鉴定相关的多肽或者基因,可以通过本领域技术人员对序列的手工评估,或者通过使用诸如BLAST的算法(Basic Local Alignment Search Tool;Altschul,S.F.,等人,J.Mol.Biol.215:403-410(1993))和ClustalW(DNASTAR软件的Megalign程序)的计算机自动化序列比较和鉴定来进行所述鉴定。如上所述,使用Yarrowia lipolytica Δ12去饱和酶(SEQ ID NO:52)允许鉴定一组真菌去饱和酶,其当分析时,聚簇为蛋白质的两个不同的亚家族(即,亚家族1和亚家族2)。亚家族2包含上述串珠镰孢Δ12去饱和酶以及这样的蛋白质,其编码DNA序列在下列内容中发现:

·构巢曲霉基因组计划(Center for Genome Research(CGR),Cambridge,MA发起)中的重叠群1.15(scaffold 1)(AAG36933)(SEQ ID NO:8);

·Magnaporthe grisea基因组计划(CGR and International RiceBlast Genome Consortium发起)中重叠群中的基因座MG01985.1(SEQ ID NO:12);

·GenBank检索号AABX01000374(粗糙脉孢霉)(SEQ ID NO:16);

·禾本科镰孢  基因组计划(the CGR and the InternationalGibberella zeae Genomics Consortium(IGGR)发起)中的重叠群1.233(SEQ ID NO:20);

·烟曲霉基因组计划(Sanger Institute发起,the Universityof Manchester and The Institute of Genome Research(TIGR)合作)中的AFA.344248:345586(反相)(SEQ ID NO:21);和,

·GenBank检索号AY280867(黄曲霉)(SEQ ID NO:22)。

假设上面的蛋白质的每一种都编码Δ12去饱和酶。该假设在WO03/099216对粗糙脉孢霉进行了证实。

对上面蛋白质的分析揭示,根据Clustal比对方法(上文),这些蛋白质与串珠镰孢Δ12去饱和酶(SEQ ID NO:4)具有至少56.3%序列同一性(图5)。此外,将本发明中亚家族2的Δ12去饱和酶与其他已知的Δ12去饱和酶比较;然而,此处亚家族2的Δ12去饱和酶与Yarrowia lipolytica Δ12去饱和酶(51.6%同一性;图6)比与任意其他已知的Δ12去饱和酶的同源性更高。本领域技术人员将能够使用相似的方法鉴定将在亚家族2中聚簇的其他直向同源蛋白质(在此处鉴定为Δ12去饱和酶)。

备选地,本发明去饱和酶序列的任一种(即,SEQ ID NOs:3,4,7,8,11,12,15,16,19,20,21和22)可以用作同源物鉴定中的杂交试剂。核酸杂交试验的基本成分包括探针、怀疑含有目的基因或基因片段的样品和特定杂交方法。本发明的探针通常是单链核酸序列,其与待检测的核酸序列互补。探针与待检测的核酸序列是“可杂交的”。探针长度可以从5个碱基到数万碱基不等,并且将取决于所进行的特定试验。通常,约15个碱基到约30个碱基的探针长度是合适的。仅部分探针分子需要与待检测的核酸序列互补。此外,探针和靶序列之间的互补性不必是完全的。在不完全互补的分子之间发生杂交,结果杂交区中的一部分碱基不与适当的互补碱基配对。

杂交方法是成熟的。通常,探针和样品必须在将允许核酸杂交的条件下混合。这包括在无机或者有机盐存在下在适当的浓度和温度条件下将探针和样品接触。探针和样品核酸必须接触足够长的时间使得可以发生探针和样品核酸之间发生任何可能的杂交。混合物中探针或者靶标的浓度将决定发生杂交所必要的时间。探针或者靶标浓度越高,需要的杂交孵育时间越短。任选地,可以加入离液剂。离液剂通过抑制核酸酶活性稳定核酸。此外,离液剂允许室温下短寡核苷酸探针的灵敏和严格杂交(Van Ness和Chen,Nucl.Acids Res.19:5143-5151(1991))。适宜的离液剂包括氯化胍、硫氰酸胍、硫氰酸钠、四氯代乙酸锂、高氯酸钠、四氯代乙酸铷、碘化钾和三氟乙酸铯,等等。通常,离液剂将以约3M的终浓度存在。如果希望,可以将甲酰胺加入到杂交混合物,浓度通常为30-50%(v/v)。

可以使用多种杂交溶液。通常,这些包含约20到60%体积,优选30%的极性有机溶剂。常用的杂交溶液使用约30-50%v/v甲酰胺,约0.15到1M氯化钠,约0.05到0.1M缓冲液(例如,柠檬酸钠,Tris-HCl,PIPES或HEPES(pH范围约6-9)),约0.05到0.2%去污剂(例如,十二烷基硫酸钠),或0.5-20mM EDTA,FICOLL(PharmaciaInc.)(约300-500kdal),聚乙烯吡咯酮(约250-500kdal),和血清白蛋白。典型杂交溶液中还包括的将是约0.1到5mg/mL未标记的载体核酸、片段化核DNA(例如,小牛胸腺或鲑精DNA,或酵母RNA),和任选约0.5到2%wt/vol甘氨酸。还可以包括其他添加剂,如体积排阻剂,其包括多种极性水溶性或者膨胀剂(例如,聚乙二醇),阴离子聚合物(例如,聚丙烯酸酯或者聚异丁烯酸酯)和阴离子糖类聚合物(例如,硫酸葡聚糖)。

核酸杂交适于多种测定形式。一种最适宜的是夹层测定形式。夹层测定尤其适于在非变性条件下杂交。夹层型测定的主要成分是固相支持体。固相支持体已经在其上吸附或者偶联了固定化核酸探针,其是未标记的或者与序列的一部分互补。

分离方法

本发明的串珠镰孢Δ12去饱和酶核酸片段(或者本文鉴定的任意Δ12去饱和酶[SEQ ID NOs:7,8,11,12,15,16,和19-22])可以用于分离编码来自相同或者其他细菌、藻类、真菌或者植物种类的同源蛋白质的基因。使用序列依赖性方案分离同源基因是本领域公知的。

序列依赖性方案的实例包括,但不限于:1)核酸杂交方法;2)DNA和RNA扩增方法,如通过核酸扩增技术的多种用途例证[例如,聚合酶链式反应(PCR),Mullis等人,美国专利4,683,202;连接酶链反(LCR),Tabor,S.等人,Proc.Acad.Sci.USA 82:1074(1985);或者链置换扩增(SDA),Walker,等人,Proc.Natl.Acad.Sci.U.S.A.,89:392(1992)];和3)文库构建和通过互补作用筛选的方法。

例如,使用本领域技术人员公知的方法,通过用本发明核酸片段的全部或者一部分作为DNA杂交探针筛选来自任意希望的酵母或者真菌的文库,可以直接分离编码与本文描述的去饱和酶相似的蛋白质或者多肽的基因(其中将优选产生LA[或者LA衍生物]的那些酵母或者真菌)。通过本领域已知的方法(Maniatis,上文)可以设计和合成基于本发明核酸序列的特异寡核苷酸探针。此外,完整序列可以直接用于由技术人员合成DNA探针(例如,随机引物DNA标记、缺口翻译或者末端标记技术),或者使用可利用的体外RNA转录系统合成RNA探针。此外,可以设计并使用特异引物扩增本发明序列的部分(或者全长序列)。所得扩增产物可以在扩增反应期间直接标记或者在扩增反应后标记,并用作探针在适宜严格性的条件下分离全长DNA片段。

通常,在PCR型扩增技术中,引物具有不同序列并且不相互互补。取决于所希望的测试条件,应该设计引物的序列以提供靶核酸的有效和可靠的复制。PCR引物设计方法是本领域常见和公知的(Thein和Wallace,“The use of oligonucleotide as specifichybridization probes in the Diagnosis of Genetic Disorders”,in Human Genetic Diseases:A Practical Approach,K.E.DavisEd.,(1986)pp 33-50,IRL:Herndon,VA;and Rychlik,W.,InMethods in Molecular Biology,White,B.A.Ed.,(1993)Vol.15,pp 31-39,PCR Protocols:Current Methods andApplications.Humania:Totowa,NJ)。

通常本发明序列的两种短片段可以用于聚合酶链式反应方案中来从DNA或者RNA扩增编码同源基因的更长的核酸片段。还可以对所克隆的核酸片段文库进行聚合酶链式反应,其中一种引物的序列来自本发明核酸片段,另一种引物的序列利用了编码微生物基因的mRNA前体的3,末端的聚腺苷酸序列。

备选地,第二种引物序列可以基于来自克隆载体的序列。例如,技术人员可以通过使用PCR扩增转录物的单个点和3’或5’末端之间区域的拷贝,按照RACE方案(Frohman等人,PNAS USA 85:8998(1988))来产生cDNA。可以从本发明序列设计3’和5’方向取向的引物。使用通过商业途径可获得的3’RACE或5’RACE系统(Gibco/BRL,Gaithersburg,MD),可以分离特定3’或5’cDNA片段(Ohara等人,PNAS USA 86:5673(1989);Loh等人,Science 243:217(1989))。

本发明核苷酸和推导的氨基酸序列的有效性方便了DNA表达文库的免疫学筛选。可以合成代表本发明氨基酸序列的部分的合成肽。这些肽可以用于免疫动物以产生对包含所述氨基酸序列的肽或者蛋白质具有特异性的多克隆或者单克隆抗体。这些抗体可以用于筛选DNA表达文库来分离全长目的DNA克隆(Lerner,R.A.Adv.Immunol.36:1(1984);Maniatis,上文)。

用于提高异源表达的基因优化

多种技术可用于提高特定目的Δ12去饱和酶在备选宿主中的表达。两种此类技术包括密码子优化和基因诱变。

密码子优化

对于一些实施方案,可能希望修饰例如,编码具有Δ12去饱和酶活性的多肽的密码子的部分,以便增强编码这些多肽的基因在备选宿主(即,油质酵母)中的表达。

通常,通过检查蛋白质(优选以录大量表达的那些蛋白质)的密码子选择并确定那些密码子以最高频率使用可以确定特定目的宿主物种中的宿主优选的密码子。然后,可以使用该宿主物种中优选的密码子完整或者部分合成具有去饱和酶活性的目的多肽的编码序列。还可以合成DNA的全部(或者部分)以除去将在所转录的mRNA中存在的任何不稳定序列或者二级结构区。可以合成DNA的全部(或者部分)以将碱基组成改变成所希望的宿主细胞中更优选的碱基组成。

在本发明的优选实施方案中,来自例如串珠镰孢,构巢曲霉,Magnaporthe grisea,粗糙脉孢霉,禾本科镰孢,烟曲霉和黄曲霉的Δ12去饱和酶可以经密码子优化后在异源油质酵母宿主,例如Yarrowia lipolytica中表达。

诱变

合成序列并将序列聚集的方法是文献中非常确实的。例如,体外诱变和选择、定点诱变、易错PCR(Melnikov等人,Nucleic AcidsResearch,27(4):1056-1062(February 15,1999)),“基因改组”(U.S.5,605,793;U.S.5,811,238;U.S.5,830,721;和U.S.5,837,458)或者其他方法可以用于得到天然发生的去饱和酶,如本文描述的Δ12去饱和酶的基因的突变。这将允许在体内产生具有去饱和酶活性的多肽,其具有在宿主中发挥功能所需的多种所希望的物理和动力学参数(例如,更长的半寿期或者产生所希望的PUFA的更高速率)。

如果希望,可以通过常规诱变、所得突变多肽的表达和确定它们的活性可以确定对于酶活性重要的去饱和酶多肽的区域。突变体可以包括缺失、插入和点突变,或者其组合。典型的功能分析以缺失诱变开始,该缺失诱变用于确定所述蛋白质的功能必需的N-和C-末端界限,然后产生内部缺失、插入或者点突变体以进一步确定功能必需的区域。还可以使用其他技术,如盒诱变或者总合成。例如,通过使用外切核酸酶以顺序除去5’或者3’编码区可以完成缺失诱变。此类技术可以使用试剂盒。缺失后,通过将含有起始或者终止密码子的寡核苷酸连接到分别5’或3’缺失后缺失的编码区,可以完成编码区。备选地,通过包括定点诱变、诱变PCR的多种方法或者通过连接到消化的DNA的现有的限制性位点上可以将编码起始或者终止密码子的寡核苷酸插入到编码区。通过多种方法可以进行相似的内部插入,所述方法包括使用DNA中的现有限制性位点,通过使用诱变引物经定点诱变或者诱变PCR。通过诸如接头分区诱变、定点诱变或者诱变PCR的技术可以进行点突变。化学诱变也可以用于鉴定对于活性重要的去饱和酶多肽区。表达突变构建体,并测定所得改变的蛋白质发挥去饱和酶功能的能力。此类结构-功能分析可以确定可以缺失哪些区,那些区耐受插入,和那些点突变允许突变蛋白质以与天然去饱和酶基本相同的方式发挥功能。来自本文描述的去饱和酶基因的所有此类突变蛋白质和编码它们的核苷酸序列都在本发明范围内。

从而,本发明包含如在所附序列表中报导的Δ12去饱和酶基因的完整序列、那些完整序列的互补序列、那些序列的实质性部分、源于它们的密码子优化的去饱和酶,和与它们基本上同源的那些序列。

ω-3和/或ω-6脂肪酸的微生物生产

ω-3和/或ω-6脂肪酸的微生物生产与从天然来源如鱼或者植物纯化相比具有一些优点。例如:

1.)与高级生物相比,已知许多微生物具有极大简化的油组成,使得所希望的组分的纯化更容易;

2.)微生物生产不受外部变量,如天气或者食物供应导致的波动;

3.)微生物产物的油基本上无环境污染物的污染;

4.)微生物可以提供特定形式的PUFA,其可以具有特定用途;和

5.)通过控制培养调节,特别是通过提供用于微生物表达的酶的特定底物,或者通过加入化合物或者用基因工程方法抑制不希望的生物化学途径,可以操控微生物油生产。

除了这些优点,从重组微生物生产ω-3和/或ω-6脂肪酸提供了改变天然产生的微生物脂肪酸图的能力,通过改变宿主中新的生物合成经,或者通过抑制不希望的途径,从而增加所希望的PUFA的水平(或者其缀合形式)和降低不希望的PUFA的水平(见,共同待决的美国专利申请10/840579,这里完整引入作为参考)可以实现所述目睹。

产生多种ω-3和/或ω-6脂肪酸的方法

预计引入处于适当启动子控制下的编码本文描述的Δ12去饱和酶的嵌合基因将导致所转化的宿主生物中LA的产生增加。同样地,本发明包括指导PUFA产生的方法,其包括将脂肪酸底物(即,油酸)暴露于此处描述的PUFA酶(例如,串珠镰孢Δ12去饱和酶),从而底物转化成所希望的脂肪酸产物(即,LA)。更特别地,本发明的一个目的是提供在油质酵母中产生LA的方法,其中为所述油质酵母提供了:(a)编码具有Δ12去饱和酶活性的真菌蛋白质的分离的核酸片段,当基于Clustal比对方法将所述蛋白质与具有SEQ ID NO:4中给出的序列的多肽比较时具有至少56.3%同一性;和(b)由油酸组成的去饱和酶底物来源;其中酵母在一定条件下生长,使得嵌合去饱和酶基因表达并且油酸转化成LA,并且其中任选回收LA。从而,该方法最少包括使用下面的Δ12去饱和酶:如本文描述的SEQ ID NOs:4、8、12、16、20、21和22。

备选地,每种PUFA基因和其相应的在本文描述的酶产物可以间接用于产生ω-3和/或ω-6 PUFA。发生PUFA的间接产生,其中脂肪酸底物通过中间步骤或者中间途径间接转化成目的脂肪酸产物。从而,预期本文描述的Δ12去饱和酶与编码其他酶的一种或多种基因一起表达,从而发生一系列反应以产生所希望的产物。在优选实施方案中,例如,宿主生物可以用包含编码PUFA生物合成途径的酶的基因以导致更高水平地产生ω-3和/或ω-6脂肪酸(例如,GLA、DGLA、ARA、ALA、STA、ETA、EPA、DPA和DHA)。特别地,例如,可以希望在宿主细胞中表达任一种本文描述的Δ12去饱和酶,所述宿主细胞还表达:1)编码用于过量产生GLA的Δ6去饱和酶的基因;2)表达盒,其包含编码用于过量产生DGLA的Δ6去饱和酶和高亲和性延伸酶的基因;3)编码用于过量产生ARA的Δ6去饱和酶、高亲和性延伸酶和Δ5去饱和酶的基因;或4)编码用于过量产生EPA的Δ6去饱和酶、高亲和性延伸酶、Δ5去饱和酶和Δ17去饱和酶的基因。在备选实施方案中,例如,可以希望在细胞中过量表达如本文描述的Δ12去饱和酶,所述细胞还表达:1)编码用于过量产生ALA的Δ15去饱和酶的基因2)编码用于过量产生STA的Δ15去饱和酶和Δ6去饱和酶的基因;3)编码用于过量产生ETA的Δ15去饱和酶、Δ6去饱和酶和高亲和性延伸酶的基因;4)编码用于过量产生EPA的Δ15去饱和酶、Δ6去饱和酶、高亲和性延伸酶和Δ5去饱和酶的基因。如本领域技术人公知的,下面酶活性的多种其他组合可以用于在宿主中与本文的去饱和酶一起表达:Δ15去饱和酶、Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ17去饱和酶、Δ9去饱和酶、Δ8去饱和酶和/或延伸酶(图2)。在特定表达盒中包括的特定基因将取决于宿主细胞(和它的PUFA图和/或去饱和酶图)、底物的可用性,和所希望的终产物。

在备选实施方案中,有用的是基于本文描述的完整序列、那些完整序列的互补序列、那些序列的实质性部分、来源于所述序列的密码子优化的去饱和酶和与所述序列基本上同源的那些序列,可以破坏宿主生物的天然Δ12去饱和酶。例如,宿主生物中Δ12去饱和酶的定向那破坏产生不能合成LA的突变菌株。

表达系统、盒和载体

可以在异源微生物细胞,尤其在油质酵母(例如,Yarrowialipolytica)的细胞中产生本文描述的本发明序列的基因和基因产物。重组微生物宿主中的表达可以用于产生多种PUFA途径中间产物,或者用于调节宿主中现有的PUFA途径用以合成迄今使用该宿主不可能合成的新产物。

含有指导外源蛋白质的高水平表达的调节序列的微生物表达系统和表达载体是本领域技术人员公知的。这些表达系统和表达载体的任一种都可以用于构建嵌合基因用来产生本发明序列的基因产物的任一种。这些嵌合基因可以然后通过转化导入适宜的微生物以提供所编码酶的高水平表达。

用于转化适宜的宿主细胞的载体或者DNA盒是本领域公知的。构建体中存在的序列的特定选择取决于所希望的表达产物(上文)、宿主细胞的性质和所建议的分离转化细胞与未转化细胞的方法。然而,通常,载体或者表达盒含有指导相关基因转录和翻译的序列、选择性标记和允许自主复制或者染色体整合的序列。适宜的载体包含控制转录起始的基因5’区和控制转录终止的DNA片段3’区。当两个控制区都来自所转化的宿主细胞的基因时是最优选的,尽管将理解此类控制区不必来自选择生产宿主的特定物种天然的基因。

用于驱动本发明ORF在所希望的宿主细胞中表达的起始控制区或者启动子有许多并且是本领域技术人员熟悉的。几乎能够指导这些基因在所选宿主细胞中表达的任何启动子都适于本发明。可以以瞬时或者稳定的方式完整宿主细胞中的表达。通过诱导与目的基因可操作地连接的可调节的启动子的活性可以完成瞬时表达。通过使用与目的基因可操作地连接的组成型启动子可以实现稳定表达。作为实例,当宿主细胞是酵母时,提供了在酵母细胞中有功能的转录和翻译区,尤其来自宿主物种的转录和翻译区。例如可以从如下得到转录起始调节区:1)糖酵解途径中的基因,如醇脱氢酶、甘油醛-3-磷酸-脱氢酶(见美国专利申请号10/869630)、磷酸甘油酸变位酶(见美国专利申请号10/869630)、果糖二磷酸醛缩酶(见美国专利申请号60/519971)、磷酸葡萄糖异构酶、磷酸甘油酸酯激酶、甘油-3-磷酸O-酰基转移酶(见美国专利申请号60/610060),等等;或者2)可调节的基因,如酸性磷酸酶、乳糖酶、金属硫蛋白、葡萄糖淀粉酶、翻译延伸因子EF1-α(TEF)蛋白质(U.S.6,265,185)、核糖体蛋白质S7(U.S.6,265,185)等等。可以使用多种调节序列的任一种,这取决于希望组成型还是诱导型转录、启动子在表达目的ORF中的效率、构建的容易性,等等。

已经发现翻译起始密码子ATG周围的核苷酸序列影响酵母细胞中的表达。如果本发明Δ12去饱和酶的任一种在酵母中表达很弱,那么可以修饰外源基因的核苷酸序列以包括有效的酵母翻译起始序列从而得到最佳的基因表达。为了在酵母中表达,这可以通过无效表达的基因的定点诱变来进行,通过将所述基因融合在内源酵母基因,优选高度表达的基因的框内来进行所述定点诱变。备选地,可以确定宿主中共有翻译起始序列并将该序列改造成异源基因用于它们在目的宿主中的最佳表达(关于可应用于Yarrowia lipolytica的特定教导见,例如,美国专利申请号10/840478)。

终止区可以来自基因的3’区,其中起始区从所述基因得到或者来自不同的基因。多种终止序列是已知的并且在多种宿主中令人满意地发挥功能(当用于与它们所来源的相同或不同的属和种时)。通常选择终止区更多是由于方便而不是因为任何具体性质。优选地,终止区来自酵母基因,尤其酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、假丝酵母属(Candida)、Yarrowia或者克鲁维酵母属(Kluyveromyces)。还已知编码γ-干扰素和α-2干扰素的哺乳动物基因的3’区在酵母中有功能。终止控制区还可以来自优选宿主天然的多种基因。任选地,终止位点可以是不必要的;然而,最优选包括终止位点。

如本领域技术人员已知的,仅将基因插入到克隆载体不能确保它将以所需的水平成功地表达。响应更高表达率的需要,通过操作许多不同的遗传元件已经产生了许多专门的表达载体,所述遗传元件控制转录、翻译、蛋白质稳定性、氧限制、和从宿主细胞的分泌。更特别地,已经操作用以控制基因表达的一些分子特征包括:1)相关转录启动子和终止子序列的性质;2)所克隆的基因拷贝数和该基因是包含在质粒中还是整合到宿主的染色体中;3)所合成的外源蛋白质的最终细胞定位;4)宿主生物中翻译效率;5)宿主细胞内所克隆的基因蛋白质的内在稳定性;和6)所克隆基因内的密码子选择,从而它的频率接近宿主细胞的优选密码子选择的频率。这些类型修饰的每一种都包括在本发明中,作为进一步优化本文所述的Δ12去饱和酶的表达的方式。

微生物宿主的转化

一旦已经得到了编码适于在油质酵母中表达的多肽的DNA,就将它置于能够在宿主细胞中自主复制的质粒载体中,或者它直接整合到宿主细胞的基因组中。表达盒的整合可以在宿主基因组内随机发生或者可以通过使用含有与宿主基因的同源性区的构建体靶定,所述同源性足够与宿主基因座的靶定重组。当构建体靶向内源基因座时,通过内源基因座可以提供所有或者一些转录和翻译调节区。

当从分开的复制载体表达两种和多种基因时,希望每种载体具有不同的分泌方式并且应该缺少与其他载体的同源性从而保持稳定表达和防止构建体间元件的再分布。可以通过实验确定调节区的慎重选择、选择方法和增殖方法,从而所有导入的基因以提供目的产物合成必要的水平表达。

包含目的基因的构建体可以通过标准技术导入宿主细胞。这些技术包括转化(例如,乙酸锂转化[Methods in Enzymology,194:186-187(1991)])、原生质体融合、生物射弹轰击(biolisticimpact)、电穿孔、微注射或者将目的基因导入宿主细胞的任意其他方法。适于油质酵母(即,Yarrowia lipolytica)的更特别的教导包括美国专利号4,880,741和5,071,764和Chen,D.C.等人(ApplMicrobiol Biotechnol.48(2):232-235-(1997))。

为了方便,已经通过任意方法操作以吸收DNA序列(例如,表达盒)的宿主细胞将在本文称作“转化的”或者“重组的”。所转化的宿主将具有表达构建体的至少一个拷贝并且可以具有两个或多个拷贝,这取决于所述基因整合到基因组、扩增,还是存在于具有多个拷贝数的染色体外元件上。通过选择所导入的构建体上含有的标记可以鉴定转化的宿主细胞。备选地,可以有目的构建体共同转化单独的标记构建体,因为许多转化技术向宿主细胞导入许多DNA分子。通常,对转化的宿主选择它们在选择性培养基上生长的能力。选择性培养基可以掺入抗生素或者缺少未转化的宿主的生长必需的因子,如营养物或者生长因子。所导入的标记基因可以赋予抗生素抗性,或者编码必需生长因子或者酶,从而当在所转化的宿主中表达时允许在选择性培养基上生长。当可以直接或者间接检测表达的标记蛋白质时,也可以发生经转化的宿主细胞的选择。标记蛋白质可以单独或者作为与另一种蛋白质的融合蛋白表达。标记蛋白质可以通过如下检测:1)它的酶促活性(例如,β半乳糖苷酶可以将底物X-gal[5-溴-4-氯-3-吲哚基-β-D-吡喃半乳糖苷]转化成有色产物;萤光素酶可以萤光素转化成发光产物);或者2)它的光产生或者修饰特征(例如,Aequorea victoria的绿色荧光蛋白当用蓝光照射时发荧光)。备选地,可以用抗生素检测例如,目的蛋白质上的标记蛋白质或者分子标签。可以例如,通过视觉或者通过诸如FACS或者使用抗体淘选可以选择表达标记蛋白质或者标签的细胞。对于酵母转化株的选择,可以使用在酵母中有功能的任意标记。理想地,对卡那霉素、潮霉素和氨基糖苷G418的抗性是重要的以及在缺少尿嘧啶或者亮氨酸的培养基上生长的能力。

转化后,适于本发明Δ12去饱和酶(和任选地在宿主细胞内共表达的其他PUFA酶)的底物可以由宿主天然地或者转基因地产生,或者它们可以外源地提供。

微生物中ω-3和/或ω-6脂肪酸生物合成的代谢工程化

本发明Δ12去饱和酶的序列的知识将可以用于操作油质酵母,尤其Yarrowia lipolytica中ω-3和/或ω-6脂肪酸生物合成。这可能需要PUFA生物合成途径内的直接代谢工程化或者对PUFA生物合成途径贡献碳的途径的额外操作。用于操作生物化学途径的方法是本领域技术人员公知的。

用于上调所希望的生物合成途径的技术

可以将去饱和酶(任选延伸酶)的额外拷贝导入宿主中以增加ω-3和/或ω-6脂肪酸生物合成途径的输出,通常通过使用多拷贝质粒。去饱和酶和延伸酶基因的表达也可以通过使用更强的启动子(受调节的或者组成型的)在转录水平上增加,以导致增加的表达,通过从所述mRNA或者编码的蛋白质除去/缺失区去稳定序列,或者通过向所述mRNA加入稳定序列(U.S.4,910,141)也可以增加所述表达。增加异源去饱和酶或者延伸酶基因的表达的再一种方法是通过将天然基因中的密码子用用于在所选宿主微生物中最佳基因表达的密码子代替来增加所编码mRNA的翻译效率。

下调不希望的生物合成途径的技术

相反地,与ω-3和/或ω-6脂肪酸生物合成途径竞争能量或者碳的生物化学途径,或者干扰特定PUFA终产物的产生的天然PUFA生物合成途径酶可以通过基因破坏消除或者通过其他方法(例如,反义mRNA)下调。对于基因破坏,将外源DNA片段(通常选择性标记基因)插入到待破坏的结构基因中以便中断它的编码序列并从而功能地失活所述基因。将破坏盒转化到宿主细胞导致通过与非功能破坏的基因的同源重组代替功能的天然基因(见,例如:Hamilton等人J.Bacteriol.171:4617-4622(1989);Balbas等人Gene 136:211-213(1993);Gueldener等人Nucleic Acids Res.24:2519-2524(1996);和Smith等人Methods Mol.Cell.Biol.5:270-277(1996))。

反义技术是当已知靶基因的序列时下调基因的另一种方法。为了完成该目的,将来自所希望的基因的核酸片段克隆并可操作地连接启动子从而将转录RNA的反义链。然后将该构建体导入宿主细胞并产生RNA的反义链。反义RNA通过防止编码目的蛋白质的mRNA的积累抑制基因表达。本领域技术人员将知道特定考虑与反义技术的用途结合以便减小具体基因的表达。例如,反义基因表达的适宜水平可以需要使用不同的嵌合基因,利用技术人员已知的不同调节元件。

尽管靶定基因破坏和反义技术提供了当已知序列时下调基因的有效方法,但是已经开发了不是基于序列的特异性较低的方法。例如,可以将细胞暴露于紫外照射然后筛选所希望的表型。用化学剂诱变对于产生突变体也是有效的并且是常用的物质,包括影响非复制的DNA的化学品(例如,HNO2和NH2OH),以及影响正复制的DNA的试剂(例如,吖啶类染料,已知其导致移码突变)。使用辐射或者化学试剂产生突变体的特定方法在本领域中详细记载。参加,例如:Thomas D.Brock in Biotechnology:A Textbook of IndustrialMicrobiology,2nd ed.(1989)Sinauer Associates:Sunderland,MA;or Deshpande,Mukund V.,Appl.Biochem.Biotechnol.,36:227(1992)。

基因破坏的另一种非特异方法是使用转座元件或者转座子。转座子是随机插入DNA但是可以基于序列确定发生插入的位置在以后恢复的遗传元件。体内和体外转座方法都是已知的。两种方法包括使用转座元件联合转座酶。当转座元件或者转座子在转座酶存在下与核酸片段接触时,转座元件将随机插入到该核酸片段中。该技术用于随机诱变和基因分离,因为可以基于转座元件的序列鉴定所破坏的基因。用于体外转座的试剂盒可以通过商业途径获得[见,例如:1)PrimerIsland Transposition试剂盒,其可以从Perkin Elmer AppliedBiosystems,Branchburg,NJ得到,基于酵母Ty1元件;2)GenomePriming System,其可以从New England Biolabs,Beverly,MA得到,基于细菌转座子Tn7;和3)EZ::TN Transposon InsertionSystems,其可以从Epicentre Technologies,Madison,WI获得,基于Tn5细菌转座元件]。

在本发明上下文中,有用的是通过上述方法之一调节脂肪酸生物合成途径的表达。例如,本发明提供了编码所述生物合成途径中的关键酶的基因(即,Δ12去饱和酶),导致产生ω-3和/或ω-6脂肪酸。尤其有用的是在油质酵母中表达产生不足量的18:2脂肪酸的这些基因,和使用用于宿主生物的代谢工程化的多种方法调节这种和其他PUFA生物合成基因的表达以最大化优选PUFA产物的产生。同样地,为了最大化这些基因的PUFA产生,有必要破坏竞争指向PUFA生物合成的碳流的途径。

在备选实施方案中,可能希望破坏本文的Δ12去饱和酶,以防止ω-3和/或ω-6脂肪酸的合成。在另一备选实施方案中,可能通过将任一种本发明的Δ12去饱和酶基因置于可诱导的或者受调节的启动子控制下调节ω-3和/或ω-6脂肪酸的产生。

用于重组表达Δ12去饱和酶的优选微生物宿主

用于表达本发明基因和核酸片段的宿主细胞可以包括在多种原料,包括简单和复杂糖类、有机酸和醇,和/或烃上在宽范围的温度和pH值下生长的微生物宿主。尽管已经分离了用于在油质酵母,尤其Yarrowia lipolytica中表达的本发明中描述的基因,但是预计因为转录、翻译和蛋白质生物合成装置是高度保守的,所以任意细菌、酵母、藻类和/或丝状真菌将是用于表达本发明核酸片段的适宜的宿主。

优选的宿主是油质生物,如油质酵母。这些油质生物天然地能够进行油合成和积累,其中油可以占细胞干重的约25%以上,或者优选细胞干重的约30%以上,最优选细胞干重的约40%以上。通常鉴定为油质酵母的属包括,但不限于:Yarrowia、假丝酵母属、红酵母属、红冬孢酵母属、隐球菌属、毛孢子菌属和油脂酵母属。更特别地,阐明性油合成酵母包括:Rhodosporidium toruloides,Lipomycesstarkeyii,L.lipoferus,Candida revkaufi,C.pulcherrima,C.tropicalis,C.utilis,Trichosporon pullans,T.cutaneum,Rhodotorula glutinus,R.graminis和Yarrowia lipolytica以前分类为Candida lipolytica)。最优选地是油质酵母Yarrowialipolytica;在另一实施方案中,最优选称作ATCC #76982、ATCC#20362、ATCC #8862、ATCC #18944和/或LGAM S(7)1的Yarrowialipolytica菌株(Papanikolaou S.,和Aggelis G.,Bioresour.Technol.82(1):43-9(2002))。

其他优选的微生物宿主包括油质细菌、藻类和其他真菌(例如,Thraustochytrium sp.,Schizochytrium sp.和Mortierellasp.)。

用于PUFA生产的发酵方法

所转化的微生物宿主细胞在优化脂肪酸生物合成基因活性和产生最大和最经济的脂肪酸产率(例如,LA,其可以又增加多种ω-3和/或ω-6脂肪酸的产生)的条件下生长。通常,可以优化的培养基条件包括碳源的类型和量、氮源的类型和量、碳-氮比率、氧水平、生长温度、pH、生物量生产期的长度、油积累期的长度和细胞收获的时间。目的微生物,如油质酵母生长在复杂培养基(例如,酵母提取物-蛋白胨-葡萄糖培养基(YPD)或者缺少生长必需组分的确定的基本培养基并从而强迫选择所希望的表达盒(例如,Yeast Nitrogen Base(DIFCO Laboratories,Detroit,MI))。

本发明中的发酵培养基必须含有适宜的碳源。适宜的碳源可以包括,但不限于:单糖(例如,葡萄糖、果糖),二糖(例如,乳糖或蔗糖),寡糖,多糖(例如,淀粉、纤维素或者其混合物),糖醇(例如,甘油)或者来自可更新的原料的混合物(例如,干酪乳清渗透物、玉米浆、甜菜糖蜜、大麦麦芽)。此外,碳源可以包括烃类、脂肪酸、脂肪酸酯、甘油一酯、甘油二酯、甘油三酯、磷脂和脂肪酸的多种商业来源,包括植物油(例如,大豆油)和动物脂肪。此外,碳底物可以包括一碳底物(例如,二氧化碳或者甲醇),已经为所述底物阐明了向关键生物化学中间物的代谢转化。因此,预计用于本发明的碳源可以包括多种含碳底物并且将仅受到宿主生物的选择的限制。尽管预计所有上述碳底物和其混合物将适于本发明,但是优选的碳底物为糖和/或脂肪酸。最优选的是葡萄糖和/或含有10-22个碳的脂肪酸。可以从无机(例如,(NH4)2SO4)或者有机来源(例如,尿素或者谷氨酸)提供氮。除了适宜的碳和氮源,发酵培养基必须还含有适宜的矿物质、盐、辅因子、缓冲剂、维生素、和本领域已知的其他组分,它们适于微生物的生长和促进PUFA产生必要的酶途径。特别注意处理脂类和PUFA合成的一些金属离子(例如,Mn+2,Co+2,Zn+2,Mg+2)(Nakahara,T.等人Ind.Appl.Single Cell Oils,D.J.Kyle and R.Colin,eds.pp 61-97(1992))。

本发明中优选的生长培养基是通常商业制备的培养基,如YeastNitrogen Base(DIFCO Laboratories,Detroit,MI)。也可以使用其他限定的或者合成生长培养基并且用于生长特定微生物的适宜培养基将是微生物学或者发酵科学领域技术人员已知的。用于发酵的适宜的pH范围通常为约pH4.0到pH8.0,其中pH 5.5到pH 7.0优选为最初生长条件的范围。发酵可以在需氧或者厌氧条件下进行,其中优选微需氧条件。

通常油质微生物中PUFA的高水平积累需要两阶段方法,因为代谢状态必须在生长或者脂肪的合成/贮存之间“平衡”。从而,最优选地,两阶段发酵方法是在油质酵母中产生PUFA必需的。在该方法中,发酵的第一阶段致力于产生和积累细胞量并且特征是快速细胞生长和细胞分裂。在发酵第二阶段中,优选建立培养物中氮消除条件以促进高水平脂质积累。该氮消除的影响将是减小细胞中AMP的有效浓度,从而减小线粒体的NAD依赖性异柠檬酸脱氢酶的活性。当这发生时,柠檬酸将积累,从而形成细胞质中乙酰辅酶A的大量库并引发脂肪酸合成。从而,该阶段的特征是细胞分裂的停止,接着是合成脂肪酸和积累油。

尽管细胞通常在约30℃生长,但是一些研究已经显示在较低温度下不饱和脂肪酸的合成增加(Yongmanitchai和Ward,Appl.Environ.Microbiol.57:419-25(1991))。基于方法经济性,两阶段的第一阶段后可能发生该温度变动,此时已经发生了大量生物生长。

预计可以应哟个多种发酵方法设计,其中希望使用本发明Δ12去饱和酶基因进行ω脂肪酸的商业生产。例如,通过分批、补料分批和连续发酵方法可以产生从重组微生物宿主商业生产PUFA。

批发酵过程是一种密闭系统,其中培养基组分在该过程的开始设定并且除了为在该过程期间保持pH和氧气水平,不进行其他加入。从而,在培养过程的开始,对培养基接种所希望的生物并允许生长或者代谢活性而不向培养基加入额外底物(即,碳源和氮源)。在批过程中,系统的代谢物和生物量组分不断改变直到培养结束的时间。在典型的分批过程中,细胞通过静止滞后期温和发展到高生长对数期并最后发展到稳定期,其中生长速率减小或者停止。如果不处理,稳定期的细胞将最终死亡。标准分批方法的变通方法是补料分配方法,其中在发酵过程中向发酵罐不断加入底物。补料分配方法也适于本发明。当分解代谢物抑制易于抑制细胞的代谢或者当希望任何时刻在培养基中有有效量的底物时,补料分配方法是有用的。测量补料分批系统中底物浓度是困难的并因此可以基于可测量的因素如pH、溶解氧和废气的部分压强(例如,CO2)来估计。分批和补料分批培养方法是本领域常见和公知的并且实例可以见Thomas D.Brock,Biotechnology:ATextbook of Industrial Microbiology,2nd ed.,(1989)SinauerAssociates:Sunderland,MA;或Deshpande,Mukund V.,Appl.Biochem.Biotechnol.,36:227(1992),将它们引入作为参考。

通过连续发酵方法也可以完成使用本发明Δ12去饱和酶进行ω脂肪酸的商业生产,在所述连续发酵方法中,将确定成分培养基连续加到生物反应器中而同时取出等量培养体积用于产品回收。连续培养通常以恒定的细胞密度保持细胞处于对数生长期。连续或者半连续培养方法允许调节影响细胞生长或者终产物浓度的一种因素或者任意多种因素。例如,一种方法可以限制碳源和允许所有其他参数来缓和代谢。在其他系统中,可以连续改变影响生长的许多因素而通过培养基浊度测量的细胞浓度保持恒定。连续系统力争保持稳态生长从而细胞生长速率必须和由于从培养基分离培养物导致的损失之间保持平衡。调节连续培养方法的营养物和生长因子,以及最大化产生形成速率的技术是工业微生物学领域公知的并且Brock,上文中详述了多种方法。

PUFAs的纯化

PUFA可以在宿主微生物中作为游离脂肪酸或者以酯化形式如酰基甘油、磷脂、硫脂或者糖脂形式发现,并且可以通过本领域公知的多种方法从宿主细胞提取出来。酵母脂质的提取技术、质量分析和可接受性标准的一个综述为Z.Jacobs(Critical Reviews inBiotechnology 12(5/6):463-491(1992))的综述。下游加工的简要综述见A.Singh和O.Ward(Adv.Appl.Microbiol.45:271-312(1997))。

通常,纯化PUFA的方法可以包括用有机溶剂提取、超生处理、超临界流体提取(例如,使用二氧化碳)、皂化和物理方法,如压力,或者它们的组合。尤其重要的是在水存在下用甲醇和氯仿提取(E.G.Bligh & W.J.Dyer,Can.J.Biochem.Physiol.37:911-917(1959))。希望时,可以将含水层酸化以质子化带负电的部分和从而增加所希望的产物向有机层的分配。提取后,可以在氮气流下蒸发除去有机溶剂。当以缀合形式分离时,可以用酶或者化学切割产物以释放游离脂肪酸或者较不复杂的目的缀合物,并且可以进行进一步操作以产生目的终产物。理想地,用氢氧化钾断裂脂肪酸的缀合形式。

如果需要进一步纯化,可以使用标准方法。此类方法可以包括提取、用尿素处理、分步结晶、HPLC、分馏、硅胶层析、高速离心或者蒸馏,或者这些技术的组合。反应基,如酸性或者链烯基的保护可以通过已知技术(例如,烷基化或者碘化)在任意步骤进行。所用的方法包括脂肪酸的甲基化以产生甲酯。类似地,可以在任意步骤除去保护基。理想地,含有GLA、STA、ARA、DHA和EPA的级分的纯化可以通过用尿素处理和/和级分蒸馏完成。

优选实施方案描述

本文描述的工作的最终目的是开发积累富含ω-3和/或ω-6 PUFAs的油的油质酵母。为此,必须鉴定在油质酵母中有功能的去饱和酶,使得能够在这些宿主中合成和大量积累优选的PUFA。对于探作宿主细胞中产生的ω-3与ω-6 PUFAs比率,也有必要鉴定有效的去饱和酶。

在以前工作中,申请人已经分离了天然Yarrowia lipolyticaΔ12去饱和酶并且过表达了该蛋白质,导致相对于野生型油酸向LA的转化增加(美国专利申请10/840325,将其完整引入作为参考;也参见本文实施例2和SEQ ID NOs:51和52)。特别地,底物转化百分数(测量为([18:2]/[18:1+18:2])*100)在所转化细胞中为74%,相比在野生型Yarrowia中底物转化百分数为仅59%。尽管观察到这些宿主细胞内LA可用性增加,然而,希望鉴定编码具有Δ12去饱和酶活性的蛋白质的基因,所述基因将使得能够产生油酸向LA的更大转化。这将允许在Y.lipolytica转化的细胞中LA作为用于高水平合成多种ω-3和/或ω-6 PUFAs(例如,GLA、DGLA、ARA、ALA、STA、ETA、EPA、DPA和DHA)的有效性增加。从而,具有高水平Δ12去饱和酶活性的异源蛋白质的表达在生物的途径改造中是有利的。

为了实现该目标,在本发明中,申请人已经从串珠镰孢分离和克隆了编码Δ12去饱和酶(SEQ ID NOs:3和4)的DNA片段。该基因作为Δ12去饱和酶的活性的证实基于:1)当在破坏天然Δ12去饱和酶基因的Yarrowia lipolytica菌株中表达串珠镰孢基因时恢复了LA生物合成(通过互补);和2)在表达串珠镰孢基因的野生型Y.lipolytica细胞中过量产生LA(实施例6)。

然而,上述实验导致令人惊奇的发现,其中串珠镰孢Δ12去饱和酶比Yarrowia lipolytica Δ12去饱和酶在Yarrowia lipolytica中产生18:2更有效(见实施例6,表11)。特别地,确定了Yarrowialipolytica中TEF启动子控制下的串珠镰孢Δ12去饱和酶的表达产生比以前通过表达处于TEF启动子控制下的编码YarrowialipolyticaΔ12去饱和酶的嵌合基因可以得到的(LA的59%产物积累)更高水平的18:2(LA的68%产物积累)。这对应于底物转化百分数(以([18:2]/[18:1+18:2])*100计算)中的差异分别为85%和74%。此外,串珠镰孢Δ12去饱和酶比以前报导的任何已知的Δ12去饱和酶更有效地发挥功能(例如,当在酿酒酵母中过表达粗糙脉孢霉Δ12去饱和酶时实现油酸向18:2的仅68%的底物转化[WO 2003/099216])。

基于这些结果,本发明真菌串珠镰孢Δ12去饱和酶的表达比其他已知Δ12去饱和酶优选作为工程化积累富含ω-3和/或ω-6 PUFAs的油的油质酵母的方法(然而,本领域技术人员将预计例如,密码子优化后可以增强Yarrowia lipolytica中串珠镰孢Δ12去饱和酶的活性)。

此外,申请人还从上述构巢曲霉、Magnaporthe grisea、粗糙脉孢霉、禾本科镰孢、烟曲霉和黄曲霉鉴定了与上述串珠镰孢蛋白质直向同源的一组Δ12去饱和酶(即,SEQ ID NOs:8、12、16、20、21和22)。这些蛋白质(包括串珠镰孢Δ12去饱和酶(SEQ ID NO:4))在不同的蛋白质亚家族(本文称作“亚家族2”)中聚簇,所述亚家族蛋白质与“亚家族1”内聚簇的蛋白质明显不同(即,SEQ ID NOs:2,6,10,14和18,在共同待决的美国临时申请60/519191中鉴定为Δ15去饱和酶),尽管所有蛋白质均与本文鉴定为SEQ ID NO:52(在共同待决的美国专利申请10/840325中表征)的Y.lipolyticaΔ12去饱和酶同源。亚家族2的蛋白质(在本文鉴定为Δ12去饱和酶并且受到WO 03/099216中将所述粗糙脉孢霉功能表征为Δ12去饱和酶的指出)代表相互具有至少56.3%同一性的一组蛋白质(实施例4)并且它们通过与以前描述的Δ12去饱和酶的序列同源性而显著区分。

预期该独特类别的真菌Δ12去饱和酶将可以用于在油质酵母(例如,Yarrowia lipolytica)中表达作为改变脂肪酸组成的方法,这是基于它们将以高效率发挥功能的预期(即,底物转化百分数,其中至少约70%的油酸向LA的底物转化%是优选的,而至少约80%的油酸向LA的底物转化%是尤其适宜的,至少约85%的油酸向LA的底物转化%是最优选的)。从而,本发明的一个实施方案是改变幼稚酵母中脂肪酸分布图的方法,其中亚家族2的Δ12去饱和酶单独表达或者与其他脂肪酸生物合成基因(例如,Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ12去饱和酶、Δ15去饱和酶、Δ17去饱和酶、Δ9去饱和酶、Δ8去饱和酶和/或延伸酶)联合表达。

实施例

在下面实施例中进一步限定本发明。将理解这些实施例尽管指出本发明的优选实施方案,但是仅作为例证给出。从上面的讨论和这些实施例,本领域技术人员可以确定本发明的基本特征,并且不背离本发明的精神和范围,可以对本发明做出多种改变和修改使其适于多种用法和条件。

一般方法

实施例中使用的标准重组DNA和分子克隆技术是本领域公知的并且由:1.)Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular Cloning:A Laboratory Manual;Cold Spring HarborLaboratory:Cold Spring Harbor,NY(1989)(Maniatis);2.)T.J.Silhavy,M.L.Bennan,和L.W.Enquist,Experiments withGene Fusions;Cold Spring Harbor Laboratory:Cold SpringHarbor,NY(1984);和3.)Ausubel,F.M.等人,CurrentProtocols in Molecular Biology,Greene Publishing Assoc.andWiley-Interscience出版(1987)描述。

适于维持和生长细胞培养物的材料和方法是本领域公知的。适于用于下面的实施例的技术可以见Manual of Methods for GeneralBacteriology(Phillipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg andG.Briggs Phillips,Eds),American Society for Microbiology:Washington,D.C.(1994));或Thomas D.Brock in Biotechnology:A Textbook of Industrial Microbiology,2nd ed.,SinauerAssociates:Sunderland,MA(1989)。除非另外指出,用于生长和维持细菌细胞的所有试剂、限制酶和材料都从Aldrich Chemicals(Milwaukee,WI),DIFCO Laboratories(Detroit,MI),GIBCO/BRL(Gaithersburg,MD),或Sigma Chemical Company(St.Louis,MO)得到。

大肠杆菌(E.coli)TOP10细胞和大肠杆菌Electromax DH10B细胞从Invitrogen(Carlsbad,CA)得到。大肠杆菌DH5α的MaxEfficiency感受态细胞从GIBCO/BRL(Gaithersburg,MD)得到。大肠杆菌(XL1-Blue)感受态细胞从Stratagene Company(San Diego,CA)购买。所有大肠杆菌细胞通常在37℃生长在Luria Bertani(LB)板上。

根据标准方法(Sambrook等人,上文)进行常规分子克隆。由Sigma-Genosys(Spring,TX)合成寡核苷酸。将PCR产物克隆到Promega的pGEM-T-easy载体(Madison,WI)。

使用染料终止剂技术(U.S.5,366,860;EP 272,007),用载体和插入片段特异引物的联合在ABI自动测序仪上产生DNA序列。用Sequencher(Gene Codes Corporation,Ann Arbor,MI)进行序列编辑。所有序列代表两个方向至少两倍的盖度。用DNASTAR软件(DNASTAR Inc.,Madison,WI)完成基因序列的比较。

缩写的含义如下:“sec”表示秒;“min”表示分钟;“h”表示小时,“d”表示天,“μl”表示微升,“mL”表示毫升,“L”表示升,“μM”表示微摩尔/升,“mM”表示毫摩尔/升,“M”表示摩尔/升,“mmol”表示毫摩尔,“μmole”表示微摩尔,“g”表示克,“μg”表示微克,“ng”表示纳克,“U”表示单位,“bp”表示碱基对,“kB”表示千碱基。

Yarrowia lipolytica的培养

Yarrowia lipolytica菌株ATCC #76982和ATCC #90812从美国典型培养物保藏中心(American Type Culture Collection)(Rockville,MD)购买。Y.lipolytica菌株在28℃生长在YPD琼脂(1%酵母提取物,2%细菌用蛋白胨,2%葡萄糖,2%琼脂)上。对于转化选择,使用基本培养基(0.17%酵母氮碱基(DIFCO Laboratories,Detroit,MI),其没有硫酸铵并且没有氨基酸,2%葡萄糖,0.1%脯氨酸,pH6.1)。适当补加腺嘌呤、亮氨酸、赖氨酸和/或尿嘧啶至0.01%的终浓度。

Yarrowia lipolytica的脂肪酸分析

对于脂肪酸分析,通过离心收集细胞,并如Bligh,E.G.& Dyer,W.J.(Can.J.Biochem.Physiol.37:911-917(1959))中描述的提取脂质。通过用甲氧基钠进行脂提取物的转酯作用(Roughan,G.,and Nishida I.Arch Biochem Biophys.276(1):38-46(1990))制备脂肪酸甲酯并随后用安装30-m X 0.25mm(i.d.)HP-INNOWAX(Hewlett-Packard)柱的Hewlett-Packard 6890GC分析。烘箱温度以3.5℃/min从170℃(25min保持)升高到185℃。

对于直接碱基转酯,收获Yarrowia培养物(3mL),将其用蒸馏水洗涤一次,并在Speed-Vac中真空干燥5-10分钟。向样品中加入甲氧基钠(100μl,1%),然后涡旋样品并摇动20min。加入3滴1MNaCl和400μl己烷后,涡旋并离心样品。除去上层并如上述通过GC分析。

实施例1

构建Yarrowia表达载体

本发明描述了质粒pY5,pY5-13(包含嵌合的TEF启动子::XPR终止子基因),和pY5-20(包含嵌合的潮霉素抗性基因)的构建。

构建质粒pY5

构建质粒pY5用于在Yarrowia lipolytica中表达异源基因(图3),质粒pY5是pINA532(Claude Gaillardin博士,InsitutNational Agronomics,Centre de biotechnologie Agro-Industrielle,laboratoire de Genetique Moleculaire etCellularie INRA-CNRS,F-78850Thiverval-Grignon,France馈赠)的衍生物。

首先,将含有ARS18序列和pINA532的LEU2基因的部分消化的3598bp EcoRI片段亚克隆到pBluescript(Strategene,San Diego,CA)的EcoRI位点产生pY2。通过PCR使用TEF5’(SEQ ID NO:23)和TEF3’(SEQ ID NO:24)作为引物从Yarrowia lipolytica基因组DNA扩增TEF启动子(Muller S.,等人Yeast,14:1267-1283(1998))。在50μl总体积中进行PCR扩增,所述总体积含有:100ng Yarrowia基因组DNA,含有10mM KCl,10mM(NH4)2SO4,20mM Tris-HCl(pH8.75),2mM MgSO4,0.1%Triton X-100,100μg/mL BSA(终浓度),200μM每种脱氧核糖核酸三磷酸的PCR缓冲液,10pmole每种引物和1μl PfuTurbo DNA聚合酶(Stratagene,San Diego,CA)。如下进行扩增:95℃ 3min的最初变性,然后35个如下:95℃ 1min,56℃ 30sec,72℃ 1min循环。进行72℃ 10min的最终延伸循环,然后在4℃结束反应。将418bp PCR产物连接到pCR-Blunt以产生pIP-tef。将pIP-tef的BamHI/EcoRV片段亚克隆到pY2的BamHI/SmaI位点产生pY4。

通过PCR使用pINA532作为模板和XPR5’(SEQ ID NO:25)和XPR3’(SEQ ID NO:26)作为引物扩增XPR2转录终止子。使用上述组分和条件在50μl总体积中进行PCR扩增。将179bp PCR产物用SacII消化然后连接到pY4的SacII位点以产生pY5。从而,pY5(图3中显示)可用作Yarrowia-大肠杆菌穿梭载体,其含有:

1.)Yarrowia自主复制序列(ARS18);

2.)ColE1质粒复制起点;

3.)氨苄青霉素抗性基因(AmpR),其用于大肠杆菌中的选择;

4.)Yarrowia LEU2基因,其用于Yarrowia中的选择;

5.)翻译延伸启动子(TEF P),其用于在Yarrowia中表达异源基因;和

6.)细胞外蛋白酶基因终止子(XPR2),其用于Yarrowia中异源基因表达的转录终止。

质粒pY5-13和pY5-20的构建

将pY5-13和pY5-20构建为pY5的衍生物以方便在Yarrowialipolytica中的亚克隆和异源基因表达。

特别地,使用pY5作为模板,通过6轮定点诱变构建pY5-13。使用寡核苷酸YL5和YL6(SEQ ID NOs:27和28)通过定点诱变从pY5除去SalI和ClaI位点产生pY5-5。使用寡核苷酸YL9和YL10(SEQ IDNOs:29和30)通过定点诱变在Leu2基因和TEF启动子之间引入SalI位点产生pY5-6。使用寡核苷酸YL7和YL8(SEQ ID NOs:31和32)将PacI位点导入pY5-6中LEU2基因和ARS18之间以产生pY5-8。使用寡核苷酸YL3和YL4(SEQ ID NOs:33和34)在pY5-8中TEF的翻译起始密码子的周围引入NcoI位点以产生pY5-9。用YL1和YL2寡核苷酸(SEQ ID NOs:35和36)除去pY5-9的Leu2基因内的NcoI位点以产生pY5-12。最后,使用寡核苷酸YL61和YL62(SEQ ID NOs:37和38)在pY5-12的ColEI和XPR区之间引入BsiWI位点以产生pY5-13。

质粒pY5-20是pY5的衍生物。通过将含有嵌合的潮霉素抗性基因的Not I片段插入到pY5的Not I位点构建pY5-20。所述嵌合基因具有处于Yarrowia lipolytica TEF启动子控制下的潮霉素抗性ORF。

实施例2

克隆Yarrowia lipolytica Δ12去饱和酶和破坏内源Δ12去饱和酶基因

基于Yarrowia lipolytica(ATCC #76982)的脂肪酸组成(其阐明该生物可以产生LA(18:2)但不是ALA(18:3)),假定Y.lipolytica将可能含有具有Δ12去饱和酶活性但没有Δ15去饱和酶活性的基因。从而,本实施例描述了使用简并PCR引物分离Yarrowialipolytica Δ12去饱和酶的部分编码序列,使用该部分序列破坏Yarrowia lipolytica中的天然基因,和随后克隆全长基因。

使用简并PCR引物通过PCR从Yarrowia lipolytica克隆部分推定的Δ12去饱和酶序列

使用DNeasy Tissue试剂盒(Qiagen,Catalog #69504)从Yarrowia lipolytica(ATCC #76982)分离基因组DNA并将其以0.5μg/μl的DNA浓度重悬浮在试剂盒缓冲液AE中。用基因组DNA作为模板和根据在不同Δ12去饱和酶之间保守的氨基酸序列制备的几组简并引物进行PCR扩增。用一组上游和下游引物(分别是P73和P76)得到了最佳结果,如下表所示。

                            表4

            用于扩增部分推定的Δ12去饱和酶的简并引物

  引物组  描述  简并核苷酸序列  对应氨基酸序列  P73  (32)  26-mers  5’-TGGGTCCTGGGCCA  YGARTGYGGNCA-3’  (SEQ ID NO:39)  WVLGHECGH  (SEQ ID NO:40)  P76  (64)  30-mers  5’-GGTGGCCTCCTCGG  CGTGRTARAANGGNAT-3’  (SEQ ID NO:41)  (M/I)PFVHAEEAT  (SEQ ID NO:42)

[注解:缩写对于核苷酸和蛋白质是标准的。所用核酸简并密码如下:R=A/G;Y=C/T;和N=A/C/G/T.]

在Eppendorf Mastercycler Gradient循环变温器中根据生产商的推荐进行PCR。如下进行扩增:95℃ 1min的最初变性,接着是30个:95℃ 30sec变性,58℃ 1min退火,和72℃ 1min延伸的循环。进行72℃ 10min的最后延伸循环,然后在4℃结束反应。

将预期(约740bp)大小的PCR产物通过琼脂糖凝胶电泳检测,分离,纯化并克隆到pTA载体(Invitrogen),和测序。基于BLAST程序分析(Basic Local Alignment Search Tool;Altschul,S.F.,等人,J.Mol.Biol.215:403-410(1993)),所得序列与已知的Δ12去饱和酶具有同源性。

Yarrowia lipolytica Δ12去饱和酶基因的定向破坏

用称作pY23D12的靶定盒对Δ12去饱和酶基因进行同源重组介导的替换,进行Yarrowia lipolytica ATCC #76982中Δ12去饱和酶基因的定向破坏。pY23D12来自质粒pY20(实施例1)。

特别地,将Hind III/Eco RI片段插入到相似线性化的pY20产生pY23D12。该642bp片段由(5’到3’方向):从+718到+1031位的3’同源序列(SEQ ID NO:51中的编码序列(ORF))、Bgl II限制位点,和从+403到+717位的5’同源序列(SEQ ID NO:51中的编码序列(ORF))组成。分别使用PCR引物组P99和P100(SEQ ID NOs:43和44)和P101和P102(SEQ ID NOs:45和46)从642bp PCR产物PCR扩增3’和5’序列制备所述片段。

将pY23D12通过Bgl II限制性消化线性化并通过乙酸锂方法根据Chen,D.C.等人(Appl Microbiol Biotechnol.48(2):232-235(1997))的方法转化到对数中期Y.lipolytica ATCC #76982细胞。简言之,将Y.lipolytica在YPD板上划线并在30℃生长约18小时。从平板刮除一些大的菌环量细胞并将其重悬浮在1ml转化缓冲液中,该缓冲液含有:2.25mL 50%PEG,平均MW 3350;0.125mL 2M乙酸锂,pH6.0;0.125mL 2M DTT;和50μg剪切的鲑精DNA。

将约500ng质粒DNA在100μl重悬浮的细胞中孵育,并在39℃保持1小时,用涡旋以15分钟间隔混合。将细胞接种在YPD潮霉素选择平板上并在30℃保持2到3天。

分裂了四个潮霉素抗性菌落并通过PCR筛选定向破坏。设计一组PCR引物(P119[SEQ ID NO:47]和P120[SEQ ID NO:48])用于扩增同源重组后的特定连接片段。设计另一组PCR引物(P121[SEQ IDNO:49]和P122[SEQ ID NO:50])用于检测天然基因。四个潮霉素抗性菌落中的3个对于连接片段呈阳性并且对于天然片段呈阴性,从而证实了定向整合。

确定Δ12去饱和酶-破坏的菌株中脂肪酸分布图

通过称作Q-d12D的一个被破坏的菌株中总脂质的GC分析进一步证实天然Δ12去饱和酶基因的破坏。野生型(ATCC #76982)和Q-d12D的单个菌落每个生长在3ml基本培养基(成分/L:20g葡萄糖,1.7g酵母氮碱基,1g L-脯氨酸,0.1g L-腺嘌呤,0.1g L-赖氨酸,pH6.1)中30℃下直到OD600~1.0。收获细胞,将其用蒸馏水洗涤,speedvacuum干燥并进行直接转酯作用和GC分析(如一般方法中描述)。

在下表5中显示了野生型Yarrowia和包含破坏的Δ12去饱和酶的转化株Q-d12D的脂肪酸分布图。鉴定脂肪酸为16:0(棕榈酸),16:1(p棕榈油酸),18:0,18:1(油酸)和18:2(LA)并且每种脂肪酸的成分以总脂肪酸的%表示。

                                   表5

野生型和转化体Yarrowia lipolytica中脂肪酸成分(总脂肪酸的%)

  菌株  16:0  16:1  18:0  18:1  18:2  野生型  11  14  2  33  34  Q-d12D破坏的  6  15  1  74  nd

*nd=不可检测

结果表明Q-d12D菌株中天然Δ12去饱和酶基因被失活。从而,可以推断在仅一种基因编码Yarrowia lipolytica ATCC #76982中功能Δ12去饱和酶。

Yarrowia liDolytica Δ12去饱和酶基因的质粒拯救

因为插入也含有大肠杆菌氨苄青霉素抗性基因和大肠杆菌ori的完整pY23D12载体破坏了Δ12去饱和酶基因,所以可能拯救大肠杆菌中的侧翼序列。为此,用DNeasy Tissue Kit分离Yarrowia lipolytica菌株Q-d12D的基因组DNA。特别地,在200μl的反应体积中用50μl限制酶Age I,Avr II,Nhe I和Sph I消化10μg基因组DNA。将所消化的DNA用酚:氯仿萃取并重悬浮在40μl去离子水中。所消化的DNA(10μl)在含有3U T4 DNA连接酶的200μl连接混合物中自连接。在16℃进行连接12小时。用酚:氯仿萃取所连接的DNA并将其重悬浮在40μl去离子水中。最后,用1μl重悬浮的经连接的DNA通过电穿孔转化大肠杆菌并接种在含有氨苄青霉素(Ap)的LB板上。分离Ap-抗性菌落并通过小量制备分析质粒的存在。在回收或拯救的质粒中发现了下面的插入片段大小(表6):

                表6

所回收质粒的插入片段大小,根据限制酶

  酶  质粒插入片段大小(kB)  AgeI  1.6  AvrII  2.5  NheI  9.4  SphI  6.6

用测序引物P99(SEQ ID NO:43)和P102(SEQ ID NO:46)开始质粒测序。

基于测序结果,装配编码Yarrowia lipolytica Δ12去饱和酶基因的全长基因(1936bp;SEQ ID NO:51)。特别地,所述序列编码1257个碱基(SEQ ID NO:51的核苷酸+283到+1539)的可读框,而所推导的序列长为419个残基(SEQ ID NO:52)。该基因也在“Yeastproject Genolevures”(Center for Bioinformatics,LaBRI,Talence Cedex,France)的公开Y.lipolytica蛋白质数据库中公开为YALI-CDS3053.1(也参见Dujon,B.等人,Nature 430(6995):35-44(2004))。

实施例3

处于异源Yarrowia启动子控制下的Yarrowia lipolytica Δ12去饱和酶ORF的表达

本实施例描述了处于异源(非-Δ12去饱和酶)Yarrowia启动子控制下的嵌合基因中Y.lipolytica Δ12去饱和酶ORF(来自实施例2)的表达。这使得能够互补Δ12去饱和酶-破坏的突变体和在野生型Y.lipolytica菌株中过量产生LA。

特别地,用上游引物P147(SEQ ID NO:53)和下游引物P148(SEQID NO:54)从Y.lipolytica ATCC #76982的基因组DNA用PCR扩增编码Y.lipolytica Δ12去饱和酶的ORF。将正确大小(1260bp)的片段分离、纯化、用Nco I和Not I消化并克隆到NcoI-Not I切割的pY5-13载体(实施例1),从而该基因处于TEF启动子控制下。通过小量制备分析证实正确的转化株并将所得质粒命名为pY25-d12d。

用实施例2中描述的转化方法将质粒pY5-13(“对照”)和pY25-d12d每个单独转化到Y.lipolytica ATCC#76982野生型(WT)和Δ12-破坏的菌株(Q-d12D)。在Bio101 DOB/CSM-Leu板上选择阳性转化株。

转化株的单个菌落长大并如一般方法中描述的分析GC。结果在下面的表中显示。将脂肪酸鉴定为16:0(棕榈酸),16:1(棕榈油酸),18:0,18:1(油酸)和18:2(LA);每种脂肪酸的组分代表为总脂肪酸的%。根据下面的公式计算“D12d SC”:([18:2]/[18:1+18:2])*100并且代表底物转化百分数(SC)。

                         表7

用Yarrowia lipolytica Δ12去饱和酶基因转化的Yarrowia的脂肪酸组成(总脂肪酸%)

  菌株  质粒  %  16:0  %  16:1  %  18:0  %  18:1  %  18:2  D12d  SC  Q-d12D  pY5-13  8  10  2  80  nd  0  Q-d12D  pY25-d12d  11  8  2  34  45  57  WT  pY5-13  10  10  1  32  47  59  WT  pY25-d12d  12  7  2  21  59  74

*nd=不可检测

结果表明使用TEF启动子表达Y.lipolytica Δ12去饱和酶恢复了在内源基因破坏的菌株中18:2的产生。

此外,结果表明野生型细胞中Y.lipolytica Δ12去饱和酶的过表达导致LA产生(18:2)的水平增加。特别地,LA的%产物积累从野生型细胞中的47%增加到转化的细胞中59%(代表底物转化百分数[“D12d SC”]从野生型中的59%改变为用嵌合Δ12去饱和酶转化的那些细胞中的74%)。

实施例4

从丝状真菌鉴定Δ12去饱和酶

本实施例描述了多种丝状真菌中Δ12去饱和酶的鉴定。基于与Yarrowia lipolytica Δ12去饱和酶的同源性鉴定这些序列(实施例2);并且,来自每个物种的序列根据系统进化分析法落入两个“亚家族”之一。

使用Δ12去饱和酶蛋白质序列(SEQ ID NO:52)作为针对丝状真菌的可利用的序列数据库的查询序列进行BLAST搜索(Basic LocalAlignment Search Tool;Altschul,S.F.,等人,J.Mol.Biol.215:403-410(1993)),所述数据库包括:1)粗糙脉孢霉,Magnaporthegrisea,构巢曲霉和禾本科镰孢的公共数据库;和2)串珠镰孢菌株M-8114的DuPont EST文库(E.I.du Pont de Nemours和Co.,Inc.,Wilmington,DE)(串珠镰孢菌株M-8114可以从Fusarium ResearchCenter,University Park,PA得到;也参见Plant Disease 81(2):211-216(1997))。这些BLAST搜索鉴定了每种生物内与Yarrowialipolytica Δ12去饱和酶蛋白质的两种同源物。下表概述了关于这些同源物的每一种的细节。

                           表8

     与Yarrowia lipolytica Δ12去饱和酶具有同源性的ORF的描述

 SEQ ID NOs*  来源  缩写  生物 1,2  EST序列数据库,E.I.duPont  de Nemours和Co.,Inc.  Fm1或Fm d15  串珠镰孢 3,4  EST序列数据库,E.I.duPont  de Nemours和Co.,Inc.  Fm2或Fm d12  串珠镰孢 5,6  构巢曲霉基因组计划(Center  for Genome Research(CGR)发  起,Cambridge,MA)中的重叠群  1.122(scaffold 9);也参见WO  2003/099216  An1或An d15  构巢曲霉
  SEQ ID NOs*  来源  缩写  生物  7,8  构巢曲霉基因组计划中的重叠群  1.15(scaffold 1);AAG36933  An2或An d12  构巢曲霉  9,10  M.grisea基因组计划(CGR和  International Rice Blast  Genome Consortium发起)中重叠  群2.1597中的基因座MG08474.1  Mg1或Mg d15  Magnaporthe  grisea  11,12  M.grisea基因组计划中重叠群  2.375中的Locus MG01985.1  Mg2或Mg d12  Magnaporthe  grisea  13,14  GenBank检索号AABX01000577);  也参加WO 2003/099216  Nc1或Nc d15  粗糙脉孢霉  15,16  GenBank检索号AABX01000374;  也参加WO 2003/099216  Nc2或Nc d12  粗糙脉孢霉  17,18  1.320禾本科镰孢基因组计划(CGR  和the International  Gibberella zeae Genomics  Consortium(IGGR)发起;  BAA33772.1)中的重叠群1.320  Fg1或Fg d15  禾本科镰孢  19,20  禾本科镰孢基因组计划中的重叠群  1.233  Fg2或Fg d12  禾本科镰孢

*注释:奇数SEQ ID NOs指ORF核苷酸序列,偶数SEQ ID NOs指所推导的氨基酸序列。

所有同源物为未注解的或者有注解的Δ12去饱和酶或脂肪酸去饱和酶。此外,来自禾本科镰孢的核苷酸序列为具有推定的内含子序列的基因组序列;申请人进行了所推定氨基酸的试验性装备以比较来自其他同源物的氨基酸序列。

使用LASERGENE生物信息学计算套件(Windows 32 Megalign 5.061993-2003;DNASTAR Inc.,Madison,WI)的Megalign程序对Δ12去饱和酶的系统树分析出乎意料地揭示了两个亚家族。如图4中所示,Nc1,Mg1,Fg1,Fm1和An1在与Yarrowia lipolytica Δ12去饱和酶具有同源性的蛋白质的“亚家族1”中聚簇,而Fg2,Fm2,Mg2,Nc2和An2在Yarrowia lipolytica Δ12去饱和酶蛋白质同源物的“亚家族2”内聚簇。

随后,在两种额外生物的公共序列数据库中也鉴定了一种Δ12去饱和酶同源物,如下面的表9中所示。

                            表9

   与Yarrowia lipolytica Δ12去饱和酶具有同源性的额外ORFs

  SEQ ID NO  来源  符号  生物  21  烟曲霉基因组计划(Sanger  Institute,collaborators at  the University of Manchester,  和The Institute of Genome  Research(TIGR)发起)中  AFA.133c 344248:345586反向  序列(AfA5C5.001c)  Af d12  烟曲霉  22  GenBank检索号AY280867  (VERSION AY280867.1;  GI:30721844)  --  黄曲霉

这些额外序列在Yarrowia lipolytica Δ12去饱和酶蛋白质同源物的亚家族2内聚簇。

然后使用DNASTAR软件的Megalign程序的Clustal W方法(slow,accurate,Gonnet选项;Thompson等人,Nucleic Acids Res.22:4673-4680(1994))对与Yarrowia lipolytica Δ12去饱和酶具有同源性的每种蛋白质进行比对。通过该方法揭示的百分数同一性用于确定所述蛋白质是否是直向同源物(图5)。此外,将所述同源物与表10中所示的已知的Δ12去饱和酶比较。

                                         表10

                        用于Clustal W分析的已知的Δ12去饱和酶

  图6参  考号  符号  描述  GenBank  检索号  1  Sp d12  Spiruline  platensis Δ12  去饱和酶  X86736  2  Ce d12  秀丽隐杆线虫  Δ12去饱和酶  AF240777  3  Cr d12  Chlamydomonas  reinhardtii Δ12  去饱和酶  AB007640  4  Cv d12  普通小球藻Δ12  去饱和酶  AB075526  5  AtM d12  拟南芥微粒体  Δ12去饱和酶  AP002063  6  Y1 d12  Yarrowia  lipolytica Δ12  去饱和酶(本文的  SEQ ID NO:52)  “Yeast project Genolevures”(Center  for Bioinformatics,LaBRI,Talence  Cedex,France)的公共Y.lipolytica蛋  白质数据库内的YALI-CDS3053.1  (也参见Dujon,B.等人,Nature 430  (6995):35-44(2004));也参见美国专利  申请号10/840325  7  Dh d12  Debaryomyces  hansenii Δ12去  饱和酶  >Ctg0330-0000227-2.1(见“Yeast  project Genolevures”)  8  MaA d12  高山被孢霉Δ12  去饱和酶  >gi|6448794|gb|AAF08684.1|AF110509  _1  9  Mr d12  鲁西毛霉Δ12去  饱和酶  AF161219  10  Pa d12  Pichia augusta  Δ12去饱和酶  >Ctg1334-  0000001-1.1.  (见“Yeast project Genolevures”)

亚家族1的蛋白质(SEQ ID NOs:2,6,10,14和18;图5)相互至少46.2%同一并且与亚家族2的蛋白质(SEQ ID NOs:4,8,12,16,20;图5)具有小于45.2%的同一性。此外,亚家族2的蛋白质(SEQ IDNOs:4,8,12,16,20;图5)相互具有至少56.3%同一性。亚家族2的蛋白质和来自S.platensis、秀丽隐杆线虫、C.reinhardtii、普通小球藻、拟南芥、Y.lipolytica、D.hansenii、M.alpina、鲁西毛霉,和P.augusta的Δ12去饱和酶之间的最大同一性为51.6%(图6)。

尽管未在图5或图6中显示,但是使用Clustal W方法(上文)类似地比较了黄曲霉Δ12去饱和酶同源物(SEQ ID NO:22)和亚家族2的其他蛋白质(SEQ ID NOs:4、8、12、16、20和21)。得到了下面的结果:黄曲霉相对A.fumigatus的蛋白质同一性为79%,相对粗糙脉孢霉的蛋白质同一性为68.5%,相对禾本科镰孢的蛋白质同一性为60.9%,相对串珠镰孢的蛋白质同一性为61.8%,相对M.grisea的蛋白质同一性为66.1%,相对构巢曲霉的蛋白质同一性为76%。从而,基于图5和6中的同源性和上面给出的同源性,根据串珠镰孢和M.grisea蛋白质序列之间的同源性,串珠镰孢Δ12去饱和酶(SEQ ID NO:4)与亚家族2的剩余Δ12去饱和酶蛋白质的同一性为至少56.3%(这里定义为SEQ ID NOs:4、8、12、16、20、21和22)。

上面的分析清除地区分了与Yarrowia lipolytica Δ12去饱和酶(SEQ ID NO:52)具有同源性的两个亚家族蛋白质。此外,已知酵母,如Y.lipolytica只能合成18:2(但是不能合成18:3),而5种丝状真菌每一种都能合成18:2和18:3。此外,从Yarrowia分离了一种Δ12去饱和酶,而多数真菌与Yarrowia Δ12去饱和酶具有两种同源物。从而,申请人推测这些生物中去饱和酶的亚家族之一代表a Δ12去饱和酶(允许油酸向LA(18:2)的转化)并且另一种代表Δ15去饱和酶(允许LA向ALA(18:3)转化)。

实施例5

构建包含亚家族2的串珠镰孢去饱和酶的表达质粒pY35(TEF::Fm2)

(编码推定的Δ12去饱和酶)

本实施例描述了构建包括实施例4中鉴定的亚家族2的串珠镰孢Δ12去饱和酶(“Fm2”或“Fm d12”)的表达质粒。特别地,产生了嵌合基因,使得推定的Δ12去饱和酶将在Yarrowia TEF启动子的控制下表达。这将使得能够随后测定Yarrowia lipolytica中所述蛋白质的活性,这可以通过测试表达ORF在野生型菌株中产生LA和互补Δ12去饱和酶-破坏的突变株的能力来实现(下文,实施例6)。

使用含有全长cDNA的cDNA克隆ffm2c.pK007.g13和ffm2c.pk001.p18作为模板并使用上游和下游引物P194(SEQ IDNO:55)和P195(SEQ ID NO:56)通过PCR扩增编码串珠镰孢Δ12去饱和酶的ORF。使用TA Taq和pfu聚合酶,按照生产商的推荐,在Eppendorf Mastercycler Gradient Cycler中进行PCR。如下进行扩增:95℃1分钟的最初变性;然后是30个循环的95℃ 30秒变性,58℃ 1分钟退火;和72℃ 1分钟的延伸,接着在4℃反应结束。

从两种模板都得到正确大小(约1441bp)的片段。使用Qiagen DNA纯化试剂盒从琼脂糖凝胶纯化片段,用NcoI和NotI消化并克隆到NcoI和NotI切割的pY25-d12d(实施例3),从而代替TEF::Y1D12d嵌合基因中的Yarrowia Δ12去饱和酶ORF。这导致产生称作pY35的8571bp质粒,其含有TEF::Fm2嵌合基因(与Yarrowia Δ12去饱和酶相反)。质粒pY35还含有大肠杆菌复制起点、细菌氨苄青霉素抗性基因、Yarrowia Leu 2基因和Yarrowia自主复制序列(ARS)。

实施例6

包含亚家族2的串珠镰孢去饱和酶的质粒pY35(TEF::Fm2)(编码推定的Δ12去饱和酶)在Yarrowia lipolytica中的表达串珠镰孢去饱和酶Of亚家族2

本实施例描述了质粒pY35(包含嵌合的TEF::Fm2基因;来自实施例5)在Yarrowia lipolytica中的表达。特别地,测试了包含推定的Δ12去饱和酶的所表达的串珠镰孢ORF赋予在Y.lipolytica的野生型菌株中产生LA和互补Δ12去饱和酶-破坏的突变株(来自实施例2)的能力。

使用实施例2中描述的转化方法,将质粒pY5(仅载体对照,来自实施例1),pY25-d12d(TEF::Y1D12d,来自实施例3的“阳性对照”),和pY35(TEF::Fm2)每一种单独转化到Yarrowia lipolytica ATCC#76892的野生型(WT)和Δ12去饱和酶-破坏的(Q-d12D)菌株中。在Bio101 DOB/CSM-Leu板上选择转化细胞。

如实施例2和一般方法中描述的,在3mL基本培养基中生长每种野生型和转化细胞的单个菌落,将其收获、洗涤、干燥并分析。

在下面的表11中显示了野生型Yarrowia和每种转化株的脂肪酸分布图。脂肪酸经鉴定为16:0(棕榈酸),16:1(棕榈油酸),18:0,18:1(油酸),18:2(LA)和18:3(ALA)并且每种脂肪酸的组成以总脂肪酸的%给出。根据下面的公式计算“d12d SC”:([18:2]/[18:1+18:2])*100并且“d12d SC”代表底物向18:2转化的百分数。

                         表11

当在Yarrowia lipolytica中表达时证实串珠镰孢Fm2ORF’s Δ12去饱和酶活性

  菌株  %16:0  %16:1  %18:0  %18:1  %18:2  %ALA  d12d%SC  WT  11  11  2  33  39  0.0  55  WT+pY5  (仅载体)  9  25  0  32  35  0.0  52  菌株  %16:0  %16:1  %18:0  %18:1  %18:2  %ALA  d12d%SC  WT+TEF::Fm2  12  5  1  12  68  0.4  85  Q-d12D  6  11  1  80  0  0.0  0  Q-d12D+TEF::Fm2  10  6  1  27  53  0.3  67

上面的结果表明,本文中称作Fm2并且鉴定为与YarrowialipolyticaΔ12去饱和酶具有同源性的那些蛋白质的亚家族2内的蛋白质的串珠镰孢ORF是Δ12去饱和酶。基于该证实,申请人预测亚家族2的所有其他成员(SEQ ID NOs:8,12,16,20,21和22)将也具有Δ12去饱和酶功能性。

此外,所述结果表明,串珠镰孢Δ12去饱和酶(Fm2)在Yarrowia中的活性出乎意料地高于天然Y.lipolyticaΔ12去饱和酶的活性。特别地,比较表11和表7中的数据(实施例3)揭示在WT+TEF::Fm2细胞中的底物转化百分数(SC)为85%,而在WT+TEF::Y1 D12d细胞中仅为74%。同样地,Q-d12D+TEF::Fm2细胞中底物转化百分数为67%,而在Q-d12D+TEF::Y1 D12d细胞中底物转化百分数仅为57%。从而,预计串珠镰孢Δ12去饱和酶联合PUFA生物合成的其他基因(例如,Δ6去饱和酶,延伸酶、Δ5去饱和酶、Δ17去饱和酶、Δ9去饱和酶、Δ4去饱和酶、Δ8去饱和酶、Δ15去饱和酶)的表达产生的ω-3和ω-6 PUFAs将高于使用天然Y.lipolytica Δ12去饱和酶产生ω-3和ω-6 PUFAs的产量。

实施例7

使用用串珠镰孢Δ12去饱和酶构建的嵌合基因在Yarrowialipolytica中产生DGLA

产生构建体pKUNF12T6E(图7;SEQ ID NO:57)将4种嵌合基因(包含串珠镰孢Δ12去饱和酶、Δ6去饱和酶和2种延伸酶)整合到野生型Yarrowia菌株ATCC #20362的Ura3基因座,从而使得能够产生DGLA。pKUNF12T6E质粒含有下面的组分:

                              表12

              质粒pKUNF12T6E(SEQ ID NO:57)的描述

  SEQ ID NO:57内的RE  位点和核苷酸  片段和嵌合基因组分的描述  AscI/BsiWI  (9420-8629)  Yarrowia Ura3基因(GenBank检索号  AJ306421)的784bp 5’部分  SphI/PacI  (12128-1)  Yarrowia Ura3基因(GenBank检索号  AJ306421)的516bp 3’部分  SwaI/BsiWI  (6380-8629)  FBAIN::EL1S:Pex20,包含:_  ·FBAIN:FBAIN启动子(SEQ ID NO:58;见  共同待决的美国专利申请号60/519971,描  述果糖二磷酸醛缩酶启动子)  ·EL1S:密码子优化的延伸酶1基因(SEQ  ID NO:59),来自高山被孢霉(GenBank检  索号AX464731)  ·Pex20:来自Yarrowia Pex20基因的  Pex20终止子序列(GenBank检索号  AF054613)  SEQ ID NO:57内的RE  位点和核苷酸  片段和嵌合基因组分的描述  BglII/SwaI  (4221-6380)  TEF::Δ6S::Lip1,包含:  ·TEF:TEF启动子(GenBank检索号  AF054508)  ·Δ6S:密码子优化的Δ6去饱和酶gene  (SEQ ID NO:61),来自高山被孢霉  (GenBank Accession No.AF465281)  ·来自Yarrowia Lipl基因(GenBank检索  号Z50020)的Lip1:Lip1终止子序列

                      表12续

         质粒pKUNF12T6E(SEQ ID NO:57)的描述

 PmeI/ClaI (4207-1459)  FBA::F.Δ12::Lip2,包含:  ·FBA:FBA启动子(SEQ ID NO:63;见共  同待决的美国专利申请号60/519971,描述  果糖二磷酸醛缩酶启动子)  ·F.Δ12:串珠镰孢Δ12去饱和酶基因  (SEQ ID NO:3)  ·来自Yarrowia Lip2基因(GenBank检  索号AJ012632)的Lip2:Lip2终止子序列 ClaI/PacI (1459-1)  TEF::EL2S::XPR,包含:  ·TEF:TEF启动子(GenBank检索号  AF054508)  ·EL2S:密码子优化的延伸酶基因(SEQ ID  NO:64),来自Thraustochytrium aureum  (U.S.6,677,145)  ·Yarrowia Xpr基因(GenBank检索号  M17741)的XPR:XPR终止子序列

将pKUNF12T6E质粒用AscI/SphI消化,然后用于转化野生型Y.lipolytica ATCC #20362(如实施例2中描述)。所转化的细胞在5-氟尿嘧啶-6-羧酸一水合物(“FOA”)选择培养基平板(0.17%酵母氮碱基(DIFCO Laboratories,Detroit,MI),没有硫酸铵或者氨基酸,2%葡萄糖,0.1%脯氨酸,75mg/L尿嘧啶,75mg/L尿苷,20g/琼脂和800mg/L FOA(Zymo Research Corp.,Orange,CA92867))上接种并保持在30℃ 2到3天。挑选FOA抗性菌落并在包含基本培养基((20g/L葡萄糖,1.7g/L酵母氮碱基(无氨基酸),1g/L L-脯氨酸,0.1g/L L-腺嘌呤,0.1g/L L-赖氨酸,pH 6.1)或者基本培养基加上0.01%尿嘧啶(“MMU”)的选择平板上划线。选择可以在MMU板上生长但是不在基本培养基板上生长的菌落作为Ura-菌株。然后将Ura-菌株的单个菌落接种到30℃液态MMU中并以250转/分钟摇动2天。

GC分析(如一般方法中描述)表明在含有DKUNF12T6E的4种嵌合基因中存在DGLA,但是在野生型Yarrowia时照菌株中不存在DGLA。多数选择的32Ura-菌株产生约6%DGLA总脂类。有两个菌株产生总脂类的约8%DGLA。

实施例8

合成密码子优化的Δ12去饱和酶基因用于在Yarrowialipolytica中表达_

基于串珠镰孢DNA序列(SEQ ID NO:3),根据Yarrowia密码子选择模式,ATG翻译起始密码子周围的共有序列,和RNA稳定性的一般规律(Guhaniyogi,G.和J.Brewer,Gene 265(1-2):11-23(2001)),将设计密码子优化的Δ12去饱和酶基因。

确定Yarrowia lipolytica中优选的密码子选择

Yarrowia lipolytica中的密码子选择在表13中显示。它是基于National Center for Biotechnology Information公共数据库中发现的Y.lipolytica的约100种基因的编码区。将这些基因的编码区(包含121,167bp)通过DNAStar的Editseq程序翻译成对应的40,389个氨基酸并列表显示以确定图13种显示的Y.lipolytica密码子选择分布图。列标题“No.”指40,389个氨基酸的样品中编码特定氨基酸的给定密码子的次数。列标题“%”指编码特定氨基酸的给定密码子的频率。以粗体显示的条目代表在Yarrowia lipolytica中占优势的密码子。

                 表13

  Yarrowia lipolytica中的密码子选择

  密码子  氨基酸  No.  %  GCA  GCC  GCG  GCU  Ala(A)  Ala(A)  Ala(A)  Ala(A)  359  1523  256  1023  11.4  48.1  8.1  32.3  AGA  AGG  CGA  CGC  CGG  CGU  Arg(R)  Arg(R)  Arg(R)  Arg(R)  Arg(R)  Arg(R)  263  91  1133  108  209  189  13.2  4.6  56.8  5.4  1.0  9.5  AAC  AAU  Ans(N)  Ans(N)  1336  255  84.0  16.0  GAC  GAU  Asp(D)  Asp(D)  1602  795  66.8  33.2  UGC  UGU  Cys(C)  Cys(C)  268  236  53.2  46.8  CAA  Gln(Q)  307  17.0  CAG  Gln(Q)  1490  83.0  GAA  GAG  Glu(E)  Glu(E)  566  1893  23.0  77.0  GGA  GGC  GGG  GGU  Gly(G)  Gly(G)  Gly(G)  Gly(G)  856  986  148  893  29.7  34.2  5.1  31.0  CAC  CAU  His(H)  His(H)  618  326  65.5  34.5  AUA  AUC  AUU  Ile(I)  Ile(I)  Ile(I)  42  1106  910  2.1  53.7  44.2  CUA  CUC  CUG  CUU  UUA  UUG  Leu(L)  Leu(L)  Leu(L)  Leu(L)  Leu(L)  Leu(L)  166  1029  1379  591  54  323  4.7  29.1  38.9  16.7  1.5  9.1
  密码子  氨基酸  No.  %  AAA  AAG  Lys(K)  Lys(K)  344  1987  14.8  85.2  AUG  Met(M)  1002  100  UUC  UUU  Phe(F)  Phe(F)  996  621  61.1  38.9  CCA  CCC  CCG  CCU  Pro(P)  Pro(P)  Pro(P)  Pro(P)  207  1125  176  655  9.6  52.0  8.2  30.2  AGC  AGU  UCA  UCC  UCG  UCU  Ser(S)  Ser(S)  Ser(S)  Ser(S)  Ser(S)  Ser(S)  335  201  221  930  488  779  11.3  6.8  7.5  31.5  16.5  26.4  UAA  UAG  Term  Term  38  30  46.9  37.0  UGA  Term  13  16.1  ACA  ACC  ACG  ACU  Thr(T)  Thr(T)  Thr(T)  Thr(T)  306  1245  269  595  12.7  51.6  11.1  24.6  UGG  Trp(W)  488  100  UAC  UAU  Tyr(Y)  Tyr(Y)  988  200  83.2  16.8  GUA  GUC  GUG  GUU  Val(V)  Val(V)  Val(V)  Val(V)  118  1052  948  703  4.2  37.3  33.6  24.9

通过本领域技术人员公知的方法产生合成的、密码子优化的Δ12去饱和酶。

为了进一步优化Y.lipolytica中的基因表达,检查了79种基因的“ATG”起始密码子周围的共有序列。所分析的基因的77%都在-3位具有‘A’(翻译起始密码子(ATG)的第一个‘A’标记位+1,表明在该位置强烈偏爱‘A’。在-4,-2和-1位也偏爱‘A’或‘C’,在+5位偏爱‘A’,‘C’或‘T’,在+6位偏爱‘G’或‘C’。从而,用于基因在Y.lipolytica中最佳表达的密码子优化的翻译起始位点的优选共有序列是‘MAMMATGNHS’(SEQ ID NO:66),其中所用的核酸简并密码如下:M=A/C;S=C/G;H=A/C/T;和N=A/C/G/T。

本领域技术人员将容易地能够使用上面提供的信息,基于本文提供的串珠镰孢Δ12去饱和酶序列合成密码子优化的Δ12去饱和酶基因。

序列表

<110>E.I.du Pont de Nemours and Co.,Inc.Yadav,Narendra

<120>适于改变油质酵母中多不饱和脂肪酸水平的Δ12去饱和酶

<130>CL2502

<150>US 60/570679

<151>2004-05-13

<160>66

<170>PatentIn version 3.3

<210>1

<211>1209

<212>DNA

<213>Fusarium monoliforme

<400>1

atggcgactc gacagcgaac tgccaccact gttgtggtcg aggaccttcc caaggtcact     60

cttgaggcca agtctgaacc tgtgttcccc gatatcaaga ccatcaagga tgccattccc    120

gcgcactgct tccagccctc gctcgtcacc tcattctact acgtcttccg cgattttgcc    180

atggtctctg ccctcgtctg ggctgctctc acctacatcc ccagcatccc cgaccagacc    240

ctccgcgtcg cagcttggat ggtctacggc ttcgtccagg gtctgttctg caccggtgtc    300

tggattctcg gccatgagtg cggccacggt gctttctctc tccacggaaa ggtcaacaat    360

gtgaccggct ggttcctcca ctcgttcctc ctcgtcccct acttcagctg gaagtactct    420

caccaccgcc accaccgctt caccggccac atggatctcg acatggcttt cgtccccaag    480

actgagccca agccctccaa gtcgctcatg attgctggca ttgacgtcgc cgagcttgtt    540

gaggacaccc ccgctgctca gatggtcaag ctcatcttcc accagctttt cggatggcag    600

gcgtacctct tcttcaacgc tagctctggc aagggcagca agcagtggga gcccaagact    660

ggcctctcca agtggttccg agtcagtcac ttcgagccta ccagcgctgt cttccgcccc    720

aacgaggcca tcttcatcct catctccgat atcggtcttg ctctaatggg aactgctctg    780

tactttgctt ccaagcaagt tggtgtttcg accattctct tcctctacct tgttccctac    840

ctgtgggttc accactggct cgttgccatt acctacctcc accaccacca caccgagctc    900

cctcactaca ccgctgaggg ctggacctac gtcaagggag ctctcgccac tgtcgaccgt    960

gagtttggct tcatcggaaa gcacctcttc cacggtatca ttgagaagca cgttgttcac   1020

catctcttcc ctaagatccc cttctacaag gctgacgagg ccaccgaggc catcaagccc   1080

gtcattggcg accactactg ccacgacgac cgaagcttcc tgggccagct gtggaccatc   1140

ttcggcacgc tcaagtacgt cgagcacgac cctgcccgac ccggtgccat gcgatggaac   1200

aaggactag                                                           1209

<210>2

<211>402

<212>PRT

<213>Fusarium monoliforme

<400>2

Met Ala Thr Arg Gln Arg Thr Ala Thr Thr Val Val Val Glu Asp Leu

1               5                   10                  15

Pro Lys Val Thr Leu Glu Ala Lys Ser Glu Pro Val Phe Pro Asp Ile

            20                  25                  30

Lys Thr Ile Lys Asp Ala Ile Pro Ala His Cys Phe Gln Pro Ser Leu

        35                  40                  45

Val Thr Ser Phe Tyr Tyr Val Phe Arg Asp Phe Ala Met Val Ser Ala

    50                  55                  60

Leu Val Trp Ala Ala Leu Thr Tyr Ile Pro Ser Ile Pro Asp Gln Thr

65                  70                  75                  80

Leu Arg Val Ala Ala Trp Met Val Tyr Gly Phe Val Gln Gly Leu Phe

                85                  90                  95

Cys Thr Gly Val Trp Ile Leu Gly His Glu Cys Gly His Gly Ala Phe

            100                 105                 110

Ser Leu His Gly Lys Val Asn Asn Val Thr Gly Trp Phe Leu His Ser

        115                 120                 125

Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His His Arg His

    130                 135                 140

His Arg Phe Thr Gly His Met Asp Leu Asp Met Ala Phe Val Pro Lys

145                 150                 155                 160

Thr Glu Pro Lys Pro Ser Lys Ser Leu Met Ile Ala Gly Ile Asp Val

                165                 170                 175

Ala Glu Leu Val Glu Asp Thr Pro Ala Ala Gln Met Val Lys Leu Ile

            180                 185                 190

Phe His Gln Leu Phe Gly Trp Gln Ala Tyr Leu Phe Phe Asn Ala Ser

        195                 200                 205

Ser Gly Lys Gly Ser Lys Gln Trp Glu Pro Lys Thr Gly Leu Ser Lys

    210                 215                 220

Trp Phe Arg Val Ser His Phe Glu Pro Thr Ser Ala Val Phe Arg Pro

225                 230                 235                 240

Asn Glu Ala Ile Phe Ile Leu Ile Ser Asp Ile Gly Leu Ala Leu Met

                245                 250                 255

Gly Thr Ala Leu Tyr Phe Ala Ser Lys Gln Val Gly Val Ser Thr Ile

            260                 265                 270

Leu Phe Leu Tyr Leu Val Pro Tyr Leu Trp Val His His Trp Leu Val

        275                 280                 285

Ala Ile Thr Tyr Leu His His His His Thr Glu Leu Pro His Tyr Thr

    290                 295                 300

Ala Glu Gly Trp Thr Tyr Val Lys Gly Ala Leu Ala Thr Val Asp Arg

305                 310                 315                 320

Glu Phe Gly Phe Ile Gly Lys His Leu Phe His Gly Ile Ile Glu Lys

                325                 330                 335

His Val Val His His Leu Phe Pro Lys Ile Pro Phe Tyr Lys Ala Asp

            340                 345                 350

Glu Ala Thr Glu Ala Ile Lys Pro Val Ile Gly Asp His Tyr Cys His

        355                 360                 365

Asp Asp Arg Ser Phe Leu Gly Gln Leu Trp Thr Ile Phe Gly Thr Leu

    370                 375                 380

Lys Tyr Val Glu His Asp Pro Ala Arg Pro Gly Ala Met Arg Trp Asn

385                 390                 395                 400

Lys Asp

<210>3

<211>1434

<212>DNA

<213>Fusarium monoliforme

<400>3

atggcgtcca cttcggctct gcccaagcag aaccctgcgc ttagacgcac cgtcacctca     60

actactgtga cggattctga gtctgccgcc gtctctcctt cagactctcc ccgccactcg    120

gcctcttcca catcgctctc gtccatgtcc gaggttgata tcgccaagcc caagtccgag    180

tatggtgtca tgctcgacac ctacggcaac cagttcgagg ttcccgactt taccatcaag    240

gacatctaca atgccatccc taagcactgc ttcaagcgct ccgctctcaa gggatacggt    300

tatatcctcc gcgacattgt cctcctgact accactttca gcatctggta caactttgtg    360

acccccgaat atatcccctc cacccccgcc cgcgctggtc tgtgggccgt gtacaccgtt    420

cttcagggtc ttttcggtac tggtctctgg gttattgccc atgagtgcgg tcacggtgct    480

ttctccgatt ctcgcatcat caacgacatt actggctggg ttcttcactc ttccctcctt    540

gtcccctact tcagctggca aatctcccac cgaaagcacc acaaggccac tggcaacatg    600

gagcgtgaca tggtcttcgt tccccgaacc cgcgagcagc aggctactcg tctcggaaag    660

atgacccacg agctcgctca tcttactgag gagacccccg ctttcactct tctcatgctc    720

gtccttcagc agctcgttgg ctggcccaac tacctcatca ccaatgttac cggccacaac    780

taccacgagc gccagcgtga gggtcgcggc aagggcaagc ataacggcct cggcggtggt    840

gttaaccact tcgatccccg cagccctctg tacgagaaca gtgacgctaa gctcatcgtc    900

ctcagcgata ttggtatcgg tctgatggcc actgctctgt acttcctcgt tcagaagttc    960

ggtttctaca acatggccat ctggtacttt gttccctacc tctgggttaa ccactggctc   1020

gttgccatca ccttcctcca gcacaccgac cctacccttc cccactacac caacgacgag   1080

tggaacttcg tccgtggtgc cgctgctacc attgaccgtg agatgggctt catcggccgc   1140

caccttctcc acggcatcat cgagactcat gtcctccacc actacgtcag cagcatcccc   1200

ttctacaacg cggacgaggc caccgaggcc attaagccca tcatgggcaa gcactaccgg   1260

gctgatgtcc aggatggtcc tcgtggcttc atccgcgcca tgtaccgcag tgcgcgtatg   1320

tgccagtggg ttgagcccag cgctggtgcc gagggtgctg gtaagggtgt tctgttcttc   1380

cgcaaccgca acaacgtggg cacccccccc gctgttatca agcccgttgc ttaa         1434

<210>4

<211>477

<212>PRT

<213>Fusarium monoliforme

<400>4

Met Ala Ser Thr Ser Ala Leu Pro Lys Gln Asn Pro Ala Leu Arg Arg

1               5                   10                  15

Thr Val Thr Ser Thr Thr Val Thr Asp Ser Glu Ser Ala Ala Val Ser

            20                  25                  30

Pro Ser Asp Ser Pro Arg His Ser Ala Ser Ser Thr Ser Leu Ser Ser

        35                  40                  45

Met Ser Glu Val Asp Ile Ala Lys Pro Lys Ser Glu Tyr Gly Val Met

    50                  55                  60

Leu Asp Thr Tyr Gly Asn Gln Phe Glu Val Pro Asp Phe Thr Ile Lys

65                  70                  75                  80

Asp Ile Tyr Asn Ala Ile Pro Lys His Cys Phe Lys Arg Ser Ala Leu

                85                  90                  95

Lys Gly Tyr Gly Tyr Ile Leu Arg Asp Ile Val Leu Leu Thr Thr Thr

            100                 105                 110

Phe Ser Ile Trp Tyr Asn Phe Val Thr Pro Glu Tyr Ile Pro Ser Thr

        115                 120                 125

Pro Ala Arg Ala Gly Leu Trp Ala Val Tyr Thr Val Leu Gln Gly Leu

    130                 135                 140

Phe Gly Thr Gly Leu Trp Val Ile Ala His Glu Cys Gly His Gly Ala

145                 150                 155                 160

Phe Ser Asp Ser Arg Ile Ile Asn Asp Ile Thr Gly Trp Val Leu His

                165                 170                 175

Ser Ser Leu Leu Val Pro Tyr Phe Ser Trp Gln Ile Ser His Arg Lys

            180                 185                 190

His His Lys Ala Thr Gly Asn Met Glu Arg Asp Met Val Phe Val Pro

        195                 200                 205

Arg Thr Arg Glu Gln Gln Ala Thr Arg Leu Gly Lys Met Thr His Glu

    210                 215                 220

Leu Ala His Leu Thr Glu Glu Thr Pro Ala Phe Thr Leu Leu Met Leu

225                 230                 235                 240

Val Leu Gln Gln Leu Val Gly Trp Pro Asn Tyr Leu Ile Thr Asn Val

                245                 250                 255

Thr Gly His Asn Tyr His Glu Arg Gln Arg Glu Gly Arg Gly Lys Gly

            260                 265                 270

Lys His Asn Gly Leu Gly Gly Gly Val Asn His Phe Asp Pro Arg Ser

        275                 280                 285

Pro Leu Tyr Glu Asn Ser Asp Ala Lys Leu Ile Val Leu Ser Asp Ile

    290                 295                 300

Gly Ile Gly Leu Met Ala Thr Ala Leu Tyr Phe Leu Val Gln Lys Phe

305                 310                 315                 320

Gly Phe Tyr Asn Met Ala Ile Trp Tyr Phe Val Pro Tyr Leu Trp Val

                325                 330                 335

Asn His Trp Leu Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr

            340                 345                 350

Leu Pro His Tyr Thr Asn Asp Glu Trp Asn Phe Val Arg Gly Ala Ala

        355                 360                 365

Ala Thr Ile Asp Arg Glu Met Gly Phe Ile Gly Arg His Leu Leu His

    370                 375                 380

Gly Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Ser Ile Pro

385                 390                 395                 400

Phe Tyr Asn Ala Asp Glu Ala Thr Glu Ala Ile Lys Pro Ile Met Gly

                405                 410                 415

Lys His Tyr Arg Ala Asp Val Gln Asp Gly Pro Arg Gly Phe Ile Arg

            420                 425                 430

Ala Met Tyr Arg Ser Ala Arg Met Cys Gln Trp Val Glu Pro Ser Ala

        435                 440                 445

Gly Ala Glu Gly Ala Gly Lys Gly Val Leu Phe Phe Arg Asn Arg Asn

    450                 455                 460

Asn Val Gly Thr Pro Pro Ala Val Ile Lys Pro Val Ala

465                 470                 475

<210>5

<211>1206

<212>DNA

<213>Aspergillus nidulans

<400>5

atggctgcaa ctgcaacaac cctagcagag attgaaaaga aaaaagaaga aataactctg     60

cagacaatca aaaatgcgat tcccaaacac tgcttcaacc gctctctcct catttcctct    120

gcctacgtcg tccgcgatct cctctacgcc tccgtcctct tctactttgc cctgcacatt    180

gacaccctct tttcctcgca actcctccgc atcctcgcct ggaccgccta cggtttcatg    240

caaggctgcg tcggcaccgg aatctggatc ctcgcacacg aatgcggcca tggagctttc    300

tccccatacc aaacgtggaa cgatgtcgtc ggatggacat tgcactccct cctgatggtc    360

ccgtatttca gctggaagat cacgcacgct cgacaccacc ggtacacaaa caacacagag    420

cgagatacag catttgtccc ctggacagag aaggaatacg acactcgccc gcgctacttc    480

cctgcctggt ttgagatgtt tgaggacacg cccgtctaca accttattag cctactggcg    540

catcagatcg caggatggca gatgtatctc tgtttttacg ttagcgccgg cgcaaagagt    600

aagcctgtac cgcagggaaa acagagcggg tggtttggag gccagcagag cgccagccac    660

tttgatccgg gcagttcgct gtggacggaa aaccagcggc atctgattgc gatttcggac    720

ctggggttgc tgcttgttgc ggcggcaaat tggtaccttg cgcagcaagt gggcgtgctc    780

cgcatggtgc tgatctatgt tgtgccgtac ttctgggtgc accattggct tgtggcgatc    840

acgtacctcc accacacaca cccctcgatc ccgcactaca ctgatagcac ctggacgttc    900

accaaaggcg ctctgtccac cgtcgaccgc gacttcggtt tcatcgggcg gcatttcttc    960

caccatatca ttgaccacca tgtcgtgcat cacttgttta accggatccc gttctaccat   1020

gccgaggagg cgactaatgc cattattccc gtactcgggg acatgtatca tcgcgaagag   1080

accggcttct tgtggagttt aatggagacg tacaagaact gtcggtttgt aggcgttgaa   1140

aatgatgttg gaaaggaggg cgttttgcat tgggtttttg aggagaagaa gggtgccaaa   1200

gcggaa                                                              1206

<210>6

<211>401

<212>PRT

<213>Aspergillus nidulans

<400>6

Met Ala Ala Thr Ala Thr Thr Leu Ala Glu Ile Glu Lys Lys Lys Glu

1               5                   10                  15

Glu Ile Thr Leu Gln Thr Ile Lys Asn Ala Ile Pro Lys His Cys Phe

            20                  25                  30

Asn Arg Ser Leu Leu Ile Ser Ser Ala Tyr Val Val Arg Asp Leu Leu

        35                  40                  45

Tyr Ala Ser Val Leu Phe Tyr Phe Ala Leu His Ile Asp Thr Leu Phe

    50                  55                  60

Ser Ser Gln Leu Leu Arg Ile Leu Ala Trp Thr Ala Tyr Gly Phe Met

65                  70                  75                  80

Gln Gly Cys Val Gly Thr Gly Ile Trp Ile Leu Ala His Glu Cys Gly

                85                  90                  95

His Gly Ala Phe Ser Pro Tyr Gln Thr Trp Asn Asp Val Val Gly Trp

            100                 105                 110

Thr Leu His Ser Leu Leu Met Val Pro Tyr Phe Ser Trp Lys Ile Thr

        115                 120                 125

His Ala Arg His His Arg Tyr Thr Asn Asn Thr Glu Arg Asp Thr Ala

    130                 135                 140

Phe Val Pro Trp Thr Glu Lys Glu Tyr Asp Thr Arg Pro Arg Tyr Phe

145                 150                 155                 160

Pro Ala Trp Phe Glu Met Phe Glu Asp Thr Pro Val Tyr Asn Leu Ile

                165                 170                 175

Ser Leu Leu Ala His Gln Ile Ala Gly Trp Gln Met Tyr Leu Cys Phe

            180                 185                 190

Tyr Val Ser Ala Gly Ala Lys Ser Lys Pro Val Pro Gln Gly Lys Gln

        195                 200                 205

Ser Gly Trp Phe Gly Gly Gln Gln Ser Ala Ser His Phe Asp Pro Gly

    210                 215                 220

Ser Ser Leu Trp Thr Glu Asn Gln Arg His Leu Ile Ala Ile Ser Asp

225                 230                 235                 240

Leu Gly Leu Leu Leu Val Ala Ala Ala Asn Trp Tyr Leu Ala Gln Gln

                245                 250                 255

Val Gly Val Leu Arg Met Val Leu Ile Tyr Val Val Pro Tyr Phe Trp

            260                 265                 270

Val His His Trp Leu Val Ala Ile Thr Tyr Leu His His Thr His Pro

        275                 280                 285

Ser Ile Pro His Tyr Thr Asp Ser Thr Trp Thr Phe Thr Lys Gly Ala

    290                 295                 300

Leu Ser Thr Val Asp Arg Asp Phe Gly Phe Ile Gly Arg His Phe Phe

305                 310                 315                 320

His His Ile Ile Asp His His Val Val His His Leu Phe Asn Arg Ile

                325                 330                 335

Pro Phe Tyr His Ala Glu Glu Ala Thr Asn Ala Ile Ile Pro Val Leu

            340                 345                 350

Gly Asp Met Tyr His Arg Glu Glu Thr Gly Phe Leu Trp Ser Leu Met

        355                 360                 365

Glu Thr Tyr Lys Asn Cys Arg Phe Val Gly Val Glu Asn Asp Val Gly

    370                 375                 380

Lys Glu Gly Val Leu His Trp Val Phe Glu Glu Lys Lys Gly Ala Lys

385                 390                 395                 400

Ala

<210>7

<211>1416

<212>DNA

<213>Aspergillus nidulans

<400>7

atgtcgtcta ctgccctccc gaagcgcgtt gcgctgcatc gcaacccgac taccgactct     60

tcggtcccca gctccgtctc ggtctccccg ctggactcgc cccgtcagtc tccgtcgtcg    120

acttcgctct cgtcaatggc ctcggatgcg ggcaagggag acttgggcaa gatgctcgac    180

acctatggca atgagttcaa gatccccgac tacaccatca aggatatccg tgatgccatt    240

ccgtcccact gctacaaccg gtctgctatc aggagtctgt cctatgtctt ccgtgatctc    300

gccgtcctcg cttccgtctt ctacgtcttc cacaaatacg tgaccccgga gaccgtccct    360

tcgtacccgg cgcgtgttgc gctgtggact ctctacactg tcgtccaggg tctgttcggt    420

accggtattt gggttcttgc tcacgagtgt ggacaccagg cgttctctac ttccaaggtg    480

ctcaacgaca ctgttggctg gatcctgcat tcggctctgc tggtccccta tttctcgtgg    540

aagatctctc acggcaagca ccacaaggcc accggtaacc tggctcgtga catggtcttc    600

gtccccaaga cccgcgaggt gtacgcctcc cgcatcaaga agaccatcta cgacctgaac    660

gaggtgatgg aggagacccc cttggccact gccacccact ccatcctgca gcagctgttc    720

ggctggccct tgtacctgct caccaacgtt accggtcacg acaaccacga gcgccagcct    780

gaaggccgcg gcaagggcaa gcgtaacggc tacttcaccg gcgtcaacca cttcaacccc    840

aacagccctc tgttcgaggc caaggacgcc aagctcatca ttctgagtga tatcggcctc    900

gccatcaccg ccagcatcct gtacctgatc ggctccaagt tcggctggat gaacttgctc    960

gtctggtacg gtatccccta cctctgggtg aaccactggc ttgttgccat cacctacctc   1020

cagcacaccg accccactct cccccactac cagcccgagt cctggacctt cgcccgcggt   1080

gccgctgcca ccattgaccg cgagttcggc ttcatcggcc gtcacattct ccacggcatc   1140

atcgagaccc acgtcctcca ccactacgtc agcaccatcc ccttctacca cgccgacgag   1200

gccagcgagg ctatcaagaa ggtcatgggc tcgcactacc gcagcgaggc acacaccggt   1260

cctctgggct tcctcaaggc tctctggacc agcgcccgtg tctgccactg ggtcgagccc   1320

accgaaggca ccaagggcga gaacgctggt gtcttgttct tccgcaacac caacggcatc   1380

ggtgttcctc ccattaagct gaccaagcct aactaa                             1416

<210>8

<211>471

<212>PRT

<213>Aspergillus nidulans

<400>8

Met Ser Ser Thr Ala Leu Pro Lys Arg Val Ala Leu His Arg Asn Pro

1               5                   10                  15

Thr Thr Asp Ser Ser Val Pro Ser Ser Val Ser Val Ser Pro Leu Asp

            20                  25                  30

Ser Pro Arg Gln Ser Pro Ser Ser Thr Ser Leu Ser Ser Met Ala Ser

        35                  40                  45

Asp Ala Gly Lys Gly Asp Leu Gly Lys Met Leu Asp Thr Tyr Gly Asn

    50                  55                  60

Glu Phe Lys Ile Pro Asp Tyr Thr Ile Lys Asp Ile Arg Asp Ala Ile

65                  70                  75                  80

Pro Ser His Cys Tyr Asn Arg Ser Ala Ile Arg Ser Leu Ser Tyr Val

                85                  90                  95

Phe Arg Asp Leu Ala Val Leu Ala Ser Val Phe Tyr Val Phe His Lys

            100                 105                 110

Tyr Val Thr Pro Glu Thr Val Pro Ser Tyr Pro Ala Arg Val Ala Leu

        115                 120                 125

Trp Thr Leu Tyr Thr Val Val Gln Gly Leu Phe Gly Thr Gly Ile Trp

    130                 135                 140

Val Leu Ala His Glu Cys Gly His Gln Ala Phe Ser Thr Ser Lys Val

145                 150                 155                 160

Leu Asn Asp Thr Val Gly Trp Ile Leu His Ser Ala Leu Leu Val Pro

                165                 170                 175

Tyr Phe Ser Trp Lys Ile Ser His Gly Lys His His Lys Ala Thr Gly

            180                 185                 190

Asn Leu Ala Arg Asp Met Val Phe Val Pro Lys Thr Arg Glu Val Tyr

        195                 200                 205

Ala Ser Arg Ile Lys Lys Thr Ile Tyr Asp Leu Asn Glu Val Met Glu

    210                 215                 220

Glu Thr Pro Leu Ala Thr Ala Thr His Ser Ile Leu Gln Gln Leu Phe

225                 230                 235                 240

Gly Trp Pro Leu Tyr Leu Leu Thr Asn Val Thr Gly His Asp Asn His

                245                 250                 255

Glu Arg Gln Pro Glu Gly Arg Gly Lys Gly Lys Arg Asn Gly Tyr Phe

            260                 265                 270

Thr Gly Val Asn His Phe Asn Pro Asn Ser Pro Leu Phe Glu Ala Lys

        275                 280                 285

Asp Ala Lys Leu Ile Ile Leu Ser Asp Ile Gly Leu Ala Ile Thr Ala

    290                 295                 300

Ser Ile Leu Tyr Leu Ile Gly Ser Lys Phe Gly Trp Met Asn Leu Leu

305                 310                 315                 320

Val Trp Tyr Gly Ile Pro Tyr Leu Trp Val Asn His Trp Leu Val Ala

                325                 330                 335

Ile Thr Tyr Leu Gln His Thr Asp Pro Thr Leu Pro His Tyr Gln Pro

            340                 345                 350

Glu Ser Trp Thr Phe Ala Arg Gly Ala Ala Ala Thr Ile Asp Arg Glu

        355                 360                 365

Phe Gly Phe Ile Gly Arg His Ile Leu His Gly Ile Ile Glu Thr His

    370                 375                 380

Val Leu His His Tyr Val Ser Thr Ile Pro Phe Tyr His Ala Asp Glu

385                 390                 395                 400

Ala Ser Glu Ala Ile Lys Lys Val Met Gly Ser His Tyr Arg Ser Glu

                405                 410                 415

Ala His Thr Gly Pro Leu Gly Phe Leu Lys Ala Leu Trp Thr Ser Ala

            420                 425                 430

Arg Val Cys His Trp Val Glu Pro Thr Glu Gly Thr Lys Gly Glu Asn

        435                 440                 445

Ala Gly Val Leu Phe Phe Arg Asn Thr Asn Gly Ile Gly Val Pro Pro

    450                 455                 460

Ile Lys Leu Thr Lys Pro Asn

465                 470

<210>9

<211>1185

<212>DNA

<213>Magnaporthe grisea

<400>9

atgtccacca ccgtcactca gcggccgggc gccgctagcc gcgctgaagc caagcccaag     60

gagcagcaat ttccagacat caacaccatc aggaatgcta tccccgcaca ctgttttgag    120

gcatctctgg tgacttcagt tggttacttg gtgcgagatg tggccctcat caccgctctc    180

ggctgggccg ccttgaccta cattccccaa attccggatt cgactttgcg ctggaccgcc    240

tgggccgctt acggctttgt tcagggtctc tttggcaccg gtctctggat tctggcccac    300

gagtgcggcc acggtgcttt cagcaagcac acgcgcatta acaacattct tggctgggcc    360

gcccactcgg ccctgctggt accgtacttc agctggaagt tctctcacca ccgccaccac    420

aacttcaccg gccacatgga gaaggacatg gcctttgtgc ccccccaggc tgccgaccgc    480

gagtcccgcg ccagcttgct gtcccgcttc ggcatcgacc tcgaggtctt tgaggatacc    540

cccatctttc agcttgctcg cctcgtgagc caccagctct tcggctggca gacttacctg    600

ctcttcaacg ccacctgcgg caaggagtct ctgcagaaca agggtgccgc gtggttccgc    660

cagagccact ttgagcccac ctctgccgtc ttccgctcca gcgaggccct ctacatcgcc    720

atctctgaca ttggcctggc catcgttgcc gccgccatct actggggctc caccaaggtc    780

ggcgccggca ccatgttcct cctctacgcc gttccctaca tgtgggttca ccactggctc    840

gtcgccatca cctaccttca ccacaccaac aaggaggtgc accactacga ggccgacagc    900

tggacctttg tcaagggtgc cgtcgccact gtcgaccgtg actttggttt cattgaccgc    960

cacctgttcc acggtatcat tggaacccac gtcgcccacc atctgttccc tcgcattccc   1020

ttttacaagg cagaggaggc caccgaggcc atcaagcctg tcctcggaga cctttaccac   1080

agcgacaatc gccccttcat gcaggctctg tggagcaact tcaccacctg caagtacgtc   1140

gagaaggacc ccaaggttcc cggcgccatg aggtgggccg attga                   1185

<210>10

<211>394

<212>PRT

<213>Magnaporthe grisea

<400>10

Met Ser Thr Thr Val Thr Gln Arg Pro Gly Ala Ala Ser Arg Ala Glu

1               5                   10                  15

Ala Lys Pro Lys Glu Gln Gln Phe Pro Asp Ile Asn Thr Ile Arg Asn

            20                  25                  30

Ala Ile Pro Ala His Cys Phe Glu Ala Ser Leu Val Thr Ser Val Gly

        35                  40                  45

Tyr Leu Val Arg Asp Val Ala Leu Ile Thr Ala Leu Gly Trp Ala Ala

    50                  55                  60

Leu Thr Tyr Ile Pro Gln Ile Pro Asp Ser Thr Leu Arg Trp Thr Ala

65                  70                  75                  80

Trp Ala Ala Tyr Gly Phe Val Gln Gly Leu Phe Gly Thr Gly Leu Trp

                85                  90                  95

Tle Leu Ala His Glu Cys Gly His Gly Ala Phe Ser Lys His Thr Arg

            100                 105                 110

Ile Asn Asn Ile Leu Gly Trp Ala Ala His Ser Ala Leu Leu Val Pro

        115                 120                 125

Tyr Phe Ser Trp Lys Phe Ser His His Arg His His Asn Phe Thr Gly

    130                 135                 140

His Met Glu Lys Asp Met Ala Phe Val Pro Pro Gln Ala Ala Asp Arg

145                 150                 155                 160

Glu Ser Arg Ala Ser Leu Leu Ser Arg Phe Gly Ile Asp Leu Glu Val

                165                 170                 175

Phe Glu Asp Thr Pro Ile Phe Gln Leu Ala Arg Leu Val Ser His Gln

            180                 185                 190

Leu Phe Gly Trp Gln Thr Tyr Leu Leu Phe Asn Ala Thr Cys Gly Lys

        195                 200                 205

Glu Ser Leu Gln Asn Lys Gly Ala Ala Trp Phe Arg Gln Ser His Phe

    210                 215                 220

Glu Pro Thr Ser Ala Val Phe Arg Ser Ser Glu Ala Leu Tyr Ile Ala

225                 230                 235                 240

Ile Ser Asp Ile Gly Leu Ala Ile Val Ala Ala Ala Ile Tyr Trp Gly

                245                 250                 255

Ser Thr Lys Val Gly Ala Gly Thr Met Phe Leu Leu Tyr Ala Val Pro

            260                 265                 270

Tyr Met Trp Val His His Trp Leu Val Ala Ile Thr Tyr Leu His His

        275                 280                 285

Thr Asn Lys Glu Val His His Tyr Glu Ala Asp Ser Trp Thr Phe Val

    290                 295                 300

Lys Gly Ala Val Ala Thr Val Asp Arg Asp Phe Gly Phe Ile Asp Arg

305                 310                 315                 320

His Leu Phe His Gly Ile Ile Gly Thr His Val Ala His His Leu Phe

                325                 330                 335

Pro Arg Ile Pro Phe Tyr Lys Ala Glu Glu Ala Thr Glu Ala Ile Lys

            340                 345                 350

Pro Val Leu Gly Asp Leu Tyr His Ser Asp Asn Arg Pro Phe Met Gln

        355                 360                 365

Ala Leu Trp Ser Asn Phe Thr Thr Cys Lys Tyr Val Glu Lys Asp Pro

    370                 375                 380

Lys Val Pro Gly Ala Met Arg Trp Ala Asp

385                 390

<210>11

<211>1656

<212>DNA

<213>Magnaporthe grisea

<400>11

atgccttcca ccagatcgac cacatcgggc attgcccagg agaagactcc tatgaggcga     60

acgaccacct cggccactgt cgaatcggac gtctcagctc cgggaaccgc tgttcagtcg    120

cctatggact cgccccgcca ctctgcctcg tccacctcac tctcttcact ctcttccgtt    180

gatgcggcgg ccgagaagaa atccaacgag tctgtcggca aactcgtcga cacgtacggc    240

aacacctttg agatccctga cttcaccatc aaggacatcc acgatgccat tccaaagcac    300

tgctttgaac gctctgctat tcgtagcttg agctacgtcg cccgtgatat ggtcctcctg    360

gcgacgacct tctacgtgtt ccacaactac gtgacaccag agtacattcc ctcgaagccg    420

gctcgtgctg gtctgtgggc catttacacg gtgctccagg gcctcttcgg caccggaatc    480

tgggttcttg cccatgagtg tggccactag gctttctcgc cttccaagac catcaacaac    540

acggttggct ggattctcca ctcgtctctg ctggttccgt acttcagctg gcagatgtca    600

cacagcaagc accacaaggc cactggccat attgagcgcg acatggtctt tgtgccccgc    660

acccgggagg agcacgctag caggatcggc cgcatggtcc acgagctgtc ggagttgacc    720

gaggagacgc ctattgccac ccttatccac ttggttgggc agcagctgat cggctggcct    780

ctgtacatca tcactaacaa gaccggtcac aactaccacg agcgccagcg tgagggccgt    840

ggcaagggca agaagaacgg tcttttcact ggcgtcaacc acttcaaccc cagcagccct    900

ctgtacgaga acaaggacgc cggaaaggtg cttctcagcg acctgggtgt cggccttgtt    960

atcgctggcc tcgtgtacct ttgccaaact ttcggcaccc agaacatgct ggtttggtac   1020

tttatcccct acctctgggt gaaccactgg ctcgttgcca ttacattcct tcagcacacc   1080

gacccctcgc ttccgcacta tactgccgag gaatggaact tcgtccgagg tgccgctgcc   1140

acgatcgatc gcgagtttgg cttcgtcggc cgccacctgc ttcacggtat cattgagacc   1200

cacgtcctgc accactatgt cagcacgatc cccttttaca acgccgacga ggctactgat   1260

gccatcaaga aggtgatggg caagcactac cgcagcgaca ctgccggcgg ccctgctggc   1320

ttccttaagt cactctggac gagtagccgc atgtgccaat gggttgagcc cagcgccgag   1380

gctgagggta gtggcaaggg tgtcctgttc ttccgcaacc acaacaagat cggcactcct   1440

cctatcaaga tgtctgctca gaaaattaga ctatgcaatg accttcttgg catgcataag   1500

ggaaagaatc aaatgaatgg atcaagggag cgccgcggcg gacaaagtag tttaaagagg   1560

gtgagaaatc agcgatcgac aaatatgaac gaatcacaca tgacggtgtt ccgggcattc   1620

cgaacttgga gctcatgcac gcgcgcgtcc acatga                             1656

<210>12

<211>551

<212>PRT

<213>Magnaporthe grisea

<400>12

Met Pro Ser Thr Arg Ser Thr Thr Ser Gly Ile Ala Gln Glu Lys Thr

1               5                   10                  15

Pro Met Arg Arg Thr Thr Thr Ser Ala Thr Val Glu Ser Asp Val Ser

            20                  25                  30

Ala Pro Gly Thr Ala Val Gln Ser Pro Met Asp Ser Pro Arg His Ser

        35                  40                  45

Ala Ser Ser Thr Ser Leu Ser Ser Leu Ser Ser Val Asp Ala Ala Ala

    50                  55                  60

Glu Lys Lys Ser Asn Glu Ser Val Gly Lys Leu Val Asp Thr Tyr Gly

65                  70                  75                  80

Asn Thr Phe Glu Ile Pro Asp Phe Thr Ile Lys Asp Ile His Asp Ala

                85                  90                  95

Ile Pro Lys His Cys Phe Glu Arg Ser Ala Ile Arg Ser Leu Ser Tyr

            100                 105                 110

Val Ala Arg Asp Met Val Leu Leu Ala Thr Thr Phe Tyr Val Phe His

        115                 120                 125

Asn Tyr Val Thr Pro Glu Tyr Ile Pro Ser Lys Pro Ala Arg Ala Gly

    130                 135                 140

Leu Trp Ala Ile Tyr Thr Val Leu Gln Gly Leu Phe Gly Thr Gly Ile

145                 150                 155                 160

Trp Val Leu Ala His Glu Cys Gly His Gln Ala Phe Ser Pro Ser Lys

                165                 170                 175

Thr Ile Asn Asn Thr Val Gly Trp Ile Leu His Ser Ser Leu Leu Val

            180                 185                 190

Pro Tyr Phe Ser Trp Gln Met Ser His Ser Lys His His Lys Ala Thr

        195                 200                 205

Gly His Ile Glu Arg Asp Met Val Phe Val Pro Arg Thr Arg Glu Glu

    210                 215                 220

His Ala Ser Arg Ile Gly Arg Met Val His Glu Leu Ser Glu Leu Thr

225                 230                 235                 240

Glu Glu Thr Pro Ile Ala Thr Leu Ile His Leu Val Gly Gln Gln Leu

                245                 250                 255

Ile Gly Trp Pro Leu Tyr Ile Ile Thr Asn Lys Thr Gly His Asn Tyr

            260                 265                 270

His Glu Arg Gln Arg Glu Gly Arg Gly Lys Gly Lys Lys Asn Gly Leu

        275                 280                 285

Phe Thr Gly Val Asn His Phe Asn Pro Ser Ser Pro Leu Tyr Glu Asn

    290                 295                 300

Lys Asp Ala Gly Lys Val Leu Leu Ser Asp Leu Gly Val Gly Leu Val

305                 310                 315                 320

Ile Ala Gly Leu Val Tyr Leu Cys Gln Thr Phe Gly Thr Gln Asn Met

                325                 330                 335

Leu Val Trp Tyr Phe Ile Pro Tyr Leu Trp Val Asn His Trp Leu Val

            340                 345                 350

Ala Ile Thr Phe Leu Gln His Thr Asp Pro Ser Leu Pro His Tyr Thr

        355                 360                 365

Ala Glu Glu Trp Asn Phe Val Arg Gly Ala Ala Ala Thr Ile Asp Arg

    370                 375                 380

Glu Phe Gly Phe Val Gly Arg His Leu Leu His Gly Ile Ile Glu Thr

385                 390                 395                 400

His Val Leu His His Tyr Val Ser Thr Ile Pro Phe Tyr Asn Ala Asp

                405                 410                 415

Glu Ala Thr Asp Ala Ile Lys Lys Val Met Gly Lys His Tyr Arg Ser

            420                 425                 430

Asp Thr Ala Gly Gly Pro Ala Gly Phe Leu Lys Ser Leu Trp Thr Ser

        435                 440                 445

Ser Arg Met Cys Gln Trp Val Glu Pro Ser Ala Glu Ala Glu Gly Ser

    450                 455                 460

Gly Lys Gly Val Leu Phe Phe Arg Asn His Asn Lys Ile Gly Thr Pro

465                 470                 475                 480

Pro Ile Lys Met Ser Ala Gln Lys Ile Arg Leu Cys Asn Asp Leu Leu

                485                 490                 495

Gly Met His Lys Gly Lys Asn Gln Met Asn Gly Ser Arg Glu Arg Arg

            500                 505                 510

Gly Gly Gln Ser Ser Leu Lys Arg Val Arg Asn Gln Arg Ser Thr Asn

        515                 520                 525

Met Asn Glu Ser His Met Thr Val Phe Arg Ala Phe Arg Thr Trp Ser

    530                 535                 540

Ser Cys Thr Arg Ala Ser Thr

545                 550

<210>13

<211>1290

<212>DNA

<213>Neurospora crassa

<400>13

atgacggtca ccacccgcag ccacaaggcc gcggccgcca ccgagcccga ggttgtcagc     60

accggcgttg acgccgtctc tgctgctgct ccctcctcct cctcctcctc ttccagccaa    120

aagtcggccg agcccatcga ataccccgac atcaagacca tccgcgacgc catccccgac    180

cactgcttcc gcccgcgcgt ctggatctcc atggcctact tcatccgcga cttcgccatg    240

gcctttggcc tcggctacct cgcctggcag tacatccccc tgatcgcctc caccccgctc    300

cgctacggcg cctgggctct gtacggctac ctccagggtc tcgtctgcac gggcatctgg    360

attctggcgc acgagtgcgg ccacggcgcc ttctcgaggc acacgtggtt caacaacgtc    420

atggggtgga ttggccactc cttcctcttg gtcccttact tcagctggaa gttcagccac    480

catcgccacc atcgcttcac cggccacatg gagaaggaca tggcgtttgt gcctgccacc    540

gaggctgatc gcaaccagag gaagctggcc aacttgtaca tggacaagga gacggccgag    600

atgtttgagg atgtgcccat tgtccagctc gtcaagctca tcgcccacca gctggccggc    660

tggcagatgt acctcctctt caacgtctcc gccggtaagg gcagcaagca gtgggagact    720

ggcaagggcg gcatgggctg gttgagggtt agccactttg agccttcctc tgctgtgttc    780

cgcaactccg aggccatcta cattgccctg tccgatcttg gtctcatgat catgggctat    840

atcctctacc aggccgcgca ggttgttggc tggcagatgg taggtctgct gtacttccag    900

cagtacttct gggttcacca ttggttggtc gccatcactt acctccacca cacccacgag    960

gaagtccacc actttgacgc cgactcgtgg accttcgtca agggcgctct cgccaccgtc    1020

gaccgcgatt ttggcttcat tggcaagcac ctcttccaca acattatcga ccaccacgtc    1080

gtccaccact tgttccctcg catccccttc tactacgccg aagaagccac caactcgatc    1140

cgccccatgc tcggccccct ctaccaccgc gacgaccgct ccttcatggg ccagctgtgg    1200

tacaacttca cccactgcaa gtgggtcgtt ccggaccccc aggtccccgg cgcgcttatt    1260

tgggcgcaca ccgttcagag cacccagtaa                                     1290

<210>14

<211>429

<212>PRT

<213>Neurospora crassa

<400>14

Met Thr Val Thr Thr Arg Ser His Lys Ala Ala Ala Ala Thr Glu Pro

1               5                   10                  15

Glu Val Val Ser Thr Gly Val Asp Ala Val Ser Ala Ala Ala Pro Ser

            20                  25                  30

Ser Ser Ser Ser Ser Ser Ser Gln Lys Ser Ala Glu Pro Ile Glu Tyr

        35                  40                  45

Pro Asp Ile Lys Thr Ile Arg Asp Ala Ile Pro Asp His Cys Phe Arg

    50                  55                  60

Pro Arg Val Trp Ile Ser Met Ala Tyr Phe Ile Arg Asp Phe Ala Met

65                  70                  75                  80

Ala Phe Gly Leu Gly Tyr Leu Ala Trp Gln Tyr Ile Pro Leu Ile Ala

                85                  90                  95

Ser Thr Pro Leu Arg Tyr Gly Ala Trp Ala Leu Tyr Gly Tyr Leu Gln

            100                 105                 110

Gly Leu Val Cys Thr Gly Ile Trp Ile Leu Ala His Glu Cys Gly His

        115                 120                 125

Gly Ala Phe Ser Arg His Thr Trp Phe Asn Asn Val Met Gly Trp Ile

    130                 135                 140

Gly His Ser Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Phe Ser His

145                 150                 155                 160

His Arg His His Arg Phe Thr Gly His Met Glu Lys Asp Met Ala Phe

                165                 170                 175

Val Pro Ala Thr Glu Ala Asp Arg Asn Gln Arg Lys Leu Ala Asn Leu

            180                 185                 190

Tyr Met Asp Lys Glu Thr Ala Glu Met Phe Glu Asp Val Pro Ile Val

        195                 200                 205

Gln Leu Val Lys Leu Ile Ala His Gln Leu Ala Gly Trp Gln Met Tyr

    210                 215                 220

Leu Leu Phe Asn Val Ser Ala Gly Lys Gly Ser Lys Gln Trp Glu Thr

225                 230                 235                 240

Gly Lys Gly Gly Met Gly Trp Leu Arg Val Ser His Phe Glu Pro Ser

                245                 250                 255

Ser Ala Val Phe Arg Asn Ser Glu Ala Ile Tyr Ile Ala Leu Ser Asp

            260                 265                 270

Leu Gly Leu Met Ile Met Gly Tyr Ile Leu Tyr Gln Ala Ala Gln Val

        275                 280                 285

Val Gly Trp Gln Met Val Gly Leu Leu Tyr Phe Gln Gln Tyr Phe Trp

    290                 295                 300

Val His His Trp Leu Val Ala Ile Thr Tyr Leu His His Thr His Glu

305                 310                 315                 320

Glu Val His His Phe Asp Ala Asp Ser Trp Thr Phe Val Lys Gly Ala

                325                 330                 335

Leu Ala Thr Val Asp Arg Asp Phe Gly Phe Ile Gly Lys His Leu Phe

            340                 345                 350

His Asn Ile Ile Asp His His Val Val His His Leu Phe Pro Arg Ile

        355                 360                 365

Pro Phe Tyr Tyr Ala Glu Glu Ala Thr Asn Ser Ile Arg Pro Met Leu

    370                 375                 380

Gly Pro Leu Tyr His Arg Asp Asp Arg Ser Phe Met Gly Gln Leu Trp

385                 390                 395                 400

Tyr Asn Phe Thr His Cys Lys Trp Val Val Pro Asp Pro Gln Val Pro

                405                 410                 415

Gly Ala Leu Ile Trp Ala His Thr Val Gln Ser Thr Gln

            420                 425

<210>15

<211>1446

<212>DNA

<213>Neurospora crassa

<400>15

atggcgtccg tctcctctgc ccttcccgag ggcaacaagc ctgccctgcg caggacccaa    60

accgaggcca cctccgactc ataccctggt accgctgatg cctctccctt cgactctccc    120

cttgagcgct cggcctccaa cacctcgctt tcttcccagg cctctgacaa cgtcaagacc    180

gacaaggccg agttcggcaa gctgctcgac acgtatggca acgagttcga ggtccccgac    240

ttcaccatca aggacatccg cgatgccatc cccgcccact gctttgagcg ttcggctctt    300

cacagcttgg cgcacgtcgt ccgcgacatc atttacctca ccgtcacttt ttacgtctgg    360

aacaagtatg tcactcccga gtacatcccc atgaaggctg cccgtgtcgt cctctggggt    420

ctgtacacct tcatgcaggg ccttttcggc accggtctct gggttcttgc ccatgagtgc    480

ggtcaccagg ctttctcccc gtccaggttg atcaacgaca ccgtcggctg ggtcctccac    540

tctgcccttc tcgtccccta cttctcgtgg aagttctccc acagcaagca ccacaaggcc    600

accggcaaca tcgagcgtga catggtcttc gttcctcgga cccgcgagca gtttgcgtct    660

cgcatcggcc gtttcgtcca tgagatttcc gagttgaccg aggagacccc catctacacc    720

ttgatccacc ttatcggtca gcagctcatc ggctggccca actacctcat gaccaacgtc    780

accggccaca acttccacga gaggcagcgc gagggtcgtg gcaagggcaa gaagaacggc    840

tggttcactg gtgtcaacca cttcaacccc agctctcccc tctatgagga gcgtgaggcc    900

ccctggatca tcgtctccga catcggtatc gctatcgccg ccaccgccct catctacctc    960

ggcaacacct tcggctggtc caacatgttc gtctggtact tccttcccta cctctgggtc    1020

aaccactggc ttgttgccat cacctacctc cagcacaccg acccctcgct cccccactac    1080

acccctgatc agtggaactt tgtccgtggt gccgccgcga ctattgaccg cgagttcggc    1140

ttcatcggcc gtcacctcct ccacggcatt atcgagaccc acgttctcca ccactacgtc    1200

agcaccattc ccttttacca cgccgacgag gcctccgagg ccatcaagaa ggtcatgggc    1260

cgtcactacc gcgctgacgt ccaagatggc cccatcggtt tcatcaaggc catgtggaag    1320

gctgctcgtt ggtgccagtg ggttgagcct accgagggcg ctgagggtaa gggcaagggc    1380

gtcttgttct accgcaacca gaacggtctc ggtgtcaagc ctgccaagct ccccaaaacc    1440

aactaa                                                               1446

<210>16

<211>481

<212>PRT

<213>Neurospora crassa

<400>16

Met Ala Ser Val Ser Ser Ala Leu Pro Glu Gly Asn Lys Pro Ala Leu

1               5                   10                  15

Arg Arg Thr Gln Thr Glu Ala Thr Ser Asp Ser Tyr Pro Gly Thr Ala

            20                  25                  30

Asp Ala Ser Pro Phe Asp Ser Pro Leu Glu Arg Ser Ala Ser Asn Thr

        35                  40                  45

Ser Leu Ser Ser Gln Ala Ser Asp Asn Val Lys Thr Asp Lys Ala Glu

    50                  55                  60

Phe Gly Lys Leu Leu Asp Thr Tyr Gly Asn Glu Phe Glu Val Pro Asp

65                  70                  75                  80

Phe Thr Ile Lys Asp Ile Arg Asp Ala Ile Pro Ala His Cys Phe Glu

                85                  90                  95

Arg Ser Ala Leu His Ser Leu Ala His Val Val Arg Asp Ile Ile Tyr

            100                 105                 110

Leu Thr Val Thr Phe Tyr Val Trp Asn Lys Tyr Val Thr Pro Glu Tyr

        115                 120                 125

Ile Pro Met Lys Ala Ala Arg Val Val Leu Trp Gly Leu Tyr Thr Phe

    130                 135                 140

Met Gln Gly Leu Phe Gly Thr Gly Leu Trp Val Leu Ala His Glu Cys

145                 150                 155                 160

Gly His Gln Ala Phe Ser Pro Ser Arg Leu Ile Asn Asp Thr Val Gly

                165                 170                 175

Trp Val Leu His Ser Ala Leu Leu Val Pro Tyr Phe Ser Trp Lys Phe

            180                 185                 190

Ser His Ser Lys His His Lys Ala Thr Gly Asn Ile Glu Arg Asp Met

        195                 200                 205

Val Phe Val Pro Arg Thr Arg Glu Gln Phe Ala Ser Arg Ile Gly Arg

    210                 215                 220

Phe Val His Glu Ile Ser Glu Leu Thr Glu Glu Thr Pro Ile Tyr Thr

225                 230                 235                 240

Leu Ile His Leu Ile Gly Gln Gln Leu Ile Gly Trp Pro Asn Tyr Leu

                245                 250                 255

Met Thr Asn Val Thr Gly His Asn Phe His Glu Arg Gln Arg Glu Gly

            260                 265                 270

Arg Gly Lys Gly Lys Lys Asn Gly Trp Phe Thr Gly Val Asn His Phe

        275                 280                 285

Asn Pro Ser Ser Pro Leu Tyr Glu Glu Arg Glu Ala Pro Trp Ile Ile

    290                 295                 300

Val Ser Asp Ile Gly Ile Ala Ile Ala Ala Thr Ala Leu Ile Tyr Leu

305                 310                 315                 320

Gly Asn Thr Phe Gly Trp Ser Asn Met Phe Val Trp Tyr Phe Leu Pro

                325                 330                 335

Tyr Leu Trp Val Asn His Trp Leu Val Ala Ile Thr Tyr Leu Gln His

            340                 345                 350

Thr Asp Pro Ser Leu Pro His Tyr Thr Pro Asp Gln Trp Asn Phe Val

        355                 360                 365

Arg Gly Ala Ala Ala Thr Ile Asp Arg Glu Phe Gly Phe Ile Gly Arg

    370                 375                 380

His Leu Leu His Gly Ile Ile Glu Thr His Val Leu His His Tyr Val

385                 390                 395                 400

Ser Thr Ile Pro Phe Tyr His Ala Asp Glu Ala Ser Glu Ala Ile Lys

                405                 410                 415

Lys Val Met Gly Arg His Tyr Arg Ala Asp Val Gln Asp Gly Pro Ile

            420                 425                 430

Gly Phe Ile Lys Ala Met Trp Lys Ala Ala Arg Trp Cys Gln Trp Val

        435                 440                 445

Glu Pro Thr Glu Gly Ala Glu Gly Lys Gly Lys Gly Val Leu Phe Tyr

    450                 455                 460

Arg Asn Gln Asn Gly Leu Gly Val Lys Pro Ala Lys Leu Pro Lys Thr

465                 470                 475                 480

Asn

<210>17

<211>1212

<212>DNA

<213>Fusarium graminearium

<400>17

atggccacca gacagcgaac tgccaccact gttgtggtcg agaaggacct gcccaaggtc    60

actctcgagg ccacttctca gcctcaattc cccgacatca agaccatcaa ggatgccatc    120

cccgcccact gcttccagcc ctcgctcatc acctcatact actatgtcgt ccgcgacttc    180

gccatggtcg gctccctcgt ctgggccgcc ctcacctaca tccccggcat tgaggaccag    240

tacctccgcg tcgccgcctg gatggcctac ggcttcctcc agggtctctt ctgcaccgga    300

atctggattc tcggtcatga gtgcggccac ggtgccttct ctacccacag caagctcaac    360

aatgtgaccg gctggttcct ccactcgttc ctcatggtcc cctatttcag ctggaagtac    420

tctcaccacc gtcaccaccg cttcaccggc cacatggatc tcgacatggc ctttgtcccc    480

cgcacttcgc ccaagccttc tttgtctttc cgcattgctg gtatggacgt cgctgagctg    540

attgaggaca cccccattgc ccaggccgtc aagctcatct tccaccagct cttcggatgg    600

caggtgtaca ccttcttcaa cgccagctct ggcaagggta gcaagcagtg ggagcccaag    660

agcggcttgg ccagctggtt ccgcgtcagc cacttcgagc ccaccagcgc tgtcttccgc    720

cccgccgagg ctcctttcat cctcatctcc gacattggtc tcgccctcac tggaactgct    780

ctgtactttg cttccaagga ggtcggcgtt tccaccgttc tctacctcta cctcgtcccc    840

tacctctggg tccaccactg gctcgtcgcc atcacctacc tccaccacca ccacaccgag    900

cttccccact acaccgccga gggctggacc tacgtcaagg gtgctctcgc tactgttgac    960

cgcgagtttg gcttcattgg caagcacctt ttccacggca tcattgagaa gcacgtcatt    1020

caccacctgt tccctaagat ccccttctac aaggctgacg aggccaccga ggccatcaag    1080

cccatcatcg gcgaccacta ctgccacgac gaccgcagct tccttggcca gctctggacc    1140

atctttggca gcctcaagta cgtcgagcac gaccccgccg tccctggtgc catgcgctgg    1200

gccaaggagt ag                                                        1212

<210>18

<211>403

<212>PRT

<213>Fusarium graminearium

<400>18

Met Ala Thr Arg Gln Arg Thr Ala Thr Thr Val Val Val Glu Lys Asp

1               5                   10                  15

Leu Pro Lys Val Thr Leu Glu Ala Thr Ser Gln Pro Gln Phe Pro Asp

            20                  25                  30

Ile Lys Thr Ile Lys Asp Ala Ile Pro Ala His Cys Phe Gln Pro Ser

        35                  40                  45

Leu Ile Thr Ser Tyr Tyr Tyr Val Val Arg Asp Phe Ala Met Val Gly

    50                  55                  60

Ser Leu Val Trp Ala Ala Leu Thr Tyr Ile Pro Gly Ile Glu Asp Gln

65                  70                  75                  80

Tyr Leu Arg Val Ala Ala Trp Met Ala Tyr Gly Phe Leu Gln Gly Leu

                85                  90                  95

Phe Cys Thr Gly Ile Trp Ile Leu Gly His Glu Cys Gly His Gly Ala

            100                 105                 110

Phe Ser Thr His Ser Lys Leu Asn Asn Val Thr Gly Trp Phe Leu His

        115                 120                 125

Ser Phe Leu Met Val Pro Tyr Phe Ser Trp Lys Tyr Ser His His Arg

    130                 135                 140

His His Arg Phe Thr Gly His Met Asp Leu Asp Met Ala Phe Val Pro

145                 150                 155                 160

Arg Thr Ser Pro Lys Pro Ser Leu Ser Phe Arg Ile Ala Gly Met Asp

                165                 170                 175

Val Ala Glu Leu Ile Glu Asp Thr Pro Ile Ala Gln Ala Val Lys Leu

            180                 185                 190

Ile Phe His Gln Leu Phe Gly Trp Gln Val Tyr Thr Phe Phe Asn Ala

        195                 200                 205

Ser Ser Gly Lys Gly Ser Lys Gln Trp Glu Pro Lys Ser Gly Leu Ala

    210                 215                 220

Ser Trp Phe Arg Val Ser His Phe Glu Pro Thr Ser Ala Val Phe Arg

225                 230                 235                 240

Pro Ala Glu Ala Pro Phe Ile Leu Ile Ser Asp Ile Gly Leu Ala Leu

                245                 250                 255   Thr Gly Thr Ala Leu Tyr Phe Ala Ser Lys Glu Val Gly Val Ser Thr

           260                 265                 270

Val Leu Tyr Leu Tyr Leu Val Pro Tyr Leu Trp Val His His Trp Leu

        275                 280                 285

Val Ala Ile Thr Tyr Leu His His His His Thr Glu Leu Pro His Tyr

    290                 295                 300

Thr Ala Glu Gly Trp Thr Tyr Val Lys Gly Ala Leu Ala Thr Val Asp

305                 310                 315                 320

Arg Glu Phe Gly Phe Ile Gly Lys His Leu Phe His Gly Ile Ile Glu

                325                 330                 335

Lys His Val Ile His His Leu Phe Pro Lys Ile Pro Phe Tyr Lys Ala

            340                 345                 350

Asp Glu Ala Thr Glu Ala Ile Lys Pro Ile Ile Gly Asp His Tyr Cys

        355                 360                 365

His Asp Asp Arg Ser Phe Leu Gly Gln Leu Trp Thr Ile Phe Gly Ser

    370                 375                 380

Leu Lys Tyr Val Glu His Asp Pro Ala Val Pro Gly Ala Met Arg Trp

385                 390                 395                 400

Ala Lys Glu

<210>19

<211>1371

<212>DNA

<213>Fusarium graminearium

<400>19

tcaaccacgg cgacggatac tgagtctgct gccgtttctc cttcagactc tccccgccat    60

tcggcctctt ccacctcgct ctcgtctctt tccgagattg atatcgccaa gcccaaggcc    120

gaatatggtg ttatgcttga cacctatggc aacaagttcg aggttcccga cttcaccatc    180

aaggagatct acaatgccat ccccaagcac tgcttccagc gctccgctct caagggatac    240

ggatacatcc tccgcgacat tgtccttctt gctaccacct ttagcatctg gtacaactat    300

gtgacccccg agtacatccc tagcactccc gcccgcgctg gtctctgggc tgtctacact    360

gttctccagg gtcttttcgg taccggtctc tgggtcatcg ctcacgagtg tggccacggt    420

gctttctccg actctcgcct tatcaacgac atcaccggct gggtcctcca ctcttctctc    480

ctcgtcccct acttcagctg gcaaatctcc caccgaaagc accacaaggc taccggaaac    540

atggagcgtg acatggtctt tgttccccga actcgcgagc agcaggctac tcgtctcggc    600

aagatgaccc acgagcttgc tcacctcact gaggagaccc ccgtcttcac tctgatcatg    660

cttgttctcc agcagctcgt cggctggccc aactacctca tgaccaacgt tactggccac    720

aactaccacg agcgtcagaa ggagggccgt ggcaagggca agcacaacgg tctcggcggc    780

ggtgtcaacc actttgatcc ccgcagccct ctttacgagc acagcgatgc taagctcatt    840

gtcttgagtg atattggtat cggtctgatg ggtaccgctc tgtacttcct cgtccagaag    900

tttggctttt acaacatggc catctggtac tttgtccctt acctttgggt caaccactgg    960

ctcgtcgcca ttactttcct ccagcacacc gaccctaccc ttccccacta caccaacgac    1020

gagtggaact ttgtccgcgg tgctgctgct accatcgatc gtgagatggg tttcattggc    1080

cgacacctcc tccacggtat catcgagact cacgtcctcc accactacgt cagcagcatc    1140

cccttctaca acgccgacga ggctaccgag gctatcaagc ctgtcatggg caagcactac    1200

cgtgccgacg tccaggatgg tccccgtggt ttcattcgtg ccatgtaccg cagtgcccgt    1260

atgtgccagt gggttgagcc cagcgctgag gccgagggtg ctggcaaggg tgttctgttc    1320

ttccgcaacc gcaacaaggt tggcactgct cctgccgtcc tcaaggctta g             1371

<210>20

<211>456

<212>PRT

<213>Fusarium graminearium

<400>20

Ser Thr Thr Ala Thr Asp Thr Glu Ser Ala Ala Val Ser Pro Ser Asp

1               5                   10                  15

Ser Pro Arg His Ser Ala Ser Ser Thr Ser Leu Ser Ser Leu Ser Glu

            20                  25                  30

Ile Asp Ile Ala Lys Pro Lys Ala Glu Tyr Gly Val Met Leu Asp Thr

        35                  40                  45

Tyr Gly Asn Lys Phe Glu Val Pro Asp Phe Thr Ile Lys Glu Ile Tyr

    50                  55                  60

Asn Ala Ile Pro Lys His Cys Phe Gln Arg Ser Ala Leu Lys Gly Tyr

65                  70                  75                  80

Gly Tyr Ile Leu Arg Asp Ile Val Leu Leu Ala Thr Thr Phe Ser Ile

                85                  90                  95

Trp Tyr Asn Tyr Val Thr Pro Glu Tyr Ile Pro Ser Thr Pro Ala Arg

            100                 105                 110

Ala Gly Leu Trp Ala Val Tyr Thr Val Leu Gln Gly Leu Phe Gly Thr

        115                 120                 125

Gly Leu Trp Val Ile Ala His Glu Cys Gly His Gly Ala Phe Ser Asp

    130                 135                 140

Ser Arg Leu Ile Ash Asp Ile Thr Gly Trp Val Leu His Ser Ser Leu

145                 150                 155                 160

Leu Val Pro Tyr Phe Ser Trp Gln Ile Ser His Arg Lys His His Lys

                165                 170                 175

Ala Thr Gly Asn Met Glu Arg Asp Met Val Phe Val Pro Arg Thr Arg

            180                 185                 190

Glu Gln Gln Ala Thr Arg Leu Gly Lys Met Thr His Glu Leu Ala His

        195                 200                 205

Leu Thr Glu Glu Thr Pro Val Phe Thr Leu Ile Met Leu Val Leu Gln

    210                 215                 220

Gln Leu Val Gly Trp Pro Asn Tyr Leu Met Thr Asn Val Thr Gly His

225                 230                 235                 240

Asn Tyr His Glu Arg Gln Lys Glu Gly Arg Gly Lys Gly Lys His Asn

                245                 250                 255

Gly Leu Gly Gly Gly Val Asn His Phe Asp Pro Arg Ser Pro Leu Tyr

            260                 265                 270

Glu His Ser Asp Ala Lys Leu Ile Val Leu Ser Asp Ile Gly Tle Gly

        275                 280                 285

Leu Met Gly Thr Ala Leu Tyr Phe Leu Val Gln Lys Phe Gly Phe Tyr

    290                 295                 300

Asn Met Ala Ile Trp Tyr Phe Val Pro Tyr Leu Trp Val Asn His Trp

305                 310                 315                 320

Leu Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr Leu Pro His

                325                 330                 335

Tyr Thr Asn Asp Glu Trp Asn Phe Val Arg Gly Ala Ala Ala Thr Ile

            340                 345                 350

Asp Arg Glu Met Gly Phe Ile Gly Arg His Leu Leu His Gly Ile Ile

        355                 360                 365

Glu Thr His Val Leu His His Tyr Val Ser Ser Ile Pro Phe Tyr Asn

    370                 375                 380

Ala Asp Glu Ala Thr Glu Ala Ile Lys Pro Val Met Gly Lys His Tyr

385                 390                 395                 400

Arg Ala Asp Val Gln Asp Gly Pro Arg Gly Phe Ile Arg Ala Met Tyr

                405                 410                 415

Arg Ser Ala Arg Met Cys Gln Trp Val Glu Pro Ser Ala Glu Ala Glu

            420                 425                 430

Gly Ala Gly Lys Gly Val Leu Phe Phe Arg Asn Arg Asn Lys Val Gly

        435                 440                 445

Thr Ala Pro Ala Val Leu Lys Ala

    450                 455

<210>21

<211>424

<212>PRT

<213>Aspergillus fumigatus

<400>21

Met Ala Ser Asp Ala Glu Lys Thr Ser Ser Lys Met Ile Asp Thr Tyr

1               5                   10                  15

Gly Asn Glu Phe Lys Ile Pro Asp Tyr Thr Ile Lys Gln Ile Arg Asp

            20                  25                  30

Ala Ile Pro Ala His Cys Tyr Gln Arg Ser Ala Ala Thr Ser Leu Tyr

        35                  40                  45

Tyr Val Phe Arg Asp Met Ala Ile Leu Ala Ser Val Phe Tyr Val Phe

     50                  55                  60

His Asn Tyr Val Thr Pro Glu Thr Val Pro Ser Met Pro Val Arg Val

65                  70                  75                  80

Val Leu Trp Thr Ile Tyr Thr Val Val Gln Gly Leu Val Gly Thr Gly

                85                  90                  95

Val Trp Val Leu Ala His Glu Cys Gly His Gln Ala Phe Ser Thr Ser

            100                 105                 110

Lys Val Leu Asn Asp Thr Val Gly Trp Ile Cys His Ser Leu Leu Leu

        115                 120                 125

Val Pro Tyr Phe Ser Trp Lys Ile Ser His Gly Lys His His Lys Ala

    130                 135                 140

Thr Gly Asn Ile Ala Arg Asp Met Val Phe Val Pro Lys Thr Arg Glu

145                 150                 155                 160

Glu Tyr Ala Thr Arg Ile Gly Arg Ala Ala His Glu Leu Ser Glu Leu

                165                 170                 175

Met Glu Glu Thr Pro Ile Leu Thr Ala Thr Asn Leu Val Leu Gln Gln

            180                 185                 190

Leu Phe Gly Trp Pro Met Tyr Leu Leu Thr Asn Val Thr Gly His Asn

        195                 200                 205

Asn His Glu Arg Gln Pro Glu Gly Arg Gly Lys Gly Lys Arg Asn Gly

    210                 215                 220

Tyr Phe Gly Gly Val Asn His Phe Asn Pro Ser Ser Pro Leu Tyr Glu

225                 230                 235                 240

Ala Lys Asp Ala Lys Leu Ile Val Leu Ser Asp Leu Gly Leu Phe Leu

                245                 250                 255

Val Gly Ser Leu Leu Tyr Tyr Ile Gly Ser Thr Tyr Gly Trp Leu Asn

            260                 265                 270

Leu Leu Val Trp Tyr Gly Ile Pro Tyr Leu Trp Val Asn His Trp Leu

        275                 280                 285

Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr Leu Pro His Tyr

    290                 295                 300

Gln Pro Glu Ala Trp Asp Phe Thr Arg Gly Ala Ala Ala Thr Ile Asp

305                 310                 315                 320

Arg Asp Phe Gly Phe Val Gly Arg His Ile Phe His Gly Ile Ile Glu

                325                 330                 335

Thr His Val Leu His His Tyr Val Ser Thr Ile Pro Phe Tyr His Ala

            340                 345                 350

Asp Glu Ala Ser Glu Ala Ile Gln Lys Val Met Gly Pro His Tyr Arg

        355                 360                 365

Ser Glu Ala His Thr Gly Trp Thr Gly Phe Leu Lys Ala Leu Trp Thr

    370                 375                 380

Ser Ala Arg Thr Cys Gln Trp Val Glu Pro Thr Glu Gly Ala Lys Gly

385                 390                 395                 400

Glu Ser Gln Tyr Val Leu Phe Tyr Arg Asn Ile Asn Gly Ile Gly Val

                405                 410                 415

Pro Pro Ala Lys Ile Pro Ala Lys

            420

<210>22

<211>466

<212>PRT

<213>Aspergillus flavus

<400>22

Met Ser Ser Thr Ala Ile Pro Lys Arg Met Ala Leu Asn Arg Asn Pro

1               5                   10                  15

Gly Thr Asp Ser Ser Val Pro Ser Val Ser Val Ser Pro Phe Asp Ser

            20                 25                 30

Pro Arg His Ser Pro Ser Ser Thr Ser Leu Ser Ser Leu Ala Ser Glu

        35                 40                 45

Ser Glu Asn Lys Gly Lys Met Leu Asp Thr Tyr Gly Asn Glu Phe Lys

    50                 55                 60

Ile Pro Asp Tyr Thr Ile Lys Gln Ile Arg Asp Ala Ile Pro Ala His

65                 70                 75                 80

Cys Tyr Glu Arg Lys Ala Leu Thr Ser Leu Tyr Tyr Val Phe Arg Asp

                85                 90                 95

Ile Ala Met Leu Gly Ser Ile Phe Tyr Val Phe His Asn Tyr Val Thr

            100                105                110

Pro Glu Thr Val Pro Ser Phe Pro Ala Arg Val Ala Leu Trp Ser Leu

        115                 120                 125

Tyr Thr Val Val Gln Gly Leu Ile Ala Thr Gly Val Trp Val Leu Ala

    130                 135                 140

His Glu Cys Gly His Gln Ala Phe Ser Pro Ser Lys Val Leu Asn Asp

145                 150                 155                 160

Thr Val Gly Trp Ile cys His Ser Ala Leu Leu Val Pro Tyr Phe Ser

                165                 170                 175

Trp Lys Ile Ser His Gly Lys His His Lys Ala Thr Gly Asn Ile Ala

            180                 185                 190

Arg Asp Met Val Phe Val Pro Lys Thr Arg Glu Glu Tyr Ala Ser Arg

        195                 200                 205

Ile Gly Lys Thr Ile His Asp Leu Asn Glu Leu Met Glu Glu Thr Pro

    210                 215                 220

Ile Ala Thr Val Thr Asn Leu Ile Leu Gln Gln Leu Phe Gly Trp Pro

225                 230                 235                 240

Met Tyr Leu Leu Thr Asn Val Thr Gly His Asn Asn His Glu Arg Gln

                245                 250                 255

Pro Glu Gly Arg Gly Lys Gly Lys Arg Asn Gly Tyr Phe Gly Gly Val

            260                 265                 270

Asn His Phe Asn Pro Ser Ser Pro Leu Tyr Glu Ala Lys Asp Ala Lys

        275                 280                 285

Leu Ile Val Leu Ser Asp Leu Gly Leu Ala Ile Thr Gly Ser Val Leu

    290                 295                 300

Tyr Tyr Ile Gly Ser Thr Tyr Gly Trp Leu Asn Leu Leu Val Trp Tyr

305                 310                 315                 320

Gly Ile Pro Tyr Leu Trp Val Asn His Trp Leu Val Ala Ile Thr Tyr

                325                 330                 335

Leu Gln His Thr Asp Pro Thr Leu Pro His Tyr Gln Pro Glu Val Trp

            340                 345                 350

Asn Phe Ala Arg Gly Ala Ala Ala Thr Ile Asp Arg Asp Phe Gly Phe

        355                 360                 365

Val Gly Arg His Ile Leu His Gly Ile Ile Glu Thr His Val Leu His

    370                 375                 380

His Tyr Val Ser Thr Ile Pro Phe Tyr His Ala Asp Glu Ala Ser Glu

385                 390                 395                 400

Ala Ile Gln Lys Val Met Gly Ser His Tyr Arg Thr Glu Ala His Thr

                405                 410                 415

Gly Trp Thr Gly Phe Phe Lys Ala Leu Phe Thr Ser Ala Arg Val Cys

            420                 425                 430

His Trp Val Glu Pro Thr Glu Gly Ala Arg Gly Glu Ser Glu Gly Val

        435                 440                 445

Leu Phe Tyr Arg Asn Thr Asn Gly Ile Gly Val Pro Pro Ala Lys Leu

    450                 455                 460

Ser Lys

465

<210>23

<211>19

<212>DNA

<213>人工序列

<220>

<223>引物TEF5′

<400>23

agagaccggg ttggcggcg                                                19

<210>24

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物TEF3′

<400>24

ttggatcctt tgaatgattc ttatactcag                                    30

<210>25

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物XPR5′

<400>25

tttccgcggc ccgagattcc ggcctcttc                                     29

<210>26

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物XPR3′

<400>26

tttccgcgga cacaatatct ggtcaaattt c                                  31

<210>27

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物YL5

<400>27

cccccctcga ggtcgatggt gtcgataagc ttgatatcg                          39

<210>28

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物YL6

<400>28

cgatatcaag cttatcgaca ccatcgacct cgagggggg                          39

<210>29

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物YL9

<400>29

tggtaaataa atgatgtcga ctcaggcgac gacgg                              35

<210>30

<21>35

<212>DNA

<213>人工序列

<220>

<223>引物YL10

<400>30

ccgtcgtcgc ctgagtcgac atcatttatt tacca                              35

<210>31

<211>37

<212>DNA

<213>人工序列

<220>

<223>引物YL7

<400>31

caaccgattt cgacagttaa ttaataattt gaatcga                            37

<210>32

<21>37

<212>DNA

<213>人工序列

<220>

<223>引物YL8

<400>32

tcgattcaaa ttattaatta actgtcgaaa tcggttg                            37

<210>33

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物YL3

<400>33

gtataagaat cattcaccat ggatccacta gttcta                             36

<210>34

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物YL4

<400>34

tagaactagt ggatccatgg tgaatgattc ttatac                             36

<210>35

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物YL1

<400>35

cagtgccaaa agccaaggca ctgagctcgt                                    30

<210>36

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物YL2

<400>36

gacgagctca gtgccttggc ttttggcact g                                  31

<210>37

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物YL61

<400>37

acaattccac acaacgtacg agccggaagc ata                                33

<210>38

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物YL62

<400>38

tatgcttccg gctcgtacgt tgtgtggaat tgt                                33

<210>39

<211>26

<212>DNA

<213>人工序列

<220>

<223>简并引物P73

<220>

<221>misc_feature

<222>(24)..(24)

<223>n is a,c,g,or t

<400>39

tgggtcctgg gccaygartg yggnca                                        26

<210>40

<211>9

<212>PRT

<213>人工序列

<220>

<223>Δ12去饱和酶中的共有序列

<400>40

Trp Val Leu Gly His Glu cys Gly His

1               5

<210>41

<211>30

<212>DNA

<213>人工序列

<220>

<223>简并引物P76

<220>

<221>misc_feature

<222>(25)..(25)

<223>n is a,c,g,or t

<220>

<221>misc_feature

<222>(28)..(28)

<223>n is a,c,g,or t

<400>41

ggtggcctcc tcggcgtgrt araanggnat                                    30

<210>42

<211>10

<212>PRT

<213>人工序列

<220>

<223>Δ12去饱和酶中的共有序列

<220>

<221>MISC_FEATURE

<222>(1)..(1)

<223>Xaa=Met or Ile

<400>42

Xaa Pro Phe Val His Ala Glu Glu Ala Thr

1               5                   10

<210>43

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物P99

<400>43

ggcaagctta acgccccgct gtttgagaa                                     29

<210>44

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物P100

<400>44

tgacgttgtt agatctacgt gggtctcgat gatgtc                            36

<210>45

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物P101

<400>45

gacccacgta gatctaacaa cgtcaccgga tgggt                              35

<210>46

<21>29

<212>DNA

<213>人工序列

<220>

<223>引物P102

<400>46

cgggaattcg gggttgaagt ggttgacag                                     29

<210>47

<211>16

<212>DNA

<213>人工序列

<220>

<223>引物P119

<400>47

taataacgcc agggtt                                                   16

<210>48

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物P120

<400>48

gtagaagggc attcgagaca cg                                            22

<210>49

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物P121

<400>49

tgtgcccaag gaccgaaagg ag                                            22

<210>50

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物P122

<400>50

tgcaggtagg tgatggccac gagttggg                                      28

<210>51

<211>1936

<212>DNA

<213>Yarrowia lioplytica

<400>51

cgtagttata tacaagaggt agatgcgtgc tggtgttaga ggggctctca ggattaggag     60

gaaaatttga cattggccct caacatataa cctcgggtgt gcctctgttt accctcagct    120

tttgcttgtc cccaagtcag tcacgccagg ccaaaaaggt tggtggattg acagggagaa    180

aaaaaaaagc ctagtgggtt taaactcgag gtaagacatt gaaatatata ccggtcggca    240

tcctgagtcc ctttctcgta ttccaacaga ccgaccatag aaatggattc gaccacgcag    300

accaacaccg gcaccggcaa ggtggccgtg cagcccccca cggccttcat taagcccatt    360

gagaaggtgt ccgagcccgt ctacgacacc tttggcaacg agttcactcc tccagactac    420

tctatcaagg atattctgga tgccattccc caggagtgct acaagcggtc ctacgttaag    480

tcctactcgt acgtggcccg agactgcttc tttatcgccg tttttgccta catggcctac    540

gcgtacctgc ctcttattcc ctcggcttcc ggccgagctg tggcctgggc catgtactcc    600

attgtccagg gtctgtttgg caccggtctg tgggttcttg cccacgagtg tggccactct    660

gctttctccg actctaacac cgtcaacaac gtcaccggat gggttctgca ctcctccatg    720

ctggtccctt actacgcctg gaagctgacc cactccatgc accacaagtc cactggtcac    780

ctcacccgtg atatggtgtt tgtgcccaag gaccgaaagg agtttatgga gaaccgaggc    840

gcccatgact ggtctgagct tgctgaggac gctcccctca tgaccctcta cggcctcatc    900

acccagcagg tgtttggatg gcctctgtat ctgctgtctt acgttaccgg acagaagtac    960

cccaagctca acaaatgggc tgtcaaccac ttcaacccca acgccccgct gtttgagaag   1020

aaggactggt tcaacatctg gatctctaac gtcggtattg gtatcaccat gtccgtcatc   1080

gcatactcca tcaaccgatg gggcctggct tccgtcaccc tctactacct gatcccctac   1140

ctgtgggtca accactggct cgtggccatc acctacctgc agcacaccga ccccactctg   1200

ccccactacc acgccgacca gtggaacttc acccgaggag ccgccgccac catcgaccga   1260

gagtttggct tcatcggctc cttctgcttc catgacatca tcgagaccca cgttctgcac   1320

cactacgtgt ctcgaattcc cttctacaac gcccgaatcg ccactgagaa gatcaagaag   1380

gtcatgggca agcactaccg acacgacgac accaacttca tcaagtctct ttacactgtc   1440

gcccgaacct gccagtttgt tgaaggtaag gaaggcattc agatgtttag aaacgtcaat   1500

ggagtcggag ttgctcctga cggcctgcct tctaaaaagt agagctagaa atgttatttg   1560

attgtgtttt aactgaacag caccgagccc gaggctaagc caagcgaagc cgaggggttg   1620

tgtagtccat ggacgtaacg agtaggcgat atcaccgcac tcggcactgc gtgtctgcgt   1680

tcatgggcga agtcacatta cgctgacaac cgttgtagtt tccctttagt atcaatactg   1740

ttacaagtac cggtctcgta ctcgtactga tacgaatctg tgggaagaag tcacccttat   1800

cagaccttca tactgatgtt tcggatatca atagaactgg catagagccg ttaaagaagt   1860

ttcacttaat cactccaacc ctcctacttg tagattcaag cagatcgata agatggattt   1920

gatggtcagt gctagc                                                   1936

<210>52

<211>419

<212>PRT

<213>Yarrowia lipolytica

<400>52

Met Asp Ser Thr Thr Gln Thr Asn Thr Gly Thr Gly Lys Val Ala Val

1               5                   10                  15

Gln Pro Pro Thr Ala Phe Ile Lys Pro Ile Glu Lys Val Ser Glu Pro

            20                  25                  30

Val Tyr Asp Thr Phe Gly Asn Glu Phe Thr Pro Pro Asp Tyr Ser Ile

        35                  40                  45

Lys Asp Ile Leu Asp Ala Ile Pro Gln Glu Cys Tyr Lys Arg Ser Tyr

    50                  55                  60

Val Lys Ser Tyr Ser Tyr Val Ala Arg Asp Cys Phe Phe Ile Ala Val

65                  70                  75                  80

Phe Ala Tyr Met Ala Tyr Ala Tyr Leu Pro Leu Ile Pro Ser Ala Ser

                85                  90                  95

Gly Arg Ala Val Ala Trp Ala Met Tyr Ser Ile Val Gln Gly Leu Phe

            100                 105                 110

Gly Thr Gly Leu Trp Val Leu Ala His Glu cys Gly His Ser Ala Phe

        115                 120                 125

Ser Asp Ser Asn Thr Val Asn Asn Val Thr Gly Trp Val Leu His Ser

    130                 135                 140

Ser Met Leu Val Pro Tyr Tyr Ala Trp Lys Leu Thr His Ser Met His

145                 150                 155                 160

His Lys Ser Thr Gly His Leu Thr Arg Asp Met Val Phe Val Pro Lys

                165                 170                 175

Asp Arg Lys Glu Phe Met Glu Asn Arg Gly Ala His Asp Trp Ser Glu

            180                 185                 190

Leu Ala Glu Asp Ala Pro Leu Met Thr Leu Tyr Gly Leu Ile Thr Gln

        195                 200                 205

Gln Val Phe Gly Trp Pro Leu Tyr Leu Leu Ser Tyr Val Thr Gly Gln

    210                 215                 220

Lys Tyr Pro Lys Leu Asn Lys Trp Ala Val Asn His Phe Asn Pro Asn

225                 230                 235                 240

Ala Pro Leu Phe Glu Lys Lys Asp Trp Phe Asn Ile Trp Ile Ser Asn

                245                 250                 255

Val Gly Ile Gly Ile Thr Met Ser Val Ile Ala Tyr Ser Ile Asn Arg

            260                 265                 270

Trp Gly Leu Ala Ser Val Thr Leu Tyr Tyr Leu Ile Pro Tyr Leu Trp

        275                 280                 285

Val Asn His Trp Leu Val Ala Ile Thr Tyr Leu Gln His Thr Asp Pro

    290                 295                 300

Thr Leu Pro His Tyr His Ala Asp Gln Trp Asn Phe Thr Arg Gly Ala

305                 310                 315                 320

Ala Ala Thr Ile Asp Arg Glu Phe Gly Phe Ile Gly Ser Phe Cys Phe

                325                 330                 335

His Asp Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Arg Ile

            340                 345                 350

Pro Phe Tyr Asn Ala Arg Ile Ala Thr Glu Lys Ile Lys Lys Val Met

        355                 360                 365

Gly Lys His Tyr Arg His Asp Asp Thr Asn Phe Ile Lys Ser Leu Tyr

    370                 375                 380

Thr Val Ala Arg Thr Cys Gln Phe Val Glu Gly Lys Glu Gly Ile Gln

385                 390                 395                 400

Met Phe Arg Asn Val Asn Gly Val Gly Val Ala Pro Asp Gly Leu Pro

                405                 410                 415

Ser Lys Lys

<210>53

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物P147

<400>53

tcatgccatg gattcgacca cgcag                                         25

<210>54

<211>26

<212>DNA

<213>人工序列

<220>

<223>引物P148

<400>54

acatgcggcc gcctactttt tagaag                                        26

<210>55

<211>37

<212>DNA

<213>人工序列

<220>

<223>引物P194

<400>55

agactccatg gcgtccactt cggctctgcc caagcag                            37

<210>56

<211>44

<212>DNA

<213>人工序列

<220>

<223>引物P195

<400>56

tttatagcgg ccgcctactt aagcaacggg cttgataaca gcgg                        44

<210>57

<211>12649

<212>DNA

<213>人工序列

<220>

<223>质粒pKUNF12T6E

<220>

<221>misc_feature

<222>(2507)..(2507)

<223>n is a,c,g,or t

<220>

<221>misc_feature

<222>(2512)..(2515)

<223>n is a,c,g,or t

<400>57

taaccctcac taaagggaac aaaagctgga gctccaccgc ggacacaata tctggtcaaa     60

tttcagtttc gttacataaa tcgttatgtc aaaggagtgt gggaggttaa gagaattatc    120

accggcaaac tatctgttaa ttgctaggta cctctagacg tccacccggg tcgcttggcg    180

gccgaagagg ccggaatctc gggccgcggt ggcggccgct tagttggtct tggacttctt    240

gggcttcttc aggtaggact ggacaaagaa gttgccgaac agagcgagca gggtgatcat    300

gtacacgccg agcagctgga ccagagcctg agggtagtcg caggggaaga ggtagtcgta    360

cagggactgc accagcatag ccatgaactg ggtcatctgc agagtggtga tgtagggctt    420

gatgggcttg acgaagccga agccctgaga ggaaaagaag tagtaggcgt acatgacggt    480

gtggacgaag gagttgagga tgacggagaa gtaggcgtcg ccaccaggag cgtacttggc    540

aatagcccac cagatggcga agatggtggc atggtggtac acgtgcagga aggagacctg    600

gttgaacttc ttgcacagga tcatgatagc ggtgtccagg aactcgtagg ccttggagac    660

gtagaacacg tagacgattc gggacatgcc ctgagcgtgg gactcgttgc ccttctccat    720

gtcgttgccg aagaccttgt agccacccag gatagcctgt cggatggtct cgacgcacat    780

gtagagggac agtccgaaga ggaacaggtt gtggagcagc ttgatggtct tcagctcgaa    840

gggcttctcc atctgcttca tgatgggaat gccgaagagc agcatggcca tgtagccgac    900

ctcgaaggcg agcatggtgg agacgtccat catgggcaga ccgtcggtca gagcgtaggg    960

cttagctccg tccatccact ggtcgacacc ggtctcgact cgtccgacca cgtcgtccca   1020

gacagaggag ttggccatgg tgaatgattc ttatactcag aaggaaatgc ttaacgattt   1080

cgggtgtgag ttgacaagga gagagagaaa agaagaggaa aggtaattcg gggacggtgg    1140

tcttttatac ccttggctaa agtcccaacc acaaagcaaa aaaattttca gtagtctatt    1200

ttgcgtccgg catgggttac ccggatggcc agacaaagaa actagtacaa agtctgaaca    1260

agcgtagatt ccagactgca gtaccctacg cccttaacgg caagtgtggg aaccggggga    1320

ggtttgatat gtggggtgaa gggggctctc gccggggttg ggcccgctac tgggtcaatt    1380

tggggtcaat tggggcaatt ggggctgttt tttgggacac aaatacgccg ccaacccggt    1440

ctctcctgaa ttctgcatcg atcgaggaag aggacaagcg gctgcttctt aagtttgtga    1500

catcagtatc caaggcacca ttgcaaggat tcaaggcttt gaacccgtca tttgccattc    1560

gtaacgctgg tagacaggtt gatcggttcc ctacggcctc cacctgtgtc aatcttctca    1620

agctgcctga ctatcaggac attgatcaac ttcggaagaa acttttgtat gccattcgat    1680

cacatgctgg tttcgatttg tcttagagga acgcatatac agtaatcata gagaataaac    1740

gatattcatt tattaaagta gatagttgag gtagaagttg taaagagtga taaatagcgg    1800

ccgcgcctac ttaagcaacg ggcttgataa cagcgggggg ggtgcccacg ttgttgcggt    1860

tgcggaagaa cagaacaccc ttaccagcac cctcggcacc agcgctgggc tcaacccact    1920

ggcacatacg cgcactgcgg tacatggcgc ggatgaagcc acgaggacca tcctggacat    1980

cagcccggta gtgcttgccc atgatgggct taatggcctc ggtggcctcg tccgcgttgt    2040

agaaggggat gctgctgacg tagtggtgga ggacatgagt ctcgatgatg ccgtggagaa    2100

ggtggcggcc gatgaagccc atctcacggt caatggtagc agcggcacca cggacgaagt    2160

tccactcgtc gttggtgtag tggggaaggg tagggtcggt gtgctggagg aaggtgatgg    2220

caacgagcca gtggttaacc cagaggtagg gaacaaagta ccagatggcc atgttgtaga    2280

aaccgaactt ctgaacgagg aagtacagag cagtggccat cagaccgata ccaatatcgc    2340

tgaggacgat gagcttagcg tcactgttct cgtacagagg gctgcgggga tcgaagtggt    2400

taacaccacc gccgaggccg ttatgcttgc ccttgccgcg accctcacgc tggcgctcgt    2460

ggtagttgtg gccggtaaca ttggtgatga ggtagttggg ccagccnacg annnnctcag    2520

taagatgagc gagctcgtgg gtcatctttc cgagacgagt agcctgctgc tcgcgggttc    2580

ggggaacgaa gaccatgtca cgctccatgt tgccagtggc cttgtggtgc tttcggtggg    2640

agatttgcca gctgaagtag gggacaagga gggaagagtg aagaacccag ccagtaatgt    2700

cgttgatgat gcgagaatcg gagaaagcac cgtgaccgca ctcatgggca ataacccaga    2760

gaccagtacc gaaaagaccc tgaagaacgg tgtacacggc ccacagacca gcgcgggcgg    2820

gggtggaggg gatatattcg ggggtcacaa agttgtacca gatgctgaaa gtggtagtca    2880

ggaggacaat gtcgcggagg atataaccgt atcccttgag agcggagcgc ttgaagcagt    2940

gcttagggat ggcattgtag atgtccttga tggtaaagtc gggaacctcg aactggttgc    3000

cgtaggtgtc gagcatgaca ccatactcgg acttgggctt ggcgatatca acctcggaca    3060

tggacgagag cgatgtggaa gaggccgagt ggcggggaga gtctgaagga gagacggcgg    3120

cagactcaga atccgtcaca gtagttgagg tgacggtgcg tctaagcgca gggttctgct    3180

tgggcagagc cgaagtggac gccatggaga gctgggttag tttgtgtaga gagtgtgtgt    3240

tgctagcgac tttcggattg tgtcattaca caaaacgcgt cgtctcgaca ctgatcttgt    3300

cgtggatact cacggctcgg acatcgtcgc cgacgatgac accggacttt cgcttaagga    3360

cgtcagtaac aggcattgtg tgatgtgtag tttagatttc gaatctgtgg ggaaagaaag    3420

gaaaaaagag actggcaacc gattgggaga gccactgttt atatataccc tagacaagcc    3480

ccccgcttgt aagatgttgg tcaatgtaaa ccagtattaa ggttggcaag tgcaggagaa    3540

gcaaggtgtg ggtaccgagc aatggaaatg tgcggaaggc aaaaaaatga ggccacggcc    3600

tattgtcggg gctatatcca gggggcgatt gaagtacact aacatgacat gtgtccacag    3660

accctcaatc tggcctgatg agccaaatcc atacgcgctt tcgcagctct aaaggctata    3720

acaagtcaca ccaccctgct cgacctcagc gccctcactt tttgttaaga caaactgtac    3780

acgctgttcc agcgttttct gcctgcacct ggtgggacat ttggtgcaac ctaaagtgct    3840

cggaacctct gtggtgtcca gatcagcgca gcagttccga ggtagttttg aggcccttag    3900

atgatgcaat ggtgtcagtc gctggatcac gagtcttaat ggcagtattc gttcttattt    3960

gtgccattga gccccgttat cctcgtatct tctacccccc atcccatccc tttgttggtg    4020

caaccctacc catttattgt tgggtgcagc ccaaccgacg tggagagctt ggcttggcca    4080

tataaaaagg ccccccccta gtggcaatgg cagaaagtca gctgtgagtt gttgaatttg    4140

tcatctaggc ggcctggccg tcttctccgg ggcaattgtt cctctatagt actgcgtaca    4200

ctgtttaaac agtgtacgca gatctgcgac gacggaattc ctgcagccca tctgcagaat    4260

tcaggagaga ccgggttggc ggcgtatttg tgtcccaaaa aacagcccca attgccccaa    4320

ttgaccccaa attgacccag tagcgggccc aaccccggcg agagccccct tcaccccaca    4380

tatcaaacct cccccggttc ccacacttgc cgttaagggc gtagggtact gcagtctgga    4440

atctacgctt gttcagactt tgtactagtt tctttgtctg gccatccggg taacccatgc    4500

cggacgcaaa atagactact gaaaattttt ttgctttgtg gttgggactt tagccaaggg    4560

tataaaagac caccgtcccc gaattacctt tcctcttctt ttctctctct ccttgtcaac    4620

tcacacccga aatcgttaag catttccttc tgagtataag aatcattcac catggctgcc    4680

gctccctctg tgcgaacctt tacccgagcc gaggttctga acgctgaggc tctgaacgag    4740

ggcaagaagg acgctgaggc tcccttcctg atgatcatcg acaacaaggt gtacgacgtc    4800

cgagagttcg tccctgacca tcctggaggc tccgtgattc tcacccacgt tggcaaggac    4860

ggcaccgacg tctttgacac ctttcatccc gaggctgctt gggagactct cgccaacttc    4920

tacgttggag acattgacga gtccgaccga gacatcaaga acgatgactt tgccgctgag    4980

gtccgaaagc tgcgaaccct gttccagtct ctcggctact acgactcctc taaggcctac    5040

tacgccttca aggtctcctt caacctctgc atctggggac tgtccaccgt cattgtggcc    5100

aagtggggtc agacctccac cctcgccaac gtgctctctg ctgccctgct cggcctgttc    5160

tggcagcagt gcggatggct ggctcacgac tttctgcacc accaggtctt ccaggaccga    5220

ttctggggtg atctcttcgg agccttcctg ggaggtgtct gccagggctt ctcctcttcc    5280

tggtggaagg acaagcacaa cactcaccat gccgctccca acgtgcatgg cgaggatcct    5340

gacattgaca cccaccctct cctgacctgg tccgagcacg ctctggagat gttctccgac    5400

gtccccgatg aggagctgac ccgaatgtgg tctcgattca tggtcctgaa ccagacctgg    5460

ttctacttcc ccattctctc cttcgctcga ctgtcttggt gcctccagtc cattctcttt    5520

gtgctgccca acggtcaggc tcacaagccc tccggagctc gagtgcccat ctccctggtc    5580

gagcagctgt ccctcgccat gcactggacc tggtacctcg ctaccatgtt cctgttcatc    5640

aaggatcctg tcaacatgct cgtgtacttc ctggtgtctc aggctgtgtg cggaaacctg    5700

ctcgccatcg tgttctccct caaccacaac ggtatgcctg tgatctccaa ggaggaggct    5760

gtcgacatgg atttctttac caagcagatc atcactggtc gagatgtcca tcctggactg    5820

ttcgccaact ggttcaccgg tggcctgaac taccagatcg agcatcacct gttcccttcc    5880

atgcctcgac acaacttctc caagatccag cctgccgtcg agaccctgtg caagaagtac    5940

aacgtccgat accacaccac tggtatgatc gagggaactg ccgaggtctt ctcccgactg    6000

aacgaggtct ccaaggccac ctccaagatg ggcaaggctc agtaagcggc cgcatgagaa    6060

gataaatata taaatacatt gagatattaa atgcgctaga ttagagagcc tcatactgct    6120

cggagagaag ccaagacgag tactcaaagg ggattacacc atccatatcc acagacacaa    6180

gctggggaaa ggttctatat acactttccg gaataccgta gtttccgatg ttatcaatgg    6240

gggcagccag gatttcaggc acttcggtgt ctcggggtga aatggcgttc ttggcctcca    6300

tcaagtcgta ccatgtcttc atttgcctgt caaagtaaaa cagaagcaga tgaagaatga    6360

acttgaagtg aaggaattta aattgccccg gagaagacgg ccaggccgcc tagatgacaa    6420

attcaacaac tcacagctga ctttctgcca ttgccactag gggggggcct ttttatatgg    6480

ccaagccaag ctctccacgt cggttgggct gcacccaaca ataaatgggt agggttgcac    6540

caacaaaggg atgggatggg gggtagaaga tacgaggata acggggctca atggcacaaa    6600

taagaacgaa tactgccatt aagactcgtg atccagcgac tgacaccatt gcatcatcta    6660

agggcctcaa aactacctcg gaactgctgc gctgatctgg acaccacaga ggttccgagc    6720

actttaggtt gcaccaaatg tcccaccagg tgcaggcaga aaacgctgga acagcgtgta    6780

cagtttgtct taacaaaaag tgagggcgct gaggtcgagc agggtggtgt gacttgttat    6840

agcctttaga gctgcgaaag cgcgtatgga tttggctcat caggccagat tgagggtctg    6900

tggacacatg tcatgttagt gtacttcaat cgccccctgg atatagcccc gacaataggc    6960

cgtggcctca tttttttgcc ttccgcacat ttccattgct cggtacccac accttgcttc    7020

tcctgcactt gccaacctta atactggttt acattgacca acatcttaca agcggggggc    7080

ttgtctaggg tatatataaa cagtggctct cccaatcggt tgccagtctc ttttttcctt    7140

tctttcccca cagattcgaa atctaaacta cacatcacac aatgcctgtt actgacgtcc    7200

ttaagcgaaa gtccggtgtc atcgtcggcg acgatgtccg agccgtgagt atccacgaca    7260

agatcagtgt cgagacgacg cgttttgtgt aatgacacaa tccgaaagtc gctagcaaca    7320

cacactctct acacaaacta acccagctct ccatggagtc cattgctccc ttcctgccct    7380

ccaagatgcc tcaggacctg ttcatggacc tcgccagcgc tatcggtgtc cgagctgctc    7440

cctacgtcga tcccctggag gctgccctgg ttgcccaggc cgagaagtac attcccacca    7500

ttgtccatca cactcgaggc ttcctggttg ccgtggagtc tcccctggct cgagagctgc    7560

ctctgatgaa ccccttccac gtgctcctga tcgtgctcgc ctacctggtc accgtgtttg    7620

tgggtatgca gatcatgaag aactttgaac gattcgaggt caagaccttc tccctcctgc    7680

acaacttctg tctggtctcc atctccgcct acatgtgcgg tggcatcctg tacgaggctt    7740

atcaggccaa ctatggactg tttgagaacg ctgccgatca caccttcaag ggtctcccta    7800

tggctaagat gatctggctc ttctacttct ccaagatcat ggagtttgtc gacaccatga    7860

tcatggtcct caagaagaac aaccgacaga tttcctttct gcacgtgtac caccactctt    7920

ccatcttcac catctggtgg ctggtcacct tcgttgctcc caacggtgaa gcctacttct    7980

ctgctgccct gaactccttc atccacgtca tcatgtacgg ctactacttt ctgtctgccc    8040

tgggcttcaa gcaggtgtcg ttcatcaagt tctacatcac tcgatcccag atgacccagt    8100

tctgcatgat gtctgtccag tcttcctggg acatgtacgc catgaaggtc cttggccgac    8160

ctggataccc cttcttcatc accgctctgc tctggttcta catgtggacc atgctcggtc    8220

tcttctacaa cttttaccga aagaacgcca agctcgccaa gcaggccaag gctgacgctg    8280

ccaaggagaa ggccagaaag ctccagtaag cggccgcaag tgtggatggg gaagtgagtg    8340

cccggttctg tgtgcacaat tggcaatcca agatggatgg attcaacaca gggatatagc    8400

gagctacgtg gtggtgcgag gatatagcaa cggatattta tgtttgacac ttgagaatgt    8460

acgatacaag cactgtccaa gtacaatact aaacatactg tacatactca tactcgtacc    8520

cgggcaacgg tttcacttga gtgcagtggc tagtgctctt actcgtacag tgtgcaatac    8580

tgcgtatcat agtctttgat gtatatcgta ttcattcatg ttagttgcgt acgaagtcgt    8640

caatgatgtc gatatgggtt ttgatcatgc acacataagg tccgacctta tcggcaagct    8700

caatgagctc cttggtggtg gtaacatcca gagaagcaca caggttggtt ttcttggctg    8760

ccacgagctt gagcactcga gcggcaaagg cggacttgtg gacgttagct cgagcttcgt    8820

aggagggcat tttggtggtg aagaggagac tgaaataaat ttagtctgca gaacttttta    8880

tcggaacctt atctggggca gtgaagtata tgttatggta atagttacga gttagttgaa    8940

cttatagata gactggacta tacggctatc ggtccaaatt agaaagaacg tcaatggctc    9000

tctgggcgtc gcctttgccg acaaaaatgt gatcatgatg aaagccagca atgacgttgc    9060

agctgatatt gttgtcggcc aaccgcgccg aaaacgcagc tgtcagaccc acagcctcca    9120

acgaagaatg tatcgtcaaa gtgatccaag cacactcata gttggagtcg tactccaaag    9180

gcggcaatga cgagtcagac agatactcgt cgaccttttc cttgggaacc accaccgtca    9240

gcccttctga ctcacgtatt gtagccaccg acacaggcaa cagtccgtgg atagcagaat    9300

atgtcttgtc ggtccatttc tcaccaactt taggcgtcaa gtgaatgttg cagaagaagt    9360

atgtgccttc attgagaatc ggtgttgctg atttcaataa agtcttgaga tcagtttggc    9420

gcgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg    9480

ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt    9540

atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa    9600

gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc    9660

gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag    9720

gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt    9780

gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg    9840

aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg    9900

ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg    9960

taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac   10020

tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg   10080

gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt   10140

taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg   10200

tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc   10260

tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt   10320

ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt   10380

taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag   10440

tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt   10500

cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc   10560

gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc   10620

cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg   10680

ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac   10740

aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg   10800

atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc   10860

tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact   10920

gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc   10980

aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat   11040

acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc   11100

ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac   11160

tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa   11220

aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact   11280

catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg   11340

atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg   11400

aaaagtgcca cctgatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca   11460

tcaggaaatt gtaagcgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag   11520

ctcatttttt aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac   11580

cgagataggg ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga   11640

ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc   11700

accctaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg   11760

gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa   11820

gaaagcgaaa ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac   11880

caccacaccc gccgcgctta atgcgccgct acagggcgcg tccattcgcc attcaggctg   11940

cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa   12000

gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt   12060

tgtaaaacga cggccagtga attgtaatac gactcactat agggcgaatt gggcccgacg   12120

tcgcatgcag tggtggtatt gtgactgggg atgtagttga gaataagtca tacacaagtc   12180

agctttcttc gagcctcata taagtataag tagttcaacg tattagcact gtacccagca   12240

tctccgtatc gagaaacaca acaacatgcc ccattggaca gatcatgcgg atacacaggt   12300

tgtgcagtat catacatact cgatcagaca ggtcgtctga ccatcataca agctgaacaa   12360

gcgctccata cttgcacgct ctctatatac acagttaaat tacatatcca tagtctaacc   12420

tctaacagtt aatcttctgg taagcctccc agccagcctt ctggtatcgc ttggcctcct   12480

caataggatc tcggttctgg ccgtacagac ctcggccgac aattatgata tccgttccgg   12540

tagacatgac atcctcaaca gttcggtact gctgtccgag agcgtctccc ttgtcgtcaa   12600

gacccacccc gggggtcaga ataagccagt cctcagagtc gcccttaat               12649

<210>58

<211>973

<212>DNA

<213>Yarrowia lipolytica

<220>

<221>misc_feature

<223>启动子FBAIN

<400>58

aaattgcccc ggagaagacg gccaggccgc ctagatgaca aattcaacaa ctcacagctg      60

actttctgcc attgccacta ggggggggcc tttttatatg gccaagccaa gctctccacg     120

tcggttgggc tgcacccaac aataaatggg tagggttgca ccaacaaagg gatgggatgg     180

ggggtagaag atacgaggat aacggggctc aatggcacaa ataagaacga atactgccat     240

taagactcgt gatccagcga ctgacaccat tgcatcatct aagggcctca aaactacctc     300

ggaactgctg cgctgatctg gacaccacag aggttccgag cactttaggt tgcaccaaat    360

gtcccaccag gtgcaggcag aaaacgctgg aacagcgtgt acagtttgtc ttaacaaaaa    420

gtgagggcgc tgaggtcgag cagggtggtg tgacttgtta tagcctttag agctgcgaaa    480

gcgcgtatgg atttggctca tcaggccaga ttgagggtct gtggacacat gtcatgttag    540

tgtacttcaa tcgccccctg gatatagccc cgacaatagg ccgtggcctc atttttttgc    600

cttccgcaca tttccattgc tcggtaccca caccttgctt ctcctgcact tgccaacctt    660

aatactggtt tacattgacc aacatcttac aagcgggggg cttgtctagg gtatatataa    720

acagtggctc tcccaatcgg ttgccagtct cttttttcct ttctttcccc acagattcga    780

aatctaaact acacatcaca caatgcctgt tactgacgtc cttaagcgaa agtccggtgt    840

catcgtcggc gacgatgtcc gagccgtgag tatccacgac aagatcagtg tcgagacgac    900

gcgttttgtg taatgacaca atccgaaagt cgctagcaac acacactctc tacacaaact    960

aacccagctc tcc                                                       973

<210>59

<211>957

<212>DNA

<213>Mortierella alpina

<400>59

atggagtcca ttgctccctt cctgccctcc aagatgcctc aggacctgtt catggacctc     60

gccagcgcta tcggtgtccg agctgctccc tacgtcgatc ccctggaggc tgccctggtt    120

gcccaggccg agaagtacat tcccaccatt gtccatcaca ctcgaggctt cctggttgcc    180

gtggagtctc ccctggctcg agagctgcct ctgatgaacc ccttccacgt gctcctgatc    240

gtgctcgcct acctggtcac cgtgtttgtg ggtatgcaga tcatgaagaa ctttgaacga    300

ttcgaggtca agaccttctc cctcctgcac aacttctgtc tggtctccat ctccgcctac    360

atgtgcggtg gcatcctgta cgaggcttat caggccaact atggactgtt tgagaacgct    420

gccgatcaca ccttcaaggg tctccctatg gctaagatga tctggctctt ctacttctcc    480

aagatcatgg agtttgtcga caccatgatc atggtcctca agaagaacaa ccgacagatt    540

tcctttctgc acgtgtacca ccactcttcc atcttcacca tctggtggct ggtcaccttc    600

gttgctccca acggtgaagc ctacttctct gctgccctga actccttcat ccacgtcatc    660

atgtacggct actactttct gtctgccctg ggcttcaagc aggtgtcgtt catcaagttc    720

tacatcactc gatcccagat gacccagttc tgcatgatgt ctgtccagtc ttcctgggac    780

atgtacgcca tgaaggtcct tggccgacct ggatacccct tcttcatcac cgctctgctc    840

tggttctaca tgtggaccat gctcggtctc ttctacaact tttaccgaaa gaacgccaag    900

ctcgccaagc aggccaaggc tgacgctgcc aaggagaagg ccagaaagct ccagtaa       957

<210>60

<211>318

<212>PRT

<213>Mortierella alpina(GenBank Accession No.AX464731)

<400>60

Met Glu Ser Ile Ala Pro Phe Leu Pro Ser Lys Met Pro Gln Asp Leu

1               5                   10                  15

Phe Met Asp Leu Ala Thr Ala Ile Gly Val Arg Ala Ala Pro Tyr Val

            20                  25                  30

Asp Pro Leu Glu Ala Ala Leu Val Ala Gln Ala Glu Lys Tyr Ile Pro

        35                  40                  45

Thr Ile Val His His Thr Arg Gly Phe Leu Val Ala Val Glu Ser Pro

    50                  55                  60

Leu Ala Arg Glu Leu Pro Leu Met Asn Pro Phe His Val Leu Leu Ile

65                  70                  75                  80

Val Leu Ala Tyr Leu Val Thr Val Phe Val Gly Met Gln Ile Met Lys

                85                  90                  95

Asn Phe Glu Arg Phe Glu Val Lys Thr Phe Ser Leu Leu His Asn Phe

            100                 105                 110

Cys Leu Val Ser Ile Ser Ala Tyr Met Cys Gly Gly Ile Leu Tyr Glu

        115                 120                 125

Ala Tyr Gln Ala Asn Tyr Gly Leu Phe Glu Asn Ala Ala Asp His Thr

    130                 135                 140

Phe Lys Gly Leu Pro Met Ala Lys Met Ile Trp Leu Phe Tyr Phe Ser

145                 150                 155                 160

Lys Ile Met Glu Phe Val Asp Thr Net Ile Met Val Leu Lys Lys Asn

                165                 170                 175

Asn Arg Gln Ile Ser Phe Leu His Val Tyr His His Ser Ser Ile Phe

            180                 185                 190

Thr Ile Trp Trp Leu Val Thr Phe Val Ala Pro Asn Gly Glu Ala Tyr

        195                 200                 205

Phe Ser Ala Ala Leu Asn Ser Phe Ile His Val Ile Met Tyr Gly Tyr

    210                 215                 220

Tyr Phe Leu Ser Ala Leu Gly Phe Lys Gln Val Ser Phe Ile Lys Phe

225                 230                 235                 240

Tyr Ile Thr Arg Ser Gln Met Thr Gln Phe cys Met Met Ser Val Gln

                245                 250                 255

Ser Ser Trp Asp Met Tyr Ala Met Lys Val Leu Gly Arg Pro Gly Tyr

            260                 265                 270

Pro Phe Phe Ile Thr Ala Leu Leu Trp Phe Tyr Met Trp Thr Met Leu

        275                 280                 285

Gly Leu Phe Tyr Asn Phe Tyr Arg Lys Asn Ala Lys Leu Ala Lys Gln

    290                 295                 300

Ala Lys Ala Asp Ala Ala Lys Glu Lys Ala Arg Lys Leu Gln

305                 310                 315

<210>61

<211>1374

<212>DNA

<213>Mortierella alpina

<400>61

atggctgccg ctccctctgt gcgaaccttt acccgagccg aggttctgaa cgctgaggct     60

ctgaacgagg gcaagaagga cgctgaggct cccttcctga tgatcatcga caacaaggtg    120

tacgacgtcc gagagttcgt ccctgaccat cctggaggct ccgtgattct cacccacgtt    180

ggcaaggacg gcaccgacgt ctttgacacc tttcatcccg aggctgcttg ggagactctc    240

gccaacttct acgttggaga cattgacgag tccgaccgag acatcaagaa cgatgacttt    300

gccgctgagg tccgaaagct gcgaaccctg ttccagtctc tcggctacta cgactcctct    360

aaggcctact acgccttcaa ggtctccttc aacctctgca tctggggact gtccaccgtc    420

attgtggcca agtggggtca gacctccacc ctcgccaacg tgctctctgc tgccctgctc    480

ggcctgttct ggcagcagtg cggatggctg gctcacgact ttctgcacca ccaggtcttc    540

caggaccgat tctggggtga tctcttcgga gccttcctgg gaggtgtctg ccagggcttc    600

tcctcttcct ggtggaagga caagcacaac actcaccatg ccgctcccaa cgtgcatggc    660

gaggatcctg acattgacac ccaccctctc ctgacctggt ccgagcacgc tctggagatg    720

ttctccgacg tccccgatga ggagctgacc cgaatgtggt ctcgattcat ggtcctgaac    780

cagacctggt tctacttccc cattctctcc ttcgctcgac tgtcttggtg cctccagtcc    840

attctctttg tgctgcccaa cggtcaggct cacaagccct ccggagctcg agtgcccatc    900

tccctggtcg agcagctgtc cctcgccatg cactggacct ggtacctcgc taccatgttc    960

ctgttcatca aggatcctgt caacatgctc gtgtacttcc tggtgtctca ggctgtgtgc   1020

ggaaacctgc tcgccatcgt gttctccctc aaccacaacg gtatgcctgt gatctccaag   1080

gaggaggctg tcgacatgga tttctttacc aagcagatca tcactggtcg agatgtccat   1140

cctggactgt tcgccaactg gttcaccggt ggcctgaact accagatcga gcatcacctg   1200

ttcccttcca tgcctcgaca caacttctcc aagatccagc ctgccgtcga gaccctgtgc   1260

aagaagtaca acgtccgata ccacaccact ggtatgatcg agggaactgc cgaggtcttc   1320

tcccgactga acgaggtctc caaggccacc tccaagatgg gcaaggctca gtaa         1374

<210>62

<211>457

<212>PRT

<213>Mortierella alpina(GenBank Accession No.AF465281)

<400>62

Met Ala Ala Ala Pro Ser Val Arg Thr Phe Thr Arg Ala Glu Val Leu

1               5                   10                  15

Asn Ala Glu Ala Leu Asn Glu Gly Lys Lys Asp Ala Glu Ala Pro Phe

            20                  25                  30

Leu Met Ile Ile Asp Asn Lys Val Tyr Asp Val Arg Glu Phe Val Pro

        35                  40                  45

Asp His Pro Gly Gly Ser Val Ile Leu Thr His Val Gly Lys Asp Gly

    50                  55                  60

Thr Asp Val Phe Asp Thr Phe His Pro Glu Ala Ala Trp Glu Thr Leu

65                  70                  75                  80

Ala Asn Phe Tyr Val Gly Asp Ile Asp Glu Ser Asp Arg Asp Ile Lys

                85                  90                  95

Asn Asp Asp Phe Ala Ala Glu Val Arg Lys Leu Arg Thr Leu Phe Gln

            100                 105                 110

Ser Leu Gly Tyr Tyr Asp Ser Ser Lys Ala Tyr Tyr Ala Phe Lys Val

        115                 120                 125

Ser Phe Asn Leu Cys Tle Trp Gly Leu Ser Thr Val Ile Val Ala Lys

    130                 135                 140

Trp Gly Gln Thr Ser Thr Leu Ala Asn Val Leu Ser Ala Ala Leu Leu

145                 150                 155                 160

Gly Leu Phe Trp Gln Gln Cys Gly Trp Leu Ala His Asp Phe Leu His

                165                 170                 175

His Gln Val Phe Gln Asp Arg Phe Trp Gly Asp Leu Phe Gly Ala Phe

            180                 185                 190

Leu Gly Gly Val Cys Gln Gly Phe Ser Ser Ser Trp Trp Lys Asp Lys

        195                 200                 205

His Asn Thr His His Ala Ala Pro Asn Val His Gly Glu Asp Pro Asp

    210                 215                 220

Ile Asp Thr His Pro Leu Leu Thr Trp Ser Glu His Ala Leu Glu Met

225                 230                 235                 240

Phe Ser Asp Val Pro Asp Glu Glu Leu Thr Arg Met Trp Ser Arg Phe

                245                 250                 255

Met Val Leu Asn Gln Thr Trp Phe Tyr Phe Pro Ile Leu Ser Phe Ala

            260                 265                 270

Arg Leu Ser Trp Cys Leu Gln Ser Ile Leu Phe Val Leu Pro Asn Gly

        275                 280                 285

Gln Ala His Lys Pro Ser Gly Ala Arg Val Pro Ile Ser Leu Val Glu

    290                 295                 300

Gln Leu Ser Leu Ala Met His Trp Thr Trp Tyr Leu Ala Thr Met Phe

305                 310                 315                 320

Leu Phe Ile Lys Asp Pro Val Asn Met Leu Val Tyr Phe Leu Val Ser

                325                 330                 335

Gln Ala Val Cys Gly Asn Leu Leu Ala Ile Val Phe Ser Leu Asn His

            340                 345                 350

Asn Gly Met Pro Val Ile Ser Lys Glu Glu Ala Val Asp Met Asp Phe

        355                 360                 365

Phe Thr Lys Gln Ile Ile Thr Gly Arg Asp Val His Pro Gly Leu Phe

    370                 375                 380

Ala Asn Trp Phe Thr Gly Gly Leu Asn Tyr Gln Ile Glu His His Leu

385                 390                 395                 400

Phe Pro Ser Met Pro Arg His Asn Phe Ser Lys Ile Gln Pro Ala Val

                405                 410                 415

Glu Thr Leu Cys Lys Lys Tyr Asn Val Arg Tyr His Thr Thr Gly Met

            420                 425                 430

Ile Glu Gly Thr Ala Glu Val Phe Ser Arg Leu Asn Glu Val Ser Lys

        435                 440                 445

Ala Thr Ser Lys Met Gly Lys Ala Gln

    450                 455

<210>63

<211>1001

<212>DNA

<213>Yarrowia lipolytica

<220>

<22>misc_feature

<223>Promoter FBA

<400>63

taaacagtgt acgcagtact atagaggaac aattgccccg gagaagacgg ccaggccgcc    60

tagatgacaa attcaacaac tcacagctga ctttctgcca ttgccactag ggggggcctt    120

tttatatggc caagccaagc tctccacgtc ggttgggctg cacccaacaa taaatgggta    180

gggttgcacc aacaaaggga tgggatgggg ggtagaagat acgaggataa cggggctcaa    240

tggcacaaat aagaacgaat actgccatta agactcgtga tccagcgact gacaccattg    300

catcatctaa gggcctcaaa actacctcgg aactgctgcg ctgatctgga caccacagag    360

gttccgagca ctttaggttg caccaaatgt cccaccaggt gcaggcagaa aacgctggaa    420

cagcgtgtac agtttgtctt aacaaaaagt gagggcgctg aggtcgagca gggtggtgtg    480

acttgttata gcctttagag ctgcgaaagc gcgtatggat ttggctcatc aggccagatt    540

gagggtctgt ggacacatgt catgttagtg tacttcaatc gccccctgga tatagccccg    600

acaataggcc gtggcctcat ttttttgcct tccgcacatt tccattgctc ggtacccaca    660

ccttgcttct cctgcacttg ccaaccttaa tactggttta cattgaccaa catcttacaa    720

gcggggggct tgtctagggt atatataaac agtggctctc ccaatcggtt gccagtctct    780

tttttccttt ctttccccac agattcgaaa tctaaactac acatcacaca atgcctgtta    840

ctgacgtcct taagcgaaag tccggtgtca tcgtcggcga cgatgtccga gccgtgagta    900

tccacgacaa gatcagtgtc gagacgacgc gttttgtgta atgacacaat ccgaaagtcg    960

ctagcaacac acactctcta cacaaactaa cccagctctc c                       1001

<210>64

<211>819

<213>Thraustochytrium aureum

<400>64

atggccaact cctctgtctg ggacgacgtg gtcggacgag tcgagaccgg tgtcgaccag     60

tggatggacg gagctaagcc ctacgctctg accgacggtc tgcccatgat ggacgtctcc    120

accatgctcg ccttcgaggt cggctacatg gccatgctgc tcttcggcat tcccatcatg    180

aagcagatgg agaagccctt cgagctgaag accatcaagc tgctccacaa cctgttcctc    240

ttcggactgt ccctctacat gtgcgtcgag accatccgac aggctatcct gggtggctac    300

aaggtcttcg gcaacgacat ggagaagggc aacgagtccc acgctcaggg catgtcccga    360

atcgtctacg tgttctacgt ctccaaggcc tacgagttcc tggacaccgc tatcatgatc    420

ctgtgcaaga agttcaacca ggtctccttc ctgcacgtgt accaccatgc caccatcttc    480

gccatctggt gggctattgc caagtacgct cctggtggcg acgcctactt ctccgtcatc    540

ctcaactcct tcgtccacac cgtcatgtac gcctactact tcttttcctc tcagggcttc    600

ggcttcgtca agcccatcaa gccctacatc accactctgc agatgaccca gttcatggct    660

atgctggtgc agtccctgta cgactacctc ttcccctgcg actaccctca ggctctggtc    720

cagctgctcg gcgtgtacat gatcaccctg ctcgctctgt tcggcaactt ctttgtccag    780

tcctacctga agaagcccaa gaagtccaag accaactaa                           819

<210>65

<211>272

<212>PRT

<213>Thraustochytrium aureum

<400>65

Met Ala Asn Ser Ser Val Trp Asp Asp Val Val Gly Arg Val Glu Thr

1               5                   10                  15

Gly Val Asp Gln Trp Met Asp Gly Ala Lys Pro Tyr Ala Leu Thr Asp

            20                  25                  30

Gly Leu Pro Met Met Asp Val Ser Thr Met Leu Ala Phe Glu Val Gly

        35                  40                  45

Tyr Met Ala Met Leu Leu Phe Gly Ile Pro Ile Met Lys Gln Met Glu

    50                  55                  60

Lys Pro Phe Glu Leu Lys Thr Ile Lys Leu Leu His Asn Leu Phe Leu

                    70                  75                  80

Phe Gly Leu Ser Leu Tyr Met Cys Val Glu Thr Ile Arg Gln Ala Ile

                85                  90                  95

Leu Gly Gly Tyr Lys Val Phe Gly Asn Asp Met Glu Lys Gly Asn Glu

            100                 105                 110

Ser His Ala Gln Gly Met Ser Arg Ile Val Tyr Val Phe Tyr Val Ser

        115                 120                 125

Lys Ala Tyr Glu Phe Leu Asp Thr Ala Ile Met Ile Leu Cys Lys Lys

    130                 135                 140

Phe Asn Gln Val Ser Phe Leu His Val Tyr His His Ala Thr Ile Phe

145                 150                 155                 160

Ala Ile Trp Trp Ala Ile Ala Lys Tyr Ala Pro Gly Gly Asp Ala Tyr

                165                 170                 175

Phe Ser Val Ile Leu Asn Ser Phe Val His Thr Val Met Tyr Ala Tyr

            180                 185                 190

Tyr Phe Phe Ser Ser Gln Gly Phe Gly Phe Val Lys Pro Ile Lys Pro

        195                 200                 205

Tyr Ile Thr Thr Leu Gln Met Thr Gln Phe Met Ala Met Leu Val Gln

    210                 215                 220

Ser Leu Tyr Asp Tyr Leu Phe Pro Cys Asp Tyr Pro Gln Ala Leu Val

225                 230                 235                 240

Gln Leu Leu Gly Val Tyr Met Ile Thr Leu Leu Ala Leu Phe Gly Asn

                245                 250                 255

Phe Phe Val Gln Ser Tyr Leu Lys Lys Pro Lys Lys Ser Lys Thr Asn

            260                 265                 270

<210>66

<211>10

<212>DNA

<213>Yarrowia lipolytica

<220>

<221>misc_feature

<222>(8)..(8)

<223>n is a,c,g,or t

<400>66

mammatgnhs                                                          10

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号