首页> 中国专利> 破坏过氧化物酶体生物合成因子蛋白(PEX)以改变含油真核生物中多不饱和脂肪酸和总脂质含量

破坏过氧化物酶体生物合成因子蛋白(PEX)以改变含油真核生物中多不饱和脂肪酸和总脂质含量

摘要

通过改变过氧化物酶体生物合成因子(Pex)蛋白的活性,已经成功地找到在生产PUFA的含油真核生物中的总脂质级分和油级分中提高多不饱和脂肪酸(PUFA)的量的方法。在与不破坏天然Pex蛋白的亲本菌株比较时,在生产PUFA的含油真核生物菌种中破坏染色体Pex3基因、Pex10p基因或Pex16p基因,导致在菌株的总脂质级分和油级分中的PUFA量提高,所述PUFA的量以总脂肪酸百分比和干细胞重量百分比形式表示。

著录项

  • 公开/公告号CN101883843A

    专利类型发明专利

  • 公开/公告日2010-11-10

    原文格式PDF

  • 申请/专利权人 纳幕尔杜邦公司;

    申请/专利号CN200880118917.4

  • 申请日2008-10-03

  • 分类号C12N1/00(20060101);C12P7/64(20060101);C12N15/00(20060101);

  • 代理机构72001 中国专利代理(香港)有限公司;

  • 代理人李波;郭文洁

  • 地址 美国特拉华州

  • 入库时间 2023-12-18 01:13:49

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-03-02

    授权

    授权

  • 2010-12-22

    实质审查的生效 IPC(主分类):C12N1/00 申请日:20081003

    实质审查的生效

  • 2010-11-10

    公开

    公开

说明书

本专利申请要求美国临时申请60/977,174和60/977,177的优先权,所述临时申请均提交于2007年10月3日,并且全文以引用方式并入本文中。

发明领域

本发明属于生物技术领域。更具体地讲,本发明涉及基于破坏过氧化物酶体生物合成因子(PEX)蛋白的、用于操纵真核生物的多不饱和脂肪酸(PUFA)组成和脂质含量的方法。

发明背景

已经有大量文献证明了与多不饱和脂肪酸[“PUFA”],尤其是ω-3和ω-6PUFA相关的健康有益效果。为了寻找大规模制备ω-3和ω-6

PUFA的方法,研究者已经将他们的工作转向发现基因以及了解产生脂质和脂肪酸的编码的生物合成途径。

一个用于生产这些PUFA的研究成果已经将ω-3/ω-6PUFA生物合成途径导入了不会天然产生ω-3/ω-6PUFA的生物体中。一种已经被广泛使用的所述生物是非含油酵母,啤酒糖酵母(Saccharomycescerevisiae)。然而,并无初步结果证明有限产量的亚油酸[“LA”]、γ-亚麻酸[“GLA”]、α-亚麻酸[“ALA”]、十八碳四烯酸[“STA”]和/或二十碳五烯酸[“EPA”]适于商业开发。

其它用于大规模生产ω-3/ω-6PUFA的研究成果已经培育出了天然生产选定脂肪酸的微生物,例如异养硅藻小环藻属(Cyclotella sp.)和菱形藻属(Nitzschia sp.)、假单胞菌属(Pseudomonas)、交替单胞菌属(Alteromonas)或希瓦氏菌(Shewanella)、腐霉属(Pythium)的丝状真菌、或长被孢霉属(Mortierella elongata)、M.exigua或M.hygrophila。

然而所有这些研究成果都不能够充分地改善油产量或控制所生产的油的组成的特性,因为发酵依赖微生物本身的天然能力。

共有的美国专利7,238,482描述了使用含油酵母解脂耶氏酵母作为生产宿主用于生产PUFA的用途。含油酵母被定义为是那些天然能够合成并积聚油的酵母,其中细胞干重一般大于25%。本领域已经描述了生产宿主的优化(参见例如国际申请公开WO 2006/033723、美国专利申请公开2006-0094092、美国专利申请公开2006-0115881、和美国专利申请公开2006-0110806)。本文所述的重组菌株包含多种嵌合基因,所述基因表达多拷贝的异源去饱和酶、延伸酶和酰基转移酶,并且任选地包含多个天然去饱和酶和酰基转移酶敲除以能够合成并积聚PUFA。商业生产PUFA需要对宿主细胞进行进一步优化。

Lin Y.等人提出过氧化物酶体是脂质的分解代谢和合成代谢所必需的(Plant Physiology,135:814-827(2004))。然而,该假说是以对拟南芥属突变体中的Pex16p同源物的研究为基础的,该突变体具有异常的过氧化物酶体生物合成以及脂肪酸合成(即,据报道ssel种子中生产的油比野生型减少了大约10-16%)。Binns,D.等人(J.Cell Biol.,173(5):719-731(2006))也提供了证明过氧化物酶体和脂质体在啤酒糖酵母中的密切协作的文献。但是以前尚未在生产PUFA的生物中进行过对Pex敲除的研究。

申请人已经通过在生产PUFA的生物体中破坏过氧化物酶体生物合成因子蛋白的非预知机制,解决了优化宿主细胞以用于PUFA商业生产的所述问题,所述机制导致在解脂耶氏酵母的重组PUFA生产菌株中提高PUFA量(以总脂肪酸百分比形式表示)的非预知结果。本文描述了在过氧化物酶体生物合成因子蛋白中存在破坏的新型菌株。

发明概述

本文所述的是提高在具有总脂质含量、总脂质级分和油级分的含油真核生物中至少一种多不饱和脂肪酸[“PUFA”]的重量%相对于总脂肪酸[“TFA”]的重量%的方法,所述方法包括:

a)提供含油真核生物,所述含油真核生物包含:

1)编码功能性多不饱和脂肪酸生物合成途径的基因;和

2)在编码过氧化物酶体生物合成因子蛋白的天然基因中的破坏,由此提供PEX破坏的生物,以及

b)使所述PEX破坏的生物在以下条件下生长:即,使得当与编码过氧化物酶体生物合成因子蛋白的天然基因未被破坏的含油真核生物中的总脂质级分或油级分中相对于总脂肪酸的重量百分比的至少一种多不饱和脂肪酸的重量百分比进行比较时,所述总脂质级分或油级分中至少一种多不饱和脂肪酸的重量百分比相对于总脂肪酸的重量百分比提高。

该提高方法也可通过实施相同步骤(a)和(b),用于提高至少一种多不饱和脂肪酸[“PUFA”]相对于干细胞重量[“DCW”]的百分比。

在本文所述的一些方法中,PUFA重量%相对于TFA重量%提高了至少1.3倍。

在一些所述方法中,PEX破坏的生物体中的总脂质含量与天然PEX基因中无破坏的含油真核生物的总脂质含量相比可能提高或降低。

在这些方法的任何一种中,提高的PUFA可以是单个PUFA或多个PUFA的组合。在任一种情况下,提高的PUFA或提高的PUFA组合可以包括亚油酸、共轭亚油酸、γ-亚麻酸、二高-γ-亚麻酸、花生四烯酸、二十二碳四烯酸、ω-6二十二碳五烯酸、α-亚麻酸、十八碳四烯酸、二十碳四烯酸、二十碳五烯酸、ω-3二十二碳五烯酸、二十碳二烯酸、二十碳三烯酸、二十二碳六烯酸、这些脂肪酸的羟基化或环氧脂肪酸、C18多不饱和脂肪酸或这些脂肪酸的组合、C20多不饱和脂肪酸或这些脂肪酸的组合、C20-22多不饱和脂肪酸的组合和C22多不饱和脂肪酸或这些脂肪酸的组合。

在这些方法的任何一种中,PEX破坏的生物可以是以下生物的一员:耶氏酵母属(Yarrowia)、假丝酵母属(Candida)、红酵母属(Rhodotorula)、红冬孢酵母属(Rhodosporidium)、隐球酵母属(Cryptococcus)、丝孢酵母属(Trichosporon)、油脂酵母属(Lipomyces)、被孢霉属(Mortierella)、破囊壶菌属(Thraustochytrium)、裂殖壶菌属(Schizochytrium)、和糖酵母属(Saccharomyces),上述生物都具有含油特性。并且,在任何一种所述方法中,PUFA生物合成途径包括编码以下酶的任何一种或它们的组合的基因:Δ9去饱和酶、Δ12去饱和酶、Δ6去饱和酶、Δ5去饱和酶、Δ17去饱和酶、Δ8去饱和酶、Δ15去饱和酶、Δ4去饱和酶、C14/16延伸酶、C16/18延伸酶、C18/20延伸酶、C20/22延伸酶和Δ9延伸酶。

破坏可发生在编码以下过氧化物酶体生物合成因子蛋白的PEX基因中,所述蛋白包括:Pex1p、Pex 2p、Pex3p、Pex3Bp、Pex4p、Pex5p、Pex5Bp、Pex5Cp、Pex5/20p、Pex6p、Pex7p、Pex8p、Pex10p、Pex12p、Pex13p、Pex14p、Pex15p、Pex16p、Pex17p、Pex14/17p、Pex18p、Pex19p、Pex20p、Pex21p、Pex21Bp、Pex22p、Pex22p样和Pex26p。并且在这些方法的任何一种中,破坏可以是编码蛋白的C-末端部分的基因的一部分中的基因敲除或缺失。在这些方法的任何一种中,缺失发生在编码蛋白的C3HC4环状锌指基序的C-末端部分的基因部分。

本文也描述了PEX破坏的生物中的油级分或总脂质级分,通过如权利要求1所述的方法,其已经提高了至少一种PUFA的重量%。本文也描述了一种PEX破坏的解脂耶氏酵母,该酵母在编码Pex3p或Pex10p或Pex16p的天然基因中存在破坏。该解脂耶氏酵母的ATCC命名为ATCC PTA-8614(菌株Y4128)。

生物保藏

下列生物材料保藏于美国典型培养物保藏中心(American TypeCulture Collection)(ATCC)(10801 University Boulevard,Manassas,VA20110-2209),并具有下列名称、保藏号和保藏日期。

  生物材料  保藏号  保藏日期  解脂耶氏酵母(Yarrowia lipolytica)Y2047  ATCC PTA-7186  2005年10月26日  解脂耶氏酵母(Yarrowia lipolytica)Y2201  ATCC PTA-7185  2005年10月26日  解脂耶氏酵母(Yarrowia lipolytica)Y2096  ATCC PTA-7184  2005年10月26日  解脂耶氏酵母(Yarrowia lipolytica)Y3000  ATCC PTA-7187  2005年10月26日  解脂耶氏酵母(Yarrowia lipolytica)Y4128  ATCC PTA-8614  2007年8月23日  解脂耶氏酵母(Yarrowia lipolytica)Y4127  ATCC PTA-8802  2007年11月29日

上面列出的生物材料将按照国际承认的用于专利程序目的的微生物保藏的布达佩斯条约的有关条款来保存。所列出的保藏物将会被保持在指定的国际保藏机构中至少30年,并且一旦准予专利公开它就将会对公众开放。在由政府行为授予的专利权的部分废除中,保藏物的可用性不会构成实施主题发明的许可。

附图简述和序列表

图1由图1A和图1B组成,它们一起示出了ω-3/ω-6脂肪酸生物合成途径,并且当考虑下文对该途径的描述时应被视为一起。

图2A提供了解脂耶氏酵母Pex10p(即,SEQ ID NO:10[GenBank保藏号CAG81606]的氨基酸327-364)、解脂耶氏酵母Pex2p(即,SEQID NO:2[GenBank保藏号CAG77647]的氨基酸266-323)和解脂耶氏酵母Pex12p(即,SEQ ID NO:11[GenBank保藏号CAG81532]的氨基酸342-391)的C3HC4环状锌指基序的比对,它们具有星号指示的保守C3HC4环状锌指基序的半胱氨酸和组氨酸残基。

图2B图示出了解脂耶氏酵母Pex10p C3HC4指状基序的不同氨基酸残基和它们结合的两个锌离子之间的本发明相互作用。

图3A图示了解脂耶氏酵母菌株Y4128的发育,该菌株在总脂质级分中生产37.6%的EPA。

图3B提供了pZP3-Pa777U的质粒图谱。

图4提供了下列质粒的质粒图谱:(A)pY117;和(B)pZP2-2988。

图5提供了下列质粒的质粒图谱:(A)pZKUE3S;和(B)pFBAIN-MOD-1。

图6提供了下列质粒的质粒图谱:(A)pFBAIN-PEX10;和(B)pEXP-MOD-1。

图7A提供了pPEX10-1的质粒图谱。图7B图示了解脂耶氏酵母菌株Y4184U的发育。

图8提供了如下质粒的质粒图谱:(A)pZKL1-2SP98C;和(B)pZKL2-5U89GC。

图9提供了下列质粒的质粒图谱:(A)pYPS161;和(B)pYRH13。

图10图示了解脂耶氏酵母菌株Y4305U3的发育。

图11提供了下列质粒的质粒图谱:(A)pZKUM;和(B)pZKD2-5U89A2。

图12提供了下列质粒的质粒图谱:(A)pY87;和(B)pY157。

根据下面的详细描述和附带的序列描述可以更充分地理解本发明,下面的详细描述和所附的序列描述形成了本申请的一部分。

下面的序列遵照37C.F.R.§1.821-1.825(“对包含核苷酸序列和/或氨基酸序列公开内容的专利申请的要求-序列规则”(“Requirements forPatent Applications Containing Nuceotide Sequences and/or Amino AcidSequence Disclosures-the Sequence Rules”)),并且符合世界知识产权组织(World Intellectual Property Organization)(WIPO)ST.25标准(1998)以及EPO和PCT的序列表要求(细则5.2和49.5(a-bis)以及行政指令(Administrative Instructions)的208节和附录C)。用于核苷酸和氨基酸序列数据的符号和格式遵循在37C.F.R.§1.822中示出的规则。

SEQ ID NO:1-86是引物、编码基因或蛋白(或它们的片段)的ORF、或质粒,如表1所述。

表1

核酸和蛋白质SEQ ID号总汇

 描述和缩写  核酸SEQ ID NO  蛋白质SEQ ID NO 解脂耶氏酵母Pex1p(GenBank保藏号CAG82178)  --  1(1024AA) 解脂耶氏酵母Pex2p(GenBank保藏号CAG77647)  --  2(381AA) 解脂耶氏酵母Pex3p(GenBank保藏号CAG78565)  --  3(431AA) 解脂耶氏酵母Pex3Bp(GenBank保藏号CAG83356)  --  4(395AA) 解脂耶氏酵母Pex4p(GenBank保藏号CAG79130)  --  5(153AA) 解脂耶氏酵母Pex5p(GenBank保藏号CAG78803)  --  6(598AA) 解脂耶氏酵母Pex6p(GenBank保藏号CAG82306)  --  7(1024AA) 解脂耶氏酵母Pex7p(GenBank保藏号CAG78389)  --  8(356AA) 解脂耶氏酵母Pex8p(GenBank保藏号CAG80447)  --  9(671AA) 解脂耶氏酵母Pex10p(GenBank保藏号CAG81606)  --  10(377AA) 解脂耶氏酵母Pex12p(GenBank保藏号CAG81532)  --  11(408AA) 解脂耶氏酵母Pex13p(GenBank保藏号CAG81789)  --  12(412AA) 解脂耶氏酵母Pex14p(GenBank保藏号CAG79323)  --  13(380AA) 解脂耶氏酵母Pex16p(GenBank保藏号CAG79622)  --  14(391AA) 解脂耶氏酵母Pex17p(GenBank保藏号CAG84025)  --  15(225AA)

 描述和缩写  核酸SEQ ID NO  蛋白质SEQ ID NO 解脂耶氏酵母Pex19p(GenBank保藏号AAK84827)  --  16(324AA) 解脂耶氏酵母Pex20p(GenBank保藏号CAG79226)  --  17(417AA) 解脂耶氏酵母Pex22p(GenBank保藏号CAG77876)  --  18(195AA) 解脂耶氏酵母Pex26p(GenBank保藏号NC_006072,核苷酸117230-118387的反义翻译)  --  19(386AA) 包含解脂耶氏酵母Pex10基因的重叠群,该基因编码过氧化物酶体生物合成因子蛋白(Pex10p)(GenBank保藏号AB036770)  20(3387bp)  -- 解脂耶氏酵母Pex10(GenBank保藏号AB036770,核苷酸1038-2171)(蛋白序列与SEQ ID NO:10100%相同)  21(1134bp)  22(377AA)  解脂耶氏酵母Pex10(GenBank保藏号AJ012084,它对应于GenBank保藏号AB036770的核苷酸1107-2171)(相对于SEQID NO:10和22的蛋白序列截短了最初的23个氨基酸)  23(1065bp)  24(354AA)  解脂耶氏酵母Pex10p C3HC4环状锌指基序(即,SEQ ID NO:10的氨基酸327-364)  --  25(38AA)  解脂耶氏酵母截短Pex10p(GenBank保藏号CAG81606[SEQ IDNO:10],缺失了C-末端的32个氨基酸)  --  26(345AA)  解脂耶氏酵母乙酰羟酸合酶(AHAS)突变基因,该基因包含W497L突变  27(2987bp)  --  质粒pZP3-Pa777U  28(13,066bp)  --  质粒pY117  29(9570bp)  --  质粒pZP2-2988  30(15,743bp)  --  质粒pZKUE3S  31(6303bp)  --  引物pZP-GW-5-1  32  --  引物pZP-GW-5-2  33  --

 描述和缩写  核酸SEQ ID NO  蛋白质SEQ ID NO  引物pZP-GW-5-3  34  --  引物pZP-GW-5-4  35  --  引物pZP-GW-3-1  36  --  引物pZP-GW-3-2  37  --  引物pZP-GW-3-3  38  --  引物pZP-GW-3-4  39  --  Genome Walker衔接子[顶链]  40  --  Genome Walker衔接子[底链]  41  --  巢式衔接子引物  42  --  引物Per10F1  43  --  引物ZPGW-5-5  44  --  引物Per10R  45  --  质粒pFBAIN-MOD-1  46(7222bp)--  质粒pFBAIn-PEX10  47(8133bp)--  引物PEX10-R-BsiWI  48--  引物PEX10-F1-SalI  49--  引物PEX10-F2-SalI  50--  质粒pEXP-MOD1  51(7277bp)--  质粒pPEX10-1  52(7559bp)--  质粒pPEX10-2  53(8051bp)--  质粒pZKL1-2SP98C  54(15,877bp)--

 描述和缩写  核酸SEQ ID NO  蛋白质SEQ ID NO  质粒pZKL2-5U89GC  55(15,812bp)--  质粒pYPS161  56(7966bp)--  引物Pex-10del1 3′.正向  57--  引物Pex-10del2 5′.反向  58--  质粒pYRH13  59(8673bp)--  引物PEX16Fii  60--  引物PEX16Rii  61--  引物3UTR-URA3  62--  引物Pex16-conf  63--  实时PCR引物ef-324F  64--  实时PCR引物ef-392R  65--  实时PCR引物Pex16-741F  66--  实时PCR引物Pex16-802R  67-- TaqMan探针ef-345T的核苷酸部分  68  -- TaqMan探针PEX16-760T的核苷酸部分  69  -- 质粒pZKUM  70(4313bp)  -- 质粒pZKD2-5U89A2  71(15,966bp)  -- 解脂耶氏酵母二酰基甘油酰基转移酶(DGAT2)(美国专利公开7,267,976)  72(2119bp)  73(514AA) 合成Δ12去饱和酶,该酶来源于串珠镰刀菌,其密码子经优化以在解脂耶氏酵母(“FmD12S”)中表达  74(1434bp)  75(477AA) 合成突变型Δ8去饱和酶(“EgD8M”),该酶来源于小眼虫(“EgD8S”;美国专利公开7,256,033)  76(1272bp)  77(422AA)

 描述和缩写  核酸SEQ ID NO  蛋白质SEQ ID NO 合成Δ9延伸酶,该酶来源于小型绿藻属CCMP389,其密码子经优化以在解脂耶氏酵母(“E389D9eS”)中表达  78(792bp)  79(263AA) 合成Δ5去饱和酶,该酶来源于小眼虫,其密码子经优化以在解脂耶氏酵母(“EgD5S”)中表达  80(1350bp)  81(449AA) 质粒pY157  82(6356bp)  -- 质粒pY87  83(5910bp)  -- 被Cre重组酶识别的大肠杆菌(Escherichia coli)LoxP重组位点  84(34bp)  -- 引物UP 768  85  -- 引物LP 769  86  --

发明详述

本文所述的是用于操纵在生产PUFA的真核生物中的长链多不饱和脂肪酸[“LC-PUFA”]的浓度(以总脂肪酸百分比形式表示)和含量(以干细胞重量百分比形式表示)的通用方法。这些方法依赖于破坏在宿主中的天然过氧化物酶体生物合成因子[“Pex”]蛋白并将对具有天然的或遗传工程的PUFA生产能力的多种真核生物具有广泛适用性,所述真核生物包括藻类、真菌、卵菌、酵母、类眼虫、原生藻菌、植物和一些哺乳动物系统。

PUFA或其衍生物可用作膳食替代品或补充剂,尤其是婴儿代乳品(formula),用于接受静脉内营养法的患者或用来预防或治疗营养不良。例如,PUFA可掺入烹饪油、脂肪或人造黄油并作为消费者的一般饮食部分被摄入,从而给予消费者所需的饮食补充剂。此外,PUFA还可以掺入婴儿代乳品、营养补充剂或其它食品中,并且可用作抗炎或降胆固醇剂。任选地,该组合物可以用于药用(人药或兽药)。

定义

在本公开中,使用了大量术语和缩写。给出了如下定义。

“开放阅读框”缩写为ORF。

“聚合酶链反应”缩写为PCR。

“美国典型培养物保藏中心”缩写为“ATCC”。

“多不饱和脂肪酸”缩写为“PUFA”。

“三酰基甘油”缩写为“TAG”。

“总脂肪酸”缩写为“TFA”。

“脂肪酸甲酯”缩写为“FAME”。

“干细胞重量”缩写为“DCW”。

如本文所用,术语“发明”或“本发明”不旨在限制而是通常适用于权利要求中的或本文所述的任何发明。

术语“过氧化物酶体”指普遍存在于所有真核细胞中的细胞器。它们具有单独的脂双层膜,该膜将它们的内容物与细胞溶质分离开来,并且包含多种下文所述功能必需的膜蛋白。过氧化物酶体经由“扩展的穿梭机制(extended shuttle mechanism)”选择性输入蛋白。更具体地讲,存在至少32个已知的过氧化物酶体蛋白(也称为peroxin),它们参与通过ATP水解穿过过氧化物酶体膜而输入蛋白的过程。一些过氧化物酶体蛋白在其N-末端或C-末端包含特异性蛋白信号,即,过氧化物酶体靶信号或“PTS”,它们引导蛋白通过过氧化物酶体膜。一旦细胞蛋白进入过氧化物酶体,它们通常通过一些方法降解。例如,过氧化物酶体包含氧化酶,例如过氧化氢酶、D-氨基酸氧化酶和尿酸氧化酶,这些酶能够降解对细胞有毒的物质。作为另外一种选择,过氧化物酶体降解脂肪酸分子以生成乙酰-CoA游离分子,它们被回输到细胞溶质中,该过程称为β-氧化。

术语“过氧化物酶体生物合成因子蛋白”、“过氧化物酶体蛋白”和“Pex蛋白”是可互换的,并且指涉及过氧化物酶体生物合成的和/或参与通过ATP水解使细胞蛋白穿过过氧化物酶体膜的过程的蛋白。编码任何这些蛋白的基因的首字母缩写是“Pex基因”。Pex基因的命名体系描述于Distel等人,J.Cell Biol.,135:1-3(1996)。迄今已经在多种真核生物中鉴定了至少32个不同的Pex基因。已经从对突变体的分析中分离出了多种Pex基因,所述突变体显示具有异常的过氧化物酶体功能或结构。根据Kiel,J.A.K.W.等人的文献(Traffic,7:1291-1303(2006)),其中对17个不同真菌菌种中的基因组序列进行了电脑模拟的信息学分析(silico analysis),鉴定了以下Pex蛋白:Pex1p、Pex2p、Pex3p、Pex3Bp、Pex4p、Pex5p、Pex5Bp、Pex5Cp、Pex5/20p、Pex6p、Pex7p、Pex8p、Pex10p、Pex12p、Pex13p、Pex14p、Pex15p、Pex16p、Pex17p、Pex14/17p、Pex18p、Pex19p、Pex20p、Pex21p、Pex21Bp、Pex22p、Pex22p样和Pex26p。因此,本文将这些蛋白中的每一个称为“Pex蛋白”、“过氧化物酶体蛋白”或“过氧化物酶体生物合成因子蛋白”,并且每个蛋白由至少一个“Pex基因”编码。

术语“保守结构域”或“基序”指进化上相关的蛋白质的比对序列中在特定位置处保守的一组氨基酸。虽然同源蛋白质之间在其它位置的氨基酸可以发生变化,但在特定位置高度保守的氨基酸表明为是对蛋白质的结构、稳定性或活性来说必需的氨基酸。因为它们可通过它们在蛋白质同系物家族的比对序列中的高度保守来鉴定,所以它们可用作识别标签或“签名”来确定具有新的测定序列的蛋白质是否属于以前鉴定的蛋白质家族。参考本文相关部分,Pex2p、Pex10p和Pex12p在它们的羧基末端都有一个富含半胱氨酸的基序,已知该基序是C3HC4环状锌指基序。该基序是它们的活性所必需的,涉及蛋白停靠并转移到过氧化物酶体中(Kiel,J.A.K.W.,等人,Traffic,7:1291-1303(2006))。

术语“C3HC4环状锌指基序”或“C3HC4基序”一般指结合两个锌离子的保守半胱氨酸富含基序,它们通过如式I所示的氨基酸序列进行鉴定:

式I:CX2CX9-27CX1-3HX2CX2CX4-48CX2C

在解脂耶氏酵母的编码过氧化物酶体生物合成因子10蛋白(即YlPex10p)的基因中的C3HC4环状锌指基序,位于SEQ ID NO:10的氨基酸327-364之间,并且由CX2CX11CX1HX2CX2CX10CX2C基序(SEQ IDNO:25)限定。在解脂耶氏酵母的编码过氧化物酶体生物合成因子2蛋白(即YlPex2p)的基因中的C3HC4环状锌指基序,位于SEQ ID NO:2的氨基酸266-323之间。解脂耶氏酵母过氧化物酶体生物合成因子12蛋白,即YlPex12p,包含位于SEQ ID NO:11的氨基酸342-391之间的不完全C3HC4环指基序。图2A列出了对应于YlPex10、YlPex2和YlPex12的C3HC4环状锌指基序的蛋白序列;星号表示基序的保守半胱氨酸或组氨酸残基。

认为YlPex10、YlPex2和YlPex12通过蛋白-蛋白相互作用形成环指复合物。本发明的YlPex10p C3HC4指状基序(具有两个锌残基)的胱氨酸和组氨酸残基间相互作用在图2B中用图表示出。

术语“Pex10”指编码过氧化物酶体生物合成因子10蛋白或过氧化物酶体装配蛋白Peroxin 10的基因,其中所述peroxin蛋白在下文中称为“Pex10p”。Pex10p的功能尚未被清楚的阐明,虽然对其它生物的研究已经揭示Pex10产物位于过氧化物酶体膜内并且是细胞器正常功能所必需的。C3HC4环状锌指基序在Pex10p的C-末端区域是保守的(Kalish,J.E.等人,Mol.Cell Biol.,15:6406-6419(1995);Tan,X.等人,J.CellBiol.,128:307-319(1995);Warren,D.S.,等人,Am.J.Hum.Genet.,63:347-359(1998)),并且是酶活性所必需的。

术语“YlPex10”指解脂耶氏酵母的编码过氧化物酶体生物合成因子10蛋白的基因,其中所述蛋白在下文中称为“YlPex10p”。该特定的peroxin近来由Sumita等人(FEMS Microbiol.Lett.,214:31-38(2002))进行了研究。YlPex10的核苷酸序列在GenBank中注册了多个保藏号,包括GenBank保藏号CAG81606(SEQ ID NO:10)、AB036770(SEQ IDNOs:20、21和22)以及AJ012084(SEQ ID NO:23和24)。如在SEQ IDNO:24中所示的YlPex10p的序列长度为354个氨基酸。相比之下,如在SEQ ID NO:10和SEQ ID NO:22中所示的YlPex10p序列每个长度为377个氨基酸,它们100%相同的序列在蛋白N-末端具有附加地23个氨基酸(对应于与GenBank保藏号AJ012084(SEQ ID NO:24)中鉴定的起始密码子不同的起始密码子)。

术语“Pex3”指编码过氧化物酶体生物合成因子3蛋白或过氧化物酶体装配蛋白Peroxin 3的基因,其中peroxin蛋白在下文中称为“Pex3p”。虽然尚未清楚地了解关于Pex3p的机制细节,但是清楚的是Pex3p是在早期的过氧化物酶体生物合成中所需的过氧化物酶体整合膜蛋白,该蛋白用于形成过氧化物酶体膜(参见例如Baerends,R.J.等人,J.Biol.Chem.,271:8887-8894(1996);Bascom,R.A.等人,Mol.Biol.Cell,14:939-957(2003))。

术语“YlPex3”指解脂耶氏酵母的编码过氧化物酶体生物合成因子3蛋白的基因,其中所述蛋白在下文中称为“YlPex3p”。YlPex3的核苷酸序列在GenBank中登记为保藏号CAG78565(SEQ ID NO:3)。

术术语“Pex16”指编码过氧化物酶体生物合成因子16蛋白或过氧化物酶体装配蛋白Peroxin 16的基因,其中peroxin蛋白在下文中称为“Pex16p”。虽然对多种生物的研究已经揭示Pex16产物在形成过氧化物酶体膜和调节过氧化物酶体增殖中起到作用,但是Pex16p的功能仍未被清楚地阐明(Platta,H.W.和R.Erdmann,Trends Cell Biol.,17(10):474-484(2007))。

术语“YlPex16”指解脂耶氏酵母的编码过氧化物酶体生物合成因子16蛋白的基因,其中所述蛋白在下文中称为“YlPex16p”。该特定peroxin描述于Elizen G.A.等人(J.Cell Biol.,137:1265-1278(1997))和Titorenko,V.I.等人(Mol.Cell Biol.,17:5210-5226(1997))。YlPex16的核苷酸序列在GenBank中登记为保藏号CAG79622(SEQ ID NO:14)。

在天然Pex基因中的或与之相关的术语“破坏”指在一部分该基因中的插入、缺失、或定向突变,所述破坏导致全部基因敲除使得该基因从基因组中缺失并且不翻译蛋白,或者导致翻译的Pex蛋白具有插入、缺失、氨基酸取代或其它定向突变。蛋白中的破坏位置可以是在例如蛋白的N-末端部分中或在蛋白的C-末端部分中。破坏的Pex蛋白相对于未破坏的Pex蛋白将具有减弱的活性,并且可能是无功能的。在编码Pex蛋白的天然基因中的破坏也包括导致Pex蛋白低表达或缺乏表达的替代方法,例如能够经由操纵调控序列、转录和翻译因子和/或信号转导途径或使用有义、反义或RNAi技术等方法导致破坏。

如本文所用,术语“PEX破坏的生物”指包含以下基因的任何含油真核生物,所述基因编码功能性多不饱和脂肪酸生物合成途径并且在编码过氧化物酶体生物合成因子蛋白的天然基因中具有上述破坏。

术语“脂质”指任何脂溶性的(即,亲脂的)、天然存在的分子。脂质是具有多种关键生物学功能的化合物的不同组,所述功能例如细胞膜的结构组分、能量贮存来源和信号途径的中间体。可以将脂质广泛定义为疏水性或两亲性小分子,它们完全地或部分地起源于酮脂酰或异戊二烯基团。表2显示了对脂质的综述,它基于Lipid Metabolites andPathways Strategy(LIPID MAPS)分类系统(National Institute of GeneralMedical Sciences,Bethesda,MD)。

表2

脂质类别综述

本文术语细胞的“总脂质级分”指细胞的所有酯化脂肪酸。可分离在总脂质级分中的不同亚级分,包括三酰基甘油[“油”]级分、磷脂酰胆碱级分和磷脂酰乙醇胺级分,但是这并不包括所有亚级分。

“脂质体”指通过单层磷脂以及通常通过特异性蛋白结合的脂质小滴。这些细胞器是大多数生物运输/贮存中性脂类的位点。认为脂质体来源于包含TAG生物合成酶的内质网的微区。它们的合成及尺寸受特异性蛋白组分的控制。

“中性脂类”指那些一般以贮存脂肪和油形式存在于脂质体中的细胞中的脂质,它们的名称是因为在细胞pH下,所述脂质无带电基团。它们一般是完全非极性的,对水无亲和力。中性脂类一般指脂肪酸的甘油单酯、二酯、和/或三酯,也分别称为单酰基甘油、二酰基甘油或三酰基甘油,或统称为酰基甘油。为了从酰基甘油中释放游离脂肪酸,必须发生水解反应。

术语“三酰基甘油”[“TAG”]和“油”是可互换的,它们指由酰化甘油分子的三个脂肪酰残基组成的中性脂类。TAG能够包含长链PUFA,以及较短的饱和的和不饱和的脂肪酸以及较长链的饱和脂肪酸。细胞的TAG级分也称作“油级分”,并且“油的生物合成”一般指在细胞中合成TAG。油或TAG级分是总脂质级分的亚级分,虽然它也是构成总脂质含量的主要部分,总脂质含量以含油生物细胞中的总脂肪酸重量占干细胞重量[参见下文]的百分比表示。油[“TAG”]级分中的脂肪酸组成和总脂质级分的脂肪酸组成一般是相似的。因此,总脂质级分中的PUFA浓度的提高或降低将对应于油[“TAG”]级分中的PUFA浓度的升高或降低,反之亦然。

术语“总脂肪酸”[“TFA”]本文指所有细胞脂肪酸的总量,所述脂肪酸在给定实例中可通过碱酯交换方法(本领域已知的方法)被衍生化成脂肪酸甲酯[“FAME”],例如它可以是总脂质级分或油级分。因此,总脂肪酸包括来自中性和极性脂质级分的脂肪酸,包括磷脂酰胆碱级分、磷脂酰乙醇胺级分(phosphatidyletanolamine fraction)和二酰基甘油、单酰基甘油和三酰基甘油[“TAG或油”]级分,但是不包括游离脂肪酸。

术语细胞的“总脂质含量”是TFA的量度,以干细胞重量[“DCW”]百分比的形式表示。因此,总脂质含量[“TFA%DCW”]等同于例如每100毫克DCW的总脂肪酸毫克数。

脂肪酸浓度本文一般表示为TFA的重量百分比[“%TFA”],例如每100毫克TFA的给定脂肪酸毫克数。除非在本文公开内容中另作具体说明,给定脂肪酸相对于总脂质的百分比等同于以%TFA表示的脂肪酸浓度(例如总脂质的%EPA等同于EPA%TFA)。

在一些情况下,可使用细胞中给定脂肪酸占干细胞重量的百分比[“%DCW”]形式表达给定脂肪酸的含量。因此例如二十碳五烯酸%DCW将根据下式进行测定:(二十碳五烯酸%TFA)*(TFA%DCW)]/100。

术语“脂质分布”和“脂质组成”是可互换的,并且指在特定脂质级分(例如在总脂质级分或油[“TAG”]级分中)中包含的单个脂肪酸的量,其中所述量用TFA百分比形式表示。混合物中存在的各单个脂肪酸的总量应当是100。

如本文所用,术语“成倍增加”指通过乘以某数获得的增加。例如,通过乘以1.3的数量、量、浓度、重量百分比等,提供1.3倍的增加。

术语“脂肪酸”指不同链长的长链脂族酸(链烷酸),链长为约C12至C22(尽管更长和更短链长的酸均是已知的)。主链长介于C16和C22之间。脂肪酸的结构可用简单的记号系统“X:Y”来表示,其中X表示具体脂肪酸中碳(“C”)原子的总数,而Y表示双键的数目。另外的关于“饱和脂肪酸”与“不饱和脂肪酸”、“单不饱和脂肪酸”与“多不饱和脂肪酸”(“PUFA”)以及“ω-6脂肪酸”(ω-6或n-6)与“ω-3脂肪酸”(ω-3或n-3)之间的区别的详细信息在美国专利7,238,482中有所提供。

表3提供了用于描述本文PUFA的命名。在标题为“简化符号”一栏中,ω-指代系统用于表明碳数目、双键的数目和最接近ω碳的双键位置,双键位置的计数从ω碳开始(为此ω碳的编号为1)。该表的其余部分汇总了ω-3和ω-6脂肪酸及其前体的俗名、在整个说明书中使用的缩写以及每种化合物的化学名称。

表3

多不饱和脂肪酸及其前体的命名

  俗名  缩写  化学名称  简化符号  肉豆蔻酸  --  十四酸  14:0  棕榈酸  棕榈酸  十六酸  16:0  棕榈油酸  --  9-十六碳烯酸  16:1  硬脂酸  --  十八酸  18:0  油酸  --  顺式-9-十八碳烯酸  18:1  亚油酸  LA  顺式-9,12-十八碳二烯酸  18:2 ω-6  γ-亚麻酸  GLA  顺式-6,9,12-十八碳三烯酸  18:3 ω-6  附子脂酸  EDA  顺式-11,14-二十碳二烯酸  20:2 ω-6  二高-γ-亚麻酸  DGLA  顺式-8,11,14-二十碳三烯酸  20:3 ω-6  花生四烯酸  ARA  顺式-5,8,11,14-二十碳四烯酸  20:4 ω-6

  俗名  缩写  化学名称  简化符号  α-亚麻酸  ALA  顺式-9,12,15-十八碳三烯酸  18:3 ω-3  硬脂艾杜糖酸  STA  顺式-6,9,12,15-十八碳四烯酸  18:4 ω-3  二十碳三烯酸  ETrA  顺式-11,14,17-二十碳三烯酸  20:3 ω-3  金松烯酸  SCI  顺式-5,11,14-二十碳三烯酸  20:3b ω-6JuniperonicJUP  顺式-5,17,11,14-二十碳四烯酸20:4b ω-3  二十碳四烯酸  ETA  顺式-8,11,14,17-二十碳四烯酸  20:4 ω-3  二十碳五烯酸  EPA  顺式-5,8,11,14,17-二十碳五烯酸  20:5 ω-3

  俗名  缩写  化学名称  简化符号二十二碳三烯酸DRA  顺式-10,13,16-二十二碳三烯酸22:3 ω-3二十二碳四烯酸DTA  顺式-7,10,13,16-二十二碳四烯酸22:4 ω-3二十二碳五烯酸DPAn-6  顺式-4,7,10,13,16-二十二碳五烯酸22:5 ω-6  二十二碳五烯酸  DPA  顺式-7,10,13,16,19-二十二碳五烯酸  22:5 ω-3  二十二碳六烯酸  DHA  顺式-4,7,10,13,16,19-二十二碳六烯酸  22:6 ω-3

虽然使用本文所述方法,表3列出的ω-3/ω-6PUFA最可能在含油酵母的油级分中积聚,但是该列表不应理解为限制性的或完全的。

如本文所用,术语“多不饱和脂肪酸的组合”或“多不饱和脂肪酸的任何组合”指上表3中列出的任何两种或更多种多不饱和脂肪酸的混合物。此类组合具有能相对于细胞中的多种浓度或重量百分比进行测量,包括相对于细胞中的总脂肪酸的重量百分比进行测量的浓度和重量百分比属性。

代谢途径或生物合成途径在生物化学意义上可以认为是发生于细胞内由酶催化的一系列化学反应,以实现细胞待使用的或待贮存的代谢产物的形成,或启动另一代谢途径(称作流量产生步骤)。很多此类途径均很精细,并涉及对起始物质的逐步修饰以使之形成具有期望的精确化学结构的产物。

术语“PUFA生物合成途径”指将油酸转化成诸如LA、EDA、GLA、DGLA、ARA、DRA、DTA和DPAn-6之类的ω-6脂肪酸和诸如ALA、STA、ETrA、ETA、EPA、DPA和DHA之类的ω-3脂肪酸的代谢过程。文献中详细描述了该过程。参见例如Int′.App.Pub.No.WO 2006/052870。简而言之,该过程涉及通过添加碳原子来延长碳链和通过加入双键来使分子去饱和,这通过存在于内质网膜内的一系列特异性去饱和酶和延伸酶(称为“PUFA生物合成途径酶”)进行。更具体地讲,“PUFA生物合成途径酶”指如下与PUFA生物合成相关的任何酶(以及编码它们的基因),所述酶包括:Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ12去饱和酶、Δ15去饱和酶、Δ17去饱和酶、Δ9去饱和酶、Δ8去饱和酶、Δ9延伸酶、C14/16延伸酶、C16/18延伸酶、C18/20延伸酶和/或C20/22延伸酶。

术语“ω-3/ω-6脂肪酸生物合成途径”指在合适条件下表达时编码催化ω-3和ω-6脂肪酸二者之一或两者产生的酶的一组基因。通常,参与ω-3/ω-6脂肪酸生物合成途径的基因编码PUFA生物合成途径酶。图1示出了一条代表性途径,提供了从肉豆蔻酸经过多种中间产物向DHA的转化,演示了ω-3和ω-6脂肪酸两者是如何可以从共同来源产生。该途径自然分成两部分,使得一部分只生成ω-3脂肪酸而另一部分只生成ω-6脂肪酸。只产生ω-3脂肪酸的部分在本文中将称作ω-3脂肪酸生物合成途径,而只产生ω-6脂肪酸的部分在本文中称作ω-6脂肪酸生物合成途径。

如本文中关于ω-3/ω-6脂肪酸生物合成途径所用的,术语“功能性的”指该途径中的一些(或全部)基因表达活性酶,导致体内催化或底物转化。应当理解,“ω-3/ω-6脂肪酸生物合成途径”或“功能性ω-3/ω-6脂肪酸生物合成途径”并不意味着上面段落中列出的所有基因都是必需的,因为许多脂肪酸产物将仅需要表达该途径中的一亚组基因。

术语“Δ6去饱和酶/Δ6延伸酶途径”指最低程度包括至少一种Δ6去饱和酶和至少一种C18/20延伸酶的PUFA生物合成途径,从而使得能分别从LA和ALA开始,以GLA和/或STA作为脂肪酸中间产物来生物合成DGLA和/或ETA。通过其它去饱和酶和延伸酶的表达,还可以合成ARA、EPA、DPA和DHA。

术语“Δ9延伸酶/Δ8去饱和酶途径”指最低程度包括至少一种Δ9延伸酶和至少一种Δ8去饱和酶的PUFA生物合成途径,从而使得能分别从LA和ALA开始,以EDA和/或ETrA作为脂肪酸中间产物来生物合成DGLA和/或ETA。通过其它去饱和酶和延伸酶的表达,还可以合成ARA、EPA、DPA和DHA。

术语“去饱和酶”指能够通过从邻接碳原子中的一个上移除氢原子、并且从而在碳原子之间导入双键来去饱和脂肪酸中的邻接碳原子的多肽。去饱和产生了脂肪酸或受关注的前体。尽管在整个说明书中使用ω-指代系统来指代特定的脂肪酸,但使用Δ-系统从底物的羧基端计数来表示去饱和酶的活性更方便。本文特别关注的是:1)Δ5去饱和酶,它催化脂肪酸底物DGLA转化成ARA和/或催化脂肪酸底物ETA转化成EPA;2)Δ17去饱和酶,它在从分子羧基末端编号为第17和第18的碳原子之间去饱和脂肪酸,并且它例如催化底物脂肪酸ARA转化成EPA和/或催化底物脂肪酸DGLA转化成ETA;3)Δ6去饱和酶,它催化脂肪酸底物LA转化成GLA和/或催化脂肪酸底物ALA转化成STA;4)Δ12去饱和酶,它催化底物脂肪酸油酸转化成LA;5)Δ15去饱和酶,它催化脂肪酸底物LA转化成ALA和/或催化脂肪酸底物GLA转化成STA;6)Δ4去饱和酶,它催化底物脂肪酸DPA转化成DHA和/或催化底物脂肪酸DTA转化成DPAn-6;7)Δ8去饱和酶,它催化底物脂肪酸EDA转化成DGLA和/或催化底物脂肪酸ETrA转化成ETA;和,8)Δ9去饱和酶,它催化底物脂肪酸棕榈酸转化成棕榈油酸(16:1)和/或催化底物脂肪酸硬脂酸转化成油酸。基于Δ15和Δ17去饱和酶将ω-6脂肪酸转化成它们的ω-3对应物的能力(如分别将LA转化成ALA以及将ARA转化成EPA),偶尔也将它们称作“ω-3去饱和酶”、“W-3去饱和酶”和/或“ω-3去饱和酶”。所期望的是通过用脂肪酸去饱和酶的基因来转化合适的宿主并测定它对该宿主脂肪酸分布的作用,从而经验性地测定特定脂肪酸去饱和酶的特异性。

术语“延伸酶”指能延长脂肪酸碳链从而产生比该延伸酶作用于其上的脂肪酸底物长2个碳原子的酸的多肽。该延长过程在与脂肪酸合酶相关的多步骤机制中发生,如美国专利公开2005/0132442和国际专利公开WO 2005/047480所述。延伸酶体系催化反应的实例如GLA转化成DGLA、STA转化成ETA以及EPA转化成DPA。通常,延伸酶的底物选择性有些广泛,但由链长度和不饱和的程度及类型两者来区分。例如,C14/16延伸酶利用C14底物(如肉豆蔻酸),C16/18延伸酶利用C16底物(如棕榈酸),C18/20延伸酶(也称为Δ6延伸酶,两个术语可以互换使用)利用C18底物(如GLA、STA),而C20/22延伸酶利用C20底物(如EPA)。以类似方式,Δ9延伸酶能够催化LA和ALA分别转化成EDA和ETrA。重要的是,须注意一些延伸酶具有广泛的特异性因而单个酶可能能够催化几种延伸酶反应。例如单个酶可因此作为C16/18延伸酶和C18/20延伸酶。

术语“转化效率”和“底物转化百分比”指特定酶(如去饱和酶)能够将底物转化成产物的效率。转化效率根据下面的公式测量:([产物]/[底物+产物])*100,其中‘产物’包括中间产物和该途径中来源于它的所有产物。

术语“含油的”指那些倾向于以油形式贮存它们的能源的生物(Weete,Fungal Lipid Biochemistry,第2版,Plenum,1980)。

术语“含油酵母”指那些能制造油(即TAG)的、分类为酵母的微生物。通常,含油微生物的细胞油或TAG含量符合S形曲线,其中脂质浓度增加直至在对数生长期晚期或稳定生长期早期它达到最高浓度,随后在稳定生长期晚期和死亡期期间逐渐下降(Yongrmanitchai和Ward,Appl.Environ.Microbiol.,57:419-25(1991))。本文所述的含油微生物通常积聚超过它们的干细胞重量约25%的油或TAG。含油酵母的实例包括但不限于如下属:耶氏酵母属(Yarrowia)、假丝酵母属(Candida)、红酵母属(Rhodotorula)、红冬孢酵母属(Rhodosporidium)、隐球酵母属(Cryptococcus)、丝孢酵母属(Trichosporon)和油脂酵母属(Lipomyces)。

如本文所用的,术语“分离的核酸片段”和“分离的核酸分子”可互换使用,并且是指单链或双链的,任选含有合成的、非天然的或改变了的核苷酸碱基的RNA或DNA聚合物。-DNA聚合物形式的分离的核酸片段可由cDNA、基因组DNA或合成DNA的一个或多个片段构成。

当在合适的温度和溶液离子强度条件下单链形式的核酸片段可以退火至另一核酸片段时,核酸片段“可杂交”至另一核酸片段,例如cDNA、基因组DNA或RNA分子。杂交条件和洗涤条件是众所周知的,并在Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular Cloning:ALaboratory Manual,第2版,Cold Spring Harbor Laboratory:Cold SpringHarbor,NY(1989)中得到举例说明。

氨基酸或核苷酸序列的“基本部分”指这样的部分,该部分包括的多肽的氨基酸序列或基因的核苷酸序列足以推定鉴定所述多肽或基因,所述鉴定或者可以由本领域技术人员通过人工评价序列来完成,或者可以利用诸如BLAST(Basic Local Alignment Search Tool;Altschul,S.F.等人,J.Mol.Biol.,215:403-410(1993))之类的算法通过计算机自动化序列比较和鉴定来完成。一般来讲,为了推测鉴定多肽或核酸序列是否与已知的蛋白质或基因同源,需要有10个或更多邻接氨基酸或者30个或更多邻接核苷酸的序列。此外,对于核苷酸序列,包含20-30个邻接核苷酸的基因特异性寡核苷酸探针可用于序列依赖性的基因鉴定(如DNA杂交)和基因分离(如细菌菌落或噬斑的原位杂交)的方法中。此外,12至15个碱基的短寡核苷酸可在PCR中用作扩增引物,以便获得包含该引物的特定核酸片段。因此,核苷酸序列的“基本部分”所包含的序列应足以特异性地鉴定和/或分离包含该序列的核酸片段。

术语“互补的”用于描述核苷酸碱基之间能够彼此杂交的关系。例如,对于DNA,腺嘌呤与胸腺嘧啶互补,而胞嘧啶与鸟嘌呤互补。

术语“同源性”或“同源”本文互换使用。它们指这样的核酸片段,即其中一个或多个核苷酸碱基改变并不会影响该核酸片段介导基因表达或产生某种表型的能力。这些术语也指本文所述的Pex核酸片段的修饰(例如缺失或插入一个或多个核苷酸),相对于初始的未经修饰的核酸片段,该修饰基本上不会改变所得核酸片段的功能特性。

此外,技术人员认识到,同源核酸序列也由它们在中等严格条件(如0.5×SSC,0.1%SDS,60℃)下,与本文所示例的序列杂交的能力,或杂交至本文公开的核苷酸序列的任何部分以及杂交至与其功能相当的序列的能力所限定。

“密码子简并性”指允许核苷酸序列在不影响所编码的多肽的氨基酸序列的情况下发生变化的遗传密码的性质。技术人员非常了解具体宿主细胞在使用核苷酸密码子确定给定氨基酸时所表现出的“密码子偏好性”。因此,当合成基因用以改善在宿主细胞中的表达时,希望对基因进行设计,使得其密码子使用频率接近该宿主细胞优选的密码子使用频率。

“合成的基因”可由使用本领域技术人员已知的方法化学合成的寡核苷酸构件装配而成。将这些寡核苷酸基本单位构件进行退火并随后连接以形成基因节段,该基因节段随后在酶促作用下装配而构建成完整的基因。因此,基于最优化核苷酸序列以反映宿主细胞的密码子偏好性,可以定制基因用以最优化基因表达。如果密码子使用偏向于宿主偏好的那些密码子,则技术人员能预期成功的基因表达的可能。优选的密码子的确定可基于对来源于宿主细胞的基因(其中序列信息可获得)的检测。

“基因”指表达特定蛋白的核酸片段,并且可以指单独的编码区或可以包含位于编码序列之前的调控序列(5′非编码区)和之后的调控序列(3′非编码区)。“天然基因”是指天然存在的具有其自己的调控序列的基因。“嵌合基因”是指不是天然基因的任何基因,包含在天然情况下不是一起存在的调控序列和编码序列。因此,嵌合基因可包括源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。“内源性基因”指位于生物基因组内它的天然位置的天然基因。“外来”基因指通过基因转移导入到宿主生物内的基因。外来基因可包括插入到非天然生物内的天然基因、导入到天然宿主内的新位置的天然基因,或嵌合基因。“转基因”是已通过转化方法导入基因组内的基因。“密码子优化的基因”是其密码子使用频率经设计用以模仿宿主细胞优选的密码子使用频率的基因。

“编码序列”指编码特定氨基酸序列的DNA序列。“合适的调控序列”指位于编码序列的上游(5′非编码序列)、中间或下游(3′非编码序列)的核苷酸序列,其可影响相关编码序列的转录、RNA加工或稳定性或者翻译。调控序列可包括启动子、增强子、静默子、5′非翻译前导序列(例如在转录起始位点和翻译启动密码子之间的序列)、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎-环结构。

“启动子”指能够控制编码序列或功能性RNA表达的DNA序列。一般来讲,编码序列位于启动子序列的3′端。启动子可整个源于天然基因,或者由源于不同的天然存在的启动子的不同元件组成,或者甚至包含合成的DNA片段。本领域内的技术人员应当理解,不同的启动子可以在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件或生理条件而引导基因的表达。导致基因在大部分时间内在大多数细胞类型中表达的启动子通常称为“组成型启动子”。还应当进一步认识到,由于在大多数情况下调控序列的确切边界尚未完全确定,因此不同长度的DNA片段可能具有相同的启动子活性。

术语“3′非编码序列”和“转录终止子”指位于编码序列下游的DNA序列。这包括多腺苷酸化识别序列和编码能影响mRNA加工或基因表达的调控信号的其它序列。多腺苷酸化信号通常特征在于影响多腺苷酸片添加到mRNA前体的3′末端。3′区可影响相关编码序列的转录、RNA加工或稳定性或翻译。

“RNA转录物”指由RNA聚合酶催化DNA序列的转录所产生的产物。当RNA转录物是DNA序列的完全互补的拷贝时,它被称为初级转录物,或者它可以是源自初级转录物的转录后加工的RNA序列并被称作成熟RNA。“信使RNA”或“mRNA”指无内含子并且可以由细胞翻译成蛋白质的RNA。“eDNA”指与mRNA互补并源于mRNA的双链DNA。“有义”RNA指包含mRNA并因而能由细胞翻译成蛋白质的RNA转录物。“反义RNA”指与全部或部分靶初级转录物或mRNA互补,并阻止靶基因表达的RNA转录物(美国专利5,107,065;国际申请公开WO 99/28508)。反义RNA可以与特定基因转录物的任何部分,即5′非编码序列、3′非编码序列或编码序列互补。“功能性RNA”指反义RNA、核酶RNA或其它不被翻译但是对细胞过程有影响作用的RNA。

术语“可操作地连接”指单个核酸片段上的核酸序列的关联,使得其中一个核酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达时,它可操作地连接编码序列。即,编码序列处于启动子的转录控制下。编码序列可以以有义或反义的取向可操作地连接至调控序列。

如本文所用,术语“表达”指源于核酸片段的有义RNA(mRNA)或反义RNA的转录和稳定积聚。表达也可指将mRNA翻译成多肽。

“成熟”蛋白指经翻译后加工的多肽,即已经去除了存在于初始翻译产物中的任何前肽或肽原的多肽。“前体”蛋白质指mRNA的初级翻译产物,即前肽和肽原仍然存在。前肽和肽原可以是但不限于细胞内定位信号。

“转化”指将核酸分子转移至宿主生物中,导致在遗传上稳定遗传。例如,核酸分子可以是自主复制的质粒,或者它可以整合进宿主生物的基因组中。含有转化核酸片段的宿主生物被称为“转基因”或“重组”或“转化”生物体。

“稳定转化”指将核酸片段转移至宿主生物的基因组(包括核基因组和细胞器基因组)中,导致在遗传上稳定遗传。相反,“瞬时转化”指将核酸片段转移至宿主生物的核中或包含DNA的细胞器中,导致基因表达而不整合或不稳定遗传。含有转化核酸片段的宿主生物被称为“转基因”生物体。

术语“质粒”和“载体”指通常携带有不属于细胞中心代谢部分的基因的染色体外元件,并且常常是环状双链DNA片段的形式。这类元件可以是源自任何来源的自主复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列(线性或环状),其中多个核苷酸序列已连接或重组为一种独特构建体,该独特构建体能够将表达盒引入细胞中。

术语“表达盒”指包含如下编码序列的DNA片段:所选基因的编码序列和所选基因产物表达所需的位于编码序列之前(5′非编码序列)和之后(3′非编码序列)的调控序列。因此,表达盒通常由如下序列构成:(1)启动子序列;2)编码序列,即,开放阅读框[“ORF”]和,3)3′非翻译区域,即,在真核细胞中通常包含聚腺苷酸位点的终止子。表达盒通常包含于载体中以有利于克隆和转化。可以将不同表达盒转化进包括细菌、酵母、植物和哺乳动物细胞在内的不同生物体中,只要能针对每种宿主使用正确的调控序列。

术语“同一性百分比”指两种或更多种多肽序列之间或两种或更多种多核苷酸序列之间的关系,该关系通过对序列进行比较而确定。“同一性”还表示多肽或多核苷酸序列之间的序列关联的程度,根据具体情况,它由比较序列的序列串之间的匹配百分比确定。“同一性百分比”和“相似性百分比”可容易地通过已知方法计算出来,所述的方法包括但不限于以下文献中所描述的那些:1.)Computational Molecular Biology(Lesk,A.M.编辑)Oxford University:NY(1988);2)Biocomputing:Informatics and Genome Projects(Smith,D.W.编辑)Academic:NY(1993);3.)Computer Analysis of Sequence Data,Part I(Griffin,A.M.和Griffin,H.G.编辑)Humania:NJ(1994);4)Sequence Analysis inMolecular Biology(von Heinje,G.编辑)Academic(1987);和5.)Sequence Analysis Primer(Gribskov,M.和Devereux,J.编辑)Stockton:NY(1991)。

设定确定同一性百分比的优选方法来用于给出待测试序列之间的最佳匹配。用于测定同一性百分比和相似性百分比的方法在公开可获得的计算机程序中进行编辑。序列比对和同一性百分比计算可以用LASERGENE生物信息学计算软件包(LASERGENE bioinformaticscomputing suite(DNASTAR Inc.,Madison,WI))中的MegAlignTM程序进行。序列的多重比对采用包括几种改变形式的算法在内的“Clustal比对方法”进行,包括“Clustal V比对方法”和“Clustal W比对方法”(在Higgins和Sharp,CABIOS,5:151-153(1989);Higgins,D.G.等人,Comput.Appl.Biosci.,8:189-191(1992)中有所描述)和可以在LASERGENE生物信息学计算软件包(DNASTAR Inc.)中的MegAlignTMv6.1程序中找到的比对方法。用Clustal程序比对序列后,可通过查看程序中的“序列距离”表来获得“同一性百分比”。

本领域的技术人员非常清楚,多种程度的序列同一性百分比可用于从其它物种中鉴定多肽,其中这类多肽具有相同或相似的功能或活性。同一性百分比的有用实例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%、或95%、或从50%至100%的任何整数百分比。实际上,从50%至100%的任何整数氨基酸同一性可用于描述在本文所述的方法和宿主细胞中编码多肽的合适核酸片段(分离的多核苷酸),例如51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。在一些情况下,合适的核酸片段(分离的多核苷酸)编码与本文报道的氨基酸序列至少约70%相同,优选地至少约75%相同,更优选地至少约80%相同的多肽。优选的核酸片段编码与本文所报道的氨基酸序列具有至少约85%同一性的氨基酸序列。更优选的核酸片段编码与本文所报道的氨基酸序列具有至少约90%同一性的氨基酸序列。最优选的是编码与本文所报道的氨基酸序列具有至少约95%同一性的氨基酸序列的核酸片段。

合适的核酸片段不但具有上述同源性,而且通常编码具有至少50个氨基酸,优选至少100个氨基酸,更优选至少150个氨基酸,更优选至少200个氨基酸,最优选至少250个氨基酸的多肽。

术语“序列分析软件”指可用于分析核苷酸或氨基酸序列的任何计算机算法或软件程序。“序列分析软件”可商购获得或独立开发。典型的序列分析软件包括但不限于:1.)GCG程序包(Wisconsin PackageVersion 9.0,Genetics Computer Group(GCG),Madison,WI);2)BLASTP,BLASTN,BLASTX(Altschul等人,J.Mol.Biol.,215:403-410(1990));3)DNASTAR(DNASTAR,Inc.Madison,WI);4)Sequencher(Gene Codes Corporation,Ann Arbor,MI);和5.)整合了Smith-Waterman算法的FASTA程序(W.R.Pearson,Comput.MethodsGenome Res.,[Proc.Int.Symp.](1994),召开年份:1992,111-20.编辑:Suhai,Sandor.Plenum:New York,NY)。在这一描述中,除非另外指明,只要序列分析软件用于分析,分析结果都基于所用程序的“默认值”。在此所用的“默认值”指在首次初始化软件时软件最初加载的任何值或参数集。

本文使用的标准重组DNA和分子克隆技术是本领域熟知的并且已经在如下文献中有所描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring HarborLaboratory:Cold Spring Harbor,NY(1989)(下文称为“Maniatis”);Silhavy,T.J.、Bennan,M.L.和Enquist,L.W.,Experiments with GeneFusions,Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1984);以及Ausubel,F.M.等人,Current Protocols in Molecular Biology,GreenePublishing Assoc.and Wiley-Interscience出版,Hoboken,NJ(1987)。

综述:脂肪酸和三酰基甘油的生物合成

通常,含油微生物中的脂质蓄积是响应存在于生长培养基中的总的碳氮比而触发。该过程(导致含油微生物中游离棕榈酸(16:0)的从头合成)在美国专利7,238,482中有详细描述。棕榈酸是长链饱和和不饱和脂肪酸衍生物的前体,这些脂肪酸衍生物通过延伸酶和去饱和酶的作用形成(图1)。

TAG(脂肪酸的主要贮存单位)通过涉及如下反应的一系列反应形成:(1)一分子的酰基辅酶A和甘油-3-磷酸通过酰基转移酶酯化而生成溶血磷脂酸;(2)第二分子的酰基辅酶A通过酰基转移酶酯化而生成1,2-二酰基甘油磷酸(通常称为磷脂酸);3)通过磷脂酸磷酸酶移除磷酸以生成1,2-二酰基甘油[“DAG”];和4)通过酰基转移酶的作用加入第三脂肪酸以形成TAG。

广谱的脂肪酸可被引入TAG中,包括饱和的和不饱和的脂肪酸以及短链和长链的脂肪酸。一些能通过酰基转移酶被引入TAG的脂肪酸的非限制性实例包括:癸酸(10:0)、月桂酸(12:0)、肉豆蔻酸(14:0)、棕榈酸(16:0)、棕榈油酸(16:1)、硬脂酸(18:0)、油酸(18:1)、异油酸(18:1)、LA(18:2)、桐油酸(18:3)、GLA(18:3)、ALA(18:3)、STA(18:4)、花生酸(20:0)、EDA(20:2)、DGLA(20:3)、ETrA(20:3)、ARA(20:4)、ETA(20:4)、EPA(20:5)、二十二烷酸(22:0)、DPA(22:5)、DHA(22:6)、木蜡酸(24:0)、神经酸(24:1)、蜡酸(26:0)和褐煤酸(28:0)脂肪酸。在本文所述的方法和宿主细胞中,最期望将“长链”PUFA引入TAG中,其中长链PUFA包括来源于18:1底物的任何脂肪酸,所述底物具有至少18个碳原子,即,C18或更长。其也包括羟基化脂肪酸、环氧脂肪酸和共轭亚油酸。

虽然大多数PUFA以中性脂类的形式掺入TAG并贮存于脂质体中,但是重要的是认识到在含油生物中测量总PUFA应包括那些位于磷脂酰胆碱级分、磷脂酰乙醇胺级分、和三酰基甘油(也称为TAG或油)级分中的PUFA。

ω脂肪酸的生物合成

其中油酸转化成ω-3/ω-6脂肪酸的代谢过程包括通过添加碳原子使碳链延长和通过加入双键使分子去饱和。这需要存在于内质网膜内的一系列专门的去饱和酶和延伸酶。然而,如在图1中看到的和如下所述的,通常存在多个用于产生特定ω-3/ω-6脂肪酸的替代途径。

具体地讲,图1描述了下文所述的途径。所有途径都需要最初通过Δ12去饱和酶将油酸转化成亚油酸LA(第一个ω-6脂肪酸)。然后,利用“Δ6去饱和酶/Δ6延伸酶途径”并将LA用作底物来如下形成长链ω-6脂肪酸:1)通过Δ6去饱和酶将LA转化成γ-亚麻酸[“GLA”];2)通过C18/20延伸酶将GLA转化成二高-γ-亚麻酸[“DGLA”];3)通过Δ5去饱和酶将DGLA转化成花生四烯酸[“ARA”];4)通过C20/22延伸酶将ARA转化成二十二碳四烯酸[“DTA”];以及,5)通过Δ4去饱和酶将DTA转化成二十二碳五烯酸[“DPAn-6”]。

作为另外一种选择,“Δ6去饱和酶/Δ6延伸酶途径”能够如下使用α-亚麻酸[“ALA”]作底物生产长链ω-3脂肪酸:(1)通过Δ15去饱和酶将LA转化成ALA(第一个ω-3脂肪酸);2)通过Δ6去饱和酶将ALA转化成十八碳四烯酸[“STA”];3)通过C18/20延伸酶将STA转化成二十碳四烯酸[“ETA”];4)通过Δ5去饱和酶将ETA转化成二十碳五烯酸[“EPA”];5)通过C20/22延伸酶将EPA转化成二十二碳五烯酸[“DPA”];以及,6)通过Δ4去饱和酶将DPA转化成二十二碳六烯酸[“DHA”]。任选地,ω-6脂肪酸可转化成ω-3脂肪酸;例如,ETA和EPA通过Δ17去饱和酶活性分别从DGLA和ARA生成。

ω-3/ω-6脂肪酸生物合成的替代途径利用Δ9延伸酶和Δ8去饱和酶,即,“Δ9延伸酶/Δ8去饱和酶途径”。更具体地讲,LA和ALA可通过Δ9延伸酶分别转化成EDA和ETrA;Δ8去饱和酶然后将EDA转化成DGLA和/或将ETrA转化成ETA。随后如上所述形成下游PUFA。

本文宿主生物必须天然或经由基因工程技术具有生产PUFA的能力。虽然多种微生物能够在常见的细胞代谢过程中合成PUFA(包括ω-3/ω-6脂肪酸),并且它们中的一些能进行商业培养,但是这些生物很少生产或不生产具有期望的油含量的油和用于药物、膳食替代品、医疗食品、营养补充剂、其它食物产品、工业油脂化学制品或其它终端产品中的组合物。因此,越来越着重于工程化微生物以生产“设计”的脂质和油的能力,其中脂肪酸含量和组成通过基因工程进行详细指定。在此基础上,期望宿主可能包含编码功能性PUFA生物合成途径的异源基因,但这是非必需的。

如果宿主生物不天然生产期望的PUFA或具有期望的脂质分布,本领域的技术人员熟悉将编码用于PUFA生物合成的合适酶的一个或多个表达盒导入所选的宿主生物所必需的构思和技术。文献为技术人员提供了多个教导,用于将此类表达盒导入多个宿主生物。将使用宿主生物解脂耶氏酵母的一些文献提供如下:美国专利7,238,482、国际申请公布WO 2006/033723、专利申请公布US-2006-0094092、专利申请公布US-2006-0115881-A1和专利申请公布US-2006-0110806-A1。上述列举并非穷尽性的因此不应理解为限制性的。

简而言之,多种ω-3/ω-6PUFA产品能在它们转化成TAG之前被生产出来,这取决于脂肪酸底物和存在于或被转化到宿主细胞中的ω-3/ω-6脂肪酸生物合成途径的特定基因。同样地,期望脂肪酸产品的生产可能直接发生或间接发生。当不经过任何中间步骤或中间途径将脂肪酸底物直接转化成期望的脂肪酸产品时,直接生产发生。当编码PUFA生物合成途径的多个基因可被组合使用,使得一系列反应发生以生产期望的PUFA时,间接生产发生。具体地讲,可期望用包含Δ12去饱和酶、Δ6去饱和酶、C18/20延伸酶、Δ5去饱和酶和Δ17去饱和酶的表达盒转化含油酵母以过剩生产EPA。参见美国专利7,238,482和国际申请公布WO 2006/052870。为本领域的技术人员熟知的是可将编码PUFA生物合成途径酶的基因的多种其它组合用于在含油生物中表达(参见图1)。包含于具体表达盒中的具体基因取决于宿主生物、它的PFUA分布和/或去饱和酶/延伸酶分布、底物的可利用性和期望的终产物。

许多候选基因具有所需去饱和酶和/或延伸酶活性,它们能根据公开可获得的文献进行鉴定,如GenBank、专利文献、和对具有生产PUFA能力的生物进行的实验分析。可用的去饱和酶和延伸酶序列可源自任何来源,例如,分离自天然来源如细菌、藻类、真菌、卵菌、酵母、植物、动物等、经由半合成途径产生或从头合成。在鉴定这些候选基因后,选择具有去饱和酶或延伸酶活性的特定多肽时的考虑事项包括:1)多肽的底物特异性;2)多肽或其组件是否为限速酶;3)去饱和酶或延伸酶是否是合成期望的PUFA所必需的;4)多肽所需的辅因子;和/或5)多肽在其产生后是否被修饰,例如,通过激酶或异戊烯转移酶修饰。

表达的多肽优选具有与它在宿主细胞中的位置的生化环境相容的参数。参见美国专利7,238,482。考虑每种特定的去饱和酶和/或延伸酶的转化效率也可以是有用的。更具体地讲,由于每种酶极少能以100%的效率将底物转化成产物,宿主细胞内所产生的未纯化的油的最终脂质分布通常是由期望的ω-3/ω-6脂肪酸及多种上游PUFA中间产物组成的多种PUFA的混合物。因此,当使期望的脂肪酸的生物合成最优化时,每种酶的转换效率也是要考虑的变量。

过氧化物酶体生物合成和Pex基因

如前文所述,过氧化物酶体是普遍存在于所有真核细胞中的细胞器。它们的主要作用是降解细胞定位细胞器中的各种物质,例如毒性化合物、脂肪酸等。例如,在过氧化物酶体中能够发生β-氧化过程,其中脂肪酸分子发生降解,最后产生乙酰-CoA的游离分子(它被回输到细胞溶质中)。虽然线粒体中的β-氧化过程导致ATP合成,在过氧化物酶体中的β-氧化引起高电位电子转移到O2中并导致形成H2O2,H2O2随后被过氧化物酶体过氧化氢酶转化成水和O2。特长链(如C18至C22)脂肪酸在过氧化物酶体中经过初始β-氧化,然后经过线粒体β-氧化。

已知负责通过ATP水解使蛋白穿过过氧化物酶体膜的蛋白是过氧化物酶体生物合成因子蛋白,或“peroxins”。这些过氧化物酶体生物合成因子蛋白也包括那些涉及过氧化物酶体生物合成/装配的蛋白。过氧化物酶体生物合成因子蛋白的基因首字母缩写是Pex;并且命名体系描述于Distel等人,J.Cell Biol.,135:1-3(1996)。迄今已经在多种真核生物中鉴定了至少32个不同的Pex基因。然而在真菌中,Kiel等人近来的文献(Traffic,7:1291-1303(2006))提出过氧化物酶体生物合成/基质蛋白输入所需的最小数目是17,因此仅需要Pex1p、Pex2p、Pex3p、Pex4p、Pex5p、Pex6p、Pex7p、Pex8p、Pex10p、Pex12p、Pex13p、Pex14p、Pex17p、Pex19p、Pex20p、Pex22p和Pe26p。这些蛋白以协同方式作用以增生(复制)过氧化物酶体并经由转移进入过氧化物酶体以输入蛋白(参见Waterham,H.R.和J.M.Cregg,BioEssays.19(1):57-66(1996))。

最初从对突变体的分析中分离了多种Pex基因,所述突变体显示具有异常的过氧化物酶体功能或结构。然而,由于全部基因组序列是可获得的,所以通过基于同源性的计算机序列搜索来鉴定Pex基因变得更加容易。Kiel等人(Traffic,7:1291-1303(2006))引用过氧化物酶体生物合成机制的强保守性,尽管它偶尔会出现低序列相似性。更具体地讲,在酵母和丝状真菌中,它们的数据指示迄今鉴定的几乎所有Pex蛋白都是保守的。下表4显示Kiel等人鉴定的过氧化物酶体生物合成因子蛋白(同上),它们来源于啤酒糖酵母(Saccharomyces cerevisiae)、光滑假丝酵母(Candida glabrata)、棉阿舒囊霉(Ashbya gossypii)、乳酸克鲁维酵母(Kluyveromyces lactis)、白假丝酵母(Candida albicans)、汉逊德巴利酵母(Debaryomyces hansenii)、巴斯德毕赤酵母(Pichiapastoris)、多形汉逊酵母(Hansenula polymorpha)、解脂耶氏酵母(Yarrowia lipolytica)、烟曲霉(Aspergillus fumigatus)、构巢曲霉(Aspergillus nidulans)、产黄青霉(Penicillium chrysogenum)、稻瘟病菌(Magnaporthe grisea)、粗糙脉孢菌(Neurospora crassa)、玉蜀黍赤霉(Gibberella zeae)、玉米黑粉菌(Ustilago maydis)、新生隐球菌新生变种(Cryptococcus neoformans var.neoformans)和粟酒裂殖酵母(Schizosaccharomyces pombe)。

导致过氧化物酶体生物合成减弱的Pex基因突变在酵母、人类和植物中引起严重的代谢和发育紊乱(Eckert,J.H.和R.Erdmann,Rev.Physiol.Biochem Pharmacol.,147:75-121(2003);Weller,S.等人,AnnualReview of Genomics and Human Genetics,4:165-211(2003);Wanders,R.J.,Am.J.Med.Genet.,126A:355-375(2004);Mano,S.和M.Nishimura,Vitam Horm.,72:111-154(2005);Wanders,J.A.,和H.R.Waterham,Annu.Rev.Biochem.,75:295-332(2006);Fujiki,Yukio.Peroxisome Biogenesis Disorders.In,Encyclopedia of Life Sciences.JohnWiley&Sons,2006)。例如X-连锁肾上腺脑白质营养不良[“X-ALD”]和Zellweger综合征、以及若干个严重程度较低的疾病,它们可能由单个酶缺乏和/或过氧化物酶体生物合成失调引起。

在酵母、解脂耶氏酵母中,已经分离并鉴定了多种不同的Pex基因,如上表4中鉴定的那些Pex基因。更具体地讲,Bascom,R.A.等人(Mol.Biol.Cell,14:939-957(2003))描述了YlPex3p;Szilard,R.K.等人(J.Cell Biol.,131:1453-1469(1995))描述了YlPex5p;Nuttley,W.M.等人(J.Biol.Chem.,269:556-566(1994))描述了YlPex6p;Elizen G.A.,等人(J.Biol.Chem.,270:1429-1436(1995))描述了YlPex9p;ElizenG.A.,等人(J.Cell Biol.,137:1265-1278(1997))和Titorenko,V.I.等人(Mol.Cell Biol.,17:5210-5226(1997))描述了YlPex16p;Lambkin,G.R.和R.A.Rachubinski(Mol.Biol.Cell.,12(11):3353-3364(2001))描述了YlPex19;以及Titorenko V.I.,等人(J.Cell Biol.,142:403-420(1998))和Smith J.J.以及R.A.Rachubinski(J.Cell Biol.,276:1618-1625(2001))描述了YlPex20p。

本文最初关注的基因是YlPex10p(GenBank保藏号CAG81606、AB036770和AJ012084)。它由Sumita等人证明(FEMS Microbiol.Lett.,214:31-38(2002)):1)YlPex10p用作过氧化物酶体的组分;并且2)YlPex10p的C3HC4环状锌指基序是蛋白功能必需的,如经由制造C341S、C346S和H343W点突变并随后进行生长分析来所测定的。

已经在其它生物中完成了对Pex10的C3HC4环状锌指基序的研究并具有类似结果。例如,发现改变在巴斯德毕赤酵

母(Pichia pastoris)的Pex10p C3HC4基序中的保守残基的点突变会使蛋白无功能(Kalish,J.E.等人,Mol.Cell Biol.,15:6406-6419(1995))。同样地,在对纤维原细胞系进行功能互补分析后,Warren D.S.等人(Hum.Mutat.,15(6):509-521(2000))得出结论:C3HC4基序对Pex10p功能是至关重要的。若干个研究结果显示Pex10p在拟南芥属中丧失功能会引起胚芽在心期死亡(Hu,J.等人,Science,297:405-409(2002);Schmumann,U.等人,Proc.Natl.Acad.Sci.U.S.A.,100:9626-9631(2003);Sparkes,I.A.等人,Plant Physiol.,133:1809-1819(2003);Fan,J.等人,Plant Physiol.,139:231-239(2005))。在后继研究中,Schemann,U.等人(Proc.Natl.Acad.Sci.U.S.A,104:1069-1074(2007))研究了Pex10p在非致命的功能部分丧失拟南芥属突变体中的功能。具体地讲,在拟南芥属野生型植株中制备具有功能异常的C3HC4基序的表达Pex10p的四个T-DNA插入序列。突变植物显示具有减少的叶片过氧化物酶体,并且作者提出Pex10p中环指基序的失活消除了连结过氧化物酶体与叶绿体以及在过氧化物酶体和叶绿体之间转移代谢物所需的蛋白相互作用。

虽然研究尚未鉴定其它Pex蛋白中必需的结构域,但是研究认识到了多种Pex突变体的效应,从而认识到各种不同的生物进化出的用于装配、保持、繁殖和遗传过氧化物酶体(一种已知在脂质代谢中起作用的细胞器)的方法和分子机制。例如,Bascom,R.A.等人已经进行了解脂耶氏酵母Pex3p的基因敲除和超表达(Mol.Biol.Cell,14:939-957(2003))。基因敲除细胞不包含野生型过氧化物酶体,相反具有多个小囊泡;超表达导致细胞具有较少、较大和聚集的过氧化物酶体。他们假定Pex3p涉及通过固定过氧化物酶体生物合成组件启动过氧化物酶体装配,即,过氧化物酶体靶信号(PTS)1和2输入机制。同样地,Guo,T.等人,敲除解脂耶氏酵母Pex16p导致过多地增殖不成熟的过氧化物酶体囊泡并显著地降低它们转化成成熟过氧化物酶体的速率和效率(J.Cell Biol.,162:1255-1266(2003)),然而超表达导致产生很少但是增大的过氧化物酶体(Eitzen等人,J.Cell Biol.,137:1265-1278(1997))。Guo等人得出结论:Pex16p负调节早期的过氧化物酶体前体分裂所需的膜分裂事件。

尽管已有上文概述的研究进展,关于不同Pex蛋白的作用、它们彼此相互作用和过氧化物酶体中的生物合成/装配机制的细节仍未被阐明。同样地,本专利申请所述的数据是在对其它植物或动物的研究中尚未验证的新观察数据,其中在YlPex10p的C3HC4基序中的突变或YlPex3p、YlPex10p或YlPex16p的敲除导致产生解脂耶氏酵母突变体,该突变体具有提高的PUFA掺入能力,尤其是掺入长链PUFA如C20至C22分子到细胞的总脂质级分和油级分中的能力。

已经提出过氧化物酶体是脂质的分解代谢和合成代谢所必需的(LinY.等人,Plant Physiology,135:814-827(2004));然而,该假说是基于对Pex16p的同源物的研究。更具体地讲,Lin,Y.等人(同上)报道拟南芥属Shrunken种子1(sse1)突变体具有异常的过氧化物酶体生物合成和脂肪酸合成,这基于sse1种子中的油与野生型相比减少了10-16%。Binns,D.等人(J.Cell Biol.,173(5):719-731(2006))检查了啤酒糖酵母中的过氧化物酶体-脂质体相互作用并测定两个细胞器之间的广泛物理接触促进脂质体内的结合脂解及过氧化物酶体脂肪酸氧化。更具体地讲,检查不同Pex基因敲除菌株的游离脂肪酸与TAG的比率,发现比率相对于野生型提高。很明显,为了了解过氧化物酶体,尤其是Pex3p、Pex10p和Pex16p蛋白的代谢作用,进一步的研究将是必须的。

不希望受任何具体说明或理论的限制,假定在含油酵母细胞中的Pex基因破坏或敲除影响过氧化物酶体中天然存在的脂质分解代谢和合成代谢,或受过氧化物酶体的影响。与尚未破坏其天然过氧化物酶体生物合成因子蛋白的含油酵母相比,破坏或敲除导致总脂质级分和油级分中的PUFA量增加,所述PUFA量以总脂肪酸百分比形式表示。在一些情况下,也观察到在总脂质级分和油级分中以干细胞重量百分比形式表示的PUFA量增加,和/或以干细胞重量百分比形式表示的总脂质含量增加。假定这种通用机制可应用于所有真核生物中,如藻类、真菌、卵菌、酵母、类眼虫、原生藻菌、植物和一些哺乳动物体系,因为所有这些生物都包含过氧化物酶体。

鉴定并分离Pex同源物

当在优选宿主生物中的特定Pex基因或蛋白的序列不是已知的时,本领域技术人员认识到在调控基因编码的蛋白活性之前鉴定和分离这些基因或它们的部分基因将是最期望的,所述调控继而促进掺入真核生物总脂质级分和油级分中的PUFA量的变化,所述量以总脂肪酸百分比形式表示。对优选的宿主Pex基因序列的认识将有利于通过定向破坏来破坏同源染色体基因。

表4中的Pex序列或它们的序列部分可用于在相同或其它藻类、真菌、卵菌、类眼虫、原生藻菌、酵母或植物物种中使用序列分析软件搜索Pex同源物。通常,这种计算机软件通过将同源程度赋予多种置换、缺失和其它修饰来匹配相似的序列。使用软件算法,如具有低复杂度滤波器和以下参数的BLASTP比对方法:Expect value=10,matrix=Blosum 62(Altschul,等人,Nucleic Acids Res.25:3389-3402(1997)),该方法是用于将表4中的任何Pex蛋白对核酸或蛋白序列数据库进行比较并从而鉴定在优选宿主生物中的相似已知序列的熟知方法。

使用算法软件搜索已知序列数据库尤其适于分离对公开可获得的Pex序列具有相对低的同一性百分比的同源物,如那些表4中描述的序列。可预测的一点是:分离与公开可获得的Pex序列具有至少约70%-85%同一性的Pex同源物将是相对更容易的。此外,那些至少约85%-90%相同的序列将尤其适于分离,那些至少约90%-95%相同的序列将最容易分离。

通过使用Pex酶独有的基序已经分离了一些Pex同源物。例如,为人熟知的是Pex2p、Pex10p和Pex12p在它们的羧基末端都有一个富含半胱氨酸的基序,已知该基序是C3HC4环状锌指基序(图2A)。该“保守结构域”区域对应于一组在特定位点高度保守的氨基酸,并且可能提供对蛋白结构、稳定性或活性来说必需的Pex蛋白区域。基序通过它们在蛋白同源物家族的比对序列中的高度保守性进行鉴定。作为独有的“标记”,它们能决定具有新测定序列的蛋白是否属于以前鉴定过的蛋白家族。这些基序可用作诊断工具以分别迅速鉴定新的Pex2、Pex10和/或Pex12基因。

作为另外一种选择,公开可获得的Pex序列或它们的基序可以是用于鉴定同源物的杂交试剂。核酸杂交试验的基本组成包括探针、怀疑含有目的基因或基因片段的样本及特定的杂交方法。探针通常是与待检测核酸序列互补的单链核酸序列。探针与待检测的核酸序列是可杂交的。尽管探针的长度可在5个碱基到数万个碱基之间变化,但通常约15个碱基到约30个碱基的探针长度是合适的。只需要探针分子的部分与待检测的核酸序列互补。另外,探针和靶序列之间不需要完全互补。杂交确实可以在并不完全互补的分子之间发生,结果是杂交区内的一定比率的碱基未与适当的互补碱基配对。

杂交方法是已知的。通常探针和样品必须在允许核酸杂交的条件下混合。这涉及在适当浓度和温度条件下在存在无机或有机盐时使探针和样品接触。探针和样品核酸必须接触足够长的时间,使探针和样品核酸之间的任何可能的杂交均会发生。混合物中的探针或靶标的浓度决定杂交发生所需的时间。探针或靶标的浓度越高,所需的杂交孵育时间就越短。任选地,可以加入离液剂(如氯化胍、硫氰酸胍、硫氰酸钠、四氯乙酸锂、高氯酸钠、四氯乙酸铷、碘化钾或三氟乙酸铯)。如果需要,能将甲酰胺加入杂交混合物,通常为30-50%(v/v)[“按体积计”]。

可以采用多种杂交溶液。通常,这些杂交溶液包含约20%至60%体积,优选30%体积的极性有机溶剂。通常的杂交溶液采用约30-50%v/v甲酰胺、约0.15至1M氯化钠、约0.05至0.1M缓冲液(如柠檬酸钠、Tris-HCl、PIPES或HEPES(pH范围约6-9))、约0.05至0.2%的去污剂(如十二烷基硫酸钠)或0.5-20mM的EDTA、FICOLL(Pharmacia Inc.)(约300-500千道尔顿)、聚乙烯吡咯烷酮(约250-500千道尔顿)和血清白蛋白。一般的杂交溶液还包含约0.1至5mg/mL未经标记的载体核酸、片段化的核酸DNA(如小牛胸腺或鲑精DNA或酵母RNA),以及任选约0.5%至2%wt/vol[“重量体积比”]的甘氨酸。可以包含其它添加剂,例如包括极性水溶性或可膨胀试剂(如聚乙二醇)、阴离子聚合物(如聚丙烯酸酯或聚甲基丙烯酸酯)和阴离子糖类聚合物(如硫酸葡聚糖)在内的体积排阻剂。

核酸杂交可适用于多种测定形式。最合适的形式之一是夹心测定形式。夹心测定尤其适用于在非变性条件下杂交。夹心型测定的主要成分是固体支持体。固体支持体具有吸附或共价连接至其上的固定核酸探针,该探针未经标记并且与序列的一部分互补。

任何Pex核酸片段或任何鉴定的同源物可用于从相同或其它藻类、真菌、卵菌、类眼虫、原生藻菌、酵母或植物物种中分离编码同源蛋白的基因。使用序列依赖性规程分离同源基因是本领域熟知的。序列依赖性规程的实例包括但不限于:1)核酸杂交方法;2)DNA和RNA扩增方法,例如核酸扩增技术的多种应用,如聚合酶链反应[“PCR”](美国专利4,683,202);连接酶链反应[“LCR”](Tabor,S.等人,Proc.Natl.Acad.Sci.U.S.A.,82:1074(1985));或链置换扩增[“SDA”],Walker等人,Proc.Natl.Acad.Sci.U.S.A.,89:392(1992));和3.)文库构建和互补筛选方法。

例如,编码蛋白或多肽的基因类似于公开可获得的Pex基因或它们的基序,可使用所有或部分那些公开可获得的核酸片段作为DNA杂交探针,以使用熟知的方法筛选来自任何期望生物的文库而直接分离该基因。基于公开可获得核酸序列的特异性,寡核苷酸探针可通过本领域已知的方法(Maniatis,同上)设计并合成。而且,整个序列可直接用于通过熟练技术人员已知的方法,例如随机引物DNA标记、切口平移或末端标记技术,来合成DNA探针,或使用可获得的体外转录体系来合成RNA探针。此外,能设计特异性引物并用于扩增部分或全长公开可获得的序列或它们的基序。所得的扩增产物可在扩增反应过程中直接标记或在扩增反应后标记,并用作探针以在合适的严格条件下分离全长的DNA片段。

通常,在PCR类型的扩增技术中,引物具有不同的序列而且彼此之间不互补。取决于期望的检测条件,应当设计引物序列以提供既有效又可靠的靶核酸的复制。PCR引物设计方法是常见且熟知的(Thein和Wallace,“The use of oligonucleotides as specific hybridization probes inthe Diagnosis of Genetic Disorders”,Human Genetic Diseases:A PracticalApproach,K.E.Davis编辑,(1986)第33-50页,IRL:Herndon,VA;Rychlik,W.,In Methods in Molecular Biology,White,B.A.Ed.,(1993)第15卷,第31-39页,PCR Protocols:Current Methods and Applications.Humania:Totowa,NJ)。

通常,可以将可获得的Pex序列的两个短片段在PCR规程中用于从DNA或RNA扩增编码同源基因的更长的核酸片段。也可以对克隆的核酸片段文库进行PCR,其中一个引物的序列来源于可获得的核酸片段或它们的基序。其它引物序列利用mRNA前体编码基因3′末端存在的多腺苷酸片。

作为另一种选择,第二个引物序列可以基于来源于克隆载体的序列。例如,技术人员可以按照RACE规程(Frohman等人,Proc.Natl.Acad.Sci.U.S.A.,85:8998(1988)),通过用PCR扩增在转录物内单个位点与3′或5′端之间的区域的拷贝来产生cDNA。以3′和5′方向取向的引物可以从能利用可获得的序列设计。使用可商业获得的3′RACE或5′RACE体系(例如BRL,Gaithersburg,MD),可以分离特异性的3′或5′cDNA片段(Ohara等人,Proc.Natl.Acad.Sci.U.S.A.,86:5673(1989);Loh等人,Science,243:217(1989))。

基于所讨论的这些熟知方法中的任何一种,在选择的任何优选真核生物中鉴定和/或分离Pex基因同源物将是可能的。能通过定向破坏PUFA生产宿主生物中的内源基因容易地确认任何推定的Pex基因的活性,因为总脂质级分和油级分的脂质分布相对于它们在缺乏定向Pex基因破坏的生物中的那些脂质分布发生了改变。

经由破坏天然过氧化物酶体生物合成因子蛋白提高总脂质级分和油级分中的PUFA量

如上所述,本发明的公开内容涉及下述提高含油真核生物中的一种PUFA或PUFA组合的重量百分比的方法,所述方法包括:

a)提供含油真核生物,所述生物在编码过氧化物酶体生物合成因子蛋白的天然基因中包含破坏,这产生PEX破坏生物;和编码功能性PUFA生物合成途径的基因;以及

b)在下述条件下培养(a)的真核生物:当与未破坏其天然过氧化物酶体生物合成因子蛋白的含油真核生物中的那些的重量%相比较时,(a)真核生物的总脂质级分和油级分中的一种PUFA或PUFA组合的重量%相对于总脂肪酸的重量%增加。

以总脂肪酸百分比形式提高的PUFA的量可能是:1)作为功能性PUFA生物合成途径期望终产品形式的PUFA,这与以中间体或副产品形式产生的PUFA相反;2)C20至C22的PUFA;和/或3)总PUFA。

除了相对于总脂肪酸重量%提高一种PUFA或PUFA组合的重量%之外,在一些情况下,还可以提高或降低细胞的总脂质含量(TFA%DCW)。这意味着无论PEX基因破坏是否引起PEX破坏细胞中的总脂质量提高或降低,该破坏总是引起一种PUFA或PUFA组合的重量%提高。

本文提供的另一种方法涉及在编码过氧化物酶体生物合成因子蛋白的天然基因中的破坏,其中当与亲本菌株中的该百分比进行比较时,所述破坏能够导致一种PUFA或PUFA组合相对于干细胞重量的百分比提高,所述亲本菌株的天然Pex蛋白未被破坏或其表达破坏天然Pex蛋白的“后备”拷贝。

在上述方法的优选方面,在编码过氧化物酶体生物合成因子蛋白的天然基因中的破坏导致PUFA的量提高,PUFA是功能性PUFA生物合成途径期望的终产品,而不是PUFA中间体或副产品,PUFA量以干细胞重量百分比相对于亲本菌株的重量百分比表示,所述亲本菌株的天然Pex蛋白未被破坏或其表达破坏天然Pex蛋白的“后备”拷贝。在一些情况下,组合PUFA相对于干细胞重量的百分比的提高是C20至C22PUFA的组合或总PUFA的提高。

上文也描述了通过这些方法产生的生物,所述生物包含至少一个过氧化物酶体生物合成因子蛋白的破坏。也描述了获取自这些生物的脂质和油、获取自脂质和油加工的产品、这些脂质和油用于食品、动物饲料、或工业应用的用途和/或副产品用于食品或动物饲料的用途。

上述方法中优选的真核生物包括藻类、真菌、卵菌、酵母、类眼虫、原生藻菌、植物和一些哺乳动物系统。

用于这些方法中任何一种的过氧化物酶体生物合成因子蛋白可选自:Pex1p、Pex2p、Pex3p、Pex3Bp、Pex4p、Pex5p、Pex5Bp、Pex5Cp、Pex5/20p、Pex6p、Pex7p、Pex8p、Pex10p、Pex12p、Pex13p、Pex14p、Pex15p、Pex16p、Pex17p、Pex14/17p、Pex18p、Pex19p、Pex20p、Pex21p、Pex21B、Pex22p、Pex22p样和Pex26p(以及它们的蛋白同源物)。在本文所述的一些优选方法中,被破坏的过氧化物酶体生物合成因子蛋白选自:Pex2p、Pex3p、Pex10p、Pex12p和/或Pex16p。然而在一些更优选的方法中,被破坏的过氧化物酶体生物合成因子蛋白选自:Pex3p、Pex10p和/或Pex16p。

在编码过氧化物酶体生物合成因子蛋白的天然基因中的破坏可能是在部分基因(例如在蛋白N-末端部分或在蛋白C-末端部分)中进行的插入、缺失、或定向突变。作为另外一种选择,该破坏能导致完全的基因敲除,使得基因从宿主细胞基因组中除去。或者该破坏可能是导致无功能蛋白的定向突变。

破坏方法

本发明包括在天然基因中的破坏,所述基因编码优选宿主细胞内的过氧化物酶体生物合成因子蛋白。虽然本领域的技术人员可使用多种技术获得破坏,但是特定基因的内源活性一般能通过以下技术减少或消除,例如:1)通过插入、取代和/或缺失所有或部分靶基因破坏所述基因;或2)操纵控制所述蛋白表达的调控序列。这些技术在下文中讨论。然而,本领域的技术人员认识到这些技术在现有文献中已有详细描述,并且不受本文所述的方法、宿主细胞、和产品的限制。本领域的技术人员也认识到大多数适用的技术使用任何特定的含油酵母。

经由插入、取代和/或缺失的破坏:就基因破坏而言,将外源DNA片段(通常是一个选择性标记基因)插入结构基因。这打断结构基因的编码序列并引起基因失活。将破坏盒转化到宿主细胞中导致非功能性破坏基因通过同源重组置换功能性天然基因。参见例如:Hamilton等人,J.Bacteriol.,171:4617-4622(1989);Balbas等人,Gene,136:211-213(1993);Gueldener等人,Nucleic Acids Res.,24:2519-2524(1996);和Smith等人,Methods Mol.Cell.Biol.,5:270-277(1996)。本领域的技术人员了解基因定向常规方法的许多改良方法,所述方法容许有阳性选择和阴性选择、生成基因敲除、以及将外来DNA序列插入到哺乳动物系统、植物细胞、丝状真菌、藻类、卵菌、类眼虫、原生藻菌、酵母和/或微生物系统的特定基因组位点中。

相反地,基因破坏的非特异性方法是使用转座元件或转座子。转座子是随机插入DNA但随后能根据序列进行检索以测定插入位点的基因元件。体内和体外转座技术是已知的,并且涉及转座元件与转座酶的组合使用。当转座元件或转座子与核酸片段在存在转座酶的情况下接触时,转座元件随机插入核酸片段中。该技术用于随机诱变和基因分离,因为被破坏的基因可基于转座元件的序列进行鉴定。用于体外转座的试剂盒是可商购获得的并包括:Primer Island Transposition Kit,得自PerkinElmer Applied Biosystems,Branchburg,NJ,基于酵母的Ty1元件;GenomePriming System,得自New England Biolabs,Beverly,MA,基于细菌转座子Tn7;和EZ::TN转座子插入系统,得自Epicentre Technologies,Madison,WI,基于Tn5细菌转座元件。

Pex调控序列的操纵:本领域熟知与编码序列附连的调控序列包括转录和翻译“控制”核苷酸序列,所述序列位于编码序列的上游(5′非编码序列)、内部、或下游(3′非编码序列),并且影响附连的编码序列的转录、RNA加工或稳定性、或翻译。因此,操纵Pex基因调控序列可以指操纵特定Pex基因的启动子、静默子、5′非转录前导序列(介于转录起始位点好翻译启动密码子之间)、内含子、增强子、启动控制区、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎-环结构。然而在所有情况下,操纵的结果是下调Pex基因的表达,这促使与天然过氧化物酶体生物合成因子蛋白未被破坏的含油酵母相比,总脂质级分和油级分中以总脂肪酸百分比形式表示的PUFA量增加。

例如,能缺失或破坏Pex10基因的启动子。作为另外一种选择,驱动Pex10基因表达的天然启动子可以用与天然启动子相比启动子活性减弱的异源启动子取代。用于操纵调控序列的方法是为人们熟知的。

技术人员能够使用这些技术和其它熟知技术破坏在本文所述的优选宿主细胞中的天然过氧化物酶体生物合成因子蛋白,所述优选宿主例如哺乳动物系统、植物细胞、丝状真菌、藻类、卵菌、类眼虫、原生藻菌和酵母。

本领域的技术人员能够识别破坏天然Pex基因的最佳方法,以使得与天然过氧化物酶体生物合成因子蛋白未被破坏的真核生物相比,在总脂质级分和油级分中积聚的PUFA量增加,所述PUFA量以总脂肪酸的百分比形式表示。

ω-3和/或ω-6脂肪酸生物合成的代谢工程

本文所述方法除了用于破坏天然过氧化物酶体生物合成因子蛋白之外,还可使用操纵ω-3和/或ω-6脂肪酸生物合成。这种操纵可能需要直接在PUFA生物合成途径中进行代谢工程改造或需要另外对为PUFA生物合成途径贡献碳的途径进行操纵。可用于上调期望的生化途径和下调不期望的生化途径的技术是本领域熟知的。例如,与ω-3和/或ω-6脂肪酸生物合成途径竞争能量或碳的生化途径或干扰特定PUFA终产物产生的天然PUFA生物合成途径中的酶可以通过基因破坏来去除或通过其它手段(如反义mRNA和锌指靶向技术(zinc-finger targetingtechnologies))来下调。

以下讨论改变PUFA生物合成途径从而分别提高GLA、ARA、EPA或DHA含量的方法,以及在TAG生物合成途径和TAG降解途径中的所期望的操纵:分别是国际申请公布WO 2006/033723,国际申请公布WO 2006/055322[美国专利申请公布2006-0094092-A1],国际申请公布WO 2006/052870[美国专利申请公布2006-0115881-A1]和国际申请公布WO 2006/052871[美国专利申请公布2006-0110806-A1]。

表达系统、表达盒、载体和宿主细胞转化

制备重组构建体并将其导入到优选真核宿主中以破坏天然过氧化物酶体生物合成因子蛋白和/或导入编码PUFA生物合成途径的基因可能是必需的,所述真核宿主例如哺乳动物系统、植物细胞、丝状真菌、藻类、卵菌、类眼虫、原生藻菌和酵母。本领域的技术人员了解的标准来源材料如下所述:1)构建、操纵和分离大分子(例如DNA分子、质粒等)的特定条件和程序;2)生成重组DNA片段和重组表达构建体;和3)克隆的筛选和分离。参见Sambrook等人,Molecular Cloning:ALaboratory Manual,第2版,Cold Spring Harbor Laboratory:Cold SpringHarbor,NY(1989);Maliga等人,Methods in Plant Molecular Biology,Cold Spring Harbor,NY(1995);Birren等人,Genome Analysis:DetectingGenes,v.1,Cold Spring Harbor,NY(1998);Birren等人,Genome Analysis:Analyzing DNA,v.2,Cold Spring Harbor:NY(1998);Plant MolecularBiology:A Laboratory Manual,Clark,ed.Springer:NY(1997)。

一般来讲,存在于构建体中的序列的具体选择取决于期望的表达产物、宿主细胞的性质以及提出的相对于未转化细胞分离转化细胞的手段。技术人员熟知基因元件必须存在于质粒载体上以成功地转化、选择并增殖包含嵌合基因的宿主细胞。然而,通常载体或盒含有引导相关基因的转录和翻译的序列、选择标记和允许自主复制或染色体整合的序列。合适的载体包括控制转录起始的基因5′区(即启动子)和控制转录终止的DNA片段3′区(即终止子)。最优选两个控制区都来源于来自转化宿主细胞的基因。

用于驱动在期望的宿主细胞中的异源基因或部分异源基因表达的启动控制区或启动子有多种,并且为人们所熟知。这些控制区可包含启动子、增强子、静默子、内含子序列、3′UTR和/或5′UTR区域、以及蛋白和/或RNA稳定元件。此类元件的长度和特异性可以不同。实际上能够引导这些基因在所选宿主细胞中的表达的任何启动子(即,天然的、合成的、或嵌合的启动子)都是适用的。在宿主细胞中的表达能够以诱导型或组成型的方式发生。诱导型表达通过诱导可操作地连接至受关注的Pex基因的可调控启动子的活性发生。组成型表达通过利用可操作地连接至受关注基因的组成型启动子发生。

当宿主细胞是例如酵母时,酵母细胞中的功能性转录和翻译区域尤其从宿主菌种中提供。用于在解脂耶氏酵母中使用的优选转录起始调节区参见国际申请公布WO 2006/052870。可以使用许多调控序列的任意一种,这取决于是期望组成型转录还是诱导型转录、启动子在表达所关注的ORF中的效率、构建的容易性等。

必须在重组构建体中提供编码转录终止信号的3′非编码序列,即,“终止区”,该序列可以来自从中获取初始区的基因或不同基因的3′区域。大量的终止区是已知的并且当用于与它们源自的属和物种相同和不同的属和物种两者时,其在多种宿主中发挥的功能令人满意。选择终止区更多的是从方便的角度出发而不是为了任何特性。终止区也可以源于优选宿主的多种天然基因。

尤其有用的酵母终止区是那些来源于酵母基因,尤其是糖酵母属、裂殖糖酵母属、假丝酵母属、耶氏酵母属或克鲁维酵母属的终止区。编码γ-干扰素和α-2干扰素的哺乳动物基因的3′区域也已知能在酵母中起作用。3′-区也可以是合成的,因为本领域的技术人员可利用可获得的信息来设计和合成用作转录终止子的3′-区序列。终止区可以是非必需的,但是是高度优选的。

载体除了上述调控元件之外还可包含选择性的和/或可评分的标记。优选地,标记基因是抗生素抗性基因,使得用抗生素处理细胞引起未转化细胞的生长抑制或死亡,但不抑制转化细胞的生长。为了选择酵母转化体,可使用在酵母中发挥功能的任何标记,使之具有对卡那霉素、潮霉素、和氨基配醣物G418的抗性并能够在缺乏尿嘧啶、赖氨酸、组氨酸、或亮氨酸的培养基上生长的标记是尤其有用的。

仅仅将基因插入克隆载体不确保它能以期望的速率、浓度、量等表达。根据对高表达率的需要,通过操作许多控制转录、RNA稳定性、翻译、蛋白质稳定性和位置、氧限制和从宿主细胞分泌的不同遗传元件,已经建立了许多专用的表达载体。一些操纵特征包括:相关转录启动子和终止子序列的性质,所克隆基因的拷贝数目以及该基因是质粒携带的还是整合进了宿主细胞的基因组中,所合成的外来蛋白质的最终细胞定位,蛋白质在宿主生物内的翻译和正确折叠的效率,所克隆基因的mRNA和蛋白质在宿主细胞内的固有稳定性和所克隆基因中的密码子使用,以使得其频率与宿主细胞的优选密码子使用频率接近。这些特征的每一种可用于本文所述的方法和宿主细胞中,以进一步优化PUFA生物合成途径基因的表达并减少天然Pex基因的表达。

在制备适于破坏或敲除天然过氧化物酶体生物合成因子蛋白和/或表达编码PUFA生物合成途径活性的基因的重组构建体(例如包含具有启动子、ORF和终止子的嵌合基因的构建体)后,将其置于能够在宿主细胞中自主复制的质粒载体中,或直接整合进宿主细胞基因组中。表达盒的整合可以在宿主基因组中随机地发生或者可以通过使用下述构建体来靶向,所述构建体含有足以靶向宿主基因座中的重组的与宿主基因组同源的区。如果构建体靶向内源性基因座,则转录和翻译调控区的全部或某些可以由内源性基因座提供。

当两个或更多个基因从独立的复制载体表达时,每个载体可具有不同的选择手段并且应当缺乏与其它构建体的同源性以便维持稳定表达和防止元件在构建体之间重配(reassortment)。可用实验方法确定对调控区、选择手段和所引入的构建体的增殖方法的正确选择,以便所有导入的基因均以需要的水平表达从而提供期望的产品的合成。

包含目的基因的构建体可以通过任何标准技术导入到宿主细胞中。这些技术包括转化(如醋酸锂转化[Methods in Enzymology,194:186-187(1991)])、原生质体融合、基因枪轰击(bolistic impact)、电穿孔、显微注射、真空过滤或将所关注的基因引入宿主细胞中的任何其它方法。

为方便起见,已经通过任何方法被操纵以摄取DNA序列(如表达盒)的宿主细胞在本文中将称为“转化的”或“重组的”。转化的宿主将具有至少一个表达构建体的拷贝,而且可以具有两个或更多个拷贝,这取决于该基因是整合进基因组内、被扩增还是存在于具有多拷贝数的染色体外元件上。

转化宿主细胞能通过选择导入构建体上包含的标记进行鉴定。作为另外一种选择,分离的标记构建体可用期望的构建体进行共转化,该方法与多种将多个DNA分子导入宿主细胞的转化技术一样。通常转化宿主通过它们在选择培养基上生长的能力进行选择。选择培养基可掺入抗生素或缺乏未转化宿主必需的生长因子,如营养物质或生长因子。导入的标记基因可赋予抗生素抗性,或编码必需的生长因子或酶,从而当在转化宿主中表达时允许在选择培养基上生长。转化宿主的选择也能发生在表达标记蛋白能被直接地或间接地检测出来时。标记蛋白可单独表达或融合到另一种蛋白中进行表达。标记蛋白可通过其酶活性(例如β-半乳醣苷酶可将X-gal[“5-溴-4-氯-3-吲哚基-β-D-半乳糖苷”]底物转化成着色产物;荧光素酶能将荧光素转化成发光产物)或其产光或改性特性(例如维多利亚多管水母(Aequorea victoria)的绿荧光蛋白,它当用蓝光照亮时发荧光)进行检测。作为另外一种选择,能使用抗体检测标记蛋白或在例如所关注蛋白上的分子标记。能对表达标记蛋白或标记物的细胞进行选择,例如通过视觉检测或通过例如使用抗体分选或批选荧光活化细胞的技术。

无论选择哪种宿主或表达构建体,必须筛选多个转化体以获取显示期望的表达水平、调节和模式的菌株或植物品系,因为不同的独立转化事件导致不同水平和模式的表达(Jones等人,EMBO J.,4:2411-2418(1985);De Almeida等人,Mol.Gen.Genetics,218:78-86(1989))。这种筛选可以通过DNA印迹的Southern分析(Southern,J.Mol.Biol.,98:503(1975))、mRNA表达的Northern分析(Kroczek,J.Chromatogr.Biomed.Appl.,618(1-2):133-145(1993))、蛋白质表达的Western和/或Elisa分析、PUFA产物的表型分析或GC分析来完成。

优选的真核宿主生物

多种真核生物适合作为本文的宿主,因此产生在天然过氧化物酶体生物合成因子蛋白和编码PUFA生物合成途径的基因中的包含破坏的转化宿主生物,与尚未破坏其天然过氧化物酶体生物合成因子蛋白的真核生物相比,其中转化的真核宿主生物的PUFA含量提高,所述PUFA被掺入到总脂质级分和油级分中,以总脂肪酸百分比形式表示。可获得的宿主可以是不同的哺乳动物体系、植物细胞、真菌、藻类、卵菌、酵母、原生藻菌和/或类眼虫。虽然优选含油生物,但本文也可使用非含油生物,使得当它们的一种天然PEX基因被破坏时,在总脂质级分或油级分中至少一种多不饱和脂肪酸的重量%相对于总脂肪酸的重量%提高,并且可导致PUFA提高1.3倍。此外,PUFA百分比可相对于非含油生物的干细胞重量提高。在另一个实施方案中,能基因修饰非含油生物使之变成含油生物,例如酵母如啤酒糖酵母。

含油生物天然能够合成并积聚油,其中总油含量通常大于细胞干重的约25%。将多种藻类、藓、真菌、酵母、原生藻菌和植物被天然地归类为含油生物。

优选的含油微生物包括那些藻类、原生藻菌和真菌生物,它们天然生产ω-3/ω-6PUFA。例如,ARA、EPA和/或DHA经由小环藻属(Cyclotella sp.)、菱形藻属(Nitzschia sp.)、腐霉属(Pythium)、破囊壶菌属(Thraustochytrium sp.)、裂殖壶菌属(Schizochytrium sp.)和被孢霉属(Mortierella)生产。Mackenzie等人(Appl.Environ.Microbiol.,66:4655(2000))描述了转化高山被孢霉(M.alpina)的方法。类似地,用于转化破囊壶菌目(Thraustochytriales)微生物(例如破囊壶菌属(Thraustochytrium)、裂殖壶菌属(Schizochytrium))的方法在美国专利7,001,772中公开。

更优选含油酵母,包括那些天然生产和那些经遗传工程化以生产ω-3/ω-6PUFA的酵母。通常鉴定为含油酵母的属包括但不限于:耶氏酵母属(Yarrowia)、假丝酵母属(Candida)、红酵母属(Rhodotorula)、红冬孢酵母属(Rhodosporidium)、隐球酵母属(Cryptococcus)、丝孢酵母属(Trichosporon)和油脂酵母属(Lipomyces)。更具体地讲,示例性的油合成酵母包括:圆红冬孢酵母(Rhodosporidium toruloides)、斯达氏油脂酵母(Lipomyces starkeyii)、产油油脂酵母(L.lipoferus)、拉可夫氏假丝酵母(Candida revkaufi)、铁红假丝酵母(C.pulcherrima)、热带假丝酵母(C.tropicalis)、产朊假丝酵母(C.utilis)、茁芽丝孢酵母(Trichosporon pullans)、皮状丝孢酵母(T.cutaneum)、胶粘红酵母(Rhodotorula glutinus)、禾木科红酵母(R.graminis)和解脂耶氏酵母(Yarrowia lipolytica)(以前归类为解脂假丝酵母(Candidalipolytica))。

最优选的是含油酵母解脂耶氏酵母;而且,在其它实施方案中,最优选的是命名为ATCC#76982、ATCC#20362、ATCC#8862、ATCC#18944和/或LGAM S(7)1的解脂耶氏酵母菌株(Papanikolaou S.和Aggelis G.,Bioresour.Technol.,82(1):43-9(2002))。

涉及转化解脂耶氏酵母的具体教导内容包括美国专利4,880,741和美国专利5,071,764,以及Chen,D.C.等人(Appl.Microbiol Biotechnol..,48(2):232-235(1997)),而合适的选择技术描述于美国专利7,238,482和国际申请公布WO 2005/003310和WO 2006/052870。

在解脂耶氏酵母中表达基因的优选方法是通过将线性DNA整合进宿主基因组中。当期望基因高水平表达时,整合进基因组中的多个位置可能是尤其有用的,例如在Ura3基因座(GenBank保藏号AJ306421)、Leu2基因座(GenBank保藏号AF260230)、Lys5基因座(GenBank保藏号M34929)、Aco2基因座(GenBank保藏号AJ001300)、Pox3基因座(Pox3:GenBank保藏号XP_503244或Aco3:GenBank保藏号AJ001301)、Δ12去饱和酶基因座(美国专利7,214,491)、Lip1基因座(GenBank保藏号Z50020)、Lip2基因座(GenBank保藏号AJ012632)、SCP2基因座(GenBank保藏号AJ431362)、Pex3基因座(GenBank保藏号CAG78565)、Pex16基因座(GenBank保藏号CAG79622)和/或Pex10基因座(GenBank保藏号CAG81606)。

优选的用于解脂耶氏酵母的选择方法是对卡那霉素、潮霉素和氨基糖苷G418的抗性以及在缺乏尿嘧啶、亮氨酸、赖氨酸、色氨酸或组氨酸的培养基上生长的能力。5-氟乳清酸[5-氟尿嘧啶-6-羧酸一水合物或“5-FOA”]也可用于选择酵母Ura-突变体。该化合物对具有编码乳清酸苷5′-单磷酸脱羧酶[OMP脱羧酶]的功能性URA3基因的酵母细胞有毒性;因此,基于这种毒性,5-FOA特别可用于选择和鉴定Ura-突变型酵母菌株(Bartel,P.L.和Fields,S.,Yeast 2-Hybrid System,Oxford University:New York,第7卷,第109-147页,1997;也参见国际申请公开WO2006/052870,用于5-FOA在耶氏酵母属中的应用)。

用于耶氏酵母属的备选的优选选择方法依赖于用于解脂耶氏酵母的基于磺酰脲(氯嘧磺隆;E.I.duPont de Nemours & Co.,Inc.,Wilmington,DE)抗性的显性非抗生素标记。更具体地讲,该标记基因是具有单个氨基酸改变(即W497L)的天然乙酰羟酸合酶(“AHAS”或乙酰乳酸合酶;E.C.4.1.3.18),从而赋予了磺酰脲除草剂抗性(国际申请公布WO 2006/052870)。AHAS是用于生物合成支链氨基酸(即缬氨酸、亮氨酸、异亮氨酸)的途径中的第一常用酶,并且它是磺酰脲和咪唑啉酮除草剂的靶标。

用于多不饱和脂肪酸生产的发酵方法

使转化的宿主细胞在优化PUFA生物合成基因的表达并且产生最大并且最经济产量的期望PUFA的条件下生长。通常,可通过改变碳源的类型和量、氮源的类型和量、碳氮比、不同矿物离子的量、氧水平、生长温度、pH、生物质生产期的时长、油积聚期的时长以及细胞收获的时间和方法来优化培养基条件。通常使所关注的含油酵母例如解脂耶氏酵母在复合培养基(例如酵母提取物-蛋白胨-葡萄糖肉汤培养基(YPD))或缺乏生长所必需的成分并强迫选择期望表达盒的确定成分的极限培养基(如Yeast Nitrogen Base(DIFCO Laboratories,Detroit,MI))中生长。

用于本文所述方法和宿主细胞的发酵培养基必须包含合适的碳源如在美国专利7,238,482中提出的碳源。合适的碳源涵盖多种来源,优选糖、甘油和/或脂肪酸。最优选的碳源是葡萄糖和/或包含介于10-22个碳之间的脂肪酸。

氮可以由无机源(如(NH4)2SO4)或有机源(如尿素或谷氨酸)提供。除了合适的碳源和氮源之外,发酵培养基还必须含有合适的矿物质、盐、辅因子、缓冲液、维生素和本领域技术人员已知的适合含油酵母生长并促进PUFA产生的酶促途径的其它组分。要特别注意促进脂质和PUFA合成的几种金属离子(如Fe+2、Cu+2、Mn+2、Co+2、Zn+2和Mg+2)(Nakahara,T.等人,Ind.Appl.Single Cell Oils,D.J.Kyle和R.Colin编辑,第61-97页(1992))。

用于本文所述方法和宿主细胞的优选生长培养基是常规的商业制备培养基,如酵母氮源培养基(Yeast Nitrogen Base,DIFCO Laboratories,Detroit,MI)。也可以使用其它确定成分的生长培养基或合成的生长培养基,适于转化宿主细胞生长的培养基对微生物学或发酵科学来说是已知的。适于发酵的pH范围通常介于约pH 4.0至pH 8.0之间,其中优选将pH 5.5至pH 7.5作为初始生长条件的范围。发酵可以在有氧或厌氧条件下进行,其中优选为微好氧条件。

通常,在含油酵母细胞中积聚高水平的PUFA和TAG需要一个两阶段过程,因为代谢状态必须在生长和脂肪的合成/贮存之间达到“平衡”。因此,最优选的是,两阶段的发酵过程是在含油酵母中产生油所必需的。这种方法在美国专利7,238,482中有所描述,其也描述了多种合适的发酵工艺设计(即分批式、补料分批式和连续式)和生长过程中的注意事项。

PUFA油的纯化和处理

包括PUFA在内的脂肪酸可以游离脂肪酸或酯化形式如酰基甘油、磷脂、硫脂或糖脂形式存在于宿主生物中。这些脂肪酸可通过本领域熟知的多种方法从宿主细胞中提取。关于酵母脂质的提取技术、质量分析和可接受标准的一篇综述是Z.Jacobs(Critical Reviews in Biotechnology,12(5/6):463-491(1992))的综述。有关下游加工的简述也可由A.Singh和O.Ward(Adv.Appl.Microbiol.,45:271-312(1997))提供。

一般来讲,用于纯化脂肪酸(包括PUFA)的手段可包括用有机溶剂萃取(例如,美国专利6,797,303和美国专利5,648,564)、超声处理、超临界流体萃取(如使用二氧化碳)、皂化和物理手段(例如挤压)、或它们的组合。参见美国专利7,238,482.

油在食物、保健食品、药物和动物饲料中的用途

市场包含许多种掺入了ω-3和/或ω-6脂肪酸(尤其是ALA、GLA、ARA、EPA、DPA和DHA)的食物和饲料产品。可以预期,通过本文所述方法和宿主细胞制备的包含长链PUFA的微生物生物质、包含PUFA的部分纯化微生物生物质、包含PUFA的纯化微生物油、和/或纯化的PUFA赋予健康有益效果,通过加入这些物质改善了对食物或饲料的摄取。举例来说,可将这些油加到食物类似物、饮料、肉产品、谷类产品、烘焙食品、小吃食品和乳制品中。参见美国专利公开2006/0094092。

这些组合物通过加入到医疗食品(包括医疗营养物质、饮食补充剂、婴儿代乳品和药品)中可赋予健康有益效果。技术人员将会知道加到食品、饲料、饮食补充剂、营养物质、药品、和其它可摄取的产品中以赋予健康有益效果的油的量。本领域描述了摄取这些油获得的健康有益效果,它是技术人员已知的并进行了持续的研究。本文所指的量是“有效”量,除了其它方面的原因,它取决于摄入的包含这些油的产品的性质以及它们旨在治疗的病症。

优选实施方案的描述

如实施例所证明并如表5所概述的(下文),破坏YlPex10p的C3HC4环状锌指基序的C-末端部分、缺失整个染色体YlPex10基因整个染色体YlPex16基因、缺失整个染色体YlPex10YlPex16基因、和缺失整个染色体YlPex3基因都导致产生解脂耶氏酵母的工程化PUFA生产菌株,相对于不破坏天然Pex蛋白的亲本菌株,该菌株具有以总脂肪酸百分比形式表示的、提高的PUFA重量%。在解脂耶氏酵母的工程化EPA生产菌株中表达染色体外的YlPex10p逆转了该效应,所述菌株在基因组Pex10p中具有破坏和提高的总脂质级分和油级分中的PUFA的量。

表5汇编了来自实施例3、4、5、7、9、11和12的数据,使得关于总脂质含量[“TFA%DCW”]、以总脂肪酸重量%表示的给定脂肪酸浓度[“TFA%”]、和干细胞重量百分比形式表示的给定脂肪酸含量[“DCW%”]的趋势能基于存在/不存在Pex破坏或敲除被推论出来。“期望PUFA%TFA”和“期望PUFA%DCW”分别定量期望的PUFA产物(即DGLA或EPA)的特定浓度或含量,所述产物通过设计的工程化PUFA生物合成途径进行生产。“全部PUFA”包括LA、ALA、EDA、DGLA、ETrA、ETA和EPA、然而“C20PUFA”被限定为EDA、DGLA、ETrA、ETA和EPA。

虽然数据不能直接地在实施例之间进行比较,但作为不同的耶氏酵母属菌株和生长条件的结果,可得出以下结论(相对于其天然Pex蛋白未被破坏的亲本菌株或其表达破坏天然Pex蛋白的“后备”拷贝的亲本菌株):

1)在生产PUFA的耶氏酵母属中的Pex破坏导致总脂质级分和油级分中的单个PUFA例如EPA或DLGA的重量%相对于总脂肪酸的重量%(%TFA)提高;

2)在生产PUFA的耶氏酵母属中的Pex破坏导致总脂质级分和油级分中的C20PUFA的重量%相对于总脂肪酸的重量%(%TFA)提高;

3)通过延伸点1),在生产PUFA的耶氏酵母属中的Pex破坏导致总脂质级分和油级分中的任何PUFA和所有PUFA组合的量相对于总脂肪酸的重量%提高;和

4)在生产PUFA的耶氏酵母属中的Pex破坏导致单个PUFA例如EPA或DLGA相对于干细胞重量的百分比提高。

当比较在“所有PUFA%DCW”、“C20PUFA%DCW”和TFA%DCW中的Pex破坏的效应时,观察到不同的结果。具体地讲,在一些情况下,在生产PUFA的耶氏酵母属中的Pex破坏导致总脂质级分和油级分中的C20PUFA或所有PUFA的量(以干细胞重量百分比形式表示)提高(相对于天然Pex蛋白未被破坏的亲本菌株)。在其它情况下,在总脂质级分和油级分中存在以干细胞重量百分比形式表示的减少量的C20PUFA或所有PUFA(相对于天然Pex蛋白未被破坏的亲本菌株)。也观察到相对于总脂质含量(TFA%DCW)的类似结果,因此Pex破坏的效应可能导致总脂质含量提高或降低。

虽然上文概述的每项内容都是受关注的,尤其有用的是检查Pex破坏对期望的PUFA相对于总PUFA量的比率的效应,对生物进行工程化以生产期望的PUFA。

例如,在包含Pex10破坏的菌株Y4128中54%的PUFA(%TFA)是EPA,所述破坏导致截去C末端的最后32个氨基酸,然而在亲本菌株Y4086中仅有16.3%的PUFA(%TFA)是EPA。因此,所述破坏导致期望的PUFA(%TFA)量提高3.3倍(实施例3、4)。在类似情况下,在菌株Y4036(ΔPex16)中62.8%的PUFA(%TFA)是DGLA,然而在Y4036-中仅有38.1%的PUFA(%TFA)是DGLA,提高了1.65倍(实施例9)。并且在菌株Y4036(ΔPex3)中67.7%的PUFA(%TFA)是DGLA,然而在Y4036-中仅有33.3%的PUFA(%TFA)是DGLA,提高了2.0倍(实施例12)。这些结果证实这一假说:Pex破坏导致总脂质级分和油级分中的期望的PUFA的量(%TFA)选择性地提高,所述PUFA通过工程化生物进行生产。

当检查Pex破坏对C20PUFA相对于总PUFA量的比率的效应时,观察到较低的选择性。例如,在包含Pex10破坏的菌株Y4128中,73%的PUFA(%TFA)是C20PUFA,然而在菌株Y4086中,仅有42%的PUFA(%TFA)是C20PUFA。因此,破坏导致总脂质级分和油级分中积聚的C20PUFA相对于总PUFA的量提高1.7倍(实施例3、4)。在类似情况下,在菌株Y4036(ΔPex16)中71%的PUFA(%TFA)是C20PUFA,然而在Y4036-中仅有54.8%的PUFA(%TFA)是C20PUFA,提高了1.3倍(实施例9)。并且在菌株Y4036(ΔPex3)中82.4%的PUFA(%TFA)是C20PUFA,然而在Y4036-中仅有47.4%的PUFA(%TFA)是C20PUFA,提高了1.7倍(实施例12)。

基于教导和本文所述的结果,期望将实现以下方法的可行性和商业可用性:利用在编码过氧化物酶体生物合成因子蛋白的天然基因中的多个破坏作为提高在生产PUFA的真核生物中的PUFA量的方法。生产PUFA的真核生物能够合成多种ω-3和/或ω-6PUFA,该合成利用Δ9延伸酶/Δ8去饱和酶途径或Δ6去饱和酶/Δ6延伸酶途径。

实施例

在以下实施例中进一步描述本发明,所述实施例示出了实施本发明的简要方法,但不完全限定其所有可能变型。

一般方法

实施例中使用的标准重组DNA技术和分子克隆技术是本领域所熟知的并且在如下文献中有所描述:1)Sambrook,J.,Fritsch,E.F.和Maniatis,T.的Molecular Cloning:A Laboratory Manual;Cold SpringHarbor Laboratory:Cold Spring Harbor,NY(1989)(Maniatis);2)T.J.Silhavy,M.L.Bennan和L.W.Enquist,Experiments with GeneFusions;Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1984);以及3.)Ausubel,F.M.等人,Current Protocols in Molecular Biology,由Greene Publishing Assoc.和Wiley-Interscience出版,Hoboken,NJ(1987)。

适用于微生物培养物的维持和生长的材料和方法是本领域熟知的。适用于下面实施例的技术可在Manual of Methods for GeneralBacteriology(Phillipp Gerhardt,R.G.E.Murray,Ralph N.Costilow,Eugene W.Nester,Willis A.Wood,Noel R.Krieg和G.Briggs Phillips编辑),American Society for Microbiology:Washington,D.C.(1994));或Thomas D.Brock in Biotechnology:A Textbook of IndustrialMicrobiology,第2版,Sinauer Associates:Sunderland,MA(1989)的描述中找到。用于生长和维持微生物细胞的所有试剂、限制性酶和材料得自Aldrich Chemicals(Milwaukee,WI)、DIFCO Laboratories(Detroit,MI)、New England Biolabs,Inc.(Beverly,MA)、GIBCO/BRL(Gaithersburg,MD)、或Sigma Chemical Company(St.Louis,MO)。通常于37℃下在Luria Bertani(LB)平板上培养大肠杆菌菌株。

一般的分子克隆根据标准方法(Sambrook等人,同上)来完成。DNA序列是在ABI自动测序仪上采用染料终止剂技术(美国专利5,366,860;EP 272,007)使用载体和插入特异性引物的组合来产生的。序列编辑是在Sequencher(Gene Codes Corporation,Ann Arbor,MI)中进行的。所有序列在两个方向上覆盖至少两次。除非另外指明,使用DNASTAR软件(DNASTAR Inc.,Madison,WI)比较本文的基因序列。

缩写的含义如下:“sec”表示秒,“min”表示分钟,“h”表示小时,“d”表示天,“μL”表示微升,“mL”表示毫升,“L”表示升,“μM”表示微摩尔浓度,“mM”表示毫摩尔浓度,“M”表示摩尔浓度,“mmol”表示毫摩尔,“μmole”表示微摩尔,“g”表示克,“μg”表示微克,“ng”表示纳克,“U”表示单位,“bp”表示碱基对,并且“kB”表示千碱基对。

表达盒的命名

表达盒的结构通过简单的记号系统“X::Y::Z”表示,其中X描述启动子片段,Y描述基因片段而Z描述终止子片段,它们均彼此可操作地连接。

解脂耶氏酵母的转化和培养

解脂耶氏酵母菌株ATCC#20362购自美国典型培养物保藏中心(Rockville,MD)。解脂耶氏酵母菌株通常是在根据下面所示配方的数种培养基中于28-30℃下培育。根据标准方法,按需要通过将20g/L琼脂添加到每种液体培养基中来制备琼脂平板。

YPD琼脂培养基(每升):10g酵母提取物[Difco]、20g细菌用蛋白胨[Difco]、以及20g葡萄糖。

基本培养基(MM)(每升):20g葡萄糖、1.7g无氨基酸酵母氮源、1.0g脯氨酸,并且pH6.1(不需要调节)。

基本培养基+尿嘧啶(MM+尿嘧啶或MMU)(每升):如上制备MM培养基并加入0.1g尿嘧啶和0.1g尿苷。

基本培养基+尿嘧啶+磺酰脲类(MMU+SU)(每升):如上制备MMU培养基并加入280mg磺酰脲类。

基本培养基+亮氨酸+赖氨酸(MMLeuLys)(每升):如上制备MM培养基并加入0.1g亮氨酸和0.1g赖氨酸。

基本培养基+5-氟乳清酸(MM+5-FOA)(每升):20a葡萄糖、6.7g酵母氮源、75mg尿嘧啶、75mg尿苷,并且基于对一系列从100mg/L至1000mg/L的浓度的FOA活性试验(因为供应商提供的每批料中会发生改变),选用适量的FOA(Zymo Research Corp.,Orange,CA)。

高葡萄糖培养基(HGM)(每升):80葡萄糖、2.58g KH2PO4和5.36g K2HPO4,pH7.5(不需要调节)。

无酵母提取物的发酵培养基(FM无YE)(每升):6.70g酵母氮源、6.00g KH2PO4,2.00g K2HPO4、1.50g MgSO4*7H2O和20g葡萄糖。

发酵培养基(FM)(每升):如上制备无YE培养基的FM并加入5.00g酵母提取物(BBL)。

合成右旋糖培养基(SD)(每升):6.7g酵母氮源,具有硫酸铵并且无氨基酸;和20g葡萄糖。

Complete Minimal Glucose Broth Minus Uracil(CSM-Ura):目录号

C8140,Teknova,Hollister,CA(0.13%氨基酸缺陷型粉末,无尿嘧啶。0.17%酵母氮源,0.5%(NH4)2SO4,2.0%葡萄糖)。

解脂耶氏酵母的转化根据Chen,D.C.等人(Appl.MicrobiolBiotechnol.,48(2):232-235(1997))的方法完成,除非另外说明。简而言之,将耶氏酵母划线到YPD平板上,并在30℃下生长大约18小时。从平板上刮掉几大环量的细胞并将其重悬浮于含有下面成分的lmL转化缓冲液中:2.25mL 50%PEG,平均分子量为3350;0.125mL 2M醋酸锂,pH6.0;以及0.125mL 2M DTT。然后,将大约500ng线性化的质粒DNA在100μL重悬浮的细胞中孵育,并将其在39℃下维持1小时,每间隔15分钟进行涡旋混合。将细胞铺在选择培养基平板上并在30℃下维持2至3天。

解脂耶氏酵母的脂肪酸分析

为了进行脂肪酸分析,将细胞通过离心收集并如Bligh,E.G.&Dyer,W.J.(Can.J.Biochem.Physiol.,37:911-917(1959))中所述提取脂质。通过将脂质提取物与甲醇钠进行酯交换反应而制备脂肪酸甲酯[“FAME”(Roughan,G.和Nishida I.,Arch Biochem Biophys.,276(1):38-46(1990))并随后将其用配有30m×0.25mm(内径)HP-INNOWAX(Hewlett-Packard)柱的Hewlett-Packard 6890气相色谱仪(GC)进行分析。炉温以3.5℃/分钟从170℃(保持25分钟)升到185℃。

为了进行直接的碱催化酯交换反应,收获耶氏酵母培养物(3mL),在蒸馏水中洗涤一次,并在Speed-Vac中在真空下干燥5-10分钟。将甲醇钠(100μL,浓度为1%)加入样本中,然后将样本涡旋振荡20分钟。在加入3滴1M氯化钠和400μL己烷后,涡旋并离心样本。移出上层并如上所述用GC进行分析。

实施例1

产生解脂耶氏酵母菌株Y4086以通过Δ9延伸酶/Δ8去饱和酶途径生产占总脂质约14%的EPA

本实施例描述了来源于解脂耶氏酵母ATCC#20362的菌株Y4086的构建,该菌株能通过Δ9延伸酶/Δ8去饱和酶途径的表达生产相对于总脂质而言约14%的EPA(图3A)。

菌株Y4086的产生需要构建菌株Y2224(由野生型耶氏酵母菌株ATCC#20362的Ura3基因自主突变而产生的FOA抗性突变体)、菌株Y4001(产生17%EDA,具有Leu-表型)、菌株Y4001U(Leu-和Ura表型)、菌株Y4036(产生18%DGLA,具有Leu-表型)、菌株Y4036U(具有Leu-和Ura-表型)和菌株Y4070(产生12%ARA,具有Ura-表型)。关于构建菌株Y2224、Y4001、Y4001U、Y4036、Y4036U和Y4070的更多细节描述于实施例7,国际申请公布WO 2008/073367。

相对于野生型解脂耶氏酵母ATCC#20362,菌株Y4070的最终基因型是Ura3-、unknown 1-、unknown 3-、Leu+、Lys+、GPD::FmD12::Pex20、YAT1::FmD12::OCT、YAT1::ME3S::Pex16、GPAT::EgD9e::Lip2、EXP1::EgD9eS::Lip1、FBAINm::EgD9eS::Lip2、FBAINm::EgD8M::Pex20、EXP1::EgD8M::Pex16、FBAIN::EgD5::Aco、EXP1::EgD5S::Pex20、YAT1::RD5S::OCT(其中FmD12是串珠镰刀菌Δ12去饱和酶基因[国际申请公布WO 2005/047485];ME3S是经密码子优化的C16/18延伸酶基因,来源于高山被孢霉[国际申请公布WO 2007/046817];EgD9e是小眼虫Δ9延伸酶基因[国际申请公布WO 2007/061742];EgD9eS是经密码子优化的Δ9延伸酶基因,来源于小眼虫[国际申请公布WO 2007/061742];EgD8M是合成突变型Δ8去饱和酶[国际申请公布WO 2008/073271],来源于小眼虫[美国专利7,256,033];EgD5是小眼虫Δ5去饱和酶[美国专利申请公布US 2007-0292924-A1];EgD5S是经密码子优化的Δ5去饱和酶基因,来源于小眼虫[美国专利申请公布2007-0292924];以及RD5S是经密码子优化的Δ5去饱和酶,来源于多甲藻属CCMP626[美国专利申请公布2007-0271632])。

产生菌株Y4086以生产占总脂质约14%的EPA

构建体pZP3-Pa777U(图3B;SEQ ID NO:28)描述于表19,国际申请公布WO 2008/07336,它被生成以将三个Δ17去饱和酶基因整合进菌株Y4070的Pox3位点中(GenBank保藏号AJ001301),从而生成EPA。Δ17去饱和酶基因是PaD17,一种瓜果腐霉菌Δ17去饱和酶(国际申请公布WO 2008/054565),和PaD17S,一种经密码子优化的Δ17去饱和酶,来源于瓜果腐霉菌(国际申请公布WO 2008/054565)。

将pZP3-Pa777U质粒用AscI/SphI消化,然后根据“一般方法”将其用于转化菌株Y4070。将转化细胞铺在MM平板上并在30℃下维持2至3天。将单菌落再次划线至MM平板上,随后将其在30℃下接种至液体MMLeuLys中并以250rpm/min摇动2天。离心收集细胞,提取脂质,通过酯交换反应来制备FAME,并随后用Hewlett-Packard 6890GC进行分析。

GC分析显示,EPA存在于含有pZP3-Pa777U的3种嵌合基因的转化体中,但不存在于亲本Y4070菌株中。所选的96个菌株中大部分产生占总脂质约10-13%的EPA。有2个菌株(即#58和#79)产生了占总脂质约14.2%和13.8%的EPA。将这两个菌株分别命名为Y4085和Y4086。

相对于野生型解脂耶氏酵母ATCC#20362,菌株Y4086的最终基因型是Ura3+、Leu+、Lys+、unknown 1-、unknown 2-、YALI0F24167g-、GPD::FmD12::Pex20、YAT1::FmD12::OCT、YAT1::ME3S::Pex16、GPAT::EgD9e::Lip2、EXP1::EgD9eS::Lip1、FBAINm::EgD9eS::Lip2、FBAINm::EgD8M::Pex20、EXP 1::EgD8M::Pex16、FBAIN::EgD5::Aco、EXP1::EgD5S::Pex20、YAT1::RD5S::OCT、YAT1::PaD17S::Lip1、EXP1::PaD17::Pex16、FBAINm::PaD17::Aco。

实施例2

产生解脂耶氏酵母菌株Y4128以通过Δ9延伸酶/Δ8去饱和酶途径生产占总脂质约37%的EPA

本实施例描述来源于解脂耶氏酵母ATCC#20362的菌株Y4128的构建,该菌株能够产生相对于总脂质约37.6%的EPA(即,相对于Y4086以总脂肪酸的百分比表示的EPA浓度有大于2倍的提高;图3A)。

菌株Y4128的产生需要构建菌株Y2224、Y4001、Y4001U、Y4036、Y4036U、Y4070和Y4086(如实施例1所述),以及构建菌株Y4086U1(Ura-)。

产生菌株Y4086U1(Ura-)

菌株Y4086U1经由在菌株Y4086的构建体pY117中暂时表达Cre重组酶(图4A;SEQ ID NO:29;描述于国际申请公布WO 2008/073367的表20中)制备Ura-表型。这从基因组释放出LoxP夹着的Ura3基因。突变的耶氏酵母属乙酰羟酸合酶[“AHAS”;E.C.4.1.3.18](即,GenBank保藏号XP501277,包含W497L突变,如SEQ ID NO:27所示;参见国际申请公布WO 2006/052870)在质粒pY117中,赋予其磺酰脲类抗除草剂性(SUR),该抗性用作阳性筛选标记。

根据“一般方法”将质粒pY117用于转化菌株Y4086。在转化后,将细胞置于MMU+SU(280μg/mL磺酰脲类;也称作氯嘧磺隆,E.I.duPont de Nemours & Co.,Inc.,Wilmington,DE)平板上并在30℃下保持2至3天。挑取在MMU+SU平板上生长的SUR单菌落,将其在30℃下划线至YPD液体培养基中并以250rpm/min摇动1天以固化pY117质粒。将生长培养基划线接种在MMU平板上。在30℃下保持两天后,将单克隆再划线接种在MM和MMU平板上。选择可以在MMU平板上生长但不在MM平板上生长的那些菌落。将这些菌株中具有Ura-表型的两个菌株命名为Y4086U1和Y4086U2。

产生菌株Y4128以生产占总脂质约37%的EPA

制备构建体pZP2-2988(图4B;SEQ ID NO:30;描述于表21,国际申请公布WO 2008/073367)以将一个Δ12去饱和酶基因(即,FmD12S,一种经密码子优化的Δ12去饱和酶基因,来源于串珠镰刀菌[国际申请公布WO 2005/047485])、两个Δ8去饱和酶基因(即,EgD8M)和一个Δ9延伸酶基因(即,EgD9eS)整合进菌株Y4086U1的Pox2位点(GenBank保藏号AJ001300)中,从而在较高水平上生产EPA。将pZP2-2988质粒用AscI/SphI消化,然后根据“一般方法”将其用于转化菌株Y4086U1。将转化细胞铺在MM平板上并在30℃下维持2至3天。将单菌落再次划线至MM平板上,随后将其在30℃下接种至液体MMLeuLys中并以250rpm/min摇动2天。通过离心收集细胞,将其重悬浮于HGM中,然后以250rpm/min摇动5天。离心收集细胞,提取脂质,通过酯交换反应来制备FAME,并随后用Hewlett-Packard 6890GC进行分析。

GC分析显示所选择的96个菌株中的大多数生产了占总脂12-15.6%的EPA。有2个菌株(即,Group I中的#37和Group II中的#33)生产占总脂质约37.6%和16.3%的EPA。将这两个菌株分别命名为Y4128和Y4129。

相对于野生型解脂耶氏酵母ATCC#20362的菌株Y4128的最终基因型是:YALI0F24167g-、Pex10-、unknown 1-、unknown 2-、GPD::FmD12::Pex20、YAT1::FmD12::OCT、GPM/FBAIN::FmD12S::OCT、YAT1::ME3S::Pex16、GPAT::EgD9e::Lip2、EXP1::EgD9eS::Lip1、FBAINm::EgD9eS::Lip2、FBA::EgD9eS::Pex20、FBAINm::EgD8M::Pex20、EXP1::EgD8M::Pex16、GPDIN::EgD8M::Lip1、YAT1::EgD8M::Aco、FBAIN::EgD5::Aco、EXP1::EgD5S::Pex20、YAT1::RD5S::OCT、YAT1::PaD17S::Lip1、EXP1::PaD17::Pex16、FBAINm::PaD17::Aco。

在2007年8月23日将解脂耶氏酵母菌株Y4128保藏于美国典型培养物保藏中心,并且命名为ATCC PTA-8614。

产生具有Ura-表型的Y4128U菌株

为了破坏菌株Y4128中的Ura3基因,制备构建体pZKUE3S(图5ASEQ ID NO:31;描述于表22,国际申请公布WO 2008/073367)以将EXP1::ME3S::Pex20嵌合基因整合进菌株Y4128的Ura3基因中。将质粒pZKUE3S用SphI/PacI消化,然后根据“一般方法”将其用于转化菌株Y4128。转化后,将细胞铺至MM+5-FOA选择平板上并在30℃下维持2至3天。

挑取在MM+5-FOA选择平板上生长的总共24个转化体,并且再次划线接种到新MM+5-FOA平板上。从板上剥离细胞,提取脂质,通过酯交换反应来制备FAME,并随后用Hewlett-Packard 6890GC进行分析。

GC分析显示来自平板的具有pZKUE3S的所有转化体中存在10-15%的EPA。鉴定为#3、#4、#10、#12、#19和#21的菌株分别生产占总脂质12.9%、14.4%、15.2%、15.4%、14%和10.9%的EPA,将它们分别命名为Y4128U1、Y4128U2、Y4128U3、Y4128U4、Y4128U5和Y4128U6(统称为Y4128U)。

Y4128(37.6%)对Y4128U(平均13.8%)%EPA定量差异是因为不同的生长条件而产生的。具体地讲,前者的培养基是在液体培养基中生长两天后进行分析的,而后者的培养基是在琼脂平板上生长后进行分析的。申请人已经观察到当比较琼脂平板与液体培养基中的结果时,%EPA提高了2-3倍。因此,虽然不能直接比较结果,但Y4128和Y4128U菌株都证明产生了EPA。

实施例3

测定解脂耶氏酵母菌株Y4128的总脂质含量

通过GC分析法测定菌株Y4128生产的脂质总量和脂质中的每种脂肪酸物质的百分比。具体地讲,如一般方法所述,提取总脂质,通过酯交换反应来制备FAME,并随后用Hewlett-Packard 6890GC进行分析。

干细胞重量如下进行测定:从10mL培养物中经由离心收集细胞,用水洗涤细胞一次以除去残余培养基,在80℃真空炉中干燥细胞过夜,称量干细胞重量。样本中的FAME总量通过比较GC特征图中的所有峰面积与加入的已知量内部标准品C15:0脂肪酸的峰面积而进行测定。

基于上述分析,测定菌株Y4086和Y4128的以干细胞重量百分比形式表示的脂质含量(DCW)和脂质组成。菌株Y4128与菌株Y4086相比脂质含量降低(11.2TFA%DCW对28.6TFA%DCW)。相反地,菌株Y4128与菌株Y4086相比脂质中的EPA浓度提高,如下表6所示。脂肪酸被鉴定为18:0(硬脂酸)、18:1(油酸)、LA、ALA、EDA、DGLA、ETrA、ETA和EPA;脂肪酸组成表示为总脂肪酸的重量百分比(wt.%)(TFA)。

表6

在解脂耶氏酵母菌株Y4086和Y4128中的脂质组成

样本18:018:118:2[LA]  18:3(n-3)[ALA]20:2[EDA]  20:3(n-6)[DGLA]  20:3(n-3)[ETrA]  20:4(n-3)[ETA]  20:5(n-3)[EPA]  Y4086  4.6  26.8  28.0  6.9  7.6  0.9  4.9  2.0  9.8  Y4128  1.8  6.7  19.6  1.8  4.2  3.4  1.5  6.0  42.8

细胞中的EPA含量以mg EPA/g干细胞形式表示,并且按照下式计算:(%EPA/脂质)*(%脂质/干细胞重量)*0.1,其从菌株Y4086中的28mg EPA/g DCW提高到菌株Y4128中的47.9mg EPA/g DCW。

因此,表6中的结果显示与亲本菌株Y4086相比,菌株Y4128具有更低的总脂质含量(TFA%DCW)(11.2%对28.6%),更高的EPA%TFA(42.8%对9.8%),和更高的EPA%DCW(4.8%对2.8%)。此外,菌株Y4128的EPA相对于总PUFA的量提高了3.3倍(54%的PUFA[%TFA]对16.3%的PUFA[%TFA]),而C20PUFA相对于总PUFA的量提高了1.7倍(73%的PUFA[%TFA]对42%的PUFA[%TFA])。

实施例4

测定在解脂耶氏酵母菌株Y4128中的整合位点pZP2-2988发生Pex10整

菌株Y4128中的pZP2-2988基因组整合位点通过基因组步移法,使用来自Clontech(Palo Alto,CA)的Universal GenomeWalkerTM试剂盒,按照制造商推荐的规程进行测定。基因质粒序列,设计以下引物用于基因组步移法:pZP-GW-5-1(SEQ ID NO:32)、pZP-GW-5-2(SEQ IDNO:33)、pZP-GW-5-3(SEQ ID NO:34)、pZP-GW-5-4(SEQ ID NO:35)、pZP-GW-3-1(SEQ ID NO:36)、pZP-GW-3-2(SEQ ID NO:37)、pZP-GW-3-3(SEQ ID NO:38)和pZP-GW-3-4(SEQ ID NO:39)。

使用Qiagen Miniprep试剂盒用改进规程从菌株Y4128中制备基因组DNA。从YPD培养基平板上刮除细胞并置于1.5mL微管中。将细胞沉淀物(100μL)用250μL缓冲液P1重悬,该缓冲液P1包含0.125M β-巯基乙醇和1mg/mL酵母裂解酶20T(MP Biomedicals,Inc.,Solon,OH)。细胞悬浮液在37℃下培养30分钟。然后将缓冲液P2(250μL)加到管中。在将管颠倒几次进行混合后,加入350μL缓冲液N3。然后将微管中的混合物在14,000rpm下离心5分钟。将上清液注入Qiagen小量制备离心柱中,离心1分钟。加入0.75mL缓冲液PE洗涤一次柱子,然后在14,000rpm下离心1分钟。在14,000rpm下再离心1分钟干燥该柱。通过加入50μL的缓冲液EB到柱中洗脱基因组DNA,允许静置1分钟并在14,000rpm下离心1分钟。

使用纯化的基因组DNA进行基因组步移法。按照GenomeWalker试剂盒的规程,用限制性酶DraI、EcoRV、PvuII和StuI分别消化DNA。就每次消化而言,反应混合物包含10μL 10X限制缓冲液、10μL适用的限制性酶和8μg基因组DNA,总体积为100μL。反应混合物在37℃下培养4小时。然后使用Qiagen PCR纯化试剂盒,严格按照制造商规程纯化经消化的DNA样本。DNA样本用16μL水洗脱。然后将纯化的经消化基因组DNA样本连接到genome walker衔接子上(下文)。每个连接混合物包含1.9μL genome walker衔接子、1.6μL 10X连接缓冲液、0.5μL T4DNA连接酶和4μL消化过的DNA。反应混合物在16℃下培养过夜。然后将72μL的50mM TrisHCl、1mM EDTA,pH7.5加入到每个连接混合物中。

就5′末端基因组步移法而言,使用1μL的每个连接混合物作模板进行四个PCR反应。此外,每个反应混合物包含1μL的10μM引物pZP-GW-5-1(SEQ ID NO:32)、1μL的10μM试剂盒配送的GenomeWalker衔接子、41μL水、5μL 10X cDNA PCR反应缓冲液和1μL来自Clontech的Advantage cDNA聚合酶混合物。Genome Walker衔接子序列(SEQ ID NOs:40[顶链]和41[底链])显示如下:

5′-GTAATACGACTCACTATAGGGCACGCGTGGTCGACGGCCCG

GGCTGGT-3′

3′-H2N-CCCGACCA-5′

PCR条件如下:95℃1分钟,随后是30个95℃20秒和68℃3分钟的循环,最后在68℃下延伸7分钟。将PCR产物每个进行1:100的稀释,并且将1μL稀释PCR产物用作模板进行第二轮PCR。条件是完全相同的,除了用pZP-GW-5-2(SEQ ID NO:33)代替pZP-GW-5-1(SEQ IDNO:32)。

就3′-末端基因组步移而言,如上文所述进行四个PCR反应,除了使用引物pZP-GW-3-1(SEQ ID NO:36)和巢式衔接子引物(SEQ IDNO:42)。PCR产物同样进行稀释并用作第二轮PCR的模板,使用pZP-GW-3-2(SEQ ID NO:37)代替pZP-GW-3-1(SEQ ID NO:36)。

通过凝胶电泳分析PCR产物。使用EcoRV消化的基因组DNA作为模板和引物pZP-GW-3-2以及巢式衔接子引物,一个反应产物生成~1.6kB的片段。分离该片段,用Qiagen凝胶纯化试剂盒纯化并克隆到pCR2.1-TOPO中。序列分析显示该片段包括两部分:质粒pZP2-2988耶氏酵母属来自染色体C的基因组DNA。它们在染色体C的核苷酸位点139826上接合。这是位于Pex10基因的编码区内部(GenBank保藏号CAG81606;SEQ ID NO:10)。

为了测定接合的5′末端,使用来自菌株Y4128的基因组DNA作为模板以及引物Per10F1(SEQ ID NO:43)和ZPGW-5-5(SEQ ID NO:44)进行PCR扩增。反应混合物包括1μL的每个均为20μM的引物、1μL基因组DNA、22μL水和25μL TaKaRa ExTaq 2X预混物(TaKaRa BioInc.,Otsu Shiga,Japan)。热循环仪条件是:94℃1分钟,然后为30个94℃20秒、55℃20秒和72℃2分钟的循环,之后在72℃下进行7分钟最终延伸反应。扩增了1.6kB的DNA片段并将其克隆到pCR2.1-TOPO中。序列分析显示它是一个嵌合片段,该片段位于耶氏酵母属来自染色体C的基因组DNA和pZP2-2988之间。接合位于染色体C的核苷酸位点139817。因此,染色体C的10个核苷酸的片段被来自菌株Y4128中的pZP2-2988(图4B)AscI/SphI片段置换。因此,菌株Y4128中的Pex10缺少编码蛋白的最后32个氨基酸。

基于上述结论,实施例2中分离的Y4128U菌株2(同上)后来称为Δpex10菌株。为清楚起见,菌株Y4128U1等同于菌株Y4128U1(Δpex10)。

实施例5

在解脂耶氏酵母菌株Y4128U1(Δpex10)中的Pex10质粒表达

构建递送解脂耶氏酵母Pex10基因的三个质粒:1)pFBAIn-PEX10允许Pex10 ORF在FBAINm启动子控制下表达;和2)pPEX10-1和pPEX10-2允许在天然Pex10启动子控制下表达Pex10,虽然pPEX10-1使用较短版本(~500bp)的启动子而pPEX10-2使用较长版本(~900bp)的启动子。在构建这些表达质粒并转化后,测定Pex10质粒表达对解脂耶氏酵母菌株Y4128U1(Δpex10)总油含量和EPA含量的效应。缺失Pex10导致细胞中以TFA百分比形式表示的EPA的量提高,但是以DCW百分比形式表示的总脂质的量降低。

构建pFBAIn-PEX10、pPEX10-1和pPEX10-2

为了构建pFBAIn-PEX10,使用引物Per10F1(SEQ ID NO:43)和Per10R(SEQ ID NO:45),使用解脂耶氏酵母基因组DNA作为模板扩增Pex10基因的编码区。PCR反应混合物包含1μL每个均为20μM的引物、1μL解脂耶氏酵母基因组DNA(~100ng)、25μL ExTaq 2X预混物和22μL水。反应如下进行:94℃1分钟,然后为30个94℃20秒、55℃20秒和72℃90秒的循环,之后在72℃下进行7分钟最终延伸反应。PCR产物是一个1168bp的DNA片段,它用Qiagen PCR纯化试剂盒进行纯化,用NcoI和NotI消化,并克隆到用相同的两个限制性酶消化的pFBAIn-MOD-1(SEQ ID NO:46;图5B)中。

8个单克隆进行序列分析,2个具有无错的正确Pex10序列。pFBAIn-PEX10(SEQ ID NO:47;图6A)组分在下表7中列出。

表7

质粒pFBAIn-PEX10(SEQ ID NO:47)的组分

  SEQ ID NO:47内的RE位点和核苷酸  片段和嵌合基因组分的描述  BglII-BsiWI(6040-318)  FBAINm::Pex10::Pex20,它包含:●FBAINm:解脂耶氏酵母FBAINm启动子(美国专利7,202,356);●Pex10:解脂耶氏酵母Pex10ORF(GenBank保藏号AB036770,核苷酸1038-2171;SEQ ID NO:21);●Pex20:来自耶氏酵母属Pex20基因(GenBank保藏号AF054613)的Pex20终止子序列

  SEQ ID NO:47内的RE位点和核苷酸  片段和嵌合基因组分的描述  PacI-BglII(4530-6040)  耶氏酵母属URA3(GenBank保藏号AJ306421)  (3123-4487)  耶氏酵母属自主复制序列18(ARS18;GenBank保藏号A17608)  (2464-2864)  大肠杆菌f1复制起点  (1424-2284)  用于在大肠杆菌中选择的氨苄青霉素抗性基因(AmpR)  (474-1354)  ColE1质粒复制起点

为了构建pPEX10-1和pPEX10-2,设计并合成引物PEx10-R-BsiWI(SEQ ID NO:48)、PEX10-F1-SalI(SEQ ID NO:49)和PEX10-F2-SalI(SEQ ID NO:50)。使用基因组解脂耶氏酵母DNA以及引物PEX10-R-BsiWI和PEX10-F1-SalI进行的PCR扩增生成1873bp的片段,该片段包含Pex10 ORF,Pex10基因的500bp的5′上游区域和215bp的3′下游区域,该基因的两端侧接SalI和BsiWI限制性位点。该片段用Qiagen PCR纯化试剂盒进行纯化,用SalI和BsiWI消化,并克隆到用相同的两个酶消化的pEXP-MOD-1(SEQ ID NO:51;图6B)中以生成pPEX10-1(SEQ ID NO:52;图7A)。质粒pEXP-MOD1类似于pFBAIn-MOD-1(SEQ ID NO:46;图5B),除了后者的FBAINm启动子被EXP1启动子置换。表8列出pPEX10-1的组分。

表8

质粒pPEX10-1(SEQ ID NO:52)的组分

  SEQ ID NO:52中的RE位点和核苷酸  片段和嵌合基因组分的描述  SalI-BsiWI(5705-1)  Pex10-5′::Pex10::Pex10-3′,它包含:●Pex10-5′:解脂耶氏酵母Pex10基因的500bp的5′启动子区域;●Pex10:解脂耶氏酵母Pex10ORF(GenBank保藏号AB036770,核苷酸1038-2171;SEQ ID NO:21);●Pex10-3′:来自耶氏酵母属Pex10基因的215bp的Pex10终止子序列(GenBank保藏号AB036770)[注意图中的整个Pex10-5′::Pex10::Pex10-3′表达盒统一标记成“PEX10”]

  SEQ ID NO:52中的RE位点和核苷酸  片段和嵌合基因组分的描述  PacI-SalI(4216-5703)  耶氏酵母属URA3基因(GenBank保藏号AJ306421)  (2806-4170)  耶氏酵母属自主复制序列18(ARS18;GenBank保藏号A17608)  (2147-2547)  大肠杆菌f1复制起点  (1107-1967)  用于在大肠杆菌中选择的氨苄青霉素抗性基因(AmpR)  (157-1037)  ColE1质粒复制起点

使用PEX10-R-BsiWI(SEQ ID NO:48)和PEX10-F2-SalI(SEQ IDNO:50)对解脂耶氏酵母基因组DNA进行PCR扩增生成2365bp的片段,该片段包含Pex10ORF,Pex10基因的991bp的5′上游区域和215bp的3′下游区域,该基因的两端侧接SalI和BsiWI限制性位点。用Qiagen PCR纯化试剂盒纯化该片段,用SalI和BsiWI进行消化,然后将其克隆到进行了相似消化的pEXP-MOD-1中。这导致合成pPEX10-2(SEQ IDNO:53),其构建类似于质粒pPEX10-1的构建(表8,同上),除了在嵌合Pex10-5′::Pex10::Pex10-3′基因中有更长的Pex10-5′启动子。

在菌株Y4128U1(Δpex10)中表达Pex10

按照一般方法中的规程将质粒pFBAIN-MOD-1(对照物;SEQ IDNO:46)、pFBAIn-PEX10(SEQ ID NO:47)、pPEX10-1(SEQ ID NO:52)和pPEX10-2(SEQ ID NO:53)转化到Y4128U1(Δpex10)中。将转化体置于MM平板上。递送上述质粒的转化体总脂质含量和脂肪酸组成按照实施例3所述进行分析。

下表9显示以干细胞重量(DCW)百分比表示的脂质含量和脂质组成。具体地讲,将脂肪酸鉴定为18:0(硬脂酸)、18:1(油酸)、LA、ALA、EDA、DGLA、ETrA、ETA和EPA;脂肪酸组成表示为总脂肪酸的重量百分比(wt.%)。

表9中的结果显示在Y4128U1(Δpex10)中从天然解脂耶氏酵母Pex10启动子或从解脂耶氏酵母FBAINm启动子表达Pex10,将EPA百分比降低回Y4086的水平,同时将总脂质含量(TFA%DCW)提高到Y4086的水平(参见表6数据用于比较)。每克干细胞的EPA含量从对照样本中(即,递送pFBAIn-MOD-1的细胞)的63.2mg变成递送pFBAIn-PEX10的细胞中的31.5mg、递送pPEX10-1的细胞中的29mg以及递送pPEX10-2的细胞中的30.8mg。这些结果证明破坏Pex10的环指结构域提高了细胞中的EPA的量但降低细胞中的总脂质含量。

因此,表9的结果显示与具有对照质粒的Y4128U1(Δpex10)转化体相比,所有具有Pex10表达质粒的转化体显示更高的脂质含量(TFA%DCW)(>27%对22.8%)、更低的EPA%TFA(大约10.8%对27.7%)、和更低的EPA%DCW(<3.1%对6.3%)。此外,具有对照质粒的菌株Y4128U1(Δpex10)转化体与那些具有Pex10表达质粒的转化体相比,EPA相对于总PUFA的量提高了2.5倍(44%的PUFA[%TFA]对17.5%(平均值)的PUFA[%TFA]),C20PUFA相对于总PUFA的量提高了1.5倍(67%的PUFA[%TFA]对44%(平均值)的PUFA[%TFA])。

实施例6

生成Y4184U菌株用于生产EPA

解脂耶氏酵母菌株Y4184U用作实施例7中的宿主,下文菌株Y4184U来源于解脂耶氏酵母ATCC#20362,并且能够经由Δ9延伸酶/Δ8去饱和酶途径的表达生产EPA。该菌株具有Ura-表型并且其构建如实施例7所述,国际申请公布WO 2008/073367。

然而概括地说,菌株Y4184U的产生需要构建菌株Y2224、菌株Y4001、菌株Y4001U、菌株Y4036、菌株Y4036U和菌株Y4069(如上文实施例1所述)。进一步产生菌株Y4184U(在图7B用图表表示)需要生成菌株Y4084、菌株Y4084U1、菌株Y4127(在2007年11月29日保藏于美国典型培养物保藏中心,保藏号ATCC PTA-8802)、菌株Y4127U2、菌株Y4158、菌株Y4158U1和菌株Y4184。质粒构建体pZKL1-2SP98C用于转化菌株Y4127U2,在图8A中用图表表示(SEQ IDNO:54;描述于表23,国际申请公布WO 2008/073367)。质粒pZKL2-5U89GC用于转化菌株Y4158U1,在图8B中显示(SEQ IDNO:55;描述于表24,国际申请公布WO 2008/073367)。

相对于野生型解脂耶氏酵母ATCC#20362的菌株Y4184(生产占总脂质31%的EPA)的最终基因型是unknown 1-、unknown 2-、unknown 4-、unknown 5-、unknown 6-、unknown 7-、YAT1::ME3S::Pex16、EXP1::ME3S::Pex20(2拷贝)、GPAT::EgD9e::Lip2、FBAINm::EgD9eS::Lip2、EXP1::EgD9eS::Lip1、FBA::EgD9eS::Pex20、YAT1::EgD9eS::Lip2、GPD::EgD9eS::Lip2、GPDIN::EgD8M::Lip1、YAT 1::EgD8M::Aco、EXP1::EgD8M::Pex16、FBAINm::EgD8M::Pex20、FBAIN::EgD8M::Lip1(2拷贝)、GPM/FBAIN::FmD 12S::Oct、EXP1::FmD12S::Aco、YAT1::FmD12::Oct、GPD::FmD12::Pex20、EXP1::EgD5S::Pex20、YAT1::EgD5S::Aco、YAT1::Rd5S::Oct、FBAIN::EgD5::Aco、FBAINm::PaD17::Aco、EXP1::PaD17::Pex16、YAT1::PaD17S::Lip1、YAT1::Y1CPT1::Aco、GPD::YlCPT1::Aco(其中FmD12是串珠镰刀菌Δ12去饱和酶基因[国际申请公布WO2005/047485];FmD12S是经密码子优化的Δ12去饱和酶基因,来源于串珠镰刀菌[国际申请公布WO 2005/047485];ME3S是经密码子优化的C16/18延伸酶基因,来源于高山被孢霉[国际申请公布WO 2007/046817];EgD9e是小眼虫Δ9延伸酶基因[国际申请公布WO 2007/061742];EgD9eS是经密码子优化的Δ9延伸酶基因,来源于小眼虫[国际申请公布WO 2007/061742];EgD8M是合成突变型Δ8去饱和酶[国际申请公布WO 2008/073271],来源于小眼虫[美国专利7,256,033];EgD5是小眼虫Δ5去饱和酶[美国专利申请公布US 2007-0292924-A1];EgD5S是经密码子优化的Δ5去饱和酶基因,来源于小眼虫[美国专利申请公布2007-0292924];RD5S是经密码子优化的Δ5去饱和酶,来源于多甲藻属CCMP626[美国专利申请公布2007-0271632];PaD17是瓜果腐霉菌Δ17去饱和酶[国际申请公布WO 2008/054565];PaD17S是一种经密码子优化的Δ17去饱和酶,来源于瓜果腐霉菌[国际申请公布WO2008/054565];和YlCPT1是一种解脂耶氏酵母二酰基甘油胆碱磷酸转移酶基因[国际申请公布WO 2006/052870])。

为了破坏菌株Y4184中的Ura3基因,构建体pZKUE3S(图5A SEQID NO:31;描述于表22,国际申请公布WO 2008/073367)用于将EXP1::ME3S::Pex20嵌合基因整合进菌株Y4184的Ura3基因中以分别产生菌株Y4184U1(占总脂质11.2%的EPA)、Y4184U2(占总脂质10.6%的EPA)和Y4184U4(占总脂质15.5%的EPA)(统称为Y4184U)。

实施例7

解脂耶氏酵母菌株Y4184U4中的Pex10染色体缺失提高了EPA的积聚和总脂质含量

构建体pYPS161(图9A,SEQ ID NO:56)用于从生产EPA的耶氏酵母属菌株Y4184U4中敲除染色体Pex10基因(实施例6)。用Pex10敲除构建体转化解脂耶氏酵母菌株Y4184U4导致生成菌株Y4184(Δpex10)。测定并比较Pex10敲除对总油量和EPA含量的效应。具体地讲,敲除Pex10导致细胞中EPA(%TFA%DCW)百分比提高以及总脂质含量提高。

构建体pYSP161

构建体pYPS161包含以下组分:

表10

质粒pYPS161(SEQ ID NO:56)的描述

  SEQ ID NO:56中的RE位点和核苷酸  片段和嵌合基因组分的描述  AscI/BsiW I(1521-157)  耶氏酵母属Pex10基因的1364bp的Pex10敲除片段#1(GenBank保藏号AB036770)  PacI/SphI(5519-4229)  耶氏酵母属Pex10基因的1290bp的Pex10敲除片段#2(GenBank保藏号AB036770)  SalI/EcoRI(7170-5551)  耶氏酵母属URA3基因(GenBank保藏号AJ306421)  2451-1571  ColE1质粒复制起点

  SEQ ID NO:56中的RE位点和核苷酸  片段和嵌合基因组分的描述  3369-2509  用于在大肠杆菌中选择的氨苄青霉素抗性基因(AmpR)  3977-3577  大肠杆菌f1复制起点

生成解脂耶氏酵母基因敲除菌株Y4184(ΔPex10)

用于转化解脂耶氏酵母菌株Y4184U4(实施例6)的标准规程使用Pex10敲除构建体pYPS161的纯化5.3kB AscI/SphI片段(同上),并且还制备了细胞单独对照。在每个转化实验中有大约200至250个菌落存在,然而在细胞单独平板上无菌落存在(每期望值)。

菌落PCR用于筛选具有Pex10缺失的细胞。具体地讲,PCR反应使用MasterAmp Taq聚合酶(Epicentre Technologies,Madison,WI),使用PCR引物Pex-10del1 3′.正向(SEQ ID NO:57)和Pex-10del2 5′.反向(SEQ ID NO:58),按照标准规程进行。PCR反应条件为94℃5分钟,然后30个94℃30秒、60℃30秒和72℃2分钟的循环,之后在72℃下进行6分钟的最终延伸反应。然后将该反应保持在4℃下。如果Pex10基因敲除构建体在Pex10区域整合,期望生成长度为2.8KB的单一PCR产物。相反地,如果该菌株在除Pex10区域之外的染色体区域内整合Pex10基因敲除构建体,则将生成两个PCR片段,即2.8kB和1.1kB的片段。在288个筛选的菌落中,大部分菌落具有在随机位点整合的Pex10基因敲除构建体。288个菌落中仅有一个菌落包含Pex10敲除。将该菌株命名为Y4184(Δpex10)。

评估解脂耶氏酵母菌株Y4184和Y4184(ΔPex10)的总油和EPA产量

为了评估Pex10基因敲除对总脂质级分中的PUFA百分比和细胞中的总脂质含量的效应,菌株Y4184和Y4184(Δpex10)在可比较的含油条件下生长。具体地讲,培养物在初始OD600为~0.1的情况下开始生长,在含有25mL发酵培养基(FM)或无酵母提取物(FM无YE)的FM培养基的250mL烧瓶中生长48小时。在50mL圆锥管中,以8000rpm离心10分钟收获细胞。弃去上清液,将细胞重悬于25mL HGM中并转移到新的250mL烧瓶中。细胞在30℃下透气培养另外120小时。

为了测定干细胞重量(DCW),处理来自5mL FM生长培养基和10mL无YE生长培养物的FM的细胞。培养的细胞在4300rpm下离心10分钟。使用10mL生理盐水重悬沉淀物并在相同条件下二次离心。然后用1mL无菌H2O(第三次)重悬沉淀物,将其转移到预先称重的铝盘中。细胞在80℃真空炉中干燥过夜。测量细胞重量。

递送上述质粒的转化体的总脂质含量和脂肪酸组成如实施例3所述分析。DCW、总脂质含量(TFA%DCW)、总EPA%TFA、和EPA%DCW在下表11中显示。

表11

在解脂耶氏酵母菌株Y4184和Y4184中的脂质组成(ΔPex10)

表11中的结果显示敲除Y4184(ΔPex10)中的染色体Pex10基因与菌株Y4184中的EPA百分比和总油含量相比提高EPA百分比(%TFA和%DCW)并提高总油含量,菌株Y4184的天然Pex10p未被敲除。更具体地讲,在FM培养基中,EPA(%TFA)有约109%的提高,EPA产量(%DCW)有约216%的提高,总油量(TFA%DCW)有约49%的提高。在无YE的FM培养基中,EPA(%TFA)有约100%的提高,EPA产量(%DCW)有约205%的提高,总油量(TFA%DCW)有约50%的提高。

因此,表11中的结果显示与亲本菌株Y4184相比,Y4184(ΔPex10)菌株在FM培养基中具有更高的脂质含量(TFA%DCW)(17.6%对11.8%),更高的EPA%TFA(43.2%对20.6%),和更高的EPA%DCW(7.6%对2.4%)。同样的,与亲本菌株Y4184相比,Y4184(ΔPex10)菌株在无YE的FM培养基中具有更高的脂质含量(TFA%DCW)(13.2%对8.8%),更高的EPA%TFA(46.1%对23.2%),和更高的EPA%DCW(6.1%对2.0%)。

实施例8(预测的)

在解脂耶氏酵母的PUFA生产菌株中的替代Pex基因的染色体敲除

本实施例描述了已经进行了工程化以生产ω-3/ω-6PUFA的解脂耶氏酵母的多个菌株。如果使用实施例7的方法同上破坏编码Pex1p、Pex2p、Pex3p、Pex3Bp、Pex4p、Pex5p、Pex6p、Pex7p、Pex8p、Pex12p、Pex13p、Pex14p、Pex16p、Pex17p、Pex19p、Pex20p、Pex22p或Pex26p的染色体基因,预期这些解脂耶氏酵母宿主菌株中的任何一种都能进行工程化以生产在总脂质级分和油级分中含量提高的ω-3/ω-6PUFA。

更具体地讲,申请人的受让人已经工程化了多种解脂耶氏酵母菌株,经由表达异源Δ6去饱和酶/Δ6延伸酶PUFA途径或异源Δ9延伸酶/Δ8去饱和酶PUFA途径来生产高浓度的多种ω-3/.ω-6PUFA。

生产ω-3/ω-6PUFA的代表性解脂耶氏酵母菌株概述

虽然在下表中概述了一些代表性菌株,但公开的生产ω-3/ω-6PUFA的解脂耶氏酵母菌株不受本文菌株的任何方式的限制。相反地,除了以下共有的和共同未决的专利申请之外,在本专利申请中提供的所有教导对于开发合适的工程化解脂耶氏酵母菌株以生产ω-3/ω-6PUFA也是有用的。这些教导具体地讲包括以下申请人的受让人的共同未决的专利和专利申请:美国专利7,125,672、美国专利7,189,559、美国专利7,192,762、美国专利7,198,937、美国专利7,202,356、美国专利7,214,491、美国专利7,238,482、美国专利7,256,033、美国专利7,259,255、美国专利7,264,949、美国专利7,267,976、美国专利7,273,746、美国专利申请10/985254和10/985691(提交于2004年11月10日)、美国专利申请11/183664(提交于2005年7月18日)、美国专利申请11/185301(提交于2005年7月20日)、美国专利申请11/190750(提交于2005年7月27日)、美国专利申请11/198975(提交于2005年8月8日)、美国专利申请11/253882(提交于2005年10月19日)、美国专利申请11/264784和11/264737(提交于2005年11月1日)、美国专利申请11/265761(提交于2005年11月2日)、美国专利申请11/601563和11/601564(提交于2006年11月16日)、美国专利申请11/635258(提交于2006年12月7日)、美国专利申请11/613420(提交于2006年12月20日)、美国专利申请11/787772(提交于2007年4月18日)、美国专利申请11/737772(提交于2007年4月20日)、美国专利申请11/740298(提交于2007年4月26日)、美国专利申请12/111237(提交于2008年4月29日)、美国专利申请11/748629和11/748637(提交于2007年5月15日)、美国专利申请11/779915(提交于2007年7月19日)、美国专利申请60/991266(提交于2007年11月30日)、美国专利申请11/952243(提交于2007年12月7日)、美国专利申请61/041716(提交于2008年4月2日)、美国专利申请12/061738(提交于2008年4月3日)、美国专利申请12/099811(提交于2008年4月9日)、美国专利申请12/102879(提交于2008年4月15日)、美国专利申请12/111237(提交于2008年4月29日)、美国专利申请61/055511(提交于2008年5月23日)和美国专利申请61/093007(提交于2008年8月29日)。

Pex基因的染色体敲除

在选择优选解脂耶氏酵母菌株生产期望的ω-3/ω-6PUFA(或它们的PUFA组合)后,本领域的技术人员能够容易地工程化合适的基因敲除构建体(类似于在实施例7中的pYPS161)以使得染色体Pex敲除基因通过转化进入解脂耶氏酵母菌株。优选的Pex基因将包括:YlPex1p(GenBank保藏号CAG82178;SEQ ID NO:1)、YlPex2p(GenBank保藏号CAG77647;SEQ ID NO:2)、YlPex3p(GenBank保藏号CAG78565;SEQ ID NO:3)、YlPex3Bp(GenBank保藏号CAG83356;SEQ ID NO:4)、YlPex4p(GenBank保藏号CAG79130;SEQ ID NO:5)、YlPex5p(GenBank保藏号CAG78803;SEQ ID NO:6)、YlPex6p(GenBank保藏号CAG82306;SEQ ID NO:7)、YlPex7p(GenBank保藏号CAG78389;SEQ ID NO:8)、YlPex8p(GenBank保藏号CAG80447;SEQ ID NO:9)、YlPex12p(GenBank保藏号CAG81532;SEQ ID NO:11)、YlPex13p(GenBank保藏号CAG81789;SEQ ID NO:12)、YlPex14p(GenBank保藏号CAG79323;SEQ ID NO:13)、YlPex16p(GenBank保藏号CAG79622;SEQ ID NO:14)、YlPex17p(GenBank保藏号CAG84025;SEQ ID NO:15)、YlPex19p(GenBank保藏号AAK84827;SEQ ID NO:16)、YlPex20p(GenBank保藏号CAG79226;SEQ ID NO:17)、YlPex22p(GenBank保藏号CAG77876;SEQ ID NO:18)和YlPex26p(GenBank保藏号NC_006072,反义翻译核苷酸117230-118387;SEQ ID NO:19)。

期望的是染色体破坏Pex基因将导致与天然过氧化物酶体生物合成因子蛋白未被破坏的真核生物相比,在总脂质级分和油级分中积聚的以总脂肪酸百分比形式表示的PUFA量增加,其中所述PUFA量可能是:1)以功能性PUFA生物合成途径期望的终产品形式产生的PUFA,与以中间体或副产品形式产生的PUFA相反,2)C20和C22PUFA,和/或3)总PUFA。优选的结果是与天然过氧化物酶体生物合成因子蛋白未被破坏的真核生物相比,不但以总脂肪酸百分比表示的PUFA量提高,而且以干细胞重量百分比形式表示的PUFA量也提高。此外,PUFA量可能是:1)以功能性PUFA生物合成途径期望的终产品形式产生的PUFA,与以中间体或副产品形式产生的PUFA相反,2)C20和C22PUFA,和/或3)总PUFA。在一些情况下,相对于未破坏天然过氧化物酶体生物合成因子蛋白的真核生物,总脂质含量也提高。

实施例9

在解脂耶氏酵母菌株Y4036U中的Pex16染色体缺失提高了积聚的DGLA百分比

本实施例描述使用构建体pYRH13(图9B;SEQ ID NO:59)敲除DGLA生产耶氏酵母属菌株Y4036U(实施例1)中的染色体Pex16基因。用Pex16敲除构建体转化解脂耶氏酵母菌株Y4036U导致生成菌株Y4036U(Dpex16)。测定并比较Pex16敲除对DGLA含量的效应。具体地讲,敲除Pex16导致细胞中以总脂肪酸百分比形式存在的DGLA百分比提高。

构建体pYRH13

质粒pYRH13来源于质粒pYPS161(图9A,SEQ ID NO:56;实施例7)。具体地讲,解脂耶氏酵母Pex16基因(GenBank保藏号CAG79622)的1982bp的5′启动子区域置换pYPS161的AscI/BsiWI片段,解脂耶氏酵母Pex16基因(GenBank保藏号CAG79622)的448bp的3′终止子区域置换pYPS161的PacI/SphI片段以生成pYRH13(SEQ ID NO:59;图9B)。

生成解脂耶氏酵母基因敲除菌株Y4036(ΔPex16)

使用标准规程,用Pex16敲除构建体pYRH13的纯化6.0kBAscI/SphI片段转化解脂耶氏酵母的菌株Y4036U(实施例1)。

为了筛选具有Pex16缺失的细胞,使用Taq聚合酶(Invitrogen;Carlsbad,CA)、PCR引物PEX16Fii(SEQ ID NO:60)和PEX16Rii(SEQID NO:61)进行菌落PCR。设计这组引物以扩增完整Pex16基因的1.1kB区域,因此Pex16缺失突变体(即,Δpex16)将不生成该条带。设计第二组引物生成仅当Pex16基因被缺失时出现的条带。具体地讲,一个引物(即3UTR-URA3;SEQ ID NO:62)结合到导入的6.0kB AscI/SphI破坏片段的载体序列区域上,而另一个引物(即,PEX16-conf;SEQ IDNO:63)结合到在破坏片段的同源序列之外染色体Pex16终止子序列上。

更具体地讲,使用反应混合物进行菌落PCR,所述混合物包含:20mM Tris-HCl(pH 8.4)、50mM KCl、1.5mM MgCl2、400μM各种dGTP、dCTP、dATP、和dTTP、2μM的各个引物、20μL的水和2U Taq聚合酶。扩增如下进行:94℃120秒进行初始变性,随后在94℃60秒进行35个循环的变性,在55℃下退火60秒,在72℃下延伸120秒。最后在72℃下进行5分钟的最终延伸循环,然后在4℃下终止反应。

在205个筛选的菌落中,195个菌落具有在染色体随机位点整合的Pex16敲除片段,因此不是Δpex16突变体(然而,由于存在pYRH13,细胞能够在ura-平板上生长)。这些随机整合的菌株中的三个,命名为Y4036U-17、Y4036U-19和Y4036U-33,用作脂质生产实验中的对照物(下文)。

筛选的剩余10个菌落(即,总计205个菌落中的剩余菌落)包含Pex16基因敲除。将在Y4036U菌株背景中的这十个Δpex16突变体命名为RHY25至RHY34。

通过定量实时PCR确认解脂耶氏酵母基因敲除菌株Y4036U(ΔPex16)

通过定量实时PCR在菌株RHY25至RHY34中对Pex16基因敲除进行进一步确认,使用耶氏酵母属翻译延伸因子(tef-1)基因(GenBank保藏号AF054510)作为对照物。

首先,设计分别靶向于Pex16基因和tef-1基因的实时PCR引物和TaqMan探针,该设计使用Primer Express软件v 2.0(AppliedBiosystems,Foster City,CA)。具体地讲,设计实时PCR引物ef-324F(SEQ ID NO:64)、ef-392R(SEQ ID NO:65)、PEX16-741F(SEQ ID NO:66)和PEX16-802R(SEQ ID NO:67)以及TaqMan探针ef-345T(即,5′6-FAMTM-TGCTGGTGGTGTTGGTGAGTT-TAMRATM,其中核苷酸序列如SEQ ID NO:68所示)和PEX16-760T(即,5′-6FAMTM-CTGTCCATTCTGCGACCCCTC-TAMRATM,其中核苷酸序列如EQ ID NO:69所示)。TaqMan荧光探针5′末端具有结合的6FAMTM荧光报告基因染料,而3′末端包含TAMRATM淬灭剂。所有引物和探针获取自Sigma-Genosys(Woodlands,TX)。

敲除候选DNA通过在50μL水中悬浮1个菌落进行制备。tef-1和PEX16的反应分别进行,每个样本重复三次。实时PCR反应包括20pmoles各个正向和反向引物(即,ef-324F、ef-392R、PEX16-741F和PEX16-802R 5′,同上)、5pmoles TaqMan探针(即,ef-345T和PEX16-760T)、10μL TaqMan Universal PCR Master Mix--No AmpEraseUracil-N-Glycosylase(UNG)(目录号PN 4326614,AppliedBiosystems)、1μL菌落悬浮液和8.5μL去RNase/DNase水,每个反应总体积为20μL。反应在ABI PRISM7900Sequence Detection System上进行,使用以下条件:初始在95℃变性10分钟,随后进行95℃变性15秒、60℃退火1分钟的循环40次。在每个循环期间通过监控6-FAMTM荧光自动收集实时数据。使用用于数据归一化的tef-1基因阈值循环(CT)值,按照ABIPRISM7900Sequence Detection System使用说明书进行数据分析。

基于这一分析,得出结论:所有十个Y4036U(Δpex16)菌落(即,RHY25至RHY34)是有效的Pex16基因敲除菌落,其中pYRH13构建体已经整合进染色体YlPex16中。

评估用于DGLA生产的解脂耶氏酵母菌株Y4036U和Y4036U(δPex16)

为了评估Pex16基因敲除对总脂质级分中的PUFA百分比和细胞中的总脂质含量的效应,使Y4036U和Y4036U(Δpex16)菌株在可比较的含油条件下生长。更具体地讲,菌株Y4036U-17、Y4036U-19和Y4036U-33具有在染色体随机位点整合的Pex16基因敲除片段,上述菌株被认为是Pex16野生型(即,Y4036U),而菌株RHY25至RHY34是Pex16突变型菌株(即,Y4036U(Δpex16))。每个菌株在起始OD600为~0.1的情况下,在包含90mg/L L-亮氨酸的25mL MM中,置于125mL烧瓶中培养48小时。在50mL圆锥管中,以4300rpm离心5分钟收获细胞。弃去上清液,将细胞重悬于25mL HGM中并转移到新的125mL烧瓶中。细胞在30℃下透气培养另外120小时。

下表13中显示了每个菌株的脂肪酸组成(即,LA(18:2),ALA,EDA和DGLA);脂肪酸组成以占总脂肪酸的重量百分比(wt.%)的形式表示。菌株Y4036U和Y4036U(Δpex16)的平均脂肪酸组成用灰色突出显示并且用“Ave”指示。在MM+L-亮氨酸培养基中无受试菌株提供足够的细胞群,因此不能分析总脂质含量。

表13

解脂耶氏酵母菌株Y4036U和Y4036U(Δpex16)中的脂质组成

表13中的结果显示敲除Y4036U(Δpex16)中的染色体Pex16基因与天然Pex16p未被敲除的菌株Y4036U中的DGLA%TFA相比较,DGLA%TFA提高了大约85%。然而,Y4036U(Δpex16)积聚的LA(18:2)也降低了~40%。

因此,表13中的结果显示与亲本菌株Y4036相比,Y4036(ΔPex16)菌株具有更高的平均DGLA%TFA(43.4%对23.4%)。此外,菌株Y4036U(Δpex16)的DGLA相对于总PUFA的量提高了1.65倍(62.8%的PUFA[%TFA]对38.1%的PUFA[%TFA]),而C20PUFA相对于总PUFA的量提高了1.3倍(71%的PUFA[%TFA]对54.8%的PUFA[%TFA])。

实施例10

产生菌株Y4305以生产占总脂质约53.2%的EPA

解脂耶氏酵母菌株Y4305U具有Ura-表型,它在下文的实施例11中被用作宿主。菌株Y4305(Ura+菌株,它是Y4305U的亲本)来源于解脂耶氏酵母ATCC#20362,该菌株能通过Δ9延伸酶/Δ8去饱和酶途径的表达生产相对于总脂质而言约53.2%的EPA。

菌株Y4305U的产生需要构建菌株Y2224、菌株Y4001、菌株Y4001U、菌株Y4036、菌株Y4036U、菌株Y4070和菌株Y4086(如上文实施例1所述)。进一步开发菌株Y4305U需要构建菌株Y4086U1、菌株Y4128和菌株Y4128U3(如上文实施例2所述)。随后产生菌株Y4305U(如图10所示)需要构建菌株Y4217(生产42%的EPA)、菌株Y4217U2(Ura-)、菌株Y4259(生产46.5%的EPA)、菌株Y4259U2(Ura-)和菌株Y4305(生产53.2%的EPA)。

虽然本文未详细阐述关于转化和选择EPA生产菌株(在菌株Y4128U3后开发的菌株)的细节,但是在实施例1和2中描述了分离菌株Y4217、菌株Y4217U2、菌株Y4259、菌株Y4259U2、菌株Y4305和菌株Y4305U的方法。

简而言之,生成构建体pZKL2-5U89GC(图8B;SEQ ID NO:55;描述于表24,国际申请公布WO 2008/073367)以将一个Δ9延伸酶基因(即,EgD9eS)、一个Δ8去饱和酶基因(即,EgD8M)、一个Δ5去饱和酶基因(即,EgD5S)、和一个解脂耶氏酵母二酰基甘油胆碱磷酸转移酶(CPT1)基因整合进菌株Y4128U3的Lip2位点(GenBank保藏号AJ012632)中,从而产生较高含量的EPA。六个分别命名为Y4215、Y4216、Y4217、Y4218、Y4219和Y4220的菌株分别生产占总脂质约41.1%、41.8%、41.7%、41.1%、41%和41.1%的EPA。

菌株Y4217U1和Y4217U2经由构建体pZKUE3S破坏菌株Y4217中的Ura3基因进行制备(图5A SEQ ID NO:31;描述于表22,国际申请公布WO 2008/073367),它包含定向于Ura3基因的嵌合EXP1::ME3S::Pex20基因。利用构建体pZKL1-2SP98C(图8A SEQ IDNO:54;描述于表23,国际申请公布WO 2008/073367)将一个Δ9延伸酶基因(即,EgD9eS)、一个Δ8去饱和酶基因(即,EgD8M)、一个Δ12去饱和酶基因(即,FmD12S)、和一个解脂耶氏酵母CPT1基因整合进菌株Y4217U2的Lip1位点(GenBank保藏号Z50020)中,从而产生分离菌株Y4259、Y4260、Y4261、Y4262、Y4263和Y4264,分别生产占总脂质约46.5%、44.5%、44.5%、44.8%、44.5%和44.3%的EPA。

然后经由用构建体pZKUM进行转化制备Ura-衍生物(即,菌株Y4259U2)(图11A;SEQ ID NO:70;描述于表33,国际申请公布WO2008/073367),该构建体将Ura3突变基因整合进菌株Y4259的Ura3基因中,从而分别产生分离的菌株Y4259U1、Y4259U2和Y4259U3(统称为Y4259U)(分别生产占总脂质31.4%、31%和31.3%的EPA)。

最后,生成构建体pZKD2-5U89A2(图11B;SEQ ID NO:71)以将一个Δ9延伸酶基因、一个Δ5去饱和酶基因、一个Δ8去饱和酶基因、和一个Δ12去饱和酶基因整合进菌株Y4259U2的二酰基甘油酰基转移酶(DGAT2)位点中,从而使EPA产量提高。pZKD2-5U89A2质粒含有如下组分:

表14

描述质粒pZKD2-5U89A2(SEQ ID NO:71)

 SEQ ID NO:71中的RE位点和核苷酸  片段和嵌合基因组分的描述 AscI/BsiWI(1-736)  耶氏酵母属DGAT2基因的728bp的5′部分(SEQ IDNO:72)(图中标记为“YLDGAT5”;美国专利7,267,976) PacI/SphI(4164-3444)  耶氏酵母属DGAT2基因的714bp的3′部分(SEQ IDNO:72)(图中标记为“YLDGAT3”;美国专利7,267,976)

 SEQ ID NO:71中的RE位点和核苷酸  片段和嵌合基因组分的描述 SwaI/BsiWI(13377-1)  YAT1::FmD12S::Lip2,它包含:●YAT1:解脂耶氏酵母YAT1启动子(在图中标记为“YAT”;专利申请公布US 2006/0094102-A1);●FmD12S:经密码子优化的Δ12延伸酶(SEQ IDNO:74),来源于串珠镰刀菌(图中标记为“F.D12S”;国际申请公布WO 2005/047485);●Lip2:来自耶氏酵母属Lip2基因(GenBank保藏号AJ012632)的Lip2终止子序列  PmeI/SwaI(10740-13377)  FBAIN::EgD8M::Lip1,它包含:●FBAIN:解脂耶氏酵母FBAIN启动子(美国专利7,202,356);●EgD8M:合成突变型Δ8去饱和酶(SEQ ID NO:76;专利申请公布US 2008-0138868A1),来源于小眼虫(“EgD8S”;美国专利7,256,033);●Lip1:来自耶氏酵母属Lip1基因(GenBank保藏号Z50020)的Lip1终止子序列  ClaI/PmeI(8846-10740)  YAT1::E389D9eS::OCT,它包含:●YAT1:解脂耶氏酵母YAT1启动子(在图中标记为“YAT”;专利申请公布US 2006/0094102-A1);●E389D9eS:经密码子优化的Δ9延伸酶(SEQ IDNO:78),来源于小型绿藻属CCMP389(图中标记为“D9ES-389”;国际申请公布WO 2007/061742);●OCT:耶氏酵母属OCT基因(GenBank保藏号X69988)的OCT终止子序列  ClaI/EcoRI(8846-6777)  耶氏酵母属Ura3基因(GenBank保藏号AJ306421)

 SEQ ID NO:71中的RE位点和核苷酸  片段和嵌合基因组分的描述  EcoRI/PacI(6777-4164)  EXP1::EgD5S::ACO,它包含:●EXP1:解脂耶氏酵母输出蛋白(EXP1)启动子(在图中标记为“Exp”;国际申请公布WO 2006/052870)。●EgD5S:经密码子优化的Δ5去饱和酶(SEQ IDNO:80),来源于小眼虫(专利申请公布US2007-0292924-A1);●Aco:耶氏酵母属Aco基因(GenBank保藏号AJ001300)的Aco终止子序列

将pZKD2-5U89A2质粒用AscI/SphI消化,然后根据“一般方法”将其用于转化菌株Y4259U2。将转化细胞铺在MM平板上并在30℃下维持3至4天。将单菌落再划线接种到MM平板上,所得菌落用于接种液体MM。液体培养物以250rpm/min,在30℃下摇动2天。通过离心收集细胞,将其重悬浮于HGM中,然后以250rpm/min摇动5天。通过离心收集细胞,并提取脂质。通过酯交换制备FAME并随后用Hewlett-Packard 6890GC进行分析。

GC分析显示大多数选择的96个菌株生产占总脂质40-46%的EPA。命名为Y4305、Y4306、Y4307和Y4308的四个菌株分别生产占总脂质约53.2%、46.4%、46.8%和47.8%的EPA。Y4305的全部脂质分布如下:16:0(2.8%)、16:1(0.7%)、18:0(1.3%)、18:1(4.9%)、18:2(17.6%)、ALA(2.3%)、EDA(3.4%)、DGLA(2.0%)、ARA(0.6%)、ETA(1.7%)和EPA(53.2%)。总脂质%干细胞重量是27.5。

相对于野生型解脂耶氏酵母ATCC#20362的菌株Y4305的最终基因型是SCP2-(YALI0E01298g)、YALI0C18711g-、Pex10-、YALI0F24167g-,unknown 1-、unknown 3-、unknown 8-、GPD::FmD12::Pex20、YAT1::FmD12::OCT、GPM/FBAIN::FmD12S::OCT、EXP1::FmD12S::Aco、YAT1::FmD12S::Lip2、YAT1::ME3S::Pex16、EXP1::ME3S::Pex20(3copies)、GPAT::EgD9e::Lip2、EXP1::EgD9eS::Lip1、FBAINm::EgD9eS::Lip2、FBA::EgD9eS::Pex20、GPD::EgD9eS::Lip2、YAT1::EgD9eS::Lip2、YAT1::E389D9eS::OCT、FBAINm::EgD8M::Pex20、FBAIN::EgD8M::Lip1(2个拷贝)、EXP1::EgD8M::Pex16、GPDIN::EgD8M::Lip1、YAT1::EgD8M::Aco、FBAIN::EgD5::Aco、EXP1::EgD5S::Pex20、YAT1::EgD5S::Aco、EXP1::EgD5S::ACO、YAT1::RD5S::OCT、YAT1::PaD17S::Lip1、EXP1::PaD17::Pex16、FBAINm::PaD17::Aco、YAT1::Y1CPT1::ACO、GPD::YlCPT1::ACO。

为了破坏菌株Y4305中的Ura3基因,使用构建体pZKUM(图11A;SEQ ID NO:70;描述于表33,国际申请公布WO 2008/073367)以将Ura3突变基因整合进菌株Y4305的Ura3基因中。挑取在MM+5-FOA平板上生长的总共8个转化体,并且再次分别划线接种到MM平板和MM+5-FOA平板上。所有8个菌株具有Ura-表型(即,细胞能在MM+5-FOA平板上生长,但是不能在MM平板上生长)。从MM+5-FOA平板上刮除细胞并提取脂质。通过酯交换制备FAME并随后用Hewlett-Packard6890GC进行分析。

GC分析显示在MM+5-FOA平板上生长的pZKUM转化体#1、#6和#7中存在占总脂质37.6%,37.3%和36.5%的EPA。这三个菌株分别命名为菌株Y4305U1、Y4305U2和Y4305U3(统称为Y4305U)。为清楚起见,在实施例11中菌株Y4305U被称为菌株Y4305U(Δpex10)。

实施例11

在解脂耶氏酵母菌株Y4305U(Δpex10)中的Pex16染色体缺失进一步提高了积聚的EPA百分比(Pex10-Pex16双敲除)

本实施例描述使用构建体pYRH13(图9B;SEQ ID NO:59)敲除在耶氏酵母属菌株Y4305U中的染色体Pex16(Δpex10)(实施例10),从而导致生成Pex10-Pex16双突变体。测定并比较Pex10-Pex16双敲除对总油量和EPA含量的效应。具体地讲,在菌株Y4305U(Δpex10)(Δpex16)中的Pex10-Pex16双突变体的效应导致细胞中EPA的量与单突变体相比(即,菌株Y4305U(Δpex10))有所提高(EPA%TFA和EPA%DCW)。

生成解脂耶氏酵母基因敲除菌株Y4305U(Δpex10)(Δpex16)

采用Pex16敲除构建体pYRH13(实施例9;SEQ ID NO:59)的纯化6.0kB AscI/SphI片段,使用标准规程来转化解脂耶氏酵母菌株Y4305U(Δpex10)(实施例10)。如实施例9所述,通过菌落PCR筛选并鉴定具有Pex16缺失的细胞。

在93个筛选的菌落中,88个菌落具有在染色体随机位点整合的Pex16敲除片段,因此不是Δpex16突变体(然而,由于存在pYRH13,细胞能够在ura-平板上生长)。这些随机整合的菌株中的两个,命名为Y4305U-22和Y4305U-25,用作脂质生产实验中的对照物(下文)。

筛选的剩余5个菌落(即,总计93个菌落中的剩余菌落)包含Pex16基因敲除。将在Y4305U菌株中的这五个Δpex16突变体命名为RHY20、RHY21、RHY22、RHY23和RHY24。如实施例9所述,通过如实施例9所述的定量实时PCR进行对YlPex16基因敲除的进一步确认。

评估用于EPA生产的解脂耶氏酵母菌株Y4305U(ΔPex10)和Y4305U(ΔPex10)(Δpex16)

为了评估多个Pex基因突变对总脂质级分中的PUFA百分比和细胞中的总脂质含量的效应,将Y4305U(Δpex10)和Y4305U(Δpex10)(Δpex16)菌株在可比较的含油条件下生长。更具体地讲,菌株Y4305U-22和Y4305U-25具有在染色体随机位点整合的Pex16基因敲除片段,它们被认为是Pex16野生型,Pex10基因敲除型(即,Y4305U(Δpex10))。菌株RHY22、RHY23和RHY24是双敲除突变型菌株(即,Y4305U(Δpex10)(Δpex16))。在可比较的含油条件下平行培养每个菌株。

具体地讲,在25mL合成右旋糖培养基(SD)中在起始OD600为~0.1的情况下,在125mL烧瓶中培养48小时。在50mL圆锥管中,以4300rpm离心5分钟收获细胞。弃去上清液,将细胞重悬于25mL HGM中并转移到新的125mL烧瓶中。细胞在30℃下透气培养另外120小时。

为了测定干细胞重量(DCW),对来自5mL HGM生长培养物的细胞进行处理。培养的细胞在4300rpm下离心5分钟。使用10mL无菌水重悬沉淀物并在相同条件下二次离心。然后用1mL无菌H2O(第三次)重悬沉淀物,将其转移到预先称重的铝盘中。细胞悬浮液在80℃真空炉中干燥过夜。测量细胞重量。

为了测定总脂质含量,1mL的HGM培养细胞通过在13,000rpm下离心1分钟进行收集,提取总脂质并通过酯交换制备FAME,随后用Hewlett-Packard 6890GC(一般方法)进行分析。

表15显示了每个菌株的脂肪酸组成(即,16:0(棕榈酸))、16:1(棕榈油酸)、18:0、18:1(油酸)、18:2(LA)、18:3(ALA)、EDA、DGLA、ARA、ETrA、ETA和EPA)(以总脂肪酸(TFA)的重量百分比(wt.%)形式表示),以及DCW(g/L)和总脂质含量(TFA%DCW)。菌株Y4305U(Δpex10)和Y4305U(Δpex10)(Δpex16)的平均脂肪酸组成用灰色突出显示并用“Ave”指示。

表15中的结果显示敲除Y4305U(Δpex10)(Δpex16)中的染色体Pex16基因与天然Pex16p未被敲除的菌株Y4305U(Δpex10)中的EPA%TFA相比较,EPA%TFA提高了大约8%。此外,与单突变菌株相比,EPA%DCW也在双突变体中提高,而TFA%DCW保持不变。

因此,表15中的结果显示与对照Y4305(ΔPex10)菌株相比,Y4305(ΔPex10,ΔPex16)菌株平均具有更高的EPA%TFA(48.3%对44.7%)和更高的EPA%DCW(14.57%对13.23%)。菌株Y4305(ΔPex10,ΔPex16)相对于菌株Y4305(ΔPex10)的EPA相对于总PUFA的量(61%的PUFA[%TFA]对58.3%的PUFA[%TFA])仅提高了1.05倍,而C20PUFA相对于总PUFA的量的提高二者基本上相同(73%的PUFA[%TFA]对72%的PUFA[%TFA])。

实施例12

在解脂耶氏酵母菌株Y4036U中的Pex3染色体缺失提高了积聚的DGLA百分比

本实施例描述了使用构建体pY157(图12B;SEQ ID NO:82)敲除在Ura-、DGLA-生产耶氏酵母属菌株Y4036U(实施例1)中的染色体Pex3基因(SEQ ID NO:3)。用Pex3敲除构建体转化解脂耶氏酵母菌株Y4036U导致生成菌株Y4036(Dpex3)。测量Pex3敲除对DGLA含量的效应并与对照菌株Y4036(Ura+菌株,它是菌株Y4036U的亲本)比较。具体地讲,敲除Pex3提高DGLA占总脂肪酸的百分比并且与对照相比改善了大约3倍的DGLA%DCW。

构建体pY157

质粒pY87(图12A)包含表达盒以敲除解脂耶氏酵母二酰基甘油酰基转移酶(DGAT2)基因,如下表16所述:

表16

质粒pY87(SEQ ID NO:83)的描述

  SEQ ID NO:83中的RE位点和核苷酸  片段和嵌合基因组分的描述  SphI/PacI(1-721)  耶氏酵母属DGAT2基因的5′部分(SEQ ID NO:72的碱基1-720)(美国专利公开7,267,976)  PacI/BglII(721-2459)  LoxP::Ura3::LoxP,它包含:●LoxP序列(SEQ ID NO:84);●耶氏酵母属Ura3基因(GenBank保藏号AJ306421);●LoxP序列(SEQ ID NO:84)  BglII/AscI(2459-3203)  耶氏酵母属DGAT2基因的3′部分(SEQ ID NO:72的碱基2468-3202)(美国专利公开7,267,976)  AscI/SphI(3203-5910)  载体主链包括:●ColE1质粒复制起点●用于在大肠杆菌中选择的氨苄青霉素抗性基因(AmpR)(4191-5051);●大肠杆菌f1复制起点

质粒pY157来源于质粒pY87。具体地讲,解脂耶氏酵母Pex3基因的704bp的5′启动子区域置换pY87的SphI/PacI片段,解脂耶氏酵母Pex3基因的448bp的3′终止子区域置换pY87的BglII/AscI片段以生成pYR157(SEQ ID NO:82;图12B)。

生成解脂耶氏酵母基因敲除菌株Y4036(ΔPex3)

使用标准规程,用Pex3敲除构建体pY157的纯化3648bp的AscI/SphI片段来转化解脂耶氏酵母的菌株Y4036U(实施例1)(同上)。

为了筛选具有Pex3缺失的细胞,使用Taq聚合酶(Invitrogen;Carlsbad,CA)和PCR引物UP 768(SEQ ID NO:85)以及LP 769(SEQID NO:86)进行菌落PCR。设计这组引物用于扩增完整Pex3基因的2039bp的野生型条带,以及当Pex3基因被定向敲除破坏时,3719bp的敲除特异性条带。

更具体地讲,菌落PCR使用MasterAmp Taq试剂盒(EpicentreTechnologies,Madison,WI;目录号82250),并且按照制造商说明书进行,在25μL的反应中包含:2.5μL 10X MasterAmp Taq缓冲液、2.0μL25mM MgCl2、7.5μL 10X MasterAmp Enhancer、2.5μL 2.5mM dNTP(TaKaRa Bio Inc.,Otsu Shiga,Japan)、1.0μL 10μM上游引物、1.0μL10μM下游引物、0.25μL MasterAmp Taq DNA聚合酶和19.75μL水。扩增如下进行:95℃5分钟进行初始变性,随后在95℃30秒进行40个循环的变性,在56℃下退火60秒,在72℃下延伸4分钟。最后在72℃下进行10分钟的最终延伸循环,然后在4℃下终止反应。

筛选的48个菌落中,46个菌落具有2039bp的预期条带,该条带来自野生型(即,未破坏的)Pex3基因,因此不是Δpex3突变体。剩余的2个菌落只显示2039bp的弱条带,说明它们是在背景中存在一些污染的非转化细胞的Δpex3突变体。通过划线接种2个推定敲除菌落到选择性平板上分离单菌落,这一点得到了证实。然后从每个推定基因敲除菌株的3个单菌落中来分离基因组DNA并用相同引物对来进行筛选。即,UP 768和LP 769(SEQ ID NO:85和86)。该方法被认为是比菌落PCR更灵敏的方法。来自主要转化体的所有三个单菌落都缺少2039bp的野生型条带,相反地具有3719bp的基因敲除特异性条带。将在Y4036U菌株中的Δpex3突变体命名为L134和L135。

评估用于DGLA生产的解脂耶氏酵母菌株YY4036和Y4036(ΔPex3)

为了评估Pex3基因敲除对总脂质级分中的PUFA百分比和细胞中的总脂质含量的效应,Y4036和Y4036(Δpex3)菌株6在可比较的含油条件下生长。将菌株Y4036、L134(即,Y4036(Δpex3))和L135(即,Y4036(Δpex3))接种到25mL的CSM-Ura并在振荡器中在30℃下培养过夜。将预培养物等分到新的25mL CSM-Ura烧瓶中,最终OD600为0.4。培养物在30℃下在振荡器中生长。在48小时后,离心细胞(它几乎不生长)并重悬在新的25mL CSM-Ura中并继续生长72小时。将细胞离心、重悬于25mL HGM中,并继续如上文所述生长72小时。离心收获细胞,用蒸馏水洗涤一次并重悬于25mL水中,终体积为20.5mL。使用等分试样(1.5mL)测量脂质含量,提取总脂质,通过酯交换制备FAME并通过Hewlett-Packard 6890GC进行分析(一般方法)。如实施例11所述干燥剩余的等分试样以测量干细胞重量(DCW)。

表17显示了每个菌株的脂肪酸组成(即,16:0(棕榈酸)、16:1(棕榈油酸)、18:0、18:1(油酸)、18:2(LA)、EDA和DGLA)(以占总脂肪酸(TFA)的重量百分比(wt.%)形式表示),以及总脂质含量(TFA%DCW)。转化效率(“CE”)根据下面的公式测量:([产物]/[底物+产物])*100,其中‘产物’包括中间产物和该途径中来源于它的所有产物。因此,Δ12去饱和酶转化效率(Δ12%CE)计算如下:([LA+EDA+DGLA]/[18:1+LA+EDA+DGLA])*100;Δ9延伸酶转化效率(Δ9elo%CE)计算如下:([EDA+DGLA]/[LA+EDA+DGLA])*100;并且Δ8去饱和酶转化效率(Δ8%CE)计算如下:([DGLA]/[EDA+DGLA])*100。菌株Y4036、L134和L135的平均脂肪酸组成用灰色突出显示并用“Ave”表示,而“S.D.”指示标准偏差。正如预期的那样,Δpex3菌株不在用油酸盐作唯一碳源的平板上生长。

表17中的结果显示敲除Y4036(Δpex3)中的染色体Pex3基因与天然Pex3p未被敲除的菌株Y4036中的DGLA%TFA相比较,DGLA%TFA提高了大约142%。具体地讲,Pex3敲除提高了DGLA含量,从在Y4036中的大约19%提高到在Y4036(Δpex3)菌株L134和L135中的46%。此外,Δ9延伸酶转化效率百分比从Y4036中的大约48%提高到Y4036(Δpex3)菌株L134和L135中的83%;并且菌株L134和L135中的TFA%DCW从4.7%提高到6%。LA%TFA从30%下降到12%。Pex3缺失实际上提高了脂肪酸的通量并从而提高了用于Δ9延伸的底物可利用性。

因此,表17中的结果显示与亲本菌株Y4036相比,Y4036(ΔPex3)菌株具有平均更高的脂质含量(TFA%DCW)(大约6.0%对4.7%),更高的DGLA%TFA(46%对19%),以及更高的DGLA%DCW(大约2.8%对0.9%)。此外,菌株Y4036(ΔPex3)的DGLA相对于总PUFA的量提高了2倍(67.7%的PUFA[%TFA]对33.3%的PUFA[%TFA]),而C20PUFA相对于总PUFA的量提高了1.7倍(82%的PUFA[%TFA]对47%的PUFA[%TFA])。

预测改善的DGLA产量也将导致在经基因工程化用于EPA生产的解脂耶氏酵母菌株中的EPA产量的改善(例如实施例10所述并从中衍生出的解脂耶氏酵母菌株Y4305U)。

序列表

<110>E.I.du Pont de Nemours & Co.,Inc.

     Zhu,Quinn

     Xue,Zhixiong

 

<120)破坏过氧化物酶体生物合成因子蛋白(PEX)以改变含油真核生物中多不饱和脂肪酸和总脂质含量

 

<130>CL3847

 

<160>89

 

<170>PatentIn版本3.4

 

<210>1

<211>1024

<212>PRT

<213>解脂耶氏酵母CLIBl22(GenBank保藏号CAG82178)

 

<220>

<221>MISC_FEATURE

<222>(1)..(1024)

<223>YlPex1p

 

<400>1

Met Thr Ser Lys Ser Asp Tyr Ser Gly Lys Asp Lys Ile Glu Leu Asp

1               5                   10                  15

Pro Val Phe Ala Lys Ser Ile Asp Leu Leu Pro Asn Thr Gln Val Val

            20                  25                  30

Ile Asp Ile Gln Leu Asn Pro Lys Ile Ala His Thr Ile His Leu Glu

        35                  40                  45

Pro Val Thr Val Ala Asp Trp Glu Ile Val Glu Leu His Ala Ala Tyr

    50                  55                  60

Leu Glu Ser Arg Met Ile Asn Gln Val Arg Ala Val Ser Pro Asn Gln

65                  70                  75                  80

Pro Val Thr Val Tyr Pro Ser Ser Thr Thr Ser Ala Thr Leu Lys Val

                85                  90                  95

Ile Arg Ile Glu Pro Asp Leu Gly Ala Ala Gly Phe Ala Lys Leu Ser

            100                 105                 110

Pro Asp Ser Glu Val Val Val Ala Pro Lys Gln Arg Lys Lys Glu Glu

        115                 120                 125

Lys Gln Val Lys Lys Arg Ser Gly Ser Ala Arg Ser Thr Gly Ser Gln

    130                 135                 140

Lys Arg Lys Gly Gly Arg Gly Pro His Ala Leu Arg Arg Ala Ile Ser

145                 150                 155                 160

Glu Asp Phe Asp Gly His Leu Arg Leu Glu Val Ser Leu Asp Val Ser

                165                 170                 175

Gln Leu Pro Pro Glu Phe His Gln Leu Lys Asn Val Ser Ile Lys Val

            180                 185                 190

Ile Thr Pro Pro Asn Leu Ala Ser Pro Gln Gln Ala Ala Ser Ile Ala

        195                 200                 205

Val Glu Glu Lys Ser Glu Glu Ser Leu Ser Gln Asn Lys Pro Pro Ser

    210                 215                 220

Ser Glu Pro Lys Val Glu Val Pro Pro Asp Ile Ile Asn Pro Ala Ser

225                 230                 235                 240

Glu Ile Val Ala Thr Leu Val Asn Asp Thr Thr Ser Pro Thr Gly His

                245                 250                 255

Ala Lys Leu Ser Tyr Ala Leu Ala Asp Ala Leu Gly Ile Pro Ser Ser

            260                 265                 270

Val Gly His Val Ile Arg Phe Glu Ser Ala Ser Lys Pro Leu Ser Gln

        275                 280                 285

Lys Pro Gly Ala Leu Val Ile His Arg Phe Ile Thr Lys Thr Val Gly

    290                 295                 300

Ala Ala Glu Gln Lys Ser Leu Arg Leu Lys Gly Glu Lys Asn Ala Asp

305                 310                 315                 320

Asp Gly Val Ser Ala Asp Asp Gln Phe Ser Leu Leu Glu Glu Leu Lys

                325                 330                 335

Lys Leu Gln Mer Leu Glu Gly Pro Ile Thr Asn Phe Gln Arg Leu Pro

            340                 345                 350

Pro Ile Pro Glu Leu Leu Pro Leu Gly Gly Val Ile Gly Leu Gln Asn

        355                 360                 365

Ser Glu Gly Trp Ile Gln Gly Gly Tyr Leu Gly Glu Glu Pro Ile Pro

    370                 375                 380

Phe Val Ser Gly Ser Glu Ile Leu Arg Ser Glu Ser Ser Leu Ser Pro

385                 390                 395                 400

Ser Asn Ile Glu Ser Glu Asp Lys Arg Val Val Gly Leu Asp Asn Met

                405                 410                 415

Leu Asn Lys Ile Asn Glu Val Leu Ser Arg Asp Ser Ile Gly Cys Leu

            420                 425                 430

Val Tyr Gly Ser Arg Gly Ser Gly Lys Ser Ala Val Leu Asn His Ile

        435                 440                 445

Lys Lys Glu Cys Lys Val Ser His Thr His Thr Val Ser Ile Ala Cys

    450                 455                 460

Gly Leu Ile Ala Gln Asp Arg Val Gln Ala Val Arg Glu Ile Leu Thr

465                 470                 475                 480

Lys Ala Phe Leu Glu Ala Ser Trp Phe Ser Pro Ser Val Leu Phe Leu

                485                 490                 495

Asp Asp Ile Asp Ala Leu Met Pro Ala Glu Val Glu His Ala Asp Ser

            500                 505                 510

Ser Arg Thr Arg Gln Leu Thr Gln Leu Phe Leu Glu Leu Ala Leu Pro

        515                 520                 525

Ile Met Lys Ser Arg His Val Ser Val Val Ala Ser Ala Gln Ala Lys

    530                 535                 540

Glu Ser Leu His Met Asn Leu Val Thr Gly His Val Phe Glu Glu Leu

545                 550                 555                 560

Phe His Leu Lys Ser Pro Asp Lys Glu Ala Arg Leu Ala Ile Leu Ser

                565                 570                 575

Glu Ala Val Lys Leu Met Asp Gln Asn Val Ser Phe Ser Gln Asn Asp

            580                 585                 590

Val Leu Glu Ile Ala Ser Gln Val Asp Gly Tyr Leu Pro Gly Asp Leu

        595                 600                 605

Trp Thr Leu Ser Glu Arg Ala Gln His Glu Met Ala Leu Arg Gln Ile

    610                 615                 620

Glu Ile Gly Leu Glu Asn Pro Ser Ile Gln Leu Ala Asp Phe Met Lys

625                 630                 635                 640

Ala Leu Glu Asp Phe Val Pro Ser Ser Leu Arg Gly Val Lys Leu Gln

                645                 650                 655

Lys Ser Asn Val Lys Trp Asn Asp Ile Gly Gly Leu Lys Glu Thr Lys

            660                 665                 670

Ala Val Leu Leu Glu Thr Leu Glu Trp Pro Thr Lys Tyr Ala Pro Ile

        675                 680                 685

Phe Ala Ser Cys Pro Leu Arg Leu Arg Ser Gly Leu Leu Leu Tyr Gly

    690                 695                 700

Tyr Pro Gly Cys Gly Lys Thr Tyr Leu Ala Ser Ala Val Ala Ala Gln

705                 710                 715                 720

Cys Gly Leu Asn Phe Ile Ser Ile Lys Gly Pro Glu Ile Leu Asn Lys

                725                 730                 735

Tyr Ile Gly Ala Ser Glu Gln Ser Val Arg Glu Leu Phe Glu Arg Ala

            740                 745                 750

Gln Ala Ala Lys Pro Cys Ile Leu Phe Phe Asp Glu Phe Asp Ser Ile

        755                 760                 765

Ala Pro Lys Arg Gly His Asp Ser Thr Gly Val Thr Asp Arg Val Val

    770                 775                 780

Asn Gln Met Leu Thr Gln Met Asp Gly Ala Glu Gly Leu Asp Gly Val

785                 790                 795                 800

Tyr Val Leu Ala Ala Thr Ser Arg Pro Asp Leu Ile Asp Pro Ala Leu

                805                 810                 815

Leu Arg Pro Gly Arg Leu Asp Lys Met Leu Ile Cys Asp Leu Pro Ser

            820                 825                 830

Tyr Glu Asp Arg Leu Asp Ile Leu Arg Ala Ile Val Asp Gly Lys Met

        835                 840                 845

His Leu Asp Gly Glu Val Glu Leu Glu Tyr Val Ala Ser Arg Thr Asp

    850                 855                 860

Gly Phe Ser Gly Ala Asp Leu Gln Ala Val Met Phe Asn Ala Tyr Leu

865                 870                 875                 880

Glu Ala Ile His Glu Val Val Asp Val Ala Asp Asp Thr Ala Ala Asp

                885                 890                 895

Thr Pro Ala Leu Glu Asp Lys Arg Leu Glu Phe Phe Gln Thr Thr Leu

            900                 905                 910

Gly Asp Ala Lys Lys Asp Pro Ala Ala Val Gln Asn Glu Val Met Asn

        915                 920                 925

Ala Arg Ala Ala Val Ala Glu Lys Ala Arg Val Thr Ala Lys Leu Glu

    930                 935                 940

Ala Leu Phe Lys Gly Met Ser Val Gly Val Asp Asn Asp Asp Asp Lys

945                 950                 955                 960

Pro Arg Lys Lys Ala Val Val Val Ile Lys Pro Gln His Met Asn Lys

                965                 970                 975

Ser Leu Asp Glu Thr Ser Pro Ser Ile Ser Lys Lys Glu Leu Leu Lys

            980                 985                 990

Leu Lys Gly Ile Tyr Ser Gln Phe  Val Ser Gly Arg Ser  Gly Asp Met

        995                 1000                 1005

Pro Pro  Gly Thr Ala Ser Thr  Asp ValGly Gly Arg  Ala Thr Leu

    1010                 1015                1020

Ala

 

<210>2

<211>381

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG77647)

 

<220>

<221>MISC_FEATURE

<222>(1)..(381)

<223>YlPex2p

 

<400>2

Met Ser Ser Val Leu Arg Leu Phe Lys Ile Gly Ala Pro Val Pro Asn

1               5                   10                  15

Val Arg Val His Gln Leu Asp Ala Ser Leu Leu Asp Ala Glu Leu Val

           20                  25                  30

Asp Leu Leu Lys Asn Gln Leu Phe Lys Gly Phe Thr Asn Phe His Pro

        35                  40                  45

Glu Phe Arg Asp Lys Tyr Glu Ser Glu Leu Val Leu Ala Leu Lys Leu

    50                  55                  60

Ile Leu Phe Lys Leu Thr Val Trp Asp His Ala Ile Thr Tyr Gly Gly

65                  70                  75                  80

Lys Leu Gln Asn Leu Lys Phe Ile Asp Ser Arg His Ser Ser Lys Leu

                85                  90                  95

Gln Ile Gln Pro Ser Val Ile Gln Lys Leu Gly Tyr Gly Ile Leu Val

            100                 105                 110

Val Gly Gly Gly Tyr Leu Trp Ser Lys Ile Glu Gly Tyr Leu Leu Ala

        115                 120                 125

Arg Ser Glu Asp Asp Val Ala Thr Asp Gly Thr Ser Val Arg Gly Ala

    130                 135                 140

Ser Ala Ala Arg Gly Ala Leu Lys Val Ala Asn Phe Ala Ser Leu Leu

145                 150                 155                 160

Tyr Ser Ala Ala Thr Leu Gly Asn Phe Val Ala Phe Leu Tyr Thr Gly

                165                 170                 175

Arg Tyr Ala Thr Val Ile Met Arg Leu Leu Arg Ile Arg Leu Val Pro

            180                 185                 190

Ser Gln Arg Thr Ser Ser Arg Gln Val Ser Tyr Glu Phe Gln Asn Arg

        195                 200                 205

Gln Leu Val Trp Asn Ala Phe Thr Glu Phe Leu Ile Phe Ile Leu Pro

    210                 215                 220

Leu Leu Gln Leu Pro Lys Leu Lys Arg Arg Ile Glu Arg Lys Leu Gln

225                 230                 235                 240

Ser Leu Asn Val Thr Arg Val Gly Asn Val Glu Glu Ala Ser Glu Gly

                245                 250                 255

Glu Leu Ala His Leu Pro Gln Lys Thr Cys Ala Ile Cys Phe Arg Asp

            260                 265                 270

Glu Glu Glu Gln Glu Gly Gly Gly Gly Ala Ser His Tyr Ser Thr Asp

        275                 280                 285

Val Thr Asn Pro Tyr Gln Ala Asp Cys Gly His Val Tyr Cys Tyr Val

    290                 295                 300

Cys Leu Val Thr Lys Leu Ala Gln Gly Asp Gly Asp Gly Trp Asn Cys

305                 310                 315                 320

Tyr Arg Cys Ala Lys Gln ValGln Lys Met Lys Pro Trp Val Asp Val

                325                 330                 335

Asp Glu Ala Ala Val Val Gly Ala Ala Glu Met His Glu Lys Val Asp

            340                 345                 350

Val Ile Glu His Ala Glu Asp Asn Glu Gln Glu Glu Glu Glu Phe Asp

        355                 360                 365

Asp Asp Asp Glu Asp Ser Asn Phe Gln Leu Met Lys Asp

    370                 375                 380

 

<210>3

<211>431

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG78565)

 

<220>

<221>MISC_FEATURE

<222>(1)..(431)

<223>YlPex3p

 

<400>3

Met Asp Phe Phe Arg Arg His Gln Lys Lys Val Leu Ala Leu Val Gly

1               5                   10                  15

Val Ala Leu Ser Ser Tyr Leu Phe Ile Asp Tyr Val Lys Lys Lys Phe

            20                  25                  30

Phe Glu Ile Gln Gly Arg Leu Ser Ser Glu Arg Thr Ala Lys Gln Asn

        35                  40                  45

Leu Arg Arg Arg Phe Glu Gln Asn Gln Gln Asp Ala Asp Phe Thr Ile

    50                  55                  60

Met Ala Leu Leu Ser Ser Leu Thr Thr Pro Val Met Glu Arg Tyr Pro

65                  70                  75                  80

Val Asp Gln Ile Lys Ala Glu Leu Gln Ser Lys Arg Arg Pro Thr Asp

                85                  90                  95

Arg Val Leu Ala Leu Glu Ser Ser Thr Ser Ser Ser Ala Thr Ala Gln

            100                 105                 110

Thr Val Pro Thr Met Thr Ser Gly Ala Thr Glu Glu Gly Glu Lys Ser

        115                 120                 125

Lys Thr Gln Leu Trp Gln Asp Leu Lys Arg Thr Thr Ile Ser Arg Ala

    130                 135                 140

Phe Ser Leu Val Tyr Ala Asp Ala Leu Leu Ile Phe Phe Thr Arg Leu

145                 150                 155                 160

Gln Leu Asn Ile Leu Gly Arg Arg Asn Tyr Val Asn Ser Val Val Ala

                165                 170                 175

Leu Ala Gln Gln Gly Arg Glu Gly Asn Ala Glu Gly Arg Val Ala Pro

            180                 185                 190

Ser Phe Gly Asp Leu Ala Asp Met Gly Tyr Phe Gly Asp Leu Ser Gly

        195                 200                 205

Ser Ser Ser Phe Gly Glu Thr Ile Val Asp Pro Asp Leu Asp Glu Gln

    210                 215                 220

Tyr Leu Thr Phe Ser Trp Trp Leu Leu Asn Glu Gly Trp Val Ser Leu

225                 230                 235                 240

Ser Glu Arg Val Glu Glu Ala Val Arg Arg Val Trp Asp Pro Val Ser

                245                 250                 255

Pro Lys Ala Glu Leu Gly Phe Asp Glu Leu Ser Glu Leu Ile Gly Arg

            260                 265                 270

Thr Gln Met Leu Ile Asp Arg Pro Leu Asn Pro Ser Ser Pro Leu Asn

        275                 280                 285

Phe Leu Ser Gln Leu Leu Pro Pro Arg Glu Gln Glu Glu Tyr Val Leu

    290                 295                 300

Ala Gln Asn Pro Ser Asp Thr Ala Ala Pro Ile Val Gly Pro Thr Leu

305                 310                 315                 320

Arg Arg Leu Leu Asp Glu Thr Ala Asp Phe Ile Glu Ser Pro Asn Ala

                325                 330                 335

Ala Glu Val Ile Glu Arg Leu Val His Ser Gly Leu Ser Val Phe Met

            340                 345                 350

Asp Lys Leu Ala Val Thr Phe Gly Ala Thr Pro Ala Asp Ser Gly Ser

        355                 360                 365

Pro Tyr Pro Val Val Leu Pro Thr Ala Lys Val Lys Leu Pro Ser Ile

     70                 375                 380

Leu Ala Asn Met Ala Arg Gln Ala Gly Gly Met Ala Gln Gly Ser Pro

385                 390                 395                 400

Gly Val Glu Asn Glu Tyr Ile Asp Val Met Asn Gln Val Gln Glu Leu

                405                 410                 415

Thr Ser Phe Ser Ala Val Val Tyr Ser Ser Phe Asp Trp Ala Leu

            420                 425                 430

 

<210>4

<211>395

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG83356)

<220>

<221>MISC_FEATURE

<222>(1)..(395)

<223>YlPex3Bp

 

<400>4

Met Leu Gln Ser Leu Asn Arg Asn Lys Lys Arg Leu Ala Val Ser Thr

1               5                   10                  15

Gly Leu Ile Ala Val Ala Tyr Val Val Ile Ser Tyr Thr Thr Lys Arg

            20                  25                  30

Leu Ile Glu Lys Gln Glu Gln Lys Leu Glu Glu Glu Arg Ala Lys Glu

        35                  40                  45

Arg Leu Lys Gln Leu Phe Ala Gln Thr Gln Asn Glu Ala Ala Phe His

    50                  55                  60

Thr Ala Ser Val Leu Pro Gln Leu Cys Glu Gln Ile Met Glu Phe Val

65                  70                  75                  80

Ala Val Glu Lys Ile Ala Glu Gln Leu Gln Asn Met Arg Ala Glu Lys

                85                  90                  95

Arg Lys Lys Gln Asn Met Asp Asp Asp Lys His Ser Val Leu Ser Leu

            100                 105                 110

Gly Thr Glu Thr Thr Ala Ser Met Ala Asp Gly Gln Lys Met Ser Lys

        115                 120                 125

Ile Gln Leu Trp Asp Glu Leu Lys Ile Glu Ser Leu Thr Arg Ile Val

    130                 135                 140

Thr Leu Ile Tyr Cys Val Ser Leu Leu Asn Tyr Leu Ile Arg Leu Gln

145                 150                 155                 160

Thr Asn Ile Val Gly Arg Lys Arg Tyr Gln Asn Glu Ala Gly Pro Ala

                165                 170                 175

Gly Ala Thr Tyr Asp Met Ser Leu Glu Gln Cys Tyr Thr Trp Leu Leu

            180                 185                 190

Thr Arg Gly Trp Lys Ser Val Val Asp Asn Val Arg Arg Ser Val Gln

        195                 200                 205

Gln Val Phe Thr Gly Val Asn Pro Arg Gln Asn Leu Ser Leu Asp Glu

    210                 215                 220

Phe Ala Thr Leu Leu Lys Arg Val Gln Thr Leu Val Asn Ser Pro Pro

225                 230                 235                 240

Tyr Ser Thr Thr Pro Asn Thr Phe Leu Thr Ser Leu Leu Pro Pro Arg

                245                 250                 255

Glu Leu Glu Gln Leu Arg Leu Glu Lys Glu Lys Gln Ser Leu Ser Pro

            260                 265                 270

Asn Tyr Thr Tyr Gly Ser Pro Leu Lys Asp Leu Val Phe Glu Ser Ala

        275                 280                 285

Gln His Ile Gln Ser Pro Gln Gly Met Ser Ser Phe Arg Ala Ile Ile

    290                 295                 300

Asp Gln Ser Phe Lys Val Phe Leu Glu Lys Val Asn Glu Ser Gln Tyr

305                 310                 315                 320

Val Asn Pro Pro Ser Thr Gly Gly Lys Arg Ile Ala Val Gly Ala Leu

                325                 330                 335

Gln Pro Pro Ile Ile Ser Gly Gly Pro Lys Lys Val Lys Leu Ala Ser

            340                 345                 350

Leu Leu Ser Val Ala Thr Arg Gln Ser Ser Val Ile Ser His Ala Gln

        355                 360                 365

Pro Asn Pro Tyr Val Asp Ala Ile Asn Ser Val Ala Glu Tyr Asn Gly

    370                 375                 380

Leu Cys Ala Val Ile Tyr Ser Ser Phe Glu Gln

385                 390                 395

 

<210>5

<211>153

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG79130)

 

<220>

<221>MISC_FEATURE

<222>(1)..(153)

<223>YlPex4p

 

<400>5

Met Ala Ser Gln Lys Arg Leu Ile Lys Glu Leu Ala Ala Tyr Lys Lys

1               5                   10                  15

Asp Pro Asn Pro Cys Leu Ala Ser Leu Thr Ala Asp Gly Asp Ser Leu

            20                  25                  30

Tyr Lys Trp Thr Ala Val Met Arg Gly Thr Glu Gly Thr Ala Tyr Glu

        35                  40                  45

Asn Gly Leu Trp Gln Val Glu Ile Asn Ile Pro Glu Asn Tyr Pro Leu

    50                  55                  60

Gln Pro Pro Thr Met Phe Phe Arg Thr Lys Ile Cys His Pro Asn Ile

65                  70                  75                  80

His Phe Glu Thr Gly Glu Val Cys Ile Asp Val Leu Lys Thr Gln Trp

                85                  90                  95

Ser Pro Ala Trp Thr Ile Ser Ser Ala Cys Thr Ala Val Ser Ala Met

            100                 105                 110

Leu Ser Leu Pro Glu Pro Asp Ser Pro Leu Asn Ile Asp Ala Ala Asn

        115                 120                 125

Leu Val Arg Cys Gly Asp GluSer Ala Met Glu Gly Leu Val Arg Tyr

    130                 135                 140

Tyr Val Asn Lys Tyr Ala Ser Gly Asn

145                 150

 

<210>6

<211>598

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG78803)

 

<220>

<221>MISC_FEATURE

<222>(1)..(598)

<223>YlPex5p

 

<400>6

Met Ser Phe Met Arg Gly Gly Ser Glu Cys Ser Thr Gly Arg Asn Pro

1               5                   10                  15

Leu Ser Gln Phe Thr Lys His Thr Ala Glu Asp Arg Ser Leu Gln His

            20                  25                  30

Asp Arg Val Ala Gly Pro Ser Gly Gly Arg Val Gly Gly Met Arg Ser

        35                  40                  45

Asn Thr Gly Glu Met Ser Gln Gln Asp Arg Glu Met Met Ala Arg Phe

    50                  55                  60

Gly Ala Ala Gly Pro Glu Gln Ser Ser Phe Asn Tyr Glu Gln Met Arg

65                  70                  75                  80

His Glu Leu His Asn Met Gly Ala Gln Gly Gly Gln Ile Pro Gln Val

                85                  90                  95

Pro Ser Gln Gln Gly Ala Ala Asn Gly Gly Gln Trp Ala Arg Asp Phe

            100                 105                 110

Gly Gly Gln Gln Thr Ala Pro Gly Ala Ala Pro Gln Asp Ala Lys Asn

        115                 120                 125

Trp Asn Ala Glu Phe Gln Arg Gly Gly Ser Pro Ala Glu Ala Met Gln

    130                 135                 140

Gln Gln Gly Pro Gly Pro Met Gln Gly Gly Met Gly Met Gly Gly Met

145                 150                 155                 160

Pro Met Tyr Gly Met Ala Arg Pro Met Tyr Ser Gly Met Ser Ala Asn

                165                 170                 175

Met Ala Pro Gln Phe Gln Pro Gln Gln Ala Asn Ala Arg Val Val Glu

            180                 185                 190

Leu Asp Glu Gln Asn Trp Glu Glu Gln Phe Lys Gln Met Asp Ser Ala

        195                 200                 205

Val Gly Lys Gly Lys Glu Val Glu Glu Gln Thr Ala Glu Thr Ala Thr

    210                 215                 220

Ala Thr Glu Thr Val Thr Glu Thr Glu Thr Thr Thr Glu Asp Lys Pro

225                 230                 235                 240

Met Asp Ile Lys Asn Met Asp Phe Glu Asn Ile Trp Lys Asn Leu Gln

                245                 250                 255

Val Asn Val Leu Asp Asn Met Asp Glu Trp Leu Glu Glu Thr Asn Ser

            260                 265                 270

Pro Ala Trp Glu Arg Asp Phe His Glu Tyr Thr His Asn Arg Pro Glu

        275                 280                 285

Phe Ala Asp Tyr Gln Phe Glu Glu Asn Asn Gln Phe Met Glu His Pro

    290                 295                 300

Asp Pro Phe Lys Ile Gly Val Glu Leu Met Glu Thr Gly Gly Arg Leu

305                 310                 315                 320

Ser Glu Ala Ala Leu Ala Phe Glu Ala Ala Val Gln Lys Asn Thr Glu

                325                 330                 335

His Ala Glu Ala Trp Gly Arg Leu Gly Ala Cys Gln Ala Gln Asn Glu

            340                 345                 350

Lys Glu Asp Pro Ala Ile Arg Ala Leu Glu Arg Cys Ile Lys Leu Glu

        355                 360                 365

Pro Gly Asn Leu Ser Ala Leu Met Asn Leu Ser Val Ser Tyr Thr Asn

    370                 375                 380

Glu Gly Tyr Glu Asn Ala Ala Tyr Ala Thr Leu Glu Arg Trp Leu Ala

385                 390                 395                 400

Thr Lys Tyr Pro Glu Val Val Asp Gln Ala Arg Asn Gln Glu Pro Arg

                405                 410                 415

Leu Gly Asn Glu Asp Lys Phe Gln Leu His Ser Arg Val Thr Glu Leu

            420                 425                 430

Phe Ile Arg Ala Ala Gln Leu Ser Pro Asp Gly Ala Asn Ile Asp Ala

        435                 440                 445

Asp Val Gln Val Gly Leu Gly Val Leu Phe Tyr Gly Asn Glu Glu Tyr

    450                 455                 460

Asp Lys Ala Ile Asp Cys Phe Asn Ala Ala Ile Ala Val Arg Pro Asp

465                 470                 475                 480

Asp Ala Leu Leu Trp Asn Arg Leu Gly Ala Thr Leu Ala Asn Ser His

                485                 490                 495

Arg Ser Glu Glu Ala Ile Asp Ala Tyr Tyr Lys Ala Leu Glu Leu Arg

            500                 505                 510

Pro Ser Phe Val Arg Ala Arg Tyr Asn Leu Gly Val Ser Cys Ile Asn

        515                 520                 525

Ile Gly Cys Tyr Lys Glu Ala Ala Gln Tyr Leu Leu Gly Ala Leu Ser

    530                 535                 540

Met His Lys Val Glu Gly Val Gln Asp Asp Val Leu Ala Asn Gln Ser

545v550                 555                 560

Thr Asn Leu Tyr Asp Thr Leu Lys Arg Val Phe Leu Gly Met Asp Arg

                    565                 570                 575

Arg Asp Leu Val Ala Lys Val Gly Asn Gly Met Asp Val Asn Gln Phe

                580                 585                 590

Arg Asn Glu Phe Glu Phe

        595

 

<210>7

<211>1024

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG82306)

 

<220>

<221>MISC_FEATURE

<222>(1)..(1024)

<223>YlPex6p

 

<400>7

Met Pro Ser Ile Ser His Lys Pro Ile Thr Ala Lys Leu Val Ala Ala

1               5                   10                  15

Pro Asp Ala Thr Lys Leu Glu Leu Ser Ser Tyr Leu Tyr Gln Gln Leu

            20                  25                  30

Phe Ser Asp Lys Pro Ala Glu Pro Tyr Val Ala Phe Glu Ala Pro Gly

        35                  40                  45

Ile Lys Trp Ala Leu Tyr Pro Ala Ser Glu Asp Arg Ser Leu Pro Gln

    50                  55                  60

Tyr Thr Cys Lys Ala Asp Ile Arg His Val Ala Gly Ser Leu Lys Lys

65                  70                  75                  80

Phe Met Pro Val Val Leu Lys Arg Val Asn Pro Val Thr Ile Glu His

                85                  90                  95

Ala Ile Val Thr Val Pro Ala Ser Gln Tyr Glu Thr Leu Asn Thr Pro

            100                 105                 110

Glu Gln Val Leu Lys Ala Leu Glu Pro Gln Leu Asp Lys Asp Arg Pro

        115                 120                 125

Val Ile Arg Gln Gly Asp Val Leu Leu Asn Gly Cys Arg Val Arg Leu

    130                 135                 140

Cys Glu Pro Val Asn Gln Gly Lys Val Val Lys Gly Thr Thr Lys Leu

145                 150                 155                 160

Thr Val Ala Lys Glu Gln Glu Thr Ile Gln Pro Ala Asp Glu Ala Ala

                165                 170                 175

Asp Val Ala Phe Asp Ile Ala Glu Phe Leu Asp Phe Asp Thr Ser Val

            180                 185                 190

Ala Lys Thr Arg Glu Ser Thr Asn Leu Gln Val Ala Pro Leu Glu Gly

        195                 200                 205

Ala Ile Pro Thr Pro Leu Ser Asp Arg Phe Asp Asp Cys Glu Ser Arg

    210                 215                 220

Gly Phe Val Lys Ser Glu Thr Met Ser Lys Leu Gly Val Phe Ser Gly

225                 230                 235                 240

Asp Ile Val Ser Ile Lys Thr Lys Asn Gly Ala Glu Arg Val Leu Arg

                245                 250                 255

Leu Phe Ala Tyr Pro Glu Pro Asn Thr Val Lys Tyr Asp Val Val Tyr

            260                 265                 270

Val Ser Pro Ile Leu Tyr His Asn Ile Gly Asp Lys Glu Ile Glu Val

        275                 280                 285

Thr Pro Asn Gly Glu Thr His Lys Ser Val Gly Glu Ala Leu Asp Ser

    290                 295                 300

Val Leu Glu AIa Ala Glu Glu Val Lys Leu Ala Arg Val Leu Gly Pro

305                 310                 315                 320

Thr Thr Thr Asp Arg Thr Phe Gln Thr Ala Tyr His Ala Gly Leu Gln

                325                 330                 335

Ala Tyr Phe Lys Pro Val Lys Arg Ala Val Arg Val Gly Asp Leu Ile

            340                 345                 350

Pro Ile Pro Phe Asp Ser Ile Leu Ala Arg Thr Ile Gly Glu Asp Pro

        355                 360                 365

Glu Met Ser His Ile Pro Leu Glu Ala Leu Ala Val Lys Pro Asp Ser

    370                 375                 380

Val Ala Trp Phe Gln Val Thr Ser Leu Asn Gly Ser Glu Asp Pro Ala

385                 390                 395                 400

Ser Lys Gln Tyr Leu Val Asp Ser Ser Gln Thr Lys Leu Ile Glu Gly

                405                 410                 415

Gly Thr Thr Ser Ser Ala Val Ile Pro Thr Ser Val Pro Trp Arg Glu

            420                 425                 430

Tyr Leu Gly Leu Asp Thr Leu Pro Lys Phe Gly Ser Glu Phe Ala Tyr

        435                 440                 445

Ala Asp Lys Ile Arg Asn Leu Val Gln Ile Ser Thr Ser Ala Leu Ser

    450                 455                 460

His Ala Lys Leu Asn Thr Ser Val Leu Leu His Ser Ala Lys Arg Gly

465                 470                 475                 480

Val Gly Lys Ser Thr Val Leu Arg Ser Val Ala Ala Gln Cys Gly Ile

                485                 490                 495

Ser Val Phe Glu Ile Ser Cys Phe Gly Leu Ile Gly Asp Asn Glu Ala

            500                 505                 510

Gln Thr Leu Gly Thr Leu Arg Ala Lys Leu Asp Arg Ala Tyr Gly Cys

        515                 520                 525

Ser Pro Cys Val Val Val Leu Gln His Leu Glu Ser Ile Ala Lys Lys

    530                 535                 540

Ser Asp Gln Asp Gly Lys Asp Glu Gly Ile Val Ser Lys Leu Val Asp

545                 550                 555                 560

Val Leu Ala Asp Tyr Ser Gly His Gly Val Leu Leu Ala Ala Thr Ser

                565                 570                 575

Asn Asp Pro Asp Lys Ile Ser Glu Ala Ile Arg Ser Arg Phe Gln Phe

            580                 585                 590

Glu Ile Glu Ile Gly Val Pro Ser Glu Pro Gln Arg Arg Gln Ile Phe

        595                 600                 605

Ser His Leu Thr Lys Ser Gly Pro Gly Gly Asp Ser Ile Arg Asn Ala

    610                 615                 620

Pro Ile Ser Leu Arg Ser Asp Val Ser Val Glu Asn Leu Ala Leu Gln

625                 630                 635                 640

Ser Ala Gly Leu Thr Pro Pro Asp Leu Thr Ala Ile Val Gln Thr Thr

                645                 650                 655

Arg Leu Arg Ala Ile Asp Arg Leu Asn Lys Leu Thr Lys Asp Ser Asp

            660                 665                 670

Thr Thr Leu Asp Asp Leu Leu Thr Leu Ser His Gly Thr Leu Gln Leu

        675                 680                 685

Thr Pro Ser Asp Phe Asp Asp Ala Ile Ala Asp Ala Arg Gln Lys Tyr

    690                 695                 700

Ser Asp Ser Ile Gly Ala Pro Arg Ile Pro Asn Val Gly Trp Asp Asp

705                 710                 715                 720

Val Gly Gly Met Glu Gly Val Lys Lys Asp Ile Leu Asp Thr Ile Glu

                725                 730                 735

Thr Pro Leu Lys Tyr Pro His Trp Phe Ser Asp Gly Val Lys Lys Arg

            740                 745                 750

Ser Gly Ile Leu Phe Tyr Gly Pro Pro Gly Thr Gly Lys Thr Leu Leu

        755                 760                 765

Ala Lys Ala Ile Ala Thr Thr Phe Ser Leu Asn Phe Phe Ser Val Lys

    770                 775                 780

Gly Pro Glu Leu Leu Asn Met Tyr Ile Gly Glu Ser Glu Ala Asn Val

785                 790                 795                 800

Arg Arg Val Phe Gln Lys Ala Arg Asp Ala Lys Pro Cys Val Val Phe

                805                 810                 815

Phe Asp Glu Leu Asp Ser Val Ala Pro Gln Arg Gly Asn Gln Gly Asp

            820                 825                 830

Ser Gly Gly Val Mer Asp Arg Ile Val Ser Gln Leu Leu Ala Glu Leu

        835                 840                 845

Asp Gly Met Ser Thr Ala Gly Gly Glu Gly Val Phe Val Val Gly Ala

    850                 855                 860

Thr Asn Arg Pro Asp Leu Leu Asp Glu Ala Leu Leu Arg Pro Gly Arg

865                 870                 875                 880

Phe Asp Lys Met Leu Tyr Leu Gly Ile Ser Asp Thr His Glu Lys Gln

                885                 890                 895

Gln Thr Ile Met Glu Ala Leu Thr Arg Lys Phe Arg Leu Ala Ala Asp

            900                 905                 910

Val Ser Leu Glu Ala Ile Ser Lys Arg Cys Pro Phe Thr Phe Thr Gly

        915                 920                 925

Ala Asp Phe Tyr Ala Leu Cys Ser Asp Ala Met Leu Asn Ala Met Thr

    930                 935                 940

Arg Thr Ala Asn Glu Val Asp Ala Lys Ile Lys Leu Leu Asn Lys Asn

945                 950                 955                 960

Arg Glu Glu Ala Gly Glu Glu Pro Val Ser Ile Arg Trp Trp Phe Asp

                965                 970                 975

His Glu Ala Thr Lys Ser Asp Ile Glu Val Glu Val Ala Gln Gln Asp

            980                 985                 990

Phe Glu Lys Ala Lys Asp Glu Leu  Ser Pro Ser Val Ser  Ala Glu Glu

        995                 1000                 1005

Leu Gln  His Tyr Leu Lys Leu  Arg Gln Gln Phe Glu  Gly Gly Lys

    1010                 1015                 1020

Lys

 

<210>8

<211>356

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG78389)

 

<220>

<221>MISC_FEATURE

<222>(1)..(356)

<223>YlPex7p

 

<400>8

Met Leu Gly Phe Lys Thr Gln Gly Phe Asn Gly Tyr Ala Ala Asn Tyr

1               5                   10                  15

Ser Pro Phe Phe Asn Asp Lys Ile Ala Val Gly Thr Ala Ala Asn Tyr

            20                  25                  30

Gly Leu Val Gly Asn Gly Lys Leu Phe Ile Leu Gly Ile Ser Pro Glu

        35                  40                  45

Gly Arg Met Val Cys Glu Gly Gln Phe Asp Thr Gln Asp Gly Ile Phe

    50                  55                  60

Asp Val Ala Trp Ser Glu Gln His Glu Asn His Val Ala Thr Ala Cys

65                  70                  75                  80

Gly Asp Gly Ser Val Lys Leu Phe Asp Ile Lys Ala Gly Ala Phe Pro

                85                  90                  95

Leu Val Ser Phe Lys Glu His Thr Arg Glu Val Phe Ser Val Asn Trp

            100                 105                 110

Asn Met Ala Asn Lys Ala Leu Phe Cys Thr Ser Ser Trp Asp Ser Thr

        115                 120                 125

Ile Lys Ile Trp Thr Pro Glu Arg Thr Asn Ser Ile Met Thr Leu Gly

    130                 135                 140

Gln Pro Ala Pro Ala Gln Gly Thr Asn Ala Ser Ala His Ile Gly Arg

145                 150                 155                 160

Gln Thr Ala Pro Asn Gln Ala Ala Ala Gln Glu Cys Ile Tyr Ser Ala

                165                 170                 175

Lys Phe Ser Pro His Thr Asp Ser Ile Ile Ala Ser Ala His Ser Thr

            180                 185                 190

Gly Met Val Lys Val Trp Asp Thr Arg Ala Pro Gln Pro Leu Gln Gln

        195                 200                 205

Gln Phe Ser Thr Gln Gln Thr Glu Ser Gly Gly Pro Pro Glu Val Leu

    210                 215                 220

Ser Leu Asp Trp Asn Lys Tyr Arg Pro Thr Val Ile Ala Thr Gly Gly

225                 230                 235                 240

Val Asp Arg Ser Val Gln Val Tyr Asp Ile Arg Met Thr Gln Pro Ala

                245                 250                 255

Ala Asn Gln Pro Val Gln Pro Leu Ser Leu Ile Leu Gly His Arg Leu

            260                 265                 270

Pro Val Arg Gly Val Ser Trp Ser Pro His His Ala Asp Leu Leu Leu

        275                 280                 285

Ser Cys Ser Tyr Asp Met Thr Ala Arg Val Trp Arg Asp Ala Ser Thr

    290                 295                 300

Gly Gly Asn Tyr Leu Ala Arg Gln Arg Gly Gly Thr Glu Val Lys Cys

305                 310                 315                 320

Met Asp Arg His Thr Glu Phe Val Ile Gly Gly Asp Trp Ser Leu Trp

                325                 330                 335

Gly Asp Pro Gly Trp Ile Thr Thr Val Gly Trp Asp Gln Met Val Tyr

            340                 345                 350

Val Trp His Ala

        355

<210>9

<211>671

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG80447) 

 

<220>

<221>MISC_FEATURE

<222>(1)..(671)

<223>YlPex8p

 

<400>9

Met Asn Lys Tyr Leu Val Pro Pro Pro Gln Ala Asn Arg Thr Val Thr

1               5                   10                  15

Asn Leu Asp Leu Leu Ile Asn Asn Leu Arg Gly Ser Ser Thr Pro Gly

            20                  25                  30

Ala Ala Glu Val Asp Thr Arg Asp Ile Leu Gln Arg Ile Val Phe Ile

        35                  40                  45

Leu Pro Thr Ile Lys Asn Pro Leu Asn Leu Asp Leu Val Ile Lys Glu

    50                  55                  60

Ile Ile Asn Ser Pro Arg Leu Leu Pro Pro Leu Ile Asp Leu His Asp

65                  70                  75                  80

Tyr Gln Gln Leu Thr Asp Ala Phe Arg Ala Thr Ile Lys Arg Lys Ala

                85                  90                  95

Leu Val Thr Asp Pro Thr Ile Ser Phe Glu Ala Trp Leu Glu Thr Cys

            100                 105                 110

Phe Gln Val Ile Thr Arg Phe Ala Gly Pro Gly Trp Lys Lys Leu Pro

        115                 120                 125

Leu Leu Ala Gly Leu Ile Leu Ala Asp Tyr Asp Ile Ser Ala Asp Gly

    130                 135                 140

Pro Thr Leu Glu Arg Lys Pro Gly Phe Pro Ser Lys Leu Lys His Leu

145                 150                 155                 160

Leu Lys Arg Glu Phe Val Thr Thr Phe Asp Gln Cys Leu Ser Ile Asp

                165                 170                 175

Thr Arg Asn Arg Ser Asp Ala Thr Lys Trp Val Pro Val Leu Ala Cys

            180                 185                 190

Ile Ser Ile Ala Gln Val Tyr Ser Leu Leu Gly Asp Val Ala Ile Asn

        195                 200                 205

Tyr Arg Arg Phe Leu Gln Val Gly Leu Asp Leu Ile Phe Ser Asn Tyr

    210                 215                 220

Gly Leu Glu Met Gly Thr Ala Leu Ala Arg Leu His Ala Glu Ser Gly

225                 230                 235                 240

Gly Asp Ala Thr Thr Ala Gly Gly Leu Ile Gly Lys Lys Leu Lys Glu

                245                 250                 255

Pro Val Val Ala Leu Leu Asn Thr Phe Ala His Ile Ala Ser Ser Cys

            260                 265                 270

Ile Val His Val Asp Ile Asp Tyr Ile Asp Arg Ile Gln Asn Lys Ile

        275                 280                 285

Ile Leu Val Cys Glu Asn Gln Ala Glu Thr Trp Arg Ile Leu Thr Ile

    290                 295                 300

Glu Ser Pro Thr Val Met His His Gln Glu Ser Val Gln Tyr Leu Lys

305                 310                 315                 320

Trp Glu Leu Phe Thr Leu Cys Ile Ile Met Gln Gly Ile Ala Asn Met

                325                 330                 335

Leu Leu Thr Gln Lys Met Asn Gln Phe Met Tyr Leu Gln Leu Ala Tyr

            340                 345                 350

Lys Gln Leu Gln Ala Leu His Ser Ile Tyr Phe Ile Val Asp Gln Met

        355                 360                 365

Gly Ser Gln Phe Ala Ala Tyr Asp Tyr Val Phe Phe Ser Ala Ile Asp

    370                 375                 380

Val Leu Leu Ser Glu Tyr Ala Pro Tyr Ile Lys Asn Arg Gly Thr Ile

385                 390                 395                 400

Pro Pro Asn Lys Glu Phe Val Ala Glu Arg Leu Ala Ala Asn Leu Ala

                405                 410                 415

Gly Thr Ser Asn Val Gly Ser His Leu Pro Ile Asp Arg Ser Arg Val

            420                 425                 430

Leu Phe Ala Leu Asn Tyr Tyr Glu Gln Leu Val Thr Val Cys His Asp

        435                 440                 445

Ser Cys Val Glu Thr Ile Ile Tyr Pro Met Ala Arg Ser Phe Leu Tyr

    450                 455                 460

Pro Thr Ser Asp Ile Gln Gln Leu Lys Pro Leu Val Glu Ala Ala His

465                 470                 475                 480

Ser Val Ile Leu Ala Gly Leu Ala Val Pro Thr Asn Ala Val Val Asn

                485                 490                 495

Ala Lys Leu Ile Pro Glu Tyr Met Gly Gly Val Leu Pro Leu Phe Pro

            500                 505                 510

Gly Val Phe Ser Trp Asn Gln Phe Val Leu Ala Ile Gln Ser Ile Val

        515                 520                 525

Asn Thr Val Ser Pro Pro Ser Glu ValPhe Lys Thr Asn Gln Lys Leu

    530                 535                 540

Phe Arg Leu Val Leu Asp Ser Leu Met Lys Lys Cys Arg Asp Thr Pro

545                 550                 555                 560

Val Gly Ile Pro Val Pro His Ser Val Thr Val Ser Gln Glu Gln Glu

                565                 570                 575

Asp Ile Pro Pro Thr Gln Arg Ala Val Val Met Leu Ala Leu Ile Asn

            580                 585                 590

Ser Leu Pro Tyr Val Asp Ile Arg Ser Phe Glu Leu Trp Leu Gln Glu

        595                 600                 605

Thr Trp Asn Met Ile Glu Ala Thr Pro Met Leu Ala Glu Asn Ala Pro

    610                 615                 620

Asn Lys Glu Leu Ala His Ala Glu His Glu Phe Leu Val Leu Glu Met

625                 630                 635                 640

Trp Lys Met Ile Ser Gly Asn Ile Asp Gln Arg Leu Asn Asp Val Ala

                645                 650                 655

Ile Arg Trp Trp Tyr Lys Lys Asn Ala Arg Val His Gly Thr Leu

            660                 665                 670

 

<210>10

<211>377

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG81606)

 

<220>

<221>MISC_FEATURE

<222>(1)..(377)

<223>YlPex10p

 

<400>10

Met Trp Gly Ser Ser His Ala Phe Ala Gly Glu Ser Asp Leu Thr Leu

1               5                   10                  15

Gln Leu His Thr Arg Ser Asn Met Ser Asp Asn Thr Thr Ile Lys Lys

            20                  25                  30

Pro Ile Arg Pro Lys Pro Ile Arg Thr Glu Arg Leu Pro Tyr Ala Gly

        35                  40                  45

Ala Ala Glu Ile Ile Arg Ala Asn Gln Lys Asp His Tyr Phe Glu Ser

    50                  55                  60

Val Leu Glu Gln His Leu Val Thr Phe Leu Gln Lys Trp Lys Gly Val

65                  70                  75                  80

Arg Phe Ile His Gln Tyr Lys Glu Glu Leu Glu Thr Ala Ser Lys Phe

                85                  90                  95

Ala Tyr Leu Gly Leu Cys Thr Leu Val Gly Ser Lys Thr Leu Gly Glu

            100                 105                 110

Glu Tyr Thr Asn Leu Met Tyr Thr Ile Arg Asp Arg Thr Ala Leu Pro

        115                 120                 125

Gly Val Val Arg Arg Phe Gly Tyr Val Leu Ser Asn Thr Leu Phe Pro

    130                 135                 140

Tyr Leu Phe Val Arg Tyr Met Gly Lys Leu Arg Ala Lys Leu Met Arg

145                 150                 155                 160

Glu Tyr Pro His Leu Val Glu Tyr Asp Glu Asp Glu Pro Val Pro Ser

                165                 170                 175

Pro Glu Thr Trp Lys Glu Arg Val Ile Lys Thr Phe Val Asn Lys Phe

            180                 185                 190

Asp Lys Phe Thr Ala Leu Glu Gly Phe Thr Ala Ile His Leu Ala Ile

        195                 200                 205

Phe Tyr Val Tyr Gly Ser Tyr Tyr Gln Leu Ser Lys Arg Ile Trp Gly

    210                 215                 220

Met Arg Tyr Val Phe Gly His Arg Leu Asp Lys Asn Glu Pro Arg Ile

225                 230                 235                 240

Gly Tyr Glu Met Leu Gly Leu Leu Ile Phe Ala Arg Phe Ala Thr Ser

                245                 250                 255

Phe Val Gln Thr Gly Arg Glu Tyr Leu Gly Ala Leu Leu Glu Lys Ser

            260                 265                 270

Val Glu Lys Glu Ala Gly Glu Lys Glu Asp Glu Lys Glu Ala Val Val

        275                 280                 285

Pro Lys Lys Lys Ser Ser Ile Pro Phe Ile Glu Asp Thr Glu Gly Glu

    290                 295                 300

Thr Glu Asp Lys Ile Asp Leu Glu Asp Pro Arg Gln Leu Lys Phe Ile

305                 310                 315                 320

Pro Glu Ala Ser Arg Ala Cys Thr Leu Cys Leu Ser Tyr Ile Ser Ala

                325                 330                 335

Pro Ala Cys Thr Pro Cys Gly His Phe Phe Cys Trp Asp Cys Ile Ser

            340                 345                 350

Glu Trp Val Arg Glu Lys Pro Glu Cys Pro Leu Cys Arg Gln Gly Val

        355                 360                 365

Arg Glu Gln Asn Leu Leu Pro Ile Arg

    370                 375

 

<210>11

<211>408

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG81532)

 

<220>

<221>MISC_FEATURE

<222>(1)..(408)

<223>YlPex12p

 

<400>11

Met Asp Tyr Phe Ser Ser Leu Asn Ala Ser Gln Leu Asp Pro Asp Val

1               5                   10                  15

Pro Thr Leu Phe Glu Leu Leu Ser Ala Lys Gln Leu Glu Gly Leu Ile

            20                  25                  30

Ala Pro Ser Val Arg Tyr Ile Leu Ala Phe Tyr Ala Gln Arg His Pro

        35                  40                  45

Arg Tyr Leu Leu Arg Ile Val Asn Arg Tyr Asp Glu Leu Tyr Ala Leu

    50                  55                  60

Phe Mer Gly Leu Val Glu Tyr Tyr Asn Leu Lys Thr Trp Asn Ala Ser

65                  70                  75                  80

Phe Thr Glu Lys Phe Tyr Gly Leu Lys Arg Thr Gln Ile Leu Thr Asn

                85                  90                  95

Pro Ala Leu Arg Thr Arg Gln Ala Val Pro Asp Leu Val Glu Ala Glu

            100                 105                 110

Lys Arg Leu Ser Lys Lys Lys Ile Trp Gly Ser Leu Phe Phe Leu Ile

        115                 120                 125

Val Val Pro Tyr Val Lys Glu Lys Leu Asp Ala Arg Tyr Glu Arg Leu

    130                 135                 140

Lys Gly Arg Tyr Leu Ala Arg Asp Ile Asn Glu Glu Arg Ile Glu Ile

145                 150                 155                 160

Lys Arg Thr Gly Thr Ala Gln Gln Ile Ala Val Phe Glu Phe Asp Tyr

                165                 170                 175

Trp Leu Leu Lys Leu Tyr Pro Ile Val Thr Met Gly Cys Thr Thr Ala

            180                 185                 190

Thr Leu Ala Phe His Met Leu Phe Leu Phe Ser Val Thr Arg Ala Tyr

        195                 200                 205

Ser Ile Asp Asp Phe Leu Leu Asn Ile Gln Phe Ser Arg Met Thr Arg

    210                 215                 220

Tyr Asp Tyr Gln Met Glu Thr Gln Arg Asp Ser Arg Asn Ala Ala Asn

225                 230                 235                 240

Val Ala His Thr Met Lys Ser Ile Ser Glu Tyr Pro Val Ala Glu Arg

                245                 250                 255

Val Met Leu Leu Leu Thr Thr Lys Ala Gly Ala Asn Ala Met Arg Ser

            260                 265                 270

Ala Ala Leu Ser Gly Leu Ser Tyr Val Leu Pro Thr Ser Ile Phe Ala

        275                 280                 285

Leu Lys Phe Leu Glu Trp Trp Tyr Ala Ser Asp Phe Ala Arg Gln Leu

    290                 295                 300

Asn Gln Lys Arg Arg Gly Asp Leu Glu Asp Asn Leu Pro Val Pro Asp

305                 310                 315                 320

Lys Val Lys Gly Ala Asp Lys Leu Ala Glu Ser Val Ala Lys Trp Lys

                325                 330                 335

Glu Asp Thr Ser Lys Cys Pro Leu Cys Ser Lys Glu Leu Val Asn Pro

            340                 345                 350

Thr Val Ile Glu Ser Gly Tyr Val Phe Cys Tyr Thr Cys Ile Tyr Arg

        355                 360                 365

His Leu Glu Asp Gly Asp Glu Glu Thr Gly Gly Arg Cys Pro Val Thr

    370                 375                 380

Gly Gln Lys Leu Leu Gly Cys Arg Trp Gln Asp Asp Val Trp Gln Val

385                 390                 395                 400

Thr Gly Leu Arg Arg Leu Met Val

                405

 

<210>12

<211>412

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG81789)

 

<220>

<221>MISC_FEATURE

<222>(1)..(412)

<223>YlPex13p

 

<400>12

Met Ser Val Pro Arg Pro Lys Pro Trp Glu Gly Ala Ser Gly Ser Ser

1               5                   10                  15

Ala Ala Thr Ala Thr Pro Ala Ala Thr Ala Thr Pro Ala Ser Thr Asp

            20                  25                  30

Ala Val Ser Ser Ser Ala Gly Ser Ala Thr Gly Ala Pro Glu Leu Pro

        35                  40                  45

Ser Arg Pro Ser Ala Met Gly Ser Thr Ser Asn Ala Leu Ser Ser Pro

    50                  55                  60

Met Gly Ser Ser Met Asn Ser Gly Tyr Gly Gly Met Asn Ser Gly Tyr

65                  70                  75                  80

Gly Gly Met Gly Ser Ser Tyr Gly Ser Gly Tyr Gly Ser Ser Tyr Gly

                85                  90                  95

Met Gly Ser Ser Tyr Gly Ser Gly Tyr Gly Ser Gly Leu Gly Gly Tyr

            100                 105                 110

Gly Ser Tyr Gly Gly Met Gly Gly Met Gly Gly Met Tyr Gly Ser Arg

        115                 120                 125

Tyr Gly Gly Tyr Gly Ser Tyr Gly Gly Met Gly Gly Tyr Gly Gly Tyr

    130                 135                 140

Gly Gly Met Gly Gly Gly Pro Met Gly Gln Asn Gly Leu Ala Gly Gly

145                 150                 155                 160

Thr Gln Ala Thr Phe Gln Leu Ile Glu Ser Ile Val Gly Ala Val Gly

                165                 170                 175

Gly Phe Ala Gln Met Leu Glu Ser Thr Tyr Met Ala Thr Gln Ser Ser

            180                 185                 190

Phe Phe Ala Met Val Ser Val Ala Glu Gln Phe Gly Asn Leu Lys Asn

        195                 200                 205

Thr Leu Gly Ser Leu Leu Gly Ile Tyr Ala Ile Met Arg Trp Ala Arg

    210                 215                 220

Arg Leu Val Ala Lys Leu Ser Gly Gln Pro Val Thr Gly Ala Asn Gly

225                 230                 235                 240

Ile Thr Pro Ala Gly Phe Ala Lys Phe Glu Ala Thr Gly Gly Ala Ala

                245                 250                 255

Gly Pro Gly Arg Gly Pro Arg Pro Ser Tyr Lys Pro Leu Leu Phe Phe

            260                 265                 270

Leu Thr Ala Val Phe Gly Leu Pro Tyr Leu Leu Gly Arg Leu Ile Lys

        275                 280                 285

Ala Leu Ala Ala Lys Gln Glu Gly Met Tyr Asp Glu His Gly Asn Leu

    290                 295                 300

Leu Pro Gly Ala Gln Met Gly Met Gly Gly Pro Gly Met Glu Gly Gly

305                 310                 315                 320

Ala Glu Ile Asp Pro Ser Lys Leu Glu Phe Cys Arg Ala Asn Phe Asp

                325                 330                 335

Phe Val Pro Glu Asn Pro Gln Leu Glu Leu Glu Leu Arg Lys Gly Asp

            340                 345                 350

Leu Val Ala Val Leu Ala Lys Thr Asp Pro Met Gly Asn Pro Ser Gln

        355                 360                 365

Trp Trp Arg Val Arg Thr Arg Asp Gly Arg Ser Gly Tyr Val Pro Ala

    370                 375                 380

Asn Tyr Leu Glu Val Ile Pro Arg Pro Ala Val Glu Ala Pro Lys Lys

385                 390                 395                 400

Val Glu Glu Ile Gly Ala Ser Ala Val Pro Val Asn

                405                 410

 

<210>13

<211>380

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG79323)

 

<220>

<221>MISC_FEATURE

<222>(1)..(380)

<223>YlPex14p

 

<400>13

Met Ile Pro Ser Cys Leu Ser Thr Gln His Met Ala Pro Arg Glu Asp

1               5                   10                  15

Leu Val Gln Ser Ala Val Ala Phe Leu Asn Asp Pro Gln Ala Ala Thr

            20                  25                  30

Ala Pro Leu Ala Lys Arg Ile Glu Phe Leu Glu Ser Lys Asp Met Thr

        35                  40                  45

Pro Glu Glu Ile Glu Glu Ala Leu Lys Arg Ala Gly Ser Gly Ser Ala

    50                  55                  60

Gln Ser His Pro Gly Ser Val Val Ser His Gly Gly Ala Ala Pro Thr

65                  70                  75                  80

Val Pro Ala Ser Tyr Ala Phe Gln Ser Ala Pro Pro Leu Pro Glu Arg

                85                  90                  95

Asp Trp Lys Asp Val Phe Ile Met Ala Thr Val Thr Val Gly Val Gly

            100                 105                 110

Phe Gly Leu Tyr Thr Val Ala Lys Arg Tyr Leu Met Pro Leu Ile Leu

        115                 120                 125

Pro Pro Thr Pro Pro Ser Leu Glu Ala Asp Lys Glu Ala Leu Glu Ala

    130                 135                 140

Glu Phe Ala Arg Val Gln Gly Leu Leu Asp Gln Val Gln Gln Asp Thr

145                 150                 155                 160

Glu Glu Val Lys Asn Ser Gln Val Glu Val Ala Lys Arg Val Thr Asp

                165                 170                 175

Ala Leu Lys Gly Val Glu Glu Thr Ile Asp Gln Leu Lys Ser Gln Thr

            180                 185                 190

Lys Lys Arg Asp Asp Glu Met Lys Leu Val Thr Ala Glu Val Glu Arg

        195                 200                 205

Ile Arg Asp Arg Leu Pro Lys Asn Ile Asp Lys Leu Lys Asp Ser Gln

    210                 215                 220

Glu Gln Gly Leu Ala Asp Ile Gln Ser Glu Leu Lys Ser Leu Lys Gln

225                 230                 235                 240

Leu Leu Ser Thr Arg Thr Ala Ala Ser Ser Gly Pro Lys Leu Pro Pro

                245                 250                 255

Ile Pro Pro Pro Ser Ser Tyr Leu Thr Arg Lys Ala Ser Pro Ala Val

            260                 265                 270

Pro Ala Ala Ala Pro Ala Pro Val Thr Pro Gly Ser Pro Val His Asn

        275                 280                 285

Val Ser Ser Ser Ser Thr Val Pro Ala Asp Arg Asp Asp Phe Ile Pro

    290                 295                 300

Thr Pro Ala Gly Ala Val Pro Met Ile Pro Gln Pro Ala Ser Met Ser

305                 310                 315                 320

Ser Ser Ser Thr Ser Thr Val Pro Asn Ser Ala Ile Ser Ser Ala Pro

                325                 330                 335

Ser Pro Ile Gln Glu Pro Glu Pro Phe Val Pro Glu Pro Gly Asn Ser

            340                 345                 350

Ala Val Lys Lys Pro Ala Pro Lys Ala Ser Ile Pro Ala Trp Gln Leu

        355                 360                 365

Ala Ala Leu Glu Lys Glu Lys Glu Lys Glu Lys Glu

370                 375                 380

 

<210>14

<211>391

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG79622)

 

<220>

<221>MISC_FEATURE

<222>(1)..(391)

<223>YlPex16p

 

<400>14

Met Thr Asp Lys Leu Val Lys Val Met Gln Lys Lys Lys Ser Ala Pro

1               5                   10                  15

Gln Thr Trp Leu Asp Ser Tyr Asp Lys Phe Leu Val Arg Asn Ala Ala

            20                  25                  30

Ser Ile Gly Ser Ile Glu Ser Thr Leu Arg Thr Val Ser Tyr Val Leu

        35                  40                  45

Pro Gly Arg Phe Asn Asp Val Glu Ile Ala Thr Glu Thr Leu Tyr Ala

    50                  55                  60

Val Leu Asn Val Leu Gly Leu Tyr His Asp Thr Ile Ile Ala Arg Ala

65                  70                  75                  80

Val Ala Ala Ser Pro Asn Ala Ala Ala Val Tyr Arg Pro Ser Pro His

                85                  90                  95

Asn Arg Tyr Thr Asp Trp Phe Ile Lys Asn Arg Lys Gly Tyr Lys Tyr

            100                 105                 110

Ala Ser Arg Ala Val Thr Phe Val Lys Phe Gly Glu Leu Val Ala Glu

        115                 120                 125

Met Val Ala Lys Lys Asn Gly Gly Glu Met Ala Arg Trp Lys Cys Ile

    130                 135                 140

Ile Gly Ile Glu Gly Ile Lys Ala Gly Leu Arg Ile Tyr Met Leu Gly

145                 150                 155                 160

Ser Thr Leu Tyr Gln Pro Leu Cys Thr Thr Pro Tyr Pro Asp Arg Glu

                165                 170                 175

Val Thr Gly Glu Leu Leu Glu Thr Ile Cys Arg Asp Glu Gly Glu Leu

            180                 185                 190

Asp Ile Glu Lys Gly Leu Met Asp Pro Gln Trp Lys Met Pro Arg Thr

        195                 200                 205

Gly Arg Thr Ile Pro Glu Ile Ala Pro Thr Asn Val Glu Gly Tyr Leu

    210                 215                 220

Leu Thr Lys Val Leu Arg Ser Glu Asp Val Asp Arg Pro Tyr Asn Leu

225                 230                 235                 240

Leu Ser Arg Leu Asp Asn Trp Gly Val Val Ala Glu Leu Leu Ser Ile

                245                 250                 255

Leu Arg Pro Leu Ile Tyr Ala Cys Leu Leu Phe Arg Gln His Val Asn

            260                 265                 270

Lys Thr Val Pro Ala Ser Thr Lys Ser Lys Phe Pro Phe Leu Asn Ser

        275                 280                 285

Pro Trp Ala Pro Trp Ile Ile Gly Leu Val Ile Glu Ala Leu Ser Arg

    290                 295                 300

Lys Met Met Gly Ser Trp Leu Leu Arg Gln Arg Gln Ser Gly Lys Thr

305                 310                 315                 320

Pro Thr Ala Leu Asp Gln Met Glu Val Lys Gly Arg Thr Asn Leu Leu

                325                 330                 335

Gly Trp Trp Leu Phe Arg Gly Glu Phe Tyr Gln Ala Tyr Thr Arg Pro

            340                 345                 350

Leu Leu Tyr Ser Ile Val Ala Arg Leu Glu Lys Ile Pro Gly Leu Gly

        355                 360                 365

Leu Phe Gly Ala Leu Ile Ser Asp Tyr Leu Tyr Leu Phe Asp Arg Tyr

    370                 375                 380

Tyr Phe Thr Ala Ser Thr Leu

385                 390

<210>15

<211>225

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG84025)

 

<220>

<221>MISC_FEATURE

<222>(1)..(225)

<223>YlPex17p

 

<400>15

Met Ser Ala Phe Pro Glu Pro Ser Ser Phe Glu Ile Glu Phe Ala Lys

1               5                   10                  15

Gln Met Asn Arg Pro Arg Thr Val Gln Phe Lys Gln Leu Val Ala Val

            20                  25                  30

Leu Tyr Ile Phe Gly Gly Thr Ser Ala Leu Ile Tyr Ile Ile Ser Lys

        35                  40                  45

Thr Ile Leu Asn Pro Leu Phe Glu Glu Leu Thr Phe Ala Arg Ser Glu

    50                  55                  60

Tyr Ala Ile His Ala Arg Arg Leu Met Glu Gln Leu Asn Ala Lys Leu

65                  70                  75                  80

Ser Ser Met Ala Ser Tyr Ile Pro Pro Val Arg Ala Leu Gln Gly Gln

                85                  90                  95

Arg Phe Val Asp Ala Gln Thr Gln Thr Glu Asp Glu Glu Gly Glu Asp

            100                 105                 110

Ile Pro Asn Pro Ser Leu Gly Lys Ser Ser His Val Ser Phe Gly Glu

        115                 120                 125

Ser Pro Met Gln Leu Lys Leu Ala Glu Lys Glu Lys Gln Gln Lys Leu

    130                 135                 140

Ile Asp Asp Ser Val Asp Asn Leu Glu Arg Leu Ala Asp Ser Leu Lys

145                 150                 155                 160

His Ala Gly Glu Val Ser Asp Leu Ser Ala Leu Ser Gly Phe Lys Tyr

                165                 170                 175

Gln Val Glu Glu Leu Thr Asn Tyr Ser Asp Gln Leu Ala Met Ser Gly

            180                 185                 190

Tyr Ser Met Met Lys Ser Gly Leu Pro Gly His Glu Thr Ala Met Ser

        195                 200                 205

Glu Thr Lys Lys Glu Ile Arg Ser Leu Lys Gly Ser Val Leu Ser Val

    210                 215                 220

Arg

225

 

<210>16

<211>324

<212>PRT

<213>解脂耶氏酵母(GenBank保藏号AAK84827)

 

<220>

<221>MISC_FEATURE

<222>(1)..(324)

<223>YlPex19p

 

<400>16

Met Ser His Glu Glu Asp Leu Asp Asp Leu Asp Asp Phe Leu Asp Glu

1               5                   10                  15

Phe Asp Glu Gln Val Leu Ser Lys Pro Pro Gly Ala Gln Lys Asp Ala

            20                  25                  30

Thr Pro Thr Thr Ser Thr Ala Pro Thr Thr Ala Glu Ala Lys Pro Asp

        35                  40                  45

Ala Thr Lys Lys Ser Thr Glu Thr Ser Gly Thr Asp Ser Lys Thr Glu

    50                  55                  60

Gly Ala Asp Thr Ala Asp Lys Asn Ala Ala Thr Asp Ser Ala Glu Ala

65                 70                 75                 80

Gly Ala Glu Lys Val Ser Leu Pro Asn Leu Glu Asp Gln Leu Ala Gly

                85                  90                  95

Leu Lys Met Asp Asp Phe Leu Lys Asp Ile Glu Ala Asp Pro Glu Ser

            100                 105                 110

Lys Ala Gln Phe Glu Ser Leu Leu Lys Glu Ile Asn Asn Val Thr Ser

        115                 120                 125

Ala Thr Ala Ser Glu Lys Ala Gln Gln Pro Lys Ser Phe Lys Glu Thr

    130                 135                 140

Ile Ser Ala Thr Ala Asp Arg Leu Asn Gln Ser Asn Gln Glu Met Gly

145                 150                 155                 160

Asp Met Pro Leu Gly Asp Asp Met Leu Ala Gly Leu Met Glu Gln Leu

                165                 170                 175

Ser Gly Ala Gly Gly Phe Gly Glu Gly Gly Glu Gly Asp Phe Gly Asp

            180                 185                 190

Met Leu Gly Gly Ile Met Arg Gln Leu Ala Ser Lys Glu Val Leu Tyr

        195                 200                 205

Gln Pro Leu Lys Glu Met His Asp Asn Tyr Pro Lys Trp Trp Asp Glu

    210                 215                 220

His Gly Ser Lys Val Thr Glu Glu Lys Glu Arg Asp Arg Leu Lys Leu

225                 230                 235                 240

Gln Gln Asp Ile Val Gly Lys Ile Cys Ala Lys Phe Glu Asp Pro Ser

                245                 250                 255

Tyr Ser Asp Asp Ser Glu Ala Asp Arg Ala ValIle Thr Gln Leu Met

            260                 265                 270

Asp Glu Met Gln Glu Thr Gly Ala Pro Pro Asp Glu Ile Met Ser Asn

        275                 280                 285

Val Ala Asp Gly Ser Ile Pro Gly Gly Leu Asp Gly Leu Gly Leu Gly

    290                 295                 300

Gly Leu Gly Gly Gly Lys Met Pro Glu Met Pro Glu Asn Met Pro Glu

305                 310                 315                 320

Cys Asn Gln Gln

 

<210>17

<211>417

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG79226)

 

<220>

<221>MISC_FEATURE

<222>(1)..(417)

<223>YlPex20p

 

<400>17

Met Ala Ser Cys Gly Pro Ser Asn Ala Leu Gln Asn Leu Ser Lys His

1               5                   10                  15

Ala Ser Ala Asp Arg Ser Leu Gln His Asp Arg Met Ala Pro Gly Gly

            20                  25                  30

Ala Pro Gly Ala Gln Arg Gln Gln Phe Arg Ser Gln Thr Gln Gly Gly

        35                  40                  45

Gln Leu Asn Asn Glu Phe Gln Gln Phe Ala Gln Ala Gly Pro Ala His

    50                  55                  60

Asn Ser Phe Glu Gln Ser Gln Met Gly Pro His Phe Gly Gln Gln His

65                  70                  75                  80

Phe Gly Gln Pro His Gln Pro Gln Met Gly Gln His Ala Pro Met Ala

                85                  90                  95

His Gly Gln Gln Ser Asp Trp Ala Gln Ser Phe Ser Gln Leu Asn Leu

            100                 105                 110

Gly Pro Gln Thr Gly Pro Gln His Thr Gln Gln Ser Asn Trp Gly Gln

        115                 120                 125

Asp Phe Met Arg Gln Ser Pro Gln Ser His Gln Val Gln Pro Gln Met

    130                 135                 140

Ala Asn Gly Val Met Gly Ser Met Ser Gly Met Ser Ser Phe Gly Pro

145                 150                 155                 160

Met Tyr Ser Asn Ser Gln Leu Met Asn Ser Thr Tyr Gly Leu Gln Thr

                165                 170                 175

Glu His Gln Gln Thr His Lys Thr Glu Thr Lys Ser Ser Gln Asp Ala

            180                 185                 190

Ala Phe Glu Ala Ala Phe Gly Ala Val Glu Glu Ser Ile Thr Lys Thr

        195                 200                 205

Ser Asp Lys Gly Lys Glu Val Glu Lys Asp Pro Met Glu Gln Thr Tyr

    210                 215                 220

Arg Tyr Asp Gln Ala Asp Ala Leu Asn Arg Gln Ala Glu His Ile Ser

225                 230                 235                 240

Asp Asn Ile Ser Arg Glu Glu Val Asp Ile Lys Thr Asp Glu Asn Gly

                245                 250                 255

Glu Phe Ala Ser Ile Ala Arg Gln Ile Ala Ser Ser Leu Glu Glu Ala

            260                 265                 270

Asp Lys Ser Lys Phe Glu Lys Ser Thr Phe Met Asn Leu Met Arg Arg

        275                 280                 285

Ile Gly Asn His Glu Val Thr Leu Asp Gly Asp Lys Leu Val Asn Lys

    290                 295                 300

Glu Gly Glu Asp Ile Arg Glu Glu Val Arg Asp Glu Leu Leu Arg Glu

305                 310                 315                 320

Gly Ala Ser Gln Glu Asn Gly Phe Gln Ser Glu Ala Gln Gln Thr Ala

                325                 330                 335

Pro Leu Pro Val His His Glu Ala Pro Pro Pro Glu Gln Ile His Pro

            340                 345                 350

His Thr Glu Thr Gly Asp Lys Gln Leu Glu Asp Pro Met Val Tyr Ile

        355                 360                 365

Glu Gln Glu Ala Ala Arg Arg Ala Ala Glu Ser Gly Arg Thr Val Glu

    370                 375                 380

Glu Glu Lys Leu Asn Phe Tyr Ser Pro Phe Glu Tyr Ala Gln Lys Leu

385                 390                 395                 400

Gly Pro Gln Gly Val Ala Lys Gln Ser Asn Trp Glu Glu Asp Tyr Asp

                405                 410                 415

Phe

<210>18

<211>195

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号CAG77876)

 

<220>

<221>MISC_FEATURE

<222>(1)..(195)

<223>YlPex22p

 

<400>18

Val Pro Arg Cys Thr Ser His Pro Cys Asn Leu Thr Leu His Leu Pro

1               5                   10                  15

Val Thr Thr Met Ala Pro Arg Lys Thr Arg Leu Pro Ala Val Ile Gly

            20                  25                  30

Ala Ala Ala Ala Ala Ala Ala Val Ala Tyr Leu Val Tyr Ser Phe Val

        35                  40                  45

Ala Lys Ser Asn Ser Asp Gln Asp Thr Phe Asp Ser Ser Val Gln Ser

    50                  55                  60

Ser Ser Lys Ser Ser Thr Lys Ser Pro Lys Ser Thr Ala Thr Asn Ser

65                  70                  75                  80

Lys Ile Thr Val Val Val Ser Gln Glu Leu Val Gln Ser Gln Leu Val

                85                  90                  95

Asp Phe Lys His Leu Met Ser Val His Pro Asn Leu Val Val Ile Val

            100                 105                 110

Pro Pro Met Val Ala Asn Lys Phe His Arg Ala Leu Lys Ser Ser Val

        115                 120                 125

Gly His Asp His Gly Val Lys Val Ile Arg Cys Asp Thr Asp Val Gly

    130                 135                 140

Val Ile His Val Ile Lys His Ile Arg Pro Asp Leu Ala Leu Ile Ala

145                 150                 155                 160

Asp Gly Val Gly Asp Asn Ile Gln Gly Glu Ile Lys Arg Phe Val Gly

                165                 170                 175

Ser Ser Glu Ala Leu Ser Gly Asp Val Asn Leu Ala Ala Glu Arg Leu

            180                 185                 190

Thr Gly Leu

        195

 

<210>19

<211>386

<212>PRT

<213>解脂耶氏酵母CLIB122(GenBank保藏号NC_006072,核苷酸117230至118387的

反义翻译)

 

<220>

<221>MISC_FEATURE

<222>(1)..(386)

<223>YlPex26p

 

<400>19

Met Pro Pro Ala Met Pro Gln Met Thr Thr Ser Thr Leu Leu Thr Asp

1               5                   10                  15

Ser Val Thr Ser Ala Val Asn Gln Ala Ala Thr Pro Lys Val Asp Gln

            20                  25                  30

Met Tyr Gln Thr Phe Gly Glu Ser Ala Arg Glu Phe Val Asn Lys Asn

        35                  40                  45

Phe Tyr Asn Ser Tyr Glu Leu Ile Arg Pro Phe Phe Asp Glu Ile Thr

    50                  55                  60

Ala Lys Gly Ala Gln Gln Asn Gly Ser Thr Val Leu Asp Ala Glu Asn

65                  70                  75                  80

Pro His Asn Ile Pro Leu Ser Leu Trp Ile Lys Val Trp Ser Leu Tyr

                85                  90                  95

Leu Ala Ile Leu Asp Ala Ser Cys Lys Gln Ala Gly Glu Ala Leu Leu

            100                 105                 110

Asn Ser Thr Gly Asp Leu Ser Gly Ser Asp Ser Gly Glu Trp Asn Gln

        115                 120                 125

Thr Arg Lys Leu Leu Ala Arg Lys Leu Thr Ser Gly Ser Val Trp Asp

    130                 135                 140

Glu Leu Val Thr Ala Ser Gly Gly Thr Gly Asn Ile His Pro Thr Ile

145                 150                 155                 160

Leu Ala Leu Leu Ala Ser Leu Ser Ile Arg His Asp Thr Asp Ala Lys

                165                 170                 175

Leu Met Ala Asp Asn Leu Glu Lys Phe Ile Val Thr Tyr Asn Asp Asn

            180                 185                 190

Gly Ser Asp Asp Val Lys Thr Lys Thr Ala Phe Tyr Lys Val Leu Asp

        195                 200                 205

Leu Tyr Leu Leu Arg Val Leu Pro Asp Leu Gly Gln Trp Asp Val Ala

    210                 215                 220

His Ser Phe Val Asn Asn Thr Asn Leu Phe Ser His Glu Gln Lys Lys

225                 230                 235                 240

Glu Met Thr His Lys Leu Asp Gln Ser Gln Lys His Ala Glu Gln Glu

                245                 250                 255

His Lys Arg Leu Leu Glu Glu Ala Gln Glu Lys Glu Lys Ser Asp Ala

            260                 265                 270

Lys Glu Lys Glu Arg Glu Glu Arg Val Ser Arg Asp Thr Gln Ser Arg

        275                 280                 285

Glu Ile Lys Ser Pro Ile Val Asp Ser Ser Thr Ser Ser Arg Asp Val

    290                 295                 300

Thr Arg Asp Thr Thr Arg Glu Leu Ser Lys Ser Ser Arg Gln Pro Arg

305                 310                 315                 320

Thr Leu Ser Gln Ile Ile Ser Thr Ser Leu Lys Ser Gln Phe Asp Gly

                325                 330                 335

Asn Ala Ile Phe Arg Thr Leu Ala Leu Ile Val Ile Val Ser Leu Ser

            340                 345                 350

Ala Ala Asn Pro Leu Ile Arg Lys Arg Val Val Asp Thr Leu Lys Met

        355                 360                 365

Leu Trp Ile Lys Ile Leu Gln Thr Leu Ser Met Gly Phe Lys Val Ser

    370                 375                 380

Tyr Leu

385

 

<210>20

<211>3387

<212>DNA

<213>解脂耶氏酵母(GenBank保藏号AB036770)

 

<400>20

ggtaccatca agggtaaaat caaggctatc atcaagggcc atatatcgca agtttggggg     60

aagataatat gttcatagtg aatcgggttg tggatttcct catctaacgg cattataact    120

agtcctggag ggtctttttt atggataacc tccatgtacg atgtatccaa gatctccacg    180

tactgtgttc tgtttcctaa gtaataccca acaacctctc caacaaacac ttgggaagat    240

gcacttgtgc tgagatgtca agatgttaga gagtagagac agtagcaagc gtaaaaggcg    300

gccgaggcca ccgagagaac agcgtagcag ggcgcgtagt caccacaggg gacgcagaac    360

caaacaaatg acgaagaaga accacaagga gacgttttca aaggcaatgc aaacgaagag    420

ggcaatggaa ggattgagat tagagaactg gagactggag tggcgttttc ccgatgaacg    480

aacaaacacg cgaagctatg tggaccaaca tacaacacgg actgaaccag gtttttttat    540

gattttttta ctggaaatag gtacgtgcca agttggacca tgacactaaa cgtgtttaat    600

tagtaatatt cgtgtaagcg tacattcatt tcaaaggtta ttctttcacg gcaaagttat    660

aattaaatga atgtatatgc agaaaaaaaa aaaaaaagta ctgtactgga tggagagaat    720

attaataaat aattgttacc caactacatc ttgtcgattg aaagagaccc ctaagacaga    780

taggatatct gcaacccgag gaatgaaccc cccagcaccg gcaccctttc tattaacaaa    840

atgccaactg aaatttgaaa agttcaacta aacttatttg acccacaaaa actcgtcaaa    900

agtggcggcg aaagctggca aatgatgaca tccccttgga accatgatat cctctcggaa    960

tcttcgtccc catttgccac atctacttgc aacgccacat ctgcttacta agcaacccaa   1020

atctgcctcg gctcaaaatg tggggaagtt cacatgcatt cgctggtgaa tctgatctga   1080

cactacaact acacaccagg tccaacatga gcgacaatac gacaatcaaa aagccgatcc   1140

gacccaaacc gatccggacg gaacgcctgc cttacgctgg ggccgcagaa atcatccgag   1200

ccaaccagaa agaccactac tttgagtccg tgcttgaaca gcatctcgtc acgtttctgc   1260

agaaatggaa gggagtacga tttatccacc agtacaagga ggagctggag acggcgtcca   1320

agtttgcata tctcggtttg tgtacgcttg tgggctccaa gactctcgga gaagagtaca   1380

ccaatctcat gtacactatc agagaccgaa cagctctacc gggggtggtg agacggtttg   1440

gctacgtgct ttccaacact ctgtttccat acctgtttgt gcgctacatg ggcaagttgc   1500

gcgccaaact gatgcgcgag tatccccatc tggtggagta cgacgaagat gagcctgtgc   1560

ccagcccgga aacatggaag gagcgggtca tcaagacgtt tgtgaacaag tttgacaagt   1620

tcacggcgct ggaggggttt accgcgatcc acttggcgat tttctacgtc tacggctcgt   1680

actaccagct cagtaagcgg atctggggca tgcgttatgt atttggacac cgactggaca   1740

agaatgagcc tcgaatcggt tacgagatgc tcggtctgct gattttcgcc cggtttgcca   1800

cgtcatttgt gcagacggga agagagtacc tcggagcgct gctggaaaag agcgtggaga   1860

aagaggcagg ggagaaggaa gatgaaaagg aagcggttgt gccgaaaaag aagtcgtcaa   1920

ttccgttcat tgaggataca gaaggggaga cggaagacaa gatcgatctg gaggaccctc   1980

gacagctcaa gttcattcct gaggcgtcca gagcgtgcac tctgtgtctg tcatacatta   2040

gtgcgccggc atgtacgcca tgtggacact ttttctgttg ggactgtatt tccgaatggg   2100

tgagagagaa gcccgagtgt cccttgtgtc ggcagggtgt gagagagcag aacttgttgc   2160

ctatcagata atgacgaggt ctggatggaa ggactagtca gcgagacaca gagcatcagg   2220

gaccagacac gaccaattca atcgacaaca ctgtgctgca tagcagtgca cagaggtcct   2280

gggcatgaat atattttagc attggagata tgagtggtag agcgtataca gtattaattg   2340

tggaggtatc tcgtcgcatt gatagagcaa tacagttact gctgaaggga atgataccga   2400

gtatttcggc ccgattcagt tcttgatatc gtcattttgt ctctattgtc tacttttcag   2460

ataacctcaa caaatcttca acaaatctcc cagtaaacag tcagagatca tatccgagat   2520

catatcagat atgtcacgat ccgagtacaa taatggatat taatctgctt gattttgaat   2580

tctgttgcga ttatgatttc tttgatttcg atatgaacac atacggcgac tcccagacct   2640

ttagaagctc cagtttggat tcttagcaat ggttacactc aactatatcc caagtaatac   2700

ttggtaacaa tatgccaagt tagtcattca ttcgttatag gagttagcaa gtgtttgtca   2760

gctaaaaatg gttagtcggt cgattaccac ttagatcttt tcagcgtgga acttgatggt   2820

acgcttgaac cgacacttgg agtagtcggg gctgttgatg acgtagatga cgtttcgctc   2880

agggtgagga gtgcaatagt agtactcctt ggggccgtct ctcagctcaa aggttccatc   2940

ggcggcaatg tcaaagaccg agccctggag cttgtagccg tagtcgccgg tccagaacaa   3000

agcctgcagc tccagatagg cgatgggcat gtcgttaaca gagaaggtgt tgccctcgcc   3060

ctcggtgatg gtgatgggtt cgccgtcggt ggaggcggtg atcaggtcat cttggtaggt   3120

gacgggcaga gattcgaccg attgggcgtc tgatctggta taggtcagct tgtacttgtc   3180

tccgacagcc gccagagcgg tggtagcgac ggtgatgagg gagatgagtt tcatattggc   3240

ggcaagttta gcaaaagatg gcagtgggat tgagggacaa gagtgtttat atagatatag   3300

atacaacaca acgagtctga atgagacaac cgagacaacc actcccgaag cctcactaat   3360

agttactaac ggcatatttc aggtacc                                       3387

 

<210>21

<211>1134

<212>DNA

<213>解脂耶氏酵母(GenBank保藏号AB036770,核苷酸1038-2171)

 

<220>

<221>CDS

<222>(1)..(1134)

<223>Pex10

 

<400>21

atg tgg gga agt tca cat gca ttc gct ggt gaa tct gat ctg aca cta       48

Met Trp Gly Ser Ser His Ala Phe Ala Gly Glu Ser Asp Leu Thr Leu

1               5                   10                  15

caa cta cac acc agg tcc aac atg agc gac aat acg aca atc aaa aag       96

Gln Leu His Thr Arg Ser Asn Met Ser Asp Asn Thr Thr Ile Lys Lys

            20                  25                  30

ccg atc cga ccc aaa ccg atc cgg acg gaa cgc ctg cct tac gct ggg      144

Pro Ile Arg Pro Lys Pro Ile Arg Thr Glu Arg Leu Pro Tyr Ala Gly

        35                  40                  45

gcc gca gaa atc atc cga gcc aac cag aaa gac cac tac ttt gag tcc      192

Ala Ala Glu Ile Ile Arg Ala Asn Gln Lys Asp His Tyr Phe Glu Ser

    50                  55                  60

gtg ctt gaa cag cat ctc gtc acg ttt ctg cag aaa tgg aag gga gta      240

Val Leu Glu Gln His Leu Val Thr Phe Leu Gln Lys Trp Lys Gly Val

65                  70                  75                  80

cga ttt atc cac cag tac aag gag gag ctg gag acg gcg tcc aag ttt      288

Arg Phe Ile His Gln Tyr Lys Glu Glu Leu Glu Thr Ala Ser Lys Phe

                85                  90                  95

gca tat ctc ggt ttg tgt acg ctt gtg ggc tcc aag act ctc gga gaa      336

Ala Tyr Leu Gly Leu Cys Thr Leu Val Gly Ser Lys Thr Leu Gly Glu

            100                 105                 110

gag tac acc aat ctc atg tac act atc aga gac cga aca gct cta ccg      384

Glu Tyr Thr Asn Leu Met Tyr Thr Ile Arg Asp Arg Thr Ala Leu Pro

        115                 120                 125

ggg gtg gtg aga cgg ttt ggc tac gtg ctt tcc aac act ctg ttt cca      432

Gly Val Val Arg Arg Phe Gly Tyr Val Leu Ser Asn Thr Leu Phe Pro

    130                 135                 140

tac ctg ttt gtg cgc tac atg ggc aag ttg cgc gcc aaa ctg atg cgc      480

Tyr Leu Phe Val Arg Tyr Met Gly Lys Leu Arg Ala Lys Leu Met Arg

145                 150                 155                 160

gag tat ccc cat ctg gtg gag tac gac gaa gat gag cct gtg ccc agc      528

Glu Tyr Pro His Leu Val Glu Tyr Asp Glu Asp Glu Pro Val Pro Ser

                165                 170                 175

ccg gaa aca tgg aag gag cgg gtc atc aag acg ttt gtg aac aag ttt      576

Pro Glu Thr Trp Lys Glu Arg Val Ile Lys Thr Phe Val Asn Lys Phe

            180                 185                 190

gac aag ttc acg gcg ctg gag ggg ttt acc gcg atc cac ttg gcg att      624

Asp Lys Phe Thr Ala Leu Glu Gly Phe Thr Ala Ile His Leu Ala Ile

        195                 200                 205

ttc tac gtc tac ggc tcg tac tac cag ctc agt aag cgg atc tgg ggc      672

Phe Tyr Val Tyr Gly Ser Tyr Tyr Gln Leu Ser Lys Arg Ile Trp Gly

    210                 215                 220

atg cgt tat gta ttt gga cac cga ctg gac aag aat gag cct cga atc      720

Met Arg Tyr Val Phe Gly His Arg Leu Asp Lys Asn Glu Pro Arg Ile

225                 230                 235                 240

ggt tac gag atg ctc ggt ctg ctg att ttc gcc cgg ttt gcc acg tca      768

Gly Tyr Glu Met Leu Gly Leu Leu Ile Phe Ala Arg Phe Ala Thr Ser

                245                 250                 255

ttt gtg cag acg gga aga gag tac ctc gga gcg ctg ctg gaa aag agc      816

Phe Val Gln Thr Gly Arg Glu Tyr Leu Gly Ala Leu Leu Glu Lys Ser

            260                 265                 270

gtg gag aaa gag gca ggg gag aag gaa gat gaa aag gaa gcg gtt gtg      864

Val Glu Lys Glu Ala Gly Glu Lys Glu Asp Glu Lys Glu Ala Val Val

        275                 280                 285

ccg aaa aag aag tcg tca att ccg ttc att gag gat aca gaa ggg gag      912

Pro Lys Lys Lys Ser Ser Ile Pro Phe Ile Glu Asp Thr Glu Gly Glu

    290                 295                 300

acg gaa gac aag atc gat ctg gag gac cct cga cag ctc aag ttc att      960

Thr Glu Asp Lys Ile Asp Leu Glu Asp Pro Arg Gln Leu Lys Phe Ile

305                 310                 315                 320

cct gag gcg tcc aga gcg tgc act ctg tgt ctg tca tac att agt gcg     1008

Pro Glu Ala Ser Arg Ala Cys Thr Leu Cys Leu Ser Tyr Ile Ser Ala

                325                 330                 335

ccg gca tgt acg cca tgt gga cac ttt ttc tgt tgg gac tgt att tcc     1056

Pro Ala Cys Thr Pro Cys Gly His Phe Phe Cys Trp Asp Cys Ile Ser

            340                 345                 350

gaa tgg gtg aga gag aag ccc gag tgt ccc ttg tgt cgg cag ggt gtg     1104

Glu Trp Val Arg Glu Lys Pro Glu Cys Pro Leu Cys Arg Gln Gly Val

        355                 360                 365

aga gag cag aac ttg ttg cct atc aga taa                             1134

Arg Glu Gln Asn Leu Leu Pro Ile Arg

    370                 375

 

<210>22

<211>377

<212>PRT

<213>解脂耶氏酵母(GenBank保藏号AB036770,核苷酸1038-2171)

 

<400>22

Met Trp Gly Ser Ser His Ala Phe Ala Gly Glu Ser Asp Leu Thr Leu

1               5                   10                  15

Gln Leu His Thr Arg Ser Asn Met Ser Asp Asn Thr Thr Ile Lys Lys

            20                  25                  30

Pro Ile Arg Pro Lys Pro Ile Arg Thr Glu Arg Leu Pro Tyr Ala Gly

        35                  40                  45

Ala Ala Glu Ile Ile Arg Ala Asn Gln Lys Asp His Tyr Phe Glu Ser

    50                  55                  60

Val Leu Glu Gln His Leu Val Thr Phe Leu Gln Lys Trp Lys Gly Val

65                  70                  75                  80

Arg Phe Ile His Gln Tyr Lys Glu Glu Leu Glu Thr Ala Ser Lys Phe

                85                  90                  95

Ala Tyr Leu Gly Leu Cys Thr Leu Val Gly Ser Lys Thr Leu Gly Glu

            100                 105                 110

Glu Tyr Thr Asn Leu Met Tyr Thr Ile Arg Asp Arg Thr Ala Leu Pro

        115                 120                 125

Gly Val Val Arg Arg Phe Gly Tyr Val Leu Ser Asn Thr Leu Phe Pro

    130                 135                 140

Tyr Leu Phe Val Arg Tyr Met Gly Lys Leu Arg Ala Lys Leu Met Arg

145                 150                 155                 160

Glu Tyr Pro His Leu Val Glu Tyr Asp Glu Asp Glu Pro Val Pro Ser

                165                 170                 175

Pro Glu Thr Trp Lys Glu Arg Val Ile Lys Thr Phe Val Asn Lys Phe

            180                 185                 190

Asp Lys Phe Thr Ala Leu Glu Gly Phe Thr Ala Ile His Leu Ala Ile

        195                 200                 205

Phe Tyr Val Tyr Gly Ser Tyr Tyr Gln Leu Ser Lys Arg Ile Trp Gly

    210                 215                 220

Met Arg Tyr Val Phe Gly His Arg Leu Asp Lys Asn Glu Pro Arg Ile

225                 230                 235                 240

Gly Tyr Glu Met Leu Gly Leu Leu Ile Phe Ala Arg Phe Ala Thr Ser

                245                 250                 255

Phe ValGln Thr Gly Arg Glu Tyr Leu Gly Ala Leu Leu Glu Lys Ser

           260                 265                 270

ValGlu Lys Glu Ala Gly Glu Lys Glu Asp Glu Lys Glu Ala Val Val

       275                 280                 285

Pro Lys Lys Lys Ser Ser Ile Pro Phe Ile Glu Asp Thr Glu Gly Glu

    290                 295                 300

Thr Glu Asp Lys Ile Asp Leu Glu Asp Pro Arg Gln Leu Lys Phe Ile

305                 310                 315                 320

Pro Glu Ala Ser Arg Ala Cys Thr Leu Cys Leu Ser Tyr Ile Ser Ala

                325                 330                 335

Pro Ala Cys Thr Pro Cys Gly His Phe Phe Cys Trp Asp Cys Ile Ser

            340                 345                 350

Glu Trp Val Arg Glu Lys Pro Glu Cys Pro Leu Cys Arg Gln Gly Val

        355                 360                 365

Arg Glu Gln Asn Leu Leu Pro Ile Arg

    370                 375

 

<210>23

<211>1065

<212>DNA

<213>解脂耶氏酵母(GenBank保藏号AJ012084,对应于GenBank保藏号AB036770的核

苷酸1107-2171)

 

<220>

<221>CDS

<222>(1)..(1065)

<223>YlPEX10

 

<400>23

atg agc gac aat acg aca atc aaa aag ccg atc cga ccc aaa ccg atc       48

Met Ser Asp Asn Thr Thr Ile Lys Lys Pro Ile Arg Pro Lys Pro Ile

1                   5               10                  15

cgg acg gaa cgc ctg cct tac gct ggg gcc gca gaa atc atc cga gcc       96

Arg Thr Glu Arg Leu Pro Tyr Ala Gly Ala Ala Glu Ile Ile Arg Ala

            20                  25                  30

aac cag aaa gac cac tac ttt gag tcc gtg ctt gaa cag cat ctc gtc      144

Asn Gln Lys Asp His Tyr Phe Glu Ser Val Leu Glu Gln His Leu Val

        35                  40                  45

acg ttt ctg cag aaa tgg aag gga gta cga ttt atc cac cag tac aag      192

Thr Phe Leu Gln Lys Trp Lys Gly Val Arg Phe Ile His Gln Tyr Lys

    50                  55                  60

gag gag ctg gag acg gcg tcc aag ttt gca tat ctc ggt ttg tgt acg      240

Glu Glu Leu Glu Thr Ala Ser Lys Phe Ala Tyr Leu Gly Leu Cys Thr

65                  70                  75                  80

ctt gtg ggc tcc aag act ctc gga gaa gag tac acc aat ctc atg tac      288

Leu Val Gly Ser Lys Thr Leu Gly Glu Glu Tyr Thr Asn Leu Met Tyr

                85                  90                  95

act atc aga gac cga aca gct cta ccg ggg gtg gtg aga cgg ttt ggc      336

Thr Ile Arg Asp Arg Thr Ala Leu Pro Gly Val Val Arg Arg Phe Gly

            100                 105                 110

tac gtg ctt tcc aac act ctg ttt cca tac ctg ttt gtg cgc tac atg      384

Tyr Val Leu Ser Asn Thr Leu Phe Pro Tyr Leu Phe Val Arg Tyr Met

        115                 120                 125

ggc aag ttg cgc gcc aaa ctg atg cgc gag tat ccc cat ctg gtg gag      432

Gly Lys Leu Arg Ala Lys Leu Met Arg Glu Tyr Pro His Leu Val Glu

    130                 135                 140

tac gac gaa gat gag cct gtg ccc agc ccg gaa aca tgg aag gag cgg      480

Tyr Asp Glu Asp Glu Pro Val Pro Ser Pro Glu Thr Trp Lys Glu Arg

145                 150                 155                 160

gtc atc aag acg ttt gtg aac aag ttt gac aag ttc acg gcg ctg gag      528

Val Ile Lys Thr Phe Val Asn Lys Phe Asp Lys Phe Thr Ala Leu Glu

                165                 170                 175

ggg ttt acc gcg atc cac ttg gcg att ttc tac gtc tac ggc tcg tac      576

Gly Phe Thr Ala Ile His Leu Ala Ile Phe Tyr Val Tyr Gly Ser Tyr

            180                 185                 190

tac cag ctc agt aag cgg atc tgg ggc atg cgt tat gta ttt gga cac      624

Tyr Gln Leu Ser Lys Arg Ile Trp Gly Met Arg Tyr Val Phe Gly His

        195                 200                 205

cga ctg gac aag aat gag cct cga atc ggt tac gag atg ctc ggt ctg      672

Arg Leu Asp Lys Asn Glu Pro Arg Ile Gly Tyr Glu Met Leu Gly Leu

    210                 215                 220

ctg att ttc gcc cgg ttt gcc acg tca ttt gtg cag acg gga aga gag      720

Leu Ile Phe Ala Arg Phe Ala Thr Ser Phe Val Gln Thr Gly Arg Glu

225                 230                 235                 240

tac ctc gga gcg ctg ctg gaa aag agc gtg gag aaa gag gca ggg gag      768

Tyr Leu Gly Ala Leu Leu Glu Lys Ser Val Glu Lys Glu Ala Gly Glu

                245                 250                 255

aag gaa gat gaa aag gaa gcg gtt gtg ccg aaa aag aag tcg tca att      816

Lys Glu Asp Glu Lys Glu Ala ValVal Pro Lys Lys Lys Ser Ser Ile

            260                 265                 270

ccg ttc att gag gat aca gaa ggg gag acg gaa gac aag atc gat ctg      864

Pro Phe Ile Glu Asp Thr Glu Gly Glu Thr Glu Asp Lys Ile Asp Leu

        275                 280                 285

gag gac cct cga cag ctc aag ttc att cct gag gcg tcc aga gcg tgc      912

Glu Asp Pro Arg Gln Leu Lys Phe Ile Pro Glu Ala Ser Arg Ala Cys

    290                 295                 300

act ctg tgt ctg tca tac att agt gcg ccg gca tgt acg cca tgt gga      960

Thr Leu Cys Leu Ser Tyr Ile Ser Ala Pro Ala Cys Thr Pro Cys Gly

305                 310                 315                 320

cac ttt ttc tgt tgg gac tgt att tcc gaa tgg gtg aga gag aag ccc     1008

His Phe Phe Cys Trp Asp Cys Ile Ser Glu Trp Val Arg Glu Lys Pro

                325                 330                 335

gag tgt ccc ttg tgt cgg cag ggt gtg aga gag cag aac ttg ttg cct     1056

Glu Cys Pro Leu Cys Arg Gln Gly Val Arg Glu Gln Asn Leu Leu Pro

            340                 345                 350

atc aga taa                                                         1065

Ile Arg

 

<210>24

<211>354

<212>PRT

<213>解脂耶氏酵母(GenBank保藏号AJ012084,对应于GenBank保藏号AB036770的核

苷酸1107-2171)

 

<400>24

Met Ser Asp Asn Thr Thr Ile Lys Lys Pro Ile Arg Pro Lys Pro Ile

1               5                   10                  15

Arg Thr Glu Arg Leu Pro Tyr Ala Gly Ala Ala Glu Ile Ile Arg Ala

            20                  25                  30

Asn Gln Lys Asp His Tyr Phe Glu Ser Val Leu Glu Gln His Leu Val

        35                  40                  45

Thr Phe Leu Gln Lys Trp Lys Gly Val Arg Phe Ile His Gln Tyr Lys

    50                  55                  60

Glu Glu Leu Glu Thr Ala Ser Lys Phe Ala Tyr Leu Gly Leu Cys Thr

65                  70                  75                  80

Leu Val Gly Ser Lys Thr Leu Gly Glu Glu Tyr Thr Asn Leu Met Tyr

                85                  90                  95

Thr Ile Arg Asp Arg Thr Ala Leu Pro Gly Val Val Arg Arg Phe Gly

            100                 105                 110

Tyr Val Leu Ser Asn Thr Leu Phe Pro Tyr Leu Phe Val Arg Tyr Met

        115                 120                 125

Gly Lys Leu Arg Ala Lys Leu Met Arg Glu Tyr Pro His Leu Val Glu

    130                 135                 140

Tyr Asp Glu Asp Glu Pro Val Pro Ser Pro Glu Thr Trp Lys Glu Arg

145                 150                 155                 160

Val Ile Lys Thr Phe Val Asn Lys Phe Asp Lys Phe Thr Ala Leu Glu

                165                 170                 175

Gly Phe Thr Ala Ile His Leu Ala Ile Phe Tyr Val Tyr Gly Ser Tyr

            180                 185                 190

Tyr Gln Leu Ser Lys Arg Ile Trp Gly Met Arg Tyr Val Phe Gly His

        195                 200                 205

Arg Leu Asp Lys Asn Glu Pro Arg Ile Gly Tyr Glu Met Leu Gly Leu

    210                 215                 220

Leu Ile Phe Ala Arg Phe Ala Thr Ser Phe Val Gln Thr Gly Arg Glu

225                 230                 235                 240

Tyr Leu Gly Ala Leu Leu Glu Lys Ser Val Glu Lys Glu Ala Gly Glu

                245                 250                 255

Lys Glu Asp Glu Lys Glu Ala Val Val Pro Lys Lys Lys Ser Ser Ile

            260                 265                 270

Pro Phe Ile Glu Asp Thr Glu Gly Glu Thr Glu Asp Lys Ile Asp Leu

        275                 280                 285

Glu Asp Pro Arg Gln Leu Lys Phe Ile Pro Glu Ala Ser Arg Ala Cys

    290                 295                 300

Thr Leu Cys Leu Ser Tyr Ile Ser Ala Pro Ala Cys Thr Pro Cys Gly

305                 310                 315                 320

His Phe Phe Cys Trp Asp Cys Ile Ser Glu Trp Val Arg Glu Lys Pro

                325                 330                 335

Glu Cys Pro Leu Cys Arg Gln Gly Val Arg Glu Gln Asn Leu Leu Pro

            340                 345                 350

Ile Arg

 

<210>25

<211>38

<212>PRT

<213>解脂耶氏酵母

 

<220>

<221>misc_feature

<222>(2)..(3)

<223>Xaa可以是任何天然存在的氨基酸

 

<220>

<221>misc_feature

<222>(5)..(15)

<223>Xaa可以是任何天然存在的氨基酸

 

<220>

<221>misc_feature

<222>(17)..(17)

<223>Xaa可以是任何天然存在的氨基酸

 

<220>

<221>misc_feature

<222>(19)..(20)

<223>Xaa可以是任何天然存在的氨基酸

 

<220>

<221>misc_feature

<222>(22)..(23)

<223>Xaa可以是任何天然存在的氨基酸

 

<220>

<221>misc_feature

<222>(25)..(34)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(36)..(37)

<223>Xaa可以是任何天然存在的氨基酸

 

<400>25

Cys Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Cys

1               5                   10                  15

Xaa His Xaa Xaa Cys Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

            20                  25                  30

Xaa Xaa Cys Xaa Xaa Cys

        35

<210>26

<211>345

<212>PRT

<213>解脂耶氏酵母

 

<400>26

Met Trp Gly Ser Ser His Ala Phe Ala Gly Glu Ser Asp Leu Thr Leu

1               5                   10                  15

Gln Leu His Thr Arg Ser Asn Met Ser Asp Asn Thr Thr Ile Lys Lys

            20                  25                  30

Pro Ile Arg Pro Lys Pro Ile Arg Thr Glu Arg Leu Pro Tyr Ala Gly

        35                  40                  45

Ala Ala Glu Ile Ile Arg Ala Asn Gln Lys Asp His Tyr Phe Glu Ser

    50                  55                  60

Val Leu Glu Gln His Leu Val Thr Phe Leu Gln Lys Trp Lys Gly Val

65                  70                  75                  80

Arg Phe Ile His Gln Tyr Lys Glu Glu Leu Glu Thr Ala Ser Lys Phe

                85                  90                  95

Ala Tyr Leu Gly Leu Cys Thr Leu Val Gly Ser Lys Thr Leu Gly Glu

            100                 105                 110

Glu Tyr Thr Asn Leu Met Tyr Thr Ile Arg Asp Arg Thr Ala Leu Pro

        115                 120                 125

Gly Val Val Arg Arg Phe Gly Tyr Val Leu Ser Asn Thr Leu Phe Pro

    130                 135                 140

Tyr Leu Phe Val Arg Tyr Met Gly Lys Leu Arg Ala Lys Leu Met Arg

145                 150                 155                 160

Glu Tyr Pro His Leu Val Glu Tyr Asp Glu Asp Glu Pro Val Pro Ser

                165                 170                 175

Pro Glu Thr Trp Lys Glu Arg Val Ile Lys Thr Phe Val Asn Lys Phe

            180                 185                 190

Asp Lys Phe Thr Ala Leu Glu Gly Phe Thr Ala Ile His Leu Ala Ile

        195                 200                 205

Phe Tyr Val Tyr Gly Ser Tyr Tyr Gln Leu Ser Lys Arg Ile Trp Gly

    210                 215                 220

Met Arg Tyr Val Phe Gly His Arg Leu Asp Lys Asn Glu Pro Arg Ile

225                 230                 235                 240

Gly Tyr Glu Met Leu Gly Leu Leu Ile Phe Ala Arg Phe Ala Thr Ser

                245                 250                 255

Phe Val Gln Thr Gly Arg Glu Tyr Leu Gly Ala Leu Leu Glu Lys Ser

            260                 265                 270

Val Glu Lys Glu Ala Gly Glu Lys Glu Asp Glu Lys Glu Ala Val Val

        275                 280                 285

Pro Lys Lys Lys Ser Ser Ile Pro Phe Ile Glu Asp Thr Glu Gly Glu

    290                 295                 300

Thr Glu Asp Lys Ile Asp Leu Glu Asp Pro Arg Gln Leu Lys Phe Ile

305                 310                 315                 320

Pro Glu Ala Ser Arg Ala Cys Thr Leu Cys Leu Ser Tyr Ile Ser Ala

                325                 330                 335

Pro Ala Cys Thr Pro Cys Gly His Phe

            340                 345

 

<210>27

<211>2987

<212>DNA

<213>解脂耶氏酵母

 

<220>

<221>misc_feature

<223>具有W497L突变的突变型乙酰羟酸合酶(AHAS)

 

<300>

<302>解脂耶氏酵母的高二十碳五烯酸生产菌株

 

<310>US 2006-0115881-A1

<311>2005-11-02

<312>2006-06-01

<313>(1)..(2987)

 

<300>

<302>解脂耶氏酵母的高二十碳五烯酸生产菌株

 

<310>WO 2006/052870

<311>2005-11-03

<312>2006-05-18

<313>(1)..(2987)

 

<400>27

ttccctagtc ccagtgtaca cccgccgata tcgcttaccc tgcagccgga ttaaggttgg     60

caatttttca cgtccttgtc tccgcaatta ctcaccgggt ggtttataag attgcaagcg    120

tcttgatttg tctctgtata ctaacatgca atcgcgactc gcccgacggg ccactaacct    180

ggccagaatc tccagatcca agtattctct tggtctgcga tatgtttcca acacaaaagc    240

ccctgctgcc cagccggcaa ctgctgagtg agtattcctt gccataaacg acccagaacc    300

actgtatagt gtttggaagc actagtcaga agaccagcga aaacaggtgg aaaaaactga    360

gacgaaaagc aacgaccaga aatgtaatgt gtggaaaagc gacacacaca gagcagataa    420

agaggtgaca aataacgaca aatgaaatat cagtatcttc ccacaatcac tacctctcag    480

ctgtctgaag gtgcggctga tatatccatc ccacgtctaa cgtatggagt gtgatagaat    540

atgacgacac aagcatgaga actcgctctc tatccaacca ccgaaacact gtcactacag    600

ccgttcttgt tgctccattc gcttttgtga ttccatgcct tctctggtga ctgacaacat    660

tccttccttt tctccagccc tgttgttatc tgctcatgac ctacggccac tctctatcgc    720

atactaacat agacgatccc agcccgctcc ccacttccag ggcaccgttg gcaagcctcc    780

tatcctcaag aaggctgagg ctgccaacgc tgacatggac gagtccttca tcggaatgtc    840

tggaggagag atcttccacg agatgatgct gcgacacaac gtcgacactg tcttcggtta    900

ccccggtgga gccattctcc ccgtctttga cgccattcac aactctgagt acttcaactt    960

tgtgctccct cgacacgagc agggtgccgg ccacatggcc gagggctacg ctcgagcctc   1020

tggtaagccc ggtgtcgttc tcgtcacctc tggccccggt gccaccaacg tcatcacccc   1080

catgcaggac gctctttccg atggtacccc catggttgtc ttcaccggtc aggtcctgac   1140

ctccgttatc ggcactgacg ccttccagga ggccgatgtt gtcggcatct cccgatcttg   1200

caccaagtgg aacgtcatgg tcaagaacgt tgctgagctc ccccgacgaa tcaacgaggc   1260

ctttgagatt gctacttccg gccgacccgg tcccgttctc gtcgatctgc ccaaggatgt   1320

tactgctgcc atcctgcgag agcccatccc caccaagtcc accattccct cgcattctct   1380

gaccaacctc acctctgccg ccgccaccga gttccagaag caggctatcc agcgagccgc   1440

caacctcatc aaccagtcca agaagcccgt cctttacgtc ggacagggta tccttggctc   1500

cgaggagggt cctaagctgc ttaaggagct ggctgagaag gccgagattc ccgtcaccac   1560

tactctgcag ggtcttggtg cctttgacga gcgagacccc aagtctctgc acatgctcgg   1620

tatgcacggt tccggctacg ccaacatggc catgcagaac gctgactgta tcattgctct   1680

cggcgcccga tttgatgacc gagttaccgg ctccatcccc aagtttgccc ccgaggctcg   1740

agccgctgcc cttgagggtc gaggtggtat tgttcacttt gagatccagg ccaagaacat   1800

caacaaggtt gttcaggcca ccgaagccgt tgagggagac gttaccgagt ctgtccgaca   1860

gctcatcccc ctcatcaaca aggtctctgc cgctgagcga gctccctgga ctgagactat   1920

ccagtcctgg aagcagcagt tccccttcct cttcgaggct gaaggtgagg atggtgttat   1980

caagccccag tccgtcattg ctctgctctc tgacctgaca gagaacaaca aggacaagac   2040

catcatcacc accggtgttg gtcagcatca gatgtggact gcccagcatt tccgatggcg   2100

acaccctcga accatgatca cttctggtgg tcttggaact atgggttacg gcctgcccgc   2160

cgctatcggc gccaaggttg cccgacctga ctgcgacgtc attgacatcg atggtgacgc   2220

ttctttcaac atgactctga ccgagctgtc caccgccgtt cagttcaaca ttggcgtcaa   2280

ggctattgtc ctcaacaacg aggaacaggg tatggtcacc cagctgcagt ctctcttcta   2340

cgagaaccga tactgccaca ctcatcagaa gaaccccgac ttcatgaagc tggccgagtc   2400

catgggcatg aagggtatcc gaatcactca cattgaccag ctggaggccg gtctcaagga   2460

gatgctcgca tacaagggcc ctgtgctcgt tgaggttgtt gtcgacaaga agatccccgt   2520

tcttcccatg gttcccgctg gtaaggcttt gcatgagttc cttgtctacg acgctgacgc   2580

cgaggctgct tctcgacccg atcgactgaa gaatgccccc gcccctcacg tccaccagac   2640

cacctttgag aactaagtgg aaaggaacac aagcaatccg aaccaaaaat aattggggtc   2700

ccgtgcccac agagtctagt gcagacctaa aatgaccaca gtaaattata gctgttatta   2760

aacatgagat tttgaccaac aagagcgtag gaatgttatt agctactact tgtacataca   2820

cagcatttgt tttaaataat gttgcctcca ggggcagtga gatcaggacc cagatccgtg   2880

gccagctctc tgacttcaga ccgcttgtac ttaagcagct cgcaacactg ttgtcgagga   2940

ttgaacttgc catattcgat tttgtggtca tgaatccagc acacctc                 2987

 

<210>28

<211>14688

<212>DNA

<213>人工序列

 

<220>

<223>质粒pZKLeuN-29E3

 

<400>28

cgattgttgt ctactaacta tcgtacgata acttcgtata gcatacatta tacgaagtta     60

tcgcgtcgac gagtatctgt ctgactcgtc attgccgcct ttggagtacg actccaacta    120

tgagtgtgct tggatcactt tgacgataca ttcttcgttg gaggctgtgg gtctgacagc    180

tgcgttttcg gcgcggttgg ccgacaacaa tatcagctgc aacgtcattg ctggctttca    240

tcatgatcac atttttgtcg gcaaaggcga cgcccagaga gccattgacg ttctttctaa    300

tttggaccga tagccgtata gtccagtcta tctataagtt caactaactc gtaactatta    360

ccataacata tacttcactg ccccagataa ggttccgata aaaagttctg cagactaaat    420

ttatttcagt ctcctcttca ccaccaaaat gccctcctac gaagctcgag ctaacgtcca    480

caagtccgcc tttgccgctc gagtgctcaa gctcgtggca gccaagaaaa ccaacctgtg    540

tgcttctctg gatgttacca ccaccaagga gctcattgag cttgccgata aggtcggacc    600

ttatgtgtgc atgatcaaaa cccatatcga catcattgac gacttcacct acgccggcac    660

tgtgctcccc ctcaaggaac ttgctcttaa gcacggtttc ttcctgttcg aggacagaaa    720

gttcgcagat attggcaaca ctgtcaagca ccagtaccgg tgtcaccgaa tcgccgagtg    780

gtccgatatc accaacgccc acggtgtacc cggaaccgga atcattgctg gcctgcgagc    840

tggtgccgag gaaactgtct ctgaacagaa gaaggaggac gtctctgact acgagaactc    900

ccagtacaag gagttcctag tcccctctcc caacgagaag ctggccagag gtctgctcat    960

gctggccgag ctgtcttgca agggctctct ggccactggc gagtactcca agcagaccat   1020

tgagcttgcc cgatccgacc ccgagtttgt ggttggcttc attgcccaga accgacctaa   1080

gggcgactct gaggactggc ttattctgac ccccggggtg ggtcttgacg acaagggaga   1140

cgctctcgga cagcagtacc gaactgttga ggatgtcatg tctaccggaa cggatatcat   1200

aattgtcggc cgaggtctgt acggccagaa ccgagatcct attgaggagg ccaagcgata   1260

ccagaaggct ggctgggagg cttaccagaa gattaactgt tagaggttag actatggata   1320

tgtaatttaa ctgtgtatat agagagcgtg caagtatgga gcgcttgttc agcttgtatg   1380

atggtcagac gacctgtctg atcgagtatg tatgatactg cacaacctgt gtatccgcat   1440

gatctgtcca atggggcatg ttgttgtgtt tctcgatacg gagatgctgg gtacagtgct   1500

aatacgttga actacttata cttatatgag gctcgaagaa agctgacttg tgtatgactt   1560

attctcaact acatccccag tcacaatacc accactgcac taccactaca ccaaaaccat   1620

gatcaaacca cccatggact tcctggaggc agaagaactt gttatggaaa agctcaagag   1680

agagatcata acttcgtata gcatacatta tacgaagtta tcctgcaggt aaaggaattc   1740

tggagtttct gagagaaaaa ggcaagatac gtatgtaaca aagcgacgca tggtacaata   1800

ataccggagg catgtatcat agagagttag tggttcgatg atggcactgg tgcctggtat   1860

gactttatac ggctgactac atatttgtcc tcagacatac aattacagtc aagcacttac   1920

ccttggacat ctgtaggtac cccccggcca agacgatctc agcgtgtcgt atgtcggatt   1980

ggcgtagctc cctcgctcgt caattggctc ccatctactt tcttctgctt ggctacaccc   2040

agcatgtctg ctatggctcg ttttcgtgcc ttatctatcc tcccagtatt accaactcta   2100

aatgacatga tgtgattggg tctacacttt catatcagag ataaggagta gcacagttgc   2160

ataaaaagcc caactctaat cagcttcttc ctttcttgta attagtacaa aggtgattag   2220

cgaaatctgg aagcttagtt ggccctaaaa aaatcaaaaa aagcaaaaaa cgaaaaacga   2280

aaaaccacag ttttgagaac agggaggtaa cgaaggatcg tatatatata tatatatata   2340

tatacccacg gatcccgaga ccggcctttg attcttccct acaaccaacc attctcacca   2400

ccctaattca caaccatgga gtctggaccc atgcctgctg gcattccctt ccctgagtac   2460

tatgacttct ttatggactg gaagactccc ctggccatcg ctgccaccta cactgctgcc   2520

gtcggtctct tcaaccccaa ggttggcaag gtctcccgag tggttgccaa gtcggctaac   2580

gcaaagcctg ccgagcgaac ccagtccgga gctgccatga ctgccttcgt ctttgtgcac   2640

aacctcattc tgtgtgtcta ctctggcatc accttctact acatgtttcc tgctatggtc   2700

aagaacttcc gaacccacac actgcacgaa gcctactgcg acacggatca gtccctctgg   2760

aacaacgcac ttggctactg gggttacctc ttctacctgt ccaagttcta cgaggtcatt   2820

gacaccatca tcatcatcct gaagggacga cggtcctcgc tgcttcagac ctaccaccat   2880

gctggagcca tgattaccat gtggtctggc atcaactacc aagccactcc catttggatc   2940

tttgtggtct tcaactcctt cattcacacc atcatgtact gttactatgc cttcacctct   3000

atcggattcc atcctcctgg caaaaagtac ctgacttcga tgcagattac tcagtttctg   3060

gtcggtatca ccattgccgt gtcctacctc ttcgttcctg gctgcatccg aacacccggt   3120

gctcagatgg ctgtctggat caacgtcggc tacctgtttc ccttgaccta tctgttcgtg   3180

gactttgcca agcgaaccta ctccaagcga tctgccattg ccgctcagaa aaaggctcag   3240

taagcggccg cattgatgat tggaaacaca cacatgggtt atatctaggt gagagttagt   3300

tggacagtta tatattaaat cagctatgcc aacggtaact tcattcatgt caacgaggaa   3360

ccagtgactg caagtaatat agaatttgac caccttgcca ttctcttgca ctcctttact   3420

atatctcatt tatttcttat atacaaatca cttcttcttc ccagcatcga gctcggaaac   3480

ctcatgagca ataacatcgt ggatctcgtc aatagagggc tttttggact ccttgctgtt   3540

ggccaccttg tccttgctgt ctggctcatt ctgtttcaac gccttttaat taacggagta   3600

ggtctcggtg tcggaagcga cgccagatcc gtcatcctcc tttcgctctc caaagtagat   3660

acctccgacg agctctcgga caatgatgaa gtcggtgccc tcaacgtttc ggatggggga   3720

gagatcggcg agcttgggcg acagcagctg gcagggtcgc aggttggcgt acaggttcag   3780

gtcctttcgc agcttgagga gaccctgctc gggtcgcacg tcggttcgtc cgtcgggagt   3840

ggtccatacg gtgttggcag cgcctccgac agcaccgagc ataatagagt cagcctttcg   3900

gcagatgtcg agagtagcgt cggtgatggg ctcgccctcc ttctcaatgg cagctcctcc   3960

aatgagtcgg tcctcaaaca caaactcggt gccggaggcc tcagcaacag acttgagcac   4020

cttgacggcc tcggcaatca cctcggggcc acagaagtcg ccgccgagaa gaacaatctt   4080

cttggagtca gtcttggtct tcttagtttc gggttccatt gtggatgtgt gtggttgtat   4140

gtgtgatgtg gtgtgtggag tgaaaatctg tggctggcaa acgctcttgt atatatacgc   4200

acttttgccc gtgctatgtg gaagactaaa cctccgaaga ttgtgactca ggtagtgcgg   4260

tatcggctag ggacccaaac cttgtcgatg ccgatagcat gcgacgtcgg gcccaattcg   4320

ccctatagtg agtcgtatta caattcactg gccgtcgttt tacaacgtcg tgactgggaa   4380

aaccctggcg ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt   4440

aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa   4500

tggacgcgcc ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga   4560

ccgctacact tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg   4620

ccacgttcgc cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat   4680

ttagtgcttt acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg   4740

ggccatcgcc ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata   4800

gtggactctt gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt   4860

tataagggat tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat   4920

ttaacgcgaa ttttaacaaa atattaacgc ttacaatttc ctgatgcggt attttctcct   4980

tacgcatctg tgcggtattt cacaccgcat caggtggcac ttttcgggga aatgtgcgcg   5040

gaacccctat ttgtttattt ttctaaatac attcaaatat gtatccgctc atgagacaat   5100

aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt caacatttcc   5160

gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa   5220

cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac   5280

tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga   5340

tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtattgac gccgggcaag   5400

agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac tcaccagtca   5460

cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca   5520

tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa   5580

ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc   5640

tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca atggcaacaa   5700

cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag   5760

actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct   5820

ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac   5880

tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa   5940

ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt   6000

aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat   6060

ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg   6120

agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc   6180

ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg   6240

tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag   6300

cgcagatacc aaatactgtt cttctagtgt agccgtagtt aggccaccac ttcaagaact   6360

ctgtagcacc gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg   6420

gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc   6480

ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg   6540

aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa gggagaaagg   6600

cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag   6660

ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc   6720

gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct   6780

ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc   6840

ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc   6900

gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgccca atacgcaaac   6960

cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg gcgcgcccac tgagctcgtc   7020

taacggactt gatatacaac caattaaaac aaatgaaaag aaatacagtt ctttgtatca   7080

tttgtaacaa ttaccctgta caaactaagg tattgaaatc ccacaatatt cccaaagtcc   7140

acccctttcc aaattgtcat gcctacaact catataccaa gcactaacct accaaacacc   7200

actaaaaccc cacaaaatat atcttaccga atatacagta acaagctacc accacactcg   7260

ttgggtgcag tcgccagctt aaagatatct atccacatca gccacaactc ccttccttta   7320

ataaaccgac tacacccttg gctattgagg ttatgagtga atatactgta gacaagacac   7380

tttcaagaag actgtttcca aaacgtacca ctgtcctcca ctacaaacac acccaatctg   7440

cttcttctag tcaaggttgc tacaccggta aattataaat catcatttca ttagcagggc   7500

agggcccttt ttatagagtc ttatacacta gcggaccctg ccggtagacc aacccgcagg   7560

cgcgtcagtt tgctccttcc atcaatgcgt cgtagaaacg acttactcct tcttgagcag   7620

ctccttgacc ttgttggcaa caagtctccg acctcggagg tggaggaaga gcctccgata   7680

tcggcggtag tgataccagc ctcgacggac tccttgacgg cagcctcaac agcgtcaccg   7740

gcgggcttca tgttaagaga gaacttgagc atcatggcgg cagacagaat ggtggcgtac   7800

gcaactaaca tgaatgaata cgatatacat caaagactat gatacgcagt attgcacact   7860

gtacgagtaa gagcactagc cactgcactc aagtgaaacc gttgcccggg tacgagtatg   7920

agtatgtaca gtatgtttag tattgtactt ggacagtgct tgtatcgtac attctcaagt   7980

gtcaaacata aatatccgtt gctatatcct cgcaccacca cgtagctcgc tatatccctg   8040

tgttgaatcc atccatcttg gattgccaat tgtgcacaca gaaccgggca ctcacttccc   8100

catccacact tgcggccgct taagcaacgg gcttgataac agcggggggg gtgcccacgt   8160

tgttgcggtt gcggaagaac agaacaccct taccagcacc ctcggcacca gcgctgggct   8220

caacccactg gcacatacgc gcactgcggt acatggcgcg gatgaagcca cgaggaccat   8280

cctggacatc agcccggtag tgcttgccca tgatgggctt aatggcctcg gtggcctcgt   8340

ccgcgttgta gaaggggatg ctgctgacgt agtggtggag gacatgagtc tcgatgatgc   8400

cgtggagaag gtggcggccg atgaagccca tctcacggtc aatggtagca gcggcaccac   8460

ggacgaagtt ccactcgtcg ttggtgtagt ggggaagggt agggtcggtg tgctggagga   8520

aggtgatggc aacgagccag tggttaaccc agaggtaggg aacaaagtac cagatggcca   8580

tgttgtagaa accgaacttc tgaacgagga agtacagagc agtggccatc agaccgatac   8640

caatatcgct gaggacgatg agcttagcgt cactgttctc gtacagaggg ctgcggggat   8700

cgaagtggtt aacaccaccg ccgaggccgt tatgcttgcc cttgccgcga ccctcacgct   8760

ggcgctcgtg gtagttgtgg ccggtaacat tggtgatgag gtagttgggc cagccaacga   8820

gctgctgaag gacgagcatg agaagagtga aagcgggggt ctcctcagta agatgagcga   8880

gctcgtgggt catctttccg agacgagtag cctgctgctc gcgggttcgg ggaacgaaga   8940

ccatgtcacg ctccatgttg ccagtggcct tgtggtgctt tcggtgggag atttgccagc   9000

tgaagtaggg gacaaggagg gaagagtgaa gaacccagcc agtaatgtcg ttgatgatgc   9060

gagaatcgga gaaagcaccg tgaccgcact catgggcaat aacccagaga ccagtaccga   9120

aaagaccctg aagaacggtg tacacggccc acagaccagc gcgggcgggg gtggagggga   9180

tatattcggg ggtcacaaag ttgtaccaga tgctgaaagt ggtagtcagg aggacaatgt   9240

cgcggaggat ataaccgtat cccttgagag cggagcgctt gaagcagtgc ttagggatgg   9300

cattgtagat gtccttgatg gtaaagtcgg gaacctcgaa ctggttgccg taggtgtcga   9360

gcatgacacc atactcggac ttgggcttgg cgatatcaac ctcggacatg gacgagagcg   9420

atgtggaaga ggccgagtgg cggggagagt ctgaaggaga gacggcggca gactcagaat   9480

ccgtcacagt agttgaggtg acggtgcgtc taagcgcagg gttctgcttg ggcagagccg   9540

aagtggacgc catggttgat gtgtgtttaa ttcaagaatg aatatagaga agagaagaag   9600

aaaaaagatt caattgagcc ggcgatgcag acccttatat aaatgttgcc ttggacagac   9660

ggagcaagcc cgcccaaacc tacgttcggt ataatatgtt aagcttttta acacaaaggt   9720

ttggcttggg gtaacctgat gtggtgcaaa agaccgggcg ttggcgagcc attgcgcggg   9780

cgaatggggc cgtgactcgt ctcaaattcg agggcgtgcc tcaattcgtg cccccgtggc   9840

tttttcccgc cgtttccgcc ccgtttgcac cactgcagcc gcttctttgg ttcggacacc   9900

ttgctgcgag ctaggtgcct tgtgctactt aaaaagtggc ctcccaacac caacatgaca   9960

tgagtgcgtg ggccaagaca cgttggcggg gtcgcagtcg gctcaatggc ccggaaaaaa  10020

cgctgctgga gctggttcgg acgcagtccg ccgcggcgta tggatatccg caaggttcca  10080

tagcgccatt gccctccgtc ggcgtctatc ccgcaacctc taaatagagc gggaatataa  10140

cccaagcttc ttttttttcc tttaacacgc acacccccaa ctatcatgtt gctgctgctg  10200

tttgactcta ctctgtggag gggtgctccc acccaaccca acctacaggt ggatccggcg  10260

ctgtgattgg ctgataagtc tcctatccgg actaattctg accaatggga catgcgcgca  10320

ggacccaaat gccgcaatta cgtaacccca acgaaatgcc tacccctctt tggagcccag  10380

cggccccaaa tccccccaag cagcccggtt ctaccggctt ccatctccaa gcacaagcag  10440

cccggttcta ccggcttcca tctccaagca cccctttctc cacaccccac aaaaagaccc  10500

gtgcaggaca tcctactgcg tcgacatcat ttaaattcct tcacttcaag ttcattcttc  10560

atctgcttct gttttacttt gacaggcaaa tgaagacatg gtacgacttg atggaggcca  10620

agaacgccat ttcaccccga gacaccgaag tgcctgaaat cctggctgcc cccattgata  10680

acatcggaaa ctacggtatt ccggaaagtg tatatagaac ctttccccag cttgtgtctg  10740

tggatatgga tggtgtaatc ccctttgagt actcgtcttg gcttctctcc gagcagtatg  10800

aggctctcta atctagcgca tttaatatct caatgtattt atatatttat cttctcatgc  10860

ggccgctcac tgaatctttt tggctccctt gtgcttcctg acgatatacg tttgcacata  10920

gaaattcaag aacaaacaca agactgtgcc aacataaaag taattgaaga accagccaaa  10980

catcctcatc ccatcttggc gataacaggg aatgttcctg tacttccaga caatgtagaa  11040

accaacattg aattgaatga tctgcattga tgtaatcagg gattttggca tggggaactt  11100

cagcttgatc aatctggtcc aataataacc gtacatgatc cagtggatga aaccattcaa  11160

cagcacaaaa atccaaacag cttcatttcg gtaattatag aacagccaca tatccatcgg  11220

tgcccccaaa tgatggaaga attgcaacca ggtcagaggc ttgcccatca gtggcaaata  11280

gaaggagtca atatactcca ggaacttgct caaatagaac aactgcgtgg tgatcctgaa  11340

gacgttgttg tcaaaagcct tctcgcagtt gtcagacata acaccgatgg tgtacatggc  11400

atatgccatt gagaggaatg atcccaacga ataaatggac atgagaaggt tgtaattggt  11460

gaaaacaaac ttcatacgag actgaccttt tggaccaagg gggccaagag tgaacttcaa  11520

gatgacaaat gcgatggaca agtaaagcac ctcacagtga ctggcatcac tccagagttg  11580

ggcataatca actggttggg taaaacttcc tgcccaattg agactatttc attcaccacc  11640

tccatggcca ttgctgtaga tatgtcttgt gtgtaagggg gttggggtgg ttgtttgtgt  11700

tcttgacttt tgtgttagca agggaagacg ggcaaaaaag tgagtgtggt tgggagggag  11760

agacgagcct tatatataat gcttgtttgt gtttgtgcaa gtggacgccg aaacgggcag  11820

gagccaaact aaacaaggca gacaatgcga gcttaattgg attgcctgat gggcaggggt  11880

tagggctcga tcaatggggg tgcgaagtga caaaattggg aattaggttc gcaagcaagg  11940

ctgacaagac tttggcccaa acatttgtac gcggtggaca acaggagcca cccatcgtct  12000

gtcacgggct agccggtcgt gcgtcctgtc aggctccacc taggctccat gccactccat  12060

acaatcccac tagtgtaccg ctaggccgct tttagctccc atctaagacc cccccaaaac  12120

ctccactgta cagtgcactg tactgtgtgg cgatcaaggg caagggaaaa aaggcgcaaa  12180

catgcacgca tggaatgacg taggtaaggc gttactagac tgaaaagtgg cacatttcgg  12240

cgtgccaaag ggtcctaggt gcgtttcgcg agctgggcgc caggccaagc cgctccaaaa  12300

cgcctctccg actccctcca gcggcctcca tatccccatc cctctccaca gcaatgttgt  12360

taagccttgc aaacgaaaaa atagaaaggc taataagctt ccaatattgt ggtgtacgct  12420

gcataacgca acaatgagcg ccaaacaaca cacacacaca gcacacagca gcattaacca  12480

cgatgaacag catgacatta caggtgggtg tgtaatcagg gccctgattg ctggtggtgg  12540

gagcccccat catgggcaga tctgcgtaca ctgtttaaac agtgtacgca gatctactat  12600

agaggaacat ttaaattgcc ccggagaaga cggccaggcc gcctagatga caaattcaac  12660

aactcacagc tgactttctg ccattgccac tagggggggg cctttttata tggccaagcc  12720

aagctctcca cgtcggttgg gctgcaccca acaataaatg ggtagggttg caccaacaaa  12780

gggatgggat ggggggtaga agatacgagg ataacggggc tcaatggcac aaataagaac  12840

gaatactgcc attaagactc gtgatccagc gactgacacc attgcatcat ctaagggcct  12900

caaaactacc tcggaactgc tgcgctgatc tggacaccac agaggttccg agcactttag  12960

gttgcaccaa atgtcccacc aggtgcaggc agaaaacgct ggaacagcgt gtacagtttg  13020

tcttaacaaa aagtgagggc gctgaggtcg agcagggtgg tgtgacttgt tatagccttt  13080

agagctgcga aagcgcgtat ggatttggct catcaggcca gattgagggt ctgtggacac  13140

atgtcatgtt agtgtacttc aatcgccccc tggatatagc cccgacaata ggccgtggcc  13200

tcattttttt gccttccgca catttccatt gctcgatacc cacaccttgc ttctcctgca  13260

cttgccaacc ttaatactgg tttacattga ccaacatctt acaagcgggg ggcttgtcta  13320

gggtatatat aaacagtggc tctcccaatc ggttgccagt ctcttttttc ctttctttcc  13380

ccacagattc gaaatctaaa ctacacatca cagaattccg agccgtgagt atccacgaca  13440

agatcagtgt cgagacgacg cgttttgtgt aatgacacaa tccgaaagtc gctagcaaca  13500

cacactctct acacaaacta acccagctct ggtaccatgg aggtcgtgaa cgaaatcgtc  13560

tccattggcc aggaggttct tcccaaggtc gactatgctc agctctggtc tgatgcctcg  13620

cactgcgagg tgctgtacct ctccatcgcc ttcgtcatcc tgaagttcac ccttggtcct  13680

ctcggaccca agggtcagtc tcgaatgaag tttgtgttca ccaactacaa cctgctcatg  13740

tccatctact cgctgggctc cttcctctct atggcctacg ccatgtacac cattggtgtc  13800

atgtccgaca actgcgagaa ggctttcgac aacaatgtct tccgaatcac cactcagctg  13860

ttctacctca gcaagttcct cgagtacatt gactccttct atctgcccct catgggcaag  13920

cctctgacct ggttgcagtt ctttcaccat ctcggagctc ctatggacat gtggctgttc  13980

tacaactacc gaaacgaagc cgtttggatc tttgtgctgc tcaacggctt cattcactgg  14040

atcatgtacg gctactattg gacccgactg atcaagctca agttccctat gcccaagtcc  14100

ctgattactt ctatgcagat cattcagttc aacgttggct tctacatcgt ctggaagtac  14160

cggaacattc cctgctaccg acaagatgga atgagaatgt ttggctggtt tttcaactac  14220

ttctacgttg gtactgtcct gtgtctgttc ctcaacttct acgtgcagac ctacatcgtc  14280

cgaaagcaca agggagccaa aaagattcag tgagcggccg catgtacata caagattatt  14340

tatagaaatg aatcgcgatc gaacaaagag tacgagtgta cgagtagggg atgatgataa  14400

aagtggaaga agttccgcat ctttggattt atcaacgtgt aggacgatac ttcctgtaaa  14460

aatgcaatgt ctttaccata ggttctgctg tagatgttat taactaccat taacatgtct  14520

acttgtacag ttgcagacca gttggagtat agaatggtac acttaccaaa aagtgttgat  14580

ggttgtaact acgatatata aaactgttga cgggatcccc gctgatatgc ctaaggaaca  14640

atcaaagagg aagatattaa ttcagaatgc tagtatacag ttagggat               14688

 

<210>29

<211>1434

<212>DNA

<213>串珠镰孢菌

 

<220>

<221>CDS

<222>(1)..(1434)

<223>Δ-12去饱和酶

<300>

<302>适于改变含油酵母中多不饱和脂肪酸含量的Δ-12去饱和酶

 

<310>WO 2005/047485

<311>2004-11-12

<312>2005-05-26

<313>(1)..(1434)

 

<300>

<302>适于改变含油酵母中多不饱和脂肪酸含量的Δ-12去饱和酶

 

<310>US 2005-0216975-A1

<311>2004-11-10

<312>2005-09-29

<313>(1)..(1434)

 

<400>29

atg gcg tcc act tcg gct ctg ccc aag cag aac cct gcg ctt aga cgc       48

Met Ala Ser Thr Ser Ala Leu Pro Lys Gln Asn Pro Ala Leu Arg Arg

1               5                   10                  15

acc gtc acc tca act act gtg acg gat tct gag tct gcc gcc gtc tct       96

Thr Val Thr Ser Thr Thr Val Thr Asp Ser Glu Ser Ala Ala Val Ser

            20                  25                  30

cct tca gac tct ccc cgc cac tcg gcc tct tcc aca tcg ctc tcg tcc      144

Pro Ser Asp Ser Pro Arg His Ser Ala Ser Ser Thr Ser Leu Ser Ser

        35                  40                  45

atg tcc gag gtt gat atc gcc aag ccc aag tcc gag tat ggt gtc atg      192

Met Ser Glu Val Asp Ile Ala Lys Pro Lys Ser Glu Tyr Gly Val Met

    50                  55                  60

ctc gac acc tac ggc aac cag ttc gag gtt ccc gac ttt acc atc aag      240

Leu Asp Thr Tyr Gly Asn Gln Phe Glu Val Pro Asp Phe Thr Ile Lys

65                  70                  75                  80

gac atc tac aat gcc atc cct aag cac tgc ttc aag cgc tcc gct ctc      288

Asp Ile Tyr Asn Ala Ile Pro Lys His Cys Phe Lys Arg Ser Ala Leu

                85                  90                  95

aag gga tac ggt tat atc ctc cgc gac att gtc ctc ctg act acc act      336

Lys Gly Tyr Gly Tyr Ile Leu Arg Asp Ile Val Leu Leu Thr Thr Thr

            100                 105                 110

ttc agc atc tgg tac aac ttt gtg acc ccc gaa tat atc ccc tcc acc      384

Phe Ser Ile Trp Tyr Asn Phe Val Thr Pro Glu Tyr Ile Pro Ser Thr

        115                 120                 125

ccc gcc cgc gct ggt ctg tgg gcc gtg tac acc gtt ctt cag ggt ctt      432

Pro Ala Arg Ala Gly Leu Trp Ala Val Tyr Thr Val Leu Gln Gly Leu

    130                 135                 140

ttc ggt act ggt ctc tgg gtt att gcc cat gag tgc ggt cac ggt gct      480

Phe Gly Thr Gly Leu Trp Val Ile Ala His Glu Cys Gly His Gly Ala

145                 150                 155                 160

ttc tcc gat tct cgc atc atc aac gac att act ggc tgg gtt ctt cac      528

Phe Ser Asp Ser Arg Ile Ile Asn Asp Ile Thr Gly Trp Val Leu His

                165                 170                 175

tct tcc ctc ctt gtc ccc tac ttc agc tgg caa atc tcc cac cga aag      576

Ser Ser Leu Leu Val Pro Tyr Phe Ser Trp Gln Ile Ser His Arg Lys

            180                 185                 190

cac cac aag gcc act ggc aac atg gag cgt gac atg gtc ttc gtt ccc      624

His His Lys Ala Thr Gly Asn Met Glu Arg Asp Met Val Phe Val Pro

        195                 200                 205

cga acc cgc gag cag cag gct act cgt ctc gga aag atg acc cac gag      672

Arg Thr Arg Glu Gln Gln Ala Thr Arg Leu Gly Lys Met Thr His Glu

    210                 215                 220

ctc gct cat ctt act gag gag acc ccc gct ttc act ctt ctc atg ctc      720

Leu Ala His Leu Thr Glu Glu Thr Pro Ala Phe Thr Leu Leu Met Leu

225                 230                 235                 240

gtc ctt cag cag ctc gtt ggc tgg ccc aac tac ctc atc acc aat gtt      768

Val Leu Gln Gln Leu Val Gly Trp Pro Asn Tyr Leu Ile Thr Asn Val

                245                 250                 255

acc ggc cac aac tac cac gag cgc cag cgt gag ggt cgc ggc aag ggc      816

Thr Gly His Asn Tyr His Glu Arg Gln Arg Glu Gly Arg Gly Lys Gly

            260                 265                 270

aag cat aac ggc ctc ggc ggt ggt gtt aac cac ttc gat ccc cgc agc      864

Lys His Asn Gly Leu Gly Gly Gly Val Asn His Phe Asp Pro Arg Ser

        275                 280                 285

cct ctg tac gag aac agt gac gct aag ctc atc gtc ctc agc gat att      912

Pro Leu Tyr Glu Asn Ser Asp Ala Lys Leu Ile Val Leu Ser Asp Ile

    290                 295                 300

ggt atc ggt ctg atg gcc act gct ctg tacttc ctc gtt cag aag ttc       960

Gly Ile Gly Leu Met Ala Thr Ala Leu Tyr Phe Leu ValGln Lys Phe

305                 310                 315                 320

ggt ttc tac aac atg gcc atc tgg tac ttt gtt ccc tac ctc tgg gtt     1008

Gly Phe Tyr Asn Met Ala Ile Trp Tyr Phe Val Pro Tyr Leu Trp Val

                325                 330                 335

aac cac tgg ctc gtt gcc atc acc ttc ctc cag cac acc gac cct acc     1056

Asn His Trp Leu Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr

            340                 345                 350

ctt ccc cac tac acc aac gac gag tgg aac ttc gtc cgt ggt gcc gct     1104

Leu Pro His Tyr Thr Asn Asp Glu Trp Asn Phe Val Arg Gly Ala Ala

        355                 360                 365

gct acc att gac cgt gag atg ggc ttc atc ggc cgc cac ctt ctc cac     1152

Ala Thr Ile Asp Arg Glu Met Gly Phe Ile Gly Arg His Leu Leu His

    370                 375                 380

ggc atc atc gag act cat gtc ctc cac cac tac gtc agc agc atc ccc     1200

Gly Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Ser Ile Pro

385                 390                 395                 400

ttc tac aac gcg gac gag gcc acc gag gcc att aag ccc atc atg ggc     1248

Phe Tyr Asn Ala Asp Glu Ala Thr Glu Ala Ile Lys Pro Ile Met Gly

                405                 410                 415

aag cac tac cgg gct gat gtc cag gat ggt cct cgt ggc ttc atc cgc     1296

Lys His Tyr Arg Ala Asp Val Gln Asp Gly Pro Arg Gly Phe Ile Arg

            420                 425                 430

gcc atg tac cgc agt gcg cgt atg tgc cag tgg gtt gag ccc agc gct     1344

Ala Met Tyr Arg Ser Ala Arg Met Cys Gln Trp Val Glu Pro Ser Ala

        435                 440                 445

ggt gcc gag ggt gct ggt aag ggt gtt ctg ttc ttc cgc aac cgc aac     1392

Gly Ala Glu Gly Ala Gly Lys Gly Val Leu Phe Phe Arg Asn Arg Asn

    450                 455                 460

aac gtg ggc acc ccc ccc gct gtt atc aag ccc gtt gct taa             1434

Asn Val Gly Thr Pro Pro Ala Val Ile Lys Pro Val Ala

465                 470                 475

 

<210>30

<211>477

<212>PRT

<213>串珠镰孢菌

 

<400>30

Met Ala Ser Thr Ser Ala Leu Pro Lys Gln Asn Pro Ala Leu Arg Arg

1               5                   10                  15

Thr Val Thr Ser Thr Thr Val Thr Asp Ser Glu Ser Ala Ala Val Ser

            20                  25                  30

Pro Ser Asp Ser Pro Arg His Ser Ala Ser Ser Thr Ser Leu Ser Ser

        35                  40                  45

Met Ser Glu Val Asp Ile Ala Lys Pro Lys Ser Glu Tyr Gly Val Met

    50                  55                  60

Leu Asp Thr Tyr Gly Asn Gln Phe Glu Val Pro Asp Phe Thr Ile Lys

65                  70                  75                  80

Asp Ile Tyr Asn Ala Ile Pro Lys His Cys Phe Lys Arg Ser Ala Leu

                85                  90                  95

Lys Gly Tyr Gly Tyr Ile Leu Arg Asp Ile Val Leu Leu Thr Thr Thr

            100                 105                 110

Phe Ser Ile Trp Tyr Asn Phe Val Thr Pro Glu Tyr Ile Pro Ser Thr

        115                 120                 125

Pro Ala Arg Ala Gly Leu Trp Ala Val Tyr Thr Val Leu Gln Gly Leu

    130                 135                 140

Phe Gly Thr Gly Leu Trp Val Ile Ala His Glu Cys Gly His Gly Ala

145                 150                 155                 160

Phe Ser Asp Ser Arg Ile Ile Asn Asp Ile Thr Gly Trp Val Leu His

                165                 170                 175

Ser Ser Leu Leu Val Pro Tyr Phe Ser Trp Gln Ile Ser His Arg Lys

            180                 185                 190

His His Lys Ala Thr Gly Asn Met Glu Arg Asp Met Val Phe Val Pro

        195                 200                 205

Arg Thr Arg Glu Gln Gln Ala Thr Arg Leu Gly Lys Met Thr His Glu

    210                 215                 220

Leu Ala His Leu Thr Glu Glu Thr Pro Ala Phe Thr Leu Leu Met Leu

225                 230                 235                 240

Val Leu Gln Gln Leu Val Gly Trp Pro Asn Tyr Leu Ile Thr Asn Val

                245                 250                 255

Thr Gly His Asn Tyr His Glu Arg Gln Arg Glu Gly Arg Gly Lys Gly

            260                 265                 270

Lys His Asn Gly Leu Gly Gly Gly Val Asn His Phe Asp Pro Arg Ser

        275                 280                 285

Pro Leu Tyr Glu Asn Ser Asp Ala Lys Leu Ile Val Leu Ser Asp Ile

    290                 295                 300

Gly Ile Gly Leu Met Ala Thr Ala Leu Tyr Phe Leu Val Gln Lys Phe

305                 310                 315                 320

Gly Phe Tyr Asn Met Ala Ile Trp Tyr Phe Val Pro Tyr Leu Trp Val

                325                 330                 335

Asn His Trp Leu Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr

            340                 345                 350

Leu Pro His Tyr Thr Asn Asp Glu Trp Asn Phe Val Arg Gly Ala Ala

        355                 360                 365

Ala Thr Ile Asp Arg Glu Met Gly Phe Ile Gly Arg His Leu Leu His

    370                 375                 380

Gly Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Ser Ile Pro

385                 390                 395                 400

Phe Tyr Asn Ala Asp Glu Ala Thr Glu Ala Ile Lys Pro Ile Met Gly

                405                 410                 415

Lys His Tyr Arg Ala Asp Val Gln Asp Gly Pro Arg Gly Phe Ile Arg

            420                 425                 430

Ala Met Tyr Arg Ser Ala Arg Met Cys Gln Trp Val Glu Pro Ser Ala

        435                 440                 445

Gly Ala Glu Gly Ala Gly Lys Gly Val Leu Phe Phe Arg Asn Arg Asn

    450                 455                 460

Asn Val Gly Thr Pro Pro Ala Val Ile Lys Pro Val Ala

465                 470                 475

 

<210>31

<211>777

<212>DNA

<213>小眼虫

 

<220>

<221>CDS

<222>(1)..(777)

<223>合成Δ-9延伸酶(经密码子优化用于解脂耶氏酵母)

 

<300>

<302>Δ-9延伸酶及其在制备多不饱和脂肪酸中的应用

 

<310>WO 2007/061742

<311>2006-11-16

<312>2007-05-31

<313>(1)..(777)

 

<300>

<302>Δ-9延伸酶及其在制备多不饱和脂肪酸中的应用

 

<310>US-2007-0117190-A1

<311>2006-11-16

<312>2007-05-24

<313>(1)..(777)

 

<400>31

atg gag gtc gtg aac gaa atc gtc tcc att ggc cag gag gtt ctt ccc       48

Met Glu Val Val Asn Glu Ile Val Ser Ile Gly Gln Glu Val Leu Pro

1               5                   10                  15

aag gtc gac tat gct cag ctc tgg tct gat gcc tcg cac tgc gag gtg       96

Lys Val Asp Tyr Ala Gln Leu Trp Ser Asp Ala Ser His Cys Glu Val

            20                  25                  30

ctg tac ctc tcc atc gcc ttc gtc atc ctg aag ttc acc ctt ggt cct      144

Leu Tyr Leu Ser Ile Ala Phe Val Ile Leu Lys Phe Thr Leu Gly Pro

        35                  40                  45

ctc gga ccc aag ggt cag tct cga atg aag ttt gtg ttc acc aac tac      192

Leu Gly Pro Lys Gly Gln Ser Arg Met Lys Phe Val Phe Thr Asn Tyr

    50                  55                  60

aac ctg ctc atg tcc atc tac tcg ctg ggc tcc ttc ctc tct atg gcc      240

Asn Leu Leu Met Ser Ile Tyr Ser Leu Gly Ser Phe Leu Ser Met Ala

65                  70                  75                  80

tac gcc atg tac acc att ggt gtc atg tcc gac aac tgc gag aag gct      288

Tyr Ala Met Tyr Thr Ile Gly Val Met Ser Asp Asn Cys Glu Lys Ala

                85                  90                  95

ttc gac aac aat gtc ttc cga atc acc act cag ctg ttc tac ctc agc      336

Phe Asp Asn Asn Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser

            100                 105                 110

aag ttc ctc gag tac att gac tcc ttc tat ctg ccc ctc atg ggc aag      384

Lys Phe Leu Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Gly Lys

        115                 120                 125

cct ctg acc tgg ttg cag ttc ttt cac cat ctc gga gct cct atg gac      432

Pro Leu Thr Trp Leu Gln Phe Phe His His Leu Gly Ala Pro Met Asp

    130                 135                 140

atg tgg ctg ttc tac aac tac cga aac gaa gcc gtt tgg atc ttt gtg      480

Met Trp Leu Phe Tyr Asn Tyr Arg Asn Glu Ala Val Trp Ile Phe Val

145                 150                 155                 160

ctg ctc aac ggc ttc att cac tgg atc atg tac ggc tac tat tgg acc      528

Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr

                165                 170                 175

cga ctg atc aag ctc aag ttc cct atg ccc aag tcc ctg att act tct      576

Arg Leu Ile Lys Leu Lys Phe Pro Met Pro Lys Ser Leu Ile Thr Ser

            180                 185                 190

atg cag atc att cag ttc aac gtt ggc ttc tac atc gtc tgg aag tac      624

Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr

        195                 200                 205

cgg aac att ccc tgc tac cga caa gat gga atg aga atg ttt ggc tgg      672

Arg Asn Ile Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Gly Trp

    210                 215                 220

ttt ttc aac tac ttc tac gtt ggt act gtc ctg tgt ctg ttc ctc aac      720

Phe Phe Asn Tyr Phe Tyr Val Gly Thr Val Leu Cys Leu Phe Leu Asn

225                 230                 235                 240

ttc tac gtg cag acc tac atc gtc cga aag cac aag gga gcc aaa aag      768

Phe Tyr Val Gln Thr Tyr Ile Val Arg Lys His Lys Gly Ala Lys Lys

                245                 250                 255

att cag tga                                                          777

Ile Gln

 

<210>32

<211>258

<212>PRT

<213>小眼虫

 

<400>32

Met Glu Val Val Asn Glu Ile Val Ser Ile Gly Gln Glu Val Leu Pro

1               5                   10                  15

Lys Val Asp Tyr Ala Gln Leu Trp Ser Asp Ala Ser His Cys Glu Val

            20                  25                  30

Leu Tyr Leu Ser Ile Ala Phe Val Ile Leu Lys Phe Thr Leu Gly Pro

        35                  40                  45

Leu Gly Pro Lys Gly Gln Ser Arg Met Lys Phe Val Phe Thr Asn Tyr

    50                  55                  60

Asn Leu Leu Met Ser Ile Tyr Ser Leu Gly Ser Phe Leu Ser Met Ala

65                  70                  75                  80

Tyr Ala Met Tyr Thr Ile Gly Val Met Ser Asp Asn Cys Glu Lys Ala

                85                  90                  95

Phe Asp Asn Asn Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser

            100                 105                 110

Lys Phe Leu Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Gly Lys

        115                 120                 125

Pro Leu Thr Trp Leu Gln Phe Phe His His Leu Gly Ala Pro Met Asp

    130                 135                 140

Met Trp Leu Phe Tyr Asn Tyr Arg Asn Glu Ala Val Trp Ile Phe Val

145                 150                 155                 160

Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr

                165                 170                 175

Arg Leu Ile Lys Leu Lys Phe Pro Met Pro Lys Ser Leu Ile Thr Ser

            180                 185                 190

Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr

        195                 200                 205

Arg Asn Ile Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Gly Trp

    210                 215                 220

Phe Phe Asn Tyr Phe Tyr Val Gly Thr Val Leu Cys Leu Phe Leu Asn

225                 230                 235                 240

Phe Tyr Val Gln Thr Tyr Ile Val Arg Lys His Lys Gly Ala Lys Lys

                245                 250                 255

Ile Gln

 

<210>33

<211>34

<212>DNA

<213>大肠杆菌

 

<400>33

ataacttcgt ataatgtatg ctatacgaag ttat                                 34

 

<210>34

<211>828

<212>DNA

<213>高山被孢霉

 

<220>

<221>CDS

<222>(1)..(828)

<223>合成C16/18延伸酶(经密码子优化用于解脂耶氏酵母)

 

<300>

<302>高山被孢霉C16/18脂肪酸延伸酶

<310>US 2007-0087420-A1

<311>2005-10-19

<312>2007-04-19

<313>(1)..(828)

 

<300>

<302>高山被孢霉C16/18脂肪酸延伸酶

<310>WO 2007/046817

<311>2005-11-04

<312>2007-04-26

<313>(1)..(828)

 

<400>34

atg gag tct gga ccc atg cct gct ggc att ccc ttc cct gag tac tat       48

Met Glu Ser Gly Pro Met Pro Ala Gly Ile Pro Phe Pro Glu Tyr Tyr

1               5                   10                  15

gac ttc ttt atg gac tgg aag act ccc ctg gcc atc gct gcc acc tac      96

Asp Phe Phe Met Asp Trp Lys Thr Pro Leu Ala Ile Ala Ala Thr Tyr

            20                  25                  30

act gct gcc gtc ggt ctc ttc aac ccc aag gtt ggc aag gtc tcc cga      144

Thr Ala Ala Val Gly Leu Phe Asn Pro Lys Val Gly Lys Val Ser Arg

        35                  40                  45

gtg gtt gcc aag tcg gct aac gca aag cct gcc gag cga acc cag tcc      192

Val Val Ala Lys Ser Ala Asn Ala Lys Pro Ala Glu Arg Thr Gln Ser

    50                  55                  60

gga gct gcc atg act gcc ttc gtc ttt gtg cac aac ctc att ctg tgt      240

Gly Ala Ala Met Thr Ala Phe Val Phe Val His Asn Leu Ile Leu Cys

65                  70                  75                  80

gtc tac tct ggc atc acc ttc tac tac atg ttt cct gct atg gtc aag      288

Val Tyr Ser Gly Ile Thr Phe Tyr Tyr Met Phe Pro Ala Met Val Lys

                85                  90                  95

aac ttc cga acc cac aca ctg cac gaa gcc tac tgc gac acg gat cag      336

Asn Phe Arg Thr His Thr Leu His Glu Ala Tyr Cys Asp Thr Asp Gln

            100                 105                 110

tcc ctc tgg aac aac gca ctt ggc tac tgg ggt tac ctc ttc tac ctg      384

Ser Leu Trp Asn Asn Ala Leu Gly Tyr Trp Gly Tyr Leu Phe Tyr Leu

        115                 120                 125

tcc aag ttc tac gag gtc att gac acc atc atc atc atc ctg aag gga      432

Ser Lys Phe Tyr Glu Val Ile Asp Thr Ile Ile Ile Ile Leu Lys Gly

    130                 135                 140

cga cgg tcc tcg ctg ctt cag acc tac cac cat gct gga gcc atg att      480

Arg Arg Ser Ser Leu Leu Gln Thr Tyr His His Ala Gly Ala Met Ile

145                 150                 155                 160

acc atg tgg tct ggc atc aac tac caa gcc act ccc att tgg atc ttt      528

Thr Met Trp Ser Gly Ile Asn Tyr Gln Ala Thr Pro Ile Trp Ile Phe

                165                 170                 175

gtg gtc ttc aac tcc ttc att cac acc atc atg tac tgt tac tat gcc      576

Val Val Phe Asn Ser Phe Ile His Thr Ile Met Tyr Cys Tyr Tyr Ala

            180                 185                 190

ttc acc tct atc gga ttc cat cct cct ggc aaa aag tac ctg act tcg      624

Phe Thr Ser Ile Gly Phe His Pro Pro Gly Lys Lys Tyr Leu Thr Ser

        195                 200                 205

atg cag att act cag ttt ctg gtc ggt atc acc att gcc gtg tcc tac      672

Met Gln Ile Thr Gln Phe Leu Val Gly Ile Thr Ile Ala Val Ser Tyr

    210                 215                 220

ctc ttc gtt cct ggc tgc atc cga aca ccc ggt gct cag atg gct gtc      720

Leu Phe Val Pro Gly Cys Ile Arg Thr Pro Gly Ala Gln Met Ala Val

225                 230                 235                 240

tgg atc aac gtc ggc tac ctg ttt ccc ttg acc tat ctg ttc gtg gac      768

Trp Ile Asn Val Gly Tyr Leu Phe Pro Leu Thr Tyr Leu Phe Val Asp

                245                 250                 255

ttt gcc aag cga acc tac tcc aag cga tct gcc att gcc gct cag aaa      816

Phe Ala Lys Arg Thr Tyr Ser Lys Arg Ser Ala Ile Ala Ala Gln Lys

            260                 265                 270

aag gct cag taa                                                      828

Lys Ala Gln

        275

 

<210>35

<211>275

<212>PRT

<213>高山被孢霉

 

<400>35

Met Glu Ser Gly Pro Met Pro Ala Gly Ile Pro Phe Pro Glu Tyr Tyr

1               5                   10                  15

Asp Phe Phe Met Asp Trp Lys Thr Pro Leu Ala Ile Ala Ala Thr Tyr

            20                  25                  30

Thr Ala Ala Val Gly Leu Phe Asn Pro Lys Val Gly Lys Val Ser Arg

        35                  40                  45

Val Val Ala Lys Ser Ala Asn Ala Lys Pro Ala Glu Arg Thr Gln Ser

    50                  55                  60

Gly Ala Ala Met Thr Ala Phe Val Phe Val His Asn Leu Ile Leu Cys

65                  70                  75                  80

Val Tyr Ser Gly Ile Thr Phe Tyr Tyr Met Phe Pro Ala Met Val Lys

                85                  90                  95

Asn Phe Arg Thr His Thr Leu His Glu Ala Tyr Cys Asp Thr Asp Gln

            100                 105                 110

Ser Leu Trp Asn Asn Ala Leu Gly Tyr Trp Gly Tyr Leu Phe Tyr Leu

        115                 120                 125

Ser Lys Phe Tyr Glu Val Ile Asp Thr Ile Ile Ile Ile Leu Lys Gly

    130                 135                 140

Arg Arg Ser Ser Leu Leu Gln Thr Tyr His His Ala Gly Ala Met Ile

145                 150                 155                 160

Thr Met Trp Ser Gly Ile Asn Tyr Gln Ala Thr Pro Ile Trp Ile Phe

                165                 170                 175

Val Val Phe Asn Ser Phe Ile His Thr Ile Met Tyr Cys Tyr Tyr Ala

            180                 185                 190

Phe Thr Ser Ile Gly Phe His Pro Pro Gly Lys Lys Tyr Leu Thr Ser

        195                 200                 205

Met Gln Ile Thr Gln Phe Leu Val Gly Ile Thr Ile Ala Val Ser Tyr

    210                 215                 220

Leu Phe Val Pro Gly Cys Ile Arg Thr Pro Gly Ala Gln Met Ala Val

225                 230                 235                 240

Trp Ile Asn Val Gly Tyr Leu Phe Pro Leu Thr Tyr Leu Phe Val Asp

                245                 250                 255

Phe Ala Lys Arg Thr Tyr Ser Lys Arg Ser Ala Ile Ala Ala Gln Lys

            260                 265                 270

Lys Ala Gln

        275

 

<210>36

<211>8739

<212>DNA

<213>人工序列

 

<220>

<223>质粒pY116

 

<400>36

ggccgccacc gcggcccgag attccggcct cttcggccgc caagcgaccc gggtggacgt     60

ctagaggtac ctagcaatta acagatagtt tgccggtgat aattctctta acctcccaca    120

ctcctttgac ataacgattt atgtaacgaa actgaaattt gaccagatat tgtgtccgcg    180

gtggagctcc agcttttgtt ccctttagtg agggtttaaa cgagcttggc gtaatcatgg    240

tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa cgtacgagcc    300

ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg    360

ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc    420

ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact    480

gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta    540

atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag    600

caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc    660

cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta    720

taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg    780

ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc    840

tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac    900

gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac    960

ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg   1020

aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga   1080

aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt   1140

agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag   1200

cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct   1260

gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg   1320

atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat   1380

gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc   1440

tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg   1500

gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct   1560

ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca   1620

actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg   1680

ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg   1740

tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc   1800

cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag   1860

ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg   1920

ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag   1980

tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat   2040

agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg   2100

atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca   2160

gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca   2220

aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat   2280

tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag   2340

aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgcgccc   2400

tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt   2460

gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc   2520

ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta   2580

cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc   2640

tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg   2700

ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt   2760

ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat   2820

tttaacaaaa tattaacgct tacaatttcc attcgccatt caggctgcgc aactgttggg   2880

aagggcgatc ggtgcgggcc tcttcgctat tacgccagct ggcgaaaggg ggatgtgctg   2940

caaggcgatt aagttgggta acgccagggt tttcccagtc acgacgttgt aaaacgacgg   3000

ccagtgaatt gtaatacgac tcactatagg gcgaattggg taccgggccc cccctcgagg   3060

tcgatggtgt cgataagctt gatatcgaat tcatgtcaca caaaccgatc ttcgcctcaa   3120

ggaaacctaa ttctacatcc gagagactgc cgagatccag tctacactga ttaattttcg   3180

ggccaataat ttaaaaaaat cgtgttatat aatattatat gtattatata tatacatcat   3240

gatgatactg acagtcatgt cccattgcta aatagacaga ctccatctgc cgcctccaac   3300

tgatgttctc aatatttaag gggtcatctc gcattgttta ataataaaca gactccatct   3360

accgcctcca aatgatgttc tcaaaatata ttgtatgaac ttatttttat tacttagtat   3420

tattagacaa cttacttgct ttatgaaaaa cacttcctat ttaggaaaca atttataatg   3480

gcagttcgtt catttaacaa tttatgtaga ataaatgtta taaatgcgta tgggaaatct   3540

taaatatgga tagcataaat gatatctgca ttgcctaatt cgaaatcaac agcaacgaaa   3600

aaaatccctt gtacaacata aatagtcatc gagaaatatc aactatcaaa gaacagctat   3660

tcacacgtta ctattgagat tattattgga cgagaatcac acactcaact gtctttctct   3720

cttctagaaa tacaggtaca agtatgtact attctcattg ttcatacttc tagtcatttc   3780

atcccacata ttccttggat ttctctccaa tgaatgacat tctatcttgc aaattcaaca   3840

attataataa gatataccaa agtagcggta tagtggcaat caaaaagctt ctctggtgtg   3900

cttctcgtat ttatttttat tctaatgatc cattaaaggt atatatttat ttcttgttat   3960

ataatccttt tgtttattac atgggctgga tacataaagg tattttgatt taattttttg   4020

cttaaattca atcccccctc gttcagtgtc aactgtaatg gtaggaaatt accatacttt   4080

tgaagaagca aaaaaaatga aagaaaaaaa aaatcgtatt tccaggttag acgttccgca   4140

gaatctagaa tgcggtatgc ggtacattgt tcttcgaacg taaaagttgc gctccctgag   4200

atattgtaca tttttgcttt tacaagtaca agtacatcgt acaactatgt actactgttg   4260

atgcatccac aacagtttgt tttgtttttt tttgtttttt ttttttctaa tgattcatta   4320

ccgctatgta tacctacttg tacttgtagt aagccgggtt attggcgttc aattaatcat   4380

agacttatga atctgcacgg tgtgcgctgc gagttacttt tagcttatgc atgctacttg   4440

ggtgtaatat tgggatctgt tcggaaatca acggatgctc aaccgatttc gacagtaatt   4500

aattaatttg aatcgaatcg gagcctaaaa tgaacccgag tatatctcat aaaattctcg   4560

gtgagaggtc tgtgactgtc agtacaaggt gccttcatta tgccctcaac cttaccatac   4620

ctcactgaat gtagtgtacc tctaaaaatg aaatacagtg ccaaaagcca aggcactgag   4680

ctcgtctaac ggacttgata tacaaccaat taaaacaaat gaaaagaaat acagttcttt   4740

gtatcatttg taacaattac cctgtacaaa ctaaggtatt gaaatcccac aatattccca   4800

aagtccaccc ctttccaaat tgtcatgcct acaactcata taccaagcac taacctacca   4860

aacaccacta aaaccccaca aaatatatct taccgaatat acagtaacaa gctaccacca   4920

cactcgttgg gtgcagtcgc cagcttaaag atatctatcc acatcagcca caactccctt   4980

cctttaataa accgactaca cccttggcta ttgaggttat gagtgaatat actgtagaca   5040

agacactttc aagaagactg tttccaaaac gtaccactgt cctccactac aaacacaccc   5100

aatctgcttc ttctagtcaa ggttgctaca ccggtaaatt ataaatcatc atttcattag   5160

cagggcaggg ccctttttat agagtcttat acactagcgg accctgccgg tagaccaacc   5220

cgcaggcgcg tcagtttgct ccttccatca atgcgtcgta gaaacgactt actccttctt   5280

gagcagctcc ttgaccttgt tggcaacaag tctccgacct cggaggtgga ggaagagcct   5340

ccgatatcgg cggtagtgat accagcctcg acggactcct tgacggcagc ctcaacagcg   5400

tcaccggcgg gcttcatgtt aagagagaac ttgagcatca tggcggcaga cagaatggtg   5460

gcaatggggt tgaccttctg cttgccgaga tcgggggcag atccgtgaca gggctcgtac   5520

agaccgaacg cctcgttggt gtcgggcaga gaagccagag aggcggaggg cagcagaccc   5580

agagaaccgg ggatgacgga ggcctcgtcg gagatgatat cgccaaacat gttggtggtg   5640

atgatgatac cattcatctt ggagggctgc ttgatgagga tcatggcggc cgagtcgatc   5700

agctggtggt tgagctcgag ctgggggaat tcgtccttga ggactcgagt gacagtcttt   5760

cgccaaagtc gagaggaggc cagcacgttg gccttgtcaa gagaccacac gggaagaggg   5820

gggttgtgct gaagggccag gaaggcggcc attcgggcaa ttcgctcaac ctcaggaacg   5880

gagtaggtct cggtgtcgga agcgacgcca gatccgtcat cctcctttcg ctctccaaag   5940

tagatacctc cgacgagctc tcggacaatg atgaagtcgg tgccctcaac gtttcggatg   6000

ggggagagat cggcgagctt gggcgacagc agctggcagg gtcgcaggtt ggcgtacagg   6060

ttcaggtcct ttcgcagctt gaggagaccc tgctcgggtc gcacgtcggt tcgtccgtcg   6120

ggagtggtcc atacggtgtt ggcagcgcct ccgacagcac cgagcataat agagtcagcc   6180

tttcggcaga tgtcgagagt agcgtcggtg atgggctcgc cctccttctc aatggcagct   6240

cctccaatga gtcggtcctc aaacacaaac tcggtgccgg aggcctcagc aacagacttg   6300

agcaccttga cggcctcggc aatcacctcg gggccacaga agtcgccgcc gagaagaaca   6360

atcttcttgg agtcagtctt ggtcttctta gtttcgggtt ccattgtgga tgtgtgtggt   6420

tgtatgtgtg atgtggtgtg tggagtgaaa atctgtggct ggcaaacgct cttgtatata   6480

tacgcacttt tgcccgtgct atgtggaaga ctaaacctcc gaagattgtg actcaggtag   6540

tgcggtatcg gctagggacc caaaccttgt cgatgccgat agcgctatcg aacgtacccc   6600

agccggccgg gagtatgtcg gaggggacat acgagatcgt caagggtttg tggccaactg   6660

gtatttaaat gtagctaacg gtagcaggcg aactactggt acatacctcc cccggaatat   6720

gtacaggcat aatgcgtatc tgtgggacat gtggtcgttg cgccattatg taagcagcgt   6780

gtactcctct gactgtccat atggtttgct ccatctcacc ctcatcgttt tcattgttca   6840

caggcggcca caaaaaaact gtcttctctc cttctctctt cgccttagtc tactcggacc   6900

agttttagtt tagcttggcg ccactggata aatgagacct caggccttgt gatgaggagg   6960

tcacttatga agcatgttag gaggtgcttg tatggataga gaagcaccca aaataataag   7020

aataataata aaacaggggg cgttgtcatt tcatatcgtg ttttcaccat caatacacct   7080

ccaaacaatg cccttcatgt ggccagcccc aatattgtcc tgtagttcaa ctctatgcag   7140

ctcgtatctt attgagcaag taaaactctg tcagccgata ttgcccgacc cgcgacaagg   7200

gtcaacaagg tggtgtaagg ccttcgcaga agtcaaaact gtgccaaaca aacatctaga   7260

gtctctttgg tgtttctcgc atatatttwa tcggctgtct tacgtatttg cgcctcggta   7320

ccggactaat ttcggatcat ccccaatacg ctttttcttc gcagctgtca acagtgtcca   7380

tgatctatcc acctaaatgg gtcatatgag gcgtataatt tcgtggtgct gataataatt   7440

cccatatatt tgacacaaaa cttccccccc tagacataca tctcacaatc tcacttcttg   7500

tgcttctgtc acacatctcc tccagctgac ttcaactcac acctctgccc cagttggtct   7560

acagcggtat aaggtttctc cgcatagagg tgcaccactc ctcccgatac ttgtttgtgt   7620

gacttgtggg tcacgacata tatatctaca cacattgcgc caccctttgg ttcttccagc   7680

acaacaaaaa cacgacacgc taaccatggc caatttactg accgtacacc aaaatttgcc   7740

tgcattaccg gtcgatgcaa cgagtgatga ggttcgcaag aacctgatgg acatgttcag   7800

ggatcgccag gcgttttctg agcatacctg gaaaatgctt ctgtccgttt gccggtcgtg   7860

ggcggcatgg tgcaagttga ataaccggaa atggtttccc gcagaacctg aagatgttcg   7920

cgattatctt ctatatcttc aggcgcgcgg tctggcagta aaaactatcc agcaacattt   7980

gggccagcta aacatgcttc atcgtcggtc cgggctgcca cgaccaagtg acagcaatgc   8040

tgtttcactg gttatgcggc ggatccgaaa agaaaacgtt gatgccggtg aacgtgcaaa   8100

acaggctcta gcgttcgaac gcactgattt cgaccaggtt cgttcactca tggaaaatag   8160

cgatcgctgc caggatatac gtaatctggc atttctgggg attgcttata acaccctgtt   8220

acgtatagcc gaaattgcca ggatcagggt taaagatatc tcacgtactg acggtgggag   8280

aatgttaatc catattggca gaacgaaaac gctggttagc accgcaggtg tagagaaggc   8340

acttagcctg ggggtaacta aactggtcga gcgatggatt tccgtctctg gtgtagctga   8400

tgatccgaat aactacctgt tttgccgggt cagaaaaaat ggtgttgccg cgccatctgc   8460

caccagccag ctatcaactc gcgccctgga agggattttt gaagcaactc atcgattgat   8520

ttacggcgct aaggatgact ctggtcagag atacctggcc tggtctggac acagtgcccg   8580

tgtcggagcc gcgcgagata tggcccgcgc tggagtttca ataccggaga tcatgcaagc   8640

tggtggctgg accaatgtaa atattgtcat gaactatatc cgtaacctgg atagtgaaac   8700

aggggcaatg gtgcgcctgc tggaagatgg cgattaagc                          8739

<210>37

<211>15337

<212>DNA

<213>人工序列

 

<220>

<223>质粒pK02UF8289

 

<400>37

cgatcgagga agaggacaag cggctgcttc ttaagtttgt gacatcagta tccaaggcac     60

cattgcaagg attcaaggct ttgaacccgt catttgccat tcgtaacgct ggtagacagg    120

ttgatcggtt ccctacggcc tccacctgtg tcaatcttct caagctgcct gactatcagg    180

acattgatca acttcggaag aaacttttgt atgccattcg atcacatgct ggtttcgatt    240

tgtcttagag gaacgcatat acagtaatca tagagaataa acgatattca tttattaaag    300

tagatagttg aggtagaagt tgtaaagagt gataaatagc ggccgctcac tgaatctttt    360

tggctccctt gtgcttcctg acgatatacg tttgcacata gaaattcaag aacaaacaca    420

agactgtgcc aacataaaag taattgaaga accagccaaa catcctcatc ccatcttggc    480

gataacaggg aatgttcctg tacttccaga caatgtagaa accaacattg aattgaatga    540

tctgcattga tgtaatcagg gattttggca tggggaactt cagcttgatc aatctggtcc    600

aataataacc gtacatgatc cagtggatga aaccattcaa cagcacaaaa atccaaacag    660

cttcatttcg gtaattatag aacagccaca tatccatcgg tgcccccaaa tgatggaaga    720

attgcaacca ggtcagaggc ttgcccatca gtggcaaata gaaggagtca atatactcca    780

ggaacttgct caaatagaac aactgcgtgg tgatcctgaa gacgttgttg tcaaaagcct    840

tctcgcagtt gtcagacata acaccgatgg tgtacatggc atatgccatt gagaggaatg    900

atcccaacga ataaatggac atgagaaggt tgtaattggt gaaaacaaac ttcatacgag    960

actgaccttt tggaccaagg gggccaagag tgaacttcaa gatgacaaat gcgatggaca   1020

agtaaagcac ctcacagtga ctggcatcac tccagagttg ggcataatca actggttggg   1080

taaaacttcc tgcccaattg agactatttc attcaccacc tccatggtta gcgtgtcgtg   1140

tttttgttgt gctggaagaa ccaaagggtg gcgcaatgtg tgtagatata tatgtcgtga   1200

cccacaagtc acacaaacaa gtatcgggag gagtggtgca cctctatgcg gagaaacctt   1260

ataccgctgt agaccaactg gggcagaggt gtgagttgaa gtcagctgga ggagatgtgt   1320

gacagaagca caagaagtga gattgtgaga tgtatgtcta gggggggaag ttttgtgtca   1380

aatatatggg aattattatc agcaccacga aattatacgc ctcatatgac ccatttaggt   1440

ggatagatca tggacactgt tgacagctgc gaagaaaaag cgtattgggg atgatccgaa   1500

attagtccgg taccgaggcg caaatacgta agacagccga twaaatatat gcgagaaaca   1560

ccaaagagac tctagatgtt tgtttggcac agttttgact tctgcgaagg ccttacacca   1620

ccttgttgac ccttgtcgcg ggtcgggcaa tatcggctga cagagtttta cttgctcaat   1680

aagatacgag ctgcatagag ttgaactaca ggacaatatt ggggctggcc acatgaaggg   1740

cattgtttgg aggtgtattg atggtgaaaa cacgatatga aatgacaacg ccccctgttt   1800

tattattatt cttattattt tgggtgcttc tctatccata caagcacctc ctaacatgct   1860

tcataagtga cctcctcatc acaaggcctg aggtctcatt tatccagtgg cgccaagcta   1920

aactaaaact ggtccgagta gactaaggcg aagagagaag gagagaagac agtttttttg   1980

tggccgcctg tgaacaatga aaacgatgag ggtgagatgg agcaaaccat atggtttaaa   2040

cagtcagagg agtacacgct gcttacataa tggcgcaacg accacatgtc ccacagatac   2100

gcatcgattc gattcaaatt aattaaaagg cgttgaaaca gaatgagcca gacagcaagg   2160

acaaggtggc caacagcaag gagtccaaaa agccctctat tgacgagatc cacgatgtta   2220

ttgctcatga ggtttccgag ctcgatgctg ggaagaagaa gtgatttgta tataagaaat   2280

aaatgagata tagtaaagga gtgcaagaga atggcaaggt ggtcaaattc tatattactt   2340

gcagtcactg gttcctcgtt gacatgaatg aagttaccgt tggcatagct gatttaatat   2400

ataactgtcc aactaactct cacctagata taacccatgt gtgtgtttcc aatcatcaat   2460

gcggccgctt actgagcctt ggcaccgggc tgcttctcgg ccattcgagc gaactgggac   2520

aggtatcgga gcaggatgac gagaccttca tggggcagag ggtttcggta ggggaggttg   2580

tgcttctggc acagctgttc cacctggtag gaaacggcag tgaggttgtg tcgaggcagg   2640

gtgggccaga gatggtgctc gatctggtag ttcaggcctc caaagaacca gtcagtaatg   2700

atgcctcgtc gaatgttcat ggtctcatgg atctgaccca cagagaagcc atgtccgtcc   2760

cagacggaat caccgatctt ctccagaggg tagtggttca tgaagaccac gatggcaatt   2820

ccgaagccac cgacgagctc ggaaacaaag aacaccagca tcgaggtcag gatggagggc   2880

ataaagaaga ggtggaacag ggtcttgaga gtccagtgca gagcgagtcc aatggcctct   2940

ttcttgtact gagatcggta gaactggttg tctcggtcct tgagggatcg aacggtcagc   3000

acagactgga aacaccagat gaatcgcagg agaatacaga tgaccaggaa atagtactgt   3060

tggaactgaa tgagctttcg ggagatggga gaagctcgag tgacatcgtc ctcggaccag   3120

gcgagcagag gcaggttatc aatgtcggga tcgtgaccct gaacgttggt agcagaatga   3180

tgggcgttgt gtctgtcctt ccaccaggtc acggagaagc cctggagtcc gttgccaaag   3240

accagaccca ggacgttatt ccagtttcgg ttcttgaagg tctggtggtg gcagatgtca   3300

tgagacagcc atcccatttg ctggtagtgc ataccgagca cgagagcacc aatgaagtac   3360

aggtggtact ggaccagcat gaagaaggca agcacgccaa gacccagggt ggtcaagatc   3420

ttgtacgagt accagagggg agaggcgtca aacatgccag tggcgatcag ctcttctcgg   3480

agctttcgga aatcctcctg agcttcgttg acggcagcct ggggaggcag ctcggaagcc   3540

tggttgatct tgggcattcg cttgagcttg tcgaaggctt cctgagagtg cataaccatg   3600

aaggcgtcag tagcatctcg tccctggtag ttctcaatga tttcagctcc accagggtgg   3660

aagttcaccc aagcggagac gtcgtacacc tttccgtcga tgacgagggg cagagcctgt   3720

cgagaagcct tcaccatggc cattgctgta gatatgtctt gtgtgtaagg gggttggggt   3780

ggttgtttgt gttcttgact tttgtgttag caagggaaga cgggcaaaaa agtgagtgtg   3840

gttgggaggg agagacgagc cttatatata atgcttgttt gtgtttgtgc aagtggacgc   3900

cgaaacgggc aggagccaaa ctaaacaagg cagacaatgc gagcttaatt ggattgcctg   3960

atgggcaggg gttagggctc gatcaatggg ggtgcgaagt gacaaaattg ggaattaggt   4020

tcgcaagcaa ggctgacaag actttggccc aaacatttgt acgcggtgga caacaggagc   4080

cacccatcgt ctgtcacggg ctagccggtc gtgcgtcctg tcaggctcca cctaggctcc   4140

atgccactcc atacaatccc actagtgtac cgctaggccg cttttagctc ccatctaaga   4200

cccccccaaa acctccactg tacagtgcac tgtactgtgt ggcgatcaag ggcaagggaa   4260

aaaaggcgca aacatgcacg catggaatga cgtaggtaag gcgttactag actgaaaagt   4320

ggcacatttc ggcgtgccaa agggtcctag gtgcgtttcg cgagctgggc gccaggccaa   4380

gccgctccaa aacgcctctc cgactccctc cagcggcctc catatcccca tccctctcca   4440

cagcaatgtt gttaagcctt gcaaacgaaa aaatagaaag gctaataagc ttccaatatt   4500

gtggtgtacg ctgcataacg caacaatgag cgccaaacaa cacacacaca cagcacacag   4560

cagcattaac cacgatgttt aaacagtgta cgcagatccc gtcaacagtt ttatatatcg   4620

tagttacaac catcaacact ttttggtaag tgtaccattc tatactccaa ctggtctgca   4680

actgtacaag tagacatgtt aatggtagtt aataacatct acagcagaac ctatggtaaa   4740

gacattgcat ttttacagga agtatcgtcc tacacgttga taaatccaaa gatgcggaac   4800

ttcttccact tttatcatca tcccctactc gtacactcgt actctttgtt cgatcgcgat   4860

tcatttctat aaataatctt gtatgtacat gcggccgctt aagcaacggg cttgataaca   4920

gcgggggggg tgcccacgtt gttgcggttg cggaagaaca gaacaccctt accagcaccc   4980

tcggcaccag cgctgggctc aacccactgg cacatacgcg cactgcggta catggcgcgg   5040

atgaagccac gaggaccatc ctggacatca gcccggtagt gcttgcccat gatgggctta   5100

atggcctcgg tggcctcgtc cgcgttgtag aaggggatgc tgctgacgta gtggtggagg   5160

acatgagtct cgatgatgcc gtggagaagg tggcggccga tgaagcccat ctcacggtca   5220

atggtagcag cggcaccacg gacgaagttc cactcgtcgt tggtgtagtg gggaagggta   5280

gggtcggtgt gctggaggaa ggtgatggca acgagccagt ggttaaccca gaggtaggga   5340

acaaagtacc agatggccat gttgtagaaa ccgaacttct gaacgaggaa gtacagagca   5400

gtggccatca gaccgatacc aatatcgctg aggacgatga gcttagcgtc actgttctcg   5460

tacagagggc tgcggggatc gaagtggtta acaccaccgc cgaggccgtt atgcttgccc   5520

ttgccgcgac cctcacgctg gcgctcgtgg tagttgtggc cggtaacatt ggtgatgagg   5580

tagttgggcc agccaacgag ctgctgaagg acgagcatga gaagagtgaa agcgggggtc   5640

tcctcagtaa gatgagcgag ctcgtgggtc atctttccga gacgagtagc ctgctgctcg   5700

cgggttcggg gaacgaagac catgtcacgc tccatgttgc cagtggcctt gtggtgcttt   5760

cggtgggaga tttgccagct gaagtagggg acaaggaggg aagagtgaag aacccagcca   5820

gtaatgtcgt tgatgatgcg agaatcggag aaagcaccgt gaccgcactc atgggcaata   5880

acccagagac cagtaccgaa aagaccctga agaacggtgt acacggccca cagaccagcg   5940

cgggcggggg tggaggggat atattcgggg gtcacaaagt tgtaccagat gctgaaagtg   6000

gtagtcagga ggacaatgtc gcggaggata taaccgtatc ccttgagagc ggagcgcttg   6060

aagcagtgct tagggatggc attgtagatg tccttgatgg taaagtcggg aacctcgaac   6120

tggttgccgt aggtgtcgag catgacacca tactcggact tgggcttggc gatatcaacc   6180

tcggacatgg acgagagcga tgtggaagag gccgagtggc ggggagagtc tgaaggagag   6240

acggcggcag actcagaatc cgtcacagta gttgaggtga cggtgcgtct aagcgcaggg   6300

ttctgcttgg gcagagccga agtggacgcc atggttgtga attagggtgg tgagaatggt   6360

tggttgtagg gaagaatcaa aggccggtct cgggatccgt gggtatatat atatatatat   6420

atatatacga tccttcgtta cctccctgtt ctcaaaactg tggtttttcg tttttcgttt   6480

tttgcttttt ttgatttttt tagggccaac taagcttcca gatttcgcta atcacctttg   6540

tactaattac aagaaaggaa gaagctgatt agagttgggc tttttatgca actgtgctac   6600

tccttatctc tgatatgaaa gtgtagaccc aatcacatca tgtcatttag agttggtaat   6660

actgggagga tagataaggc acgaaaacga gccatagcag acatgctggg tgtagccaag   6720

cagaagaaag tagatgggag ccaattgacg agcgagggag ctacgccaat ccgacatacg   6780

acacgctgag atcgtcttgg ccggggggta cctacagatg tccaagggta agtgcttgac   6840

tgtaattgta tgtctgagga caaatatgta gtcagccgta taaagtcata ccaggcacca   6900

gtgccatcat cgaaccacta actctctatg atacatgcct ccggtattat tgtaccatgc   6960

gtcgctttgt tacatacgta tcttgccttt ttctctcaga aactccagac tttggctatt   7020

ggtcgagata agcccggacc atagtgagtc tttcacactc tacatttctc ccttgctcca   7080

actatttaaa ttgccccgga gaagacggcc aggccgccta gatgacaaat tcaacaactc   7140

acagctgact ttctgccatt gccactaggg gggggccttt ttatatggcc aagccaagct   7200

ctccacgtcg gttgggctgc acccaacaat aaatgggtag ggttgcacca acaaagggat   7260

gggatggggg gtagaagata cgaggataac ggggctcaat ggcacaaata agaacgaata   7320

ctgccattaa gactcgtgat ccagcgactg acaccattgc atcatctaag ggcctcaaaa   7380

ctacctcgga actgctgcgc tgatctggac accacagagg ttccgagcac tttaggttgc   7440

accaaatgtc ccaccaggtg caggcagaaa acgctggaac agcgtgtaca gtttgtctta   7500

acaaaaagtg agggcgctga ggtcgagcag ggtggtgtga cttgttatag cctttagagc   7560

tgcgaaagcg cgtatggatt tggctcatca ggccagattg agggtctgtg gacacatgtc   7620

atgttagtgt acttcaatcg ccccctggat atagccccga caataggccg tggcctcatt   7680

tttttgcctt ccgcacattt ccattgctcg gtacccacac cttgcttctc ctgcacttgc   7740

caaccttaat actggtttac attgaccaac atcttacaag cggggggctt gtctagggta   7800

tatataaaca gtggctctcc caatcggttg ccagtctctt ttttcctttc tttccccaca   7860

gattcgaaat ctaaactaca catcacagaa ttccgagccg tgagtatcca cgacaagatc   7920

agtgtcgaga cgacgcgttt tgtgtaatga cacaatccga aagtcgctag caacacacac   7980

tctctacaca aactaaccca gctctggtac catggtgaag gcttctcgac aggctctgcc   8040

cctcgtcatc gacggaaagg tgtacgacgt ctccgcttgg gtgaacttcc accctggtgg   8100

agctgaaatc attgagaact accagggacg agatgctact gacgccttca tggttatgca   8160

ctctcaggaa gccttcgaca agctcaagcg aatgcccaag atcaaccagg cttccgagct   8220

gcctccccag gctgccgtca acgaagctca ggaggatttc cgaaagctcc gagaagagct   8280

gatcgccact ggcatgtttg acgcctctcc cctctggtac tcgtacaaga tcttgaccac   8340

cctgggtctt ggcgtgcttg ccttcttcat gctggtccag taccacctgt acttcattgg   8400

tgctctcgtg ctcggtatgc actaccagca aatgggatgg ctgtctcatg acatctgcca   8460

ccaccagacc ttcaagaacc gaaactggaa taacgtcctg ggtctggtct ttggcaacgg   8520

actccagggc ttctccgtga cctggtggaa ggacagacac aacgcccatc attctgctac   8580

caacgttcag ggtcacgatc ccgacattga taacctgcct ctgctcgcct ggtccgagga   8640

cgatgtcact cgagcttctc ccatctcccg aaagctcatt cagttccaac agtactattt   8700

cctggtcatc tgtattctcc tgcgattcat ctggtgtttc cagtctgtgc tgaccgttcg   8760

atccctcaag gaccgagaca accagttcta ccgatctcag tacaagaaag aggccattgg   8820

actcgctctg cactggactc tcaagaccct gttccacctc ttctttatgc cctccatcct   8880

gacctcgatg ctggtgttct ttgtttccga gctcgtcggt ggcttcggaa ttgccatcgt   8940

ggtcttcatg aaccactacc ctctggagaa gatcggtgat tccgtctggg acggacatgg   9000

cttctctgtg ggtcagatcc atgagaccat gaacattcga cgaggcatca ttactgactg   9060

gttctttgga ggcctgaact accagatcga gcaccatctc tggcccaccc tgcctcgaca   9120

caacctcact gccgtttcct accaggtgga acagctgtgc cagaagcaca acctccccta   9180

ccgaaaccct ctgccccatg aaggtctcgt catcctgctc cgatacctgt cccagttcgc   9240

tcgaatggcc gagaagcagc ccggtgccaa ggctcagtaa gcggccgcaa gtgtggatgg   9300

ggaagtgagt gcccggttct gtgtgcacaa ttggcaatcc aagatggatg gattcaacac   9360

agggatatag cgagctacgt ggtggtgcga ggatatagca acggatattt atgtttgaca   9420

cttgagaatg tacgatacaa gcactgtcca agtacaatac taaacatact gtacatactc   9480

atactcgtac ccgggcaacg gtttcacttg agtgcagtgg ctagtgctct tactcgtaca   9540

gtgtgcaata ctgcgtatca tagtctttga tgtatatcgt attcattcat gttagttgcg   9600

tacgggtgaa gcttccactg gtcggcgtgg tagtggggca gagtggggtc ggtgtgctgc   9660

aggtaggtga tggccacgag ccagtggttg acccacaggt aggggatcag gtagtagagg   9720

gtgacggaag ccaggcccca tcggttgatg gagtatgcga tgacggacat ggtgatacca   9780

ataccgacgt tagagatcca gatgttgaac cagtccttct tctcaaacag cggggcgttg   9840

gggttgaagt ggttgacagc ccatttgttg agcttggggt acttctgtcc ggtaacgtaa   9900

gacagcagat acagaggcca tccaaacacc tgctgggtga tgaggccgta gagggtcatg   9960

aggggagcgt cctcagcaag ctcagaccag tcatgggcgc ctcggttctc cataaactcc  10020

tttcggtcct tgggcacaaa caccatatca cgggtgaggt gaccagtgga cttgtggtgc  10080

atggagtggg tcagcttcca ggcgtagtaa gggaccagca tggaggagtg cagaacccat  10140

ccggtgacgt tgttgacggt gttagagtcg gagaaagcag agtggccaca ctcgtgggca  10200

agaacccaca gaccggtgcc aaacagaccc tggacaatgg agtacatggc ccaggccaca  10260

gctcggccgg aagccgaggg aataagaggc aggtacgcgt aggccatgta ggcaaaaacg  10320

gcgataaaga agcaggcgcg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc  10380

ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt  10440

cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca  10500

ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa  10560

aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat  10620

cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc  10680

cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc  10740

gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt  10800

tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac  10860

cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg  10920

ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca  10980

gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt tggtatctgc  11040

gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa  11100

accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa  11160

ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac  11220

tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta  11280

aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt  11340

taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata  11400

gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc  11460

agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac  11520

cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag  11580

tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac  11640

gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc  11700

agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg  11760

gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc  11820

atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct  11880

gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc  11940

tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc  12000

atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc  12060

agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc  12120

gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca  12180

cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt  12240

tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt  12300

ccgcgcacat ttccccgaaa agtgccacct gatgcggtgt gaaataccgc acagatgcgt  12360

aaggagaaaa taccgcatca ggaaattgta agcgttaata ttttgttaaa attcgcgtta  12420

aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat  12480

aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa caagagtcca  12540

ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc  12600

ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg taaagcacta  12660

aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc ggcgaacgtg  12720

gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc aagtgtagcg  12780

gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca gggcgcgtcc  12840

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat  12900

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt  12960

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt gtaatacgac tcactatagg  13020

gcgaattggg cccgacgtcg catgcttgaa tctacaagta ggagggttgg agtgattaag  13080

tgaaacttct ttaacggctc tatgccagtt ctattgatat ccgaaacatc agtatgaagg  13140

tctgataagg gtgacttctt cccacagatt cgtatcagta cgagtacgag accggtactt  13200

gtaacagtat tgatactaaa gggaaactac aacggttgtc agcgtaatgt gacttcgccc  13260

atgaacgcag acacgcagtg ccgagtgcgg tgatatcgcc tactcgttac gtccatggac  13320

tacacaaccc ctcggcttcg cttggcttag cctcgggctc ggtgctgttc agttaaaaca  13380

caatcaaata acatttctac tttttagaag gcaggccgtc aggagcaact ccgactccat  13440

tgacgtttct aaacatctga atgccttcct taccttcaac aaactggcag gttcgggcga  13500

cagtgtaaag agacttgatg aagttggtgt cgtcgtgtcg gtagtgcttg cccatgacct  13560

tcttgatctt ctcagtggcg attcgggcgt tgtagaaggg aattccttta cctgcaggat  13620

aacttcgtat aatgtatgct atacgaagtt atgatctctc tcttgagctt ttccataaca  13680

agttcttctg cctccaggaa gtccatgggt ggtttgatca tggttttggt gtagtggtag  13740

tgcagtggtg gtattgtgac tggggatgta gttgagaata agtcatacac aagtcagctt  13800

tcttcgagcc tcatataagt ataagtagtt caacgtatta gcactgtacc cagcatctcc  13860

gtatcgagaa acacaacaac atgccccatt ggacagatca tgcggataca caggttgtgc  13920

agtatcatac atactcgatc agacaggtcg tctgaccatc atacaagctg aacaagcgct  13980

ccatacttgc acgctctcta tatacacagt taaattacat atccatagtc taacctctaa  14040

cagttaatct tctggtaagc ctcccagcca gccttctggt atcgcttggc ctcctcaata  14100

ggatctcggt tctggccgta cagacctcgg ccgacaatta tgatatccgt tccggtagac  14160

atgacatcct caacagttcg gtactgctgt ccgagagcgt ctcccttgtc gtcaagaccc  14220

accccggggg tcagaataag ccagtcctca gagtcgccct taggtcggtt ctgggcaatg  14280

aagccaacca caaactcggg gtcggatcgg gcaagctcaa tggtctgctt ggagtactcg  14340

ccagtggcca gagagccctt gcaagacagc tcggccagca tgagcagacc tctggccagc  14400

ttctcgttgg gagaggggac taggaactcc ttgtactggg agttctcgta gtcagagacg  14460

tcctccttct tctgttcaga gacagtttcc tcggcaccag ctcgcaggcc agcaatgatt  14520

ccggttccgg gtacaccgtg ggcgttggtg atatcggacc actcggcgat tcggtgacac  14580

cggtactggt gcttgacagt gttgccaata tctgcgaact ttctgtcctc gaacaggaag  14640

aaaccgtgct taagagcaag ttccttgagg gggagcacag tgccggcgta ggtgaagtcg  14700

tcaatgatgt cgatatgggt tttgatcatg cacacataag gtccgacctt atcggcaagc  14760

tcaatgagct ccttggtggt ggtaacatcc agagaagcac acaggttggt tttcttggct  14820

gccacgagct tgagcactcg agcggcaaag gcggacttgt ggacgttagc tcgagcttcg  14880

taggagggca ttttggtggt gaagaggaga ctgaaataaa tttagtctgc agaacttttt  14940

atcggaacct tatctggggc agtgaagtat atgttatggt aatagttacg agttagttga  15000

acttatagat agactggact atacggctat cggtccaaat tagaaagaac gtcaatggct  15060

ctctgggcgt cgcctttgcc gacaaaaatg tgatcatgat gaaagccagc aatgacgttg  15120

cagctgatat tgttgtcggc caaccgcgcc gaaaacgcag ctgtcagacc cacagcctcc  15180

aacgaagaat gtatcgtcaa agtgatccaa gcacactcat agttggagtc gtactccaaa  15240

ggcggcaatg acgagtcaga cagatactcg tcgacgcgat aacttcgtat aatgtatgct  15300

atacgaagtt atcgtacgat agttagtaga caacaat                           15337

<210>38

<211>1272

<212>DNA

<213>人工序列

 

<220>

<223>突变型EgD8MΔ-8去饱和酶(也称为“EgD8S-23”)

 

<220>

<221>CDS

<222>(2)..(1270)

 

<400>38

c atg gtg aag gct tct cga cag gct ctg ccc ctc gtc atc gac gga aag     49

  Met Val Lys Ala Ser Arg Gln Ala Leu Pro Leu Val Ile Asp Gly Lys

  1               5                   10                  15

gtg tac gac gtc tcc gct tgg gtg aac ttc cac cct ggt gga gct gaa       97

Val Tyr Asp Val Ser Ala Trp Val Asn Phe His Pro Gly Gly Ala Glu

              20                  25                  30

atc att gag aac tac cag gga cga gat gct act gac gcc ttc atg gtt      145

Ile Ile Glu Asn Tyr Gln Gly Arg Asp Ala Thr Asp Ala Phe Met Val

        35                  40                  45

atg cac tct cag gaa gcc ttc gac aag ctc aag cga atg ccc aag atc      193

Met His Ser Gln Glu Ala Phe Asp Lys Leu Lys Arg Met Pro Lys Ile

    50                  55                  60

aac cag gct tcc gag ctg cct ccc cag gct gcc gtc aac gaa gct cag      241

Asn Gln Ala Ser Glu Leu Pro Pro Gln Ala Ala Val Asn Glu Ala Gln

65                  70                  75                  80

gag gat ttc cga aag ctc cga gaa gag ctg atc gcc act ggc atg ttt      289

Glu Asp Phe Arg Lys Leu Arg Glu Glu Leu Ile Ala Thr Gly Met Phe

                85                  90                  95

gac gcc tct ccc ctc tgg tac tcg tac aag atc ttg acc acc ctg ggt      337

Asp Ala Ser Pro Leu Trp Tyr Ser Tyr Lys Ile Leu Thr Thr Leu Gly

            100                 105                 110

ctt ggc gtg ctt gcc ttc ttc atg ctg gtc cag tac cac ctg tac ttc      385

Leu Gly Val Leu Ala Phe Phe Met Leu Val Gln Tyr His Leu Tyr Phe

        115                 120                 125

att ggt gct ctc gtg ctc ggt atg cac tac cag caa atg gga tgg ctg      433

Ile Gly Ala Leu Val Leu Gly Met His Tyr Gln Gln Met Gly Trp Leu

    130                 135                 140

tct cat gac atc tgc cac cac cag acc ttc aag aac cga aac tgg aat      481

Ser His Asp Ile Cys His His Gln Thr Phe Lys Asn Arg Asn Trp Asn

145                 150                 155                 160

aac gtc ctg ggt ctg gtc ttt ggc aac gga ctc cag ggc ttc tcc gtg      529

Asn Val Leu Gly Leu Val Phe Gly Asn Gly Leu Gln Gly Phe Ser Val

                165                 170                 175

acc tgg tgg aag gac aga cac aac gcc cat cat tct gct acc aac gtt      577

Thr Trp Trp Lys Asp Arg His Asn Ala His His Ser Ala Thr Asn Val

            180                 185                 190

cag ggt cac gat ccc gac att gat aac ctg cct ctg ctc gcc tgg tcc      625

Gln Gly His Asp Pro Asp Ile Asp Asn Leu Pro Leu Leu Ala Trp Ser

        195                 200                 205

gag gac gat gtc act cga gct tct ccc atc tcc cga aag ctc att cag      673

Glu Asp Asp Val Thr Arg Ala Ser Pro Ile Ser Arg Lys Leu Ile Gln

    210                 215                 220

ttc caa cag tac tat ttc ctg gtc atc tgt att ctc ctg cga ttc atc      721

Phe Gln Gln Tyr Tyr Phe Leu Val Ile Cys Ile Leu Leu Arg Phe Ile

225                 230                 235                 240

tgg tgt ttc cag tct gtg ctg acc gtt cga tcc ctc aag gac cga gac      769

Trp Cys Phe Gln Ser Val Leu Thr Val Arg Ser Leu Lys Asp Arg Asp

                245                 250                 255

aac cag ttc tac cga tct cag tac aag aaa gag gcc att gga ctc gct      817

Asn Gln Phe Tyr Arg Ser Gln Tyr Lys Lys Glu Ala Ile Gly Leu Ala

            260                 265                 270

ctg cac tgg act ctc aag acc ctg ttc cac ctc ttc ttt atg ccc tcc      865

Leu His Trp Thr Leu Lys Thr Leu Phe His Leu Phe Phe Met Pro Ser

        275                 280                 285

atc ctg acc tcg atg ctg gtg ttc ttt gtt tcc gag ctc gtc ggt ggc      913

Ile Leu Thr Ser Met Leu Val Phe Phe Val Ser Glu Leu Val Gly Gly

    290                 295                 300

ttc gga att gcc atc gtg gtc ttc atg aac cac tac cct ctg gag aag      961

Phe Gly Ile Ala Ile Val Val Phe Met Asn His Tyr Pro Leu Glu Lys

305                 310                 315                 320

atc ggt gat tcc gtc tgg gac gga cat ggc ttc tct gtg ggt cag atc     1009

Ile Gly Asp Ser Val Trp Asp Gly His Gly Phe Ser Val Gly Gln Ile

                325                 330                 335

cat gag acc atg aac att cga cga ggc atc att act gac tgg ttc ttt     1057

His Glu Thr Met Asn Ile Arg Arg Gly Ile Ile Thr Asp Trp Phe Phe

            340                 345                 350

gga ggc ctg aac tac cag atc gag cac cat ctc tgg ccc acc ctg cct     1105

Gly Gly Leu Asn Tyr Gln Ile Glu His His Leu Trp Pro Thr Leu Pro

        355                 360                 365

cga cac aac ctc act gcc gtt tcc tac cag gtg gaa cag ctg tgc cag     1153

Arg His Asn Leu Thr Ala Val Ser Tyr Gln Val Glu Gln Leu Cys Gln

    370                 375                 380

aag cac aac ctc ccc tac cga aac cct ctg ccc cat gaa ggt ctc gtc     1201

Lys His Asn Leu Pro Tyr Arg Asn Pro Leu Pro His Glu Gly Leu Val

385                 390                 395                 400

atc ctg ctc cga tac ctg tcc cag ttc gct cga atg gcc gag aag cag     1249

Ile Leu Leu Arg Tyr Leu Ser Gln Phe Ala Arg Met Ala Glu Lys Gln

                405                 410                 415

ccc ggt gcc aag gct cag taa gc                                      1272

Pro Gly Ala Lys Ala Gln

            420

 

<210>39

<211>422

<212>PRT

<213>人工序列

 

<220>

<223>合成构建体

 

<400>39

Met Val Lys Ala Ser Arg Gln Ala Leu Pro Leu Val Ile Asp Gly Lys

1               5                   10                  15

Val Tyr Asp Val Ser Ala Trp Val Asn Phe His Pro Gly Gly Ala Glu

            20                  25                  30

Ile Ile Glu Asn Tyr Gln Gly Arg Asp Ala Thr Asp Ala Phe Met Val

        35                  40                  45

Met His Ser Gln Glu Ala Phe Asp Lys Leu Lys Arg Met Pro Lys Ile

    50                  55                  60

Asn Gln Ala Ser Glu Leu Pro Pro Gln Ala Ala Val Asn Glu Ala Gln

65                  70                  75                  80

Glu Asp Phe Arg Lys Leu Arg Glu Glu Leu Ile Ala Thr Gly Met Phe

                85                  90                  95

Asp Ala Ser Pro Leu Trp Tyr Ser Tyr Lys Ile Leu Thr Thr Leu Gly

            100                 105                 110

Leu Gly Val Leu Ala Phe Phe Met Leu Val Gln Tyr His Leu Tyr Phe

        115                 120                 125

Ile Gly Ala Leu Val Leu Gly Met His Tyr Gln Gln Met Gly Trp Leu

    130                 135                 140

Ser His Asp Ile Cys His His Gln Thr Phe Lys Asn Arg Asn Trp Asn

145                 150                 155                 160

Asn Val Leu Gly Leu Val Phe Gly Asn Gly Leu Gln Gly Phe Ser Val

                165                 170                 175

Thr Trp Trp Lys Asp Arg His Asn Ala His His Ser Ala Thr Asn Val

            180                 185                 190

Gln Gly His Asp Pro Asp Ile Asp Asn Leu Pro Leu Leu Ala Trp Ser

        195                 200                 205

Glu Asp Asp Val Thr Arg Ala Ser Pro Ile Ser Arg Lys Leu Ile Gln

    210                 215                 220

Phe Gln Gln Tyr Tyr Phe Leu Val Ile Cys Ile Leu Leu Arg Phe Ile

225                 230                 235                 240

Trp Cys Phe Gln Ser Val Leu Thr Val Arg Ser Leu Lys Asp Arg Asp

                245                 250                 255

Asn Gln Phe Tyr Arg Ser Gln Tyr Lys Lys Glu Ala Ile Gly Leu Ala

            260                 265                 270

Leu His Trp Thr Leu Lys Thr Leu Phe His Leu Phe Phe Met Pro Ser

        275                 280                 285

Ile Leu Thr Ser Met Leu Val Phe Phe Val Ser Glu Leu Va lGly Gly

    290                 295                 300

Phe Gly Ile Ala Ile Val Val Phe Met Asn His Tyr Pro Leu Glu Lys

305                 310                 315                 320

Ile Gly Asp Ser Val Trp Asp Gly His Gly Phe Ser Val Gly Gln Ile

                325                 330                 335

His Glu Thr Met Asn Ile Arg Arg Gly Ile Ile Thr Asp Trp Phe Phe

            340                 345                 350

Gly Gly Leu Asn Tyr Gln Ile Glu His His Leu Trp Pro Thr Leu Pro

        355                 360                 365

Arg His Asn Leu Thr Ala Val Ser Tyr Gln Val Glu Gln Leu Cys Gln

    370                 375                 380

Lys His Asn Leu Pro Tyr Arg Asn Pro Leu Pro His Glu Gly Leu Val

385                 390                 395                 400

Ile Leu Leu Arg Tyr Leu Ser Gln Phe Ala Arg Met Ala Glu Lys Gln

                405                 410                 415

Pro Gly Ala Lys Ala Gln

            420

 

<210>40

<211>777

<212>DNA

<213>小眼虫

 

<220>

<221>CDS

<222>(1)..(777)

<223>Δ-9延伸酶

 

<300>

<302>Δ-9延伸酶及其在制备多不饱和脂肪酸中的应用

 

<310>WO 2007/061742

<311>2006-11-16

<312>2007-05-31

<313>(1)..(777)

 

<300>

<302>Δ-9延伸酶及其在制备多不饱和脂肪酸中的应用

 

<310>US 2007-0117190-A1

<311>2006-11-16

<312>2007-05-24

<313>(1)..(777)

 

<400>40

atg gag gtg gtg aat gaa ata gtc tca att ggg cag gaa gtt tta ccc       48

Met Glu Val Val Asn Glu Ile Val Ser Ile Gly Gln Glu Val Leu Pro

1               5                   10                  15

aaa gtt gat tat gcc caa ctc tgg agt gat gcc agt cac tgt gag gtg       96

Lys Val Asp Tyr Ala Gln Leu Trp Ser Asp Ala Ser His Cys Glu Val

            20                  25                  30

ctt tac ttg tcc atc gca ttt gtc atc ttg aag ttc act ctt ggc ccc      144

Leu Tyr Leu Ser Ile Ala Phe Val Ile Leu Lys Phe Thr Leu Gly Pro

        35                  40                  45

ctt ggt cca aaa ggt cag tct cgt atg aag ttt gtt ttc acc aat tac      192

Leu Gly Pro Lys Gly Gln Ser Arg Met Lys Phe Val Phe Thr Asn Tyr

    50                  55                  60

aac ctt ctc atg tcc att tat tcg ttg gga tca ttc ctc tca atg gca      240

Asn Leu Leu Met Ser Ile Tyr Ser Leu Gly Ser Phe Leu Ser Met Ala

65                  70                  75                  80

tat gcc atg tac acc atc ggt gtt atg tct gac aac tgc gag aag gct      288

Tyr Ala Met Tyr Thr Ile Gly Val Met Ser Asp Asn Cys Glu Lys Ala

                85                  90                  95

ttt gac aac aac gtc ttc agg atc acc acg cag ttg ttc tat ttg agc      336

Phe Asp Asn Asn Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser

            100                 105                 110

aag ttc ctg gag tat att gac tcc ttc tat ttg cca ctg atg ggc aag      384

Lys Phe Leu Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Gly Lys

        115                 120                 125

cct ctg acc tgg ttg caa ttc ttc cat cat ttg ggg gca ccg atg gat      432

Pro Leu Thr Trp Leu Gln Phe Phe His His Leu Gly Ala Pro Met Asp

    130                 135                 140

atg tgg ctg ttc tat aat tac cga aat gaa gct gtt tgg att ttt gtg      480

Met Trp Leu Phe Tyr Asn Tyr Arg Asn Glu Ala Val Trp Ile Phe Val

145                 150                 155                 160

ctg ttg aat ggt ttc atc cac tgg atc atg tac ggt tat tat tgg acc      528

Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr

                165                 170                 175

aga ttg atc aag ctg aag ttc ccc atg cca aaa tcc ctg att aca tca      576

Arg Leu Ile Lys Leu Lys Phe Pro Met Pro Lys Ser Leu Ile Thr Ser

            180                 185                 190

atg cag atc att caa ttc aat gtt ggt ttc tac att gtc tgg aag tac      624

Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr

        195                 200                 205

agg aac att ccc tgt tat cgc caa gat ggg atg agg atg ttt ggc tgg      672

Arg Asn Ile Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Gly Trp

    210                 215                 220

ttc ttc aat tac ttt tat gtt ggc aca gtc ttg tgt ttg ttc ttg aat      720

Phe Phe Asn Tyr Phe Tyr Val Gly Thr Val Leu Cys Leu Phe Leu Asn

225                 230                 235                 240

ttc tat gtg caa acg tat atc gtc agg aag cac aag gga gcc aaa aag      768

Phe Tyr Val Gln Thr Tyr Ile Val Arg Lys His Lys Gly Ala Lys Lys

                245                 250                 255

att cag tga                                                          777

Ile Gln

 

<210>41

<211>258

<212>PRT

<213>小眼虫

 

<400>41

Met Glu Val Val Asn Glu Ile Val Ser Ile Gly Gln Glu Val Leu Pro

1               5                   10                  15

Lys Val Asp Tyr Ala Gln Leu Trp Ser Asp Ala Ser His Cys Glu Val

            20                  25                  30

Leu Tyr Leu Ser Ile Ala Phe Val Ile Leu Lys Phe Thr Leu Gly Pro

        35                  40                  45

Leu Gly Pro Lys Gly Gln Ser Arg Met Lys Phe Val Phe Thr Asn Tyr

    50                  55                  60

Asn Leu Leu Met Ser Ile Tyr Ser Leu Gly Ser Phe Leu Ser Met Ala

65                  70                  75                  80

Tyr Ala Met Tyr Thr Ile Gly Val Met Ser Asp Asn Cys Glu Lys Ala

                85                  90                  95

Phe Asp Asn Asn Val Phe Arg Ile Thr Thr Gln Leu Phe Tyr Leu Ser

            100                 105                 110

Lys Phe Leu Glu Tyr Ile Asp Ser Phe Tyr Leu Pro Leu Met Gly Lys

        115                 120                 125

Pro Leu Thr Trp Leu Gln Phe Phe His His Leu Gly Ala Pro Met Asp

    130                 135                 140

Met Trp Leu Phe Tyr Asn Tyr Arg Asn Glu Ala Val Trp Ile Phe Val

145                 150                 155                 160

Leu Leu Asn Gly Phe Ile His Trp Ile Met Tyr Gly Tyr Tyr Trp Thr

                165                 170                 175

Arg Leu Ile Lys Leu Lys Phe Pro Met Pro Lys Ser Leu Ile Thr Ser

            180                 185                 190

Met Gln Ile Ile Gln Phe Asn Val Gly Phe Tyr Ile Val Trp Lys Tyr

        195                 200                 205

Arg Asn Ile Pro Cys Tyr Arg Gln Asp Gly Met Arg Met Phe Gly Trp

    210                 215                 220

Phe Phe Asn Tyr Phe Tyr Val Gly Thr Val Leu Cys Leu Phe Leu Asn

225                 230                 235                 240

Phe Tyr Val Gln Thr Tyr Ile Val Arg Lys His Lys Gly Ala Lys Lys

                245                 250                 255

Ile Gln

 

<210>42

<211>13707

<212>DNA

<213>人工序列

 

<220>

<223>质粒pZKSL-555R

 

<400>42

aaacagtgta cgcagatctg cccatgatgg gggctcccac caccagcaat cagggccctg     60

attacacacc cacctgtaat gtcatgctgt tcatcgtggt taatgctgct gtgtgctgtg    120

tgtgtgtgtt gtttggcgct cattgttgcg ttatgcagcg tacaccacaa tattggaagc    180

ttattagcct ttctattttt tcgtttgcaa ggcttaacaa cattgctgtg gagagggatg    240

gggatatgga ggccgctgga gggagtcgga gaggcgtttt ggagcggctt ggcctggcgc    300

ccagctcgcg aaacgcacct aggacccttt ggcacgccga aatgtgccac ttttcagtct    360

agtaacgcct tacctacgtc attccatgcg tgcatgtttg cgcctttttt cccttgccct    420

tgatcgccac acagtacagt gcactgtaca gtggaggttt tgggggggtc ttagatggga    480

gctaaaagcg gcctagcggt acactagtgg gattgtatgg agtggcatgg agcctaggtg    540

gagcctgaca ggacgcacga ccggctagcc cgtgacagac gatgggtggc tcctgttgtc    600

caccgcgtac aaatgtttgg gccaaagtct tgtcagcctt gcttgcgaac ctaattccca    660

attttgtcac ttcgcacccc cattgatcga gccctaaccc ctgcccatca ggcaatccaa    720

ttaagctcgc attgtctgcc ttgtttagtt tggctcctgc ccgtttcggc gtccacttgc    780

acaaacacaa acaagcatta tatataaggc tcgtctctcc ctcccaacca cactcacttt    840

tttgcccgtc ttcccttgct aacacaaaag tcaagaacac aaacaaccac cccaaccccc    900

ttacacacaa gacatatcta cagcaatggc catggctctc tcccttacta ccgagcagct    960

gctcgagcga cccgacctgg ttgccatcga cggcattctc tacgatctgg aaggtcttgc   1020

caaggtccat cccggaggcg acttgatcct cgcttctggt gcctccgatg cttctcctct   1080

gttctactcc atgcaccctt acgtcaagcc cgagaactcg aagctgcttc aacagttcgt   1140

gcgaggcaag cacgaccgaa cctccaagga cattgtctac acctacgact ctccctttgc   1200

acaggacgtc aagcgaacta tgcgagaggt catgaaaggt cggaactggt atgccacacc   1260

tggattctgg ctgcgaaccg ttggcatcat tgctgtcacc gccttttgcg agtggcactg   1320

ggctactacc ggaatggtgc tgtggggtct cttgactgga ttcatgcaca tgcagatcgg   1380

cctgtccatt cagcacgatg cctctcatgg tgccatcagc aaaaagccct gggtcaacgc   1440

tctctttgcc tacggcatcg acgtcattgg atcgtccaga tggatctggc tgcagtctca   1500

catcatgcga catcacacct acaccaatca gcatggtctc gacctggatg ccgagtccgc   1560

agaaccattc cttgtgttcc acaactaccc tgctgccaac actgctcgaa agtggtttca   1620

ccgattccag gcctggtaca tgtacctcgt gcttggagcc tacggcgttt cgctggtgta   1680

caaccctctc tacatcttcc gaatgcagca caacgacacc attcccgagt ctgtcacagc   1740

catgcgagag aacggctttc tgcgacggta ccgaaccctt gcattcgtta tgcgagcttt   1800

cttcatcttt cgaaccgcct tcttgccctg gtatctcact ggaacctccc tgctcatcac   1860

cattcctctg gtgcccactg ctaccggtgc cttcctcacc ttctttttca tcttgtctca   1920

caacttcgat ggctcggagc gaatccccga caagaactgc aaggtcaaga gctccgagaa   1980

ggacgttgaa gccgatcaga tcgactggta cagagctcag gtggagacct cttccaccta   2040

cggtggaccc attgccatgt tctttactgg cggtctcaac ttccagatcg agcatcacct   2100

ctttcctcga atgtcgtctt ggcactatcc cttcgtgcag caagctgtcc gagagtgttg   2160

cgaacgacac ggagttcggt acgtcttcta ccctaccatt gtgggcaaca tcatttccac   2220

cctcaagtac atgcacaaag tcggtgtggt tcactgtgtc aaggacgctc aggattccta   2280

agcggccgca agtgtggatg gggaagtgag tgcccggttc tgtgtgcaca attggcaatc   2340

caagatggat ggattcaaca cagggatata gcgagctacg tggtggtgcg aggatatagc   2400

aacggatatt tatgtttgac acttgagaat gtacgataca agcactgtcc aagtacaata   2460

ctaaacatac tgtacatact catactcgta cccgggcaac ggtttcactt gagtgcagtg   2520

gctagtgctc ttactcgtac agtgtgcaat actgcgtatc atagtctttg atgtatatcg   2580

tattcattca tgttagttgc gtacgctgtg ttgttgtatg tggtgaagct tgacaatgga   2640

tggtgtgtcg tatcaggctg gggaacaatt gtgcttaagt atgctgcagt tgagtaagag   2700

tcatcgctcc accaaaataa agtttgccat tagggttgga gagagagatg gtggctggaa   2760

gaattaaatg acatcaagct gaggattgtg ggtgtgcaat aacacatgtt aggggtgacc   2820

tgtggctcga aatctgataa ttattttgta actttatgat tattcttaga ttttttaata   2880

ttcctctata taacacataa gtagctgtcg tctagttgtt catagcctga ctcctgcaat   2940

agattagtgc agagtgattt tgtgcaattg agagccacgg ttgagtcaag tgactttgtg   3000

tgtgaagtca tcttacgttt caagtctcac aggttactca attggttggt tgtctgccct   3060

ttacagatat ttacagtacc tgagcgtaaa gtcgttcatc cacggaatga ctgttcctgt   3120

cacgcagtca tgatcatgga tgtggctggt caggaaccat tttggatagg agacttaggg   3180

attggactat tattgaaaaa actgagccga atatgatata gttctatttg aatgcagaac   3240

ttctgatggt caattcactt atttcaggca tatcggtcat ggtggcagct gccacgatgt   3300

tatctcgttg gaaacctcgg cgcgccagct gcattaatga atcggccaac gcgcggggag   3360

aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt   3420

cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga   3480

atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg   3540

taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa   3600

aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt   3660

tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct   3720

gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct   3780

cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc   3840

cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt   3900

atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc   3960

tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat   4020

ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa   4080

acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa   4140

aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga   4200

aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct   4260

tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga   4320

cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc   4380

catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg   4440

ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat   4500

aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat   4560

ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg   4620

caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc   4680

attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa   4740

agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc   4800

actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt   4860

ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag   4920

ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt   4980

gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag   5040

atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac   5100

cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc   5160

gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca   5220

gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg   5280

ggttccgcgc acatttcccc gaaaagtgcc acctgatgcg gtgtgaaata ccgcacagat   5340

gcgtaaggag aaaataccgc atcaggaaat tgtaagcgtt aatattttgt taaaattcgc   5400

gttaaatttt tgttaaatca gctcattttt taaccaatag gccgaaatcg gcaaaatccc   5460

ttataaatca aaagaataga ccgagatagg gttgagtgtt gttccagttt ggaacaagag   5520

tccactatta aagaacgtgg actccaacgt caaagggcga aaaaccgtct atcagggcga   5580

tggcccacta cgtgaaccat caccctaatc aagttttttg gggtcgaggt gccgtaaagc   5640

actaaatcgg aaccctaaag ggagcccccg atttagagct tgacggggaa agccggcgaa   5700

cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc gctagggcgc tggcaagtgt   5760

agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt aatgcgccgc tacagggcgc   5820

gtccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg   5880

ctattacgcc agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca   5940

gggttttccc agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta   6000

tagggcgaat tgggcccgac gtcgcatgca ttccatagcc acacctttgc ctatggcttc   6060

acaaccgaag gcaattcgag aggtcgcgct tatggaatcg actcgtataa agctgaaggg   6120

aaagggagac gttccgagcg ctcagatgca atagtcgtcc agctaatgtg gattcaaaaa   6180

caaccccaac agtaatcttg aaaatttgaa cggatcaatc tgaacactct tgctccaggt   6240

cattcttcta acgcacatcc ccagagtcta gagggagttg tgttgtgaac atcctaataa   6300

acaatgcaat ggattcggga tatcttctgt ctcgccccct actcgatgtc gagtaaaccg   6360

atcaccaact aacaatactc ctccgcgttc tgccattgac tctcaaacag acatcgctat   6420

caacggaaca gcatatttta gcttcttagg acaataaata ttgataatgc cggctctccc   6480

tcggtatatt aagcaatcca ttcatacact cattcatcag gttaatttta tatatataat   6540

ttgtctattc aaacaccgta aattactggt accatcatct cctccttttc aaatacacgt   6600

ctatttgcat taatgaaatt actcgccaat tcgcagaacg tgtttgtcga acagagcctt   6660

agctcgggtc cagacaggag cagtgtctcg ctgaggaagc tgcaggagag ttaattaact   6720

cacctgcagg attgagacta tgaatggatt cccgtgcccg tattactcta ctaatttgat   6780

cttggaacgc gaaaatacgt ttctaggact ccaaagaatc tcaactcttg tccttactaa   6840

atatactacc catagttgat ggtttacttg aacagagagg acatgttcac ttgacccaaa   6900

gtttctcgca tctcttggat atttgaacaa cggcgtccac tgaccgtcag ttatccagtc   6960

acaaaacccc cacattcata cattcccatg tacgtttaca aagttctcaa ttccatcgtg   7020

caaatcaaaa tcacatctat tcattcatca tatataaacc catcatgtct actaacactc   7080

acaactccat agaaaacatc gactcagaac acacgctcca tgcggccgct taggaatcct   7140

gtgcgtcctt cacgcagtgg acgacaccca ccttatgcat gtacttcagg gtggagatga   7200

tgttgccgac gatggtaggg tagaaaacat atcgcactcc atgtcgttcg caacactccc   7260

ggaccgcctg ctggacgaag gggtagtgcc aagacgacat ccggggaaag aggtggtgct   7320

cgatctggaa attgagaccg ccagtgaaga acatggcgat ggggccaccg tatgtggagg   7380

acgtctccac ctgcgcccga taccagtcaa tttggtcagc ctcaacgtcc ttctcagatc   7440

gcttaacctt gcagttcttg tcggggatcc gttcggagcc atcaaaattg tgggacaaaa   7500

tgaagaagaa cgtcaagaag gcaccagttg cggtgggcac cagaggaatg gtgatcagca   7560

atgaggtccc agtgaggtac cagggcaaga atgcggtccg gaagatgaag aaagctcgca   7620

tcacgaatgc aagtgtgcgg tagcgccgca gaaagccatt ttcccgcatg gccgtgacag   7680

actctgggat ggtgtcattg tgctgcatcc ggaaaatgta gagcgggttg tacaccagcg   7740

ataccccgta tgcccccagc acaaggtaca tgtaccaagc ctggaagcgg tggaaccact   7800

ttcgggcggt gtttgcggcg gggtagttgt ggaacaccag gaacggctct gccgactccg   7860

catccaggtc gaggccgtgc tggttggtgt aggtgtggtg ccgcatgatg tgcgactgca   7920

gccaaatcca ccgggacgat ccgatgacgt caatgccgta ggcgaagagg gcgttgaccc   7980

aaggcttctt gctgatggcc ccgtgggacg catcatgctg gatggataag ccgatctgca   8040

tgtgcatgaa tccagtcaac aggccccaca gcaccatccc cgtggtagcc cagtgccact   8100

cgcaaaaggc cgtcacggcg atgatcccaa cggtgcgcag ccagaagcca ggggttgcgt   8160

accagttcct ccctttcatc acctcgcgca ttgtccgctt aacgtcttgt gcgaagggag   8220

aatcatacgt gtagacaatg tccttcgagg tgcggtcatg cttccctcgg acgaactgtt   8280

gaagcaattt ggagttctcc ggtttgacgt atggatgcat tgaataaaag agaggggagg   8340

catcagaggc accagaagcg agaatcaaat ctcctcctgg atgaactttg gcaagccctt   8400

caaggtcgta gaggatgcca tcaatcgcaa ccaaatcagg gcgttctaac agctgttctg   8460

tggtaagact gagagccatg gagagctggg ttagtttgtg tagagagtgt gtgttgctag   8520

cgactttcgg attgtgtcat tacacaaaac gcgtcgtctc gacactgatc ttgtcgtgga   8580

tactcacggc tcggacatcg tcgccgacga tgacaccgga ctttcgctta aggacgtcag   8640

taacaggcat tgtgtgatgt gtagtttaga tttcgaatct gtggggaaag aaaggaaaaa   8700

agagactggc aaccgattgg gagagccact gtttatatat accctagaca agccccccgc   8760

ttgtaagatg ttggtcaatg taaaccagta ttaaggttgg caagtgcagg agaagcaagg   8820

tgtgggtacc gagcaatgga aatgtgcgga aggcaaaaaa atgaggccac ggcctattgt   8880

cggggctata tccagggggc gattgaagta cactaacatg acatgtgtcc acagaccctc   8940

aatctggcct gatgagccaa atccatacgc gctttcgcag ctctaaaggc tataacaagt   9000

cacaccaccc tgctcgacct cagcgccctc actttttgtt aagacaaact gtacacgctg   9060

ttccagcgtt ttctgcctgc acctggtggg acatttggtg caacctaaag tgctcggaac   9120

ctctgtggtg tccagatcag cgcagcagtt ccgaggtagt tttgaggccc ttagatgatg   9180

caatggtgtc agtcgctgga tcacgagtct taatggcagt attcgttctt atttgtgcca   9240

ttgagccccg ttatcctcgt atcttctacc ccccatccca tccctttgtt ggtgcaaccc   9300

tacccattta ttgttgggtg cagcccaacc gacgtggaga gcttggcttg gccatataaa   9360

aaggcccccc cctagtggca atggcagaaa gtcagctgtg agttgttgaa tttgtcatct   9420

aggcggcctg gccgtcttct ccggggcaat tggggctgtt ttttgggaca caaatacgcc   9480

gccaacccgg tctctcctga attccgtcgt cgcctgagtc gacatcattt atttaccagt   9540

tggccacaaa cccttgacga tctcgtatgt cccctccgac atactcccgg ccggctgggg   9600

tacgttcgat agcgctatcg gcatcgacaa ggtttgggtc cctagccgat accgcactac   9660

ctgagtcaca atcttcggag gtttagtctt ccacatagca cgggcaaaag tgcgtatata   9720

tacaagagcg tttgccagcc acagattttc actccacaca ccacatcaca catacaacca   9780

cacacatcca caatggaacc cgaaactaag aagaccaaga ctgactccaa gaagattgtt   9840

cttctcggcg gcgacttctg tggccccgag gtgattgccg aggccgtcaa ggtgctcaag   9900

tctgttgctg aggcctccgg caccgagttt gtgtttgagg accgactcat tggaggagct   9960

gccattgaga aggagggcga gcccatcacc gacgctactc tcgacatctg ccgaaaggct  10020

gactctatta tgctcggtgc tgtcggaggc gctgccaaca ccgtatggac cactcccgac  10080

ggacgaaccg acgtgcgacc cgagcagggt ctcctcaagc tgcgaaagga cctgaacctg  10140

tacgccaacc tgcgaccctg ccagctgctg tcgcccaagc tcgccgatct ctcccccatc  10200

cgaaacgttg agggcaccga cttcatcatt gtccgagagc tcgtcggagg tatctacttt  10260

ggagagcgaa aggaggatga cggatctggc gtcgcttccg acaccgagac ctactccgtt  10320

cctgaggttg agcgaattgc ccgaatggcc gccttcctgg cccttcagca caacccccct  10380

cttcccgtgt ggtctcttga caaggccaac gtgctggcct cctctcgact ttggcgaaag  10440

actgtcactc gagtcctcaa ggacgaactc ccccagctcg agctcaacca ccagctgatc  10500

gactcggccg ccatgatcct catcaagcag ccctccaaga tgaatggtat catcatcacc  10560

accaacatgt ttggcgatat catctccgac gaggcctccg tcatccccgg ttctctgggt  10620

ctgctgccct ccgcctctct ggcttctctg cccgacacca acgaggcgtt cggtctgtac  10680

gagccctgtc acggatctgc ccccgatctc ggcaagcaga aggtcaaccc cattgccacc  10740

attctgtctg ccgccatgat gctcaagttc tctcttaaca tgaagcccgc cggtgacgct  10800

gttgaggctg ccgtcaagga gtccgtcgag gctggtatca ctaccgccga tatcggaggc  10860

tcttcctcca cctccgaggt cggagacttg ttgccaacaa ggtcaaggag ctgctcaaga  10920

aggagtaagt cgtttctacg acgcattgat ggaaggagca aactgacgcg cctgcgggtt  10980

ggtctaccgg cagggtccgc tagtgtataa gactctataa aaagggccct gccctgctaa  11040

tgaaatgatg atttataatt taccggtgta gcaaccttga ctagaagaag cagattgggt  11100

gtgtttgtag tggaggacag tggtacgttt tggaaacagt cttcttgaaa gtgtcttgtc  11160

tacagtatat tcactcataa cctcaatagc caagggtgta gtcggtttat taaaggaagg  11220

gagttgtggc tgatgtggat atcgatagtt ggagcaaggg agaaatgtag agtgtgaaag  11280

actcactatg gtccgggctt atctcgacca atagccaaag tctggagttt ctgagagaaa  11340

aaggcaagat acgtatgtaa caaagcgacg catggtacaa taataccgga ggcatgtatc  11400

atagagagtt agtggttcga tgatggcact ggtgcctggt atgactttat acggctgact  11460

acatatttgt cctcagacat acaattacag tcaagcactt acccttggac atctgtaggt  11520

accccccggc caagacgatc tcagcgtgtc gtatgtcgga ttggcgtagc tccctcgctc  11580

gtcaattggc tcccatctac tttcttctgc ttggctacac ccagcatgtc tgctatggct  11640

cgttttcgtg ccttatctat cctcccagta ttaccaactc taaatgacat gatgtgattg  11700

ggtctacact ttcatatcag agataaggag tagcacagtt gcataaaaag cccaactcta  11760

atcagcttct tcctttcttg taattagtac aaaggtgatt agcgaaatct ggaagcttag  11820

ttggccctaa aaaaatcaaa aaaagcaaaa aacgaaaaac gaaaaaccac agttttgaga  11880

acagggaggt aacgaaggat cgtatatata tatatatata tatataccca cggatcccga  11940

gaccggcctt tgattcttcc ctacaaccaa ccattctcac caccctaatt cacaaccatg  12000

gctcccgacg ccgacaagct gcgacagcga aaggctcagt ccatccagga cactgccgat  12060

tctcaggcta ccgagctcaa gattggcacc ctgaagggtc tccaaggcac cgagatcgtc  12120

attgatggcg acatctacga catcaaagac ttcgatcacc ctggaggcga atccatcatg  12180

acctttggtg gcaacgacgt tactgccacc tacaagatga ttcatcccta ccactcgaag  12240

catcacctgg agaagatgaa aaaggtcggt cgagtgcccg actacacctc cgagtacaag  12300

ttcgatactc ccttcgaacg agagatcaaa caggaggtct tcaagattgt gcgaagaggt  12360

cgagagtttg gaacacctgg ctacttcttt cgagccttct gctacatcgg tctcttcttt  12420

tacctgcagt atctctgggt taccactcct accactttcg cccttgctat cttctacggt  12480

gtgtctcagg ccttcattgg cctgaacgtc cagcacgacg ccaaccacgg agctgcctcc  12540

aaaaagccct ggatcaacaa tttgctcggc ctgggtgccg actttatcgg aggctccaag  12600

tggctctgga tgaaccagca ctggacccat cacacttaca ccaaccatca cgagaaggat  12660

cccgacgccc tgggtgcaga gcctatgctg ctcttcaacg actatccctt gggtcacccc  12720

aagcgaaccc tcattcatca cttccaagcc ttctactatc tgtttgtcct tgctggctac  12780

tgggtgtctt cggtgttcaa ccctcagatc ctggacctcc agcaccgagg tgcccaggct  12840

gtcggcatga agatggagaa cgactacatt gccaagtctc gaaagtacgc tatcttcctg  12900

cgactcctgt acatctacac caacattgtg gctcccatcc agaaccaagg cttttcgctc  12960

accgtcgttg ctcacattct tactatgggt gtcgcctcca gcctgaccct cgctactctg  13020

ttcgccctct cccacaactt cgagaacgca gatcgggatc ccacctacga ggctcgaaag  13080

ggaggcgagc ctgtctgttg gttcaagtcg caggtggaaa cctcctctac ttacggtggc  13140

ttcatttccg gttgccttac aggcggactc aactttcagg tcgagcatca cctgtttcct  13200

cgaatgtcct ctgcctggta cccctacatc gctcctaccg ttcgagaggt ctgcaaaaag  13260

cacggcgtca agtacgccta ctatccctgg gtgtggcaga acctcatctc gaccgtcaag  13320

tacctgcatc agtccggaac tggctcgaac tggaagaacg gtgccaatcc ctactctggc  13380

aagctgtaag cggccgcatg tacatacaag attatttatagaaatgaatc gcgatcgaac   13440

aaagagtacg agtgtacgag taggggatga tgataaaagt ggaagaagtt ccgcatcttt  13500

ggatttatca acgtgtagga cgatacttcc tgtaaaaatg caatgtcttt accataggtt  13560

ctgctgtaga tgttattaac taccattaac atgtctactt gtacagttgc agaccagttg  13620

gagtatagaa tggtacactt accaaaaagt gttgatggtt gtaactacga tatataaaac  13680

tgttgacggg atctgcgtac actgttt                                      13707

 

<210>43

<211>1350

<212>DNA

<213>小眼虫

 

<220>

<221>CDS

<222>(1)..(1350)

<223>合成Δ-5去饱和酶(经密码子优化用于解脂耶氏酵母)

 

<400>43

atg gct ctc tcc ctt act acc gag cag ctg ctc gag cga ccc gac ctg       48

Met Ala Leu Ser Leu Thr Thr Glu Gln Leu Leu Glu Arg Pro Asp Leu

1               5                   10                  15

gtt gcc atc gac ggc att ctc tac gat ctg gaa ggt ctt gcc aag gtc       96

Val Ala Ile Asp Gly Ile Leu Tyr Asp Leu Glu Gly Leu Ala Lys Val

            20                  25                  30

cat ccc gga ggc gac ttg atc ctc gct tct ggt gcc tcc gat gct tct      144

His Pro Gly Gly Asp Leu Ile Leu Ala Ser Gly Ala Ser Asp Ala Ser

        35                  40                  45

cct ctg ttc tac tcc atg cac cct tac gtc aag ccc gag aac tcg aag      192

Pro Leu Phc Tyr Ser Met His Pro Tyr Val Lys Pro Glu Asn Ser Lys

    50                  55                  60

ctg ctt caa cag ttc gtg cga ggc aag cac gac cga acc tcc aag gac      240

Leu Leu Gln Gln Phe Val Arg Gly Lys His Asp Arg Thr Ser Lys Asp

65                  70                  75                  80

att gtc tac acc tac gac tct ccc ttt gca cag gac gtc aag cga act      288

Ile Val Tyr Thr Tyr Asp Ser Pro Phe Ala Gln Asp Val Lys Arg Thr

                85                  90                  95

atg cga gag gtc atg aaa ggt cgg aac tgg tat gcc aca cct gga ttc      336

Met Arg Glu Val Met Lys Gly Arg Asn Trp Tyr Ala Thr Pro Gly Phe

            100                 105                 110

tgg ctg cga acc gtt ggc atc att gct gtc acc gcc ttt tgc gag tgg      384

Trp Leu Arg Thr Val Gly Ile Ile Ala Val Thr Ala Phe Cys Glu Trp

        115                 120                 125

cac tgg gct act acc gga atg gtg ctg tgg ggt ctc ttg act gga ttc      432

His Trp Ala Thr Thr Gly Met Val Leu Trp Gly Leu Leu Thr Gly Phe

    130                 135                 140

atg cac atg cag atc ggc ctg tcc att cag cac gat gcc tct cat ggt      480

Met His Met Gln Ile Gly Leu Ser Ile Gln His Asp Ala Ser His Gly

145                 150                 155                 160

gcc atc agc aaa aag ccc tgg gtc aac gct ctc ttt gcc tac ggc atc      528

Ala Ile Ser Lys Lys Pro Trp Val Asn Ala Leu Phe Ala Tyr Gly Ile

                165                 170                 175

gac gtc att gga tcg tcc aga tgg atc tgg ctg cag tct cac atc atg      576

Asp Val Ile Gly Ser Ser Arg Trp Ile Trp Leu Gln Ser His Ile Met

            180                 185                 190

cga cat cac acc tac acc aat cag cat ggt ctc gac ctg gat gcc gag      624

Arg His His Thr Tyr Thr Asn Gln His Gly Leu Asp Leu Asp Ala Glu

        195                 200                 205

tcc gca gaa cca ttc ctt gtg ttc cac aac tac cct gct gcc aac act      672

Sar Ala Glu Pro Phe Leu Val Phe His Asn Tyr Pro Ala Ala Asn Thr

    210                 215                 220

gct cga aag tgg ttt cac cga ttc cag gcc tgg tac atg tac ctc gtg      720

Ala Arg Lys Trp Phe His Arg Phe Gln Ala Trp Tyr Met Tyr Leu Val

225                 230                 235                 240

ctt gga gcc tac ggc gtt tcg ctg gtg tac aac cct ctc tac atc ttc      768

Leu Gly Ala Tyr Gly Val Ser Leu Val Tyr Asn Pro Leu Tyr Ile Phe

                245                 250                 255

cga atg cag cac aac gac acc att ccc gag tct gtc aca gcc atg cga      816

Arg Met Gln His Asn Asp Thr Ile Pro Glu Ser Val Thr Ala Met Arg

            260                 265                 270

gag aac ggc ttt ctg cga cgg tac cga acc ctt gca ttc gtt atg cga      864

Glu Asn Gly Phe Leu Arg Arg Tyr Arg Thr Leu Ala Phe Val Met Arg

        275                 280                 285

gct ttc ttc atc ttt cga acc gcc ttc ttg ccc tgg tat ctc act gga      912

Ala Phe Phe Ile Phe Arg Thr Ala Phe Leu Pro Trp Tyr Leu Thr Gly

    290                 295                 300

acc tcc ctg ctc atc acc att cct ctg gtg ccc act gct acc ggt gcc      960

Thr Ser Leu Leu Ile Thr Ile Pro Leu Val Pro Thr Ala Thr Gly Ala

305                 310                 315                 320

ttc ctc acc ttc ttt ttc atc ttg tct cac aac ttc gat ggc tcg gag     1008

Phe Leu Thr Phe Phe Phe Ile Leu Ser His Asn Phe Asp Gly Ser Glu

                325                 330                 335

cga atc ccc gac aag aac tgc aag gtc aag agc tcc gag aag gac gtt     1056

Arg Ile Pro Asp Lys Asn Cys Lys Val Lys Ser Ser Glu Lys Asp Val

            340                 345                 350

gaa gcc gat cag atc gac tgg tac aga gct cag gtg gag acc tct tcc     1104

Glu Ala Asp Gln Ile Asp Trp Tyr Arg Ala Gln Val Glu Thr Ser Ser

        355                 360                 365

acc tac ggt gga ccc att gcc atg ttc ttt act ggc ggt ctc aac ttc     1152

Thr Tyr Gly Gly Pro Ile Ala Met Phe Phe Thr Gly Gly Leu Asn Phe

    370                 375                 380

cag atc gag cat cac ctc ttt cct cga atg tcg tct tgg cac tat ccc     1200

Gln Ile Glu His His Leu Phe Pro Arg Met Ser Ser Trp His Tyr Pro

385                 390                 395                 400

ttc gtg cag caa gct gtc cga gag tgt tgc gaa cga cac gga gtt cgg     1248

Phe Val Gln Gln Ala Val Arg Glu Cys Cys Glu Arg His Gly Val Arg

                405                 410                 415

tac gtc ttc tac cct acc att gtg ggc aac atc att tcc acc ctc aag     1296

Tyr ValPhe Tyr Pro Thr Ile Val Gly Asn Ile Ile Ser Thr Leu Lys

           420                 425                 430

tac atg cac aaa gtc ggt gtg gtt cac tgt gtc aag gac gct cag gat     1344

Tyr Met His Lys Val Gly Val Val His Cys Val Lys Asp Ala Gln Asp

        435                 440                 445

tcc taa                                                             1350

Ser

 

<210>44

<211>449

<212>PRT

<213>小眼虫

 

<400>44

Met Ala Leu Ser Leu Thr Thr Glu Gln Leu Leu Glu Arg Pro Asp Leu

1               5                   10                  15

Val Ala Ile Asp Gly Ile Leu Tyr Asp Leu Glu Gly Leu Ala Lys Val

            20                  25                  30

His Pro Gly Gly Asp Leu Ile Leu Ala Ser Gly Ala Ser Asp Ala Ser

        35                  40                  45

Pro Leu Phe Tyr Ser Met His Pro Tyr Val Lys Pro Glu Asn Ser Lys

    50                  55                  60

Leu Leu Gln Gln Phe Val Arg Gly Lys His Asp Arg Thr Ser Lys Asp

65                  70                  75                  80

Ile Val Tyr Thr Tyr Asp Ser Pro Phe Ala Gln Asp Val Lys Arg Thr

                85                  90                  95

Met Arg Glu Val Met Lys Gly Arg Asn Trp Tyr Ala Thr Pro Gly Phe

            100                 105                 110

Trp Leu Arg Thr Val Gly Ile Ile Ala Val Thr Ala Phe Cys Glu Trp

        115                 120                 125

His Trp Ala Thr Thr Gly Met Val Leu Trp Gly Leu Leu Thr Gly Phe

    130                 135                 140

Met His Met Gln Ile Gly Leu Ser Ile Gln His Asp Ala Ser His Gly

145                 150                 155                 160

Ala Ile Ser Lys Lys Pro Trp Val Asn Ala Leu Phe Ala Tyr Gly Ile

                165                 170                 175

Asp ValIle Gly Ser Ser Arg Trp Ile Trp Leu Gln Ser His Ile Met

           180                 185                 190

Arg His His Thr Tyr Thr Asn Gln His Gly Leu Asp Leu Asp Ala Glu

        195                 200                 205

Ser Ala Glu Pro Phe Leu Val Phe His Asn Tyr Pro Ala Ala Asn Thr

    210                 215                 220

Ala Arg Lys Trp Phe His Arg Phe Gln Ala Trp Tyr Met Tyr Leu Val

225                 230                 235                 240

Leu Gly Ala Tyr Gly Val Ser Leu Val Tyr Asn Pro Leu Tyr Ile Phe

                245                 250                 255

Arg Met Gln His Asn Asp Thr Ile Pro Glu Ser Val Thr Ala Met Arg

            260                 265                 270

Glu Asn Gly Phe Leu Arg Arg Tyr Arg Thr Leu Ala Phe Val Met Arg

        275                 280                 285

Ala Phe Phe Ile Phe Arg Thr Ala Phe Leu Pro Trp Tyr Leu Thr Gly

    290                 295                 300

Thr Ser Leu Leu Ile Thr Ile Pro Leu Val Pro Thr Ala Thr Gly Ala

305                 310                 315                 320

Phe Leu Thr Phe Phe Phe Ile Leu Ser His Asn Phe Asp Gly Ser Glu

                325                 330                 335

Arg Ile Pro Asp Lys Asn Cys Lys Val Lys Ser Ser Glu Lys Asp Val

            340                 345                 350

Glu Ala Asp Gln Ile Asp Trp Tyr Arg Ala Gln Val Glu Thr Ser Ser

        355                 360                 365

Thr Tyr Gly Gly Pro Ile Ala Met Phe Phe Thr Gly Gly Leu Asn Phe

    370                 375                 380

Gln Ile Glu His His Leu Phe Pro Arg Met Ser Ser Trp His Tyr Pro

385                 390                 395                 400

Phe Val Gln Gln Ala Val Arg Glu Cys Cys Glu Arg His Gly Val Arg

                405                 410                 415

Tyr Val Phe Tyr Pro Thr Ile Val Gly Asn Ile Ile Ser Thr Leu Lys

            420                 425                 430

Tyr Met His Lys Val Gly Val Val His Cys Val Lys Asp Ala Gln Asp

        435                 440                 445

Ser

 

<210>45

<211>1392

<212>DNA

<213>多甲藻属CCMP626

 

<220>

<221>CDS

<222>(1)..(1392)

<223>合成Δ-5去饱和酶(经密码子优化用于解脂耶氏酵母)

 

<400>45

atg gct ccc gac gcc gac aag ctg cga cag cga aag gct cag tcc atc       48

Met Ala Pro Asp Ala Asp Lys Leu Arg Gln Arg Lys Ala Gln Ser Ile

1               5                   10                  15

cag gac act gcc gat tct cag gct acc gag ctc aag att ggc acc ctg       96

Gln Asp Thr Ala Asp Ser Gln Ala Thr Glu Leu Lys Ile Gly Thr Leu

            20                  25                  30

aag ggt ctc caa ggc acc gag atc gtc att gat ggc gac atc tac gac      144

Lys Gly Leu Gln Gly Thr Glu Ile Val Ile Asp Gly Asp Ile Tyr Asp

            35                  40                  45

atc aaa gac ttc gat cac cct gga ggc gaa tcc atc atg acc ttt ggt      192

Ile Lys Asp Phe Asp His Pro Gly Gly Glu Ser Ile Met Thr Phe Gly

    50                  55                  60

ggc aac gac gtt act gcc acc tac aag atg att cat ccc tac cac tcg      240

Gly Asn Asp Val Thr Ala Thr Tyr Lys Met Ile His Pro Tyr His Ser

65                 70                 75                 80

aag cat cac ctg gag aag atg aaa aag gtc ggt cga gtg ccc gac tac      288

Lys His His Leu Glu Lys Met Lys Lys Val Gly Arg Val Pro Asp Tyr

                85                 90                 95

acc tcc gag tac aag ttc gat act ccc ttc gaa cga gag atc aaa cag      336

Thr Ser Glu Tyr Lys Phe Asp Thr Pro Phe Glu Arg Glu Ile Lys Gln

            100                105                110

gag gtc ttc aag att gtg cga aga ggt cga gag ttt gga aca cct ggc      384

Glu Val Phe Lys Ile Val Arg Arg Gly Arg Glu Phe Gly Thr Pro Gly

        115                 120                 125

tac ttc ttt cga gcc ttc tgc tac atc ggt ctc ttc ttt tac ctg cag      432

Tyr Phe Phe Arg Ala Phe Cys Tyr Ile Gly Leu Phe Phe Tyr Leu Gln

    130                 135                 140

tat ctc tgg gtt acc act cct acc act ttc gcc ctt gct atc ttc tac      480

Tyr Leu Trp Val Thr Thr Pro Thr Thr Phe Ala Leu Ala Ile Phe Tyr

145                 150                 155                 160

ggt gtg tct cag gcc ttc att ggc ctg aac gtc cag cac gac gcc aac      528

Gly Val Ser Gln Ala Phe Ile Gly Leu Asn Val Gln His Asp Ala Asn

                165                 170                 175

cac gga gct gcc tcc aaa aag ccc tgg atc aac aat ttg ctc ggc ctg      576

His Gly Ala Ala Ser Lys Lys Pro Trp Ile Asn Asn Leu Leu Gly Leu

            180                 185                 190

ggt gcc gac ttt atc gga ggc tcc aag tgg ctc tgg atg aac cag cac      624

Gly Ala Asp Phe Ile Gly Gly Ser Lys Trp Leu Trp Met Asn Gln His

        195                 200                 205

tgg acc cat cac act tac acc aac cat cac gag aag gat ccc gac gcc      672

Trp Thr His His Thr Tyr Thr Asn His His Glu Lys Asp Pro Asp Ala

    210                 215                 220

ctg ggt gca gag cct atg ctg ctc ttc aac gac tat ccc ttg ggt cac      720

Leu Gly Ala Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Gly His

225                 230                 235                 240

ccc aag cga acc ctc att cat cac ttc caa gcc ttc tac tat ctg ttt      768

Pro Lys Arg Thr Leu Ile His His Phe Gln Ala Phe Tyr Tyr Leu Phe

                245                 250                 255

gtc ctt gct ggc tac tgg gtg tct tcg gtg ttc aac cct cag atc ctg      816

Val Leu Ala Gly Tyr Trp Val Ser Ser Val Phe Asn Pro Gln Ile Leu

            260                 265                 270

gac ctc cag cac cga ggt gcc cag gct gtc ggc atg aag atg gag aac      864

Asp Leu Gln His Arg Gly Ala Gln Ala Val Gly Met Lys Met Glu Asn

        275                 280                 285

gac tac att gcc aag tct cga aag tac gct atc ttc ctg cga ctc ctg      912

Asp Tyr Ile Ala Lys Ser Arg Lys Tyr Ala Ile Phe Leu Arg Leu Leu

    290                 295                 300

tac atc tac acc aac att gtg gct ccc atc cag aac caa ggc ttt tcg      960

Tyr Ile Tyr Thr Asn Ile Val Ala Pro Ile Gln Asn Gln Gly Phe Ser

305                 310                 315                 320

ctc acc gtc gtt gct cac att ctt act atg ggt gtc gcc tcc agc ctg     1008

Leu Thr Val Val Ala His Ile Leu Thr Met Gly Val Ala Ser Ser Leu

                325                 330                 335

acc ctc gct act ctg ttc gcc ctc tcc cac aac ttc gag aac gca gat     1056

Thr Leu Ala Thr Leu Phe Ala Leu Ser His Asn Phe Glu Asn Ala Asp

            340                 345                 350

cgg gat ccc acc tac gag gct cga aag gga ggc gag cct gtc tgt tgg     1104

Arg Asp Pro Thr Tyr Glu Ala Arg Lys Gly Gly Glu Pro Val Cys Trp

        355                 360                 365

ttc aag tcg cag gtg gaa acc tcc tct act tac ggt ggc ttc att tcc     1152

Phe Lys Ser Gln Val Glu Thr Ser Ser Thr Tyr Gly Gly Phe Ile Ser

    370                 375                 380

ggt tgc ctt aca ggc gga ctc aac ttt cag gtc gag cat cac ctg ttt     1200

Gly Cys Leu Thr Gly Gly Leu Asn Phe Gln Val Glu His His Leu Phe

385                 390                 395                 400

cct cga atg tcc tct gcc tgg tac ccc tac atc gct cct acc gtt cga     1248

Pro Arg Met Ser Ser Ala Trp Tyr Pro Tyr Ile Ala Pro Thr Val Arg

                405                 410                 415

gag gtc tgc aaa aag cac ggc gtc aag tac gcc tac tat ccc tgg gtg     1296

Glu Val Cys Lys Lys His Gly Val Lys Tyr Ala Tyr Tyr Pro Trp Val

            420                 425                 430

tgg cag aac ctc atc tcg acc gtc aag tac ctg cat cag tcc gga act     1344

Trp Gln Asn Leu Ile Ser Thr Val Lys Tyr Leu His Gln Ser Gly Thr

        435                 440                 445

ggc tcg aac tgg aag aac ggt gcc aat ccc tac tct ggc aag ctg taa     1392

Gly Ser Asn Trp Lys Asn Gly Ala Asn Pro Tyr Ser Gly Lys Leu

    450                 455                 460

 

<210>46

<211>463

<212>PRT

<213>多甲藻属CCMP626

 

<400>46

Met Ala Pro Asp Ala Asp Lys Leu Arg Gln Arg Lys Ala Gln Ser Ile

1               5                   10                  15

Gln Asp Thr Ala Asp Ser Gln Ala Thr Glu Leu Lys Ile Gly Thr Leu

            20                  25                  30

Lys Gly Leu Gln Gly Thr Glu Ile Val Ile Asp Gly Asp Ile Tyr Asp

        35                  40                  45

Ile Lys Asp Phe Asp His Pro Gly Gly Glu Ser Ile Met Thr Phe Gly

    50                  55                  60

Gly Asn Asp Val Thr Ala Thr Tyr Lys Met Ile His Pro Tyr His Ser

65                  70                  75                  80

Lys His His Leu Glu Lys Met Lys Lys Val Gly Arg Val Pro Asp Tyr

                85                  90                  95

Thr Ser Glu Tyr Lys Phe Asp Thr Pro Phe Glu Arg Glu Ile Lys Gln

            100                 105                 110

Glu Val Phe Lys Ile Val Arg Arg Gly Arg Glu Phe Gly Thr Pro Gly

        115                 120                 125

Tyr Phe Phe Arg Ala Phe Cys Tyr Ile Gly Leu Phe Phe Tyr Leu Gln

    130                 135                 140

Tyr Leu Trp Val Thr Thr Pro Thr Thr Phe Ala Leu Ala Ile Phe Tyr

145                 150                 155                 160

Gly Val Ser Gln Ala Phe Ile Gly Leu Asn Val Gln His Asp Ala Asn

                165                 170                 175

His Gly Ala Ala Ser Lys Lys Pro Trp Ile Asn Asn Leu Leu Gly Leu

            180                 185                 190

Gly Ala Asp Phe Ile Gly Gly Ser Lys Trp Leu Trp Met Asn Gln His

        195                 200                 205

Trp Thr His His Thr Tyr Thr Asn His His Glu Lys Asp Pro Asp Ala

    210                 215                 220

Leu Gly Ala Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Gly His

225                 230                 235                 240

Pro Lys Arg Thr Leu Ile His His Phe Gln Ala Phe Tyr Tyr Leu Phe

                245                 250                 255

Val Leu Ala Gly Tyr Trp Val Ser Ser Val Phe Asn Pro Gln Ile Leu

            260                 265                 270

Asp Leu Gln His Arg Gly Ala Gln Ala Val Gly Met Lys Met Glu Asn

        275                 280                 285

Asp Tyr Ile Ala Lys Ser Arg Lys Tyr Ala Ile Phe Leu Arg Leu Leu

    290                 295                 300

Tyr Ile Tyr Thr Asn Ile Val Ala Pro Ile Gln Asn Gln Gly Phe Ser

305                 310                 315                 320

Leu Thr Val Val Ala His Ile Leu Thr Met Gly ValAla Ser Ser Leu

                325                 330                 335

Thr Leu Ala Thr Leu Phe Ala Leu Ser His Asn Phe Glu Asn Ala Asp

            340                 345                 350

Arg Asp Pro Thr Tyr Glu Ala Arg Lys Gly Gly Glu Pro ValCys Trp

        355                 360                 365

Phe Lys Ser Gln Val Glu Thr Ser Ser Thr Tyr Gly Gly Phe Ile Ser

    370                 375                 380

Gly Cys Leu Thr Gly Gly Leu Asn Phe Gln ValGlu His His Leu Phe

385                 390                 395                 400

Pro Arg Met Ser Ser Ala Trp Tyr Pro Tyr Ile Ala Pro Thr Val Arg

                405                 410                 415

Glu ValCys Lys Lys His Gly ValLys Tyr Ala Tyr Tyr Pro Trp Val

           420                 425                 430

Trp Gln Asn Leu Ile Ser Thr Val Lys Tyr Leu His Gln Ser Gly Thr

        435                 440                 445

Gly Ser Asn Trp Lys Asn Gly Ala Asn Pro Tyr Ser Gly Lys Leu

    450                 455                 460

 

<210>47

<211>1350

<212>DNA

<213>小眼虫

<220>

<221>CDS

<222>(1)..(1350)

<223>Δ-5去饱和酶

 

<400>47

atg gct ctc agt ctt acc aca gaa cag ctg tta gaa cgc cct gat ttg       48

Met Ala Leu Ser Leu Thr Thr Glu Gln Leu Leu Glu Arg Pro Asp Leu

1               5                   10                  15

gtt gcg att gat ggc atc ctc tac gac ctt gaa ggg ctt gcc aaa gtt       96

Val Ala Ile Asp Gly Ile Leu Tyr Asp Leu Glu Gly Leu Ala Lys Val

            20                  25                  30

cat cca gga gga gat ttg att ctc gct tct ggt gcc tct gat gcc tcc      144

His Pro Gly Gly Asp Leu Ile Leu Ala Ser Gly Ala Ser Asp Ala Ser

        35                  40                  45

cct ctc ttt tat tca atg cat cca tac gtc aaa ccg gag aat tcc aaa      192

Pro Leu Phe Tyr Ser Met His Pro Tyr Val Lys Pro Glu Asn Ser Lys

    50                  55                  60

ttg ctt caa cag ttc gtc cga ggg aag cat gac cgc acc tcg aag gac      240

Leu Leu Gln Gln Phe Val Arg Gly Lys His Asp Arg Thr Ser Lys Asp

65                  70                  75                  80

att gtc tac acg tat gat tct ccc ttc gca caa gac gtt aag cgg aca      288

Ile Val Tyr Thr Tyr Asp Ser Pro Phe Ala Gln Asp Val Lys Arg Thr

                85                  90                  95

atg cgc gag gtg atg aaa ggg agg aac tgg tac gca acc cct ggc ttc      336

Met Arg Glu Val Met Lys Gly Arg Asn Trp Tyr Ala Thr Pro Gly Phe

            100                 105                 110

tgg ctg cgc acc gtt ggg atc atc gcc gtg acg gcc ttt tgc gag tgg      384

Trp Leu Arg Thr Val Gly Ile Ile Ala Val Thr Ala Phe Cys Glu Trp

        115                 120                 125

cac tgg gct acc acg ggg atg gtg ctg tgg ggc ctg ttg act gga ttc      432

His Trp Ala Thr Thr Gly Met Val Leu Trp Gly Leu Leu Thr Gly Phe

    130                 135                 140

atg cac atg cag atc ggc tta tcc atc cag cat gat gcg tcc cac ggg      480

Met His Met Gln Ile Gly Leu Ser Ile Gln His Asp Ala Ser His Gly

145                 150                 155                 160

gcc atc agc aag aag cct tgg gtc aac gcc ctc ttc gcc tac ggc att      528

Ala Ile Ser Lys Lys Pro Trp Val Asn Ala Leu Phe Ala Tyr Gly Ile

                165                 170                 175

gac gtc atc gga tcg tcc cgg tgg att tgg ctg cag tcg cac atc atg      576

Asp Val Ile Gly Ser Ser Arg Trp Ile Trp Leu Gln Ser His Ile Met

           180                 185                 190

cgg cac cac acc tac acc aac cag cac ggc ctc gac ctg gat gcg gag      624

Arg His His Thr Tyr Thr Asn Gln His Gly Leu Asp Leu Asp Ala Glu

        195                 200                 205

tcg gca gag ccg ttc ctg gtg ttc cac aac tac ccc gcc gca aac acc      672

Ser Ala Glu Pro Phe Leu Val Phe His Asn Tyr Pro Ala Ala Asn Thr

    210                 215                 220

gcc cga aag tgg ttc cac cgc ttc caa gct tgg tac atg tac ctt gtg      720

Ala Arg Lys Trp Phe His Arg Phe Gln Ala Trp Tyr Met Tyr Leu Val

225                 230                 235                 240

ctg ggg gca tac ggg gta tcg ctg gtg tac aac ccg ctc tac att ttc      768

Leu Gly Ala Tyr Gly Val Ser Leu Val Tyr Asn Pro Leu Tyr Ile Phe

                245                 250                 255

cgg atg cag cac aat gac acc atc cca gag tct gtc acg gcc atg cgg      816

Arg Met Gln His Asn Asp Thr Ile Pro Glu Ser Val Thr Ala Met Arg

            260                 265                 270

gag aat ggc ttt ctg cgg cgc tac cgc aca ctt gca ttc gtg atg cga      864

Glu Asn Gly Phe Leu Arg Arg Tyr Arg Thr Leu Ala Phe Val Met Arg

        275                 280                 285

gct ttc ttc atc ttc cgg acc gca ttc ttg ccc tgg tac ctc act ggg      912

Ala Phe Phe Ile Phe Arg Thr Ala Phe Leu Pro Trp Tyr Leu Thr Gly

    290                 295                 300

acc tca ttg ctg atc acc att cct ctg gtg ccc act gca act ggt gcc      960

Thr Ser Leu Leu Ile Thr Ile Pro Leu Val Pro Thr Ala Thr Gly Ala

305                 310                 315                 320

ttc ttg acg ttc ttc ttc att ttg tcc cac aat ttt gat ggc tcc gaa     1008

Phe Leu Thr Phe Phe Phe Ile Leu Ser His Asn Phe Asp Gly Ser Glu

                325                 330                 335

cgg atc ccc gac aag aac tgc aag gtt aag agc tct gag aag gac gtt     1056

Arg Ile Pro Asp Lys Asn Cys Lys Val Lys Ser Ser Glu Lys Asp Val

            340                 345                 350

gag gct gac caa att gac tgg tat cgg gcg cag gtg gag acg tcc tcc     1104

Glu Ala Asp Gln Ile Asp Trp Tyr Arg Ala Gln Val Glu Thr Ser Ser

        355                 360                 365

aca tac ggt ggc ccc atc gcc atg ttc ttc act ggc ggt ctc aat ttc     1152

Thr Tyr Gly Gly Pro Ile Ala Met Phe Phe Thr Gly Gly Leu Asn Phe

    370                 375                 380

cag atc gag cac cac ctc ttt ccc cgg atg tcg tct tgg cac tac ccc     1200

Gln Ile Glu His His Leu Phe Pro Arg Met Ser Ser Trp His Tyr Pro

385                 390                 395                 400

ttc gtc cag cag gcg gtc cgg gag tgt tgc gaa cgc cat gga gtg cga     1248

Phe Val Gln Gln Ala Val Arg Glu Cys Cys Glu Arg His Gly Val Arg

                405                 410                 415

tat gtt ttc tac cct acc atc gtc ggc aac atc atc tcc acc ctg aag     1296

Tyr Val Phe Tyr Pro Thr Ile Val Gly Asn Ile Ile Ser Thr Leu Lys

            420                 425                 430

tac atg cat aag gtg ggt gtc gtc cac tgc gtg aag gac gca cag gat     1344

Tyr Met His Lys Val Gly Val Val His Cys Val Lys Asp Ala Gln Asp

        435                 440                 445

tcc tga                                                             1350

Ser

 

<210>48

<211>449

<212>PRT

<213>小眼虫

 

<400>48

Met Ala Leu Ser Leu Thr Thr Glu Gln Leu Leu Glu Arg Pro Asp Leu

1               5                   10                  15

Val Ala Ile Asp Gly Ile Leu Tyr Asp Leu Glu Gly Leu Ala Lys Val

            20                  25                  30

His Pro Gly Gly Asp Leu Ile Leu Ala Ser Gly Ala Ser Asp Ala Ser

        35                  40                  45

Pro Leu Phe Tyr Ser Met His Pro Tyr Val Lys Pro Glu Asn Ser Lys

    50                  55                  60

Leu Leu Gln Gln Phe Val Arg Gly Lys His Asp Arg Thr Ser Lys Asp

65                  70                  75                  80

Ile Val Tyr Thr Tyr Asp Ser Pro Phe Ala Gln Asp Val Lys Arg Thr

                85                  90                  95

Met Arg Glu Val Met Lys Gly Arg Asn Trp Tyr Ala Thr Pro Gly Phe

            100                 105                 110

Trp Leu Arg Thr Val Gly Ile Ile Ala Val Thr Ala Phe Cys Glu Trp

        115                 120                 125

His Trp Ala Thr Thr Gly Met Val Leu Trp Gly Leu Leu Thr Gly Phe

    130                 135                 140

Met His Met Gln Ile Gly Leu Ser Ile Gln His Asp Ala Ser His Gly

145                 150                 155                 160

Ala Ile Ser Lys Lys Pro Trp Val Asn Ala Leu Phe Ala Tyr Gly Ile

                165                 170                 175

Asp Val Ile Gly Ser Ser Arg Trp Ile Trp Leu Gln Ser His Ile Met

            180                 185                 190

Arg His His Thr Tyr Thr Asn Gln His Gly Leu Asp Leu Asp Ala Glu

        195                 200                 205

Ser Ala Glu Pro Phe Leu Val Phe His Asn Tyr Pro Ala Ala Asn Thr

    210                 215                 220

Ala Arg Lys Trp Phe His Arg Phe Gln Ala Trp Tyr Met Tyr Leu Val

225                 230                 235                 240

Leu Gly Ala Tyr Gly Val Ser Leu Val Tyr Asn Pro Leu Tyr Ile Phe

                245                 250                 255

Arg Met Gln His Asn Asp Thr Ile Pro Glu Ser Val Thr Ala Met Arg

            260                 265                 270

Glu Asn Gly Phe Leu Arg Arg Tyr Arg Thr Leu Ala Phe Val Met Arg

        275                 280                 285

Ala Phe Phe Ile Phe Arg Thr Ala Phe Leu Pro Trp Tyr Leu Thr Gly

    290                 295                 300

Thr Ser Leu Leu Ile Thr Ile Pro Leu Val Pro Thr Ala Thr Gly Ala

305                 310                 315                 320

Phe Leu Thr Phe Phe Phe Ile Leu Ser His Asn Phe Asp Gly Ser Glu

                325                 330                 335

Arg Ile Pro Asp Lys Asn Cys Lys Val Lys Ser Ser Glu Lys Asp Val

            340                 345                 350

Glu Ala Asp Gln Ile Asp Trp Tyr Arg Ala Gln Val Glu Thr Ser Ser

        355                 360                 365

Thr Tyr Gly Gly Pro Ile Ala Met Phe Phe Thr Gly Gly Leu Asn Phe

    370                 375                 380

Gln Ile Glu His His Leu Phe Pro Arg Met Ser Ser Trp His Tyr Pro

385                 390                 395                 400

Phe Val Gln Gln Ala Val Arg Glu Cys Cys Glu Arg His Gly Val Arg

                405                 410                 415

Tyr Val Phe Tyr Pro Thr Ile Val Gly Asn Ile Ile Ser Thr Leu Lys

            420                 425                 430

Tyr Met His Lys Val Gly Val Val His Cys Val Lys Asp Ala Gln Asp

        435                 440                 445

Ser

 

<210>49

<211>13066

<212>DNA

<213>人工序列

 

<220>

<223>质粒pZP3-Pa777U

 

<400>49

tctcggtcta ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa     60

atgagctgat ttaacaaaaa tttaacgcga attttaacaa aatattaacg cttacaattt    120

cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tcaggtggca    180

cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata cattcaaata    240

tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga    300

gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca ttttgccttc    360

ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat cagttgggtg    420

cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag agttttcgcc    480

ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc gcggtattat    540

cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct cagaatgact    600

tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca gtaagagaat    660

tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt ctgacaacga    720

tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat gtaactcgcc    780

ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt gacaccacga    840

tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta cttactctag    900

cttcccggca acaattaata gactggatgg aggcggataa agttgcagga ccacttctgc    960

gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt gagcgtgggt   1020

ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc gtagttatct   1080

acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct gagataggtg   1140

cctcactgat taagcattgg taactgtcag accaagttta ctcatatata ctttagattg   1200

atttaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt gataatctca   1260

tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga   1320

tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa   1380

aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga   1440

aggtaactgg cttcagcaga gcgcagatac caaatactgt tcttctagtg tagccgtagt   1500

taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt   1560

taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat   1620

agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct   1680

tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga gaaagcgcca   1740

cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag   1800

agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc   1860

gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga   1920

aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct tttgctcaca   1980

tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc tttgagtgag   2040

ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg   2100

aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat taatgcagct   2160

ggcgcgccac caatcacaat tctgaaaagc acatcttgat ctcctcattg cggggagtcc   2220

aacggtggtc ttattccccc gaatttcccg ctcaatctcg ttccagaccg acccggacac   2280

agtgcttaac gccgttccga aactctaccg cagatatgct ccaacggact gggctgcata   2340

gatgtgatcc tcggcttgga gaaatggata aaagccggcc aaaaaaaaag cggaaaaaag   2400

cggaaaaaaa gagaaaaaaa atcgcaaaat ttgaaaaata gggggaaaag acgcaaaaac   2460

gcaaggaggg gggagtatat gacactgata agcaagctca caacggttcc tcttattttt   2520

ttcctcatct tctgcctagg ttcccaaaat cccagatgct tctctccagt gccaaaagta   2580

agtaccccac aggttttcgg ccgaaaattc cacgtgcagc aacgtcgtgt ggggtgttaa   2640

aatgtggggg gggggaacca ggacaagagg ctcttgtggg agccgaatga gagcacaaag   2700

cgggcgggtg tgataagggc atttttgccc attttccctt ctcctgtctc tccgacggtg   2760

atggcgttgt gcgtcctcta tttcttttta tttctttttg ttttatttct ctgactaccg   2820

atttggtttg atttcctcaa ccccacacaa ataagctcgg gccgaggaat atatatatac   2880

acggacacag tcgccctgtg gacaacacgt cactacctct acgatacaca ccgtacgttg   2940

tgtggaagct tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg   3000

ccaagctcga aattaaccct cactaaaggg aacaaaagct ggagctccac cgcggacaca   3060

atatctggtc aaatttcagt ttcgttacat ttaaattcct tcacttcaag ttcattcttc   3120

atctgcttct gttttacttt gacaggcaaa tgaagacatg gtacgacttg atggaggcca   3180

agaacgccat ttcaccccga gacaccgaag tgcctgaaat cctggctgcc cccattgata   3240

acatcggaaa ctacggtatt ccggaaagtg tatatagaac ctttccccag cttgtgtctg   3300

tggatatgga tggtgtaatc ccctttgagt actcgtcttg gcttctctcc gagcagtatg   3360

aggctctcta atctagcgca tttaatatct caatgtattt atatatttat cttctcatgc   3420

ggccgcttag ttggctttgg tcttggcagc cttggcctcc ttgagggtaa acatcttggc   3480

atccttgtcg accacgccgt acttggcgta cataagacca attcggatga aggtgggaat   3540

gatgggagaa gccgactttc gcaccagttc gggaaaggcc tgagcgaagg cagcagtggc   3600

ctcgttgagc ttgtagtgag gaatgatggg aaacagatgg tggatctgat gtgtaccaat   3660

gttgtgggac aggttgtcga tgagggctcc gtagcttcgg tccacagagg acaagttgcc   3720

cttgacatag gtccactccg aatcggcgta ccagggagtt tcctcgtcgt tgtgatggag   3780

gaaggtagtg acaaccagca tggtggcgaa tccaaagaga ggtgcgaagt aatacagagc   3840

catggtcttg aggccgtaga cgtaggtaag gtaggcgtac agaccagcaa aggccacgag   3900

agagccgagg gaaatgatga cggcagacat tcttcgcagg tagagaggct cccagggatt   3960

gaagtggttg acctttcggg gaggaaatcc agcaacgagg taggcaaacc aagccgaacc   4020

aagggagatg accatgtgtc gggacagggg atgagagtcg gcttctcgct gagggtagaa   4080

gatctcatcc ttgtcgatgt tgccggtgtt cttgtgatgg tgtcgatggc tgatcttcca   4140

cgactcgtag ggagtcagaa tgatggagtg aatgagtgtg ccaacagaga agttgagcag   4200

gtgggatcgc gagaaggcac catgtccaca gtcgtgaccg atggtaaaga atccccagaa   4260

cacgataccc tggagcagaa tgtagccagt gcaaaggacg gcatcgagca gtgcaaactc   4320

ctgcacgata gcaagggctc gagcatagta cagtccgaga gcaagggaac cggcaatgcc   4380

cagagctcgc acggtatagt agagggacca gggaacagag gcttcgaagc agtgggcagg   4440

cagggatcgc ttgatctcgg tgagagtagg gaactcgtag ggagcggcaa cggtagagga   4500

agccatggtt gtgaattagg gtggtgagaa tggttggttg tagggaagaa tcaaaggccg   4560

gtctcgggat ccgtgggtat atatatatat atatatatat acgatccttc gttacctccc   4620

tgttctcaaa actgtggttt ttcgtttttc gttttttgct ttttttgatt tttttagggc   4680

caactaagct tccagatttc gctaatcacc tttgtactaa ttacaagaaa ggaagaagct   4740

gattagagtt gggcttttta tgcaactgtg ctactcctta tctctgatat gaaagtgtag   4800

acccaatcac atcatgtcat ttagagttgg taatactggg aggatagata aggcacgaaa   4860

acgagccata gcagacatgc tgggtgtagc caagcagaag aaagtagatg ggagccaatt   4920

gacgagcgag ggagctacgc caatccgaca tacgacacgc tgagatcgtc ttggccgggg   4980

ggtacctaca gatgtccaag ggtaagtgct tgactgtaat tgtatgtctg aggacaaata   5040

tgtagtcagc cgtataaagt cataccaggc accagtgcca tcatcgaacc actaactctc   5100

tatgatacat gcctccggta ttattgtacc atgcgtcgct ttgttacata cgtatcttgc   5160

ctttttctct cagaaactcc agactttggc tattggtcga gataagcccg gaccatagtg   5220

agtctttcac actctacatt tctcccttgc tccaactatc gattgttgtc tactaactat   5280

cgtacgataa cttcgtatag catacattat acgaagttat cgcgtcgacg agtatctgtc   5340

tgactcgtca ttgccgcctt tggagtacga ctccaactat gagtgtgctt ggatcacttt   5400

gacgatacat tcttcgttgg aggctgtggg tctgacagct gcgttttcgg cgcggttggc   5460

cgacaacaat atcagctgca acgtcattgc tggctttcat catgatcaca tttttgtcgg   5520

caaaggcgac gcccagagag ccattgacgt tctttctaat ttggaccgat agccgtatag   5580

tccagtctat ctataagttc aactaactcg taactattac cataacatat acttcactgc   5640

cccagataag gttccgataa aaagttctgc agactaaatt tatttcagtc tcctcttcac   5700

caccaaaatg ccctcctacg aagctcgagc taacgtccac aagtccgcct ttgccgctcg   5760

agtgctcaag ctcgtggcag ccaagaaaac caacctgtgt gcttctctgg atgttaccac   5820

caccaaggag ctcattgagc ttgccgataa ggtcggacct tatgtgtgca tgatcaaaac   5880

ccatatcgac atcattgacg acttcaccta cgccggcact gtgctccccc tcaaggaact   5940

tgctcttaag cacggtttct tcctgttcga ggacagaaag ttcgcagata ttggcaacac   6000

tgtcaagcac cagtaccggt gtcaccgaat cgccgagtgg tccgatatca ccaacgccca   6060

cggtgtaccc ggaaccggaa tcattgctgg cctgcgagct ggtgccgagg aaactgtctc   6120

tgaacagaag aaggaggacg tctctgacta cgagaactcc cagtacaagg agttcctagt   6180

cccctctccc aacgagaagc tggccagagg tctgctcatg ctggccgagc tgtcttgcaa   6240

gggctctctg gccactggcg agtactccaa gcagaccatt gagcttgccc gatccgaccc   6300

cgagtttgtg gttggcttca ttgcccagaa ccgacctaag ggcgactctg aggactggct   6360

tattctgacc cccggggtgg gtcttgacga caagggagac gctctcggac agcagtaccg   6420

aactgttgag gatgtcatgt ctaccggaac ggatatcata attgtcggcc gaggtctgta   6480

cggccagaac cgagatccta ttgaggaggc caagcgatac cagaaggctg gctgggaggc   6540

ttaccagaag attaactgtt agaggttaga ctatggatat gtaatttaac tgtgtatata   6600

gagagcgtgc aagtatggag cgcttgttca gcttgtatga tggtcagacg acctgtctga   6660

tcgagtatgt atgatactgc acaacctgtg tatccgcatg atctgtccaa tggggcatgt   6720

tgttgtgttt ctcgatacgg agatgctggg tacagtgcta atacgttgaa ctacttatac   6780

ttatatgagg ctcgaagaaa gctgacttgt gtatgactta ttctcaacta catccccagt   6840

cacaatacca ccactgcact accactacac caaaaccatg atcaaaccac ccatggactt   6900

cctggaggca gaagaacttg ttatggaaaa gctcaagaga gagatcataa cttcgtatag   6960

catacattat acgaagttat cctgcaggta aaggaattca tgctgttcat cgtggttaat   7020

gctgctgtgt gctgtgtgtg tgtgttgttt ggcgctcatt gttgcgttat gcagcgtaca   7080

ccacaatatt ggaagcttat tagcctttct attttttcgt ttgcaaggct taacaacatt   7140

gctgtggaga gggatgggga tatggaggcc gctggaggga gtcggagagg cgttttggag   7200

cggcttggcc tggcgcccag ctcgcgaaac gcacctagga ccctttggca cgccgaaatg   7260

tgccactttt cagtctagta acgccttacc tacgtcattc catgcgtgca tgtttgcgcc   7320

ttttttccct tgcccttgat cgccacacag tacagtgcac tgtacagtgg aggttttggg   7380

ggggtcttag atgggagcta aaagcggcct agcggtacac tagtgggatt gtatggagtg   7440

gcatggagcc taggtggagc ctgacaggac gcacgaccgg ctagcccgtg acagacgatg   7500

ggtggctcct gttgtccacc gcgtacaaat gtttgggcca aagtcttgtc agccttgctt   7560

gcgaacctaa ttcccaattt tgtcacttcg cacccccatt gatcgagccc taacccctgc   7620

ccatcaggca atccaattaa gctcgcattg tctgccttgt ttagtttggc tcctgcccgt   7680

ttcggcgtcc acttgcacaa acacaaacaa gcattatata taaggctcgt ctctccctcc   7740

caaccacact cacttttttg cccgtcttcc cttgctaaca caaaagtcaa gaacacaaac   7800

aaccacccca acccccttac acacaagaca tatctacagc aatggccatg gcttcttcca   7860

ctgttgctgc gccgtacgag ttcccgacgc tgacggagat caagcgctcg ctgccagcgc   7920

actgctttga ggcctcggtc ccgtggtcgc tctactacac cgtgcgcgcg ctgggcatcg   7980

ccggctcgct cgcgctcggc ctctactacg cgcgcgcgct cgcgatcgtg caggagtttg   8040

ccctgctgga tgcggtgctc tgcacggggt acattctgct gcagggcatc gtattctggg   8100

ggttcttcac catcggccat gactgcggcc acggcgcgtt ctcgcgttcg cacctgctca   8160

acttcagcgt cggcacgctc attcactcga tcatcctcac gccgtacgag tcatggaaga   8220

tctcgcaccg ccaccaccac aagaacacgg gcaacatcga caaggacgag attttctacc   8280

cgcagcgcga ggccgactcg cacccactgt cccgacacat ggtgatctcg ctcggctcgg   8340

cctggttcgc gtacctcgtt gcgggcttcc ctcctcgcaa ggtgaaccac ttcaaccctt   8400

gggaaccgtt gtacctgcgc cgcatgtctg ccgtcatcat ctcactcggc tcgctcgtgg   8460

cgttcgcggg cttgtatgcg tatctcacct acgtctatgg ccttaagacc atggcgctgt   8520

actacttcgc ccctctcttt gggttcgcca cgatgctcgt ggtcactacc tttttgcacc   8580

acaatgacga ggaaacgcca tggtacgccg actcggagtg gacgtacgtc aagggcaacc   8640

tctcgtccgt ggaccgctcg tacggcgcgc tcatcgacaa cctgagccac aacatcggca   8700

cgcaccagat ccaccacctg tttccgatca tcccgcacta caagctgaac gaggcgacgg   8760

cagcgttcgc gcaggcgttc ccggagctcg tgcgcaagag cgcgtcgccg atcatcccga   8820

cgttcatccg catcgggctc atgtacgcca agtacggcgt cgtggacaag gacgccaaga   8880

tgtttacgct caaggaggcc aaggccgcca agaccaaggc caactaggcg gccgcattga   8940

tgattggaaa cacacacatg ggttatatct aggtgagagt tagttggaca gttatatatt   9000

aaatcagcta tgccaacggt aacttcattc atgtcaacga ggaaccagtg actgcaagta   9060

atatagaatt tgaccacctt gccattctct tgcactcctt tactatatct catttatttc   9120

ttatatacaa atcacttctt cttcccagca tcgagctcgg aaacctcatg agcaataaca   9180

tcgtggatct cgtcaataga gggctttttg gactccttgc tgttggccac cttgtccttg   9240

ctgtttaaac agtgtacgca gatctactat agaggaacat ttaaattgcc ccggagaaga   9300

cggccaggcc gcctagatga caaattcaac aactcacagc tgactttctg ccattgccac   9360

tagggggggg cctttttata tggccaagcc aagctctcca cgtcggttgg gctgcaccca   9420

acaataaatg ggtagggttg caccaacaaa gggatgggat ggggggtaga agatacgagg   9480

ataacggggc tcaatggcac aaataagaac gaatactgcc attaagactc gtgatccagc   9540

gactgacacc attgcatcat ctaagggcct caaaactacc tcggaactgc tgcgctgatc   9600

tggacaccac agaggttccg agcactttag gttgcaccaa atgtcccacc aggtgcaggc   9660

agaaaacgct ggaacagcgt gtacagtttg tcttaacaaa aagtgagggc gctgaggtcg   9720

agcagggtgg tgtgacttgt tatagccttt agagctgcga aagcgcgtat ggatttggct   9780

catcaggcca gattgagggt ctgtggacac atgtcatgtt agtgtacttc aatcgccccc   9840

tggatatagc cccgacaata ggccgtggcc tcattttttt gccttccgca catttccatt   9900

gctcggtacc cacaccttgc ttctcctgca cttgccaacc ttaatactgg tttacattga   9960

ccaacatctt acaagcgggg ggcttgtcta gggtatatat aaacagtggc tctcccaatc  10020

ggttgccagt ctcttttttc ctttctttcc ccacagattc gaaatctaaa ctacacatca  10080

cagaattccg agccgtgagt atccacgaca agatcagtgt cgagacgacg cgttttgtgt  10140

aatgacacaa tccgaaagtc gctagcaaca cacactctct acacaaacta acccagctct  10200

ggtaccatgg cttcttccac tgttgctgcg ccgtacgagt tcccgacgct gacggagatc  10260

aagcgctcgc tgccagcgca ctgctttgag gcctcggtcc cgtggtcgct ctactacacc  10320

gtgcgcgcgc tgggcatcgc cggctcgctc gcgctcggcc tctactacgc gcgcgcgctc  10380

gcgatcgtgc aggagtttgc cctgctggat gcggtgctct gcacggggta cattctgctg  10440

cagggcatcg tattctgggg gttcttcacc atcggccatg actgcggcca cggcgcgttc  10500

tcgcgttcgc acctgctcaa cttcagcgtc ggcacgctca ttcactcgat catcctcacg  10560

ccgtacgagt catggaagat ctcgcaccgc caccaccaca agaacacggg caacatcgac  10620

aaggacgaga ttttctaccc gcagcgcgag gccgactcgc acccactgtc ccgacacatg  10680

gtgatctcgc tcggctcggc ctggttcgcg tacctcgttg cgggcttccc tcctcgcaag  10740

gtgaaccact tcaacccttg ggaaccgttg tacctgcgcc gcatgtctgc cgtcatcatc  10800

tcactcggct cgctcgtggc gttcgcgggc ttgtatgcgt atctcaccta cgtctatggc  10860

cttaagacca tggcgctgta ctacttcgcc cctctctttg ggttcgccac gatgctcgtg  10920

gtcactacct ttttgcacca caatgacgag gaaacgccat ggtacgccga ctcggagtgg  10980

acgtacgtca agggcaacct ctcgtccgtg gaccgctcgt acggcgcgct catcgacaac  11040

ctgagccaca acatcggcac gcaccagatc caccacctgt ttccgatcat cccgcactac  11100

aagctgaacg aggcgacggc agcgttcgcg caggcgttcc cggagctcgt gcgcaagagc  11160

gcgtcgccga tcatcccgac gttcatccgc atcgggctca tgtacgccaa gtacggcgtc  11220

gtggacaagg acgccaagat gtttacgctc aaggaggcca aggccgccaa gaccaaggcc  11280

aactaggcgg ccgcatggag cgtgtgttct gagtcgatgt tttctatgga gttgtgagtg  11340

ttagtagaca tgatgggttt atatatgatg aatgaataga tgtgattttg atttgcacga  11400

tggaattgag aactttgtaa acgtacatgg gaatgtatga atgtgggggt tttgtgactg  11460

gataactgac ggtcagtgga cgccgttgtt caaatatcca agagatgcga gaaactttgg  11520

gtcaagtgaa catgtcctct ctgttcaagt aaaccatcaa ctatgggtag tatatttagt  11580

aaggacaaga gttgagattc tttggagtcc tagaaacgta ttttcgcgtt ccaagatcaa  11640

attagtagag taatacgggc acgggaatcc attcatagtc tcaatcctgc aggtgagtta  11700

attaagatga cgacatttgc gagctggacg aggaatagat ggagcgtgtg ttctgagtcg  11760

atgttttcta tggagttgtg agtgttagta gacatgatgg gtttatatat gatgaatgaa  11820

tagatgtgat tttgatttgc acgatggaat tgagaacttt gtaaacgtac atgggaatgt  11880

atgaatgtgg gggttttgtg actggataac tgacggtcag tggacgccgt tgttcaaata  11940

tccaagagat gcgagaaact ttgggtcaag tgaacatgtc ctctctgttc aagtaaacca  12000

tcaactatgg gtagtatatt tagtaaggac aagagttgag attctttgga gtcctagaaa  12060

cgtattttcg cgttccaaga tcaaattagt agagtaatac gggcacggga atccattcat  12120

agtctcaatt ttcccatagg tgtgctacaa ggtgttgaga tgtggtacag taccaccatg  12180

attcgaggta aagagcccag aagtcattga tgaggtcaag aaatacacag atctacagct  12240

caatacaatg aatatcttct ttcatattct tcaggtgaca ccaagggtgt ctattttccc  12300

cagaaatgcg tgaaaaggcg cgtgtgtagc gtggagtatg ggttcggttg gcgtatcctt  12360

catatatcga cgaaatagta gggcaagaga tgacaaaaag tatctatatg tagacagcgt  12420

agaatatgga tttgattggt ataaattcat ttattgcgtg tctcacaaat actctcgata  12480

agttggggtt aaactggaga tggaacaatg tcgatatctc gacgcatgcg acgtcgggcc  12540

caattcgccc tatagtgagt cgtattacaa ttcactggcc gtcgttttac aacgtcgtga  12600

ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag  12660

ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa  12720

tggcgaatgg acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc  12780

agcgtgaccg ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc  12840

tttctcgcca cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg  12900

ttccgattta gtgctttacg gcacctcgac cccaaaaaac ttgattaggg tgatggttca  12960

cgtagtgggc catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc  13020

tttaatagtg gactcttgtt ccaaactgga acaacactca acccta                 13066

 

<210>50

<211>1080

<212>DNA

<213>瓜果腐霉菌

<220>

<221>CDS

<222>(1)..(1080)

<223>合成Δ-17去饱和酶(经密码子优化用于解脂耶氏酵母)

 

<400>50

atg gct tcc tct acc gtt gcc gct ccc tac gag ttc cct act ctc acc       48

Met Ala Ser Ser Thr Val Ala Ala Pro Tyr Glu Phe Pro Thr Leu Thr

1               5                   10                  15

gag arc aag cga tcc ctg cct gcc cac tgc ttc gaa gcc tct gtt ccc       96

Glu Ile Lys Arg Ser Leu Pro Ala His Cys Phe Glu Ala Ser Val Pro

            20                  25                  30

tgg tcc ctc tac tat acc gtg cga gct ctg ggc att gcc ggt tcc ctt      144

Trp Ser Leu Tyr Tyr Thr Val Arg Ala Leu Gly Ile Ala Gly Ser Leu

        35                  40                  45

gct ctc gga ctg tac tat gct cga gcc ctt gct atc gtg cag gag ttt      192

Ala Leu Gly Leu Tyr Tyr Ala Arg Ala Leu Ala Ile Val Gln Glu Phe

    50                  55                  60

gca ctg ctc gat gcc gtc ctt tgc act ggc tac att ctg ctc cag ggt      240

Ala Leu Leu Asp Ala Val Leu Cys Thr Gly Tyr Ile Leu Leu Gln Gly

65                  70                  75                  80

atc gtg ttc tgg gga ttc ttt acc atc ggt cac gac tgt gga cat ggt      288

Ile Val Phe Trp Gly Phe Phe Thr Ile Gly His Asp Cys Gly His Gly

                85                  90                  95

gcc ttc tcg cga tcc cac ctg ctc aac ttc tct gtt ggc aca ctc att      336

Ala Phe Ser Arg Ser His Leu Leu Asn Phe Ser Val Gly Thr Leu Ile

            100                 105                 110

cac tcc atc att ctg act ccc tac gag tcg tgg aag atc agc cat cga      384

His Ser Ile Ile Leu Thr Pro Tyr Glu Ser Trp Lys Ile Ser His Arg

        115                 120                 125

cac cat cac aag aac acc ggc aac atc gac aag gat gag atc ttc tac      432

His His His Lys Asn Thr Gly Asn Ile Asp Lys Asp Glu Ile Phe Tyr

    130                 135                 140

cct cag cga gaa gcc gac tct cat ccc ctg tcc cga cac atg gtc atc      480

Pro Gln Arg Glu Ala Asp Ser His Pro Leu Ser Arg His Met Val Ile

145                 150                 155                 160

tcc ctt ggt tcg gct tgg ttt gcc tac ctc gtt gct gga ttt cct ccc      528

Ser Leu Gly Ser Ala Trp Phe Ala Tyr Leu Val Ala Gly Phe Pro Pro

                165                 170                 175

cga aag gtc aac cac ttc aat ccc tgg gag cct ctc tac ctg cga aga      576

Arg Lys Val Asn His Phe Asn Pro Trp Glu Pro Leu Tyr Leu Arg Arg

            180                 185                 190

atg tct gcc gtc atc att tcc ctc ggc tct ctc gtg gcc ttt gct ggt      624

Met Ser Ala Val Ile Ile Ser Leu Gly Ser Leu Val Ala Phe Ala Gly

        195                 200                 205

ctg tac gcc tac ctt acc tac gtc tac ggc ctc aag acc atg gct ctg      672

Leu Tyr Ala Tyr Leu Thr Tyr Val Tyr Gly Leu Lys Thr Met Ala Leu

    210                 215                 220

tat tac ttc gca cct ctc ttt gga ttc gcc acc atg ctg gtt gtc act      720

Tyr Tyr Phe Ala Pro Leu Phe Gly Phe Ala Thr Met Leu Val Val Thr

225                 230                 235                 240

acc ttc ctc cat cac aac gac gag gaa act ccc tgg tac gcc gat tcg      768

Thr Phe Leu His His Asn Asp Glu Glu Thr Pro Trp Tyr Ala Asp Ser

                245                 250                 255

gag tgg acc tat gtc aag ggc aac ttg tcc tct gtg gac cga agc tac      816

Glu Trp Thr Tyr Val Lys Gly Asn Leu Ser Ser Val Asp Arg Ser Tyr

            260                 265                 270

gga gcc ctc atc gac aac ctg tcc cac aac att ggt aca cat cag atc      864

Gly Ala Leu Ile Asp Asn Leu Ser His Asn Ile Gly Thr His Gln Ile

        275                 280                 285

cac cat ctg ttt ccc atc att cct cac tac aag ctc aac gag gcc act      912

His His Leu Phe Pro Ile Ile Pro His Tyr Lys Leu Asn Glu Ala Thr

    290                 295                 300

gct gcc ttc gct cag gcc ttt ccc gaa ctg gtg cga aag tcg gct tct      960

Ala Ala Phe Ala Gln Ala Phe Pro Glu Leu Val Arg Lys Ser Ala Ser

305                 310                 315                 320

ccc atc att ccc acc ttc atc cga att ggt ctt atg tac gcc aag tac     1008

Pro Ile Ile Pro Thr Phe Ile Arg Ile Gly Leu Met Tyr Ala Lys Tyr

                325                 330                 335

ggc gtg gtc gac aag gat gcc aag atg ttt acc ctc aag gaggcc aag      1056

Gly ValVal Asp Lys Asp Ala Lys Met Phe Thr Leu Lys Glu Ala Lys

           340                 345                 350

gct gcc aag acc aaa gcc aac taa                                     1080

Ala Ala Lys Thr Lys Ala Asn

        355

 

<210>51

<211>359

<212>PRT

<213>瓜果腐霉菌

 

<400>51

Met Ala Ser Ser Thr Val Ala Ala Pro Tyr Glu Phe Pro Thr Leu Thr

1               5                   10                  15

Glu Ile Lys Arg Ser Leu Pro Ala His Cys Phe Glu Ala Ser Val Pro

            20                  25                  30

Trp Ser Leu Tyr Tyr Thr Val Arg Ala Leu Gly Ile Ala Gly Ser Leu

        35                  40                  45

Ala Leu Gly Leu Tyr Tyr Ala Arg Ala Leu Ala Ile Val Gln Glu Phe

    50                  55                  60

Ala Leu Leu Asp Ala Val Leu Cys Thr Gly Tyr Ile Leu Leu Gln Gly

65                  70                  75                  80

Ile Val Phe Trp Gly Phe Phe Thr Ile Gly His Asp Cys Gly His Gly

                85                  90                  95

Ala Phe Ser Arg Ser His Leu Leu Asn Phe Ser Val Gly Thr Leu Ile

            100                 105                 110

His Ser Ile Ile Leu Thr Pro Tyr Glu Ser Trp Lys Ile Ser His Arg

        115                 120                 125

His His His Lys Asn Thr Gly Asn Ile Asp Lys Asp Glu Ile Phe Tyr

    130                 135                 140

Pro Gln Arg Glu Ala Asp Ser His Pro Leu Ser Arg His Met Val Ile

145                 150                 155                 160

Ser Leu Gly Ser Ala Trp Phe Ala Tyr Leu Val Ala Gly Phe Pro Pro

                165                 170                 175

Arg Lys Val Asn His Phe Asn Pro Trp Glu Pro Leu Tyr Leu Arg Arg

            180                 185                 190

Met Ser Ala Val Ile Ile Ser Leu Gly Ser Leu Val Ala Phe Ala Gly

        195                 200                 205

Leu Tyr Ala Tyr Leu Thr Tyr Val Tyr Gly Leu Lys Thr Met Ala Leu

    210                 215                 220

Tyr Tyr Phe Ala Pro Leu Phe Gly Phe Ala Thr Met Leu Val Val Thr

225                 230                 235                 240

Thr Phe Leu His His Asn Asp Glu Glu Thr Pro Trp Tyr Ala Asp Ser

                245                 250                 255

Glu Trp Thr Tyr Val Lys Gly Asn Leu Ser Ser Val Asp Arg Ser Tyr

            260                 265                 270

Gly Ala Leu Ile Asp Asn Leu Ser His Asn Ile Gly Thr His Gln Ile

        275                 280                 285

His His Leu Phe Pro Ile Ile Pro His Tyr Lys Leu Asn Glu Ala Thr

    290                 295                 300

Ala Ala Phe Ala Gln Ala Phe Pro Glu Leu Val Arg Lys Ser Ala Ser

305                 310                 315                 320

Pro Ile Ile Pro Thr Phe Ile Arg Ile Gly Leu Met Tyr Ala Lys Tyr

                325                 330                 335

Gly Val Val Asp Lys Asp Ala Lys Met Phe Thr Leu Lys Glu Ala Lys

            340                 345                 350

Ala Ala Lys Thr Lys Ala Asn

        355

 

<210>52

<211>1080

<212>DNA

<213>瓜果腐霉菌

 

<220>

<221>CDS

<222>(1)..(1080)

<223>Δ-17去饱和酶

 

<400>52

atg gct tct tcc act gtt gct gcg ccg tac gag ttc ccg acg ctg acg       48

Met Ala Ser Ser Thr Val Ala Ala Pro Tyr Glu Phe Pro Thr Leu Thr

1               5                   10                  15

gag atc aag cgc tcg ctg cca gcg cac tgc ttt gag gcc tcg gtc ccg       96

Glu Ile Lys Arg Ser Leu Pro Ala His Cys Phe Glu Ala Ser Val Pro

            20                  25                  30

tgg tcg ctc tac tac acc gtg cgc gcg ctg ggc atc gcc ggc tcg ctc      144

Trp Ser Leu Tyr Tyr Thr Val Arg Ala Leu Gly Ile Ala Gly Ser Leu

        35                  40                  45

gcg ctc ggc ctc tac tac gcg cgc gcg ctc gcg atc gtg cag gag ttt      192

Ala Leu Gly Leu Tyr Tyr Ala Arg Ala Leu Ala Ile Val Gln Glu Phe

    50                  55                  60

gcc ctg ctg gat gcg gtg ctc tgc acg ggg tac att ctg ctg cag ggc      240

Ala Leu Leu Asp Ala Val Leu Cys Thr Gly Tyr Ile Leu Leu Gln Gly

65                  70                  75                  80

atc gta ttc tgg ggg ttc ttc acc atc ggc cat gac tgc ggc cac ggc      288

Ile Val Phe Trp Gly Phe Phe Thr Ile Gly His Asp Cys Gly His Gly

                85                  90                  95

gcg ttc tcg cgt tcg cac ctg ctc aac ttc agc gtc ggc acg ctc att      336

Ala Phe Ser Arg Ser His Leu Leu Asn Phe Ser ValGly Thr Leu Ile

            100                 105                110

cac tcg atc atc ctc acg ccg tac gag tca tgg aag atc tcg cac cgc      384

His Ser Ile Ile Leu Thr Pro Tyr Glu Ser Trp Lys Ile Ser His Arg

        115                 120                 125

cac cac cac aag aac acg ggc aac atc gac aag gac gag att ttc tac      432

His His His Lys Asn Thr Gly Asn Ile Asp Lys Asp Glu Ile Phe Tyr

    130                 135                 140

ccg cag cgc gag gcc gac tcg cac cca ctg tcc cga cac atg gtg atc      480

Pro Gln Arg Glu Ala Asp Ser His Pro Leu Ser Arg His Met Val Ile

145                 150                 155                 160

tcg ctc ggc tcg gcc tgg ttc gcg tac ctc gtt gcg ggc ttc cct cct      528

Ser Leu Gly Ser Ala Trp Phe Ala Tyr Leu Val Ala Gly Phe Pro Pro

                165                 170                 175

cgc aag gtg aac cacttc aac cct tgg gaa ccg ttg tac ctg cgc cgc      576

Arg Lys Val Asn His Phe Asn Pro Trp Glu Pro Leu Tyr Leu Arg Arg

            180                 185                 190

atg tct gcc gtc a tc atctca ctc ggc tcg ctc gtg gcg ttc gcg ggc       624

Met Ser Ala Val Ile Ile Ser Leu Gly Ser Leu Val Ala Phe Ala Gly

        195                 200                 205

ttg tat gcg tat ctc acc tac gtc tat ggc ctt aag acc atg gcg ctg      672

Leu Tyr Ala Tyr Leu Thr Tyr Val Tyr Gly Leu Lys Thr Met Ala Leu

    210                 215                 220

tac tac ttc gcc cct ctc ttt ggg ttc gcc acg atg ctc gtg gtc act       720

Tyr Tyr Phe Ala Pro Leu Phe Gly Phe Ala Thr Met Leu Val Val Thr

225                 230                 235                 240

acc ttt ttg cac cac aat gac gag gaa acg cca tgg tac gcc gac tcg      768

Thr Phe Leu His His Asn Asp Glu Glu Thr Pro Trp Tyr Ala Asp Ser

                245                 250                 255

gag tgg acg tac gtc aag ggc aac ctc tcg tcc gtg gac cgc tcg tac      816

Glu Trp Thr Tyr Val Lys Gly Asn Leu Ser Ser Val Asp Arg Ser Tyr

            260                 265                 270

ggc gcg ctc atc gac aac ctg agc cac aac atc ggc acg cac cag atc      864

Gly Ala Leu Ile Asp Asn Leu Ser His Asn Ile Gly Thr His Gln Ile

        275                 280                 285

cac cac ctg ttt ccg atc atc ccg cac tac aag ctg aac gag gcg acg      912

His His Leu Phe Pro Ile Ile Pro His Tyr Lys Leu Asn Glu Ala Thr

    290                 295                 300

gca gcg ttc gcg cag gcg ttc ccg gag ctc gtg cgc aag agc gcg tcg      960

Ala Ala Phe Ala Gln Ala Phe Pro Glu Leu Val Arg Lys Ser Ala Ser

305                 310                 315                 320

ccg atc atc ccg acg ttc atc cgc atc ggg ctc atg tac gcc aag tac     1008

Pro Ile Ile Pro Thr Phe Ile Arg Ile Gly Leu Met Tyr Ala Lys Tyr

                325                 330                 335

ggc gtc gtg gac aag gac gcc aag atg ttt acg ctc aag gag gcc aag     1056

Gly Val Val Asp Lys Asp Ala Lys Met Phe Thr Leu Lys Glu Ala Lys

            340                 345                 350

gcc gcc aag acc aag gcc aac tag                                         1080

Ala Ala Lys Thr Lys Ala Asn

        355

 

<210>53

<211>359

<212>PRT

<213>瓜果腐霉菌

 

<400>53

Met Ala Ser Ser Thr Val Ala Ala Pro Tyr Glu Phe Pro Thr Leu Thr

1               5                   10                  15

Glu Ile Lys Arg Ser Leu Pro Ala His Cys Phe Glu Ala Ser Val Pro

            20                  25                  30

Trp Ser Leu Tyr Tyr Thr Val Arg Ala Leu Gly Ile Ala Gly Ser Leu

        35                  40                  45

Ala Leu Gly Leu Tyr Tyr Ala Arg Ala Leu Ala Ile Val Gln Glu Phe

    50                  55                  60

Ala Leu Leu Asp Ala Val Leu Cys Thr Gly Tyr Ile Leu Leu Gln Gly

65                  70                  75                  80

Ile Val Phe Trp Gly Phe Phe Thr Ile Gly His Asp Cys Gly His Gly

                85                  90                  95

Ala Phe Ser Arg Ser His Leu Leu Asn Phe Ser Val Gly Thr Leu Ile

            100                 105                 110

His Ser Ile Ile Leu Thr Pro Tyr Glu Ser Trp Lys Ile Ser His Arg

        115                 120                 125

His His His Lys Asn Thr Gly Asn Ile Asp Lys Asp Gln Ile Phe Tyr

    130                 135                 140

Pro Gln Arg Glu Ala Asp Ser His Pro Leu Ser Arg His Met Val Ile

145                 150                 155                 160

Ser Leu Gly Ser Ala Trp Phe Ala Tyr Leu Val Ala Gly Phe Pro Pro

                165                 170                 175

Arg Lys Val Asn His Phe Asn Pro Trp Glu Pro Leu Tyr Leu Arg Arg

            180                 185                 190

Met Ser Ala Val Ile Ile Ser Leu Gly Ser Leu Val Ala Phe Ala Gly

        195                 200                 205

Leu Tyr Ala Tyr Leu Thr Tyr Val Tyr Gly Leu Lys Thr Met Ala Leu

    210                 215                 220

Tyr Tyr Phe Ala Pro Leu Phe Gly Phe Ala Thr Met Leu Val Val Thr

225                 230                 235                 240

Thr Phe Leu His His Asn Asp Glu Glu Thr Pro Trp Tyr Ala Asp Ser

                245                 250                 255

Glu Trp Thr Tyr Val Lys Gly Asn Leu Ser Ser Val Asp Arg Ser Tyr

            260                 265                 270

Gly Ala Leu Ile Asp Asn Leu Ser His Asn Ile Gly Thr His Gln Ile

        275                 280                 285

His His Leu Phe Pro Ile Ile Pro His Tyr Lys Leu Asn Glu Ala Thr

    290                 295                 300

Ala Ala Phe Ala Gln Ala Phe Pro Glu Leu Val Arg Lys Ser Ala Ser

305                 310                 315                 320

Pro Ile Ile Pro Thr Phe Ile Arg Ile Gly Leu Met Tyr Ala Lys Tyr

                325                 330                 335

Gly Val Val Asp Lys Asp Ala Lys Met Phe Thr Leu Lys Glu Ala Lys

            340                 345                 350

Ala Ala Lys Thr Lys Ala Asn

        355

 

<210>54

<211>9570

<212>DNA

<213>人工序列

 

<220>

<223>质粒pY117

 

<400>54

ggccgccacc gcggcccgag attccggcct cttcggccgc caagcgaccc gggtggacgt     60

ctagaggtac ctagcaatta acagatagtt tgccggtgat aattctctta acctcccaca    120

ctcctttgac ataacgattt atgtaacgaa actgaaattt gaccagatat tgtgtccgcg    180

gtggagctcc agcttttgtt ccctttagtg agggtttaaa cgagcttggc gtaatcatgg    240

tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa ttccacacaa cgtacgagcc    300

ggaagcataa agtgtaaagc ctggggtgcc taatgagtga gctaactcac attaattgcg    360

ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaatgaatc    420

ggccaacgcg cggggagagg cggtttgcgt attgggcgct cttccgcttc ctcgctcact    480

gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta    540

atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag    600

caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc    660

cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta    720

taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg    780

ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc    840

tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac    900

gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac    960

ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg   1020

aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga   1080

aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt   1140

agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag   1200

cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct   1260

gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgagatt atcaaaaagg   1320

atcttcacct agatcctttt aaattaaaaa tgaagtttta aatcaatcta aagtatatat   1380

gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc   1440

tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac tacgatacgg   1500

gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg ctcaccggct   1560

ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag tggtcctgca   1620

actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt aagtagttcg   1680

ccagttaata gtttgcgcaa cgttgttgcc attgctacag gcatcgtggt gtcacgctcg   1740

tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt tacatgatcc   1800

cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag   1860

ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct tactgtcatg   1920

ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt ctgagaatag   1980

tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac gggataatac cgcgccacat   2040

agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa actctcaagg   2100

atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa ctgatcttca   2160

gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca aaatgccgca   2220

aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct ttttcaatat   2280

tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag   2340

aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgacgcgccc   2400

tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac cgctacactt   2460

gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc cacgttcgcc   2520

ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt tagtgcttta   2580

cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg gccatcgccc   2640

tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag tggactcttg   2700

ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt ataagggatt   2760

ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt taacgcgaat   2820

tttaacaaaa tattaacgct tacaatttcc attcgccatt caggctgcgc aactgttggg   2880

aagggcgatc ggtgcgggcc tcttcgctat tacgccagct ggcgaaaggg ggatgtgctg   2940

caaggcgatt aagttgggta acgccagggt tttcccagtc acgacgttgt aaaacgacgg   3000

ccagtgaatt gtaatacgac tcactatagg gcgaattggg taccgggccc cccctcgagg   3060

tcgatggtgt cgataagctt gatatcgaat tcatgtcaca caaaccgatc ttcgcctcaa   3120

ggaaacctaa ttctacatcc gagagactgc cgagatccag tctacactga ttaattttcg   3180

ggccaataat ttaaaaaaat cgtgttatat aatattatat gtattatata tatacatcat   3240

gatgatactg acagtcatgt cccattgcta aatagacaga ctccatctgc cgcctccaac   3300

tgatgttctc aatatttaag gggtcatctc gcattgttta ataataaaca gactccatct   3360

accgcctcca aatgatgttc tcaaaatata ttgtatgaac ttatttttat tacttagtat   3420

tattagacaa cttacttgct ttatgaaaaa cacttcctat ttaggaaaca atttataatg   3480

gcagttcgtt catttaacaa tttatgtaga ataaatgtta taaatgcgta tgggaaatct   3540

taaatatgga tagcataaat gatatctgca ttgcctaatt cgaaatcaac agcaacgaaa   3600

aaaatccctt gtacaacata aatagtcatc gagaaatatc aactatcaaa gaacagctat   3660

tcacacgtta ctattgagat tattattgga cgagaatcac acactcaact gtctttctct   3720

cttctagaaa tacaggtaca agtatgtact attctcattg ttcatacttc tagtcatttc   3780

atcccacata ttccttggat ttctctccaa tgaatgacat tctatcttgc aaattcaaca   3840

attataataa gatataccaa agtagcggta tagtggcaat caaaaagctt ctctggtgtg   3900

cttctcgtat ttatttttat tctaatgatc cattaaaggt atatatttat ttcttgttat   3960

ataatccttt tgtttattac atgggctgga tacataaagg tattttgatt taattttttg   4020

cttaaattca atcccccctc gttcagtgtc aactgtaatg gtaggaaatt accatacttt   4080

tgaagaagca aaaaaaatga aagaaaaaaa aaatcgtatt tccaggttag acgttccgca   4140

gaatctagaa tgcggtatgc ggtacattgt tcttcgaacg taaaagttgc gctccctgag   4200

atattgtaca tttttgcttt tacaagtaca agtacatcgt acaactatgt actactgttg   4260

atgcatccac aacagtttgt tttgtttttt tttgtttttt ttttttctaa tgattcatta   4320

ccgctatgta tacctacttg tacttgtagt aagccgggtt attggcgttc aattaatcat   4380

agacttatga atctgcacgg tgtgcgctgc gagttacttt tagcttatgc atgctacttg   4440

ggtgtaatat tgggatctgt tcggaaatca acggatgctc aaccgatttc gacagtaatt   4500

aattaattcc ctagtcccag tgtacacccg ccgatatcgc ttaccctgca gccggattaa   4560

ggttggcaat ttttcacgtc cttgtctccg caattactca ccgggtggtt tataagattg   4620

caagcgtctt gatttgtctc tgtatactaa catgcaatcg cgactcgccc gacgggccac   4680

taacctggcc agaatctcca gatccaagta ttctcttggt ctgcgatatg tttccaacac   4740

aaaagcccct gctgcccagc cggcaactgc tgagtgagta ttccttgcca taaacgaccc   4800

agaaccactg tatagtgttt ggaagcacta gtcagaagac cagcgaaaac aggtggaaaa   4860

aactgagacg aaaagcaacg accagaaatg taatgtgtgg aaaagcgaca cacacagagc   4920

agataaagag gtgacaaata acgacaaatg aaatatcagt atcttcccac aatcactacc   4980

tctcagctgt ctgaaggtgc ggctgatata tccatcccac gtctaacgta tggagtgtga   5040

tagaatatga cgacacaagc atgagaactc gctctctatc caaccaccga aacactgtca   5100

ctacagccgt tcttgttgct ccattcgctt ttgtgattcc atgccttctc tggtgactga   5160

caacattcct tccttttctc cagccctgtt gttatctgct catgacctac ggccactctc   5220

tatcgcatac taacatagac gatcccagcc cgctccccac ttccagggca ccgttggcaa   5280

gcctcctatc ctcaagaagg ctgaggctgc caacgctgac atggacgagt ccttcatcgg   5340

aatgtctgga ggagagatct tccacgagat gatgctgcga cacaacgtcg acactgtctt   5400

cggttacccc ggtggagcca ttctccccgt ctttgacgcc attcacaact ctgagtactt   5460

caactttgtg ctccctcgac acgagcaggg tgccggccac atggccgagg gctacgctcg   5520

agcctctggt aagcccggtg tcgttctcgt cacctctggc cccggtgcca ccaacgtcat   5580

cacccccatg caggacgctc tttccgatgg tacccccatg gttgtcttca ccggtcaggt   5640

cctgacctcc gttatcggca ctgacgcctt ccaggaggcc gatgttgtcg gcatctcccg   5700

atcttgcacc aagtggaacg tcatggtcaa gaacgttgct gagctccccc gacgaatcaa   5760

cgaggccttt gagattgcta cttccggccg acccggtccc gttctcgtcg atctgcccaa   5820

ggatgttact gctgccatcc tgcgagagcc catccccacc aagtccacca ttccctcgca   5880

ttctctgacc aacctcacct ctgccgccgc caccgagttc cagaagcagg ctatccagcg   5940

agccgccaac ctcatcaacc agtccaagaa gcccgtcctt tacgtcggac agggtatcct   6000

tggctccgag gagggtccta agctgcttaa ggagctggct gagaaggccg agattcccgt   6060

caccactact ctgcagggtc ttggtgcctt tgacgagcga gaccccaagt ctctgcacat   6120

gctcggtatg cacggttccg gctacgccaa catggccatg cagaacgctg actgtatcat   6180

tgctctcggc gcccgatttg atgaccgagt taccggctcc atccccaagt ttgcccccga   6240

ggctcgagcc gctgcccttg agggtcgagg tggtattgtt cactttgaga tccaggccaa   6300

gaacatcaac aaggttgttc aggccaccga agccgttgag ggagacgtta ccgagtctgt   6360

ccgacagctc atccccctca tcaacaaggt ctctgccgct gagcgagctc cctggactga   6420

gactatccag tcctggaagc agcagttccc cttcctcttc gaggctgaag gtgaggatgg   6480

tgttatcaag ccccagtccg tcattgctct gctctctgac ctgacagaga acaacaagga   6540

caagaccatc atcaccaccg gtgttggtca gcatcagatg tggactgccc agcatttccg   6600

atggcgacac cctcgaacca tgatcacttc tggtggtctt ggaactatgg gttacggcct   6660

gcccgccgct atcggcgcca aggttgcccg acctgactgc gacgtcattg acatcgatgg   6720

tgacgcttct ttcaacatga ctctgaccga gctgtccacc gccgttcagt tcaacattgg   6780

cgtcaaggct attgtcctca acaacgagga acagggtatg gtcacccagc tgcagtctct   6840

cttctacgag aaccgatact gccacactca tcagaagaac cccgacttca tgaagctggc   6900

cgagtccatg ggcatgaagg gtatccgaat cactcacatt gaccagctgg aggccggtct   6960

caaggagatg ctcgcataca agggccctgt gctcgttgag gttgttgtcg acaagaagat   7020

ccccgttctt cccatggttc ccgctggtaa ggctttgcat gagttccttg tctacgacgc   7080

tgacgccgag gctgcttctc gacccgatcg actgaagaat gcccccgccc ctcacgtcca   7140

ccagaccacc tttgagaact aagtggaaag gaacacaagc aatccgaacc aaaaataatt   7200

ggggtcccgt gcccacagag tctagtgcag acctaaaatg accacagtaa attatagctg   7260

ttattaaaca tgagattttg accaacaaga gcgtaggaat gttattagct actacttgta   7320

catacacagc atttgtttta aataatgttg cctccagggg cagtgagatc aggacccaga   7380

tccgtggcca gctctctgac ttcagaccgc ttgtacttaa gcagctcgca acactgttgt   7440

cgaggattga acttgccata ttcgattttg tggtcatgaa tccagcacac ctcatttaaa   7500

tgtagctaac ggtagcaggc gaactactgg tacatacctc ccccggaata tgtacaggca   7560

taatgcgtat ctgtgggaca tgtggtcgtt gcgccattat gtaagcagcg tgtactcctc   7620

tgactgtcca tatggtttgc tccatctcac cctcatcgtt ttcattgttc acaggcggcc   7680

acaaaaaaac tgtcttctct ccttctctct tcgccttagt ctactcggac cagttttagt   7740

ttagcttggc gccactggat aaatgagacc tcaggccttg tgatgaggag gtcacttatg   7800

aagcatgtta ggaggtgctt gtatggatag agaagcaccc aaaataataa gaataataat   7860

aaaacagggg gcgttgtcat ttcatatcgt gttttcacca tcaatacacc tccaaacaat   7920

gcccttcatg tggccagccc caatattgtc ctgtagttca actctatgca gctcgtatct   7980

tattgagcaa gtaaaactct gtcagccgat attgcccgac ccgcgacaag ggtcaacaag   8040

gtggtgtaag gccttcgcag aagtcaaaac tgtgccaaac aaacatctag agtctctttg   8100

gtgtttctcg catatatttw atcggctgtc ttacgtattt gcgcctcggt accggactaa   8160

tttcggatca tccccaatac gctttttctt cgcagctgtc aacagtgtcc atgatctatc   8220

cacctaaatg ggtcatatga ggcgtataat ttcgtggtgc tgataataat tcccatatat   8280

ttgacacaaa acttcccccc ctagacatac atctcacaat ctcacttctt gtgcttctgt   8340

cacacatctc ctccagctga cttcaactca cacctctgcc ccagttggtc tacagcggta   8400

taaggtttct ccgcatagag gtgcaccact cctcccgata cttgtttgtg tgacttgtgg   8460

gtcacgacat atatatctac acacattgcg ccaccctttg gttcttccag cacaacaaaa   8520

acacgacacg ctaaccatgg ccaatttact gaccgtacac caaaatttgc ctgcattacc   8580

ggtcgatgca acgagtgatg aggttcgcaa gaacctgatg gacatgttca gggatcgcca   8640

ggcgttttct gagcatacct ggaaaatgct tctgtccgtt tgccggtcgt gggcggcatg   8700

gtgcaagttg aataaccgga aatggtttcc cgcagaacct gaagatgttc gcgattatct   8760

tctatatctt caggcgcgcg gtctggcagt aaaaactatc cagcaacatt tgggccagct   8820

aaacatgctt catcgtcggt ccgggctgcc acgaccaagt gacagcaatg ctgtttcact   8880

ggttatgcgg cggatccgaa aagaaaacgt tgatgccggt gaacgtgcaa aacaggctct   8940

agcgttcgaa cgcactgatt tcgaccaggt tcgttcactc atggaaaata gcgatcgctg   9000

ccaggatata cgtaatctgg catttctggg gattgcttat aacaccctgt tacgtatagc   9060

cgaaattgcc aggatcaggg ttaaagatat ctcacgtact gacggtggga gaatgttaat   9120

ccatattggc agaacgaaaa cgctggttag caccgcaggt gtagagaagg cacttagcct   9180

gggggtaact aaactggtcg agcgatggat ttccgtctct ggtgtagctg atgatccgaa   9240

taactacctg ttttgccggg tcagaaaaaa tggtgttgcc gcgccatctg ccaccagcca   9300

gctatcaact cgcgccctgg aagggatttt tgaagcaact catcgattga tttacggcgc   9360

taaggatgac tctggtcaga gatacctggc ctggtctgga cacagtgccc gtgtcggagc   9420

cgcgcgagat atggcccgcg ctggagtttc aataccggag atcatgcaag ctggtggctg   9480

gaccaatgta aatattgtca tgaactatat ccgtaacctg gatagtgaaa caggggcaat   9540

ggtgcgcctg ctggaagatg gcgattaagc                                    9570

 

<210>55

<211>15743

<212>DNA

<213>人工序列

 

<220>

<223>质粒pZP2-2988

 

<400>55

ggccgcatgt acatacaaga ttatttatag aaatgaatcg cgatcgaaca aagagtacga     60

gtgtacgagt aggggatgat gataaaagtg gaagaagttc cgcatctttg gatttatcaa    120

cgtgtaggac gatacttcct gtaaaaatgc aatgtcttta ccataggttc tgctgtagat    180

gttattaact accattaaca tgtctacttg tacagttgca gaccagttgg agtatagaat    240

ggtacactta ccaaaaagtg ttgatggttg taactacgat atataaaact gttgacggga    300

tctgtatatt cggtaagata tattttgtgg ggttttagtg gtgtttaaac agtgtacgca    360

gtactataga ggaacaattg ccccggagaa gacggccagg ccgcctagat gacaaattca    420

acaactcaca gctgactttc tgccattgcc actagggggg ggccttttta tatggccaag    480

ccaagctctc cacgtcggtt gggctgcacc caacaataaa tgggtagggt tgcaccaaca    540

aagggatggg atggggggta gaagatacga ggataacggg gctcaatggc acaaataaga    600

acgaatactg ccattaagac tcgtgatcca gcgactgaca ccattgcatc atctaagggc    660

ctcaaaacta cctcggaact gctgcgctga tctggacacc acagaggttc cgagcacttt    720

aggttgcacc aaatgtccca ccaggtgcag gcagaaaacg ctggaacagc gtgtacagtt    780

tgtcttaaca aaaagtgagg gcgctgaggt cgagcagggt ggtgtgactt gttatagcct    840

ttagagctgc gaaagcgcgt atggatttgg ctcatcaggc cagattgagg gtctgtggac    900

acatgtcatg ttagtgtact tcaatcgccc cctggatata gccccgacaa taggccgtgg    960

cctcattttt ttgccttccg cacatttcca ttgctcggta cccacacctt gcttctcctg   1020

cacttgccaa ccttaatact ggtttacatt gaccaacatc ttacaagcgg ggggcttgtc   1080

tagggtatat ataaacagtg gctctcccaa tcggttgcca gtctcttttt tcctttcttt   1140

ccccacagat tcgaaatcta aactacacat cacaccatgg aggtcgtgaa cgaaatcgtc   1200

tccattggcc aggaggttct tcccaaggtc gactatgctc agctctggtc tgatgcctcg   1260

cactgcgagg tgctgtacct ctccatcgcc ttcgtcatcc tgaagttcac ccttggtcct   1320

ctcggaccca agggtcagtc tcgaatgaag tttgtgttca ccaactacaa cctgctcatg   1380

tccatctact cgctgggctc cttcctctct atggcctacg ccatgtacac cattggtgtc   1440

atgtccgaca actgcgagaa ggctttcgac aacaatgtct tccgaatcac cactcagctg   1500

ttctacctca gcaagttcct cgagtacatt gactccttct atctgcccct catgggcaag   1560

cctctgacct ggttgcagtt ctttcaccat ctcggagctc ctatggacat gtggctgttc   1620

tacaactacc gaaacgaagc cgtttggatc tttgtgctgc tcaacggctt cattcactgg   1680

atcatgtacg gctactattg gacccgactg atcaagctca agttccctat gcccaagtcc   1740

ctgattactt ctatgcagat cattcagttc aacgttggct tctacatcgt ctggaagtac   1800

cggaacattc cctgctaccg acaagatgga atgagaatgt ttggctggtt tttcaactac   1860

ttctacgttg gtactgtcct gtgtctgttc ctcaacttct acgtgcagac ctacatcgtc   1920

cgaaagcaca agggagccaa aaagattcag tgagcggccg caagtgtgga tggggaagtg   1980

agtgcccggt tctgtgtgca caattggcaa tccaagatgg atggattcaa cacagggata   2040

tagcgagcta cgtggtggtg cgaggatata gcaacggata tttatgtttg acacttgaga   2100

atgtacgata caagcactgt ccaagtacaa tactaaacat actgtacata ctcatactcg   2160

tacccgggca acggtttcac ttgagtgcag tggctagtgc tcttactcgt acagtgtgca   2220

atactgcgta tcatagtctt tgatgtatat cgtattcatt catgttagtt gcgtacgggc   2280

gtcgttgctt gtgtgatttt tgaggaccca tccctttggt atataagtat actctggggt   2340

taaggttgcc cgtgtagtct aggttatagt tttcatgtga aataccgaga gccgagggag   2400

aataaacggg ggtatttgga cttgtttttt tcgcggaaaa gcgtcgaatc aaccctgcgg   2460

gccttgcacc atgtccacga cgtgtttctc gccccaattc gccccttgca cgtcaaaatt   2520

aggcctccat ctagacccct ccataacatg tgactgtggg gaaaagtata agggaaacca   2580

tgcaaccata gacgacgtga aagacgggga ggaaccaatg gaggccaaag aaatggggta   2640

gcaacagtcc aggagacaga caaggagaca aggagagggc gcccgaaaga tcggaaaaac   2700

aaacatgtcc aattggggca gtgacggaaa cgacacggac acttcagtac aatggaccga   2760

ccatctccaa gccagggtta ttccggtatc accttggccg taacctcccg ctggtacctg   2820

atattgtaca cgttcacatt caatatactt tcagctacaa taagagaggc tgtttgtcgg   2880

gcatgtgtgt ccgtcgtatg gggtgatgtc cgagggcgaa attcgctaca agcttaactc   2940

tggcgcttgt ccagtatgaa tagacaagtc aagaccagtg gtgccatgat tgacagggag   3000

gtacaagact tcgatactcg agcattactc ggacttgtgg cgattgaaca gacgggcgat   3060

cgcttctccc ccgtattgcc ggcgcgccag ctgcattaat gaatcggcca acgcgcgggg   3120

agaggcggtt tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg   3180

gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca   3240

gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac   3300

cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac   3360

aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg   3420

tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac   3480

ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat   3540

ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag   3600

cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac   3660

ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt   3720

gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaagaac agtatttggt   3780

atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc   3840

aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga   3900

aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac   3960

gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc   4020

cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct   4080

gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca   4140

tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct   4200

ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca   4260

ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc   4320

atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg   4380

cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac gctcgtcgtt tggtatggct   4440

tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa   4500

aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta   4560

tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc   4620

ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg   4680

agttgctctt gcccggcgtc aatacgggat aataccgcgc cacatagcag aactttaaaa   4740

gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg   4800

agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc   4860

accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg   4920

gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat   4980

cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata   5040

ggggttccgc gcacatttcc ccgaaaagtg ccacctgatg cggtgtgaaa taccgcacag   5100

atgcgtaagg agaaaatacc gcatcaggaa attgtaagcg ttaatatttt gttaaaattc   5160

gcgttaaatt tttgttaaat cagctcattt tttaaccaat aggccgaaat cggcaaaatc   5220

ccttataaat caaaagaata gaccgagata gggttgagtg ttgttccagt ttggaacaag   5280

agtccactat taaagaacgt ggactccaac gtcaaagggc gaaaaaccgt ctatcagggc   5340

gatggcccac tacgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa   5400

gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg   5460

aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt   5520

gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc   5580

gcgtccattc gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt   5640

cgctattacg ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc   5700

cagggttttc ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa tacgactcac   5760

tatagggcga attgggcccg acgtcgcatg cgctgatgac actttggtct gaaagagatg   5820

cattttgaat cccaaacttg cagtgcccaa gtgacataca tctccgcgtt ttggaaaatg   5880

ttcagaaaca gttgattgtg ttggaatggg gaatggggaa tggaaaaatg actcaagtat   5940

caattccaaa aacttctctg gctggcagta cctactgtcc atactactgc attttctcca   6000

gtcaggccac tctatactcg acgacacagt agtaaaaccc agataatttc gacataaaca   6060

agaaaacaga cccaataata tttatatata gtcagccgtt tgtccagttc agactgtaat   6120

agccgaaaaa aaatccaaag tttctattct aggaaaatat attccaatat ttttaattct   6180

taatctcatt tattttattc tagcgaaata catttcagct acttgagaca tgtgataccc   6240

acaaatcgga ttcggactcg gttgttcaga agagcatatg gcattcgtgc tcgcttgttc   6300

acgtattctt cctgttccat ctcttggccg acaatcacac aaaaatgggg tttttttttt   6360

aattctaatg attcattaca gcaaaattga gatatagcag accacgtatt ccataatcac   6420

caaggaagtt cttgggcgtc ttaattaact cacctgcagg attgagacta tgaatggatt   6480

cccgtgcccg tattactcta ctaatttgat cttggaacgc gaaaatacgt ttctaggact   6540

ccaaagaatc tcaactcttg tccttactaa atatactacc catagttgat ggtttacttg   6600

aacagagagg acatgttcac ttgacccaaa gtttctcgca tctcttggat atttgaacaa   6660

cggcgtccac tgaccgtcag ttatccagtc acaaaacccc cacattcata cattcccatg   6720

tacgtttaca aagttctcaa ttccatcgtg caaatcaaaa tcacatctat tcattcatca   6780

tatataaacc catcatgtct actaacactc acaactccat agaaaacatc gactcagaac   6840

acacgctcca tgcggccgct tactgagcct tggcaccggg ctgcttctcg gccattcgag   6900

cgaactggga caggtatcgg agcaggatga cgagaccttc atggggcaga gggtttcggt   6960

aggggaggtt gtgcttctgg cacagctgtt ccacctggta ggaaacggca gtgaggttgt   7020

gtcgaggcag ggtgggccag agatggtgct cgatctggta gttcaggcct ccaaagaacc   7080

agtcagtaat gatgcctcgt cgaatgttca tggtctcatg gatctgaccc acagagaagc   7140

catgtccgtc ccagacggaa tcaccgatct tctccagagg gtagtggttc atgaagacca   7200

cgatggcaat tccgaagcca ccgacgagct cggaaacaaa gaacaccagc atcgaggtca   7260

ggatggaggg cataaagaag aggtggaaca gggtcttgag agtccagtgc agagcgagtc   7320

caatggcctc tttcttgtac tgagatcggt agaactggtt gtctcggtcc ttgagggatc   7380

gaacggtcag cacagactgg aaacaccaga tgaatcgcag gagaatacag atgaccagga   7440

aatagtactg ttggaactga atgagctttc gggagatggg agaagctcga gtgacatcgt   7500

cctcggacca ggcgagcaga ggcaggttat caatgtcggg atcgtgaccc tgaacgttgg   7560

tagcagaatg atgggcgttg tgtctgtcct tccaccaggt cacggagaag ccctggagtc   7620

cgttgccaaa gaccagaccc aggacgttat tccagtttcg gttcttgaag gtctggtggt   7680

ggcagatgtc atgagacagc catcccattt gctggtagtg cataccgagc acgagagcac   7740

caatgaagta caggtggtac tggaccagca tgaagaaggc aagcacgcca agacccaggg   7800

tggtcaagat cttgtacgag taccagaggg gagaggcgtc aaacatgcca gtggcgatca   7860

gctcttctcg gagctttcgg aaatcctcct gagcttcgtt gacggcagcc tggggaggca   7920

gctcggaagc ctggttgatc ttgggcattc gcttgagctt gtcgaaggct tcctgagagt   7980

gcataaccat gaaggcgtca gtagcatctc gtccctggta gttctcaatg atttcagctc   8040

caccagggtg gaagttcacc caagcggaga cgtcgtacac ctttccgtcg atgacgaggg   8100

gcagagcctg tcgagaagcc ttcaccatgg ttgtgaatta gggtggtgag aatggttggt   8160

tgtagggaag aatcaaaggc cggtctcggg atccgtgggt atatatatat atatatatat   8220

atacgatcct tcgttacctc cctgttctca aaactgtggt ttttcgtttt tcgttttttg   8280

ctttttttga tttttttagg gccaactaag cttccagatt tcgctaatca cctttgtact   8340

aattacaaga aaggaagaag ctgattagag ttgggctttt tatgcaactg tgctactcct   8400

tatctctgat atgaaagtgt agacccaatc acatcatgtc atttagagtt ggtaatactg   8460

ggaggataga taaggcacga aaacgagcca tagcagacat gctgggtgta gccaagcaga   8520

agaaagtaga tgggagccaa ttgacgagcg agggagctac gccaatccga catacgacac   8580

gctgagatcg tcttggccgg ggggtaccta cagatgtcca agggtaagtg cttgactgta   8640

attgtatgtc tgaggacaaa tatgtagtca gccgtataaa gtcataccag gcaccagtgc   8700

catcatcgaa ccactaactc tctatgatac atgcctccgg tattattgta ccatgcgtcg   8760

ctttgttaca tacgtatctt gcctttttct ctcagaaact ccagactttg gctattggtc   8820

gagataagcc cggaccatag tgagtctttc acactctaca tttctccctt gctccaacta   8880

tttaaattcc ttcacttcaa gttcattctt catctgcttc tgttttactt tgacaggcaa   8940

atgaagacat ggtacgactt gatggaggcc aagaacgcca tttcaccccg agacaccgaa   9000

gtgcctgaaa tcctggctgc ccccattgat aacatcggaa actacggtat tccggaaagt   9060

gtatatagaa cctttcccca gcttgtgtct gtggatatgg atggtgtaat cccctttgag   9120

tactcgtctt ggcttctctc cgagcagtat gaggctctct aatctagcgc atttaatatc   9180

tcaatgtatt tatatattta tcttctcatg cggccgctta ctgagccttg gcaccgggct   9240

gcttctcggc cattcgagcg aactgggaca ggtatcggag caggatgacg agaccttcat   9300

ggggcagagg gtttcggtag gggaggttgt gcttctggca cagctgttcc acctggtagg   9360

aaacggcagt gaggttgtgt cgaggcaggg tgggccagag atggtgctcg atctggtagt   9420

tcaggcctcc aaagaaccag tcagtaatga tgcctcgtcg aatgttcatg gtctcatgga   9480

tctgacccac agagaagcca tgtccgtccc agacggaatc accgatcttc tccagagggt   9540

agtggttcat gaagaccacg atggcaattc cgaagccacc gacgagctcg gaaacaaaga   9600

acaccagcat cgaggtcagg atggagggca taaagaagag gtggaacagg gtcttgagag   9660

tccagtgcag agcgagtcca atggcctctt tcttgtactg agatcggtag aactggttgt   9720

ctcggtcctt gagggatcga acggtcagca cagactggaa acaccagatg aatcgcagga   9780

gaatacagat gaccaggaaa tagtactgtt ggaactgaat gagctttcgg gagatgggag   9840

aagctcgagt gacatcgtcc tcggaccagg cgagcagagg caggttatca atgtcgggat   9900

cgtgaccctg aacgttggta gcagaatgat gggcgttgtg tctgtccttc caccaggtca   9960

cggagaagcc ctggagtccg ttgccaaaga ccagacccag gacgttattc cagtttcggt  10020

tcttgaaggt ctggtggtgg cagatgtcat gagacagcca tcccatttgc tggtagtgca  10080

taccgagcac gagagcacca atgaagtaca ggtggtactg gaccagcatg aagaaggcaa  10140

gcacgccaag acccagggtg gtcaagatct tgtacgagta ccagagggga gaggcgtcaa  10200

acatgccagt ggcgatcagc tcttctcgga gctttcggaa atcctcctga gcttcgttga  10260

cggcagcctg gggaggcagc tcggaagcct ggttgatctt gggcattcgc ttgagcttgt  10320

cgaaggcttc ctgagagtgc ataaccatga aggcgtcagt agcatctcgt ccctggtagt  10380

tctcaatgat ttcagctcca ccagggtgga agttcaccca agcggagacg tcgtacacct  10440

ttccgtcgat gacgaggggc agagcctgtc gagaagcctt caccatgggc aggacctgtg  10500

ttagtacatt gtcggggagt catcaattgg ttcgacaggt tgtcgactgt tagtatgagc  10560

tcaattgggc tctggtgggt cgatgacact tgtcatctgt ttctgttggg tcatgtttcc  10620

atcaccttct atggtactca caattcgtcc gattcgcccg aatccgttaa taccgacttt  10680

gatggccatg ttgatgtgtg tttaattcaa gaatgaatat agagaagaga agaagaaaaa  10740

agattcaatt gagccggcga tgcagaccct tatataaatg ttgccttgga cagacggagc  10800

aagcccgccc aaacctacgt tcggtataat atgttaagct ttttaacaca aaggtttggc  10860

ttggggtaac ctgatgtggt gcaaaagacc gggcgttggc gagccattgc gcgggcgaat  10920

ggggccgtga ctcgtctcaa attcgagggc gtgcctcaat tcgtgccccc gtggcttttt  10980

cccgccgttt ccgccccgtt tgcaccactg cagccgcttc tttggttcgg acaccttgct  11040

gcgagctagg tgccttgtgc tacttaaaaa gtggcctccc aacaccaaca tgacatgagt  11100

gcgtgggcca agacacgttg gcggggtcgc agtcggctca atggcccgga aaaaacgctg  11160

ctggagctgg ttcggacgca gtccgccgcg gcgtatggat atccgcaagg ttccatagcg  11220

ccattgccct ccgtcggcgt ctatcccgca acctctaaat agagcgggaa tataacccaa  11280

gcttcttttt tttcctttaa cacgcacacc cccaactatc atgttgctgc tgctgtttga  11340

ctctactctg tggaggggtg ctcccaccca acccaaccta caggtggatc cggcgctgtg  11400

attggctgat aagtctccta tccggactaa ttctgaccaa tgggacatgc gcgcaggacc  11460

caaatgccgc aattacgtaa ccccaacgaa atgcctaccc ctctttggag cccagcggcc  11520

ccaaatcccc ccaagcagcc cggttctacc ggcttccatc tccaagcaca agcagcccgg  11580

aattccttta cctgcaggat aacttcgtat aatgtatgct atacgaagtt atgatctctc  11640

tcttgagctt ttccataaca agttcttctg cctccaggaa gtccatgggt ggtttgatca  11700

tggttttggt gtagtggtag tgcagtggtg gtattgtgac tggggatgta gttgagaata  11760

agtcatacac aagtcagctt tcttcgagcc tcatataagt ataagtagtt caacgtatta  11820

gcactgtacc cagcatctcc gtatcgagaa acacaacaac atgccccatt ggacagatca  11880

tgcggataca caggttgtgc agtatcatac atactcgatc agacaggtcg tctgaccatc  11940

atacaagctg aacaagcgct ccatacttgc acgctctcta tatacacagt taaattacat  12000

atccatagtc taacctctaa cagttaatct tctggtaagc ctcccagcca gccttctggt  12060

atcgcttggc ctcctcaata ggatctcggt tctggccgta cagacctcgg ccgacaatta  12120

tgatatccgt tccggtagac atgacatcct caacagttcg gtactgctgt ccgagagcgt  12180

ctcccttgtc gtcaagaccc accccggggg tcagaataag ccagtcctca gagtcgccct  12240

taggtcggtt ctgggcaatg aagccaacca caaactcggg gtcggatcgg gcaagctcaa  12300

tggtctgctt ggagtactcg ccagtggcca gagagccctt gcaagacagc tcggccagca  12360

tgagcagacc tctggccagc ttctcgttgg gagaggggac taggaactcc ttgtactggg  12420

agttctcgta gtcagagacg tcctccttct tctgttcaga gacagtttcc tcggcaccag  12480

ctcgcaggcc agcaatgatt ccggttccgg gtacaccgtg ggcgttggtg atatcggacc  12540

actcggcgat tcggtgacac cggtactggt gcttgacagt gttgccaata tctgcgaact  12600

ttctgtcctc gaacaggaag aaaccgtgct taagagcaag ttccttgagg gggagcacag  12660

tgccggcgta ggtgaagtcg tcaatgatgt cgatatgggt tttgatcatg cacacataag  12720

gtccgacctt atcggcaagc tcaatgagct ccttggtggt ggtaacatcc agagaagcac  12780

acaggttggt tttcttggct gccacgagct tgagcactcg agcggcaaag gcggacttgt  12840

ggacgttagc tcgagcttcg taggagggca ttttggtggt gaagaggaga ctgaaataaa  12900

tttagtctgc agaacttttt atcggaacct tatctggggc agtgaagtat atgttatggt  12960

aatagttacg agttagttga acttatagat agactggact atacggctat cggtccaaat  13020

tagaaagaac gtcaatggct ctctgggcgt cgcctttgcc gacaaaaatg tgatcatgat  13080

gaaagccagc aatgacgttg cagctgatat tgttgtcggc caaccgcgcc gaaaacgcag  13140

ctgtcagacc cacagcctcc aacgaagaat gtatcgtcaa agtgatccaa gcacactcat  13200

agttggagtc gtactccaaa ggcggcaatg acgagtcaga cagatactcg tcgacgcgat  13260

aacttcgtat aatgtatgct atacgaagtt atcgtacgat agttagtaga caacaatcga  13320

taacgtctcg taccaaccac agattacgac ccattcgcag tcacagttca ctagggtttg  13380

ggttgcatcc gttgagagcg gtttgttttt aaccttctcc atgtgctcac tcaggttttg  13440

ggttcagatc aaatcaaggc gtgaaccact ttgtttgagg acaaatgtga cacaaccaac  13500

cagtgtcagg ggcaagtccg tgacaaaggg gaagatacaa tgcaattact gacagttaca  13560

gactgcctcg atgccctaac cttgccccaa aataagacaa ctgtcctcgt ttaagcgcaa  13620

ccctattcag cgtcacgtca taatagcgtt tggatagcac tagtctatga ggagcgtttt  13680

atgttgcggt gagggcgatt ggtgctcata tgggttcaat tgaggtggcg gaacgagctt  13740

agtcttcaat tgaggtgcga gcgacacaat tgggtgtcac gtggcctaat tgacctcggg  13800

tcgtggagtc cccagttata cagcaaccac gaggtgcatg ggtaggagac gtcaccagac  13860

aatagggttt tttttggact ggagagggtt gggcaaaagc gctcaacggg ctgtttgggg  13920

agctgtgggg gaggaattgg cgatatttgt gaggttaacg gctccgattt gcgtgttttg  13980

tcgctcctgc atctccccat acccatatct tccctcccca cctctttcca cgataatttt  14040

acggatcagc aataaggttc cttctcctag tttccacgtc catatatatc tatgctgcgt  14100

cgtccttttc gtgacatcac caaaacacat acaacaatgg ctgttactga cgtccttaag  14160

cgaaagtccg gtgtcatcgt cggcgacgat gtccgagccg tgagtatcca cgacaagatc  14220

agtgtcgaga cgacgcgttt tgtgtaatga cacaatccga aagtcgctag caacacacac  14280

tctctacaca aactaaccca gctctccatg gcctccacct cggctctgcc caagcagaac  14340

cctgccctcc gacgaaccgt cacttccacc actgtgaccg actcggagtc tgctgccgtc  14400

tctccctccg attctcccag acactcggcc tcctctacat cgctgtcttc catgtccgag  14460

gtggacattg ccaagcccaa gtccgagtac ggtgtcatgc tggataccta cggcaaccag  14520

ttcgaagttc ccgacttcac catcaaggac atctacaacg ctattcccaa gcactgcttc  14580

aagcgatctg ctctcaaggg atacggctac attcttcgag acattgtcct cctgactacc  14640

actttcagca tctggtacaa ctttgtgaca cccgagtaca ttccctccac tcctgctcga  14700

gccggtctgt gggctgtgta caccgttctt cagggactct tcggtactgg actgtgggtc  14760

attgcccacg agtgtggaca tggtgctttc tccgattccc gaatcatcaa cgacattact  14820

ggctgggtgc ttcactcttc cctgcttgtt ccctacttca gctggcaaat ctcccaccgg  14880

aagcatcaca aggccactgg aaacatggag cgagacatgg tcttcgttcc tcgaacccga  14940

gagcagcaag ctactcgact cggcaagatg acccacgaac tcgcccatct taccgaggaa  15000

actcctgctt tcaccctgct catgcttgtg cttcagcaac tggtcggttg gcccaactat  15060

ctcattacca acgttactgg acacaactac catgagcggc agcgagaggg tcgaggcaag  15120

ggaaagcaca acggtcttgg cggtggagtt aaccatttcg atccccgatc tcctctgtac  15180

gagaacagcg acgccaagct catcgtgctc tccgacattg gcattggtct tatggccacc  15240

gctctgtact ttctcgttca gaagttcgga ttctacaaca tggccatctg gtacttcgtt  15300

ccctacttgt gggttaacca ctggctcgtc gccattacct ttctgcagca cacagatcct  15360

actcttcccc actacaccaa cgacgagtgg aactttgtgc gaggtgccgc tgcaaccatc  15420

gaccgagaga tgggcttcat tggacgtcat ctgctccacg gcattatcga gactcacgtc  15480

ctgcatcact acgtctcttc cattcccttc tacaatgcgg acgaagctac cgaggccatc  15540

aaacctatca tgggcaagca ctatcgagct gatgtccagg acggtcctcg aggattcatt  15600

cgagccatgt accgatctgc acgaatgtgc cagtgggttg aaccctccgc tggtgccgag  15660

ggagctggca agggtgtcct gttctttcga aaccgaaaca atgtgggcac tcctcccgct  15720

gtcatcaagc ccgttgccta agc                                          15743

 

<210>56

<211>1434

<212>DNA

<213>串珠镰刀菌

<220>

<221>CDS

<222>(1)..(1434)

<223>合成Δ-12去饱和酶(经密码子优化用于解脂耶氏酵母)

 

<300>

<302>适于改变含油酵母中多不饱和脂肪酸含量的Δ-12去饱和酶

 

<310>WO 2005/047485

<311>2004-11-12

<312>2005-05-26

<313>(1)..(1434)

 

<300>

<302>适于改变含油酵母中多不饱和脂肪酸含量的Δ-12去饱和酶

 

<310>US 2005-0216975-A1

<311>2004-11-10

<312>2005-09-29

<313>(1)..(1434)

 

<400>56

atg gcc tcc acc tcg gct ctg ccc aag cag aac cct gcc ctc cga cga       48

Met Ala Ser Thr Ser Ala Leu Pro Lys Gln Asn Pro Ala Leu Arg Arg

1               5                   10                  15

acc gtc act tcc acc act gtg acc gac tcg gag tct gct gcc gtc tct       96

Thr Val Thr Ser Thr Thr Val Thr Asp Ser Glu Ser Ala Ala Val Ser

            20                  25                  30

ccc tcc gat tct ccc aga cac tcg gcc tcc tct aca tcg ctg tct tcc      144

Pro Ser Asp Ser Pro Arg His Ser Ala Ser Ser Thr Ser Leu Ser Ser

        35                  40                  45

atg tcc gag gtg gac att gcc aag ccc aag tcc gag tac ggt gtc atg      192

Met Ser Glu Val Asp Ile Ala Lys Pro Lys Ser Glu Tyr Gly Val Met

    50                  55                  60

ctg gat acc tac ggc aac cag ttc gaa gtt ccc gac ttc acc atc aag      240

Leu Asp Thr Tyr Gly Asn Gln Phe Glu Val Pro Asp Phe Thr Ile Lys

65                  70                  75                  80

gac atc tac aac gct att ccc aag cac tgc ttc aag cga tct gct ctc      288

Asp Ile Tyr Asn Ala Ile Pro Lys His Cys Phe Lys Arg Ser Ala Leu

                85                  90                  95

aag gga tac ggc tac att ctt cga gac att gtc ctc ctg act acc act      336

Lys Gly Tyr Gly Tyr Ile Leu Arg Asp Ile Val Leu Leu Thr Thr Thr

            100                 105                 110

ttc agc atc tgg tac aac ttt gtg aca ccc gag tac att ccc tcc act      384

Phe Ser Ile Trp Tyr Asn Phe Val Thr Pro Glu Tyr Ile Pro Ser Thr

        115                 120                 125

cct gct cga gcc ggt ctg tgg gct gtg tac acc gtt ctt cag gga ctc      432

Pro Ala Arg Ala Gly Leu Trp Ala Val Tyr Thr Val Leu Gln Gly Leu

    130                 135                 140

ttc ggt act gga ctg tgg gtc att gcc cac gag tgt gga cat ggt gct      480

Phe Gly Thr Gly Leu Trp Val Ile Ala His Glu Cys Gly His Gly Ala

145                 150                 155                 160

ttc tcc gat tcc cga atc atc aac gac att act ggc tgg gtg ctt cac      528

Phe Ser Asp Ser Arg Ile Ile Asn Asp Ile Thr Gly Trp Val Leu His

                165                 170                 175

tct tcc ctg ctt gtt ccc tac ttc agc tgg caa atc tcc cac cgg aag      576

Ser Ser Leu Leu Val Pro Tyr Phe Ser Trp Gln Ile Ser His Arg Lys

            180                 185                 190

cat cac aag gcc act gga aac atg gag cga gac atg gtc ttc gtt cct      624

His His Lys Ala Thr Gly Asn Met Glu Arg Asp Met Val Phe Val Pro

        195                 200                 205

cga acc cga gag cag caa gct act cga ctc ggc aag atg acc cac gaa      672

Arg Thr Arg Glu Gln Gln Ala Thr Arg Leu Gly Lys Met Thr His Glu

    210                 215                 220

ctc gcc cat ctt acc gag gaa act cct gct ttc acc ctg ctc atg ctt      720

Leu Ala His Leu Thr Glu Glu Thr Pro Ala Phe Thr Leu Leu Met Leu

225                 230                 235                 240

gtg ctt cag caa ctg gtc ggt tgg ccc aac tat ctc att acc aac gtt      768

Val Leu Gln Gln Leu Val Gly Trp Pro Asn Tyr Leu Ile Thr Asn Val

                245                 250                 255

act gga cac aac tac cat gag cgg cag cga gag ggt cga ggc aag gga      816

Thr Gly His Asn Tyr His Glu Arg Gln Arg Glu Gly Arg Gly Lys Gly

            260                 265                 270

aag cac aac ggt ctt ggc ggt gga gtt aac cat ttc gat ccc cga tct      864

Lys His Asn Gly Leu Gly Gly Gly Val Asn His Phe Asp Pro Arg Ser

        275                 280                 285

cct ctg tac gag aac agc gac gcc aag ctc atc gtg ctc tcc gac att      912

Pro Leu Tyr Glu Asn Ser Asp Ala Lys Leu Ile Val Leu Ser Asp Ile

    290                 295                 300

ggc att ggt ctt atg gcc acc gct ctg tac ttt ctc gtt cag aag ttc      960

Gly Ile Gly Leu Met Ala Thr Ala Leu Tyr Phe Leu Val Gln Lys Phe

305                 310                 315                 320

gga ttc tac aac atg gcc atc tgg tac ttc gtt ccc tac ttg tgg gtt     1008

Gly Phe Tyr Asn Met Ala Ile Trp Tyr Phe Val Pro Tyr Leu Trp Val

                325                 330                 335

aac cac tgg ctc gtc gcc att acc ttt ctg cag cac aca gat cct act     1056

Asn His Trp Leu Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr

            340                 345                 350

ctt ccc cac tac acc aac gac gag tgg aac ttt gtg cga ggt gcc gct     1104

Leu Pro His Tyr Thr Asn Asp Glu Trp Asn Phe Val Arg Gly Ala Ala

        355                 360                 365

gca acc atc gac cga gag atg ggc ttc att gga cgt cat ctg ctc cac     1152

Ala Thr Ile Asp Arg Glu Met Gly Phe Ile Gly Arg His Leu Leu His

    370                 375                 380

ggc att atc gag act cac gtc ctg cat cac tac gtc tct tcc att ccc     1200

Gly Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Ser Ile Pro

385                 390                 395                 400

ttc tac aat gcg gac gaa gct acc gag gcc atc aaa cct atc atg ggc     1248

Phe Tyr Asu Ala Asp Glu Ala Thr Glu Ala Ile Lys Pro Ile Met Gly

                405                 410                 415

aag cac tat cga gct gat gtc cag gac ggt cct cga gga ttc att cga     1296

Lys His Tyr Arg Ala Asp Val Gln Asp Gly Pro Arg Gly Phe Ile Arg

            420                 425                 430

gcc atg tac cga tct gca cga atg tgc cag tgg gtt gaa ccc tcc gct     1344

Ala Met Tyr Arg Ser Ala Arg Met Cys Gln Trp Val Glu Pro Ser Ala

        435                 440                 445

ggt gcc gag gga gct ggc aag ggt gtc ctg ttc ttt cga aac cga aac     1392

Gly Ala Glu Gly Ala Gly Lys Gly Val Leu Phe Phe Arg Asn Arg Asn

    450                 455                 460

aat gtg ggc act cct ccc gct gtc atc aag ccc gtt gcc taa             1434

Asn Val Gly Thr Pro Pro Ala Val Ile Lys Pro Val Ala

465                 470                 475

 

<210>57

<211>477

<212>PRT

<213>串珠镰刀菌

 

<400>57

Met Ala Ser Thr Ser Ala Leu Pro Lys Gln Asn Pro Ala Leu Arg Arg

1               5                   10                  15

Thr Val Thr Ser Thr Thr Val Thr Asp Ser Glu Ser Ala Ala Val Ser

            20                  25                  30

Pro Ser Asp Ser Pro Arg His Ser Ala Ser Ser Thr Ser Leu Ser Ser

        35                  40                  45

Met Ser Glu Val Asp Ile Ala Lys Pro Lys Ser Glu Tyr Gly Val Met

    50                  55                  60

Leu Asp Thr Tyr Gly Asn Gln Phe Glu Val Pro Asp Phe Thr Ile Lys

65                  70                  75                  80

Asp Ile Tyr Asn Ala Ile Pro Lys His Cys Phe Lys Arg Ser Ala Leu

                85                  90                  95

Lys Gly Tyr Gly Tyr Ile Leu Arg Asp Ile Val Leu Leu Thr Thr Thr

            100                 105                 110

Phe Ser Ile Trp Tyr Asn Phe Val Thr Pro Glu Tyr Ile Pro Ser Thr

        115                 120                 125

Pro Ala Arg Ala Gly Leu Trp Ala Val Tyr Thr Val Leu Gln Gly Leu

    130                 135                 140

Phe Gly Thr Gly Leu Trp Val Ile Ala His Glu Cys Gly His Gly Ala

145                 150                 155                 160

Phe Ser Asp Ser Arg Ile Ile Asn Asp Ile Thr Gly Trp Val Leu His

                165                 170                 175

Ser Ser Leu Leu Val Pro Tyr Phe Ser Trp Gln Ile Ser His Arg Lys

            180                 185                 190

His His Lys Ala Thr Gly Asn Met Glu Arg Asp Met Val Phe Val Pro

        195                 200                 205

Arg Thr Arg Glu Gln Gln Ala Thr Arg Leu Gly Lys Met Thr His Glu

    210                 215                 220

Leu Ala His Leu Thr Glu Glu Thr Pro Ala Phe Thr Leu Leu Met Leu

225                 230                 235                 240

Val Leu Gln Gln Leu Val Gly Trp Pro Asn Tyr Leu Ile Thr Asn Val

                245                 250                 255

Thr Gly His Asn Tyr His Glu Arg Gln Arg Glu Gly Arg Gly Lys Gly

            260                 265                 270

Lys His Asn Gly Leu Gly Gly Gly Val Asn His Phe Asp Pro Arg Ser

        275                 280                 285

Pro Leu Tyr Glu Asn Ser Asp Ala Lys Leu Ile Val Leu Ser Asp Ile

    290                 295                 300

Gly Ile Gly Leu Met Ala Thr Ala Leu Tyr Phe Leu Val Gln Lys Phe

305                 310                 315                 320

Gly Phe Tyr Asn Met Ala Ile Trp Tyr Phe Val Pro Tyr Leu Trp Val

                325                 330                 335

Asn His Trp Leu Val Ala Ile Thr Phe Leu Gln His Thr Asp Pro Thr

            340                 345                 350

Leu Pro His Tyr Thr Asn Asp Glu Trp Asn Phe Val Arg Gly Ala Ala

        355                 360                 365

Ala Thr Ile Asp Arg Glu Met Gly Phe Ile Gly Arg His Leu Leu His

    370                 375                 380

Gly Ile Ile Glu Thr His Val Leu His His Tyr Val Ser Ser Ile Pro

385                 390                 395                 400

Phe Tyr Asn Ala Asp Glu Ala Thr Glu Ala Ile Lys Pro Ile Met Gly

                405                 410                 415

Lys His Tyr Arg Ala Asp Val Gln Asp Gly Pro Arg Gly Phe Ile Arg

            420                 425                 430

Ala Met Tyr Arg Ser Ala Arg Met Cys Gln Trp Val Glu Pro Ser Ala

        435                 440                 445

Gly Ala Glu Gly Ala Gly Lys Gly Val Leu Phe Phe Arg Asn Arg Asn

    450                 455                 460

Asn Val Gly Thr Pro Pro Ala Val Ile Lys Pro Val Ala

465                 470                 475

 

<210>58

<211>6303

<212>DNA

<213>人工序列

 

<220>

<223>质粒pZKUE3S

 

<400>58

ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa     60

gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac    120

ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta    180

aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct    240

agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat    300

tcattcatgt tagttgcgta cgaggaaact gtctctgaac agaagaagga ggacgtctct    360

gactacgaga actcccagta caaggagttc ctagtcccct ctcccaacga gaagctggcc    420

agaggtctgc tcatgctggc cgagctgtct tgcaagggct ctctggccac tggcgagtac    480

tccaagcaga ccattgagct tgcccgatcc gaccccgagt ttgtggttgg cttcattgcc    540

cagaaccgac ctaagggcga ctctgaggac tggcttattc tgacccccgg ggtgggtctt    600

gacgacaagg gagacgctct cggacagcag taccgaactg ttgaggatgt catgtctacc    660

ggaacggata tcataattgt cggccgaggt ctgtacggcc agaaccgaga tcctattgag    720

gaggccaagc gataccagaa ggctggctgg gaggcttacc agaagattaa ctgttagagg    780

ttagactatg gatatgtaat ttaactgtgt atatagagag cgtgcaagta tggagcgctt    840

gttcagcttg tatgatggtc agacgacctg tctgatcgag tatgtatgat actgcacaac    900

ctgtgtatcc gcatgatctg tccaatgggg catgttgttg tgtttctcga tacggagatg    960

ctgggtacag tgctaatacg ttgaactact tatacttata tgaggctcga agaaagctga   1020

cttgtgtatg acttaattaa tcgagcttgg cgtaatcatg gtcatagctg tttcctgtgt   1080

gaaattgtta tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag   1140

cctggggtgc ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt   1200

tccagtcggg aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag   1260

gcggtttgcg tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg   1320

ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat   1380

caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta   1440

aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa   1500

atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc   1560

cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt   1620

ccgcctttct cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca   1680

gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg   1740

accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat   1800

cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta   1860

cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta tttggtatct   1920

gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac   1980

aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa   2040

aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa   2100

actcacgtta agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt   2160

taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca   2220

gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca   2280

tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc   2340

ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa   2400

accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc   2460

agtctattaa ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca   2520

acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat   2580

tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag   2640

cggttagctc cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac   2700

tcatggttat ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt   2760

ctgtgactgg tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt   2820

gctcttgccc ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc   2880

tcatcattgg aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat   2940

ccagttcgat gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca   3000

gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga   3060

cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg   3120

gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg   3180

ttccgcgcac atttccccga aaagtgccac ctgacgcgcc ctgtagcggc gcattaagcg   3240

cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg   3300

ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc   3360

taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa   3420

aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc   3480

ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac   3540

tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt   3600

ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgc   3660

ttacaatttc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc   3720

ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt   3780

aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgaat tgtaatacga   3840

ctcactatag ggcgaattgg gtaccgggcc ccacctcgag gtcgacgagt atctgtctga   3900

ctcgtcattg catgcctttg gagtacgact ccaactatga gtgtgcttgg atcactttga   3960

cgatacattc ttcgttggag gctgtgggtc tgacagctgc gttttcggcg cggttggccg   4020

acaacaatat cagctgcaac gtcattgctg gctttcatca tgatcacatt tttgtcggca   4080

aaggcgacgc ccagagagcc attgacgttc tttctaattt ggaccgatag ccgtatagtc   4140

cagtctatct ataagttcaa ctaactcgta actattacca taacatatac ttcactgccc   4200

cagataaggt tccgataaaa agttctgcag actaaattta tttcagtctc ctcttcacca   4260

ccaaaatgcc ctcctacgaa gctcgagtgc tcaagctcgt ggcagccaag aaaaccaacc   4320

tgtgtgcttc tctggatgtt accaccacca aggagctcat tgagcttgcc gataaggtcg   4380

gaccttatgt gtgcatgatc aaaacccata tcgacatcat tgacgacttc acctacgccg   4440

gcactgtgct ccccctcaag gaacttgctc ttaagcacgg tttcttcctg ttcgaggaca   4500

gaaagttcgc agatattggc aacactgtca agcaccagta ccggtgtcac cgaatcgccg   4560

agtggtccga tatcaccaac gcccacggtg tttaaacccg gaaccggaat cgataagctt   4620

gatatcgaat tcatgctgtt catcgtggtt aatgctgctg tgtgctgtgt gtgtgtgttg   4680

tttggcgctc attgttgcgt tatgcagcgt acaccacaat attggaagct tattagcctt   4740

tctatttttt cgtttgcaag gcttaacaac attgctgtgg agagggatgg ggatatggag   4800

gccgctggag ggagtcggag aggcgttttg gagcggcttg gcctggcgcc cagctcgcga   4860

aacgcaccta ggaccctttg gcacgccgaa atgtgccact tttcagtcta gtaacgcctt   4920

acctacgtca ttccatgcgt gcatgtttgc gccttttttc ccttgccctt gatcgccaca   4980

cagtacagtg cactgtacag tggaggtttt gggggggtct tagatgggag ctaaaagcgg   5040

cctagcggta cactagtggg attgtatgga gtggcatgga gcctaggtgg agcctgacag   5100

gacgcacgac cggctagccc gtgacagacg atgggtggct cctgttgtcc accgcgtaca   5160

aatgtttggg ccaaagtctt gtcagccttg cttgcgaacc taattcccaa ttttgtcact   5220

tcgcaccccc attgatcgag ccctaacccc tgcccatcag gcaatccaat taagctcgca   5280

ttgtctgcct tgtttagttt ggctcctgcc cgtttcggcg tccacttgca caaacacaaa   5340

caagcattat atataaggct cgtctctccc tcccaaccac actcactttt ttgcccgtct   5400

tcccttgcta acacaaaagt caagaacaca aacaaccacc ccaaccccct tacacacaag   5460

acatatctac accatggagt ctggacccat gcctgctggc attcccttcc ctgagtacta   5520

tgacttcttt atggactgga agactcccct ggccatcgct gccacctaca ctgctgccgt   5580

cggtctcttc aaccccaagg ttggcaaggt ctcccgagtg gttgccaagt cggctaacgc   5640

aaagcctgcc gagcgaaccc agtccggagc tgccatgact gccttcgtct ttgtgcacaa   5700

cctcattctg tgtgtctact ctggcatcac cttctactac atgtttcctg ctatggtcaa   5760

gaacttccga acccacacac tgcacgaagc ctactgcgac acggatcagt ccctctggaa   5820

caacgcactt ggctactggg gttacctctt ctacctgtcc aagttctacg aggtcattga   5880

caccatcatc atcatcctga agggacgacg gtcctcgctg cttcagacct accaccatgc   5940

tggagccatg attaccatgt ggtctggcat caactaccaa gccactccca tttggatctt   6000

tgtggtcttc aactccttca ttcacaccat catgtactgt tactatgcct tcacctctat   6060

cggattccat cctcctggca aaaagtacct gacttcgatg cagattactc agtttctggt   6120

cggtatcacc attgccgtgt cctacctctt cgttcctggc tgcatccgaa cacccggtgc   6180

tcagatggct gtctggatca acgtcggcta cctgtttccc ttgacctatc tgttcgtgga   6240

ctttgccaag cgaacctact ccaagcgatc tgccattgcc gctcagaaaa aggctcagta   6300

agc                                                                 6303

 

<210>59

<211>21

<212>DNA

<213>人工序列

 

<220>

<223>引物pZP-GW-5-1

 

<400>59

cgacaagatg gaatgagaat g                                               21

 

<210>60

<211>22

<212>DNA

<213>人工序列

 

<220>

<223>引物pZP-GW-5-2

 

<400>60

ctggtttttc aactacttct ac                                              22

 

<210>61

<211>21

<212>DNA

<213>人工序列

 

<220>

<223>引物pZP-GW-5-3

 

<400>61

gtactgtcct gtgtctgttc c                                               21

 

<210>62

<211>22

<212>DNA

<213>人工序列

 

<220>

<223>引物pZP-GW-5-4

 

<400>62

ctacatcgtc cgaaagcaca ag                                              22

 

<210>63

<211>24

<212>DNA

<213>人工序列

 

<220>

<223>引物pZP-GW-3-1

 

<400>63

ctaccagatc gagcaccatc tctg                                            24

 

<210>64

<211>21

<212>DNA

<213>人工序列

 

<220>

<223>引物pZP-GW-3-2

 

<400>64

ctaccaggtg gaacagctgt g                                               21

 

<210>65

<211>22

<212>DNA

<213>人工序列

 

<220>

<223>引物pZP-GW-3-3

 

<400>65

tctgccccat gaaggtctcg tc                                              22

 

<210>66

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物pZP-GW-3-4

 

<400>66

cctgtcccag ttcgctcgaa tg                                              22

 

<210>67

<211>44

<212>DNA

<213>人工序列

 

<220>

<223>Genome Walker衔接子-1

 

<400>67

gtaatacgac tatagggcac gcgtggtcga cggcccgggc tggt                      44

 

<210>68

<211>8

<212>DNA

<213>人工序列

 

<220>

<223>Genome Walker衔接子-2

 

<220>

<221>misc_feature

<222>(1)..(1)

<223>5’末端与-PO4基附连

 

<220>

<221>misc_feature

<222>(8)..(8)

<223>3’末端与-H2N基附连

 

<400>68

accagccc                                                              8

 

<210>69

<211>22

<212>DNA

<213>人工序列

 

<220>

<223>巢式衔接子引物

 

<400>69

gtaatacgac tcactatagg gc                                              22

 

<210>70

<211>36

<212>DNA

<213>人工序列

 

<220>

<223>引物Per10F1

 

<400>70

gatcaaccat ggggggaagt tcacatgcat tcgctg                               36

 

<210>71

<211>29

<212>DNA

<213>人工序列

 

<220>

<223>引物ZPGW-5-5

 

<400>71

gttatagttt tcatgtgaaa taccgagag                                       29

 

<210>72

<211>37

<212>DNA

<213>人工序列

 

<220>

<223>引物Per10R

 

<400>72

gatcaagcgg ccgccagacc tcgtcattat ctgatag                              37

 

<210>73

<211>7222

<212>DNA

<213>人工序列

 

<220>

<223>质粒pFBAIn-MOD-1

 

<400>73

catggatcca ggcctgttaa cggccattac ggcctgcagg atccgaaaaa acctcccaca     60

cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc    120

agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt    180

ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctgcgg    240

ccgcaagtgt ggatggggaa gtgagtgccc ggttctgtgt gcacaattgg caatccaaga    300

tggatggatt caacacaggg atatagcgag ctacgtggtg gtgcgaggat atagcaacgg    360

atatttatgt ttgacacttg agaatgtacg atacaagcac tgtccaagta caatactaaa    420

catactgtac atactcatac tcgtacccgg gcaacggttt cacttgagtg cagtggctag    480

tgctcttact cgtacagtgt gcaatactgc gtatcatagt ctttgatgta tatcgtattc    540

attcatgtta gttgcgtacg agccggaagc ataaagtgta aagcctgggg tgcctaatga    600

gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg    660

tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg    720

cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg    780

gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga    840

aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg    900

gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag    960

aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc   1020

gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg   1080

ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt   1140

cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc   1200

ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc   1260

actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg   1320

tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca   1380

gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc   1440

ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat   1500

cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt   1560

ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt   1620

tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc   1680

agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc   1740

gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata   1800

ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg   1860

gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc   1920

cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct   1980

acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa   2040

cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt   2100

cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca   2160

ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac   2220

tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca   2280

atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt   2340

tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc   2400

actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca   2460

aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata   2520

ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc   2580

ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc   2640

cgaaaagtgc cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt   2700

acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc   2760

ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct   2820

ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat   2880

ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc   2940

acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc   3000

tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg   3060

atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc   3120

cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc   3180

agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc   3240

agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat   3300

tgggtaccgg gccccccctc gaggtcgatg gtgtcgataa gcttgatatc gaattcatgt   3360

cacacaaacc gatcttcgcc tcaaggaaac ctaattctac atccgagaga ctgccgagat   3420

ccagtctaca ctgattaatt ttcgggccaa taatttaaaa aaatcgtgtt atataatatt   3480

atatgtatta tatatataca tcatgatgat actgacagtc atgtcccatt gctaaataga   3540

cagactccat ctgccgcctc caactgatgt tctcaatatt taaggggtca tctcgcattg   3600

tttaataata aacagactcc atctaccgcc tccaaatgat gttctcaaaa tatattgtat   3660

gaacttattt ttattactta gtattattag acaacttact tgctttatga aaaacacttc   3720

ctatttagga aacaatttat aatggcagtt cgttcattta acaatttatg tagaataaat   3780

gttataaatg cgtatgggaa atcttaaata tggatagcat aaatgatatc tgcattgcct   3840

aattcgaaat caacagcaac gaaaaaaatc ccttgtacaa cataaatagt catcgagaaa   3900

tatcaactat caaagaacag ctattcacac gttactattg agattattat tggacgagaa   3960

tcacacactc aactgtcttt ctctcttcta gaaatacagg tacaagtatg tactattctc   4020

attgttcata cttctagtca tttcatccca catattcctt ggatttctct ccaatgaatg   4080

acattctatc ttgcaaattc aacaattata ataagatata ccaaagtagc ggtatagtgg   4140

caatcaaaaa gcttctctgg tgtgcttctc gtatttattt ttattctaat gatccattaa   4200

aggtatatat ttatttcttg ttatataatc cttttgttta ttacatgggc tggatacata   4260

aaggtatttt gatttaattt tttgcttaaa ttcaatcccc cctcgttcag tgtcaactgt   4320

aatggtagga aattaccata cttttgaaga agcaaaaaaa atgaaagaaa aaaaaaatcg   4380

tatttccagg ttagacgttc cgcagaatct agaatgcggt atgcggtaca ttgttcttcg   4440

aacgtaaaag ttgcgctccc tgagatattg tacatttttg cttttacaag tacaagtaca   4500

tcgtacaact atgtactact gttgatgcat ccacaacagt ttgttttgtt tttttttgtt   4560

tttttttttt ctaatgattc attaccgcta tgtataccta cttgtacttg tagtaagccg   4620

ggttattggc gttcaattaa tcatagactt atgaatctgc acggtgtgcg ctgcgagtta   4680

cttttagctt atgcatgcta cttgggtgta atattgggat ctgttcggaa atcaacggat   4740

gctcaatcga tttcgacagt aattaattaa gtcatacaca agtcagcttt cttcgagcct   4800

catataagta taagtagttc aacgtattag cactgtaccc agcatctccg tatcgagaaa   4860

cacaacaaca tgccccattg gacagatcat gcggatacac aggttgtgca gtatcataca   4920

tactcgatca gacaggtcgt ctgaccatca tacaagctga acaagcgctc catacttgca   4980

cgctctctat atacacagtt aaattacata tccatagtct aacctctaac agttaatctt   5040

ctggtaagcc tcccagccag ccttctggta tcgcttggcc tcctcaatag gatctcggtt   5100

ctggccgtac agacctcggc cgacaattat gatatccgtt ccggtagaca tgacatcctc   5160

aacagttcgg tactgctgtc cgagagcgtc tcccttgtcg tcaagaccca ccccgggggt   5220

cagaataagc cagtcctcag agtcgccctt aggtcggttc tgggcaatga agccaaccac   5280

aaactcgggg tcggatcggg caagctcaat ggtctgcttg gagtactcgc cagtggccag   5340

agagcccttg caagacagct cggccagcat gagcagacct ctggccagct tctcgttggg   5400

agaggggact aggaactcct tgtactggga gttctcgtag tcagagacgt cctccttctt   5460

ctgttcagag acagtttcct cggcaccagc tcgcaggcca gcaatgattc cggttccggg   5520

tacaccgtgg gcgttggtga tatcggacca ctcggcgatt cggtgacacc ggtactggtg   5580

cttgacagtg ttgccaatat ctgcgaactt tctgtcctcg aacaggaaga aaccgtgctt   5640

aagagcaagt tccttgaggg ggagcacagt gccggcgtag gtgaagtcgt caatgatgtc   5700

gatatgggtt ttgatcatgc acacataagg tccgacctta tcggcaagct caatgagctc   5760

cttggtggtg gtaacatcca gagaagcaca caggttggtt ttcttggctg ccacgagctt   5820

gagcactcga gcggcaaagg cggacttgtg gacgttagct cgagcttcgt aggagggcat   5880

tttggtggtg aagaggagac tgaaataaat ttagtctgca gaacttttta tcggaacctt   5940

atctggggca gtgaagtata tgttatggta atagttacga gttagttgaa cttatagata   6000

gactggacta tacggctatc ggtccaaatt agaaagaacg tcaatggctc tctgggcgtc   6060

gcctttgccg acaaaaatgt gatcatgatg aaagccagca atgacgttgc agctgatatt   6120

gttgtcggcc aaccgcgccg aaaacgcagc tgtcagaccc acagcctcca acgaagaatg   6180

tatcgtcaaa gtgatccaag cacactcata gttggagtcg tactccaaag gcggcaatga   6240

cgagtcagac agatactcgt cgaaaacagt gtacgcagat ctactataga ggaacattta   6300

aattgccccg gagaagacgg ccaggccgcc tagatgacaa attcaacaac tcacagctga   6360

ctttctgcca ttgccactag gggggggcct ttttatatgg ccaagccaag ctctccacgt   6420

cggttgggct gcacccaaca ataaatgggt agggttgcac caacaaaggg atgggatggg   6480

gggtagaaga tacgaggata acggggctca atggcacaaa taagaacgaa tactgccatt   6540

aagactcgtg atccagcgac tgacaccatt gcatcatcta agggcctcaa aactacctcg   6600

gaactgctgc gctgatctgg acaccacaga ggttccgagc actttaggtt gcaccaaatg   6660

tcccaccagg tgcaggcaga aaacgctgga acagcgtgta cagtttgtct taacaaaaag   6720

tgagggcgct gaggtcgagc agggtggtgt gacttgttat agcctttaga gctgcgaaag   6780

cgcgtatgga tttggctcat caggccagat tgagggtctg tggacacatg tcatgttagt   6840

gtacttcaat cgccccctgg atatagcccc gacaataggc cgtggcctca tttttttgcc   6900

ttccgcacat ttccattgct cggtacccac accttgcttc tcctgcactt gccaacctta   6960

atactggttt acattgacca acatcttaca agcggggggc ttgtctaggg tatatataaa   7020

cagtggctct cccaatcggt tgccagtctc ttttttcctt tctttcccca cagattcgaa   7080

atctaaacta cacatcacag aattccgagc cgtgagtatc cacgacaaga tcagtgtcga   7140

gacgacgcgt tttgtgtaat gacacaatcc gaaagtcgct agcaacacac actctctaca   7200

caaactaacc cagctctggt ac                                            7222

 

<210>74

<211>8133

<212>DNA

<213>人工序列

<220>

<223>质粒pFBA IN-Pex10

 

<400>74

ggccgcaagt gtggatgggg aagtgagtgc ccggttctgt gtgcacaatt ggcaatccaa     60

gatggatgga ttcaacacag ggatatagcg agctacgtgg tggtgcgagg atatagcaac    120

ggatatttat gtttgacact tgagaatgta cgatacaagc actgtccaag tacaatacta    180

aacatactgt acatactcat actcgtaccc gggcaacggt ttcacttgag tgcagtggct    240

agtgctctta ctcgtacagt gtgcaatact gcgtatcata gtctttgatg tatatcgtat    300

tcattcatgt tagttgcgta cgagccggaa gcataaagtg taaagcctgg ggtgcctaat    360

gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc    420

tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg    480

ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag    540

cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag    600

gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc    660

tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc    720

agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc    780

tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt    840

cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg    900

ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat    960

ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag   1020

ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt   1080

ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct ctgctgaagc   1140

cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta   1200

gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag   1260

atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga   1320

ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa   1380

gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa   1440

tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc   1500

ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga   1560

taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa   1620

gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt   1680

gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg   1740

ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc   1800

aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg   1860

gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag   1920

cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt   1980

actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt   2040

caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac   2100

gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac   2160

ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag   2220

caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa   2280

tactcatact cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga   2340

gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc   2400

cccgaaaagt gccacctgac gcgccctgta gcggcgcatt aagcgcggcg ggtgtggtgg   2460

ttacgcgcag cgtgaccgct acacttgcca gcgccctagc gcccgctcct ttcgctttct   2520

tcccttcctt tctcgccacg ttcgccggct ttccccgtca agctctaaat cgggggctcc   2580

ctttagggtt ccgatttagt gctttacggc acctcgaccc caaaaaactt gattagggtg   2640

atggttcacg tagtgggcca tcgccctgat agacggtttt tcgccctttg acgttggagt   2700

ccacgttctt taatagtgga ctcttgttcc aaactggaac aacactcaac cctatctcgg   2760

tctattcttt tgatttataa gggattttgc cgatttcggc ctattggtta aaaaatgagc   2820

tgatttaaca aaaatttaac gcgaatttta acaaaatatt aacgcttaca atttccattc   2880

gccattcagg ctgcgcaact gttgggaagg gcgatcggtg cgggcctctt cgctattacg   2940

ccagctggcg aaagggggat gtgctgcaag gcgattaagt tgggtaacgc cagggttttc   3000

ccagtcacga cgttgtaaaa cgacggccag tgaattgtaa tacgactcac tatagggcga   3060

attgggtacc gggccccccc tcgaggtcga tggtgtcgat aagcttgata tcgaattcat   3120

gtcacacaaa ccgatcttcg cctcaaggaa acctaattct acatccgaga gactgccgag   3180

atccagtcta cactgattaa ttttcgggcc aataatttaa aaaaatcgtg ttatataata   3240

ttatatgtat tatatatata catcatgatg atactgacag tcatgtccca ttgctaaata   3300

gacagactcc atctgccgcc tccaactgat gttctcaata tttaaggggt catctcgcat   3360

tgtttaataa taaacagact ccatctaccg cctccaaatg atgttctcaa aatatattgt   3420

atgaacttat ttttattact tagtattatt agacaactta cttgctttat gaaaaacact   3480

tcctatttag gaaacaattt ataatggcag ttcgttcatt taacaattta tgtagaataa   3540

atgttataaa tgcgtatggg aaatcttaaa tatggatagc ataaatgata tctgcattgc   3600

ctaattcgaa atcaacagca acgaaaaaaa tcccttgtac aacataaata gtcatcgaga   3660

aatatcaact atcaaagaac agctattcac acgttactat tgagattatt attggacgag   3720

aatcacacac tcaactgtct ttctctcttc tagaaataca ggtacaagta tgtactattc   3780

tcattgttca tacttctagt catttcatcc cacatattcc ttggatttct ctccaatgaa   3840

tgacattcta tcttgcaaat tcaacaatta taataagata taccaaagta gcggtatagt   3900

ggcaatcaaa aagcttctct ggtgtgcttc tcgtatttat ttttattcta atgatccatt   3960

aaaggtatat atttatttct tgttatataa tccttttgtt tattacatgg gctggataca   4020

taaaggtatt ttgatttaat tttttgctta aattcaatcc cccctcgttc agtgtcaact   4080

gtaatggtag gaaattacca tacttttgaa gaagcaaaaa aaatgaaaga aaaaaaaaat   4140

cgtatttcca ggttagacgt tccgcagaat ctagaatgcg gtatgcggta cattgttctt   4200

cgaacgtaaa agttgcgctc cctgagatat tgtacatttt tgcttttaca agtacaagta   4260

catcgtacaa ctatgtacta ctgttgatgc atccacaaca gtttgttttg tttttttttg   4320

tttttttttt ttctaatgat tcattaccgc tatgtatacc tacttgtact tgtagtaagc   4380

cgggttattg gcgttcaatt aatcatagac ttatgaatct gcacggtgtg cgctgcgagt   4440

tacttttagc ttatgcatgc tacttgggtg taatattggg atctgttcgg aaatcaacgg   4500

atgctcaatc gatttcgaca gtaattaatt aagtcataca caagtcagct ttcttcgagc   4560

ctcatataag tataagtagt tcaacgtatt agcactgtac ccagcatctc cgtatcgaga   4620

aacacaacaa catgccccat tggacagatc atgcggatac acaggttgtg cagtatcata   4680

catactcgat cagacaggtc gtctgaccat catacaagct gaacaagcgc tccatacttg   4740

cacgctctct atatacacag ttaaattaca tatccatagt ctaacctcta acagttaatc   4800

ttctggtaag cctcccagcc agccttctgg tatcgcttgg cctcctcaat aggatctcgg   4860

ttctggccgt acagacctcg gccgacaatt atgatatccg ttccggtaga catgacatcc   4920

tcaacagttc ggtactgctg tccgagagcg tctcccttgt cgtcaagacc caccccgggg   4980

gtcagaataa gccagtcctc agagtcgccc ttaggtcggt tctgggcaat gaagccaacc   5040

acaaactcgg ggtcggatcg ggcaagctca atggtctgct tggagtactc gccagtggcc   5100

agagagccct tgcaagacag ctcggccagc atgagcagac ctctggccag cttctcgttg   5160

ggagagggga ctaggaactc cttgtactgg gagttctcgt agtcagagac gtcctccttc   5220

ttctgttcag agacagtttc ctcggcacca gctcgcaggc cagcaatgat tccggttccg   5280

ggtacaccgt gggcgttggt gatatcggac cactcggcga ttcggtgaca ccggtactgg   5340

tgcttgacag tgttgccaat atctgcgaac tttctgtcct cgaacaggaa gaaaccgtgc   5400

ttaagagcaa gttccttgag ggggagcaca gtgccggcgt aggtgaagtc gtcaatgatg   5460

tcgatatggg ttttgatcat gcacacataa ggtccgacct tatcggcaag ctcaatgagc   5520

tccttggtgg tggtaacatc cagagaagca cacaggttgg ttttcttggc tgccacgagc   5580

ttgagcactc gagcggcaaa ggcggacttg tggacgttag ctcgagcttc gtaggagggc   5640

attttggtgg tgaagaggag actgaaataa atttagtctg cagaactttt tatcggaacc   5700

ttatctgggg cagtgaagta tatgttatgg taatagttac gagttagttg aacttataga   5760

tagactggac tatacggcta tcggtccaaa ttagaaagaa cgtcaatggc tctctgggcg   5820

tcgcctttgc cgacaaaaat gtgatcatga tgaaagccag caatgacgtt gcagctgata   5880

ttgttgtcgg ccaaccgcgc cgaaaacgca gctgtcagac ccacagcctc caacgaagaa   5940

tgtatcgtca aagtgatcca agcacactca tagttggagt cgtactccaa aggcggcaat   6000

gacgagtcag acagatactc gtcgaaaaca gtgtacgcag atctactata gaggaacatt   6060

taaattgccc cggagaagac ggccaggccg cctagatgac aaattcaaca actcacagct   6120

gactttctgc cattgccact aggggggggc ctttttatat ggccaagcca agctctccac   6180

gtcggttggg ctgcacccaa caataaatgg gtagggttgc accaacaaag ggatgggatg   6240

gggggtagaa gatacgagga taacggggct caatggcaca aataagaacg aatactgcca   6300

ttaagactcg tgatccagcg actgacacca ttgcatcatc taagggcctc aaaactacct   6360

cggaactgct gcgctgatct ggacaccaca gaggttccga gcactttagg ttgcaccaaa   6420

tgtcccacca ggtgcaggca gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa   6480

agtgagggcg ctgaggtcga gcagggtggt gtgacttgtt atagccttta gagctgcgaa   6540

agcgcgtatg gatttggctc atcaggccag attgagggtc tgtggacaca tgtcatgtta   6600

gtgtacttca atcgccccct ggatatagcc ccgacaatag gccgtggcct catttttttg   6660

ccttccgcac atttccattg ctcggtaccc acaccttgct tctcctgcac ttgccaacct   6720

taatactggt ttacattgac caacatctta caagcggggg gcttgtctag ggtatatata   6780

aacagtggct ctcccaatcg gttgccagtc tcttttttcc tttctttccc cacagattcg   6840

aaatctaaac tacacatcac agaattccga gccgtgagta tccacgacaa gatcagtgtc   6900

gagacgacgc gttttgtgta atgacacaat ccgaaagtcg ctagcaacac acactctcta   6960

cacaaactaa cccagctctg gtaccatggg gggaagttca catgcattcg ctggtgaatc   7020

tgatctgaca ctacaactac acaccaggtc caacatgagc gacaatacga caatcaaaaa   7080

gccgatccga cccaaaccga tccggacgga acgcctgcct tacgctgggg ccgcagaaat   7140

catccgagcc aaccagaaag accactactt tgagtccgtg cttgaacagc atctcgtcac   7200

gtttctgcag aaatggaagg gagtacgatt tatccaccag tacaaggagg agctggagac   7260

ggcgtccaag tttgcatatc tcggtttgtg tacgcttgtg ggctccaaga ctctcggaga   7320

agagtacacc aatctcatgt acactatcag agaccgaaca gctctaccgg gggtggtgag   7380

acggtttggc tacgtgcttt ccaacactct gtttccatac ctgtttgtgc gctacatggg   7440

caagttgcgc gccaaactga tgcgcgagta tccccatctg gtggagtacg acgaagatga   7500

gcctgtgccc agcccggaaa catggaagga gcgggtcatc aagacgtttg tgaacaagtt   7560

tgacaagttc acggcgctgg aggggtttac cgcgatccac ttggcgattt tctacgtcta   7620

cggctcgtac taccagctca gtaagcggat ctggggcatg cgttatgtat ttggacaccg   7680

actggacaag aatgagcctc gaatcggtta cgagatgctc ggtctgctga ttttcgcccg   7740

gtttgccacg tcatttgtgc agacgggaag agagtacctc ggagcgctgc tggaaaagag   7800

cgtggagaaa gaggcagggg agaaggaaga tgaaaaggaa gcggttgtgc cgaaaaagaa   7860

gtcgtcaatt ccgttcattg aggatacaga aggggagacg gaagacaaga tcgatctgga   7920

ggaccctcga cagctcaagt tcattcctga ggcgtccaga gcgtgcactc tgtgtctgtc   7980

atacattagt gcgccggcat gtacgccatg tggacacttt ttctgttggg actgtatttc   8040

cgaatgggtg agagagaagc ccgagtgtcc cttgtgtcgg cagggtgtga gagagcagaa   8100

cttgttgcct atcagataat gacgaggtct ggc                                8133

 

<210>75

<211>35

<212>DNA

<213>人工序列

 

<220>

<223>引物PEX10-R-BsiWI

 

<400>75

gatcaacgta cgcttcagca gtaactgtat tgctc                                35

 

<210>76

<211>35

<212>DNA

<213>人工序列

 

<220>

<223>引物PEX10-F1-SalI

 

<400>76

gatcaagtcg acattgtaac tagtcctgga gggtc                                35

 

<210>77

<211>36

<212>DNA

<213>人工序列

 

<220>

<223>引物PEX10-F2-SalI

 

<400>77

gatcaagtcg acgtcttagc gtcatgtatt ctcaag                               36

 

<210>78

<211>7277

<212>DNA

<213>人工序列

 

<220>

<223>质粒pEXP-MOD1

 

<400>78

catggatcca ggcctgttaa cggccattac ggcctgcagg atccgaaaaa acctcccaca     60

cctccccctg aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc    120

agcttataat ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt    180

ttcactgcat tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctgcgg    240

ccgcaagtgt ggatggggaa gtgagtgccc ggttctgtgt gcacaattgg caatccaaga    300

tggatggatt caacacaggg atatagcgag ctacgtggtg gtgcgaggat atagcaacgg    360

atatttatgt ttgacacttg agaatgtacg atacaagcac tgtccaagta caatactaaa    420

catactgtac atactcatac tcgtacccgg gcaacggttt cacttgagtg cagtggctag    480

tgctcttact cgtacagtgt gcaatactgc gtatcatagt ctttgatgta tatcgtattc    540

attcatgtta gttgcgtacg agccggaagc ataaagtgta aagcctgggg tgcctaatga    600

gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg    660

tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg    720

cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg    780

gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga    840

aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg    900

gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag    960

aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc   1020

gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg   1080

ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt   1140

cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc   1200

ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc   1260

actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg   1320

tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca   1380

gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc   1440

ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat   1500

cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt   1560

ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt   1620

tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc   1680

agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc   1740

gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata   1800

ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg   1860

gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc   1920

cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct   1980

acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa   2040

cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt   2100

cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca   2160

ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac   2220

tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca   2280

atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt   2340

tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc   2400

actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca   2460

aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata   2520

ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc   2580

ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc   2640

cgaaaagtgc cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt   2700

acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc   2760

ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct   2820

ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat   2880

ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc   2940

acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc   3000

tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg   3060

atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc   3120

cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc   3180

agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc   3240

agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat   3300

tgggtaccgg gccccccctc gaggtcgatg gtgtcgataa gcttgatatc gaattcatgt   3360

cacacaaacc gatcttcgcc tcaaggaaac ctaattctac atccgagaga ctgccgagat   3420

ccagtctaca ctgattaatt ttcgggccaa taatttaaaa aaatcgtgtt atataatatt   3480

atatgtatta tatatataca tcatgatgat actgacagtc atgtcccatt gctaaataga   3540

cagactccat ctgccgcctc caactgatgt tctcaatatt taaggggtca tctcgcattg   3600

tttaataata aacagactcc atctaccgcc tccaaatgat gttctcaaaa tatattgtat   3660

gaacttattt ttattactta gtattattag acaacttact tgctttatga aaaacacttc   3720

ctatttagga aacaatttat aatggcagtt cgttcattta acaatttatg tagaataaat   3780

gttataaatg cgtatgggaa atcttaaata tggatagcat aaatgatatc tgcattgcct   3840

aattcgaaat caacagcaac gaaaaaaatc ccttgtacaa cataaatagt catcgagaaa   3900

tatcaactat caaagaacag ctattcacac gttactattg agattattat tggacgagaa   3960

tcacacactc aactgtcttt ctctcttcta gaaatacagg tacaagtatg tactattctc   4020

attgttcata cttctagtca tttcatccca catattcctt ggatttctct ccaatgaatg   4080

acattctatc ttgcaaattc aacaattata ataagatata ccaaagtagc ggtatagtgg   4140

caatcaaaaa gcttctctgg tgtgcttctc gtatttattt ttattctaat gatccattaa   4200

aggtatatat ttatttcttg ttatataatc cttttgttta ttacatgggc tggatacata   4260

aaggtatttt gatttaattt tttgcttaaa ttcaatcccc cctcgttcag tgtcaactgt   4320

aatggtagga aattaccata cttttgaaga agcaaaaaaa atgaaagaaa aaaaaaatcg   4380

tatttccagg ttagacgttc cgcagaatct agaatgcggt atgcggtaca ttgttcttcg   4440

aacgtaaaag ttgcgctccc tgagatattg tacatttttg cttttacaag tacaagtaca   4500

tcgtacaact atgtactact gttgatgcat ccacaacagt ttgttttgtt tttttttgtt   4560

tttttttttt ctaatgattc attaccgcta tgtataccta cttgtacttg tagtaagccg   4620

ggttattggc gttcaattaa tcatagactt atgaatctgc acggtgtgcg ctgcgagtta   4680

cttttagctt atgcatgcta cttgggtgta atattgggat ctgttcggaa atcaacggat   4740

gctcaatcga tttcgacagt aattaattaa gtcatacaca agtcagcttt cttcgagcct   4800

catataagta taagtagttc aacgtattag cactgtaccc agcatctccg tatcgagaaa   4860

cacaacaaca tgccccattg gacagatcat gcggatacac aggttgtgca gtatcataca   4920

tactcgatca gacaggtcgt ctgaccatca tacaagctga acaagcgctc catacttgca   4980

cgctctctat atacacagtt aaattacata tccatagtct aacctctaac agttaatctt   5040

ctggtaagcc tcccagccag ccttctggta tcgcttggcc tcctcaatag gatctcggtt   5100

ctggccgtac agacctcggc cgacaattat gatatccgtt ccggtagaca tgacatcctc   5160

aacagttcgg tactgctgtc cgagagcgtc tcccttgtcg tcaagaccca ccccgggggt   5220

cagaataagc cagtcctcag agtcgccctt aggtcggttc tgggcaatga agccaaccac   5280

aaactcgggg tcggatcggg caagctcaat ggtctgcttg gagtactcgc cagtggccag   5340

agagcccttg caagacagct cggccagcat gagcagacct ctggccagct tctcgttggg   5400

agaggggact aggaactcct tgtactggga gttctcgtag tcagagacgt cctccttctt   5460

ctgttcagag acagtttcct cggcaccagc tcgcaggcca gcaatgattc cggttccggg   5520

tacaccgtgg gcgttggtga tatcggacca ctcggcgatt cggtgacacc ggtactggtg   5580

cttgacagtg ttgccaatat ctgcgaactt tctgtcctcg aacaggaaga aaccgtgctt   5640

aagagcaagt tccttgaggg ggagcacagt gccggcgtag gtgaagtcgt caatgatgtc   5700

gatatgggtt ttgatcatgc acacataagg tccgacctta tcggcaagct caatgagctc   5760

cttggtggtg gtaacatcca gagaagcaca caggttggtt ttcttggctg ccacgagctt   5820

gagcactcga gcggcaaagg cggacttgtg gacgttagct cgagcttcgt aggagggcat   5880

tttggtggtg aagaggagac tgaaataaat ttagtctgca gaacttttta tcggaacctt   5940

atctggggca gtgaagtata tgttatggta atagttacga gttagttgaa cttatagata   6000

gactggacta tacggctatc ggtccaaatt agaaagaacg tcaatggctc tctgggcgtc   6060

gcctttgccg acaaaaatgt gatcatgatg aaagccagca atgacgttgc agctgatatt   6120

gttgtcggcc aaccgcgccg aaaacgcagc tgtcagaccc acagcctcca acgaagaatg   6180

tatcgtcaaa gtgatccaag cacactcata gttggagtcg tactccaaag gcggcaatga   6240

cgagtcagac agatactcgt cgaccgtacg gggagtttgg cgcccgtttt ttcgagcccc   6300

acacgtttcg gtgagtatga gcggcggcag attcgagcgt ttccggtttc cgcggctgga   6360

cgagagccca tgatgggggc tcccaccacc agcaatcagg gccctgatta cacacccacc   6420

tgtaatgtca tgctgttcat cgatggttaa tgctgctgtg tgctgtgtgt gtgtgttgtt   6480

tggcgctcat tgttgcgtta tgcagcgtac accacaatat tggaagctta ttagcctttc   6540

tattttttcg tttgcaaggc ttaacaacat tgctgtggag agggatgggg atatggaggc   6600

cgctggaggg agtcggagag gcgttttgga gcggcttggc ctggcgccca gctcgcgaaa   6660

cgcacctagg accctttggc acgccgaaat gtgccacttt tcagtctagt aacgccttac   6720

ctacgtcatt ccatgcgtgc atgtttgcgc cttttttccc ttgcccttga tcgccacaca   6780

gtacagtgca ctgtacagtg gaggttttgg gggggtctta gatgggagct aaaagcggcc   6840

tagcggtaca ctagtgggat tgtatggagt ggcatggagc ctaggtggag cctgacagga   6900

cgcacgaccg gctagcccgt gacagacgat gggtggctcc tgttgtccac cgcgtacaaa   6960

tgtttgggcc aaagtcttgt cagccttgct tgcgaaccta attcccaatt ttgtcacttc   7020

gcacccccat tgatcgagcc ctaacccctg cccatcaggc aatccaatta agctcgcatt   7080

gtctgccttg tttagtttgg ctcctgcccg tttcggcgtc cacttgcaca aacacaaaca   7140

agcattatat ataaggctcg tctctccctc ccaaccacac tcactttttt gcccgtcttc   7200

ccttgctaac acaaaagtca agaacacaaa caaccacccc aaccccctta cacacaagac   7260

atatctacag caatggc                                                  7277

 

<210>79

<211>7559

<212>DNA

<213>人工序列

 

<220>

<223>质粒pPEX10-1

 

<400>79

gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca     60

ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat    120

taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc    180

tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca    240

aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca    300

aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg    360

ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg    420

acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt    480

ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt    540

tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc    600

tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt    660

gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt    720

agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc    780

tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa    840

agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt    900

tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct    960

acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta   1020

tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa   1080

agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc   1140

tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact   1200

acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc   1260

tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt   1320

ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta   1380

agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg   1440

tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt   1500

acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc   1560

agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt   1620

actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc   1680

tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc   1740

gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa   1800

ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac   1860

tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa   1920

aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt   1980

tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa   2040

tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct   2100

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc   2160

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc   2220

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt   2280

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg   2340

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt   2400

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta   2460

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt   2520

aacgcgaatt ttaacaaaat attaacgctt acaatttcca ttcgccattc aggctgcgca   2580

actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg   2640

gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta   2700

aaacgacggc cagtgaattg taatacgact cactataggg cgaattgggt accgggcccc   2760

ccctcgaggt cgatggtgtc gataagcttg atatcgaatt catgtcacac aaaccgatct   2820

tcgcctcaag gaaacctaat tctacatccg agagactgcc gagatccagt ctacactgat   2880

taattttcgg gccaataatt taaaaaaatc gtgttatata atattatatg tattatatat   2940

atacatcatg atgatactga cagtcatgtc ccattgctaa atagacagac tccatctgcc   3000

gcctccaact gatgttctca atatttaagg ggtcatctcg cattgtttaa taataaacag   3060

actccatcta ccgcctccaa atgatgttct caaaatatat tgtatgaact tatttttatt   3120

acttagtatt attagacaac ttacttgctt tatgaaaaac acttcctatt taggaaacaa   3180

tttataatgg cagttcgttc atttaacaat ttatgtagaa taaatgttat aaatgcgtat   3240

gggaaatctt aaatatggat agcataaatg atatctgcat tgcctaattc gaaatcaaca   3300

gcaacgaaaa aaatcccttg tacaacataa atagtcatcg agaaatatca actatcaaag   3360

aacagctatt cacacgttac tattgagatt attattggac gagaatcaca cactcaactg   3420

tctttctctc ttctagaaat acaggtacaa gtatgtacta ttctcattgt tcatacttct   3480

agtcatttca tcccacatat tccttggatt tctctccaat gaatgacatt ctatcttgca   3540

aattcaacaa ttataataag atataccaaa gtagcggtat agtggcaatc aaaaagcttc   3600

tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc attaaaggta tatatttatt   3660

tcttgttata taatcctttt gtttattaca tgggctggat acataaaggt attttgattt   3720

aattttttgc ttaaattcaa tcccccctcg ttcagtgtca actgtaatgg taggaaatta   3780

ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa aatcgtattt ccaggttaga   3840

cgttccgcag aatctagaat gcggtatgcg gtacattgtt cttcgaacgt aaaagttgcg   3900

ctccctgaga tattgtacat ttttgctttt acaagtacaa gtacatcgta caactatgta   3960

ctactgttga tgcatccaca acagtttgtt ttgttttttt ttgttttttt tttttctaat   4020

gattcattac cgctatgtat acctacttgt acttgtagta agccgggtta ttggcgttca   4080

attaatcata gacttatgaa tctgcacggt gtgcgctgcg agttactttt agcttatgca   4140

tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa cggatgctca atcgatttcg   4200

acagtaatta attaagtcat acacaagtca gctttcttcg agcctcatat aagtataagt   4260

agttcaacgt attagcactg tacccagcat ctccgtatcg agaaacacaa caacatgccc   4320

cattggacag atcatgcgga tacacaggtt gtgcagtatc atacatactc gatcagacag   4380

gtcgtctgac catcatacaa gctgaacaag cgctccatac ttgcacgctc tctatataca   4440

cagttaaatt acatatccat agtctaacct ctaacagtta atcttctggt aagcctccca   4500

gccagccttc tggtatcgct tggcctcctc aataggatct cggttctggc cgtacagacc   4560

tcggccgaca attatgatat ccgttccggt agacatgaca tcctcaacag ttcggtactg   4620

ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg ggggtcagaa taagccagtc   4680

ctcagagtcg cccttaggtc ggttctgggc aatgaagcca accacaaact cggggtcgga   4740

tcgggcaagc tcaatggtct gcttggagta ctcgccagtg gccagagagc ccttgcaaga   4800

cagctcggcc agcatgagca gacctctggc cagcttctcg ttgggagagg ggactaggaa   4860

ctccttgtac tgggagttct cgtagtcaga gacgtcctcc ttcttctgtt cagagacagt   4920

ttcctcggca ccagctcgca ggccagcaat gattccggtt ccgggtacac cgtgggcgtt   4980

ggtgatatcg gaccactcgg cgattcggtg acaccggtac tggtgcttga cagtgttgcc   5040

aatatctgcg aactttctgt cctcgaacag gaagaaaccg tgcttaagag caagttcctt   5100

gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg atgtcgatat gggttttgat   5160

catgcacaca taaggtccga ccttatcggc aagctcaatg agctccttgg tggtggtaac   5220

atccagagaa gcacacaggt tggttttctt ggctgccacg agcttgagca ctcgagcggc   5280

aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag ggcattttgg tggtgaagag   5340

gagactgaaa taaatttagt ctgcagaact ttttatcgga accttatctg gggcagtgaa   5400

gtatatgtta tggtaatagt tacgagttag ttgaacttat agatagactg gactatacgg   5460

ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg gcgtcgcctt tgccgacaaa   5520

aatgtgatca tgatgaaagc cagcaatgac gttgcagctg atattgttgt cggccaaccg   5580

cgccgaaaac gcagctgtca gacccacagc ctccaacgaa gaatgtatcg tcaaagtgat   5640

ccaagcacac tcatagttgg agtcgtactc caaaggcggc aatgacgagt cagacagata   5700

ctcgtcgaca ttgtaactag tcctggaggg tcttttttat ggataacctc catgtacgat   5760

gtatccaaga tctccacgta ctgtgttctg tttcctaagt aatacccaac aacctctcca   5820

acaaacactt gggaagatgc acttgtgctg agatgtcaag atgttagtac tgtactggat   5880

ggagagaata ttaataaata attgttaccc aactacatct tgtcgattga aagagatacc   5940

cctaagacag ataggatatc tgcaacccga ggaatgaacc ccccagcacc ggcacccttt   6000

ctattaacaa aatgccaact gaaatttgaa aagttcaact aaacttattt gacccacaaa   6060

aactcgtcaa aagtggcggc gaaagctggc aaatgatgac atccccttgg aactatgata   6120

tcccctcgga atcttcgtcc ccatttgcca catctacttg caacgccacg tctgcttact   6180

aagcaaccca aatctgcctc ggctcaaaat gtggggaagt tcacatgcat tcgctggtga   6240

atctgatctg acactacaac tacacaccag gtccaacatg agcgacaata cgacaatcaa   6300

aaagccgatc cgacccaaac cgatccggac ggaacgcctg ccttacgctg gggccgcaga   6360

aatcatccga gccaaccaga aagaccacta ctttgagtcc gtgcttgaac agcatctcgt   6420

cacgtttctg cagaaatgga agggagtacg atttatccac cagtacaagg aggagctgga   6480

gacggcgtcc aagtttgcat atctcggttt gtgtacgctt gtgggctcca agactctcgg   6540

agaagagtac accaatctca tgtacactat cagagaccga acagctctac cgggggtggt   6600

gagacggttt ggctacgtgc tttccaacac tctgtttcca tacctgtttg tgcgctacat   6660

gggcaagttg cgcgccaaac tgatgcgcga gtatccccat ctggtggagt acgacgaaga   6720

tgagcctgtg cccagcccgg aaacatggaa ggagcgggtc atcaagacgt ttgtgaacaa   6780

gtttgacaag ttcacggcgc tggaggggtt taccgcgatc cacttggcga ttttctacgt   6840

ctacggctcg tactaccagc tcagtaagcg gatctggggc atgcgttatg tatttggaca   6900

ccgactggac aagaatgagc ctcgaatcgg ttacgagatg ctcggtctgc tgattttcgc   6960

ccggtttgcc acgtcatttg tgcagacggg aagagagtac ctcggagcgc tgctggaaaa   7020

gagcgtggag aaagaggcag gggagaagga agatgaaaag gaagcggttg tgccgaaaaa   7080

gaagtcgtca attccgttca ttgaggatac agaaggggag acggaagaca agatcgatct   7140

ggaggaccct cgacagctca agttcattcc tgaggcgtcc agagcgtgca ctctgtgtct   7200

gtcatacatt agtgcgccgg catgtacgcc atgtggacac tttttctgtt gggactgtat   7260

ttccgaatgg gtgagagaga agcccgagtg tcccttgtgt cggcagggtg tgagagagca   7320

gaacttgttg cctatcagat aatgacgagg tctggatgga aggactagtc agcgagacac   7380

agagcatcag ggaccagaca cgaccaattc aatcgacaac actgtgctgc atagcagtgc   7440

acagaggtcc tgggcatgaa tatattttag cattggagat atgagtggta gagcgtatac   7500

agtattaatt gtggaggtat ctcgtcgcat tgatagagca atacagttac tgctgaagc    7559

 

<210>80

<211>8051

<212>DNA

<213>人工序列

<220>

<223>质粒pPEX10-2

<400>80

gtacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca     60

ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat    120

taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc ttccgcttcc    180

tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc agctcactca    240

aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca    300

aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg    360

ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg    420

acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt    480

ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt    540

tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc    600

tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt    660

gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt    720

agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc    780

tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa    840

agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt    900

tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct    960

acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catgagatta   1020

tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa atcaatctaa   1080

agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga ggcacctatc   1140

tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt gtagataact   1200

acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg agacccacgc   1260

tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga gcgcagaagt   1320

ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga agctagagta   1380

agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg catcgtggtg   1440

tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt   1500

acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc   1560

agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt   1620

actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc   1680

tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg ggataatacc   1740

gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa   1800

ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac   1860

tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa   1920

aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt   1980

tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa   2040

tgtatttaga aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct   2100

gacgcgccct gtagcggcgc attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc   2160

gctacacttg ccagcgccct agcgcccgct cctttcgctt tcttcccttc ctttctcgcc   2220

acgttcgccg gctttccccg tcaagctcta aatcgggggc tccctttagg gttccgattt   2280

agtgctttac ggcacctcga ccccaaaaaa cttgattagg gtgatggttc acgtagtggg   2340

ccatcgccct gatagacggt ttttcgccct ttgacgttgg agtccacgtt ctttaatagt   2400

ggactcttgt tccaaactgg aacaacactc aaccctatct cggtctattc ttttgattta   2460

taagggattt tgccgatttc ggcctattgg ttaaaaaatg agctgattta acaaaaattt   2520

aacgcgaatt ttaacaaaat attaacgctt acaatttcca ttcgccattc aggctgcgca   2580

actgttggga agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg   2640

gatgtgctgc aaggcgatta agttgggtaa cgccagggtt ttcccagtca cgacgttgta   2700

aaacgacggc cagtgaattg taatacgact cactataggg cgaattgggt accgggcccc   2760

ccctcgaggt cgatggtgtc gataagcttg atatcgaatt catgtcacac aaaccgatct   2820

tcgcctcaag gaaacctaat tctacatccg agagactgcc gagatccagt ctacactgat   2880

taattttcgg gccaataatt taaaaaaatc gtgttatata atattatatg tattatatat   2940

atacatcatg atgatactga cagtcatgtc ccattgctaa atagacagac tccatctgcc   3000

gcctccaact gatgttctca atatttaagg ggtcatctcg cattgtttaa taataaacag   3060

actccatcta ccgcctccaa atgatgttct caaaatatat tgtatgaact tatttttatt   3120

acttagtatt attagacaac ttacttgctt tatgaaaaac acttcctatt taggaaacaa   3180

tttataatgg cagttcgttc atttaacaat ttatgtagaa taaatgttat aaatgcgtat   3240

gggaaatctt aaatatggat agcataaatg atatctgcat tgcctaattc gaaatcaaca   3300

gcaacgaaaa aaatcccttg tacaacataa atagtcatcg agaaatatca actatcaaag   3360

aacagctatt cacacgttac tattgagatt attattggac gagaatcaca cactcaactg   3420

tctttctctc ttctagaaat acaggtacaa gtatgtacta ttctcattgt tcatacttct   3480

agtcatttca tcccacatat tccttggatt tctctccaat gaatgacatt ctatcttgca   3540

aattcaacaa ttataataag atataccaaa gtagcggtat agtggcaatc aaaaagcttc   3600

tctggtgtgc ttctcgtatt tatttttatt ctaatgatcc attaaaggta tatatttatt   3660

tcttgttata taatcctttt gtttattaca tgggctggat acataaaggt attttgattt   3720

aattttttgc ttaaattcaa tcccccctcg ttcagtgtca actgtaatgg taggaaatta   3780

ccatactttt gaagaagcaa aaaaaatgaa agaaaaaaaa aatcgtattt ccaggttaga   3840

cgttccgcag aatctagaat gcggtatgcg gtacattgtt cttcgaacgt aaaagttgcg   3900

ctccctgaga tattgtacat ttttgctttt acaagtacaa gtacatcgta caactatgta   3960

ctactgttga tgcatccaca acagtttgtt ttgttttttt ttgttttttt tttttctaat   4020

gattcattac cgctatgtat acctacttgt acttgtagta agccgggtta ttggcgttca   4080

attaatcata gacttatgaa tctgcacggt gtgcgctgcg agttactttt agcttatgca   4140

tgctacttgg gtgtaatatt gggatctgtt cggaaatcaa cggatgctca atcgatttcg   4200

acagtaatta attaagtcat acacaagtca gctttcttcg agcctcatat aagtataagt   4260

agttcaacgt attagcactg tacccagcat ctccgtatcg agaaacacaa caacatgccc   4320

cattggacag atcatgcgga tacacaggtt gtgcagtatc atacatactc gatcagacag   4380

gtcgtctgac catcatacaa gctgaacaag cgctccatac ttgcacgctc tctatataca   4440

cagttaaatt acatatccat agtctaacct ctaacagtta atcttctggt aagcctccca   4500

gccagccttc tggtatcgct tggcctcctc aataggatct cggttctggc cgtacagacc   4560

tcggccgaca attatgatat ccgttccggt agacatgaca tcctcaacag ttcggtactg   4620

ctgtccgaga gcgtctccct tgtcgtcaag acccaccccg ggggtcagaa taagccagtc   4680

ctcagagtcg cccttaggtc ggttctgggc aatgaagcca accacaaact cggggtcgga   4740

tcgggcaagc tcaatggtct gcttggagta ctcgccagtg gccagagagc ccttgcaaga   4800

cagctcggcc agcatgagca gacctctggc cagcttctcg ttgggagagg ggactaggaa   4860

ctccttgtac tgggagttct cgtagtcaga gacgtcctcc ttcttctgtt cagagacagt   4920

ttcctcggca ccagctcgca ggccagcaat gattccggtt ccgggtacac cgtgggcgtt   4980

ggtgatatcg gaccactcgg cgattcggtg acaccggtac tggtgcttga cagtgttgcc   5040

aatatctgcg aactttctgt cctcgaacag gaagaaaccg tgcttaagag caagttcctt   5100

gagggggagc acagtgccgg cgtaggtgaa gtcgtcaatg atgtcgatat gggttttgat   5160

catgcacaca taaggtccga ccttatcggc aagctcaatg agctccttgg tggtggtaac   5220

atccagagaa gcacacaggt tggttttctt ggctgccacg agcttgagca ctcgagcggc   5280

aaaggcggac ttgtggacgt tagctcgagc ttcgtaggag ggcattttgg tggtgaagag   5340

gagactgaaa taaatttagt ctgcagaact ttttatcgga accttatctg gggcagtgaa   5400

gtatatgtta tggtaatagt tacgagttag ttgaacttat agatagactg gactatacgg   5460

ctatcggtcc aaattagaaa gaacgtcaat ggctctctgg gcgtcgcctt tgccgacaaa   5520

aatgtgatca tgatgaaagc cagcaatgac gttgcagctg atattgttgt cggccaaccg   5580

cgccgaaaac gcagctgtca gacccacagc ctccaacgaa gaatgtatcg tcaaagtgat   5640

ccaagcacac tcatagttgg agtcgtactc caaaggcggc aatgacgagt cagacagata   5700

ctcgtcgacg tcttagcgtc atgtattctc aagcttagtc agagagaagg actatggagg   5760

agaaggggag aattgagaag ggtatttgaa gggactttga aggtcgcgtg gaagaggtac   5820

ttgaagaggt atttgaaggt cacgtggaag aggtatttga agatcacgtg gaagaagtac   5880

ttgttttaca gagaatatcg gggtgatttt gacagtggga ttgtctccca agtcctaatc   5940

gtttgacatg ggagcagtga aaagtcgggc taaaaaaggg aatatcggaa atcggaaaga   6000

cggaaagaat tactggactc atgtttagta gatctgagca cttcaaattt gaaaatatct   6060

cttcaaacag cagatcggtt ggtcgtggag gtaccatcaa gggtaaaatc aaggctatca   6120

tcaagggcca tatatcgcaa gtttggggga agataatatg ttcatagtga atcagggttg   6180

tggatttcct catctaacgg cattgtaact agtcctggag ggtctttttt atggataacc   6240

tccatgtacg atgtatccaa gatctccacg tactgtgttc tgtttcctaa gtaataccca   6300

acaacctctc caacaaacac ttgggaagat gcacttgtgc tgagatgtca agatgttagt   6360

actgtactgg atggagagaa tattaataaa taattgttac ccaactacat cttgtcgatt   6420

gaaagagata cccctaagac agataggata tctgcaaccc gaggaatgaa ccccccagca   6480

ccggcaccct ttctattaac aaaatgccaa ctgaaatttg aaaagttcaa ctaaacttat   6540

ttgacccaca aaaactcgtc aaaagtggcg gcgaaagctg gcaaatgatg acatcccctt   6600

ggaactatga tatcccctcg gaatcttcgt ccccatttgc cacatctact tgcaacgcca   6660

cgtctgctta ctaagcaacc caaatctgcc tcggctcaaa atgtggggaa gttcacatgc   6720

attcgctggt gaatctgatc tgacactaca actacacacc aggtccaaca tgagcgacaa   6780

tacgacaatc aaaaagccga tccgacccaa accgatccgg acggaacgcc tgccttacgc   6840

tggggccgca gaaatcatcc gagccaacca gaaagaccac tactttgagt ccgtgcttga   6900

acagcatctc gtcacgtttc tgcagaaatg gaagggagta cgatttatcc accagtacaa   6960

ggaggagctg gagacggcgt ccaagtttgc atatctcggt ttgtgtacgc ttgtgggctc   7020

caagactctc ggagaagagt acaccaatct catgtacact atcagagacc gaacagctct   7080

accgggggtg gtgagacggt ttggctacgt gctttccaac actctgtttc catacctgtt   7140

tgtgcgctac atgggcaagt tgcgcgccaa actgatgcgc gagtatcccc atctggtgga   7200

gtacgacgaa gatgagcctg tgcccagccc ggaaacatgg aaggagcggg tcatcaagac   7260

gtttgtgaac aagtttgaca agttcacggc gctggagggg tttaccgcga tccacttggc   7320

gattttctac gtctacggct cgtactacca gctcagtaag cggatctggg gcatgcgtta   7380

tgtatttgga caccgactgg acaagaatga gcctcgaatc ggttacgaga tgctcggtct   7440

gctgattttc gcccggtttg ccacgtcatt tgtgcagacg ggaagagagt acctcggagc   7500

gctgctggaa aagagcgtgg agaaagaggc aggggagaag gaagatgaaa aggaagcggt   7560

tgtgccgaaa aagaagtcgt caattccgtt cattgaggat acagaagggg agacggaaga   7620

caagatcgat ctggaggacc ctcgacagct caagttcatt cctgaggcgt ccagagcgtg   7680

cactctgtgt ctgtcataca ttagtgcgcc ggcatgtacg ccatgtggac actttttctg   7740

ttgggactgt atttccgaat gggtgagaga gaagcccgag tgtcccttgt gtcggcaggg   7800

tgtgagagag cagaacttgt tgcctatcag ataatgacga ggtctggatg gaaggactag   7860

tcagcgagac acagagcatc agggaccaga cacgaccaat tcaatcgaca acactgtgct   7920

gcatagcagt gcacagaggt cctgggcatg aatatatttt agcattggag atatgagtgg   7980

tagagcgtat acagtattaa ttgtggaggt atctcgtcgc attgatagag caatacagtt   8040

actgctgaag c                                                        8051

 

<210>81

<211>15877

<212>DNA

<213>人工序列

 

<220>

<223>质粒pZKL1-2SP98C

 

<400>81

aaatgatgtc gacgcagtag gatgtcctgc acgggtcttt ttgtggggtg tggagaaagg     60

ggtgcttgga tcgatggaag ccggtagaac cgggctgctt gtgcttggag atggaagccg    120

gtagaaccgg gctgcttggg gggatttggg gccgctgggc tccaaagagg ggtaggcatt    180

tcgttggggt tacgtaattg cggcatttgg gtcctgcgcg catgtcccat tggtcagaat    240

tagtccggat aggagactta tcagccaatc acagcgccgg atccacctgt aggttgggtt    300

gggtgggagc acccctccac agagtagagt caaacagcag cagcaacatg atagttgggg    360

gtgtgcgtgt taaaggaaaa aaaagaagct tgggttatat tcccgctcta tttagaggtt    420

gcgggataga cgccgacgga gggcaatggc gctatggaac cttgcggata tccatacgcc    480

gcggcggact gcgtccgaac cagctccagc agcgtttttt ccgggccatt gagccgactg    540

cgaccccgcc aacgtgtctt ggcccacgca ctcatgtcat gttggtgttg ggaggccact    600

ttttaagtag cacaaggcac ctagctcgca gcaaggtgtc cgaaccaaag aagcggctgc    660

agtggtgcaa acggggcgga aacggcggga aaaagccacg ggggcacgaa ttgaggcacg    720

ccctcgaatt tgagacgagt cacggcccca ttcgcccgcg caatggctcg ccaacgcccg    780

gtcttttgca ccacatcagg ttaccccaag ccaaaccttt gtgttaaaaa gcttaacata    840

ttataccgaa cgtaggtttg ggcgggcttg ctccgtctgt ccaaggcaac atttatataa    900

gggtctgcat cgccggctca attgaatctt ttttcttctt ctcttctcta tattcattct    960

tgaattaaac acacatcaac catgggcgta ttcattaaac aggagcagct tccggctctc   1020

aagaagtaca agtactccgc cgaggatcac tcgttcatct ccaacaacat tctgcgcccc   1080

ttctggcgac agtttgtcaa aatcttccct ctgtggatgg cccccaacat ggtgactctg   1140

ctgggcttct tctttgtcat tgtgaacttc atcaccatgc tcattgttga tcccacccac   1200

gaccgcgagc ctcccagatg ggtctacctc acctacgctc tgggtctgtt cctttaccag   1260

acatttgatg cctgtgacgg atcccatgcc cgacgaactg gccagagtgg accccttgga   1320

gagctgtttg accactgtgt cgacgccatg aatacctctc tgattctcac ggtggtggtg   1380

tccaccaccc atatgggata taacatgaag ctactgattg tgcagattgc cgctctcgga   1440

aacttctacc tgtcgacctg ggagacctac cataccggaa ctctgtacct ttctggcttc   1500

tctggtcctg ttgaaggtat cttgattctg gtggctcttt tcgtcctcac cttcttcact   1560

ggtcccaacg tgtacgctct gaccgtctac gaggctcttc ccgagtccat cacttcgctg   1620

ctgcctgcca gcttcctgga cgtcaccatc acccagatct acattggatt cggagtgctg   1680

ggcatggtgt tcaacatcta cggcgcctgc ggaaacgtga tcaagtacta caacaacaag   1740

ggcaagagcg ctctccccgc cattctcgga atcgccccct ttggcatctt ctacgtcggc   1800

gtctttgcct gggcccatgt tgctcctctg cttctctcca agtacgccat cgtctatctg   1860

tttgccattg gggctgcctt tgccatgcaa gtcggccaga tgattcttgc ccatctcgtg   1920

cttgctccct ttccccactg gaacgtgctg ctcttcttcc cctttgtggg actggcagtg   1980

cactacattg cacccgtgtt tggctgggac gccgatatcg tgtcggttaa cactctcttc   2040

acctgttttg gcgccaccct ctccatttac gccttctttg tgcttgagat catcgacgag   2100

atcaccaact acctcgatat ctggtgtctg cgaatcaagt accctcagga gaagaagacc   2160

gaataagcgg ccgcatggag cgtgtgttct gagtcgatgt tttctatgga gttgtgagtg   2220

ttagtagaca tgatgggttt atatatgatg aatgaataga tgtgattttg atttgcacga   2280

tggaattgag aactttgtaa acgtacatgg gaatgtatga atgtgggggt tttgtgactg   2340

gataactgac ggtcagtgga cgccgttgtt caaatatcca agagatgcga gaaactttgg   2400

gtcaagtgaa catgtcctct ctgttcaagt aaaccatcaa ctatgggtag tatatttagt   2460

aaggacaaga gttgagattc tttggagtcc tagaaacgta ttttcgcgtt ccaagatcaa   2520

attagtagag taatacgggc acgggaatcc attcatagtc tcaatcctgc aggtgagtta   2580

attaatcgag cttggcgtaa tcatggtcat agctgtttcc tgtgtgaaat tgttatccgc   2640

tcacaattcc acacaacgta cgatagttag tagacaacaa tcagaacatc tccctcctta   2700

tataatcaca caggccagaa cgcgctaaac taaagcgctt tggacactat gttacattgg   2760

cattgattga actgaaacca cagtctccct cgcctgaatc gagcaatgga tgttgtcgga   2820

agtcaacttc actagaagag cggttctatg ccttgtcaag atcatatcat aaactcactc   2880

tgtattaccc catctataga acacttgtta tgaatgggcg gaaacattcc gctatatgca   2940

cctttccaca ctaatgcaaa gatgtgcatc ttcaacgggt agtaagactg gttccgactt   3000

ccgttgcatg gagagcaatg acctcgataa tgcgaacatc ccccacatat acactcttac   3060

acaggccaat ataatctgtg catttactaa atatttaagt ctatgcacct gcttgatgaa   3120

aagcggcacg gatggtatca tctagtttcc gccaatccaa gaaccaactg tgttggcagt   3180

ggtgtagccc atggcacaca gaccaaagat gaaaatacag acatcggcgg ttcgagccgt   3240

ggtgcctcga gcaacaccct tgtaatgcaa aagaggaggg taaatgtaca ccagaggcac   3300

acatgcaaac gatccggtga gagcgacgaa ccgatcgaga tcgtcggcac ctccccatgc   3360

aacaaaggcg gtgacaaaca caaggaagaa ccggaaaatg ttcttctgcc acttgatggt   3420

agagttgtac ttgcctgatc gggtgaagag accattctcg atgattcgga tggcgcgcca   3480

gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc   3540

cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc   3600

tcactcaaag gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat   3660

gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt   3720

ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg   3780

aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc   3840

tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt   3900

ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa   3960

gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta   4020

tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa   4080

caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa   4140

ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt   4200

cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt   4260

ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat   4320

cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat   4380

gagattatca aaaaggatct tcacctagat ccttttaaat taaaaatgaa gttttaaatc   4440

aatctaaagt atatatgagt aaacttggtc tgacagttac caatgcttaa tcagtgaggc   4500

acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta   4560

gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga   4620

cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg   4680

cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc   4740

tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat   4800

cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag   4860

gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat   4920

cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa   4980

ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa   5040

gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga   5100

taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg   5160

gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc   5220

acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg   5280

aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact   5340

cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat   5400

atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt   5460

gccacctgat gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcagga   5520

aattgtaagc gttaatattt tgttaaaatt cgcgttaaat ttttgttaaa tcagctcatt   5580

ttttaaccaa taggccgaaa tcggcaaaat cccttataaa tcaaaagaat agaccgagat   5640

agggttgagt gttgttccag tttggaacaa gagtccacta ttaaagaacg tggactccaa   5700

cgtcaaaggg cgaaaaaccg tctatcaggg cgatggccca ctacgtgaac catcacccta   5760

atcaagtttt ttggggtcga ggtgccgtaa agcactaaat cggaacccta aagggagccc   5820

ccgatttaga gcttgacggg gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc   5880

gaaaggagcg ggcgctaggg cgctggcaag tgtagcggtc acgctgcgcg taaccaccac   5940

acccgccgcg cttaatgcgc cgctacaggg cgcgtccatt cgccattcag gctgcgcaac   6000

tgttgggaag ggcgatcggt gcgggcctct tcgctattac gccagctggc gaaaggggga   6060

tgtgctgcaa ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa   6120

acgacggcca gtgaattgta atacgactca ctatagggcg aattgggccc gacgtcgcat   6180

gcttagaagt gaggattaca agaagcctct ggatatcaat gatgaacgta ctcagcggct   6240

ggtcaagcat ttcgaccgtc gaatcgacga ggtgttcacc tttgacaagc gagggttccc   6300

aattgatcac gttctcgagt tgttcaaatc ttctctcaac atctctctgc atgaactatc   6360

tctgttgacg aacgtgtcac ccactgttcc tcgaacgccc ttctccgagt ttggtctgaa   6420

catcttcgat ctcaaactga cccccgcagt gatcaatagt gccatgccac tgccgatgcg   6480

gtgcgaacat ccctggaggg attctcggag ctctacacaa tgcagattct gtcgtcgagt   6540

actctctacc ttgctcgaat gacttattgt gctactactg cactcatgct tcgatcatgt   6600

gccctactgc accccaaatt tggtgatctg attgagacag agtaccctct tcagctgatt   6660

cagaagatca tcagcaacat gaatgatgtg gttgaccagg caggctgttg tagtcacgtc   6720

cttcacttca agttcattct tcatctgctt ctgttttact ttgacaggca aatgaagaca   6780

tggtacgact tgatggaggc caagaacgcc atttcacccc gagacaccga agtgcctgaa   6840

atcctggctg cccccattga taacatcgga aactacggta ttccggaaag tgtatataga   6900

acctttcccc agcttgtgtc tgtggatatg gatggtgtaa tccccttaat taactcacct   6960

gcaggattga gactatgaat ggattcccgt gcccgtatta ctctactaat ttgatcttgg   7020

aacgcgaaaa tacgtttcta ggactccaaa gaatctcaac tcttgtcctt actaaatata   7080

ctacccatag ttgatggttt acttgaacag agaggacatg ttcacttgac ccaaagtttc   7140

tcgcatctct tggatatttg aacaacggcg tccactgacc gtcagttatc cagtcacaaa   7200

acccccacat tcatacattc ccatgtacgt ttacaaagtt ctcaattcca tcgtgcaaat   7260

caaaatcaca tctattcatt catcatatat aaacccatca tgtctactaa cactcacaac   7320

tccatagaaa acatcgactc agaacacacg ctccatgcgg ccgcttaggc aacgggcttg   7380

atgacagcgg gaggagtgcc cacattgttt cggtttcgaa agaacaggac acccttgcca   7440

gctccctcgg caccagcgga gggttcaacc cactggcaca ttcgtgcaga tcggtacatg   7500

gctcgaatga atcctcgagg accgtcctgg acatcagctc gatagtgctt gcccatgata   7560

ggtttgatgg cctcggtagc ttcgtccgca ttgtagaagg gaatggaaga gacgtagtga   7620

tgcaggacgt gagtctcgat aatgccgtgg agcagatgac gtccaatgaa gcccatctct   7680

cggtcgatgg ttgcagcggc acctcgcaca aagttccact cgtcgttggt gtagtgggga   7740

agagtaggat ctgtgtgctg cagaaaggta atggcgacga gccagtggtt aacccacaag   7800

tagggaacga agtaccagat ggccatgttg tagaatccga acttctgaac gagaaagtac   7860

agagcggtgg ccataagacc aatgccaatg tcggagagca cgatgagctt ggcgtcgctg   7920

ttctcgtaca gaggagatcg gggatcgaaa tggttaactc caccgccaag accgttgtgc   7980

tttcccttgc ctcgaccctc tcgctgccgc tcatggtagt tgtgtccagt aacgttggta   8040

atgagatagt tgggccaacc gaccagttgc tgaagcacaa gcatgagcag ggtgaaagca   8100

ggagtttcct cggtaagatg ggcgagttcg tgggtcatct tgccgagtcg agtagcttgc   8160

tgctctcggg ttcgaggaac gaagaccatg tctcgctcca tgtttccagt ggccttgtga   8220

tgcttccggt gggagatttg ccagctgaag tagggaacaa gcagggaaga gtgaagcacc   8280

cagccagtaa tgtcgttgat gattcgggaa tcggagaaag caccatgtcc acactcgtgg   8340

gcaatgaccc acagtccagt accgaagagt ccctgaagaa cggtgtacac agcccacaga   8400

ccggctcgag caggagtgga gggaatgtac tcgggtgtca caaagttgta ccagatgctg   8460

aaagtggtag tcaggaggac aatgtctcga agaatgtagc cgtatccctt gagagcagat   8520

cgcttgaagc agtgcttggg aatagcgttg tagatgtcct tgatggtgaa gtcgggaact   8580

tcgaactggt tgccgtaggt atccagcatg acaccgtact cggacttggg cttggcaatg   8640

tccacctcgg acatggaaga cagcgatgta gaggaggccg agtgtctggg agaatcggag   8700

ggagagacgg cagcagactc cgagtcggtc acagtggtgg aagtgacggt tcgtcggagg   8760

gcagggttct gcttgggcag agccgaggtg gaggccatgg ccattgctgt agatatgtct   8820

tgtgtgtaag ggggttgggg tggttgtttg tgttcttgac ttttgtgtta gcaagggaag   8880

acgggcaaaa aagtgagtgt ggttgggagg gagagacgag ccttatatat aatgcttgtt   8940

tgtgtttgtg caagtggacg ccgaaacggg caggagccaa actaaacaag gcagacaatg   9000

cgagcttaat tggattgcct gatgggcagg ggttagggct cgatcaatgg gggtgcgaag   9060

tgacaaaatt gggaattagg ttcgcaagca aggctgacaa gactttggcc caaacatttg   9120

tacgcggtgg acaacaggag ccacccatcg tctgtcacgg gctagccggt cgtgcgtcct   9180

gtcaggctcc acctaggctc catgccactc catacaatcc cactagtgta ccgctaggcc   9240

gcttttagct cccatctaag acccccccaa aacctccact gtacagtgca ctgtactgtg   9300

tggcgatcaa gggcaaggga aaaaaggcgc aaacatgcac gcatggaatg acgtaggtaa   9360

ggcgttacta gactgaaaag tggcacattt cggcgtgcca aagggtccta ggtgcgtttc   9420

gcgagctggg cgccaggcca agccgctcca aaacgcctct ccgactccct ccagcggcct   9480

ccatatcccc atccctctcc acagcaatgt tgttaagcct tgcaaacgaa aaaatagaaa   9540

ggctaataag cttccaatat tgtggtgtac gctgcataac gcaacaatga gcgccaaaca   9600

acacacacac acagcacaca gcagcattaa ccacgatgaa cagcatgaat tcctttacct   9660

gcaggataac ttcgtataat gtatgctata cgaagttatg atctctctct tgagcttttc   9720

cataacaagt tcttctgcct ccaggaagtc catgggtggt ttgatcatgg ttttggtgta   9780

gtggtagtgc agtggtggta ttgtgactgg ggatgtagtt gagaataagt catacacaag   9840

tcagctttct tcgagcctca tataagtata agtagttcaa cgtattagca ctgtacccag   9900

catctccgta tcgagaaaca caacaacatg ccccattgga cagatcatgc ggatacacag   9960

gttgtgcagt atcatacata ctcgatcaga caggtcgtct gaccatcata caagctgaac  10020

aagcgctcca tacttgcacg ctctctatat acacagttaa attacatatc catagtctaa  10080

cctctaacag ttaatcttct ggtaagcctc ccagccagcc ttctggtatc gcttggcctc  10140

ctcaatagga tctcggttct ggccgtacag acctcggccg acaattatga tatccgttcc  10200

ggtagacatg acatcctcaa cagttcggta ctgctgtccg agagcgtctc ccttgtcgtc  10260

aagacccacc ccgggggtca gaataagcca gtcctcagag tcgcccttag gtcggttctg  10320

ggcaatgaag ccaaccacaa actcggggtc ggatcgggca agctcaatgg tctgcttgga  10380

gtactcgcca gtggccagag agcccttgca agacagctcg gccagcatga gcagacctct  10440

ggccagcttc tcgttgggag aggggactag gaactccttg tactgggagt tctcgtagtc  10500

agagacgtcc tccttcttct gttcagagac agtttcctcg gcaccagctc gcaggccagc  10560

aatgattccg gttccgggta caccgtgggc gttggtgata tcggaccact cggcgattcg  10620

gtgacaccgg tactggtgct tgacagtgtt gccaatatct gcgaactttc tgtcctcgaa  10680

caggaagaaa ccgtgcttaa gagcaagttc cttgaggggg agcacagtgc cggcgtaggt  10740

gaagtcgtca atgatgtcga tatgggtttt gatcatgcac acataaggtc cgaccttatc  10800

ggcaagctca atgagctcct tggtggtggt aacatccaga gaagcacaca ggttggtttt  10860

cttggctgcc acgagcttga gcactcgagc ggcaaaggcg gacttgtgga cgttagctcg  10920

agcttcgtag gagggcattt tggtggtgaa gaggagactg aaataaattt agtctgcaga  10980

actttttatc ggaaccttat ctggggcagt gaagtatatg ttatggtaat agttacgagt  11040

tagttgaact tatagataga ctggactata cggctatcgg tccaaattag aaagaacgtc  11100

aatggctctc tgggcgtcgc ctttgccgac aaaaatgtga tcatgatgaa agccagcaat  11160

gacgttgcag ctgatattgt tgtcggccaa ccgcgccgaa aacgcagctg tcagacccac  11220

agcctccaac gaagaatgta tcgtcaaagt gatccaagca cactcatagt tggagtcgta  11280

ctccaaaggc ggcaatgacg agtcagacag atactcgtcg acgcgataac ttcgtataat  11340

gtatgctata cgaagttatc gtacgatagt tagtagacaa caatcgatcg aggaagagga  11400

caagcggctg cttcttaagt ttgtgacatc agtatccaag gcaccattgc aaggattcaa  11460

ggctttgaac ccgtcatttg ccattcgtaa cgctggtaga caggttgatc ggttccctac  11520

ggcctccacc tgtgtcaatc ttctcaagct gcctgactat caggacattg atcaacttcg  11580

gaagaaactt ttgtatgcca ttcgatcaca tgctggtttc gatttgtctt agaggaacgc  11640

atatacagta atcatagaga ataaacgata ttcatttatt aaagtagata gttgaggtag  11700

aagttgtaaa gagtgataaa tagcggccgc tcactgaatc tttttggctc ccttgtgctt  11760

tcggacgatg taggtctgca cgtagaagtt gaggaacaga cacaggacag taccaacgta  11820

gaagtagttg aaaaaccagc caaacattct cattccatct tgtcggtagc agggaatgtt  11880

ccggtacttc cagacgatgt agaagccaac gttgaactga atgatctgca tagaagtaat  11940

cagggacttg ggcataggga acttgagctt gatcagtcgg gtccaatagt agccgtacat  12000

gatccagtga atgaagccgt tgagcagcac aaagatccaa acggcttcgt ttcggtagtt  12060

gtagaacagc cacatgtcca taggagctcc gagatggtga aagaactgca accaggtcag  12120

aggcttgccc atgaggggca gatagaagga gtcaatgtac tcgaggaact tgctgaggta  12180

gaacagctga gtggtgattc ggaagacatt gttgtcgaaa gccttctcgc agttgtcgga  12240

catgacacca atggtgtaca tggcgtaggc catagagagg aaggagccca gcgagtagat  12300

ggacatgagc aggttgtagt tggtgaacac aaacttcatt cgagactgac ccttgggtcc  12360

gagaggacca agggtgaact tcaggatgac gaaggcgatg gagaggtaca gcacctcgca  12420

gtgcgaggca tcagaccaga gctgagcata gtcgaccttg ggaagaacct cctggccaat  12480

ggagacgatt tcgttcacga cctccatggt tgtgaattag ggtggtgaga atggttggtt  12540

gtagggaaga atcaaaggcc ggtctcggga tccgtgggta tatatatata tatatatata  12600

tacgatcctt cgttacctcc ctgttctcaa aactgtggtt tttcgttttt cgttttttgc  12660

tttttttgat ttttttaggg ccaactaagc ttccagattt cgctaatcac ctttgtacta  12720

attacaagaa aggaagaagc tgattagagt tgggcttttt atgcaactgt gctactcctt  12780

atctctgata tgaaagtgta gacccaatca catcatgtca tttagagttg gtaatactgg  12840

gaggatagat aaggcacgaa aacgagccat agcagacatg ctgggtgtag ccaagcagaa  12900

gaaagtagat gggagccaat tgacgagcga gggagctacg ccaatccgac atacgacacg  12960

ctgagatcgt cttggccggg gggtacctac agatgtccaa gggtaagtgc ttgactgtaa  13020

ttgtatgtct gaggacaaat atgtagtcag ccgtataaag tcataccagg caccagtgcc  13080

atcatcgaac cactaactct ctatgataca tgcctccggt attattgtac catgcgtcgc  13140

tttgttacat acgtatcttg cctttttctc tcagaaactc cagactttgg ctattggtcg  13200

agataagccc ggaccatagt gagtctttca cactctgttt aaacaccact aaaaccccac  13260

aaaatatatc ttaccgaata tacagatcta ctatagagga acaattgccc cggagaagac  13320

ggccaggccg cctagatgac aaattcaaca actcacagct gactttctgc cattgccact  13380

aggggggggc ctttttatat ggccaagcca agctctccac gtcggttggg ctgcacccaa  13440

caataaatgg gtagggttgc accaacaaag ggatgggatg gggggtagaa gatacgagga  13500

taacggggct caatggcaca aataagaacg aatactgcca ttaagactcg tgatccagcg  13560

actgacacca ttgcatcatc taagggcctc aaaactacct cggaactgct gcgctgatct  13620

ggacaccaca gaggttccga gcactttagg ttgcaccaaa tgtcccacca ggtgcaggca  13680

gaaaacgctg gaacagcgtg tacagtttgt cttaacaaaa agtgagggcg ctgaggtcga  13740

gcagggtggt gtgacttgtt atagccttta gagctgcgaa agcgcgtatg gatttggctc  13800

atcaggccag attgagggtc tgtggacaca tgtcatgtta gtgtacttca atcgccccct  13860

ggatatagcc ccgacaatag gccgtggcct catttttttg ccttccgcac atttccattg  13920

ctcggtaccc acaccttgct tctcctgcac ttgccaacct taatactggt ttacattgac  13980

caacatctta caagcggggg gcttgtctag ggtatatata aacagtggct ctcccaatcg  14040

gttgccagtc tcttttttcc tttctttccc cacagattcg aaatctaaac tacacatcac  14100

acaatgcctg ttactgacgt ccttaagcga aagtccggtg tcatcgtcgg cgacgatgtc  14160

cgagccgtga gtatccacga caagatcagt gtcgagacga cgcgttttgt gtaatgacac  14220

aatccgaaag tcgctagcaa cacacactct ctacacaaac taacccagct ctccatggtg  14280

aaggcttctc gacaggctct gcccctcgtc atcgacggaa aggtgtacga cgtctccgct  14340

tgggtgaact tccaccctgg tggagctgaa atcattgaga actaccaggg acgagatgct  14400

actgacgcct tcatggttat gcactctcag gaagccttcg acaagctcaa gcgaatgccc  14460

aagatcaacc aggcttccga gctgcctccc caggctgccg tcaacgaagc tcaggaggat  14520

ttccgaaagc tccgagaaga gctgatcgcc actggcatgt ttgacgcctc tcccctctgg  14580

tactcgtaca agatcttgac caccctgggt cttggcgtgc ttgccttctt catgctggtc  14640

cagtaccacc tgtacttcat tggtgctctc gtgctcggta tgcactacca gcaaatggga  14700

tggctgtctc atgacatctg ccaccaccag accttcaaga accgaaactg gaataacgtc  14760

ctgggtctgg tctttggcaa cggactccag ggcttctccg tgacctggtg gaaggacaga  14820

cacaacgccc atcattctgc taccaacgtt cagggtcacg atcccgacat tgataacctg  14880

cctctgctcg cctggtccga ggacgatgtc actcgagctt ctcccatctc ccgaaagctc  14940

attcagttcc aacagtacta tttcctggtc atctgtattc tcctgcgatt catctggtgt  15000

ttccagtctg tgctgaccgt tcgatccctc aaggaccgag acaaccagtt ctaccgatct  15060

cagtacaaga aagaggccat tggactcgct ctgcactgga ctctcaagac cctgttccac  15120

ctcttcttta tgccctccat cctgacctcg atgctggtgt tctttgtttc cgagctcgtc  15180

ggtggcttcg gaattgccat cgtggtcttc atgaaccact accctctgga gaagatcggt  15240

gattccgtct gggacggaca tggcttctct gtgggtcaga tccatgagac catgaacatt  15300

cgacgaggca tcattactga ctggttcttt ggaggcctga actaccagat cgagcaccat  15360

ctctggccca ccctgcctcg acacaacctc actgccgttt cctaccaggt ggaacagctg  15420

tgccagaagc acaacctccc ctaccgaaac cctctgcccc atgaaggtct cgtcatcctg  15480

ctccgatacc tgtcccagtt cgctcgaatg gccgagaagc agcccggtgc caaggctcag  15540

taagcggccg catgagaaga taaatatata aatacattga gatattaaat gcgctagatt  15600

agagagcctc atactgctcg gagagaagcc aagacgagta ctcaaagggg attacaccat  15660

ccatatccac agacacaagc tggggaaagg ttctatatac actttccgga ataccgtagt  15720

ttccgatgtt atcaatgggg gcagccagga tttcaggcac ttcggtgtct cggggtgaaa  15780

tggcgttctt ggcctccatc aagtcgtacc atgtcttcat ttgcctgtca aagtaaaaca  15840

gaagcagatg aagaatgaac ttgaagtgaa ggaattt                           15877

 

<210>82

<211>1185

<212>DNA

<213>解脂耶氏酵母

 

<220>

<221>CDS

<222>(1)..(1185)

<223>二酰基甘油胆碱磷酸转移酶(YlCPT1)

 

<300>

<302>高二十碳五烯酸生产菌株

<310>WO 2006/052870

<311>2005-11-03

<312>2006-05-18

<313>(1)..(1185)

 

<300>

<302>高二十碳五烯酸生产菌株

<310>US 2006-0115881-A1

<311>2005-11-02

<312>2006-06-01

<313>(1)..(1185)

 

<400>82

atg ggc gta ttc att aaa cag gag cag ctt ccg gct ctc aag aag tac       48

Met Gly Val Phe Ile Lys Gln Glu Gln Leu Pro Ala Leu Lys Lys Tyr

1               5                   10                  15

aag tac tcc gcc gag gat cac tcg ttc atc tcc aac aac att ctg cgc       96

Lys Tyr Ser Ala Glu Asp His Ser Phe Ile Ser Asn Asn Ile Leu Arg

            20                  25                  30

ccc ttc tgg cga cag ttt gtc aaa atc ttc cct ctg tgg atg gcc ccc      144

Pro Phe Trp Arg Gln Phe Val Lys Ile Phe Pro Leu Trp Met Ala Pro

        35                  40                  45

aac atg gtg act ctg ttg ggc ttc ttc ttt gtc att gtg aac ttc atc      192

Asn Met Val Thr Leu Leu Gly Phe Phe Phe Val Ile Val Asn Phe Ile

    50                  55                  60

acc atg ctc att gtt gat ccc acc cac gac cgc gag cct ccc aga tgg      240

Thr Met Leu Ile Val Asp Pro Thr His Asp Arg Glu Pro Pro Arg Trp

65                  70                  75                  80

gtc tac ctc acc tac gct ctg ggt ctg ttc ctt tac cag aca ttt gat      288

Val Tyr Leu Thr Tyr Ala Leu Gly Leu Phe Leu Tyr Gln Thr Phe Asp

                85                  90                  95

gcc tgt gac gga tcc cat gcc cga cga act ggc cag agt gga ccc ctt      336

Ala Cys Asp Gly Ser His Ala Arg Arg Thr Gly Gln Ser Gly Pro Leu

            100                 105                 110

gga gag ctg ttt gac cac tgt gtc gac gcc atg aat acc tct ctg att      384

Gly Glu Leu Phe Asp His Cys Val Asp Ala Met Asn Thr Ser Leu Ile

        115                 120                 125

ctc acg gtg gtg gtg tcc acc acc cat atg gga tat aac atg aag ctg      432

Leu Thr Val Val Val Ser Thr Thr His Met Gly Tyr Asn Met Lys Leu

    130                 135                 140

ctg att gtg cag att gcc gct ctc gga aac ttc tac ctg tcg acc tgg      480

Leu Ile Val Gln Ile Ala Ala Leu Gly Asn Phe Tyr Leu Ser Thr Trp

145                 150                 155                 160

gag acc tac cat acc gga act ctg tac ctt tct ggc ttc tct ggt cct      528

Glu Thr Tyr His Thr Gly Thr Leu Tyr Leu Ser Gly Phe Ser Gly Pro

                165                 170                 175

gtt gaa ggt atc ttg att ctg gtg gct ctt ttc gtc ctc acc ttc ttc      576

Val Glu Gly Ile Leu Ile Leu Val Ala Leu Phe Val Leu Thr Phe Phe

            180                 185                 190

act ggt ccc aac gtg tac gct ctg acc gtc tac gag gct ctt ccc gaa      624

Thr Gly Pro Asn Val Tyr Ala Leu Thr Val Tyr Glu Ala Leu Pro Glu

        195                 200                 205

tcc atc act tcg ctg ctg cct gcc agc ttc ctg gac gtc acc atc acc      672

Ser Ile Thr Ser Leu Leu Pro Ala Ser Phe Leu Asp Val Thr Ile Thr

    210                 215                 220

cag atc tac att gga ttc gga gtg ctg ggc atg gtg ttc aac atc tac      720

Gln Ile Tyr Ile Gly Phe Gly Val Leu Gly Met Val Phe Asn Ile Tyr

225                 230                 235                 240

ggc gcc tgc gga aac gtg atc aag tac tac aac aac aag ggc aag agc      768

Gly Ala Cys Gly Asn Val Ile Lys Tyr Tyr Asn Asn Lys Gly Lys Ser

                245                 250                 255

gct ctc ccc gcc att ctc gga atc gcc ccc ttt ggc atc ttc tac gtc      816

Ala Leu Pro Ala Ile Leu Gly Ile Ala Pro Phe Gly Ile Phe Tyr Val

            260                 265                 270

ggc gtc ttt gcc tgg gcc cat gtt gct cct ctg ctt ctc tcc aag tac      864

Gly Val Phe Ala Trp Ala His Val Ala Pro Leu Leu Leu Ser Lys Tyr

        275                 280                 285

gcc atc gtc tat ctg ttt gcc att ggg gct gcc ttt gcc atg caa gtc      912

Ala Ile Val Tyr Leu Phe Ala Ile Gly Ala Ala Phe Ala Met Gln Val

    290                 295                 300

ggc cag atg att ctt gcc cat ctc gtg ctt gct ccc ttc ccc cac tgg      960

Gly Gln Met Ile Leu Ala His Leu Val Leu Ala Pro Phe Pro His Trp

305                 310                 315                 320

aac gtg ctg ctc ttc ttc ccc ttt gtg gga ctg gca gtg cac tac att     1008

Asn Val Leu Leu Phe Phe Pro Phe Val Gly Leu Ala Val His Tyr Ile

                325                 330                 335

gca ccc gtg ttt ggc tgg gac gcc gat atc gtg tcg gtt aac act ctc     1056

Ala Pro Val Phe Gly Trp Asp Ala Asp Ile Val Ser Val Asn Thr Leu

            340                 345                 350

ttc acc tgt ttt ggc gcc acc ctc tcc att tac gcc ttc ttt gtg ctt     1104

Phe Thr Cys Phe Gly Ala Thr Leu Ser Ile Tyr Ala Phe Phe Val Leu

        355                 360                 365

gag atc atc gac gag atc acc aac tac ctc gat atc tgg tgt ctg cga     1152

Glu Ile Ile Asp Glu Ile Thr Asn Tyr Leu Asp Ile Trp Cys Leu Arg

    370                 375                 380

atc aag tac cct cag gag aag aag act gag taa                         1185

Ile Lys Tyr Pro Gln Glu Lys Lys Thr Glu

385                 390

 

<210>83

<211>394

<212>PRT

<213>解脂耶氏酵母

 

<400>83

Met Gly Val Phe Ile Lys Gln Glu Gln Leu Pro Ala Leu Lys Lys Tyr

1               5                   10                  15

Lys Tyr Ser Ala Glu Asp His Ser Phe Ile Ser Asn Asn Ile Leu Arg

            20                  25                  30

Pro Phe Trp Arg Gln Phe Val Lys Ile Phe Pro Leu Trp Met Ala Pro

        35                  40                  45

Asn Met Val Thr Leu Leu Gly Phe Phe Phe Val Ile Val Asn Phe Ile

    50                  55                  60

Thr Met Leu Ile Val Asp Pro Thr His Asp Arg Glu Pro Pro Arg Trp

65                  70                  75                  80

Val Tyr Leu Thr Tyr Ala Leu Gly Leu Phe Leu Tyr Gln Thr Phe Asp

                85                  90                  95

Ala Cys Asp Gly Ser His Ala Arg Arg Thr Gly Gln Ser Gly Pro Leu

            100                 105                 110

Gly Glu Leu Phe Asp His Cys Val Asp Ala Met Asn Thr Ser Leu Ile

        115                 120                 125

Leu Thr Val Val Val Ser Thr Thr His Met Gly Tyr Asn Met Lys Leu

    130                 135                 140

Leu Ile Val Gln Ile Ala Ala Leu Gly Asn Phe Tyr Leu Ser Thr Trp

145                 150                 155                 160

Glu Thr Tyr His Thr Gly Thr Leu Tyr Leu Ser Gly Phe Ser Gly Pro

                165                 170                 175

Val Glu Gly Ile Leu Ile Leu Val Ala Leu Phe Val Leu Thr Phe Phe

            180                 185                 190

Thr Gly Pro Asn Val Tyr Ala Leu Thr ValTyr Glu Ala Leu Pro Glu

        195                 200                 205

Ser Ile Thr Ser Leu Leu Pro Ala Ser Phe Leu Asp Val Thr Ile Thr

    210                 215                 220

Gln Ile Tyr Ile Gly Phe Gly Val Leu Gly Met Val Phe Asn Ile Tyr

225                 230                 235                 240

Gly Ala Cys Gly Asn Val Ile Lys Tyr Tyr Asn Asn Lys Gly Lys Ser

                245                 250                 255

Ala Leu Pro Ala Ile Leu Gly Ile Ala Pro Phe Gly Ile Phe Tyr Val

            260                 265                 270

Gly Val Phe Ala Trp Ala His Val Ala Pro Leu Leu Leu Ser Lys Tyr

        275                 280                 285

Ala Ile Val Tyr Leu Phe Ala Ile Gly Ala Ala Phe Ala Met Gln Val

    290                 295                 300

Gly Gln Met Ile Leu Ala His Leu Val Leu Ala Pro Phe Pro His Trp

305                 310                 315                 320

Asn Val Leu Leu Phe Phe Pro Phe Val Gly Leu Ala Val His Tyr Ile

                325                 330                 335

Ala Pro Val Phe Gly Trp Asp Ala Asp Ile Val Ser Val Asn Thr Leu

            340                 345                 350

Phe Thr Cys Phe Gly Ala Thr Leu Ser Ile Tyr Ala Phe Phe Val Leu

        355                 360                 365

Glu Ile Ile Asp Glu Ile Thr Asn Tyr Leu Asp Ile Trp Cys Leu Arg

    370                 375                 380

Ile Lys Tyr Pro Gln Glu Lys Lys Thr Glu

385                 390

 

<210>84

<211>15812

<212>DNA

<213>人工序列

 

<220>

<223>质粒pZKL2-5U89Gc

 

<400>84

gtacgttatc atttgaacag tgaaaggcta cagtaacaga agcagttgta aacttcattc     60

cgttgattct gtactacagt accccactac gccgcttccg ctgacactgt tcaacccaaa    120

aactacatct gcgtgcgctg tgtaaggcta tcatcagata catactgtag attctgtaga    180

tgcgaacctg cttgtatcat atacatcccc ctccccctga cctgcacaag caagcaatgt    240

gacattgata ttgctgctta tctagtgccg aggatgtgaa agccgagact caaacatttc    300

ttttactctc ttgttcctga ccagacctgg cggagattac gccagtatga ttcttgcagg    360

tctgagacaa gcctggaaca gccaacattt atttttcgaa gcgagaaaca tgccacaccc    420

cggcacgttc agagatgcat atgatttgtt tttcgagtaa cagtaccccc cccccccccc    480

ccaatgaaac cagtattact cacaccatcc tcattcaaag cgttacactg attacgcgcc    540

catcaacgac agcatgaggg gactgctgat ctgatctaat caaatgacta caaaaatcgc    600

aataatgaag agcaaacgac aaaaaagaaa caggttaacc aatcccgctt caatgtctca    660

ccacaatcca gcactgtttc tcattacctc ctccctctaa tttcagagtt gcatcagggt    720

ccttgatggc gcgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc    780

gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc    840

ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata    900

acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg    960

cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct   1020

caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa   1080

gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc   1140

tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt   1200

aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg   1260

ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg   1320

cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct   1380

tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc   1440

tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg   1500

ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc   1560

aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt   1620

aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa   1680

aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat   1740

gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct   1800

gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg   1860

caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag   1920

ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta   1980

attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg   2040

ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg   2100

gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct   2160

ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta   2220

tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg   2280

gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc   2340

cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg   2400

gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga   2460

tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg   2520

ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat   2580

gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc   2640

tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca   2700

catttccccg aaaagtgcca cctgatgcgg tgtgaaatac cgcacagatg cgtaaggaga   2760

aaataccgca tcaggaaatt gtaagcgtta atattttgtt aaaattcgcg ttaaattttt   2820

gttaaatcag ctcatttttt aaccaatagg ccgaaatcgg caaaatccct tataaatcaa   2880

aagaatagac cgagataggg ttgagtgttg ttccagtttg gaacaagagt ccactattaa   2940

agaacgtgga ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac   3000

gtgaaccatc accctaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga   3060

accctaaagg gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa   3120

aggaagggaa gaaagcgaaa ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc   3180

tgcgcgtaac caccacaccc gccgcgctta atgcgccgct acagggcgcg tccattcgcc   3240

attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca   3300

gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca   3360

gtcacgacgt tgtaaaacga cggccagtga attgtaatac gactcactat agggcgaatt   3420

gggcccgacg tcgcatgctg gtttcgattt gtcttagagg aacgcatata cagtaatcat   3480

agagaataaa cgatattcat ttattaaagt agatagttga ggtagaagtt gtaaagagtg   3540

ataaatagct tagataccac agacaccctc ggtgacgaag tactgcagat ggtttccaat   3600

cacattgacc tgctggagca gagtgttacc ggcagagcac tgtttattgc tctggccctg   3660

gcacatgaca acgttggaga gaggagggtg gatcaggggc cagtcaataa agacctcacc   3720

agagcagtgc tggtaaccgt cccagaaggg cacttgaggg acgatatctc ctcggtgggt   3780

gattcggtag agctttcggt ctttggacac cttggagaca tcggggttct cctggccaaa   3840

gaagagttta tcgacccagt tagcaaagcc agcgttaccg acaatgggct gaccaagagt   3900

aacaacgagg ggatcgtggc cgttaacctt gaggttgatt ccgaacagaa gggctgcagc   3960

tcctccgaga gagtgaccgg tgacagcaat ctggtagtcg ggatactgct caatcacaga   4020

gtcgagcttg gggccgatct gattgtaggt gttgttgtag gactggatga agccattgtg   4080

gacaagacag tcatcacaag tagcagtaga agagatgtta gcagcaagat caaagttaat   4140

taactcacct gcaggattga gactatgaat ggattcccgt gcccgtatta ctctactaat   4200

ttgatcttgg aacgcgaaaa tacgtttcta ggactccaaa gaatctcaac tcttgtcctt   4260

actaaatata ctacccatag ttgatggttt acttgaacag agaggacatg ttcacttgac   4320

ccaaagtttc tcgcatctct tggatatttg aacaacggcg tccactgacc gtcagttatc   4380

cagtcacaaa acccccacat tcatacattc ccatgtacgt ttacaaagtt ctcaattcca   4440

tcgtgcaaat caaaatcaca tctattcatt catcatatat aaacccatca tgtctactaa   4500

cactcacaac tccatagaaa acatcgactc agaacacacg ctccatgcgg ccgcttagga   4560

atcctgagcg tccttgacac agtgaaccac accgactttg tgcatgtact tgagggtgga   4620

aatgatgttg cccacaatgg tagggtagaa gacgtaccga actccgtgtc gttcgcaaca   4680

ctctcggaca gcttgctgca cgaagggata gtgccaagac gacattcgag gaaagaggtg   4740

atgctcgatc tggaagttga gaccgccagt aaagaacatg gcaatgggtc caccgtaggt   4800

ggaagaggtc tccacctgag ctctgtacca gtcgatctga tcggcttcaa cgtccttctc   4860

ggagctcttg accttgcagt tcttgtcggg gattcgctcc gagccatcga agttgtgaga   4920

caagatgaaa aagaaggtga ggaaggcacc ggtagcagtg ggcaccagag gaatggtgat   4980

gagcagggag gttccagtga gataccaggg caagaaggcg gttcgaaaga tgaagaaagc   5040

tcgcataacg aatgcaaggg ttcggtaccg tcgcagaaag ccgttctctc gcatggctgt   5100

gacagactcg ggaatggtgt cgttgtgctg cattcggaag atgtagagag ggttgtacac   5160

cagcgaaacg ccgtaggctc caagcacgag gtacatgtac caggcctgga atcggtgaaa   5220

ccactttcga gcagtgttgg cagcagggta gttgtggaac acaaggaatg gttctgcgga   5280

ctcggcatcc aggtcgagac catgctgatt ggtgtaggtg tgatgtcgca tgatgtgaga   5340

ctgcagccag atccatctgg acgatccaat gacgtcgatg ccgtaggcaa agagagcgtt   5400

gacccagggc tttttgctga tggcaccatg agaggcatcg tgctgaatgg acaggccgat   5460

ctgcatgtgc atgaatccag tcaagagacc ccacagcacc attccggtag tagcccagtg   5520

ccactcgcaa aaggcggtga cagcaatgat gccaacggtt cgcagccaga atccaggtgt   5580

ggcataccag ttccgacctt tcatgacctc tcgcatagtt cgcttgacgt cctgtgcaaa   5640

gggagagtcg taggtgtaga caatgtcctt ggaggttcgg tcgtgcttgc ctcgcacgaa   5700

ctgttgaagc agcttcgagt tctcgggctt gacgtaaggg tgcatggagt agaacagagg   5760

agaagcatcg gaggcaccag aagcgaggat caagtcgcct ccgggatgga ccttggcaag   5820

accttccaga tcgtagagaa tgccgtcgat ggcaaccagg tcgggtcgct cgagcagctg   5880

ctcggtagta agggagagag ccatggttgt gaattagggt ggtgagaatg gttggttgta   5940

gggaagaatc aaaggccggt ctcgggatcc gtgggtatat atatatatat atatatatac   6000

gatccttcgt tacctccctg ttctcaaaac tgtggttttt cgtttttcgt tttttgcttt   6060

ttttgatttt tttagggcca actaagcttc cagatttcgc taatcacctt tgtactaatt   6120

acaagaaagg aagaagctga ttagagttgg gctttttatg caactgtgct actccttatc   6180

tctgatatga aagtgtagac ccaatcacat catgtcattt agagttggta atactgggag   6240

gatagataag gcacgaaaac gagccatagc agacatgctg ggtgtagcca agcagaagaa   6300

agtagatggg agccaattga cgagcgaggg agctacgcca atccgacata cgacacgctg   6360

agatcgtctt ggccgggggg tacctacaga tgtccaaggg taagtgcttg actgtaattg   6420

tatgtctgag gacaaatatg tagtcagccg tataaagtca taccaggcac cagtgccatc   6480

atcgaaccac taactctcta tgatacatgc ctccggtatt attgtaccat gcgtcgcttt   6540

gttacatacg tatcttgcct ttttctctca gaaactccag aattctctct cttgagcttt   6600

tccataacaa gttcttctgc ctccaggaag tccatgggtg gtttgatcat ggttttggtg   6660

tagtggtagt gcagtggtgg tattgtgact ggggatgtag ttgagaataa gtcatacaca   6720

agtcagcttt cttcgagcct catataagta taagtagttc aacgtattag cactgtaccc   6780

agcatctccg tatcgagaaa cacaacaaca tgccccattg gacagatcat gcggatacac   6840

aggttgtgca gtatcataca tactcgatca gacaggtcgt ctgaccatca tacaagctga   6900

acaagcgctc catacttgca cgctctctat atacacagtt aaattacata tccatagtct   6960

aacctctaac agttaatctt ctggtaagcc tcccagccag ccttctggta tcgcttggcc   7020

tcctcaatag gatctcggtt ctggccgtac agacctcggc cgacaattat gatatccgtt   7080

ccggtagaca tgacatcctc aacagttcgg tactgctgtc cgagagcgtc tcccttgtcg   7140

tcaagaccca ccccgggggt cagaataagc cagtcctcag agtcgccctt aggtcggttc   7200

tgggcaatga agccaaccac aaactcgggg tcggatcggg caagctcaat ggtctgcttg   7260

gagtactcgc cagtggccag agagcccttg caagacagct cggccagcat gagcagacct   7320

ctggccagct tctcgttggg agaggggact aggaactcct tgtactggga gttctcgtag   7380

tcagagacgt cctccttctt ctgttcagag acagtttcct cggcaccagc tcgcaggcca   7440

gcaatgattc cggttccggg tacaccgtgg gcgttggtga tatcggacca ctcggcgatt   7500

cggtgacacc ggtactggtg cttgacagtg ttgccaatat ctgcgaactt tctgtcctcg   7560

aacaggaaga aaccgtgctt aagagcaagt tccttgaggg ggagcacagt gccggcgtag   7620

gtgaagtcgt caatgatgtc gatatgggtt ttgatcatgc acacataagg tccgacctta   7680

tcggcaagct caatgagctc cttggtggtg gtaacatcca gagaagcaca caggttggtt   7740

ttcttggctg ccacgagctt gagcactcga gcggcaaagg cggacttgtg gacgttagct   7800

cgagcttcgt aggagggcat tttggtggtg aagaggagac tgaaataaat ttagtctgca   7860

gaacttttta tcggaacctt atctggggca gtgaagtata tgttatggta atagttacga   7920

gttagttgaa cttatagata gactggacta tacggctatc ggtccaaatt agaaagaacg   7980

tcaatggctc tctgggcgtc gcctttgccg acaaaaatgt gatcatgatg aaagccagca   8040

atgacgttgc agctgatatt gttgtcggcc aaccgcgccg aaaacgcagc tgtcagaccc   8100

acagcctcca acgaagaatg tatcgtcaaa gtgatccaag cacactcata gttggagtcg   8160

tactccaaag gcggcaatga cgagtcagac agatactcgt cgaccttttc cttgggaacc   8220

accaccgtca gcccttctga ctcacgtatt gtagccaccg acacaggcaa cagtccgtgg   8280

atagcagaat atgtcttgtc ggtccatttc tcaccaactt taggcgtcaa gtgaatgttg   8340

cagaagaagt atgtgccttc attgagaatc ggtgttgctg atttcaataa agtcttgaga   8400

tcagtttggc cagtcatgtt gtggggggta attggattga gttatcgcct acagtctgta   8460

caggtatact cgctgcccac tttatacttt ttgattccgc tgcacttgaa gcaatgtcgt   8520

ttaccaaaag tgagaatgct ccacagaaca caccccaggg tatggttgag caaaaaataa   8580

acactccgat acggggaatc gaaccccggt ctccacggtt ctcaagaagt attcttgatg   8640

agagcgtatc gatcgaggaa gaggacaagc ggctgcttct taagtttgtg acatcagtat   8700

ccaaggcacc attgcaagga ttcaaggctt tgaacccgtc atttgccatt cgtaacgctg   8760

gtagacaggt tgatcggttc cctacggcct ccacctgtgt caatcttctc aagctgcctg   8820

actatcagga cattgatcaa cttcggaaga aacttttgta tgccattcga tcacatgctg   8880

gtttcgattt gtcttagagg aacgcatata cagtaatcat agagaataaa cgatattcat   8940

ttattaaagt agatagttga ggtagaagtt gtaaagagtg ataaatagcg gccgctcact   9000

gaatcttttt ggctcccttg tgctttcgga cgatgtaggt ctgcacgtag aagttgagga   9060

acagacacag gacagtacca acgtagaagt agttgaaaaa ccagccaaac attctcattc   9120

catcttgtcg gtagcaggga atgttccggt acttccagac gatgtagaag ccaacgttga   9180

actgaatgat ctgcatagaa gtaatcaggg acttgggcat agggaacttg agcttgatca   9240

gtcgggtcca atagtagccg tacatgatcc agtgaatgaa gccgttgagc agcacaaaga   9300

tccaaacggc ttcgtttcgg tagttgtaga acagccacat gtccatagga gctccgagat   9360

ggtgaaagaa ctgcaaccag gtcagaggct tgcccatgag gggcagatag aaggagtcaa   9420

tgtactcgag gaacttgctg aggtagaaca gctgagtggt gattcggaag acattgttgt   9480

cgaaagcctt ctcgcagttg tcggacatga caccaatggt gtacatggcg taggccatag   9540

agaggaagga gcccagcgag tagatggaca tgagcaggtt gtagttggtg aacacaaact   9600

tcattcgaga ctgacccttg ggtccgagag gaccaagggt gaacttcagg atgacgaagg   9660

cgatggagag gtacagcacc tcgcagtgcg aggcatcaga ccagagctga gcatagtcga   9720

ccttgggaag aacctcctgg ccaatggaga cgatttcgtt cacgacctcc atggttgatg   9780

tgtgtttaat tcaagaatga atatagagaa gagaagaaga aaaaagattc aattgagccg   9840

gcgatgcaga cccttatata aatgttgcct tggacagacg gagcaagccc gcccaaacct   9900

acgttcggta taatatgtta agctttttaa cacaaaggtt tggcttgggg taacctgatg   9960

tggtgcaaaa gaccgggcgt tggcgagcca ttgcgcgggc gaatggggcc gtgactcgtc  10020

tcaaattcga gggcgtgcct caattcgtgc ccccgtggct ttttcccgcc gtttccgccc  10080

cgtttgcacc actgcagccg cttctttggt tcggacacct tgctgcgagc taggtgcctt  10140

gtgctactta aaaagtggcc tcccaacacc aacatgacat gagtgcgtgg gccaagacac  10200

gttggcgggg tcgcagtcgg ctcaatggcc cggaaaaaac gctgctggag ctggttcgga  10260

cgcagtccgc cgcggcgtat ggatatccgc aaggttccat agcgccattg ccctccgtcg  10320

gcgtctatcc cgcaacctct aaatagagcg ggaatataac ccaagcttct tttttttcct  10380

ttaacacgca cacccccaac tatcatgttg ctgctgctgt ttgactctac tctgtggagg  10440

ggtgctccca cccaacccaa cctacaggtg gatccggcgc tgtgattggc tgataagtct  10500

cctatccgga ctaattctga ccaatgggac atgcgcgcag gacccaaatg ccgcaattac  10560

gtaaccccaa cgaaatgcct acccctcttt ggagcccagc ggccccaaat ccccccaagc  10620

agcccggttc taccggcttc catctccaag cacaagcagc ccggttctac cggcttccat  10680

ctccaagcac ccctttctcc acaccccaca aaaagacccg tgcaggacat cctactgcgt  10740

gtttaaacac cactaaaacc ccacaaaata tatcttaccg aatatacaga tctactatag  10800

aggaacaatt gccccggaga agacggccag gccgcctaga tgacaaattc aacaactcac  10860

agctgacttt ctgccattgc cactaggggg gggccttttt atatggccaa gccaagctct  10920

ccacgtcggt tgggctgcac ccaacaataa atgggtaggg ttgcaccaac aaagggatgg  10980

gatggggggt agaagatacg aggataacgg ggctcaatgg cacaaataag aacgaatact  11040

gccattaaga ctcgtgatcc agcgactgac accattgcat catctaaggg cctcaaaact  11100

acctcggaac tgctgcgctg atctggacac cacagaggtt ccgagcactt taggttgcac  11160

caaatgtccc accaggtgca ggcagaaaac gctggaacag cgtgtacagt ttgtcttaac  11220

aaaaagtgag ggcgctgagg tcgagcaggg tggtgtgact tgttatagcc tttagagctg  11280

cgaaagcgcg tatggatttg gctcatcagg ccagattgag ggtctgtgga cacatgtcat  11340

gttagtgtac ttcaatcgcc ccctggatat agccccgaca ataggccgtg gcctcatttt  11400

tttgccttcc gcacatttcc attgctcggt acccacacct tgcttctcct gcacttgcca  11460

accttaatac tggtttacat tgaccaacat cttacaagcg gggggcttgt ctagggtata  11520

tataaacagt ggctctccca atcggttgcc agtctctttt ttcctttctt tccccacaga  11580

ttcgaaatct aaactacaca tcacacaatg cctgttactg acgtccttaa gcgaaagtcc  11640

ggtgtcatcg tcggcgacga tgtccgagcc gtgagtatcc acgacaagat cagtgtcgag  11700

acgacgcgtt ttgtgtaatg acacaatccg aaagtcgcta gcaacacaca ctctctacac  11760

aaactaaccc agctctccat ggtgaaggct tctcgacagg ctctgcccct cgtcatcgac  11820

ggaaaggtgt acgacgtctc cgcttgggtg aacttccacc ctggtggagc tgaaatcatt  11880

gagaactacc agggacgaga tgctactgac gccttcatgg ttatgcactc tcaggaagcc  11940

ttcgacaagc tcaagcgaat gcccaagatc aaccaggctt ccgagctgcc tccccaggct  12000

gccgtcaacg aagctcagga ggatttccga aagctccgag aagagctgat cgccactggc  12060

atgtttgacg cctctcccct ctggtactcg tacaagatct tgaccaccct gggtcttggc  12120

gtgcttgcct tcttcatgct ggtccagtac cacctgtact tcattggtgc tctcgtgctc  12180

ggtatgcact accagcaaat gggatggctg tctcatgaca tctgccacca ccagaccttc  12240

aagaaccgaa actggaataa cgtcctgggt ctggtctttg gcaacggact ccagggcttc  12300

tccgtgacct ggtggaagga cagacacaac gcccatcatt ctgctaccaa cgttcagggt  12360

cacgatcccg acattgataa cctgcctctg ctcgcctggt ccgaggacga tgtcactcga  12420

gcttctccca tctcccgaaa gctcattcag ttccaacagt actatttcct ggtcatctgt  12480

attctcctgc gattcatctg gtgtttccag tctgtgctga ccgttcgatc cctcaaggac  12540

cgagacaacc agttctaccg atctcagtac aagaaagagg ccattggact cgctctgcac  12600

tggactctca agaccctgtt ccacctcttc tttatgccct ccatcctgac ctcgatgctg  12660

gtgttctttg tttccgagct cgtcggtggc ttcggaattg ccatcgtggt cttcatgaac  12720

cactaccctc tggagaagat cggtgattcc gtctgggacg gacatggctt ctctgtgggt  12780

cagatccatg agaccatgaa cattcgacga ggcatcatta ctgactggtt ctttggaggc  12840

ctgaactacc agatcgagca ccatctctgg cccaccctgc ctcgacacaa cctcactgcc  12900

gtttcctacc aggtggaaca gctgtgccag aagcacaacc tcccctaccg aaaccctctg  12960

ccccatgaag gtctcgtcat cctgctccga tacctgtccc agttcgctcg aatggccgag  13020

aagcagcccg gtgccaaggc tcagtaagcg gccgcatgag aagataaata tataaataca  13080

ttgagatatt aaatgcgcta gattagagag cctcatactg ctcggagaga agccaagacg  13140

agtactcaaa ggggattaca ccatccatat ccacagacac aagctgggga aaggttctat  13200

atacactttc cggaataccg tagtttccga tgttatcaat gggggcagcc aggatttcag  13260

gcacttcggt gtctcggggt gaaatggcgt tcttggcctc catcaagtcg taccatgtct  13320

tcatttgcct gtcaaagtaa aacagaagca gatgaagaat gaacttgaag tgaaggaatt  13380

taaatagttg gagcaaggga gaaatgtaga gtgtgaaaga ctcactatgg tccgggctta  13440

tctcgaccaa tagccaaagt ctggagtttc tgagagaaaa aggcaagata cgtatgtaac  13500

aaagcgacgc atggtacaat aataccggag gcatgtatca tagagagtta gtggttcgat  13560

gatggcactg gtgcctggta tgactttata cggctgacta catatttgtc ctcagacata  13620

caattacagt caagcactta cccttggaca tctgtaggta ccccccggcc aagacgatct  13680

cagcgtgtcg tatgtcggat tggcgtagct ccctcgctcg tcaattggct cccatctact  13740

ttcttctgct tggctacacc cagcatgtct gctatggctc gttttcgtgc cttatctatc  13800

ctcccagtat taccaactct aaatgacatg atgtgattgg gtctacactt tcatatcaga  13860

gataaggagt agcacagttg cataaaaagc ccaactctaa tcagcttctt cctttcttgt  13920

aattagtaca aaggtgatta gcgaaatctg gaagcttagt tggccctaaa aaaatcaaaa  13980

aaagcaaaaa acgaaaaacg aaaaaccaca gttttgagaa cagggaggta acgaaggatc  14040

gtatatatat atatatatat atatacccac ggatcccgag accggccttt gattcttccc  14100

tacaaccaac cattctcacc accctaattc acaaccatgg gcgtattcat taaacaggag  14160

cagcttccgg ctctcaagaa gtacaagtac tccgccgagg atcactcgtt catctccaac  14220

aacattctgc gccccttctg gcgacagttt gtcaaaatct tccctctgtg gatggccccc  14280

aacatggtga ctctgctggg cttcttcttt gtcattgtga acttcatcac catgctcatt  14340

gttgatccca cccacgaccg cgagcctccc agatgggtct acctcaccta cgctctgggt  14400

ctgttccttt accagacatt tgatgcctgt gacggatccc atgcccgacg aactggccag  14460

agtggacccc ttggagagct gtttgaccac tgtgtcgacg ccatgaatac ctctctgatt  14520

ctcacggtgg tggtgtccac cacccatatg ggatataaca tgaagctact gattgtgcag  14580

attgccgctc tcggaaactt ctacctgtcg acctgggaga cctaccatac cggaactctg  14640

tacctttctg gcttctctgg tcctgttgaa ggtatcttga ttctggtggc tcttttcgtc  14700

ctcaccttct tcactggtcc caacgtgtac gctctgaccg tctacgaggc tcttcccgag  14760

tccatcactt cgctgctgcc tgccagcttc ctggacgtca ccatcaccca gatctacatt  14820

ggattcggag tgctgggcat ggtgttcaac atctacggcg cctgcggaaa cgtgatcaag  14880

tactacaaca acaagggcaa gagcgctctc cccgccattc tcggaatcgc cccctttggc  14940

atcttctacg tcggcgtctt tgcctgggcc catgttgctc ctctgcttct ctccaagtac  15000

gccatcgtct atctgtttgc cattggggct gcctttgcca tgcaagtcgg ccagatgatt  15060

cttgcccatc tcgtgcttgc tccctttccc cactggaacg tgctgctctt cttccccttt  15120

gtgggactgg cagtgcacta cattgcaccc gtgtttggct gggacgccga tatcgtgtcg  15180

gttaacactc tcttcacctg ttttggcgcc accctctcca tttacgcctt ctttgtgctt  15240

gagatcatcg acgagatcac caactacctc gatatctggt gtctgcgaat caagtaccct  15300

caggagaaga agaccgaata agcggccgca tggagcgtgt gttctgagtc gatgttttct  15360

atggagttgt gagtgttagt agacatgatg ggtttatata tgatgaatga atagatgtga  15420

ttttgatttg cacgatggaa ttgagaactt tgtaaacgta catgggaatg tatgaatgtg  15480

ggggttttgt gactggataa ctgacggtca gtggacgccg ttgttcaaat atccaagaga  15540

tgcgagaaac tttgggtcaa gtgaacatgt cctctctgtt caagtaaacc atcaactatg  15600

ggtagtatat ttagtaagga caagagttga gattctttgg agtcctagaa acgtattttc  15660

gcgttccaag atcaaattag tagagtaata cgggcacggg aatccattca tagtctcaat  15720

cctgcaggtg agttaattaa tcgagcttgg cgtaatcatg gtcatagctg tttcctgtgt  15780

gaaattgtta tccgctcaca attccacaca ac                                15812

 

<210>85

<211>4313

<212>DNA

<213>人工序列

 

<220>

<223>质粒pZKUM

 

<400>85

taatcgagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc     60

acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga    120

gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg    180

tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg    240

cgctcttccg cttcctcgct cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg    300

gtatcagctc actcaaaggc ggtaatacgg ttatccacag aatcagggga taacgcagga    360

aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg    420

gcgtttttcc ataggctccg cccccctgac gagcatcaca aaaatcgacg ctcaagtcag    480

aggtggcgaa acccgacagg actataaaga taccaggcgt ttccccctgg aagctccctc    540

gtgcgctctc ctgttccgac cctgccgctt accggatacc tgtccgcctt tctcccttcg    600

ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt    660

cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc    720

ggtaactatc gtcttgagtc caacccggta agacacgact tatcgccact ggcagcagcc    780

actggtaaca ggattagcag agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg    840

tggcctaact acggctacac tagaaggaca gtatttggta tctgcgctct gctgaagcca    900

gttaccttcg gaaaaagagt tggtagctct tgatccggca aacaaaccac cgctggtagc    960

ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat   1020

cctttgatct tttctacggg gtctgacgct cagtggaacg aaaactcacg ttaagggatt   1080

ttggtcatga gattatcaaa aaggatcttc acctagatcc ttttaaatta aaaatgaagt   1140

tttaaatcaa tctaaagtat atatgagtaa acttggtctg acagttacca atgcttaatc   1200

agtgaggcac ctatctcagc gatctgtcta tttcgttcat ccatagttgc ctgactcccc   1260

gtcgtgtaga taactacgat acgggagggc ttaccatctg gccccagtgc tgcaatgata   1320

ccgcgagacc cacgctcacc ggctccagat ttatcagcaa taaaccagcc agccggaagg   1380

gccgagcgca gaagtggtcc tgcaacttta tccgcctcca tccagtctat taattgttgc   1440

cgggaagcta gagtaagtag ttcgccagtt aatagtttgc gcaacgttgt tgccattgct   1500

acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt cattcagctc cggttcccaa   1560

cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa aagcggttag ctccttcggt   1620

cctccgatcg ttgtcagaag taagttggcc gcagtgttat cactcatggt tatggcagca   1680

ctgcataatt ctcttactgt catgccatcc gtaagatgct tttctgtgac tggtgagtac   1740

tcaaccaagt cattctgaga atagtgtatg cggcgaccga gttgctcttg cccggcgtca   1800

atacgggata ataccgcgcc acatagcaga actttaaaag tgctcatcat tggaaaacgt   1860

tcttcggggc gaaaactctc aaggatctta ccgctgttga gatccagttc gatgtaaccc   1920

actcgtgcac ccaactgatc ttcagcatct tttactttca ccagcgtttc tgggtgagca   1980

aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg cgacacggaa atgttgaata   2040

ctcatactct tcctttttca atattattga agcatttatc agggttattg tctcatgagc   2100

ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc   2160

cgaaaagtgc cacctgacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt   2220

acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc   2280

ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct   2340

ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga ttagggtgat   2400

ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc   2460

acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcggtc   2520

tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg   2580

atttaacaaa aatttaacgc gaattttaac aaaatattaa cgcttacaat ttccattcgc   2640

cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc   2700

agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc   2760

agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat   2820

tgggtaccgg gccccccctc gaggtcgacg agtatctgtc tgactcgtca ttgccgcctt   2880

tggagtacga ctccaactat gagtgtgctt ggatcacttt gacgatacat tcttcgttgg   2940

aggctgtggg tctgacagct gcgttttcgg cgcggttggc cgacaacaat atcagctgca   3000

acgtcattgc tggctttcat catgatcaca tttttgtcgg caaaggcgac gcccagagag   3060

ccattgacgt tctttctaat ttggaccgat agccgtatag tccagtctat ctataagttc   3120

aactaactcg taactattac cataacatat acttcactgc cccagataag gttccgataa   3180

aaagttctgc agactaaatt tatttcagtc tcctcttcac caccaaaatg ccctcctacg   3240

aagctcgagt gctcaagctc gtggcagcca agaaaaccaa cctgtgtgct tctctggatg   3300

ttaccaccac caaggagctc attgagcttg ccgataaggt cggaccttat gtgtgcatga   3360

tcaaaaccca tatcgacatc attgacgact tcacctacgc cggcactgtg ctccccctca   3420

aggaacttgc tcttaagcac ggtttcttcc tgttcgagga cagaaagttc gcagatattg   3480

gcaacactgt caagcaccag taccggtgtc accgaatcgc cgagtggtcc gatatcacca   3540

acgcccacgg tgtacccgga accggaatcg attgctggcc tgcgagctgg tgcgtacgag   3600

gaaactgtct ctgaacagaa gaaggaggac gtctctgact acgagaactc ccagtacaag   3660

gagttcctag tcccctctcc caacgagaag ctggccagag gtctgctcat gctggccgag   3720

ctgtcttgca agggctctct ggccactggc gagtactcca agcagaccat tgagcttgcc   3780

cgatccgacc ccgagtttgt ggttggcttc attgcccaga accgacctaa gggcgactct   3840

gaggactggc ttattctgac ccccggggtg ggtcttgacg acaagggaga cgctctcgga   3900

cagcagtacc gaactgttga ggatgtcatg tctaccggaa cggatatcat aattgtcggc   3960

cgaggtctgt acggccagaa ccgagatcct attgaggagg ccaagcgata ccagaaggct   4020

ggctgggagg cttaccagaa gattaactgt tagaggttag actatggata tgtaatttaa   4080

ctgtgtatat agagagcgtg caagtatgga gcgcttgttc agcttgtatg atggtcagac   4140

gacctgtctg atcgagtatg tatgatactg cacaacctgt gtatccgcat gatctgtcca   4200

atggggcatg ttgttgtgtt tctcgatacg gagatgctgg gtacagtgct aatacgttga   4260

actacttata cttatatgag gctcgaagaa agctgacttg tgtatgactt aat          4313

 

<210>86

<211>1459

<212>DNA

<213>人工序列

 

<220>

<223>合成突变型Ura3基因,包含对耶氏酵母属Ura3编码区(GenBank保藏号AJ306421)的一个从+21至+53的33bp的缺失,一个在+376的1bp缺失,和一个从+400至403的3bp缺失

 

<400>86

gagtatctgt ctgactcgtc attgccgcct ttggagtacg actccaacta tgagtgtgct     60

tggatcactt tgacgataca ttcttcgttg gaggctgtgg gtctgacagc tgcgttttcg    120

gcgcggttgg ccgacaacaa tatcagctgc aacgtcattg ctggctttca tcatgatcac    180

atttttgtcg gcaaaggcga cgcccagaga gccattgacg ttctttctaa tttggaccga    240

tagccgtata gtccagtcta tctataagtt caactaactc gtaactatta ccataacata    300

tacttcactg ccccagataa ggttccgata aaaagttctg cagactaaat ttatttcagt    360

ctcctcttca ccaccaaaat gccctcctac gaagctcgag tgctcaagct cgtggcagcc    420

aagaaaacca acctgtgtgc ttctctggat gttaccacca ccaaggagct cattgagctt    480

gccgataagg tcggacctta tgtgtgcatg atcaaaaccc atatcgacat cattgacgac    540

ttcacctacg ccggcactgt gctccccctc aaggaacttg ctcttaagca cggtttcttc    600

ctgttcgagg acagaaagtt cgcagatatt ggcaacactg tcaagcacca gtaccggtgt    660

caccgaatcg ccgagtggtc cgatatcacc aacgcccacg gtgtacccgg aaccggaatc    720

gattgctggc ctgcgagctg gtgcgtacga ggaaactgtc tctgaacaga agaaggagga    780

cgtctctgac tacgagaact cccagtacaa ggagttccta gtcccctctc ccaacgagaa    840

gctggccaga ggtctgctca tgctggccga gctgtcttgc aagggctctc tggccactgg    900

cgagtactcc aagcagacca ttgagcttgc ccgatccgac cccgagtttg tggttggctt    960

cattgcccag aaccgaccta agggcgactc tgaggactgg cttattctga cccccggggt   1020

gggtcttgac gacaagggag acgctctcgg acagcagtac cgaactgttg aggatgtcat   1080

gtctaccgga acggatatca taattgtcgg ccgaggtctg tacggccaga accgagatcc   1140

tattgaggag gccaagcgat accagaaggc tggctgggag gcttaccaga agattaactg   1200

ttagaggtta gactatggat atgtaattta actgtgtata tagagagcgt gcaagtatgg   1260

agcgcttgtt cagcttgtat gatggtcaga cgacctgtct gatcgagtat gtatgatact   1320

gcacaacctg tgtatccgca tgatctgtcc aatggggcat gttgttgtgt ttctcgatac   1380

ggagatgctg ggtacagtgc taatacgttg aactacttat acttatatga ggctcgaaga   1440

aagctgactt gtgtatgac                                                1459

 

<210>87

<211>7966

<212>DNA

<213>人工序列

 

<220>

<223>质粒pYPS161

 

<400>87

aaatgtaacg aaactgaaat ttgaccagat attgtgtccg cggtggagct ccagcttttg     60

ttccctttag tgagggttaa tttcgagctt ggcgtaatca tggtcatagc tgtttcctgt    120

gtgaaattgt tatccgctca caagcttcca cacaacgtac gttctggttg gctcggatga    180

tttctgcggc cccagcgtaa ggcaggcgtt ccgtccggat cggtttgggt cggatcggct    240

ttttgattgt cgtattgtcg ctcatgttgg acctggtgtg tagttgtagt gtcagatcag    300

attcaccagc gaatgcatgt gaacttcccc acattttgag ccgaggcaga tttgggttgc    360

ttagtaagca gacgtggcgt tgcaagtaga tgtggcaaat ggggacgaag attccgaggg    420

gatatcatag ttccaagggg atgtcatcat ttgccagctt tcgccgccac ttttgacgag    480

tttttgtggg tcaaataagt ttagttgaac ttttcaaatt tcagttggca ttttgttaat    540

agaaagggtg ccggtgctgg ggggttcatt cctcgggttg cagatatcct atctgtctta    600

ggggtatctc tttcaatcga caagatgtag ttgggtaaca attatttatt aatattctct    660

ccatccagta cagtactaac atcttgacat ctcagcacaa gtgcatcttc ccaagtgttt    720

gttggagagg ttgttgggta ttacttagga aacagaacac agtacgtgga gatcttggat    780

acatcgtaca tggaggttat ccataaaaaa gaccctccag gactagttac aatgccgtta    840

gatgaggaaa tccacaaccc tgattcacta tgaacatatt atcttccccc aaacttgcga    900

tatatggccc ttgatgatag ccttgatttt acccttgatg gtacctccac gaccaaccga    960

tctgctgttt gaagagatat tttcaaattt gaagtgctca gatctactaa acatgagtcc   1020

agtaattctt tccgtctttc cgatttccga tattcccttt tttagcccga cttttcactg   1080

ctcccatgtc aaacgattag gacttgggag acaatcccac tgtcaaaatc accccgatat   1140

tctctgtaaa acaagtactt cttccacgtg atcttcaaat acctcttcca cgtgaccttc   1200

aaatacctct tcaagtacct cttccacgcg accttcaaag tcccttcaaa tacccttctc   1260

aattctcccc ttctcctcca tagtccttct ctctgactaa gcttgagaat acatgacgct   1320

aagacgaaaa cacactagag accctgagag cctgaacatg catccactct gcagttgcgc   1380

acgtgcctac agcaactatc gggtccagtg ctggatctga cactgcgtct ccctatgaag   1440

aaactgataa acagatctgc actcataaca atgatctgag cgatgaaaac gtgacctcca   1500

cagccacaag tcataatcgg cgcgccagct gcattaatga atcggccaac gcgcggggag   1560

aggcggtttg cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt   1620

cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga   1680

atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg   1740

taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa   1800

aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt   1860

tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct   1920

gtccgccttt ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct   1980

cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc   2040

cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt   2100

atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc   2160

tacagagttc ttgaagtggt ggcctaacta cggctacact agaagaacag tatttggtat   2220

ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa   2280

acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa   2340

aaaaggatct caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga   2400

aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct   2460

tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga   2520

cagttaccaa tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc   2580

catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg   2640

ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat   2700

aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat   2760

ccagtctatt aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg   2820

caacgttgtt gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc   2880

attcagctcc ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa   2940

agcggttagc tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc   3000

actcatggtt atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt   3060

ttctgtgact ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag   3120

ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt   3180

gctcatcatt ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag   3240

atccagttcg atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac   3300

cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc   3360

gacacggaaa tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca   3420

gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg   3480

ggttccgcgc acatttcccc gaaaagtgcc acctgatgcg gtgtgaaata ccgcacagat   3540

gcgtaaggag aaaataccgc atcaggaaat tgtaagcgtt aatattttgt taaaattcgc   3600

gttaaatttt tgttaaatca gctcattttt taaccaatag gccgaaatcg gcaaaatccc   3660

ttataaatca aaagaataga ccgagatagg gttgagtgtt gttccagttt ggaacaagag   3720

tccactatta aagaacgtgg actccaacgt caaagggcga aaaaccgtct atcagggcga   3780

tggcccacta cgtgaaccat caccctaatc aagttttttg gggtcgaggt gccgtaaagc   3840

actaaatcgg aaccctaaag ggagcccccg atttagagct tgacggggaa agccggcgaa   3900

cgtggcgaga aaggaaggga agaaagcgaa aggagcgggc gctagggcgc tggcaagtgt   3960

agcggtcacg ctgcgcgtaa ccaccacacc cgccgcgctt aatgcgccgc tacagggcgc   4020

gtccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg   4080

ctattacgcc agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca   4140

gggttttccc agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta   4200

tagggcgaat tgggcccgac gtcgcatgca actattagtg aggcttcggg agtggttgtc   4260

tcggttgtct cattcagact cgttgtgttg tatctatatc tatataaaca ctcttgtccc   4320

tcaatcccac tgccatcttt tgctaaactt gccgccaata tgaaactcat ctccctcatc   4380

accgtcgcta ccaccgctct ggcggctgtc ggagacaagt acaagctgac ctataccaga   4440

tcagacgccc aatcggtcga atctctgccc gtcacctacc aagatgacct gatcaccgcc   4500

tccaccgacg gcgaacccat caccatcacc gagggcgagg gcaacacctt ctctgttaac   4560

gacatgccca tcgcctatct ggagctgcag gctttgttct ggaccggcga ctacggctac   4620

aagctccagg gctcggtctt tgacattgcc gccgatggaa cctttgagct gagagacggc   4680

cccaaggagt actactattg cactcctcac cctgagcgaa acgtcatcta cgtcatcaac   4740

agccccgact actccaagtg tcggttcaag cgtaccatca agttccacgc tgaaaagatc   4800

taagtggtaa tcgaccgact aaccattttt agctgacaaa cacttgctaa ctcctataac   4860

gaatgaatga ctaacttggc atattgttac caagtattac ttgggatata gttgagtgta   4920

accattgcta agaatccaaa ctggagcttc taaaggtctg ggagtcgccg tatgtgttca   4980

tatcgaaatc aaagaaatca taatcgcaac agaattcaaa atcaagcaga ttaatatcca   5040

ttattgtact cggatcgtga catatctgat atgatctcgg atatgatctc tgactgttta   5100

ctgggagatt tgttgaagat ttgttgaggt tatctgaaaa gtagacaata gagacaaaat   5160

gacgatatca agaactgaat cgggccgaaa tactcggtat cattcccttc agcagtaact   5220

gtattgctct atcaatgcga cgagatacct ccacaattaa tactgtatac gctctaccac   5280

tcatatctcc aatgctaaaa tatattcatg cccaggacct ctgtgcactg ctatgcagca   5340

cagtgttgtc gattgaattg gtcgtgtctg gtccctgatg ctctgtgtct cgctgactag   5400

tccttccatc cagacctcgt cattatctga taggcaacaa gttctgctct ctcacaccct   5460

gccgacacaa gggacactcg ggcttctctc tcacccattc ggaaatacag tccttaatta   5520

agttgcgaca catgtcttga tagtatcttg aattctctct cttgagcttt tccataacaa   5580

gttcttctgc ctccaggaag tccatgggtg gtttgatcat ggttttggtg tagtggtagt   5640

gcagtggtgg tattgtgact ggggatgtag ttgagaataa gtcatacaca agtcagcttt   5700

cttcgagcct catataagta taagtagttc aacgtattag cactgtaccc agcatctccg   5760

tatcgagaaa cacaacaaca tgccccattg gacagatcat gcggatacac aggttgtgca   5820

gtatcataca tactcgatca gacaggtcgt ctgaccatca tacaagctga acaagcgctc   5880

catacttgca cgctctctat atacacagtt aaattacata tccatagtct aacctctaac   5940

agttaatctt ctggtaagcc tcccagccag ccttctggta tcgcttggcc tcctcaatag   6000

gatctcggtt ctggccgtac agacctcggc cgacaattat gatatccgtt ccggtagaca   6060

tgacatcctc aacagttcgg tactgctgtc cgagagcgtc tcccttgtcg tcaagaccca   6120

ccccgggggt cagaataagc cagtcctcag agtcgccctt aggtcggttc tgggcaatga   6180

agccaaccac aaactcgggg tcggatcggg caagctcaat ggtctgcttg gagtactcgc   6240

cagtggccag agagcccttg caagacagct cggccagcat gagcagacct ctggccagct   6300

tctcgttggg agaggggact aggaactcct tgtactggga gttctcgtag tcagagacgt   6360

cctccttctt ctgttcagag acagtttcct cggcaccagc tcgcaggcca gcaatgattc   6420

cggttccggg tacaccgtgg gcgttggtga tatcggacca ctcggcgatt cggtgacacc   6480

ggtactggtg cttgacagtg ttgccaatat ctgcgaactt tctgtcctcg aacaggaaga   6540

aaccgtgctt aagagcaagt tccttgaggg ggagcacagt gccggcgtag gtgaagtcgt   6600

caatgatgtc gatatgggtt ttgatcatgc acacataagg tccgacctta tcggcaagct   6660

caatgagctc cttggtggtg gtaacatcca gagaagcaca caggttggtt ttcttggctg   6720

ccacgagctt gagcactcga gcggcaaagg cggacttgtg gacgttagct cgagcttcgt   6780

aggagggcat tttggtggtg aagaggagac tgaaataaat ttagtctgca gaacttttta   6840

tcggaacctt atctggggca gtgaagtata tgttatggta atagttacga gttagttgaa   6900

cttatagata gactggacta tacggctatc ggtccaaatt agaaagaacg tcaatggctc   6960

tctgggcgtc gcctttgccg acaaaaatgt gatcatgatg aaagccagca atgacgttgc   7020

agctgatatt gttgtcggcc aaccgcgccg aaaacgcagc tgtcagaccc acagcctcca   7080

acgaagaatg tatcgtcaaa gtgatccaag cacactcata gttggagtcg tactccaaag   7140

gcggcaatga cgagtcagac agatactcgt cgaccttttc cttgggaacc accaccgtca   7200

gcccttctga ctcacgtatt gtagccaccg acacaggcaa cagtccgtgg atagcagaat   7260

atgtcttgtc ggtccatttc tcaccaactt taggcgtcaa gtgaatgttg cagaagaagt   7320

atgtgccttc attgagaatc ggtgttgctg atttcaataa agtcttgaga tcagtttggc   7380

cagtcatgtt gtggggggta attggattga gttatcgcct acagtctgta caggtatact   7440

cgctgcccac tttatacttt ttgattccgc tgcacttgaa gcaatgtcgt ttaccaaaag   7500

tgagaatgct ccacagaaca caccccaggg tatggttgag caaaaaataa acactccgat   7560

acggggaatc gaaccccggt ctccacggtt ctcaagaagt attcttgatg agagcgtatc   7620

gatgagccta aaatgaaccc gagtatatct cataaaattc tcggtgagag gtctgtgact   7680

gtcagtacaa ggtgccttca ttatgccctc aaccttacca tacctcactg aatgtagtgt   7740

acctctaaaa atgaaataca gtgccaaaag ccaaggcact gagctcgtct aacggacttg   7800

atatacaacc aattaaaaca aatgaaaaga aatacagttc tttgtatcat ttgtaacaat   7860

taccctgtac aaactaaggt attgaaatcc cacaatattc ccaaagtcca cccctttcca   7920

aattgtcatg cctacaactc atataccaag cactaaccta ccgttt                  7966

 

<210>88

<211>20

<212>DNA

<213>人工序列

 

<220>

<223>引物Pex-10del13’.正向

 

<400>88

ccaacatgag cgacaatacg                                                 20

 

<210>89

<211>20

<212>DNA

<213>人工序列

 

<220>

<223>引物Pex-10del25’.反向

 

<400>89

caagttctgc tctctcacac                                                 20

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号