首页> 中国专利> 用于使用经工程化的酵母产生乙醇的方法

用于使用经工程化的酵母产生乙醇的方法

摘要

本公开的方面提供用于乙醇产生的经工程化的微生物。本文还提供用于微生物工程化和培养的方法。这样的经工程化的微生物表现出增强的乙醇产生能力。

著录项

  • 公开/公告号CN112166188A

    专利类型发明专利

  • 公开/公告日2021-01-01

    原文格式PDF

  • 申请/专利权人 嘉吉有限公司;

    申请/专利号CN201980035013.3

  • 申请日2019-03-27

  • 分类号C12N9/02(20060101);C12N9/16(20060101);C12N9/34(20060101);C12P7/06(20060101);C12N15/81(20060101);

  • 代理机构11269 北京嘉和天工知识产权代理事务所(普通合伙);

  • 代理人缪策;甘玲

  • 地址 美国明尼苏达州

  • 入库时间 2023-06-19 09:23:00

说明书

相关申请

本申请要求于2018年3月27日提交的标题为“用于使用经工程化的酵母产生乙醇的方法”的美国临时申请序列号62/648,679(其通过引用被整体并入本文)的在35u.s.c§119(e)下的权益。

领域

本公开涉及通过基因工程产生乙醇。

背景

乙醇是可以通过天然产物的发酵产生的可再生生物燃料。通过发酵产生的乙醇具有许多工业应用(包含产生产品,如溶剂、提取剂、防冻剂、以及作为各种有机化学物质的合成的中间产物)。乙醇还广泛用于工业(如涂料、印刷油墨和粘合剂)中。微生物(包含酵母)可以通过各种底物(包含糖类和淀粉)的发酵来产生乙醇。使用酵母产生乙醇的优势包含使用多种底物的能力、对高乙醇浓度的耐受性和产生大乙醇产量的能力(Mohd Azhar etal.,Biochem Biophys Rep(2017)10:52-61)。然而,使用酵母发酵产生乙醇也导致副产物的产生。

概述

本公开的方面涉及新型经工程化的酵母和使用该新型经工程化的酵母产生乙醇的方法的开发。令人惊讶的是,本文所描述的经工程化的酵母产生高的乙醇产率而不表现出发酵损失,并且产生降低水平的副产物(如甘油)。

本公开的方面涉及经工程化的酵母,该经工程化的酵母包括:编码甘油醛-3-磷酸脱氢酶(E.C.1.2.1.9)的重组核酸;编码甘油-3-磷酸磷酸酶(E.C.3.1.3.21)的基因的降低或消除的表达;以及编码葡糖淀粉酶的重组核酸,其中酵母能够在测试1条件下在48小时内产生至少100g/kg的乙醇并且产生少于1.5g/kg的残余葡萄糖。

在一些实施方案中,经工程化的酵母是全基因组复制后的酵母菌种。在一些实施方案中,酵母是酿酒酵母(Saccharomyces cerevisiae)(酿酒酵母(S.cerevisiae))。

在一些实施方案中,经工程化的酵母产生比对照菌株高至少0.5%的乙醇产率。在一些实施方案中,通过以下测定乙醇产率:(时间终点处的乙醇滴度-时间零点处的乙醇滴度)除以时间零点处的总葡萄糖当量。在一些实施方案中,经工程化的酵母产生比对照菌株少30%的甘油、比对照菌株少40%的甘油、或比对照菌株少50%的甘油。在一些实施方案中,通过测试4测定甘油产生。

在一些实施方案中,葡糖淀粉酶(GA)与SEQ ID NO:38(扣囊复膜酵母GA(Saccharomycopsis fibuligera GA)具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,GA与SEQ ID NO:39(米根霉amyA(Rhizopus oryzae amyA))具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,GA与SEQ ID NO:41(小孢根霉GA(Rhizopus microsporus GA))具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,GA与SEQ ID NO:40(戴尔根霉GA(Rhizopus delemar GA))具有至少80%、至少85%、至少90%、或至少95%的序列一致性。

在一些实施方案中,编码甘油醛-3-磷酸脱氢酶(E.C.1.2.1.9)的核酸与SEQ IDNO:45具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,编码甘油醛-3-磷酸脱氢酶(E.C.1.2.1.9)的核酸编码与SEQ ID NO:42具有至少80%、至少85%、至少90%、或至少95%的序列一致性的蛋白质。在一些实施方案中,经工程化的酵母包括与SEQ ID NO:59具有至少80%、至少85%、至少90%、或至少95%的序列一致性的核酸。

在一些实施方案中,经工程化的酵母具有甘油-3-磷酸脱氢酶(E.C.1.1.1.8)的降低的或消除的表达。

在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPP1、GPP2、GPD1、或GPD2的降低的或消除的表达。在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPP1的降低的或消除的表达。在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPP2的降低的或消除的表达。在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPD1的降低的或消除的表达。在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPD2的降低的或消除的表达。

在一些实施方案中,经工程化的酵母还包括编码海藻糖-6-磷酸合酶(Tps1;E.C.2.4.1.15)的核酸。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps1;E.C.2.4.1.15)的核酸与SEQ ID NO:55具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps1;E.C.2.4.1.15)的核酸编码与SEQ ID NO:43具有至少80%、至少85%、至少90%、或至少95%的序列一致性的蛋白质。

在一些实施方案中,经工程化的酵母还包括编码海藻糖-6-磷酸合酶(Tps2;EC3.1.3.12)的核酸。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps2;EC 3.1.3.12)的核酸与SEQ ID NO:56具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps2;EC 3.1.3.12)的核酸编码与SEQ ID NO:44具有至少80%、至少85%、至少90%、或至少95%的序列一致性的蛋白质。

本公开的方面涉及经工程化的酿酒酵母,该经工程化的酿酒酵母包括:编码甘油醛-3-磷酸脱氢酶(E.C.1.2.1.9)的重组核酸;以及编码甘油-3-磷酸磷酸酶(E.C.3.1.3.21)的基因的降低或消除的表达,其中酵母能够在测试2条件下在48小时内产生至少100g/kg的乙醇并且产生少于1.5g/kg的残余葡萄糖。

在一些实施方案中,经工程化的酿酒酵母产生比对照菌株高至少0.5%的乙醇产率。在一些实施方案中,通过下式测定乙醇产率:(时间终点处的乙醇滴度-时间零点处的乙醇滴度)除以时间零点处的总葡萄糖当量。在一些实施方案中,经工程化的酵母产生比对照菌株少30%的甘油、比对照菌株少40%的甘油、或比对照菌株少50%的甘油。在一些实施方案中,通过测试4测定甘油产生。

在一些实施方案中,GA与SEQ ID NO:38(扣囊复膜酵母GA)具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,GA与SEQ ID NO:39(米根霉amyA)具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,GA与SEQ ID NO:41(小孢根霉GA)具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,GA与SEQ ID NO:40(戴尔根霉GA)具有至少80%、至少85%、至少90%、或至少95%的序列一致性。

本公开的方面涉及经工程化的酵母,该经工程化的酵母包括编码甘油醛-3-磷酸脱氢酶(E.C.1.2.1.9)的外源性核酸,以及编码与SEQ ID NO:38(扣囊复膜酵母GA)、SEQ IDNO:41(小孢根霉GA)、SEQ ID NO:40(戴尔根霉GA)、或SEQ ID NO:39(米根霉amyA)具有80%或更大一致性的GA的外源性核酸,其中酵母能够在测试1条件下在48小时内产生至少100g/kg的乙醇并且具有少于1.5g/kg的残余葡萄糖。

在一些实施方案中,酵母是全基因组复制后的酵母菌种。在一些实施方案中,酵母是酿酒酵母。

在一些实施方案中,经工程化的酵母产生比对照菌株高至少0.5%的乙醇产率。在一些实施方案中,通过下式测定乙醇产率:(时间终点处的乙醇滴度-时间零点处的乙醇滴度)除以时间零点处的总葡萄糖当量。

在一些实施方案中,经工程化的酵母产生比对照菌株少30%的甘油、比对照菌株少40%的甘油、或比对照菌株少50%的甘油。在一些实施方案中,通过测试4测定甘油产生。

在一些实施方案中,经工程化的酵母具有编码甘油-3-磷酸磷酸酶(E.C.3.1.3.21)的基因的降低的或消除的表达。

在一些实施方案中,编码甘油醛-3-磷酸脱氢酶(E.C.1.2.1.9)的核酸与SEQ IDNO:45具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,编码甘油醛-3-磷酸脱氢酶(E.C.1.2.1.9)的核酸编码与SEQ ID NO:42具有至少80%、至少85%、至少90%、或至少95%的序列一致性的蛋白质。在一些实施方案中,经工程化的酵母包括与SEQ ID NO:59具有至少80%、至少85%、至少90%、或至少95%的序列一致性的核酸。

在一些实施方案中,经工程化的酵母具有甘油-3-磷酸脱氢酶(E.C.1.1.1.8)的降低的或消除的表达。

在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPP1、GPP2、GPD1、或GPD2的降低的或消除的表达。在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPP1的降低的或消除的表达。在一些实施方案中,其中经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPP2的降低的或消除的表达。在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPD1的降低的或消除的表达。在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPD2的降低的或消除的表达。

在一些实施方案中,经工程化的酵母还包括编码海藻糖-6-磷酸合酶(Tps1;E.C.2.4.1.15)的核酸。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps1;E.C.2.4.1.15)的核酸与SEQ ID NO:55具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps1;E.C.2.4.1.15)的核酸编码与SEQ ID NO:43具有至少80%、至少85%、至少90%、或至少95%的序列一致性的蛋白质。

在一些实施方案中,经工程化的酵母还包括编码海藻糖-6-磷酸合酶(Tps2;EC3.1.3.12)的核酸。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps2;EC 3.1.3.12)的核酸与SEQ ID NO:56具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps2;EC 3.1.3.12)的核酸编码与SEQ ID NO:44具有至少80%、至少85%、至少90%、或至少95%的序列一致性的蛋白质。

本公开的方面涉及用于产生乙醇的方法,方法包括用发酵基质使本文所描述的经工程化的酵母发酵。在一些实施方案中,发酵基质包括淀粉。在一些实施方案中,发酵基质包括葡萄糖。在一些实施方案中,发酵基质包括蔗糖。在一些实施方案中,从玉米、小麦和/或木薯获得淀粉。在一些实施方案中,方法包含用葡糖淀粉酶补充。

本公开的方面涉及用于产生海藻糖的方法,方法包括用发酵基质使本文公开的经工程化的酵母中的任何一种发酵。

本发明的限制中的每个可以涵盖本发明的各种实施方案。因此,预期涉及任何一个要素或要素的组合的本发明的限制中的每个都可以包含在本发明的每个方面中。本发明的应用不限于在以下描述中所示或者在附图中所图示说明的构造细节和组分的布置。本发明能够具有其他实施方案并且能够以各种方式被实践或进行。

附图的简要说明

附图并非旨在按比例绘制。为了清楚起见,并非在每个附图中都标记了每个组分。在附图中:

图1是示出用菌株1-22在玉米醪中产生乙醇的图表,菌株1-22在米根霉(Ro)葡糖淀粉酶菌株背景中在GPP1基因座处含有蜡样芽胞杆菌(Bc)gapN基因。

图2是示出用菌株1-22在玉米醪中的乙醇产率的表格。

图3A-3C图3A是示出用菌株1-22的乙醇滴度的图表。图3B是示出用菌株1-22的残余葡萄糖滴度的图表。图3C是示出用菌株1-22的甘油滴度的图表。

图4是示出用菌株1-20和菌株1-22的乙醇产生的比较的图表。图5是示出在轻浸渍水/液化物(玉米湿磨原料)气锁摇瓶中用菌株1-22产生乙醇的表格。

图6是示出玉米醪中的乙醇滴度的图表。

图7是示出玉米醪中的残余葡萄糖的图表。

图8是示出玉米醪中的甘油滴度的图表。

图9是示出在47小时处玉米醪中相对于菌株1的菌株1-25的乙醇滴度增加的图表。

图10A-10B图10A是示出玉米醪中相对于菌株1的菌株1-25的甘油降低的图表。图10B是示出玉米醪中发酵结束(47小时)时的残余葡萄糖的图表。

图11是示出所示菌株在48小时处的甘油滴度的图表。

图12是示出所示菌株在48小时处的乙醇滴度的图表。

图13是示出所示菌株在48小时处的残余葡萄糖的图表。

详细说明

本公开的方面涉及用于乙醇产生的经基因工程化的微生物。先前报道的使酵母工程化以降低乙醇发酵中的副产物产生的尝试受到发酵损失的阻碍。令人惊讶的是,本文所描述的经工程化的酵母展现出增加的乙醇滴度而没有发酵损失,并且产生降低量的副产物(包含甘油)。因此,本文所描述的新型经工程化的酵母代表了用于通过发酵产生乙醇的出乎意料有效的新方法。

本发明的应用不限于在以下描述中所示或者在附图中所图示说明的构造细节和组分的布置。本发明能够具有其他实施方案并且能够以各种方式被实践或进行。另外,本文所使用的措词和术语是出于描述的目的,而不应当被认为是限制性的。本文中“包含”、“包括”或“具有”、“含有”、“涉及”及其变体的使用旨在涵盖其后列出的项目及其等同物以及附加项目。

降低的甘油产生

甘油-3-磷酸磷酸酶

本文所描述的经工程化的酵母菌株可以包含参与甘油产生的一种或更多种酶的基因修饰。例如,本文所描述的经工程化的酵母菌株可以具有编码甘油-3-磷酸磷酸酶(Gpp;对应于E.C.3.1.3.21;也称为“甘油-1-磷酸酶”)的一个或更多个基因的降低的或消除的表达。甘油-3-磷酸磷酸酶将甘油-3-磷酸水解成甘油,并且从而调控甘油-3-磷酸(葡萄糖、脂质和能量代谢的代谢中间产物)的细胞水平(Mugabo et al.,PNAS(2016)113:E430-439)。

酿酒酵母(酿酒酵母(S.cerevisiae))具有两种甘油-3-磷酸磷酸酶旁系同源物,分别称为Gpp1p和Gpp2p(分别由GPP1(UniProt号P41277)基因和GPP2(UniProt号P40106)基因编码)(Norbeck et al.(1996)J.Biol.Chem.271(23):13875-81;Pahlman et al.(2001)J.Biol.Chem.276(5):3555-63)。在一些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPP1的降低的或消除的表达。在其他实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPP2的降低的或消除的表达。在其他实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPP1和GPP2两者的降低的或消除的表达。

Gpp1p(UniProt号P41277)的氨基酸序列(SEQ ID NO:57)是:

Gpp2p(UniProt号P40106)的氨基酸序列(SEQ ID NO:58)是:

应当理解的是,实现编码甘油-3-磷酸磷酸酶的基因的降低的或消除的表达的任何手段都与本发明的方面相容。例如,可以通过破坏基因的序列和/或控制该基因表达的一个或更多个调控区(如通过将一个或更多个突变或插入引入到基因的序列中或控制该基因表达的一个或更多个调控区中)来实现编码甘油-3-磷酸磷酸酶的基因的降低的或消除的表达。

在一些实施方案中,编码甘油-3-磷酸磷酸酶的基因(如GPP1基因)的表达降低至少大约10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。在一些实施方案中,编码甘油-3-磷酸磷酸酶的基因(如GPP1基因)的表达被消除。可以通过本领域普通技术人员已知的任何手段(如通过将核酸片段插入到GPP1基因座或围绕GPP1基因座的调控区中)来消除编码甘油-3-磷酸磷酸酶的基因(如GPP1基因)的表达。

在一些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)是二倍体,并且具有GPP1基因的两个拷贝的降低的或消除的表达。在一些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)是二倍体,并且在GPP1基因的两个拷贝中都含有缺失和/或插入。

甘油-3-磷酸脱氢酶(E.C.1.1.1.8)

本文所描述的经工程化的酵母可以具有编码甘油-3-磷酸脱氢酶(Gpd;对应于E.C.1.1.1.8)的一个或更多个基因的降低的或消除的表达。

酿酒酵母具有两种甘油-3-磷酸脱氢酶,分别称为Gpd1p和Gpd2p(分别由GPD1(UniProt号Q00055)基因和GPD2(UniProt号P41911)基因编码)。在一些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPD1的降低的或消除的表达。在其他实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPD2的降低的或消除的表达。在其他实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPD1和GPD2两者的降低的或消除的表达。

应当理解的是,实现编码甘油-3-磷酸脱氢酶的基因的降低的或消除的表达的任何手段都与本发明的方面相容。例如,可以通过破坏基因的序列和/或控制该基因表达的一个或更多个调控区(如通过将一个或更多个突变或插入引入到基因的序列中或控制该基因表达的一个或更多个调控区中)来实现编码甘油-3-磷酸脱氢酶的基因的降低的或消除的表达。

在一些实施方案中,编码甘油-3-磷酸脱氢酶的基因(如GPD1基因)的表达降低至少大约10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。在一些实施方案中,编码甘油-3-磷酸脱氢酶的基因(如GPD1基因)的表达被消除。可以通过本领域普通技术人员已知的任何手段(如通过将核酸片段插入到GPD1基因座或围绕GPD1基因座的调控区中)来消除编码甘油-3-磷酸脱氢酶的基因(如GPD1基因)的表达。

在一些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)是二倍体,并且具有GPD1基因的两个拷贝的降低的或消除的表达。在一些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)是二倍体,并且在GPD1基因的两个拷贝中都包含缺失和/或插入。在其他实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPD1基因的一个拷贝的降低的或消除的表达。

在一些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPP1和/或GPP2的降低的或消除的表达,并且还具有GPD1和/或GPD2的降低的或消除的表达。在某些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPP1的两个拷贝的降低的或消除的表达,并且还具有GPD1的一个拷贝的降低的或消除的表达。

甘油醛-3-磷酸脱氢酶(GAPN;E.C.1.2.1.9)

本文所描述的经工程化的酵母重组表达编码甘油醛-3-磷酸脱氢酶(gapN;对应于E.C.1.2.1.9;也称为“NADP依赖性非磷酸化甘油醛-3-磷酸脱氢酶”)的一种或更多种核酸。GapN酶将D-甘油醛3-磷酸转化成3-磷酸-D-甘油酯(Rosenberg et al.,J Biol Chem(1955)217:361-71)。

应当理解的是,编码gapN酶的重组核酸可以来自任何来源。重组表达编码gapN酶的核酸的经工程化的酵母可以含有编码gapN酶的内源基因或者可以不含有编码gapN酶的内源基因。在一些实施方案中,重组表达编码gapN酶的核酸的经工程化的酵母不含有编码gapN酶的基因的内源拷贝。因此,在这样的实施方案中,编码gapN酶的核酸来源于与经工程化的酵母不同的物种或生物体。

在其他实施方案中,重组表达编码gapN酶的核酸的经工程化的酵母确实含有编码gapN酶的基因的内源拷贝。在一些这样的实施方案中,编码gapN酶的基因的内源拷贝或该基因的调控区(如启动子)被工程化以增加编码gapN酶的基因的表达。在其他这样的实施方案中,将编码gapN酶的核酸引入到酵母中。在这样的实施方案中,被引入到酵母中的编码gapN酶的核酸可以来源于与其在其中表达的经工程化的酵母相同的物种或生物体,或者可以来源于与其在其中表达的经工程化的酵母不同的物种或生物体。

在一些实施方案中,编码gapN酶的重组核酸包括蜡样芽孢杆菌基因(例如,GAPN,对应于UniProt号Q2HQS1)。在一些实施方案中,编码GapN酶或其部分的重组核酸是密码子优化的。在一些实施方案中,编码gapN酶或其部分的重组核酸包括SEQ ID NO:45。

在一些实施方案中,编码gapN酶或其部分的重组核酸与SEQ ID NO:45的序列具有至少或约50%、至少或约60%、至少或约70%、至少或约75%、至少或约80%、至少或约81%、至少或约82%、至少或约83%、至少或约84%、至少或约85%、至少或约86%、至少或约87%、至少或约88%、至少或约89%、至少或约90%、至少或约91%、至少或约92%、至少或约93%、至少或约94%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、或者至少或约99.9%的序列一致性。

在一些实施方案中,gapN蛋白包括SEQ ID NO:42。在一些实施方案中,gapN蛋白与SEQ ID NO:42的序列具有至少或约50%、至少或约60%、至少或约70%、至少或约75%、至少或约80%、至少或约81%、至少或约82%、至少或约83%、至少或约84%、至少或约85%、至少或约86%、至少或约87%、至少或约88%、至少或约89%、至少或约90%、至少或约91%、至少或约92%、至少或约93%、至少或约94%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、或者至少或约99.9%的序列一致性。

本领域普通技术人员将理解GAPN基因可以来源于任何来源,并且可以使用常规方法进行工程化,如以改善在宿主细胞中的表达。

海藻糖生物合成

本文描述的经工程化的酵母可以重组表达编码参与海藻糖生物合成的一种或更多种蛋白质的一个或更多个基因(Gancedo et al.(2004)FEMS Yeast Research 4:351-359)。参与海藻糖生物合成的酶的非限制性实例包含海藻糖-6-磷酸合酶(Tps1;E.C.2.4.1.15)和海藻糖-6-磷酸磷酸酶(Tps2;EC 3.1.3.12)。

在酿酒酵母中,Tps1由TPS1基因(UniProt号C7GY09)编码,并且Tps2由TPS2基因(UniProt号P31688)编码。应当理解的是,编码Tps1酶或Tps2酶的重组核酸可以来自任何来源。重组表达编码Tps1酶或Tps2酶的核酸的经工程化的酵母细胞可以含有编码Tps1酶或Tps2酶的内源基因或者可以不含有编码Tps1酶或Tps2酶的内源基因。在一些实施方案中,重组表达编码Tps1酶或Tps2酶的核酸的经工程化的酵母细胞不含有编码Tps1酶或Tps2酶的基因的内源拷贝。因此,在这样的实施方案中,编码Tps1酶或Tps2酶的核酸来源于与经工程化的酵母细胞不同的物种或生物体。

在其他实施方案中,重组表达编码Tps1酶或Tps2酶的核酸的经工程化的酵母不含有编码Tps1酶或Tps2酶的基因的内源拷贝。在一些这样的实施方案中,编码Tps1酶或Tps2酶的基因的内源拷贝或者该基因的调控区(如启动子)被工程化以增加编码Tps1酶或Tps2酶的基因的表达。在其他实施方案中,编码Tps1酶或Tps2酶的核酸被引入酵母。在这样的实施方案中,被引入酵母的编码Tps1酶或Tps2酶的核酸可以来源于与在其中表达它的经工程化的酵母相同的物种或生物体,或者可以来源于与在其中表达它的经工程化的酵母不同的物种或生物体。

在一些实施方案中,编码Tps1酶或Tps2酶的重组核酸包括酿酒酵母基因(例如,对应于UniProt号C7GY09或UniProt号P31688)。在一些实施方案中,Tps1对应于SEQ ID NO:43。在一些实施方案中,Tps2对应于SEQ ID NO:44。本领域普通技术人员将理解,TPS1基因或TPS2基因可以来源于任何来源,并且可以使用常规方法被工程化,如以改善宿主细胞中的表达。

葡糖淀粉酶

本文所描述的经工程化的酵母重组表达编码葡糖淀粉酶(E.C.3.2.1.3)的核酸。葡糖淀粉酶从直链淀粉链的非还原端连续地水解末端1,4-连接的α-D-葡萄糖残基以释放游离葡萄糖(参见例如,Mertens et al.,Curr Microbiol(2007)54:462-6)。

应当理解的是,编码葡糖淀粉酶的核酸可以来自任何来源。重组表达编码葡糖淀粉酶的核酸的经工程化的酵母可以含有编码葡糖淀粉酶的内源基因或者可以不含有编码葡糖淀粉酶的内源基因。在一些实施方案中,重组表达编码葡糖淀粉酶的核酸的经工程化的酵母不含有编码葡糖淀粉酶的基因的内源拷贝。因此,在这样的实施方案中,编码葡糖淀粉酶的核酸来源于与经工程化的酵母不同的物种或生物体。

在其他实施方案中,重组表达编码葡糖淀粉酶的核酸的经工程化的酵母的确含有编码葡糖淀粉酶的基因的内源拷贝。在一些这样的实施方案中,编码葡糖淀粉酶的基因的内源拷贝或者该基因的调控区(如启动子)被工程化以增加编码葡糖淀粉酶的基因的表达。在其他实施方案中,编码葡糖淀粉酶的核酸被引入酵母。在这样的实施方案中,被引入酵母的编码葡糖淀粉酶的核酸可以来源于与在其中表达它的经工程化的酵母相同的物种或生物体,或者可以来源于与在其中表达它的经工程化的酵母不同的物种或生物体。

在一些实施方案中,编码葡糖淀粉酶的重组核酸包括扣囊复膜酵母基因(例如,对应于UniProt号Q8TFE5)。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸是经密码子优化的。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸包括SEQ ID NO:46至SEQ ID NO:49。

在一些实施方案中,编码葡糖淀粉酶的重组核酸与SEQ ID NO:46至SEQ ID NO:49的核酸序列具有至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、至少或约99.9%、或者至少或约100%的序列一致性。

在一些实施方案中,葡糖淀粉酶与SEQ ID NO:38的蛋白质序列具有至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、至少或约99.9%、或者至少或约100%的序列一致性。

在一些实施方案中,编码葡糖淀粉酶的重组核酸包括戴尔根霉基因(例如,RO3G_00082,对应于UniProt号I1BGP8)。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸是经密码子优化的。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸包括SEQID NO:52或SEQ ID NO:53。

在一些实施方案中,编码葡糖淀粉酶的重组核酸与SEQ ID NO:52或SEQ ID NO:53的核酸序列具有至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、至少或约99.9%、或者100%的序列一致性。

在一些实施方案中,葡糖淀粉酶与SEQ ID NO:40的蛋白质序列具有至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、或者100%的序列一致性。

在一些实施方案中,编码葡糖淀粉酶的重组核酸包括小孢根霉基因(例如,对应于UniProt号A0A0C7BD37)。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸是经密码子优化的。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸包括SEQ ID NO:54。

在一些实施方案中,编码葡糖淀粉酶的重组核酸与SEQ ID NO:54的核酸序列具有至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、至少或约99.9%、或者100%的序列一致性。

在一些实施方案中,葡糖淀粉酶与SEQ ID NO:41的蛋白质序列包括至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、或者100%的序列一致性。

在一些实施方案中,编码葡糖淀粉酶的重组核酸包括米根霉基因(例如,amyA,对应于UniProt号B7XC04)。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸是经密码子优化的。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸包括SEQ ID NO:50或SEQ ID NO:51。

在一些实施方案中,编码葡糖淀粉酶的重组核酸与SEQ ID NO:50或SEQ ID NO:51的核酸序列具有至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、至少或约99.9%、或者100%的序列一致性。

在一些实施方案中,葡糖淀粉酶与SEQ ID NO:39的蛋白质序列具有至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、或者100%的序列一致性。

宿主细胞

可以用于发酵以产生乙醇的任何类型的细胞均可以与本发明的方面相容,包含真菌细胞(如酵母细胞)。酵母细胞的非限制性实例包含获自例如酵母属(Saccharomycesspp)、裂殖酵母属(Schizosaccharomyces spp.)、毕赤酵母属(Pichia spp)、法夫酵母属(Paffia spp.)、克鲁维酵母属(Kluyveromyces spp.)、念珠菌属(Candida spp.)、踝节菌属(Talaromyces spp.)、酒香酵母属(Brettanomyces spp.)、管囊酵母属(Pachysolenspp.)、德巴利氏酵母属(Debaryomyces spp.)、亚罗酵母属(Yarrowia spp.)和工业多倍体酵母菌株的酵母细胞。在某些实施方案中,酵母细胞是酿酒酵母细胞。真菌细胞的其他实例包含获自曲霉属(Aspergillus spp.)、青霉属(Penicillium spp.)、镰刀菌属(Fusariumspp.)、根霉菌属(Rhizopus spp.)、支顶孢属(Acremonium spp.)、脉孢菌属(Neurosporaspp.)、粪壳菌属(Sordaria spp.)、稻瘟菌属(Magnaporthe spp.)、异水霉属(Allomycesspp.)、黑粉菌属(Ustilago spp.)、葡萄孢属(Botrytis spp.)、和木霉菌属(Trichodermaspp.)的细胞。

在一些实施方案中,细胞来自全基因组复制后的酵母菌种(如酿酒酵母)(Wolfe(2015)PLoS Biol 13(8):e1002221)。

发酵条件

本文提供了用于产生乙醇的新型方法,该方法包括使经工程化的酵母发酵。在一些实施方案中,用于产生乙醇的方法包含在导致乙醇的产生的条件下将细胞(如本文所描述的经工程化的细胞)与发酵基质一起培养。

发酵基质可以包括淀粉。淀粉可以获自天然来源(如植物来源)。淀粉也可以获自具有高淀粉或糖含量的原料(包含(但不限于)玉米、甜高粱、水果、甘薯、稻米、大麦、甘蔗、甜菜、小麦、木薯,马铃薯、木薯粉、竹芋、豌豆、或西米)。在一些实施方案中,发酵基质来自木质纤维素生物质(如木材、稻草、草或藻类生物质(如微藻类和大藻类))。在一些实施方案中,发酵基质来自草、树、或农业剩余物和林业剩余物(如玉米芯和茎、稻秸、锯屑和木屑)。发酵基质还可以包括糖(如葡萄糖或蔗糖)。

在一些实施方案中,发酵基质包括干磨的乙醇原料(如玉米醪)。在一些实施方案中,发酵基质包括液化玉米醪(LCM)。在一些实施方案中,发酵基质包括玉米湿磨原料(如轻浸渍水/液化物(LSW/LQ)。

用于本文所描述的经工程化的酵母的发酵的培养基可以补充有各种组分。例如,用于本文所描述的经工程化的酵母的发酵的培养基可以补充有葡糖淀粉酶。在一些实施方案中,葡糖淀粉酶是Spirizyme

在一些实施方案中,补充组分(如葡糖淀粉酶)的浓度和量是优化的。例如,在一些实施方案中,以约1%、5%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%或超过30%的浓度添加葡糖淀粉酶。在一些实施方案中,添加一定量的葡糖淀粉酶以达到大约0.33AGU/g干固体的剂量。在一些实施方案中,添加一定量的葡糖淀粉酶以达到大约0.0825AGU/g干固体的剂量。在一些实施方案中,添加一定量的葡糖淀粉酶以达到大约0.05、0.06、0.07、0.08、0.09、0.1、0.15、0.2、0.25、0.3、0.35、0.4、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95、或1.0AGU/g干固体的剂量。

应当理解的是,可以在任何类型和任何组成的培养基中培养本文所描述的经工程化的酵母,并且可以通过如本领域普通技术人员所理解的常规实验来使发酵条件优化。在一些实施方案中,使发酵条件优化以产生乙醇。可以优化的参数包含(但不限于)温度、糖浓度、pH、发酵时间、搅拌速率、和/或接种量。

在一些实施方案中,控制用于本文所描述的经工程化的酵母的培养基的温度以用于优化的乙醇产生。(参见例如,Zabed et al.,Sci World J(2014):1-11;Charoenchai etal.,Am J Enol Vitic(1998)49:283-8;MarelneCot et al.,FEMS Yeast Res(2007)7:22-32;Liu et al.,Bioresour Technol(2008)99:847-54;Phisalaphong et al.,J BiochemEng(2006)28:36-43)。多种因素可以影响培养用于乙醇产生的经工程化的酵母的最优温度(例如,细胞类型、生长培养基和生长条件)。在一些实施方案中,培养的温度在25℃与40℃之间(包含25℃和40℃)。在某些实施方案中,温度为约25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、或两者之间的任何值。在一些实施方案中,温度在30℃与35℃之间(包含30℃和35℃)、或者为两者之间的任何值。在一些实施方案中,温度为大约33℃。在某些实施方案中,温度为大约33.3℃。

在一些实施方案中,控制本文所描述的培养基的pH以用于最优的乙醇产生(Linet al.,Biomass-Bioenergy(2012)47:395-401)。在一些实施方案中,本文所描述的经工程化的细胞的培养或发酵混合物的pH在4.0与6.0之间的范围。在一些实施方案中,将pH维持在4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、5.0、5.1、5.2、5.3、5.4、5.5、5.6、5.7、5.8、5.9、或6.0以用于至少一部分孵育。在一些实施方案中,将pH维持在5.0与5.5之间的范围。

在一些实施方案中,控制培养时间以用于最优的乙醇产生(Lin et al.,Biomass-Bioenergy(2012)47:395-401)。在一些实施方案中,将经工程化的酵母培养大约24-72小时。在一些实施方案中,将经工程化的酵母培养大约12、18、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、78、80、90、96小时、或超过96小时。在一些实施方案中,将本文所描述的经工程化的酵母培养大约48至72小时。在一些实施方案中,约48小时的培养(发酵)时间是商业规模的乙醇发酵过程的代表性时间。因此,可以使用48小时的时间点来比较不同酵母菌株的发酵性能。

可以在乙醇产生过程中测量或调整反应参数。反应参数的非限制性实例包含生物学参数(例如,生长速率、细胞尺寸、细胞数量、细胞密度、细胞类型、或细胞状态等)、化学参数(例如,pH、氧化还原电位、反应基质和/或产物的浓度、溶解的气体的浓度(如氧气浓度和CO

在60℃、0.01N硫酸流动相、0.6mL/min流速下使用具有Aminex HPX-87H柱(300mm×7.8mm)的HPLC测定糖和低碳水化合物的含量。

测定和测试条件

测试1

本公开的方面涉及经工程化的酵母,该经工程化的酵母能够在测试1条件下在48小时内产生至少100g/kg的乙醇并且产生少于1.5g/kg的残余葡萄糖,测试1条件涉及菌株在33.3℃在33%DS玉米醪中的表征。

如本文所使用的,“测试1”条件指以下:

将菌株接种至YPD板,并且在30℃孵育直至可见单菌落(1-2天)。将来自YPD板的细胞刮入pH 7.0的无菌磷酸盐缓冲液中,并且测量光密度(OD600)。使用型号Genesys 20可见光分光光度计(Thermo Scientific)在600nm波长和1cm路径长度下测量光密度。在摇瓶中接种达到0.1的初始OD600所必需的体积的细胞浆。接种体积通常为约66μl。在即将接种之前,将以下材料添加至每个250ml带有挡板的摇瓶:50克的液化玉米醪、190μl的500g/L经过滤灭菌的尿素、以及2.5μl的100mg/ml氨苄青霉素的经过滤灭菌的原料。对于含有Ethanol

测试2

本公开的方面涉及经工程化的酵母(如酿酒酵母),该经工程化的酵母能够在测试2条件下在48小时内产生至少100g/kg的乙醇并且产生少于1.5g/kg的残余葡萄糖,测试2条件涉及菌株在33.3℃在33%DS玉米醪中的表征。

如本文所使用的,“测试2”条件指以下:

将菌株接种至YPD板,并且在30℃孵育直至可见单菌落(1-2天)。将来自YPD板的细胞刮入pH 7.0的无菌磷酸盐缓冲液中,并且测量光密度(OD600)。使用型号Genesys 20可见光分光光度计(Thermo Scientific)在600nm波长和1cm路径长度下测量光密度。在摇瓶中接种达到0.1的初始OD600所必需的体积的细胞浆。接种体积通常为约66μl。在即将接种之前,将以下材料添加至每个250ml带有挡板的摇瓶:50克的液化玉米醪、190μl的500g/L经过滤灭菌的尿素、以及2.5μl的100mg/ml氨苄青霉素的经过滤灭菌的原料。摇瓶接收达到0.33AGU/g干固体的剂量的一定量的葡糖淀粉酶(Spirizyme Fuel HS

测试4

本公开的方面涉及经工程化的酵母菌株,该经工程化的酵母菌株在测试4条件下与未经修饰的参考菌株相比在48小时时表现出至少30%的甘油降低,测试4条件涉及在同步糖化发酵(SSF)摇瓶测定中评估菌株。

如本文所使用的,“测试4条件”指以下:

将菌株接种至ScD-ura板,并且在30℃孵育直至可见单菌落(2-3天)。将来自ScD-ura板的细胞刮入无菌摇瓶培养基中,并且测量光密度(OD600)。使用型号Genesys 20分光光度计(Thermo Scientific)在600nm波长和1cm路径长度下测量光密度。在摇瓶中接种细胞浆以达到0.1的初始OD600。在即将接种之前,将50mL的摇瓶培养基添加至250mL带有挡板的摇瓶,该摇瓶用含有4ml灭菌芥花油的气锁密封。摇瓶培养基由725g部分水解的玉米淀粉、150g经过滤的轻浸渍水、10g水、25g葡萄糖和1g尿素组成。将菌株在30℃在定轨振荡器中以100rpm振荡孵育72小时。采集样品,并且通过HPLC分析发酵过程中液体培养基中的代谢物浓度。

在一些实施方案中,本文所描述的经工程化的酵母菌株比参考菌株产生至少少30%的甘油。在一些实施方案中,参考菌株是对照菌株菌株1。在一些实施方案中,本文所描述的经工程化的酵母菌株在48小时时比参考菌株产生少至少10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、或至少50%的甘油。

乙醇产率

本文所描述的经工程化的酵母产生高乙醇浓度。乙醇浓度可以由克/千克(g/kg)标度或克/升(g/L)标度表示。

在一些实施方案中,发酵结束时发酵液体培养基中的乙醇浓度为约或至少10g/kg、约或至少15g/kg、约或至少20g/kg、约或至少25g/kg、约或至少30g/kg、约或至少35g/kg、约或至少40g/kg、约或至少45g/kg、约或至少50g/kg、约或至少55g/kg、约或至少60g/kg、约或至少65g/kg、约或至少70g/kg、约或至少75g/kg、约或至少80g/kg、约或至少85g/kg、约或至少90g/kg、约或至少95g/kg、约或至少100g/kg、约或至少105g/kg、约或至少110g/kg、约或至少115g/kg、约或至少120g/kg、约或至少125g/kg、约或至少130g/kg、约或至少135g/kg、约或至少140g/kg、约或至少145g/kg、约或至少150g/kg、约或至少155g/kg、约或至少160g/kg、约或至少165g/kg、约或至少170g/kg、约或至少175g/kg、约或至少180(克/千克)(包含全部中间值和范围)、或超过180g/kg。

在一些实施方案中,发酵结束时发酵液体培养基中的乙醇浓度为约或至少10g/kg、约或至少15g/kg、约或至少20g/kg、约或至少25g/kg、约或至少30g/kg、约或至少35g/kg、约或至少40g/kg、约或至少45g/kg、约或至少50g/kg、约或至少55g/kg、约或至少60g/kg、约或至少65g/kg、约或至少70g/kg、约或至少75g/kg、约或至少80g/kg、约或至少85g/kg、约或至少90g/kg、约或至少95g/kg、约或至少100g/kg、约或至少105g/kg、约或至少110g/kg、约或至少115g/kg、约或至少120g/kg、约或至少125g/kg、约或至少130g/kg、约或至少135g/kg、约或至少140g/kg、约或至少145g/kg、约或至少150g/kg、约或至少155g/kg、约或至少160g/kg、约或至少165g/kg、约或至少170g/kg、约或至少175g/kg、约或至少180(克/千克)(包含全部中间值和范围)、或超过180g/kg。

可以通过将乙醇浓度除以消耗的总葡萄糖来计算乙醇质量产率。由于葡萄糖可以以游离葡萄糖的形式存在或者在寡聚物中结合,因此需要同时考虑两种情况。为了测定在发酵开始和发酵结束时存在的总葡萄糖,测定总葡萄糖当量测量值(TGE)。TGE测量如下执行。使用RI检测用HPLC测量葡萄糖。使用10mM H

可以将乙醇产率计算为相对于参考酵母菌株(例如,不含有本文所描述的经工程化的酵母菌株的基因修饰中的一种或更多种的参考菌株)的增加。在一些实施方案中,乙醇产率的公式可以定义为:(时间终点处的乙醇滴度-时间零点处的乙醇滴度)除以时间零点处的TGE。在一些实施方案中,使用以下被称为“测试3”的公式确定乙醇产率。

测试3

在一些实施方案中,本文所描述的经工程化的菌株中的乙醇产率相对于参考菌株的增加为约或至少0.05%、约或至少0.1%、约或至少0.2%、约或至少0.3%、约或至少0.4%、约或至少0.5%、约或至少0.6%、约或至少0.7%、约或至少0.8%、约或至少0.9%、约或至少1%、约或至少1.1%、约或至少1.2%、约或至少1.3%、约或至少1.4%、约或至少1.5%、约或至少1.6%、约或至少1.7%、约或至少1.8%、约或至少1.9%、约或至少2%、约或至少2.5%、约或至少3%、约或至少3.5%、约或至少4%、约或至少4.5%、或者约或至少5%(相对于参考菌株)(包含全部中间值和范围)、或超过5%。

重组核酸的表达

如本领域普通技术人员将知晓的,本文所描述的酶的同源基因可以获自其他物种,并且可以通过同源性检索来鉴别(例如,通过蛋白质BLAST检索,蛋白质BLAST检索在美国国家生物技术信息中心(NCBI)互联网网站(www.ncbi.nlm.nih.gov)可获得)。可以例如通过PCR扩增和/或限制性消化从来自含有给定基因的DNA的任何来源的DNA克隆基因。在一些实施方案中,基因是合成的。可以使用获得或合成编码酶的基因的任何手段。

本公开涉及上文讨论的编码酶的基因的重组表达、其功能修饰和变体、以及与其有关的应用。可以通过常规技术鉴别与本发明相关的核酸的同源物和等位基因。同源物和等位基因将通常分别与核酸和多肽的序列共有至少75%的核苷酸一致性和/或至少90%的氨基酸一致性,在一些情况下将共有至少90%的核苷酸一致性和/或至少95%的氨基酸一致性,并且在其他情况下将共有至少95%的核苷酸一致性和/或至少99%的氨基酸一致性。可以使用NCBI(Bethesda,Maryland)开发的各种可公开获得的软件工具来计算同源性,可以通过NCBI互联网网站获得该软件工具。示例性工具包含在NCBI互联网网站(www.ncbi.nlm.nih.gov)也可获得的BLAST软件。可以使用MacVector序列分析软件(Oxford Molecular Group)获得双序列比对和ClustalW比对(BLOSUM30矩阵设置)以及Kyte-Doolittle亲水性分析。本文还预期上述核酸的沃森-克里克补体(Watson-Crickcomplement)。

例如,可以使用BLAST(美国国家生物信息中心(NCBI)基本局部比对检索工具)2.2.31版软件利用默认参数执行比对。可以使用利用以下默认参数的标准蛋白质BLAST来测定氨基酸序列之间的氨基酸序列一致性%:最大靶序列:100;短查询:自动调整短输入序列的参数;预期阈值:10;字长:6;查询范围内的最大匹配数:0;矩阵:BLOSUM62;空位成本(Gap Cost):(存在:11,延伸:1);组成调整:条件式组成评分矩阵调整;过滤器:未选择;掩码:未选择。可以使用利用以下默认参数的标准核苷酸BLAST来测定核酸序列之间的核酸序列一致性%:最大靶序列:100;短查询:自动调整短输入序列的参数;预期阈值:10;字长:28;查询范围内的最大匹配数:0;匹配/不匹配评分:1,-2;空位成本:线性;过滤器:低复杂度区;掩码:仅用于查找表的掩码。使用利用默认参数的NCBI BLAST 2.2.31版算法相对于参考序列具有XX%(例如,80%)的一致性评分的序列被认为与参考序列至少XX%相同或等同、与参考序列具有XX%的序列一致性。

本公开还涉及简并核酸,该简并核酸包含存在于天然材料中的那些的供替代的密码子。例如,丝氨酸残基由密码子TCA、AGT,TCC、TCG、TCT和AGC编码。为了编码丝氨酸残基的目的,六种密码子中的每种是等同的。因此,对于本领域普通技术人员将显而易见的是,可以采用编码丝氨酸的核苷酸三联体中的任何一种在体外或体内引导蛋白质合成设备,以将丝氨酸残基并入延伸多肽中。类似地,编码其他氨基酸残基的核苷酸序列三联体包含(但不限于):CCA、CCC、CCG和CCT(脯氨酸密码子);CGA、CGC、CGG、CGT、AGA和AGG(精氨酸密码子);ACA、ACC、ACG和ACT(苏氨酸密码子);AAC和AAT(天冬酰胺密码子);以及ATA、ATC和ATT(异亮氨酸密码子)。其他氨基酸残基可以类似地由多个核苷酸序列编码。因此,本公开包含由于遗传密码的简并而在密码子序列方面与生物学分离的核酸不同的简并核酸。

本文还公开了优化细胞中乙醇产生的策略。乙醇的优化产生指按照优化策略产生比在不存在优化策略的情况下所达到的更高量的乙醇。在一些实施方案中,乙醇的优化产生涉及在编码参与乙醇产生的酶的基因在细胞中重组表达之前修饰编码参与乙醇产生的酶的基因。在一些实施方案中,修饰涉及用于在细胞(例如,宿主生物体,如酵母)中表达的密码子优化。可以在本领域普通技术人员可获得的数据库(如密码子使用数据库(kazusa.or.jp/codon/))中访问各种生物体的密码子使用。密码子优化(包含各种生物体的最优密码子的鉴别)和用于实现密码子优化的方法是本领域普通技术人员所熟知的,并且可以使用标准方法来实现。应当理解的是,本文所描述的核酸序列和蛋白质序列中任何一种的各种经密码子优化的形式都可以用于本文公开的产物和方法中。

在一些实施方案中,可以通过以与本文所描述的酶相同的途径起作用的酶的操作(例如,增加在靶标酶(如本文所描述的酶)的上游或下游起作用的酶或其他因子的表达)来优化细胞中乙醇的产生。这可以通过使用任何标准方法过度表达上游或下游因子来实现。

在一些实施方案中,在编码酶的基因在细胞中重组表达之前对该基因进行修饰涉及在该编码酶的基因在细胞中重组表达之前在该基因中进行一个或更多个突变。例如,突变可以涉及单个核苷酸或多个核苷酸的置换或缺失。在一些实施方案中,编码酶的基因中的一个或更多个核苷酸的突变将造成该酶的突变(如一个或更多个氨基酸的置换或缺失)。

附加的变化可以包含如通过附加的游离型表达(episomal expression)来增加乙醇产生中活性途径的基因组分的拷贝数。在一些实施方案中,可以通过随机诱变筛选或者通过已知突变的筛选来进行导致增强的乙醇产生的乙醇产生的组分或其他途径的组分中的突变的筛选。在一些实施方案中,基因组片段的鸟枪法克隆可以用于通过筛选具有用于增加的乙醇产生的这些片段的细胞或生物体来鉴别导致乙醇产生增加的基因组区。在一些情况下,一个或更多个突变可以在同一细胞或生物体中组合。

在一些实施方案中,通过选择各种强度的启动子以驱动基因的表达来增加乙醇产生。在一些实施方案中,这可以包含高拷贝数质粒或低拷贝数质粒或中等拷贝数质粒的选择。通过结构(如茎环)的引入或消除,转录终止的步骤也可以靶向基因表达的调控。

本文还预期含有本文所描述的基因编码的野生型残基、突变的残基、或经密码子优化的残基的蛋白质或多肽以及编码该多肽的分离的核酸分子。如本文所使用的,术语“蛋白质”和“多肽”被可互换地使用,因此术语多肽可以用于指全长多肽,并且也可以用于指全长多肽的片段。

在本文所描述的一些实施方案中,细胞表达本文公开的基因中的一种或更多种的内源拷贝、本文公开的基因中的一种或更多种的重组拷贝、或本文公开的基因中的一种或更多种的内源拷贝和用于增加的乙醇产生的本文公开的基因中的一种或更多种的重组拷贝。

如本文所使用的,术语“过度表达”或“增加的表达”指与参考细胞(例如,相同细胞类型的野生型细胞或者未经修饰(如基因修饰)的相同细胞类型的细胞)相比,在细胞、细胞类型或细胞状态中基因或基因产物的增加的表达水平。例如,在一些实施方案中,经工程化的细胞中编码GapN酶和葡糖淀粉酶的一个或更多个基因的过度表达造成相对于不过度表达编码GapN酶和葡糖淀粉酶的一个或更多个基因的参考细胞(如野生型细胞)的较高的乙醇产生。在一些实施方案中,通过重组表达内源基因从而增加基因的表达来实现本文所描述的经工程化的细胞中基因的过度表达或增加的表达。在一种些实施方案中,通过重组表达对于经工程化的细胞为非内源的基因从而增加基因的表达来实现本文所描述的经工程化的细胞中基因的过度表达或增加的表达。

如本文所使用的,术语“外源”指源自感兴趣的微生物之外的任何材料。例如,术语“外源”可以应用于在基因修饰之前不以特定生物体的天然形式存在的遗传物质(即,这样的外源性遗传物质也可以称为异源性),或者也可以应用于并非源自特定生物体的酶或其他蛋白质。

如本文所公开的和本领域普通技术人员所理解的,可以以几种方式(包含通过降低相关基因的表达、破坏相关基因、在相关基因中引入一个或更多个突变(造成具有降低、减弱或消除的酶促活性的蛋白质的产生)、和/或使用特定的抑制剂以降低、减弱或消除酶促活性(包含使用核酸,如微RNA(miRNA)或小干扰RNA(siRNA)等))降低、减弱或消除一个或更多个基因和基因产物的活性或表达。

在一些实施方案中,使用运载体表达本文公开的基因中的一个或更多个。在一些实施方案中,运载体在细胞中自主复制。在其他实施方案中,运载体被整合到细胞的基因组中。运载体可以含有一个或更多个核酸内切酶限制性位点,该核酸内切酶限制位点被限制性核酸内切酶切割以插入和连接含有本文所描述的基因的核酸,以产生能够在细胞中复制的重组运载体。运载体通常由DNA组成,尽管RNA运载体也是可用的。

克隆运载体包含(但不限于):质粒、F黏粒(fosmid)、噬菌粒、病毒基因组和人工染色体。如本文所使用的,术语“表达运载体”或“表达构建体”指重组或合成生成的、具有一系列容许特定核酸在宿主细胞(例如,微生物,如酵母细胞)中转录的指定核酸元件的核酸构建体。在一些实施方案中,将本文所描述的基因的核酸序列插入克隆运载体,使得其可操作地连接至调控序列,并且在一些实施方案中表达为RNA转录物。

在一些实施方案中,运载体含有一种或更多种标志物以鉴别用重组运载体转化或转染的细胞。标志物包含例如编码增加或降低对化合物(例如,抗生素)的抗性或敏感性的蛋白质的基因、编码活性通过本领域普通技术人员已知的标准测定可检测的酶(例如,β-半乳糖苷酶、荧光素酶或碱性磷酸酶)的基因、以及显著地影响经转化或经转染的细胞、宿主、菌落或斑块的表型的基因(例如,编码荧光蛋白(如绿色荧光蛋白))。在某些实施方案中,标志物是amdS标志物或URA3标志物。

当编码序列和调控序列共价地连接并且编码序列的表达或转录受到调控序列的影响或控制时,编码序列和调控序列被称为“可操作地连接”。如果编码序列被翻译成功能蛋白,则如果5’调控序列中启动子的诱导转录编码序列,并且如果编码序列与调控序列之间的联接的性质不(1)造成移码突变的引入;(2)干扰启动子区指导编码序列的转录的能力、或(3)干扰相应RNA转录物被翻译成蛋白质的能力,则编码序列和调控序列被称为是可操作地连接。因此,如果启动子区转录编码序列并且转录物可以被翻译成感兴趣的蛋白质或多肽,则启动子区与编码序列可操作地连接。

在一些实施方案中,编码本文所描述的蛋白质中的任何一种的核酸受调控序列(例如,增强子序列)的控制。在一些实施方案中,核酸在启动子的控制下表达。启动子可以是天然启动子(例如,基因在其内源环境中的启动子,该启动子提供基因表达的正常调控)。可替代地,启动子可以是与基因的天然启动子不同的启动子,例如,启动子与基因在其内源环境中的启动子不同。在一些实施方案中,修饰增加细胞中的乙醇产生或减少细胞中的甘油产生的基因的启动子。“经修饰的启动子”指核苷酸序列已经改变的启动子。在一些实施方案中,相对于未经修饰的启动子,经修饰的启动子具有增加的或减小的转录活性。在一些实施方案中,通过一个或多个核苷酸缺失、一个或多个核苷酸插入或一个或多个核苷酸突变、或其任何组合来获得经修饰的启动子。在一些实施方案中,例如通过同源重组、基因靶向、敲除、敲入、定点突变、或人工锌指核酸酶介导的策略通过随机或拟随机事件(例如,辐照或非靶向的核苷酸整合以及随后的选择)来改变启动子。本文还预期本领域普通技术人员已知的用于修饰启动子以增加启动子的转录活性的其他方法。

如本文所使用的,“异源启动子”是和与其可操作地连接的DNA序列的转录并非天然地或正常地相关的启动子,或者并非天然地或正常地控制与其可操作地连接的DNA序列的转录的启动子。在一些实施方案中,本文所描述的核酸序列或基因受异源启动子的控制。

在一些实施方案中,启动子是真核启动子。真核启动子的非限制性实例包含如本领域普通技术人员已知的TDH3、PGK1、PKC1、TDH2、PYK1、TPI1、AT1、CMV、EF1a、SV40、Ubc、人β肌动蛋白、CAG、TRE、UAS、Ac5、多角体蛋白、CaMKIIa、GAL1、GAL10、TEF1、GDS、ADH1、CaMV35S、Ubi、H1、U6和TEF1(参见,例如,Addgene网站:blog.addgene.org/plasmids-101-the-promoter-region)。在一些实施方案中,启动子是原核启动子(例如,噬菌体启动子或细菌启动子)。噬菌体启动子的非限制性实例包含Pls1con、T3、T7、SP6、PL。细菌启动子的非限制性实例包含Pbad、PmgrB、Ptrc2、Plac/ara、Ptac、Pm。

在一些实施方案中,启动子是诱导型启动子。如本文所使用的,“诱导型启动子”是受到分子的存在或不存在控制的启动子。诱导型启动子的非限制性实例包含化学调控的启动子和物理调控的启动子。对于化学调控的启动子,转录活性由一种或更多种化合物(如醇、四环素、半乳糖、类固醇、金属、或其他化合物)调控。对于物理调控的启动子,转录活性受现象(如光或温度)的调控。四环素调控的启动子的非限制性实例包含脱水四环素(aTc)响应性启动子和其他四环素响应性启动子系统(例如,四环素阻遏蛋白(tetR)、四环素操纵子序列(tetO)和四环素反式激活子融合蛋白(tTA))。类固醇调控的启动子的非限制性实例包含基于大鼠糖皮质激素受体、人雌激素受体、蛾蜕皮激素受体的启动子,以及来自类固醇/类维生素A/甲状腺受体超家族的启动子。金属调控的启动子的非限制性实例包含来源于金属硫蛋白(结合并且螯合金属离子的蛋白质)基因的启动子。发病机制调控的启动子的非限制性实例包含由水杨酸、乙烯或苯并噻二唑(BTH)诱导的启动子。温度/热诱导型启动子的非限制性实例包含热激启动子。光调控的启动子的非限制性实例包含来自植物细胞的光响应性启动子。在某些实施方案中,诱导型启动子是半乳糖诱导型启动子。在一些实施方案中,通过一种或更多种生理条件(例如,pH、温度、辐射、渗透压、盐水梯度、细胞表面结合、或者一种或更多种外在诱导剂或内在诱导剂的浓度)来诱导诱导型启动子。外在诱导物或诱导剂的非限制性实例包含氨基酸和氨基酸类似物、糖类和多糖、核酸、蛋白质转录激活子(activator)和阻遏子(repressor)、细胞因子、毒素、石油基化合物、含金属的化合物、盐、离子、酶底物类似物、激素或其任何组合。

在一些实施方案中,启动子是组成型启动子。如本文所使用的,“组成型启动子”指允许基因的连续转录的未经调控的启动子。组成型启动子的非限制性实例包含CP1、CMV、EF1a、SV40、PGK1、Ubc、人β肌动蛋白、CAG、Ac5、多角体蛋白、TEF1、GDS、CaM35S、Ubi、H1和U6。本文也预期了本领域普通技术人员已知的其他诱导型启动子或组成型启动子。

在一些实施方案中,通过引入异源核酸(例如,DNA和/或RNA)来使细胞工程化。可以将该异源核酸置于转录元件的可操作控制下,以容许异源DNA或RNA在本文所描述的经工程化的细胞中的表达。使用酿酒酵母在实施例部分中证明了用于产生乙醇的基因的异源表达。本文还预期了使用本文所描述的新型方法在其他细胞(包含其他真菌细胞)中产生乙醇。

基因表达所需的调控序列的确切性质可能在物种或细胞类型之间变化,但通常视需要包含分别涉及转录和翻译的起始的5’非转录序列和5’非翻译序列(如TATA框、加帽序列、CAAT序列等)。特别地,这样的5’非转录调控序列将包含启动子区,该启动子区包含用于可操作地连接的基因的转录控制的启动子序列。调控序列还可以包含增强子序列或上游激活子序列。本文公开的运载体可以包含5’前导序列(leader)或信号序列。调控序列还可以包含终止子序列。在一些实施方案中,终止子序列在转录期间标记DNA中基因的末端。适合于诱导异源生物体中的本文所描述的一个或更多个基因的表达的一种或更多种适当的运载体的选择和设计在本领域普通技术人员的能力和判断范围之内。

含有表达必需元件的表达运载体是可商业获得的,并且是本领域普通技术人员已知的(参见,例如,Molecular Cloning:A Laboratory Manual,J.Sambrook,et al.,eds.,Fourth Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NewYork,2012,或Current Protocols in Molecular Biology,F.M.Ausubel,et al.,eds.,John Wiley&Sons,Inc.,New York,2010)。

在一些实施方案中,使用本领域普通技术人员已知的标准方法将本文公开的重组表达的基因中的一个或更多个引入经工程化的细胞中。非限制性实例包含转化(例如,化学转化、电穿孔等)、转导、粒子轰击等。在一些实施方案中,本文公开的基因中的一个或更多个被整合到细胞的基因组中。

核酸和蛋白质序列

GapN基因序列和氨基酸序列对于本领域普通技术人员而言是公知的。GapN基因序列和蛋白质序列的非限制性实例包含:

来自蜡样芽孢杆菌的经密码子优化的GAPN DNA序列(SEQ ID NO:45):

ATGACAACATCAAATACCTACAAATTCTATCTAAACGGTGAATGGAGAGAATCTTCCTCTGGAGAAACTATTGAGATACCATCACCATACTTACATGAAGTGATCGGACAGGTTCAAGCAATCACTAGAGGAGAGGTTGACGAAGCGATTGCTAGCGCTAAGGAAGCACAGAAATCTTGGGCTGAGGCATCTCTACAAGATAGAGCTAAGTACTTGTACAAATGGGCAGATGAATTGGTAAACATGCAAGACGAAATCGCCGATATCATCATGAAGGAAGTGGGCAAGGGTTACAAAGACGCTAAAAAGGAGGTTGTTAGAACCGCCGATTTCATCAGATACACCATTGAAGAGGCACTCCATATGCACGGTGAATCCATGATGGGCGATTCATTTCCTGGTGGAACAAAATCTAAGCTAGCAATAATCCAAAGAGCGCCTCTGGGTGTAGTCTTAGCCATCGCTCCATTCAATTACCCTGTAAACCTTTCTGCTGCAAAATTGGCACCAGCCTTAATTATGGGTAACGCTGTGATATTCAAGCCAGCAACTCAGGGTGCTATTTCCGGCATCAAAATGGTTGAAGCTTTGCATAAGGCTGGTTTGCCAAAGGGTTTGGTTAACGTTGCCACAGGTAGAGGTAGCGTCATAGGCGATTATTTGGTCGAACACGAAGGGATAAACATGGTTTCCTTCACCGGTGGCACTAACACTGGTAAGCATTTAGCAAAAAAGGCCTCAATGATTCCATTAGTCTTGGAACTTGGTGGCAAAGATCCAGGCATCGTTCGTGAAGATGCAGACCTACAAGATGCTGCGAATCATATCGTATCTGGTGCGTTCAGTTACTCAGGGCAGAGATGTACAGCCATTAAGAGAGTCCTTGTTCATGAAAATGTTGCTGATGAACTGGTATCATTGGTTAAGGAACAAGTGGCAAAGCTTTCTGTGGGATCACCAGAGCAAGATTCAACAATTGTTCCTCTGATTGACGATAAGTCCGCTGATTTTGTTCAGGGTTTAGTGGACGATGCAGTCGAAAAGGGCGCTACAATTGTCATTGGGAACAAGAGAGAACGTAACCTAATCTACCCAACATTGATTGATCACGTCACAGAGGAAATGAAAGTTGCCTGGGAGGAACCATTCGGTCCTATTCTTCCAATTATTAGAGTTAGTAGCGACGAGCAAGCTATTGAAATTGCAAATAAGAGTGAGTTCGGATTACAAGCTTCTGTGTTTACCAAAGACATAAACAAGGCATTCGCAATCGCAAATAAGATTGAGACTGGTTCAGTGCAAATCAACGGTAGAACAGAGAGAGGACCAGATCACTTTCCTTTTATCGGGGTTAAGGGATCTGGGATGGGTGCCCAAGGCATCAGAAAGTCTTTGGAATCTATGACTAGAGAAAAAGTTACTGTCTTAAATCTCGTATGA。

来自蜡样芽孢杆菌的GapN蛋白质序列(SEQ ID NO:42):

MTTSNTYKFYLNGEWRESSSGETIEIPSPYLHEVIGQVQAITRGEVDEAIASAKEAQKSWAEASLQDRAKYLYKWADELVNMQDEIADIIMKEVGKGYKDAKKEVVRTADFIRYTIEEALHMHGESMMGDSFPGGTKSKLAIIQRAPLGVVLAIAPFNYPVNLSAAKLAPALIMGNAVIFKPATQGAISGIKMVEALHKAGLPKGLVNVATGRGSVIGDYLVEHEGINMVSFTGGTNTGKHLAKKASMIPLVLELGGKDPGIVREDADLQDAANHIVSGAFSYSGQRCTAIKRVLVHENVADELVSLVKEQVAKLSVGSPEQDSTIVPLIDDKSADFVQGLVDDAVEKGATIVIGNKRERNLIYPTLIDHVTEEMKVAWEEPFGPILPIIRVSSDEQAIEIANKSEFGLQASVFTKDINKAFAIANKIETGSVQINGRTERGPDHFPFIGVKGSGMGAQGIRKSLESMTREKVTVLNLV。

葡糖淀粉酶基因和蛋白质序列对于本领域普通技术人员而言是公知的。葡糖淀粉酶基因和蛋白质序列的非限制性实例包含:

来自扣囊复膜酵母的经密码子优化的葡糖淀粉酶DNA序列(GLA1基因)(SEQ IDNO:46):

ATGATTAGATTAACCGTATTCCTCACTGCAGTTTTTGCAGCAGTCGCTTCCTGTGTTCCAGTTGAATTGGATAAGAGAAATACAGGCCATTTCCAAGCATATTCTGGTTACACCGTAGCTAGATCAAACTTTACTCAATGGATTCACGAGCAACCAGCCGTATCATGGTACTATTTGCTTCAGAATATAGACTATCCAGAAGGACAATTCAAGTCTGCCAAGCCAGGGGTCGTTGTGGCTTCCCCTTCTACATCCGAACCTGATTACTTCTACCAATGGACTAGAGATACTGCTATCACCTTCTTGTCACTTATCGCGGAAGTTGAGGATCATTCTTTTTCAAATACTACACTAGCCAAGGTGGTTGAATACTACATCTCTAATACTTACACATTACAAAGAGTTTCCAACCCATCTGGTAACTTCGACAGTCCAAATCACGACGGTTTGGGAGAACCAAAGTTTAATGTTGATGATACAGCTTATACTGCATCTTGGGGTAGACCACAAAATGATGGCCCAGCGTTGAGAGCATACGCAATTTCAAGATACCTTAACGCAGTAGCAAAACACAACAACGGTAAGTTACTGCTCGCTGGACAAAACGGTATTCCTTACTCTTCAGCTTCTGATATCTACTGGAAGATTATCAAGCCAGATCTTCAACATGTGTCAACCCATTGGTCTACATCTGGTTTTGATTTGTGGGAAGAGAATCAGGGAACACATTTCTTTACTGCGTTGGTCCAGCTAAAAGCACTTAGTTACGGCATTCCTTTAAGTAAGACCTACAACGATCCTGGTTTCACTAGTTGGCTAGAAAAGCAAAAGGATGCTTTAAACTCTTATATCAACAGCTCTGGTTTCGTAAACTCTGGCAAAAAGCATATAGTGGAGAGCCCTCAACTATCTTCAAGAGGAGGGTTGGATAGCGCCACATACATTGCAGCCTTAATCACACATGATATTGGCGACGACGACACTTACACACCTTTCAACGTTGACAACTCCTATGTCTTGAACTCACTGTATTACCTTCTAGTCGATAACAAAAACCGTTACAAAATCAATGGTAACTACAAGGCCGGTGCTGCTGTTGGTAGATACCCAGAGGATGTTTACAACGGTGTTGGGACATCAGAAGGCAATCCATGGCAATTAGCTACAGCCTACGCCGGCCAAACATTTTACACACTGGCTTACAACTCATTGAAAAACAAAAAAAACTTAGTGATTGAAAAGTTGAACTACGACCTCTACAATTCTTTCATAGCAGATTTATCCAAGATCGATAGTTCTTACGCATCAAAAGACTCCTTGACTTTGACCTACGGTTCTGACAACTACAAAAACGTCATAAAGTCACTATTACAGTTTGGAGATTCATTCCTGAAGGTCTTGCTCGATCACATTGATGATAATGGACAATTAACAGAAGAGATCAATAGATACACAGGGTTCCAGGCTGGTGCTGTTAGTTTGACATGGTCCTCTGGTTCATTACTTTCAGCAAACCGTGCGAGAAATAAGTTGATTGAACTATTGTAG。

来自扣囊复膜酵母的经密码子优化的葡糖淀粉酶DNA序列(GLA1基因)(SEQ IDNO:47):

ATGATCAGACTTACAGTTTTCCTAACAGCCGTTTTCGCCGCCGTTGCATCATGTGTCCCAGTAGAATTGGATAAGAGAAACACCGGCCATTTCCAAGCATATTCAGGATACACCGTTGCACGTTCTAATTTCACACAATGGATTCATGAGCAGCCTGCTGTGTCCTGGTACTACTTATTACAAAACATTGATTATCCTGAGGGACAATTCAAGTCAGCGAAACCAGGCGTTGTGGTTGCTTCTCCATCCACTTCAGAACCAGACTACTTCTACCAGTGGACCCGTGACACAGCAATAACTTTCTTATCTTTGATAGCAGAAGTAGAAGATCACTCATTTTCAAATACAACTCTAGCTAAGGTTGTCGAATACTACATCTCTAACACATACACCCTACAAAGAGTTTCTAACCCATCTGGTAATTTCGATAGCCCAAATCACGATGGTCTGGGTGAACCAAAGTTCAACGTTGACGACACTGCTTACACTGCATCATGGGGCAGACCTCAAAACGACGGTCCAGCCTTAAGAGCTTACGCGATCTCAAGATATTTGAACGCAGTTGCCAAGCATAACAACGGTAAGCTATTGCTCGCGGGTCAAAATGGTATTCCTTACTCATCTGCATCAGATATCTACTGGAAGATTATCAAGCCAGATTTACAACATGTAAGTACTCACTGGAGTACATCTGGTTTTGACTTATGGGAAGAGAATCAAGGTACACATTTCTTTACTGCACTTGTCCAGTTAAAAGCTCTTTCATACGGTATACCTTTGTCTAAGACATATAACGATCCAGGATTTACTTCTTGGTTGGAAAAGCAGAAGGATGCCTTGAACTCTTACATCAATTCCAGCGGCTTCGTCAACTCCGGGAAAAAGCACATTGTCGAATCTCCTCAATTATCTAGTAGAGGGGGTCTTGATAGCGCTACTTACATCGCTGCTCTAATTACACATGATATTGGTGATGATGATACATACACTCCTTTTAACGTAGATAATTCTTATGTGCTGAACTCTTTATACTATCTGCTTGTAGACAACAAAAACAGATACAAGATCAACGGGAACTACAAAGCAGGAGCTGCAGTTGGTAGATACCCAGAAGATGTGTACAATGGAGTGGGAACCTCAGAGGGAAACCCATGGCAATTGGCGACAGCATACGCCGGCCAAACCTTTTACACACTGGCTTACAATTCTCTCAAAAACAAAAAAAATTTGGTTATTGAGAAGTTGAATTACGATCTATACAACTCCTTTATAGCTGACTTAAGTAAGATTGACTCCTCTTACGCTTCTAAGGATTCATTGACATTGACCTACGGCTCAGATAACTACAAAAATGTCATTAAGTCACTTTTACAATTCGGGGATTCTTTCTTGAAAGTCTTGTTGGACCATATTGATGATAATGGTCAGCTAACAGAGGAAATCAACAGATATACAGGTTTTCAAGCTGGCGCAGTTTCCCTCACTTGGAGTAGTGGTTCACTCTTATCTGCAAACAGAGCCAGAAACAAGTTGATCGAATTGCTTTAG。

来自扣囊复膜酵母的经密码子优化的葡糖淀粉酶DNA序列(GLA1基因)(SEQ IDNO:48):

ATGATCAGACTTACTGTTTTCCTCACAGCCGTTTTTGCAGCAGTAGCTTCTTGTGTTCCAGTTGAATTGGATAAGAGAAATACAGGTCATTTCCAAGCTTACTCTGGTTACACTGTGGCTAGATCTAACTTCACACAATGGATTCATGAACAGCCTGCCGTGAGTTGGTACTATTTGCTACAAAACATTGATTACCCTGAGGGTCAATTCAAATCAGCTAAGCCAGGTGTTGTTGTCGCGAGCCCATCAACTTCTGAACCAGATTACTTCTACCAATGGACTAGAGATACCGCAATAACCTTCTTATCTCTAATCGCAGAGGTAGAAGATCACTCTTTTTCAAATACTACCCTGGCAAAAGTGGTCGAGTACTACATCTCAAACACATACACCTTGCAGAGAGTCTCAAACCCATCAGGAAACTTCGATTCTCCTAATCATGACGGCTTAGGAGAACCAAAGTTTAATGTTGACGATACCGCTTATACTGCATCTTGGGGTAGACCACAGAATGATGGCCCTGCCTTACGTGCATACGCCATTTCCAGATATCTCAACGCTGTAGCGAAGCACAACAACGGTAAGCTGCTTTTAGCTGGTCAAAATGGGATACCATACTCTTCCGCTTCAGACATTTACTGGAAGATTATCAAACCAGACTTGCAGCATGTCAGTACACATTGGTCAACTTCTGGTTTTGATTTGTGGGAAGAGAACCAAGGCACTCACTTCTTTACAGCCTTGGTTCAACTAAAGGCATTGTCTTACGGAATCCCTTTGTCCAAGACATACAATGATCCTGGATTCACTAGTTGGCTAGAAAAGCAAAAGGATGCACTGAACTCATACATTAACAGTTCAGGCTTTGTGAACTCCGGTAAAAAGCATATTGTTGAAAGCCCACAACTATCTAGCAGAGGTGGTTTAGATTCTGCAACCTACATAGCAGCCTTGATCACACACGACATTGGGGATGACGATACATACACACCATTCAACGTCGACAATTCATACGTTTTGAATAGCTTATACTACCTACTGGTAGATAACAAAAACAGATATAAGATCAATGGCAACTACAAGGCCGGTGCTGCCGTAGGAAGATACCCTGAAGATGTCTACAACGGAGTTGGTACATCAGAAGGTAACCCATGGCAATTAGCAACAGCATATGCGGGCCAGACATTTTACACTTTGGCTTACAATTCATTGAAAAACAAAAAAAATTTAGTGATAGAAAAGCTTAACTATGACCTTTACAACTCTTTCATTGCCGATTTATCCAAGATTGATTCCTCCTACGCATCAAAGGACTCCTTGACACTTACATACGGTTCTGACAACTACAAAAATGTTATCAAGTCTCTCTTGCAATTTGGTGATTCTTTCTTGAAGGTTTTACTCGATCATATCGATGATAATGGTCAACTAACTGAGGAAATCAACAGATACACTGGGTTCCAAGCTGGAGCTGTCTCTTTAACATGGAGTTCAGGGAGTTTGTTATCTGCTAACAGAGCGCGTAACAAACTTATTGAGCTTCTGTAG。

来自扣囊复膜酵母的经密码子优化的葡糖淀粉酶DNA序列(GLA1基因)(SEQ IDNO:49):

ATGATTAGATTAACAGTATTTCTTACAGCCGTTTTCGCAGCCGTCGCATCCTGTGTTCCAGTAGAATTAGATAAGCGTAATACAGGACATTTTCAAGCTTACTCTGGCTATACAGTTGCGAGATCTAACTTTACACAATGGATTCACGAACAGCCAGCAGTTTCTTGGTACTATTTGCTCCAAAACATCGACTACCCTGAAGGCCAATTCAAGTCTGCAAAGCCAGGAGTGGTCGTCGCTTCTCCTAGTACTTCAGAACCAGATTACTTCTACCAGTGGACAAGAGACACTGCTATTACCTTCCTGAGCTTAATCGCTGAAGTTGAAGATCACTCTTTTTCTAATACAACACTGGCCAAAGTAGTTGAGTACTACATCTCTAACACTTACACTCTACAAAGAGTGTCAAACCCTTCTGGGAACTTCGACAGCCCAAACCATGATGGTTTGGGGGAGCCAAAATTCAACGTTGATGATACAGCCTACACCGCATCTTGGGGTAGACCACAAAACGACGGACCAGCTTTAAGAGCATACGCAATATCTCGTTACCTTAATGCTGTTGCAAAGCACAATAATGGAAAGTTGTTGTTGGCTGGTCAAAACGGTATTCCTTACTCTTCAGCATCTGATATCTACTGGAAGATTATCAAGCCAGATCTTCAACACGTATCCACACATTGGTCAACCTCCGGCTTCGATTTATGGGAGGAAAATCAGGGTACACATTTCTTCACCGCTCTAGTGCAATTGAAGGCTTTGAGTTACGGCATTCCATTGTCTAAGACTTACAACGATCCTGGTTTCACCTCATGGCTTGAAAAGCAGAAGGATGCCCTGAATAGCTACATCAACTCATCTGGTTTTGTTAACTCAGGGAAAAAGCATATAGTTGAATCCCCACAACTATCATCAAGAGGAGGTTTAGACTCCGCCACATACATTGCTGCCTTGATTACACATGATATTGGGGATGATGACACATATACTCCATTTAACGTCGATAACAGTTATGTCCTTAATTCCTTATACTATTTGTTGGTCGATAACAAAAATAGATACAAAATCAACGGCAACTACAAGGCTGGCGCAGCGGTGGGTAGATACCCTGAGGATGTTTACAATGGTGTAGGTACATCTGAAGGCAATCCATGGCAATTAGCGACTGCTTACGCTGGACAAACTTTCTACACACTTGCGTACAACTCATTGAAAAACAAAAAAAACCTAGTCATTGAAAAGTTGAATTACGATCTGTACAACTCTTTCATCGCAGACCTATCAAAGATTGACTCATCTTATGCAAGTAAAGATTCACTAACTTTAACCTACGGTAGTGATAACTACAAAAACGTTATCAAGTCTTTACTCCAGTTTGGTGATTCATTCTTGAAGGTGTTGTTAGATCATATAGACGACAATGGTCAACTCACAGAGGAGATAAACAGATACACTGGTTTTCAAGCAGGAGCTGTTTCACTTACTTGGTCAAGTGGTTCTTTGCTTTCCGCCAACAGAGCCAGAAACAAGCTCATCGAATTACTATAG。

来自扣囊复膜酵母的葡糖淀粉酶蛋白质序列(GLA1蛋白质)(SEQ ID NO:38):

MIRLTVFLTAVFAAVASCVPVELDKRNTGHFQAYSGYTVARSNFTQWIHEQPAVSWYYLLQNIDYPEGQFKSAKPGVVVASPSTSEPDYFYQWTRDTAITFLSLIAEVEDHSFSNTTLAKVVEYYISNTYTLQRVSNPSGNFDSPNHDGLGEPKFNVDDTAYTASWGRPQNDGPALRAYAISRYLNAVAKHNNGKLLLAGQNGIPYSSASDIYWKIIKPDLQHVSTHWSTSGFDLWEENQGTHFFTALVQLKALSYGIPLSKTYNDPGFTSWLEKQKDALNSYINSSGFVNSGKKHIVESPQLSSRGGLDSATYIAALITHDIGDDDTYTPFNVDNSYVLNSLYYLLVDNKNRYKINGNYKAGAAVGRYPEDVYNGVGTSEGNPWQLATAYAGQTFYTLAYNSLKNKKNLVIEKLNYDLYNSFIADLSKIDSSYASKDSLTLTYGSDNYKNVIKSLLQFGDSFLKVLLDHIDDNGQLTEEINRYTGFQAGAVSLTWSSGSLLSANRARNKLIELL。

来自米根霉的经密码子优化的葡糖淀粉酶DNA序列(amyA基因)(SEQ ID NO: 50):

ATGAAGTTCATTTCCACTTTCTTGACCTTCATTTTGGCTGCTGTCTCTGTCACCGCTGCATCTATTCCATCTAGTGCATCTGTACAATTGGACTCCTACAATTACGATGGTTCCACATTTTCCGGCAAGATTTATGTCAAAAACATCGCTTACTCTAAAAAGGTTACTGTTGTGTACGCAGACGGTTCTGACAACTGGAACAATAACGGCAACACTATTGCTGCATCATTTTCAGGCCCAATCTCTGGATCAAATTACGAATACTGGACATTCTCAGCATCAGTGAAGGGCATAAAGGAGTTCTACATCAAATACGAAGTTTCAGGTAAGACATATTACGACAATAACAACTCTGCAAACTACCAAGTCTCAACTTCTAAACCTACTACAACTACTGCAGCTACAACCACAACTACAGCTCCATCAACTTCTACAACAACCCGTCCATCTAGTTCAGAGCCTGCCACCTTCCCTACTGGTAATTCTACCATCAGCTCTTGGATCAAAAAGCAGGAAGATATTTCCAGATTCGCTATGCTTAGAAACATCAACCCACCTGGTTCTGCCACAGGGTTTATCGCCGCATCACTCTCTACCGCTGGTCCAGATTACTACTACGCGTGGACAAGAGATGCCGCTTTGACATCTAACGTTATCGTTTACGAATACAACACCACATTGTCTGGGAATAAGACAATTCTAAACGTACTTAAGGATTACGTCACATTCAGTGTTAAGACACAGTCTACTTCAACAGTTTGTAATTGCCTTGGTGAACCAAAGTTCAATCCAGACGGCAGTGGTTACACAGGTGCTTGGGGTAGACCTCAAAATGATGGTCCTGCAGAAAGAGCGACTACATTTGTTCTGTTTGCCGACAGCTACTTGACTCAAACTAAGGATGCCTCATACGTCACTGGTACATTAAAGCCAGCAATTTTCAAAGATCTCGATTACGTTGTTAACGTCTGGAGTAACGGATGTTTCGATTTATGGGAGGAGGTGAACGGAGTTCATTTCTACACCCTTATGGTTATGAGAAAAGGGCTATTGTTGGGGGCTGATTTCGCGAAGAGAAACGGTGACTCAACTAGAGCCTCAACTTACTCTTCTACTGCTTCCACAATTGCTAACAAGATATCAAGTTTCTGGGTTAGCTCAAACAACTGGGTGCAAGTATCCCAATCTGTCACAGGAGGTGTAAGTAAAAAGGGGTTAGACGTTAGCACCCTGTTAGCTGCGAATCTAGGATCAGTCGATGATGGATTTTTCACTCCAGGTTCTGAAAAGATATTAGCTACAGCTGTGGCAGTCGAAGATTCCTTTGCCAGTCTATACCCAATCAACAAAAACCTTCCATCATACTTGGGGAACGCTATTGGAAGATACCCTGAAGATACATACAACGGTAATGGTAACTCACAAGGCAATCCTTGGTTTCTGGCGGTTACCGGCTACGCAGAGTTGTACTATAGAGCAATTAAGGAATGGATTTCTAATGGAGGCGTTACAGTGTCCTCTATCTCATTGCCATTTTTCAAAAAGTTCGATAGCTCTGCAACATCCGGTAAAAAGTACACCGTAGGTACTTCTGACTTCAACAATTTAGCACAAAACATTGCTCTTGCTGCAGATCGTTTCCTATCTACTGTACAACTCCATGCACCAAACAATGGTTCATTAGCAGAGGAATTTGATAGAACAACAGGTTTTTCTACCGGCGCTAGAGATTTAACATGGTCCCACGCCTCATTGATAACAGCATCCTATGCCAAAGCCGGTGCTCCAGCTGCATAA。

来自米根霉的经密码子优化的葡糖淀粉酶DNA序列(amyA基因)(SEQ ID NO: 51):

ATGAAGTTTATCTCCACGTTTTTAACCTTTATCCTAGCAGCTGTCAGCGTCACCGCCGCATCAATTCCGAGTTCAGCATCTGTACAACTTGACTCTTACAATTACGATGGCAGCACTTTCTCAGGGAAAATTTATGTGAAAAACATAGCATATAGTAAGAAGGTTACCGTGGTATATGCAGACGGTTCTGATAATTGGAATAATAATGGAAACACTATTGCCGCCAGTTTTTCCGGCCCAATTTCTGGTTCCAATTACGAGTATTGGACCTTTTCTGCATCAGTAAAAGGCATCAAGGAATTCTATATTAAGTACGAAGTTTCAGGTAAGACATATTACGATAACAATAACTCAGCAAATTATCAAGTCTCTACATCTAAGCCCACAACAACAACTGCTGCTACCACCACTACAACCGCTCCTTCTACCAGCACCACTACCAGACCAAGCTCTAGTGAACCGGCTACCTTTCCTACCGGAAACAGTACCATCTCAAGCTGGATCAAAAAGCAAGAGGACATAAGTCGTTTTGCTATGTTGAGGAACATTAATCCTCCAGGATCCGCGACCGGTTTCATTGCAGCATCACTAAGTACTGCCGGGCCTGATTATTATTATGCTTGGACTAGAGACGCTGCATTAACATCAAACGTGATTGTTTATGAATATAATACGACCCTTTCCGGTAATAAAACGATCTTGAACGTATTAAAAGACTATGTGACCTTTAGTGTGAAGACCCAATCTACATCTACAGTGTGTAATTGTTTGGGAGAACCTAAATTCAATCCAGACGGTTCTGGGTACACTGGTGCCTGGGGTAGACCTCAAAACGACGGTCCAGCAGAAAGAGCAACAACCTTTGTTCTATTTGCTGACTCTTATTTAACGCAAACAAAGGACGCCTCATATGTTACAGGGACCCTAAAACCAGCAATTTTCAAAGACTTGGATTATGTTGTTAATGTTTGGAGCAACGGATGTTTTGACTTGTGGGAGGAGGTTAACGGTGTACACTTTTATACATTGATGGTGATGAGAAAAGGGTTGCTATTGGGAGCAGATTTCGCTAAAAGAAATGGTGATTCTACAAGAGCGAGCACATATAGTAGCACCGCTTCAACAATCGCCAATAAAATCTCATCTTTCTGGGTATCTAGCAACAACTGGGTACAAGTTTCCCAAAGTGTTACCGGCGGTGTGTCCAAAAAGGGTTTAGACGTTAGCACACTTCTAGCTGCTAATTTGGGTAGCGTTGATGACGGGTTTTTTACTCCAGGTAGTGAGAAGATACTGGCAACCGCGGTGGCGGTTGAAGACAGCTTTGCTTCATTGTATCCTATAAATAAAAATCTGCCCTCTTATCTGGGTAATGCAATTGGCAGATACCCAGAAGATACCTACAATGGTAATGGTAATTCCCAGGGGAACCCATGGTTTTTGGCTGTTACAGGCTACGCAGAACTTTATTACCGTGCAATCAAGGAATGGATTTCAAATGGCGGCGTCACTGTCAGTAGTATAAGTTTGCCCTTTTTTAAGAAATTTGATTCCTCAGCAACGTCTGGTAAAAAATACACCGTAGGTACTAGTGATTTCAATAATTTGGCCCAAAATATTGCGCTTGCTGCTGACAGGTTTCTTAGTACCGTTCAGTTGCACGCTCCAAATAATGGCTCATTGGCTGAAGAATTTGATCGTACGACAGGTTTCTCCACTGGTGCTAGGGATTTGACTTGGAGTCATGCCTCCTTAATCACAGCAAGCTATGCTAAAGCTGGTGCACCTGCTGCTTAG。

来自米根霉的葡糖淀粉酶蛋白质序列(amyA蛋白质)(SEQ ID NO:39):

MKFISTFLTFILAAVSVTAASIPSSASVQLDSYNYDGSTFSGKIYVKNIAYSKKVTVVYADGSDNWNNNGNTIAASFSGPISGSNYEYWTFSASVKGIKEFYIKYEVSGKTYYDNNNSANYQVSTSKPTTTTAATTTTTAPSTSTTTRPSSSEPATFPTGNSTISSWIKKQEDISRFAMLRNINPPGSATGFIAASLSTAGPDYYYAWTRDAALTSNVIVYEYNTTLSGNKTILNVLKDYVTFSVKTQSTSTVCNCLGEPKFNPDGSGYTGAWGRPQNDGPAERATTFVLFADSYLTQTKDASYVTGTLKPAIFKDLDYVVNVWSNGCFDLWEEVNGVHFYTLMVMRKGLLLGADFAKRNGDSTRASTYSSTASTIANKISSFWVSSNNWVQVSQSVTGGVSKKGLDVSTLLAANLGSVDDGFFTPGSEKILATAVAVEDSFASLYPINKNLPSYLGNAIGRYPEDTYNGNGNSQGNPWFLAVTGYAELYYRAIKEWISNGGVTVSSISLPFFKKFDSSATSGKKYTVGTSDFNNLAQNIALAADRFLSTVQLHAPNNGSLAEEFDRTTGFSTGARDLTWSHASLITASYAKAGAPAA。

来自戴尔根霉的经密码子优化的葡糖淀粉酶基因序列(amyA蛋白质)(SEQ ID NO:52):

ATGCAGCTGTTCAACTTGCCATTAAAGGTTTCATTCTTTTTGGTCCTATCATACTTTAGTTTGTTGGTGTCAGCCGCATCTATTCCATCTTCAGCATCTGTACAATTAGACTCCTACAATTACGACGGCTCTACATTCAGCGGAAAGATTTACGTGAAAAATATTGCGTACAGCAAAAAAGTAACTGTTATCTATGCCGACGGATCAGATAACTGGAACAACAATGGAAACACTATCGCTGCCAGTTACTCTGCACCAATTTCAGGTTCTAACTACGAATATTGGACATTCTCAGCCTCCATCAATGGCATTAAGGAATTCTACATAAAGTACGAAGTTTCCGGTAAGACTTACTACGATAACAACAATTCTGCAAACTATCAAGTATCAACATCAAAACCTACTACCACCACCGCCACAGCTACAACTACAACTGCACCTTCAACATCTACCACAACCCCACCATCTTCTAGCGAACCAGCTACATTCCCAACTGGCAATTCTACTATTTCTAGTTGGATCAAAAAACAAGAGGGTATTTCCAGATTCGCAATGTTGAGAAACATAAATCCACCAGGATCAGCAACTGGATTCATCGCAGCTTCTTTGTCCACAGCGGGGCCAGATTACTACTACGCATGGACCAGAGATGCTGCTTTGACAAGTAACGTTATTGTTTACGAATACAATACCACTTTGTCCGGTAACAAGACTATTCTTAACGTCCTAAAGGATTACGTTACATTCTCTGTTAAGACTCAGTCTACATCCACAGTCTGCAATTGTTTGGGTGAACCAAAGTTCAACCCAGATGGCTCTGGATACACAGGTGCCTGGGGTCGTCCACAAAACGATGGGCCTGCCGAGAGAGCCACTACATTTATCCTATTTGCTGACTCATACCTTACACAAACAAAAGATGCATCCTACGTGACTGGAACATTAAAGCCTGCAATCTTCAAAGACCTGGATTACGTTGTCAACGTGTGGTCTAACGGCTGTTTCGATCTATGGGAAGAGGTTAACGGCGTGCACTTCTACACTCTAATGGTCATGAGAAAGGGTCTGTTGTTAGGTGCAGATTTTGCTAAGAGAAACGGTGATTCTACACGTGCTTCTACCTACTCCTCAACAGCATCAACTATTGCGAACAAGATTTCTTCATTTTGGGTTTCAAGTAATAACTGGATACAAGTATCTCAAAGCGTTACAGGGGGTGTCTCAAAAAAGGGTCTTGATGTTTCTACATTACTGGCTGCTAATCTTGGGTCTGTTGATGACGGTTTCTTCACCCCTGGTTCTGAAAAGATCCTCGCTACCGCCGTCGCGGTTGAGGATAGTTTTGCTTCACTCTATCCTATAAACAAAAACCTTCCTTCATACTTAGGAAACAGTATCGGTAGATACCCAGAGGATACATACAATGGTAATGGCAATTCACAGGGAAATCCATGGTTCCTTGCTGTTACAGGGTACGCAGAACTTTACTATAGAGCTATTAAGGAATGGATCGGCAACGGCGGTGTGACAGTTTCCTCAATCTCATTGCCATTTTTCAAAAAGTTTGACTCCAGCGCGACATCTGGTAAAAAGTATACTGTGGGGACTTCTGATTTCAACAATTTGGCTCAAAACATTGCCTTAGCTGCCGACAGATTCTTATCTACCGTACAACTCCATGCACATAACAATGGTAGTTTGGCAGAGGAATTTGATAGAACTACAGGACTCTCTACAGGTGCGAGAGATTTAACTTGGTCACATGCAAGTTTAATTACAGCCTCTTACGCAAAGGCTGGTGCTCCTGCTGCATAA。

来自戴尔根霉的经密码子优化的葡糖淀粉酶基因序列(amyA蛋白质)(SEQ ID NO:53):

ATGCAGTTATTCAACTTACCACTTAAGGTATCTTTCTTTCTAGTCTTATCTTACTTTTCATTGTTAGTATCAGCTGCCTCTATACCAAGTTCAGCATCCGTACAACTAGATTCATACAATTACGACGGTTCAACATTCTCAGGAAAGATATACGTGAAAAATATTGCTTACAGCAAAAAGGTTACTGTGATTTACGCAGATGGGTCAGACAACTGGAATAACAATGGAAACACAATTGCTGCTTCCTATTCTGCCCCTATTTCTGGATCTAACTACGAATACTGGACTTTTTCAGCGAGTATAAACGGAATTAAGGAATTCTATATCAAATATGAAGTCTCTGGTAAGACCTACTACGATAACAACAACTCCGCAAACTACCAAGTTAGCACATCAAAGCCAACCACAACAACTGCTACTGCGACAACTACAACCGCACCAAGCACTTCTACTACAACACCTCCTAGTTCATCTGAGCCAGCAACTTTCCCAACTGGTAATTCCACTATTTCTTCTTGGATCAAAAAACAAGAGGGTATCTCAAGATTCGCCATGCTTAGAAATATCAATCCTCCAGGCTCTGCAACAGGATTCATTGCAGCATCTTTATCAACTGCGGGGCCAGACTACTACTACGCCTGGACTAGAGATGCAGCTTTGACATCAAATGTGATTGTTTATGAATACAACACAACTTTGTCCGGTAACAAGACAATCTTGAACGTCTTGAAGGATTATGTGACATTCTCTGTCAAGACTCAATCTACATCAACAGTTTGTAACTGTCTCGGCGAACCAAAGTTCAACCCTGATGGTAGTGGTTACACTGGTGCTTGGGGTAGACCACAAAACGATGGTCCAGCAGAGAGAGCTACAACTTTCATCTTGTTTGCTGACTCTTACCTAACACAAACCAAGGATGCAAGCTACGTTACTGGAACACTAAAGCCTGCAATCTTTAAAGACCTGGACTATGTTGTAAACGTTTGGTCAAATGGCTGCTTCGATCTATGGGAGGAAGTGAACGGTGTTCACTTCTACACATTAATGGTCATGAGAAAGGGACTCTTGCTTGGTGCAGACTTTGCTAAGAGAAACGGTGATTCTACACGTGCCTCCACTTACTCCTCCACAGCTTCAACCATTGCCAACAAAATCTCTTCTTTCTGGGTCAGCTCAAATAACTGGATTCAAGTTTCTCAATCAGTTACTGGTGGTGTTTCTAAAAAGGGCCTGGATGTGTCAACCTTGCTTGCTGCCAATTTGGGCAGTGTTGATGACGGGTTCTTCACCCCAGGTTCTGAAAAGATCCTCGCCACCGCAGTTGCCGTTGAAGATTCATTTGCTAGTTTATACCCAATCAACAAAAATCTACCATCATACCTTGGAAATTCAATCGGTAGATATCCAGAGGATACATACAACGGTAATGGAAACTCTCAGGGTAACCCTTGGTTTCTTGCAGTTACAGGGTACGCTGAACTGTACTACAGAGCGATTAAGGAATGGATTGGTAATGGCGGCGTAACTGTTAGTTCTATTTCTCTACCTTTCTTCAAAAAGTTCGATAGTTCTGCAACATCTGGTAAAAAGTACACAGTCGGCACTTCCGATTTTAACAATTTAGCTCAGAACATAGCACTGGCAGCTGATCGTTTCTTGAGTACAGTCCAATTGCATGCCCATAACAACGGTAGTTTGGCTGAAGAGTTTGATAGAACCACCGGTTTATCAACCGGCGCCAGAGATTTAACATGGTCCCATGCGTCTTTGATAACTGCTTCTTACGCCAAGGCTGGGGCACCAGCTGCCTGA。

来自戴尔根霉的葡糖淀粉酶蛋白质序列(amyA蛋白质)(SEQ ID NO:40):

MQLFNLPLKVSFFLVLSYFSLLVSAASIPSSASVQLDSYNYDGSTFSGKIYVKNIAYSKKVTVIYADGSDNWNNNGNTIAASYSAPISGSNYEYWTFSASINGIKEFYIKYEVSGKTYYDNNNSANYQVSTSKPTTTTATATTTTAPSTSTTTPPSSSEPATFPTGNSTISSWIKKQEGISRFAMLRNINPPGSATGFIAASLSTAGPDYYYAWTRDAALTSNVIVYEYNTTLSGNKTILNVLKDYVTFSVKTQSTSTVCNCLGEPKFNPDGSGYTGAWGRPQNDGPAERATTFILFADSYLTQTKDASYVTGTLKPAIFKDLDYVVNVWSNGCFDLWEEVNGVHFYTLMVMRKGLLLGADFAKRNGDSTRASTYSSTASTIANKISSFWVSSNNWIQVSQSVTGGVSKKGLDVSTLLAANLGSVDDGFFTPGSEKILATAVAVEDSFASLYPINKNLPSYLGNSIGRYPEDTYNGNGNSQGNPWFLAVTGYAELYYRAIKEWIGNGGVTVSSISLPFFKKFDSSATSGKKYTVGTSDFNNLAQNIALAADRFLSTVQLHAHNNGSLAEEFDRTTGLSTGARDLTWSHASLITASYAKAGAPAA。

来自小孢根霉的经密码子优化的葡糖淀粉酶基因序列(amyA蛋白质)(SEQ ID NO:54):

ATGAAACTTATGAATCCATCTATGAAGGCATACGTTTTCTTTATCTTAAGCTACTTCTCTTTACTCGTTAGCTCAGCTGCGGTGCCAACCTCTGCCGCCGTACAAGTTGAGTCATACAATTATGACGGTACCACTTTTTCAGGTAGAATATTCGTCAAAAACATTGCCTACTCAAAGGTCGTAACAGTTATCTACTCCGATGGATCAGATAACTGGAACAATAACAACAACAAAGTTTCTGCAGCTTACTCAGAAGCAATTTCTGGGTCTAACTACGAATACTGGACATTCTCCGCAAAGTTATCCGGAATTAAACAGTTTTATGTCAAATACGAAGTTTCTGGTTCAACATATTACGACAACAACGGTACCAAAAACTACCAAGTCCAAGCAACCTCAGCGACATCTACAACAGCTACTGCAACCACAACTACAGCTACTGGCACAACAACTACTTCTACAGGTCCAACTAGTACTGCATCCGTATCATTCCCTACCGGTAACTCAACAATTTCTTCCTGGATAAAAAATCAAGAGGAAATCAGCCGTTTTGCTATGTTGAGAAATATCAATCCACCTGGGTCTGCCACAGGGTTCATAGCCGCATCTCTGTCCACAGCCGGCCCAGATTACTATTACTCTTGGACTAGAGATTCAGCACTAACAGCTAATGTGATCGCTTACGAATACAACACAACATTCACTGGAAACACCACCCTTCTTAAGTACTTGAAAGATTACGTTACATTTTCTGTCAAAAGCCAATCTGTATCTACCGTTTGTAACTGTCTGGGAGAACCAAAGTTCAACGCTGATGGTAGTTCTTTTACAGGTCCATGGGGCAGACCACAAAACGACGGACCAGCAGAGAGAGCTGTTACTTTTATGTTGATTGCTGACAGCTACTTGACTCAAACTAAGGACGCATCCTACGTTACCGGTACATTAAAGCCAGCAATCTTCAAAGATCTTGATTACGTAGTTTCTGTTTGGTCTAACGGTTGCTACGATTTATGGGAAGAGGTTAATGGTGTTCATTTCTATACTCTCATGGTCATGAGAAAGGGTTTGATCTTAGGTGCCGACTTCGCTGCTAGAAATGGTGACTCTAGTAGAGCTTCAACCTACAAGCAAACTGCATCAACAATGGAATCAAAGATCAGTTCTTTTTGGTCAGATTCTAACAACTACGTCCAAGTTTCTCAATCAGTTACCGCCGGAGTGTCAAAAAAGGGACTAGATGTTAGTACACTATTGGCGGCCAACATTGGTAGTCTGCCTGATGGCTTTTTCACTCCAGGCTCCGAAAAGATATTGGCTACAGCAGTGGCGTTAGAAAATGCATTCGCATCCTTGTACCCAATTAACTCTAACCTACCTTCTTACTTGGGTAACTCAATTGGAAGATATCCTGAGGATACATACAACGGTAATGGCAACTCTCAGGGGAATCCATGGTTCCTTGCCGTCAACGCATACGCAGAACTTTACTACAGAGCTATTAAGGAATGGATTAGTAATGGCAAGGTGACAGTATCCAATATCTCACTACCTTTCTTCAAAAAGTTTGATTCTTCCGCCACTTCTGGAAAGACATACACTGCTGGTACATCAGATTTCAATAACTTGGCTCAGAACATTGCTTTAGGCGCCGATAGATTCCTGTCTACTGTTAAGTTCCACGCATACACTAACGGGAGTCTATCAGAAGAGTACGATAGATCTACCGGTATGAGTACTGGGGCTCGTGATTTAACATGGTCCCATGCTTCATTGATCACAGTGGCGTACGCAAAGGCCGGTAGTCCTGCAGCTTAG。

来自小孢根霉的葡糖淀粉酶蛋白质序列(amyA蛋白质)(SEQ ID NO:41):

MKLMNPSMKAYVFFILSYFSLLVSSAAVPTSAAVQVESYNYDGTTFSGRIFVKNIAYSKVVTVIYSDGSDNWNNNNNKVSAAYSEAISGSNYEYWTFSAKLSGIKQFYVKYEVSGSTYYDNNGTKNYQVQATSATSTTATATTTTATGTTTTSTGPTSTASVSFPTGNSTISSWIKNQEEISRFAMLRNINPPGSATGFIAASLSTAGPDYYYSWTRDSALTANVIAYEYNTTFTGNTTLLKYLKDYVTFSVKSQSVSTVCNCLGEPKFNADGSSFTGPWGRPQNDGPAERAVTFMLIADSYLTQTKDASYVTGTLKPAIFKDLDYVVSVWSNGCYDLWEEVNGVHFYTLMVMRKGLILGADFAARNGDSSRASTYKQTASTMESKISSFWSDSNNYVQVSQSVTAGVSKKGLDVSTLLAANIGSLPDGFFTPGSEKILATAVALENAFASLYPINSNLPSYLGNSIGRYPEDTYNGNGNSQGNPWFLAVNAYAELYYRAIKEWISNGKVTVSNISLPFFKKFDSSATSGKTYTAGTSDFNNLAQNIALGADRFLSTVKFHAYTNGSLSEEYDRSTGMSTGARDLTWSHASLITVAYAKAGSPAA。

海藻糖-6-磷酸合酶基因序列和蛋白质序列对于本领域普通技术人员而言是公知的。海藻糖-6-磷酸合酶基因序列和蛋白质序列的非限制性实例包含:

来自酿酒酵母的TPS1基因序列(SEQ ID NO:55):

ATGACTACGGATAACGCTAAGGCGCAACTGACCTCGTCTTCAGGGGGTAACATTATTGTGGTGTCCAACAGGCTTCCCGTGACAATCACTAAAAACAGCAGTACGGGACAGTACGAGTACGCAATGTCGTCCGGAGGGCTGGTCACGGCGTTGGAAGGGTTGAAGAAGACGTACACTTTCAAGTGGTTCGGATGGCCTGGGCTAGAGATTCCTGACGATGAGAAGGATCAGGTGAGGAAGGACTTGCTGGAAAAGTTTAATGCCGTACCCATCTTCCTGAGCGATGAAATCGCAGACTTACACTACAACGGGTTCAGTAATTCTATTCTATGGCCGTTATTCCATTACCATCCTGGTGAGATCAATTTCGACGAGAATGCGTGGTTGGCATACAACGAGGCAAACCAGACGTTCACCAACGAGATTGCTAAGACTATGAACCATAACGATTTAATCTGGGTGCATGATTACCATTTGATGTTGGTTCCGGAAATGTTGAGAGTCAAGATTCACGAGAAGCAACTGCAAAACGTTAAGGTCGGGTGGTTCCTGCACACACCATTCCCTTCGAGTGAAATTTACAGAATCTTACCTGTCAGACAAGAGATTTTGAAGGGTGTTTTGAGTTGTGATTTAGTCGGGTTCCACACATACGATTATGCAAGACATTTCTTGTCTTCCGTGCAAAGAGTGCTTAACGTGAACACATTGCCTAATGGGGTGGAATACCAGGGCAGATTCGTTAACGTAGGGGCCTTCCCTATCGGTATCGACGTGGACAAGTTCACCGATGGGTTGAAAAAGGAATCCGTACAAAAGAGAATCCAACAATTGAAGGAAACTTTCAAGGGCTGCAAGATCATAGTTGGTGTCGACAGGCTGGATTACATCAAAGGTGTGCCTCAGAAGTTGCACGCCATGGAAGTGTTTCTGAACGAGCATCCAGAATGGAGGGGCAAGGTTGTTCTGGTACAGGTTGCAGTGCCAAGTCGTGGAGATGTGGAAGAGTACCAATATTTAAGATCTGTGGTCAATGAGTTGGTCGGTAGAATCAACGGTCAGTTCGGTACTGTGGAATTCGTCCCCATCCATTTCATGCACAAGTCTATACCATTTGAAGAGCTGATTTCGTTATATGCTGTGAGCGATGTCTGTTTGGTCTCGTCCACCCGTGATGGTATGAACTTGGTTTCCTACGAATATATTGCTTGCCAAGAAGAAAAGAAAGGTTCCTTAATCCTGAGTGAGTTCACAGGTGCCGCACAATCCTTGAATGGTGCTATTATTGTAAATCCTTGGAACACCGATGATCTTTCTGATGCCATCAACGAGGCCTTGACTTTGCCCGATGTAAAGAAAGAAGTTAACTGGGAAAAACTTTACAAATACATCTCTAAATACACTTCTGCCTTCTGGGGTGAAAATTTCGTCCATGAATTATACAGTACATCATCAAGCTCAACAAGCTCCTCTGCCACCAAAAACTGA。

来自酿酒酵母的Tps1蛋白质序列(SEQ ID NO:43):

MTTDNAKAQLTSSSGGNIIVVSNRLPVTITKNSSTGQYEYAMSSGGLVTALEGLKKTYTFKWFGWPGLEIPDDEKDQVRKDLLEKFNAVPIFLSDEIADLHYNGFSNSILWPLFHYHPGEINFDENAWLAYNEANQTFTNEIAKTMNHNDLIWVHDYHLMLVPEMLRVKIHEKQLQNVKVGWFLHTPFPSSEIYRILPVRQEILKGVLSCDLVGFHTYDYARHFLSSVQRVLNVNTLPNGVEYQGRFVNVGAFPIGIDVDKFTDGLKKESVQKRIQQLKETFKGCKIIVGVDRLDYIKGVPQKLHAMEVFLNEHPEWRGKVVLVQVAVPSRGDVEEYQYLRSVVNELVGRINGQFGTVEFVPIHFMHKSIPFEELISLYAVSDVCLVSSTRDGMNLVSYEYIACQEEKKGSLILSEFTGAAQSLNGAIIVNPWNTDDLSDAINEALTLPDVKKEVNWEKLYKYISKYTSAFWGENFVHELYSTSSSSTSSSATKN。

海藻糖-6-磷酸磷酸酶基因序列和蛋白质序列对于本领域普通技术人员而言是公知的。海藻糖-6-磷酸磷酸酶基因序列和蛋白质序列的非限制性实例包含:

来自酿酒酵母的TPS2基因序列(SEQ ID NO:56):

ATGACCACCACTGCCCAAGACAATTCTCCAAAGAAGAGACAGCGTATCATCAATTGTGTCACGCAGCTGCCCTACAAAATCCAATTGGGAGAAAGCAACGATGACTGGAAAATATCTGCTACTACAGGTAACAGCGCATTATATTCCTCTCTAGAATACCTTCAATTTGATTCTACCGAGTACGAGCAACACGTTGTTGGTTGGACCGGCGAAATAACAAGAACCGAACGCAACCTGTTTACTAGAGAAGCGAAAGAGAAACCACAGGATCTGGACGATGACCCACTATATTTAACAAAAGAGCAGATCAATGGGTTGACTACTACTCTACAAGATCATATGAAATCTGATAAAGAGGCAAAGACCGATACTACTCAAACAGCTCCCGTTACCAATAACGTTCATCCCGTTTGGCTACTTAGAAAAAACCAGAGTAGATGGAGAAATTACGCGGAAAAAGTAATTTGGCCAACCTTCCACTACATCTTGAATCCTTCAAATGAAGGTGAGCAAGAAAAAAACTGGTGGTACGACTACGTCAAGTTTAACGAAGCTTATGCACAAAAAATCGGGGAAGTTTACAGGAAGGGTGACATCATCTGGATCCATGACTACTACCTACTGCTATTGCCTCAACTACTGAGAATGAAATTTAACGACGAATCTATCATTATTGGTTATTTCCATCATGCCCCATGGCCTAGTAATGAATATTTTCGCTGTTTGCCACGTAGAAAACAAATCTTAGATGGTCTTGTTGGGGCCAATAGAATTTGTTTCCAAAATGAATCTTTCTCCCGTCATTTTGTATCGAGTTGTAAAAGATTACTCGACGCAACCGCCAAGAAATCTAAAAACTCTTCCGATAGTGATCAATATCAAGTGTCTGTGTACGGTGGTGACGTACTCGTAGATTCTTTGCCTATAGGTGTTAACACAACTCAAATACTGAAAGATGCTTTCACGAAGGATATAGATTCCAAGGTTCTTTCCATCAAGCAAGCTTATCAAAACAAAAAAATTATTATTGGTAGAGATCGTCTGGATTCCGTCAGAGGCGTCGTTCAAAAATTAAGAGCTTTTGAAACTTTCTTGGCCATGTATCCAGAATGGCGAGATCAAGTGGTATTGATCCAGGTCAGCAGTCCTACTGCTAACAGAAATTCCCCCCAAACTATCAGATTGGAACAACAAGTCAACGAGTTGGTTAATTCCATAAATTCTGAATATGGTAATTTGAATTTTTCTCCCGTCCAGCATTATTATATGAGAATCCCTAAAGATGTATACTTGTCCTTACTAAGAGTTGCAGACTTATGTTTAATCACAAGTGTTAGAGACGGTATGAATACCACTGCTTTGGAATACGTCACTGTGAAATCTCACATGTCGAACTTTTTATGCTACGGAAATCCATTGATTTTAAGTGAGTTTTCTGGCTCTAGTAACGTATTGAAAGATGCCATTGTCGTTAACCCATGGGATTCGGTGGCCGTGGCTAAATCTATTAACATGGCTTTGAAATTGGACAAGGAAGAAAAGTCCAATTTAGAATCAAAATTATGGAAAGAAGTTCCTACAATTCAAGATTGGACTAATAAGTTTTTGAGTTCATTAAAGGAAAAGGCGTCATCTGATGATGATGTGGAAAGGAAAATGACTCCAGCACTTAATAGACCTGTTCTTTTAGAAAACTACAAGCAGGCTAAGCGTAGATTATTCCTTTTTGATTACGATGGTACTTTGACCCCAATTGTCAAAGACCCAGCTGCAGCTATTCCATCGGCAAGACTTTATACAATTCTACAAAAATTATGTGCCGATCCTCATAATCAAATCTGGATTATTTCTGGTCGTGACCAGAAGTTTTTGAACAAGTGGTTAGGCGGTAAACTTCCTCAACTGGGTCTAAGTGCGGAGCATGGATGTTTCATGAAAGATGTTTCTTGCCAAGATTGGGTCAATTTGACCGAAAAAGTTGATATGTCTTGGCAAGTACGCGTCAATGAAGTGATGGAAGAATTTACCACAAGGACCCCAGGTTCATTCATCGAAAGAAAGAAAGTCGCTCTAACTTGGCATTATAGACGTACCGTTCCAGAATTGGGTGAATTCCACGCCAAAGAACTGAAAGAAAAATTGTTATCATTTACTGATGACTTCGATTTAGAGGTCATGGATGGTAAAGCAAACATTGAAGTTCGTCCAAGATTCGTCAACAAAGGTGAAATAGTCAAGAGACTAGTCTGGCATCAACATGGCAAACCACAGGACATGTTGAAGGGAATCAGTGAAAAACTACCTAAGGATGAAATGCCTGATTTTGTATTATGTCTGGGTGATGACTTCACTGACGAAGACATGTTTAGACAGTTGAATACCATTGAAACTTGTTGGAAAGAAAAATATCCTGACCAAAAAAATCAATGGGGCAACTACGGATTCTATCCTGTCACTGTGGGATCTGCATCCAAGAAAACTGTCGCAAAGGCTCATTTAACCGATCCTCAGCAAGTCCTGGAGACTTTAGGTTTACTTGTTGGTGATGTCTCTCTCTTCCAAAGTGCTGGTACGGTCGACCTGGATTCCAGAGGTCATGTCAAGAATAGTGAGAGCAGTTTGAAATCAAAGCTAGCATCTAAAGCTTATGTTATGAAAAGATCGGCTTCTTACACCGGCGCAAAGGTTTGA。

来自酿酒酵母的Tps2蛋白质序列(SEQ ID NO:44):

MTTTAQDNSPKKRQRIINCVTQLPYKIQLGESNDDWKISATTGNSALFSSLEYLQFDSTEYEQHVVGWTGEITRTERNLFTREAKEKPQDLDDDPLYLTKEQINGLTTTLQDHMKSDKEAKTDTTQTAPVTNNVHPVWLLRKNQSRWRNYAEKVIWPTFHYILNPSNEGEQEKNWWYDYVKFNEAYAQKIGEVYRKGDIIWIHDYYLLLLPQLLRMKFNDESIIIGYFHHAPWPSNEYFRCLPRRKQILDGLVGANRICFQNESFSRHFVSSCKRLLDATAKKSKNSSNSDQYQVSVYGGDVLVDSLPIGVNTTQILKDAFTKDIDSKVLSIKQAYQNKKIIIGRDRLDSVRGVVQKLRAFETFLAMYPEWRDQVVLIQVSSPTANRNSPQTIRLEQQVNELVNSINSEYGNLNFSPVQHYYMRIPKDVYLSLLRVADLCLITSVRDGMNTTALEYVTVKSHMSNFLCYGNPLILSEFSGSSNVLKDAIVVNPWDSVAVAKSINMALKLDKEEKSNLESKLWKEVPTIQDWTNKFLSSLKEQASSNDDMERKMTPALNRPVLLENYKQAKRRLFLFDYDGTLTPIVKDPAAAIPSARLYTILQKLCADPHNQIWIISGRDQKFLNKWLGGKLPQLGLSAEHGCFMKDVSCQDWVNLTEKVDMSWQVRVNEVMEEFTTRTPGSFIERKKVALTWHYRRTVPELGEFHAKELKEKLLSFTDDFDLEVMDGKANIEVRPRFVNKGEIVKRLVWHQHGKPQDMLKGISEKLPKDEMPDFVLCLGDDFTDEDMFRQLNTIETCWKEKYPDQKNQWGNYGFYPVTVGSASKKTVAKAHLTDPQQVLETLGLLVGDVSLFQSAGTVDLDSRGHVKNSESSLKSKLASKAYVMKRSASYTGAKV。

将从下文实施例中更加充分地理解这些和其他实施方案的功能和优势。以下实施例旨在阐明本发明的益处,但不举例说明本发明的全部范围。因此,将理解的是,实施例部分并不意味着限制本发明的范围。

实施例

下文描述的是经基因修饰的酿酒酵母菌株。所描述的菌株包含具有改善产乙醇的酵母的乳酸消耗能力的基因修饰的菌株。

菌株1-3:ura3Δ酿酒酵母基础菌株

用SEQ ID NO:1转化菌株1(Ethanol

用SEQ ID NO:2转化菌株1-1。SEQ ID NO:2含有以下元件:i)来自构巢曲霉(Aspergillus nidulans)的乙酰胺酶(amdS)基因的表达盒;以及ii)用于向URA3基因座中的靶向染色体整合的侧翼DNA。在含有80mg/L尿嘧啶和l g/L乙酰胺作为唯一氮源的酵母氮源(无硫酸铵或氨基酸)上选择转化体。将所得的转化体接种在含有80mg/L尿嘧啶和l g/L乙酰胺作为唯一氮源的酵母氮源(无硫酸铵或氨基酸)上以用于单菌落分离。选择单菌落。在单菌落中通过PCR验证SEQ ID NO:2向基因座A的第二等位基因中的正确整合。将经PCR验证的分离株命名为菌株1-2。

用SEQ ID NO:3和SEQ ID NO:4共转化菌株1-2。SEQ ID NO:3含有以下元件:i)来自P1噬菌体的cre重组酶的开放阅读框;以及ii)与SEQ ID NO:4同源的侧翼DNA。SEQ IDNO:4含有以下元件:i)2μ的复制起点;ii)来自酿酒酵母的URA3可选标记;以及iii)含有来自酿酒酵母的PGK启动子和CYC1终止子的侧翼DNA。在缺乏尿嘧啶的合成缺陷型培养基(ScD-Ura)上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落。筛选分离的菌落,以在ScD-PFP以及含有80mg/L尿嘧啶和l g/L乙酰胺作为唯一氮源的酵母氮源(无硫酸铵或氨基酸)上生长。通过PCR验证ARO4-OFP基因和amdS基因的缺失。将经PCR验证的分离株接种至含有5-FOA的YNB,以针对2μ质粒缺失进行选择。将经PCR验证的分离株命名为菌株1-3。

菌株1-4:在CYB2的第一等位基因处表达扣囊复膜酵母葡糖淀粉酶的两个密码子优化变体的酿酒酵母

用SEQ ID NO:5和SEQ ID NO:6共转化菌株1-3。SEQ ID NO:5含有以下元件:i)与天然CYB2基因的5’区同源的DNA;和ii)扣囊复膜酵母葡糖淀粉酶(SEQ ID NO:38)的独特密码子优化变体的表达盒,其受TDH3启动子和CYC1终止子的控制;以及iii)URA3启动子以及URA3基因的一部分。SEQ ID NO:6含有以下元件:i)URA3基因的一部分和终止子;和ii)扣囊复膜酵母葡糖淀粉酶的独特密码子优化变体的表达盒,其受PGK启动子和RPL3终止子的控制;以及iii)与天然CYB2基因的3’区同源的DNA。在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落。通过PCR验证SEQID NO:5和SEQ ID NO:6在CYB2的一等位基因处的正确整合。将经PCR验证的分离株命名为菌株1-4。

菌株1-5:在CYB2的第二等位基因处表达扣囊复膜酵母葡糖淀粉酶的四个密码子优化变体的酿酒酵母

用SEQ ID NO:7和SEQ ID NO:8共转化菌株1-4。SEQ ID NO:7含有以下元件:i)与天然CYB2基因的5’区同源的DNA;和ii)扣囊复膜酵母葡糖淀粉酶的独特密码子优化变体的表达盒,其受TDH3启动子和CYC1终止子的控制;以及iii)TEF1启动子和构巢曲霉乙酰胺酶基因(amdS)的一部分。SEQ ID NO:8含有以下元件:i)构巢曲霉乙酰胺酶基因(amdS)的一部分和ADH1终止子;和ii)扣囊复膜酵母葡糖淀粉酶的独特密码子优化变体的表达盒,其受PGK启动子和RPL3终止子的控制;以及iii)与天然CYB2基因的3’区同源的DNA。在含有80mg/L尿嘧啶和l g/L乙酰胺作为唯一氮源的酵母氮源(无硫酸铵或氨基酸)上选择转化体。将所得的转化体接种在含有80mg/L尿嘧啶和l g/L乙酰胺作为唯一氮源的酵母氮源(无硫酸铵或氨基酸)上以用于单菌落分离。选择单菌落。通过PCR验证SEQ ID NO:7和SEQ ID NO:8在CYB2的剩余等位基因处的正确整合。将经PCR验证的分离株命名为菌株1-5。

菌株1-6:经由菌株1-5中的cre重组酶回收URA3标记和amdS标记

用SEQ ID NO:9转化菌株1-5。SEQ ID NO:9含有以下元件:i)来自酿酒酵母(ARO4-OFP)的3-脱氧-D-阿拉伯-庚酮糖酸-7-磷酸(DAHP)合酶基因的突变形式的表达盒;2)来自P1噬菌体的cre重组酶的表达盒;3)含有天然URA3的表达盒;以及4)酿酒酵母CEN6着丝粒。在含有3.5g/L对氟苯丙氨酸和l g/L L-酪氨酸的合成完全培养基(ScD-PFP)上选择转化体。将所得的转化体接种在ScD-PFP上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-6。

菌株1-7:在菌株1-6中的原始基因座处恢复天然URA3

用SEQ ID NO:10转化菌株1-6。SEQ ID NO:10含有以下元件:1)与菌株1-6中破坏的URA3基因座具有5’和3’同源性的天然URA3的表达盒。在ScD-ura上选择转化体。将所得的转化体接种在ScD-ura上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-7。

菌株1-8:在CYB2的第一等位基因处表达经修饰的米根霉葡糖淀粉酶的酿酒酵母

用SEQ ID NO:11和SEQ ID NO:12共转化菌株1-3。SEQ ID NO:11和SEQ ID NO:12类似于SEQ ID NO:5和SEQ ID NO:6,但具有以下区别:用米根霉葡糖淀粉酶(SEQ ID NO:39)代替扣囊复膜酵母葡糖淀粉酶。在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-8。

菌株1-9:在CYB2的第二等位基因处表达经修饰的米根霉葡糖淀粉酶的酿酒酵母

用SEQ ID NO:13和SEQ ID NO:14共转化菌株1-8。SEQ ID NO:13和SEQ ID NO:14与SEQ ID NO:7和SEQ ID NO:8类似,但具有以下区别:用米根霉葡糖淀粉酶代替扣囊复膜酵母葡糖淀粉酶。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-9。

菌株1-10:经由菌株1-9中的cre重组酶回收URA3标记和amdS标记

用SEQ ID NO:9转化菌株1-9。在含有3.5g/L对氟苯丙氨酸和l g/L L-酪氨酸的合成完全培养基(ScD-PFP)上选择转化体。将所得的转化体接种在ScD-PFP上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-10。

菌株1-11:在菌株1-10中的原始基因座处恢复天然URA3

用SEQ ID NO:10转化菌株1-10。在ScD-ura上选择转化体。将所得的转化体接种在ScD-ura上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-11。

菌株1-12:在FCY1的第一等位基因处表达经修饰的戴尔根霉葡糖淀粉酶的酿酒酵母

用SEQ ID NO:15和SEQ ID NO:16共转化菌株1-3。SEQ ID NO:15含有以下元件:i)与天然FCY1基因的5’区同源的DNA;和ii)戴尔根霉葡糖淀粉酶(SEQ ID NO:40)的独特密码子优化变体的表达盒,其受TDH3启动子和CYC1终止子的控制;以及iii)URA3启动子以及URA3基因的一部分。SEQ ID NO:16含有以下元件:i)URA3基因的一部分和终止子;和ii)戴尔根霉葡糖淀粉酶的独特密码子优化变体的表达盒,其受PGK启动子和GAL10终止子的控制;以及iii)与天然FCY1基因的3’区同源的DNA。在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-12。

菌株1-13:在FCY1的第二等位基因处表达经修饰的戴尔根霉葡糖淀粉酶的酿酒酵母

用SEQ ID NO:17和SEQ ID NO:18共转化菌株1-12。SEQ ID NO:17含有以下元件:i)与天然FCY1基因的5’区同源的DNA;和ii)戴尔根霉葡糖淀粉酶的独特密码子优化变体的表达盒,其受TDH3启动子和CYC1终止子的控制;以及iii)TEF1启动子和构巢曲霉amdS基因的一部分。SEQ ID NO:18含有以下元件:i)构巢曲霉乙酰胺酶(amdS)基因的一部分和ADH1终止子;和ii)戴尔根霉葡糖淀粉酶的独特密码子优化变体的表达盒,其受PGK启动子和GAL10终止子的控制;以及iii)与天然FCY1基因的3’区同源的DNA。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-13。

菌株1-14:经由菌株1-13中的cre重组酶回收URA3标记和amdS标记

用SEQ ID NO:9转化菌株1-13。在含有3.5g/L对氟苯丙氨酸和l g/L L-酪氨酸的合成完全培养基(ScD-PFP)上选择转化体。将所得的转化体接种在ScD-PFP上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-14。

菌株1-15:在菌株1-14中的原始基因座处恢复天然URA3

用SEQ ID NO:10转化菌株1-14。在ScD-ura上选择转化体。将所得的转化体接种在ScD-ura上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-15。

菌株1-16:在FCY1的第一等位基因处表达经修饰的小孢根霉葡糖淀粉酶的酿酒酵母

用SEQ ID NO:19和SEQ ID NO:20共转化菌株1-3。SEQ ID NO:19与SEQ ID NO:15类似,但具有以下区别:用小孢根霉葡糖淀粉酶(SEQ ID NO:41)代替戴尔根霉葡糖淀粉酶。SEQ ID NO:20含有以下元件:i)URA3基因的一部分和终止子;以及ii)与天然FCY1基因的3’区同源的DNA。在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-16。

菌株1-17:在FCY1的第二等位基因处表达经修饰的小孢根霉葡糖淀粉酶的酿酒酵母

用SEQ ID NO:21和SEQ ID NO:22共转化菌株1-16。SEQ ID NO:21与SEQ ID NO:17类似,但具有以下区别:用小孢根霉葡糖淀粉酶代替戴尔根霉葡糖淀粉酶。SEQ ID NO:22含有以下元件:i)构巢曲霉乙酰胺酶(amdS)基因的一部分和TEF1终止子;以及ii)与天然FCY1基因的3’区同源的DNA。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-17。

菌株1-18:经由菌株1-17中的cre重组酶回收URA3标记和amdS标记

用SEQ ID NO:9转化菌株1-17。在含有3.5g/L对氟苯丙氨酸和l g/L L-酪氨酸的合成完全培养基(ScD-PFP)上选择转化体。将所得的转化体接种在ScD-PFP上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-18。

菌株1-19:在菌株1-18中的原始基因座处恢复天然URA3

用SEQ ID NO:10转化菌株1-18。在ScD-ura上选择转化体。将所得的转化体接种在ScD-ura上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-19。

菌株1-20:在CYB2的两个等位基因处表达经修饰的米根霉葡糖淀粉酶并且在GDP1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母

用SEQ ID NO:23和SEQ ID NO:24以及SEQ ID NO:25和SEQ ID NO:26共转化菌株1-10。

SEQ ID NO:23含有以下元件:i)与天然GPD1基因的5’区同源的DNA;和ii)蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶(SEQ ID NO:42)的独特密码子优化变体的表达盒,其受PGK1启动子和CYC1终止子的控制;和iii)loxP重组位点;以及iv)URA3基因的一部分。SEQ IDNO:24含有以下元件:i)URA3基因的一部分和URA3终止子;和ii)loxP重组位点;以及iii)与天然GPD1基因的3’区同源的DNA。

SEQ ID NO:25含有以下元件:i)与天然GPD1基因的5’区同源的DNA;和ii)蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的独特密码子优化变体的表达盒,其受PGK1启动子和CYC1终止子的控制下;和iii)loxP重组位点;以及iv)TEF1启动子和构巢曲霉乙酰胺酶(amdS)基因的一部分。SEQ ID NO:26含有以下元件:i)amdS基因的一部分和TEF1终止子;和ii)loxP重组位点;以及iii)与天然GPD1基因的3’区同源的DNA。

在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过测序确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-20。

菌株1-21:在CYB2的两个等位基因处表达经修饰的米根霉葡糖淀粉酶、以及GPP1的两个等位基因的缺失的酿酒酵母

用SEQ ID NO:27转化菌株1-10。SEQ ID NO:27含有以下元件:i)与天然GPP1基因的5’区同源的DNA;和ii)来自乳酸克鲁维酵母,URA3启动子以及URA3基因和URA3终止子;和iii)位于URA3盒侧翼的loxP重组位点;以及iv)与天然GPP1基因的3’区同源的DNA。

在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过测序确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-21。

菌株1-22:在CYB2的两个等位基因处表达经修饰的米根霉葡糖淀粉酶并且在GPP1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母

用SEQ ID NO:28和SEQ ID NO:29以及SEQ ID NO:30和SEQ ID NO:31共转化菌株1-10。

SEQ ID NO:28和SEQ ID NO:29类似于SEQ ID NO:23和SEQ ID NO:24,但具有以下区别:用与天然GPP1基因同源的DNA替换与SEQ ID NO:23和SEQ ID NO:24中的天然GPD1基因同源的DNA。SEQ ID NO:30和SEQ ID NO:31类似于SEQ ID NO:25和SEQ ID NO:26,但具有以下区别:用与天然GPP1基因同源的DNA替换与SEQ ID NO:25和SEQ ID NO:26中的天然GPD1基因同源的DNA。

GAPN整合盒的质粒序列为:

在SEQ ID NO:59中,由核苷酸1-729编码的区是GPP1上侧翼区;由核苷酸730-1326编码的区是PGK启动子;由核苷酸1327-2766编码的区是蜡样芽孢杆菌GAPN的密码子优化编码序列;由核苷酸2767-2995编码的区是终止子区。

在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过测序确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-22。

菌株1-23:在CYB2的两个等位基因处表达经修饰的扣囊复膜酵母葡糖淀粉酶并且在GPP1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母

用SEQ ID NO:28和SEQ ID NO:29共转化菌株1-6,并且在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。向前移动三个独立的转化体,以在GPP1基因座处整合表达盒的第二拷贝。

用SEQ ID NO:30和SEQ ID NO:31共转化含有SEQ ID NO:28和SEQ ID NO:29的1个拷贝的三个独立的姊妹菌株,并且在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在测试#5中描述的发酵条件下测试三个独立的转化体,并且将与菌株1相比显示出早期发酵速率和相等或更高最终乙醇滴度的代表性分离株命名为菌株1-23。

菌株1-24:在FCY1的两个等位基因处表达经修饰的戴尔根霉葡糖淀粉酶并且在GPP1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母

用SEQ ID NO:28和SEQ ID NO:29以及SEQ ID NO:30和SEQ ID NO:31共转化菌株1-14。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过测序确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-24。

菌株1-25:在FCY1的两个等位基因处表达经修饰的小孢根霉葡糖淀粉酶并且在GPP1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母

用SEQ ID NO:28和SEQ ID NO:29以及SEQ ID NO:30和SEQ ID NO:31共转化菌株1-18。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过测序确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-25。

菌株1-26:在CYB2的两个等位基因处表达经修饰的米根霉葡糖淀粉酶并且在DLD1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母

用SEQ ID NO:32和SEQ ID NO:33共转化菌株1-10。SEQ ID NO:32和SEQ ID NO:33类似于SEQ ID NO:23和SEQ ID NO:24,但具有以下区别:用与天然DLD1基因同源的DNA替换与SEQ ID NO:23和SEQ ID NO:24中的天然GPD1基因同源的DNA。在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。向前移动三个独立的转化体,以在DLD1基因座处整合表达盒的第二拷贝。

用SEQ ID NO:34和SEQ ID NO:35共转化含有SEQ ID NO:32和SEQ ID NO:33的1个拷贝的三个独立的姊妹菌株。SEQ ID NO:34和SEQ ID NO:35类似于SEQ ID NO:25和SEQ IDNO:26,但具有以下区别:用与天然DLD1基因同源的DNA替换与SEQ ID NO:25和SEQ ID NO:26中的天然GPD1基因同源的DNA。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在测试#5中描述的发酵条件下测试三个独立的转化体,并且将与菌株1相比显示出早期发酵速率和相等或更高最终乙醇滴度的代表性分离株命名为菌株1-26。

菌株1-27:在CYB2的两个等位基因处表达经修饰的扣囊复膜酵母葡糖淀粉酶并且在DLD1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母

用SEQ ID NO:32和SEQ ID NO:33共转化菌株1-6,并且在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。向前移动三个独立的转化体,以在DLD1基因座处整合表达盒的第二拷贝。

用SEQ ID NO:34和SEQ ID NO:35共转化含有SEQ ID NO:32和SEQ ID NO:33的1个拷贝的三个独立的姊妹菌株。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在测试#5中描述的发酵条件下测试三个独立的转化体,并且将与菌株1相比显示出早期发酵速率和相等或更高最终乙醇滴度的代表性分离株命名为菌株1-27。

菌株1-28:在FCY1的两个等位基因处表达经修饰的戴尔根霉葡糖淀粉酶并且在DLD1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母

用SEQ ID NO:32和SEQ ID NO:33共转化菌株1-14,并且在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。向前移动三个独立的转化体,以在DLD1基因座处整合表达盒的第二拷贝。

用SEQ ID NO:34和SEQ ID NO:35共转化含有SEQ ID NO:32和SEQ ID NO:33的1个拷贝的三个独立的姊妹菌株。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在测试#5中描述的发酵条件下测试三个独立的转化体,并且将与菌株1相比显示出早期发酵速率和相等或更高最终乙醇滴度的代表性分离株命名为菌株1-28。

菌株1-29:在FCY1的两个等位基因处表达经修饰的小孢根霉葡糖淀粉酶并且在DLD1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母

用SEQ ID NO:32和SEQ ID NO:33共转化菌株1-18,并且在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。向前移动三个独立的转化体,以在DLD1基因座处整合表达盒的第二拷贝。

用SEQ ID NO:34和SEQ ID NO:35共转化含有SEQ ID NO:32和SEQ ID NO:33的1个拷贝的三个独立的姊妹菌株。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在测试#5中描述的发酵条件下测试三个独立的转化体,并且将与菌株1相比显示出早期发酵速率和相等或更高最终乙醇滴度的代表性分离株命名为菌株1-29。

菌株1-30:在CYB2的两个等位基因处表达经修饰的米根霉葡糖淀粉酶、在GPP1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶、并且在ADH2的一等位基因处表达酿酒酵母海藻糖-6-磷酸合酶和海藻糖-6-磷酸合酶/磷酸酶的一个拷贝的酿酒酵母

用SEQ ID NO:36和SEQ ID NO:37共转化菌株1-22。SEQ ID NO:36含有以下元件:i)与天然ADH2基因的5’区同源的DNA;和ii)天然酿酒酵母海藻糖-6-磷酸合酶(TPS1)(SEQID NO:43)的表达盒,其受天然酿酒酵母3-磷酸甘油酸激酶(PGK1)启动子和天然酿酒酵母液泡分选蛋白(VPS13)终止子的控制;以及iii)天然酿酒酵母磷酸丙糖异构酶(TPI1)启动子以及卡那霉素耐药性(G418

菌株1-31:在CYB2的两个等位基因处表达经修饰的米根霉葡糖淀粉酶、在GPD1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶、并且在ADH2的一等位基因处表达酿酒酵母海藻糖-6-磷酸合酶和海藻糖-6-磷酸合酶/磷酸酶的一个拷贝的酿酒酵母

用SEQ ID NO:36和SEQ ID NO:37共转化菌株1-20,并且在YPD+G418培养基上选择转化体。将所得的转化体接种在选择培养基上以用于单菌落分离。选择单菌落,并且通过测序确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-31。

表1:序列的说明

表2:菌株的说明

实施例2.在玉米醪中在米根霉(Ro)葡糖淀粉酶使能的酵母菌株中的GPP1基因座处gpp1缺失和蜡样芽胞杆菌gapN基因的过度表达的影响

如测试#1中所描述的评估降低GPP1的表达和过度表达GAPN对乙醇产生的影响。在具有使能葡糖淀粉酶的酿酒酵母的菌株中,缺失GPP1基因(菌株1-21和菌株1-22),并且过度表达gapN(菌株1-22)。总葡萄糖当量(TGE)被测定为279g/kg葡萄糖,并且该值用于确定菌株1-22与亲本菌株(菌株1-11)之间的产率差异,如测试#3中所描述的。

结果表明,相对于亲本菌株1-11,对测试菌株(菌株1-21和菌株1-22)中的发酵速率没有影响(图1),并且对于全部菌株而言,在48小时残余葡萄糖为<0.6g/kg(图3B)。在48小时时,与亲本(菌株1-11)相比,葡糖淀粉酶使能的酵母菌株(菌株1-22)中在GPP1基因座处整合的gapN的组合造成4.3g/L的甘油滴度降低(图3C)、1.8g/L的乙醇滴度提高(图3A)和1.3%的产率提高(图2)。

实施例3.在玉米醪中在米根霉(Ro)葡糖淀粉酶使能的酵母菌株中的GPD1基因座或GPP1基因座处过度表达蜡样芽胞杆菌gapN基因的比较

如测试1#中所描述的,在玉米醪中比较在米根霉(Ro)葡糖淀粉酶使能的酵母菌株中的GPD1基因座(菌株1-20)或GPP1基因座(菌株1-22)处过度表达蜡样芽胞杆菌gapN基因的影响。将测试菌株(菌株1-20和菌株1-22)与亲本菌株(菌株1-11)和野生型菌株(菌株1)进行比较。

发现菌株1-20在玉米醪中在40小时内产生的乙醇降低了17%(依据质量损失计算),证明显著的速率损失(图4)。相比之下,向GPP1基因座(菌株1-22)添加GAPN导致到40小时时的乙醇产生与菌株1等同(图4)。在48小时时,图4中每种菌株的平均乙醇滴度(依据质量损失)(g/L)如下:115.62g/L(菌株1-20)、130.47g/L(菌株1-22)、130.09g/L(菌株1-11)和130.16g/L(菌株1)。这些数据表明,在GPD1基因座处添加GAPN较不利,因为相对于将GAPN添加至除GPD1以外的基因座(如添加至基因座GPP1),这造成增加的发酵损失。

实施例4.在轻浸渍水液化物(湿磨原料)气锁烧瓶中的菌株1-21和菌株1-22中的乙醇产生和甘油降低

使用菌株1、菌株1-11、菌株1-21和菌株1-22测试降低GPP1的表达和过度表达GAPN对轻浸渍水液化物(湿磨原料)气锁烧瓶中乙醇产生的影响,从而如测试#4中所描述的测量乙醇滴度和甘油水平。

数据揭示了与菌株1-11相比菌株1-22中3.9g/L的甘油降低、1.9g/L的乙醇增加(图5)。这与在玉米醪(干磨乙醇原料)中观察到的甘油滴度降低和乙醇滴度增加相似。图5示出在72小时的轻浸渍水液化物LSW/LQ培养基(湿磨原料)中的结果。

实施例5:葡糖淀粉酶背景的比较、以及表达Tps1/Tps2的菌株的评价

运行发酵实验(测试#1)(每个菌株4次重复),从而比较在米根霉(Ro)葡糖淀粉酶使能的酵母菌株中的GPD1基因座(菌株1-20)或GPP1基因座(菌株1-22)处过度表达蜡样芽胞杆菌gapN基因的影响。此外,在菌株1-20和菌株1-22中过度表达Tps1/Tps2蛋白,以评估这些基因是否会提高乙醇发酵速度。所得的菌株(菌株1-30(在GPP1基因座处gapN)和菌株1-31(在GPD1基因座处gapN))两者都在ADH2基因座处含有1个Tps1/Tps2基因的过度表达的拷贝。还在三种不同的葡糖淀粉酶背景RoGA(菌株1-22)、Rdel(菌株1-24)和Rmic(菌株1-25)中评估GPP1基因座处的蜡样芽孢杆菌gapN基因的影响,以便确定葡糖淀粉酶基因来源是否会影响玉米醪中的乙醇产生。除菌株1-20和菌株1-31(含有GPD1基因座的缺失)运行67小时以外,全部菌株运行48小时。

图6是示出玉米醪中的菌株1-24和菌株1-25分别比菌株1产生高出2.2g/L和3.6g/L的乙醇滴度的图表。

图7是示出菌株1-24和菌株1-25中的残余葡萄糖(相对于菌株1)的图表。在GPP1基因座处含有gapN基因的菌株在发酵结束时显示出<1.5g/kg的残余葡萄糖值。

图8是示出玉米醪中的菌株1-24和菌株1-25分别相对于菌株1产生5.0g/L和4.6g/L的甘油滴度降低的图表。

由于发酵负担,将蜡样芽孢杆菌gapN基因插入GPD1基因座处的菌株从未达到亲本菌株的滴度。相比之下,蜡样芽孢杆菌gapN基因插入GPP1基因座处的菌株表现更好。

图9示出在47小时处玉米醪中的菌株1-25相对于菌株1产生4.1g/L的乙醇滴度增加。

图10示出玉米醪中的菌株1-25相对于菌株1产生4.3g/L的甘油滴度降低。图10B示出玉米醪中在发酵结束时(47小时)的残余葡萄糖少于1.5g/L。

菌株1-25展现出改善的乙醇滴度和减小的甘油滴度,而对发酵速率没有负面影响。

实施例6.在玉米醪中在各种葡糖淀粉酶使能的酵母菌株中在GPP1基因座或DLD1基因座处过度表达蜡样芽孢杆菌gapN基因的比较

如测试1#中所描述的,在玉米醪中比较在葡糖淀粉酶使能的酵母菌株中的GPP1基因座(菌株1-22、菌株1-23、菌株1-24、和菌株1-25)或DLD1基因座(菌株1-27、菌株1-28、和菌株1-29)处过度表达蜡样芽胞杆菌gapN基因的影响。将测试菌株(菌株1-22、菌株1-23、菌株1-24、菌株1-25、菌株1-27、菌株1-28、和菌株1-29)与亲本菌株(菌株1-7、菌株1-11、菌株1-15、和菌株1-19)和野生型菌株(菌株1)进行比较。

根据葡糖淀粉酶背景,蜡样芽孢杆菌gapN向GPP1基因座和DLD1基因座两者的添加造成甘油滴度降低介于3.1g/kg与3.9g/kg之间(图11)。一般而言,含有gapN的菌株(无论整合位点如何)相比于各自的亲本菌株并且相比于野生型菌株(菌株1)都显示出乙醇滴度增加(图12)。除了菌株1-23以外,全部菌株中的乙醇滴度增加为至少1.4g/kg。尽管菌株1-23与亲本对照(菌株1-7)相比显示出3.1g/kg的甘油降低,但乙醇滴度相似。菌株1-29相对于菌株1显示出最高的乙醇滴度增加(增加3.5g/kg(138.2g/kg-134.7g/kg))。

这些数据表明,如测试#1所定义的,GAPN在GPP1基因座或DLD1基因座处的添加造成发酵结束时增加的乙醇滴度。

实施例7:测试和测定

测试1:菌株在33.3℃在33%DS玉米醪中的表征

将菌株接种至YPD板,并且在30℃孵育直至可见单菌落(1-2天)。将来自YPD板的细胞刮入pH 7.0的无菌磷酸盐缓冲液中,并且测量光密度(OD600)。使用型号Genesys 20可见光分光光度计(Thermo Scientific)在600nm波长和1cm路径长度下测量光密度。在摇瓶中接种达到0.1的初始OD600所必需的体积的细胞浆。接种体积通常为约66μl。在即将接种之前,将以下材料添加至每个250ml带有挡板的摇瓶:50克的液化玉米醪、190μl的500g/L经过滤灭菌的尿素、以及2.5μl的100mg/ml氨苄青霉素的经过滤灭菌的原料。对于含有Ethanol

测试2:菌株在33.3℃在33%DS玉米醪中的表征(测试#2)

将菌株接种至YPD板,并且在30℃孵育直至可见单菌落(1-2天)。将来自YPD板的细胞刮入pH 7.0的无菌磷酸盐缓冲液中,并且测量光密度(OD600)。使用型号Genesys 20可见光分光光度计(Thermo Scientific)在600nm波长和1cm路径长度下测量光密度。在摇瓶中接种达到0.1的初始OD600所必需的体积的细胞浆。接种体积通常为约66μl。在即将接种之前,将以下材料添加至每个250ml带有挡板的摇瓶:50克的液化玉米醪、190μl的500g/L经过滤灭菌的尿素、以及2.5μl的100mg/ml氨苄青霉素的经过滤灭菌的原料。摇瓶接收达到0.33AGU/g干固体的剂量的一定量的葡糖淀粉酶(Spirizyme Fuel HS

测试3:产率计算

乙醇产率的公式可以定义为:(时间终点处的乙醇滴度-时间零点处的乙醇滴度)除以时间零点处的TGE。

当计算甘油降低菌株与对照菌株之间的产率差异时,从甘油降低菌株的乙醇产率中减去对照菌株的乙醇产率。例如,如测试#1中所描述的,在玉米醪发酵中运行菌株1-24和菌株1。起始培养基被确定为具有280g/kg葡萄糖的TGE值,并且存在0g/kg的乙醇。在48小时时,通过HPLC测量发酵液体培养基,并且确定菌株1-24达到130g/kg的最终乙醇滴度,且菌株1达到128g/kg的的最终乙醇滴度。基于上文的产率计算,可以确定菌株1-24具有46.4%的乙醇产率(130g/kg乙醇除以280g/kg TGE),并且菌株1具有45.7%的乙醇产率(128g/kg乙醇除以280g/kg TGE)。通过使用菌株1-24的乙醇产率(46.4%)并且减去菌株1的乙醇产率(45.7%),可以认为菌株1-24具有比菌株1高出0.7%的乙醇产率。

测试4:经基因修饰的酿酒酵母菌株在同步糖化发酵(SSF)摇瓶测定中的评估

将菌株接种至ScD-ura板,并且在30℃孵育直至可见单菌落(2-3天)。将来自ScD-ura板的细胞刮入无菌摇瓶培养基中,并且测量光密度(OD600)。使用型号Genesys 20分光光度计(Thermo Scientific)在600nm波长和1cm路径长度下测量光密度。在摇瓶中接种细胞浆以达到0.1的初始OD600。在即将接种之前,将50mL的摇瓶培养基添加至250mL带有挡板的摇瓶,该摇瓶用含有4ml灭菌芥花油的气锁密封。摇瓶培养基由725g部分水解的玉米淀粉、150g经过滤的灭菌(0.2μm)轻浸渍水、10g水、25g葡萄糖和1g尿素组成。将菌株在30℃在定轨振荡器中以100rpm振荡孵育72小时。采集样品,并且通过HPLC分析发酵结束时液体培养基中的代谢物浓度。

葡糖淀粉酶活性测定

葡糖淀粉酶活性(AGU)指在标准反应条件下每分钟水解1微摩尔麦芽糖的酶的量。制备以下储备溶液:i)10×麦芽糖储备溶液(232mM);和ii)2×乙酸钠缓冲液(pH 4.3)的储备溶液(200mM)。葡糖淀粉酶储备溶液的1:10稀释液用作起始材料,并且从此处稀释(.899g水+.140g葡糖淀粉酶=总计1.0139g)。在水中进行系列稀释(1:1),其中从最初的1:10稀释开始,系列中总计六次稀释。

在200μl反应体积中,依次添加以下组分:100μl的乙酸钠缓冲液(pH 4.3)、20μl的10×麦芽糖储备溶液(或空白对照中的水)、以及70μl水。在10μl经稀释的酶溶液的添加之前,将反应预加温至37℃。在37℃5分钟之后,用15μl的浓H

1.将反应结束时的葡萄糖浓度(克/升)除以葡萄糖的分子量(180.156克/摩尔),以获得葡萄糖的摩尔浓度(摩尔/升)。

2.将摩尔浓度乘以反应的总体积(215μl),以获得葡萄糖的微摩尔浓度。

3.将步骤2(上文)中计算的葡萄糖的微摩尔除以2,以计算反应中用作底物的麦芽糖(2葡萄糖=1麦芽糖)。该数字除以测定本身中使用的酶的克数。如上所述制作最低稀释度(1.1039g水中0.140g),然后将该稀释度乘以测定稀释度(10μl的酶除以215μl的总体积)。

例如,含有上文列出的组分的反应返回4.2克/升的HPLC葡萄糖浓度,并且酶的活性被确定为312.7AGU/g。

表3:淀粉酶活性测定的实例

测试5:菌株在50ml锥形管中在33.3℃在33%DS玉米醪中的表征

菌株接种至YPD板,并且在30℃孵育直至可见单菌落(1-2天)。将来自YPD板的细胞刮入pH 7.0的无菌磷酸盐缓冲液中,并且测量光密度(OD600)。使用型号Genesys 20可见光分光光度计(Thermo Scientific)在600nm波长和1cm路径长度下测量光密度。装有0.2μm过滤器(Nalgene注射器式过滤器,Thermo Scientific;目录号:727-2020)的50ml锥形管接种有达到0.1的初始OD600所必需的体积的细胞浆。接种体积通常为约26μl。在即将接种之前,将以下材料添加至每个50ml锥形管(Fisher Scientific;目录号:05-539-13):20克的液化玉米醪、76μl的500g/L经过滤灭菌的尿素、以及1μl的100mg/ml氨苄青霉素的经过滤灭菌的原料。对于含有Ethanol

等同物

本领域技术人员仅使用常规实验就将认识到或能够确知本文所描述的本发明的具体实施方案的许多等同物。这样的等同物旨在由以下权利要求书涵盖。

本文公开的全部参考文献(包含专利文件)通过引用被整体(特别是本文所引用的公开内容)并入本文。

序列表

<110> 嘉吉有限公司

<120> 用于使用经工程化的酵母产生乙醇的方法

<130> G0919.70031WO00

<140> 尚未分配

<141> 与此同时

<150> US 62/648,679

<151> 2018-03-27

<160> 59

<170> PatentIn版本3.5

<210> 1

<211> 3182

<212> DNA

<213> 酿酒酵母

<400> 1

cctactgcgc caattgatga caatacagac gatgataaca aaccgaagtt atctgatgta 60

gaaaaggatt aaagatgcta agagatagtg atgatatttc ataaataatg taattctata 120

tatgttaatt accttttttg cgaggcatat ttatggtgaa ggataagttt tgaccatcaa 180

agaaggttaa tgtggctgtg gtttcagggt ccataaagct tttcaattca tctttttttt 240

ttttgttctt ttttttgatt ccggtttctt tgaaattttt ttgattcggt aatctccgag 300

cagaaggaag aacgaaggaa ggagcacaga cttagattgg tatatatacg catatgtggt 360

gttgaagaaa catgaaattg cccagtattc ttaacccaac tgcacagaac aaaaacctgc 420

aggaaacgaa gataaagcgg ccgcataact tcgtataatg tatgctatac gaagttatct 480

gccagtatac agctagcctt gaaagtgatg gaaaacattg tcatcggcac ataaataaaa 540

aaattatgaa tcacgtgatc aacagcaaat tatgtactcg tatatatgca agcgcattcc 600

ttatattgac actctttcat tgggcatgag gctgtgtaaa cataagctgt aacggtctca 660

cggaacactg tgtagttgca ttactgtcag gcagttatgt tgcttaatat aaaggcaaag 720

gcatggcaga atcactttaa aacgtggccc cacccgctgc accctgtgca ttttgtacgt 780

tactgcgaaa tgactcaacg atgaaatgaa aaaattttgc ttgaaatttt gaaaaaaaga 840

tgtgcgggac gcattgttag ctcattgaat acatcgtgat cgaatccaat caatgtttaa 900

tttcatatta atacagaaac tttttctcat actttcttct tcttttcatt ggtatattat 960

ctatatatcg tgttaattcc tctttcgtca tttttagcat cgttataaga gtaattaaga 1020

ataactagaa gagtctctct ttatattcgt ttattttata tatttaaccg ctaaatttag 1080

taaacaaaag aatctatcag aaatgagtga atctccaatg ttcgctgcca acggcatgcc 1140

aaaggtaaat caaggtgctg aagaagatgt cagaatttta ggttacgacc cattagcttc 1200

tccagctctc cttcaagtgc aaatcccagc cacaccaact tctttggaaa ctgccaagag 1260

aggtagaaga gaagctatag atattattac cggtaaagac gacagagttc ttgtcattgt 1320

cggtccttgt tccatccatg atctagaagc cgctcaagaa tacgctttga gattaaagaa 1380

attgtcagat gaattaaaag gtgatttatc catcattatg agagcatact tggagaagcc 1440

aagaacaacc gtcggctgga aaggtctaat taatgaccct gatgttaaca acactttcaa 1500

catcaacaag ggtttgcaat ccgctagaca attgtttgtc aacttgacaa atatcggttt 1560

gccaattggt tctgaaatgc ttgataccat ttctcctaaa tacttggctg atttggtctc 1620

cttcggtgcc attggtgcca gaaccaccga atctcaactg cacagagaat tggcctccgg 1680

tttgtctttc ccagttggtt tcaagaacgg taccgatggt accttaaatg ttgctgtgga 1740

tgcttgtcaa gccgctgctc attctcacca tttcatgggt gttactaagc atggtgttgc 1800

tgctatcacc actactaagg gtaacgaaca ctgcttcgtt attctaagag gtggtaaaaa 1860

gggtaccaac tacgacgcta agtccgttgc agaagctaag gctcaattgc ctgccggttc 1920

caacggtcta atgattgact actctcacgg taactccaat aaggatttca gaaaccaacc 1980

aaaggtcaat gacgttgttt gtgagcaaat cgctaacggt gaaaacgcca ttaccggtgt 2040

catgattgaa tcaaacatca acgaaggtaa ccaaggcatc ccagccgaag gtaaagccgg 2100

cttgaaatat ggtgtttcca tcactgatgc ttgtataggt tgggaaacta ctgaagacgt 2160

cttgaggaaa ttggctgctg ctgtcagaca aagaagagaa gttaacaaga aatagatgtt 2220

tttttaatga tatatgtaac gtacattctt tcctctacca ctgccaattc ggtattattt 2280

aattgtgttt agcgctattt actaattaac tagaaactca atttttaaag gcaaagctcg 2340

ctgacctttc actgatttcg tggatgttat actatcagtt actcttctgc aaaaaaaaat 2400

tgagtcatat cgtagctttg ggattatttt tctctctctc cacggctaat taggtgatca 2460

tgaaaaaatg aaaaattcat gagaaaagag tcagacatcg aaacatacat aagttgatat 2520

tcctttgata tcgacgacta ctcaatcagg ttttaaaaga aaagaggcag ctattgaagt 2580

agcagtatcc agtttaggtt ttttaattat ttacaagtaa agaaaaagag aatgccggtc 2640

gttcacgata acttcgtata atgtatgcta tacgaagtta tgcggccgcg agaagatgcg 2700

gccagcaaaa ctaaaaaact gtattataag taaatgcatg tatactaaac tcacaaatta 2760

gagcttcaat ttaattatat cagttattac ccgggaatct cggtcgtaat gatttctata 2820

atgacgaaaa aaaaaaaatt ggaaagaaaa agcttcatgg cctttataaa aaggaactat 2880

ccaatacctc gccagaacca agtaacagta ttttacgggg cacaaatcaa gaacaataag 2940

acaggactgt aaagatggac gcattgaact ccaaagaaca acaagagttc caaaaagtag 3000

tggaacaaaa gcaaatgaag gatttcatgc gtttgtactc taatctggta gaaagatgtt 3060

tcacagactg tgtcaatgac ttcacaacat caaagctaac caataaggaa caaacatgca 3120

tcatgaagtg ctcagaaaag ttcttgaagc atagcgaacg tgtagggcag cgtttccaag 3180

ag 3182

<210> 2

<211> 3275

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 2

cctactgcgc caattgatga caatacagac gatgataaca aaccgaagtt atctgatgta 60

gaaaaggatt aaagatgcta agagatagtg atgatatttc ataaataatg taattctata 120

tatgttaatt accttttttg cgaggcatat ttatggtgaa gaataagttt tgaccatcaa 180

agaaggttaa tgtggctgtg gtttcagggt ccataaagct tttcaattca tcattttttt 240

tttattcttt tttttgattc cggtttcctt gaaatttttt tgattcggta atctccgaac 300

agaaggaaga acgaaggaag gagcacagac ttagattggt atatatacgc atatgtagtg 360

ttgaagaaac atgaaattgc ccagtattct taacccaact gcacagaaca aaaatctgca 420

ggaaacgaag ataaagcggc cgcataactt cgtatagcat acattatacg aagttatcgc 480

ctgttaagat ataactgaaa aaagagggga atttttagat actgaaatga tattttagaa 540

taaccagact atatataagg ataaattaca aaaaattaac taatagataa gatttaaata 600

taaaagatat gcaactagaa aagtcttatc aatctcctta tggagtgacg acgttaccca 660

acaatttacc gacttcttcg gcgatagcca aagttctctc ttcggacaat cttctaccaa 720

taacttgaac agcaacagga gcaccgtgat aagcctctgg gtcgtattct tcttgaacca 780

aagcatccaa ttcggaaaca gctttaaaag attcgttctt cttatcaata ttcttatcag 840

cgaaagtgac tgggacgaca acagaggtga aatccaataa gttaataacg gaggcgtaac 900

cgtagtatct gaattgatcg tgtctgacag cggcggtagg agtaattgga gcgataatag 960

cgtccaattc cttaccagct ttttcttcag cttcacgcca cttttccaag tattccattt 1020

gatagttcca cttttgtaaa tgagtgtccc acaattcgtt catgttaaca gccttaatat 1080

ttgggttcaa caagtcctta atgttaggga tggctggctc accagaggca gaaatgtctc 1140

tcatgacgtc ggcagaacca tcagcagcat agatgtggga aatcaagtca tgaccgaaat 1200

catgcttgta tggagtccat ggagtaacgg tgtgaccagc cttggccaaa gcggcaacgg 1260

tagtttcgac accacgtaaa attggtgggt gtggcaagac gttaccgtcg aaattgtaat 1320

aaccaatgtt caaaccacca ttcttaatct tagaggcaat gatgtcagat tcagattgtc 1380

tccatggcat tgggatgacc ttagagtcgt acttccaagg ttcttgaccc aagacagatt 1440

tggtgaacaa tctcaagtct tcgacggagt gagtgatagg accaacgacg gagtgaacgg 1500

tttcttgacc ttccatagag ttagccattt tagcatatgg caatctaccg tgagatggtc 1560

tcaaaccgta taaaaagttg aaagcagctg ggactctaat ggaaccacca atgtcagtac 1620

cgacaccaat aacaccacct ctaataccaa caatagcacc ttcaccacca gaagaaccac 1680

cacaggacca atttttgttt cttggattga cagttctacc aatgatgttg ttgacggttt 1740

cacagaccat caaggtttgt gggacagagg tcttaacgta gaaaacagca ccagcttttc 1800

tcaacatggt ggttaagacg gaatcacctt catcgtattt gtttaaccag gaaatgtaac 1860

ccatggaggt ttcgtaaccc ttaacacgca attggtcctt taaagagatt ggtaaaccgt 1920

gtaatggacc aactggtctc ttatgcttag cgtagtattc atctaattct ctagcttgag 1980

ctaaagcagc atctgggaag aattcgtgag cacagttggt taattgttga gcaatagcag 2040

ctctcttaca aaaagccaaa gtgacttcaa cagaagtcaa ctcaccagcg gccaacttgg 2100

agaccaaatc agcagcagag gcttcggtaa tcttcaattc agcctcagac aaaataccgg 2160

acttctttgg gaaatcaata acggaatctt cggcaggcaa agtttgaacc ttccattcgt 2220

caggaatggt tttagccaaa cgggcacgtt tgtcggcggc caattcttcc caggattgtg 2280

gcattttgta attaaaactt agattagatt gctatgcttt ctttctaatg agcaagaagt 2340

aaaaaaagtt gtaatagaac aagaaaaacg aaactgaaac ttgagaaatt gaagaccatt 2400

tattaactta aatatcaatg ggaggtcatc gaaagagaaa aaaatcaaaa aaaaaatttt 2460

tcaagaaaaa gaaacgtgat aaaaattttt attgcctttt tcgacgaaga aaaagaaacg 2520

aggcggtctc ttttttcttt tccaaacctt tagtacgggt aattaacgcc accctagagg 2580

aagaaagagg ggaaatttag tatgctgtgc ttgggtgttt tgaagtggta cggcgatgcg 2640

cggagtccga gaaaatctgg aagagtaaaa aaggagtaga aacattttga agctatggtg 2700

tgtgggggat cacttgtggg ggattgggtg tgatgtaagg ataacttcgt atagcataca 2760

ttatacgaag ttatgcggcc gcgagaagat gcggccagca aaactaaaaa actgtattat 2820

aagtaaatgc atgtatacta aactcacaaa ttagagcttc aatttaatta tatcagttat 2880

tacccgggaa tctcggtcgt aatgattttt ataatgacga aaaaaaaaaa attggaaaga 2940

aaaagcttca tggcctttat aaaaaggaac catccaatac ctcgccagaa ccaagtaaca 3000

gtattttacg gggcacaaat caagaacaat aagacaggac tgtaaagatg gacgcattga 3060

actccaaaga acaacaagag ttccaaaaag tagtggaaca aaagcaaatg aaggatttca 3120

tgcgtttgta ctctaatctg gtagaaagat gttttacaga ctgtgtcaat gacttcacaa 3180

catcaaagct aaccaataag gaacaaacat gcatcatgaa gtgctcagaa aagttcttga 3240

agcatagcga acgtgtaggg cagcgtttcc aagag 3275

<210> 3

<211> 1132

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 3

ctctttttta cagatcatca aggaagtaat tatctacttt ttacaagaat tcatgtctaa 60

tttacttact gttcaccaaa acttgcctgc attaccagtt gacgcaacct ccgatgaagt 120

cagaaagaac cttatggata tgtttagaga tagacaagct ttctccgaac atacttggaa 180

aatgttatta tccgtttgta gatcctgggc cgcttggtgt aaacttaaca atagaaaatg 240

gtttcctgct gaaccagaag acgtcagaga ttacttactt tacttacaag ctagaggttt 300

ggctgttaaa actatccaac aacacttagg tcaattgaat atgttacaca gaagatccgg 360

tttaccaaga ccatccgatt ccaacgcagt ttcccttgtt atgagaagaa ttagaaaaga 420

aaatgttgac gctggtgaaa gagctaaaca agcattagca tttgaaagaa ccgatttcga 480

tcaagttaga tccttaatgg aaaattccga tagatgtcaa gatattagaa acttagcttt 540

cttaggtatt gcttacaaca cattattaag aatcgctgaa attgctagaa ttagagttaa 600

agatatttca agaaccgatg gcggtagaat gttaatccac attggcagaa caaaaacctt 660

agtctccaca gcaggcgtcg aaaaagcatt atcattaggt gttactaaat tagttgaacg 720

ttggatttcc gtttccggtg ttgcagatga cccaaacaac tacttattct gtcgtgttag 780

aaaaaatggt gttgccgctc cttccgctac ctcacaatta tccacaagag cattagaagg 840

catttttgaa gctacccaca gacttattta tggtgcaaaa gacgattccg gtcaaagata 900

tttagcttgg tctggtcatt ccgctagagt tggtgccgca agagacatgg caagagctgg 960

tgtttctatt cctgaaatta tgcaagccgg tggttggact aatgttaaca ttgttatgaa 1020

ctatatcaga aacttagatt ccgaaacagg tgctatggtt agattacttg aagacggtga 1080

ttaagctagc taagatccgc tctaaccgaa aaggaaggag ttagacaacc tg 1132

<210> 4

<211> 6376

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 4

ctagctaaga tccgctctaa ccgaaaagga aggagttaga caacctgaag tctaggtccc 60

tatttatttt tttatagtta tgttagtatt aagaacgtta tttatatttc aaatttttct 120

tttttttctg tacagacgcg tgtacgcatg taacattata ctgaaaacct tgcttgagaa 180

ggttttggga cgctcgaaga tccagctgca ttaatgaatc ggccaacgcg cggggagagg 240

cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 300

tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 360

aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 420

aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 480

tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 540

ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 600

cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 660

ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 720

ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 780

gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 840

agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 900

cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 960

aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1020

aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 1080

ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 1140

aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 1200

ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 1260

agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 1320

cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 1380

ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 1440

gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 1500

cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 1560

cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 1620

ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 1680

catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 1740

tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 1800

ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 1860

catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 1920

cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 1980

cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 2040

acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 2100

ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 2160

tccgcgcaca tttccccgaa aagtgccacc tgaacgaagc atctgtgctt cattttgtag 2220

aacaaaaatg caacgcgaga gcgctaattt ttcaaacaaa gaatctgagc tgcattttta 2280

cagaacagaa atgcaacgcg aaagcgctat tttaccaacg aagaatctgt gcttcatttt 2340

tgtaaaacaa aaatgcaacg cgagagcgct aatttttcaa acaaagaatc tgagctgcat 2400

ttttacagaa cagaaatgca acgcgagagc gctattttac caacaaagaa tctatacttc 2460

ttttttgttc tacaaaaatg catcccgaga gcgctatttt tctaacaaag catcttagat 2520

tacttttttt ctcctttgtg cgctctataa tgcagtctct tgataacttt ttgcactgta 2580

ggtccgttaa ggttagaaga aggctacttt ggtgtctatt ttctcttcca taaaaaaagc 2640

ctgactccac ttcccgcgtt tactgattac tagcgaagct gcgggtgcat tttttcaaga 2700

taaaggcatc cccgattata ttctataccg atgtggattg cgcatacttt gtgaacagaa 2760

agtgatagcg ttgatgattc ttcattggtc agaaaattat gaacggtttc ttctattttg 2820

tctctatata ctacgtatag gaaatgttta cattttcgta ttgttttcga ttcactctat 2880

gaatagttct tactacaatt tttttgtcta aagagtaata ctagagataa acataaaaaa 2940

tgtagaggtc gagtttagat gcaagttcaa ggagcgaaag gtggatgggt aggttatata 3000

gggatatagc acagagatat atagcaaaga gatacttttg agcaatgttt gtggaagcgg 3060

tattcgcaat attttagtag ctcgttacag tccggtgcgt ttttggtttt ttgaaagtgc 3120

gtcttcagag cgcttttggt tttcaaaagc gctctgaagt tcctatactt tctagagaat 3180

aggaacttcg gaataggaac ttcaaagcgt ttccgaaaac gagcgcttcc gaaaatgcaa 3240

cgcgagctgc gcacatacag ctcactgttc acgtcgcacc tatatctgcg tgttgcctgt 3300

atatatatat acatgagaag aacggcatag tgcgtgttta tgcttaaatg cgtacttata 3360

tgcgtctatt tatgtaggat gaaaggtagt ctagtacctc ctgtgatatt atcccattcc 3420

atgcggggta tcgtatgctt ccttcagcac taccctttag ctgttctata tgctgccact 3480

cctcaattgg attagtctca tccttcaatg ctatcatttc ctttgatatt ggatcatact 3540

aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 3600

gtctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg 3660

tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg 3720

gtgttggcgg gtgtcggggc tggcttaact atgcggcatc agagcagatt gtactgagag 3780

tgcaccatac cacagctttt caattcaatt catcattttt tttttattct tttttttgat 3840

ttcggtttct ttgaaatttt tttgattcgg taatctccga acagaaggaa gaacgaagga 3900

aggagcacag acttagattg gtatatatac gcatatgtag tgttgaagaa acatgaaatt 3960

gcccagtatt cttaacccaa ctgcacagaa caaaaacctg caggaaacga agataaatca 4020

tgtcgaaagc tacatataag gaacgtgctg ctactcatcc tagtcctgtt gctgccaagc 4080

tatttaatat catgcacgaa aagcaaacaa acttgtgtgc ttcattggat gttcgtacca 4140

ccaaggaatt actggagtta gttgaagcat taggtcccaa aatttgttta ctaaaaacac 4200

atgtggatat cttgactgat ttttccatgg agggcacagt taagccgcta aaggcattat 4260

ccgccaagta caatttttta ctcttcgaag acagaaaatt tgctgacatt ggtaatacag 4320

tcaaattgca gtactctgcg ggtgtataca gaatagcaga atgggcagac attacgaatg 4380

cacacggtgt ggtgggccca ggtattgtta gcggtttgaa gcaggcggca gaagaagtaa 4440

caaaggaacc tagaggcctt ttgatgttag cagaattgtc atgcaagggc tccctatcta 4500

ctggagaata tactaagggt actgttgaca ttgcgaagag cgacaaagat tttgttatcg 4560

gctttattgc tcaaagagac atgggtggaa gagatgaagg ttacgattgg ttgattatga 4620

cacccggtgt gggtttagat gacaagggag acgcattggg tcaacagtat agaaccgtgg 4680

atgatgtggt ctctacagga tctgacatta ttattgttgg aagaggacta tttgcaaagg 4740

gaagggatgc taaggtagag ggtgaacgtt acagaaaagc aggctgggaa gcatatttga 4800

gaagatgcgg ccagcaaaac taaaaaactg tattataagt aaatgcatgt atactaaact 4860

cacaaattag agcttcaatt taattatatc agttattacc ctatgcggtg tgaaataccg 4920

cacagatgcg taaggagaaa ataccgcatc aggaaattgt aaacgttaat attttgttaa 4980

aattcgcgtt aaatttttgt taaatcagct cattttttaa ccaataggcc gaaatcggca 5040

aaatccctta taaatcaaaa gaatagaccg agatagggtt gagtgttgtt ccagtttgga 5100

acaagagtcc actattaaag aacgtggact ccaacgtcaa agggcgaaaa accgtctatc 5160

agggcgatgg cccactacgt gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc 5220

gtaaagcact aaatcggaac cctaaaggga gcccccgatt tagagcttga cggggaaagc 5280

cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg agcgggcgct agggcgctgg 5340

caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac 5400

agggcgcgtc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 5460

ctcttcgcta ttacgccagc tgaattggag cgacctcatg ctatacctga gaaagcaacc 5520

tgacctacag gaaagagtta ctcaagaata agaattttcg ttttaaaacc taagagtcac 5580

tttaaaattt gtatacactt atttttttta taacttattt aataataaaa atcataaatc 5640

ataagaaatt cgcttattta gaagtgtcaa caacgtatct accaacgatt tgaccctttt 5700

ccatcttttc gtaaatttct ggcaaggtag acaagccgac aaccttgatt ggagacttga 5760

ccaaacctct ggcgaagaat tgttaattaa gccagaaaaa ggaagtgttt ccctccttct 5820

tgaattgatg ttaccctcat aaagcacgtg gcctcttatc gagaaagaaa ttaccgtcgc 5880

tcgtgatttg tttgcaaaaa gaacaaaact gaaaaaaccc agacacgctc gacttcctgt 5940

cttcctattg attgcagctt ccaatttcgt cacacaacaa ggtcctagcg acggctcaca 6000

ggttttgtaa caagcaatcg aaggttctgg aatggcggga aagggtttag taccacatgc 6060

tatgatgccc actgtgatct ccagagcaaa gttcgttcga tcgtactgtt actctctctc 6120

tttcaaacag aattgtccga atcgtgtgac aacaacagcc tgttctcaca cactcttttc 6180

ttctaaccaa gggggtggtt tagtttagta gaacctcgtg aaacttacat ttacatatat 6240

ataaacttgc ataaattggt caatgcaaga aatacatatt tggtcttttc taattcgtag 6300

tttttcaagt tcttagatgc tttctttttc tcttttttac agatcatcaa ggaagtaatt 6360

atctactttt tacaag 6376

<210> 5

<211> 4632

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 5

cagagcctct tatattcact ctgttcctcc atcgcctatt gagaaacgtt ggaataaaac 60

tctaaaaata tcatctagtt ggttagtttt tattttacca gtacattgtc acttgcggag 120

ggaggatgac ataaagattg agacgcagtc atttaatgaa gtttaaacgc aggtatttga 180

taaagtaata cgatattgaa tcatgacgta taaagtgaaa tgaacaaatg attacgtaaa 240

aaatgtcgat tttctcttga gagactccca tagcctctaa gaggccttct actacgttcc 300

atatatctaa gaatggggcc atatccagtg gaatcccagc aattatttaa ggatcaccta 360

tttctcagcc gatattttag caaaatcact accaatatca gggggcaata gttgatcgcc 420

tactttaaca aaaaatgttg ctcacgtatt aacacaggca acaaaaagga tattacgcaa 480

gaacgtagta tccacatgcc atcctccttg ttgcatcttt ttttttccga aatgattccc 540

tttcctgcac aacacgagat ctttcacgca tacatcggaa ggatcacccc ccactcaagt 600

cgttgcattg ctaacatgtg gcattctgcc catttttttc acgaaaattc tctctctata 660

atgaagaccc ttgtgccctg gactctgtaa tacttgaaac tacttcctca ataatcgctt 720

ggagacctac ccccacgctt ttcaaacaag gcgctagcaa aaagcctgcc gatatctcct 780

tgccccctcc ttctgttcga gagaactacg acccgaccaa taataatgtc atacaagaac 840

cgccaagaac caactgctga accttagatc tccaatactt cagttggagt atgtgaatat 900

ataagtacct ggtcgactaa tcttcttgca tcttttcgta ttcttacatc ctatgtcgct 960

aatacagttc ccgcatagag aagaaagcaa acaaaagtag tcactcgaga tctcccgagt 1020

ttatcattat caatactgcc atttcaaaga atacgtaaat aattaatagt agtgattttc 1080

ctaactttat ttagtcaaaa aattggcctt ttaattctgc tgtaacccgt acatgcccaa 1140

aatagggggc gggttacaca gaatatataa catcataggt gtctgggtga acagtttatt 1200

cctggcatcc actaaatata atggagcccg ctttttttaa gctggcatcc agaaaaaaaa 1260

agaatcccag caccaaaata ttgttttctt caccaaccat cagttcatag gtccattctc 1320

ttagcgcaac tacacagaac aggggcacaa acaggcaaaa aacgggcaca acctcaatgg 1380

agtgatgcaa cctgcttgga gtaaatgatg acacaaggca attgacctac gcatgtatct 1440

atctcatttt cttacacctt ctattacctt ctgctctctc tgatttggaa aaagctgaaa 1500

aaaaaggttg aaaccagttc cctgaaatta ttcccctatt tgactaataa gtatataaag 1560

acggtaggta ttgattgtaa ttctgtaaat ctatttctta aacttcttaa attctacttt 1620

tatagttagt ctttttttta gtttaaaaca ccaagaactt agtttcgaat aaacacacat 1680

aaacaaacaa atctagaatg attagattaa ccgtattcct cactgcagtt tttgcagcag 1740

tcgcttcctg tgttccagtt gaattggata agagaaatac aggccatttc caagcatatt 1800

ctggttacac cgtagctaga tcaaacttta ctcaatggat tcacgagcaa ccagccgtat 1860

catggtacta tttgcttcag aatatagact atccagaagg acaattcaag tctgccaagc 1920

caggggtcgt tgtggcttcc ccttctacat ccgaacctga ttacttctac caatggacta 1980

gagatactgc tatcaccttc ttgtcactta tcgcggaagt tgaggatcat tctttttcaa 2040

atactacact agccaaggtg gttgaatact acatctctaa tacttacaca ttacaaagag 2100

tttccaaccc atctggtaac ttcgacagtc caaatcacga cggtttggga gaaccaaagt 2160

ttaatgttga tgatacagct tatactgcat cttggggtag accacaaaat gatggcccag 2220

cgttgagagc atacgcaatt tcaagatacc ttaacgcagt agcaaaacac aacaacggta 2280

agttactgct cgctggacaa aacggtattc cttactcttc agcttctgat atctactgga 2340

agattatcaa gccagatctt caacatgtgt caacccattg gtctacatct ggttttgatt 2400

tgtgggaaga gaatcaggga acacatttct ttactgcgtt ggtccagcta aaagcactta 2460

gttacggcat tcctttaagt aagacctaca acgatcctgg tttcactagt tggctagaaa 2520

agcaaaagga tgctttaaac tcttatatca acagctctgg tttcgtaaac tctggcaaaa 2580

agcatatagt ggagagccct caactatctt caagaggagg gttggatagc gccacataca 2640

ttgcagcctt aatcacacat gatattggcg acgacgacac ttacacacct ttcaacgttg 2700

acaactccta tgtcttgaac tcactgtatt accttctagt cgataacaaa aaccgttaca 2760

aaatcaatgg taactacaag gccggtgctg ctgttggtag atacccagag gatgtttaca 2820

acggtgttgg gacatcagaa ggcaatccat ggcaattagc tacagcctac gccggccaaa 2880

cattttacac actggcttac aactcattga aaaacaaaaa aaacttagtg attgaaaagt 2940

tgaactacga cctctacaat tctttcatag cagatttatc caagatcgat agttcttacg 3000

catcaaaaga ctccttgact ttgacctacg gttctgacaa ctacaaaaac gtcataaagt 3060

cactattaca gtttggagat tcattcctga aggtcttgct cgatcacatt gatgataatg 3120

gacaattaac agaagagatc aatagataca cagggttcca ggctggtgct gttagtttga 3180

catggtcctc tggttcatta ctttcagcaa accgtgcgag aaataagttg attgaactat 3240

tgtagttaat taaacaggcc ccttttcctt tgtcgatatc atgtaattag ttatgtcacg 3300

cttacattca cgccctcctc ccacatccgc tctaaccgaa aaggaaggag ttagacaacc 3360

tgaagtctag gtccctattt atttttttat agttatgtta gtattaagaa cgttatttat 3420

atttcaaatt tttctttttt ttctgtacaa acgcgtgtac gcatgtaacg ggcagacggc 3480

cggccataac ttcgtataat gtatgctata cgaagttatg gcaacggttc atcatctcat 3540

ggatctgcac atgaacaaac accagagtca aacgacgttg aaattgaggc tactgcgcca 3600

attgatgaca atacagacga tgataacaaa ccgaagttat ctgatgtaga aaaggattag 3660

agatgctaag agatagtgat gatatttcat aaataatgta attctatata tgttaattac 3720

cttttttgcg aggcatattt atggtgaagg ataagttttg accatcaaag aaggttaatg 3780

tggctgtggt ttcagggtcc ataaagcttt tcaattcatc tttttttttt ttgttctttt 3840

ttttgattcc ggtttctttg aaattttttt gattcggtaa tctccgagca gaaggaagaa 3900

cgaaggaagg agcacagact tagattggta tatatacgca tatgtggtgt tgaagaaaca 3960

tgaaattgcc cagtattctt aacccaactg cacagaacaa aaacctgcag gaaacgaaga 4020

taaatcatgt cgaaagctac atataaggaa cgtgctgcta ctcatcctag tcctgttgct 4080

gccaagctat ttaatatcat gcacgaaaag caaacaaact tgtgtgcttc attggatgtt 4140

cgtaccacca aggaattact ggagttagtt gaagcattag gtcccaaaat ttgtttacta 4200

aaaacacatg tggatatctt gactgatttt tccatggagg gcacagttaa gccgctaaag 4260

gcattatccg ccaagtacaa ttttttactc ttcgaagaca gaaaatttgc tgacattggt 4320

aatacagtca aattgcagta ctctgcgggt gtatacagaa tagcagaatg ggcagacatt 4380

acgaatgcac acggtgtggt gggcccaggt attgttagcg gtttgaagca ggcggcggaa 4440

gaagtaacaa aggaacctag aggccttttg atgttagcag aattgtcatg caagggctcc 4500

ctagctactg gagaatatac taagggtact gttgacattg cgaagagcga caaagatttt 4560

gttatcggct ttattgctca aagagacatg ggtggaagag atgaaggtta cgattggttg 4620

attatgacac gc 4632

<210> 6

<211> 4363

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 6

ggccgctcca tggagggcac agttaagccg ctaaaggcat tatccgccaa gtacaatttt 60

ttactcttcg aagacagaaa atttgctgac attggtaata cagtcaaatt gcagtactct 120

gcgggtgtat acagaatagc agaatgggca gacattacga atgcacacgg tgtggtgggc 180

ccaggtattg ttagcggttt gaagcaggcg gcggaagaag taacaaagga acctagaggc 240

cttttgatgt tagcagaatt gtcatgcaag ggctccctag ctactggaga atatactaag 300

ggtactgttg acattgcgaa gagcgacaaa gattttgtta tcggctttat tgctcaaaga 360

gacatgggtg gaagagatga aggttacgat tggttgatta tgacacccgg tgtgggttta 420

gatgacaagg gagacgcatt gggtcaacag tatagaaccg tggatgatgt ggtctctaca 480

ggatctgaca ttattattgt tggaagagga ctatttgcaa agggaaggga tgctaaggta 540

gagggtgaac gttacagaaa agcaggctgg gaagcatatt tgagaagatg cggccagcaa 600

aactaaaaaa ctgtattata agtaaatgca tgtatactaa actcacaaat tagagcttca 660

atttaattat atcagttatt acccgggaat ctcggtcgta atgattttta taatgacgaa 720

aaaaaaaaaa ttggaaagaa aaagcttcat ggcctttata aaaaggaacc atccaatacc 780

tcgccagaac caagtaacag tattttacgg ggcacaaatc aagaacaata agacaggact 840

gtaaagatgg acgcattgaa ctccaaagaa caacaagagt tccaaaaagt agtggaacaa 900

aagcaaatga aggatttcat gcgtttgata acttcgtata atgtatgcta tacgaagtta 960

tctcgagggc cagaaaaagg aagtgtttcc ctccttcttg aattgatgtt accctcataa 1020

agcacgtggc ctcttatcga gaaagaaatt accgtcgctc gtgatttgtt tgcaaaaaga 1080

acaaaactga aaaaacccag acacgctcga cttcctgtct tcctgttgat tgcagcttcc 1140

aatttcgtca cacaacaagg tcctagcgac ggctcacagg ttttgtaaca agcaatcgaa 1200

ggttctggaa tggcgggaaa gggtttagta ccacatgcta tgatgcccac tgtgatctcc 1260

agagcaaagt tcgttcgatc gtactgttac tctctctctt tcaaacagaa ttgtccgaat 1320

cgtgtgacaa caacagcctg ttctcacaca ctcttttctt ctaaccaagg gggtggttta 1380

gtttagtaga acctcgtgaa acttacattt acatatatat aaacttgcat aaattggtca 1440

atgcaagaaa tacatatttg gtcttttcta attcgtagtt tttcaagttc ttagatgctt 1500

tctttttctc ttttttacag atcatcaagg aagtaattat ctacttttta caagtctaga 1560

atgatcagac ttacagtttt cctaacagcc gttttcgccg ccgttgcatc atgtgtccca 1620

gtagaattgg ataagagaaa caccggccat ttccaagcat attcaggata caccgttgca 1680

cgttctaatt tcacacaatg gattcatgag cagcctgctg tgtcctggta ctacttatta 1740

caaaacattg attatcctga gggacaattc aagtcagcga aaccaggcgt tgtggttgct 1800

tctccatcca cttcagaacc agactacttc taccagtgga cccgtgacac agcaataact 1860

ttcttatctt tgatagcaga agtagaagat cactcatttt caaatacaac tctagctaag 1920

gttgtcgaat actacatctc taacacatac accctacaaa gagtttctaa cccatctggt 1980

aatttcgata gcccaaatca cgatggtctg ggtgaaccaa agttcaacgt tgacgacact 2040

gcttacactg catcatgggg cagacctcaa aacgacggtc cagccttaag agcttacgcg 2100

atctcaagat atttgaacgc agttgccaag cataacaacg gtaagctatt gctcgcgggt 2160

caaaatggta ttccttactc atctgcatca gatatctact ggaagattat caagccagat 2220

ttacaacatg taagtactca ctggagtaca tctggttttg acttatggga agagaatcaa 2280

ggtacacatt tctttactgc acttgtccag ttaaaagctc tttcatacgg tatacctttg 2340

tctaagacat ataacgatcc aggatttact tcttggttgg aaaagcagaa ggatgccttg 2400

aactcttaca tcaattccag cggcttcgtc aactccggga aaaagcacat tgtcgaatct 2460

cctcaattat ctagtagagg gggtcttgat agcgctactt acatcgctgc tctaattaca 2520

catgatattg gtgatgatga tacatacact ccttttaacg tagataattc ttatgtgctg 2580

aactctttat actatctgct tgtagacaac aaaaacagat acaagatcaa cgggaactac 2640

aaagcaggag ctgcagttgg tagataccca gaagatgtgt acaatggagt gggaacctca 2700

gagggaaacc catggcaatt ggcgacagca tacgccggcc aaacctttta cacactggct 2760

tacaattctc tcaaaaacaa aaaaaatttg gttattgaga agttgaatta cgatctatac 2820

aactccttta tagctgactt aagtaagatt gactcctctt acgcttctaa ggattcattg 2880

acattgacct acggctcaga taactacaaa aatgtcatta agtcactttt acaattcggg 2940

gattctttct tgaaagtctt gttggaccat attgatgata atggtcagct aacagaggaa 3000

atcaacagat atacaggttt tcaagctggc gcagtttccc tcacttggag tagtggttca 3060

ctcttatctg caaacagagc cagaaacaag ttgatcgaat tgctttagtt aattaagaag 3120

ttttgttaga aaataaatca ttttttaatt gagcattctt attcctattt tatttaaata 3180

gttttatgta ttgttagcta catacaacag tttaaatcaa attttctttt tcccaagtcc 3240

aaaatggagg tttattttga tgacccgcat gcgattatgt tttgaaagta taagactaca 3300

tacatgtaca tatatttaaa catgtaaacc cgtccattat attgccgggc agacggccgg 3360

ccttatagcc tagctttaag gctactttaa aaacttttta tttattcata cacatatatt 3420

atcgaacatt cgtataactt aatatcattc aaaaaaaaaa aaaaaaaaaa aagaaaacat 3480

atacacatat atatttatgt ttatagagag agagagagaa aatttgaatt tttgaatcat 3540

ttgcaaagtt atatgtttta tacattattt attcattttt tttggtgtcg aggacattgt 3600

gctgttcaga gaaccactta aaatacgcat cgttctgtaa atatccactt tcattaaaaa 3660

ccttattcac ttctaacttt gccttcaact ccttcttgga gttttctccc ttttttttct 3720

gaacaagctc aaccagatat aatggttcgt tcttttcgaa ctttgtcttt acatatattt 3780

cctcctttgt acctcttctc tttcccacat aaacagtccc cttttcaata aaacgagaga 3840

aataccagaa aagtagcgag agaacaaaat atgcgcctac caaaagcttt tgatacgtaa 3900

caatctgatc tctctcaaat tttttatcca agaagaaact caaaccagct acaacagcta 3960

tggaataacc tatgtacaat ttagcatcga gtaaagcgta tgatctctcg taatttaatc 4020

tcgcgaaaac agaaggtagg gcttcatcta aagcttggtt caactccggg attgaatata 4080

cattaatagg tttagcagaa ctcatcttga acaggcgtct cttttcctta caataacttg 4140

tgcttttcct tctataattc cgtttcaacg tgtacaattg tcattttttg tctggtatga 4200

ttttgcagaa ctgaaaaaat ctcttaaatg ttccgcctca tcaagaaggc atattccttt 4260

acaaaagtac attgatctta caagaagcta gctaatggta ctatttaaaa aacaactaca 4320

ctccatcaat acataaaatt gttatgatag acttgaggga cgg 4363

<210> 7

<211> 5015

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 7

cagagcctct tatattcact ctgttcctcc atcgcctatt gagaaacgtt ggaataaaac 60

tctaaaaata tcatctagtt ggttagtttt tattttacca gtacattgtc acttgcggag 120

ggaggatgac ataaagattg agacgcagtc atttaatgaa gtttaaacgc aggtatttga 180

taaagtaata cgatattgaa tcatgacgta taaagtgaaa tgaacaaatg attacgtaaa 240

aaatgtcgat tttctcttga gagactccca tagcctctaa gaggccttct actacgttcc 300

atatatctaa gaatggggcc atatccagtg gaatcccagc aattatttaa ggatcaccta 360

tttctcagcc gatattttag caaaatcact accaatatca gggggcaata gttgatcgcc 420

tactttaaca aaaaatgttg ctcacgtatt aacacaggca acaaaaagga tattacgcaa 480

gaacgtagta tccacatgcc atcctccttg ttgcatcttt ttttttccga aatgattccc 540

tttcctgcac aacacgagat ctttcacgca tacatcggaa ggatcacccc ccactcaagt 600

cgttgcattg ctaacatgtg gcattctgcc catttttttc acgaaaattc tctctctata 660

atgaagaccc ttgtgccctg gactctgtaa tacttgaaac tacttcctca ataatcgctt 720

ggagacctac ccccacgctt ttcaaacaag gcgctagcaa aaagcctgcc gatatctcct 780

tgccccctcc ttctgttcga gagaactacg acccgaccaa taataatgtc atacaagaac 840

cgccaagaac caactgctga accttagatc tccaatactt cagttggagt atgtgaatat 900

ataagtacct ggtcgactaa tcttcttgca tcttttcgta ttcttacatc ctatgtcgct 960

aatacagttc ccgcatagag aagaaagcaa acaaaagtag tcactcgaga tctcccgagt 1020

ttatcattat caatactgcc atttcaaaga atacgtaaat aattaatagt agtgattttc 1080

ctaactttat ttagtcaaaa aattggcctt ttaattctgc tgtaacccgt acatgcccaa 1140

aatagggggc gggttacaca gaatatataa catcataggt gtctgggtga acagtttatt 1200

cctggcatcc actaaatata atggagcccg ctttttttaa gctggcatcc agaaaaaaaa 1260

agaatcccag caccaaaata ttgttttctt caccaaccat cagttcatag gtccattctc 1320

ttagcgcaac tacacagaac aggggcacaa acaggcaaaa aacgggcaca acctcaatgg 1380

agtgatgcaa cctgcttgga gtaaatgatg acacaaggca attgacctac gcatgtatct 1440

atctcatttt cttacacctt ctattacctt ctgctctctc tgatttggaa aaagctgaaa 1500

aaaaaggttg aaaccagttc cctgaaatta ttcccctatt tgactaataa gtatataaag 1560

acggtaggta ttgattgtaa ttctgtaaat ctatttctta aacttcttaa attctacttt 1620

tatagttagt ctttttttta gtttaaaaca ccaagaactt agtttcgaat aaacacacat 1680

aaacaaacaa atctagaatg atcagactta ctgttttcct cacagccgtt tttgcagcag 1740

tagcttcttg tgttccagtt gaattggata agagaaatac aggtcatttc caagcttact 1800

ctggttacac tgtggctaga tctaacttca cacaatggat tcatgaacag cctgccgtga 1860

gttggtacta tttgctacaa aacattgatt accctgaggg tcaattcaaa tcagctaagc 1920

caggtgttgt tgtcgcgagc ccatcaactt ctgaaccaga ttacttctac caatggacta 1980

gagataccgc aataaccttc ttatctctaa tcgcagaggt agaagatcac tctttttcaa 2040

atactaccct ggcaaaagtg gtcgagtact acatctcaaa cacatacacc ttgcagagag 2100

tctcaaaccc atcaggaaac ttcgattctc ctaatcatga cggcttagga gaaccaaagt 2160

ttaatgttga cgataccgct tatactgcat cttggggtag accacagaat gatggccctg 2220

ccttacgtgc atacgccatt tccagatatc tcaacgctgt agcgaagcac aacaacggta 2280

agctgctttt agctggtcaa aatgggatac catactcttc cgcttcagac atttactgga 2340

agattatcaa accagacttg cagcatgtca gtacacattg gtcaacttct ggttttgatt 2400

tgtgggaaga gaaccaaggc actcacttct ttacagcctt ggttcaacta aaggcattgt 2460

cttacggaat ccctttgtcc aagacataca atgatcctgg attcactagt tggctagaaa 2520

agcaaaagga tgcactgaac tcatacatta acagttcagg ctttgtgaac tccggtaaaa 2580

agcatattgt tgaaagccca caactatcta gcagaggtgg tttagattct gcaacctaca 2640

tagcagcctt gatcacacac gacattgggg atgacgatac atacacacca ttcaacgtcg 2700

acaattcata cgttttgaat agcttatact acctactggt agataacaaa aacagatata 2760

agatcaatgg caactacaag gccggtgctg ccgtaggaag ataccctgaa gatgtctaca 2820

acggagttgg tacatcagaa ggtaacccat ggcaattagc aacagcatat gcgggccaga 2880

cattttacac tttggcttac aattcattga aaaacaaaaa aaatttagtg atagaaaagc 2940

ttaactatga cctttacaac tctttcattg ccgatttatc caagattgat tcctcctacg 3000

catcaaagga ctccttgaca cttacatacg gttctgacaa ctacaaaaat gttatcaagt 3060

ctctcttgca atttggtgat tctttcttga aggttttact cgatcatatc gatgataatg 3120

gtcaactaac tgaggaaatc aacagataca ctgggttcca agctggagct gtctctttaa 3180

catggagttc agggagtttg ttatctgcta acagagcgcg taacaaactt attgagcttc 3240

tgtagttaat taaacaggcc ccttttcctt tgtcgatatc atgtaattag ttatgtcacg 3300

cttacattca cgccctcctc ccacatccgc tctaaccgaa aaggaaggag ttagacaacc 3360

tgaagtctag gtccctattt atttttttat agttatgtta gtattaagaa cgttatttat 3420

atttcaaatt tttctttttt ttctgtacaa acgcgtgtac gcatgtaacg ggcagacggc 3480

cggccataac ttcgtataat gtatgctata cgaagttatc cttacatcac acccaatccc 3540

ccacaagtga tcccccacac accatagctt caaaatgttt ctactccttt tttactcttc 3600

cagattttct cggactccgc gcatcgccgt accacttcaa aacacccaag cacagcatac 3660

taaatttccc ctctttcttc ctctagggtg gcgttaatta cccgtactaa aggtttggaa 3720

aagaaaaaag agaccgcctc gtttcttttt cttcgtcgaa aaaggcaata aaaattttta 3780

tcacgtttct ttttcttgaa aaattttttt tttgattttt ttctctttcg atgacctccc 3840

attgatattt aagttaataa atggtcttca atttctcaag tttcagtttc gtttttcttg 3900

ttctattaca acttttttta cttcttgctc attagaaaga aagcatagca atctaatcta 3960

agttttaatt acaaaatgcc acaatcctgg gaagaattgg ccgccgacaa acgtgcccgt 4020

ttggctaaaa ccattcctga cgaatggaag gttcaaactt tgcctgccga agattccgtt 4080

attgatttcc caaagaagtc cggtattttg tctgaggctg aattgaagat taccgaagcc 4140

tctgctgctg atttggtctc caagttggcc gctggtgagt tgacttctgt tgaagtcact 4200

ttggcttttt gtaagagagc tgctattgct caacaattaa ccaactgtgc tcacgaattc 4260

ttcccagatg ctgctttagc tcaagctaga gaattagatg aatactacgc taagcataag 4320

agaccagttg gtccattaca cggtttacca atctctttaa aggaccaatt gcgtgttaag 4380

ggttacgaaa cctccatggg ttacatttcc tggttaaaca aatacgatga aggtgattcc 4440

gtcttaacca ccatgttgag aaaagctggt gctgttttct acgttaagac ctctgtccca 4500

caaaccttga tggtctgtga aaccgtcaac aacatcattg gtagaactgt caatccaaga 4560

aacaaaaatt ggtcctgtgg tggttcttct ggtggtgaag gtgctattgt tggtattaga 4620

ggtggtgtta ttggtgtcgg tactgacatt ggtggttcca ttagagtccc agctgctttc 4680

aactttttat acggtttgag accatctcac ggtagattgc catatgctaa aatggctaac 4740

tctatggaag gtcaagaaac cgttcactcc gtcgttggtc ctatcactca ctccgtcgaa 4800

gacttgagat tgttcaccaa atctgtcttg ggtcaagaac cttggaagta cgactctaag 4860

gtcatcccca tgccatggag acaatctgaa tctgacatca ttgcctctaa gattaagaat 4920

ggtggtttga acattggtta ttacaatttc gacggtaacg tcttgccaca cccaccaatt 4980

ttacgtggtg tcgaaactac cgttgccgct ttggc 5015

<210> 8

<211> 4771

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 8

ggccgcgaag gtgctattgt tggtattaga ggtggtgtta ttggtgtcgg tactgacatt 60

ggtggttcca ttagagtccc agctgctttc aactttttat acggtttgag accatctcac 120

ggtagattgc catatgctaa aatggctaac tctatggaag gtcaagaaac cgttcactcc 180

gtcgttggtc ctatcactca ctccgtcgaa gacttgagat tgttcaccaa atctgtcttg 240

ggtcaagaac cttggaagta cgactctaag gtcatcccaa tgccatggag acaatctgaa 300

tctgacatca ttgcctctaa gattaagaat ggtggtttga acattggtta ttacaatttc 360

gacggtaacg tcttgccaca cccaccaatt ttacgtggtg tcgaaactac cgttgccgct 420

ttggccaagg ctggtcacac cgttactcca tggactccat acaagcatga tttcggtcat 480

gacttgattt cccacatcta tgctgctgat ggttctgccg acgtcatgag agacatttct 540

gcctctggtg agccagccat ccctaacatt aaggacttgt tgaacccaaa tattaaggct 600

gttaacatga acgaattgtg ggacactcat ttacaaaagt ggaactatca aatggaatac 660

ttggaaaagt ggcgtgaagc tgaagaaaaa gctggtaagg aattggacgc tattatcgct 720

ccaattactc ctaccgccgc tgtcagacac gatcaattca gatactacgg ttacgcctcc 780

gttattaact tattggattt cacctctgtt gtcgtcccag tcactttcgc tgataagaat 840

attgataaga agaacgaatc ttttaaagct gtttccgaat tggatgcttt ggttcaagaa 900

gaatacgacc cagaggctta tcacggtgct cctgttgctg ttcaagttat tggtagaaga 960

ttgtccgaag agagaacttt ggctatcgcc gaagaagtcg gtaaattgtt gggtaacgtc 1020

gtcactccat aagcgaattt cttatgattt atgattttta ttattaaata agttataaaa 1080

aaaataagtg tatacaaatt ttaaagtgac tcttaggttt taaaacgaaa attcttattc 1140

ttgagtaact ctttcctgta ggtcaggttg ctttctcagg tatagcatga ggtcgctctt 1200

attgaccaca cctctaccgg catgccgagc aaatgcctgc aaatcgctcc ccatttcacc 1260

caattgtaga tatgctaact ccagcaatga gttgatgaat ctcggtgtgt attttatgtc 1320

ctcagaggac aacacataac ttcgtataat gtatgctata cgaagttatc tcgagggcca 1380

gaaaaaggaa gtgtttccct ccttcttgaa ttgatgttac cctcataaag cacgtggcct 1440

cttatcgaga aagaaattac cgtcgctcgt gatttgtttg caaaaagaac aaaactgaaa 1500

aaacccagac acgctcgact tcctgtcttc ctgttgattg cagcttccaa tttcgtcaca 1560

caacaaggtc ctagcgacgg ctcacaggtt ttgtaacaag caatcgaagg ttctggaatg 1620

gcgggaaagg gtttagtacc acatgctatg atgcccactg tgatctccag agcaaagttc 1680

gttcgatcgt actgttactc tctctctttc aaacagaatt gtccgaatcg tgtgacaaca 1740

acagcctgtt ctcacacact cttttcttct aaccaagggg gtggtttagt ttagtagaac 1800

ctcgtgaaac ttacatttac atatatataa acttgcataa attggtcaat gcaagaaata 1860

catatttggt cttttctaat tcgtagtttt tcaagttctt agatgctttc tttttctctt 1920

ttttacagat catcaaggaa gtaattatct actttttaca agtctagaat gattagatta 1980

acagtatttc ttacagccgt tttcgcagcc gtcgcatcct gtgttccagt agaattagat 2040

aagcgtaata caggacattt tcaagcttac tctggctata cagttgcgag atctaacttt 2100

acacaatgga ttcacgaaca gccagcagtt tcttggtact atttgctcca aaacatcgac 2160

taccctgaag gccaattcaa gtctgcaaag ccaggagtgg tcgtcgcttc tcctagtact 2220

tcagaaccag attacttcta ccagtggaca agagacactg ctattacctt cctgagctta 2280

atcgctgaag ttgaagatca ctctttttct aatacaacac tggccaaagt agttgagtac 2340

tacatctcta acacttacac tctacaaaga gtgtcaaacc cttctgggaa cttcgacagc 2400

ccaaaccatg atggtttggg ggagccaaaa ttcaacgttg atgatacagc ctacaccgca 2460

tcttggggta gaccacaaaa cgacggacca gctttaagag catacgcaat atctcgttac 2520

cttaatgctg ttgcaaagca caataatgga aagttgttgt tggctggtca aaacggtatt 2580

ccttactctt cagcatctga tatctactgg aagattatca agccagatct tcaacacgta 2640

tccacacatt ggtcaacctc cggcttcgat ttatgggagg aaaatcaggg tacacatttc 2700

ttcaccgctc tagtgcaatt gaaggctttg agttacggca ttccattgtc taagacttac 2760

aacgatcctg gtttcacctc atggcttgaa aagcagaagg atgccctgaa tagctacatc 2820

aactcatctg gttttgttaa ctcagggaaa aagcatatag ttgaatcccc acaactatca 2880

tcaagaggag gtttagactc cgccacatac attgctgcct tgattacaca tgatattggg 2940

gatgatgaca catatactcc atttaacgtc gataacagtt atgtccttaa ttccttatac 3000

tatttgttgg tcgataacaa aaatagatac aaaatcaacg gcaactacaa ggctggcgca 3060

gcggtgggta gataccctga ggatgtttac aatggtgtag gtacatctga aggcaatcca 3120

tggcaattag cgactgctta cgctggacaa actttctaca cacttgcgta caactcattg 3180

aaaaacaaaa aaaacctagt cattgaaaag ttgaattacg atctgtacaa ctctttcatc 3240

gcagacctat caaagattga ctcatcttat gcaagtaaag attcactaac tttaacctac 3300

ggtagtgata actacaaaaa cgttatcaag tctttactcc agtttggtga ttcattcttg 3360

aaggtgttgt tagatcatat agacgacaat ggtcaactca cagaggagat aaacagatac 3420

actggttttc aagcaggagc tgtttcactt acttggtcaa gtggttcttt gctttccgcc 3480

aacagagcca gaaacaagct catcgaatta ctatagttaa ttaagaagtt ttgttagaaa 3540

ataaatcatt ttttaattga gcattcttat tcctatttta tttaaatagt tttatgtatt 3600

gttagctaca tacaacagtt taaatcaaat tttctttttc ccaagtccaa aatggaggtt 3660

tattttgatg acccgcatgc gattatgttt tgaaagtata agactacata catgtacata 3720

tatttaaaca tgtaaacccg tccattatat tgccgggcag acggccggcc ttatagccta 3780

gctttaaggc tactttaaaa actttttatt tattcataca catatattat cgaacattcg 3840

tataacttaa tatcattcaa aaaaaaaaaa aaaaaaaaaa gaaaacatat acacatatat 3900

atttatgttt atagagagag agagagaaaa tttgaatttt tgaatcattt gcaaagttat 3960

atgttttata cattatttat tcattttttt tggtgtcgag gacattgtgc tgttcagaga 4020

accacttaaa atacgcatcg ttctgtaaat atccactttc attaaaaacc ttattcactt 4080

ctaactttgc cttcaactcc ttcttggagt tttctccctt ttttttctga acaagctcaa 4140

ccagatataa tggttcgttc ttttcgaact ttgtctttac atatatttcc tcctttgtac 4200

ctcttctctt tcccacataa acagtcccct tttcaataaa acgagagaaa taccagaaaa 4260

gtagcgagag aacaaaatat gcgcctacca aaagcttttg atacgtaaca atctgatctc 4320

tctcaaattt tttatccaag aagaaactca aaccagctac aacagctatg gaataaccta 4380

tgtacaattt agcatcgagt aaagcgtatg atctctcgta atttaatctc gcgaaaacag 4440

aaggtagggc ttcatctaaa gcttggttca actccgggat tgaatataca ttaataggtt 4500

tagcagaact catcttgaac aggcgtctct tttccttaca ataacttgtg cttttccttc 4560

tataattccg tttcaacgtg tacaattgtc attttttgtc tggtatgatt ttgcagaact 4620

gaaaaaatct cttaaatgtt ccgcctcatc aagaaggcat attcctttac aaaagtacat 4680

tgatcttaca agaagctagc taatggtact atttaaaaaa caactacact ccatcaatac 4740

ataaaattgt tatgatagac ttgagggacg g 4771

<210> 9

<211> 8719

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 9

atcacatagg aagcaacagg cgcgttggac ttttaatttt cgaggaccgc gaatccttac 60

atcacaccca atcccccaca agtgatcccc cacacaccat agcttcaaaa tgtttctact 120

ccttttttac tcttccagat tttctcggac tccgcgcatc gccgtaccac ttcaaaacac 180

ccaagcacag catactaaat ttcccctctt tcttcctcta gggtgtcgtt aattacccgt 240

actaaaggtt tggaaaagaa aaaagagacc gcctcgtttc tttttcttcg tcgaaaaagg 300

caataaaaat ttttatcacg tttctttttc ttgaaaattt ttttttttga tttttttctc 360

tttcgatgac ctcccattga tatttaagtt aataaacggt cttcaatttc tcaagtttca 420

gtttcatttt tcttgttcta ttacaacttt ttttacttct tgctcattag aaagaaagca 480

tagcaatcta atctaagttt taattacaaa tctagaatga gtgaatctcc aatgttcgct 540

gccaacggca tgccaaaggt aaatcaaggt gctgaagaag atgtcagaat tttaggttac 600

gacccattag cttctccagc tctccttcaa gtgcaaatcc cagccacacc aacttctttg 660

gaaactgcca agagaggtag aagagaagct atagatatta ttaccggtaa agacgacaga 720

gttcttgtca ttgtcggtcc ttgttccatc catgatcttg aagccgctca agaatacgct 780

ttgagattaa agaaattgtc agatgaatta aaaggtgatt tatccatcat tatgagagca 840

tacttggaga agccaagaac aaccgtcggc tggaaaggtc taattaatga ccctgatgtt 900

aacaacactt tcaacatcaa caagggtttg caatccgcta gacaattgtt tgtcaacttg 960

acaaatatcg gtttgccaat tggttctgaa atgcttgata ccatttctcc taaatacttg 1020

gctgatttgg tctccttcgg tgccattggt gccagaacca ccgaatctca actgcacaga 1080

gaattggcct ccggtttgtc tttcccagtt ggtttcaaga acggtaccga tggtacctta 1140

aatgttgctg tggatgcttg tcaagccgct gctcattctc accatttcat gggtgttact 1200

aagcatggtg ttgctgctat caccactact aagggtaacg aacactgctt cgttattcta 1260

agaggtggta aaaagggtac caactacgac gctaagtccg ttgcagaagc taaggctcaa 1320

ttgcctgccg gttccaacgg tctaatgatt gactactctc acggtaactc caataaggat 1380

ttcagaaacc aaccaaaggt caatgacgtt gtttgtgagc aaatcgctaa cggtgaaaac 1440

gccattaccg gtgtcatgat tgaatcaaac atcaacgaag gtaaccaagg catcccagcc 1500

gaaggtaaag ccggcttgaa atatggtgtt tccatcactg atgcttgtat aggttgggaa 1560

actactgaag acgtcttgag gaaattggct gctgctgtca gacaaagaag agaagttaac 1620

aagaaataga tgttttttta atgatatatg taacgtacat tctttcctct accactgcca 1680

attcggtatt atttaattgt gtttagcgct atttactaat taactagaaa ctcaattttt 1740

aaaggcaaag ctcgctgacc tttcactgat ttcgtggatg ttatactatc agttactctt 1800

ctgcaaaaaa aaattgagtc atatcgtagc tttgggatta tttttctctc tctccacggc 1860

taattaggtg atcatgaaaa aatgaaaaat tcatgagaaa agagtcagac atcgaaacat 1920

acataagttg atattccttt gatatcgacg actactcaat caggttttaa aagaaaagag 1980

gcagctattg aagtagcagt atccagttta ggttttttaa ttatttacaa gtaaagaaaa 2040

agagaatgcc ggtcgttcac ggcggccgcg ccagaaaaag gaagtgtttc cctccttctt 2100

gaattgatgt taccctcata aagcacgtgg cctcttatcg agaaagaaat taccgtcgct 2160

cgtgatttgt ttgcaaaaag aacaaaactg aaaaaaccca gacacgctcg acttcctgtc 2220

ttcctattga ttgcagcttc caatttcgtc acacaacaag gtcctagcga cggctcacag 2280

gttttgtaac aagcaatcga aggttctgga atggcgggaa agggtttagt accacatgct 2340

atgatgccca ctgtgatctc cagagcaaag ttcgttcgat cgtactgtta ctctctctct 2400

ttcaaacaga attgtccgaa tcgtgtgaca acaacagcct gttctcacac actcttttct 2460

tctaaccaag ggggtggttt agtttagtag aacctcgtga aacttacatt tacatatata 2520

taaacttgca taaattggtc aatgcaagaa atacatattt ggtcttttct aattcgtagt 2580

ttttcaagtt cttagatgct ttctttttct cttttttaca gatcatcaac tcttttttac 2640

agatcatcaa ggaagtaatt atctactttt tacaagaatt catgtctaat ttacttactg 2700

ttcaccaaaa cttgcctgca ttaccagttg acgcaacctc cgatgaagtc agaaagaacc 2760

ttatggatat gtttagagat agacaagctt tctccgaaca tacttggaaa atgttattat 2820

ccgtttgtag atcctgggcc gcttggtgta aacttaacaa tagaaaatgg tttcctgctg 2880

aaccagaaga cgtcagagat tacttacttt acttacaagc tagaggtttg gctgttaaaa 2940

ctatccaaca acacttaggt caattgaata tgttacacag aagatccggt ttaccaagac 3000

catccgattc caacgcagtt tcccttgtta tgagaagaat tagaaaagaa aatgttgacg 3060

ctggtgaaag agctaaacaa gcattagcat ttgaaagaac cgatttcgat caagttagat 3120

ccttaatgga aaattccgat agatgtcaag atattagaaa cttagctttc ttaggtattg 3180

cttacaacac attattaaga atcgctgaaa ttgctagaat tagagttaaa gatatttcaa 3240

gaaccgatgg cggtagaatg ttaatccaca ttggcagaac aaaaacctta gtctccacag 3300

caggcgtcga aaaagcatta tcattaggtg ttactaaatt agttgaacgt tggatttccg 3360

tttccggtgt tgcagatgac ccaaacaact acttattctg tcgtgttaga aaaaatggtg 3420

ttgccgctcc ttccgctacc tcacaattat ccacaagagc attagaaggc atttttgaag 3480

ctacccacag acttatttat ggtgcaaaag acgattccgg tcaaagatat ttagcttggt 3540

ctggtcattc cgctagagtt ggtgccgcaa gagacatggc aagagctggt gtttctattc 3600

ctgaaattat gcaagccggt ggttggacta atgttaacat tgttatgaac tatatcagaa 3660

acttagattc cgaaacaggt gctatggtta gattacttga agacggtgat taagctagct 3720

aagatccgct ctaaccgaaa aggaaggagt tagacaacct gaagtctagg tccctattta 3780

tttttttata gttatgttag tattaagaac gttatttata tttcaaattt ttcttttttt 3840

tctgtacaga cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt 3900

gggacgctcg aaggagctcc aattcgccct atagtgagtc gtattacaat tcactggccg 3960

tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag 4020

cacatccccc cttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc 4080

aacagttgcg cagcctgaat ggcgaatggc gcgacgcgcc ctgtagcggc gcattaagcg 4140

cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 4200

ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 4260

taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 4320

aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 4380

ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 4440

tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt 4500

ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 4560

ttacaatttc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcag 4620

ggtaataact gatataatta aattgaagct ctaatttgtg agtttagtat acatgcattt 4680

acttataata cagtttttta gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct 4740

gcttttctgt aacgttcacc ctctacctta gcatcccttc cctttgcaaa tagtcctctt 4800

ccaacaataa taatgtcaga tcctgtagag accacatcat ccacggttct atactgttga 4860

cccaatgcgt ctcccttgtc atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa 4920

ccttcatctc ttccacccat gtctctttga gcaataaagc cgataacaaa atctttgtcg 4980

ctcttcgcaa tgtcaacagt acccttagta tattctccag tagataggga gcccttgcat 5040

gacaattctg ctaacatcaa aaggcctcta ggttcctttg ttacttcttc tgccgcctgc 5100

ttcaaaccgc taacaatacc tgggcccacc acaccgtgtg cattcgtaat gtctgcccat 5160

tctgctattc tgtatacacc cgcagagtac tgcaatttga ctgtattacc aatgtcagca 5220

aattttctgt cttcgaagag taaaaaattg tacttggcgg ataatgcctt tagcggctta 5280

actgtgccct ccatggaaaa atcagtcaag atatccacat gtgtttttag taaacaaatt 5340

ttgggaccta atgcttcaac taactccagt aattccttgg tggtacgaac atccaatgaa 5400

gcacacaagt ttgtttgctt ttcgtgcatg atattaaata gcttggcagc aacaggacta 5460

ggatgagtag cagcacgttc cttatatgta gctttcgaca tgatttatct tcgtttcctg 5520

caggtttttg ttctgtgcag ttgggttaag aatactgggc aatttcatgt ttcttcaaca 5580

ctacatatgc gtatatatac caatctaagt ctgtgctcct tccttcgttc ttccttctgt 5640

tcggagatta ccgaatcaaa aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa 5700

aaaaatgatg aattgaattg aaaagcgtgg tgcactctca gtacaatctg ctctgatgcc 5760

gcatagttaa gccagccccg acacccgcca acacccgctg acgcgccctg acgggcttgt 5820

ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag 5880

aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat acgcctattt 5940

ttataggtta atgtcatgat aataatggtt tcttaggacg gatcgcttgc ctgtaactta 6000

cacgcgcctc gtatctttta atgatggaat aatttgggaa tttactctgt gtttatttat 6060

ttttatgttt tgtatttgga ttttagaaag taaataaaga aggtagaaga gttacggaat 6120

gaagaaaaaa aaataaacaa aggtttaaaa aatttcaaca aaaagcgtac tttacatata 6180

tatttattag acaagaaaag cagattaaat agatatacat tcgattaacg ataagtaaaa 6240

tgtaaaatca caggattttc gtgtgtggtc ttctacacag acaagatgaa acaattcggc 6300

attaatacct gagagcagga agagcaagat aaaaggtagt atttgttggc gatcccccta 6360

gagtctttta catcttcgga aaacaaaaac tattttttct ttaatttctt tttttacttt 6420

ctatttttaa tttatatatt tatattaaaa aatttaaatt ataattattt ttatagcacg 6480

tgatgaaaag gacccaggtg gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt 6540

atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct gataaatgct 6600

tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg cccttattcc 6660

cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa 6720

agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc tcaacagcgg 6780

taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca cttttaaagt 6840

tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac tcggtcgccg 6900

catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa agcatcttac 6960

ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg ataacactgc 7020

ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt tttttcacaa 7080

catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg aagccatacc 7140

aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc gcaaactatt 7200

aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga tggaggcgga 7260

taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta ttgctgataa 7320

atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc cagatggtaa 7380

gccctcccgt atcgtagtta tctacacgac gggcagtcag gcaactatgg atgaacgaaa 7440

tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt cagaccaagt 7500

ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa ggatctaggt 7560

gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt cgttccactg 7620

agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt 7680

aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca 7740

agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac 7800

tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac 7860

atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct 7920

taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg 7980

gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga gatacctaca 8040

gcgtgagcat tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt 8100

aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggga acgcctggta 8160

tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc 8220

gtcagggggg ccgagcctat ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc 8280

cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt ctgtggataa 8340

ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga ccgagcgcag 8400

cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg 8460

ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag cgggcagtga 8520

gcgcaacgca attaatgtga gttacctcac tcattaggca ccccaggctt tacactttat 8580

gcttccggct cctatgttgt gtggaattgt gagcggataa caatttcaca caggaaacag 8640

ctatgaccat gattacgcca agctcggaat taaccctcac taaagggaac aaaagctggg 8700

taccgggccc cccctcgag 8719

<210> 10

<211> 1632

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 10

ggcaacggtt catcatctca tggatctgca catgaacaaa caccagagtc aaacgacgtt 60

gaaattgagg ctactgcgcc aattgatgac aatacagacg atgataacaa accgaagtta 120

tctgatgtag aaaaggatta gagatgctaa gagatagtga tgatatttca taaataatgt 180

aattctatat atgttaatta ccttttttgc gaggcatatt tatggtgaag gataagtttt 240

gaccatcaaa gaaggttaat gtggctgtgg tttcagggtc cataaagctt ttcaattcat 300

cttttttttt tttgttcttt tttttgattc cggtttcttt gaaatttttt tgattcggta 360

atctccgagc agaaggaaga acgaaggaag gagcacagac ttagattggt atatatacgc 420

atatgtggtg ttgaagaaac atgaaattgc ccagtattct taacccaact gcacagaaca 480

aaaacctgca ggaaacgaag ataaatcatg tcgaaagcta catataagga acgtgctgct 540

actcatccta gtcctgttgc tgccaagcta tttaatatca tgcacgaaaa gcaaacaaac 600

ttgtgtgctt cattggatgt tcgtaccacc aaggaattac tggagttagt tgaagcatta 660

ggtcccaaaa tttgtttact aaaaacacat gtggatatct tgactgattt ttccatggag 720

ggcacagtta agccgctaaa ggcattatcc gccaagtaca attttttact cttcgaagac 780

agaaaatttg ctgacattgg taatacagtc aaattgcagt actctgcggg tgtatacaga 840

atagcagaat gggcagacat tacgaatgca cacggtgtgg tgggcccagg tattgttagc 900

ggtttgaagc aggcggcgga agaagtaaca aaggaaccta gaggcctttt gatgttagca 960

gaattgtcat gcaagggctc cctagctact ggagaatata ctaagggtac tgttgacatt 1020

gcgaagagcg acaaagattt tgttatcggc tttattgctc aaagagacat gggtggaaga 1080

gatgaaggtt acgattggtt gattatgaca cccggtgtgg gtttagatga caagggagac 1140

gcattgggtc aacagtatag aaccgtggat gatgtggtct ctacaggatc tgacattatt 1200

attgttggaa gaggactatt tgcaaaggga agggatgcta aggtagaggg tgaacgttac 1260

agaaaagcag gctgggaagc atatttgaga agatgcggcc agcaaaacta aaaaactgta 1320

ttataagtaa atgcatgtat actaaactca caaattagag cttcaattta attatatcag 1380

ttattacccg ggaatctcgg tcgtaatgat ttttataatg acgaaaaaaa aaaaattgga 1440

aagaaaaagc ttcatggcct ttataaaaag gaaccatcca atacctcgcc agaaccaagt 1500

aacagtattt tacggggcac aaatcaagaa caataagaca ggactgtaaa gatggacgca 1560

ttgaactcca aagaacaaca agagttccaa aaagtagtgg aacaaaagca aatgaaggat 1620

ttcatgcgtt tg 1632

<210> 11

<211> 4863

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 11

ctaaattcgg ccttgctcag agactcctgg attttggcta acaacgcagt cccttcgatg 60

catatagcta ggccacaaat tatgccaata acggtccatg ggttgatgtt ttcttgaatt 120

ctttcgtttt tcatgctatt tgcgtcttcc caagtcccag cgttccagta ttcatactgc 180

gcgttagagt ggtagccata agagccggca tattggtaat tttcagtatt aacgttagaa 240

cgtggtgaat acgatgtggt ccagccttgc ctcgttgtgt catatacgat ctttttcttt 300

gggtcacaaa gaatatcata tgcttgagag atgactttaa atctatgtag tttttcgctt 360

gatgttagca gcagcggtga tttactatca ctgttggtaa ccttttctga gctaaatatt 420

tgaatgttat cggaatggtc agggtggtac aattttacat aacgatgata tttttttttt 480

aacgacttct tgtccagttt aggatttcca gatccggcct ttggaatgcc aaaaatatca 540

tagggagttg gatctgccaa ctcaggccat tgttcatccc ttatcgtaag ttttctattg 600

ccatttttat cgttcgctgt agcatactta gctataaaag tgatttgtgg gggacacttt 660

tctacacatg ataagtgcca cttgaataaa aatgggtata cgaacttatg gtgtagcata 720

acaaatatat tgcaagtagt gacctatggt gtgtagatat acgtacagtt agttacgagc 780

ctaaagacac aacgtgtttg ttaattatac tgtcgctgta atatcttctc ttccattatc 840

accggtcatt ccttgcaggg gcggtagtac ccggagaccc tgaacttttc tttttttttt 900

tgcgaaatta aaaagttcat tttcaattcg acaatgagat ctacaagcca ttgttttatg 960

ttgatgagag ccagcttaaa gagttctcga gatctcccga gtttatcatt atcaatactg 1020

ccatttcaaa gaatacgtaa ataattaata gtagtgattt tcctaacttt atttagtcaa 1080

aaaattggcc ttttaattct gctgtaaccc gtacatgccc aaaatagggg gcgggttaca 1140

cagaatatat aacatcatag gtgtctgggt gaacagttta ttcctggcat ccactaaata 1200

taatggagcc cgcttttttt aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa 1260

tattgttttc ttcaccaacc atcagttcat aggtccattc tcttagcgca actacacaga 1320

acaggggcac aaacaggcaa aaaacgggca caacctcaat ggagtgatgc aacctgcttg 1380

gagtaaatga tgacacaagg caattgacct acgcatgtat ctatctcatt ttcttacacc 1440

ttctattacc ttctgctctc tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt 1500

tccctgaaat tattccccta tttgactaat aagtatataa agacggtagg tattgattgt 1560

aattctgtaa atctatttct taaacttctt aaattctact tttatagtta gtcttttttt 1620

tagtttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac aaatctagaa 1680

tgaagttcat ttccactttc ttgaccttca ttttggctgc tgtctctgtc accgctgcat 1740

ctattccatc tagtgcatct gtacaattgg actcctacaa ttacgatggt tccacatttt 1800

ccggcaagat ttatgtcaaa aacatcgctt actctaaaaa ggttactgtt gtgtacgcag 1860

acggttctga caactggaac aataacggca acactattgc tgcatcattt tcaggcccaa 1920

tctctggatc aaattacgaa tactggacat tctcagcatc agtgaagggc ataaaggagt 1980

tctacatcaa atacgaagtt tcaggtaaga catattacga caataacaac tctgcaaact 2040

accaagtctc aacttctaaa cctactacaa ctactgcagc tacaaccaca actacagctc 2100

catcaacttc tacaacaacc cgtccatcta gttcagagcc tgccaccttc cctactggta 2160

attctaccat cagctcttgg atcaaaaagc aggaagatat ttccagattc gctatgctta 2220

gaaacatcaa cccacctggt tctgccacag ggtttatcgc cgcatcactc tctaccgctg 2280

gtccagatta ctactacgcg tggacaagag atgccgcttt gacatctaac gttatcgttt 2340

acgaatacaa caccacattg tctgggaata agacaattct aaacgtactt aaggattacg 2400

tcacattcag tgttaagaca cagtctactt caacagtttg taattgcctt ggtgaaccaa 2460

agttcaatcc agacggcagt ggttacacag gtgcttgggg tagacctcaa aatgatggtc 2520

ctgcagaaag agcgactaca tttgttctgt ttgccgacag ctacttgact caaactaagg 2580

atgcctcata cgtcactggt acattaaagc cagcaatttt caaagatctc gattacgttg 2640

ttaacgtctg gagtaacgga tgtttcgatt tatgggagga ggtgaacgga gttcatttct 2700

acacccttat ggttatgaga aaagggctat tgttgggggc tgatttcgcg aagagaaacg 2760

gtgactcaac tagagcctca acttactctt ctactgcttc cacaattgct aacaagatat 2820

caagtttctg ggttagctca aacaactggg tgcaagtatc ccaatctgtc acaggaggtg 2880

taagtaaaaa ggggttagac gttagcaccc tgttagctgc gaatctagga tcagtcgatg 2940

atggattttt cactccaggt tctgaaaaga tattagctac agctgtggca gtcgaagatt 3000

cctttgccag tctataccca atcaacaaaa accttccatc atacttgggg aacgctattg 3060

gaagataccc tgaagataca tacaacggta atggtaactc acaaggcaat ccttggtttc 3120

tggcggttac cggctacgca gagttgtact atagagcaat taaggaatgg atttctaatg 3180

gaggcgttac agtgtcctct atctcattgc catttttcaa aaagttcgat agctctgcaa 3240

catccggtaa aaagtacacc gtaggtactt ctgacttcaa caatttagca caaaacattg 3300

ctcttgctgc agatcgtttc ctatctactg tacaactcca tgcaccaaac aatggttcat 3360

tagcagagga atttgataga acaacaggtt tttctaccgg cgctagagat ttaacatggt 3420

cccacgcctc attgataaca gcatcctatg ccaaagccgg tgctccagct gcataattaa 3480

ttaaacaggc cccttttcct ttgtcgatat catgtaatta gttatgtcac gcttacattc 3540

acgccctcct cccacatccg ctctaaccga aaaggaagga gttagacaac ctgaagtcta 3600

ggtccctatt tattttttta tagttatgtt agtattaaga acgttattta tatttcaaat 3660

ttttcttttt tttctgtaca aacgcgtgta cgcatgtaac gggcagacgg ccggccataa 3720

cttcgtataa tgtatgctat acgaagttat ggcaacggtt catcatctca tggatctgca 3780

catgaacaaa caccagagtc aaacgacgtt gaaattgagg ctactgcgcc aattgatgac 3840

aatacagacg atgataacaa accgaagtta tctgatgtag aaaaggatta gagatgctaa 3900

gagatagtga tgatatttca taaataatgt aattctatat atgttaatta ccttttttgc 3960

gaggcatatt tatggtgaag gataagtttt gaccatcaaa gaaggttaat gtggctgtgg 4020

tttcagggtc cataaagctt ttcaattcat cttttttttt tttgttcttt tttttgattc 4080

cggtttcttt gaaatttttt tgattcggta atctccgagc agaaggaaga acgaaggaag 4140

gagcacagac ttagattggt atatatacgc atatgtggtg ttgaagaaac atgaaattgc 4200

ccagtattct taacccaact gcacagaaca aaaacctgca ggaaacgaag ataaatcatg 4260

tcgaaagcta catataagga acgtgctgct actcatccta gtcctgttgc tgccaagcta 4320

tttaatatca tgcacgaaaa gcaaacaaac ttgtgtgctt cattggatgt tcgtaccacc 4380

aaggaattac tggagttagt tgaagcatta ggtcccaaaa tttgtttact aaaaacacat 4440

gtggatatct tgactgattt ttccatggag ggcacagtta agccgctaaa ggcattatcc 4500

gccaagtaca attttttact cttcgaagac agaaaatttg ctgacattgg taatacagtc 4560

aaattgcagt actctgcggg tgtatacaga atagcagaat gggcagacat tacgaatgca 4620

cacggtgtgg tgggcccagg tattgttagc ggtttgaagc aggcggcgga agaagtaaca 4680

aaggaaccta gaggcctttt gatgttagca gaattgtcat gcaagggctc cctagctact 4740

ggagaatata ctaagggtac tgttgacatt gcgaagagcg acaaagattt tgttatcggc 4800

tttattgctc aaagagacat gggtggaaga gatgaaggtt acgattggtt gattatgaca 4860

cgc 4863

<210> 12

<211> 4748

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 12

ggccgctcca tggagggcac agttaagccg ctaaaggcat tatccgccaa gtacaatttt 60

ttactcttcg aagacagaaa atttgctgac attggtaata cagtcaaatt gcagtactct 120

gcgggtgtat acagaatagc agaatgggca gacattacga atgcacacgg tgtggtgggc 180

ccaggtattg ttagcggttt gaagcaggcg gcggaagaag taacaaagga acctagaggc 240

cttttgatgt tagcagaatt gtcatgcaag ggctccctag ctactggaga atatactaag 300

ggtactgttg acattgcgaa gagcgacaaa gattttgtta tcggctttat tgctcaaaga 360

gacatgggtg gaagagatga aggttacgat tggttgatta tgacacccgg tgtgggttta 420

gatgacaagg gagacgcatt gggtcaacag tatagaaccg tggatgatgt ggtctctaca 480

ggatctgaca ttattattgt tggaagagga ctatttgcaa agggaaggga tgctaaggta 540

gagggtgaac gttacagaaa agcaggctgg gaagcatatt tgagaagatg cggccagcaa 600

aactaaaaaa ctgtattata agtaaatgca tgtatactaa actcacaaat tagagcttca 660

atttaattat atcagttatt acccgggaat ctcggtcgta atgattttta taatgacgaa 720

aaaaaaaaaa ttggaaagaa aaagcttcat ggcctttata aaaaggaacc atccaatacc 780

tcgccagaac caagtaacag tattttacgg ggcacaaatc aagaacaata agacaggact 840

gtaaagatgg acgcattgaa ctccaaagaa caacaagagt tccaaaaagt agtggaacaa 900

aagcaaatga aggatttcat gcgtttgata acttcgtata atgtatgcta tacgaagtta 960

tctcgagggc cagaaaaagg aagtgtttcc ctccttcttg aattgatgtt accctcataa 1020

agcacgtggc ctcttatcga gaaagaaatt accgtcgctc gtgatttgtt tgcaaaaaga 1080

acaaaactga aaaaacccag acacgctcga cttcctgtct tcctgttgat tgcagcttcc 1140

aatttcgtca cacaacaagg tcctagcgac ggctcacagg ttttgtaaca agcaatcgaa 1200

ggttctggaa tggcgggaaa gggtttagta ccacatgcta tgatgcccac tgtgatctcc 1260

agagcaaagt tcgttcgatc gtactgttac tctctctctt tcaaacagaa ttgtccgaat 1320

cgtgtgacaa caacagcctg ttctcacaca ctcttttctt ctaaccaagg gggtggttta 1380

gtttagtaga acctcgtgaa acttacattt acatatatat aaacttgcat aaattggtca 1440

atgcaagaaa tacatatttg gtcttttcta attcgtagtt tttcaagttc ttagatgctt 1500

tctttttctc ttttttacag atcatcaagg aagtaattat ctacttttta caagtctaga 1560

atgaagttta tctccacgtt tttaaccttt atcctagcag ctgtcagcgt caccgccgca 1620

tcaattccga gttcagcatc tgtacaactt gactcttaca attacgatgg cagcactttc 1680

tcagggaaaa tttatgtgaa aaacatagca tatagtaaga aggttaccgt ggtatatgca 1740

gacggttctg ataattggaa taataatgga aacactattg ccgccagttt ttccggccca 1800

atttctggtt ccaattacga gtattggacc ttttctgcat cagtaaaagg catcaaggaa 1860

ttctatatta agtacgaagt ttcaggtaag acatattacg ataacaataa ctcagcaaat 1920

tatcaagtct ctacatctaa gcccacaaca acaactgctg ctaccaccac tacaaccgct 1980

ccttctacca gcaccactac cagaccaagc tctagtgaac cggctacctt tcctaccgga 2040

aacagtacca tctcaagctg gatcaaaaag caagaggaca taagtcgttt tgctatgttg 2100

aggaacatta atcctccagg atccgcgacc ggtttcattg cagcatcact aagtactgcc 2160

gggcctgatt attattatgc ttggactaga gacgctgcat taacatcaaa cgtgattgtt 2220

tatgaatata atacgaccct ttccggtaat aaaacgatct tgaacgtatt aaaagactat 2280

gtgaccttta gtgtgaagac ccaatctaca tctacagtgt gtaattgttt gggagaacct 2340

aaattcaatc cagacggttc tgggtacact ggtgcctggg gtagacctca aaacgacggt 2400

ccagcagaaa gagcaacaac ctttgttcta tttgctgact cttatttaac gcaaacaaag 2460

gacgcctcat atgttacagg gaccctaaaa ccagcaattt tcaaagactt ggattatgtt 2520

gttaatgttt ggagcaacgg atgttttgac ttgtgggagg aggttaacgg tgtacacttt 2580

tatacattga tggtgatgag aaaagggttg ctattgggag cagatttcgc taaaagaaat 2640

ggtgattcta caagagcgag cacatatagt agcaccgctt caacaatcgc caataaaatc 2700

tcatctttct gggtatctag caacaactgg gtacaagttt cccaaagtgt taccggcggt 2760

gtgtccaaaa agggtttaga cgttagcaca cttctagctg ctaatttggg tagcgttgat 2820

gacgggtttt ttactccagg tagtgagaag atactggcaa ccgcggtggc ggttgaagac 2880

agctttgctt cattgtatcc tataaataaa aatctgccct cttatctggg taatgcaatt 2940

ggcagatacc cagaagatac ctacaatggt aatggtaatt cccaggggaa cccatggttt 3000

ttggctgtta caggctacgc agaactttat taccgtgcaa tcaaggaatg gatttcaaat 3060

ggcggcgtca ctgtcagtag tataagtttg ccctttttta agaaatttga ttcctcagca 3120

acgtctggta aaaaatacac cgtaggtact agtgatttca ataatttggc ccaaaatatt 3180

gcgcttgctg ctgacaggtt tcttagtacc gttcagttgc acgctccaaa taatggctca 3240

ttggctgaag aatttgatcg tacgacaggt ttctccactg gtgctaggga tttgacttgg 3300

agtcatgcct ccttaatcac agcaagctat gctaaagctg gtgcacctgc tgcttagtta 3360

attaatttac cagcttacta tccttcttga aaatatgcac tctatatctt ttagttctta 3420

attgcaacac atagatttgc tgtataacga attttatgct atttttttaa tttggagttc 3480

ggtgatgaaa gtgtcacagc gaatttcctc acatgtaggg accgaattgt ttacaagttc 3540

tctgtaccac catggagaca tcaaagattg aaaatctatg gaaagatatg gacggtagca 3600

acaagaatat agcacgagcc gcggagttca tttcgttact tttgatatcg ctcacaacta 3660

ttgcgaagcg cttcagtgaa aaaatcataa ggaaaagttg taaatattat tggtagtatt 3720

cgtttggtaa agtagagggg gtaatttttc ccctttattt tgttcataca ttcttaaatt 3780

gctttgcctc tccttttgga aagctatact tcggagcact gttgagcgaa ggctcaggcc 3840

ggcagcacgc agcacgctgt atttacgtat ttaattttat atatttgtgc atacactact 3900

agggaagact tgaaaaaaac ctaggaaatg aaaaaacgac acaggaagtc ccgtatttac 3960

tattttttcc ttccttttga tggggcaggg cggaaataga ggataggata agcctactgc 4020

ttagctgttt ccgtctctac ttcggtagtt gtctcaattg tcgtttcagt attaccttta 4080

gagccgctag acgatggttg agctatttgt tgagggaaaa ctaagttcat gtaacacacg 4140

cataacccga ttaaactcat gaatagcttg attgcaggag gctggtccat tggagatggt 4200

gccttatttt ccttataggc aacgatgatg tcttcgtcgg tgttcaggta gtagtgtaca 4260

ctctgaatca gggagaacca ggcaatgaac ttgttcctca agaaaatagc ggccataggc 4320

atggattggt taaccacacc agatatgctt ggtgtggcag aatatagtcc ttttggtggc 4380

gcaattttct tgtacctgtg gtagaaaggg agcggttgaa ctgttagtat atattggcaa 4440

tatcagcaaa tttgaaagaa aattgtcggt gaaaaacata cgaaacacaa aggtcgggcc 4500

ttgcaacgtt attcaaagtc attgtttagt tgaggaggta gcagcggagt atatgtattc 4560

cttttttttg cctatggatg ttgtaccatg cccattctgc tcaagctttt gttaaaatta 4620

tttttcagta ttttttcttc catgttgcgc gttacgagaa cagaagcgac agataaccgc 4680

aatcatacaa ctagcgctac tgcggggtgt aaaaagcaca agaactaagc caagatcaca 4740

acagttat 4748

<210> 13

<211> 4260

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 13

tcgagatctc ccgagtttat cattatcaat actgccattt caaagaatac gtaaataatt 60

aatagtagtg attttcctaa ctttatttag tcaaaaaatt ggccttttaa ttctgctgta 120

acccgtacat gcccaaaata gggggcgggt tacacagaat atataacatc ataggtgtct 180

gggtgaacag tttattcctg gcatccacta aatataatgg agcccgcttt ttttaagctg 240

gcatccagaa aaaaaaagaa tcccagcacc aaaatattgt tttcttcacc aaccatcagt 300

tcataggtcc attctcttag cgcaactaca cagaacaggg gcacaaacag gcaaaaaacg 360

ggcacaacct caatggagtg atgcaacctg cttggagtaa atgatgacac aaggcaattg 420

acctacgcat gtatctatct cattttctta caccttctat taccttctgc tctctctgat 480

ttggaaaaag ctgaaaaaaa aggttgaaac cagttccctg aaattattcc cctatttgac 540

taataagtat ataaagacgg taggtattga ttgtaattct gtaaatctat ttcttaaact 600

tcttaaattc tacttttata gttagtcttt tttttagttt aaaacaccaa gaacttagtt 660

tcgaataaac acacataaac aaacaaatct agaatgaagt tcatttccac tttcttgacc 720

ttcattttgg ctgctgtctc tgtcaccgct gcatctattc catctagtgc atctgtacaa 780

ttggactcct acaattacga tggttccaca ttttccggca agatttatgt caaaaacatc 840

gcttactcta aaaaggttac tgttgtgtac gcagacggtt ctgacaactg gaacaataac 900

ggcaacacta ttgctgcatc attttcaggc ccaatctctg gatcaaatta cgaatactgg 960

acattctcag catcagtgaa gggcataaag gagttctaca tcaaatacga agtttcaggt 1020

aagacatatt acgacaataa caactctgca aactaccaag tctcaacttc taaacctact 1080

acaactactg cagctacaac cacaactaca gctccatcaa cttctacaac aacccgtcca 1140

tctagttcag agcctgccac cttccctact ggtaattcta ccatcagctc ttggatcaaa 1200

aagcaggaag atatttccag attcgctatg cttagaaaca tcaacccacc tggttctgcc 1260

acagggttta tcgccgcatc actctctacc gctggtccag attactacta cgcgtggaca 1320

agagatgccg ctttgacatc taacgttatc gtttacgaat acaacaccac attgtctggg 1380

aataagacaa ttctaaacgt acttaaggat tacgtcacat tcagtgttaa gacacagtct 1440

acttcaacag tttgtaattg ccttggtgaa ccaaagttca atccagacgg cagtggttac 1500

acaggtgctt ggggtagacc tcaaaatgat ggtcctgcag aaagagcgac tacatttgtt 1560

ctgtttgccg acagctactt gactcaaact aaggatgcct catacgtcac tggtacatta 1620

aagccagcaa ttttcaaaga tctcgattac gttgttaacg tctggagtaa cggatgtttc 1680

gatttatggg aggaggtgaa cggagttcat ttctacaccc ttatggttat gagaaaaggg 1740

ctattgttgg gggctgattt cgcgaagaga aacggtgact caactagagc ctcaacttac 1800

tcttctactg cttccacaat tgctaacaag atatcaagtt tctgggttag ctcaaacaac 1860

tgggtgcaag tatcccaatc tgtcacagga ggtgtaagta aaaaggggtt agacgttagc 1920

accctgttag ctgcgaatct aggatcagtc gatgatggat ttttcactcc aggttctgaa 1980

aagatattag ctacagctgt ggcagtcgaa gattcctttg ccagtctata cccaatcaac 2040

aaaaaccttc catcatactt ggggaacgct attggaagat accctgaaga tacatacaac 2100

ggtaatggta actcacaagg caatccttgg tttctggcgg ttaccggcta cgcagagttg 2160

tactatagag caattaagga atggatttct aatggaggcg ttacagtgtc ctctatctca 2220

ttgccatttt tcaaaaagtt cgatagctct gcaacatccg gtaaaaagta caccgtaggt 2280

acttctgact tcaacaattt agcacaaaac attgctcttg ctgcagatcg tttcctatct 2340

actgtacaac tccatgcacc aaacaatggt tcattagcag aggaatttga tagaacaaca 2400

ggtttttcta ccggcgctag agatttaaca tggtcccacg cctcattgat aacagcatcc 2460

tatgccaaag ccggtgctcc agctgcataa ttaattaaac aggccccttt tcctttgtcg 2520

atatcatgta attagttatg tcacgcttac attcacgccc tcctcccaca tccgctctaa 2580

ccgaaaagga aggagttaga caacctgaag tctaggtccc tatttatttt tttatagtta 2640

tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg tacaaacgcg 2700

tgtacgcatg taacgggcag acggccggcc ataacttcgt ataatgtatg ctatacgaag 2760

ttatccttac atcacaccca atcccccaca agtgatcccc cacacaccat agcttcaaaa 2820

tgtttctact ccttttttac tcttccagat tttctcggac tccgcgcatc gccgtaccac 2880

ttcaaaacac ccaagcacag catactaaat ttcccctctt tcttcctcta gggtggcgtt 2940

aattacccgt actaaaggtt tggaaaagaa aaaagagacc gcctcgtttc tttttcttcg 3000

tcgaaaaagg caataaaaat ttttatcacg tttctttttc ttgaaaaatt ttttttttga 3060

tttttttctc tttcgatgac ctcccattga tatttaagtt aataaatggt cttcaatttc 3120

tcaagtttca gtttcgtttt tcttgttcta ttacaacttt ttttacttct tgctcattag 3180

aaagaaagca tagcaatcta atctaagttt taattacaaa atgccacaat cctgggaaga 3240

attggccgcc gacaaacgtg cccgtttggc taaaaccatt cctgacgaat ggaaggttca 3300

aactttgcct gccgaagatt ccgttattga tttcccaaag aagtccggta ttttgtctga 3360

ggctgaattg aagattaccg aagcctctgc tgctgatttg gtctccaagt tggccgctgg 3420

tgagttgact tctgttgaag tcactttggc tttttgtaag agagctgcta ttgctcaaca 3480

attaaccaac tgtgctcacg aattcttccc agatgctgct ttagctcaag ctagagaatt 3540

agatgaatac tacgctaagc ataagagacc agttggtcca ttacacggtt taccaatctc 3600

tttaaaggac caattgcgtg ttaagggtta cgaaacctcc atgggttaca tttcctggtt 3660

aaacaaatac gatgaaggtg attccgtctt aaccaccatg ttgagaaaag ctggtgctgt 3720

tttctacgtt aagacctctg tcccacaaac cttgatggtc tgtgaaaccg tcaacaacat 3780

cattggtaga actgtcaatc caagaaacaa aaattggtcc tgtggtggtt cttctggtgg 3840

tgaaggtgct attgttggta ttagaggtgg tgttattggt gtcggtactg acattggtgg 3900

ttccattaga gtcccagctg ctttcaactt tttatacggt ttgagaccat ctcacggtag 3960

attgccatat gctaaaatgg ctaactctat ggaaggtcaa gaaaccgttc actccgtcgt 4020

tggtcctatc actcactccg tcgaagactt gagattgttc accaaatctg tcttgggtca 4080

agaaccttgg aagtacgact ctaaggtcat ccccatgcca tggagacaat ctgaatctga 4140

catcattgcc tctaagatta agaatggtgg tttgaacatt ggttattaca atttcgacgg 4200

taacgtcttg ccacacccac caattttacg tggtgtcgaa actaccgttg ccgctttggc 4260

<210> 14

<211> 5008

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 14

ggccgcgaag gtgctattgt tggtattaga ggtggtgtta ttggtgtcgg tactgacatt 60

ggtggttcca ttagagtccc agctgctttc aactttttat acggtttgag accatctcac 120

ggtagattgc catatgctaa aatggctaac tctatggaag gtcaagaaac cgttcactcc 180

gtcgttggtc ctatcactca ctccgtcgaa gacttgagat tgttcaccaa atctgtcttg 240

ggtcaagaac cttggaagta cgactctaag gtcatcccaa tgccatggag acaatctgaa 300

tctgacatca ttgcctctaa gattaagaat ggtggtttga acattggtta ttacaatttc 360

gacggtaacg tcttgccaca cccaccaatt ttacgtggtg tcgaaactac cgttgccgct 420

ttggccaagg ctggtcacac cgttactcca tggactccat acaagcatga tttcggtcat 480

gacttgattt cccacatcta tgctgctgat ggttctgccg acgtcatgag agacatttct 540

gcctctggtg agccagccat ccctaacatt aaggacttgt tgaacccaaa tattaaggct 600

gttaacatga acgaattgtg ggacactcat ttacaaaagt ggaactatca aatggaatac 660

ttggaaaagt ggcgtgaagc tgaagaaaaa gctggtaagg aattggacgc tattatcgct 720

ccaattactc ctaccgccgc tgtcagacac gatcaattca gatactacgg ttacgcctcc 780

gttattaact tattggattt cacctctgtt gtcgtcccag tcactttcgc tgataagaat 840

attgataaga agaacgaatc ttttaaagct gtttccgaat tggatgcttt ggttcaagaa 900

gaatacgacc cagaggctta tcacggtgct cctgttgctg ttcaagttat tggtagaaga 960

ttgtccgaag agagaacttt ggctatcgcc gaagaagtcg gtaaattgtt gggtaacgtc 1020

gtcactccat aagcgaattt cttatgattt atgattttta ttattaaata agttataaaa 1080

aaaataagtg tatacaaatt ttaaagtgac tcttaggttt taaaacgaaa attcttattc 1140

ttgagtaact ctttcctgta ggtcaggttg ctttctcagg tatagcatga ggtcgctctt 1200

attgaccaca cctctaccgg catgccgagc aaatgcctgc aaatcgctcc ccatttcacc 1260

caattgtaga tatgctaact ccagcaatga gttgatgaat ctcggtgtgt attttatgtc 1320

ctcagaggac aacacataac ttcgtataat gtatgctata cgaagttatc tcgagggcca 1380

gaaaaaggaa gtgtttccct ccttcttgaa ttgatgttac cctcataaag cacgtggcct 1440

cttatcgaga aagaaattac cgtcgctcgt gatttgtttg caaaaagaac aaaactgaaa 1500

aaacccagac acgctcgact tcctgtcttc ctgttgattg cagcttccaa tttcgtcaca 1560

caacaaggtc ctagcgacgg ctcacaggtt ttgtaacaag caatcgaagg ttctggaatg 1620

gcgggaaagg gtttagtacc acatgctatg atgcccactg tgatctccag agcaaagttc 1680

gttcgatcgt actgttactc tctctctttc aaacagaatt gtccgaatcg tgtgacaaca 1740

acagcctgtt ctcacacact cttttcttct aaccaagggg gtggtttagt ttagtagaac 1800

ctcgtgaaac ttacatttac atatatataa acttgcataa attggtcaat gcaagaaata 1860

catatttggt cttttctaat tcgtagtttt tcaagttctt agatgctttc tttttctctt 1920

ttttacagat catcaaggaa gtaattatct actttttaca agtctagaat gaagtttatc 1980

tccacgtttt taacctttat cctagcagct gtcagcgtca ccgccgcatc aattccgagt 2040

tcagcatctg tacaacttga ctcttacaat tacgatggca gcactttctc agggaaaatt 2100

tatgtgaaaa acatagcata tagtaagaag gttaccgtgg tatatgcaga cggttctgat 2160

aattggaata ataatggaaa cactattgcc gccagttttt ccggcccaat ttctggttcc 2220

aattacgagt attggacctt ttctgcatca gtaaaaggca tcaaggaatt ctatattaag 2280

tacgaagttt caggtaagac atattacgat aacaataact cagcaaatta tcaagtctct 2340

acatctaagc ccacaacaac aactgctgct accaccacta caaccgctcc ttctaccagc 2400

accactacca gaccaagctc tagtgaaccg gctacctttc ctaccggaaa cagtaccatc 2460

tcaagctgga tcaaaaagca agaggacata agtcgttttg ctatgttgag gaacattaat 2520

cctccaggat ccgcgaccgg tttcattgca gcatcactaa gtactgccgg gcctgattat 2580

tattatgctt ggactagaga cgctgcatta acatcaaacg tgattgttta tgaatataat 2640

acgacccttt ccggtaataa aacgatcttg aacgtattaa aagactatgt gacctttagt 2700

gtgaagaccc aatctacatc tacagtgtgt aattgtttgg gagaacctaa attcaatcca 2760

gacggttctg ggtacactgg tgcctggggt agacctcaaa acgacggtcc agcagaaaga 2820

gcaacaacct ttgttctatt tgctgactct tatttaacgc aaacaaagga cgcctcatat 2880

gttacaggga ccctaaaacc agcaattttc aaagacttgg attatgttgt taatgtttgg 2940

agcaacggat gttttgactt gtgggaggag gttaacggtg tacactttta tacattgatg 3000

gtgatgagaa aagggttgct attgggagca gatttcgcta aaagaaatgg tgattctaca 3060

agagcgagca catatagtag caccgcttca acaatcgcca ataaaatctc atctttctgg 3120

gtatctagca acaactgggt acaagtttcc caaagtgtta ccggcggtgt gtccaaaaag 3180

ggtttagacg ttagcacact tctagctgct aatttgggta gcgttgatga cgggtttttt 3240

actccaggta gtgagaagat actggcaacc gcggtggcgg ttgaagacag ctttgcttca 3300

ttgtatccta taaataaaaa tctgccctct tatctgggta atgcaattgg cagataccca 3360

gaagatacct acaatggtaa tggtaattcc caggggaacc catggttttt ggctgttaca 3420

ggctacgcag aactttatta ccgtgcaatc aaggaatgga tttcaaatgg cggcgtcact 3480

gtcagtagta taagtttgcc cttttttaag aaatttgatt cctcagcaac gtctggtaaa 3540

aaatacaccg taggtactag tgatttcaat aatttggccc aaaatattgc gcttgctgct 3600

gacaggtttc ttagtaccgt tcagttgcac gctccaaata atggctcatt ggctgaagaa 3660

tttgatcgta cgacaggttt ctccactggt gctagggatt tgacttggag tcatgcctcc 3720

ttaatcacag caagctatgc taaagctggt gcacctgctg cttagttaat taatttacca 3780

gcttactatc cttcttgaaa atatgcactc tatatctttt agttcttaat tgcaacacat 3840

agatttgctg tataacgaat tttatgctat ttttttaatt tggagttcgg tgatgaaagt 3900

gtcacagcga atttcctcac atgtagggac cgaattgttt acaagttctc tgtaccacca 3960

tggagacatc aaagattgaa aatctatgga aagatatgga cggtagcaac aagaatatag 4020

cacgagccgc ggagttcatt tcgttacttt tgatatcgct cacaactatt gcgaagcgct 4080

tcagtgaaaa aatcataagg aaaagttgta aatattattg gtagtattcg tttggtaaag 4140

tagagggggt aatttttccc ctttattttg ttcatacatt cttaaattgc tttgcctctc 4200

cttttggaaa gctatacttc ggagcactgt tgagcgaagg ctcaggccgg cagcacgcag 4260

cacgctgtat ttacgtattt aattttatat atttgtgcat acactactag ggaagacttg 4320

aaaaaaacct aggaaatgaa aaaacgacac aggaagtccc gtatttacta ttttttcctt 4380

ccttttgatg gggcagggcg gaaatagagg ataggataag cctactgctt agctgtttcc 4440

gtctctactt cggtagttgt ctcaattgtc gtttcagtat tacctttaga gccgctagac 4500

gatggttgag ctatttgttg agggaaaact aagttcatgt aacacacgca taacccgatt 4560

aaactcatga atagcttgat tgcaggaggc tggtccattg gagatggtgc cttattttcc 4620

ttataggcaa cgatgatgtc ttcgtcggtg ttcaggtagt agtgtacact ctgaatcagg 4680

gagaaccagg caatgaactt gttcctcaag aaaatagcgg ccataggcat ggattggtta 4740

accacaccag atatgcttgg tgtggcagaa tatagtcctt ttggtggcgc aattttcttg 4800

tacctgtggt agaaagggag cggttgaact gttagtatat attggcaata tcagcaaatt 4860

tgaaagaaaa ttgtcggtga aaaacatacg aaacacaaag gtcgggcctt gcaacgttat 4920

tcaaagtcat tgtttagttg aggaggtagc agcggagtat atgtattcct tttttttgcc 4980

tatggatgtt gtaccatgcc cattctga 5008

<210> 15

<211> 4881

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 15

ctaaattcgg ccttgctcag agactcctgg attttggcta acaacgcagt cccttcgatg 60

catatagcta ggccacaaat tatgccaata acggtccatg ggttgatgtt ttcttgaatt 120

ctttcgtttt tcatgctatt tgcgtcttcc caagtcccag cgttccagta ttcatactgc 180

gcgttagagt ggtagccata agagccggca tattggtaat tttcagtatt aacgttagaa 240

cgtggtgaat acgatgtggt ccagccttgc ctcgttgtgt catatacgat ctttttcttt 300

gggtcacaaa gaatatcata tgcttgagag atgactttaa atctatgtag tttttcgctt 360

gatgttagca gcagcggtga tttactatca ctgttggtaa ccttttctga gctaaatatt 420

tgaatgttat cggaatggtc agggtggtac aattttacat aacgatgata tttttttttt 480

aacgacttct tgtccagttt aggatttcca gatccggcct ttggaatgcc aaaaatatca 540

tagggagttg gatctgccaa ctcaggccat tgttcatccc ttatcgtaag ttttctattg 600

ccatttttat cgttcgctgt agcatactta gctataaaag tgatttgtgg gggacacttt 660

tctacacatg ataagtgcca cttgaataaa aatgggtata cgaacttatg gtgtagcata 720

acaaatatat tgcaagtagt gacctatggt gtgtagatat acgtacagtt agttacgagc 780

ctaaagacac aacgtgtttg ttaattatac tgtcgctgta atatcttctc ttccattatc 840

accggtcatt ccttgcaggg gcggtagtac ccggagaccc tgaacttttc tttttttttt 900

tgcgaaatta aaaagttcat tttcaattcg acaatgagat ctacaagcca ttgttttatg 960

ttgatgagag ccagcttaaa gagttctcga gatctcccga gtttatcatt atcaatactg 1020

ccatttcaaa gaatacgtaa ataattaata gtagtgattt tcctaacttt atttagtcaa 1080

aaaattggcc ttttaattct gctgtaaccc gtacatgccc aaaatagggg gcgggttaca 1140

cagaatatat aacatcatag gtgtctgggt gaacagttta ttcctggcat ccactaaata 1200

taatggagcc cgcttttttt aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa 1260

tattgttttc ttcaccaacc atcagttcat aggtccattc tcttagcgca actacacaga 1320

acaggggcac aaacaggcaa aaaacgggca caacctcaat ggagtgatgc aacctgcttg 1380

gagtaaatga tgacacaagg caattgacct acgcatgtat ctatctcatt ttcttacacc 1440

ttctattacc ttctgctctc tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt 1500

tccctgaaat tattccccta tttgactaat aagtatataa agacggtagg tattgattgt 1560

aattctgtaa atctatttct taaacttctt aaattctact tttatagtta gtcttttttt 1620

tagtttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac aaatctagaa 1680

tgcagttatt caacttacca cttaaggtat ctttctttct agtcttatct tacttttcat 1740

tgttagtatc agctgcctct ataccaagtt cagcatccgt acaactagat tcatacaatt 1800

acgacggttc aacattctca ggaaagatat acgtgaaaaa tattgcttac agcaaaaagg 1860

ttactgtgat ttacgcagat gggtcagaca actggaataa caatggaaac acaattgctg 1920

cttcctattc tgcccctatt tctggatcta actacgaata ctggactttt tcagcgagta 1980

taaacggaat taaggaattc tatatcaaat atgaagtctc tggtaagacc tactacgata 2040

acaacaactc cgcaaactac caagttagca catcaaagcc aaccacaaca actgctactg 2100

cgacaactac aaccgcacca agcacttcta ctacaacacc tcctagttca tctgagccag 2160

caactttccc aactggtaat tccactattt cttcttggat caaaaaacaa gagggtatct 2220

caagattcgc catgcttaga aatatcaatc ctccaggctc tgcaacagga ttcattgcag 2280

catctttatc aactgcgggg ccagactact actacgcctg gactagagat gcagctttga 2340

catcaaatgt gattgtttat gaatacaaca caactttgtc cggtaacaag acaatcttga 2400

acgtcttgaa ggattatgtg acattctctg tcaagactca atctacatca acagtttgta 2460

actgtctcgg cgaaccaaag ttcaaccctg atggtagtgg ttacactggt gcttggggta 2520

gaccacaaaa cgatggtcca gcagagagag ctacaacttt catcttgttt gctgactctt 2580

acctaacaca aaccaaggat gcaagctacg ttactggaac actaaagcct gcaatcttta 2640

aagacctgga ctatgttgta aacgtttggt caaatggctg cttcgatcta tgggaggaag 2700

tgaacggtgt tcacttctac acattaatgg tcatgagaaa gggactcttg cttggtgcag 2760

actttgctaa gagaaacggt gattctacac gtgcctccac ttactcctcc acagcttcaa 2820

ccattgccaa caaaatctct tctttctggg tcagctcaaa taactggatt caagtttctc 2880

aatcagttac tggtggtgtt tctaaaaagg gcctggatgt gtcaaccttg cttgctgcca 2940

atttgggcag tgttgatgac gggttcttca ccccaggttc tgaaaagatc ctcgccaccg 3000

cagttgccgt tgaagattca tttgctagtt tatacccaat caacaaaaat ctaccatcat 3060

accttggaaa ttcaatcggt agatatccag aggatacata caacggtaat ggaaactctc 3120

agggtaaccc ttggtttctt gcagttacag ggtacgctga actgtactac agagcgatta 3180

aggaatggat tggtaatggc ggcgtaactg ttagttctat ttctctacct ttcttcaaaa 3240

agttcgatag ttctgcaaca tctggtaaaa agtacacagt cggcacttcc gattttaaca 3300

atttagctca gaacatagca ctggcagctg atcgtttctt gagtacagtc caattgcatg 3360

cccataacaa cggtagtttg gctgaagagt ttgatagaac caccggttta tcaaccggcg 3420

ccagagattt aacatggtcc catgcgtctt tgataactgc ttcttacgcc aaggctgggg 3480

caccagctgc ctgattaatt aaacaggccc cttttccttt gtcgatatca tgtaattagt 3540

tatgtcacgc ttacattcac gccctcctcc cacatccgct ctaaccgaaa aggaaggagt 3600

tagacaacct gaagtctagg tccctattta tttttttata gttatgttag tattaagaac 3660

gttatttata tttcaaattt ttcttttttt tctgtacaaa cgcgtgtacg catgtaacgg 3720

gcagacggcc ggccataact tcgtataatg tatgctatac gaagttatgg caacggttca 3780

tcatctcatg gatctgcaca tgaacaaaca ccagagtcaa acgacgttga aattgaggct 3840

actgcgccaa ttgatgacaa tacagacgat gataacaaac cgaagttatc tgatgtagaa 3900

aaggattaga gatgctaaga gatagtgatg atatttcata aataatgtaa ttctatatat 3960

gttaattacc ttttttgcga ggcatattta tggtgaagga taagttttga ccatcaaaga 4020

aggttaatgt ggctgtggtt tcagggtcca taaagctttt caattcatct tttttttttt 4080

tgttcttttt tttgattccg gtttctttga aatttttttg attcggtaat ctccgagcag 4140

aaggaagaac gaaggaagga gcacagactt agattggtat atatacgcat atgtggtgtt 4200

gaagaaacat gaaattgccc agtattctta acccaactgc acagaacaaa aacctgcagg 4260

aaacgaagat aaatcatgtc gaaagctaca tataaggaac gtgctgctac tcatcctagt 4320

cctgttgctg ccaagctatt taatatcatg cacgaaaagc aaacaaactt gtgtgcttca 4380

ttggatgttc gtaccaccaa ggaattactg gagttagttg aagcattagg tcccaaaatt 4440

tgtttactaa aaacacatgt ggatatcttg actgattttt ccatggaggg cacagttaag 4500

ccgctaaagg cattatccgc caagtacaat tttttactct tcgaagacag aaaatttgct 4560

gacattggta atacagtcaa attgcagtac tctgcgggtg tatacagaat agcagaatgg 4620

gcagacatta cgaatgcaca cggtgtggtg ggcccaggta ttgttagcgg tttgaagcag 4680

gcggcggaag aagtaacaaa ggaacctaga ggccttttga tgttagcaga attgtcatgc 4740

aagggctccc tagctactgg agaatatact aagggtactg ttgacattgc gaagagcgac 4800

aaagattttg ttatcggctt tattgctcaa agagacatgg gtggaagaga tgaaggttac 4860

gattggttga ttatgacacg c 4881

<210> 16

<211> 4824

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 16

ggccgctcca tggagggcac agttaagccg ctaaaggcat tatccgccaa gtacaatttt 60

ttactcttcg aagacagaaa atttgctgac attggtaata cagtcaaatt gcagtactct 120

gcgggtgtat acagaatagc agaatgggca gacattacga atgcacacgg tgtggtgggc 180

ccaggtattg ttagcggttt gaagcaggcg gcggaagaag taacaaagga acctagaggc 240

cttttgatgt tagcagaatt gtcatgcaag ggctccctag ctactggaga atatactaag 300

ggtactgttg acattgcgaa gagcgacaaa gattttgtta tcggctttat tgctcaaaga 360

gacatgggtg gaagagatga aggttacgat tggttgatta tgacacccgg tgtgggttta 420

gatgacaagg gagacgcatt gggtcaacag tatagaaccg tggatgatgt ggtctctaca 480

ggatctgaca ttattattgt tggaagagga ctatttgcaa agggaaggga tgctaaggta 540

gagggtgaac gttacagaaa agcaggctgg gaagcatatt tgagaagatg cggccagcaa 600

aactaaaaaa ctgtattata agtaaatgca tgtatactaa actcacaaat tagagcttca 660

atttaattat atcagttatt acccgggaat ctcggtcgta atgattttta taatgacgaa 720

aaaaaaaaaa ttggaaagaa aaagcttcat ggcctttata aaaaggaacc atccaatacc 780

tcgccagaac caagtaacag tattttacgg ggcacaaatc aagaacaata agacaggact 840

gtaaagatgg acgcattgaa ctccaaagaa caacaagagt tccaaaaagt agtggaacaa 900

aagcaaatga aggatttcat gcgtttgata acttcgtata atgtatgcta tacgaagtta 960

tctcgagggc cagaaaaagg aagtgtttcc ctccttcttg aattgatgtt accctcataa 1020

agcacgtggc ctcttatcga gaaagaaatt accgtcgctc gtgatttgtt tgcaaaaaga 1080

acaaaactga aaaaacccag acacgctcga cttcctgtct tcctgttgat tgcagcttcc 1140

aatttcgtca cacaacaagg tcctagcgac ggctcacagg ttttgtaaca agcaatcgaa 1200

ggttctggaa tggcgggaaa gggtttagta ccacatgcta tgatgcccac tgtgatctcc 1260

agagcaaagt tcgttcgatc gtactgttac tctctctctt tcaaacagaa ttgtccgaat 1320

cgtgtgacaa caacagcctg ttctcacaca ctcttttctt ctaaccaagg gggtggttta 1380

gtttagtaga acctcgtgaa acttacattt acatatatat aaacttgcat aaattggtca 1440

atgcaagaaa tacatatttg gtcttttcta attcgtagtt tttcaagttc ttagatgctt 1500

tctttttctc ttttttacag atcatcaagg aagtaattat ctacttttta caagtctaga 1560

atgcagctgt tcaacttgcc attaaaggtt tcattctttt tggtcctatc atactttagt 1620

ttgttggtgt cagccgcatc tattccatct tcagcatctg tacaattaga ctcctacaat 1680

tacgacggct ctacattcag cggaaagatt tacgtgaaaa atattgcgta cagcaaaaaa 1740

gtaactgtta tctatgccga cggatcagat aactggaaca acaatggaaa cactatcgct 1800

gccagttact ctgcaccaat ttcaggttct aactacgaat attggacatt ctcagcctcc 1860

atcaatggca ttaaggaatt ctacataaag tacgaagttt ccggtaagac ttactacgat 1920

aacaacaatt ctgcaaacta tcaagtatca acatcaaaac ctactaccac caccgccaca 1980

gctacaacta caactgcacc ttcaacatct accacaaccc caccatcttc tagcgaacca 2040

gctacattcc caactggcaa ttctactatt tctagttgga tcaaaaaaca agagggtatt 2100

tccagattcg caatgttgag aaacataaat ccaccaggat cagcaactgg attcatcgca 2160

gcttctttgt ccacagcggg gccagattac tactacgcat ggaccagaga tgctgctttg 2220

acaagtaacg ttattgttta cgaatacaat accactttgt ccggtaacaa gactattctt 2280

aacgtcctaa aggattacgt tacattctct gttaagactc agtctacatc cacagtctgc 2340

aattgtttgg gtgaaccaaa gttcaaccca gatggctctg gatacacagg tgcctggggt 2400

cgtccacaaa acgatgggcc tgccgagaga gccactacat ttatcctatt tgctgactca 2460

taccttacac aaacaaaaga tgcatcctac gtgactggaa cattaaagcc tgcaatcttc 2520

aaagacctgg attacgttgt caacgtgtgg tctaacggct gtttcgatct atgggaagag 2580

gttaacggcg tgcacttcta cactctaatg gtcatgagaa agggtctgtt gttaggtgca 2640

gattttgcta agagaaacgg tgattctaca cgtgcttcta cctactcctc aacagcatca 2700

actattgcga acaagatttc ttcattttgg gtttcaagta ataactggat acaagtatct 2760

caaagcgtta cagggggtgt ctcaaaaaag ggtcttgatg tttctacatt actggctgct 2820

aatcttgggt ctgttgatga cggtttcttc acccctggtt ctgaaaagat cctcgctacc 2880

gccgtcgcgg ttgaggatag ttttgcttca ctctatccta taaacaaaaa ccttccttca 2940

tacttaggaa acagtatcgg tagataccca gaggatacat acaatggtaa tggcaattca 3000

cagggaaatc catggttcct tgctgttaca gggtacgcag aactttacta tagagctatt 3060

aaggaatgga tcggcaacgg cggtgtgaca gtttcctcaa tctcattgcc atttttcaaa 3120

aagtttgact ccagcgcgac atctggtaaa aagtatactg tggggacttc tgatttcaac 3180

aatttggctc aaaacattgc cttagctgcc gacagattct tatctaccgt acaactccat 3240

gcacataaca atggtagttt ggcagaggaa tttgatagaa ctacaggact ctctacaggt 3300

gcgagagatt taacttggtc acatgcaagt ttaattacag cctcttacgc aaaggctggt 3360

gctcctgctg cataattaat taatttacca gcttactatc cttcttgaaa atatgcactc 3420

tatatctttt agttcttaat tgcaacacat agatttgctg tataacgaat tttatgctat 3480

ttttttaatt tggagttcgg tgatgaaagt gtcacagcga atttcctcac atgtagggac 3540

cgaattgttt acaagttctc tgtaccacca tggagacatc aaagattgaa aatctatgga 3600

aagatatgga cggtagcaac aagaatatag cacgagccgc ggagttcatt tcgttacttt 3660

tgatatcgct cacaactatt gcgaagcgct tcagtgaaaa aatcataagg aaaagttgta 3720

aatattattg gtagtattcg tttggtaaag tagagggggt aatttttccc ctttattttg 3780

ttcatacatt cttaaattgc tttgcctctc cttttggaaa gctatacttc ggagcactgt 3840

tgagcgaagg ctcaggccgg cagcacgcag cacgctgtat ttacgtattt aattttatat 3900

atttgtgcat acactactag ggaagacttg aaaaaaacct aggaaatgaa aaaacgacac 3960

aggaagtccc gtatttacta ttttttcctt ccttttgatg gggcagggcg gaaatagagg 4020

ataggataag cctactgctt agctgtttcc gtctctactt cggtagttgt ctcaattgtc 4080

gtttcagtat tacctttaga gccgctagac gatggttgag ctatttgttg agggaaaact 4140

aagttcatgt aacacacgca taacccgatt aaactcatga atagcttgat tgcaggaggc 4200

tggtccattg gagatggtgc cttattttcc ttataggcaa cgatgatgtc ttcgtcggtg 4260

ttcaggtagt agtgtacact ctgaatcagg gagaaccagg caatgaactt gttcctcaag 4320

aaaatagcgg ccataggcat ggattggtta accacaccag atatgcttgg tgtggcagaa 4380

tatagtcctt ttggtggcgc aattttcttg tacctgtggt agaaagggag cggttgaact 4440

gttagtatat attggcaata tcagcaaatt tgaaagaaaa ttgtcggtga aaaacatacg 4500

aaacacaaag gtcgggcctt gcaacgttat tcaaagtcat tgtttagttg aggaggtagc 4560

agcggagtat atgtattcct tttttttgcc tatggatgtt gtaccatgcc cattctgctc 4620

aagcttttgt taaaattatt tttcagtatt ttttcttcca tgttgcgcgt tacgagaaca 4680

gaagcgacag ataaccgcaa tcatacaact agcgctactg cggggtgtaa aaagcacaag 4740

aactaagcca agatcacaac agttatcgat aaaatagcag tgtttgcatg gccattgaga 4800

aggacaacat tggcgtgcgg catg 4824

<210> 17

<211> 5264

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 17

ctaaattcgg ccttgctcag agactcctgg attttggcta acaacgcagt cccttcgatg 60

catatagcta ggccacaaat tatgccaata acggtccatg ggttgatgtt ttcttgaatt 120

ctttcgtttt tcatgctatt tgcgtcttcc caagtcccag cgttccagta ttcatactgc 180

gcgttagagt ggtagccata agagccggca tattggtaat tttcagtatt aacgttagaa 240

cgtggtgaat acgatgtggt ccagccttgc ctcgttgtgt catatacgat ctttttcttt 300

gggtcacaaa gaatatcata tgcttgagag atgactttaa atctatgtag tttttcgctt 360

gatgttagca gcagcggtga tttactatca ctgttggtaa ccttttctga gctaaatatt 420

tgaatgttat cggaatggtc agggtggtac aattttacat aacgatgata tttttttttt 480

aacgacttct tgtccagttt aggatttcca gatccggcct ttggaatgcc aaaaatatca 540

tagggagttg gatctgccaa ctcaggccat tgttcatccc ttatcgtaag ttttctattg 600

ccatttttat cgttcgctgt agcatactta gctataaaag tgatttgtgg gggacacttt 660

tctacacatg ataagtgcca cttgaataaa aatgggtata cgaacttatg gtgtagcata 720

acaaatatat tgcaagtagt gacctatggt gtgtagatat acgtacagtt agttacgagc 780

ctaaagacac aacgtgtttg ttaattatac tgtcgctgta atatcttctc ttccattatc 840

accggtcatt ccttgcaggg gcggtagtac ccggagaccc tgaacttttc tttttttttt 900

tgcgaaatta aaaagttcat tttcaattcg acaatgagat ctacaagcca ttgttttatg 960

ttgatgagag ccagcttaaa gagttctcga gatctcccga gtttatcatt atcaatactg 1020

ccatttcaaa gaatacgtaa ataattaata gtagtgattt tcctaacttt atttagtcaa 1080

aaaattggcc ttttaattct gctgtaaccc gtacatgccc aaaatagggg gcgggttaca 1140

cagaatatat aacatcatag gtgtctgggt gaacagttta ttcctggcat ccactaaata 1200

taatggagcc cgcttttttt aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa 1260

tattgttttc ttcaccaacc atcagttcat aggtccattc tcttagcgca actacacaga 1320

acaggggcac aaacaggcaa aaaacgggca caacctcaat ggagtgatgc aacctgcttg 1380

gagtaaatga tgacacaagg caattgacct acgcatgtat ctatctcatt ttcttacacc 1440

ttctattacc ttctgctctc tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt 1500

tccctgaaat tattccccta tttgactaat aagtatataa agacggtagg tattgattgt 1560

aattctgtaa atctatttct taaacttctt aaattctact tttatagtta gtcttttttt 1620

tagtttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac aaatctagaa 1680

tgcagttatt caacttacca cttaaggtat ctttctttct agtcttatct tacttttcat 1740

tgttagtatc agctgcctct ataccaagtt cagcatccgt acaactagat tcatacaatt 1800

acgacggttc aacattctca ggaaagatat acgtgaaaaa tattgcttac agcaaaaagg 1860

ttactgtgat ttacgcagat gggtcagaca actggaataa caatggaaac acaattgctg 1920

cttcctattc tgcccctatt tctggatcta actacgaata ctggactttt tcagcgagta 1980

taaacggaat taaggaattc tatatcaaat atgaagtctc tggtaagacc tactacgata 2040

acaacaactc cgcaaactac caagttagca catcaaagcc aaccacaaca actgctactg 2100

cgacaactac aaccgcacca agcacttcta ctacaacacc tcctagttca tctgagccag 2160

caactttccc aactggtaat tccactattt cttcttggat caaaaaacaa gagggtatct 2220

caagattcgc catgcttaga aatatcaatc ctccaggctc tgcaacagga ttcattgcag 2280

catctttatc aactgcgggg ccagactact actacgcctg gactagagat gcagctttga 2340

catcaaatgt gattgtttat gaatacaaca caactttgtc cggtaacaag acaatcttga 2400

acgtcttgaa ggattatgtg acattctctg tcaagactca atctacatca acagtttgta 2460

actgtctcgg cgaaccaaag ttcaaccctg atggtagtgg ttacactggt gcttggggta 2520

gaccacaaaa cgatggtcca gcagagagag ctacaacttt catcttgttt gctgactctt 2580

acctaacaca aaccaaggat gcaagctacg ttactggaac actaaagcct gcaatcttta 2640

aagacctgga ctatgttgta aacgtttggt caaatggctg cttcgatcta tgggaggaag 2700

tgaacggtgt tcacttctac acattaatgg tcatgagaaa gggactcttg cttggtgcag 2760

actttgctaa gagaaacggt gattctacac gtgcctccac ttactcctcc acagcttcaa 2820

ccattgccaa caaaatctct tctttctggg tcagctcaaa taactggatt caagtttctc 2880

aatcagttac tggtggtgtt tctaaaaagg gcctggatgt gtcaaccttg cttgctgcca 2940

atttgggcag tgttgatgac gggttcttca ccccaggttc tgaaaagatc ctcgccaccg 3000

cagttgccgt tgaagattca tttgctagtt tatacccaat caacaaaaat ctaccatcat 3060

accttggaaa ttcaatcggt agatatccag aggatacata caacggtaat ggaaactctc 3120

agggtaaccc ttggtttctt gcagttacag ggtacgctga actgtactac agagcgatta 3180

aggaatggat tggtaatggc ggcgtaactg ttagttctat ttctctacct ttcttcaaaa 3240

agttcgatag ttctgcaaca tctggtaaaa agtacacagt cggcacttcc gattttaaca 3300

atttagctca gaacatagca ctggcagctg atcgtttctt gagtacagtc caattgcatg 3360

cccataacaa cggtagtttg gctgaagagt ttgatagaac caccggttta tcaaccggcg 3420

ccagagattt aacatggtcc catgcgtctt tgataactgc ttcttacgcc aaggctgggg 3480

caccagctgc ctgattaatt aaacaggccc cttttccttt gtcgatatca tgtaattagt 3540

tatgtcacgc ttacattcac gccctcctcc cacatccgct ctaaccgaaa aggaaggagt 3600

tagacaacct gaagtctagg tccctattta tttttttata gttatgttag tattaagaac 3660

gttatttata tttcaaattt ttcttttttt tctgtacaaa cgcgtgtacg catgtaacgg 3720

gcagacggcc ggccataact tcgtataatg tatgctatac gaagttatcc ttacatcaca 3780

cccaatcccc cacaagtgat cccccacaca ccatagcttc aaaatgtttc tactcctttt 3840

ttactcttcc agattttctc ggactccgcg catcgccgta ccacttcaaa acacccaagc 3900

acagcatact aaatttcccc tctttcttcc tctagggtgg cgttaattac ccgtactaaa 3960

ggtttggaaa agaaaaaaga gaccgcctcg tttctttttc ttcgtcgaaa aaggcaataa 4020

aaatttttat cacgtttctt tttcttgaaa aatttttttt ttgatttttt tctctttcga 4080

tgacctccca ttgatattta agttaataaa tggtcttcaa tttctcaagt ttcagtttcg 4140

tttttcttgt tctattacaa ctttttttac ttcttgctca ttagaaagaa agcatagcaa 4200

tctaatctaa gttttaatta caaaatgcca caatcctggg aagaattggc cgccgacaaa 4260

cgtgcccgtt tggctaaaac cattcctgac gaatggaagg ttcaaacttt gcctgccgaa 4320

gattccgtta ttgatttccc aaagaagtcc ggtattttgt ctgaggctga attgaagatt 4380

accgaagcct ctgctgctga tttggtctcc aagttggccg ctggtgagtt gacttctgtt 4440

gaagtcactt tggctttttg taagagagct gctattgctc aacaattaac caactgtgct 4500

cacgaattct tcccagatgc tgctttagct caagctagag aattagatga atactacgct 4560

aagcataaga gaccagttgg tccattacac ggtttaccaa tctctttaaa ggaccaattg 4620

cgtgttaagg gttacgaaac ctccatgggt tacatttcct ggttaaacaa atacgatgaa 4680

ggtgattccg tcttaaccac catgttgaga aaagctggtg ctgttttcta cgttaagacc 4740

tctgtcccac aaaccttgat ggtctgtgaa accgtcaaca acatcattgg tagaactgtc 4800

aatccaagaa acaaaaattg gtcctgtggt ggttcttctg gtggtgaagg tgctattgtt 4860

ggtattagag gtggtgttat tggtgtcggt actgacattg gtggttccat tagagtccca 4920

gctgctttca actttttata cggtttgaga ccatctcacg gtagattgcc atatgctaaa 4980

atggctaact ctatggaagg tcaagaaacc gttcactccg tcgttggtcc tatcactcac 5040

tccgtcgaag acttgagatt gttcaccaaa tctgtcttgg gtcaagaacc ttggaagtac 5100

gactctaagg tcatccccat gccatggaga caatctgaat ctgacatcat tgcctctaag 5160

attaagaatg gtggtttgaa cattggttat tacaatttcg acggtaacgt cttgccacac 5220

ccaccaattt tacgtggtgt cgaaactacc gttgccgctt tggc 5264

<210> 18

<211> 5026

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 18

ggccgcgaag gtgctattgt tggtattaga ggtggtgtta ttggtgtcgg tactgacatt 60

ggtggttcca ttagagtccc agctgctttc aactttttat acggtttgag accatctcac 120

ggtagattgc catatgctaa aatggctaac tctatggaag gtcaagaaac cgttcactcc 180

gtcgttggtc ctatcactca ctccgtcgaa gacttgagat tgttcaccaa atctgtcttg 240

ggtcaagaac cttggaagta cgactctaag gtcatcccaa tgccatggag acaatctgaa 300

tctgacatca ttgcctctaa gattaagaat ggtggtttga acattggtta ttacaatttc 360

gacggtaacg tcttgccaca cccaccaatt ttacgtggtg tcgaaactac cgttgccgct 420

ttggccaagg ctggtcacac cgttactcca tggactccat acaagcatga tttcggtcat 480

gacttgattt cccacatcta tgctgctgat ggttctgccg acgtcatgag agacatttct 540

gcctctggtg agccagccat ccctaacatt aaggacttgt tgaacccaaa tattaaggct 600

gttaacatga acgaattgtg ggacactcat ttacaaaagt ggaactatca aatggaatac 660

ttggaaaagt ggcgtgaagc tgaagaaaaa gctggtaagg aattggacgc tattatcgct 720

ccaattactc ctaccgccgc tgtcagacac gatcaattca gatactacgg ttacgcctcc 780

gttattaact tattggattt cacctctgtt gtcgtcccag tcactttcgc tgataagaat 840

attgataaga agaacgaatc ttttaaagct gtttccgaat tggatgcttt ggttcaagaa 900

gaatacgacc cagaggctta tcacggtgct cctgttgctg ttcaagttat tggtagaaga 960

ttgtccgaag agagaacttt ggctatcgcc gaagaagtcg gtaaattgtt gggtaacgtc 1020

gtcactccat aagcgaattt cttatgattt atgattttta ttattaaata agttataaaa 1080

aaaataagtg tatacaaatt ttaaagtgac tcttaggttt taaaacgaaa attcttattc 1140

ttgagtaact ctttcctgta ggtcaggttg ctttctcagg tatagcatga ggtcgctctt 1200

attgaccaca cctctaccgg catgccgagc aaatgcctgc aaatcgctcc ccatttcacc 1260

caattgtaga tatgctaact ccagcaatga gttgatgaat ctcggtgtgt attttatgtc 1320

ctcagaggac aacacataac ttcgtataat gtatgctata cgaagttatc tcgagggcca 1380

gaaaaaggaa gtgtttccct ccttcttgaa ttgatgttac cctcataaag cacgtggcct 1440

cttatcgaga aagaaattac cgtcgctcgt gatttgtttg caaaaagaac aaaactgaaa 1500

aaacccagac acgctcgact tcctgtcttc ctgttgattg cagcttccaa tttcgtcaca 1560

caacaaggtc ctagcgacgg ctcacaggtt ttgtaacaag caatcgaagg ttctggaatg 1620

gcgggaaagg gtttagtacc acatgctatg atgcccactg tgatctccag agcaaagttc 1680

gttcgatcgt actgttactc tctctctttc aaacagaatt gtccgaatcg tgtgacaaca 1740

acagcctgtt ctcacacact cttttcttct aaccaagggg gtggtttagt ttagtagaac 1800

ctcgtgaaac ttacatttac atatatataa acttgcataa attggtcaat gcaagaaata 1860

catatttggt cttttctaat tcgtagtttt tcaagttctt agatgctttc tttttctctt 1920

ttttacagat catcaaggaa gtaattatct actttttaca agtctagaat gcagctgttc 1980

aacttgccat taaaggtttc attctttttg gtcctatcat actttagttt gttggtgtca 2040

gccgcatcta ttccatcttc agcatctgta caattagact cctacaatta cgacggctct 2100

acattcagcg gaaagattta cgtgaaaaat attgcgtaca gcaaaaaagt aactgttatc 2160

tatgccgacg gatcagataa ctggaacaac aatggaaaca ctatcgctgc cagttactct 2220

gcaccaattt caggttctaa ctacgaatat tggacattct cagcctccat caatggcatt 2280

aaggaattct acataaagta cgaagtttcc ggtaagactt actacgataa caacaattct 2340

gcaaactatc aagtatcaac atcaaaacct actaccacca ccgccacagc tacaactaca 2400

actgcacctt caacatctac cacaacccca ccatcttcta gcgaaccagc tacattccca 2460

actggcaatt ctactatttc tagttggatc aaaaaacaag agggtatttc cagattcgca 2520

atgttgagaa acataaatcc accaggatca gcaactggat tcatcgcagc ttctttgtcc 2580

acagcggggc cagattacta ctacgcatgg accagagatg ctgctttgac aagtaacgtt 2640

attgtttacg aatacaatac cactttgtcc ggtaacaaga ctattcttaa cgtcctaaag 2700

gattacgtta cattctctgt taagactcag tctacatcca cagtctgcaa ttgtttgggt 2760

gaaccaaagt tcaacccaga tggctctgga tacacaggtg cctggggtcg tccacaaaac 2820

gatgggcctg ccgagagagc cactacattt atcctatttg ctgactcata ccttacacaa 2880

acaaaagatg catcctacgt gactggaaca ttaaagcctg caatcttcaa agacctggat 2940

tacgttgtca acgtgtggtc taacggctgt ttcgatctat gggaagaggt taacggcgtg 3000

cacttctaca ctctaatggt catgagaaag ggtctgttgt taggtgcaga ttttgctaag 3060

agaaacggtg attctacacg tgcttctacc tactcctcaa cagcatcaac tattgcgaac 3120

aagatttctt cattttgggt ttcaagtaat aactggatac aagtatctca aagcgttaca 3180

gggggtgtct caaaaaaggg tcttgatgtt tctacattac tggctgctaa tcttgggtct 3240

gttgatgacg gtttcttcac ccctggttct gaaaagatcc tcgctaccgc cgtcgcggtt 3300

gaggatagtt ttgcttcact ctatcctata aacaaaaacc ttccttcata cttaggaaac 3360

agtatcggta gatacccaga ggatacatac aatggtaatg gcaattcaca gggaaatcca 3420

tggttccttg ctgttacagg gtacgcagaa ctttactata gagctattaa ggaatggatc 3480

ggcaacggcg gtgtgacagt ttcctcaatc tcattgccat ttttcaaaaa gtttgactcc 3540

agcgcgacat ctggtaaaaa gtatactgtg gggacttctg atttcaacaa tttggctcaa 3600

aacattgcct tagctgccga cagattctta tctaccgtac aactccatgc acataacaat 3660

ggtagtttgg cagaggaatt tgatagaact acaggactct ctacaggtgc gagagattta 3720

acttggtcac atgcaagttt aattacagcc tcttacgcaa aggctggtgc tcctgctgca 3780

taattaatta atttaccagc ttactatcct tcttgaaaat atgcactcta tatcttttag 3840

ttcttaattg caacacatag atttgctgta taacgaattt tatgctattt ttttaatttg 3900

gagttcggtg atgaaagtgt cacagcgaat ttcctcacat gtagggaccg aattgtttac 3960

aagttctctg taccaccatg gagacatcaa agattgaaaa tctatggaaa gatatggacg 4020

gtagcaacaa gaatatagca cgagccgcgg agttcatttc gttacttttg atatcgctca 4080

caactattgc gaagcgcttc agtgaaaaaa tcataaggaa aagttgtaaa tattattggt 4140

agtattcgtt tggtaaagta gagggggtaa tttttcccct ttattttgtt catacattct 4200

taaattgctt tgcctctcct tttggaaagc tatacttcgg agcactgttg agcgaaggct 4260

caggccggca gcacgcagca cgctgtattt acgtatttaa ttttatatat ttgtgcatac 4320

actactaggg aagacttgaa aaaaacctag gaaatgaaaa aacgacacag gaagtcccgt 4380

atttactatt ttttccttcc ttttgatggg gcagggcgga aatagaggat aggataagcc 4440

tactgcttag ctgtttccgt ctctacttcg gtagttgtct caattgtcgt ttcagtatta 4500

cctttagagc cgctagacga tggttgagct atttgttgag ggaaaactaa gttcatgtaa 4560

cacacgcata acccgattaa actcatgaat agcttgattg caggaggctg gtccattgga 4620

gatggtgcct tattttcctt ataggcaacg atgatgtctt cgtcggtgtt caggtagtag 4680

tgtacactct gaatcaggga gaaccaggca atgaacttgt tcctcaagaa aatagcggcc 4740

ataggcatgg attggttaac cacaccagat atgcttggtg tggcagaata tagtcctttt 4800

ggtggcgcaa ttttcttgta cctgtggtag aaagggagcg gttgaactgt tagtatatat 4860

tggcaatatc agcaaatttg aaagaaaatt gtcggtgaaa aacatacgaa acacaaaggt 4920

cgggccttgc aacgttattc aaagtcattg tttagttgag gaggtagcag cggagtatat 4980

gtattccttt tttttgccta tggatgttgt accatgccca ttctga 5026

<210> 19

<211> 4884

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 19

ctaaattcgg ccttgctcag agactcctgg attttggcta acaacgcagt cccttcgatg 60

catatagcta ggccacaaat tatgccaata acggtccatg ggttgatgtt ttcttgaatt 120

ctttcgtttt tcatgctatt tgcgtcttcc caagtcccag cgttccagta ttcatactgc 180

gcgttagagt ggtagccata agagccggca tattggtaat tttcagtatt aacgttagaa 240

cgtggtgaat acgatgtggt ccagccttgc ctcgttgtgt catatacgat ctttttcttt 300

gggtcacaaa gaatatcata tgcttgagag atgactttaa atctatgtag tttttcgctt 360

gatgttagca gcagcggtga tttactatca ctgttggtaa ccttttctga gctaaatatt 420

tgaatgttat cggaatggtc agggtggtac aattttacat aacgatgata tttttttttt 480

aacgacttct tgtccagttt aggatttcca gatccggcct ttggaatgcc aaaaatatca 540

tagggagttg gatctgccaa ctcaggccat tgttcatccc ttatcgtaag ttttctattg 600

ccatttttat cgttcgctgt agcatactta gctataaaag tgatttgtgg gggacacttt 660

tctacacatg ataagtgcca cttgaataaa aatgggtata cgaacttatg gtgtagcata 720

acaaatatat tgcaagtagt gacctatggt gtgtagatat acgtacagtt agttacgagc 780

ctaaagacac aacgtgtttg ttaattatac tgtcgctgta atatcttctc ttccattatc 840

accggtcatt ccttgcaggg gcggtagtac ccggagaccc tgaacttttc tttttttttt 900

tgcgaaatta aaaagttcat tttcaattcg acaatgagat ctacaagcca ttgttttatg 960

ttgatgagag ccagcttaaa gagttctcga gatctcccga gtttatcatt atcaatactg 1020

ccatttcaaa gaatacgtaa ataattaata gtagtgattt tcctaacttt atttagtcaa 1080

aaaattggcc ttttaattct gctgtaaccc gtacatgccc aaaatagggg gcgggttaca 1140

cagaatatat aacatcatag gtgtctgggt gaacagttta ttcctggcat ccactaaata 1200

taatggagcc cgcttttttt aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa 1260

tattgttttc ttcaccaacc atcagttcat aggtccattc tcttagcgca actacacaga 1320

acaggggcac aaacaggcaa aaaacgggca caacctcaat ggagtgatgc aacctgcttg 1380

gagtaaatga tgacacaagg caattgacct acgcatgtat ctatctcatt ttcttacacc 1440

ttctattacc ttctgctctc tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt 1500

tccctgaaat tattccccta tttgactaat aagtatataa agacggtagg tattgattgt 1560

aattctgtaa atctatttct taaacttctt aaattctact tttatagtta gtcttttttt 1620

tagtttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac aaatctagaa 1680

tgaaacttat gaatccatct atgaaggcat acgttttctt tatcttaagc tacttctctt 1740

tactcgttag ctcagctgcg gtgccaacct ctgccgccgt acaagttgag tcatacaatt 1800

atgacggtac cactttttca ggtagaatat tcgtcaaaaa cattgcctac tcaaaggtcg 1860

taacagttat ctactccgat ggatcagata actggaacaa taacaacaac aaagtttctg 1920

cagcttactc agaagcaatt tctgggtcta actacgaata ctggacattc tccgcaaagt 1980

tatccggaat taaacagttt tatgtcaaat acgaagtttc tggttcaaca tattacgaca 2040

acaacggtac caaaaactac caagtccaag caacctcagc gacatctaca acagctactg 2100

caaccacaac tacagctact ggcacaacaa ctacttctac aggtccaact agtactgcat 2160

ccgtatcatt ccctaccggt aactcaacaa tttcttcctg gataaaaaat caagaggaaa 2220

tcagccgttt tgctatgttg agaaatatca atccacctgg gtctgccaca gggttcatag 2280

ccgcatctct gtccacagcc ggcccagatt actattactc ttggactaga gattcagcac 2340

taacagctaa tgtgatcgct tacgaataca acacaacatt cactggaaac accacccttc 2400

ttaagtactt gaaagattac gttacatttt ctgtcaaaag ccaatctgta tctaccgttt 2460

gtaactgtct gggagaacca aagttcaacg ctgatggtag ttcttttaca ggtccatggg 2520

gcagaccaca aaacgacgga ccagcagaga gagctgttac ttttatgttg attgctgaca 2580

gctacttgac tcaaactaag gacgcatcct acgttaccgg tacattaaag ccagcaatct 2640

tcaaagatct tgattacgta gtttctgttt ggtctaacgg ttgctacgat ttatgggaag 2700

aggttaatgg tgttcatttc tatactctca tggtcatgag aaagggtttg atcttaggtg 2760

ccgacttcgc tgctagaaat ggtgactcta gtagagcttc aacctacaag caaactgcat 2820

caacaatgga atcaaagatc agttcttttt ggtcagattc taacaactac gtccaagttt 2880

ctcaatcagt taccgccgga gtgtcaaaaa agggactaga tgttagtaca ctattggcgg 2940

ccaacattgg tagtctgcct gatggctttt tcactccagg ctccgaaaag atattggcta 3000

cagcagtggc gttagaaaat gcattcgcat ccttgtaccc aattaactct aacctacctt 3060

cttacttggg taactcaatt ggaagatatc ctgaggatac atacaacggt aatggcaact 3120

ctcaggggaa tccatggttc cttgccgtca acgcatacgc agaactttac tacagagcta 3180

ttaaggaatg gattagtaat ggcaaggtga cagtatccaa tatctcacta cctttcttca 3240

aaaagtttga ttcttccgcc acttctggaa agacatacac tgctggtaca tcagatttca 3300

ataacttggc tcagaacatt gctttaggcg ccgatagatt cctgtctact gttaagttcc 3360

acgcatacac taacgggagt ctatcagaag agtacgatag atctaccggt atgagtactg 3420

gggctcgtga tttaacatgg tcccatgctt cattgatcac agtggcgtac gcaaaggccg 3480

gtagtcctgc agcttagtta attaaacagg ccccttttcc tttgtcgata tcatgtaatt 3540

agttatgtca cgcttacatt cacgccctcc tcccacatcc gctctaaccg aaaaggaagg 3600

agttagacaa cctgaagtct aggtccctat ttattttttt atagttatgt tagtattaag 3660

aacgttattt atatttcaaa tttttctttt ttttctgtac aaacgcgtgt acgcatgtaa 3720

cgggcagacg gccggccata acttcgtata atgtatgcta tacgaagtta tggcaacggt 3780

tcatcatctc atggatctgc acatgaacaa acaccagagt caaacgacgt tgaaattgag 3840

gctactgcgc caattgatga caatacagac gatgataaca aaccgaagtt atctgatgta 3900

gaaaaggatt agagatgcta agagatagtg atgatatttc ataaataatg taattctata 3960

tatgttaatt accttttttg cgaggcatat ttatggtgaa ggataagttt tgaccatcaa 4020

agaaggttaa tgtggctgtg gtttcagggt ccataaagct tttcaattca tctttttttt 4080

ttttgttctt ttttttgatt ccggtttctt tgaaattttt ttgattcggt aatctccgag 4140

cagaaggaag aacgaaggaa ggagcacaga cttagattgg tatatatacg catatgtggt 4200

gttgaagaaa catgaaattg cccagtattc ttaacccaac tgcacagaac aaaaacctgc 4260

aggaaacgaa gataaatcat gtcgaaagct acatataagg aacgtgctgc tactcatcct 4320

agtcctgttg ctgccaagct atttaatatc atgcacgaaa agcaaacaaa cttgtgtgct 4380

tcattggatg ttcgtaccac caaggaatta ctggagttag ttgaagcatt aggtcccaaa 4440

atttgtttac taaaaacaca tgtggatatc ttgactgatt tttccatgga gggcacagtt 4500

aagccgctaa aggcattatc cgccaagtac aattttttac tcttcgaaga cagaaaattt 4560

gctgacattg gtaatacagt caaattgcag tactctgcgg gtgtatacag aatagcagaa 4620

tgggcagaca ttacgaatgc acacggtgtg gtgggcccag gtattgttag cggtttgaag 4680

caggcggcgg aagaagtaac aaaggaacct agaggccttt tgatgttagc agaattgtca 4740

tgcaagggct ccctagctac tggagaatat actaagggta ctgttgacat tgcgaagagc 4800

gacaaagatt ttgttatcgg ctttattgct caaagagaca tgggtggaag agatgaaggt 4860

tacgattggt tgattatgac acgc 4884

<210> 20

<211> 1790

<212> DNA

<213> 酿酒酵母

<400> 20

ggaagagctc ctactgcgcc aattgatgac aatacagacg atgataacaa accgaagtta 60

tctgatgtag aaaaggatta gagatgctaa gagatagtga tgatatttca taaataatgt 120

aattctatat atgttaatta ccttttttgc gaggcatatt tatggtgaag gataagtttt 180

gaccatcaaa gaaggttaat gtggctgtgg tttcagggtc cataaagctt ttcaattcat 240

cttttttttt ttgttctttt ttttgattcc ggtttctttg aaattttttt gattcggtaa 300

tctccgagca gaaggaagaa cgaaggaagg agcacagact tagattggta tatatacgca 360

tatgtggtgt tgaagaaaca tgaaattgcc cagtattctt aacccaactg cacagaacaa 420

aaacctgcag gaaacgaaga taaatcatgt cgaaagctac atataaggaa cgtgctgcta 480

ctcatcctag tcctgttgct gccaagctat ttaatatcat gcacgaaaag caaacaaact 540

tgtgtgcttc attggatgtt cgtaccacca aggaattact ggagttagtt gaagcattag 600

gtcccaaaat ttgtttacta aaaacacatg tggatatctt gactgatttt tccatggagg 660

gcacagttaa gccgctaaag gcattatccg ccaagtacaa ttttttactc ttcgaagaca 720

gaaaatttgc tgacattggt aatacagtca aattgcagta ctctgcgggt gtatacagaa 780

tagcagaatg ggcagacatt acgaatgcgc acggtgtggt gggcccaggt attgttagcg 840

gtttgaagca ggcggcggaa gaagtaacaa aggaacctag aggccttttg atgttagcag 900

aattgtcatg caagggctcc ctagctactg gagaatatac taagggtact gttgacattg 960

cgaagagcga caaagatttt gttatcggct ttattgctca aagagacatg ggtggaagag 1020

atgaaggtta cgattggttg attatgacac ccggtgtggg tttagatgac aagggagacg 1080

cattgggtca acagtataga gccgtggatg atgtggtctc tacaggatct gacattatta 1140

ttgttggaag aggactattt gcaaagggaa gggatgctaa ggtagagggt gaacgttaca 1200

gaaaagcagg ctgggaagca tatttgagaa gatgcggcca gcaaaactaa aaaactgtat 1260

tataagtaaa tgcatgtata ctaaactcac aaattagagc ttcaatttaa ttatatcagt 1320

tattacccgg gaatctcggt cgtaatgatt tttataatga cgaaaaaaaa aaattggaaa 1380

gaaaaagctt catggccttt ataaaaagga accatccaat acctcgccag aaccaagtaa 1440

cagtatttta cggggcacaa atcaagaaca ataagacagg actgtaaaga tggacgcatt 1500

gaactccaaa gaacaacaag agttccaaaa agtagtggaa caaaagcaaa tgaaggattt 1560

catgcgtttg ataacttcgt ataatgtatg ctatacgaag ttatgcggcc gccagcacgc 1620

agcacgctgt atttacgtat ttaattttat atatttgtgc atacactact agggaagact 1680

tgaaaaaaac ctaggaaatg aaaaaacgac acaggaagtc ccgtatttac tattttttcc 1740

ttccttttga tggggcaggg cggaaataga ggataggata agcctactgc 1790

<210> 21

<211> 4474

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 21

gtgtttgtta attatactgt cgctgtaata tcttctcttc cattatcacc ggtcattcct 60

tgcaggggcg gtagtacccg gagaccctga acttttcttt ttttttttgc gaaattaaaa 120

agttcatttt caattcgaca atgagatcta caagccattg ttttatgttg atgagagcca 180

gcttaaagag ttctcgagat ctcccgagtt tatcattatc aatactgcca tttcaaagaa 240

tacgtaaata attaatagta gtgattttcc taactttatt tagtcaaaaa attggccttt 300

taattctgct gtaacccgta catgcccaaa atagggggcg ggttacacag aatatataac 360

atcataggtg tctgggtgaa cagtttattc ctggcatcca ctaaatataa tggagcccgc 420

tttttttaag ctggcatcca gaaaaaaaaa gaatcccagc accaaaatat tgttttcttc 480

accaaccatc agttcatagg tccattctct tagcgcaact acacagaaca ggggcacaaa 540

caggcaaaaa acgggcacaa cctcaatgga gtgatgcaac ctgcttggag taaatgatga 600

cacaaggcaa ttgacctacg catgtatcta tctcattttc ttacaccttc tattaccttc 660

tgctctctct gatttggaaa aagctgaaaa aaaaggttga aaccagttcc ctgaaattat 720

tcccctattt gactaataag tatataaaga cggtaggtat tgattgtaat tctgtaaatc 780

tatttcttaa acttcttaaa ttctactttt atagttagtc ttttttttag tttaaaacac 840

caagaactta gtttcgaata aacacacata aacaaacaaa tctagaatga aacttatgaa 900

tccatctatg aaggcatacg ttttctttat cttaagctac ttctctttac tcgttagctc 960

agctgcggtg ccaacctctg ccgccgtaca agttgagtca tacaattatg acggtaccac 1020

tttttcaggt agaatattcg tcaaaaacat tgcctactca aaggtcgtaa cagttatcta 1080

ctccgatgga tcagataact ggaacaataa caacaacaaa gtttctgcag cttactcaga 1140

agcaatttct gggtctaact acgaatactg gacattctcc gcaaagttat ccggaattaa 1200

acagttttat gtcaaatacg aagtttctgg ttcaacatat tacgacaaca acggtaccaa 1260

aaactaccaa gtccaagcaa cctcagcgac atctacaaca gctactgcaa ccacaactac 1320

agctactggc acaacaacta cttctacagg tccaactagt actgcatccg tatcattccc 1380

taccggtaac tcaacaattt cttcctggat aaaaaatcaa gaggaaatca gccgttttgc 1440

tatgttgaga aatatcaatc cacctgggtc tgccacaggg ttcatagccg catctctgtc 1500

cacagccggc ccagattact attactcttg gactagagat tcagcactaa cagctaatgt 1560

gatcgcttac gaatacaaca caacattcac tggaaacacc acccttctta agtacttgaa 1620

agattacgtt acattttctg tcaaaagcca atctgtatct accgtttgta actgtctggg 1680

agaaccaaag ttcaacgctg atggtagttc ttttacaggt ccatggggca gaccacaaaa 1740

cgacggacca gcagagagag ctgttacttt tatgttgatt gctgacagct acttgactca 1800

aactaaggac gcatcctacg ttaccggtac attaaagcca gcaatcttca aagatcttga 1860

ttacgtagtt tctgtttggt ctaacggttg ctacgattta tgggaagagg ttaatggtgt 1920

tcatttctat actctcatgg tcatgagaaa gggtttgatc ttaggtgccg acttcgctgc 1980

tagaaatggt gactctagta gagcttcaac ctacaagcaa actgcatcaa caatggaatc 2040

aaagatcagt tctttttggt cagattctaa caactacgtc caagtttctc aatcagttac 2100

cgccggagtg tcaaaaaagg gactagatgt tagtacacta ttggcggcca acattggtag 2160

tctgcctgat ggctttttca ctccaggctc cgaaaagata ttggctacag cagtggcgtt 2220

agaaaatgca ttcgcatcct tgtacccaat taactctaac ctaccttctt acttgggtaa 2280

ctcaattgga agatatcctg aggatacata caacggtaat ggcaactctc aggggaatcc 2340

atggttcctt gccgtcaacg catacgcaga actttactac agagctatta aggaatggat 2400

tagtaatggc aaggtgacag tatccaatat ctcactacct ttcttcaaaa agtttgattc 2460

ttccgccact tctggaaaga catacactgc tggtacatca gatttcaata acttggctca 2520

gaacattgct ttaggcgccg atagattcct gtctactgtt aagttccacg catacactaa 2580

cgggagtcta tcagaagagt acgatagatc taccggtatg agtactgggg ctcgtgattt 2640

aacatggtcc catgcttcat tgatcacagt ggcgtacgca aaggccggta gtcctgcagc 2700

ttagttaatt aaacaggccc cttttccttt gtcgatatca tgtaattagt tatgtcacgc 2760

ttacattcac gccctcctcc cacatccgct ctaaccgaaa aggaaggagt tagacaacct 2820

gaagtctagg tccctattta tttttttata gttatgttag tattaagaac gttatttata 2880

tttcaaattt ttcttttttt tctgtacaaa cgcgtgtacg catgtaacgg gcagacggcc 2940

ggccataact tcgtataatg tatgctatac gaagttatcc ttacatcaca cccaatcccc 3000

cacaagtgat cccccacaca ccatagcttc aaaatgtttc tactcctttt ttactcttcc 3060

agattttctc ggactccgcg catcgccgta ccacttcaaa acacccaagc acagcatact 3120

aaatttcccc tctttcttcc tctagggtgg cgttaattac ccgtactaaa ggtttggaaa 3180

agaaaaaaga gaccgcctcg tttctttttc ttcgtcgaaa aaggcaataa aaatttttat 3240

cacgtttctt tttcttgaaa aatttttttt ttgatttttt tctctttcga tgacctccca 3300

ttgatattta agttaataaa tggtcttcaa tttctcaagt ttcagtttcg tttttcttgt 3360

tctattacaa ctttttttac ttcttgctca ttagaaagaa agcatagcaa tctaatctaa 3420

gttttaatta caaaatgcca caatcctggg aagaattggc cgccgacaaa cgtgcccgtt 3480

tggctaaaac cattcctgac gaatggaagg ttcaaacttt gcctgccgaa gattccgtta 3540

ttgatttccc aaagaagtcc ggtattttgt ctgaggctga attgaagatt accgaagcct 3600

ctgctgctga tttggtctcc aagttggccg ctggtgagtt gacttctgtt gaagtcactt 3660

tggctttttg taagagagct gctattgctc aacaattaac caactgtgct cacgaattct 3720

tcccagatgc tgctttagct caagctagag aattagatga atactacgct aagcataaga 3780

gaccagttgg tccattacac ggtttaccaa tctctttaaa ggaccaattg cgtgttaagg 3840

gttacgaaac ctccatgggt tacatttcct ggttaaacaa atacgatgaa ggtgattccg 3900

tcttaaccac catgttgaga aaagctggtg ctgttttcta cgttaagacc tctgtcccac 3960

aaaccttgat ggtctgtgaa accgtcaaca acatcattgg tagaactgtc aatccaagaa 4020

acaaaaattg gtcctgtggt ggttcttctg gtggtgaagg tgctattgtt ggtattagag 4080

gtggtgttat tggtgtcggt actgacattg gtggttccat tagagtccca gctgctttca 4140

actttttata cggtttgaga ccatctcacg gtagattgcc atatgctaaa atggctaact 4200

ctatggaagg tcaagaaacc gttcactccg tcgttggtcc tatcactcac tccgtcgaag 4260

acttgagatt gttcaccaaa tctgtcttgg gtcaagaacc ttggaagtac gactctaagg 4320

tcatccccat gccatggaga caatctgaat ctgacatcat tgcctctaag attaagaatg 4380

gtggtttgaa cattggttat tacaatttcg acggtaacgt cttgccacac ccaccaattt 4440

tacgtggtgt cgaaactacc gttgccgctt tggc 4474

<210> 22

<211> 1878

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 22

gaagattacc gaagcctctg ctgctgattt ggtctccaag ttggccgctg gtgagttgac 60

ttctgttgaa gtcactttgg ctttttgtaa gagagctgct attgctcaac aattaaccaa 120

ctgtgctcac gaattcttcc cagatgctgc tttagctcaa gctagagaat tagatgaata 180

ctacgctaag cataagagac cagttggtcc attacacggt ttaccaatct ctttaaagga 240

ccaattgcgt gttaagggtt acgaaacctc catgggttac atttcctggt taaacaaata 300

cgatgaaggt gattccgtct taaccaccat gttgagaaaa gctggtgctg ttttctacgt 360

taagacctct gtcccacaaa ccttgatggt ctgtgaaacc gtcaacaaca tcattggtag 420

aactgtcaat ccaagaaaca aaaattggtc ctgtggtggt tcttctggtg gtgaaggtgc 480

tattgttggt attagaggtg gtgttattgg tgtcggtact gacattggtg gttccattag 540

agtcccagct gctttcaact ttttatacgg tttgagacca tctcacggta gattgccata 600

tgctaaaatg gctaactcta tggaaggtca agaaaccgtt cactccgtcg ttggtcctat 660

cactcactcc gtcgaagact tgagattgtt caccaaatct gtcttgggtc aagaaccttg 720

gaagtacgac tctaaggtca tcccaatgcc atggagacaa tctgaatctg acatcattgc 780

ctctaagatt aagaatggtg gtttgaacat tggttattac aatttcgacg gtaacgtctt 840

gccacaccca ccaattttac gtggtgtcga aactaccgtt gccgctttgg ccaaggctgg 900

tcacaccgtt actccatgga ctccatacaa gcatgatttc ggtcatgact tgatttccca 960

catctatgct gctgatggtt ctgccgacgt catgagagac atttctgcct ctggtgagcc 1020

agccatccct aacattaagg acttgttgaa cccaaatatt aaggctgtta acatgaacga 1080

attgtgggac actcatttac aaaagtggaa ctatcaaatg gaatacttgg aaaagtggcg 1140

tgaagctgaa gaaaaagctg gtaaggaatt ggacgctatt atcgctccaa ttactcctac 1200

cgccgctgtc agacacgatc aattcagata ctacggttac gcctccgtta ttaacttatt 1260

ggatttcacc tctgttgtcg tcccagtcac tttcgctgat aagaatattg ataagaagaa 1320

cgaatctttt aaagctgttt ccgaattgga tgctttggtt caagaagaat acgacccaga 1380

ggcttatcac ggtgctcctg ttgctgttca agttattggt agaagattgt ccgaagagag 1440

aactttggct atcgccgaag aagtcggtaa attgttgggt aacgtcgtca ctccataagg 1500

agattgataa gacttttcta gttgcatatc ttttatattt aaatcttatc tattagttaa 1560

ttttttgtaa tttatcctta tatatagtct ggttattcta aaatatcatt tcagtatcta 1620

aaaattcccc tcttttttca gttatatctt aacaggcgat aacttcgtat aatgtatgct 1680

atacgaagtt atgcggccgc cagcacgcag cacgctgtat ttacgtattt aattttatat 1740

atttgtgcat acactactag ggaagacttg aaaaaaacct aggaaatgaa aaaacgacac 1800

aggaagtccc gtatttacta ttttttcctt ccttttgatg gggcagggcg gaaatagagg 1860

ataggataag cctactgc 1878

<210> 23

<211> 3921

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 23

gcccgaaaga gttatcgtta ctccgattat tttgtacagc tgatgggacc ttgccgtctt 60

catttttttt tttttcacct atagagccgg gcagagctgc ccggctcaac taagggccgg 120

aaaaaaaacg gaaaaaagaa agccaagcgt gtagacgtag tataacagta tatctgacac 180

gcacgtgatg accacgtaat cgcatcgccc ctcacatctc acctctcacc gctgactcag 240

cttcactaaa aaggaaaata tatactcttt cccaggcaag gtgacagcgg tccccgtctc 300

ctccacaaag gcctctcctg gggtttgagc aagtctaagt ttacgtagca taaaaattct 360

cggattgcgt caaataataa aaaaagtaac tccacttcta cttctacatc ggaaaaacat 420

tccattcaca tatcgtcttt ggcctatctt gttttgtcct tggtagatca ggtcagtaca 480

aacgcaacac gctcgaggcc agaaaaagga agtgtttccc tccttcttga attgatgtta 540

ccctcataaa gcacgtggcc tcttatcgag aaagaaatta ccgtcgctcg tgatttgttt 600

gcaaaaagaa caaaactgaa aaaacccaga cacgctcgac ttcctgtctt cctattgatt 660

gcagcttcca atttcgtcac acaacaaggt cctagcgacg gctcacaggt tttgtaacaa 720

gcaatcgaag gttctggaat ggcgggaaag ggtttagtac cacatgctat gatgcccact 780

gtgatctcca gagcaaagtt cgttcgatcg tactgttact ctctctcttt caaacagaat 840

tgtccgaatc gtgtgacaac aacagcctgt tctcacacac tcttttcttc taaccaaggg 900

ggtggtttag tttagtagaa cctcgtgaaa cttacattta catatatata aacttgcata 960

aattggtcaa tgcaagaaat acatatttgg tcttttctaa ttcgtagttt ttcaagttct 1020

tagatgcttt ctttttctct tttttacaga tcatcaagga agtaattatc tactttttac 1080

aagtctagaa tgacaacatc aaatacctac aaattctatc taaacggtga atggagagaa 1140

tcttcctctg gagaaactat tgagatacca tcaccatact tacatgaagt gatcggacag 1200

gttcaagcaa tcactagagg agaggttgac gaagcgattg ctagcgctaa ggaagcacag 1260

aaatcttggg ctgaggcatc tctacaagat agagctaagt acttgtacaa atgggcagat 1320

gaattggtaa acatgcaaga cgaaatcgcc gatatcatca tgaaggaagt gggcaagggt 1380

tacaaagacg ctaaaaagga ggttgttaga accgccgatt tcatcagata caccattgaa 1440

gaggcactcc atatgcacgg tgaatccatg atgggcgatt catttcctgg tggaacaaaa 1500

tctaagctag caataatcca aagagcgcct ctgggtgtag tcttagccat cgctccattc 1560

aattaccctg taaacctttc tgctgcaaaa ttggcaccag ccttaattat gggtaacgct 1620

gtgatattca agccagcaac tcagggtgct atttccggca tcaaaatggt tgaagctttg 1680

cataaggctg gtttgccaaa gggtttggtt aacgttgcca caggtagagg tagcgtcata 1740

ggcgattatt tggtcgaaca cgaagggata aacatggttt ccttcaccgg tggcactaac 1800

actggtaagc atttagcaaa aaaggcctca atgattccat tagtcttgga acttggtggc 1860

aaagatccag gcatcgttcg tgaagatgca gacctacaag atgctgcgaa tcatatcgta 1920

tctggtgcgt tcagttactc agggcagaga tgtacagcca ttaagagagt ccttgttcat 1980

gaaaatgttg ctgatgaact ggtatcattg gttaaggaac aagtggcaaa gctttctgtg 2040

ggatcaccag agcaagattc aacaattgtt cctctgattg acgataagtc cgctgatttt 2100

gttcagggtt tagtggacga tgcagtcgaa aagggcgcta caattgtcat tgggaacaag 2160

agagaacgta acctaatcta cccaacattg attgatcacg tcacagagga aatgaaagtt 2220

gcctgggagg aaccattcgg tcctattctt ccaattatta gagttagtag cgacgagcaa 2280

gctattgaaa ttgcaaataa gagtgagttc ggattacaag cttctgtgtt taccaaagac 2340

ataaacaagg cattcgcaat cgcaaataag attgagactg gttcagtgca aatcaacggt 2400

agaacagaga gaggaccaga tcactttcct tttatcgggg ttaagggatc tgggatgggt 2460

gcccaaggca tcagaaagtc tttggaatct atgactagag aaaaagttac tgtcttaaat 2520

ctcgtatgat taaacaggcc ccttttcctt tgtcgatatc atgtaattag ttatgtcacg 2580

cttacattca cgccctcctc ccacatccgc tctaaccgaa aaggaaggag ttagacaacc 2640

tgaagtctag gtccctattt atttttttat agttatgtta gtattaagaa cgttatttat 2700

atttcaaatt tttctttttt ttctgtacaa acgcgtgtac gcatgtaacg ggcagacggc 2760

cggccataac ttcgtataat gtatgctata cgaagttatg gcaacggttc atcatctcat 2820

ggatctgcac atgaacaaac accagagtca aacgacgttg aaattgaggc tactgcgcca 2880

attgatgaca atacagacga tgataacaaa ccgaagttat ctgatgtaga aaaggattag 2940

agatgctaag agatagtgat gatatttcat aaataatgta attctatata tgttaattac 3000

cttttttgcg aggcatattt atggtgaagg ataagttttg accatcaaag aaggttaatg 3060

tggctgtggt ttcagggtcc ataaagcttt tcaattcatc tttttttttt ttgttctttt 3120

ttttgattcc ggtttctttg aaattttttt gattcggtaa tctccgagca gaaggaagaa 3180

cgaaggaagg agcacagact tagattggta tatatacgca tatgtggtgt tgaagaaaca 3240

tgaaattgcc cagtattctt aacccaactg cacagaacaa aaacctgcag gaaacgaaga 3300

taaatcatgt cgaaagctac atataaggaa cgtgctgcta ctcatcctag tcctgttgct 3360

gccaagctat ttaatatcat gcacgaaaag caaacaaact tgtgtgcttc attggatgtt 3420

cgtaccacca aggaattact ggagttagtt gaagcattag gtcccaaaat ttgtttacta 3480

aaaacacatg tggatatctt gactgatttt tccatggagg gcacagttaa gccgctaaag 3540

gcattatccg ccaagtacaa ttttttactc ttcgaagaca gaaaatttgc tgacattggt 3600

aatacagtca aattgcagta ctctgcgggt gtatacagaa tagcagaatg ggcagacatt 3660

acgaatgcac acggtgtggt gggcccaggt attgttagcg gtttgaagca ggcggcggaa 3720

gaagtaacaa aggaacctag aggccttttg atgttagcag aattgtcatg caagggctcc 3780

ctagctactg gagaatatac taagggtact gttgacattg cgaagagcga caaagatttt 3840

gttatcggct ttattgctca aagagacatg ggtggaagag atgaaggtta cgattggttg 3900

attatgacac gcggccgcgg c 3921

<210> 24

<211> 1130

<212> DNA

<213> 酿酒酵母

<400> 24

gctccatgga gggcacagtt aagccgctaa aggcattatc cgccaagtac aattttttac 60

tcttcgaaga cagaaaattt gctgacattg gtaatacagt caaattgcag tactctgcgg 120

gtgtatacag aatagcagaa tgggcagaca ttacgaatgc acacggtgtg gtgggcccag 180

gtattgttag cggtttgaag caggcggcgg aagaagtaac aaaggaacct agaggccttt 240

tgatgttagc agaattgtca tgcaagggct ccctagctac tggagaatat actaagggta 300

ctgttgacat tgcgaagagc gacaaagatt ttgttatcgg ctttattgct caaagagaca 360

tgggtggaag agatgaaggt tacgattggt tgattatgac acccggtgtg ggtttagatg 420

acaagggaga cgcattgggt caacagtata gaaccgtgga tgatgtggtc tctacaggat 480

ctgacattat tattgttgga agaggactat ttgcaaaggg aagggatgct aaggtagagg 540

gtgaacgtta cagaaaagca ggctgggaag catatttgag aagatgcggc cagcaaaact 600

aaaaaactgt attataagta aatgcatgta tactaaactc acaaattaga gcttcaattt 660

aattatatca gttattaccc gggaatctcg gtcgtaatga tttttataat gacgaaaaaa 720

aaaaaattgg aaagaaaaag cttcatggcc tttataaaaa ggaaccatcc aatacctcgc 780

cagaaccaag taacagtatt ttacggggca caaatcaaga acaataagac aggactgtaa 840

agatggacgc attgaactcc aaagaacaac aagagttcca aaaagtagtg gaacaaaagc 900

aaatgaagga tttcatgcgt ttgataactt cgtataatgt atgctatacg aagttatctc 960

gaggtacttt agaatatcta tattcaagta cgtggcgcgc atatgtttga gtgtgcacac 1020

aataaaggtt tttagatatt ttgcggcgtc ctaagaaaat aaggggtttc tagaaaaata 1080

acaatagcaa acaaagttcc ttacgatgat ttcagatgtg aacagcatgg 1130

<210> 25

<211> 4306

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 25

gcccgaaaga gttatcgtta ctccgattat tttgtacagc tgatgggacc ttgccgtctt 60

catttttttt tttttcacct atagagccgg gcagagctgc ccggctcaac taagggccgg 120

aaaaaaaacg gaaaaaagaa agccaagcgt gtagacgtag tataacagta tatctgacac 180

gcacgtgatg accacgtaat cgcatcgccc ctcacatctc acctctcacc gctgactcag 240

cttcactaaa aaggaaaata tatactcttt cccaggcaag gtgacagcgg tccccgtctc 300

ctccacaaag gcctctcctg gggtttgagc aagtctaagt ttacgtagca taaaaattct 360

cggattgcgt caaataataa aaaaagtaac tccacttcta cttctacatc ggaaaaacat 420

tccattcaca tatcgtcttt ggcctatctt gttttgtcct tggtagatca ggtcagtaca 480

aacgcaacac gcctcgaggc cagaaaaagg aagtgtttcc ctccttcttg aattgatgtt 540

accctcataa agcacgtggc ctcttatcga gaaagaaatt accgtcgctc gtgatttgtt 600

tgcaaaaaga acaaaactga aaaaacccag acacgctcga cttcctgtct tcctattgat 660

tgcagcttcc aatttcgtca cacaacaagg tcctagcgac ggctcacagg ttttgtaaca 720

agcaatcgaa ggttctggaa tggcgggaaa gggtttagta ccacatgcta tgatgcccac 780

tgtgatctcc agagcaaagt tcgttcgatc gtactgttac tctctctctt tcaaacagaa 840

ttgtccgaat cgtgtgacaa caacagcctg ttctcacaca ctcttttctt ctaaccaagg 900

gggtggttta gtttagtaga acctcgtgaa acttacattt acatatatat aaacttgcat 960

aaattggtca atgcaagaaa tacatatttg gtcttttcta attcgtagtt tttcaagttc 1020

ttagatgctt tctttttctc ttttttacag atcatcaagg aagtaattat ctacttttta 1080

caagtctaga atgacaacat caaataccta caaattctat ctaaacggtg aatggagaga 1140

atcttcctct ggagaaacta ttgagatacc atcaccatac ttacatgaag tgatcggaca 1200

ggttcaagca atcactagag gagaggttga cgaagcgatt gctagcgcta aggaagcaca 1260

gaaatcttgg gctgaggcat ctctacaaga tagagctaag tacttgtaca aatgggcaga 1320

tgaattggta aacatgcaag acgaaatcgc cgatatcatc atgaaggaag tgggcaaggg 1380

ttacaaagac gctaaaaagg aggttgttag aaccgccgat ttcatcagat acaccattga 1440

agaggcactc catatgcacg gtgaatccat gatgggcgat tcatttcctg gtggaacaaa 1500

atctaagcta gcaataatcc aaagagcgcc tctgggtgta gtcttagcca tcgctccatt 1560

caattaccct gtaaaccttt ctgctgcaaa attggcacca gccttaatta tgggtaacgc 1620

tgtgatattc aagccagcaa ctcagggtgc tatttccggc atcaaaatgg ttgaagcttt 1680

gcataaggct ggtttgccaa agggtttggt taacgttgcc acaggtagag gtagcgtcat 1740

aggcgattat ttggtcgaac acgaagggat aaacatggtt tccttcaccg gtggcactaa 1800

cactggtaag catttagcaa aaaaggcctc aatgattcca ttagtcttgg aacttggtgg 1860

caaagatcca ggcatcgttc gtgaagatgc agacctacaa gatgctgcga atcatatcgt 1920

atctggtgcg ttcagttact cagggcagag atgtacagcc attaagagag tccttgttca 1980

tgaaaatgtt gctgatgaac tggtatcatt ggttaaggaa caagtggcaa agctttctgt 2040

gggatcacca gagcaagatt caacaattgt tcctctgatt gacgataagt ccgctgattt 2100

tgttcagggt ttagtggacg atgcagtcga aaagggcgct acaattgtca ttgggaacaa 2160

gagagaacgt aacctaatct acccaacatt gattgatcac gtcacagagg aaatgaaagt 2220

tgcctgggag gaaccattcg gtcctattct tccaattatt agagttagta gcgacgagca 2280

agctattgaa attgcaaata agagtgagtt cggattacaa gcttctgtgt ttaccaaaga 2340

cataaacaag gcattcgcaa tcgcaaataa gattgagact ggttcagtgc aaatcaacgg 2400

tagaacagag agaggaccag atcactttcc ttttatcggg gttaagggat ctgggatggg 2460

tgcccaaggc atcagaaagt ctttggaatc tatgactaga gaaaaagtta ctgtcttaaa 2520

tctcgtatga ttaaacaggc cccttttcct ttgtcgatat catgtaatta gttatgtcac 2580

gcttacattc acgccctcct cccacatccg ctctaaccga aaaggaagga gttagacaac 2640

ctgaagtcta ggtccctatt tattttttta tagttatgtt agtattaaga acgttattta 2700

tatttcaaat ttttcttttt tttctgtaca aacgcgtgta cgcatgtaac gggcagacgg 2760

ccggccataa cttcgtataa tgtatgctat acgaagttat ccttacatca cacccaatcc 2820

cccacaagtg atcccccaca caccatagct tcaaaatgtt tctactcctt ttttactctt 2880

ccagattttc tcggactccg cgcatcgccg taccacttca aaacacccaa gcacagcata 2940

ctaaatttcc cctctttctt cctctagggt ggcgttaatt acccgtacta aaggtttgga 3000

aaagaaaaaa gagaccgcct cgtttctttt tcttcgtcga aaaaggcaat aaaaattttt 3060

atcacgtttc tttttcttga aaaatttttt ttttgatttt tttctctttc gatgacctcc 3120

cattgatatt taagttaata aatggtcttc aatttctcaa gtttcagttt cgtttttctt 3180

gttctattac aacttttttt acttcttgct cattagaaag aaagcatagc aatctaatct 3240

aagttttaat tacaaaatgc cacaatcctg ggaagaattg gccgccgaca aacgtgcccg 3300

tttggctaaa accattcctg acgaatggaa ggttcaaact ttgcctgccg aagattccgt 3360

tattgatttc ccaaagaagt ccggtatttt gtctgaggct gaattgaaga ttaccgaagc 3420

ctctgctgct gatttggtct ccaagttggc cgctggtgag ttgacttctg ttgaagtcac 3480

tttggctttt tgtaagagag ctgctattgc tcaacaatta accaactgtg ctcacgaatt 3540

cttcccagat gctgctttag ctcaagctag agaattagat gaatactacg ctaagcataa 3600

gagaccagtt ggtccattac acggtttacc aatctcttta aaggaccaat tgcgtgttaa 3660

gggttacgaa acctccatgg gttacatttc ctggttaaac aaatacgatg aaggtgattc 3720

cgtcttaacc accatgttga gaaaagctgg tgctgttttc tacgttaaga cctctgtccc 3780

acaaaccttg atggtctgtg aaaccgtcaa caacatcatt ggtagaactg tcaatccaag 3840

aaacaaaaat tggtcctgtg gtggttcttc tggtggtgaa ggtgctattg ttggtattag 3900

aggtggtgtt attggtgtcg gtactgacat tggtggttcc attagagtcc cagctgcttt 3960

caacttttta tacggtttga gaccatctca cggtagattg ccatatgcta aaatggctaa 4020

ctctatggaa ggtcaagaaa ccgttcactc cgtcgttggt cctatcactc actccgtcga 4080

agacttgaga ttgttcacca aatctgtctt gggtcaagaa ccttggaagt acgactctaa 4140

ggtcatcccc atgccatgga gacaatctga atctgacatc attgcctcta agattaagaa 4200

tggtggtttg aacattggtt attacaattt cgacggtaac gtcttgccac acccaccaat 4260

tttacgtggt gtcgaaacta ccgttgccgc tttggcggcc gcggca 4306

<210> 26

<211> 1366

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 26

agaggtggtg ttattggtgt cggtactgac attggtggtt ccattagagt cccagctgct 60

ttcaactttt tatacggttt gagaccatct cacggtagat tgccatatgc taaaatggct 120

aactctatgg aaggtcaaga aaccgttcac tccgtcgttg gtcctatcac tcactccgtc 180

gaagacttga gattgttcac caaatctgtc ttgggtcaag aaccttggaa gtacgactct 240

aaggtcatcc ccatgccatg gagacaatct gaatctgaca tcattgcctc taagattaag 300

aatggtggtt tgaacattgg ttattacaat ttcgacggta acgtcttgcc acacccacca 360

attttacgtg gtgtcgaaac taccgttgcc gctttggcca aggctggtca caccgttact 420

ccatggactc catacaagca tgatttctgt catgacttga tttcccacat ctatgctgct 480

gatggttctg ccgacgtcat gagagacatt tctgcctctg gtgagccagc catccctaac 540

attaaggact tgttgaaccc aaatattaag gctgttaaca tgaacgaatt gtgggacact 600

catttacaaa agtggaacta tcaaatggaa tacttggaaa agtggcgtga agctgaagaa 660

aaagctggta aggaattgga cgctattatc gctccaatta ctcctaccgt cgctgtcaga 720

cacgatcaat tcagatacta cggttacgcc tccgttatta gcttattgga tttcacctct 780

gttgtcgtcc cagtcacttt cgctgataag aatattgata agaagaacga atcttttaaa 840

gctgtttccg aattggatgc tttggttcaa gaagaatacg acccagaggc ttatcacggt 900

gctcctgttg ctgttcaagt tattggtaga agattgtccg aagagagaac tttggctatc 960

gccgaagaag tcggtaaatt gttgggtaac gtcgtcactc cataaggaga ttgataagac 1020

ttttctagtt gcatatcttt tatatttaaa tcttatctat tagttaattt tttgtaattt 1080

atccttatat atagtctggt tattctaaaa tatcatttca gtatctaaaa attcccctct 1140

tttttcagtt atatcttaac aggcgataac ttcgtataat gtatgctata cgaagttatg 1200

tactttagaa tatctatatt caagtacgtg gcgcgcatat gtttgagtgt gcacacaata 1260

aaggttttta gatattttgc ggcgtcctaa gaaaataagg ggtttctaga aaaataacaa 1320

tagcaaacaa agttccttac gatgatttca gatgtgaaca gcatgg 1366

<210> 27

<211> 2447

<212> DNA

<213> 酿酒酵母

<400> 27

ctatggaata atacaatgca cacaaacaaa aggtaacatt tgaaaaatgg agtagagaat 60

atattccatt cccctaattt tttgcgggtc ttccagggct gcgaacccat cgctcaaaac 120

aagcgcagtg tcaattaaga catcattgaa ctaaaacgga aaatttgctt gcgccacaca 180

ccctggtcaa tcgtaccaag ggatatcact ctgtacgggt gggaggaagg cgcggcaatt 240

agaatgtgtg ggtgcggaag ctcgccgctc ccatcaagag agtggaagac gtatggtctg 300

ggtgcgaagt accaccacgt ttctttttca tctcttaagt gggattctta cgaaacacgt 360

cacagggtca aaagaaagag aacaaaagca atattgtaat tgtctcagtc cacggcaatg 420

acatggcatg gccccgaagg ctttttttgt ctgtcttcct tgggtcttac cccgccacgc 480

gttaatagtg agacaagcaa taacttcgta tagcatacat tatacgaagt tatcggagac 540

aatcatatgg gagaagcaat tggaagatag aaaaaaggta ctcggtacat aaatatatgt 600

aattctgggt agaagatcgg tctgcattgg atggtggtaa cgcatttttt tacacacatt 660

acttgcctcg agcatcaaat ggtggttatt cgtggatcta tatcacgtga tttgcttaag 720

aattgtcgtt catggtgaca cttttagctt tgacatgatt aagctcatct caattgatgt 780

tatctaaagt catttcaact atctaagatg tggttgtgat tgggccattt tgtgaaagcc 840

agtacgccag cgtcaataca ctcccgtcaa ttagttgcac catgtccaca aaatcatata 900

ccagtagagc tgagactcat gcaagtccgg ttgcatcgaa acttttacgt ttaatggatg 960

aaaagaagac caatttgtgt gcttctcttg acgttcgttc gactgatgag ctattgaaac 1020

tagttgaaac gttgggtcca tacatttgcc ttttgaaaac acacgttgat atcttggatg 1080

atttcagtta tgagggtact gtcgttccat tgaaagcatt ggcagagaaa tacaagttct 1140

tgatatttga ggacagaaaa ttcgccgata tcggtaacac agtcaaatta caatatacat 1200

cgggcgttta ccgtatcgca gaatggtctg atatcaccaa cgcccacggg gttactggtg 1260

ctggtattgt tgctggcttg aaacaaggtg cgcaagaggt caccaaagaa ccaaggggat 1320

tattgatgct tgctgaattg tcttccaagg gttctctagc acacggtgaa tatactaagg 1380

gtaccgttga tattgcaaag agtgataaag atttcgttat tgggttcatt gctcagaacg 1440

atatgggagg cagagaagaa gggtttgatt ggctaatcat gaccccaggt gtaggtttag 1500

acgacaaagg cgatgcattg ggtcagcagt acagaaccgt cgacgaagtt gtaagtggtg 1560

gatcagatat catcattgtt ggcagaggac ttttcgccaa gggtagagat cctaaggttg 1620

aaggtgaaag atacagaaat gctggatggg aagcgtacca aaagagaatc agcgctcccc 1680

attaattata caggaaactt aatagaacaa atcacatatt taatctaata gccacctgca 1740

ttggcacggt gcaacactac ttcaacttca tcctacaaaa agatcacgtg atctgttgta 1800

ttgaactgaa aattttttgt ttgcttctct ctctctcttt cattatgtga gatttaaaaa 1860

ccagaaacta catcatcgaa aaagaataac ttcgtatagc atacattata cgaagttata 1920

ctggccgtcg ttttacaacc ggccgctact agtaacaaaa aacccctagc cccccgtttc 1980

gacgagaagt tagagtaatt ataaaaggaa tgcttattta aatttatttc ttagacttct 2040

tttcagactt cttagcagcc tcagtttgtt ccttaacgac cttcttaaca atcttttgtt 2100

cttcaatcaa gaaagctctg acgattcttt ccttgacaca gttggcacat ctggaaccac 2160

cgtaagctct ggaaacagtc ttgtgggtct tggagacagt agcgtattgt cttggtctca 2220

aagtggaaat accttgtaga gcactaccac agtcaccaca ctttggtcta gtagccaact 2280

tcttaacgtg ttgggcacgc aagataccac ctggggtctt aacaaccttg attttgttag 2340

aacgggtgtt gtctgtacgt agtaaagaga aaattttccc attaatgtta gtaatcactt 2400

ctttattatc ctatgattta agaacttgag tgggattgct ccatatg 2447

<210> 28

<211> 4158

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 28

tgagctccgg gtgggaggaa ggcgcggcaa ttagaatgtg tgggtgcgga agctcgccgc 60

tcccatcaag agagtggaag acgtatggtc tgggtgcgaa gtaccaccac gtttcttttt 120

catctcttaa gtgggattct tacgaaacac gtcacagggt caaaagaaag agaacaaaag 180

caatattgta attgtctcag tccacggcaa tgacatggca tggccccgaa ggcttttttt 240

gtctgtcttc cttgggtctt accccgccac gcgttaatag tgagacaagc aggaaatccg 300

tatcattttc tcgcatacac gaacccgcgt gcgcctggta aattgcagga ttctcattgt 360

ccggttttct ttatgggaat aatcatcatc accattatca ctgttactct tgcgatcatc 420

atcattaaca taattttttt aacgctgttt gatgatggta tgtgctttta ttgttcctta 480

ctcacctttt cctttgtgtc ttttaatttt gaccattttg accattttga cctttgatga 540

tgtgtgagtt cctcttttct ttttttcttt tcttttttcc tttttttttc ttttcttact 600

gtgttaatca ctttctttcc tttttgttca tattgtcgtc ttgttcattt tcgttcaatt 660

gataatgtat ataaatcttt cgtaagtatc tcttgattgc catttttttc tttccaagtt 720

tccttgttct cgaggccaga aaaaggaagt gtttccctcc ttcttgaatt gatgttaccc 780

tcataaagca cgtggcctct tatcgagaaa gaaattaccg tcgctcgtga tttgtttgca 840

aaaagaacaa aactgaaaaa acccagacac gctcgacttc ctgtcttcct attgattgca 900

gcttccaatt tcgtcacaca acaaggtcct agcgacggct cacaggtttt gtaacaagca 960

atcgaaggtt ctggaatggc gggaaagggt ttagtaccac atgctatgat gcccactgtg 1020

atctccagag caaagttcgt tcgatcgtac tgttactctc tctctttcaa acagaattgt 1080

ccgaatcgtg tgacaacaac agcctgttct cacacactct tttcttctaa ccaagggggt 1140

ggtttagttt agtagaacct cgtgaaactt acatttacat atatataaac ttgcataaat 1200

tggtcaatgc aagaaataca tatttggtct tttctaattc gtagtttttc aagttcttag 1260

atgctttctt tttctctttt ttacagatca tcaaggaagt aattatctac tttttacaag 1320

tctagaatga caacatcaaa tacctacaaa ttctatctaa acggtgaatg gagagaatct 1380

tcctctggag aaactattga gataccatca ccatacttac atgaagtgat cggacaggtt 1440

caagcaatca ctagaggaga ggttgacgaa gcgattgcta gcgctaagga agcacagaaa 1500

tcttgggctg aggcatctct acaagataga gctaagtact tgtacaaatg ggcagatgaa 1560

ttggtaaaca tgcaagacga aatcgccgat atcatcatga aggaagtggg caagggttac 1620

aaagacgcta aaaaggaggt tgttagaacc gccgatttca tcagatacac cattgaagag 1680

gcactccata tgcacggtga atccatgatg ggcgattcat ttcctggtgg aacaaaatct 1740

aagctagcaa taatccaaag agcgcctctg ggtgtagtct tagccatcgc tccattcaat 1800

taccctgtaa acctttctgc tgcaaaattg gcaccagcct taattatggg taacgctgtg 1860

atattcaagc cagcaactca gggtgctatt tccggcatca aaatggttga agctttgcat 1920

aaggctggtt tgccaaaggg tttggttaac gttgccacag gtagaggtag cgtcataggc 1980

gattatttgg tcgaacacga agggataaac atggtttcct tcaccggtgg cactaacact 2040

ggtaagcatt tagcaaaaaa ggcctcaatg attccattag tcttggaact tggtggcaaa 2100

gatccaggca tcgttcgtga agatgcagac ctacaagatg ctgcgaatca tatcgtatct 2160

ggtgcgttca gttactcagg gcagagatgt acagccatta agagagtcct tgttcatgaa 2220

aatgttgctg atgaactggt atcattggtt aaggaacaag tggcaaagct ttctgtggga 2280

tcaccagagc aagattcaac aattgttcct ctgattgacg ataagtccgc tgattttgtt 2340

cagggtttag tggacgatgc agtcgaaaag ggcgctacaa ttgtcattgg gaacaagaga 2400

gaacgtaacc taatctaccc aacattgatt gatcacgtca cagaggaaat gaaagttgcc 2460

tgggaggaac cattcggtcc tattcttcca attattagag ttagtagcga cgagcaagct 2520

attgaaattg caaataagag tgagttcgga ttacaagctt ctgtgtttac caaagacata 2580

aacaaggcat tcgcaatcgc aaataagatt gagactggtt cagtgcaaat caacggtaga 2640

acagagagag gaccagatca ctttcctttt atcggggtta agggatctgg gatgggtgcc 2700

caaggcatca gaaagtcttt ggaatctatg actagagaaa aagttactgt cttaaatctc 2760

gtatgattaa acaggcccct tttcctttgt cgatatcatg taattagtta tgtcacgctt 2820

acattcacgc cctcctccca catccgctct aaccgaaaag gaaggagtta gacaacctga 2880

agtctaggtc cctatttatt tttttatagt tatgttagta ttaagaacgt tatttatatt 2940

tcaaattttt cttttttttc tgtacaaacg cgtgtacgca tgtaacgggc agacggccgg 3000

ccataacttc gtataatgta tgctatacga agttatggca acggttcatc atctcatgga 3060

tctgcacatg aacaaacacc agagtcaaac gacgttgaaa ttgaggctac tgcgccaatt 3120

gatgacaata cagacgatga taacaaaccg aagttatctg atgtagaaaa ggattagaga 3180

tgctaagaga tagtgatgat atttcataaa taatgtaatt ctatatatgt taattacctt 3240

ttttgcgagg catatttatg gtgaaggata agttttgacc atcaaagaag gttaatgtgg 3300

ctgtggtttc agggtccata aagcttttca attcatcttt tttttttttg ttcttttttt 3360

tgattccggt ttctttgaaa tttttttgat tcggtaatct ccgagcagaa ggaagaacga 3420

aggaaggagc acagacttag attggtatat atacgcatat gtggtgttga agaaacatga 3480

aattgcccag tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa 3540

atcatgtcga aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc 3600

aagctattta atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt 3660

accaccaagg aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa 3720

acacatgtgg atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca 3780

ttatccgcca agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat 3840

acagtcaaat tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg 3900

aatgcacacg gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcggaagaa 3960

gtaacaaagg aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta 4020

gctactggag aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt 4080

atcggcttta ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt 4140

atgacacgcg gccgcggc 4158

<210> 29

<211> 1127

<212> DNA

<213> 酿酒酵母

<400> 29

gctccatgga gggcacagtt aagccgctaa aggcattatc cgccaagtac aattttttac 60

tcttcgaaga cagaaaattt gctgacattg gtaatacagt caaattgcag tactctgcgg 120

gtgtatacag aatagcagaa tgggcagaca ttacgaatgc acacggtgtg gtgggcccag 180

gtattgttag cggtttgaag caggcggcgg aagaagtaac aaaggaacct agaggccttt 240

tgatgttagc agaattgtca tgcaagggct ccctagctac tggagaatat actaagggta 300

ctgttgacat tgcgaagagc gacaaagatt ttgttatcgg ctttattgct caaagagaca 360

tgggtggaag agatgaaggt tacgattggt tgattatgac acccggtgtg ggtttagatg 420

acaagggaga cgcattgggt caacagtata gaaccgtgga tgatgtggtc tctacaggat 480

ctgacattat tattgttgga agaggactat ttgcaaaggg aagggatgct aaggtagagg 540

gtgaacgtta cagaaaagca ggctgggaag catatttgag aagatgcggc cagcaaaact 600

aaaaaactgt attataagta aatgcatgta tactaaactc acaaattaga gcttcaattt 660

aattatatca gttattaccc gggaatctcg gtcgtaatga tttttataat gacgaaaaaa 720

aaaaaattgg aaagaaaaag cttcatggcc tttataaaaa ggaaccatcc aatacctcgc 780

cagaaccaag taacagtatt ttacggggca caaatcaaga acaataagac aggactgtaa 840

agatggacgc attgaactcc aaagaacaac aagagttcca aaaagtagtg gaacaaaagc 900

aaatgaagga tttcatgcgt ttgataactt cgtataatgt atgctatacg aagttatctc 960

gaggataaaa ctactacgct aaaaataaaa taaaaatgta tgatttccct ccatttccga 1020

ccaattgtat aattttatat ctgcatgact taataatata atataatact tataaaatac 1080

gaatagaaaa atttaaaccg atgtaatgca tccttttctt tgttgtc 1127

<210> 30

<211> 4542

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 30

tgagctccgg gtgggaggaa ggcgcggcaa ttagaatgtg tgggtgcgga agctcgccgc 60

tcccatcaag agagtggaag acgtatggtc tgggtgcgaa gtaccaccac gtttcttttt 120

catctcttaa gtgggattct tacgaaacac gtcacagggt caaaagaaag agaacaaaag 180

caatattgta attgtctcag tccacggcaa tgacatggca tggccccgaa ggcttttttt 240

gtctgtcttc cttgggtctt accccgccac gcgttaatag tgagacaagc aggaaatccg 300

tatcattttc tcgcatacac gaacccgcgt gcgcctggta aattgcagga ttctcattgt 360

ccggttttct ttatgggaat aatcatcatc accattatca ctgttactct tgcgatcatc 420

atcattaaca taattttttt aacgctgttt gatgatggta tgtgctttta ttgttcctta 480

ctcacctttt cctttgtgtc ttttaatttt gaccattttg accattttga cctttgatga 540

tgtgtgagtt cctcttttct ttttttcttt tcttttttcc tttttttttc ttttcttact 600

gtgttaatca ctttctttcc tttttgttca tattgtcgtc ttgttcattt tcgttcaatt 660

gataatgtat ataaatcttt cgtaagtatc tcttgattgc catttttttc tttccaagtt 720

tccttgttct cgaggccaga aaaaggaagt gtttccctcc ttcttgaatt gatgttaccc 780

tcataaagca cgtggcctct tatcgagaaa gaaattaccg tcgctcgtga tttgtttgca 840

aaaagaacaa aactgaaaaa acccagacac gctcgacttc ctgtcttcct attgattgca 900

gcttccaatt tcgtcacaca acaaggtcct agcgacggct cacaggtttt gtaacaagca 960

atcgaaggtt ctggaatggc gggaaagggt ttagtaccac atgctatgat gcccactgtg 1020

atctccagag caaagttcgt tcgatcgtac tgttactctc tctctttcaa acagaattgt 1080

ccgaatcgtg tgacaacaac agcctgttct cacacactct tttcttctaa ccaagggggt 1140

ggtttagttt agtagaacct cgtgaaactt acatttacat atatataaac ttgcataaat 1200

tggtcaatgc aagaaataca tatttggtct tttctaattc gtagtttttc aagttcttag 1260

atgctttctt tttctctttt ttacagatca tcaaggaagt aattatctac tttttacaag 1320

tctagaatga caacatcaaa tacctacaaa ttctatctaa acggtgaatg gagagaatct 1380

tcctctggag aaactattga gataccatca ccatacttac atgaagtgat cggacaggtt 1440

caagcaatca ctagaggaga ggttgacgaa gcgattgcta gcgctaagga agcacagaaa 1500

tcttgggctg aggcatctct acaagataga gctaagtact tgtacaaatg ggcagatgaa 1560

ttggtaaaca tgcaagacga aatcgccgat atcatcatga aggaagtggg caagggttac 1620

aaagacgcta aaaaggaggt tgttagaacc gccgatttca tcagatacac cattgaagag 1680

gcactccata tgcacggtga atccatgatg ggcgattcat ttcctggtgg aacaaaatct 1740

aagctagcaa taatccaaag agcgcctctg ggtgtagtct tagccatcgc tccattcaat 1800

taccctgtaa acctttctgc tgcaaaattg gcaccagcct taattatggg taacgctgtg 1860

atattcaagc cagcaactca gggtgctatt tccggcatca aaatggttga agctttgcat 1920

aaggctggtt tgccaaaggg tttggttaac gttgccacag gtagaggtag cgtcataggc 1980

gattatttgg tcgaacacga agggataaac atggtttcct tcaccggtgg cactaacact 2040

ggtaagcatt tagcaaaaaa ggcctcaatg attccattag tcttggaact tggtggcaaa 2100

gatccaggca tcgttcgtga agatgcagac ctacaagatg ctgcgaatca tatcgtatct 2160

ggtgcgttca gttactcagg gcagagatgt acagccatta agagagtcct tgttcatgaa 2220

aatgttgctg atgaactggt atcattggtt aaggaacaag tggcaaagct ttctgtggga 2280

tcaccagagc aagattcaac aattgttcct ctgattgacg ataagtccgc tgattttgtt 2340

cagggtttag tggacgatgc agtcgaaaag ggcgctacaa ttgtcattgg gaacaagaga 2400

gaacgtaacc taatctaccc aacattgatt gatcacgtca cagaggaaat gaaagttgcc 2460

tgggaggaac cattcggtcc tattcttcca attattagag ttagtagcga cgagcaagct 2520

attgaaattg caaataagag tgagttcgga ttacaagctt ctgtgtttac caaagacata 2580

aacaaggcat tcgcaatcgc aaataagatt gagactggtt cagtgcaaat caacggtaga 2640

acagagagag gaccagatca ctttcctttt atcggggtta agggatctgg gatgggtgcc 2700

caaggcatca gaaagtcttt ggaatctatg actagagaaa aagttactgt cttaaatctc 2760

gtatgattaa acaggcccct tttcctttgt cgatatcatg taattagtta tgtcacgctt 2820

acattcacgc cctcctccca catccgctct aaccgaaaag gaaggagtta gacaacctga 2880

agtctaggtc cctatttatt tttttatagt tatgttagta ttaagaacgt tatttatatt 2940

tcaaattttt cttttttttc tgtacaaacg cgtgtacgca tgtaacgggc agacggccgg 3000

ccataacttc gtataatgta tgctatacga agttatcctt acatcacacc caatccccca 3060

caagtgatcc cccacacacc atagcttcaa aatgtttcta ctcctttttt actcttccag 3120

attttctcgg actccgcgca tcgccgtacc acttcaaaac acccaagcac agcatactaa 3180

atttcccctc tttcttcctc tagggtggcg ttaattaccc gtactaaagg tttggaaaag 3240

aaaaaagaga ccgcctcgtt tctttttctt cgtcgaaaaa ggcaataaaa atttttatca 3300

cgtttctttt tcttgaaaaa tttttttttt gatttttttc tctttcgatg acctcccatt 3360

gatatttaag ttaataaatg gtcttcaatt tctcaagttt cagtttcgtt tttcttgttc 3420

tattacaact ttttttactt cttgctcatt agaaagaaag catagcaatc taatctaagt 3480

tttaattaca aaatgccaca atcctgggaa gaattggccg ccgacaaacg tgcccgtttg 3540

gctaaaacca ttcctgacga atggaaggtt caaactttgc ctgccgaaga ttccgttatt 3600

gatttcccaa agaagtccgg tattttgtct gaggctgaat tgaagattac cgaagcctct 3660

gctgctgatt tggtctccaa gttggccgct ggtgagttga cttctgttga agtcactttg 3720

gctttttgta agagagctgc tattgctcaa caattaacca actgtgctca cgaattcttc 3780

ccagatgctg ctttagctca agctagagaa ttagatgaat actacgctaa gcataagaga 3840

ccagttggtc cattacacgg tttaccaatc tctttaaagg accaattgcg tgttaagggt 3900

tacgaaacct ccatgggtta catttcctgg ttaaacaaat acgatgaagg tgattccgtc 3960

ttaaccacca tgttgagaaa agctggtgct gttttctacg ttaagacctc tgtcccacaa 4020

accttgatgg tctgtgaaac cgtcaacaac atcattggta gaactgtcaa tccaagaaac 4080

aaaaattggt cctgtggtgg ttcttctggt ggtgaaggtg ctattgttgg tattagaggt 4140

ggtgttattg gtgtcggtac tgacattggt ggttccatta gagtcccagc tgctttcaac 4200

tttttatacg gtttgagacc atctcacggt agattgccat atgctaaaat ggctaactct 4260

atggaaggtc aagaaaccgt tcactccgtc gttggtccta tcactcactc cgtcgaagac 4320

ttgagattgt tcaccaaatc tgtcttgggt caagaacctt ggaagtacga ctctaaggtc 4380

atccccatgc catggagaca atctgaatct gacatcattg cctctaagat taagaatggt 4440

ggtttgaaca ttggttatta caatttcgac ggtaacgtct tgccacaccc accaatttta 4500

cgtggtgtcg aaactaccgt tgccgctttg gcggccgcgg ca 4542

<210> 31

<211> 1363

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 31

agaggtggtg ttattggtgt cggtactgac attggtggtt ccattagagt cccagctgct 60

ttcaactttt tatacggttt gagaccatct cacggtagat tgccatatgc taaaatggct 120

aactctatgg aaggtcaaga aaccgttcac tccgtcgttg gtcctatcac tcactccgtc 180

gaagacttga gattgttcac caaatctgtc ttgggtcaag aaccttggaa gtacgactct 240

aaggtcatcc ccatgccatg gagacaatct gaatctgaca tcattgcctc taagattaag 300

aatggtggtt tgaacattgg ttattacaat ttcgacggta acgtcttgcc acacccacca 360

attttacgtg gtgtcgaaac taccgttgcc gctttggcca aggctggtca caccgttact 420

ccatggactc catacaagca tgatttctgt catgacttga tttcccacat ctatgctgct 480

gatggttctg ccgacgtcat gagagacatt tctgcctctg gtgagccagc catccctaac 540

attaaggact tgttgaaccc aaatattaag gctgttaaca tgaacgaatt gtgggacact 600

catttacaaa agtggaacta tcaaatggaa tacttggaaa agtggcgtga agctgaagaa 660

aaagctggta aggaattgga cgctattatc gctccaatta ctcctaccgt cgctgtcaga 720

cacgatcaat tcagatacta cggttacgcc tccgttatta gcttattgga tttcacctct 780

gttgtcgtcc cagtcacttt cgctgataag aatattgata agaagaacga atcttttaaa 840

gctgtttccg aattggatgc tttggttcaa gaagaatacg acccagaggc ttatcacggt 900

gctcctgttg ctgttcaagt tattggtaga agattgtccg aagagagaac tttggctatc 960

gccgaagaag tcggtaaatt gttgggtaac gtcgtcactc cataaggaga ttgataagac 1020

ttttctagtt gcatatcttt tatatttaaa tcttatctat tagttaattt tttgtaattt 1080

atccttatat atagtctggt tattctaaaa tatcatttca gtatctaaaa attcccctct 1140

tttttcagtt atatcttaac aggcgataac ttcgtataat gtatgctata cgaagttatg 1200

ataaaactac tacgctaaaa ataaaataaa aatgtatgat ttccctccat ttccgaccaa 1260

ttgtataatt ttatatctgc atgacttaat aatataatat aatacttata aaatacgaat 1320

agaaaaattt aaaccgatgt aatgcatcct tttctttgtt gtc 1363

<210> 32

<211> 4825

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 32

ccgggctaat tgaggggtgt cgcccttatt cgactcgggg tgagctcacc caccttcatc 60

caccatatcc gaagttatag gggaaatata atcgtcgatg tcattgatca cgtcgttata 120

gttgatattg tcgttagagt ccagttgttg ggcggatctc gtcaggtgcg gatcatgaaa 180

gatattaccg gcaccacctc taccaattgc aaaacgagga accttttcct ggttgctacc 240

gttattattg ttgtttgcta ctgtctttga attggatttc aatggaagaa gtacgggaga 300

cggcttggac atagatttat ggatgttgcc agctccgcct ctgccagtgg agaccttgta 360

ctcttgtaca cgtgcctggt tctccatctc gttttgtggg ttgaacgtag ccatactaac 420

ttggtcttac gctactgctg ctgctaacgc tgctgctgct tttgctcata tgcttccatt 480

gaccgtcatt agtatcagcg tcagcctttt tgacataagc caccgctctg tcagggtaac 540

cctatgaaac atttcaaaac gttataaagg aactcgtctg gttacaacaa ggaaatatca 600

ctacaaacag ctgtccgtac ggctcctcaa ctctctcaat gttgttcgcc tggtcacaca 660

cagcatagtt tcgtcattcg gcgccgacgg tcgctgtctc ttggagcctt caagctcttg 720

tcaacccagg tccgttgtgc cgataaaagt aacagcagac ccccacgccc gcatcccact 780

ctcttctccg accacctccc tcgaagttct tccctgccaa tcccacgtcg atccagcgta 840

gttggcccca actggtgcag taataaccgc ttagcgattt tgcactcgga actacatatg 900

tatatatata tgtgtgtgtg tgtgtgggct ggaaagattt cttgagcttc cgtgttatag 960

tgcaatttaa atattgtaca tcattccgat ccagctggaa acaaaagcaa gaacactcga 1020

ggccagaaaa aggaagtgtt tccctccttc ttgaattgat gttaccctca taaagcacgt 1080

ggcctcttat cgagaaagaa attaccgtcg ctcgtgattt gtttgcaaaa agaacaaaac 1140

tgaaaaaacc cagacacgct cgacttcctg tcttcctatt gattgcagct tccaatttcg 1200

tcacacaaca aggtcctagc gacggctcac aggttttgta acaagcaatc gaaggttctg 1260

gaatggcggg aaagggttta gtaccacatg ctatgatgcc cactgtgatc tccagagcaa 1320

agttcgttcg atcgtactgt tactctctct ctttcaaaca gaattgtccg aatcgtgtga 1380

caacaacagc ctgttctcac acactctttt cttctaacca agggggtggt ttagtttagt 1440

agaacctcgt gaaacttaca tttacatata tataaacttg cataaattgg tcaatgcaag 1500

aaatacatat ttggtctttt ctaattcgta gtttttcaag ttcttagatg ctttcttttt 1560

ctctttttta cagatcatca aggaagtaat tatctacttt ttacaagtct agaatgacaa 1620

catcaaatac ctacaaattc tatctaaacg gtgaatggag agaatcttcc tctggagaaa 1680

ctattgagat accatcacca tacttacatg aagtgatcgg acaggttcaa gcaatcacta 1740

gaggagaggt tgacgaagcg attgctagcg ctaaggaagc acagaaatct tgggctgagg 1800

catctctaca agatagagct aagtacttgt acaaatgggc agatgaattg gtaaacatgc 1860

aagacgaaat cgccgatatc atcatgaagg aagtgggcaa gggttacaaa gacgctaaaa 1920

aggaggttgt tagaaccgcc gatttcatca gatacaccat tgaagaggca ctccatatgc 1980

acggtgaatc catgatgggc gattcatttc ctggtggaac aaaatctaag ctagcaataa 2040

tccaaagagc gcctctgggt gtagtcttag ccatcgctcc attcaattac cctgtaaacc 2100

tttctgctgc aaaattggca ccagccttaa ttatgggtaa cgctgtgata ttcaagccag 2160

caactcaggg tgctatttcc ggcatcaaaa tggttgaagc tttgcataag gctggtttgc 2220

caaagggttt ggttaacgtt gccacaggta gaggtagcgt cataggcgat tatttggtcg 2280

aacacgaagg gataaacatg gtttccttca ccggtggcac taacactggt aagcatttag 2340

caaaaaaggc ctcaatgatt ccattagtct tggaacttgg tggcaaagat ccaggcatcg 2400

ttcgtgaaga tgcagaccta caagatgctg cgaatcatat cgtatctggt gcgttcagtt 2460

actcagggca gagatgtaca gccattaaga gagtccttgt tcatgaaaat gttgctgatg 2520

aactggtatc attggttaag gaacaagtgg caaagctttc tgtgggatca ccagagcaag 2580

attcaacaat tgttcctctg attgacgata agtccgctga ttttgttcag ggtttagtgg 2640

acgatgcagt cgaaaagggc gctacaattg tcattgggaa caagagagaa cgtaacctaa 2700

tctacccaac attgattgat cacgtcacag aggaaatgaa agttgcctgg gaggaaccat 2760

tcggtcctat tcttccaatt attagagtta gtagcgacga gcaagctatt gaaattgcaa 2820

ataagagtga gttcggatta caagcttctg tgtttaccaa agacataaac aaggcattcg 2880

caatcgcaaa taagattgag actggttcag tgcaaatcaa cggtagaaca gagagaggac 2940

cagatcactt tccttttatc ggggttaagg gatctgggat gggtgcccaa ggcatcagaa 3000

agtctttgga atctatgact agagaaaaag ttactgtctt aaatctcgta tgattaaaca 3060

ggcccctttt cctttgtcga tatcatgtaa ttagttatgt cacgcttaca ttcacgccct 3120

cctcccacat ccgctctaac cgaaaaggaa ggagttagac aacctgaagt ctaggtccct 3180

atttattttt ttatagttat gttagtatta agaacgttat ttatatttca aatttttctt 3240

ttttttctgt acaaacgcgt gtacgcatgt aacgggcaga cggccggcca taacttcgta 3300

taatgtatgc tatacgaagt tatccttaca tcacacccaa tcccccacaa gtgatccccc 3360

acacaccata gcttcaaaat gtttctactc cttttttact cttccagatt ttctcggact 3420

ccgcgcatcg ccgtaccact tcaaaacacc caagcacagc atactaaatt tcccctcttt 3480

cttcctctag ggtggcgtta attacccgta ctaaaggttt ggaaaagaaa aaagagaccg 3540

cctcgtttct ttttcttcgt cgaaaaaggc aataaaaatt tttatcacgt ttctttttct 3600

tgaaaaattt tttttttgat ttttttctct ttcgatgacc tcccattgat atttaagtta 3660

ataaatggtc ttcaatttct caagtttcag tttcgttttt cttgttctat tacaactttt 3720

tttacttctt gctcattaga aagaaagcat agcaatctaa tctaagtttt aattacaaaa 3780

tgccacaatc ctgggaagaa ttggccgccg acaaacgtgc ccgtttggct aaaaccattc 3840

ctgacgaatg gaaggttcaa actttgcctg ccgaagattc cgttattgat ttcccaaaga 3900

agtccggtat tttgtctgag gctgaattga agattaccga agcctctgct gctgatttgg 3960

tctccaagtt ggccgctggt gagttgactt ctgttgaagt cactttggct ttttgtaaga 4020

gagctgctat tgctcaacaa ttaaccaact gtgctcacga attcttccca gatgctgctt 4080

tagctcaagc tagagaatta gatgaatact acgctaagca taagagacca gttggtccat 4140

tacacggttt accaatctct ttaaaggacc aattgcgtgt taagggttac gaaacctcca 4200

tgggttacat ttcctggtta aacaaatacg atgaaggtga ttccgtctta accaccatgt 4260

tgagaaaagc tggtgctgtt ttctacgtta agacctctgt cccacaaacc ttgatggtct 4320

gtgaaaccgt caacaacatc attggtagaa ctgtcaatcc aagaaacaaa aattggtcct 4380

gtggtggttc ttctggtggt gaaggtgcta ttgttggtat tagaggtggt gttattggtg 4440

tcggtactga cattggtggt tccattagag tcccagctgc tttcaacttt ttatacggtt 4500

tgagaccatc tcacggtaga ttgccatatg ctaaaatggc taactctatg gaaggtcaag 4560

aaaccgttca ctccgtcgtt ggtcctatca ctcactccgt cgaagacttg agattgttca 4620

ccaaatctgt cttgggtcaa gaaccttgga agtacgactc taaggtcatc cccatgccat 4680

ggagacaatc tgaatctgac atcattgcct ctaagattaa gaatggtggt ttgaacattg 4740

gttattacaa tttcgacggt aacgtcttgc cacacccacc aattttacgt ggtgtcgaaa 4800

ctaccgttgc cgctttggcg gccgc 4825

<210> 33

<211> 1029

<212> DNA

<213> 酿酒酵母

<400> 33

catggagggc acagttaagc cgctaaaggc attatccgcc aagtacaatt ttttactctt 60

cgaagacaga aaatttgctg acattggtaa tacagtcaaa ttgcagtact ctgcgggtgt 120

atacagaata gcagaatggg cagacattac gaatgcacac ggtgtggtgg gcccaggtat 180

tgttagcggt ttgaagcagg cggcggaaga agtaacaaag gaacctagag gccttttgat 240

gttagcagaa ttgtcatgca agggctccct agctactgga gaatatacta agggtactgt 300

tgacattgcg aagagcgaca aagattttgt tatcggcttt attgctcaaa gagacatggg 360

tggaagagat gaaggttacg attggttgat tatgacaccc ggtgtgggtt tagatgacaa 420

gggagacgca ttgggtcaac agtatagaac cgtggatgat gtggtctcta caggatctga 480

cattattatt gttggaagag gactatttgc aaagggaagg gatgctaagg tagagggtga 540

acgttacaga aaagcaggct gggaagcata tttgagaaga tgcggccagc aaaactaaaa 600

aactgtatta taagtaaatg catgtatact aaactcacaa attagagctt caatttaatt 660

atatcagtta ttacccggga atctcggtcg taatgatttt tataatgacg aaaaaaaaaa 720

aattggaaag aaaaagcttc atggccttta taaaaaggaa ccatccaata cctcgccaga 780

accaagtaac agtattttac ggggcacaaa tcaagaacaa taagacagga ctgtaaagat 840

ggacgcattg aactccaaag aacaacaaga gttccaaaaa gtagtggaac aaaagcaaat 900

gaaggatttc atgcgtttga taacttcgta taatgtatgc tatacgaagt tatctcgagg 960

tatctgattt tcctttttca cccttcacgt aaacctgaaa tatatttcat gtaatatata 1020

tagttcatc 1029

<210> 34

<211> 4442

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 34

ccgggctaat tgaggggtgt cgcccttatt cgactcgggg tgagctcacc caccttcatc 60

caccatatcc gaagttatag gggaaatata atcgtcgatg tcattgatca cgtcgttata 120

gttgatattg tcgttagagt ccagttgttg ggcggatctc gtcaggtgcg gatcatgaaa 180

gatattaccg gcaccacctc taccaattgc aaaacgagga accttttcct ggttgctacc 240

gttattattg ttgtttgcta ctgtctttga attggatttc aatggaagaa gtacgggaga 300

cggcttggac atagatttat ggatgttgcc agctccgcct ctgccagtgg agaccttgta 360

ctcttgtaca cgtgcctggt tctccatctc gttttgtggg ttgaacgtag ccatactaac 420

ttggtcttac gctactgctg ctgctaacgc tgctgctgct tttgctcata tgcttccatt 480

gaccgtcatt agtatcagcg tcagcctttt tgacataagc caccgctctg tcagggtaac 540

cctatgaaac atttcaaaac gttataaagg aactcgtctg gttacaacaa ggaaatatca 600

ctacaaacag ctgtccgtac ggctcctcaa ctctctcaat gttgttcgcc tggtcacaca 660

cagcatagtt tcgtcattcg gcgccgacgg tcgctgtctc ttggagcctt caagctcttg 720

tcaacccagg tccgttgtgc cgataaaagt aacagcagac ccccacgccc gcatcccact 780

ctcttctccg accacctccc tcgaagttct tccctgccaa tcccacgtcg atccagcgta 840

gttggcccca actggtgcag taataaccgc ttagcgattt tgcactcgga actacatatg 900

tatatatata tgtgtgtgtg tgtgtgggct ggaaagattt cttgagcttc cgtgttatag 960

tgcaatttaa atattgtaca tcattccgat ccagctggaa acaaaagcaa gaacactcga 1020

ggccagaaaa aggaagtgtt tccctccttc ttgaattgat gttaccctca taaagcacgt 1080

ggcctcttat cgagaaagaa attaccgtcg ctcgtgattt gtttgcaaaa agaacaaaac 1140

tgaaaaaacc cagacacgct cgacttcctg tcttcctatt gattgcagct tccaatttcg 1200

tcacacaaca aggtcctagc gacggctcac aggttttgta acaagcaatc gaaggttctg 1260

gaatggcggg aaagggttta gtaccacatg ctatgatgcc cactgtgatc tccagagcaa 1320

agttcgttcg atcgtactgt tactctctct ctttcaaaca gaattgtccg aatcgtgtga 1380

caacaacagc ctgttctcac acactctttt cttctaacca agggggtggt ttagtttagt 1440

agaacctcgt gaaacttaca tttacatata tataaacttg cataaattgg tcaatgcaag 1500

aaatacatat ttggtctttt ctaattcgta gtttttcaag ttcttagatg ctttcttttt 1560

ctctttttta cagatcatca aggaagtaat tatctacttt ttacaagtct agaatgacaa 1620

catcaaatac ctacaaattc tatctaaacg gtgaatggag agaatcttcc tctggagaaa 1680

ctattgagat accatcacca tacttacatg aagtgatcgg acaggttcaa gcaatcacta 1740

gaggagaggt tgacgaagcg attgctagcg ctaaggaagc acagaaatct tgggctgagg 1800

catctctaca agatagagct aagtacttgt acaaatgggc agatgaattg gtaaacatgc 1860

aagacgaaat cgccgatatc atcatgaagg aagtgggcaa gggttacaaa gacgctaaaa 1920

aggaggttgt tagaaccgcc gatttcatca gatacaccat tgaagaggca ctccatatgc 1980

acggtgaatc catgatgggc gattcatttc ctggtggaac aaaatctaag ctagcaataa 2040

tccaaagagc gcctctgggt gtagtcttag ccatcgctcc attcaattac cctgtaaacc 2100

tttctgctgc aaaattggca ccagccttaa ttatgggtaa cgctgtgata ttcaagccag 2160

caactcaggg tgctatttcc ggcatcaaaa tggttgaagc tttgcataag gctggtttgc 2220

caaagggttt ggttaacgtt gccacaggta gaggtagcgt cataggcgat tatttggtcg 2280

aacacgaagg gataaacatg gtttccttca ccggtggcac taacactggt aagcatttag 2340

caaaaaaggc ctcaatgatt ccattagtct tggaacttgg tggcaaagat ccaggcatcg 2400

ttcgtgaaga tgcagaccta caagatgctg cgaatcatat cgtatctggt gcgttcagtt 2460

actcagggca gagatgtaca gccattaaga gagtccttgt tcatgaaaat gttgctgatg 2520

aactggtatc attggttaag gaacaagtgg caaagctttc tgtgggatca ccagagcaag 2580

attcaacaat tgttcctctg attgacgata agtccgctga ttttgttcag ggtttagtgg 2640

acgatgcagt cgaaaagggc gctacaattg tcattgggaa caagagagaa cgtaacctaa 2700

tctacccaac attgattgat cacgtcacag aggaaatgaa agttgcctgg gaggaaccat 2760

tcggtcctat tcttccaatt attagagtta gtagcgacga gcaagctatt gaaattgcaa 2820

ataagagtga gttcggatta caagcttctg tgtttaccaa agacataaac aaggcattcg 2880

caatcgcaaa taagattgag actggttcag tgcaaatcaa cggtagaaca gagagaggac 2940

cagatcactt tccttttatc ggggttaagg gatctgggat gggtgcccaa ggcatcagaa 3000

agtctttgga atctatgact agagaaaaag ttactgtctt aaatctcgta tgattaaaca 3060

ggcccctttt cctttgtcga tatcatgtaa ttagttatgt cacgcttaca ttcacgccct 3120

cctcccacat ccgctctaac cgaaaaggaa ggagttagac aacctgaagt ctaggtccct 3180

atttattttt ttatagttat gttagtatta agaacgttat ttatatttca aatttttctt 3240

ttttttctgt acaaacgcgt gtacgcatgt aacgggcaga cggccggcca taacttcgta 3300

taatgtatgc tatacgaagt tatggcaacg gttcatcatc tcatggatct gcacatgaac 3360

aaacaccaga gtcaaacgac gttgaaattg aggctactgc gccaattgat gacaatacag 3420

acgatgataa caaaccgaag ttatctgatg tagaaaagga ttagagatgc taagagatag 3480

tgatgatatt tcataaataa tgtaattcta tatatgttaa ttaccttttt tgcgaggcat 3540

atttatggtg aaggataagt tttgaccatc aaagaaggtt aatgtggctg tggtttcagg 3600

gtccataaag cttttcaatt catctttttt ttttttgttc ttttttttga ttccggtttc 3660

tttgaaattt ttttgattcg gtaatctccg agcagaagga agaacgaagg aaggagcaca 3720

gacttagatt ggtatatata cgcatatgtg gtgttgaaga aacatgaaat tgcccagtat 3780

tcttaaccca actgcacaga acaaaaacct gcaggaaacg aagataaatc atgtcgaaag 3840

ctacatataa ggaacgtgct gctactcatc ctagtcctgt tgctgccaag ctatttaata 3900

tcatgcacga aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc accaaggaat 3960

tactggagtt agttgaagca ttaggtccca aaatttgttt actaaaaaca catgtggata 4020

tcttgactga tttttccatg gagggcacag ttaagccgct aaaggcatta tccgccaagt 4080

acaatttttt actcttcgaa gacagaaaat ttgctgacat tggtaataca gtcaaattgc 4140

agtactctgc gggtgtatac agaatagcag aatgggcaga cattacgaat gcacacggtg 4200

tggtgggccc aggtattgtt agcggtttga agcaggcggc ggaagaagta acaaaggaac 4260

ctagaggcct tttgatgtta gcagaattgt catgcaaggg ctccctagct actggagaat 4320

atactaaggg tactgttgac attgcgaaga gcgacaaaga ttttgttatc ggctttattg 4380

ctcaaagaga catgggtgga agagatgaag gttacgattg gttgattatg acacgcggcc 4440

gc 4442

<210> 35

<211> 1447

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 35

gcggccgcga aggtgctatt gttggtatta gaggtggtgt tattggtgtc ggtactgaca 60

ttggtggttc cattagagtc ccagctgctt tcaacttttt atacggtttg agaccatctc 120

acggtagatt gccatatgct aaaatggcta actctatgga aggtcaagaa accgttcact 180

ccgtcgttgg tcctatcact cactccgtcg aagacttgag attgttcacc aaatctgtct 240

tgggtcaaga accttggaag tacgactcta aggtcatccc aatgccatgg agacaatctg 300

aatctgacat cattgcctct aagattaaga atggtggttt gaacattggt tattacaatt 360

tcgacggtaa cgtcttgcca cacccaccaa ttttacgtgg tgtcgaaact accgttgccg 420

ctttggccaa ggctggtcac accgttactc catggactcc atacaagcat gatttcggtc 480

atgacttgat ttcccacatc tatgctgctg atggttctgc cgacgtcatg agagacattt 540

ctgcctctgg tgagccagcc atccctaaca ttaaggactt gttgaaccca aatattaagg 600

ctgttaacat gaacgaattg tgggacactc atttacaaaa gtggaactat caaatggaat 660

acttggaaaa gtggcgtgaa gctgaagaaa aagctggtaa ggaattggac gctattatcg 720

ctccaattac tcctaccgcc gctgtcagac acgatcaatt cagatactac ggttacgcct 780

ccgttattaa cttattggat ttcacctctg ttgtcgtccc agtcactttc gctgataaga 840

atattgataa gaagaacgaa tcttttaaag ctgtttccga attggatgct ttggttcaag 900

aagaatacga cccagaggct tatcacggtg ctcctgttgc tgttcaagtt attggtagaa 960

gattgtccga agagagaact ttggctatcg ccgaagaagt cggtaaattg ttgggtaacg 1020

tcgtcactcc ataagcgaat ttcttatgat ttatgatttt tattattaaa taagttataa 1080

aaaaaataag tgtatacaaa ttttaaagtg actcttaggt tttaaaacga aaattcttat 1140

tcttgagtaa ctctttcctg taggtcaggt tgctttctca ggtatagcat gaggtcgctc 1200

ttattgacca cacctctacc ggcatgccga gcaaatgcct gcaaatcgct ccccatttca 1260

cccaattgta gatatgctaa ctccagcaat gagttgatga atctcggtgt gtattttatg 1320

tcctcagagg acaacacata acttcgtata atgtatgcta tacgaagtta tctcgaggta 1380

tctgattttc ctttttcacc cttcacgtaa acctgaaata tatttcatgt aatatatata 1440

gttcatc 1447

<210> 36

<211> 3579

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 36

gaggttccag atataccgca acacctttat tatggtttcc ctgagggaat aatagaatgt 60

cccattcgaa atcaccaatt ctaaacctgg gcgaattgta tttcgggttt gttaactcgt 120

tccagtcagg aatgttccac gtgaagctat cttccagcaa agtctccact tcttcatcaa 180

attgtgggag aatactccca atgctcttat ctatgggact tccgggaaac acagtaccga 240

tacttcccaa ttcgtcttca gagctcattg tttgtttgaa gagactaatc aaagaatcgt 300

tttctcaaaa aatttaatat cttaactgat agtttgatca aaggcggccg ccgcgctgcg 360

gatatttcta aggcatggtc gtgcggagct acaataatac gattgaatta tagctacata 420

gtgtacaaaa gcgggtatat actttcatat gtgatcagtt tttggtggca gaggagcttg 480

ttgagcttga tgatgtactg tataattcat ggacgaaatt ttcaccccag aaggcagaag 540

tgtatttaga gatgtatttg taaagttttt cccagttaac ttctttcttt acatcgggca 600

aagtcaaggc ctcgttgatg gcatcagaaa gatcatcggt gttccaagga tttacaataa 660

tagcaccatt caaggattgt gcggcacctg tgaactcact caggattaag gaacctttct 720

tttcttcttg gcaagcaata tattcgtagg aaaccaagtt cataccatca cgggtggacg 780

agaccaaaca gacatcgctc acagcatata acgaaatcag ctcttcaaat ggtatagact 840

tgtgcatgaa atggatgggg acgaattcca cagtaccgaa ctgaccgttg attctaccga 900

ccaactcatt gaccacagat cttaaatatt ggtactcttc cacatctcca cgacttggca 960

ctgcaacctg taccagaaca accttgcccc tccattctgg atgctcgttc agaaacactt 1020

ccatggcgtg caacttctga ggcacacctt tgatgtaatc cagcctgtcg acaccaacta 1080

tgatcttgca gcccttgaaa gtttccttca attgttggat tctcttttgt acggattcct 1140

ttttcaaccc atcggtgaac ttgtccacgt cgataccgat agggaaggcc cctacgttaa 1200

cgaatctgcc ctggtattcc accccattag gcaatgtgtt cacgttaagc actctttgca 1260

cggaagacaa gaaatgtctt gcataatcgt atgtgtggaa cccgactaaa tcacaactca 1320

aaacaccctt caaaatctct tgtctgacag gtaagattct gtaaatttca ctcgaaggga 1380

atggtgtgtg caggaaccac ccgaccttaa cgttttgcag ttgcttctcg tgaatcttga 1440

ctctcaacat ttccggaacc aacatcaaat ggtaatcatg cacccagatt aaatcgttat 1500

ggttcatagt cttagcaatc tcgttggtga acgtctggtt tgcctcgttg tatgccaacc 1560

acgcattctc gtcgaaattg atctcaccag gatggtaatg gaataacggc catagaatag 1620

aattactgaa cccgttgtag tgtaagtctg cgatttcatc gctcaggaag atgggtacgg 1680

cattaaactt ttccagcaag tccttcctca cctgatcctt ctcatcgtca ggaatctcta 1740

gcccaggcca tccgaaccac ttgaaagtgt acgtcttctt caacccttcc aacgccgtga 1800

ccagccctcc ggacgacatt gcgtactcgt actgtcccgt actgctgttt ttagtgattg 1860

tcacgggaag cctgttggac accacaataa tgttaccccc tgaagacgag gtcagttgcg 1920

ccttagcgtt atccgtagtc attgttttat atttgttgta aaaagtagat aattacttcc 1980

ttgatgatct gtaaaaaaga gaaaaagaaa gcatctaaga acttgaaaaa ctacgaatta 2040

gaaaagacca aatatgtatt tcttgcattg accaatttat gcaagtttat atatatgtaa 2100

atgtaagttt cacgaggttc tactaaacta aaccaccccc ttggttagaa gaaaagagtg 2160

tgtgagaaca ggctgttgtt gtcacacgat tcggacaatt ctgtttgaaa gagagagagt 2220

aacagtacga tcgaacgaac tttgctctgg agatcacagt gggcatcata gcatgtggta 2280

ctaaaccctt tcccgccatt ccagaacctt cgattgcttg ttacaaaacc tgtgagccgt 2340

cgctaggacc ttgttgtgtg acgaaattgg aagctgcaat caataggaag acaggaagtc 2400

gagcgtgtct gggttttttc agttttgttc tttttgcaaa caaatcacga gcgacggtaa 2460

tttctttctc gataagaggc cacgtgcttt atgagggtaa catcaattca agaaggaggg 2520

aaacacttcc tttttctggc cctgataata gtatgagggt gaagccaaaa taaaggattc 2580

gcgcccaaat cggcatcttt aaatgcaggt atgcgatagt tcctcactct ttccttactc 2640

acgagctcat aacttcgtat agcatacatt atacgaagtt atttaattaa atttaaactg 2700

tgaggacctt aatacattca gacacttcgg cggtatcacc ctacttattc ccttcgagat 2760

tatatctagg aacccatcag gttggtggaa gattacccgt tctaagactt ttcagcttcc 2820

tctattgatg ttacacctgg acaccccttt tctggcatcc agtttttaat cttcagtggc 2880

atgtgagatt ctccgaaatt aattaaagca atcacacaat tctctcggat gccacctcgg 2940

ttgaaactga caggtggttt gttacgcatg ctaatgcaaa ggagcctata tacctttggc 3000

tcggctgctg taacagggaa tataaagggc agcataattt aggagtttag tgaacttgca 3060

acatttacta ttttcccttc ttacgtaaat atttttcttt ttaattctaa atcaatcttt 3120

ttcaattttt tgtttgtatt cttttcttgc ttaaatctat aactacaaaa aacacataca 3180

taaactaaaa ggcgcgccat gggtaaggaa aagactcacg tttcgaggcc gcgattaaat 3240

tccaacatgg atgctgattt atatgggtat aaatgggctc gcgataatgt cgggcaatca 3300

ggtgcgacaa tctatcgatt gtatgggaag cccgatgcgc cagagttgtt tctgaaacat 3360

ggcaaaggta gcgttgccaa tgatgttaca gatgagatgg tcagactaaa ctggctgacg 3420

gaatttatgc ctctaccgac catcaagcat tttatccgta ctcctgatga tgcatggtta 3480

ctcaccactg cgatccccgg caaaacagca ttccaggtat tagaagaata tcctgattca 3540

ggtgaaaata ttgttgatgc gctggcagtg ttcctgcgc 3579

<210> 37

<211> 4848

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 37

gacaatctat cgattgtatg ggaagcccga tgcgccagag ttgtttctga aacatggcaa 60

aggtagcgtt gccaatgatg ttacagatga gatggtcaga ctaaactggc tgacggaatt 120

tatgcctcta ccgaccatca agcattttat ccgtactcct gatgatgcat ggttactcac 180

cactgcgatc cccggcaaaa cagcattcca ggtattagaa gaatatcctg attcaggtga 240

aaatattgtt gatgcgctgg cagtgttcct gcgccggttg cattcgattc ctgtttgtaa 300

ttgtcctttt aacagcgatc gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa 360

cggtttggtt gatgcgagtg attttgatga cgagcgtaat ggctggcctg ttgaacaagt 420

ctggaaagaa atgcataagc ttttgccatt ctcaccggat tcagtcgtca ctcatggtga 480

tttctcactt gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg 540

acgagtcgga atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga 600

gttttctcct tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat 660

gaataaattg cagtttcatt tgatgctcga tgagtttttc taacctaggg cgaatttctt 720

atgatttatg atttttatta ttaaataagt tataaaaaaa ataagtgtat acaaatttta 780

aagtgactct taggttttaa aacgaaaatt cttattcttg agtaactctt tcctgtaggt 840

caggttgctt tctcaggtat agcatgaggt cgctcttatt gaccacacct ctaccggcat 900

gataacttcg tatagcatac attatacgaa gttatttaat taacccggga tctcccgagt 960

ttatcattat caatactgcc atttcaaaga atacgtaaat aattaatagt agtgattttc 1020

ctaactttat ttagtcaaaa aattggcctt ttaattctgc tgtaacccgt acatgcccaa 1080

aatagggggc gggttacaca gaatatataa catcataggt gtctgggtga acagtttatt 1140

cctggcatcc actaaatata atggagcccg ctttttttaa gctggcatcc agaaaaaaaa 1200

agaatcccag caccaaaata ttgttttctt caccaaccat cagttcatag gtccattctc 1260

ttagcgcaac tacacagaac aggggcacaa acaggcaaaa aacgggcaca acctcaatgg 1320

agtgatgcaa cctgcttgga gtaaatgatg acacaaggca attgacctac gcatgtatct 1380

atctcatttt cttacacctt ctattacctt ctgctctctc tgatttggaa aaagctgaaa 1440

aaaaaggttg aaaccagttc cctgaaatta ttcccctatt tgactaataa gtatataaag 1500

acggtaggta ttgattgtaa ttctgtaaat ctatttctta aacttcttaa attctacttt 1560

tatagttagt ctttttttta gttttaaaac actaagaact tagtttcgaa taaacacaca 1620

taaacaaaca aaatgaccac cactgcccaa gacaattctc caaagaagag acagcgtatc 1680

atcaattgtg tcacgcagct gccctacaaa atccaattgg gagaaagcaa cgatgactgg 1740

aaaatatctg ctactacagg taacagcgca ttatattcct ctctagaata ccttcaattt 1800

gattctaccg agtacgagca acacgttgtt ggttggaccg gcgaaataac aagaaccgaa 1860

cgcaacctgt ttactagaga agcgaaagag aaaccacagg atctggacga tgacccacta 1920

tatttaacaa aagagcagat caatgggttg actactactc tacaagatca tatgaaatct 1980

gataaagagg caaagaccga tactactcaa acagctcccg ttaccaataa cgttcatccc 2040

gtttggctac ttagaaaaaa ccagagtaga tggagaaatt acgcggaaaa agtaatttgg 2100

ccaaccttcc actacatctt gaatccttca aatgaaggtg agcaagaaaa aaactggtgg 2160

tacgactacg tcaagtttaa cgaagcttat gcacaaaaaa tcggggaagt ttacaggaag 2220

ggtgacatca tctggatcca tgactactac ctactgctat tgcctcaact actgagaatg 2280

aaatttaacg acgaatctat cattattggt tatttccatc atgccccatg gcctagtaat 2340

gaatattttc gctgtttgcc acgtagaaaa caaatcttag atggtcttgt tggggccaat 2400

agaatttgtt tccaaaatga atctttctcc cgtcattttg tatcgagttg taaaagatta 2460

ctcgacgcaa ccgccaagaa atctaaaaac tcttccgata gtgatcaata tcaagtgtct 2520

gtgtacggtg gtgacgtact cgtagattct ttgcctatag gtgttaacac aactcaaata 2580

ctgaaagatg ctttcacgaa ggatatagat tccaaggttc tttccatcaa gcaagcttat 2640

caaaacaaaa aaattattat tggtagagat cgtctggatt ccgtcagagg cgtcgttcaa 2700

aaattaagag cttttgaaac tttcttggcc atgtatccag aatggcgaga tcaagtggta 2760

ttgatccagg tcagcagtcc tactgctaac agaaattccc cccaaactat cagattggaa 2820

caacaagtca acgagttggt taattccata aattctgaat atggtaattt gaatttttct 2880

cccgtccagc attattatat gagaatccct aaagatgtat acttgtcctt actaagagtt 2940

gcagacttat gtttaatcac aagtgttaga gacggtatga ataccactgc tttggaatac 3000

gtcactgtga aatctcacat gtcgaacttt ttatgctacg gaaatccatt gattttaagt 3060

gagttttctg gctctagtaa cgtattgaaa gatgccattg tcgttaaccc atgggattcg 3120

gtggccgtgg ctaaatctat taacatggct ttgaaattgg acaaggaaga aaagtccaat 3180

ttagaatcaa aattatggaa agaagttcct acaattcaag attggactaa taagtttttg 3240

agttcattaa aggaaaaggc gtcatctgat gatgatgtgg aaaggaaaat gactccagca 3300

cttaatagac ctgttctttt agaaaactac aagcaggcta agcgtagatt attccttttt 3360

gattacgatg gtactttgac cccaattgtc aaagacccag ctgcagctat tccatcggca 3420

agactttata caattctaca aaaattatgt gccgatcctc ataatcaaat ctggattatt 3480

tctggtcgtg accagaagtt tttgaacaag tggttaggcg gtaaacttcc tcaactgggt 3540

ctaagtgcgg agcatggatg tttcatgaaa gatgtttctt gccaagattg ggtcaatttg 3600

accgaaaaag ttgatatgtc ttggcaagta cgcgtcaatg aagtgatgga agaatttacc 3660

acaaggaccc caggttcatt catcgaaaga aagaaagtcg ctctaacttg gcattataga 3720

cgtaccgttc cagaattggg tgaattccac gccaaagaac tgaaagaaaa attgttatca 3780

tttactgatg acttcgattt agaggtcatg gatggtaaag caaacattga agttcgtcca 3840

agattcgtca acaaaggtga aatagtcaag agactagtct ggcatcaaca tggcaaacca 3900

caggacatgt tgaagggaat cagtgaaaaa ctacctaagg atgaaatgcc tgattttgta 3960

ttatgtctgg gtgatgactt cactgacgaa gacatgttta gacagttgaa taccattgaa 4020

acttgttgga aagaaaaata tcctgaccaa aaaaatcaat ggggcaacta cggattctat 4080

cctgtcactg tgggatctgc atccaagaaa actgtcgcaa aggctcattt aaccgatcct 4140

cagcaagtcc tggagacttt aggtttactt gttggtgatg tctctctctt ccaaagtgct 4200

ggtacggtcg acctggattc cagaggtcat gtcaagaata gtgagagcag tttgaaatca 4260

aagctagcat ctaaagctta tgttatgaaa agatcggctt cttacaccgg cgcaaaggtt 4320

tgaacagaag acgggagaca ctagcacaca actttaccag gcaaggtatt tgacgctagc 4380

atgtgtccaa ttcagtgtca tttatgattt tttgtagtag gatataaata tatacagcgc 4440

tccaaatagt gcggttgccc caaaaacacc acggactcga ggcgggccta tacaggaagt 4500

agtatttgta aaagtaaacc atgttgctag tacgaacgac ttccctgaat gtgtcaagga 4560

tgccagtgcc atgcctcgcc agaggaatag gcatcctcaa gggcaaatat agactagcga 4620

acctgatgaa tgcccaaccc tcagtgagac atgtgtcgag cgagatccag caaaaggatc 4680

agcaggcagg agagtcaaac accgccaccg atactggtgt tattcacaaa tcagatgaag 4740

aaactctgat atatttcgat aatgtttacg ctagaaccac ctcggtttgg aatccaacac 4800

tgtggtacaa tctcctgcta agaaaccagt cacgggatgc agtgaggg 4848

<210> 38

<211> 515

<212> PRT

<213> 扣囊复膜酵母

<400> 38

Met Ile Arg Leu Thr Val Phe Leu Thr Ala Val Phe Ala Ala Val Ala

1 5 10 15

Ser Cys Val Pro Val Glu Leu Asp Lys Arg Asn Thr Gly His Phe Gln

20 25 30

Ala Tyr Ser Gly Tyr Thr Val Ala Arg Ser Asn Phe Thr Gln Trp Ile

35 40 45

His Glu Gln Pro Ala Val Ser Trp Tyr Tyr Leu Leu Gln Asn Ile Asp

50 55 60

Tyr Pro Glu Gly Gln Phe Lys Ser Ala Lys Pro Gly Val Val Val Ala

65 70 75 80

Ser Pro Ser Thr Ser Glu Pro Asp Tyr Phe Tyr Gln Trp Thr Arg Asp

85 90 95

Thr Ala Ile Thr Phe Leu Ser Leu Ile Ala Glu Val Glu Asp His Ser

100 105 110

Phe Ser Asn Thr Thr Leu Ala Lys Val Val Glu Tyr Tyr Ile Ser Asn

115 120 125

Thr Tyr Thr Leu Gln Arg Val Ser Asn Pro Ser Gly Asn Phe Asp Ser

130 135 140

Pro Asn His Asp Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Asp Thr

145 150 155 160

Ala Tyr Thr Ala Ser Trp Gly Arg Pro Gln Asn Asp Gly Pro Ala Leu

165 170 175

Arg Ala Tyr Ala Ile Ser Arg Tyr Leu Asn Ala Val Ala Lys His Asn

180 185 190

Asn Gly Lys Leu Leu Leu Ala Gly Gln Asn Gly Ile Pro Tyr Ser Ser

195 200 205

Ala Ser Asp Ile Tyr Trp Lys Ile Ile Lys Pro Asp Leu Gln His Val

210 215 220

Ser Thr His Trp Ser Thr Ser Gly Phe Asp Leu Trp Glu Glu Asn Gln

225 230 235 240

Gly Thr His Phe Phe Thr Ala Leu Val Gln Leu Lys Ala Leu Ser Tyr

245 250 255

Gly Ile Pro Leu Ser Lys Thr Tyr Asn Asp Pro Gly Phe Thr Ser Trp

260 265 270

Leu Glu Lys Gln Lys Asp Ala Leu Asn Ser Tyr Ile Asn Ser Ser Gly

275 280 285

Phe Val Asn Ser Gly Lys Lys His Ile Val Glu Ser Pro Gln Leu Ser

290 295 300

Ser Arg Gly Gly Leu Asp Ser Ala Thr Tyr Ile Ala Ala Leu Ile Thr

305 310 315 320

His Asp Ile Gly Asp Asp Asp Thr Tyr Thr Pro Phe Asn Val Asp Asn

325 330 335

Ser Tyr Val Leu Asn Ser Leu Tyr Tyr Leu Leu Val Asp Asn Lys Asn

340 345 350

Arg Tyr Lys Ile Asn Gly Asn Tyr Lys Ala Gly Ala Ala Val Gly Arg

355 360 365

Tyr Pro Glu Asp Val Tyr Asn Gly Val Gly Thr Ser Glu Gly Asn Pro

370 375 380

Trp Gln Leu Ala Thr Ala Tyr Ala Gly Gln Thr Phe Tyr Thr Leu Ala

385 390 395 400

Tyr Asn Ser Leu Lys Asn Lys Lys Asn Leu Val Ile Glu Lys Leu Asn

405 410 415

Tyr Asp Leu Tyr Asn Ser Phe Ile Ala Asp Leu Ser Lys Ile Asp Ser

420 425 430

Ser Tyr Ala Ser Lys Asp Ser Leu Thr Leu Thr Tyr Gly Ser Asp Asn

435 440 445

Tyr Lys Asn Val Ile Lys Ser Leu Leu Gln Phe Gly Asp Ser Phe Leu

450 455 460

Lys Val Leu Leu Asp His Ile Asp Asp Asn Gly Gln Leu Thr Glu Glu

465 470 475 480

Ile Asn Arg Tyr Thr Gly Phe Gln Ala Gly Ala Val Ser Leu Thr Trp

485 490 495

Ser Ser Gly Ser Leu Leu Ser Ala Asn Arg Ala Arg Asn Lys Leu Ile

500 505 510

Glu Leu Leu

515

<210> 39

<211> 599

<212> PRT

<213> 米根霉

<400> 39

Met Lys Phe Ile Ser Thr Phe Leu Thr Phe Ile Leu Ala Ala Val Ser

1 5 10 15

Val Thr Ala Gly Ala Ser Ile Pro Ser Ser Ala Ser Val Gln Leu Asp

20 25 30

Ser Tyr Asn Tyr Asp Gly Ser Thr Phe Ser Gly Lys Ile Tyr Val Lys

35 40 45

Asn Ile Ala Tyr Ser Lys Lys Val Thr Val Val Tyr Ala Asp Gly Ser

50 55 60

Asp Asn Trp Asn Asn Asn Gly Asn Thr Ile Ala Ala Ser Phe Ser Gly

65 70 75 80

Pro Ile Ser Gly Ser Asn Tyr Glu Tyr Trp Thr Phe Ser Ala Ser Val

85 90 95

Lys Gly Ile Lys Glu Phe Tyr Ile Lys Tyr Glu Val Ser Gly Lys Thr

100 105 110

Tyr Tyr Asp Asn Asn Asn Ser Ala Asn Tyr Gln Val Ser Thr Ser Lys

115 120 125

Pro Thr Thr Thr Thr Ala Ala Thr Thr Thr Thr Thr Ala Pro Ser Thr

130 135 140

Ser Thr Thr Thr Arg Pro Ser Ser Ser Glu Pro Ala Thr Phe Pro Thr

145 150 155 160

Gly Asn Ser Thr Ile Ser Ser Trp Ile Lys Lys Gln Glu Asp Ile Ser

165 170 175

Arg Phe Ala Met Leu Arg Asn Ile Asn Pro Pro Gly Ser Ala Thr Gly

180 185 190

Phe Ile Ala Ala Ser Leu Ser Thr Ala Gly Pro Asp Tyr Tyr Tyr Ala

195 200 205

Trp Thr Arg Asp Ala Ala Leu Thr Ser Asn Val Ile Val Tyr Glu Tyr

210 215 220

Asn Thr Thr Leu Ser Gly Asn Lys Thr Ile Leu Asn Val Leu Lys Asp

225 230 235 240

Tyr Val Thr Phe Ser Val Lys Thr Gln Ser Thr Ser Thr Val Cys Asn

245 250 255

Cys Leu Gly Glu Pro Lys Phe Asn Pro Asp Gly Ser Gly Tyr Thr Gly

260 265 270

Ala Trp Gly Arg Pro Gln Asn Asp Gly Pro Ala Glu Arg Ala Thr Thr

275 280 285

Phe Val Leu Phe Ala Asp Ser Tyr Leu Thr Gln Thr Lys Asp Ala Ser

290 295 300

Tyr Val Thr Gly Thr Leu Lys Pro Ala Ile Phe Lys Asp Leu Asp Tyr

305 310 315 320

Val Val Asn Val Trp Ser Asn Gly Cys Phe Asp Leu Trp Glu Glu Val

325 330 335

Asn Gly Val His Phe Tyr Thr Leu Met Val Met Arg Lys Gly Leu Leu

340 345 350

Leu Gly Ala Asp Phe Ala Lys Arg Asn Gly Asp Ser Thr Arg Ala Ser

355 360 365

Thr Tyr Ser Ser Thr Ala Ser Thr Ile Ala Asn Lys Ile Ser Ser Phe

370 375 380

Trp Val Ser Ser Asn Asn Trp Val Gln Val Ser Gln Ser Val Thr Gly

385 390 395 400

Gly Val Ser Lys Lys Gly Leu Asp Val Ser Thr Leu Leu Ala Ala Asn

405 410 415

Leu Gly Ser Val Asp Asp Gly Phe Phe Thr Pro Gly Ser Glu Lys Ile

420 425 430

Leu Ala Thr Ala Val Ala Val Glu Asp Ser Phe Ala Ser Leu Tyr Pro

435 440 445

Ile Asn Lys Asn Leu Pro Ser Tyr Leu Gly Asn Ala Ile Gly Arg Tyr

450 455 460

Pro Glu Asp Thr Tyr Asn Gly Asn Gly Asn Ser Gln Gly Asn Pro Trp

465 470 475 480

Phe Leu Ala Val Thr Gly Tyr Ala Glu Leu Tyr Tyr Arg Ala Ile Lys

485 490 495

Glu Trp Ile Ser Asn Gly Gly Val Thr Val Ser Ser Ile Ser Leu Pro

500 505 510

Phe Phe Lys Lys Phe Asp Ser Ser Ala Thr Ser Gly Lys Lys Tyr Thr

515 520 525

Val Gly Thr Ser Asp Phe Asn Asn Leu Ala Gln Asn Ile Ala Leu Ala

530 535 540

Ala Asp Arg Phe Leu Ser Thr Val Gln Leu His Ala Pro Asn Asn Gly

545 550 555 560

Ser Leu Ala Glu Glu Phe Asp Arg Thr Thr Gly Phe Ser Thr Gly Ala

565 570 575

Arg Asp Leu Thr Trp Ser His Ala Ser Leu Ile Thr Ala Ser Tyr Ala

580 585 590

Lys Ala Gly Ala Pro Ala Ala

595

<210> 40

<211> 604

<212> PRT

<213> 戴尔根霉

<400> 40

Met Gln Leu Phe Asn Leu Pro Leu Lys Val Ser Phe Phe Leu Val Leu

1 5 10 15

Ser Tyr Phe Ser Leu Leu Val Ser Ala Ala Ser Ile Pro Ser Ser Ala

20 25 30

Ser Val Gln Leu Asp Ser Tyr Asn Tyr Asp Gly Ser Thr Phe Ser Gly

35 40 45

Lys Ile Tyr Val Lys Asn Ile Ala Tyr Ser Lys Lys Val Thr Val Ile

50 55 60

Tyr Ala Asp Gly Ser Asp Asn Trp Asn Asn Asn Gly Asn Thr Ile Ala

65 70 75 80

Ala Ser Tyr Ser Ala Pro Ile Ser Gly Ser Asn Tyr Glu Tyr Trp Thr

85 90 95

Phe Ser Ala Ser Ile Asn Gly Ile Lys Glu Phe Tyr Ile Lys Tyr Glu

100 105 110

Val Ser Gly Lys Thr Tyr Tyr Asp Asn Asn Asn Ser Ala Asn Tyr Gln

115 120 125

Val Ser Thr Ser Lys Pro Thr Thr Thr Thr Ala Thr Ala Thr Thr Thr

130 135 140

Thr Ala Pro Ser Thr Ser Thr Thr Thr Pro Pro Ser Ser Ser Glu Pro

145 150 155 160

Ala Thr Phe Pro Thr Gly Asn Ser Thr Ile Ser Ser Trp Ile Lys Lys

165 170 175

Gln Glu Gly Ile Ser Arg Phe Ala Met Leu Arg Asn Ile Asn Pro Pro

180 185 190

Gly Ser Ala Thr Gly Phe Ile Ala Ala Ser Leu Ser Thr Ala Gly Pro

195 200 205

Asp Tyr Tyr Tyr Ala Trp Thr Arg Asp Ala Ala Leu Thr Ser Asn Val

210 215 220

Ile Val Tyr Glu Tyr Asn Thr Thr Leu Ser Gly Asn Lys Thr Ile Leu

225 230 235 240

Asn Val Leu Lys Asp Tyr Val Thr Phe Ser Val Lys Thr Gln Ser Thr

245 250 255

Ser Thr Val Cys Asn Cys Leu Gly Glu Pro Lys Phe Asn Pro Asp Gly

260 265 270

Ser Gly Tyr Thr Gly Ala Trp Gly Arg Pro Gln Asn Asp Gly Pro Ala

275 280 285

Glu Arg Ala Thr Thr Phe Ile Leu Phe Ala Asp Ser Tyr Leu Thr Gln

290 295 300

Thr Lys Asp Ala Ser Tyr Val Thr Gly Thr Leu Lys Pro Ala Ile Phe

305 310 315 320

Lys Asp Leu Asp Tyr Val Val Asn Val Trp Ser Asn Gly Cys Phe Asp

325 330 335

Leu Trp Glu Glu Val Asn Gly Val His Phe Tyr Thr Leu Met Val Met

340 345 350

Arg Lys Gly Leu Leu Leu Gly Ala Asp Phe Ala Lys Arg Asn Gly Asp

355 360 365

Ser Thr Arg Ala Ser Thr Tyr Ser Ser Thr Ala Ser Thr Ile Ala Asn

370 375 380

Lys Ile Ser Ser Phe Trp Val Ser Ser Asn Asn Trp Ile Gln Val Ser

385 390 395 400

Gln Ser Val Thr Gly Gly Val Ser Lys Lys Gly Leu Asp Val Ser Thr

405 410 415

Leu Leu Ala Ala Asn Leu Gly Ser Val Asp Asp Gly Phe Phe Thr Pro

420 425 430

Gly Ser Glu Lys Ile Leu Ala Thr Ala Val Ala Val Glu Asp Ser Phe

435 440 445

Ala Ser Leu Tyr Pro Ile Asn Lys Asn Leu Pro Ser Tyr Leu Gly Asn

450 455 460

Ser Ile Gly Arg Tyr Pro Glu Asp Thr Tyr Asn Gly Asn Gly Asn Ser

465 470 475 480

Gln Gly Asn Pro Trp Phe Leu Ala Val Thr Gly Tyr Ala Glu Leu Tyr

485 490 495

Tyr Arg Ala Ile Lys Glu Trp Ile Gly Asn Gly Gly Val Thr Val Ser

500 505 510

Ser Ile Ser Leu Pro Phe Phe Lys Lys Phe Asp Ser Ser Ala Thr Ser

515 520 525

Gly Lys Lys Tyr Thr Val Gly Thr Ser Asp Phe Asn Asn Leu Ala Gln

530 535 540

Asn Ile Ala Leu Ala Ala Asp Arg Phe Leu Ser Thr Val Gln Leu His

545 550 555 560

Ala His Asn Asn Gly Ser Leu Ala Glu Glu Phe Asp Arg Thr Thr Gly

565 570 575

Leu Ser Thr Gly Ala Arg Asp Leu Thr Trp Ser His Ala Ser Leu Ile

580 585 590

Thr Ala Ser Tyr Ala Lys Ala Gly Ala Pro Ala Ala

595 600

<210> 41

<211> 605

<212> PRT

<213> 小孢根霉

<400> 41

Met Lys Leu Met Asn Pro Ser Met Lys Ala Tyr Val Phe Phe Ile Leu

1 5 10 15

Ser Tyr Phe Ser Leu Leu Val Ser Ser Ala Ala Val Pro Thr Ser Ala

20 25 30

Ala Val Gln Val Glu Ser Tyr Asn Tyr Asp Gly Thr Thr Phe Ser Gly

35 40 45

Arg Ile Phe Val Lys Asn Ile Ala Tyr Ser Lys Val Val Thr Val Ile

50 55 60

Tyr Ser Asp Gly Ser Asp Asn Trp Asn Asn Asn Asn Asn Lys Val Ser

65 70 75 80

Ala Ala Tyr Ser Glu Ala Ile Ser Gly Ser Asn Tyr Glu Tyr Trp Thr

85 90 95

Phe Ser Ala Lys Leu Ser Gly Ile Lys Gln Phe Tyr Val Lys Tyr Glu

100 105 110

Val Ser Gly Ser Thr Tyr Tyr Asp Asn Asn Gly Thr Lys Asn Tyr Gln

115 120 125

Val Gln Ala Thr Ser Ala Thr Ser Thr Thr Ala Thr Ala Thr Thr Thr

130 135 140

Thr Ala Thr Gly Thr Thr Thr Thr Ser Thr Gly Pro Thr Ser Thr Ala

145 150 155 160

Ser Val Ser Phe Pro Thr Gly Asn Ser Thr Ile Ser Ser Trp Ile Lys

165 170 175

Asn Gln Glu Glu Ile Ser Arg Phe Ala Met Leu Arg Asn Ile Asn Pro

180 185 190

Pro Gly Ser Ala Thr Gly Phe Ile Ala Ala Ser Leu Ser Thr Ala Gly

195 200 205

Pro Asp Tyr Tyr Tyr Ser Trp Thr Arg Asp Ser Ala Leu Thr Ala Asn

210 215 220

Val Ile Ala Tyr Glu Tyr Asn Thr Thr Phe Thr Gly Asn Thr Thr Leu

225 230 235 240

Leu Lys Tyr Leu Lys Asp Tyr Val Thr Phe Ser Val Lys Ser Gln Ser

245 250 255

Val Ser Thr Val Cys Asn Cys Leu Gly Glu Pro Lys Phe Asn Ala Asp

260 265 270

Gly Ser Ser Phe Thr Gly Pro Trp Gly Arg Pro Gln Asn Asp Gly Pro

275 280 285

Ala Glu Arg Ala Val Thr Phe Met Leu Ile Ala Asp Ser Tyr Leu Thr

290 295 300

Gln Thr Lys Asp Ala Ser Tyr Val Thr Gly Thr Leu Lys Pro Ala Ile

305 310 315 320

Phe Lys Asp Leu Asp Tyr Val Val Ser Val Trp Ser Asn Gly Cys Tyr

325 330 335

Asp Leu Trp Glu Glu Val Asn Gly Val His Phe Tyr Thr Leu Met Val

340 345 350

Met Arg Lys Gly Leu Ile Leu Gly Ala Asp Phe Ala Ala Arg Asn Gly

355 360 365

Asp Ser Ser Arg Ala Ser Thr Tyr Lys Gln Thr Ala Ser Thr Met Glu

370 375 380

Ser Lys Ile Ser Ser Phe Trp Ser Asp Ser Asn Asn Tyr Val Gln Val

385 390 395 400

Ser Gln Ser Val Thr Ala Gly Val Ser Lys Lys Gly Leu Asp Val Ser

405 410 415

Thr Leu Leu Ala Ala Asn Ile Gly Ser Leu Pro Asp Gly Phe Phe Thr

420 425 430

Pro Gly Ser Glu Lys Ile Leu Ala Thr Ala Val Ala Leu Glu Asn Ala

435 440 445

Phe Ala Ser Leu Tyr Pro Ile Asn Ser Asn Leu Pro Ser Tyr Leu Gly

450 455 460

Asn Ser Ile Gly Arg Tyr Pro Glu Asp Thr Tyr Asn Gly Asn Gly Asn

465 470 475 480

Ser Gln Gly Asn Pro Trp Phe Leu Ala Val Asn Ala Tyr Ala Glu Leu

485 490 495

Tyr Tyr Arg Ala Ile Lys Glu Trp Ile Ser Asn Gly Lys Val Thr Val

500 505 510

Ser Asn Ile Ser Leu Pro Phe Phe Lys Lys Phe Asp Ser Ser Ala Thr

515 520 525

Ser Gly Lys Thr Tyr Thr Ala Gly Thr Ser Asp Phe Asn Asn Leu Ala

530 535 540

Gln Asn Ile Ala Leu Gly Ala Asp Arg Phe Leu Ser Thr Val Lys Phe

545 550 555 560

His Ala Tyr Thr Asn Gly Ser Leu Ser Glu Glu Tyr Asp Arg Ser Thr

565 570 575

Gly Met Ser Thr Gly Ala Arg Asp Leu Thr Trp Ser His Ala Ser Leu

580 585 590

Ile Thr Val Ala Tyr Ala Lys Ala Gly Ser Pro Ala Ala

595 600 605

<210> 42

<211> 479

<212> PRT

<213> 蜡样芽胞杆菌

<400> 42

Met Thr Thr Ser Asn Thr Tyr Lys Phe Tyr Leu Asn Gly Glu Trp Arg

1 5 10 15

Glu Ser Ser Ser Gly Glu Thr Ile Glu Ile Pro Ser Pro Tyr Leu His

20 25 30

Glu Val Ile Gly Gln Val Gln Ala Ile Thr Arg Gly Glu Val Asp Glu

35 40 45

Ala Ile Ala Ser Ala Lys Glu Ala Gln Lys Ser Trp Ala Glu Ala Ser

50 55 60

Leu Gln Asp Arg Ala Lys Tyr Leu Tyr Lys Trp Ala Asp Glu Leu Val

65 70 75 80

Asn Met Gln Asp Glu Ile Ala Asp Ile Ile Met Lys Glu Val Gly Lys

85 90 95

Gly Tyr Lys Asp Ala Lys Lys Glu Val Val Arg Thr Ala Asp Phe Ile

100 105 110

Arg Tyr Thr Ile Glu Glu Ala Leu His Met His Gly Glu Ser Met Met

115 120 125

Gly Asp Ser Phe Pro Gly Gly Thr Lys Ser Lys Leu Ala Ile Ile Gln

130 135 140

Arg Ala Pro Leu Gly Val Val Leu Ala Ile Ala Pro Phe Asn Tyr Pro

145 150 155 160

Val Asn Leu Ser Ala Ala Lys Leu Ala Pro Ala Leu Ile Met Gly Asn

165 170 175

Ala Val Ile Phe Lys Pro Ala Thr Gln Gly Ala Ile Ser Gly Ile Lys

180 185 190

Met Val Glu Ala Leu His Lys Ala Gly Leu Pro Lys Gly Leu Val Asn

195 200 205

Val Ala Thr Gly Arg Gly Ser Val Ile Gly Asp Tyr Leu Val Glu His

210 215 220

Glu Gly Ile Asn Met Val Ser Phe Thr Gly Gly Thr Asn Thr Gly Lys

225 230 235 240

His Leu Ala Lys Lys Ala Ser Met Ile Pro Leu Val Leu Glu Leu Gly

245 250 255

Gly Lys Asp Pro Gly Ile Val Arg Glu Asp Ala Asp Leu Gln Asp Ala

260 265 270

Ala Asn His Ile Val Ser Gly Ala Phe Ser Tyr Ser Gly Gln Arg Cys

275 280 285

Thr Ala Ile Lys Arg Val Leu Val His Glu Asn Val Ala Asp Glu Leu

290 295 300

Val Ser Leu Val Lys Glu Gln Val Ala Lys Leu Ser Val Gly Ser Pro

305 310 315 320

Glu Gln Asp Ser Thr Ile Val Pro Leu Ile Asp Asp Lys Ser Ala Asp

325 330 335

Phe Val Gln Gly Leu Val Asp Asp Ala Val Glu Lys Gly Ala Thr Ile

340 345 350

Val Ile Gly Asn Lys Arg Glu Arg Asn Leu Ile Tyr Pro Thr Leu Ile

355 360 365

Asp His Val Thr Glu Glu Met Lys Val Ala Trp Glu Glu Pro Phe Gly

370 375 380

Pro Ile Leu Pro Ile Ile Arg Val Ser Ser Asp Glu Gln Ala Ile Glu

385 390 395 400

Ile Ala Asn Lys Ser Glu Phe Gly Leu Gln Ala Ser Val Phe Thr Lys

405 410 415

Asp Ile Asn Lys Ala Phe Ala Ile Ala Asn Lys Ile Glu Thr Gly Ser

420 425 430

Val Gln Ile Asn Gly Arg Thr Glu Arg Gly Pro Asp His Phe Pro Phe

435 440 445

Ile Gly Val Lys Gly Ser Gly Met Gly Ala Gln Gly Ile Arg Lys Ser

450 455 460

Leu Glu Ser Met Thr Arg Glu Lys Val Thr Val Leu Asn Leu Val

465 470 475

<210> 43

<211> 495

<212> PRT

<213> 酿酒酵母

<400> 43

Met Thr Thr Asp Asn Ala Lys Ala Gln Leu Thr Ser Ser Ser Gly Gly

1 5 10 15

Asn Ile Ile Val Val Ser Asn Arg Leu Pro Val Thr Ile Thr Lys Asn

20 25 30

Ser Ser Thr Gly Gln Tyr Glu Tyr Ala Met Ser Ser Gly Gly Leu Val

35 40 45

Thr Ala Leu Glu Gly Leu Lys Lys Thr Tyr Thr Phe Lys Trp Phe Gly

50 55 60

Trp Pro Gly Leu Glu Ile Pro Asp Asp Glu Lys Asp Gln Val Arg Lys

65 70 75 80

Asp Leu Leu Glu Lys Phe Asn Ala Val Pro Ile Phe Leu Ser Asp Glu

85 90 95

Ile Ala Asp Leu His Tyr Asn Gly Phe Ser Asn Ser Ile Leu Trp Pro

100 105 110

Leu Phe His Tyr His Pro Gly Glu Ile Asn Phe Asp Glu Asn Ala Trp

115 120 125

Leu Ala Tyr Asn Glu Ala Asn Gln Thr Phe Thr Asn Glu Ile Ala Lys

130 135 140

Thr Met Asn His Asn Asp Leu Ile Trp Val His Asp Tyr His Leu Met

145 150 155 160

Leu Val Pro Glu Met Leu Arg Val Lys Ile His Glu Lys Gln Leu Gln

165 170 175

Asn Val Lys Val Gly Trp Phe Leu His Thr Pro Phe Pro Ser Ser Glu

180 185 190

Ile Tyr Arg Ile Leu Pro Val Arg Gln Glu Ile Leu Lys Gly Val Leu

195 200 205

Ser Cys Asp Leu Val Gly Phe His Thr Tyr Asp Tyr Ala Arg His Phe

210 215 220

Leu Ser Ser Val Gln Arg Val Leu Asn Val Asn Thr Leu Pro Asn Gly

225 230 235 240

Val Glu Tyr Gln Gly Arg Phe Val Asn Val Gly Ala Phe Pro Ile Gly

245 250 255

Ile Asp Val Asp Lys Phe Thr Asp Gly Leu Lys Lys Glu Ser Val Gln

260 265 270

Lys Arg Ile Gln Gln Leu Lys Glu Thr Phe Lys Gly Cys Lys Ile Ile

275 280 285

Val Gly Val Asp Arg Leu Asp Tyr Ile Lys Gly Val Pro Gln Lys Leu

290 295 300

His Ala Met Glu Val Phe Leu Asn Glu His Pro Glu Trp Arg Gly Lys

305 310 315 320

Val Val Leu Val Gln Val Ala Val Pro Ser Arg Gly Asp Val Glu Glu

325 330 335

Tyr Gln Tyr Leu Arg Ser Val Val Asn Glu Leu Val Gly Arg Ile Asn

340 345 350

Gly Gln Phe Gly Thr Val Glu Phe Val Pro Ile His Phe Met His Lys

355 360 365

Ser Ile Pro Phe Glu Glu Leu Ile Ser Leu Tyr Ala Val Ser Asp Val

370 375 380

Cys Leu Val Ser Ser Thr Arg Asp Gly Met Asn Leu Val Ser Tyr Glu

385 390 395 400

Tyr Ile Ala Cys Gln Glu Glu Lys Lys Gly Ser Leu Ile Leu Ser Glu

405 410 415

Phe Thr Gly Ala Ala Gln Ser Leu Asn Gly Ala Ile Ile Val Asn Pro

420 425 430

Trp Asn Thr Asp Asp Leu Ser Asp Ala Ile Asn Glu Ala Leu Thr Leu

435 440 445

Pro Asp Val Lys Lys Glu Val Asn Trp Glu Lys Leu Tyr Lys Tyr Ile

450 455 460

Ser Lys Tyr Thr Ser Ala Phe Trp Gly Glu Asn Phe Val His Glu Leu

465 470 475 480

Tyr Ser Thr Ser Ser Ser Ser Thr Ser Ser Ser Ala Thr Lys Asn

485 490 495

<210> 44

<211> 896

<212> PRT

<213> 酿酒酵母

<400> 44

Met Thr Thr Thr Ala Gln Asp Asn Ser Pro Lys Lys Arg Gln Arg Ile

1 5 10 15

Ile Asn Cys Val Thr Gln Leu Pro Tyr Lys Ile Gln Leu Gly Glu Ser

20 25 30

Asn Asp Asp Trp Lys Ile Ser Ala Thr Thr Gly Asn Ser Ala Leu Phe

35 40 45

Ser Ser Leu Glu Tyr Leu Gln Phe Asp Ser Thr Glu Tyr Glu Gln His

50 55 60

Val Val Gly Trp Thr Gly Glu Ile Thr Arg Thr Glu Arg Asn Leu Phe

65 70 75 80

Thr Arg Glu Ala Lys Glu Lys Pro Gln Asp Leu Asp Asp Asp Pro Leu

85 90 95

Tyr Leu Thr Lys Glu Gln Ile Asn Gly Leu Thr Thr Thr Leu Gln Asp

100 105 110

His Met Lys Ser Asp Lys Glu Ala Lys Thr Asp Thr Thr Gln Thr Ala

115 120 125

Pro Val Thr Asn Asn Val His Pro Val Trp Leu Leu Arg Lys Asn Gln

130 135 140

Ser Arg Trp Arg Asn Tyr Ala Glu Lys Val Ile Trp Pro Thr Phe His

145 150 155 160

Tyr Ile Leu Asn Pro Ser Asn Glu Gly Glu Gln Glu Lys Asn Trp Trp

165 170 175

Tyr Asp Tyr Val Lys Phe Asn Glu Ala Tyr Ala Gln Lys Ile Gly Glu

180 185 190

Val Tyr Arg Lys Gly Asp Ile Ile Trp Ile His Asp Tyr Tyr Leu Leu

195 200 205

Leu Leu Pro Gln Leu Leu Arg Met Lys Phe Asn Asp Glu Ser Ile Ile

210 215 220

Ile Gly Tyr Phe His His Ala Pro Trp Pro Ser Asn Glu Tyr Phe Arg

225 230 235 240

Cys Leu Pro Arg Arg Lys Gln Ile Leu Asp Gly Leu Val Gly Ala Asn

245 250 255

Arg Ile Cys Phe Gln Asn Glu Ser Phe Ser Arg His Phe Val Ser Ser

260 265 270

Cys Lys Arg Leu Leu Asp Ala Thr Ala Lys Lys Ser Lys Asn Ser Ser

275 280 285

Asn Ser Asp Gln Tyr Gln Val Ser Val Tyr Gly Gly Asp Val Leu Val

290 295 300

Asp Ser Leu Pro Ile Gly Val Asn Thr Thr Gln Ile Leu Lys Asp Ala

305 310 315 320

Phe Thr Lys Asp Ile Asp Ser Lys Val Leu Ser Ile Lys Gln Ala Tyr

325 330 335

Gln Asn Lys Lys Ile Ile Ile Gly Arg Asp Arg Leu Asp Ser Val Arg

340 345 350

Gly Val Val Gln Lys Leu Arg Ala Phe Glu Thr Phe Leu Ala Met Tyr

355 360 365

Pro Glu Trp Arg Asp Gln Val Val Leu Ile Gln Val Ser Ser Pro Thr

370 375 380

Ala Asn Arg Asn Ser Pro Gln Thr Ile Arg Leu Glu Gln Gln Val Asn

385 390 395 400

Glu Leu Val Asn Ser Ile Asn Ser Glu Tyr Gly Asn Leu Asn Phe Ser

405 410 415

Pro Val Gln His Tyr Tyr Met Arg Ile Pro Lys Asp Val Tyr Leu Ser

420 425 430

Leu Leu Arg Val Ala Asp Leu Cys Leu Ile Thr Ser Val Arg Asp Gly

435 440 445

Met Asn Thr Thr Ala Leu Glu Tyr Val Thr Val Lys Ser His Met Ser

450 455 460

Asn Phe Leu Cys Tyr Gly Asn Pro Leu Ile Leu Ser Glu Phe Ser Gly

465 470 475 480

Ser Ser Asn Val Leu Lys Asp Ala Ile Val Val Asn Pro Trp Asp Ser

485 490 495

Val Ala Val Ala Lys Ser Ile Asn Met Ala Leu Lys Leu Asp Lys Glu

500 505 510

Glu Lys Ser Asn Leu Glu Ser Lys Leu Trp Lys Glu Val Pro Thr Ile

515 520 525

Gln Asp Trp Thr Asn Lys Phe Leu Ser Ser Leu Lys Glu Gln Ala Ser

530 535 540

Ser Asn Asp Asp Met Glu Arg Lys Met Thr Pro Ala Leu Asn Arg Pro

545 550 555 560

Val Leu Leu Glu Asn Tyr Lys Gln Ala Lys Arg Arg Leu Phe Leu Phe

565 570 575

Asp Tyr Asp Gly Thr Leu Thr Pro Ile Val Lys Asp Pro Ala Ala Ala

580 585 590

Ile Pro Ser Ala Arg Leu Tyr Thr Ile Leu Gln Lys Leu Cys Ala Asp

595 600 605

Pro His Asn Gln Ile Trp Ile Ile Ser Gly Arg Asp Gln Lys Phe Leu

610 615 620

Asn Lys Trp Leu Gly Gly Lys Leu Pro Gln Leu Gly Leu Ser Ala Glu

625 630 635 640

His Gly Cys Phe Met Lys Asp Val Ser Cys Gln Asp Trp Val Asn Leu

645 650 655

Thr Glu Lys Val Asp Met Ser Trp Gln Val Arg Val Asn Glu Val Met

660 665 670

Glu Glu Phe Thr Thr Arg Thr Pro Gly Ser Phe Ile Glu Arg Lys Lys

675 680 685

Val Ala Leu Thr Trp His Tyr Arg Arg Thr Val Pro Glu Leu Gly Glu

690 695 700

Phe His Ala Lys Glu Leu Lys Glu Lys Leu Leu Ser Phe Thr Asp Asp

705 710 715 720

Phe Asp Leu Glu Val Met Asp Gly Lys Ala Asn Ile Glu Val Arg Pro

725 730 735

Arg Phe Val Asn Lys Gly Glu Ile Val Lys Arg Leu Val Trp His Gln

740 745 750

His Gly Lys Pro Gln Asp Met Leu Lys Gly Ile Ser Glu Lys Leu Pro

755 760 765

Lys Asp Glu Met Pro Asp Phe Val Leu Cys Leu Gly Asp Asp Phe Thr

770 775 780

Asp Glu Asp Met Phe Arg Gln Leu Asn Thr Ile Glu Thr Cys Trp Lys

785 790 795 800

Glu Lys Tyr Pro Asp Gln Lys Asn Gln Trp Gly Asn Tyr Gly Phe Tyr

805 810 815

Pro Val Thr Val Gly Ser Ala Ser Lys Lys Thr Val Ala Lys Ala His

820 825 830

Leu Thr Asp Pro Gln Gln Val Leu Glu Thr Leu Gly Leu Leu Val Gly

835 840 845

Asp Val Ser Leu Phe Gln Ser Ala Gly Thr Val Asp Leu Asp Ser Arg

850 855 860

Gly His Val Lys Asn Ser Glu Ser Ser Leu Lys Ser Lys Leu Ala Ser

865 870 875 880

Lys Ala Tyr Val Met Lys Arg Ser Ala Ser Tyr Thr Gly Ala Lys Val

885 890 895

<210> 45

<211> 1440

<212> DNA

<213> 蜡样芽胞杆菌

<400> 45

atgacaacat caaataccta caaattctat ctaaacggtg aatggagaga atcttcctct 60

ggagaaacta ttgagatacc atcaccatac ttacatgaag tgatcggaca ggttcaagca 120

atcactagag gagaggttga cgaagcgatt gctagcgcta aggaagcaca gaaatcttgg 180

gctgaggcat ctctacaaga tagagctaag tacttgtaca aatgggcaga tgaattggta 240

aacatgcaag acgaaatcgc cgatatcatc atgaaggaag tgggcaaggg ttacaaagac 300

gctaaaaagg aggttgttag aaccgccgat ttcatcagat acaccattga agaggcactc 360

catatgcacg gtgaatccat gatgggcgat tcatttcctg gtggaacaaa atctaagcta 420

gcaataatcc aaagagcgcc tctgggtgta gtcttagcca tcgctccatt caattaccct 480

gtaaaccttt ctgctgcaaa attggcacca gccttaatta tgggtaacgc tgtgatattc 540

aagccagcaa ctcagggtgc tatttccggc atcaaaatgg ttgaagcttt gcataaggct 600

ggtttgccaa agggtttggt taacgttgcc acaggtagag gtagcgtcat aggcgattat 660

ttggtcgaac acgaagggat aaacatggtt tccttcaccg gtggcactaa cactggtaag 720

catttagcaa aaaaggcctc aatgattcca ttagtcttgg aacttggtgg caaagatcca 780

ggcatcgttc gtgaagatgc agacctacaa gatgctgcga atcatatcgt atctggtgcg 840

ttcagttact cagggcagag atgtacagcc attaagagag tccttgttca tgaaaatgtt 900

gctgatgaac tggtatcatt ggttaaggaa caagtggcaa agctttctgt gggatcacca 960

gagcaagatt caacaattgt tcctctgatt gacgataagt ccgctgattt tgttcagggt 1020

ttagtggacg atgcagtcga aaagggcgct acaattgtca ttgggaacaa gagagaacgt 1080

aacctaatct acccaacatt gattgatcac gtcacagagg aaatgaaagt tgcctgggag 1140

gaaccattcg gtcctattct tccaattatt agagttagta gcgacgagca agctattgaa 1200

attgcaaata agagtgagtt cggattacaa gcttctgtgt ttaccaaaga cataaacaag 1260

gcattcgcaa tcgcaaataa gattgagact ggttcagtgc aaatcaacgg tagaacagag 1320

agaggaccag atcactttcc ttttatcggg gttaagggat ctgggatggg tgcccaaggc 1380

atcagaaagt ctttggaatc tatgactaga gaaaaagtta ctgtcttaaa tctcgtatga 1440

<210> 46

<211> 1548

<212> DNA

<213> 扣囊复膜酵母

<400> 46

atgattagat taaccgtatt cctcactgca gtttttgcag cagtcgcttc ctgtgttcca 60

gttgaattgg ataagagaaa tacaggccat ttccaagcat attctggtta caccgtagct 120

agatcaaact ttactcaatg gattcacgag caaccagccg tatcatggta ctatttgctt 180

cagaatatag actatccaga aggacaattc aagtctgcca agccaggggt cgttgtggct 240

tccccttcta catccgaacc tgattacttc taccaatgga ctagagatac tgctatcacc 300

ttcttgtcac ttatcgcgga agttgaggat cattcttttt caaatactac actagccaag 360

gtggttgaat actacatctc taatacttac acattacaaa gagtttccaa cccatctggt 420

aacttcgaca gtccaaatca cgacggtttg ggagaaccaa agtttaatgt tgatgataca 480

gcttatactg catcttgggg tagaccacaa aatgatggcc cagcgttgag agcatacgca 540

atttcaagat accttaacgc agtagcaaaa cacaacaacg gtaagttact gctcgctgga 600

caaaacggta ttccttactc ttcagcttct gatatctact ggaagattat caagccagat 660

cttcaacatg tgtcaaccca ttggtctaca tctggttttg atttgtggga agagaatcag 720

ggaacacatt tctttactgc gttggtccag ctaaaagcac ttagttacgg cattccttta 780

agtaagacct acaacgatcc tggtttcact agttggctag aaaagcaaaa ggatgcttta 840

aactcttata tcaacagctc tggtttcgta aactctggca aaaagcatat agtggagagc 900

cctcaactat cttcaagagg agggttggat agcgccacat acattgcagc cttaatcaca 960

catgatattg gcgacgacga cacttacaca cctttcaacg ttgacaactc ctatgtcttg 1020

aactcactgt attaccttct agtcgataac aaaaaccgtt acaaaatcaa tggtaactac 1080

aaggccggtg ctgctgttgg tagataccca gaggatgttt acaacggtgt tgggacatca 1140

gaaggcaatc catggcaatt agctacagcc tacgccggcc aaacatttta cacactggct 1200

tacaactcat tgaaaaacaa aaaaaactta gtgattgaaa agttgaacta cgacctctac 1260

aattctttca tagcagattt atccaagatc gatagttctt acgcatcaaa agactccttg 1320

actttgacct acggttctga caactacaaa aacgtcataa agtcactatt acagtttgga 1380

gattcattcc tgaaggtctt gctcgatcac attgatgata atggacaatt aacagaagag 1440

atcaatagat acacagggtt ccaggctggt gctgttagtt tgacatggtc ctctggttca 1500

ttactttcag caaaccgtgc gagaaataag ttgattgaac tattgtag 1548

<210> 47

<211> 1548

<212> DNA

<213> 扣囊复膜酵母

<400> 47

atgatcagac ttacagtttt cctaacagcc gttttcgccg ccgttgcatc atgtgtccca 60

gtagaattgg ataagagaaa caccggccat ttccaagcat attcaggata caccgttgca 120

cgttctaatt tcacacaatg gattcatgag cagcctgctg tgtcctggta ctacttatta 180

caaaacattg attatcctga gggacaattc aagtcagcga aaccaggcgt tgtggttgct 240

tctccatcca cttcagaacc agactacttc taccagtgga cccgtgacac agcaataact 300

ttcttatctt tgatagcaga agtagaagat cactcatttt caaatacaac tctagctaag 360

gttgtcgaat actacatctc taacacatac accctacaaa gagtttctaa cccatctggt 420

aatttcgata gcccaaatca cgatggtctg ggtgaaccaa agttcaacgt tgacgacact 480

gcttacactg catcatgggg cagacctcaa aacgacggtc cagccttaag agcttacgcg 540

atctcaagat atttgaacgc agttgccaag cataacaacg gtaagctatt gctcgcgggt 600

caaaatggta ttccttactc atctgcatca gatatctact ggaagattat caagccagat 660

ttacaacatg taagtactca ctggagtaca tctggttttg acttatggga agagaatcaa 720

ggtacacatt tctttactgc acttgtccag ttaaaagctc tttcatacgg tatacctttg 780

tctaagacat ataacgatcc aggatttact tcttggttgg aaaagcagaa ggatgccttg 840

aactcttaca tcaattccag cggcttcgtc aactccggga aaaagcacat tgtcgaatct 900

cctcaattat ctagtagagg gggtcttgat agcgctactt acatcgctgc tctaattaca 960

catgatattg gtgatgatga tacatacact ccttttaacg tagataattc ttatgtgctg 1020

aactctttat actatctgct tgtagacaac aaaaacagat acaagatcaa cgggaactac 1080

aaagcaggag ctgcagttgg tagataccca gaagatgtgt acaatggagt gggaacctca 1140

gagggaaacc catggcaatt ggcgacagca tacgccggcc aaacctttta cacactggct 1200

tacaattctc tcaaaaacaa aaaaaatttg gttattgaga agttgaatta cgatctatac 1260

aactccttta tagctgactt aagtaagatt gactcctctt acgcttctaa ggattcattg 1320

acattgacct acggctcaga taactacaaa aatgtcatta agtcactttt acaattcggg 1380

gattctttct tgaaagtctt gttggaccat attgatgata atggtcagct aacagaggaa 1440

atcaacagat atacaggttt tcaagctggc gcagtttccc tcacttggag tagtggttca 1500

ctcttatctg caaacagagc cagaaacaag ttgatcgaat tgctttag 1548

<210> 48

<211> 1548

<212> DNA

<213> 扣囊复膜酵母

<400> 48

atgatcagac ttactgtttt cctcacagcc gtttttgcag cagtagcttc ttgtgttcca 60

gttgaattgg ataagagaaa tacaggtcat ttccaagctt actctggtta cactgtggct 120

agatctaact tcacacaatg gattcatgaa cagcctgccg tgagttggta ctatttgcta 180

caaaacattg attaccctga gggtcaattc aaatcagcta agccaggtgt tgttgtcgcg 240

agcccatcaa cttctgaacc agattacttc taccaatgga ctagagatac cgcaataacc 300

ttcttatctc taatcgcaga ggtagaagat cactcttttt caaatactac cctggcaaaa 360

gtggtcgagt actacatctc aaacacatac accttgcaga gagtctcaaa cccatcagga 420

aacttcgatt ctcctaatca tgacggctta ggagaaccaa agtttaatgt tgacgatacc 480

gcttatactg catcttgggg tagaccacag aatgatggcc ctgccttacg tgcatacgcc 540

atttccagat atctcaacgc tgtagcgaag cacaacaacg gtaagctgct tttagctggt 600

caaaatggga taccatactc ttccgcttca gacatttact ggaagattat caaaccagac 660

ttgcagcatg tcagtacaca ttggtcaact tctggttttg atttgtggga agagaaccaa 720

ggcactcact tctttacagc cttggttcaa ctaaaggcat tgtcttacgg aatccctttg 780

tccaagacat acaatgatcc tggattcact agttggctag aaaagcaaaa ggatgcactg 840

aactcataca ttaacagttc aggctttgtg aactccggta aaaagcatat tgttgaaagc 900

ccacaactat ctagcagagg tggtttagat tctgcaacct acatagcagc cttgatcaca 960

cacgacattg gggatgacga tacatacaca ccattcaacg tcgacaattc atacgttttg 1020

aatagcttat actacctact ggtagataac aaaaacagat ataagatcaa tggcaactac 1080

aaggccggtg ctgccgtagg aagataccct gaagatgtct acaacggagt tggtacatca 1140

gaaggtaacc catggcaatt agcaacagca tatgcgggcc agacatttta cactttggct 1200

tacaattcat tgaaaaacaa aaaaaattta gtgatagaaa agcttaacta tgacctttac 1260

aactctttca ttgccgattt atccaagatt gattcctcct acgcatcaaa ggactccttg 1320

acacttacat acggttctga caactacaaa aatgttatca agtctctctt gcaatttggt 1380

gattctttct tgaaggtttt actcgatcat atcgatgata atggtcaact aactgaggaa 1440

atcaacagat acactgggtt ccaagctgga gctgtctctt taacatggag ttcagggagt 1500

ttgttatctg ctaacagagc gcgtaacaaa cttattgagc ttctgtag 1548

<210> 49

<211> 1548

<212> DNA

<213> 扣囊复膜酵母

<400> 49

atgattagat taacagtatt tcttacagcc gttttcgcag ccgtcgcatc ctgtgttcca 60

gtagaattag ataagcgtaa tacaggacat tttcaagctt actctggcta tacagttgcg 120

agatctaact ttacacaatg gattcacgaa cagccagcag tttcttggta ctatttgctc 180

caaaacatcg actaccctga aggccaattc aagtctgcaa agccaggagt ggtcgtcgct 240

tctcctagta cttcagaacc agattacttc taccagtgga caagagacac tgctattacc 300

ttcctgagct taatcgctga agttgaagat cactcttttt ctaatacaac actggccaaa 360

gtagttgagt actacatctc taacacttac actctacaaa gagtgtcaaa cccttctggg 420

aacttcgaca gcccaaacca tgatggtttg ggggagccaa aattcaacgt tgatgataca 480

gcctacaccg catcttgggg tagaccacaa aacgacggac cagctttaag agcatacgca 540

atatctcgtt accttaatgc tgttgcaaag cacaataatg gaaagttgtt gttggctggt 600

caaaacggta ttccttactc ttcagcatct gatatctact ggaagattat caagccagat 660

cttcaacacg tatccacaca ttggtcaacc tccggcttcg atttatggga ggaaaatcag 720

ggtacacatt tcttcaccgc tctagtgcaa ttgaaggctt tgagttacgg cattccattg 780

tctaagactt acaacgatcc tggtttcacc tcatggcttg aaaagcagaa ggatgccctg 840

aatagctaca tcaactcatc tggttttgtt aactcaggga aaaagcatat agttgaatcc 900

ccacaactat catcaagagg aggtttagac tccgccacat acattgctgc cttgattaca 960

catgatattg gggatgatga cacatatact ccatttaacg tcgataacag ttatgtcctt 1020

aattccttat actatttgtt ggtcgataac aaaaatagat acaaaatcaa cggcaactac 1080

aaggctggcg cagcggtggg tagataccct gaggatgttt acaatggtgt aggtacatct 1140

gaaggcaatc catggcaatt agcgactgct tacgctggac aaactttcta cacacttgcg 1200

tacaactcat tgaaaaacaa aaaaaaccta gtcattgaaa agttgaatta cgatctgtac 1260

aactctttca tcgcagacct atcaaagatt gactcatctt atgcaagtaa agattcacta 1320

actttaacct acggtagtga taactacaaa aacgttatca agtctttact ccagtttggt 1380

gattcattct tgaaggtgtt gttagatcat atagacgaca atggtcaact cacagaggag 1440

ataaacagat acactggttt tcaagcagga gctgtttcac ttacttggtc aagtggttct 1500

ttgctttccg ccaacagagc cagaaacaag ctcatcgaat tactatag 1548

<210> 50

<211> 1797

<212> DNA

<213> 米根霉

<400> 50

atgaagttca tttccacttt cttgaccttc attttggctg ctgtctctgt caccgctgca 60

tctattccat ctagtgcatc tgtacaattg gactcctaca attacgatgg ttccacattt 120

tccggcaaga tttatgtcaa aaacatcgct tactctaaaa aggttactgt tgtgtacgca 180

gacggttctg acaactggaa caataacggc aacactattg ctgcatcatt ttcaggccca 240

atctctggat caaattacga atactggaca ttctcagcat cagtgaaggg cataaaggag 300

ttctacatca aatacgaagt ttcaggtaag acatattacg acaataacaa ctctgcaaac 360

taccaagtct caacttctaa acctactaca actactgcag ctacaaccac aactacagct 420

ccatcaactt ctacaacaac ccgtccatct agttcagagc ctgccacctt ccctactggt 480

aattctacca tcagctcttg gatcaaaaag caggaagata tttccagatt cgctatgctt 540

agaaacatca acccacctgg ttctgccaca gggtttatcg ccgcatcact ctctaccgct 600

ggtccagatt actactacgc gtggacaaga gatgccgctt tgacatctaa cgttatcgtt 660

tacgaataca acaccacatt gtctgggaat aagacaattc taaacgtact taaggattac 720

gtcacattca gtgttaagac acagtctact tcaacagttt gtaattgcct tggtgaacca 780

aagttcaatc cagacggcag tggttacaca ggtgcttggg gtagacctca aaatgatggt 840

cctgcagaaa gagcgactac atttgttctg tttgccgaca gctacttgac tcaaactaag 900

gatgcctcat acgtcactgg tacattaaag ccagcaattt tcaaagatct cgattacgtt 960

gttaacgtct ggagtaacgg atgtttcgat ttatgggagg aggtgaacgg agttcatttc 1020

tacaccctta tggttatgag aaaagggcta ttgttggggg ctgatttcgc gaagagaaac 1080

ggtgactcaa ctagagcctc aacttactct tctactgctt ccacaattgc taacaagata 1140

tcaagtttct gggttagctc aaacaactgg gtgcaagtat cccaatctgt cacaggaggt 1200

gtaagtaaaa aggggttaga cgttagcacc ctgttagctg cgaatctagg atcagtcgat 1260

gatggatttt tcactccagg ttctgaaaag atattagcta cagctgtggc agtcgaagat 1320

tcctttgcca gtctataccc aatcaacaaa aaccttccat catacttggg gaacgctatt 1380

ggaagatacc ctgaagatac atacaacggt aatggtaact cacaaggcaa tccttggttt 1440

ctggcggtta ccggctacgc agagttgtac tatagagcaa ttaaggaatg gatttctaat 1500

ggaggcgtta cagtgtcctc tatctcattg ccatttttca aaaagttcga tagctctgca 1560

acatccggta aaaagtacac cgtaggtact tctgacttca acaatttagc acaaaacatt 1620

gctcttgctg cagatcgttt cctatctact gtacaactcc atgcaccaaa caatggttca 1680

ttagcagagg aatttgatag aacaacaggt ttttctaccg gcgctagaga tttaacatgg 1740

tcccacgcct cattgataac agcatcctat gccaaagccg gtgctccagc tgcataa 1797

<210> 51

<211> 1797

<212> DNA

<213> 米根霉

<400> 51

atgaagttta tctccacgtt tttaaccttt atcctagcag ctgtcagcgt caccgccgca 60

tcaattccga gttcagcatc tgtacaactt gactcttaca attacgatgg cagcactttc 120

tcagggaaaa tttatgtgaa aaacatagca tatagtaaga aggttaccgt ggtatatgca 180

gacggttctg ataattggaa taataatgga aacactattg ccgccagttt ttccggccca 240

atttctggtt ccaattacga gtattggacc ttttctgcat cagtaaaagg catcaaggaa 300

ttctatatta agtacgaagt ttcaggtaag acatattacg ataacaataa ctcagcaaat 360

tatcaagtct ctacatctaa gcccacaaca acaactgctg ctaccaccac tacaaccgct 420

ccttctacca gcaccactac cagaccaagc tctagtgaac cggctacctt tcctaccgga 480

aacagtacca tctcaagctg gatcaaaaag caagaggaca taagtcgttt tgctatgttg 540

aggaacatta atcctccagg atccgcgacc ggtttcattg cagcatcact aagtactgcc 600

gggcctgatt attattatgc ttggactaga gacgctgcat taacatcaaa cgtgattgtt 660

tatgaatata atacgaccct ttccggtaat aaaacgatct tgaacgtatt aaaagactat 720

gtgaccttta gtgtgaagac ccaatctaca tctacagtgt gtaattgttt gggagaacct 780

aaattcaatc cagacggttc tgggtacact ggtgcctggg gtagacctca aaacgacggt 840

ccagcagaaa gagcaacaac ctttgttcta tttgctgact cttatttaac gcaaacaaag 900

gacgcctcat atgttacagg gaccctaaaa ccagcaattt tcaaagactt ggattatgtt 960

gttaatgttt ggagcaacgg atgttttgac ttgtgggagg aggttaacgg tgtacacttt 1020

tatacattga tggtgatgag aaaagggttg ctattgggag cagatttcgc taaaagaaat 1080

ggtgattcta caagagcgag cacatatagt agcaccgctt caacaatcgc caataaaatc 1140

tcatctttct gggtatctag caacaactgg gtacaagttt cccaaagtgt taccggcggt 1200

gtgtccaaaa agggtttaga cgttagcaca cttctagctg ctaatttggg tagcgttgat 1260

gacgggtttt ttactccagg tagtgagaag atactggcaa ccgcggtggc ggttgaagac 1320

agctttgctt cattgtatcc tataaataaa aatctgccct cttatctggg taatgcaatt 1380

ggcagatacc cagaagatac ctacaatggt aatggtaatt cccaggggaa cccatggttt 1440

ttggctgtta caggctacgc agaactttat taccgtgcaa tcaaggaatg gatttcaaat 1500

ggcggcgtca ctgtcagtag tataagtttg ccctttttta agaaatttga ttcctcagca 1560

acgtctggta aaaaatacac cgtaggtact agtgatttca ataatttggc ccaaaatatt 1620

gcgcttgctg ctgacaggtt tcttagtacc gttcagttgc acgctccaaa taatggctca 1680

ttggctgaag aatttgatcg tacgacaggt ttctccactg gtgctaggga tttgacttgg 1740

agtcatgcct ccttaatcac agcaagctat gctaaagctg gtgcacctgc tgcttag 1797

<210> 52

<211> 1815

<212> DNA

<213> 戴尔根霉

<400> 52

atgcagctgt tcaacttgcc attaaaggtt tcattctttt tggtcctatc atactttagt 60

ttgttggtgt cagccgcatc tattccatct tcagcatctg tacaattaga ctcctacaat 120

tacgacggct ctacattcag cggaaagatt tacgtgaaaa atattgcgta cagcaaaaaa 180

gtaactgtta tctatgccga cggatcagat aactggaaca acaatggaaa cactatcgct 240

gccagttact ctgcaccaat ttcaggttct aactacgaat attggacatt ctcagcctcc 300

atcaatggca ttaaggaatt ctacataaag tacgaagttt ccggtaagac ttactacgat 360

aacaacaatt ctgcaaacta tcaagtatca acatcaaaac ctactaccac caccgccaca 420

gctacaacta caactgcacc ttcaacatct accacaaccc caccatcttc tagcgaacca 480

gctacattcc caactggcaa ttctactatt tctagttgga tcaaaaaaca agagggtatt 540

tccagattcg caatgttgag aaacataaat ccaccaggat cagcaactgg attcatcgca 600

gcttctttgt ccacagcggg gccagattac tactacgcat ggaccagaga tgctgctttg 660

acaagtaacg ttattgttta cgaatacaat accactttgt ccggtaacaa gactattctt 720

aacgtcctaa aggattacgt tacattctct gttaagactc agtctacatc cacagtctgc 780

aattgtttgg gtgaaccaaa gttcaaccca gatggctctg gatacacagg tgcctggggt 840

cgtccacaaa acgatgggcc tgccgagaga gccactacat ttatcctatt tgctgactca 900

taccttacac aaacaaaaga tgcatcctac gtgactggaa cattaaagcc tgcaatcttc 960

aaagacctgg attacgttgt caacgtgtgg tctaacggct gtttcgatct atgggaagag 1020

gttaacggcg tgcacttcta cactctaatg gtcatgagaa agggtctgtt gttaggtgca 1080

gattttgcta agagaaacgg tgattctaca cgtgcttcta cctactcctc aacagcatca 1140

actattgcga acaagatttc ttcattttgg gtttcaagta ataactggat acaagtatct 1200

caaagcgtta cagggggtgt ctcaaaaaag ggtcttgatg tttctacatt actggctgct 1260

aatcttgggt ctgttgatga cggtttcttc acccctggtt ctgaaaagat cctcgctacc 1320

gccgtcgcgg ttgaggatag ttttgcttca ctctatccta taaacaaaaa ccttccttca 1380

tacttaggaa acagtatcgg tagataccca gaggatacat acaatggtaa tggcaattca 1440

cagggaaatc catggttcct tgctgttaca gggtacgcag aactttacta tagagctatt 1500

aaggaatgga tcggcaacgg cggtgtgaca gtttcctcaa tctcattgcc atttttcaaa 1560

aagtttgact ccagcgcgac atctggtaaa aagtatactg tggggacttc tgatttcaac 1620

aatttggctc aaaacattgc cttagctgcc gacagattct tatctaccgt acaactccat 1680

gcacataaca atggtagttt ggcagaggaa tttgatagaa ctacaggact ctctacaggt 1740

gcgagagatt taacttggtc acatgcaagt ttaattacag cctcttacgc aaaggctggt 1800

gctcctgctg cataa 1815

<210> 53

<211> 1815

<212> DNA

<213> 戴尔根霉

<400> 53

atgcagttat tcaacttacc acttaaggta tctttctttc tagtcttatc ttacttttca 60

ttgttagtat cagctgcctc tataccaagt tcagcatccg tacaactaga ttcatacaat 120

tacgacggtt caacattctc aggaaagata tacgtgaaaa atattgctta cagcaaaaag 180

gttactgtga tttacgcaga tgggtcagac aactggaata acaatggaaa cacaattgct 240

gcttcctatt ctgcccctat ttctggatct aactacgaat actggacttt ttcagcgagt 300

ataaacggaa ttaaggaatt ctatatcaaa tatgaagtct ctggtaagac ctactacgat 360

aacaacaact ccgcaaacta ccaagttagc acatcaaagc caaccacaac aactgctact 420

gcgacaacta caaccgcacc aagcacttct actacaacac ctcctagttc atctgagcca 480

gcaactttcc caactggtaa ttccactatt tcttcttgga tcaaaaaaca agagggtatc 540

tcaagattcg ccatgcttag aaatatcaat cctccaggct ctgcaacagg attcattgca 600

gcatctttat caactgcggg gccagactac tactacgcct ggactagaga tgcagctttg 660

acatcaaatg tgattgttta tgaatacaac acaactttgt ccggtaacaa gacaatcttg 720

aacgtcttga aggattatgt gacattctct gtcaagactc aatctacatc aacagtttgt 780

aactgtctcg gcgaaccaaa gttcaaccct gatggtagtg gttacactgg tgcttggggt 840

agaccacaaa acgatggtcc agcagagaga gctacaactt tcatcttgtt tgctgactct 900

tacctaacac aaaccaagga tgcaagctac gttactggaa cactaaagcc tgcaatcttt 960

aaagacctgg actatgttgt aaacgtttgg tcaaatggct gcttcgatct atgggaggaa 1020

gtgaacggtg ttcacttcta cacattaatg gtcatgagaa agggactctt gcttggtgca 1080

gactttgcta agagaaacgg tgattctaca cgtgcctcca cttactcctc cacagcttca 1140

accattgcca acaaaatctc ttctttctgg gtcagctcaa ataactggat tcaagtttct 1200

caatcagtta ctggtggtgt ttctaaaaag ggcctggatg tgtcaacctt gcttgctgcc 1260

aatttgggca gtgttgatga cgggttcttc accccaggtt ctgaaaagat cctcgccacc 1320

gcagttgccg ttgaagattc atttgctagt ttatacccaa tcaacaaaaa tctaccatca 1380

taccttggaa attcaatcgg tagatatcca gaggatacat acaacggtaa tggaaactct 1440

cagggtaacc cttggtttct tgcagttaca gggtacgctg aactgtacta cagagcgatt 1500

aaggaatgga ttggtaatgg cggcgtaact gttagttcta tttctctacc tttcttcaaa 1560

aagttcgata gttctgcaac atctggtaaa aagtacacag tcggcacttc cgattttaac 1620

aatttagctc agaacatagc actggcagct gatcgtttct tgagtacagt ccaattgcat 1680

gcccataaca acggtagttt ggctgaagag tttgatagaa ccaccggttt atcaaccggc 1740

gccagagatt taacatggtc ccatgcgtct ttgataactg cttcttacgc caaggctggg 1800

gcaccagctg cctga 1815

<210> 54

<211> 1818

<212> DNA

<213> 小孢根霉

<400> 54

atgaaactta tgaatccatc tatgaaggca tacgttttct ttatcttaag ctacttctct 60

ttactcgtta gctcagctgc ggtgccaacc tctgccgccg tacaagttga gtcatacaat 120

tatgacggta ccactttttc aggtagaata ttcgtcaaaa acattgccta ctcaaaggtc 180

gtaacagtta tctactccga tggatcagat aactggaaca ataacaacaa caaagtttct 240

gcagcttact cagaagcaat ttctgggtct aactacgaat actggacatt ctccgcaaag 300

ttatccggaa ttaaacagtt ttatgtcaaa tacgaagttt ctggttcaac atattacgac 360

aacaacggta ccaaaaacta ccaagtccaa gcaacctcag cgacatctac aacagctact 420

gcaaccacaa ctacagctac tggcacaaca actacttcta caggtccaac tagtactgca 480

tccgtatcat tccctaccgg taactcaaca atttcttcct ggataaaaaa tcaagaggaa 540

atcagccgtt ttgctatgtt gagaaatatc aatccacctg ggtctgccac agggttcata 600

gccgcatctc tgtccacagc cggcccagat tactattact cttggactag agattcagca 660

ctaacagcta atgtgatcgc ttacgaatac aacacaacat tcactggaaa caccaccctt 720

cttaagtact tgaaagatta cgttacattt tctgtcaaaa gccaatctgt atctaccgtt 780

tgtaactgtc tgggagaacc aaagttcaac gctgatggta gttcttttac aggtccatgg 840

ggcagaccac aaaacgacgg accagcagag agagctgtta cttttatgtt gattgctgac 900

agctacttga ctcaaactaa ggacgcatcc tacgttaccg gtacattaaa gccagcaatc 960

ttcaaagatc ttgattacgt agtttctgtt tggtctaacg gttgctacga tttatgggaa 1020

gaggttaatg gtgttcattt ctatactctc atggtcatga gaaagggttt gatcttaggt 1080

gccgacttcg ctgctagaaa tggtgactct agtagagctt caacctacaa gcaaactgca 1140

tcaacaatgg aatcaaagat cagttctttt tggtcagatt ctaacaacta cgtccaagtt 1200

tctcaatcag ttaccgccgg agtgtcaaaa aagggactag atgttagtac actattggcg 1260

gccaacattg gtagtctgcc tgatggcttt ttcactccag gctccgaaaa gatattggct 1320

acagcagtgg cgttagaaaa tgcattcgca tccttgtacc caattaactc taacctacct 1380

tcttacttgg gtaactcaat tggaagatat cctgaggata catacaacgg taatggcaac 1440

tctcagggga atccatggtt ccttgccgtc aacgcatacg cagaacttta ctacagagct 1500

attaaggaat ggattagtaa tggcaaggtg acagtatcca atatctcact acctttcttc 1560

aaaaagtttg attcttccgc cacttctgga aagacataca ctgctggtac atcagatttc 1620

aataacttgg ctcagaacat tgctttaggc gccgatagat tcctgtctac tgttaagttc 1680

cacgcataca ctaacgggag tctatcagaa gagtacgata gatctaccgg tatgagtact 1740

ggggctcgtg atttaacatg gtcccatgct tcattgatca cagtggcgta cgcaaaggcc 1800

ggtagtcctg cagcttag 1818

<210> 55

<211> 1488

<212> DNA

<213> 酿酒酵母

<400> 55

atgactacgg ataacgctaa ggcgcaactg acctcgtctt cagggggtaa cattattgtg 60

gtgtccaaca ggcttcccgt gacaatcact aaaaacagca gtacgggaca gtacgagtac 120

gcaatgtcgt ccggagggct ggtcacggcg ttggaagggt tgaagaagac gtacactttc 180

aagtggttcg gatggcctgg gctagagatt cctgacgatg agaaggatca ggtgaggaag 240

gacttgctgg aaaagtttaa tgccgtaccc atcttcctga gcgatgaaat cgcagactta 300

cactacaacg ggttcagtaa ttctattcta tggccgttat tccattacca tcctggtgag 360

atcaatttcg acgagaatgc gtggttggca tacaacgagg caaaccagac gttcaccaac 420

gagattgcta agactatgaa ccataacgat ttaatctggg tgcatgatta ccatttgatg 480

ttggttccgg aaatgttgag agtcaagatt cacgagaagc aactgcaaaa cgttaaggtc 540

gggtggttcc tgcacacacc attcccttcg agtgaaattt acagaatctt acctgtcaga 600

caagagattt tgaagggtgt tttgagttgt gatttagtcg ggttccacac atacgattat 660

gcaagacatt tcttgtcttc cgtgcaaaga gtgcttaacg tgaacacatt gcctaatggg 720

gtggaatacc agggcagatt cgttaacgta ggggccttcc ctatcggtat cgacgtggac 780

aagttcaccg atgggttgaa aaaggaatcc gtacaaaaga gaatccaaca attgaaggaa 840

actttcaagg gctgcaagat catagttggt gtcgacaggc tggattacat caaaggtgtg 900

cctcagaagt tgcacgccat ggaagtgttt ctgaacgagc atccagaatg gaggggcaag 960

gttgttctgg tacaggttgc agtgccaagt cgtggagatg tggaagagta ccaatattta 1020

agatctgtgg tcaatgagtt ggtcggtaga atcaacggtc agttcggtac tgtggaattc 1080

gtccccatcc atttcatgca caagtctata ccatttgaag agctgatttc gttatatgct 1140

gtgagcgatg tctgtttggt ctcgtccacc cgtgatggta tgaacttggt ttcctacgaa 1200

tatattgctt gccaagaaga aaagaaaggt tccttaatcc tgagtgagtt cacaggtgcc 1260

gcacaatcct tgaatggtgc tattattgta aatccttgga acaccgatga tctttctgat 1320

gccatcaacg aggccttgac tttgcccgat gtaaagaaag aagttaactg ggaaaaactt 1380

tacaaataca tctctaaata cacttctgcc ttctggggtg aaaatttcgt ccatgaatta 1440

tacagtacat catcaagctc aacaagctcc tctgccacca aaaactga 1488

<210> 56

<211> 2691

<212> DNA

<213> 酿酒酵母

<400> 56

atgaccacca ctgcccaaga caattctcca aagaagagac agcgtatcat caattgtgtc 60

acgcagctgc cctacaaaat ccaattggga gaaagcaacg atgactggaa aatatctgct 120

actacaggta acagcgcatt atattcctct ctagaatacc ttcaatttga ttctaccgag 180

tacgagcaac acgttgttgg ttggaccggc gaaataacaa gaaccgaacg caacctgttt 240

actagagaag cgaaagagaa accacaggat ctggacgatg acccactata tttaacaaaa 300

gagcagatca atgggttgac tactactcta caagatcata tgaaatctga taaagaggca 360

aagaccgata ctactcaaac agctcccgtt accaataacg ttcatcccgt ttggctactt 420

agaaaaaacc agagtagatg gagaaattac gcggaaaaag taatttggcc aaccttccac 480

tacatcttga atccttcaaa tgaaggtgag caagaaaaaa actggtggta cgactacgtc 540

aagtttaacg aagcttatgc acaaaaaatc ggggaagttt acaggaaggg tgacatcatc 600

tggatccatg actactacct actgctattg cctcaactac tgagaatgaa atttaacgac 660

gaatctatca ttattggtta tttccatcat gccccatggc ctagtaatga atattttcgc 720

tgtttgccac gtagaaaaca aatcttagat ggtcttgttg gggccaatag aatttgtttc 780

caaaatgaat ctttctcccg tcattttgta tcgagttgta aaagattact cgacgcaacc 840

gccaagaaat ctaaaaactc ttccgatagt gatcaatatc aagtgtctgt gtacggtggt 900

gacgtactcg tagattcttt gcctataggt gttaacacaa ctcaaatact gaaagatgct 960

ttcacgaagg atatagattc caaggttctt tccatcaagc aagcttatca aaacaaaaaa 1020

attattattg gtagagatcg tctggattcc gtcagaggcg tcgttcaaaa attaagagct 1080

tttgaaactt tcttggccat gtatccagaa tggcgagatc aagtggtatt gatccaggtc 1140

agcagtccta ctgctaacag aaattccccc caaactatca gattggaaca acaagtcaac 1200

gagttggtta attccataaa ttctgaatat ggtaatttga atttttctcc cgtccagcat 1260

tattatatga gaatccctaa agatgtatac ttgtccttac taagagttgc agacttatgt 1320

ttaatcacaa gtgttagaga cggtatgaat accactgctt tggaatacgt cactgtgaaa 1380

tctcacatgt cgaacttttt atgctacgga aatccattga ttttaagtga gttttctggc 1440

tctagtaacg tattgaaaga tgccattgtc gttaacccat gggattcggt ggccgtggct 1500

aaatctatta acatggcttt gaaattggac aaggaagaaa agtccaattt agaatcaaaa 1560

ttatggaaag aagttcctac aattcaagat tggactaata agtttttgag ttcattaaag 1620

gaaaaggcgt catctgatga tgatgtggaa aggaaaatga ctccagcact taatagacct 1680

gttcttttag aaaactacaa gcaggctaag cgtagattat tcctttttga ttacgatggt 1740

actttgaccc caattgtcaa agacccagct gcagctattc catcggcaag actttataca 1800

attctacaaa aattatgtgc cgatcctcat aatcaaatct ggattatttc tggtcgtgac 1860

cagaagtttt tgaacaagtg gttaggcggt aaacttcctc aactgggtct aagtgcggag 1920

catggatgtt tcatgaaaga tgtttcttgc caagattggg tcaatttgac cgaaaaagtt 1980

gatatgtctt ggcaagtacg cgtcaatgaa gtgatggaag aatttaccac aaggacccca 2040

ggttcattca tcgaaagaaa gaaagtcgct ctaacttggc attatagacg taccgttcca 2100

gaattgggtg aattccacgc caaagaactg aaagaaaaat tgttatcatt tactgatgac 2160

ttcgatttag aggtcatgga tggtaaagca aacattgaag ttcgtccaag attcgtcaac 2220

aaaggtgaaa tagtcaagag actagtctgg catcaacatg gcaaaccaca ggacatgttg 2280

aagggaatca gtgaaaaact acctaaggat gaaatgcctg attttgtatt atgtctgggt 2340

gatgacttca ctgacgaaga catgtttaga cagttgaata ccattgaaac ttgttggaaa 2400

gaaaaatatc ctgaccaaaa aaatcaatgg ggcaactacg gattctatcc tgtcactgtg 2460

ggatctgcat ccaagaaaac tgtcgcaaag gctcatttaa ccgatcctca gcaagtcctg 2520

gagactttag gtttacttgt tggtgatgtc tctctcttcc aaagtgctgg tacggtcgac 2580

ctggattcca gaggtcatgt caagaatagt gagagcagtt tgaaatcaaa gctagcatct 2640

aaagcttatg ttatgaaaag atcggcttct tacaccggcg caaaggtttg a 2691

<210> 57

<211> 250

<212> PRT

<213> 酿酒酵母

<400> 57

Met Pro Leu Thr Thr Lys Pro Leu Ser Leu Lys Ile Asn Ala Ala Leu

1 5 10 15

Phe Asp Val Asp Gly Thr Ile Ile Ile Ser Gln Pro Ala Ile Ala Ala

20 25 30

Phe Trp Arg Asp Phe Gly Lys Asp Lys Pro Tyr Phe Asp Ala Glu His

35 40 45

Val Ile His Ile Ser His Gly Trp Arg Thr Tyr Asp Ala Ile Ala Lys

50 55 60

Phe Ala Pro Asp Phe Ala Asp Glu Glu Tyr Val Asn Lys Leu Glu Gly

65 70 75 80

Glu Ile Pro Glu Lys Tyr Gly Glu His Ser Ile Glu Val Pro Gly Ala

85 90 95

Val Lys Leu Cys Asn Ala Leu Asn Ala Leu Pro Lys Glu Lys Trp Ala

100 105 110

Val Ala Thr Ser Gly Thr Arg Asp Met Ala Lys Lys Trp Phe Asp Ile

115 120 125

Leu Lys Ile Lys Arg Pro Glu Tyr Phe Ile Thr Ala Asn Asp Val Lys

130 135 140

Gln Gly Lys Pro His Pro Glu Pro Tyr Leu Lys Gly Arg Asn Gly Leu

145 150 155 160

Gly Phe Pro Ile Asn Glu Gln Asp Pro Ser Lys Ser Lys Val Val Val

165 170 175

Phe Glu Asp Ala Pro Ala Gly Ile Ala Ala Gly Lys Ala Ala Gly Cys

180 185 190

Lys Ile Val Gly Ile Ala Thr Thr Phe Asp Leu Asp Phe Leu Lys Glu

195 200 205

Lys Gly Cys Asp Ile Ile Val Lys Asn His Glu Ser Ile Arg Val Gly

210 215 220

Glu Tyr Asn Ala Glu Thr Asp Glu Val Glu Leu Ile Phe Asp Asp Tyr

225 230 235 240

Leu Tyr Ala Lys Asp Asp Leu Leu Lys Trp

245 250

<210> 58

<211> 250

<212> PRT

<213> 酿酒酵母

<400> 58

Met Gly Leu Thr Thr Lys Pro Leu Ser Leu Lys Val Asn Ala Ala Leu

1 5 10 15

Phe Asp Val Asp Gly Thr Ile Ile Ile Ser Gln Pro Ala Ile Ala Ala

20 25 30

Phe Trp Arg Asp Phe Gly Lys Asp Lys Pro Tyr Phe Asp Ala Glu His

35 40 45

Val Ile Gln Val Ser His Gly Trp Arg Thr Phe Asp Ala Ile Ala Lys

50 55 60

Phe Ala Pro Asp Phe Ala Asn Glu Glu Tyr Val Asn Lys Leu Glu Ala

65 70 75 80

Glu Ile Pro Val Lys Tyr Gly Glu Lys Ser Ile Glu Val Pro Gly Ala

85 90 95

Val Lys Leu Cys Asn Ala Leu Asn Ala Leu Pro Lys Glu Lys Trp Ala

100 105 110

Val Ala Thr Ser Gly Thr Arg Asp Met Ala Gln Lys Trp Phe Glu His

115 120 125

Leu Gly Ile Arg Arg Pro Lys Tyr Phe Ile Thr Ala Asn Asp Val Lys

130 135 140

Gln Gly Lys Pro His Pro Glu Pro Tyr Leu Lys Gly Arg Asn Gly Leu

145 150 155 160

Gly Tyr Pro Ile Asn Glu Gln Asp Pro Ser Lys Ser Lys Val Val Val

165 170 175

Phe Glu Asp Ala Pro Ala Gly Ile Ala Ala Gly Lys Ala Ala Gly Cys

180 185 190

Lys Ile Ile Gly Ile Ala Thr Thr Phe Asp Leu Asp Phe Leu Lys Glu

195 200 205

Lys Gly Cys Asp Ile Ile Val Lys Asn His Glu Ser Ile Arg Val Gly

210 215 220

Gly Tyr Asn Ala Glu Thr Asp Glu Val Glu Phe Ile Phe Asp Asp Tyr

225 230 235 240

Leu Tyr Ala Lys Asp Asp Leu Leu Lys Trp

245 250

<210> 59

<211> 2995

<212> DNA

<213> 人工序列

<220>

<223> 合成多核苷酸

<400> 59

tgagctccgg gtgggaggaa ggcgcggcaa ttagaatgtg tgggtgcgga agctcgccgc 60

tcccatcaag agagtggaag acgtatggtc tgggtgcgaa gtaccaccac gtttcttttt 120

catctcttaa gtgggattct tacgaaacac gtcacagggt caaaagaaag agaacaaaag 180

caatattgta attgtctcag tccacggcaa tgacatggca tggccccgaa ggcttttttt 240

gtctgtcttc cttgggtctt accccgccac gcgttaatag tgagacaagc aggaaatccg 300

tatcattttc tcgcatacac gaacccgcgt gcgcctggta aattgcagga ttctcattgt 360

ccggttttct ttatgggaat aatcatcatc accattatca ctgttactct tgcgatcatc 420

atcattaaca taattttttt aacgctgttt gatgatggta tgtgctttta ttgttcctta 480

ctcacctttt cctttgtgtc ttttaatttt gaccattttg accattttga cctttgatga 540

tgtgtgagtt cctcttttct ttttttcttt tcttttttcc tttttttttc ttttcttact 600

gtgttaatca ctttctttcc tttttgttca tattgtcgtc ttgttcattt tcgttcaatt 660

gataatgtat ataaatcttt cgtaagtatc tcttgattgc catttttttc tttccaagtt 720

tccttgttct cgaggccaga aaaaggaagt gtttccctcc ttcttgaatt gatgttaccc 780

tcataaagca cgtggcctct tatcgagaaa gaaattaccg tcgctcgtga tttgtttgca 840

aaaagaacaa aactgaaaaa acccagacac gctcgacttc ctgtcttcct attgattgca 900

gcttccaatt tcgtcacaca acaaggtcct agcgacggct cacaggtttt gtaacaagca 960

atcgaaggtt ctggaatggc gggaaagggt ttagtaccac atgctatgat gcccactgtg 1020

atctccagag caaagttcgt tcgatcgtac tgttactctc tctctttcaa acagaattgt 1080

ccgaatcgtg tgacaacaac agcctgttct cacacactct tttcttctaa ccaagggggt 1140

ggtttagttt agtagaacct cgtgaaactt acatttacat atatataaac ttgcataaat 1200

tggtcaatgc aagaaataca tatttggtct tttctaattc gtagtttttc aagttcttag 1260

atgctttctt tttctctttt ttacagatca tcaaggaagt aattatctac tttttacaag 1320

tctagaatga caacatcaaa tacctacaaa ttctatctaa acggtgaatg gagagaatct 1380

tcctctggag aaactattga gataccatca ccatacttac atgaagtgat cggacaggtt 1440

caagcaatca ctagaggaga ggttgacgaa gcgattgcta gcgctaagga agcacagaaa 1500

tcttgggctg aggcatctct acaagataga gctaagtact tgtacaaatg ggcagatgaa 1560

ttggtaaaca tgcaagacga aatcgccgat atcatcatga aggaagtggg caagggttac 1620

aaagacgcta aaaaggaggt tgttagaacc gccgatttca tcagatacac cattgaagag 1680

gcactccata tgcacggtga atccatgatg ggcgattcat ttcctggtgg aacaaaatct 1740

aagctagcaa taatccaaag agcgcctctg ggtgtagtct tagccatcgc tccattcaat 1800

taccctgtaa acctttctgc tgcaaaattg gcaccagcct taattatggg taacgctgtg 1860

atattcaagc cagcaactca gggtgctatt tccggcatca aaatggttga agctttgcat 1920

aaggctggtt tgccaaaggg tttggttaac gttgccacag gtagaggtag cgtcataggc 1980

gattatttgg tcgaacacga agggataaac atggtttcct tcaccggtgg cactaacact 2040

ggtaagcatt tagcaaaaaa ggcctcaatg attccattag tcttggaact tggtggcaaa 2100

gatccaggca tcgttcgtga agatgcagac ctacaagatg ctgcgaatca tatcgtatct 2160

ggtgcgttca gttactcagg gcagagatgt acagccatta agagagtcct tgttcatgaa 2220

aatgttgctg atgaactggt atcattggtt aaggaacaag tggcaaagct ttctgtggga 2280

tcaccagagc aagattcaac aattgttcct ctgattgacg ataagtccgc tgattttgtt 2340

cagggtttag tggacgatgc agtcgaaaag ggcgctacaa ttgtcattgg gaacaagaga 2400

gaacgtaacc taatctaccc aacattgatt gatcacgtca cagaggaaat gaaagttgcc 2460

tgggaggaac cattcggtcc tattcttcca attattagag ttagtagcga cgagcaagct 2520

attgaaattg caaataagag tgagttcgga ttacaagctt ctgtgtttac caaagacata 2580

aacaaggcat tcgcaatcgc aaataagatt gagactggtt cagtgcaaat caacggtaga 2640

acagagagag gaccagatca ctttcctttt atcggggtta agggatctgg gatgggtgcc 2700

caaggcatca gaaagtcttt ggaatctatg actagagaaa aagttactgt cttaaatctc 2760

gtatgattaa acaggcccct tttcctttgt cgatatcatg taattagtta tgtcacgctt 2820

acattcacgc cctcctccca catccgctct aaccgaaaag gaaggagtta gacaacctga 2880

agtctaggtc cctatttatt tttttatagt tatgttagta ttaagaacgt tatttatatt 2940

tcaaattttt cttttttttc tgtacaaacg cgtgtacgca tgtaacgggc agacg 2995

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号