公开/公告号CN112166188A
专利类型发明专利
公开/公告日2021-01-01
原文格式PDF
申请/专利权人 嘉吉有限公司;
申请/专利号CN201980035013.3
申请日2019-03-27
分类号C12N9/02(20060101);C12N9/16(20060101);C12N9/34(20060101);C12P7/06(20060101);C12N15/81(20060101);
代理机构11269 北京嘉和天工知识产权代理事务所(普通合伙);
代理人缪策;甘玲
地址 美国明尼苏达州
入库时间 2023-06-19 09:23:00
相关申请
本申请要求于2018年3月27日提交的标题为“用于使用经工程化的酵母产生乙醇的方法”的美国临时申请序列号62/648,679(其通过引用被整体并入本文)的在35u.s.c§119(e)下的权益。
领域
本公开涉及通过基因工程产生乙醇。
背景
乙醇是可以通过天然产物的发酵产生的可再生生物燃料。通过发酵产生的乙醇具有许多工业应用(包含产生产品,如溶剂、提取剂、防冻剂、以及作为各种有机化学物质的合成的中间产物)。乙醇还广泛用于工业(如涂料、印刷油墨和粘合剂)中。微生物(包含酵母)可以通过各种底物(包含糖类和淀粉)的发酵来产生乙醇。使用酵母产生乙醇的优势包含使用多种底物的能力、对高乙醇浓度的耐受性和产生大乙醇产量的能力(Mohd Azhar etal.,Biochem Biophys Rep(2017)10:52-61)。然而,使用酵母发酵产生乙醇也导致副产物的产生。
概述
本公开的方面涉及新型经工程化的酵母和使用该新型经工程化的酵母产生乙醇的方法的开发。令人惊讶的是,本文所描述的经工程化的酵母产生高的乙醇产率而不表现出发酵损失,并且产生降低水平的副产物(如甘油)。
本公开的方面涉及经工程化的酵母,该经工程化的酵母包括:编码甘油醛-3-磷酸脱氢酶(E.C.1.2.1.9)的重组核酸;编码甘油-3-磷酸磷酸酶(E.C.3.1.3.21)的基因的降低或消除的表达;以及编码葡糖淀粉酶的重组核酸,其中酵母能够在测试1条件下在48小时内产生至少100g/kg的乙醇并且产生少于1.5g/kg的残余葡萄糖。
在一些实施方案中,经工程化的酵母是全基因组复制后的酵母菌种。在一些实施方案中,酵母是酿酒酵母(Saccharomyces cerevisiae)(酿酒酵母(S.cerevisiae))。
在一些实施方案中,经工程化的酵母产生比对照菌株高至少0.5%的乙醇产率。在一些实施方案中,通过以下测定乙醇产率:(时间终点处的乙醇滴度-时间零点处的乙醇滴度)除以时间零点处的总葡萄糖当量。在一些实施方案中,经工程化的酵母产生比对照菌株少30%的甘油、比对照菌株少40%的甘油、或比对照菌株少50%的甘油。在一些实施方案中,通过测试4测定甘油产生。
在一些实施方案中,葡糖淀粉酶(GA)与SEQ ID NO:38(扣囊复膜酵母GA(Saccharomycopsis fibuligera GA)具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,GA与SEQ ID NO:39(米根霉amyA(Rhizopus oryzae amyA))具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,GA与SEQ ID NO:41(小孢根霉GA(Rhizopus microsporus GA))具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,GA与SEQ ID NO:40(戴尔根霉GA(Rhizopus delemar GA))具有至少80%、至少85%、至少90%、或至少95%的序列一致性。
在一些实施方案中,编码甘油醛-3-磷酸脱氢酶(E.C.1.2.1.9)的核酸与SEQ IDNO:45具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,编码甘油醛-3-磷酸脱氢酶(E.C.1.2.1.9)的核酸编码与SEQ ID NO:42具有至少80%、至少85%、至少90%、或至少95%的序列一致性的蛋白质。在一些实施方案中,经工程化的酵母包括与SEQ ID NO:59具有至少80%、至少85%、至少90%、或至少95%的序列一致性的核酸。
在一些实施方案中,经工程化的酵母具有甘油-3-磷酸脱氢酶(E.C.1.1.1.8)的降低的或消除的表达。
在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPP1、GPP2、GPD1、或GPD2的降低的或消除的表达。在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPP1的降低的或消除的表达。在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPP2的降低的或消除的表达。在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPD1的降低的或消除的表达。在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPD2的降低的或消除的表达。
在一些实施方案中,经工程化的酵母还包括编码海藻糖-6-磷酸合酶(Tps1;E.C.2.4.1.15)的核酸。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps1;E.C.2.4.1.15)的核酸与SEQ ID NO:55具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps1;E.C.2.4.1.15)的核酸编码与SEQ ID NO:43具有至少80%、至少85%、至少90%、或至少95%的序列一致性的蛋白质。
在一些实施方案中,经工程化的酵母还包括编码海藻糖-6-磷酸合酶(Tps2;EC3.1.3.12)的核酸。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps2;EC 3.1.3.12)的核酸与SEQ ID NO:56具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps2;EC 3.1.3.12)的核酸编码与SEQ ID NO:44具有至少80%、至少85%、至少90%、或至少95%的序列一致性的蛋白质。
本公开的方面涉及经工程化的酿酒酵母,该经工程化的酿酒酵母包括:编码甘油醛-3-磷酸脱氢酶(E.C.1.2.1.9)的重组核酸;以及编码甘油-3-磷酸磷酸酶(E.C.3.1.3.21)的基因的降低或消除的表达,其中酵母能够在测试2条件下在48小时内产生至少100g/kg的乙醇并且产生少于1.5g/kg的残余葡萄糖。
在一些实施方案中,经工程化的酿酒酵母产生比对照菌株高至少0.5%的乙醇产率。在一些实施方案中,通过下式测定乙醇产率:(时间终点处的乙醇滴度-时间零点处的乙醇滴度)除以时间零点处的总葡萄糖当量。在一些实施方案中,经工程化的酵母产生比对照菌株少30%的甘油、比对照菌株少40%的甘油、或比对照菌株少50%的甘油。在一些实施方案中,通过测试4测定甘油产生。
在一些实施方案中,GA与SEQ ID NO:38(扣囊复膜酵母GA)具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,GA与SEQ ID NO:39(米根霉amyA)具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,GA与SEQ ID NO:41(小孢根霉GA)具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,GA与SEQ ID NO:40(戴尔根霉GA)具有至少80%、至少85%、至少90%、或至少95%的序列一致性。
本公开的方面涉及经工程化的酵母,该经工程化的酵母包括编码甘油醛-3-磷酸脱氢酶(E.C.1.2.1.9)的外源性核酸,以及编码与SEQ ID NO:38(扣囊复膜酵母GA)、SEQ IDNO:41(小孢根霉GA)、SEQ ID NO:40(戴尔根霉GA)、或SEQ ID NO:39(米根霉amyA)具有80%或更大一致性的GA的外源性核酸,其中酵母能够在测试1条件下在48小时内产生至少100g/kg的乙醇并且具有少于1.5g/kg的残余葡萄糖。
在一些实施方案中,酵母是全基因组复制后的酵母菌种。在一些实施方案中,酵母是酿酒酵母。
在一些实施方案中,经工程化的酵母产生比对照菌株高至少0.5%的乙醇产率。在一些实施方案中,通过下式测定乙醇产率:(时间终点处的乙醇滴度-时间零点处的乙醇滴度)除以时间零点处的总葡萄糖当量。
在一些实施方案中,经工程化的酵母产生比对照菌株少30%的甘油、比对照菌株少40%的甘油、或比对照菌株少50%的甘油。在一些实施方案中,通过测试4测定甘油产生。
在一些实施方案中,经工程化的酵母具有编码甘油-3-磷酸磷酸酶(E.C.3.1.3.21)的基因的降低的或消除的表达。
在一些实施方案中,编码甘油醛-3-磷酸脱氢酶(E.C.1.2.1.9)的核酸与SEQ IDNO:45具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,编码甘油醛-3-磷酸脱氢酶(E.C.1.2.1.9)的核酸编码与SEQ ID NO:42具有至少80%、至少85%、至少90%、或至少95%的序列一致性的蛋白质。在一些实施方案中,经工程化的酵母包括与SEQ ID NO:59具有至少80%、至少85%、至少90%、或至少95%的序列一致性的核酸。
在一些实施方案中,经工程化的酵母具有甘油-3-磷酸脱氢酶(E.C.1.1.1.8)的降低的或消除的表达。
在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPP1、GPP2、GPD1、或GPD2的降低的或消除的表达。在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPP1的降低的或消除的表达。在一些实施方案中,其中经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPP2的降低的或消除的表达。在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPD1的降低的或消除的表达。在一些实施方案中,经工程化的酵母是酿酒酵母,并且经工程化的酵母具有GPD2的降低的或消除的表达。
在一些实施方案中,经工程化的酵母还包括编码海藻糖-6-磷酸合酶(Tps1;E.C.2.4.1.15)的核酸。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps1;E.C.2.4.1.15)的核酸与SEQ ID NO:55具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps1;E.C.2.4.1.15)的核酸编码与SEQ ID NO:43具有至少80%、至少85%、至少90%、或至少95%的序列一致性的蛋白质。
在一些实施方案中,经工程化的酵母还包括编码海藻糖-6-磷酸合酶(Tps2;EC3.1.3.12)的核酸。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps2;EC 3.1.3.12)的核酸与SEQ ID NO:56具有至少80%、至少85%、至少90%、或至少95%的序列一致性。在一些实施方案中,编码海藻糖-6-磷酸合酶(Tps2;EC 3.1.3.12)的核酸编码与SEQ ID NO:44具有至少80%、至少85%、至少90%、或至少95%的序列一致性的蛋白质。
本公开的方面涉及用于产生乙醇的方法,方法包括用发酵基质使本文所描述的经工程化的酵母发酵。在一些实施方案中,发酵基质包括淀粉。在一些实施方案中,发酵基质包括葡萄糖。在一些实施方案中,发酵基质包括蔗糖。在一些实施方案中,从玉米、小麦和/或木薯获得淀粉。在一些实施方案中,方法包含用葡糖淀粉酶补充。
本公开的方面涉及用于产生海藻糖的方法,方法包括用发酵基质使本文公开的经工程化的酵母中的任何一种发酵。
本发明的限制中的每个可以涵盖本发明的各种实施方案。因此,预期涉及任何一个要素或要素的组合的本发明的限制中的每个都可以包含在本发明的每个方面中。本发明的应用不限于在以下描述中所示或者在附图中所图示说明的构造细节和组分的布置。本发明能够具有其他实施方案并且能够以各种方式被实践或进行。
附图的简要说明
附图并非旨在按比例绘制。为了清楚起见,并非在每个附图中都标记了每个组分。在附图中:
图1是示出用菌株1-22在玉米醪中产生乙醇的图表,菌株1-22在米根霉(Ro)葡糖淀粉酶菌株背景中在GPP1基因座处含有蜡样芽胞杆菌(Bc)gapN基因。
图2是示出用菌株1-22在玉米醪中的乙醇产率的表格。
图3A-3C图3A是示出用菌株1-22的乙醇滴度的图表。图3B是示出用菌株1-22的残余葡萄糖滴度的图表。图3C是示出用菌株1-22的甘油滴度的图表。
图4是示出用菌株1-20和菌株1-22的乙醇产生的比较的图表。图5是示出在轻浸渍水/液化物(玉米湿磨原料)气锁摇瓶中用菌株1-22产生乙醇的表格。
图6是示出玉米醪中的乙醇滴度的图表。
图7是示出玉米醪中的残余葡萄糖的图表。
图8是示出玉米醪中的甘油滴度的图表。
图9是示出在47小时处玉米醪中相对于菌株1的菌株1-25的乙醇滴度增加的图表。
图10A-10B图10A是示出玉米醪中相对于菌株1的菌株1-25的甘油降低的图表。图10B是示出玉米醪中发酵结束(47小时)时的残余葡萄糖的图表。
图11是示出所示菌株在48小时处的甘油滴度的图表。
图12是示出所示菌株在48小时处的乙醇滴度的图表。
图13是示出所示菌株在48小时处的残余葡萄糖的图表。
详细说明
本公开的方面涉及用于乙醇产生的经基因工程化的微生物。先前报道的使酵母工程化以降低乙醇发酵中的副产物产生的尝试受到发酵损失的阻碍。令人惊讶的是,本文所描述的经工程化的酵母展现出增加的乙醇滴度而没有发酵损失,并且产生降低量的副产物(包含甘油)。因此,本文所描述的新型经工程化的酵母代表了用于通过发酵产生乙醇的出乎意料有效的新方法。
本发明的应用不限于在以下描述中所示或者在附图中所图示说明的构造细节和组分的布置。本发明能够具有其他实施方案并且能够以各种方式被实践或进行。另外,本文所使用的措词和术语是出于描述的目的,而不应当被认为是限制性的。本文中“包含”、“包括”或“具有”、“含有”、“涉及”及其变体的使用旨在涵盖其后列出的项目及其等同物以及附加项目。
降低的甘油产生
甘油-3-磷酸磷酸酶
本文所描述的经工程化的酵母菌株可以包含参与甘油产生的一种或更多种酶的基因修饰。例如,本文所描述的经工程化的酵母菌株可以具有编码甘油-3-磷酸磷酸酶(Gpp;对应于E.C.3.1.3.21;也称为“甘油-1-磷酸酶”)的一个或更多个基因的降低的或消除的表达。甘油-3-磷酸磷酸酶将甘油-3-磷酸水解成甘油,并且从而调控甘油-3-磷酸(葡萄糖、脂质和能量代谢的代谢中间产物)的细胞水平(Mugabo et al.,PNAS(2016)113:E430-439)。
酿酒酵母(酿酒酵母(S.cerevisiae))具有两种甘油-3-磷酸磷酸酶旁系同源物,分别称为Gpp1p和Gpp2p(分别由GPP1(UniProt号P41277)基因和GPP2(UniProt号P40106)基因编码)(Norbeck et al.(1996)J.Biol.Chem.271(23):13875-81;Pahlman et al.(2001)J.Biol.Chem.276(5):3555-63)。在一些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPP1的降低的或消除的表达。在其他实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPP2的降低的或消除的表达。在其他实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPP1和GPP2两者的降低的或消除的表达。
Gpp1p(UniProt号P41277)的氨基酸序列(SEQ ID NO:57)是:
Gpp2p(UniProt号P40106)的氨基酸序列(SEQ ID NO:58)是:
应当理解的是,实现编码甘油-3-磷酸磷酸酶的基因的降低的或消除的表达的任何手段都与本发明的方面相容。例如,可以通过破坏基因的序列和/或控制该基因表达的一个或更多个调控区(如通过将一个或更多个突变或插入引入到基因的序列中或控制该基因表达的一个或更多个调控区中)来实现编码甘油-3-磷酸磷酸酶的基因的降低的或消除的表达。
在一些实施方案中,编码甘油-3-磷酸磷酸酶的基因(如GPP1基因)的表达降低至少大约10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。在一些实施方案中,编码甘油-3-磷酸磷酸酶的基因(如GPP1基因)的表达被消除。可以通过本领域普通技术人员已知的任何手段(如通过将核酸片段插入到GPP1基因座或围绕GPP1基因座的调控区中)来消除编码甘油-3-磷酸磷酸酶的基因(如GPP1基因)的表达。
在一些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)是二倍体,并且具有GPP1基因的两个拷贝的降低的或消除的表达。在一些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)是二倍体,并且在GPP1基因的两个拷贝中都含有缺失和/或插入。
甘油-3-磷酸脱氢酶(E.C.1.1.1.8)
本文所描述的经工程化的酵母可以具有编码甘油-3-磷酸脱氢酶(Gpd;对应于E.C.1.1.1.8)的一个或更多个基因的降低的或消除的表达。
酿酒酵母具有两种甘油-3-磷酸脱氢酶,分别称为Gpd1p和Gpd2p(分别由GPD1(UniProt号Q00055)基因和GPD2(UniProt号P41911)基因编码)。在一些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPD1的降低的或消除的表达。在其他实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPD2的降低的或消除的表达。在其他实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPD1和GPD2两者的降低的或消除的表达。
应当理解的是,实现编码甘油-3-磷酸脱氢酶的基因的降低的或消除的表达的任何手段都与本发明的方面相容。例如,可以通过破坏基因的序列和/或控制该基因表达的一个或更多个调控区(如通过将一个或更多个突变或插入引入到基因的序列中或控制该基因表达的一个或更多个调控区中)来实现编码甘油-3-磷酸脱氢酶的基因的降低的或消除的表达。
在一些实施方案中,编码甘油-3-磷酸脱氢酶的基因(如GPD1基因)的表达降低至少大约10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。在一些实施方案中,编码甘油-3-磷酸脱氢酶的基因(如GPD1基因)的表达被消除。可以通过本领域普通技术人员已知的任何手段(如通过将核酸片段插入到GPD1基因座或围绕GPD1基因座的调控区中)来消除编码甘油-3-磷酸脱氢酶的基因(如GPD1基因)的表达。
在一些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)是二倍体,并且具有GPD1基因的两个拷贝的降低的或消除的表达。在一些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)是二倍体,并且在GPD1基因的两个拷贝中都包含缺失和/或插入。在其他实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPD1基因的一个拷贝的降低的或消除的表达。
在一些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPP1和/或GPP2的降低的或消除的表达,并且还具有GPD1和/或GPD2的降低的或消除的表达。在某些实施方案中,本文所描述的经工程化的酵母(如酿酒酵母)具有GPP1的两个拷贝的降低的或消除的表达,并且还具有GPD1的一个拷贝的降低的或消除的表达。
甘油醛-3-磷酸脱氢酶(GAPN;E.C.1.2.1.9)
本文所描述的经工程化的酵母重组表达编码甘油醛-3-磷酸脱氢酶(gapN;对应于E.C.1.2.1.9;也称为“NADP依赖性非磷酸化甘油醛-3-磷酸脱氢酶”)的一种或更多种核酸。GapN酶将D-甘油醛3-磷酸转化成3-磷酸-D-甘油酯(Rosenberg et al.,J Biol Chem(1955)217:361-71)。
应当理解的是,编码gapN酶的重组核酸可以来自任何来源。重组表达编码gapN酶的核酸的经工程化的酵母可以含有编码gapN酶的内源基因或者可以不含有编码gapN酶的内源基因。在一些实施方案中,重组表达编码gapN酶的核酸的经工程化的酵母不含有编码gapN酶的基因的内源拷贝。因此,在这样的实施方案中,编码gapN酶的核酸来源于与经工程化的酵母不同的物种或生物体。
在其他实施方案中,重组表达编码gapN酶的核酸的经工程化的酵母确实含有编码gapN酶的基因的内源拷贝。在一些这样的实施方案中,编码gapN酶的基因的内源拷贝或该基因的调控区(如启动子)被工程化以增加编码gapN酶的基因的表达。在其他这样的实施方案中,将编码gapN酶的核酸引入到酵母中。在这样的实施方案中,被引入到酵母中的编码gapN酶的核酸可以来源于与其在其中表达的经工程化的酵母相同的物种或生物体,或者可以来源于与其在其中表达的经工程化的酵母不同的物种或生物体。
在一些实施方案中,编码gapN酶的重组核酸包括蜡样芽孢杆菌基因(例如,GAPN,对应于UniProt号Q2HQS1)。在一些实施方案中,编码GapN酶或其部分的重组核酸是密码子优化的。在一些实施方案中,编码gapN酶或其部分的重组核酸包括SEQ ID NO:45。
在一些实施方案中,编码gapN酶或其部分的重组核酸与SEQ ID NO:45的序列具有至少或约50%、至少或约60%、至少或约70%、至少或约75%、至少或约80%、至少或约81%、至少或约82%、至少或约83%、至少或约84%、至少或约85%、至少或约86%、至少或约87%、至少或约88%、至少或约89%、至少或约90%、至少或约91%、至少或约92%、至少或约93%、至少或约94%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、或者至少或约99.9%的序列一致性。
在一些实施方案中,gapN蛋白包括SEQ ID NO:42。在一些实施方案中,gapN蛋白与SEQ ID NO:42的序列具有至少或约50%、至少或约60%、至少或约70%、至少或约75%、至少或约80%、至少或约81%、至少或约82%、至少或约83%、至少或约84%、至少或约85%、至少或约86%、至少或约87%、至少或约88%、至少或约89%、至少或约90%、至少或约91%、至少或约92%、至少或约93%、至少或约94%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、或者至少或约99.9%的序列一致性。
本领域普通技术人员将理解GAPN基因可以来源于任何来源,并且可以使用常规方法进行工程化,如以改善在宿主细胞中的表达。
海藻糖生物合成
本文描述的经工程化的酵母可以重组表达编码参与海藻糖生物合成的一种或更多种蛋白质的一个或更多个基因(Gancedo et al.(2004)FEMS Yeast Research 4:351-359)。参与海藻糖生物合成的酶的非限制性实例包含海藻糖-6-磷酸合酶(Tps1;E.C.2.4.1.15)和海藻糖-6-磷酸磷酸酶(Tps2;EC 3.1.3.12)。
在酿酒酵母中,Tps1由TPS1基因(UniProt号C7GY09)编码,并且Tps2由TPS2基因(UniProt号P31688)编码。应当理解的是,编码Tps1酶或Tps2酶的重组核酸可以来自任何来源。重组表达编码Tps1酶或Tps2酶的核酸的经工程化的酵母细胞可以含有编码Tps1酶或Tps2酶的内源基因或者可以不含有编码Tps1酶或Tps2酶的内源基因。在一些实施方案中,重组表达编码Tps1酶或Tps2酶的核酸的经工程化的酵母细胞不含有编码Tps1酶或Tps2酶的基因的内源拷贝。因此,在这样的实施方案中,编码Tps1酶或Tps2酶的核酸来源于与经工程化的酵母细胞不同的物种或生物体。
在其他实施方案中,重组表达编码Tps1酶或Tps2酶的核酸的经工程化的酵母不含有编码Tps1酶或Tps2酶的基因的内源拷贝。在一些这样的实施方案中,编码Tps1酶或Tps2酶的基因的内源拷贝或者该基因的调控区(如启动子)被工程化以增加编码Tps1酶或Tps2酶的基因的表达。在其他实施方案中,编码Tps1酶或Tps2酶的核酸被引入酵母。在这样的实施方案中,被引入酵母的编码Tps1酶或Tps2酶的核酸可以来源于与在其中表达它的经工程化的酵母相同的物种或生物体,或者可以来源于与在其中表达它的经工程化的酵母不同的物种或生物体。
在一些实施方案中,编码Tps1酶或Tps2酶的重组核酸包括酿酒酵母基因(例如,对应于UniProt号C7GY09或UniProt号P31688)。在一些实施方案中,Tps1对应于SEQ ID NO:43。在一些实施方案中,Tps2对应于SEQ ID NO:44。本领域普通技术人员将理解,TPS1基因或TPS2基因可以来源于任何来源,并且可以使用常规方法被工程化,如以改善宿主细胞中的表达。
葡糖淀粉酶
本文所描述的经工程化的酵母重组表达编码葡糖淀粉酶(E.C.3.2.1.3)的核酸。葡糖淀粉酶从直链淀粉链的非还原端连续地水解末端1,4-连接的α-D-葡萄糖残基以释放游离葡萄糖(参见例如,Mertens et al.,Curr Microbiol(2007)54:462-6)。
应当理解的是,编码葡糖淀粉酶的核酸可以来自任何来源。重组表达编码葡糖淀粉酶的核酸的经工程化的酵母可以含有编码葡糖淀粉酶的内源基因或者可以不含有编码葡糖淀粉酶的内源基因。在一些实施方案中,重组表达编码葡糖淀粉酶的核酸的经工程化的酵母不含有编码葡糖淀粉酶的基因的内源拷贝。因此,在这样的实施方案中,编码葡糖淀粉酶的核酸来源于与经工程化的酵母不同的物种或生物体。
在其他实施方案中,重组表达编码葡糖淀粉酶的核酸的经工程化的酵母的确含有编码葡糖淀粉酶的基因的内源拷贝。在一些这样的实施方案中,编码葡糖淀粉酶的基因的内源拷贝或者该基因的调控区(如启动子)被工程化以增加编码葡糖淀粉酶的基因的表达。在其他实施方案中,编码葡糖淀粉酶的核酸被引入酵母。在这样的实施方案中,被引入酵母的编码葡糖淀粉酶的核酸可以来源于与在其中表达它的经工程化的酵母相同的物种或生物体,或者可以来源于与在其中表达它的经工程化的酵母不同的物种或生物体。
在一些实施方案中,编码葡糖淀粉酶的重组核酸包括扣囊复膜酵母基因(例如,对应于UniProt号Q8TFE5)。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸是经密码子优化的。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸包括SEQ ID NO:46至SEQ ID NO:49。
在一些实施方案中,编码葡糖淀粉酶的重组核酸与SEQ ID NO:46至SEQ ID NO:49的核酸序列具有至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、至少或约99.9%、或者至少或约100%的序列一致性。
在一些实施方案中,葡糖淀粉酶与SEQ ID NO:38的蛋白质序列具有至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、至少或约99.9%、或者至少或约100%的序列一致性。
在一些实施方案中,编码葡糖淀粉酶的重组核酸包括戴尔根霉基因(例如,RO3G_00082,对应于UniProt号I1BGP8)。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸是经密码子优化的。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸包括SEQID NO:52或SEQ ID NO:53。
在一些实施方案中,编码葡糖淀粉酶的重组核酸与SEQ ID NO:52或SEQ ID NO:53的核酸序列具有至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、至少或约99.9%、或者100%的序列一致性。
在一些实施方案中,葡糖淀粉酶与SEQ ID NO:40的蛋白质序列具有至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、或者100%的序列一致性。
在一些实施方案中,编码葡糖淀粉酶的重组核酸包括小孢根霉基因(例如,对应于UniProt号A0A0C7BD37)。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸是经密码子优化的。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸包括SEQ ID NO:54。
在一些实施方案中,编码葡糖淀粉酶的重组核酸与SEQ ID NO:54的核酸序列具有至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、至少或约99.9%、或者100%的序列一致性。
在一些实施方案中,葡糖淀粉酶与SEQ ID NO:41的蛋白质序列包括至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、或者100%的序列一致性。
在一些实施方案中,编码葡糖淀粉酶的重组核酸包括米根霉基因(例如,amyA,对应于UniProt号B7XC04)。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸是经密码子优化的。在一些实施方案中,编码葡糖淀粉酶或其部分的重组核酸包括SEQ ID NO:50或SEQ ID NO:51。
在一些实施方案中,编码葡糖淀粉酶的重组核酸与SEQ ID NO:50或SEQ ID NO:51的核酸序列具有至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、至少或约99.9%、或者100%的序列一致性。
在一些实施方案中,葡糖淀粉酶与SEQ ID NO:39的蛋白质序列具有至少或约50%、至少或约60%、至少或约70%、至少或约80%、至少或约85%、至少或约90%、至少或约95%、至少或约96%、至少或约97%、至少或约98%、至少或约99%、至少或约99.5%、或者100%的序列一致性。
宿主细胞
可以用于发酵以产生乙醇的任何类型的细胞均可以与本发明的方面相容,包含真菌细胞(如酵母细胞)。酵母细胞的非限制性实例包含获自例如酵母属(Saccharomycesspp)、裂殖酵母属(Schizosaccharomyces spp.)、毕赤酵母属(Pichia spp)、法夫酵母属(Paffia spp.)、克鲁维酵母属(Kluyveromyces spp.)、念珠菌属(Candida spp.)、踝节菌属(Talaromyces spp.)、酒香酵母属(Brettanomyces spp.)、管囊酵母属(Pachysolenspp.)、德巴利氏酵母属(Debaryomyces spp.)、亚罗酵母属(Yarrowia spp.)和工业多倍体酵母菌株的酵母细胞。在某些实施方案中,酵母细胞是酿酒酵母细胞。真菌细胞的其他实例包含获自曲霉属(Aspergillus spp.)、青霉属(Penicillium spp.)、镰刀菌属(Fusariumspp.)、根霉菌属(Rhizopus spp.)、支顶孢属(Acremonium spp.)、脉孢菌属(Neurosporaspp.)、粪壳菌属(Sordaria spp.)、稻瘟菌属(Magnaporthe spp.)、异水霉属(Allomycesspp.)、黑粉菌属(Ustilago spp.)、葡萄孢属(Botrytis spp.)、和木霉菌属(Trichodermaspp.)的细胞。
在一些实施方案中,细胞来自全基因组复制后的酵母菌种(如酿酒酵母)(Wolfe(2015)PLoS Biol 13(8):e1002221)。
发酵条件
本文提供了用于产生乙醇的新型方法,该方法包括使经工程化的酵母发酵。在一些实施方案中,用于产生乙醇的方法包含在导致乙醇的产生的条件下将细胞(如本文所描述的经工程化的细胞)与发酵基质一起培养。
发酵基质可以包括淀粉。淀粉可以获自天然来源(如植物来源)。淀粉也可以获自具有高淀粉或糖含量的原料(包含(但不限于)玉米、甜高粱、水果、甘薯、稻米、大麦、甘蔗、甜菜、小麦、木薯,马铃薯、木薯粉、竹芋、豌豆、或西米)。在一些实施方案中,发酵基质来自木质纤维素生物质(如木材、稻草、草或藻类生物质(如微藻类和大藻类))。在一些实施方案中,发酵基质来自草、树、或农业剩余物和林业剩余物(如玉米芯和茎、稻秸、锯屑和木屑)。发酵基质还可以包括糖(如葡萄糖或蔗糖)。
在一些实施方案中,发酵基质包括干磨的乙醇原料(如玉米醪)。在一些实施方案中,发酵基质包括液化玉米醪(LCM)。在一些实施方案中,发酵基质包括玉米湿磨原料(如轻浸渍水/液化物(LSW/LQ)。
用于本文所描述的经工程化的酵母的发酵的培养基可以补充有各种组分。例如,用于本文所描述的经工程化的酵母的发酵的培养基可以补充有葡糖淀粉酶。在一些实施方案中,葡糖淀粉酶是Spirizyme
在一些实施方案中,补充组分(如葡糖淀粉酶)的浓度和量是优化的。例如,在一些实施方案中,以约1%、5%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%或超过30%的浓度添加葡糖淀粉酶。在一些实施方案中,添加一定量的葡糖淀粉酶以达到大约0.33AGU/g干固体的剂量。在一些实施方案中,添加一定量的葡糖淀粉酶以达到大约0.0825AGU/g干固体的剂量。在一些实施方案中,添加一定量的葡糖淀粉酶以达到大约0.05、0.06、0.07、0.08、0.09、0.1、0.15、0.2、0.25、0.3、0.35、0.4、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95、或1.0AGU/g干固体的剂量。
应当理解的是,可以在任何类型和任何组成的培养基中培养本文所描述的经工程化的酵母,并且可以通过如本领域普通技术人员所理解的常规实验来使发酵条件优化。在一些实施方案中,使发酵条件优化以产生乙醇。可以优化的参数包含(但不限于)温度、糖浓度、pH、发酵时间、搅拌速率、和/或接种量。
在一些实施方案中,控制用于本文所描述的经工程化的酵母的培养基的温度以用于优化的乙醇产生。(参见例如,Zabed et al.,Sci World J(2014):1-11;Charoenchai etal.,Am J Enol Vitic(1998)49:283-8;MarelneCot et al.,FEMS Yeast Res(2007)7:22-32;Liu et al.,Bioresour Technol(2008)99:847-54;Phisalaphong et al.,J BiochemEng(2006)28:36-43)。多种因素可以影响培养用于乙醇产生的经工程化的酵母的最优温度(例如,细胞类型、生长培养基和生长条件)。在一些实施方案中,培养的温度在25℃与40℃之间(包含25℃和40℃)。在某些实施方案中,温度为约25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、或两者之间的任何值。在一些实施方案中,温度在30℃与35℃之间(包含30℃和35℃)、或者为两者之间的任何值。在一些实施方案中,温度为大约33℃。在某些实施方案中,温度为大约33.3℃。
在一些实施方案中,控制本文所描述的培养基的pH以用于最优的乙醇产生(Linet al.,Biomass-Bioenergy(2012)47:395-401)。在一些实施方案中,本文所描述的经工程化的细胞的培养或发酵混合物的pH在4.0与6.0之间的范围。在一些实施方案中,将pH维持在4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、5.0、5.1、5.2、5.3、5.4、5.5、5.6、5.7、5.8、5.9、或6.0以用于至少一部分孵育。在一些实施方案中,将pH维持在5.0与5.5之间的范围。
在一些实施方案中,控制培养时间以用于最优的乙醇产生(Lin et al.,Biomass-Bioenergy(2012)47:395-401)。在一些实施方案中,将经工程化的酵母培养大约24-72小时。在一些实施方案中,将经工程化的酵母培养大约12、18、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、78、80、90、96小时、或超过96小时。在一些实施方案中,将本文所描述的经工程化的酵母培养大约48至72小时。在一些实施方案中,约48小时的培养(发酵)时间是商业规模的乙醇发酵过程的代表性时间。因此,可以使用48小时的时间点来比较不同酵母菌株的发酵性能。
可以在乙醇产生过程中测量或调整反应参数。反应参数的非限制性实例包含生物学参数(例如,生长速率、细胞尺寸、细胞数量、细胞密度、细胞类型、或细胞状态等)、化学参数(例如,pH、氧化还原电位、反应基质和/或产物的浓度、溶解的气体的浓度(如氧气浓度和CO
在60℃、0.01N硫酸流动相、0.6mL/min流速下使用具有Aminex HPX-87H柱(300mm×7.8mm)的HPLC测定糖和低碳水化合物的含量。
测定和测试条件
测试1
本公开的方面涉及经工程化的酵母,该经工程化的酵母能够在测试1条件下在48小时内产生至少100g/kg的乙醇并且产生少于1.5g/kg的残余葡萄糖,测试1条件涉及菌株在33.3℃在33%DS玉米醪中的表征。
如本文所使用的,“测试1”条件指以下:
将菌株接种至YPD板,并且在30℃孵育直至可见单菌落(1-2天)。将来自YPD板的细胞刮入pH 7.0的无菌磷酸盐缓冲液中,并且测量光密度(OD600)。使用型号Genesys 20可见光分光光度计(Thermo Scientific)在600nm波长和1cm路径长度下测量光密度。在摇瓶中接种达到0.1的初始OD600所必需的体积的细胞浆。接种体积通常为约66μl。在即将接种之前,将以下材料添加至每个250ml带有挡板的摇瓶:50克的液化玉米醪、190μl的500g/L经过滤灭菌的尿素、以及2.5μl的100mg/ml氨苄青霉素的经过滤灭菌的原料。对于含有Ethanol
测试2
本公开的方面涉及经工程化的酵母(如酿酒酵母),该经工程化的酵母能够在测试2条件下在48小时内产生至少100g/kg的乙醇并且产生少于1.5g/kg的残余葡萄糖,测试2条件涉及菌株在33.3℃在33%DS玉米醪中的表征。
如本文所使用的,“测试2”条件指以下:
将菌株接种至YPD板,并且在30℃孵育直至可见单菌落(1-2天)。将来自YPD板的细胞刮入pH 7.0的无菌磷酸盐缓冲液中,并且测量光密度(OD600)。使用型号Genesys 20可见光分光光度计(Thermo Scientific)在600nm波长和1cm路径长度下测量光密度。在摇瓶中接种达到0.1的初始OD600所必需的体积的细胞浆。接种体积通常为约66μl。在即将接种之前,将以下材料添加至每个250ml带有挡板的摇瓶:50克的液化玉米醪、190μl的500g/L经过滤灭菌的尿素、以及2.5μl的100mg/ml氨苄青霉素的经过滤灭菌的原料。摇瓶接收达到0.33AGU/g干固体的剂量的一定量的葡糖淀粉酶(Spirizyme Fuel HS
测试4
本公开的方面涉及经工程化的酵母菌株,该经工程化的酵母菌株在测试4条件下与未经修饰的参考菌株相比在48小时时表现出至少30%的甘油降低,测试4条件涉及在同步糖化发酵(SSF)摇瓶测定中评估菌株。
如本文所使用的,“测试4条件”指以下:
将菌株接种至ScD-ura板,并且在30℃孵育直至可见单菌落(2-3天)。将来自ScD-ura板的细胞刮入无菌摇瓶培养基中,并且测量光密度(OD600)。使用型号Genesys 20分光光度计(Thermo Scientific)在600nm波长和1cm路径长度下测量光密度。在摇瓶中接种细胞浆以达到0.1的初始OD600。在即将接种之前,将50mL的摇瓶培养基添加至250mL带有挡板的摇瓶,该摇瓶用含有4ml灭菌芥花油的气锁密封。摇瓶培养基由725g部分水解的玉米淀粉、150g经过滤的轻浸渍水、10g水、25g葡萄糖和1g尿素组成。将菌株在30℃在定轨振荡器中以100rpm振荡孵育72小时。采集样品,并且通过HPLC分析发酵过程中液体培养基中的代谢物浓度。
在一些实施方案中,本文所描述的经工程化的酵母菌株比参考菌株产生至少少30%的甘油。在一些实施方案中,参考菌株是对照菌株菌株1。在一些实施方案中,本文所描述的经工程化的酵母菌株在48小时时比参考菌株产生少至少10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、或至少50%的甘油。
乙醇产率
本文所描述的经工程化的酵母产生高乙醇浓度。乙醇浓度可以由克/千克(g/kg)标度或克/升(g/L)标度表示。
在一些实施方案中,发酵结束时发酵液体培养基中的乙醇浓度为约或至少10g/kg、约或至少15g/kg、约或至少20g/kg、约或至少25g/kg、约或至少30g/kg、约或至少35g/kg、约或至少40g/kg、约或至少45g/kg、约或至少50g/kg、约或至少55g/kg、约或至少60g/kg、约或至少65g/kg、约或至少70g/kg、约或至少75g/kg、约或至少80g/kg、约或至少85g/kg、约或至少90g/kg、约或至少95g/kg、约或至少100g/kg、约或至少105g/kg、约或至少110g/kg、约或至少115g/kg、约或至少120g/kg、约或至少125g/kg、约或至少130g/kg、约或至少135g/kg、约或至少140g/kg、约或至少145g/kg、约或至少150g/kg、约或至少155g/kg、约或至少160g/kg、约或至少165g/kg、约或至少170g/kg、约或至少175g/kg、约或至少180(克/千克)(包含全部中间值和范围)、或超过180g/kg。
在一些实施方案中,发酵结束时发酵液体培养基中的乙醇浓度为约或至少10g/kg、约或至少15g/kg、约或至少20g/kg、约或至少25g/kg、约或至少30g/kg、约或至少35g/kg、约或至少40g/kg、约或至少45g/kg、约或至少50g/kg、约或至少55g/kg、约或至少60g/kg、约或至少65g/kg、约或至少70g/kg、约或至少75g/kg、约或至少80g/kg、约或至少85g/kg、约或至少90g/kg、约或至少95g/kg、约或至少100g/kg、约或至少105g/kg、约或至少110g/kg、约或至少115g/kg、约或至少120g/kg、约或至少125g/kg、约或至少130g/kg、约或至少135g/kg、约或至少140g/kg、约或至少145g/kg、约或至少150g/kg、约或至少155g/kg、约或至少160g/kg、约或至少165g/kg、约或至少170g/kg、约或至少175g/kg、约或至少180(克/千克)(包含全部中间值和范围)、或超过180g/kg。
可以通过将乙醇浓度除以消耗的总葡萄糖来计算乙醇质量产率。由于葡萄糖可以以游离葡萄糖的形式存在或者在寡聚物中结合,因此需要同时考虑两种情况。为了测定在发酵开始和发酵结束时存在的总葡萄糖,测定总葡萄糖当量测量值(TGE)。TGE测量如下执行。使用RI检测用HPLC测量葡萄糖。使用10mM H
可以将乙醇产率计算为相对于参考酵母菌株(例如,不含有本文所描述的经工程化的酵母菌株的基因修饰中的一种或更多种的参考菌株)的增加。在一些实施方案中,乙醇产率的公式可以定义为:(时间终点处的乙醇滴度-时间零点处的乙醇滴度)除以时间零点处的TGE。在一些实施方案中,使用以下被称为“测试3”的公式确定乙醇产率。
测试3
在一些实施方案中,本文所描述的经工程化的菌株中的乙醇产率相对于参考菌株的增加为约或至少0.05%、约或至少0.1%、约或至少0.2%、约或至少0.3%、约或至少0.4%、约或至少0.5%、约或至少0.6%、约或至少0.7%、约或至少0.8%、约或至少0.9%、约或至少1%、约或至少1.1%、约或至少1.2%、约或至少1.3%、约或至少1.4%、约或至少1.5%、约或至少1.6%、约或至少1.7%、约或至少1.8%、约或至少1.9%、约或至少2%、约或至少2.5%、约或至少3%、约或至少3.5%、约或至少4%、约或至少4.5%、或者约或至少5%(相对于参考菌株)(包含全部中间值和范围)、或超过5%。
重组核酸的表达
如本领域普通技术人员将知晓的,本文所描述的酶的同源基因可以获自其他物种,并且可以通过同源性检索来鉴别(例如,通过蛋白质BLAST检索,蛋白质BLAST检索在美国国家生物技术信息中心(NCBI)互联网网站(www.ncbi.nlm.nih.gov)可获得)。可以例如通过PCR扩增和/或限制性消化从来自含有给定基因的DNA的任何来源的DNA克隆基因。在一些实施方案中,基因是合成的。可以使用获得或合成编码酶的基因的任何手段。
本公开涉及上文讨论的编码酶的基因的重组表达、其功能修饰和变体、以及与其有关的应用。可以通过常规技术鉴别与本发明相关的核酸的同源物和等位基因。同源物和等位基因将通常分别与核酸和多肽的序列共有至少75%的核苷酸一致性和/或至少90%的氨基酸一致性,在一些情况下将共有至少90%的核苷酸一致性和/或至少95%的氨基酸一致性,并且在其他情况下将共有至少95%的核苷酸一致性和/或至少99%的氨基酸一致性。可以使用NCBI(Bethesda,Maryland)开发的各种可公开获得的软件工具来计算同源性,可以通过NCBI互联网网站获得该软件工具。示例性工具包含在NCBI互联网网站(www.ncbi.nlm.nih.gov)也可获得的BLAST软件。可以使用MacVector序列分析软件(Oxford Molecular Group)获得双序列比对和ClustalW比对(BLOSUM30矩阵设置)以及Kyte-Doolittle亲水性分析。本文还预期上述核酸的沃森-克里克补体(Watson-Crickcomplement)。
例如,可以使用BLAST(美国国家生物信息中心(NCBI)基本局部比对检索工具)2.2.31版软件利用默认参数执行比对。可以使用利用以下默认参数的标准蛋白质BLAST来测定氨基酸序列之间的氨基酸序列一致性%:最大靶序列:100;短查询:自动调整短输入序列的参数;预期阈值:10;字长:6;查询范围内的最大匹配数:0;矩阵:BLOSUM62;空位成本(Gap Cost):(存在:11,延伸:1);组成调整:条件式组成评分矩阵调整;过滤器:未选择;掩码:未选择。可以使用利用以下默认参数的标准核苷酸BLAST来测定核酸序列之间的核酸序列一致性%:最大靶序列:100;短查询:自动调整短输入序列的参数;预期阈值:10;字长:28;查询范围内的最大匹配数:0;匹配/不匹配评分:1,-2;空位成本:线性;过滤器:低复杂度区;掩码:仅用于查找表的掩码。使用利用默认参数的NCBI BLAST 2.2.31版算法相对于参考序列具有XX%(例如,80%)的一致性评分的序列被认为与参考序列至少XX%相同或等同、与参考序列具有XX%的序列一致性。
本公开还涉及简并核酸,该简并核酸包含存在于天然材料中的那些的供替代的密码子。例如,丝氨酸残基由密码子TCA、AGT,TCC、TCG、TCT和AGC编码。为了编码丝氨酸残基的目的,六种密码子中的每种是等同的。因此,对于本领域普通技术人员将显而易见的是,可以采用编码丝氨酸的核苷酸三联体中的任何一种在体外或体内引导蛋白质合成设备,以将丝氨酸残基并入延伸多肽中。类似地,编码其他氨基酸残基的核苷酸序列三联体包含(但不限于):CCA、CCC、CCG和CCT(脯氨酸密码子);CGA、CGC、CGG、CGT、AGA和AGG(精氨酸密码子);ACA、ACC、ACG和ACT(苏氨酸密码子);AAC和AAT(天冬酰胺密码子);以及ATA、ATC和ATT(异亮氨酸密码子)。其他氨基酸残基可以类似地由多个核苷酸序列编码。因此,本公开包含由于遗传密码的简并而在密码子序列方面与生物学分离的核酸不同的简并核酸。
本文还公开了优化细胞中乙醇产生的策略。乙醇的优化产生指按照优化策略产生比在不存在优化策略的情况下所达到的更高量的乙醇。在一些实施方案中,乙醇的优化产生涉及在编码参与乙醇产生的酶的基因在细胞中重组表达之前修饰编码参与乙醇产生的酶的基因。在一些实施方案中,修饰涉及用于在细胞(例如,宿主生物体,如酵母)中表达的密码子优化。可以在本领域普通技术人员可获得的数据库(如密码子使用数据库(kazusa.or.jp/codon/))中访问各种生物体的密码子使用。密码子优化(包含各种生物体的最优密码子的鉴别)和用于实现密码子优化的方法是本领域普通技术人员所熟知的,并且可以使用标准方法来实现。应当理解的是,本文所描述的核酸序列和蛋白质序列中任何一种的各种经密码子优化的形式都可以用于本文公开的产物和方法中。
在一些实施方案中,可以通过以与本文所描述的酶相同的途径起作用的酶的操作(例如,增加在靶标酶(如本文所描述的酶)的上游或下游起作用的酶或其他因子的表达)来优化细胞中乙醇的产生。这可以通过使用任何标准方法过度表达上游或下游因子来实现。
在一些实施方案中,在编码酶的基因在细胞中重组表达之前对该基因进行修饰涉及在该编码酶的基因在细胞中重组表达之前在该基因中进行一个或更多个突变。例如,突变可以涉及单个核苷酸或多个核苷酸的置换或缺失。在一些实施方案中,编码酶的基因中的一个或更多个核苷酸的突变将造成该酶的突变(如一个或更多个氨基酸的置换或缺失)。
附加的变化可以包含如通过附加的游离型表达(episomal expression)来增加乙醇产生中活性途径的基因组分的拷贝数。在一些实施方案中,可以通过随机诱变筛选或者通过已知突变的筛选来进行导致增强的乙醇产生的乙醇产生的组分或其他途径的组分中的突变的筛选。在一些实施方案中,基因组片段的鸟枪法克隆可以用于通过筛选具有用于增加的乙醇产生的这些片段的细胞或生物体来鉴别导致乙醇产生增加的基因组区。在一些情况下,一个或更多个突变可以在同一细胞或生物体中组合。
在一些实施方案中,通过选择各种强度的启动子以驱动基因的表达来增加乙醇产生。在一些实施方案中,这可以包含高拷贝数质粒或低拷贝数质粒或中等拷贝数质粒的选择。通过结构(如茎环)的引入或消除,转录终止的步骤也可以靶向基因表达的调控。
本文还预期含有本文所描述的基因编码的野生型残基、突变的残基、或经密码子优化的残基的蛋白质或多肽以及编码该多肽的分离的核酸分子。如本文所使用的,术语“蛋白质”和“多肽”被可互换地使用,因此术语多肽可以用于指全长多肽,并且也可以用于指全长多肽的片段。
在本文所描述的一些实施方案中,细胞表达本文公开的基因中的一种或更多种的内源拷贝、本文公开的基因中的一种或更多种的重组拷贝、或本文公开的基因中的一种或更多种的内源拷贝和用于增加的乙醇产生的本文公开的基因中的一种或更多种的重组拷贝。
如本文所使用的,术语“过度表达”或“增加的表达”指与参考细胞(例如,相同细胞类型的野生型细胞或者未经修饰(如基因修饰)的相同细胞类型的细胞)相比,在细胞、细胞类型或细胞状态中基因或基因产物的增加的表达水平。例如,在一些实施方案中,经工程化的细胞中编码GapN酶和葡糖淀粉酶的一个或更多个基因的过度表达造成相对于不过度表达编码GapN酶和葡糖淀粉酶的一个或更多个基因的参考细胞(如野生型细胞)的较高的乙醇产生。在一些实施方案中,通过重组表达内源基因从而增加基因的表达来实现本文所描述的经工程化的细胞中基因的过度表达或增加的表达。在一种些实施方案中,通过重组表达对于经工程化的细胞为非内源的基因从而增加基因的表达来实现本文所描述的经工程化的细胞中基因的过度表达或增加的表达。
如本文所使用的,术语“外源”指源自感兴趣的微生物之外的任何材料。例如,术语“外源”可以应用于在基因修饰之前不以特定生物体的天然形式存在的遗传物质(即,这样的外源性遗传物质也可以称为异源性),或者也可以应用于并非源自特定生物体的酶或其他蛋白质。
如本文所公开的和本领域普通技术人员所理解的,可以以几种方式(包含通过降低相关基因的表达、破坏相关基因、在相关基因中引入一个或更多个突变(造成具有降低、减弱或消除的酶促活性的蛋白质的产生)、和/或使用特定的抑制剂以降低、减弱或消除酶促活性(包含使用核酸,如微RNA(miRNA)或小干扰RNA(siRNA)等))降低、减弱或消除一个或更多个基因和基因产物的活性或表达。
在一些实施方案中,使用运载体表达本文公开的基因中的一个或更多个。在一些实施方案中,运载体在细胞中自主复制。在其他实施方案中,运载体被整合到细胞的基因组中。运载体可以含有一个或更多个核酸内切酶限制性位点,该核酸内切酶限制位点被限制性核酸内切酶切割以插入和连接含有本文所描述的基因的核酸,以产生能够在细胞中复制的重组运载体。运载体通常由DNA组成,尽管RNA运载体也是可用的。
克隆运载体包含(但不限于):质粒、F黏粒(fosmid)、噬菌粒、病毒基因组和人工染色体。如本文所使用的,术语“表达运载体”或“表达构建体”指重组或合成生成的、具有一系列容许特定核酸在宿主细胞(例如,微生物,如酵母细胞)中转录的指定核酸元件的核酸构建体。在一些实施方案中,将本文所描述的基因的核酸序列插入克隆运载体,使得其可操作地连接至调控序列,并且在一些实施方案中表达为RNA转录物。
在一些实施方案中,运载体含有一种或更多种标志物以鉴别用重组运载体转化或转染的细胞。标志物包含例如编码增加或降低对化合物(例如,抗生素)的抗性或敏感性的蛋白质的基因、编码活性通过本领域普通技术人员已知的标准测定可检测的酶(例如,β-半乳糖苷酶、荧光素酶或碱性磷酸酶)的基因、以及显著地影响经转化或经转染的细胞、宿主、菌落或斑块的表型的基因(例如,编码荧光蛋白(如绿色荧光蛋白))。在某些实施方案中,标志物是amdS标志物或URA3标志物。
当编码序列和调控序列共价地连接并且编码序列的表达或转录受到调控序列的影响或控制时,编码序列和调控序列被称为“可操作地连接”。如果编码序列被翻译成功能蛋白,则如果5’调控序列中启动子的诱导转录编码序列,并且如果编码序列与调控序列之间的联接的性质不(1)造成移码突变的引入;(2)干扰启动子区指导编码序列的转录的能力、或(3)干扰相应RNA转录物被翻译成蛋白质的能力,则编码序列和调控序列被称为是可操作地连接。因此,如果启动子区转录编码序列并且转录物可以被翻译成感兴趣的蛋白质或多肽,则启动子区与编码序列可操作地连接。
在一些实施方案中,编码本文所描述的蛋白质中的任何一种的核酸受调控序列(例如,增强子序列)的控制。在一些实施方案中,核酸在启动子的控制下表达。启动子可以是天然启动子(例如,基因在其内源环境中的启动子,该启动子提供基因表达的正常调控)。可替代地,启动子可以是与基因的天然启动子不同的启动子,例如,启动子与基因在其内源环境中的启动子不同。在一些实施方案中,修饰增加细胞中的乙醇产生或减少细胞中的甘油产生的基因的启动子。“经修饰的启动子”指核苷酸序列已经改变的启动子。在一些实施方案中,相对于未经修饰的启动子,经修饰的启动子具有增加的或减小的转录活性。在一些实施方案中,通过一个或多个核苷酸缺失、一个或多个核苷酸插入或一个或多个核苷酸突变、或其任何组合来获得经修饰的启动子。在一些实施方案中,例如通过同源重组、基因靶向、敲除、敲入、定点突变、或人工锌指核酸酶介导的策略通过随机或拟随机事件(例如,辐照或非靶向的核苷酸整合以及随后的选择)来改变启动子。本文还预期本领域普通技术人员已知的用于修饰启动子以增加启动子的转录活性的其他方法。
如本文所使用的,“异源启动子”是和与其可操作地连接的DNA序列的转录并非天然地或正常地相关的启动子,或者并非天然地或正常地控制与其可操作地连接的DNA序列的转录的启动子。在一些实施方案中,本文所描述的核酸序列或基因受异源启动子的控制。
在一些实施方案中,启动子是真核启动子。真核启动子的非限制性实例包含如本领域普通技术人员已知的TDH3、PGK1、PKC1、TDH2、PYK1、TPI1、AT1、CMV、EF1a、SV40、Ubc、人β肌动蛋白、CAG、TRE、UAS、Ac5、多角体蛋白、CaMKIIa、GAL1、GAL10、TEF1、GDS、ADH1、CaMV35S、Ubi、H1、U6和TEF1(参见,例如,Addgene网站:blog.addgene.org/plasmids-101-the-promoter-region)。在一些实施方案中,启动子是原核启动子(例如,噬菌体启动子或细菌启动子)。噬菌体启动子的非限制性实例包含Pls1con、T3、T7、SP6、PL。细菌启动子的非限制性实例包含Pbad、PmgrB、Ptrc2、Plac/ara、Ptac、Pm。
在一些实施方案中,启动子是诱导型启动子。如本文所使用的,“诱导型启动子”是受到分子的存在或不存在控制的启动子。诱导型启动子的非限制性实例包含化学调控的启动子和物理调控的启动子。对于化学调控的启动子,转录活性由一种或更多种化合物(如醇、四环素、半乳糖、类固醇、金属、或其他化合物)调控。对于物理调控的启动子,转录活性受现象(如光或温度)的调控。四环素调控的启动子的非限制性实例包含脱水四环素(aTc)响应性启动子和其他四环素响应性启动子系统(例如,四环素阻遏蛋白(tetR)、四环素操纵子序列(tetO)和四环素反式激活子融合蛋白(tTA))。类固醇调控的启动子的非限制性实例包含基于大鼠糖皮质激素受体、人雌激素受体、蛾蜕皮激素受体的启动子,以及来自类固醇/类维生素A/甲状腺受体超家族的启动子。金属调控的启动子的非限制性实例包含来源于金属硫蛋白(结合并且螯合金属离子的蛋白质)基因的启动子。发病机制调控的启动子的非限制性实例包含由水杨酸、乙烯或苯并噻二唑(BTH)诱导的启动子。温度/热诱导型启动子的非限制性实例包含热激启动子。光调控的启动子的非限制性实例包含来自植物细胞的光响应性启动子。在某些实施方案中,诱导型启动子是半乳糖诱导型启动子。在一些实施方案中,通过一种或更多种生理条件(例如,pH、温度、辐射、渗透压、盐水梯度、细胞表面结合、或者一种或更多种外在诱导剂或内在诱导剂的浓度)来诱导诱导型启动子。外在诱导物或诱导剂的非限制性实例包含氨基酸和氨基酸类似物、糖类和多糖、核酸、蛋白质转录激活子(activator)和阻遏子(repressor)、细胞因子、毒素、石油基化合物、含金属的化合物、盐、离子、酶底物类似物、激素或其任何组合。
在一些实施方案中,启动子是组成型启动子。如本文所使用的,“组成型启动子”指允许基因的连续转录的未经调控的启动子。组成型启动子的非限制性实例包含CP1、CMV、EF1a、SV40、PGK1、Ubc、人β肌动蛋白、CAG、Ac5、多角体蛋白、TEF1、GDS、CaM35S、Ubi、H1和U6。本文也预期了本领域普通技术人员已知的其他诱导型启动子或组成型启动子。
在一些实施方案中,通过引入异源核酸(例如,DNA和/或RNA)来使细胞工程化。可以将该异源核酸置于转录元件的可操作控制下,以容许异源DNA或RNA在本文所描述的经工程化的细胞中的表达。使用酿酒酵母在实施例部分中证明了用于产生乙醇的基因的异源表达。本文还预期了使用本文所描述的新型方法在其他细胞(包含其他真菌细胞)中产生乙醇。
基因表达所需的调控序列的确切性质可能在物种或细胞类型之间变化,但通常视需要包含分别涉及转录和翻译的起始的5’非转录序列和5’非翻译序列(如TATA框、加帽序列、CAAT序列等)。特别地,这样的5’非转录调控序列将包含启动子区,该启动子区包含用于可操作地连接的基因的转录控制的启动子序列。调控序列还可以包含增强子序列或上游激活子序列。本文公开的运载体可以包含5’前导序列(leader)或信号序列。调控序列还可以包含终止子序列。在一些实施方案中,终止子序列在转录期间标记DNA中基因的末端。适合于诱导异源生物体中的本文所描述的一个或更多个基因的表达的一种或更多种适当的运载体的选择和设计在本领域普通技术人员的能力和判断范围之内。
含有表达必需元件的表达运载体是可商业获得的,并且是本领域普通技术人员已知的(参见,例如,Molecular Cloning:A Laboratory Manual,J.Sambrook,et al.,eds.,Fourth Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NewYork,2012,或Current Protocols in Molecular Biology,F.M.Ausubel,et al.,eds.,John Wiley&Sons,Inc.,New York,2010)。
在一些实施方案中,使用本领域普通技术人员已知的标准方法将本文公开的重组表达的基因中的一个或更多个引入经工程化的细胞中。非限制性实例包含转化(例如,化学转化、电穿孔等)、转导、粒子轰击等。在一些实施方案中,本文公开的基因中的一个或更多个被整合到细胞的基因组中。
核酸和蛋白质序列
GapN基因序列和氨基酸序列对于本领域普通技术人员而言是公知的。GapN基因序列和蛋白质序列的非限制性实例包含:
来自蜡样芽孢杆菌的经密码子优化的GAPN DNA序列(SEQ ID NO:45):
ATGACAACATCAAATACCTACAAATTCTATCTAAACGGTGAATGGAGAGAATCTTCCTCTGGAGAAACTATTGAGATACCATCACCATACTTACATGAAGTGATCGGACAGGTTCAAGCAATCACTAGAGGAGAGGTTGACGAAGCGATTGCTAGCGCTAAGGAAGCACAGAAATCTTGGGCTGAGGCATCTCTACAAGATAGAGCTAAGTACTTGTACAAATGGGCAGATGAATTGGTAAACATGCAAGACGAAATCGCCGATATCATCATGAAGGAAGTGGGCAAGGGTTACAAAGACGCTAAAAAGGAGGTTGTTAGAACCGCCGATTTCATCAGATACACCATTGAAGAGGCACTCCATATGCACGGTGAATCCATGATGGGCGATTCATTTCCTGGTGGAACAAAATCTAAGCTAGCAATAATCCAAAGAGCGCCTCTGGGTGTAGTCTTAGCCATCGCTCCATTCAATTACCCTGTAAACCTTTCTGCTGCAAAATTGGCACCAGCCTTAATTATGGGTAACGCTGTGATATTCAAGCCAGCAACTCAGGGTGCTATTTCCGGCATCAAAATGGTTGAAGCTTTGCATAAGGCTGGTTTGCCAAAGGGTTTGGTTAACGTTGCCACAGGTAGAGGTAGCGTCATAGGCGATTATTTGGTCGAACACGAAGGGATAAACATGGTTTCCTTCACCGGTGGCACTAACACTGGTAAGCATTTAGCAAAAAAGGCCTCAATGATTCCATTAGTCTTGGAACTTGGTGGCAAAGATCCAGGCATCGTTCGTGAAGATGCAGACCTACAAGATGCTGCGAATCATATCGTATCTGGTGCGTTCAGTTACTCAGGGCAGAGATGTACAGCCATTAAGAGAGTCCTTGTTCATGAAAATGTTGCTGATGAACTGGTATCATTGGTTAAGGAACAAGTGGCAAAGCTTTCTGTGGGATCACCAGAGCAAGATTCAACAATTGTTCCTCTGATTGACGATAAGTCCGCTGATTTTGTTCAGGGTTTAGTGGACGATGCAGTCGAAAAGGGCGCTACAATTGTCATTGGGAACAAGAGAGAACGTAACCTAATCTACCCAACATTGATTGATCACGTCACAGAGGAAATGAAAGTTGCCTGGGAGGAACCATTCGGTCCTATTCTTCCAATTATTAGAGTTAGTAGCGACGAGCAAGCTATTGAAATTGCAAATAAGAGTGAGTTCGGATTACAAGCTTCTGTGTTTACCAAAGACATAAACAAGGCATTCGCAATCGCAAATAAGATTGAGACTGGTTCAGTGCAAATCAACGGTAGAACAGAGAGAGGACCAGATCACTTTCCTTTTATCGGGGTTAAGGGATCTGGGATGGGTGCCCAAGGCATCAGAAAGTCTTTGGAATCTATGACTAGAGAAAAAGTTACTGTCTTAAATCTCGTATGA。
来自蜡样芽孢杆菌的GapN蛋白质序列(SEQ ID NO:42):
MTTSNTYKFYLNGEWRESSSGETIEIPSPYLHEVIGQVQAITRGEVDEAIASAKEAQKSWAEASLQDRAKYLYKWADELVNMQDEIADIIMKEVGKGYKDAKKEVVRTADFIRYTIEEALHMHGESMMGDSFPGGTKSKLAIIQRAPLGVVLAIAPFNYPVNLSAAKLAPALIMGNAVIFKPATQGAISGIKMVEALHKAGLPKGLVNVATGRGSVIGDYLVEHEGINMVSFTGGTNTGKHLAKKASMIPLVLELGGKDPGIVREDADLQDAANHIVSGAFSYSGQRCTAIKRVLVHENVADELVSLVKEQVAKLSVGSPEQDSTIVPLIDDKSADFVQGLVDDAVEKGATIVIGNKRERNLIYPTLIDHVTEEMKVAWEEPFGPILPIIRVSSDEQAIEIANKSEFGLQASVFTKDINKAFAIANKIETGSVQINGRTERGPDHFPFIGVKGSGMGAQGIRKSLESMTREKVTVLNLV。
葡糖淀粉酶基因和蛋白质序列对于本领域普通技术人员而言是公知的。葡糖淀粉酶基因和蛋白质序列的非限制性实例包含:
来自扣囊复膜酵母的经密码子优化的葡糖淀粉酶DNA序列(GLA1基因)(SEQ IDNO:46):
ATGATTAGATTAACCGTATTCCTCACTGCAGTTTTTGCAGCAGTCGCTTCCTGTGTTCCAGTTGAATTGGATAAGAGAAATACAGGCCATTTCCAAGCATATTCTGGTTACACCGTAGCTAGATCAAACTTTACTCAATGGATTCACGAGCAACCAGCCGTATCATGGTACTATTTGCTTCAGAATATAGACTATCCAGAAGGACAATTCAAGTCTGCCAAGCCAGGGGTCGTTGTGGCTTCCCCTTCTACATCCGAACCTGATTACTTCTACCAATGGACTAGAGATACTGCTATCACCTTCTTGTCACTTATCGCGGAAGTTGAGGATCATTCTTTTTCAAATACTACACTAGCCAAGGTGGTTGAATACTACATCTCTAATACTTACACATTACAAAGAGTTTCCAACCCATCTGGTAACTTCGACAGTCCAAATCACGACGGTTTGGGAGAACCAAAGTTTAATGTTGATGATACAGCTTATACTGCATCTTGGGGTAGACCACAAAATGATGGCCCAGCGTTGAGAGCATACGCAATTTCAAGATACCTTAACGCAGTAGCAAAACACAACAACGGTAAGTTACTGCTCGCTGGACAAAACGGTATTCCTTACTCTTCAGCTTCTGATATCTACTGGAAGATTATCAAGCCAGATCTTCAACATGTGTCAACCCATTGGTCTACATCTGGTTTTGATTTGTGGGAAGAGAATCAGGGAACACATTTCTTTACTGCGTTGGTCCAGCTAAAAGCACTTAGTTACGGCATTCCTTTAAGTAAGACCTACAACGATCCTGGTTTCACTAGTTGGCTAGAAAAGCAAAAGGATGCTTTAAACTCTTATATCAACAGCTCTGGTTTCGTAAACTCTGGCAAAAAGCATATAGTGGAGAGCCCTCAACTATCTTCAAGAGGAGGGTTGGATAGCGCCACATACATTGCAGCCTTAATCACACATGATATTGGCGACGACGACACTTACACACCTTTCAACGTTGACAACTCCTATGTCTTGAACTCACTGTATTACCTTCTAGTCGATAACAAAAACCGTTACAAAATCAATGGTAACTACAAGGCCGGTGCTGCTGTTGGTAGATACCCAGAGGATGTTTACAACGGTGTTGGGACATCAGAAGGCAATCCATGGCAATTAGCTACAGCCTACGCCGGCCAAACATTTTACACACTGGCTTACAACTCATTGAAAAACAAAAAAAACTTAGTGATTGAAAAGTTGAACTACGACCTCTACAATTCTTTCATAGCAGATTTATCCAAGATCGATAGTTCTTACGCATCAAAAGACTCCTTGACTTTGACCTACGGTTCTGACAACTACAAAAACGTCATAAAGTCACTATTACAGTTTGGAGATTCATTCCTGAAGGTCTTGCTCGATCACATTGATGATAATGGACAATTAACAGAAGAGATCAATAGATACACAGGGTTCCAGGCTGGTGCTGTTAGTTTGACATGGTCCTCTGGTTCATTACTTTCAGCAAACCGTGCGAGAAATAAGTTGATTGAACTATTGTAG。
来自扣囊复膜酵母的经密码子优化的葡糖淀粉酶DNA序列(GLA1基因)(SEQ IDNO:47):
ATGATCAGACTTACAGTTTTCCTAACAGCCGTTTTCGCCGCCGTTGCATCATGTGTCCCAGTAGAATTGGATAAGAGAAACACCGGCCATTTCCAAGCATATTCAGGATACACCGTTGCACGTTCTAATTTCACACAATGGATTCATGAGCAGCCTGCTGTGTCCTGGTACTACTTATTACAAAACATTGATTATCCTGAGGGACAATTCAAGTCAGCGAAACCAGGCGTTGTGGTTGCTTCTCCATCCACTTCAGAACCAGACTACTTCTACCAGTGGACCCGTGACACAGCAATAACTTTCTTATCTTTGATAGCAGAAGTAGAAGATCACTCATTTTCAAATACAACTCTAGCTAAGGTTGTCGAATACTACATCTCTAACACATACACCCTACAAAGAGTTTCTAACCCATCTGGTAATTTCGATAGCCCAAATCACGATGGTCTGGGTGAACCAAAGTTCAACGTTGACGACACTGCTTACACTGCATCATGGGGCAGACCTCAAAACGACGGTCCAGCCTTAAGAGCTTACGCGATCTCAAGATATTTGAACGCAGTTGCCAAGCATAACAACGGTAAGCTATTGCTCGCGGGTCAAAATGGTATTCCTTACTCATCTGCATCAGATATCTACTGGAAGATTATCAAGCCAGATTTACAACATGTAAGTACTCACTGGAGTACATCTGGTTTTGACTTATGGGAAGAGAATCAAGGTACACATTTCTTTACTGCACTTGTCCAGTTAAAAGCTCTTTCATACGGTATACCTTTGTCTAAGACATATAACGATCCAGGATTTACTTCTTGGTTGGAAAAGCAGAAGGATGCCTTGAACTCTTACATCAATTCCAGCGGCTTCGTCAACTCCGGGAAAAAGCACATTGTCGAATCTCCTCAATTATCTAGTAGAGGGGGTCTTGATAGCGCTACTTACATCGCTGCTCTAATTACACATGATATTGGTGATGATGATACATACACTCCTTTTAACGTAGATAATTCTTATGTGCTGAACTCTTTATACTATCTGCTTGTAGACAACAAAAACAGATACAAGATCAACGGGAACTACAAAGCAGGAGCTGCAGTTGGTAGATACCCAGAAGATGTGTACAATGGAGTGGGAACCTCAGAGGGAAACCCATGGCAATTGGCGACAGCATACGCCGGCCAAACCTTTTACACACTGGCTTACAATTCTCTCAAAAACAAAAAAAATTTGGTTATTGAGAAGTTGAATTACGATCTATACAACTCCTTTATAGCTGACTTAAGTAAGATTGACTCCTCTTACGCTTCTAAGGATTCATTGACATTGACCTACGGCTCAGATAACTACAAAAATGTCATTAAGTCACTTTTACAATTCGGGGATTCTTTCTTGAAAGTCTTGTTGGACCATATTGATGATAATGGTCAGCTAACAGAGGAAATCAACAGATATACAGGTTTTCAAGCTGGCGCAGTTTCCCTCACTTGGAGTAGTGGTTCACTCTTATCTGCAAACAGAGCCAGAAACAAGTTGATCGAATTGCTTTAG。
来自扣囊复膜酵母的经密码子优化的葡糖淀粉酶DNA序列(GLA1基因)(SEQ IDNO:48):
ATGATCAGACTTACTGTTTTCCTCACAGCCGTTTTTGCAGCAGTAGCTTCTTGTGTTCCAGTTGAATTGGATAAGAGAAATACAGGTCATTTCCAAGCTTACTCTGGTTACACTGTGGCTAGATCTAACTTCACACAATGGATTCATGAACAGCCTGCCGTGAGTTGGTACTATTTGCTACAAAACATTGATTACCCTGAGGGTCAATTCAAATCAGCTAAGCCAGGTGTTGTTGTCGCGAGCCCATCAACTTCTGAACCAGATTACTTCTACCAATGGACTAGAGATACCGCAATAACCTTCTTATCTCTAATCGCAGAGGTAGAAGATCACTCTTTTTCAAATACTACCCTGGCAAAAGTGGTCGAGTACTACATCTCAAACACATACACCTTGCAGAGAGTCTCAAACCCATCAGGAAACTTCGATTCTCCTAATCATGACGGCTTAGGAGAACCAAAGTTTAATGTTGACGATACCGCTTATACTGCATCTTGGGGTAGACCACAGAATGATGGCCCTGCCTTACGTGCATACGCCATTTCCAGATATCTCAACGCTGTAGCGAAGCACAACAACGGTAAGCTGCTTTTAGCTGGTCAAAATGGGATACCATACTCTTCCGCTTCAGACATTTACTGGAAGATTATCAAACCAGACTTGCAGCATGTCAGTACACATTGGTCAACTTCTGGTTTTGATTTGTGGGAAGAGAACCAAGGCACTCACTTCTTTACAGCCTTGGTTCAACTAAAGGCATTGTCTTACGGAATCCCTTTGTCCAAGACATACAATGATCCTGGATTCACTAGTTGGCTAGAAAAGCAAAAGGATGCACTGAACTCATACATTAACAGTTCAGGCTTTGTGAACTCCGGTAAAAAGCATATTGTTGAAAGCCCACAACTATCTAGCAGAGGTGGTTTAGATTCTGCAACCTACATAGCAGCCTTGATCACACACGACATTGGGGATGACGATACATACACACCATTCAACGTCGACAATTCATACGTTTTGAATAGCTTATACTACCTACTGGTAGATAACAAAAACAGATATAAGATCAATGGCAACTACAAGGCCGGTGCTGCCGTAGGAAGATACCCTGAAGATGTCTACAACGGAGTTGGTACATCAGAAGGTAACCCATGGCAATTAGCAACAGCATATGCGGGCCAGACATTTTACACTTTGGCTTACAATTCATTGAAAAACAAAAAAAATTTAGTGATAGAAAAGCTTAACTATGACCTTTACAACTCTTTCATTGCCGATTTATCCAAGATTGATTCCTCCTACGCATCAAAGGACTCCTTGACACTTACATACGGTTCTGACAACTACAAAAATGTTATCAAGTCTCTCTTGCAATTTGGTGATTCTTTCTTGAAGGTTTTACTCGATCATATCGATGATAATGGTCAACTAACTGAGGAAATCAACAGATACACTGGGTTCCAAGCTGGAGCTGTCTCTTTAACATGGAGTTCAGGGAGTTTGTTATCTGCTAACAGAGCGCGTAACAAACTTATTGAGCTTCTGTAG。
来自扣囊复膜酵母的经密码子优化的葡糖淀粉酶DNA序列(GLA1基因)(SEQ IDNO:49):
ATGATTAGATTAACAGTATTTCTTACAGCCGTTTTCGCAGCCGTCGCATCCTGTGTTCCAGTAGAATTAGATAAGCGTAATACAGGACATTTTCAAGCTTACTCTGGCTATACAGTTGCGAGATCTAACTTTACACAATGGATTCACGAACAGCCAGCAGTTTCTTGGTACTATTTGCTCCAAAACATCGACTACCCTGAAGGCCAATTCAAGTCTGCAAAGCCAGGAGTGGTCGTCGCTTCTCCTAGTACTTCAGAACCAGATTACTTCTACCAGTGGACAAGAGACACTGCTATTACCTTCCTGAGCTTAATCGCTGAAGTTGAAGATCACTCTTTTTCTAATACAACACTGGCCAAAGTAGTTGAGTACTACATCTCTAACACTTACACTCTACAAAGAGTGTCAAACCCTTCTGGGAACTTCGACAGCCCAAACCATGATGGTTTGGGGGAGCCAAAATTCAACGTTGATGATACAGCCTACACCGCATCTTGGGGTAGACCACAAAACGACGGACCAGCTTTAAGAGCATACGCAATATCTCGTTACCTTAATGCTGTTGCAAAGCACAATAATGGAAAGTTGTTGTTGGCTGGTCAAAACGGTATTCCTTACTCTTCAGCATCTGATATCTACTGGAAGATTATCAAGCCAGATCTTCAACACGTATCCACACATTGGTCAACCTCCGGCTTCGATTTATGGGAGGAAAATCAGGGTACACATTTCTTCACCGCTCTAGTGCAATTGAAGGCTTTGAGTTACGGCATTCCATTGTCTAAGACTTACAACGATCCTGGTTTCACCTCATGGCTTGAAAAGCAGAAGGATGCCCTGAATAGCTACATCAACTCATCTGGTTTTGTTAACTCAGGGAAAAAGCATATAGTTGAATCCCCACAACTATCATCAAGAGGAGGTTTAGACTCCGCCACATACATTGCTGCCTTGATTACACATGATATTGGGGATGATGACACATATACTCCATTTAACGTCGATAACAGTTATGTCCTTAATTCCTTATACTATTTGTTGGTCGATAACAAAAATAGATACAAAATCAACGGCAACTACAAGGCTGGCGCAGCGGTGGGTAGATACCCTGAGGATGTTTACAATGGTGTAGGTACATCTGAAGGCAATCCATGGCAATTAGCGACTGCTTACGCTGGACAAACTTTCTACACACTTGCGTACAACTCATTGAAAAACAAAAAAAACCTAGTCATTGAAAAGTTGAATTACGATCTGTACAACTCTTTCATCGCAGACCTATCAAAGATTGACTCATCTTATGCAAGTAAAGATTCACTAACTTTAACCTACGGTAGTGATAACTACAAAAACGTTATCAAGTCTTTACTCCAGTTTGGTGATTCATTCTTGAAGGTGTTGTTAGATCATATAGACGACAATGGTCAACTCACAGAGGAGATAAACAGATACACTGGTTTTCAAGCAGGAGCTGTTTCACTTACTTGGTCAAGTGGTTCTTTGCTTTCCGCCAACAGAGCCAGAAACAAGCTCATCGAATTACTATAG。
来自扣囊复膜酵母的葡糖淀粉酶蛋白质序列(GLA1蛋白质)(SEQ ID NO:38):
MIRLTVFLTAVFAAVASCVPVELDKRNTGHFQAYSGYTVARSNFTQWIHEQPAVSWYYLLQNIDYPEGQFKSAKPGVVVASPSTSEPDYFYQWTRDTAITFLSLIAEVEDHSFSNTTLAKVVEYYISNTYTLQRVSNPSGNFDSPNHDGLGEPKFNVDDTAYTASWGRPQNDGPALRAYAISRYLNAVAKHNNGKLLLAGQNGIPYSSASDIYWKIIKPDLQHVSTHWSTSGFDLWEENQGTHFFTALVQLKALSYGIPLSKTYNDPGFTSWLEKQKDALNSYINSSGFVNSGKKHIVESPQLSSRGGLDSATYIAALITHDIGDDDTYTPFNVDNSYVLNSLYYLLVDNKNRYKINGNYKAGAAVGRYPEDVYNGVGTSEGNPWQLATAYAGQTFYTLAYNSLKNKKNLVIEKLNYDLYNSFIADLSKIDSSYASKDSLTLTYGSDNYKNVIKSLLQFGDSFLKVLLDHIDDNGQLTEEINRYTGFQAGAVSLTWSSGSLLSANRARNKLIELL。
来自米根霉的经密码子优化的葡糖淀粉酶DNA序列(amyA基因)(SEQ ID NO: 50):
ATGAAGTTCATTTCCACTTTCTTGACCTTCATTTTGGCTGCTGTCTCTGTCACCGCTGCATCTATTCCATCTAGTGCATCTGTACAATTGGACTCCTACAATTACGATGGTTCCACATTTTCCGGCAAGATTTATGTCAAAAACATCGCTTACTCTAAAAAGGTTACTGTTGTGTACGCAGACGGTTCTGACAACTGGAACAATAACGGCAACACTATTGCTGCATCATTTTCAGGCCCAATCTCTGGATCAAATTACGAATACTGGACATTCTCAGCATCAGTGAAGGGCATAAAGGAGTTCTACATCAAATACGAAGTTTCAGGTAAGACATATTACGACAATAACAACTCTGCAAACTACCAAGTCTCAACTTCTAAACCTACTACAACTACTGCAGCTACAACCACAACTACAGCTCCATCAACTTCTACAACAACCCGTCCATCTAGTTCAGAGCCTGCCACCTTCCCTACTGGTAATTCTACCATCAGCTCTTGGATCAAAAAGCAGGAAGATATTTCCAGATTCGCTATGCTTAGAAACATCAACCCACCTGGTTCTGCCACAGGGTTTATCGCCGCATCACTCTCTACCGCTGGTCCAGATTACTACTACGCGTGGACAAGAGATGCCGCTTTGACATCTAACGTTATCGTTTACGAATACAACACCACATTGTCTGGGAATAAGACAATTCTAAACGTACTTAAGGATTACGTCACATTCAGTGTTAAGACACAGTCTACTTCAACAGTTTGTAATTGCCTTGGTGAACCAAAGTTCAATCCAGACGGCAGTGGTTACACAGGTGCTTGGGGTAGACCTCAAAATGATGGTCCTGCAGAAAGAGCGACTACATTTGTTCTGTTTGCCGACAGCTACTTGACTCAAACTAAGGATGCCTCATACGTCACTGGTACATTAAAGCCAGCAATTTTCAAAGATCTCGATTACGTTGTTAACGTCTGGAGTAACGGATGTTTCGATTTATGGGAGGAGGTGAACGGAGTTCATTTCTACACCCTTATGGTTATGAGAAAAGGGCTATTGTTGGGGGCTGATTTCGCGAAGAGAAACGGTGACTCAACTAGAGCCTCAACTTACTCTTCTACTGCTTCCACAATTGCTAACAAGATATCAAGTTTCTGGGTTAGCTCAAACAACTGGGTGCAAGTATCCCAATCTGTCACAGGAGGTGTAAGTAAAAAGGGGTTAGACGTTAGCACCCTGTTAGCTGCGAATCTAGGATCAGTCGATGATGGATTTTTCACTCCAGGTTCTGAAAAGATATTAGCTACAGCTGTGGCAGTCGAAGATTCCTTTGCCAGTCTATACCCAATCAACAAAAACCTTCCATCATACTTGGGGAACGCTATTGGAAGATACCCTGAAGATACATACAACGGTAATGGTAACTCACAAGGCAATCCTTGGTTTCTGGCGGTTACCGGCTACGCAGAGTTGTACTATAGAGCAATTAAGGAATGGATTTCTAATGGAGGCGTTACAGTGTCCTCTATCTCATTGCCATTTTTCAAAAAGTTCGATAGCTCTGCAACATCCGGTAAAAAGTACACCGTAGGTACTTCTGACTTCAACAATTTAGCACAAAACATTGCTCTTGCTGCAGATCGTTTCCTATCTACTGTACAACTCCATGCACCAAACAATGGTTCATTAGCAGAGGAATTTGATAGAACAACAGGTTTTTCTACCGGCGCTAGAGATTTAACATGGTCCCACGCCTCATTGATAACAGCATCCTATGCCAAAGCCGGTGCTCCAGCTGCATAA。
来自米根霉的经密码子优化的葡糖淀粉酶DNA序列(amyA基因)(SEQ ID NO: 51):
ATGAAGTTTATCTCCACGTTTTTAACCTTTATCCTAGCAGCTGTCAGCGTCACCGCCGCATCAATTCCGAGTTCAGCATCTGTACAACTTGACTCTTACAATTACGATGGCAGCACTTTCTCAGGGAAAATTTATGTGAAAAACATAGCATATAGTAAGAAGGTTACCGTGGTATATGCAGACGGTTCTGATAATTGGAATAATAATGGAAACACTATTGCCGCCAGTTTTTCCGGCCCAATTTCTGGTTCCAATTACGAGTATTGGACCTTTTCTGCATCAGTAAAAGGCATCAAGGAATTCTATATTAAGTACGAAGTTTCAGGTAAGACATATTACGATAACAATAACTCAGCAAATTATCAAGTCTCTACATCTAAGCCCACAACAACAACTGCTGCTACCACCACTACAACCGCTCCTTCTACCAGCACCACTACCAGACCAAGCTCTAGTGAACCGGCTACCTTTCCTACCGGAAACAGTACCATCTCAAGCTGGATCAAAAAGCAAGAGGACATAAGTCGTTTTGCTATGTTGAGGAACATTAATCCTCCAGGATCCGCGACCGGTTTCATTGCAGCATCACTAAGTACTGCCGGGCCTGATTATTATTATGCTTGGACTAGAGACGCTGCATTAACATCAAACGTGATTGTTTATGAATATAATACGACCCTTTCCGGTAATAAAACGATCTTGAACGTATTAAAAGACTATGTGACCTTTAGTGTGAAGACCCAATCTACATCTACAGTGTGTAATTGTTTGGGAGAACCTAAATTCAATCCAGACGGTTCTGGGTACACTGGTGCCTGGGGTAGACCTCAAAACGACGGTCCAGCAGAAAGAGCAACAACCTTTGTTCTATTTGCTGACTCTTATTTAACGCAAACAAAGGACGCCTCATATGTTACAGGGACCCTAAAACCAGCAATTTTCAAAGACTTGGATTATGTTGTTAATGTTTGGAGCAACGGATGTTTTGACTTGTGGGAGGAGGTTAACGGTGTACACTTTTATACATTGATGGTGATGAGAAAAGGGTTGCTATTGGGAGCAGATTTCGCTAAAAGAAATGGTGATTCTACAAGAGCGAGCACATATAGTAGCACCGCTTCAACAATCGCCAATAAAATCTCATCTTTCTGGGTATCTAGCAACAACTGGGTACAAGTTTCCCAAAGTGTTACCGGCGGTGTGTCCAAAAAGGGTTTAGACGTTAGCACACTTCTAGCTGCTAATTTGGGTAGCGTTGATGACGGGTTTTTTACTCCAGGTAGTGAGAAGATACTGGCAACCGCGGTGGCGGTTGAAGACAGCTTTGCTTCATTGTATCCTATAAATAAAAATCTGCCCTCTTATCTGGGTAATGCAATTGGCAGATACCCAGAAGATACCTACAATGGTAATGGTAATTCCCAGGGGAACCCATGGTTTTTGGCTGTTACAGGCTACGCAGAACTTTATTACCGTGCAATCAAGGAATGGATTTCAAATGGCGGCGTCACTGTCAGTAGTATAAGTTTGCCCTTTTTTAAGAAATTTGATTCCTCAGCAACGTCTGGTAAAAAATACACCGTAGGTACTAGTGATTTCAATAATTTGGCCCAAAATATTGCGCTTGCTGCTGACAGGTTTCTTAGTACCGTTCAGTTGCACGCTCCAAATAATGGCTCATTGGCTGAAGAATTTGATCGTACGACAGGTTTCTCCACTGGTGCTAGGGATTTGACTTGGAGTCATGCCTCCTTAATCACAGCAAGCTATGCTAAAGCTGGTGCACCTGCTGCTTAG。
来自米根霉的葡糖淀粉酶蛋白质序列(amyA蛋白质)(SEQ ID NO:39):
MKFISTFLTFILAAVSVTAASIPSSASVQLDSYNYDGSTFSGKIYVKNIAYSKKVTVVYADGSDNWNNNGNTIAASFSGPISGSNYEYWTFSASVKGIKEFYIKYEVSGKTYYDNNNSANYQVSTSKPTTTTAATTTTTAPSTSTTTRPSSSEPATFPTGNSTISSWIKKQEDISRFAMLRNINPPGSATGFIAASLSTAGPDYYYAWTRDAALTSNVIVYEYNTTLSGNKTILNVLKDYVTFSVKTQSTSTVCNCLGEPKFNPDGSGYTGAWGRPQNDGPAERATTFVLFADSYLTQTKDASYVTGTLKPAIFKDLDYVVNVWSNGCFDLWEEVNGVHFYTLMVMRKGLLLGADFAKRNGDSTRASTYSSTASTIANKISSFWVSSNNWVQVSQSVTGGVSKKGLDVSTLLAANLGSVDDGFFTPGSEKILATAVAVEDSFASLYPINKNLPSYLGNAIGRYPEDTYNGNGNSQGNPWFLAVTGYAELYYRAIKEWISNGGVTVSSISLPFFKKFDSSATSGKKYTVGTSDFNNLAQNIALAADRFLSTVQLHAPNNGSLAEEFDRTTGFSTGARDLTWSHASLITASYAKAGAPAA。
来自戴尔根霉的经密码子优化的葡糖淀粉酶基因序列(amyA蛋白质)(SEQ ID NO:52):
ATGCAGCTGTTCAACTTGCCATTAAAGGTTTCATTCTTTTTGGTCCTATCATACTTTAGTTTGTTGGTGTCAGCCGCATCTATTCCATCTTCAGCATCTGTACAATTAGACTCCTACAATTACGACGGCTCTACATTCAGCGGAAAGATTTACGTGAAAAATATTGCGTACAGCAAAAAAGTAACTGTTATCTATGCCGACGGATCAGATAACTGGAACAACAATGGAAACACTATCGCTGCCAGTTACTCTGCACCAATTTCAGGTTCTAACTACGAATATTGGACATTCTCAGCCTCCATCAATGGCATTAAGGAATTCTACATAAAGTACGAAGTTTCCGGTAAGACTTACTACGATAACAACAATTCTGCAAACTATCAAGTATCAACATCAAAACCTACTACCACCACCGCCACAGCTACAACTACAACTGCACCTTCAACATCTACCACAACCCCACCATCTTCTAGCGAACCAGCTACATTCCCAACTGGCAATTCTACTATTTCTAGTTGGATCAAAAAACAAGAGGGTATTTCCAGATTCGCAATGTTGAGAAACATAAATCCACCAGGATCAGCAACTGGATTCATCGCAGCTTCTTTGTCCACAGCGGGGCCAGATTACTACTACGCATGGACCAGAGATGCTGCTTTGACAAGTAACGTTATTGTTTACGAATACAATACCACTTTGTCCGGTAACAAGACTATTCTTAACGTCCTAAAGGATTACGTTACATTCTCTGTTAAGACTCAGTCTACATCCACAGTCTGCAATTGTTTGGGTGAACCAAAGTTCAACCCAGATGGCTCTGGATACACAGGTGCCTGGGGTCGTCCACAAAACGATGGGCCTGCCGAGAGAGCCACTACATTTATCCTATTTGCTGACTCATACCTTACACAAACAAAAGATGCATCCTACGTGACTGGAACATTAAAGCCTGCAATCTTCAAAGACCTGGATTACGTTGTCAACGTGTGGTCTAACGGCTGTTTCGATCTATGGGAAGAGGTTAACGGCGTGCACTTCTACACTCTAATGGTCATGAGAAAGGGTCTGTTGTTAGGTGCAGATTTTGCTAAGAGAAACGGTGATTCTACACGTGCTTCTACCTACTCCTCAACAGCATCAACTATTGCGAACAAGATTTCTTCATTTTGGGTTTCAAGTAATAACTGGATACAAGTATCTCAAAGCGTTACAGGGGGTGTCTCAAAAAAGGGTCTTGATGTTTCTACATTACTGGCTGCTAATCTTGGGTCTGTTGATGACGGTTTCTTCACCCCTGGTTCTGAAAAGATCCTCGCTACCGCCGTCGCGGTTGAGGATAGTTTTGCTTCACTCTATCCTATAAACAAAAACCTTCCTTCATACTTAGGAAACAGTATCGGTAGATACCCAGAGGATACATACAATGGTAATGGCAATTCACAGGGAAATCCATGGTTCCTTGCTGTTACAGGGTACGCAGAACTTTACTATAGAGCTATTAAGGAATGGATCGGCAACGGCGGTGTGACAGTTTCCTCAATCTCATTGCCATTTTTCAAAAAGTTTGACTCCAGCGCGACATCTGGTAAAAAGTATACTGTGGGGACTTCTGATTTCAACAATTTGGCTCAAAACATTGCCTTAGCTGCCGACAGATTCTTATCTACCGTACAACTCCATGCACATAACAATGGTAGTTTGGCAGAGGAATTTGATAGAACTACAGGACTCTCTACAGGTGCGAGAGATTTAACTTGGTCACATGCAAGTTTAATTACAGCCTCTTACGCAAAGGCTGGTGCTCCTGCTGCATAA。
来自戴尔根霉的经密码子优化的葡糖淀粉酶基因序列(amyA蛋白质)(SEQ ID NO:53):
ATGCAGTTATTCAACTTACCACTTAAGGTATCTTTCTTTCTAGTCTTATCTTACTTTTCATTGTTAGTATCAGCTGCCTCTATACCAAGTTCAGCATCCGTACAACTAGATTCATACAATTACGACGGTTCAACATTCTCAGGAAAGATATACGTGAAAAATATTGCTTACAGCAAAAAGGTTACTGTGATTTACGCAGATGGGTCAGACAACTGGAATAACAATGGAAACACAATTGCTGCTTCCTATTCTGCCCCTATTTCTGGATCTAACTACGAATACTGGACTTTTTCAGCGAGTATAAACGGAATTAAGGAATTCTATATCAAATATGAAGTCTCTGGTAAGACCTACTACGATAACAACAACTCCGCAAACTACCAAGTTAGCACATCAAAGCCAACCACAACAACTGCTACTGCGACAACTACAACCGCACCAAGCACTTCTACTACAACACCTCCTAGTTCATCTGAGCCAGCAACTTTCCCAACTGGTAATTCCACTATTTCTTCTTGGATCAAAAAACAAGAGGGTATCTCAAGATTCGCCATGCTTAGAAATATCAATCCTCCAGGCTCTGCAACAGGATTCATTGCAGCATCTTTATCAACTGCGGGGCCAGACTACTACTACGCCTGGACTAGAGATGCAGCTTTGACATCAAATGTGATTGTTTATGAATACAACACAACTTTGTCCGGTAACAAGACAATCTTGAACGTCTTGAAGGATTATGTGACATTCTCTGTCAAGACTCAATCTACATCAACAGTTTGTAACTGTCTCGGCGAACCAAAGTTCAACCCTGATGGTAGTGGTTACACTGGTGCTTGGGGTAGACCACAAAACGATGGTCCAGCAGAGAGAGCTACAACTTTCATCTTGTTTGCTGACTCTTACCTAACACAAACCAAGGATGCAAGCTACGTTACTGGAACACTAAAGCCTGCAATCTTTAAAGACCTGGACTATGTTGTAAACGTTTGGTCAAATGGCTGCTTCGATCTATGGGAGGAAGTGAACGGTGTTCACTTCTACACATTAATGGTCATGAGAAAGGGACTCTTGCTTGGTGCAGACTTTGCTAAGAGAAACGGTGATTCTACACGTGCCTCCACTTACTCCTCCACAGCTTCAACCATTGCCAACAAAATCTCTTCTTTCTGGGTCAGCTCAAATAACTGGATTCAAGTTTCTCAATCAGTTACTGGTGGTGTTTCTAAAAAGGGCCTGGATGTGTCAACCTTGCTTGCTGCCAATTTGGGCAGTGTTGATGACGGGTTCTTCACCCCAGGTTCTGAAAAGATCCTCGCCACCGCAGTTGCCGTTGAAGATTCATTTGCTAGTTTATACCCAATCAACAAAAATCTACCATCATACCTTGGAAATTCAATCGGTAGATATCCAGAGGATACATACAACGGTAATGGAAACTCTCAGGGTAACCCTTGGTTTCTTGCAGTTACAGGGTACGCTGAACTGTACTACAGAGCGATTAAGGAATGGATTGGTAATGGCGGCGTAACTGTTAGTTCTATTTCTCTACCTTTCTTCAAAAAGTTCGATAGTTCTGCAACATCTGGTAAAAAGTACACAGTCGGCACTTCCGATTTTAACAATTTAGCTCAGAACATAGCACTGGCAGCTGATCGTTTCTTGAGTACAGTCCAATTGCATGCCCATAACAACGGTAGTTTGGCTGAAGAGTTTGATAGAACCACCGGTTTATCAACCGGCGCCAGAGATTTAACATGGTCCCATGCGTCTTTGATAACTGCTTCTTACGCCAAGGCTGGGGCACCAGCTGCCTGA。
来自戴尔根霉的葡糖淀粉酶蛋白质序列(amyA蛋白质)(SEQ ID NO:40):
MQLFNLPLKVSFFLVLSYFSLLVSAASIPSSASVQLDSYNYDGSTFSGKIYVKNIAYSKKVTVIYADGSDNWNNNGNTIAASYSAPISGSNYEYWTFSASINGIKEFYIKYEVSGKTYYDNNNSANYQVSTSKPTTTTATATTTTAPSTSTTTPPSSSEPATFPTGNSTISSWIKKQEGISRFAMLRNINPPGSATGFIAASLSTAGPDYYYAWTRDAALTSNVIVYEYNTTLSGNKTILNVLKDYVTFSVKTQSTSTVCNCLGEPKFNPDGSGYTGAWGRPQNDGPAERATTFILFADSYLTQTKDASYVTGTLKPAIFKDLDYVVNVWSNGCFDLWEEVNGVHFYTLMVMRKGLLLGADFAKRNGDSTRASTYSSTASTIANKISSFWVSSNNWIQVSQSVTGGVSKKGLDVSTLLAANLGSVDDGFFTPGSEKILATAVAVEDSFASLYPINKNLPSYLGNSIGRYPEDTYNGNGNSQGNPWFLAVTGYAELYYRAIKEWIGNGGVTVSSISLPFFKKFDSSATSGKKYTVGTSDFNNLAQNIALAADRFLSTVQLHAHNNGSLAEEFDRTTGLSTGARDLTWSHASLITASYAKAGAPAA。
来自小孢根霉的经密码子优化的葡糖淀粉酶基因序列(amyA蛋白质)(SEQ ID NO:54):
ATGAAACTTATGAATCCATCTATGAAGGCATACGTTTTCTTTATCTTAAGCTACTTCTCTTTACTCGTTAGCTCAGCTGCGGTGCCAACCTCTGCCGCCGTACAAGTTGAGTCATACAATTATGACGGTACCACTTTTTCAGGTAGAATATTCGTCAAAAACATTGCCTACTCAAAGGTCGTAACAGTTATCTACTCCGATGGATCAGATAACTGGAACAATAACAACAACAAAGTTTCTGCAGCTTACTCAGAAGCAATTTCTGGGTCTAACTACGAATACTGGACATTCTCCGCAAAGTTATCCGGAATTAAACAGTTTTATGTCAAATACGAAGTTTCTGGTTCAACATATTACGACAACAACGGTACCAAAAACTACCAAGTCCAAGCAACCTCAGCGACATCTACAACAGCTACTGCAACCACAACTACAGCTACTGGCACAACAACTACTTCTACAGGTCCAACTAGTACTGCATCCGTATCATTCCCTACCGGTAACTCAACAATTTCTTCCTGGATAAAAAATCAAGAGGAAATCAGCCGTTTTGCTATGTTGAGAAATATCAATCCACCTGGGTCTGCCACAGGGTTCATAGCCGCATCTCTGTCCACAGCCGGCCCAGATTACTATTACTCTTGGACTAGAGATTCAGCACTAACAGCTAATGTGATCGCTTACGAATACAACACAACATTCACTGGAAACACCACCCTTCTTAAGTACTTGAAAGATTACGTTACATTTTCTGTCAAAAGCCAATCTGTATCTACCGTTTGTAACTGTCTGGGAGAACCAAAGTTCAACGCTGATGGTAGTTCTTTTACAGGTCCATGGGGCAGACCACAAAACGACGGACCAGCAGAGAGAGCTGTTACTTTTATGTTGATTGCTGACAGCTACTTGACTCAAACTAAGGACGCATCCTACGTTACCGGTACATTAAAGCCAGCAATCTTCAAAGATCTTGATTACGTAGTTTCTGTTTGGTCTAACGGTTGCTACGATTTATGGGAAGAGGTTAATGGTGTTCATTTCTATACTCTCATGGTCATGAGAAAGGGTTTGATCTTAGGTGCCGACTTCGCTGCTAGAAATGGTGACTCTAGTAGAGCTTCAACCTACAAGCAAACTGCATCAACAATGGAATCAAAGATCAGTTCTTTTTGGTCAGATTCTAACAACTACGTCCAAGTTTCTCAATCAGTTACCGCCGGAGTGTCAAAAAAGGGACTAGATGTTAGTACACTATTGGCGGCCAACATTGGTAGTCTGCCTGATGGCTTTTTCACTCCAGGCTCCGAAAAGATATTGGCTACAGCAGTGGCGTTAGAAAATGCATTCGCATCCTTGTACCCAATTAACTCTAACCTACCTTCTTACTTGGGTAACTCAATTGGAAGATATCCTGAGGATACATACAACGGTAATGGCAACTCTCAGGGGAATCCATGGTTCCTTGCCGTCAACGCATACGCAGAACTTTACTACAGAGCTATTAAGGAATGGATTAGTAATGGCAAGGTGACAGTATCCAATATCTCACTACCTTTCTTCAAAAAGTTTGATTCTTCCGCCACTTCTGGAAAGACATACACTGCTGGTACATCAGATTTCAATAACTTGGCTCAGAACATTGCTTTAGGCGCCGATAGATTCCTGTCTACTGTTAAGTTCCACGCATACACTAACGGGAGTCTATCAGAAGAGTACGATAGATCTACCGGTATGAGTACTGGGGCTCGTGATTTAACATGGTCCCATGCTTCATTGATCACAGTGGCGTACGCAAAGGCCGGTAGTCCTGCAGCTTAG。
来自小孢根霉的葡糖淀粉酶蛋白质序列(amyA蛋白质)(SEQ ID NO:41):
MKLMNPSMKAYVFFILSYFSLLVSSAAVPTSAAVQVESYNYDGTTFSGRIFVKNIAYSKVVTVIYSDGSDNWNNNNNKVSAAYSEAISGSNYEYWTFSAKLSGIKQFYVKYEVSGSTYYDNNGTKNYQVQATSATSTTATATTTTATGTTTTSTGPTSTASVSFPTGNSTISSWIKNQEEISRFAMLRNINPPGSATGFIAASLSTAGPDYYYSWTRDSALTANVIAYEYNTTFTGNTTLLKYLKDYVTFSVKSQSVSTVCNCLGEPKFNADGSSFTGPWGRPQNDGPAERAVTFMLIADSYLTQTKDASYVTGTLKPAIFKDLDYVVSVWSNGCYDLWEEVNGVHFYTLMVMRKGLILGADFAARNGDSSRASTYKQTASTMESKISSFWSDSNNYVQVSQSVTAGVSKKGLDVSTLLAANIGSLPDGFFTPGSEKILATAVALENAFASLYPINSNLPSYLGNSIGRYPEDTYNGNGNSQGNPWFLAVNAYAELYYRAIKEWISNGKVTVSNISLPFFKKFDSSATSGKTYTAGTSDFNNLAQNIALGADRFLSTVKFHAYTNGSLSEEYDRSTGMSTGARDLTWSHASLITVAYAKAGSPAA。
海藻糖-6-磷酸合酶基因序列和蛋白质序列对于本领域普通技术人员而言是公知的。海藻糖-6-磷酸合酶基因序列和蛋白质序列的非限制性实例包含:
来自酿酒酵母的TPS1基因序列(SEQ ID NO:55):
ATGACTACGGATAACGCTAAGGCGCAACTGACCTCGTCTTCAGGGGGTAACATTATTGTGGTGTCCAACAGGCTTCCCGTGACAATCACTAAAAACAGCAGTACGGGACAGTACGAGTACGCAATGTCGTCCGGAGGGCTGGTCACGGCGTTGGAAGGGTTGAAGAAGACGTACACTTTCAAGTGGTTCGGATGGCCTGGGCTAGAGATTCCTGACGATGAGAAGGATCAGGTGAGGAAGGACTTGCTGGAAAAGTTTAATGCCGTACCCATCTTCCTGAGCGATGAAATCGCAGACTTACACTACAACGGGTTCAGTAATTCTATTCTATGGCCGTTATTCCATTACCATCCTGGTGAGATCAATTTCGACGAGAATGCGTGGTTGGCATACAACGAGGCAAACCAGACGTTCACCAACGAGATTGCTAAGACTATGAACCATAACGATTTAATCTGGGTGCATGATTACCATTTGATGTTGGTTCCGGAAATGTTGAGAGTCAAGATTCACGAGAAGCAACTGCAAAACGTTAAGGTCGGGTGGTTCCTGCACACACCATTCCCTTCGAGTGAAATTTACAGAATCTTACCTGTCAGACAAGAGATTTTGAAGGGTGTTTTGAGTTGTGATTTAGTCGGGTTCCACACATACGATTATGCAAGACATTTCTTGTCTTCCGTGCAAAGAGTGCTTAACGTGAACACATTGCCTAATGGGGTGGAATACCAGGGCAGATTCGTTAACGTAGGGGCCTTCCCTATCGGTATCGACGTGGACAAGTTCACCGATGGGTTGAAAAAGGAATCCGTACAAAAGAGAATCCAACAATTGAAGGAAACTTTCAAGGGCTGCAAGATCATAGTTGGTGTCGACAGGCTGGATTACATCAAAGGTGTGCCTCAGAAGTTGCACGCCATGGAAGTGTTTCTGAACGAGCATCCAGAATGGAGGGGCAAGGTTGTTCTGGTACAGGTTGCAGTGCCAAGTCGTGGAGATGTGGAAGAGTACCAATATTTAAGATCTGTGGTCAATGAGTTGGTCGGTAGAATCAACGGTCAGTTCGGTACTGTGGAATTCGTCCCCATCCATTTCATGCACAAGTCTATACCATTTGAAGAGCTGATTTCGTTATATGCTGTGAGCGATGTCTGTTTGGTCTCGTCCACCCGTGATGGTATGAACTTGGTTTCCTACGAATATATTGCTTGCCAAGAAGAAAAGAAAGGTTCCTTAATCCTGAGTGAGTTCACAGGTGCCGCACAATCCTTGAATGGTGCTATTATTGTAAATCCTTGGAACACCGATGATCTTTCTGATGCCATCAACGAGGCCTTGACTTTGCCCGATGTAAAGAAAGAAGTTAACTGGGAAAAACTTTACAAATACATCTCTAAATACACTTCTGCCTTCTGGGGTGAAAATTTCGTCCATGAATTATACAGTACATCATCAAGCTCAACAAGCTCCTCTGCCACCAAAAACTGA。
来自酿酒酵母的Tps1蛋白质序列(SEQ ID NO:43):
MTTDNAKAQLTSSSGGNIIVVSNRLPVTITKNSSTGQYEYAMSSGGLVTALEGLKKTYTFKWFGWPGLEIPDDEKDQVRKDLLEKFNAVPIFLSDEIADLHYNGFSNSILWPLFHYHPGEINFDENAWLAYNEANQTFTNEIAKTMNHNDLIWVHDYHLMLVPEMLRVKIHEKQLQNVKVGWFLHTPFPSSEIYRILPVRQEILKGVLSCDLVGFHTYDYARHFLSSVQRVLNVNTLPNGVEYQGRFVNVGAFPIGIDVDKFTDGLKKESVQKRIQQLKETFKGCKIIVGVDRLDYIKGVPQKLHAMEVFLNEHPEWRGKVVLVQVAVPSRGDVEEYQYLRSVVNELVGRINGQFGTVEFVPIHFMHKSIPFEELISLYAVSDVCLVSSTRDGMNLVSYEYIACQEEKKGSLILSEFTGAAQSLNGAIIVNPWNTDDLSDAINEALTLPDVKKEVNWEKLYKYISKYTSAFWGENFVHELYSTSSSSTSSSATKN。
海藻糖-6-磷酸磷酸酶基因序列和蛋白质序列对于本领域普通技术人员而言是公知的。海藻糖-6-磷酸磷酸酶基因序列和蛋白质序列的非限制性实例包含:
来自酿酒酵母的TPS2基因序列(SEQ ID NO:56):
ATGACCACCACTGCCCAAGACAATTCTCCAAAGAAGAGACAGCGTATCATCAATTGTGTCACGCAGCTGCCCTACAAAATCCAATTGGGAGAAAGCAACGATGACTGGAAAATATCTGCTACTACAGGTAACAGCGCATTATATTCCTCTCTAGAATACCTTCAATTTGATTCTACCGAGTACGAGCAACACGTTGTTGGTTGGACCGGCGAAATAACAAGAACCGAACGCAACCTGTTTACTAGAGAAGCGAAAGAGAAACCACAGGATCTGGACGATGACCCACTATATTTAACAAAAGAGCAGATCAATGGGTTGACTACTACTCTACAAGATCATATGAAATCTGATAAAGAGGCAAAGACCGATACTACTCAAACAGCTCCCGTTACCAATAACGTTCATCCCGTTTGGCTACTTAGAAAAAACCAGAGTAGATGGAGAAATTACGCGGAAAAAGTAATTTGGCCAACCTTCCACTACATCTTGAATCCTTCAAATGAAGGTGAGCAAGAAAAAAACTGGTGGTACGACTACGTCAAGTTTAACGAAGCTTATGCACAAAAAATCGGGGAAGTTTACAGGAAGGGTGACATCATCTGGATCCATGACTACTACCTACTGCTATTGCCTCAACTACTGAGAATGAAATTTAACGACGAATCTATCATTATTGGTTATTTCCATCATGCCCCATGGCCTAGTAATGAATATTTTCGCTGTTTGCCACGTAGAAAACAAATCTTAGATGGTCTTGTTGGGGCCAATAGAATTTGTTTCCAAAATGAATCTTTCTCCCGTCATTTTGTATCGAGTTGTAAAAGATTACTCGACGCAACCGCCAAGAAATCTAAAAACTCTTCCGATAGTGATCAATATCAAGTGTCTGTGTACGGTGGTGACGTACTCGTAGATTCTTTGCCTATAGGTGTTAACACAACTCAAATACTGAAAGATGCTTTCACGAAGGATATAGATTCCAAGGTTCTTTCCATCAAGCAAGCTTATCAAAACAAAAAAATTATTATTGGTAGAGATCGTCTGGATTCCGTCAGAGGCGTCGTTCAAAAATTAAGAGCTTTTGAAACTTTCTTGGCCATGTATCCAGAATGGCGAGATCAAGTGGTATTGATCCAGGTCAGCAGTCCTACTGCTAACAGAAATTCCCCCCAAACTATCAGATTGGAACAACAAGTCAACGAGTTGGTTAATTCCATAAATTCTGAATATGGTAATTTGAATTTTTCTCCCGTCCAGCATTATTATATGAGAATCCCTAAAGATGTATACTTGTCCTTACTAAGAGTTGCAGACTTATGTTTAATCACAAGTGTTAGAGACGGTATGAATACCACTGCTTTGGAATACGTCACTGTGAAATCTCACATGTCGAACTTTTTATGCTACGGAAATCCATTGATTTTAAGTGAGTTTTCTGGCTCTAGTAACGTATTGAAAGATGCCATTGTCGTTAACCCATGGGATTCGGTGGCCGTGGCTAAATCTATTAACATGGCTTTGAAATTGGACAAGGAAGAAAAGTCCAATTTAGAATCAAAATTATGGAAAGAAGTTCCTACAATTCAAGATTGGACTAATAAGTTTTTGAGTTCATTAAAGGAAAAGGCGTCATCTGATGATGATGTGGAAAGGAAAATGACTCCAGCACTTAATAGACCTGTTCTTTTAGAAAACTACAAGCAGGCTAAGCGTAGATTATTCCTTTTTGATTACGATGGTACTTTGACCCCAATTGTCAAAGACCCAGCTGCAGCTATTCCATCGGCAAGACTTTATACAATTCTACAAAAATTATGTGCCGATCCTCATAATCAAATCTGGATTATTTCTGGTCGTGACCAGAAGTTTTTGAACAAGTGGTTAGGCGGTAAACTTCCTCAACTGGGTCTAAGTGCGGAGCATGGATGTTTCATGAAAGATGTTTCTTGCCAAGATTGGGTCAATTTGACCGAAAAAGTTGATATGTCTTGGCAAGTACGCGTCAATGAAGTGATGGAAGAATTTACCACAAGGACCCCAGGTTCATTCATCGAAAGAAAGAAAGTCGCTCTAACTTGGCATTATAGACGTACCGTTCCAGAATTGGGTGAATTCCACGCCAAAGAACTGAAAGAAAAATTGTTATCATTTACTGATGACTTCGATTTAGAGGTCATGGATGGTAAAGCAAACATTGAAGTTCGTCCAAGATTCGTCAACAAAGGTGAAATAGTCAAGAGACTAGTCTGGCATCAACATGGCAAACCACAGGACATGTTGAAGGGAATCAGTGAAAAACTACCTAAGGATGAAATGCCTGATTTTGTATTATGTCTGGGTGATGACTTCACTGACGAAGACATGTTTAGACAGTTGAATACCATTGAAACTTGTTGGAAAGAAAAATATCCTGACCAAAAAAATCAATGGGGCAACTACGGATTCTATCCTGTCACTGTGGGATCTGCATCCAAGAAAACTGTCGCAAAGGCTCATTTAACCGATCCTCAGCAAGTCCTGGAGACTTTAGGTTTACTTGTTGGTGATGTCTCTCTCTTCCAAAGTGCTGGTACGGTCGACCTGGATTCCAGAGGTCATGTCAAGAATAGTGAGAGCAGTTTGAAATCAAAGCTAGCATCTAAAGCTTATGTTATGAAAAGATCGGCTTCTTACACCGGCGCAAAGGTTTGA。
来自酿酒酵母的Tps2蛋白质序列(SEQ ID NO:44):
MTTTAQDNSPKKRQRIINCVTQLPYKIQLGESNDDWKISATTGNSALFSSLEYLQFDSTEYEQHVVGWTGEITRTERNLFTREAKEKPQDLDDDPLYLTKEQINGLTTTLQDHMKSDKEAKTDTTQTAPVTNNVHPVWLLRKNQSRWRNYAEKVIWPTFHYILNPSNEGEQEKNWWYDYVKFNEAYAQKIGEVYRKGDIIWIHDYYLLLLPQLLRMKFNDESIIIGYFHHAPWPSNEYFRCLPRRKQILDGLVGANRICFQNESFSRHFVSSCKRLLDATAKKSKNSSNSDQYQVSVYGGDVLVDSLPIGVNTTQILKDAFTKDIDSKVLSIKQAYQNKKIIIGRDRLDSVRGVVQKLRAFETFLAMYPEWRDQVVLIQVSSPTANRNSPQTIRLEQQVNELVNSINSEYGNLNFSPVQHYYMRIPKDVYLSLLRVADLCLITSVRDGMNTTALEYVTVKSHMSNFLCYGNPLILSEFSGSSNVLKDAIVVNPWDSVAVAKSINMALKLDKEEKSNLESKLWKEVPTIQDWTNKFLSSLKEQASSNDDMERKMTPALNRPVLLENYKQAKRRLFLFDYDGTLTPIVKDPAAAIPSARLYTILQKLCADPHNQIWIISGRDQKFLNKWLGGKLPQLGLSAEHGCFMKDVSCQDWVNLTEKVDMSWQVRVNEVMEEFTTRTPGSFIERKKVALTWHYRRTVPELGEFHAKELKEKLLSFTDDFDLEVMDGKANIEVRPRFVNKGEIVKRLVWHQHGKPQDMLKGISEKLPKDEMPDFVLCLGDDFTDEDMFRQLNTIETCWKEKYPDQKNQWGNYGFYPVTVGSASKKTVAKAHLTDPQQVLETLGLLVGDVSLFQSAGTVDLDSRGHVKNSESSLKSKLASKAYVMKRSASYTGAKV。
将从下文实施例中更加充分地理解这些和其他实施方案的功能和优势。以下实施例旨在阐明本发明的益处,但不举例说明本发明的全部范围。因此,将理解的是,实施例部分并不意味着限制本发明的范围。
实施例
下文描述的是经基因修饰的酿酒酵母菌株。所描述的菌株包含具有改善产乙醇的酵母的乳酸消耗能力的基因修饰的菌株。
菌株1-3:ura3Δ酿酒酵母基础菌株
用SEQ ID NO:1转化菌株1(Ethanol
用SEQ ID NO:2转化菌株1-1。SEQ ID NO:2含有以下元件:i)来自构巢曲霉(Aspergillus nidulans)的乙酰胺酶(amdS)基因的表达盒;以及ii)用于向URA3基因座中的靶向染色体整合的侧翼DNA。在含有80mg/L尿嘧啶和l g/L乙酰胺作为唯一氮源的酵母氮源(无硫酸铵或氨基酸)上选择转化体。将所得的转化体接种在含有80mg/L尿嘧啶和l g/L乙酰胺作为唯一氮源的酵母氮源(无硫酸铵或氨基酸)上以用于单菌落分离。选择单菌落。在单菌落中通过PCR验证SEQ ID NO:2向基因座A的第二等位基因中的正确整合。将经PCR验证的分离株命名为菌株1-2。
用SEQ ID NO:3和SEQ ID NO:4共转化菌株1-2。SEQ ID NO:3含有以下元件:i)来自P1噬菌体的cre重组酶的开放阅读框;以及ii)与SEQ ID NO:4同源的侧翼DNA。SEQ IDNO:4含有以下元件:i)2μ的复制起点;ii)来自酿酒酵母的URA3可选标记;以及iii)含有来自酿酒酵母的PGK启动子和CYC1终止子的侧翼DNA。在缺乏尿嘧啶的合成缺陷型培养基(ScD-Ura)上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落。筛选分离的菌落,以在ScD-PFP以及含有80mg/L尿嘧啶和l g/L乙酰胺作为唯一氮源的酵母氮源(无硫酸铵或氨基酸)上生长。通过PCR验证ARO4-OFP基因和amdS基因的缺失。将经PCR验证的分离株接种至含有5-FOA的YNB,以针对2μ质粒缺失进行选择。将经PCR验证的分离株命名为菌株1-3。
菌株1-4:在CYB2的第一等位基因处表达扣囊复膜酵母葡糖淀粉酶的两个密码子优化变体的酿酒酵母
用SEQ ID NO:5和SEQ ID NO:6共转化菌株1-3。SEQ ID NO:5含有以下元件:i)与天然CYB2基因的5’区同源的DNA;和ii)扣囊复膜酵母葡糖淀粉酶(SEQ ID NO:38)的独特密码子优化变体的表达盒,其受TDH3启动子和CYC1终止子的控制;以及iii)URA3启动子以及URA3基因的一部分。SEQ ID NO:6含有以下元件:i)URA3基因的一部分和终止子;和ii)扣囊复膜酵母葡糖淀粉酶的独特密码子优化变体的表达盒,其受PGK启动子和RPL3终止子的控制;以及iii)与天然CYB2基因的3’区同源的DNA。在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落。通过PCR验证SEQID NO:5和SEQ ID NO:6在CYB2的一等位基因处的正确整合。将经PCR验证的分离株命名为菌株1-4。
菌株1-5:在CYB2的第二等位基因处表达扣囊复膜酵母葡糖淀粉酶的四个密码子优化变体的酿酒酵母
用SEQ ID NO:7和SEQ ID NO:8共转化菌株1-4。SEQ ID NO:7含有以下元件:i)与天然CYB2基因的5’区同源的DNA;和ii)扣囊复膜酵母葡糖淀粉酶的独特密码子优化变体的表达盒,其受TDH3启动子和CYC1终止子的控制;以及iii)TEF1启动子和构巢曲霉乙酰胺酶基因(amdS)的一部分。SEQ ID NO:8含有以下元件:i)构巢曲霉乙酰胺酶基因(amdS)的一部分和ADH1终止子;和ii)扣囊复膜酵母葡糖淀粉酶的独特密码子优化变体的表达盒,其受PGK启动子和RPL3终止子的控制;以及iii)与天然CYB2基因的3’区同源的DNA。在含有80mg/L尿嘧啶和l g/L乙酰胺作为唯一氮源的酵母氮源(无硫酸铵或氨基酸)上选择转化体。将所得的转化体接种在含有80mg/L尿嘧啶和l g/L乙酰胺作为唯一氮源的酵母氮源(无硫酸铵或氨基酸)上以用于单菌落分离。选择单菌落。通过PCR验证SEQ ID NO:7和SEQ ID NO:8在CYB2的剩余等位基因处的正确整合。将经PCR验证的分离株命名为菌株1-5。
菌株1-6:经由菌株1-5中的cre重组酶回收URA3标记和amdS标记
用SEQ ID NO:9转化菌株1-5。SEQ ID NO:9含有以下元件:i)来自酿酒酵母(ARO4-OFP)的3-脱氧-D-阿拉伯-庚酮糖酸-7-磷酸(DAHP)合酶基因的突变形式的表达盒;2)来自P1噬菌体的cre重组酶的表达盒;3)含有天然URA3的表达盒;以及4)酿酒酵母CEN6着丝粒。在含有3.5g/L对氟苯丙氨酸和l g/L L-酪氨酸的合成完全培养基(ScD-PFP)上选择转化体。将所得的转化体接种在ScD-PFP上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-6。
菌株1-7:在菌株1-6中的原始基因座处恢复天然URA3
用SEQ ID NO:10转化菌株1-6。SEQ ID NO:10含有以下元件:1)与菌株1-6中破坏的URA3基因座具有5’和3’同源性的天然URA3的表达盒。在ScD-ura上选择转化体。将所得的转化体接种在ScD-ura上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-7。
菌株1-8:在CYB2的第一等位基因处表达经修饰的米根霉葡糖淀粉酶的酿酒酵母
用SEQ ID NO:11和SEQ ID NO:12共转化菌株1-3。SEQ ID NO:11和SEQ ID NO:12类似于SEQ ID NO:5和SEQ ID NO:6,但具有以下区别:用米根霉葡糖淀粉酶(SEQ ID NO:39)代替扣囊复膜酵母葡糖淀粉酶。在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-8。
菌株1-9:在CYB2的第二等位基因处表达经修饰的米根霉葡糖淀粉酶的酿酒酵母
用SEQ ID NO:13和SEQ ID NO:14共转化菌株1-8。SEQ ID NO:13和SEQ ID NO:14与SEQ ID NO:7和SEQ ID NO:8类似,但具有以下区别:用米根霉葡糖淀粉酶代替扣囊复膜酵母葡糖淀粉酶。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-9。
菌株1-10:经由菌株1-9中的cre重组酶回收URA3标记和amdS标记
用SEQ ID NO:9转化菌株1-9。在含有3.5g/L对氟苯丙氨酸和l g/L L-酪氨酸的合成完全培养基(ScD-PFP)上选择转化体。将所得的转化体接种在ScD-PFP上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-10。
菌株1-11:在菌株1-10中的原始基因座处恢复天然URA3
用SEQ ID NO:10转化菌株1-10。在ScD-ura上选择转化体。将所得的转化体接种在ScD-ura上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-11。
菌株1-12:在FCY1的第一等位基因处表达经修饰的戴尔根霉葡糖淀粉酶的酿酒酵母
用SEQ ID NO:15和SEQ ID NO:16共转化菌株1-3。SEQ ID NO:15含有以下元件:i)与天然FCY1基因的5’区同源的DNA;和ii)戴尔根霉葡糖淀粉酶(SEQ ID NO:40)的独特密码子优化变体的表达盒,其受TDH3启动子和CYC1终止子的控制;以及iii)URA3启动子以及URA3基因的一部分。SEQ ID NO:16含有以下元件:i)URA3基因的一部分和终止子;和ii)戴尔根霉葡糖淀粉酶的独特密码子优化变体的表达盒,其受PGK启动子和GAL10终止子的控制;以及iii)与天然FCY1基因的3’区同源的DNA。在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-12。
菌株1-13:在FCY1的第二等位基因处表达经修饰的戴尔根霉葡糖淀粉酶的酿酒酵母
用SEQ ID NO:17和SEQ ID NO:18共转化菌株1-12。SEQ ID NO:17含有以下元件:i)与天然FCY1基因的5’区同源的DNA;和ii)戴尔根霉葡糖淀粉酶的独特密码子优化变体的表达盒,其受TDH3启动子和CYC1终止子的控制;以及iii)TEF1启动子和构巢曲霉amdS基因的一部分。SEQ ID NO:18含有以下元件:i)构巢曲霉乙酰胺酶(amdS)基因的一部分和ADH1终止子;和ii)戴尔根霉葡糖淀粉酶的独特密码子优化变体的表达盒,其受PGK启动子和GAL10终止子的控制;以及iii)与天然FCY1基因的3’区同源的DNA。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-13。
菌株1-14:经由菌株1-13中的cre重组酶回收URA3标记和amdS标记
用SEQ ID NO:9转化菌株1-13。在含有3.5g/L对氟苯丙氨酸和l g/L L-酪氨酸的合成完全培养基(ScD-PFP)上选择转化体。将所得的转化体接种在ScD-PFP上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-14。
菌株1-15:在菌株1-14中的原始基因座处恢复天然URA3
用SEQ ID NO:10转化菌株1-14。在ScD-ura上选择转化体。将所得的转化体接种在ScD-ura上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-15。
菌株1-16:在FCY1的第一等位基因处表达经修饰的小孢根霉葡糖淀粉酶的酿酒酵母
用SEQ ID NO:19和SEQ ID NO:20共转化菌株1-3。SEQ ID NO:19与SEQ ID NO:15类似,但具有以下区别:用小孢根霉葡糖淀粉酶(SEQ ID NO:41)代替戴尔根霉葡糖淀粉酶。SEQ ID NO:20含有以下元件:i)URA3基因的一部分和终止子;以及ii)与天然FCY1基因的3’区同源的DNA。在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-16。
菌株1-17:在FCY1的第二等位基因处表达经修饰的小孢根霉葡糖淀粉酶的酿酒酵母
用SEQ ID NO:21和SEQ ID NO:22共转化菌株1-16。SEQ ID NO:21与SEQ ID NO:17类似,但具有以下区别:用小孢根霉葡糖淀粉酶代替戴尔根霉葡糖淀粉酶。SEQ ID NO:22含有以下元件:i)构巢曲霉乙酰胺酶(amdS)基因的一部分和TEF1终止子;以及ii)与天然FCY1基因的3’区同源的DNA。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-17。
菌株1-18:经由菌株1-17中的cre重组酶回收URA3标记和amdS标记
用SEQ ID NO:9转化菌株1-17。在含有3.5g/L对氟苯丙氨酸和l g/L L-酪氨酸的合成完全培养基(ScD-PFP)上选择转化体。将所得的转化体接种在ScD-PFP上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-18。
菌株1-19:在菌株1-18中的原始基因座处恢复天然URA3
用SEQ ID NO:10转化菌株1-18。在ScD-ura上选择转化体。将所得的转化体接种在ScD-ura上以用于单菌落分离。选择单菌落。将经PCR验证的分离株命名为菌株1-19。
菌株1-20:在CYB2的两个等位基因处表达经修饰的米根霉葡糖淀粉酶并且在GDP1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母
用SEQ ID NO:23和SEQ ID NO:24以及SEQ ID NO:25和SEQ ID NO:26共转化菌株1-10。
SEQ ID NO:23含有以下元件:i)与天然GPD1基因的5’区同源的DNA;和ii)蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶(SEQ ID NO:42)的独特密码子优化变体的表达盒,其受PGK1启动子和CYC1终止子的控制;和iii)loxP重组位点;以及iv)URA3基因的一部分。SEQ IDNO:24含有以下元件:i)URA3基因的一部分和URA3终止子;和ii)loxP重组位点;以及iii)与天然GPD1基因的3’区同源的DNA。
SEQ ID NO:25含有以下元件:i)与天然GPD1基因的5’区同源的DNA;和ii)蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的独特密码子优化变体的表达盒,其受PGK1启动子和CYC1终止子的控制下;和iii)loxP重组位点;以及iv)TEF1启动子和构巢曲霉乙酰胺酶(amdS)基因的一部分。SEQ ID NO:26含有以下元件:i)amdS基因的一部分和TEF1终止子;和ii)loxP重组位点;以及iii)与天然GPD1基因的3’区同源的DNA。
在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过测序确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-20。
菌株1-21:在CYB2的两个等位基因处表达经修饰的米根霉葡糖淀粉酶、以及GPP1的两个等位基因的缺失的酿酒酵母
用SEQ ID NO:27转化菌株1-10。SEQ ID NO:27含有以下元件:i)与天然GPP1基因的5’区同源的DNA;和ii)来自乳酸克鲁维酵母,URA3启动子以及URA3基因和URA3终止子;和iii)位于URA3盒侧翼的loxP重组位点;以及iv)与天然GPP1基因的3’区同源的DNA。
在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过测序确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-21。
菌株1-22:在CYB2的两个等位基因处表达经修饰的米根霉葡糖淀粉酶并且在GPP1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母
用SEQ ID NO:28和SEQ ID NO:29以及SEQ ID NO:30和SEQ ID NO:31共转化菌株1-10。
SEQ ID NO:28和SEQ ID NO:29类似于SEQ ID NO:23和SEQ ID NO:24,但具有以下区别:用与天然GPP1基因同源的DNA替换与SEQ ID NO:23和SEQ ID NO:24中的天然GPD1基因同源的DNA。SEQ ID NO:30和SEQ ID NO:31类似于SEQ ID NO:25和SEQ ID NO:26,但具有以下区别:用与天然GPP1基因同源的DNA替换与SEQ ID NO:25和SEQ ID NO:26中的天然GPD1基因同源的DNA。
GAPN整合盒的质粒序列为:
在SEQ ID NO:59中,由核苷酸1-729编码的区是GPP1上侧翼区;由核苷酸730-1326编码的区是PGK启动子;由核苷酸1327-2766编码的区是蜡样芽孢杆菌GAPN的密码子优化编码序列;由核苷酸2767-2995编码的区是终止子区。
在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过测序确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-22。
菌株1-23:在CYB2的两个等位基因处表达经修饰的扣囊复膜酵母葡糖淀粉酶并且在GPP1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母
用SEQ ID NO:28和SEQ ID NO:29共转化菌株1-6,并且在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。向前移动三个独立的转化体,以在GPP1基因座处整合表达盒的第二拷贝。
用SEQ ID NO:30和SEQ ID NO:31共转化含有SEQ ID NO:28和SEQ ID NO:29的1个拷贝的三个独立的姊妹菌株,并且在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在测试#5中描述的发酵条件下测试三个独立的转化体,并且将与菌株1相比显示出早期发酵速率和相等或更高最终乙醇滴度的代表性分离株命名为菌株1-23。
菌株1-24:在FCY1的两个等位基因处表达经修饰的戴尔根霉葡糖淀粉酶并且在GPP1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母
用SEQ ID NO:28和SEQ ID NO:29以及SEQ ID NO:30和SEQ ID NO:31共转化菌株1-14。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过测序确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-24。
菌株1-25:在FCY1的两个等位基因处表达经修饰的小孢根霉葡糖淀粉酶并且在GPP1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母
用SEQ ID NO:28和SEQ ID NO:29以及SEQ ID NO:30和SEQ ID NO:31共转化菌株1-18。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过测序确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-25。
菌株1-26:在CYB2的两个等位基因处表达经修饰的米根霉葡糖淀粉酶并且在DLD1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母
用SEQ ID NO:32和SEQ ID NO:33共转化菌株1-10。SEQ ID NO:32和SEQ ID NO:33类似于SEQ ID NO:23和SEQ ID NO:24,但具有以下区别:用与天然DLD1基因同源的DNA替换与SEQ ID NO:23和SEQ ID NO:24中的天然GPD1基因同源的DNA。在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。向前移动三个独立的转化体,以在DLD1基因座处整合表达盒的第二拷贝。
用SEQ ID NO:34和SEQ ID NO:35共转化含有SEQ ID NO:32和SEQ ID NO:33的1个拷贝的三个独立的姊妹菌株。SEQ ID NO:34和SEQ ID NO:35类似于SEQ ID NO:25和SEQ IDNO:26,但具有以下区别:用与天然DLD1基因同源的DNA替换与SEQ ID NO:25和SEQ ID NO:26中的天然GPD1基因同源的DNA。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在测试#5中描述的发酵条件下测试三个独立的转化体,并且将与菌株1相比显示出早期发酵速率和相等或更高最终乙醇滴度的代表性分离株命名为菌株1-26。
菌株1-27:在CYB2的两个等位基因处表达经修饰的扣囊复膜酵母葡糖淀粉酶并且在DLD1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母
用SEQ ID NO:32和SEQ ID NO:33共转化菌株1-6,并且在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。向前移动三个独立的转化体,以在DLD1基因座处整合表达盒的第二拷贝。
用SEQ ID NO:34和SEQ ID NO:35共转化含有SEQ ID NO:32和SEQ ID NO:33的1个拷贝的三个独立的姊妹菌株。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在测试#5中描述的发酵条件下测试三个独立的转化体,并且将与菌株1相比显示出早期发酵速率和相等或更高最终乙醇滴度的代表性分离株命名为菌株1-27。
菌株1-28:在FCY1的两个等位基因处表达经修饰的戴尔根霉葡糖淀粉酶并且在DLD1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母
用SEQ ID NO:32和SEQ ID NO:33共转化菌株1-14,并且在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。向前移动三个独立的转化体,以在DLD1基因座处整合表达盒的第二拷贝。
用SEQ ID NO:34和SEQ ID NO:35共转化含有SEQ ID NO:32和SEQ ID NO:33的1个拷贝的三个独立的姊妹菌株。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在测试#5中描述的发酵条件下测试三个独立的转化体,并且将与菌株1相比显示出早期发酵速率和相等或更高最终乙醇滴度的代表性分离株命名为菌株1-28。
菌株1-29:在FCY1的两个等位基因处表达经修饰的小孢根霉葡糖淀粉酶并且在DLD1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶的酿酒酵母
用SEQ ID NO:32和SEQ ID NO:33共转化菌株1-18,并且在ScD-Ura上选择转化体。将所得的转化体接种在ScD-Ura上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。向前移动三个独立的转化体,以在DLD1基因座处整合表达盒的第二拷贝。
用SEQ ID NO:34和SEQ ID NO:35共转化含有SEQ ID NO:32和SEQ ID NO:33的1个拷贝的三个独立的姊妹菌株。在YNB+乙酰胺板上选择转化体。将所得的转化体接种在YNB+乙酰胺板上以用于单菌落分离。选择单菌落,并且通过PCR确认表达盒的正确整合。在测试#5中描述的发酵条件下测试三个独立的转化体,并且将与菌株1相比显示出早期发酵速率和相等或更高最终乙醇滴度的代表性分离株命名为菌株1-29。
菌株1-30:在CYB2的两个等位基因处表达经修饰的米根霉葡糖淀粉酶、在GPP1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶、并且在ADH2的一等位基因处表达酿酒酵母海藻糖-6-磷酸合酶和海藻糖-6-磷酸合酶/磷酸酶的一个拷贝的酿酒酵母
用SEQ ID NO:36和SEQ ID NO:37共转化菌株1-22。SEQ ID NO:36含有以下元件:i)与天然ADH2基因的5’区同源的DNA;和ii)天然酿酒酵母海藻糖-6-磷酸合酶(TPS1)(SEQID NO:43)的表达盒,其受天然酿酒酵母3-磷酸甘油酸激酶(PGK1)启动子和天然酿酒酵母液泡分选蛋白(VPS13)终止子的控制;以及iii)天然酿酒酵母磷酸丙糖异构酶(TPI1)启动子以及卡那霉素耐药性(G418
菌株1-31:在CYB2的两个等位基因处表达经修饰的米根霉葡糖淀粉酶、在GPD1的两个等位基因处表达蜡样芽胞杆菌甘油醛-3-磷酸脱氢酶、并且在ADH2的一等位基因处表达酿酒酵母海藻糖-6-磷酸合酶和海藻糖-6-磷酸合酶/磷酸酶的一个拷贝的酿酒酵母
用SEQ ID NO:36和SEQ ID NO:37共转化菌株1-20,并且在YPD+G418培养基上选择转化体。将所得的转化体接种在选择培养基上以用于单菌落分离。选择单菌落,并且通过测序确认表达盒的正确整合。在摇瓶发酵中测试三个独立的转化体,并且将代表性分离株命名为菌株1-31。
表1:序列的说明
表2:菌株的说明
实施例2.在玉米醪中在米根霉(Ro)葡糖淀粉酶使能的酵母菌株中的GPP1基因座处gpp1缺失和蜡样芽胞杆菌gapN基因的过度表达的影响
如测试#1中所描述的评估降低GPP1的表达和过度表达GAPN对乙醇产生的影响。在具有使能葡糖淀粉酶的酿酒酵母的菌株中,缺失GPP1基因(菌株1-21和菌株1-22),并且过度表达gapN(菌株1-22)。总葡萄糖当量(TGE)被测定为279g/kg葡萄糖,并且该值用于确定菌株1-22与亲本菌株(菌株1-11)之间的产率差异,如测试#3中所描述的。
结果表明,相对于亲本菌株1-11,对测试菌株(菌株1-21和菌株1-22)中的发酵速率没有影响(图1),并且对于全部菌株而言,在48小时残余葡萄糖为<0.6g/kg(图3B)。在48小时时,与亲本(菌株1-11)相比,葡糖淀粉酶使能的酵母菌株(菌株1-22)中在GPP1基因座处整合的gapN的组合造成4.3g/L的甘油滴度降低(图3C)、1.8g/L的乙醇滴度提高(图3A)和1.3%的产率提高(图2)。
实施例3.在玉米醪中在米根霉(Ro)葡糖淀粉酶使能的酵母菌株中的GPD1基因座或GPP1基因座处过度表达蜡样芽胞杆菌gapN基因的比较
如测试1#中所描述的,在玉米醪中比较在米根霉(Ro)葡糖淀粉酶使能的酵母菌株中的GPD1基因座(菌株1-20)或GPP1基因座(菌株1-22)处过度表达蜡样芽胞杆菌gapN基因的影响。将测试菌株(菌株1-20和菌株1-22)与亲本菌株(菌株1-11)和野生型菌株(菌株1)进行比较。
发现菌株1-20在玉米醪中在40小时内产生的乙醇降低了17%(依据质量损失计算),证明显著的速率损失(图4)。相比之下,向GPP1基因座(菌株1-22)添加GAPN导致到40小时时的乙醇产生与菌株1等同(图4)。在48小时时,图4中每种菌株的平均乙醇滴度(依据质量损失)(g/L)如下:115.62g/L(菌株1-20)、130.47g/L(菌株1-22)、130.09g/L(菌株1-11)和130.16g/L(菌株1)。这些数据表明,在GPD1基因座处添加GAPN较不利,因为相对于将GAPN添加至除GPD1以外的基因座(如添加至基因座GPP1),这造成增加的发酵损失。
实施例4.在轻浸渍水液化物(湿磨原料)气锁烧瓶中的菌株1-21和菌株1-22中的乙醇产生和甘油降低
使用菌株1、菌株1-11、菌株1-21和菌株1-22测试降低GPP1的表达和过度表达GAPN对轻浸渍水液化物(湿磨原料)气锁烧瓶中乙醇产生的影响,从而如测试#4中所描述的测量乙醇滴度和甘油水平。
数据揭示了与菌株1-11相比菌株1-22中3.9g/L的甘油降低、1.9g/L的乙醇增加(图5)。这与在玉米醪(干磨乙醇原料)中观察到的甘油滴度降低和乙醇滴度增加相似。图5示出在72小时的轻浸渍水液化物LSW/LQ培养基(湿磨原料)中的结果。
实施例5:葡糖淀粉酶背景的比较、以及表达Tps1/Tps2的菌株的评价
运行发酵实验(测试#1)(每个菌株4次重复),从而比较在米根霉(Ro)葡糖淀粉酶使能的酵母菌株中的GPD1基因座(菌株1-20)或GPP1基因座(菌株1-22)处过度表达蜡样芽胞杆菌gapN基因的影响。此外,在菌株1-20和菌株1-22中过度表达Tps1/Tps2蛋白,以评估这些基因是否会提高乙醇发酵速度。所得的菌株(菌株1-30(在GPP1基因座处gapN)和菌株1-31(在GPD1基因座处gapN))两者都在ADH2基因座处含有1个Tps1/Tps2基因的过度表达的拷贝。还在三种不同的葡糖淀粉酶背景RoGA(菌株1-22)、Rdel(菌株1-24)和Rmic(菌株1-25)中评估GPP1基因座处的蜡样芽孢杆菌gapN基因的影响,以便确定葡糖淀粉酶基因来源是否会影响玉米醪中的乙醇产生。除菌株1-20和菌株1-31(含有GPD1基因座的缺失)运行67小时以外,全部菌株运行48小时。
图6是示出玉米醪中的菌株1-24和菌株1-25分别比菌株1产生高出2.2g/L和3.6g/L的乙醇滴度的图表。
图7是示出菌株1-24和菌株1-25中的残余葡萄糖(相对于菌株1)的图表。在GPP1基因座处含有gapN基因的菌株在发酵结束时显示出<1.5g/kg的残余葡萄糖值。
图8是示出玉米醪中的菌株1-24和菌株1-25分别相对于菌株1产生5.0g/L和4.6g/L的甘油滴度降低的图表。
由于发酵负担,将蜡样芽孢杆菌gapN基因插入GPD1基因座处的菌株从未达到亲本菌株的滴度。相比之下,蜡样芽孢杆菌gapN基因插入GPP1基因座处的菌株表现更好。
图9示出在47小时处玉米醪中的菌株1-25相对于菌株1产生4.1g/L的乙醇滴度增加。
图10示出玉米醪中的菌株1-25相对于菌株1产生4.3g/L的甘油滴度降低。图10B示出玉米醪中在发酵结束时(47小时)的残余葡萄糖少于1.5g/L。
菌株1-25展现出改善的乙醇滴度和减小的甘油滴度,而对发酵速率没有负面影响。
实施例6.在玉米醪中在各种葡糖淀粉酶使能的酵母菌株中在GPP1基因座或DLD1基因座处过度表达蜡样芽孢杆菌gapN基因的比较
如测试1#中所描述的,在玉米醪中比较在葡糖淀粉酶使能的酵母菌株中的GPP1基因座(菌株1-22、菌株1-23、菌株1-24、和菌株1-25)或DLD1基因座(菌株1-27、菌株1-28、和菌株1-29)处过度表达蜡样芽胞杆菌gapN基因的影响。将测试菌株(菌株1-22、菌株1-23、菌株1-24、菌株1-25、菌株1-27、菌株1-28、和菌株1-29)与亲本菌株(菌株1-7、菌株1-11、菌株1-15、和菌株1-19)和野生型菌株(菌株1)进行比较。
根据葡糖淀粉酶背景,蜡样芽孢杆菌gapN向GPP1基因座和DLD1基因座两者的添加造成甘油滴度降低介于3.1g/kg与3.9g/kg之间(图11)。一般而言,含有gapN的菌株(无论整合位点如何)相比于各自的亲本菌株并且相比于野生型菌株(菌株1)都显示出乙醇滴度增加(图12)。除了菌株1-23以外,全部菌株中的乙醇滴度增加为至少1.4g/kg。尽管菌株1-23与亲本对照(菌株1-7)相比显示出3.1g/kg的甘油降低,但乙醇滴度相似。菌株1-29相对于菌株1显示出最高的乙醇滴度增加(增加3.5g/kg(138.2g/kg-134.7g/kg))。
这些数据表明,如测试#1所定义的,GAPN在GPP1基因座或DLD1基因座处的添加造成发酵结束时增加的乙醇滴度。
实施例7:测试和测定
测试1:菌株在33.3℃在33%DS玉米醪中的表征
将菌株接种至YPD板,并且在30℃孵育直至可见单菌落(1-2天)。将来自YPD板的细胞刮入pH 7.0的无菌磷酸盐缓冲液中,并且测量光密度(OD600)。使用型号Genesys 20可见光分光光度计(Thermo Scientific)在600nm波长和1cm路径长度下测量光密度。在摇瓶中接种达到0.1的初始OD600所必需的体积的细胞浆。接种体积通常为约66μl。在即将接种之前,将以下材料添加至每个250ml带有挡板的摇瓶:50克的液化玉米醪、190μl的500g/L经过滤灭菌的尿素、以及2.5μl的100mg/ml氨苄青霉素的经过滤灭菌的原料。对于含有Ethanol
测试2:菌株在33.3℃在33%DS玉米醪中的表征(测试#2)
将菌株接种至YPD板,并且在30℃孵育直至可见单菌落(1-2天)。将来自YPD板的细胞刮入pH 7.0的无菌磷酸盐缓冲液中,并且测量光密度(OD600)。使用型号Genesys 20可见光分光光度计(Thermo Scientific)在600nm波长和1cm路径长度下测量光密度。在摇瓶中接种达到0.1的初始OD600所必需的体积的细胞浆。接种体积通常为约66μl。在即将接种之前,将以下材料添加至每个250ml带有挡板的摇瓶:50克的液化玉米醪、190μl的500g/L经过滤灭菌的尿素、以及2.5μl的100mg/ml氨苄青霉素的经过滤灭菌的原料。摇瓶接收达到0.33AGU/g干固体的剂量的一定量的葡糖淀粉酶(Spirizyme Fuel HS
测试3:产率计算
乙醇产率的公式可以定义为:(时间终点处的乙醇滴度-时间零点处的乙醇滴度)除以时间零点处的TGE。
当计算甘油降低菌株与对照菌株之间的产率差异时,从甘油降低菌株的乙醇产率中减去对照菌株的乙醇产率。例如,如测试#1中所描述的,在玉米醪发酵中运行菌株1-24和菌株1。起始培养基被确定为具有280g/kg葡萄糖的TGE值,并且存在0g/kg的乙醇。在48小时时,通过HPLC测量发酵液体培养基,并且确定菌株1-24达到130g/kg的最终乙醇滴度,且菌株1达到128g/kg的的最终乙醇滴度。基于上文的产率计算,可以确定菌株1-24具有46.4%的乙醇产率(130g/kg乙醇除以280g/kg TGE),并且菌株1具有45.7%的乙醇产率(128g/kg乙醇除以280g/kg TGE)。通过使用菌株1-24的乙醇产率(46.4%)并且减去菌株1的乙醇产率(45.7%),可以认为菌株1-24具有比菌株1高出0.7%的乙醇产率。
测试4:经基因修饰的酿酒酵母菌株在同步糖化发酵(SSF)摇瓶测定中的评估
将菌株接种至ScD-ura板,并且在30℃孵育直至可见单菌落(2-3天)。将来自ScD-ura板的细胞刮入无菌摇瓶培养基中,并且测量光密度(OD600)。使用型号Genesys 20分光光度计(Thermo Scientific)在600nm波长和1cm路径长度下测量光密度。在摇瓶中接种细胞浆以达到0.1的初始OD600。在即将接种之前,将50mL的摇瓶培养基添加至250mL带有挡板的摇瓶,该摇瓶用含有4ml灭菌芥花油的气锁密封。摇瓶培养基由725g部分水解的玉米淀粉、150g经过滤的灭菌(0.2μm)轻浸渍水、10g水、25g葡萄糖和1g尿素组成。将菌株在30℃在定轨振荡器中以100rpm振荡孵育72小时。采集样品,并且通过HPLC分析发酵结束时液体培养基中的代谢物浓度。
葡糖淀粉酶活性测定
葡糖淀粉酶活性(AGU)指在标准反应条件下每分钟水解1微摩尔麦芽糖的酶的量。制备以下储备溶液:i)10×麦芽糖储备溶液(232mM);和ii)2×乙酸钠缓冲液(pH 4.3)的储备溶液(200mM)。葡糖淀粉酶储备溶液的1:10稀释液用作起始材料,并且从此处稀释(.899g水+.140g葡糖淀粉酶=总计1.0139g)。在水中进行系列稀释(1:1),其中从最初的1:10稀释开始,系列中总计六次稀释。
在200μl反应体积中,依次添加以下组分:100μl的乙酸钠缓冲液(pH 4.3)、20μl的10×麦芽糖储备溶液(或空白对照中的水)、以及70μl水。在10μl经稀释的酶溶液的添加之前,将反应预加温至37℃。在37℃5分钟之后,用15μl的浓H
1.将反应结束时的葡萄糖浓度(克/升)除以葡萄糖的分子量(180.156克/摩尔),以获得葡萄糖的摩尔浓度(摩尔/升)。
2.将摩尔浓度乘以反应的总体积(215μl),以获得葡萄糖的微摩尔浓度。
3.将步骤2(上文)中计算的葡萄糖的微摩尔除以2,以计算反应中用作底物的麦芽糖(2葡萄糖=1麦芽糖)。该数字除以测定本身中使用的酶的克数。如上所述制作最低稀释度(1.1039g水中0.140g),然后将该稀释度乘以测定稀释度(10μl的酶除以215μl的总体积)。
例如,含有上文列出的组分的反应返回4.2克/升的HPLC葡萄糖浓度,并且酶的活性被确定为312.7AGU/g。
表3:淀粉酶活性测定的实例
测试5:菌株在50ml锥形管中在33.3℃在33%DS玉米醪中的表征
菌株接种至YPD板,并且在30℃孵育直至可见单菌落(1-2天)。将来自YPD板的细胞刮入pH 7.0的无菌磷酸盐缓冲液中,并且测量光密度(OD600)。使用型号Genesys 20可见光分光光度计(Thermo Scientific)在600nm波长和1cm路径长度下测量光密度。装有0.2μm过滤器(Nalgene注射器式过滤器,Thermo Scientific;目录号:727-2020)的50ml锥形管接种有达到0.1的初始OD600所必需的体积的细胞浆。接种体积通常为约26μl。在即将接种之前,将以下材料添加至每个50ml锥形管(Fisher Scientific;目录号:05-539-13):20克的液化玉米醪、76μl的500g/L经过滤灭菌的尿素、以及1μl的100mg/ml氨苄青霉素的经过滤灭菌的原料。对于含有Ethanol
等同物
本领域技术人员仅使用常规实验就将认识到或能够确知本文所描述的本发明的具体实施方案的许多等同物。这样的等同物旨在由以下权利要求书涵盖。
本文公开的全部参考文献(包含专利文件)通过引用被整体(特别是本文所引用的公开内容)并入本文。
序列表
<110> 嘉吉有限公司
<120> 用于使用经工程化的酵母产生乙醇的方法
<130> G0919.70031WO00
<140> 尚未分配
<141> 与此同时
<150> US 62/648,679
<151> 2018-03-27
<160> 59
<170> PatentIn版本3.5
<210> 1
<211> 3182
<212> DNA
<213> 酿酒酵母
<400> 1
cctactgcgc caattgatga caatacagac gatgataaca aaccgaagtt atctgatgta 60
gaaaaggatt aaagatgcta agagatagtg atgatatttc ataaataatg taattctata 120
tatgttaatt accttttttg cgaggcatat ttatggtgaa ggataagttt tgaccatcaa 180
agaaggttaa tgtggctgtg gtttcagggt ccataaagct tttcaattca tctttttttt 240
ttttgttctt ttttttgatt ccggtttctt tgaaattttt ttgattcggt aatctccgag 300
cagaaggaag aacgaaggaa ggagcacaga cttagattgg tatatatacg catatgtggt 360
gttgaagaaa catgaaattg cccagtattc ttaacccaac tgcacagaac aaaaacctgc 420
aggaaacgaa gataaagcgg ccgcataact tcgtataatg tatgctatac gaagttatct 480
gccagtatac agctagcctt gaaagtgatg gaaaacattg tcatcggcac ataaataaaa 540
aaattatgaa tcacgtgatc aacagcaaat tatgtactcg tatatatgca agcgcattcc 600
ttatattgac actctttcat tgggcatgag gctgtgtaaa cataagctgt aacggtctca 660
cggaacactg tgtagttgca ttactgtcag gcagttatgt tgcttaatat aaaggcaaag 720
gcatggcaga atcactttaa aacgtggccc cacccgctgc accctgtgca ttttgtacgt 780
tactgcgaaa tgactcaacg atgaaatgaa aaaattttgc ttgaaatttt gaaaaaaaga 840
tgtgcgggac gcattgttag ctcattgaat acatcgtgat cgaatccaat caatgtttaa 900
tttcatatta atacagaaac tttttctcat actttcttct tcttttcatt ggtatattat 960
ctatatatcg tgttaattcc tctttcgtca tttttagcat cgttataaga gtaattaaga 1020
ataactagaa gagtctctct ttatattcgt ttattttata tatttaaccg ctaaatttag 1080
taaacaaaag aatctatcag aaatgagtga atctccaatg ttcgctgcca acggcatgcc 1140
aaaggtaaat caaggtgctg aagaagatgt cagaatttta ggttacgacc cattagcttc 1200
tccagctctc cttcaagtgc aaatcccagc cacaccaact tctttggaaa ctgccaagag 1260
aggtagaaga gaagctatag atattattac cggtaaagac gacagagttc ttgtcattgt 1320
cggtccttgt tccatccatg atctagaagc cgctcaagaa tacgctttga gattaaagaa 1380
attgtcagat gaattaaaag gtgatttatc catcattatg agagcatact tggagaagcc 1440
aagaacaacc gtcggctgga aaggtctaat taatgaccct gatgttaaca acactttcaa 1500
catcaacaag ggtttgcaat ccgctagaca attgtttgtc aacttgacaa atatcggttt 1560
gccaattggt tctgaaatgc ttgataccat ttctcctaaa tacttggctg atttggtctc 1620
cttcggtgcc attggtgcca gaaccaccga atctcaactg cacagagaat tggcctccgg 1680
tttgtctttc ccagttggtt tcaagaacgg taccgatggt accttaaatg ttgctgtgga 1740
tgcttgtcaa gccgctgctc attctcacca tttcatgggt gttactaagc atggtgttgc 1800
tgctatcacc actactaagg gtaacgaaca ctgcttcgtt attctaagag gtggtaaaaa 1860
gggtaccaac tacgacgcta agtccgttgc agaagctaag gctcaattgc ctgccggttc 1920
caacggtcta atgattgact actctcacgg taactccaat aaggatttca gaaaccaacc 1980
aaaggtcaat gacgttgttt gtgagcaaat cgctaacggt gaaaacgcca ttaccggtgt 2040
catgattgaa tcaaacatca acgaaggtaa ccaaggcatc ccagccgaag gtaaagccgg 2100
cttgaaatat ggtgtttcca tcactgatgc ttgtataggt tgggaaacta ctgaagacgt 2160
cttgaggaaa ttggctgctg ctgtcagaca aagaagagaa gttaacaaga aatagatgtt 2220
tttttaatga tatatgtaac gtacattctt tcctctacca ctgccaattc ggtattattt 2280
aattgtgttt agcgctattt actaattaac tagaaactca atttttaaag gcaaagctcg 2340
ctgacctttc actgatttcg tggatgttat actatcagtt actcttctgc aaaaaaaaat 2400
tgagtcatat cgtagctttg ggattatttt tctctctctc cacggctaat taggtgatca 2460
tgaaaaaatg aaaaattcat gagaaaagag tcagacatcg aaacatacat aagttgatat 2520
tcctttgata tcgacgacta ctcaatcagg ttttaaaaga aaagaggcag ctattgaagt 2580
agcagtatcc agtttaggtt ttttaattat ttacaagtaa agaaaaagag aatgccggtc 2640
gttcacgata acttcgtata atgtatgcta tacgaagtta tgcggccgcg agaagatgcg 2700
gccagcaaaa ctaaaaaact gtattataag taaatgcatg tatactaaac tcacaaatta 2760
gagcttcaat ttaattatat cagttattac ccgggaatct cggtcgtaat gatttctata 2820
atgacgaaaa aaaaaaaatt ggaaagaaaa agcttcatgg cctttataaa aaggaactat 2880
ccaatacctc gccagaacca agtaacagta ttttacgggg cacaaatcaa gaacaataag 2940
acaggactgt aaagatggac gcattgaact ccaaagaaca acaagagttc caaaaagtag 3000
tggaacaaaa gcaaatgaag gatttcatgc gtttgtactc taatctggta gaaagatgtt 3060
tcacagactg tgtcaatgac ttcacaacat caaagctaac caataaggaa caaacatgca 3120
tcatgaagtg ctcagaaaag ttcttgaagc atagcgaacg tgtagggcag cgtttccaag 3180
ag 3182
<210> 2
<211> 3275
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 2
cctactgcgc caattgatga caatacagac gatgataaca aaccgaagtt atctgatgta 60
gaaaaggatt aaagatgcta agagatagtg atgatatttc ataaataatg taattctata 120
tatgttaatt accttttttg cgaggcatat ttatggtgaa gaataagttt tgaccatcaa 180
agaaggttaa tgtggctgtg gtttcagggt ccataaagct tttcaattca tcattttttt 240
tttattcttt tttttgattc cggtttcctt gaaatttttt tgattcggta atctccgaac 300
agaaggaaga acgaaggaag gagcacagac ttagattggt atatatacgc atatgtagtg 360
ttgaagaaac atgaaattgc ccagtattct taacccaact gcacagaaca aaaatctgca 420
ggaaacgaag ataaagcggc cgcataactt cgtatagcat acattatacg aagttatcgc 480
ctgttaagat ataactgaaa aaagagggga atttttagat actgaaatga tattttagaa 540
taaccagact atatataagg ataaattaca aaaaattaac taatagataa gatttaaata 600
taaaagatat gcaactagaa aagtcttatc aatctcctta tggagtgacg acgttaccca 660
acaatttacc gacttcttcg gcgatagcca aagttctctc ttcggacaat cttctaccaa 720
taacttgaac agcaacagga gcaccgtgat aagcctctgg gtcgtattct tcttgaacca 780
aagcatccaa ttcggaaaca gctttaaaag attcgttctt cttatcaata ttcttatcag 840
cgaaagtgac tgggacgaca acagaggtga aatccaataa gttaataacg gaggcgtaac 900
cgtagtatct gaattgatcg tgtctgacag cggcggtagg agtaattgga gcgataatag 960
cgtccaattc cttaccagct ttttcttcag cttcacgcca cttttccaag tattccattt 1020
gatagttcca cttttgtaaa tgagtgtccc acaattcgtt catgttaaca gccttaatat 1080
ttgggttcaa caagtcctta atgttaggga tggctggctc accagaggca gaaatgtctc 1140
tcatgacgtc ggcagaacca tcagcagcat agatgtggga aatcaagtca tgaccgaaat 1200
catgcttgta tggagtccat ggagtaacgg tgtgaccagc cttggccaaa gcggcaacgg 1260
tagtttcgac accacgtaaa attggtgggt gtggcaagac gttaccgtcg aaattgtaat 1320
aaccaatgtt caaaccacca ttcttaatct tagaggcaat gatgtcagat tcagattgtc 1380
tccatggcat tgggatgacc ttagagtcgt acttccaagg ttcttgaccc aagacagatt 1440
tggtgaacaa tctcaagtct tcgacggagt gagtgatagg accaacgacg gagtgaacgg 1500
tttcttgacc ttccatagag ttagccattt tagcatatgg caatctaccg tgagatggtc 1560
tcaaaccgta taaaaagttg aaagcagctg ggactctaat ggaaccacca atgtcagtac 1620
cgacaccaat aacaccacct ctaataccaa caatagcacc ttcaccacca gaagaaccac 1680
cacaggacca atttttgttt cttggattga cagttctacc aatgatgttg ttgacggttt 1740
cacagaccat caaggtttgt gggacagagg tcttaacgta gaaaacagca ccagcttttc 1800
tcaacatggt ggttaagacg gaatcacctt catcgtattt gtttaaccag gaaatgtaac 1860
ccatggaggt ttcgtaaccc ttaacacgca attggtcctt taaagagatt ggtaaaccgt 1920
gtaatggacc aactggtctc ttatgcttag cgtagtattc atctaattct ctagcttgag 1980
ctaaagcagc atctgggaag aattcgtgag cacagttggt taattgttga gcaatagcag 2040
ctctcttaca aaaagccaaa gtgacttcaa cagaagtcaa ctcaccagcg gccaacttgg 2100
agaccaaatc agcagcagag gcttcggtaa tcttcaattc agcctcagac aaaataccgg 2160
acttctttgg gaaatcaata acggaatctt cggcaggcaa agtttgaacc ttccattcgt 2220
caggaatggt tttagccaaa cgggcacgtt tgtcggcggc caattcttcc caggattgtg 2280
gcattttgta attaaaactt agattagatt gctatgcttt ctttctaatg agcaagaagt 2340
aaaaaaagtt gtaatagaac aagaaaaacg aaactgaaac ttgagaaatt gaagaccatt 2400
tattaactta aatatcaatg ggaggtcatc gaaagagaaa aaaatcaaaa aaaaaatttt 2460
tcaagaaaaa gaaacgtgat aaaaattttt attgcctttt tcgacgaaga aaaagaaacg 2520
aggcggtctc ttttttcttt tccaaacctt tagtacgggt aattaacgcc accctagagg 2580
aagaaagagg ggaaatttag tatgctgtgc ttgggtgttt tgaagtggta cggcgatgcg 2640
cggagtccga gaaaatctgg aagagtaaaa aaggagtaga aacattttga agctatggtg 2700
tgtgggggat cacttgtggg ggattgggtg tgatgtaagg ataacttcgt atagcataca 2760
ttatacgaag ttatgcggcc gcgagaagat gcggccagca aaactaaaaa actgtattat 2820
aagtaaatgc atgtatacta aactcacaaa ttagagcttc aatttaatta tatcagttat 2880
tacccgggaa tctcggtcgt aatgattttt ataatgacga aaaaaaaaaa attggaaaga 2940
aaaagcttca tggcctttat aaaaaggaac catccaatac ctcgccagaa ccaagtaaca 3000
gtattttacg gggcacaaat caagaacaat aagacaggac tgtaaagatg gacgcattga 3060
actccaaaga acaacaagag ttccaaaaag tagtggaaca aaagcaaatg aaggatttca 3120
tgcgtttgta ctctaatctg gtagaaagat gttttacaga ctgtgtcaat gacttcacaa 3180
catcaaagct aaccaataag gaacaaacat gcatcatgaa gtgctcagaa aagttcttga 3240
agcatagcga acgtgtaggg cagcgtttcc aagag 3275
<210> 3
<211> 1132
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 3
ctctttttta cagatcatca aggaagtaat tatctacttt ttacaagaat tcatgtctaa 60
tttacttact gttcaccaaa acttgcctgc attaccagtt gacgcaacct ccgatgaagt 120
cagaaagaac cttatggata tgtttagaga tagacaagct ttctccgaac atacttggaa 180
aatgttatta tccgtttgta gatcctgggc cgcttggtgt aaacttaaca atagaaaatg 240
gtttcctgct gaaccagaag acgtcagaga ttacttactt tacttacaag ctagaggttt 300
ggctgttaaa actatccaac aacacttagg tcaattgaat atgttacaca gaagatccgg 360
tttaccaaga ccatccgatt ccaacgcagt ttcccttgtt atgagaagaa ttagaaaaga 420
aaatgttgac gctggtgaaa gagctaaaca agcattagca tttgaaagaa ccgatttcga 480
tcaagttaga tccttaatgg aaaattccga tagatgtcaa gatattagaa acttagcttt 540
cttaggtatt gcttacaaca cattattaag aatcgctgaa attgctagaa ttagagttaa 600
agatatttca agaaccgatg gcggtagaat gttaatccac attggcagaa caaaaacctt 660
agtctccaca gcaggcgtcg aaaaagcatt atcattaggt gttactaaat tagttgaacg 720
ttggatttcc gtttccggtg ttgcagatga cccaaacaac tacttattct gtcgtgttag 780
aaaaaatggt gttgccgctc cttccgctac ctcacaatta tccacaagag cattagaagg 840
catttttgaa gctacccaca gacttattta tggtgcaaaa gacgattccg gtcaaagata 900
tttagcttgg tctggtcatt ccgctagagt tggtgccgca agagacatgg caagagctgg 960
tgtttctatt cctgaaatta tgcaagccgg tggttggact aatgttaaca ttgttatgaa 1020
ctatatcaga aacttagatt ccgaaacagg tgctatggtt agattacttg aagacggtga 1080
ttaagctagc taagatccgc tctaaccgaa aaggaaggag ttagacaacc tg 1132
<210> 4
<211> 6376
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 4
ctagctaaga tccgctctaa ccgaaaagga aggagttaga caacctgaag tctaggtccc 60
tatttatttt tttatagtta tgttagtatt aagaacgtta tttatatttc aaatttttct 120
tttttttctg tacagacgcg tgtacgcatg taacattata ctgaaaacct tgcttgagaa 180
ggttttggga cgctcgaaga tccagctgca ttaatgaatc ggccaacgcg cggggagagg 240
cggtttgcgt attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 300
tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 360
aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 420
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 480
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 540
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 600
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 660
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 720
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 780
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 840
agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 900
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 960
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1020
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 1080
ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 1140
aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 1200
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 1260
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 1320
cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 1380
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 1440
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 1500
cgttgttgcc attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 1560
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 1620
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 1680
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 1740
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 1800
ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 1860
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 1920
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 1980
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 2040
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 2100
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 2160
tccgcgcaca tttccccgaa aagtgccacc tgaacgaagc atctgtgctt cattttgtag 2220
aacaaaaatg caacgcgaga gcgctaattt ttcaaacaaa gaatctgagc tgcattttta 2280
cagaacagaa atgcaacgcg aaagcgctat tttaccaacg aagaatctgt gcttcatttt 2340
tgtaaaacaa aaatgcaacg cgagagcgct aatttttcaa acaaagaatc tgagctgcat 2400
ttttacagaa cagaaatgca acgcgagagc gctattttac caacaaagaa tctatacttc 2460
ttttttgttc tacaaaaatg catcccgaga gcgctatttt tctaacaaag catcttagat 2520
tacttttttt ctcctttgtg cgctctataa tgcagtctct tgataacttt ttgcactgta 2580
ggtccgttaa ggttagaaga aggctacttt ggtgtctatt ttctcttcca taaaaaaagc 2640
ctgactccac ttcccgcgtt tactgattac tagcgaagct gcgggtgcat tttttcaaga 2700
taaaggcatc cccgattata ttctataccg atgtggattg cgcatacttt gtgaacagaa 2760
agtgatagcg ttgatgattc ttcattggtc agaaaattat gaacggtttc ttctattttg 2820
tctctatata ctacgtatag gaaatgttta cattttcgta ttgttttcga ttcactctat 2880
gaatagttct tactacaatt tttttgtcta aagagtaata ctagagataa acataaaaaa 2940
tgtagaggtc gagtttagat gcaagttcaa ggagcgaaag gtggatgggt aggttatata 3000
gggatatagc acagagatat atagcaaaga gatacttttg agcaatgttt gtggaagcgg 3060
tattcgcaat attttagtag ctcgttacag tccggtgcgt ttttggtttt ttgaaagtgc 3120
gtcttcagag cgcttttggt tttcaaaagc gctctgaagt tcctatactt tctagagaat 3180
aggaacttcg gaataggaac ttcaaagcgt ttccgaaaac gagcgcttcc gaaaatgcaa 3240
cgcgagctgc gcacatacag ctcactgttc acgtcgcacc tatatctgcg tgttgcctgt 3300
atatatatat acatgagaag aacggcatag tgcgtgttta tgcttaaatg cgtacttata 3360
tgcgtctatt tatgtaggat gaaaggtagt ctagtacctc ctgtgatatt atcccattcc 3420
atgcggggta tcgtatgctt ccttcagcac taccctttag ctgttctata tgctgccact 3480
cctcaattgg attagtctca tccttcaatg ctatcatttc ctttgatatt ggatcatact 3540
aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 3600
gtctcgcgcg tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg 3660
tcacagcttg tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg 3720
gtgttggcgg gtgtcggggc tggcttaact atgcggcatc agagcagatt gtactgagag 3780
tgcaccatac cacagctttt caattcaatt catcattttt tttttattct tttttttgat 3840
ttcggtttct ttgaaatttt tttgattcgg taatctccga acagaaggaa gaacgaagga 3900
aggagcacag acttagattg gtatatatac gcatatgtag tgttgaagaa acatgaaatt 3960
gcccagtatt cttaacccaa ctgcacagaa caaaaacctg caggaaacga agataaatca 4020
tgtcgaaagc tacatataag gaacgtgctg ctactcatcc tagtcctgtt gctgccaagc 4080
tatttaatat catgcacgaa aagcaaacaa acttgtgtgc ttcattggat gttcgtacca 4140
ccaaggaatt actggagtta gttgaagcat taggtcccaa aatttgttta ctaaaaacac 4200
atgtggatat cttgactgat ttttccatgg agggcacagt taagccgcta aaggcattat 4260
ccgccaagta caatttttta ctcttcgaag acagaaaatt tgctgacatt ggtaatacag 4320
tcaaattgca gtactctgcg ggtgtataca gaatagcaga atgggcagac attacgaatg 4380
cacacggtgt ggtgggccca ggtattgtta gcggtttgaa gcaggcggca gaagaagtaa 4440
caaaggaacc tagaggcctt ttgatgttag cagaattgtc atgcaagggc tccctatcta 4500
ctggagaata tactaagggt actgttgaca ttgcgaagag cgacaaagat tttgttatcg 4560
gctttattgc tcaaagagac atgggtggaa gagatgaagg ttacgattgg ttgattatga 4620
cacccggtgt gggtttagat gacaagggag acgcattggg tcaacagtat agaaccgtgg 4680
atgatgtggt ctctacagga tctgacatta ttattgttgg aagaggacta tttgcaaagg 4740
gaagggatgc taaggtagag ggtgaacgtt acagaaaagc aggctgggaa gcatatttga 4800
gaagatgcgg ccagcaaaac taaaaaactg tattataagt aaatgcatgt atactaaact 4860
cacaaattag agcttcaatt taattatatc agttattacc ctatgcggtg tgaaataccg 4920
cacagatgcg taaggagaaa ataccgcatc aggaaattgt aaacgttaat attttgttaa 4980
aattcgcgtt aaatttttgt taaatcagct cattttttaa ccaataggcc gaaatcggca 5040
aaatccctta taaatcaaaa gaatagaccg agatagggtt gagtgttgtt ccagtttgga 5100
acaagagtcc actattaaag aacgtggact ccaacgtcaa agggcgaaaa accgtctatc 5160
agggcgatgg cccactacgt gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc 5220
gtaaagcact aaatcggaac cctaaaggga gcccccgatt tagagcttga cggggaaagc 5280
cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg agcgggcgct agggcgctgg 5340
caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac 5400
agggcgcgtc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 5460
ctcttcgcta ttacgccagc tgaattggag cgacctcatg ctatacctga gaaagcaacc 5520
tgacctacag gaaagagtta ctcaagaata agaattttcg ttttaaaacc taagagtcac 5580
tttaaaattt gtatacactt atttttttta taacttattt aataataaaa atcataaatc 5640
ataagaaatt cgcttattta gaagtgtcaa caacgtatct accaacgatt tgaccctttt 5700
ccatcttttc gtaaatttct ggcaaggtag acaagccgac aaccttgatt ggagacttga 5760
ccaaacctct ggcgaagaat tgttaattaa gccagaaaaa ggaagtgttt ccctccttct 5820
tgaattgatg ttaccctcat aaagcacgtg gcctcttatc gagaaagaaa ttaccgtcgc 5880
tcgtgatttg tttgcaaaaa gaacaaaact gaaaaaaccc agacacgctc gacttcctgt 5940
cttcctattg attgcagctt ccaatttcgt cacacaacaa ggtcctagcg acggctcaca 6000
ggttttgtaa caagcaatcg aaggttctgg aatggcggga aagggtttag taccacatgc 6060
tatgatgccc actgtgatct ccagagcaaa gttcgttcga tcgtactgtt actctctctc 6120
tttcaaacag aattgtccga atcgtgtgac aacaacagcc tgttctcaca cactcttttc 6180
ttctaaccaa gggggtggtt tagtttagta gaacctcgtg aaacttacat ttacatatat 6240
ataaacttgc ataaattggt caatgcaaga aatacatatt tggtcttttc taattcgtag 6300
tttttcaagt tcttagatgc tttctttttc tcttttttac agatcatcaa ggaagtaatt 6360
atctactttt tacaag 6376
<210> 5
<211> 4632
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 5
cagagcctct tatattcact ctgttcctcc atcgcctatt gagaaacgtt ggaataaaac 60
tctaaaaata tcatctagtt ggttagtttt tattttacca gtacattgtc acttgcggag 120
ggaggatgac ataaagattg agacgcagtc atttaatgaa gtttaaacgc aggtatttga 180
taaagtaata cgatattgaa tcatgacgta taaagtgaaa tgaacaaatg attacgtaaa 240
aaatgtcgat tttctcttga gagactccca tagcctctaa gaggccttct actacgttcc 300
atatatctaa gaatggggcc atatccagtg gaatcccagc aattatttaa ggatcaccta 360
tttctcagcc gatattttag caaaatcact accaatatca gggggcaata gttgatcgcc 420
tactttaaca aaaaatgttg ctcacgtatt aacacaggca acaaaaagga tattacgcaa 480
gaacgtagta tccacatgcc atcctccttg ttgcatcttt ttttttccga aatgattccc 540
tttcctgcac aacacgagat ctttcacgca tacatcggaa ggatcacccc ccactcaagt 600
cgttgcattg ctaacatgtg gcattctgcc catttttttc acgaaaattc tctctctata 660
atgaagaccc ttgtgccctg gactctgtaa tacttgaaac tacttcctca ataatcgctt 720
ggagacctac ccccacgctt ttcaaacaag gcgctagcaa aaagcctgcc gatatctcct 780
tgccccctcc ttctgttcga gagaactacg acccgaccaa taataatgtc atacaagaac 840
cgccaagaac caactgctga accttagatc tccaatactt cagttggagt atgtgaatat 900
ataagtacct ggtcgactaa tcttcttgca tcttttcgta ttcttacatc ctatgtcgct 960
aatacagttc ccgcatagag aagaaagcaa acaaaagtag tcactcgaga tctcccgagt 1020
ttatcattat caatactgcc atttcaaaga atacgtaaat aattaatagt agtgattttc 1080
ctaactttat ttagtcaaaa aattggcctt ttaattctgc tgtaacccgt acatgcccaa 1140
aatagggggc gggttacaca gaatatataa catcataggt gtctgggtga acagtttatt 1200
cctggcatcc actaaatata atggagcccg ctttttttaa gctggcatcc agaaaaaaaa 1260
agaatcccag caccaaaata ttgttttctt caccaaccat cagttcatag gtccattctc 1320
ttagcgcaac tacacagaac aggggcacaa acaggcaaaa aacgggcaca acctcaatgg 1380
agtgatgcaa cctgcttgga gtaaatgatg acacaaggca attgacctac gcatgtatct 1440
atctcatttt cttacacctt ctattacctt ctgctctctc tgatttggaa aaagctgaaa 1500
aaaaaggttg aaaccagttc cctgaaatta ttcccctatt tgactaataa gtatataaag 1560
acggtaggta ttgattgtaa ttctgtaaat ctatttctta aacttcttaa attctacttt 1620
tatagttagt ctttttttta gtttaaaaca ccaagaactt agtttcgaat aaacacacat 1680
aaacaaacaa atctagaatg attagattaa ccgtattcct cactgcagtt tttgcagcag 1740
tcgcttcctg tgttccagtt gaattggata agagaaatac aggccatttc caagcatatt 1800
ctggttacac cgtagctaga tcaaacttta ctcaatggat tcacgagcaa ccagccgtat 1860
catggtacta tttgcttcag aatatagact atccagaagg acaattcaag tctgccaagc 1920
caggggtcgt tgtggcttcc ccttctacat ccgaacctga ttacttctac caatggacta 1980
gagatactgc tatcaccttc ttgtcactta tcgcggaagt tgaggatcat tctttttcaa 2040
atactacact agccaaggtg gttgaatact acatctctaa tacttacaca ttacaaagag 2100
tttccaaccc atctggtaac ttcgacagtc caaatcacga cggtttggga gaaccaaagt 2160
ttaatgttga tgatacagct tatactgcat cttggggtag accacaaaat gatggcccag 2220
cgttgagagc atacgcaatt tcaagatacc ttaacgcagt agcaaaacac aacaacggta 2280
agttactgct cgctggacaa aacggtattc cttactcttc agcttctgat atctactgga 2340
agattatcaa gccagatctt caacatgtgt caacccattg gtctacatct ggttttgatt 2400
tgtgggaaga gaatcaggga acacatttct ttactgcgtt ggtccagcta aaagcactta 2460
gttacggcat tcctttaagt aagacctaca acgatcctgg tttcactagt tggctagaaa 2520
agcaaaagga tgctttaaac tcttatatca acagctctgg tttcgtaaac tctggcaaaa 2580
agcatatagt ggagagccct caactatctt caagaggagg gttggatagc gccacataca 2640
ttgcagcctt aatcacacat gatattggcg acgacgacac ttacacacct ttcaacgttg 2700
acaactccta tgtcttgaac tcactgtatt accttctagt cgataacaaa aaccgttaca 2760
aaatcaatgg taactacaag gccggtgctg ctgttggtag atacccagag gatgtttaca 2820
acggtgttgg gacatcagaa ggcaatccat ggcaattagc tacagcctac gccggccaaa 2880
cattttacac actggcttac aactcattga aaaacaaaaa aaacttagtg attgaaaagt 2940
tgaactacga cctctacaat tctttcatag cagatttatc caagatcgat agttcttacg 3000
catcaaaaga ctccttgact ttgacctacg gttctgacaa ctacaaaaac gtcataaagt 3060
cactattaca gtttggagat tcattcctga aggtcttgct cgatcacatt gatgataatg 3120
gacaattaac agaagagatc aatagataca cagggttcca ggctggtgct gttagtttga 3180
catggtcctc tggttcatta ctttcagcaa accgtgcgag aaataagttg attgaactat 3240
tgtagttaat taaacaggcc ccttttcctt tgtcgatatc atgtaattag ttatgtcacg 3300
cttacattca cgccctcctc ccacatccgc tctaaccgaa aaggaaggag ttagacaacc 3360
tgaagtctag gtccctattt atttttttat agttatgtta gtattaagaa cgttatttat 3420
atttcaaatt tttctttttt ttctgtacaa acgcgtgtac gcatgtaacg ggcagacggc 3480
cggccataac ttcgtataat gtatgctata cgaagttatg gcaacggttc atcatctcat 3540
ggatctgcac atgaacaaac accagagtca aacgacgttg aaattgaggc tactgcgcca 3600
attgatgaca atacagacga tgataacaaa ccgaagttat ctgatgtaga aaaggattag 3660
agatgctaag agatagtgat gatatttcat aaataatgta attctatata tgttaattac 3720
cttttttgcg aggcatattt atggtgaagg ataagttttg accatcaaag aaggttaatg 3780
tggctgtggt ttcagggtcc ataaagcttt tcaattcatc tttttttttt ttgttctttt 3840
ttttgattcc ggtttctttg aaattttttt gattcggtaa tctccgagca gaaggaagaa 3900
cgaaggaagg agcacagact tagattggta tatatacgca tatgtggtgt tgaagaaaca 3960
tgaaattgcc cagtattctt aacccaactg cacagaacaa aaacctgcag gaaacgaaga 4020
taaatcatgt cgaaagctac atataaggaa cgtgctgcta ctcatcctag tcctgttgct 4080
gccaagctat ttaatatcat gcacgaaaag caaacaaact tgtgtgcttc attggatgtt 4140
cgtaccacca aggaattact ggagttagtt gaagcattag gtcccaaaat ttgtttacta 4200
aaaacacatg tggatatctt gactgatttt tccatggagg gcacagttaa gccgctaaag 4260
gcattatccg ccaagtacaa ttttttactc ttcgaagaca gaaaatttgc tgacattggt 4320
aatacagtca aattgcagta ctctgcgggt gtatacagaa tagcagaatg ggcagacatt 4380
acgaatgcac acggtgtggt gggcccaggt attgttagcg gtttgaagca ggcggcggaa 4440
gaagtaacaa aggaacctag aggccttttg atgttagcag aattgtcatg caagggctcc 4500
ctagctactg gagaatatac taagggtact gttgacattg cgaagagcga caaagatttt 4560
gttatcggct ttattgctca aagagacatg ggtggaagag atgaaggtta cgattggttg 4620
attatgacac gc 4632
<210> 6
<211> 4363
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 6
ggccgctcca tggagggcac agttaagccg ctaaaggcat tatccgccaa gtacaatttt 60
ttactcttcg aagacagaaa atttgctgac attggtaata cagtcaaatt gcagtactct 120
gcgggtgtat acagaatagc agaatgggca gacattacga atgcacacgg tgtggtgggc 180
ccaggtattg ttagcggttt gaagcaggcg gcggaagaag taacaaagga acctagaggc 240
cttttgatgt tagcagaatt gtcatgcaag ggctccctag ctactggaga atatactaag 300
ggtactgttg acattgcgaa gagcgacaaa gattttgtta tcggctttat tgctcaaaga 360
gacatgggtg gaagagatga aggttacgat tggttgatta tgacacccgg tgtgggttta 420
gatgacaagg gagacgcatt gggtcaacag tatagaaccg tggatgatgt ggtctctaca 480
ggatctgaca ttattattgt tggaagagga ctatttgcaa agggaaggga tgctaaggta 540
gagggtgaac gttacagaaa agcaggctgg gaagcatatt tgagaagatg cggccagcaa 600
aactaaaaaa ctgtattata agtaaatgca tgtatactaa actcacaaat tagagcttca 660
atttaattat atcagttatt acccgggaat ctcggtcgta atgattttta taatgacgaa 720
aaaaaaaaaa ttggaaagaa aaagcttcat ggcctttata aaaaggaacc atccaatacc 780
tcgccagaac caagtaacag tattttacgg ggcacaaatc aagaacaata agacaggact 840
gtaaagatgg acgcattgaa ctccaaagaa caacaagagt tccaaaaagt agtggaacaa 900
aagcaaatga aggatttcat gcgtttgata acttcgtata atgtatgcta tacgaagtta 960
tctcgagggc cagaaaaagg aagtgtttcc ctccttcttg aattgatgtt accctcataa 1020
agcacgtggc ctcttatcga gaaagaaatt accgtcgctc gtgatttgtt tgcaaaaaga 1080
acaaaactga aaaaacccag acacgctcga cttcctgtct tcctgttgat tgcagcttcc 1140
aatttcgtca cacaacaagg tcctagcgac ggctcacagg ttttgtaaca agcaatcgaa 1200
ggttctggaa tggcgggaaa gggtttagta ccacatgcta tgatgcccac tgtgatctcc 1260
agagcaaagt tcgttcgatc gtactgttac tctctctctt tcaaacagaa ttgtccgaat 1320
cgtgtgacaa caacagcctg ttctcacaca ctcttttctt ctaaccaagg gggtggttta 1380
gtttagtaga acctcgtgaa acttacattt acatatatat aaacttgcat aaattggtca 1440
atgcaagaaa tacatatttg gtcttttcta attcgtagtt tttcaagttc ttagatgctt 1500
tctttttctc ttttttacag atcatcaagg aagtaattat ctacttttta caagtctaga 1560
atgatcagac ttacagtttt cctaacagcc gttttcgccg ccgttgcatc atgtgtccca 1620
gtagaattgg ataagagaaa caccggccat ttccaagcat attcaggata caccgttgca 1680
cgttctaatt tcacacaatg gattcatgag cagcctgctg tgtcctggta ctacttatta 1740
caaaacattg attatcctga gggacaattc aagtcagcga aaccaggcgt tgtggttgct 1800
tctccatcca cttcagaacc agactacttc taccagtgga cccgtgacac agcaataact 1860
ttcttatctt tgatagcaga agtagaagat cactcatttt caaatacaac tctagctaag 1920
gttgtcgaat actacatctc taacacatac accctacaaa gagtttctaa cccatctggt 1980
aatttcgata gcccaaatca cgatggtctg ggtgaaccaa agttcaacgt tgacgacact 2040
gcttacactg catcatgggg cagacctcaa aacgacggtc cagccttaag agcttacgcg 2100
atctcaagat atttgaacgc agttgccaag cataacaacg gtaagctatt gctcgcgggt 2160
caaaatggta ttccttactc atctgcatca gatatctact ggaagattat caagccagat 2220
ttacaacatg taagtactca ctggagtaca tctggttttg acttatggga agagaatcaa 2280
ggtacacatt tctttactgc acttgtccag ttaaaagctc tttcatacgg tatacctttg 2340
tctaagacat ataacgatcc aggatttact tcttggttgg aaaagcagaa ggatgccttg 2400
aactcttaca tcaattccag cggcttcgtc aactccggga aaaagcacat tgtcgaatct 2460
cctcaattat ctagtagagg gggtcttgat agcgctactt acatcgctgc tctaattaca 2520
catgatattg gtgatgatga tacatacact ccttttaacg tagataattc ttatgtgctg 2580
aactctttat actatctgct tgtagacaac aaaaacagat acaagatcaa cgggaactac 2640
aaagcaggag ctgcagttgg tagataccca gaagatgtgt acaatggagt gggaacctca 2700
gagggaaacc catggcaatt ggcgacagca tacgccggcc aaacctttta cacactggct 2760
tacaattctc tcaaaaacaa aaaaaatttg gttattgaga agttgaatta cgatctatac 2820
aactccttta tagctgactt aagtaagatt gactcctctt acgcttctaa ggattcattg 2880
acattgacct acggctcaga taactacaaa aatgtcatta agtcactttt acaattcggg 2940
gattctttct tgaaagtctt gttggaccat attgatgata atggtcagct aacagaggaa 3000
atcaacagat atacaggttt tcaagctggc gcagtttccc tcacttggag tagtggttca 3060
ctcttatctg caaacagagc cagaaacaag ttgatcgaat tgctttagtt aattaagaag 3120
ttttgttaga aaataaatca ttttttaatt gagcattctt attcctattt tatttaaata 3180
gttttatgta ttgttagcta catacaacag tttaaatcaa attttctttt tcccaagtcc 3240
aaaatggagg tttattttga tgacccgcat gcgattatgt tttgaaagta taagactaca 3300
tacatgtaca tatatttaaa catgtaaacc cgtccattat attgccgggc agacggccgg 3360
ccttatagcc tagctttaag gctactttaa aaacttttta tttattcata cacatatatt 3420
atcgaacatt cgtataactt aatatcattc aaaaaaaaaa aaaaaaaaaa aagaaaacat 3480
atacacatat atatttatgt ttatagagag agagagagaa aatttgaatt tttgaatcat 3540
ttgcaaagtt atatgtttta tacattattt attcattttt tttggtgtcg aggacattgt 3600
gctgttcaga gaaccactta aaatacgcat cgttctgtaa atatccactt tcattaaaaa 3660
ccttattcac ttctaacttt gccttcaact ccttcttgga gttttctccc ttttttttct 3720
gaacaagctc aaccagatat aatggttcgt tcttttcgaa ctttgtcttt acatatattt 3780
cctcctttgt acctcttctc tttcccacat aaacagtccc cttttcaata aaacgagaga 3840
aataccagaa aagtagcgag agaacaaaat atgcgcctac caaaagcttt tgatacgtaa 3900
caatctgatc tctctcaaat tttttatcca agaagaaact caaaccagct acaacagcta 3960
tggaataacc tatgtacaat ttagcatcga gtaaagcgta tgatctctcg taatttaatc 4020
tcgcgaaaac agaaggtagg gcttcatcta aagcttggtt caactccggg attgaatata 4080
cattaatagg tttagcagaa ctcatcttga acaggcgtct cttttcctta caataacttg 4140
tgcttttcct tctataattc cgtttcaacg tgtacaattg tcattttttg tctggtatga 4200
ttttgcagaa ctgaaaaaat ctcttaaatg ttccgcctca tcaagaaggc atattccttt 4260
acaaaagtac attgatctta caagaagcta gctaatggta ctatttaaaa aacaactaca 4320
ctccatcaat acataaaatt gttatgatag acttgaggga cgg 4363
<210> 7
<211> 5015
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 7
cagagcctct tatattcact ctgttcctcc atcgcctatt gagaaacgtt ggaataaaac 60
tctaaaaata tcatctagtt ggttagtttt tattttacca gtacattgtc acttgcggag 120
ggaggatgac ataaagattg agacgcagtc atttaatgaa gtttaaacgc aggtatttga 180
taaagtaata cgatattgaa tcatgacgta taaagtgaaa tgaacaaatg attacgtaaa 240
aaatgtcgat tttctcttga gagactccca tagcctctaa gaggccttct actacgttcc 300
atatatctaa gaatggggcc atatccagtg gaatcccagc aattatttaa ggatcaccta 360
tttctcagcc gatattttag caaaatcact accaatatca gggggcaata gttgatcgcc 420
tactttaaca aaaaatgttg ctcacgtatt aacacaggca acaaaaagga tattacgcaa 480
gaacgtagta tccacatgcc atcctccttg ttgcatcttt ttttttccga aatgattccc 540
tttcctgcac aacacgagat ctttcacgca tacatcggaa ggatcacccc ccactcaagt 600
cgttgcattg ctaacatgtg gcattctgcc catttttttc acgaaaattc tctctctata 660
atgaagaccc ttgtgccctg gactctgtaa tacttgaaac tacttcctca ataatcgctt 720
ggagacctac ccccacgctt ttcaaacaag gcgctagcaa aaagcctgcc gatatctcct 780
tgccccctcc ttctgttcga gagaactacg acccgaccaa taataatgtc atacaagaac 840
cgccaagaac caactgctga accttagatc tccaatactt cagttggagt atgtgaatat 900
ataagtacct ggtcgactaa tcttcttgca tcttttcgta ttcttacatc ctatgtcgct 960
aatacagttc ccgcatagag aagaaagcaa acaaaagtag tcactcgaga tctcccgagt 1020
ttatcattat caatactgcc atttcaaaga atacgtaaat aattaatagt agtgattttc 1080
ctaactttat ttagtcaaaa aattggcctt ttaattctgc tgtaacccgt acatgcccaa 1140
aatagggggc gggttacaca gaatatataa catcataggt gtctgggtga acagtttatt 1200
cctggcatcc actaaatata atggagcccg ctttttttaa gctggcatcc agaaaaaaaa 1260
agaatcccag caccaaaata ttgttttctt caccaaccat cagttcatag gtccattctc 1320
ttagcgcaac tacacagaac aggggcacaa acaggcaaaa aacgggcaca acctcaatgg 1380
agtgatgcaa cctgcttgga gtaaatgatg acacaaggca attgacctac gcatgtatct 1440
atctcatttt cttacacctt ctattacctt ctgctctctc tgatttggaa aaagctgaaa 1500
aaaaaggttg aaaccagttc cctgaaatta ttcccctatt tgactaataa gtatataaag 1560
acggtaggta ttgattgtaa ttctgtaaat ctatttctta aacttcttaa attctacttt 1620
tatagttagt ctttttttta gtttaaaaca ccaagaactt agtttcgaat aaacacacat 1680
aaacaaacaa atctagaatg atcagactta ctgttttcct cacagccgtt tttgcagcag 1740
tagcttcttg tgttccagtt gaattggata agagaaatac aggtcatttc caagcttact 1800
ctggttacac tgtggctaga tctaacttca cacaatggat tcatgaacag cctgccgtga 1860
gttggtacta tttgctacaa aacattgatt accctgaggg tcaattcaaa tcagctaagc 1920
caggtgttgt tgtcgcgagc ccatcaactt ctgaaccaga ttacttctac caatggacta 1980
gagataccgc aataaccttc ttatctctaa tcgcagaggt agaagatcac tctttttcaa 2040
atactaccct ggcaaaagtg gtcgagtact acatctcaaa cacatacacc ttgcagagag 2100
tctcaaaccc atcaggaaac ttcgattctc ctaatcatga cggcttagga gaaccaaagt 2160
ttaatgttga cgataccgct tatactgcat cttggggtag accacagaat gatggccctg 2220
ccttacgtgc atacgccatt tccagatatc tcaacgctgt agcgaagcac aacaacggta 2280
agctgctttt agctggtcaa aatgggatac catactcttc cgcttcagac atttactgga 2340
agattatcaa accagacttg cagcatgtca gtacacattg gtcaacttct ggttttgatt 2400
tgtgggaaga gaaccaaggc actcacttct ttacagcctt ggttcaacta aaggcattgt 2460
cttacggaat ccctttgtcc aagacataca atgatcctgg attcactagt tggctagaaa 2520
agcaaaagga tgcactgaac tcatacatta acagttcagg ctttgtgaac tccggtaaaa 2580
agcatattgt tgaaagccca caactatcta gcagaggtgg tttagattct gcaacctaca 2640
tagcagcctt gatcacacac gacattgggg atgacgatac atacacacca ttcaacgtcg 2700
acaattcata cgttttgaat agcttatact acctactggt agataacaaa aacagatata 2760
agatcaatgg caactacaag gccggtgctg ccgtaggaag ataccctgaa gatgtctaca 2820
acggagttgg tacatcagaa ggtaacccat ggcaattagc aacagcatat gcgggccaga 2880
cattttacac tttggcttac aattcattga aaaacaaaaa aaatttagtg atagaaaagc 2940
ttaactatga cctttacaac tctttcattg ccgatttatc caagattgat tcctcctacg 3000
catcaaagga ctccttgaca cttacatacg gttctgacaa ctacaaaaat gttatcaagt 3060
ctctcttgca atttggtgat tctttcttga aggttttact cgatcatatc gatgataatg 3120
gtcaactaac tgaggaaatc aacagataca ctgggttcca agctggagct gtctctttaa 3180
catggagttc agggagtttg ttatctgcta acagagcgcg taacaaactt attgagcttc 3240
tgtagttaat taaacaggcc ccttttcctt tgtcgatatc atgtaattag ttatgtcacg 3300
cttacattca cgccctcctc ccacatccgc tctaaccgaa aaggaaggag ttagacaacc 3360
tgaagtctag gtccctattt atttttttat agttatgtta gtattaagaa cgttatttat 3420
atttcaaatt tttctttttt ttctgtacaa acgcgtgtac gcatgtaacg ggcagacggc 3480
cggccataac ttcgtataat gtatgctata cgaagttatc cttacatcac acccaatccc 3540
ccacaagtga tcccccacac accatagctt caaaatgttt ctactccttt tttactcttc 3600
cagattttct cggactccgc gcatcgccgt accacttcaa aacacccaag cacagcatac 3660
taaatttccc ctctttcttc ctctagggtg gcgttaatta cccgtactaa aggtttggaa 3720
aagaaaaaag agaccgcctc gtttcttttt cttcgtcgaa aaaggcaata aaaattttta 3780
tcacgtttct ttttcttgaa aaattttttt tttgattttt ttctctttcg atgacctccc 3840
attgatattt aagttaataa atggtcttca atttctcaag tttcagtttc gtttttcttg 3900
ttctattaca acttttttta cttcttgctc attagaaaga aagcatagca atctaatcta 3960
agttttaatt acaaaatgcc acaatcctgg gaagaattgg ccgccgacaa acgtgcccgt 4020
ttggctaaaa ccattcctga cgaatggaag gttcaaactt tgcctgccga agattccgtt 4080
attgatttcc caaagaagtc cggtattttg tctgaggctg aattgaagat taccgaagcc 4140
tctgctgctg atttggtctc caagttggcc gctggtgagt tgacttctgt tgaagtcact 4200
ttggcttttt gtaagagagc tgctattgct caacaattaa ccaactgtgc tcacgaattc 4260
ttcccagatg ctgctttagc tcaagctaga gaattagatg aatactacgc taagcataag 4320
agaccagttg gtccattaca cggtttacca atctctttaa aggaccaatt gcgtgttaag 4380
ggttacgaaa cctccatggg ttacatttcc tggttaaaca aatacgatga aggtgattcc 4440
gtcttaacca ccatgttgag aaaagctggt gctgttttct acgttaagac ctctgtccca 4500
caaaccttga tggtctgtga aaccgtcaac aacatcattg gtagaactgt caatccaaga 4560
aacaaaaatt ggtcctgtgg tggttcttct ggtggtgaag gtgctattgt tggtattaga 4620
ggtggtgtta ttggtgtcgg tactgacatt ggtggttcca ttagagtccc agctgctttc 4680
aactttttat acggtttgag accatctcac ggtagattgc catatgctaa aatggctaac 4740
tctatggaag gtcaagaaac cgttcactcc gtcgttggtc ctatcactca ctccgtcgaa 4800
gacttgagat tgttcaccaa atctgtcttg ggtcaagaac cttggaagta cgactctaag 4860
gtcatcccca tgccatggag acaatctgaa tctgacatca ttgcctctaa gattaagaat 4920
ggtggtttga acattggtta ttacaatttc gacggtaacg tcttgccaca cccaccaatt 4980
ttacgtggtg tcgaaactac cgttgccgct ttggc 5015
<210> 8
<211> 4771
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 8
ggccgcgaag gtgctattgt tggtattaga ggtggtgtta ttggtgtcgg tactgacatt 60
ggtggttcca ttagagtccc agctgctttc aactttttat acggtttgag accatctcac 120
ggtagattgc catatgctaa aatggctaac tctatggaag gtcaagaaac cgttcactcc 180
gtcgttggtc ctatcactca ctccgtcgaa gacttgagat tgttcaccaa atctgtcttg 240
ggtcaagaac cttggaagta cgactctaag gtcatcccaa tgccatggag acaatctgaa 300
tctgacatca ttgcctctaa gattaagaat ggtggtttga acattggtta ttacaatttc 360
gacggtaacg tcttgccaca cccaccaatt ttacgtggtg tcgaaactac cgttgccgct 420
ttggccaagg ctggtcacac cgttactcca tggactccat acaagcatga tttcggtcat 480
gacttgattt cccacatcta tgctgctgat ggttctgccg acgtcatgag agacatttct 540
gcctctggtg agccagccat ccctaacatt aaggacttgt tgaacccaaa tattaaggct 600
gttaacatga acgaattgtg ggacactcat ttacaaaagt ggaactatca aatggaatac 660
ttggaaaagt ggcgtgaagc tgaagaaaaa gctggtaagg aattggacgc tattatcgct 720
ccaattactc ctaccgccgc tgtcagacac gatcaattca gatactacgg ttacgcctcc 780
gttattaact tattggattt cacctctgtt gtcgtcccag tcactttcgc tgataagaat 840
attgataaga agaacgaatc ttttaaagct gtttccgaat tggatgcttt ggttcaagaa 900
gaatacgacc cagaggctta tcacggtgct cctgttgctg ttcaagttat tggtagaaga 960
ttgtccgaag agagaacttt ggctatcgcc gaagaagtcg gtaaattgtt gggtaacgtc 1020
gtcactccat aagcgaattt cttatgattt atgattttta ttattaaata agttataaaa 1080
aaaataagtg tatacaaatt ttaaagtgac tcttaggttt taaaacgaaa attcttattc 1140
ttgagtaact ctttcctgta ggtcaggttg ctttctcagg tatagcatga ggtcgctctt 1200
attgaccaca cctctaccgg catgccgagc aaatgcctgc aaatcgctcc ccatttcacc 1260
caattgtaga tatgctaact ccagcaatga gttgatgaat ctcggtgtgt attttatgtc 1320
ctcagaggac aacacataac ttcgtataat gtatgctata cgaagttatc tcgagggcca 1380
gaaaaaggaa gtgtttccct ccttcttgaa ttgatgttac cctcataaag cacgtggcct 1440
cttatcgaga aagaaattac cgtcgctcgt gatttgtttg caaaaagaac aaaactgaaa 1500
aaacccagac acgctcgact tcctgtcttc ctgttgattg cagcttccaa tttcgtcaca 1560
caacaaggtc ctagcgacgg ctcacaggtt ttgtaacaag caatcgaagg ttctggaatg 1620
gcgggaaagg gtttagtacc acatgctatg atgcccactg tgatctccag agcaaagttc 1680
gttcgatcgt actgttactc tctctctttc aaacagaatt gtccgaatcg tgtgacaaca 1740
acagcctgtt ctcacacact cttttcttct aaccaagggg gtggtttagt ttagtagaac 1800
ctcgtgaaac ttacatttac atatatataa acttgcataa attggtcaat gcaagaaata 1860
catatttggt cttttctaat tcgtagtttt tcaagttctt agatgctttc tttttctctt 1920
ttttacagat catcaaggaa gtaattatct actttttaca agtctagaat gattagatta 1980
acagtatttc ttacagccgt tttcgcagcc gtcgcatcct gtgttccagt agaattagat 2040
aagcgtaata caggacattt tcaagcttac tctggctata cagttgcgag atctaacttt 2100
acacaatgga ttcacgaaca gccagcagtt tcttggtact atttgctcca aaacatcgac 2160
taccctgaag gccaattcaa gtctgcaaag ccaggagtgg tcgtcgcttc tcctagtact 2220
tcagaaccag attacttcta ccagtggaca agagacactg ctattacctt cctgagctta 2280
atcgctgaag ttgaagatca ctctttttct aatacaacac tggccaaagt agttgagtac 2340
tacatctcta acacttacac tctacaaaga gtgtcaaacc cttctgggaa cttcgacagc 2400
ccaaaccatg atggtttggg ggagccaaaa ttcaacgttg atgatacagc ctacaccgca 2460
tcttggggta gaccacaaaa cgacggacca gctttaagag catacgcaat atctcgttac 2520
cttaatgctg ttgcaaagca caataatgga aagttgttgt tggctggtca aaacggtatt 2580
ccttactctt cagcatctga tatctactgg aagattatca agccagatct tcaacacgta 2640
tccacacatt ggtcaacctc cggcttcgat ttatgggagg aaaatcaggg tacacatttc 2700
ttcaccgctc tagtgcaatt gaaggctttg agttacggca ttccattgtc taagacttac 2760
aacgatcctg gtttcacctc atggcttgaa aagcagaagg atgccctgaa tagctacatc 2820
aactcatctg gttttgttaa ctcagggaaa aagcatatag ttgaatcccc acaactatca 2880
tcaagaggag gtttagactc cgccacatac attgctgcct tgattacaca tgatattggg 2940
gatgatgaca catatactcc atttaacgtc gataacagtt atgtccttaa ttccttatac 3000
tatttgttgg tcgataacaa aaatagatac aaaatcaacg gcaactacaa ggctggcgca 3060
gcggtgggta gataccctga ggatgtttac aatggtgtag gtacatctga aggcaatcca 3120
tggcaattag cgactgctta cgctggacaa actttctaca cacttgcgta caactcattg 3180
aaaaacaaaa aaaacctagt cattgaaaag ttgaattacg atctgtacaa ctctttcatc 3240
gcagacctat caaagattga ctcatcttat gcaagtaaag attcactaac tttaacctac 3300
ggtagtgata actacaaaaa cgttatcaag tctttactcc agtttggtga ttcattcttg 3360
aaggtgttgt tagatcatat agacgacaat ggtcaactca cagaggagat aaacagatac 3420
actggttttc aagcaggagc tgtttcactt acttggtcaa gtggttcttt gctttccgcc 3480
aacagagcca gaaacaagct catcgaatta ctatagttaa ttaagaagtt ttgttagaaa 3540
ataaatcatt ttttaattga gcattcttat tcctatttta tttaaatagt tttatgtatt 3600
gttagctaca tacaacagtt taaatcaaat tttctttttc ccaagtccaa aatggaggtt 3660
tattttgatg acccgcatgc gattatgttt tgaaagtata agactacata catgtacata 3720
tatttaaaca tgtaaacccg tccattatat tgccgggcag acggccggcc ttatagccta 3780
gctttaaggc tactttaaaa actttttatt tattcataca catatattat cgaacattcg 3840
tataacttaa tatcattcaa aaaaaaaaaa aaaaaaaaaa gaaaacatat acacatatat 3900
atttatgttt atagagagag agagagaaaa tttgaatttt tgaatcattt gcaaagttat 3960
atgttttata cattatttat tcattttttt tggtgtcgag gacattgtgc tgttcagaga 4020
accacttaaa atacgcatcg ttctgtaaat atccactttc attaaaaacc ttattcactt 4080
ctaactttgc cttcaactcc ttcttggagt tttctccctt ttttttctga acaagctcaa 4140
ccagatataa tggttcgttc ttttcgaact ttgtctttac atatatttcc tcctttgtac 4200
ctcttctctt tcccacataa acagtcccct tttcaataaa acgagagaaa taccagaaaa 4260
gtagcgagag aacaaaatat gcgcctacca aaagcttttg atacgtaaca atctgatctc 4320
tctcaaattt tttatccaag aagaaactca aaccagctac aacagctatg gaataaccta 4380
tgtacaattt agcatcgagt aaagcgtatg atctctcgta atttaatctc gcgaaaacag 4440
aaggtagggc ttcatctaaa gcttggttca actccgggat tgaatataca ttaataggtt 4500
tagcagaact catcttgaac aggcgtctct tttccttaca ataacttgtg cttttccttc 4560
tataattccg tttcaacgtg tacaattgtc attttttgtc tggtatgatt ttgcagaact 4620
gaaaaaatct cttaaatgtt ccgcctcatc aagaaggcat attcctttac aaaagtacat 4680
tgatcttaca agaagctagc taatggtact atttaaaaaa caactacact ccatcaatac 4740
ataaaattgt tatgatagac ttgagggacg g 4771
<210> 9
<211> 8719
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 9
atcacatagg aagcaacagg cgcgttggac ttttaatttt cgaggaccgc gaatccttac 60
atcacaccca atcccccaca agtgatcccc cacacaccat agcttcaaaa tgtttctact 120
ccttttttac tcttccagat tttctcggac tccgcgcatc gccgtaccac ttcaaaacac 180
ccaagcacag catactaaat ttcccctctt tcttcctcta gggtgtcgtt aattacccgt 240
actaaaggtt tggaaaagaa aaaagagacc gcctcgtttc tttttcttcg tcgaaaaagg 300
caataaaaat ttttatcacg tttctttttc ttgaaaattt ttttttttga tttttttctc 360
tttcgatgac ctcccattga tatttaagtt aataaacggt cttcaatttc tcaagtttca 420
gtttcatttt tcttgttcta ttacaacttt ttttacttct tgctcattag aaagaaagca 480
tagcaatcta atctaagttt taattacaaa tctagaatga gtgaatctcc aatgttcgct 540
gccaacggca tgccaaaggt aaatcaaggt gctgaagaag atgtcagaat tttaggttac 600
gacccattag cttctccagc tctccttcaa gtgcaaatcc cagccacacc aacttctttg 660
gaaactgcca agagaggtag aagagaagct atagatatta ttaccggtaa agacgacaga 720
gttcttgtca ttgtcggtcc ttgttccatc catgatcttg aagccgctca agaatacgct 780
ttgagattaa agaaattgtc agatgaatta aaaggtgatt tatccatcat tatgagagca 840
tacttggaga agccaagaac aaccgtcggc tggaaaggtc taattaatga ccctgatgtt 900
aacaacactt tcaacatcaa caagggtttg caatccgcta gacaattgtt tgtcaacttg 960
acaaatatcg gtttgccaat tggttctgaa atgcttgata ccatttctcc taaatacttg 1020
gctgatttgg tctccttcgg tgccattggt gccagaacca ccgaatctca actgcacaga 1080
gaattggcct ccggtttgtc tttcccagtt ggtttcaaga acggtaccga tggtacctta 1140
aatgttgctg tggatgcttg tcaagccgct gctcattctc accatttcat gggtgttact 1200
aagcatggtg ttgctgctat caccactact aagggtaacg aacactgctt cgttattcta 1260
agaggtggta aaaagggtac caactacgac gctaagtccg ttgcagaagc taaggctcaa 1320
ttgcctgccg gttccaacgg tctaatgatt gactactctc acggtaactc caataaggat 1380
ttcagaaacc aaccaaaggt caatgacgtt gtttgtgagc aaatcgctaa cggtgaaaac 1440
gccattaccg gtgtcatgat tgaatcaaac atcaacgaag gtaaccaagg catcccagcc 1500
gaaggtaaag ccggcttgaa atatggtgtt tccatcactg atgcttgtat aggttgggaa 1560
actactgaag acgtcttgag gaaattggct gctgctgtca gacaaagaag agaagttaac 1620
aagaaataga tgttttttta atgatatatg taacgtacat tctttcctct accactgcca 1680
attcggtatt atttaattgt gtttagcgct atttactaat taactagaaa ctcaattttt 1740
aaaggcaaag ctcgctgacc tttcactgat ttcgtggatg ttatactatc agttactctt 1800
ctgcaaaaaa aaattgagtc atatcgtagc tttgggatta tttttctctc tctccacggc 1860
taattaggtg atcatgaaaa aatgaaaaat tcatgagaaa agagtcagac atcgaaacat 1920
acataagttg atattccttt gatatcgacg actactcaat caggttttaa aagaaaagag 1980
gcagctattg aagtagcagt atccagttta ggttttttaa ttatttacaa gtaaagaaaa 2040
agagaatgcc ggtcgttcac ggcggccgcg ccagaaaaag gaagtgtttc cctccttctt 2100
gaattgatgt taccctcata aagcacgtgg cctcttatcg agaaagaaat taccgtcgct 2160
cgtgatttgt ttgcaaaaag aacaaaactg aaaaaaccca gacacgctcg acttcctgtc 2220
ttcctattga ttgcagcttc caatttcgtc acacaacaag gtcctagcga cggctcacag 2280
gttttgtaac aagcaatcga aggttctgga atggcgggaa agggtttagt accacatgct 2340
atgatgccca ctgtgatctc cagagcaaag ttcgttcgat cgtactgtta ctctctctct 2400
ttcaaacaga attgtccgaa tcgtgtgaca acaacagcct gttctcacac actcttttct 2460
tctaaccaag ggggtggttt agtttagtag aacctcgtga aacttacatt tacatatata 2520
taaacttgca taaattggtc aatgcaagaa atacatattt ggtcttttct aattcgtagt 2580
ttttcaagtt cttagatgct ttctttttct cttttttaca gatcatcaac tcttttttac 2640
agatcatcaa ggaagtaatt atctactttt tacaagaatt catgtctaat ttacttactg 2700
ttcaccaaaa cttgcctgca ttaccagttg acgcaacctc cgatgaagtc agaaagaacc 2760
ttatggatat gtttagagat agacaagctt tctccgaaca tacttggaaa atgttattat 2820
ccgtttgtag atcctgggcc gcttggtgta aacttaacaa tagaaaatgg tttcctgctg 2880
aaccagaaga cgtcagagat tacttacttt acttacaagc tagaggtttg gctgttaaaa 2940
ctatccaaca acacttaggt caattgaata tgttacacag aagatccggt ttaccaagac 3000
catccgattc caacgcagtt tcccttgtta tgagaagaat tagaaaagaa aatgttgacg 3060
ctggtgaaag agctaaacaa gcattagcat ttgaaagaac cgatttcgat caagttagat 3120
ccttaatgga aaattccgat agatgtcaag atattagaaa cttagctttc ttaggtattg 3180
cttacaacac attattaaga atcgctgaaa ttgctagaat tagagttaaa gatatttcaa 3240
gaaccgatgg cggtagaatg ttaatccaca ttggcagaac aaaaacctta gtctccacag 3300
caggcgtcga aaaagcatta tcattaggtg ttactaaatt agttgaacgt tggatttccg 3360
tttccggtgt tgcagatgac ccaaacaact acttattctg tcgtgttaga aaaaatggtg 3420
ttgccgctcc ttccgctacc tcacaattat ccacaagagc attagaaggc atttttgaag 3480
ctacccacag acttatttat ggtgcaaaag acgattccgg tcaaagatat ttagcttggt 3540
ctggtcattc cgctagagtt ggtgccgcaa gagacatggc aagagctggt gtttctattc 3600
ctgaaattat gcaagccggt ggttggacta atgttaacat tgttatgaac tatatcagaa 3660
acttagattc cgaaacaggt gctatggtta gattacttga agacggtgat taagctagct 3720
aagatccgct ctaaccgaaa aggaaggagt tagacaacct gaagtctagg tccctattta 3780
tttttttata gttatgttag tattaagaac gttatttata tttcaaattt ttcttttttt 3840
tctgtacaga cgcgtgtacg catgtaacat tatactgaaa accttgcttg agaaggtttt 3900
gggacgctcg aaggagctcc aattcgccct atagtgagtc gtattacaat tcactggccg 3960
tcgttttaca acgtcgtgac tgggaaaacc ctggcgttac ccaacttaat cgccttgcag 4020
cacatccccc cttcgccagc tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc 4080
aacagttgcg cagcctgaat ggcgaatggc gcgacgcgcc ctgtagcggc gcattaagcg 4140
cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc ctagcgcccg 4200
ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc cgtcaagctc 4260
taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc gaccccaaaa 4320
aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg gtttttcgcc 4380
ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact ggaacaacac 4440
tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt tcggcctatt 4500
ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa atattaacgt 4560
ttacaatttc ctgatgcggt attttctcct tacgcatctg tgcggtattt cacaccgcag 4620
ggtaataact gatataatta aattgaagct ctaatttgtg agtttagtat acatgcattt 4680
acttataata cagtttttta gttttgctgg ccgcatcttc tcaaatatgc ttcccagcct 4740
gcttttctgt aacgttcacc ctctacctta gcatcccttc cctttgcaaa tagtcctctt 4800
ccaacaataa taatgtcaga tcctgtagag accacatcat ccacggttct atactgttga 4860
cccaatgcgt ctcccttgtc atctaaaccc acaccgggtg tcataatcaa ccaatcgtaa 4920
ccttcatctc ttccacccat gtctctttga gcaataaagc cgataacaaa atctttgtcg 4980
ctcttcgcaa tgtcaacagt acccttagta tattctccag tagataggga gcccttgcat 5040
gacaattctg ctaacatcaa aaggcctcta ggttcctttg ttacttcttc tgccgcctgc 5100
ttcaaaccgc taacaatacc tgggcccacc acaccgtgtg cattcgtaat gtctgcccat 5160
tctgctattc tgtatacacc cgcagagtac tgcaatttga ctgtattacc aatgtcagca 5220
aattttctgt cttcgaagag taaaaaattg tacttggcgg ataatgcctt tagcggctta 5280
actgtgccct ccatggaaaa atcagtcaag atatccacat gtgtttttag taaacaaatt 5340
ttgggaccta atgcttcaac taactccagt aattccttgg tggtacgaac atccaatgaa 5400
gcacacaagt ttgtttgctt ttcgtgcatg atattaaata gcttggcagc aacaggacta 5460
ggatgagtag cagcacgttc cttatatgta gctttcgaca tgatttatct tcgtttcctg 5520
caggtttttg ttctgtgcag ttgggttaag aatactgggc aatttcatgt ttcttcaaca 5580
ctacatatgc gtatatatac caatctaagt ctgtgctcct tccttcgttc ttccttctgt 5640
tcggagatta ccgaatcaaa aaaatttcaa agaaaccgaa atcaaaaaaa agaataaaaa 5700
aaaaatgatg aattgaattg aaaagcgtgg tgcactctca gtacaatctg ctctgatgcc 5760
gcatagttaa gccagccccg acacccgcca acacccgctg acgcgccctg acgggcttgt 5820
ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag 5880
aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat acgcctattt 5940
ttataggtta atgtcatgat aataatggtt tcttaggacg gatcgcttgc ctgtaactta 6000
cacgcgcctc gtatctttta atgatggaat aatttgggaa tttactctgt gtttatttat 6060
ttttatgttt tgtatttgga ttttagaaag taaataaaga aggtagaaga gttacggaat 6120
gaagaaaaaa aaataaacaa aggtttaaaa aatttcaaca aaaagcgtac tttacatata 6180
tatttattag acaagaaaag cagattaaat agatatacat tcgattaacg ataagtaaaa 6240
tgtaaaatca caggattttc gtgtgtggtc ttctacacag acaagatgaa acaattcggc 6300
attaatacct gagagcagga agagcaagat aaaaggtagt atttgttggc gatcccccta 6360
gagtctttta catcttcgga aaacaaaaac tattttttct ttaatttctt tttttacttt 6420
ctatttttaa tttatatatt tatattaaaa aatttaaatt ataattattt ttatagcacg 6480
tgatgaaaag gacccaggtg gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt 6540
atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct gataaatgct 6600
tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg cccttattcc 6660
cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa 6720
agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc tcaacagcgg 6780
taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca cttttaaagt 6840
tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac tcggtcgccg 6900
catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa agcatcttac 6960
ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg ataacactgc 7020
ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt tttttcacaa 7080
catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg aagccatacc 7140
aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc gcaaactatt 7200
aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga tggaggcgga 7260
taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta ttgctgataa 7320
atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc cagatggtaa 7380
gccctcccgt atcgtagtta tctacacgac gggcagtcag gcaactatgg atgaacgaaa 7440
tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt cagaccaagt 7500
ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa ggatctaggt 7560
gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt cgttccactg 7620
agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt ttctgcgcgt 7680
aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt tgccggatca 7740
agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga taccaaatac 7800
tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag caccgcctac 7860
atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata agtcgtgtct 7920
taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg gctgaacggg 7980
gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga gatacctaca 8040
gcgtgagcat tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca ggtatccggt 8100
aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggga acgcctggta 8160
tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc 8220
gtcagggggg ccgagcctat ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc 8280
cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt ctgtggataa 8340
ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga ccgagcgcag 8400
cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg 8460
ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag cgggcagtga 8520
gcgcaacgca attaatgtga gttacctcac tcattaggca ccccaggctt tacactttat 8580
gcttccggct cctatgttgt gtggaattgt gagcggataa caatttcaca caggaaacag 8640
ctatgaccat gattacgcca agctcggaat taaccctcac taaagggaac aaaagctggg 8700
taccgggccc cccctcgag 8719
<210> 10
<211> 1632
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 10
ggcaacggtt catcatctca tggatctgca catgaacaaa caccagagtc aaacgacgtt 60
gaaattgagg ctactgcgcc aattgatgac aatacagacg atgataacaa accgaagtta 120
tctgatgtag aaaaggatta gagatgctaa gagatagtga tgatatttca taaataatgt 180
aattctatat atgttaatta ccttttttgc gaggcatatt tatggtgaag gataagtttt 240
gaccatcaaa gaaggttaat gtggctgtgg tttcagggtc cataaagctt ttcaattcat 300
cttttttttt tttgttcttt tttttgattc cggtttcttt gaaatttttt tgattcggta 360
atctccgagc agaaggaaga acgaaggaag gagcacagac ttagattggt atatatacgc 420
atatgtggtg ttgaagaaac atgaaattgc ccagtattct taacccaact gcacagaaca 480
aaaacctgca ggaaacgaag ataaatcatg tcgaaagcta catataagga acgtgctgct 540
actcatccta gtcctgttgc tgccaagcta tttaatatca tgcacgaaaa gcaaacaaac 600
ttgtgtgctt cattggatgt tcgtaccacc aaggaattac tggagttagt tgaagcatta 660
ggtcccaaaa tttgtttact aaaaacacat gtggatatct tgactgattt ttccatggag 720
ggcacagtta agccgctaaa ggcattatcc gccaagtaca attttttact cttcgaagac 780
agaaaatttg ctgacattgg taatacagtc aaattgcagt actctgcggg tgtatacaga 840
atagcagaat gggcagacat tacgaatgca cacggtgtgg tgggcccagg tattgttagc 900
ggtttgaagc aggcggcgga agaagtaaca aaggaaccta gaggcctttt gatgttagca 960
gaattgtcat gcaagggctc cctagctact ggagaatata ctaagggtac tgttgacatt 1020
gcgaagagcg acaaagattt tgttatcggc tttattgctc aaagagacat gggtggaaga 1080
gatgaaggtt acgattggtt gattatgaca cccggtgtgg gtttagatga caagggagac 1140
gcattgggtc aacagtatag aaccgtggat gatgtggtct ctacaggatc tgacattatt 1200
attgttggaa gaggactatt tgcaaaggga agggatgcta aggtagaggg tgaacgttac 1260
agaaaagcag gctgggaagc atatttgaga agatgcggcc agcaaaacta aaaaactgta 1320
ttataagtaa atgcatgtat actaaactca caaattagag cttcaattta attatatcag 1380
ttattacccg ggaatctcgg tcgtaatgat ttttataatg acgaaaaaaa aaaaattgga 1440
aagaaaaagc ttcatggcct ttataaaaag gaaccatcca atacctcgcc agaaccaagt 1500
aacagtattt tacggggcac aaatcaagaa caataagaca ggactgtaaa gatggacgca 1560
ttgaactcca aagaacaaca agagttccaa aaagtagtgg aacaaaagca aatgaaggat 1620
ttcatgcgtt tg 1632
<210> 11
<211> 4863
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 11
ctaaattcgg ccttgctcag agactcctgg attttggcta acaacgcagt cccttcgatg 60
catatagcta ggccacaaat tatgccaata acggtccatg ggttgatgtt ttcttgaatt 120
ctttcgtttt tcatgctatt tgcgtcttcc caagtcccag cgttccagta ttcatactgc 180
gcgttagagt ggtagccata agagccggca tattggtaat tttcagtatt aacgttagaa 240
cgtggtgaat acgatgtggt ccagccttgc ctcgttgtgt catatacgat ctttttcttt 300
gggtcacaaa gaatatcata tgcttgagag atgactttaa atctatgtag tttttcgctt 360
gatgttagca gcagcggtga tttactatca ctgttggtaa ccttttctga gctaaatatt 420
tgaatgttat cggaatggtc agggtggtac aattttacat aacgatgata tttttttttt 480
aacgacttct tgtccagttt aggatttcca gatccggcct ttggaatgcc aaaaatatca 540
tagggagttg gatctgccaa ctcaggccat tgttcatccc ttatcgtaag ttttctattg 600
ccatttttat cgttcgctgt agcatactta gctataaaag tgatttgtgg gggacacttt 660
tctacacatg ataagtgcca cttgaataaa aatgggtata cgaacttatg gtgtagcata 720
acaaatatat tgcaagtagt gacctatggt gtgtagatat acgtacagtt agttacgagc 780
ctaaagacac aacgtgtttg ttaattatac tgtcgctgta atatcttctc ttccattatc 840
accggtcatt ccttgcaggg gcggtagtac ccggagaccc tgaacttttc tttttttttt 900
tgcgaaatta aaaagttcat tttcaattcg acaatgagat ctacaagcca ttgttttatg 960
ttgatgagag ccagcttaaa gagttctcga gatctcccga gtttatcatt atcaatactg 1020
ccatttcaaa gaatacgtaa ataattaata gtagtgattt tcctaacttt atttagtcaa 1080
aaaattggcc ttttaattct gctgtaaccc gtacatgccc aaaatagggg gcgggttaca 1140
cagaatatat aacatcatag gtgtctgggt gaacagttta ttcctggcat ccactaaata 1200
taatggagcc cgcttttttt aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa 1260
tattgttttc ttcaccaacc atcagttcat aggtccattc tcttagcgca actacacaga 1320
acaggggcac aaacaggcaa aaaacgggca caacctcaat ggagtgatgc aacctgcttg 1380
gagtaaatga tgacacaagg caattgacct acgcatgtat ctatctcatt ttcttacacc 1440
ttctattacc ttctgctctc tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt 1500
tccctgaaat tattccccta tttgactaat aagtatataa agacggtagg tattgattgt 1560
aattctgtaa atctatttct taaacttctt aaattctact tttatagtta gtcttttttt 1620
tagtttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac aaatctagaa 1680
tgaagttcat ttccactttc ttgaccttca ttttggctgc tgtctctgtc accgctgcat 1740
ctattccatc tagtgcatct gtacaattgg actcctacaa ttacgatggt tccacatttt 1800
ccggcaagat ttatgtcaaa aacatcgctt actctaaaaa ggttactgtt gtgtacgcag 1860
acggttctga caactggaac aataacggca acactattgc tgcatcattt tcaggcccaa 1920
tctctggatc aaattacgaa tactggacat tctcagcatc agtgaagggc ataaaggagt 1980
tctacatcaa atacgaagtt tcaggtaaga catattacga caataacaac tctgcaaact 2040
accaagtctc aacttctaaa cctactacaa ctactgcagc tacaaccaca actacagctc 2100
catcaacttc tacaacaacc cgtccatcta gttcagagcc tgccaccttc cctactggta 2160
attctaccat cagctcttgg atcaaaaagc aggaagatat ttccagattc gctatgctta 2220
gaaacatcaa cccacctggt tctgccacag ggtttatcgc cgcatcactc tctaccgctg 2280
gtccagatta ctactacgcg tggacaagag atgccgcttt gacatctaac gttatcgttt 2340
acgaatacaa caccacattg tctgggaata agacaattct aaacgtactt aaggattacg 2400
tcacattcag tgttaagaca cagtctactt caacagtttg taattgcctt ggtgaaccaa 2460
agttcaatcc agacggcagt ggttacacag gtgcttgggg tagacctcaa aatgatggtc 2520
ctgcagaaag agcgactaca tttgttctgt ttgccgacag ctacttgact caaactaagg 2580
atgcctcata cgtcactggt acattaaagc cagcaatttt caaagatctc gattacgttg 2640
ttaacgtctg gagtaacgga tgtttcgatt tatgggagga ggtgaacgga gttcatttct 2700
acacccttat ggttatgaga aaagggctat tgttgggggc tgatttcgcg aagagaaacg 2760
gtgactcaac tagagcctca acttactctt ctactgcttc cacaattgct aacaagatat 2820
caagtttctg ggttagctca aacaactggg tgcaagtatc ccaatctgtc acaggaggtg 2880
taagtaaaaa ggggttagac gttagcaccc tgttagctgc gaatctagga tcagtcgatg 2940
atggattttt cactccaggt tctgaaaaga tattagctac agctgtggca gtcgaagatt 3000
cctttgccag tctataccca atcaacaaaa accttccatc atacttgggg aacgctattg 3060
gaagataccc tgaagataca tacaacggta atggtaactc acaaggcaat ccttggtttc 3120
tggcggttac cggctacgca gagttgtact atagagcaat taaggaatgg atttctaatg 3180
gaggcgttac agtgtcctct atctcattgc catttttcaa aaagttcgat agctctgcaa 3240
catccggtaa aaagtacacc gtaggtactt ctgacttcaa caatttagca caaaacattg 3300
ctcttgctgc agatcgtttc ctatctactg tacaactcca tgcaccaaac aatggttcat 3360
tagcagagga atttgataga acaacaggtt tttctaccgg cgctagagat ttaacatggt 3420
cccacgcctc attgataaca gcatcctatg ccaaagccgg tgctccagct gcataattaa 3480
ttaaacaggc cccttttcct ttgtcgatat catgtaatta gttatgtcac gcttacattc 3540
acgccctcct cccacatccg ctctaaccga aaaggaagga gttagacaac ctgaagtcta 3600
ggtccctatt tattttttta tagttatgtt agtattaaga acgttattta tatttcaaat 3660
ttttcttttt tttctgtaca aacgcgtgta cgcatgtaac gggcagacgg ccggccataa 3720
cttcgtataa tgtatgctat acgaagttat ggcaacggtt catcatctca tggatctgca 3780
catgaacaaa caccagagtc aaacgacgtt gaaattgagg ctactgcgcc aattgatgac 3840
aatacagacg atgataacaa accgaagtta tctgatgtag aaaaggatta gagatgctaa 3900
gagatagtga tgatatttca taaataatgt aattctatat atgttaatta ccttttttgc 3960
gaggcatatt tatggtgaag gataagtttt gaccatcaaa gaaggttaat gtggctgtgg 4020
tttcagggtc cataaagctt ttcaattcat cttttttttt tttgttcttt tttttgattc 4080
cggtttcttt gaaatttttt tgattcggta atctccgagc agaaggaaga acgaaggaag 4140
gagcacagac ttagattggt atatatacgc atatgtggtg ttgaagaaac atgaaattgc 4200
ccagtattct taacccaact gcacagaaca aaaacctgca ggaaacgaag ataaatcatg 4260
tcgaaagcta catataagga acgtgctgct actcatccta gtcctgttgc tgccaagcta 4320
tttaatatca tgcacgaaaa gcaaacaaac ttgtgtgctt cattggatgt tcgtaccacc 4380
aaggaattac tggagttagt tgaagcatta ggtcccaaaa tttgtttact aaaaacacat 4440
gtggatatct tgactgattt ttccatggag ggcacagtta agccgctaaa ggcattatcc 4500
gccaagtaca attttttact cttcgaagac agaaaatttg ctgacattgg taatacagtc 4560
aaattgcagt actctgcggg tgtatacaga atagcagaat gggcagacat tacgaatgca 4620
cacggtgtgg tgggcccagg tattgttagc ggtttgaagc aggcggcgga agaagtaaca 4680
aaggaaccta gaggcctttt gatgttagca gaattgtcat gcaagggctc cctagctact 4740
ggagaatata ctaagggtac tgttgacatt gcgaagagcg acaaagattt tgttatcggc 4800
tttattgctc aaagagacat gggtggaaga gatgaaggtt acgattggtt gattatgaca 4860
cgc 4863
<210> 12
<211> 4748
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 12
ggccgctcca tggagggcac agttaagccg ctaaaggcat tatccgccaa gtacaatttt 60
ttactcttcg aagacagaaa atttgctgac attggtaata cagtcaaatt gcagtactct 120
gcgggtgtat acagaatagc agaatgggca gacattacga atgcacacgg tgtggtgggc 180
ccaggtattg ttagcggttt gaagcaggcg gcggaagaag taacaaagga acctagaggc 240
cttttgatgt tagcagaatt gtcatgcaag ggctccctag ctactggaga atatactaag 300
ggtactgttg acattgcgaa gagcgacaaa gattttgtta tcggctttat tgctcaaaga 360
gacatgggtg gaagagatga aggttacgat tggttgatta tgacacccgg tgtgggttta 420
gatgacaagg gagacgcatt gggtcaacag tatagaaccg tggatgatgt ggtctctaca 480
ggatctgaca ttattattgt tggaagagga ctatttgcaa agggaaggga tgctaaggta 540
gagggtgaac gttacagaaa agcaggctgg gaagcatatt tgagaagatg cggccagcaa 600
aactaaaaaa ctgtattata agtaaatgca tgtatactaa actcacaaat tagagcttca 660
atttaattat atcagttatt acccgggaat ctcggtcgta atgattttta taatgacgaa 720
aaaaaaaaaa ttggaaagaa aaagcttcat ggcctttata aaaaggaacc atccaatacc 780
tcgccagaac caagtaacag tattttacgg ggcacaaatc aagaacaata agacaggact 840
gtaaagatgg acgcattgaa ctccaaagaa caacaagagt tccaaaaagt agtggaacaa 900
aagcaaatga aggatttcat gcgtttgata acttcgtata atgtatgcta tacgaagtta 960
tctcgagggc cagaaaaagg aagtgtttcc ctccttcttg aattgatgtt accctcataa 1020
agcacgtggc ctcttatcga gaaagaaatt accgtcgctc gtgatttgtt tgcaaaaaga 1080
acaaaactga aaaaacccag acacgctcga cttcctgtct tcctgttgat tgcagcttcc 1140
aatttcgtca cacaacaagg tcctagcgac ggctcacagg ttttgtaaca agcaatcgaa 1200
ggttctggaa tggcgggaaa gggtttagta ccacatgcta tgatgcccac tgtgatctcc 1260
agagcaaagt tcgttcgatc gtactgttac tctctctctt tcaaacagaa ttgtccgaat 1320
cgtgtgacaa caacagcctg ttctcacaca ctcttttctt ctaaccaagg gggtggttta 1380
gtttagtaga acctcgtgaa acttacattt acatatatat aaacttgcat aaattggtca 1440
atgcaagaaa tacatatttg gtcttttcta attcgtagtt tttcaagttc ttagatgctt 1500
tctttttctc ttttttacag atcatcaagg aagtaattat ctacttttta caagtctaga 1560
atgaagttta tctccacgtt tttaaccttt atcctagcag ctgtcagcgt caccgccgca 1620
tcaattccga gttcagcatc tgtacaactt gactcttaca attacgatgg cagcactttc 1680
tcagggaaaa tttatgtgaa aaacatagca tatagtaaga aggttaccgt ggtatatgca 1740
gacggttctg ataattggaa taataatgga aacactattg ccgccagttt ttccggccca 1800
atttctggtt ccaattacga gtattggacc ttttctgcat cagtaaaagg catcaaggaa 1860
ttctatatta agtacgaagt ttcaggtaag acatattacg ataacaataa ctcagcaaat 1920
tatcaagtct ctacatctaa gcccacaaca acaactgctg ctaccaccac tacaaccgct 1980
ccttctacca gcaccactac cagaccaagc tctagtgaac cggctacctt tcctaccgga 2040
aacagtacca tctcaagctg gatcaaaaag caagaggaca taagtcgttt tgctatgttg 2100
aggaacatta atcctccagg atccgcgacc ggtttcattg cagcatcact aagtactgcc 2160
gggcctgatt attattatgc ttggactaga gacgctgcat taacatcaaa cgtgattgtt 2220
tatgaatata atacgaccct ttccggtaat aaaacgatct tgaacgtatt aaaagactat 2280
gtgaccttta gtgtgaagac ccaatctaca tctacagtgt gtaattgttt gggagaacct 2340
aaattcaatc cagacggttc tgggtacact ggtgcctggg gtagacctca aaacgacggt 2400
ccagcagaaa gagcaacaac ctttgttcta tttgctgact cttatttaac gcaaacaaag 2460
gacgcctcat atgttacagg gaccctaaaa ccagcaattt tcaaagactt ggattatgtt 2520
gttaatgttt ggagcaacgg atgttttgac ttgtgggagg aggttaacgg tgtacacttt 2580
tatacattga tggtgatgag aaaagggttg ctattgggag cagatttcgc taaaagaaat 2640
ggtgattcta caagagcgag cacatatagt agcaccgctt caacaatcgc caataaaatc 2700
tcatctttct gggtatctag caacaactgg gtacaagttt cccaaagtgt taccggcggt 2760
gtgtccaaaa agggtttaga cgttagcaca cttctagctg ctaatttggg tagcgttgat 2820
gacgggtttt ttactccagg tagtgagaag atactggcaa ccgcggtggc ggttgaagac 2880
agctttgctt cattgtatcc tataaataaa aatctgccct cttatctggg taatgcaatt 2940
ggcagatacc cagaagatac ctacaatggt aatggtaatt cccaggggaa cccatggttt 3000
ttggctgtta caggctacgc agaactttat taccgtgcaa tcaaggaatg gatttcaaat 3060
ggcggcgtca ctgtcagtag tataagtttg ccctttttta agaaatttga ttcctcagca 3120
acgtctggta aaaaatacac cgtaggtact agtgatttca ataatttggc ccaaaatatt 3180
gcgcttgctg ctgacaggtt tcttagtacc gttcagttgc acgctccaaa taatggctca 3240
ttggctgaag aatttgatcg tacgacaggt ttctccactg gtgctaggga tttgacttgg 3300
agtcatgcct ccttaatcac agcaagctat gctaaagctg gtgcacctgc tgcttagtta 3360
attaatttac cagcttacta tccttcttga aaatatgcac tctatatctt ttagttctta 3420
attgcaacac atagatttgc tgtataacga attttatgct atttttttaa tttggagttc 3480
ggtgatgaaa gtgtcacagc gaatttcctc acatgtaggg accgaattgt ttacaagttc 3540
tctgtaccac catggagaca tcaaagattg aaaatctatg gaaagatatg gacggtagca 3600
acaagaatat agcacgagcc gcggagttca tttcgttact tttgatatcg ctcacaacta 3660
ttgcgaagcg cttcagtgaa aaaatcataa ggaaaagttg taaatattat tggtagtatt 3720
cgtttggtaa agtagagggg gtaatttttc ccctttattt tgttcataca ttcttaaatt 3780
gctttgcctc tccttttgga aagctatact tcggagcact gttgagcgaa ggctcaggcc 3840
ggcagcacgc agcacgctgt atttacgtat ttaattttat atatttgtgc atacactact 3900
agggaagact tgaaaaaaac ctaggaaatg aaaaaacgac acaggaagtc ccgtatttac 3960
tattttttcc ttccttttga tggggcaggg cggaaataga ggataggata agcctactgc 4020
ttagctgttt ccgtctctac ttcggtagtt gtctcaattg tcgtttcagt attaccttta 4080
gagccgctag acgatggttg agctatttgt tgagggaaaa ctaagttcat gtaacacacg 4140
cataacccga ttaaactcat gaatagcttg attgcaggag gctggtccat tggagatggt 4200
gccttatttt ccttataggc aacgatgatg tcttcgtcgg tgttcaggta gtagtgtaca 4260
ctctgaatca gggagaacca ggcaatgaac ttgttcctca agaaaatagc ggccataggc 4320
atggattggt taaccacacc agatatgctt ggtgtggcag aatatagtcc ttttggtggc 4380
gcaattttct tgtacctgtg gtagaaaggg agcggttgaa ctgttagtat atattggcaa 4440
tatcagcaaa tttgaaagaa aattgtcggt gaaaaacata cgaaacacaa aggtcgggcc 4500
ttgcaacgtt attcaaagtc attgtttagt tgaggaggta gcagcggagt atatgtattc 4560
cttttttttg cctatggatg ttgtaccatg cccattctgc tcaagctttt gttaaaatta 4620
tttttcagta ttttttcttc catgttgcgc gttacgagaa cagaagcgac agataaccgc 4680
aatcatacaa ctagcgctac tgcggggtgt aaaaagcaca agaactaagc caagatcaca 4740
acagttat 4748
<210> 13
<211> 4260
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 13
tcgagatctc ccgagtttat cattatcaat actgccattt caaagaatac gtaaataatt 60
aatagtagtg attttcctaa ctttatttag tcaaaaaatt ggccttttaa ttctgctgta 120
acccgtacat gcccaaaata gggggcgggt tacacagaat atataacatc ataggtgtct 180
gggtgaacag tttattcctg gcatccacta aatataatgg agcccgcttt ttttaagctg 240
gcatccagaa aaaaaaagaa tcccagcacc aaaatattgt tttcttcacc aaccatcagt 300
tcataggtcc attctcttag cgcaactaca cagaacaggg gcacaaacag gcaaaaaacg 360
ggcacaacct caatggagtg atgcaacctg cttggagtaa atgatgacac aaggcaattg 420
acctacgcat gtatctatct cattttctta caccttctat taccttctgc tctctctgat 480
ttggaaaaag ctgaaaaaaa aggttgaaac cagttccctg aaattattcc cctatttgac 540
taataagtat ataaagacgg taggtattga ttgtaattct gtaaatctat ttcttaaact 600
tcttaaattc tacttttata gttagtcttt tttttagttt aaaacaccaa gaacttagtt 660
tcgaataaac acacataaac aaacaaatct agaatgaagt tcatttccac tttcttgacc 720
ttcattttgg ctgctgtctc tgtcaccgct gcatctattc catctagtgc atctgtacaa 780
ttggactcct acaattacga tggttccaca ttttccggca agatttatgt caaaaacatc 840
gcttactcta aaaaggttac tgttgtgtac gcagacggtt ctgacaactg gaacaataac 900
ggcaacacta ttgctgcatc attttcaggc ccaatctctg gatcaaatta cgaatactgg 960
acattctcag catcagtgaa gggcataaag gagttctaca tcaaatacga agtttcaggt 1020
aagacatatt acgacaataa caactctgca aactaccaag tctcaacttc taaacctact 1080
acaactactg cagctacaac cacaactaca gctccatcaa cttctacaac aacccgtcca 1140
tctagttcag agcctgccac cttccctact ggtaattcta ccatcagctc ttggatcaaa 1200
aagcaggaag atatttccag attcgctatg cttagaaaca tcaacccacc tggttctgcc 1260
acagggttta tcgccgcatc actctctacc gctggtccag attactacta cgcgtggaca 1320
agagatgccg ctttgacatc taacgttatc gtttacgaat acaacaccac attgtctggg 1380
aataagacaa ttctaaacgt acttaaggat tacgtcacat tcagtgttaa gacacagtct 1440
acttcaacag tttgtaattg ccttggtgaa ccaaagttca atccagacgg cagtggttac 1500
acaggtgctt ggggtagacc tcaaaatgat ggtcctgcag aaagagcgac tacatttgtt 1560
ctgtttgccg acagctactt gactcaaact aaggatgcct catacgtcac tggtacatta 1620
aagccagcaa ttttcaaaga tctcgattac gttgttaacg tctggagtaa cggatgtttc 1680
gatttatggg aggaggtgaa cggagttcat ttctacaccc ttatggttat gagaaaaggg 1740
ctattgttgg gggctgattt cgcgaagaga aacggtgact caactagagc ctcaacttac 1800
tcttctactg cttccacaat tgctaacaag atatcaagtt tctgggttag ctcaaacaac 1860
tgggtgcaag tatcccaatc tgtcacagga ggtgtaagta aaaaggggtt agacgttagc 1920
accctgttag ctgcgaatct aggatcagtc gatgatggat ttttcactcc aggttctgaa 1980
aagatattag ctacagctgt ggcagtcgaa gattcctttg ccagtctata cccaatcaac 2040
aaaaaccttc catcatactt ggggaacgct attggaagat accctgaaga tacatacaac 2100
ggtaatggta actcacaagg caatccttgg tttctggcgg ttaccggcta cgcagagttg 2160
tactatagag caattaagga atggatttct aatggaggcg ttacagtgtc ctctatctca 2220
ttgccatttt tcaaaaagtt cgatagctct gcaacatccg gtaaaaagta caccgtaggt 2280
acttctgact tcaacaattt agcacaaaac attgctcttg ctgcagatcg tttcctatct 2340
actgtacaac tccatgcacc aaacaatggt tcattagcag aggaatttga tagaacaaca 2400
ggtttttcta ccggcgctag agatttaaca tggtcccacg cctcattgat aacagcatcc 2460
tatgccaaag ccggtgctcc agctgcataa ttaattaaac aggccccttt tcctttgtcg 2520
atatcatgta attagttatg tcacgcttac attcacgccc tcctcccaca tccgctctaa 2580
ccgaaaagga aggagttaga caacctgaag tctaggtccc tatttatttt tttatagtta 2640
tgttagtatt aagaacgtta tttatatttc aaatttttct tttttttctg tacaaacgcg 2700
tgtacgcatg taacgggcag acggccggcc ataacttcgt ataatgtatg ctatacgaag 2760
ttatccttac atcacaccca atcccccaca agtgatcccc cacacaccat agcttcaaaa 2820
tgtttctact ccttttttac tcttccagat tttctcggac tccgcgcatc gccgtaccac 2880
ttcaaaacac ccaagcacag catactaaat ttcccctctt tcttcctcta gggtggcgtt 2940
aattacccgt actaaaggtt tggaaaagaa aaaagagacc gcctcgtttc tttttcttcg 3000
tcgaaaaagg caataaaaat ttttatcacg tttctttttc ttgaaaaatt ttttttttga 3060
tttttttctc tttcgatgac ctcccattga tatttaagtt aataaatggt cttcaatttc 3120
tcaagtttca gtttcgtttt tcttgttcta ttacaacttt ttttacttct tgctcattag 3180
aaagaaagca tagcaatcta atctaagttt taattacaaa atgccacaat cctgggaaga 3240
attggccgcc gacaaacgtg cccgtttggc taaaaccatt cctgacgaat ggaaggttca 3300
aactttgcct gccgaagatt ccgttattga tttcccaaag aagtccggta ttttgtctga 3360
ggctgaattg aagattaccg aagcctctgc tgctgatttg gtctccaagt tggccgctgg 3420
tgagttgact tctgttgaag tcactttggc tttttgtaag agagctgcta ttgctcaaca 3480
attaaccaac tgtgctcacg aattcttccc agatgctgct ttagctcaag ctagagaatt 3540
agatgaatac tacgctaagc ataagagacc agttggtcca ttacacggtt taccaatctc 3600
tttaaaggac caattgcgtg ttaagggtta cgaaacctcc atgggttaca tttcctggtt 3660
aaacaaatac gatgaaggtg attccgtctt aaccaccatg ttgagaaaag ctggtgctgt 3720
tttctacgtt aagacctctg tcccacaaac cttgatggtc tgtgaaaccg tcaacaacat 3780
cattggtaga actgtcaatc caagaaacaa aaattggtcc tgtggtggtt cttctggtgg 3840
tgaaggtgct attgttggta ttagaggtgg tgttattggt gtcggtactg acattggtgg 3900
ttccattaga gtcccagctg ctttcaactt tttatacggt ttgagaccat ctcacggtag 3960
attgccatat gctaaaatgg ctaactctat ggaaggtcaa gaaaccgttc actccgtcgt 4020
tggtcctatc actcactccg tcgaagactt gagattgttc accaaatctg tcttgggtca 4080
agaaccttgg aagtacgact ctaaggtcat ccccatgcca tggagacaat ctgaatctga 4140
catcattgcc tctaagatta agaatggtgg tttgaacatt ggttattaca atttcgacgg 4200
taacgtcttg ccacacccac caattttacg tggtgtcgaa actaccgttg ccgctttggc 4260
<210> 14
<211> 5008
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 14
ggccgcgaag gtgctattgt tggtattaga ggtggtgtta ttggtgtcgg tactgacatt 60
ggtggttcca ttagagtccc agctgctttc aactttttat acggtttgag accatctcac 120
ggtagattgc catatgctaa aatggctaac tctatggaag gtcaagaaac cgttcactcc 180
gtcgttggtc ctatcactca ctccgtcgaa gacttgagat tgttcaccaa atctgtcttg 240
ggtcaagaac cttggaagta cgactctaag gtcatcccaa tgccatggag acaatctgaa 300
tctgacatca ttgcctctaa gattaagaat ggtggtttga acattggtta ttacaatttc 360
gacggtaacg tcttgccaca cccaccaatt ttacgtggtg tcgaaactac cgttgccgct 420
ttggccaagg ctggtcacac cgttactcca tggactccat acaagcatga tttcggtcat 480
gacttgattt cccacatcta tgctgctgat ggttctgccg acgtcatgag agacatttct 540
gcctctggtg agccagccat ccctaacatt aaggacttgt tgaacccaaa tattaaggct 600
gttaacatga acgaattgtg ggacactcat ttacaaaagt ggaactatca aatggaatac 660
ttggaaaagt ggcgtgaagc tgaagaaaaa gctggtaagg aattggacgc tattatcgct 720
ccaattactc ctaccgccgc tgtcagacac gatcaattca gatactacgg ttacgcctcc 780
gttattaact tattggattt cacctctgtt gtcgtcccag tcactttcgc tgataagaat 840
attgataaga agaacgaatc ttttaaagct gtttccgaat tggatgcttt ggttcaagaa 900
gaatacgacc cagaggctta tcacggtgct cctgttgctg ttcaagttat tggtagaaga 960
ttgtccgaag agagaacttt ggctatcgcc gaagaagtcg gtaaattgtt gggtaacgtc 1020
gtcactccat aagcgaattt cttatgattt atgattttta ttattaaata agttataaaa 1080
aaaataagtg tatacaaatt ttaaagtgac tcttaggttt taaaacgaaa attcttattc 1140
ttgagtaact ctttcctgta ggtcaggttg ctttctcagg tatagcatga ggtcgctctt 1200
attgaccaca cctctaccgg catgccgagc aaatgcctgc aaatcgctcc ccatttcacc 1260
caattgtaga tatgctaact ccagcaatga gttgatgaat ctcggtgtgt attttatgtc 1320
ctcagaggac aacacataac ttcgtataat gtatgctata cgaagttatc tcgagggcca 1380
gaaaaaggaa gtgtttccct ccttcttgaa ttgatgttac cctcataaag cacgtggcct 1440
cttatcgaga aagaaattac cgtcgctcgt gatttgtttg caaaaagaac aaaactgaaa 1500
aaacccagac acgctcgact tcctgtcttc ctgttgattg cagcttccaa tttcgtcaca 1560
caacaaggtc ctagcgacgg ctcacaggtt ttgtaacaag caatcgaagg ttctggaatg 1620
gcgggaaagg gtttagtacc acatgctatg atgcccactg tgatctccag agcaaagttc 1680
gttcgatcgt actgttactc tctctctttc aaacagaatt gtccgaatcg tgtgacaaca 1740
acagcctgtt ctcacacact cttttcttct aaccaagggg gtggtttagt ttagtagaac 1800
ctcgtgaaac ttacatttac atatatataa acttgcataa attggtcaat gcaagaaata 1860
catatttggt cttttctaat tcgtagtttt tcaagttctt agatgctttc tttttctctt 1920
ttttacagat catcaaggaa gtaattatct actttttaca agtctagaat gaagtttatc 1980
tccacgtttt taacctttat cctagcagct gtcagcgtca ccgccgcatc aattccgagt 2040
tcagcatctg tacaacttga ctcttacaat tacgatggca gcactttctc agggaaaatt 2100
tatgtgaaaa acatagcata tagtaagaag gttaccgtgg tatatgcaga cggttctgat 2160
aattggaata ataatggaaa cactattgcc gccagttttt ccggcccaat ttctggttcc 2220
aattacgagt attggacctt ttctgcatca gtaaaaggca tcaaggaatt ctatattaag 2280
tacgaagttt caggtaagac atattacgat aacaataact cagcaaatta tcaagtctct 2340
acatctaagc ccacaacaac aactgctgct accaccacta caaccgctcc ttctaccagc 2400
accactacca gaccaagctc tagtgaaccg gctacctttc ctaccggaaa cagtaccatc 2460
tcaagctgga tcaaaaagca agaggacata agtcgttttg ctatgttgag gaacattaat 2520
cctccaggat ccgcgaccgg tttcattgca gcatcactaa gtactgccgg gcctgattat 2580
tattatgctt ggactagaga cgctgcatta acatcaaacg tgattgttta tgaatataat 2640
acgacccttt ccggtaataa aacgatcttg aacgtattaa aagactatgt gacctttagt 2700
gtgaagaccc aatctacatc tacagtgtgt aattgtttgg gagaacctaa attcaatcca 2760
gacggttctg ggtacactgg tgcctggggt agacctcaaa acgacggtcc agcagaaaga 2820
gcaacaacct ttgttctatt tgctgactct tatttaacgc aaacaaagga cgcctcatat 2880
gttacaggga ccctaaaacc agcaattttc aaagacttgg attatgttgt taatgtttgg 2940
agcaacggat gttttgactt gtgggaggag gttaacggtg tacactttta tacattgatg 3000
gtgatgagaa aagggttgct attgggagca gatttcgcta aaagaaatgg tgattctaca 3060
agagcgagca catatagtag caccgcttca acaatcgcca ataaaatctc atctttctgg 3120
gtatctagca acaactgggt acaagtttcc caaagtgtta ccggcggtgt gtccaaaaag 3180
ggtttagacg ttagcacact tctagctgct aatttgggta gcgttgatga cgggtttttt 3240
actccaggta gtgagaagat actggcaacc gcggtggcgg ttgaagacag ctttgcttca 3300
ttgtatccta taaataaaaa tctgccctct tatctgggta atgcaattgg cagataccca 3360
gaagatacct acaatggtaa tggtaattcc caggggaacc catggttttt ggctgttaca 3420
ggctacgcag aactttatta ccgtgcaatc aaggaatgga tttcaaatgg cggcgtcact 3480
gtcagtagta taagtttgcc cttttttaag aaatttgatt cctcagcaac gtctggtaaa 3540
aaatacaccg taggtactag tgatttcaat aatttggccc aaaatattgc gcttgctgct 3600
gacaggtttc ttagtaccgt tcagttgcac gctccaaata atggctcatt ggctgaagaa 3660
tttgatcgta cgacaggttt ctccactggt gctagggatt tgacttggag tcatgcctcc 3720
ttaatcacag caagctatgc taaagctggt gcacctgctg cttagttaat taatttacca 3780
gcttactatc cttcttgaaa atatgcactc tatatctttt agttcttaat tgcaacacat 3840
agatttgctg tataacgaat tttatgctat ttttttaatt tggagttcgg tgatgaaagt 3900
gtcacagcga atttcctcac atgtagggac cgaattgttt acaagttctc tgtaccacca 3960
tggagacatc aaagattgaa aatctatgga aagatatgga cggtagcaac aagaatatag 4020
cacgagccgc ggagttcatt tcgttacttt tgatatcgct cacaactatt gcgaagcgct 4080
tcagtgaaaa aatcataagg aaaagttgta aatattattg gtagtattcg tttggtaaag 4140
tagagggggt aatttttccc ctttattttg ttcatacatt cttaaattgc tttgcctctc 4200
cttttggaaa gctatacttc ggagcactgt tgagcgaagg ctcaggccgg cagcacgcag 4260
cacgctgtat ttacgtattt aattttatat atttgtgcat acactactag ggaagacttg 4320
aaaaaaacct aggaaatgaa aaaacgacac aggaagtccc gtatttacta ttttttcctt 4380
ccttttgatg gggcagggcg gaaatagagg ataggataag cctactgctt agctgtttcc 4440
gtctctactt cggtagttgt ctcaattgtc gtttcagtat tacctttaga gccgctagac 4500
gatggttgag ctatttgttg agggaaaact aagttcatgt aacacacgca taacccgatt 4560
aaactcatga atagcttgat tgcaggaggc tggtccattg gagatggtgc cttattttcc 4620
ttataggcaa cgatgatgtc ttcgtcggtg ttcaggtagt agtgtacact ctgaatcagg 4680
gagaaccagg caatgaactt gttcctcaag aaaatagcgg ccataggcat ggattggtta 4740
accacaccag atatgcttgg tgtggcagaa tatagtcctt ttggtggcgc aattttcttg 4800
tacctgtggt agaaagggag cggttgaact gttagtatat attggcaata tcagcaaatt 4860
tgaaagaaaa ttgtcggtga aaaacatacg aaacacaaag gtcgggcctt gcaacgttat 4920
tcaaagtcat tgtttagttg aggaggtagc agcggagtat atgtattcct tttttttgcc 4980
tatggatgtt gtaccatgcc cattctga 5008
<210> 15
<211> 4881
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 15
ctaaattcgg ccttgctcag agactcctgg attttggcta acaacgcagt cccttcgatg 60
catatagcta ggccacaaat tatgccaata acggtccatg ggttgatgtt ttcttgaatt 120
ctttcgtttt tcatgctatt tgcgtcttcc caagtcccag cgttccagta ttcatactgc 180
gcgttagagt ggtagccata agagccggca tattggtaat tttcagtatt aacgttagaa 240
cgtggtgaat acgatgtggt ccagccttgc ctcgttgtgt catatacgat ctttttcttt 300
gggtcacaaa gaatatcata tgcttgagag atgactttaa atctatgtag tttttcgctt 360
gatgttagca gcagcggtga tttactatca ctgttggtaa ccttttctga gctaaatatt 420
tgaatgttat cggaatggtc agggtggtac aattttacat aacgatgata tttttttttt 480
aacgacttct tgtccagttt aggatttcca gatccggcct ttggaatgcc aaaaatatca 540
tagggagttg gatctgccaa ctcaggccat tgttcatccc ttatcgtaag ttttctattg 600
ccatttttat cgttcgctgt agcatactta gctataaaag tgatttgtgg gggacacttt 660
tctacacatg ataagtgcca cttgaataaa aatgggtata cgaacttatg gtgtagcata 720
acaaatatat tgcaagtagt gacctatggt gtgtagatat acgtacagtt agttacgagc 780
ctaaagacac aacgtgtttg ttaattatac tgtcgctgta atatcttctc ttccattatc 840
accggtcatt ccttgcaggg gcggtagtac ccggagaccc tgaacttttc tttttttttt 900
tgcgaaatta aaaagttcat tttcaattcg acaatgagat ctacaagcca ttgttttatg 960
ttgatgagag ccagcttaaa gagttctcga gatctcccga gtttatcatt atcaatactg 1020
ccatttcaaa gaatacgtaa ataattaata gtagtgattt tcctaacttt atttagtcaa 1080
aaaattggcc ttttaattct gctgtaaccc gtacatgccc aaaatagggg gcgggttaca 1140
cagaatatat aacatcatag gtgtctgggt gaacagttta ttcctggcat ccactaaata 1200
taatggagcc cgcttttttt aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa 1260
tattgttttc ttcaccaacc atcagttcat aggtccattc tcttagcgca actacacaga 1320
acaggggcac aaacaggcaa aaaacgggca caacctcaat ggagtgatgc aacctgcttg 1380
gagtaaatga tgacacaagg caattgacct acgcatgtat ctatctcatt ttcttacacc 1440
ttctattacc ttctgctctc tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt 1500
tccctgaaat tattccccta tttgactaat aagtatataa agacggtagg tattgattgt 1560
aattctgtaa atctatttct taaacttctt aaattctact tttatagtta gtcttttttt 1620
tagtttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac aaatctagaa 1680
tgcagttatt caacttacca cttaaggtat ctttctttct agtcttatct tacttttcat 1740
tgttagtatc agctgcctct ataccaagtt cagcatccgt acaactagat tcatacaatt 1800
acgacggttc aacattctca ggaaagatat acgtgaaaaa tattgcttac agcaaaaagg 1860
ttactgtgat ttacgcagat gggtcagaca actggaataa caatggaaac acaattgctg 1920
cttcctattc tgcccctatt tctggatcta actacgaata ctggactttt tcagcgagta 1980
taaacggaat taaggaattc tatatcaaat atgaagtctc tggtaagacc tactacgata 2040
acaacaactc cgcaaactac caagttagca catcaaagcc aaccacaaca actgctactg 2100
cgacaactac aaccgcacca agcacttcta ctacaacacc tcctagttca tctgagccag 2160
caactttccc aactggtaat tccactattt cttcttggat caaaaaacaa gagggtatct 2220
caagattcgc catgcttaga aatatcaatc ctccaggctc tgcaacagga ttcattgcag 2280
catctttatc aactgcgggg ccagactact actacgcctg gactagagat gcagctttga 2340
catcaaatgt gattgtttat gaatacaaca caactttgtc cggtaacaag acaatcttga 2400
acgtcttgaa ggattatgtg acattctctg tcaagactca atctacatca acagtttgta 2460
actgtctcgg cgaaccaaag ttcaaccctg atggtagtgg ttacactggt gcttggggta 2520
gaccacaaaa cgatggtcca gcagagagag ctacaacttt catcttgttt gctgactctt 2580
acctaacaca aaccaaggat gcaagctacg ttactggaac actaaagcct gcaatcttta 2640
aagacctgga ctatgttgta aacgtttggt caaatggctg cttcgatcta tgggaggaag 2700
tgaacggtgt tcacttctac acattaatgg tcatgagaaa gggactcttg cttggtgcag 2760
actttgctaa gagaaacggt gattctacac gtgcctccac ttactcctcc acagcttcaa 2820
ccattgccaa caaaatctct tctttctggg tcagctcaaa taactggatt caagtttctc 2880
aatcagttac tggtggtgtt tctaaaaagg gcctggatgt gtcaaccttg cttgctgcca 2940
atttgggcag tgttgatgac gggttcttca ccccaggttc tgaaaagatc ctcgccaccg 3000
cagttgccgt tgaagattca tttgctagtt tatacccaat caacaaaaat ctaccatcat 3060
accttggaaa ttcaatcggt agatatccag aggatacata caacggtaat ggaaactctc 3120
agggtaaccc ttggtttctt gcagttacag ggtacgctga actgtactac agagcgatta 3180
aggaatggat tggtaatggc ggcgtaactg ttagttctat ttctctacct ttcttcaaaa 3240
agttcgatag ttctgcaaca tctggtaaaa agtacacagt cggcacttcc gattttaaca 3300
atttagctca gaacatagca ctggcagctg atcgtttctt gagtacagtc caattgcatg 3360
cccataacaa cggtagtttg gctgaagagt ttgatagaac caccggttta tcaaccggcg 3420
ccagagattt aacatggtcc catgcgtctt tgataactgc ttcttacgcc aaggctgggg 3480
caccagctgc ctgattaatt aaacaggccc cttttccttt gtcgatatca tgtaattagt 3540
tatgtcacgc ttacattcac gccctcctcc cacatccgct ctaaccgaaa aggaaggagt 3600
tagacaacct gaagtctagg tccctattta tttttttata gttatgttag tattaagaac 3660
gttatttata tttcaaattt ttcttttttt tctgtacaaa cgcgtgtacg catgtaacgg 3720
gcagacggcc ggccataact tcgtataatg tatgctatac gaagttatgg caacggttca 3780
tcatctcatg gatctgcaca tgaacaaaca ccagagtcaa acgacgttga aattgaggct 3840
actgcgccaa ttgatgacaa tacagacgat gataacaaac cgaagttatc tgatgtagaa 3900
aaggattaga gatgctaaga gatagtgatg atatttcata aataatgtaa ttctatatat 3960
gttaattacc ttttttgcga ggcatattta tggtgaagga taagttttga ccatcaaaga 4020
aggttaatgt ggctgtggtt tcagggtcca taaagctttt caattcatct tttttttttt 4080
tgttcttttt tttgattccg gtttctttga aatttttttg attcggtaat ctccgagcag 4140
aaggaagaac gaaggaagga gcacagactt agattggtat atatacgcat atgtggtgtt 4200
gaagaaacat gaaattgccc agtattctta acccaactgc acagaacaaa aacctgcagg 4260
aaacgaagat aaatcatgtc gaaagctaca tataaggaac gtgctgctac tcatcctagt 4320
cctgttgctg ccaagctatt taatatcatg cacgaaaagc aaacaaactt gtgtgcttca 4380
ttggatgttc gtaccaccaa ggaattactg gagttagttg aagcattagg tcccaaaatt 4440
tgtttactaa aaacacatgt ggatatcttg actgattttt ccatggaggg cacagttaag 4500
ccgctaaagg cattatccgc caagtacaat tttttactct tcgaagacag aaaatttgct 4560
gacattggta atacagtcaa attgcagtac tctgcgggtg tatacagaat agcagaatgg 4620
gcagacatta cgaatgcaca cggtgtggtg ggcccaggta ttgttagcgg tttgaagcag 4680
gcggcggaag aagtaacaaa ggaacctaga ggccttttga tgttagcaga attgtcatgc 4740
aagggctccc tagctactgg agaatatact aagggtactg ttgacattgc gaagagcgac 4800
aaagattttg ttatcggctt tattgctcaa agagacatgg gtggaagaga tgaaggttac 4860
gattggttga ttatgacacg c 4881
<210> 16
<211> 4824
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 16
ggccgctcca tggagggcac agttaagccg ctaaaggcat tatccgccaa gtacaatttt 60
ttactcttcg aagacagaaa atttgctgac attggtaata cagtcaaatt gcagtactct 120
gcgggtgtat acagaatagc agaatgggca gacattacga atgcacacgg tgtggtgggc 180
ccaggtattg ttagcggttt gaagcaggcg gcggaagaag taacaaagga acctagaggc 240
cttttgatgt tagcagaatt gtcatgcaag ggctccctag ctactggaga atatactaag 300
ggtactgttg acattgcgaa gagcgacaaa gattttgtta tcggctttat tgctcaaaga 360
gacatgggtg gaagagatga aggttacgat tggttgatta tgacacccgg tgtgggttta 420
gatgacaagg gagacgcatt gggtcaacag tatagaaccg tggatgatgt ggtctctaca 480
ggatctgaca ttattattgt tggaagagga ctatttgcaa agggaaggga tgctaaggta 540
gagggtgaac gttacagaaa agcaggctgg gaagcatatt tgagaagatg cggccagcaa 600
aactaaaaaa ctgtattata agtaaatgca tgtatactaa actcacaaat tagagcttca 660
atttaattat atcagttatt acccgggaat ctcggtcgta atgattttta taatgacgaa 720
aaaaaaaaaa ttggaaagaa aaagcttcat ggcctttata aaaaggaacc atccaatacc 780
tcgccagaac caagtaacag tattttacgg ggcacaaatc aagaacaata agacaggact 840
gtaaagatgg acgcattgaa ctccaaagaa caacaagagt tccaaaaagt agtggaacaa 900
aagcaaatga aggatttcat gcgtttgata acttcgtata atgtatgcta tacgaagtta 960
tctcgagggc cagaaaaagg aagtgtttcc ctccttcttg aattgatgtt accctcataa 1020
agcacgtggc ctcttatcga gaaagaaatt accgtcgctc gtgatttgtt tgcaaaaaga 1080
acaaaactga aaaaacccag acacgctcga cttcctgtct tcctgttgat tgcagcttcc 1140
aatttcgtca cacaacaagg tcctagcgac ggctcacagg ttttgtaaca agcaatcgaa 1200
ggttctggaa tggcgggaaa gggtttagta ccacatgcta tgatgcccac tgtgatctcc 1260
agagcaaagt tcgttcgatc gtactgttac tctctctctt tcaaacagaa ttgtccgaat 1320
cgtgtgacaa caacagcctg ttctcacaca ctcttttctt ctaaccaagg gggtggttta 1380
gtttagtaga acctcgtgaa acttacattt acatatatat aaacttgcat aaattggtca 1440
atgcaagaaa tacatatttg gtcttttcta attcgtagtt tttcaagttc ttagatgctt 1500
tctttttctc ttttttacag atcatcaagg aagtaattat ctacttttta caagtctaga 1560
atgcagctgt tcaacttgcc attaaaggtt tcattctttt tggtcctatc atactttagt 1620
ttgttggtgt cagccgcatc tattccatct tcagcatctg tacaattaga ctcctacaat 1680
tacgacggct ctacattcag cggaaagatt tacgtgaaaa atattgcgta cagcaaaaaa 1740
gtaactgtta tctatgccga cggatcagat aactggaaca acaatggaaa cactatcgct 1800
gccagttact ctgcaccaat ttcaggttct aactacgaat attggacatt ctcagcctcc 1860
atcaatggca ttaaggaatt ctacataaag tacgaagttt ccggtaagac ttactacgat 1920
aacaacaatt ctgcaaacta tcaagtatca acatcaaaac ctactaccac caccgccaca 1980
gctacaacta caactgcacc ttcaacatct accacaaccc caccatcttc tagcgaacca 2040
gctacattcc caactggcaa ttctactatt tctagttgga tcaaaaaaca agagggtatt 2100
tccagattcg caatgttgag aaacataaat ccaccaggat cagcaactgg attcatcgca 2160
gcttctttgt ccacagcggg gccagattac tactacgcat ggaccagaga tgctgctttg 2220
acaagtaacg ttattgttta cgaatacaat accactttgt ccggtaacaa gactattctt 2280
aacgtcctaa aggattacgt tacattctct gttaagactc agtctacatc cacagtctgc 2340
aattgtttgg gtgaaccaaa gttcaaccca gatggctctg gatacacagg tgcctggggt 2400
cgtccacaaa acgatgggcc tgccgagaga gccactacat ttatcctatt tgctgactca 2460
taccttacac aaacaaaaga tgcatcctac gtgactggaa cattaaagcc tgcaatcttc 2520
aaagacctgg attacgttgt caacgtgtgg tctaacggct gtttcgatct atgggaagag 2580
gttaacggcg tgcacttcta cactctaatg gtcatgagaa agggtctgtt gttaggtgca 2640
gattttgcta agagaaacgg tgattctaca cgtgcttcta cctactcctc aacagcatca 2700
actattgcga acaagatttc ttcattttgg gtttcaagta ataactggat acaagtatct 2760
caaagcgtta cagggggtgt ctcaaaaaag ggtcttgatg tttctacatt actggctgct 2820
aatcttgggt ctgttgatga cggtttcttc acccctggtt ctgaaaagat cctcgctacc 2880
gccgtcgcgg ttgaggatag ttttgcttca ctctatccta taaacaaaaa ccttccttca 2940
tacttaggaa acagtatcgg tagataccca gaggatacat acaatggtaa tggcaattca 3000
cagggaaatc catggttcct tgctgttaca gggtacgcag aactttacta tagagctatt 3060
aaggaatgga tcggcaacgg cggtgtgaca gtttcctcaa tctcattgcc atttttcaaa 3120
aagtttgact ccagcgcgac atctggtaaa aagtatactg tggggacttc tgatttcaac 3180
aatttggctc aaaacattgc cttagctgcc gacagattct tatctaccgt acaactccat 3240
gcacataaca atggtagttt ggcagaggaa tttgatagaa ctacaggact ctctacaggt 3300
gcgagagatt taacttggtc acatgcaagt ttaattacag cctcttacgc aaaggctggt 3360
gctcctgctg cataattaat taatttacca gcttactatc cttcttgaaa atatgcactc 3420
tatatctttt agttcttaat tgcaacacat agatttgctg tataacgaat tttatgctat 3480
ttttttaatt tggagttcgg tgatgaaagt gtcacagcga atttcctcac atgtagggac 3540
cgaattgttt acaagttctc tgtaccacca tggagacatc aaagattgaa aatctatgga 3600
aagatatgga cggtagcaac aagaatatag cacgagccgc ggagttcatt tcgttacttt 3660
tgatatcgct cacaactatt gcgaagcgct tcagtgaaaa aatcataagg aaaagttgta 3720
aatattattg gtagtattcg tttggtaaag tagagggggt aatttttccc ctttattttg 3780
ttcatacatt cttaaattgc tttgcctctc cttttggaaa gctatacttc ggagcactgt 3840
tgagcgaagg ctcaggccgg cagcacgcag cacgctgtat ttacgtattt aattttatat 3900
atttgtgcat acactactag ggaagacttg aaaaaaacct aggaaatgaa aaaacgacac 3960
aggaagtccc gtatttacta ttttttcctt ccttttgatg gggcagggcg gaaatagagg 4020
ataggataag cctactgctt agctgtttcc gtctctactt cggtagttgt ctcaattgtc 4080
gtttcagtat tacctttaga gccgctagac gatggttgag ctatttgttg agggaaaact 4140
aagttcatgt aacacacgca taacccgatt aaactcatga atagcttgat tgcaggaggc 4200
tggtccattg gagatggtgc cttattttcc ttataggcaa cgatgatgtc ttcgtcggtg 4260
ttcaggtagt agtgtacact ctgaatcagg gagaaccagg caatgaactt gttcctcaag 4320
aaaatagcgg ccataggcat ggattggtta accacaccag atatgcttgg tgtggcagaa 4380
tatagtcctt ttggtggcgc aattttcttg tacctgtggt agaaagggag cggttgaact 4440
gttagtatat attggcaata tcagcaaatt tgaaagaaaa ttgtcggtga aaaacatacg 4500
aaacacaaag gtcgggcctt gcaacgttat tcaaagtcat tgtttagttg aggaggtagc 4560
agcggagtat atgtattcct tttttttgcc tatggatgtt gtaccatgcc cattctgctc 4620
aagcttttgt taaaattatt tttcagtatt ttttcttcca tgttgcgcgt tacgagaaca 4680
gaagcgacag ataaccgcaa tcatacaact agcgctactg cggggtgtaa aaagcacaag 4740
aactaagcca agatcacaac agttatcgat aaaatagcag tgtttgcatg gccattgaga 4800
aggacaacat tggcgtgcgg catg 4824
<210> 17
<211> 5264
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 17
ctaaattcgg ccttgctcag agactcctgg attttggcta acaacgcagt cccttcgatg 60
catatagcta ggccacaaat tatgccaata acggtccatg ggttgatgtt ttcttgaatt 120
ctttcgtttt tcatgctatt tgcgtcttcc caagtcccag cgttccagta ttcatactgc 180
gcgttagagt ggtagccata agagccggca tattggtaat tttcagtatt aacgttagaa 240
cgtggtgaat acgatgtggt ccagccttgc ctcgttgtgt catatacgat ctttttcttt 300
gggtcacaaa gaatatcata tgcttgagag atgactttaa atctatgtag tttttcgctt 360
gatgttagca gcagcggtga tttactatca ctgttggtaa ccttttctga gctaaatatt 420
tgaatgttat cggaatggtc agggtggtac aattttacat aacgatgata tttttttttt 480
aacgacttct tgtccagttt aggatttcca gatccggcct ttggaatgcc aaaaatatca 540
tagggagttg gatctgccaa ctcaggccat tgttcatccc ttatcgtaag ttttctattg 600
ccatttttat cgttcgctgt agcatactta gctataaaag tgatttgtgg gggacacttt 660
tctacacatg ataagtgcca cttgaataaa aatgggtata cgaacttatg gtgtagcata 720
acaaatatat tgcaagtagt gacctatggt gtgtagatat acgtacagtt agttacgagc 780
ctaaagacac aacgtgtttg ttaattatac tgtcgctgta atatcttctc ttccattatc 840
accggtcatt ccttgcaggg gcggtagtac ccggagaccc tgaacttttc tttttttttt 900
tgcgaaatta aaaagttcat tttcaattcg acaatgagat ctacaagcca ttgttttatg 960
ttgatgagag ccagcttaaa gagttctcga gatctcccga gtttatcatt atcaatactg 1020
ccatttcaaa gaatacgtaa ataattaata gtagtgattt tcctaacttt atttagtcaa 1080
aaaattggcc ttttaattct gctgtaaccc gtacatgccc aaaatagggg gcgggttaca 1140
cagaatatat aacatcatag gtgtctgggt gaacagttta ttcctggcat ccactaaata 1200
taatggagcc cgcttttttt aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa 1260
tattgttttc ttcaccaacc atcagttcat aggtccattc tcttagcgca actacacaga 1320
acaggggcac aaacaggcaa aaaacgggca caacctcaat ggagtgatgc aacctgcttg 1380
gagtaaatga tgacacaagg caattgacct acgcatgtat ctatctcatt ttcttacacc 1440
ttctattacc ttctgctctc tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt 1500
tccctgaaat tattccccta tttgactaat aagtatataa agacggtagg tattgattgt 1560
aattctgtaa atctatttct taaacttctt aaattctact tttatagtta gtcttttttt 1620
tagtttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac aaatctagaa 1680
tgcagttatt caacttacca cttaaggtat ctttctttct agtcttatct tacttttcat 1740
tgttagtatc agctgcctct ataccaagtt cagcatccgt acaactagat tcatacaatt 1800
acgacggttc aacattctca ggaaagatat acgtgaaaaa tattgcttac agcaaaaagg 1860
ttactgtgat ttacgcagat gggtcagaca actggaataa caatggaaac acaattgctg 1920
cttcctattc tgcccctatt tctggatcta actacgaata ctggactttt tcagcgagta 1980
taaacggaat taaggaattc tatatcaaat atgaagtctc tggtaagacc tactacgata 2040
acaacaactc cgcaaactac caagttagca catcaaagcc aaccacaaca actgctactg 2100
cgacaactac aaccgcacca agcacttcta ctacaacacc tcctagttca tctgagccag 2160
caactttccc aactggtaat tccactattt cttcttggat caaaaaacaa gagggtatct 2220
caagattcgc catgcttaga aatatcaatc ctccaggctc tgcaacagga ttcattgcag 2280
catctttatc aactgcgggg ccagactact actacgcctg gactagagat gcagctttga 2340
catcaaatgt gattgtttat gaatacaaca caactttgtc cggtaacaag acaatcttga 2400
acgtcttgaa ggattatgtg acattctctg tcaagactca atctacatca acagtttgta 2460
actgtctcgg cgaaccaaag ttcaaccctg atggtagtgg ttacactggt gcttggggta 2520
gaccacaaaa cgatggtcca gcagagagag ctacaacttt catcttgttt gctgactctt 2580
acctaacaca aaccaaggat gcaagctacg ttactggaac actaaagcct gcaatcttta 2640
aagacctgga ctatgttgta aacgtttggt caaatggctg cttcgatcta tgggaggaag 2700
tgaacggtgt tcacttctac acattaatgg tcatgagaaa gggactcttg cttggtgcag 2760
actttgctaa gagaaacggt gattctacac gtgcctccac ttactcctcc acagcttcaa 2820
ccattgccaa caaaatctct tctttctggg tcagctcaaa taactggatt caagtttctc 2880
aatcagttac tggtggtgtt tctaaaaagg gcctggatgt gtcaaccttg cttgctgcca 2940
atttgggcag tgttgatgac gggttcttca ccccaggttc tgaaaagatc ctcgccaccg 3000
cagttgccgt tgaagattca tttgctagtt tatacccaat caacaaaaat ctaccatcat 3060
accttggaaa ttcaatcggt agatatccag aggatacata caacggtaat ggaaactctc 3120
agggtaaccc ttggtttctt gcagttacag ggtacgctga actgtactac agagcgatta 3180
aggaatggat tggtaatggc ggcgtaactg ttagttctat ttctctacct ttcttcaaaa 3240
agttcgatag ttctgcaaca tctggtaaaa agtacacagt cggcacttcc gattttaaca 3300
atttagctca gaacatagca ctggcagctg atcgtttctt gagtacagtc caattgcatg 3360
cccataacaa cggtagtttg gctgaagagt ttgatagaac caccggttta tcaaccggcg 3420
ccagagattt aacatggtcc catgcgtctt tgataactgc ttcttacgcc aaggctgggg 3480
caccagctgc ctgattaatt aaacaggccc cttttccttt gtcgatatca tgtaattagt 3540
tatgtcacgc ttacattcac gccctcctcc cacatccgct ctaaccgaaa aggaaggagt 3600
tagacaacct gaagtctagg tccctattta tttttttata gttatgttag tattaagaac 3660
gttatttata tttcaaattt ttcttttttt tctgtacaaa cgcgtgtacg catgtaacgg 3720
gcagacggcc ggccataact tcgtataatg tatgctatac gaagttatcc ttacatcaca 3780
cccaatcccc cacaagtgat cccccacaca ccatagcttc aaaatgtttc tactcctttt 3840
ttactcttcc agattttctc ggactccgcg catcgccgta ccacttcaaa acacccaagc 3900
acagcatact aaatttcccc tctttcttcc tctagggtgg cgttaattac ccgtactaaa 3960
ggtttggaaa agaaaaaaga gaccgcctcg tttctttttc ttcgtcgaaa aaggcaataa 4020
aaatttttat cacgtttctt tttcttgaaa aatttttttt ttgatttttt tctctttcga 4080
tgacctccca ttgatattta agttaataaa tggtcttcaa tttctcaagt ttcagtttcg 4140
tttttcttgt tctattacaa ctttttttac ttcttgctca ttagaaagaa agcatagcaa 4200
tctaatctaa gttttaatta caaaatgcca caatcctggg aagaattggc cgccgacaaa 4260
cgtgcccgtt tggctaaaac cattcctgac gaatggaagg ttcaaacttt gcctgccgaa 4320
gattccgtta ttgatttccc aaagaagtcc ggtattttgt ctgaggctga attgaagatt 4380
accgaagcct ctgctgctga tttggtctcc aagttggccg ctggtgagtt gacttctgtt 4440
gaagtcactt tggctttttg taagagagct gctattgctc aacaattaac caactgtgct 4500
cacgaattct tcccagatgc tgctttagct caagctagag aattagatga atactacgct 4560
aagcataaga gaccagttgg tccattacac ggtttaccaa tctctttaaa ggaccaattg 4620
cgtgttaagg gttacgaaac ctccatgggt tacatttcct ggttaaacaa atacgatgaa 4680
ggtgattccg tcttaaccac catgttgaga aaagctggtg ctgttttcta cgttaagacc 4740
tctgtcccac aaaccttgat ggtctgtgaa accgtcaaca acatcattgg tagaactgtc 4800
aatccaagaa acaaaaattg gtcctgtggt ggttcttctg gtggtgaagg tgctattgtt 4860
ggtattagag gtggtgttat tggtgtcggt actgacattg gtggttccat tagagtccca 4920
gctgctttca actttttata cggtttgaga ccatctcacg gtagattgcc atatgctaaa 4980
atggctaact ctatggaagg tcaagaaacc gttcactccg tcgttggtcc tatcactcac 5040
tccgtcgaag acttgagatt gttcaccaaa tctgtcttgg gtcaagaacc ttggaagtac 5100
gactctaagg tcatccccat gccatggaga caatctgaat ctgacatcat tgcctctaag 5160
attaagaatg gtggtttgaa cattggttat tacaatttcg acggtaacgt cttgccacac 5220
ccaccaattt tacgtggtgt cgaaactacc gttgccgctt tggc 5264
<210> 18
<211> 5026
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 18
ggccgcgaag gtgctattgt tggtattaga ggtggtgtta ttggtgtcgg tactgacatt 60
ggtggttcca ttagagtccc agctgctttc aactttttat acggtttgag accatctcac 120
ggtagattgc catatgctaa aatggctaac tctatggaag gtcaagaaac cgttcactcc 180
gtcgttggtc ctatcactca ctccgtcgaa gacttgagat tgttcaccaa atctgtcttg 240
ggtcaagaac cttggaagta cgactctaag gtcatcccaa tgccatggag acaatctgaa 300
tctgacatca ttgcctctaa gattaagaat ggtggtttga acattggtta ttacaatttc 360
gacggtaacg tcttgccaca cccaccaatt ttacgtggtg tcgaaactac cgttgccgct 420
ttggccaagg ctggtcacac cgttactcca tggactccat acaagcatga tttcggtcat 480
gacttgattt cccacatcta tgctgctgat ggttctgccg acgtcatgag agacatttct 540
gcctctggtg agccagccat ccctaacatt aaggacttgt tgaacccaaa tattaaggct 600
gttaacatga acgaattgtg ggacactcat ttacaaaagt ggaactatca aatggaatac 660
ttggaaaagt ggcgtgaagc tgaagaaaaa gctggtaagg aattggacgc tattatcgct 720
ccaattactc ctaccgccgc tgtcagacac gatcaattca gatactacgg ttacgcctcc 780
gttattaact tattggattt cacctctgtt gtcgtcccag tcactttcgc tgataagaat 840
attgataaga agaacgaatc ttttaaagct gtttccgaat tggatgcttt ggttcaagaa 900
gaatacgacc cagaggctta tcacggtgct cctgttgctg ttcaagttat tggtagaaga 960
ttgtccgaag agagaacttt ggctatcgcc gaagaagtcg gtaaattgtt gggtaacgtc 1020
gtcactccat aagcgaattt cttatgattt atgattttta ttattaaata agttataaaa 1080
aaaataagtg tatacaaatt ttaaagtgac tcttaggttt taaaacgaaa attcttattc 1140
ttgagtaact ctttcctgta ggtcaggttg ctttctcagg tatagcatga ggtcgctctt 1200
attgaccaca cctctaccgg catgccgagc aaatgcctgc aaatcgctcc ccatttcacc 1260
caattgtaga tatgctaact ccagcaatga gttgatgaat ctcggtgtgt attttatgtc 1320
ctcagaggac aacacataac ttcgtataat gtatgctata cgaagttatc tcgagggcca 1380
gaaaaaggaa gtgtttccct ccttcttgaa ttgatgttac cctcataaag cacgtggcct 1440
cttatcgaga aagaaattac cgtcgctcgt gatttgtttg caaaaagaac aaaactgaaa 1500
aaacccagac acgctcgact tcctgtcttc ctgttgattg cagcttccaa tttcgtcaca 1560
caacaaggtc ctagcgacgg ctcacaggtt ttgtaacaag caatcgaagg ttctggaatg 1620
gcgggaaagg gtttagtacc acatgctatg atgcccactg tgatctccag agcaaagttc 1680
gttcgatcgt actgttactc tctctctttc aaacagaatt gtccgaatcg tgtgacaaca 1740
acagcctgtt ctcacacact cttttcttct aaccaagggg gtggtttagt ttagtagaac 1800
ctcgtgaaac ttacatttac atatatataa acttgcataa attggtcaat gcaagaaata 1860
catatttggt cttttctaat tcgtagtttt tcaagttctt agatgctttc tttttctctt 1920
ttttacagat catcaaggaa gtaattatct actttttaca agtctagaat gcagctgttc 1980
aacttgccat taaaggtttc attctttttg gtcctatcat actttagttt gttggtgtca 2040
gccgcatcta ttccatcttc agcatctgta caattagact cctacaatta cgacggctct 2100
acattcagcg gaaagattta cgtgaaaaat attgcgtaca gcaaaaaagt aactgttatc 2160
tatgccgacg gatcagataa ctggaacaac aatggaaaca ctatcgctgc cagttactct 2220
gcaccaattt caggttctaa ctacgaatat tggacattct cagcctccat caatggcatt 2280
aaggaattct acataaagta cgaagtttcc ggtaagactt actacgataa caacaattct 2340
gcaaactatc aagtatcaac atcaaaacct actaccacca ccgccacagc tacaactaca 2400
actgcacctt caacatctac cacaacccca ccatcttcta gcgaaccagc tacattccca 2460
actggcaatt ctactatttc tagttggatc aaaaaacaag agggtatttc cagattcgca 2520
atgttgagaa acataaatcc accaggatca gcaactggat tcatcgcagc ttctttgtcc 2580
acagcggggc cagattacta ctacgcatgg accagagatg ctgctttgac aagtaacgtt 2640
attgtttacg aatacaatac cactttgtcc ggtaacaaga ctattcttaa cgtcctaaag 2700
gattacgtta cattctctgt taagactcag tctacatcca cagtctgcaa ttgtttgggt 2760
gaaccaaagt tcaacccaga tggctctgga tacacaggtg cctggggtcg tccacaaaac 2820
gatgggcctg ccgagagagc cactacattt atcctatttg ctgactcata ccttacacaa 2880
acaaaagatg catcctacgt gactggaaca ttaaagcctg caatcttcaa agacctggat 2940
tacgttgtca acgtgtggtc taacggctgt ttcgatctat gggaagaggt taacggcgtg 3000
cacttctaca ctctaatggt catgagaaag ggtctgttgt taggtgcaga ttttgctaag 3060
agaaacggtg attctacacg tgcttctacc tactcctcaa cagcatcaac tattgcgaac 3120
aagatttctt cattttgggt ttcaagtaat aactggatac aagtatctca aagcgttaca 3180
gggggtgtct caaaaaaggg tcttgatgtt tctacattac tggctgctaa tcttgggtct 3240
gttgatgacg gtttcttcac ccctggttct gaaaagatcc tcgctaccgc cgtcgcggtt 3300
gaggatagtt ttgcttcact ctatcctata aacaaaaacc ttccttcata cttaggaaac 3360
agtatcggta gatacccaga ggatacatac aatggtaatg gcaattcaca gggaaatcca 3420
tggttccttg ctgttacagg gtacgcagaa ctttactata gagctattaa ggaatggatc 3480
ggcaacggcg gtgtgacagt ttcctcaatc tcattgccat ttttcaaaaa gtttgactcc 3540
agcgcgacat ctggtaaaaa gtatactgtg gggacttctg atttcaacaa tttggctcaa 3600
aacattgcct tagctgccga cagattctta tctaccgtac aactccatgc acataacaat 3660
ggtagtttgg cagaggaatt tgatagaact acaggactct ctacaggtgc gagagattta 3720
acttggtcac atgcaagttt aattacagcc tcttacgcaa aggctggtgc tcctgctgca 3780
taattaatta atttaccagc ttactatcct tcttgaaaat atgcactcta tatcttttag 3840
ttcttaattg caacacatag atttgctgta taacgaattt tatgctattt ttttaatttg 3900
gagttcggtg atgaaagtgt cacagcgaat ttcctcacat gtagggaccg aattgtttac 3960
aagttctctg taccaccatg gagacatcaa agattgaaaa tctatggaaa gatatggacg 4020
gtagcaacaa gaatatagca cgagccgcgg agttcatttc gttacttttg atatcgctca 4080
caactattgc gaagcgcttc agtgaaaaaa tcataaggaa aagttgtaaa tattattggt 4140
agtattcgtt tggtaaagta gagggggtaa tttttcccct ttattttgtt catacattct 4200
taaattgctt tgcctctcct tttggaaagc tatacttcgg agcactgttg agcgaaggct 4260
caggccggca gcacgcagca cgctgtattt acgtatttaa ttttatatat ttgtgcatac 4320
actactaggg aagacttgaa aaaaacctag gaaatgaaaa aacgacacag gaagtcccgt 4380
atttactatt ttttccttcc ttttgatggg gcagggcgga aatagaggat aggataagcc 4440
tactgcttag ctgtttccgt ctctacttcg gtagttgtct caattgtcgt ttcagtatta 4500
cctttagagc cgctagacga tggttgagct atttgttgag ggaaaactaa gttcatgtaa 4560
cacacgcata acccgattaa actcatgaat agcttgattg caggaggctg gtccattgga 4620
gatggtgcct tattttcctt ataggcaacg atgatgtctt cgtcggtgtt caggtagtag 4680
tgtacactct gaatcaggga gaaccaggca atgaacttgt tcctcaagaa aatagcggcc 4740
ataggcatgg attggttaac cacaccagat atgcttggtg tggcagaata tagtcctttt 4800
ggtggcgcaa ttttcttgta cctgtggtag aaagggagcg gttgaactgt tagtatatat 4860
tggcaatatc agcaaatttg aaagaaaatt gtcggtgaaa aacatacgaa acacaaaggt 4920
cgggccttgc aacgttattc aaagtcattg tttagttgag gaggtagcag cggagtatat 4980
gtattccttt tttttgccta tggatgttgt accatgccca ttctga 5026
<210> 19
<211> 4884
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 19
ctaaattcgg ccttgctcag agactcctgg attttggcta acaacgcagt cccttcgatg 60
catatagcta ggccacaaat tatgccaata acggtccatg ggttgatgtt ttcttgaatt 120
ctttcgtttt tcatgctatt tgcgtcttcc caagtcccag cgttccagta ttcatactgc 180
gcgttagagt ggtagccata agagccggca tattggtaat tttcagtatt aacgttagaa 240
cgtggtgaat acgatgtggt ccagccttgc ctcgttgtgt catatacgat ctttttcttt 300
gggtcacaaa gaatatcata tgcttgagag atgactttaa atctatgtag tttttcgctt 360
gatgttagca gcagcggtga tttactatca ctgttggtaa ccttttctga gctaaatatt 420
tgaatgttat cggaatggtc agggtggtac aattttacat aacgatgata tttttttttt 480
aacgacttct tgtccagttt aggatttcca gatccggcct ttggaatgcc aaaaatatca 540
tagggagttg gatctgccaa ctcaggccat tgttcatccc ttatcgtaag ttttctattg 600
ccatttttat cgttcgctgt agcatactta gctataaaag tgatttgtgg gggacacttt 660
tctacacatg ataagtgcca cttgaataaa aatgggtata cgaacttatg gtgtagcata 720
acaaatatat tgcaagtagt gacctatggt gtgtagatat acgtacagtt agttacgagc 780
ctaaagacac aacgtgtttg ttaattatac tgtcgctgta atatcttctc ttccattatc 840
accggtcatt ccttgcaggg gcggtagtac ccggagaccc tgaacttttc tttttttttt 900
tgcgaaatta aaaagttcat tttcaattcg acaatgagat ctacaagcca ttgttttatg 960
ttgatgagag ccagcttaaa gagttctcga gatctcccga gtttatcatt atcaatactg 1020
ccatttcaaa gaatacgtaa ataattaata gtagtgattt tcctaacttt atttagtcaa 1080
aaaattggcc ttttaattct gctgtaaccc gtacatgccc aaaatagggg gcgggttaca 1140
cagaatatat aacatcatag gtgtctgggt gaacagttta ttcctggcat ccactaaata 1200
taatggagcc cgcttttttt aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa 1260
tattgttttc ttcaccaacc atcagttcat aggtccattc tcttagcgca actacacaga 1320
acaggggcac aaacaggcaa aaaacgggca caacctcaat ggagtgatgc aacctgcttg 1380
gagtaaatga tgacacaagg caattgacct acgcatgtat ctatctcatt ttcttacacc 1440
ttctattacc ttctgctctc tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt 1500
tccctgaaat tattccccta tttgactaat aagtatataa agacggtagg tattgattgt 1560
aattctgtaa atctatttct taaacttctt aaattctact tttatagtta gtcttttttt 1620
tagtttaaaa caccaagaac ttagtttcga ataaacacac ataaacaaac aaatctagaa 1680
tgaaacttat gaatccatct atgaaggcat acgttttctt tatcttaagc tacttctctt 1740
tactcgttag ctcagctgcg gtgccaacct ctgccgccgt acaagttgag tcatacaatt 1800
atgacggtac cactttttca ggtagaatat tcgtcaaaaa cattgcctac tcaaaggtcg 1860
taacagttat ctactccgat ggatcagata actggaacaa taacaacaac aaagtttctg 1920
cagcttactc agaagcaatt tctgggtcta actacgaata ctggacattc tccgcaaagt 1980
tatccggaat taaacagttt tatgtcaaat acgaagtttc tggttcaaca tattacgaca 2040
acaacggtac caaaaactac caagtccaag caacctcagc gacatctaca acagctactg 2100
caaccacaac tacagctact ggcacaacaa ctacttctac aggtccaact agtactgcat 2160
ccgtatcatt ccctaccggt aactcaacaa tttcttcctg gataaaaaat caagaggaaa 2220
tcagccgttt tgctatgttg agaaatatca atccacctgg gtctgccaca gggttcatag 2280
ccgcatctct gtccacagcc ggcccagatt actattactc ttggactaga gattcagcac 2340
taacagctaa tgtgatcgct tacgaataca acacaacatt cactggaaac accacccttc 2400
ttaagtactt gaaagattac gttacatttt ctgtcaaaag ccaatctgta tctaccgttt 2460
gtaactgtct gggagaacca aagttcaacg ctgatggtag ttcttttaca ggtccatggg 2520
gcagaccaca aaacgacgga ccagcagaga gagctgttac ttttatgttg attgctgaca 2580
gctacttgac tcaaactaag gacgcatcct acgttaccgg tacattaaag ccagcaatct 2640
tcaaagatct tgattacgta gtttctgttt ggtctaacgg ttgctacgat ttatgggaag 2700
aggttaatgg tgttcatttc tatactctca tggtcatgag aaagggtttg atcttaggtg 2760
ccgacttcgc tgctagaaat ggtgactcta gtagagcttc aacctacaag caaactgcat 2820
caacaatgga atcaaagatc agttcttttt ggtcagattc taacaactac gtccaagttt 2880
ctcaatcagt taccgccgga gtgtcaaaaa agggactaga tgttagtaca ctattggcgg 2940
ccaacattgg tagtctgcct gatggctttt tcactccagg ctccgaaaag atattggcta 3000
cagcagtggc gttagaaaat gcattcgcat ccttgtaccc aattaactct aacctacctt 3060
cttacttggg taactcaatt ggaagatatc ctgaggatac atacaacggt aatggcaact 3120
ctcaggggaa tccatggttc cttgccgtca acgcatacgc agaactttac tacagagcta 3180
ttaaggaatg gattagtaat ggcaaggtga cagtatccaa tatctcacta cctttcttca 3240
aaaagtttga ttcttccgcc acttctggaa agacatacac tgctggtaca tcagatttca 3300
ataacttggc tcagaacatt gctttaggcg ccgatagatt cctgtctact gttaagttcc 3360
acgcatacac taacgggagt ctatcagaag agtacgatag atctaccggt atgagtactg 3420
gggctcgtga tttaacatgg tcccatgctt cattgatcac agtggcgtac gcaaaggccg 3480
gtagtcctgc agcttagtta attaaacagg ccccttttcc tttgtcgata tcatgtaatt 3540
agttatgtca cgcttacatt cacgccctcc tcccacatcc gctctaaccg aaaaggaagg 3600
agttagacaa cctgaagtct aggtccctat ttattttttt atagttatgt tagtattaag 3660
aacgttattt atatttcaaa tttttctttt ttttctgtac aaacgcgtgt acgcatgtaa 3720
cgggcagacg gccggccata acttcgtata atgtatgcta tacgaagtta tggcaacggt 3780
tcatcatctc atggatctgc acatgaacaa acaccagagt caaacgacgt tgaaattgag 3840
gctactgcgc caattgatga caatacagac gatgataaca aaccgaagtt atctgatgta 3900
gaaaaggatt agagatgcta agagatagtg atgatatttc ataaataatg taattctata 3960
tatgttaatt accttttttg cgaggcatat ttatggtgaa ggataagttt tgaccatcaa 4020
agaaggttaa tgtggctgtg gtttcagggt ccataaagct tttcaattca tctttttttt 4080
ttttgttctt ttttttgatt ccggtttctt tgaaattttt ttgattcggt aatctccgag 4140
cagaaggaag aacgaaggaa ggagcacaga cttagattgg tatatatacg catatgtggt 4200
gttgaagaaa catgaaattg cccagtattc ttaacccaac tgcacagaac aaaaacctgc 4260
aggaaacgaa gataaatcat gtcgaaagct acatataagg aacgtgctgc tactcatcct 4320
agtcctgttg ctgccaagct atttaatatc atgcacgaaa agcaaacaaa cttgtgtgct 4380
tcattggatg ttcgtaccac caaggaatta ctggagttag ttgaagcatt aggtcccaaa 4440
atttgtttac taaaaacaca tgtggatatc ttgactgatt tttccatgga gggcacagtt 4500
aagccgctaa aggcattatc cgccaagtac aattttttac tcttcgaaga cagaaaattt 4560
gctgacattg gtaatacagt caaattgcag tactctgcgg gtgtatacag aatagcagaa 4620
tgggcagaca ttacgaatgc acacggtgtg gtgggcccag gtattgttag cggtttgaag 4680
caggcggcgg aagaagtaac aaaggaacct agaggccttt tgatgttagc agaattgtca 4740
tgcaagggct ccctagctac tggagaatat actaagggta ctgttgacat tgcgaagagc 4800
gacaaagatt ttgttatcgg ctttattgct caaagagaca tgggtggaag agatgaaggt 4860
tacgattggt tgattatgac acgc 4884
<210> 20
<211> 1790
<212> DNA
<213> 酿酒酵母
<400> 20
ggaagagctc ctactgcgcc aattgatgac aatacagacg atgataacaa accgaagtta 60
tctgatgtag aaaaggatta gagatgctaa gagatagtga tgatatttca taaataatgt 120
aattctatat atgttaatta ccttttttgc gaggcatatt tatggtgaag gataagtttt 180
gaccatcaaa gaaggttaat gtggctgtgg tttcagggtc cataaagctt ttcaattcat 240
cttttttttt ttgttctttt ttttgattcc ggtttctttg aaattttttt gattcggtaa 300
tctccgagca gaaggaagaa cgaaggaagg agcacagact tagattggta tatatacgca 360
tatgtggtgt tgaagaaaca tgaaattgcc cagtattctt aacccaactg cacagaacaa 420
aaacctgcag gaaacgaaga taaatcatgt cgaaagctac atataaggaa cgtgctgcta 480
ctcatcctag tcctgttgct gccaagctat ttaatatcat gcacgaaaag caaacaaact 540
tgtgtgcttc attggatgtt cgtaccacca aggaattact ggagttagtt gaagcattag 600
gtcccaaaat ttgtttacta aaaacacatg tggatatctt gactgatttt tccatggagg 660
gcacagttaa gccgctaaag gcattatccg ccaagtacaa ttttttactc ttcgaagaca 720
gaaaatttgc tgacattggt aatacagtca aattgcagta ctctgcgggt gtatacagaa 780
tagcagaatg ggcagacatt acgaatgcgc acggtgtggt gggcccaggt attgttagcg 840
gtttgaagca ggcggcggaa gaagtaacaa aggaacctag aggccttttg atgttagcag 900
aattgtcatg caagggctcc ctagctactg gagaatatac taagggtact gttgacattg 960
cgaagagcga caaagatttt gttatcggct ttattgctca aagagacatg ggtggaagag 1020
atgaaggtta cgattggttg attatgacac ccggtgtggg tttagatgac aagggagacg 1080
cattgggtca acagtataga gccgtggatg atgtggtctc tacaggatct gacattatta 1140
ttgttggaag aggactattt gcaaagggaa gggatgctaa ggtagagggt gaacgttaca 1200
gaaaagcagg ctgggaagca tatttgagaa gatgcggcca gcaaaactaa aaaactgtat 1260
tataagtaaa tgcatgtata ctaaactcac aaattagagc ttcaatttaa ttatatcagt 1320
tattacccgg gaatctcggt cgtaatgatt tttataatga cgaaaaaaaa aaattggaaa 1380
gaaaaagctt catggccttt ataaaaagga accatccaat acctcgccag aaccaagtaa 1440
cagtatttta cggggcacaa atcaagaaca ataagacagg actgtaaaga tggacgcatt 1500
gaactccaaa gaacaacaag agttccaaaa agtagtggaa caaaagcaaa tgaaggattt 1560
catgcgtttg ataacttcgt ataatgtatg ctatacgaag ttatgcggcc gccagcacgc 1620
agcacgctgt atttacgtat ttaattttat atatttgtgc atacactact agggaagact 1680
tgaaaaaaac ctaggaaatg aaaaaacgac acaggaagtc ccgtatttac tattttttcc 1740
ttccttttga tggggcaggg cggaaataga ggataggata agcctactgc 1790
<210> 21
<211> 4474
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 21
gtgtttgtta attatactgt cgctgtaata tcttctcttc cattatcacc ggtcattcct 60
tgcaggggcg gtagtacccg gagaccctga acttttcttt ttttttttgc gaaattaaaa 120
agttcatttt caattcgaca atgagatcta caagccattg ttttatgttg atgagagcca 180
gcttaaagag ttctcgagat ctcccgagtt tatcattatc aatactgcca tttcaaagaa 240
tacgtaaata attaatagta gtgattttcc taactttatt tagtcaaaaa attggccttt 300
taattctgct gtaacccgta catgcccaaa atagggggcg ggttacacag aatatataac 360
atcataggtg tctgggtgaa cagtttattc ctggcatcca ctaaatataa tggagcccgc 420
tttttttaag ctggcatcca gaaaaaaaaa gaatcccagc accaaaatat tgttttcttc 480
accaaccatc agttcatagg tccattctct tagcgcaact acacagaaca ggggcacaaa 540
caggcaaaaa acgggcacaa cctcaatgga gtgatgcaac ctgcttggag taaatgatga 600
cacaaggcaa ttgacctacg catgtatcta tctcattttc ttacaccttc tattaccttc 660
tgctctctct gatttggaaa aagctgaaaa aaaaggttga aaccagttcc ctgaaattat 720
tcccctattt gactaataag tatataaaga cggtaggtat tgattgtaat tctgtaaatc 780
tatttcttaa acttcttaaa ttctactttt atagttagtc ttttttttag tttaaaacac 840
caagaactta gtttcgaata aacacacata aacaaacaaa tctagaatga aacttatgaa 900
tccatctatg aaggcatacg ttttctttat cttaagctac ttctctttac tcgttagctc 960
agctgcggtg ccaacctctg ccgccgtaca agttgagtca tacaattatg acggtaccac 1020
tttttcaggt agaatattcg tcaaaaacat tgcctactca aaggtcgtaa cagttatcta 1080
ctccgatgga tcagataact ggaacaataa caacaacaaa gtttctgcag cttactcaga 1140
agcaatttct gggtctaact acgaatactg gacattctcc gcaaagttat ccggaattaa 1200
acagttttat gtcaaatacg aagtttctgg ttcaacatat tacgacaaca acggtaccaa 1260
aaactaccaa gtccaagcaa cctcagcgac atctacaaca gctactgcaa ccacaactac 1320
agctactggc acaacaacta cttctacagg tccaactagt actgcatccg tatcattccc 1380
taccggtaac tcaacaattt cttcctggat aaaaaatcaa gaggaaatca gccgttttgc 1440
tatgttgaga aatatcaatc cacctgggtc tgccacaggg ttcatagccg catctctgtc 1500
cacagccggc ccagattact attactcttg gactagagat tcagcactaa cagctaatgt 1560
gatcgcttac gaatacaaca caacattcac tggaaacacc acccttctta agtacttgaa 1620
agattacgtt acattttctg tcaaaagcca atctgtatct accgtttgta actgtctggg 1680
agaaccaaag ttcaacgctg atggtagttc ttttacaggt ccatggggca gaccacaaaa 1740
cgacggacca gcagagagag ctgttacttt tatgttgatt gctgacagct acttgactca 1800
aactaaggac gcatcctacg ttaccggtac attaaagcca gcaatcttca aagatcttga 1860
ttacgtagtt tctgtttggt ctaacggttg ctacgattta tgggaagagg ttaatggtgt 1920
tcatttctat actctcatgg tcatgagaaa gggtttgatc ttaggtgccg acttcgctgc 1980
tagaaatggt gactctagta gagcttcaac ctacaagcaa actgcatcaa caatggaatc 2040
aaagatcagt tctttttggt cagattctaa caactacgtc caagtttctc aatcagttac 2100
cgccggagtg tcaaaaaagg gactagatgt tagtacacta ttggcggcca acattggtag 2160
tctgcctgat ggctttttca ctccaggctc cgaaaagata ttggctacag cagtggcgtt 2220
agaaaatgca ttcgcatcct tgtacccaat taactctaac ctaccttctt acttgggtaa 2280
ctcaattgga agatatcctg aggatacata caacggtaat ggcaactctc aggggaatcc 2340
atggttcctt gccgtcaacg catacgcaga actttactac agagctatta aggaatggat 2400
tagtaatggc aaggtgacag tatccaatat ctcactacct ttcttcaaaa agtttgattc 2460
ttccgccact tctggaaaga catacactgc tggtacatca gatttcaata acttggctca 2520
gaacattgct ttaggcgccg atagattcct gtctactgtt aagttccacg catacactaa 2580
cgggagtcta tcagaagagt acgatagatc taccggtatg agtactgggg ctcgtgattt 2640
aacatggtcc catgcttcat tgatcacagt ggcgtacgca aaggccggta gtcctgcagc 2700
ttagttaatt aaacaggccc cttttccttt gtcgatatca tgtaattagt tatgtcacgc 2760
ttacattcac gccctcctcc cacatccgct ctaaccgaaa aggaaggagt tagacaacct 2820
gaagtctagg tccctattta tttttttata gttatgttag tattaagaac gttatttata 2880
tttcaaattt ttcttttttt tctgtacaaa cgcgtgtacg catgtaacgg gcagacggcc 2940
ggccataact tcgtataatg tatgctatac gaagttatcc ttacatcaca cccaatcccc 3000
cacaagtgat cccccacaca ccatagcttc aaaatgtttc tactcctttt ttactcttcc 3060
agattttctc ggactccgcg catcgccgta ccacttcaaa acacccaagc acagcatact 3120
aaatttcccc tctttcttcc tctagggtgg cgttaattac ccgtactaaa ggtttggaaa 3180
agaaaaaaga gaccgcctcg tttctttttc ttcgtcgaaa aaggcaataa aaatttttat 3240
cacgtttctt tttcttgaaa aatttttttt ttgatttttt tctctttcga tgacctccca 3300
ttgatattta agttaataaa tggtcttcaa tttctcaagt ttcagtttcg tttttcttgt 3360
tctattacaa ctttttttac ttcttgctca ttagaaagaa agcatagcaa tctaatctaa 3420
gttttaatta caaaatgcca caatcctggg aagaattggc cgccgacaaa cgtgcccgtt 3480
tggctaaaac cattcctgac gaatggaagg ttcaaacttt gcctgccgaa gattccgtta 3540
ttgatttccc aaagaagtcc ggtattttgt ctgaggctga attgaagatt accgaagcct 3600
ctgctgctga tttggtctcc aagttggccg ctggtgagtt gacttctgtt gaagtcactt 3660
tggctttttg taagagagct gctattgctc aacaattaac caactgtgct cacgaattct 3720
tcccagatgc tgctttagct caagctagag aattagatga atactacgct aagcataaga 3780
gaccagttgg tccattacac ggtttaccaa tctctttaaa ggaccaattg cgtgttaagg 3840
gttacgaaac ctccatgggt tacatttcct ggttaaacaa atacgatgaa ggtgattccg 3900
tcttaaccac catgttgaga aaagctggtg ctgttttcta cgttaagacc tctgtcccac 3960
aaaccttgat ggtctgtgaa accgtcaaca acatcattgg tagaactgtc aatccaagaa 4020
acaaaaattg gtcctgtggt ggttcttctg gtggtgaagg tgctattgtt ggtattagag 4080
gtggtgttat tggtgtcggt actgacattg gtggttccat tagagtccca gctgctttca 4140
actttttata cggtttgaga ccatctcacg gtagattgcc atatgctaaa atggctaact 4200
ctatggaagg tcaagaaacc gttcactccg tcgttggtcc tatcactcac tccgtcgaag 4260
acttgagatt gttcaccaaa tctgtcttgg gtcaagaacc ttggaagtac gactctaagg 4320
tcatccccat gccatggaga caatctgaat ctgacatcat tgcctctaag attaagaatg 4380
gtggtttgaa cattggttat tacaatttcg acggtaacgt cttgccacac ccaccaattt 4440
tacgtggtgt cgaaactacc gttgccgctt tggc 4474
<210> 22
<211> 1878
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 22
gaagattacc gaagcctctg ctgctgattt ggtctccaag ttggccgctg gtgagttgac 60
ttctgttgaa gtcactttgg ctttttgtaa gagagctgct attgctcaac aattaaccaa 120
ctgtgctcac gaattcttcc cagatgctgc tttagctcaa gctagagaat tagatgaata 180
ctacgctaag cataagagac cagttggtcc attacacggt ttaccaatct ctttaaagga 240
ccaattgcgt gttaagggtt acgaaacctc catgggttac atttcctggt taaacaaata 300
cgatgaaggt gattccgtct taaccaccat gttgagaaaa gctggtgctg ttttctacgt 360
taagacctct gtcccacaaa ccttgatggt ctgtgaaacc gtcaacaaca tcattggtag 420
aactgtcaat ccaagaaaca aaaattggtc ctgtggtggt tcttctggtg gtgaaggtgc 480
tattgttggt attagaggtg gtgttattgg tgtcggtact gacattggtg gttccattag 540
agtcccagct gctttcaact ttttatacgg tttgagacca tctcacggta gattgccata 600
tgctaaaatg gctaactcta tggaaggtca agaaaccgtt cactccgtcg ttggtcctat 660
cactcactcc gtcgaagact tgagattgtt caccaaatct gtcttgggtc aagaaccttg 720
gaagtacgac tctaaggtca tcccaatgcc atggagacaa tctgaatctg acatcattgc 780
ctctaagatt aagaatggtg gtttgaacat tggttattac aatttcgacg gtaacgtctt 840
gccacaccca ccaattttac gtggtgtcga aactaccgtt gccgctttgg ccaaggctgg 900
tcacaccgtt actccatgga ctccatacaa gcatgatttc ggtcatgact tgatttccca 960
catctatgct gctgatggtt ctgccgacgt catgagagac atttctgcct ctggtgagcc 1020
agccatccct aacattaagg acttgttgaa cccaaatatt aaggctgtta acatgaacga 1080
attgtgggac actcatttac aaaagtggaa ctatcaaatg gaatacttgg aaaagtggcg 1140
tgaagctgaa gaaaaagctg gtaaggaatt ggacgctatt atcgctccaa ttactcctac 1200
cgccgctgtc agacacgatc aattcagata ctacggttac gcctccgtta ttaacttatt 1260
ggatttcacc tctgttgtcg tcccagtcac tttcgctgat aagaatattg ataagaagaa 1320
cgaatctttt aaagctgttt ccgaattgga tgctttggtt caagaagaat acgacccaga 1380
ggcttatcac ggtgctcctg ttgctgttca agttattggt agaagattgt ccgaagagag 1440
aactttggct atcgccgaag aagtcggtaa attgttgggt aacgtcgtca ctccataagg 1500
agattgataa gacttttcta gttgcatatc ttttatattt aaatcttatc tattagttaa 1560
ttttttgtaa tttatcctta tatatagtct ggttattcta aaatatcatt tcagtatcta 1620
aaaattcccc tcttttttca gttatatctt aacaggcgat aacttcgtat aatgtatgct 1680
atacgaagtt atgcggccgc cagcacgcag cacgctgtat ttacgtattt aattttatat 1740
atttgtgcat acactactag ggaagacttg aaaaaaacct aggaaatgaa aaaacgacac 1800
aggaagtccc gtatttacta ttttttcctt ccttttgatg gggcagggcg gaaatagagg 1860
ataggataag cctactgc 1878
<210> 23
<211> 3921
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 23
gcccgaaaga gttatcgtta ctccgattat tttgtacagc tgatgggacc ttgccgtctt 60
catttttttt tttttcacct atagagccgg gcagagctgc ccggctcaac taagggccgg 120
aaaaaaaacg gaaaaaagaa agccaagcgt gtagacgtag tataacagta tatctgacac 180
gcacgtgatg accacgtaat cgcatcgccc ctcacatctc acctctcacc gctgactcag 240
cttcactaaa aaggaaaata tatactcttt cccaggcaag gtgacagcgg tccccgtctc 300
ctccacaaag gcctctcctg gggtttgagc aagtctaagt ttacgtagca taaaaattct 360
cggattgcgt caaataataa aaaaagtaac tccacttcta cttctacatc ggaaaaacat 420
tccattcaca tatcgtcttt ggcctatctt gttttgtcct tggtagatca ggtcagtaca 480
aacgcaacac gctcgaggcc agaaaaagga agtgtttccc tccttcttga attgatgtta 540
ccctcataaa gcacgtggcc tcttatcgag aaagaaatta ccgtcgctcg tgatttgttt 600
gcaaaaagaa caaaactgaa aaaacccaga cacgctcgac ttcctgtctt cctattgatt 660
gcagcttcca atttcgtcac acaacaaggt cctagcgacg gctcacaggt tttgtaacaa 720
gcaatcgaag gttctggaat ggcgggaaag ggtttagtac cacatgctat gatgcccact 780
gtgatctcca gagcaaagtt cgttcgatcg tactgttact ctctctcttt caaacagaat 840
tgtccgaatc gtgtgacaac aacagcctgt tctcacacac tcttttcttc taaccaaggg 900
ggtggtttag tttagtagaa cctcgtgaaa cttacattta catatatata aacttgcata 960
aattggtcaa tgcaagaaat acatatttgg tcttttctaa ttcgtagttt ttcaagttct 1020
tagatgcttt ctttttctct tttttacaga tcatcaagga agtaattatc tactttttac 1080
aagtctagaa tgacaacatc aaatacctac aaattctatc taaacggtga atggagagaa 1140
tcttcctctg gagaaactat tgagatacca tcaccatact tacatgaagt gatcggacag 1200
gttcaagcaa tcactagagg agaggttgac gaagcgattg ctagcgctaa ggaagcacag 1260
aaatcttggg ctgaggcatc tctacaagat agagctaagt acttgtacaa atgggcagat 1320
gaattggtaa acatgcaaga cgaaatcgcc gatatcatca tgaaggaagt gggcaagggt 1380
tacaaagacg ctaaaaagga ggttgttaga accgccgatt tcatcagata caccattgaa 1440
gaggcactcc atatgcacgg tgaatccatg atgggcgatt catttcctgg tggaacaaaa 1500
tctaagctag caataatcca aagagcgcct ctgggtgtag tcttagccat cgctccattc 1560
aattaccctg taaacctttc tgctgcaaaa ttggcaccag ccttaattat gggtaacgct 1620
gtgatattca agccagcaac tcagggtgct atttccggca tcaaaatggt tgaagctttg 1680
cataaggctg gtttgccaaa gggtttggtt aacgttgcca caggtagagg tagcgtcata 1740
ggcgattatt tggtcgaaca cgaagggata aacatggttt ccttcaccgg tggcactaac 1800
actggtaagc atttagcaaa aaaggcctca atgattccat tagtcttgga acttggtggc 1860
aaagatccag gcatcgttcg tgaagatgca gacctacaag atgctgcgaa tcatatcgta 1920
tctggtgcgt tcagttactc agggcagaga tgtacagcca ttaagagagt ccttgttcat 1980
gaaaatgttg ctgatgaact ggtatcattg gttaaggaac aagtggcaaa gctttctgtg 2040
ggatcaccag agcaagattc aacaattgtt cctctgattg acgataagtc cgctgatttt 2100
gttcagggtt tagtggacga tgcagtcgaa aagggcgcta caattgtcat tgggaacaag 2160
agagaacgta acctaatcta cccaacattg attgatcacg tcacagagga aatgaaagtt 2220
gcctgggagg aaccattcgg tcctattctt ccaattatta gagttagtag cgacgagcaa 2280
gctattgaaa ttgcaaataa gagtgagttc ggattacaag cttctgtgtt taccaaagac 2340
ataaacaagg cattcgcaat cgcaaataag attgagactg gttcagtgca aatcaacggt 2400
agaacagaga gaggaccaga tcactttcct tttatcgggg ttaagggatc tgggatgggt 2460
gcccaaggca tcagaaagtc tttggaatct atgactagag aaaaagttac tgtcttaaat 2520
ctcgtatgat taaacaggcc ccttttcctt tgtcgatatc atgtaattag ttatgtcacg 2580
cttacattca cgccctcctc ccacatccgc tctaaccgaa aaggaaggag ttagacaacc 2640
tgaagtctag gtccctattt atttttttat agttatgtta gtattaagaa cgttatttat 2700
atttcaaatt tttctttttt ttctgtacaa acgcgtgtac gcatgtaacg ggcagacggc 2760
cggccataac ttcgtataat gtatgctata cgaagttatg gcaacggttc atcatctcat 2820
ggatctgcac atgaacaaac accagagtca aacgacgttg aaattgaggc tactgcgcca 2880
attgatgaca atacagacga tgataacaaa ccgaagttat ctgatgtaga aaaggattag 2940
agatgctaag agatagtgat gatatttcat aaataatgta attctatata tgttaattac 3000
cttttttgcg aggcatattt atggtgaagg ataagttttg accatcaaag aaggttaatg 3060
tggctgtggt ttcagggtcc ataaagcttt tcaattcatc tttttttttt ttgttctttt 3120
ttttgattcc ggtttctttg aaattttttt gattcggtaa tctccgagca gaaggaagaa 3180
cgaaggaagg agcacagact tagattggta tatatacgca tatgtggtgt tgaagaaaca 3240
tgaaattgcc cagtattctt aacccaactg cacagaacaa aaacctgcag gaaacgaaga 3300
taaatcatgt cgaaagctac atataaggaa cgtgctgcta ctcatcctag tcctgttgct 3360
gccaagctat ttaatatcat gcacgaaaag caaacaaact tgtgtgcttc attggatgtt 3420
cgtaccacca aggaattact ggagttagtt gaagcattag gtcccaaaat ttgtttacta 3480
aaaacacatg tggatatctt gactgatttt tccatggagg gcacagttaa gccgctaaag 3540
gcattatccg ccaagtacaa ttttttactc ttcgaagaca gaaaatttgc tgacattggt 3600
aatacagtca aattgcagta ctctgcgggt gtatacagaa tagcagaatg ggcagacatt 3660
acgaatgcac acggtgtggt gggcccaggt attgttagcg gtttgaagca ggcggcggaa 3720
gaagtaacaa aggaacctag aggccttttg atgttagcag aattgtcatg caagggctcc 3780
ctagctactg gagaatatac taagggtact gttgacattg cgaagagcga caaagatttt 3840
gttatcggct ttattgctca aagagacatg ggtggaagag atgaaggtta cgattggttg 3900
attatgacac gcggccgcgg c 3921
<210> 24
<211> 1130
<212> DNA
<213> 酿酒酵母
<400> 24
gctccatgga gggcacagtt aagccgctaa aggcattatc cgccaagtac aattttttac 60
tcttcgaaga cagaaaattt gctgacattg gtaatacagt caaattgcag tactctgcgg 120
gtgtatacag aatagcagaa tgggcagaca ttacgaatgc acacggtgtg gtgggcccag 180
gtattgttag cggtttgaag caggcggcgg aagaagtaac aaaggaacct agaggccttt 240
tgatgttagc agaattgtca tgcaagggct ccctagctac tggagaatat actaagggta 300
ctgttgacat tgcgaagagc gacaaagatt ttgttatcgg ctttattgct caaagagaca 360
tgggtggaag agatgaaggt tacgattggt tgattatgac acccggtgtg ggtttagatg 420
acaagggaga cgcattgggt caacagtata gaaccgtgga tgatgtggtc tctacaggat 480
ctgacattat tattgttgga agaggactat ttgcaaaggg aagggatgct aaggtagagg 540
gtgaacgtta cagaaaagca ggctgggaag catatttgag aagatgcggc cagcaaaact 600
aaaaaactgt attataagta aatgcatgta tactaaactc acaaattaga gcttcaattt 660
aattatatca gttattaccc gggaatctcg gtcgtaatga tttttataat gacgaaaaaa 720
aaaaaattgg aaagaaaaag cttcatggcc tttataaaaa ggaaccatcc aatacctcgc 780
cagaaccaag taacagtatt ttacggggca caaatcaaga acaataagac aggactgtaa 840
agatggacgc attgaactcc aaagaacaac aagagttcca aaaagtagtg gaacaaaagc 900
aaatgaagga tttcatgcgt ttgataactt cgtataatgt atgctatacg aagttatctc 960
gaggtacttt agaatatcta tattcaagta cgtggcgcgc atatgtttga gtgtgcacac 1020
aataaaggtt tttagatatt ttgcggcgtc ctaagaaaat aaggggtttc tagaaaaata 1080
acaatagcaa acaaagttcc ttacgatgat ttcagatgtg aacagcatgg 1130
<210> 25
<211> 4306
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 25
gcccgaaaga gttatcgtta ctccgattat tttgtacagc tgatgggacc ttgccgtctt 60
catttttttt tttttcacct atagagccgg gcagagctgc ccggctcaac taagggccgg 120
aaaaaaaacg gaaaaaagaa agccaagcgt gtagacgtag tataacagta tatctgacac 180
gcacgtgatg accacgtaat cgcatcgccc ctcacatctc acctctcacc gctgactcag 240
cttcactaaa aaggaaaata tatactcttt cccaggcaag gtgacagcgg tccccgtctc 300
ctccacaaag gcctctcctg gggtttgagc aagtctaagt ttacgtagca taaaaattct 360
cggattgcgt caaataataa aaaaagtaac tccacttcta cttctacatc ggaaaaacat 420
tccattcaca tatcgtcttt ggcctatctt gttttgtcct tggtagatca ggtcagtaca 480
aacgcaacac gcctcgaggc cagaaaaagg aagtgtttcc ctccttcttg aattgatgtt 540
accctcataa agcacgtggc ctcttatcga gaaagaaatt accgtcgctc gtgatttgtt 600
tgcaaaaaga acaaaactga aaaaacccag acacgctcga cttcctgtct tcctattgat 660
tgcagcttcc aatttcgtca cacaacaagg tcctagcgac ggctcacagg ttttgtaaca 720
agcaatcgaa ggttctggaa tggcgggaaa gggtttagta ccacatgcta tgatgcccac 780
tgtgatctcc agagcaaagt tcgttcgatc gtactgttac tctctctctt tcaaacagaa 840
ttgtccgaat cgtgtgacaa caacagcctg ttctcacaca ctcttttctt ctaaccaagg 900
gggtggttta gtttagtaga acctcgtgaa acttacattt acatatatat aaacttgcat 960
aaattggtca atgcaagaaa tacatatttg gtcttttcta attcgtagtt tttcaagttc 1020
ttagatgctt tctttttctc ttttttacag atcatcaagg aagtaattat ctacttttta 1080
caagtctaga atgacaacat caaataccta caaattctat ctaaacggtg aatggagaga 1140
atcttcctct ggagaaacta ttgagatacc atcaccatac ttacatgaag tgatcggaca 1200
ggttcaagca atcactagag gagaggttga cgaagcgatt gctagcgcta aggaagcaca 1260
gaaatcttgg gctgaggcat ctctacaaga tagagctaag tacttgtaca aatgggcaga 1320
tgaattggta aacatgcaag acgaaatcgc cgatatcatc atgaaggaag tgggcaaggg 1380
ttacaaagac gctaaaaagg aggttgttag aaccgccgat ttcatcagat acaccattga 1440
agaggcactc catatgcacg gtgaatccat gatgggcgat tcatttcctg gtggaacaaa 1500
atctaagcta gcaataatcc aaagagcgcc tctgggtgta gtcttagcca tcgctccatt 1560
caattaccct gtaaaccttt ctgctgcaaa attggcacca gccttaatta tgggtaacgc 1620
tgtgatattc aagccagcaa ctcagggtgc tatttccggc atcaaaatgg ttgaagcttt 1680
gcataaggct ggtttgccaa agggtttggt taacgttgcc acaggtagag gtagcgtcat 1740
aggcgattat ttggtcgaac acgaagggat aaacatggtt tccttcaccg gtggcactaa 1800
cactggtaag catttagcaa aaaaggcctc aatgattcca ttagtcttgg aacttggtgg 1860
caaagatcca ggcatcgttc gtgaagatgc agacctacaa gatgctgcga atcatatcgt 1920
atctggtgcg ttcagttact cagggcagag atgtacagcc attaagagag tccttgttca 1980
tgaaaatgtt gctgatgaac tggtatcatt ggttaaggaa caagtggcaa agctttctgt 2040
gggatcacca gagcaagatt caacaattgt tcctctgatt gacgataagt ccgctgattt 2100
tgttcagggt ttagtggacg atgcagtcga aaagggcgct acaattgtca ttgggaacaa 2160
gagagaacgt aacctaatct acccaacatt gattgatcac gtcacagagg aaatgaaagt 2220
tgcctgggag gaaccattcg gtcctattct tccaattatt agagttagta gcgacgagca 2280
agctattgaa attgcaaata agagtgagtt cggattacaa gcttctgtgt ttaccaaaga 2340
cataaacaag gcattcgcaa tcgcaaataa gattgagact ggttcagtgc aaatcaacgg 2400
tagaacagag agaggaccag atcactttcc ttttatcggg gttaagggat ctgggatggg 2460
tgcccaaggc atcagaaagt ctttggaatc tatgactaga gaaaaagtta ctgtcttaaa 2520
tctcgtatga ttaaacaggc cccttttcct ttgtcgatat catgtaatta gttatgtcac 2580
gcttacattc acgccctcct cccacatccg ctctaaccga aaaggaagga gttagacaac 2640
ctgaagtcta ggtccctatt tattttttta tagttatgtt agtattaaga acgttattta 2700
tatttcaaat ttttcttttt tttctgtaca aacgcgtgta cgcatgtaac gggcagacgg 2760
ccggccataa cttcgtataa tgtatgctat acgaagttat ccttacatca cacccaatcc 2820
cccacaagtg atcccccaca caccatagct tcaaaatgtt tctactcctt ttttactctt 2880
ccagattttc tcggactccg cgcatcgccg taccacttca aaacacccaa gcacagcata 2940
ctaaatttcc cctctttctt cctctagggt ggcgttaatt acccgtacta aaggtttgga 3000
aaagaaaaaa gagaccgcct cgtttctttt tcttcgtcga aaaaggcaat aaaaattttt 3060
atcacgtttc tttttcttga aaaatttttt ttttgatttt tttctctttc gatgacctcc 3120
cattgatatt taagttaata aatggtcttc aatttctcaa gtttcagttt cgtttttctt 3180
gttctattac aacttttttt acttcttgct cattagaaag aaagcatagc aatctaatct 3240
aagttttaat tacaaaatgc cacaatcctg ggaagaattg gccgccgaca aacgtgcccg 3300
tttggctaaa accattcctg acgaatggaa ggttcaaact ttgcctgccg aagattccgt 3360
tattgatttc ccaaagaagt ccggtatttt gtctgaggct gaattgaaga ttaccgaagc 3420
ctctgctgct gatttggtct ccaagttggc cgctggtgag ttgacttctg ttgaagtcac 3480
tttggctttt tgtaagagag ctgctattgc tcaacaatta accaactgtg ctcacgaatt 3540
cttcccagat gctgctttag ctcaagctag agaattagat gaatactacg ctaagcataa 3600
gagaccagtt ggtccattac acggtttacc aatctcttta aaggaccaat tgcgtgttaa 3660
gggttacgaa acctccatgg gttacatttc ctggttaaac aaatacgatg aaggtgattc 3720
cgtcttaacc accatgttga gaaaagctgg tgctgttttc tacgttaaga cctctgtccc 3780
acaaaccttg atggtctgtg aaaccgtcaa caacatcatt ggtagaactg tcaatccaag 3840
aaacaaaaat tggtcctgtg gtggttcttc tggtggtgaa ggtgctattg ttggtattag 3900
aggtggtgtt attggtgtcg gtactgacat tggtggttcc attagagtcc cagctgcttt 3960
caacttttta tacggtttga gaccatctca cggtagattg ccatatgcta aaatggctaa 4020
ctctatggaa ggtcaagaaa ccgttcactc cgtcgttggt cctatcactc actccgtcga 4080
agacttgaga ttgttcacca aatctgtctt gggtcaagaa ccttggaagt acgactctaa 4140
ggtcatcccc atgccatgga gacaatctga atctgacatc attgcctcta agattaagaa 4200
tggtggtttg aacattggtt attacaattt cgacggtaac gtcttgccac acccaccaat 4260
tttacgtggt gtcgaaacta ccgttgccgc tttggcggcc gcggca 4306
<210> 26
<211> 1366
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 26
agaggtggtg ttattggtgt cggtactgac attggtggtt ccattagagt cccagctgct 60
ttcaactttt tatacggttt gagaccatct cacggtagat tgccatatgc taaaatggct 120
aactctatgg aaggtcaaga aaccgttcac tccgtcgttg gtcctatcac tcactccgtc 180
gaagacttga gattgttcac caaatctgtc ttgggtcaag aaccttggaa gtacgactct 240
aaggtcatcc ccatgccatg gagacaatct gaatctgaca tcattgcctc taagattaag 300
aatggtggtt tgaacattgg ttattacaat ttcgacggta acgtcttgcc acacccacca 360
attttacgtg gtgtcgaaac taccgttgcc gctttggcca aggctggtca caccgttact 420
ccatggactc catacaagca tgatttctgt catgacttga tttcccacat ctatgctgct 480
gatggttctg ccgacgtcat gagagacatt tctgcctctg gtgagccagc catccctaac 540
attaaggact tgttgaaccc aaatattaag gctgttaaca tgaacgaatt gtgggacact 600
catttacaaa agtggaacta tcaaatggaa tacttggaaa agtggcgtga agctgaagaa 660
aaagctggta aggaattgga cgctattatc gctccaatta ctcctaccgt cgctgtcaga 720
cacgatcaat tcagatacta cggttacgcc tccgttatta gcttattgga tttcacctct 780
gttgtcgtcc cagtcacttt cgctgataag aatattgata agaagaacga atcttttaaa 840
gctgtttccg aattggatgc tttggttcaa gaagaatacg acccagaggc ttatcacggt 900
gctcctgttg ctgttcaagt tattggtaga agattgtccg aagagagaac tttggctatc 960
gccgaagaag tcggtaaatt gttgggtaac gtcgtcactc cataaggaga ttgataagac 1020
ttttctagtt gcatatcttt tatatttaaa tcttatctat tagttaattt tttgtaattt 1080
atccttatat atagtctggt tattctaaaa tatcatttca gtatctaaaa attcccctct 1140
tttttcagtt atatcttaac aggcgataac ttcgtataat gtatgctata cgaagttatg 1200
tactttagaa tatctatatt caagtacgtg gcgcgcatat gtttgagtgt gcacacaata 1260
aaggttttta gatattttgc ggcgtcctaa gaaaataagg ggtttctaga aaaataacaa 1320
tagcaaacaa agttccttac gatgatttca gatgtgaaca gcatgg 1366
<210> 27
<211> 2447
<212> DNA
<213> 酿酒酵母
<400> 27
ctatggaata atacaatgca cacaaacaaa aggtaacatt tgaaaaatgg agtagagaat 60
atattccatt cccctaattt tttgcgggtc ttccagggct gcgaacccat cgctcaaaac 120
aagcgcagtg tcaattaaga catcattgaa ctaaaacgga aaatttgctt gcgccacaca 180
ccctggtcaa tcgtaccaag ggatatcact ctgtacgggt gggaggaagg cgcggcaatt 240
agaatgtgtg ggtgcggaag ctcgccgctc ccatcaagag agtggaagac gtatggtctg 300
ggtgcgaagt accaccacgt ttctttttca tctcttaagt gggattctta cgaaacacgt 360
cacagggtca aaagaaagag aacaaaagca atattgtaat tgtctcagtc cacggcaatg 420
acatggcatg gccccgaagg ctttttttgt ctgtcttcct tgggtcttac cccgccacgc 480
gttaatagtg agacaagcaa taacttcgta tagcatacat tatacgaagt tatcggagac 540
aatcatatgg gagaagcaat tggaagatag aaaaaaggta ctcggtacat aaatatatgt 600
aattctgggt agaagatcgg tctgcattgg atggtggtaa cgcatttttt tacacacatt 660
acttgcctcg agcatcaaat ggtggttatt cgtggatcta tatcacgtga tttgcttaag 720
aattgtcgtt catggtgaca cttttagctt tgacatgatt aagctcatct caattgatgt 780
tatctaaagt catttcaact atctaagatg tggttgtgat tgggccattt tgtgaaagcc 840
agtacgccag cgtcaataca ctcccgtcaa ttagttgcac catgtccaca aaatcatata 900
ccagtagagc tgagactcat gcaagtccgg ttgcatcgaa acttttacgt ttaatggatg 960
aaaagaagac caatttgtgt gcttctcttg acgttcgttc gactgatgag ctattgaaac 1020
tagttgaaac gttgggtcca tacatttgcc ttttgaaaac acacgttgat atcttggatg 1080
atttcagtta tgagggtact gtcgttccat tgaaagcatt ggcagagaaa tacaagttct 1140
tgatatttga ggacagaaaa ttcgccgata tcggtaacac agtcaaatta caatatacat 1200
cgggcgttta ccgtatcgca gaatggtctg atatcaccaa cgcccacggg gttactggtg 1260
ctggtattgt tgctggcttg aaacaaggtg cgcaagaggt caccaaagaa ccaaggggat 1320
tattgatgct tgctgaattg tcttccaagg gttctctagc acacggtgaa tatactaagg 1380
gtaccgttga tattgcaaag agtgataaag atttcgttat tgggttcatt gctcagaacg 1440
atatgggagg cagagaagaa gggtttgatt ggctaatcat gaccccaggt gtaggtttag 1500
acgacaaagg cgatgcattg ggtcagcagt acagaaccgt cgacgaagtt gtaagtggtg 1560
gatcagatat catcattgtt ggcagaggac ttttcgccaa gggtagagat cctaaggttg 1620
aaggtgaaag atacagaaat gctggatggg aagcgtacca aaagagaatc agcgctcccc 1680
attaattata caggaaactt aatagaacaa atcacatatt taatctaata gccacctgca 1740
ttggcacggt gcaacactac ttcaacttca tcctacaaaa agatcacgtg atctgttgta 1800
ttgaactgaa aattttttgt ttgcttctct ctctctcttt cattatgtga gatttaaaaa 1860
ccagaaacta catcatcgaa aaagaataac ttcgtatagc atacattata cgaagttata 1920
ctggccgtcg ttttacaacc ggccgctact agtaacaaaa aacccctagc cccccgtttc 1980
gacgagaagt tagagtaatt ataaaaggaa tgcttattta aatttatttc ttagacttct 2040
tttcagactt cttagcagcc tcagtttgtt ccttaacgac cttcttaaca atcttttgtt 2100
cttcaatcaa gaaagctctg acgattcttt ccttgacaca gttggcacat ctggaaccac 2160
cgtaagctct ggaaacagtc ttgtgggtct tggagacagt agcgtattgt cttggtctca 2220
aagtggaaat accttgtaga gcactaccac agtcaccaca ctttggtcta gtagccaact 2280
tcttaacgtg ttgggcacgc aagataccac ctggggtctt aacaaccttg attttgttag 2340
aacgggtgtt gtctgtacgt agtaaagaga aaattttccc attaatgtta gtaatcactt 2400
ctttattatc ctatgattta agaacttgag tgggattgct ccatatg 2447
<210> 28
<211> 4158
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 28
tgagctccgg gtgggaggaa ggcgcggcaa ttagaatgtg tgggtgcgga agctcgccgc 60
tcccatcaag agagtggaag acgtatggtc tgggtgcgaa gtaccaccac gtttcttttt 120
catctcttaa gtgggattct tacgaaacac gtcacagggt caaaagaaag agaacaaaag 180
caatattgta attgtctcag tccacggcaa tgacatggca tggccccgaa ggcttttttt 240
gtctgtcttc cttgggtctt accccgccac gcgttaatag tgagacaagc aggaaatccg 300
tatcattttc tcgcatacac gaacccgcgt gcgcctggta aattgcagga ttctcattgt 360
ccggttttct ttatgggaat aatcatcatc accattatca ctgttactct tgcgatcatc 420
atcattaaca taattttttt aacgctgttt gatgatggta tgtgctttta ttgttcctta 480
ctcacctttt cctttgtgtc ttttaatttt gaccattttg accattttga cctttgatga 540
tgtgtgagtt cctcttttct ttttttcttt tcttttttcc tttttttttc ttttcttact 600
gtgttaatca ctttctttcc tttttgttca tattgtcgtc ttgttcattt tcgttcaatt 660
gataatgtat ataaatcttt cgtaagtatc tcttgattgc catttttttc tttccaagtt 720
tccttgttct cgaggccaga aaaaggaagt gtttccctcc ttcttgaatt gatgttaccc 780
tcataaagca cgtggcctct tatcgagaaa gaaattaccg tcgctcgtga tttgtttgca 840
aaaagaacaa aactgaaaaa acccagacac gctcgacttc ctgtcttcct attgattgca 900
gcttccaatt tcgtcacaca acaaggtcct agcgacggct cacaggtttt gtaacaagca 960
atcgaaggtt ctggaatggc gggaaagggt ttagtaccac atgctatgat gcccactgtg 1020
atctccagag caaagttcgt tcgatcgtac tgttactctc tctctttcaa acagaattgt 1080
ccgaatcgtg tgacaacaac agcctgttct cacacactct tttcttctaa ccaagggggt 1140
ggtttagttt agtagaacct cgtgaaactt acatttacat atatataaac ttgcataaat 1200
tggtcaatgc aagaaataca tatttggtct tttctaattc gtagtttttc aagttcttag 1260
atgctttctt tttctctttt ttacagatca tcaaggaagt aattatctac tttttacaag 1320
tctagaatga caacatcaaa tacctacaaa ttctatctaa acggtgaatg gagagaatct 1380
tcctctggag aaactattga gataccatca ccatacttac atgaagtgat cggacaggtt 1440
caagcaatca ctagaggaga ggttgacgaa gcgattgcta gcgctaagga agcacagaaa 1500
tcttgggctg aggcatctct acaagataga gctaagtact tgtacaaatg ggcagatgaa 1560
ttggtaaaca tgcaagacga aatcgccgat atcatcatga aggaagtggg caagggttac 1620
aaagacgcta aaaaggaggt tgttagaacc gccgatttca tcagatacac cattgaagag 1680
gcactccata tgcacggtga atccatgatg ggcgattcat ttcctggtgg aacaaaatct 1740
aagctagcaa taatccaaag agcgcctctg ggtgtagtct tagccatcgc tccattcaat 1800
taccctgtaa acctttctgc tgcaaaattg gcaccagcct taattatggg taacgctgtg 1860
atattcaagc cagcaactca gggtgctatt tccggcatca aaatggttga agctttgcat 1920
aaggctggtt tgccaaaggg tttggttaac gttgccacag gtagaggtag cgtcataggc 1980
gattatttgg tcgaacacga agggataaac atggtttcct tcaccggtgg cactaacact 2040
ggtaagcatt tagcaaaaaa ggcctcaatg attccattag tcttggaact tggtggcaaa 2100
gatccaggca tcgttcgtga agatgcagac ctacaagatg ctgcgaatca tatcgtatct 2160
ggtgcgttca gttactcagg gcagagatgt acagccatta agagagtcct tgttcatgaa 2220
aatgttgctg atgaactggt atcattggtt aaggaacaag tggcaaagct ttctgtggga 2280
tcaccagagc aagattcaac aattgttcct ctgattgacg ataagtccgc tgattttgtt 2340
cagggtttag tggacgatgc agtcgaaaag ggcgctacaa ttgtcattgg gaacaagaga 2400
gaacgtaacc taatctaccc aacattgatt gatcacgtca cagaggaaat gaaagttgcc 2460
tgggaggaac cattcggtcc tattcttcca attattagag ttagtagcga cgagcaagct 2520
attgaaattg caaataagag tgagttcgga ttacaagctt ctgtgtttac caaagacata 2580
aacaaggcat tcgcaatcgc aaataagatt gagactggtt cagtgcaaat caacggtaga 2640
acagagagag gaccagatca ctttcctttt atcggggtta agggatctgg gatgggtgcc 2700
caaggcatca gaaagtcttt ggaatctatg actagagaaa aagttactgt cttaaatctc 2760
gtatgattaa acaggcccct tttcctttgt cgatatcatg taattagtta tgtcacgctt 2820
acattcacgc cctcctccca catccgctct aaccgaaaag gaaggagtta gacaacctga 2880
agtctaggtc cctatttatt tttttatagt tatgttagta ttaagaacgt tatttatatt 2940
tcaaattttt cttttttttc tgtacaaacg cgtgtacgca tgtaacgggc agacggccgg 3000
ccataacttc gtataatgta tgctatacga agttatggca acggttcatc atctcatgga 3060
tctgcacatg aacaaacacc agagtcaaac gacgttgaaa ttgaggctac tgcgccaatt 3120
gatgacaata cagacgatga taacaaaccg aagttatctg atgtagaaaa ggattagaga 3180
tgctaagaga tagtgatgat atttcataaa taatgtaatt ctatatatgt taattacctt 3240
ttttgcgagg catatttatg gtgaaggata agttttgacc atcaaagaag gttaatgtgg 3300
ctgtggtttc agggtccata aagcttttca attcatcttt tttttttttg ttcttttttt 3360
tgattccggt ttctttgaaa tttttttgat tcggtaatct ccgagcagaa ggaagaacga 3420
aggaaggagc acagacttag attggtatat atacgcatat gtggtgttga agaaacatga 3480
aattgcccag tattcttaac ccaactgcac agaacaaaaa cctgcaggaa acgaagataa 3540
atcatgtcga aagctacata taaggaacgt gctgctactc atcctagtcc tgttgctgcc 3600
aagctattta atatcatgca cgaaaagcaa acaaacttgt gtgcttcatt ggatgttcgt 3660
accaccaagg aattactgga gttagttgaa gcattaggtc ccaaaatttg tttactaaaa 3720
acacatgtgg atatcttgac tgatttttcc atggagggca cagttaagcc gctaaaggca 3780
ttatccgcca agtacaattt tttactcttc gaagacagaa aatttgctga cattggtaat 3840
acagtcaaat tgcagtactc tgcgggtgta tacagaatag cagaatgggc agacattacg 3900
aatgcacacg gtgtggtggg cccaggtatt gttagcggtt tgaagcaggc ggcggaagaa 3960
gtaacaaagg aacctagagg ccttttgatg ttagcagaat tgtcatgcaa gggctcccta 4020
gctactggag aatatactaa gggtactgtt gacattgcga agagcgacaa agattttgtt 4080
atcggcttta ttgctcaaag agacatgggt ggaagagatg aaggttacga ttggttgatt 4140
atgacacgcg gccgcggc 4158
<210> 29
<211> 1127
<212> DNA
<213> 酿酒酵母
<400> 29
gctccatgga gggcacagtt aagccgctaa aggcattatc cgccaagtac aattttttac 60
tcttcgaaga cagaaaattt gctgacattg gtaatacagt caaattgcag tactctgcgg 120
gtgtatacag aatagcagaa tgggcagaca ttacgaatgc acacggtgtg gtgggcccag 180
gtattgttag cggtttgaag caggcggcgg aagaagtaac aaaggaacct agaggccttt 240
tgatgttagc agaattgtca tgcaagggct ccctagctac tggagaatat actaagggta 300
ctgttgacat tgcgaagagc gacaaagatt ttgttatcgg ctttattgct caaagagaca 360
tgggtggaag agatgaaggt tacgattggt tgattatgac acccggtgtg ggtttagatg 420
acaagggaga cgcattgggt caacagtata gaaccgtgga tgatgtggtc tctacaggat 480
ctgacattat tattgttgga agaggactat ttgcaaaggg aagggatgct aaggtagagg 540
gtgaacgtta cagaaaagca ggctgggaag catatttgag aagatgcggc cagcaaaact 600
aaaaaactgt attataagta aatgcatgta tactaaactc acaaattaga gcttcaattt 660
aattatatca gttattaccc gggaatctcg gtcgtaatga tttttataat gacgaaaaaa 720
aaaaaattgg aaagaaaaag cttcatggcc tttataaaaa ggaaccatcc aatacctcgc 780
cagaaccaag taacagtatt ttacggggca caaatcaaga acaataagac aggactgtaa 840
agatggacgc attgaactcc aaagaacaac aagagttcca aaaagtagtg gaacaaaagc 900
aaatgaagga tttcatgcgt ttgataactt cgtataatgt atgctatacg aagttatctc 960
gaggataaaa ctactacgct aaaaataaaa taaaaatgta tgatttccct ccatttccga 1020
ccaattgtat aattttatat ctgcatgact taataatata atataatact tataaaatac 1080
gaatagaaaa atttaaaccg atgtaatgca tccttttctt tgttgtc 1127
<210> 30
<211> 4542
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 30
tgagctccgg gtgggaggaa ggcgcggcaa ttagaatgtg tgggtgcgga agctcgccgc 60
tcccatcaag agagtggaag acgtatggtc tgggtgcgaa gtaccaccac gtttcttttt 120
catctcttaa gtgggattct tacgaaacac gtcacagggt caaaagaaag agaacaaaag 180
caatattgta attgtctcag tccacggcaa tgacatggca tggccccgaa ggcttttttt 240
gtctgtcttc cttgggtctt accccgccac gcgttaatag tgagacaagc aggaaatccg 300
tatcattttc tcgcatacac gaacccgcgt gcgcctggta aattgcagga ttctcattgt 360
ccggttttct ttatgggaat aatcatcatc accattatca ctgttactct tgcgatcatc 420
atcattaaca taattttttt aacgctgttt gatgatggta tgtgctttta ttgttcctta 480
ctcacctttt cctttgtgtc ttttaatttt gaccattttg accattttga cctttgatga 540
tgtgtgagtt cctcttttct ttttttcttt tcttttttcc tttttttttc ttttcttact 600
gtgttaatca ctttctttcc tttttgttca tattgtcgtc ttgttcattt tcgttcaatt 660
gataatgtat ataaatcttt cgtaagtatc tcttgattgc catttttttc tttccaagtt 720
tccttgttct cgaggccaga aaaaggaagt gtttccctcc ttcttgaatt gatgttaccc 780
tcataaagca cgtggcctct tatcgagaaa gaaattaccg tcgctcgtga tttgtttgca 840
aaaagaacaa aactgaaaaa acccagacac gctcgacttc ctgtcttcct attgattgca 900
gcttccaatt tcgtcacaca acaaggtcct agcgacggct cacaggtttt gtaacaagca 960
atcgaaggtt ctggaatggc gggaaagggt ttagtaccac atgctatgat gcccactgtg 1020
atctccagag caaagttcgt tcgatcgtac tgttactctc tctctttcaa acagaattgt 1080
ccgaatcgtg tgacaacaac agcctgttct cacacactct tttcttctaa ccaagggggt 1140
ggtttagttt agtagaacct cgtgaaactt acatttacat atatataaac ttgcataaat 1200
tggtcaatgc aagaaataca tatttggtct tttctaattc gtagtttttc aagttcttag 1260
atgctttctt tttctctttt ttacagatca tcaaggaagt aattatctac tttttacaag 1320
tctagaatga caacatcaaa tacctacaaa ttctatctaa acggtgaatg gagagaatct 1380
tcctctggag aaactattga gataccatca ccatacttac atgaagtgat cggacaggtt 1440
caagcaatca ctagaggaga ggttgacgaa gcgattgcta gcgctaagga agcacagaaa 1500
tcttgggctg aggcatctct acaagataga gctaagtact tgtacaaatg ggcagatgaa 1560
ttggtaaaca tgcaagacga aatcgccgat atcatcatga aggaagtggg caagggttac 1620
aaagacgcta aaaaggaggt tgttagaacc gccgatttca tcagatacac cattgaagag 1680
gcactccata tgcacggtga atccatgatg ggcgattcat ttcctggtgg aacaaaatct 1740
aagctagcaa taatccaaag agcgcctctg ggtgtagtct tagccatcgc tccattcaat 1800
taccctgtaa acctttctgc tgcaaaattg gcaccagcct taattatggg taacgctgtg 1860
atattcaagc cagcaactca gggtgctatt tccggcatca aaatggttga agctttgcat 1920
aaggctggtt tgccaaaggg tttggttaac gttgccacag gtagaggtag cgtcataggc 1980
gattatttgg tcgaacacga agggataaac atggtttcct tcaccggtgg cactaacact 2040
ggtaagcatt tagcaaaaaa ggcctcaatg attccattag tcttggaact tggtggcaaa 2100
gatccaggca tcgttcgtga agatgcagac ctacaagatg ctgcgaatca tatcgtatct 2160
ggtgcgttca gttactcagg gcagagatgt acagccatta agagagtcct tgttcatgaa 2220
aatgttgctg atgaactggt atcattggtt aaggaacaag tggcaaagct ttctgtggga 2280
tcaccagagc aagattcaac aattgttcct ctgattgacg ataagtccgc tgattttgtt 2340
cagggtttag tggacgatgc agtcgaaaag ggcgctacaa ttgtcattgg gaacaagaga 2400
gaacgtaacc taatctaccc aacattgatt gatcacgtca cagaggaaat gaaagttgcc 2460
tgggaggaac cattcggtcc tattcttcca attattagag ttagtagcga cgagcaagct 2520
attgaaattg caaataagag tgagttcgga ttacaagctt ctgtgtttac caaagacata 2580
aacaaggcat tcgcaatcgc aaataagatt gagactggtt cagtgcaaat caacggtaga 2640
acagagagag gaccagatca ctttcctttt atcggggtta agggatctgg gatgggtgcc 2700
caaggcatca gaaagtcttt ggaatctatg actagagaaa aagttactgt cttaaatctc 2760
gtatgattaa acaggcccct tttcctttgt cgatatcatg taattagtta tgtcacgctt 2820
acattcacgc cctcctccca catccgctct aaccgaaaag gaaggagtta gacaacctga 2880
agtctaggtc cctatttatt tttttatagt tatgttagta ttaagaacgt tatttatatt 2940
tcaaattttt cttttttttc tgtacaaacg cgtgtacgca tgtaacgggc agacggccgg 3000
ccataacttc gtataatgta tgctatacga agttatcctt acatcacacc caatccccca 3060
caagtgatcc cccacacacc atagcttcaa aatgtttcta ctcctttttt actcttccag 3120
attttctcgg actccgcgca tcgccgtacc acttcaaaac acccaagcac agcatactaa 3180
atttcccctc tttcttcctc tagggtggcg ttaattaccc gtactaaagg tttggaaaag 3240
aaaaaagaga ccgcctcgtt tctttttctt cgtcgaaaaa ggcaataaaa atttttatca 3300
cgtttctttt tcttgaaaaa tttttttttt gatttttttc tctttcgatg acctcccatt 3360
gatatttaag ttaataaatg gtcttcaatt tctcaagttt cagtttcgtt tttcttgttc 3420
tattacaact ttttttactt cttgctcatt agaaagaaag catagcaatc taatctaagt 3480
tttaattaca aaatgccaca atcctgggaa gaattggccg ccgacaaacg tgcccgtttg 3540
gctaaaacca ttcctgacga atggaaggtt caaactttgc ctgccgaaga ttccgttatt 3600
gatttcccaa agaagtccgg tattttgtct gaggctgaat tgaagattac cgaagcctct 3660
gctgctgatt tggtctccaa gttggccgct ggtgagttga cttctgttga agtcactttg 3720
gctttttgta agagagctgc tattgctcaa caattaacca actgtgctca cgaattcttc 3780
ccagatgctg ctttagctca agctagagaa ttagatgaat actacgctaa gcataagaga 3840
ccagttggtc cattacacgg tttaccaatc tctttaaagg accaattgcg tgttaagggt 3900
tacgaaacct ccatgggtta catttcctgg ttaaacaaat acgatgaagg tgattccgtc 3960
ttaaccacca tgttgagaaa agctggtgct gttttctacg ttaagacctc tgtcccacaa 4020
accttgatgg tctgtgaaac cgtcaacaac atcattggta gaactgtcaa tccaagaaac 4080
aaaaattggt cctgtggtgg ttcttctggt ggtgaaggtg ctattgttgg tattagaggt 4140
ggtgttattg gtgtcggtac tgacattggt ggttccatta gagtcccagc tgctttcaac 4200
tttttatacg gtttgagacc atctcacggt agattgccat atgctaaaat ggctaactct 4260
atggaaggtc aagaaaccgt tcactccgtc gttggtccta tcactcactc cgtcgaagac 4320
ttgagattgt tcaccaaatc tgtcttgggt caagaacctt ggaagtacga ctctaaggtc 4380
atccccatgc catggagaca atctgaatct gacatcattg cctctaagat taagaatggt 4440
ggtttgaaca ttggttatta caatttcgac ggtaacgtct tgccacaccc accaatttta 4500
cgtggtgtcg aaactaccgt tgccgctttg gcggccgcgg ca 4542
<210> 31
<211> 1363
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 31
agaggtggtg ttattggtgt cggtactgac attggtggtt ccattagagt cccagctgct 60
ttcaactttt tatacggttt gagaccatct cacggtagat tgccatatgc taaaatggct 120
aactctatgg aaggtcaaga aaccgttcac tccgtcgttg gtcctatcac tcactccgtc 180
gaagacttga gattgttcac caaatctgtc ttgggtcaag aaccttggaa gtacgactct 240
aaggtcatcc ccatgccatg gagacaatct gaatctgaca tcattgcctc taagattaag 300
aatggtggtt tgaacattgg ttattacaat ttcgacggta acgtcttgcc acacccacca 360
attttacgtg gtgtcgaaac taccgttgcc gctttggcca aggctggtca caccgttact 420
ccatggactc catacaagca tgatttctgt catgacttga tttcccacat ctatgctgct 480
gatggttctg ccgacgtcat gagagacatt tctgcctctg gtgagccagc catccctaac 540
attaaggact tgttgaaccc aaatattaag gctgttaaca tgaacgaatt gtgggacact 600
catttacaaa agtggaacta tcaaatggaa tacttggaaa agtggcgtga agctgaagaa 660
aaagctggta aggaattgga cgctattatc gctccaatta ctcctaccgt cgctgtcaga 720
cacgatcaat tcagatacta cggttacgcc tccgttatta gcttattgga tttcacctct 780
gttgtcgtcc cagtcacttt cgctgataag aatattgata agaagaacga atcttttaaa 840
gctgtttccg aattggatgc tttggttcaa gaagaatacg acccagaggc ttatcacggt 900
gctcctgttg ctgttcaagt tattggtaga agattgtccg aagagagaac tttggctatc 960
gccgaagaag tcggtaaatt gttgggtaac gtcgtcactc cataaggaga ttgataagac 1020
ttttctagtt gcatatcttt tatatttaaa tcttatctat tagttaattt tttgtaattt 1080
atccttatat atagtctggt tattctaaaa tatcatttca gtatctaaaa attcccctct 1140
tttttcagtt atatcttaac aggcgataac ttcgtataat gtatgctata cgaagttatg 1200
ataaaactac tacgctaaaa ataaaataaa aatgtatgat ttccctccat ttccgaccaa 1260
ttgtataatt ttatatctgc atgacttaat aatataatat aatacttata aaatacgaat 1320
agaaaaattt aaaccgatgt aatgcatcct tttctttgtt gtc 1363
<210> 32
<211> 4825
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 32
ccgggctaat tgaggggtgt cgcccttatt cgactcgggg tgagctcacc caccttcatc 60
caccatatcc gaagttatag gggaaatata atcgtcgatg tcattgatca cgtcgttata 120
gttgatattg tcgttagagt ccagttgttg ggcggatctc gtcaggtgcg gatcatgaaa 180
gatattaccg gcaccacctc taccaattgc aaaacgagga accttttcct ggttgctacc 240
gttattattg ttgtttgcta ctgtctttga attggatttc aatggaagaa gtacgggaga 300
cggcttggac atagatttat ggatgttgcc agctccgcct ctgccagtgg agaccttgta 360
ctcttgtaca cgtgcctggt tctccatctc gttttgtggg ttgaacgtag ccatactaac 420
ttggtcttac gctactgctg ctgctaacgc tgctgctgct tttgctcata tgcttccatt 480
gaccgtcatt agtatcagcg tcagcctttt tgacataagc caccgctctg tcagggtaac 540
cctatgaaac atttcaaaac gttataaagg aactcgtctg gttacaacaa ggaaatatca 600
ctacaaacag ctgtccgtac ggctcctcaa ctctctcaat gttgttcgcc tggtcacaca 660
cagcatagtt tcgtcattcg gcgccgacgg tcgctgtctc ttggagcctt caagctcttg 720
tcaacccagg tccgttgtgc cgataaaagt aacagcagac ccccacgccc gcatcccact 780
ctcttctccg accacctccc tcgaagttct tccctgccaa tcccacgtcg atccagcgta 840
gttggcccca actggtgcag taataaccgc ttagcgattt tgcactcgga actacatatg 900
tatatatata tgtgtgtgtg tgtgtgggct ggaaagattt cttgagcttc cgtgttatag 960
tgcaatttaa atattgtaca tcattccgat ccagctggaa acaaaagcaa gaacactcga 1020
ggccagaaaa aggaagtgtt tccctccttc ttgaattgat gttaccctca taaagcacgt 1080
ggcctcttat cgagaaagaa attaccgtcg ctcgtgattt gtttgcaaaa agaacaaaac 1140
tgaaaaaacc cagacacgct cgacttcctg tcttcctatt gattgcagct tccaatttcg 1200
tcacacaaca aggtcctagc gacggctcac aggttttgta acaagcaatc gaaggttctg 1260
gaatggcggg aaagggttta gtaccacatg ctatgatgcc cactgtgatc tccagagcaa 1320
agttcgttcg atcgtactgt tactctctct ctttcaaaca gaattgtccg aatcgtgtga 1380
caacaacagc ctgttctcac acactctttt cttctaacca agggggtggt ttagtttagt 1440
agaacctcgt gaaacttaca tttacatata tataaacttg cataaattgg tcaatgcaag 1500
aaatacatat ttggtctttt ctaattcgta gtttttcaag ttcttagatg ctttcttttt 1560
ctctttttta cagatcatca aggaagtaat tatctacttt ttacaagtct agaatgacaa 1620
catcaaatac ctacaaattc tatctaaacg gtgaatggag agaatcttcc tctggagaaa 1680
ctattgagat accatcacca tacttacatg aagtgatcgg acaggttcaa gcaatcacta 1740
gaggagaggt tgacgaagcg attgctagcg ctaaggaagc acagaaatct tgggctgagg 1800
catctctaca agatagagct aagtacttgt acaaatgggc agatgaattg gtaaacatgc 1860
aagacgaaat cgccgatatc atcatgaagg aagtgggcaa gggttacaaa gacgctaaaa 1920
aggaggttgt tagaaccgcc gatttcatca gatacaccat tgaagaggca ctccatatgc 1980
acggtgaatc catgatgggc gattcatttc ctggtggaac aaaatctaag ctagcaataa 2040
tccaaagagc gcctctgggt gtagtcttag ccatcgctcc attcaattac cctgtaaacc 2100
tttctgctgc aaaattggca ccagccttaa ttatgggtaa cgctgtgata ttcaagccag 2160
caactcaggg tgctatttcc ggcatcaaaa tggttgaagc tttgcataag gctggtttgc 2220
caaagggttt ggttaacgtt gccacaggta gaggtagcgt cataggcgat tatttggtcg 2280
aacacgaagg gataaacatg gtttccttca ccggtggcac taacactggt aagcatttag 2340
caaaaaaggc ctcaatgatt ccattagtct tggaacttgg tggcaaagat ccaggcatcg 2400
ttcgtgaaga tgcagaccta caagatgctg cgaatcatat cgtatctggt gcgttcagtt 2460
actcagggca gagatgtaca gccattaaga gagtccttgt tcatgaaaat gttgctgatg 2520
aactggtatc attggttaag gaacaagtgg caaagctttc tgtgggatca ccagagcaag 2580
attcaacaat tgttcctctg attgacgata agtccgctga ttttgttcag ggtttagtgg 2640
acgatgcagt cgaaaagggc gctacaattg tcattgggaa caagagagaa cgtaacctaa 2700
tctacccaac attgattgat cacgtcacag aggaaatgaa agttgcctgg gaggaaccat 2760
tcggtcctat tcttccaatt attagagtta gtagcgacga gcaagctatt gaaattgcaa 2820
ataagagtga gttcggatta caagcttctg tgtttaccaa agacataaac aaggcattcg 2880
caatcgcaaa taagattgag actggttcag tgcaaatcaa cggtagaaca gagagaggac 2940
cagatcactt tccttttatc ggggttaagg gatctgggat gggtgcccaa ggcatcagaa 3000
agtctttgga atctatgact agagaaaaag ttactgtctt aaatctcgta tgattaaaca 3060
ggcccctttt cctttgtcga tatcatgtaa ttagttatgt cacgcttaca ttcacgccct 3120
cctcccacat ccgctctaac cgaaaaggaa ggagttagac aacctgaagt ctaggtccct 3180
atttattttt ttatagttat gttagtatta agaacgttat ttatatttca aatttttctt 3240
ttttttctgt acaaacgcgt gtacgcatgt aacgggcaga cggccggcca taacttcgta 3300
taatgtatgc tatacgaagt tatccttaca tcacacccaa tcccccacaa gtgatccccc 3360
acacaccata gcttcaaaat gtttctactc cttttttact cttccagatt ttctcggact 3420
ccgcgcatcg ccgtaccact tcaaaacacc caagcacagc atactaaatt tcccctcttt 3480
cttcctctag ggtggcgtta attacccgta ctaaaggttt ggaaaagaaa aaagagaccg 3540
cctcgtttct ttttcttcgt cgaaaaaggc aataaaaatt tttatcacgt ttctttttct 3600
tgaaaaattt tttttttgat ttttttctct ttcgatgacc tcccattgat atttaagtta 3660
ataaatggtc ttcaatttct caagtttcag tttcgttttt cttgttctat tacaactttt 3720
tttacttctt gctcattaga aagaaagcat agcaatctaa tctaagtttt aattacaaaa 3780
tgccacaatc ctgggaagaa ttggccgccg acaaacgtgc ccgtttggct aaaaccattc 3840
ctgacgaatg gaaggttcaa actttgcctg ccgaagattc cgttattgat ttcccaaaga 3900
agtccggtat tttgtctgag gctgaattga agattaccga agcctctgct gctgatttgg 3960
tctccaagtt ggccgctggt gagttgactt ctgttgaagt cactttggct ttttgtaaga 4020
gagctgctat tgctcaacaa ttaaccaact gtgctcacga attcttccca gatgctgctt 4080
tagctcaagc tagagaatta gatgaatact acgctaagca taagagacca gttggtccat 4140
tacacggttt accaatctct ttaaaggacc aattgcgtgt taagggttac gaaacctcca 4200
tgggttacat ttcctggtta aacaaatacg atgaaggtga ttccgtctta accaccatgt 4260
tgagaaaagc tggtgctgtt ttctacgtta agacctctgt cccacaaacc ttgatggtct 4320
gtgaaaccgt caacaacatc attggtagaa ctgtcaatcc aagaaacaaa aattggtcct 4380
gtggtggttc ttctggtggt gaaggtgcta ttgttggtat tagaggtggt gttattggtg 4440
tcggtactga cattggtggt tccattagag tcccagctgc tttcaacttt ttatacggtt 4500
tgagaccatc tcacggtaga ttgccatatg ctaaaatggc taactctatg gaaggtcaag 4560
aaaccgttca ctccgtcgtt ggtcctatca ctcactccgt cgaagacttg agattgttca 4620
ccaaatctgt cttgggtcaa gaaccttgga agtacgactc taaggtcatc cccatgccat 4680
ggagacaatc tgaatctgac atcattgcct ctaagattaa gaatggtggt ttgaacattg 4740
gttattacaa tttcgacggt aacgtcttgc cacacccacc aattttacgt ggtgtcgaaa 4800
ctaccgttgc cgctttggcg gccgc 4825
<210> 33
<211> 1029
<212> DNA
<213> 酿酒酵母
<400> 33
catggagggc acagttaagc cgctaaaggc attatccgcc aagtacaatt ttttactctt 60
cgaagacaga aaatttgctg acattggtaa tacagtcaaa ttgcagtact ctgcgggtgt 120
atacagaata gcagaatggg cagacattac gaatgcacac ggtgtggtgg gcccaggtat 180
tgttagcggt ttgaagcagg cggcggaaga agtaacaaag gaacctagag gccttttgat 240
gttagcagaa ttgtcatgca agggctccct agctactgga gaatatacta agggtactgt 300
tgacattgcg aagagcgaca aagattttgt tatcggcttt attgctcaaa gagacatggg 360
tggaagagat gaaggttacg attggttgat tatgacaccc ggtgtgggtt tagatgacaa 420
gggagacgca ttgggtcaac agtatagaac cgtggatgat gtggtctcta caggatctga 480
cattattatt gttggaagag gactatttgc aaagggaagg gatgctaagg tagagggtga 540
acgttacaga aaagcaggct gggaagcata tttgagaaga tgcggccagc aaaactaaaa 600
aactgtatta taagtaaatg catgtatact aaactcacaa attagagctt caatttaatt 660
atatcagtta ttacccggga atctcggtcg taatgatttt tataatgacg aaaaaaaaaa 720
aattggaaag aaaaagcttc atggccttta taaaaaggaa ccatccaata cctcgccaga 780
accaagtaac agtattttac ggggcacaaa tcaagaacaa taagacagga ctgtaaagat 840
ggacgcattg aactccaaag aacaacaaga gttccaaaaa gtagtggaac aaaagcaaat 900
gaaggatttc atgcgtttga taacttcgta taatgtatgc tatacgaagt tatctcgagg 960
tatctgattt tcctttttca cccttcacgt aaacctgaaa tatatttcat gtaatatata 1020
tagttcatc 1029
<210> 34
<211> 4442
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 34
ccgggctaat tgaggggtgt cgcccttatt cgactcgggg tgagctcacc caccttcatc 60
caccatatcc gaagttatag gggaaatata atcgtcgatg tcattgatca cgtcgttata 120
gttgatattg tcgttagagt ccagttgttg ggcggatctc gtcaggtgcg gatcatgaaa 180
gatattaccg gcaccacctc taccaattgc aaaacgagga accttttcct ggttgctacc 240
gttattattg ttgtttgcta ctgtctttga attggatttc aatggaagaa gtacgggaga 300
cggcttggac atagatttat ggatgttgcc agctccgcct ctgccagtgg agaccttgta 360
ctcttgtaca cgtgcctggt tctccatctc gttttgtggg ttgaacgtag ccatactaac 420
ttggtcttac gctactgctg ctgctaacgc tgctgctgct tttgctcata tgcttccatt 480
gaccgtcatt agtatcagcg tcagcctttt tgacataagc caccgctctg tcagggtaac 540
cctatgaaac atttcaaaac gttataaagg aactcgtctg gttacaacaa ggaaatatca 600
ctacaaacag ctgtccgtac ggctcctcaa ctctctcaat gttgttcgcc tggtcacaca 660
cagcatagtt tcgtcattcg gcgccgacgg tcgctgtctc ttggagcctt caagctcttg 720
tcaacccagg tccgttgtgc cgataaaagt aacagcagac ccccacgccc gcatcccact 780
ctcttctccg accacctccc tcgaagttct tccctgccaa tcccacgtcg atccagcgta 840
gttggcccca actggtgcag taataaccgc ttagcgattt tgcactcgga actacatatg 900
tatatatata tgtgtgtgtg tgtgtgggct ggaaagattt cttgagcttc cgtgttatag 960
tgcaatttaa atattgtaca tcattccgat ccagctggaa acaaaagcaa gaacactcga 1020
ggccagaaaa aggaagtgtt tccctccttc ttgaattgat gttaccctca taaagcacgt 1080
ggcctcttat cgagaaagaa attaccgtcg ctcgtgattt gtttgcaaaa agaacaaaac 1140
tgaaaaaacc cagacacgct cgacttcctg tcttcctatt gattgcagct tccaatttcg 1200
tcacacaaca aggtcctagc gacggctcac aggttttgta acaagcaatc gaaggttctg 1260
gaatggcggg aaagggttta gtaccacatg ctatgatgcc cactgtgatc tccagagcaa 1320
agttcgttcg atcgtactgt tactctctct ctttcaaaca gaattgtccg aatcgtgtga 1380
caacaacagc ctgttctcac acactctttt cttctaacca agggggtggt ttagtttagt 1440
agaacctcgt gaaacttaca tttacatata tataaacttg cataaattgg tcaatgcaag 1500
aaatacatat ttggtctttt ctaattcgta gtttttcaag ttcttagatg ctttcttttt 1560
ctctttttta cagatcatca aggaagtaat tatctacttt ttacaagtct agaatgacaa 1620
catcaaatac ctacaaattc tatctaaacg gtgaatggag agaatcttcc tctggagaaa 1680
ctattgagat accatcacca tacttacatg aagtgatcgg acaggttcaa gcaatcacta 1740
gaggagaggt tgacgaagcg attgctagcg ctaaggaagc acagaaatct tgggctgagg 1800
catctctaca agatagagct aagtacttgt acaaatgggc agatgaattg gtaaacatgc 1860
aagacgaaat cgccgatatc atcatgaagg aagtgggcaa gggttacaaa gacgctaaaa 1920
aggaggttgt tagaaccgcc gatttcatca gatacaccat tgaagaggca ctccatatgc 1980
acggtgaatc catgatgggc gattcatttc ctggtggaac aaaatctaag ctagcaataa 2040
tccaaagagc gcctctgggt gtagtcttag ccatcgctcc attcaattac cctgtaaacc 2100
tttctgctgc aaaattggca ccagccttaa ttatgggtaa cgctgtgata ttcaagccag 2160
caactcaggg tgctatttcc ggcatcaaaa tggttgaagc tttgcataag gctggtttgc 2220
caaagggttt ggttaacgtt gccacaggta gaggtagcgt cataggcgat tatttggtcg 2280
aacacgaagg gataaacatg gtttccttca ccggtggcac taacactggt aagcatttag 2340
caaaaaaggc ctcaatgatt ccattagtct tggaacttgg tggcaaagat ccaggcatcg 2400
ttcgtgaaga tgcagaccta caagatgctg cgaatcatat cgtatctggt gcgttcagtt 2460
actcagggca gagatgtaca gccattaaga gagtccttgt tcatgaaaat gttgctgatg 2520
aactggtatc attggttaag gaacaagtgg caaagctttc tgtgggatca ccagagcaag 2580
attcaacaat tgttcctctg attgacgata agtccgctga ttttgttcag ggtttagtgg 2640
acgatgcagt cgaaaagggc gctacaattg tcattgggaa caagagagaa cgtaacctaa 2700
tctacccaac attgattgat cacgtcacag aggaaatgaa agttgcctgg gaggaaccat 2760
tcggtcctat tcttccaatt attagagtta gtagcgacga gcaagctatt gaaattgcaa 2820
ataagagtga gttcggatta caagcttctg tgtttaccaa agacataaac aaggcattcg 2880
caatcgcaaa taagattgag actggttcag tgcaaatcaa cggtagaaca gagagaggac 2940
cagatcactt tccttttatc ggggttaagg gatctgggat gggtgcccaa ggcatcagaa 3000
agtctttgga atctatgact agagaaaaag ttactgtctt aaatctcgta tgattaaaca 3060
ggcccctttt cctttgtcga tatcatgtaa ttagttatgt cacgcttaca ttcacgccct 3120
cctcccacat ccgctctaac cgaaaaggaa ggagttagac aacctgaagt ctaggtccct 3180
atttattttt ttatagttat gttagtatta agaacgttat ttatatttca aatttttctt 3240
ttttttctgt acaaacgcgt gtacgcatgt aacgggcaga cggccggcca taacttcgta 3300
taatgtatgc tatacgaagt tatggcaacg gttcatcatc tcatggatct gcacatgaac 3360
aaacaccaga gtcaaacgac gttgaaattg aggctactgc gccaattgat gacaatacag 3420
acgatgataa caaaccgaag ttatctgatg tagaaaagga ttagagatgc taagagatag 3480
tgatgatatt tcataaataa tgtaattcta tatatgttaa ttaccttttt tgcgaggcat 3540
atttatggtg aaggataagt tttgaccatc aaagaaggtt aatgtggctg tggtttcagg 3600
gtccataaag cttttcaatt catctttttt ttttttgttc ttttttttga ttccggtttc 3660
tttgaaattt ttttgattcg gtaatctccg agcagaagga agaacgaagg aaggagcaca 3720
gacttagatt ggtatatata cgcatatgtg gtgttgaaga aacatgaaat tgcccagtat 3780
tcttaaccca actgcacaga acaaaaacct gcaggaaacg aagataaatc atgtcgaaag 3840
ctacatataa ggaacgtgct gctactcatc ctagtcctgt tgctgccaag ctatttaata 3900
tcatgcacga aaagcaaaca aacttgtgtg cttcattgga tgttcgtacc accaaggaat 3960
tactggagtt agttgaagca ttaggtccca aaatttgttt actaaaaaca catgtggata 4020
tcttgactga tttttccatg gagggcacag ttaagccgct aaaggcatta tccgccaagt 4080
acaatttttt actcttcgaa gacagaaaat ttgctgacat tggtaataca gtcaaattgc 4140
agtactctgc gggtgtatac agaatagcag aatgggcaga cattacgaat gcacacggtg 4200
tggtgggccc aggtattgtt agcggtttga agcaggcggc ggaagaagta acaaaggaac 4260
ctagaggcct tttgatgtta gcagaattgt catgcaaggg ctccctagct actggagaat 4320
atactaaggg tactgttgac attgcgaaga gcgacaaaga ttttgttatc ggctttattg 4380
ctcaaagaga catgggtgga agagatgaag gttacgattg gttgattatg acacgcggcc 4440
gc 4442
<210> 35
<211> 1447
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 35
gcggccgcga aggtgctatt gttggtatta gaggtggtgt tattggtgtc ggtactgaca 60
ttggtggttc cattagagtc ccagctgctt tcaacttttt atacggtttg agaccatctc 120
acggtagatt gccatatgct aaaatggcta actctatgga aggtcaagaa accgttcact 180
ccgtcgttgg tcctatcact cactccgtcg aagacttgag attgttcacc aaatctgtct 240
tgggtcaaga accttggaag tacgactcta aggtcatccc aatgccatgg agacaatctg 300
aatctgacat cattgcctct aagattaaga atggtggttt gaacattggt tattacaatt 360
tcgacggtaa cgtcttgcca cacccaccaa ttttacgtgg tgtcgaaact accgttgccg 420
ctttggccaa ggctggtcac accgttactc catggactcc atacaagcat gatttcggtc 480
atgacttgat ttcccacatc tatgctgctg atggttctgc cgacgtcatg agagacattt 540
ctgcctctgg tgagccagcc atccctaaca ttaaggactt gttgaaccca aatattaagg 600
ctgttaacat gaacgaattg tgggacactc atttacaaaa gtggaactat caaatggaat 660
acttggaaaa gtggcgtgaa gctgaagaaa aagctggtaa ggaattggac gctattatcg 720
ctccaattac tcctaccgcc gctgtcagac acgatcaatt cagatactac ggttacgcct 780
ccgttattaa cttattggat ttcacctctg ttgtcgtccc agtcactttc gctgataaga 840
atattgataa gaagaacgaa tcttttaaag ctgtttccga attggatgct ttggttcaag 900
aagaatacga cccagaggct tatcacggtg ctcctgttgc tgttcaagtt attggtagaa 960
gattgtccga agagagaact ttggctatcg ccgaagaagt cggtaaattg ttgggtaacg 1020
tcgtcactcc ataagcgaat ttcttatgat ttatgatttt tattattaaa taagttataa 1080
aaaaaataag tgtatacaaa ttttaaagtg actcttaggt tttaaaacga aaattcttat 1140
tcttgagtaa ctctttcctg taggtcaggt tgctttctca ggtatagcat gaggtcgctc 1200
ttattgacca cacctctacc ggcatgccga gcaaatgcct gcaaatcgct ccccatttca 1260
cccaattgta gatatgctaa ctccagcaat gagttgatga atctcggtgt gtattttatg 1320
tcctcagagg acaacacata acttcgtata atgtatgcta tacgaagtta tctcgaggta 1380
tctgattttc ctttttcacc cttcacgtaa acctgaaata tatttcatgt aatatatata 1440
gttcatc 1447
<210> 36
<211> 3579
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 36
gaggttccag atataccgca acacctttat tatggtttcc ctgagggaat aatagaatgt 60
cccattcgaa atcaccaatt ctaaacctgg gcgaattgta tttcgggttt gttaactcgt 120
tccagtcagg aatgttccac gtgaagctat cttccagcaa agtctccact tcttcatcaa 180
attgtgggag aatactccca atgctcttat ctatgggact tccgggaaac acagtaccga 240
tacttcccaa ttcgtcttca gagctcattg tttgtttgaa gagactaatc aaagaatcgt 300
tttctcaaaa aatttaatat cttaactgat agtttgatca aaggcggccg ccgcgctgcg 360
gatatttcta aggcatggtc gtgcggagct acaataatac gattgaatta tagctacata 420
gtgtacaaaa gcgggtatat actttcatat gtgatcagtt tttggtggca gaggagcttg 480
ttgagcttga tgatgtactg tataattcat ggacgaaatt ttcaccccag aaggcagaag 540
tgtatttaga gatgtatttg taaagttttt cccagttaac ttctttcttt acatcgggca 600
aagtcaaggc ctcgttgatg gcatcagaaa gatcatcggt gttccaagga tttacaataa 660
tagcaccatt caaggattgt gcggcacctg tgaactcact caggattaag gaacctttct 720
tttcttcttg gcaagcaata tattcgtagg aaaccaagtt cataccatca cgggtggacg 780
agaccaaaca gacatcgctc acagcatata acgaaatcag ctcttcaaat ggtatagact 840
tgtgcatgaa atggatgggg acgaattcca cagtaccgaa ctgaccgttg attctaccga 900
ccaactcatt gaccacagat cttaaatatt ggtactcttc cacatctcca cgacttggca 960
ctgcaacctg taccagaaca accttgcccc tccattctgg atgctcgttc agaaacactt 1020
ccatggcgtg caacttctga ggcacacctt tgatgtaatc cagcctgtcg acaccaacta 1080
tgatcttgca gcccttgaaa gtttccttca attgttggat tctcttttgt acggattcct 1140
ttttcaaccc atcggtgaac ttgtccacgt cgataccgat agggaaggcc cctacgttaa 1200
cgaatctgcc ctggtattcc accccattag gcaatgtgtt cacgttaagc actctttgca 1260
cggaagacaa gaaatgtctt gcataatcgt atgtgtggaa cccgactaaa tcacaactca 1320
aaacaccctt caaaatctct tgtctgacag gtaagattct gtaaatttca ctcgaaggga 1380
atggtgtgtg caggaaccac ccgaccttaa cgttttgcag ttgcttctcg tgaatcttga 1440
ctctcaacat ttccggaacc aacatcaaat ggtaatcatg cacccagatt aaatcgttat 1500
ggttcatagt cttagcaatc tcgttggtga acgtctggtt tgcctcgttg tatgccaacc 1560
acgcattctc gtcgaaattg atctcaccag gatggtaatg gaataacggc catagaatag 1620
aattactgaa cccgttgtag tgtaagtctg cgatttcatc gctcaggaag atgggtacgg 1680
cattaaactt ttccagcaag tccttcctca cctgatcctt ctcatcgtca ggaatctcta 1740
gcccaggcca tccgaaccac ttgaaagtgt acgtcttctt caacccttcc aacgccgtga 1800
ccagccctcc ggacgacatt gcgtactcgt actgtcccgt actgctgttt ttagtgattg 1860
tcacgggaag cctgttggac accacaataa tgttaccccc tgaagacgag gtcagttgcg 1920
ccttagcgtt atccgtagtc attgttttat atttgttgta aaaagtagat aattacttcc 1980
ttgatgatct gtaaaaaaga gaaaaagaaa gcatctaaga acttgaaaaa ctacgaatta 2040
gaaaagacca aatatgtatt tcttgcattg accaatttat gcaagtttat atatatgtaa 2100
atgtaagttt cacgaggttc tactaaacta aaccaccccc ttggttagaa gaaaagagtg 2160
tgtgagaaca ggctgttgtt gtcacacgat tcggacaatt ctgtttgaaa gagagagagt 2220
aacagtacga tcgaacgaac tttgctctgg agatcacagt gggcatcata gcatgtggta 2280
ctaaaccctt tcccgccatt ccagaacctt cgattgcttg ttacaaaacc tgtgagccgt 2340
cgctaggacc ttgttgtgtg acgaaattgg aagctgcaat caataggaag acaggaagtc 2400
gagcgtgtct gggttttttc agttttgttc tttttgcaaa caaatcacga gcgacggtaa 2460
tttctttctc gataagaggc cacgtgcttt atgagggtaa catcaattca agaaggaggg 2520
aaacacttcc tttttctggc cctgataata gtatgagggt gaagccaaaa taaaggattc 2580
gcgcccaaat cggcatcttt aaatgcaggt atgcgatagt tcctcactct ttccttactc 2640
acgagctcat aacttcgtat agcatacatt atacgaagtt atttaattaa atttaaactg 2700
tgaggacctt aatacattca gacacttcgg cggtatcacc ctacttattc ccttcgagat 2760
tatatctagg aacccatcag gttggtggaa gattacccgt tctaagactt ttcagcttcc 2820
tctattgatg ttacacctgg acaccccttt tctggcatcc agtttttaat cttcagtggc 2880
atgtgagatt ctccgaaatt aattaaagca atcacacaat tctctcggat gccacctcgg 2940
ttgaaactga caggtggttt gttacgcatg ctaatgcaaa ggagcctata tacctttggc 3000
tcggctgctg taacagggaa tataaagggc agcataattt aggagtttag tgaacttgca 3060
acatttacta ttttcccttc ttacgtaaat atttttcttt ttaattctaa atcaatcttt 3120
ttcaattttt tgtttgtatt cttttcttgc ttaaatctat aactacaaaa aacacataca 3180
taaactaaaa ggcgcgccat gggtaaggaa aagactcacg tttcgaggcc gcgattaaat 3240
tccaacatgg atgctgattt atatgggtat aaatgggctc gcgataatgt cgggcaatca 3300
ggtgcgacaa tctatcgatt gtatgggaag cccgatgcgc cagagttgtt tctgaaacat 3360
ggcaaaggta gcgttgccaa tgatgttaca gatgagatgg tcagactaaa ctggctgacg 3420
gaatttatgc ctctaccgac catcaagcat tttatccgta ctcctgatga tgcatggtta 3480
ctcaccactg cgatccccgg caaaacagca ttccaggtat tagaagaata tcctgattca 3540
ggtgaaaata ttgttgatgc gctggcagtg ttcctgcgc 3579
<210> 37
<211> 4848
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 37
gacaatctat cgattgtatg ggaagcccga tgcgccagag ttgtttctga aacatggcaa 60
aggtagcgtt gccaatgatg ttacagatga gatggtcaga ctaaactggc tgacggaatt 120
tatgcctcta ccgaccatca agcattttat ccgtactcct gatgatgcat ggttactcac 180
cactgcgatc cccggcaaaa cagcattcca ggtattagaa gaatatcctg attcaggtga 240
aaatattgtt gatgcgctgg cagtgttcct gcgccggttg cattcgattc ctgtttgtaa 300
ttgtcctttt aacagcgatc gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa 360
cggtttggtt gatgcgagtg attttgatga cgagcgtaat ggctggcctg ttgaacaagt 420
ctggaaagaa atgcataagc ttttgccatt ctcaccggat tcagtcgtca ctcatggtga 480
tttctcactt gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg 540
acgagtcgga atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga 600
gttttctcct tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat 660
gaataaattg cagtttcatt tgatgctcga tgagtttttc taacctaggg cgaatttctt 720
atgatttatg atttttatta ttaaataagt tataaaaaaa ataagtgtat acaaatttta 780
aagtgactct taggttttaa aacgaaaatt cttattcttg agtaactctt tcctgtaggt 840
caggttgctt tctcaggtat agcatgaggt cgctcttatt gaccacacct ctaccggcat 900
gataacttcg tatagcatac attatacgaa gttatttaat taacccggga tctcccgagt 960
ttatcattat caatactgcc atttcaaaga atacgtaaat aattaatagt agtgattttc 1020
ctaactttat ttagtcaaaa aattggcctt ttaattctgc tgtaacccgt acatgcccaa 1080
aatagggggc gggttacaca gaatatataa catcataggt gtctgggtga acagtttatt 1140
cctggcatcc actaaatata atggagcccg ctttttttaa gctggcatcc agaaaaaaaa 1200
agaatcccag caccaaaata ttgttttctt caccaaccat cagttcatag gtccattctc 1260
ttagcgcaac tacacagaac aggggcacaa acaggcaaaa aacgggcaca acctcaatgg 1320
agtgatgcaa cctgcttgga gtaaatgatg acacaaggca attgacctac gcatgtatct 1380
atctcatttt cttacacctt ctattacctt ctgctctctc tgatttggaa aaagctgaaa 1440
aaaaaggttg aaaccagttc cctgaaatta ttcccctatt tgactaataa gtatataaag 1500
acggtaggta ttgattgtaa ttctgtaaat ctatttctta aacttcttaa attctacttt 1560
tatagttagt ctttttttta gttttaaaac actaagaact tagtttcgaa taaacacaca 1620
taaacaaaca aaatgaccac cactgcccaa gacaattctc caaagaagag acagcgtatc 1680
atcaattgtg tcacgcagct gccctacaaa atccaattgg gagaaagcaa cgatgactgg 1740
aaaatatctg ctactacagg taacagcgca ttatattcct ctctagaata ccttcaattt 1800
gattctaccg agtacgagca acacgttgtt ggttggaccg gcgaaataac aagaaccgaa 1860
cgcaacctgt ttactagaga agcgaaagag aaaccacagg atctggacga tgacccacta 1920
tatttaacaa aagagcagat caatgggttg actactactc tacaagatca tatgaaatct 1980
gataaagagg caaagaccga tactactcaa acagctcccg ttaccaataa cgttcatccc 2040
gtttggctac ttagaaaaaa ccagagtaga tggagaaatt acgcggaaaa agtaatttgg 2100
ccaaccttcc actacatctt gaatccttca aatgaaggtg agcaagaaaa aaactggtgg 2160
tacgactacg tcaagtttaa cgaagcttat gcacaaaaaa tcggggaagt ttacaggaag 2220
ggtgacatca tctggatcca tgactactac ctactgctat tgcctcaact actgagaatg 2280
aaatttaacg acgaatctat cattattggt tatttccatc atgccccatg gcctagtaat 2340
gaatattttc gctgtttgcc acgtagaaaa caaatcttag atggtcttgt tggggccaat 2400
agaatttgtt tccaaaatga atctttctcc cgtcattttg tatcgagttg taaaagatta 2460
ctcgacgcaa ccgccaagaa atctaaaaac tcttccgata gtgatcaata tcaagtgtct 2520
gtgtacggtg gtgacgtact cgtagattct ttgcctatag gtgttaacac aactcaaata 2580
ctgaaagatg ctttcacgaa ggatatagat tccaaggttc tttccatcaa gcaagcttat 2640
caaaacaaaa aaattattat tggtagagat cgtctggatt ccgtcagagg cgtcgttcaa 2700
aaattaagag cttttgaaac tttcttggcc atgtatccag aatggcgaga tcaagtggta 2760
ttgatccagg tcagcagtcc tactgctaac agaaattccc cccaaactat cagattggaa 2820
caacaagtca acgagttggt taattccata aattctgaat atggtaattt gaatttttct 2880
cccgtccagc attattatat gagaatccct aaagatgtat acttgtcctt actaagagtt 2940
gcagacttat gtttaatcac aagtgttaga gacggtatga ataccactgc tttggaatac 3000
gtcactgtga aatctcacat gtcgaacttt ttatgctacg gaaatccatt gattttaagt 3060
gagttttctg gctctagtaa cgtattgaaa gatgccattg tcgttaaccc atgggattcg 3120
gtggccgtgg ctaaatctat taacatggct ttgaaattgg acaaggaaga aaagtccaat 3180
ttagaatcaa aattatggaa agaagttcct acaattcaag attggactaa taagtttttg 3240
agttcattaa aggaaaaggc gtcatctgat gatgatgtgg aaaggaaaat gactccagca 3300
cttaatagac ctgttctttt agaaaactac aagcaggcta agcgtagatt attccttttt 3360
gattacgatg gtactttgac cccaattgtc aaagacccag ctgcagctat tccatcggca 3420
agactttata caattctaca aaaattatgt gccgatcctc ataatcaaat ctggattatt 3480
tctggtcgtg accagaagtt tttgaacaag tggttaggcg gtaaacttcc tcaactgggt 3540
ctaagtgcgg agcatggatg tttcatgaaa gatgtttctt gccaagattg ggtcaatttg 3600
accgaaaaag ttgatatgtc ttggcaagta cgcgtcaatg aagtgatgga agaatttacc 3660
acaaggaccc caggttcatt catcgaaaga aagaaagtcg ctctaacttg gcattataga 3720
cgtaccgttc cagaattggg tgaattccac gccaaagaac tgaaagaaaa attgttatca 3780
tttactgatg acttcgattt agaggtcatg gatggtaaag caaacattga agttcgtcca 3840
agattcgtca acaaaggtga aatagtcaag agactagtct ggcatcaaca tggcaaacca 3900
caggacatgt tgaagggaat cagtgaaaaa ctacctaagg atgaaatgcc tgattttgta 3960
ttatgtctgg gtgatgactt cactgacgaa gacatgttta gacagttgaa taccattgaa 4020
acttgttgga aagaaaaata tcctgaccaa aaaaatcaat ggggcaacta cggattctat 4080
cctgtcactg tgggatctgc atccaagaaa actgtcgcaa aggctcattt aaccgatcct 4140
cagcaagtcc tggagacttt aggtttactt gttggtgatg tctctctctt ccaaagtgct 4200
ggtacggtcg acctggattc cagaggtcat gtcaagaata gtgagagcag tttgaaatca 4260
aagctagcat ctaaagctta tgttatgaaa agatcggctt cttacaccgg cgcaaaggtt 4320
tgaacagaag acgggagaca ctagcacaca actttaccag gcaaggtatt tgacgctagc 4380
atgtgtccaa ttcagtgtca tttatgattt tttgtagtag gatataaata tatacagcgc 4440
tccaaatagt gcggttgccc caaaaacacc acggactcga ggcgggccta tacaggaagt 4500
agtatttgta aaagtaaacc atgttgctag tacgaacgac ttccctgaat gtgtcaagga 4560
tgccagtgcc atgcctcgcc agaggaatag gcatcctcaa gggcaaatat agactagcga 4620
acctgatgaa tgcccaaccc tcagtgagac atgtgtcgag cgagatccag caaaaggatc 4680
agcaggcagg agagtcaaac accgccaccg atactggtgt tattcacaaa tcagatgaag 4740
aaactctgat atatttcgat aatgtttacg ctagaaccac ctcggtttgg aatccaacac 4800
tgtggtacaa tctcctgcta agaaaccagt cacgggatgc agtgaggg 4848
<210> 38
<211> 515
<212> PRT
<213> 扣囊复膜酵母
<400> 38
Met Ile Arg Leu Thr Val Phe Leu Thr Ala Val Phe Ala Ala Val Ala
1 5 10 15
Ser Cys Val Pro Val Glu Leu Asp Lys Arg Asn Thr Gly His Phe Gln
20 25 30
Ala Tyr Ser Gly Tyr Thr Val Ala Arg Ser Asn Phe Thr Gln Trp Ile
35 40 45
His Glu Gln Pro Ala Val Ser Trp Tyr Tyr Leu Leu Gln Asn Ile Asp
50 55 60
Tyr Pro Glu Gly Gln Phe Lys Ser Ala Lys Pro Gly Val Val Val Ala
65 70 75 80
Ser Pro Ser Thr Ser Glu Pro Asp Tyr Phe Tyr Gln Trp Thr Arg Asp
85 90 95
Thr Ala Ile Thr Phe Leu Ser Leu Ile Ala Glu Val Glu Asp His Ser
100 105 110
Phe Ser Asn Thr Thr Leu Ala Lys Val Val Glu Tyr Tyr Ile Ser Asn
115 120 125
Thr Tyr Thr Leu Gln Arg Val Ser Asn Pro Ser Gly Asn Phe Asp Ser
130 135 140
Pro Asn His Asp Gly Leu Gly Glu Pro Lys Phe Asn Val Asp Asp Thr
145 150 155 160
Ala Tyr Thr Ala Ser Trp Gly Arg Pro Gln Asn Asp Gly Pro Ala Leu
165 170 175
Arg Ala Tyr Ala Ile Ser Arg Tyr Leu Asn Ala Val Ala Lys His Asn
180 185 190
Asn Gly Lys Leu Leu Leu Ala Gly Gln Asn Gly Ile Pro Tyr Ser Ser
195 200 205
Ala Ser Asp Ile Tyr Trp Lys Ile Ile Lys Pro Asp Leu Gln His Val
210 215 220
Ser Thr His Trp Ser Thr Ser Gly Phe Asp Leu Trp Glu Glu Asn Gln
225 230 235 240
Gly Thr His Phe Phe Thr Ala Leu Val Gln Leu Lys Ala Leu Ser Tyr
245 250 255
Gly Ile Pro Leu Ser Lys Thr Tyr Asn Asp Pro Gly Phe Thr Ser Trp
260 265 270
Leu Glu Lys Gln Lys Asp Ala Leu Asn Ser Tyr Ile Asn Ser Ser Gly
275 280 285
Phe Val Asn Ser Gly Lys Lys His Ile Val Glu Ser Pro Gln Leu Ser
290 295 300
Ser Arg Gly Gly Leu Asp Ser Ala Thr Tyr Ile Ala Ala Leu Ile Thr
305 310 315 320
His Asp Ile Gly Asp Asp Asp Thr Tyr Thr Pro Phe Asn Val Asp Asn
325 330 335
Ser Tyr Val Leu Asn Ser Leu Tyr Tyr Leu Leu Val Asp Asn Lys Asn
340 345 350
Arg Tyr Lys Ile Asn Gly Asn Tyr Lys Ala Gly Ala Ala Val Gly Arg
355 360 365
Tyr Pro Glu Asp Val Tyr Asn Gly Val Gly Thr Ser Glu Gly Asn Pro
370 375 380
Trp Gln Leu Ala Thr Ala Tyr Ala Gly Gln Thr Phe Tyr Thr Leu Ala
385 390 395 400
Tyr Asn Ser Leu Lys Asn Lys Lys Asn Leu Val Ile Glu Lys Leu Asn
405 410 415
Tyr Asp Leu Tyr Asn Ser Phe Ile Ala Asp Leu Ser Lys Ile Asp Ser
420 425 430
Ser Tyr Ala Ser Lys Asp Ser Leu Thr Leu Thr Tyr Gly Ser Asp Asn
435 440 445
Tyr Lys Asn Val Ile Lys Ser Leu Leu Gln Phe Gly Asp Ser Phe Leu
450 455 460
Lys Val Leu Leu Asp His Ile Asp Asp Asn Gly Gln Leu Thr Glu Glu
465 470 475 480
Ile Asn Arg Tyr Thr Gly Phe Gln Ala Gly Ala Val Ser Leu Thr Trp
485 490 495
Ser Ser Gly Ser Leu Leu Ser Ala Asn Arg Ala Arg Asn Lys Leu Ile
500 505 510
Glu Leu Leu
515
<210> 39
<211> 599
<212> PRT
<213> 米根霉
<400> 39
Met Lys Phe Ile Ser Thr Phe Leu Thr Phe Ile Leu Ala Ala Val Ser
1 5 10 15
Val Thr Ala Gly Ala Ser Ile Pro Ser Ser Ala Ser Val Gln Leu Asp
20 25 30
Ser Tyr Asn Tyr Asp Gly Ser Thr Phe Ser Gly Lys Ile Tyr Val Lys
35 40 45
Asn Ile Ala Tyr Ser Lys Lys Val Thr Val Val Tyr Ala Asp Gly Ser
50 55 60
Asp Asn Trp Asn Asn Asn Gly Asn Thr Ile Ala Ala Ser Phe Ser Gly
65 70 75 80
Pro Ile Ser Gly Ser Asn Tyr Glu Tyr Trp Thr Phe Ser Ala Ser Val
85 90 95
Lys Gly Ile Lys Glu Phe Tyr Ile Lys Tyr Glu Val Ser Gly Lys Thr
100 105 110
Tyr Tyr Asp Asn Asn Asn Ser Ala Asn Tyr Gln Val Ser Thr Ser Lys
115 120 125
Pro Thr Thr Thr Thr Ala Ala Thr Thr Thr Thr Thr Ala Pro Ser Thr
130 135 140
Ser Thr Thr Thr Arg Pro Ser Ser Ser Glu Pro Ala Thr Phe Pro Thr
145 150 155 160
Gly Asn Ser Thr Ile Ser Ser Trp Ile Lys Lys Gln Glu Asp Ile Ser
165 170 175
Arg Phe Ala Met Leu Arg Asn Ile Asn Pro Pro Gly Ser Ala Thr Gly
180 185 190
Phe Ile Ala Ala Ser Leu Ser Thr Ala Gly Pro Asp Tyr Tyr Tyr Ala
195 200 205
Trp Thr Arg Asp Ala Ala Leu Thr Ser Asn Val Ile Val Tyr Glu Tyr
210 215 220
Asn Thr Thr Leu Ser Gly Asn Lys Thr Ile Leu Asn Val Leu Lys Asp
225 230 235 240
Tyr Val Thr Phe Ser Val Lys Thr Gln Ser Thr Ser Thr Val Cys Asn
245 250 255
Cys Leu Gly Glu Pro Lys Phe Asn Pro Asp Gly Ser Gly Tyr Thr Gly
260 265 270
Ala Trp Gly Arg Pro Gln Asn Asp Gly Pro Ala Glu Arg Ala Thr Thr
275 280 285
Phe Val Leu Phe Ala Asp Ser Tyr Leu Thr Gln Thr Lys Asp Ala Ser
290 295 300
Tyr Val Thr Gly Thr Leu Lys Pro Ala Ile Phe Lys Asp Leu Asp Tyr
305 310 315 320
Val Val Asn Val Trp Ser Asn Gly Cys Phe Asp Leu Trp Glu Glu Val
325 330 335
Asn Gly Val His Phe Tyr Thr Leu Met Val Met Arg Lys Gly Leu Leu
340 345 350
Leu Gly Ala Asp Phe Ala Lys Arg Asn Gly Asp Ser Thr Arg Ala Ser
355 360 365
Thr Tyr Ser Ser Thr Ala Ser Thr Ile Ala Asn Lys Ile Ser Ser Phe
370 375 380
Trp Val Ser Ser Asn Asn Trp Val Gln Val Ser Gln Ser Val Thr Gly
385 390 395 400
Gly Val Ser Lys Lys Gly Leu Asp Val Ser Thr Leu Leu Ala Ala Asn
405 410 415
Leu Gly Ser Val Asp Asp Gly Phe Phe Thr Pro Gly Ser Glu Lys Ile
420 425 430
Leu Ala Thr Ala Val Ala Val Glu Asp Ser Phe Ala Ser Leu Tyr Pro
435 440 445
Ile Asn Lys Asn Leu Pro Ser Tyr Leu Gly Asn Ala Ile Gly Arg Tyr
450 455 460
Pro Glu Asp Thr Tyr Asn Gly Asn Gly Asn Ser Gln Gly Asn Pro Trp
465 470 475 480
Phe Leu Ala Val Thr Gly Tyr Ala Glu Leu Tyr Tyr Arg Ala Ile Lys
485 490 495
Glu Trp Ile Ser Asn Gly Gly Val Thr Val Ser Ser Ile Ser Leu Pro
500 505 510
Phe Phe Lys Lys Phe Asp Ser Ser Ala Thr Ser Gly Lys Lys Tyr Thr
515 520 525
Val Gly Thr Ser Asp Phe Asn Asn Leu Ala Gln Asn Ile Ala Leu Ala
530 535 540
Ala Asp Arg Phe Leu Ser Thr Val Gln Leu His Ala Pro Asn Asn Gly
545 550 555 560
Ser Leu Ala Glu Glu Phe Asp Arg Thr Thr Gly Phe Ser Thr Gly Ala
565 570 575
Arg Asp Leu Thr Trp Ser His Ala Ser Leu Ile Thr Ala Ser Tyr Ala
580 585 590
Lys Ala Gly Ala Pro Ala Ala
595
<210> 40
<211> 604
<212> PRT
<213> 戴尔根霉
<400> 40
Met Gln Leu Phe Asn Leu Pro Leu Lys Val Ser Phe Phe Leu Val Leu
1 5 10 15
Ser Tyr Phe Ser Leu Leu Val Ser Ala Ala Ser Ile Pro Ser Ser Ala
20 25 30
Ser Val Gln Leu Asp Ser Tyr Asn Tyr Asp Gly Ser Thr Phe Ser Gly
35 40 45
Lys Ile Tyr Val Lys Asn Ile Ala Tyr Ser Lys Lys Val Thr Val Ile
50 55 60
Tyr Ala Asp Gly Ser Asp Asn Trp Asn Asn Asn Gly Asn Thr Ile Ala
65 70 75 80
Ala Ser Tyr Ser Ala Pro Ile Ser Gly Ser Asn Tyr Glu Tyr Trp Thr
85 90 95
Phe Ser Ala Ser Ile Asn Gly Ile Lys Glu Phe Tyr Ile Lys Tyr Glu
100 105 110
Val Ser Gly Lys Thr Tyr Tyr Asp Asn Asn Asn Ser Ala Asn Tyr Gln
115 120 125
Val Ser Thr Ser Lys Pro Thr Thr Thr Thr Ala Thr Ala Thr Thr Thr
130 135 140
Thr Ala Pro Ser Thr Ser Thr Thr Thr Pro Pro Ser Ser Ser Glu Pro
145 150 155 160
Ala Thr Phe Pro Thr Gly Asn Ser Thr Ile Ser Ser Trp Ile Lys Lys
165 170 175
Gln Glu Gly Ile Ser Arg Phe Ala Met Leu Arg Asn Ile Asn Pro Pro
180 185 190
Gly Ser Ala Thr Gly Phe Ile Ala Ala Ser Leu Ser Thr Ala Gly Pro
195 200 205
Asp Tyr Tyr Tyr Ala Trp Thr Arg Asp Ala Ala Leu Thr Ser Asn Val
210 215 220
Ile Val Tyr Glu Tyr Asn Thr Thr Leu Ser Gly Asn Lys Thr Ile Leu
225 230 235 240
Asn Val Leu Lys Asp Tyr Val Thr Phe Ser Val Lys Thr Gln Ser Thr
245 250 255
Ser Thr Val Cys Asn Cys Leu Gly Glu Pro Lys Phe Asn Pro Asp Gly
260 265 270
Ser Gly Tyr Thr Gly Ala Trp Gly Arg Pro Gln Asn Asp Gly Pro Ala
275 280 285
Glu Arg Ala Thr Thr Phe Ile Leu Phe Ala Asp Ser Tyr Leu Thr Gln
290 295 300
Thr Lys Asp Ala Ser Tyr Val Thr Gly Thr Leu Lys Pro Ala Ile Phe
305 310 315 320
Lys Asp Leu Asp Tyr Val Val Asn Val Trp Ser Asn Gly Cys Phe Asp
325 330 335
Leu Trp Glu Glu Val Asn Gly Val His Phe Tyr Thr Leu Met Val Met
340 345 350
Arg Lys Gly Leu Leu Leu Gly Ala Asp Phe Ala Lys Arg Asn Gly Asp
355 360 365
Ser Thr Arg Ala Ser Thr Tyr Ser Ser Thr Ala Ser Thr Ile Ala Asn
370 375 380
Lys Ile Ser Ser Phe Trp Val Ser Ser Asn Asn Trp Ile Gln Val Ser
385 390 395 400
Gln Ser Val Thr Gly Gly Val Ser Lys Lys Gly Leu Asp Val Ser Thr
405 410 415
Leu Leu Ala Ala Asn Leu Gly Ser Val Asp Asp Gly Phe Phe Thr Pro
420 425 430
Gly Ser Glu Lys Ile Leu Ala Thr Ala Val Ala Val Glu Asp Ser Phe
435 440 445
Ala Ser Leu Tyr Pro Ile Asn Lys Asn Leu Pro Ser Tyr Leu Gly Asn
450 455 460
Ser Ile Gly Arg Tyr Pro Glu Asp Thr Tyr Asn Gly Asn Gly Asn Ser
465 470 475 480
Gln Gly Asn Pro Trp Phe Leu Ala Val Thr Gly Tyr Ala Glu Leu Tyr
485 490 495
Tyr Arg Ala Ile Lys Glu Trp Ile Gly Asn Gly Gly Val Thr Val Ser
500 505 510
Ser Ile Ser Leu Pro Phe Phe Lys Lys Phe Asp Ser Ser Ala Thr Ser
515 520 525
Gly Lys Lys Tyr Thr Val Gly Thr Ser Asp Phe Asn Asn Leu Ala Gln
530 535 540
Asn Ile Ala Leu Ala Ala Asp Arg Phe Leu Ser Thr Val Gln Leu His
545 550 555 560
Ala His Asn Asn Gly Ser Leu Ala Glu Glu Phe Asp Arg Thr Thr Gly
565 570 575
Leu Ser Thr Gly Ala Arg Asp Leu Thr Trp Ser His Ala Ser Leu Ile
580 585 590
Thr Ala Ser Tyr Ala Lys Ala Gly Ala Pro Ala Ala
595 600
<210> 41
<211> 605
<212> PRT
<213> 小孢根霉
<400> 41
Met Lys Leu Met Asn Pro Ser Met Lys Ala Tyr Val Phe Phe Ile Leu
1 5 10 15
Ser Tyr Phe Ser Leu Leu Val Ser Ser Ala Ala Val Pro Thr Ser Ala
20 25 30
Ala Val Gln Val Glu Ser Tyr Asn Tyr Asp Gly Thr Thr Phe Ser Gly
35 40 45
Arg Ile Phe Val Lys Asn Ile Ala Tyr Ser Lys Val Val Thr Val Ile
50 55 60
Tyr Ser Asp Gly Ser Asp Asn Trp Asn Asn Asn Asn Asn Lys Val Ser
65 70 75 80
Ala Ala Tyr Ser Glu Ala Ile Ser Gly Ser Asn Tyr Glu Tyr Trp Thr
85 90 95
Phe Ser Ala Lys Leu Ser Gly Ile Lys Gln Phe Tyr Val Lys Tyr Glu
100 105 110
Val Ser Gly Ser Thr Tyr Tyr Asp Asn Asn Gly Thr Lys Asn Tyr Gln
115 120 125
Val Gln Ala Thr Ser Ala Thr Ser Thr Thr Ala Thr Ala Thr Thr Thr
130 135 140
Thr Ala Thr Gly Thr Thr Thr Thr Ser Thr Gly Pro Thr Ser Thr Ala
145 150 155 160
Ser Val Ser Phe Pro Thr Gly Asn Ser Thr Ile Ser Ser Trp Ile Lys
165 170 175
Asn Gln Glu Glu Ile Ser Arg Phe Ala Met Leu Arg Asn Ile Asn Pro
180 185 190
Pro Gly Ser Ala Thr Gly Phe Ile Ala Ala Ser Leu Ser Thr Ala Gly
195 200 205
Pro Asp Tyr Tyr Tyr Ser Trp Thr Arg Asp Ser Ala Leu Thr Ala Asn
210 215 220
Val Ile Ala Tyr Glu Tyr Asn Thr Thr Phe Thr Gly Asn Thr Thr Leu
225 230 235 240
Leu Lys Tyr Leu Lys Asp Tyr Val Thr Phe Ser Val Lys Ser Gln Ser
245 250 255
Val Ser Thr Val Cys Asn Cys Leu Gly Glu Pro Lys Phe Asn Ala Asp
260 265 270
Gly Ser Ser Phe Thr Gly Pro Trp Gly Arg Pro Gln Asn Asp Gly Pro
275 280 285
Ala Glu Arg Ala Val Thr Phe Met Leu Ile Ala Asp Ser Tyr Leu Thr
290 295 300
Gln Thr Lys Asp Ala Ser Tyr Val Thr Gly Thr Leu Lys Pro Ala Ile
305 310 315 320
Phe Lys Asp Leu Asp Tyr Val Val Ser Val Trp Ser Asn Gly Cys Tyr
325 330 335
Asp Leu Trp Glu Glu Val Asn Gly Val His Phe Tyr Thr Leu Met Val
340 345 350
Met Arg Lys Gly Leu Ile Leu Gly Ala Asp Phe Ala Ala Arg Asn Gly
355 360 365
Asp Ser Ser Arg Ala Ser Thr Tyr Lys Gln Thr Ala Ser Thr Met Glu
370 375 380
Ser Lys Ile Ser Ser Phe Trp Ser Asp Ser Asn Asn Tyr Val Gln Val
385 390 395 400
Ser Gln Ser Val Thr Ala Gly Val Ser Lys Lys Gly Leu Asp Val Ser
405 410 415
Thr Leu Leu Ala Ala Asn Ile Gly Ser Leu Pro Asp Gly Phe Phe Thr
420 425 430
Pro Gly Ser Glu Lys Ile Leu Ala Thr Ala Val Ala Leu Glu Asn Ala
435 440 445
Phe Ala Ser Leu Tyr Pro Ile Asn Ser Asn Leu Pro Ser Tyr Leu Gly
450 455 460
Asn Ser Ile Gly Arg Tyr Pro Glu Asp Thr Tyr Asn Gly Asn Gly Asn
465 470 475 480
Ser Gln Gly Asn Pro Trp Phe Leu Ala Val Asn Ala Tyr Ala Glu Leu
485 490 495
Tyr Tyr Arg Ala Ile Lys Glu Trp Ile Ser Asn Gly Lys Val Thr Val
500 505 510
Ser Asn Ile Ser Leu Pro Phe Phe Lys Lys Phe Asp Ser Ser Ala Thr
515 520 525
Ser Gly Lys Thr Tyr Thr Ala Gly Thr Ser Asp Phe Asn Asn Leu Ala
530 535 540
Gln Asn Ile Ala Leu Gly Ala Asp Arg Phe Leu Ser Thr Val Lys Phe
545 550 555 560
His Ala Tyr Thr Asn Gly Ser Leu Ser Glu Glu Tyr Asp Arg Ser Thr
565 570 575
Gly Met Ser Thr Gly Ala Arg Asp Leu Thr Trp Ser His Ala Ser Leu
580 585 590
Ile Thr Val Ala Tyr Ala Lys Ala Gly Ser Pro Ala Ala
595 600 605
<210> 42
<211> 479
<212> PRT
<213> 蜡样芽胞杆菌
<400> 42
Met Thr Thr Ser Asn Thr Tyr Lys Phe Tyr Leu Asn Gly Glu Trp Arg
1 5 10 15
Glu Ser Ser Ser Gly Glu Thr Ile Glu Ile Pro Ser Pro Tyr Leu His
20 25 30
Glu Val Ile Gly Gln Val Gln Ala Ile Thr Arg Gly Glu Val Asp Glu
35 40 45
Ala Ile Ala Ser Ala Lys Glu Ala Gln Lys Ser Trp Ala Glu Ala Ser
50 55 60
Leu Gln Asp Arg Ala Lys Tyr Leu Tyr Lys Trp Ala Asp Glu Leu Val
65 70 75 80
Asn Met Gln Asp Glu Ile Ala Asp Ile Ile Met Lys Glu Val Gly Lys
85 90 95
Gly Tyr Lys Asp Ala Lys Lys Glu Val Val Arg Thr Ala Asp Phe Ile
100 105 110
Arg Tyr Thr Ile Glu Glu Ala Leu His Met His Gly Glu Ser Met Met
115 120 125
Gly Asp Ser Phe Pro Gly Gly Thr Lys Ser Lys Leu Ala Ile Ile Gln
130 135 140
Arg Ala Pro Leu Gly Val Val Leu Ala Ile Ala Pro Phe Asn Tyr Pro
145 150 155 160
Val Asn Leu Ser Ala Ala Lys Leu Ala Pro Ala Leu Ile Met Gly Asn
165 170 175
Ala Val Ile Phe Lys Pro Ala Thr Gln Gly Ala Ile Ser Gly Ile Lys
180 185 190
Met Val Glu Ala Leu His Lys Ala Gly Leu Pro Lys Gly Leu Val Asn
195 200 205
Val Ala Thr Gly Arg Gly Ser Val Ile Gly Asp Tyr Leu Val Glu His
210 215 220
Glu Gly Ile Asn Met Val Ser Phe Thr Gly Gly Thr Asn Thr Gly Lys
225 230 235 240
His Leu Ala Lys Lys Ala Ser Met Ile Pro Leu Val Leu Glu Leu Gly
245 250 255
Gly Lys Asp Pro Gly Ile Val Arg Glu Asp Ala Asp Leu Gln Asp Ala
260 265 270
Ala Asn His Ile Val Ser Gly Ala Phe Ser Tyr Ser Gly Gln Arg Cys
275 280 285
Thr Ala Ile Lys Arg Val Leu Val His Glu Asn Val Ala Asp Glu Leu
290 295 300
Val Ser Leu Val Lys Glu Gln Val Ala Lys Leu Ser Val Gly Ser Pro
305 310 315 320
Glu Gln Asp Ser Thr Ile Val Pro Leu Ile Asp Asp Lys Ser Ala Asp
325 330 335
Phe Val Gln Gly Leu Val Asp Asp Ala Val Glu Lys Gly Ala Thr Ile
340 345 350
Val Ile Gly Asn Lys Arg Glu Arg Asn Leu Ile Tyr Pro Thr Leu Ile
355 360 365
Asp His Val Thr Glu Glu Met Lys Val Ala Trp Glu Glu Pro Phe Gly
370 375 380
Pro Ile Leu Pro Ile Ile Arg Val Ser Ser Asp Glu Gln Ala Ile Glu
385 390 395 400
Ile Ala Asn Lys Ser Glu Phe Gly Leu Gln Ala Ser Val Phe Thr Lys
405 410 415
Asp Ile Asn Lys Ala Phe Ala Ile Ala Asn Lys Ile Glu Thr Gly Ser
420 425 430
Val Gln Ile Asn Gly Arg Thr Glu Arg Gly Pro Asp His Phe Pro Phe
435 440 445
Ile Gly Val Lys Gly Ser Gly Met Gly Ala Gln Gly Ile Arg Lys Ser
450 455 460
Leu Glu Ser Met Thr Arg Glu Lys Val Thr Val Leu Asn Leu Val
465 470 475
<210> 43
<211> 495
<212> PRT
<213> 酿酒酵母
<400> 43
Met Thr Thr Asp Asn Ala Lys Ala Gln Leu Thr Ser Ser Ser Gly Gly
1 5 10 15
Asn Ile Ile Val Val Ser Asn Arg Leu Pro Val Thr Ile Thr Lys Asn
20 25 30
Ser Ser Thr Gly Gln Tyr Glu Tyr Ala Met Ser Ser Gly Gly Leu Val
35 40 45
Thr Ala Leu Glu Gly Leu Lys Lys Thr Tyr Thr Phe Lys Trp Phe Gly
50 55 60
Trp Pro Gly Leu Glu Ile Pro Asp Asp Glu Lys Asp Gln Val Arg Lys
65 70 75 80
Asp Leu Leu Glu Lys Phe Asn Ala Val Pro Ile Phe Leu Ser Asp Glu
85 90 95
Ile Ala Asp Leu His Tyr Asn Gly Phe Ser Asn Ser Ile Leu Trp Pro
100 105 110
Leu Phe His Tyr His Pro Gly Glu Ile Asn Phe Asp Glu Asn Ala Trp
115 120 125
Leu Ala Tyr Asn Glu Ala Asn Gln Thr Phe Thr Asn Glu Ile Ala Lys
130 135 140
Thr Met Asn His Asn Asp Leu Ile Trp Val His Asp Tyr His Leu Met
145 150 155 160
Leu Val Pro Glu Met Leu Arg Val Lys Ile His Glu Lys Gln Leu Gln
165 170 175
Asn Val Lys Val Gly Trp Phe Leu His Thr Pro Phe Pro Ser Ser Glu
180 185 190
Ile Tyr Arg Ile Leu Pro Val Arg Gln Glu Ile Leu Lys Gly Val Leu
195 200 205
Ser Cys Asp Leu Val Gly Phe His Thr Tyr Asp Tyr Ala Arg His Phe
210 215 220
Leu Ser Ser Val Gln Arg Val Leu Asn Val Asn Thr Leu Pro Asn Gly
225 230 235 240
Val Glu Tyr Gln Gly Arg Phe Val Asn Val Gly Ala Phe Pro Ile Gly
245 250 255
Ile Asp Val Asp Lys Phe Thr Asp Gly Leu Lys Lys Glu Ser Val Gln
260 265 270
Lys Arg Ile Gln Gln Leu Lys Glu Thr Phe Lys Gly Cys Lys Ile Ile
275 280 285
Val Gly Val Asp Arg Leu Asp Tyr Ile Lys Gly Val Pro Gln Lys Leu
290 295 300
His Ala Met Glu Val Phe Leu Asn Glu His Pro Glu Trp Arg Gly Lys
305 310 315 320
Val Val Leu Val Gln Val Ala Val Pro Ser Arg Gly Asp Val Glu Glu
325 330 335
Tyr Gln Tyr Leu Arg Ser Val Val Asn Glu Leu Val Gly Arg Ile Asn
340 345 350
Gly Gln Phe Gly Thr Val Glu Phe Val Pro Ile His Phe Met His Lys
355 360 365
Ser Ile Pro Phe Glu Glu Leu Ile Ser Leu Tyr Ala Val Ser Asp Val
370 375 380
Cys Leu Val Ser Ser Thr Arg Asp Gly Met Asn Leu Val Ser Tyr Glu
385 390 395 400
Tyr Ile Ala Cys Gln Glu Glu Lys Lys Gly Ser Leu Ile Leu Ser Glu
405 410 415
Phe Thr Gly Ala Ala Gln Ser Leu Asn Gly Ala Ile Ile Val Asn Pro
420 425 430
Trp Asn Thr Asp Asp Leu Ser Asp Ala Ile Asn Glu Ala Leu Thr Leu
435 440 445
Pro Asp Val Lys Lys Glu Val Asn Trp Glu Lys Leu Tyr Lys Tyr Ile
450 455 460
Ser Lys Tyr Thr Ser Ala Phe Trp Gly Glu Asn Phe Val His Glu Leu
465 470 475 480
Tyr Ser Thr Ser Ser Ser Ser Thr Ser Ser Ser Ala Thr Lys Asn
485 490 495
<210> 44
<211> 896
<212> PRT
<213> 酿酒酵母
<400> 44
Met Thr Thr Thr Ala Gln Asp Asn Ser Pro Lys Lys Arg Gln Arg Ile
1 5 10 15
Ile Asn Cys Val Thr Gln Leu Pro Tyr Lys Ile Gln Leu Gly Glu Ser
20 25 30
Asn Asp Asp Trp Lys Ile Ser Ala Thr Thr Gly Asn Ser Ala Leu Phe
35 40 45
Ser Ser Leu Glu Tyr Leu Gln Phe Asp Ser Thr Glu Tyr Glu Gln His
50 55 60
Val Val Gly Trp Thr Gly Glu Ile Thr Arg Thr Glu Arg Asn Leu Phe
65 70 75 80
Thr Arg Glu Ala Lys Glu Lys Pro Gln Asp Leu Asp Asp Asp Pro Leu
85 90 95
Tyr Leu Thr Lys Glu Gln Ile Asn Gly Leu Thr Thr Thr Leu Gln Asp
100 105 110
His Met Lys Ser Asp Lys Glu Ala Lys Thr Asp Thr Thr Gln Thr Ala
115 120 125
Pro Val Thr Asn Asn Val His Pro Val Trp Leu Leu Arg Lys Asn Gln
130 135 140
Ser Arg Trp Arg Asn Tyr Ala Glu Lys Val Ile Trp Pro Thr Phe His
145 150 155 160
Tyr Ile Leu Asn Pro Ser Asn Glu Gly Glu Gln Glu Lys Asn Trp Trp
165 170 175
Tyr Asp Tyr Val Lys Phe Asn Glu Ala Tyr Ala Gln Lys Ile Gly Glu
180 185 190
Val Tyr Arg Lys Gly Asp Ile Ile Trp Ile His Asp Tyr Tyr Leu Leu
195 200 205
Leu Leu Pro Gln Leu Leu Arg Met Lys Phe Asn Asp Glu Ser Ile Ile
210 215 220
Ile Gly Tyr Phe His His Ala Pro Trp Pro Ser Asn Glu Tyr Phe Arg
225 230 235 240
Cys Leu Pro Arg Arg Lys Gln Ile Leu Asp Gly Leu Val Gly Ala Asn
245 250 255
Arg Ile Cys Phe Gln Asn Glu Ser Phe Ser Arg His Phe Val Ser Ser
260 265 270
Cys Lys Arg Leu Leu Asp Ala Thr Ala Lys Lys Ser Lys Asn Ser Ser
275 280 285
Asn Ser Asp Gln Tyr Gln Val Ser Val Tyr Gly Gly Asp Val Leu Val
290 295 300
Asp Ser Leu Pro Ile Gly Val Asn Thr Thr Gln Ile Leu Lys Asp Ala
305 310 315 320
Phe Thr Lys Asp Ile Asp Ser Lys Val Leu Ser Ile Lys Gln Ala Tyr
325 330 335
Gln Asn Lys Lys Ile Ile Ile Gly Arg Asp Arg Leu Asp Ser Val Arg
340 345 350
Gly Val Val Gln Lys Leu Arg Ala Phe Glu Thr Phe Leu Ala Met Tyr
355 360 365
Pro Glu Trp Arg Asp Gln Val Val Leu Ile Gln Val Ser Ser Pro Thr
370 375 380
Ala Asn Arg Asn Ser Pro Gln Thr Ile Arg Leu Glu Gln Gln Val Asn
385 390 395 400
Glu Leu Val Asn Ser Ile Asn Ser Glu Tyr Gly Asn Leu Asn Phe Ser
405 410 415
Pro Val Gln His Tyr Tyr Met Arg Ile Pro Lys Asp Val Tyr Leu Ser
420 425 430
Leu Leu Arg Val Ala Asp Leu Cys Leu Ile Thr Ser Val Arg Asp Gly
435 440 445
Met Asn Thr Thr Ala Leu Glu Tyr Val Thr Val Lys Ser His Met Ser
450 455 460
Asn Phe Leu Cys Tyr Gly Asn Pro Leu Ile Leu Ser Glu Phe Ser Gly
465 470 475 480
Ser Ser Asn Val Leu Lys Asp Ala Ile Val Val Asn Pro Trp Asp Ser
485 490 495
Val Ala Val Ala Lys Ser Ile Asn Met Ala Leu Lys Leu Asp Lys Glu
500 505 510
Glu Lys Ser Asn Leu Glu Ser Lys Leu Trp Lys Glu Val Pro Thr Ile
515 520 525
Gln Asp Trp Thr Asn Lys Phe Leu Ser Ser Leu Lys Glu Gln Ala Ser
530 535 540
Ser Asn Asp Asp Met Glu Arg Lys Met Thr Pro Ala Leu Asn Arg Pro
545 550 555 560
Val Leu Leu Glu Asn Tyr Lys Gln Ala Lys Arg Arg Leu Phe Leu Phe
565 570 575
Asp Tyr Asp Gly Thr Leu Thr Pro Ile Val Lys Asp Pro Ala Ala Ala
580 585 590
Ile Pro Ser Ala Arg Leu Tyr Thr Ile Leu Gln Lys Leu Cys Ala Asp
595 600 605
Pro His Asn Gln Ile Trp Ile Ile Ser Gly Arg Asp Gln Lys Phe Leu
610 615 620
Asn Lys Trp Leu Gly Gly Lys Leu Pro Gln Leu Gly Leu Ser Ala Glu
625 630 635 640
His Gly Cys Phe Met Lys Asp Val Ser Cys Gln Asp Trp Val Asn Leu
645 650 655
Thr Glu Lys Val Asp Met Ser Trp Gln Val Arg Val Asn Glu Val Met
660 665 670
Glu Glu Phe Thr Thr Arg Thr Pro Gly Ser Phe Ile Glu Arg Lys Lys
675 680 685
Val Ala Leu Thr Trp His Tyr Arg Arg Thr Val Pro Glu Leu Gly Glu
690 695 700
Phe His Ala Lys Glu Leu Lys Glu Lys Leu Leu Ser Phe Thr Asp Asp
705 710 715 720
Phe Asp Leu Glu Val Met Asp Gly Lys Ala Asn Ile Glu Val Arg Pro
725 730 735
Arg Phe Val Asn Lys Gly Glu Ile Val Lys Arg Leu Val Trp His Gln
740 745 750
His Gly Lys Pro Gln Asp Met Leu Lys Gly Ile Ser Glu Lys Leu Pro
755 760 765
Lys Asp Glu Met Pro Asp Phe Val Leu Cys Leu Gly Asp Asp Phe Thr
770 775 780
Asp Glu Asp Met Phe Arg Gln Leu Asn Thr Ile Glu Thr Cys Trp Lys
785 790 795 800
Glu Lys Tyr Pro Asp Gln Lys Asn Gln Trp Gly Asn Tyr Gly Phe Tyr
805 810 815
Pro Val Thr Val Gly Ser Ala Ser Lys Lys Thr Val Ala Lys Ala His
820 825 830
Leu Thr Asp Pro Gln Gln Val Leu Glu Thr Leu Gly Leu Leu Val Gly
835 840 845
Asp Val Ser Leu Phe Gln Ser Ala Gly Thr Val Asp Leu Asp Ser Arg
850 855 860
Gly His Val Lys Asn Ser Glu Ser Ser Leu Lys Ser Lys Leu Ala Ser
865 870 875 880
Lys Ala Tyr Val Met Lys Arg Ser Ala Ser Tyr Thr Gly Ala Lys Val
885 890 895
<210> 45
<211> 1440
<212> DNA
<213> 蜡样芽胞杆菌
<400> 45
atgacaacat caaataccta caaattctat ctaaacggtg aatggagaga atcttcctct 60
ggagaaacta ttgagatacc atcaccatac ttacatgaag tgatcggaca ggttcaagca 120
atcactagag gagaggttga cgaagcgatt gctagcgcta aggaagcaca gaaatcttgg 180
gctgaggcat ctctacaaga tagagctaag tacttgtaca aatgggcaga tgaattggta 240
aacatgcaag acgaaatcgc cgatatcatc atgaaggaag tgggcaaggg ttacaaagac 300
gctaaaaagg aggttgttag aaccgccgat ttcatcagat acaccattga agaggcactc 360
catatgcacg gtgaatccat gatgggcgat tcatttcctg gtggaacaaa atctaagcta 420
gcaataatcc aaagagcgcc tctgggtgta gtcttagcca tcgctccatt caattaccct 480
gtaaaccttt ctgctgcaaa attggcacca gccttaatta tgggtaacgc tgtgatattc 540
aagccagcaa ctcagggtgc tatttccggc atcaaaatgg ttgaagcttt gcataaggct 600
ggtttgccaa agggtttggt taacgttgcc acaggtagag gtagcgtcat aggcgattat 660
ttggtcgaac acgaagggat aaacatggtt tccttcaccg gtggcactaa cactggtaag 720
catttagcaa aaaaggcctc aatgattcca ttagtcttgg aacttggtgg caaagatcca 780
ggcatcgttc gtgaagatgc agacctacaa gatgctgcga atcatatcgt atctggtgcg 840
ttcagttact cagggcagag atgtacagcc attaagagag tccttgttca tgaaaatgtt 900
gctgatgaac tggtatcatt ggttaaggaa caagtggcaa agctttctgt gggatcacca 960
gagcaagatt caacaattgt tcctctgatt gacgataagt ccgctgattt tgttcagggt 1020
ttagtggacg atgcagtcga aaagggcgct acaattgtca ttgggaacaa gagagaacgt 1080
aacctaatct acccaacatt gattgatcac gtcacagagg aaatgaaagt tgcctgggag 1140
gaaccattcg gtcctattct tccaattatt agagttagta gcgacgagca agctattgaa 1200
attgcaaata agagtgagtt cggattacaa gcttctgtgt ttaccaaaga cataaacaag 1260
gcattcgcaa tcgcaaataa gattgagact ggttcagtgc aaatcaacgg tagaacagag 1320
agaggaccag atcactttcc ttttatcggg gttaagggat ctgggatggg tgcccaaggc 1380
atcagaaagt ctttggaatc tatgactaga gaaaaagtta ctgtcttaaa tctcgtatga 1440
<210> 46
<211> 1548
<212> DNA
<213> 扣囊复膜酵母
<400> 46
atgattagat taaccgtatt cctcactgca gtttttgcag cagtcgcttc ctgtgttcca 60
gttgaattgg ataagagaaa tacaggccat ttccaagcat attctggtta caccgtagct 120
agatcaaact ttactcaatg gattcacgag caaccagccg tatcatggta ctatttgctt 180
cagaatatag actatccaga aggacaattc aagtctgcca agccaggggt cgttgtggct 240
tccccttcta catccgaacc tgattacttc taccaatgga ctagagatac tgctatcacc 300
ttcttgtcac ttatcgcgga agttgaggat cattcttttt caaatactac actagccaag 360
gtggttgaat actacatctc taatacttac acattacaaa gagtttccaa cccatctggt 420
aacttcgaca gtccaaatca cgacggtttg ggagaaccaa agtttaatgt tgatgataca 480
gcttatactg catcttgggg tagaccacaa aatgatggcc cagcgttgag agcatacgca 540
atttcaagat accttaacgc agtagcaaaa cacaacaacg gtaagttact gctcgctgga 600
caaaacggta ttccttactc ttcagcttct gatatctact ggaagattat caagccagat 660
cttcaacatg tgtcaaccca ttggtctaca tctggttttg atttgtggga agagaatcag 720
ggaacacatt tctttactgc gttggtccag ctaaaagcac ttagttacgg cattccttta 780
agtaagacct acaacgatcc tggtttcact agttggctag aaaagcaaaa ggatgcttta 840
aactcttata tcaacagctc tggtttcgta aactctggca aaaagcatat agtggagagc 900
cctcaactat cttcaagagg agggttggat agcgccacat acattgcagc cttaatcaca 960
catgatattg gcgacgacga cacttacaca cctttcaacg ttgacaactc ctatgtcttg 1020
aactcactgt attaccttct agtcgataac aaaaaccgtt acaaaatcaa tggtaactac 1080
aaggccggtg ctgctgttgg tagataccca gaggatgttt acaacggtgt tgggacatca 1140
gaaggcaatc catggcaatt agctacagcc tacgccggcc aaacatttta cacactggct 1200
tacaactcat tgaaaaacaa aaaaaactta gtgattgaaa agttgaacta cgacctctac 1260
aattctttca tagcagattt atccaagatc gatagttctt acgcatcaaa agactccttg 1320
actttgacct acggttctga caactacaaa aacgtcataa agtcactatt acagtttgga 1380
gattcattcc tgaaggtctt gctcgatcac attgatgata atggacaatt aacagaagag 1440
atcaatagat acacagggtt ccaggctggt gctgttagtt tgacatggtc ctctggttca 1500
ttactttcag caaaccgtgc gagaaataag ttgattgaac tattgtag 1548
<210> 47
<211> 1548
<212> DNA
<213> 扣囊复膜酵母
<400> 47
atgatcagac ttacagtttt cctaacagcc gttttcgccg ccgttgcatc atgtgtccca 60
gtagaattgg ataagagaaa caccggccat ttccaagcat attcaggata caccgttgca 120
cgttctaatt tcacacaatg gattcatgag cagcctgctg tgtcctggta ctacttatta 180
caaaacattg attatcctga gggacaattc aagtcagcga aaccaggcgt tgtggttgct 240
tctccatcca cttcagaacc agactacttc taccagtgga cccgtgacac agcaataact 300
ttcttatctt tgatagcaga agtagaagat cactcatttt caaatacaac tctagctaag 360
gttgtcgaat actacatctc taacacatac accctacaaa gagtttctaa cccatctggt 420
aatttcgata gcccaaatca cgatggtctg ggtgaaccaa agttcaacgt tgacgacact 480
gcttacactg catcatgggg cagacctcaa aacgacggtc cagccttaag agcttacgcg 540
atctcaagat atttgaacgc agttgccaag cataacaacg gtaagctatt gctcgcgggt 600
caaaatggta ttccttactc atctgcatca gatatctact ggaagattat caagccagat 660
ttacaacatg taagtactca ctggagtaca tctggttttg acttatggga agagaatcaa 720
ggtacacatt tctttactgc acttgtccag ttaaaagctc tttcatacgg tatacctttg 780
tctaagacat ataacgatcc aggatttact tcttggttgg aaaagcagaa ggatgccttg 840
aactcttaca tcaattccag cggcttcgtc aactccggga aaaagcacat tgtcgaatct 900
cctcaattat ctagtagagg gggtcttgat agcgctactt acatcgctgc tctaattaca 960
catgatattg gtgatgatga tacatacact ccttttaacg tagataattc ttatgtgctg 1020
aactctttat actatctgct tgtagacaac aaaaacagat acaagatcaa cgggaactac 1080
aaagcaggag ctgcagttgg tagataccca gaagatgtgt acaatggagt gggaacctca 1140
gagggaaacc catggcaatt ggcgacagca tacgccggcc aaacctttta cacactggct 1200
tacaattctc tcaaaaacaa aaaaaatttg gttattgaga agttgaatta cgatctatac 1260
aactccttta tagctgactt aagtaagatt gactcctctt acgcttctaa ggattcattg 1320
acattgacct acggctcaga taactacaaa aatgtcatta agtcactttt acaattcggg 1380
gattctttct tgaaagtctt gttggaccat attgatgata atggtcagct aacagaggaa 1440
atcaacagat atacaggttt tcaagctggc gcagtttccc tcacttggag tagtggttca 1500
ctcttatctg caaacagagc cagaaacaag ttgatcgaat tgctttag 1548
<210> 48
<211> 1548
<212> DNA
<213> 扣囊复膜酵母
<400> 48
atgatcagac ttactgtttt cctcacagcc gtttttgcag cagtagcttc ttgtgttcca 60
gttgaattgg ataagagaaa tacaggtcat ttccaagctt actctggtta cactgtggct 120
agatctaact tcacacaatg gattcatgaa cagcctgccg tgagttggta ctatttgcta 180
caaaacattg attaccctga gggtcaattc aaatcagcta agccaggtgt tgttgtcgcg 240
agcccatcaa cttctgaacc agattacttc taccaatgga ctagagatac cgcaataacc 300
ttcttatctc taatcgcaga ggtagaagat cactcttttt caaatactac cctggcaaaa 360
gtggtcgagt actacatctc aaacacatac accttgcaga gagtctcaaa cccatcagga 420
aacttcgatt ctcctaatca tgacggctta ggagaaccaa agtttaatgt tgacgatacc 480
gcttatactg catcttgggg tagaccacag aatgatggcc ctgccttacg tgcatacgcc 540
atttccagat atctcaacgc tgtagcgaag cacaacaacg gtaagctgct tttagctggt 600
caaaatggga taccatactc ttccgcttca gacatttact ggaagattat caaaccagac 660
ttgcagcatg tcagtacaca ttggtcaact tctggttttg atttgtggga agagaaccaa 720
ggcactcact tctttacagc cttggttcaa ctaaaggcat tgtcttacgg aatccctttg 780
tccaagacat acaatgatcc tggattcact agttggctag aaaagcaaaa ggatgcactg 840
aactcataca ttaacagttc aggctttgtg aactccggta aaaagcatat tgttgaaagc 900
ccacaactat ctagcagagg tggtttagat tctgcaacct acatagcagc cttgatcaca 960
cacgacattg gggatgacga tacatacaca ccattcaacg tcgacaattc atacgttttg 1020
aatagcttat actacctact ggtagataac aaaaacagat ataagatcaa tggcaactac 1080
aaggccggtg ctgccgtagg aagataccct gaagatgtct acaacggagt tggtacatca 1140
gaaggtaacc catggcaatt agcaacagca tatgcgggcc agacatttta cactttggct 1200
tacaattcat tgaaaaacaa aaaaaattta gtgatagaaa agcttaacta tgacctttac 1260
aactctttca ttgccgattt atccaagatt gattcctcct acgcatcaaa ggactccttg 1320
acacttacat acggttctga caactacaaa aatgttatca agtctctctt gcaatttggt 1380
gattctttct tgaaggtttt actcgatcat atcgatgata atggtcaact aactgaggaa 1440
atcaacagat acactgggtt ccaagctgga gctgtctctt taacatggag ttcagggagt 1500
ttgttatctg ctaacagagc gcgtaacaaa cttattgagc ttctgtag 1548
<210> 49
<211> 1548
<212> DNA
<213> 扣囊复膜酵母
<400> 49
atgattagat taacagtatt tcttacagcc gttttcgcag ccgtcgcatc ctgtgttcca 60
gtagaattag ataagcgtaa tacaggacat tttcaagctt actctggcta tacagttgcg 120
agatctaact ttacacaatg gattcacgaa cagccagcag tttcttggta ctatttgctc 180
caaaacatcg actaccctga aggccaattc aagtctgcaa agccaggagt ggtcgtcgct 240
tctcctagta cttcagaacc agattacttc taccagtgga caagagacac tgctattacc 300
ttcctgagct taatcgctga agttgaagat cactcttttt ctaatacaac actggccaaa 360
gtagttgagt actacatctc taacacttac actctacaaa gagtgtcaaa cccttctggg 420
aacttcgaca gcccaaacca tgatggtttg ggggagccaa aattcaacgt tgatgataca 480
gcctacaccg catcttgggg tagaccacaa aacgacggac cagctttaag agcatacgca 540
atatctcgtt accttaatgc tgttgcaaag cacaataatg gaaagttgtt gttggctggt 600
caaaacggta ttccttactc ttcagcatct gatatctact ggaagattat caagccagat 660
cttcaacacg tatccacaca ttggtcaacc tccggcttcg atttatggga ggaaaatcag 720
ggtacacatt tcttcaccgc tctagtgcaa ttgaaggctt tgagttacgg cattccattg 780
tctaagactt acaacgatcc tggtttcacc tcatggcttg aaaagcagaa ggatgccctg 840
aatagctaca tcaactcatc tggttttgtt aactcaggga aaaagcatat agttgaatcc 900
ccacaactat catcaagagg aggtttagac tccgccacat acattgctgc cttgattaca 960
catgatattg gggatgatga cacatatact ccatttaacg tcgataacag ttatgtcctt 1020
aattccttat actatttgtt ggtcgataac aaaaatagat acaaaatcaa cggcaactac 1080
aaggctggcg cagcggtggg tagataccct gaggatgttt acaatggtgt aggtacatct 1140
gaaggcaatc catggcaatt agcgactgct tacgctggac aaactttcta cacacttgcg 1200
tacaactcat tgaaaaacaa aaaaaaccta gtcattgaaa agttgaatta cgatctgtac 1260
aactctttca tcgcagacct atcaaagatt gactcatctt atgcaagtaa agattcacta 1320
actttaacct acggtagtga taactacaaa aacgttatca agtctttact ccagtttggt 1380
gattcattct tgaaggtgtt gttagatcat atagacgaca atggtcaact cacagaggag 1440
ataaacagat acactggttt tcaagcagga gctgtttcac ttacttggtc aagtggttct 1500
ttgctttccg ccaacagagc cagaaacaag ctcatcgaat tactatag 1548
<210> 50
<211> 1797
<212> DNA
<213> 米根霉
<400> 50
atgaagttca tttccacttt cttgaccttc attttggctg ctgtctctgt caccgctgca 60
tctattccat ctagtgcatc tgtacaattg gactcctaca attacgatgg ttccacattt 120
tccggcaaga tttatgtcaa aaacatcgct tactctaaaa aggttactgt tgtgtacgca 180
gacggttctg acaactggaa caataacggc aacactattg ctgcatcatt ttcaggccca 240
atctctggat caaattacga atactggaca ttctcagcat cagtgaaggg cataaaggag 300
ttctacatca aatacgaagt ttcaggtaag acatattacg acaataacaa ctctgcaaac 360
taccaagtct caacttctaa acctactaca actactgcag ctacaaccac aactacagct 420
ccatcaactt ctacaacaac ccgtccatct agttcagagc ctgccacctt ccctactggt 480
aattctacca tcagctcttg gatcaaaaag caggaagata tttccagatt cgctatgctt 540
agaaacatca acccacctgg ttctgccaca gggtttatcg ccgcatcact ctctaccgct 600
ggtccagatt actactacgc gtggacaaga gatgccgctt tgacatctaa cgttatcgtt 660
tacgaataca acaccacatt gtctgggaat aagacaattc taaacgtact taaggattac 720
gtcacattca gtgttaagac acagtctact tcaacagttt gtaattgcct tggtgaacca 780
aagttcaatc cagacggcag tggttacaca ggtgcttggg gtagacctca aaatgatggt 840
cctgcagaaa gagcgactac atttgttctg tttgccgaca gctacttgac tcaaactaag 900
gatgcctcat acgtcactgg tacattaaag ccagcaattt tcaaagatct cgattacgtt 960
gttaacgtct ggagtaacgg atgtttcgat ttatgggagg aggtgaacgg agttcatttc 1020
tacaccctta tggttatgag aaaagggcta ttgttggggg ctgatttcgc gaagagaaac 1080
ggtgactcaa ctagagcctc aacttactct tctactgctt ccacaattgc taacaagata 1140
tcaagtttct gggttagctc aaacaactgg gtgcaagtat cccaatctgt cacaggaggt 1200
gtaagtaaaa aggggttaga cgttagcacc ctgttagctg cgaatctagg atcagtcgat 1260
gatggatttt tcactccagg ttctgaaaag atattagcta cagctgtggc agtcgaagat 1320
tcctttgcca gtctataccc aatcaacaaa aaccttccat catacttggg gaacgctatt 1380
ggaagatacc ctgaagatac atacaacggt aatggtaact cacaaggcaa tccttggttt 1440
ctggcggtta ccggctacgc agagttgtac tatagagcaa ttaaggaatg gatttctaat 1500
ggaggcgtta cagtgtcctc tatctcattg ccatttttca aaaagttcga tagctctgca 1560
acatccggta aaaagtacac cgtaggtact tctgacttca acaatttagc acaaaacatt 1620
gctcttgctg cagatcgttt cctatctact gtacaactcc atgcaccaaa caatggttca 1680
ttagcagagg aatttgatag aacaacaggt ttttctaccg gcgctagaga tttaacatgg 1740
tcccacgcct cattgataac agcatcctat gccaaagccg gtgctccagc tgcataa 1797
<210> 51
<211> 1797
<212> DNA
<213> 米根霉
<400> 51
atgaagttta tctccacgtt tttaaccttt atcctagcag ctgtcagcgt caccgccgca 60
tcaattccga gttcagcatc tgtacaactt gactcttaca attacgatgg cagcactttc 120
tcagggaaaa tttatgtgaa aaacatagca tatagtaaga aggttaccgt ggtatatgca 180
gacggttctg ataattggaa taataatgga aacactattg ccgccagttt ttccggccca 240
atttctggtt ccaattacga gtattggacc ttttctgcat cagtaaaagg catcaaggaa 300
ttctatatta agtacgaagt ttcaggtaag acatattacg ataacaataa ctcagcaaat 360
tatcaagtct ctacatctaa gcccacaaca acaactgctg ctaccaccac tacaaccgct 420
ccttctacca gcaccactac cagaccaagc tctagtgaac cggctacctt tcctaccgga 480
aacagtacca tctcaagctg gatcaaaaag caagaggaca taagtcgttt tgctatgttg 540
aggaacatta atcctccagg atccgcgacc ggtttcattg cagcatcact aagtactgcc 600
gggcctgatt attattatgc ttggactaga gacgctgcat taacatcaaa cgtgattgtt 660
tatgaatata atacgaccct ttccggtaat aaaacgatct tgaacgtatt aaaagactat 720
gtgaccttta gtgtgaagac ccaatctaca tctacagtgt gtaattgttt gggagaacct 780
aaattcaatc cagacggttc tgggtacact ggtgcctggg gtagacctca aaacgacggt 840
ccagcagaaa gagcaacaac ctttgttcta tttgctgact cttatttaac gcaaacaaag 900
gacgcctcat atgttacagg gaccctaaaa ccagcaattt tcaaagactt ggattatgtt 960
gttaatgttt ggagcaacgg atgttttgac ttgtgggagg aggttaacgg tgtacacttt 1020
tatacattga tggtgatgag aaaagggttg ctattgggag cagatttcgc taaaagaaat 1080
ggtgattcta caagagcgag cacatatagt agcaccgctt caacaatcgc caataaaatc 1140
tcatctttct gggtatctag caacaactgg gtacaagttt cccaaagtgt taccggcggt 1200
gtgtccaaaa agggtttaga cgttagcaca cttctagctg ctaatttggg tagcgttgat 1260
gacgggtttt ttactccagg tagtgagaag atactggcaa ccgcggtggc ggttgaagac 1320
agctttgctt cattgtatcc tataaataaa aatctgccct cttatctggg taatgcaatt 1380
ggcagatacc cagaagatac ctacaatggt aatggtaatt cccaggggaa cccatggttt 1440
ttggctgtta caggctacgc agaactttat taccgtgcaa tcaaggaatg gatttcaaat 1500
ggcggcgtca ctgtcagtag tataagtttg ccctttttta agaaatttga ttcctcagca 1560
acgtctggta aaaaatacac cgtaggtact agtgatttca ataatttggc ccaaaatatt 1620
gcgcttgctg ctgacaggtt tcttagtacc gttcagttgc acgctccaaa taatggctca 1680
ttggctgaag aatttgatcg tacgacaggt ttctccactg gtgctaggga tttgacttgg 1740
agtcatgcct ccttaatcac agcaagctat gctaaagctg gtgcacctgc tgcttag 1797
<210> 52
<211> 1815
<212> DNA
<213> 戴尔根霉
<400> 52
atgcagctgt tcaacttgcc attaaaggtt tcattctttt tggtcctatc atactttagt 60
ttgttggtgt cagccgcatc tattccatct tcagcatctg tacaattaga ctcctacaat 120
tacgacggct ctacattcag cggaaagatt tacgtgaaaa atattgcgta cagcaaaaaa 180
gtaactgtta tctatgccga cggatcagat aactggaaca acaatggaaa cactatcgct 240
gccagttact ctgcaccaat ttcaggttct aactacgaat attggacatt ctcagcctcc 300
atcaatggca ttaaggaatt ctacataaag tacgaagttt ccggtaagac ttactacgat 360
aacaacaatt ctgcaaacta tcaagtatca acatcaaaac ctactaccac caccgccaca 420
gctacaacta caactgcacc ttcaacatct accacaaccc caccatcttc tagcgaacca 480
gctacattcc caactggcaa ttctactatt tctagttgga tcaaaaaaca agagggtatt 540
tccagattcg caatgttgag aaacataaat ccaccaggat cagcaactgg attcatcgca 600
gcttctttgt ccacagcggg gccagattac tactacgcat ggaccagaga tgctgctttg 660
acaagtaacg ttattgttta cgaatacaat accactttgt ccggtaacaa gactattctt 720
aacgtcctaa aggattacgt tacattctct gttaagactc agtctacatc cacagtctgc 780
aattgtttgg gtgaaccaaa gttcaaccca gatggctctg gatacacagg tgcctggggt 840
cgtccacaaa acgatgggcc tgccgagaga gccactacat ttatcctatt tgctgactca 900
taccttacac aaacaaaaga tgcatcctac gtgactggaa cattaaagcc tgcaatcttc 960
aaagacctgg attacgttgt caacgtgtgg tctaacggct gtttcgatct atgggaagag 1020
gttaacggcg tgcacttcta cactctaatg gtcatgagaa agggtctgtt gttaggtgca 1080
gattttgcta agagaaacgg tgattctaca cgtgcttcta cctactcctc aacagcatca 1140
actattgcga acaagatttc ttcattttgg gtttcaagta ataactggat acaagtatct 1200
caaagcgtta cagggggtgt ctcaaaaaag ggtcttgatg tttctacatt actggctgct 1260
aatcttgggt ctgttgatga cggtttcttc acccctggtt ctgaaaagat cctcgctacc 1320
gccgtcgcgg ttgaggatag ttttgcttca ctctatccta taaacaaaaa ccttccttca 1380
tacttaggaa acagtatcgg tagataccca gaggatacat acaatggtaa tggcaattca 1440
cagggaaatc catggttcct tgctgttaca gggtacgcag aactttacta tagagctatt 1500
aaggaatgga tcggcaacgg cggtgtgaca gtttcctcaa tctcattgcc atttttcaaa 1560
aagtttgact ccagcgcgac atctggtaaa aagtatactg tggggacttc tgatttcaac 1620
aatttggctc aaaacattgc cttagctgcc gacagattct tatctaccgt acaactccat 1680
gcacataaca atggtagttt ggcagaggaa tttgatagaa ctacaggact ctctacaggt 1740
gcgagagatt taacttggtc acatgcaagt ttaattacag cctcttacgc aaaggctggt 1800
gctcctgctg cataa 1815
<210> 53
<211> 1815
<212> DNA
<213> 戴尔根霉
<400> 53
atgcagttat tcaacttacc acttaaggta tctttctttc tagtcttatc ttacttttca 60
ttgttagtat cagctgcctc tataccaagt tcagcatccg tacaactaga ttcatacaat 120
tacgacggtt caacattctc aggaaagata tacgtgaaaa atattgctta cagcaaaaag 180
gttactgtga tttacgcaga tgggtcagac aactggaata acaatggaaa cacaattgct 240
gcttcctatt ctgcccctat ttctggatct aactacgaat actggacttt ttcagcgagt 300
ataaacggaa ttaaggaatt ctatatcaaa tatgaagtct ctggtaagac ctactacgat 360
aacaacaact ccgcaaacta ccaagttagc acatcaaagc caaccacaac aactgctact 420
gcgacaacta caaccgcacc aagcacttct actacaacac ctcctagttc atctgagcca 480
gcaactttcc caactggtaa ttccactatt tcttcttgga tcaaaaaaca agagggtatc 540
tcaagattcg ccatgcttag aaatatcaat cctccaggct ctgcaacagg attcattgca 600
gcatctttat caactgcggg gccagactac tactacgcct ggactagaga tgcagctttg 660
acatcaaatg tgattgttta tgaatacaac acaactttgt ccggtaacaa gacaatcttg 720
aacgtcttga aggattatgt gacattctct gtcaagactc aatctacatc aacagtttgt 780
aactgtctcg gcgaaccaaa gttcaaccct gatggtagtg gttacactgg tgcttggggt 840
agaccacaaa acgatggtcc agcagagaga gctacaactt tcatcttgtt tgctgactct 900
tacctaacac aaaccaagga tgcaagctac gttactggaa cactaaagcc tgcaatcttt 960
aaagacctgg actatgttgt aaacgtttgg tcaaatggct gcttcgatct atgggaggaa 1020
gtgaacggtg ttcacttcta cacattaatg gtcatgagaa agggactctt gcttggtgca 1080
gactttgcta agagaaacgg tgattctaca cgtgcctcca cttactcctc cacagcttca 1140
accattgcca acaaaatctc ttctttctgg gtcagctcaa ataactggat tcaagtttct 1200
caatcagtta ctggtggtgt ttctaaaaag ggcctggatg tgtcaacctt gcttgctgcc 1260
aatttgggca gtgttgatga cgggttcttc accccaggtt ctgaaaagat cctcgccacc 1320
gcagttgccg ttgaagattc atttgctagt ttatacccaa tcaacaaaaa tctaccatca 1380
taccttggaa attcaatcgg tagatatcca gaggatacat acaacggtaa tggaaactct 1440
cagggtaacc cttggtttct tgcagttaca gggtacgctg aactgtacta cagagcgatt 1500
aaggaatgga ttggtaatgg cggcgtaact gttagttcta tttctctacc tttcttcaaa 1560
aagttcgata gttctgcaac atctggtaaa aagtacacag tcggcacttc cgattttaac 1620
aatttagctc agaacatagc actggcagct gatcgtttct tgagtacagt ccaattgcat 1680
gcccataaca acggtagttt ggctgaagag tttgatagaa ccaccggttt atcaaccggc 1740
gccagagatt taacatggtc ccatgcgtct ttgataactg cttcttacgc caaggctggg 1800
gcaccagctg cctga 1815
<210> 54
<211> 1818
<212> DNA
<213> 小孢根霉
<400> 54
atgaaactta tgaatccatc tatgaaggca tacgttttct ttatcttaag ctacttctct 60
ttactcgtta gctcagctgc ggtgccaacc tctgccgccg tacaagttga gtcatacaat 120
tatgacggta ccactttttc aggtagaata ttcgtcaaaa acattgccta ctcaaaggtc 180
gtaacagtta tctactccga tggatcagat aactggaaca ataacaacaa caaagtttct 240
gcagcttact cagaagcaat ttctgggtct aactacgaat actggacatt ctccgcaaag 300
ttatccggaa ttaaacagtt ttatgtcaaa tacgaagttt ctggttcaac atattacgac 360
aacaacggta ccaaaaacta ccaagtccaa gcaacctcag cgacatctac aacagctact 420
gcaaccacaa ctacagctac tggcacaaca actacttcta caggtccaac tagtactgca 480
tccgtatcat tccctaccgg taactcaaca atttcttcct ggataaaaaa tcaagaggaa 540
atcagccgtt ttgctatgtt gagaaatatc aatccacctg ggtctgccac agggttcata 600
gccgcatctc tgtccacagc cggcccagat tactattact cttggactag agattcagca 660
ctaacagcta atgtgatcgc ttacgaatac aacacaacat tcactggaaa caccaccctt 720
cttaagtact tgaaagatta cgttacattt tctgtcaaaa gccaatctgt atctaccgtt 780
tgtaactgtc tgggagaacc aaagttcaac gctgatggta gttcttttac aggtccatgg 840
ggcagaccac aaaacgacgg accagcagag agagctgtta cttttatgtt gattgctgac 900
agctacttga ctcaaactaa ggacgcatcc tacgttaccg gtacattaaa gccagcaatc 960
ttcaaagatc ttgattacgt agtttctgtt tggtctaacg gttgctacga tttatgggaa 1020
gaggttaatg gtgttcattt ctatactctc atggtcatga gaaagggttt gatcttaggt 1080
gccgacttcg ctgctagaaa tggtgactct agtagagctt caacctacaa gcaaactgca 1140
tcaacaatgg aatcaaagat cagttctttt tggtcagatt ctaacaacta cgtccaagtt 1200
tctcaatcag ttaccgccgg agtgtcaaaa aagggactag atgttagtac actattggcg 1260
gccaacattg gtagtctgcc tgatggcttt ttcactccag gctccgaaaa gatattggct 1320
acagcagtgg cgttagaaaa tgcattcgca tccttgtacc caattaactc taacctacct 1380
tcttacttgg gtaactcaat tggaagatat cctgaggata catacaacgg taatggcaac 1440
tctcagggga atccatggtt ccttgccgtc aacgcatacg cagaacttta ctacagagct 1500
attaaggaat ggattagtaa tggcaaggtg acagtatcca atatctcact acctttcttc 1560
aaaaagtttg attcttccgc cacttctgga aagacataca ctgctggtac atcagatttc 1620
aataacttgg ctcagaacat tgctttaggc gccgatagat tcctgtctac tgttaagttc 1680
cacgcataca ctaacgggag tctatcagaa gagtacgata gatctaccgg tatgagtact 1740
ggggctcgtg atttaacatg gtcccatgct tcattgatca cagtggcgta cgcaaaggcc 1800
ggtagtcctg cagcttag 1818
<210> 55
<211> 1488
<212> DNA
<213> 酿酒酵母
<400> 55
atgactacgg ataacgctaa ggcgcaactg acctcgtctt cagggggtaa cattattgtg 60
gtgtccaaca ggcttcccgt gacaatcact aaaaacagca gtacgggaca gtacgagtac 120
gcaatgtcgt ccggagggct ggtcacggcg ttggaagggt tgaagaagac gtacactttc 180
aagtggttcg gatggcctgg gctagagatt cctgacgatg agaaggatca ggtgaggaag 240
gacttgctgg aaaagtttaa tgccgtaccc atcttcctga gcgatgaaat cgcagactta 300
cactacaacg ggttcagtaa ttctattcta tggccgttat tccattacca tcctggtgag 360
atcaatttcg acgagaatgc gtggttggca tacaacgagg caaaccagac gttcaccaac 420
gagattgcta agactatgaa ccataacgat ttaatctggg tgcatgatta ccatttgatg 480
ttggttccgg aaatgttgag agtcaagatt cacgagaagc aactgcaaaa cgttaaggtc 540
gggtggttcc tgcacacacc attcccttcg agtgaaattt acagaatctt acctgtcaga 600
caagagattt tgaagggtgt tttgagttgt gatttagtcg ggttccacac atacgattat 660
gcaagacatt tcttgtcttc cgtgcaaaga gtgcttaacg tgaacacatt gcctaatggg 720
gtggaatacc agggcagatt cgttaacgta ggggccttcc ctatcggtat cgacgtggac 780
aagttcaccg atgggttgaa aaaggaatcc gtacaaaaga gaatccaaca attgaaggaa 840
actttcaagg gctgcaagat catagttggt gtcgacaggc tggattacat caaaggtgtg 900
cctcagaagt tgcacgccat ggaagtgttt ctgaacgagc atccagaatg gaggggcaag 960
gttgttctgg tacaggttgc agtgccaagt cgtggagatg tggaagagta ccaatattta 1020
agatctgtgg tcaatgagtt ggtcggtaga atcaacggtc agttcggtac tgtggaattc 1080
gtccccatcc atttcatgca caagtctata ccatttgaag agctgatttc gttatatgct 1140
gtgagcgatg tctgtttggt ctcgtccacc cgtgatggta tgaacttggt ttcctacgaa 1200
tatattgctt gccaagaaga aaagaaaggt tccttaatcc tgagtgagtt cacaggtgcc 1260
gcacaatcct tgaatggtgc tattattgta aatccttgga acaccgatga tctttctgat 1320
gccatcaacg aggccttgac tttgcccgat gtaaagaaag aagttaactg ggaaaaactt 1380
tacaaataca tctctaaata cacttctgcc ttctggggtg aaaatttcgt ccatgaatta 1440
tacagtacat catcaagctc aacaagctcc tctgccacca aaaactga 1488
<210> 56
<211> 2691
<212> DNA
<213> 酿酒酵母
<400> 56
atgaccacca ctgcccaaga caattctcca aagaagagac agcgtatcat caattgtgtc 60
acgcagctgc cctacaaaat ccaattggga gaaagcaacg atgactggaa aatatctgct 120
actacaggta acagcgcatt atattcctct ctagaatacc ttcaatttga ttctaccgag 180
tacgagcaac acgttgttgg ttggaccggc gaaataacaa gaaccgaacg caacctgttt 240
actagagaag cgaaagagaa accacaggat ctggacgatg acccactata tttaacaaaa 300
gagcagatca atgggttgac tactactcta caagatcata tgaaatctga taaagaggca 360
aagaccgata ctactcaaac agctcccgtt accaataacg ttcatcccgt ttggctactt 420
agaaaaaacc agagtagatg gagaaattac gcggaaaaag taatttggcc aaccttccac 480
tacatcttga atccttcaaa tgaaggtgag caagaaaaaa actggtggta cgactacgtc 540
aagtttaacg aagcttatgc acaaaaaatc ggggaagttt acaggaaggg tgacatcatc 600
tggatccatg actactacct actgctattg cctcaactac tgagaatgaa atttaacgac 660
gaatctatca ttattggtta tttccatcat gccccatggc ctagtaatga atattttcgc 720
tgtttgccac gtagaaaaca aatcttagat ggtcttgttg gggccaatag aatttgtttc 780
caaaatgaat ctttctcccg tcattttgta tcgagttgta aaagattact cgacgcaacc 840
gccaagaaat ctaaaaactc ttccgatagt gatcaatatc aagtgtctgt gtacggtggt 900
gacgtactcg tagattcttt gcctataggt gttaacacaa ctcaaatact gaaagatgct 960
ttcacgaagg atatagattc caaggttctt tccatcaagc aagcttatca aaacaaaaaa 1020
attattattg gtagagatcg tctggattcc gtcagaggcg tcgttcaaaa attaagagct 1080
tttgaaactt tcttggccat gtatccagaa tggcgagatc aagtggtatt gatccaggtc 1140
agcagtccta ctgctaacag aaattccccc caaactatca gattggaaca acaagtcaac 1200
gagttggtta attccataaa ttctgaatat ggtaatttga atttttctcc cgtccagcat 1260
tattatatga gaatccctaa agatgtatac ttgtccttac taagagttgc agacttatgt 1320
ttaatcacaa gtgttagaga cggtatgaat accactgctt tggaatacgt cactgtgaaa 1380
tctcacatgt cgaacttttt atgctacgga aatccattga ttttaagtga gttttctggc 1440
tctagtaacg tattgaaaga tgccattgtc gttaacccat gggattcggt ggccgtggct 1500
aaatctatta acatggcttt gaaattggac aaggaagaaa agtccaattt agaatcaaaa 1560
ttatggaaag aagttcctac aattcaagat tggactaata agtttttgag ttcattaaag 1620
gaaaaggcgt catctgatga tgatgtggaa aggaaaatga ctccagcact taatagacct 1680
gttcttttag aaaactacaa gcaggctaag cgtagattat tcctttttga ttacgatggt 1740
actttgaccc caattgtcaa agacccagct gcagctattc catcggcaag actttataca 1800
attctacaaa aattatgtgc cgatcctcat aatcaaatct ggattatttc tggtcgtgac 1860
cagaagtttt tgaacaagtg gttaggcggt aaacttcctc aactgggtct aagtgcggag 1920
catggatgtt tcatgaaaga tgtttcttgc caagattggg tcaatttgac cgaaaaagtt 1980
gatatgtctt ggcaagtacg cgtcaatgaa gtgatggaag aatttaccac aaggacccca 2040
ggttcattca tcgaaagaaa gaaagtcgct ctaacttggc attatagacg taccgttcca 2100
gaattgggtg aattccacgc caaagaactg aaagaaaaat tgttatcatt tactgatgac 2160
ttcgatttag aggtcatgga tggtaaagca aacattgaag ttcgtccaag attcgtcaac 2220
aaaggtgaaa tagtcaagag actagtctgg catcaacatg gcaaaccaca ggacatgttg 2280
aagggaatca gtgaaaaact acctaaggat gaaatgcctg attttgtatt atgtctgggt 2340
gatgacttca ctgacgaaga catgtttaga cagttgaata ccattgaaac ttgttggaaa 2400
gaaaaatatc ctgaccaaaa aaatcaatgg ggcaactacg gattctatcc tgtcactgtg 2460
ggatctgcat ccaagaaaac tgtcgcaaag gctcatttaa ccgatcctca gcaagtcctg 2520
gagactttag gtttacttgt tggtgatgtc tctctcttcc aaagtgctgg tacggtcgac 2580
ctggattcca gaggtcatgt caagaatagt gagagcagtt tgaaatcaaa gctagcatct 2640
aaagcttatg ttatgaaaag atcggcttct tacaccggcg caaaggtttg a 2691
<210> 57
<211> 250
<212> PRT
<213> 酿酒酵母
<400> 57
Met Pro Leu Thr Thr Lys Pro Leu Ser Leu Lys Ile Asn Ala Ala Leu
1 5 10 15
Phe Asp Val Asp Gly Thr Ile Ile Ile Ser Gln Pro Ala Ile Ala Ala
20 25 30
Phe Trp Arg Asp Phe Gly Lys Asp Lys Pro Tyr Phe Asp Ala Glu His
35 40 45
Val Ile His Ile Ser His Gly Trp Arg Thr Tyr Asp Ala Ile Ala Lys
50 55 60
Phe Ala Pro Asp Phe Ala Asp Glu Glu Tyr Val Asn Lys Leu Glu Gly
65 70 75 80
Glu Ile Pro Glu Lys Tyr Gly Glu His Ser Ile Glu Val Pro Gly Ala
85 90 95
Val Lys Leu Cys Asn Ala Leu Asn Ala Leu Pro Lys Glu Lys Trp Ala
100 105 110
Val Ala Thr Ser Gly Thr Arg Asp Met Ala Lys Lys Trp Phe Asp Ile
115 120 125
Leu Lys Ile Lys Arg Pro Glu Tyr Phe Ile Thr Ala Asn Asp Val Lys
130 135 140
Gln Gly Lys Pro His Pro Glu Pro Tyr Leu Lys Gly Arg Asn Gly Leu
145 150 155 160
Gly Phe Pro Ile Asn Glu Gln Asp Pro Ser Lys Ser Lys Val Val Val
165 170 175
Phe Glu Asp Ala Pro Ala Gly Ile Ala Ala Gly Lys Ala Ala Gly Cys
180 185 190
Lys Ile Val Gly Ile Ala Thr Thr Phe Asp Leu Asp Phe Leu Lys Glu
195 200 205
Lys Gly Cys Asp Ile Ile Val Lys Asn His Glu Ser Ile Arg Val Gly
210 215 220
Glu Tyr Asn Ala Glu Thr Asp Glu Val Glu Leu Ile Phe Asp Asp Tyr
225 230 235 240
Leu Tyr Ala Lys Asp Asp Leu Leu Lys Trp
245 250
<210> 58
<211> 250
<212> PRT
<213> 酿酒酵母
<400> 58
Met Gly Leu Thr Thr Lys Pro Leu Ser Leu Lys Val Asn Ala Ala Leu
1 5 10 15
Phe Asp Val Asp Gly Thr Ile Ile Ile Ser Gln Pro Ala Ile Ala Ala
20 25 30
Phe Trp Arg Asp Phe Gly Lys Asp Lys Pro Tyr Phe Asp Ala Glu His
35 40 45
Val Ile Gln Val Ser His Gly Trp Arg Thr Phe Asp Ala Ile Ala Lys
50 55 60
Phe Ala Pro Asp Phe Ala Asn Glu Glu Tyr Val Asn Lys Leu Glu Ala
65 70 75 80
Glu Ile Pro Val Lys Tyr Gly Glu Lys Ser Ile Glu Val Pro Gly Ala
85 90 95
Val Lys Leu Cys Asn Ala Leu Asn Ala Leu Pro Lys Glu Lys Trp Ala
100 105 110
Val Ala Thr Ser Gly Thr Arg Asp Met Ala Gln Lys Trp Phe Glu His
115 120 125
Leu Gly Ile Arg Arg Pro Lys Tyr Phe Ile Thr Ala Asn Asp Val Lys
130 135 140
Gln Gly Lys Pro His Pro Glu Pro Tyr Leu Lys Gly Arg Asn Gly Leu
145 150 155 160
Gly Tyr Pro Ile Asn Glu Gln Asp Pro Ser Lys Ser Lys Val Val Val
165 170 175
Phe Glu Asp Ala Pro Ala Gly Ile Ala Ala Gly Lys Ala Ala Gly Cys
180 185 190
Lys Ile Ile Gly Ile Ala Thr Thr Phe Asp Leu Asp Phe Leu Lys Glu
195 200 205
Lys Gly Cys Asp Ile Ile Val Lys Asn His Glu Ser Ile Arg Val Gly
210 215 220
Gly Tyr Asn Ala Glu Thr Asp Glu Val Glu Phe Ile Phe Asp Asp Tyr
225 230 235 240
Leu Tyr Ala Lys Asp Asp Leu Leu Lys Trp
245 250
<210> 59
<211> 2995
<212> DNA
<213> 人工序列
<220>
<223> 合成多核苷酸
<400> 59
tgagctccgg gtgggaggaa ggcgcggcaa ttagaatgtg tgggtgcgga agctcgccgc 60
tcccatcaag agagtggaag acgtatggtc tgggtgcgaa gtaccaccac gtttcttttt 120
catctcttaa gtgggattct tacgaaacac gtcacagggt caaaagaaag agaacaaaag 180
caatattgta attgtctcag tccacggcaa tgacatggca tggccccgaa ggcttttttt 240
gtctgtcttc cttgggtctt accccgccac gcgttaatag tgagacaagc aggaaatccg 300
tatcattttc tcgcatacac gaacccgcgt gcgcctggta aattgcagga ttctcattgt 360
ccggttttct ttatgggaat aatcatcatc accattatca ctgttactct tgcgatcatc 420
atcattaaca taattttttt aacgctgttt gatgatggta tgtgctttta ttgttcctta 480
ctcacctttt cctttgtgtc ttttaatttt gaccattttg accattttga cctttgatga 540
tgtgtgagtt cctcttttct ttttttcttt tcttttttcc tttttttttc ttttcttact 600
gtgttaatca ctttctttcc tttttgttca tattgtcgtc ttgttcattt tcgttcaatt 660
gataatgtat ataaatcttt cgtaagtatc tcttgattgc catttttttc tttccaagtt 720
tccttgttct cgaggccaga aaaaggaagt gtttccctcc ttcttgaatt gatgttaccc 780
tcataaagca cgtggcctct tatcgagaaa gaaattaccg tcgctcgtga tttgtttgca 840
aaaagaacaa aactgaaaaa acccagacac gctcgacttc ctgtcttcct attgattgca 900
gcttccaatt tcgtcacaca acaaggtcct agcgacggct cacaggtttt gtaacaagca 960
atcgaaggtt ctggaatggc gggaaagggt ttagtaccac atgctatgat gcccactgtg 1020
atctccagag caaagttcgt tcgatcgtac tgttactctc tctctttcaa acagaattgt 1080
ccgaatcgtg tgacaacaac agcctgttct cacacactct tttcttctaa ccaagggggt 1140
ggtttagttt agtagaacct cgtgaaactt acatttacat atatataaac ttgcataaat 1200
tggtcaatgc aagaaataca tatttggtct tttctaattc gtagtttttc aagttcttag 1260
atgctttctt tttctctttt ttacagatca tcaaggaagt aattatctac tttttacaag 1320
tctagaatga caacatcaaa tacctacaaa ttctatctaa acggtgaatg gagagaatct 1380
tcctctggag aaactattga gataccatca ccatacttac atgaagtgat cggacaggtt 1440
caagcaatca ctagaggaga ggttgacgaa gcgattgcta gcgctaagga agcacagaaa 1500
tcttgggctg aggcatctct acaagataga gctaagtact tgtacaaatg ggcagatgaa 1560
ttggtaaaca tgcaagacga aatcgccgat atcatcatga aggaagtggg caagggttac 1620
aaagacgcta aaaaggaggt tgttagaacc gccgatttca tcagatacac cattgaagag 1680
gcactccata tgcacggtga atccatgatg ggcgattcat ttcctggtgg aacaaaatct 1740
aagctagcaa taatccaaag agcgcctctg ggtgtagtct tagccatcgc tccattcaat 1800
taccctgtaa acctttctgc tgcaaaattg gcaccagcct taattatggg taacgctgtg 1860
atattcaagc cagcaactca gggtgctatt tccggcatca aaatggttga agctttgcat 1920
aaggctggtt tgccaaaggg tttggttaac gttgccacag gtagaggtag cgtcataggc 1980
gattatttgg tcgaacacga agggataaac atggtttcct tcaccggtgg cactaacact 2040
ggtaagcatt tagcaaaaaa ggcctcaatg attccattag tcttggaact tggtggcaaa 2100
gatccaggca tcgttcgtga agatgcagac ctacaagatg ctgcgaatca tatcgtatct 2160
ggtgcgttca gttactcagg gcagagatgt acagccatta agagagtcct tgttcatgaa 2220
aatgttgctg atgaactggt atcattggtt aaggaacaag tggcaaagct ttctgtggga 2280
tcaccagagc aagattcaac aattgttcct ctgattgacg ataagtccgc tgattttgtt 2340
cagggtttag tggacgatgc agtcgaaaag ggcgctacaa ttgtcattgg gaacaagaga 2400
gaacgtaacc taatctaccc aacattgatt gatcacgtca cagaggaaat gaaagttgcc 2460
tgggaggaac cattcggtcc tattcttcca attattagag ttagtagcga cgagcaagct 2520
attgaaattg caaataagag tgagttcgga ttacaagctt ctgtgtttac caaagacata 2580
aacaaggcat tcgcaatcgc aaataagatt gagactggtt cagtgcaaat caacggtaga 2640
acagagagag gaccagatca ctttcctttt atcggggtta agggatctgg gatgggtgcc 2700
caaggcatca gaaagtcttt ggaatctatg actagagaaa aagttactgt cttaaatctc 2760
gtatgattaa acaggcccct tttcctttgt cgatatcatg taattagtta tgtcacgctt 2820
acattcacgc cctcctccca catccgctct aaccgaaaag gaaggagtta gacaacctga 2880
agtctaggtc cctatttatt tttttatagt tatgttagta ttaagaacgt tatttatatt 2940
tcaaattttt cttttttttc tgtacaaacg cgtgtacgca tgtaacgggc agacg 2995
机译: 遗传工程化的酵母横纹脂多糖和生产生物基乙醇酸的方法
机译: 遗传工程化的酵母横纹脂多糖和生产生物基乙醇酸的方法
机译: 琼脂培养基,用于分离和鉴定高乙醇生产性和主要大豆酱油发酵酵母菌,用于分离酵母菌的方法和用于通过使用酵母菌生产含盐发酵食品的方法