首页> 中国专利> 通过指导的内切核酸酶和单链寡核苷酸进行基因组编辑

通过指导的内切核酸酶和单链寡核苷酸进行基因组编辑

摘要

本发明涉及用于在微生物细胞基因组的靶序列中引入一个或多个所需核苷酸修饰的方法,这些方法使用多核苷酸指导的内切核酸酶,例如通过InscriptaTM分离并描述的MAD7酶或熟知的化脓链球菌Cas9,连同用于每个待修饰的靶序列的合适的指导RNA,以在至少一个基因组靶序列中产生位点特异性切口或缺口,随后经由至少一种能够与该至少一个基因组靶序列杂交的寡核苷酸修复该一个或多个切口和/或缺口,从而非常高效地将该一个或多个所需修饰引入该靶序列中。

著录项

  • 公开/公告号CN113039278A

    专利类型发明专利

  • 公开/公告日2021-06-25

    原文格式PDF

  • 申请/专利权人 诺维信公司;

    申请/专利号CN201980064817.6

  • 发明设计人 G.穆齐-埃里赫森;N.约胡姆森;

    申请日2019-10-30

  • 分类号C12N15/90(20060101);C12N15/10(20060101);C12N15/113(20060101);

  • 代理机构11105 北京市柳沈律师事务所;

  • 代理人张文辉

  • 地址 丹麦鲍斯韦

  • 入库时间 2023-06-19 11:35:49

说明书

序列表的引用

本申请包含计算机可读形式的序列表。该计算机可读形式通过引用并入本文。

技术领域

本发明提供了用于通过采用可编程多核苷酸指导的内切核酸酶(例如,通过Inscripta

背景技术

最初从化脓链球菌分离的所谓的CRISPR(成簇的规律间隔的短回文重复序列)Cas9基因组编辑系统已被广泛用作修饰多种微生物以及高等生物的基因组的工具。

可编程Cas9酶具有两个能够靶向特定基因组序列的RNA指导的DNA内切核酸酶结构域。该系统已被广泛描述用于在各种真核生物[Doudna,J.A.和E.Charpentier,Genomeediting.[基因组编辑]The new frontier of genome engineering with CRISPR-Cas9[采用CRISPR-Cas9进行基因组工程化的新前沿].Science[科学],2014.346(6213):第1258096页]、人干细胞[Paquet,D.等人,Efficient introduction of specifichomozygous and heterozygous mutations using CRISPR/Cas9[使用CRISPR/Cas9高效引入特定纯合和杂合突变].Nature[自然],2016.533:第125-129页]、小鼠合子[Inui,M.等人,Rapid generation of mouse models with defined point mutations by theCRISPR/Cas9 system[通过CRISPR/Cas9系统快速产生具有限定点突变的小鼠模型].SciRep[科学报告].2014;4:5396]、猪[Wang,K.等人,Efficient Generation of OrthologousPoint Mutations in Pigs via CRISPR-assisted ssODN-mediated Homology-directedRepair[经由CRISPR辅助的ssODN介导的同源定向修复在猪中高效产生直向同源点突变].Mol Ther Nucleic Acids[分子疗法-核酸].2016年11月;5(11):e396]、大肠杆菌(E.coli)[Jiang,W.等人,RNA-guided editing of bacterial genomes using CRISPR-Cassystems[使用CRISPR-Cas系统对细菌基因组的RNA指导的编辑].Nat Biotechnol[自然生物技术],2013.31(3):第233-9页]、酵母[DiCarlo,J.E.等人,Genome engineering inSaccharomyces cerevisiae using CRISPR-Cas systems[使用CRISPR-Cas系统在酿酒酵母中进行基因组工程化].Nucleic Acids Res[核酸研究],2013.41(7):第4336-43页、[Horwitz,A.A.等人,Efficient Multiplexed Integration of Synergistic Allelesand Metabolic Pathways in Yeasts via CRISPR-Cas[经由CRISPR-Cas在酵母中进行协同等位基因和代谢途径的高效多重整合].Cell Syst[细胞系统].2015.1(1):第88-96页]、乳杆菌属(Lactobacillus)[Oh,J.H.和J.P.van Pijkeren,CRISPR-Cas9-assistedrecombineering in Lactobacillus reuteri[罗伊氏乳杆菌中的CRISPR-Cas9辅助重组工程化].Nucleic Acids Res[核酸研究],2014.42(17):第e131页]和丝状真菌(如里氏木霉(Trichoderma reesei))[Liu,R.等人,Efficient genome editing in filamentousfungus Trichoderma reesei using the CRISP R/Cas9 system[使用CRISPR/Cas9系统在丝状真菌里氏木霉中进行高效基因组编辑].Cell Discovery[细胞发现],2015.1]中编辑基因组。

Cas9系统的力量在于它的简单性以及靶向和编辑特定目的基因的能力。另外,可能的是在单个反应中靶向多个基因进行修饰(多重化),以产生插入和缺失,以及沉默或活化基因。在2012年,Cas9蛋白被证明是双RNA指导的内切核酸酶蛋白[Jinek,M.等人,Aprogrammable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity[在自适应细菌免疫中的可编程双RNA指导的DNA内切核酸酶].Science[科学],2012.337(6096):第816-21页.]。

进一步开发已导致了单指导RNA分子的工程化,该分子将内切核酸酶指导至其DNA靶标。单指导RNA保留了与Cas9蛋白相互作用和靶向所需核苷酸序列所必需的关键特征。当与RNA分子复合时,Cas9蛋白与靶序列结合并使用两个催化结构域产生双链断裂。

当工程化为在任一催化结构域中含有单个氨基酸突变时,Cas9蛋白起切口酶的作用,切口酶是具有单链切割活性的变体蛋白。最近Xu等人证实了经由CRISPR-Cas9切口酶在解纤维梭菌(Clostridium cellulyticum)中进行基因组编辑[Xu,T.等人,EfficientGenome Editing in Clostridium cellulolyticum via CRISPR-Cas9 Nickase[经由CRISPR-Cas9切口酶在解纤维梭菌中进行高效基因组编辑].Appl Environ Microbiol[应用与环境微生物学],2015.81(13):第4423-31页.]。

与基因组编辑有关的大量科学出版物和公开的专利申请已成为可用的。最近,

自从首次发现Cas9酶以来,已描述了许多新的多核苷酸指导的且可编程的内切核酸酶,包括例如从马达加斯加分离并由Inscripta

已证明,在基于Cas9的基因组编辑中使用单链寡核苷酸作为供体DNA是可能的。然而,几项研究已证明,在距切割位点的距离与使用单链寡核苷酸作为供体DNA的突变掺入之间存在负相关[Inui等人,2014;Wang等人,2016;Paquet等人,2016;参见上文]。在猪(猪胎儿成纤维细胞)中,Wang等人(2016)证明了11bp的突变到切口距离导致两个点突变之间同源定向修复效率的显著差异[Wang,K.等人,Efficient Generation of OrthologousPoint Mutations in Pigs via CRISPR-assisted ssODN-mediated Homology-directedRepair[经由CRISPR辅助的ssODN介导的同源定向修复在猪中高效产生直向同源点突变].Mol Ther Nucleic Acids[分子疗法-核酸].2016年11月;5(11):e396]。同样,对于人诱导多能干细胞,Paquet等人(2016)指出,为了高效的纯合突变掺入,切口到突变距离需要最小化[Paquet,D.等人,Efficient introduction of specific homozygous andheterozygous mutations using CRISPR/Cas9[使用CRISPR/Cas9高效引入特定纯合和杂合突变].Nature[自然],2016.533:第125-129页]。类似地,对于小鼠,Inui等人(2014)报告,修饰位点与gRNA靶位点之间的距离是影响取代效率的重要参数[Inui,M.等人,Rapidgeneration of mouse models with defined point mutations by the CRISPR/Cas9system[通过CRISPR/Cas9系统快速产生具有限定点突变的小鼠模型].Sci Rep[科学报告].2014;4:5396]。

对于在酿酒酵母(Saccharomyces cerevisiae)中进行定向诱变或基因组编辑,Horwitz等人(2015)报告,靶向切割的位点应当尽可能接近所需突变的位点。此外,为了破坏供体DNA中的Cas9靶位点并且同时提高重组事件包括所需突变的机会,Horwitz等人(2015)在靶位点与点突变之间的密码子中进行了沉默改变(一种“异源性阻断”)[Horwitz,A.A.等人,Efficient Multiplexed Integration of Synergistic Alleles andMetabolic Pathways in Yeastsvia CRISPR-Cas[经由CRISPR-Cas在酵母中进行协同等位基因和代谢途径的高效多重整合].Cell Syst[细胞系统].2015.1(1):第88-96页]。

常用基因组编辑方法的一个局限性是,可能在你打算修饰基因组的地方附近难以找到合适的PAM位点和良好的原型间隔子序列,和/或在可读框中靶位点与点突变之间的密码子中多个沉默改变的掺入可能导致不希望的效应,如在真核生物中的选择性剪接。

发明内容

诸位发明人发现,与其他地方已报告的相反,在使用可编程内切核酸酶在待修饰的靶序列附近切割或切开双链基因组DNA序列之后,他们能够在微生物宿主细胞中采用包含所需核苷酸修饰的较长单链寡核苷酸作为修复模板或“供体DNA”,由此寡核苷酸的核苷酸修饰将以相对较高的效率成功地引入双链DNA中。

因此,在第一方面,本发明涉及用于使用多核苷酸指导的内切核酸酶在微生物细胞基因组中的至少一个靶序列中引入一个或多个所需核苷酸修饰的方法,所述方法包括以下步骤:

a)提供微生物宿主细胞,该微生物宿主细胞包含位于该多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列附近的至少一个待修饰的基因组靶序列;

b)用以下转化该微生物宿主细胞:

i)该多核苷酸指导的内切核酸酶和用于该至少一个待修饰的靶序列的至少一种合适的指导多核苷酸,或者编码该多核苷酸指导的内切核酸酶和编码用于该至少一个待修饰的靶序列的至少一种合适的指导多核苷酸的一种或多种多核苷酸,和

ii)能够与该至少一个基因组靶序列杂交的至少一种单链或双链寡核苷酸,所述寡核苷酸包含该一个或多个所需核苷酸修饰;

其中该多核苷酸指导的内切核酸酶与该指导多核苷酸和基因组相互作用并且切割或切开基因组,并且其中该至少一种单链或双链寡核苷酸指导DNA修复穿过该切口或缺口,从而以至少以下的效率将该一个或多个所需修饰引入基因组的该靶序列中:

当该切口或缺口位于距该一个或多个所需核苷酸修饰10-20个核苷酸时为70%,

当该切口或缺口位于距该一个或多个所需核苷酸修饰21-30个核苷酸时为60%,

当该切口或缺口位于距该一个或多个所需核苷酸修饰31-43个核苷酸时为50%,

当该切口或缺口位于距该一个或多个所需核苷酸修饰44-52个核苷酸时为40%,或者

当该切口或缺口位于距该一个或多个所需核苷酸修饰至少53个核苷酸时为30%。

附图说明

图1示出了pSMAI290的质粒图。

图2示出了pNJOC502的质粒图。

图3示出了pNJOC503的质粒图。

图4示出了pNJOC504的质粒图。

图5示出了本文实例5中使用的寡核苷酸的概况。箭头示出了该基因DNA被切割的区域,包括对本研究中使用的寡核苷酸而言同源的区域(未按比例)。每种寡核苷酸在与PAM位点对应的区域中均含有突变,以避免重组时重新切割DNA(由填充的圆圈表示;●)。除了PAM突变之外,每种寡核苷酸还均含有放置地距切割位点的距离越来越远的另一个突变(由三角形表示;

图6示出了本文实例6中使用的寡核苷酸的概况。箭头示出了该基因DNA被切割的区域,包括对本研究中使用的寡核苷酸而言同源的区域(未按比例)。每种寡核苷酸在与PAM位点对应的区域中均含有突变,以避免重组时重新切割DNA(由填充的圆圈表示;●)。除了PAM突变之外,每种寡核苷酸还均含有放置地距切割位点的距离越来越远的另一个突变(由三角形表示;

图7示出了pAT3630的质粒图。

图8示出了pAT3720的质粒图,其用于测试使用米曲霉(Aspergillus oryzae)中的单链寡核苷酸进行的CRISPR/Mad7辅助的突变递送。

图9示出了pGMEr263的质粒图。

图10示出了pGMEr263-proto1的质粒图,其用于测试使用里氏木霉中的单链寡核苷酸进行的CRISPR/Mad7辅助的突变递送。

图11示出了pGMEr263-proto2的质粒图。

图12示出了pGMEr263-proto3的质粒图。

图13示出了pGMEr263-proto4的质粒图。

图14示出了pGMEr263-proto5的质粒图。

定义

基因组修饰:术语“一个或多个基因组修饰”包括基因组序列(无论是非编码还是编码)中的在核苷酸水平上的任何修饰。此类修饰可能不改变编码的多肽的氨基酸序列,或者它们可能导致氨基酸序列的变化,如缺失、插入或取代。

如果一个氨基酸被具有相似特征的另一个氨基酸取代,则它可以被称为保守取代。保守取代的实例是在下组之内:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)以及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不会改变比活性的氨基酸取代是本领域已知的并且例如由H.Neurath和R.L.Hill,1979,于The Proteins[蛋白质],Academic Press[学术出版社],纽约中描述。常见取代为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。

可替代地,这些氨基酸改变具有这样的性质:改变多肽的物理化学特性。例如,氨基酸改变可以提高多肽的热稳定性、改变底物特异性、改变最适pH,等等。

可以根据本领域已知的程序,如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science[科学]244:1081-1085)来鉴定多肽中的必需氨基酸。在后一项技术中,在分子中的每个残基处引入单个丙氨酸突变,并且对所得突变型分子的活性进行测试以鉴定对于分子的活性至关重要的氨基酸残基。还参见,Hilton等人,1996,J.Biol.Chem.[生物化学杂志]271:4699-4708。酶或其他生物学相互作用的活性位点还可以通过对结构的物理分析来确定,如通过诸如下述技术来确定:核磁共振、晶体学、电子衍射或光亲和标记,连同对推定的接触位点氨基酸进行突变。参见例如,de Vos等人,1992,Science[科学]255:306-312;Smith等人,1992,J.Mol.Biol.[分子生物学杂志]224:899-904;Wlodaver等人,1992,FEBS Lett.[欧洲生化学会联合会快报]309:59-64。还可以从与相关多肽的比对来推断必需氨基酸的身份。

使用已知的诱变、重组和/或改组方法,随后进行相关的筛选程序可以做出单个或多个氨基酸取代、缺失和/或插入并对其进行测试,这些相关的筛选程序是如由Reidhaar-Olson和Sauer,1988,Science[科学]241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2152-2156;WO 95/17413;或WO 95/22625披露的那些。其他可以使用的方法包括易错PCR、噬菌体展示(例如Lowman等人,1991,Biochemistry[生物化学]30:10832-10837;美国专利号5,223,409;WO 92/06204)以及区域定向诱变(Derbyshire等人,1986,Gene[基因]46:145;Ner等人,1988,DNA 7:127)。

诱变/改组方法可以与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等人,1999,Nature Biotechnology[自然生物技术]17:893-896)。可以从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域的标准方法快速测序。这些方法允许快速确定多肽中各个氨基酸残基的重要性。

多肽可以是杂合多肽,其中一种多肽的区域在另一种多肽的区域的N末端或C末端处融合。

多肽可以是融合多肽或可切割的融合多肽,其中另一种多肽在本发明多肽的N末端或C末端处融合。通过将编码另一种多肽的多核苷酸融合于本发明的多核苷酸来产生融合多肽。用于产生融合多肽的技术是本领域已知的,并且包括连接编码多肽的编码序列使得它们符合读框,而且融合多肽的表达处于一个或多个相同的启动子和终止子的控制之下。还可以使用内含肽技术构建融合多肽,其中在翻译后产生融合多肽(Cooper等人,1993,EMBO J.[欧洲分子生物学学会杂志]12:2575-2583;Dawson等人,1994,Science[科学]266:776-779)。

融合多肽可以进一步包含两种多肽之间的切割位点。在融合蛋白分泌之时,位点被切割,从而释放出这两种多肽。切割位点的实例包括但不限于在以下文献中披露的位点:Martin等人,2003,J.Ind.Microbiol.Biotechnol.[工业微生物生物技术杂志]3:568-576;Svetina等人,2000,J.Biotechnol.[生物技术杂志]76:245-251;Rasmussen-Wilson等人,1997,Appl.Environ.Microbiol.[应用与环境微生物学]63:3488-3493;Ward等人,1995,Biotechnology[生物技术]13:498-503;和Contreras等人,1991,Biotechnology[生物技术]9:378-381;Eaton等人,1986,Biochemistry[生物化学]25:505-512;Collins-Racie等人,1995,Biotechnology[生物技术]13:982-987;Carter等人,1989,Proteins:Structure,Function,and Genetics[蛋白质:结构、功能以及遗传学]6:240-248;以及Stevens,2003,Drug Discovery World[药物发现世界]4:35-48。

可编程多核苷酸指导的内切核酸酶:在本文中术语“可编程多核苷酸指导的内切核酸酶”或“多核苷酸指导的内切核酸酶”或“多核苷酸指导的核酸酶”可互换地使用。该术语包括所谓的II类Cas9类似物或同源物,其中几种是已知的,并且随着近几年科学兴趣的激增,几乎每月都会发现更多;Makarova K.S.等人提供了综述(An updated evolutionaryclassification of CRISPR-Cas systems[CRISPR-Cas系统的更新的进化分类],2015,Nature[自然]第13卷:722-736)。

Cas内切核酸酶:术语“Cas内切核酸酶”意指与CRISPR相关的RNA指导的DNA内切核酸酶,其在与单指导RNA偶联时切割靶DNA序列。Cas内切核酸酶由一种或多种单指导RNA指导,以识别和切割细胞基因组中的双链DNA中的特定靶位点。CRISPR-Cas系统目前被分类为I型、II型和III型CRISPR-Cas系统(Liu和Fan,2014,Plant Mol.Biol.[植物分子生物学]85:209-218)。出于本披露的目的,CRISPR-Cas系统是采用Cas9内切核酸酶或其变体(包括例如Cas9切口酶)的II型CRISPR-Cas系统。Cas9内切核酸酶包含两个核酸酶结构域:切割互补DNA链的HNH(McrA样)核酸酶结构域和切割非互补DNA链的RuvC样核酸酶结构域。通过Cas9内切核酸酶识别和切割靶标需要嵌合的单指导RNA,其由crRNA(20个核苷酸的指导序列和部分同向重复)和tracrRNA(反式激活crRNA)的融合物以及crRNA结合区下游的短保守序列基序(称为原型间隔子相邻基序(PAM))组成。在来源于细菌化脓链球菌的CRISPR-Cas9系统中,靶DNA紧接在5'-NGG PAM之前。RNA指导的Cas9内切核酸酶活性产生位点特异性双链断裂,然后这些断裂通过非同源末端连接(NHEJ)或同源定向修复(HDR)进行修复。应理解,术语“Cas内切核酸酶”涵盖其变体。

Cas切口酶:术语“Cas9切口酶”意指当与嵌合的单指导RNA偶联时,将单链缺口引入靶双链DNA序列中的Cas9内切核酸酶。通过灭活亲本Cas9内切核酸酶中的两个核酸酶结构域之一(例如,通过定点诱变),可以重组产生Cas9切口酶。Cas9切口酶的非限制性实例是其中的RuvC结构域被来自化脓链球菌的Cas9内切核酸酶中的D10A突变灭活的Cas9切口酶(Sander和Joung,2013,Nature Biotechnology[自然生物技术]1-9)。设计在相对DNA链上的两种指导RNA需要Cas9切口酶来产生双链断裂。

Mad内切核酸酶:术语“Mad内切核酸酶”意指与CRISPR相关的RNA指导的DNA内切核酸酶,其在与单指导RNA偶联时切割靶DNA序列。Mad内切核酸酶由一种或多种单指导RNA指导,以识别和切割细胞基因组中的双链DNA中的特定靶位点。CRISPR-Mad系统与CAS酶的2类家族的V型(Cpf1样)密切相关。出于本披露的目的,CRISPR-Mad系统采用直肠真杆菌(Eubacterium rectale)MAD7内切核酸酶或其变体。MAD7-crRNA复合物通过鉴定原型间隔子相邻基序(PAM)5'-YTTN来切割靶DNA。在鉴定PAM之后,MAD7引入对靶向PAM的3'端突出的4-5个核苷酸的粘性末端DNA双链断裂,然后该断裂通过非同源末端连接(NHEJ)或同源定向修复(HDR)进行修复。应理解,术语“Mad内切核酸酶”涵盖其变体。

Cpf1内切核酸酶:术语“Cpf内切核酸酶”意指与CRISPR相关的RNA指导的DNA内切核酸酶,其在与单指导RNA偶联时切割靶DNA序列。Cpf内切核酸酶由一种或多种单指导RNA指导,以识别和切割细胞基因组中的双链DNA中的特定靶位点。出于本披露的目的,CRISPR-Cpf系统采用氨基酸球菌属物种(Acidaminococcus sp.)Cpf1内切核酸酶、毛螺菌科物种(Lachnospiraceae sp.)Cpf1内切核酸酶或新凶手弗朗西斯氏菌(Francisella novicide)Cpf1内切核酸酶或者其变体。Cpf1-crRNA复合物通过鉴定氨基酸球菌属物种Cpf1内切核酸酶和毛螺菌科物种Cpf1内切核酸酶的原型间隔子相邻基序(PAM)5'-TTTN和新凶手弗朗西斯氏菌Cpf1的PAM序列5'-TTN来切割靶DNA。在鉴定PAM之后,Cpf1引入对靶向PAM的3'端远侧突出的4-5个核苷酸的粘性末端DNA双链断裂,然后该断裂通过非同源末端连接(NHEJ)或同源定向修复(HDR)进行修复。应理解,术语“Cpf1内切核酸酶”涵盖其变体。

核定位信号(NLS):编码可编程内切核酸酶的多核苷酸可以与编码一个或多个核定位信号的一种或多种多核苷酸可操作地连接,因此所表达的内切核酸酶在真核宿主细胞中被有效地从细胞质转运到细胞核。合适的核定位信号的实例包括SV40核定位信号、构巢曲霉(Aspergillus nidulans)GATA转录因子(AreA)、用于纤维素酶和半纤维素酶基因表达的里氏木霉转录调控子(XYR1)、里氏木霉蓝光调控子2(blr2)、非洲爪蟾(Xenopus laevis)卵母细胞核质蛋白核定位信号、秀丽隐杆线虫(Caenorhabditis elegans)转录因子EGL-13核定位信号、智人(homo sapiens)转录因子c-Myc核定位信号和大肠杆菌复制叉停滞蛋白(TUS蛋白)核定位信号。

指导RNA:CRISPR-Cas9基因组编辑中的术语“指导RNA”是指使得系统如此通用的可重编程部分。在天然化脓链球菌系统中,指导RNA实际上是两种RNA多核苷酸的复合物:含有约20个决定Cas9酶的特异性的核苷酸的第一crRNA以及与cr RNA杂交以形成与Cas9相互作用的RNA复合物的tracr RNA。参见Jinek M.等人,A programmable dual-RNA-guidedDNA endonuclease in adaptive bacterial immunity[在自适应细菌免疫中的可编程双RNA指导的DNA内切核酸酶].Science[科学].2012;337:816-21。在本文中术语crRNA和tracrRNA与术语tracr配对RNA和tracr RNA可互换地使用。由于CRISPR-Cas9系统的发现,单一多核苷酸指导RNA已被开发并成功地应用,恰好与天然两部分指导RNA复合物一样有效。

供体DNA:术语“供体DNA”意指包含用于修饰真菌细胞基因组中的靶位点的目的核苷酸序列的多核苷酸。供体DNA可以是双链DNA。供体DNA的核苷酸序列可以是任何核苷酸序列,如基因或基因的区域、用于将突变引入基因中的一个或多个核苷酸、基因破坏序列等。在一个方面,供体DNA进一步包含对靶位点的对应区域而言的第一同源区和第二同源区,用于通过同源重组将供体DNA掺入双链断裂中,即供体DNA与紧接预期编辑位点上游和下游的序列具有高度同源性。术语“供体DNA”在本文中也被理解为意指“DNA修复模板”。

cDNA:术语“cDNA”意指可以通过从获得自真核或原核细胞的成熟的剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。初始的初级RNA转录物是mRNA的前体,其通过一系列的步骤(包括剪接)进行加工,然后呈现为成熟的剪接的mRNA。

编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界通常由可读框确定,该可读框以起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可以为基因组DNA、cDNA、合成DNA或其组合。

密码子优化基因:术语“密码子优化基因”意指其密码子使用频率被优化到宿主细胞优选密码子使用频率的基因。对基因进行密码子优化的核酸改变不会改变亲本基因的编码的多肽的氨基酸序列。

控制序列:术语“控制序列”意指包含非编码RNA的多核苷酸或编码多肽的多核苷酸的表达所必需的核酸序列。每个控制序列对于编码多肽的多核苷酸而言可以是天然的(即,来自相同基因)或异源的(即,来自不同基因),或者相对于彼此是天然的或异源的。此类控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子和转录终止信号。出于引入有利于将控制序列与编码多肽的多核苷酸的编码区连接的特定限制位点的目的,控制序列可以提供有多个接头。

表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。术语“表达”还意指产生非编码RNA(例如,单指导RNA)。

表达载体:术语“表达载体”意指直链或环状DNA分子,其包含编码多肽的多核苷酸或非编码多核苷酸(例如,单指导RNA),并且与提供用于其表达的控制序列可操作地连接。

基因组:术语“基因组”意指真菌细胞中的整套遗传信息,其以称为染色体的DNA长分子以及DNA(例如,质粒)和RNA的染色体外元件存在。

指导RNA或单指导RNA:术语“指导RNA”(gRNA)或“单指导RNA”(sgRNA)意指工程化的单链RNA,涉及(1)CRISPR RNA(crRNA)序列的靶向功能(对于MAD7和Cpf1),或(2)CRISPRRNA(crRNA)的靶向功能和反式激活CRISPR RNA(tracrRNA)序列的核酸酶结合功能(对于Cas9)。对于Cas9内切核酸酶,crRNA序列是大约20个核苷酸的序列,其限定了经由同源性进行修饰的目的基因组靶标并指导Cas9内切核酸酶活性。20个核苷酸的序列作为“向导”,其通过RNA-DNA碱基配对,将Cas9/gRNA复合物招募到直接在原型间隔子相邻基序(PAM)上游的基于crRNA序列的特定DNA靶位点。PAM是切割所需要的,但是不是gRNA或sgRNA序列的一部分。Cas9内切核酸酶将切割PAM上游的大约3个碱基。对于MAD7和Cpf1内切核酸酶,它们由单一CRISPR RNA(crRNA)指导,并且不需要反式激活CRISPR RNA(tracrRNA)。MAD7和Cpf1内切核酸酶在原型间隔子的+18/+23位置之后切割其PAM远端的DNA,从而形成交错的DNA突出。

同源重组:术语“同源重组”意指两个DNA分子之间经由经典的Campbell型同源重组事件在同源位点处交换DNA片段。

宿主细胞:术语“宿主细胞”意指易于用包含多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不相同的任何亲本细胞子代。

突变体:术语“突变体”意指在一个或多个(例如,几个)位置处包含改变(即,取代、插入和/或缺失)的多核苷酸。取代意指用不同的核苷酸替代占据某一位置的核苷酸;缺失意指去除占据某一位置的核苷酸;并且插入意指在邻接并且紧接占据某一位置的核苷酸之后添加核苷酸。

核酸构建体:术语“核酸构建体”意指单链或双链的核酸或多核苷酸分子,其是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成含有核酸的区段,或其是合成的,其可以包含一个或多个控制序列。

可操作地连接:术语“可操作地连接”意指这样的构型,在其中控制序列被置于相对于多核苷酸适当的位置处,使得控制序列指导多核苷酸的表达。

启动子:术语“启动子”意指限定了RNA聚合酶从何处开始转录基因的DNA序列。启动子直接位于基因转录起始位点的上游或5'端处。RNA聚合酶和必需的转录因子与启动子序列结合并启动转录。

序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的关联度通过参数“序列同一性”来描述。

出于本披露的目的,使用如在EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套件(EMBOSS:The European Molecular Biology Open Software Suite),Rice等人,2000,Trends Genet.[遗传学趋势]16:276-277)(优选5.0.0版或更新版)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)来确定两个氨基酸序列之间的序列同一性。所使用的参数是空位开放罚分10、空位延伸罚分0.5和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。将标记为“最长同一性”的Needle的输出(使用非简化选项(nobrief option)获得)用作同一性百分比并且计算如下:(相同的残基x100)/(比对长度-比对中的空位总数)

出于本披露的目的,使用如在EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套件,Rice等人,2000,见上文)(优选5.0.0版或更新版)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来确定两个脱氧核糖核苷酸序列之间的序列同一性。所使用的参数是空位开放罚分10、空位延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。将标记为“最长同一性”的Needle的输出(使用非简化选项获得)用作同一性百分比并且计算如下:

(相同的脱氧核糖核苷酸x100)/(比对长度-比对中的空位总数)

转录终止子:术语“转录终止子”意指基因的多核苷酸序列下游的DNA序列,其被RNA聚合酶识别为停止合成并从转录复合物中释放新生RNA的信号。

转移RNA:术语“转移RNA”意指由RNA(典型地长度为73至94个核苷酸)构成的分子,其充当核酸的核苷酸序列与蛋白质的氨基酸序列之间的物理连接。转移RNA按照信使RNA(mRNA)中的三核苷酸序列(密码子)的指导,将氨基酸携带至细胞的蛋白质合成机器(核糖体),并且在tRNA的反密码子与将翻译成蛋白质的mRNA上的密码子配对时,将正确的氨基酸附接在核糖体细胞处合成的蛋白质链上。存在至少20个种类的转移RNA,每个种类均能够与特定的氨基酸组合。每种类型的转移RNA分子仅可以与一种类型的氨基酸附接,因此每种生物均具有许多类型的转移RNA。由于遗传密码含有多个指定相同氨基酸的密码子,因此存在许多带有不同反密码子的转移RNA分子,这些反密码子也携带相同的氨基酸。对于每个密码子通常存在多个种类的tRNA,并且因此在特定真菌细胞的基因组内可能存在多于一百个tRNA基因。例如,参见Hani和Feldman,1998,Nucleic Acids Res.[核酸研究]26:689-696。在本文中术语“转移RNA”和“tRNA”可互换地使用。

U6启动子:术语“U6启动子”意指从U6小核RNA(snRNA)基因中获得并通过RNA聚合酶III转录的启动子。

RNA聚合酶III:术语“RNA聚合酶III”意指这样的核苷酸转移酶,其使用DNA基因作为模板使核糖核苷酸聚合(Paule和White,2000,Nucleic Acids Res.[核酸研究]28(6):1283),以产生小核糖核酸(RNA)分子,包括但不限于氨酰基转移RNA、5S核糖体RNA、剪接体RNA(snRNA)和U6小核RNA。

具体实施方式

在第一方面,本发明涉及用于使用多核苷酸指导的内切核酸酶在微生物细胞基因组中的至少一个靶序列中引入一个或多个所需核苷酸修饰的方法,所述方法包括以下步骤:

a)提供微生物宿主细胞,该微生物宿主细胞包含位于该多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列附近的至少一个待修饰的基因组靶序列;

b)用以下转化该微生物宿主细胞:

i)该多核苷酸指导的内切核酸酶和用于该至少一个待修饰的靶序列的至少一种合适的指导多核苷酸,或者编码该多核苷酸指导的内切核酸酶和编码用于该至少一个待修饰的靶序列的至少一种合适的指导多核苷酸的一种或多种多核苷酸,和

ii)能够与该至少一个基因组靶序列杂交的至少一种单链寡核苷酸,所述寡核苷酸包含该一个或多个所需核苷酸修饰;

其中该多核苷酸指导的内切核酸酶与该指导多核苷酸和基因组相互作用并且切割或切开基因组,并且其中该至少一种单链核苷酸指导DNA修复穿过该切口或缺口,从而以至少以下的效率将该一个或多个所需修饰引入基因组的该靶序列中:

当该切口或缺口位于距该一个或多个所需核苷酸修饰10-20个核苷酸时为70%;当该切口或缺口位于距该一个或多个所需核苷酸修饰10-20个核苷酸时优选为至少75%、80%或85%;当该切口或缺口位于距该一个或多个所需核苷酸修饰10-20个核苷酸时最优选为至少90%;

当该切口或缺口位于距该一个或多个所需核苷酸修饰21-30个核苷酸时为60%;当该切口或缺口位于距该一个或多个所需核苷酸修饰21-30个核苷酸时优选为至少65%;当该切口或缺口位于距该一个或多个所需核苷酸修饰21-30个核苷酸时更优选为至少70%;

当该切口或缺口位于距该一个或多个所需核苷酸修饰31-43个核苷酸时为50%;当该切口或缺口位于距该一个或多个所需核苷酸修饰31-43个核苷酸时优选为至少55%;当该切口或缺口位于距该一个或多个所需核苷酸修饰31-43个核苷酸时更优选为至少60%;

当该切口或缺口位于距该一个或多个所需核苷酸修饰44-52个核苷酸时为40%;当该切口或缺口位于距该一个或多个所需核苷酸修饰44-52个核苷酸时优选为至少45%;当该切口或缺口位于距该一个或多个所需核苷酸修饰44-52个核苷酸时更优选为至少50%;或者

当该切口或缺口位于距该一个或多个所需核苷酸修饰至少53个核苷酸时为30%;当该切口或缺口位于距该一个或多个所需核苷酸修饰至少53个核苷酸时优选为至少35%;当该切口或缺口位于距该一个或多个所需核苷酸修饰至少53个核苷酸时更优选为至少40%。

宿主细胞

本发明还涉及微生物宿主细胞。将包含多核苷酸的构建体或载体引入宿主细胞中,使得该构建体或载体作为染色体整合体或作为自主复制的染色体外载体维持,如较早前所述。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不相同的任何亲本细胞子代。宿主细胞的选择将在很大程度上取决于编码多肽的基因及其来源。

宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞,例如原核生物或真核生物。

原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、肠球菌属(Enterococcus)、土芽孢杆菌属(Geobacillus)、乳杆菌属、乳球菌属(Lactococcus)、大洋芽孢杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)和链球菌属。革兰氏阴性细菌包括但不限于弯曲菌属(Campylobacter)、大肠杆菌、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属(Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟菌属(Neisseria)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)和脲原体属(Ureaplasma)。

细菌宿主细胞可以是任何芽孢杆菌属细胞,包括但不限于嗜碱芽孢杆菌(Bacillus alkalophilus)、高地芽孢杆菌(Bacillus altitudinis)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、植物解淀粉芽孢杆菌亚种(B.amyloliquefacienssubsp.plantarum)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacilluscirculans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、甲基营养型芽孢杆菌(Bacillus methylotrophicus)、短小芽孢杆菌(Bacillus pumilus)、沙福芽孢杆菌(Bacillus safensis)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)和苏云金芽孢杆菌(Bacillusthuringiensis)细胞。

细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于类马链球菌(Streptococcus equisimilis)、化脓链球菌、乳房链球菌(Streptococcus uberis)和马链球菌兽疫亚种(Streptococcus equi subsp.Zooepidemicus)细胞。

细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于不产色链球菌(Streptococcus achromogenes)、除虫链球菌(Streptococcus avermitilis)、天蓝链球菌(Streptococcus coelicolor)、灰色链球菌(Streptococcus griseus)和浅青紫链球菌(Streptococcus lividans)细胞。

将DNA引入芽孢杆菌属细胞中可以通过以下方式来实现:原生质体转化(参见例如,Chang和Cohen,1979,Mol.Gen.Genet.[分子与普通遗传学]168:111-115)、感受态细胞转化(参见例如,Young和Spizizen,1961,J.Bacteriol.[细菌学杂志]81:823-829;或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.[分子生物学杂志]56:209-221)、电穿孔(参见例如,Shigekawa和Dower,1988,Biotechniques[生物技术]6:742-751)或接合(参见例如,Koehler和Thorne,1987,J.Bacteriol.[细菌学杂志]169:5271-5278)。将DNA引入大肠杆菌细胞中可以通过以下方式来实现:原生质体转化(参见例如,Hanahan,1983,J.Mol.Biol.[分子生物学杂志]166:557-580)或电穿孔(参见例如,Dower等人,1988,Nucleic Acids Res.[核酸研究]16:6127-6145)。将DNA引入链球菌属细胞中可以通过以下方式来实现:原生质体转化、电穿孔(参见例如,Gong等人,2004,Folia Microbiol.[叶线形微生物学](布拉格(Praha))49:399-405)、接合(参见例如,Mazodier等人,1989,J.Bacteriol.[细菌学杂志]171:3583-3585)或转导(参见例如,Burke等人,2001,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]98:6289-6294)。将DNA引入假单孢菌属细胞中可以通过以下方式来实现:电穿孔(参见例如,Choi等人,2006,J.Microbiol.Methods[微生物学方法杂志]64:391-397)或接合(参见例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.[应用与环境微生物学]71:51-57)。将DNA引入链球菌属细胞中可以通过以下方式来实现:天然感受态(参见例如,Perry和Kuramitsu,1981,Infect.Immun.[感染与免疫]32:1295-1297)、原生质体转化(参见例如,Catt和Jollick,1991,Microbios[微生物学]68:189-207)、电穿孔(参见例如,Buckley等人,1999,Appl.Environ.Microbiol.[应用与环境微生物学]65:3800-3804)或接合(参见例如,Clewell,1981,Microbiol.Rev.[微生物学评论]45:409-436)。然而,可以使用本领域已知的将DNA引入宿主细胞中的任何方法。

宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。

宿主细胞可以是真菌细胞。如本文所用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如由Hawksworth等人在以下文献中所定义的:Ainsworth and Bisby’s Dictionary of The Fungi[安斯沃思和拜斯比真菌字典],第8版,1995,CAB International[国际应用生物科学中心],University Press[大学出版社],英国剑桥)。

真菌宿主细胞可以是酵母细胞。如本文所用的“酵母”包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类可能在将来变化,出于本发明的目的,酵母应当如Biology and Activities of Yeast[酵母的生物学与活性](Skinner,Passmore和Davenport编辑,Soc.App.Bacteriol.Symposium Series No.9[应用细菌学学会专题论文集系列9],1980)中所述的那样定义。

酵母宿主细胞可以是假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或耶氏酵母属(Yarrowia)细胞,如乳酸克鲁维酵母(Kluyveromyces lactis)、卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、卵形酵母(Saccharomyces oviformis)或解脂耶氏酵母(Yarrowia lipolytica)细胞。

真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门的所有丝状形式(如由Hawksworth等人,1995,见上文所定义的)。丝状真菌的特征通常在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸来进行的,并且碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽来进行的,并且碳分解代谢可以是发酵性的。

丝状真菌宿主细胞可以是枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管菌属(Bjerkandera)、拟腊菌属(Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、线黑粉菌科(Filibasidium)、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、链孢霉属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)或木霉属(Trichoderma)细胞。

例如,丝状真菌宿主细胞可以是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌(Chrysosporium keratinophilum)、卢克诺文思金孢子菌(Chrysosporiumlucknowense)、粪状金孢子菌(Chrysosporium merdarium)、毡金孢子菌(Chrysosporiumpannicola)、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌(Chrysosporium tropicum)、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢(Fusariumbactridioides)、谷类镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusariumroseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusariumvenenatum)、特异腐质霉(Humicola insolens)、柔毛腐质霉(Humicola lanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢霉(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotuseryngii)、土生梭孢壳(Thielavia terrestris)、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉或绿色木霉(Trichoderma viride)细胞。

可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身已知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适程序描述于以下文献中:EP238023;Yelton等人,1984,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:1470-1474;以及Christensen等人,1988,Bio/Technology[生物/技术]6:1419-1422。用于转化镰孢属物种的合适方法由Malardier等人,1989,Gene[基因]78:147-156和WO 96/00787描述。可以使用由以下文献描述的程序转化酵母:Becker和Guarente,在Abelson,J.N.和Simon,M.I.编辑,Guide to Yeast Genetics and Molecular Biology[酵母遗传学与分子生物学指南],Methods in Enzymology[酶学方法],第194卷,第182-187页,Academic Press,Inc.[学术出版社公司],纽约);Ito等人,1983,J.Bacteriol.[细菌学杂志]153:163;以及Hinnen等人,1978,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:1920。

在本发明的方法中采用丝状真菌宿主细胞是有利的,该丝状真菌宿主细胞不能快速修复一个或多个被切开或切割的靶序列而没有整合基因组的修饰的供体部分。

因此,优选的是本发明第一方面的步骤(A)中提供的丝状真菌宿主细胞包含灭活的非同源末端连接(NHEJ)系统;优选地,细胞包含灭活的DNA连接酶D(LigD)和/或DNA末端结合蛋白Ku;甚至更优选地,细胞包含灭活的ligD、ku70和或ku80基因或其一种或多种同源物。

在优选实施例中,在第一方面的步骤之前或之后,用编码目的多肽的多核苷酸转化微生物宿主细胞;优选地,目的多肽是酶;优选地,酶是水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;甚至更优选地,酶是α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。

多核苷酸指导的内切核酸酶

在本披露的方法中,可以使用任何多核苷酸指导的内切核酸酶,考虑RNA和DNA指导的内切核酸酶两者。

RNA指导的DNA内切核酸酶可以是Cas内切核酸酶、Mad内切核酸酶或Cpf内切核酸酶。

在一个方面,Cas内切核酸酶可以是可用于本披露方法的任何Cas内切核酸酶或其功能片段。在一个实施例中,Cas内切核酸酶是Cas9内切核酸酶。Cas9内切核酸酶的实例是来自以下细菌物种的Cas9内切核酸酶:链球菌属物种(Streptococcus sp.)(例如,化脓链球菌、变形链球菌(S.mutans)和嗜热链球菌(S.thermophilus))、弯曲菌属物种(Campylobacter sp.)(例如,空肠弯曲菌(C.jejuni))、奈瑟菌属物种(Neisseria sp.)(例如,脑膜炎奈瑟菌(N.meningitidis))、弗朗西斯氏菌属物种(Francisella sp.)(例如,新凶手弗朗西斯氏菌)以及巴氏杆菌属物种(Pasteurella sp.)(例如,多杀性巴氏杆菌(P.multocida))。有关Cas9内切核酸酶的讨论,参见Makarova等人,2015,Nature[自然]13:722-736。

在另一个实施例中,Cas9内切核酸酶是化脓链球菌Cas9或其同源物。在另一个实施例中,Cas9内切核酸酶是变形链球菌Cas9内切核酸酶。在另一个实施例中,Cas9内切核酸酶是嗜热链球菌Cas9内切核酸酶。在另一个实施例中,Cas9内切核酸酶是空肠弯曲菌Cas9内切核酸酶。在另一个实施例中,Cas9内切核酸酶是脑膜炎奈瑟菌Cas9内切核酸酶。在另一个实施例中,Cas9内切核酸酶是新凶手弗朗西斯氏菌Cas9内切核酸酶。在另一个实施例中,Cas9内切核酸酶是多杀性巴氏杆菌Cas9内切核酸酶。

在另一个实施例中,Cas9内切核酸酶变体仅具有一个活性核酸酶结构域。在更优选的实施例中,Cas9内切核酸酶变体在与化脓链霉菌(Streptomyces pyogenes)Cas9氨基酸序列的位置10对应的氨基酸位置中包含用丙氨酸进行的取代。在最优选的实施例中,多核苷酸指导的内切核酸酶仅具有一个活性核酸酶结构域;优选地,所述变体是化脓链球菌Cas9,其在与位置10对应的氨基酸位置中包含丙氨酸对天冬氨酸的取代D10A

在另一个实施例中,Cas9内切核酸酶是亲本Cas9内切核酸酶的变体。在一个实施例中,Cas9内切核酸酶变体是其中的RuvC结构域被来自化脓链球菌的Cas9内切核酸酶中的D10A突变灭活的Cas9切口酶(Sander和Joung,2013,Nature Biotechnology[自然生物技术]1-9)。预期其他II类Cas9酶可以被类似地修饰。

在另一个方面,Mad内切核酸酶可以是可用于本披露方法的任何Mad内切核酸酶或其功能片段。在一个实施例中,Mad内切核酸酶是MAD7内切核酸酶。MAD7内切核酸酶的实例是来自直肠真杆菌的MAD7内切核酸酶。有关MAD7内切核酸酶的讨论,参见WO 2018/071672。

在另一个实施例中,MAD7内切核酸酶是真杆菌属(Eubacterium)MAD7内切核酸酶。在另一个实施例中,真杆菌属MAD7内切核酸酶是直肠真杆菌MAD7内切核酸酶。

在一个方面,Cpf内切核酸酶可以是可用于本披露方法的任何Cpf内切核酸酶或其功能片段。在一个实施例中,Mad内切核酸酶是Cpf1内切核酸酶。Cpf1内切核酸酶的实例是来自氨基酸球菌属物种、毛螺菌科物种和新凶手弗朗西斯氏菌的Cpf1内切核酸酶。有关Cpf1内切核酸酶的讨论,参见Zetsche等人,2015,Cell[细胞]163(3):759-771。

在另一个实施例中,Cpf1内切核酸酶是氨基酸球菌属Cpf1内切核酸酶。在另一个实施例中,Cpf1内切核酸酶是毛螺菌科Cpf1内切核酸酶。在另一个实施例中,Cpf1内切核酸酶是弗朗西斯氏菌属(Francisella)Cpf1内切核酸酶。在另一个实施例中,Cpf1内切核酸酶是新凶手弗朗西斯氏菌Cpf1内切核酸酶。

在另一个实施例中,编码RNA指导的DNA内切核酸酶的基因是用于在真菌细胞中表达的密码子优化的合成序列。

在另一个实施例中,RNA指导的DNA内切核酸酶基因与编码核定位信号的一种或多种多核苷酸可操作地连接,因此所表达的内切核酸酶被有效地从细胞质转运到细胞核。核定位信号的实例是SV40核定位信号、构巢曲霉GATA转录因子(AreA)、用于纤维素酶和半纤维素酶基因表达的里氏木霉转录调控子(XYR1)、里氏木霉蓝光调控子2(blr2)、非洲爪蟾卵母细胞核质蛋白核定位信号、秀丽隐杆线虫转录因子EGL-13核定位信号、智人转录因子c-Myc核定位信号和大肠杆菌复制叉停滞蛋白(TUS蛋白)核定位信号。

指导RNA

CRISPR-Cas9基因组编辑中的指导RNA(gRNA)构成了使得系统如此通用的可重编程部分。在天然化脓链霉菌系统中,指导RNA是两种RNA多核苷酸的复合物:含有约20个决定Cas9酶的特异性的核苷酸的crRNA以及与crRNA杂交以形成与Cas9内切核酸酶相互作用的RNA复合物的tracrRNA。参见Jinek等人,2012,Science[科学]337:816-821。

由于CRISPR-Cas9系统的发现,单指导RNA已被开发并成功地应用,恰好与天然两部分指导RNA复合物一样有效。

在本披露的方法中,可以使用任何指导RNA系统。

在一个实施例中,指导RNA是天然化脓链霉菌系统(Jinek等人,2012,Science[科学]337(6096):816-821)。

在另一个实施例中,称为单指导RNA(sgRNA)的指导RNA是工程化的单链嵌合RNA,其组合了细菌反式激活CRISPR RNA(tracrRNA)的支架功能与细菌CRISPR RNA(crRNA)的特异性。crRNA的5'末处的最后17-20bp作为“向导”,其通过RNA-DNA碱基配对,将Cas9/gRNA复合物招募到直接在原型间隔子相邻基序(PAM)上游的特定DNA靶位点。

在另一个实施例中,单指导RNA包含含有17至20个或更多个核苷酸的第一RNA,其与靶序列至少85%(例如,90%、95%、96%、97%、98%、99%或100%)互补并且能够与靶序列杂交。

在另一个实施例中,包含17至20个或更多个核苷酸的第一RNA与靶序列至少90%、95%、97%、98%、99%或甚至100%互补并且能够与靶序列杂交。

在另一个实施例中,单指导RNA是化脓链霉菌Cas9指导RNA。在另一个实施例中,指导RNA是直肠真杆菌MAD7指导RNA。在另一个实施例中,指导RNA是Cpf1指导RNA。

基因组靶序列

至少一个基因组靶序列将通过本发明的方法进行修饰,并且该靶序列必须位于多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列附近;优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从10至1,000个核苷酸处;优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从10至500个核苷酸处;更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从20至250个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从21至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从22至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从23至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从24至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从25至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从26至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从27至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从28至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从29至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从30至100个核苷酸处。

基因组靶序列中的实际切口或缺口是在基因组中紧邻PAM序列的“原型间隔子互补”序列内制造的。原型间隔子互补序列的长度通常为20个核苷酸左右,以便允许其与指导多核苷酸的对应原型间隔子序列杂交,但是甚至更短的序列也已显示出起作用,如指导物中的17个核苷酸的原型间隔子和基因组中的对应的17个核苷酸的原型间隔子互补序列。该至少一个待修饰的基因组靶序列可以位于基因组中的任何位置,但是通常将在编码序列或可读框内。

在优选实施例中,宿主细胞中的至少两个基因组靶序列通过一个或多个核苷酸或密码子的至少一个插入、缺失和/或取代进行修饰。

在另一个优选实施例中,该一个或多个所需核苷酸修饰包含一个或多个核苷酸或密码子的至少一个插入、缺失和/或取代。

基因组中的每个原型间隔子互补序列均需要具有紧邻它的合适的原型间隔子相邻基序(PAM),以允许对应的多核苷酸指导的内切核酸酶结合和切割或切开基因组。术语“原型间隔子相邻基序”或“PAM”意指紧邻基因组中的靶位点下游或上游的2-6个碱基对的DNA序列,其被RNA指导的DNA内切核酸酶(例如,Cas9、MAD7或Cpf1内切核酸酶)直接识别,以促进RNA指导的DNA内切酶对靶位点的切割。来自化脓链球菌的Cas9内切核酸酶识别gRNA序列的3'端上的5'-NGG。来自直肠真杆菌的MAD7内切核酸酶识别gRNA序列的5'端上的5'-TTTV,但是5'-YTTV和YTTN也在一定程度上起作用。来自氨基酸球菌属物种和毛螺菌科物种的Cpf1内切核酸酶识别5'-TTTN,并且来自新凶手弗朗西斯氏菌的Cpf1内切核酸酶识别gRNA的5'端上的5'-TTN-3'。有关其他PAM序列的综述,参见例如Shah,S.A.等人,Protospacer recognition motifs[原型间隔子识别基序],RNA Biol.[RNA生物学]2013年5月1日;10(5):891-899。

单链寡核苷酸

本发明第一方面的单链寡核苷酸用作供体DNA,也称为DNA修复模板。单链寡核苷酸包含用于修饰或编辑微生物宿主细胞的靶位点的核苷酸序列以及与靶位点的紧邻上游和下游对应的另外的同源序列(称为“5'同源序列”和“3'同源序列”)。每个同源序列的长度可以改变,但是通常单链寡核苷酸包含在基因组中相对于该一个或多个修饰在切口或缺口的相对侧上的至少15个未修饰的核苷酸以及在基因组中相对于切口或缺口在该一个或多个修饰的相对侧上的至少15个未修饰的核苷酸;优选至少16个未修饰的核苷酸;每侧上优选至少17、18、19、20、21、22、23、24、25、26个或至少27个未修饰的核苷酸。

用于修饰靶位点的非限制性实例是缺失基因或其部分、破坏基因、改变基因内的一个或多个核苷酸、用编码具有改进的生物活性的蛋白质(例如,同系物或变体)的异源基因替代基因、将突变引入基因中、用编码具有不同生物活性的蛋白质的异源基因替代基因、插入基因或修复基因。

在一个实施例中,用于修饰靶位点的目的核苷酸序列包含至少30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1,000、2,000、4,000、6,000、8,000或10,000个核苷酸。

在一种或多种单链寡核苷酸的PAM或原型间隔子对应序列中包括一个或多个另外的突变可能是有利的,使得当第一方面的方法已按预期起作用并且已将所需修饰引入基因组中时,基因组中的PAM位点和原型间隔子互补序列将已被突变,以避免来自多核苷酸指导的内切核酸酶的剩余活性的任何后续切口或缺口。

因此,在优选实施例中,除了该一个或多个所需核苷酸修饰之外,该至少一种单链寡核苷酸还包含在PAM或原型间隔子序列中的一个或多个突变,其中所述一个或多个突变在引入靶序列中时有效地阻断多核苷酸指导的内切核酸酶。

用于多肽表达的多核苷酸

在一个实施例中,目的核苷酸序列是基因。目的基因可以是。氧化还原酶、转移酶、水解酶、裂解酶、异构酶或连接酶。在另一个方面,多肽是乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、氨肽酶、α-淀粉酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、香豆酸酯酶、环糊精糖基转移酶、角质酶、环糊精糖基转移酶、脱酰胺酶、脱氧核糖核酸酶、分散素(dispersin)、内切葡聚糖酶、酯酶、阿魏酸酯酶、具有纤维素分解增强活性的GH61多肽、α-半乳糖苷酶、β-半乳糖苷酶、葡糖脑苷脂酶、葡糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡糖醛酸糖苷酶、葡萄糖醛酸酯酶、卤素过氧化物酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、溶菌酶、甘露聚糖酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、磷脂酶、植酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、α-1,6-转葡糖苷酶、转谷氨酰胺酶、尿激酶、黄原胶酶、木聚糖酶或β-木糖苷酶

在另一个方面,目的核苷酸序列是基因的区域。

区域可以是例如可读框、蛋白质编码序列、内含子位点、内含子增强基序、mRNA剪接位点、启动子、转录调控元件、转录终止子和翻译调控元件。

用于分离或克隆作为目的核苷酸序列的基因的技术是本领域已知的,并且包括从基因组DNA或cDNA或其组合进行分离。从基因组DNA克隆基因可以例如通过使用熟知的聚合酶链式反应(PCR)或用以对具有共有的结构特征的克隆的DNA片段进行检测的表达库抗体筛选来实现。参见例如,Innis等人,1990,PCR:A Guide to Methods and Application[PCR:方法和应用指南],Academic Press[学术出版社],纽约。可以使用其他核酸扩增程序,如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。

编码例如多肽的任何基因均可以在核苷酸序列水平上进行修饰以用作目的核苷酸序列。此类修饰可能不改变编码的多肽的氨基酸序列,或者它们可能导致氨基酸序列的变化,如缺失、插入或取代。

如果一个氨基酸被具有相似特征的另一个氨基酸取代,则它可以被称为保守取代。保守取代的实例是在下组之内:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)以及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不会改变比活性的氨基酸取代是本领域已知的并且例如由H.Neurath和R.L.Hill,1979,于The Proteins[蛋白质],Academic Press[学术出版社],纽约中描述。常见取代为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。

可替代地,氨基酸改变可以具有这样的性质:改变多肽的物理化学特性。例如,氨基酸改变可以提高多肽的热稳定性、改变底物特异性、改变最适pH,等等。

可以根据本领域已知的程序,如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science[科学]244:1081-1085)来鉴定多肽中的必需氨基酸。在后一项技术中,在分子中的每个残基处引入单个丙氨酸突变,并且对所得突变型分子的活性进行测试以鉴定对于分子的活性至关重要的氨基酸残基。还参见,Hilton等人,1996,J.Biol.Chem.[生物化学杂志]271:4699-4708。酶或其他生物学相互作用的活性位点还可以通过对结构的物理分析来确定,如通过诸如下述技术来确定:核磁共振、晶体学、电子衍射或光亲和标记,连同对推定的接触位点氨基酸进行突变。参见例如,de Vos等人,1992,Science[科学]255:306-312;Smith等人,1992,J.Mol.Biol.[分子生物学杂志]224:899-904;Wlodaver等人,1992,FEBS Lett.[欧洲生化学会联合会快报]309:59-64。还可以从与相关多肽的比对来推断必需氨基酸的身份。

使用已知的诱变、重组和/或改组方法,随后进行相关的筛选程序可以做出单个或多个氨基酸取代、缺失和/或插入并对其进行测试,这些相关的筛选程序是如由Reidhaar-Olson和Sauer,1988,Science[科学]241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2152-2156;WO 95/17413;或WO 95/22625披露的那些。其他可以使用的方法包括易错PCR、噬菌体展示(例如Lowman等人,1991,Biochemistry[生物化学]30:10832-10837;美国专利号5,223,409;WO 92/06204)以及区域定向诱变(Derbyshire等人,1986,Gene[基因]46:145;Ner等人,1988,DNA 7:127)。

诱变/改组方法可以与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等人,1999,Nature Biotechnology[自然生物技术]17:893-896)。可以从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域的标准方法快速测序。这些方法允许快速确定多肽中各个氨基酸残基的重要性。

内切核酸酶或指导多核苷酸表达

本披露的方法涉及用于修饰真菌细胞基因组中的靶位点的几种核酸构建体。

在一个方面,核酸构建体包含编码多核苷酸指导的内切核酸酶(例如,Cas9或MAD7内切核酸酶)的多核苷酸,用于在真菌细胞基因组中的靶位点处引入双链切口或单链切口(缺口),其中真菌细胞包含紧邻靶位点附近的RNA指导的DNA内切核酸酶的原型间隔子相邻基序序列。

在另一个方面,核酸构建体包含(a)在(1)编码转移RNA的序列和(2)编码转移RNA序列的3'端处的单指导RNA的序列的5'端处可操作地连接的U6启动子序列;以及(b)在编码单指导RNA的序列的3'端处可操作地连接的U6转录终止子序列,其中单指导RNA将RNA指导的DNA内切核酸酶(例如,Cas9、MAD7或Cpf1内切核酸酶)指导至真菌细胞基因组中的靶位点以引入双链断裂,并且其中核酸构建体提高RNA指导的DNA内切核酸酶在靶位点处产生双链断裂的频率。

在优选实施例中,包含编码RNA指导的DNA内切核酸酶(例如,Cas9、MAD7或Cpf1内切核酸酶)的多核苷酸的核酸构建体以及包含(a)在(1)编码转移RNA的序列、(2)编码转移RNA序列的3'端处的单指导RNA的序列的5'端处可操作地连接的U6启动子序列和(b)在编码单指导RNA的序列的3'端处可操作地连接的U6转录终止子序列的核酸构建体在单个DNA片段或单个载体上。

用于多肽表达的核酸构建体

本发明还涉及转化到丝状真菌宿主细胞中用于多肽表达的核酸构建体。

待表达的多核苷酸与一个或多个控制序列可操作地连接,该一个或多个控制序列在与控制序列相容的条件下指导编码序列在合适的宿主细胞中的表达。可以用许多方式操作多核苷酸以提供多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操作可能是理想的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。

控制序列可以是启动子,即被宿主细胞识别用于表达编码本发明的多肽的多核苷酸的多核苷酸。启动子含有介导多肽的表达的转录控制序列。启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸,包括突变型、截短型和杂合型启动子,并且可以获得自编码对宿主细胞而言同源或异源的细胞外或细胞内多肽的基因。

用于指导本发明的核酸构建体在细菌宿主细胞中的转录的合适启动子的实例是从以下基因中获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(Agaisse和Lereclus,1994,Molecular Microbiology[分子微生物学]13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon等人,1988,Gene[基因]69:301-315)、天蓝链球菌琼脂水解酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:3727-3731);以及tac启动子(DeBoer等人,1983,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]80:21-25)。其他启动子描述于Gilbert等人,1980,Scientific American[科学美国人]242:74-94的“Usefulproteins from recombinant bacteria[来自重组细菌的有用蛋白质]”;和在Sambrook等人,1989,见上文。串联启动子的实例披露于WO 99/43835中。

用于指导本发明的核酸构建体在丝状真菌宿主细胞中的转录的合适启动子的实例是从以下的基因中获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、尖孢镰孢胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、米黑根毛霉(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶和里氏木霉翻译延伸因子,以及NA2-tpi启动子(来自曲霉属中性α-淀粉酶基因的修饰的启动子,其中已用来自曲霉属磷酸丙糖异构酶基因的未翻译的前导序列替代未翻译的前导序列;非限制性实例包括来自黑曲霉中性α-淀粉酶基因的修饰的启动子,其中已用来自构巢曲霉或米曲霉磷酸丙糖异构酶基因的未翻译的前导序列替换未翻译的前导序列);及其突变型、截短型和杂合型启动子。其他启动子描述于美国专利号6,011,147中。

在酵母宿主中,有用的启动子从以下的基因中获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。酵母宿主细胞的其他有用的启动子由Romanos等人,1992,Yeast[酵母]8:423-488描述。

控制序列也可以是被宿主细胞识别以终止转录的转录终止子。终止子可操作地连接至编码多肽的多核苷酸的3'-末端。在宿主细胞中有功能的任何终止子均可以用于本发明中。

细菌宿主细胞的优选终止子从以下的基因中获得:克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)和大肠杆菌核糖体RNA(rrnB)。

丝状真菌宿主细胞的优选终止子从以下的基因中获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶和里氏木霉翻译延伸因子。

酵母宿主细胞的优选终止子从以下的基因中获得:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。酵母宿主细胞的其他有用的终止子由Romanos等人(1992,见上文)描述。

控制序列还可以是启动子下游和基因的编码序列上游的mRNA稳定子区,其增加基因的表达。

合适的mRNA稳定子区的实例从以下基因中获得:苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(Hue等人,1995,Journal of Bacteriology[细菌学杂志]177:3465-3471)。

控制序列也可以是前导序列,即对宿主细胞翻译很重要的mRNA的非翻译区。前导序列可操作地连接至编码多肽的多核苷酸的5'-末端。可以使用在宿主细胞中有功能的任何前导序列。

丝状真菌宿主细胞的优选前导序列从以下的基因中获得:米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。

酵母宿主细胞的合适前导序列从以下的基因中获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

控制序列还可以是多腺苷酸化序列,即可操作地连接至多核苷酸的3'-末端并且当转录时被宿主细胞识别为将多腺苷残基添加至所转录的mRNA的信号的序列。可以使用在宿主细胞中有功能的任何多腺苷酸化序列。

丝状真菌宿主细胞的优选多腺苷酸化序列从以下的基因中获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖孢镰孢胰蛋白酶样蛋白酶。

酵母宿主细胞的有用的多腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.[分子细胞生物学]15:5983-5990描述。

控制序列还可以是编码与多肽的N末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5'端本身可以含有在翻译阅读框中天然与编码多肽的编码序列区段相连接的信号肽编码序列。可替代地,编码序列的5'端可以含有对编码序列而言外源的信号肽编码序列。在编码序列不天然地含有信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而,可以使用指导所表达的多肽进入宿主细胞的分泌途径的任何信号肽编码序列。

细菌宿主细胞的有效信号肽编码序列是从以下的基因中获得的信号肽编码序列:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。其他信号肽由Simonen和Palva,1993,Microbiological Reviews[微生物评论]57:109-137描述。

丝状真菌宿主细胞的有效信号肽编码序列是从以下的基因中获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶。

酵母宿主细胞的有用的信号肽从以下的基因中获得:酿酒酵母α-因子和酿酒酵母转化酶。其他有用的信号肽编码序列由Romanos等人(1992,见上文)描述。

控制序列还可以是编码位于多肽的N末端的前肽的前肽编码序列。所得多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下的基因中获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。

在信号肽序列和前肽序列两者都存在的情况下,前肽序列位于紧邻多肽的N末端,并且信号肽序列位于紧邻前肽序列的N末端。

还可能希望的是添加调控序列,其相对于宿主细胞的生长调控多肽的表达。调控序列的实例是引起基因表达响应于化学或物理刺激(包括调控化合物的存在)而开启或关闭的那些。原核系统中的调控序列包括lac、tac和trp操纵子系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKA α-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调控序列的其他实例是允许基因扩增的那些。在真核系统中,这些调控序列包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸会与调控序列可操作地连接。

表达载体

本发明还涉及包含本发明的多核苷酸、启动子以及转录和翻译终止信号的重组表达载体。多个核苷酸和控制序列可以连接在一起以产生重组表达载体,其可以包括一个或多个便利的限制位点以允许编码多肽的多核苷酸在此类位点处的插入或取代。可替代地,可以通过将多核苷酸或包含多核苷酸的核酸构建体插入用于表达的适当载体中而表达多核苷酸。在产生表达载体时,编码序列如此位于载体中,使得编码序列与用于表达的适当控制序列可操作地连接。

重组表达载体可以是可方便地经受重组DNA程序并且可以引起多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是直链或闭合环状质粒。

载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微型染色体或人工染色体。载体可以含有用于确保自我复制的任何手段。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合到基因组中并与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单个载体或质粒或者两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组中的总DNA,或者可以使用转座子。

载体优选地含有允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一种或多种选择性标记。选择性标记是这样的基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属的抗性、对营养缺陷型的原养型等。

细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因、或赋予抗生素抗性(如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素或四环素抗性)的标记。酵母宿主细胞的合适标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、ade B(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5'-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)和trp C(邻氨基苯甲酸合酶)以及其等同物。优选用于在曲霉属细胞中使用的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链球菌(Streptococcus hygros copicus)bar基因。优选用于在木霉属细胞中使用的是adeA、adeB、amdS、hph和pyrG基因。

选择性标记可以是如WO 2010/039889中所述的双选择性标记系统。在一个方面,双选择性标记是hph-tk双选择性标记系统。

载体优选地含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。

对于整合到宿主细胞基因组中,载体可以依靠编码多肽的多核苷酸序列或用于通过同源或非同源重组整合到基因组中的载体的任何其他元件。可替代地,载体可以含有用于指导通过同源重组而整合到宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性,整合元件应当含有足够数目的核酸,如从约30至约10,000个碱基对、或从约400至约10,000个碱基对、或从约800至约10,000个碱基对,这些核酸与对应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码多核苷酸。另一方面,载体可以通过非同源重组而整合到宿主细胞的基因组中。

为了自主复制,载体可以进一步包含复制起点,其使得载体能够在讨论中的宿主细胞中自主复制。复制起点可以是在细胞中发挥作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使得质粒或载体能够在体内复制的多核苷酸。

细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,以及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。

用于在酵母宿主细胞中使用的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1与CEN3的组合以及ARS4与CEN6的组合。

在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等人,1991,Gene[基因]98:61-67;Cullen等人,1987,Nucleic Acids Res.[核酸研究]15:9163-9175;WO00/24883)。可以根据WO 00/24883中披露的方法完成AMA1基因的分离和包含该基因的质粒或载体的构建。

可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞中以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包括与多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数,其中通过在适当的选择性试剂的存在下培养细胞可以选择含有选择性标记基因的扩增的拷贝以及由此多核苷酸的另外的拷贝的细胞。

用于连接以上所述的元件以构建本发明的重组表达载体的程序是本领域技术人员熟知的(参见例如,Sambrook等人,1989,见上文)。

减少或消除基因表达

使用例如一个或多个核苷酸插入、破坏、取代或缺失来减少或消除多核苷酸的表达是本领域熟知的。

在本发明第一方面的方法中,在优选实施例中,修饰宿主细胞的基因组以确保多核苷酸的表达减少或消除,例如通过修饰、灭活或完全/部分缺失。例如,待修饰、灭活或缺失的多核苷酸可以是活性必需的编码区或其一部分、或编码区的表达所需调控元件。这种调控或控制序列的实例可以是启动子序列或其功能部分,即足以影响多核苷酸的表达的部分。可修饰的其他控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活因子。

多核苷酸的修饰或灭活可以通过在基因中或在其转录或翻译所需的调控元件中插入、取代或缺失一个或多个核苷酸来完成。例如,可以插入或去除核苷酸从而导致终止密码子的引入、起始密码子的去除或可读框的变化。此类修饰或灭活可以根据本领域已知的方法通过定点诱变或PCR产生的诱变来完成。尽管原则上,修饰可以在体内进行,即直接在表达待修饰的多核苷酸的细胞上进行,但优选的是如下所示例地在体外进行修饰。

消除或减少多核苷酸的表达的便利方法的实例是基于基因替代、基因缺失或基因破坏技术的。例如,在基因破坏方法中,将与内源多核苷酸对应的核酸序列在体外诱变以产生缺陷核酸序列,然后将其转化到亲本细胞中以产生缺陷基因。通过同源重组,缺陷核酸序列替代内源多核苷酸。可能希望的是,缺陷多核苷酸还编码可用于选择其中的多核苷酸已被修饰或破坏的转化体的标记。在一个方面,用选择性标记如本文所述的那些来破坏多核苷酸。

这些多肽缺陷型突变型细胞作为用于天然和异源多肽的表达的宿主细胞尤其有用。因此,本发明进一步涉及产生天然或异源多肽的方法,这些方法包括(a)在有益于产生该多肽的条件下培养突变型细胞;以及(b)回收该多肽。术语“异源多肽”意指对宿主细胞而言不是天然的多肽,例如天然蛋白质的变体。宿主细胞可以包含多于一个拷贝的编码天然或异源多肽的多核苷酸。

通过以下实例进一步描述本发明,这些实例不应当理解为对本发明的范围进行限制。

实例

这些实例的目的是证明使用多核苷酸指导的内切核酸酶(如Cas9或MAD7)的定向诱变或基因组编辑是可能的,其中使用单链寡核苷酸作为供体DNA。

菌株

里氏木霉BTR213描述于WO 2013/086633中。里氏木霉菌株TrGMEr62-24a2-1是里氏木霉BTR213的ku70破坏菌株。

米曲霉AT526是来源于在WO 18167153(实例4)中描述的JaL1903的ligD破坏菌株。

培养基和溶液

LB+Amp培养基由以下构成:10g的Bacto

PDA板由39g的Difco

PDA+1M蔗糖板由以下构成:39g的Difco

PEG缓冲液由去离子水中的50%聚乙二醇(PEG)4000、10mM Tris-HCl(pH 7.5)和10mM CaCl

STC由去离子水中的1M山梨醇、10mM Tris(pH 7.5)和50mM CaCl

TBE缓冲液由以下构成:10.8g的Tris碱、5g的硼酸、4ml的0.5M EDTA(pH 8)和补足至1升的去离子水。

TE缓冲液由1M Tris(pH 8.0)和0.5M EDTA(pH 8.0)构成。

2xYT+Amp板由以下构成:16g的Bacto

YP培养基由去离子水中的1%Bacto

YPD培养基由1%Bacto

顶级琼脂溶液由去离子水中的0.18μM Na

用于蔗糖+尿素板的培养基由去离子水中的0.18μM Na

用于蔗糖+尿素+Triton板的培养基由去离子水中的0.18μM Na

实例1:里氏木霉原生质体产生

使用与Penttila等人,1987,Gene[基因]61:155-164类似的方案进行里氏木霉的原生质体制备与转化。简而言之,将里氏木霉在27℃下在各自含有25ml的YPD培养基的两个摇瓶中在90rpm轻轻搅拌下培养17小时。将菌丝体通过使用真空驱动一次性过滤系统(密理博公司(Millipore))过滤来收集,并且用去离子水洗涤两次并用1.2M山梨醇洗涤两次。通过在34℃下以75-90rpm轻轻振荡使洗涤的菌丝体悬浮于30ml含有5mg/ml的Yatalase

实例2:CRISPR/Cas9骨架载体pSMAI290

质粒pSMAI290(SEQ ID NO:1,图1)是CRISPR/Cas9表达质粒,用于使用

实例3:pNJOC502-504的构建

由赛默飞世尔科技公司将其延伸序列用于克隆的每个原型间隔子(oNJ336、oNJ338和oNJ340)合成为单链寡核苷酸。将所有原型间隔子寡核苷酸稀释至最终工作浓度为1μM:

oNJ336;SEQ ID NO:3。

oNJ338;SEQ ID NO:4。

oNJ340;SEQ ID NO:5。

实例4:pNJOC502-504与单链寡核苷酸的共转化

本实验的目的是检查单链寡核苷酸是否可以用作使用多核苷酸指导的核酸酶(如MAD7、Cas9等)进行基因组编辑的供体DNA。pNJOC502-pNJOC504是表达Cas9的自主复制质粒(含有AMA1),其是靶向里氏木霉ACE3基因座的特定序列和hph选择标记(潮霉素B抗性)的sgRNA构建体。如此设计寡核苷酸,使得在供体DNA与靶基因座之间重组时,ACE3基因座处的整个靶序列将被HindIII位点替代(以便于通过PCR和HindIII消化进行筛选)。将TrGMEr62-24a2-1原生质体在冰上解冻。对于每次转化,将大约2μg质粒DNA和5μl单链寡核苷酸(100μM,由赛默飞世尔科技公司合成)添加至100μl解冻的原生质体溶液中,并且轻轻混合。添加PEG缓冲液(250μl),并且将反应物混合并在34℃下孵育30分钟。在转化后,将1ml的STC添加至每种转化反应物中,并且将内容物涂布在PDA+1M蔗糖板上并在30℃下孵育过夜。第二天,添加由PDA+潮霉素B组成的覆盖物至最终浓度为10μg/ml潮霉素B,并且将板在30℃下孵育5-7天。每次转化获得大约100-200个转化体。为了确定编辑频率,从每个转化板中挑取少量潮霉素抗性菌落,并且将其转移至PDA板上并在30℃下孵育5-7天。对于每个转化体,用1μl无菌接种环收集孢子,并且将其悬浮于薄壁PCR管中的20μl稀释缓冲液(PHIRE

oNJ456;SEQ ID NO:10

oNJ459;SEQ ID NO:11

每种PCR反应物由以下构成:1μl孢子悬浮液、10pmol每种引物、10μl的2X PHIRE

为了鉴定编辑的转化体,用HindIII消化PCR产物。编辑的转化体应当在PCR/HindIII消化后产生两个条带,而未编辑的转化体应当仅产生单个条带(不存在HindIII位点)。每种HindIII消化反应物由以下构成:5μl PCR产物、1x CutSmart缓冲液(新英格兰生物实验室公司)、6个单位的HindIII-HF酶(新英格兰生物实验室公司)和至最终体积为20μl的无菌Milli-Q H

表1.

实例5:距切割位点长达43bp递送SNV

几项研究已证明,在距切割位点的距离与使用单链寡核苷酸作为供体DNA的突变掺入之间存在负相关[(Inui,M.等人,Rapid generation of mouse models with definedpoint mutations by the CRISPR/Cas9 system[通过CRISPR/Cas9系统快速产生具有限定点突变的小鼠模型].Sci Rep[科学报告].2014;4:5396)、(Wang,K.等人,EfficientGeneration of Orthologous Point Mutations in Pigs via CRISPR-assisted ssODN-mediated Homology-directed Repair[经由CRISPR辅助的ssODN介导的同源定向修复在猪中高效产生直向同源点突变].Mol Ther Nucleic Acids[分子疗法-核酸].2016年11月;5(11):e396)、(Paquet,D.等人,Efficient introduction of specific homozygous andheterozygous mutations using CRISPR/Cas9[使用CRISPR/Cas9高效引入特定纯合和杂合突变].Nature[自然],2016.533:第125-129页)]。在猪(猪胎儿成纤维细胞)中,Wang等人(2016)证明了11bp的突变到切口距离导致两个点突变之间同源定向修复效率的显著差异[Wang,K.等人,Efficient Generation of Orthologous Point Mutations in Pigs viaCRISPR-assisted ssODN-mediated Homology-directed Repair[经由CRISPR辅助的ssODN介导的同源定向修复在猪中高效产生直向同源点突变].Mol Ther Nucleic Acids[分子疗法-核酸].2016年11月;5(11):e396]。同样,对于人诱导多能干细胞,Paquet等人(2016)指出,为了高效的纯合突变掺入,切口到突变距离需要最小化[Paquet,D.等人,Efficientintroduction of specific homozygous and heterozygous mutations using CRISPR/Cas9[使用CRISPR/Cas9高效引入特定纯合和杂合突变].Nature[自然],2016.533:第125-129页]。类似地,对于小鼠,Inui等人(2014)报告,修饰位点与gRNA靶位点之间的距离是影响取代效率的重要参数[Inui,M.等人,Rapid generation of mouse models withdefined point mutations by the CRISPR/Cas9 system[通过CRISPR/Cas9系统快速产生具有限定点突变的小鼠模型].Sci Rep[科学报告].2014;4:5396]。

对于在酿酒酵母中进行定向诱变或基因组编辑,Horwitz等人(2015)报告,靶向切割的位点应当尽可能接近所需突变的位点。此外,为了破坏供体DNA中的Cas9p靶位点并且同时提高重组事件包括所需突变的机会,Horwitz等人(2015)在靶位点与点突变之间的密码子中进行了沉默改变(一种“异源性阻断”)[Horwitz,A.A.等人,Efficient MultiplexedIntegration of Synergistic Alleles and Metabolic Pathways in Yeasts viaCRISPR-Cas[经由CRISPR-Cas在酵母中进行协同等位基因和代谢途径的高效多重整合].Cell Syst[细胞系统].2015.1(1):第88-96页]。

本实验的目的是检查切割位点与预期突变之间的距离如何影响突变掺入的频率。使用pNJOC503 CRISPR/Cas9靶向质粒,并且将不同的单链寡核苷酸(作为

oNJ499;SEQ ID NO:18。

oNJ500;SEQ ID NO:19。

oNJ501;SEQ ID NO:20。

oNJ502;SEQ ID NO:21。

oNJ503;SEQ ID NO:22。

oNJ504;SEQ ID NO:23。

oNJ505;SEQ ID NO:24。

所有寡核苷酸均被设计用于将靶基因座处的NGG PAM位点的序列改变成NGT,以防止编辑的转化体中的Cas9识别和重新切割。将另外的突变掺入寡核苷酸中,对应于距Cas9切割位点下游8bp、13bp、23bp、33bp或43bp的突变(在图5中由

将TrGMEr62-24a2-1原生质体在冰上解冻。对于每次转化,将大约2μg的pNJOC503质粒DNA和5μl单链寡核苷酸(100μM)添加至100μl解冻的原生质体溶液中,并且轻轻混合。添加PEG缓冲液(250μl),并且将反应物混合并在34℃下孵育30分钟。在转化后,将1ml的STC添加至每种转化反应物中,并且将内容物涂布在PDA+1M蔗糖板上并在30℃下孵育过夜。第二天,添加由PDA+潮霉素B组成的覆盖物至最终浓度为10μg/ml潮霉素B,并且将板在30℃下孵育5-7天。每次转化获得大约100-200个转化体。为了确定编辑频率,从每个转化板中挑取6-12个潮霉素抗性转化体,并且将其转移至PDA板上并在30℃下孵育5-7天。对于每个转化体,用1μl无菌接种环收集孢子,并且将其悬浮于薄壁PCR管中的20μl稀释缓冲液(PHIRE

每种PCR反应物由以下构成:1μl孢子悬浮液、10pmol每种引物、10μl的2X PHIRE

表2.

可能的是高效地将突变转移地远离切割位点(在本实验中长达43bp)(60%-100%的编辑的转化体含有所有预期突变)。突变转移效率远高于使用单链寡核苷酸对哺乳动物细胞[(Inui,M.等人,Rapid generation of mouse models with defined pointmutations by the CRISPR/Cas9 system[通过CRISPR/Cas9系统快速产生具有限定点突变的小鼠模型].Sci Rep[科学报告].2014;4:5396)、(Wang,K.等人,Efficient Generationof Orthologous Point Mutations in Pigs via CRISPR-assisted ssODN-mediatedHomology-directed Repair[经由CRISPR辅助的ssODN介导的同源定向修复在猪中高效产生直向同源点突变].Mol Ther Nucleic Acids[分子疗法-核酸].2016年11月;5(11):e396)、(Paquet,D.等人,Efficient introduction of specific homozygous andheterozygous mutations using CRISPR/Cas9[使用CRISPR/Cas9高效引入特定纯合和杂合突变].Nature[自然],2016.533:第125-129页)]或使用双链寡核苷酸对酵母[Horwitz,A.A.等人,Efficient Multiplexed Integration of Synergistic Alleles andMetabolic Pathways in Yeasts via CRISPR-Cas[经由CRISPR-Cas在酵母中进行协同等位基因和代谢途径的高效多重整合].Cell Syst[细胞系统].2015.1(1):第88-96页]所报告的效率。

实例6:距切割位点长达63bp递送SNV

基于上述实例中提到的有希望的结果,决定测试是否可以将突变转移地距切割位点更远,以及突变每侧上的同源量在多大程度上影响转移效率(图6)。在本实验中测试了八种不同的单链寡核苷酸(作为

表3.

使用单链寡核苷酸,可能的是高效地距切割位点长达63bp引入突变,因为31%-84%的编辑的转化体含有所有所需突变(PAM突变和在距切割位点不同距离处插入的另一个突变)。突变转移是高效的,即使是在预期突变之外的连续的未修饰的核苷酸数目减少至约30bp或约20bp的情况下。总体上,实例5和实例6的结果证明,使用单链寡核苷酸可以以令人惊讶的高效率引入远离切割位点的突变。这些是重要的结果,因为不一定总能找到好的原型间隔子和接近目的靶位点的PAM序列。例如,对于含有25%的碱基A、T、C和G中每一个的序列,将预期酶(如MAD7(MAD7显示出对TTTV或CTTV PAM位点的偏好))的四核苷酸TTTN或CTTN PAM序列(其中N是A、T、C或G)对于DNA的每条链大约每64bp而存在或总体上每32pb而存在一次。这些结果扩大了序列的量,这些序列可以高效地靶向用于CRISPR介导的突变和使用单链寡核苷酸进行基因组编辑。

实例7:使用减少量的单链寡核苷酸进行CRISPR/Cas9和单链寡核苷酸介导的编辑

对于使用单链寡核苷酸的高通量诱变工作,如果每次转化可以使用较少的寡核苷酸将是有利的,因为这将通过允许为多个目的重复使用相同的寡核苷酸和/或以较小的规模合成寡核苷酸来降低总成本(每核苷酸的价格较低)。因此,我们想测试单链寡核苷酸的量如何影响转化和编辑效率。将TrGMEr62-24a2-1原生质体在冰上解冻。对于每次转化,将大约2μg的pNJOC503质粒DNA和10-500pmol oNJ346(SEQ ID NO:16)单链寡核苷酸(与0.1-5μl 100μM储备液对应)添加至100μl解冻的原生质体溶液中,并且轻轻混合。添加PEG缓冲液(250μl),并且将反应物混合并在34℃下孵育30分钟。在转化后,将1ml的STC添加至每种转化反应物中,并且将内容物涂布在PDA+1M蔗糖板上并在30℃下孵育过夜。第二天,添加由PDA+潮霉素B组成的覆盖物至最终浓度为10μg/ml潮霉素B,并且将板在30℃下孵育5-7天。除了用10pmol的oNJ346转化仅给出约50个转化体之外,每次转化获得大约100-200个转化体。使用Whatman

表4.

oNJ346单链寡核苷酸的量可以降低至20pmol而不会负面地影响编辑效率(>87%),并且仍保持较高的转化效率。这使得能够使用相同的寡核苷酸进行多次转化,并且允许以较小规模合成寡核苷酸。

实例8:米曲霉原生质体产生

根据Christensen等人,1988,Biotechnology[生物技术]6:1419-1422进行米曲霉转化。简言之,使米曲霉菌丝体在富营养培养液中生长。通过过滤从培养液中分离出菌丝体。将酶制剂

实例9:CRISPR/Mad7骨架载体pAT3630

质粒pAT3630(SEQ ID NO:33,图7)是CRISPR/Mad7表达质粒,用于使用

实例10:pAT3720的构建

由集成DNA技术公司将其延伸序列用于克隆的原型间隔子(oAT3858)合成为单链寡核苷酸。将原型间隔子寡核苷酸稀释至最终工作浓度为1μM:

oAT3858(SEQ ID NO:36):

AATTTCTACTCTTGTAGATacgatggtgctgatggctacttttttttttgagcatttatcagcttg

将具有正确的原型间隔子序列的质粒标记为pAT3720(SEQ ID NO:38,图8)并且保存以供以后使用。

实例11:距CRISPR/Mad7切割位点长达58bp递送SNV

基于上述实例中提到的使用CRISPR/Cas9获得的有希望的结果,决定测试是否可以使用CRISPR/Mad7将突变转移地距切割位点长达58bp,以使双链在靶位点处断裂。下表中报告的距切割位点的距离是相对于PAM位点的3'的位置19给出的。在本实验中测试了三种不同的单链寡核苷酸(oAT4070-oAT4072,作为

每种PCR反应物由以下构成:1μl孢子悬浮液、10pmol每种引物、10μl的2X PHIRE

表5.

在本实验中以样本量为8获得的转移效率与使用CRISPR/Cas9和单链寡核苷酸在里氏木霉中观察到的效率相当。

实例12:使用CRISPR/Cas9和单链寡核苷酸在黑曲霉中转移SNV

基于CRISPR/Cas9和CRISPR/Mad7所获得的有希望的结果,使用Cas9作为CRISPR核酸酶在ku70破坏黑曲霉宿主中测试了使用与CRISPR组合的单链寡核苷酸进行的SNV递送。使用CRISPR/Cas9和单链寡核苷酸作为供体DNA,靶向总共11个不同的基因进行编辑。总体上,当距Cas9切割位点7-26bp转移突变时,获得了60%-100%的SNV转移效率(数据未示出)。结果证明,使用与CRISPR Cas9组合的单链寡核苷酸插入SNV在黑曲霉中也是可能的。

实例13:CRISPR/Mad7骨架载体pGMEr263

质粒pGMEr263(SEQ ID NO:45,图9)是CRISPR/MAD7表达质粒,用于使用

直肠真杆菌Mad7的表达在来自pFC330-333的构巢曲霉tef1启动子(核苷酸8777-9662)和终止子(核苷酸13,479-13,883)的控制之下(

实例14:pGMEr263proto1-proto5的构建

由赛默飞世尔科技公司将其延伸序列用于克隆的每个原型间隔子(1228713、1228715、1228717、1228719和1228721)合成为单链寡核苷酸。每种寡核苷酸中的加下划线序列突出了五个二十一个核苷酸的原型间隔子。将所有原型间隔子寡核苷酸稀释至最终工作浓度为1μM:

1228713;SEQ ID NO:46

1228715;SEQ ID NO:47

1228717;SEQ ID NO:48

1228719;SEQ ID NO:49

1228721;SEQ ID NO:50

实例15:pGMEr263proto1-proto5与单链寡核苷酸在里氏木霉中的共转化

本实验的目的是检查单链寡核苷酸是否可以用作使用多核苷酸指导的核酸酶(如MAD7、Cas9等)进行基因组编辑的供体DNA。pGMEr263proto1-pGMEr2630proto5质粒是表达Mad7的自主复制质粒(含有AMA1),其是靶向里氏木霉ACE3基因座的特定序列和hph选择标记(潮霉素B抗性)的sgRNA构建体。如此设计寡核苷酸,使得在供体DNA与靶基因座之间重组时,ACE3基因座处的整个靶序列将被HindIII位点替代(以便于通过PCR和HindIII消化进行筛选)。将TrGMEr62-24a2-1原生质体在冰上解冻。对于每次转化,将大约2μg质粒DNA和3μl单链寡核苷酸(50μM,由赛默飞世尔科技公司合成)添加至100μl解冻的原生质体溶液中,并且轻轻混合。添加PEG缓冲液(250μl),并且将反应物混合并在34℃下孵育30分钟。在转化后,将1ml的STC添加至每种转化反应物中,并且将内容物涂布在PDA+1M蔗糖板上并在34℃下孵育过夜。第二天,添加由PDA+潮霉素B组成的覆盖物至最终浓度为10μg/ml潮霉素B,并且将板在30℃下孵育5-7天。每次转化获得大约15-20个转化体。为了确定编辑频率,从每个转化板中挑取少量潮霉素抗性菌落,并且将其转移至PDA板上并在30℃下孵育5-7天。对于每个转化体,用1μl无菌接种环收集孢子,并且将其悬浮于薄壁PCR管中的20μl稀释缓冲液(PHIRE

1228586(SEQ ID NO:57)

1228587(SEQ ID NO:58)

每种PCR反应物由以下构成:1μl孢子悬浮液、10pmol每种引物、10μl的2X PHIRE

为了鉴定编辑的转化体,用HindIII消化PCR产物。编辑的转化体应当在PCR/HindIII消化后产生两个条带,而未编辑的转化体应当仅产生单个条带(不存在HindIII位点)。每种HindIII消化反应物由以下构成:5μl PCR产物、1x CutSmart缓冲液(新英格兰生物实验室公司)、6个单位的HindIII-HF酶(新英格兰生物实验室公司)和至最终体积为20μl的无菌Milli-Q H

表6.

实例16:在里氏木霉中使用单链寡核苷酸距切割位点长达47bp经由CRISPR/Mad7编辑递送SNV

本实验的目的是在里氏木霉中经由CRISPR/Mad7基因组编辑检查切割位点与预期突变之间的距离如何影响突变掺入的频率。使用pGMEr263-proto1 CRISPR/Mad7靶向质粒,并且将不同的单链寡核苷酸(作为

寡核苷酸10(SEQ ID NO:69)

寡核苷酸11(SEQ ID NO:70)

寡核苷酸12(SEQ ID NO:71)

寡核苷酸13(SEQ ID NO:72)

寡核苷酸10-13被设计用于将靶基因座处的TTTV PAM位点的序列中的一个核苷酸改变成TTGV以及原型间隔子1区域中的一个核苷酸改变,以防止编辑的转化体中的Mad7识别和重新切割。将另外的突变掺入所有寡核苷酸中,对应于距Mad7切割位点下游20bp、32bp或47bp,或者上游-44bp的所需SNV的插入。下表中报告的距切割位点的距离是相对于PAM位点的3'的位置19给出的。下表示出了所使用的每种寡核苷酸中所有改变的位置。

表7.

所有寡核苷酸在被研究突变掺入的突变(SNV)的5'侧上均含有61-39个未修饰的核苷酸(nt),并且在3'侧上均含有33-41个未修饰的nt。

将TrGMEr62-24a2-1原生质体在冰上解冻。对于每次转化,将大约2μg的pGMER263-proto1质粒DNA和3μl单链寡核苷酸(50μM)添加至100μl解冻的原生质体溶液中,并且轻轻混合。添加PEG缓冲液(250μl),并且将反应物混合并在34℃下孵育30分钟。在转化后,将1ml的STC添加至每种转化反应物中,并且将内容物涂布在PDA+1M蔗糖板上并在34℃下孵育过夜。第二天,添加由PDA+潮霉素B组成的覆盖物至最终浓度为10μg/ml潮霉素B,并且将板在30℃下孵育5-7天。每次转化获得在0与30之间的转化体数目。为了确定编辑频率,从每个转化板中挑取最多15个潮霉素抗性转化体,并且将其转移至PDA板上并在30℃下孵育5-7天。对于每个转化体,用1μl无菌接种环收集孢子,并且将其悬浮于薄壁PCR管中的20μl稀释缓冲液(PHIRE

每种PCR反应物由以下构成:1μl孢子悬浮液、10pmol每种引物、10μl的2X PHIRE

表8.显示寡核苷酸与所需突变和切割位点之间的距离(核苷酸数目;Nt)(第2列);PAM突变(第3列);原型间隔子突变(原型间隔子中的位置编号)(第4列);通过同源定向修复(HDR)编辑的转化体数目(第5列);通过HDR和掺入的所有突变编辑的转化体数目(第6列)。

可能的是以36%-100%之间的编辑效率将突变转移至Mad7切割位点下游长达47nt和上游44nt。突变转移效率远高于使用单链寡核苷酸对哺乳动物细胞[(Inui,M.等人,Rapid generation of mouse models with defined point mutations by the CRISPR/Cas9 system[通过CRISPR/Cas9系统快速产生具有限定点突变的小鼠模型].Sci Rep[科学报告].2014;4:5396)、(Wang,K.等人,Efficient Generation of Orthologous PointMutations in P igs via CRISPR-assisted ssODN-mediated Homology-directedRepair[经由CRISPR辅助的ssODN介导的同源定向修复在猪中高效产生直向同源点突变].Mol Ther Nucleic Acids[分子疗法-核酸].2016年11月;5(11):e396)、(Paquet,D.等人,Efficient introduction of specific homozygous and hetero zygous mutationsusing CRISPR/Cas9[使用CRISPR/Cas9高效引入特定纯合和杂合突变].Nature[自然],2016.533:第125-129页)]或使用双链寡核苷酸对酵母[Horwitz,A.A.等人,EfficientMultiplexed Integration of Syn ergistic Alleles and Metabolic Pathways inYeasts via CRISPR-Cas[经由C RISPR-Cas在酵母中进行协同等位基因和代谢途径的高效多重整合].Cell S yst[细胞系统].2015.1(1):第88-96页]所报告的效率。

实例17:在里氏木霉中使用CRISPR/Mad7和dsDNA片段距切割位点长达553bp递送SNV

本实验的目的是检查SNV是否可以在CRISPR切割位点与预期突变之间有较大距离的情况下被靶向。将七种不同的CRISPR/Mad7靶向质粒与作为供体DNA的不同双链DNA(作为

所有供体DNA均被设计用于改变靶基因座处的TTTV PAM位点的序列以及在原型间隔子中引入沉默突变,以防止编辑的转化体中的Mad7识别和重新切割。将导致氨基酸改变的突变掺入修复片段中。此外,基于Horwitz等人(2015)的推荐,包括了在PAM突变与距切割位点长达553bp的所需突变之间的另外的“缓冲突变”,以观察添加额外的“缓冲突变”是否可以提高距切割位点更远的突变掺入率。

将TrGMEr62-24a2-1原生质体在冰上解冻。对于每次转化,将大约1.5μg的CRISPR/Mad7靶向质粒DNA和2-5μg双链供体DNA添加至100μl解冻的原生质体溶液中,并且轻轻混合。添加PEG缓冲液(250μl),并且将反应物混合并在37℃下孵育30分钟。在转化后,将1ml的STC添加至每种转化反应物中,并且将内容物涂布在PDA+1M蔗糖板上并在34℃下孵育过夜。第二天,添加由PDA+潮霉素B组成的覆盖物至最终浓度为10μg/ml潮霉素B,并且将板在30℃下孵育5-7天。每次转化获得大约2-8个转化体。为了确定编辑频率,从每个转化板中挑取潮霉素抗性转化体,并且将其转移至PDA板上并在30℃下孵育5-7天。对于每个转化体,用1μl无菌接种环收集孢子,并且将其悬浮于薄壁PCR管中的20μl稀释缓冲液(PHIRE

每种PCR反应物由以下构成:0.5μl孢子悬浮液、10pmol每种引物、5μl的2X PHIRE

表9.

可能的是高效地将突变转移地相当远离切割位点(在本实验中长达553bp)(33%-100%的编辑的转化体含有所有预期突变;表9)。考虑到距CRISPR/Mad7切割位点的距离,突变转移效率较高。

序列表

<110> 诺维信公司(Novozymes A/S)

<120> 通过指导的内切核酸酶和单链寡核苷酸进行基因组编辑

<130> NZ 14843-WO-PCT

<160> 72

<170> PatentIn 3.5版

<210> 1

<211> 16531

<212> DNA

<213> 人工序列

<220>

<223> 质粒pSMAI290.

<400> 1

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acccgggcta 420

attatggggt gtcgccctta ttcgactcta tagtgaagtt cctattctct agaaagtata 480

ggaacttctg aagtggggat ttaaatgcgg ccgcgctgag ggtttaatcg acgaagcagc 540

tgacggccag tgccaagctt aacgcgtacc gggcccagta tatgttccgc agatgactgg 600

agctctgcca tacgtgccct ctcaagcacc atttgttcca tctacagaga ctagtcacca 660

actagtctat caagactcac agggtacatt gctgagacca actgaccaga ggcagggtag 720

cggattgacg gctccatctc cttcacttac aaggtctatt gaaagccctt tagcatcacc 780

aagcggagaa tagattgtta agcttatttt ttgtatactg ttttgtgata gcacgaagtt 840

tttccacggt atcttgtaaa aatatatatt tgtggcgggc ttacctacat caaattaata 900

agagactaat tataaactaa acacacaagc aagctacttt agggtaaaag tttataaatg 960

cttttgacgt ataaacgttg cttgtattta ttattacaat taaaggtgga tagaaaacct 1020

agagactagt tagaaactaa tctcaggttt gcgttaaact aaatcagagc ccgagaggtt 1080

aacagaacct agaaggggac tagatatccg ggtagggaaa caaaaaaaaa aaacaagaca 1140

gccacatatt agggagacta gttagaagct agttccagga ctaggaaaat aaaagacaat 1200

gataccacag tctagttgac aactagatag attctagatt gaggccaaag tctctgagat 1260

ccaggttagt tgcaactaat actagttagt atctagtctc ctataactct gaagctagaa 1320

taacttacta ctattatcct caccactgtt cagctgcgca aacggagtga ttgcaaggtg 1380

ttcagagact agttattgac tagtcagtga ctagcaataa ctaacaaggt attaacctac 1440

catgtctgcc atcaccctgc acttcctcgg gctcagcagc cttttcctcc tcattttcat 1500

gctcattttc cttgtttaag actgtgacta gtcaaagact agtccagaac cacaaaggag 1560

aaatgtctta ccactttctt cattgcttgt ctcttttgca ttatccatgt ctgcaactag 1620

ttagagtcta gttagtgact agtccgacga ggacttgctt gtctccggat tgttggagga 1680

actctccagg gcctcaagat ccacaacaga gccttctaga agactggtca ataactagtt 1740

ggtctttgtc tgagtctgac ttacgaggtt gcatactcgc tccctttgcc tcgtcaatcg 1800

atgagaaaaa gcgccaaaac tcgcaatatg gctttgaacc acacggtgct gagactagtt 1860

agaatctagt cccaaactag cttggatagc ttacctttgc cctttgcgtt gcgacaggtc 1920

ttgcagggta tggttccttt ctcaccagct gatttagctg ccttgctacc ctcacggcgg 1980

atctgccata aagagtggct agaggttata aattagcact gatcctaggt acggggctga 2040

atgtaacttg cctttccttt ctcatcgcgc ggcaagacag gcttgctcaa attcctacca 2100

gtcacagggg tatgcacggc gtacggacca cttgaactag tcacagatta gttagcaact 2160

agtctgcatt gaatggctgt acttacgggc cctcgccatt gtcctgatca tttccagctt 2220

caccctcgtt gctgcaaagt agttagtgac tagtcaagga ctagttgaaa tgggagaaga 2280

aactcacgaa ttctcgactc ccttagtatt gtggtccttg gacttggtgc tgctatatat 2340

tagctaatac actagttaga ctcacagaaa cttacgcagc tcgcttgcgc ttcttggtag 2400

gagtcggggt tgggagaaca gtgccttcaa acaagccttc ataccatgct acttgactag 2460

tcagggacta gtcaccaagt aatctagata ggacttgcct ttggcctcca tcagttcctt 2520

catagtggga ggaccattgt gcaatgtaaa ctccatgccg tgggagttct tgtccttcaa 2580

gtgcttgacc aatatgtttc tgttggcaga gggaacctgt caactagtta ataactagtc 2640

agaaactatg atagcagtag actcactgta cgcttgaggc atcccttcac tcggcagtag 2700

acttcatatg gatggatatc aggcacgcca ttgtcgtcct gtggactagt cagtaactag 2760

gcttaaagct agtcgggtcg gcttactatc ttgaaatccg gcagcgtaag ctccccgtcc 2820

ttaactgcct cgagatagtg acagtactct ggggactttc ggagatcgtt atcgttatcg 2880

cgaatgctcg gcatactaac tgttgactag tcttggacta gtcccgagca aaaaggattg 2940

gaggaggagg aggaaggtga gagtgagaca aagagcgaaa taagagcttc aaaggctatc 3000

tctaagcagt atgaaggtta agtatctagt tcttgactag atttaaaaga gatttcgact 3060

agttatgtac ctggagtttg gatataggaa tgtgttgtgg taacgaaatg taagggggag 3120

gaaagaaaaa gtcggtcaag aggtaactct aagtcggcca ttcctttttg ggaggcgcta 3180

accataaacg gcatggtcga cttagagtta gctcagggaa tttagggagt tatctgcgac 3240

caccgaggaa cggcggaatg ccaaagaatc ccgatggagc tctagctggc ggttgacaac 3300

cccacctttt ggcgtttctg cggcgttgca ggcgggactg gatacttcgt agaaccagaa 3360

aggcaaggca gaacgcgctc agcaagagtg ttggaagtga tagcatgatg tgccttgtta 3420

actaggtcaa aatctgcagt atgcttgatg ttatccaaag tgtgagagag gaaggtccaa 3480

acatacacga ttgggagagg gcctaggtat aagagttttt gagtagaacg catgtgagcc 3540

cagccatctc gaggagatta aacacgggcc ggcatttgat ggctatgtta gtaccccaat 3600

ggaaacggtg agagtccagt ggtcgcagat aactccctaa attccctgag ctaactctaa 3660

gtcgaccatg ccgtttatgg ttagcgcctc ccaaaaagga atggccgact tagagttacc 3720

tcttgaccga ctttttcttt cctccccctt acatttcgtt accacaacac attcctatat 3780

ccaaactcca ggtacataac tagtcgaaat ctcttttaaa tctagtcaag aactagatac 3840

ttaaccttca tactgcttag agatagcctt tgaagctctt atttcgctct ttgtctcact 3900

ctcaccttcc tcctcctcct ccaatccttt ttgctcggga ctagtccaag actagtcaac 3960

agttagtatg ccgagcattc gcgataacga taacgatctc cgaaagtccc cagagtactg 4020

tcactatctc gaggcagtta aggacgggga gcttacgctg ccggatttca agatagtaag 4080

ccgacccgac tagctttaag cctagttact gactagtcca caggacgaca atggcgtgcc 4140

tgatatccat ccatatgaag tctactgccg agtgaaggga tgcctcaagc gtacagtgag 4200

tctactgcta tcatagtttc tgactagtta ttaactagtt gacaggttcc ctctgccaac 4260

agaaacatat tggtcaagca cttgaaggac aagaactccc acggcatgga gtttacattg 4320

cacaatggtc ctcccactat gaaggaactg atggaggcca aaggcaagtc ctatctagat 4380

tacttggtga ctagtccctg actagtcaag tagcatggta tgaaggcttg tttgaaggca 4440

ctgttctccc aaccccgact cctaccaaga agcgcaagcg agctgcgtaa gtttctgtga 4500

gtctaactag tgtattagct aatatatagc agcaccaagt ccaaggacca caatactaag 4560

ggagtcgaga attcgtgagt ttcttctccc atttcaacta gtccttgact agtcactaac 4620

tactttgcag caacgagggt gaagctggaa atgatcagga caatggcgag ggcccgtaag 4680

tacagccatt caatgcagac tagttgctaa ctaatctgtg actagttcaa gtggtccgta 4740

cgccgtgcat acccctgtga ctggtaggaa tttgagcaag cctgtcttgc cgcgcgatga 4800

gaaaggaaag gcaagttaca ttcagccccg tacctaggat cagtgctaat ttataacctc 4860

tagccactct ttatggcaga tccgccgtga gggtagcaag gcagctaaat cagctggtga 4920

gaaaggaacc ataccctgca agacctgtcg caacgcaaag ggcaaaggta agctatccaa 4980

gctagtttgg gactagattc taactagtct cagcaccgtg tggttcaaag ccatattgcg 5040

agttttggcg ctttttctca tcgattgacg aggcaaaggg agcgagtatg caacctcgta 5100

agtcagactc agacaaagac caactagtta ttgaccagtc ttctagaagg ctctgttgtg 5160

gatcttgagg ccctggagag ttcctccaac aatccggaga caagcaagtc ctcgtcggac 5220

tagtcactaa ctagactcta actagttgca gacatggata atgcaaaaga gacaagcaat 5280

gaagaaagtg gtaagacatt tctcctttgt ggttctggac tagtctttga ctagtcacag 5340

tcttaaacaa ggaaaatgag catgaaaatg aggaggaaaa ggctgctgag cccgaggaag 5400

tgcagggtga tggcagacat ggtaggttaa taccttgtta gttattgcta gtcactgact 5460

agtcaataac tagtctctga acaccttgca atcactccgt ttgcgcagct gaacagtggt 5520

gaggataata gtagtaagtt attctagctt cagagttata ggagactaga tactaactag 5580

tattagttgc aactaacctg gatctcagag actttggcct caatctagaa tctatctagt 5640

tgtcaactag actgtggtat cattgtcttt tattttccta gtcctggaac tagcttctaa 5700

ctagtctccc taatatgtgg ctgtcttgtt tttttttttt gtttccctac ccggatatct 5760

agtccccttc taggttctgt taacctctcg ggctctgatt tagtttaacg caaacctgag 5820

attagtttct aactagtctc taggttttct atccaccttt aattgtaata ataaatacaa 5880

gcaacgttta tacgtcaaaa gcatttataa acttttaccc taaagtagct tgcttgtgtg 5940

tttagtttat aattagtctc ttattaattt gatgtaggta agcccgccac aaatatatat 6000

ttttacaaga taccgtggaa aaacttcgtg ctatcacaaa acagtataca aaaaataagc 6060

ttaacaatct attctccgct tggtgatgct aaagggcttt caatagacct tgtaagtgaa 6120

ggagatggag ccgtcaatcc gctaccctgc ctctggtcag ttggtctcag caatgtaccc 6180

tgtgagtctt gatagactag ttggtgacta gtctctgtag atggaacaaa tggtgcttga 6240

gagggcacgt atggcagagc tccagtcatc tgcggaacat atactgggcc cggggatcct 6300

ctagagtcga cctgcaggtt catttaaacg gcttcacggg cagcccagcg gtcgatttcg 6360

cttccaaatt ttgggggaaa gggtccctga gcagcctcac aaacgcaaac atgcgcacgc 6420

gccacacgga aaatgaagct gactttgaat ttttaagaat cccctttgcc cgtggcacct 6480

tctgattttt gtcttcgtgt ccaatccatc tccttgaacg acaacccagc cctttctatt 6540

tcctatcccc taatatctaa tgtgagtcct catcgtcaca gacggcgacg gacgcgacat 6600

ttcgcccgtg ctcatcgacc gctctgctgt cgccaacaga acacgcggtt atgtcgcgtt 6660

ccgctttgtc gtaccacttt cgccccacac cgctgacctc gcgttcccag catgaaaaag 6720

cctgaactca ccgcgacgtc tgtcgagaag tttctgatcg aaaagttcga cagcgtctcc 6780

gacctgatgc agctctcgga gggcgaagaa tctcgtgctt tcagcttcga tgtaggaggg 6840

cgtggatatg tcctgcgggt aaatagctgc gccgatggtt tctacaaaga tcgttatgtt 6900

tatcggcact ttgcatcggc cgcgctcccg attccggaag tgcttgacat tggggagttc 6960

agcgagagcc tgacctattg catctcccgc cgtgcacagg gtgtcacgtt gcaagacctg 7020

cctgaaaccg aactgcccgc tgttctgcag ccggtcgcgg aggccatgga tgcgatcgct 7080

gcggccgatc ttagccagac gagcgggttc ggcccattcg gaccgcaagg aatcggtcaa 7140

tacactacat ggcgtgattt catatgcgcg attgctgatc cccatgtgta tcactggcaa 7200

actgtgatgg acgacaccgt cagtgcgtcc gtcgcgcagg ctctcgatga gctgatgctt 7260

tgggccgagg actgccccga agtccggcac ctcgtgcacg cggatttcgg ctccaacaat 7320

gtcctgacgg acaatggccg cataacagcg gtcattgact ggagcgaggc gatgttcggg 7380

gattcccaat acgaggtcgc caacatcttc ttctggaggc cgtggttggc ttgtatggag 7440

cagcagacgc gctacttcga gcggaggcat ccggagcttg caggatcgcc gcggctccgg 7500

gcgtatatgc tccgcattgg tcttgaccaa ctctatcaga gcttggttga cggcaatttc 7560

gatgatgcag cttgggcgca gggtcgatgc gacgcaatcg tccgatccgg agccgggact 7620

gtcgggcgta cacaaatcgc ccgcagaagc gcggccgtct ggaccgatgg ctgtgtagaa 7680

gtactcgccg atagtggaaa ccgacgcccc agcactcgtc cgagggcaag gaatagtaaa 7740

tgattcgtta gttctttcct gaactgatga ttcgcgcgat tcgtatttct ctttgttggt 7800

tgttctgatg atgatgaaaa tgacgcatct ctttatttgc tgcactcgta cacccatcct 7860

ttggaatgat taatacccct cctttttcat cgcggacggt agtcgttctc tttggggccg 7920

tgtttcttcc cattcgcatg cgacctcgtg gtcattgact gtctgtcctc ttcctctcca 7980

cctacctcca ccacctacgt tgactgcata tcactttttc aaacattcat gataatacgc 8040

taccttctgg catgaccttt tgatgatcgc tttttactat cctttcaatt acgatgttgt 8100

cacttctatt tgtcattttg cggaattagt attttctttc catcttcgat ggagagatga 8160

atattgcctg caggcatgca agctttctgc tcgaggccat ctggcttttc tctgctgtct 8220

gcctcgggaa tgggatggaa taccacgtac ggtatttggc ctccggtgcc atccgaagcg 8280

agatgctttg agcttgaaac cccctcggcc tgcacaggtg tctcatcgtg catttaatcc 8340

aacggcggcg agtcaaaaca tcagctaatt gaccaggttt ctggattgtg aatgccaact 8400

ttttgggtct tgaggagttg cggggtggga aaaaagtaaa gaaatttact gaggatttta 8460

tcattgcgac tataaaataa agcggcattg caaatccttg cgttgctact atgtaaaatg 8520

gactgtagtt gtgctgctga aaatagtttg gcgattgtgg attgtggatt gtggattgtg 8580

gattatggca agttgtcaag gggcaagttg acgaaaatga ttgtgtggtg tctgccagca 8640

aattgagaac gtgggtatat atttcatctt ttcatgattc ccttcggctt gcttgtcaag 8700

caatggcatc attggtctag tggtagaatt cgtcgttgcc atcgacgagg cccgtgttcg 8760

attcacggat gatgcaagat ctgttttaga gctagaaata gcaagttaaa ataaggctag 8820

tccgttatca acttgaaaaa gtggcaccga gtcggtgctt tttttttggc tcttgggttc 8880

gaactgccca aggcccatgt tttggtcatc ttttttttta tgccccacca tttgggtcac 8940

ccctgccaat cattccatct ttgttcctac ccttcacgtg tgctttccga agccaaagtt 9000

cccattcaac aactctcctt gcgttttttt tttcttgaag cttgtcaccc gtcgatagtt 9060

tctgccattt gcaataagct tcgagacagc agaatcaccg cccaagttaa gcctttgtgc 9120

tgatcatgct ctcgaacggg ccaagttcgg gaaaagcaaa ggagcgttta gtgaggggca 9180

atttgactca cctcccaggc aacagatgag gggggcaaaa agaaagaaat tttcgtgagt 9240

caatatggat tccgagcatc attttcttgc ggtctatctt gctacgtatg ttgatcttga 9300

cgctgtggat caagcaacgc cactcgctcg ctccatcgca ggctggtcgc agacaaatta 9360

aaaggcggca aactcgtaca gccgcggggt tgtccgctgc aaagtacaga gtgataaaag 9420

ccgccatgcg accatcaacg cgttgatgcc cagctttttc gatccgagaa tccaccgtag 9480

aggcgatagc aagtaaagaa aagctaaaca aaaaaaaatt tctgccccta agccatgaaa 9540

acgagatggg gtggagcaga accaaggaaa gagtcgcgct gggctgccgt tccggaaggt 9600

gttgtaaagg ctcgacgccc aaggtgggag tctaggagaa gaatttgcat cgggagtggg 9660

gcgggttacc cctccatatc caatgacaga tatctaccag ccaagggttt gagcccgccc 9720

gcttagtcgt cgtcctcgct tgcccctcca taaaaggatt tcccctcccc ctcccacaaa 9780

attttctttc ccttcctctc cttgtccgct tcagtacgta tatcttccct tccctcgctt 9840

ctctcctcca tccttctttc atccatctcc tgctaacttc tctgctcagc acctctacgc 9900

attactagcc gtagtatctg agcacttctc ccttttatat tccacaaaac ataacacaac 9960

cttcaccatg gacaagaagt atagcatcgg gctggacatt ggaacgaact cggttggttg 10020

ggctgtgatt acggacgaat acaaggtgcc atccaagaag tttaaggtcc tgggaaacac 10080

cgaccgtcac tcaatcaaga agaatctcat tggagccctg ctcttcgata gtggggagac 10140

cgccgaagct actcgactga agcgaacggc tcgccggcgt tatacacgac gcaagaatcg 10200

catctgctac ctccaggaga ttttcagcaa cgaaatggct aaggttgatg actcattctt 10260

tcatcgactc gaagaaagtt tcttggtcga ggaggataag aagcacgagc gccatccgat 10320

ctttggtaac attgtggatg aggttgccta tcacgaaaag tacccaacta tctatcatct 10380

tcgtaagaag ctggtcgata gcacggacaa ggctgatttg cgacttatct acctggcact 10440

cgcgcacatg attaagttcc gcggccattt tcttatcgag ggtgacctga accccgataa 10500

ttctgacgtt gataagctct tcatccagtt ggtccaaacc tacaatcagc tgtttgagga 10560

aaaccctatt aatgcatctg gcgtggacgc caaggctatc ctttcggcgc gcctgtctaa 10620

gtcgcggcgt ttggagaacc ttatcgcaca actccccggc gaaaagaaga acggcctctt 10680

cggtaatttg attgcgttgt cacttggtct gactcctaac ttcaagagta attttgacct 10740

ggcagaggat gcgaagctcc agttgtctaa ggatacgtat gatgacgatc tcgacaactt 10800

gcttgcccaa atcggtgacc agtacgctga tcttttcctg gccgctaaga atctctcaga 10860

tgcaatcctg ctcagtgaca ttttgcgggt caacaccgag attactaagg cccccctgtc 10920

agctagtatg atcaagcggt atgatgagca ccatcaggac ctcaccttgc ttaaggccct 10980

cgtgcgtcag caattgcctg agaagtacaa ggaaatcttc tttgaccaat ccaagaacgg 11040

atacgcaggg tatattgatg gcggtgcgag ccaggaggaa ttctacaagt ttatcaagcc 11100

gattttggag aagatggacg gcactgagga actgctcgtc aagctgaatc gcgaagattt 11160

gcttcgtaag caacgaacgt tcgacaacgg ctccatcccg caccagattc atctgggcga 11220

gctccacgcc atccttcgac gccaggaaga tttctaccca tttctgaagg acaaccgtga 11280

gaagatcgaa aagattctta cattccgaat cccctactat gtgggacctt tggcccgtgg 11340

gaattcccga tttgcttgga tgacccgaaa gagcgaggaa accatcactc cgtggaactt 11400

cgaggaagtc gtggacaagg gtgcatccgc gcagagcttc attgagcgga tgaccaattt 11460

tgataagaac cttccgaatg aaaaggtcct gccaaagcat tcgctgctct acgagtattt 11520

caccgtgtat aacgaactga ctaaggtcaa gtacgtgacg gagggaatgc ggaagccagc 11580

cttcctctca ggggaacaaa agaaggctat cgtcgatttg ctttttaaga ccaatcgtaa 11640

agtgactgtt aagcagctga aggaggatta tttcaagaag attgaatgtt tcgactccgt 11700

cgagatcagc ggcgtggaag atcgctttaa cgcttccctc ggtacctacc acgacctgct 11760

caagatcatt aaggacaagg atttcctcga taacgaggaa aatgaggaca tcttggaaga 11820

tattgtcctc acgttgacac tttttgagga ccgcgaaatg atcgaggaac ggctcaagac 11880

atatgcccat ttgttcgacg ataaggtgat gaagcagctg aagcggcgtc gatacaccgg 11940

atggggtcgc cttagccgga agctgatcaa cggcattcga gataagcaat ctggtaagac 12000

tatcttggat ttccttaagt cggacggctt cgccaaccgc aattttatgc agcttattca 12060

cgacgattcc ctgacgttca aggaggacat ccagaaggca caagtctcag gacaagggga 12120

ttccctgcac gagcatatcg ccaacctggc tggatccccg gcgatcaaga aggggattct 12180

tcagaccgtc aaggttgtcg acgagctggt caaggtgatg ggccgtcata agccagaaaa 12240

catcgtgatt gagatggccc gagaaaatca gaccactcaa aagggtcaga agaacagccg 12300

cgagcggatg aagcggatcg aggaaggcat taaggaactt ggttctcaga tcctgaagga 12360

gcaccctgtt gaaaacacac agctccaaaa tgagaagctg tatctctact atttgcaaaa 12420

tggacgcgac atgtacgtcg atcaggagct cgacattaac cggttgtcgg actacgatgt 12480

tgaccatatc gtcccgcaat ccttccttaa ggacgatagc attgataaca aggtgctgac 12540

tcgctcagat aagaaccggg gcaagtccga caatgttcca agcgaggaag tggttaagaa 12600

gatgaagaac tactggcgcc aattgcttaa tgccaagctc atcacacagc gcaagtttga 12660

caacttgacc aaggccgagc ggggagggct gagtgaactc gataaggctg gcttcatcaa 12720

gcgtcaactc gtggagacgc gacagatcac aaagcacgtt gctcagattc tggactcccg 12780

gatgaacaca aagtacgacg agaatgataa gctcatccgt gaagttaagg tcattaccct 12840

caagtctaag ttggtgtcgg atttccgcaa ggacttccaa ttttataagg ttcgggagat 12900

caacaattat caccatgcac atgatgcgta cctcaacgca gtcgtgggaa ctgcgctcat 12960

caagaagtat cccaagttgg agtccgaatt cgtctacggg gattataagg tttacgacgt 13020

ccgcaagatg atcgccaaga gtgagcagga aattggcaag gccacggcta agtatttctt 13080

ttactccaac atcatgaatt tctttaagac ggagatcaca ctcgccaatg gagaaatccg 13140

taagcgacct ttgattgaga ccaacggcga gactggtgaa atcgtttggg ataaggggcg 13200

cgacttcgct accgtgcgga aggttctgag catgccgcaa gtcaatatcg tcaagaaaac 13260

cgaggtgcag acaggcggtt tctctaagga atcgattctt ccaaagcgta actctgacaa 13320

gctgatcgct cgaaagaagg attgggaccc caagaagtat ggagggttcg attctcctac 13380

agtggcatac tcggttctcg ttgtcgcgaa ggttgagaag ggaaagtcta agaagctgaa 13440

gtcggtcaag gaactgctcg ggatcaccat tatggagcgc tccagcttcg aaaagaatcc 13500

catcgacttt ctcgaggcca agggctataa ggaagtcaag aaggatctta tcattaagct 13560

gcctaagtac tctttgttcg agcttgaaaa cggtcgaaag cgaatgctcg catcggcagg 13620

agagttgcag aaggggaatg aattggcact tccctcaaag tacgtgaact tcctgtatct 13680

cgcgtcccac tacgagaagc tgaagggtag ccctgaggac aacgaacaga agcaactttt 13740

tgttgagcaa cacaagcatt atctggatga gatcattgaa cagatttcag agttcagtaa 13800

gcgcgtcatc ctcgccgatg ctaatctcga caaggtgttg tcggcctaca acaagcaccg 13860

tgacaagccg atccgagagc aggctgaaaa tatcattcat ctgttcaccc tcactaactt 13920

gggagcacca gcagcgttca agtattttga tacgacaatc gaccgtaagc gatacacgtc 13980

cacaaaggag gtgcttgatg cgaccctgat tcatcaatcc atcactgggc tctatgaaac 14040

ccgtatcgac cttagtcaac tggggggcga cccccccaag aagaagcgca aggtctgagc 14100

ggacattcga tttatgccgt tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg 14160

gaattagact tgttatgtag ttgattctac aatggattat gattcctgaa cttcaaatcc 14220

gctgttcatt attaatctca gctcttcccg taaagccaat gttgaaacta ttcgtaaatg 14280

tacctcgttt tgcgtgtggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat 14340

ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 14400

taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 14460

aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 14520

attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 14580

cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 14640

gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 14700

ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 14760

agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 14820

tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 14880

ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 14940

gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 15000

ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 15060

gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 15120

aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 15180

aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 15240

ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 15300

gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 15360

gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 15420

tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 15480

ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 15540

ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 15600

atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 15660

ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 15720

tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 15780

attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 15840

tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 15900

ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 15960

gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 16020

gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 16080

gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 16140

aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 16200

taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 16260

tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 16320

tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 16380

atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca 16440

tttccccgaa aagtgccacc tgacgtctaa gaaaccatta ttatcatgac attaacctat 16500

aaaaataggc gtatcacgag gccctttcgt c 16531

<210> 2

<211> 2885

<212> DNA

<213> 里氏木霉

<400> 2

ttagtccgac gccttcgagt ccagccgcgt gagaatatcc aaaagcacgg aaaagtcgct 60

cctggctcgc gtagccaagg gtgaatcctg gttgcgatgg atgatggcca gcaaactagc 120

tccgataagg cgaatctttt caacctgcag catccagaca acataatcag gacagattag 180

caacaagtgc cgaggcttga tgatatacat atccgcaggg atataaagag agaggggggg 240

tcgtcgaaga aaagggtgtg cagaaaagag aagagacaag gaaacgactc acgtttggct 300

cgccattggc ctgcaggccc caaaagggcg cctcgttcat caccctcagc atgtctcgca 360

caatctccga ctttctgaga tcagcctgct caacgccagg agcaaaataa gagaggtctt 420

cgaatttctg cgtaattacc atgcgcagac agtgaaacgt cacctgcagg ttgatgcact 480

gtatcacgta ctgcttggac tcggcagacc cgttgccttc tgccatcgct gccatcgcca 540

gagtgcacga ctggaggtac ggcgggagat cgtccaagca ggtgatgaag cggacataga 600

gagaatcgag atgctgcctg tcggcggagg gcagcacatg gttcgggggc atggtccctc 660

gaaagtgctg catcatctga tcttgcagca cgcggatttc cagcagcaaa tcagccgcgg 720

actgccagag ccgcacattt gcgttgaagc cggatatgaa gctcttccgg ggcggctcgg 780

acgccgtgct caggaactcg tcctcgatac ccgacgggta tagcgtggtg atgccggcgt 840

cgaagcagta cttgtggatg gtgatgggcc gattgttgag tatagcggct gacttgtcgc 900

ccaagtacag gatccaaaag cagcgacggc ggaactctgc ctcgatgggg acgagcccct 960

cgagggcagc ctcctcgtgc agctgcatga cctgcgccag gcggatggcc tcgccaaata 1020

tgtgccacga gtacttgggc ttccccgcag cgtggaggca gttggagtgg aagtagcgaa 1080

tggcaatcga gttggccgtc ggattctcca ggtcggcctc gaggtgctgg tgcaggcagt 1140

cccgagaggc ttcgagcaag atctcagaga cggattctcc ttcggggaaa atgtccttgg 1200

gtagcatgaa tgctgcctct gcgcagacgg ccgtgaccag ggtgaaggtc gagtcggccc 1260

agggagccag cctgctgccg acggttcgcg agccgctggg ctggccaaag ccggcccacg 1320

actcggcagc gttgaggggg gtggtgccgg tggtcgggtc tggcgtgagc tgtgacagcg 1380

gcgatggttg gttgacgcca ggcaagggct gggagaagat gtatgcgagc acgtcccgga 1440

gggccggctc gtacaccagg ggggtgaggg ggtagaggta gtcgaagaag aggtcgatac 1500

atcgcttcga gacgcgctct agcgtcgtgt tgcgcagcgt catggcgttg gccaggtgta 1560

tccatcgctg gcgcgtcgag atgttctgga tggtggagag gccgggcagg tcgcccagcg 1620

gctgccgggg caggccgttg tcaatgctga gcggctcgac gggctcccag gccgcgtcgg 1680

gcgacagcga cgacgaggcg aagggctgca gcgcggctac tgcggggccg gagaaggtca 1740

gcggcggcgg catctggccg ggtcgagccg cggtggagag cgagctcgga tcaggaggcg 1800

gctggccggg ctggtcgctc ttcttcctcg ctttggggcc gcgtcgcgcc aggggcaggt 1860

cgaaagtgca ctgcacgtgg gcatcgcggc agtgcgtgca gctatcgaca gcgctgaggt 1920

actcgcactt tgggcgggga agagcattgg tcagtggtgg caaggagaga gtatccaggt 1980

gtaagacggg ggagtagcgc agcatggaag acgaggtcgg tgttggggtg aggctgcagc 2040

agtatgaacg agttgtgaag gcagtgcaat acaatacaca caactctcaa cacaacacaa 2100

cgcttgccat gtatgctgat gtattgtatg tatgctttgt acgcatgaca gacacgcagg 2160

agaagaggac gggaggaggg ggaacgggaa cggggagagg agacacgggc agtaaggaca 2220

tatgaagagc agggaccagg gaccaggaga cggggaggag gaggaggagg aggagcagca 2280

gcatcagcag cagcaggagg aggagcaatg acaacagaga tgcaagcaac agcaaagggg 2340

ctagactgac cttggccttg cgccggcggc agcggtcgca ggctctgctc accagacggc 2400

ctctgggatg gtggtggaac gaggttgcag ccgacacgag tgagttctgc ggcggcgtgg 2460

ttgaggcggt tggcgagccg ggctgcgagg ccgaggcaga ctcgggcgag gtggtgaggg 2520

cgtggacagc gccagcgcca gcgccagcag ctggagggcc gcctgcagct gcagctacag 2580

agccctgggc cggagctgct gagcccatcg ccacggagcc tgtccgggtg cctggaagcc 2640

ctggaaggcc tggagggcct gtagagctgg agcctgcagc gcctgtgtgg ccgaggagcc 2700

acggggggca gcgttagttg ggggggccgc actgcactga ttgcgctgca ctgcgttcca 2760

gtgccaccca cgcgggctgg cagctgggag ggaacgcgag cggacgggac gggactcaac 2820

gcacctgtgt ctgcacccgc agcaaccgcc gcgccgccag ctgctgccgc ggccgctgtg 2880

gccat 2885

<210> 3

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ336

<400> 3

ccgtgttcga ttcacggatg atgcatggcc aggtgtatcc atcgcgtttt agagctagaa 60

atagcaagtt 70

<210> 4

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ338

<400> 4

ccgtgttcga ttcacggatg atgcagccga cacgagtgag ttctggtttt agagctagaa 60

atagcaagtt 70

<210> 5

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ340

<400> 5

ccgtgttcga ttcacggatg atgcaccccg gaagagcttc atatcgtttt agagctagaa 60

atagcaagtt 70

<210> 6

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ260

<400> 6

gattgtgtgg tgtctgccag c 21

<210> 7

<211> 16545

<212> DNA

<213> 人工序列

<220>

<223> 质粒pNJOC502

<400> 7

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acccgggcta 420

attatggggt gtcgccctta ttcgactcta tagtgaagtt cctattctct agaaagtata 480

ggaacttctg aagtggggat ttaaatgcgg ccgcgctgag ggtttaatcg acgaagcagc 540

tgacggccag tgccaagctt aacgcgtacc gggcccagta tatgttccgc agatgactgg 600

agctctgcca tacgtgccct ctcaagcacc atttgttcca tctacagaga ctagtcacca 660

actagtctat caagactcac agggtacatt gctgagacca actgaccaga ggcagggtag 720

cggattgacg gctccatctc cttcacttac aaggtctatt gaaagccctt tagcatcacc 780

aagcggagaa tagattgtta agcttatttt ttgtatactg ttttgtgata gcacgaagtt 840

tttccacggt atcttgtaaa aatatatatt tgtggcgggc ttacctacat caaattaata 900

agagactaat tataaactaa acacacaagc aagctacttt agggtaaaag tttataaatg 960

cttttgacgt ataaacgttg cttgtattta ttattacaat taaaggtgga tagaaaacct 1020

agagactagt tagaaactaa tctcaggttt gcgttaaact aaatcagagc ccgagaggtt 1080

aacagaacct agaaggggac tagatatccg ggtagggaaa caaaaaaaaa aaacaagaca 1140

gccacatatt agggagacta gttagaagct agttccagga ctaggaaaat aaaagacaat 1200

gataccacag tctagttgac aactagatag attctagatt gaggccaaag tctctgagat 1260

ccaggttagt tgcaactaat actagttagt atctagtctc ctataactct gaagctagaa 1320

taacttacta ctattatcct caccactgtt cagctgcgca aacggagtga ttgcaaggtg 1380

ttcagagact agttattgac tagtcagtga ctagcaataa ctaacaaggt attaacctac 1440

catgtctgcc atcaccctgc acttcctcgg gctcagcagc cttttcctcc tcattttcat 1500

gctcattttc cttgtttaag actgtgacta gtcaaagact agtccagaac cacaaaggag 1560

aaatgtctta ccactttctt cattgcttgt ctcttttgca ttatccatgt ctgcaactag 1620

ttagagtcta gttagtgact agtccgacga ggacttgctt gtctccggat tgttggagga 1680

actctccagg gcctcaagat ccacaacaga gccttctaga agactggtca ataactagtt 1740

ggtctttgtc tgagtctgac ttacgaggtt gcatactcgc tccctttgcc tcgtcaatcg 1800

atgagaaaaa gcgccaaaac tcgcaatatg gctttgaacc acacggtgct gagactagtt 1860

agaatctagt cccaaactag cttggatagc ttacctttgc cctttgcgtt gcgacaggtc 1920

ttgcagggta tggttccttt ctcaccagct gatttagctg ccttgctacc ctcacggcgg 1980

atctgccata aagagtggct agaggttata aattagcact gatcctaggt acggggctga 2040

atgtaacttg cctttccttt ctcatcgcgc ggcaagacag gcttgctcaa attcctacca 2100

gtcacagggg tatgcacggc gtacggacca cttgaactag tcacagatta gttagcaact 2160

agtctgcatt gaatggctgt acttacgggc cctcgccatt gtcctgatca tttccagctt 2220

caccctcgtt gctgcaaagt agttagtgac tagtcaagga ctagttgaaa tgggagaaga 2280

aactcacgaa ttctcgactc ccttagtatt gtggtccttg gacttggtgc tgctatatat 2340

tagctaatac actagttaga ctcacagaaa cttacgcagc tcgcttgcgc ttcttggtag 2400

gagtcggggt tgggagaaca gtgccttcaa acaagccttc ataccatgct acttgactag 2460

tcagggacta gtcaccaagt aatctagata ggacttgcct ttggcctcca tcagttcctt 2520

catagtggga ggaccattgt gcaatgtaaa ctccatgccg tgggagttct tgtccttcaa 2580

gtgcttgacc aatatgtttc tgttggcaga gggaacctgt caactagtta ataactagtc 2640

agaaactatg atagcagtag actcactgta cgcttgaggc atcccttcac tcggcagtag 2700

acttcatatg gatggatatc aggcacgcca ttgtcgtcct gtggactagt cagtaactag 2760

gcttaaagct agtcgggtcg gcttactatc ttgaaatccg gcagcgtaag ctccccgtcc 2820

ttaactgcct cgagatagtg acagtactct ggggactttc ggagatcgtt atcgttatcg 2880

cgaatgctcg gcatactaac tgttgactag tcttggacta gtcccgagca aaaaggattg 2940

gaggaggagg aggaaggtga gagtgagaca aagagcgaaa taagagcttc aaaggctatc 3000

tctaagcagt atgaaggtta agtatctagt tcttgactag atttaaaaga gatttcgact 3060

agttatgtac ctggagtttg gatataggaa tgtgttgtgg taacgaaatg taagggggag 3120

gaaagaaaaa gtcggtcaag aggtaactct aagtcggcca ttcctttttg ggaggcgcta 3180

accataaacg gcatggtcga cttagagtta gctcagggaa tttagggagt tatctgcgac 3240

caccgaggaa cggcggaatg ccaaagaatc ccgatggagc tctagctggc ggttgacaac 3300

cccacctttt ggcgtttctg cggcgttgca ggcgggactg gatacttcgt agaaccagaa 3360

aggcaaggca gaacgcgctc agcaagagtg ttggaagtga tagcatgatg tgccttgtta 3420

actaggtcaa aatctgcagt atgcttgatg ttatccaaag tgtgagagag gaaggtccaa 3480

acatacacga ttgggagagg gcctaggtat aagagttttt gagtagaacg catgtgagcc 3540

cagccatctc gaggagatta aacacgggcc ggcatttgat ggctatgtta gtaccccaat 3600

ggaaacggtg agagtccagt ggtcgcagat aactccctaa attccctgag ctaactctaa 3660

gtcgaccatg ccgtttatgg ttagcgcctc ccaaaaagga atggccgact tagagttacc 3720

tcttgaccga ctttttcttt cctccccctt acatttcgtt accacaacac attcctatat 3780

ccaaactcca ggtacataac tagtcgaaat ctcttttaaa tctagtcaag aactagatac 3840

ttaaccttca tactgcttag agatagcctt tgaagctctt atttcgctct ttgtctcact 3900

ctcaccttcc tcctcctcct ccaatccttt ttgctcggga ctagtccaag actagtcaac 3960

agttagtatg ccgagcattc gcgataacga taacgatctc cgaaagtccc cagagtactg 4020

tcactatctc gaggcagtta aggacgggga gcttacgctg ccggatttca agatagtaag 4080

ccgacccgac tagctttaag cctagttact gactagtcca caggacgaca atggcgtgcc 4140

tgatatccat ccatatgaag tctactgccg agtgaaggga tgcctcaagc gtacagtgag 4200

tctactgcta tcatagtttc tgactagtta ttaactagtt gacaggttcc ctctgccaac 4260

agaaacatat tggtcaagca cttgaaggac aagaactccc acggcatgga gtttacattg 4320

cacaatggtc ctcccactat gaaggaactg atggaggcca aaggcaagtc ctatctagat 4380

tacttggtga ctagtccctg actagtcaag tagcatggta tgaaggcttg tttgaaggca 4440

ctgttctccc aaccccgact cctaccaaga agcgcaagcg agctgcgtaa gtttctgtga 4500

gtctaactag tgtattagct aatatatagc agcaccaagt ccaaggacca caatactaag 4560

ggagtcgaga attcgtgagt ttcttctccc atttcaacta gtccttgact agtcactaac 4620

tactttgcag caacgagggt gaagctggaa atgatcagga caatggcgag ggcccgtaag 4680

tacagccatt caatgcagac tagttgctaa ctaatctgtg actagttcaa gtggtccgta 4740

cgccgtgcat acccctgtga ctggtaggaa tttgagcaag cctgtcttgc cgcgcgatga 4800

gaaaggaaag gcaagttaca ttcagccccg tacctaggat cagtgctaat ttataacctc 4860

tagccactct ttatggcaga tccgccgtga gggtagcaag gcagctaaat cagctggtga 4920

gaaaggaacc ataccctgca agacctgtcg caacgcaaag ggcaaaggta agctatccaa 4980

gctagtttgg gactagattc taactagtct cagcaccgtg tggttcaaag ccatattgcg 5040

agttttggcg ctttttctca tcgattgacg aggcaaaggg agcgagtatg caacctcgta 5100

agtcagactc agacaaagac caactagtta ttgaccagtc ttctagaagg ctctgttgtg 5160

gatcttgagg ccctggagag ttcctccaac aatccggaga caagcaagtc ctcgtcggac 5220

tagtcactaa ctagactcta actagttgca gacatggata atgcaaaaga gacaagcaat 5280

gaagaaagtg gtaagacatt tctcctttgt ggttctggac tagtctttga ctagtcacag 5340

tcttaaacaa ggaaaatgag catgaaaatg aggaggaaaa ggctgctgag cccgaggaag 5400

tgcagggtga tggcagacat ggtaggttaa taccttgtta gttattgcta gtcactgact 5460

agtcaataac tagtctctga acaccttgca atcactccgt ttgcgcagct gaacagtggt 5520

gaggataata gtagtaagtt attctagctt cagagttata ggagactaga tactaactag 5580

tattagttgc aactaacctg gatctcagag actttggcct caatctagaa tctatctagt 5640

tgtcaactag actgtggtat cattgtcttt tattttccta gtcctggaac tagcttctaa 5700

ctagtctccc taatatgtgg ctgtcttgtt tttttttttt gtttccctac ccggatatct 5760

agtccccttc taggttctgt taacctctcg ggctctgatt tagtttaacg caaacctgag 5820

attagtttct aactagtctc taggttttct atccaccttt aattgtaata ataaatacaa 5880

gcaacgttta tacgtcaaaa gcatttataa acttttaccc taaagtagct tgcttgtgtg 5940

tttagtttat aattagtctc ttattaattt gatgtaggta agcccgccac aaatatatat 6000

ttttacaaga taccgtggaa aaacttcgtg ctatcacaaa acagtataca aaaaataagc 6060

ttaacaatct attctccgct tggtgatgct aaagggcttt caatagacct tgtaagtgaa 6120

ggagatggag ccgtcaatcc gctaccctgc ctctggtcag ttggtctcag caatgtaccc 6180

tgtgagtctt gatagactag ttggtgacta gtctctgtag atggaacaaa tggtgcttga 6240

gagggcacgt atggcagagc tccagtcatc tgcggaacat atactgggcc cggggatcct 6300

ctagagtcga cctgcaggtt catttaaacg gcttcacggg cagcccagcg gtcgatttcg 6360

cttccaaatt ttgggggaaa gggtccctga gcagcctcac aaacgcaaac atgcgcacgc 6420

gccacacgga aaatgaagct gactttgaat ttttaagaat cccctttgcc cgtggcacct 6480

tctgattttt gtcttcgtgt ccaatccatc tccttgaacg acaacccagc cctttctatt 6540

tcctatcccc taatatctaa tgtgagtcct catcgtcaca gacggcgacg gacgcgacat 6600

ttcgcccgtg ctcatcgacc gctctgctgt cgccaacaga acacgcggtt atgtcgcgtt 6660

ccgctttgtc gtaccacttt cgccccacac cgctgacctc gcgttcccag catgaaaaag 6720

cctgaactca ccgcgacgtc tgtcgagaag tttctgatcg aaaagttcga cagcgtctcc 6780

gacctgatgc agctctcgga gggcgaagaa tctcgtgctt tcagcttcga tgtaggaggg 6840

cgtggatatg tcctgcgggt aaatagctgc gccgatggtt tctacaaaga tcgttatgtt 6900

tatcggcact ttgcatcggc cgcgctcccg attccggaag tgcttgacat tggggagttc 6960

agcgagagcc tgacctattg catctcccgc cgtgcacagg gtgtcacgtt gcaagacctg 7020

cctgaaaccg aactgcccgc tgttctgcag ccggtcgcgg aggccatgga tgcgatcgct 7080

gcggccgatc ttagccagac gagcgggttc ggcccattcg gaccgcaagg aatcggtcaa 7140

tacactacat ggcgtgattt catatgcgcg attgctgatc cccatgtgta tcactggcaa 7200

actgtgatgg acgacaccgt cagtgcgtcc gtcgcgcagg ctctcgatga gctgatgctt 7260

tgggccgagg actgccccga agtccggcac ctcgtgcacg cggatttcgg ctccaacaat 7320

gtcctgacgg acaatggccg cataacagcg gtcattgact ggagcgaggc gatgttcggg 7380

gattcccaat acgaggtcgc caacatcttc ttctggaggc cgtggttggc ttgtatggag 7440

cagcagacgc gctacttcga gcggaggcat ccggagcttg caggatcgcc gcggctccgg 7500

gcgtatatgc tccgcattgg tcttgaccaa ctctatcaga gcttggttga cggcaatttc 7560

gatgatgcag cttgggcgca gggtcgatgc gacgcaatcg tccgatccgg agccgggact 7620

gtcgggcgta cacaaatcgc ccgcagaagc gcggccgtct ggaccgatgg ctgtgtagaa 7680

gtactcgccg atagtggaaa ccgacgcccc agcactcgtc cgagggcaag gaatagtaaa 7740

tgattcgtta gttctttcct gaactgatga ttcgcgcgat tcgtatttct ctttgttggt 7800

tgttctgatg atgatgaaaa tgacgcatct ctttatttgc tgcactcgta cacccatcct 7860

ttggaatgat taatacccct cctttttcat cgcggacggt agtcgttctc tttggggccg 7920

tgtttcttcc cattcgcatg cgacctcgtg gtcattgact gtctgtcctc ttcctctcca 7980

cctacctcca ccacctacgt tgactgcata tcactttttc aaacattcat gataatacgc 8040

taccttctgg catgaccttt tgatgatcgc tttttactat cctttcaatt acgatgttgt 8100

cacttctatt tgtcattttg cggaattagt attttctttc catcttcgat ggagagatga 8160

atattgcctg caggcatgca agctttctgc tcgaggccat ctggcttttc tctgctgtct 8220

gcctcgggaa tgggatggaa taccacgtac ggtatttggc ctccggtgcc atccgaagcg 8280

agatgctttg agcttgaaac cccctcggcc tgcacaggtg tctcatcgtg catttaatcc 8340

aacggcggcg agtcaaaaca tcagctaatt gaccaggttt ctggattgtg aatgccaact 8400

ttttgggtct tgaggagttg cggggtggga aaaaagtaaa gaaatttact gaggatttta 8460

tcattgcgac tataaaataa agcggcattg caaatccttg cgttgctact atgtaaaatg 8520

gactgtagtt gtgctgctga aaatagtttg gcgattgtgg attgtggatt gtggattgtg 8580

gattatggca agttgtcaag gggcaagttg acgaaaatga ttgtgtggtg tctgccagca 8640

aattgagaac gtgggtatat atttcatctt ttcatgattc ccttcggctt gcttgtcaag 8700

caatggcatc attggtctag tggtagaatt cgtcgttgcc atcgacgagg cccgtgttcg 8760

attcacggat gatgcatggc caggtgtatc catcgcgttt tagagctaga aatagcaagt 8820

taaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt gctttttttt 8880

tggctcttgg gttcgaactg cccaaggccc atgttttggt catctttttt tttatgcccc 8940

accatttggg tcacccctgc caatcattcc atctttgttc ctacccttca cgtgtgcttt 9000

ccgaagccaa agttcccatt caacaactct ccttgcgttt tttttttctt gaagcttgtc 9060

acccgtcgat agtttctgcc atttgcaata agcttcgaga cagcagaatc accgcccaag 9120

ttaagccttt gtgctgatca tgctctcgaa cgggccaagt tcgggaaaag caaaggagcg 9180

tttagtgagg ggcaatttga ctcacctccc aggcaacaga tgaggggggc aaaaagaaag 9240

aaattttcgt gagtcaatat ggattccgag catcattttc ttgcggtcta tcttgctacg 9300

tatgttgatc ttgacgctgt ggatcaagca acgccactcg ctcgctccat cgcaggctgg 9360

tcgcagacaa attaaaaggc ggcaaactcg tacagccgcg gggttgtccg ctgcaaagta 9420

cagagtgata aaagccgcca tgcgaccatc aacgcgttga tgcccagctt tttcgatccg 9480

agaatccacc gtagaggcga tagcaagtaa agaaaagcta aacaaaaaaa aatttctgcc 9540

cctaagccat gaaaacgaga tggggtggag cagaaccaag gaaagagtcg cgctgggctg 9600

ccgttccgga aggtgttgta aaggctcgac gcccaaggtg ggagtctagg agaagaattt 9660

gcatcgggag tggggcgggt tacccctcca tatccaatga cagatatcta ccagccaagg 9720

gtttgagccc gcccgcttag tcgtcgtcct cgcttgcccc tccataaaag gatttcccct 9780

ccccctccca caaaattttc tttcccttcc tctccttgtc cgcttcagta cgtatatctt 9840

cccttccctc gcttctctcc tccatccttc tttcatccat ctcctgctaa cttctctgct 9900

cagcacctct acgcattact agccgtagta tctgagcact tctccctttt atattccaca 9960

aaacataaca caaccttcac catggacaag aagtatagca tcgggctgga cattggaacg 10020

aactcggttg gttgggctgt gattacggac gaatacaagg tgccatccaa gaagtttaag 10080

gtcctgggaa acaccgaccg tcactcaatc aagaagaatc tcattggagc cctgctcttc 10140

gatagtgggg agaccgccga agctactcga ctgaagcgaa cggctcgccg gcgttataca 10200

cgacgcaaga atcgcatctg ctacctccag gagattttca gcaacgaaat ggctaaggtt 10260

gatgactcat tctttcatcg actcgaagaa agtttcttgg tcgaggagga taagaagcac 10320

gagcgccatc cgatctttgg taacattgtg gatgaggttg cctatcacga aaagtaccca 10380

actatctatc atcttcgtaa gaagctggtc gatagcacgg acaaggctga tttgcgactt 10440

atctacctgg cactcgcgca catgattaag ttccgcggcc attttcttat cgagggtgac 10500

ctgaaccccg ataattctga cgttgataag ctcttcatcc agttggtcca aacctacaat 10560

cagctgtttg aggaaaaccc tattaatgca tctggcgtgg acgccaaggc tatcctttcg 10620

gcgcgcctgt ctaagtcgcg gcgtttggag aaccttatcg cacaactccc cggcgaaaag 10680

aagaacggcc tcttcggtaa tttgattgcg ttgtcacttg gtctgactcc taacttcaag 10740

agtaattttg acctggcaga ggatgcgaag ctccagttgt ctaaggatac gtatgatgac 10800

gatctcgaca acttgcttgc ccaaatcggt gaccagtacg ctgatctttt cctggccgct 10860

aagaatctct cagatgcaat cctgctcagt gacattttgc gggtcaacac cgagattact 10920

aaggcccccc tgtcagctag tatgatcaag cggtatgatg agcaccatca ggacctcacc 10980

ttgcttaagg ccctcgtgcg tcagcaattg cctgagaagt acaaggaaat cttctttgac 11040

caatccaaga acggatacgc agggtatatt gatggcggtg cgagccagga ggaattctac 11100

aagtttatca agccgatttt ggagaagatg gacggcactg aggaactgct cgtcaagctg 11160

aatcgcgaag atttgcttcg taagcaacga acgttcgaca acggctccat cccgcaccag 11220

attcatctgg gcgagctcca cgccatcctt cgacgccagg aagatttcta cccatttctg 11280

aaggacaacc gtgagaagat cgaaaagatt cttacattcc gaatccccta ctatgtggga 11340

cctttggccc gtgggaattc ccgatttgct tggatgaccc gaaagagcga ggaaaccatc 11400

actccgtgga acttcgagga agtcgtggac aagggtgcat ccgcgcagag cttcattgag 11460

cggatgacca attttgataa gaaccttccg aatgaaaagg tcctgccaaa gcattcgctg 11520

ctctacgagt atttcaccgt gtataacgaa ctgactaagg tcaagtacgt gacggaggga 11580

atgcggaagc cagccttcct ctcaggggaa caaaagaagg ctatcgtcga tttgcttttt 11640

aagaccaatc gtaaagtgac tgttaagcag ctgaaggagg attatttcaa gaagattgaa 11700

tgtttcgact ccgtcgagat cagcggcgtg gaagatcgct ttaacgcttc cctcggtacc 11760

taccacgacc tgctcaagat cattaaggac aaggatttcc tcgataacga ggaaaatgag 11820

gacatcttgg aagatattgt cctcacgttg acactttttg aggaccgcga aatgatcgag 11880

gaacggctca agacatatgc ccatttgttc gacgataagg tgatgaagca gctgaagcgg 11940

cgtcgataca ccggatgggg tcgccttagc cggaagctga tcaacggcat tcgagataag 12000

caatctggta agactatctt ggatttcctt aagtcggacg gcttcgccaa ccgcaatttt 12060

atgcagctta ttcacgacga ttccctgacg ttcaaggagg acatccagaa ggcacaagtc 12120

tcaggacaag gggattccct gcacgagcat atcgccaacc tggctggatc cccggcgatc 12180

aagaagggga ttcttcagac cgtcaaggtt gtcgacgagc tggtcaaggt gatgggccgt 12240

cataagccag aaaacatcgt gattgagatg gcccgagaaa atcagaccac tcaaaagggt 12300

cagaagaaca gccgcgagcg gatgaagcgg atcgaggaag gcattaagga acttggttct 12360

cagatcctga aggagcaccc tgttgaaaac acacagctcc aaaatgagaa gctgtatctc 12420

tactatttgc aaaatggacg cgacatgtac gtcgatcagg agctcgacat taaccggttg 12480

tcggactacg atgttgacca tatcgtcccg caatccttcc ttaaggacga tagcattgat 12540

aacaaggtgc tgactcgctc agataagaac cggggcaagt ccgacaatgt tccaagcgag 12600

gaagtggtta agaagatgaa gaactactgg cgccaattgc ttaatgccaa gctcatcaca 12660

cagcgcaagt ttgacaactt gaccaaggcc gagcggggag ggctgagtga actcgataag 12720

gctggcttca tcaagcgtca actcgtggag acgcgacaga tcacaaagca cgttgctcag 12780

attctggact cccggatgaa cacaaagtac gacgagaatg ataagctcat ccgtgaagtt 12840

aaggtcatta ccctcaagtc taagttggtg tcggatttcc gcaaggactt ccaattttat 12900

aaggttcggg agatcaacaa ttatcaccat gcacatgatg cgtacctcaa cgcagtcgtg 12960

ggaactgcgc tcatcaagaa gtatcccaag ttggagtccg aattcgtcta cggggattat 13020

aaggtttacg acgtccgcaa gatgatcgcc aagagtgagc aggaaattgg caaggccacg 13080

gctaagtatt tcttttactc caacatcatg aatttcttta agacggagat cacactcgcc 13140

aatggagaaa tccgtaagcg acctttgatt gagaccaacg gcgagactgg tgaaatcgtt 13200

tgggataagg ggcgcgactt cgctaccgtg cggaaggttc tgagcatgcc gcaagtcaat 13260

atcgtcaaga aaaccgaggt gcagacaggc ggtttctcta aggaatcgat tcttccaaag 13320

cgtaactctg acaagctgat cgctcgaaag aaggattggg accccaagaa gtatggaggg 13380

ttcgattctc ctacagtggc atactcggtt ctcgttgtcg cgaaggttga gaagggaaag 13440

tctaagaagc tgaagtcggt caaggaactg ctcgggatca ccattatgga gcgctccagc 13500

ttcgaaaaga atcccatcga ctttctcgag gccaagggct ataaggaagt caagaaggat 13560

cttatcatta agctgcctaa gtactctttg ttcgagcttg aaaacggtcg aaagcgaatg 13620

ctcgcatcgg caggagagtt gcagaagggg aatgaattgg cacttccctc aaagtacgtg 13680

aacttcctgt atctcgcgtc ccactacgag aagctgaagg gtagccctga ggacaacgaa 13740

cagaagcaac tttttgttga gcaacacaag cattatctgg atgagatcat tgaacagatt 13800

tcagagttca gtaagcgcgt catcctcgcc gatgctaatc tcgacaaggt gttgtcggcc 13860

tacaacaagc accgtgacaa gccgatccga gagcaggctg aaaatatcat tcatctgttc 13920

accctcacta acttgggagc accagcagcg ttcaagtatt ttgatacgac aatcgaccgt 13980

aagcgataca cgtccacaaa ggaggtgctt gatgcgaccc tgattcatca atccatcact 14040

gggctctatg aaacccgtat cgaccttagt caactggggg gcgacccccc caagaagaag 14100

cgcaaggtct gagcggacat tcgatttatg ccgttatgac ttccttaaaa aagcctttac 14160

gaatgaaaga aatggaatta gacttgttat gtagttgatt ctacaatgga ttatgattcc 14220

tgaacttcaa atccgctgtt cattattaat ctcagctctt cccgtaaagc caatgttgaa 14280

actattcgta aatgtacctc gttttgcgtg tggcgtaatc atggtcatag ctgtttcctg 14340

tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 14400

aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 14460

ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 14520

gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 14580

tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 14640

aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 14700

gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 14760

aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 14820

ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 14880

tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 14940

tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 15000

ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 15060

tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 15120

ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 15180

tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 15240

aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 15300

aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 15360

aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 15420

ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 15480

acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 15540

ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 15600

gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 15660

taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 15720

tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 15780

gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 15840

cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 15900

aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 15960

cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 16020

tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 16080

gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 16140

tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 16200

gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 16260

ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 16320

cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 16380

agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 16440

gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 16500

tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtc 16545

<210> 8

<211> 16545

<212> DNA

<213> 人工序列

<220>

<223> 质粒pNJOC503

<400> 8

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acccgggcta 420

attatggggt gtcgccctta ttcgactcta tagtgaagtt cctattctct agaaagtata 480

ggaacttctg aagtggggat ttaaatgcgg ccgcgctgag ggtttaatcg acgaagcagc 540

tgacggccag tgccaagctt aacgcgtacc gggcccagta tatgttccgc agatgactgg 600

agctctgcca tacgtgccct ctcaagcacc atttgttcca tctacagaga ctagtcacca 660

actagtctat caagactcac agggtacatt gctgagacca actgaccaga ggcagggtag 720

cggattgacg gctccatctc cttcacttac aaggtctatt gaaagccctt tagcatcacc 780

aagcggagaa tagattgtta agcttatttt ttgtatactg ttttgtgata gcacgaagtt 840

tttccacggt atcttgtaaa aatatatatt tgtggcgggc ttacctacat caaattaata 900

agagactaat tataaactaa acacacaagc aagctacttt agggtaaaag tttataaatg 960

cttttgacgt ataaacgttg cttgtattta ttattacaat taaaggtgga tagaaaacct 1020

agagactagt tagaaactaa tctcaggttt gcgttaaact aaatcagagc ccgagaggtt 1080

aacagaacct agaaggggac tagatatccg ggtagggaaa caaaaaaaaa aaacaagaca 1140

gccacatatt agggagacta gttagaagct agttccagga ctaggaaaat aaaagacaat 1200

gataccacag tctagttgac aactagatag attctagatt gaggccaaag tctctgagat 1260

ccaggttagt tgcaactaat actagttagt atctagtctc ctataactct gaagctagaa 1320

taacttacta ctattatcct caccactgtt cagctgcgca aacggagtga ttgcaaggtg 1380

ttcagagact agttattgac tagtcagtga ctagcaataa ctaacaaggt attaacctac 1440

catgtctgcc atcaccctgc acttcctcgg gctcagcagc cttttcctcc tcattttcat 1500

gctcattttc cttgtttaag actgtgacta gtcaaagact agtccagaac cacaaaggag 1560

aaatgtctta ccactttctt cattgcttgt ctcttttgca ttatccatgt ctgcaactag 1620

ttagagtcta gttagtgact agtccgacga ggacttgctt gtctccggat tgttggagga 1680

actctccagg gcctcaagat ccacaacaga gccttctaga agactggtca ataactagtt 1740

ggtctttgtc tgagtctgac ttacgaggtt gcatactcgc tccctttgcc tcgtcaatcg 1800

atgagaaaaa gcgccaaaac tcgcaatatg gctttgaacc acacggtgct gagactagtt 1860

agaatctagt cccaaactag cttggatagc ttacctttgc cctttgcgtt gcgacaggtc 1920

ttgcagggta tggttccttt ctcaccagct gatttagctg ccttgctacc ctcacggcgg 1980

atctgccata aagagtggct agaggttata aattagcact gatcctaggt acggggctga 2040

atgtaacttg cctttccttt ctcatcgcgc ggcaagacag gcttgctcaa attcctacca 2100

gtcacagggg tatgcacggc gtacggacca cttgaactag tcacagatta gttagcaact 2160

agtctgcatt gaatggctgt acttacgggc cctcgccatt gtcctgatca tttccagctt 2220

caccctcgtt gctgcaaagt agttagtgac tagtcaagga ctagttgaaa tgggagaaga 2280

aactcacgaa ttctcgactc ccttagtatt gtggtccttg gacttggtgc tgctatatat 2340

tagctaatac actagttaga ctcacagaaa cttacgcagc tcgcttgcgc ttcttggtag 2400

gagtcggggt tgggagaaca gtgccttcaa acaagccttc ataccatgct acttgactag 2460

tcagggacta gtcaccaagt aatctagata ggacttgcct ttggcctcca tcagttcctt 2520

catagtggga ggaccattgt gcaatgtaaa ctccatgccg tgggagttct tgtccttcaa 2580

gtgcttgacc aatatgtttc tgttggcaga gggaacctgt caactagtta ataactagtc 2640

agaaactatg atagcagtag actcactgta cgcttgaggc atcccttcac tcggcagtag 2700

acttcatatg gatggatatc aggcacgcca ttgtcgtcct gtggactagt cagtaactag 2760

gcttaaagct agtcgggtcg gcttactatc ttgaaatccg gcagcgtaag ctccccgtcc 2820

ttaactgcct cgagatagtg acagtactct ggggactttc ggagatcgtt atcgttatcg 2880

cgaatgctcg gcatactaac tgttgactag tcttggacta gtcccgagca aaaaggattg 2940

gaggaggagg aggaaggtga gagtgagaca aagagcgaaa taagagcttc aaaggctatc 3000

tctaagcagt atgaaggtta agtatctagt tcttgactag atttaaaaga gatttcgact 3060

agttatgtac ctggagtttg gatataggaa tgtgttgtgg taacgaaatg taagggggag 3120

gaaagaaaaa gtcggtcaag aggtaactct aagtcggcca ttcctttttg ggaggcgcta 3180

accataaacg gcatggtcga cttagagtta gctcagggaa tttagggagt tatctgcgac 3240

caccgaggaa cggcggaatg ccaaagaatc ccgatggagc tctagctggc ggttgacaac 3300

cccacctttt ggcgtttctg cggcgttgca ggcgggactg gatacttcgt agaaccagaa 3360

aggcaaggca gaacgcgctc agcaagagtg ttggaagtga tagcatgatg tgccttgtta 3420

actaggtcaa aatctgcagt atgcttgatg ttatccaaag tgtgagagag gaaggtccaa 3480

acatacacga ttgggagagg gcctaggtat aagagttttt gagtagaacg catgtgagcc 3540

cagccatctc gaggagatta aacacgggcc ggcatttgat ggctatgtta gtaccccaat 3600

ggaaacggtg agagtccagt ggtcgcagat aactccctaa attccctgag ctaactctaa 3660

gtcgaccatg ccgtttatgg ttagcgcctc ccaaaaagga atggccgact tagagttacc 3720

tcttgaccga ctttttcttt cctccccctt acatttcgtt accacaacac attcctatat 3780

ccaaactcca ggtacataac tagtcgaaat ctcttttaaa tctagtcaag aactagatac 3840

ttaaccttca tactgcttag agatagcctt tgaagctctt atttcgctct ttgtctcact 3900

ctcaccttcc tcctcctcct ccaatccttt ttgctcggga ctagtccaag actagtcaac 3960

agttagtatg ccgagcattc gcgataacga taacgatctc cgaaagtccc cagagtactg 4020

tcactatctc gaggcagtta aggacgggga gcttacgctg ccggatttca agatagtaag 4080

ccgacccgac tagctttaag cctagttact gactagtcca caggacgaca atggcgtgcc 4140

tgatatccat ccatatgaag tctactgccg agtgaaggga tgcctcaagc gtacagtgag 4200

tctactgcta tcatagtttc tgactagtta ttaactagtt gacaggttcc ctctgccaac 4260

agaaacatat tggtcaagca cttgaaggac aagaactccc acggcatgga gtttacattg 4320

cacaatggtc ctcccactat gaaggaactg atggaggcca aaggcaagtc ctatctagat 4380

tacttggtga ctagtccctg actagtcaag tagcatggta tgaaggcttg tttgaaggca 4440

ctgttctccc aaccccgact cctaccaaga agcgcaagcg agctgcgtaa gtttctgtga 4500

gtctaactag tgtattagct aatatatagc agcaccaagt ccaaggacca caatactaag 4560

ggagtcgaga attcgtgagt ttcttctccc atttcaacta gtccttgact agtcactaac 4620

tactttgcag caacgagggt gaagctggaa atgatcagga caatggcgag ggcccgtaag 4680

tacagccatt caatgcagac tagttgctaa ctaatctgtg actagttcaa gtggtccgta 4740

cgccgtgcat acccctgtga ctggtaggaa tttgagcaag cctgtcttgc cgcgcgatga 4800

gaaaggaaag gcaagttaca ttcagccccg tacctaggat cagtgctaat ttataacctc 4860

tagccactct ttatggcaga tccgccgtga gggtagcaag gcagctaaat cagctggtga 4920

gaaaggaacc ataccctgca agacctgtcg caacgcaaag ggcaaaggta agctatccaa 4980

gctagtttgg gactagattc taactagtct cagcaccgtg tggttcaaag ccatattgcg 5040

agttttggcg ctttttctca tcgattgacg aggcaaaggg agcgagtatg caacctcgta 5100

agtcagactc agacaaagac caactagtta ttgaccagtc ttctagaagg ctctgttgtg 5160

gatcttgagg ccctggagag ttcctccaac aatccggaga caagcaagtc ctcgtcggac 5220

tagtcactaa ctagactcta actagttgca gacatggata atgcaaaaga gacaagcaat 5280

gaagaaagtg gtaagacatt tctcctttgt ggttctggac tagtctttga ctagtcacag 5340

tcttaaacaa ggaaaatgag catgaaaatg aggaggaaaa ggctgctgag cccgaggaag 5400

tgcagggtga tggcagacat ggtaggttaa taccttgtta gttattgcta gtcactgact 5460

agtcaataac tagtctctga acaccttgca atcactccgt ttgcgcagct gaacagtggt 5520

gaggataata gtagtaagtt attctagctt cagagttata ggagactaga tactaactag 5580

tattagttgc aactaacctg gatctcagag actttggcct caatctagaa tctatctagt 5640

tgtcaactag actgtggtat cattgtcttt tattttccta gtcctggaac tagcttctaa 5700

ctagtctccc taatatgtgg ctgtcttgtt tttttttttt gtttccctac ccggatatct 5760

agtccccttc taggttctgt taacctctcg ggctctgatt tagtttaacg caaacctgag 5820

attagtttct aactagtctc taggttttct atccaccttt aattgtaata ataaatacaa 5880

gcaacgttta tacgtcaaaa gcatttataa acttttaccc taaagtagct tgcttgtgtg 5940

tttagtttat aattagtctc ttattaattt gatgtaggta agcccgccac aaatatatat 6000

ttttacaaga taccgtggaa aaacttcgtg ctatcacaaa acagtataca aaaaataagc 6060

ttaacaatct attctccgct tggtgatgct aaagggcttt caatagacct tgtaagtgaa 6120

ggagatggag ccgtcaatcc gctaccctgc ctctggtcag ttggtctcag caatgtaccc 6180

tgtgagtctt gatagactag ttggtgacta gtctctgtag atggaacaaa tggtgcttga 6240

gagggcacgt atggcagagc tccagtcatc tgcggaacat atactgggcc cggggatcct 6300

ctagagtcga cctgcaggtt catttaaacg gcttcacggg cagcccagcg gtcgatttcg 6360

cttccaaatt ttgggggaaa gggtccctga gcagcctcac aaacgcaaac atgcgcacgc 6420

gccacacgga aaatgaagct gactttgaat ttttaagaat cccctttgcc cgtggcacct 6480

tctgattttt gtcttcgtgt ccaatccatc tccttgaacg acaacccagc cctttctatt 6540

tcctatcccc taatatctaa tgtgagtcct catcgtcaca gacggcgacg gacgcgacat 6600

ttcgcccgtg ctcatcgacc gctctgctgt cgccaacaga acacgcggtt atgtcgcgtt 6660

ccgctttgtc gtaccacttt cgccccacac cgctgacctc gcgttcccag catgaaaaag 6720

cctgaactca ccgcgacgtc tgtcgagaag tttctgatcg aaaagttcga cagcgtctcc 6780

gacctgatgc agctctcgga gggcgaagaa tctcgtgctt tcagcttcga tgtaggaggg 6840

cgtggatatg tcctgcgggt aaatagctgc gccgatggtt tctacaaaga tcgttatgtt 6900

tatcggcact ttgcatcggc cgcgctcccg attccggaag tgcttgacat tggggagttc 6960

agcgagagcc tgacctattg catctcccgc cgtgcacagg gtgtcacgtt gcaagacctg 7020

cctgaaaccg aactgcccgc tgttctgcag ccggtcgcgg aggccatgga tgcgatcgct 7080

gcggccgatc ttagccagac gagcgggttc ggcccattcg gaccgcaagg aatcggtcaa 7140

tacactacat ggcgtgattt catatgcgcg attgctgatc cccatgtgta tcactggcaa 7200

actgtgatgg acgacaccgt cagtgcgtcc gtcgcgcagg ctctcgatga gctgatgctt 7260

tgggccgagg actgccccga agtccggcac ctcgtgcacg cggatttcgg ctccaacaat 7320

gtcctgacgg acaatggccg cataacagcg gtcattgact ggagcgaggc gatgttcggg 7380

gattcccaat acgaggtcgc caacatcttc ttctggaggc cgtggttggc ttgtatggag 7440

cagcagacgc gctacttcga gcggaggcat ccggagcttg caggatcgcc gcggctccgg 7500

gcgtatatgc tccgcattgg tcttgaccaa ctctatcaga gcttggttga cggcaatttc 7560

gatgatgcag cttgggcgca gggtcgatgc gacgcaatcg tccgatccgg agccgggact 7620

gtcgggcgta cacaaatcgc ccgcagaagc gcggccgtct ggaccgatgg ctgtgtagaa 7680

gtactcgccg atagtggaaa ccgacgcccc agcactcgtc cgagggcaag gaatagtaaa 7740

tgattcgtta gttctttcct gaactgatga ttcgcgcgat tcgtatttct ctttgttggt 7800

tgttctgatg atgatgaaaa tgacgcatct ctttatttgc tgcactcgta cacccatcct 7860

ttggaatgat taatacccct cctttttcat cgcggacggt agtcgttctc tttggggccg 7920

tgtttcttcc cattcgcatg cgacctcgtg gtcattgact gtctgtcctc ttcctctcca 7980

cctacctcca ccacctacgt tgactgcata tcactttttc aaacattcat gataatacgc 8040

taccttctgg catgaccttt tgatgatcgc tttttactat cctttcaatt acgatgttgt 8100

cacttctatt tgtcattttg cggaattagt attttctttc catcttcgat ggagagatga 8160

atattgcctg caggcatgca agctttctgc tcgaggccat ctggcttttc tctgctgtct 8220

gcctcgggaa tgggatggaa taccacgtac ggtatttggc ctccggtgcc atccgaagcg 8280

agatgctttg agcttgaaac cccctcggcc tgcacaggtg tctcatcgtg catttaatcc 8340

aacggcggcg agtcaaaaca tcagctaatt gaccaggttt ctggattgtg aatgccaact 8400

ttttgggtct tgaggagttg cggggtggga aaaaagtaaa gaaatttact gaggatttta 8460

tcattgcgac tataaaataa agcggcattg caaatccttg cgttgctact atgtaaaatg 8520

gactgtagtt gtgctgctga aaatagtttg gcgattgtgg attgtggatt gtggattgtg 8580

gattatggca agttgtcaag gggcaagttg acgaaaatga ttgtgtggtg tctgccagca 8640

aattgagaac gtgggtatat atttcatctt ttcatgattc ccttcggctt gcttgtcaag 8700

caatggcatc attggtctag tggtagaatt cgtcgttgcc atcgacgagg cccgtgttcg 8760

attcacggat gatgcagccg acacgagtga gttctggttt tagagctaga aatagcaagt 8820

taaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt gctttttttt 8880

tggctcttgg gttcgaactg cccaaggccc atgttttggt catctttttt tttatgcccc 8940

accatttggg tcacccctgc caatcattcc atctttgttc ctacccttca cgtgtgcttt 9000

ccgaagccaa agttcccatt caacaactct ccttgcgttt tttttttctt gaagcttgtc 9060

acccgtcgat agtttctgcc atttgcaata agcttcgaga cagcagaatc accgcccaag 9120

ttaagccttt gtgctgatca tgctctcgaa cgggccaagt tcgggaaaag caaaggagcg 9180

tttagtgagg ggcaatttga ctcacctccc aggcaacaga tgaggggggc aaaaagaaag 9240

aaattttcgt gagtcaatat ggattccgag catcattttc ttgcggtcta tcttgctacg 9300

tatgttgatc ttgacgctgt ggatcaagca acgccactcg ctcgctccat cgcaggctgg 9360

tcgcagacaa attaaaaggc ggcaaactcg tacagccgcg gggttgtccg ctgcaaagta 9420

cagagtgata aaagccgcca tgcgaccatc aacgcgttga tgcccagctt tttcgatccg 9480

agaatccacc gtagaggcga tagcaagtaa agaaaagcta aacaaaaaaa aatttctgcc 9540

cctaagccat gaaaacgaga tggggtggag cagaaccaag gaaagagtcg cgctgggctg 9600

ccgttccgga aggtgttgta aaggctcgac gcccaaggtg ggagtctagg agaagaattt 9660

gcatcgggag tggggcgggt tacccctcca tatccaatga cagatatcta ccagccaagg 9720

gtttgagccc gcccgcttag tcgtcgtcct cgcttgcccc tccataaaag gatttcccct 9780

ccccctccca caaaattttc tttcccttcc tctccttgtc cgcttcagta cgtatatctt 9840

cccttccctc gcttctctcc tccatccttc tttcatccat ctcctgctaa cttctctgct 9900

cagcacctct acgcattact agccgtagta tctgagcact tctccctttt atattccaca 9960

aaacataaca caaccttcac catggacaag aagtatagca tcgggctgga cattggaacg 10020

aactcggttg gttgggctgt gattacggac gaatacaagg tgccatccaa gaagtttaag 10080

gtcctgggaa acaccgaccg tcactcaatc aagaagaatc tcattggagc cctgctcttc 10140

gatagtgggg agaccgccga agctactcga ctgaagcgaa cggctcgccg gcgttataca 10200

cgacgcaaga atcgcatctg ctacctccag gagattttca gcaacgaaat ggctaaggtt 10260

gatgactcat tctttcatcg actcgaagaa agtttcttgg tcgaggagga taagaagcac 10320

gagcgccatc cgatctttgg taacattgtg gatgaggttg cctatcacga aaagtaccca 10380

actatctatc atcttcgtaa gaagctggtc gatagcacgg acaaggctga tttgcgactt 10440

atctacctgg cactcgcgca catgattaag ttccgcggcc attttcttat cgagggtgac 10500

ctgaaccccg ataattctga cgttgataag ctcttcatcc agttggtcca aacctacaat 10560

cagctgtttg aggaaaaccc tattaatgca tctggcgtgg acgccaaggc tatcctttcg 10620

gcgcgcctgt ctaagtcgcg gcgtttggag aaccttatcg cacaactccc cggcgaaaag 10680

aagaacggcc tcttcggtaa tttgattgcg ttgtcacttg gtctgactcc taacttcaag 10740

agtaattttg acctggcaga ggatgcgaag ctccagttgt ctaaggatac gtatgatgac 10800

gatctcgaca acttgcttgc ccaaatcggt gaccagtacg ctgatctttt cctggccgct 10860

aagaatctct cagatgcaat cctgctcagt gacattttgc gggtcaacac cgagattact 10920

aaggcccccc tgtcagctag tatgatcaag cggtatgatg agcaccatca ggacctcacc 10980

ttgcttaagg ccctcgtgcg tcagcaattg cctgagaagt acaaggaaat cttctttgac 11040

caatccaaga acggatacgc agggtatatt gatggcggtg cgagccagga ggaattctac 11100

aagtttatca agccgatttt ggagaagatg gacggcactg aggaactgct cgtcaagctg 11160

aatcgcgaag atttgcttcg taagcaacga acgttcgaca acggctccat cccgcaccag 11220

attcatctgg gcgagctcca cgccatcctt cgacgccagg aagatttcta cccatttctg 11280

aaggacaacc gtgagaagat cgaaaagatt cttacattcc gaatccccta ctatgtggga 11340

cctttggccc gtgggaattc ccgatttgct tggatgaccc gaaagagcga ggaaaccatc 11400

actccgtgga acttcgagga agtcgtggac aagggtgcat ccgcgcagag cttcattgag 11460

cggatgacca attttgataa gaaccttccg aatgaaaagg tcctgccaaa gcattcgctg 11520

ctctacgagt atttcaccgt gtataacgaa ctgactaagg tcaagtacgt gacggaggga 11580

atgcggaagc cagccttcct ctcaggggaa caaaagaagg ctatcgtcga tttgcttttt 11640

aagaccaatc gtaaagtgac tgttaagcag ctgaaggagg attatttcaa gaagattgaa 11700

tgtttcgact ccgtcgagat cagcggcgtg gaagatcgct ttaacgcttc cctcggtacc 11760

taccacgacc tgctcaagat cattaaggac aaggatttcc tcgataacga ggaaaatgag 11820

gacatcttgg aagatattgt cctcacgttg acactttttg aggaccgcga aatgatcgag 11880

gaacggctca agacatatgc ccatttgttc gacgataagg tgatgaagca gctgaagcgg 11940

cgtcgataca ccggatgggg tcgccttagc cggaagctga tcaacggcat tcgagataag 12000

caatctggta agactatctt ggatttcctt aagtcggacg gcttcgccaa ccgcaatttt 12060

atgcagctta ttcacgacga ttccctgacg ttcaaggagg acatccagaa ggcacaagtc 12120

tcaggacaag gggattccct gcacgagcat atcgccaacc tggctggatc cccggcgatc 12180

aagaagggga ttcttcagac cgtcaaggtt gtcgacgagc tggtcaaggt gatgggccgt 12240

cataagccag aaaacatcgt gattgagatg gcccgagaaa atcagaccac tcaaaagggt 12300

cagaagaaca gccgcgagcg gatgaagcgg atcgaggaag gcattaagga acttggttct 12360

cagatcctga aggagcaccc tgttgaaaac acacagctcc aaaatgagaa gctgtatctc 12420

tactatttgc aaaatggacg cgacatgtac gtcgatcagg agctcgacat taaccggttg 12480

tcggactacg atgttgacca tatcgtcccg caatccttcc ttaaggacga tagcattgat 12540

aacaaggtgc tgactcgctc agataagaac cggggcaagt ccgacaatgt tccaagcgag 12600

gaagtggtta agaagatgaa gaactactgg cgccaattgc ttaatgccaa gctcatcaca 12660

cagcgcaagt ttgacaactt gaccaaggcc gagcggggag ggctgagtga actcgataag 12720

gctggcttca tcaagcgtca actcgtggag acgcgacaga tcacaaagca cgttgctcag 12780

attctggact cccggatgaa cacaaagtac gacgagaatg ataagctcat ccgtgaagtt 12840

aaggtcatta ccctcaagtc taagttggtg tcggatttcc gcaaggactt ccaattttat 12900

aaggttcggg agatcaacaa ttatcaccat gcacatgatg cgtacctcaa cgcagtcgtg 12960

ggaactgcgc tcatcaagaa gtatcccaag ttggagtccg aattcgtcta cggggattat 13020

aaggtttacg acgtccgcaa gatgatcgcc aagagtgagc aggaaattgg caaggccacg 13080

gctaagtatt tcttttactc caacatcatg aatttcttta agacggagat cacactcgcc 13140

aatggagaaa tccgtaagcg acctttgatt gagaccaacg gcgagactgg tgaaatcgtt 13200

tgggataagg ggcgcgactt cgctaccgtg cggaaggttc tgagcatgcc gcaagtcaat 13260

atcgtcaaga aaaccgaggt gcagacaggc ggtttctcta aggaatcgat tcttccaaag 13320

cgtaactctg acaagctgat cgctcgaaag aaggattggg accccaagaa gtatggaggg 13380

ttcgattctc ctacagtggc atactcggtt ctcgttgtcg cgaaggttga gaagggaaag 13440

tctaagaagc tgaagtcggt caaggaactg ctcgggatca ccattatgga gcgctccagc 13500

ttcgaaaaga atcccatcga ctttctcgag gccaagggct ataaggaagt caagaaggat 13560

cttatcatta agctgcctaa gtactctttg ttcgagcttg aaaacggtcg aaagcgaatg 13620

ctcgcatcgg caggagagtt gcagaagggg aatgaattgg cacttccctc aaagtacgtg 13680

aacttcctgt atctcgcgtc ccactacgag aagctgaagg gtagccctga ggacaacgaa 13740

cagaagcaac tttttgttga gcaacacaag cattatctgg atgagatcat tgaacagatt 13800

tcagagttca gtaagcgcgt catcctcgcc gatgctaatc tcgacaaggt gttgtcggcc 13860

tacaacaagc accgtgacaa gccgatccga gagcaggctg aaaatatcat tcatctgttc 13920

accctcacta acttgggagc accagcagcg ttcaagtatt ttgatacgac aatcgaccgt 13980

aagcgataca cgtccacaaa ggaggtgctt gatgcgaccc tgattcatca atccatcact 14040

gggctctatg aaacccgtat cgaccttagt caactggggg gcgacccccc caagaagaag 14100

cgcaaggtct gagcggacat tcgatttatg ccgttatgac ttccttaaaa aagcctttac 14160

gaatgaaaga aatggaatta gacttgttat gtagttgatt ctacaatgga ttatgattcc 14220

tgaacttcaa atccgctgtt cattattaat ctcagctctt cccgtaaagc caatgttgaa 14280

actattcgta aatgtacctc gttttgcgtg tggcgtaatc atggtcatag ctgtttcctg 14340

tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 14400

aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 14460

ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 14520

gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 14580

tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 14640

aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 14700

gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 14760

aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 14820

ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 14880

tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 14940

tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 15000

ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 15060

tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 15120

ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 15180

tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 15240

aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 15300

aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 15360

aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 15420

ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 15480

acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 15540

ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 15600

gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 15660

taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 15720

tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 15780

gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 15840

cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 15900

aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 15960

cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 16020

tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 16080

gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 16140

tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 16200

gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 16260

ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 16320

cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 16380

agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 16440

gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 16500

tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtc 16545

<210> 9

<211> 16545

<212> DNA

<213> 人工序列

<220>

<223> 质粒pNJOC504

<400> 9

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acccgggcta 420

attatggggt gtcgccctta ttcgactcta tagtgaagtt cctattctct agaaagtata 480

ggaacttctg aagtggggat ttaaatgcgg ccgcgctgag ggtttaatcg acgaagcagc 540

tgacggccag tgccaagctt aacgcgtacc gggcccagta tatgttccgc agatgactgg 600

agctctgcca tacgtgccct ctcaagcacc atttgttcca tctacagaga ctagtcacca 660

actagtctat caagactcac agggtacatt gctgagacca actgaccaga ggcagggtag 720

cggattgacg gctccatctc cttcacttac aaggtctatt gaaagccctt tagcatcacc 780

aagcggagaa tagattgtta agcttatttt ttgtatactg ttttgtgata gcacgaagtt 840

tttccacggt atcttgtaaa aatatatatt tgtggcgggc ttacctacat caaattaata 900

agagactaat tataaactaa acacacaagc aagctacttt agggtaaaag tttataaatg 960

cttttgacgt ataaacgttg cttgtattta ttattacaat taaaggtgga tagaaaacct 1020

agagactagt tagaaactaa tctcaggttt gcgttaaact aaatcagagc ccgagaggtt 1080

aacagaacct agaaggggac tagatatccg ggtagggaaa caaaaaaaaa aaacaagaca 1140

gccacatatt agggagacta gttagaagct agttccagga ctaggaaaat aaaagacaat 1200

gataccacag tctagttgac aactagatag attctagatt gaggccaaag tctctgagat 1260

ccaggttagt tgcaactaat actagttagt atctagtctc ctataactct gaagctagaa 1320

taacttacta ctattatcct caccactgtt cagctgcgca aacggagtga ttgcaaggtg 1380

ttcagagact agttattgac tagtcagtga ctagcaataa ctaacaaggt attaacctac 1440

catgtctgcc atcaccctgc acttcctcgg gctcagcagc cttttcctcc tcattttcat 1500

gctcattttc cttgtttaag actgtgacta gtcaaagact agtccagaac cacaaaggag 1560

aaatgtctta ccactttctt cattgcttgt ctcttttgca ttatccatgt ctgcaactag 1620

ttagagtcta gttagtgact agtccgacga ggacttgctt gtctccggat tgttggagga 1680

actctccagg gcctcaagat ccacaacaga gccttctaga agactggtca ataactagtt 1740

ggtctttgtc tgagtctgac ttacgaggtt gcatactcgc tccctttgcc tcgtcaatcg 1800

atgagaaaaa gcgccaaaac tcgcaatatg gctttgaacc acacggtgct gagactagtt 1860

agaatctagt cccaaactag cttggatagc ttacctttgc cctttgcgtt gcgacaggtc 1920

ttgcagggta tggttccttt ctcaccagct gatttagctg ccttgctacc ctcacggcgg 1980

atctgccata aagagtggct agaggttata aattagcact gatcctaggt acggggctga 2040

atgtaacttg cctttccttt ctcatcgcgc ggcaagacag gcttgctcaa attcctacca 2100

gtcacagggg tatgcacggc gtacggacca cttgaactag tcacagatta gttagcaact 2160

agtctgcatt gaatggctgt acttacgggc cctcgccatt gtcctgatca tttccagctt 2220

caccctcgtt gctgcaaagt agttagtgac tagtcaagga ctagttgaaa tgggagaaga 2280

aactcacgaa ttctcgactc ccttagtatt gtggtccttg gacttggtgc tgctatatat 2340

tagctaatac actagttaga ctcacagaaa cttacgcagc tcgcttgcgc ttcttggtag 2400

gagtcggggt tgggagaaca gtgccttcaa acaagccttc ataccatgct acttgactag 2460

tcagggacta gtcaccaagt aatctagata ggacttgcct ttggcctcca tcagttcctt 2520

catagtggga ggaccattgt gcaatgtaaa ctccatgccg tgggagttct tgtccttcaa 2580

gtgcttgacc aatatgtttc tgttggcaga gggaacctgt caactagtta ataactagtc 2640

agaaactatg atagcagtag actcactgta cgcttgaggc atcccttcac tcggcagtag 2700

acttcatatg gatggatatc aggcacgcca ttgtcgtcct gtggactagt cagtaactag 2760

gcttaaagct agtcgggtcg gcttactatc ttgaaatccg gcagcgtaag ctccccgtcc 2820

ttaactgcct cgagatagtg acagtactct ggggactttc ggagatcgtt atcgttatcg 2880

cgaatgctcg gcatactaac tgttgactag tcttggacta gtcccgagca aaaaggattg 2940

gaggaggagg aggaaggtga gagtgagaca aagagcgaaa taagagcttc aaaggctatc 3000

tctaagcagt atgaaggtta agtatctagt tcttgactag atttaaaaga gatttcgact 3060

agttatgtac ctggagtttg gatataggaa tgtgttgtgg taacgaaatg taagggggag 3120

gaaagaaaaa gtcggtcaag aggtaactct aagtcggcca ttcctttttg ggaggcgcta 3180

accataaacg gcatggtcga cttagagtta gctcagggaa tttagggagt tatctgcgac 3240

caccgaggaa cggcggaatg ccaaagaatc ccgatggagc tctagctggc ggttgacaac 3300

cccacctttt ggcgtttctg cggcgttgca ggcgggactg gatacttcgt agaaccagaa 3360

aggcaaggca gaacgcgctc agcaagagtg ttggaagtga tagcatgatg tgccttgtta 3420

actaggtcaa aatctgcagt atgcttgatg ttatccaaag tgtgagagag gaaggtccaa 3480

acatacacga ttgggagagg gcctaggtat aagagttttt gagtagaacg catgtgagcc 3540

cagccatctc gaggagatta aacacgggcc ggcatttgat ggctatgtta gtaccccaat 3600

ggaaacggtg agagtccagt ggtcgcagat aactccctaa attccctgag ctaactctaa 3660

gtcgaccatg ccgtttatgg ttagcgcctc ccaaaaagga atggccgact tagagttacc 3720

tcttgaccga ctttttcttt cctccccctt acatttcgtt accacaacac attcctatat 3780

ccaaactcca ggtacataac tagtcgaaat ctcttttaaa tctagtcaag aactagatac 3840

ttaaccttca tactgcttag agatagcctt tgaagctctt atttcgctct ttgtctcact 3900

ctcaccttcc tcctcctcct ccaatccttt ttgctcggga ctagtccaag actagtcaac 3960

agttagtatg ccgagcattc gcgataacga taacgatctc cgaaagtccc cagagtactg 4020

tcactatctc gaggcagtta aggacgggga gcttacgctg ccggatttca agatagtaag 4080

ccgacccgac tagctttaag cctagttact gactagtcca caggacgaca atggcgtgcc 4140

tgatatccat ccatatgaag tctactgccg agtgaaggga tgcctcaagc gtacagtgag 4200

tctactgcta tcatagtttc tgactagtta ttaactagtt gacaggttcc ctctgccaac 4260

agaaacatat tggtcaagca cttgaaggac aagaactccc acggcatgga gtttacattg 4320

cacaatggtc ctcccactat gaaggaactg atggaggcca aaggcaagtc ctatctagat 4380

tacttggtga ctagtccctg actagtcaag tagcatggta tgaaggcttg tttgaaggca 4440

ctgttctccc aaccccgact cctaccaaga agcgcaagcg agctgcgtaa gtttctgtga 4500

gtctaactag tgtattagct aatatatagc agcaccaagt ccaaggacca caatactaag 4560

ggagtcgaga attcgtgagt ttcttctccc atttcaacta gtccttgact agtcactaac 4620

tactttgcag caacgagggt gaagctggaa atgatcagga caatggcgag ggcccgtaag 4680

tacagccatt caatgcagac tagttgctaa ctaatctgtg actagttcaa gtggtccgta 4740

cgccgtgcat acccctgtga ctggtaggaa tttgagcaag cctgtcttgc cgcgcgatga 4800

gaaaggaaag gcaagttaca ttcagccccg tacctaggat cagtgctaat ttataacctc 4860

tagccactct ttatggcaga tccgccgtga gggtagcaag gcagctaaat cagctggtga 4920

gaaaggaacc ataccctgca agacctgtcg caacgcaaag ggcaaaggta agctatccaa 4980

gctagtttgg gactagattc taactagtct cagcaccgtg tggttcaaag ccatattgcg 5040

agttttggcg ctttttctca tcgattgacg aggcaaaggg agcgagtatg caacctcgta 5100

agtcagactc agacaaagac caactagtta ttgaccagtc ttctagaagg ctctgttgtg 5160

gatcttgagg ccctggagag ttcctccaac aatccggaga caagcaagtc ctcgtcggac 5220

tagtcactaa ctagactcta actagttgca gacatggata atgcaaaaga gacaagcaat 5280

gaagaaagtg gtaagacatt tctcctttgt ggttctggac tagtctttga ctagtcacag 5340

tcttaaacaa ggaaaatgag catgaaaatg aggaggaaaa ggctgctgag cccgaggaag 5400

tgcagggtga tggcagacat ggtaggttaa taccttgtta gttattgcta gtcactgact 5460

agtcaataac tagtctctga acaccttgca atcactccgt ttgcgcagct gaacagtggt 5520

gaggataata gtagtaagtt attctagctt cagagttata ggagactaga tactaactag 5580

tattagttgc aactaacctg gatctcagag actttggcct caatctagaa tctatctagt 5640

tgtcaactag actgtggtat cattgtcttt tattttccta gtcctggaac tagcttctaa 5700

ctagtctccc taatatgtgg ctgtcttgtt tttttttttt gtttccctac ccggatatct 5760

agtccccttc taggttctgt taacctctcg ggctctgatt tagtttaacg caaacctgag 5820

attagtttct aactagtctc taggttttct atccaccttt aattgtaata ataaatacaa 5880

gcaacgttta tacgtcaaaa gcatttataa acttttaccc taaagtagct tgcttgtgtg 5940

tttagtttat aattagtctc ttattaattt gatgtaggta agcccgccac aaatatatat 6000

ttttacaaga taccgtggaa aaacttcgtg ctatcacaaa acagtataca aaaaataagc 6060

ttaacaatct attctccgct tggtgatgct aaagggcttt caatagacct tgtaagtgaa 6120

ggagatggag ccgtcaatcc gctaccctgc ctctggtcag ttggtctcag caatgtaccc 6180

tgtgagtctt gatagactag ttggtgacta gtctctgtag atggaacaaa tggtgcttga 6240

gagggcacgt atggcagagc tccagtcatc tgcggaacat atactgggcc cggggatcct 6300

ctagagtcga cctgcaggtt catttaaacg gcttcacggg cagcccagcg gtcgatttcg 6360

cttccaaatt ttgggggaaa gggtccctga gcagcctcac aaacgcaaac atgcgcacgc 6420

gccacacgga aaatgaagct gactttgaat ttttaagaat cccctttgcc cgtggcacct 6480

tctgattttt gtcttcgtgt ccaatccatc tccttgaacg acaacccagc cctttctatt 6540

tcctatcccc taatatctaa tgtgagtcct catcgtcaca gacggcgacg gacgcgacat 6600

ttcgcccgtg ctcatcgacc gctctgctgt cgccaacaga acacgcggtt atgtcgcgtt 6660

ccgctttgtc gtaccacttt cgccccacac cgctgacctc gcgttcccag catgaaaaag 6720

cctgaactca ccgcgacgtc tgtcgagaag tttctgatcg aaaagttcga cagcgtctcc 6780

gacctgatgc agctctcgga gggcgaagaa tctcgtgctt tcagcttcga tgtaggaggg 6840

cgtggatatg tcctgcgggt aaatagctgc gccgatggtt tctacaaaga tcgttatgtt 6900

tatcggcact ttgcatcggc cgcgctcccg attccggaag tgcttgacat tggggagttc 6960

agcgagagcc tgacctattg catctcccgc cgtgcacagg gtgtcacgtt gcaagacctg 7020

cctgaaaccg aactgcccgc tgttctgcag ccggtcgcgg aggccatgga tgcgatcgct 7080

gcggccgatc ttagccagac gagcgggttc ggcccattcg gaccgcaagg aatcggtcaa 7140

tacactacat ggcgtgattt catatgcgcg attgctgatc cccatgtgta tcactggcaa 7200

actgtgatgg acgacaccgt cagtgcgtcc gtcgcgcagg ctctcgatga gctgatgctt 7260

tgggccgagg actgccccga agtccggcac ctcgtgcacg cggatttcgg ctccaacaat 7320

gtcctgacgg acaatggccg cataacagcg gtcattgact ggagcgaggc gatgttcggg 7380

gattcccaat acgaggtcgc caacatcttc ttctggaggc cgtggttggc ttgtatggag 7440

cagcagacgc gctacttcga gcggaggcat ccggagcttg caggatcgcc gcggctccgg 7500

gcgtatatgc tccgcattgg tcttgaccaa ctctatcaga gcttggttga cggcaatttc 7560

gatgatgcag cttgggcgca gggtcgatgc gacgcaatcg tccgatccgg agccgggact 7620

gtcgggcgta cacaaatcgc ccgcagaagc gcggccgtct ggaccgatgg ctgtgtagaa 7680

gtactcgccg atagtggaaa ccgacgcccc agcactcgtc cgagggcaag gaatagtaaa 7740

tgattcgtta gttctttcct gaactgatga ttcgcgcgat tcgtatttct ctttgttggt 7800

tgttctgatg atgatgaaaa tgacgcatct ctttatttgc tgcactcgta cacccatcct 7860

ttggaatgat taatacccct cctttttcat cgcggacggt agtcgttctc tttggggccg 7920

tgtttcttcc cattcgcatg cgacctcgtg gtcattgact gtctgtcctc ttcctctcca 7980

cctacctcca ccacctacgt tgactgcata tcactttttc aaacattcat gataatacgc 8040

taccttctgg catgaccttt tgatgatcgc tttttactat cctttcaatt acgatgttgt 8100

cacttctatt tgtcattttg cggaattagt attttctttc catcttcgat ggagagatga 8160

atattgcctg caggcatgca agctttctgc tcgaggccat ctggcttttc tctgctgtct 8220

gcctcgggaa tgggatggaa taccacgtac ggtatttggc ctccggtgcc atccgaagcg 8280

agatgctttg agcttgaaac cccctcggcc tgcacaggtg tctcatcgtg catttaatcc 8340

aacggcggcg agtcaaaaca tcagctaatt gaccaggttt ctggattgtg aatgccaact 8400

ttttgggtct tgaggagttg cggggtggga aaaaagtaaa gaaatttact gaggatttta 8460

tcattgcgac tataaaataa agcggcattg caaatccttg cgttgctact atgtaaaatg 8520

gactgtagtt gtgctgctga aaatagtttg gcgattgtgg attgtggatt gtggattgtg 8580

gattatggca agttgtcaag gggcaagttg acgaaaatga ttgtgtggtg tctgccagca 8640

aattgagaac gtgggtatat atttcatctt ttcatgattc ccttcggctt gcttgtcaag 8700

caatggcatc attggtctag tggtagaatt cgtcgttgcc atcgacgagg cccgtgttcg 8760

attcacggat gatgcacccc ggaagagctt catatcgttt tagagctaga aatagcaagt 8820

taaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt gctttttttt 8880

tggctcttgg gttcgaactg cccaaggccc atgttttggt catctttttt tttatgcccc 8940

accatttggg tcacccctgc caatcattcc atctttgttc ctacccttca cgtgtgcttt 9000

ccgaagccaa agttcccatt caacaactct ccttgcgttt tttttttctt gaagcttgtc 9060

acccgtcgat agtttctgcc atttgcaata agcttcgaga cagcagaatc accgcccaag 9120

ttaagccttt gtgctgatca tgctctcgaa cgggccaagt tcgggaaaag caaaggagcg 9180

tttagtgagg ggcaatttga ctcacctccc aggcaacaga tgaggggggc aaaaagaaag 9240

aaattttcgt gagtcaatat ggattccgag catcattttc ttgcggtcta tcttgctacg 9300

tatgttgatc ttgacgctgt ggatcaagca acgccactcg ctcgctccat cgcaggctgg 9360

tcgcagacaa attaaaaggc ggcaaactcg tacagccgcg gggttgtccg ctgcaaagta 9420

cagagtgata aaagccgcca tgcgaccatc aacgcgttga tgcccagctt tttcgatccg 9480

agaatccacc gtagaggcga tagcaagtaa agaaaagcta aacaaaaaaa aatttctgcc 9540

cctaagccat gaaaacgaga tggggtggag cagaaccaag gaaagagtcg cgctgggctg 9600

ccgttccgga aggtgttgta aaggctcgac gcccaaggtg ggagtctagg agaagaattt 9660

gcatcgggag tggggcgggt tacccctcca tatccaatga cagatatcta ccagccaagg 9720

gtttgagccc gcccgcttag tcgtcgtcct cgcttgcccc tccataaaag gatttcccct 9780

ccccctccca caaaattttc tttcccttcc tctccttgtc cgcttcagta cgtatatctt 9840

cccttccctc gcttctctcc tccatccttc tttcatccat ctcctgctaa cttctctgct 9900

cagcacctct acgcattact agccgtagta tctgagcact tctccctttt atattccaca 9960

aaacataaca caaccttcac catggacaag aagtatagca tcgggctgga cattggaacg 10020

aactcggttg gttgggctgt gattacggac gaatacaagg tgccatccaa gaagtttaag 10080

gtcctgggaa acaccgaccg tcactcaatc aagaagaatc tcattggagc cctgctcttc 10140

gatagtgggg agaccgccga agctactcga ctgaagcgaa cggctcgccg gcgttataca 10200

cgacgcaaga atcgcatctg ctacctccag gagattttca gcaacgaaat ggctaaggtt 10260

gatgactcat tctttcatcg actcgaagaa agtttcttgg tcgaggagga taagaagcac 10320

gagcgccatc cgatctttgg taacattgtg gatgaggttg cctatcacga aaagtaccca 10380

actatctatc atcttcgtaa gaagctggtc gatagcacgg acaaggctga tttgcgactt 10440

atctacctgg cactcgcgca catgattaag ttccgcggcc attttcttat cgagggtgac 10500

ctgaaccccg ataattctga cgttgataag ctcttcatcc agttggtcca aacctacaat 10560

cagctgtttg aggaaaaccc tattaatgca tctggcgtgg acgccaaggc tatcctttcg 10620

gcgcgcctgt ctaagtcgcg gcgtttggag aaccttatcg cacaactccc cggcgaaaag 10680

aagaacggcc tcttcggtaa tttgattgcg ttgtcacttg gtctgactcc taacttcaag 10740

agtaattttg acctggcaga ggatgcgaag ctccagttgt ctaaggatac gtatgatgac 10800

gatctcgaca acttgcttgc ccaaatcggt gaccagtacg ctgatctttt cctggccgct 10860

aagaatctct cagatgcaat cctgctcagt gacattttgc gggtcaacac cgagattact 10920

aaggcccccc tgtcagctag tatgatcaag cggtatgatg agcaccatca ggacctcacc 10980

ttgcttaagg ccctcgtgcg tcagcaattg cctgagaagt acaaggaaat cttctttgac 11040

caatccaaga acggatacgc agggtatatt gatggcggtg cgagccagga ggaattctac 11100

aagtttatca agccgatttt ggagaagatg gacggcactg aggaactgct cgtcaagctg 11160

aatcgcgaag atttgcttcg taagcaacga acgttcgaca acggctccat cccgcaccag 11220

attcatctgg gcgagctcca cgccatcctt cgacgccagg aagatttcta cccatttctg 11280

aaggacaacc gtgagaagat cgaaaagatt cttacattcc gaatccccta ctatgtggga 11340

cctttggccc gtgggaattc ccgatttgct tggatgaccc gaaagagcga ggaaaccatc 11400

actccgtgga acttcgagga agtcgtggac aagggtgcat ccgcgcagag cttcattgag 11460

cggatgacca attttgataa gaaccttccg aatgaaaagg tcctgccaaa gcattcgctg 11520

ctctacgagt atttcaccgt gtataacgaa ctgactaagg tcaagtacgt gacggaggga 11580

atgcggaagc cagccttcct ctcaggggaa caaaagaagg ctatcgtcga tttgcttttt 11640

aagaccaatc gtaaagtgac tgttaagcag ctgaaggagg attatttcaa gaagattgaa 11700

tgtttcgact ccgtcgagat cagcggcgtg gaagatcgct ttaacgcttc cctcggtacc 11760

taccacgacc tgctcaagat cattaaggac aaggatttcc tcgataacga ggaaaatgag 11820

gacatcttgg aagatattgt cctcacgttg acactttttg aggaccgcga aatgatcgag 11880

gaacggctca agacatatgc ccatttgttc gacgataagg tgatgaagca gctgaagcgg 11940

cgtcgataca ccggatgggg tcgccttagc cggaagctga tcaacggcat tcgagataag 12000

caatctggta agactatctt ggatttcctt aagtcggacg gcttcgccaa ccgcaatttt 12060

atgcagctta ttcacgacga ttccctgacg ttcaaggagg acatccagaa ggcacaagtc 12120

tcaggacaag gggattccct gcacgagcat atcgccaacc tggctggatc cccggcgatc 12180

aagaagggga ttcttcagac cgtcaaggtt gtcgacgagc tggtcaaggt gatgggccgt 12240

cataagccag aaaacatcgt gattgagatg gcccgagaaa atcagaccac tcaaaagggt 12300

cagaagaaca gccgcgagcg gatgaagcgg atcgaggaag gcattaagga acttggttct 12360

cagatcctga aggagcaccc tgttgaaaac acacagctcc aaaatgagaa gctgtatctc 12420

tactatttgc aaaatggacg cgacatgtac gtcgatcagg agctcgacat taaccggttg 12480

tcggactacg atgttgacca tatcgtcccg caatccttcc ttaaggacga tagcattgat 12540

aacaaggtgc tgactcgctc agataagaac cggggcaagt ccgacaatgt tccaagcgag 12600

gaagtggtta agaagatgaa gaactactgg cgccaattgc ttaatgccaa gctcatcaca 12660

cagcgcaagt ttgacaactt gaccaaggcc gagcggggag ggctgagtga actcgataag 12720

gctggcttca tcaagcgtca actcgtggag acgcgacaga tcacaaagca cgttgctcag 12780

attctggact cccggatgaa cacaaagtac gacgagaatg ataagctcat ccgtgaagtt 12840

aaggtcatta ccctcaagtc taagttggtg tcggatttcc gcaaggactt ccaattttat 12900

aaggttcggg agatcaacaa ttatcaccat gcacatgatg cgtacctcaa cgcagtcgtg 12960

ggaactgcgc tcatcaagaa gtatcccaag ttggagtccg aattcgtcta cggggattat 13020

aaggtttacg acgtccgcaa gatgatcgcc aagagtgagc aggaaattgg caaggccacg 13080

gctaagtatt tcttttactc caacatcatg aatttcttta agacggagat cacactcgcc 13140

aatggagaaa tccgtaagcg acctttgatt gagaccaacg gcgagactgg tgaaatcgtt 13200

tgggataagg ggcgcgactt cgctaccgtg cggaaggttc tgagcatgcc gcaagtcaat 13260

atcgtcaaga aaaccgaggt gcagacaggc ggtttctcta aggaatcgat tcttccaaag 13320

cgtaactctg acaagctgat cgctcgaaag aaggattggg accccaagaa gtatggaggg 13380

ttcgattctc ctacagtggc atactcggtt ctcgttgtcg cgaaggttga gaagggaaag 13440

tctaagaagc tgaagtcggt caaggaactg ctcgggatca ccattatgga gcgctccagc 13500

ttcgaaaaga atcccatcga ctttctcgag gccaagggct ataaggaagt caagaaggat 13560

cttatcatta agctgcctaa gtactctttg ttcgagcttg aaaacggtcg aaagcgaatg 13620

ctcgcatcgg caggagagtt gcagaagggg aatgaattgg cacttccctc aaagtacgtg 13680

aacttcctgt atctcgcgtc ccactacgag aagctgaagg gtagccctga ggacaacgaa 13740

cagaagcaac tttttgttga gcaacacaag cattatctgg atgagatcat tgaacagatt 13800

tcagagttca gtaagcgcgt catcctcgcc gatgctaatc tcgacaaggt gttgtcggcc 13860

tacaacaagc accgtgacaa gccgatccga gagcaggctg aaaatatcat tcatctgttc 13920

accctcacta acttgggagc accagcagcg ttcaagtatt ttgatacgac aatcgaccgt 13980

aagcgataca cgtccacaaa ggaggtgctt gatgcgaccc tgattcatca atccatcact 14040

gggctctatg aaacccgtat cgaccttagt caactggggg gcgacccccc caagaagaag 14100

cgcaaggtct gagcggacat tcgatttatg ccgttatgac ttccttaaaa aagcctttac 14160

gaatgaaaga aatggaatta gacttgttat gtagttgatt ctacaatgga ttatgattcc 14220

tgaacttcaa atccgctgtt cattattaat ctcagctctt cccgtaaagc caatgttgaa 14280

actattcgta aatgtacctc gttttgcgtg tggcgtaatc atggtcatag ctgtttcctg 14340

tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 14400

aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 14460

ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 14520

gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 14580

tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 14640

aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 14700

gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 14760

aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 14820

ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 14880

tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 14940

tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 15000

ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 15060

tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 15120

ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 15180

tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 15240

aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 15300

aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 15360

aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 15420

ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 15480

acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 15540

ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 15600

gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 15660

taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 15720

tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 15780

gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 15840

cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 15900

aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 15960

cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 16020

tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 16080

gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 16140

tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 16200

gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 16260

ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 16320

cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 16380

agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 16440

gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 16500

tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtc 16545

<210> 10

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ456

<400> 10

gcctgcgttt ctccgatcc 19

<210> 11

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ459

<400> 11

caacctgcag catccagac 19

<210> 12

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 原型间隔子PS4

<400> 12

ggatccaaaa gcagcgacgg 20

<210> 13

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 原型间隔子PS6

<400> 13

tggccaggtg tatccatcgc 20

<210> 14

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 原型间隔子PS9.1

<400> 14

ccccggaaga gcttcatatc 20

<210> 15

<211> 86

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ344

<400> 15

tgcccggcct ctccaccatc cagaacatct cgacgcgcca aagcttacgc catgacgctg 60

cgcaacacga cgctagagcg cgtctc 86

<210> 16

<211> 86

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ346

<400> 16

ctcgcagccc ggctcgccaa ccgcctcaac cacgccgccg aagctttgca acctcgttcc 60

accaccatcc cagaggccgt ctggtg 86

<210> 17

<211> 86

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ348

<400> 17

gggtatcgag gacgagttcc tgagcacggc gtccgagccg aagcttcggc ttcaacgcaa 60

atgtgcggct ctggcagtcc gcggct 86

<210> 18

<211> 85

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ499

<400> 18

ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcagcgtg gttgaggcgg 60

ttggcgagcc gggctgcgag gccga 85

<210> 19

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ500

<400> 19

ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcggcgta gttgaggcgg 60

ttggcgagcc gggctgcgag gccgaggcag 90

<210> 20

<211> 100

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ501

<400> 20

ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcga 60

ttggcgagcc gggctgcgag gccgaggcag actcgggcga 100

<210> 21

<211> 110

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ502

<400> 21

ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg 60

ttggcgagca gggctgcgag gccgaggcag actcgggcga ggtggtgagg 110

<210> 22

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ503

<400> 22

ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg 60

ttggcgagcc gggctgcgaa gccgaggcag actcgggcga ggtggtgagg gcgtggacag 120

<210> 23

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ504

<400> 23

ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgacgcgg 60

ttggcgaacc gggctgcgaa gccgaggcag actcgggcga ggtggtgagg gcgtggacag 120

<210> 24

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ505

<400> 24

ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcgtcgta gtttaggagg 60

tcggcaagct gggatgtgaa gccgaggcag actcgggcga ggtggtgagg gcgtggacag 120

<210> 25

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ474

<400> 25

cagtaaggac atatgaagag cagg 24

<210> 26

<211> 100

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ567

<400> 26

cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg ttggcgagcc 60

gggctgcgaa gccgaggcag actcgggcga ggtggtgagg 100

<210> 27

<211> 80

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ568

<400> 27

gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg ttggcgagcc gggctgcgaa 60

gccgaggcag actcgggcga 80

<210> 28

<211> 130

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ569

<400> 28

ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg 60

ttggcgagcc gggctgcgag gccgaggcac actcgggcga ggtggtgagg gcgtggacag 120

cgccagcgcc 130

<210> 29

<211> 140

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ570

<400> 29

ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg 60

ttggcgagcc gggctgcgag gccgaggcag actcgggcgt ggtggtgagg gcgtggacag 120

cgccagcgcc agcgccagca 140

<210> 30

<211> 110

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ571

<400> 30

cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg ttggcgagcc 60

gggctgcgag gccgaggcac actcgggcga ggtggtgagg gcgtggacag 110

<210> 31

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ572

<400> 31

cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg ttggcgagcc 60

gggctgcgag gccgaggcag actcgggcgt ggtggtgagg gcgtggacag cgccagcgcc 120

<210> 32

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> 引物oNJ573

<400> 32

cagcggtcgc aggctctgct caccagacgg cctctgggat tgtggtggaa cgaggttgca 60

gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg ttggcgagcc gggctgcgag 120

<210> 33

<211> 16195

<212> DNA

<213> 人工序列

<220>

<223> 质粒pAT3630

<400> 33

accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 60

ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 120

gcgctgcgat gataccgcga gaaccacgct caccggctcc ggatttatca gcaataaacc 180

agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 240

ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 300

ttgttgccat cgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 360

gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 420

ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 480

tggttatggc agcgctacat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 540

tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 600

cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 660

tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 720

gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 780

tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 840

ggaaatgttg aatactcata ttcttccttt ttcaatatta ttgaagcatt tatcagggtt 900

attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggtca 960

gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata cctgaatatg 1020

gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc tgaccccatg 1080

ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc ccatgcgaga 1140

gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg 1200

cccgggctaa ttatggggtg tcgcccttat tcgactctat agtgaagttc ctattctcta 1260

gaaagtatag gaacttctga agtggggatt taaatgcggc cgcgctgagg gtttaatcga 1320

cgaagcagct gacggccagt gccaagctta acgcgtaccc gggcccagta tatgttccgc 1380

agatgactgg agctctgcca tacgtgccct ctcaagcacc atttgttcca tctacagaga 1440

ctagtcacca actagtctat caagactcac agggtacatt gctgagacca actgaccaga 1500

ggcagggtag cggattgacg gctccatctc cttcacttac aaggtctatt gaaagccctt 1560

tagcatcacc aagcggagaa tagattgtta agcttatttt ttgtatactg ttttgtgata 1620

gcacgaagtt tttccacggt atcttgtaaa aatatatatt tgtggcgggc ttacctacat 1680

caaattaata agagactaat tataaactaa acacacaagc aagctacttt agggtaaaag 1740

tttataaatg cttttgacgt ataaacgttg cttgtattta ttattacaat taaaggtgga 1800

tagaaaacct agagactagt tagaaactaa tctcaggttt gcgttaaact aaatcagagc 1860

ccgagaggtt aacagaacct agaaggggac tagatatccg ggtagggaaa caaaaaaaaa 1920

aaacaagaca gccacatatt agggagacta gttagaagct agttccagga ctaggaaaat 1980

aaaagacaat gataccacag tctagttgac aactagatag attctagatt gaggccaaag 2040

tctctgagat ccaggttagt tgcaactaat actagttagt atctagtctc ctataactct 2100

gaagctagaa taacttacta ctattatcct caccactgtt cagctgcgca aacggagtga 2160

ttgcaaggtg ttcagagact agttattgac tagtcagtga ctagcaataa ctaacaaggt 2220

attaacctac catgtctgcc atcaccctgc acttcctcgg gctcagcagc cttttcctcc 2280

tcattttcat gctcattttc cttgtttaag actgtgacta gtcaaagact agtccagaac 2340

cacaaaggag aaatgtctta ccactttctt cattgcttgt ctcttttgca ttatccatgt 2400

ctgcaactag ttagagtcta gttagtgact agtccgacga ggacttgctt gtctccggat 2460

tgttggagga actctccagg gcctcaagat ccacaacaga gccttctaga agactggtca 2520

ataactagtt ggtctttgtc tgagtctgac ttacgaggtt gcatactcgc tccctttgcc 2580

tcgtcaatcg atgagaaaaa gcgccaaaac tcgcaatatg gctttgaacc acacggtgct 2640

gagactagtt agaatctagt cccaaactag cttggatagc ttacctttgc cctttgcgtt 2700

gcgacaggtc ttgcagggta tggttccttt ctcaccagct gatttagctg ccttgctacc 2760

ctcacggcgg atctgccata aagagtggct agaggttata aattagcact gatcctaggt 2820

acggggctga atgtaacttg cctttccttt ctcatcgcgc ggcaagacag gcttgctcaa 2880

attcctacca gtcacagggg tatgcacggc gtacggacca cttgaactag tcacagatta 2940

gttagcaact agtctgcatt gaatggctgt acttacgggc cctcgccatt gtcctgatca 3000

tttccagctt caccctcgtt gctgcaaagt agttagtgac tagtcaagga ctagttgaaa 3060

tgggagaaga aactcacgaa ttctcgactc ccttagtatt gtggtccttg gacttggtgc 3120

tgctatatat tagctaatac actagttaga ctcacagaaa cttacgcagc tcgcttgcgc 3180

ttcttggtag gagtcggggt tgggagaaca gtgccttcaa acaagccttc ataccatgct 3240

acttgactag tcagggacta gtcaccaagt aatctagata ggacttgcct ttggcctcca 3300

tcagttcctt catagtggga ggaccattgt gcaatgtaaa ctccatgccg tgggagttct 3360

tgtccttcaa gtgcttgacc aatatgtttc tgttggcaga gggaacctgt caactagtta 3420

ataactagtc agaaactatg atagcagtag actcactgta cgcttgaggc atcccttcac 3480

tcggcagtag acttcatatg gatggatatc aggcacgcca ttgtcgtcct gtggactagt 3540

cagtaactag gcttaaagct agtcgggtcg gcttactatc ttgaaatccg gcagcgtaag 3600

ctccccgtcc ttaactgcct cgagatagtg acagtactct ggggactttc ggagatcgtt 3660

atcgttatcg cgaatgctcg gcatactaac tgttgactag tcttggacta gtcccgagca 3720

aaaaggattg gaggaggagg aggaaggtga gagtgagaca aagagcgaaa taagagcttc 3780

aaaggctatc tctaagcagt atgaaggtta agtatctagt tcttgactag atttaaagag 3840

atttcgacta gttatgtacc tggagtttgg atataggaat gtgttgtggt aacgaaatgt 3900

aagggggagg aaagaaaaag tcgtcaagag gtaactctaa gtcggccatt cctttttggg 3960

aggcgctaac cataaacggc atggtcgact tagagttagc tcagggaatt tagggagtta 4020

tctgcgacca ccgaggaacg gcggaatgcc aaagaatccc gatggagctc tagctggcgg 4080

ttgacaaccc caccttttgg cgtttctgcg gcgttgcagg cgggactgga tacttcgtag 4140

aaccagaaag gcaaggcaga acgcgctcag caagagtgtt ggaagtgata gcatgatgtg 4200

ccttgttaac taggtaccaa tctgcagtat gcttgatgtt atccaaagtg tgagagagga 4260

aggtccaaac atacacgatt gggagagggc ctaggtataa gagtttttga gtagaacgca 4320

tgtgagccca gccatctcga ggagattaaa cacgggccgg catttgatgg ctatgttagt 4380

accccaatgg aaacggtgag agtccagtgg tcgcagataa ctccctaaat tccctgagct 4440

aactctaagt cgaccatgcc gtttatggtt agcgcctccc aaaaaggaat ggccgactta 4500

gagttacctc ttgacgactt tttctttcct cccccttaca tttcgttacc acaacacatt 4560

cctatatcca aactccaggt acataactag tcgaaatctc tttaaatcta gtcaagaact 4620

agatacttaa ccttcatact gcttagagat agcctttgaa gctcttattt cgctctttgt 4680

ctcactctca ccttcctcct cctcctccaa tcctttttgc tcgggactag tccaagacta 4740

gtcaacagtt agtatgccga gcattcgcga taacgataac gatctccgaa agtccccaga 4800

gtactgtcac tatctcgagg cagttaagga cggggagctt acgctgccgg atttcaagat 4860

agtaagccga cccgactagc tttaagccta gttactgact agtccacagg acgacaatgg 4920

cgtgcctgat atccatccat atgaagtcta ctgccgagtg aagggatgcc tcaagcgtac 4980

agtgagtcta ctgctatcat agtttctgac tagttattaa ctagttgaca ggttccctct 5040

gccaacagaa acatattggt caagcacttg aaggacaaga actcccacgg catggagttt 5100

acattgcaca atggtcctcc cactatgaag gaactgatgg aggccaaagg caagtcctat 5160

ctagattact tggtgactag tccctgacta gtcaagtagc atggtatgaa ggcttgtttg 5220

aaggcactgt tctcccaacc ccgactccta ccaagaagcg caagcgagct gcgtaagttt 5280

ctgtgagtct aactagtgta ttagctaata tatagcagca ccaagtccaa ggaccacaat 5340

actaagggag tcgagaattc gtgagtttct tctcccattt caactagtcc ttgactagtc 5400

actaactact ttgcagcaac gagggtgaag ctggaaatga tcaggacaat ggcgagggcc 5460

cgtaagtaca gccattcaat gcagactagt tgctaactaa tctgtgacta gttcaagtgg 5520

tccgtacgcc gtgcataccc ctgtgactgg taggaatttg agcaagcctg tcttgccgcg 5580

cgatgagaaa ggaaaggcaa gttacattca gccccgtacc taggatcagt gctaatttat 5640

aacctctagc cactctttat ggcagatccg ccgtgagggt agcaaggcag ctaaatcagc 5700

tggtgagaaa ggaaccatac cctgcaagac ctgtcgcaac gcaaagggca aaggtaagct 5760

atccaagcta gtttgggact agattctaac tagtctcagc accgtgtggt tcaaagccat 5820

attgcgagtt ttggcgcttt ttctcatcga ttgacgaggc aaagggagcg agtatgcaac 5880

ctcgtaagtc agactcagac aaagaccaac tagttattga ccagtcttct agaaggctct 5940

gttgtggatc ttgaggccct ggagagttcc tccaacaatc cggagacaag caagtcctcg 6000

tcggactagt cactaactag actctaacta gttgcagaca tggataatgc aaaagagaca 6060

agcaatgaag aaagtggtaa gacatttctc ctttgtggtt ctggactagt ctttgactag 6120

tcacagtctt aaacaaggaa aatgagcatg aaaatgagga ggaaaaggct gctgagcccg 6180

aggaagtgca gggtgatggc agacatggta ggttaatacc ttgttagtta ttgctagtca 6240

ctgactagtc aataactagt ctctgaacac cttgcaatca ctccgtttgc gcagctgaac 6300

agtggtgagg ataatagtag taagttattc tagcttcaga gttataggag actagatact 6360

aactagtatt agttgcaact aacctggatc tcagagactt tggcctcaat ctagaatcta 6420

tctagttgtc aactagactg tggtatcatt gtcttttatt ttcctagtcc tggaactagc 6480

ttctaactag tctccctaat atgtggctgt cttgtttttt ttttttgttt ccctacccgg 6540

atatctagtc cccttctagg ttctgttaac ctctcgggct ctgatttagt ttaacgcaaa 6600

cctgagatta gtttctaact agtctctagg ttttctatcc acctttaatt gtaataataa 6660

atacaagcaa cgtttatacg tcaaaagcat ttataaactt ttaccctaaa gtagcttgct 6720

tgtgtgttta gtttataatt agtctcttat taatttgatg taggtaagcc cgccacaaat 6780

atatattttt acaagatacc gtggaaaaac ttcgtgctat cacaaaacag tatacaaaaa 6840

ataagcttaa caatctattc tccgcttggt gatgctaaag ggctttcaat agaccttgta 6900

agtgaaggag atggagccgt caatccgcta ccctgcctct ggtcagttgg tctcagcaat 6960

gtaccctgtg agtcttgata gactagttgg tgactagtct ctgtagatgg aacaaatggt 7020

gcttgagagg gcacgtatgg cagagctcca gtcatctgcg gaacatatac tgggcccggg 7080

aagatctcat ggtcatagct gtttccgtta attaatggtt cacttctctt tagaaatcaa 7140

ctgtgggttt tgctttttgc ttcattctct ttgtcttctc catctttgat caaatcctgg 7200

actttctcaa tccccagcta attcaatcat agtcagtttt ctatttttat tatttctttt 7260

tcttttgaaa tgtgattaac aaccagtccg ttatatatct tgtacccaga ttacgcccaa 7320

ctcgtgctcc tcagccacaa agatactcaa ttgatagcca agatacatac ataccacaaa 7380

gtaaggactc catgcattga gtattactca tcgtattcta gactactcca aaactcagca 7440

catagacaaa caatacgaac ctcgtctagg ggtgattcag aggcggcaaa gcggggtttt 7500

cgcatttgat gttcctggca cttatgtaag cccacgcttc ccgctcaact aaaccatcag 7560

ccaatcagac tgctcagatt tatcttttga agggtaaata aatcattgta aagaagaaca 7620

agtggcttgc ttgtcaagca atggcatcat tggtctagtg gtagaattcg tcgttgccat 7680

cgacgaggcc cgtgttcgat tcacggatga tgcaggaatt tctactcttg tagatggcgc 7740

gccttttttt ttgagcattt atcagcttga tatagaggta ggaatgtatg gaggtgcaga 7800

atggctattt tgttattgga gcgggttcga aacggagggc aggagacttt ttctaaatac 7860

gtcacgtgat atagagctgc tttaattaac gagacagcag aatcaccgcc caagttaagc 7920

ctttgtgctg atcatgctct cgaacgggcc aagttcggga aaagcaaagg agcgtttagt 7980

gaggggcaat ttgactcacc tcccaggcaa cagatgaggg gggcaaaaag aaagaaattt 8040

tcgtgagtca atatggattc cgagcatcat tttcttgcgg tctatcttgc tacgtatgtt 8100

gatcttgacg ctgtggatca agcaacgcca ctcgctcgct ccatcgcagg ctggtcgcag 8160

acaaattaaa aggcggcaaa ctcgtacagc cgcggggttg tccgctgcaa agtacagagt 8220

gataaaagcc gccatgcgac catcaacgcg ttgatgccca gctttttcga tccgagaatc 8280

caccgtagag gcgatagcaa gtaaagaaaa gctaaacaaa aaaaaatttc tgcccctaag 8340

ccatgaaaac gagatggggt ggagcagaac caaggaaaga gtcgcgctgg gctgccgttc 8400

cggaaggtgt tgtaaaggct cgacgcccaa ggtgggagtc taggagaaga atttgcatcg 8460

ggagtggggc gggttacccc tccatatcca atgacagata tctaccagcc aagggtttga 8520

gcccgcccgc ttagtcatcg tcctcgcttg cccctccata aaaggatttc ccctccccct 8580

cccacaaaat tttctttccc ttcctctcct tgtccgcttc agtacgtata tcttcccttc 8640

cctcgcttct ctcctccatc cttctttcat ccatctcctg ctaacttctc tgctcagcac 8700

ctctacgcat tactagccgt agtatctgag cacttctccc ttttatattc cacaaaacat 8760

aacacaacct tcaccatgaa caacggcaca aacaacttcc agaacttcat tggaatctcg 8820

tcgttgcaga agactttgcg caacgccctc atccccacag aaactaccca gcagttcatt 8880

gtgaagaacg gaatcatcaa ggaagatgaa ctccgaggcg agaaccgcca gattttgaag 8940

gacatcatgg atgattacta ccgtggtttc atctcggaaa cgctctcctc cattgacgac 9000

atcgattgga cttcgttgtt cgaaaagatg gaaatccagc tcaaaaacgg cgataacaag 9060

gataccttga tcaaggagca gaccgagtat cggaaggcga tccataagaa gttcgccaac 9120

gatgatcggt tcaagaacat gttctcggcc aagttgattt ccgacattct ccccgaattc 9180

gtgatccata acaacaacta ctcggcgtcg gagaaggagg agaagacgca ggtcatcaag 9240

ttgttctcga ggttcgccac atcgttcaaa gactatttta agaatcgtgc gaactgtttc 9300

tcggcagatg atatctcctc gtcctcctgt caccgcattg tgaacgacaa cgcggaaatc 9360

ttcttctcga acgcgttggt gtataggcgc atcgtgaagt ccctctccaa cgatgacatc 9420

aacaaaatct cgggagatat gaaggattcg ctcaaggaga tgtcgttgga ggaaatctac 9480

tcctatgaga agtatggcga gttcattacg caggagggca tttccttcta caacgacatt 9540

tgtggtaaag tcaactcgtt catgaacctc tactgtcaga aaaacaagga gaacaaaaac 9600

ctctataagc tccagaagtt gcataagcag atcctctgta tcgcagacac ctcgtacgag 9660

gtcccttaca agttcgaatc cgatgaggag gtctaccagt ccgtcaacgg attcttggac 9720

aacatctcct cgaaacacat tgtcgagcgg ctccgaaaga tcggcgataa ctacaacggc 9780

tacaacttgg acaaaatcta tatcgtctcc aagttctatg agtccgtctc gcagaaaacc 9840

tatcgtgatt gggagactat caacactgcg ctcgagattc actataacaa catcttgcct 9900

ggtaacggca aatcgaaagc cgacaaggtg aagaaggccg tgaaaaacga tctccagaag 9960

tcgatcacag aaatcaacga actcgtctcg aactacaagc tctgttcgga tgataacatc 10020

aaggcggaaa cgtacatcca tgaaatctcg catatcttga acaacttcga ggcccaggaa 10080

ctcaaataca accccgagat ccacttggtc gagtcggagc tcaaagcctc ggagttgaag 10140

aacgtcttgg atgtcatcat gaacgcattc cactggtgtt ccgtgttcat gaccgaggaa 10200

ctcgtcgata aagacaacaa cttctacgcg gaactcgagg aaatctacga tgaaatctat 10260

cccgtgatct ccctctacaa cctcgtgcga aactacgtca ctcagaagcc ctattccacc 10320

aagaagatca agctcaactt cggcatcccc actctcgcag acggttggtc gaagtcgaag 10380

gagtactcca acaacgccat tatcctcatg cgagacaacc tctactactt gggtatcttc 10440

aacgcaaaga acaagccgga taagaagatc attgaaggca acacttcgga aaacaaggga 10500

gactataaga agatgatcta caacctcctc cctggaccca acaagatgat tcctaaagtg 10560

ttcctctcgt cgaagactgg tgtggaaacg tataagccgt cggcctacat cttggagggc 10620

tacaaacaga acaagcatat caagtcctcg aaggacttcg acatcacttt ctgtcacgac 10680

ctcatcgact atttcaagaa ctgtattgca atccatccgg aatggaagaa cttcggcttc 10740

gatttctcgg atacttcgac atacgaagat atctcgggat tctaccgaga ggtcgaattg 10800

cagggctata agattgattg gacctacatc tcggaaaagg atatcgactt gctccaggaa 10860

aagggccagc tctacctctt ccagatttac aacaaggact tctccaagaa gtcgacgggt 10920

aacgacaact tgcacacaat gtatctcaaa aacctcttct cggaggagaa cttgaaggat 10980

atcgtgctca aattgaacgg agaggccgaa atcttcttcc gtaagtcctc catcaagaac 11040

ccgatcatcc ataagaaggg atcgatcttg gtcaaccgga cttacgaagc agaggaaaaa 11100

gatcagttcg gaaacatcca gattgtcagg aagaacatcc ctgaaaacat ctatcaggag 11160

ttgtataagt acttcaacga caagtcggat aaggagctct ccgacgaagc agccaaactc 11220

aagaacgtcg tcggacacca tgaagcagca accaacattg tgaaggacta ccggtacact 11280

tacgacaagt acttcttgca catgccgatc actatcaact tcaaagccaa caagaccgga 11340

ttcattaacg acaggatcct ccagtacatt gccaaagaaa aggacctcca tgtcatcggt 11400

atcgataggg gagaacggaa cctcatctac gtctccgtga ttgacacttg tggcaacatt 11460

gtcgaacaga agtcgttcaa catcgtcaac ggttacgatt accagattaa gttgaaacag 11520

caggaaggtg cgaggcagat tgcgcgaaag gaatggaagg agattggcaa aatcaaggag 11580

attaaggaag gctacttgtc gttggtcatc cacgaaatct cgaaaatggt gatcaaatac 11640

aacgccatca tcgccatgga agacctctcg tacggcttca aaaagggacg gttcaaagtg 11700

gagcgtcagg tgtaccagaa gttcgaaaca atgttgatca acaagttgaa ctacttggtg 11760

ttcaaggaca tttccattac cgagaacgga ggattgctca agggttatca gctcacgtac 11820

atccccgaca agttgaaaaa cgtgggacac cagtgtggct gtatcttcta cgtgcctgca 11880

gcctacacgt cgaaaatcga ccctacaaca ggattcgtga acatcttcaa gttcaaggat 11940

ctcaccgtcg acgcgaagcg ggagttcatc aaaaagttcg actccatccg ctatgattcg 12000

gagaagaact tgttctgttt cacattcgac tacaacaact tcattactca gaacaccgtg 12060

atgtccaaat cgtcgtggtc cgtgtacacg tatggtgtgc gcatcaaaag gcgcttcgtc 12120

aacggtcgct tctccaacga atcggacacg atcgatatca cgaaagacat ggagaaaaca 12180

ttggaaatga ccgacatcaa ctggcgtgac ggccatgacc tcaggcagga catcatcgat 12240

tacgagatcg tccagcacat cttcgaaatc ttccgtctca ccgtgcagat gaggaactcc 12300

ctctccgagc tcgaagatcg ggattacgac cggctcattt cccctgtgtt gaacgagaac 12360

aacatcttct acgactcggc aaaagcggga gatgcattgc cgaaggacgc cgatgcgaac 12420

ggtgcatatt gtattgcact caagggtctc tacgaaatca agcagatcac cgaaaactgg 12480

aaggaggacg gcaaattctc gagggacaag ttgaagattt cgaacaagga ttggttcgat 12540

ttcatccaga acaagaggta cttgcctccg aagaagaagc gaaaggtgtg agcggacatt 12600

cgatttatgc cgttatgact tccttaaaaa agcctttacg aatgaaagaa atggaattag 12660

acttgttatg tagttgattc tacaatggat tatgattcct gaacttcaaa tccgctgttc 12720

attattaatc tcagctcttc ccgtaaagcc aatgttgaaa ctattcgtaa atgtacctcg 12780

ttttgcgtgt accttgctta tcacgtgata ttacatgacc tggacagagt tctgcgcgaa 12840

agtcataacg taaatcccgg gcggtaggtg cgtcccgggc ggaaggtagt tttctcgtcc 12900

accccaacgc gtttatcaac ctcaactttc aacaaccatc atgccaccaa aagcgcgtaa 12960

aacaaagcga gatttgattg agcaagaggg caggatccaa tgcgcgattc aagacattaa 13020

aaatggaaaa tttcaaaaaa ttgcgcccgc agcgcgtgca tacaaaattc atcccaatac 13080

tcctcgtgta ctgtgtaagc gcccactagg taatatgaca tgattacgaa ttcgagctcg 13140

gtacccggcc ggggatcctc tagacgtgga gttaccagtg attgaccaat gttttatctt 13200

ctacagttct gcctgtctac cccattctag ctgtacctga ctacagagta gtttaattgt 13260

ggttgacccc acagtcggag gcggaggaat acagcaccga tgtggcctgt ctccatccag 13320

attggcacgc aatttttaca cgcggaaaag atcgagatag agtacgactt taaatttagt 13380

ccccggcggc ttctatttta gaatatttga gatttgattc tcaagcaatt gatttggttg 13440

ggtcaccctc aattggataa tatacctcat tgctcggcta cttcaactca tcaatcaccg 13500

tcataccccg catataaccc tccattccca cgatgtcgtc caagtcgcaa ttgacttacg 13560

gtgctcgagc cagcaagcac cccaatcctc tggcaaagag actttttgag attgccgaag 13620

caaagaagac aaacgttacc gtctctgctg atgtgacgac aacccgagaa ctcctggacc 13680

tcgctgaccg tacggaagct gttggatcca atacatatgc cgtctagcaa tggactaatc 13740

aacttttgat gatacaggtc tcggtcccta catcgccgtc atcaagacac acatcgacat 13800

cctcaccgat ttcagcgtcg acactatcaa tggcctgaat gtgctggctc aaaagtacaa 13860

ctttttgatc ttcgaggacc gcaaattcat cgacatcggc aataccgtcc agaagcaata 13920

ccacggcggt gctctgagga tctccgaatg ggcccacatt atcaactgca gcgttctccc 13980

tggcgagggc atcgtcgagg ctctggccca gaccgcatct gcgcaagact tcccctatgg 14040

tcctgagaga ggactgttgg tcctggcaga gatgaccccc aaaggatcgc tggctacggg 14100

cgagtatacc aaggcatcgg ttgactacgc tcgcaaatac aagaacttcg ttatgggttt 14160

cgtgtcgacg cgggccctga cggaagtgca gtcggatgtg tcttcagcct cggaggatga 14220

agatttcgtg gtcttcacga cgggtgtgaa cctctcttcc aaaggagata agcttggaca 14280

gcaataccag actcctgcat cggctattgg acgcggtgcc gactttatca tcgccggtcg 14340

aggcatctac gctgctcccg acccggttga agctgcacag cggtaccaga aagaaggctg 14400

ggaagcttat atggccagag tatgcggcaa gtcatgattt cctcttggag caaaagtgta 14460

gtgccagtac gagtgttgtg gaggaaggct gcatacattg tgcctgtcat taaacgatga 14520

gctcgtccgt attggcccct gtaatgccat gttttccgcc cccaatcgtc aaggttttcc 14580

ctttgttaga ttcctaccag tcatctagca aggcggccgc agctagcaca attgaggcat 14640

ccccactacc gcattaagac ctcagcgcgg ccgcaaattt aaataaaatg aagtgaagtt 14700

cctatacttt ctagagaata ggaacttcta tagtgagtcg aataagggcg acacaaaatt 14760

tattctaaat gcataataaa tactgataac atcttatagt ttgtattata ttttgtatta 14820

tcgttgacat gtataatttt gatatcaaaa actgattttc cctttattat tttcgagatt 14880

tattttctta attctcttta acaaactaga aatattgtat atacaaaaaa tcataaataa 14940

tagatgaata gtttaattat aggtgttcat caatcgaaaa agcaacgtat cttatttaaa 15000

gtgcgttgct tttttctcat ttataaggtt aaataattct catatatcaa gcaaagtgac 15060

aggcgccctt aaatattctg acaaatgctc tttccctaaa ctccccccat aaaaaaaccc 15120

gccgaagcgg gtttttacgt tatttgcgga ttaacgatta ctcgttatca gaaccgccca 15180

gggggcccga gcttaagact ggccgtcgtt ttacaacaca gaaagagttt gtagaaacgc 15240

aaaaaggcca tccgtcaggg gccttctgct tagtttgatg cctggcagtt ccctactctc 15300

gccttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 15360

atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 15420

gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 15480

gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 15540

gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 15600

gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 15660

aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 15720

ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 15780

taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 15840

tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 15900

ggctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 15960

taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 16020

tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 16080

tttgatcttt tctacggggt ctgacgctca gtggaacgac gcgcgcgtaa ctcacgttaa 16140

gggattttgg tcatgagctt gcgccgtccc gtcaagtcag cgtaatgctc tgctt 16195

<210> 34

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 二十一个碱基对的原型间隔子

<400> 34

acgatggtgc tgatggctac t 21

<210> 35

<211> 6783

<212> DNA

<213> 曲霉属

<220>

<221> 尚未归类的特征

<222> (1)..(6783)

<223> wA基因座

<400> 35

atagtctcca ctgtcgcatg tggtagtaac tctatcttgg tataaatcat acttaatatc 60

tagccaatcg ctttgggaaa acaatttgat cagcatctct gcgactcttg actggcactt 120

tcttgaccca acatggaggg gccacgcggc gtctatctct tcggagacca gacaagtgat 180

ttcgacgccg gcttacgtcg cctcctacaa gtaaagaata acacaattgt tgcatcgttc 240

ttccagagat gctttcacgc tttgcgccaa gagatcgcga ggctttcacc atctgaacgg 300

aagatcttcc cccggtttac gagcatagtg gatctactgg cgcgtcaccg ggagtcagac 360

cctaatccgg ctctggagag tgcgttgacc tgtatctatc aattgggatg ctttataaag 420

tacgtgtaac tgcagatcct gacccgtttg aacgagccta acctgagata gctactacgg 480

agaccttgga aacgtgtacc catctgcttc agactgccat atagttggcc tgtgcgcggg 540

tcttcttagt tctgcagctg taagctgttc gaacaatgtt ggagaattgc tccccgctgc 600

ggttgaagcg gtggtggtag ctctccgact tggtctatgc gtccttaaag ttcgagagct 660

ggtgagctct gaccaagcgt cgtcaacaag ctggtcagtc ttgatttcag ggattagcga 720

gaaagatgcc tcgcagctta taggagaatt cactgctgaa cgggtaagtc aattgatctg 780

aaatagtttg caggacagaa tgttctaacc actggataaa ggcaattcct ccttcatcca 840

aaccgtatat cagtgcggtg ggatataaca gtataaccat cagcgcaccg cctaaggtcc 900

ttgatgattt aattgattct aggctgtcta agagccataa gccggtgagg gcgcaaatcc 960

atggtcctta ccatgcagca catctgtact atggccgaga tgtcgacagg atcatcgaaa 1020

gctgccataa tgaggtcgtt tcaaactaca caccccgtat ccccgtacta tcaagtacta 1080

cgggacagcc gatagaggcc aaacacatga aagatctact taaggccgcc cttgaagaga 1140

ttctactacg tcaactatgc tgggagaaag tgaccgatgc ctgctattcc atattaaaaa 1200

ctgctcgtca tcaaccatgc aagttgttcc caatttcaag cactgcgaca caaagcttgt 1260

ttacagctct tacgaaagcc gggataaccg acatcgaagt ggaaaatggg ctcggagatg 1320

ttcccacgaa cccgaaggac aaccttaaca tcagcggcag ggcggactgc tccaagatag 1380

ctatcattgg catgtctgga cgattcccag aagctgatgg cacagagagt ttctgggacc 1440

ttctgtataa tggcctcgat gtacaccgga aggtgcctgc agagcgttgg gatgttgatg 1500

cccacgttga tcctaccgga acaaaacgga acaccagcaa ggttccatac ggatgctgga 1560

taaacgaacc ggggttattt gacccccgct tcttcaatat gtcgccacgc gaagccctcc 1620

aggcagatcc cgctcaaaga cttgcattgc tcacggccta tgaagctctt gaaatggccg 1680

gctttatccc cgacagcacc ccttctacac agagggatcg agtcggcctc ttctatggaa 1740

tgactagcga tgactatcgg gagataaata gtggtcaaga tattgatact tactttatcc 1800

ctggtgggaa tcgtgctttc acacctggcc ggataaacta ctatttcaag ttcagtgggc 1860

ccagcgtcag cgttgataca gcttgttctt caagtcttgc ggctattcat atggcttgca 1920

attcgatctg gagaaatgat tgcgatgctg ctattgctgg aggtgtcaat atattgacaa 1980

accctgataa ccatgccggt cttgaccgtg gccatttcct gtccagaacc gggaattgca 2040

acacatttga cgatggtgct gatggctact gtagagcaga tggagtgggt acaatcattc 2100

tcaagcggct ggaagacgct caggcggaca acgatccaat cctcggtgtg atcaatggag 2160

cctataccaa tcattcggca gaagcagtct cgattacccg ccctcatgtt ggcgcacaag 2220

cgtttatctt taataagcta ttgaacgatg ccaatatcga ccctaaggac gtcagctacg 2280

ttgaaatgca tggaactggt actcaagctg gggatgcggt ggaaatgcaa tcggtcttgg 2340

atacgtttgc tcccgactac cgccgtggac caggacagtc tctccatctt ggttccgcca 2400

aagcaaatgt tgggcatgga gagtcagcat ctggtgtaac tgcacttgtg aaagtgctgc 2460

taatgatgaa gaagaatacc ataccccctc attgtggtat aaagactaag atcaaccaca 2520

acttccccac ggatctcgcg caacgaaatg tccacattgc ctttcaacct accccttgga 2580

acagaccggc ttccggaaag cggcagtgct tcattaacaa cttttcggcg gctggtggaa 2640

ataccgctct tttgatggaa gacgctccaa tcgctgaggt taaggggcag gacactcgac 2700

ctgttcacgt tgtgtctgta tcggcacgat cccagagtgc gctcaaaaac aacatcaact 2760

ctctcgtaaa atacatcgac gaacaaggaa ggtcattcaa tgtgaacgag gcagacttta 2820

tcccaagctt ggcatacacc accacagcac ggcgtatcca tcacccattc cgtgtcacag 2880

ctatcgggtc tagtttgcag gagctgcgtg actcacttaa caacagctct cgtctggaaa 2940

gctttacccc tgtccctgcg acggcccctg gcgtagggtt cgtgttcgct ggccaaggag 3000

ctcagcacac cggaatggga aggcaactat acgaaaaatg ctctcaattc cgggcaacaa 3060

tgcagcactt cgattgcatt agtcaaaacc aagggtttcc ttcgatcctt cccttggttg 3120

acggaagcgt gcccgtggag gagctgggcc ctatcgtgac acagctcggc accacatgtc 3180

ttcagatggc tttggtcaac tattggggtt cactaggtat aaaacctgcg ttcgttcttg 3240

ggcatagtct cggggagttt gctgctttga ataccgcagg agtattatcg acttccgata 3300

ccatctacct ttgtggccgt cgggctaccc tccttacaga atactgccag gttgggacac 3360

acgccatgct ggctgtcaag gcttcctacc cccaggtcaa gcagttactg aaagaaggtg 3420

tggatgaagt tgcctgtgtc aactcaccca gtgagacagt cgtcagtggc ctcaccgctg 3480

atattgatga cttggctcaa aggtgttcca ctgaaggttg gaagtccact aaactaaggg 3540

taccgttcgc tttccattct gcccaagtta ctccaattct tgaacggttt caagaagagg 3600

cccagggtgt cacgttccgt aagccgtcgt taccgtttgt ttcctcactc cttggggaag 3660

tcatcaccga atctaattac gatgtcctgg gagctcaata tatggtgaag cagtgccgga 3720

agtcggtgaa cttccttggt gctcttgagg ccaccagata tgcgaaattg atgactgata 3780

agactgtctg gctggaagtt ggtgcccata ccatttgctc tggtatgatc aaagcaacat 3840

tcggtcccca ggttaccact gtggcatctc ttcgccgaga ggagaatgca tggaaggtcc 3900

tctccaatag tctatcggcc cttcatttgg ctggcattga tattaattgg aaagaatatc 3960

atcaagactt cagctccagc caccaggtgc tcccacttcc ttcttacaag tgggatctca 4020

agaactactg gataccctac actaacaatt tctgccttac gaagggtgct ccccaaactg 4080

caattcaagc tgcaccacaa actacattcc tgaccactgc tgcgcaaaag gttgttgaga 4140

gtcgcgacga cggtacaaca gcgactgtcg tggtgcaaaa tgacatcgct gatcctgagt 4200

tgaaccgtgt tatccaaggt cacaaggtca atggagccgc actttgccca tcggtaagta 4260

ttgcatgcat tgccagacta tcttgtgtta taattcggct acttacgtat tgcctagtca 4320

ctctacgcag atattgccca gacacttgga gagtatctta ttgagaaata caaacccgag 4380

ttcaaagatc ttggtctcga tgtgtgtgac atggtcgtac cgaagccact catcgcgaag 4440

ggaggagagc agctctttag agtctctgct attgctaatt gggctgagaa gaaggcttca 4500

gttcaagtat acgccgttaa tgctgacggc aaaaagaccg tggatcatgc gtattgtacg 4560

gtgaagttct ttgataccaa tgcctccgag ctcgagtgga agagaatctc gtacctggtc 4620

aagagaagca tcgacagtct tcaccagaat gcggagacag gggaggctca ccgtatccag 4680

cgaggaatgg tctataaact tttcagcgcg ttggtcgatt atgatgaaaa tttcaagtcg 4740

attcgcgagg ttatcctgga cagcgacaat aatgaggcca ccgctcgtgt caaattccaa 4800

gcaccgccag gaaatttcca ccgaaaccca ttctggattg acagtttcgg tcacttgtcc 4860

ggattcatta tgaatgcgag cgacgcgacc gactctaaga accaagtatt tgttaaccat 4920

ggatgggatt cgatgcgttg cctgaagaag ttctcgcctg atgtcactta tcgcacttat 4980

gtgaggatgc agccatggca aaacaacatt tgggctggag atgtttatat ctttgagggc 5040

gacgatatta ttgctgtctt cggaggtgtg aaggtgggta cctcactact gattttggtt 5100

cctgcttact gacatgataa ttagttccaa gcactggcac gcaagatact tgacactgtt 5160

cttccccctg ttggcggttc aaaggcacca attacagcga aatcaccacc tccagctcgc 5220

actcagaagg ccaacaccgg cgccaagacc cgtcctaaag cacctgttcc ttccaagtcg 5280

ttcaccaaat cttctgggcc gagtgttgtc gtacgcgcac tcagcattct ggcctcagaa 5340

gttggcctgg cagagtctga aatctcagac gacatggtgt ttgcggacta cggtgtagac 5400

tcactcctct cccttacagt tactggcagg tatcgtgaag agttgaacct cgatttggac 5460

tcctctgtgt ttaccgatca tccaactgtc aacgacttca agcggctcat cgcccaagtg 5520

agtccttcag agagccatga tggttcctcc agtgaacaag agtcgaattt ctctttcaac 5580

ggtggcgagt cctcaagcgc aagcacacct gacataacgt caccgccgaa tgagaaggta 5640

gctcaagtcg agcaaaacgg caccatgaag gaaatccgta acatcatggc ggaggagatc 5700

ggtgtacccg cagaagagat cgaccctgac gagaacttgg gagagatggg tatggactcg 5760

cttctctccc ttactgttct tggaagaata cgggagactt tggacatgga cctgccagga 5820

gagttcttca tcgaaaacca gaccctcaat gatatagagg tggctttgga cctaaaaccc 5880

aagactacct ctgctccaat tcctatgcca gagccagtga aattccctga agctatccac 5940

gacctccagc caaagcttgc tcaacatccc aaggccacat ccatcctgtt acaaggaaac 6000

cccaggacag caacaaagac gttattcttg tttcctgacg gctctggctc agctacatct 6060

tacgctacca tccccggact ctctcctgac gtctgcgttt acgggttgaa ttgcccatat 6120

atgaagacac ctgagaagct caaatgcagc ctagatgaac tcactgcgcc ctatgtagca 6180

gagattcgtc gtcggcaacc caagggtcct tacagcttcg gtggctggtc agcaggaggg 6240

atctgtgcat atgatgcggc acgccatcta atgtttgagg aaggtgaaca agtcgaccgc 6300

ttgcttctcc ttgatacccc cttccccatc ggcctcgaga agctgccgca gagattgtac 6360

ggcttcttca actctatcgg tctcttcggt gaaggtaaaa cggcaccacc ctcctggctc 6420

ctaccccact tcctagcctt tatcgacgct ctcgacgcat acaaggccgc gccccttcca 6480

ttcaaagacg agaaatgggc caagaaactg cccaagactt atatcatctg ggccaaggac 6540

ggtgtttgcg gtaagccggg agatccccgg cctgatcccc cgacagacgg ttccaaggat 6600

cccaaggaga tggtctggct tcttaatgac cggaccgatc tgggacctaa caagtgggat 6660

acattggttg gacctgagaa tattggtgga atcacagtaa tggaagatgc taatcatttt 6720

acgatgacga agggcgaaaa agcgaaagag ttgtctacat ttatggctaa cgccatggct 6780

taa 6783

<210> 36

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 其延伸序列用于克隆的原型间隔子(oAT3858)

<400> 36

aatttctact cttgtagata cgatggtgct gatggctact tttttttttg agcatttatc 60

agcttg 66

<210> 37

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物oAT4025

<400> 37

gcccgttcga gagcatgatc 20

<210> 38

<211> 16208

<212> DNA

<213> 人工序列

<220>

<223> 质粒pAT3720

<400> 38

accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 60

ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 120

gcgctgcgat gataccgcga gaaccacgct caccggctcc ggatttatca gcaataaacc 180

agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 240

ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 300

ttgttgccat cgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 360

gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 420

ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 480

tggttatggc agcgctacat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 540

tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 600

cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 660

tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 720

gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 780

tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 840

ggaaatgttg aatactcata ttcttccttt ttcaatatta ttgaagcatt tatcagggtt 900

attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggtca 960

gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata cctgaatatg 1020

gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc tgaccccatg 1080

ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc ccatgcgaga 1140

gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg 1200

cccgggctaa ttatggggtg tcgcccttat tcgactctat agtgaagttc ctattctcta 1260

gaaagtatag gaacttctga agtggggatt taaatgcggc cgcgctgagg gtttaatcga 1320

cgaagcagct gacggccagt gccaagctta acgcgtaccc gggcccagta tatgttccgc 1380

agatgactgg agctctgcca tacgtgccct ctcaagcacc atttgttcca tctacagaga 1440

ctagtcacca actagtctat caagactcac agggtacatt gctgagacca actgaccaga 1500

ggcagggtag cggattgacg gctccatctc cttcacttac aaggtctatt gaaagccctt 1560

tagcatcacc aagcggagaa tagattgtta agcttatttt ttgtatactg ttttgtgata 1620

gcacgaagtt tttccacggt atcttgtaaa aatatatatt tgtggcgggc ttacctacat 1680

caaattaata agagactaat tataaactaa acacacaagc aagctacttt agggtaaaag 1740

tttataaatg cttttgacgt ataaacgttg cttgtattta ttattacaat taaaggtgga 1800

tagaaaacct agagactagt tagaaactaa tctcaggttt gcgttaaact aaatcagagc 1860

ccgagaggtt aacagaacct agaaggggac tagatatccg ggtagggaaa caaaaaaaaa 1920

aaacaagaca gccacatatt agggagacta gttagaagct agttccagga ctaggaaaat 1980

aaaagacaat gataccacag tctagttgac aactagatag attctagatt gaggccaaag 2040

tctctgagat ccaggttagt tgcaactaat actagttagt atctagtctc ctataactct 2100

gaagctagaa taacttacta ctattatcct caccactgtt cagctgcgca aacggagtga 2160

ttgcaaggtg ttcagagact agttattgac tagtcagtga ctagcaataa ctaacaaggt 2220

attaacctac catgtctgcc atcaccctgc acttcctcgg gctcagcagc cttttcctcc 2280

tcattttcat gctcattttc cttgtttaag actgtgacta gtcaaagact agtccagaac 2340

cacaaaggag aaatgtctta ccactttctt cattgcttgt ctcttttgca ttatccatgt 2400

ctgcaactag ttagagtcta gttagtgact agtccgacga ggacttgctt gtctccggat 2460

tgttggagga actctccagg gcctcaagat ccacaacaga gccttctaga agactggtca 2520

ataactagtt ggtctttgtc tgagtctgac ttacgaggtt gcatactcgc tccctttgcc 2580

tcgtcaatcg atgagaaaaa gcgccaaaac tcgcaatatg gctttgaacc acacggtgct 2640

gagactagtt agaatctagt cccaaactag cttggatagc ttacctttgc cctttgcgtt 2700

gcgacaggtc ttgcagggta tggttccttt ctcaccagct gatttagctg ccttgctacc 2760

ctcacggcgg atctgccata aagagtggct agaggttata aattagcact gatcctaggt 2820

acggggctga atgtaacttg cctttccttt ctcatcgcgc ggcaagacag gcttgctcaa 2880

attcctacca gtcacagggg tatgcacggc gtacggacca cttgaactag tcacagatta 2940

gttagcaact agtctgcatt gaatggctgt acttacgggc cctcgccatt gtcctgatca 3000

tttccagctt caccctcgtt gctgcaaagt agttagtgac tagtcaagga ctagttgaaa 3060

tgggagaaga aactcacgaa ttctcgactc ccttagtatt gtggtccttg gacttggtgc 3120

tgctatatat tagctaatac actagttaga ctcacagaaa cttacgcagc tcgcttgcgc 3180

ttcttggtag gagtcggggt tgggagaaca gtgccttcaa acaagccttc ataccatgct 3240

acttgactag tcagggacta gtcaccaagt aatctagata ggacttgcct ttggcctcca 3300

tcagttcctt catagtggga ggaccattgt gcaatgtaaa ctccatgccg tgggagttct 3360

tgtccttcaa gtgcttgacc aatatgtttc tgttggcaga gggaacctgt caactagtta 3420

ataactagtc agaaactatg atagcagtag actcactgta cgcttgaggc atcccttcac 3480

tcggcagtag acttcatatg gatggatatc aggcacgcca ttgtcgtcct gtggactagt 3540

cagtaactag gcttaaagct agtcgggtcg gcttactatc ttgaaatccg gcagcgtaag 3600

ctccccgtcc ttaactgcct cgagatagtg acagtactct ggggactttc ggagatcgtt 3660

atcgttatcg cgaatgctcg gcatactaac tgttgactag tcttggacta gtcccgagca 3720

aaaaggattg gaggaggagg aggaaggtga gagtgagaca aagagcgaaa taagagcttc 3780

aaaggctatc tctaagcagt atgaaggtta agtatctagt tcttgactag atttaaagag 3840

atttcgacta gttatgtacc tggagtttgg atataggaat gtgttgtggt aacgaaatgt 3900

aagggggagg aaagaaaaag tcgtcaagag gtaactctaa gtcggccatt cctttttggg 3960

aggcgctaac cataaacggc atggtcgact tagagttagc tcagggaatt tagggagtta 4020

tctgcgacca ccgaggaacg gcggaatgcc aaagaatccc gatggagctc tagctggcgg 4080

ttgacaaccc caccttttgg cgtttctgcg gcgttgcagg cgggactgga tacttcgtag 4140

aaccagaaag gcaaggcaga acgcgctcag caagagtgtt ggaagtgata gcatgatgtg 4200

ccttgttaac taggtaccaa tctgcagtat gcttgatgtt atccaaagtg tgagagagga 4260

aggtccaaac atacacgatt gggagagggc ctaggtataa gagtttttga gtagaacgca 4320

tgtgagccca gccatctcga ggagattaaa cacgggccgg catttgatgg ctatgttagt 4380

accccaatgg aaacggtgag agtccagtgg tcgcagataa ctccctaaat tccctgagct 4440

aactctaagt cgaccatgcc gtttatggtt agcgcctccc aaaaaggaat ggccgactta 4500

gagttacctc ttgacgactt tttctttcct cccccttaca tttcgttacc acaacacatt 4560

cctatatcca aactccaggt acataactag tcgaaatctc tttaaatcta gtcaagaact 4620

agatacttaa ccttcatact gcttagagat agcctttgaa gctcttattt cgctctttgt 4680

ctcactctca ccttcctcct cctcctccaa tcctttttgc tcgggactag tccaagacta 4740

gtcaacagtt agtatgccga gcattcgcga taacgataac gatctccgaa agtccccaga 4800

gtactgtcac tatctcgagg cagttaagga cggggagctt acgctgccgg atttcaagat 4860

agtaagccga cccgactagc tttaagccta gttactgact agtccacagg acgacaatgg 4920

cgtgcctgat atccatccat atgaagtcta ctgccgagtg aagggatgcc tcaagcgtac 4980

agtgagtcta ctgctatcat agtttctgac tagttattaa ctagttgaca ggttccctct 5040

gccaacagaa acatattggt caagcacttg aaggacaaga actcccacgg catggagttt 5100

acattgcaca atggtcctcc cactatgaag gaactgatgg aggccaaagg caagtcctat 5160

ctagattact tggtgactag tccctgacta gtcaagtagc atggtatgaa ggcttgtttg 5220

aaggcactgt tctcccaacc ccgactccta ccaagaagcg caagcgagct gcgtaagttt 5280

ctgtgagtct aactagtgta ttagctaata tatagcagca ccaagtccaa ggaccacaat 5340

actaagggag tcgagaattc gtgagtttct tctcccattt caactagtcc ttgactagtc 5400

actaactact ttgcagcaac gagggtgaag ctggaaatga tcaggacaat ggcgagggcc 5460

cgtaagtaca gccattcaat gcagactagt tgctaactaa tctgtgacta gttcaagtgg 5520

tccgtacgcc gtgcataccc ctgtgactgg taggaatttg agcaagcctg tcttgccgcg 5580

cgatgagaaa ggaaaggcaa gttacattca gccccgtacc taggatcagt gctaatttat 5640

aacctctagc cactctttat ggcagatccg ccgtgagggt agcaaggcag ctaaatcagc 5700

tggtgagaaa ggaaccatac cctgcaagac ctgtcgcaac gcaaagggca aaggtaagct 5760

atccaagcta gtttgggact agattctaac tagtctcagc accgtgtggt tcaaagccat 5820

attgcgagtt ttggcgcttt ttctcatcga ttgacgaggc aaagggagcg agtatgcaac 5880

ctcgtaagtc agactcagac aaagaccaac tagttattga ccagtcttct agaaggctct 5940

gttgtggatc ttgaggccct ggagagttcc tccaacaatc cggagacaag caagtcctcg 6000

tcggactagt cactaactag actctaacta gttgcagaca tggataatgc aaaagagaca 6060

agcaatgaag aaagtggtaa gacatttctc ctttgtggtt ctggactagt ctttgactag 6120

tcacagtctt aaacaaggaa aatgagcatg aaaatgagga ggaaaaggct gctgagcccg 6180

aggaagtgca gggtgatggc agacatggta ggttaatacc ttgttagtta ttgctagtca 6240

ctgactagtc aataactagt ctctgaacac cttgcaatca ctccgtttgc gcagctgaac 6300

agtggtgagg ataatagtag taagttattc tagcttcaga gttataggag actagatact 6360

aactagtatt agttgcaact aacctggatc tcagagactt tggcctcaat ctagaatcta 6420

tctagttgtc aactagactg tggtatcatt gtcttttatt ttcctagtcc tggaactagc 6480

ttctaactag tctccctaat atgtggctgt cttgtttttt ttttttgttt ccctacccgg 6540

atatctagtc cccttctagg ttctgttaac ctctcgggct ctgatttagt ttaacgcaaa 6600

cctgagatta gtttctaact agtctctagg ttttctatcc acctttaatt gtaataataa 6660

atacaagcaa cgtttatacg tcaaaagcat ttataaactt ttaccctaaa gtagcttgct 6720

tgtgtgttta gtttataatt agtctcttat taatttgatg taggtaagcc cgccacaaat 6780

atatattttt acaagatacc gtggaaaaac ttcgtgctat cacaaaacag tatacaaaaa 6840

ataagcttaa caatctattc tccgcttggt gatgctaaag ggctttcaat agaccttgta 6900

agtgaaggag atggagccgt caatccgcta ccctgcctct ggtcagttgg tctcagcaat 6960

gtaccctgtg agtcttgata gactagttgg tgactagtct ctgtagatgg aacaaatggt 7020

gcttgagagg gcacgtatgg cagagctcca gtcatctgcg gaacatatac tgggcccggg 7080

aagatctcat ggtcatagct gtttccgtta attaatggtt cacttctctt tagaaatcaa 7140

ctgtgggttt tgctttttgc ttcattctct ttgtcttctc catctttgat caaatcctgg 7200

actttctcaa tccccagcta attcaatcat agtcagtttt ctatttttat tatttctttt 7260

tcttttgaaa tgtgattaac aaccagtccg ttatatatct tgtacccaga ttacgcccaa 7320

ctcgtgctcc tcagccacaa agatactcaa ttgatagcca agatacatac ataccacaaa 7380

gtaaggactc catgcattga gtattactca tcgtattcta gactactcca aaactcagca 7440

catagacaaa caatacgaac ctcgtctagg ggtgattcag aggcggcaaa gcggggtttt 7500

cgcatttgat gttcctggca cttatgtaag cccacgcttc ccgctcaact aaaccatcag 7560

ccaatcagac tgctcagatt tatcttttga agggtaaata aatcattgta aagaagaaca 7620

agtggcttgc ttgtcaagca atggcatcat tggtctagtg gtagaattcg tcgttgccat 7680

cgacgaggcc cgtgttcgat tcacggatga tgcaggaatt tctactcttg tagatacgat 7740

ggtgctgatg gctacttttt tttttgagca tttatcagct tgatatagag gtaggaatgt 7800

atggaggtgc agaatggcta ttttgttatt ggagcgggtt cgaaacggag ggcaggagac 7860

tttttctaaa tacgtcacgt gatatagagc tgctttaatt aacgagacag cagaatcacc 7920

gcccaagtta agcctttgtg ctgatcatgc tctcgaacgg gccaagttcg ggaaaagcaa 7980

aggagcgttt agtgaggggc aatttgactc acctcccagg caacagatga ggggggcaaa 8040

aagaaagaaa ttttcgtgag tcaatatgga ttccgagcat cattttcttg cggtctatct 8100

tgctacgtat gttgatcttg acgctgtgga tcaagcaacg ccactcgctc gctccatcgc 8160

aggctggtcg cagacaaatt aaaaggcggc aaactcgtac agccgcgggg ttgtccgctg 8220

caaagtacag agtgataaaa gccgccatgc gaccatcaac gcgttgatgc ccagcttttt 8280

cgatccgaga atccaccgta gaggcgatag caagtaaaga aaagctaaac aaaaaaaaat 8340

ttctgcccct aagccatgaa aacgagatgg ggtggagcag aaccaaggaa agagtcgcgc 8400

tgggctgccg ttccggaagg tgttgtaaag gctcgacgcc caaggtggga gtctaggaga 8460

agaatttgca tcgggagtgg ggcgggttac ccctccatat ccaatgacag atatctacca 8520

gccaagggtt tgagcccgcc cgcttagtca tcgtcctcgc ttgcccctcc ataaaaggat 8580

ttcccctccc cctcccacaa aattttcttt cccttcctct ccttgtccgc ttcagtacgt 8640

atatcttccc ttccctcgct tctctcctcc atccttcttt catccatctc ctgctaactt 8700

ctctgctcag cacctctacg cattactagc cgtagtatct gagcacttct cccttttata 8760

ttccacaaaa cataacacaa ccttcaccat gaacaacggc acaaacaact tccagaactt 8820

cattggaatc tcgtcgttgc agaagacttt gcgcaacgcc ctcatcccca cagaaactac 8880

ccagcagttc attgtgaaga acggaatcat caaggaagat gaactccgag gcgagaaccg 8940

ccagattttg aaggacatca tggatgatta ctaccgtggt ttcatctcgg aaacgctctc 9000

ctccattgac gacatcgatt ggacttcgtt gttcgaaaag atggaaatcc agctcaaaaa 9060

cggcgataac aaggatacct tgatcaagga gcagaccgag tatcggaagg cgatccataa 9120

gaagttcgcc aacgatgatc ggttcaagaa catgttctcg gccaagttga tttccgacat 9180

tctccccgaa ttcgtgatcc ataacaacaa ctactcggcg tcggagaagg aggagaagac 9240

gcaggtcatc aagttgttct cgaggttcgc cacatcgttc aaagactatt ttaagaatcg 9300

tgcgaactgt ttctcggcag atgatatctc ctcgtcctcc tgtcaccgca ttgtgaacga 9360

caacgcggaa atcttcttct cgaacgcgtt ggtgtatagg cgcatcgtga agtccctctc 9420

caacgatgac atcaacaaaa tctcgggaga tatgaaggat tcgctcaagg agatgtcgtt 9480

ggaggaaatc tactcctatg agaagtatgg cgagttcatt acgcaggagg gcatttcctt 9540

ctacaacgac atttgtggta aagtcaactc gttcatgaac ctctactgtc agaaaaacaa 9600

ggagaacaaa aacctctata agctccagaa gttgcataag cagatcctct gtatcgcaga 9660

cacctcgtac gaggtccctt acaagttcga atccgatgag gaggtctacc agtccgtcaa 9720

cggattcttg gacaacatct cctcgaaaca cattgtcgag cggctccgaa agatcggcga 9780

taactacaac ggctacaact tggacaaaat ctatatcgtc tccaagttct atgagtccgt 9840

ctcgcagaaa acctatcgtg attgggagac tatcaacact gcgctcgaga ttcactataa 9900

caacatcttg cctggtaacg gcaaatcgaa agccgacaag gtgaagaagg ccgtgaaaaa 9960

cgatctccag aagtcgatca cagaaatcaa cgaactcgtc tcgaactaca agctctgttc 10020

ggatgataac atcaaggcgg aaacgtacat ccatgaaatc tcgcatatct tgaacaactt 10080

cgaggcccag gaactcaaat acaaccccga gatccacttg gtcgagtcgg agctcaaagc 10140

ctcggagttg aagaacgtct tggatgtcat catgaacgca ttccactggt gttccgtgtt 10200

catgaccgag gaactcgtcg ataaagacaa caacttctac gcggaactcg aggaaatcta 10260

cgatgaaatc tatcccgtga tctccctcta caacctcgtg cgaaactacg tcactcagaa 10320

gccctattcc accaagaaga tcaagctcaa cttcggcatc cccactctcg cagacggttg 10380

gtcgaagtcg aaggagtact ccaacaacgc cattatcctc atgcgagaca acctctacta 10440

cttgggtatc ttcaacgcaa agaacaagcc ggataagaag atcattgaag gcaacacttc 10500

ggaaaacaag ggagactata agaagatgat ctacaacctc ctccctggac ccaacaagat 10560

gattcctaaa gtgttcctct cgtcgaagac tggtgtggaa acgtataagc cgtcggccta 10620

catcttggag ggctacaaac agaacaagca tatcaagtcc tcgaaggact tcgacatcac 10680

tttctgtcac gacctcatcg actatttcaa gaactgtatt gcaatccatc cggaatggaa 10740

gaacttcggc ttcgatttct cggatacttc gacatacgaa gatatctcgg gattctaccg 10800

agaggtcgaa ttgcagggct ataagattga ttggacctac atctcggaaa aggatatcga 10860

cttgctccag gaaaagggcc agctctacct cttccagatt tacaacaagg acttctccaa 10920

gaagtcgacg ggtaacgaca acttgcacac aatgtatctc aaaaacctct tctcggagga 10980

gaacttgaag gatatcgtgc tcaaattgaa cggagaggcc gaaatcttct tccgtaagtc 11040

ctccatcaag aacccgatca tccataagaa gggatcgatc ttggtcaacc ggacttacga 11100

agcagaggaa aaagatcagt tcggaaacat ccagattgtc aggaagaaca tccctgaaaa 11160

catctatcag gagttgtata agtacttcaa cgacaagtcg gataaggagc tctccgacga 11220

agcagccaaa ctcaagaacg tcgtcggaca ccatgaagca gcaaccaaca ttgtgaagga 11280

ctaccggtac acttacgaca agtacttctt gcacatgccg atcactatca acttcaaagc 11340

caacaagacc ggattcatta acgacaggat cctccagtac attgccaaag aaaaggacct 11400

ccatgtcatc ggtatcgata ggggagaacg gaacctcatc tacgtctccg tgattgacac 11460

ttgtggcaac attgtcgaac agaagtcgtt caacatcgtc aacggttacg attaccagat 11520

taagttgaaa cagcaggaag gtgcgaggca gattgcgcga aaggaatgga aggagattgg 11580

caaaatcaag gagattaagg aaggctactt gtcgttggtc atccacgaaa tctcgaaaat 11640

ggtgatcaaa tacaacgcca tcatcgccat ggaagacctc tcgtacggct tcaaaaaggg 11700

acggttcaaa gtggagcgtc aggtgtacca gaagttcgaa acaatgttga tcaacaagtt 11760

gaactacttg gtgttcaagg acatttccat taccgagaac ggaggattgc tcaagggtta 11820

tcagctcacg tacatccccg acaagttgaa aaacgtggga caccagtgtg gctgtatctt 11880

ctacgtgcct gcagcctaca cgtcgaaaat cgaccctaca acaggattcg tgaacatctt 11940

caagttcaag gatctcaccg tcgacgcgaa gcgggagttc atcaaaaagt tcgactccat 12000

ccgctatgat tcggagaaga acttgttctg tttcacattc gactacaaca acttcattac 12060

tcagaacacc gtgatgtcca aatcgtcgtg gtccgtgtac acgtatggtg tgcgcatcaa 12120

aaggcgcttc gtcaacggtc gcttctccaa cgaatcggac acgatcgata tcacgaaaga 12180

catggagaaa acattggaaa tgaccgacat caactggcgt gacggccatg acctcaggca 12240

ggacatcatc gattacgaga tcgtccagca catcttcgaa atcttccgtc tcaccgtgca 12300

gatgaggaac tccctctccg agctcgaaga tcgggattac gaccggctca tttcccctgt 12360

gttgaacgag aacaacatct tctacgactc ggcaaaagcg ggagatgcat tgccgaagga 12420

cgccgatgcg aacggtgcat attgtattgc actcaagggt ctctacgaaa tcaagcagat 12480

caccgaaaac tggaaggagg acggcaaatt ctcgagggac aagttgaaga tttcgaacaa 12540

ggattggttc gatttcatcc agaacaagag gtacttgcct ccgaagaaga agcgaaaggt 12600

gtgagcggac attcgattta tgccgttatg acttccttaa aaaagccttt acgaatgaaa 12660

gaaatggaat tagacttgtt atgtagttga ttctacaatg gattatgatt cctgaacttc 12720

aaatccgctg ttcattatta atctcagctc ttcccgtaaa gccaatgttg aaactattcg 12780

taaatgtacc tcgttttgcg tgtaccttgc ttatcacgtg atattacatg acctggacag 12840

agttctgcgc gaaagtcata acgtaaatcc cgggcggtag gtgcgtcccg ggcggaaggt 12900

agttttctcg tccaccccaa cgcgtttatc aacctcaact ttcaacaacc atcatgccac 12960

caaaagcgcg taaaacaaag cgagatttga ttgagcaaga gggcaggatc caatgcgcga 13020

ttcaagacat taaaaatgga aaatttcaaa aaattgcgcc cgcagcgcgt gcatacaaaa 13080

ttcatcccaa tactcctcgt gtactgtgta agcgcccact aggtaatatg acatgattac 13140

gaattcgagc tcggtacccg gccggggatc ctctagacgt ggagttacca gtgattgacc 13200

aatgttttat cttctacagt tctgcctgtc taccccattc tagctgtacc tgactacaga 13260

gtagtttaat tgtggttgac cccacagtcg gaggcggagg aatacagcac cgatgtggcc 13320

tgtctccatc cagattggca cgcaattttt acacgcggaa aagatcgaga tagagtacga 13380

ctttaaattt agtccccggc ggcttctatt ttagaatatt tgagatttga ttctcaagca 13440

attgatttgg ttgggtcacc ctcaattgga taatatacct cattgctcgg ctacttcaac 13500

tcatcaatca ccgtcatacc ccgcatataa ccctccattc ccacgatgtc gtccaagtcg 13560

caattgactt acggtgctcg agccagcaag caccccaatc ctctggcaaa gagacttttt 13620

gagattgccg aagcaaagaa gacaaacgtt accgtctctg ctgatgtgac gacaacccga 13680

gaactcctgg acctcgctga ccgtacggaa gctgttggat ccaatacata tgccgtctag 13740

caatggacta atcaactttt gatgatacag gtctcggtcc ctacatcgcc gtcatcaaga 13800

cacacatcga catcctcacc gatttcagcg tcgacactat caatggcctg aatgtgctgg 13860

ctcaaaagta caactttttg atcttcgagg accgcaaatt catcgacatc ggcaataccg 13920

tccagaagca ataccacggc ggtgctctga ggatctccga atgggcccac attatcaact 13980

gcagcgttct ccctggcgag ggcatcgtcg aggctctggc ccagaccgca tctgcgcaag 14040

acttccccta tggtcctgag agaggactgt tggtcctggc agagatgacc cccaaaggat 14100

cgctggctac gggcgagtat accaaggcat cggttgacta cgctcgcaaa tacaagaact 14160

tcgttatggg tttcgtgtcg acgcgggccc tgacggaagt gcagtcggat gtgtcttcag 14220

cctcggagga tgaagatttc gtggtcttca cgacgggtgt gaacctctct tccaaaggag 14280

ataagcttgg acagcaatac cagactcctg catcggctat tggacgcggt gccgacttta 14340

tcatcgccgg tcgaggcatc tacgctgctc ccgacccggt tgaagctgca cagcggtacc 14400

agaaagaagg ctgggaagct tatatggcca gagtatgcgg caagtcatga tttcctcttg 14460

gagcaaaagt gtagtgccag tacgagtgtt gtggaggaag gctgcataca ttgtgcctgt 14520

cattaaacga tgagctcgtc cgtattggcc cctgtaatgc catgttttcc gcccccaatc 14580

gtcaaggttt tccctttgtt agattcctac cagtcatcta gcaaggcggc cgcagctagc 14640

acaattgagg catccccact accgcattaa gacctcagcg cggccgcaaa tttaaataaa 14700

atgaagtgaa gttcctatac tttctagaga ataggaactt ctatagtgag tcgaataagg 14760

gcgacacaaa atttattcta aatgcataat aaatactgat aacatcttat agtttgtatt 14820

atattttgta ttatcgttga catgtataat tttgatatca aaaactgatt ttccctttat 14880

tattttcgag atttattttc ttaattctct ttaacaaact agaaatattg tatatacaaa 14940

aaatcataaa taatagatga atagtttaat tataggtgtt catcaatcga aaaagcaacg 15000

tatcttattt aaagtgcgtt gcttttttct catttataag gttaaataat tctcatatat 15060

caagcaaagt gacaggcgcc cttaaatatt ctgacaaatg ctctttccct aaactccccc 15120

cataaaaaaa cccgccgaag cgggttttta cgttatttgc ggattaacga ttactcgtta 15180

tcagaaccgc ccagggggcc cgagcttaag actggccgtc gttttacaac acagaaagag 15240

tttgtagaaa cgcaaaaagg ccatccgtca ggggccttct gcttagtttg atgcctggca 15300

gttccctact ctcgccttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc 15360

tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg 15420

ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 15480

ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac 15540

gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg 15600

gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct 15660

ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg 15720

tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct 15780

gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac 15840

tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt 15900

tcttgaagtg gtgggctaac tacggctaca ctagaagaac agtatttggt atctgcgctc 15960

tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 16020

ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 16080

ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gacgcgcgcg 16140

taactcacgt taagggattt tggtcatgag cttgcgccgt cccgtcaagt cagcgtaatg 16200

ctctgctt 16208

<210> 39

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 引物oAT4074

<400> 39

gtctggacga ttcccagaag ctgatgg 27

<210> 40

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 引物oAT4075

<400> 40

ctctgggatc gtgccgatac agacac 26

<210> 41

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物oAT4076

<400> 41

ccagcgtcag cgttgataca gcttg 25

<210> 42

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> 引物oAT4070

<400> 42

cgtggccatt tcctgtccag aaccgggaat tgcaacacat aagacgatgg tgctgatggc 60

tactgtagag cagatggaga gggtacaatc attctcaagc ggctggaaga cgctcaggcg 120

<210> 43

<211> 140

<212> DNA

<213> 人工序列

<220>

<223> 引物oAT4071

<400> 43

cgtggccatt tcctgtccag aaccgggaat tgcaacacat aagacgatgg tgctgatggc 60

tactgtagag cagatggagt gggtacaatc attctcaagg ggctggaaga cgctcaggcg 120

gacaacgatc caatcctcgg 140

<210> 44

<211> 160

<212> DNA

<213> 人工序列

<220>

<223> 引物oAT4072

<400> 44

cgtggccatt tcctgtccag aaccgggaat tgcaacacat aagacgatgg tgctgatggc 60

tactgtagag cagatggagt gggtacaatc attctcaagc ggctggaaga cgctcaggcc 120

gacaacgatc caatcctcgg tgtgatcaat ggagcctata 160

<210> 45

<211> 16354

<212> DNA

<213> 人工序列

<220>

<223> 质粒pGMEr263

<400> 45

gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60

tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120

ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180

ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240

ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300

agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360

tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420

ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480

tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540

accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600

gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660

ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720

atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780

cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840

gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900

acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960

aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020

gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080

gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140

gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200

taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260

catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320

gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380

tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440

ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500

gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560

tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620

gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680

gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740

cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800

tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860

ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920

actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980

cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040

agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100

tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160

taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220

tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280

cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340

caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400

gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460

tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520

taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580

tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640

tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700

ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760

atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820

actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880

gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940

ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000

gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060

aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120

gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180

ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240

caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300

gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360

aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420

taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480

acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540

tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600

tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660

actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720

aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780

ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840

aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900

gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960

gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020

aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080

ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140

gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200

gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260

tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320

aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380

aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440

aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500

gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560

tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620

ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680

tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740

caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800

gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860

gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920

gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980

gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040

aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100

cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160

aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220

actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280

ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340

tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400

agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460

taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520

tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580

gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640

caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700

gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760

tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820

agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880

gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940

ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000

tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060

cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120

tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180

cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240

ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300

atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360

catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420

gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480

aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540

tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600

gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660

gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720

ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780

ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840

gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900

caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960

caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020

ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080

aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140

ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200

gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260

cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320

ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380

actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440

gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500

aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560

ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620

cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680

ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740

ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800

cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860

tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920

tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980

tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040

gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100

tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160

actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220

ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280

atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340

gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400

gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460

aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520

tcgattcacg gatgatgcag gaatttctac tcttgtagat ctttttttgg ctcttgggtt 8580

cgaactgccc aaggcccatg ttttggtcat cttttttttt atgccccacc atttgggtca 8640

cccctgccaa tcattccatc tttgttccta cccttcacgt gtgctttccg aagccaaagt 8700

tcccattcaa caactctcct tgcgtttttt ttttcttgaa gcttgtcacc cgtcgatagt 8760

ttctgccatt tgcaatcgag acagcagaat caccgcccaa gttaagcctt tgtgctgatc 8820

atgctctcga acgggccaag ttcgggaaaa gcaaaggagc gtttagtgag gggcaatttg 8880

actcacctcc caggcaacag atgagggggg caaaaagaaa gaaattttcg tgagtcaata 8940

tggattccga gcatcatttt cttgcggtct atcttgctac gtatgttgat cttgacgctg 9000

tggatcaagc aacgccactc gctcgctcca tcgcaggctg gtcgcagaca aattaaaagg 9060

cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt acagagtgat aaaagccgcc 9120

atgcgaccat caacgcgttg atgcccagct ttttcgatcc gagaatccac cgtagaggcg 9180

atagcaagta aagaaaagct aaacaaaaaa aaatttctgc ccctaagcca tgaaaacgag 9240

atggggtgga gcagaaccaa ggaaagagtc gcgctgggct gccgttccgg aaggtgttgt 9300

aaaggctcga cgcccaaggt gggagtctag gagaagaatt tgcatcggga gtggggcggg 9360

ttacccctcc atatccaatg acagatatct accagccaag ggtttgagcc cgcccgctta 9420

gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc tccccctccc acaaaatttt 9480

ctttcccttc ctctccttgt ccgcttcagt acgtatatct tcccttccct cgcttctctc 9540

ctccatcctt ctttcatcca tctcctgcta acttctctgc tcagcacctc tacgcattac 9600

tagccgtagt atctgagcac ttctcccttt tatattccac aaaacataac acaaccttca 9660

ccatgaacaa cggcacaaac aacttccaga acttcattgg aatctcgtcg ttgcagaaga 9720

ctttgcgcaa cgccctcatc cccacagaaa ctacccagca gttcattgtg aagaacggaa 9780

tcatcaagga agatgaactc cgaggcgaga accgccagat tttgaaggac atcatggatg 9840

attactaccg tggtttcatc tcggaaacgc tctcctccat tgacgacatc gattggactt 9900

cgttgttcga aaagatggaa atccagctca aaaacggcga taacaaggat accttgatca 9960

aggagcagac cgagtatcgg aaggcgatcc ataagaagtt cgccaacgat gatcggttca 10020

agaacatgtt ctcggccaag ttgatttccg acattctccc cgaattcgtg atccataaca 10080

acaactactc ggcgtcggag aaggaggaga agacgcaggt catcaagttg ttctcgaggt 10140

tcgccacatc gttcaaagac tattttaaga atcgtgcgaa ctgtttctcg gcagatgata 10200

tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc ggaaatcttc ttctcgaacg 10260

cgttggtgta taggcgcatc gtgaagtccc tctccaacga tgacatcaac aaaatctcgg 10320

gagatatgaa ggattcgctc aaggagatgt cgttggagga aatctactcc tatgagaagt 10380

atggcgagtt cattacgcag gagggcattt ccttctacaa cgacatttgt ggtaaagtca 10440

actcgttcat gaacctctac tgtcagaaaa acaaggagaa caaaaacctc tataagctcc 10500

agaagttgca taagcagatc ctctgtatcg cagacacctc gtacgaggtc ccttacaagt 10560

tcgaatccga tgaggaggtc taccagtccg tcaacggatt cttggacaac atctcctcga 10620

aacacattgt cgagcggctc cgaaagatcg gcgataacta caacggctac aacttggaca 10680

aaatctatat cgtctccaag ttctatgagt ccgtctcgca gaaaacctat cgtgattggg 10740

agactatcaa cactgcgctc gagattcact ataacaacat cttgcctggt aacggcaaat 10800

cgaaagccga caaggtgaag aaggccgtga aaaacgatct ccagaagtcg atcacagaaa 10860

tcaacgaact cgtctcgaac tacaagctct gttcggatga taacatcaag gcggaaacgt 10920

acatccatga aatctcgcat atcttgaaca acttcgaggc ccaggaactc aaatacaacc 10980

ccgagatcca cttggtcgag tcggagctca aagcctcgga gttgaagaac gtcttggatg 11040

tcatcatgaa cgcattccac tggtgttccg tgttcatgac cgaggaactc gtcgataaag 11100

acaacaactt ctacgcggaa ctcgaggaaa tctacgatga aatctatccc gtgatctccc 11160

tctacaacct cgtgcgaaac tacgtcactc agaagcccta ttccaccaag aagatcaagc 11220

tcaacttcgg catccccact ctcgcagacg gttggtcgaa gtcgaaggag tactccaaca 11280

acgccattat cctcatgcga gacaacctct actacttggg tatcttcaac gcaaagaaca 11340

agccggataa gaagatcatt gaaggcaaca cttcggaaaa caagggagac tataagaaga 11400

tgatctacaa cctcctccct ggacccaaca agatgattcc taaagtgttc ctctcgtcga 11460

agactggtgt ggaaacgtat aagccgtcgg cctacatctt ggagggctac aaacagaaca 11520

agcatatcaa gtcctcgaag gacttcgaca tcactttctg tcacgacctc atcgactatt 11580

tcaagaactg tattgcaatc catccggaat ggaagaactt cggcttcgat ttctcggata 11640

cttcgacata cgaagatatc tcgggattct accgagaggt cgaattgcag ggctataaga 11700

ttgattggac ctacatctcg gaaaaggata tcgacttgct ccaggaaaag ggccagctct 11760

acctcttcca gatttacaac aaggacttct ccaagaagtc gacgggtaac gacaacttgc 11820

acacaatgta tctcaaaaac ctcttctcgg aggagaactt gaaggatatc gtgctcaaat 11880

tgaacggaga ggccgaaatc ttcttccgta agtcctccat caagaacccg atcatccata 11940

agaagggatc gatcttggtc aaccggactt acgaagcaga ggaaaaagat cagttcggaa 12000

acatccagat tgtcaggaag aacatccctg aaaacatcta tcaggagttg tataagtact 12060

tcaacgacaa gtcggataag gagctctccg acgaagcagc caaactcaag aacgtcgtcg 12120

gacaccatga agcagcaacc aacattgtga aggactaccg gtacacttac gacaagtact 12180

tcttgcacat gccgatcact atcaacttca aagccaacaa gaccggattc attaacgaca 12240

ggatcctcca gtacattgcc aaagaaaagg acctccatgt catcggtatc gataggggag 12300

aacggaacct catctacgtc tccgtgattg acacttgtgg caacattgtc gaacagaagt 12360

cgttcaacat cgtcaacggt tacgattacc agattaagtt gaaacagcag gaaggtgcga 12420

ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat caaggagatt aaggaaggct 12480

acttgtcgtt ggtcatccac gaaatctcga aaatggtgat caaatacaac gccatcatcg 12540

ccatggaaga cctctcgtac ggcttcaaaa agggacggtt caaagtggag cgtcaggtgt 12600

accagaagtt cgaaacaatg ttgatcaaca agttgaacta cttggtgttc aaggacattt 12660

ccattaccga gaacggagga ttgctcaagg gttatcagct cacgtacatc cccgacaagt 12720

tgaaaaacgt gggacaccag tgtggctgta tcttctacgt gcctgcagcc tacacgtcga 12780

aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt caaggatctc accgtcgacg 12840

cgaagcggga gttcatcaaa aagttcgact ccatccgcta tgattcggag aagaacttgt 12900

tctgtttcac attcgactac aacaacttca ttactcagaa caccgtgatg tccaaatcgt 12960

cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg cttcgtcaac ggtcgcttct 13020

ccaacgaatc ggacacgatc gatatcacga aagacatgga gaaaacattg gaaatgaccg 13080

acatcaactg gcgtgacggc catgacctca ggcaggacat catcgattac gagatcgtcc 13140

agcacatctt cgaaatcttc cgtctcaccg tgcagatgag gaactccctc tccgagctcg 13200

aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa cgagaacaac atcttctacg 13260

actcggcaaa agcgggagat gcattgccga aggacgccga tgcgaacggt gcatattgta 13320

ttgcactcaa gggtctctac gaaatcaagc agatcaccga aaactggaag gaggacggca 13380

aattctcgag ggacaagttg aagatttcga acaaggattg gttcgatttc atccagaaca 13440

agaggtactt gcctccgaag aagaagcgaa aggtgtgagc ggacattcga tttatgccgt 13500

tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg gaattagact tgttatgtag 13560

ttgattctac aatggattat gattcctgaa cttcaaatcc gctgttcatt attaatctca 13620

gctcttcccg taaagccaat gttgaaacta ttcgtaaatg tacctcgttt tgcgtgtacc 13680

ttgcttatca cgtgatatta catgacctgg acagagttct gcgcgaaagt cataacgtaa 13740

atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt ctcgtccacc ccaacgcgtt 13800

tatcaacctc aactttcaac aaccatcatg ccaccaaaag cgcgtaaaac aaagcgagat 13860

ttgattgagc aagagggcag gatggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 13920

tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 13980

ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 14040

tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 14100

ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 14160

ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 14220

gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 14280

gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 14340

cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 14400

ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 14460

tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg 14520

gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 14580

tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 14640

ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 14700

ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct 14760

ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 14820

accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 14880

tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 14940

cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat 15000

taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac 15060

caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 15120

gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt 15180

gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag 15240

ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 15300

attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 15360

gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 15420

tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt 15480

agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg 15540

gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg 15600

actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct 15660

tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc 15720

attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt 15780

tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt 15840

tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg 15900

aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat 15960

tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg 16020

cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat catgacatta 16080

acctataaaa ataggcgtat cacgaggccc tttcgtctcg cgcgtttcgg tgatgacggt 16140

gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta agcggatgcc 16200

gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg gggctggctt 16260

aactatgcgg catcagagca gattgtactg agagtgcacc atatgcggtg tgaaataccg 16320

cacagatgcg taaggagaaa ataccgcatc aggc 16354

<210> 46

<211> 93

<212> DNA

<213> 人工序列

<220>

<223> 原型间隔子寡核苷酸1228713

<400> 46

ttcacggatg atgcaggaat ttctactctt gtagatcgtt gaagccggat atgaagcttt 60

ttttggctct tgggttcgaa ctgcccaagg ccc 93

<210> 47

<211> 93

<212> DNA

<213> 人工序列

<220>

<223> 原型间隔子寡核苷酸1228715

<400> 47

ttcacggatg atgcaggaat ttctactctt gtagatgcga ggccatccgc ctggcgcttt 60

ttttggctct tgggttcgaa ctgcccaagg ccc 93

<210> 48

<211> 93

<212> DNA

<213> 人工序列

<220>

<223> 原型间隔子寡核苷酸1228717

<400> 48

ttcacggatg atgcaggaat ttctactctt gtagatcccc gaaggagaat ccgtctcttt 60

ttttggctct tgggttcgaa ctgcccaagg ccc 93

<210> 49

<211> 93

<212> DNA

<213> 人工序列

<220>

<223> 原型间隔子寡核苷酸1228719

<400> 49

ttcacggatg atgcaggaat ttctactctt gtagattgcg taattaccat gcgcagattt 60

ttttggctct tgggttcgaa ctgcccaagg ccc 93

<210> 50

<211> 93

<212> DNA

<213> 人工序列

<220>

<223> 原型间隔子寡核苷酸1228721

<400> 50

ttcacggatg atgcaggaat ttctactctt gtagattatc cctgcggata tgtatatttt 60

ttttggctct tgggttcgaa ctgcccaagg ccc 93

<210> 51

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物1228659

<400> 51

cttgcttgtc aagcaatggc 20

<210> 52

<211> 16374

<212> DNA

<213> 人工序列

<220>

<223> 质粒pGMEr263proto1

<400> 52

gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60

tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120

ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180

ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240

ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300

agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360

tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420

ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480

tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540

accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600

gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660

ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720

atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780

cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840

gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900

acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960

aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020

gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080

gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140

gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200

taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260

catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320

gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380

tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440

ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500

gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560

tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620

gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680

gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740

cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800

tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860

ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920

actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980

cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040

agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100

tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160

taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220

tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280

cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340

caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400

gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460

tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520

taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580

tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640

tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700

ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760

atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820

actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880

gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940

ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000

gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060

aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120

gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180

ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240

caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300

gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360

aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420

taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480

acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540

tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600

tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660

actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720

aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780

ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840

aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900

gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960

gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020

aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080

ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140

gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200

gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260

tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320

aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380

aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440

aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500

gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560

tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620

ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680

tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740

caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800

gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860

gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920

gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980

gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040

aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100

cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160

aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220

actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280

ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340

tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400

agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460

taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520

tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580

gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640

caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700

gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760

tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820

agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880

gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940

ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000

tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060

cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120

tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180

cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240

ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300

atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360

catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420

gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480

aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540

tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600

gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660

gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720

ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780

ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840

gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900

caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960

caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020

ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080

aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140

ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200

gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260

cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320

ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380

actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440

gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500

aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560

ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620

cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680

ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740

ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800

cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860

tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920

tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980

tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040

gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100

tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160

actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220

ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280

atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340

gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400

gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460

aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520

tcgattcacg gatgatgcag gaatttctac tcttgtagat cgttgaagcc ggatatgaag 8580

ctttttttgg ctcttgggtt cgaactgccc aaggcccatg ttttggtcat cttttttttt 8640

atgccccacc atttgggtca cccctgccaa tcattccatc tttgttccta cccttcacgt 8700

gtgctttccg aagccaaagt tcccattcaa caactctcct tgcgtttttt ttttcttgaa 8760

gcttgtcacc cgtcgatagt ttctgccatt tgcaatcgag acagcagaat caccgcccaa 8820

gttaagcctt tgtgctgatc atgctctcga acgggccaag ttcgggaaaa gcaaaggagc 8880

gtttagtgag gggcaatttg actcacctcc caggcaacag atgagggggg caaaaagaaa 8940

gaaattttcg tgagtcaata tggattccga gcatcatttt cttgcggtct atcttgctac 9000

gtatgttgat cttgacgctg tggatcaagc aacgccactc gctcgctcca tcgcaggctg 9060

gtcgcagaca aattaaaagg cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt 9120

acagagtgat aaaagccgcc atgcgaccat caacgcgttg atgcccagct ttttcgatcc 9180

gagaatccac cgtagaggcg atagcaagta aagaaaagct aaacaaaaaa aaatttctgc 9240

ccctaagcca tgaaaacgag atggggtgga gcagaaccaa ggaaagagtc gcgctgggct 9300

gccgttccgg aaggtgttgt aaaggctcga cgcccaaggt gggagtctag gagaagaatt 9360

tgcatcggga gtggggcggg ttacccctcc atatccaatg acagatatct accagccaag 9420

ggtttgagcc cgcccgctta gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc 9480

tccccctccc acaaaatttt ctttcccttc ctctccttgt ccgcttcagt acgtatatct 9540

tcccttccct cgcttctctc ctccatcctt ctttcatcca tctcctgcta acttctctgc 9600

tcagcacctc tacgcattac tagccgtagt atctgagcac ttctcccttt tatattccac 9660

aaaacataac acaaccttca ccatgaacaa cggcacaaac aacttccaga acttcattgg 9720

aatctcgtcg ttgcagaaga ctttgcgcaa cgccctcatc cccacagaaa ctacccagca 9780

gttcattgtg aagaacggaa tcatcaagga agatgaactc cgaggcgaga accgccagat 9840

tttgaaggac atcatggatg attactaccg tggtttcatc tcggaaacgc tctcctccat 9900

tgacgacatc gattggactt cgttgttcga aaagatggaa atccagctca aaaacggcga 9960

taacaaggat accttgatca aggagcagac cgagtatcgg aaggcgatcc ataagaagtt 10020

cgccaacgat gatcggttca agaacatgtt ctcggccaag ttgatttccg acattctccc 10080

cgaattcgtg atccataaca acaactactc ggcgtcggag aaggaggaga agacgcaggt 10140

catcaagttg ttctcgaggt tcgccacatc gttcaaagac tattttaaga atcgtgcgaa 10200

ctgtttctcg gcagatgata tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc 10260

ggaaatcttc ttctcgaacg cgttggtgta taggcgcatc gtgaagtccc tctccaacga 10320

tgacatcaac aaaatctcgg gagatatgaa ggattcgctc aaggagatgt cgttggagga 10380

aatctactcc tatgagaagt atggcgagtt cattacgcag gagggcattt ccttctacaa 10440

cgacatttgt ggtaaagtca actcgttcat gaacctctac tgtcagaaaa acaaggagaa 10500

caaaaacctc tataagctcc agaagttgca taagcagatc ctctgtatcg cagacacctc 10560

gtacgaggtc ccttacaagt tcgaatccga tgaggaggtc taccagtccg tcaacggatt 10620

cttggacaac atctcctcga aacacattgt cgagcggctc cgaaagatcg gcgataacta 10680

caacggctac aacttggaca aaatctatat cgtctccaag ttctatgagt ccgtctcgca 10740

gaaaacctat cgtgattggg agactatcaa cactgcgctc gagattcact ataacaacat 10800

cttgcctggt aacggcaaat cgaaagccga caaggtgaag aaggccgtga aaaacgatct 10860

ccagaagtcg atcacagaaa tcaacgaact cgtctcgaac tacaagctct gttcggatga 10920

taacatcaag gcggaaacgt acatccatga aatctcgcat atcttgaaca acttcgaggc 10980

ccaggaactc aaatacaacc ccgagatcca cttggtcgag tcggagctca aagcctcgga 11040

gttgaagaac gtcttggatg tcatcatgaa cgcattccac tggtgttccg tgttcatgac 11100

cgaggaactc gtcgataaag acaacaactt ctacgcggaa ctcgaggaaa tctacgatga 11160

aatctatccc gtgatctccc tctacaacct cgtgcgaaac tacgtcactc agaagcccta 11220

ttccaccaag aagatcaagc tcaacttcgg catccccact ctcgcagacg gttggtcgaa 11280

gtcgaaggag tactccaaca acgccattat cctcatgcga gacaacctct actacttggg 11340

tatcttcaac gcaaagaaca agccggataa gaagatcatt gaaggcaaca cttcggaaaa 11400

caagggagac tataagaaga tgatctacaa cctcctccct ggacccaaca agatgattcc 11460

taaagtgttc ctctcgtcga agactggtgt ggaaacgtat aagccgtcgg cctacatctt 11520

ggagggctac aaacagaaca agcatatcaa gtcctcgaag gacttcgaca tcactttctg 11580

tcacgacctc atcgactatt tcaagaactg tattgcaatc catccggaat ggaagaactt 11640

cggcttcgat ttctcggata cttcgacata cgaagatatc tcgggattct accgagaggt 11700

cgaattgcag ggctataaga ttgattggac ctacatctcg gaaaaggata tcgacttgct 11760

ccaggaaaag ggccagctct acctcttcca gatttacaac aaggacttct ccaagaagtc 11820

gacgggtaac gacaacttgc acacaatgta tctcaaaaac ctcttctcgg aggagaactt 11880

gaaggatatc gtgctcaaat tgaacggaga ggccgaaatc ttcttccgta agtcctccat 11940

caagaacccg atcatccata agaagggatc gatcttggtc aaccggactt acgaagcaga 12000

ggaaaaagat cagttcggaa acatccagat tgtcaggaag aacatccctg aaaacatcta 12060

tcaggagttg tataagtact tcaacgacaa gtcggataag gagctctccg acgaagcagc 12120

caaactcaag aacgtcgtcg gacaccatga agcagcaacc aacattgtga aggactaccg 12180

gtacacttac gacaagtact tcttgcacat gccgatcact atcaacttca aagccaacaa 12240

gaccggattc attaacgaca ggatcctcca gtacattgcc aaagaaaagg acctccatgt 12300

catcggtatc gataggggag aacggaacct catctacgtc tccgtgattg acacttgtgg 12360

caacattgtc gaacagaagt cgttcaacat cgtcaacggt tacgattacc agattaagtt 12420

gaaacagcag gaaggtgcga ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat 12480

caaggagatt aaggaaggct acttgtcgtt ggtcatccac gaaatctcga aaatggtgat 12540

caaatacaac gccatcatcg ccatggaaga cctctcgtac ggcttcaaaa agggacggtt 12600

caaagtggag cgtcaggtgt accagaagtt cgaaacaatg ttgatcaaca agttgaacta 12660

cttggtgttc aaggacattt ccattaccga gaacggagga ttgctcaagg gttatcagct 12720

cacgtacatc cccgacaagt tgaaaaacgt gggacaccag tgtggctgta tcttctacgt 12780

gcctgcagcc tacacgtcga aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt 12840

caaggatctc accgtcgacg cgaagcggga gttcatcaaa aagttcgact ccatccgcta 12900

tgattcggag aagaacttgt tctgtttcac attcgactac aacaacttca ttactcagaa 12960

caccgtgatg tccaaatcgt cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg 13020

cttcgtcaac ggtcgcttct ccaacgaatc ggacacgatc gatatcacga aagacatgga 13080

gaaaacattg gaaatgaccg acatcaactg gcgtgacggc catgacctca ggcaggacat 13140

catcgattac gagatcgtcc agcacatctt cgaaatcttc cgtctcaccg tgcagatgag 13200

gaactccctc tccgagctcg aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa 13260

cgagaacaac atcttctacg actcggcaaa agcgggagat gcattgccga aggacgccga 13320

tgcgaacggt gcatattgta ttgcactcaa gggtctctac gaaatcaagc agatcaccga 13380

aaactggaag gaggacggca aattctcgag ggacaagttg aagatttcga acaaggattg 13440

gttcgatttc atccagaaca agaggtactt gcctccgaag aagaagcgaa aggtgtgagc 13500

ggacattcga tttatgccgt tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg 13560

gaattagact tgttatgtag ttgattctac aatggattat gattcctgaa cttcaaatcc 13620

gctgttcatt attaatctca gctcttcccg taaagccaat gttgaaacta ttcgtaaatg 13680

tacctcgttt tgcgtgtacc ttgcttatca cgtgatatta catgacctgg acagagttct 13740

gcgcgaaagt cataacgtaa atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt 13800

ctcgtccacc ccaacgcgtt tatcaacctc aactttcaac aaccatcatg ccaccaaaag 13860

cgcgtaaaac aaagcgagat ttgattgagc aagagggcag gatggcgtaa tcatggtcat 13920

agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 13980

gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 14040

gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 14100

aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 14160

cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 14220

ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 14280

aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 14340

acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 14400

gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 14460

ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 14520

gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 14580

cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 14640

taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 14700

atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 14760

cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 14820

cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 14880

ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 14940

ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 15000

tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 15060

aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 15120

tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 15180

gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 15240

atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 15300

tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 15360

ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 15420

ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 15480

tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 15540

ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 15600

ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 15660

tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 15720

gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 15780

taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 15840

cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 15900

agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 15960

gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 16020

ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 16080

ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg 16140

cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 16200

cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 16260

gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg agagtgcacc 16320

atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggc 16374

<210> 53

<211> 16374

<212> DNA

<213> 人工序列

<220>

<223> 质粒pGMEr263proto2

<400> 53

gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60

tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120

ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180

ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240

ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300

agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360

tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420

ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480

tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540

accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600

gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660

ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720

atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780

cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840

gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900

acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960

aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020

gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080

gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140

gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200

taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260

catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320

gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380

tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440

ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500

gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560

tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620

gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680

gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740

cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800

tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860

ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920

actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980

cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040

agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100

tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160

taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220

tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280

cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340

caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400

gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460

tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520

taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580

tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640

tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700

ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760

atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820

actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880

gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940

ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000

gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060

aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120

gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180

ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240

caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300

gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360

aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420

taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480

acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540

tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600

tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660

actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720

aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780

ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840

aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900

gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960

gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020

aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080

ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140

gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200

gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260

tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320

aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380

aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440

aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500

gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560

tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620

ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680

tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740

caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800

gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860

gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920

gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980

gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040

aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100

cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160

aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220

actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280

ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340

tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400

agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460

taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520

tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580

gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640

caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700

gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760

tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820

agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880

gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940

ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000

tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060

cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120

tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180

cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240

ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300

atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360

catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420

gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480

aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540

tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600

gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660

gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720

ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780

ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840

gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900

caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960

caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020

ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080

aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140

ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200

gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260

cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320

ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380

actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440

gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500

aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560

ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620

cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680

ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740

ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800

cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860

tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920

tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980

tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040

gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100

tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160

actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220

ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280

atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340

gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400

gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460

aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520

tcgattcacg gatgatgcag gaatttctac tcttgtagat gcgaggccat ccgcctggcg 8580

ctttttttgg ctcttgggtt cgaactgccc aaggcccatg ttttggtcat cttttttttt 8640

atgccccacc atttgggtca cccctgccaa tcattccatc tttgttccta cccttcacgt 8700

gtgctttccg aagccaaagt tcccattcaa caactctcct tgcgtttttt ttttcttgaa 8760

gcttgtcacc cgtcgatagt ttctgccatt tgcaatcgag acagcagaat caccgcccaa 8820

gttaagcctt tgtgctgatc atgctctcga acgggccaag ttcgggaaaa gcaaaggagc 8880

gtttagtgag gggcaatttg actcacctcc caggcaacag atgagggggg caaaaagaaa 8940

gaaattttcg tgagtcaata tggattccga gcatcatttt cttgcggtct atcttgctac 9000

gtatgttgat cttgacgctg tggatcaagc aacgccactc gctcgctcca tcgcaggctg 9060

gtcgcagaca aattaaaagg cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt 9120

acagagtgat aaaagccgcc atgcgaccat caacgcgttg atgcccagct ttttcgatcc 9180

gagaatccac cgtagaggcg atagcaagta aagaaaagct aaacaaaaaa aaatttctgc 9240

ccctaagcca tgaaaacgag atggggtgga gcagaaccaa ggaaagagtc gcgctgggct 9300

gccgttccgg aaggtgttgt aaaggctcga cgcccaaggt gggagtctag gagaagaatt 9360

tgcatcggga gtggggcggg ttacccctcc atatccaatg acagatatct accagccaag 9420

ggtttgagcc cgcccgctta gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc 9480

tccccctccc acaaaatttt ctttcccttc ctctccttgt ccgcttcagt acgtatatct 9540

tcccttccct cgcttctctc ctccatcctt ctttcatcca tctcctgcta acttctctgc 9600

tcagcacctc tacgcattac tagccgtagt atctgagcac ttctcccttt tatattccac 9660

aaaacataac acaaccttca ccatgaacaa cggcacaaac aacttccaga acttcattgg 9720

aatctcgtcg ttgcagaaga ctttgcgcaa cgccctcatc cccacagaaa ctacccagca 9780

gttcattgtg aagaacggaa tcatcaagga agatgaactc cgaggcgaga accgccagat 9840

tttgaaggac atcatggatg attactaccg tggtttcatc tcggaaacgc tctcctccat 9900

tgacgacatc gattggactt cgttgttcga aaagatggaa atccagctca aaaacggcga 9960

taacaaggat accttgatca aggagcagac cgagtatcgg aaggcgatcc ataagaagtt 10020

cgccaacgat gatcggttca agaacatgtt ctcggccaag ttgatttccg acattctccc 10080

cgaattcgtg atccataaca acaactactc ggcgtcggag aaggaggaga agacgcaggt 10140

catcaagttg ttctcgaggt tcgccacatc gttcaaagac tattttaaga atcgtgcgaa 10200

ctgtttctcg gcagatgata tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc 10260

ggaaatcttc ttctcgaacg cgttggtgta taggcgcatc gtgaagtccc tctccaacga 10320

tgacatcaac aaaatctcgg gagatatgaa ggattcgctc aaggagatgt cgttggagga 10380

aatctactcc tatgagaagt atggcgagtt cattacgcag gagggcattt ccttctacaa 10440

cgacatttgt ggtaaagtca actcgttcat gaacctctac tgtcagaaaa acaaggagaa 10500

caaaaacctc tataagctcc agaagttgca taagcagatc ctctgtatcg cagacacctc 10560

gtacgaggtc ccttacaagt tcgaatccga tgaggaggtc taccagtccg tcaacggatt 10620

cttggacaac atctcctcga aacacattgt cgagcggctc cgaaagatcg gcgataacta 10680

caacggctac aacttggaca aaatctatat cgtctccaag ttctatgagt ccgtctcgca 10740

gaaaacctat cgtgattggg agactatcaa cactgcgctc gagattcact ataacaacat 10800

cttgcctggt aacggcaaat cgaaagccga caaggtgaag aaggccgtga aaaacgatct 10860

ccagaagtcg atcacagaaa tcaacgaact cgtctcgaac tacaagctct gttcggatga 10920

taacatcaag gcggaaacgt acatccatga aatctcgcat atcttgaaca acttcgaggc 10980

ccaggaactc aaatacaacc ccgagatcca cttggtcgag tcggagctca aagcctcgga 11040

gttgaagaac gtcttggatg tcatcatgaa cgcattccac tggtgttccg tgttcatgac 11100

cgaggaactc gtcgataaag acaacaactt ctacgcggaa ctcgaggaaa tctacgatga 11160

aatctatccc gtgatctccc tctacaacct cgtgcgaaac tacgtcactc agaagcccta 11220

ttccaccaag aagatcaagc tcaacttcgg catccccact ctcgcagacg gttggtcgaa 11280

gtcgaaggag tactccaaca acgccattat cctcatgcga gacaacctct actacttggg 11340

tatcttcaac gcaaagaaca agccggataa gaagatcatt gaaggcaaca cttcggaaaa 11400

caagggagac tataagaaga tgatctacaa cctcctccct ggacccaaca agatgattcc 11460

taaagtgttc ctctcgtcga agactggtgt ggaaacgtat aagccgtcgg cctacatctt 11520

ggagggctac aaacagaaca agcatatcaa gtcctcgaag gacttcgaca tcactttctg 11580

tcacgacctc atcgactatt tcaagaactg tattgcaatc catccggaat ggaagaactt 11640

cggcttcgat ttctcggata cttcgacata cgaagatatc tcgggattct accgagaggt 11700

cgaattgcag ggctataaga ttgattggac ctacatctcg gaaaaggata tcgacttgct 11760

ccaggaaaag ggccagctct acctcttcca gatttacaac aaggacttct ccaagaagtc 11820

gacgggtaac gacaacttgc acacaatgta tctcaaaaac ctcttctcgg aggagaactt 11880

gaaggatatc gtgctcaaat tgaacggaga ggccgaaatc ttcttccgta agtcctccat 11940

caagaacccg atcatccata agaagggatc gatcttggtc aaccggactt acgaagcaga 12000

ggaaaaagat cagttcggaa acatccagat tgtcaggaag aacatccctg aaaacatcta 12060

tcaggagttg tataagtact tcaacgacaa gtcggataag gagctctccg acgaagcagc 12120

caaactcaag aacgtcgtcg gacaccatga agcagcaacc aacattgtga aggactaccg 12180

gtacacttac gacaagtact tcttgcacat gccgatcact atcaacttca aagccaacaa 12240

gaccggattc attaacgaca ggatcctcca gtacattgcc aaagaaaagg acctccatgt 12300

catcggtatc gataggggag aacggaacct catctacgtc tccgtgattg acacttgtgg 12360

caacattgtc gaacagaagt cgttcaacat cgtcaacggt tacgattacc agattaagtt 12420

gaaacagcag gaaggtgcga ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat 12480

caaggagatt aaggaaggct acttgtcgtt ggtcatccac gaaatctcga aaatggtgat 12540

caaatacaac gccatcatcg ccatggaaga cctctcgtac ggcttcaaaa agggacggtt 12600

caaagtggag cgtcaggtgt accagaagtt cgaaacaatg ttgatcaaca agttgaacta 12660

cttggtgttc aaggacattt ccattaccga gaacggagga ttgctcaagg gttatcagct 12720

cacgtacatc cccgacaagt tgaaaaacgt gggacaccag tgtggctgta tcttctacgt 12780

gcctgcagcc tacacgtcga aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt 12840

caaggatctc accgtcgacg cgaagcggga gttcatcaaa aagttcgact ccatccgcta 12900

tgattcggag aagaacttgt tctgtttcac attcgactac aacaacttca ttactcagaa 12960

caccgtgatg tccaaatcgt cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg 13020

cttcgtcaac ggtcgcttct ccaacgaatc ggacacgatc gatatcacga aagacatgga 13080

gaaaacattg gaaatgaccg acatcaactg gcgtgacggc catgacctca ggcaggacat 13140

catcgattac gagatcgtcc agcacatctt cgaaatcttc cgtctcaccg tgcagatgag 13200

gaactccctc tccgagctcg aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa 13260

cgagaacaac atcttctacg actcggcaaa agcgggagat gcattgccga aggacgccga 13320

tgcgaacggt gcatattgta ttgcactcaa gggtctctac gaaatcaagc agatcaccga 13380

aaactggaag gaggacggca aattctcgag ggacaagttg aagatttcga acaaggattg 13440

gttcgatttc atccagaaca agaggtactt gcctccgaag aagaagcgaa aggtgtgagc 13500

ggacattcga tttatgccgt tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg 13560

gaattagact tgttatgtag ttgattctac aatggattat gattcctgaa cttcaaatcc 13620

gctgttcatt attaatctca gctcttcccg taaagccaat gttgaaacta ttcgtaaatg 13680

tacctcgttt tgcgtgtacc ttgcttatca cgtgatatta catgacctgg acagagttct 13740

gcgcgaaagt cataacgtaa atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt 13800

ctcgtccacc ccaacgcgtt tatcaacctc aactttcaac aaccatcatg ccaccaaaag 13860

cgcgtaaaac aaagcgagat ttgattgagc aagagggcag gatggcgtaa tcatggtcat 13920

agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 13980

gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 14040

gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 14100

aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 14160

cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 14220

ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 14280

aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 14340

acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 14400

gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 14460

ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 14520

gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 14580

cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 14640

taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 14700

atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 14760

cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 14820

cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 14880

ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 14940

ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 15000

tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 15060

aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 15120

tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 15180

gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 15240

atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 15300

tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 15360

ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 15420

ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 15480

tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 15540

ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 15600

ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 15660

tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 15720

gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 15780

taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 15840

cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 15900

agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 15960

gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 16020

ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 16080

ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg 16140

cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 16200

cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 16260

gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg agagtgcacc 16320

atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggc 16374

<210> 54

<211> 16374

<212> DNA

<213> 人工序列

<220>

<223> 质粒pGMEr263proto3

<400> 54

gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60

tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120

ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180

ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240

ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300

agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360

tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420

ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480

tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540

accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600

gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660

ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720

atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780

cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840

gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900

acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960

aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020

gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080

gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140

gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200

taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260

catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320

gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380

tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440

ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500

gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560

tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620

gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680

gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740

cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800

tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860

ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920

actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980

cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040

agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100

tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160

taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220

tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280

cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340

caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400

gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460

tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520

taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580

tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640

tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700

ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760

atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820

actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880

gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940

ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000

gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060

aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120

gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180

ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240

caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300

gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360

aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420

taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480

acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540

tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600

tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660

actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720

aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780

ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840

aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900

gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960

gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020

aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080

ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140

gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200

gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260

tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320

aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380

aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440

aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500

gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560

tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620

ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680

tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740

caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800

gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860

gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920

gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980

gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040

aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100

cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160

aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220

actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280

ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340

tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400

agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460

taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520

tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580

gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640

caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700

gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760

tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820

agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880

gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940

ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000

tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060

cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120

tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180

cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240

ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300

atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360

catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420

gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480

aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540

tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600

gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660

gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720

ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780

ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840

gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900

caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960

caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020

ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080

aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140

ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200

gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260

cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320

ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380

actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440

gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500

aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560

ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620

cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680

ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740

ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800

cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860

tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920

tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980

tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040

gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100

tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160

actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220

ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280

atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340

gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400

gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460

aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520

tcgattcacg gatgatgcag gaatttctac tcttgtagat ccccgaagga gaatccgtct 8580

ctttttttgg ctcttgggtt cgaactgccc aaggcccatg ttttggtcat cttttttttt 8640

atgccccacc atttgggtca cccctgccaa tcattccatc tttgttccta cccttcacgt 8700

gtgctttccg aagccaaagt tcccattcaa caactctcct tgcgtttttt ttttcttgaa 8760

gcttgtcacc cgtcgatagt ttctgccatt tgcaatcgag acagcagaat caccgcccaa 8820

gttaagcctt tgtgctgatc atgctctcga acgggccaag ttcgggaaaa gcaaaggagc 8880

gtttagtgag gggcaatttg actcacctcc caggcaacag atgagggggg caaaaagaaa 8940

gaaattttcg tgagtcaata tggattccga gcatcatttt cttgcggtct atcttgctac 9000

gtatgttgat cttgacgctg tggatcaagc aacgccactc gctcgctcca tcgcaggctg 9060

gtcgcagaca aattaaaagg cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt 9120

acagagtgat aaaagccgcc atgcgaccat caacgcgttg atgcccagct ttttcgatcc 9180

gagaatccac cgtagaggcg atagcaagta aagaaaagct aaacaaaaaa aaatttctgc 9240

ccctaagcca tgaaaacgag atggggtgga gcagaaccaa ggaaagagtc gcgctgggct 9300

gccgttccgg aaggtgttgt aaaggctcga cgcccaaggt gggagtctag gagaagaatt 9360

tgcatcggga gtggggcggg ttacccctcc atatccaatg acagatatct accagccaag 9420

ggtttgagcc cgcccgctta gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc 9480

tccccctccc acaaaatttt ctttcccttc ctctccttgt ccgcttcagt acgtatatct 9540

tcccttccct cgcttctctc ctccatcctt ctttcatcca tctcctgcta acttctctgc 9600

tcagcacctc tacgcattac tagccgtagt atctgagcac ttctcccttt tatattccac 9660

aaaacataac acaaccttca ccatgaacaa cggcacaaac aacttccaga acttcattgg 9720

aatctcgtcg ttgcagaaga ctttgcgcaa cgccctcatc cccacagaaa ctacccagca 9780

gttcattgtg aagaacggaa tcatcaagga agatgaactc cgaggcgaga accgccagat 9840

tttgaaggac atcatggatg attactaccg tggtttcatc tcggaaacgc tctcctccat 9900

tgacgacatc gattggactt cgttgttcga aaagatggaa atccagctca aaaacggcga 9960

taacaaggat accttgatca aggagcagac cgagtatcgg aaggcgatcc ataagaagtt 10020

cgccaacgat gatcggttca agaacatgtt ctcggccaag ttgatttccg acattctccc 10080

cgaattcgtg atccataaca acaactactc ggcgtcggag aaggaggaga agacgcaggt 10140

catcaagttg ttctcgaggt tcgccacatc gttcaaagac tattttaaga atcgtgcgaa 10200

ctgtttctcg gcagatgata tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc 10260

ggaaatcttc ttctcgaacg cgttggtgta taggcgcatc gtgaagtccc tctccaacga 10320

tgacatcaac aaaatctcgg gagatatgaa ggattcgctc aaggagatgt cgttggagga 10380

aatctactcc tatgagaagt atggcgagtt cattacgcag gagggcattt ccttctacaa 10440

cgacatttgt ggtaaagtca actcgttcat gaacctctac tgtcagaaaa acaaggagaa 10500

caaaaacctc tataagctcc agaagttgca taagcagatc ctctgtatcg cagacacctc 10560

gtacgaggtc ccttacaagt tcgaatccga tgaggaggtc taccagtccg tcaacggatt 10620

cttggacaac atctcctcga aacacattgt cgagcggctc cgaaagatcg gcgataacta 10680

caacggctac aacttggaca aaatctatat cgtctccaag ttctatgagt ccgtctcgca 10740

gaaaacctat cgtgattggg agactatcaa cactgcgctc gagattcact ataacaacat 10800

cttgcctggt aacggcaaat cgaaagccga caaggtgaag aaggccgtga aaaacgatct 10860

ccagaagtcg atcacagaaa tcaacgaact cgtctcgaac tacaagctct gttcggatga 10920

taacatcaag gcggaaacgt acatccatga aatctcgcat atcttgaaca acttcgaggc 10980

ccaggaactc aaatacaacc ccgagatcca cttggtcgag tcggagctca aagcctcgga 11040

gttgaagaac gtcttggatg tcatcatgaa cgcattccac tggtgttccg tgttcatgac 11100

cgaggaactc gtcgataaag acaacaactt ctacgcggaa ctcgaggaaa tctacgatga 11160

aatctatccc gtgatctccc tctacaacct cgtgcgaaac tacgtcactc agaagcccta 11220

ttccaccaag aagatcaagc tcaacttcgg catccccact ctcgcagacg gttggtcgaa 11280

gtcgaaggag tactccaaca acgccattat cctcatgcga gacaacctct actacttggg 11340

tatcttcaac gcaaagaaca agccggataa gaagatcatt gaaggcaaca cttcggaaaa 11400

caagggagac tataagaaga tgatctacaa cctcctccct ggacccaaca agatgattcc 11460

taaagtgttc ctctcgtcga agactggtgt ggaaacgtat aagccgtcgg cctacatctt 11520

ggagggctac aaacagaaca agcatatcaa gtcctcgaag gacttcgaca tcactttctg 11580

tcacgacctc atcgactatt tcaagaactg tattgcaatc catccggaat ggaagaactt 11640

cggcttcgat ttctcggata cttcgacata cgaagatatc tcgggattct accgagaggt 11700

cgaattgcag ggctataaga ttgattggac ctacatctcg gaaaaggata tcgacttgct 11760

ccaggaaaag ggccagctct acctcttcca gatttacaac aaggacttct ccaagaagtc 11820

gacgggtaac gacaacttgc acacaatgta tctcaaaaac ctcttctcgg aggagaactt 11880

gaaggatatc gtgctcaaat tgaacggaga ggccgaaatc ttcttccgta agtcctccat 11940

caagaacccg atcatccata agaagggatc gatcttggtc aaccggactt acgaagcaga 12000

ggaaaaagat cagttcggaa acatccagat tgtcaggaag aacatccctg aaaacatcta 12060

tcaggagttg tataagtact tcaacgacaa gtcggataag gagctctccg acgaagcagc 12120

caaactcaag aacgtcgtcg gacaccatga agcagcaacc aacattgtga aggactaccg 12180

gtacacttac gacaagtact tcttgcacat gccgatcact atcaacttca aagccaacaa 12240

gaccggattc attaacgaca ggatcctcca gtacattgcc aaagaaaagg acctccatgt 12300

catcggtatc gataggggag aacggaacct catctacgtc tccgtgattg acacttgtgg 12360

caacattgtc gaacagaagt cgttcaacat cgtcaacggt tacgattacc agattaagtt 12420

gaaacagcag gaaggtgcga ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat 12480

caaggagatt aaggaaggct acttgtcgtt ggtcatccac gaaatctcga aaatggtgat 12540

caaatacaac gccatcatcg ccatggaaga cctctcgtac ggcttcaaaa agggacggtt 12600

caaagtggag cgtcaggtgt accagaagtt cgaaacaatg ttgatcaaca agttgaacta 12660

cttggtgttc aaggacattt ccattaccga gaacggagga ttgctcaagg gttatcagct 12720

cacgtacatc cccgacaagt tgaaaaacgt gggacaccag tgtggctgta tcttctacgt 12780

gcctgcagcc tacacgtcga aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt 12840

caaggatctc accgtcgacg cgaagcggga gttcatcaaa aagttcgact ccatccgcta 12900

tgattcggag aagaacttgt tctgtttcac attcgactac aacaacttca ttactcagaa 12960

caccgtgatg tccaaatcgt cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg 13020

cttcgtcaac ggtcgcttct ccaacgaatc ggacacgatc gatatcacga aagacatgga 13080

gaaaacattg gaaatgaccg acatcaactg gcgtgacggc catgacctca ggcaggacat 13140

catcgattac gagatcgtcc agcacatctt cgaaatcttc cgtctcaccg tgcagatgag 13200

gaactccctc tccgagctcg aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa 13260

cgagaacaac atcttctacg actcggcaaa agcgggagat gcattgccga aggacgccga 13320

tgcgaacggt gcatattgta ttgcactcaa gggtctctac gaaatcaagc agatcaccga 13380

aaactggaag gaggacggca aattctcgag ggacaagttg aagatttcga acaaggattg 13440

gttcgatttc atccagaaca agaggtactt gcctccgaag aagaagcgaa aggtgtgagc 13500

ggacattcga tttatgccgt tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg 13560

gaattagact tgttatgtag ttgattctac aatggattat gattcctgaa cttcaaatcc 13620

gctgttcatt attaatctca gctcttcccg taaagccaat gttgaaacta ttcgtaaatg 13680

tacctcgttt tgcgtgtacc ttgcttatca cgtgatatta catgacctgg acagagttct 13740

gcgcgaaagt cataacgtaa atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt 13800

ctcgtccacc ccaacgcgtt tatcaacctc aactttcaac aaccatcatg ccaccaaaag 13860

cgcgtaaaac aaagcgagat ttgattgagc aagagggcag gatggcgtaa tcatggtcat 13920

agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 13980

gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 14040

gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 14100

aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 14160

cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 14220

ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 14280

aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 14340

acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 14400

gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 14460

ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 14520

gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 14580

cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 14640

taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 14700

atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 14760

cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 14820

cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 14880

ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 14940

ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 15000

tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 15060

aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 15120

tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 15180

gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 15240

atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 15300

tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 15360

ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 15420

ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 15480

tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 15540

ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 15600

ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 15660

tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 15720

gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 15780

taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 15840

cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 15900

agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 15960

gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 16020

ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 16080

ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg 16140

cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 16200

cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 16260

gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg agagtgcacc 16320

atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggc 16374

<210> 55

<211> 16374

<212> DNA

<213> 人工序列

<220>

<223> 质粒pGMEr263proto4

<400> 55

gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60

tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120

ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180

ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240

ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300

agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360

tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420

ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480

tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540

accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600

gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660

ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720

atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780

cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840

gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900

acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960

aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020

gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080

gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140

gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200

taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260

catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320

gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380

tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440

ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500

gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560

tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620

gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680

gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740

cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800

tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860

ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920

actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980

cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040

agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100

tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160

taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220

tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280

cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340

caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400

gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460

tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520

taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580

tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640

tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700

ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760

atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820

actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880

gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940

ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000

gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060

aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120

gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180

ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240

caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300

gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360

aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420

taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480

acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540

tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600

tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660

actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720

aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780

ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840

aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900

gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960

gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020

aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080

ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140

gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200

gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260

tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320

aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380

aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440

aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500

gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560

tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620

ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680

tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740

caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800

gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860

gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920

gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980

gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040

aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100

cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160

aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220

actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280

ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340

tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400

agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460

taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520

tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580

gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640

caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700

gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760

tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820

agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880

gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940

ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000

tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060

cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120

tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180

cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240

ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300

atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360

catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420

gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480

aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540

tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600

gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660

gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720

ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780

ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840

gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900

caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960

caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020

ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080

aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140

ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200

gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260

cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320

ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380

actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440

gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500

aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560

ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620

cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680

ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740

ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800

cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860

tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920

tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980

tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040

gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100

tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160

actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220

ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280

atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340

gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400

gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460

aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520

tcgattcacg gatgatgcag gaatttctac tcttgtagat tgcgtaatta ccatgcgcag 8580

atttttttgg ctcttgggtt cgaactgccc aaggcccatg ttttggtcat cttttttttt 8640

atgccccacc atttgggtca cccctgccaa tcattccatc tttgttccta cccttcacgt 8700

gtgctttccg aagccaaagt tcccattcaa caactctcct tgcgtttttt ttttcttgaa 8760

gcttgtcacc cgtcgatagt ttctgccatt tgcaatcgag acagcagaat caccgcccaa 8820

gttaagcctt tgtgctgatc atgctctcga acgggccaag ttcgggaaaa gcaaaggagc 8880

gtttagtgag gggcaatttg actcacctcc caggcaacag atgagggggg caaaaagaaa 8940

gaaattttcg tgagtcaata tggattccga gcatcatttt cttgcggtct atcttgctac 9000

gtatgttgat cttgacgctg tggatcaagc aacgccactc gctcgctcca tcgcaggctg 9060

gtcgcagaca aattaaaagg cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt 9120

acagagtgat aaaagccgcc atgcgaccat caacgcgttg atgcccagct ttttcgatcc 9180

gagaatccac cgtagaggcg atagcaagta aagaaaagct aaacaaaaaa aaatttctgc 9240

ccctaagcca tgaaaacgag atggggtgga gcagaaccaa ggaaagagtc gcgctgggct 9300

gccgttccgg aaggtgttgt aaaggctcga cgcccaaggt gggagtctag gagaagaatt 9360

tgcatcggga gtggggcggg ttacccctcc atatccaatg acagatatct accagccaag 9420

ggtttgagcc cgcccgctta gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc 9480

tccccctccc acaaaatttt ctttcccttc ctctccttgt ccgcttcagt acgtatatct 9540

tcccttccct cgcttctctc ctccatcctt ctttcatcca tctcctgcta acttctctgc 9600

tcagcacctc tacgcattac tagccgtagt atctgagcac ttctcccttt tatattccac 9660

aaaacataac acaaccttca ccatgaacaa cggcacaaac aacttccaga acttcattgg 9720

aatctcgtcg ttgcagaaga ctttgcgcaa cgccctcatc cccacagaaa ctacccagca 9780

gttcattgtg aagaacggaa tcatcaagga agatgaactc cgaggcgaga accgccagat 9840

tttgaaggac atcatggatg attactaccg tggtttcatc tcggaaacgc tctcctccat 9900

tgacgacatc gattggactt cgttgttcga aaagatggaa atccagctca aaaacggcga 9960

taacaaggat accttgatca aggagcagac cgagtatcgg aaggcgatcc ataagaagtt 10020

cgccaacgat gatcggttca agaacatgtt ctcggccaag ttgatttccg acattctccc 10080

cgaattcgtg atccataaca acaactactc ggcgtcggag aaggaggaga agacgcaggt 10140

catcaagttg ttctcgaggt tcgccacatc gttcaaagac tattttaaga atcgtgcgaa 10200

ctgtttctcg gcagatgata tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc 10260

ggaaatcttc ttctcgaacg cgttggtgta taggcgcatc gtgaagtccc tctccaacga 10320

tgacatcaac aaaatctcgg gagatatgaa ggattcgctc aaggagatgt cgttggagga 10380

aatctactcc tatgagaagt atggcgagtt cattacgcag gagggcattt ccttctacaa 10440

cgacatttgt ggtaaagtca actcgttcat gaacctctac tgtcagaaaa acaaggagaa 10500

caaaaacctc tataagctcc agaagttgca taagcagatc ctctgtatcg cagacacctc 10560

gtacgaggtc ccttacaagt tcgaatccga tgaggaggtc taccagtccg tcaacggatt 10620

cttggacaac atctcctcga aacacattgt cgagcggctc cgaaagatcg gcgataacta 10680

caacggctac aacttggaca aaatctatat cgtctccaag ttctatgagt ccgtctcgca 10740

gaaaacctat cgtgattggg agactatcaa cactgcgctc gagattcact ataacaacat 10800

cttgcctggt aacggcaaat cgaaagccga caaggtgaag aaggccgtga aaaacgatct 10860

ccagaagtcg atcacagaaa tcaacgaact cgtctcgaac tacaagctct gttcggatga 10920

taacatcaag gcggaaacgt acatccatga aatctcgcat atcttgaaca acttcgaggc 10980

ccaggaactc aaatacaacc ccgagatcca cttggtcgag tcggagctca aagcctcgga 11040

gttgaagaac gtcttggatg tcatcatgaa cgcattccac tggtgttccg tgttcatgac 11100

cgaggaactc gtcgataaag acaacaactt ctacgcggaa ctcgaggaaa tctacgatga 11160

aatctatccc gtgatctccc tctacaacct cgtgcgaaac tacgtcactc agaagcccta 11220

ttccaccaag aagatcaagc tcaacttcgg catccccact ctcgcagacg gttggtcgaa 11280

gtcgaaggag tactccaaca acgccattat cctcatgcga gacaacctct actacttggg 11340

tatcttcaac gcaaagaaca agccggataa gaagatcatt gaaggcaaca cttcggaaaa 11400

caagggagac tataagaaga tgatctacaa cctcctccct ggacccaaca agatgattcc 11460

taaagtgttc ctctcgtcga agactggtgt ggaaacgtat aagccgtcgg cctacatctt 11520

ggagggctac aaacagaaca agcatatcaa gtcctcgaag gacttcgaca tcactttctg 11580

tcacgacctc atcgactatt tcaagaactg tattgcaatc catccggaat ggaagaactt 11640

cggcttcgat ttctcggata cttcgacata cgaagatatc tcgggattct accgagaggt 11700

cgaattgcag ggctataaga ttgattggac ctacatctcg gaaaaggata tcgacttgct 11760

ccaggaaaag ggccagctct acctcttcca gatttacaac aaggacttct ccaagaagtc 11820

gacgggtaac gacaacttgc acacaatgta tctcaaaaac ctcttctcgg aggagaactt 11880

gaaggatatc gtgctcaaat tgaacggaga ggccgaaatc ttcttccgta agtcctccat 11940

caagaacccg atcatccata agaagggatc gatcttggtc aaccggactt acgaagcaga 12000

ggaaaaagat cagttcggaa acatccagat tgtcaggaag aacatccctg aaaacatcta 12060

tcaggagttg tataagtact tcaacgacaa gtcggataag gagctctccg acgaagcagc 12120

caaactcaag aacgtcgtcg gacaccatga agcagcaacc aacattgtga aggactaccg 12180

gtacacttac gacaagtact tcttgcacat gccgatcact atcaacttca aagccaacaa 12240

gaccggattc attaacgaca ggatcctcca gtacattgcc aaagaaaagg acctccatgt 12300

catcggtatc gataggggag aacggaacct catctacgtc tccgtgattg acacttgtgg 12360

caacattgtc gaacagaagt cgttcaacat cgtcaacggt tacgattacc agattaagtt 12420

gaaacagcag gaaggtgcga ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat 12480

caaggagatt aaggaaggct acttgtcgtt ggtcatccac gaaatctcga aaatggtgat 12540

caaatacaac gccatcatcg ccatggaaga cctctcgtac ggcttcaaaa agggacggtt 12600

caaagtggag cgtcaggtgt accagaagtt cgaaacaatg ttgatcaaca agttgaacta 12660

cttggtgttc aaggacattt ccattaccga gaacggagga ttgctcaagg gttatcagct 12720

cacgtacatc cccgacaagt tgaaaaacgt gggacaccag tgtggctgta tcttctacgt 12780

gcctgcagcc tacacgtcga aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt 12840

caaggatctc accgtcgacg cgaagcggga gttcatcaaa aagttcgact ccatccgcta 12900

tgattcggag aagaacttgt tctgtttcac attcgactac aacaacttca ttactcagaa 12960

caccgtgatg tccaaatcgt cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg 13020

cttcgtcaac ggtcgcttct ccaacgaatc ggacacgatc gatatcacga aagacatgga 13080

gaaaacattg gaaatgaccg acatcaactg gcgtgacggc catgacctca ggcaggacat 13140

catcgattac gagatcgtcc agcacatctt cgaaatcttc cgtctcaccg tgcagatgag 13200

gaactccctc tccgagctcg aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa 13260

cgagaacaac atcttctacg actcggcaaa agcgggagat gcattgccga aggacgccga 13320

tgcgaacggt gcatattgta ttgcactcaa gggtctctac gaaatcaagc agatcaccga 13380

aaactggaag gaggacggca aattctcgag ggacaagttg aagatttcga acaaggattg 13440

gttcgatttc atccagaaca agaggtactt gcctccgaag aagaagcgaa aggtgtgagc 13500

ggacattcga tttatgccgt tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg 13560

gaattagact tgttatgtag ttgattctac aatggattat gattcctgaa cttcaaatcc 13620

gctgttcatt attaatctca gctcttcccg taaagccaat gttgaaacta ttcgtaaatg 13680

tacctcgttt tgcgtgtacc ttgcttatca cgtgatatta catgacctgg acagagttct 13740

gcgcgaaagt cataacgtaa atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt 13800

ctcgtccacc ccaacgcgtt tatcaacctc aactttcaac aaccatcatg ccaccaaaag 13860

cgcgtaaaac aaagcgagat ttgattgagc aagagggcag gatggcgtaa tcatggtcat 13920

agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 13980

gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 14040

gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 14100

aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 14160

cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 14220

ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 14280

aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 14340

acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 14400

gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 14460

ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 14520

gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 14580

cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 14640

taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 14700

atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 14760

cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 14820

cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 14880

ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 14940

ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 15000

tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 15060

aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 15120

tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 15180

gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 15240

atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 15300

tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 15360

ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 15420

ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 15480

tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 15540

ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 15600

ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 15660

tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 15720

gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 15780

taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 15840

cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 15900

agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 15960

gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 16020

ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 16080

ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg 16140

cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 16200

cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 16260

gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg agagtgcacc 16320

atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggc 16374

<210> 56

<211> 16374

<212> DNA

<213> 人工序列

<220>

<223> 质粒pGMEr263proto5

<400> 56

gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60

tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120

ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180

ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240

ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300

agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360

tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420

ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480

tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540

accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600

gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660

ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720

atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780

cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840

gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900

acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960

aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020

gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080

gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140

gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200

taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260

catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320

gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380

tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440

ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500

gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560

tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620

gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680

gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740

cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800

tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860

ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920

actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980

cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040

agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100

tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160

taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220

tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280

cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340

caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400

gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460

tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520

taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580

tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640

tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700

ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760

atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820

actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880

gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940

ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000

gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060

aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120

gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180

ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240

caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300

gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360

aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420

taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480

acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540

tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600

tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660

actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720

aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780

ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840

aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900

gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960

gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020

aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080

ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140

gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200

gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260

tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320

aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380

aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440

aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500

gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560

tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620

ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680

tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740

caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800

gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860

gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920

gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980

gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040

aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100

cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160

aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220

actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280

ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340

tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400

agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460

taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520

tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580

gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640

caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700

gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760

tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820

agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880

gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940

ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000

tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060

cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120

tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180

cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240

ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300

atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360

catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420

gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480

aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540

tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600

gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660

gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720

ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780

ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840

gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900

caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960

caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020

ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080

aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140

ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200

gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260

cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320

ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380

actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440

gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500

aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560

ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620

cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680

ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740

ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800

cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860

tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920

tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980

tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040

gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100

tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160

actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220

ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280

atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340

gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400

gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460

aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520

tcgattcacg gatgatgcag gaatttctac tcttgtagat tatccctgcg gatatgtata 8580

ttttttttgg ctcttgggtt cgaactgccc aaggcccatg ttttggtcat cttttttttt 8640

atgccccacc atttgggtca cccctgccaa tcattccatc tttgttccta cccttcacgt 8700

gtgctttccg aagccaaagt tcccattcaa caactctcct tgcgtttttt ttttcttgaa 8760

gcttgtcacc cgtcgatagt ttctgccatt tgcaatcgag acagcagaat caccgcccaa 8820

gttaagcctt tgtgctgatc atgctctcga acgggccaag ttcgggaaaa gcaaaggagc 8880

gtttagtgag gggcaatttg actcacctcc caggcaacag atgagggggg caaaaagaaa 8940

gaaattttcg tgagtcaata tggattccga gcatcatttt cttgcggtct atcttgctac 9000

gtatgttgat cttgacgctg tggatcaagc aacgccactc gctcgctcca tcgcaggctg 9060

gtcgcagaca aattaaaagg cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt 9120

acagagtgat aaaagccgcc atgcgaccat caacgcgttg atgcccagct ttttcgatcc 9180

gagaatccac cgtagaggcg atagcaagta aagaaaagct aaacaaaaaa aaatttctgc 9240

ccctaagcca tgaaaacgag atggggtgga gcagaaccaa ggaaagagtc gcgctgggct 9300

gccgttccgg aaggtgttgt aaaggctcga cgcccaaggt gggagtctag gagaagaatt 9360

tgcatcggga gtggggcggg ttacccctcc atatccaatg acagatatct accagccaag 9420

ggtttgagcc cgcccgctta gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc 9480

tccccctccc acaaaatttt ctttcccttc ctctccttgt ccgcttcagt acgtatatct 9540

tcccttccct cgcttctctc ctccatcctt ctttcatcca tctcctgcta acttctctgc 9600

tcagcacctc tacgcattac tagccgtagt atctgagcac ttctcccttt tatattccac 9660

aaaacataac acaaccttca ccatgaacaa cggcacaaac aacttccaga acttcattgg 9720

aatctcgtcg ttgcagaaga ctttgcgcaa cgccctcatc cccacagaaa ctacccagca 9780

gttcattgtg aagaacggaa tcatcaagga agatgaactc cgaggcgaga accgccagat 9840

tttgaaggac atcatggatg attactaccg tggtttcatc tcggaaacgc tctcctccat 9900

tgacgacatc gattggactt cgttgttcga aaagatggaa atccagctca aaaacggcga 9960

taacaaggat accttgatca aggagcagac cgagtatcgg aaggcgatcc ataagaagtt 10020

cgccaacgat gatcggttca agaacatgtt ctcggccaag ttgatttccg acattctccc 10080

cgaattcgtg atccataaca acaactactc ggcgtcggag aaggaggaga agacgcaggt 10140

catcaagttg ttctcgaggt tcgccacatc gttcaaagac tattttaaga atcgtgcgaa 10200

ctgtttctcg gcagatgata tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc 10260

ggaaatcttc ttctcgaacg cgttggtgta taggcgcatc gtgaagtccc tctccaacga 10320

tgacatcaac aaaatctcgg gagatatgaa ggattcgctc aaggagatgt cgttggagga 10380

aatctactcc tatgagaagt atggcgagtt cattacgcag gagggcattt ccttctacaa 10440

cgacatttgt ggtaaagtca actcgttcat gaacctctac tgtcagaaaa acaaggagaa 10500

caaaaacctc tataagctcc agaagttgca taagcagatc ctctgtatcg cagacacctc 10560

gtacgaggtc ccttacaagt tcgaatccga tgaggaggtc taccagtccg tcaacggatt 10620

cttggacaac atctcctcga aacacattgt cgagcggctc cgaaagatcg gcgataacta 10680

caacggctac aacttggaca aaatctatat cgtctccaag ttctatgagt ccgtctcgca 10740

gaaaacctat cgtgattggg agactatcaa cactgcgctc gagattcact ataacaacat 10800

cttgcctggt aacggcaaat cgaaagccga caaggtgaag aaggccgtga aaaacgatct 10860

ccagaagtcg atcacagaaa tcaacgaact cgtctcgaac tacaagctct gttcggatga 10920

taacatcaag gcggaaacgt acatccatga aatctcgcat atcttgaaca acttcgaggc 10980

ccaggaactc aaatacaacc ccgagatcca cttggtcgag tcggagctca aagcctcgga 11040

gttgaagaac gtcttggatg tcatcatgaa cgcattccac tggtgttccg tgttcatgac 11100

cgaggaactc gtcgataaag acaacaactt ctacgcggaa ctcgaggaaa tctacgatga 11160

aatctatccc gtgatctccc tctacaacct cgtgcgaaac tacgtcactc agaagcccta 11220

ttccaccaag aagatcaagc tcaacttcgg catccccact ctcgcagacg gttggtcgaa 11280

gtcgaaggag tactccaaca acgccattat cctcatgcga gacaacctct actacttggg 11340

tatcttcaac gcaaagaaca agccggataa gaagatcatt gaaggcaaca cttcggaaaa 11400

caagggagac tataagaaga tgatctacaa cctcctccct ggacccaaca agatgattcc 11460

taaagtgttc ctctcgtcga agactggtgt ggaaacgtat aagccgtcgg cctacatctt 11520

ggagggctac aaacagaaca agcatatcaa gtcctcgaag gacttcgaca tcactttctg 11580

tcacgacctc atcgactatt tcaagaactg tattgcaatc catccggaat ggaagaactt 11640

cggcttcgat ttctcggata cttcgacata cgaagatatc tcgggattct accgagaggt 11700

cgaattgcag ggctataaga ttgattggac ctacatctcg gaaaaggata tcgacttgct 11760

ccaggaaaag ggccagctct acctcttcca gatttacaac aaggacttct ccaagaagtc 11820

gacgggtaac gacaacttgc acacaatgta tctcaaaaac ctcttctcgg aggagaactt 11880

gaaggatatc gtgctcaaat tgaacggaga ggccgaaatc ttcttccgta agtcctccat 11940

caagaacccg atcatccata agaagggatc gatcttggtc aaccggactt acgaagcaga 12000

ggaaaaagat cagttcggaa acatccagat tgtcaggaag aacatccctg aaaacatcta 12060

tcaggagttg tataagtact tcaacgacaa gtcggataag gagctctccg acgaagcagc 12120

caaactcaag aacgtcgtcg gacaccatga agcagcaacc aacattgtga aggactaccg 12180

gtacacttac gacaagtact tcttgcacat gccgatcact atcaacttca aagccaacaa 12240

gaccggattc attaacgaca ggatcctcca gtacattgcc aaagaaaagg acctccatgt 12300

catcggtatc gataggggag aacggaacct catctacgtc tccgtgattg acacttgtgg 12360

caacattgtc gaacagaagt cgttcaacat cgtcaacggt tacgattacc agattaagtt 12420

gaaacagcag gaaggtgcga ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat 12480

caaggagatt aaggaaggct acttgtcgtt ggtcatccac gaaatctcga aaatggtgat 12540

caaatacaac gccatcatcg ccatggaaga cctctcgtac ggcttcaaaa agggacggtt 12600

caaagtggag cgtcaggtgt accagaagtt cgaaacaatg ttgatcaaca agttgaacta 12660

cttggtgttc aaggacattt ccattaccga gaacggagga ttgctcaagg gttatcagct 12720

cacgtacatc cccgacaagt tgaaaaacgt gggacaccag tgtggctgta tcttctacgt 12780

gcctgcagcc tacacgtcga aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt 12840

caaggatctc accgtcgacg cgaagcggga gttcatcaaa aagttcgact ccatccgcta 12900

tgattcggag aagaacttgt tctgtttcac attcgactac aacaacttca ttactcagaa 12960

caccgtgatg tccaaatcgt cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg 13020

cttcgtcaac ggtcgcttct ccaacgaatc ggacacgatc gatatcacga aagacatgga 13080

gaaaacattg gaaatgaccg acatcaactg gcgtgacggc catgacctca ggcaggacat 13140

catcgattac gagatcgtcc agcacatctt cgaaatcttc cgtctcaccg tgcagatgag 13200

gaactccctc tccgagctcg aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa 13260

cgagaacaac atcttctacg actcggcaaa agcgggagat gcattgccga aggacgccga 13320

tgcgaacggt gcatattgta ttgcactcaa gggtctctac gaaatcaagc agatcaccga 13380

aaactggaag gaggacggca aattctcgag ggacaagttg aagatttcga acaaggattg 13440

gttcgatttc atccagaaca agaggtactt gcctccgaag aagaagcgaa aggtgtgagc 13500

ggacattcga tttatgccgt tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg 13560

gaattagact tgttatgtag ttgattctac aatggattat gattcctgaa cttcaaatcc 13620

gctgttcatt attaatctca gctcttcccg taaagccaat gttgaaacta ttcgtaaatg 13680

tacctcgttt tgcgtgtacc ttgcttatca cgtgatatta catgacctgg acagagttct 13740

gcgcgaaagt cataacgtaa atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt 13800

ctcgtccacc ccaacgcgtt tatcaacctc aactttcaac aaccatcatg ccaccaaaag 13860

cgcgtaaaac aaagcgagat ttgattgagc aagagggcag gatggcgtaa tcatggtcat 13920

agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 13980

gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 14040

gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 14100

aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 14160

cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 14220

ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 14280

aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 14340

acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 14400

gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 14460

ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 14520

gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 14580

cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 14640

taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 14700

atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 14760

cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 14820

cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 14880

ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 14940

ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 15000

tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 15060

aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 15120

tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 15180

gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 15240

atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 15300

tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 15360

ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 15420

ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 15480

tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 15540

ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 15600

ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 15660

tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 15720

gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 15780

taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 15840

cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 15900

agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 15960

gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 16020

ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 16080

ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg 16140

cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 16200

cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 16260

gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg agagtgcacc 16320

atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggc 16374

<210> 57

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物1228586

<400> 57

ttagtccgac gccttcgagt 20

<210> 58

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物1228587

<400> 58

tgcgagtacc tcagcgctgt 20

<210> 59

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 原型间隔子PS1

<400> 59

cgttgaagcc ggatatgaag c 21

<210> 60

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 原型间隔子PS2

<400> 60

gcgaggccat ccgcctggcg c 21

<210> 61

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 原型间隔子PS3

<400> 61

ccccgaagga gaatccgtct c 21

<210> 62

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 原型间隔子PS4

<400> 62

tgcgtaatta ccatgcgcag a 21

<210> 63

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 原型间隔子PS5

<400> 63

tatccctgcg gatatgtata t 21

<210> 64

<211> 94

<212> DNA

<213> 人工序列

<220>

<223> 修复DNA 1228583

<400> 64

cggatttcca gcagcaaatc agccgcggac tgccagagcc gcacaagctt cttccggggc 60

ggctcggacg ccgtgctcag gaactcgtcc tcga 94

<210> 65

<211> 94

<212> DNA

<213> 人工序列

<220>

<223> 修复DNA 1228584

<400> 65

tggggacgag cccctcgagg gcagcctcct cgtgcagctg catgaagctt atgtgccacg 60

agtacttggg cttccccgca gcgtggaggc agtt 94

<210> 66

<211> 95

<212> DNA

<213> 人工序列

<220>

<223> 修复DNA 1228585

<400> 66

aggtgctggt gcaggcagtc ccgagaggct tcgagcaaga tctcaagctt tgtccttggg 60

tagcatgaat gctgcctctg cgcagacggc cgtga 95

<210> 67

<211> 94

<212> DNA

<213> 人工序列

<220>

<223> 修复DNA 1228582

<400> 67

atcagcctgc tcaacgccag gagcaaaata agagaggtct tcgaagcttc agtgaaacgt 60

cacctgcagg ttgatgcact gtatcacgta ctgc 94

<210> 68

<211> 94

<212> DNA

<213> 人工序列

<220>

<223> 修复DNA 1228581

<400> 68

caacataatc aggacagatt agcaacaagt gccgaggctt gatgaagctt aaagagagag 60

ggggggtcgt cgaagaaaag ggtgtgcaga aaag 94

<210> 69

<211> 122

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸10

<400> 69

tttccagcag caaatcagcc gcggactgcc agagccgcac attggcgtta aagccggata 60

tgaagctctt ccggggcggc tcgcacgccg tgctcaggaa ctcgtcctcg atacccgacg 120

gg 122

<210> 70

<211> 135

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸11

<400> 70

tttccagcag caaatcagcc gcggactgcc agagccgcac attggcgtta aagccggata 60

tgaagctctt ccggggcggc tcggacgccg tgctctggaa ctcgtcctcg atacccgacg 120

ggtatagcgt ggtga 135

<210> 71

<211> 150

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸12

<400> 71

tttccagcag caaatcagcc gcggactgcc agagccgcac attggcgtta aagccggata 60

tgaagctctt ccggggcggc tcggacgccg tgctcaggaa ctcgtcctcg ctacccgacg 120

ggtatagcgt ggtgatgccg gcgtcgaagc 150

<210> 72

<211> 111

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸13

<400> 72

ctgatcttgc agcacgcgga tttccagcag caaatcagcc acggactgcc agagccgcac 60

attggcgtta aagccggata tgaagctctt ccggggcggc tcggacgccg t 111

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号