公开/公告号CN113039278A
专利类型发明专利
公开/公告日2021-06-25
原文格式PDF
申请/专利权人 诺维信公司;
申请/专利号CN201980064817.6
发明设计人 G.穆齐-埃里赫森;N.约胡姆森;
申请日2019-10-30
分类号C12N15/90(20060101);C12N15/10(20060101);C12N15/113(20060101);
代理机构11105 北京市柳沈律师事务所;
代理人张文辉
地址 丹麦鲍斯韦
入库时间 2023-06-19 11:35:49
序列表的引用
本申请包含计算机可读形式的序列表。该计算机可读形式通过引用并入本文。
技术领域
本发明提供了用于通过采用可编程多核苷酸指导的内切核酸酶(例如,通过Inscripta
背景技术
最初从化脓链球菌分离的所谓的CRISPR(成簇的规律间隔的短回文重复序列)Cas9基因组编辑系统已被广泛用作修饰多种微生物以及高等生物的基因组的工具。
可编程Cas9酶具有两个能够靶向特定基因组序列的RNA指导的DNA内切核酸酶结构域。该系统已被广泛描述用于在各种真核生物[Doudna,J.A.和E.Charpentier,Genomeediting.[基因组编辑]The new frontier of genome engineering with CRISPR-Cas9[采用CRISPR-Cas9进行基因组工程化的新前沿].Science[科学],2014.346(6213):第1258096页]、人干细胞[Paquet,D.等人,Efficient introduction of specifichomozygous and heterozygous mutations using CRISPR/Cas9[使用CRISPR/Cas9高效引入特定纯合和杂合突变].Nature[自然],2016.533:第125-129页]、小鼠合子[Inui,M.等人,Rapid generation of mouse models with defined point mutations by theCRISPR/Cas9 system[通过CRISPR/Cas9系统快速产生具有限定点突变的小鼠模型].SciRep[科学报告].2014;4:5396]、猪[Wang,K.等人,Efficient Generation of OrthologousPoint Mutations in Pigs via CRISPR-assisted ssODN-mediated Homology-directedRepair[经由CRISPR辅助的ssODN介导的同源定向修复在猪中高效产生直向同源点突变].Mol Ther Nucleic Acids[分子疗法-核酸].2016年11月;5(11):e396]、大肠杆菌(E.coli)[Jiang,W.等人,RNA-guided editing of bacterial genomes using CRISPR-Cassystems[使用CRISPR-Cas系统对细菌基因组的RNA指导的编辑].Nat Biotechnol[自然生物技术],2013.31(3):第233-9页]、酵母[DiCarlo,J.E.等人,Genome engineering inSaccharomyces cerevisiae using CRISPR-Cas systems[使用CRISPR-Cas系统在酿酒酵母中进行基因组工程化].Nucleic Acids Res[核酸研究],2013.41(7):第4336-43页、[Horwitz,A.A.等人,Efficient Multiplexed Integration of Synergistic Allelesand Metabolic Pathways in Yeasts via CRISPR-Cas[经由CRISPR-Cas在酵母中进行协同等位基因和代谢途径的高效多重整合].Cell Syst[细胞系统].2015.1(1):第88-96页]、乳杆菌属(Lactobacillus)[Oh,J.H.和J.P.van Pijkeren,CRISPR-Cas9-assistedrecombineering in Lactobacillus reuteri[罗伊氏乳杆菌中的CRISPR-Cas9辅助重组工程化].Nucleic Acids Res[核酸研究],2014.42(17):第e131页]和丝状真菌(如里氏木霉(Trichoderma reesei))[Liu,R.等人,Efficient genome editing in filamentousfungus Trichoderma reesei using the CRISP R/Cas9 system[使用CRISPR/Cas9系统在丝状真菌里氏木霉中进行高效基因组编辑].Cell Discovery[细胞发现],2015.1]中编辑基因组。
Cas9系统的力量在于它的简单性以及靶向和编辑特定目的基因的能力。另外,可能的是在单个反应中靶向多个基因进行修饰(多重化),以产生插入和缺失,以及沉默或活化基因。在2012年,Cas9蛋白被证明是双RNA指导的内切核酸酶蛋白[Jinek,M.等人,Aprogrammable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity[在自适应细菌免疫中的可编程双RNA指导的DNA内切核酸酶].Science[科学],2012.337(6096):第816-21页.]。
进一步开发已导致了单指导RNA分子的工程化,该分子将内切核酸酶指导至其DNA靶标。单指导RNA保留了与Cas9蛋白相互作用和靶向所需核苷酸序列所必需的关键特征。当与RNA分子复合时,Cas9蛋白与靶序列结合并使用两个催化结构域产生双链断裂。
当工程化为在任一催化结构域中含有单个氨基酸突变时,Cas9蛋白起切口酶的作用,切口酶是具有单链切割活性的变体蛋白。最近Xu等人证实了经由CRISPR-Cas9切口酶在解纤维梭菌(Clostridium cellulyticum)中进行基因组编辑[Xu,T.等人,EfficientGenome Editing in Clostridium cellulolyticum via CRISPR-Cas9 Nickase[经由CRISPR-Cas9切口酶在解纤维梭菌中进行高效基因组编辑].Appl Environ Microbiol[应用与环境微生物学],2015.81(13):第4423-31页.]。
与基因组编辑有关的大量科学出版物和公开的专利申请已成为可用的。最近,
自从首次发现Cas9酶以来,已描述了许多新的多核苷酸指导的且可编程的内切核酸酶,包括例如从马达加斯加分离并由Inscripta
已证明,在基于Cas9的基因组编辑中使用单链寡核苷酸作为供体DNA是可能的。然而,几项研究已证明,在距切割位点的距离与使用单链寡核苷酸作为供体DNA的突变掺入之间存在负相关[Inui等人,2014;Wang等人,2016;Paquet等人,2016;参见上文]。在猪(猪胎儿成纤维细胞)中,Wang等人(2016)证明了11bp的突变到切口距离导致两个点突变之间同源定向修复效率的显著差异[Wang,K.等人,Efficient Generation of OrthologousPoint Mutations in Pigs via CRISPR-assisted ssODN-mediated Homology-directedRepair[经由CRISPR辅助的ssODN介导的同源定向修复在猪中高效产生直向同源点突变].Mol Ther Nucleic Acids[分子疗法-核酸].2016年11月;5(11):e396]。同样,对于人诱导多能干细胞,Paquet等人(2016)指出,为了高效的纯合突变掺入,切口到突变距离需要最小化[Paquet,D.等人,Efficient introduction of specific homozygous andheterozygous mutations using CRISPR/Cas9[使用CRISPR/Cas9高效引入特定纯合和杂合突变].Nature[自然],2016.533:第125-129页]。类似地,对于小鼠,Inui等人(2014)报告,修饰位点与gRNA靶位点之间的距离是影响取代效率的重要参数[Inui,M.等人,Rapidgeneration of mouse models with defined point mutations by the CRISPR/Cas9system[通过CRISPR/Cas9系统快速产生具有限定点突变的小鼠模型].Sci Rep[科学报告].2014;4:5396]。
对于在酿酒酵母(Saccharomyces cerevisiae)中进行定向诱变或基因组编辑,Horwitz等人(2015)报告,靶向切割的位点应当尽可能接近所需突变的位点。此外,为了破坏供体DNA中的Cas9靶位点并且同时提高重组事件包括所需突变的机会,Horwitz等人(2015)在靶位点与点突变之间的密码子中进行了沉默改变(一种“异源性阻断”)[Horwitz,A.A.等人,Efficient Multiplexed Integration of Synergistic Alleles andMetabolic Pathways in Yeastsvia CRISPR-Cas[经由CRISPR-Cas在酵母中进行协同等位基因和代谢途径的高效多重整合].Cell Syst[细胞系统].2015.1(1):第88-96页]。
常用基因组编辑方法的一个局限性是,可能在你打算修饰基因组的地方附近难以找到合适的PAM位点和良好的原型间隔子序列,和/或在可读框中靶位点与点突变之间的密码子中多个沉默改变的掺入可能导致不希望的效应,如在真核生物中的选择性剪接。
发明内容
诸位发明人发现,与其他地方已报告的相反,在使用可编程内切核酸酶在待修饰的靶序列附近切割或切开双链基因组DNA序列之后,他们能够在微生物宿主细胞中采用包含所需核苷酸修饰的较长单链寡核苷酸作为修复模板或“供体DNA”,由此寡核苷酸的核苷酸修饰将以相对较高的效率成功地引入双链DNA中。
因此,在第一方面,本发明涉及用于使用多核苷酸指导的内切核酸酶在微生物细胞基因组中的至少一个靶序列中引入一个或多个所需核苷酸修饰的方法,所述方法包括以下步骤:
a)提供微生物宿主细胞,该微生物宿主细胞包含位于该多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列附近的至少一个待修饰的基因组靶序列;
b)用以下转化该微生物宿主细胞:
i)该多核苷酸指导的内切核酸酶和用于该至少一个待修饰的靶序列的至少一种合适的指导多核苷酸,或者编码该多核苷酸指导的内切核酸酶和编码用于该至少一个待修饰的靶序列的至少一种合适的指导多核苷酸的一种或多种多核苷酸,和
ii)能够与该至少一个基因组靶序列杂交的至少一种单链或双链寡核苷酸,所述寡核苷酸包含该一个或多个所需核苷酸修饰;
其中该多核苷酸指导的内切核酸酶与该指导多核苷酸和基因组相互作用并且切割或切开基因组,并且其中该至少一种单链或双链寡核苷酸指导DNA修复穿过该切口或缺口,从而以至少以下的效率将该一个或多个所需修饰引入基因组的该靶序列中:
当该切口或缺口位于距该一个或多个所需核苷酸修饰10-20个核苷酸时为70%,
当该切口或缺口位于距该一个或多个所需核苷酸修饰21-30个核苷酸时为60%,
当该切口或缺口位于距该一个或多个所需核苷酸修饰31-43个核苷酸时为50%,
当该切口或缺口位于距该一个或多个所需核苷酸修饰44-52个核苷酸时为40%,或者
当该切口或缺口位于距该一个或多个所需核苷酸修饰至少53个核苷酸时为30%。
附图说明
图1示出了pSMAI290的质粒图。
图2示出了pNJOC502的质粒图。
图3示出了pNJOC503的质粒图。
图4示出了pNJOC504的质粒图。
图5示出了本文实例5中使用的寡核苷酸的概况。箭头示出了该基因DNA被切割的区域,包括对本研究中使用的寡核苷酸而言同源的区域(未按比例)。每种寡核苷酸在与PAM位点对应的区域中均含有突变,以避免重组时重新切割DNA(由填充的圆圈表示;●)。除了PAM突变之外,每种寡核苷酸还均含有放置地距切割位点的距离越来越远的另一个突变(由三角形表示;
图6示出了本文实例6中使用的寡核苷酸的概况。箭头示出了该基因DNA被切割的区域,包括对本研究中使用的寡核苷酸而言同源的区域(未按比例)。每种寡核苷酸在与PAM位点对应的区域中均含有突变,以避免重组时重新切割DNA(由填充的圆圈表示;●)。除了PAM突变之外,每种寡核苷酸还均含有放置地距切割位点的距离越来越远的另一个突变(由三角形表示;
图7示出了pAT3630的质粒图。
图8示出了pAT3720的质粒图,其用于测试使用米曲霉(Aspergillus oryzae)中的单链寡核苷酸进行的CRISPR/Mad7辅助的突变递送。
图9示出了pGMEr263的质粒图。
图10示出了pGMEr263-proto1的质粒图,其用于测试使用里氏木霉中的单链寡核苷酸进行的CRISPR/Mad7辅助的突变递送。
图11示出了pGMEr263-proto2的质粒图。
图12示出了pGMEr263-proto3的质粒图。
图13示出了pGMEr263-proto4的质粒图。
图14示出了pGMEr263-proto5的质粒图。
定义
基因组修饰:术语“一个或多个基因组修饰”包括基因组序列(无论是非编码还是编码)中的在核苷酸水平上的任何修饰。此类修饰可能不改变编码的多肽的氨基酸序列,或者它们可能导致氨基酸序列的变化,如缺失、插入或取代。
如果一个氨基酸被具有相似特征的另一个氨基酸取代,则它可以被称为保守取代。保守取代的实例是在下组之内:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)以及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不会改变比活性的氨基酸取代是本领域已知的并且例如由H.Neurath和R.L.Hill,1979,于The Proteins[蛋白质],Academic Press[学术出版社],纽约中描述。常见取代为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
可替代地,这些氨基酸改变具有这样的性质:改变多肽的物理化学特性。例如,氨基酸改变可以提高多肽的热稳定性、改变底物特异性、改变最适pH,等等。
可以根据本领域已知的程序,如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science[科学]244:1081-1085)来鉴定多肽中的必需氨基酸。在后一项技术中,在分子中的每个残基处引入单个丙氨酸突变,并且对所得突变型分子的活性进行测试以鉴定对于分子的活性至关重要的氨基酸残基。还参见,Hilton等人,1996,J.Biol.Chem.[生物化学杂志]271:4699-4708。酶或其他生物学相互作用的活性位点还可以通过对结构的物理分析来确定,如通过诸如下述技术来确定:核磁共振、晶体学、电子衍射或光亲和标记,连同对推定的接触位点氨基酸进行突变。参见例如,de Vos等人,1992,Science[科学]255:306-312;Smith等人,1992,J.Mol.Biol.[分子生物学杂志]224:899-904;Wlodaver等人,1992,FEBS Lett.[欧洲生化学会联合会快报]309:59-64。还可以从与相关多肽的比对来推断必需氨基酸的身份。
使用已知的诱变、重组和/或改组方法,随后进行相关的筛选程序可以做出单个或多个氨基酸取代、缺失和/或插入并对其进行测试,这些相关的筛选程序是如由Reidhaar-Olson和Sauer,1988,Science[科学]241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2152-2156;WO 95/17413;或WO 95/22625披露的那些。其他可以使用的方法包括易错PCR、噬菌体展示(例如Lowman等人,1991,Biochemistry[生物化学]30:10832-10837;美国专利号5,223,409;WO 92/06204)以及区域定向诱变(Derbyshire等人,1986,Gene[基因]46:145;Ner等人,1988,DNA 7:127)。
诱变/改组方法可以与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等人,1999,Nature Biotechnology[自然生物技术]17:893-896)。可以从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域的标准方法快速测序。这些方法允许快速确定多肽中各个氨基酸残基的重要性。
多肽可以是杂合多肽,其中一种多肽的区域在另一种多肽的区域的N末端或C末端处融合。
多肽可以是融合多肽或可切割的融合多肽,其中另一种多肽在本发明多肽的N末端或C末端处融合。通过将编码另一种多肽的多核苷酸融合于本发明的多核苷酸来产生融合多肽。用于产生融合多肽的技术是本领域已知的,并且包括连接编码多肽的编码序列使得它们符合读框,而且融合多肽的表达处于一个或多个相同的启动子和终止子的控制之下。还可以使用内含肽技术构建融合多肽,其中在翻译后产生融合多肽(Cooper等人,1993,EMBO J.[欧洲分子生物学学会杂志]12:2575-2583;Dawson等人,1994,Science[科学]266:776-779)。
融合多肽可以进一步包含两种多肽之间的切割位点。在融合蛋白分泌之时,位点被切割,从而释放出这两种多肽。切割位点的实例包括但不限于在以下文献中披露的位点:Martin等人,2003,J.Ind.Microbiol.Biotechnol.[工业微生物生物技术杂志]3:568-576;Svetina等人,2000,J.Biotechnol.[生物技术杂志]76:245-251;Rasmussen-Wilson等人,1997,Appl.Environ.Microbiol.[应用与环境微生物学]63:3488-3493;Ward等人,1995,Biotechnology[生物技术]13:498-503;和Contreras等人,1991,Biotechnology[生物技术]9:378-381;Eaton等人,1986,Biochemistry[生物化学]25:505-512;Collins-Racie等人,1995,Biotechnology[生物技术]13:982-987;Carter等人,1989,Proteins:Structure,Function,and Genetics[蛋白质:结构、功能以及遗传学]6:240-248;以及Stevens,2003,Drug Discovery World[药物发现世界]4:35-48。
可编程多核苷酸指导的内切核酸酶:在本文中术语“可编程多核苷酸指导的内切核酸酶”或“多核苷酸指导的内切核酸酶”或“多核苷酸指导的核酸酶”可互换地使用。该术语包括所谓的II类Cas9类似物或同源物,其中几种是已知的,并且随着近几年科学兴趣的激增,几乎每月都会发现更多;Makarova K.S.等人提供了综述(An updated evolutionaryclassification of CRISPR-Cas systems[CRISPR-Cas系统的更新的进化分类],2015,Nature[自然]第13卷:722-736)。
Cas内切核酸酶:术语“Cas内切核酸酶”意指与CRISPR相关的RNA指导的DNA内切核酸酶,其在与单指导RNA偶联时切割靶DNA序列。Cas内切核酸酶由一种或多种单指导RNA指导,以识别和切割细胞基因组中的双链DNA中的特定靶位点。CRISPR-Cas系统目前被分类为I型、II型和III型CRISPR-Cas系统(Liu和Fan,2014,Plant Mol.Biol.[植物分子生物学]85:209-218)。出于本披露的目的,CRISPR-Cas系统是采用Cas9内切核酸酶或其变体(包括例如Cas9切口酶)的II型CRISPR-Cas系统。Cas9内切核酸酶包含两个核酸酶结构域:切割互补DNA链的HNH(McrA样)核酸酶结构域和切割非互补DNA链的RuvC样核酸酶结构域。通过Cas9内切核酸酶识别和切割靶标需要嵌合的单指导RNA,其由crRNA(20个核苷酸的指导序列和部分同向重复)和tracrRNA(反式激活crRNA)的融合物以及crRNA结合区下游的短保守序列基序(称为原型间隔子相邻基序(PAM))组成。在来源于细菌化脓链球菌的CRISPR-Cas9系统中,靶DNA紧接在5'-NGG PAM之前。RNA指导的Cas9内切核酸酶活性产生位点特异性双链断裂,然后这些断裂通过非同源末端连接(NHEJ)或同源定向修复(HDR)进行修复。应理解,术语“Cas内切核酸酶”涵盖其变体。
Cas切口酶:术语“Cas9切口酶”意指当与嵌合的单指导RNA偶联时,将单链缺口引入靶双链DNA序列中的Cas9内切核酸酶。通过灭活亲本Cas9内切核酸酶中的两个核酸酶结构域之一(例如,通过定点诱变),可以重组产生Cas9切口酶。Cas9切口酶的非限制性实例是其中的RuvC结构域被来自化脓链球菌的Cas9内切核酸酶中的D10A突变灭活的Cas9切口酶(Sander和Joung,2013,Nature Biotechnology[自然生物技术]1-9)。设计在相对DNA链上的两种指导RNA需要Cas9切口酶来产生双链断裂。
Mad内切核酸酶:术语“Mad内切核酸酶”意指与CRISPR相关的RNA指导的DNA内切核酸酶,其在与单指导RNA偶联时切割靶DNA序列。Mad内切核酸酶由一种或多种单指导RNA指导,以识别和切割细胞基因组中的双链DNA中的特定靶位点。CRISPR-Mad系统与CAS酶的2类家族的V型(Cpf1样)密切相关。出于本披露的目的,CRISPR-Mad系统采用直肠真杆菌(Eubacterium rectale)MAD7内切核酸酶或其变体。MAD7-crRNA复合物通过鉴定原型间隔子相邻基序(PAM)5'-YTTN来切割靶DNA。在鉴定PAM之后,MAD7引入对靶向PAM的3'端突出的4-5个核苷酸的粘性末端DNA双链断裂,然后该断裂通过非同源末端连接(NHEJ)或同源定向修复(HDR)进行修复。应理解,术语“Mad内切核酸酶”涵盖其变体。
Cpf1内切核酸酶:术语“Cpf内切核酸酶”意指与CRISPR相关的RNA指导的DNA内切核酸酶,其在与单指导RNA偶联时切割靶DNA序列。Cpf内切核酸酶由一种或多种单指导RNA指导,以识别和切割细胞基因组中的双链DNA中的特定靶位点。出于本披露的目的,CRISPR-Cpf系统采用氨基酸球菌属物种(Acidaminococcus sp.)Cpf1内切核酸酶、毛螺菌科物种(Lachnospiraceae sp.)Cpf1内切核酸酶或新凶手弗朗西斯氏菌(Francisella novicide)Cpf1内切核酸酶或者其变体。Cpf1-crRNA复合物通过鉴定氨基酸球菌属物种Cpf1内切核酸酶和毛螺菌科物种Cpf1内切核酸酶的原型间隔子相邻基序(PAM)5'-TTTN和新凶手弗朗西斯氏菌Cpf1的PAM序列5'-TTN来切割靶DNA。在鉴定PAM之后,Cpf1引入对靶向PAM的3'端远侧突出的4-5个核苷酸的粘性末端DNA双链断裂,然后该断裂通过非同源末端连接(NHEJ)或同源定向修复(HDR)进行修复。应理解,术语“Cpf1内切核酸酶”涵盖其变体。
核定位信号(NLS):编码可编程内切核酸酶的多核苷酸可以与编码一个或多个核定位信号的一种或多种多核苷酸可操作地连接,因此所表达的内切核酸酶在真核宿主细胞中被有效地从细胞质转运到细胞核。合适的核定位信号的实例包括SV40核定位信号、构巢曲霉(Aspergillus nidulans)GATA转录因子(AreA)、用于纤维素酶和半纤维素酶基因表达的里氏木霉转录调控子(XYR1)、里氏木霉蓝光调控子2(blr2)、非洲爪蟾(Xenopus laevis)卵母细胞核质蛋白核定位信号、秀丽隐杆线虫(Caenorhabditis elegans)转录因子EGL-13核定位信号、智人(homo sapiens)转录因子c-Myc核定位信号和大肠杆菌复制叉停滞蛋白(TUS蛋白)核定位信号。
指导RNA:CRISPR-Cas9基因组编辑中的术语“指导RNA”是指使得系统如此通用的可重编程部分。在天然化脓链球菌系统中,指导RNA实际上是两种RNA多核苷酸的复合物:含有约20个决定Cas9酶的特异性的核苷酸的第一crRNA以及与cr RNA杂交以形成与Cas9相互作用的RNA复合物的tracr RNA。参见Jinek M.等人,A programmable dual-RNA-guidedDNA endonuclease in adaptive bacterial immunity[在自适应细菌免疫中的可编程双RNA指导的DNA内切核酸酶].Science[科学].2012;337:816-21。在本文中术语crRNA和tracrRNA与术语tracr配对RNA和tracr RNA可互换地使用。由于CRISPR-Cas9系统的发现,单一多核苷酸指导RNA已被开发并成功地应用,恰好与天然两部分指导RNA复合物一样有效。
供体DNA:术语“供体DNA”意指包含用于修饰真菌细胞基因组中的靶位点的目的核苷酸序列的多核苷酸。供体DNA可以是双链DNA。供体DNA的核苷酸序列可以是任何核苷酸序列,如基因或基因的区域、用于将突变引入基因中的一个或多个核苷酸、基因破坏序列等。在一个方面,供体DNA进一步包含对靶位点的对应区域而言的第一同源区和第二同源区,用于通过同源重组将供体DNA掺入双链断裂中,即供体DNA与紧接预期编辑位点上游和下游的序列具有高度同源性。术语“供体DNA”在本文中也被理解为意指“DNA修复模板”。
cDNA:术语“cDNA”意指可以通过从获得自真核或原核细胞的成熟的剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。初始的初级RNA转录物是mRNA的前体,其通过一系列的步骤(包括剪接)进行加工,然后呈现为成熟的剪接的mRNA。
编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界通常由可读框确定,该可读框以起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可以为基因组DNA、cDNA、合成DNA或其组合。
密码子优化基因:术语“密码子优化基因”意指其密码子使用频率被优化到宿主细胞优选密码子使用频率的基因。对基因进行密码子优化的核酸改变不会改变亲本基因的编码的多肽的氨基酸序列。
控制序列:术语“控制序列”意指包含非编码RNA的多核苷酸或编码多肽的多核苷酸的表达所必需的核酸序列。每个控制序列对于编码多肽的多核苷酸而言可以是天然的(即,来自相同基因)或异源的(即,来自不同基因),或者相对于彼此是天然的或异源的。此类控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子和转录终止信号。出于引入有利于将控制序列与编码多肽的多核苷酸的编码区连接的特定限制位点的目的,控制序列可以提供有多个接头。
表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。术语“表达”还意指产生非编码RNA(例如,单指导RNA)。
表达载体:术语“表达载体”意指直链或环状DNA分子,其包含编码多肽的多核苷酸或非编码多核苷酸(例如,单指导RNA),并且与提供用于其表达的控制序列可操作地连接。
基因组:术语“基因组”意指真菌细胞中的整套遗传信息,其以称为染色体的DNA长分子以及DNA(例如,质粒)和RNA的染色体外元件存在。
指导RNA或单指导RNA:术语“指导RNA”(gRNA)或“单指导RNA”(sgRNA)意指工程化的单链RNA,涉及(1)CRISPR RNA(crRNA)序列的靶向功能(对于MAD7和Cpf1),或(2)CRISPRRNA(crRNA)的靶向功能和反式激活CRISPR RNA(tracrRNA)序列的核酸酶结合功能(对于Cas9)。对于Cas9内切核酸酶,crRNA序列是大约20个核苷酸的序列,其限定了经由同源性进行修饰的目的基因组靶标并指导Cas9内切核酸酶活性。20个核苷酸的序列作为“向导”,其通过RNA-DNA碱基配对,将Cas9/gRNA复合物招募到直接在原型间隔子相邻基序(PAM)上游的基于crRNA序列的特定DNA靶位点。PAM是切割所需要的,但是不是gRNA或sgRNA序列的一部分。Cas9内切核酸酶将切割PAM上游的大约3个碱基。对于MAD7和Cpf1内切核酸酶,它们由单一CRISPR RNA(crRNA)指导,并且不需要反式激活CRISPR RNA(tracrRNA)。MAD7和Cpf1内切核酸酶在原型间隔子的+18/+23位置之后切割其PAM远端的DNA,从而形成交错的DNA突出。
同源重组:术语“同源重组”意指两个DNA分子之间经由经典的Campbell型同源重组事件在同源位点处交换DNA片段。
宿主细胞:术语“宿主细胞”意指易于用包含多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不相同的任何亲本细胞子代。
突变体:术语“突变体”意指在一个或多个(例如,几个)位置处包含改变(即,取代、插入和/或缺失)的多核苷酸。取代意指用不同的核苷酸替代占据某一位置的核苷酸;缺失意指去除占据某一位置的核苷酸;并且插入意指在邻接并且紧接占据某一位置的核苷酸之后添加核苷酸。
核酸构建体:术语“核酸构建体”意指单链或双链的核酸或多核苷酸分子,其是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成含有核酸的区段,或其是合成的,其可以包含一个或多个控制序列。
可操作地连接:术语“可操作地连接”意指这样的构型,在其中控制序列被置于相对于多核苷酸适当的位置处,使得控制序列指导多核苷酸的表达。
启动子:术语“启动子”意指限定了RNA聚合酶从何处开始转录基因的DNA序列。启动子直接位于基因转录起始位点的上游或5'端处。RNA聚合酶和必需的转录因子与启动子序列结合并启动转录。
序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的关联度通过参数“序列同一性”来描述。
出于本披露的目的,使用如在EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套件(EMBOSS:The European Molecular Biology Open Software Suite),Rice等人,2000,Trends Genet.[遗传学趋势]16:276-277)(优选5.0.0版或更新版)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)来确定两个氨基酸序列之间的序列同一性。所使用的参数是空位开放罚分10、空位延伸罚分0.5和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。将标记为“最长同一性”的Needle的输出(使用非简化选项(nobrief option)获得)用作同一性百分比并且计算如下:(相同的残基x100)/(比对长度-比对中的空位总数)
出于本披露的目的,使用如在EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套件,Rice等人,2000,见上文)(优选5.0.0版或更新版)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来确定两个脱氧核糖核苷酸序列之间的序列同一性。所使用的参数是空位开放罚分10、空位延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。将标记为“最长同一性”的Needle的输出(使用非简化选项获得)用作同一性百分比并且计算如下:
(相同的脱氧核糖核苷酸x100)/(比对长度-比对中的空位总数)
转录终止子:术语“转录终止子”意指基因的多核苷酸序列下游的DNA序列,其被RNA聚合酶识别为停止合成并从转录复合物中释放新生RNA的信号。
转移RNA:术语“转移RNA”意指由RNA(典型地长度为73至94个核苷酸)构成的分子,其充当核酸的核苷酸序列与蛋白质的氨基酸序列之间的物理连接。转移RNA按照信使RNA(mRNA)中的三核苷酸序列(密码子)的指导,将氨基酸携带至细胞的蛋白质合成机器(核糖体),并且在tRNA的反密码子与将翻译成蛋白质的mRNA上的密码子配对时,将正确的氨基酸附接在核糖体细胞处合成的蛋白质链上。存在至少20个种类的转移RNA,每个种类均能够与特定的氨基酸组合。每种类型的转移RNA分子仅可以与一种类型的氨基酸附接,因此每种生物均具有许多类型的转移RNA。由于遗传密码含有多个指定相同氨基酸的密码子,因此存在许多带有不同反密码子的转移RNA分子,这些反密码子也携带相同的氨基酸。对于每个密码子通常存在多个种类的tRNA,并且因此在特定真菌细胞的基因组内可能存在多于一百个tRNA基因。例如,参见Hani和Feldman,1998,Nucleic Acids Res.[核酸研究]26:689-696。在本文中术语“转移RNA”和“tRNA”可互换地使用。
U6启动子:术语“U6启动子”意指从U6小核RNA(snRNA)基因中获得并通过RNA聚合酶III转录的启动子。
RNA聚合酶III:术语“RNA聚合酶III”意指这样的核苷酸转移酶,其使用DNA基因作为模板使核糖核苷酸聚合(Paule和White,2000,Nucleic Acids Res.[核酸研究]28(6):1283),以产生小核糖核酸(RNA)分子,包括但不限于氨酰基转移RNA、5S核糖体RNA、剪接体RNA(snRNA)和U6小核RNA。
具体实施方式
在第一方面,本发明涉及用于使用多核苷酸指导的内切核酸酶在微生物细胞基因组中的至少一个靶序列中引入一个或多个所需核苷酸修饰的方法,所述方法包括以下步骤:
a)提供微生物宿主细胞,该微生物宿主细胞包含位于该多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列附近的至少一个待修饰的基因组靶序列;
b)用以下转化该微生物宿主细胞:
i)该多核苷酸指导的内切核酸酶和用于该至少一个待修饰的靶序列的至少一种合适的指导多核苷酸,或者编码该多核苷酸指导的内切核酸酶和编码用于该至少一个待修饰的靶序列的至少一种合适的指导多核苷酸的一种或多种多核苷酸,和
ii)能够与该至少一个基因组靶序列杂交的至少一种单链寡核苷酸,所述寡核苷酸包含该一个或多个所需核苷酸修饰;
其中该多核苷酸指导的内切核酸酶与该指导多核苷酸和基因组相互作用并且切割或切开基因组,并且其中该至少一种单链核苷酸指导DNA修复穿过该切口或缺口,从而以至少以下的效率将该一个或多个所需修饰引入基因组的该靶序列中:
当该切口或缺口位于距该一个或多个所需核苷酸修饰10-20个核苷酸时为70%;当该切口或缺口位于距该一个或多个所需核苷酸修饰10-20个核苷酸时优选为至少75%、80%或85%;当该切口或缺口位于距该一个或多个所需核苷酸修饰10-20个核苷酸时最优选为至少90%;
当该切口或缺口位于距该一个或多个所需核苷酸修饰21-30个核苷酸时为60%;当该切口或缺口位于距该一个或多个所需核苷酸修饰21-30个核苷酸时优选为至少65%;当该切口或缺口位于距该一个或多个所需核苷酸修饰21-30个核苷酸时更优选为至少70%;
当该切口或缺口位于距该一个或多个所需核苷酸修饰31-43个核苷酸时为50%;当该切口或缺口位于距该一个或多个所需核苷酸修饰31-43个核苷酸时优选为至少55%;当该切口或缺口位于距该一个或多个所需核苷酸修饰31-43个核苷酸时更优选为至少60%;
当该切口或缺口位于距该一个或多个所需核苷酸修饰44-52个核苷酸时为40%;当该切口或缺口位于距该一个或多个所需核苷酸修饰44-52个核苷酸时优选为至少45%;当该切口或缺口位于距该一个或多个所需核苷酸修饰44-52个核苷酸时更优选为至少50%;或者
当该切口或缺口位于距该一个或多个所需核苷酸修饰至少53个核苷酸时为30%;当该切口或缺口位于距该一个或多个所需核苷酸修饰至少53个核苷酸时优选为至少35%;当该切口或缺口位于距该一个或多个所需核苷酸修饰至少53个核苷酸时更优选为至少40%。
宿主细胞
本发明还涉及微生物宿主细胞。将包含多核苷酸的构建体或载体引入宿主细胞中,使得该构建体或载体作为染色体整合体或作为自主复制的染色体外载体维持,如较早前所述。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不相同的任何亲本细胞子代。宿主细胞的选择将在很大程度上取决于编码多肽的基因及其来源。
宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞,例如原核生物或真核生物。
原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、肠球菌属(Enterococcus)、土芽孢杆菌属(Geobacillus)、乳杆菌属、乳球菌属(Lactococcus)、大洋芽孢杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)和链球菌属。革兰氏阴性细菌包括但不限于弯曲菌属(Campylobacter)、大肠杆菌、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属(Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟菌属(Neisseria)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)和脲原体属(Ureaplasma)。
细菌宿主细胞可以是任何芽孢杆菌属细胞,包括但不限于嗜碱芽孢杆菌(Bacillus alkalophilus)、高地芽孢杆菌(Bacillus altitudinis)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、植物解淀粉芽孢杆菌亚种(B.amyloliquefacienssubsp.plantarum)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacilluscirculans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、甲基营养型芽孢杆菌(Bacillus methylotrophicus)、短小芽孢杆菌(Bacillus pumilus)、沙福芽孢杆菌(Bacillus safensis)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)和苏云金芽孢杆菌(Bacillusthuringiensis)细胞。
细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于类马链球菌(Streptococcus equisimilis)、化脓链球菌、乳房链球菌(Streptococcus uberis)和马链球菌兽疫亚种(Streptococcus equi subsp.Zooepidemicus)细胞。
细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于不产色链球菌(Streptococcus achromogenes)、除虫链球菌(Streptococcus avermitilis)、天蓝链球菌(Streptococcus coelicolor)、灰色链球菌(Streptococcus griseus)和浅青紫链球菌(Streptococcus lividans)细胞。
将DNA引入芽孢杆菌属细胞中可以通过以下方式来实现:原生质体转化(参见例如,Chang和Cohen,1979,Mol.Gen.Genet.[分子与普通遗传学]168:111-115)、感受态细胞转化(参见例如,Young和Spizizen,1961,J.Bacteriol.[细菌学杂志]81:823-829;或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.[分子生物学杂志]56:209-221)、电穿孔(参见例如,Shigekawa和Dower,1988,Biotechniques[生物技术]6:742-751)或接合(参见例如,Koehler和Thorne,1987,J.Bacteriol.[细菌学杂志]169:5271-5278)。将DNA引入大肠杆菌细胞中可以通过以下方式来实现:原生质体转化(参见例如,Hanahan,1983,J.Mol.Biol.[分子生物学杂志]166:557-580)或电穿孔(参见例如,Dower等人,1988,Nucleic Acids Res.[核酸研究]16:6127-6145)。将DNA引入链球菌属细胞中可以通过以下方式来实现:原生质体转化、电穿孔(参见例如,Gong等人,2004,Folia Microbiol.[叶线形微生物学](布拉格(Praha))49:399-405)、接合(参见例如,Mazodier等人,1989,J.Bacteriol.[细菌学杂志]171:3583-3585)或转导(参见例如,Burke等人,2001,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]98:6289-6294)。将DNA引入假单孢菌属细胞中可以通过以下方式来实现:电穿孔(参见例如,Choi等人,2006,J.Microbiol.Methods[微生物学方法杂志]64:391-397)或接合(参见例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.[应用与环境微生物学]71:51-57)。将DNA引入链球菌属细胞中可以通过以下方式来实现:天然感受态(参见例如,Perry和Kuramitsu,1981,Infect.Immun.[感染与免疫]32:1295-1297)、原生质体转化(参见例如,Catt和Jollick,1991,Microbios[微生物学]68:189-207)、电穿孔(参见例如,Buckley等人,1999,Appl.Environ.Microbiol.[应用与环境微生物学]65:3800-3804)或接合(参见例如,Clewell,1981,Microbiol.Rev.[微生物学评论]45:409-436)。然而,可以使用本领域已知的将DNA引入宿主细胞中的任何方法。
宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。
宿主细胞可以是真菌细胞。如本文所用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如由Hawksworth等人在以下文献中所定义的:Ainsworth and Bisby’s Dictionary of The Fungi[安斯沃思和拜斯比真菌字典],第8版,1995,CAB International[国际应用生物科学中心],University Press[大学出版社],英国剑桥)。
真菌宿主细胞可以是酵母细胞。如本文所用的“酵母”包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类可能在将来变化,出于本发明的目的,酵母应当如Biology and Activities of Yeast[酵母的生物学与活性](Skinner,Passmore和Davenport编辑,Soc.App.Bacteriol.Symposium Series No.9[应用细菌学学会专题论文集系列9],1980)中所述的那样定义。
酵母宿主细胞可以是假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或耶氏酵母属(Yarrowia)细胞,如乳酸克鲁维酵母(Kluyveromyces lactis)、卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、卵形酵母(Saccharomyces oviformis)或解脂耶氏酵母(Yarrowia lipolytica)细胞。
真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门的所有丝状形式(如由Hawksworth等人,1995,见上文所定义的)。丝状真菌的特征通常在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸来进行的,并且碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽来进行的,并且碳分解代谢可以是发酵性的。
丝状真菌宿主细胞可以是枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管菌属(Bjerkandera)、拟腊菌属(Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、线黑粉菌科(Filibasidium)、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、链孢霉属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)或木霉属(Trichoderma)细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌(Chrysosporium keratinophilum)、卢克诺文思金孢子菌(Chrysosporiumlucknowense)、粪状金孢子菌(Chrysosporium merdarium)、毡金孢子菌(Chrysosporiumpannicola)、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌(Chrysosporium tropicum)、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢(Fusariumbactridioides)、谷类镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusariumroseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusariumvenenatum)、特异腐质霉(Humicola insolens)、柔毛腐质霉(Humicola lanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢霉(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotuseryngii)、土生梭孢壳(Thielavia terrestris)、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉或绿色木霉(Trichoderma viride)细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身已知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适程序描述于以下文献中:EP238023;Yelton等人,1984,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:1470-1474;以及Christensen等人,1988,Bio/Technology[生物/技术]6:1419-1422。用于转化镰孢属物种的合适方法由Malardier等人,1989,Gene[基因]78:147-156和WO 96/00787描述。可以使用由以下文献描述的程序转化酵母:Becker和Guarente,在Abelson,J.N.和Simon,M.I.编辑,Guide to Yeast Genetics and Molecular Biology[酵母遗传学与分子生物学指南],Methods in Enzymology[酶学方法],第194卷,第182-187页,Academic Press,Inc.[学术出版社公司],纽约);Ito等人,1983,J.Bacteriol.[细菌学杂志]153:163;以及Hinnen等人,1978,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:1920。
在本发明的方法中采用丝状真菌宿主细胞是有利的,该丝状真菌宿主细胞不能快速修复一个或多个被切开或切割的靶序列而没有整合基因组的修饰的供体部分。
因此,优选的是本发明第一方面的步骤(A)中提供的丝状真菌宿主细胞包含灭活的非同源末端连接(NHEJ)系统;优选地,细胞包含灭活的DNA连接酶D(LigD)和/或DNA末端结合蛋白Ku;甚至更优选地,细胞包含灭活的ligD、ku70和或ku80基因或其一种或多种同源物。
在优选实施例中,在第一方面的步骤之前或之后,用编码目的多肽的多核苷酸转化微生物宿主细胞;优选地,目的多肽是酶;优选地,酶是水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶;甚至更优选地,酶是α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
多核苷酸指导的内切核酸酶
在本披露的方法中,可以使用任何多核苷酸指导的内切核酸酶,考虑RNA和DNA指导的内切核酸酶两者。
RNA指导的DNA内切核酸酶可以是Cas内切核酸酶、Mad内切核酸酶或Cpf内切核酸酶。
在一个方面,Cas内切核酸酶可以是可用于本披露方法的任何Cas内切核酸酶或其功能片段。在一个实施例中,Cas内切核酸酶是Cas9内切核酸酶。Cas9内切核酸酶的实例是来自以下细菌物种的Cas9内切核酸酶:链球菌属物种(Streptococcus sp.)(例如,化脓链球菌、变形链球菌(S.mutans)和嗜热链球菌(S.thermophilus))、弯曲菌属物种(Campylobacter sp.)(例如,空肠弯曲菌(C.jejuni))、奈瑟菌属物种(Neisseria sp.)(例如,脑膜炎奈瑟菌(N.meningitidis))、弗朗西斯氏菌属物种(Francisella sp.)(例如,新凶手弗朗西斯氏菌)以及巴氏杆菌属物种(Pasteurella sp.)(例如,多杀性巴氏杆菌(P.multocida))。有关Cas9内切核酸酶的讨论,参见Makarova等人,2015,Nature[自然]13:722-736。
在另一个实施例中,Cas9内切核酸酶是化脓链球菌Cas9或其同源物。在另一个实施例中,Cas9内切核酸酶是变形链球菌Cas9内切核酸酶。在另一个实施例中,Cas9内切核酸酶是嗜热链球菌Cas9内切核酸酶。在另一个实施例中,Cas9内切核酸酶是空肠弯曲菌Cas9内切核酸酶。在另一个实施例中,Cas9内切核酸酶是脑膜炎奈瑟菌Cas9内切核酸酶。在另一个实施例中,Cas9内切核酸酶是新凶手弗朗西斯氏菌Cas9内切核酸酶。在另一个实施例中,Cas9内切核酸酶是多杀性巴氏杆菌Cas9内切核酸酶。
在另一个实施例中,Cas9内切核酸酶变体仅具有一个活性核酸酶结构域。在更优选的实施例中,Cas9内切核酸酶变体在与化脓链霉菌(Streptomyces pyogenes)Cas9氨基酸序列的位置10对应的氨基酸位置中包含用丙氨酸进行的取代。在最优选的实施例中,多核苷酸指导的内切核酸酶仅具有一个活性核酸酶结构域;优选地,所述变体是化脓链球菌Cas9,其在与位置10对应的氨基酸位置中包含丙氨酸对天冬氨酸的取代D10A
在另一个实施例中,Cas9内切核酸酶是亲本Cas9内切核酸酶的变体。在一个实施例中,Cas9内切核酸酶变体是其中的RuvC结构域被来自化脓链球菌的Cas9内切核酸酶中的D10A突变灭活的Cas9切口酶(Sander和Joung,2013,Nature Biotechnology[自然生物技术]1-9)。预期其他II类Cas9酶可以被类似地修饰。
在另一个方面,Mad内切核酸酶可以是可用于本披露方法的任何Mad内切核酸酶或其功能片段。在一个实施例中,Mad内切核酸酶是MAD7内切核酸酶。MAD7内切核酸酶的实例是来自直肠真杆菌的MAD7内切核酸酶。有关MAD7内切核酸酶的讨论,参见WO 2018/071672。
在另一个实施例中,MAD7内切核酸酶是真杆菌属(Eubacterium)MAD7内切核酸酶。在另一个实施例中,真杆菌属MAD7内切核酸酶是直肠真杆菌MAD7内切核酸酶。
在一个方面,Cpf内切核酸酶可以是可用于本披露方法的任何Cpf内切核酸酶或其功能片段。在一个实施例中,Mad内切核酸酶是Cpf1内切核酸酶。Cpf1内切核酸酶的实例是来自氨基酸球菌属物种、毛螺菌科物种和新凶手弗朗西斯氏菌的Cpf1内切核酸酶。有关Cpf1内切核酸酶的讨论,参见Zetsche等人,2015,Cell[细胞]163(3):759-771。
在另一个实施例中,Cpf1内切核酸酶是氨基酸球菌属Cpf1内切核酸酶。在另一个实施例中,Cpf1内切核酸酶是毛螺菌科Cpf1内切核酸酶。在另一个实施例中,Cpf1内切核酸酶是弗朗西斯氏菌属(Francisella)Cpf1内切核酸酶。在另一个实施例中,Cpf1内切核酸酶是新凶手弗朗西斯氏菌Cpf1内切核酸酶。
在另一个实施例中,编码RNA指导的DNA内切核酸酶的基因是用于在真菌细胞中表达的密码子优化的合成序列。
在另一个实施例中,RNA指导的DNA内切核酸酶基因与编码核定位信号的一种或多种多核苷酸可操作地连接,因此所表达的内切核酸酶被有效地从细胞质转运到细胞核。核定位信号的实例是SV40核定位信号、构巢曲霉GATA转录因子(AreA)、用于纤维素酶和半纤维素酶基因表达的里氏木霉转录调控子(XYR1)、里氏木霉蓝光调控子2(blr2)、非洲爪蟾卵母细胞核质蛋白核定位信号、秀丽隐杆线虫转录因子EGL-13核定位信号、智人转录因子c-Myc核定位信号和大肠杆菌复制叉停滞蛋白(TUS蛋白)核定位信号。
指导RNA
CRISPR-Cas9基因组编辑中的指导RNA(gRNA)构成了使得系统如此通用的可重编程部分。在天然化脓链霉菌系统中,指导RNA是两种RNA多核苷酸的复合物:含有约20个决定Cas9酶的特异性的核苷酸的crRNA以及与crRNA杂交以形成与Cas9内切核酸酶相互作用的RNA复合物的tracrRNA。参见Jinek等人,2012,Science[科学]337:816-821。
由于CRISPR-Cas9系统的发现,单指导RNA已被开发并成功地应用,恰好与天然两部分指导RNA复合物一样有效。
在本披露的方法中,可以使用任何指导RNA系统。
在一个实施例中,指导RNA是天然化脓链霉菌系统(Jinek等人,2012,Science[科学]337(6096):816-821)。
在另一个实施例中,称为单指导RNA(sgRNA)的指导RNA是工程化的单链嵌合RNA,其组合了细菌反式激活CRISPR RNA(tracrRNA)的支架功能与细菌CRISPR RNA(crRNA)的特异性。crRNA的5'末处的最后17-20bp作为“向导”,其通过RNA-DNA碱基配对,将Cas9/gRNA复合物招募到直接在原型间隔子相邻基序(PAM)上游的特定DNA靶位点。
在另一个实施例中,单指导RNA包含含有17至20个或更多个核苷酸的第一RNA,其与靶序列至少85%(例如,90%、95%、96%、97%、98%、99%或100%)互补并且能够与靶序列杂交。
在另一个实施例中,包含17至20个或更多个核苷酸的第一RNA与靶序列至少90%、95%、97%、98%、99%或甚至100%互补并且能够与靶序列杂交。
在另一个实施例中,单指导RNA是化脓链霉菌Cas9指导RNA。在另一个实施例中,指导RNA是直肠真杆菌MAD7指导RNA。在另一个实施例中,指导RNA是Cpf1指导RNA。
基因组靶序列
至少一个基因组靶序列将通过本发明的方法进行修饰,并且该靶序列必须位于多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列附近;优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从10至1,000个核苷酸处;优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从10至500个核苷酸处;更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从20至250个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从21至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从22至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从23至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从24至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从25至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从26至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从27至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从28至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从29至100个核苷酸处;甚至更优选地,该至少一个待修饰的基因组靶序列在微生物宿主细胞基因组中位于距多核苷酸指导的内切核酸酶的原型间隔子相邻基序(PAM)序列从30至100个核苷酸处。
基因组靶序列中的实际切口或缺口是在基因组中紧邻PAM序列的“原型间隔子互补”序列内制造的。原型间隔子互补序列的长度通常为20个核苷酸左右,以便允许其与指导多核苷酸的对应原型间隔子序列杂交,但是甚至更短的序列也已显示出起作用,如指导物中的17个核苷酸的原型间隔子和基因组中的对应的17个核苷酸的原型间隔子互补序列。该至少一个待修饰的基因组靶序列可以位于基因组中的任何位置,但是通常将在编码序列或可读框内。
在优选实施例中,宿主细胞中的至少两个基因组靶序列通过一个或多个核苷酸或密码子的至少一个插入、缺失和/或取代进行修饰。
在另一个优选实施例中,该一个或多个所需核苷酸修饰包含一个或多个核苷酸或密码子的至少一个插入、缺失和/或取代。
基因组中的每个原型间隔子互补序列均需要具有紧邻它的合适的原型间隔子相邻基序(PAM),以允许对应的多核苷酸指导的内切核酸酶结合和切割或切开基因组。术语“原型间隔子相邻基序”或“PAM”意指紧邻基因组中的靶位点下游或上游的2-6个碱基对的DNA序列,其被RNA指导的DNA内切核酸酶(例如,Cas9、MAD7或Cpf1内切核酸酶)直接识别,以促进RNA指导的DNA内切酶对靶位点的切割。来自化脓链球菌的Cas9内切核酸酶识别gRNA序列的3'端上的5'-NGG。来自直肠真杆菌的MAD7内切核酸酶识别gRNA序列的5'端上的5'-TTTV,但是5'-YTTV和YTTN也在一定程度上起作用。来自氨基酸球菌属物种和毛螺菌科物种的Cpf1内切核酸酶识别5'-TTTN,并且来自新凶手弗朗西斯氏菌的Cpf1内切核酸酶识别gRNA的5'端上的5'-TTN-3'。有关其他PAM序列的综述,参见例如Shah,S.A.等人,Protospacer recognition motifs[原型间隔子识别基序],RNA Biol.[RNA生物学]2013年5月1日;10(5):891-899。
单链寡核苷酸
本发明第一方面的单链寡核苷酸用作供体DNA,也称为DNA修复模板。单链寡核苷酸包含用于修饰或编辑微生物宿主细胞的靶位点的核苷酸序列以及与靶位点的紧邻上游和下游对应的另外的同源序列(称为“5'同源序列”和“3'同源序列”)。每个同源序列的长度可以改变,但是通常单链寡核苷酸包含在基因组中相对于该一个或多个修饰在切口或缺口的相对侧上的至少15个未修饰的核苷酸以及在基因组中相对于切口或缺口在该一个或多个修饰的相对侧上的至少15个未修饰的核苷酸;优选至少16个未修饰的核苷酸;每侧上优选至少17、18、19、20、21、22、23、24、25、26个或至少27个未修饰的核苷酸。
用于修饰靶位点的非限制性实例是缺失基因或其部分、破坏基因、改变基因内的一个或多个核苷酸、用编码具有改进的生物活性的蛋白质(例如,同系物或变体)的异源基因替代基因、将突变引入基因中、用编码具有不同生物活性的蛋白质的异源基因替代基因、插入基因或修复基因。
在一个实施例中,用于修饰靶位点的目的核苷酸序列包含至少30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1,000、2,000、4,000、6,000、8,000或10,000个核苷酸。
在一种或多种单链寡核苷酸的PAM或原型间隔子对应序列中包括一个或多个另外的突变可能是有利的,使得当第一方面的方法已按预期起作用并且已将所需修饰引入基因组中时,基因组中的PAM位点和原型间隔子互补序列将已被突变,以避免来自多核苷酸指导的内切核酸酶的剩余活性的任何后续切口或缺口。
因此,在优选实施例中,除了该一个或多个所需核苷酸修饰之外,该至少一种单链寡核苷酸还包含在PAM或原型间隔子序列中的一个或多个突变,其中所述一个或多个突变在引入靶序列中时有效地阻断多核苷酸指导的内切核酸酶。
用于多肽表达的多核苷酸
在一个实施例中,目的核苷酸序列是基因。目的基因可以是。氧化还原酶、转移酶、水解酶、裂解酶、异构酶或连接酶。在另一个方面,多肽是乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、氨肽酶、α-淀粉酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、香豆酸酯酶、环糊精糖基转移酶、角质酶、环糊精糖基转移酶、脱酰胺酶、脱氧核糖核酸酶、分散素(dispersin)、内切葡聚糖酶、酯酶、阿魏酸酯酶、具有纤维素分解增强活性的GH61多肽、α-半乳糖苷酶、β-半乳糖苷酶、葡糖脑苷脂酶、葡糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡糖醛酸糖苷酶、葡萄糖醛酸酯酶、卤素过氧化物酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、溶菌酶、甘露聚糖酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷酸二酯酶、磷脂酶、植酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、α-1,6-转葡糖苷酶、转谷氨酰胺酶、尿激酶、黄原胶酶、木聚糖酶或β-木糖苷酶
在另一个方面,目的核苷酸序列是基因的区域。
区域可以是例如可读框、蛋白质编码序列、内含子位点、内含子增强基序、mRNA剪接位点、启动子、转录调控元件、转录终止子和翻译调控元件。
用于分离或克隆作为目的核苷酸序列的基因的技术是本领域已知的,并且包括从基因组DNA或cDNA或其组合进行分离。从基因组DNA克隆基因可以例如通过使用熟知的聚合酶链式反应(PCR)或用以对具有共有的结构特征的克隆的DNA片段进行检测的表达库抗体筛选来实现。参见例如,Innis等人,1990,PCR:A Guide to Methods and Application[PCR:方法和应用指南],Academic Press[学术出版社],纽约。可以使用其他核酸扩增程序,如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。
编码例如多肽的任何基因均可以在核苷酸序列水平上进行修饰以用作目的核苷酸序列。此类修饰可能不改变编码的多肽的氨基酸序列,或者它们可能导致氨基酸序列的变化,如缺失、插入或取代。
如果一个氨基酸被具有相似特征的另一个氨基酸取代,则它可以被称为保守取代。保守取代的实例是在下组之内:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)以及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不会改变比活性的氨基酸取代是本领域已知的并且例如由H.Neurath和R.L.Hill,1979,于The Proteins[蛋白质],Academic Press[学术出版社],纽约中描述。常见取代为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
可替代地,氨基酸改变可以具有这样的性质:改变多肽的物理化学特性。例如,氨基酸改变可以提高多肽的热稳定性、改变底物特异性、改变最适pH,等等。
可以根据本领域已知的程序,如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science[科学]244:1081-1085)来鉴定多肽中的必需氨基酸。在后一项技术中,在分子中的每个残基处引入单个丙氨酸突变,并且对所得突变型分子的活性进行测试以鉴定对于分子的活性至关重要的氨基酸残基。还参见,Hilton等人,1996,J.Biol.Chem.[生物化学杂志]271:4699-4708。酶或其他生物学相互作用的活性位点还可以通过对结构的物理分析来确定,如通过诸如下述技术来确定:核磁共振、晶体学、电子衍射或光亲和标记,连同对推定的接触位点氨基酸进行突变。参见例如,de Vos等人,1992,Science[科学]255:306-312;Smith等人,1992,J.Mol.Biol.[分子生物学杂志]224:899-904;Wlodaver等人,1992,FEBS Lett.[欧洲生化学会联合会快报]309:59-64。还可以从与相关多肽的比对来推断必需氨基酸的身份。
使用已知的诱变、重组和/或改组方法,随后进行相关的筛选程序可以做出单个或多个氨基酸取代、缺失和/或插入并对其进行测试,这些相关的筛选程序是如由Reidhaar-Olson和Sauer,1988,Science[科学]241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2152-2156;WO 95/17413;或WO 95/22625披露的那些。其他可以使用的方法包括易错PCR、噬菌体展示(例如Lowman等人,1991,Biochemistry[生物化学]30:10832-10837;美国专利号5,223,409;WO 92/06204)以及区域定向诱变(Derbyshire等人,1986,Gene[基因]46:145;Ner等人,1988,DNA 7:127)。
诱变/改组方法可以与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等人,1999,Nature Biotechnology[自然生物技术]17:893-896)。可以从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域的标准方法快速测序。这些方法允许快速确定多肽中各个氨基酸残基的重要性。
内切核酸酶或指导多核苷酸表达
本披露的方法涉及用于修饰真菌细胞基因组中的靶位点的几种核酸构建体。
在一个方面,核酸构建体包含编码多核苷酸指导的内切核酸酶(例如,Cas9或MAD7内切核酸酶)的多核苷酸,用于在真菌细胞基因组中的靶位点处引入双链切口或单链切口(缺口),其中真菌细胞包含紧邻靶位点附近的RNA指导的DNA内切核酸酶的原型间隔子相邻基序序列。
在另一个方面,核酸构建体包含(a)在(1)编码转移RNA的序列和(2)编码转移RNA序列的3'端处的单指导RNA的序列的5'端处可操作地连接的U6启动子序列;以及(b)在编码单指导RNA的序列的3'端处可操作地连接的U6转录终止子序列,其中单指导RNA将RNA指导的DNA内切核酸酶(例如,Cas9、MAD7或Cpf1内切核酸酶)指导至真菌细胞基因组中的靶位点以引入双链断裂,并且其中核酸构建体提高RNA指导的DNA内切核酸酶在靶位点处产生双链断裂的频率。
在优选实施例中,包含编码RNA指导的DNA内切核酸酶(例如,Cas9、MAD7或Cpf1内切核酸酶)的多核苷酸的核酸构建体以及包含(a)在(1)编码转移RNA的序列、(2)编码转移RNA序列的3'端处的单指导RNA的序列的5'端处可操作地连接的U6启动子序列和(b)在编码单指导RNA的序列的3'端处可操作地连接的U6转录终止子序列的核酸构建体在单个DNA片段或单个载体上。
用于多肽表达的核酸构建体
本发明还涉及转化到丝状真菌宿主细胞中用于多肽表达的核酸构建体。
待表达的多核苷酸与一个或多个控制序列可操作地连接,该一个或多个控制序列在与控制序列相容的条件下指导编码序列在合适的宿主细胞中的表达。可以用许多方式操作多核苷酸以提供多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操作可能是理想的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
控制序列可以是启动子,即被宿主细胞识别用于表达编码本发明的多肽的多核苷酸的多核苷酸。启动子含有介导多肽的表达的转录控制序列。启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸,包括突变型、截短型和杂合型启动子,并且可以获得自编码对宿主细胞而言同源或异源的细胞外或细胞内多肽的基因。
用于指导本发明的核酸构建体在细菌宿主细胞中的转录的合适启动子的实例是从以下基因中获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(Agaisse和Lereclus,1994,Molecular Microbiology[分子微生物学]13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon等人,1988,Gene[基因]69:301-315)、天蓝链球菌琼脂水解酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:3727-3731);以及tac启动子(DeBoer等人,1983,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]80:21-25)。其他启动子描述于Gilbert等人,1980,Scientific American[科学美国人]242:74-94的“Usefulproteins from recombinant bacteria[来自重组细菌的有用蛋白质]”;和在Sambrook等人,1989,见上文。串联启动子的实例披露于WO 99/43835中。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中的转录的合适启动子的实例是从以下的基因中获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、尖孢镰孢胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、米黑根毛霉(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶和里氏木霉翻译延伸因子,以及NA2-tpi启动子(来自曲霉属中性α-淀粉酶基因的修饰的启动子,其中已用来自曲霉属磷酸丙糖异构酶基因的未翻译的前导序列替代未翻译的前导序列;非限制性实例包括来自黑曲霉中性α-淀粉酶基因的修饰的启动子,其中已用来自构巢曲霉或米曲霉磷酸丙糖异构酶基因的未翻译的前导序列替换未翻译的前导序列);及其突变型、截短型和杂合型启动子。其他启动子描述于美国专利号6,011,147中。
在酵母宿主中,有用的启动子从以下的基因中获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。酵母宿主细胞的其他有用的启动子由Romanos等人,1992,Yeast[酵母]8:423-488描述。
控制序列也可以是被宿主细胞识别以终止转录的转录终止子。终止子可操作地连接至编码多肽的多核苷酸的3'-末端。在宿主细胞中有功能的任何终止子均可以用于本发明中。
细菌宿主细胞的优选终止子从以下的基因中获得:克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)和大肠杆菌核糖体RNA(rrnB)。
丝状真菌宿主细胞的优选终止子从以下的基因中获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶和里氏木霉翻译延伸因子。
酵母宿主细胞的优选终止子从以下的基因中获得:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。酵母宿主细胞的其他有用的终止子由Romanos等人(1992,见上文)描述。
控制序列还可以是启动子下游和基因的编码序列上游的mRNA稳定子区,其增加基因的表达。
合适的mRNA稳定子区的实例从以下基因中获得:苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(Hue等人,1995,Journal of Bacteriology[细菌学杂志]177:3465-3471)。
控制序列也可以是前导序列,即对宿主细胞翻译很重要的mRNA的非翻译区。前导序列可操作地连接至编码多肽的多核苷酸的5'-末端。可以使用在宿主细胞中有功能的任何前导序列。
丝状真菌宿主细胞的优选前导序列从以下的基因中获得:米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。
酵母宿主细胞的合适前导序列从以下的基因中获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
控制序列还可以是多腺苷酸化序列,即可操作地连接至多核苷酸的3'-末端并且当转录时被宿主细胞识别为将多腺苷残基添加至所转录的mRNA的信号的序列。可以使用在宿主细胞中有功能的任何多腺苷酸化序列。
丝状真菌宿主细胞的优选多腺苷酸化序列从以下的基因中获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖孢镰孢胰蛋白酶样蛋白酶。
酵母宿主细胞的有用的多腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.[分子细胞生物学]15:5983-5990描述。
控制序列还可以是编码与多肽的N末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5'端本身可以含有在翻译阅读框中天然与编码多肽的编码序列区段相连接的信号肽编码序列。可替代地,编码序列的5'端可以含有对编码序列而言外源的信号肽编码序列。在编码序列不天然地含有信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而,可以使用指导所表达的多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
细菌宿主细胞的有效信号肽编码序列是从以下的基因中获得的信号肽编码序列:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。其他信号肽由Simonen和Palva,1993,Microbiological Reviews[微生物评论]57:109-137描述。
丝状真菌宿主细胞的有效信号肽编码序列是从以下的基因中获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶。
酵母宿主细胞的有用的信号肽从以下的基因中获得:酿酒酵母α-因子和酿酒酵母转化酶。其他有用的信号肽编码序列由Romanos等人(1992,见上文)描述。
控制序列还可以是编码位于多肽的N末端的前肽的前肽编码序列。所得多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下的基因中获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。
在信号肽序列和前肽序列两者都存在的情况下,前肽序列位于紧邻多肽的N末端,并且信号肽序列位于紧邻前肽序列的N末端。
还可能希望的是添加调控序列,其相对于宿主细胞的生长调控多肽的表达。调控序列的实例是引起基因表达响应于化学或物理刺激(包括调控化合物的存在)而开启或关闭的那些。原核系统中的调控序列包括lac、tac和trp操纵子系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKA α-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调控序列的其他实例是允许基因扩增的那些。在真核系统中,这些调控序列包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸会与调控序列可操作地连接。
表达载体
本发明还涉及包含本发明的多核苷酸、启动子以及转录和翻译终止信号的重组表达载体。多个核苷酸和控制序列可以连接在一起以产生重组表达载体,其可以包括一个或多个便利的限制位点以允许编码多肽的多核苷酸在此类位点处的插入或取代。可替代地,可以通过将多核苷酸或包含多核苷酸的核酸构建体插入用于表达的适当载体中而表达多核苷酸。在产生表达载体时,编码序列如此位于载体中,使得编码序列与用于表达的适当控制序列可操作地连接。
重组表达载体可以是可方便地经受重组DNA程序并且可以引起多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是直链或闭合环状质粒。
载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微型染色体或人工染色体。载体可以含有用于确保自我复制的任何手段。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合到基因组中并与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单个载体或质粒或者两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组中的总DNA,或者可以使用转座子。
载体优选地含有允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一种或多种选择性标记。选择性标记是这样的基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属的抗性、对营养缺陷型的原养型等。
细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因、或赋予抗生素抗性(如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素或四环素抗性)的标记。酵母宿主细胞的合适标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、ade B(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5'-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)和trp C(邻氨基苯甲酸合酶)以及其等同物。优选用于在曲霉属细胞中使用的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链球菌(Streptococcus hygros copicus)bar基因。优选用于在木霉属细胞中使用的是adeA、adeB、amdS、hph和pyrG基因。
选择性标记可以是如WO 2010/039889中所述的双选择性标记系统。在一个方面,双选择性标记是hph-tk双选择性标记系统。
载体优选地含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
对于整合到宿主细胞基因组中,载体可以依靠编码多肽的多核苷酸序列或用于通过同源或非同源重组整合到基因组中的载体的任何其他元件。可替代地,载体可以含有用于指导通过同源重组而整合到宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性,整合元件应当含有足够数目的核酸,如从约30至约10,000个碱基对、或从约400至约10,000个碱基对、或从约800至约10,000个碱基对,这些核酸与对应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码多核苷酸。另一方面,载体可以通过非同源重组而整合到宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,其使得载体能够在讨论中的宿主细胞中自主复制。复制起点可以是在细胞中发挥作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使得质粒或载体能够在体内复制的多核苷酸。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,以及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于在酵母宿主细胞中使用的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1与CEN3的组合以及ARS4与CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等人,1991,Gene[基因]98:61-67;Cullen等人,1987,Nucleic Acids Res.[核酸研究]15:9163-9175;WO00/24883)。可以根据WO 00/24883中披露的方法完成AMA1基因的分离和包含该基因的质粒或载体的构建。
可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞中以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包括与多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数,其中通过在适当的选择性试剂的存在下培养细胞可以选择含有选择性标记基因的扩增的拷贝以及由此多核苷酸的另外的拷贝的细胞。
用于连接以上所述的元件以构建本发明的重组表达载体的程序是本领域技术人员熟知的(参见例如,Sambrook等人,1989,见上文)。
减少或消除基因表达
使用例如一个或多个核苷酸插入、破坏、取代或缺失来减少或消除多核苷酸的表达是本领域熟知的。
在本发明第一方面的方法中,在优选实施例中,修饰宿主细胞的基因组以确保多核苷酸的表达减少或消除,例如通过修饰、灭活或完全/部分缺失。例如,待修饰、灭活或缺失的多核苷酸可以是活性必需的编码区或其一部分、或编码区的表达所需调控元件。这种调控或控制序列的实例可以是启动子序列或其功能部分,即足以影响多核苷酸的表达的部分。可修饰的其他控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活因子。
多核苷酸的修饰或灭活可以通过在基因中或在其转录或翻译所需的调控元件中插入、取代或缺失一个或多个核苷酸来完成。例如,可以插入或去除核苷酸从而导致终止密码子的引入、起始密码子的去除或可读框的变化。此类修饰或灭活可以根据本领域已知的方法通过定点诱变或PCR产生的诱变来完成。尽管原则上,修饰可以在体内进行,即直接在表达待修饰的多核苷酸的细胞上进行,但优选的是如下所示例地在体外进行修饰。
消除或减少多核苷酸的表达的便利方法的实例是基于基因替代、基因缺失或基因破坏技术的。例如,在基因破坏方法中,将与内源多核苷酸对应的核酸序列在体外诱变以产生缺陷核酸序列,然后将其转化到亲本细胞中以产生缺陷基因。通过同源重组,缺陷核酸序列替代内源多核苷酸。可能希望的是,缺陷多核苷酸还编码可用于选择其中的多核苷酸已被修饰或破坏的转化体的标记。在一个方面,用选择性标记如本文所述的那些来破坏多核苷酸。
这些多肽缺陷型突变型细胞作为用于天然和异源多肽的表达的宿主细胞尤其有用。因此,本发明进一步涉及产生天然或异源多肽的方法,这些方法包括(a)在有益于产生该多肽的条件下培养突变型细胞;以及(b)回收该多肽。术语“异源多肽”意指对宿主细胞而言不是天然的多肽,例如天然蛋白质的变体。宿主细胞可以包含多于一个拷贝的编码天然或异源多肽的多核苷酸。
通过以下实例进一步描述本发明,这些实例不应当理解为对本发明的范围进行限制。
实例
这些实例的目的是证明使用多核苷酸指导的内切核酸酶(如Cas9或MAD7)的定向诱变或基因组编辑是可能的,其中使用单链寡核苷酸作为供体DNA。
菌株
里氏木霉BTR213描述于WO 2013/086633中。里氏木霉菌株TrGMEr62-24a2-1是里氏木霉BTR213的ku70破坏菌株。
米曲霉AT526是来源于在WO 18167153(实例4)中描述的JaL1903的ligD破坏菌株。
培养基和溶液
LB+Amp培养基由以下构成:10g的Bacto
PDA板由39g的Difco
PDA+1M蔗糖板由以下构成:39g的Difco
PEG缓冲液由去离子水中的50%聚乙二醇(PEG)4000、10mM Tris-HCl(pH 7.5)和10mM CaCl
STC由去离子水中的1M山梨醇、10mM Tris(pH 7.5)和50mM CaCl
TBE缓冲液由以下构成:10.8g的Tris碱、5g的硼酸、4ml的0.5M EDTA(pH 8)和补足至1升的去离子水。
TE缓冲液由1M Tris(pH 8.0)和0.5M EDTA(pH 8.0)构成。
2xYT+Amp板由以下构成:16g的Bacto
YP培养基由去离子水中的1%Bacto
YPD培养基由1%Bacto
顶级琼脂溶液由去离子水中的0.18μM Na
用于蔗糖+尿素板的培养基由去离子水中的0.18μM Na
用于蔗糖+尿素+Triton板的培养基由去离子水中的0.18μM Na
实例1:里氏木霉原生质体产生
使用与Penttila等人,1987,Gene[基因]61:155-164类似的方案进行里氏木霉的原生质体制备与转化。简而言之,将里氏木霉在27℃下在各自含有25ml的YPD培养基的两个摇瓶中在90rpm轻轻搅拌下培养17小时。将菌丝体通过使用真空驱动一次性过滤系统(密理博公司(Millipore))过滤来收集,并且用去离子水洗涤两次并用1.2M山梨醇洗涤两次。通过在34℃下以75-90rpm轻轻振荡使洗涤的菌丝体悬浮于30ml含有5mg/ml的Yatalase
实例2:CRISPR/Cas9骨架载体pSMAI290
质粒pSMAI290(SEQ ID NO:1,图1)是CRISPR/Cas9表达质粒,用于使用
实例3:pNJOC502-504的构建
由赛默飞世尔科技公司将其延伸序列用于克隆的每个原型间隔子(oNJ336、oNJ338和oNJ340)合成为单链寡核苷酸。将所有原型间隔子寡核苷酸稀释至最终工作浓度为1μM:
oNJ336;SEQ ID NO:3。
oNJ338;SEQ ID NO:4。
oNJ340;SEQ ID NO:5。
实例4:pNJOC502-504与单链寡核苷酸的共转化
本实验的目的是检查单链寡核苷酸是否可以用作使用多核苷酸指导的核酸酶(如MAD7、Cas9等)进行基因组编辑的供体DNA。pNJOC502-pNJOC504是表达Cas9的自主复制质粒(含有AMA1),其是靶向里氏木霉ACE3基因座的特定序列和hph选择标记(潮霉素B抗性)的sgRNA构建体。如此设计寡核苷酸,使得在供体DNA与靶基因座之间重组时,ACE3基因座处的整个靶序列将被HindIII位点替代(以便于通过PCR和HindIII消化进行筛选)。将TrGMEr62-24a2-1原生质体在冰上解冻。对于每次转化,将大约2μg质粒DNA和5μl单链寡核苷酸(100μM,由赛默飞世尔科技公司合成)添加至100μl解冻的原生质体溶液中,并且轻轻混合。添加PEG缓冲液(250μl),并且将反应物混合并在34℃下孵育30分钟。在转化后,将1ml的STC添加至每种转化反应物中,并且将内容物涂布在PDA+1M蔗糖板上并在30℃下孵育过夜。第二天,添加由PDA+潮霉素B组成的覆盖物至最终浓度为10μg/ml潮霉素B,并且将板在30℃下孵育5-7天。每次转化获得大约100-200个转化体。为了确定编辑频率,从每个转化板中挑取少量潮霉素抗性菌落,并且将其转移至PDA板上并在30℃下孵育5-7天。对于每个转化体,用1μl无菌接种环收集孢子,并且将其悬浮于薄壁PCR管中的20μl稀释缓冲液(PHIRE
oNJ456;SEQ ID NO:10
oNJ459;SEQ ID NO:11
每种PCR反应物由以下构成:1μl孢子悬浮液、10pmol每种引物、10μl的2X PHIRE
为了鉴定编辑的转化体,用HindIII消化PCR产物。编辑的转化体应当在PCR/HindIII消化后产生两个条带,而未编辑的转化体应当仅产生单个条带(不存在HindIII位点)。每种HindIII消化反应物由以下构成:5μl PCR产物、1x CutSmart缓冲液(新英格兰生物实验室公司)、6个单位的HindIII-HF酶(新英格兰生物实验室公司)和至最终体积为20μl的无菌Milli-Q H
表1.
实例5:距切割位点长达43bp递送SNV
几项研究已证明,在距切割位点的距离与使用单链寡核苷酸作为供体DNA的突变掺入之间存在负相关[(Inui,M.等人,Rapid generation of mouse models with definedpoint mutations by the CRISPR/Cas9 system[通过CRISPR/Cas9系统快速产生具有限定点突变的小鼠模型].Sci Rep[科学报告].2014;4:5396)、(Wang,K.等人,EfficientGeneration of Orthologous Point Mutations in Pigs via CRISPR-assisted ssODN-mediated Homology-directed Repair[经由CRISPR辅助的ssODN介导的同源定向修复在猪中高效产生直向同源点突变].Mol Ther Nucleic Acids[分子疗法-核酸].2016年11月;5(11):e396)、(Paquet,D.等人,Efficient introduction of specific homozygous andheterozygous mutations using CRISPR/Cas9[使用CRISPR/Cas9高效引入特定纯合和杂合突变].Nature[自然],2016.533:第125-129页)]。在猪(猪胎儿成纤维细胞)中,Wang等人(2016)证明了11bp的突变到切口距离导致两个点突变之间同源定向修复效率的显著差异[Wang,K.等人,Efficient Generation of Orthologous Point Mutations in Pigs viaCRISPR-assisted ssODN-mediated Homology-directed Repair[经由CRISPR辅助的ssODN介导的同源定向修复在猪中高效产生直向同源点突变].Mol Ther Nucleic Acids[分子疗法-核酸].2016年11月;5(11):e396]。同样,对于人诱导多能干细胞,Paquet等人(2016)指出,为了高效的纯合突变掺入,切口到突变距离需要最小化[Paquet,D.等人,Efficientintroduction of specific homozygous and heterozygous mutations using CRISPR/Cas9[使用CRISPR/Cas9高效引入特定纯合和杂合突变].Nature[自然],2016.533:第125-129页]。类似地,对于小鼠,Inui等人(2014)报告,修饰位点与gRNA靶位点之间的距离是影响取代效率的重要参数[Inui,M.等人,Rapid generation of mouse models withdefined point mutations by the CRISPR/Cas9 system[通过CRISPR/Cas9系统快速产生具有限定点突变的小鼠模型].Sci Rep[科学报告].2014;4:5396]。
对于在酿酒酵母中进行定向诱变或基因组编辑,Horwitz等人(2015)报告,靶向切割的位点应当尽可能接近所需突变的位点。此外,为了破坏供体DNA中的Cas9p靶位点并且同时提高重组事件包括所需突变的机会,Horwitz等人(2015)在靶位点与点突变之间的密码子中进行了沉默改变(一种“异源性阻断”)[Horwitz,A.A.等人,Efficient MultiplexedIntegration of Synergistic Alleles and Metabolic Pathways in Yeasts viaCRISPR-Cas[经由CRISPR-Cas在酵母中进行协同等位基因和代谢途径的高效多重整合].Cell Syst[细胞系统].2015.1(1):第88-96页]。
本实验的目的是检查切割位点与预期突变之间的距离如何影响突变掺入的频率。使用pNJOC503 CRISPR/Cas9靶向质粒,并且将不同的单链寡核苷酸(作为
oNJ499;SEQ ID NO:18。
oNJ500;SEQ ID NO:19。
oNJ501;SEQ ID NO:20。
oNJ502;SEQ ID NO:21。
oNJ503;SEQ ID NO:22。
oNJ504;SEQ ID NO:23。
oNJ505;SEQ ID NO:24。
所有寡核苷酸均被设计用于将靶基因座处的NGG PAM位点的序列改变成NGT,以防止编辑的转化体中的Cas9识别和重新切割。将另外的突变掺入寡核苷酸中,对应于距Cas9切割位点下游8bp、13bp、23bp、33bp或43bp的突变(在图5中由
将TrGMEr62-24a2-1原生质体在冰上解冻。对于每次转化,将大约2μg的pNJOC503质粒DNA和5μl单链寡核苷酸(100μM)添加至100μl解冻的原生质体溶液中,并且轻轻混合。添加PEG缓冲液(250μl),并且将反应物混合并在34℃下孵育30分钟。在转化后,将1ml的STC添加至每种转化反应物中,并且将内容物涂布在PDA+1M蔗糖板上并在30℃下孵育过夜。第二天,添加由PDA+潮霉素B组成的覆盖物至最终浓度为10μg/ml潮霉素B,并且将板在30℃下孵育5-7天。每次转化获得大约100-200个转化体。为了确定编辑频率,从每个转化板中挑取6-12个潮霉素抗性转化体,并且将其转移至PDA板上并在30℃下孵育5-7天。对于每个转化体,用1μl无菌接种环收集孢子,并且将其悬浮于薄壁PCR管中的20μl稀释缓冲液(PHIRE
每种PCR反应物由以下构成:1μl孢子悬浮液、10pmol每种引物、10μl的2X PHIRE
表2.
可能的是高效地将突变转移地远离切割位点(在本实验中长达43bp)(60%-100%的编辑的转化体含有所有预期突变)。突变转移效率远高于使用单链寡核苷酸对哺乳动物细胞[(Inui,M.等人,Rapid generation of mouse models with defined pointmutations by the CRISPR/Cas9 system[通过CRISPR/Cas9系统快速产生具有限定点突变的小鼠模型].Sci Rep[科学报告].2014;4:5396)、(Wang,K.等人,Efficient Generationof Orthologous Point Mutations in Pigs via CRISPR-assisted ssODN-mediatedHomology-directed Repair[经由CRISPR辅助的ssODN介导的同源定向修复在猪中高效产生直向同源点突变].Mol Ther Nucleic Acids[分子疗法-核酸].2016年11月;5(11):e396)、(Paquet,D.等人,Efficient introduction of specific homozygous andheterozygous mutations using CRISPR/Cas9[使用CRISPR/Cas9高效引入特定纯合和杂合突变].Nature[自然],2016.533:第125-129页)]或使用双链寡核苷酸对酵母[Horwitz,A.A.等人,Efficient Multiplexed Integration of Synergistic Alleles andMetabolic Pathways in Yeasts via CRISPR-Cas[经由CRISPR-Cas在酵母中进行协同等位基因和代谢途径的高效多重整合].Cell Syst[细胞系统].2015.1(1):第88-96页]所报告的效率。
实例6:距切割位点长达63bp递送SNV
基于上述实例中提到的有希望的结果,决定测试是否可以将突变转移地距切割位点更远,以及突变每侧上的同源量在多大程度上影响转移效率(图6)。在本实验中测试了八种不同的单链寡核苷酸(作为
表3.
使用单链寡核苷酸,可能的是高效地距切割位点长达63bp引入突变,因为31%-84%的编辑的转化体含有所有所需突变(PAM突变和在距切割位点不同距离处插入的另一个突变)。突变转移是高效的,即使是在预期突变之外的连续的未修饰的核苷酸数目减少至约30bp或约20bp的情况下。总体上,实例5和实例6的结果证明,使用单链寡核苷酸可以以令人惊讶的高效率引入远离切割位点的突变。这些是重要的结果,因为不一定总能找到好的原型间隔子和接近目的靶位点的PAM序列。例如,对于含有25%的碱基A、T、C和G中每一个的序列,将预期酶(如MAD7(MAD7显示出对TTTV或CTTV PAM位点的偏好))的四核苷酸TTTN或CTTN PAM序列(其中N是A、T、C或G)对于DNA的每条链大约每64bp而存在或总体上每32pb而存在一次。这些结果扩大了序列的量,这些序列可以高效地靶向用于CRISPR介导的突变和使用单链寡核苷酸进行基因组编辑。
实例7:使用减少量的单链寡核苷酸进行CRISPR/Cas9和单链寡核苷酸介导的编辑
对于使用单链寡核苷酸的高通量诱变工作,如果每次转化可以使用较少的寡核苷酸将是有利的,因为这将通过允许为多个目的重复使用相同的寡核苷酸和/或以较小的规模合成寡核苷酸来降低总成本(每核苷酸的价格较低)。因此,我们想测试单链寡核苷酸的量如何影响转化和编辑效率。将TrGMEr62-24a2-1原生质体在冰上解冻。对于每次转化,将大约2μg的pNJOC503质粒DNA和10-500pmol oNJ346(SEQ ID NO:16)单链寡核苷酸(与0.1-5μl 100μM储备液对应)添加至100μl解冻的原生质体溶液中,并且轻轻混合。添加PEG缓冲液(250μl),并且将反应物混合并在34℃下孵育30分钟。在转化后,将1ml的STC添加至每种转化反应物中,并且将内容物涂布在PDA+1M蔗糖板上并在30℃下孵育过夜。第二天,添加由PDA+潮霉素B组成的覆盖物至最终浓度为10μg/ml潮霉素B,并且将板在30℃下孵育5-7天。除了用10pmol的oNJ346转化仅给出约50个转化体之外,每次转化获得大约100-200个转化体。使用Whatman
表4.
oNJ346单链寡核苷酸的量可以降低至20pmol而不会负面地影响编辑效率(>87%),并且仍保持较高的转化效率。这使得能够使用相同的寡核苷酸进行多次转化,并且允许以较小规模合成寡核苷酸。
实例8:米曲霉原生质体产生
根据Christensen等人,1988,Biotechnology[生物技术]6:1419-1422进行米曲霉转化。简言之,使米曲霉菌丝体在富营养培养液中生长。通过过滤从培养液中分离出菌丝体。将酶制剂
实例9:CRISPR/Mad7骨架载体pAT3630
质粒pAT3630(SEQ ID NO:33,图7)是CRISPR/Mad7表达质粒,用于使用
实例10:pAT3720的构建
由集成DNA技术公司将其延伸序列用于克隆的原型间隔子(oAT3858)合成为单链寡核苷酸。将原型间隔子寡核苷酸稀释至最终工作浓度为1μM:
oAT3858(SEQ ID NO:36):
AATTTCTACTCTTGTAGATacgatggtgctgatggctacttttttttttgagcatttatcagcttg
将具有正确的原型间隔子序列的质粒标记为pAT3720(SEQ ID NO:38,图8)并且保存以供以后使用。
实例11:距CRISPR/Mad7切割位点长达58bp递送SNV
基于上述实例中提到的使用CRISPR/Cas9获得的有希望的结果,决定测试是否可以使用CRISPR/Mad7将突变转移地距切割位点长达58bp,以使双链在靶位点处断裂。下表中报告的距切割位点的距离是相对于PAM位点的3'的位置19给出的。在本实验中测试了三种不同的单链寡核苷酸(oAT4070-oAT4072,作为
每种PCR反应物由以下构成:1μl孢子悬浮液、10pmol每种引物、10μl的2X PHIRE
表5.
在本实验中以样本量为8获得的转移效率与使用CRISPR/Cas9和单链寡核苷酸在里氏木霉中观察到的效率相当。
实例12:使用CRISPR/Cas9和单链寡核苷酸在黑曲霉中转移SNV
基于CRISPR/Cas9和CRISPR/Mad7所获得的有希望的结果,使用Cas9作为CRISPR核酸酶在ku70破坏黑曲霉宿主中测试了使用与CRISPR组合的单链寡核苷酸进行的SNV递送。使用CRISPR/Cas9和单链寡核苷酸作为供体DNA,靶向总共11个不同的基因进行编辑。总体上,当距Cas9切割位点7-26bp转移突变时,获得了60%-100%的SNV转移效率(数据未示出)。结果证明,使用与CRISPR Cas9组合的单链寡核苷酸插入SNV在黑曲霉中也是可能的。
实例13:CRISPR/Mad7骨架载体pGMEr263
质粒pGMEr263(SEQ ID NO:45,图9)是CRISPR/MAD7表达质粒,用于使用
直肠真杆菌Mad7的表达在来自pFC330-333的构巢曲霉tef1启动子(核苷酸8777-9662)和终止子(核苷酸13,479-13,883)的控制之下(
实例14:pGMEr263proto1-proto5的构建
由赛默飞世尔科技公司将其延伸序列用于克隆的每个原型间隔子(1228713、1228715、1228717、1228719和1228721)合成为单链寡核苷酸。每种寡核苷酸中的加下划线序列突出了五个二十一个核苷酸的原型间隔子。将所有原型间隔子寡核苷酸稀释至最终工作浓度为1μM:
1228713;SEQ ID NO:46
1228715;SEQ ID NO:47
1228717;SEQ ID NO:48
1228719;SEQ ID NO:49
1228721;SEQ ID NO:50
实例15:pGMEr263proto1-proto5与单链寡核苷酸在里氏木霉中的共转化
本实验的目的是检查单链寡核苷酸是否可以用作使用多核苷酸指导的核酸酶(如MAD7、Cas9等)进行基因组编辑的供体DNA。pGMEr263proto1-pGMEr2630proto5质粒是表达Mad7的自主复制质粒(含有AMA1),其是靶向里氏木霉ACE3基因座的特定序列和hph选择标记(潮霉素B抗性)的sgRNA构建体。如此设计寡核苷酸,使得在供体DNA与靶基因座之间重组时,ACE3基因座处的整个靶序列将被HindIII位点替代(以便于通过PCR和HindIII消化进行筛选)。将TrGMEr62-24a2-1原生质体在冰上解冻。对于每次转化,将大约2μg质粒DNA和3μl单链寡核苷酸(50μM,由赛默飞世尔科技公司合成)添加至100μl解冻的原生质体溶液中,并且轻轻混合。添加PEG缓冲液(250μl),并且将反应物混合并在34℃下孵育30分钟。在转化后,将1ml的STC添加至每种转化反应物中,并且将内容物涂布在PDA+1M蔗糖板上并在34℃下孵育过夜。第二天,添加由PDA+潮霉素B组成的覆盖物至最终浓度为10μg/ml潮霉素B,并且将板在30℃下孵育5-7天。每次转化获得大约15-20个转化体。为了确定编辑频率,从每个转化板中挑取少量潮霉素抗性菌落,并且将其转移至PDA板上并在30℃下孵育5-7天。对于每个转化体,用1μl无菌接种环收集孢子,并且将其悬浮于薄壁PCR管中的20μl稀释缓冲液(PHIRE
1228586(SEQ ID NO:57)
1228587(SEQ ID NO:58)
每种PCR反应物由以下构成:1μl孢子悬浮液、10pmol每种引物、10μl的2X PHIRE
为了鉴定编辑的转化体,用HindIII消化PCR产物。编辑的转化体应当在PCR/HindIII消化后产生两个条带,而未编辑的转化体应当仅产生单个条带(不存在HindIII位点)。每种HindIII消化反应物由以下构成:5μl PCR产物、1x CutSmart缓冲液(新英格兰生物实验室公司)、6个单位的HindIII-HF酶(新英格兰生物实验室公司)和至最终体积为20μl的无菌Milli-Q H
表6.
实例16:在里氏木霉中使用单链寡核苷酸距切割位点长达47bp经由CRISPR/Mad7编辑递送SNV
本实验的目的是在里氏木霉中经由CRISPR/Mad7基因组编辑检查切割位点与预期突变之间的距离如何影响突变掺入的频率。使用pGMEr263-proto1 CRISPR/Mad7靶向质粒,并且将不同的单链寡核苷酸(作为
寡核苷酸10(SEQ ID NO:69)
寡核苷酸11(SEQ ID NO:70)
寡核苷酸12(SEQ ID NO:71)
寡核苷酸13(SEQ ID NO:72)
寡核苷酸10-13被设计用于将靶基因座处的TTTV PAM位点的序列中的一个核苷酸改变成TTGV以及原型间隔子1区域中的一个核苷酸改变,以防止编辑的转化体中的Mad7识别和重新切割。将另外的突变掺入所有寡核苷酸中,对应于距Mad7切割位点下游20bp、32bp或47bp,或者上游-44bp的所需SNV的插入。下表中报告的距切割位点的距离是相对于PAM位点的3'的位置19给出的。下表示出了所使用的每种寡核苷酸中所有改变的位置。
表7.
所有寡核苷酸在被研究突变掺入的突变(SNV)的5'侧上均含有61-39个未修饰的核苷酸(nt),并且在3'侧上均含有33-41个未修饰的nt。
将TrGMEr62-24a2-1原生质体在冰上解冻。对于每次转化,将大约2μg的pGMER263-proto1质粒DNA和3μl单链寡核苷酸(50μM)添加至100μl解冻的原生质体溶液中,并且轻轻混合。添加PEG缓冲液(250μl),并且将反应物混合并在34℃下孵育30分钟。在转化后,将1ml的STC添加至每种转化反应物中,并且将内容物涂布在PDA+1M蔗糖板上并在34℃下孵育过夜。第二天,添加由PDA+潮霉素B组成的覆盖物至最终浓度为10μg/ml潮霉素B,并且将板在30℃下孵育5-7天。每次转化获得在0与30之间的转化体数目。为了确定编辑频率,从每个转化板中挑取最多15个潮霉素抗性转化体,并且将其转移至PDA板上并在30℃下孵育5-7天。对于每个转化体,用1μl无菌接种环收集孢子,并且将其悬浮于薄壁PCR管中的20μl稀释缓冲液(PHIRE
每种PCR反应物由以下构成:1μl孢子悬浮液、10pmol每种引物、10μl的2X PHIRE
表8.显示寡核苷酸与所需突变和切割位点之间的距离(核苷酸数目;Nt)(第2列);PAM突变(第3列);原型间隔子突变(原型间隔子中的位置编号)(第4列);通过同源定向修复(HDR)编辑的转化体数目(第5列);通过HDR和掺入的所有突变编辑的转化体数目(第6列)。
可能的是以36%-100%之间的编辑效率将突变转移至Mad7切割位点下游长达47nt和上游44nt。突变转移效率远高于使用单链寡核苷酸对哺乳动物细胞[(Inui,M.等人,Rapid generation of mouse models with defined point mutations by the CRISPR/Cas9 system[通过CRISPR/Cas9系统快速产生具有限定点突变的小鼠模型].Sci Rep[科学报告].2014;4:5396)、(Wang,K.等人,Efficient Generation of Orthologous PointMutations in P igs via CRISPR-assisted ssODN-mediated Homology-directedRepair[经由CRISPR辅助的ssODN介导的同源定向修复在猪中高效产生直向同源点突变].Mol Ther Nucleic Acids[分子疗法-核酸].2016年11月;5(11):e396)、(Paquet,D.等人,Efficient introduction of specific homozygous and hetero zygous mutationsusing CRISPR/Cas9[使用CRISPR/Cas9高效引入特定纯合和杂合突变].Nature[自然],2016.533:第125-129页)]或使用双链寡核苷酸对酵母[Horwitz,A.A.等人,EfficientMultiplexed Integration of Syn ergistic Alleles and Metabolic Pathways inYeasts via CRISPR-Cas[经由C RISPR-Cas在酵母中进行协同等位基因和代谢途径的高效多重整合].Cell S yst[细胞系统].2015.1(1):第88-96页]所报告的效率。
实例17:在里氏木霉中使用CRISPR/Mad7和dsDNA片段距切割位点长达553bp递送SNV
本实验的目的是检查SNV是否可以在CRISPR切割位点与预期突变之间有较大距离的情况下被靶向。将七种不同的CRISPR/Mad7靶向质粒与作为供体DNA的不同双链DNA(作为
所有供体DNA均被设计用于改变靶基因座处的TTTV PAM位点的序列以及在原型间隔子中引入沉默突变,以防止编辑的转化体中的Mad7识别和重新切割。将导致氨基酸改变的突变掺入修复片段中。此外,基于Horwitz等人(2015)的推荐,包括了在PAM突变与距切割位点长达553bp的所需突变之间的另外的“缓冲突变”,以观察添加额外的“缓冲突变”是否可以提高距切割位点更远的突变掺入率。
将TrGMEr62-24a2-1原生质体在冰上解冻。对于每次转化,将大约1.5μg的CRISPR/Mad7靶向质粒DNA和2-5μg双链供体DNA添加至100μl解冻的原生质体溶液中,并且轻轻混合。添加PEG缓冲液(250μl),并且将反应物混合并在37℃下孵育30分钟。在转化后,将1ml的STC添加至每种转化反应物中,并且将内容物涂布在PDA+1M蔗糖板上并在34℃下孵育过夜。第二天,添加由PDA+潮霉素B组成的覆盖物至最终浓度为10μg/ml潮霉素B,并且将板在30℃下孵育5-7天。每次转化获得大约2-8个转化体。为了确定编辑频率,从每个转化板中挑取潮霉素抗性转化体,并且将其转移至PDA板上并在30℃下孵育5-7天。对于每个转化体,用1μl无菌接种环收集孢子,并且将其悬浮于薄壁PCR管中的20μl稀释缓冲液(PHIRE
每种PCR反应物由以下构成:0.5μl孢子悬浮液、10pmol每种引物、5μl的2X PHIRE
表9.
可能的是高效地将突变转移地相当远离切割位点(在本实验中长达553bp)(33%-100%的编辑的转化体含有所有预期突变;表9)。考虑到距CRISPR/Mad7切割位点的距离,突变转移效率较高。
序列表
<110> 诺维信公司(Novozymes A/S)
<120> 通过指导的内切核酸酶和单链寡核苷酸进行基因组编辑
<130> NZ 14843-WO-PCT
<160> 72
<170> PatentIn 3.5版
<210> 1
<211> 16531
<212> DNA
<213> 人工序列
<220>
<223> 质粒pSMAI290.
<400> 1
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acccgggcta 420
attatggggt gtcgccctta ttcgactcta tagtgaagtt cctattctct agaaagtata 480
ggaacttctg aagtggggat ttaaatgcgg ccgcgctgag ggtttaatcg acgaagcagc 540
tgacggccag tgccaagctt aacgcgtacc gggcccagta tatgttccgc agatgactgg 600
agctctgcca tacgtgccct ctcaagcacc atttgttcca tctacagaga ctagtcacca 660
actagtctat caagactcac agggtacatt gctgagacca actgaccaga ggcagggtag 720
cggattgacg gctccatctc cttcacttac aaggtctatt gaaagccctt tagcatcacc 780
aagcggagaa tagattgtta agcttatttt ttgtatactg ttttgtgata gcacgaagtt 840
tttccacggt atcttgtaaa aatatatatt tgtggcgggc ttacctacat caaattaata 900
agagactaat tataaactaa acacacaagc aagctacttt agggtaaaag tttataaatg 960
cttttgacgt ataaacgttg cttgtattta ttattacaat taaaggtgga tagaaaacct 1020
agagactagt tagaaactaa tctcaggttt gcgttaaact aaatcagagc ccgagaggtt 1080
aacagaacct agaaggggac tagatatccg ggtagggaaa caaaaaaaaa aaacaagaca 1140
gccacatatt agggagacta gttagaagct agttccagga ctaggaaaat aaaagacaat 1200
gataccacag tctagttgac aactagatag attctagatt gaggccaaag tctctgagat 1260
ccaggttagt tgcaactaat actagttagt atctagtctc ctataactct gaagctagaa 1320
taacttacta ctattatcct caccactgtt cagctgcgca aacggagtga ttgcaaggtg 1380
ttcagagact agttattgac tagtcagtga ctagcaataa ctaacaaggt attaacctac 1440
catgtctgcc atcaccctgc acttcctcgg gctcagcagc cttttcctcc tcattttcat 1500
gctcattttc cttgtttaag actgtgacta gtcaaagact agtccagaac cacaaaggag 1560
aaatgtctta ccactttctt cattgcttgt ctcttttgca ttatccatgt ctgcaactag 1620
ttagagtcta gttagtgact agtccgacga ggacttgctt gtctccggat tgttggagga 1680
actctccagg gcctcaagat ccacaacaga gccttctaga agactggtca ataactagtt 1740
ggtctttgtc tgagtctgac ttacgaggtt gcatactcgc tccctttgcc tcgtcaatcg 1800
atgagaaaaa gcgccaaaac tcgcaatatg gctttgaacc acacggtgct gagactagtt 1860
agaatctagt cccaaactag cttggatagc ttacctttgc cctttgcgtt gcgacaggtc 1920
ttgcagggta tggttccttt ctcaccagct gatttagctg ccttgctacc ctcacggcgg 1980
atctgccata aagagtggct agaggttata aattagcact gatcctaggt acggggctga 2040
atgtaacttg cctttccttt ctcatcgcgc ggcaagacag gcttgctcaa attcctacca 2100
gtcacagggg tatgcacggc gtacggacca cttgaactag tcacagatta gttagcaact 2160
agtctgcatt gaatggctgt acttacgggc cctcgccatt gtcctgatca tttccagctt 2220
caccctcgtt gctgcaaagt agttagtgac tagtcaagga ctagttgaaa tgggagaaga 2280
aactcacgaa ttctcgactc ccttagtatt gtggtccttg gacttggtgc tgctatatat 2340
tagctaatac actagttaga ctcacagaaa cttacgcagc tcgcttgcgc ttcttggtag 2400
gagtcggggt tgggagaaca gtgccttcaa acaagccttc ataccatgct acttgactag 2460
tcagggacta gtcaccaagt aatctagata ggacttgcct ttggcctcca tcagttcctt 2520
catagtggga ggaccattgt gcaatgtaaa ctccatgccg tgggagttct tgtccttcaa 2580
gtgcttgacc aatatgtttc tgttggcaga gggaacctgt caactagtta ataactagtc 2640
agaaactatg atagcagtag actcactgta cgcttgaggc atcccttcac tcggcagtag 2700
acttcatatg gatggatatc aggcacgcca ttgtcgtcct gtggactagt cagtaactag 2760
gcttaaagct agtcgggtcg gcttactatc ttgaaatccg gcagcgtaag ctccccgtcc 2820
ttaactgcct cgagatagtg acagtactct ggggactttc ggagatcgtt atcgttatcg 2880
cgaatgctcg gcatactaac tgttgactag tcttggacta gtcccgagca aaaaggattg 2940
gaggaggagg aggaaggtga gagtgagaca aagagcgaaa taagagcttc aaaggctatc 3000
tctaagcagt atgaaggtta agtatctagt tcttgactag atttaaaaga gatttcgact 3060
agttatgtac ctggagtttg gatataggaa tgtgttgtgg taacgaaatg taagggggag 3120
gaaagaaaaa gtcggtcaag aggtaactct aagtcggcca ttcctttttg ggaggcgcta 3180
accataaacg gcatggtcga cttagagtta gctcagggaa tttagggagt tatctgcgac 3240
caccgaggaa cggcggaatg ccaaagaatc ccgatggagc tctagctggc ggttgacaac 3300
cccacctttt ggcgtttctg cggcgttgca ggcgggactg gatacttcgt agaaccagaa 3360
aggcaaggca gaacgcgctc agcaagagtg ttggaagtga tagcatgatg tgccttgtta 3420
actaggtcaa aatctgcagt atgcttgatg ttatccaaag tgtgagagag gaaggtccaa 3480
acatacacga ttgggagagg gcctaggtat aagagttttt gagtagaacg catgtgagcc 3540
cagccatctc gaggagatta aacacgggcc ggcatttgat ggctatgtta gtaccccaat 3600
ggaaacggtg agagtccagt ggtcgcagat aactccctaa attccctgag ctaactctaa 3660
gtcgaccatg ccgtttatgg ttagcgcctc ccaaaaagga atggccgact tagagttacc 3720
tcttgaccga ctttttcttt cctccccctt acatttcgtt accacaacac attcctatat 3780
ccaaactcca ggtacataac tagtcgaaat ctcttttaaa tctagtcaag aactagatac 3840
ttaaccttca tactgcttag agatagcctt tgaagctctt atttcgctct ttgtctcact 3900
ctcaccttcc tcctcctcct ccaatccttt ttgctcggga ctagtccaag actagtcaac 3960
agttagtatg ccgagcattc gcgataacga taacgatctc cgaaagtccc cagagtactg 4020
tcactatctc gaggcagtta aggacgggga gcttacgctg ccggatttca agatagtaag 4080
ccgacccgac tagctttaag cctagttact gactagtcca caggacgaca atggcgtgcc 4140
tgatatccat ccatatgaag tctactgccg agtgaaggga tgcctcaagc gtacagtgag 4200
tctactgcta tcatagtttc tgactagtta ttaactagtt gacaggttcc ctctgccaac 4260
agaaacatat tggtcaagca cttgaaggac aagaactccc acggcatgga gtttacattg 4320
cacaatggtc ctcccactat gaaggaactg atggaggcca aaggcaagtc ctatctagat 4380
tacttggtga ctagtccctg actagtcaag tagcatggta tgaaggcttg tttgaaggca 4440
ctgttctccc aaccccgact cctaccaaga agcgcaagcg agctgcgtaa gtttctgtga 4500
gtctaactag tgtattagct aatatatagc agcaccaagt ccaaggacca caatactaag 4560
ggagtcgaga attcgtgagt ttcttctccc atttcaacta gtccttgact agtcactaac 4620
tactttgcag caacgagggt gaagctggaa atgatcagga caatggcgag ggcccgtaag 4680
tacagccatt caatgcagac tagttgctaa ctaatctgtg actagttcaa gtggtccgta 4740
cgccgtgcat acccctgtga ctggtaggaa tttgagcaag cctgtcttgc cgcgcgatga 4800
gaaaggaaag gcaagttaca ttcagccccg tacctaggat cagtgctaat ttataacctc 4860
tagccactct ttatggcaga tccgccgtga gggtagcaag gcagctaaat cagctggtga 4920
gaaaggaacc ataccctgca agacctgtcg caacgcaaag ggcaaaggta agctatccaa 4980
gctagtttgg gactagattc taactagtct cagcaccgtg tggttcaaag ccatattgcg 5040
agttttggcg ctttttctca tcgattgacg aggcaaaggg agcgagtatg caacctcgta 5100
agtcagactc agacaaagac caactagtta ttgaccagtc ttctagaagg ctctgttgtg 5160
gatcttgagg ccctggagag ttcctccaac aatccggaga caagcaagtc ctcgtcggac 5220
tagtcactaa ctagactcta actagttgca gacatggata atgcaaaaga gacaagcaat 5280
gaagaaagtg gtaagacatt tctcctttgt ggttctggac tagtctttga ctagtcacag 5340
tcttaaacaa ggaaaatgag catgaaaatg aggaggaaaa ggctgctgag cccgaggaag 5400
tgcagggtga tggcagacat ggtaggttaa taccttgtta gttattgcta gtcactgact 5460
agtcaataac tagtctctga acaccttgca atcactccgt ttgcgcagct gaacagtggt 5520
gaggataata gtagtaagtt attctagctt cagagttata ggagactaga tactaactag 5580
tattagttgc aactaacctg gatctcagag actttggcct caatctagaa tctatctagt 5640
tgtcaactag actgtggtat cattgtcttt tattttccta gtcctggaac tagcttctaa 5700
ctagtctccc taatatgtgg ctgtcttgtt tttttttttt gtttccctac ccggatatct 5760
agtccccttc taggttctgt taacctctcg ggctctgatt tagtttaacg caaacctgag 5820
attagtttct aactagtctc taggttttct atccaccttt aattgtaata ataaatacaa 5880
gcaacgttta tacgtcaaaa gcatttataa acttttaccc taaagtagct tgcttgtgtg 5940
tttagtttat aattagtctc ttattaattt gatgtaggta agcccgccac aaatatatat 6000
ttttacaaga taccgtggaa aaacttcgtg ctatcacaaa acagtataca aaaaataagc 6060
ttaacaatct attctccgct tggtgatgct aaagggcttt caatagacct tgtaagtgaa 6120
ggagatggag ccgtcaatcc gctaccctgc ctctggtcag ttggtctcag caatgtaccc 6180
tgtgagtctt gatagactag ttggtgacta gtctctgtag atggaacaaa tggtgcttga 6240
gagggcacgt atggcagagc tccagtcatc tgcggaacat atactgggcc cggggatcct 6300
ctagagtcga cctgcaggtt catttaaacg gcttcacggg cagcccagcg gtcgatttcg 6360
cttccaaatt ttgggggaaa gggtccctga gcagcctcac aaacgcaaac atgcgcacgc 6420
gccacacgga aaatgaagct gactttgaat ttttaagaat cccctttgcc cgtggcacct 6480
tctgattttt gtcttcgtgt ccaatccatc tccttgaacg acaacccagc cctttctatt 6540
tcctatcccc taatatctaa tgtgagtcct catcgtcaca gacggcgacg gacgcgacat 6600
ttcgcccgtg ctcatcgacc gctctgctgt cgccaacaga acacgcggtt atgtcgcgtt 6660
ccgctttgtc gtaccacttt cgccccacac cgctgacctc gcgttcccag catgaaaaag 6720
cctgaactca ccgcgacgtc tgtcgagaag tttctgatcg aaaagttcga cagcgtctcc 6780
gacctgatgc agctctcgga gggcgaagaa tctcgtgctt tcagcttcga tgtaggaggg 6840
cgtggatatg tcctgcgggt aaatagctgc gccgatggtt tctacaaaga tcgttatgtt 6900
tatcggcact ttgcatcggc cgcgctcccg attccggaag tgcttgacat tggggagttc 6960
agcgagagcc tgacctattg catctcccgc cgtgcacagg gtgtcacgtt gcaagacctg 7020
cctgaaaccg aactgcccgc tgttctgcag ccggtcgcgg aggccatgga tgcgatcgct 7080
gcggccgatc ttagccagac gagcgggttc ggcccattcg gaccgcaagg aatcggtcaa 7140
tacactacat ggcgtgattt catatgcgcg attgctgatc cccatgtgta tcactggcaa 7200
actgtgatgg acgacaccgt cagtgcgtcc gtcgcgcagg ctctcgatga gctgatgctt 7260
tgggccgagg actgccccga agtccggcac ctcgtgcacg cggatttcgg ctccaacaat 7320
gtcctgacgg acaatggccg cataacagcg gtcattgact ggagcgaggc gatgttcggg 7380
gattcccaat acgaggtcgc caacatcttc ttctggaggc cgtggttggc ttgtatggag 7440
cagcagacgc gctacttcga gcggaggcat ccggagcttg caggatcgcc gcggctccgg 7500
gcgtatatgc tccgcattgg tcttgaccaa ctctatcaga gcttggttga cggcaatttc 7560
gatgatgcag cttgggcgca gggtcgatgc gacgcaatcg tccgatccgg agccgggact 7620
gtcgggcgta cacaaatcgc ccgcagaagc gcggccgtct ggaccgatgg ctgtgtagaa 7680
gtactcgccg atagtggaaa ccgacgcccc agcactcgtc cgagggcaag gaatagtaaa 7740
tgattcgtta gttctttcct gaactgatga ttcgcgcgat tcgtatttct ctttgttggt 7800
tgttctgatg atgatgaaaa tgacgcatct ctttatttgc tgcactcgta cacccatcct 7860
ttggaatgat taatacccct cctttttcat cgcggacggt agtcgttctc tttggggccg 7920
tgtttcttcc cattcgcatg cgacctcgtg gtcattgact gtctgtcctc ttcctctcca 7980
cctacctcca ccacctacgt tgactgcata tcactttttc aaacattcat gataatacgc 8040
taccttctgg catgaccttt tgatgatcgc tttttactat cctttcaatt acgatgttgt 8100
cacttctatt tgtcattttg cggaattagt attttctttc catcttcgat ggagagatga 8160
atattgcctg caggcatgca agctttctgc tcgaggccat ctggcttttc tctgctgtct 8220
gcctcgggaa tgggatggaa taccacgtac ggtatttggc ctccggtgcc atccgaagcg 8280
agatgctttg agcttgaaac cccctcggcc tgcacaggtg tctcatcgtg catttaatcc 8340
aacggcggcg agtcaaaaca tcagctaatt gaccaggttt ctggattgtg aatgccaact 8400
ttttgggtct tgaggagttg cggggtggga aaaaagtaaa gaaatttact gaggatttta 8460
tcattgcgac tataaaataa agcggcattg caaatccttg cgttgctact atgtaaaatg 8520
gactgtagtt gtgctgctga aaatagtttg gcgattgtgg attgtggatt gtggattgtg 8580
gattatggca agttgtcaag gggcaagttg acgaaaatga ttgtgtggtg tctgccagca 8640
aattgagaac gtgggtatat atttcatctt ttcatgattc ccttcggctt gcttgtcaag 8700
caatggcatc attggtctag tggtagaatt cgtcgttgcc atcgacgagg cccgtgttcg 8760
attcacggat gatgcaagat ctgttttaga gctagaaata gcaagttaaa ataaggctag 8820
tccgttatca acttgaaaaa gtggcaccga gtcggtgctt tttttttggc tcttgggttc 8880
gaactgccca aggcccatgt tttggtcatc ttttttttta tgccccacca tttgggtcac 8940
ccctgccaat cattccatct ttgttcctac ccttcacgtg tgctttccga agccaaagtt 9000
cccattcaac aactctcctt gcgttttttt tttcttgaag cttgtcaccc gtcgatagtt 9060
tctgccattt gcaataagct tcgagacagc agaatcaccg cccaagttaa gcctttgtgc 9120
tgatcatgct ctcgaacggg ccaagttcgg gaaaagcaaa ggagcgttta gtgaggggca 9180
atttgactca cctcccaggc aacagatgag gggggcaaaa agaaagaaat tttcgtgagt 9240
caatatggat tccgagcatc attttcttgc ggtctatctt gctacgtatg ttgatcttga 9300
cgctgtggat caagcaacgc cactcgctcg ctccatcgca ggctggtcgc agacaaatta 9360
aaaggcggca aactcgtaca gccgcggggt tgtccgctgc aaagtacaga gtgataaaag 9420
ccgccatgcg accatcaacg cgttgatgcc cagctttttc gatccgagaa tccaccgtag 9480
aggcgatagc aagtaaagaa aagctaaaca aaaaaaaatt tctgccccta agccatgaaa 9540
acgagatggg gtggagcaga accaaggaaa gagtcgcgct gggctgccgt tccggaaggt 9600
gttgtaaagg ctcgacgccc aaggtgggag tctaggagaa gaatttgcat cgggagtggg 9660
gcgggttacc cctccatatc caatgacaga tatctaccag ccaagggttt gagcccgccc 9720
gcttagtcgt cgtcctcgct tgcccctcca taaaaggatt tcccctcccc ctcccacaaa 9780
attttctttc ccttcctctc cttgtccgct tcagtacgta tatcttccct tccctcgctt 9840
ctctcctcca tccttctttc atccatctcc tgctaacttc tctgctcagc acctctacgc 9900
attactagcc gtagtatctg agcacttctc ccttttatat tccacaaaac ataacacaac 9960
cttcaccatg gacaagaagt atagcatcgg gctggacatt ggaacgaact cggttggttg 10020
ggctgtgatt acggacgaat acaaggtgcc atccaagaag tttaaggtcc tgggaaacac 10080
cgaccgtcac tcaatcaaga agaatctcat tggagccctg ctcttcgata gtggggagac 10140
cgccgaagct actcgactga agcgaacggc tcgccggcgt tatacacgac gcaagaatcg 10200
catctgctac ctccaggaga ttttcagcaa cgaaatggct aaggttgatg actcattctt 10260
tcatcgactc gaagaaagtt tcttggtcga ggaggataag aagcacgagc gccatccgat 10320
ctttggtaac attgtggatg aggttgccta tcacgaaaag tacccaacta tctatcatct 10380
tcgtaagaag ctggtcgata gcacggacaa ggctgatttg cgacttatct acctggcact 10440
cgcgcacatg attaagttcc gcggccattt tcttatcgag ggtgacctga accccgataa 10500
ttctgacgtt gataagctct tcatccagtt ggtccaaacc tacaatcagc tgtttgagga 10560
aaaccctatt aatgcatctg gcgtggacgc caaggctatc ctttcggcgc gcctgtctaa 10620
gtcgcggcgt ttggagaacc ttatcgcaca actccccggc gaaaagaaga acggcctctt 10680
cggtaatttg attgcgttgt cacttggtct gactcctaac ttcaagagta attttgacct 10740
ggcagaggat gcgaagctcc agttgtctaa ggatacgtat gatgacgatc tcgacaactt 10800
gcttgcccaa atcggtgacc agtacgctga tcttttcctg gccgctaaga atctctcaga 10860
tgcaatcctg ctcagtgaca ttttgcgggt caacaccgag attactaagg cccccctgtc 10920
agctagtatg atcaagcggt atgatgagca ccatcaggac ctcaccttgc ttaaggccct 10980
cgtgcgtcag caattgcctg agaagtacaa ggaaatcttc tttgaccaat ccaagaacgg 11040
atacgcaggg tatattgatg gcggtgcgag ccaggaggaa ttctacaagt ttatcaagcc 11100
gattttggag aagatggacg gcactgagga actgctcgtc aagctgaatc gcgaagattt 11160
gcttcgtaag caacgaacgt tcgacaacgg ctccatcccg caccagattc atctgggcga 11220
gctccacgcc atccttcgac gccaggaaga tttctaccca tttctgaagg acaaccgtga 11280
gaagatcgaa aagattctta cattccgaat cccctactat gtgggacctt tggcccgtgg 11340
gaattcccga tttgcttgga tgacccgaaa gagcgaggaa accatcactc cgtggaactt 11400
cgaggaagtc gtggacaagg gtgcatccgc gcagagcttc attgagcgga tgaccaattt 11460
tgataagaac cttccgaatg aaaaggtcct gccaaagcat tcgctgctct acgagtattt 11520
caccgtgtat aacgaactga ctaaggtcaa gtacgtgacg gagggaatgc ggaagccagc 11580
cttcctctca ggggaacaaa agaaggctat cgtcgatttg ctttttaaga ccaatcgtaa 11640
agtgactgtt aagcagctga aggaggatta tttcaagaag attgaatgtt tcgactccgt 11700
cgagatcagc ggcgtggaag atcgctttaa cgcttccctc ggtacctacc acgacctgct 11760
caagatcatt aaggacaagg atttcctcga taacgaggaa aatgaggaca tcttggaaga 11820
tattgtcctc acgttgacac tttttgagga ccgcgaaatg atcgaggaac ggctcaagac 11880
atatgcccat ttgttcgacg ataaggtgat gaagcagctg aagcggcgtc gatacaccgg 11940
atggggtcgc cttagccgga agctgatcaa cggcattcga gataagcaat ctggtaagac 12000
tatcttggat ttccttaagt cggacggctt cgccaaccgc aattttatgc agcttattca 12060
cgacgattcc ctgacgttca aggaggacat ccagaaggca caagtctcag gacaagggga 12120
ttccctgcac gagcatatcg ccaacctggc tggatccccg gcgatcaaga aggggattct 12180
tcagaccgtc aaggttgtcg acgagctggt caaggtgatg ggccgtcata agccagaaaa 12240
catcgtgatt gagatggccc gagaaaatca gaccactcaa aagggtcaga agaacagccg 12300
cgagcggatg aagcggatcg aggaaggcat taaggaactt ggttctcaga tcctgaagga 12360
gcaccctgtt gaaaacacac agctccaaaa tgagaagctg tatctctact atttgcaaaa 12420
tggacgcgac atgtacgtcg atcaggagct cgacattaac cggttgtcgg actacgatgt 12480
tgaccatatc gtcccgcaat ccttccttaa ggacgatagc attgataaca aggtgctgac 12540
tcgctcagat aagaaccggg gcaagtccga caatgttcca agcgaggaag tggttaagaa 12600
gatgaagaac tactggcgcc aattgcttaa tgccaagctc atcacacagc gcaagtttga 12660
caacttgacc aaggccgagc ggggagggct gagtgaactc gataaggctg gcttcatcaa 12720
gcgtcaactc gtggagacgc gacagatcac aaagcacgtt gctcagattc tggactcccg 12780
gatgaacaca aagtacgacg agaatgataa gctcatccgt gaagttaagg tcattaccct 12840
caagtctaag ttggtgtcgg atttccgcaa ggacttccaa ttttataagg ttcgggagat 12900
caacaattat caccatgcac atgatgcgta cctcaacgca gtcgtgggaa ctgcgctcat 12960
caagaagtat cccaagttgg agtccgaatt cgtctacggg gattataagg tttacgacgt 13020
ccgcaagatg atcgccaaga gtgagcagga aattggcaag gccacggcta agtatttctt 13080
ttactccaac atcatgaatt tctttaagac ggagatcaca ctcgccaatg gagaaatccg 13140
taagcgacct ttgattgaga ccaacggcga gactggtgaa atcgtttggg ataaggggcg 13200
cgacttcgct accgtgcgga aggttctgag catgccgcaa gtcaatatcg tcaagaaaac 13260
cgaggtgcag acaggcggtt tctctaagga atcgattctt ccaaagcgta actctgacaa 13320
gctgatcgct cgaaagaagg attgggaccc caagaagtat ggagggttcg attctcctac 13380
agtggcatac tcggttctcg ttgtcgcgaa ggttgagaag ggaaagtcta agaagctgaa 13440
gtcggtcaag gaactgctcg ggatcaccat tatggagcgc tccagcttcg aaaagaatcc 13500
catcgacttt ctcgaggcca agggctataa ggaagtcaag aaggatctta tcattaagct 13560
gcctaagtac tctttgttcg agcttgaaaa cggtcgaaag cgaatgctcg catcggcagg 13620
agagttgcag aaggggaatg aattggcact tccctcaaag tacgtgaact tcctgtatct 13680
cgcgtcccac tacgagaagc tgaagggtag ccctgaggac aacgaacaga agcaactttt 13740
tgttgagcaa cacaagcatt atctggatga gatcattgaa cagatttcag agttcagtaa 13800
gcgcgtcatc ctcgccgatg ctaatctcga caaggtgttg tcggcctaca acaagcaccg 13860
tgacaagccg atccgagagc aggctgaaaa tatcattcat ctgttcaccc tcactaactt 13920
gggagcacca gcagcgttca agtattttga tacgacaatc gaccgtaagc gatacacgtc 13980
cacaaaggag gtgcttgatg cgaccctgat tcatcaatcc atcactgggc tctatgaaac 14040
ccgtatcgac cttagtcaac tggggggcga cccccccaag aagaagcgca aggtctgagc 14100
ggacattcga tttatgccgt tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg 14160
gaattagact tgttatgtag ttgattctac aatggattat gattcctgaa cttcaaatcc 14220
gctgttcatt attaatctca gctcttcccg taaagccaat gttgaaacta ttcgtaaatg 14280
tacctcgttt tgcgtgtggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat 14340
ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 14400
taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 14460
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 14520
attgggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 14580
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 14640
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 14700
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 14760
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 14820
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 14880
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 14940
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 15000
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 15060
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 15120
aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 15180
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 15240
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 15300
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 15360
gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 15420
tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 15480
ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 15540
ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 15600
atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 15660
ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 15720
tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 15780
attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 15840
tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 15900
ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 15960
gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 16020
gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 16080
gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 16140
aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 16200
taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 16260
tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 16320
tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 16380
atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca 16440
tttccccgaa aagtgccacc tgacgtctaa gaaaccatta ttatcatgac attaacctat 16500
aaaaataggc gtatcacgag gccctttcgt c 16531
<210> 2
<211> 2885
<212> DNA
<213> 里氏木霉
<400> 2
ttagtccgac gccttcgagt ccagccgcgt gagaatatcc aaaagcacgg aaaagtcgct 60
cctggctcgc gtagccaagg gtgaatcctg gttgcgatgg atgatggcca gcaaactagc 120
tccgataagg cgaatctttt caacctgcag catccagaca acataatcag gacagattag 180
caacaagtgc cgaggcttga tgatatacat atccgcaggg atataaagag agaggggggg 240
tcgtcgaaga aaagggtgtg cagaaaagag aagagacaag gaaacgactc acgtttggct 300
cgccattggc ctgcaggccc caaaagggcg cctcgttcat caccctcagc atgtctcgca 360
caatctccga ctttctgaga tcagcctgct caacgccagg agcaaaataa gagaggtctt 420
cgaatttctg cgtaattacc atgcgcagac agtgaaacgt cacctgcagg ttgatgcact 480
gtatcacgta ctgcttggac tcggcagacc cgttgccttc tgccatcgct gccatcgcca 540
gagtgcacga ctggaggtac ggcgggagat cgtccaagca ggtgatgaag cggacataga 600
gagaatcgag atgctgcctg tcggcggagg gcagcacatg gttcgggggc atggtccctc 660
gaaagtgctg catcatctga tcttgcagca cgcggatttc cagcagcaaa tcagccgcgg 720
actgccagag ccgcacattt gcgttgaagc cggatatgaa gctcttccgg ggcggctcgg 780
acgccgtgct caggaactcg tcctcgatac ccgacgggta tagcgtggtg atgccggcgt 840
cgaagcagta cttgtggatg gtgatgggcc gattgttgag tatagcggct gacttgtcgc 900
ccaagtacag gatccaaaag cagcgacggc ggaactctgc ctcgatgggg acgagcccct 960
cgagggcagc ctcctcgtgc agctgcatga cctgcgccag gcggatggcc tcgccaaata 1020
tgtgccacga gtacttgggc ttccccgcag cgtggaggca gttggagtgg aagtagcgaa 1080
tggcaatcga gttggccgtc ggattctcca ggtcggcctc gaggtgctgg tgcaggcagt 1140
cccgagaggc ttcgagcaag atctcagaga cggattctcc ttcggggaaa atgtccttgg 1200
gtagcatgaa tgctgcctct gcgcagacgg ccgtgaccag ggtgaaggtc gagtcggccc 1260
agggagccag cctgctgccg acggttcgcg agccgctggg ctggccaaag ccggcccacg 1320
actcggcagc gttgaggggg gtggtgccgg tggtcgggtc tggcgtgagc tgtgacagcg 1380
gcgatggttg gttgacgcca ggcaagggct gggagaagat gtatgcgagc acgtcccgga 1440
gggccggctc gtacaccagg ggggtgaggg ggtagaggta gtcgaagaag aggtcgatac 1500
atcgcttcga gacgcgctct agcgtcgtgt tgcgcagcgt catggcgttg gccaggtgta 1560
tccatcgctg gcgcgtcgag atgttctgga tggtggagag gccgggcagg tcgcccagcg 1620
gctgccgggg caggccgttg tcaatgctga gcggctcgac gggctcccag gccgcgtcgg 1680
gcgacagcga cgacgaggcg aagggctgca gcgcggctac tgcggggccg gagaaggtca 1740
gcggcggcgg catctggccg ggtcgagccg cggtggagag cgagctcgga tcaggaggcg 1800
gctggccggg ctggtcgctc ttcttcctcg ctttggggcc gcgtcgcgcc aggggcaggt 1860
cgaaagtgca ctgcacgtgg gcatcgcggc agtgcgtgca gctatcgaca gcgctgaggt 1920
actcgcactt tgggcgggga agagcattgg tcagtggtgg caaggagaga gtatccaggt 1980
gtaagacggg ggagtagcgc agcatggaag acgaggtcgg tgttggggtg aggctgcagc 2040
agtatgaacg agttgtgaag gcagtgcaat acaatacaca caactctcaa cacaacacaa 2100
cgcttgccat gtatgctgat gtattgtatg tatgctttgt acgcatgaca gacacgcagg 2160
agaagaggac gggaggaggg ggaacgggaa cggggagagg agacacgggc agtaaggaca 2220
tatgaagagc agggaccagg gaccaggaga cggggaggag gaggaggagg aggagcagca 2280
gcatcagcag cagcaggagg aggagcaatg acaacagaga tgcaagcaac agcaaagggg 2340
ctagactgac cttggccttg cgccggcggc agcggtcgca ggctctgctc accagacggc 2400
ctctgggatg gtggtggaac gaggttgcag ccgacacgag tgagttctgc ggcggcgtgg 2460
ttgaggcggt tggcgagccg ggctgcgagg ccgaggcaga ctcgggcgag gtggtgaggg 2520
cgtggacagc gccagcgcca gcgccagcag ctggagggcc gcctgcagct gcagctacag 2580
agccctgggc cggagctgct gagcccatcg ccacggagcc tgtccgggtg cctggaagcc 2640
ctggaaggcc tggagggcct gtagagctgg agcctgcagc gcctgtgtgg ccgaggagcc 2700
acggggggca gcgttagttg ggggggccgc actgcactga ttgcgctgca ctgcgttcca 2760
gtgccaccca cgcgggctgg cagctgggag ggaacgcgag cggacgggac gggactcaac 2820
gcacctgtgt ctgcacccgc agcaaccgcc gcgccgccag ctgctgccgc ggccgctgtg 2880
gccat 2885
<210> 3
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ336
<400> 3
ccgtgttcga ttcacggatg atgcatggcc aggtgtatcc atcgcgtttt agagctagaa 60
atagcaagtt 70
<210> 4
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ338
<400> 4
ccgtgttcga ttcacggatg atgcagccga cacgagtgag ttctggtttt agagctagaa 60
atagcaagtt 70
<210> 5
<211> 70
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ340
<400> 5
ccgtgttcga ttcacggatg atgcaccccg gaagagcttc atatcgtttt agagctagaa 60
atagcaagtt 70
<210> 6
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ260
<400> 6
gattgtgtgg tgtctgccag c 21
<210> 7
<211> 16545
<212> DNA
<213> 人工序列
<220>
<223> 质粒pNJOC502
<400> 7
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acccgggcta 420
attatggggt gtcgccctta ttcgactcta tagtgaagtt cctattctct agaaagtata 480
ggaacttctg aagtggggat ttaaatgcgg ccgcgctgag ggtttaatcg acgaagcagc 540
tgacggccag tgccaagctt aacgcgtacc gggcccagta tatgttccgc agatgactgg 600
agctctgcca tacgtgccct ctcaagcacc atttgttcca tctacagaga ctagtcacca 660
actagtctat caagactcac agggtacatt gctgagacca actgaccaga ggcagggtag 720
cggattgacg gctccatctc cttcacttac aaggtctatt gaaagccctt tagcatcacc 780
aagcggagaa tagattgtta agcttatttt ttgtatactg ttttgtgata gcacgaagtt 840
tttccacggt atcttgtaaa aatatatatt tgtggcgggc ttacctacat caaattaata 900
agagactaat tataaactaa acacacaagc aagctacttt agggtaaaag tttataaatg 960
cttttgacgt ataaacgttg cttgtattta ttattacaat taaaggtgga tagaaaacct 1020
agagactagt tagaaactaa tctcaggttt gcgttaaact aaatcagagc ccgagaggtt 1080
aacagaacct agaaggggac tagatatccg ggtagggaaa caaaaaaaaa aaacaagaca 1140
gccacatatt agggagacta gttagaagct agttccagga ctaggaaaat aaaagacaat 1200
gataccacag tctagttgac aactagatag attctagatt gaggccaaag tctctgagat 1260
ccaggttagt tgcaactaat actagttagt atctagtctc ctataactct gaagctagaa 1320
taacttacta ctattatcct caccactgtt cagctgcgca aacggagtga ttgcaaggtg 1380
ttcagagact agttattgac tagtcagtga ctagcaataa ctaacaaggt attaacctac 1440
catgtctgcc atcaccctgc acttcctcgg gctcagcagc cttttcctcc tcattttcat 1500
gctcattttc cttgtttaag actgtgacta gtcaaagact agtccagaac cacaaaggag 1560
aaatgtctta ccactttctt cattgcttgt ctcttttgca ttatccatgt ctgcaactag 1620
ttagagtcta gttagtgact agtccgacga ggacttgctt gtctccggat tgttggagga 1680
actctccagg gcctcaagat ccacaacaga gccttctaga agactggtca ataactagtt 1740
ggtctttgtc tgagtctgac ttacgaggtt gcatactcgc tccctttgcc tcgtcaatcg 1800
atgagaaaaa gcgccaaaac tcgcaatatg gctttgaacc acacggtgct gagactagtt 1860
agaatctagt cccaaactag cttggatagc ttacctttgc cctttgcgtt gcgacaggtc 1920
ttgcagggta tggttccttt ctcaccagct gatttagctg ccttgctacc ctcacggcgg 1980
atctgccata aagagtggct agaggttata aattagcact gatcctaggt acggggctga 2040
atgtaacttg cctttccttt ctcatcgcgc ggcaagacag gcttgctcaa attcctacca 2100
gtcacagggg tatgcacggc gtacggacca cttgaactag tcacagatta gttagcaact 2160
agtctgcatt gaatggctgt acttacgggc cctcgccatt gtcctgatca tttccagctt 2220
caccctcgtt gctgcaaagt agttagtgac tagtcaagga ctagttgaaa tgggagaaga 2280
aactcacgaa ttctcgactc ccttagtatt gtggtccttg gacttggtgc tgctatatat 2340
tagctaatac actagttaga ctcacagaaa cttacgcagc tcgcttgcgc ttcttggtag 2400
gagtcggggt tgggagaaca gtgccttcaa acaagccttc ataccatgct acttgactag 2460
tcagggacta gtcaccaagt aatctagata ggacttgcct ttggcctcca tcagttcctt 2520
catagtggga ggaccattgt gcaatgtaaa ctccatgccg tgggagttct tgtccttcaa 2580
gtgcttgacc aatatgtttc tgttggcaga gggaacctgt caactagtta ataactagtc 2640
agaaactatg atagcagtag actcactgta cgcttgaggc atcccttcac tcggcagtag 2700
acttcatatg gatggatatc aggcacgcca ttgtcgtcct gtggactagt cagtaactag 2760
gcttaaagct agtcgggtcg gcttactatc ttgaaatccg gcagcgtaag ctccccgtcc 2820
ttaactgcct cgagatagtg acagtactct ggggactttc ggagatcgtt atcgttatcg 2880
cgaatgctcg gcatactaac tgttgactag tcttggacta gtcccgagca aaaaggattg 2940
gaggaggagg aggaaggtga gagtgagaca aagagcgaaa taagagcttc aaaggctatc 3000
tctaagcagt atgaaggtta agtatctagt tcttgactag atttaaaaga gatttcgact 3060
agttatgtac ctggagtttg gatataggaa tgtgttgtgg taacgaaatg taagggggag 3120
gaaagaaaaa gtcggtcaag aggtaactct aagtcggcca ttcctttttg ggaggcgcta 3180
accataaacg gcatggtcga cttagagtta gctcagggaa tttagggagt tatctgcgac 3240
caccgaggaa cggcggaatg ccaaagaatc ccgatggagc tctagctggc ggttgacaac 3300
cccacctttt ggcgtttctg cggcgttgca ggcgggactg gatacttcgt agaaccagaa 3360
aggcaaggca gaacgcgctc agcaagagtg ttggaagtga tagcatgatg tgccttgtta 3420
actaggtcaa aatctgcagt atgcttgatg ttatccaaag tgtgagagag gaaggtccaa 3480
acatacacga ttgggagagg gcctaggtat aagagttttt gagtagaacg catgtgagcc 3540
cagccatctc gaggagatta aacacgggcc ggcatttgat ggctatgtta gtaccccaat 3600
ggaaacggtg agagtccagt ggtcgcagat aactccctaa attccctgag ctaactctaa 3660
gtcgaccatg ccgtttatgg ttagcgcctc ccaaaaagga atggccgact tagagttacc 3720
tcttgaccga ctttttcttt cctccccctt acatttcgtt accacaacac attcctatat 3780
ccaaactcca ggtacataac tagtcgaaat ctcttttaaa tctagtcaag aactagatac 3840
ttaaccttca tactgcttag agatagcctt tgaagctctt atttcgctct ttgtctcact 3900
ctcaccttcc tcctcctcct ccaatccttt ttgctcggga ctagtccaag actagtcaac 3960
agttagtatg ccgagcattc gcgataacga taacgatctc cgaaagtccc cagagtactg 4020
tcactatctc gaggcagtta aggacgggga gcttacgctg ccggatttca agatagtaag 4080
ccgacccgac tagctttaag cctagttact gactagtcca caggacgaca atggcgtgcc 4140
tgatatccat ccatatgaag tctactgccg agtgaaggga tgcctcaagc gtacagtgag 4200
tctactgcta tcatagtttc tgactagtta ttaactagtt gacaggttcc ctctgccaac 4260
agaaacatat tggtcaagca cttgaaggac aagaactccc acggcatgga gtttacattg 4320
cacaatggtc ctcccactat gaaggaactg atggaggcca aaggcaagtc ctatctagat 4380
tacttggtga ctagtccctg actagtcaag tagcatggta tgaaggcttg tttgaaggca 4440
ctgttctccc aaccccgact cctaccaaga agcgcaagcg agctgcgtaa gtttctgtga 4500
gtctaactag tgtattagct aatatatagc agcaccaagt ccaaggacca caatactaag 4560
ggagtcgaga attcgtgagt ttcttctccc atttcaacta gtccttgact agtcactaac 4620
tactttgcag caacgagggt gaagctggaa atgatcagga caatggcgag ggcccgtaag 4680
tacagccatt caatgcagac tagttgctaa ctaatctgtg actagttcaa gtggtccgta 4740
cgccgtgcat acccctgtga ctggtaggaa tttgagcaag cctgtcttgc cgcgcgatga 4800
gaaaggaaag gcaagttaca ttcagccccg tacctaggat cagtgctaat ttataacctc 4860
tagccactct ttatggcaga tccgccgtga gggtagcaag gcagctaaat cagctggtga 4920
gaaaggaacc ataccctgca agacctgtcg caacgcaaag ggcaaaggta agctatccaa 4980
gctagtttgg gactagattc taactagtct cagcaccgtg tggttcaaag ccatattgcg 5040
agttttggcg ctttttctca tcgattgacg aggcaaaggg agcgagtatg caacctcgta 5100
agtcagactc agacaaagac caactagtta ttgaccagtc ttctagaagg ctctgttgtg 5160
gatcttgagg ccctggagag ttcctccaac aatccggaga caagcaagtc ctcgtcggac 5220
tagtcactaa ctagactcta actagttgca gacatggata atgcaaaaga gacaagcaat 5280
gaagaaagtg gtaagacatt tctcctttgt ggttctggac tagtctttga ctagtcacag 5340
tcttaaacaa ggaaaatgag catgaaaatg aggaggaaaa ggctgctgag cccgaggaag 5400
tgcagggtga tggcagacat ggtaggttaa taccttgtta gttattgcta gtcactgact 5460
agtcaataac tagtctctga acaccttgca atcactccgt ttgcgcagct gaacagtggt 5520
gaggataata gtagtaagtt attctagctt cagagttata ggagactaga tactaactag 5580
tattagttgc aactaacctg gatctcagag actttggcct caatctagaa tctatctagt 5640
tgtcaactag actgtggtat cattgtcttt tattttccta gtcctggaac tagcttctaa 5700
ctagtctccc taatatgtgg ctgtcttgtt tttttttttt gtttccctac ccggatatct 5760
agtccccttc taggttctgt taacctctcg ggctctgatt tagtttaacg caaacctgag 5820
attagtttct aactagtctc taggttttct atccaccttt aattgtaata ataaatacaa 5880
gcaacgttta tacgtcaaaa gcatttataa acttttaccc taaagtagct tgcttgtgtg 5940
tttagtttat aattagtctc ttattaattt gatgtaggta agcccgccac aaatatatat 6000
ttttacaaga taccgtggaa aaacttcgtg ctatcacaaa acagtataca aaaaataagc 6060
ttaacaatct attctccgct tggtgatgct aaagggcttt caatagacct tgtaagtgaa 6120
ggagatggag ccgtcaatcc gctaccctgc ctctggtcag ttggtctcag caatgtaccc 6180
tgtgagtctt gatagactag ttggtgacta gtctctgtag atggaacaaa tggtgcttga 6240
gagggcacgt atggcagagc tccagtcatc tgcggaacat atactgggcc cggggatcct 6300
ctagagtcga cctgcaggtt catttaaacg gcttcacggg cagcccagcg gtcgatttcg 6360
cttccaaatt ttgggggaaa gggtccctga gcagcctcac aaacgcaaac atgcgcacgc 6420
gccacacgga aaatgaagct gactttgaat ttttaagaat cccctttgcc cgtggcacct 6480
tctgattttt gtcttcgtgt ccaatccatc tccttgaacg acaacccagc cctttctatt 6540
tcctatcccc taatatctaa tgtgagtcct catcgtcaca gacggcgacg gacgcgacat 6600
ttcgcccgtg ctcatcgacc gctctgctgt cgccaacaga acacgcggtt atgtcgcgtt 6660
ccgctttgtc gtaccacttt cgccccacac cgctgacctc gcgttcccag catgaaaaag 6720
cctgaactca ccgcgacgtc tgtcgagaag tttctgatcg aaaagttcga cagcgtctcc 6780
gacctgatgc agctctcgga gggcgaagaa tctcgtgctt tcagcttcga tgtaggaggg 6840
cgtggatatg tcctgcgggt aaatagctgc gccgatggtt tctacaaaga tcgttatgtt 6900
tatcggcact ttgcatcggc cgcgctcccg attccggaag tgcttgacat tggggagttc 6960
agcgagagcc tgacctattg catctcccgc cgtgcacagg gtgtcacgtt gcaagacctg 7020
cctgaaaccg aactgcccgc tgttctgcag ccggtcgcgg aggccatgga tgcgatcgct 7080
gcggccgatc ttagccagac gagcgggttc ggcccattcg gaccgcaagg aatcggtcaa 7140
tacactacat ggcgtgattt catatgcgcg attgctgatc cccatgtgta tcactggcaa 7200
actgtgatgg acgacaccgt cagtgcgtcc gtcgcgcagg ctctcgatga gctgatgctt 7260
tgggccgagg actgccccga agtccggcac ctcgtgcacg cggatttcgg ctccaacaat 7320
gtcctgacgg acaatggccg cataacagcg gtcattgact ggagcgaggc gatgttcggg 7380
gattcccaat acgaggtcgc caacatcttc ttctggaggc cgtggttggc ttgtatggag 7440
cagcagacgc gctacttcga gcggaggcat ccggagcttg caggatcgcc gcggctccgg 7500
gcgtatatgc tccgcattgg tcttgaccaa ctctatcaga gcttggttga cggcaatttc 7560
gatgatgcag cttgggcgca gggtcgatgc gacgcaatcg tccgatccgg agccgggact 7620
gtcgggcgta cacaaatcgc ccgcagaagc gcggccgtct ggaccgatgg ctgtgtagaa 7680
gtactcgccg atagtggaaa ccgacgcccc agcactcgtc cgagggcaag gaatagtaaa 7740
tgattcgtta gttctttcct gaactgatga ttcgcgcgat tcgtatttct ctttgttggt 7800
tgttctgatg atgatgaaaa tgacgcatct ctttatttgc tgcactcgta cacccatcct 7860
ttggaatgat taatacccct cctttttcat cgcggacggt agtcgttctc tttggggccg 7920
tgtttcttcc cattcgcatg cgacctcgtg gtcattgact gtctgtcctc ttcctctcca 7980
cctacctcca ccacctacgt tgactgcata tcactttttc aaacattcat gataatacgc 8040
taccttctgg catgaccttt tgatgatcgc tttttactat cctttcaatt acgatgttgt 8100
cacttctatt tgtcattttg cggaattagt attttctttc catcttcgat ggagagatga 8160
atattgcctg caggcatgca agctttctgc tcgaggccat ctggcttttc tctgctgtct 8220
gcctcgggaa tgggatggaa taccacgtac ggtatttggc ctccggtgcc atccgaagcg 8280
agatgctttg agcttgaaac cccctcggcc tgcacaggtg tctcatcgtg catttaatcc 8340
aacggcggcg agtcaaaaca tcagctaatt gaccaggttt ctggattgtg aatgccaact 8400
ttttgggtct tgaggagttg cggggtggga aaaaagtaaa gaaatttact gaggatttta 8460
tcattgcgac tataaaataa agcggcattg caaatccttg cgttgctact atgtaaaatg 8520
gactgtagtt gtgctgctga aaatagtttg gcgattgtgg attgtggatt gtggattgtg 8580
gattatggca agttgtcaag gggcaagttg acgaaaatga ttgtgtggtg tctgccagca 8640
aattgagaac gtgggtatat atttcatctt ttcatgattc ccttcggctt gcttgtcaag 8700
caatggcatc attggtctag tggtagaatt cgtcgttgcc atcgacgagg cccgtgttcg 8760
attcacggat gatgcatggc caggtgtatc catcgcgttt tagagctaga aatagcaagt 8820
taaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt gctttttttt 8880
tggctcttgg gttcgaactg cccaaggccc atgttttggt catctttttt tttatgcccc 8940
accatttggg tcacccctgc caatcattcc atctttgttc ctacccttca cgtgtgcttt 9000
ccgaagccaa agttcccatt caacaactct ccttgcgttt tttttttctt gaagcttgtc 9060
acccgtcgat agtttctgcc atttgcaata agcttcgaga cagcagaatc accgcccaag 9120
ttaagccttt gtgctgatca tgctctcgaa cgggccaagt tcgggaaaag caaaggagcg 9180
tttagtgagg ggcaatttga ctcacctccc aggcaacaga tgaggggggc aaaaagaaag 9240
aaattttcgt gagtcaatat ggattccgag catcattttc ttgcggtcta tcttgctacg 9300
tatgttgatc ttgacgctgt ggatcaagca acgccactcg ctcgctccat cgcaggctgg 9360
tcgcagacaa attaaaaggc ggcaaactcg tacagccgcg gggttgtccg ctgcaaagta 9420
cagagtgata aaagccgcca tgcgaccatc aacgcgttga tgcccagctt tttcgatccg 9480
agaatccacc gtagaggcga tagcaagtaa agaaaagcta aacaaaaaaa aatttctgcc 9540
cctaagccat gaaaacgaga tggggtggag cagaaccaag gaaagagtcg cgctgggctg 9600
ccgttccgga aggtgttgta aaggctcgac gcccaaggtg ggagtctagg agaagaattt 9660
gcatcgggag tggggcgggt tacccctcca tatccaatga cagatatcta ccagccaagg 9720
gtttgagccc gcccgcttag tcgtcgtcct cgcttgcccc tccataaaag gatttcccct 9780
ccccctccca caaaattttc tttcccttcc tctccttgtc cgcttcagta cgtatatctt 9840
cccttccctc gcttctctcc tccatccttc tttcatccat ctcctgctaa cttctctgct 9900
cagcacctct acgcattact agccgtagta tctgagcact tctccctttt atattccaca 9960
aaacataaca caaccttcac catggacaag aagtatagca tcgggctgga cattggaacg 10020
aactcggttg gttgggctgt gattacggac gaatacaagg tgccatccaa gaagtttaag 10080
gtcctgggaa acaccgaccg tcactcaatc aagaagaatc tcattggagc cctgctcttc 10140
gatagtgggg agaccgccga agctactcga ctgaagcgaa cggctcgccg gcgttataca 10200
cgacgcaaga atcgcatctg ctacctccag gagattttca gcaacgaaat ggctaaggtt 10260
gatgactcat tctttcatcg actcgaagaa agtttcttgg tcgaggagga taagaagcac 10320
gagcgccatc cgatctttgg taacattgtg gatgaggttg cctatcacga aaagtaccca 10380
actatctatc atcttcgtaa gaagctggtc gatagcacgg acaaggctga tttgcgactt 10440
atctacctgg cactcgcgca catgattaag ttccgcggcc attttcttat cgagggtgac 10500
ctgaaccccg ataattctga cgttgataag ctcttcatcc agttggtcca aacctacaat 10560
cagctgtttg aggaaaaccc tattaatgca tctggcgtgg acgccaaggc tatcctttcg 10620
gcgcgcctgt ctaagtcgcg gcgtttggag aaccttatcg cacaactccc cggcgaaaag 10680
aagaacggcc tcttcggtaa tttgattgcg ttgtcacttg gtctgactcc taacttcaag 10740
agtaattttg acctggcaga ggatgcgaag ctccagttgt ctaaggatac gtatgatgac 10800
gatctcgaca acttgcttgc ccaaatcggt gaccagtacg ctgatctttt cctggccgct 10860
aagaatctct cagatgcaat cctgctcagt gacattttgc gggtcaacac cgagattact 10920
aaggcccccc tgtcagctag tatgatcaag cggtatgatg agcaccatca ggacctcacc 10980
ttgcttaagg ccctcgtgcg tcagcaattg cctgagaagt acaaggaaat cttctttgac 11040
caatccaaga acggatacgc agggtatatt gatggcggtg cgagccagga ggaattctac 11100
aagtttatca agccgatttt ggagaagatg gacggcactg aggaactgct cgtcaagctg 11160
aatcgcgaag atttgcttcg taagcaacga acgttcgaca acggctccat cccgcaccag 11220
attcatctgg gcgagctcca cgccatcctt cgacgccagg aagatttcta cccatttctg 11280
aaggacaacc gtgagaagat cgaaaagatt cttacattcc gaatccccta ctatgtggga 11340
cctttggccc gtgggaattc ccgatttgct tggatgaccc gaaagagcga ggaaaccatc 11400
actccgtgga acttcgagga agtcgtggac aagggtgcat ccgcgcagag cttcattgag 11460
cggatgacca attttgataa gaaccttccg aatgaaaagg tcctgccaaa gcattcgctg 11520
ctctacgagt atttcaccgt gtataacgaa ctgactaagg tcaagtacgt gacggaggga 11580
atgcggaagc cagccttcct ctcaggggaa caaaagaagg ctatcgtcga tttgcttttt 11640
aagaccaatc gtaaagtgac tgttaagcag ctgaaggagg attatttcaa gaagattgaa 11700
tgtttcgact ccgtcgagat cagcggcgtg gaagatcgct ttaacgcttc cctcggtacc 11760
taccacgacc tgctcaagat cattaaggac aaggatttcc tcgataacga ggaaaatgag 11820
gacatcttgg aagatattgt cctcacgttg acactttttg aggaccgcga aatgatcgag 11880
gaacggctca agacatatgc ccatttgttc gacgataagg tgatgaagca gctgaagcgg 11940
cgtcgataca ccggatgggg tcgccttagc cggaagctga tcaacggcat tcgagataag 12000
caatctggta agactatctt ggatttcctt aagtcggacg gcttcgccaa ccgcaatttt 12060
atgcagctta ttcacgacga ttccctgacg ttcaaggagg acatccagaa ggcacaagtc 12120
tcaggacaag gggattccct gcacgagcat atcgccaacc tggctggatc cccggcgatc 12180
aagaagggga ttcttcagac cgtcaaggtt gtcgacgagc tggtcaaggt gatgggccgt 12240
cataagccag aaaacatcgt gattgagatg gcccgagaaa atcagaccac tcaaaagggt 12300
cagaagaaca gccgcgagcg gatgaagcgg atcgaggaag gcattaagga acttggttct 12360
cagatcctga aggagcaccc tgttgaaaac acacagctcc aaaatgagaa gctgtatctc 12420
tactatttgc aaaatggacg cgacatgtac gtcgatcagg agctcgacat taaccggttg 12480
tcggactacg atgttgacca tatcgtcccg caatccttcc ttaaggacga tagcattgat 12540
aacaaggtgc tgactcgctc agataagaac cggggcaagt ccgacaatgt tccaagcgag 12600
gaagtggtta agaagatgaa gaactactgg cgccaattgc ttaatgccaa gctcatcaca 12660
cagcgcaagt ttgacaactt gaccaaggcc gagcggggag ggctgagtga actcgataag 12720
gctggcttca tcaagcgtca actcgtggag acgcgacaga tcacaaagca cgttgctcag 12780
attctggact cccggatgaa cacaaagtac gacgagaatg ataagctcat ccgtgaagtt 12840
aaggtcatta ccctcaagtc taagttggtg tcggatttcc gcaaggactt ccaattttat 12900
aaggttcggg agatcaacaa ttatcaccat gcacatgatg cgtacctcaa cgcagtcgtg 12960
ggaactgcgc tcatcaagaa gtatcccaag ttggagtccg aattcgtcta cggggattat 13020
aaggtttacg acgtccgcaa gatgatcgcc aagagtgagc aggaaattgg caaggccacg 13080
gctaagtatt tcttttactc caacatcatg aatttcttta agacggagat cacactcgcc 13140
aatggagaaa tccgtaagcg acctttgatt gagaccaacg gcgagactgg tgaaatcgtt 13200
tgggataagg ggcgcgactt cgctaccgtg cggaaggttc tgagcatgcc gcaagtcaat 13260
atcgtcaaga aaaccgaggt gcagacaggc ggtttctcta aggaatcgat tcttccaaag 13320
cgtaactctg acaagctgat cgctcgaaag aaggattggg accccaagaa gtatggaggg 13380
ttcgattctc ctacagtggc atactcggtt ctcgttgtcg cgaaggttga gaagggaaag 13440
tctaagaagc tgaagtcggt caaggaactg ctcgggatca ccattatgga gcgctccagc 13500
ttcgaaaaga atcccatcga ctttctcgag gccaagggct ataaggaagt caagaaggat 13560
cttatcatta agctgcctaa gtactctttg ttcgagcttg aaaacggtcg aaagcgaatg 13620
ctcgcatcgg caggagagtt gcagaagggg aatgaattgg cacttccctc aaagtacgtg 13680
aacttcctgt atctcgcgtc ccactacgag aagctgaagg gtagccctga ggacaacgaa 13740
cagaagcaac tttttgttga gcaacacaag cattatctgg atgagatcat tgaacagatt 13800
tcagagttca gtaagcgcgt catcctcgcc gatgctaatc tcgacaaggt gttgtcggcc 13860
tacaacaagc accgtgacaa gccgatccga gagcaggctg aaaatatcat tcatctgttc 13920
accctcacta acttgggagc accagcagcg ttcaagtatt ttgatacgac aatcgaccgt 13980
aagcgataca cgtccacaaa ggaggtgctt gatgcgaccc tgattcatca atccatcact 14040
gggctctatg aaacccgtat cgaccttagt caactggggg gcgacccccc caagaagaag 14100
cgcaaggtct gagcggacat tcgatttatg ccgttatgac ttccttaaaa aagcctttac 14160
gaatgaaaga aatggaatta gacttgttat gtagttgatt ctacaatgga ttatgattcc 14220
tgaacttcaa atccgctgtt cattattaat ctcagctctt cccgtaaagc caatgttgaa 14280
actattcgta aatgtacctc gttttgcgtg tggcgtaatc atggtcatag ctgtttcctg 14340
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 14400
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 14460
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 14520
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 14580
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 14640
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 14700
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 14760
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 14820
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 14880
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 14940
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 15000
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 15060
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 15120
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 15180
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 15240
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 15300
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 15360
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 15420
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 15480
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 15540
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 15600
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 15660
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 15720
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 15780
gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 15840
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 15900
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 15960
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 16020
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 16080
gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 16140
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 16200
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 16260
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 16320
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 16380
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 16440
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 16500
tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtc 16545
<210> 8
<211> 16545
<212> DNA
<213> 人工序列
<220>
<223> 质粒pNJOC503
<400> 8
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acccgggcta 420
attatggggt gtcgccctta ttcgactcta tagtgaagtt cctattctct agaaagtata 480
ggaacttctg aagtggggat ttaaatgcgg ccgcgctgag ggtttaatcg acgaagcagc 540
tgacggccag tgccaagctt aacgcgtacc gggcccagta tatgttccgc agatgactgg 600
agctctgcca tacgtgccct ctcaagcacc atttgttcca tctacagaga ctagtcacca 660
actagtctat caagactcac agggtacatt gctgagacca actgaccaga ggcagggtag 720
cggattgacg gctccatctc cttcacttac aaggtctatt gaaagccctt tagcatcacc 780
aagcggagaa tagattgtta agcttatttt ttgtatactg ttttgtgata gcacgaagtt 840
tttccacggt atcttgtaaa aatatatatt tgtggcgggc ttacctacat caaattaata 900
agagactaat tataaactaa acacacaagc aagctacttt agggtaaaag tttataaatg 960
cttttgacgt ataaacgttg cttgtattta ttattacaat taaaggtgga tagaaaacct 1020
agagactagt tagaaactaa tctcaggttt gcgttaaact aaatcagagc ccgagaggtt 1080
aacagaacct agaaggggac tagatatccg ggtagggaaa caaaaaaaaa aaacaagaca 1140
gccacatatt agggagacta gttagaagct agttccagga ctaggaaaat aaaagacaat 1200
gataccacag tctagttgac aactagatag attctagatt gaggccaaag tctctgagat 1260
ccaggttagt tgcaactaat actagttagt atctagtctc ctataactct gaagctagaa 1320
taacttacta ctattatcct caccactgtt cagctgcgca aacggagtga ttgcaaggtg 1380
ttcagagact agttattgac tagtcagtga ctagcaataa ctaacaaggt attaacctac 1440
catgtctgcc atcaccctgc acttcctcgg gctcagcagc cttttcctcc tcattttcat 1500
gctcattttc cttgtttaag actgtgacta gtcaaagact agtccagaac cacaaaggag 1560
aaatgtctta ccactttctt cattgcttgt ctcttttgca ttatccatgt ctgcaactag 1620
ttagagtcta gttagtgact agtccgacga ggacttgctt gtctccggat tgttggagga 1680
actctccagg gcctcaagat ccacaacaga gccttctaga agactggtca ataactagtt 1740
ggtctttgtc tgagtctgac ttacgaggtt gcatactcgc tccctttgcc tcgtcaatcg 1800
atgagaaaaa gcgccaaaac tcgcaatatg gctttgaacc acacggtgct gagactagtt 1860
agaatctagt cccaaactag cttggatagc ttacctttgc cctttgcgtt gcgacaggtc 1920
ttgcagggta tggttccttt ctcaccagct gatttagctg ccttgctacc ctcacggcgg 1980
atctgccata aagagtggct agaggttata aattagcact gatcctaggt acggggctga 2040
atgtaacttg cctttccttt ctcatcgcgc ggcaagacag gcttgctcaa attcctacca 2100
gtcacagggg tatgcacggc gtacggacca cttgaactag tcacagatta gttagcaact 2160
agtctgcatt gaatggctgt acttacgggc cctcgccatt gtcctgatca tttccagctt 2220
caccctcgtt gctgcaaagt agttagtgac tagtcaagga ctagttgaaa tgggagaaga 2280
aactcacgaa ttctcgactc ccttagtatt gtggtccttg gacttggtgc tgctatatat 2340
tagctaatac actagttaga ctcacagaaa cttacgcagc tcgcttgcgc ttcttggtag 2400
gagtcggggt tgggagaaca gtgccttcaa acaagccttc ataccatgct acttgactag 2460
tcagggacta gtcaccaagt aatctagata ggacttgcct ttggcctcca tcagttcctt 2520
catagtggga ggaccattgt gcaatgtaaa ctccatgccg tgggagttct tgtccttcaa 2580
gtgcttgacc aatatgtttc tgttggcaga gggaacctgt caactagtta ataactagtc 2640
agaaactatg atagcagtag actcactgta cgcttgaggc atcccttcac tcggcagtag 2700
acttcatatg gatggatatc aggcacgcca ttgtcgtcct gtggactagt cagtaactag 2760
gcttaaagct agtcgggtcg gcttactatc ttgaaatccg gcagcgtaag ctccccgtcc 2820
ttaactgcct cgagatagtg acagtactct ggggactttc ggagatcgtt atcgttatcg 2880
cgaatgctcg gcatactaac tgttgactag tcttggacta gtcccgagca aaaaggattg 2940
gaggaggagg aggaaggtga gagtgagaca aagagcgaaa taagagcttc aaaggctatc 3000
tctaagcagt atgaaggtta agtatctagt tcttgactag atttaaaaga gatttcgact 3060
agttatgtac ctggagtttg gatataggaa tgtgttgtgg taacgaaatg taagggggag 3120
gaaagaaaaa gtcggtcaag aggtaactct aagtcggcca ttcctttttg ggaggcgcta 3180
accataaacg gcatggtcga cttagagtta gctcagggaa tttagggagt tatctgcgac 3240
caccgaggaa cggcggaatg ccaaagaatc ccgatggagc tctagctggc ggttgacaac 3300
cccacctttt ggcgtttctg cggcgttgca ggcgggactg gatacttcgt agaaccagaa 3360
aggcaaggca gaacgcgctc agcaagagtg ttggaagtga tagcatgatg tgccttgtta 3420
actaggtcaa aatctgcagt atgcttgatg ttatccaaag tgtgagagag gaaggtccaa 3480
acatacacga ttgggagagg gcctaggtat aagagttttt gagtagaacg catgtgagcc 3540
cagccatctc gaggagatta aacacgggcc ggcatttgat ggctatgtta gtaccccaat 3600
ggaaacggtg agagtccagt ggtcgcagat aactccctaa attccctgag ctaactctaa 3660
gtcgaccatg ccgtttatgg ttagcgcctc ccaaaaagga atggccgact tagagttacc 3720
tcttgaccga ctttttcttt cctccccctt acatttcgtt accacaacac attcctatat 3780
ccaaactcca ggtacataac tagtcgaaat ctcttttaaa tctagtcaag aactagatac 3840
ttaaccttca tactgcttag agatagcctt tgaagctctt atttcgctct ttgtctcact 3900
ctcaccttcc tcctcctcct ccaatccttt ttgctcggga ctagtccaag actagtcaac 3960
agttagtatg ccgagcattc gcgataacga taacgatctc cgaaagtccc cagagtactg 4020
tcactatctc gaggcagtta aggacgggga gcttacgctg ccggatttca agatagtaag 4080
ccgacccgac tagctttaag cctagttact gactagtcca caggacgaca atggcgtgcc 4140
tgatatccat ccatatgaag tctactgccg agtgaaggga tgcctcaagc gtacagtgag 4200
tctactgcta tcatagtttc tgactagtta ttaactagtt gacaggttcc ctctgccaac 4260
agaaacatat tggtcaagca cttgaaggac aagaactccc acggcatgga gtttacattg 4320
cacaatggtc ctcccactat gaaggaactg atggaggcca aaggcaagtc ctatctagat 4380
tacttggtga ctagtccctg actagtcaag tagcatggta tgaaggcttg tttgaaggca 4440
ctgttctccc aaccccgact cctaccaaga agcgcaagcg agctgcgtaa gtttctgtga 4500
gtctaactag tgtattagct aatatatagc agcaccaagt ccaaggacca caatactaag 4560
ggagtcgaga attcgtgagt ttcttctccc atttcaacta gtccttgact agtcactaac 4620
tactttgcag caacgagggt gaagctggaa atgatcagga caatggcgag ggcccgtaag 4680
tacagccatt caatgcagac tagttgctaa ctaatctgtg actagttcaa gtggtccgta 4740
cgccgtgcat acccctgtga ctggtaggaa tttgagcaag cctgtcttgc cgcgcgatga 4800
gaaaggaaag gcaagttaca ttcagccccg tacctaggat cagtgctaat ttataacctc 4860
tagccactct ttatggcaga tccgccgtga gggtagcaag gcagctaaat cagctggtga 4920
gaaaggaacc ataccctgca agacctgtcg caacgcaaag ggcaaaggta agctatccaa 4980
gctagtttgg gactagattc taactagtct cagcaccgtg tggttcaaag ccatattgcg 5040
agttttggcg ctttttctca tcgattgacg aggcaaaggg agcgagtatg caacctcgta 5100
agtcagactc agacaaagac caactagtta ttgaccagtc ttctagaagg ctctgttgtg 5160
gatcttgagg ccctggagag ttcctccaac aatccggaga caagcaagtc ctcgtcggac 5220
tagtcactaa ctagactcta actagttgca gacatggata atgcaaaaga gacaagcaat 5280
gaagaaagtg gtaagacatt tctcctttgt ggttctggac tagtctttga ctagtcacag 5340
tcttaaacaa ggaaaatgag catgaaaatg aggaggaaaa ggctgctgag cccgaggaag 5400
tgcagggtga tggcagacat ggtaggttaa taccttgtta gttattgcta gtcactgact 5460
agtcaataac tagtctctga acaccttgca atcactccgt ttgcgcagct gaacagtggt 5520
gaggataata gtagtaagtt attctagctt cagagttata ggagactaga tactaactag 5580
tattagttgc aactaacctg gatctcagag actttggcct caatctagaa tctatctagt 5640
tgtcaactag actgtggtat cattgtcttt tattttccta gtcctggaac tagcttctaa 5700
ctagtctccc taatatgtgg ctgtcttgtt tttttttttt gtttccctac ccggatatct 5760
agtccccttc taggttctgt taacctctcg ggctctgatt tagtttaacg caaacctgag 5820
attagtttct aactagtctc taggttttct atccaccttt aattgtaata ataaatacaa 5880
gcaacgttta tacgtcaaaa gcatttataa acttttaccc taaagtagct tgcttgtgtg 5940
tttagtttat aattagtctc ttattaattt gatgtaggta agcccgccac aaatatatat 6000
ttttacaaga taccgtggaa aaacttcgtg ctatcacaaa acagtataca aaaaataagc 6060
ttaacaatct attctccgct tggtgatgct aaagggcttt caatagacct tgtaagtgaa 6120
ggagatggag ccgtcaatcc gctaccctgc ctctggtcag ttggtctcag caatgtaccc 6180
tgtgagtctt gatagactag ttggtgacta gtctctgtag atggaacaaa tggtgcttga 6240
gagggcacgt atggcagagc tccagtcatc tgcggaacat atactgggcc cggggatcct 6300
ctagagtcga cctgcaggtt catttaaacg gcttcacggg cagcccagcg gtcgatttcg 6360
cttccaaatt ttgggggaaa gggtccctga gcagcctcac aaacgcaaac atgcgcacgc 6420
gccacacgga aaatgaagct gactttgaat ttttaagaat cccctttgcc cgtggcacct 6480
tctgattttt gtcttcgtgt ccaatccatc tccttgaacg acaacccagc cctttctatt 6540
tcctatcccc taatatctaa tgtgagtcct catcgtcaca gacggcgacg gacgcgacat 6600
ttcgcccgtg ctcatcgacc gctctgctgt cgccaacaga acacgcggtt atgtcgcgtt 6660
ccgctttgtc gtaccacttt cgccccacac cgctgacctc gcgttcccag catgaaaaag 6720
cctgaactca ccgcgacgtc tgtcgagaag tttctgatcg aaaagttcga cagcgtctcc 6780
gacctgatgc agctctcgga gggcgaagaa tctcgtgctt tcagcttcga tgtaggaggg 6840
cgtggatatg tcctgcgggt aaatagctgc gccgatggtt tctacaaaga tcgttatgtt 6900
tatcggcact ttgcatcggc cgcgctcccg attccggaag tgcttgacat tggggagttc 6960
agcgagagcc tgacctattg catctcccgc cgtgcacagg gtgtcacgtt gcaagacctg 7020
cctgaaaccg aactgcccgc tgttctgcag ccggtcgcgg aggccatgga tgcgatcgct 7080
gcggccgatc ttagccagac gagcgggttc ggcccattcg gaccgcaagg aatcggtcaa 7140
tacactacat ggcgtgattt catatgcgcg attgctgatc cccatgtgta tcactggcaa 7200
actgtgatgg acgacaccgt cagtgcgtcc gtcgcgcagg ctctcgatga gctgatgctt 7260
tgggccgagg actgccccga agtccggcac ctcgtgcacg cggatttcgg ctccaacaat 7320
gtcctgacgg acaatggccg cataacagcg gtcattgact ggagcgaggc gatgttcggg 7380
gattcccaat acgaggtcgc caacatcttc ttctggaggc cgtggttggc ttgtatggag 7440
cagcagacgc gctacttcga gcggaggcat ccggagcttg caggatcgcc gcggctccgg 7500
gcgtatatgc tccgcattgg tcttgaccaa ctctatcaga gcttggttga cggcaatttc 7560
gatgatgcag cttgggcgca gggtcgatgc gacgcaatcg tccgatccgg agccgggact 7620
gtcgggcgta cacaaatcgc ccgcagaagc gcggccgtct ggaccgatgg ctgtgtagaa 7680
gtactcgccg atagtggaaa ccgacgcccc agcactcgtc cgagggcaag gaatagtaaa 7740
tgattcgtta gttctttcct gaactgatga ttcgcgcgat tcgtatttct ctttgttggt 7800
tgttctgatg atgatgaaaa tgacgcatct ctttatttgc tgcactcgta cacccatcct 7860
ttggaatgat taatacccct cctttttcat cgcggacggt agtcgttctc tttggggccg 7920
tgtttcttcc cattcgcatg cgacctcgtg gtcattgact gtctgtcctc ttcctctcca 7980
cctacctcca ccacctacgt tgactgcata tcactttttc aaacattcat gataatacgc 8040
taccttctgg catgaccttt tgatgatcgc tttttactat cctttcaatt acgatgttgt 8100
cacttctatt tgtcattttg cggaattagt attttctttc catcttcgat ggagagatga 8160
atattgcctg caggcatgca agctttctgc tcgaggccat ctggcttttc tctgctgtct 8220
gcctcgggaa tgggatggaa taccacgtac ggtatttggc ctccggtgcc atccgaagcg 8280
agatgctttg agcttgaaac cccctcggcc tgcacaggtg tctcatcgtg catttaatcc 8340
aacggcggcg agtcaaaaca tcagctaatt gaccaggttt ctggattgtg aatgccaact 8400
ttttgggtct tgaggagttg cggggtggga aaaaagtaaa gaaatttact gaggatttta 8460
tcattgcgac tataaaataa agcggcattg caaatccttg cgttgctact atgtaaaatg 8520
gactgtagtt gtgctgctga aaatagtttg gcgattgtgg attgtggatt gtggattgtg 8580
gattatggca agttgtcaag gggcaagttg acgaaaatga ttgtgtggtg tctgccagca 8640
aattgagaac gtgggtatat atttcatctt ttcatgattc ccttcggctt gcttgtcaag 8700
caatggcatc attggtctag tggtagaatt cgtcgttgcc atcgacgagg cccgtgttcg 8760
attcacggat gatgcagccg acacgagtga gttctggttt tagagctaga aatagcaagt 8820
taaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt gctttttttt 8880
tggctcttgg gttcgaactg cccaaggccc atgttttggt catctttttt tttatgcccc 8940
accatttggg tcacccctgc caatcattcc atctttgttc ctacccttca cgtgtgcttt 9000
ccgaagccaa agttcccatt caacaactct ccttgcgttt tttttttctt gaagcttgtc 9060
acccgtcgat agtttctgcc atttgcaata agcttcgaga cagcagaatc accgcccaag 9120
ttaagccttt gtgctgatca tgctctcgaa cgggccaagt tcgggaaaag caaaggagcg 9180
tttagtgagg ggcaatttga ctcacctccc aggcaacaga tgaggggggc aaaaagaaag 9240
aaattttcgt gagtcaatat ggattccgag catcattttc ttgcggtcta tcttgctacg 9300
tatgttgatc ttgacgctgt ggatcaagca acgccactcg ctcgctccat cgcaggctgg 9360
tcgcagacaa attaaaaggc ggcaaactcg tacagccgcg gggttgtccg ctgcaaagta 9420
cagagtgata aaagccgcca tgcgaccatc aacgcgttga tgcccagctt tttcgatccg 9480
agaatccacc gtagaggcga tagcaagtaa agaaaagcta aacaaaaaaa aatttctgcc 9540
cctaagccat gaaaacgaga tggggtggag cagaaccaag gaaagagtcg cgctgggctg 9600
ccgttccgga aggtgttgta aaggctcgac gcccaaggtg ggagtctagg agaagaattt 9660
gcatcgggag tggggcgggt tacccctcca tatccaatga cagatatcta ccagccaagg 9720
gtttgagccc gcccgcttag tcgtcgtcct cgcttgcccc tccataaaag gatttcccct 9780
ccccctccca caaaattttc tttcccttcc tctccttgtc cgcttcagta cgtatatctt 9840
cccttccctc gcttctctcc tccatccttc tttcatccat ctcctgctaa cttctctgct 9900
cagcacctct acgcattact agccgtagta tctgagcact tctccctttt atattccaca 9960
aaacataaca caaccttcac catggacaag aagtatagca tcgggctgga cattggaacg 10020
aactcggttg gttgggctgt gattacggac gaatacaagg tgccatccaa gaagtttaag 10080
gtcctgggaa acaccgaccg tcactcaatc aagaagaatc tcattggagc cctgctcttc 10140
gatagtgggg agaccgccga agctactcga ctgaagcgaa cggctcgccg gcgttataca 10200
cgacgcaaga atcgcatctg ctacctccag gagattttca gcaacgaaat ggctaaggtt 10260
gatgactcat tctttcatcg actcgaagaa agtttcttgg tcgaggagga taagaagcac 10320
gagcgccatc cgatctttgg taacattgtg gatgaggttg cctatcacga aaagtaccca 10380
actatctatc atcttcgtaa gaagctggtc gatagcacgg acaaggctga tttgcgactt 10440
atctacctgg cactcgcgca catgattaag ttccgcggcc attttcttat cgagggtgac 10500
ctgaaccccg ataattctga cgttgataag ctcttcatcc agttggtcca aacctacaat 10560
cagctgtttg aggaaaaccc tattaatgca tctggcgtgg acgccaaggc tatcctttcg 10620
gcgcgcctgt ctaagtcgcg gcgtttggag aaccttatcg cacaactccc cggcgaaaag 10680
aagaacggcc tcttcggtaa tttgattgcg ttgtcacttg gtctgactcc taacttcaag 10740
agtaattttg acctggcaga ggatgcgaag ctccagttgt ctaaggatac gtatgatgac 10800
gatctcgaca acttgcttgc ccaaatcggt gaccagtacg ctgatctttt cctggccgct 10860
aagaatctct cagatgcaat cctgctcagt gacattttgc gggtcaacac cgagattact 10920
aaggcccccc tgtcagctag tatgatcaag cggtatgatg agcaccatca ggacctcacc 10980
ttgcttaagg ccctcgtgcg tcagcaattg cctgagaagt acaaggaaat cttctttgac 11040
caatccaaga acggatacgc agggtatatt gatggcggtg cgagccagga ggaattctac 11100
aagtttatca agccgatttt ggagaagatg gacggcactg aggaactgct cgtcaagctg 11160
aatcgcgaag atttgcttcg taagcaacga acgttcgaca acggctccat cccgcaccag 11220
attcatctgg gcgagctcca cgccatcctt cgacgccagg aagatttcta cccatttctg 11280
aaggacaacc gtgagaagat cgaaaagatt cttacattcc gaatccccta ctatgtggga 11340
cctttggccc gtgggaattc ccgatttgct tggatgaccc gaaagagcga ggaaaccatc 11400
actccgtgga acttcgagga agtcgtggac aagggtgcat ccgcgcagag cttcattgag 11460
cggatgacca attttgataa gaaccttccg aatgaaaagg tcctgccaaa gcattcgctg 11520
ctctacgagt atttcaccgt gtataacgaa ctgactaagg tcaagtacgt gacggaggga 11580
atgcggaagc cagccttcct ctcaggggaa caaaagaagg ctatcgtcga tttgcttttt 11640
aagaccaatc gtaaagtgac tgttaagcag ctgaaggagg attatttcaa gaagattgaa 11700
tgtttcgact ccgtcgagat cagcggcgtg gaagatcgct ttaacgcttc cctcggtacc 11760
taccacgacc tgctcaagat cattaaggac aaggatttcc tcgataacga ggaaaatgag 11820
gacatcttgg aagatattgt cctcacgttg acactttttg aggaccgcga aatgatcgag 11880
gaacggctca agacatatgc ccatttgttc gacgataagg tgatgaagca gctgaagcgg 11940
cgtcgataca ccggatgggg tcgccttagc cggaagctga tcaacggcat tcgagataag 12000
caatctggta agactatctt ggatttcctt aagtcggacg gcttcgccaa ccgcaatttt 12060
atgcagctta ttcacgacga ttccctgacg ttcaaggagg acatccagaa ggcacaagtc 12120
tcaggacaag gggattccct gcacgagcat atcgccaacc tggctggatc cccggcgatc 12180
aagaagggga ttcttcagac cgtcaaggtt gtcgacgagc tggtcaaggt gatgggccgt 12240
cataagccag aaaacatcgt gattgagatg gcccgagaaa atcagaccac tcaaaagggt 12300
cagaagaaca gccgcgagcg gatgaagcgg atcgaggaag gcattaagga acttggttct 12360
cagatcctga aggagcaccc tgttgaaaac acacagctcc aaaatgagaa gctgtatctc 12420
tactatttgc aaaatggacg cgacatgtac gtcgatcagg agctcgacat taaccggttg 12480
tcggactacg atgttgacca tatcgtcccg caatccttcc ttaaggacga tagcattgat 12540
aacaaggtgc tgactcgctc agataagaac cggggcaagt ccgacaatgt tccaagcgag 12600
gaagtggtta agaagatgaa gaactactgg cgccaattgc ttaatgccaa gctcatcaca 12660
cagcgcaagt ttgacaactt gaccaaggcc gagcggggag ggctgagtga actcgataag 12720
gctggcttca tcaagcgtca actcgtggag acgcgacaga tcacaaagca cgttgctcag 12780
attctggact cccggatgaa cacaaagtac gacgagaatg ataagctcat ccgtgaagtt 12840
aaggtcatta ccctcaagtc taagttggtg tcggatttcc gcaaggactt ccaattttat 12900
aaggttcggg agatcaacaa ttatcaccat gcacatgatg cgtacctcaa cgcagtcgtg 12960
ggaactgcgc tcatcaagaa gtatcccaag ttggagtccg aattcgtcta cggggattat 13020
aaggtttacg acgtccgcaa gatgatcgcc aagagtgagc aggaaattgg caaggccacg 13080
gctaagtatt tcttttactc caacatcatg aatttcttta agacggagat cacactcgcc 13140
aatggagaaa tccgtaagcg acctttgatt gagaccaacg gcgagactgg tgaaatcgtt 13200
tgggataagg ggcgcgactt cgctaccgtg cggaaggttc tgagcatgcc gcaagtcaat 13260
atcgtcaaga aaaccgaggt gcagacaggc ggtttctcta aggaatcgat tcttccaaag 13320
cgtaactctg acaagctgat cgctcgaaag aaggattggg accccaagaa gtatggaggg 13380
ttcgattctc ctacagtggc atactcggtt ctcgttgtcg cgaaggttga gaagggaaag 13440
tctaagaagc tgaagtcggt caaggaactg ctcgggatca ccattatgga gcgctccagc 13500
ttcgaaaaga atcccatcga ctttctcgag gccaagggct ataaggaagt caagaaggat 13560
cttatcatta agctgcctaa gtactctttg ttcgagcttg aaaacggtcg aaagcgaatg 13620
ctcgcatcgg caggagagtt gcagaagggg aatgaattgg cacttccctc aaagtacgtg 13680
aacttcctgt atctcgcgtc ccactacgag aagctgaagg gtagccctga ggacaacgaa 13740
cagaagcaac tttttgttga gcaacacaag cattatctgg atgagatcat tgaacagatt 13800
tcagagttca gtaagcgcgt catcctcgcc gatgctaatc tcgacaaggt gttgtcggcc 13860
tacaacaagc accgtgacaa gccgatccga gagcaggctg aaaatatcat tcatctgttc 13920
accctcacta acttgggagc accagcagcg ttcaagtatt ttgatacgac aatcgaccgt 13980
aagcgataca cgtccacaaa ggaggtgctt gatgcgaccc tgattcatca atccatcact 14040
gggctctatg aaacccgtat cgaccttagt caactggggg gcgacccccc caagaagaag 14100
cgcaaggtct gagcggacat tcgatttatg ccgttatgac ttccttaaaa aagcctttac 14160
gaatgaaaga aatggaatta gacttgttat gtagttgatt ctacaatgga ttatgattcc 14220
tgaacttcaa atccgctgtt cattattaat ctcagctctt cccgtaaagc caatgttgaa 14280
actattcgta aatgtacctc gttttgcgtg tggcgtaatc atggtcatag ctgtttcctg 14340
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 14400
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 14460
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 14520
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 14580
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 14640
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 14700
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 14760
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 14820
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 14880
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 14940
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 15000
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 15060
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 15120
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 15180
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 15240
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 15300
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 15360
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 15420
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 15480
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 15540
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 15600
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 15660
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 15720
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 15780
gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 15840
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 15900
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 15960
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 16020
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 16080
gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 16140
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 16200
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 16260
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 16320
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 16380
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 16440
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 16500
tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtc 16545
<210> 9
<211> 16545
<212> DNA
<213> 人工序列
<220>
<223> 质粒pNJOC504
<400> 9
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acccgggcta 420
attatggggt gtcgccctta ttcgactcta tagtgaagtt cctattctct agaaagtata 480
ggaacttctg aagtggggat ttaaatgcgg ccgcgctgag ggtttaatcg acgaagcagc 540
tgacggccag tgccaagctt aacgcgtacc gggcccagta tatgttccgc agatgactgg 600
agctctgcca tacgtgccct ctcaagcacc atttgttcca tctacagaga ctagtcacca 660
actagtctat caagactcac agggtacatt gctgagacca actgaccaga ggcagggtag 720
cggattgacg gctccatctc cttcacttac aaggtctatt gaaagccctt tagcatcacc 780
aagcggagaa tagattgtta agcttatttt ttgtatactg ttttgtgata gcacgaagtt 840
tttccacggt atcttgtaaa aatatatatt tgtggcgggc ttacctacat caaattaata 900
agagactaat tataaactaa acacacaagc aagctacttt agggtaaaag tttataaatg 960
cttttgacgt ataaacgttg cttgtattta ttattacaat taaaggtgga tagaaaacct 1020
agagactagt tagaaactaa tctcaggttt gcgttaaact aaatcagagc ccgagaggtt 1080
aacagaacct agaaggggac tagatatccg ggtagggaaa caaaaaaaaa aaacaagaca 1140
gccacatatt agggagacta gttagaagct agttccagga ctaggaaaat aaaagacaat 1200
gataccacag tctagttgac aactagatag attctagatt gaggccaaag tctctgagat 1260
ccaggttagt tgcaactaat actagttagt atctagtctc ctataactct gaagctagaa 1320
taacttacta ctattatcct caccactgtt cagctgcgca aacggagtga ttgcaaggtg 1380
ttcagagact agttattgac tagtcagtga ctagcaataa ctaacaaggt attaacctac 1440
catgtctgcc atcaccctgc acttcctcgg gctcagcagc cttttcctcc tcattttcat 1500
gctcattttc cttgtttaag actgtgacta gtcaaagact agtccagaac cacaaaggag 1560
aaatgtctta ccactttctt cattgcttgt ctcttttgca ttatccatgt ctgcaactag 1620
ttagagtcta gttagtgact agtccgacga ggacttgctt gtctccggat tgttggagga 1680
actctccagg gcctcaagat ccacaacaga gccttctaga agactggtca ataactagtt 1740
ggtctttgtc tgagtctgac ttacgaggtt gcatactcgc tccctttgcc tcgtcaatcg 1800
atgagaaaaa gcgccaaaac tcgcaatatg gctttgaacc acacggtgct gagactagtt 1860
agaatctagt cccaaactag cttggatagc ttacctttgc cctttgcgtt gcgacaggtc 1920
ttgcagggta tggttccttt ctcaccagct gatttagctg ccttgctacc ctcacggcgg 1980
atctgccata aagagtggct agaggttata aattagcact gatcctaggt acggggctga 2040
atgtaacttg cctttccttt ctcatcgcgc ggcaagacag gcttgctcaa attcctacca 2100
gtcacagggg tatgcacggc gtacggacca cttgaactag tcacagatta gttagcaact 2160
agtctgcatt gaatggctgt acttacgggc cctcgccatt gtcctgatca tttccagctt 2220
caccctcgtt gctgcaaagt agttagtgac tagtcaagga ctagttgaaa tgggagaaga 2280
aactcacgaa ttctcgactc ccttagtatt gtggtccttg gacttggtgc tgctatatat 2340
tagctaatac actagttaga ctcacagaaa cttacgcagc tcgcttgcgc ttcttggtag 2400
gagtcggggt tgggagaaca gtgccttcaa acaagccttc ataccatgct acttgactag 2460
tcagggacta gtcaccaagt aatctagata ggacttgcct ttggcctcca tcagttcctt 2520
catagtggga ggaccattgt gcaatgtaaa ctccatgccg tgggagttct tgtccttcaa 2580
gtgcttgacc aatatgtttc tgttggcaga gggaacctgt caactagtta ataactagtc 2640
agaaactatg atagcagtag actcactgta cgcttgaggc atcccttcac tcggcagtag 2700
acttcatatg gatggatatc aggcacgcca ttgtcgtcct gtggactagt cagtaactag 2760
gcttaaagct agtcgggtcg gcttactatc ttgaaatccg gcagcgtaag ctccccgtcc 2820
ttaactgcct cgagatagtg acagtactct ggggactttc ggagatcgtt atcgttatcg 2880
cgaatgctcg gcatactaac tgttgactag tcttggacta gtcccgagca aaaaggattg 2940
gaggaggagg aggaaggtga gagtgagaca aagagcgaaa taagagcttc aaaggctatc 3000
tctaagcagt atgaaggtta agtatctagt tcttgactag atttaaaaga gatttcgact 3060
agttatgtac ctggagtttg gatataggaa tgtgttgtgg taacgaaatg taagggggag 3120
gaaagaaaaa gtcggtcaag aggtaactct aagtcggcca ttcctttttg ggaggcgcta 3180
accataaacg gcatggtcga cttagagtta gctcagggaa tttagggagt tatctgcgac 3240
caccgaggaa cggcggaatg ccaaagaatc ccgatggagc tctagctggc ggttgacaac 3300
cccacctttt ggcgtttctg cggcgttgca ggcgggactg gatacttcgt agaaccagaa 3360
aggcaaggca gaacgcgctc agcaagagtg ttggaagtga tagcatgatg tgccttgtta 3420
actaggtcaa aatctgcagt atgcttgatg ttatccaaag tgtgagagag gaaggtccaa 3480
acatacacga ttgggagagg gcctaggtat aagagttttt gagtagaacg catgtgagcc 3540
cagccatctc gaggagatta aacacgggcc ggcatttgat ggctatgtta gtaccccaat 3600
ggaaacggtg agagtccagt ggtcgcagat aactccctaa attccctgag ctaactctaa 3660
gtcgaccatg ccgtttatgg ttagcgcctc ccaaaaagga atggccgact tagagttacc 3720
tcttgaccga ctttttcttt cctccccctt acatttcgtt accacaacac attcctatat 3780
ccaaactcca ggtacataac tagtcgaaat ctcttttaaa tctagtcaag aactagatac 3840
ttaaccttca tactgcttag agatagcctt tgaagctctt atttcgctct ttgtctcact 3900
ctcaccttcc tcctcctcct ccaatccttt ttgctcggga ctagtccaag actagtcaac 3960
agttagtatg ccgagcattc gcgataacga taacgatctc cgaaagtccc cagagtactg 4020
tcactatctc gaggcagtta aggacgggga gcttacgctg ccggatttca agatagtaag 4080
ccgacccgac tagctttaag cctagttact gactagtcca caggacgaca atggcgtgcc 4140
tgatatccat ccatatgaag tctactgccg agtgaaggga tgcctcaagc gtacagtgag 4200
tctactgcta tcatagtttc tgactagtta ttaactagtt gacaggttcc ctctgccaac 4260
agaaacatat tggtcaagca cttgaaggac aagaactccc acggcatgga gtttacattg 4320
cacaatggtc ctcccactat gaaggaactg atggaggcca aaggcaagtc ctatctagat 4380
tacttggtga ctagtccctg actagtcaag tagcatggta tgaaggcttg tttgaaggca 4440
ctgttctccc aaccccgact cctaccaaga agcgcaagcg agctgcgtaa gtttctgtga 4500
gtctaactag tgtattagct aatatatagc agcaccaagt ccaaggacca caatactaag 4560
ggagtcgaga attcgtgagt ttcttctccc atttcaacta gtccttgact agtcactaac 4620
tactttgcag caacgagggt gaagctggaa atgatcagga caatggcgag ggcccgtaag 4680
tacagccatt caatgcagac tagttgctaa ctaatctgtg actagttcaa gtggtccgta 4740
cgccgtgcat acccctgtga ctggtaggaa tttgagcaag cctgtcttgc cgcgcgatga 4800
gaaaggaaag gcaagttaca ttcagccccg tacctaggat cagtgctaat ttataacctc 4860
tagccactct ttatggcaga tccgccgtga gggtagcaag gcagctaaat cagctggtga 4920
gaaaggaacc ataccctgca agacctgtcg caacgcaaag ggcaaaggta agctatccaa 4980
gctagtttgg gactagattc taactagtct cagcaccgtg tggttcaaag ccatattgcg 5040
agttttggcg ctttttctca tcgattgacg aggcaaaggg agcgagtatg caacctcgta 5100
agtcagactc agacaaagac caactagtta ttgaccagtc ttctagaagg ctctgttgtg 5160
gatcttgagg ccctggagag ttcctccaac aatccggaga caagcaagtc ctcgtcggac 5220
tagtcactaa ctagactcta actagttgca gacatggata atgcaaaaga gacaagcaat 5280
gaagaaagtg gtaagacatt tctcctttgt ggttctggac tagtctttga ctagtcacag 5340
tcttaaacaa ggaaaatgag catgaaaatg aggaggaaaa ggctgctgag cccgaggaag 5400
tgcagggtga tggcagacat ggtaggttaa taccttgtta gttattgcta gtcactgact 5460
agtcaataac tagtctctga acaccttgca atcactccgt ttgcgcagct gaacagtggt 5520
gaggataata gtagtaagtt attctagctt cagagttata ggagactaga tactaactag 5580
tattagttgc aactaacctg gatctcagag actttggcct caatctagaa tctatctagt 5640
tgtcaactag actgtggtat cattgtcttt tattttccta gtcctggaac tagcttctaa 5700
ctagtctccc taatatgtgg ctgtcttgtt tttttttttt gtttccctac ccggatatct 5760
agtccccttc taggttctgt taacctctcg ggctctgatt tagtttaacg caaacctgag 5820
attagtttct aactagtctc taggttttct atccaccttt aattgtaata ataaatacaa 5880
gcaacgttta tacgtcaaaa gcatttataa acttttaccc taaagtagct tgcttgtgtg 5940
tttagtttat aattagtctc ttattaattt gatgtaggta agcccgccac aaatatatat 6000
ttttacaaga taccgtggaa aaacttcgtg ctatcacaaa acagtataca aaaaataagc 6060
ttaacaatct attctccgct tggtgatgct aaagggcttt caatagacct tgtaagtgaa 6120
ggagatggag ccgtcaatcc gctaccctgc ctctggtcag ttggtctcag caatgtaccc 6180
tgtgagtctt gatagactag ttggtgacta gtctctgtag atggaacaaa tggtgcttga 6240
gagggcacgt atggcagagc tccagtcatc tgcggaacat atactgggcc cggggatcct 6300
ctagagtcga cctgcaggtt catttaaacg gcttcacggg cagcccagcg gtcgatttcg 6360
cttccaaatt ttgggggaaa gggtccctga gcagcctcac aaacgcaaac atgcgcacgc 6420
gccacacgga aaatgaagct gactttgaat ttttaagaat cccctttgcc cgtggcacct 6480
tctgattttt gtcttcgtgt ccaatccatc tccttgaacg acaacccagc cctttctatt 6540
tcctatcccc taatatctaa tgtgagtcct catcgtcaca gacggcgacg gacgcgacat 6600
ttcgcccgtg ctcatcgacc gctctgctgt cgccaacaga acacgcggtt atgtcgcgtt 6660
ccgctttgtc gtaccacttt cgccccacac cgctgacctc gcgttcccag catgaaaaag 6720
cctgaactca ccgcgacgtc tgtcgagaag tttctgatcg aaaagttcga cagcgtctcc 6780
gacctgatgc agctctcgga gggcgaagaa tctcgtgctt tcagcttcga tgtaggaggg 6840
cgtggatatg tcctgcgggt aaatagctgc gccgatggtt tctacaaaga tcgttatgtt 6900
tatcggcact ttgcatcggc cgcgctcccg attccggaag tgcttgacat tggggagttc 6960
agcgagagcc tgacctattg catctcccgc cgtgcacagg gtgtcacgtt gcaagacctg 7020
cctgaaaccg aactgcccgc tgttctgcag ccggtcgcgg aggccatgga tgcgatcgct 7080
gcggccgatc ttagccagac gagcgggttc ggcccattcg gaccgcaagg aatcggtcaa 7140
tacactacat ggcgtgattt catatgcgcg attgctgatc cccatgtgta tcactggcaa 7200
actgtgatgg acgacaccgt cagtgcgtcc gtcgcgcagg ctctcgatga gctgatgctt 7260
tgggccgagg actgccccga agtccggcac ctcgtgcacg cggatttcgg ctccaacaat 7320
gtcctgacgg acaatggccg cataacagcg gtcattgact ggagcgaggc gatgttcggg 7380
gattcccaat acgaggtcgc caacatcttc ttctggaggc cgtggttggc ttgtatggag 7440
cagcagacgc gctacttcga gcggaggcat ccggagcttg caggatcgcc gcggctccgg 7500
gcgtatatgc tccgcattgg tcttgaccaa ctctatcaga gcttggttga cggcaatttc 7560
gatgatgcag cttgggcgca gggtcgatgc gacgcaatcg tccgatccgg agccgggact 7620
gtcgggcgta cacaaatcgc ccgcagaagc gcggccgtct ggaccgatgg ctgtgtagaa 7680
gtactcgccg atagtggaaa ccgacgcccc agcactcgtc cgagggcaag gaatagtaaa 7740
tgattcgtta gttctttcct gaactgatga ttcgcgcgat tcgtatttct ctttgttggt 7800
tgttctgatg atgatgaaaa tgacgcatct ctttatttgc tgcactcgta cacccatcct 7860
ttggaatgat taatacccct cctttttcat cgcggacggt agtcgttctc tttggggccg 7920
tgtttcttcc cattcgcatg cgacctcgtg gtcattgact gtctgtcctc ttcctctcca 7980
cctacctcca ccacctacgt tgactgcata tcactttttc aaacattcat gataatacgc 8040
taccttctgg catgaccttt tgatgatcgc tttttactat cctttcaatt acgatgttgt 8100
cacttctatt tgtcattttg cggaattagt attttctttc catcttcgat ggagagatga 8160
atattgcctg caggcatgca agctttctgc tcgaggccat ctggcttttc tctgctgtct 8220
gcctcgggaa tgggatggaa taccacgtac ggtatttggc ctccggtgcc atccgaagcg 8280
agatgctttg agcttgaaac cccctcggcc tgcacaggtg tctcatcgtg catttaatcc 8340
aacggcggcg agtcaaaaca tcagctaatt gaccaggttt ctggattgtg aatgccaact 8400
ttttgggtct tgaggagttg cggggtggga aaaaagtaaa gaaatttact gaggatttta 8460
tcattgcgac tataaaataa agcggcattg caaatccttg cgttgctact atgtaaaatg 8520
gactgtagtt gtgctgctga aaatagtttg gcgattgtgg attgtggatt gtggattgtg 8580
gattatggca agttgtcaag gggcaagttg acgaaaatga ttgtgtggtg tctgccagca 8640
aattgagaac gtgggtatat atttcatctt ttcatgattc ccttcggctt gcttgtcaag 8700
caatggcatc attggtctag tggtagaatt cgtcgttgcc atcgacgagg cccgtgttcg 8760
attcacggat gatgcacccc ggaagagctt catatcgttt tagagctaga aatagcaagt 8820
taaaataagg ctagtccgtt atcaacttga aaaagtggca ccgagtcggt gctttttttt 8880
tggctcttgg gttcgaactg cccaaggccc atgttttggt catctttttt tttatgcccc 8940
accatttggg tcacccctgc caatcattcc atctttgttc ctacccttca cgtgtgcttt 9000
ccgaagccaa agttcccatt caacaactct ccttgcgttt tttttttctt gaagcttgtc 9060
acccgtcgat agtttctgcc atttgcaata agcttcgaga cagcagaatc accgcccaag 9120
ttaagccttt gtgctgatca tgctctcgaa cgggccaagt tcgggaaaag caaaggagcg 9180
tttagtgagg ggcaatttga ctcacctccc aggcaacaga tgaggggggc aaaaagaaag 9240
aaattttcgt gagtcaatat ggattccgag catcattttc ttgcggtcta tcttgctacg 9300
tatgttgatc ttgacgctgt ggatcaagca acgccactcg ctcgctccat cgcaggctgg 9360
tcgcagacaa attaaaaggc ggcaaactcg tacagccgcg gggttgtccg ctgcaaagta 9420
cagagtgata aaagccgcca tgcgaccatc aacgcgttga tgcccagctt tttcgatccg 9480
agaatccacc gtagaggcga tagcaagtaa agaaaagcta aacaaaaaaa aatttctgcc 9540
cctaagccat gaaaacgaga tggggtggag cagaaccaag gaaagagtcg cgctgggctg 9600
ccgttccgga aggtgttgta aaggctcgac gcccaaggtg ggagtctagg agaagaattt 9660
gcatcgggag tggggcgggt tacccctcca tatccaatga cagatatcta ccagccaagg 9720
gtttgagccc gcccgcttag tcgtcgtcct cgcttgcccc tccataaaag gatttcccct 9780
ccccctccca caaaattttc tttcccttcc tctccttgtc cgcttcagta cgtatatctt 9840
cccttccctc gcttctctcc tccatccttc tttcatccat ctcctgctaa cttctctgct 9900
cagcacctct acgcattact agccgtagta tctgagcact tctccctttt atattccaca 9960
aaacataaca caaccttcac catggacaag aagtatagca tcgggctgga cattggaacg 10020
aactcggttg gttgggctgt gattacggac gaatacaagg tgccatccaa gaagtttaag 10080
gtcctgggaa acaccgaccg tcactcaatc aagaagaatc tcattggagc cctgctcttc 10140
gatagtgggg agaccgccga agctactcga ctgaagcgaa cggctcgccg gcgttataca 10200
cgacgcaaga atcgcatctg ctacctccag gagattttca gcaacgaaat ggctaaggtt 10260
gatgactcat tctttcatcg actcgaagaa agtttcttgg tcgaggagga taagaagcac 10320
gagcgccatc cgatctttgg taacattgtg gatgaggttg cctatcacga aaagtaccca 10380
actatctatc atcttcgtaa gaagctggtc gatagcacgg acaaggctga tttgcgactt 10440
atctacctgg cactcgcgca catgattaag ttccgcggcc attttcttat cgagggtgac 10500
ctgaaccccg ataattctga cgttgataag ctcttcatcc agttggtcca aacctacaat 10560
cagctgtttg aggaaaaccc tattaatgca tctggcgtgg acgccaaggc tatcctttcg 10620
gcgcgcctgt ctaagtcgcg gcgtttggag aaccttatcg cacaactccc cggcgaaaag 10680
aagaacggcc tcttcggtaa tttgattgcg ttgtcacttg gtctgactcc taacttcaag 10740
agtaattttg acctggcaga ggatgcgaag ctccagttgt ctaaggatac gtatgatgac 10800
gatctcgaca acttgcttgc ccaaatcggt gaccagtacg ctgatctttt cctggccgct 10860
aagaatctct cagatgcaat cctgctcagt gacattttgc gggtcaacac cgagattact 10920
aaggcccccc tgtcagctag tatgatcaag cggtatgatg agcaccatca ggacctcacc 10980
ttgcttaagg ccctcgtgcg tcagcaattg cctgagaagt acaaggaaat cttctttgac 11040
caatccaaga acggatacgc agggtatatt gatggcggtg cgagccagga ggaattctac 11100
aagtttatca agccgatttt ggagaagatg gacggcactg aggaactgct cgtcaagctg 11160
aatcgcgaag atttgcttcg taagcaacga acgttcgaca acggctccat cccgcaccag 11220
attcatctgg gcgagctcca cgccatcctt cgacgccagg aagatttcta cccatttctg 11280
aaggacaacc gtgagaagat cgaaaagatt cttacattcc gaatccccta ctatgtggga 11340
cctttggccc gtgggaattc ccgatttgct tggatgaccc gaaagagcga ggaaaccatc 11400
actccgtgga acttcgagga agtcgtggac aagggtgcat ccgcgcagag cttcattgag 11460
cggatgacca attttgataa gaaccttccg aatgaaaagg tcctgccaaa gcattcgctg 11520
ctctacgagt atttcaccgt gtataacgaa ctgactaagg tcaagtacgt gacggaggga 11580
atgcggaagc cagccttcct ctcaggggaa caaaagaagg ctatcgtcga tttgcttttt 11640
aagaccaatc gtaaagtgac tgttaagcag ctgaaggagg attatttcaa gaagattgaa 11700
tgtttcgact ccgtcgagat cagcggcgtg gaagatcgct ttaacgcttc cctcggtacc 11760
taccacgacc tgctcaagat cattaaggac aaggatttcc tcgataacga ggaaaatgag 11820
gacatcttgg aagatattgt cctcacgttg acactttttg aggaccgcga aatgatcgag 11880
gaacggctca agacatatgc ccatttgttc gacgataagg tgatgaagca gctgaagcgg 11940
cgtcgataca ccggatgggg tcgccttagc cggaagctga tcaacggcat tcgagataag 12000
caatctggta agactatctt ggatttcctt aagtcggacg gcttcgccaa ccgcaatttt 12060
atgcagctta ttcacgacga ttccctgacg ttcaaggagg acatccagaa ggcacaagtc 12120
tcaggacaag gggattccct gcacgagcat atcgccaacc tggctggatc cccggcgatc 12180
aagaagggga ttcttcagac cgtcaaggtt gtcgacgagc tggtcaaggt gatgggccgt 12240
cataagccag aaaacatcgt gattgagatg gcccgagaaa atcagaccac tcaaaagggt 12300
cagaagaaca gccgcgagcg gatgaagcgg atcgaggaag gcattaagga acttggttct 12360
cagatcctga aggagcaccc tgttgaaaac acacagctcc aaaatgagaa gctgtatctc 12420
tactatttgc aaaatggacg cgacatgtac gtcgatcagg agctcgacat taaccggttg 12480
tcggactacg atgttgacca tatcgtcccg caatccttcc ttaaggacga tagcattgat 12540
aacaaggtgc tgactcgctc agataagaac cggggcaagt ccgacaatgt tccaagcgag 12600
gaagtggtta agaagatgaa gaactactgg cgccaattgc ttaatgccaa gctcatcaca 12660
cagcgcaagt ttgacaactt gaccaaggcc gagcggggag ggctgagtga actcgataag 12720
gctggcttca tcaagcgtca actcgtggag acgcgacaga tcacaaagca cgttgctcag 12780
attctggact cccggatgaa cacaaagtac gacgagaatg ataagctcat ccgtgaagtt 12840
aaggtcatta ccctcaagtc taagttggtg tcggatttcc gcaaggactt ccaattttat 12900
aaggttcggg agatcaacaa ttatcaccat gcacatgatg cgtacctcaa cgcagtcgtg 12960
ggaactgcgc tcatcaagaa gtatcccaag ttggagtccg aattcgtcta cggggattat 13020
aaggtttacg acgtccgcaa gatgatcgcc aagagtgagc aggaaattgg caaggccacg 13080
gctaagtatt tcttttactc caacatcatg aatttcttta agacggagat cacactcgcc 13140
aatggagaaa tccgtaagcg acctttgatt gagaccaacg gcgagactgg tgaaatcgtt 13200
tgggataagg ggcgcgactt cgctaccgtg cggaaggttc tgagcatgcc gcaagtcaat 13260
atcgtcaaga aaaccgaggt gcagacaggc ggtttctcta aggaatcgat tcttccaaag 13320
cgtaactctg acaagctgat cgctcgaaag aaggattggg accccaagaa gtatggaggg 13380
ttcgattctc ctacagtggc atactcggtt ctcgttgtcg cgaaggttga gaagggaaag 13440
tctaagaagc tgaagtcggt caaggaactg ctcgggatca ccattatgga gcgctccagc 13500
ttcgaaaaga atcccatcga ctttctcgag gccaagggct ataaggaagt caagaaggat 13560
cttatcatta agctgcctaa gtactctttg ttcgagcttg aaaacggtcg aaagcgaatg 13620
ctcgcatcgg caggagagtt gcagaagggg aatgaattgg cacttccctc aaagtacgtg 13680
aacttcctgt atctcgcgtc ccactacgag aagctgaagg gtagccctga ggacaacgaa 13740
cagaagcaac tttttgttga gcaacacaag cattatctgg atgagatcat tgaacagatt 13800
tcagagttca gtaagcgcgt catcctcgcc gatgctaatc tcgacaaggt gttgtcggcc 13860
tacaacaagc accgtgacaa gccgatccga gagcaggctg aaaatatcat tcatctgttc 13920
accctcacta acttgggagc accagcagcg ttcaagtatt ttgatacgac aatcgaccgt 13980
aagcgataca cgtccacaaa ggaggtgctt gatgcgaccc tgattcatca atccatcact 14040
gggctctatg aaacccgtat cgaccttagt caactggggg gcgacccccc caagaagaag 14100
cgcaaggtct gagcggacat tcgatttatg ccgttatgac ttccttaaaa aagcctttac 14160
gaatgaaaga aatggaatta gacttgttat gtagttgatt ctacaatgga ttatgattcc 14220
tgaacttcaa atccgctgtt cattattaat ctcagctctt cccgtaaagc caatgttgaa 14280
actattcgta aatgtacctc gttttgcgtg tggcgtaatc atggtcatag ctgtttcctg 14340
tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 14400
aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 14460
ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 14520
gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 14580
tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 14640
aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 14700
gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 14760
aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 14820
ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 14880
tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 14940
tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 15000
ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 15060
tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 15120
ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca gtatttggta 15180
tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 15240
aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 15300
aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 15360
aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 15420
ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 15480
acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 15540
ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 15600
gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 15660
taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 15720
tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 15780
gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 15840
cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 15900
aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 15960
cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 16020
tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 16080
gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 16140
tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 16200
gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 16260
ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 16320
cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 16380
agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 16440
gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 16500
tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtc 16545
<210> 10
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ456
<400> 10
gcctgcgttt ctccgatcc 19
<210> 11
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ459
<400> 11
caacctgcag catccagac 19
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 原型间隔子PS4
<400> 12
ggatccaaaa gcagcgacgg 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 原型间隔子PS6
<400> 13
tggccaggtg tatccatcgc 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 原型间隔子PS9.1
<400> 14
ccccggaaga gcttcatatc 20
<210> 15
<211> 86
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ344
<400> 15
tgcccggcct ctccaccatc cagaacatct cgacgcgcca aagcttacgc catgacgctg 60
cgcaacacga cgctagagcg cgtctc 86
<210> 16
<211> 86
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ346
<400> 16
ctcgcagccc ggctcgccaa ccgcctcaac cacgccgccg aagctttgca acctcgttcc 60
accaccatcc cagaggccgt ctggtg 86
<210> 17
<211> 86
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ348
<400> 17
gggtatcgag gacgagttcc tgagcacggc gtccgagccg aagcttcggc ttcaacgcaa 60
atgtgcggct ctggcagtcc gcggct 86
<210> 18
<211> 85
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ499
<400> 18
ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcagcgtg gttgaggcgg 60
ttggcgagcc gggctgcgag gccga 85
<210> 19
<211> 90
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ500
<400> 19
ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcggcgta gttgaggcgg 60
ttggcgagcc gggctgcgag gccgaggcag 90
<210> 20
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ501
<400> 20
ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcga 60
ttggcgagcc gggctgcgag gccgaggcag actcgggcga 100
<210> 21
<211> 110
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ502
<400> 21
ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg 60
ttggcgagca gggctgcgag gccgaggcag actcgggcga ggtggtgagg 110
<210> 22
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ503
<400> 22
ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg 60
ttggcgagcc gggctgcgaa gccgaggcag actcgggcga ggtggtgagg gcgtggacag 120
<210> 23
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ504
<400> 23
ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgacgcgg 60
ttggcgaacc gggctgcgaa gccgaggcag actcgggcga ggtggtgagg gcgtggacag 120
<210> 24
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ505
<400> 24
ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcgtcgta gtttaggagg 60
tcggcaagct gggatgtgaa gccgaggcag actcgggcga ggtggtgagg gcgtggacag 120
<210> 25
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ474
<400> 25
cagtaaggac atatgaagag cagg 24
<210> 26
<211> 100
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ567
<400> 26
cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg ttggcgagcc 60
gggctgcgaa gccgaggcag actcgggcga ggtggtgagg 100
<210> 27
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ568
<400> 27
gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg ttggcgagcc gggctgcgaa 60
gccgaggcag actcgggcga 80
<210> 28
<211> 130
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ569
<400> 28
ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg 60
ttggcgagcc gggctgcgag gccgaggcac actcgggcga ggtggtgagg gcgtggacag 120
cgccagcgcc 130
<210> 29
<211> 140
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ570
<400> 29
ggtggtggaa cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg 60
ttggcgagcc gggctgcgag gccgaggcag actcgggcgt ggtggtgagg gcgtggacag 120
cgccagcgcc agcgccagca 140
<210> 30
<211> 110
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ571
<400> 30
cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg ttggcgagcc 60
gggctgcgag gccgaggcac actcgggcga ggtggtgagg gcgtggacag 110
<210> 31
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ572
<400> 31
cgaggttgca gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg ttggcgagcc 60
gggctgcgag gccgaggcag actcgggcgt ggtggtgagg gcgtggacag cgccagcgcc 120
<210> 32
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 引物oNJ573
<400> 32
cagcggtcgc aggctctgct caccagacgg cctctgggat tgtggtggaa cgaggttgca 60
gccgacacga gtgagttctg cgtcggcgtg gttgaggcgg ttggcgagcc gggctgcgag 120
<210> 33
<211> 16195
<212> DNA
<213> 人工序列
<220>
<223> 质粒pAT3630
<400> 33
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 60
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 120
gcgctgcgat gataccgcga gaaccacgct caccggctcc ggatttatca gcaataaacc 180
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 240
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 300
ttgttgccat cgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 360
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 420
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 480
tggttatggc agcgctacat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 540
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 600
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 660
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 720
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 780
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 840
ggaaatgttg aatactcata ttcttccttt ttcaatatta ttgaagcatt tatcagggtt 900
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggtca 960
gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata cctgaatatg 1020
gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc tgaccccatg 1080
ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc ccatgcgaga 1140
gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg 1200
cccgggctaa ttatggggtg tcgcccttat tcgactctat agtgaagttc ctattctcta 1260
gaaagtatag gaacttctga agtggggatt taaatgcggc cgcgctgagg gtttaatcga 1320
cgaagcagct gacggccagt gccaagctta acgcgtaccc gggcccagta tatgttccgc 1380
agatgactgg agctctgcca tacgtgccct ctcaagcacc atttgttcca tctacagaga 1440
ctagtcacca actagtctat caagactcac agggtacatt gctgagacca actgaccaga 1500
ggcagggtag cggattgacg gctccatctc cttcacttac aaggtctatt gaaagccctt 1560
tagcatcacc aagcggagaa tagattgtta agcttatttt ttgtatactg ttttgtgata 1620
gcacgaagtt tttccacggt atcttgtaaa aatatatatt tgtggcgggc ttacctacat 1680
caaattaata agagactaat tataaactaa acacacaagc aagctacttt agggtaaaag 1740
tttataaatg cttttgacgt ataaacgttg cttgtattta ttattacaat taaaggtgga 1800
tagaaaacct agagactagt tagaaactaa tctcaggttt gcgttaaact aaatcagagc 1860
ccgagaggtt aacagaacct agaaggggac tagatatccg ggtagggaaa caaaaaaaaa 1920
aaacaagaca gccacatatt agggagacta gttagaagct agttccagga ctaggaaaat 1980
aaaagacaat gataccacag tctagttgac aactagatag attctagatt gaggccaaag 2040
tctctgagat ccaggttagt tgcaactaat actagttagt atctagtctc ctataactct 2100
gaagctagaa taacttacta ctattatcct caccactgtt cagctgcgca aacggagtga 2160
ttgcaaggtg ttcagagact agttattgac tagtcagtga ctagcaataa ctaacaaggt 2220
attaacctac catgtctgcc atcaccctgc acttcctcgg gctcagcagc cttttcctcc 2280
tcattttcat gctcattttc cttgtttaag actgtgacta gtcaaagact agtccagaac 2340
cacaaaggag aaatgtctta ccactttctt cattgcttgt ctcttttgca ttatccatgt 2400
ctgcaactag ttagagtcta gttagtgact agtccgacga ggacttgctt gtctccggat 2460
tgttggagga actctccagg gcctcaagat ccacaacaga gccttctaga agactggtca 2520
ataactagtt ggtctttgtc tgagtctgac ttacgaggtt gcatactcgc tccctttgcc 2580
tcgtcaatcg atgagaaaaa gcgccaaaac tcgcaatatg gctttgaacc acacggtgct 2640
gagactagtt agaatctagt cccaaactag cttggatagc ttacctttgc cctttgcgtt 2700
gcgacaggtc ttgcagggta tggttccttt ctcaccagct gatttagctg ccttgctacc 2760
ctcacggcgg atctgccata aagagtggct agaggttata aattagcact gatcctaggt 2820
acggggctga atgtaacttg cctttccttt ctcatcgcgc ggcaagacag gcttgctcaa 2880
attcctacca gtcacagggg tatgcacggc gtacggacca cttgaactag tcacagatta 2940
gttagcaact agtctgcatt gaatggctgt acttacgggc cctcgccatt gtcctgatca 3000
tttccagctt caccctcgtt gctgcaaagt agttagtgac tagtcaagga ctagttgaaa 3060
tgggagaaga aactcacgaa ttctcgactc ccttagtatt gtggtccttg gacttggtgc 3120
tgctatatat tagctaatac actagttaga ctcacagaaa cttacgcagc tcgcttgcgc 3180
ttcttggtag gagtcggggt tgggagaaca gtgccttcaa acaagccttc ataccatgct 3240
acttgactag tcagggacta gtcaccaagt aatctagata ggacttgcct ttggcctcca 3300
tcagttcctt catagtggga ggaccattgt gcaatgtaaa ctccatgccg tgggagttct 3360
tgtccttcaa gtgcttgacc aatatgtttc tgttggcaga gggaacctgt caactagtta 3420
ataactagtc agaaactatg atagcagtag actcactgta cgcttgaggc atcccttcac 3480
tcggcagtag acttcatatg gatggatatc aggcacgcca ttgtcgtcct gtggactagt 3540
cagtaactag gcttaaagct agtcgggtcg gcttactatc ttgaaatccg gcagcgtaag 3600
ctccccgtcc ttaactgcct cgagatagtg acagtactct ggggactttc ggagatcgtt 3660
atcgttatcg cgaatgctcg gcatactaac tgttgactag tcttggacta gtcccgagca 3720
aaaaggattg gaggaggagg aggaaggtga gagtgagaca aagagcgaaa taagagcttc 3780
aaaggctatc tctaagcagt atgaaggtta agtatctagt tcttgactag atttaaagag 3840
atttcgacta gttatgtacc tggagtttgg atataggaat gtgttgtggt aacgaaatgt 3900
aagggggagg aaagaaaaag tcgtcaagag gtaactctaa gtcggccatt cctttttggg 3960
aggcgctaac cataaacggc atggtcgact tagagttagc tcagggaatt tagggagtta 4020
tctgcgacca ccgaggaacg gcggaatgcc aaagaatccc gatggagctc tagctggcgg 4080
ttgacaaccc caccttttgg cgtttctgcg gcgttgcagg cgggactgga tacttcgtag 4140
aaccagaaag gcaaggcaga acgcgctcag caagagtgtt ggaagtgata gcatgatgtg 4200
ccttgttaac taggtaccaa tctgcagtat gcttgatgtt atccaaagtg tgagagagga 4260
aggtccaaac atacacgatt gggagagggc ctaggtataa gagtttttga gtagaacgca 4320
tgtgagccca gccatctcga ggagattaaa cacgggccgg catttgatgg ctatgttagt 4380
accccaatgg aaacggtgag agtccagtgg tcgcagataa ctccctaaat tccctgagct 4440
aactctaagt cgaccatgcc gtttatggtt agcgcctccc aaaaaggaat ggccgactta 4500
gagttacctc ttgacgactt tttctttcct cccccttaca tttcgttacc acaacacatt 4560
cctatatcca aactccaggt acataactag tcgaaatctc tttaaatcta gtcaagaact 4620
agatacttaa ccttcatact gcttagagat agcctttgaa gctcttattt cgctctttgt 4680
ctcactctca ccttcctcct cctcctccaa tcctttttgc tcgggactag tccaagacta 4740
gtcaacagtt agtatgccga gcattcgcga taacgataac gatctccgaa agtccccaga 4800
gtactgtcac tatctcgagg cagttaagga cggggagctt acgctgccgg atttcaagat 4860
agtaagccga cccgactagc tttaagccta gttactgact agtccacagg acgacaatgg 4920
cgtgcctgat atccatccat atgaagtcta ctgccgagtg aagggatgcc tcaagcgtac 4980
agtgagtcta ctgctatcat agtttctgac tagttattaa ctagttgaca ggttccctct 5040
gccaacagaa acatattggt caagcacttg aaggacaaga actcccacgg catggagttt 5100
acattgcaca atggtcctcc cactatgaag gaactgatgg aggccaaagg caagtcctat 5160
ctagattact tggtgactag tccctgacta gtcaagtagc atggtatgaa ggcttgtttg 5220
aaggcactgt tctcccaacc ccgactccta ccaagaagcg caagcgagct gcgtaagttt 5280
ctgtgagtct aactagtgta ttagctaata tatagcagca ccaagtccaa ggaccacaat 5340
actaagggag tcgagaattc gtgagtttct tctcccattt caactagtcc ttgactagtc 5400
actaactact ttgcagcaac gagggtgaag ctggaaatga tcaggacaat ggcgagggcc 5460
cgtaagtaca gccattcaat gcagactagt tgctaactaa tctgtgacta gttcaagtgg 5520
tccgtacgcc gtgcataccc ctgtgactgg taggaatttg agcaagcctg tcttgccgcg 5580
cgatgagaaa ggaaaggcaa gttacattca gccccgtacc taggatcagt gctaatttat 5640
aacctctagc cactctttat ggcagatccg ccgtgagggt agcaaggcag ctaaatcagc 5700
tggtgagaaa ggaaccatac cctgcaagac ctgtcgcaac gcaaagggca aaggtaagct 5760
atccaagcta gtttgggact agattctaac tagtctcagc accgtgtggt tcaaagccat 5820
attgcgagtt ttggcgcttt ttctcatcga ttgacgaggc aaagggagcg agtatgcaac 5880
ctcgtaagtc agactcagac aaagaccaac tagttattga ccagtcttct agaaggctct 5940
gttgtggatc ttgaggccct ggagagttcc tccaacaatc cggagacaag caagtcctcg 6000
tcggactagt cactaactag actctaacta gttgcagaca tggataatgc aaaagagaca 6060
agcaatgaag aaagtggtaa gacatttctc ctttgtggtt ctggactagt ctttgactag 6120
tcacagtctt aaacaaggaa aatgagcatg aaaatgagga ggaaaaggct gctgagcccg 6180
aggaagtgca gggtgatggc agacatggta ggttaatacc ttgttagtta ttgctagtca 6240
ctgactagtc aataactagt ctctgaacac cttgcaatca ctccgtttgc gcagctgaac 6300
agtggtgagg ataatagtag taagttattc tagcttcaga gttataggag actagatact 6360
aactagtatt agttgcaact aacctggatc tcagagactt tggcctcaat ctagaatcta 6420
tctagttgtc aactagactg tggtatcatt gtcttttatt ttcctagtcc tggaactagc 6480
ttctaactag tctccctaat atgtggctgt cttgtttttt ttttttgttt ccctacccgg 6540
atatctagtc cccttctagg ttctgttaac ctctcgggct ctgatttagt ttaacgcaaa 6600
cctgagatta gtttctaact agtctctagg ttttctatcc acctttaatt gtaataataa 6660
atacaagcaa cgtttatacg tcaaaagcat ttataaactt ttaccctaaa gtagcttgct 6720
tgtgtgttta gtttataatt agtctcttat taatttgatg taggtaagcc cgccacaaat 6780
atatattttt acaagatacc gtggaaaaac ttcgtgctat cacaaaacag tatacaaaaa 6840
ataagcttaa caatctattc tccgcttggt gatgctaaag ggctttcaat agaccttgta 6900
agtgaaggag atggagccgt caatccgcta ccctgcctct ggtcagttgg tctcagcaat 6960
gtaccctgtg agtcttgata gactagttgg tgactagtct ctgtagatgg aacaaatggt 7020
gcttgagagg gcacgtatgg cagagctcca gtcatctgcg gaacatatac tgggcccggg 7080
aagatctcat ggtcatagct gtttccgtta attaatggtt cacttctctt tagaaatcaa 7140
ctgtgggttt tgctttttgc ttcattctct ttgtcttctc catctttgat caaatcctgg 7200
actttctcaa tccccagcta attcaatcat agtcagtttt ctatttttat tatttctttt 7260
tcttttgaaa tgtgattaac aaccagtccg ttatatatct tgtacccaga ttacgcccaa 7320
ctcgtgctcc tcagccacaa agatactcaa ttgatagcca agatacatac ataccacaaa 7380
gtaaggactc catgcattga gtattactca tcgtattcta gactactcca aaactcagca 7440
catagacaaa caatacgaac ctcgtctagg ggtgattcag aggcggcaaa gcggggtttt 7500
cgcatttgat gttcctggca cttatgtaag cccacgcttc ccgctcaact aaaccatcag 7560
ccaatcagac tgctcagatt tatcttttga agggtaaata aatcattgta aagaagaaca 7620
agtggcttgc ttgtcaagca atggcatcat tggtctagtg gtagaattcg tcgttgccat 7680
cgacgaggcc cgtgttcgat tcacggatga tgcaggaatt tctactcttg tagatggcgc 7740
gccttttttt ttgagcattt atcagcttga tatagaggta ggaatgtatg gaggtgcaga 7800
atggctattt tgttattgga gcgggttcga aacggagggc aggagacttt ttctaaatac 7860
gtcacgtgat atagagctgc tttaattaac gagacagcag aatcaccgcc caagttaagc 7920
ctttgtgctg atcatgctct cgaacgggcc aagttcggga aaagcaaagg agcgtttagt 7980
gaggggcaat ttgactcacc tcccaggcaa cagatgaggg gggcaaaaag aaagaaattt 8040
tcgtgagtca atatggattc cgagcatcat tttcttgcgg tctatcttgc tacgtatgtt 8100
gatcttgacg ctgtggatca agcaacgcca ctcgctcgct ccatcgcagg ctggtcgcag 8160
acaaattaaa aggcggcaaa ctcgtacagc cgcggggttg tccgctgcaa agtacagagt 8220
gataaaagcc gccatgcgac catcaacgcg ttgatgccca gctttttcga tccgagaatc 8280
caccgtagag gcgatagcaa gtaaagaaaa gctaaacaaa aaaaaatttc tgcccctaag 8340
ccatgaaaac gagatggggt ggagcagaac caaggaaaga gtcgcgctgg gctgccgttc 8400
cggaaggtgt tgtaaaggct cgacgcccaa ggtgggagtc taggagaaga atttgcatcg 8460
ggagtggggc gggttacccc tccatatcca atgacagata tctaccagcc aagggtttga 8520
gcccgcccgc ttagtcatcg tcctcgcttg cccctccata aaaggatttc ccctccccct 8580
cccacaaaat tttctttccc ttcctctcct tgtccgcttc agtacgtata tcttcccttc 8640
cctcgcttct ctcctccatc cttctttcat ccatctcctg ctaacttctc tgctcagcac 8700
ctctacgcat tactagccgt agtatctgag cacttctccc ttttatattc cacaaaacat 8760
aacacaacct tcaccatgaa caacggcaca aacaacttcc agaacttcat tggaatctcg 8820
tcgttgcaga agactttgcg caacgccctc atccccacag aaactaccca gcagttcatt 8880
gtgaagaacg gaatcatcaa ggaagatgaa ctccgaggcg agaaccgcca gattttgaag 8940
gacatcatgg atgattacta ccgtggtttc atctcggaaa cgctctcctc cattgacgac 9000
atcgattgga cttcgttgtt cgaaaagatg gaaatccagc tcaaaaacgg cgataacaag 9060
gataccttga tcaaggagca gaccgagtat cggaaggcga tccataagaa gttcgccaac 9120
gatgatcggt tcaagaacat gttctcggcc aagttgattt ccgacattct ccccgaattc 9180
gtgatccata acaacaacta ctcggcgtcg gagaaggagg agaagacgca ggtcatcaag 9240
ttgttctcga ggttcgccac atcgttcaaa gactatttta agaatcgtgc gaactgtttc 9300
tcggcagatg atatctcctc gtcctcctgt caccgcattg tgaacgacaa cgcggaaatc 9360
ttcttctcga acgcgttggt gtataggcgc atcgtgaagt ccctctccaa cgatgacatc 9420
aacaaaatct cgggagatat gaaggattcg ctcaaggaga tgtcgttgga ggaaatctac 9480
tcctatgaga agtatggcga gttcattacg caggagggca tttccttcta caacgacatt 9540
tgtggtaaag tcaactcgtt catgaacctc tactgtcaga aaaacaagga gaacaaaaac 9600
ctctataagc tccagaagtt gcataagcag atcctctgta tcgcagacac ctcgtacgag 9660
gtcccttaca agttcgaatc cgatgaggag gtctaccagt ccgtcaacgg attcttggac 9720
aacatctcct cgaaacacat tgtcgagcgg ctccgaaaga tcggcgataa ctacaacggc 9780
tacaacttgg acaaaatcta tatcgtctcc aagttctatg agtccgtctc gcagaaaacc 9840
tatcgtgatt gggagactat caacactgcg ctcgagattc actataacaa catcttgcct 9900
ggtaacggca aatcgaaagc cgacaaggtg aagaaggccg tgaaaaacga tctccagaag 9960
tcgatcacag aaatcaacga actcgtctcg aactacaagc tctgttcgga tgataacatc 10020
aaggcggaaa cgtacatcca tgaaatctcg catatcttga acaacttcga ggcccaggaa 10080
ctcaaataca accccgagat ccacttggtc gagtcggagc tcaaagcctc ggagttgaag 10140
aacgtcttgg atgtcatcat gaacgcattc cactggtgtt ccgtgttcat gaccgaggaa 10200
ctcgtcgata aagacaacaa cttctacgcg gaactcgagg aaatctacga tgaaatctat 10260
cccgtgatct ccctctacaa cctcgtgcga aactacgtca ctcagaagcc ctattccacc 10320
aagaagatca agctcaactt cggcatcccc actctcgcag acggttggtc gaagtcgaag 10380
gagtactcca acaacgccat tatcctcatg cgagacaacc tctactactt gggtatcttc 10440
aacgcaaaga acaagccgga taagaagatc attgaaggca acacttcgga aaacaaggga 10500
gactataaga agatgatcta caacctcctc cctggaccca acaagatgat tcctaaagtg 10560
ttcctctcgt cgaagactgg tgtggaaacg tataagccgt cggcctacat cttggagggc 10620
tacaaacaga acaagcatat caagtcctcg aaggacttcg acatcacttt ctgtcacgac 10680
ctcatcgact atttcaagaa ctgtattgca atccatccgg aatggaagaa cttcggcttc 10740
gatttctcgg atacttcgac atacgaagat atctcgggat tctaccgaga ggtcgaattg 10800
cagggctata agattgattg gacctacatc tcggaaaagg atatcgactt gctccaggaa 10860
aagggccagc tctacctctt ccagatttac aacaaggact tctccaagaa gtcgacgggt 10920
aacgacaact tgcacacaat gtatctcaaa aacctcttct cggaggagaa cttgaaggat 10980
atcgtgctca aattgaacgg agaggccgaa atcttcttcc gtaagtcctc catcaagaac 11040
ccgatcatcc ataagaaggg atcgatcttg gtcaaccgga cttacgaagc agaggaaaaa 11100
gatcagttcg gaaacatcca gattgtcagg aagaacatcc ctgaaaacat ctatcaggag 11160
ttgtataagt acttcaacga caagtcggat aaggagctct ccgacgaagc agccaaactc 11220
aagaacgtcg tcggacacca tgaagcagca accaacattg tgaaggacta ccggtacact 11280
tacgacaagt acttcttgca catgccgatc actatcaact tcaaagccaa caagaccgga 11340
ttcattaacg acaggatcct ccagtacatt gccaaagaaa aggacctcca tgtcatcggt 11400
atcgataggg gagaacggaa cctcatctac gtctccgtga ttgacacttg tggcaacatt 11460
gtcgaacaga agtcgttcaa catcgtcaac ggttacgatt accagattaa gttgaaacag 11520
caggaaggtg cgaggcagat tgcgcgaaag gaatggaagg agattggcaa aatcaaggag 11580
attaaggaag gctacttgtc gttggtcatc cacgaaatct cgaaaatggt gatcaaatac 11640
aacgccatca tcgccatgga agacctctcg tacggcttca aaaagggacg gttcaaagtg 11700
gagcgtcagg tgtaccagaa gttcgaaaca atgttgatca acaagttgaa ctacttggtg 11760
ttcaaggaca tttccattac cgagaacgga ggattgctca agggttatca gctcacgtac 11820
atccccgaca agttgaaaaa cgtgggacac cagtgtggct gtatcttcta cgtgcctgca 11880
gcctacacgt cgaaaatcga ccctacaaca ggattcgtga acatcttcaa gttcaaggat 11940
ctcaccgtcg acgcgaagcg ggagttcatc aaaaagttcg actccatccg ctatgattcg 12000
gagaagaact tgttctgttt cacattcgac tacaacaact tcattactca gaacaccgtg 12060
atgtccaaat cgtcgtggtc cgtgtacacg tatggtgtgc gcatcaaaag gcgcttcgtc 12120
aacggtcgct tctccaacga atcggacacg atcgatatca cgaaagacat ggagaaaaca 12180
ttggaaatga ccgacatcaa ctggcgtgac ggccatgacc tcaggcagga catcatcgat 12240
tacgagatcg tccagcacat cttcgaaatc ttccgtctca ccgtgcagat gaggaactcc 12300
ctctccgagc tcgaagatcg ggattacgac cggctcattt cccctgtgtt gaacgagaac 12360
aacatcttct acgactcggc aaaagcggga gatgcattgc cgaaggacgc cgatgcgaac 12420
ggtgcatatt gtattgcact caagggtctc tacgaaatca agcagatcac cgaaaactgg 12480
aaggaggacg gcaaattctc gagggacaag ttgaagattt cgaacaagga ttggttcgat 12540
ttcatccaga acaagaggta cttgcctccg aagaagaagc gaaaggtgtg agcggacatt 12600
cgatttatgc cgttatgact tccttaaaaa agcctttacg aatgaaagaa atggaattag 12660
acttgttatg tagttgattc tacaatggat tatgattcct gaacttcaaa tccgctgttc 12720
attattaatc tcagctcttc ccgtaaagcc aatgttgaaa ctattcgtaa atgtacctcg 12780
ttttgcgtgt accttgctta tcacgtgata ttacatgacc tggacagagt tctgcgcgaa 12840
agtcataacg taaatcccgg gcggtaggtg cgtcccgggc ggaaggtagt tttctcgtcc 12900
accccaacgc gtttatcaac ctcaactttc aacaaccatc atgccaccaa aagcgcgtaa 12960
aacaaagcga gatttgattg agcaagaggg caggatccaa tgcgcgattc aagacattaa 13020
aaatggaaaa tttcaaaaaa ttgcgcccgc agcgcgtgca tacaaaattc atcccaatac 13080
tcctcgtgta ctgtgtaagc gcccactagg taatatgaca tgattacgaa ttcgagctcg 13140
gtacccggcc ggggatcctc tagacgtgga gttaccagtg attgaccaat gttttatctt 13200
ctacagttct gcctgtctac cccattctag ctgtacctga ctacagagta gtttaattgt 13260
ggttgacccc acagtcggag gcggaggaat acagcaccga tgtggcctgt ctccatccag 13320
attggcacgc aatttttaca cgcggaaaag atcgagatag agtacgactt taaatttagt 13380
ccccggcggc ttctatttta gaatatttga gatttgattc tcaagcaatt gatttggttg 13440
ggtcaccctc aattggataa tatacctcat tgctcggcta cttcaactca tcaatcaccg 13500
tcataccccg catataaccc tccattccca cgatgtcgtc caagtcgcaa ttgacttacg 13560
gtgctcgagc cagcaagcac cccaatcctc tggcaaagag actttttgag attgccgaag 13620
caaagaagac aaacgttacc gtctctgctg atgtgacgac aacccgagaa ctcctggacc 13680
tcgctgaccg tacggaagct gttggatcca atacatatgc cgtctagcaa tggactaatc 13740
aacttttgat gatacaggtc tcggtcccta catcgccgtc atcaagacac acatcgacat 13800
cctcaccgat ttcagcgtcg acactatcaa tggcctgaat gtgctggctc aaaagtacaa 13860
ctttttgatc ttcgaggacc gcaaattcat cgacatcggc aataccgtcc agaagcaata 13920
ccacggcggt gctctgagga tctccgaatg ggcccacatt atcaactgca gcgttctccc 13980
tggcgagggc atcgtcgagg ctctggccca gaccgcatct gcgcaagact tcccctatgg 14040
tcctgagaga ggactgttgg tcctggcaga gatgaccccc aaaggatcgc tggctacggg 14100
cgagtatacc aaggcatcgg ttgactacgc tcgcaaatac aagaacttcg ttatgggttt 14160
cgtgtcgacg cgggccctga cggaagtgca gtcggatgtg tcttcagcct cggaggatga 14220
agatttcgtg gtcttcacga cgggtgtgaa cctctcttcc aaaggagata agcttggaca 14280
gcaataccag actcctgcat cggctattgg acgcggtgcc gactttatca tcgccggtcg 14340
aggcatctac gctgctcccg acccggttga agctgcacag cggtaccaga aagaaggctg 14400
ggaagcttat atggccagag tatgcggcaa gtcatgattt cctcttggag caaaagtgta 14460
gtgccagtac gagtgttgtg gaggaaggct gcatacattg tgcctgtcat taaacgatga 14520
gctcgtccgt attggcccct gtaatgccat gttttccgcc cccaatcgtc aaggttttcc 14580
ctttgttaga ttcctaccag tcatctagca aggcggccgc agctagcaca attgaggcat 14640
ccccactacc gcattaagac ctcagcgcgg ccgcaaattt aaataaaatg aagtgaagtt 14700
cctatacttt ctagagaata ggaacttcta tagtgagtcg aataagggcg acacaaaatt 14760
tattctaaat gcataataaa tactgataac atcttatagt ttgtattata ttttgtatta 14820
tcgttgacat gtataatttt gatatcaaaa actgattttc cctttattat tttcgagatt 14880
tattttctta attctcttta acaaactaga aatattgtat atacaaaaaa tcataaataa 14940
tagatgaata gtttaattat aggtgttcat caatcgaaaa agcaacgtat cttatttaaa 15000
gtgcgttgct tttttctcat ttataaggtt aaataattct catatatcaa gcaaagtgac 15060
aggcgccctt aaatattctg acaaatgctc tttccctaaa ctccccccat aaaaaaaccc 15120
gccgaagcgg gtttttacgt tatttgcgga ttaacgatta ctcgttatca gaaccgccca 15180
gggggcccga gcttaagact ggccgtcgtt ttacaacaca gaaagagttt gtagaaacgc 15240
aaaaaggcca tccgtcaggg gccttctgct tagtttgatg cctggcagtt ccctactctc 15300
gccttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 15360
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 15420
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 15480
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 15540
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 15600
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 15660
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 15720
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 15780
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 15840
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 15900
ggctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 15960
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 16020
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 16080
tttgatcttt tctacggggt ctgacgctca gtggaacgac gcgcgcgtaa ctcacgttaa 16140
gggattttgg tcatgagctt gcgccgtccc gtcaagtcag cgtaatgctc tgctt 16195
<210> 34
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 二十一个碱基对的原型间隔子
<400> 34
acgatggtgc tgatggctac t 21
<210> 35
<211> 6783
<212> DNA
<213> 曲霉属
<220>
<221> 尚未归类的特征
<222> (1)..(6783)
<223> wA基因座
<400> 35
atagtctcca ctgtcgcatg tggtagtaac tctatcttgg tataaatcat acttaatatc 60
tagccaatcg ctttgggaaa acaatttgat cagcatctct gcgactcttg actggcactt 120
tcttgaccca acatggaggg gccacgcggc gtctatctct tcggagacca gacaagtgat 180
ttcgacgccg gcttacgtcg cctcctacaa gtaaagaata acacaattgt tgcatcgttc 240
ttccagagat gctttcacgc tttgcgccaa gagatcgcga ggctttcacc atctgaacgg 300
aagatcttcc cccggtttac gagcatagtg gatctactgg cgcgtcaccg ggagtcagac 360
cctaatccgg ctctggagag tgcgttgacc tgtatctatc aattgggatg ctttataaag 420
tacgtgtaac tgcagatcct gacccgtttg aacgagccta acctgagata gctactacgg 480
agaccttgga aacgtgtacc catctgcttc agactgccat atagttggcc tgtgcgcggg 540
tcttcttagt tctgcagctg taagctgttc gaacaatgtt ggagaattgc tccccgctgc 600
ggttgaagcg gtggtggtag ctctccgact tggtctatgc gtccttaaag ttcgagagct 660
ggtgagctct gaccaagcgt cgtcaacaag ctggtcagtc ttgatttcag ggattagcga 720
gaaagatgcc tcgcagctta taggagaatt cactgctgaa cgggtaagtc aattgatctg 780
aaatagtttg caggacagaa tgttctaacc actggataaa ggcaattcct ccttcatcca 840
aaccgtatat cagtgcggtg ggatataaca gtataaccat cagcgcaccg cctaaggtcc 900
ttgatgattt aattgattct aggctgtcta agagccataa gccggtgagg gcgcaaatcc 960
atggtcctta ccatgcagca catctgtact atggccgaga tgtcgacagg atcatcgaaa 1020
gctgccataa tgaggtcgtt tcaaactaca caccccgtat ccccgtacta tcaagtacta 1080
cgggacagcc gatagaggcc aaacacatga aagatctact taaggccgcc cttgaagaga 1140
ttctactacg tcaactatgc tgggagaaag tgaccgatgc ctgctattcc atattaaaaa 1200
ctgctcgtca tcaaccatgc aagttgttcc caatttcaag cactgcgaca caaagcttgt 1260
ttacagctct tacgaaagcc gggataaccg acatcgaagt ggaaaatggg ctcggagatg 1320
ttcccacgaa cccgaaggac aaccttaaca tcagcggcag ggcggactgc tccaagatag 1380
ctatcattgg catgtctgga cgattcccag aagctgatgg cacagagagt ttctgggacc 1440
ttctgtataa tggcctcgat gtacaccgga aggtgcctgc agagcgttgg gatgttgatg 1500
cccacgttga tcctaccgga acaaaacgga acaccagcaa ggttccatac ggatgctgga 1560
taaacgaacc ggggttattt gacccccgct tcttcaatat gtcgccacgc gaagccctcc 1620
aggcagatcc cgctcaaaga cttgcattgc tcacggccta tgaagctctt gaaatggccg 1680
gctttatccc cgacagcacc ccttctacac agagggatcg agtcggcctc ttctatggaa 1740
tgactagcga tgactatcgg gagataaata gtggtcaaga tattgatact tactttatcc 1800
ctggtgggaa tcgtgctttc acacctggcc ggataaacta ctatttcaag ttcagtgggc 1860
ccagcgtcag cgttgataca gcttgttctt caagtcttgc ggctattcat atggcttgca 1920
attcgatctg gagaaatgat tgcgatgctg ctattgctgg aggtgtcaat atattgacaa 1980
accctgataa ccatgccggt cttgaccgtg gccatttcct gtccagaacc gggaattgca 2040
acacatttga cgatggtgct gatggctact gtagagcaga tggagtgggt acaatcattc 2100
tcaagcggct ggaagacgct caggcggaca acgatccaat cctcggtgtg atcaatggag 2160
cctataccaa tcattcggca gaagcagtct cgattacccg ccctcatgtt ggcgcacaag 2220
cgtttatctt taataagcta ttgaacgatg ccaatatcga ccctaaggac gtcagctacg 2280
ttgaaatgca tggaactggt actcaagctg gggatgcggt ggaaatgcaa tcggtcttgg 2340
atacgtttgc tcccgactac cgccgtggac caggacagtc tctccatctt ggttccgcca 2400
aagcaaatgt tgggcatgga gagtcagcat ctggtgtaac tgcacttgtg aaagtgctgc 2460
taatgatgaa gaagaatacc ataccccctc attgtggtat aaagactaag atcaaccaca 2520
acttccccac ggatctcgcg caacgaaatg tccacattgc ctttcaacct accccttgga 2580
acagaccggc ttccggaaag cggcagtgct tcattaacaa cttttcggcg gctggtggaa 2640
ataccgctct tttgatggaa gacgctccaa tcgctgaggt taaggggcag gacactcgac 2700
ctgttcacgt tgtgtctgta tcggcacgat cccagagtgc gctcaaaaac aacatcaact 2760
ctctcgtaaa atacatcgac gaacaaggaa ggtcattcaa tgtgaacgag gcagacttta 2820
tcccaagctt ggcatacacc accacagcac ggcgtatcca tcacccattc cgtgtcacag 2880
ctatcgggtc tagtttgcag gagctgcgtg actcacttaa caacagctct cgtctggaaa 2940
gctttacccc tgtccctgcg acggcccctg gcgtagggtt cgtgttcgct ggccaaggag 3000
ctcagcacac cggaatggga aggcaactat acgaaaaatg ctctcaattc cgggcaacaa 3060
tgcagcactt cgattgcatt agtcaaaacc aagggtttcc ttcgatcctt cccttggttg 3120
acggaagcgt gcccgtggag gagctgggcc ctatcgtgac acagctcggc accacatgtc 3180
ttcagatggc tttggtcaac tattggggtt cactaggtat aaaacctgcg ttcgttcttg 3240
ggcatagtct cggggagttt gctgctttga ataccgcagg agtattatcg acttccgata 3300
ccatctacct ttgtggccgt cgggctaccc tccttacaga atactgccag gttgggacac 3360
acgccatgct ggctgtcaag gcttcctacc cccaggtcaa gcagttactg aaagaaggtg 3420
tggatgaagt tgcctgtgtc aactcaccca gtgagacagt cgtcagtggc ctcaccgctg 3480
atattgatga cttggctcaa aggtgttcca ctgaaggttg gaagtccact aaactaaggg 3540
taccgttcgc tttccattct gcccaagtta ctccaattct tgaacggttt caagaagagg 3600
cccagggtgt cacgttccgt aagccgtcgt taccgtttgt ttcctcactc cttggggaag 3660
tcatcaccga atctaattac gatgtcctgg gagctcaata tatggtgaag cagtgccgga 3720
agtcggtgaa cttccttggt gctcttgagg ccaccagata tgcgaaattg atgactgata 3780
agactgtctg gctggaagtt ggtgcccata ccatttgctc tggtatgatc aaagcaacat 3840
tcggtcccca ggttaccact gtggcatctc ttcgccgaga ggagaatgca tggaaggtcc 3900
tctccaatag tctatcggcc cttcatttgg ctggcattga tattaattgg aaagaatatc 3960
atcaagactt cagctccagc caccaggtgc tcccacttcc ttcttacaag tgggatctca 4020
agaactactg gataccctac actaacaatt tctgccttac gaagggtgct ccccaaactg 4080
caattcaagc tgcaccacaa actacattcc tgaccactgc tgcgcaaaag gttgttgaga 4140
gtcgcgacga cggtacaaca gcgactgtcg tggtgcaaaa tgacatcgct gatcctgagt 4200
tgaaccgtgt tatccaaggt cacaaggtca atggagccgc actttgccca tcggtaagta 4260
ttgcatgcat tgccagacta tcttgtgtta taattcggct acttacgtat tgcctagtca 4320
ctctacgcag atattgccca gacacttgga gagtatctta ttgagaaata caaacccgag 4380
ttcaaagatc ttggtctcga tgtgtgtgac atggtcgtac cgaagccact catcgcgaag 4440
ggaggagagc agctctttag agtctctgct attgctaatt gggctgagaa gaaggcttca 4500
gttcaagtat acgccgttaa tgctgacggc aaaaagaccg tggatcatgc gtattgtacg 4560
gtgaagttct ttgataccaa tgcctccgag ctcgagtgga agagaatctc gtacctggtc 4620
aagagaagca tcgacagtct tcaccagaat gcggagacag gggaggctca ccgtatccag 4680
cgaggaatgg tctataaact tttcagcgcg ttggtcgatt atgatgaaaa tttcaagtcg 4740
attcgcgagg ttatcctgga cagcgacaat aatgaggcca ccgctcgtgt caaattccaa 4800
gcaccgccag gaaatttcca ccgaaaccca ttctggattg acagtttcgg tcacttgtcc 4860
ggattcatta tgaatgcgag cgacgcgacc gactctaaga accaagtatt tgttaaccat 4920
ggatgggatt cgatgcgttg cctgaagaag ttctcgcctg atgtcactta tcgcacttat 4980
gtgaggatgc agccatggca aaacaacatt tgggctggag atgtttatat ctttgagggc 5040
gacgatatta ttgctgtctt cggaggtgtg aaggtgggta cctcactact gattttggtt 5100
cctgcttact gacatgataa ttagttccaa gcactggcac gcaagatact tgacactgtt 5160
cttccccctg ttggcggttc aaaggcacca attacagcga aatcaccacc tccagctcgc 5220
actcagaagg ccaacaccgg cgccaagacc cgtcctaaag cacctgttcc ttccaagtcg 5280
ttcaccaaat cttctgggcc gagtgttgtc gtacgcgcac tcagcattct ggcctcagaa 5340
gttggcctgg cagagtctga aatctcagac gacatggtgt ttgcggacta cggtgtagac 5400
tcactcctct cccttacagt tactggcagg tatcgtgaag agttgaacct cgatttggac 5460
tcctctgtgt ttaccgatca tccaactgtc aacgacttca agcggctcat cgcccaagtg 5520
agtccttcag agagccatga tggttcctcc agtgaacaag agtcgaattt ctctttcaac 5580
ggtggcgagt cctcaagcgc aagcacacct gacataacgt caccgccgaa tgagaaggta 5640
gctcaagtcg agcaaaacgg caccatgaag gaaatccgta acatcatggc ggaggagatc 5700
ggtgtacccg cagaagagat cgaccctgac gagaacttgg gagagatggg tatggactcg 5760
cttctctccc ttactgttct tggaagaata cgggagactt tggacatgga cctgccagga 5820
gagttcttca tcgaaaacca gaccctcaat gatatagagg tggctttgga cctaaaaccc 5880
aagactacct ctgctccaat tcctatgcca gagccagtga aattccctga agctatccac 5940
gacctccagc caaagcttgc tcaacatccc aaggccacat ccatcctgtt acaaggaaac 6000
cccaggacag caacaaagac gttattcttg tttcctgacg gctctggctc agctacatct 6060
tacgctacca tccccggact ctctcctgac gtctgcgttt acgggttgaa ttgcccatat 6120
atgaagacac ctgagaagct caaatgcagc ctagatgaac tcactgcgcc ctatgtagca 6180
gagattcgtc gtcggcaacc caagggtcct tacagcttcg gtggctggtc agcaggaggg 6240
atctgtgcat atgatgcggc acgccatcta atgtttgagg aaggtgaaca agtcgaccgc 6300
ttgcttctcc ttgatacccc cttccccatc ggcctcgaga agctgccgca gagattgtac 6360
ggcttcttca actctatcgg tctcttcggt gaaggtaaaa cggcaccacc ctcctggctc 6420
ctaccccact tcctagcctt tatcgacgct ctcgacgcat acaaggccgc gccccttcca 6480
ttcaaagacg agaaatgggc caagaaactg cccaagactt atatcatctg ggccaaggac 6540
ggtgtttgcg gtaagccggg agatccccgg cctgatcccc cgacagacgg ttccaaggat 6600
cccaaggaga tggtctggct tcttaatgac cggaccgatc tgggacctaa caagtgggat 6660
acattggttg gacctgagaa tattggtgga atcacagtaa tggaagatgc taatcatttt 6720
acgatgacga agggcgaaaa agcgaaagag ttgtctacat ttatggctaa cgccatggct 6780
taa 6783
<210> 36
<211> 66
<212> DNA
<213> 人工序列
<220>
<223> 其延伸序列用于克隆的原型间隔子(oAT3858)
<400> 36
aatttctact cttgtagata cgatggtgct gatggctact tttttttttg agcatttatc 60
agcttg 66
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物oAT4025
<400> 37
gcccgttcga gagcatgatc 20
<210> 38
<211> 16208
<212> DNA
<213> 人工序列
<220>
<223> 质粒pAT3720
<400> 38
accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag 60
ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca 120
gcgctgcgat gataccgcga gaaccacgct caccggctcc ggatttatca gcaataaacc 180
agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt 240
ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg 300
ttgttgccat cgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca 360
gctccggttc ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg 420
ttagctcctt cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca 480
tggttatggc agcgctacat aattctctta ctgtcatgcc atccgtaaga tgcttttctg 540
tgactggtga gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct 600
cttgcccggc gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca 660
tcattggaaa acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca 720
gttcgatgta acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg 780
tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac 840
ggaaatgttg aatactcata ttcttccttt ttcaatatta ttgaagcatt tatcagggtt 900
attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggtca 960
gtgttacaac caattaacca attctgaaca ttatcgcgag cccatttata cctgaatatg 1020
gctcataaca ccccttgttt gcctggcggc agtagcgcgg tggtcccacc tgaccccatg 1080
ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggactcc ccatgcgaga 1140
gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg 1200
cccgggctaa ttatggggtg tcgcccttat tcgactctat agtgaagttc ctattctcta 1260
gaaagtatag gaacttctga agtggggatt taaatgcggc cgcgctgagg gtttaatcga 1320
cgaagcagct gacggccagt gccaagctta acgcgtaccc gggcccagta tatgttccgc 1380
agatgactgg agctctgcca tacgtgccct ctcaagcacc atttgttcca tctacagaga 1440
ctagtcacca actagtctat caagactcac agggtacatt gctgagacca actgaccaga 1500
ggcagggtag cggattgacg gctccatctc cttcacttac aaggtctatt gaaagccctt 1560
tagcatcacc aagcggagaa tagattgtta agcttatttt ttgtatactg ttttgtgata 1620
gcacgaagtt tttccacggt atcttgtaaa aatatatatt tgtggcgggc ttacctacat 1680
caaattaata agagactaat tataaactaa acacacaagc aagctacttt agggtaaaag 1740
tttataaatg cttttgacgt ataaacgttg cttgtattta ttattacaat taaaggtgga 1800
tagaaaacct agagactagt tagaaactaa tctcaggttt gcgttaaact aaatcagagc 1860
ccgagaggtt aacagaacct agaaggggac tagatatccg ggtagggaaa caaaaaaaaa 1920
aaacaagaca gccacatatt agggagacta gttagaagct agttccagga ctaggaaaat 1980
aaaagacaat gataccacag tctagttgac aactagatag attctagatt gaggccaaag 2040
tctctgagat ccaggttagt tgcaactaat actagttagt atctagtctc ctataactct 2100
gaagctagaa taacttacta ctattatcct caccactgtt cagctgcgca aacggagtga 2160
ttgcaaggtg ttcagagact agttattgac tagtcagtga ctagcaataa ctaacaaggt 2220
attaacctac catgtctgcc atcaccctgc acttcctcgg gctcagcagc cttttcctcc 2280
tcattttcat gctcattttc cttgtttaag actgtgacta gtcaaagact agtccagaac 2340
cacaaaggag aaatgtctta ccactttctt cattgcttgt ctcttttgca ttatccatgt 2400
ctgcaactag ttagagtcta gttagtgact agtccgacga ggacttgctt gtctccggat 2460
tgttggagga actctccagg gcctcaagat ccacaacaga gccttctaga agactggtca 2520
ataactagtt ggtctttgtc tgagtctgac ttacgaggtt gcatactcgc tccctttgcc 2580
tcgtcaatcg atgagaaaaa gcgccaaaac tcgcaatatg gctttgaacc acacggtgct 2640
gagactagtt agaatctagt cccaaactag cttggatagc ttacctttgc cctttgcgtt 2700
gcgacaggtc ttgcagggta tggttccttt ctcaccagct gatttagctg ccttgctacc 2760
ctcacggcgg atctgccata aagagtggct agaggttata aattagcact gatcctaggt 2820
acggggctga atgtaacttg cctttccttt ctcatcgcgc ggcaagacag gcttgctcaa 2880
attcctacca gtcacagggg tatgcacggc gtacggacca cttgaactag tcacagatta 2940
gttagcaact agtctgcatt gaatggctgt acttacgggc cctcgccatt gtcctgatca 3000
tttccagctt caccctcgtt gctgcaaagt agttagtgac tagtcaagga ctagttgaaa 3060
tgggagaaga aactcacgaa ttctcgactc ccttagtatt gtggtccttg gacttggtgc 3120
tgctatatat tagctaatac actagttaga ctcacagaaa cttacgcagc tcgcttgcgc 3180
ttcttggtag gagtcggggt tgggagaaca gtgccttcaa acaagccttc ataccatgct 3240
acttgactag tcagggacta gtcaccaagt aatctagata ggacttgcct ttggcctcca 3300
tcagttcctt catagtggga ggaccattgt gcaatgtaaa ctccatgccg tgggagttct 3360
tgtccttcaa gtgcttgacc aatatgtttc tgttggcaga gggaacctgt caactagtta 3420
ataactagtc agaaactatg atagcagtag actcactgta cgcttgaggc atcccttcac 3480
tcggcagtag acttcatatg gatggatatc aggcacgcca ttgtcgtcct gtggactagt 3540
cagtaactag gcttaaagct agtcgggtcg gcttactatc ttgaaatccg gcagcgtaag 3600
ctccccgtcc ttaactgcct cgagatagtg acagtactct ggggactttc ggagatcgtt 3660
atcgttatcg cgaatgctcg gcatactaac tgttgactag tcttggacta gtcccgagca 3720
aaaaggattg gaggaggagg aggaaggtga gagtgagaca aagagcgaaa taagagcttc 3780
aaaggctatc tctaagcagt atgaaggtta agtatctagt tcttgactag atttaaagag 3840
atttcgacta gttatgtacc tggagtttgg atataggaat gtgttgtggt aacgaaatgt 3900
aagggggagg aaagaaaaag tcgtcaagag gtaactctaa gtcggccatt cctttttggg 3960
aggcgctaac cataaacggc atggtcgact tagagttagc tcagggaatt tagggagtta 4020
tctgcgacca ccgaggaacg gcggaatgcc aaagaatccc gatggagctc tagctggcgg 4080
ttgacaaccc caccttttgg cgtttctgcg gcgttgcagg cgggactgga tacttcgtag 4140
aaccagaaag gcaaggcaga acgcgctcag caagagtgtt ggaagtgata gcatgatgtg 4200
ccttgttaac taggtaccaa tctgcagtat gcttgatgtt atccaaagtg tgagagagga 4260
aggtccaaac atacacgatt gggagagggc ctaggtataa gagtttttga gtagaacgca 4320
tgtgagccca gccatctcga ggagattaaa cacgggccgg catttgatgg ctatgttagt 4380
accccaatgg aaacggtgag agtccagtgg tcgcagataa ctccctaaat tccctgagct 4440
aactctaagt cgaccatgcc gtttatggtt agcgcctccc aaaaaggaat ggccgactta 4500
gagttacctc ttgacgactt tttctttcct cccccttaca tttcgttacc acaacacatt 4560
cctatatcca aactccaggt acataactag tcgaaatctc tttaaatcta gtcaagaact 4620
agatacttaa ccttcatact gcttagagat agcctttgaa gctcttattt cgctctttgt 4680
ctcactctca ccttcctcct cctcctccaa tcctttttgc tcgggactag tccaagacta 4740
gtcaacagtt agtatgccga gcattcgcga taacgataac gatctccgaa agtccccaga 4800
gtactgtcac tatctcgagg cagttaagga cggggagctt acgctgccgg atttcaagat 4860
agtaagccga cccgactagc tttaagccta gttactgact agtccacagg acgacaatgg 4920
cgtgcctgat atccatccat atgaagtcta ctgccgagtg aagggatgcc tcaagcgtac 4980
agtgagtcta ctgctatcat agtttctgac tagttattaa ctagttgaca ggttccctct 5040
gccaacagaa acatattggt caagcacttg aaggacaaga actcccacgg catggagttt 5100
acattgcaca atggtcctcc cactatgaag gaactgatgg aggccaaagg caagtcctat 5160
ctagattact tggtgactag tccctgacta gtcaagtagc atggtatgaa ggcttgtttg 5220
aaggcactgt tctcccaacc ccgactccta ccaagaagcg caagcgagct gcgtaagttt 5280
ctgtgagtct aactagtgta ttagctaata tatagcagca ccaagtccaa ggaccacaat 5340
actaagggag tcgagaattc gtgagtttct tctcccattt caactagtcc ttgactagtc 5400
actaactact ttgcagcaac gagggtgaag ctggaaatga tcaggacaat ggcgagggcc 5460
cgtaagtaca gccattcaat gcagactagt tgctaactaa tctgtgacta gttcaagtgg 5520
tccgtacgcc gtgcataccc ctgtgactgg taggaatttg agcaagcctg tcttgccgcg 5580
cgatgagaaa ggaaaggcaa gttacattca gccccgtacc taggatcagt gctaatttat 5640
aacctctagc cactctttat ggcagatccg ccgtgagggt agcaaggcag ctaaatcagc 5700
tggtgagaaa ggaaccatac cctgcaagac ctgtcgcaac gcaaagggca aaggtaagct 5760
atccaagcta gtttgggact agattctaac tagtctcagc accgtgtggt tcaaagccat 5820
attgcgagtt ttggcgcttt ttctcatcga ttgacgaggc aaagggagcg agtatgcaac 5880
ctcgtaagtc agactcagac aaagaccaac tagttattga ccagtcttct agaaggctct 5940
gttgtggatc ttgaggccct ggagagttcc tccaacaatc cggagacaag caagtcctcg 6000
tcggactagt cactaactag actctaacta gttgcagaca tggataatgc aaaagagaca 6060
agcaatgaag aaagtggtaa gacatttctc ctttgtggtt ctggactagt ctttgactag 6120
tcacagtctt aaacaaggaa aatgagcatg aaaatgagga ggaaaaggct gctgagcccg 6180
aggaagtgca gggtgatggc agacatggta ggttaatacc ttgttagtta ttgctagtca 6240
ctgactagtc aataactagt ctctgaacac cttgcaatca ctccgtttgc gcagctgaac 6300
agtggtgagg ataatagtag taagttattc tagcttcaga gttataggag actagatact 6360
aactagtatt agttgcaact aacctggatc tcagagactt tggcctcaat ctagaatcta 6420
tctagttgtc aactagactg tggtatcatt gtcttttatt ttcctagtcc tggaactagc 6480
ttctaactag tctccctaat atgtggctgt cttgtttttt ttttttgttt ccctacccgg 6540
atatctagtc cccttctagg ttctgttaac ctctcgggct ctgatttagt ttaacgcaaa 6600
cctgagatta gtttctaact agtctctagg ttttctatcc acctttaatt gtaataataa 6660
atacaagcaa cgtttatacg tcaaaagcat ttataaactt ttaccctaaa gtagcttgct 6720
tgtgtgttta gtttataatt agtctcttat taatttgatg taggtaagcc cgccacaaat 6780
atatattttt acaagatacc gtggaaaaac ttcgtgctat cacaaaacag tatacaaaaa 6840
ataagcttaa caatctattc tccgcttggt gatgctaaag ggctttcaat agaccttgta 6900
agtgaaggag atggagccgt caatccgcta ccctgcctct ggtcagttgg tctcagcaat 6960
gtaccctgtg agtcttgata gactagttgg tgactagtct ctgtagatgg aacaaatggt 7020
gcttgagagg gcacgtatgg cagagctcca gtcatctgcg gaacatatac tgggcccggg 7080
aagatctcat ggtcatagct gtttccgtta attaatggtt cacttctctt tagaaatcaa 7140
ctgtgggttt tgctttttgc ttcattctct ttgtcttctc catctttgat caaatcctgg 7200
actttctcaa tccccagcta attcaatcat agtcagtttt ctatttttat tatttctttt 7260
tcttttgaaa tgtgattaac aaccagtccg ttatatatct tgtacccaga ttacgcccaa 7320
ctcgtgctcc tcagccacaa agatactcaa ttgatagcca agatacatac ataccacaaa 7380
gtaaggactc catgcattga gtattactca tcgtattcta gactactcca aaactcagca 7440
catagacaaa caatacgaac ctcgtctagg ggtgattcag aggcggcaaa gcggggtttt 7500
cgcatttgat gttcctggca cttatgtaag cccacgcttc ccgctcaact aaaccatcag 7560
ccaatcagac tgctcagatt tatcttttga agggtaaata aatcattgta aagaagaaca 7620
agtggcttgc ttgtcaagca atggcatcat tggtctagtg gtagaattcg tcgttgccat 7680
cgacgaggcc cgtgttcgat tcacggatga tgcaggaatt tctactcttg tagatacgat 7740
ggtgctgatg gctacttttt tttttgagca tttatcagct tgatatagag gtaggaatgt 7800
atggaggtgc agaatggcta ttttgttatt ggagcgggtt cgaaacggag ggcaggagac 7860
tttttctaaa tacgtcacgt gatatagagc tgctttaatt aacgagacag cagaatcacc 7920
gcccaagtta agcctttgtg ctgatcatgc tctcgaacgg gccaagttcg ggaaaagcaa 7980
aggagcgttt agtgaggggc aatttgactc acctcccagg caacagatga ggggggcaaa 8040
aagaaagaaa ttttcgtgag tcaatatgga ttccgagcat cattttcttg cggtctatct 8100
tgctacgtat gttgatcttg acgctgtgga tcaagcaacg ccactcgctc gctccatcgc 8160
aggctggtcg cagacaaatt aaaaggcggc aaactcgtac agccgcgggg ttgtccgctg 8220
caaagtacag agtgataaaa gccgccatgc gaccatcaac gcgttgatgc ccagcttttt 8280
cgatccgaga atccaccgta gaggcgatag caagtaaaga aaagctaaac aaaaaaaaat 8340
ttctgcccct aagccatgaa aacgagatgg ggtggagcag aaccaaggaa agagtcgcgc 8400
tgggctgccg ttccggaagg tgttgtaaag gctcgacgcc caaggtggga gtctaggaga 8460
agaatttgca tcgggagtgg ggcgggttac ccctccatat ccaatgacag atatctacca 8520
gccaagggtt tgagcccgcc cgcttagtca tcgtcctcgc ttgcccctcc ataaaaggat 8580
ttcccctccc cctcccacaa aattttcttt cccttcctct ccttgtccgc ttcagtacgt 8640
atatcttccc ttccctcgct tctctcctcc atccttcttt catccatctc ctgctaactt 8700
ctctgctcag cacctctacg cattactagc cgtagtatct gagcacttct cccttttata 8760
ttccacaaaa cataacacaa ccttcaccat gaacaacggc acaaacaact tccagaactt 8820
cattggaatc tcgtcgttgc agaagacttt gcgcaacgcc ctcatcccca cagaaactac 8880
ccagcagttc attgtgaaga acggaatcat caaggaagat gaactccgag gcgagaaccg 8940
ccagattttg aaggacatca tggatgatta ctaccgtggt ttcatctcgg aaacgctctc 9000
ctccattgac gacatcgatt ggacttcgtt gttcgaaaag atggaaatcc agctcaaaaa 9060
cggcgataac aaggatacct tgatcaagga gcagaccgag tatcggaagg cgatccataa 9120
gaagttcgcc aacgatgatc ggttcaagaa catgttctcg gccaagttga tttccgacat 9180
tctccccgaa ttcgtgatcc ataacaacaa ctactcggcg tcggagaagg aggagaagac 9240
gcaggtcatc aagttgttct cgaggttcgc cacatcgttc aaagactatt ttaagaatcg 9300
tgcgaactgt ttctcggcag atgatatctc ctcgtcctcc tgtcaccgca ttgtgaacga 9360
caacgcggaa atcttcttct cgaacgcgtt ggtgtatagg cgcatcgtga agtccctctc 9420
caacgatgac atcaacaaaa tctcgggaga tatgaaggat tcgctcaagg agatgtcgtt 9480
ggaggaaatc tactcctatg agaagtatgg cgagttcatt acgcaggagg gcatttcctt 9540
ctacaacgac atttgtggta aagtcaactc gttcatgaac ctctactgtc agaaaaacaa 9600
ggagaacaaa aacctctata agctccagaa gttgcataag cagatcctct gtatcgcaga 9660
cacctcgtac gaggtccctt acaagttcga atccgatgag gaggtctacc agtccgtcaa 9720
cggattcttg gacaacatct cctcgaaaca cattgtcgag cggctccgaa agatcggcga 9780
taactacaac ggctacaact tggacaaaat ctatatcgtc tccaagttct atgagtccgt 9840
ctcgcagaaa acctatcgtg attgggagac tatcaacact gcgctcgaga ttcactataa 9900
caacatcttg cctggtaacg gcaaatcgaa agccgacaag gtgaagaagg ccgtgaaaaa 9960
cgatctccag aagtcgatca cagaaatcaa cgaactcgtc tcgaactaca agctctgttc 10020
ggatgataac atcaaggcgg aaacgtacat ccatgaaatc tcgcatatct tgaacaactt 10080
cgaggcccag gaactcaaat acaaccccga gatccacttg gtcgagtcgg agctcaaagc 10140
ctcggagttg aagaacgtct tggatgtcat catgaacgca ttccactggt gttccgtgtt 10200
catgaccgag gaactcgtcg ataaagacaa caacttctac gcggaactcg aggaaatcta 10260
cgatgaaatc tatcccgtga tctccctcta caacctcgtg cgaaactacg tcactcagaa 10320
gccctattcc accaagaaga tcaagctcaa cttcggcatc cccactctcg cagacggttg 10380
gtcgaagtcg aaggagtact ccaacaacgc cattatcctc atgcgagaca acctctacta 10440
cttgggtatc ttcaacgcaa agaacaagcc ggataagaag atcattgaag gcaacacttc 10500
ggaaaacaag ggagactata agaagatgat ctacaacctc ctccctggac ccaacaagat 10560
gattcctaaa gtgttcctct cgtcgaagac tggtgtggaa acgtataagc cgtcggccta 10620
catcttggag ggctacaaac agaacaagca tatcaagtcc tcgaaggact tcgacatcac 10680
tttctgtcac gacctcatcg actatttcaa gaactgtatt gcaatccatc cggaatggaa 10740
gaacttcggc ttcgatttct cggatacttc gacatacgaa gatatctcgg gattctaccg 10800
agaggtcgaa ttgcagggct ataagattga ttggacctac atctcggaaa aggatatcga 10860
cttgctccag gaaaagggcc agctctacct cttccagatt tacaacaagg acttctccaa 10920
gaagtcgacg ggtaacgaca acttgcacac aatgtatctc aaaaacctct tctcggagga 10980
gaacttgaag gatatcgtgc tcaaattgaa cggagaggcc gaaatcttct tccgtaagtc 11040
ctccatcaag aacccgatca tccataagaa gggatcgatc ttggtcaacc ggacttacga 11100
agcagaggaa aaagatcagt tcggaaacat ccagattgtc aggaagaaca tccctgaaaa 11160
catctatcag gagttgtata agtacttcaa cgacaagtcg gataaggagc tctccgacga 11220
agcagccaaa ctcaagaacg tcgtcggaca ccatgaagca gcaaccaaca ttgtgaagga 11280
ctaccggtac acttacgaca agtacttctt gcacatgccg atcactatca acttcaaagc 11340
caacaagacc ggattcatta acgacaggat cctccagtac attgccaaag aaaaggacct 11400
ccatgtcatc ggtatcgata ggggagaacg gaacctcatc tacgtctccg tgattgacac 11460
ttgtggcaac attgtcgaac agaagtcgtt caacatcgtc aacggttacg attaccagat 11520
taagttgaaa cagcaggaag gtgcgaggca gattgcgcga aaggaatgga aggagattgg 11580
caaaatcaag gagattaagg aaggctactt gtcgttggtc atccacgaaa tctcgaaaat 11640
ggtgatcaaa tacaacgcca tcatcgccat ggaagacctc tcgtacggct tcaaaaaggg 11700
acggttcaaa gtggagcgtc aggtgtacca gaagttcgaa acaatgttga tcaacaagtt 11760
gaactacttg gtgttcaagg acatttccat taccgagaac ggaggattgc tcaagggtta 11820
tcagctcacg tacatccccg acaagttgaa aaacgtggga caccagtgtg gctgtatctt 11880
ctacgtgcct gcagcctaca cgtcgaaaat cgaccctaca acaggattcg tgaacatctt 11940
caagttcaag gatctcaccg tcgacgcgaa gcgggagttc atcaaaaagt tcgactccat 12000
ccgctatgat tcggagaaga acttgttctg tttcacattc gactacaaca acttcattac 12060
tcagaacacc gtgatgtcca aatcgtcgtg gtccgtgtac acgtatggtg tgcgcatcaa 12120
aaggcgcttc gtcaacggtc gcttctccaa cgaatcggac acgatcgata tcacgaaaga 12180
catggagaaa acattggaaa tgaccgacat caactggcgt gacggccatg acctcaggca 12240
ggacatcatc gattacgaga tcgtccagca catcttcgaa atcttccgtc tcaccgtgca 12300
gatgaggaac tccctctccg agctcgaaga tcgggattac gaccggctca tttcccctgt 12360
gttgaacgag aacaacatct tctacgactc ggcaaaagcg ggagatgcat tgccgaagga 12420
cgccgatgcg aacggtgcat attgtattgc actcaagggt ctctacgaaa tcaagcagat 12480
caccgaaaac tggaaggagg acggcaaatt ctcgagggac aagttgaaga tttcgaacaa 12540
ggattggttc gatttcatcc agaacaagag gtacttgcct ccgaagaaga agcgaaaggt 12600
gtgagcggac attcgattta tgccgttatg acttccttaa aaaagccttt acgaatgaaa 12660
gaaatggaat tagacttgtt atgtagttga ttctacaatg gattatgatt cctgaacttc 12720
aaatccgctg ttcattatta atctcagctc ttcccgtaaa gccaatgttg aaactattcg 12780
taaatgtacc tcgttttgcg tgtaccttgc ttatcacgtg atattacatg acctggacag 12840
agttctgcgc gaaagtcata acgtaaatcc cgggcggtag gtgcgtcccg ggcggaaggt 12900
agttttctcg tccaccccaa cgcgtttatc aacctcaact ttcaacaacc atcatgccac 12960
caaaagcgcg taaaacaaag cgagatttga ttgagcaaga gggcaggatc caatgcgcga 13020
ttcaagacat taaaaatgga aaatttcaaa aaattgcgcc cgcagcgcgt gcatacaaaa 13080
ttcatcccaa tactcctcgt gtactgtgta agcgcccact aggtaatatg acatgattac 13140
gaattcgagc tcggtacccg gccggggatc ctctagacgt ggagttacca gtgattgacc 13200
aatgttttat cttctacagt tctgcctgtc taccccattc tagctgtacc tgactacaga 13260
gtagtttaat tgtggttgac cccacagtcg gaggcggagg aatacagcac cgatgtggcc 13320
tgtctccatc cagattggca cgcaattttt acacgcggaa aagatcgaga tagagtacga 13380
ctttaaattt agtccccggc ggcttctatt ttagaatatt tgagatttga ttctcaagca 13440
attgatttgg ttgggtcacc ctcaattgga taatatacct cattgctcgg ctacttcaac 13500
tcatcaatca ccgtcatacc ccgcatataa ccctccattc ccacgatgtc gtccaagtcg 13560
caattgactt acggtgctcg agccagcaag caccccaatc ctctggcaaa gagacttttt 13620
gagattgccg aagcaaagaa gacaaacgtt accgtctctg ctgatgtgac gacaacccga 13680
gaactcctgg acctcgctga ccgtacggaa gctgttggat ccaatacata tgccgtctag 13740
caatggacta atcaactttt gatgatacag gtctcggtcc ctacatcgcc gtcatcaaga 13800
cacacatcga catcctcacc gatttcagcg tcgacactat caatggcctg aatgtgctgg 13860
ctcaaaagta caactttttg atcttcgagg accgcaaatt catcgacatc ggcaataccg 13920
tccagaagca ataccacggc ggtgctctga ggatctccga atgggcccac attatcaact 13980
gcagcgttct ccctggcgag ggcatcgtcg aggctctggc ccagaccgca tctgcgcaag 14040
acttccccta tggtcctgag agaggactgt tggtcctggc agagatgacc cccaaaggat 14100
cgctggctac gggcgagtat accaaggcat cggttgacta cgctcgcaaa tacaagaact 14160
tcgttatggg tttcgtgtcg acgcgggccc tgacggaagt gcagtcggat gtgtcttcag 14220
cctcggagga tgaagatttc gtggtcttca cgacgggtgt gaacctctct tccaaaggag 14280
ataagcttgg acagcaatac cagactcctg catcggctat tggacgcggt gccgacttta 14340
tcatcgccgg tcgaggcatc tacgctgctc ccgacccggt tgaagctgca cagcggtacc 14400
agaaagaagg ctgggaagct tatatggcca gagtatgcgg caagtcatga tttcctcttg 14460
gagcaaaagt gtagtgccag tacgagtgtt gtggaggaag gctgcataca ttgtgcctgt 14520
cattaaacga tgagctcgtc cgtattggcc cctgtaatgc catgttttcc gcccccaatc 14580
gtcaaggttt tccctttgtt agattcctac cagtcatcta gcaaggcggc cgcagctagc 14640
acaattgagg catccccact accgcattaa gacctcagcg cggccgcaaa tttaaataaa 14700
atgaagtgaa gttcctatac tttctagaga ataggaactt ctatagtgag tcgaataagg 14760
gcgacacaaa atttattcta aatgcataat aaatactgat aacatcttat agtttgtatt 14820
atattttgta ttatcgttga catgtataat tttgatatca aaaactgatt ttccctttat 14880
tattttcgag atttattttc ttaattctct ttaacaaact agaaatattg tatatacaaa 14940
aaatcataaa taatagatga atagtttaat tataggtgtt catcaatcga aaaagcaacg 15000
tatcttattt aaagtgcgtt gcttttttct catttataag gttaaataat tctcatatat 15060
caagcaaagt gacaggcgcc cttaaatatt ctgacaaatg ctctttccct aaactccccc 15120
cataaaaaaa cccgccgaag cgggttttta cgttatttgc ggattaacga ttactcgtta 15180
tcagaaccgc ccagggggcc cgagcttaag actggccgtc gttttacaac acagaaagag 15240
tttgtagaaa cgcaaaaagg ccatccgtca ggggccttct gcttagtttg atgcctggca 15300
gttccctact ctcgccttcc gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc 15360
tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg 15420
ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 15480
ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac 15540
gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg 15600
gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct 15660
ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat ctcagttcgg 15720
tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct 15780
gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac 15840
tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt 15900
tcttgaagtg gtgggctaac tacggctaca ctagaagaac agtatttggt atctgcgctc 15960
tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 16020
ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 16080
ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gacgcgcgcg 16140
taactcacgt taagggattt tggtcatgag cttgcgccgt cccgtcaagt cagcgtaatg 16200
ctctgctt 16208
<210> 39
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物oAT4074
<400> 39
gtctggacga ttcccagaag ctgatgg 27
<210> 40
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物oAT4075
<400> 40
ctctgggatc gtgccgatac agacac 26
<210> 41
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物oAT4076
<400> 41
ccagcgtcag cgttgataca gcttg 25
<210> 42
<211> 120
<212> DNA
<213> 人工序列
<220>
<223> 引物oAT4070
<400> 42
cgtggccatt tcctgtccag aaccgggaat tgcaacacat aagacgatgg tgctgatggc 60
tactgtagag cagatggaga gggtacaatc attctcaagc ggctggaaga cgctcaggcg 120
<210> 43
<211> 140
<212> DNA
<213> 人工序列
<220>
<223> 引物oAT4071
<400> 43
cgtggccatt tcctgtccag aaccgggaat tgcaacacat aagacgatgg tgctgatggc 60
tactgtagag cagatggagt gggtacaatc attctcaagg ggctggaaga cgctcaggcg 120
gacaacgatc caatcctcgg 140
<210> 44
<211> 160
<212> DNA
<213> 人工序列
<220>
<223> 引物oAT4072
<400> 44
cgtggccatt tcctgtccag aaccgggaat tgcaacacat aagacgatgg tgctgatggc 60
tactgtagag cagatggagt gggtacaatc attctcaagc ggctggaaga cgctcaggcc 120
gacaacgatc caatcctcgg tgtgatcaat ggagcctata 160
<210> 45
<211> 16354
<212> DNA
<213> 人工序列
<220>
<223> 质粒pGMEr263
<400> 45
gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120
ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180
ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240
ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300
agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360
tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420
ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480
tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540
accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600
gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660
ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720
atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780
cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840
gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900
acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960
aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020
gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080
gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140
gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200
taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260
catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320
gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380
tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440
ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500
gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560
tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620
gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680
gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740
cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800
tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860
ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920
actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980
cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040
agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100
tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160
taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220
tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280
cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340
caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400
gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460
tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520
taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580
tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640
tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700
ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760
atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820
actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880
gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940
ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000
gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060
aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120
gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180
ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240
caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300
gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360
aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420
taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480
acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540
tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600
tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660
actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720
aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780
ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840
aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900
gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960
gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020
aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080
ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140
gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200
gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260
tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320
aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380
aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440
aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500
gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560
tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620
ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680
tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740
caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800
gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860
gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920
gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980
gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040
aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100
cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160
aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220
actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280
ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340
tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400
agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460
taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520
tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580
gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640
caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700
gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760
tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820
agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880
gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940
ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000
tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060
cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120
tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180
cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240
ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300
atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360
catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420
gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500
aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560
ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620
cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680
ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740
ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800
cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860
tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920
tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980
tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040
gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100
tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160
actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220
ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280
atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340
gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400
gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460
aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520
tcgattcacg gatgatgcag gaatttctac tcttgtagat ctttttttgg ctcttgggtt 8580
cgaactgccc aaggcccatg ttttggtcat cttttttttt atgccccacc atttgggtca 8640
cccctgccaa tcattccatc tttgttccta cccttcacgt gtgctttccg aagccaaagt 8700
tcccattcaa caactctcct tgcgtttttt ttttcttgaa gcttgtcacc cgtcgatagt 8760
ttctgccatt tgcaatcgag acagcagaat caccgcccaa gttaagcctt tgtgctgatc 8820
atgctctcga acgggccaag ttcgggaaaa gcaaaggagc gtttagtgag gggcaatttg 8880
actcacctcc caggcaacag atgagggggg caaaaagaaa gaaattttcg tgagtcaata 8940
tggattccga gcatcatttt cttgcggtct atcttgctac gtatgttgat cttgacgctg 9000
tggatcaagc aacgccactc gctcgctcca tcgcaggctg gtcgcagaca aattaaaagg 9060
cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt acagagtgat aaaagccgcc 9120
atgcgaccat caacgcgttg atgcccagct ttttcgatcc gagaatccac cgtagaggcg 9180
atagcaagta aagaaaagct aaacaaaaaa aaatttctgc ccctaagcca tgaaaacgag 9240
atggggtgga gcagaaccaa ggaaagagtc gcgctgggct gccgttccgg aaggtgttgt 9300
aaaggctcga cgcccaaggt gggagtctag gagaagaatt tgcatcggga gtggggcggg 9360
ttacccctcc atatccaatg acagatatct accagccaag ggtttgagcc cgcccgctta 9420
gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc tccccctccc acaaaatttt 9480
ctttcccttc ctctccttgt ccgcttcagt acgtatatct tcccttccct cgcttctctc 9540
ctccatcctt ctttcatcca tctcctgcta acttctctgc tcagcacctc tacgcattac 9600
tagccgtagt atctgagcac ttctcccttt tatattccac aaaacataac acaaccttca 9660
ccatgaacaa cggcacaaac aacttccaga acttcattgg aatctcgtcg ttgcagaaga 9720
ctttgcgcaa cgccctcatc cccacagaaa ctacccagca gttcattgtg aagaacggaa 9780
tcatcaagga agatgaactc cgaggcgaga accgccagat tttgaaggac atcatggatg 9840
attactaccg tggtttcatc tcggaaacgc tctcctccat tgacgacatc gattggactt 9900
cgttgttcga aaagatggaa atccagctca aaaacggcga taacaaggat accttgatca 9960
aggagcagac cgagtatcgg aaggcgatcc ataagaagtt cgccaacgat gatcggttca 10020
agaacatgtt ctcggccaag ttgatttccg acattctccc cgaattcgtg atccataaca 10080
acaactactc ggcgtcggag aaggaggaga agacgcaggt catcaagttg ttctcgaggt 10140
tcgccacatc gttcaaagac tattttaaga atcgtgcgaa ctgtttctcg gcagatgata 10200
tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc ggaaatcttc ttctcgaacg 10260
cgttggtgta taggcgcatc gtgaagtccc tctccaacga tgacatcaac aaaatctcgg 10320
gagatatgaa ggattcgctc aaggagatgt cgttggagga aatctactcc tatgagaagt 10380
atggcgagtt cattacgcag gagggcattt ccttctacaa cgacatttgt ggtaaagtca 10440
actcgttcat gaacctctac tgtcagaaaa acaaggagaa caaaaacctc tataagctcc 10500
agaagttgca taagcagatc ctctgtatcg cagacacctc gtacgaggtc ccttacaagt 10560
tcgaatccga tgaggaggtc taccagtccg tcaacggatt cttggacaac atctcctcga 10620
aacacattgt cgagcggctc cgaaagatcg gcgataacta caacggctac aacttggaca 10680
aaatctatat cgtctccaag ttctatgagt ccgtctcgca gaaaacctat cgtgattggg 10740
agactatcaa cactgcgctc gagattcact ataacaacat cttgcctggt aacggcaaat 10800
cgaaagccga caaggtgaag aaggccgtga aaaacgatct ccagaagtcg atcacagaaa 10860
tcaacgaact cgtctcgaac tacaagctct gttcggatga taacatcaag gcggaaacgt 10920
acatccatga aatctcgcat atcttgaaca acttcgaggc ccaggaactc aaatacaacc 10980
ccgagatcca cttggtcgag tcggagctca aagcctcgga gttgaagaac gtcttggatg 11040
tcatcatgaa cgcattccac tggtgttccg tgttcatgac cgaggaactc gtcgataaag 11100
acaacaactt ctacgcggaa ctcgaggaaa tctacgatga aatctatccc gtgatctccc 11160
tctacaacct cgtgcgaaac tacgtcactc agaagcccta ttccaccaag aagatcaagc 11220
tcaacttcgg catccccact ctcgcagacg gttggtcgaa gtcgaaggag tactccaaca 11280
acgccattat cctcatgcga gacaacctct actacttggg tatcttcaac gcaaagaaca 11340
agccggataa gaagatcatt gaaggcaaca cttcggaaaa caagggagac tataagaaga 11400
tgatctacaa cctcctccct ggacccaaca agatgattcc taaagtgttc ctctcgtcga 11460
agactggtgt ggaaacgtat aagccgtcgg cctacatctt ggagggctac aaacagaaca 11520
agcatatcaa gtcctcgaag gacttcgaca tcactttctg tcacgacctc atcgactatt 11580
tcaagaactg tattgcaatc catccggaat ggaagaactt cggcttcgat ttctcggata 11640
cttcgacata cgaagatatc tcgggattct accgagaggt cgaattgcag ggctataaga 11700
ttgattggac ctacatctcg gaaaaggata tcgacttgct ccaggaaaag ggccagctct 11760
acctcttcca gatttacaac aaggacttct ccaagaagtc gacgggtaac gacaacttgc 11820
acacaatgta tctcaaaaac ctcttctcgg aggagaactt gaaggatatc gtgctcaaat 11880
tgaacggaga ggccgaaatc ttcttccgta agtcctccat caagaacccg atcatccata 11940
agaagggatc gatcttggtc aaccggactt acgaagcaga ggaaaaagat cagttcggaa 12000
acatccagat tgtcaggaag aacatccctg aaaacatcta tcaggagttg tataagtact 12060
tcaacgacaa gtcggataag gagctctccg acgaagcagc caaactcaag aacgtcgtcg 12120
gacaccatga agcagcaacc aacattgtga aggactaccg gtacacttac gacaagtact 12180
tcttgcacat gccgatcact atcaacttca aagccaacaa gaccggattc attaacgaca 12240
ggatcctcca gtacattgcc aaagaaaagg acctccatgt catcggtatc gataggggag 12300
aacggaacct catctacgtc tccgtgattg acacttgtgg caacattgtc gaacagaagt 12360
cgttcaacat cgtcaacggt tacgattacc agattaagtt gaaacagcag gaaggtgcga 12420
ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat caaggagatt aaggaaggct 12480
acttgtcgtt ggtcatccac gaaatctcga aaatggtgat caaatacaac gccatcatcg 12540
ccatggaaga cctctcgtac ggcttcaaaa agggacggtt caaagtggag cgtcaggtgt 12600
accagaagtt cgaaacaatg ttgatcaaca agttgaacta cttggtgttc aaggacattt 12660
ccattaccga gaacggagga ttgctcaagg gttatcagct cacgtacatc cccgacaagt 12720
tgaaaaacgt gggacaccag tgtggctgta tcttctacgt gcctgcagcc tacacgtcga 12780
aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt caaggatctc accgtcgacg 12840
cgaagcggga gttcatcaaa aagttcgact ccatccgcta tgattcggag aagaacttgt 12900
tctgtttcac attcgactac aacaacttca ttactcagaa caccgtgatg tccaaatcgt 12960
cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg cttcgtcaac ggtcgcttct 13020
ccaacgaatc ggacacgatc gatatcacga aagacatgga gaaaacattg gaaatgaccg 13080
acatcaactg gcgtgacggc catgacctca ggcaggacat catcgattac gagatcgtcc 13140
agcacatctt cgaaatcttc cgtctcaccg tgcagatgag gaactccctc tccgagctcg 13200
aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa cgagaacaac atcttctacg 13260
actcggcaaa agcgggagat gcattgccga aggacgccga tgcgaacggt gcatattgta 13320
ttgcactcaa gggtctctac gaaatcaagc agatcaccga aaactggaag gaggacggca 13380
aattctcgag ggacaagttg aagatttcga acaaggattg gttcgatttc atccagaaca 13440
agaggtactt gcctccgaag aagaagcgaa aggtgtgagc ggacattcga tttatgccgt 13500
tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg gaattagact tgttatgtag 13560
ttgattctac aatggattat gattcctgaa cttcaaatcc gctgttcatt attaatctca 13620
gctcttcccg taaagccaat gttgaaacta ttcgtaaatg tacctcgttt tgcgtgtacc 13680
ttgcttatca cgtgatatta catgacctgg acagagttct gcgcgaaagt cataacgtaa 13740
atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt ctcgtccacc ccaacgcgtt 13800
tatcaacctc aactttcaac aaccatcatg ccaccaaaag cgcgtaaaac aaagcgagat 13860
ttgattgagc aagagggcag gatggcgtaa tcatggtcat agctgtttcc tgtgtgaaat 13920
tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg taaagcctgg 13980
ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc cgctttccag 14040
tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt 14100
ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 14160
ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 14220
gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 14280
gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 14340
cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 14400
ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 14460
tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg 14520
gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc 14580
tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca 14640
ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag 14700
ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct 14760
ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc 14820
accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga 14880
tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca 14940
cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat 15000
taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac 15060
caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt 15120
gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt 15180
gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag 15240
ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct 15300
attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt 15360
gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc 15420
tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt 15480
agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg 15540
gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg 15600
actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct 15660
tgcccggcgt caatacggga taataccgcg ccacatagca gaactttaaa agtgctcatc 15720
attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt 15780
tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt 15840
tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg 15900
aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat 15960
tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaat aggggttccg 16020
cgcacatttc cccgaaaagt gccacctgac gtctaagaaa ccattattat catgacatta 16080
acctataaaa ataggcgtat cacgaggccc tttcgtctcg cgcgtttcgg tgatgacggt 16140
gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta agcggatgcc 16200
gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg gggctggctt 16260
aactatgcgg catcagagca gattgtactg agagtgcacc atatgcggtg tgaaataccg 16320
cacagatgcg taaggagaaa ataccgcatc aggc 16354
<210> 46
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 原型间隔子寡核苷酸1228713
<400> 46
ttcacggatg atgcaggaat ttctactctt gtagatcgtt gaagccggat atgaagcttt 60
ttttggctct tgggttcgaa ctgcccaagg ccc 93
<210> 47
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 原型间隔子寡核苷酸1228715
<400> 47
ttcacggatg atgcaggaat ttctactctt gtagatgcga ggccatccgc ctggcgcttt 60
ttttggctct tgggttcgaa ctgcccaagg ccc 93
<210> 48
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 原型间隔子寡核苷酸1228717
<400> 48
ttcacggatg atgcaggaat ttctactctt gtagatcccc gaaggagaat ccgtctcttt 60
ttttggctct tgggttcgaa ctgcccaagg ccc 93
<210> 49
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 原型间隔子寡核苷酸1228719
<400> 49
ttcacggatg atgcaggaat ttctactctt gtagattgcg taattaccat gcgcagattt 60
ttttggctct tgggttcgaa ctgcccaagg ccc 93
<210> 50
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 原型间隔子寡核苷酸1228721
<400> 50
ttcacggatg atgcaggaat ttctactctt gtagattatc cctgcggata tgtatatttt 60
ttttggctct tgggttcgaa ctgcccaagg ccc 93
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物1228659
<400> 51
cttgcttgtc aagcaatggc 20
<210> 52
<211> 16374
<212> DNA
<213> 人工序列
<220>
<223> 质粒pGMEr263proto1
<400> 52
gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120
ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180
ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240
ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300
agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360
tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420
ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480
tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540
accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600
gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660
ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720
atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780
cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840
gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900
acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960
aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020
gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080
gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140
gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200
taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260
catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320
gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380
tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440
ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500
gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560
tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620
gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680
gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740
cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800
tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860
ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920
actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980
cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040
agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100
tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160
taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220
tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280
cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340
caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400
gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460
tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520
taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580
tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640
tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700
ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760
atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820
actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880
gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940
ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000
gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060
aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120
gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180
ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240
caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300
gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360
aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420
taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480
acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540
tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600
tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660
actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720
aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780
ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840
aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900
gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960
gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020
aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080
ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140
gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200
gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260
tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320
aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380
aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440
aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500
gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560
tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620
ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680
tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740
caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800
gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860
gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920
gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980
gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040
aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100
cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160
aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220
actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280
ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340
tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400
agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460
taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520
tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580
gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640
caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700
gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760
tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820
agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880
gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940
ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000
tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060
cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120
tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180
cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240
ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300
atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360
catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420
gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500
aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560
ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620
cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680
ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740
ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800
cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860
tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920
tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980
tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040
gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100
tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160
actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220
ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280
atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340
gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400
gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460
aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520
tcgattcacg gatgatgcag gaatttctac tcttgtagat cgttgaagcc ggatatgaag 8580
ctttttttgg ctcttgggtt cgaactgccc aaggcccatg ttttggtcat cttttttttt 8640
atgccccacc atttgggtca cccctgccaa tcattccatc tttgttccta cccttcacgt 8700
gtgctttccg aagccaaagt tcccattcaa caactctcct tgcgtttttt ttttcttgaa 8760
gcttgtcacc cgtcgatagt ttctgccatt tgcaatcgag acagcagaat caccgcccaa 8820
gttaagcctt tgtgctgatc atgctctcga acgggccaag ttcgggaaaa gcaaaggagc 8880
gtttagtgag gggcaatttg actcacctcc caggcaacag atgagggggg caaaaagaaa 8940
gaaattttcg tgagtcaata tggattccga gcatcatttt cttgcggtct atcttgctac 9000
gtatgttgat cttgacgctg tggatcaagc aacgccactc gctcgctcca tcgcaggctg 9060
gtcgcagaca aattaaaagg cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt 9120
acagagtgat aaaagccgcc atgcgaccat caacgcgttg atgcccagct ttttcgatcc 9180
gagaatccac cgtagaggcg atagcaagta aagaaaagct aaacaaaaaa aaatttctgc 9240
ccctaagcca tgaaaacgag atggggtgga gcagaaccaa ggaaagagtc gcgctgggct 9300
gccgttccgg aaggtgttgt aaaggctcga cgcccaaggt gggagtctag gagaagaatt 9360
tgcatcggga gtggggcggg ttacccctcc atatccaatg acagatatct accagccaag 9420
ggtttgagcc cgcccgctta gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc 9480
tccccctccc acaaaatttt ctttcccttc ctctccttgt ccgcttcagt acgtatatct 9540
tcccttccct cgcttctctc ctccatcctt ctttcatcca tctcctgcta acttctctgc 9600
tcagcacctc tacgcattac tagccgtagt atctgagcac ttctcccttt tatattccac 9660
aaaacataac acaaccttca ccatgaacaa cggcacaaac aacttccaga acttcattgg 9720
aatctcgtcg ttgcagaaga ctttgcgcaa cgccctcatc cccacagaaa ctacccagca 9780
gttcattgtg aagaacggaa tcatcaagga agatgaactc cgaggcgaga accgccagat 9840
tttgaaggac atcatggatg attactaccg tggtttcatc tcggaaacgc tctcctccat 9900
tgacgacatc gattggactt cgttgttcga aaagatggaa atccagctca aaaacggcga 9960
taacaaggat accttgatca aggagcagac cgagtatcgg aaggcgatcc ataagaagtt 10020
cgccaacgat gatcggttca agaacatgtt ctcggccaag ttgatttccg acattctccc 10080
cgaattcgtg atccataaca acaactactc ggcgtcggag aaggaggaga agacgcaggt 10140
catcaagttg ttctcgaggt tcgccacatc gttcaaagac tattttaaga atcgtgcgaa 10200
ctgtttctcg gcagatgata tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc 10260
ggaaatcttc ttctcgaacg cgttggtgta taggcgcatc gtgaagtccc tctccaacga 10320
tgacatcaac aaaatctcgg gagatatgaa ggattcgctc aaggagatgt cgttggagga 10380
aatctactcc tatgagaagt atggcgagtt cattacgcag gagggcattt ccttctacaa 10440
cgacatttgt ggtaaagtca actcgttcat gaacctctac tgtcagaaaa acaaggagaa 10500
caaaaacctc tataagctcc agaagttgca taagcagatc ctctgtatcg cagacacctc 10560
gtacgaggtc ccttacaagt tcgaatccga tgaggaggtc taccagtccg tcaacggatt 10620
cttggacaac atctcctcga aacacattgt cgagcggctc cgaaagatcg gcgataacta 10680
caacggctac aacttggaca aaatctatat cgtctccaag ttctatgagt ccgtctcgca 10740
gaaaacctat cgtgattggg agactatcaa cactgcgctc gagattcact ataacaacat 10800
cttgcctggt aacggcaaat cgaaagccga caaggtgaag aaggccgtga aaaacgatct 10860
ccagaagtcg atcacagaaa tcaacgaact cgtctcgaac tacaagctct gttcggatga 10920
taacatcaag gcggaaacgt acatccatga aatctcgcat atcttgaaca acttcgaggc 10980
ccaggaactc aaatacaacc ccgagatcca cttggtcgag tcggagctca aagcctcgga 11040
gttgaagaac gtcttggatg tcatcatgaa cgcattccac tggtgttccg tgttcatgac 11100
cgaggaactc gtcgataaag acaacaactt ctacgcggaa ctcgaggaaa tctacgatga 11160
aatctatccc gtgatctccc tctacaacct cgtgcgaaac tacgtcactc agaagcccta 11220
ttccaccaag aagatcaagc tcaacttcgg catccccact ctcgcagacg gttggtcgaa 11280
gtcgaaggag tactccaaca acgccattat cctcatgcga gacaacctct actacttggg 11340
tatcttcaac gcaaagaaca agccggataa gaagatcatt gaaggcaaca cttcggaaaa 11400
caagggagac tataagaaga tgatctacaa cctcctccct ggacccaaca agatgattcc 11460
taaagtgttc ctctcgtcga agactggtgt ggaaacgtat aagccgtcgg cctacatctt 11520
ggagggctac aaacagaaca agcatatcaa gtcctcgaag gacttcgaca tcactttctg 11580
tcacgacctc atcgactatt tcaagaactg tattgcaatc catccggaat ggaagaactt 11640
cggcttcgat ttctcggata cttcgacata cgaagatatc tcgggattct accgagaggt 11700
cgaattgcag ggctataaga ttgattggac ctacatctcg gaaaaggata tcgacttgct 11760
ccaggaaaag ggccagctct acctcttcca gatttacaac aaggacttct ccaagaagtc 11820
gacgggtaac gacaacttgc acacaatgta tctcaaaaac ctcttctcgg aggagaactt 11880
gaaggatatc gtgctcaaat tgaacggaga ggccgaaatc ttcttccgta agtcctccat 11940
caagaacccg atcatccata agaagggatc gatcttggtc aaccggactt acgaagcaga 12000
ggaaaaagat cagttcggaa acatccagat tgtcaggaag aacatccctg aaaacatcta 12060
tcaggagttg tataagtact tcaacgacaa gtcggataag gagctctccg acgaagcagc 12120
caaactcaag aacgtcgtcg gacaccatga agcagcaacc aacattgtga aggactaccg 12180
gtacacttac gacaagtact tcttgcacat gccgatcact atcaacttca aagccaacaa 12240
gaccggattc attaacgaca ggatcctcca gtacattgcc aaagaaaagg acctccatgt 12300
catcggtatc gataggggag aacggaacct catctacgtc tccgtgattg acacttgtgg 12360
caacattgtc gaacagaagt cgttcaacat cgtcaacggt tacgattacc agattaagtt 12420
gaaacagcag gaaggtgcga ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat 12480
caaggagatt aaggaaggct acttgtcgtt ggtcatccac gaaatctcga aaatggtgat 12540
caaatacaac gccatcatcg ccatggaaga cctctcgtac ggcttcaaaa agggacggtt 12600
caaagtggag cgtcaggtgt accagaagtt cgaaacaatg ttgatcaaca agttgaacta 12660
cttggtgttc aaggacattt ccattaccga gaacggagga ttgctcaagg gttatcagct 12720
cacgtacatc cccgacaagt tgaaaaacgt gggacaccag tgtggctgta tcttctacgt 12780
gcctgcagcc tacacgtcga aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt 12840
caaggatctc accgtcgacg cgaagcggga gttcatcaaa aagttcgact ccatccgcta 12900
tgattcggag aagaacttgt tctgtttcac attcgactac aacaacttca ttactcagaa 12960
caccgtgatg tccaaatcgt cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg 13020
cttcgtcaac ggtcgcttct ccaacgaatc ggacacgatc gatatcacga aagacatgga 13080
gaaaacattg gaaatgaccg acatcaactg gcgtgacggc catgacctca ggcaggacat 13140
catcgattac gagatcgtcc agcacatctt cgaaatcttc cgtctcaccg tgcagatgag 13200
gaactccctc tccgagctcg aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa 13260
cgagaacaac atcttctacg actcggcaaa agcgggagat gcattgccga aggacgccga 13320
tgcgaacggt gcatattgta ttgcactcaa gggtctctac gaaatcaagc agatcaccga 13380
aaactggaag gaggacggca aattctcgag ggacaagttg aagatttcga acaaggattg 13440
gttcgatttc atccagaaca agaggtactt gcctccgaag aagaagcgaa aggtgtgagc 13500
ggacattcga tttatgccgt tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg 13560
gaattagact tgttatgtag ttgattctac aatggattat gattcctgaa cttcaaatcc 13620
gctgttcatt attaatctca gctcttcccg taaagccaat gttgaaacta ttcgtaaatg 13680
tacctcgttt tgcgtgtacc ttgcttatca cgtgatatta catgacctgg acagagttct 13740
gcgcgaaagt cataacgtaa atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt 13800
ctcgtccacc ccaacgcgtt tatcaacctc aactttcaac aaccatcatg ccaccaaaag 13860
cgcgtaaaac aaagcgagat ttgattgagc aagagggcag gatggcgtaa tcatggtcat 13920
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 13980
gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 14040
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 14100
aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 14160
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 14220
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 14280
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 14340
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 14400
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 14460
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 14520
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 14580
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 14640
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 14700
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 14760
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 14820
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 14880
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 14940
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 15000
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 15060
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 15120
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 15180
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 15240
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 15300
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 15360
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 15420
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 15480
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 15540
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 15600
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 15660
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 15720
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 15780
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 15840
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 15900
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 15960
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 16020
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 16080
ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg 16140
cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 16200
cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 16260
gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg agagtgcacc 16320
atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggc 16374
<210> 53
<211> 16374
<212> DNA
<213> 人工序列
<220>
<223> 质粒pGMEr263proto2
<400> 53
gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120
ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180
ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240
ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300
agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360
tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420
ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480
tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540
accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600
gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660
ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720
atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780
cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840
gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900
acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960
aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020
gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080
gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140
gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200
taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260
catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320
gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380
tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440
ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500
gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560
tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620
gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680
gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740
cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800
tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860
ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920
actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980
cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040
agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100
tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160
taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220
tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280
cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340
caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400
gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460
tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520
taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580
tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640
tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700
ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760
atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820
actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880
gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940
ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000
gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060
aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120
gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180
ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240
caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300
gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360
aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420
taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480
acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540
tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600
tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660
actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720
aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780
ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840
aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900
gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960
gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020
aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080
ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140
gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200
gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260
tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320
aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380
aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440
aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500
gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560
tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620
ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680
tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740
caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800
gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860
gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920
gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980
gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040
aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100
cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160
aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220
actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280
ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340
tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400
agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460
taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520
tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580
gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640
caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700
gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760
tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820
agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880
gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940
ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000
tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060
cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120
tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180
cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240
ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300
atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360
catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420
gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500
aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560
ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620
cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680
ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740
ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800
cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860
tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920
tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980
tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040
gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100
tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160
actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220
ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280
atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340
gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400
gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460
aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520
tcgattcacg gatgatgcag gaatttctac tcttgtagat gcgaggccat ccgcctggcg 8580
ctttttttgg ctcttgggtt cgaactgccc aaggcccatg ttttggtcat cttttttttt 8640
atgccccacc atttgggtca cccctgccaa tcattccatc tttgttccta cccttcacgt 8700
gtgctttccg aagccaaagt tcccattcaa caactctcct tgcgtttttt ttttcttgaa 8760
gcttgtcacc cgtcgatagt ttctgccatt tgcaatcgag acagcagaat caccgcccaa 8820
gttaagcctt tgtgctgatc atgctctcga acgggccaag ttcgggaaaa gcaaaggagc 8880
gtttagtgag gggcaatttg actcacctcc caggcaacag atgagggggg caaaaagaaa 8940
gaaattttcg tgagtcaata tggattccga gcatcatttt cttgcggtct atcttgctac 9000
gtatgttgat cttgacgctg tggatcaagc aacgccactc gctcgctcca tcgcaggctg 9060
gtcgcagaca aattaaaagg cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt 9120
acagagtgat aaaagccgcc atgcgaccat caacgcgttg atgcccagct ttttcgatcc 9180
gagaatccac cgtagaggcg atagcaagta aagaaaagct aaacaaaaaa aaatttctgc 9240
ccctaagcca tgaaaacgag atggggtgga gcagaaccaa ggaaagagtc gcgctgggct 9300
gccgttccgg aaggtgttgt aaaggctcga cgcccaaggt gggagtctag gagaagaatt 9360
tgcatcggga gtggggcggg ttacccctcc atatccaatg acagatatct accagccaag 9420
ggtttgagcc cgcccgctta gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc 9480
tccccctccc acaaaatttt ctttcccttc ctctccttgt ccgcttcagt acgtatatct 9540
tcccttccct cgcttctctc ctccatcctt ctttcatcca tctcctgcta acttctctgc 9600
tcagcacctc tacgcattac tagccgtagt atctgagcac ttctcccttt tatattccac 9660
aaaacataac acaaccttca ccatgaacaa cggcacaaac aacttccaga acttcattgg 9720
aatctcgtcg ttgcagaaga ctttgcgcaa cgccctcatc cccacagaaa ctacccagca 9780
gttcattgtg aagaacggaa tcatcaagga agatgaactc cgaggcgaga accgccagat 9840
tttgaaggac atcatggatg attactaccg tggtttcatc tcggaaacgc tctcctccat 9900
tgacgacatc gattggactt cgttgttcga aaagatggaa atccagctca aaaacggcga 9960
taacaaggat accttgatca aggagcagac cgagtatcgg aaggcgatcc ataagaagtt 10020
cgccaacgat gatcggttca agaacatgtt ctcggccaag ttgatttccg acattctccc 10080
cgaattcgtg atccataaca acaactactc ggcgtcggag aaggaggaga agacgcaggt 10140
catcaagttg ttctcgaggt tcgccacatc gttcaaagac tattttaaga atcgtgcgaa 10200
ctgtttctcg gcagatgata tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc 10260
ggaaatcttc ttctcgaacg cgttggtgta taggcgcatc gtgaagtccc tctccaacga 10320
tgacatcaac aaaatctcgg gagatatgaa ggattcgctc aaggagatgt cgttggagga 10380
aatctactcc tatgagaagt atggcgagtt cattacgcag gagggcattt ccttctacaa 10440
cgacatttgt ggtaaagtca actcgttcat gaacctctac tgtcagaaaa acaaggagaa 10500
caaaaacctc tataagctcc agaagttgca taagcagatc ctctgtatcg cagacacctc 10560
gtacgaggtc ccttacaagt tcgaatccga tgaggaggtc taccagtccg tcaacggatt 10620
cttggacaac atctcctcga aacacattgt cgagcggctc cgaaagatcg gcgataacta 10680
caacggctac aacttggaca aaatctatat cgtctccaag ttctatgagt ccgtctcgca 10740
gaaaacctat cgtgattggg agactatcaa cactgcgctc gagattcact ataacaacat 10800
cttgcctggt aacggcaaat cgaaagccga caaggtgaag aaggccgtga aaaacgatct 10860
ccagaagtcg atcacagaaa tcaacgaact cgtctcgaac tacaagctct gttcggatga 10920
taacatcaag gcggaaacgt acatccatga aatctcgcat atcttgaaca acttcgaggc 10980
ccaggaactc aaatacaacc ccgagatcca cttggtcgag tcggagctca aagcctcgga 11040
gttgaagaac gtcttggatg tcatcatgaa cgcattccac tggtgttccg tgttcatgac 11100
cgaggaactc gtcgataaag acaacaactt ctacgcggaa ctcgaggaaa tctacgatga 11160
aatctatccc gtgatctccc tctacaacct cgtgcgaaac tacgtcactc agaagcccta 11220
ttccaccaag aagatcaagc tcaacttcgg catccccact ctcgcagacg gttggtcgaa 11280
gtcgaaggag tactccaaca acgccattat cctcatgcga gacaacctct actacttggg 11340
tatcttcaac gcaaagaaca agccggataa gaagatcatt gaaggcaaca cttcggaaaa 11400
caagggagac tataagaaga tgatctacaa cctcctccct ggacccaaca agatgattcc 11460
taaagtgttc ctctcgtcga agactggtgt ggaaacgtat aagccgtcgg cctacatctt 11520
ggagggctac aaacagaaca agcatatcaa gtcctcgaag gacttcgaca tcactttctg 11580
tcacgacctc atcgactatt tcaagaactg tattgcaatc catccggaat ggaagaactt 11640
cggcttcgat ttctcggata cttcgacata cgaagatatc tcgggattct accgagaggt 11700
cgaattgcag ggctataaga ttgattggac ctacatctcg gaaaaggata tcgacttgct 11760
ccaggaaaag ggccagctct acctcttcca gatttacaac aaggacttct ccaagaagtc 11820
gacgggtaac gacaacttgc acacaatgta tctcaaaaac ctcttctcgg aggagaactt 11880
gaaggatatc gtgctcaaat tgaacggaga ggccgaaatc ttcttccgta agtcctccat 11940
caagaacccg atcatccata agaagggatc gatcttggtc aaccggactt acgaagcaga 12000
ggaaaaagat cagttcggaa acatccagat tgtcaggaag aacatccctg aaaacatcta 12060
tcaggagttg tataagtact tcaacgacaa gtcggataag gagctctccg acgaagcagc 12120
caaactcaag aacgtcgtcg gacaccatga agcagcaacc aacattgtga aggactaccg 12180
gtacacttac gacaagtact tcttgcacat gccgatcact atcaacttca aagccaacaa 12240
gaccggattc attaacgaca ggatcctcca gtacattgcc aaagaaaagg acctccatgt 12300
catcggtatc gataggggag aacggaacct catctacgtc tccgtgattg acacttgtgg 12360
caacattgtc gaacagaagt cgttcaacat cgtcaacggt tacgattacc agattaagtt 12420
gaaacagcag gaaggtgcga ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat 12480
caaggagatt aaggaaggct acttgtcgtt ggtcatccac gaaatctcga aaatggtgat 12540
caaatacaac gccatcatcg ccatggaaga cctctcgtac ggcttcaaaa agggacggtt 12600
caaagtggag cgtcaggtgt accagaagtt cgaaacaatg ttgatcaaca agttgaacta 12660
cttggtgttc aaggacattt ccattaccga gaacggagga ttgctcaagg gttatcagct 12720
cacgtacatc cccgacaagt tgaaaaacgt gggacaccag tgtggctgta tcttctacgt 12780
gcctgcagcc tacacgtcga aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt 12840
caaggatctc accgtcgacg cgaagcggga gttcatcaaa aagttcgact ccatccgcta 12900
tgattcggag aagaacttgt tctgtttcac attcgactac aacaacttca ttactcagaa 12960
caccgtgatg tccaaatcgt cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg 13020
cttcgtcaac ggtcgcttct ccaacgaatc ggacacgatc gatatcacga aagacatgga 13080
gaaaacattg gaaatgaccg acatcaactg gcgtgacggc catgacctca ggcaggacat 13140
catcgattac gagatcgtcc agcacatctt cgaaatcttc cgtctcaccg tgcagatgag 13200
gaactccctc tccgagctcg aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa 13260
cgagaacaac atcttctacg actcggcaaa agcgggagat gcattgccga aggacgccga 13320
tgcgaacggt gcatattgta ttgcactcaa gggtctctac gaaatcaagc agatcaccga 13380
aaactggaag gaggacggca aattctcgag ggacaagttg aagatttcga acaaggattg 13440
gttcgatttc atccagaaca agaggtactt gcctccgaag aagaagcgaa aggtgtgagc 13500
ggacattcga tttatgccgt tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg 13560
gaattagact tgttatgtag ttgattctac aatggattat gattcctgaa cttcaaatcc 13620
gctgttcatt attaatctca gctcttcccg taaagccaat gttgaaacta ttcgtaaatg 13680
tacctcgttt tgcgtgtacc ttgcttatca cgtgatatta catgacctgg acagagttct 13740
gcgcgaaagt cataacgtaa atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt 13800
ctcgtccacc ccaacgcgtt tatcaacctc aactttcaac aaccatcatg ccaccaaaag 13860
cgcgtaaaac aaagcgagat ttgattgagc aagagggcag gatggcgtaa tcatggtcat 13920
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 13980
gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 14040
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 14100
aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 14160
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 14220
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 14280
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 14340
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 14400
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 14460
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 14520
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 14580
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 14640
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 14700
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 14760
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 14820
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 14880
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 14940
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 15000
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 15060
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 15120
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 15180
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 15240
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 15300
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 15360
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 15420
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 15480
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 15540
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 15600
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 15660
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 15720
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 15780
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 15840
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 15900
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 15960
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 16020
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 16080
ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg 16140
cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 16200
cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 16260
gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg agagtgcacc 16320
atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggc 16374
<210> 54
<211> 16374
<212> DNA
<213> 人工序列
<220>
<223> 质粒pGMEr263proto3
<400> 54
gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120
ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180
ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240
ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300
agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360
tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420
ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480
tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540
accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600
gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660
ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720
atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780
cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840
gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900
acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960
aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020
gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080
gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140
gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200
taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260
catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320
gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380
tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440
ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500
gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560
tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620
gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680
gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740
cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800
tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860
ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920
actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980
cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040
agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100
tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160
taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220
tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280
cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340
caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400
gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460
tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520
taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580
tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640
tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700
ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760
atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820
actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880
gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940
ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000
gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060
aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120
gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180
ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240
caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300
gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360
aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420
taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480
acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540
tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600
tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660
actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720
aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780
ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840
aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900
gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960
gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020
aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080
ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140
gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200
gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260
tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320
aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380
aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440
aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500
gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560
tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620
ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680
tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740
caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800
gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860
gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920
gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980
gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040
aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100
cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160
aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220
actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280
ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340
tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400
agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460
taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520
tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580
gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640
caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700
gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760
tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820
agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880
gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940
ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000
tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060
cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120
tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180
cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240
ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300
atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360
catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420
gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500
aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560
ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620
cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680
ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740
ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800
cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860
tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920
tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980
tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040
gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100
tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160
actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220
ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280
atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340
gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400
gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460
aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520
tcgattcacg gatgatgcag gaatttctac tcttgtagat ccccgaagga gaatccgtct 8580
ctttttttgg ctcttgggtt cgaactgccc aaggcccatg ttttggtcat cttttttttt 8640
atgccccacc atttgggtca cccctgccaa tcattccatc tttgttccta cccttcacgt 8700
gtgctttccg aagccaaagt tcccattcaa caactctcct tgcgtttttt ttttcttgaa 8760
gcttgtcacc cgtcgatagt ttctgccatt tgcaatcgag acagcagaat caccgcccaa 8820
gttaagcctt tgtgctgatc atgctctcga acgggccaag ttcgggaaaa gcaaaggagc 8880
gtttagtgag gggcaatttg actcacctcc caggcaacag atgagggggg caaaaagaaa 8940
gaaattttcg tgagtcaata tggattccga gcatcatttt cttgcggtct atcttgctac 9000
gtatgttgat cttgacgctg tggatcaagc aacgccactc gctcgctcca tcgcaggctg 9060
gtcgcagaca aattaaaagg cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt 9120
acagagtgat aaaagccgcc atgcgaccat caacgcgttg atgcccagct ttttcgatcc 9180
gagaatccac cgtagaggcg atagcaagta aagaaaagct aaacaaaaaa aaatttctgc 9240
ccctaagcca tgaaaacgag atggggtgga gcagaaccaa ggaaagagtc gcgctgggct 9300
gccgttccgg aaggtgttgt aaaggctcga cgcccaaggt gggagtctag gagaagaatt 9360
tgcatcggga gtggggcggg ttacccctcc atatccaatg acagatatct accagccaag 9420
ggtttgagcc cgcccgctta gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc 9480
tccccctccc acaaaatttt ctttcccttc ctctccttgt ccgcttcagt acgtatatct 9540
tcccttccct cgcttctctc ctccatcctt ctttcatcca tctcctgcta acttctctgc 9600
tcagcacctc tacgcattac tagccgtagt atctgagcac ttctcccttt tatattccac 9660
aaaacataac acaaccttca ccatgaacaa cggcacaaac aacttccaga acttcattgg 9720
aatctcgtcg ttgcagaaga ctttgcgcaa cgccctcatc cccacagaaa ctacccagca 9780
gttcattgtg aagaacggaa tcatcaagga agatgaactc cgaggcgaga accgccagat 9840
tttgaaggac atcatggatg attactaccg tggtttcatc tcggaaacgc tctcctccat 9900
tgacgacatc gattggactt cgttgttcga aaagatggaa atccagctca aaaacggcga 9960
taacaaggat accttgatca aggagcagac cgagtatcgg aaggcgatcc ataagaagtt 10020
cgccaacgat gatcggttca agaacatgtt ctcggccaag ttgatttccg acattctccc 10080
cgaattcgtg atccataaca acaactactc ggcgtcggag aaggaggaga agacgcaggt 10140
catcaagttg ttctcgaggt tcgccacatc gttcaaagac tattttaaga atcgtgcgaa 10200
ctgtttctcg gcagatgata tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc 10260
ggaaatcttc ttctcgaacg cgttggtgta taggcgcatc gtgaagtccc tctccaacga 10320
tgacatcaac aaaatctcgg gagatatgaa ggattcgctc aaggagatgt cgttggagga 10380
aatctactcc tatgagaagt atggcgagtt cattacgcag gagggcattt ccttctacaa 10440
cgacatttgt ggtaaagtca actcgttcat gaacctctac tgtcagaaaa acaaggagaa 10500
caaaaacctc tataagctcc agaagttgca taagcagatc ctctgtatcg cagacacctc 10560
gtacgaggtc ccttacaagt tcgaatccga tgaggaggtc taccagtccg tcaacggatt 10620
cttggacaac atctcctcga aacacattgt cgagcggctc cgaaagatcg gcgataacta 10680
caacggctac aacttggaca aaatctatat cgtctccaag ttctatgagt ccgtctcgca 10740
gaaaacctat cgtgattggg agactatcaa cactgcgctc gagattcact ataacaacat 10800
cttgcctggt aacggcaaat cgaaagccga caaggtgaag aaggccgtga aaaacgatct 10860
ccagaagtcg atcacagaaa tcaacgaact cgtctcgaac tacaagctct gttcggatga 10920
taacatcaag gcggaaacgt acatccatga aatctcgcat atcttgaaca acttcgaggc 10980
ccaggaactc aaatacaacc ccgagatcca cttggtcgag tcggagctca aagcctcgga 11040
gttgaagaac gtcttggatg tcatcatgaa cgcattccac tggtgttccg tgttcatgac 11100
cgaggaactc gtcgataaag acaacaactt ctacgcggaa ctcgaggaaa tctacgatga 11160
aatctatccc gtgatctccc tctacaacct cgtgcgaaac tacgtcactc agaagcccta 11220
ttccaccaag aagatcaagc tcaacttcgg catccccact ctcgcagacg gttggtcgaa 11280
gtcgaaggag tactccaaca acgccattat cctcatgcga gacaacctct actacttggg 11340
tatcttcaac gcaaagaaca agccggataa gaagatcatt gaaggcaaca cttcggaaaa 11400
caagggagac tataagaaga tgatctacaa cctcctccct ggacccaaca agatgattcc 11460
taaagtgttc ctctcgtcga agactggtgt ggaaacgtat aagccgtcgg cctacatctt 11520
ggagggctac aaacagaaca agcatatcaa gtcctcgaag gacttcgaca tcactttctg 11580
tcacgacctc atcgactatt tcaagaactg tattgcaatc catccggaat ggaagaactt 11640
cggcttcgat ttctcggata cttcgacata cgaagatatc tcgggattct accgagaggt 11700
cgaattgcag ggctataaga ttgattggac ctacatctcg gaaaaggata tcgacttgct 11760
ccaggaaaag ggccagctct acctcttcca gatttacaac aaggacttct ccaagaagtc 11820
gacgggtaac gacaacttgc acacaatgta tctcaaaaac ctcttctcgg aggagaactt 11880
gaaggatatc gtgctcaaat tgaacggaga ggccgaaatc ttcttccgta agtcctccat 11940
caagaacccg atcatccata agaagggatc gatcttggtc aaccggactt acgaagcaga 12000
ggaaaaagat cagttcggaa acatccagat tgtcaggaag aacatccctg aaaacatcta 12060
tcaggagttg tataagtact tcaacgacaa gtcggataag gagctctccg acgaagcagc 12120
caaactcaag aacgtcgtcg gacaccatga agcagcaacc aacattgtga aggactaccg 12180
gtacacttac gacaagtact tcttgcacat gccgatcact atcaacttca aagccaacaa 12240
gaccggattc attaacgaca ggatcctcca gtacattgcc aaagaaaagg acctccatgt 12300
catcggtatc gataggggag aacggaacct catctacgtc tccgtgattg acacttgtgg 12360
caacattgtc gaacagaagt cgttcaacat cgtcaacggt tacgattacc agattaagtt 12420
gaaacagcag gaaggtgcga ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat 12480
caaggagatt aaggaaggct acttgtcgtt ggtcatccac gaaatctcga aaatggtgat 12540
caaatacaac gccatcatcg ccatggaaga cctctcgtac ggcttcaaaa agggacggtt 12600
caaagtggag cgtcaggtgt accagaagtt cgaaacaatg ttgatcaaca agttgaacta 12660
cttggtgttc aaggacattt ccattaccga gaacggagga ttgctcaagg gttatcagct 12720
cacgtacatc cccgacaagt tgaaaaacgt gggacaccag tgtggctgta tcttctacgt 12780
gcctgcagcc tacacgtcga aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt 12840
caaggatctc accgtcgacg cgaagcggga gttcatcaaa aagttcgact ccatccgcta 12900
tgattcggag aagaacttgt tctgtttcac attcgactac aacaacttca ttactcagaa 12960
caccgtgatg tccaaatcgt cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg 13020
cttcgtcaac ggtcgcttct ccaacgaatc ggacacgatc gatatcacga aagacatgga 13080
gaaaacattg gaaatgaccg acatcaactg gcgtgacggc catgacctca ggcaggacat 13140
catcgattac gagatcgtcc agcacatctt cgaaatcttc cgtctcaccg tgcagatgag 13200
gaactccctc tccgagctcg aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa 13260
cgagaacaac atcttctacg actcggcaaa agcgggagat gcattgccga aggacgccga 13320
tgcgaacggt gcatattgta ttgcactcaa gggtctctac gaaatcaagc agatcaccga 13380
aaactggaag gaggacggca aattctcgag ggacaagttg aagatttcga acaaggattg 13440
gttcgatttc atccagaaca agaggtactt gcctccgaag aagaagcgaa aggtgtgagc 13500
ggacattcga tttatgccgt tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg 13560
gaattagact tgttatgtag ttgattctac aatggattat gattcctgaa cttcaaatcc 13620
gctgttcatt attaatctca gctcttcccg taaagccaat gttgaaacta ttcgtaaatg 13680
tacctcgttt tgcgtgtacc ttgcttatca cgtgatatta catgacctgg acagagttct 13740
gcgcgaaagt cataacgtaa atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt 13800
ctcgtccacc ccaacgcgtt tatcaacctc aactttcaac aaccatcatg ccaccaaaag 13860
cgcgtaaaac aaagcgagat ttgattgagc aagagggcag gatggcgtaa tcatggtcat 13920
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 13980
gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 14040
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 14100
aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 14160
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 14220
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 14280
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 14340
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 14400
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 14460
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 14520
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 14580
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 14640
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 14700
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 14760
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 14820
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 14880
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 14940
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 15000
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 15060
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 15120
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 15180
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 15240
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 15300
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 15360
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 15420
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 15480
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 15540
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 15600
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 15660
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 15720
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 15780
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 15840
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 15900
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 15960
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 16020
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 16080
ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg 16140
cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 16200
cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 16260
gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg agagtgcacc 16320
atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggc 16374
<210> 55
<211> 16374
<212> DNA
<213> 人工序列
<220>
<223> 质粒pGMEr263proto4
<400> 55
gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120
ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180
ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240
ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300
agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360
tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420
ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480
tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540
accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600
gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660
ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720
atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780
cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840
gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900
acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960
aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020
gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080
gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140
gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200
taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260
catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320
gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380
tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440
ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500
gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560
tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620
gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680
gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740
cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800
tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860
ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920
actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980
cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040
agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100
tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160
taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220
tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280
cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340
caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400
gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460
tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520
taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580
tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640
tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700
ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760
atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820
actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880
gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940
ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000
gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060
aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120
gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180
ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240
caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300
gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360
aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420
taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480
acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540
tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600
tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660
actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720
aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780
ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840
aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900
gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960
gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020
aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080
ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140
gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200
gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260
tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320
aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380
aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440
aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500
gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560
tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620
ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680
tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740
caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800
gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860
gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920
gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980
gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040
aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100
cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160
aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220
actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280
ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340
tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400
agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460
taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520
tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580
gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640
caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700
gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760
tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820
agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880
gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940
ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000
tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060
cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120
tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180
cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240
ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300
atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360
catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420
gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500
aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560
ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620
cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680
ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740
ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800
cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860
tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920
tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980
tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040
gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100
tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160
actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220
ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280
atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340
gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400
gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460
aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520
tcgattcacg gatgatgcag gaatttctac tcttgtagat tgcgtaatta ccatgcgcag 8580
atttttttgg ctcttgggtt cgaactgccc aaggcccatg ttttggtcat cttttttttt 8640
atgccccacc atttgggtca cccctgccaa tcattccatc tttgttccta cccttcacgt 8700
gtgctttccg aagccaaagt tcccattcaa caactctcct tgcgtttttt ttttcttgaa 8760
gcttgtcacc cgtcgatagt ttctgccatt tgcaatcgag acagcagaat caccgcccaa 8820
gttaagcctt tgtgctgatc atgctctcga acgggccaag ttcgggaaaa gcaaaggagc 8880
gtttagtgag gggcaatttg actcacctcc caggcaacag atgagggggg caaaaagaaa 8940
gaaattttcg tgagtcaata tggattccga gcatcatttt cttgcggtct atcttgctac 9000
gtatgttgat cttgacgctg tggatcaagc aacgccactc gctcgctcca tcgcaggctg 9060
gtcgcagaca aattaaaagg cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt 9120
acagagtgat aaaagccgcc atgcgaccat caacgcgttg atgcccagct ttttcgatcc 9180
gagaatccac cgtagaggcg atagcaagta aagaaaagct aaacaaaaaa aaatttctgc 9240
ccctaagcca tgaaaacgag atggggtgga gcagaaccaa ggaaagagtc gcgctgggct 9300
gccgttccgg aaggtgttgt aaaggctcga cgcccaaggt gggagtctag gagaagaatt 9360
tgcatcggga gtggggcggg ttacccctcc atatccaatg acagatatct accagccaag 9420
ggtttgagcc cgcccgctta gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc 9480
tccccctccc acaaaatttt ctttcccttc ctctccttgt ccgcttcagt acgtatatct 9540
tcccttccct cgcttctctc ctccatcctt ctttcatcca tctcctgcta acttctctgc 9600
tcagcacctc tacgcattac tagccgtagt atctgagcac ttctcccttt tatattccac 9660
aaaacataac acaaccttca ccatgaacaa cggcacaaac aacttccaga acttcattgg 9720
aatctcgtcg ttgcagaaga ctttgcgcaa cgccctcatc cccacagaaa ctacccagca 9780
gttcattgtg aagaacggaa tcatcaagga agatgaactc cgaggcgaga accgccagat 9840
tttgaaggac atcatggatg attactaccg tggtttcatc tcggaaacgc tctcctccat 9900
tgacgacatc gattggactt cgttgttcga aaagatggaa atccagctca aaaacggcga 9960
taacaaggat accttgatca aggagcagac cgagtatcgg aaggcgatcc ataagaagtt 10020
cgccaacgat gatcggttca agaacatgtt ctcggccaag ttgatttccg acattctccc 10080
cgaattcgtg atccataaca acaactactc ggcgtcggag aaggaggaga agacgcaggt 10140
catcaagttg ttctcgaggt tcgccacatc gttcaaagac tattttaaga atcgtgcgaa 10200
ctgtttctcg gcagatgata tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc 10260
ggaaatcttc ttctcgaacg cgttggtgta taggcgcatc gtgaagtccc tctccaacga 10320
tgacatcaac aaaatctcgg gagatatgaa ggattcgctc aaggagatgt cgttggagga 10380
aatctactcc tatgagaagt atggcgagtt cattacgcag gagggcattt ccttctacaa 10440
cgacatttgt ggtaaagtca actcgttcat gaacctctac tgtcagaaaa acaaggagaa 10500
caaaaacctc tataagctcc agaagttgca taagcagatc ctctgtatcg cagacacctc 10560
gtacgaggtc ccttacaagt tcgaatccga tgaggaggtc taccagtccg tcaacggatt 10620
cttggacaac atctcctcga aacacattgt cgagcggctc cgaaagatcg gcgataacta 10680
caacggctac aacttggaca aaatctatat cgtctccaag ttctatgagt ccgtctcgca 10740
gaaaacctat cgtgattggg agactatcaa cactgcgctc gagattcact ataacaacat 10800
cttgcctggt aacggcaaat cgaaagccga caaggtgaag aaggccgtga aaaacgatct 10860
ccagaagtcg atcacagaaa tcaacgaact cgtctcgaac tacaagctct gttcggatga 10920
taacatcaag gcggaaacgt acatccatga aatctcgcat atcttgaaca acttcgaggc 10980
ccaggaactc aaatacaacc ccgagatcca cttggtcgag tcggagctca aagcctcgga 11040
gttgaagaac gtcttggatg tcatcatgaa cgcattccac tggtgttccg tgttcatgac 11100
cgaggaactc gtcgataaag acaacaactt ctacgcggaa ctcgaggaaa tctacgatga 11160
aatctatccc gtgatctccc tctacaacct cgtgcgaaac tacgtcactc agaagcccta 11220
ttccaccaag aagatcaagc tcaacttcgg catccccact ctcgcagacg gttggtcgaa 11280
gtcgaaggag tactccaaca acgccattat cctcatgcga gacaacctct actacttggg 11340
tatcttcaac gcaaagaaca agccggataa gaagatcatt gaaggcaaca cttcggaaaa 11400
caagggagac tataagaaga tgatctacaa cctcctccct ggacccaaca agatgattcc 11460
taaagtgttc ctctcgtcga agactggtgt ggaaacgtat aagccgtcgg cctacatctt 11520
ggagggctac aaacagaaca agcatatcaa gtcctcgaag gacttcgaca tcactttctg 11580
tcacgacctc atcgactatt tcaagaactg tattgcaatc catccggaat ggaagaactt 11640
cggcttcgat ttctcggata cttcgacata cgaagatatc tcgggattct accgagaggt 11700
cgaattgcag ggctataaga ttgattggac ctacatctcg gaaaaggata tcgacttgct 11760
ccaggaaaag ggccagctct acctcttcca gatttacaac aaggacttct ccaagaagtc 11820
gacgggtaac gacaacttgc acacaatgta tctcaaaaac ctcttctcgg aggagaactt 11880
gaaggatatc gtgctcaaat tgaacggaga ggccgaaatc ttcttccgta agtcctccat 11940
caagaacccg atcatccata agaagggatc gatcttggtc aaccggactt acgaagcaga 12000
ggaaaaagat cagttcggaa acatccagat tgtcaggaag aacatccctg aaaacatcta 12060
tcaggagttg tataagtact tcaacgacaa gtcggataag gagctctccg acgaagcagc 12120
caaactcaag aacgtcgtcg gacaccatga agcagcaacc aacattgtga aggactaccg 12180
gtacacttac gacaagtact tcttgcacat gccgatcact atcaacttca aagccaacaa 12240
gaccggattc attaacgaca ggatcctcca gtacattgcc aaagaaaagg acctccatgt 12300
catcggtatc gataggggag aacggaacct catctacgtc tccgtgattg acacttgtgg 12360
caacattgtc gaacagaagt cgttcaacat cgtcaacggt tacgattacc agattaagtt 12420
gaaacagcag gaaggtgcga ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat 12480
caaggagatt aaggaaggct acttgtcgtt ggtcatccac gaaatctcga aaatggtgat 12540
caaatacaac gccatcatcg ccatggaaga cctctcgtac ggcttcaaaa agggacggtt 12600
caaagtggag cgtcaggtgt accagaagtt cgaaacaatg ttgatcaaca agttgaacta 12660
cttggtgttc aaggacattt ccattaccga gaacggagga ttgctcaagg gttatcagct 12720
cacgtacatc cccgacaagt tgaaaaacgt gggacaccag tgtggctgta tcttctacgt 12780
gcctgcagcc tacacgtcga aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt 12840
caaggatctc accgtcgacg cgaagcggga gttcatcaaa aagttcgact ccatccgcta 12900
tgattcggag aagaacttgt tctgtttcac attcgactac aacaacttca ttactcagaa 12960
caccgtgatg tccaaatcgt cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg 13020
cttcgtcaac ggtcgcttct ccaacgaatc ggacacgatc gatatcacga aagacatgga 13080
gaaaacattg gaaatgaccg acatcaactg gcgtgacggc catgacctca ggcaggacat 13140
catcgattac gagatcgtcc agcacatctt cgaaatcttc cgtctcaccg tgcagatgag 13200
gaactccctc tccgagctcg aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa 13260
cgagaacaac atcttctacg actcggcaaa agcgggagat gcattgccga aggacgccga 13320
tgcgaacggt gcatattgta ttgcactcaa gggtctctac gaaatcaagc agatcaccga 13380
aaactggaag gaggacggca aattctcgag ggacaagttg aagatttcga acaaggattg 13440
gttcgatttc atccagaaca agaggtactt gcctccgaag aagaagcgaa aggtgtgagc 13500
ggacattcga tttatgccgt tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg 13560
gaattagact tgttatgtag ttgattctac aatggattat gattcctgaa cttcaaatcc 13620
gctgttcatt attaatctca gctcttcccg taaagccaat gttgaaacta ttcgtaaatg 13680
tacctcgttt tgcgtgtacc ttgcttatca cgtgatatta catgacctgg acagagttct 13740
gcgcgaaagt cataacgtaa atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt 13800
ctcgtccacc ccaacgcgtt tatcaacctc aactttcaac aaccatcatg ccaccaaaag 13860
cgcgtaaaac aaagcgagat ttgattgagc aagagggcag gatggcgtaa tcatggtcat 13920
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 13980
gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 14040
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 14100
aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 14160
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 14220
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 14280
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 14340
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 14400
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 14460
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 14520
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 14580
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 14640
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 14700
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 14760
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 14820
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 14880
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 14940
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 15000
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 15060
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 15120
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 15180
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 15240
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 15300
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 15360
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 15420
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 15480
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 15540
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 15600
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 15660
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 15720
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 15780
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 15840
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 15900
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 15960
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 16020
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 16080
ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg 16140
cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 16200
cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 16260
gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg agagtgcacc 16320
atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggc 16374
<210> 56
<211> 16374
<212> DNA
<213> 人工序列
<220>
<223> 质粒pGMEr263proto5
<400> 56
gccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc 60
tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag 120
ggttttccca gtcacgacgt tgtaaaacga cggccagtga attcgagctc ggtacccggg 180
ctaattatgg ggtgtcgccc ttattcgact ctatagtgaa gttcctattc tctagaaagt 240
ataggaactt ctgaagtggg gatttaaatg cggccgcgct gagggtttaa tcgacgaagc 300
agctgacggc cagtgccaag cttaacgcgt accgggccca gtatatgttc cgcagatgac 360
tggagctctg ccatacgtgc cctctcaagc accatttgtt ccatctacag agactagtca 420
ccaactagtc tatcaagact cacagggtac attgctgaga ccaactgacc agaggcaggg 480
tagcggattg acggctccat ctccttcact tacaaggtct attgaaagcc ctttagcatc 540
accaagcgga gaatagattg ttaagcttat tttttgtata ctgttttgtg atagcacgaa 600
gtttttccac ggtatcttgt aaaaatatat atttgtggcg ggcttaccta catcaaatta 660
ataagagact aattataaac taaacacaca agcaagctac tttagggtaa aagtttataa 720
atgcttttga cgtataaacg ttgcttgtat ttattattac aattaaaggt ggatagaaaa 780
cctagagact agttagaaac taatctcagg tttgcgttaa actaaatcag agcccgagag 840
gttaacagaa cctagaaggg gactagatat ccgggtaggg aaacaaaaaa aaaaaacaag 900
acagccacat attagggaga ctagttagaa gctagttcca ggactaggaa aataaaagac 960
aatgatacca cagtctagtt gacaactaga tagattctag attgaggcca aagtctctga 1020
gatccaggtt agttgcaact aatactagtt agtatctagt ctcctataac tctgaagcta 1080
gaataactta ctactattat cctcaccact gttcagctgc gcaaacggag tgattgcaag 1140
gtgttcagag actagttatt gactagtcag tgactagcaa taactaacaa ggtattaacc 1200
taccatgtct gccatcaccc tgcacttcct cgggctcagc agccttttcc tcctcatttt 1260
catgctcatt ttccttgttt aagactgtga ctagtcaaag actagtccag aaccacaaag 1320
gagaaatgtc ttaccacttt cttcattgct tgtctctttt gcattatcca tgtctgcaac 1380
tagttagagt ctagttagtg actagtccga cgaggacttg cttgtctccg gattgttgga 1440
ggaactctcc agggcctcaa gatccacaac agagccttct agaagactgg tcaataacta 1500
gttggtcttt gtctgagtct gacttacgag gttgcatact cgctcccttt gcctcgtcaa 1560
tcgatgagaa aaagcgccaa aactcgcaat atggctttga accacacggt gctgagacta 1620
gttagaatct agtcccaaac tagcttggat agcttacctt tgccctttgc gttgcgacag 1680
gtcttgcagg gtatggttcc tttctcacca gctgatttag ctgccttgct accctcacgg 1740
cggatctgcc ataaagagtg gctagaggtt ataaattagc actgatccta ggtacggggc 1800
tgaatgtaac ttgcctttcc tttctcatcg cgcggcaaga caggcttgct caaattccta 1860
ccagtcacag gggtatgcac ggcgtacgga ccacttgaac tagtcacaga ttagttagca 1920
actagtctgc attgaatggc tgtacttacg ggccctcgcc attgtcctga tcatttccag 1980
cttcaccctc gttgctgcaa agtagttagt gactagtcaa ggactagttg aaatgggaga 2040
agaaactcac gaattctcga ctcccttagt attgtggtcc ttggacttgg tgctgctata 2100
tattagctaa tacactagtt agactcacag aaacttacgc agctcgcttg cgcttcttgg 2160
taggagtcgg ggttgggaga acagtgcctt caaacaagcc ttcataccat gctacttgac 2220
tagtcaggga ctagtcacca agtaatctag ataggacttg cctttggcct ccatcagttc 2280
cttcatagtg ggaggaccat tgtgcaatgt aaactccatg ccgtgggagt tcttgtcctt 2340
caagtgcttg accaatatgt ttctgttggc agagggaacc tgtcaactag ttaataacta 2400
gtcagaaact atgatagcag tagactcact gtacgcttga ggcatccctt cactcggcag 2460
tagacttcat atggatggat atcaggcacg ccattgtcgt cctgtggact agtcagtaac 2520
taggcttaaa gctagtcggg tcggcttact atcttgaaat ccggcagcgt aagctccccg 2580
tccttaactg cctcgagata gtgacagtac tctggggact ttcggagatc gttatcgtta 2640
tcgcgaatgc tcggcatact aactgttgac tagtcttgga ctagtcccga gcaaaaagga 2700
ttggaggagg aggaggaagg tgagagtgag acaaagagcg aaataagagc ttcaaaggct 2760
atctctaagc agtatgaagg ttaagtatct agttcttgac tagatttaaa agagatttcg 2820
actagttatg tacctggagt ttggatatag gaatgtgttg tggtaacgaa atgtaagggg 2880
gaggaaagaa aaagtcggtc aagaggtaac tctaagtcgg ccattccttt ttgggaggcg 2940
ctaaccataa acggcatggt cgacttagag ttagctcagg gaatttaggg agttatctgc 3000
gaccaccgag gaacggcgga atgccaaaga atcccgatgg agctctagct ggcggttgac 3060
aaccccacct tttggcgttt ctgcggcgtt gcaggcggga ctggatactt cgtagaacca 3120
gaaaggcaag gcagaacgcg ctcagcaaga gtgttggaag tgatagcatg atgtgccttg 3180
ttaactaggt caaaatctgc agtatgcttg atgttatcca aagtgtgaga gaggaaggtc 3240
caaacataca cgattgggag agggcctagg tataagagtt tttgagtaga acgcatgtga 3300
gcccagccat ctcgaggaga ttaaacacgg gccggcattt gatggctatg ttagtacccc 3360
aatggaaacg gtgagagtcc agtggtcgca gataactccc taaattccct gagctaactc 3420
taagtcgacc atgccgttta tggttagcgc ctcccaaaaa ggaatggccg acttagagtt 3480
acctcttgac cgactttttc tttcctcccc cttacatttc gttaccacaa cacattccta 3540
tatccaaact ccaggtacat aactagtcga aatctctttt aaatctagtc aagaactaga 3600
tacttaacct tcatactgct tagagatagc ctttgaagct cttatttcgc tctttgtctc 3660
actctcacct tcctcctcct cctccaatcc tttttgctcg ggactagtcc aagactagtc 3720
aacagttagt atgccgagca ttcgcgataa cgataacgat ctccgaaagt ccccagagta 3780
ctgtcactat ctcgaggcag ttaaggacgg ggagcttacg ctgccggatt tcaagatagt 3840
aagccgaccc gactagcttt aagcctagtt actgactagt ccacaggacg acaatggcgt 3900
gcctgatatc catccatatg aagtctactg ccgagtgaag ggatgcctca agcgtacagt 3960
gagtctactg ctatcatagt ttctgactag ttattaacta gttgacaggt tccctctgcc 4020
aacagaaaca tattggtcaa gcacttgaag gacaagaact cccacggcat ggagtttaca 4080
ttgcacaatg gtcctcccac tatgaaggaa ctgatggagg ccaaaggcaa gtcctatcta 4140
gattacttgg tgactagtcc ctgactagtc aagtagcatg gtatgaaggc ttgtttgaag 4200
gcactgttct cccaaccccg actcctacca agaagcgcaa gcgagctgcg taagtttctg 4260
tgagtctaac tagtgtatta gctaatatat agcagcacca agtccaagga ccacaatact 4320
aagggagtcg agaattcgtg agtttcttct cccatttcaa ctagtccttg actagtcact 4380
aactactttg cagcaacgag ggtgaagctg gaaatgatca ggacaatggc gagggcccgt 4440
aagtacagcc attcaatgca gactagttgc taactaatct gtgactagtt caagtggtcc 4500
gtacgccgtg catacccctg tgactggtag gaatttgagc aagcctgtct tgccgcgcga 4560
tgagaaagga aaggcaagtt acattcagcc ccgtacctag gatcagtgct aatttataac 4620
ctctagccac tctttatggc agatccgccg tgagggtagc aaggcagcta aatcagctgg 4680
tgagaaagga accataccct gcaagacctg tcgcaacgca aagggcaaag gtaagctatc 4740
caagctagtt tgggactaga ttctaactag tctcagcacc gtgtggttca aagccatatt 4800
gcgagttttg gcgctttttc tcatcgattg acgaggcaaa gggagcgagt atgcaacctc 4860
gtaagtcaga ctcagacaaa gaccaactag ttattgacca gtcttctaga aggctctgtt 4920
gtggatcttg aggccctgga gagttcctcc aacaatccgg agacaagcaa gtcctcgtcg 4980
gactagtcac taactagact ctaactagtt gcagacatgg ataatgcaaa agagacaagc 5040
aatgaagaaa gtggtaagac atttctcctt tgtggttctg gactagtctt tgactagtca 5100
cagtcttaaa caaggaaaat gagcatgaaa atgaggagga aaaggctgct gagcccgagg 5160
aagtgcaggg tgatggcaga catggtaggt taataccttg ttagttattg ctagtcactg 5220
actagtcaat aactagtctc tgaacacctt gcaatcactc cgtttgcgca gctgaacagt 5280
ggtgaggata atagtagtaa gttattctag cttcagagtt ataggagact agatactaac 5340
tagtattagt tgcaactaac ctggatctca gagactttgg cctcaatcta gaatctatct 5400
agttgtcaac tagactgtgg tatcattgtc ttttattttc ctagtcctgg aactagcttc 5460
taactagtct ccctaatatg tggctgtctt gttttttttt tttgtttccc tacccggata 5520
tctagtcccc ttctaggttc tgttaacctc tcgggctctg atttagttta acgcaaacct 5580
gagattagtt tctaactagt ctctaggttt tctatccacc tttaattgta ataataaata 5640
caagcaacgt ttatacgtca aaagcattta taaactttta ccctaaagta gcttgcttgt 5700
gtgtttagtt tataattagt ctcttattaa tttgatgtag gtaagcccgc cacaaatata 5760
tatttttaca agataccgtg gaaaaacttc gtgctatcac aaaacagtat acaaaaaata 5820
agcttaacaa tctattctcc gcttggtgat gctaaagggc tttcaataga ccttgtaagt 5880
gaaggagatg gagccgtcaa tccgctaccc tgcctctggt cagttggtct cagcaatgta 5940
ccctgtgagt cttgatagac tagttggtga ctagtctctg tagatggaac aaatggtgct 6000
tgagagggca cgtatggcag agctccagtc atctgcggaa catatactgg gcccggggat 6060
cctctagagt cgacctgcag gttcatttaa acggcttcac gggcagccca gcggtcgatt 6120
tcgcttccaa attttggggg aaagggtccc tgagcagcct cacaaacgca aacatgcgca 6180
cgcgccacac ggaaaatgaa gctgactttg aatttttaag aatccccttt gcccgtggca 6240
ccttctgatt tttgtcttcg tgtccaatcc atctccttga acgacaaccc agccctttct 6300
atttcctatc ccctaatatc taatgtgagt cctcatcgtc acagacggcg acggacgcga 6360
catttcgccc gtgctcatcg accgctctgc tgtcgccaac agaacacgcg gttatgtcgc 6420
gttccgcttt gtcgtaccac tttcgcccca caccgctgac ctcgcgttcc cagcatgaaa 6480
aagcctgaac tcaccgcgac gtctgtcgag aagtttctga tcgaaaagtt cgacagcgtc 6540
tccgacctga tgcagctctc ggagggcgaa gaatctcgtg ctttcagctt cgatgtagga 6600
gggcgtggat atgtcctgcg ggtaaatagc tgcgccgatg gtttctacaa agatcgttat 6660
gtttatcggc actttgcatc ggccgcgctc ccgattccgg aagtgcttga cattggggag 6720
ttcagcgaga gcctgaccta ttgcatctcc cgccgtgcac agggtgtcac gttgcaagac 6780
ctgcctgaaa ccgaactgcc cgctgttctg cagccggtcg cggaggccat ggatgcgatc 6840
gctgcggccg atcttagcca gacgagcggg ttcggcccat tcggaccgca aggaatcggt 6900
caatacacta catggcgtga tttcatatgc gcgattgctg atccccatgt gtatcactgg 6960
caaactgtga tggacgacac cgtcagtgcg tccgtcgcgc aggctctcga tgagctgatg 7020
ctttgggccg aggactgccc cgaagtccgg cacctcgtgc acgcggattt cggctccaac 7080
aatgtcctga cggacaatgg ccgcataaca gcggtcattg actggagcga ggcgatgttc 7140
ggggattccc aatacgaggt cgccaacatc ttcttctgga ggccgtggtt ggcttgtatg 7200
gagcagcaga cgcgctactt cgagcggagg catccggagc ttgcaggatc gccgcggctc 7260
cgggcgtata tgctccgcat tggtcttgac caactctatc agagcttggt tgacggcaat 7320
ttcgatgatg cagcttgggc gcagggtcga tgcgacgcaa tcgtccgatc cggagccggg 7380
actgtcgggc gtacacaaat cgcccgcaga agcgcggccg tctggaccga tggctgtgta 7440
gaagtactcg ccgatagtgg aaaccgacgc cccagcactc gtccgagggc aaggaatagt 7500
aaatgattcg ttagttcttt cctgaactga tgattcgcgc gattcgtatt tctctttgtt 7560
ggttgttctg atgatgatga aaatgacgca tctctttatt tgctgcactc gtacacccat 7620
cctttggaat gattaatacc cctccttttt catcgcggac ggtagtcgtt ctctttgggg 7680
ccgtgtttct tcccattcgc atgcgacctc gtggtcattg actgtctgtc ctcttcctct 7740
ccacctacct ccaccaccta cgttgactgc atatcacttt ttcaaacatt catgataata 7800
cgctaccttc tggcatgacc ttttgatgat cgctttttac tatcctttca attacgatgt 7860
tgtcacttct atttgtcatt ttgcggaatt agtattttct ttccatcttc gatggagaga 7920
tgaatattgc ctgcaggcat gcaagctttc tgctcgaggc catctggctt ttctctgctg 7980
tctgcctcgg gaatgggatg gaataccacg tacggtattt ggcctccggt gccatccgaa 8040
gcgagatgct ttgagcttga aaccccctcg gcctgcacag gtgtctcatc gtgcatttaa 8100
tccaacggcg gcgagtcaaa acatcagcta attgaccagg tttctggatt gtgaatgcca 8160
actttttggg tcttgaggag ttgcggggtg ggaaaaaagt aaagaaattt actgaggatt 8220
ttatcattgc gactataaaa taaagcggca ttgcaaatcc ttgcgttgct actatgtaaa 8280
atggactgta gttgtgctgc tgaaaatagt ttggcgattg tggattgtgg attgtggatt 8340
gtggattatg gcaagttgtc aaggggcaag ttgacgaaaa tgattgtgtg gtgtctgcca 8400
gcaaattgag aacgtgggta tatatttcat cttttcatga ttcccttcgg cttgcttgtc 8460
aagcaatggc atcattggtc tagtggtaga attcgtcgtt gccatcgacg aggcccgtgt 8520
tcgattcacg gatgatgcag gaatttctac tcttgtagat tatccctgcg gatatgtata 8580
ttttttttgg ctcttgggtt cgaactgccc aaggcccatg ttttggtcat cttttttttt 8640
atgccccacc atttgggtca cccctgccaa tcattccatc tttgttccta cccttcacgt 8700
gtgctttccg aagccaaagt tcccattcaa caactctcct tgcgtttttt ttttcttgaa 8760
gcttgtcacc cgtcgatagt ttctgccatt tgcaatcgag acagcagaat caccgcccaa 8820
gttaagcctt tgtgctgatc atgctctcga acgggccaag ttcgggaaaa gcaaaggagc 8880
gtttagtgag gggcaatttg actcacctcc caggcaacag atgagggggg caaaaagaaa 8940
gaaattttcg tgagtcaata tggattccga gcatcatttt cttgcggtct atcttgctac 9000
gtatgttgat cttgacgctg tggatcaagc aacgccactc gctcgctcca tcgcaggctg 9060
gtcgcagaca aattaaaagg cggcaaactc gtacagccgc ggggttgtcc gctgcaaagt 9120
acagagtgat aaaagccgcc atgcgaccat caacgcgttg atgcccagct ttttcgatcc 9180
gagaatccac cgtagaggcg atagcaagta aagaaaagct aaacaaaaaa aaatttctgc 9240
ccctaagcca tgaaaacgag atggggtgga gcagaaccaa ggaaagagtc gcgctgggct 9300
gccgttccgg aaggtgttgt aaaggctcga cgcccaaggt gggagtctag gagaagaatt 9360
tgcatcggga gtggggcggg ttacccctcc atatccaatg acagatatct accagccaag 9420
ggtttgagcc cgcccgctta gtcatcgtcc tcgcttgccc ctccataaaa ggatttcccc 9480
tccccctccc acaaaatttt ctttcccttc ctctccttgt ccgcttcagt acgtatatct 9540
tcccttccct cgcttctctc ctccatcctt ctttcatcca tctcctgcta acttctctgc 9600
tcagcacctc tacgcattac tagccgtagt atctgagcac ttctcccttt tatattccac 9660
aaaacataac acaaccttca ccatgaacaa cggcacaaac aacttccaga acttcattgg 9720
aatctcgtcg ttgcagaaga ctttgcgcaa cgccctcatc cccacagaaa ctacccagca 9780
gttcattgtg aagaacggaa tcatcaagga agatgaactc cgaggcgaga accgccagat 9840
tttgaaggac atcatggatg attactaccg tggtttcatc tcggaaacgc tctcctccat 9900
tgacgacatc gattggactt cgttgttcga aaagatggaa atccagctca aaaacggcga 9960
taacaaggat accttgatca aggagcagac cgagtatcgg aaggcgatcc ataagaagtt 10020
cgccaacgat gatcggttca agaacatgtt ctcggccaag ttgatttccg acattctccc 10080
cgaattcgtg atccataaca acaactactc ggcgtcggag aaggaggaga agacgcaggt 10140
catcaagttg ttctcgaggt tcgccacatc gttcaaagac tattttaaga atcgtgcgaa 10200
ctgtttctcg gcagatgata tctcctcgtc ctcctgtcac cgcattgtga acgacaacgc 10260
ggaaatcttc ttctcgaacg cgttggtgta taggcgcatc gtgaagtccc tctccaacga 10320
tgacatcaac aaaatctcgg gagatatgaa ggattcgctc aaggagatgt cgttggagga 10380
aatctactcc tatgagaagt atggcgagtt cattacgcag gagggcattt ccttctacaa 10440
cgacatttgt ggtaaagtca actcgttcat gaacctctac tgtcagaaaa acaaggagaa 10500
caaaaacctc tataagctcc agaagttgca taagcagatc ctctgtatcg cagacacctc 10560
gtacgaggtc ccttacaagt tcgaatccga tgaggaggtc taccagtccg tcaacggatt 10620
cttggacaac atctcctcga aacacattgt cgagcggctc cgaaagatcg gcgataacta 10680
caacggctac aacttggaca aaatctatat cgtctccaag ttctatgagt ccgtctcgca 10740
gaaaacctat cgtgattggg agactatcaa cactgcgctc gagattcact ataacaacat 10800
cttgcctggt aacggcaaat cgaaagccga caaggtgaag aaggccgtga aaaacgatct 10860
ccagaagtcg atcacagaaa tcaacgaact cgtctcgaac tacaagctct gttcggatga 10920
taacatcaag gcggaaacgt acatccatga aatctcgcat atcttgaaca acttcgaggc 10980
ccaggaactc aaatacaacc ccgagatcca cttggtcgag tcggagctca aagcctcgga 11040
gttgaagaac gtcttggatg tcatcatgaa cgcattccac tggtgttccg tgttcatgac 11100
cgaggaactc gtcgataaag acaacaactt ctacgcggaa ctcgaggaaa tctacgatga 11160
aatctatccc gtgatctccc tctacaacct cgtgcgaaac tacgtcactc agaagcccta 11220
ttccaccaag aagatcaagc tcaacttcgg catccccact ctcgcagacg gttggtcgaa 11280
gtcgaaggag tactccaaca acgccattat cctcatgcga gacaacctct actacttggg 11340
tatcttcaac gcaaagaaca agccggataa gaagatcatt gaaggcaaca cttcggaaaa 11400
caagggagac tataagaaga tgatctacaa cctcctccct ggacccaaca agatgattcc 11460
taaagtgttc ctctcgtcga agactggtgt ggaaacgtat aagccgtcgg cctacatctt 11520
ggagggctac aaacagaaca agcatatcaa gtcctcgaag gacttcgaca tcactttctg 11580
tcacgacctc atcgactatt tcaagaactg tattgcaatc catccggaat ggaagaactt 11640
cggcttcgat ttctcggata cttcgacata cgaagatatc tcgggattct accgagaggt 11700
cgaattgcag ggctataaga ttgattggac ctacatctcg gaaaaggata tcgacttgct 11760
ccaggaaaag ggccagctct acctcttcca gatttacaac aaggacttct ccaagaagtc 11820
gacgggtaac gacaacttgc acacaatgta tctcaaaaac ctcttctcgg aggagaactt 11880
gaaggatatc gtgctcaaat tgaacggaga ggccgaaatc ttcttccgta agtcctccat 11940
caagaacccg atcatccata agaagggatc gatcttggtc aaccggactt acgaagcaga 12000
ggaaaaagat cagttcggaa acatccagat tgtcaggaag aacatccctg aaaacatcta 12060
tcaggagttg tataagtact tcaacgacaa gtcggataag gagctctccg acgaagcagc 12120
caaactcaag aacgtcgtcg gacaccatga agcagcaacc aacattgtga aggactaccg 12180
gtacacttac gacaagtact tcttgcacat gccgatcact atcaacttca aagccaacaa 12240
gaccggattc attaacgaca ggatcctcca gtacattgcc aaagaaaagg acctccatgt 12300
catcggtatc gataggggag aacggaacct catctacgtc tccgtgattg acacttgtgg 12360
caacattgtc gaacagaagt cgttcaacat cgtcaacggt tacgattacc agattaagtt 12420
gaaacagcag gaaggtgcga ggcagattgc gcgaaaggaa tggaaggaga ttggcaaaat 12480
caaggagatt aaggaaggct acttgtcgtt ggtcatccac gaaatctcga aaatggtgat 12540
caaatacaac gccatcatcg ccatggaaga cctctcgtac ggcttcaaaa agggacggtt 12600
caaagtggag cgtcaggtgt accagaagtt cgaaacaatg ttgatcaaca agttgaacta 12660
cttggtgttc aaggacattt ccattaccga gaacggagga ttgctcaagg gttatcagct 12720
cacgtacatc cccgacaagt tgaaaaacgt gggacaccag tgtggctgta tcttctacgt 12780
gcctgcagcc tacacgtcga aaatcgaccc tacaacagga ttcgtgaaca tcttcaagtt 12840
caaggatctc accgtcgacg cgaagcggga gttcatcaaa aagttcgact ccatccgcta 12900
tgattcggag aagaacttgt tctgtttcac attcgactac aacaacttca ttactcagaa 12960
caccgtgatg tccaaatcgt cgtggtccgt gtacacgtat ggtgtgcgca tcaaaaggcg 13020
cttcgtcaac ggtcgcttct ccaacgaatc ggacacgatc gatatcacga aagacatgga 13080
gaaaacattg gaaatgaccg acatcaactg gcgtgacggc catgacctca ggcaggacat 13140
catcgattac gagatcgtcc agcacatctt cgaaatcttc cgtctcaccg tgcagatgag 13200
gaactccctc tccgagctcg aagatcggga ttacgaccgg ctcatttccc ctgtgttgaa 13260
cgagaacaac atcttctacg actcggcaaa agcgggagat gcattgccga aggacgccga 13320
tgcgaacggt gcatattgta ttgcactcaa gggtctctac gaaatcaagc agatcaccga 13380
aaactggaag gaggacggca aattctcgag ggacaagttg aagatttcga acaaggattg 13440
gttcgatttc atccagaaca agaggtactt gcctccgaag aagaagcgaa aggtgtgagc 13500
ggacattcga tttatgccgt tatgacttcc ttaaaaaagc ctttacgaat gaaagaaatg 13560
gaattagact tgttatgtag ttgattctac aatggattat gattcctgaa cttcaaatcc 13620
gctgttcatt attaatctca gctcttcccg taaagccaat gttgaaacta ttcgtaaatg 13680
tacctcgttt tgcgtgtacc ttgcttatca cgtgatatta catgacctgg acagagttct 13740
gcgcgaaagt cataacgtaa atcccgggcg gtaggtgcgt cccgggcgga aggtagtttt 13800
ctcgtccacc ccaacgcgtt tatcaacctc aactttcaac aaccatcatg ccaccaaaag 13860
cgcgtaaaac aaagcgagat ttgattgagc aagagggcag gatggcgtaa tcatggtcat 13920
agctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa 13980
gcataaagtg taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc 14040
gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc 14100
aacgcgcggg gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact 14160
cgctgcgctc ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 14220
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 14280
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 14340
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 14400
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 14460
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 14520
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 14580
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 14640
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 14700
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 14760
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 14820
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 14880
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 14940
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 15000
tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 15060
aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 15120
tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 15180
gcttaccatc tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag 15240
atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 15300
tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 15360
ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 15420
ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 15480
tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 15540
ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 15600
ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 15660
tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 15720
gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 15780
taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 15840
cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 15900
agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 15960
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 16020
ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa 16080
ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtctcg 16140
cgcgtttcgg tgatgacggt gaaaacctct gacacatgca gctcccggag acggtcacag 16200
cttgtctgta agcggatgcc gggagcagac aagcccgtca gggcgcgtca gcgggtgttg 16260
gcgggtgtcg gggctggctt aactatgcgg catcagagca gattgtactg agagtgcacc 16320
atatgcggtg tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggc 16374
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物1228586
<400> 57
ttagtccgac gccttcgagt 20
<210> 58
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物1228587
<400> 58
tgcgagtacc tcagcgctgt 20
<210> 59
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 原型间隔子PS1
<400> 59
cgttgaagcc ggatatgaag c 21
<210> 60
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 原型间隔子PS2
<400> 60
gcgaggccat ccgcctggcg c 21
<210> 61
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 原型间隔子PS3
<400> 61
ccccgaagga gaatccgtct c 21
<210> 62
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 原型间隔子PS4
<400> 62
tgcgtaatta ccatgcgcag a 21
<210> 63
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 原型间隔子PS5
<400> 63
tatccctgcg gatatgtata t 21
<210> 64
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 修复DNA 1228583
<400> 64
cggatttcca gcagcaaatc agccgcggac tgccagagcc gcacaagctt cttccggggc 60
ggctcggacg ccgtgctcag gaactcgtcc tcga 94
<210> 65
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 修复DNA 1228584
<400> 65
tggggacgag cccctcgagg gcagcctcct cgtgcagctg catgaagctt atgtgccacg 60
agtacttggg cttccccgca gcgtggaggc agtt 94
<210> 66
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 修复DNA 1228585
<400> 66
aggtgctggt gcaggcagtc ccgagaggct tcgagcaaga tctcaagctt tgtccttggg 60
tagcatgaat gctgcctctg cgcagacggc cgtga 95
<210> 67
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 修复DNA 1228582
<400> 67
atcagcctgc tcaacgccag gagcaaaata agagaggtct tcgaagcttc agtgaaacgt 60
cacctgcagg ttgatgcact gtatcacgta ctgc 94
<210> 68
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 修复DNA 1228581
<400> 68
caacataatc aggacagatt agcaacaagt gccgaggctt gatgaagctt aaagagagag 60
ggggggtcgt cgaagaaaag ggtgtgcaga aaag 94
<210> 69
<211> 122
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸10
<400> 69
tttccagcag caaatcagcc gcggactgcc agagccgcac attggcgtta aagccggata 60
tgaagctctt ccggggcggc tcgcacgccg tgctcaggaa ctcgtcctcg atacccgacg 120
gg 122
<210> 70
<211> 135
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸11
<400> 70
tttccagcag caaatcagcc gcggactgcc agagccgcac attggcgtta aagccggata 60
tgaagctctt ccggggcggc tcggacgccg tgctctggaa ctcgtcctcg atacccgacg 120
ggtatagcgt ggtga 135
<210> 71
<211> 150
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸12
<400> 71
tttccagcag caaatcagcc gcggactgcc agagccgcac attggcgtta aagccggata 60
tgaagctctt ccggggcggc tcggacgccg tgctcaggaa ctcgtcctcg ctacccgacg 120
ggtatagcgt ggtgatgccg gcgtcgaagc 150
<210> 72
<211> 111
<212> DNA
<213> 人工序列
<220>
<223> 寡核苷酸13
<400> 72
ctgatcttgc agcacgcgga tttccagcag caaatcagcc acggactgcc agagccgcac 60
attggcgtta aagccggata tgaagctctt ccggggcggc tcggacgccg t 111
机译: 通过引导的内切核酸酶和单链寡核苷酸进行基因组编辑
机译: 通过引导的内切核酸酶和单链寡核苷酸进行基因组编辑
机译: 指导性核酸酶和单链寡核苷酸的基因组编辑