首页> 中国专利> 具有改变的根构造的植物、涉及编码EXOSTOSIN家族多肽及其同源物的基因的相关的构建体和方法

具有改变的根构造的植物、涉及编码EXOSTOSIN家族多肽及其同源物的基因的相关的构建体和方法

摘要

本发明描述了尤其可用于改变植物的根构造的分离的多核苷酸和多肽及重组DNA构建体、包含这些重组DNA构建体的组分(例如植物或种子)、以及利用这些重组DNA构建体的方法。所述重组DNA构建体包含可操作地连接在植物中有功能的启动子的多核苷酸,其中所述多核苷酸编码可用于改变植物根构造的多肽。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-12-14

    未缴年费专利权终止 IPC(主分类):C07K14/415 授权公告日:20131106 终止日期:20151030 申请日:20081030

    专利权的终止

  • 2013-11-06

    授权

    授权

  • 2010-12-15

    实质审查的生效 IPC(主分类):C07K14/415 申请日:20081030

    实质审查的生效

  • 2010-09-29

    公开

    公开

说明书

发明领域

本发明领域涉及植物育种和遗传学,并且具体地讲涉及用于改变植物根构造的重组DNA构建体。

发明背景

在所有(除了非常少的几个之外)自然生态系统中,水和营养物质的可用性限制了植物生长。它们在大多数农业生态系统中限制产量。植物根部起到重要作用,如水和营养物质摄取、在土壤中固定植物以及在根围建立生物相互作用。因此阐明植物根发育和功能的基因调控是农学和生态学中相当受关注的课题。

根系发源于在胚胎形成期间发育的初生根。初生根产生次生根,次生根继而产生三生根。所有次生、三生、四生以及更进一步分生的根均被称为侧根。包括玉米在内的许多植物也可从连续的地下节位(冠根)或地上节位(支柱根)处产生不定根。有三个主要过程影响根系的总体构造。第一个是在初生根分裂组织中的细胞分裂过程,该过程通过加入新生细胞到根中使得根不定生长。第二个是侧根形成过程,该过程增加根系的探索能力。第三个是根毛形成过程,该过程增加初生根和侧根的总表面(Lopez-Bucio等人,Current Opinion in Plant Biology(2003)6:280-287)。在已经分离出的玉米突变体中仅仅缺少根型的一个亚型。已经鉴定了拟南芥属的根形态基因突变体如SHORTROOT和SCARECROW,它显示初生根和侧根的发育缺陷(J.E.Malamy,Plant,Cell and Environment(2005)28:67-77)。

已经鉴定了许多特异性影响根发育的玉米突变体(Hochhol dinger等人,2004,Annals of Botany 93:359-368)。隐性突变体rtcs和rt1不形成或形成较少的冠根和支柱根,然而初生根和侧根不受影响。在隐性突变体des 21中,缺失侧生种子根和根毛。隐性突变体rth1-3缺失根毛。突变体lrt1和rum1在侧根开始产生之前受影响,而突变体slr1和slr2的侧根伸长能力受到削弱。决定根系构造的内源响应途径包括激素、细胞循环调节子和调节基因。水分胁迫和营养物质可用性属于决定根系构造的环境响应途径。

提交于2005年2月14日的美国专利申请2005-57473(美国专利公开公布2005/223429A1,公布于2005年10月6日)涉及使用拟南芥属细胞分裂素氧化酶基因改变植物中的细胞分裂素含量并刺激根生长。

美国专利公开6,344,601(公布于2002年2月5日)涉及在植物细胞中低表达或超表达肌动蛋白抑制蛋白(profilin)以改变植物生长习性,例如减少根系或根毛系统会使花期推迟。

WO2004/US16432(提交于2004年5月21日(WO2004/106531,公布于2004年12月9日)涉及使用超表达顺式-异戊烯转移酶的方法操纵生长速率和/或产量和/或构造。

提交于2004年9月30日的美国专利申请2004/489500(美国专利公开公布2005/059154A1,公布于2005年3月13日)涉及使用在植物中超表达转录因子E2F的方法改变细胞数量、构造和产量。

可利用激活标记来鉴定能影响性状的基因。已经在模型植物拟南芥属中使用该方法(Weigel等人,2000,Plant Physiol.122:1003-1013)。

插入转录增强子元件能够显著激活和/或提高附近内源基因的表达。

发明内容

本发明包括:

在一个实施方案中,分离的多核苷酸,所述分离的多核苷酸包含编码EXST或EXST样多肽的核酸序列或所述核酸序列的全长互补序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15或31比较时具有至少80%的序列同一性,或在与SEQ ID NO:25比较时具有至少95%的序列同一性。

在第二实施方案中,分离的多核苷酸,所述分离的多核苷酸包含编码EXST或EXST样多肽的核酸序列或所述核酸序列的全长互补序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15或31比较时具有至少85%的序列同一性。

在第三实施方案中,分离的多核苷酸,所述分离的多核苷酸包含编码EXST或EXST样多肽的核酸序列或所述核酸序列的全长互补序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15或31比较时具有至少90%的序列同一性。

在第四实施方案中,分离的多核苷酸,所述分离的多核苷酸包含编码EXST或EXST样多肽的核酸序列或所述核酸序列的全长互补序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15或31比较时具有至少95%的序列同一性。

在第五实施方案中,分离的多核苷酸,所述分离的多核苷酸包含编码EXST或EXST样多肽的核酸序列,其中所述多肽的氨基酸序列包含SEQ IDNO:15、25、或31。

在第六实施方案中,分离的多核苷酸,所述分离的多核苷酸包含编码EXST或EXST样多肽的核酸序列,其中所述核苷酸序列包含SEQ ID NO:14、24、或30。

在另一个实施方案中,包含任何前述多核苷酸的载体和重组构建体,以及包含所述重组构建体的细胞。

在另一个实施方案中,用任一前述多核苷酸来转化细胞的方法,以及用于生产和再生包含任一前述多核苷酸的转化植物的方法。

在另一个实施方案中,在基因组中包含重组DNA构建体的植物,该重组DNA构建体包含可操作地连接至少一种调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性,并且其中所述植物在与未包含所述重组DNA构建体的对照植物进行比较时表现出改变的根构造。

在另一个实施方案中,在基因组中包含重组DNA构建体的植物,该重组DNA构建体包含:

(a)可操作地连接至少一种调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性,或

(b)抑制DNA构建体,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于ClustalV比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于ClustalV比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码EXST或EXST样多肽,并且其中在与未包含所述重组构建体的对照植物比较时,所述植物表现出至少一种农学特性的改变。

在另一个实施方案中,改变植物根构造的方法,该方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中该多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性;以及(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体并且在与未包含该DNA构建体的对照植物比较时表现出改变的根构造;以及任选地,(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含该重组DNA构建体并且在与未包含该DNA构建体的对照植物比较时表现出改变的根构造。

在另一个实施方案中,评价植物根构造的方法,该方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中该多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性,(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;以及(c)评价与未包含该重组DNA构建体的对照植物比较时该转基因植物的根构造;以及任选地,(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及任选地,(e)评价与未包含该重组DNA构建体的对照植物比较时该子代植物的根构造。

在另一个实施方案中,评价植物根构造的方法,该方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中该多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性,(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;(c)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(d)评价与未包含该重组DNA构建体的对照植物比较时该子代植物的根构造。

在另一个实施方案中,测定植物农学特性改变的方法,该方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中该多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性,(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;以及(c)测定该转基因植物在与未包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变;以及任选地,(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及任选地,(e)测定该子代植物在与未包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。

在另一个实施方案中,测定植物农学特性改变的方法,该方法包括(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中该多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性,(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;(c)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(d)测定该子代植物在与未包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。

在另一个实施方案中,测定植物农学特征改变的方法,该方法包括:

(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:

(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或

(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码EXST或EXST样多肽;

(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;以及(c)测定该转基因植物在与未包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变;

以及(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及任选地,(e)测定该子代植物在与未包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。

在另一个实施方案中,测定植物农学特征改变的方法,该方法包括:

(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:

(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或

(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码EXST或EXST样多肽;

(b)在步骤(a)之后,从所述可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体,并且当与未包含所述抑制DNA构建体的对照植物比较时表现出改变的根构造;

(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及

(d)测定所述子代植物在与未包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。

在另一个实施方案中,改变植物根构造的方法,该方法包括:

(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:

(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或

(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码EXST或EXST样多肽;以及

(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体,并且其中该转基因植物在与未包含该抑制DNA构建体的对照植物比较时表现出改变的根构造;以及

任选地,(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含该重组DNA构建体,并且其中该子代植物在与未包含该抑制DNA构建体的对照植物比较时表现出改变的农学特性。在另一个实施方案中,评价植物根构造的方法,该方法包括:

(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:

(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或

(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码EXST或EXST样多肽;

(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;以及

(c)评价与未包含该抑制DNA构建体的对照植物比较时该转基因植物的根构造;

以及(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及任选地,(e)评价与未包含该抑制DNA构建体的对照植物比较时该子代植物的根构造。

在另一个实施方案中,评价植物根构造的方法,该方法包括:

(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:

(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ IDNO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性,或(B)所述(b)(i)(A)的核酸序列的全长互补序列;或

(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码EXST或EXST样多肽;

(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;

(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及

(d)评价当与未包含所述抑制DNA构建体的对照植物比较时所述子代植物的根构造。

在另一方面,本发明也涉及对基因变异进行作图的方法,所述基因变异与控制种子发育期间的胚芽/胚乳大小和/或改变植物中的含油表型有关,所述方法包括:

(a)使两种植物品种杂交;并且

(b)在得自步骤(a)的杂交的子代植物中针对以下序列来评价基因变异:

(i)选自SEQ ID NO:14、16、18、20、22、24、26、28、30或33的核酸序列;或

(ii)编码选自SEQ ID NO:15;17、19、21、23、25、27、29、31或34的多肽的核酸序列,

其中所述评价是使用选自下组方法进行的:RFLP分析、SNP分析、和基于PCR的分析。

在另一个实施方案中,本发明涉及改变种子发育期间的胚芽/胚乳尺寸和/或改变植物中含油表型的分子育种方法,所述方法包括:

(a)使两种植物品种杂交;并

(b)在得自步骤(a)的杂交的子代植物中针对以下序列来评价基因变异:

(i)选自SEQ ID NO:14、16、18、20、22、24、26、28、30或33的核酸序列;或

(ii)编码选自SEQ ID NO:15;17、19、21、23、25、27、29、31或34的多肽的核酸序列;

其中所述评价是使用选自下组方法进行的:RFLP分析、SNP分析、和基于PCR的分析。

本发明中还包括上述植物的任何子代、上述植物的任何种子以及来自任一上述植物和子代植物的细胞。

生产可作为产品销售的种子的方法,该种子提供改变的根构造,该方法包括任一前述优选的方法,并且还包括从所述子代植物获得种子,其中所述种子在其基因组中包含所述重组DNA构建体。

附图以及序列表的说明

根据以下的详细描述和附图以及序列表,可更全面地理解本发明,以下的详细描述和附图以及序列表形成本申请的一部分。

图1示出pHSbarENDs2激活标记构建体(SEQ ID NO:1)的图谱,该构建体用于制备拟南芥属种群。

图2示出载体pDONRTM/Zeo(SEQ ID NO:2)的图谱。attP1位点位于核苷酸570-801;attP2位点位于核苷酸2754-2985(互补链)。

图3示出载体pDONRTM221(SEQ ID NO:3)的图谱。attP1位点位于核苷酸570-801;attP2位点位于核苷酸2754-2985(互补链)。

图4示出载体pBC-yellow(SEQ ID NO:4)的图谱,该载体是用于构建拟南芥属表达载体的目的载体。attR1位点位于核苷酸11276-11399(互补链);attR2位点位于核苷酸9695-9819(互补链)。

图5示出PHP27840(SEQ ID NO:5)的图谱,该载体是用于构建大豆表达载体的目的载体。attR1位点位于核苷酸7310至-434;attR2位点位于核苷酸8890-9014。

图6示出PHP23236(SEQ ID NO:6)的图谱,该载体是用于构建GaspeFlint衍生的玉米品系的表达载体的目的载体。attR1位点位于核苷酸2006-2130;attR2位点位于核苷酸2899-3023。

图7示出PHP10523(SEQ ID NO:7)的图谱,它是存在于农杆菌菌株LBA4404中的质粒DNA。

图8示出PHP23235(SEQ ID NO:8)的图谱,它是用于构建目的载体PHP23236的载体。

图9示出了入门克隆PHP20234(SEQ ID NO:9)的图谱,它是转运PINII终止子的载体。attR2位点位于核苷酸591-747;attL3位点位于核苷酸1100-1195。

图10示出PHP28529(SEQ ID NO:10)的图谱,该载体是用于构建玉米品系表达载体的目的载体。attR3位点位于核苷酸3613-3737;attR4位点位于核苷酸2035-2159。

图11示出了入门克隆PHP28408(SEQ ID NO:11)的图谱,它是转运组成型玉米GOS2启动子的载体。attL4位点位于核苷酸160-255;attR1位点位于核苷酸2301-2447。

图12示出了入门克隆PHP22020(SEQ ID NO:12)的图谱,它是转运玉米根NAS2启动子的载体。attR1位点位于核苷酸31-187;attL4位点位于核苷酸2578-2673。

图13示出PHP29635(SEQ ID NO:13)的图谱,该载体是用于构建Gaspe Flint衍生的玉米品系的表达载体的目的载体。attR1位点位于核苷酸40786-40910;attR2位点位于核苷酸41679-41803。

图14示出PIIOXS2a-FRT87(ni)m(SEQ ID NO:43)的图谱,该载体用于构建目的载体PHP29635。

图15A至15I示出以下全长氨基酸序列的多重比对:SEQ ID NO:15、17、19、21、23、25、27、29、31、34、以及SEQ ID NO:35、36、37、和38。完全匹配共有序列的残基显示为暗色。将共有序列显示于每个比对上部。共有残基通过直接取多数来确定。

图16示出图15A至15I中示出的EXST同源物的每对氨基酸序列的序列同一性百分比和趋异值图表。

图17是实施例17中用于半水耕玉米生长的培养基。

图18是列出实施例17中与不同硝酸盐浓度对Gaspe Flint衍生的玉米品系的生长和发育的影响相关的数据的图表。

序列描述以及所附序列表遵循如37C.F.R.§1.821-1.825所列出的关于专利申请中核苷酸和/或氨基酸序列公开的规定。

序列表包含用于核苷酸序列字符的单字母码和用于氨基酸的三字母码,如遵照IUPAC-IUBMB标准所定义的,该标准在Nucleic Acids Res.13:3021-3030(1985)以及在Biochemical J.219(2):345-373(1984)中有所描述,这两篇文献以引用的方式并入本文。用于核苷酸和氨基酸序列数据的符号和格式遵循在37C.F.R.§1.822中所列出的规定。

SEQ ID NO:1pHSbarENDs2

SEQ ID NO:2pDONRTM/Zeo

SEQ ID NO:3pDONRTM221

SEQ ID NO:4pBC-yellow

SEQ ID NO:5PHP27840

SEQ ID NO:6PHP23236

SEQ ID NO:7PHP10523

SEQ ID NO:8PHP23235

SEQ ID NO:9PHP20234

SEQ ID NO:10PHP28529

SEQ ID NO:11PHP28408

SEQ ID NO:12PHP22020

SEQ ID NO:13PHP29635

重叠群:列出了本文所述的多肽、包含编码多肽全部或其主要部分的核酸片段的cDNA克隆的命名、以及在所附序列表中使用的对应标识符(SEQID NO:)。

表1

EXST和EXST样蛋白

  蛋白质  克隆命名  SEQ ID NO:  (氨基酸)  SEQ ID NO:  (核苷酸)  EXST样  重叠群:  cfp5n.pk007.k11  cfp5n.pk007.k11.f  cfp6n.pk005.i1  14  15  EXST样  重叠群:  cfp3n.pk069.l15  cfp3n.pk069.l15.f  p0127.cntdd86ra  p0127.cntdd86ra.f  16  17

  蛋白质  克隆命名  SEQ ID NO:  (氨基酸)  SEQ ID NO:  (核苷酸)  EXST样  my.ceb1.pk0010.e5  18  19  EXST样  cfp6n.pk002.a5:fis  20  21  EXST样  rls24.pk0026.h11:fis  22  23  EXST样  p0127.cntdd86ra:fis  24  25  EXST样  cfp5n.pk007.k11:fis  26  27  EXST样  esl1c.pk006.l19:fis  28  29  EXST样  cfp1n.pk002.o16.f:fis  30  31

SEQ ID NO:32是拟南芥属胚囊发育停顿蛋白5(embryo sacdevelopment arrest 5)(EDA5,Exostosin家族蛋白或EXST蛋白,NCBIGI NO:15228598,At3g03650)的核苷酸序列。

SEQ ID NO:33是ORF,对应于SEQ ID NO:32的核苷酸245-1744。

SEQ ID NO:34对应于蛋白序列(NCBI GI NO:15228598),该序列由SEQ ID NO:33编码

SEQ ID NO:35对应于NCBI GI NO:115476598(稻)。

SEQ ID NO:36对应于NCBI GI NO:115487106(稻)。

SEQ ID NO:37对应于NCBI GI NO:115452759(稻)。

SEQ ID NO:38对应于NCBI GI NO:115441893(稻)。

SEQ ID NO:39是attB1序列。

SEQ ID NO:40是attB2序列。

SEQ ID NO:41是实施例9中的正向引物VC062。

SEQ ID NO:42是实施例9中的反向引物VC063。

SEQ ID NO:43PIIOXS2a-FRT87(ni)m。

SEQ ID NO:44是玉米NAS2启动子。

SEQ ID NO:45是GOS2启动子。

SEQ ID NO:46是泛素启动子。

SEQ ID NO:47是S2A启动子。

SEQ ID NO:48是PINII终止子。

优选实施方案的详细描述

本文中所列出的每篇参考文献的公开内容的全文以引用方式并入本文。

如本文所用的并在所附权利要求书中的单数形式“一个”和“所述”包括复数涵义,除非上下文中清楚地另有指明。因此,例如,“一株植物”的涵义包括多株该类植物。“一个细胞”的涵义包括一个或多个细胞及其本领域的技术人员已知的等同物,等等。

术语“根构造”指构成根的不同部分的布置方式。术语“根构造”、“根结构”、“根系”或“根系构造”在这里可互换使用。

一般来讲,植物由胚发育成的第一种根称为初生根。在大多数双子叶植物中,初生根被称为主根。这种主根向下生长并产生分枝根(侧根)。在单子叶植物中,植物的初生根发生分枝,生成须根系。

术语“改变的根构造”指与参照植株或对照植株比较,在其不同发育阶段构成根系的不同部分的改变状况。应当理解,改变的根构造涵盖了一种或多种可测量参数(包括但不限于一个或多个根系部分的直径、长度、数目、角度或表面)的改变,所述根系部分包括但不限于初生根、侧根或分枝根、不定根和根毛,所有这些均在本发明的范围内。这些改变可导致根所占的面积或空间的整体改变。参照植株或对照植株在其基因组中不含重组DNA构建体或异源构建体。

“表达序列标签”(“EST”)是得自cDNA文库的DNA序列,并且因此是已经被转录的序列。EST通常通过cDNA插入序列单程测序获取。将完整的cDNA插入序列称为“全长插入序列”(“FIS”)。“重叠群”序列是由选自,但不限于EST、FIS和PCR序列的两个或更多个序列装配成的序列。将编码完整或功能性蛋白的序列称为“完全基因序列”(“CGS”),该序列能得自FIS或重叠群。

“农学特性”是可测量的参数,包括但不限于绿度、产量、生长速率、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物含氮量、果实含氮量、种子含氮量、营养组织含氮量、总植物游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、营养组织游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织蛋白质含量、耐旱性、氮摄取、根倒伏、茎倒伏、植株高度、穗长和收获指数。

“Exostosin家族”、“at-Exostosin家族、exst、at-exst本文可互换使用,指拟南芥属位点AT3G03650(SEQ ID NO:32)。

EXST指由AT3G03650(SEQ ID NO:32)的ORF(SEQ ID NO:33编码的蛋白(SEQ ID NO:34)。

“exst样”指拟南芥属“exostosin家族”位点AT3G03650(SEQ IDNO:32)的来自不同物种的核苷酸同源物,如玉米和大豆,并且不受限制的包括任何以下核苷酸序列:SEQ ID NO:14、16、18、20、22、24、26、28和30。

“EXST样”指拟南芥属“EXOSTOSIN家族”多肽(SEQ ID NO:34)的来自不同物种的蛋白同源物,如玉米和大豆,并且不受限制的包括任何以下氨基酸序列:SEQ ID NO:15、17、19、21、23、25、27、29和31。

“环境条件”指植物生长的条件,例如水的可用性、营养物质(例如氮)的可用性或者病害的存在。

“转基因”指其基因组因异源核酸(如重组DNA构建体)的存在而发生改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,包括那些最初的转基因事件以及从最初的转基因事件通过有性杂交或无性生殖而产生的那些。如本文所用的术语“转基因”不涵盖通过常规植物育种方法或通过诸如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变之类的自然发生事件导致的基因组(染色体基因组或染色体外基因组)改变。

“基因组”在用于植物细胞时不仅涵盖存在于细胞核中的染色体DNA,而且还包括存在于细胞的亚细胞组分(如线粒体、质粒)中的细胞器DNA。

“植物”包括整个植株、植物器官、植物组织、种子和植物细胞以及同一植株的子代。植物细胞包括但不限于得自下列物质的细胞:种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。

“子代”包括植物的任何后续世代。

“转基因”指其基因组因异源核酸(如重组DNA构建体)的存在而发生改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,包括那些最初的转基因事件以及从最初的转基因事件通过有性杂交或无性生殖而产生的那些。如本文所用的术语“转基因”不涵盖通过常规植物育种方法或通过诸如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变之类的自然发生事件导致的基因组(染色体基因组或染色体外基因组)改变。

“转基因植物”包括在其基因组内包含异源多核苷酸的植物。优选的是,异源多核苷酸被稳定地整合进基因组中,使得该多核苷酸传递至连续的世代。异源多核苷酸可单独地或作为重组DNA构建体的部分整合进基因组中。

针对序列而言的“异源”意指来自外来物种的序列,或者如果来自相同物种,则指通过蓄意的人为干预而从其天然形式发生了组成和/或基因座的显著改变的序列。

“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”可互换使用并且是任选含有合成的、非天然的或改变的核苷酸碱基的单链或双链RNA或DNA聚合物。核苷酸(通常以它们的5′-单磷酸形式存在)通过如下它们的单个字母名称来指代:“A”为腺苷酸或脱氧腺苷酸(分别对应RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸,“G”表示鸟苷酸或脱氧鸟苷酸,“U”表示尿苷酸,“T”表示脱氧胸苷酸,“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,并且“N”表示任何核苷酸。

“多肽”、“肽”、“氨基酸序列”和“蛋白质”在本文中可互换使用,指氨基酸残基的聚合物。该术语适用于其中一个或多个氨基酸残基是相应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物,以及适用于天然存在的氨基酸聚合物。术语“多肽”、“肽”、“氨基酸序列”和“蛋白质”还可包括修饰,包括但不限于糖基化、脂质连接、硫酸盐化、谷氨酸残基的γ羧化、羟化和ADP-核糖基化。

“信使RNA(mRNA)”指无内含子并且可通过细胞翻译成蛋白质的RNA。

“cDNA”指与mRNA模板互补并且利用逆转录酶从mRNA模板合成的DNA。cDNA可以是单链的或者可用DNA聚合成酶I的Klenow片段转化成双链形式。

“成熟”蛋白质指经翻译后加工的多肽;即已经去除了存在于初级翻译产物中的任何前肽或原肽的多肽。

“前体”蛋白质指mRNA的翻译初级产物;即具有仍然存在的前肽和原肽。前肽和原肽可以是并且不限于细胞内定位信号。

“分离的”指物质,例如核酸和/或蛋白质,该物质基本上不含在天然存在的环境中通常伴随该物质或与其反应的组分,或者说是该物质被从所述组分移出。分离的多核苷酸可从它们天然存在于其中的宿主细胞纯化。技术人员已知的常规核酸纯化方法可用于获得分离的多核苷酸。该术语也涵盖重组多核苷酸和化学合成的多核苷酸。

“重组体”指(例如)通过化学合成或者通过用基因工程技术操纵分离的核酸片段来实现的两个原本分离的序列片段的人工组合。“重组体”也包括指已经通过引入异源核酸而进行了修饰的细胞或载体,或源于经这样修饰的细胞的细胞,但不涵盖由天然发生的事件(如自发突变、自然转化/转导/转座)对细胞或载体的改变,例如没有蓄意人为干扰而发生的那些。

“重组DNA构建体”指在自然界中通常不会一起存在的核酸片段的组合。因此,重组DNA构建体可包含源于不同来源的调控序列和编码序列,或源于相同来源但以不同于通常天然存在的方式排列的调控序列和编码序列。

术语“入门克隆”和“入门载体”本文可互换使用。

“调控序列”指位于编码序列的上游(5′非编码序列)、中间或下游(3′非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。调控序列可包括但不限于启动子、翻译前导序列、内含子和多腺苷酸化识别序列。

“启动子”指能够控制另一核酸片段转录的核酸片段。

“在植物中有功能的启动子”指能够控制植物细胞中的转录的启动子,无论其是否来源于植物细胞。

“组织特异性启动子”和“组织优选启动子”可互换使用,并且指主要但非必须专一地在一种组织或器官中表达,而是也可在一种特定细胞中表达的启动子。

“发育调控启动子”指其活性由发育事件决定的启动子。

术语“可操作地连接”指核酸片段联合成单一片段,使得其中一个核酸片段的功能受到另一个核酸片段的调控。例如,在启动子能够调节核酸片段的转录时,该启动子与该核酸片段进行了可操作地连接。

“表达”指功能产物的产生。因此,核酸片段的表达可指核酸片段的转录(如生成mRNA或功能RNA的转录)和/或RNA翻译成前体或成熟蛋白质。

“表型”意指细胞或生物体的可检测的特征。

有关将核酸片段(例如重组DNA构建体)插入细胞内的“导入”意指“转染”或“转化”或“转导”,并且包括指将核酸片段整合进真核或原核细胞中,在该细胞中核酸片段可整合进细胞的基因组(如染色体、质粒、质体或线粒体DNA)内,转变成自主的复制子或瞬时表达(如转染的mRNA)。

“转化细胞”是将核酸片段(如重组DNA构建体)引入其中的任何细胞。

在此所用的“转化”指稳定转化和瞬时转化两者。

“稳定转化”指将核酸片段引入宿主生物体的基因组中,导致基因稳定遗传。一旦稳定转化,核酸片段稳定地整合进宿主生物体和任何连续世代的基因组中。

“瞬时转化”指将核酸片段引入宿主生物体的核中或包含DNA的细胞器中,引起基因表达而没有基因稳定遗传。

“等位基因”是占据染色体上给定位点的基因的几种供选择形式的其中一种。当二倍体植物中一对同源染色体上给定基因座上存在的等位基因相同时,该植物在该基因座处是纯合的。如果二倍体植物中一对同源染色体上给定基因座上存在的等位基因不同,则该植物在该基因座处是杂合的。如果转基因存在于二倍体植物中一对同源染色体中的其中之一上,则该植物在该基因座处是半合子的。

序列比对和同一性百分比可用设计用于检测同源序列的多种比较方法来测定,这些方法包括但不限于生物信息计算包(Inc.,Madison,WI)的程序。除非另外说明,本文提供的序列的多重比对用Clustal V比对方法(Higgins和Sharp,1989,CABIOS.5:151-153)采用默认参数(空位罚分=10,空位长度罚分=10)执行。用Clustal V方法进行成对比对和蛋白质序列的同一性百分比计算的默认参数为KTUPLE=1、缺口罚分=3、窗口(WINDOW)=5和DIAGONALS SAVED=5。而对于核酸,这些参数为KTUPLE=2,空位罚分=5,窗口=4和DIAGONALSSAVED=4。用Clustal V程序比对序列后,可通过查看同一程序中的“序列距离”表来获得“同一性百分比”和“趋异度”值。除非另外说明,本文提供的和申明的同一性百分比和趋异度是以该方式计算的。

本文使用的标准重组DNA和分子克隆技术是本领域所熟知的并且在如下文献中有更全面的描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular Cloning:A Laboratory Manual;Cold Spring HarborLaboratory Press:Cold Spring Harbor,1989(下文称为“Sambrook”)。

现在来看优选的实施方案:

优选的实施方案包括分离的多核苷酸和多肽、重组DNA构建体、包含这些重组DNA构建体的组分(例如植株或种子)以及利用这些重组DNA构建体的方法。

优选的分离的多核苷酸和多肽

本发明包括如下优选的分离的多核苷酸和多肽:

分离的多核苷酸,所述多核苷酸包含:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性;或(ii)(i)的核酸序列的全长互补序列;任一上述分离的多核苷酸可用于本发明的任何重组DNA构建体(包括抑制DNA构建体)。所述多肽优选为EXST或EXST样蛋白。

分离的多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性。所述多肽优选为EXST或EXST样蛋白。

分离的多核苷酸,该多核苷酸包含(i)核酸序列,所述核酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,或(ii)(i)的核酸序列的全长互补序列。任一上述分离的多核苷酸可用于本发明的任何重组DNA构建体(包括抑制DNA构建体)。该分离的多核苷酸编码EXST或EXST样蛋白。

优选的重组DNA构建体和抑制DNA构建体。

在一个方面,本发明包括重组DNA构建体(包括抑制DNA构建体)。

在一个优选的实施方案中,重组DNA构建体包含可操作地连接至少一种调控序列(如,在植物中有功能的启动子)的多核苷酸,其中该多核苷酸包含(i)编码氨基酸序列的核酸序列,所述氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,或(ii)(i)的核酸序列的全长互补序列。

在另一个优选的实施方案中,重组DNA构建体包含可操作地连接至少一种调控序列(如,在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸包含(i)核酸序列,所述核酸序列在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,或(ii)(i)的核酸序列的全长互补序列。

图15A至15I示出以下氨基酸序列的多重比对:SEQ ID NO:15、17、19、21、23、25、27、29、31、34、以及SEQ ID NO:35、36、37、和38。用生物信息计算包(Inc.,Madison,WI)的程序进行序列多重比对。具体地讲,使用Clustal V比对方法(Higgins和Sharp(1989)CABIOS.5:151-153),多重比对预设参数为空位罚分=10,空位长度罚分=10,成对比对预设参数为KTUPLE=1,空位罚分=3,窗口=5以及DIAGONALS SAVED=5。

图16显示图15A至15I中显示的EXST同源物的每对氨基酸序列的序列同一性百分比和趋异值。

在另一个优选的实施方案中,重组DNA构建体包含可操作地连接至少一种调控序列(如,在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码EXST或EXST样蛋白。

在另一方面,本发明包括抑制DNA构建体。

抑制DNA构建体优选包含至少一种调控序列(优选在植物中有功能的启动子),该调控序列可操作地连接至:(a)以下序列的全部或部分:(i)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,或(ii)所述(a)(i)的核酸序列的全长互补序列。或者(b)源自所关注的靶基因的有义链或反义链的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码EXST或EXST样蛋白;或(c)以下序列的全部或部分:(i)核酸序列,所述核酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,或(ii)所述(c)(i)的核酸序列的全长互补序列。该抑制DNA构建体优选包含共抑制构建体、反义构建体、病毒抑制构建体、发夹抑制构建体、茎环抑制构建体、产生双链RNA的构建体、RNAi构建体或小RNA构建体(如,siRNA构建体或miRNA构建体)。

应当理解(正如本领域技术人员将会理解的),本发明不仅仅涵盖这些具体的示例性序列。导致给定位点处产生化学上等价的氨基酸但不影响所编码多肽的功能特性的核酸片段中的改变是本领域众所周知的。因此,氨基酸丙氨酸(一种疏水性氨基酸)的密码子可被编码另一个疏水性较弱的残基(例如甘氨酸)或疏水性较强的残基(例如缬氨酸、亮氨酸或异亮氨酸)的密码子取代。类似地,导致一个带负电荷的残基替换为另一个带负电荷的残基(例如,天冬氨酸替代谷氨酸)或者一个带正电荷的残基替换为另一个带正电荷的残基(例如,赖氨酸替换精氨酸)的改变也可预期产生功能上等价的产物。导致多肽分子的N-末端和C-末端部分改变的核苷酸变化也将预计不会改变多肽的活性。所提出的修饰中的每一种均完全在本领域常规技术内,如测定所编码的产物的生物活性的保留。

“抑制DNA构建体”是在转化或稳定整合进植物基因组时,导致该植物中的靶基因“沉默”的重组DNA构建体。对该植物来说,该靶基因可以是内源性的或是转基因的。如本文针对靶基因所使用的,“沉默”通常指在由靶基因表达的mRNA或蛋白质/酶的水平上的抑制,和/或在酶活性或蛋白质功能性的水平上的抑制。术语“抑制”包括降低、减少、下调、减弱、抑制、消除或阻止。“沉默”或“基因沉默”不确定机理并且包括(并且不限于)反义、共抑制、病毒抑制、发夹抑制、茎环抑制、基于RNAi的方法以及基于小RNAi的方法。

抑制DNA构建体可包含源自所关注的靶基因的区域并且可包含所关注的靶基因的有义链(或反义链)的核酸序列的全部或部分。取决于所要利用的方法,该区域可与所关注基因的有义链(或反义链)的全部或部分100%相同或者具有少于100%同一性的同一性(如,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的同一性)。

抑制DNA构建体是本领域所熟知的,一旦选定所关注的靶基因就很容易构建,并且包括但不限于共抑制构建体、反义构建体、病毒抑制构建体、发夹抑制构建体、茎环抑制构建体、产生双链RNA的构建体,以及更通常的是,RNAi(RNA干扰)构建体和小RNA构建体,例如siRNA(短干扰RNA)构建体和miRNA(微RNA)构建体。

“反义抑制”指产生能够抑制靶蛋白表达的反义RNA转录物。

“反义RNA”指与靶初级转录物或mRNA的全部或部分互补,并阻断分离的靶核酸片段表达的RNA转录物(美国专利号:5,107,065)。反义RNA可与特定基因转录物的任何部分,即5′非编码序列、3′非编码序列、内含子或编码序列互补。

“共抑制”指产生能够抑制靶蛋白表达的有义RNA转录物。“有义”RNA指包括mRNA和在细胞内或体外能被翻译成蛋白质的RNA在内的RNA转录物。此前,已通过着眼于以有义方向过表达与内源mRNA具有同源性的核酸序列(其导致与过表达的序列具有同源性的所有RNA减少)设计出了植物中的共抑制构建体(参见Vaucheret等人,1998,Plant J.,16:651-659;以及Gura,2000Nature 404:804-808)。

另一种变型描述了将植物病毒序列用于引导对近端mRNA编码序列的抑制(于1998年8月20日公开的PCT专利公开WO 98/36083)。

此前描述的是“发夹”结构的利用,该结构以互补方向整合mRNA编码序列的全部或部分,导致已表达的RNA形成潜在的“茎环”结构(于1999年10月21日公开的PCT专利公开WO99/53050)。在这种情况下,茎由对应相对于启动子以有义或反义方向插入的相关基因的多核苷酸形成,并且环由一些相关基因的多核苷酸形成,在构建体中该多核苷酸不具有互补序列。这增加了获得的转基因植物中的共抑制或沉默频率。关于发夹抑制的综述,参见Wesley,S.V.等人,2003,Methods in Molecular Biology,PlantFunctional Genomics:Methods and Protocols 236:273-286。

其中茎由至少30个来自待抑制基因的核苷酸形成而环由任何的核苷酸序列形成的构建体也已经有效地用于抑制(于1999年12月2日公开的PCT专利公开WO 99/61632)。

使用聚-T和聚-A序列产生茎环结构中的茎已经有所描述(于2002年1月3日公开的PCT专利公开WO 02/00894)。

然而另一种变型涉及使用合成的重复序列来促进茎环结构中的茎的形成。用这种重组DNA片段产生的转基因生物体已经显示由形成茎环结构的核苷酸片段编码的蛋白质的水平降低,如于2002年1月3日公开的PCT专利公开WO 02/00904中所述。

RNA干扰是指由短干扰性RNA(siRNA)介导的动物中序列特异性转录后基因沉默的过程(Fire等人,Nature 391:8061998)。在植物中的对应过程通常称为转录后基因沉默(PTGS)或RNA沉默,并且在真菌中也称为阻抑作用(quelling)。据信转录后基因沉默过程是用于防止外来基因表达的进化保守性细胞防御机制,并且通常由不同植物区系和门所共有(Fire等人,Trends Genet.15:3581999)。这种防止外来基因表达的保护作用可能是通过特异性破坏病毒基因组RNA的同源单链RNA的细胞反应,响应源自病毒感染或源自转座因子随机整合到宿主基因组内的双链RNA(dsRNA)的生成而进化而来。dsRNA在细胞中的存在通过还没有完全表征的机制引发了RNAi反应。

细胞中长dsRNA的存在刺激了称为dicer的核糖核酸酶III的活性。Dicer涉及使dsRNA加工成称为短干扰RNA(siRNA)的短dsRNA片段(Berstein等人,Nature 409:3632001)。源自dicer活性的短干扰RNA的长度通常是约21至约23个核苷酸,并且包含约19个破基对的双链体(Elbashir等人,Genes Dev.15:188,2001)。Dicer还涉及从保守结构的前体RNA上切下21个和22个核苷酸的小时序RNA(stRNA),该小时序RNA参与翻译控制(Hutvagner等人,2001,Science 293:834)。RNAi响应还涉及内切核酸酶复合物,通常称为RNA诱导沉默复合物(RISC),其介导具有与siRNA双链体的反义链互补的序列的单链RNA的裂解。靶RNA的裂解在与siRNA双链体的反义链互补的区域中间发生(Elbashir等人,Genes Dev.15:188,2001)。此外,RNA干扰还涉及小RNA(如miRNA)介导的基因沉默,可推定是通过调节染色质结构并由此防止靶基因序列转录的细胞机制(参见(例如)Allshire,Science 297:1818-18192002;Volpe等人,Science 297:1833-18372002;Jenuwein,Science 297:2215-22182002;和Hall等人,Science 297:2232-22372002)。这样,本发明的miRNA分子可用于通过与RNA转录物相互作用或者作为另一种选择通过与特定基因序列相互作用来介导基因沉默,其中这样的相互作用导致在转录或转录后水平上的基因沉默。

已经在多种系统中研究了RNAi。Fire等人(Nature 391:806,1998)首次在秀丽隐杆线虫(C.elegans)中观察到RNAi。Wianny和Goetz(Nature Cell Biol.2:70,1999)描述了在小鼠胚胎中由dsRNA介导的RNAi。Hammond等人(Nature 404:293,2000)描述了在用dsRNA转染的果蝇(Drosophila)细胞中的RNAi。Elbashir等人(Nature 411:4942001)描述了通过将合成的21-核苷酸RNA的双链体引入包括人胚肾和HeLa细胞在内的培养的哺乳动物细胞中而诱导的RNAi。

小RNA在控制基因表达中起重要作用。很多发育过程(包括开花)的调节是由小RNA控制的。现在有可能通过使用在植物中产生小RNA的转基因构建体来以工程手段改变植物基因的基因表达。

小RNA似乎是通过与互补RNA或DNA靶序列碱基配对来行使功能的。当与RNA结合时,小RNA或者引发靶序列的RNA裂解或者引发翻译抑制。当与DNA靶序列结合时,据信小RNA可介导靶序列的DNA甲基化。无论具体机制是什么,这些事件的后果是基因表达受到抑制。

据认为,小RNA和它们的RNA靶标之间的序列互补性有助于确定采用了哪种机制(RNA裂解或翻译抑制)。据信,优选与它们的靶标互补的siRNA通过RNA裂解起作用。一些miRNA与它们的靶基因具有完全或几乎完全的互补性,并且对于至少一些这样的miRNA,已经证实了RNA裂解。其他miRNA与它们的靶标具有若干错配,并且在翻译水平上明显抑制了它们的靶标。同样,无需坚持特定的作用机理,出现了这样一种一般规律:完全或几乎完全的互补性引起RNA裂解,而当miRNA/靶标双链体含有许多错配时倾向于翻译抑制。对于此规律的一个明显例外是植物中微RNA 172(miR172)。miR172的其中一个靶标是APETALA2(AP2),尽管miR172与AP2具有几乎完全的互补性,但其表现出引起AP2的翻译抑制而不是引起RNA裂解。

微RNA(miRNA)是长度为约19至约24个核苷酸(nt)的已经在动物和植物中鉴定出的非编码RNA(Lages-Quintana等人,Science 294:853-858 2001,Lagos-Quintana等人,Curr.Biol.12:735-7392002;Lau等人,Science 294:858-862,2001;Lee和Ambros,Science 294:862-864,2001;Llave等人,Plant Cell 14:1605-1619,2002;Mourelatos等人,Genes.Dev.16:720-728,2002;Park等人,Curr.Biol.12:1484-1495,2002;Reinhart等人,Genes.Dev.16:1616-1626,2002)。它们是由大小为大约70至200nt的较长的前体转录物加工生成的,并且这些前体转录物能够形成稳定的发夹结构。在动物中,涉及加工miRNA前体的酶称为Dicer,这是一种核糖核酸酶III样蛋白(Grishok等人,Cell 106:23-342001;Hutvagner等人,Science 293:834-8382001;Ketting等人,Genes.Dev.15:2654-2659,2001)。植物也具有Dicer样酶,即DCL1(以前称为CARPEL FACTORY/SHORT INTEGUMENTS1/SUSPENSOR1),并且最近有证据表明,其像Dicer一样,也涉及发夹前体的加工以产生成熟miRNA(Park等人,Curr.Biol.12:1484-1495,2002;Reinhart等人,Genes.Dev.16:1616-1626,2002)。此外,最近的研究已经清楚地表明,至少某些miRNA发夹前体最初是作为较长的聚腺苷酸化转录物存在,并且在单个转录物中可存在几种不同的miRNA以及相关发夹(Lagos-Quintana等人,Science 294:853-8582001;Lee等人,EMBO J21:4663-46702002)。最近的研究还测定了从dsRNA产物的miRNA链选择,所述dsRNA产物是通过DICER加工发夹而产生的(Schwartz等人,2003,Cell 115:199-208)。看起来,经加工的dsRNA的两端的稳定性(即G∶C与A∶U的含量比,和/或错配)影响链选择,具有低稳定性的末端更容易因解旋酶活性而解旋。低稳定性末端的5′末端链被整合至RISC复合物内,而另一条链被降解。

微RNA看起来通过与位于由这些基因产生的转录物中的互补序列结合来调节靶基因。就lin-4和let-7而言,靶位点位于靶mRNA的3′非翻译区中(Lee等人,Cell 75:843-854,1993;Wightman等人,Cell 75:855-862,1993;Reinhart等人,Nature 403:901-906,2000;Slack等人,Mol.Cell 5:659-6692000),并且在lin-4和let-7miRNA与其靶位点之间有几个错配。lin-4或let-7miRNA的结合看起来引起了由靶mRNA编码的蛋白质的稳态水平下调,而不影响转录物自身(Olsen和Ambros,Dev.Biol.216:671-680,1999)。另一方面,最近有证据表明,在某些情况下,miRNA可引起靶转录物在靶位点内特异性RNA裂解,并且该裂解步骤看起来需要miRNA与靶转录物之间具有100%的互补性(Hutvagner和Zamore,Science 297:2056-2060 2002;Llave等人,Plant Cell 14:1605-1619 2002)。看起来有可能miRNA可进入至少两条靶基因调控途径:当靶互补性<100%时,蛋白下调,当靶互补性是100%时,RNA裂解。进入RNA裂解途径的微RNA与在动物中RNA干扰(RNAi)期间以及在植物中转录后基因沉默(PTGS)期间产生的21-25nt短干扰RNA(siRNA)类似(Hamilton和Baulcombe 1999;Hammond等人,2000;Zamore等人,2000;Elbashir等人,2001),并且可能整合进与在RNAi情况中观察到的复合物类似或相同的RNA-诱导的沉默复合物(RISC)内。

用生物信息学鉴定miRNA的靶标在动物中没有成功,这可能是因为动物miRNA与它们的靶标具有低水平的互补性。另一方面,生物信息学方法已经成功地用于预测植物miRNA的靶标(Llave等人,Plant Cell 14:1605-1619 2002;Park等人,Curr.Biol.12:1484-1495 2002;Rhoades等人,Cell 110:513-520 2002),因此,看起来植物miRNA与它们的推定靶标的整体互补性高于动物miRNA。植物miRNA的这些预测靶标中的大部分编码涉及植物发育模式或细胞分化的转录因子家族的成员。

本发明的重组DNA构建体(包括抑制DNA构建体)优选包含至少一种调控序列。

优选的调控序列是启动子。

多种启动子可用于本发明的重组DNA构建体(及抑制DNA构建体)中。可根据所需结果来选择启动子,并且可包括用于在宿主生物体中表达的组成型启动子、组织特异性启动子、细胞特异性启动子、诱导型启动子或其他启动子。

虽然候选基因当通过组成型启动子驱动表达时可预测其效应,但候选基因在35S或UBI启动子控制下的高水平、组成型表达可具有多重效应。

使用组织特异表达和/或胁迫特异表达可消除不需要的效应但保留改变根构造的能力。在拟南芥属中已经观察到了该效应(Kasuga等人(1999)Nature Biotechnol.17:287-291)。

适用于植物宿主细胞的组成型启动子包括(例如)Rsyn7启动子的核心启动子和在WO 99/43838和美国专利6,072,050中公开的其他组成型启动子;CaMV 35S核心启动子(Odell等人,Nature 313:810-812(1985));稻肌动蛋白(McElroy等人,Plant Cell 2:163-171(1990));泛素(UBI)(Christensen等人,Plant Mol.Biol.12:619-632(1989)和Christensen等人,Plant Mol.Biol.18:675-689(1992));pEMU(Last等人,Theor.Appl.Genet.81:581-588(1991));MAS(Velten等人,EMBO J.3:2723-2730(1984));ALS启动子(美国专利公开5,659,026)、玉米GOS2启动子(WO0020571A2,公布于2000年4月1日)等。其他组成型启动子包括例如在美国专利5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、5,608,142和6,177,611中公开的那些启动子。

在选择启动子用于本发明方法时,可能有利的是使用组织特异性启动子或发育调控启动子。

优选的组织特异性启动子或发育调控启动子是这样的DNA序列,该序列调节DNA序列选择性地在对雄穗发育、结籽或两者重要的植物细胞/组织中的表达,并限制这种DNA序列只在植物的雄穗发育或种子成熟期间表达。任何引起所需时空表达的可鉴定启动子均可用于本发明的方法中。

种子或胚特异性的并且可用于本发明的启动子包括大豆Kunitz胰蛋白酶抑制剂(Kti3,Jofuku和Goldberg,Plant Cell 1:1079-1093(1989))、马铃薯块茎特异蛋白(patatin)(马铃薯块茎)(Rocha-Sosa,M.等人,1989,EMBO J.8:23-29)、convicilin、豌豆球蛋白和豆球蛋白(豌豆子叶)(Rerie,W.G.等人,1991,Mol.Gen.Genet.259:149-157;Newbigin,E.J.等人,1990,Planta 180:461-470;Higgins,T.J.V.等人,1988,Plant.Mol.Biol.11:683-695)、玉米蛋白(玉米胚乳)(Schemthaner,J.P.等人,1988,EMBO J.7:1249-1255)、菜豆蛋白(菜豆子叶)(Segupta-Gopalan,C.等人,1985,Proc.Natl.Acad.Sci.U.S.A.82:3320-3324)、植物血球凝集素(菜豆子叶)(Voelker,T.等人,1987,EMBO J.6:3571-3577)、B-伴球蛋白和大豆球蛋白(大豆子叶)(Chen,Z-L等人,1988,EMBO J.7:297-302)、谷蛋白(稻胚乳)、大麦醇溶蛋白(大麦胚乳)(Marris,C.等人,1988,Plant Mol.Biol.10:359-366)、麦谷蛋白和麦醇溶蛋白(小麦胚乳)(Colot,V.等人,1987,EMBO J.6:3559-3564)和甘薯贮藏蛋白(sporamin)(甘薯块根)(Hattori,T.等人,1990,Plant Mol.Biol.14:595-604)。可操作地连接至嵌合基因构建体异源编码区的种子特异性基因的启动子在转基因植物中保持它们的时空表达模式。这样的实例包括在拟南芥属和甘蓝型油菜种子中表达脑啡肽的拟南芥属2S种子储藏蛋白基因启动子(Vanderkerckhove等人,Bio/Technology 7:L929-932(1989))、表达荧光素酶的菜豆凝集素和β-菜豆蛋白启动子(Riggs等人,Plant Sci.63:47-57(1989)),以及表达氯霉素乙酰转移酶的小麦谷蛋白启动子(Colot等人,EMBO J 6:3559-3564(1987))。

可诱导启动子响应内源性或外源性刺激的存在,例如,通过化合物(化学诱导剂),或响应环境、激素、化学信号和/或发育信号而选择性表达可操作地连接的DNA序列。可诱导的或受调控的启动子包括(例如)受光、热、胁迫、水涝或干旱、植物激素、创伤或诸如乙醇、茉莉酮酸酯、水杨酸或安全剂之类的化学品调控的启动子。

优选的启动子包括如下启动子:1)胁迫诱导型RD29A启动子(Kasuga等人,1999,Nature Biotechnol.17:287-91);2)大麦启动子B22E;B22E的表达是发育中的玉米籽粒中的柄所特异性的(“Primary Structureof a Novel Barley Gene Differentially Expressed in ImmatureAleurone Layers(在未成熟糊粉层中差异表达的新大麦基因的一级结构)”。Klemsdal,S.S.等人,Mol.Gen.Genet.228(1/2):9-16(1991));以及3)玉米启动子Zag2(“Identification and molecularcharacterization of ZAG1,the maize homolog of the Arabidopsisflora homeotic gene AGAMOUS(ZAG1-拟南芥属花同源异形基因AGAMOUS的玉米同系物的鉴定和分子表征)”,Schmidt,R.J.等人,Plant Cell 5(7):729-737(1993))。“Structural characterization,chromosomal localization and phylogenetic evaluation of two pairsof AGAMOUS-like MADS-box genes from maize(两对来自玉米的AGAMOUS样MADS-box基因的结构表征、染色体定位及系统发育评价)”,Theissen等人,Gene 156(2):155-166(1995);NCBI GenBank AccessionX80206))。Zag2转录物可在授粉前5天至授粉后(DAP)7至8天被检测到,并且引导Ciml在发育中的雌花序心皮中表达,Ciml对发育中的玉米籽粒的籽仁而言是特异性的。Ciml转录物在授粉前4至5天至授粉后6至8天被检测到。其他可用的启动子包括可源自其表达与发育中的雌小花母系相关的基因的任何启动子。

用于在植物中调节本发明的核苷酸序列表达的其他优选启动子是维管元件特异性启动子或茎优选启动子。这种茎优选启动子包括苜蓿S2A启动子(GenBank登录号:EF030816;Abrahams等人,Plant Mol.Biol.27:513-528(1995))和S2B启动子(GenBank登录号:EF030817)等等,将这些文献以引用的方式并入本文。

启动子可整个源于天然基因,或者由源于天然存在的不同启动子的不同元件构成,或者甚至包含合成的DNA片段。本领域内的技术人员应当理解,不同的启动子可在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件而引导基因的表达。还应认识到,由于在大多数情况下还不能完全确定调控序列的确切范围,一些变型的DNA片段可能具有相同的启动子活性。在多数情况下引起基因在大多数细胞型中表达的启动子通常称为“组成型启动子”。目前不断在发现可用于植物细胞中的不同类型的新启动子;在Okamuro,J.K.和Goldberg,R.B.,Biochemistry ofPlants 15:1-82(1989)的汇编中可找到许多实例。(将其与其他组成型启动子描述放在一起。)

优选的启动子可包括:RIP2、mLIP15、ZmCOR1、Rab17、CaMV 35S、RD29A、B22E、Zag2、SAM合成酶启动子、泛素启动子(SEQ ID NO:46)、CaMV 19S、nos、Adh、蔗糖合成酶启动子、R-等位基因启动子、根细胞启动子、维管组织特异性启动子S2A(Genbank登录号EF030816;SEQ ID NO:47)和S2B(Genbank登录号EF030817)及来自6260玉米的组成型启动子GOS2(SEQ ID NO:45)。其他优选的启动子包括根优选的启动子,例如玉米NAS2启动子(SEQ ID NO:44)、玉米Cyclo启动子(US2006/0156439,公开于2006年7月13日)、玉米ROOTMET2启动子(WO05063998,公开于2005年7月14日)、CR1BIO启动子(WO06055487,公开于2006年5月26日)、CRWAQ81(WO05035770,公开于2005年4月21日)和玉米ZRP2.47启动子(NCBI保藏号:U38790,gi:1063664)。

核苷酸序列的“主要部分”包含的核苷酸序列足以提供其包含的启动子的推定鉴定。核苷酸序列可由本领域技术人员来人工评价,或使用基于计算机的序列比较和鉴定工具进行评价,所述工具使用算法如BLAST(BasicLocal Alignment Search Tool;Altschul等人(1993)J.Mol.Biol.215:403-410)。一般来讲,为了推定鉴定启动子核酸序列是否与已知启动子同源,包含三十或更多个邻接核苷酸的序列是必需的。具有如本文报道序列的有益效果,技术人员现在可使用全部公布序列或它们的主要部分用于本领域技术人员已知的目的。因此,本发明包括在附随序列表中报道的完全序列,以及那些上述序列的主要部分。

本发明的重组DNA构建体(及抑制DNA构建体)也可包括其他调控序列,包括但不限于翻译前导序列、内含子和多腺苷酸化识别序列。在本发明的另一个优选的实施方案中,本发明的重组DNA构建体还包括增强子或沉默子。

内含子序列可加入到部分编码序列的5’非翻译区或编码序列以增加积聚在胞浆中的成熟信息的量。已经显示,在植物和动物两者的表达构建体的转录单位中包含可剪接内含子可使基因表达在mRNA和蛋白质水平上均增强高达1000倍。参见Buchman和Berg,Mol.Cell Biol.8:4395-4405(1988);Callis等人,Genes Dev.1:1183-1200(1987)。这种内含子对基因表达的增强通常在将其设置接近转录单位的5’端时为最大。玉米内含子Adh1-S内含子1、2和6、Bronze-1内含子的使用是本领域已知的。通常参见The Maize Handbook,第116章,Freeling和Walbot(编辑),Springer,纽约(1994)。

如果期望进行多肽表达,则通常希望在多核苷酸编码区的3′-端处包含有多腺苷酸化区。该多腺苷酸化区可源自天然基因,源自多种其他植物基因或源自T-DNA。要加入的3′端序列可源自(例如)胭脂碱合成酶或章鱼碱合成酶基因,或作为选择源自另外的植物基因,或较不优选的是源自任何其他真核基因。

“翻译前导序列”指位于基因启动子序列和编码序列之间的DNA序列。翻译前导序列存在于翻译起始序列的经完全加工后的mRNA上游。翻译前导序列可影响mRNA的初级转录过程、mRNA稳定性或翻译效率。翻译前导序列的实例已经有所描述(Turner,R.和Foster,G.MolecularBiotechnology 3:225(1995))。

在本发明的另一个优选的实施方案中,本发明的重组DNA构建体还包括增强子或沉默子。

任何植物均可选择用来鉴定将用于产生本发明重组DNA构建体和抑制DNA构建体的调控序列和基因。适用于分离基因和调控序列的靶植物的实例应该包括但不限于苜蓿、苹果、杏、拟南芥属植物、洋蓟、芝麻菜、芦笋、鳄梨、香蕉、大麦、豆类、甜菜、黑莓、蓝莓、西兰花、抱子甘蓝、卷心菜、卡诺拉、香瓜、胡萝卜、木薯、蓖麻、菜花、芹菜、樱桃、菊苣、芫荽、柑桔类、克莱门氏小柑橘类、三叶草、椰子、咖啡、玉米、棉、蔓越莓、黄瓜、花旗松、茄子、菊苣、茅菜、桉树、茴香、无花果、大蒜、葫芦、葡萄、柚子树、白兰瓜、豆薯、猕猴桃、生菜、韭葱、柠檬、酸橙、火炬松、亚麻子、芒果、甜瓜、蘑菇、油桃、坚果、燕麦、油棕、油菜、秋葵、橄榄树、洋葱、橙、观赏植物、棕榈、木瓜树、欧芹、欧洲防风草、豌豆、桃树、花生、梨树、胡椒、柿树、松树、菠萝、大蕉、李树、石榴树、白杨、马铃薯、南瓜、温柏、辐射松、红菊苣、萝卜、油菜、树莓、稻、黑麦、高粱、南方松、大豆、菠菜、南瓜、草莓、甜菜、甘蔗、向日葵、甘薯、枫香树、柑橘、茶、烟草、蕃茄、黑小麦、草皮草、芜菁、葡萄树、西瓜、小麦、薯蓣和西葫芦。用于鉴定调控序列的特别优选的植物是拟南芥属植物、玉米、小麦、大豆和棉。

优选的组合物

本发明的优选组合物是其基因组中包含本发明的任何重组DNA构建体(包括任何抑制DNA构建体)(例如上面所讨论的那些优选构建体)的植物。优选的组合物也包括任何植物的子代,以及获取自植物或其子代的任何种子,其中所述子代或种子在其基因组中包含重组DNA构建体(或抑制DNA构建体)。子代包括通过植物的自花授粉或异型杂交而获得的连续世代。子代也包括杂交种和近交系。

优选地,在杂交种子繁殖的农作物中,成熟的转基因植物可自花授粉而产生纯合的近交系植物。该近交系植物产生含有新引入的重组DNA构建体(或抑制DNA构建体)的种子。这些种子可生长而产生将会表现出改变的根(或植物)构造,或者可用于育种程序以产生杂交种子,这些杂交种子可生长而产生将会表现出改变的根(或植物)构造的植物。优选地,种子是玉米。

优选地,植物是单子叶植物或双子叶植物,更优选地,是玉米或大豆植物,甚至更优选的是玉米植物,例如玉米杂交种植物或玉米近交系植物。植物还可以是向日葵、高梁、蓖麻、葡萄、卡诺拉、小麦、苜蓿、棉、稻、大麦或小米。

优选地,重组DNA构建体稳定地整合进植物的基因组中。

尤其优选的实施方案包括但不限于如下优选的实施方案:

1.在基因组中包含重组DNA构建体的植物(优选玉米或大豆植物),该重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,并且其中所述植物在与未包含所述重组DNA构建体的对照植物进行比较时表现出改变的根构造。优选地,在与该对照植物比较时,该植物还表现出至少一种农学特性的改变。

2.植物(优选地玉米或大豆植物),所述植物在其基因组中包含:重组DNA构建体,所述重组DNA构建体包含:

(a)可操作地连接至少一种调控元件的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性,或

(b)抑制DNA构建体,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:

(i)以下序列的全部或部分:(A)编码多肽的核酸序列,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%的序列同一性,或(B)(b)(i)(A)的核酸序列的全长互补序列;或

(ii)源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%的序列同一性,并且其中所述所关注的靶基因编码EXST或EXST样多肽,并且其中在与未包含所述重组构建体的对照植物比较时,所述植物表现出至少一种农学特性的改变。

3.在基因组中包含重组DNA构建体的植物(优选玉米或大豆植物),该重组DNA构建体包含可操作地连接至少一种调控序列的多核苷酸,其中所述多核苷酸编码EXST或EXST样蛋白,并且其中在与未 包含所述重组DNA构建体的对照植物比较时,所述植物表现出改变的根构造。优选地,该植物还表现出至少一种农学特性的改变。优选地,该EXST或EXST样蛋白来自拟南芥属(Arabidopsisthaliana)、玉米(Zea mays)、大豆(Glycine max)、烟豆(Glycine tabacina)、野大豆(Glycine soja)和短绒野大豆(Glycine tomentella)。

4.在基因组中包含抑制DNA构建体的植物(优选玉米或大豆植物),该抑制DNA构建体包含至少一种可操作地连接至源自所关注的靶基因的有义链或反义链的全部或部分的区域的调控元件,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码EXST或EXST样蛋白,并且其中在与未包含所述重组DNA构建体的对照植物比较时,所述植物表现出至少一种农学特性的改变。

5.在基因组中包含抑制DNA构建体的植物(优选玉米或大豆植物),该抑制DNA构建体包含至少一种可操作地连接至以下序列的全部或部分的调控元件:(a)编码多肽的核酸序列,在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34比较时,基于Clustal V比对方法,该多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(b)(a)的核酸序列的全长互补序列,并且其中在与未包含所述重组构建体的对照植物比较时,所述植物表现出至少一种农学特性的改变。

6.上述优选实施方案1-5中的植物的任何子代、上述优选实施方案1-5中的植物的任何种子、上述优选实施方案1-5中的植物的子代的任何种子以及来自上述优选实施方案1-5中的植物以及它们的子代的细胞。

在上述优选的实施方案1-6或本发明的任何其他实施方案中的任一项中,重组DNA构建体(或抑制DNA构建体)优选包含至少一种在植物中有功能的启动子作为优选的调控序列。

在上述优选的实施方案1-6或本发明的任意其他实施方案中的任一项中,至少一种农学特性的改变是增加或减少,优选增加。

在任一前述的优选实施方案1-6或本发明的任何其他实施方案中,至少一种农学特性优选选自:绿度、产量、生长速率、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物含氮量、果实含氮量、种子含氮量、营养组织中的含氮量、总植物游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、营养组织游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织蛋白质含量、抗涝性、氮摄取、根倒伏、茎倒伏、植株高度、穗长以及收获指数;产量、绿度、生物量和根倒状是尤其优选进行改变的农学特性(优选增加)。

在任一前述的优选实施方案1-6或本发明的任何其他实施方案中,在与对照植物比较时,植物优选表现出至少一种与环境条件例如水和营养物质的可用性无关的农学特性的改变。

本领域的普通技术人员熟悉测定植物根构造改变的规程。例如,可检测分析转基因玉米植物的根构造在幼苗期、花期或成熟期的改变。根构造的改变可通过统计温室培育的植物顶部第3或第4节的节根数目或根带的宽度来测定。“根带”指成熟期植物在花盆底部的根丛宽度。植物根构造变化的其他量度包括但不限于侧根的数量、节根的平均根直径、侧根的平均根直径、根毛的数量和长度。侧根分枝的程度(如侧根数量、侧根长度)可通过这样测定:从完整的根系进行二次取样,将样本用平面扫描器或数码相机成像并用WinRHIZOTM软件(Regent Instruments Inc.)分析。

对提取的有关根表型的数据进行统计分析(通常为t检验),以将转基因根与非转基因姊妹株植株的根进行比较。在多个事件和/或构建体涉及该分析的情况下,还可使用单因素方差分析。

下面的实施例描述了一些用于检测根构造改变的代表性规程和技术。

也可通过在田间测试中,在相同条件下比较植物与对照或参照植物提高产量的能力,来评价植物根构造的改变。

也可通过在田间测试中比较植物在胁迫条件下(例如营养物质过剩或受限、水过剩或受限、存在病害)保持基本产量(优选地至少75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%产量)的能力,与非胁迫条件下的对照或参照植物的产量,来评价根构造改变。

根构造的改变可通过测定转基因植物较于参照植物或对照植物的抗根倒伏性来测量。

在评价或测量其中利用了对照或参照植物的本发明任何实施方案(如,如本文描述的组合物或方法)中的转基因植物的农学特性或表型时,本领域的普通技术人员将很容易认识到要利用的合适对照或参照植物。例如,通过如下非限制性示例来说明:

1.转化过的植物的子代,该转化过的植物对于重组DNA构建体(或抑制DNA构建体)来说是半合子的,使得该子代分离成包含或不包含该DNA构建体(或抑制DNA构建体)的植株:包含该重组DNA构建体(或抑制DNA构建体)的子代将通常相对于未包含该重组DNA构建体(或抑制DNA构建体)的子代来进行测量(即,未包含该重组DNA构建体(或抑制DNA构建体)的子代是对照或参照植株)。

2.重组DNA构建体(或抑制DNA构建体)基因渗入至近交系中,例如在玉米中,或基因渗入进变种中,例如在大豆中:基因渗入品系将通常相对于亲本近交系或变种品系进行测量(即,亲本近交系或变种品系是对照或参照植物)。

3.双杂交系,其中第一杂交系由两个亲本近交系产生,而第二杂交系由相同的两个亲本近交系产生,不同的是其中一个亲本近交系含有重组DNA构建体(或抑制DNA构建体):第二杂交系通常将相对于第一杂交系进行测量(即亲本近交系或变种品系为对照植物或参照植物)。

4.包含重组DNA构建体(或抑制DNA构建体)的植株:该植株可相对于这样的对照植株进行评价或测量,该对照植株不包含重组DNA构建体(或抑制DNA构建体),但具有与该植株相当的遗传背景(例如,与包含重组DNA构建体(或抑制DNA构建体)的植株相比较,核遗传物质具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性)。存在许多可用于分析、比较和表征植物遗传背景的基于实验室的技术;其中这些技术是同工酶电泳、限制性片段长度多态性(RFLP)、随机扩增多态性DNA(RAPD)、任何引物聚合成酶链反应(AP-PCR)、DNA扩增指纹(DAF)、序列特异扩增区域(SCAR)、扩增片段长度多态性和也称为微卫星的简单序列重复(SSR)。

此外,本领域的普通技术人员将容易认识到,评价或测量转基因植物的农学特性或表型时合适的对照或参照植物将不包括先前已经针对所需的农学特性或表型通过诱变或转化而选择的植物。

优选的方法

优选的方法包括但不限于用于改变植物根构造的方法、用于评价植物根构造改变的方法、用于改变植物农学特性的方法、用于测定植物农学特性改变的方法以及用于产生种子的方法。优选地,植物是单子叶植物或双子叶植物,更优选地,是玉米或大豆植物,甚至更优选地,是玉米植物。植物还可以是向日葵、高梁、蓖麻、卡诺拉、小麦、苜蓿、棉、稻、大麦或小米。种子优选的是玉米或大豆种子,更优选的是玉米种子,并且甚至更优选的是玉米杂交种种子或玉米近交系种子。

特别优选的方法包括但不限于如下方法:

改变植物根构造的方法,该方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一种调控序列(优选在植物中有功能的启动子)的多核苷酸,其中该多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性;以及(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体并且在与未包含该重组DNA构建体的对照植物比较时表现出改变的根构造。所述方法可进一步包括(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含该重组DNA构建体并且在与未包含该重组DNA构建体的对照植物比较时表现出改变的根构造。

改变植物根构造的方法,该方法包括:(a)将包含至少一种调控序列(优选在植物中有功能的启动子)的抑制DNA构建体导入可再生植物细胞中,该调控序列可操作地连接至:

(i)以下序列的全部或部分:(A)编码多肽的核酸序列,在与SEQID NO:15、17、19、21、23、25、27、29、31、或34比较时,基于Clustal V比对方法,该多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(B)

(a)(i)(A)的核酸序列的全长互补序列;或

(ii)源自所关注的靶基因的有义链或反义链的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码EXST或EXST样多肽;以及

(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体并且在与未包含该抑制DNA构建体的对照植物比较时表现出改变的根构造。所述方法可进一步包括(c)获得源自该转基因植物的子代植物,其中所述子代植物在其基因组中包含该重组DNA构建体并且在与未包含该抑制DNA构建体的对照植物比较时表现出改变的根构造。

评价植物根构造改变的方法,该方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一种调控序列(优选在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,或(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;以及(c)评价与未包含该重组DNA构建体的对照植物比较时该转基因植物的根构造;该方法还可包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(e)评价与未包含该重组DNA构建体的对照植物比较时该子代植物的根构造。

评价植物根构造改变的方法,所述方法包括:(a)将包含至少一种调控序列(优选在植物中有功能的启动子)的抑制DNA构建体导入可再生植物细胞中,该调控序列可操作地连接至:

(i)以下序列的全部或部分:(A)编码多肽的核酸序列,在与SEQID NO:15、17、19、21、23、25、27、29、31、或34比较时,基于Clustal V比对方法,该多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,或(B)所述(a)(i)(A)的核酸序列的全长互补序列;或者(ii)源自所关注的靶基因的有义链或反义链的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%的序列同一性,并且其中所述所关注的靶基因编码EXST或EXST样多肽;以及

(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;以及(c)评价该转基因植物在与未包含该抑制DNA构建体的对照植物比较时改变的根构造。该方法可另外包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(e)评价该子代植物在与未包含该抑制DNA构建体的对照植物比较时改变的根构造。

评价植物根构造改变的方法,该方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一种调控序列(优选在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,所述多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该重组DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(d)评价该子代植物在与未包含该重组DNA构建体的对照植物比较时改变的根构造。

评价植物根构造的方法,所述方法包括:

(a)将抑制DNA构建体引入到可再生的植物细胞中,所述抑制DNA构建体包含至少一种调控元件,所述调控元件可操作地连接至:(i)以下序列的全部或部分:(A)编码多肽的核酸序列,在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34比较时,基于Clustal V比对方法,该多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(B)所述(a)(i)(A)的核酸序列的全长互补序列;或者(ii)源自所关注的靶基因的有义链或反义链的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码EXST或EXST样多肽;(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及(d)评价与未包含该抑制DNA构建体的对照植物比较时该子代植物的根构造。

测定植物农学特性改变的方法,该方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一种调控序列(优选在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34比较时,基于Clustal V比对方法,该多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,(b)在步骤(a)后,从可再生植物细胞中再生转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体;以及(c)测定该转基因植物在与未包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。该方法还可包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;以及(e)测定该子代植物在与未包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。

测定植物农学特性改变的方法,该方法包括:(a)将抑制DNA构建体引入到可再生的植物细胞中,该抑制DNA构建体包含至少一种调控序列(优选在植物中有功能的启动子),所述调控序列可操作地连接以下序列的全部或部分:(i)核酸序列,该核酸序列编码多肽,该多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(ii)所述(i)的核酸序列的全长互补序列;(b)在步骤(a)之后从可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;以及(c)测定该转基因植物在与未包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。该方法可另外包括:(d)获得源自该转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(e)测定该子代植物在与未包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。

测定植物农学特性改变的方法,该方法包括:(a)将重组DNA构建体引入到可再生的植物细胞中,该重组DNA构建体包含可操作地连接至少一种调控序列(优选在植物中有功能的启动子)的多核苷酸,其中所述多核苷酸编码多肽,在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34比较时,基于Clustal V比对方法,该多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,(b)在步骤(a)后,从可再生植物细胞中再生转基因植物,其中所述转基因植物在其基因组中包含所述重组DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该重组DNA构建体;并且(d)测定该子代植物在与未包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。测定植物中农学特性改变的方法可进一步包括:测定所述转基因植物在不同的环境条件下与未包含所述重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。

测定植物农学特性改变的方法,该方法包括:(a)将抑制DNA构建体引入到可再生的植物细胞中,该抑制DNA构建体包含至少一种调控序列(优选在植物中有功能的启动子),所述调控序列可操作地连接以下序列的全部或部分:(i)核酸序列,该核酸序列编码多肽,该多肽的氨基酸序列基于Clustal V比对方法在与SEQ ID NO:15、17、19、21、23、25、27、29、31、或34进行比较时具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,或(ii)所述(i)的核酸序列的全长互补序列;

(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;(c)获得源自所述转基因植物的子代植物,其中该子代植物在其基因组中包含该抑制DNA构建体;以及(d)测定该子代植物在与未包含该重组DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。

测定植物农学特性改变的方法,所述方法包括:(a)将抑制DNA构建体引入到可再生的植物细胞,该抑制DNA构建体包括至少一种调控元件,该调控元件可操作地连接至源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码EXST或EXST样多肽;(b)在步骤(a)之后从该可再生植物细胞再生出转基因植物,其中该转基因植物在其基因组中包含该抑制DNA构建体;以及(c)测定所述转基因植物在与未包含所述抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。所述方法可进一步包括:(d)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及(e)测定该子代植物在与未包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。

测定植物农学特性改变的方法,所述方法包括:(a)将抑制DNA构建体引入到可再生的植物细胞,该抑制DNA构建体包括至少一种调控元件,该调控元件可操作地连接至源自所关注的靶基因的有义链或反义链的全部或部分的区域,当与所述区域所来源的有义链或反义链的全部或部分比较时,基于Clustal V比对方法,所述区域的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、56%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,并且其中所述所关注的靶基因编码EXST或EXST样蛋白;(b)在步骤(a)之后,从可再生的植物细胞再生出转基因植物,其中所述转基因植物在其基因组中包含所述抑制DNA构建体;(c)获得源自所述转基因植物的子代植物,其中所述子代植物在其基因组中包含所述抑制DNA构建体;以及(d)测定该子代植物在与未包含该抑制DNA构建体的对照植物比较时是否表现出至少一种农学特性的改变。

产生种子(优选可作为提供改变的根构造的产品销售的种子)的方法,该方法包括任一上述的优选方法,并且还包括从所述子代植物获得种子,其中所述种子在其基因组中包含所述重组DNA构建体(或抑制DNA构建体)。

在任一前述的优选方法或本发明方法的任何其他实施方案中,测定转基因植物中农学特性改变的步骤(如果适用的话)可优选地包括测定在改变的环境条件下与不包含重组DNA构建体的对照植物进行比较时该转基因植物是否表现出至少一种农学特性的改变。

在任一前述的优选方法或本发明方法的任何其他实施方案中,测定子代植物中农学特性改变的步骤(如果适用的话)可优选地包括测定在改变的环境条件下与不包含重组DNA构建体的对照植物进行比较时该子代植物是否表现出至少一种农学特性的改变。

在任何前述的优选方法或本发明方法的任何其他实施方案中,在所述导入步骤中所述可再生的植物细胞优选地包括愈伤组织细胞(优选胚胎)、配子细胞、分生细胞或未成熟胚芽细胞。可再生的植物细胞优选来自近交系玉米植物。

在任一上述的优选方法或本发明方法的任何其他实施方案中,所述再生步骤优选包括:(i)在包含促进胚发生的激素的培养基中培育所述转化的植物细胞直至观察到愈伤组织;(ii)将所述步骤(i)的转化的植物细胞转移至包含促进组织机体形成的激素的第一培养基;以及(iii)在第二培养基上传代培养步骤(ii)后的所述转化的植物细胞,以允许嫩芽伸长、根发育或这两者同时发生。

在任一前述的优选方法或本发明方法的任何其他实施方案中,存在供选择的替代方案用于将包含可操作地连接至少一种调控序列上的多核苷酸的重组DNA构建体导入可再生的植物细胞。例如,可将调控序列(例如一种或多种增强子、优选地作为转位因子的部件)导入可再生的植物细胞,然后筛选其中将所述调控序列可操作地连接至编码本发明多肽的内源基因的事件。

将本发明的重组DNA构建体引入植物可通过任何合适的技术来进行,这些技术包括但不限于引导DNA摄取、化学处理、电穿孔、显微注射、细胞融合、感染、载体介导的DNA转移、轰击或农杆菌介导转化。

在任一上述的优选方法或本发明方法的任何其他实施方案中,至少一种农学特性优选选自:绿度、产量、生长速率、生物量、成熟时的鲜重、成熟时的干重、果实产量、种子产量、总植物含氮量、果实含氮量、种子含氮量、营养组织含氮量、总植物游离氨基酸含量、果实游离氨基酸含量、种子游离氨基酸含量、营养组织游离氨基酸含量、总植物蛋白质含量、果实蛋白质含量、种子蛋白质含量、营养组织蛋白质含量、抗涝性、氮摄取、根倒伏、茎倒伏、植株高度、穗长、茎倒伏以及收获指数。产量、绿度、生物量和根倒状是尤其优选进行改变的农学特性(优选增加)。

在任一上述的优选方法或本发明方法的任何其他实施方案中,在与对照植物比较时,植物优选表现出至少一种与环境条件无关的农学特性的改变。

将本发明的重组DNA构建体引入植物可通过任何合适的技术来进行,这些技术包括但不限于引导DNA摄取、化学处理、电穿孔、显微注射、细胞融合、感染、载体介导的DNA转移、轰击或农杆菌介导转化。

优选的技术如下文实施例所示,用于转化玉米植物细胞和大豆植物细胞。

用于转化双子叶植物(主要通过利用根癌农杆菌(Agrobacteriumtumefaciens)(以及获得转基因植物的其他优选方法包括公开的用于棉的那些(美国专利5,004,863、美国专利5,159,135、美国专利5,518,908);用于大豆的那些(美国专利5,569,834、美国专利5,416,011、McCabe等人,Bio/Technology 6:923(1988),Christou等人,PlantPhysiol.87:671674(1988));用于芸苔属植物(Brassica)的那些(美国专利5,463,174);用于花生的那些(Cheng等人,Plant Cell Rep.15:653657(1996),McKently等人,Plant Cell Rep.14:699 703(1995));用于番木瓜的那些;以及用于豌豆的那些(Grant等人,Plant Cell Rep.15:254258,(1995))。

用电穿孔、粒子轰击和农杆菌转化单子叶植物也已有报道并且作为优选的方法包括(例如)如在天门冬属(asparagus)中实现的转化和植物再生(Bytebier等人,Proc.Natl.Acad.Sci.U.S.A.84:5354,(1987));在大麦中实现的转化和植物再生(Wan和Lemaux,PlantPhysiol.104:37(1994));在玉米中实现的转化和植物再生(Rhodes等人,Science 240:204(1988);Gordon-Kamm等人,Plant Cell 2:603 618(1990);Fromm等人,Bio/Technology 8:833(1990);Koziel等人,Bio/Technology 11:194,(1993);Armstrong等人,CropScience 35:550-557(1995));在燕麦中实现的转化和植物再生(Somers等人,Bio/Technology 10:1589(1992));在鸭茅中实现的转化和植物再生(Horn等人,Plant Cell Rep.7:469(1988));在稻中实现的转化和植物再生(Toriyama等人,Theor.Appl.Genet.205:34,(1986);Part等人,Plant Mol.Biol.32:1135 1148,(1996);Abedinia等人,Aust.J.Plant Physiol.24:133 141(1997);Zhang和Wu,Theor.Appl.Genet.76:835(1988);Zhang等人,Plant Cell Rep.7:379,(1988);Battraw和Hall,Plant Sci.86:191 202(1992);Christou等人,Bio/Technology 9:957(1991));裸麦(De la Pena等人,Nature 325:274(1987));在甘蔗中实现的转化和植物再生(Bower和Birch,Plant J.2:409(1992));在高羊茅(tall fescue)中实现的转化和植物再生(Wang等人,Bio/Technology 10:691(1992))和在小麦中实现的转化和植物再生(Vasil等人,Bio/Technology 10:667(1992);美国专利5,631,152)。

存在多种用于从植物组织再生植物的方法。再生的具体方法将取决于起始植物组织以及要再生的具体植物物种。

从单植物原生质体转化体或从多种经转化的外植体再生、发育和培育植物是本领域所熟知的(Weissbach和Weissbach(编辑),载于:Methodsfor Plant Molecular Biology,Academic Press,Inc.San Diego,CA,(1988))。该再生和生长方法通常包括如下步骤:选择转化的细胞、培养这些单独化的细胞通过胚发育的通常阶段以及通过生根小植株阶段。转基因胚以及种子以类似的方式再生。随后将所得的转基因的生根小苗种植在诸如土壤之类的合适植物生长培养基中。

含有编码所关注蛋白质的外来的外源性分离核酸片段的植物的发育或再生是本领域所熟知的。优选地,将再生的植物进行自花授粉以产生纯合的转基因植物。或者,将得自再生植物的花粉与农学上重要的品系的产生种子的植株进行杂交。相反,将来自这些重要品系的植物用于给再生植物授粉。利用本领域技术人员所熟知的方法培育含有所需多肽的本发明的转基因植物。

在另一方面,本发明也涉及与改变根构造和/或改变植物至少一种农学特性有关的对基因变异进行作图的方法,所述方法包括:

(a)使两种植物品种杂交;并且

(b)在得自步骤(a)的杂交的子代植物中针对以下序列来评价基因变异:

(i)选自SEQ ID NO:14、16、18、20、22、24、26、28、30或33的核酸序列;或

(ii)编码选自SEQ ID NO:15;17、19、21、23、25、27、29、31或34的多肽的核酸序列,

其中所述评价是使用选自下组方法进行的:RFLP分析、SNP分析、和基于PCR的分析。

在另一个实施方案中,本发明涉及改变根构造和/或改变植物至少一种农学特性的分子育种方法,所述方法包括:

(a)使两种植物品种杂交;并且

(b)在得自步骤(a)的杂交的子代植物中针对以下序列来评价基因变异:

(i)选自SEQ ID NO:14、16、18、20、22、24、26、28、30或33的核酸序列;或

(ii)编码选自SEQ ID NO:15;17、19、21、23、25、27、29、31或34的多肽的核酸序列;

其中所述评价是使用选自下组方法进行的:RFLP分析、SNP分析、和基于PCR的分析。

术语“对基因变异进行作图”或“对基因变异性进行作图”可互换使用,并且定义了鉴定DNA序列中在不同植物品系、栽培变种、品种、家族、或物种之间存在差异的基因区域内天然发生或诱导发生的变化的方法。甚至由于极少的碱基变化导致的在特定位点(基因)的基因变异性能够改变可能生成的限制酶消化片段的形式。病原体变成基因型可能是由于被分析基因内的删除或插入导致,或者甚至只是由于能够产生或删除限制酶识别位点的单个核苷酸取代导致。RFLP分析利用这一方法并且利用具有对应于受关注的分离核酸片段的探针的Southern印迹法。

因此,如果多态性(即,基因或DNA片段中普遍存在的变型;也指在相同物种内存在若干形式的基因(等位基因))产生或破坏一个限制性核酸内切酶裂解位点,或者如果它导致DNA丢失或插入(例如可变的核苷酸串联重复(variable nucleotide tandem repeat,VNTR)多态性),将改变能用限制性核酸内切酶消化生成的DNA片段的大小或特征。同样地,通过限制性片段分析能将具有变异序列的个体与那些具有初始序列的个体区分开来。将能用该方法鉴定的多态性称为“限制性片段长度多态性:(“RFLP”)。RFLP已经被广泛应用于人类和植物基因分析(Glassberg,UK专利申请2135774;Skolnick等人,Cytogen.Cell Genet.32:58-67(1982);Botstein等人,Ann.J.Hum.Genet.32:314-331(1980);Fischer等人(PCT专利申请WO 90/13668;Uhlen,PCT专利申请WO 90/11369)。

“单核苷酸多态性”或“SNP”的中心属性是多态性位点位于单个核苷酸上。据报道,SNP具有对RFLP或VNTR的某些优点。首先,SNP比其它类型的多态性更稳定。它们的自发突变率为大约10-9(Kornberg,DNAReplication,W.H.Freeman & Co.,San Francisco,1980),比VNTR(美国专利公开5,679,524)的频率低了大约1,000倍。其次,SNP的发生频率更高,并且比RFLP和VNTR更一致。因为SNP由序列变异产生,可通过随机基因组测序或cDNA分子测序来鉴定新的多态性。SNP也能由删除、点突变和插入产生。任何单个碱基改变,无论其起因,均可能是SNP。SNP的更高频率意味着它们可能比其它类别的多态性更易于鉴定。

SNP能够使用多种方法中的任何一种进行鉴定。此类方法包括直接的或间接的位点测序、使用限制性酶(其中位点相应的等位基因产生或破坏限制性位点)、使用等位基因特异性杂交探针、使用由多态性的不同等位基因或者其它生化物质编码的蛋白的特异抗体。SNP能通过许多方法进行测序。可使用两种基本方法进行DNA测序,Sanger等人的链终止法,Proc.Natl.Acad.Sci.(U.S.A.)74:5463-5467(1977),以及Maxam和Gilbert的化学降解法,Proc.Natl.Acad.Sci.(U.S.A.)74:560-564(1977)。

此外,可通过改进的PCR技术检测单点突变,例如连接酶链反应(“LCR”)和PCR-单链构象多态性(“PCR-SSCP”)分析。也能使用PCR技术鉴定极少量样本中的基因表达水平,例如来自主体的组织或细胞。该技术称为反转录-PCR(“RT-PCR”)。

术语“分子育种”定义了在育种过程期间跟踪分子标记的方法。将分子标记与所期望的表型特征相连是普遍的。通过跟踪分离的分子标记或基因特征,而不是对表型进行评分,育种过程能通过种植更少的植物并免于对表型变型进行检测分析或目测而加快。该过程中有用的分子标记包括但不限于鉴定前文提到的可作图的基因变异时可用的任何标记,以及显示跨植物物种的同线性的任何紧接的基因。术语“同线性”指不同生物之间的基因组上的保守基因位置/顺序。这意味着发现两个或更多个基因位点(可以是紧接的,或者可以是不紧接的)位于不同物种间的相同基因组上。同线性的另一个术语是“基因组共线性”。

基因作图的目的是为了鉴定产生受关注的表型的基因。作图的第一阶段通常是定位染色体的普通区域,该区域与受关注的表型的传送有关。接下来鉴定该基因和最后的特定等位基因是否具有诱发作用。

关联作图一般分成两大类:1)候选基因关联作图,它与选择的候选基因的多态性有关,所述候选基因声称对控制特定性状的表型变异具有作用;和2)全基因组关联作图,或者基因组扫描,它检测整个基因组的基因变异以寻找关联多个复杂特性的信号。

在候选基因关联作图中,基于以前来自突变分析、生物化学途径、或所关注特性的关联分析的知识来选择候选基因。需要对一组独立的随机标记评分以推断基因关系。

全基因组关联作图是用于系统搜索基因组的因果基因变异的综合方法。测试大量标记以关联多个复杂特性,并且不需要预先知道关于候选基因的信息。(Zhu等人(2008)The Plant Genome,1:5-20)。

实施例

本发明将在下面的实施例中进一步说明,其中份数和百分比是以重量计并且度数是摄氏度,除非另外说明。应当理解,尽管这些实施例说明了本发明的优选实施方案,但仅是以例证的方式给出的。根据上面的论述和这些实施例,本领域的技术人员可以确定本发明的基本特征,并在不脱离本发明的精神和范围的情况下,可对本发明做出多种改变和修饰,以使其适用于多种用法和条件。因此,除了那些本文所示和描述的那些之外,根据前文所述,本发明的各种修改形式对本领域的技术人员来说将是显而易见的。这些修改形式也旨在属于所附权利要求书的范围内。

实施例1

制备具有激活标记基因的拟南芥属种群

构建18.5kb的T-DNA基二元构建体,pHSbarENDs2(图1;SEQ IDNO:1;)包含四个来源于花椰菜花叶病毒35S启动子的四个多聚增强子元件,对应于序列-341至-64,如Odell等人(1985)Nature 313:810-812所述。该构建体也包含允许质粒救援的载体序列(pUC9)、再动员T-DNA的转座子序列(Ds)、以及允许草胺磷选择转基因植物的bar基因。仅将从右边界(RB)至左边界(LB)包含的10.8kb片段转移到寄主植物基因组中。因为增强子元件位于靠近RB处,它们可诱导T-DNA整合后的基因组位点顺式激活。

将pHSbarENDs2构建体转化到根癌农杆菌菌株C58中,在25℃下在LB中培养至OD600~1.0。然后离心沉淀细胞,并重悬在相等体积的5%蔗糖/0.05%Silwet L-77(OSI Specialties,Inc)中。在早期抽薹时,培育拟南芥属生态型Col-0的土壤使用农杆菌悬浮液进行顶部灌溉。一周后,相同植株再次用在蔗糖/Silwet中的相同农杆菌菌株进行顶部灌溉。然后将该植物的种子设为标准。所得T1种子在土壤中播种,通过喷洒草胺磷(AgrEvo;Bayer Environmental Science)选择转基因幼苗。从大约35,000个单个草胺磷抗性T1植株中收集T2种子。培养T2植株并收集来自96个分离T2品系的相同体积的T3种子。这组成了360个亚群。

选择了总计100,000个草胺磷抗性T1幼苗。分开保存来自每个品系的T2种子。

实施例2A

筛选以鉴定具有改变根构造的品系(非限制性氮条件)

在与早期发育期间来自如实施例1所述的种群的对照幼苗进行比较时,可分析在不限制氮条件下培养的具有激活标记的拟南芥属幼苗的根系构造。

来自每个96,000个分离T1激活标记品系的十个T2种子可用氯气进行灭菌并种植在培养皿上,培养皿包含以下培养基:0.5x N-FreeHoagland’s,60mM KNO3,0.1%蔗糖,1mM MES和1%PhytagelTM。通常将10个平板置于架子中。平板在4℃下保存三天以使种子分层,然后在22℃光照和20℃黑暗垂直保持11天。光周期为16h;8h黑暗,平均光照强度为~180μmol/m2/s。架子(通常每个装有10个平板)在每个搁板中每日旋转。在第14天,评价平板的幼苗状态,拍摄整个平板的数字图像并分析根面积。将平板随机分成10个水平区域。在板上10个水平区域的每个区域中的根面积以总面积百分比表示。仅仅使用区域3至9的面积进行品系根总面积计算。可使用ICORIA开发的Rootbot图像分析工具(专有)评价根面积。根总面积以mm2表示。

期望具有增加的根生长特性的品系位于根分布区域的上端。假定架子有最多两个异常值,可使用滑动窗方法评价给定架子的根区域的变化。包括生长培养基、温度、和湿度在内的多个因素的环境变量可引起根生长的显著改变,尤其是在播种期间更是如此。因此根据播种日期和搁板来将所述品系分组以用于数据分析。然后通过平均根面积来拣选特定播种日期/搁板组中的架子。通过将架子ri的数据与来自下一个最低架子(ri-1,以及下一个最高平均根面积,ri-1)的数据进行合并来执行滑动窗根面积分布然后使用Grubbs型方法(Barnett等人,Outliers in Statistical Data,JohnWiley & Sons,第3版(1994)来分析组合分布的变量以鉴定ri中的异常值。

将通过上文所述方法测定的具有显著增加的根生长的品系命名为Phase1 hits。在相同分析条件下进行Phase 1 hits的重复试样再筛选。当任一个或两个Phase 2重复试样显示与平均值的显著差异时,认为该品系是经验证的根构造品系。

在Phase 2的至少一个平板中再次发现是异常值的那些品系经过室内进行的Phase 3筛选以验证Phase 1和Phase 2中获得的结果。使用下文所述的Rootboot图像分析(如上所述)和验证Phase 3的结果。在第一轮筛选中进行相同方式的确认。T2种子用50%家用漂白剂,0.01%triton X-100溶液灭菌,并以10颗种子/平板的密度置于与第一轮筛选所述的相同平板培养基上。在4℃下保存平板三天以使种子分层,并在与首次实验相同的温度和光周期下培养种子,光照强度为~160μmol/m2/s。将平板垂直放入10平板架的八个中心位置,第一个和最后一个位置放空白平板。每隔一天旋转架子和架子中的平板。每隔平板拍摄两组照片。第一组在14-16天拍摄,此时大多数品系的初生根已经到达平板底部,第二组照片在发育出更多侧根两天后拍摄。通常用后面的一组照片进行数据分析。用软件(Regent Instruments Inc)分析在垂直平板上生长的这些幼苗的根生长,该软件是特别设计的一种进行根测量的图像分析系统。利用像素对照来从较暗的背景辨别出根构造。为了在不拍摄背景情况下鉴定的根的最大量,所述像素级别是150-170,并且使用滤光器移除长度/宽度比率小于10.0的物体。进行分析的平板上的面积为从植物叶片边缘至距离平板底部约1cm处。使用完全相同的设置和分析面积分析一批的所有平板。给出的一个平板的总根长度得分除以已经萌发并沿平板生长一半的植物数目。每个品系培养三个平板,取它们的得分均值。然后将该平均值与同时培养的包含野生型种子的三个平板的平均值比较。

然后使用通过与野生型相比具有更高根生长数值进行再确认的拟南芥属激活标记品系,用于分子鉴定侧接T-DNA插入序列的DNA。

实施例2B

在突变种群中鉴定具有改变的根表型的突变品系(氮限制条件)

可使用两步筛选程序,该程序包括:

(1)用垂直平板检测分析法鉴定改变的根生长表型;

(2)在拯救的突变体品系中确认抗除草剂性和根表型;

初次筛选基于垂直平板,该平板包含无氮的Hoagland盐,0.3%蔗糖和1mM KNO3。该培养基也包含0.8%至1.0%PhytaGel作胶凝剂。具有1.0%Phytagel的培养基有时难以灌注,因为它凝固迅速,然而低于0.8%时当垂直放置时培养基将滑出平板。来自激活标记种群的突变体,其中100个单个品系的集合可用于总计36000个品系的筛选。在每个平板上,种植12个突变体和2个野生型Columbia种子。平板置于具有26℃恒温的培养室中,培养室为16小时-日循环,平板顶部的平均光照强度为110μE/m2s。这些平板在2.5周期限内拍照3-4次。当观察到清楚的根表型时拯救单个幼苗。拯救的幼苗在生长室(24℃,每日16小时,250至300μE/m2s)中生长至成熟以采集种子。

就次级筛选而言,将来自在初次筛选中鉴定的推定hits的种子播种于包含与上文相同的培养基(加上6mg/L双丙氨磷)的平板上。野生型Columbia种子在相同时间、但无双丙氨磷的相同培养基上播种。每个平板具有10个种子。每个突变体品系有3个平板,而野生型Columbia有2个平板作为重复试样。这些平板置于培养室中,生长条件与上文所述相同。剔除那些认为是假阳性的不具有抗除草剂性或无明显的根表型的品系。保存次级筛选验证的品系用于进一步研究。

实施例3

鉴定激活标记基因

使用下述两个标准程序中的一个或两个鉴定侧接导致根构造改变的T-DNA插入序列的基因:(1)热不对称交错PCR(TAIL)PCR(Liu等人,(1995),Plant J.8:457-63);以及(2)SAIFF PCR(Siebert等人,(1995)Nucleic Acids Res.23:1087-1088)。至于复杂的多聚T-DNA插入序列,TAIL PCR和SAIFF PCR可能均不足以鉴定候选基因。在这些情况下,可使用包括反式PCR、质粒拯救和/或基因组文库构建在内的其他程序。

成功的结果是其中单个TAIL或SAIFF PCR片段包含T-DNA边界序列和拟南芥属基因组序列。

一旦获取侧接T-DNA插入序列的基因组序列标记,通过与公开可用的拟南芥属基因组的序列比对来鉴定候选基因。

具体地讲,最靠近35S增强子元件/T-DNA RB的注释基因是激活的基因的候选基因。

为了验证鉴定的基因真的靠近T-DNA并排除TAIL/SAIFF片段是嵌合伪克隆的可能性,用一个T-DNA中的寡核苷酸和一个候选基因特异性的寡核苷酸进行对基因组DNA的诊断PCR。将提供PCR产品的基因组DNA样本理解为表示T-DNA插入序列。该分析也验证了其中一种以上的插入事件发生在相同品系中的情况,例如,在TAIL和/或SAIFF PCR分析中鉴定是否有多个不同基因组片段。

实施例4

鉴定激活标记exst基因

通过如实施例2A所述的筛选程序获取exst基因。如实施例3所述进行激活标记基因的鉴定。

进一步分析显示具有改变的根构造的一个品系(112299)。提取来自品系的DNA,使用T-DNA左边界内的引物通过连接介导PCR(Siebert等人,(1995)Nucleic Acids Res.23:1087-1088)建立T-DNA插入序列。一旦获取侧接T-DNA插入序列的基因组序列标记,通过与完全拟南芥属基因组的序列比对鉴定候选基因。将其中一个鉴定的插入位点鉴定为嵌合插入;左边界的T-DNA序列经测定位于T-DNA插入序列的两端。这仍然是可能的:位于靠近T-DNA右边界的增强子元件足够靠近以对附近的候选基因产生效应。在这种情况下,假定右边界位置位于插入位点,并将侧接插入位点的两个基因选作候选基因。其中一个最靠近嵌合插入序列的35S增强子的基因是AT3G03650(核苷酸245-1744,对应于ORF(SEQ ID NO:33),它编码EXST蛋白(SEQ ID NO:34),本文称为EXOSTOSIN家族或EXST。

实施例5A

验证候选拟南芥属基因(AT3G03650)经由转化到拟南芥属中增强植物根构造的能力

可将候选基因转化到拟南芥属中并在35S启动子作用下过表达。如果在转基因品系中观察到与亲本激活标记品系相同或相似的表型,则将该候选基因认为是拟南芥属中验证过的“前导基因”。

可直接测试拟南芥属AT3G03650基因促进拟南芥属中的根构造的能力。

拟南芥属AT3G03650cDNA用寡核苷酸进行PCR扩增,寡核苷酸导入attB1(SEQ ID NO:39)序列,其上游为ATG起始密码子的共有起始序列(CAACA)和AT3G03650DNA(SEQ ID NO:57)的蛋白编码区的前25个核苷酸,以及attB2(SEQ ID NO:40)序列和包括所述cDNA终止密码子的蛋白编码区的最后25个核苷酸。使用InvitrogenTM技术,用pDONRTM/Zeo(InvitrogenTM,图2;SEQ ID NO:2)进行MultiSiteBP重组反应。这种方法将细菌致死ccdB基因以及氯霉素抗性基因(CAM)从pDONRTM/Zeo移除并定向地克隆了该在旁侧具有attB1(SEQ IDNO:39)和attB2(SEQ ID NO:40)位点的PCR产物而得到入门克隆PHP28732。

用紧接InvitrogenTMC1转化插入序列上游的1.3-kb35S启动子构建称为pBC-yellow(图4,SEQ ID NO:4)的16.8-kb T-DNA基的二元载体,所述插入序列包含侧接attR1和attR2序列的ccdB基因和氯霉素抗性基因(CAM)。该载体也包含在Rd29a启动子控制下的YFP标记用于选择转化过的种子。

使用InvitrogenTM技术,对包含定向克隆PCR产物和pBC-yellow的入门克隆进行MultiSiteLR重组反应。这使得能够迅速地和定向地克隆pBC-yellow中在35S启动子后的AT3G03650基因。

使用如实施例1所述的相同农杆菌介导的转化程序将35S-AT3G03650基因构建体导入野生型拟南芥属生态型Col-0中。

通过存在的荧光YFP标记选择转基因T1种子。按照如实施例2A所述的程序对荧光种子进行根构造检测分析。每个构建体使用6个平板对转基因T1种子进行再筛选。包含从荧光种子中分选出的未转化的Columbia种子的两个平板(每个架子)作为对照。

每个构建体有六个平板进行统计学分析,并检测平板上生长的植物数量和它们的平均得分之间的趋势。得分进行趋势归一化处理,对应于构建体的根得分除以野生型根得分。

实施例5B

在氮限制条件下筛选候选基因

也可筛选如上文实施例5A所述通过存在的荧光标记YFP选择的转基因T1种子在氮限制条件下生长的抗性。为此目的,32个转基因个体可在一个有0.4mM KNO3或60mM KNO3的平板上紧邻着32个野生型个体生长。如果一个品系显示与对照的统计意义上的显著差异,可认为该品系是经验证的氮缺乏抗性品系。在掩蔽该平板图像以移除背景颜色后,每个个体收集两个不同的测量数据:总罗赛塔面积和进入绿色区的颜色百分比。使用色调、饱和度和强度数据(HIS),绿色区由色调50至66组成。总罗赛塔面积用作植物生物量的量度,而绿色区通过剂量-响应研究已经显示指示氮同化作用。

实施例5C

验证候选拟南芥属基因(AT3G03650)经由转化进入拟南芥属后改善植物氮利用率的能力

如实施例5B所述来筛选能够在氮限制条件下生长的转基因种子。

在第10、11、12和13天评价植物。与野生型植物相比,表达拟南芥属候选基因(AT3G03650)的转基因个体当在包含有限浓度的氮(0.4mMKNO3)的培养基上生长时,不被验证为氮缺乏抗性植物。

实施例5D

筛选以鉴定具有改善的硝酸盐摄取的品系

就每个过表达品系而言,将十二个T2植株播种在96孔微滴定板上,所述微滴定板包含2mM MgSO4,0.5mM KH2PO4,1mM CaCl2,2.5mM KCl,0.15mM Sprint 330,0.06mM FeSO4,1μM MnCl2·4H2O,1μM ZnSO4·7H2O,3μM H3BO3,0.1μM NaMoO4,0.1μM CuSO4·5H2O,

0.8mM硝酸钾,0.1%蔗糖,1mM MES,200μM溴酚红和0.40%PhytagelTM(pH测定培养基)。培养基pH使得溴酚呈红色,pH指示染料是黄色的。

将四个品系种植于每个平板中,每个平板上包含12个野生型个体和来自某一已经显示具有改善的硝酸盐摄取(阳性对照)的品系的12个个体,在每个96孔微滴定板上总计有72个个体可使用基于网络的随机序列发生器测定每个平板上的品系顺序。不将种子种植在96孔微滴定板上的Row A或Row H中。每个实验使用四个平板,使得每个品系分析最多48株植物。在暗处、4℃条件下保持平板三天以使种子分层,然后在22℃,光照和黑暗交替条件下水平放置六天。光周期为16小时光照;8小时黑暗,平均光照强度为~200mmol/m2/s。旋转并振动每个架子中的平板。在第八或第九天(生长五天或六天),通过记录培养基颜色为粉红色、桃色、黄色或无发芽来评价幼苗状态。然后移除每孔上的植物和/或种子。将每个培养基块状物转移到1.2mL微滴定管中,并置于96孔深微滴定板中的相应孔中。将包含2μM荧光素的等体积水加入每个1.2mL微滴定管中。用土壤覆盖平板并用液体循环高压灭菌。将每个管充分混合,从每个管中移除等分试样并分析培养基中保留的硝酸盐的量。如果t检验显示某个品系与野生型对照具有显著差异(p<0.05),则可认为所述品系是验证过的具有改善的硝酸盐摄取品系。

实施例5E

验证包含候选拟南芥属基因(AT3G03650)的转基因品系氮摄取增加

如实施例5D所述筛选氮摄取增加的转基因种子。

与不过表达拟南芥属候选基因的野生型植物相比,过表达拟南芥属候选基因(AT3G03650)的转基因个体经验证不是具有改善的硝酸盐摄取品系。

实施例6

cDNA文库的组成

cDNA克隆的分离和测序

cDNA文库可通过许多可用的方法中的任一种制备。例如,通过首先根据生产商的说明书(Stratagene Cloning Systems,La Jolla,CA)制备Uni-ZAPTM XR载体中的cDNA文库,可将cDNA引入质粒载体中。根据Stratagene提供的说明书,将Uni-ZAPTM XR文库转换成质粒文库。转换后,cDNA插入序列将会包含在质粒载体pBluescript中。此外,可用T4DNA连接酶(New England Biolabs)将cDNA直接引入预切的BluescriptII SK(+)载体(Stratagene)中,然后根据生产商的说明书(GIBCO BRLProducts)将其转染进DH10B细胞中。一旦cDNA插入序列处于质粒载体中,从随机选取的含重组pBluescript质粒的细菌菌落制备质粒DNA,或者用对插入的cDNA序列旁侧的载体序列特异性的引物,通过聚合酶链式反应扩增插入的cDNA序列。将扩增的DNA插入序列或质粒DNA在引物标记法测序反应(dye-primer sequencing reaction)中进行测序,以产生部分cDNA序列(表达序列标记或“EST”;参见Adams等人,1991,Science252:1651-1656)。用Perkin Elmer Model 377荧光测序仪分析所得的EST。

用改进的转座规程产生全长插入序列(FIS)数据。从归档的甘油原种作为单一菌落回收确定了FIS的克隆,并通过碱性裂解分离质粒DNA。将分离的DNA模板在基于PCR的测序反应中与载体引物M13正向和反向寡核苷酸反应并上样至自动化的测序仪上。通过与对其进行FIS查询的初始EST序列进行序列比对来确认克隆鉴定。

将确认的模板通过基于酿酒酵母(Saccharomyces cerevisiae)Ty1转座因子(Devine和Boeke,1994,Nucleic Acids Res.22:3765-3772)的Primer Island转座试剂盒(PE Applied Biosystems,Foster City,CA)进行转座。该体外转座系统在整个一组大DNA分子中随机地放入独特的结合位点。随后将转座的DNA用于通过电穿孔转化DH10B电-感受态细胞(Gibco BRL/Life Technologies,Rockville,MD)。转座因子含有另外的可选标记(称为DHFR;Fling和Richards,1983,Nucleic Acids Res.11:5147-5158),使得能在琼脂平板上仅双重筛选含有整合的转座子的那些亚克隆。从每次转座反应随机地选择多个亚克隆,通过碱性裂解制备质粒DNA,并用对转座子内的结合位点特异性的独特引物从转座事件位点向外进行测序(ABI Prism dye-terminator ReadyReaction mix)。

收集序列数据(ABI Prism Collectiohs)并用Phred和Phrap(Ewing,等人,1998,Genome Res.8:175-185;Ewing和Green,1998,Genome Res.8:186-194)进行装配。Phred是一种公用软件程序,该程序再次读取ABI序列数据,再次调出(recall)碱基,赋质量值,并将碱基序列(base call)和质量值写入可编辑的输出文件中。Phrap序列组装程序使用这些质量值来增加组装的序列重叠群的准确度。通过Consed序列编辑器(Gordon等人,1998,Genome Res.8:195-202)检查装配序列。

在一些克隆中,cDNA片段对应基因的3’-端的一部分并且不会涵盖整个开放阅读框。为了获得上游信息,使用两种不同规程中的一者。这两种方法中的第一种方法导致产生含有所需基因序列的部分的DNA片段,而第二种方法导致产生含有整个开放阅读框的片段。这两种方法均使用两轮PCR扩增以从一个或多个文库获得片段。有时基于以前的知识(特定的基因应该存在于某些组织中)选择文库,有时则进行随机地选择。获得相同基因的反应可平行地在若干文库中进行,或者在文库池中进行。文库池通常用3至5个不同的文库制备并且使其归一化而成为一致的稀释度。在第一轮扩增中,两种方法均使用载体特异性的(正向)引物,同时还使用基因特异性的(反向)引物,该正向引物对应位于克隆5’-端处的载体的一部分。第一种方法使用与已知基因序列的一部分互补的序列,而第二种方法使用与3’-非翻译区(也称为UTR)的一部分互补的基因特异性引物。在第二轮扩增中,两种方法均使用套式引物组。按照生产商的说明书,用市售试剂盒将所得DNA片段连接进pBluescript载体中。该试剂盒选自可得自包括InvitrogenTM(Carlsbad,CA)、Promega Biotech(Madison,WI)和Gibco-BRL(Gaithersburg,MD)在内的一些供应商的许多试剂盒。如上所述,将质粒DNA通过碱性裂解方法分离并进行测序和用Phred/Phrap进行装配。

实施例7

cDNA克隆的鉴定

编码EXST样多肽的cDNA克隆能通过这样鉴定:进行BLAST(基本的局部比对搜索工具);Altschul等人,1993,J.Mol.Biol.215:403-410;还可参见国立卫生研究院国家医学图书馆的国家生物技术信息中心的万维网址上对BLAST算法的解释),寻找与BLAST“nr”数据库中所包含序列(包括所有非冗余GenBank CDS翻译序列、源自3-维结构Brookhaven蛋白质数据库(Protein Data Bank)、SWISS-PROT蛋白质序列数据库的最新的主要版本、EMBL和DDBJ数据库的序列)的相似性。采用国家生物技术信息中心(NCBI)提供的BLASTN算法,能分析如实施例6中获得的cDNA序列与包含在“nr”数据库中的所有可公开获得的DNA序列的相似性。在所有的阅读框中翻译DNA并用NCBI提供的BLASTX算法(Gish和States,1993,Nat.Genet.3:266-272)比较与“nr”数据库中包含的所有可公开获得的蛋白质序列的相似性。为方便起见,通过BLAST计算仅仅偶然观察到cDNA序列与所搜索的数据库中所包含序列的匹配的P-值(概率)在本文报导为“pLog”值,它代表所报导的P值的负对数。因此,pLog值越大,cDNA序列和BLAST的“匹配”代表同源蛋白的可能性就越大。

将受分析的EST与上述Genbank数据库进行比较。通过使用BLASTn算法(Altschul等人,1997,Nucleic Acids Res.25:3389-3402.)对杜邦专利数据库比较具有序列同源共有区域或重叠区域的核苷酸序列,可找到含更5′端或3′端序列的EST。在两个或更多个核酸片段之间存在共有或重叠序列时,该序列可装配成单一的连续核苷酸序列,从而使最初的片段在5′或3′初始方向上延伸。一旦确定了最5′的EST后,可如实施例6中所述,通过全长插入序列来确定其完整的序列。可用tBLASTn算法,通过将已知基因(来自专有来源或公开数据库的已知基因)的氨基酸序列对EST数据库进行比较,可找到属于不同物种的同源基因。tBLASTn算法对所有6个阅读框都翻译了的核苷酸数据库进行氨基酸查询的搜索。该搜索允许不同物种之间的核苷酸密码子使用的差异,并且允许密码子简并。

实施例8

制备cDNA文库并且鉴定编码EXST样多肽的cDNA克隆

如实施例6所述制备提供来自玉米、大豆、稻、向日葵、瓜尔、小麦、佛罗里达苦树(Florida bitterbush)、燕麦、棉、苋属植物和卡诺拉的不同组织的mRNA的cDNA文库,下文描述了该文库。下面描述了该文库的特征。

表2

来自玉米、大豆、稻、向日葵、瓜尔、小麦、佛罗里达苦树(Floridabitterbush)、燕麦、棉、苋属植物和卡诺拉的cDNA文库

  文库  组织  克隆  cfp5n  玉米粒,收集阶段,全长富集的,标准化的  cfp5n.pk007.k11  p0127  核组织,抽丝后5天,经筛选的1。  p0127.cntdd86ra  cfp6n  收集的玉米叶片和种子,全长富集的,标准化的  cfp6n.pk002.a5  cfp6n.pk002.a5:fis  Ctn1c  玉米(Zea mays L.,B73)夜间收获的雄穗(v12  阶段)。  ctn1c.pk002.p16  rls24  稻萌发叶片后15天,感染菌株稻瘟病菌4360-R-67  (AVR2-YAMO)后24小时;易感的  rls 24.pk0026.h11  rls 24.pk0026.h11:fis  esl1c  裸麦叶片,经冰冻以诱导冷响应基因序列,该序列  能用于转化玉米以使其获得对低温或脱水胁迫的抗  性。  esllc.pk006.119  esl1c.pk006.l19:fis  cfp1n  收集的玉米雄穗V7至V12,全长富集的,标准化的  cfp1n.pk002.o16.f:fis  ebb2c  卡诺拉Rf基因敲除的突变品系02SM5的不成熟芽。  ebb2c.pk 005.f9  ebb2c.pk005.f9:fis  lds1c  15DAF时收获的瓜耳(Cyamopsis  tetragonoloba)种子。  lds1c.pk008.m15  lds1c.pk008.m15:fis  eas1c  反枝苋(Amaranthus retroflexus)种子  eas1c.pk002.p14  eas1c.pk002.p14:fis  egh1c  陆地棉(Gossypium hirsutum)发芽的种子。  egh1c.pk005.b21  egh1c.pk005.b21:fis  ort1f  燕麦(Avena strigosa)全长燕麦根尖  ort1f.pk014.e9  ort1f.pk014.e9:fis

  文库  组织  克隆  pps  佛罗里达苦树(Picramnia pentandra)的发育种子  pps.pk0007.b3  pps.pk0007.b3:fis  hso1c  草酸氧化酶转基因向日葵植物  hso1c.pk001.n10  hso1c.pk001.n10:fis  sgs1c  发芽4小时后的大豆种子  sgs1c.pk004.m16  sgs1c.pk004.m14  scn1c  10个月的大豆(大豆L.,6705)胚发生悬浮培养物  (坏死组织)。  scn1c.pk001.m7  scn1c.pk001.m7:fis  wpa1c  小麦(Triticum aestivum)减数分裂前花药JIC  wpa1c.pk011.n19  wpa1c.pk011.n19:fis  rdi2c  稻(Oryza sativa,Nipponbare)在枝梗一花器官原  基形成处的发育花序  rdi2c.pk011.p5  rdi2c.pk011.p5:fis  smj1c  来自转基因大豆的IPT转录物的表征。前导增产  (大豆YE2.1)构建体表达农杆菌异戊烯基转移酶  基因。  smj1c.pk006.c12.f  smj1c.pk006.c12.f:fis

使用来自表1中列出的克隆的EST序列进行的BLASTX搜索揭示所述多肽与来自稻的EXST样多肽的相似性(GI No.115476598、115487106、115452759和115441893分别对应于SEQ ID NO:35、36、37、和38。表3显示了表2列出的克隆的全长cDNA插入序列(“全长插入序列”或“FIS”)的BLASTP结果。每个cDNA插入序列编码完整蛋白或功能性蛋白(“完全基因序列”或“CGS”)。表3和表4也显示了使用Clustal V比对方法、使用默认参数计算的每对氨基酸序列的序列同一性百分比值:

表3

编码EXST样多肽同源物的多肽序列的BLAST结果和同一性百分比

  序列  状况  NCBI GI  BLAST pLog  打分  %同一性  重叠群:  cfp5n.pk007.k11  cfp5n.pk007.k11.f  cfp6n.pk005.i1  SEQ ID NO:14  Contig  115487106(稻)  SEQ ID NO:36  >180  77.5  重叠群:  cfp3n.pk069.l15  cfp3n.pk069.l15.f  p0127.cntdd86ra  p0127.cntdd86ra.f  SEQ ID NO:16  Contig  115452759(稻)  SEQ ID NO:37  176  70.0  my.ceb1.pk0010.e5  SEQ ID NO:18  FIS  115441893(稻)  SEQ ID NO:38  160  90.1  cfp6n.pk002.a5:fis  SEQ ID NO:20  CGS  115452759(稻)  SEQ ID NO:37  >180  82.4  rls24.pk0026.h11:fis  SEQ ID NO:22  CGS  115476598(稻)  SEQ ID NO:35  >180  99.8  p0127.cntdd86ra:fis  SEQ ID NO:24  CGS  11542759(稻)  SEQ ID NO:37  >180  80.8  cfp5n.pk007.k11:fis  SEQ ID NO:26  FIS  115487106(稻)  SEQ ID NO:36  85  36.2  esl1c.pk006.l19:fis  SEQ ID NO:28  CGS  115487106(稻)  SEQ ID NO:36  >180  78.9  cfp1n.pk002.o16.f:fis  SEQ ID NO:30  CGS  115476598(稻)  SEQ ID NO:35  >180  63.5

图15A-15I示出以下全长氨基酸序列的多重比对:SEQ ID NO:15、17、19、21、23、25、27、29、31、34、以及SEQ ID NO:35、36、37、和38。图16给出图15A-15I中给出的每对序列的序列同一性百分比和趋异值。

用LASERGENE生物信息计算包(DNASTAR Inc.,Madison,WI)的Megalign程序进行序列比对和同一性百分比计算。用带默认参数(空位罚分=10,空位长度罚分=10)的Clustal比对方法(Higgins和Sharp,1989,CABIOS.5:151-153)进行序列的多重比对。使用Clustal方法的成对比对的默认参数为KTUPLE 1,空位罚分=3,窗口=5,DIAGONALSSAVED=5。

序列比对和BLAST打分以及概率显示包含本发明cDNA克隆的核酸片段编码EXST样多肽。

表4

编码与EXST和EXST样多肽同源的多肽的序列的BLAST结果

  序列  状况  参照序列  BLAST pLog  机分  %同一性  重叠群:  cfp5n.pk007.k11  cfp5n.pk007.k11.f  cfp6n.pk005.i1  SEQ ID NO:14  CGS  JP2005185101中  的SEQ ID 49101  >180  77.5  重叠群:  cfp3n.pk069.l15  cfp3n.pk069.l15.f  p0127.cntdd86ra  p0127.cntdd86ra.f  SEQ ID NO:16  EST  US2004214272中  的SEQ ID 345741  >180  80.1  my.ceb1.pk0010.e5  SEQ ID NO:18  CGS  US2004216190中  的SEQ ID 7611  175  99.6  cfp6n.pk002.a5:fis  SEQ ID NO:20  CGS  US2004214272中  的SEQ ID 345741  >180  98.9  rls24.pk0026.h11:fis  SEQ ID NO:22  CGS  JP2005185101中  的SEQ ID NO  54370  >180  99.8  p0127.cntdd86ra:fis  SEQ ID NO:24  CGS  US20042中的SEQ  ID 345741  >180  91.4

  序列  状况  参照序列  BLAST pLog  机分  %同一性  cfp5n.pk007.k11:fis  SEQ ID NO:26  CGS  US2004214272中  的SEQ ID 361954  94  75.1  esl1c.pk006.l19:fis  SEQ ID NO:28  CGS  US2004216190-A1  中的SEQ ID  10067  >180  98.3  cfp1n.pk002.o16.f:fis  SEQ ID NO:30  CGS  JP2005185101中  的SEQ ID 54370  >180  63.5

实施例9

制备含有拟南芥属前导基因(AT3G03650)的同源物的植物表达载体

可使用诸如BLAST(基本的局部比对搜索工具(Basic LocalAlignment Search Tool);Altschul等人,J.Mol.Biol.215:403-410,1993;也参见美国国家卫生研究院(National Institutes ofHealth)国立医学图书馆(National Library of Medicine)的国家生物技术信息中心(National Center for Biotechnology Information)的万维网网址上对BLAST算法的解释)之类的序列比较算法,鉴定与前导EXST基因同源的序列。同源EXST样序列,如实施例8所述的序列,可通过任何一种以下方法进行PCR扩增。

方法1(基于RNA的方法):如果EXST同源物的蛋白编码区域的5’和3’序列信息是可用的,可如实施例5A所述设计基因特异性引物。可将RT-PCR用于植物RNA来获得含有EXST蛋白编码区的核酸片段,该EXST蛋白编码区旁侧为attB1(SEQ ID NO:39)和attB2(SEQ ID NO:40)序列。引物可含有起始密码子上游的共有Kozak序列(CAACA)。

方法2(基于DNA的方法):作为另外一种选择,如果编码EXST多肽同源物的基因的cDNA克隆是可用的,可以PCR扩增完整cDNA插入序列(含有5′和3′非编码区)。可设计正向引物和反向引物,使它们分别或者含有attB1序列和在该cDNA插入序列前面的载体特异性序列或者含有attB2序列和在该cDNA插入序列后面的载体特异性序列。对于克隆进载体pBluescript SK+中的cDNA插入序列,可使用正向引物VC062(SEQ IDNO:41)和反向引物VC063(SEQ ID NO:42)。

方法1和方法2可根据本领域技术人员已知的步骤进行修改。例如,方法1的引物可含有限制性酶切位点而不是attB1和attB2位点,用于后来将PCR产物克隆进含有attB1和attB2位点的载体内。另外,方法2可涉及从cDNA克隆、λ克隆、BAC克隆或基因组DNA扩增。

可利用BP重组反应将通过任一种上述方法获得的PCR产物与供体载体(例如pDONRTM/Zeo(InvitrogenTM,图2;SEQ ID NO:2)或pDONRTM221(InvitrogeTM,图3;SEQ ID NO:3)组合。这种方法将细菌致死ccdB基因以及氯霉素抗性基因(CAM)从pDONRTM221移除并定向地克隆了该在旁侧具有attB1和attB2位点的PCR产物而得到入门克隆(entryclone)。使用InvitrogenTMClonaseTM技术,然后可将来自入门克隆的同源EXST样基因转移到合适的目的载体中以获得植物表达载体,所述载体用于拟南芥属、玉米和大豆,如pBC-Yellow(图4;SEQ IDNO:4)、PHP27840(图5;SEQ ID NO:5)或PHP23236(图6;SEQ IDNO:6),以获取植物表达载体,分别用于拟南芥属、大豆和玉米。

作为另外一种选择,可进行多个入门克隆和合适的目的载体之间的MultiSiteLR重组反应以产生表达载体。该程序的一个实例在实施例14A中有所描述,该实施例描述了用于转化玉米品系的玉米表达载体的构建。

实施例10

用验证过的拟南芥属前导基因及其同源物制备大豆表达载体并转化大

为了检查所得表型,可将大豆植株转化以过表达验证过的拟南芥属(Arabidopsis)基因(AT3G03650)和来自不同物种的对应同源物。

可将实施例5A和9中所述的入门克隆用于将每个基因定向克隆进PHP27840载体(图5,SEQ ID NO:5)中,使得该基因的表达处于SCP1启动子的控制下。

然后可用包含编码本多肽的序列的表达载体转化大豆胚。

为了诱导体细胞胚,可将子叶(长度为3-5mm,从大豆品种A2872的表面灭菌的未成熟种子解剖出来)于26℃在光下或黑暗下培养6-10周。然后切取体细胞胚(其产生次生胚)并将其置于合适的液体培养基内。在重复选择增殖为早期球形阶段胚的体细胞胚的簇后,按下面的描述保持该悬浮液。

可将大豆胚发生悬浮培养物在26℃下在摇床(150rpm)上的35mL液体培养基中保持,荧光光照采用16∶8小时(白天/黑夜)的时间表。通过将大约35mg组织移植进35ml液体培养基中,每两周将培养物进行传代培养。

然后可通过基因枪轰击方法(Klein等人,Nature(London)327:70-73,1987;美国专利4,945,050)转化大豆胚发生悬浮培养物。杜邦公司的BiolisticTMPDS1000/HE仪器(氦气改进型)可用于这些转化。

可用于帮助大豆转化的可选标记基因是由来自花椰菜花叶病毒的35S启动子(Odell等人,Nature 313:810-812,1985)、来自质粒pJR225(来自大肠杆菌;Gritz等人,Gene 25:179-188,1983)的潮霉素磷酸转移酶基因以及胭脂碱合成酶基因的3′区构成的嵌合基因,该胭脂碱合成酶基因来自根癌农杆菌(Agrobacterium tumefaciens)Ti质粒的T-DNA。可用于帮助大豆转化的另一种可选标记基因是来自大豆或拟南芥属的除草剂抗性乙酰乳酸合成酶(ALS)基因。ALS是支链氨基酸缬氨酸、亮氨酸和异亮氨酸的生物合成中的第一共用酶。已经鉴定出ALS中的突变导致对三类ALS抑制剂中的某些或全部具有抗性(美国专利5,013,659;其全部内容以引用的方式并入本文)。除草剂抗性ALS基因的表达可处于SAM合成酶启动子(美国专利申请US-2003-0226166-A1;藉此将其全部内容以引用的方式并入本文)的控制下。

将如下物质(依次)加入50μL 60mg/mL的1μm金颗粒悬浮液:5μLDNA(1μg/μL)、20μL亚精胺(0.1M)和50μL CaCl2(2.5M)。然后搅拌该颗粒制备物三分钟,在微量离心机(microfuge)中离心10秒并移除上清液。然后将DNA包覆的颗粒在400μL 70%乙醇中洗涤一次并再悬浮于40μL无水乙醇中。可将DNA/颗粒悬浮液用超声波处理三次,每次一秒钟。然后将5μL该DNA-包覆的金颗粒装载至每个宏载体盘上。

将大约300-400mg两周大的悬浮培养物置于60×15mm的空培养皿中并用吸管将残留的液体从组织移除。对于每次转化实验,大约5-10板的组织受到正常轰击。膜破裂压力设定为1100psi并将腔室抽成28英寸汞柱的真空。将组织置于离阻挡网大约3.5英寸的地方并轰击三次。轰击后,可将组织分成两份并放回液体培养基中,如上所述进行培养。

轰击后五至七天,用新鲜培养基更换该液体培养基,并在轰击后七至十二天,用含有50mg/mL潮霉素的新鲜培养基更换。可每周更换这种选择培养基。轰击后七至八周,可观察到绿色的转化组织从未转化的坏死的胚芽发生簇长出来。移出分离的绿色组织并将其移植进单独的烧瓶中以产生新的、无性繁殖的、转化的胚发生悬浮培养物。可将每一新品系当成是独立的转化事件。然后可将这些悬浮培养物作为未成熟胚进行传代培养和维持,或者通过使单独体细胞胚成熟并萌发而再生成整株植株。

可通过在土壤中培养植物并在用分析总根质量前洗涤根部来测量大豆增大的根构造。

然后可分析用验证过的基因转化大豆植株以研究相对于对照或参照植株的农学特性。例如,在多种环境条件(如氮限制条件、干旱等)下的氮利用效率、产量增强和/或稳定性。

实施例11

使用颗粒轰击用验证过的拟南芥属前导基因转化玉米

为了检查所得表型,可将大豆植株转化以过表达验证过的拟南芥属前导基因或来自不同物种的对应同源物。

可将实施例5A中所述的入门克隆用于将每种基因定向克隆进玉米转化载体中。玉米基因的表达可处于组成型启动子的控制下,例如玉米泛素启动子(Christensen等人,Plant Mol.Biol.12:619-632,1989,以及Christensen等人,Plant Mol.Biol.18:675-689,1992)。

然后可通过下面的方法将上述重组DNA构建体引入玉米细胞中。可从源于近交玉米系H99和LH132杂交的发育中的颖果切取未成熟的玉米胚。在授粉后10至11天分离胚,这时它们长为1.0至1.5mm。然后将胚以轴线侧朝下放置并与琼脂糖硬化的N6培养基(Chu等人,Sci.Sin.Peking18:659-668,1975)接触。将胚在27℃下保持在黑暗中。从这些未成熟胚的胚鳞增生出易脆的胚发生愈伤组织,该愈伤组织由未分化的细胞块构成,在胚柄结构上长有体细胞原胚状体和胚状体。可将从该原外植体分离的胚发生愈伤组织在N6培养基上培养,并每两至三周在这种培养基上进行传代培养。

可将质粒p35S/Ac(得自Peter Eckes博士,Hoechst Ag,Frankfurt,Germany)用于转化实验以便提供可选标记。该质粒含有pat基因(见欧洲专利公布0242236),该基因编码草胺膦乙酰转移酶(PAT)。酶PAT赋予对除草性谷氨酰胺合成酶抑制剂例如草胺膦的抗性。p35S/Ac的pat基因处于来自花椰菜花叶病毒的35S启动子(Odell等人,Nature 313:810-812(1985))和胭脂碱合成酶基因的3′区的控制下,该胭脂碱合成酶基因来自根癌农杆菌Ti质粒的T-DNA。

可将粒子轰击法(Klein等人,Nature 327:70-73(1987))用于将基因转移至愈伤组织培养细胞。根据该方法,利用下面的技术用DNA包覆金颗粒(直径1μm)。将10μg质粒DNA加入到50μL金颗粒悬浮液(每mL60mg)中。将氯化钙(50μL的2.5M溶液)和亚精胺游离碱(20μL的1.0M溶液)加入到该颗粒中。再加入这些溶液过程中涡旋该悬浮液。10分钟后,将试管粗略地离心(以15,000rpm进行5秒钟)并移除上清液。将该颗粒再悬浮于200μL的无水乙醇中,再次离心并移除上清液。再次进行乙醇冲洗并将颗粒再悬浮于终体积为30μL的乙醇中。可将DNA包覆的金颗粒等分试样(5μL)置于KaptonTM飞行圆盘(Bio-Rad Labs)的中心。然后使用PDS-1000/He(Bio-Rad Instruments,Hercules CA),采用1000psi的氦气压、0.5cm的间隙距离以及1.0cm的飞行距离,将颗粒加速射入玉米组织中。

对于轰击,将胚发生组织置于琼脂糖硬化的N6培养基上的滤纸上。组织布置成薄薄一层,并覆盖直径为约5cm的圆形区域。然后可将包含组织的培养皿置于离阻挡网大约8cm的PDS-1000/He的腔室内。然后将该腔室中的空气抽出至28英寸汞柱的真空。利用在击波管中氦气压力达到1000psi时破裂的可破裂膜,宏载体被氦气冲击波加速。

轰击后七天,可将组织转移至N6培养基中,该培养基含有双丙氨磷(每升5mg)并缺少酪蛋白或脯氨酸。组织继续在这种培养基上缓慢生长。另外两周后,可将组织转移至含有bialaphos的新鲜N6培养基上。六周后,在某些装有补充了双丙氨磷的培养基的盘上,可辨别直径约1cm的区域上有活性生长的愈伤组织。当在选择培养基上传代培养时,这些愈伤组织可继续生长。

通过首先将组织簇转移到补充有0.2mg每升的2,4-D的N6培养基中,可从该转基因愈伤组织再生出植物。两周后,可将组织转移至再生培养基中(Fromm等人,Bio/Technology 8:833-839(1990))。

可再生出转基因的T0植株并按照下面的HTP步骤确定它们的表型。可收集T1种子。

可栽培T1植株并分析表型变化。利用图像分析可定量下面的参数:可收集并定量植株面积、体积、生长速率以及颜色分析。与合适的对照植物比较,导致根构造改变或上文列出的任何一种农学特性改变的表达构建体可被认为是拟南芥属前导基因在玉米中发挥功能以改变根构造或植物构造的证据。

此外,可通过直接转化或者从单独转化的品系基因渗入而将含有证实的拟南芥属基因的重组DNA构建体导入玉米品系内。

可对转基因植株(或者是近交的或者是杂交的)进行更有力的基于田间的实验来研究在多种环境条件下(如营养物质的改变和水的可利用性)的根构造或植物构造、产量提高和/或抗根倒伏性。

也可进行后续的产量分析,以测定含有验证过的拟南芥属前导基因的植物与不包含验证过的拟南芥属前导基因的对照(或参照)植物相比较时是否具有改善的产量表现。包含验证过的拟南芥属前导基因的植物相对于对植物将具有改善的产量,优选地在不利环境条件下产量损失减少50%,或在不同环境条件下相对于对照植物将具有提高的产量(例如,与对照植物相比,在不限制氮的条件下产量提高。

实施例12

电穿孔根癌农杆菌LBA4404

将电穿孔感受态细胞(40μl),例如根癌农杆菌(Agrobacteriumtumefaciens)LBA4404(含有PHP10523)在冰上解冻(20-30分钟)。PHP10523含有用于T-DNA转移的VIR基因、农杆菌属的低拷贝数质粒复制起始区、四环素抗性基因以及用于体内DNA生物分子重组的cos位点。同时,将电穿孔管(electroporation cuvette)在冰上冷却。将该电穿孔仪的设置调节至2.1kV。

将DNA等分试样(0.5μL JT(US 7,087,812)亲代DNA,在低盐缓冲液或双蒸H2O中的浓度为0.2μg-1.0μg)与解冻的农杆菌细胞混合,同时仍然保持在冰上。将该混合物转移至电穿孔管的底部并静止保持在冰上1-2分钟。通过按下“pulse(脉冲)”键两次(理想的是获得4.0毫秒的脉冲)对细胞进行电穿孔(Eppendorf电穿孔仪2510)。随后,将0.5ml 2xYT培养基(或SOCmedium)加入到电穿孔管并转移至15ml Falcon管中。将细胞在28-30℃、200-250rpm下培养3小时。

将250μl的等分试样散布在#30B(YM+50μg/mL奇放线菌素)板上并在28-30℃下培养3天。为了增加转化体的数目,可进行如下两个可选步骤中的其中一个:

选择1:用30μl 15mg/ml的利福平覆盖平板。LBA4404具有针对利福平的染色体抗性基因。这种附加的选择消除了在使用较差的LBA4404感受态细胞制备物时观察到的一些污染克隆。

选择2:进行两次重复的电穿孔以补偿较差的电感受态细胞。

转化体的鉴定

选取四个独立的克隆并划痕接种在AB基本培养基+50mg/mL奇放线菌素的平板(#12S培养基)上用于分离单个克隆。将平板在28℃下培养2-3天。

对于每个推定的共整合体选取单个克隆并将其接种在4ml具有50mg/l的奇放线菌素的#60A中。将该混合物在28℃下摇动培养24小时。采用Qiagen Miniprep+可选的PB洗涤,从4ml培养物分离出质粒DNA。将DNA在30μl中洗提。如上所述,将2μl的等分试样用于电穿孔20μl DH10b+20μl ddH2O。

可任选地,可将15μl等分试样用于转化75-100μl的InvitrogenTMLibrary Efficiency DH5α。将细胞散布在LB培养基+50mg/mL奇放线菌素的平板(#34T培养基)上并将其在37℃下培养过夜。

对于每个推定的共整合体选取3至4个独立的克隆并将其接种在4ml具有50μg/ml奇放线菌素的2xYT(#60A)上。将细胞在37℃下摇晃培养过夜。

使用Miniprep,用任选PB洗涤液(稀释成50μl)从4mL培养物中分离质粒DNA,并且8μl质粒DNA用SalI(使用JT亲本和PHP10523作对照物)进行消化。

对于4个质粒利用限制性内切酶BamHI、EcoRI和HindIII再进行三次消化(使用亲代DNA和PHP10523作为对照),这4个质粒代表2种具有正确SalI消化模式的推定共整合体。推荐电凝胶(Electronic gel)用于比较。

作为另一种选择,对于高通量应用,例如针对Gaspe Flint衍生的玉米品系(实施例15-17)所描述的,代替通过限制性酶切分析来评价所得的共整合载体,可将三个克隆同时用于如实施例13所述的感染步骤。

实施例13

农杆菌介导的玉米的转化

为了检查所得表型,可将大豆植株转化以过表达验证过的拟南芥属前导基因或来自不同物种的对应同源物。

农杆菌介导的玉米转化基本上按照Zhao等人,Meth.Mol.Biol.318:315-323(2006)中描述的方法进行(还可参见Zhao等人,Mol.Breed.8:323-333(2001)和1999年11月9日公布的美国专利5,981,840,以引用的方式将该文献并入本文)。该转化过程涉及细菌接种、共培养、静止期、选择以及植株再生。

1.未成熟胚的制备

从颖果切取未成熟胚并置于装有2mL PHI-A培养基的2mL微型管中。

2.胚的农杆菌感染以及共培养

2.1感染步骤

用1mL微量吸移管移出PHI-A培养基并加入1mL农杆菌悬浮液。轻轻倒置该管进行混合。将该混合物在室温下培养5分钟。

2.2共培养步骤

用1mL微量吸移管将农杆菌悬浮液从感染步骤中移出。使用无菌刮刀将胚从管中刮出并转移到100×15mm培养皿中的PHI-B培养基的平板中。确定胚的朝向,使得胚轴在培养基表面上朝下。将具有胚的平板在20℃下于黑暗中培养3天。L-半胱氨酸可用于共培养阶段。采用标准二元载体,补充有100-400mg/L L-半胱氨酸的共培养培养基对于回收稳定的转基因事件是至关重要的。

3.推定的转基因事件的选择

向100×15mm培养皿中的PHI-D培养基的每平板中转移10个胚,保持朝向,并用parafilm将培养皿密封。将平板在黑暗中于28℃培养。预计在6-8周将看见活性生长的推定事件(作为浅黄色胚组织)。不产生事件的胚可能是棕色和坏死的,并且几乎看不见脆性组织生长。取决于生长速率,以2-3周的间隔将推定的转基因胚组织转移到新鲜的PHI-D平板上进行传代培养。记录事件。

4.T0植株的再生

将在PHI-D培养基上增殖的胚组织转移至100×25mm培养皿中的PHI-E培养基(体细胞胚成熟培养基)进行传代培养并在28℃下,在黑暗中培养约10-18天,直至体细胞胚成熟。将具有良好限定的盾片和胚芽鞘的个体成熟体细胞胚芽转移到PHI-F胚芽发芽培养基中,并且在28℃于光中(约80μE,来自冷光灯或同等荧光灯)培养。在7-10天,将约10cm高的再生植株盆载于园艺混合物中,并使用标准园艺方法使其受冷而变得耐寒。

用于植物转化的培养基

1.PHI-A:4g/L的CHU基础盐、1.0mL/L的1000X Eriksson维生素混合物、0.5mg/L的盐酸硫胺素、1.5mg/L的2,4-D、0.69g/L的L-脯氨酸、68.5g/L的蔗糖、36g/L的葡萄糖,pH为5.2。在使用前加入100μM的乙酰丁香酮,过滤灭菌。

2.PHI-B:无葡萄糖的PHI-A,2,4-D增加至2mg/L,蔗糖减少至30g/L并且补充有0.85mg/L的硝酸银(过滤灭菌),3.0g/L的固化剂(gelrite),100μM的乙酰丁香酮(过滤灭菌),pH为5.8。

3.PHI-C:无固化剂和乙酰丁香酮的PHI-B,2,4-D减少至1.5mg/L并且补充有8.0g/L的琼脂,0.5g/L的Ms-吗啉乙磺酸(MES)缓冲液,100mg/L的羧苄青霉素(过滤灭菌)。

4.PHI-D:补充有3mg/L的双丙氨磷bialapho(过滤灭菌)的PHI-C。

5.PHI-E:4.3g/L的Murashige and Skoog(MS)盐(Gibco,BRL11117-074)、0.5mg/L的烟酸、0.1mg/L的盐酸硫胺素、0.5mg/L的盐酸吡哆醇、2.0mg/L的甘氨酸、0.1g/L的肌醇、0.5mg/L的玉米素(Sigma,商品目录号:Z-0164)、1mg/L的吲哚乙酸(IAA)、26.4μg/L的脱落酸(ABA)、60g/L的蔗糖、3mg/L的双丙氨磷(过滤灭菌)、100mg/L的羧苄青霉素(过滤灭菌)、8g/L的琼脂,pH为5.6。

6.PHI-F:不含玉米素、IAA、ABA的PHI-E;蔗糖减少至40g/L;用1.5g/L的固化剂代替琼脂;pH为5.6。

通过首先将组织簇转移到补充有0.2mg每升的2,4-D的N6培养基中,可从该转基因愈伤组织再生出植物。两周后,可将组织转移至再生培养基(Fromm等人,(1990)Bio/Technology 8:833-839)中。

可进行对转基因T0植株和T1植株的表型分析。

可分析T1植株表型的变化。利用图像分析,可在植株生长过程中在多个时间点,分析T1植株在植株面积、体积、生长速率方面的表型变化并且可进行颜色分析。可如实施例20中所述分析根构造的改变。

可对农学特性的改变进行后续分析,以测定含有验证过的拟南芥属前导基因的植株在与不含有验证过的拟南芥属前导基因的对照(或参照)植株比较时是否具有至少一种农学特性的改善。还可在多种环境条件下研究改变。

导致根构造显著改变的表达构建体将被认为是拟南芥属基因在玉米中发挥功能以改变根构造的证据。

实施例14A

利用农杆菌介导的转化构建具有拟南芥属前导基因(AT3G03650)的玉米表达载体

用拟南芥属EXST基因(AT3G03650)在NAS2(SEQ ID NO:44)和GOS2(SEQ ID NO:45)启动子控制下制备玉米表达载体。PINII是终止子(SEQID NO:48)使用InvitrogenTM技术,如实施例5A所述制备的、包含拟南芥属EXST基因(AT3G03650)的入门克隆PHP 28739被用于独立的LR反应:

1)组成型玉米GOS2启动子入门克隆(PHP28408,图11,SEQ IDNO:11)和PinII终止子入门克隆(PHP20234,图9,SEQ IDNO:9)形成目的载体PHP28529(图10,SEQ ID NO:10)。将所得载体命名为PHP28976。

2)根玉米NAS2启动子入门克隆(PHP22020,图12,SEQ ID NO:12)和PinII终止子入门克隆(PHP20234,图9,SEQ ID NO:9)形成目的载体PHP28529(图10,SEQ ID NO:10)。将所得载体命名为PHP28913。

目的载体PHP28529被加到每个最终载体(PHP28983和PHP28984)中,也是:

1)RD29A启动子::黄色荧光蛋白::PinII终止子盒,用于拟南芥属种子分选。

2)泛素启动子::moPAT/红色荧光蛋白融合基因::PinII终止子盒,用于转化选择和玉米种子分选。

实施例14B

制备包含拟南芥属EXST基因及其同源物的玉米表达构建体

可使用实施例5A和14A所述的程序将拟南芥属EXST基因及其来自玉米和其他物种的对应同源物(表1)转化到玉米品系中。能如实施例5A和14A所述制备具有拟南芥属EXST基因及其来自玉米和其他物种的对应同源物(表1)的玉米表达载体。除了GOS2或NAS2启动子,其他启动子,例如(但不限于)泛素启动子、S2A和S2B启动子、玉米ROOTMET2启动子、玉米Cyclo、CR1BIO、CRWAQ81以及玉米ZRP2.4447,可用于引导EXST和EXST样基因在玉米中的表达。此外,多种终止子,例如但不限于PINII终止子,可用于完成所关注基因在玉米中的表达。

实施例14C

使用农杆菌介导转化,用拟南芥属前导基因(AT3G03650)和来自其他物种的对应同源物来转化玉米品系

然后可将最终载体(玉米中表达的载体,实施例14A和B)分别电穿孔进入包含PHP10523的LBA4404农杆菌(图7;SEQ ID NO:7,Komari等人,Plant J 10:165-174(1996),NCBI GI:59797027)中,以产生用于玉米转化的共整合载体。该共整合载体是通过最终载体(玉米表达载体)与PHP10523的重组(通过每个载体上含有的COS重组位点)而形成。除了实施例14A-B中所述的表达盒,该共整合载体还含有农杆菌菌株以及农杆菌介导转化所需的基因(TET、TET、TRFA、ORI终止子、CTL、ORI V、VIR C1、VIR C2、VIR G、VIR B)。转化玉米品系可如实施例13所述进行。

实施例15

用于转化Gaspe Flint衍生的玉米品系的目的载体PHP23236和PHP29635的制备

目的载体PHP23236(图6,SEQ ID NO:6)是通过用质粒PHP23235(图8,SEQ ID NO:8)转化包含质粒PHP10523(图7,SEQ ID NO:7)的农杆菌菌株LBA4404并分离所得的共整合产物而获得。目的载体PHP23236可被用于如实施例16所述的与入门克隆的重组反应,以产生用于转化GaspeFlint衍生的玉米品系的玉米表达载体。所关注的基因的表达是处于泛素启动子(SEQ ID NO:46)的控制之下。

PHP29635(图13,SEQ ID NO:13)是通过用质粒PIIOXS2a-FRT87(ni)m(图14,SEQ ID NO:43)转化包含质粒PHP10523的农杆菌菌株LBA4404并分离所得的共整合产物而获得。目的载体PHP29635可被用于如实施例16所述的与入门克隆的重组反应,以产生用于转化Gaspe Flint衍生的玉米品系的玉米表达载体。所关注的基因的表达是处于S2A启动子(SEQ ID NO:47)的控制之下。

实施例16

用于转化Gaspe Flint衍生的玉米品系的质粒的制备

使用InvitrogenTM重组技术,可如实施例5A和9所述制备包含拟南芥属EXST基因(AT3G03650)或玉米EXST样同源物的入门克隆,该克隆用于定向克隆每个基因进入目的载体PHP23236(实施例15)用于在泛素启动子下表达,或进入目的载体PHP29635(实施例15)用于在S2A启动子下表达。每一种表达载体都是用于农杆菌介导玉米转化的T-DNA二元载体。

Gaspe Flint衍生的玉米品系可如实施例17中所述用表达构建体转化。

实施例17

用验证过的拟南芥属前导基因和来自其他物种的对应同源物转化GaspeFlint衍生的玉米品系

为了检查所得表型,玉米植株可如实施例16所述进行转化以过表达拟南芥属AT3G03650基因和来自其他物种的同源物,如表1列出的基因。除了如实施例16所述的启动子之外,其他启动子,例如S2A和S2B启动子、玉米ROOTMET2启动子、玉米Cyclo、CR1BIO、CRWAQ81以及玉米ZRP2.4447,可用于引导EXST和EXST样基因在玉米中的表达。此外,多种终止子,例如但不限于PINII终止子,可用于完成所关注基因在Gaspe Flint衍生的玉米品系中的表达。

受体植株

受体植株细胞可来自具有短的生活周期(“快速循环”)、大小减少以及转化潜能高的单一玉米品系。对玉米典型的这些植株细胞是来自可公开获得的Gaspe Flint(GF)品系品种的植株细胞。一种可能的候选植株品系变种是GF×QTM(Quick Turnaround Maize(快速周转玉米),选择用于在温室条件下生长的Gaspe Flint的可公开获得形式)的F1杂交种,其在Tomes等人的美国专利申请公开2003/0221212中有所公开。从该品系获得的转基因植株具有如此小的大小使得它们可在4英寸的盆中生长(是正常大小的玉米植株所需空间的1/4)并且它们在少于2.5个月时间内成熟。(传统上,一旦转基因植株适应温室后需要3.5个月来获得转基因T0种子。)另一合适的品系是GS3(高度可转化的品系)×Gaspe Flint的双单倍体品系。还有另一种合适的品系是携带引起较早开花、高度减小或这两者的转基因的可转化的优良近交系。

转化规程

任何合适的方法可用于将转基因引入玉米细胞中,包括但不限于利用基于农杆菌载体的接种类型的步骤,如实施例9所述。转化可在受体(靶标)植株的未成熟胚上进行。

精确的生长和植株跟踪

将由转化的玉米胚产生的转基因(T0)植株的事件群体在受控的温室环境中栽培,该温室使用改良的随机分块(block)设计以降低或消除环境误差。随机分块设计是这样一种植株布局,在该布局中,实验植株被分成组(如,每组30株植株),称为块,而每株植株随块被随机分配一个位置。

对于一组30株植株,24株转化的实验植株和6株对照植株(具有设定好的表型的植株)(总起来说称为“重复组”)被置于盆中,这些盆在位于温室内的桌子上布置成阵列(也叫做重复组或块)。每株植株(对照植株或实验植株)随块被随机分配一个位置,所述的块映射一个唯一的、温室物理位置以及映射该重复组。在单次实验中多个30株植株的重复组中的每一个可栽培在相同的温室中。应该确定重复组的布局(布置方式)以使对空间的要求最小以及温室内的环境影响最小。这样一种布局可称为压缩的温室布局。

对于加入特定的对照组的一种替代方法是鉴定不表达所关注基因的那些转基因植株。可将诸如RT-PCR之类的多种技术应用于定量评价引入基因的表达水平。可将不表达转基因的T0植株与表达转基因的那些植株进行比较。

在整个评价过程中鉴定和跟踪事件群体中的每株植株,并且从那些植株收集的数据自动与那些植株相关联,使得所搜集的数据可与由该植株携带的转基因关联。例如,每个植株容器具有机器可读的标签(例如通用货单代码(UPC)条形码),该标签包含了关于植物身份的信息,身份信息继而又与温室位置相关,使得从植物获得的数据可自动与该植物相关联。

作为另外一种选择,可使用任何有效的、机器可读的植物识别系统,例如二维矩阵代码或甚至是射频识别标签(RFID),其中数据被接收并由射频接收器/处理器进行翻译。参见美国公布的专利申请2004/0122592,其以引用方式并入本文。

利用三维成像进行表型分析

对T0事件群体中的每株温室植株(包括任何对照植株)分析所关注的农学特性,并且以这样一种方式记录或存储每株植株的农学数据,该方式使得数据与该植株的辨识数据(见上面)相关联。可利用与上述类似的实验设计,可在T1代中完成对表型(基因效应)的确认。

在植物的整个温室生活周期中,利用定量的非破坏性成像技术在表型水平上来分析T0植株以评价所关注的性状。优选的是,将数字成像分析仪用于整株植物的自动多维分析。成像可在温室内进行。将两个摄像系统(位于顶部和侧面)和用于旋转植物的装置用于从所有侧面观察植物和成像。从每株植物的顶部、前面和侧面采集图像。所有的三个图像一起提供了足够的信息用于评价每株植物的生物量、大小和形态。

由于植物在第一片叶片从土壤显现出来时到植物处于它们发育的末期时大小的改变,最好是从顶部以较高的放大倍率记录植物发育的早期。这可通过利用完全由成像软件控制的自动变焦镜头系统来完成。

在单次成像分析操纵中,进行如下事件:(1)将植株传送至分析仪区域内,旋转360度以便其机器可读标签可被读取,并且让其保持静止直至其叶片停止移动;(2)获取侧面图像并将其输入数据库;(3)将植株旋转90度并再次让其保持静止直至其叶片停止移动,以及(4)将该植株传送出分析仪。

每24小时的周期让植物至少6个小时处于黑暗以便具有正常的白天/黑夜周期。

成像仪器

可使用任何合适的成像仪器,包括但不限于可从LemnaTec GmbH(Wurselen,Germany)商购获得的光谱数字成像仪。获取图像并用具有1/2″IT Progressive Scan IEE CCD成像设备的LemnaTec Scanalyzer HTSLT-0001-2进行分析。该成像照相机可配备有自动变焦、自动调节光圈和自动聚焦。可利用LemnaTec软件设定所有的照相机设置。优选的是,对于主要组成成像分析仪的仪器差异小于约5%,对于次要组成成像分析仪的仪器差异小于约10%。

软件

成像分析系统包括用于颜色和构造分析的LemnaTec HTS Bonit软件程序和用于存储约500,000次分析的数据(包括分析数据)的服务器数据库。原始图像和分析过的图像储存在一起以允许用户根据需要进行再次分析。可将数据库连接至成像硬件用于自动的数据收集和存储。可将多种市售的软件系统(如Matlab等)用于定量判读成像数据,并且这些软件系统中的任何一种均可应用于图像数据集。

传送系统

具有植物旋转装置的传送系统可用于将植物传送至成像区域并在成像过程中选择植物。例如,将最多4株植物(每株最高高度为1.5m)装上汽车,该汽车在循环的传送系统上行进并通过成像测量区域。在这种情况下,该单位(成像分析仪和传送环线)的总占有面积为约5m×5m。

可扩大传送系统以同时容纳更多植物。将植物沿传送环线传送至成像区域并对每株植物分析最多50秒。获取植物的三个视图。传送系统以及成像设备应该能够用于温室环境条件。

照明

任何合适的照明模式可用于图像采集。例如,可在暗背景上使用顶部照明。作为另外一种选择,可采用使用白色背景的顶部照明和背部照明的组合。应该将被照亮的区域围起来以确保恒定的照明条件。遮蔽物应该长于测量区域使得能保持恒定的光条件而不需要打开和关闭门。作为另一种选择,可以变化照明以引起转基因(如,绿色荧光蛋白(GFP)、红色荧光蛋白(RFP))的激发或者引起内源性(如叶绿素)荧光基团的激发。

基于三维成像的生物量评价

为了更好地评价生物量,应该从至少三个轴(优选顶部视图和两个侧面(侧面1和侧面2)视图)获取植物图像。然后分析这些图像以将植物从背景(盆和花粉控制袋(如果适用的话))分离。可通过如下计算来评价植物的体积:

在上面的等式中,体积和面积的单位是“任意单位”。在该体系中,任意单位完全足以检测基因对植物大小和生长影响,因为所需的是检测与实验平均值或对照平均值的差值(正较大和负较小两者)。大小(如面积)的任意单位可通过将物理参照加入到成像过程而轻易地转化成物理量度。例如,可在顶部成像过程和侧面成像过程两者中均包括已知面积的物理参照。基于这些物理参照的面积,可测定转换因子以允许从像素转换为面积单位,例如平方厘米(cm2)。物理参照可以是或可以不是独立的样本。例如,具有已知直径和高度的盆足可用作物理参照。

颜色分类

成像技术还可用于确定植物颜色以及用于将植物颜色归为各种衍生类型。将图像颜色归属于颜色类型是LemnaTec软件的固有特色。使用其他图像分析软件系统,可通过多种计算方法确定颜色分类。

对于植物大小和生长参数的测定,一种有用的分类方案是定义一种单一颜色方案,包括绿色的两种或三种色调,此外,还有关于缺绿病、坏死和漂白(在这些条件出现时)的颜色类型。还使用了背景颜色类型,其包括图像中的非植物颜色(例如盆和土壤颜色),并将这些像素特别地从测定大小中排除。在受控的恒定照明下分析植物,使得可以定量一株植物内随时间推移的任何改变,或者植物之间或植物不同分枝之间的任何改变(如季节差异)。

除了其在测定植物的大小、生长中的有效性,颜色分类还可用于评价其他产量构成性状。对于这些其他产量构成性状,可使用另外的颜色分离方案。例如,称为“保绿度(staygreen)”的性状(已经将其与产量的提高相关联)可通过颜色分类来评价,该颜色分类将绿色色调与黄色和棕色色调(其指示老化的组织)相分离。通过将这种颜色分类应用于在T0或T1植物生活周期末获取的图像,可鉴定绿色的量相对于黄色和棕色(例如,可表示为绿色/黄色比率)增加的植物。这种绿色/黄色比率具有显著差异的植物可被鉴定为携带影响这种重要农学特性的转基因。

熟练的植物学家将认识到可指示植物健康或应激反应的其他植物颜色(花青素)的出现,以及认识到其他颜色分类方案可提供对基因在与这些响应相关的性状方面的作用的进一步度量。

植物构造分析

改变植物构造参数的转基因也可用本发明鉴定,包括诸如最大高度和宽度、节间距离、叶与茎之间的角度、在节处开始的叶片数以及叶片长度。LemnaTec系统软件可如下用于测定植物构造。在第一成像步骤中将植物简化至其主要的几何构造,并且随后基于该图像可进行不同构造参数的参数化鉴定。或者是单独地或者是组合地修改任何这些构造参数的转基因可通过应用此前所述的统计方法来鉴定。

花粉脱落日期

花粉脱落日期是转基因植物中要分析的一个重要参数,并且可通过活性雄花第一次出现在植物上来测定。为了找到雄花目标,通过颜色对茎的上端进行分类以检测黄色或紫色花药。然后将这种颜色分类分析用于定义活性花,活性花继而可用于计算花粉脱落日期。

作为另外一种选择,花粉脱落日期和其他易于在视觉上检测到的植物属性(如授粉日期、第一穗丝日期)可由负责进行植物看护的工作任人员来记录。为了使数据完整性和过程效率最大化,通过利用相同的由LemnaTec光谱数字分析设备利用的条形码来跟踪该数据。可将具有条形码阅读器的电脑、掌上设备或笔记本电脑用于使记录观察时间、植物标识符的数据捕捉变得容易,以及使捕捉数据的操纵者变得舒适。

植物的取向

以接近商业栽培的密度种植的成熟玉米植物通常具有平面的构造。也就是说,植物具有一可清晰分辨的宽的侧面和窄的侧面。对来自植物宽侧的图像进行测定。对于每株植物,给其赋予一个明确界定的基本取向以获得宽侧图像与窄侧(edgewise)图像之间的最大差别。将顶部图像用于测定植物的主轴,而将额外的旋转装置用于在开始主图像采集前将植物转至合适的取向。

实施例18

在氮限制条件下筛选Gaspe Flint衍生的玉米品系

转基因植物将含有两个或三个剂量的Gaspe Flint-3与一个剂量的GS3(GS3/(Gaspe-3)2X或GS3/(Gaspe-3)3X),并且对于显性转基因将会以1∶1分离。将植物在Turface中栽培,每天用1mM KNO3生长培养基和2mMKNO3或更高的生长培养基浇洒四次(见图23)。在1mM KNO3培养基中培养的对照植物的绿度较小,产生较少的生物量并且在开花期具有较小的穗(关于样本数据的示例请参见图24)。

用统计学测定处理株之间所观察到的差异是否真有差异。图18示出了一种方法,该方法将字母放在数值后面。同一列中其后具有相同字母(不是字母组)的那些值不具有显著的差异。使用该方法,如果在一列中的值的后面没有字母,则该列中的这些值的任何之间不存在显著的差异,换句话讲,该列中的所有这些值是均等的。

与无效转基因相比较,转基因的表达将导致植物在1mM KNO3中具有改善的植物生长。因此生物量和绿度(如实施例17所述)将在生长期间进行监控,并与无效转基因植物比较。生长、绿度、开花期穗的大小的改善将表明氮耐受性增强。

实施例19

具有经验证的拟南芥属前导基因(AT3G03650)的玉米品系的产量分析

可通过直接转化或者从单独转化的品系基因渗入而将含有证实的拟南芥属基因的重组DNA构建体导入玉米品系内。

可以将转基因植物(自交系或杂种)进行更强的基于田间的试验,以研究在不同环境条件(例如改变水和营养物质可利用性)下的产量增加和/或稳定性。

可对产量进行后续分析以测定含有验证过的拟南芥属前导基因的植株在与不含有验证过的拟南芥属前导基因的对照植株比较时,在不同环境条件下是否具有产量的改善。可以测得这两种植物的产量都有所减少。包含验证过的拟南芥属前导基因的植物具有相对于对照植物更少的产量损失,优选50%更少的产量损失。

实施例20

测定玉米根构造改变的测定法

测定转基因玉米植物在幼苗期、花期或成熟期的根构造改变。测量玉米植物的根构造改变的测定法包括但不限于下面概述的方法。为了便于手动或自动地测定根构造改变,可让玉米植物在透明的盆中生长。

1)根量(干重)。让植物在Turface中生长。将烘干的根和根组织称重并计算根冠比。

2)侧根分枝的水平。侧根分枝的程度(如侧根数量、侧根长度)通过这样测定:从完整的根系进行二次取样,将样本用平面扫描器或数码相机成像并用WinRHIZOTM软件(Regent Instruments Inc.)分析。

3)根带宽度的测量。根带是植物成熟时在温室栽培盆的底部形成的根带或根量。测量成熟时根带的厚度(以mm为单位),作为对根量的粗略评价。

4)节生根的计数。从支持培养基(support medium)(如盆栽混合物(potting mix))中分离出根后,可测定上部节位处出现的冠根数。另外,可测量冠根和/或支柱根的角度。对节生根和节生根的分枝量的数值分析形成对上述手动方法的另一种延伸。

对提取的有关根表型的所有数据进行统计分析(通常为t检验),以将转基因根与非转基因姊妹株植株的根进行比较。在多个事件和/或构建体涉及该分析的情况下,还可使用单因素方差分析。

实施例21

氮利用效率幼苗检测分析法

使用颜色标记物将转基因事件的种子分成转基因种子(杂合子)和无效转基因种子。进行两组不同的随机分配处理,使用所有处理的9个平行测定,使每个随机分块(block)有排列成6排9列的54个盆。

将每个处理的两个种子种在4英寸的方盆中,盆中包含在8英寸交错中心上的Turface,每天用包含以下营养物质的溶液浇灌四次:

1mM CaCl2     2mM MgSO4     0.5mM KH2PO4    83ppm Sprint330

3mM KCl       1mM KNO3      1μM ZnSO4      1μM MnCl2

3μM H3BO4    1μM MnCl2    0.1μM CuSO4    0.1μM NaMoO4

植物出苗后,将其减少到每盆一个种子。在收获时从盆中移除植物,并且将Turface从根部洗脱。使根与苗分开,把根置于纸袋中并且在70℃干燥70小时。将干燥后的植物部分(根和苗)称重并置于50mL的圆锥管中,管中有大约205/32英寸的钢球,在涂料振荡器中进行振荡研磨。将大约30mg研磨组织(记录重量用于后续的调节)在2mL 20%H2O2和6M H2SO4中水解30分钟,水解温度为170℃。冷却后加水至20mL,充分混合,移除50μL等分试样并将其加入950μL 1M Na2CO3中。通过将100μL该溶液置于96孔板的每个孔中,然后加入50μL OPA溶液,使用该溶液中的氨评价减少的总植物氮。测定荧光强度,激发(excitation)=360nM/发射(emission)=530nM,并且与溶解在相似溶液并用OPA溶液处理过的NH4Cl标准品进行比较。

OPA溶液-5μL巯基乙醇+1mL OPA储备液

OPA储备液-50mg邻苯二醛(OPA-Sigma#P0657)溶解于1.5mL甲醇+4.4mL 1MBorate缓冲液pH9.5(3.09g H3BO4+1g NaOH,溶于50mL水中)+0.55mL 20%SDS

使用这些数据,测量以下参数,并且使用Student t检验比较参数平均值与无效参数平均值:

植物生物重量

根生物量

苗生物量

根/苗比率

植物氮浓度

植物总氮

在每个随机分块中使用最近邻计算以及使用完全随机设计(CRD)模型的方差分析(Analysis of Variance,ANOVA)计算差异。使用F统计,通过将总随机分块处理平均面积除以总随机分块误差平均面积计算每个随机分块的总处理效应。计算更大的Student t检验的概率用于比较每个转基因平均值与合适的无效转基因(或者批构建体或单个事件的无效转基因平均值)平均值。使用最小值(P<t)0.1作为临界值。

实施例22

包含拟南芥属exostosin基因的玉米幼苗的根与来自不包含exostosin基因的幼苗的根的比较分析

如实施例14A所述制备玉米表达载体,该载体包含玉米NAS2启动子(SEQ ID NO:44)和拟南芥属exostosin基因(SEQ ID NO:33)。

如实施例14C所述经由农杆菌介导的转化,通过制备共合体载体(PHP29009)完成玉米转化,并使用如实施例20所述的幼苗检测分析法对根进行检测。

在温室实验中检测分析所有10个来自构建体PHP29009((ZM-NAS2::AT-EXST)的事件,其中每个事件使9个植株在Turface培养基中生长至V4阶段。种子来自T1代(来自从T0植株收集的穗)。对照实验包括15株生长至相同阶段的批无效植物(非转基因的分离植物)。使用完全随机分组设计种植种子。在种植后18天收获植株,此时它们达到V4阶段。洗涤根部并从苗中分开收集。在用分析天平称量干重之前,所有样本进行烘干。

发现在与批无效对照植物进行比较时,总计4个事件具有显著的根干重变化、5个事件具有显著的苗干重变化、7个事件具有显著的根苗比率变化,ata P值小于0.1。六个事件,#4、#5、#6、#7、#9、和#10,具有显著的根/苗比率提高,并且1个事件,#1,具有显著的根/苗比率降低。

进行t检验分析以显示每个转基因事件和对照之间的显著差异。显示了每种特性的p值:根干重、苗干重、以及根-苗比率。粗体字表示转基因植物具有比对照植物更高的值。具有小于0.1的p值的那些值用星号(*)指示。

表5

转基因和对照幼苗的比较

  事件  根干重  苗干重  根/苗比率  1  0.407  1.000  0.057*  2  0.737  0.909  0.501  3  0.931  0.893  0.576  4  0.012*  0.093*  0.000*  5  0.000*  0.431  0.000*  6  0.022*  0.859  0.005*  7  0.431  0.001*  0.061*  8  0.949  0.017*  0.163  9  0.003*  0.001*  0.000*  10  0.404  0.000*  0.027*

实施例23

在田间标准氮和低氮条件下的转基因杂交体产量测试

在2007季,在Johnston,Iowa的农场中进行田间实验。

实验包括表达由玉米NAS2启动子启动的exostosin基因的七个(7)转基因事件。一个对照是批杂交7个事件的非无效转基因与无效转基因。其它对照是转化中使用的野生型。所有植物是由常见自交系受试者生成的杂交体。

施加两次处理,其中植物在“标准”氮条件下或在氮“耗尽”(stress)条件下进行处理。“标准”处理包括以250lb每英亩的比率施加氮肥。氮“耗尽”条件通过在其中土壤含氮量已经在以前多年的缺乏肥料条件下被作物耗尽的土地上种植转基因和非转基因对照玉米品系获得。

氮耗尽与标准氮处理相比引起30%的产量减少,并且需要每英亩100lb的施肥比率。用2排小块土地进行实验,其密度为每英亩32000株植物。在标准氮和氮耗尽处理中分别包括四次(4)和六次(6)重复。在2007年5月21日种植植物,并在2007年9月26日和27日一起收获。以每英亩蒲式耳测量产量。

表6以相对于无效转基因对照植物的产量增加百分比综述了实验的以每英亩蒲式耳计算的总产量数据。由于缺少种子,事件#7不在标准氮条件下进行测试。总体上,在低氮条件下的3个事件和在标准氮条件下的四个(4)事件显示与批无效转基因对照相比,产量显著增加。所有测试的事件都显示了相对于无效转基因植物的产量增加趋势。

表6

在低氮和标准氮条件下转基因植物对对照植物的产量测试

  事件  产量相对于无效转基因的增加  显著性  处理  1  16.15%  P=0.1  低氮  2  6.15%  1标准误差  低氮  3  6.15%  1标准误差  低氮  4  3.08%  低氮  5  7.69%  P=0.1  低氮  6  2.31%  低氮  7  7.69%  P=0.1  低氮  1  7.53%  P=0.1  标准氮  2  7.65%  P=0.1  标准氮  3  8.82%  P=0.1  标准氮  4  12.35%  P=0.1  标准氮  5  4.71%  标准氮  6  7.53%  1标准误差  标准氮

实施例24

全基因组关联作图分析

可使用关联作图方法来鉴定与玉米根构造改变有关的标记。在该关联分析中,能够通过对几千个基因(基因位点)进行DNA测序分析玉米品系的集合。所述品系能够包括优良种质、可商购获得的栽培变种、以及其它公开的品种。

将获得对根构造改变或至少一种农学特性改变的表型评分。具有极端表型的品系将相对于全基因组关联测试(使用2×2相依表的Fisher精确检验)中的基因型进行测试。将使用基于结构的关联分析,其中使用标记数据控制群体结构。将使用基于模型的集分析软件,Structure,该软件由Pritchard等人开发,(Genetics 155:945-959(2000)),同时使用几百个标记的数百个玉米优良自交系的单倍型数据评价混合系数并且将自交系分配成许多亚群。这降低了假阳性的发生概率,假阳性可能由对关联作图统计的群体结构效应引发。使用Kuiper统计测试两个分配是否相同,并且测试给定标记与在给定亚群中的单倍型和表型之间的关联(Press等人,Numerical Recipes in C,第二版,Cambridge University Press,NY(2002))。

在至少一个亚群中的至少一个强峰值指示显著标记-性状关联(例如p<0.001)。cM中给出了标记位点,零点是染色体起始处的第一个(距着丝点最远端)已知标记。这些图谱位点不是绝对的,而是提供基于内源遗传图谱的图谱位点预测。

实施例25

候选基因关联作图

设计引物以扩增来自单个自交系的一部分候选基因位点。获取该位点上的每个自交系的基因型,并且测试多态基因座与根构造改变或至少一种农学特性改变相关的统计意义上的显著性。

序列表

<110>E.I.du Pont de Nemours and Company andPioneer Hi-Bred International

 

<120>具有改变的根构造的植物、涉及编码EXOSTOSIN家族多肽及其同源物的基因的相关的构建体和方法

 

<130>BB1572

 

<140>60/984028

<141>2007-10-31

 

<160>48

 

<170>专利版本3.4

<210>1

<211>18491

<212>DNA

<213>人工序列

 

<220>

<223>载体

 

<400>1

catgaatcaa acaaacatac acagcgactt attcacacga gctcaaatta caacggtata  60

tatcctgccg tcgacaacca tggtctagac aggatccccg ggtaccgagc tcgaatttgc  120

aggtcgactg cgtcatccct tacgtcagtg gagatatcac atcaatccac ttgctttgaa  180

gacgtggttg gaacgtcttc tttttccacg atgctcctcg tgggtggggg tccatctttg  240

ggaccactgt cggcagaggc atcttgaacg atagcctttc ctttatcgca atgatggcat  300

ttgtaggtgc caccttcctt ttctactgtc cttttgatga agtgacagat agctgggcaa  360

tggaatccga ggaggtttcc cgatattacc ctttgttgaa aagtctcaat tgccctttgg  420

tcttctgaga ctgttgcgtc atcccttacg tcagtggaga tatcacatca atccacttgc  480

tttgaagacg tggttggaac gtcttctttt tccacgatgc tcctcgtggg tgggggtcca  540

tctttgggac cactgtcggc agaggcatct tgaacgatag cctttccttt atcgcaatga  600

tggcatttgt aggtgccacc ttccttttct actgtccttt tgatgaagtg acagatagct  660

gggcaatgga atccgaggag gtttcccgat attacccttt gttgaaaagt ctcagttaac  720

ccgcgatcct gcgtcatccc ttacgtcagt ggagatatca catcaatcca cttgctttga  780

agacgtggtt ggaacgtctt ctttttccac gatgctcctc gtgggtgggg gtccatcttt  840

gggaccactg tcggcagagg catcttgaac gatagccttt cctttatcgc aatgatggca  900

tttgtaggtg ccaccttcct tttctactgt ccttttgatg aagtgacaga tagctgggca  960

atggaatccg aggaggtttc ccgatattac cctttgttga aaagtctcaa ttgccctttg    1020

gtcttctgag actgttgcgt catcccttac gtcagtggag atatcacatc aatccacttg    1080

ctttgaagac gtggttggaa cgtcttcttt ttccacgatg ctcctcgtgg gtgggggtcc    1140

atctttggga ccactgtcgg cagaggcatc ttgaacgata gcctttcctt tatcgcaatg    1200

atggcatttg taggtgccac cttccttttc tactgtcctt ttgatgaagt gacagatagc    1260

tgggcaatgg aatccgagga ggtttcccga tattaccctt tgttgaaaag tctcagttaa    1320

cccgcaattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc    1380

aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc    1440

gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggatc gatccgtcga    1500

tcgaccaaag cggccatcgt gcctccccac tcctgcagtt cgggggcatg gatgcgcgga    1560

tagccgctgc tggtttcctg gatgccgacg gatttgcact gccggtagaa ctccgcgagg    1620

tcgtccagcc tcaggcagca gctgaaccaa ctcgcgaggg gatcgagccc ctgctgagcc    1680

tcgacatgtt gtcgcaaaat tcgccctgga cccgcccaac gatttgtcgt cactgtcaag    1740

gtttgacctg cacttcattt ggggcccaca tacaccaaaa aaatgctgca taattctcgg    1800

ggcagcaagt cggttacccg gccgccgtgc tggaccgggt tgaatggtgc ccgtaacttt    1860

cggtagagcg gacggccaat actcaacttc aaggaatctc acccatgcgc gccggcgggg    1920

aaccggagtt cccttcagtg aacgttatta gttcgccgct cggtgtgtcg tagatactag    1980

cccctggggc cttttgaaat ttgaataaga tttatgtaat cagtctttta ggtttgaccg    2040

gttctgccgc tttttttaaa attggatttg taataataaa acgcaattgt ttgttattgt    2100

ggcgctctat catagatgtc gctataaacc tattcagcac aatatattgt tttcatttta    2160

atattgtaca tataagtagt agggtacaat cagtaaattg aacggagaat attattcata    2220

aaaatacgat agtaacgggt gatatattca ttagaatgaa ccgaaaccgg cggtaaggat    2280

ctgagctaca catgctcagg ttttttacaa cgtgcacaac agaattgaaa gcaaatatca    2340

tgcgatcata ggcgtctcgc atatctcatt aaagcagggg gtgggcgaag aactccagca    2400

tgagatcccc gcgctggagg atcatccagc cggcgtcccg gaaaacgatt ccgaagccca    2460

acctttcata gaaggcggcg gtggaatcga aatctcgtga tggcaggttg ggcgtcgctt    2520

ggtcggtcat ttcgaacccc agagtcccgc tcagaagaac tcgtcaagaa ggcgatagaa    2580

ggcgatgcgc tgcgaatcgg gagcggcgat accgtaaagc acgaggaagc ggtcagccca    2640

ttcgccgcca agctcttcag caatatcacg ggtagccaac gctatgtcct gatagcggtc    2700

cgccacaccc agccggccac agtcgatgaa tccagaaaag cggccatttt ccaccatgat    2760

attcggcaag caggcatcgc catgggtcac gacgagatcc tcgccgtcgg gcatgccccc    2820

caattcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact    2880

taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac    2940

cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcctga tgcggtattt    3000

tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca gtacaatctg    3060

ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg acgcgccctg    3120

acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct ccgggagctg    3180

catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg gcctcgtgat    3240

acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt caggtggcac    3300

ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac attcaaatat    3360

gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag    3420

tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc    3480

tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc    3540

acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc    3600

cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc    3660

ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt    3720

ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt    3780

atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat    3840

cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct    3900

tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat    3960

gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc    4020

ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg    4080

ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc    4140

tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta    4200

cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc    4260

ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga    4320

tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg ataatctcat    4380

gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat    4440

caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa    4500

accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa    4560

ggtaactggc ttcagcagag cgcagatacc aaatactgtc cttctagtgt agccgtagtt    4620

aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt    4680

accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata    4740

gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt    4800

ggagcgaacg acctacaccg aactgagata cctacagcgt gagcattgag aaagcgccac    4860

gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga    4920

gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg    4980

ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa    5040

aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat    5100

gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc    5160

tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga    5220

agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg    5280

gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta    5340

gctcactcat taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg    5400

aattgtgagc ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagct    5460

ttctaggggg ggggtaccga tctgagatcg gtaacgaaaa cgaacgggta gggatgaaaa    5520

cggtcggtaa cggtcggtaa aatacctcta ccgttttcat tttcatattt aacttgcggg    5580

acggaaacga aaacgggata taccggtaac gaaaacgaac gggataaata cggtaatcga    5640

aaaccgatac gatccggtcg ggttaaagtc gaaatcggac gggaaccggt atttttgttc    5700

ggtaaaatca cacatgaaaa catatattca aaacttaaaa acaaatataa aaaattgtaa    5760

acacaagtct taatgatcac tagtggcgcg cctaggagat ctcgagtagg gataacaggg    5820

taatacatag ataaaatcca tataaatctg gagcacacat agtttaatgt agcacataag    5880

tgataagtct tgggctcttg gctaacataa gaagccatat aagtctacta gcacacatga    5940

cacaatataa agtttaaaac acatattcat aatcacttgc tcacatctgg atcacttagc    6000

atgctacagc tagtgcaata ttagacactt tccaatattt ctcaaacttt tcactcattg    6060

caacggccat tctcctaatg acaaattttt catgaacaca ccattggtca atcaaatcct    6120

ttatctcaca gaaacctttg taaaataaat ttgcagtgga atattgagta ccagatagga    6180

gttcagtgag atcaaaaaac ttcttcaaac acttaaaaag agttaatgcc atcttccact    6240

cctcggcttt aggacaaatt gcatcgtacc tacaataatt gacatttgat taattgagaa    6300

tttataatga tgacatgtac aacaattgag acaaacatac ctgcgaggat cacttgtttt    6360

aagccgtgtt agtgcaggct tataatataa ggcatccctc aacatcaaat aggttgaatt    6420

ccatctagtt gagacatcat atgagatccc tttagattta tccaagtcac attcactagc    6480

acacttcatt agttcttccc actgcaaagg agaagatttt acagcaagaa caatcgcttt    6540

gattttctca attgttcctg caattacagc caagccatcc tttgcaacca agttcagtat    6600

gtgacaagca cacctcacat gaaagaaagc accatcacaa actagatttg aatcagtgtc    6660

ctgcaaatcc tcaattatat cgtgcacagc tacttcattt gcactagcat tatccaaaga    6720

caaggcaaac aattttttct caatgttcca cttaaccatg attgcagtga aggtttgtga    6780

taacctttgg ccagtgtggc gcccttcaac atgaaaaaag ccaacaattc ttttttggag    6840

acaccaatca tcatcaatcc aatggatggt gacacacatg tatgacttat tttgacaaga    6900

tgtccacata tccatagttg tactgaagcg agactgaaca tcttttagtt ttccatacaa    6960

cttttctttt tcttccaaat acaaatccat gatatatttt ctagcagtga cacgggactt    7020

tattggaaag tgagggcgca gagacttaac aaactcaaca aagtactcat gttctacaat    7080

attgaaagga tattcatgca tgattattgc caaatgaagc ttctttaggc taaccacttc    7140

atcgtactta taaggctcaa tgagatttat gtctttgcca tgatcctttt cactttttag    7200

acacaactga cctttaacta aactatgtga tgttctcaag tgatttcgaa atccgcttgt    7260

tccatgatga ccctcagccc tatacttagc cttgcaatta ggaaagttgc aatgtcccca    7320

tacctgaacg tatttctttc catcgacctc cacttcaatt tccttcttgg tgaaatgctg    7380

ccatacatcc gatgtgcact tctttgccct cttctgtggt gcttcttctt cgggttcagg    7440

ttgtggctgt ggttgtggtt ctggttgtgg ttgtggttgt ggttgtggtt catgaacaat    7500

agccatatca tcttgactcg gatctgtagc tgtaccattt gcattactac tgcttacact    7560

ctgaataaaa tgcctctcgg cctcagctgt tgatgatgat ggtgatgtgc ggccacatcc    7620

atgcccacgc gcacgtgcac gtacattctg aatccgacta gaagaggctt cagcttttct    7680

tttcaaccct gttataaaca gatttttcgt attattctac agtcaatatg atgcttccca    7740

atctacaacc aattagtaat gctaatgcta ttgctactgt ttttctaata tataccttga    7800

gcatatgcag agaatacgga atttgttttg cgagtagaag gcgctcttgt ggtagacatc    7860

aacttggcca atcttatggc tgagcctgag ggaggattat ttccaaccgg aggcgtcatc    7920

tgaggaatgg agtcgtagcc ggctagccga agtggagagc agagccctgg acagcaggtg    7980

ttcagcaatc agcttggtgc tgtactgctg tgacttgtga gcacctggac ggctggacag    8040

caatcagcag gtgttgcaga gcccctggac agcacacaaa tgacacaaca gcttggtgca    8100

atggtgctga cgtgctgtac tgctaagtgc tgtgagcctg tgagcagccg tggagacagg    8160

gagaccgcgg atggccggat gggcgagcgc cgagcagtgg aggtctggag gaccgctgac    8220

cgcagatggc ggatggcgga tgggcggacc gcggatgggc gagcagtgga gtggaggtct    8280

gggcggatgg gcggaccgcg gcgcggatgg gcgagtcgcg agcagtggag tggagggcgg    8340

accgtggatg gcggcgtctg cgtccggcgt gccgcgtcac ggccgtcacc gcgtgtggtg    8400

cctggtgcag cccagcggcc ggccggctgg gagacaggga gagtcggaga gagcaggcga    8460

gagcgagacg cgtcgccggc gtcggcgtgc ggctggcggc gtccggactc cggcgtgggc    8520

gcgtggcggc gtgtgaatgt gtgatgctgt tactcgtgtg gtgcctggcc gcctgggaga    8580

gaggcagagc agcgttcgct aggtatttct tacatgggct gggcctcagt ggttatggat    8640

gggagttgga gctggccata ttgcagtcat cccgaattag aaaatacggt aacgaaacgg    8700

gatcatcccg attaaaaacg ggatcccggt gaaacggtcg ggaaactagc tctaccgttt    8760

ccgtttccgt ttaccgtttt gtatatcccg tttccgttcc gttttcgttt tttacctcgg    8820

gttcgaaatc gatcgggata aaactaacaa aatcggttat acgataacgg tcggtacggg    8880

attttcccat cctactttca tccctgagat tattgtcgtt tctttcgcag atcggtaccc    8940

cccccctaga gtcgacatcg atctagtaac atagatgaca ccgcgcgcga taatttatcc    9000

tagtttgcgc gctatatttt gttttctatc gcgtattaaa tgtataattg cgggactcta    9060

atcataaaaa cccatctcat aaataacgtc atgcattaca tgttaattat tacatgctta    9120

acgtaattca acagaaatta tatgataatc atcgcaagac cggcaacagg attcaatctt    9180

aagaaacttt attgccaaat gtttgaacga tctgcttcga cgcactcctt ctttaggtac    9240

ggactagatc tcggtgacgg gcaggaccgg acggggcggt accggcaggc tgaagtccag    9300

ctgccagaaa cccacgtcat gccagttccc gtgcttgaag ccggccgccc gcagcatgcc    9360

gcggggggca tatccgagcg cctcgtgcat gcgcacgctc gggtcgttgg gcagcccgat    9420

gacagcgacc acgctcttga agccctgtgc ctccagggac ttcagcaggt gggtgtagag    9480

cgtggagccc agtcccgtcc gctggtggcg gggggagacg tacacggtcg actcggccgt    9540

ccagtcgtag gcgttgcgtg ccttccaggg gcccgcgtag gcgatgccgg cgacctcgcc    9600

gtccacctcg gcgacgagcc agggatagcg ctcccgcaga cggacgaggt cgtccgtcca    9660

ctcctgcggt tcctgcggct cggtacggaa gttgaccgtg cttgtctcga tgtagtggtt    9720

gacgatggtg cagaccgccg gcatgtccgc ctcggtggca cggcggatgt cggccgggcg    9780

tcgttctggg ctcatggatc tggattgaga gtgaatatga gactctaatt ggataccgag    9840

gggaatttat ggaacgtcag tggagcattt ttgacaagaa atatttgcta gctgatagtg    9900

accttaggcg acttttgaac gcgcaataat ggtttctgac gtatgtgctt agctcattaa    9960

actccagaaa cccgcggctg agtggctcct tcaatcgttg cggttctgtc agttccaaac    10020

gtaaaacggc ttgtcccgcg tcatcggcgg gggtcataac gtgactccct taattctccg    10080

ctcatgatcc ccgggtaccg agctcgaatt gcggctgagt ggctccttca atcgttgcgg    10140

ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg tcataacgtg    10200

actcccttaa ttctccgctc atgatcttga tcccctgcgc catcagatcc ttggcggcaa    10260

gaaagccatc cagtttactt tgcagggctt cccaacctta ccagagggcg ccccagctgg    10320

caattccggt tcgcttgctg tatcgatatg gtggatttat cacaaatggg acccgccgcc    10380

gacagaggtg tgatgttagg ccaggacttt gaaaatttgc gcaactatcg tatagtggcc    10440

gacaaattga cgccgagttg acagactgcc tagcatttga gtgaattatg tgaggtaatg    10500

ggctacactg aattggtagc tcaaactgtc agtatttatg tatatgagtg tatattttcg    10560

cataatctca gaccaatctg aagatgaaat gggtatctgg gaatggcgaa atcaaggcat    10620

cgatcgtgaa gtttctcatc taagccccca tttggacgtg aatgtagaca cgtcgaaata    10680

aagatttccg aattagaata atttgtttat tgctttcgcc tataaatacg acggatcgta    10740

atttgtcgtt ttatcaaaat gtactttcat tttataataa cgctgcggac atctacattt    10800

ttgaattgaa aaaaaattgg taattactct ttctttttct ccatattgac catcatactc    10860

attgctgatc catgtagatt tcccggacat gaagccattt acaattgaat atatcctgcc    10920

gccgctgccg ctttgcaccc ggtggagctt gcatgttggt ttctacgcag aactgagccg    10980

gttaggcaga taatttccat tgagaactga gccatgtgca ccttcccccc aacacggtga    11040

gcgacggggc aacggagtga tccacatggg acttttaaac atcatccgtc ggatggcgtt    11100

gcgagagaag cagtcgatcc gtgagatcag ccgacgcacc gggcaggcgc gcaacacgat    11160

cgcaaagtat ttgaacgcag gtacaatcga gccgacgttc accgtcaccc tggatgctgt    11220

aggcataggc ttggttatgc cggtactgcc gggcctcttg cgggatatcg tccattccga    11280

cagcatcgcc agtcactatg gcgtgctgct agcgctatat gcgttgatgc aatttctatg    11340

cgcacccgtt ctcggagcac tgtccgaccg ctttggccgc cgcccagtcc tgctcgcttc    11400

gctacttgga gccactatcg actacgcgat catggcgacc acacccgtcc tgtggtccaa  11460

cccctccgct gctatagtgc agtcggcttc tgacgttcag tgcagccgtc ttctgaaaac  11520

gacatgtcgc acaagtccta agttacgcga caggctgccg ccctgccctt ttcctggcgt  11580

tttcttgtcg cgtgttttag tcgcataaag tagaatactt gcgactagaa ccggagacat  11640

tacgccatga acaagagcgc cgccgctggc ctgctgggct atgcccgcgt cagcaccgac  11700

gaccaggact tgaccaacca acgggccgaa ctgcacgcgg ccggctgcac caagctgttt  11760

tccgagaaga tcaccggcac caggcgcgac cgcccggagc tggccaggat gcttgaccac  11820

ctacgccctg gcgacgttgt gacagtgacc aggctagacc gcctggcccg cagcacccgc  11880

gacctactgg acattgccga gcgcatccag gaggccggcg cgggcctgcg tagcctggca  11940

gagccgtggg ccgacaccac cacgccggcc ggccgcatgg tgttgaccgt gttcgccggc  12000

attgccgagt tcgagcgttc cctaatcatc gaccgcaccc ggagcgggcg cgaggccgcc  12060

aaggcccgag gcgtgaagtt tggcccccgc cctaccctca ccccggcaca gatcgcgcac  12120

gcccgcgagc tgatcgacca ggaaggccgc accgtgaaag aggcggctgc actgcttggc  12180

gtgcatcgct cgaccctgta ccgcgcactt gagcgcagcg aggaagtgac gcccaccgag  12240

gccaggcggc gcggtgcctt ccgtgaggac gcattgaccg aggccgacgc cctggcggcc  12300

gccgagaatg aacgccaaga ggaacaagca tgaaaccgca ccaggacggc caggacgaac  12360

cgtttttcat taccgaagag atcgaggcgg agatgatcgc ggccgggtac gtgttcgagc  12420

cgcccgcgca cgtctcaacc gtgcggctgc atgaaatcct ggccggtttg tctgatgcca  12480

agctggcggc ctggccggcc agcttggccg ctgaagaaac cgagcgccgc cgtctaaaaa  12540

ggtgatgtgt atttgagtaa aacagcttgc gtcatgcggt cgctgcgtat atgatgcgat  12600

gagtaaataa acaaatacgc aagggaacgc atgaagttat cgctgtactt aaccagaaag  12660

gcgggtcagg caagacgacc atcgcaaccc atctagcccg cgccctgcaa ctcgccgggg  12720

ccgatgttct gttagtcgat tccgatcccc agggcagtgc ccgcgattgg gcggccgtgc  12780

gggaagatca accgctaacc gttgtcggca tcgaccgccc gacgattgac cgcgacgtga  12840

aggccatcgg ccggcgcgac ttcgtagtga tcgacggagc gccccaggcg gcggacttgg  12900

ctgtgtccgc gatcaaggca gccgacttcg tgctgattcc ggtgcagcca agcccttacg  12960

acatatgggc caccgccgac ctggtggagc tggttaagca gcgcattgag gtcacggatg  13020

gaaggctaca agcggccttt gtcgtgtcgc gggcgatcaa aggcacgcgc atcggcggtg  13080

aggttgccga ggcgctggcc gggtacgagc tgcccattct tgagtcccgt atcacgcagc  13140

gcgtgagcta cccaggcact gccgccgccg gcacaaccgt tcttgaatca gaacccgagg  13200

gcgacgctgc ccgcgaggtc caggcgctgg ccgctgaaat taaatcaaaa ctcatttgag  13260

ttaatgaggt aaagagaaaa tgagcaaaag cacaaacacg ctaagtgccg gccgtccgag  13320

cgcacgcagc agcaaggctg caacgttggc cagcctggca gacacgccag ccatgaagcg  13380

ggtcaacttt cagttgccgg cggaggatca caccaagctg aagatgtacg cggtacgcca  13440

aggcaagacc attaccgagc tgctatctga atacatcgcg cagctaccag agtaaatgag  13500

caaatgaata aatgagtaga tgaattttag cggctaaagg aggcggcatg gaaaatcaag  13560

aacaaccagg caccgacgcc gtggaatgcc ccatgtgtgg aggaacgggc ggttggccag  13620

gcgtaagcgg ctgggttgtc tgccggccct gcaatggcac tggaaccccc aagcccgagg  13680

aatcggcgtg agcggtcgca aaccatccgg cccggtacaa atcggcgcgg cgctgggtga  13740

tgacctggtg gagaagttga aggccgcgca ggccgcccag cggcaacgca tcgaggcaga  13800

agcacgcccc ggtgaatcgt ggcaagcggc cgctgatcga atccgcaaag aatcccggca  13860

accgccggca gccggtgcgc cgtcgattag gaagccgccc aagggcgacg agcaaccaga  13920

ttttttcgtt ccgatgctct atgacgtggg cacccgcgat agtcgcagca tcatggacgt  13980

ggccgttttc cgtctgtcga agcgtgaccg acgagctggc gaggtgatcc gctacgagct  14040

tccagacggg cacgtagagg tttccgcagg gccggccggc atggccagtg tgtgggatta  14100

cgacctggta ctgatggcgg tttcccatct aaccgaatcc atgaaccgat accgggaagg  14160

gaagggagac aagcccggcc gcgtgttccg tccacacgtt gcggacgtac tcaagttctg  14220

ccggcgagcc gatggcggaa agcagaaaga cgacctggta gaaacctgca ttcggttaaa  14280

caccacgcac gttgccatgc agcgtacgaa gaaggccaag aacggccgcc tggtgacggt  14340

atccgagggt gaagccttga ttagccgcta caagatcgta aagagcgaaa ccgggcggcc  14400

ggagtacatc gagatcgagc tagctgattg gatgtaccgc gagatcacag aaggcaagaa  14460

cccggacgtg ctgacggttc accccgatta ctttttgatc gatcccggca tcggccgttt  14520

tctctaccgc ctggcacgcc gcgccgcagg caaggcagaa gccagatggt tgttcaagac  14580

gatctacgaa cgcagtggca gcgccggaga gttcaagaag ttctgtttca ccgtgcgcaa  14640

gctgatcggg tcaaatgacc tgccggagta cgatttgaag gaggaggcgg ggcaggctgg  14700

cccgatccta gtcatgcgct accgcaacct gatcgagggc gaagcatccg ccggttccta  14760

atgtacggag cagatgctag ggcaaattgc cctagcaggg gaaaaaggtc gaaaaggtct  14820

ctttcctgtg gatagcacgt acattgggaa cccaaagccg tacattggga accggaaccc  14880

gtacattggg aacccaaagc cgtacattgg gaaccggtca cacatgtaag tgactgatat  14940

aaaagagaaa aaaggcgatt tttccgccta aaactcttta aaacttatta aaactcttaa  15000

aacccgcctg gcctgtgcat aactgtctgg ccagcgcaca gccgaagagc tgcaaaaagc  15060

gcctaccctt cggtcgctgc gctccctacg ccccgccgct tcgcgtcggc ctatcgcggc  15120

cgctggccgc tcaaaaatgg ctggcctacg gccaggcaat ctaccagggc gcggacaagc  15180

cgcgccgtcg ccactcgacc gccggcgccc acatcaaggc accctgcctc gcgcgtttcg  15240

gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt  15300

aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc  15360

ggggcgcagc catgacccag tcacgtagcg atagcggagt gtatactggc ttaactatgc  15420

ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg  15480

cgtaaggaga aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg  15540

ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc  15600

cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag  15660

gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca  15720

tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca  15780

ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg  15840

atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag  15900

gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt  15960

tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca  16020

cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg  16080

cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt  16140

tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc  16200

cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg  16260

cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg  16320

gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta  16380

gatcctttta aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg  16440

gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg  16500

ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc  16560

atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc  16620

agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc  16680

ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag  16740

tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat  16800

ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg  16860

caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt  16920

gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag  16980

atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg  17040

accgagttgc tcttgcccgg cgtcaacacg ggataatacc gcgccacata gcagaacttt  17100

aaaagtgctc atcattggaa aagacctgca gggggggggg ggaaagccac gttgtgtctc  17160

aaaatctctg atgttacatt gcacaagata aaaatatatc atcatgaaca ataaaactgt  17220

ctgcttacat aaacagtaat acaaggggtg ttatgagcca tattcaacgg gaaacgtctt  17280

gctcgaggcc gcgattaaat tccaacatgg atgctgattt atatgggtat aaatgggctc  17340

gcgataatgt cgggcaatca ggtgcgacaa tctatcgatt gtatgggaag cccgatgcgc  17400

cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa tgatgttaca gatgagatgg  17460

tcagactaaa ctggctgacg gaatttatgc ctcttccgac catcaagcat tttatccgta  17520

ctcctgatga tgcatggtta ctcaccactg cgatccccgg gaaaacagca ttccaggtat  17580

tagaagaata tcctgattca ggtgaaaata ttgttgatgc gctggcagtg ttcctgcgcc  17640

ggttgcattc gattcctgtt tgtaattgtc cttttaacag cgatcgcgta tttcgtctcg  17700

ctcaggcgca atcacgaatg aataacggtt tggttgatgc gagtgatttt gatgacgagc  17760

gtaatggctg gcctgttgaa caagtctgga aagaaatgca taagcttttg ccattctcac  17820

cggattcagt cgtcactcat ggtgatttct cacttgataa ccttattttt gacgagggga  17880

aattaatagg ttgtattgat gttggacgag tcggaatcgc agaccgatac caggatcttg  17940

ccatcctatg gaactgcctc ggtgagtttt ctccttcatt acagaaacgg ctttttcaaa  18000

aatatggtat tgataatcct gatatgaata aattgcagtt tcatttgatg ctcgatgagt  18060

ttttctaatc agaattggtt aattggttgt aacactggca gagcattacg ctgacttgac  18120

gggacggcgg ctttgttgaa taaatcgaac ttttgctgag ttgaaggatc agatcacgca  18180

tcttcccgac aacgcagacc gttccgtggc aaagcaaaag ttcaaaatca ccaactggtc  18240

cacctacaac aaagctctca tcaaccgtgg ctccctcact ttctggctgg atgatggggc  18300

gattcaggcc tggtatgagt cagcaacacc ttcttcacga ggcagacctc agcgcccccc  18360

cccccctgca ggtcaattcg gtcgatatgg ctattacgaa gaaggctcgt gcgcggagtc  18420

ccgtgaact ttcccacgcaa caagtgaacc gcaccgggtt tgccggaggc catttcgtta  18480

aaatgcgcag c                                                       18491

 

<210>2

<211>4291

<212>DNA

<213>人工序列

 

<220>

<223>载体

 

<400>2

ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga  60

taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga  120

gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca  180

cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc  240

tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta  300

gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc  360

acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa  420

caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg  480

gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa  540

aacgacggcc agtcttaagc tcgggcccca aataatgatt ttattttgac tgatagtgac  600

ctgttcgttg caacacattg atgagcaatg cttttttata atgccaactt tgtacaaaaa  660

agctgaacga gaaacgtaaa atgatataaa tatcaatata ttaaattaga ttttgcataa  720

aaaacagact acataatact gtaaaacaca acatatccag tcactatgaa tcaactactt  780

agatggtatt agtgacctgt agtcgaccga cagccttcca aatgttcttc gggtgatgct  840

gccaacttag tcgaccgaca gccttccaaa tgttcttctc aaacggaatc gtcgtatcca  900

gcctactcgc tattgtcctc aatgccgtat taaatcataa aaagaaataa gaaaaagagg  960

tgcgagcctc ttttttgtgt gacaaaataa aaacatctac ctattcatat acgctagtgt  1020

catagtcctg aaaatcatct gcatcaagaa caatttcaca actcttatac ttttctctta  1080

caagtcgttc ggcttcatct ggattttcag cctctatact tactaaacgt gataaagttt  1140

ctgtaatttc tactgtatcg acctgcagac tggctgtgta taagggagcc tgacatttat  1200

attccccaga acatcaggtt aatggcgttt ttgatgtcat tttcgcggtg gctgagatca  1260

gccacttctt ccccgataac ggagaccggc acactggcca tatcggtggt catcatgcgc    1320

cagctttcat ccccgatatg caccaccggg taaagttcac gggagacttt atctgacagc    1380

agacgtgcac tggccagggg gatcaccatc cgtcgcccgg gcgtgtcaat aatatcactc    1440

tgtacatcca caaacagacg ataacggctc tctcttttat aggtgtaaac cttaaactgc    1500

atttcaccag cccctgttct cgtcagcaaa agagccgttc atttcaataa accgggcgac    1560

ctcagccatc ccttcctgat tttccgcttt ccagcgttcg gcacgcagac gacgggcttc    1620

attctgcatg gttgtgctta ccagaccgga gatattgaca tcatatatgc cttgagcaac    1680

tgatagctgt cgctgtcaac tgtcactgta atacgctgct tcatagcata cctctttttg    1740

acatacttcg ggtatacata tcagtatata ttcttatacc gcaaaaatca gcgcgcaaat    1800

acgcatactg ttatctggct tttagtaagc cggatccacg cggcgtttac gccccgccct    1860

gccactcatc gcagtactgt tgtaattcat taagcattct gccgacatgg aagccatcac    1920

agacggcatg atgaacctga atcgccagcg gcatcagcac cttgtcgcct tgcgtataat    1980

atttgcccat ggtgaaaacg ggggcgaaga agttgtccat attggccacg tttaaatcaa    2040

aactggtgaa actcacccag ggattggctg agacgaaaaa catattctca ataaaccctt    2100

tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa    2160

actgccggaa atcgtcgtgg tattcactcc agagcgatga aaacgtttca gtttgctcat    2220

ggaaaacggt gtaacaaggg tgaacactat cccatatcac cagctcaccg tctttcattg    2280

ccatacggaa ttccggatga gcattcatca ggcgggcaag aatgtgaata aaggccggat    2340

aaaacttgtg cttatttttc tttacggtct ttaaaaaggc cgtaatatcc agctgaacgg    2400

tctggttata ggtacattga gcaactgact gaaatgcctc aaaatgttct ttacgatgcc    2460

attgggatat atcaacggtg gtatatccag tgattttttt ctccatttta gcttccttag    2520

ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag tgatcttatt tcattatggt    2580

gaaagttgga acctcttacg tgccgatcaa cgtctcattt tcgccaaaag ttggcccagg    2640

gcttcccggt atcaacaggg acaccaggat ttatttattc tgcgaagtga tcttccgtca    2700

caggtattta ttcggcgcaa agtgcgtcgg gtgatgctgc caacttagtc gactacaggt    2760

cactaatacc atctaagtag ttgattcata gtgactggat atgttgtgtt ttacagtatt    2820

atgtagtctg ttttttatgc aaaatctaat ttaatatatt gatatttata tcattttacg    2880

tttctcgttc agctttcttg tacaaagttg gcattataag aaagcattgc ttatcaattt    2940

gttgcaacga acaggtcact atcagtcaaa ataaaatcat tatttgccat ccagctgata    3000

tcccctatag tgagtcgtat tacatggtca tagctgtttc ctggcagctc tggcccgtgt  3060

ctcaaaatct ctgatgttac attgcacaag ataaaataat atcatcatga tcagtcctgc  3120

tcctcggcca cgaagtgcac gcagttgccg gccgggtcgc gcagggcgaa ctcccgcccc  3180

cacggctgct cgccgatctc ggtcatggcc ggcccggagg cgtcccggaa gttcgtggac  3240

acgacctccg accactcggc gtacagctcg tccaggccgc gcacccacac ccaggccagg  3300

gtgttgtccg gcaccacctg gtcctggacc gcgctgatga acagggtcac gtcgtcccgg  3360

accacaccgg cgaagtcgtc ctccacgaag tcccgggaga acccgagccg gtcggtccag  3420

aactcgaccg ctccggcgac gtcgcgcgcg gtgagcaccg gaacggcact ggtcaacttg  3480

gccatggttt agttcctcac cttgtcgtat tatactatgc cgatatacta tgccgatgat  3540

taattgtcaa cacgtgctga tcatgaccaa aatcccttaa cgtgagttac gcgtcgttcc  3600

actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc  3660

gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg  3720

atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa  3780

atactgttct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc  3840

ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt  3900

gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa  3960

cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc  4020

tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc  4080

cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct  4140

ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat  4200

gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc  4260

tggccttttg ctggcctttt gctcacatgt t                                 4291

 

<210>3

<211>4762

<212>DNA

<213>人工序列

 

<220>

<223>载体

 

<400>3

ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga    60

taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga    120

gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca    180

cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc    240

tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta    300

gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc    360

acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa    420

caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg    480

gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa    540

aacgacggcc agtcttaagc tcgggcccca aataatgatt ttattttgac tgatagtgac    600

ctgttcgttg caacacattg atgagcaatg cttttttata atgccaactt tgtacaaaaa    660

agctgaacga gaaacgtaaa atgatataaa tatcaatata ttaaattaga ttttgcataa    720

aaaacagact acataatact gtaaaacaca acatatccag tcactatgaa tcaactactt    780

agatggtatt agtgacctgt agtcgaccga cagccttcca aatgttcttc gggtgatgct    840

gccaacttag tcgaccgaca gccttccaaa tgttcttctc aaacggaatc gtcgtatcca    900

gcctactcgc tattgtcctc aatgccgtat taaatcataa aaagaaataa gaaaaagagg    960

tgcgagcctc ttttttgtgt gacaaaataa aaacatctac ctattcatat acgctagtgt    1020

catagtcctg aaaatcatct gcatcaagaa caatttcaca actcttatac ttttctctta    1080

caagtcgttc ggcttcatct ggattttcag cctctatact tactaaacgt gataaagttt    1140

ctgtaatttc tactgtatcg acctgcagac tggctgtgta taagggagcc tgacatttat    1200

attccccaga acatcaggtt aatggcgttt ttgatgtcat tttcgcggtg gctgagatca    1260

gccacttctt ccccgataac ggagaccggc acactggcca tatcggtggt catcatgcgc    1320

cagctttcat ccccgatatg caccaccggg taaagttcac gggagacttt atctgacagc    1380

agacgtgcac tggccagggg gatcaccatc cgtcgcccgg gcgtgtcaat aatatcactc    1440

tgtacatcca caaacagacg ataacggctc tctcttttat aggtgtaaac cttaaactgc    1500

atttcaccag cccctgttct cgtcagcaaa agagccgttc atttcaataa accgggcgac    1560

ctcagccatc ccttcctgat tttccgcttt ccagcgttcg gcacgcagac gacgggcttc    1620

attctgcatg gttgtgctta ccagaccgga gatattgaca tcatatatgc cttgagcaac    1680

tgatagctgt cgctgtcaac tgtcactgta atacgctgct tcatagcata cctctttttg    1740

acatacttcg ggtatacata tcagtatata ttcttatacc gcaaaaatca gcgcgcaaat    1800

acgcatactg ttatctggct tttagtaagc cggatccacg cggcgtttac gccccgccct    1860

gccactcatc gcagtactgt tgtaattcat taagcattct gccgacatgg aagccatcac    1920

agacggcatg atgaacctga atcgccagcg gcatcagcac cttgtcgcct tgcgtataat    1980

atttgcccat ggtgaaaacg ggggcgaaga agttgtccat attggccacg tttaaatcaa    2040

aactggtgaa actcacccag ggattggctg agacgaaaaa catattctca ataaaccctt    2100

tagggaaata ggccaggttt tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa    2160

actgccggaa atcgtcgtgg tattcactcc agagcgatga aaacgtttca gtttgctcat    2220

ggaaaacggt gtaacaaggg tgaacactat cccatatcac cagctcaccg tctttcattg    2280

ccatacggaa ttccggatga gcattcatca ggcgggcaag aatgtgaata aaggccggat    2340

aaaacttgtg cttatttttc tttacggtct ttaaaaaggc cgtaatatcc agctgaacgg    2400

tctggttata ggtacattga gcaactgact gaaatgcctc aaaatgttct ttacgatgcc    2460

attgggatat atcaacggtg gtatatccag tgattttttt ctccatttta gcttccttag    2520

ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag tgatcttatt tcattatggt    2580

gaaagttgga acctcttacg tgccgatcaa cgtctcattt tcgccaaaag ttggcccagg    2640

gcttcccggt atcaacaggg acaccaggat ttatttattc tgcgaagtga tcttccgtca    2700

caggtattta ttcggcgcaa agtgcgtcgg gtgatgctgc caacttagtc gactacaggt    2760

cactaatacc atctaagtag ttgattcata gtgactggat atgttgtgtt ttacagtatt    2820

atgtagtctg ttttttatgc aaaatctaat ttaatatatt gatatttata tcattttacg    2880

tttctcgttc agctttcttg tacaaagttg gcattataag aaagcattgc ttatcaattt    2940

gttgcaacga acaggtcact atcagtcaaa ataaaatcat tatttgccat ccagctgata    3000

tcccctatag tgagtcgtat tacatggtca tagctgtttc ctggcagctc tggcccgtgt    3060

ctcaaaatct ctgatgttac attgcacaag ataaaataat atcatcatga acaataaaac    3120

tgtctgctta cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt    3180

cgaggccgcg attaaattcc aacatggatg ctgatttata tgggtataaa tgggctcgcg    3240

ataatgtcgg gcaatcaggt gcgacaatct atcgcttgta tgggaagccc gatgcgccag    3300

agttgtttct gaaacatggc aaaggtagcg ttgccaatga tgttacagat gagatggtca    3360

gactaaactg gctgacggaa tttatgcctc ttccgaccat caagcatttt atccgtactc    3420

ctgatgatgc atggttactc accactgcga tccccggaaa aacagcattc caggtattag    3480

aagaatatcc tgattcaggt gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt    3540

tgcattcgat tcctgtttgt aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc    3600

aggcgcaatc acgaatgaat aacggtttgg ttgatgcgag tgattttgat gacgagcgta  3660

atggctggcc tgttgaacaa gtctggaaag aaatgcataa acttttgcca ttctcaccgg  3720

attcagtcgt cactcatggt gatttctcac ttgataacct tatttttgac gaggggaaat  3780

taataggttg tattgatgtt ggacgagtcg gaatcgcaga ccgataccag gatcttgcca  3840

tcctatggaa ctgcctcggt gagttttctc cttcattaca gaaacggctt tttcaaaaat  3900

atggtattga taatcctgat atgaataaat tgcagtttca tttgatgctc gatgagtttt  3960

tctaatcaga attggttaat tggttgtaac actggcagag cattacgctg acttgacggg  4020

acggcgcaag ctcatgacca aaatccctta acgtgagtta cgcgtcgttc cactgagcgt  4080

cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct  4140

gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc  4200

taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc  4260

ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc  4320

tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg  4380

ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt  4440

cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg  4500

agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg  4560

gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt  4620

atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag  4680

gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt  4740

gctggccttt tgctcacatg tt                                           4762

 

<210>4

<211>16843

<212>DNA

<213>人工序列

 

<220>

<223>载体

 

<400>4

ccgggctggt tgccctcgcc gctgggctgg cggccgtcta tggccctgca aacgcgccag    60

aaacgccgtc gaagccgtgt gcgagacacc gcggccgccg gcgttgtgga tacctcgcgg    120

aaaacttggc cctcactgac agatgagggg cggacgttga cacttgaggg gccgactcac    180

ccggcgcggc gttgacagat gaggggcagg ctcgatttcg gccggcgacg tggagctggc    240

cagcctcgca aatcggcgaa aacgcctgat tttacgcgag tttcccacag atgatgtgga    300

caagcctggg gataagtgcc ctgcggtatt gacacttgag gggcgcgact actgacagat    360

gaggggcgcg atccttgaca cttgaggggc agagtgctga cagatgaggg gcgcacctat    420

tgacatttga ggggctgtcc acaggcagaa aatccagcat ttgcaagggt ttccgcccgt    480

ttttcggcca ccgctaacct gtcttttaac ctgcttttaa accaatattt ataaaccttg    540

tttttaacca gggctgcgcc ctgtgcgcgt gaccgcgcac gccgaagggg ggtgcccccc    600

cttctcgaac cctcccggcc cgctaacgcg ggcctcccat ccccccaggg gctgcgcccc    660

tcggccgcga acggcctcac cccaaaaatg gcagcgctgg cagtccttgc cattgccggg    720

atcggggcag taacgggatg ggcgatcagc ccgagcgcga cgcccggaag cattgacgtg    780

ccgcaggtgc tggcatcgac attcagcgac caggtgccgg gcagtgaggg cggcggcctg    840

ggtggcggcc tgcccttcac ttcggccgtc ggggcattca cggacttcat ggcggggccg    900

gcaattttta ccttgggcat tcttggcata gtggtcgcgg gtgccgtgct cgtgttcggg    960

ggtgcgataa acccagcgaa ccatttgagg tgataggtaa gattataccg aggtatgaaa    1020

acgagaattg gacctttaca gaattactct atgaagcgcc atatttaaaa agctaccaag    1080

acgaagagga tgaagaggat gaggaggcag attgccttga atatattgac aatactgata    1140

agataatata tcttttatat agaagatatc gccgtatgta aggatttcag ggggcaaggc    1200

ataggcagcg cgcttatcaa tatatctata gaatgggcaa agcataaaaa cttgcatgga    1260

ctaatgcttg aaacccagga caataacctt atagcttgta aattctatca taattgggta    1320

atgactccaa cttattgata gtgttttatg ttcagataat gcccgatgac tttgtcatgc    1380

agctccaccg attttgagaa cgacagcgac ttccgtccca gccgtgccag gtgctgcctc    1440

agattcaggt tatgccgctc aattcgctgc gtatatcgct tgctgattac gtgcagcttt    1500

cccttcaggc gggattcata cagcggccag ccatccgtca tccatatcac cacgtcaaag    1560

ggtgacagca ggctcataag acgccccagc gtcgccatag tgcgttcacc gaatacgtgc    1620

gcaacaaccg tcttccggag actgtcatac gcgtaaaaca gccagcgctg gcgcgattta    1680

gccccgacat agccccactg ttcgtccatt tccgcgcaga cgatgacgtc actgcccggc    1740

tgtatgcgcg aggttaccga ctgcggcctg agttttttaa gtgacgtaaa atcgtgttga    1800

ggccaacgcc cataatgcgg gctgttgccc ggcatccaac gccattcatg gccatatcaa    1860

tgattttctg gtgcgtaccg ggttgagaag cggtgtaagt gaactgcagt tgccatgttt    1920

tacggcagtg agagcagaga tagcgctgat gtccggcggt gcttttgccg ttacgcacca    1980

ccccgtcagt agctgaacag gagggacagc tgatagacac agaagccact ggagcacctc    2040

aaaaacacca tcatacacta aatcagtaag ttggcagcat cacccataat tgtggtttca    2100

aaatcggctc cgtcgatact atgttatacg ccaactttga aaacaacttt gaaaaagctg    2160

ttttctggta tttaaggttt tagaatgcaa ggaacagtga attggagttc gtcttgttat    2220

aattagcttc ttggggtatc tttaaatact gtagaaaaga ggaaggaaat aataaatggc    2280

taaaatgaga atatcaccgg aattgaaaaa actgatcgaa aaataccgct gcgtaaaaga    2340

tacggaagga atgtctcctg ctaaggtata taagctggtg ggagaaaatg aaaacctata    2400

tttaaaaatg acggacagcc ggtataaagg gaccacctat gatgtggaac gggaaaagga    2460

catgatgcta tggctggaag gaaagctgcc tgttccaaag gtcctgcact ttgaacggca    2520

tgatggctgg agcaatctgc tcatgagtga ggccgatggc gtcctttgct cggaagagta    2580

tgaagatgaa caaagccctg aaaagattat cgagctgtat gcggagtgca tcaggctctt    2640

tcactccatc gacatatcgg attgtcccta tacgaatagc ttagacagcc gcttagccga    2700

attggattac ttactgaata acgatctggc cgatgtggat tgcgaaaact gggaagaaga    2760

cactccattt aaagatccgc gcgagctgta tgatttttta aagacggaaa agcccgaaga    2820

ggaacttgtc ttttcccacg gcgacctggg agacagcaac atctttgtga aagatggcaa    2880

agtaagtggc tttattgatc ttgggagaag cggcagggcg gacaagtggt atgacattgc    2940

cttctgcgtc cggtcgatca gggaggatat cggggaagaa cagtatgtcg agctattttt    3000

tgacttactg gggatcaagc ctgattggga gaaaataaaa tattatattt tactggatga    3060

attgttttag tacctagatg tggcgcaacg atgccggcga caagcaggag cgcaccgact    3120

tcttccgcat caagtgtttt ggctctcagg ccgaggccca cggcaagtat ttgggcaagg    3180

ggtcgctggt attcgtgcag ggcaagattc ggaataccaa gtacgagaag gacggccaga    3240

cggtctacgg gaccgacttc attgccgata aggtggatta tctggacacc aaggcaccag    3300

gcgggtcaaa tcaggaataa gggcacattg ccccggcgtg agtcggggca atcccgcaag    3360

gagggtgaat gaatcggacg tttgaccgga aggcatacag gcaagaactg atcgacgcgg    3420

ggttttccgc cgaggatgcc gaaaccatcg caagccgcac cgtcatgcgt gcgccccgcg    3480

aaaccttcca gtccgtcggc tcgatggtcc agcaagctac ggccaagatc gagcgcgaca    3540

gcgtgcaact ggctccccct gccctgcccg cgccatcggc cgccgtggag cgttcgcgtc    3600

gtctcgaaca ggaggcggca ggtttggcga agtcgatgac catcgacacg cgaggaacta    3660

tgacgaccaa gaagcgaaaa accgccggcg aggacctggc aaaacaggtc agcgaggcca    3720

agcaggccgc gttgctgaaa cacacgaagc agcagatcaa ggaaatgcag ctttccttgt    3780

tcgatattgc gccgtggccg gacacgatgc gagcgatgcc aaacgacacg gcccgctctg    3840

ccctgttcac cacgcgcaac aagaaaatcc cgcgcgaggc gctgcaaaac aaggtcattt    3900

tccacgtcaa caaggacgtg aagatcacct acaccggcgt cgagctgcgg gccgacgatg    3960

acgaactggt gtggcagcag gtgttggagt acgcgaagcg cacccctatc ggcgagccga    4020

tcaccttcac gttctacgag ctttgccagg acctgggctg gtcgatcaat ggccggtatt    4080

acacgaaggc cgaggaatgc ctgtcgcgcc tacaggcgac ggcgatgggc ttcacgtccg    4140

accgcgttgg gcacctggaa tcggtgtcgc tgctgcaccg cttccgcgtc ctggaccgtg    4200

gcaagaaaac gtcccgttgc caggtcctga tcgacgagga aatcgtcgtg ctgtttgctg    4260

gcgaccacta cacgaaattc atatgggaga agtaccgcaa gctgtcgccg acggcccgac    4320

ggatgttcga ctatttcagc tcgcaccggg agccgtaccc gctcaagctg gaaaccttcc    4380

gcctcatgtg cggatcggat tccacccgcg tgaagaagtg gcgcgagcag gtcggcgaag    4440

cctgcgaaga gttgcgaggc agcggcctgg tggaacacgc ctgggtcaat gatgacctgg    4500

tgcattgcaa acgctagggc cttgtggggt cagttccggc tgggggttca gcagccagcg    4560

ctttactggc atttcaggaa caagcgggca ctgctcgacg cacttgcttc gctcagtatc    4620

gctcgggacg cacggcgcgc tctacgaact gccgataaac agaggattaa aattgacaat    4680

tgtgattaag gctcagattc gacggcttgg agcggccgac gtgcaggatt tccgcgagat    4740

ccgattgtcg gccctgaaga aagctccaga gatgttcggg tccgtttacg agcacgagga    4800

gaaaaagccc atggaggcgt tcgctgaacg gttgcgagat gccgtggcat tcggcgccta    4860

catcgacggc gagatcattg ggctgtcggt cttcaaacag gaggacggcc ccaaggacgc    4920

tcacaaggcg catctgtccg gcgttttcgt ggagcccgaa cagcgaggcc gaggggtcgc    4980

cggtatgctg ctgcgggcgt tgccggcggg tttattgctc gtgatgatcg tccgacagat    5040

tccaacggga atctggtgga tgcgcatctt catcctcggc gcacttaata tttcgctatt    5100

ctggagcttg ttgtttattt cggtctaccg cctgccgggc ggggtcgcgg cgacggtagg    5160

cgctgtgcag ccgctgatgg tcgtgttcat ctctgccgct ctgctaggta gcccgatacg    5220

attgatggcg gtcctggggg ctatttgcgg aactgcgggc gtggcgctgt tggtgttgac    5280

accaaacgca gcgctagatc ctgtcggcgt cgcagcgggc ctggcggggg cggtttccat    5340

ggcgttcgga accgtgctga cccgcaagtg gcaacctccc gtgcctctgc tcacctttac    5400

cgcctggcaa ctggcggccg gaggacttct gctcgttcca gtagctttag tgtttgatcc    5460

gccaatcccg atgcctacag gaaccaatgt tctcggcctg gcgtggctcg gcctgatcgg    5520

agcgggttta acctacttcc tttggttccg ggggatctcg cgactcgaac ctacagttgt    5580

ttccttactg ggctttctca gccccagatc tggggtcgat cagccgggga tgcatcaggc    5640

cgacagtcgg aacttcgggt ccccgacctg taccattcgg tgagcaatgg ataggggagt    5700

tgatatcgtc aacgttcact tctaaagaaa tagcgccact cagcttcctc agcggcttta    5760

tccagcgatt tcctattatg tcggcatagt tctcaagatc gacagcctgt cacggttaag    5820

cgagaaatga ataagaaggc tgataattcg gatctctgcg agggagatga tatttgatca    5880

caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt    5940

gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcggtaac atgagcaaag    6000

tctgccgcct tacaacggct ctcccgctga cgccgtcccg gactgatggg ctgcctgtat    6060

cgagtggtga ttttgtgccg agctgccggt cggggagctg ttggctggct ggtggcagga    6120

tatattgtgg tgtaaacaaa ttgacgctta gacaacttaa taacacattg cggacgtttt    6180

taatgtactg gggtggtttt tcttttcacc agtgagacgg gcaacagctg attgcccttc    6240

accgcctggc cctgagagag ttgcagcaag cggtccacgc tggtttgccc cagcaggcga    6300

aaatcctgtt tgatggtggt tccgaaatcg gcaaaatccc ttataaatca aaagaatagc    6360

ccgagatagg gttgagtgtt gttccagttt ggaacaagag tccactatta aagaacgtgg    6420

actccaacgt caaagggcga aaaaccgtct atcagggcga tggcccacta cctgtatggc    6480

cgcattcgca aaacacacct agactagatt tgttttgcta acccaattga tattaattat    6540

atatgattaa tatttatatg tatatggatt tggttaatga aatgcatctg gttcatcaaa    6600

gaattataaa gacacgtgac attcatttag gataagaaat atggatgatc tctttctctt    6660

ttattcagat aactagtaat tacacataac acacaacttt gatgcccaca ttatagtgat    6720

tagcatgtca ctatgtgtgc atccttttat ttcatacatt aattaagttg gccaatccag    6780

aagatggaca agtctaggtt aaccatgtgg tacctacgcg ttcgaatatc catgggccgc    6840

ttcaggccag ggcgctgggg aaggcgatgg cgtgctcggt cagctgccac ttctggttct    6900

tggcgtcgct ccggtcctcc cgcagcagct tgtgctggat gaagtgccac tcgggcatct    6960

tgctgggcac gctcttggcc ttgtacacgg tgtcgaactg gcaccggtac cggccgccgt    7020

ccttcagcag caggtacatg ctcacgtcgc ccttcaggat gccctgctta ggcacgggca    7080

tgatcttctc gcagctggcc tcccagttgg tggtcatctt cttcatcacg gggccgtcgg    7140

cggggaagtt cacgccgttg aagatgctct tgtggtagat gcagttctcc ttcacgctca    7200

cggtgatgtc cacgttacag atgcacacgg cgccgtcctc gaacaggaag ctccggcccc    7260

aggtgtagcc ggcggggcag ctgttcttga agtagtccac gatgtcctgg gggtactcgg    7320

tgaagatccg gtcgccgtac ttgaagccgg cgctcaggat gtcctcgctg aagggcaggg    7380

ggccgccctc gatcacgcac aggttgatgg tctgcttgcc cttgaagggg tagccgatgc    7440

cctcgccggt gatcacgaac ttgtggccgt tcacgcagcc ctccatgtgg tacttcatgg    7500

tcatctcctc cttcaggccg tgcttgctgt gggccatggt ggcgaccggt gaattcgagc    7560

tcggtacccg gggatcctga gtaaaacaga ggagggtctc actaagttta tagagagact    7620

gagagagata aagggacacg tatgaagcgt ctgttttcgt ggtgtgacgt caaagtcatt    7680

ttgctctcta cgcgtgtctg tgtcggcttg atcttttttt ttgctttttg gaactcatgt    7740

cggtagtata tcttttattt attttttctt tttttccctt ttctttcaaa ctgatgtcgg    7800

tatgatattt attccatcct aaaatgtaac ttactattat tagtagtcgg tccatgtcta    7860

ttggcccatc atgtggtcat tttacgttta cgtcgtgtgg ctgtttatta taacaaacgg    7920

cacatccttc tcattcgaat tgtatttctc cttaatcgtt ctaataggta tgatctttta    7980

ttttatacgt aaaattaaaa ttgaatgatg tcaagaacga aaattaattt gtatttacaa    8040

aggagctaaa tattgtttat tcctctactg gtagaagata aaagaagtag atgaaataat    8100

gatcttacta gagaatattc ctcatttaca ctagtcaaat ggaaatcttg taaactttta    8160

caataattta tcctgaaaat atgaaaaaat agaagaaaat gtttacctcc tctctcctct    8220

taattcacct acgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat    8280

gtgctgcaag gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa    8340

cgacggccag tgaattcgag ctcggtaccc ggggatcctc tagagtcgac ctgcaggcat    8400

gcaagcttgt tgaaacatcc ctgaagtgtc tcattttatt ttatttattc tttgctgata    8460

aaaaaataaa ataaaagaag ctaagcacac ggtcaaccat tgctctactg ctaaaagggt    8520

tatgtgtagt gttttactgc ataaattatg cagcaaacaa gacaactcaa attaaaaaat    8580

ttcctttgct tgtttttttg ttgtctctga cttgactttc ttgtggaagt tggttgtata    8640

aggattggga cacaccattg tccttcttaa tttaatttta tttctttgct gataaaaaaa    8700

aaaaatttca tatagtgtta aataataatt tgttaaataa ccaaaaagtc aaatatgttt    8760

actctcgttt aaataattga gagtcgtcca gcaaggctaa acgattgtat agatttatga    8820

caatatttac ttttttatag ataaatgtta tattataata aatttatata catatattat    8880

atgttattta ttatttatta ttattttaaa tccttcaata ttttatcaaa ccaactcata    8940

attttttttt tatctgtaag aagcaataaa attaaataga cccactttaa ggatgatcca    9000

acctttatac agagtaagag agttcaaata gtaccctttc atatacatat caactaaaat    9060

attagaaata tcatggatca aaccttataa agacattaaa taagtggata agtataatat    9120

ataaatgggt agtatataat atataaatgg atacaaactt ctctctttat aattgttatg    9180

tctccttaac atcctaatat aatacataag tgggtaatat ataatatata aatggagaca    9240

aacttcttcc attataattg ttatgtcttc ttaacactta tgtctcgttc acaatgctaa    9300

agttagaatt gtttagaaag tcttatagta cacatttgtt tttgtactat ttgaagcatt    9360

ccataagccg tcacgattca gatgatttat aataataaga ggaaatttat catagaacaa    9420

taaggtgcat agatagagtg ttaatatatc ataacatcct ttgtttattc atagaagaag    9480

tgagatggag ctcagttatt atactgttac atggtcggat acaatattcc atgctctcca    9540

tgagctctta cacctacatg cattttagtt catacttcat gcacgtggcc atcacagcta    9600

gctgcagcta catatttaca ttttacaaca ccaggagaac tgccctgtta gtgcataaca    9660

atcagaagat ggccgtggct actcgagtta tcgaaccact ttgtacaaga aagctgaacg    9720

agaaacgtaa aatgatataa atatcaatat attaaattag attttgcata aaaaacagac    9780

tacataatac tgtaaaacac aacatatcca gtcactatgg tcgacctgca gactggctgt    9840

gtataaggga gcctgacatt tatattcccc agaacatcag gttaatggcg tttttgatgt    9900

cattttcgcg gtggctgaga tcagccactt cttccccgat aacggagacc ggcacactgg    9960

ccatatcggt ggtcatcatg cgccagcttt catccccgat atgcaccacc gggtaaagtt    10020

cacgggagac tttatctgac agcagacgtg cactggccag ggggatcacc atccgtcgcc    10080

cgggcgtgtc aataatatca ctctgtacat ccacaaacag acgataacgg ctctctcttt    10140

tataggtgta aaccttaaac tgcatttcac cagtccctgt tctcgtcagc aaaagagccg    10200

ttcatttcaa taaaccgggc gacctcagcc atcccttcct gattttccgc tttccagcgt    10260

tcggcacgca gacgacgggc ttcattctgc atggttgtgc ttaccagacc ggagatattg    10320

acatcatata tgccttgagc aactgatagc tgtcgctgtc aactgtcact gtaatacgct    10380

gcttcatagc acacctcttt ttgacatact tcgggtatac atatcagtat atattcttat    10440

accgcaaaaa tcagcgcgca aatacgcata ctgttatctg gcttttagta agccggatcc    10500

tctagattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    10560

gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    10620

cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    10680

attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa  10740

catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc  10800

ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga  10860

aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac  10920

cagctcaccg tctttcattg ccatacggaa ttccggatga gcattcatca ggcgggcaag  10980

aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc  11040

cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc  11100

aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt  11160

ctccatttta gcttccttag ctcctgaaaa tctcgccgga tcctaactca aaatccacac  11220

attatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgcgg ccgccatagt  11280

gactggatat gttgtgtttt acagtattat gtagtctgtt ttttatgcaa aatctaattt  11340

aatatattga tatttatatc attttacgtt tctcgttcag cttttttgta caaacttgtt  11400

tgataaccgg tactagtgtg cacgtcgagc gtgtcctctc caaatgaaat gaacttcctt  11460

atatagagga agggtcttgc gaaggatagt gggattgtgc gtcatccctt acgtcagtgg  11520

agatgtcaca tcaatccact tgctttgaag acgtggttgg aacgtcttct ttttccacga  11580

tgctcctcgt gggtgggggt ccatctttgg gaccactgtc ggcagaggca tcttgaatga  11640

tagcctttcc tttatcgcaa tgatggcatt tgtaggagcc accttccttt tctactgtcc  11700

tttcgatgaa gtgacagata gctgggcaat ggaatccgag gaggtttccc gaaattatcc  11760

tttgttgaaa agtctcaata gccctttggt cttctgagac tgtatctttg acatttttgg  11820

agtagaccag agtgtcgtgc tccaccatgt tgacgaagat tttcttcttg tcattgagtc  11880

gtaaaagact ctgtatgaac tgttcgccag tcttcacggc gagttctgtt agatcctcga  11940

tttgaatctt agactccatg catggcctta gattcagtag gaactacctt tttagagact  12000

ccaatctcta ttacttgcct tggtttatga agcaagcctt gaatcgtcca tactggaata  12060

gtacttctga tcttgagaaa tatgtctttc tctgtgttct tgatgcaatt agtcctgaat  12120

cttttgactg catctttaac cttcttggga aggtatttga tctcctggag attgttactc  12180

gggtagatcg tcttgatgag acctgctgcg taggcctctc taaccatctg tgggtcagca  12240

ttctttctga aattgaagag gctaaccttc tcattatcag tggtgaacat agtgtcgtca  12300

ccttcacctt cgaacttcct tcctagatcg taaagataga ggaaatcgtc cattgtaatc  12360

tccggggcaa aggagatctc ttttggggct ggatcactgc tgggcctttt ggttcctagc  12420

gtgagccagt gggctttttg ctttggtggg cttgttaggg ccttagcaaa gctcttgggc  12480

ttgagttgag cttctccttt ggggatgaag ttcaacctgt ctgtttgctg acttgttgtg  12540

tacgcgtcag ctgctgctct tgcctctgta atagtggcaa atttcttgtg tgcaactccg  12600

ggaacgccgt ttgttgccgc ctttgtacaa ccccagtcat cgtatatacc ggcatgtgga  12660

ccgttataca caacgtagta gttgatatga gggtgttgaa tacccgattc tgctctgaga  12720

ggagcaactg tgctgttaag ctcagatttt tgtgggattg gaattggatc ctctagagca  12780

aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat  12840

tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag  12900

ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg  12960

ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggccaaa  13020

gacaaaaggg cgacattcaa ccgattgagg gagggaaggt aaatattgac ggaaattatt  13080

cattaaaggt gaattatcac cgtcaccgac ttgagccatt tgggaattag agccagcaaa  13140

atcaccagta gcaccattac cattagcaag gccggaaacg tcaccaatga aaccatcatc  13200

tagtaacata gatgacaccg cgcgcgataa tttatcctag tttgcgcgct atattttgtt  13260

ttctatcgcg tattaaatgt ataattgcgg gactctaatc ataaaaaccc atctcataaa  13320

taacgtcatg cattacatgt taattattac atgcttaacg taattcaaca gaaattatat  13380

gataatcatc gcaagaccgg caacaggatt caatcttaag aaactttatt gccaaatgtt  13440

tgaacgatct gcttcgacgc actccttctt taggtacgga ctagatctcg gtgacgggca  13500

ggaccggacg gggcggtacc ggcaggctga agtccagctg ccagaaaccc acgtcatgcc  13560

agttcccgtg cttgaagccg gccgcccgca gcatgccgcg gggggcatat ccgagcgcct  13620

cgtgcatgcg cacgctcggg tcgttgggca gcccgatgac agcgaccacg ctcttgaagc  13680

cctgtgcctc cagggacttc agcaggtggg tgtagagcgt ggagcccagt cccgtccgct  13740

ggtggcgggg ggagacgtac acggtcgact cggccgtcca gtcgtaggcg ttgcgtgcct  13800

tccaggggcc cgcgtaggcg atgccggcga cctcgccgtc cacctcggcg acgagccagg  13860

gatagcgctc ccgcagacgg acgaggtcgt ccgtccactc ctgcggttcc tgcggctcgg  13920

tacggaagtt gaccgtgctt gtctcgatgt agtggttgac gatggtgcag accgccggca  13980

tgtccgcctc ggtggcacgg cggatgtcgg ccgggcgtcg ttctgggctc atggatctgg  14040

attgagagtg aatatgagac tctaattgga taccgagggg aatttatgga acgtcagtgg  14100

agcatttttg acaagaaata tttgctagct gatagtgacc ttaggcgact tttgaacgcg  14160

caataatggt ttctgacgta tgtgcttagc tcattaaact ccagaaaccc gcggctgagt  14220

ggctccttca acgttgcggt tctgtcagtt ccaaacgtaa aacggcttgt cccgcgtcat  14280

cggcgggggt cataacgtga ctcccttaat tctccgctca tgatcagatt gtcgtttccc  14340

gccttcagtt taaactatca gtgtttgaca ggatatattg gcgggtaaac ctaagagaaa  14400

agagcgttta ttagaataat cggatattta aaagggcgtg aaaaggttta tccgttcgtc  14460

catttgtatg tgcatgccaa ccacagggtt ccccagatct ggcgccggcc agcgagacga  14520

gcaagattgg ccgccgcccg aaacgatccg acagcgcgcc cagcacaggt gcgcaggcaa  14580

attgcaccaa cgcatacagc gccagcagaa tgccatagtg ggcggtgacg tcgttcgagt  14640

gaaccagatc gcgcaggagg cccggcagca ccggcataat caggccgatg ccgacagcgt  14700

cgagcgcgac agtgctcaga attacgatca ggggtatgtt gggtttcacg tctggcctcc  14760

ggaccagcct ccgctggtcc gattgaacgc gcggattctt tatcactgat aagttggtgg  14820

acatattatg tttatcagtg ataaagtgtc aagcatgaca aagttgcagc cgaatacagt  14880

gatccgtgcc gccctggacc tgttgaacga ggtcggcgta gacggtctga cgacacgcaa  14940

actggcggaa cggttggggg ttcagcagcc ggcgctttac tggcacttca ggaacaagcg  15000

ggcgctgctc gacgcactgg ccgaagccat gctggcggag aatcatacgc attcggtgcc  15060

gagagccgac gacgactggc gctcatttct gatcgggaat gcccgcagct tcaggcaggc  15120

gctgctcgcc taccgcgatg gcgcgcgcat ccatgccggc acgcgaccgg gcgcaccgca  15180

gatggaaacg gccgacgcgc agcttcgctt cctctgcgag gcgggttttt cggccgggga  15240

cgccgtcaat gcgctgatga caatcagcta cttcactgtt ggggccgtgc ttgaggagca  15300

ggccggcgac agcgatgccg gcgagcgcgg cggcaccgtt gaacaggctc cgctctcgcc  15360

gctgttgcgg gccgcgatag acgccttcga cgaagccggt ccggacgcag cgttcgagca  15420

gggactcgcg gtgattgtcg atggattggc gaaaaggagg ctcgttgtca ggaacgttga  15480

aggaccgaga aagggtgacg attgatcagg accgctgccg gagcgcaacc cactcactac  15540

agcagagcca tgtagacaac atcccctccc cctttccacc gcgtcagacg cccgtagcag  15600

cccgctacgg gctttttcat gccctgccct agcgtccaag cctcacggcc gcgctcggcc  15660

tctctggcgg ccttctggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc  15720

gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa  15780

tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt  15840

aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa  15900

aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 15960

ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 16020

tccgcctttc tcccttcggg aagcgtggcg cttttccgct gcataaccct gcttcggggt 16080

cattatagcg attttttcgg tatatccatc ctttttcgca cgatatacag gattttgcca 16140

aagggttcgt gtagactttc cttggtgtat ccaacggcgt cagccgggca ggataggtga 16200

agtaggccca cccgcgagcg ggtgttcctt cttcactgtc ccttattcgc acctggcggt 16260

gctcaacggg aatcctgctc tgcgaggctg gccggctacc gccggcgtaa cagatgaggg 16320

caagcggatg gctgatgaaa ccaagccaac caggaagggc agcccaccta tcaaggtgta 16380

ctgccttcca gacgaacgaa gagcgattga ggaaaaggcg gcggcggccg gcatgagcct 16440

gtcggcctac ctgctggccg tcggccaggg ctacaaaatc acgggcgtcg tggactatga 16500

gcacgtccgc gagctggccc gcatcaatgg cgacctgggc cgcctgggcg gcctgctgaa 16560

actctggctc accgacgacc cgcgcacggc gcggttcggt gatgccacga tcctcgccct 16620

gctggcgaag atcgaagaga agcaggacga gcttggcaag gtcatgatgg gcgtggtccg 16680

cccgagggca gagccatgac ttttttagcc gctaaaacgg ccggggggtg cgcgtgattg 16740

ccaagcacgt ccccatgcgc tccatcaaga agagcgactt cgcggagctg gtgaagtaca 16800

tcaccgacga gcaaggcaag accgagcgcc tttgcgacgc tca                   16843

 

<210>5

<211>9142

<212>DNA

<213>人工序列

 

<220>

<223>载体

 

<400>5

ctagttatct gaataaaaga gaaagagatc atccatattt cttatcctaa atgaatgtca  60

cgtgtcttta taattctttg atgaaccaga tgcatttcat taaccaaatc catatacata  120

taaatattaa tcatatataa ttaatatcaa ttgggttagc aaaacaaatc tagtctaggt  180

gtgttttgcg aattcgatat caagcttgat gggtaccggc gcgcccgatc atccggatat  240

agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa ggggttatgc  300

tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt tgttagcagc  360

cggatcgatc caagctgtac ctcactattc ctttgccctc ggacgagtgc tggggcgtcg  420

gtttccacta tcggcgagta cttctacaca gccatcggtc cagacggccg cgcttctgcg  480

ggcgatttgt gtacgcccga cagtcccggc tccggatcgg acgattgcgt cgcatcgacc    540

ctgcgcccaa gctgcatcat cgaaattgcc gtcaaccaag ctctgataga gttggtcaag    600

accaatgcgg agcatatacg cccggagccg cggcgatcct gcaagctccg gatgcctccg    660

ctcgaagtag cgcgtctgct gctccataca agccaaccac ggcctccaga agaagatgtt    720

ggcgacctcg tattgggaat ccccgaacat cgcctcgctc cagtcaatga ccgctgttat    780

gcggccattg tccgtcagga cattgttgga gccgaaatcc gcgtgcacga ggtgccggac    840

ttcggggcag tcctcggccc aaagcatcag ctcatcgaga gcctgcgcga cggacgcact    900

gacggtgtcg tccatcacag tttgccagtg atacacatgg ggatcagcaa tcgcgcatat    960

gaaatcacgc catgtagtgt attgaccgat tccttgcggt ccgaatgggc cgaacccgct    1020

cgtctggcta agatcggccg cagcgatcgc atccatagcc tccgcgaccg gctgcagaac    1080

agcgggcagt tcggtttcag gcaggtcttg caacgtgaca ccctgtgcac ggcgggagat    1140

gcaataggtc aggctctcgc tgaattcccc aatgtcaagc acttccggaa tcgggagcgc    1200

ggccgatgca aagtgccgat aaacataacg atctttgtag aaaccatcgg cgcagctatt    1260

tacccgcagg acatatccac gccctcctac atcgaagctg aaagcacgag attcttcgcc    1320

ctccgagagc tgcatcaggt cggagacgct gtcgaacttt tcgatcagaa acttctcgac    1380

agacgtcgcg gtgagttcag gcttttccat gggtatatct ccttcttaaa gttaaacaaa    1440

attatttcta gagggaaacc gttgtggtct ccctatagtg agtcgtatta atttcgcggg    1500

atcgagatct gatcaacctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc    1560

gtattgggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc    1620

ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata    1680

acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg    1740

cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct    1800

caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa    1860

gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc    1920

tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt    1980

aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg    2040

ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg    2100

cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct    2160

tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc    2220

tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg    2280

ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc    2340

aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt    2400

aagggatttt ggtcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc    2460

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca    2520

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg    2580

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc    2640

accatatgga catattgtcg ttagaacgcg gctacaatta atacataacc ttatgtatca    2700

tacacatacg atttaggtga cactatagaa cggcgcgcca agctgggtct agaactagaa    2760

acgtgatgcc acttgttatt gaagtcgatt acagcatcta ttctgtttta ctatttataa    2820

ctttgccatt tctgactttt gaaaactatc tctggatttc ggtatcgctt tgtgaagatc    2880

gagcaaaaga gacgttttgt ggacgcaatg gtccaaatcc gttctacatg aacaaattgg    2940

tcacaatttc cactaaaagt aaataaatgg caagttaaaa aaggaatatg cattttactg    3000

attgcctagg tgagctccaa gagaagttga atctacacgt ctaccaaccg ctaaaaaaag    3060

aaaaacattg aatatgtaac ctgattccat tagcttttga cttcttcaac agattctcta    3120

cttagatttc taacagaaat attattacta gcacatcatt ttcagtctca ctacagcaaa    3180

aaatccaacg gcacaataca gacaacagga gatatcagac tacagagata gatagatgct    3240

actgcatgta gtaagttaaa taaaaggaaa ataaaatgtc ttgctaccaa aactactaca    3300

gactatgatg ctcaccacag gccaaatcct gcaactagga cagcattatc ttatatatat    3360

tgtacaaaac aagcatcaag gaacatttgg tctaggcaat cagtacctcg ttctaccatc    3420

accctcagtt atcacatcct tgaaggatcc attactggga atcatcggca acacatgctc    3480

ctgatggggc acaatgacat caagaaggta ggggccaggg gtgtccaaca ttctctgaat    3540

tgccgctcta agctcttcct tcttcgtcac tcgcgctgcc ggtatcccac aagcatcagc    3600

aaacttgagc atgtttggga atatctcgct ctcgctagac ggatctccaa gataggtgtg    3660

agctctattg gacttgtaga acctatcctc caactgaacc accataccca aatgctgatt    3720

gttcaacaac aatatcttaa ctgggagatt ctccactctt atagtggcca actcctgaac    3780

attcatgatg aaactaccat ccccatcaat gtcaaccaca acagccccag ggttagcaac    3840

agcagcacca atagccgcag gcaatccaaa acccatggct ccaagacccc ctgaggtcaa    3900

ccactgcctc ggtctcttgt acttgtaaaa ctgcgcagcc cacatttgat gctgcccaac    3960

cccagtacta acaatagcat ctccattagt caactcatca agaacctcga tagcatgctg    4020

cggagaaatc gcgtcctgga atgtcttgta acccaatgga aacttgtgtt tctgcacatt    4080

aatctcttct ctccaacctc caagatcaaa cttaccctcc actcctttct cctccaaaat    4140

catattaatt cccttcaagg ccaacttcaa atccgcgcaa accgacacgt gcgcctgctt    4200

gttcttccca atctcggcag aatcaatatc aatgtgaaca atcttagccc tactagcaaa    4260

agcctcaagc ttcccagtaa cacggtcatc aaaccttacc ccaaaggcaa gcaacaaatc    4320

actattgtca acagcatagt tagcataaac agtaccatgc atacccagca tctgaaggga    4380

atattcatca ccaataggaa aagttccaag acccattaaa gtgctagcaa cgggaatacc    4440

agtgagttca acaaagcgcc tcaattcagc actggaattc aaactgccac cgccgacgta    4500

gagaacgggc ttttgggcct ccatgatgag tctgacaatg tgttccaatt gggcctcggc    4560

ggggggcctg ggcagcctgg cgaggtaacc ggggaggtta acgggctcgt cccaattagg    4620

cacggcgagt tgctgctgaa cgtctttggg aatgtcgatg aggaccggac cggggcggcc    4680

ggaggtggcg acgaagaaag cctcggcgac gacgcggggg atgtcgtcga cgtcgaggat    4740

gaggtagttg tgcttcgtga tggatctgct cacctccacg atcggggttt cttggaaggc    4800

gtcggtgccg atcatccggc gggcgacctg gccggtgatg gcgacgactg ggacgctgtc    4860

cattaaagcg tcggcgaggc cgctcacgag gttggtggcg ccggggccgg aggtggcaat    4920

gcagacgccg gggaggccgg aggaacgcgc gtagccttcg gcggcgaaga cgccgccctg    4980

ctcgtggcgc gggagcacgt tgcggatggc ggcggagcgc gtgagcgcct ggtggatctc    5040

catcgacgca ccgccggggt acgcgaacac cgtcgtcacg ccctgcctct ccagcgcctc    5100

cacaaggatg tccgcgccct tgcgaggttc gccggaggcg aaccgtgaca cgaagggctc    5160

cgtggtcggc gcttccttgg tgaagggcgc cgccgtgggg ggtttggaga tggaacattt    5220

gattttgaga gcgtggttgg gtttggtgag ggtttgatga gagagaggga gggtggatct    5280

agtaatgcgt ttggggaagg tggggtgtga agaggaagaa gagaatcggg tggttctgga    5340

agcggtggcc gccattgtgt tgtgtggcat ggttatactt caaaaactgc acaacaagcc    5400

tagagttagt acctaaacag taaatttaca acagagagca aagacacatg caaaaatttc    5460

agccataaaa aaagttataa tagaatttaa agcaaaagtt tcatttttta aacatatata    5520

caaacaaact ggatttgaag gaagggatta attcccctgc tcaaagtttg aattcctatt    5580

gtgacctata ctcgaataaa attgaagcct aaggaatgta tgagaaacaa gaaaacaaaa    5640

caaaactaca gacaaacaag tacaattaca aaattcgcta aaattctgta atcaccaaac    5700

cccatctcag tcagcacaag gcccaaggtt tattttgaaa taaaaaaaaa gtgattttat    5760

ttctcataag ctaaaagaaa gaaaggcaat tatgaaatga tttcgactag atctgaaagt    5820

caaacgcgta ttccgcagat attaaagaaa gagtagagtt tcacatggat cctagatgga    5880

cccagttgag gaaaaagcaa ggcaaagcaa accagaagtg caagatccga aattgaacca    5940

cggaatctag gatttggtag agggagaaga aaagtacctt gagaggtaga agagaagaga    6000

agagcagaga gatatatgaa cgagtgtgtc ttggtctcaa ctctgaagcg atacgagttt    6060

agaggggagc attgagttcc aatttatagg gaaaccgggt ggcaggggtg agttaatgac    6120

ggaaaagccc ctaagtaacg agattggatt gtgggttaga ttcaaccgtt tgcatccgcg    6180

gcttagattg gggaagtcag agtgaatctc aaccgttgac tgagttgaaa attgaatgta    6240

gcaaccaatt gagccaaccc cagcctttgc cctttgattt tgatttgttt gttgcatact    6300

ttttatttgt cttctggttc tgactctctt tctctcgttt caatgccagg ttgcctactc    6360

ccacaccact cacaagaaga ttctactgtt agtattaaat attttttaat gtattaaatg    6420

atgaatgctt ttgtaaacag aacaagacta tgtctaataa gtgtcttgca acatttttta    6480

agaaattaaa aaaaatatat ttattatcaa aatcaaatgt atgaaaaatc atgaataata    6540

taattttata cattttttta aaaaatcttt taatttctta attaatatct taaaaataat    6600

gattaatatt taacccaaaa taattagtat gattggtaag gaagatatcc atgttatgtt    6660

tggatgtgag tttgatctag agcaaagctt actagagtcg acctgcagcc cctccaccgc    6720

ggtggcggcc gctctagaga tccgtcaaca tggtggagca cgacactctc gtctactcca    6780

agaatatcaa agatacagtc tcagaagacc aaagggctat tgagactttt caacaaaggg    6840

taatatcggg aaacctcctc ggattccatt gcccagctat ctgtcacttc atcaaaagga    6900

cagtagaaaa ggaaggtggc acctacaaat gccatcattg cgataaagga aaggctatcg    6960

ttcaagatgc ctctgccgac agtggtccca aagatggacc cccacccacg aggagcatcg    7020

tggaaaaaga agacgttcca accacgtctt caaagcaagt ggattgatgt gatgatccta    7080

tgcgtatggt atgacgtgtg ttcaagatga tgacttcaaa cctacctatg acgtatggta    7140

tgacgtgtgt cgactgatga cttagatcca ctcgagcggc tataaatacg tacctacgca    7200

ccctgcgcta ccatccctag agctgcagct tatttttaca acaattacca acaacaacaa    7260

acaacaaaca acattacaat tactatttac aattacagtc gacccatcaa caagtttgta    7320

caaaaaagct gaacgagaaa cgtaaaatga tataaatatc aatatattaa attagatttt    7380

gcataaaaaa cagactacat aatactgtaa aacacaacat atccagtcat attggcggcc    7440

gcattaggca ccccaggctt tacactttat gcttccggct cgtataatgt gtggattttg    7500

agttaggatc cgtcgagatt ttcaggagct aaggaagcta aaatggagaa aaaaatcact    7560

ggatatacca ccgttgatat atcccaatgg catcgtaaag aacattttga ggcatttcag    7620

tcagttgctc aatgtaccta taaccagacc gttcagctgg atattacggc ctttttaaag    7680

accgtaaaga aaaataagca caagttttat ccggccttta ttcacattct tgcccgcctg    7740

atgaatgctc atccggaatt ccgtatggca atgaaagacg gtgagctggt gatatgggat    7800

agtgttcacc cttgttacac cgttttccat gagcaaactg aaacgttttc atcgctctgg    7860

agtgaatacc acgacgattt ccggcagttt ctacacatat attcgcaaga tgtggcgtgt    7920

tacggtgaaa acctggccta tttccctaaa gggtttattg agaatatgtt tttcgtctca    7980

gccaatccct gggtgagttt caccagtttt gatttaaacg tggccaatat ggacaacttc    8040

ttcgcccccg ttttcaccat gggcaaatat tatacgcaag gcgacaaggt gctgatgccg    8100

ctggcgattc aggttcatca tgccgtttgt gatggcttcc atgtcggcag aatgcttaat    8160

gaattacaac agtactgcga tgagtggcag ggcggggcgt aaagatctgg atccggctta    8220

ctaaaagcca gataacagta tgcgtatttg cgcgctgatt tttgcggtat aagaatatat    8280

actgatatgt atacccgaag tatgtcaaaa agaggtatgc tatgaagcag cgtattacag    8340

tgacagttga cagcgacagc tatcagttgc tcaaggcata tatgatgtca atatctccgg    8400

tctggtaagc acaaccatgc agaatgaagc ccgtcgtctg cgtgccgaac gctggaaagc    8460

ggaaaatcag gaagggatgg ctgaggtcgc ccggtttatt gaaatgaacg gctcttttgc    8520

tgacgagaac aggggctggt gaaatgcagt ttaaggttta cacctataaa agagagagcc    8580

gttatcgtct gtttgtggat gtacagagtg atattattga cacgcccggg cgacggatgg    8640

tgatccccct ggccagtgca cgtctgctgt cagataaagt ctcccgtgaa ctttacccgg    8700

tggtgcatat cggggatgaa agctggcgca tgatgaccac cgatatggcc agtgtgccgg    8760

tctccgttat cggggaagaa gtggctgatc tcagccaccg cgaaaatgac atcaaaaacg    8820

ccattaacct gatgttctgg ggaatataaa tgtcaggctc ccttatacac agccagtctg    8880

caggtcgacc atagtgactg gatatgttgt gttttacagt attatgtagt ctgtttttta    8940

tgcaaaatct aatttaatat attgatattt atatcatttt acgtttctcg ttcagctttc    9000

ttgtacaaag tggttgataa cctagacttg tccatcttct ggattggcca acttaattaa    9060

tgtatgaaat aaaaggatgc acacatagtg acatgctaat cactataatg tgggcatcaa    9120

agttgtgtgt tatgtgtaat ta                                             9142

<210>6

<211>49911

<212>DNA

<213>人工序列

 

<220>

<223>载体

 

<400>6

gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta  60

taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt  120

atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca  180

gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt  240

ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg  300

caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta  360

gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct  420

ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa  480

tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta  540

aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt  600

ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca  660

cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg  720

ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag  780

gcggcctcct cctcctctca cggcacggca gctacggggg attcctttcc caccgctcct  840

tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc ctctttcccc  900

aacctcgtgt tgttcggagc gcacacacac acaaccagat ctcccccaaa tccacccgtc  960

ggcacctccg cttcaaggta cgccgctcgt cctccccccc cccccctctc taccttctct  1020

agatcggcgt tccggtccat ggttagggcc cggtagttct acttctgttc atgtttgtgt  1080

tagatccgtg tttgtgttag atccgtgctg ctagcgttcg tacacggatg cgacctgtac  1140

gtcagacacg ttctgattgc taacttgcca gtgtttctct ttggggaatc ctgggatggc  1200

tctagccgtt ccgcagacgg gatcgatttc atgatttttt ttgtttcgtt gcatagggtt  1260

tggtttgccc ttttccttta tttcaatata tgccgtgcac ttgtttgtcg ggtcatcttt  1320

tcatgctttt ttttgtcttg gttgtgatga tgtggtctgg ttgggcggtc gttctagatc  1380

ggagtagaat tctgtttcaa actacctggt ggatttatta attttggatc tgtatgtgtg  1440

tgccatacat attcatagtt acgaattgaa gatgatggat ggaaatatcg atctaggata    1500

ggtatacatg ttgatgcggg ttttactgat gcatatacag agatgctttt tgttcgcttg    1560

gttgtgatga tgtggtgtgg ttgggcggtc gttcattcgt tctagatcgg agtagaatac    1620

tgtttcaaac tacctggtgt atttattaat tttggaactg tatgtgtgtg tcatacatct    1680

tcatagttac gagtttaaga tggatggaaa tatcgatcta ggataggtat acatgttgat    1740

gtgggtttta ctgatgcata tacatgatgg catatgcagc atctattcat atgctctaac    1800

cttgagtacc tatctattat aataaacaag tatgttttat aattattttg atcttgatat    1860

acttggatga tggcatatgc agcagctata tgtggatttt tttagccctg ccttcatacg    1920

ctatttattt gcttggtact gtttcttttg tcgatgctca ccctgttgtt tggtgttact    1980

tctgcaggtc gactctagag gatccacaag tttgtacaaa aaagctgaac gagaaacgta    2040

aaatgatata aatatcaata tattaaatta gattttgcat aaaaaacaga ctacataata    2100

ctgtaaaaca caacatatcc agtcactatg gcggccgcat taggcacccc aggctttaca    2160

ctttatgctt ccggctcgta taatgtgtgg attttgagtt aggatttaaa tacgcgttga    2220

tccggcttac taaaagccag ataacagtat gcgtatttgc gcgctgattt ttgcggtata    2280

agaatatata ctgatatgta tacccgaagt atgtcaaaaa gaggtatgct atgaagcagc    2340

gtattacagt gacagttgac agcgacagct atcagttgct caaggcatat atgatgtcaa    2400

tatctccggt ctggtaagca caaccatgca gaatgaagcc cgtcgtctgc gtgccgaacg    2460

ctggaaagcg gaaaatcagg aagggatggc tgaggtcgcc cggtttattg aaatgaacgg    2520

ctcttttgct gacgagaaca ggggctggtg aaatgcagtt taaggtttac acctataaaa    2580

gagagagccg ttatcgtctg tttgtggatg tacagagtga tatcattgac acgcccggtc    2640

gacggatggt gatccccctg gccagtgcac gtctgctgtc agataaagtc tcccgtgaac    2700

tttacccggt ggtgcatatc ggggatgaaa gctggcgcat gatgaccacc gatatggcca    2760

gtgtgccggt ctccgttatc ggggaagaag tggctgatct cagccaccgc gaaaatgaca    2820

tcaaaaacgc cattaacctg atgttctggg gaatataaat gtcaggctcc cttatacaca    2880

gccagtctgc aggtcgacca tagtgactgg atatgttgtg ttttacagta ttatgtagtc    2940

tgttttttat gcaaaatcta atttaatata ttgatattta tatcatttta cgtttctcgt    3000

tcagctttct tgtacaaagt ggtgttaacc tagacttgtc catcttctgg attggccaac    3060

ttaattaatg tatgaaataa aaggatgcac acatagtgac atgctaatca ctataatgtg    3120

ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct gaataaaaga gaaagagatc    3180

atccatattt cttatcctaa atgaatgtca cgtgtcttta taattctttg atgaaccaga    3240

tgcatttcat taaccaaatc catatacata taaatattaa tcatatataa ttaatatcaa    3300

ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg aattgcggcc gccaccgcgg    3360

tggagctcga attccggtcc gggtcacctt tgtccaccaa gatggaactg cggccgctca    3420

ttaattaagt caggcgcgcc tctagttgaa gacacgttca tgtcttcatc gtaagaagac    3480

actcagtagt cttcggccag aatggccatc tggattcagc aggcctagaa ggccatttaa    3540

atcctgagga tctggtcttc ctaaggaccc gggatatcgg accgattaaa ctttaattcg    3600

gtccgaagct tgcatgcctg cagtgcagcg tgacccggtc gtgcccctct ctagagataa    3660

tgagcattgc atgtctaagt tataaaaaat taccacatat tttttttgtc acacttgttt    3720

gaagtgcagt ttatctatct ttatacatat atttaaactt tactctacga ataatataat    3780

ctatagtact acaataatat cagtgtttta gagaatcata taaatgaaca gttagacatg    3840

gtctaaagga caattgagta ttttgacaac aggactctac agttttatct ttttagtgtg    3900

catgtgttct cctttttttt tgcaaatagc ttcacctata taatacttca tccattttat    3960

tagtacatcc atttagggtt tagggttaat ggtttttata gactaatttt tttagtacat    4020

ctattttatt ctattttagc ctctaaatta agaaaactaa aactctattt tagttttttt    4080

atttaataat ttagatataa aatagaataa aataaagtga ctaaaaatta aacaaatacc    4140

ctttaagaaa ttaaaaaaac taaggaaaca tttttcttgt ttcgagtaga taatgccagc    4200

ctgttaaacg ccgtcgacga gtctaacgga caccaaccag cgaaccagca gcgtcgcgtc    4260

gggccaagcg aagcagacgg cacggcatct ctgtcgctgc ctctggaccc ctctcgagag    4320

ttccgctcca ccgttggact tgctccgctg tcggcatcca gaaattgcgt ggcggagcgg    4380

cagacgtgag ccggcacggc aggcggcctc ctcctcctct cacggcaccg gcagctacgg    4440

gggattcctt tcccaccgct ccttcgcttt cccttcctcg cccgccgtaa taaatagaca    4500

ccccctccac accctctttc cccaacctcg tgttgttcgg agcgcacaca cacacaacca    4560

gatctccccc aaatccaccc gtcggcacct ccgcttcaag gtacgccgct cgtcctcccc    4620

cccccccctc tctaccttct ctagatcggc gttccggtcc atgcatggtt agggcccggt    4680

agttctactt ctgttcatgt ttgtgttaga tccgtgtttg tgttagatcc gtgctgctag    4740

cgttcgtaca cggatgcgac ctgtacgtca gacacgttct gattgctaac ttgccagtgt    4800

ttctctttgg ggaatcctgg gatggctcta gccgttccgc agacgggatc gatttcatga    4860

ttttttttgt ttcgttgcat agggtttggt ttgccctttt cctttatttc aatatatgcc    4920

gtgcacttgt ttgtcgggtc atcttttcat gctttttttt gtcttggttg tgatgatgtg    4980

gtctggttgg gcggtcgttc tagatcggag tagaattctg tttcaaacta cctggtggat    5040

ttattaattt tggatctgta tgtgtgtgcc atacatattc atagttacga attgaagatg    5100

atggatggaa atatcgatct aggataggta tacatgttga tgcgggtttt actgatgcat    5160

atacagagat gctttttgtt cgcttggttg tgatgatgtg gtgtggttgg gcggtcgttc    5220

attcgttcta gatcggagta gaatactgtt tcaaactacc tggtgtattt attaattttg    5280

gaactgtatg tgtgtgtcat acatcttcat agttacgagt ttaagatgga tggaaatatc    5340

gatctaggat aggtatacat gttgatgtgg gttttactga tgcatataca tgatggcata    5400

tgcagcatct attcatatgc tctaaccttg agtacctatc tattataata aacaagtatg    5460

ttttataatt attttgatct tgatatactt ggatgatggc atatgcagca gctatatgtg    5520

gattttttta gccctgcctt catacgctat ttatttgctt ggtactgttt cttttgtcga    5580

tgctcaccct gttgtttggt gttacttctg caggtcgact ttaacttagc ctaggatcca    5640

cacgacacca tgtcccccga gcgccgcccc gtcgagatcc gcccggccac cgccgccgac    5700

atggccgccg tgtgcgacat cgtgaaccac tacatcgaga cctccaccgt gaacttccgc    5760

accgagccgc agaccccgca ggagtggatc gacgacctgg agcgcctcca ggaccgctac    5820

ccgtggctcg tggccgaggt ggagggcgtg gtggccggca tcgcctacgc cggcccgtgg    5880

aaggcccgca acgcctacga ctggaccgtg gagtccaccg tgtacgtgtc ccaccgccac    5940

cagcgcctcg gcctcggctc caccctctac acccacctcc tcaagagcat ggaggcccag    6000

ggcttcaagt ccgtggtggc cgtgatcggc ctcccgaacg acccgtccgt gcgcctccac    6060

gaggccctcg gctacaccgc ccgcggcacc ctccgcgccg ccggctacaa gcacggcggc    6120

tggcacgacg tcggcttctg gcagcgcgac ttcgagctgc cggccccgcc gcgcccggtg    6180

cgcccggtga cgcagatctg agtcgaaacc tagacttgtc catcttctgg attggccaac    6240

ttaattaatg tatgaaataa aaggatgcac acatagtgac atgctaatca ctataatgtg    6300

ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct gaataaaaga gaaagagatc    6360

atccatattt cttatcctaa atgaatgtca cgtgtcttta taattctttg atgaaccaga    6420

tgcatttcat taaccaaatc catatacata taaatattaa tcatatataa ttaatatcaa    6480

ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg aattgcggcc gccaccgcgg    6540

tggagctcga attcattccg attaatcgtg gcctcttgct cttcaggatg aagagctatg    6600

tttaaacgtg caagcgctac tagacaattc agtacattaa aaacgtccgc aatgtgttat    6660

taagttgtct aagcgtcaat ttggtttaca ccacaatata tcctgccacc agccagccaa    6720

cagctccccg accggcagct cggcacaaaa tcaccactcg atacaggcag cccatcagtc    6780

cgggacggcg tcagcgggag agccgttgta aggcggcaga ctttgctcat gttaccgatg    6840

ctattcggaa gaacggcaac taagctgccg ggtttgaaac acggatgatc tcgcggaggg    6900

tagcatgttg attgtaacga tgacagagcg ttgctgcctg tgatcaaata tcatctccct    6960

cgcagagatc cgaattatca gccttcttat tcatttctcg cttaaccgtg acaggctgtc    7020

gatcttgaga actatgccga cataatagga aatcgctgga taaagccgct gaggaagctg    7080

agtggcgcta tttctttaga agtgaacgtt gacgatcgtc gaccgtaccc cgatgaatta    7140

attcggacgt acgttctgaa cacagctgga tacttacttg ggcgattgtc atacatgaca    7200

tcaacaatgt acccgtttgt gtaaccgtct cttggaggtt cgtatgacac tagtggttcc    7260

cctcagcttg cgactagatg ttgaggccta acattttatt agagagcagg ctagttgctt    7320

agatacatga tcttcaggcc gttatctgtc agggcaagcg aaaattggcc atttatgacg    7380

accaatgccc cgcagaagct cccatctttg ccgccataga cgccgcgccc cccttttggg    7440

gtgtagaaca tccttttgcc agatgtggaa aagaagttcg ttgtcccatt gttggcaatg    7500

acgtagtagc cggcgaaagt gcgagaccca tttgcgctat atataagcct acgatttccg    7560

ttgcgactat tgtcgtaatt ggatgaacta ttatcgtagt tgctctcaga gttgtcgtaa    7620

tttgatggac tattgtcgta attgcttatg gagttgtcgt agttgcttgg agaaatgtcg    7680

tagttggatg gggagtagtc atagggaaga cgagcttcat ccactaaaac aattggcagg    7740

tcagcaagtg cctgccccga tgccatcgca agtacgaggc ttagaaccac cttcaacaga    7800

tcgcgcatag tcttccccag ctctctaacg cttgagttaa gccgcgccgc gaagcggcgt    7860

cggcttgaac gaattgttag acattatttg ccgactacct tggtgatctc gcctttcacg    7920

tagtgaacaa attcttccaa ctgatctgcg cgcgaggcca agcgatcttc ttgtccaaga    7980

taagcctgcc tagcttcaag tatgacgggc tgatactggg ccggcaggcg ctccattgcc    8040

cagtcggcag cgacatcctt cggcgcgatt ttgccggtta ctgcgctgta ccaaatgcgg    8100

gacaacgtaa gcactacatt tcgctcatcg ccagcccagt cgggcggcga gttccatagc    8160

gttaaggttt catttagcgc ctcaaataga tcctgttcag gaaccggatc aaagagttcc    8220

tccgccgctg gacctaccaa ggcaacgcta tgttctcttg cttttgtcag caagatagcc    8280

agatcaatgt cgatcgtggc tggctcgaag atacctgcaa gaatgtcatt gcgctgccat    8340

tctccaaatt gcagttcgcg cttagctgga taacgccacg gaatgatgtc gtcgtgcaca    8400

acaatggtga cttctacagc gcggagaatc tcgctctctc caggggaagc cgaagtttcc    8460

aaaaggtcgt tgatcaaagc tcgccgcgtt gtttcatcaa gccttacagt caccgtaacc    8520

agcaaatcaa tatcactgtg tggcttcagg ccgccatcca ctgcggagcc gtacaaatgt    8580

acggccagca acgtcggttc gagatggcgc tcgatgacgc caactacctc tgatagttga    8640

gtcgatactt cggcgatcac cgcttccctc atgatgttta actcctgaat taagccgcgc    8700

cgcgaagcgg tgtcggcttg aatgaattgt taggcgtcat cctgtgctcc cgagaaccag    8760

taccagtaca tcgctgtttc gttcgagact tgaggtctag ttttatacgt gaacaggtca    8820

atgccgccga gagtaaagcc acattttgcg tacaaattgc aggcaggtac attgttcgtt    8880

tgtgtctcta atcgtatgcc aaggagctgt ctgcttagtg cccacttttt cgcaaattcg    8940

atgagactgt gcgcgactcc tttgcctcgg tgcgtgtgcg acacaacaat gtgttcgata    9000

gaggctagat cgttccatgt tgagttgagt tcaatcttcc cgacaagctc ttggtcgatg    9060

aatgcgccat agcaagcaga gtcttcatca gagtcatcat ccgagatgta atccttccgg    9120

taggggctca cacttctggt agatagttca aagccttggt cggataggtg cacatcgaac    9180

acttcacgaa caatgaaatg gttctcagca tccaatgttt ccgccacctg ctcagggatc    9240

accgaaatct tcatatgacg cctaacgcct ggcacagcgg atcgcaaacc tggcgcggct    9300

tttggcacaa aaggcgtgac aggtttgcga atccgttgct gccacttgtt aacccttttg    9360

ccagatttgg taactataat ttatgttaga ggcgaagtct tgggtaaaaa ctggcctaaa    9420

attgctgggg atttcaggaa agtaaacatc accttccggc tcgatgtcta ttgtagatat    9480

atgtagtgta tctacttgat cgggggatct gctgcctcgc gcgtttcggt gatgacggtg    9540

aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg    9600

ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggcgcagcca    9660

tgacccagtc acgtagcgat agcggagtgt atactggctt aactatgcgg catcagagca    9720

gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa    9780

ataccgcatc aggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg    9840

gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg    9900

ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa    9960

ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg    10020

acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc    10080

tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc    10140

ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc  10200

ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg  10260

ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc  10320

actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga  10380

gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc  10440

tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac  10500

caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg  10560

atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc  10620

acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa  10680

ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta  10740

ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt  10800

tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag  10860

tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca  10920

gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc  10980

tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt  11040

tgttgccatt gctgcagggg gggggggggg gggggacttc cattgttcat tccacggaca  11100

aaaacagaga aaggaaacga cagaggccaa aaagcctcgc tttcagcacc tgtcgtttcc  11160

tttcttttca gagggtattt taaataaaaa cattaagtta tgacgaagaa gaacggaaac  11220

gccttaaacc ggaaaatttt cataaatagc gaaaacccgc gaggtcgccg ccccgtaacc  11280

tacctgtcgg atcaccggaa aggacccgta aagtgataat gattatcatc tacatatcac  11340

aacgtgcgtg gaggccatca aaccacgtca aataatcaat tatgacgcag gtatcgtatt  11400

aattgatctg catcaactta acgtaaaaac aacttcagac aatacaaatc agcgacactg  11460

aatacggggc aacctcatgt cccccccccc cccccccctg caggcatcgt ggtgtcacgc  11520

tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga  11580

tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt  11640

aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc  11700

atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa  11760

tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa cacgggataa taccgcgcca  11820

catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca  11880

aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct  11940

tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc  12000

gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa  12060

tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt  12120

tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc acctgacgtc  12180

taagaaacca ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt  12240

cgtcttcaag aattcggagc ttttgccatt ctcaccggat tcagtcgtca ctcatggtga  12300

tttctcactt gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg  12360

acgagtcgga atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga  12420

gttttctcct tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat  12480

gaataaattg cagtttcatt tgatgctcga tgagtttttc taatcagaat tggttaattg  12540

gttgtaacac tggcagagca ttacgctgac ttgacgggac ggcggctttg ttgaataaat  12600

cgaacttttg ctgagttgaa ggatcagatc acgcatcttc ccgacaacgc agaccgttcc  12660

gtggcaaagc aaaagttcaa aatcaccaac tggtccacct acaacaaagc tctcatcaac  12720

cgtggctccc tcactttctg gctggatgat ggggcgattc aggcctggta tgagtcagca  12780

acaccttctt cacgaggcag acctcagcgc cagaaggccg ccagagaggc cgagcgcggc  12840

cgtgaggctt ggacgctagg gcagggcatg aaaaagcccg tagcgggctg ctacgggcgt  12900

ctgacgcggt ggaaaggggg aggggatgtt gtctacatgg ctctgctgta gtgagtgggt  12960

tgcgctccgg cagcggtcct gatcaatcgt caccctttct cggtccttca acgttcctga  13020

caacgagcct ccttttcgcc aatccatcga caatcaccgc gagtccctgc tcgaacgctg  13080

cgtccggacc ggcttcgtcg aaggcgtcta tcgcggcccg caacagcggc gagagcggag  13140

cctgttcaac ggtgccgccg cgctcgccgg catcgctgtc gccggcctgc tcctcaagca  13200

cggccccaac agtgaagtag ctgattgtca tcagcgcatt gacggcgtcc ccggccgaaa  13260

aacccgcctc gcagaggaag cgaagctgcg cgtcggccgt ttccatctgc ggtgcgcccg  13320

gtcgcgtgcc ggcatggatg cgcgcgccat cgcggtaggc gagcagcgcc tgcctgaagc  13380

tgcgggcatt cccgatcaga aatgagcgcc agtcgtcgtc ggctctcggc accgaatgcg  13440

tatgattctc cgccagcatg gcttcggcca gtgcgtcgag cagcgcccgc ttgttcctga  13500

agtgccagta aagcgccggc tgctgaaccc ccaaccgttc cgccagtttg cgtgtcgtca  13560

gaccgtctac gccgacctcg ttcaacaggt ccagggcggc acggatcact gtattcggct  13620

gcaactttgt catgcttgac actttatcac tgataaacat aatatgtcca ccaacttatc  13680

agtgataaag aatccgcgcg ttcaatcgga ccagcggagg ctggtccgga ggccagacgt  13740

gaaacccaac atacccctga tcgtaattct gagcactgtc gcgctcgacg ctgtcggcat  13800

cggcctgatt atgccggtgc tgccgggcct cctgcgcgat ctggttcact cgaacgacgt  13860

caccgcccac tatggcattc tgctggcgct gtatgcgttg gtgcaatttg cctgcgcacc  13920

tgtgctgggc gcgctgtcgg atcgtttcgg gcggcggcca atcttgctcg tctcgctggc  13980

cggcgccact gtcgactacg ccatcatggc gacagcgcct ttcctttggg ttctctatat  14040

cgggcggatc gtggccggca tcaccggggc gactggggcg gtagccggcg cttatattgc  14100

cgatatcact gatggcgatg agcgcgcgcg gcacttcggc ttcatgagcg cctgtttcgg  14160

gttcgggatg gtcgcgggac ctgtgctcgg tgggctgatg ggcggtttct ccccccacgc  14220

tccgttcttc gccgcggcag ccttgaacgg cctcaatttc ctgacgggct gtttcctttt  14280

gccggagtcg cacaaaggcg aacgccggcc gttacgccgg gaggctctca acccgctcgc  14340

ttcgttccgg tgggcccggg gcatgaccgt cgtcgccgcc ctgatggcgg tcttcttcat  14400

catgcaactt gtcggacagg tgccggccgc gctttgggtc attttcggcg aggatcgctt  14460

tcactgggac gcgaccacga tcggcatttc gcttgccgca tttggcattc tgcattcact  14520

cgcccaggca atgatcaccg gccctgtagc cgcccggctc ggcgaaaggc gggcactcat  14580

gctcggaatg attgccgacg gcacaggcta catcctgctt gccttcgcga cacggggatg  14640

gatggcgttc ccgatcatgg tcctgcttgc ttcgggtggc atcggaatgc cggcgctgca  14700

agcaatgttg tccaggcagg tggatgagga acgtcagggg cagctgcaag gctcactggc  14760

ggcgctcacc agcctgacct cgatcgtcgg acccctcctc ttcacggcga tctatgcggc  14820

ttctataaca acgtggaacg ggtgggcatg gattgcaggc gctgccctct acttgctctg  14880

cctgccggcg ctgcgtcgcg ggctttggag cggcgcaggg caacgagccg atcgctgatc  14940

gtggaaacga taggcctatg ccatgcgggt caaggcgact tccggcaagc tatacgcgcc  15000

ctaggagtgc ggttggaacg ttggcccagc cagatactcc cgatcacgag caggacgccg  15060

atgatttgaa gcgcactcag cgtctgatcc aagaacaacc atcctagcaa cacggcggtc  15120

cccgggctga gaaagcccag taaggaaaca actgtaggtt cgagtcgcga gatcccccgg  15180

aaccaaagga agtaggttaa acccgctccg atcaggccga gccacgccag gccgagaaca  15240

ttggttcctg taggcatcgg gattggcgga tcaaacacta aagctactgg aacgagcaga  15300

agtcctccgg ccgccagttg ccaggcggta aaggtgagca gaggcacggg aggttgccac  15360

ttgcgggtca gcacggttcc gaacgccatg gaaaccgccc ccgccaggcc cgctgcgacg  15420

ccgacaggat ctagcgctgc gtttggtgtc aacaccaaca gcgccacgcc cgcagttccg  15480

caaatagccc ccaggaccgc catcaatcgt atcgggctac ctagcagagc ggcagagatg  15540

aacacgacca tcagcggctg cacagcgcct accgtcgccg cgaccccgcc cggcaggcgg  15600

tagaccgaaa taaacaacaa gctccagaat agcgaaatat taagtgcgcc gaggatgaag  15660

atgcgcatcc accagattcc cgttggaatc tgtcggacga tcatcacgag caataaaccc  15720

gccggcaacg cccgcagcag cataccggcg acccctcggc ctcgctgttc gggctccacg  15780

aaaacgccgg acagatgcgc cttgtgagcg tccttggggc cgtcctcctg tttgaagacc  15840

gacagcccaa tgatctcgcc gtcgatgtag gcgccgaatg ccacggcatc tcgcaaccgt  15900

tcagcgaacg cctccatggg ctttttctcc tcgtgctcgt aaacggaccc gaacatctct  15960

ggagctttct tcagggccga caatcggatc tcgcggaaat cctgcacgtc ggccgctcca  16020

agccgtcgaa tctgagcctt aatcacaatt gtcaatttta atcctctgtt tatcggcagt  16080

tcgtagagcg cgccgtgcgt cccgagcgat actgagcgaa gcaagtgcgt cgagcagtgc  16140

ccgcttgttc ctgaaatgcc agtaaagcgc tggctgctga acccccagcc ggaactgacc  16200

ccacaaggcc ctagcgtttg caatgcacca ggtcatcatt gacccaggcg tgttccacca  16260

ggccgctgcc tcgcaactct tcgcaggctt cgccgacctg ctcgcgccac ttcttcacgc  16320

gggtggaatc cgatccgcac atgaggcgga aggtttccag cttgagcggg tacggctccc  16380

ggtgcgagct gaaatagtcg aacatccgtc gggccgtcgg cgacagcttg cggtacttct  16440

cccatatgaa tttcgtgtag tggtcgccag caaacagcac gacgatttcc tcgtcgatca  16500

ggacctggca acgggacgtt ttcttgccac ggtccaggac gcggaagcgg tgcagcagcg  16560

acaccgattc caggtgccca acgcggtcgg acgtgaagcc catcgccgtc gcctgtaggc  16620

gcgacaggca ttcctcggcc ttcgtgtaat accggccatt gatcgaccag cccaggtcct  16680

ggcaaagctc gtagaacgtg aaggtgatcg gctcgccgat aggggtgcgc ttcgcgtact  16740

ccaacacctg ctgccacacc agttcgtcat cgtcggcccg cagctcgacg ccggtgtagg  16800

tgatcttcac gtccttgttg acgtggaaaa tgaccttgtt ttgcagcgcc tcgcgcggga  16860

ttttcttgtt gcgcgtggtg aacagggcag agcgggccgt gtcgtttggc atcgctcgca  16920

tcgtgtccgg ccacggcgca atatcgaaca aggaaagctg catttccttg atctgctgct  16980

tcgtgtgttt cagcaacgcg gcctgcttgg cctcgctgac ctgttttgcc aggtcctcgc  17040

cggcggtttt tcgcttcttg gtcgtcatag ttcctcgcgt gtcgatggtc atcgacttcg  17100

ccaaacctgc cgcctcctgt tcgagacgac gcgaacgctc cacggcggcc gatggcgcgg  17160

gcagggcagg gggagccagt tgcacgctgt cgcgctcgat cttggccgta gcttgctgga  17220

ccatcgagcc gacggactgg aaggtttcgc ggggcgcacg catgacggtg cggcttgcga  17280

tggtttcggc atcctcggcg gaaaaccccg cgtcgatcag ttcttgcctg tatgccttcc  17340

ggtcaaacgt ccgattcatt caccctcctt gcgggattgc cccgactcac gccggggcaa  17400

tgtgccctta ttcctgattt gacccgcctg gtgccttggt gtccagataa tccaccttat  17460

cggcaatgaa gtcggtcccg tagaccgtct ggccgtcctt ctcgtacttg gtattccgaa  17520

tcttgccctg cacgaatacc agcgacccct tgcccaaata cttgccgtgg gcctcggcct  17580

gagagccaaa acacttgatg cggaagaagt cggtgcgctc ctgcttgtcg ccggcatcgt  17640

tgcgccactc ttcattaacc gctatatcga aaattgcttg cggcttgtta gaattgccat  17700

gacgtacctc ggtgtcacgg gtaagattac cgataaactg gaactgatta tggctcatat  17760

cgaaagtctc cttgagaaag gagactctag tttagctaaa cattggttcc gctgtcaaga  17820

actttagcgg ctaaaatttt gcgggccgcg accaaaggtg cgaggggcgg cttccgctgt  17880

gtacaaccag atatttttca ccaacatcct tcgtctgctc gatgagcggg gcatgacgaa  17940

acatgagctg tcggagaggg caggggtttc aatttcgttt ttatcagact taaccaacgg  18000

taaggccaac ccctcgttga aggtgatgga ggccattgcc gacgccctgg aaactcccct  18060

acctcttctc ctggagtcca ccgaccttga ccgcgaggca ctcgcggaga ttgcgggtca  18120

tcctttcaag agcagcgtgc cgcccggata cgaacgcatc agtgtggttt tgccgtcaca  18180

taaggcgttt atcgtaaaga aatggggcga cgacacccga aaaaagctgc gtggaaggct  18240

ctgacgccaa gggttagggc ttgcacttcc ttctttagcc gctaaaacgg ccccttctct  18300

gcgggccgtc ggctcgcgca tcatatcgac atcctcaacg gaagccgtgc cgcgaatggc  18360

atcgggcggg tgcgctttga cagttgtttt ctatcagaac ccctacgtcg tgcggttcga  18420

ttagctgttt gtcttgcagg ctaaacactt tcggtatatc gtttgcctgt gcgataatgt  18480

tgctaatgat ttgttgcgta ggggttactg aaaagtgagc gggaaagaag agtttcagac  18540

catcaaggag cgggccaagc gcaagctgga acgcgacatg ggtgcggacc tgttggccgc  18600

gctcaacgac ccgaaaaccg ttgaagtcat gctcaacgcg gacggcaagg tgtggcacga  18660

acgccttggc gagccgatgc ggtacatctg cgacatgcgg cccagccagt cgcaggcgat  18720

tatagaaacg gtggccggat tccacggcaa agaggtcacg cggcattcgc ccatcctgga  18780

aggcgagttc cccttggatg gcagccgctt tgccggccaa ttgccgccgg tcgtggccgc  18840

gccaaccttt gcgatccgca agcgcgcggt cgccatcttc acgctggaac agtacgtcga  18900

ggcgggcatc atgacccgcg agcaatacga ggtcattaaa agcgccgtcg cggcgcatcg  18960

aaacatcctc gtcattggcg gtactggctc gggcaagacc acgctcgtca acgcgatcat  19020

caatgaaatg gtcgccttca acccgtctga gcgcgtcgtc atcatcgagg acaccggcga  19080

aatccagtgc gccgcagaga acgccgtcca ataccacacc agcatcgacg tctcgatgac  19140

gctgctgctc aagacaacgc tgcgtatgcg ccccgaccgc atcctggtcg gtgaggtacg  19200

tggccccgaa gcccttgatc tgttgatggc ctggaacacc gggcatgaag gaggtgccgc  19260

caccctgcac gcaaacaacc ccaaagcggg cctgagccgg ctcgccatgc ttatcagcat  19320

gcacccggat tcaccgaaac ccattgagcc gctgattggc gaggcggttc atgtggtcgt  19380

ccatatcgcc aggaccccta gcggccgtcg agtgcaagaa attctcgaag ttcttggtta  19440

cgagaacggc cagtacatca ccaaaaccct gtaaggagta tttccaatga caacggctgt  19500

tccgttccgt ctgaccatga atcgcggcat tttgttctac cttgccgtgt tcttcgttct  19560

cgctctcgcg ttatccgcgc atccggcgat ggcctcggaa ggcaccggcg gcagcttgcc  19620

atatgagagc tggctgacga acctgcgcaa ctccgtaacc ggcccggtgg ccttcgcgct  19680

gtccatcatc ggcatcgtcg tcgccggcgg cgtgctgatc ttcggcggcg aactcaacgc  19740

cttcttccga accctgatct tcctggttct ggtgatggcg ctgctggtcg gcgcgcagaa  19800

cgtgatgagc accttcttcg gtcgtggtgc cgaaatcgcg gccctcggca acggggcgct  19860

gcaccaggtg caagtcgcgg cggcggatgc cgtgcgtgcg gtagcggctg gacggctcgc  19920

ctaatcatgg ctctgcgcac gatccccatc cgtcgcgcag gcaaccgaga aaacctgttc  19980

atgggtggtg atcgtgaact ggtgatgttc tcgggcctga tggcgtttgc gctgattttc  20040

agcgcccaag agctgcgggc caccgtggtc ggtctgatcc tgtggttcgg ggcgctctat  20100

gcgttccgaa tcatggcgaa ggccgatccg aagatgcggt tcgtgtacct gcgtcaccgc  20160

cggtacaagc cgtattaccc ggcccgctcg accccgttcc gcgagaacac caatagccaa  20220

gggaagcaat accgatgatc caagcaattg cgattgcaat cgcgggcctc ggcgcgcttc  20280

tgttgttcat cctctttgcc cgcatccgcg cggtcgatgc cgaactgaaa ctgaaaaagc  20340

atcgttccaa ggacgccggc ctggccgatc tgctcaacta cgccgctgtc gtcgatgacg  20400

gcgtaatcgt gggcaagaac ggcagcttta tggctgcctg gctgtacaag ggcgatgaca  20460

acgcaagcag caccgaccag cagcgcgaag tagtgtccgc ccgcatcaac caggccctcg  20520

cgggcctggg aagtgggtgg atgatccatg tggacgccgt gcggcgtcct gctccgaact  20580

acgcggagcg gggcctgtcg gcgttccctg accgtctgac ggcagcgatt gaagaagagc  20640

gctcggtctt gccttgctcg tcggtgatgt acttcaccag ctccgcgaag tcgctcttct  20700

tgatggagcg catggggacg tgcttggcaa tcacgcgcac cccccggccg ttttagcggc  20760

taaaaaagtc atggctctgc cctcgggcgg accacgccca tcatgacctt gccaagctcg  20820

tcctgcttct cttcgatctt cgccagcagg gcgaggatcg tggcatcacc gaaccgcgcc  20880

gtgcgcgggt cgtcggtgag ccagagtttc agcaggccgc ccaggcggcc caggtcgcca  20940

ttgatgcggg ccagctcgcg gacgtgctca tagtccacga cgcccgtgat tttgtagccc  21000

tggccgacgg ccagcaggta ggccgacagg ctcatgccgg ccgccgccgc cttttcctca  21060

atcgctcttc gttcgtctgg aaggcagtac accttgatag gtgggctgcc cttcctggtt  21120

ggcttggttt catcagccat ccgcttgccc tcatctgtta cgccggcggt agccggccag  21180

cctcgcagag caggattccc gttgagcacc gccaggtgcg aataagggac agtgaagaag  21240

gaacacccgc tcgcgggtgg gcctacttca cctatcctgc ccggctgacg ccgttggata  21300

caccaaggaa agtctacacg aaccctttgg caaaatcctg tatatcgtgc gaaaaaggat  21360

ggatataccg aaaaaatcgc tataatgacc ccgaagcagg gttatgcagc ggaaaagcgc  21420

tgcttccctg ctgttttgtg gaatatctac cgactggaaa caggcaaatg caggaaatta  21480

ctgaactgag gggacaggcg agagacgatg ccaaagagct acaccgacga gctggccgag  21540

tgggttgaat cccgcgcggc caagaagcgc cggcgtgatg aggctgcggt tgcgttcctg  21600

gcggtgaggg cggatgtcga ggcggcgtta gcgtccggct atgcgctcgt caccatttgg  21660

gagcacatgc gggaaacggg gaaggtcaag ttctcctacg agacgttccg ctcgcacgcc  21720

aggcggcaca tcaaggccaa gcccgccgat gtgcccgcac cgcaggccaa ggctgcggaa  21780

cccgcgccgg cacccaagac gccggagcca cggcggccga agcagggggg caaggctgaa  21840

aagccggccc ccgctgcggc cccgaccggc ttcaccttca acccaacacc ggacaaaaag  21900

gatctactgt aatggcgaaa attcacatgg ttttgcaggg caagggcggg gtcggcaagt  21960

cggccatcgc cgcgatcatt gcgcagtaca agatggacaa ggggcagaca cccttgtgca  22020

tcgacaccga cccggtgaac gcgacgttcg agggctacaa ggccctgaac gtccgccggc  22080

tgaacatcat ggccggcgac gaaattaact cgcgcaactt cgacaccctg gtcgagctga  22140

ttgcgccgac caaggatgac gtggtgatcg acaacggtgc cagctcgttc gtgcctctgt  22200

cgcattacct catcagcaac caggtgccgg ctctgctgca agaaatgggg catgagctgg  22260

tcatccatac cgtcgtcacc ggcggccagg ctctcctgga cacggtgagc ggcttcgccc  22320

agctcgccag ccagttcccg gccgaagcgc ttttcgtggt ctggctgaac ccgtattggg  22380

ggcctatcga gcatgagggc aagagctttg agcagatgaa ggcgtacacg gccaacaagg  22440

cccgcgtgtc gtccatcatc cagattccgg ccctcaagga agaaacctac ggccgcgatt  22500

tcagcgacat gctgcaagag cggctgacgt tcgaccaggc gctggccgat gaatcgctca  22560

cgatcatgac gcggcaacgc ctcaagatcg tgcggcgcgg cctgtttgaa cagctcgacg  22620

cggcggccgt gctatgagcg accagattga agagctgatc cgggagattg cggccaagca  22680

cggcatcgcc gtcggccgcg acgacccggt gctgatcctg cataccatca acgcccggct  22740

catggccgac agtgcggcca agcaagagga aatccttgcc gcgttcaagg aagagctgga  22800

agggatcgcc catcgttggg gcgaggacgc caaggccaaa gcggagcgga tgctgaacgc  22860

ggccctggcg gccagcaagg acgcaatggc gaaggtaatg aaggacagcg ccgcgcaggc  22920

ggccgaagcg atccgcaggg aaatcgacga cggccttggc cgccagctcg cggccaaggt  22980

cgcggacgcg cggcgcgtgg cgatgatgaa catgatcgcc ggcggcatgg tgttgttcgc  23040

ggccgccctg gtggtgtggg cctcgttatg aatcgcagag gcgcagatga aaaagcccgg  23100

cgttgccggg ctttgttttt gcgttagctg ggcttgtttg acaggcccaa gctctgactg  23160

cgcccgcgct cgcgctcctg ggcctgtttc ttctcctgct cctgcttgcg catcagggcc  23220

tggtgccgtc gggctgcttc acgcatcgaa tcccagtcgc cggccagctc gggatgctcc  23280

gcgcgcatct tgcgcgtcgc cagttcctcg atcttgggcg cgtgaatgcc catgccttcc  23340

ttgatttcgc gcaccatgtc cagccgcgtg tgcagggtct gcaagcgggc ttgctgttgg  23400

gcctgctgct gctgccaggc ggcctttgta cgcggcaggg acagcaagcc gggggcattg  23460

gactgtagct gctgcaaacg cgcctgctga cggtctacga gctgttctag gcggtcctcg  23520

atgcgctcca cctggtcatg ctttgcctgc acgtagagcg caagggtctg ctggtaggtc  23580

tgctcgatgg gcgcggattc taagagggcc tgctgttccg tctcggcctc ctgggccgcc  23640

tgtagcaaat cctcgccgct gttgccgctg gactgcttta ctgccgggga ctgctgttgc  23700

cctgctcgcg ccgtcgtcgc agttcggctt gcccccactc gattgactgc ttcatttcga  23760

gccgcagcga tgcgatctcg gattgcgtca acggacgggg cagcgcggag gtgtccggct  23820

tctccttggg tgagtcggtc gatgccatag ccaaaggttt ccttccaaaa tgcgtccatt  23880

gctggaccgt gtttctcatt gatgcccgca agcatcttcg gcttgaccgc caggtcaagc  23940

gcgccttcat gggcggtcat gacggacgcc gccatgacct tgccgccgtt gttctcgatg  24000

tagccgcgta atgaggcaat ggtgccgccc atcgtcagcg tgtcatcgac aacgatgtac  24060

ttctggccgg ggatcacctc cccctcgaaa gtcgggttga acgccaggcg atgatctgaa  24120

ccggctccgg ttcgggcgac cttctcccgc tgcacaatgt ccgtttcgac ctcaaggcca  24180

aggcggtcgg ccagaacgac cgccatcatg gccggaatct tgttgttccc cgccgcctcg  24240

acggcgagga ctggaacgat gcggggcttg tcgtcgccga tcagcgtctt gagctgggca  24300

acagtgtcgt ccgaaatcag gcgctcgacc aaattaagcg ccgcttccgc gtcgccctgc  24360

ttcgcagcct ggtattcagg ctcgttggtc aaagaaccaa ggtcgccgtt gcgaaccacc  24420

ttcgggaagt ctccccacgg tgcgcgctcg gctctgctgt agctgctcaa gacgcctccc  24480

tttttagccg ctaaaactct aacgagtgcg cccgcgactc aacttgacgc tttcggcact  24540

tacctgtgcc ttgccacttg cgtcataggt gatgcttttc gcactcccga tttcaggtac  24600

tttatcgaaa tctgaccggg cgtgcattac aaagttcttc cccacctgtt ggtaaatgct  24660

gccgctatct gcgtggacga tgctgccgtc gtggcgctgc gacttatcgg ccttttgggc  24720

catatagatg ttgtaaatgc caggtttcag ggccccggct ttatctacct tctggttcgt  24780

ccatgcgcct tggttctcgg tctggacaat tctttgccca ttcatgacca ggaggcggtg  24840

tttcattggg tgactcctga cggttgcctc tggtgttaaa cgtgtcctgg tcgcttgccg  24900

gctaaaaaaa agccgacctc ggcagttcga ggccggcttt ccctagagcc gggcgcgtca  24960

aggttgttcc atctatttta gtgaactgcg ttcgatttat cagttacttt cctcccgctt  25020

tgtgtttcct cccactcgtt tccgcgtcta gccgacccct caacatagcg gcctcttctt  25080

gggctgcctt tgcctcttgc cgcgcttcgt cacgctcggc ttgcaccgtc gtaaagcgct  25140

cggcctgcct ggccgcctct tgcgccgcca acttcctttg ctcctggtgg gcctcggcgt  25200

cggcctgcgc cttcgctttc accgctgcca actccgtgcg caaactctcc gcttcgcgcc  25260

tggtggcgtc gcgctcgccg cgaagcgcct gcatttcctg gttggccgcg tccagggtct  25320

tgcggctctc ttctttgaat gcgcgggcgt cctggtgagc gtagtccagc tcggcgcgca  25380

gctcctgcgc tcgacgctcc acctcgtcgg cccgctgcgt cgccagcgcg gcccgctgct  25440

cggctcctgc cagggcggtg cgtgcttcgg ccagggcttg ccgctggcgt gcggccagct  25500

cggccgcctc ggcggcctgc tgctctagca atgtaacgcg cgcctgggct tcttccagct  25560

cgcgggcctg cgcctcgaag gcgtcggcca gctccccgcg cacggcttcc aactcgttgc  25620

gctcacgatc ccagccggct tgcgctgcct gcaacgattc attggcaagg gcctgggcgg  25680

cttgccagag ggcggccacg gcctggttgc cggcctgctg caccgcgtcc ggcacctgga  25740

ctgccagcgg ggcggcctgc gccgtgcgct ggcgtcgcca ttcgcgcatg ccggcgctgg  25800

cgtcgttcat gttgacgcgg gcggccttac gcactgcatc cacggtcggg aagttctccc  25860

ggtcgccttg ctcgaacagc tcgtccgcag ccgcaaaaat gcggtcgcgc gtctctttgt  25920

tcagttccat gttggctccg gtaattggta agaataataa tactcttacc taccttatca  25980

gcgcaagagt ttagctgaac agttctcgac ttaacggcag gttttttagc ggctgaaggg  26040

caggcaaaaa aagccccgca cggtcggcgg gggcaaaggg tcagcgggaa ggggattagc  26100

gggcgtcggg cttcttcatg cgtcggggcc gcgcttcttg ggatggagca cgacgaagcg  26160

cgcacgcgca tcgtcctcgg ccctatcggc ccgcgtcgcg gtcaggaact tgtcgcgcgc  26220

taggtcctcc ctggtgggca ccaggggcat gaactcggcc tgctcgatgt aggtccactc  26280

catgaccgca tcgcagtcga ggccgcgttc cttcaccgtc tcttgcaggt cgcggtacgc  26340

ccgctcgttg agcggctggt aacgggccaa ttggtcgtaa atggctgtcg gccatgagcg  26400

gcctttcctg ttgagccagc agccgacgac gaagccggca atgcaggccc ctggcacaac  26460

caggccgacg ccgggggcag gggatggcag cagctcgcca accaggaacc ccgccgcgat  26520

gatgccgatg ccggtcaacc agcccttgaa actatccggc cccgaaacac ccctgcgcat  26580

tgcctggatg ctgcgccgga tagcttgcaa catcaggagc cgtttctttt gttcgtcagt  26640

catggtccgc cctcaccagt tgttcgtatc ggtgtcggac gaactgaaat cgcaagagct  26700

gccggtatcg gtccagccgc tgtccgtgtc gctgctgccg aagcacggcg aggggtccgc  26760

gaacgccgca gacggcgtat ccggccgcag cgcatcgccc agcatggccc cggtcagcga  26820

gccgccggcc aggtagccca gcatggtgct gttggtcgcc ccggccacca gggccgacgt  26880

gacgaaatcg ccgtcattcc ctctggattg ttcgctgctc ggcggggcag tgcgccgcgc  26940

cggcggcgtc gtggatggct cgggttggct ggcctgcgac ggccggcgaa aggtgcgcag  27000

cagctcgtta tcgaccggct gcggcgtcgg ggccgccgcc ttgcgctgcg gtcggtgttc  27060

cttcttcggc tcgcgcagct tgaacagcat gatcgcggaa accagcagca acgccgcgcc  27120

tacgcctccc gcgatgtaga acagcatcgg attcattctt cggtcctcct tgtagcggaa  27180

ccgttgtctg tgcggcgcgg gtggcccgcg ccgctgtctt tggggatcag ccctcgatga  27240

gcgcgaccag tttcacgtcg gcaaggttcg cctcgaactc ctggccgtcg tcctcgtact  27300

tcaaccaggc atagccttcc gccggcggcc gacggttgag gataaggcgg gcagggcgct  27360

cgtcgtgctc gacctggacg atggcctttt tcagcttgtc cgggtccggc tccttcgcgc  27420

ccttttcctt ggcgtcctta ccgtcctggt cgccgtcctc gccgtcctgg ccgtcgccgg  27480

cctccgcgtc acgctcggca tcagtctggc cgttgaaggc atcgacggtg ttgggatcgc  27540

ggcccttctc gtccaggaac tcgcgcagca gcttgaccgt gccgcgcgtg atttcctggg  27600

tgtcgtcgtc aagccacgcc tcgacttcct ccgggcgctt cttgaaggcc gtcaccagct  27660

cgttcaccac ggtcacgtcg cgcacgcggc cggtgttgaa cgcatcggcg atcttctccg  27720

gcaggtccag cagcgtgacg tgctgggtga tgaacgccgg cgacttgccg atttccttgg  27780

cgatatcgcc tttcttcttg cccttcgcca gctcgcggcc aatgaagtcg gcaatttcgc  27840

gcggggtcag ctcgttgcgt tgcaggttct cgataacctg gtcggcttcg ttgtagtcgt  27900

tgtcgatgaa cgccgggatg gacttcttgc cggcccactt cgagccacgg tagcggcggg  27960

cgccgtgatt gatgatatag cggcccggct gctcctggtt ctcgcgcacc gaaatgggtg  28020

acttcacccc gcgctctttg atcgtggcac cgatttccgc gatgctctcc ggggaaaagc  28080

cggggttgtc ggccgtccgc ggctgatgcg gatcttcgtc gatcaggtcc aggtccagct  28140

cgatagggcc ggaaccgccc tgagacgccg caggagcgtc caggaggctc gacaggtcgc  28200

cgatgctatc caaccccagg ccggacggct gcgccgcgcc tgcggcttcc tgagcggccg  28260

cagcggtgtt tttcttggtg gtcttggctt gagccgcagt cattgggaaa tctccatctt  28320

cgtgaacacg taatcagcca gggcgcgaac ctctttcgat gccttgcgcg cggccgtttt  28380

cttgatcttc cagaccggca caccggatgc gagggcatcg gcgatgctgc tgcgcaggcc  28440

aacggtggcc ggaatcatca tcttggggta cgcggccagc agctcggctt ggtggcgcgc  28500

gtggcgcgga ttccgcgcat cgaccttgct gggcaccatg ccaaggaatt gcagcttggc  28560

gttcttctgg cgcacgttcg caatggtcgt gaccatcttc ttgatgccct ggatgctgta  28620

cgcctcaagc tcgatggggg acagcacata gtcggccgcg aagagggcgg ccgccaggcc  28680

gacgccaagg gtcggggccg tgtcgatcag gcacacgtcg aagccttggt tcgccagggc  28740

cttgatgttc gccccgaaca gctcgcgggc gtcgtccagc gacagccgtt cggcgttcgc  28800

cagtaccggg ttggactcga tgagggcgag gcgcgcggcc tggccgtcgc cggctgcggg  28860

tgcggtttcg gtccagccgc cggcagggac agcgccgaac agcttgcttg catgcaggcc  28920

ggtagcaaag tccttgagcg tgtaggacgc attgccctgg gggtccaggt cgatcacggc  28980

aacccgcaag ccgcgctcga aaaagtcgaa ggcaagatgc acaagggtcg aagtcttgcc  29040

gacgccgcct ttctggttgg ccgtgaccaa agttttcatc gtttggtttc ctgttttttc  29100

ttggcgtccg cttcccactt ccggacgatg tacgcctgat gttccggcag aaccgccgtt  29160

acccgcgcgt acccctcggg caagttcttg tcctcgaacg cggcccacac gcgatgcacc  29220

gcttgcgaca ctgcgcccct ggtcagtccc agcgacgttg cgaacgtcgc ctgtggcttc  29280

ccatcgacta agacgccccg cgctatctcg atggtctgct gccccacttc cagcccctgg  29340

atcgcctcct ggaactggct ttcggtaagc cgtttcttca tggataacac ccataatttg  29400

ctccgcgcct tggttgaaca tagcggtgac agccgccagc acatgagaga agtttagcta  29460

aacatttctc gcacgtcaac acctttagcc gctaaaactc gtccttggcg taacaaaaca  29520

aaagcccgga aaccgggctt tcgtctcttg ccgcttatgg ctctgcaccc ggctccatca  29580

ccaacaggtc gcgcacgcgc ttcactcggt tgcggatcga cactgccagc ccaacaaagc  29640

cggttgccgc cgccgccagg atcgcgccga tgatgccggc cacaccggcc atcgcccacc  29700

aggtcgccgc cttccggttc cattcctgct ggtactgctt cgcaatgctg gacctcggct  29760

caccataggc tgaccgctcg atggcgtatg ccgcttctcc ccttggcgta aaacccagcg  29820

ccgcaggcgg cattgccatg ctgcccgccg ctttcccgac cacgacgcgc gcaccaggct  29880

tgcggtccag accttcggcc acggcgagct gcgcaaggac ataatcagcc gccgacttgg  29940

ctccacgcgc ctcgatcagc tcttgcactc gcgcgaaatc cttggcctcc acggccgcca  30000

tgaatcgcgc acgcggcgaa ggctccgcag ggccggcgtc gtgatcgccg ccgagaatgc  30060

ccttcaccaa gttcgacgac acgaaaatca tgctgacggc tatcaccatc atgcagacgg  30120

atcgcacgaa cccgctgaat tgaacacgag cacggcaccc gcgaccacta tgccaagaat  30180

gcccaaggta aaaattgccg gccccgccat gaagtccgtg aatgccccga cggccgaagt  30240

gaagggcagg ccgccaccca ggccgccgcc ctcactgccc ggcacctggt cgctgaatgt  30300

cgatgccagc acctgcggca cgtcaatgct tccgggcgtc gcgctcgggc tgatcgccca  30360

tcccgttact gccccgatcc cggcaatggc aaggactgcc agcgctgcca tttttggggt  30420

gaggccgttc gcggccgagg ggcgcagccc ctggggggat gggaggcccg cgttagcggg  30480

ccgggagggt tcgagaaggg ggggcacccc ccttcggcgt gcgcggtcac gcgcacaggg  30540

cgcagccctg gttaaaaaca aggtttataa atattggttt aaaagcaggt taaaagacag  30600

gttagcggtg gccgaaaaac gggcggaaac ccttgcaaat gctggatttt ctgcctgtgg  30660

acagcccctc aaatgtcaat aggtgcgccc ctcatctgtc agcactctgc ccctcaagtg  30720

tcaaggatcg cgcccctcat ctgtcagtag tcgcgcccct caagtgtcaa taccgcaggg  30780

cacttatccc caggcttgtc cacatcatct gtgggaaact cgcgtaaaat caggcgtttt  30840

cgccgatttg cgaggctggc cagctccacg tcgccggccg aaatcgagcc tgcccctcat  30900

ctgtcaacgc cgcgccgggt gagtcggccc ctcaagtgtc aacgtccgcc cctcatctgt  30960

cagtgagggc caagttttcc gcgaggtatc cacaacgccg gcggccgcgg tgtctcgcac  31020

acggcttcga cggcgtttct ggcgcgtttg cagggccata gacggccgcc agcccagcgg  31080

cgagggcaac cagcccggtg agcgtcggaa aggcgctgga agccccgtag cgacgcggag  31140

aggggcgaga caagccaagg gcgcaggctc gatgcgcagc acgacatagc cggttctcgc  31200

aaggacgaga atttccctgc ggtgcccctc aagtgtcaat gaaagtttcc aacgcgagcc  31260

attcgcgaga gccttgagtc cacgctagat gagagctttg ttgtaggtgg accagttggt  31320

gattttgaac ttttgctttg ccacggaacg gtctgcgttg tcgggaagat gcgtgatctg  31380

atccttcaac tcagcaaaag ttcgatttat tcaacaaagc cacgttgtgt ctcaaaatct  31440

ctgatgttac attgcacaag ataaaaatat atcatcatga acaataaaac tgtctgctta  31500

cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt cttgctcgac  31560

tctagagctc gttcctcgag gaacggtacc tgcggggaag cttacaataa tgtgtgttgt  31620

taagtcttgt tgcctgtcat cgtctgactg actttcgtca taaatcccgg cctccgtaac  31680

ccagctttgg gcaagctcac ggatttgatc cggcggaacg ggaatatcga gatgccgggc  31740

tgaacgctgc agttccagct ttccctttcg ggacaggtac tccagctgat tgattatctg  31800

ctgaagggtc ttggttccac ctcctggcac aatgcgaatg attacttgag cgcgatcggg  31860

catccaattt tctcccgtca ggtgcgtggt caagtgctac aaggcacctt tcagtaacga  31920

gcgaccgtcg atccgtcgcc gggatacgga caaaatggag cgcagtagtc catcgagggc  31980

ggcgaaagcc tcgccaaaag caatacgttc atctcgcaca gcctccagat ccgatcgagg  32040

gtcttcggcg taggcagata gaagcatgga tacattgctt gagagtattc cgatggactg  32100

aagtatggct tccatctttt ctcgtgtgtc tgcatctatt tcgagaaagc ccccgatgcg  32160

gcgcaccgca acgcgaattg ccatactatc cgaaagtccc agcaggcgcg cttgatagga  32220

aaaggtttca tactcggccg atcgcagacg ggcactcacg accttgaacc cttcaacttt  32280

cagggatcga tgctggttga tggtagtctc actcgacgtg gctctggtgt gttttgacat  32340

agcttcctcc aaagaaagcg gaaggtctgg atactccagc acgaaatgtg cccgggtaga  32400

cggatggaag tctagccctg ctcaatatga aatcaacagt acatttacag tcaatactga  32460

atatacttgc tacatttgca attgtcttat aacgaatgtg aaataaaaat agtgtaacaa  32520

cgcttttact catcgataat cacaaaaaca tttatacgaa caaaaataca aatgcactcc  32580

ggtttcacag gataggcggg atcagaatat gcaacttttg acgttttgtt ctttcaaagg  32640

gggtgctggc aaaaccaccg cactcatggg cctttgcgct gctttggcaa atgacggtaa  32700

acgagtggcc ctctttgatg ccgacgaaaa ccggcctctg acgcgatgga gagaaaacgc  32760

cttacaaagc agtactggga tcctcgctgt gaagtctatt ccgccgacga aatgcccctt  32820

cttgaagcag cctatgaaaa tgccgagctc gaaggatttg attatgcgtt ggccgatacg  32880

cgtggcggct cgagcgagct caacaacaca atcatcgcta gctcaaacct gcttctgatc  32940

cccaccatgc taacgccgct cgacatcgat gaggcactat ctacctaccg ctacgtcatc  33000

gagctgctgt tgagtgaaaa tttggcaatt cctacagctg ttttgcgcca acgcgtcccg  33060

gtcggccgat tgacaacatc gcaacgcagg atgtcagaga cgctagagag ccttccagtt  33120

gtaccgtctc ccatgcatga aagagatgca tttgccgcga tgaaagaacg cggcatgttg  33180

catcttacat tactaaacac gggaactgat ccgacgatgc gcctcataga gaggaatctt  33240

cggattgcga tggaggaagt cgtggtcatt tcgaaactga tcagcaaaat cttggaggct  33300

tgaagatggc aattcgcaag cccgcattgt cggtcggcga agcacggcgg cttgctggtg  33360

ctcgacccga gatccaccat cccaacccga cacttgttcc ccagaagctg gacctccagc  33420

acttgcctga aaaagccgac gagaaagacc agcaacgtga gcctctcgtc gccgatcaca  33480

tttacagtcc cgatcgacaa cttaagctaa ctgtggatgc ccttagtcca cctccgtccc  33540

cgaaaaagct ccaggttttt ctttcagcgc gaccgcccgc gcctcaagtg tcgaaaacat  33600

atgacaacct cgttcggcaa tacagtccct cgaagtcgct acaaatgatt ttaaggcgcg  33660

cgttggacga tttcgaaagc atgctggcag atggatcatt tcgcgtggcc ccgaaaagtt  33720

atccgatccc ttcaactaca gaaaaatccg ttctcgttca gacctcacgc atgttcccgg  33780

ttgcgttgct cgaggtcgct cgaagtcatt ttgatccgtt ggggttggag accgctcgag  33840

ctttcggcca caagctggct accgccgcgc tcgcgtcatt ctttgctgga gagaagccat  33900

cgagcaattg gtgaagaggg acctatcgga acccctcacc aaatattgag tgtaggtttg  33960

aggccgctgg ccgcgtcctc agtcaccttt tgagccagat aattaagagc caaatgcaat  34020

tggctcaggc tgccatcgtc cccccgtgcg aaacctgcac gtccgcgtca aagaaataac  34080

cggcacctct tgctgttttt atcagttgag ggcttgacgg atccgcctca agtttgcggc  34140

gcagccgcaa aatgagaaca tctatactcc tgtcgtaaac ctcctcgtcg cgtactcgac  34200

tggcaatgag aagttgctcg cgcgatagaa cgtcgcgggg tttctctaaa aacgcgagga  34260

gaagattgaa ctcacctgcc gtaagtttca cctcaccgcc agcttcggac atcaagcgac  34320

gttgcctgag attaagtgtc cagtcagtaa aacaaaaaga ccgtcggtct ttggagcgga  34380

caacgttggg gcgcacgcgc aaggcaaccc gaatgcgtgc aagaaactct ctcgtactaa  34440

acggcttagc gataaaatca cttgctccta gctcgagtgc aacaacttta tccgtctcct  34500

caaggcggtc gccactgata attatgattg gaatatcaga ctttgccgcc agatttcgaa  34560

cgatctcaag cccatcttca cgacctaaat ttagatcaac aaccacgaca tcgaccgtcg  34620

cggaagagag tactctagtg aactgggtgc tgtcggctac cgcggtcact ttgaaggcgt  34680

ggatcgtaag gtattcgata ataagatgcc gcatagcgac atcgtcatcg ataagaagaa  34740

cgtgtttcaa cggctcacct ttcaatctaa aatctgaacc cttgttcaca gcgcttgaga  34800

aattttcacg tgaaggatgt acaatcatct ccagctaaat gggcagttcg tcagaattgc  34860

ggctgaccgc ggatgacgaa aatgcgaacc aagtatttca attttatgac aaaagttctc  34920

aatcgttgtt acaagtgaaa cgcttcgagg ttacagctac tattgattaa ggagatcgcc  34980

tatggtctcg ccccggcgtc gtgcgtccgc cgcgagccag atctcgccta cttcataaac  35040

gtcctcatag gcacggaatg gaatgatgac atcgatcgcc gtagagagca tgtcaatcag  35100

tgtgcgatct tccaagctag caccttgggc gctacttttg acaagggaaa acagtttctt  35160

gaatccttgg attggattcg cgccgtgtat tgttgaaatc gatcccggat gtcccgagac  35220

gacttcactc agataagccc atgctgcatc gtcgcgcatc tcgccaagca atatccggtc  35280

cggccgcata cgcagacttg cttggagcaa gtgctcggcg ctcacagcac ccagcccagc  35340

accgttcttg gagtagagta gtctaacatg attatcgtgt ggaatgacga gttcgagcgt  35400

atcttctatg gtgattagcc tttcctgggg ggggatggcg ctgatcaagg tcttgctcat  35460

tgttgtcttg ccgcttccgg tagggccaca tagcaacatc gtcagtcggc tgacgacgca  35520

tgcgtgcaga aacgcttcca aatccccgtt gtcaaaatgc tgaaggatag cttcatcatc  35580

ctgattttgg cgtttccttc gtgtctgcca ctggttccac ctcgaagcat cataacggga  35640

ggagacttct ttaagaccag aaacacgcga gcttggccgt cgaatggtca agctgacggt  35700

gcccgaggga acggtcggcg gcagacagat ttgtagtcgt tcaccaccag gaagttcagt  35760

ggcgcagagg gggttacgtg gtccgacatc ctgctttctc agcgcgcccg ctaaaatagc  35820

gatatcttca agatcatcat aagagacggg caaaggcatc ttggtaaaaa tgccggcttg  35880

gcgcacaaat gcctctccag gtcgattgat cgcaatttct tcagtcttcg ggtcatcgag  35940

ccattccaaa atcggcttca gaagaaagcg tagttgcgga tccacttcca tttacaatgt  36000

atcctatctc taagcggaaa tttgaattca ttaagagcgg cggttcctcc cccgcgtggc  36060

gccgccagtc aggcggagct ggtaaacacc aaagaaatcg aggtcccgtg ctacgaaaat  36120

ggaaacggtg tcaccctgat tcttcttcag ggttggcggt atgttgatgg ttgccttaag  36180

ggctgtctca gttgtctgct caccgttatt ttgaaagctg ttgaagctca tcccgccacc  36240

cgagctgccg gcgtaggtgc tagctgcctg gaaggcgcct tgaacaacac tcaagagcat  36300

agctccgcta aaacgctgcc agaagtggct gtcgaccgag cccggcaatc ctgagcgacc  36360

gagttcgtcc gcgcttggcg atgttaacga gatcatcgca tggtcaggtg tctcggcgcg  36420

atcccacaac acaaaaacgc gcccatctcc ctgttgcaag ccacgctgta tttcgccaac  36480

aacggtggtg ccacgatcaa gaagcacgat attgttcgtt gttccacgaa tatcctgagg  36540

caagacacac tttacatagc ctgccaaatt tgtgtcgatt gcggtttgca agatgcacgg  36600

aattattgtc ccttgcgtta ccataaaatc ggggtgcggc aagagcgtgg cgctgctggg  36660

ctgcagctcg gtgggtttca tacgtatcga caaatcgttc tcgccggaca cttcgccatt  36720

cggcaaggag ttgtcgtcac gcttgccttc ttgtcttcgg cccgtgtcgc cctgaatggc  36780

gcgtttgctg accccttgat cgccgctgct atatgcaaaa atcggtgttt cttccggccg  36840

tggctcatgc cgctccggtt cgcccctcgg cggtagagga gcagcaggct gaacagcctc  36900

ttgaaccgct ggaggatccg gcggcacctc aatcggagct ggatgaaatg gcttggtgtt  36960

tgttgcgatc aaagttgacg gcgatgcgtt ctcattcacc ttcttttggc gcccacctag  37020

ccaaatgagg cttaatgata acgcgagaac gacacctccg acgatcaatt tctgagaccc  37080

cgaaagacgc cggcgatgtt tgtcggagac cagggatcca gatgcatcaa cctcatgtgc  37140

cgcttgctga ctatcgttat tcatcccttc gcccccttca ggacgcgttt cacatcgggc  37200

ctcaccgtgc ccgtttgcgg cctttggcca acgggatcgt aagcggtgtt ccagatacat  37260

agtactgtgt ggccatccct cagacgccaa cctcgggaaa ccgaagaaat ctcgacatcg  37320

ctccctttaa ctgaatagtt ggcaacagct tccttgccat caggattgat ggtgtagatg  37380

gagggtatgc gtacattgcc cggaaagtgg aataccgtcg taaatccatt gtcgaagact  37440

tcgagtggca acagcgaacg atcgccttgg gcgacgtagt gccaattact gtccgccgca  37500

ccaagggctg tgacaggctg atccaataaa ttctcagctt tccgttgata ttgtgcttcc  37560

gcgtgtagtc tgtccacaac agccttctgt tgtgcctccc ttcgccgagc cgccgcatcg  37620

tcggcggggt aggcgaattg gacgctgtaa tagagatcgg gctgctcttt atcgaggtgg  37680

gacagagtct tggaacttat actgaaaaca taacggcgca tcccggagtc gcttgcggtt  37740

agcacgatta ctggctgagg cgtgaggacc tggcttgcct tgaaaaatag ataatttccc  37800

cgcggtaggg ctgctagatc tttgctattt gaaacggcaa ccgctgtcac cgtttcgttc  37860

gtggcgaatg ttacgaccaa agtagctcca accgccgtcg agaggcgcac cacttgatcg  37920

ggattgtaag ccaaataacg catgcgcgga tctagcttgc ccgccattgg agtgtcttca  37980

gcctccgcac cagtcgcagc ggcaaataaa catgctaaaa tgaaaagtgc ttttctgatc  38040

atggttcgct gtggcctacg tttgaaacgg tatcttccga tgtctgatag gaggtgacaa  38100

ccagacctgc cgggttggtt agtctcaatc tgccgggcaa gctggtcacc ttttcgtagc  38160

gaactgtcgc ggtccacgta ctcaccacag gcattttgcc gtcaacgacg agggtccttt  38220

tatagcgaat ttgctgcgtg cttggagtta catcatttga agcgatgtgc tcgacctcca  38280

ccctgccgcg tttgccaaga atgacttgag gcgaactggg attgggatag ttgaagaatt  38340

gctggtaatc ctggcgcact gttggggcac tgaagttcga taccaggtcg taggcgtact  38400

gagcggtgtc ggcatcataa ctctcgcgca ggcgaacgta ctcccacaat gaggcgttaa  38460

cgacggcctc ctcttgagtt gcaggcaatc gcgagacaga cacctcgctg tcaacggtgc  38520

cgtccggccg tatccataga tatacgggca caagcctgct caacggcacc attgtggcta  38580

tagcgaacgc ttgagcaaca tttcccaaaa tcgcgatagc tgcgacagct gcaatgagtt  38640

tggagagacg tcgcgccgat ttcgctcgcg cggtttgaaa ggcttctact tccttatagt  38700

gctcggcaag gctttcgcgc gccactagca tggcatattc aggccccgtc atagcgtcca  38760

cccgaattgc cgagctgaag atctgacgga gtaggctgcc atcgccccac attcagcggg  38820

aagatcgggc ctttgcagct cgctaatgtg tcgtttgtct ggcagccgct caaagcgaca  38880

actaggcaca gcaggcaata cttcatagaa ttctccattg aggcgaattt ttgcgcgacc  38940

tagcctcgct caacctgagc gaagcgacgg tacaagctgc tggcagattg ggttgcgccg  39000

ctccagtaac tgcctccaat gttgccggcg atcgccggca aagcgacaat gagcgcatcc  39060

cctgtcagaa aaaacatatc gagttcgtaa agaccaatga tcttggccgc ggtcgtaccg  39120

gcgaaggtga ttacaccaag cataagggtg agcgcagtcg cttcggttag gatgacgatc  39180

gttgccacga ggtttaagag gagaagcaag agaccgtagg tgataagttg cccgatccac  39240

ttagctgcga tgtcccgcgt gcgatcaaaa atatatccga cgaggatcag aggcccgatc  39300

gcgagaagca ctttcgtgag aattccaacg gcgtcgtaaa ctccgaaggc agaccagagc  39360

gtgccgtaaa ggacccactg tgccccttgg aaagcaagga tgtcctggtc gttcatcgga  39420

ccgatttcgg atgcgatttt ctgaaaaacg gcctgggtca cggcgaacat tgtatccaac  39480

tgtgccggaa cagtctgcag aggcaagccg gttacactaa actgctgaac aaagtttggg  39540

accgtctttt cgaagatgga aaccacatag tcttggtagt tagcctgccc aacaattaga  39600

gcaacaacga tggtgaccgt gatcacccga gtgataccgc tacgggtatc gacttcgccg  39660

cgtatgacta aaataccctg aacaataatc caaagagtga cacaggcgat caatggcgca  39720

ctcaccgcct cctggatagt ctcaagcatc gagtccaagc ctgtcgtgaa ggctacatcg  39780

aagatcgtat gaatggccgt aaacggcgcc ggaatcgtga aattcatcga ttggacctga  39840

acttgactgg tttgtcgcat aatgttggat aaaatgagct cgcattcggc gaggatgcgg  39900

gcggatgaac aaatcgccca gccttagggg agggcaccaa agatgacagc ggtcttttga  39960

tgctccttgc gttgagcggc cgcctcttcc gcctcgtgaa ggccggcctg cgcggtagtc  40020

atcgttaata ggcttgtcgc ctgtacattt tgaatcattg cgtcatggat ctgcttgaga  40080

agcaaaccat tggtcacggt tgcctgcatg atattgcgag atcgggaaag ctgagcagac  40140

gtatcagcat tcgccgtcaa gcgtttgtcc atcgtttcca gattgtcagc cgcaatgcca  40200

gcgctgtttg cggaaccggt gatctgcgat cgcaacaggt ccgcttcagc atcactaccc  40260

acgactgcac gatctgtatc gctggtgatc gcacgtgccg tggtcgacat tggcattcgc  40320

ggcgaaaaca tttcattgtc taggtccttc gtcgaaggat actgattttt ctggttgagc  40380

gaagtcagta gtccagtaac gccgtaggcc gacgtcaaca tcgtaaccat cgctatagtc  40440

tgagtgagat tctccgcagt cgcgagcgca gtcgcgagcg tctcagcctc cgttgccggg  40500

tcgctaacaa caaactgcgc ccgcgcgggc tgaatatata gaaagctgca ggtcaaaact  40560

gttgcaataa gttgcgtcgt cttcatcgtt tcctacctta tcaatcttct gcctcgtggt  40620

gacgggccat gaattcgctg agccagccag atgagttgcc ttcttgtgcc tcgcgtagtc  40680

gagttgcaaa gcgcaccgtg ttggcacgcc ccgaaagcac ggcgacatat tcacgcatat  40740

cccgcagatc aaattcgcag atgacgcttc cactttctcg tttaagaaga aacttacggc  40800

tgccgaccgt catgtcttca cggatcgcct gaaattcctt ttcggtacat ttcagtccat  40860

cgacataagc cgatcgatct gcggttggtg atggatagaa aatcttcgtc atacattgcg  40920

caaccaagct ggctcctagc ggcgattcca gaacatgctc tggttgctgc gttgccagta  40980

ttagcatccc gttgtttttt cgaacggtca ggaggaattt gtcgacgaca gtcgaaaatt  41040

tagggtttaa caaataggcg cgaaactcat cgcagctcat cacaaaacgg cggccgtcga  41100

tcatggctcc aatccgatgc aggagatatg ctgcagcggg agcgcatact tcctcgtatt  41160

cgagaagatg cgtcatgtcg aagccggtaa tcgacggatc taactttact tcgtcaactt  41220

cgccgtcaaa tgcccagcca agcgcatggc cccggcacca gcgttggagc cgcgctcctg  41280

cgccttcggc gggcccatgc aacaaaaatt cacgtaaccc cgcgattgaa cgcatttgtg  41340

gatcaaacga gagctgacga tggataccac ggaccagacg gcggttctct tccggagaaa  41400

tcccaccccg accatcactc tcgatgagag ccacgatcca ttcgcgcaga aaatcgtgtg  41460

aggctgctgt gttttctagg ccacgcaacg gcgccaaccc gctgggtgtg cctctgtgaa  41520

gtgccaaata tgttcctcct gtggcgcgaa ccagcaattc gccaccccgg tccttgtcaa  41580

agaacacgac cgtacctgca cggtcgacca tgctctgttc gagcatggct agaacaaaca  41640

tcatgagcgt cgtcttaccc ctcccgatag gcccgaatat tgccgtcatg ccaacatcgt  41700

gctcatgcgg gatatagtcg aaaggcgttc cgccattggt acgaaatcgg gcaatcgcgt  41760

tgccccagtg gcctgagctg gcgccctctg gaaagttttc gaaagagaca aaccctgcga  41820

aattgcgtga agtgattgcg ccagggcgtg tgcgccactt aaaattcccc ggcaattggg  41880

accaataggc cgcttccata ccaatacctt cttggacaac cacggcacct gcatccgcca  41940

ttcgtgtccg agcccgcgcg cccctgtccc caagactatt gagatcgtct gcatagacgc  42000

aaaggctcaa atgatgtgag cccataacga attcgttgct cgcaagtgcg tcctcagcct  42060

cggataattt gccgatttga gtcacggctt tatcgccgga actcagcatc tggctcgatt  42120

tgaggctaag tttcgcgtgc gcttgcgggc gagtcaggaa cgaaaaactc tgcgtgagaa  42180

caagtggaaa atcgagggat agcagcgcgt tgagcatgcc cggccgtgtt tttgcagggt  42240

attcgcgaaa cgaatagatg gatccaacgt aactgtcttt tggcgttctg atctcgagtc  42300

ctcgcttgcc gcaaatgact ctgtcggtat aaatcgaagc gccgagtgag ccgctgacga  42360

ccggaaccgg tgtgaaccga ccagtcatga tcaaccgtag cgcttcgcca atttcggtga  42420

agagcacacc ctgcttctcg cggatgccaa gacgatgcag gccatacgct ttaagagagc  42480

cagcgacaac atgccaaaga tcttccatgt tcctgatctg gcccgtgaga tcgttttccc  42540

tttttccgct tagcttggtg aacctcctct ttaccttccc taaagccgcc tgtgggtaga  42600

caatcaacgt aaggaagtgt tcattgcgga ggagttggcc ggagagcacg cgctgttcaa  42660

aagcttcgtt caggctagcg gcgaaaacac tacggaagtg tcgcggcgcc gatgatggca  42720

cgtcggcatg acgtacgagg tgagcatata ttgacacatg atcatcagcg atattgcgca  42780

acagcgtgtt gaacgcacga caacgcgcat tgcgcatttc agtttcctca agctcgaatg  42840

caacgccatc aattctcgca atggtcatga tcgatccgtc ttcaagaagg acgatatggt  42900

cgctgaggtg gccaatataa gggagataga tctcaccgga tctttcggtc gttccactcg  42960

cgccgagcat cacaccattc ctctccctcg tgggggaacc ctaattggat ttgggctaac  43020

agtagcgccc ccccaaactg cactatcaat gcttcttccc gcggtccgca aaaatagcag  43080

gacgacgctc gccgcattgt agtctcgctc cacgatgagc cgggctgcaa accataacgg  43140

cacgagaacg acttcgtaga gcgggttctg aacgataacg atgacaaagc cggcgaacat  43200

catgaataac cctgccaatg tcagtggcac cccaagaaac aatgcgggcc gtgtggctgc  43260

gaggtaaagg gtcgattctt ccaaacgatc agccatcaac taccgccagt gagcgtttgg  43320

ccgaggaagc tcgccccaaa catgataaca atgccgccga cgacgccggc aaccagccca  43380

agcgaagccc gcccgaacat ccaggagatc ccgatagcga caatgccgag aacagcgagt  43440

gactggccga acggaccaag gataaacgtg catatattgt taaccattgt ggcggggtca  43500

gtgccgccac ccgcagattg cgctgcggcg ggtccggatg aggaaatgct ccatgcaatt  43560

gcaccgcaca agcttggggc gcagctcgat atcacgcgca tcatcgcatt cgagagcgag  43620

aggcgattta gatgtaaacg gtatctctca aagcatcgca tcaatgcgca cctccttagt  43680

ataagtcgaa taagacttga ttgtcgtctg cggatttgcc gttgtcctgg tgtggcggtg  43740

gcggagcgat taaaccgcca gcgccatcct cctgcgagcg gcgctgatat gacccccaaa  43800

catcccacgt ctcttcggat tttagcgcct cgtgatcgtc ttttggaggc tcgattaacg  43860

cgggcaccag cgattgagca gctgtttcaa cttttcgcac gtagccgttt gcaaaaccgc  43920

cgatgaaatt accggtgttg taagcggaga tcgcccgacg aagcgcaaat tgcttctcgt  43980

caatcgtttc gccgcctgca taacgacttt tcagcatgtt tgcagcggca gataatgatg  44040

tgcacgcctg gagcgcaccg tcaggtgtca gaccgagcat agaaaaattt cgagagttta  44100

tttgcatgag gccaacatcc agcgaatgcc gtgcatcgag acggtgcctg acgacttggg  44160

ttgcttggct gtgatcttgc cagtgaagcg tttcgccggt cgtgttgtca tgaatcgcta  44220

aaggatcaaa gcgactctcc accttagcta tcgccgcaag cgtagatgtc gcaactgatg  44280

gggcacactt gcgagcaaca tggtcaaact cagcagatga gagtggcgtg gcaaggctcg  44340

acgaacagaa ggagaccatc aaggcaagag aaagcgaccc cgatctctta agcatacctt  44400

atctccttag ctcgcaacta acaccgcctc tcccgttgga agaagtgcgt tgttttatgt  44460

tgaagattat cgggagggtc ggttactcga aaattttcaa ttgcttcttt atgatttcaa  44520

ttgaagcgag aaacctcgcc cggcgtcttg gaacgcaaca tggaccgaga accgcgcatc  44580

catgactaag caaccggatc gacctattca ggccgcagtt ggtcaggtca ggctcagaac  44640

gaaaatgctc ggcgaggtta cgctgtctgt aaacccattc gatgaacggg aagcttcctt  44700

ccgattgctc ttggcaggaa tattggccca tgcctgcttg cgctttgcaa atgctcttat  44760

cgcgttggta tcatatgcct tgtccgccag cagaaacgca ctctaagcga ttatttgtaa  44820

aaatgtttcg gtcatgcggc ggtcatgggc ttgacccgct gtcagcgcaa gacggatcgg  44880

tcaaccgtcg gcatcgacaa cagcgtgaat cttggtggtc aaaccgccac gggaacgtcc  44940

catacagcca tcgtcttgat cccgctgttt cccgtcgccg catgttggtg gacgcggaca  45000

caggaactgt caatcatgac gacattctat cgaaagcctt ggaaatcaca ctcagaatat  45060

gatcccagac gtctgcctca cgccatcgta caaagcgatt gtagcaggtt gtacaggaac  45120

cgtatcgatc aggaacgtct gcccagggcg ggcccgtccg gaagcgccac aagatgacat  45180

tgatcacccg cgtcaacgcg cggcacgcga cgcggcttat ttgggaacaa aggactgaac  45240

aacagtccat tcgaaatcgg tgacatcaaa gcggggacgg gttatcagtg gcctccaagt  45300

caagcctcaa tgaatcaaaa tcagaccgat ttgcaaacct gatttatgag tgtgcggcct  45360

aaatgatgaa atcgtccttc tagatcgcct ccgtggtgta gcaacacctc gcagtatcgc  45420

cgtgctgacc ttggccaggg aattgactgg caagggtgct ttcacatgac cgctcttttg  45480

gccgcgatag atgatttcgt tgctgctttg ggcacgtaga aggagagaag tcatatcgga  45540

gaaattcctc ctggcgcgag agcctgctct atcgcgacgg catcccactg tcgggaacag  45600

accggatcat tcacgaggcg aaagtcgtca acacatgcgt tataggcatc ttcccttgaa  45660

ggatgatctt gttgctgcca atctggaggt gcggcagccg caggcagatg cgatctcagc  45720

gcaacttgcg gcaaaacatc tcactcacct gaaaaccact agcgagtctc gcgatcagac  45780

gaaggccttt tacttaacga cacaatatcc gatgtctgca tcacaggcgt cgctatccca  45840

gtcaatacta aagcggtgca ggaactaaag attactgatg acttaggcgt gccacgaggc  45900

ctgagacgac gcgcgtagac agttttttga aatcattatc aaagtgatgg cctccgctga  45960

agcctatcac ctctgcgccg gtctgtcgga gagatgggca agcattatta cggtcttcgc  46020

gcccgtacat gcattggacg attgcagggt caatggatct gagatcatcc agaggattgc  46080

cgcccttacc ttccgtttcg agttggagcc agcccctaaa tgagacgaca tagtcgactt  46140

gatgtgacaa tgccaagaga gagatttgct taacccgatt tttttgctca agcgtaagcc  46200

tattgaagct tgccggcatg acgtccgcgc cgaaagaata tcctacaagt aaaacattct  46260

gcacaccgaa atgcttggtg tagacatcga ttatgtgacc aagatcctta gcagtttcgc  46320

ttggggaccg ctccgaccag aaataccgaa gtgaactgac gccaatgaca ggaatccctt  46380

ccgtctgcag ataggtacca tcgatagatc tgctgcctcg cgcgtttcgg tgatgacggt  46440

gaaaacctct gacacatgca gctcccggag acggtcacag cttgtctgta agcggatgcc  46500

gggagcagac aagcccgtca gggcgcgtca gcgggtgttg gcgggtgtcg gggcgcagcc  46560

atgacccagt cacgtagcga tagcggagtg tatactggct taactatgcg gcatcagagc  46620

agattgtact gagagtgcac catatgcggt gtgaaatacc gcacagatgc gtaaggagaa  46680

aataccgcat caggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc  46740

ggctgcggcg agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag  46800

gggataacgc aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa  46860

aggccgcgtt gctggcgttt ttccataggc tccgcccccc tgacgagcat cacaaaaatc  46920

gacgctcaag tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc  46980

ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg  47040

cctttctccc ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt  47100

cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc  47160

gctgcgcctt atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc  47220

cactggcagc agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag  47280

agttcttgaa gtggtggcct aactacggct acactagaag gacagtattt ggtatctgcg  47340

ctctgctgaa gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa  47400

ccaccgctgg tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag  47460

gatctcaaga agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact  47520

cacgttaagg gattttggtc atgagattat caaaaaggat cttcacctag atccttttaa  47580

attaaaaatg aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt  47640

accaatgctt aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag  47700

ttgcctgact ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca  47760

gtgctgcaat gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc  47820

agccagccgg aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt  47880

ctattaattg ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg  47940

ttgttgccat tgctgcaggg gggggggggg ggggggactt ccattgttca ttccacggac  48000

aaaaacagag aaaggaaacg acagaggcca aaaagcctcg ctttcagcac ctgtcgtttc  48060

ctttcttttc agagggtatt ttaaataaaa acattaagtt atgacgaaga agaacggaaa  48120

cgccttaaac cggaaaattt tcataaatag cgaaaacccg cgaggtcgcc gccccgtagt  48180

cggatcaccg gaaaggaccc gtaaagtgat aatgattatc atctacatat cacaacgtgc  48240

gtggaggcca tcaaaccacg tcaaataatc aattatgacg caggtatcgt attaattgat  48300

ctgcatcaac ttaacgtaaa aacaacttca gacaatacaa atcagcgaca ctgaatacgg  48360

ggcaacctca tgtccccccc cccccccccc ctgcaggcat cgtggtgtca cgctcgtcgt  48420

ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca  48480

tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg  48540

ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat  48600

ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta  48660

tgcggcgacc gagttgctct tgcccggcgt caacacggga taataccgcg ccacatagca  48720

gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct  48780

taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat  48840

cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa  48900

agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt  48960

gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa  49020

ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccacctgac gtctaagaaa  49080

ccattattat catgacatta acctataaaa ataggcgtat cacgaggccc tttcgtcttc  49140

aagaattggt cgacgatctt gctgcgttcg gatattttcg tggagttccc gccacagacc  49200

cggattgaag gcgagatcca gcaactcgcg ccagatcatc ctgtgacgga actttggcgc  49260

gtgatgactg gccaggacgt cggccgaaag agcgacaagc agatcacgct tttcgacagc  49320

gtcggatttg cgatcgagga tttttcggcg ctgcgctacg tccgcgaccg cgttgaggga  49380

tcaagccaca gcagcccact cgaccttcta gccgacccag acgagccaag ggatcttttt  49440

ggaatgctgc tccgtcgtca ggctttccga cgtttgggtg gttgaacaga agtcattatc  49500

gtacggaatg ccaagcactc ccgaggggaa ccctgtggtt ggcatgcaca tacaaatgga  49560

cgaacggata aaccttttca cgccctttta aatatccgtt attctaataa acgctctttt  49620

ctcttaggtt tacccgccaa tatatcctgt caaacactga tagtttaaac tgaaggcggg  49680

aaacgacaat ctgatcatga gcggagaatt aagggagtca cgttatgacc cccgccgatg  49740

acgcgggaca agccgtttta cgtttggaac tgacagaacc gcaacgttga aggagccact  49800

cagcaagctg gtacgattgt aatacgactc actatagggc gaattgagcg ctgtttaaac  49860

gctcttcaac tggaagagcg gttacccgga ccgaagcttg catgcctgca g           49911

 

<210>7

<211>36909

<212>DNA

<213>人工序列

 

<220>

<223>载体

<400>7

tctagagctc gttcctcgag gcctcgaggc ctcgaggaac ggtacctgcg gggaagctta    60

caataatgtg tgttgttaag tcttgttgcc tgtcatcgtc tgactgactt tcgtcataaa    120

tcccggcctc cgtaacccag ctttgggcaa gctcacggat ttgatccggc ggaacgggaa    180

tatcgagatg ccgggctgaa cgctgcagtt ccagctttcc ctttcgggac aggtactcca    240

gctgattgat tatctgctga agggtcttgg ttccacctcc tggcacaatg cgaatgatta    300

cttgagcgcg atcgggcatc caattttctc ccgtcaggtg cgtggtcaag tgctacaagg    360

cacctttcag taacgagcga ccgtcgatcc gtcgccggga tacggacaaa atggagcgca    420

gtagtccatc gagggcggcg aaagcctcgc caaaagcaat acgttcatct cgcacagcct    480

ccagatccga tcgagggtct tcggcgtagg cagatagaag catggataca ttgcttgaga    540

gtattccgat ggactgaagt atggcttcca tcttttctcg tgtgtctgca tctatttcga    600

gaaagccccc gatgcggcgc accgcaacgc gaattgccat actatccgaa agtcccagca    660

ggcgcgcttg ataggaaaag gtttcatact cggccgatcg cagacgggca ctcacgacct    720

tgaacccttc aactttcagg gatcgatgct ggttgatggt agtctcactc gacgtggctc    780

tggtgtgttt tgacatagct tcctccaaag aaagcggaag gtctggatac tccagcacga    840

aatgtgcccg ggtagacgga tggaagtcta gccctgctca atatgaaatc aacagtacat    900

ttacagtcaa tactgaatat acttgctaca tttgcaattg tcttataacg aatgtgaaat    960

aaaaatagtg taacaacgct tttactcatc gataatcaca aaaacattta tacgaacaaa    1020

aatacaaatg cactccggtt tcacaggata ggcgggatca gaatatgcaa cttttgacgt    1080

tttgttcttt caaagggggt gctggcaaaa ccaccgcact catgggcctt tgcgctgctt    1140

tggcaaatga cggtaaacga gtggccctct ttgatgccga cgaaaaccgg cctctgacgc    1200

gatggagaga aaacgcctta caaagcagta ctgggatcct cgctgtgaag tctattccgc    1260

cgacgaaatg ccccttcttg aagcagccta tgaaaatgcc gagctcgaag gatttgatta    1320

tgcgttggcc gatacgcgtg gcggctcgag cgagctcaac aacacaatca tcgctagctc    1380

aaacctgctt ctgatcccca ccatgctaac gccgctcgac atcgatgagg cactatctac    1440

ctaccgctac gtcatcgagc tgctgttgag tgaaaatttg gcaattccta cagctgtttt    1500

gcgccaacgc gtcccggtcg gccgattgac aacatcgcaa cgcaggatgt cagagacgct    1560

agagagcctt ccagttgtac cgtctcccat gcatgaaaga gatgcatttg ccgcgatgaa    1620

agaacgcggc atgttgcatc ttacattact aaacacggga actgatccga cgatgcgcct    1680

catagagagg aatcttcgga ttgcgatgga ggaagtcgtg gtcatttcga aactgatcag    1740

caaaatcttg gaggcttgaa gatggcaatt cgcaagcccg cattgtcggt cggcgaagca    1800

cggcggcttg ctggtgctcg acccgagatc caccatccca acccgacact tgttccccag    1860

aagctggacc tccagcactt gcctgaaaaa gccgacgaga aagaccagca acgtgagcct    1920

ctcgtcgccg atcacattta cagtcccgat cgacaactta agctaactgt ggatgccctt    1980

agtccacctc cgtccccgaa aaagctccag gtttttcttt cagcgcgacc gcccgcgcct    2040

caagtgtcga aaacatatga caacctcgtt cggcaataca gtccctcgaa gtcgctacaa    2100

atgattttaa ggcgcgcgtt ggacgatttc gaaagcatgc tggcagatgg atcatttcgc    2160

gtggccccga aaagttatcc gatcccttca actacagaaa aatccgttct cgttcagacc    2220

tcacgcatgt tcccggttgc gttgctcgag gtcgctcgaa gtcattttga tccgttgggg    2280

ttggagaccg ctcgagcttt cggccacaag ctggctaccg ccgcgctcgc gtcattcttt    2340

gctggagaga agccatcgag caattggtga agagggacct atcggaaccc ctcaccaaat    2400

attgagtgta ggtttgaggc cgctggccgc gtcctcagtc accttttgag ccagataatt    2460

aagagccaaa tgcaattggc tcaggctgcc atcgtccccc cgtgcgaaac ctgcacgtcc    2520

gcgtcaaaga aataaccggc acctcttgct gtttttatca gttgagggct tgacggatcc    2580

gcctcaagtt tgcggcgcag ccgcaaaatg agaacatcta tactcctgtc gtaaacctcc    2640

tcgtcgcgta ctcgactggc aatgagaagt tgctcgcgcg atagaacgtc gcggggtttc    2700

tctaaaaacg cgaggagaag attgaactca cctgccgtaa gtttcacctc accgccagct    2760

tcggacatca agcgacgttg cctgagatta agtgtccagt cagtaaaaca aaaagaccgt    2820

cggtctttgg agcggacaac gttggggcgc acgcgcaagg caacccgaat gcgtgcaaga    2880

aactctctcg tactaaacgg cttagcgata aaatcacttg ctcctagctc gagtgcaaca    2940

actttatccg tctcctcaag gcggtcgcca ctgataatta tgattggaat atcagacttt    3000

gccgccagat ttcgaacgat ctcaagccca tcttcacgac ctaaatttag atcaacaacc    3060

acgacatcga ccgtcgcgga agagagtact ctagtgaact gggtgctgtc ggctaccgcg    3120

gtcactttga aggcgtggat cgtaaggtat tcgataataa gatgccgcat agcgacatcg    3180

tcatcgataa gaagaacgtg tttcaacggc tcacctttca atctaaaatc tgaacccttg    3240

ttcacagcgc ttgagaaatt ttcacgtgaa ggatgtacaa tcatctccag ctaaatgggc    3300

agttcgtcag aattgcggct gaccgcggat gacgaaaatg cgaaccaagt atttcaattt    3360

tatgacaaaa gttctcaatc gttgttacaa gtgaaacgct tcgaggttac agctactatt    3420

gattaaggag atcgcctatg gtctcgcccc ggcgtcgtgc gtccgccgcg agccagatct    3480

cgcctacttc ataaacgtcc tcataggcac ggaatggaat gatgacatcg atcgccgtag    3540

agagcatgtc aatcagtgtg cgatcttcca agctagcacc ttgggcgcta cttttgacaa    3600

gggaaaacag tttcttgaat ccttggattg gattcgcgcc gtgtattgtt gaaatcgatc    3660

ccggatgtcc cgagacgact tcactcagat aagcccatgc tgcatcgtcg cgcatctcgc    3720

caagcaatat ccggtccggc cgcatacgca gacttgcttg gagcaagtgc tcggcgctca    3780

cagcacccag cccagcaccg ttcttggagt agagtagtct aacatgatta tcgtgtggaa    3840

tgacgagttc gagcgtatct tctatggtga ttagcctttc ctgggggggg atggcgctga    3900

tcaaggtctt gctcattgtt gtcttgccgc ttccggtagg gccacatagc aacatcgtca    3960

gtcggctgac gacgcatgcg tgcagaaacg cttccaaatc cccgttgtca aaatgctgaa    4020

ggatagcttc atcatcctga ttttggcgtt tccttcgtgt ctgccactgg ttccacctcg    4080

aagcatcata acgggaggag acttctttaa gaccagaaac acgcgagctt ggccgtcgaa    4140

tggtcaagct gacggtgccc gagggaacgg tcggcggcag acagatttgt agtcgttcac    4200

caccaggaag ttcagtggcg cagagggggt tacgtggtcc gacatcctgc tttctcagcg    4260

cgcccgctaa aatagcgata tcttcaagat catcataaga gacgggcaaa ggcatcttgg    4320

taaaaatgcc ggcttggcgc acaaatgcct ctccaggtcg attgatcgca atttcttcag    4380

tcttcgggtc atcgagccat tccaaaatcg gcttcagaag aaagcgtagt tgcggatcca    4440

cttccattta caatgtatcc tatctctaag cggaaatttg aattcattaa gagcggcggt    4500

tcctcccccg cgtggcgccg ccagtcaggc ggagctggta aacaccaaag aaatcgaggt    4560

cccgtgctac gaaaatggaa acggtgtcac cctgattctt cttcagggtt ggcggtatgt    4620

tgatggttgc cttaagggct gtctcagttg tctgctcacc gttattttga aagctgttga    4680

agctcatccc gccacccgag ctgccggcgt aggtgctagc tgcctggaag gcgccttgaa    4740

caacactcaa gagcatagct ccgctaaaac gctgccagaa gtggctgtcg accgagcccg    4800

gcaatcctga gcgaccgagt tcgtccgcgc ttggcgatgt taacgagatc atcgcatggt    4860

caggtgtctc ggcgcgatcc cacaacacaa aaacgcgccc atctccctgt tgcaagccac    4920

gctgtatttc gccaacaacg gtggtgccac gatcaagaag cacgatattg ttcgttgttc    4980

cacgaatatc ctgaggcaag acacacttta catagcctgc caaatttgtg tcgattgcgg    5040

tttgcaagat gcacggaatt attgtccctt gcgttaccat aaaatcgggg tgcggcaaga    5100

gcgtggcgct gctgggctgc agctcggtgg gtttcatacg tatcgacaaa tcgttctcgc    5160

cggacacttc gccattcggc aaggagttgt cgtcacgctt gccttcttgt cttcggcccg    5220

tgtcgccctg aatggcgcgt ttgctgaccc cttgatcgcc gctgctatat gcaaaaatcg    5280

gtgtttcttc cggccgtggc tcatgccgct ccggttcgcc cctcggcggt agaggagcag    5340

caggctgaac agcctcttga accgctggag gatccggcgg cacctcaatc ggagctggat    5400

gaaatggctt ggtgtttgtt gcgatcaaag ttgacggcga tgcgttctca ttcaccttct    5460

tttggcgccc acctagccaa atgaggctta atgataacgc gagaacgaca cctccgacga    5520

tcaatttctg agaccccgaa agacgccggc gatgtttgtc ggagaccagg gatccagatg    5580

catcaacctc atgtgccgct tgctgactat cgttattcat cccttcgccc ccttcaggac    5640

gcgtttcaca tcgggcctca ccgtgcccgt ttgcggcctt tggccaacgg gatcgtaagc    5700

ggtgttccag atacatagta ctgtgtggcc atccctcaga cgccaacctc gggaaaccga    5760

agaaatctcg acatcgctcc ctttaactga atagttggca acagcttcct tgccatcagg    5820

attgatggtg tagatggagg gtatgcgtac attgcccgga aagtggaata ccgtcgtaaa    5880

tccattgtcg aagacttcga gtggcaacag cgaacgatcg ccttgggcga cgtagtgcca    5940

attactgtcc gccgcaccaa gggctgtgac aggctgatcc aataaattct cagctttccg    6000

ttgatattgt gcttccgcgt gtagtctgtc cacaacagcc ttctgttgtg cctcccttcg    6060

ccgagccgcc gcatcgtcgg cggggtaggc gaattggacg ctgtaataga gatcgggctg    6120

ctctttatcg aggtgggaca gagtcttgga acttatactg aaaacataac ggcgcatccc    6180

ggagtcgctt gcggttagca cgattactgg ctgaggcgtg aggacctggc ttgccttgaa    6240

aaatagataa tttccccgcg gtagggctgc tagatctttg ctatttgaaa cggcaaccgc    6300

tgtcaccgtt tcgttcgtgg cgaatgttac gaccaaagta gctccaaccg ccgtcgagag    6360

gcgcaccact tgatcgggat tgtaagccaa ataacgcatg cgcggatcta gcttgcccgc    6420

cattggagtg tcttcagcct ccgcaccagt cgcagcggca aataaacatg ctaaaatgaa    6480

aagtgctttt ctgatcatgg ttcgctgtgg cctacgtttg aaacggtatc ttccgatgtc    6540

tgataggagg tgacaaccag acctgccggg ttggttagtc tcaatctgcc gggcaagctg    6600

gtcacctttt cgtagcgaac tgtcgcggtc cacgtactca ccacaggcat tttgccgtca    6660

acgacgaggg tccttttata gcgaatttgc tgcgtgcttg gagttacatc atttgaagcg    6720

atgtgctcga cctccaccct gccgcgtttg ccaagaatga cttgaggcga actgggattg    6780

ggatagttga agaattgctg gtaatcctgg cgcactgttg gggcactgaa gttcgatacc    6840

aggtcgtagg cgtactgagc ggtgtcggca tcataactct cgcgcaggcg aacgtactcc    6900

cacaatgagg cgttaacgac ggcctcctct tgagttgcag gcaatcgcga gacagacacc    6960

tcgctgtcaa cggtgccgtc cggccgtatc catagatata cgggcacaag cctgctcaac    7020

ggcaccattg tggctatagc gaacgcttga gcaacatttc ccaaaatcgc gatagctgcg    7080

acagctgcaa tgagtttgga gagacgtcgc gccgatttcg ctcgcgcggt ttgaaaggct    7140

tctacttcct tatagtgctc ggcaaggctt tcgcgcgcca ctagcatggc atattcaggc    7200

cccgtcatag cgtccacccg aattgccgag ctgaagatct gacggagtag gctgccatcg    7260

ccccacattc agcgggaaga tcgggccttt gcagctcgct aatgtgtcgt ttgtctggca    7320

gccgctcaaa gcgacaacta ggcacagcag gcaatacttc atagaattct ccattgaggc    7380

gaatttttgc gcgacctagc ctcgctcaac ctgagcgaag cgacggtaca agctgctggc    7440

agattgggtt gcgccgctcc agtaactgcc tccaatgttg ccggcgatcg ccggcaaagc    7500

gacaatgagc gcatcccctg tcagaaaaaa catatcgagt tcgtaaagac caatgatctt    7560

ggccgcggtc gtaccggcga aggtgattac accaagcata agggtgagcg cagtcgcttc    7620

ggttaggatg acgatcgttg ccacgaggtt taagaggaga agcaagagac cgtaggtgat    7680

aagttgcccg atccacttag ctgcgatgtc ccgcgtgcga tcaaaaatat atccgacgag    7740

gatcagaggc ccgatcgcga gaagcacttt cgtgagaatt ccaacggcgt cgtaaactcc    7800

gaaggcagac cagagcgtgc cgtaaaggac ccactgtgcc ccttggaaag caaggatgtc    7860

ctggtcgttc atcggaccga tttcggatgc gattttctga aaaacggcct gggtcacggc    7920

gaacattgta tccaactgtg ccggaacagt ctgcagaggc aagccggtta cactaaactg    7980

ctgaacaaag tttgggaccg tcttttcgaa gatggaaacc acatagtctt ggtagttagc    8040

ctgcccaaca attagagcaa caacgatggt gaccgtgatc acccgagtga taccgctacg    8100

ggtatcgact tcgccgcgta tgactaaaat accctgaaca ataatccaaa gagtgacaca    8160

ggcgatcaat ggcgcactca ccgcctcctg gatagtctca agcatcgagt ccaagcctgt    8220

cgtgaaggct acatcgaaga tcgtatgaat ggccgtaaac ggcgccggaa tcgtgaaatt    8280

catcgattgg acctgaactt gactggtttg tcgcataatg ttggataaaa tgagctcgca    8340

ttcggcgagg atgcgggcgg atgaacaaat cgcccagcct taggggaggg caccaaagat    8400

gacagcggtc ttttgatgct ccttgcgttg agcggccgcc tcttccgcct cgtgaaggcc    8460

ggcctgcgcg gtagtcatcg ttaataggct tgtcgcctgt acattttgaa tcattgcgtc    8520

atggatctgc ttgagaagca aaccattggt cacggttgcc tgcatgatat tgcgagatcg    8580

ggaaagctga gcagacgtat cagcattcgc cgtcaagcgt ttgtccatcg tttccagatt    8640

gtcagccgca atgccagcgc tgtttgcgga accggtgatc tgcgatcgca acaggtccgc    8700

ttcagcatca ctacccacga ctgcacgatc tgtatcgctg gtgatcgcac gtgccgtggt    8760

cgacattggc attcgcggcg aaaacatttc attgtctagg tccttcgtcg aaggatactg    8820

atttttctgg ttgagcgaag tcagtagtcc agtaacgccg taggccgacg tcaacatcgt    8880

aaccatcgct atagtctgag tgagattctc cgcagtcgcg agcgcagtcg cgagcgtctc    8940

agcctccgtt gccgggtcgc taacaacaaa ctgcgcccgc gcgggctgaa tatatagaaa    9000

gctgcaggtc aaaactgttg caataagttg cgtcgtcttc atcgtttcct accttatcaa    9060

tcttctgcct cgtggtgacg ggccatgaat tcgctgagcc agccagatga gttgccttct    9120

tgtgcctcgc gtagtcgagt tgcaaagcgc accgtgttgg cacgccccga aagcacggcg    9180

acatattcac gcatatcccg cagatcaaat tcgcagatga cgcttccact ttctcgttta    9240

agaagaaact tacggctgcc gaccgtcatg tcttcacgga tcgcctgaaa ttccttttcg    9300

gtacatttca gtccatcgac ataagccgat cgatctgcgg ttggtgatgg atagaaaatc    9360

ttcgtcatac attgcgcaac caagctggct cctagcggcg attccagaac atgctctggt    9420

tgctgcgttg ccagtattag catcccgttg ttttttcgaa cggtcaggag gaatttgtcg    9480

acgacagtcg aaaatttagg gtttaacaaa taggcgcgaa actcatcgca gctcatcaca    9540

aaacggcggc cgtcgatcat ggctccaatc cgatgcagga gatatgctgc agcgggagcg    9600

catacttcct cgtattcgag aagatgcgtc atgtcgaagc cggtaatcga cggatctaac    9660

tttacttcgt caacttcgcc gtcaaatgcc cagccaagcg catggccccg gcaccagcgt    9720

tggagccgcg ctcctgcgcc ttcggcgggc ccatgcaaca aaaattcacg taaccccgcg    9780

attgaacgca tttgtggatc aaacgagagc tgacgatgga taccacggac cagacggcgg    9840

ttctcttccg gagaaatccc accccgacca tcactctcga tgagagccac gatccattcg    9900

cgcagaaaat cgtgtgaggc tgctgtgttt tctaggccac gcaacggcgc caacccgctg    9960

ggtgtgcctc tgtgaagtgc caaatatgtt cctcctgtgg cgcgaaccag caattcgcca    10020

ccccggtcct tgtcaaagaa cacgaccgta cctgcacggt cgaccatgct ctgttcgagc    10080

atggctagaa caaacatcat gagcgtcgtc ttacccctcc cgataggccc gaatattgcc    10140

gtcatgccaa catcgtgctc atgcgggata tagtcgaaag gcgttccgcc attggtacga    10200

aatcgggcaa tcgcgt tgcc ccagtggcctgagctggcgc cctctggaaa gttttcgaaa    10260

gagacaaacc ctgcgaaatt gcgtgaagtg attgcgccag ggcgtgtgcg ccacttaaaa    10320

ttccccggca attgggacca ataggccgct tccataccaa taccttcttg gacaaccacg    10380

gcacctgcat ccgccattcg tgtccgagcc cgcgcgcccc tgtccccaag actattgaga  10440

tcgtctgcat agacgcaaag gctcaaatga tgtgagccca taacgaattc gttgctcgca  10500

agtgcgtcct cagcctcgga taatttgccg atttgagtca cggctttatc gccggaactc  10560

agcatctggc tcgatttgag gctaagtttc gcgtgcgctt gcgggcgagt caggaacgaa  10620

aaactctgcg tgagaacaag tggaaaatcg agggatagca gcgcgttgag catgcccggc  10680

cgtgtttttg cagggtattc gcgaaacgaa tagatggatc caacgtaact gtcttttggc  10740

gttctgatct cgagtcctcg cttgccgcaa atgactctgt cggtataaat cgaagcgccg  10800

agtgagccgc tgacgaccgg aaccggtgtg aaccgaccag tcatgatcaa ccgtagcgct  10860

tcgccaattt cggtgaagag cacaccctgc ttctcgcgga tgccaagacg atgcaggcca  10920

tacgctttaa gagagccagc gacaacatgc caaagatctt ccatgttcct gatctggccc  10980

gtgagatcgt tttccctttt tccgcttagc ttggtgaacc tcctctttac cttccctaaa  11040

gccgcctgtg ggtagacaat caacgtaagg aagtgttcat tgcggaggag ttggccggag  11100

agcacgcgct gttcaaaagc ttcgttcagg ctagcggcga aaacactacg gaagtgtcgc  11160

ggcgccgatg atggcacgtc ggcatgacgt acgaggtgag catatattga cacatgatca  11220

tcagcgatat tgcgcaacag cgtgttgaac gcacgacaac gcgcattgcg catttcagtt  11280

tcctcaagct cgaatgcaac gccatcaatt ctcgcaatgg tcatgatcga tccgtcttca  11340

agaaggacga tatggtcgct gaggtggcca atataaggga gatagatctc accggatctt  11400

tcggtcgttc cactcgcgcc gagcatcaca ccattcctct ccctcgtggg ggaaccctaa  11460

ttggatttgg gctaacagta gcgccccccc aaactgcact atcaatgctt cttcccgcgg  11520

tccgcaaaaa tagcaggacg acgctcgccg cattgtagtc tcgctccacg atgagccggg  11580

ctgcaaacca taacggcacg agaacgactt cgtagagcgg gttctgaacg ataacgatga  11640

caaagccggc gaacatcatg aataaccctg ccaatgtcag tggcacccca agaaacaatg  11700

cgggccgtgt ggctgcgagg taaagggtcg attcttccaa acgatcagcc atcaactacc  11760

gccagtgagc gtttggccga ggaagctcgc cccaaacatg ataacaatgc cgccgacgac  11820

gccggcaacc agcccaagcg aagcccgccc gaacatccag gagatcccga tagcgacaat  11880

gccgagaaca gcgagtgact ggccgaacgg accaaggata aacgtgcata tattgttaac  11940

cattgtggcg gggtcagtgc cgccacccgc agattgcgct gcggcgggtc cggatgagga  12000

aatgctccat gcaattgcac cgcacaagct tggggcgcag ctcgatatca cgcgcatcat  12060

cgcattcgag agcgagaggc gatttagatg taaacggtat ctctcaaagc atcgcatcaa  12120

tgcgcacctc cttagtataa gtcgaataag acttgattgt cgtctgcgga tttgccgttg  12180

tcctggtgtg gcggtggcgg agcgattaaa ccgccagcgc catcctcctg cgagcggcgc  12240

tgatatgacc cccaaacatc ccacgtctct tcggatttta gcgcctcgtg atcgtctttt  12300

ggaggctcga ttaacgcggg caccagcgat tgagcagctg tttcaacttt tcgcacgtag  12360

ccgtttgcaa aaccgccgat gaaattaccg gtgttgtaag cggagatcgc ccgacgaagc  12420

gcaaattgct tctcgtcaat cgtttcgccg cctgcataac gacttttcag catgtttgca  12480

gcggcagata atgatgtgca cgcctggagc gcaccgtcag gtgtcagacc gagcatagaa  12540

aaatttcgag agtttatttg catgaggcca acatccagcg aatgccgtgc atcgagacgg  12600

tgcctgacga cttgggttgc ttggctgtga tcttgccagt gaagcgtttc gccggtcgtg  12660

ttgtcatgaa tcgctaaagg atcaaagcga ctctccacct tagctatcgc cgcaagcgta  12720

gatgtcgcaa ctgatggggc acacttgcga gcaacatggt caaactcagc agatgagagt  12780

ggcgtggcaa ggctcgacga acagaaggag accatcaagg caagagaaag cgaccccgat  12840

ctcttaagca taccttatct ccttagctcg caactaacac cgcctctccc gttggaagaa  12900

gtgcgttgtt ttatgttgaa gattatcggg agggtcggtt actcgaaaat tttcaattgc  12960

ttctttatga tttcaattga agcgagaaac ctcgcccggc gtcttggaac gcaacatgga  13020

ccgagaaccg cgcatccatg actaagcaac cggatcgacc tattcaggcc gcagttggtc  13080

aggtcaggct cagaacgaaa atgctcggcg aggttacgct gtctgtaaac ccattcgatg  13140

aacgggaagc ttccttccga ttgctcttgg caggaatatt ggcccatgcc tgcttgcgct  13200

ttgcaaatgc tcttatcgcg ttggtatcat atgccttgtc cgccagcaga aacgcactct  13260

aagcgattat ttgtaaaaat gtttcggtca tgcggcggtc atgggcttga cccgctgtca  13320

gcgcaagacg gatcggtcaa ccgtcggcat cgacaacagc gtgaatcttg gtggtcaaac  13380

cgccacggga acgtcccata cagccatcgt cttgatcccg ctgtttcccg tcgccgcatg  13440

ttggtggacg cggacacagg aactgtcaat catgacgaca ttctatcgaa agccttggaa  13500

atcacactca gaatatgatc ccagacgtct gcctcacgcc atcgtacaaa gcgattgtag  13560

caggttgtac aggaaccgta tcgatcagga acgtctgccc agggcgggcc cgtccggaag  13620

cgccacaaga tgacattgat cacccgcgtc aacgcgcggc acgcgacgcg gcttatttgg  13680

gaacaaagga ctgaacaaca gtccattcga aatcggtgac atcaaagcgg ggacgggtta  13740

tcagtggcct ccaagtcaag cctcaatgaa tcaaaatcag accgatttgc aaacctgatt  13800

tatgagtgtg cggcctaaat gatgaaatcg tccttctaga tcgcctccgt ggtgtagcaa  13860

cacctcgcag tatcgccgtg ctgaccttgg ccagggaatt gactggcaag ggtgctttca    13920

catgaccgct cttttggccg cgatagatga tttcgttgct gctttgggca cgtagaagga    13980

gagaagtcat atcggagaaa ttcctcctgg cgcgagagcc tgctctatcg cgacggcatc    14040

ccactgtcgg gaacagaccg gatcattcac gaggcgaaag tcgtcaacac atgcgttata    14100

ggcatcttcc cttgaaggat gatcttgttg ctgccaatct ggaggtgcgg cagccgcagg    14160

cagatgcgat ctcagcgcaa cttgcggcaa aacatctcac tcacctgaaa accactagcg    14220

agtctcgcga tcagacgaag gccttttact taacgacaca atatccgatg tctgcatcac    14280

aggcgtcgct atcccagtca atactaaagc ggtgcaggaa ctaaagatta ctgatgactt    14340

aggcgtgcca cgaggcctga gacgacgcgc gtagacagtt ttttgaaatc attatcaaag    14400

tgatggcctc cgctgaagcc tatcacctct gcgccggtct gtcggagaga tgggcaagca    14460

ttattacggt cttcgcgccc gtacatgcat tggacgattg cagggtcaat ggatctgaga    14520

tcatccagag gattgccgcc cttaccttcc gtttcgagtt ggagccagcc cctaaatgag    14580

acgacatagt cgacttgatg tgacaatgcc aagagagaga tttgcttaac ccgatttttt    14640

tgctcaagcg taagcctatt gaagcttgcc ggcatgacgt ccgcgccgaa agaatatcct    14700

acaagtaaaa cattctgcac accgaaatgc ttggtgtaga catcgattat gtgaccaaga    14760

tccttagcag tttcgcttgg ggaccgctcc gaccagaaat accgaagtga actgacgcca    14820

atgacaggaa tcccttccgt ctgcagatag gtaccatcga tagatctgct gcctcgcgcg    14880

tttcggtgat gacggtgaaa acctctgaca catgcagctc ccggagacgg tcacagcttg    14940

tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg    15000

gtgtcggggc gcagccatga cccagtcacg tagcgatagc ggagtgtata ctggcttaac    15060

tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga aataccgcac    15120

agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct cactgactcg    15180

ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg    15240

ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag    15300

gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac    15360

gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga    15420

taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt    15480

accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc    15540

tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc    15600

cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta  15660

agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat  15720

gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca  15780

gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct  15840

tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt  15900

acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct  15960

cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc  16020

acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa  16080

acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta  16140

tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc  16200

ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat  16260

ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta  16320

tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt  16380

aatagtttgc gcaacgttgt tgccattgct gcaggggggg gggggggggg gttccattgt  16440

tcattccacg gacaaaaaca gagaaaggaa acgacagagg ccaaaaagct cgctttcagc  16500

acctgtcgtt tcctttcttt tcagagggta ttttaaataa aaacattaag ttatgacgaa  16560

gaagaacgga aacgccttaa accggaaaat tttcataaat agcgaaaacc cgcgaggtcg  16620

ccgccccgta acctgtcgga tcaccggaaa ggacccgtaa agtgataatg attatcatct  16680

acatatcaca acgtgcgtgg aggccatcaa accacgtcaa ataatcaatt atgacgcagg  16740

tatcgtatta attgatctgc atcaacttaa cgtaaaaaca acttcagaca atacaaatca  16800

gcgacactga atacggggca acctcatgtc cccccccccc ccccccctgc aggcatcgtg  16860

gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga  16920

gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt  16980

gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct  17040

cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca  17100

ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaac acgggataat  17160

accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga  17220

aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc  17280

aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg  17340

caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc  17400

ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt  17460

gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca  17520

cctgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg  17580

aggccctttc gtcttcaaga attcggagct tttgccattc tcaccggatt cagtcgtcac  17640

tcatggtgat ttctcacttg ataaccttat ttttgacgag gggaaattaa taggttgtat  17700

tgatgttgga cgagtcggaa tcgcagaccg ataccaggat cttgccatcc tatggaactg  17760

cctcggtgag ttttctcctt cattacagaa acggcttttt caaaaatatg gtattgataa  17820

tcctgatatg aataaattgc agtttcattt gatgctcgat gagtttttct aatcagaatt  17880

ggttaattgg ttgtaacact ggcagagcat tacgctgact tgacgggacg gcggctttgt  17940

tgaataaatc gaacttttgc tgagttgaag gatcagatca cgcatcttcc cgacaacgca  18000

gaccgttccg tggcaaagca aaagttcaaa atcaccaact ggtccaccta caacaaagct  18060

ctcatcaacc gtggctccct cactttctgg ctggatgatg gggcgattca ggcctggtat  18120

gagtcagcaa caccttcttc acgaggcaga cctcagcgcc agaaggccgc cagagaggcc  18180

gagcgcggcc gtgaggcttg gacgctaggg cagggcatga aaaagcccgt agcgggctgc  18240

tacgggcgtc tgacgcggtg gaaaggggga ggggatgttg tctacatggc tctgctgtag  18300

tgagtgggtt gcgctccggc agcggtcctg atcaatcgtc accctttctc ggtccttcaa  18360

cgttcctgac aacgagcctc cttttcgcca atccatcgac aatcaccgcg agtccctgct  18420

cgaacgctgc gtccggaccg gcttcgtcga aggcgtctat cgcggcccgc aacagcggcg  18480

agagcggagc ctgttcaacg gtgccgccgc gctcgccggc atcgctgtcg ccggcctgct  18540

cctcaagcac ggccccaaca gtgaagtagc tgattgtcat cagcgcattg acggcgtccc  18600

cggccgaaaa acccgcctcg cagaggaagc gaagctgcgc gtcggccgtt tccatctgcg  18660

gtgcgcccgg tcgcgtgccg gcatggatgc gcgcgccatc gcggtaggcg agcagcgcct  18720

gcctgaagct gcgggcattc ccgatcagaa atgagcgcca gtcgtcgtcg gctctcggca  18780

ccgaatgcgt atgattctcc gccagcatgg cttcggccag tgcgtcgagc agcgcccgct  18840

tgttcctgaa gtgccagtaa agcgccggct gctgaacccc caaccgttcc gccagtttgc  18900

gtgtcgtcag accgtctacg ccgacctcgt tcaacaggtc cagggcggca cggatcactg  18960

tattcggctg caactttgtc atgcttgaca ctttatcact gataaacata atatgtccac  19020

caacttatca gtgataaaga atccgcgcgt tcaatcggac cagcggaggc tggtccggag  19080

gccagacgtg aaacccaaca tacccctgat cgtaattctg agcactgtcg cgctcgacgc  19140

tgtcggcatc ggcctgatta tgccggtgct gccgggcctc ctgcgcgatc tggttcactc  19200

gaacgacgtc accgcccact atggcattct gctggcgctg tatgcgttgg tgcaatttgc  19260

ctgcgcacct gtgctgggcg cgctgtcgga tcgtttcggg cggcggccaa tcttgctcgt  19320

ctcgctggcc ggcgccactg tcgactacgc catcatggcg acagcgcctt tcctttgggt  19380

tctctatatc gggcggatcg tggccggcat caccggggcg actggggcgg tagccggcgc  19440

ttatattgcc gatatcactg atggcgatga gcgcgcgcgg cacttcggct tcatgagcgc  19500

ctgtttcggg ttcgggatgg tcgcgggacc tgtgctcggt gggctgatgg gcggtttctc  19560

cccccacgct ccgttcttcg ccgcggcagc cttgaacggc ctcaatttcc tgacgggctg  19620

tttccttttg ccggagtcgc acaaaggcga acgccggccg ttacgccggg aggctctcaa  19680

cccgctcgct tcgttccggt gggcccgggg catgaccgtc gtcgccgccc tgatggcggt  19740

cttcttcatc atgcaacttg tcggacaggt gccggccgcg ctttgggtca ttttcggcga  19800

ggatcgcttt cactgggacg cgaccacgat cggcatttcg cttgccgcat ttggcattct  19860

gcattcactc gcccaggcaa tgatcaccgg ccctgtagcc gcccggctcg gcgaaaggcg  19920

ggcactcatg ctcggaatga ttgccgacgg cacaggctac atcctgcttg ccttcgcgac  19980

acggggatgg atggcgttcc cgatcatggt cctgcttgct tcgggtggca tcggaatgcc  20040

ggcgctgcaa gcaatgttgt ccaggcaggt ggatgaggaa cgtcaggggc agctgcaagg  20100

ctcactggcg gcgctcacca gcctgacctc gatcgtcgga cccctcctct tcacggcgat  20160

ctatgcggct tctataacaa cgtggaacgg gtgggcatgg attgcaggcg ctgccctcta  20220

cttgctctgc ctgccggcgc tgcgtcgcgg gctttggagc ggcgcagggc aacgagccga  20280

tcgctgatcg tggaaacgat aggcctatgc catgcgggtc aaggcgactt ccggcaagct  20340

atacgcgccc taggagtgcg gttggaacgt tggcccagcc agatactccc gatcacgagc  20400

aggacgccga tgatttgaag cgcactcagc gtctgatcca agaacaacca tcctagcaac  20460

acggcggtcc ccgggctgag aaagcccagt aaggaaacaa ctgtaggttc gagtcgcgag  20520

atcccccgga accaaaggaa gtaggttaaa cccgctccga tcaggccgag ccacgccagg  20580

ccgagaacat tggttcctgt aggcatcggg attggcggat caaacactaa agctactgga  20640

acgagcagaa gtcctccggc cgccagttgc caggcggtaa aggtgagcag aggcacggga  20700

ggttgccact tgcgggtcag cacggttccg aacgccatgg aaaccgcccc cgccaggccc  20760

gctgcgacgc cgacaggatc tagcgctgcg tttggtgtca acaccaacag cgccacgccc  20820

gcagttccgc aaatagcccc caggaccgcc atcaatcgta tcgggctacc tagcagagcg  20880

gcagagatga acacgaccat cagcggctgc acagcgccta ccgtcgccgc gaccccgccc  20940

ggcaggcggt agaccgaaat aaacaacaag ctccagaata gcgaaatatt aagtgcgccg  21000

aggatgaaga tgcgcatcca ccagattccc gttggaatct gtcggacgat catcacgagc  21060

aataaacccg ccggcaacgc ccgcagcagc ataccggcga cccctcggcc tcgctgttcg  21120

ggctccacga aaacgccgga cagatgcgcc ttgtgagcgt ccttggggcc gtcctcctgt  21180

ttgaagaccg acagcccaat gatctcgccg tcgatgtagg cgccgaatgc cacggcatct  21240

cgcaaccgtt cagcgaacgc ctccatgggc tttttctcct cgtgctcgta aacggacccg  21300

aacatctctg gagctttctt cagggccgac aatcggatct cgcggaaatc ctgcacgtcg  21360

gccgctccaa gccgtcgaat ctgagcctta atcacaattg tcaattttaa tcctctgttt  21420

atcggcagtt cgtagagcgc gccgtgcgtc ccgagcgata ctgagcgaag caagtgcgtc  21480

gagcagtgcc cgcttgttcc tgaaatgcca gtaaagcgct ggctgctgaa cccccagccg  21540

gaactgaccc cacaaggccc tagcgtttgc aatgcaccag gtcatcattg acccaggcgt  21600

gttccaccag gccgctgcct cgcaactctt cgcaggcttc gccgacctgc tcgcgccact  21660

tcttcacgcg ggtggaatcc gatccgcaca tgaggcggaa ggtttccagc ttgagcgggt  21720

acggctcccg gtgcgagctg aaatagtcga acatccgtcg ggccgtcggc gacagcttgc  21780

ggtacttctc ccatatgaat ttcgtgtagt ggtcgccagc aaacagcacg acgatttcct  21840

cgtcgatcag gacctggcaa cgggacgttt tcttgccacg gtccaggacg cggaagcggt  21900

gcagcagcga caccgattcc aggtgcccaa cgcggtcgga cgtgaagccc atcgccgtcg  21960

cctgtaggcg cgacaggcat tcctcggcct tcgtgtaata ccggccattg atcgaccagc  22020

ccaggtcctg gcaaagctcg tagaacgtga aggtgatcgg ctcgccgata ggggtgcgct  22080

tcgcgtactc caacacctgc tgccacacca gttcgtcatc gtcggcccgc agctcgacgc  22140

cggtgtaggt gatcttcacg tccttgttga cgtggaaaat gaccttgttt tgcagcgcct  22200

cgcgcgggat tttcttgttg cgcgtggtga acagggcaga gcgggccgtg tcgtttggca  22260

tcgctcgcat cgtgtccggc cacggcgcaa tatcgaacaa ggaaagctgc atttccttga  22320

tctgctgctt cgtgtgtttc agcaacgcgg cctgcttggc ctcgctgacc tgttttgcca  22380

ggtcctcgcc ggcggttttt cgcttcttgg tcgtcatagt tcctcgcgtg tcgatggtca  22440

tcgacttcgc caaacctgcc gcctcctgtt cgagacgacg cgaacgctcc acggcggccg  22500

atggcgcggg cagggcaggg ggagccagtt gcacgctgtc gcgctcgatc ttggccgtag  22560

cttgctggac catcgagccg acggactgga aggtttcgcg gggcgcacgc atgacggtgc  22620

ggcttgcgat ggtttcggca tcctcggcgg aaaaccccgc gtcgatcagt tcttgcctgt  22680

atgccttccg gtcaaacgtc cgattcattc accctccttg cgggattgcc ccgactcacg  22740

ccggggcaat gtgcccttat tcctgatttg acccgcctgg tgccttggtg tccagataat  22800

ccaccttatc ggcaatgaag tcggtcccgt agaccgtctg gccgtccttc tcgtacttgg  22860

tattccgaat cttgccctgc acgaatacca gcgacccctt gcccaaatac ttgccgtggg  22920

cctcggcctg agagccaaaa cacttgatgc ggaagaagtc ggtgcgctcc tgcttgtcgc  22980

cggcatcgtt gcgccactct tcattaaccg ctatatcgaa aattgcttgc ggcttgttag  23040

aattgccatg acgtacctcg gtgtcacggg taagattacc gataaactgg aactgattat  23100

ggctcatatc gaaagtctcc ttgagaaagg agactctagt ttagctaaac attggttccg  23160

ctgtcaagaa ctttagcggc taaaattttg cgggccgcga ccaaaggtgc gaggggcggc  23220

ttccgctgtg tacaaccaga tatttttcac caacatcctt cgtctgctcg atgagcgggg  23280

catgacgaaa catgagctgt cggagagggc aggggtttca atttcgtttt tatcagactt  23340

aaccaacggt aaggccaacc cctcgttgaa ggtgatggag gccattgccg acgccctgga  23400

aactccccta cctcttctcc tggagtccac cgaccttgac cgcgaggcac tcgcggagat  23460

tgcgggtcat cctttcaaga gcagcgtgcc gcccggatac gaacgcatca gtgtggtttt  23520

gccgtcacat aaggcgttta tcgtaaagaa atggggcgac gacacccgaa aaaagctgcg  23580

tggaaggctc tgacgccaag ggttagggct tgcacttcct tctttagccg ctaaaacggc  23640

cccttctctg cgggccgtcg gctcgcgcat catatcgaca tcctcaacgg aagccgtgcc  23700

gcgaatggca tcgggcgggt gcgctttgac agttgttttc tatcagaacc cctacgtcgt  23760

gcggttcgat tagctgtttg tcttgcaggc taaacacttt cggtatatcg tttgcctgtg  23820

cgataatgtt gctaatgatt tgttgcgtag gggttactga aaagtgagcg ggaaagaaga  23880

gtttcagacc atcaaggagc gggccaagcg caagctggaa cgcgacatgg gtgcggacct  23940

gttggccgcg ctcaacgacc cgaaaaccgt tgaagtcatg ctcaacgcgg acggcaaggt  24000

gtggcacgaa cgccttggcg agccgatgcg gtacatctgc gacatgcggc ccagccagtc  24060

gcaggcgatt atagaaacgg tggccggatt ccacggcaaa gaggtcacgc ggcattcgcc  24120

catcctggaa ggcgagttcc ccttggatgg cagccgcttt gccggccaat tgccgccggt  24180

cgtggccgcg ccaacctttg cgatccgcaa gcgcgcggtc gccatcttca cgctggaaca  24240

gtacgtcgag gcgggcatca tgacccgcga gcaatacgag gtcattaaaa gcgccgtcgc  24300

ggcgcatcga aacatcctcg tcattggcgg tactggctcg ggcaagacca cgctcgtcaa  24360

cgcgatcatc aatgaaatgg tcgccttcaa cccgtctgag cgcgtcgtca tcatcgagga  24420

caccggcgaa atccagtgcg ccgcagagaa cgccgtccaa taccacacca gcatcgacgt  24480

ctcgatgacg ctgctgctca agacaacgct gcgtatgcgc cccgaccgca tcctggtcgg  24540

tgaggtacgt ggccccgaag cccttgatct gttgatggcc tggaacaccg ggcatgaagg  24600

aggtgccgcc accctgcacg caaacaaccc caaagcgggc ctgagccggc tcgccatgct  24660

tatcagcatg cacccggatt caccgaaacc cattgagccg ctgattggcg aggcggttca  24720

tgtggtcgtc catatcgcca ggacccctag cggccgtcga gtgcaagaaa ttctcgaagt  24780

tcttggttac gagaacggcc agtacatcac caaaaccctg taaggagtat ttccaatgac  24840

aacggctgtt ccgttccgtc tgaccatgaa tcgcggcatt ttgttctacc ttgccgtgtt  24900

cttcgttctc gctctcgcgt tatccgcgca tccggcgatg gcctcggaag gcaccggcgg  24960

cagcttgcca tatgagagct ggctgacgaa cctgcgcaac tccgtaaccg gcccggtggc  25020

cttcgcgctg tccatcatcg gcatcgtcgt cgccggcggc gtgctgatct tcggcggcga  25080

actcaacgcc ttcttccgaa ccctgatctt cctggttctg gtgatggcgc tgctggtcgg  25140

cgcgcagaac gtgatgagca ccttcttcgg tcgtggtgcc gaaatcgcgg ccctcggcaa  25200

cggggcgctg caccaggtgc aagtcgcggc ggcggatgcc gtgcgtgcgg tagcggctgg  25260

acggctcgcc taatcatggc tctgcgcacg atccccatcc gtcgcgcagg caaccgagaa  25320

aacctgttca tgggtggtga tcgtgaactg gtgatgttct cgggcctgat ggcgtttgcg  25380

ctgattttca gcgcccaaga gctgcgggcc accgtggtcg gtctgatcct gtggttcggg  25440

gcgctctatg cgttccgaat catggcgaag gccgatccga agatgcggtt cgtgtacctg  25500

cgtcaccgcc ggtacaagcc gtattacccg gcccgctcga ccccgttccg cgagaacacc  25560

aatagccaag ggaagcaata ccgatgatcc aagcaattgc gattgcaatc gcgggcctcg  25620

gcgcgcttct gttgttcatc ctctttgccc gcatccgcgc ggtcgatgcc gaactgaaac  25680

tgaaaaagca tcgttccaag gacgccggcc tggccgatct gctcaactac gccgctgtcg  25740

tcgatgacgg cgtaatcgtg ggcaagaacg gcagctttat ggctgcctgg ctgtacaagg  25800

gcgatgacaa cgcaagcagc accgaccagc agcgcgaagt agtgtccgcc cgcatcaacc  25860

aggccctcgc gggcctggga agtgggtgga tgatccatgt ggacgccgtg cggcgtcctg  25920

ctccgaacta cgcggagcgg ggcctgtcgg cgttccctga ccgtctgacg gcagcgattg  25980

aagaagagcg ctcggtcttg ccttgctcgt cggtgatgta cttcaccagc tccgcgaagt  26040

cgctcttctt gatggagcgc atggggacgt gcttggcaat cacgcgcacc ccccggccgt  26100

tttagcggct aaaaaagtca tggctctgcc ctcgggcgga ccacgcccat catgaccttg  26160

ccaagctcgt cctgcttctc ttcgatcttc gccagcaggg cgaggatcgt ggcatcaccg  26220

aaccgcgccg tgcgcgggtc gtcggtgagc cagagtttca gcaggccgcc caggcggccc  26280

aggtcgccat tgatgcgggc cagctcgcgg acgtgctcat agtccacgac gcccgtgatt  26340

ttgtagccct ggccgacggc cagcaggtag gccgacaggc tcatgccggc cgccgccgcc  26400

ttttcctcaa tcgctcttcg ttcgtctgga aggcagtaca ccttgatagg tgggctgccc  26460

ttcctggttg gcttggtttc atcagccatc cgcttgccct catctgttac gccggcggta  26520

gccggccagc ctcgcagagc aggattcccg ttgagcaccg ccaggtgcga ataagggaca  26580

gtgaagaagg aacacccgct cgcgggtggg cctacttcac ctatcctgcc cggctgacgc  26640

cgttggatac accaaggaaa gtctacacga accctttggc aaaatcctgt atatcgtgcg  26700

aaaaaggatg gatataccga aaaaatcgct ataatgaccc cgaagcaggg ttatgcagcg  26760

gaaaagcgct gcttccctgc tgttttgtgg aatatctacc gactggaaac aggcaaatgc  26820

aggaaattac tgaactgagg ggacaggcga gagacgatgc caaagagcta caccgacgag  26880

ctggccgagt gggttgaatc ccgcgcggcc aagaagcgcc ggcgtgatga ggctgcggtt  26940

gcgttcctgg cggtgagggc ggatgtcgag gcggcgttag cgtccggcta tgcgctcgtc  27000

accatttggg agcacatgcg ggaaacgggg aaggtcaagt tctcctacga gacgttccgc  27060

tcgcacgcca ggcggcacat caaggccaag cccgccgatg tgcccgcacc gcaggccaag  27120

gctgcggaac ccgcgccggc acccaagacg ccggagccac ggcggccgaa gcaggggggc  27180

aaggctgaaa agccggcccc cgctgcggcc ccgaccggct tcaccttcaa cccaacaccg  27240

gacaaaaagg atctactgta atggcgaaaa ttcacatggt tttgcagggc aagggcgggg  27300

tcggcaagtc ggccatcgcc gcgatcattg cgcagtacaa gatggacaag gggcagacac  27360

ccttgtgcat cgacaccgac ccggtgaacg cgacgttcga gggctacaag gccctgaacg  27420

tccgccggct gaacatcatg gccggcgacg aaattaactc gcgcaacttc gacaccctgg  27480

tcgagctgat tgcgccgacc aaggatgacg tggtgatcga caacggtgcc agctcgttcg  27540

tgcctctgtc gcattacctc atcagcaacc aggtgccggc tctgctgcaa gaaatggggc  27600

atgagctggt catccatacc gtcgtcaccg gcggccaggc tctcctggac acggtgagcg  27660

gcttcgccca gctcgccagc cagttcccgg ccgaagcgct tttcgtggtc tggctgaacc  27720

cgtattgggg gcctatcgag catgagggca agagctttga gcagatgaag gcgtacacgg  27780

ccaacaaggc ccgcgtgtcg tccatcatcc agattccggc cctcaaggaa gaaacctacg  27840

gccgcgattt cagcgacatg ctgcaagagc ggctgacgtt cgaccaggcg ctggccgatg  27900

aatcgctcac gatcatgacg cggcaacgcc tcaagatcgt gcggcgcggc ctgtttgaac  27960

agctcgacgc ggcggccgtg ctatgagcga ccagattgaa gagctgatcc gggagattgc  28020

ggccaagcac ggcatcgccg tcggccgcga cgacccggtg ctgatcctgc ataccatcaa  28080

cgcccggctc atggccgaca gtgcggccaa gcaagaggaa atccttgccg cgttcaagga  28140

agagctggaa gggatcgccc atcgttgggg cgaggacgcc aaggccaaag cggagcggat  28200

gctgaacgcg gccctggcgg ccagcaagga cgcaatggcg aaggtaatga aggacagcgc  28260

cgcgcaggcg gccgaagcga tccgcaggga aatcgacgac ggccttggcc gccagctcgc  28320

ggccaaggtc gcggacgcgc ggcgcgtggc gatgatgaac atgatcgccg gcggcatggt  28380

gttgttcgcg gccgccctgg tggtgtgggc ctcgttatga atcgcagagg cgcagatgaa  28440

aaagcccggc gttgccgggc tttgtttttg cgttagctgg gcttgtttga caggcccaag  28500

ctctgactgc gcccgcgctc gcgctcctgg gcctgtttct tctcctgctc ctgcttgcgc  28560

atcagggcct ggtgccgtcg ggctgcttca cgcatcgaat cccagtcgcc ggccagctcg  28620

ggatgctccg cgcgcatctt gcgcgtcgcc agttcctcga tcttgggcgc gtgaatgccc  28680

atgccttcct tgatttcgcg caccatgtcc agccgcgtgt gcagggtctg caagcgggct  28740

tgctgttggg cctgctgctg ctgccaggcg gcctttgtac gcggcaggga cagcaagccg  28800

ggggcattgg actgtagctg ctgcaaacgc gcctgctgac ggtctacgag ctgttctagg  28860

cggtcctcga tgcgctccac ctggtcatgc tttgcctgca cgtagagcgc aagggtctgc  28920

tggtaggtct gctcgatggg cgcggattct aagagggcct gctgttccgt ctcggcctcc  28980

tgggccgcct gtagcaaatc ctcgccgctg ttgccgctgg actgctttac tgccggggac  29040

tgctgttgcc ctgctcgcgc cgtcgtcgca gttcggcttg cccccactcg attgactgct  29100

tcatttcgag ccgcagcgat gcgatctcgg attgcgtcaa cggacggggc agcgcggagg  29160

tgtccggctt ctccttgggt gagtcggtcg atgccatagc caaaggtttc cttccaaaat  29220

gcgtccattg ctggaccgtg tttctcattg atgcccgcaa gcatcttcgg cttgaccgcc  29280

aggtcaagcg cgccttcatg ggcggtcatg acggacgccg ccatgacctt gccgccgttg  29340

ttctcgatgt agccgcgtaa tgaggcaatg gtgccgccca tcgtcagcgt gtcatcgaca  29400

acgatgtact tctggccggg gatcacctcc ccctcgaaag tcgggttgaa cgccaggcga  29460

tgatctgaac cggctccggt tcgggcgacc ttctcccgct gcacaatgtc cgtttcgacc  29520

tcaaggccaa ggcggtcggc cagaacgacc gccatcatgg ccggaatctt gttgttcccc  29580

gccgcctcga cggcgaggac tggaacgatg cggggcttgt cgtcgccgat cagcgtcttg  29640

agctgggcaa cagtgtcgtc cgaaatcagg cgctcgacca aattaagcgc cgcttccgcg  29700

tcgccctgct tcgcagcctg gtattcaggc tcgttggtca aagaaccaag gtcgccgttg  29760

cgaaccacct tcgggaagtc tccccacggt gcgcgctcgg ctctgctgta gctgctcaag  29820

acgcctccct ttttagccgc taaaactcta acgagtgcgc ccgcgactca acttgacgct  29880

ttcggcactt acctgtgcct tgccacttgc gtcataggtg atgcttttcg cactcccgat  29940

ttcaggtact ttatcgaaat ctgaccgggc gtgcattaca aagttcttcc ccacctgttg  30000

gtaaatgctg ccgctatctg cgtggacgat gctgccgtcg tggcgctgcg acttatcggc  30060

cttttgggcc atatagatgt tgtaaatgcc aggtttcagg gccccggctt tatctacctt  30120

ctggttcgtc catgcgcctt ggttctcggt ctggacaatt ctttgcccat tcatgaccag  30180

gaggcggtgt ttcattgggt gactcctgac ggttgcctct ggtgttaaac gtgtcctggt  30240

cgcttgccgg ctaaaaaaaa gccgacctcg gcagttcgag gccggctttc cctagagccg  30300

ggcgcgtcaa ggttgttcca tctattttag tgaactgcgt tcgatttatc agttactttc  30360

ctcccgcttt gtgtttcctc ccactcgttt ccgcgtctag ccgacccctc aacatagcgg  30420

cctcttcttg ggctgccttt gcctcttgcc gcgcttcgtc acgctcggct tgcaccgtcg  30480

taaagcgctc ggcctgcctg gccgcctctt gcgccgccaa cttcctttgc tcctggtggg  30540

cctcggcgtc ggcctgcgcc ttcgctttca ccgctgccaa ctccgtgcgc aaactctccg  30600

cttcgcgcct ggtggcgtcg cgctcgccgc gaagcgcctg catttcctgg ttggccgcgt  30660

ccagggtctt gcggctctct tctttgaatg cgcgggcgtc ctggtgagcg tagtccagct  30720

cggcgcgcag ctcctgcgct cgacgctcca cctcgtcggc ccgctgcgtc gccagcgcgg  30780

cccgctgctc ggctcctgcc agggcggtgc gtgcttcggc cagggcttgc cgctggcgtg  30840

cggccagctc ggccgcctcg gcggcctgct gctctagcaa tgtaacgcgc gcctgggctt  30900

cttccagctc gcgggcctgc gcctcgaagg cgtcggccag ctccccgcgc acggcttcca  30960

actcgttgcg ctcacgatcc cagccggctt gcgctgcctg caacgattca ttggcaaggg  31020

cctgggcggc ttgccagagg gcggccacgg cctggttgcc ggcctgctgc accgcgtccg  31080

gcacctggac tgccagcggg gcggcctgcg ccgtgcgctg gcgtcgccat tcgcgcatgc  31140

cggcgctggc gtcgttcatg ttgacgcggg cggccttacg cactgcatcc acggtcggga  31200

agttctcccg gtcgccttgc tcgaacagct cgtccgcagc cgcaaaaatg cggtcgcgcg  31260

tctctttgtt cagttccatg ttggctccgg taattggtaa gaataataat actcttacct  31320

accttatcag cgcaagagtt tagctgaaca gttctcgact taacggcagg ttttttagcg  31380

gctgaagggc aggcaaaaaa agccccgcac ggtcggcggg ggcaaagggt cagcgggaag  31440

gggattagcg ggcgtcgggc ttcttcatgc gtcggggccg cgcttcttgg gatggagcac  31500

gacgaagcgc gcacgcgcat cgtcctcggc cctatcggcc cgcgtcgcgg tcaggaactt  31560

gtcgcgcgct aggtcctccc tggtgggcac caggggcatg aactcggcct gctcgatgta  31620

ggtccactcc atgaccgcat cgcagtcgag gccgcgttcc ttcaccgtct cttgcaggtc  31680

gcggtacgcc cgctcgttga gcggctggta acgggccaat tggtcgtaaa tggctgtcgg  31740

ccatgagcgg cctttcctgt tgagccagca gccgacgacg aagccggcaa tgcaggcccc  31800

tggcacaacc aggccgacgc cgggggcagg ggatggcagc agctcgccaa ccaggaaccc  31860

cgccgcgatg atgccgatgc cggtcaacca gcccttgaaa ctatccggcc ccgaaacacc  31920

cctgcgcatt gcctggatgc tgcgccggat agcttgcaac atcaggagcc gtttcttttg  31980

ttcgtcagtc atggtccgcc ctcaccagtt gttcgtatcg gtgtcggacg aactgaaatc  32040

gcaagagctg ccggtatcgg tccagccgct gtccgtgtcg ctgctgccga agcacggcga  32100

ggggtccgcg aacgccgcag acggcgtatc cggccgcagc gcatcgccca gcatggcccc  32160

ggtcagcgag ccgccggcca ggtagcccag catggtgctg ttggtcgccc cggccaccag  32220

ggccgacgtg acgaaatcgc cgtcattccc tctggattgt tcgctgctcg gcggggcagt  32280

gcgccgcgcc ggcggcgtcg tggatggctc gggttggctg gcctgcgacg gccggcgaaa  32340

ggtgcgcagc agctcgttat cgaccggctg cggcgtcggg gccgccgcct tgcgctgcgg  32400

tcggtgttcc ttcttcggct cgcgcagctt gaacagcatg atcgcggaaa ccagcagcaa  32460

cgccgcgcct acgcctcccg cgatgtagaa cagcatcgga ttcattcttc ggtcctcctt  32520

gtagcggaac cgttgtctgt gcggcgcggg tggcccgcgc cgctgtcttt ggggatcagc  32580

cctcgatgag cgcgaccagt ttcacgtcgg caaggttcgc ctcgaactcc tggccgtcgt  32640

cctcgtactt caaccaggca tagccttccg ccggcggccg acggttgagg ataaggcggg  32700

cagggcgctc gtcgtgctcg acctggacga tggccttttt cagcttgtcc gggtccggct  32760

ccttcgcgcc cttttccttg gcgtccttac cgtcctggtc gccgtcctcg ccgtcctggc  32820

cgtcgccggc ctccgcgtca cgctcggcat cagtctggcc gttgaaggca tcgacggtgt  32880

tgggatcgcg gcccttctcg tccaggaact cgcgcagcag cttgaccgtg ccgcgcgtga  32940

tttcctgggt gtcgtcgtca agccacgcct cgacttcctc cgggcgcttc ttgaaggccg  33000

tcaccagctc gttcaccacg gtcacgtcgc gcacgcggcc ggtgttgaac gcatcggcga  33060

tcttctccgg caggtccagc agcgtgacgt gctgggtgat gaacgccggc gacttgccga  33120

tttccttggc gatatcgcct ttcttcttgc ccttcgccag ctcgcggcca atgaagtcgg  33180

caatttcgcg cggggtcagc tcgttgcgtt gcaggttctc gataacctgg tcggcttcgt  33240

tgtagtcgtt gtcgatgaac gccgggatgg acttcttgcc ggcccacttc gagccacggt  33300

agcggcgggc gccgtgattg atgatatagc ggcccggctg ctcctggttc tcgcgcaccg  33360

aaatgggtga cttcaccccg cgctctttga tcgtggcacc gatttccgcg atgctctccg  33420

gggaaaagcc ggggttgtcg gccgtccgcg gctgatgcgg atcttcgtcg atcaggtcca  33480

ggtccagctc gatagggccg gaaccgccct gagacgccgc aggagcgtcc aggaggctcg  33540

acaggtcgcc gatgctatcc aaccccaggc cggacggctg cgccgcgcct gcggcttcct  33600

gagcggccgc agcggtgttt ttcttggtgg tcttggcttg agccgcagtc attgggaaat  33660

ctccatcttc gtgaacacgt aatcagccag ggcgcgaacc tctttcgatg ccttgcgcgc  33720

ggccgttttc ttgatcttcc agaccggcac accggatgcg agggcatcgg cgatgctgct  33780

gcgcaggcca acggtggccg gaatcatcat cttggggtac gcggccagca gctcggcttg  33840

gtggcgcgcg tggcgcggat tccgcgcatc gaccttgctg ggcaccatgc caaggaattg  33900

cagcttggcg ttcttctggc gcacgttcgc aatggtcgtg accatcttct tgatgccctg  33960

gatgctgtac gcctcaagct cgatggggga cagcacatag tcggccgcga agagggcggc  34020

cgccaggccg acgccaaggg tcggggccgt gtcgatcagg cacacgtcga agccttggtt  34080

cgccagggcc ttgatgttcg ccccgaacag ctcgcgggcg tcgtccagcg acagccgttc  34140

ggcgttcgcc agtaccgggt tggactcgat gagggcgagg cgcgcggcct ggccgtcgcc  34200

ggctgcgggt gcggtttcgg tccagccgcc ggcagggaca gcgccgaaca gcttgcttgc  34260

atgcaggccg gtagcaaagt ccttgagcgt gtaggacgca ttgccctggg ggtccaggtc  34320

gatcacggca acccgcaagc cgcgctcgaa aaagtcgaag gcaagatgca caagggtcga  34380

agtcttgccg acgccgcctt tctggttggc cgtgaccaaa gttttcatcg tttggtttcc  34440

tgttttttct tggcgtccgc ttcccacttc cggacgatgt acgcctgatg ttccggcaga  34500

accgccgtta cccgcgcgta cccctcgggc aagttcttgt cctcgaacgc ggcccacacg  34560

cgatgcaccg cttgcgacac tgcgcccctg gtcagtccca gcgacgttgc gaacgtcgcc  34620

tgtggcttcc catcgactaa gacgccccgc gctatctcga tggtctgctg ccccacttcc  34680

agcccctgga tcgcctcctg gaactggctt tcggtaagcc gtttcttcat ggataacacc  34740

cataatttgc tccgcgcctt ggttgaacat agcggtgaca gccgccagca catgagagaa  34800

gtttagctaa acatttctcg cacgtcaaca cctttagccg ctaaaactcg tccttggcgt  34860

aacaaaacaa aagcccggaa accgggcttt cgtctcttgc cgcttatggc tctgcacccg  34920

gctccatcac caacaggtcg cgcacgcgct tcactcggtt gcggatcgac actgccagcc  34980

caacaaagcc ggttgccgcc gccgccagga tcgcgccgat gatgccggcc acaccggcca  35040

tcgcccacca ggtcgccgcc ttccggttcc attcctgctg gtactgcttc gcaatgctgg  35100

acctcggctc accataggct gaccgctcga tggcgtatgc cgcttctccc cttggcgtaa  35160

aacccagcgc cgcaggcggc attgccatgc tgcccgccgc tttcccgacc acgacgcgcg  35220

caccaggctt gcggtccaga ccttcggcca cggcgagctg cgcaaggaca taatcagccg  35280

ccgacttggc tccacgcgcc tcgatcagct cttgcactcg cgcgaaatcc ttggcctcca  35340

cggccgccat gaatcgcgca cgcggcgaag gctccgcagg gccggcgtcg tgatcgccgc  35400

cgagaatgcc cttcaccaag ttcgacgaca cgaaaatcat gctgacggct atcaccatca  35460

tgcagacgga tcgcacgaac ccgctgaatt gaacacgagc acggcacccg cgaccactat  35520

gccaagaatg cccaaggtaa aaattgccgg ccccgccatg aagtccgtga atgccccgac  35580

ggccgaagtg aagggcaggc cgccacccag gccgccgccc tcactgcccg gcacctggtc  35640

gctgaatgtc gatgccagca cctgcggcac gtcaatgctt ccgggcgtcg cgctcgggct  35700

gatcgcccat cccgttactg ccccgatccc ggcaatggca aggactgcca gcgctgccat  35760

ttttggggtg aggccgttcg cggccgaggg gcgcagcccc tggggggatg ggaggcccgc  35820

gttagcgggc cgggagggtt cgagaagggg gggcaccccc cttcggcgtg cgcggtcacg  35880

cgcacagggc gcagccctgg ttaaaaacaa ggtttataaa tattggttta aaagcaggtt  35940

aaaagacagg ttagcggtgg ccgaaaaacg ggcggaaacc cttgcaaatg ctggattttc  36000

tgcctgtgga cagcccctca aatgtcaata ggtgcgcccc tcatctgtca gcactctgcc  36060

cctcaagtgt caaggatcgc gcccctcatc tgtcagtagt cgcgcccctc aagtgtcaat  36120

accgcagggc acttatcccc aggcttgtcc acatcatctg tgggaaactc gcgtaaaatc  36180

aggcgttttc gccgatttgc gaggctggcc agctccacgt cgccggccga aatcgagcct  36240

gcccctcatc tgtcaacgcc gcgccgggtg agtcggcccc tcaagtgtca acgtccgccc  36300

ctcatctgtc agtgagggcc aagttttccg cgaggtatcc acaacgccgg cggccgcggt  36360

gtctcgcaca cggcttcgac ggcgtttctg gcgcgtttgc agggccatag acggccgcca  36420

gcccagcggc gagggcaacc agcccggtga gcgtcggaaa ggcgctggaa gccccgtagc  36480

gacgcggaga ggggcgagac aagccaaggg cgcaggctcg atgcgcagca cgacatagcc  36540

ggttctcgca aggacgagaa tttccctgcg gtgcccctca agtgtcaatg aaagtttcca  36600

acgcgagcca ttcgcgagag ccttgagtcc acgctagatg agagctttgt tgtaggtgga  36660

ccagttggtg attttgaact tttgctttgc cacggaacgg tctgcgttgt cgggaagatg  36720

cgtgatctga tccttcaact cagcaaaagt tcgatttatt caacaaagcc acgttgtgtc  36780

tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact  36840

gtctgcttac ataaacagta atacaagggg tgttatgagc catattcaac gggaaacgtc  36900

ttgctcgac                                                          36909

 

<210>8

<211>13019

<212>DNA

<213>人工序列

 

<220>

<223>载体

 

<400>8

gttacccgga ccgaagctta gcccgggcat gcctgcagtg cagcgtgacc cggtcgtgcc    60

cctctctaga gataatgagc attgcatgtc taagttataa aaaattacca catatttttt    120

ttgtcacact tgtttgaagt gcagtttatc tatctttata catatattta aactttactc    180

tacgaataat ataatctata gtactacaat aatatcagtg ttttagagaa tcatataaat    240

gaacagttag acatggtcta aaggacaatt gagtattttg acaacaggac tctacagttt    300

tatcttttta gtgtgcatgt gttctccttt ttttttgcaa atagcttcac ctatataata    360

cttcatccat tttattagta catccattta gggtttaggg ttaatggttt ttatagacta    420

atttttttag tacatctatt ttattctatt ttagcctcta aattaagaaa actaaaactc    480

tattttagtt tttttattta ataatttaga tataaaatag aataaaataa agtgactaaa    540

aattaaacaa atacccttta agaaattaaa aaaactaagg aaacattttt cttgtttcga    600

gtagataatg ccagcctgtt aaacgccgtc gacgagtcta acggacacca accagcgaac    660

cagcagcgtc gcgtcgggcc aagcgaagca gacggcacgg catctctgtc gctgcctctg    720

gacccctctc gagagttccg ctccaccgtt ggacttgctc cgctgtcggc atccagaaat    780

tgcgtggcgg agcggcagac gtgagccggc acggcaggcg gcctcctcct cctctcacgg    840

cacggcagct acgggggatt cctttcccac cgctccttcg ctttcccttc ctcgcccgcc    900

gtaataaata gacaccccct ccacaccctc tttccccaac ctcgtgttgt tcggagcgca    960

cacacacaca accagatctc ccccaaatcc acccgtcggc acctccgctt caaggtacgc    1020

cgctcgtcct cccccccccc ccctctctac cttctctaga tcggcgttcc ggtccatggt    1080

tagggcccgg tagttctact tctgttcatg tttgtgttag atccgtgttt gtgttagatc    1140

cgtgctgcta gcgttcgtac acggatgcga cctgtacgtc agacacgttc tgattgctaa    1200

cttgccagtg tttctctttg gggaatcctg ggatggctct agccgttccg cagacgggat    1260

cgatttcatg attttttttg tttcgttgca tagggtttgg tttgcccttt tcctttattt    1320

caatatatgc cgtgcacttg tttgtcgggt catcttttca tgcttttttt tgtcttggtt    1380

gtgatgatgt ggtctggttg ggcggtcgtt ctagatcgga gtagaattct gtttcaaact    1440

acctggtgga tttattaatt ttggatctgt atgtgtgtgc catacatatt catagttacg    1500

aattgaagat gatggatgga aatatcgatc taggataggt atacatgttg atgcgggttt    1560

tactgatgca tatacagaga tgctttttgt tcgcttggtt gtgatgatgt ggtgtggttg    1620

ggcggtcgtt cattcgttct agatcggagt agaatactgt ttcaaactac ctggtgtatt    1680

tattaatttt ggaactgtat gtgtgtgtca tacatcttca tagttacgag tttaagatgg    1740

atggaaatat cgatctagga taggtataca tgttgatgtg ggttttactg atgcatatac    1800

atgatggcat atgcagcatc tattcatatg ctctaacctt gagtacctat ctattataat    1860

aaacaagtat gttttataat tattttgatc ttgatatact tggatgatgg catatgcagc    1920

agctatatgt ggattttttt agccctgcct tcatacgcta tttatttgct tggtactgtt    1980

tcttttgtcg atgctcaccc tgttgtttgg tgttacttct gcaggtcgac tctagaggat    2040

ccacaagttt gtacaaaaaa gctgaacgag aaacgtaaaa tgatataaat atcaatatat    2100

taaattagat tttgcataaa aaacagacta cataatactg taaaacacaa catatccagt    2160

cactatggcg gccgcattag gcaccccagg ctttacactt tatgcttccg gctcgtataa    2220

tgtgtggatt ttgagttagg atttaaatac gcgttgatcc ggcttactaa aagccagata    2280

acagtatgcg tatttgcgcg ctgatttttg cggtataaga atatatactg atatgtatac    2340

ccgaagtatg tcaaaaagag gtatgctatg aagcagcgta ttacagtgac agttgacagc    2400

gacagctatc agttgctcaa ggcatatatg atgtcaatat ctccggtctg gtaagcacaa    2460

ccatgcagaa tgaagcccgt cgtctgcgtg ccgaacgctg gaaagcggaa aatcaggaag    2520

ggatggctga ggtcgcccgg tttattgaaa tgaacggctc ttttgctgac gagaacaggg    2580

gctggtgaaa tgcagtttaa ggtttacacc tataaaagag agagccgtta tcgtctgttt    2640

gtggatgtac agagtgatat cattgacacg cccggtcgac ggatggtgat ccccctggcc    2700

agtgcacgtc tgctgtcaga taaagtctcc cgtgaacttt acccggtggt gcatatcggg    2760

gatgaaagct ggcgcatgat gaccaccgat atggccagtg tgccggtctc cgttatcggg    2820

gaagaagtgg ctgatctcag ccaccgcgaa aatgacatca aaaacgccat taacctgatg    2880

ttctggggaa tataaatgtc aggctccctt atacacagcc agtctgcagg tcgaccatag    2940

tgactggata tgttgtgttt tacagtatta tgtagtctgt tttttatgca aaatctaatt    3000

taatatattg atatttatat cattttacgt ttctcgttca gctttcttgt acaaagtggt    3060

gttaacctag acttgtccat cttctggatt ggccaactta attaatgtat gaaataaaag    3120

gatgcacaca tagtgacatg ctaatcacta taatgtgggc atcaaagttg tgtgttatgt    3180

gtaattacta gttatctgaa taaaagagaa agagatcatc catatttctt atcctaaatg    3240

aatgtcacgt gtctttataa ttctttgatg aaccagatgc atttcattaa ccaaatccat    3300

atacatataa atattaatca tatataatta atatcaattg ggttagcaaa acaaatctag    3360

tctaggtgtg ttttgcgaat tgcggccgcc accgcggtgg agctcgaatt ccggtccggg    3420

tcacctttgt ccaccaagat ggaactgcgg ccgctcatta attaagtcag gcgcgcctct    3480

agttgaagac acgttcatgt cttcatcgta agaagacact cagtagtctt cggccagaat    3540

ggccatctgg attcagcagg cctagaaggc catttaaatc ctgaggatct ggtcttccta    3600

aggacccggg atatcggacc gattaaactt taattcggtc cgaagcttgc atgcctgcag    3660

tgcagcgtga cccggtcgtg cccctctcta gagataatga gcattgcatg tctaagttat    3720

aaaaaattac cacatatttt ttttgtcaca cttgtttgaa gtgcagttta tctatcttta    3780

tacatatatt taaactttac tctacgaata atataatcta tagtactaca ataatatcag    3840

tgttttagag aatcatataa atgaacagtt agacatggtc taaaggacaa ttgagtattt    3900

tgacaacagg actctacagt tttatctttt tagtgtgcat gtgttctcct ttttttttgc    3960

aaatagcttc acctatataa tacttcatcc attttattag tacatccatt tagggtttag    4020

ggttaatggt ttttatagac taattttttt agtacatcta ttttattcta ttttagcctc    4080

taaattaaga aaactaaaac tctattttag tttttttatt taataattta gatataaaat    4140

agaataaaat aaagtgacta aaaattaaac aaataccctt taagaaatta aaaaaactaa    4200

ggaaacattt ttcttgtttc gagtagataa tgccagcctg ttaaacgccg tcgacgagtc    4260

taacggacac caaccagcga accagcagcg tcgcgtcggg ccaagcgaag cagacggcac    4320

ggcatctctg tcgctgcctc tggacccctc tcgagagttc cgctccaccg ttggacttgc    4380

tccgctgtcg gcatccagaa attgcgtggc ggagcggcag acgtgagccg gcacggcagg    4440

cggcctcctc ctcctctcac ggcaccggca gctacggggg attcctttcc caccgctcct    4500

tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc ctctttcccc    4560

aacctcgtgt tgttcggagc gcacacacac acaaccagat ctcccccaaa tccacccgtc    4620

ggcacctccg cttcaaggta cgccgctcgt cctccccccc ccccctctct accttctcta    4680

gatcggcgtt ccggtccatg catggttagg gcccggtagt tctacttctg ttcatgtttg    4740

tgttagatcc gtgtttgtgt tagatccgtg ctgctagcgt tcgtacacgg atgcgacctg    4800

tacgtcagac acgttctgat tgctaacttg ccagtgtttc tctttgggga atcctgggat    4860

ggctctagcc gttccgcaga cgggatcgat ttcatgattt tttttgtttc gttgcatagg    4920

gtttggtttg cccttttcct ttatttcaat atatgccgtg cacttgtttg tcgggtcatc    4980

ttttcatgct tttttttgtc ttggttgtga tgatgtggtc tggttgggcg gtcgttctag    5040

atcggagtag aattctgttt caaactacct ggtggattta ttaattttgg atctgtatgt    5100

gtgtgccata catattcata gttacgaatt gaagatgatg gatggaaata tcgatctagg    5160

ataggtatac atgttgatgc gggttttact gatgcatata cagagatgct ttttgttcgc    5220

ttggttgtga tgatgtggtg tggttgggcg gtcgttcatt cgttctagat cggagtagaa    5280

tactgtttca aactacctgg tgtatttatt aattttggaa ctgtatgtgt gtgtcataca    5340

tcttcatagt tacgagttta agatggatgg aaatatcgat ctaggatagg tatacatgtt    5400

gatgtgggtt ttactgatgc atatacatga tggcatatgc agcatctatt catatgctct    5460

aaccttgagt acctatctat tataataaac aagtatgttt tataattatt ttgatcttga    5520

tatacttgga tgatggcata tgcagcagct atatgtggat ttttttagcc ctgccttcat    5580

acgctattta tttgcttggt actgtttctt ttgtcgatgc tcaccctgtt gtttggtgtt    5640

acttctgcag gtcgacttta acttagccta ggatccacac gacaccatgt cccccgagcg    5700

ccgccccgtc gagatccgcc cggccaccgc cgccgacatg gccgccgtgt gcgacatcgt    5760

gaaccactac atcgagacct ccaccgtgaa cttccgcacc gagccgcaga ccccgcagga    5820

gtggatcgac gacctggagc gcctccagga ccgctacccg tggctcgtgg ccgaggtgga    5880

gggcgtggtg gccggcatcg cctacgccgg cccgtggaag gcccgcaacg cctacgactg    5940

gaccgtggag tccaccgtgt acgtgtccca ccgccaccag cgcctcggcc tcggctccac    6000

cctctacacc cacctcctca agagcatgga ggcccagggc ttcaagtccg tggtggccgt    6060

gatcggcctc ccgaacgacc cgtccgtgcg cctccacgag gccctcggct acaccgcccg    6120

cggcaccctc cgcgccgccg gctacaagca cggcggctgg cacgacgtcg gcttctggca    6180

gcgcgacttc gagctgccgg ccccgccgcg cccggtgcgc ccggtgacgc agatctgagt    6240

cgaaacctag acttgtccat cttctggatt ggccaactta attaatgtat gaaataaaag    6300

gatgcacaca tagtgacatg ctaatcacta taatgtgggc atcaaagttg tgtgttatgt    6360

gtaattacta gttatctgaa taaaagagaa agagatcatc catatttctt atcctaaatg    6420

aatgtcacgt gtctttataa ttctttgatg aaccagatgc atttcattaa ccaaatccat    6480

atacatataa atattaatca tatataatta atatcaattg ggttagcaaa acaaatctag    6540

tctaggtgtg ttttgcgaat tgcggccgcc accgcggtgg agctcgaatt cattccgatt    6600

aatcgtggcc tcttgctctt caggatgaag agctatgttt aaacgtgcaa gcgctactag    6660

acaattcagt acattaaaaa cgtccgcaat gtgttattaa gttgtctaag cgtcaatttg    6720

tttacaccac aatatatcct gccaccagcc agccaacagc tccccgaccg gcagctcggc    6780

acaaaatcac cactcgatac aggcagccca tcagtccggg acggcgtcag cgggagagcc    6840

gttgtaaggc ggcagacttt gctcatgtta ccgatgctat tcggaagaac ggcaactaag    6900

ctgccgggtt tgaaacacgg atgatctcgc ggagggtagc atgttgattg taacgatgac    6960

agagcgttgc tgcctgtgat caaatatcat ctccctcgca gagatccgaa ttatcagcct    7020

tcttattcat ttctcgctta accgtgacag gctgtcgatc ttgagaacta tgccgacata    7080

ataggaaatc gctggataaa gccgctgagg aagctgagtg gcgctatttc tttagaagtg    7140

aacgttgacg atcgtcgacc gtaccccgat gaattaattc ggacgtacgt tctgaacaca    7200

gctggatact tacttgggcg attgtcatac atgacatcaa caatgtaccc gtttgtgtaa    7260

ccgtctcttg gaggttcgta tgacactagt ggttcccctc agcttgcgac tagatgttga    7320

ggcctaacat tttattagag agcaggctag ttgcttagat acatgatctt caggccgtta    7380

tctgtcaggg caagcgaaaa ttggccattt atgacgacca atgccccgca gaagctccca    7440

tctttgccgc catagacgcc gcgcccccct tttggggtgt agaacatcct tttgccagat    7500

gtggaaaaga agttcgttgt cccattgttg gcaatgacgt agtagccggc gaaagtgcga    7560

gacccatttg cgctatatat aagcctacga tttccgttgc gactattgtc gtaattggat    7620

gaactattat cgtagttgct ctcagagttg tcgtaatttg atggactatt gtcgtaattg    7680

cttatggagt tgtcgtagtt gcttggagaa atgtcgtagt tggatgggga gtagtcatag    7740

ggaagacgag cttcatccac taaaacaatt ggcaggtcag caagtgcctg ccccgatgcc    7800

atcgcaagta cgaggcttag aaccaccttc aacagatcgc gcatagtctt ccccagctct    7860

ctaacgcttg agttaagccg cgccgcgaag cggcgtcggc ttgaacgaat tgttagacat    7920

tatttgccga ctaccttggt gatctcgcct ttcacgtagt gaacaaattc ttccaactga    7980

tctgcgcgcg aggccaagcg atcttcttgt ccaagataag cctgcctagc ttcaagtatg    8040

acgggctgat actgggccgg caggcgctcc attgcccagt cggcagcgac atccttcggc    8100

gcgattttgc cggttactgc gctgtaccaa atgcgggaca acgtaagcac tacatttcgc    8160

tcatcgccag cccagtcggg cggcgagttc catagcgtta aggtttcatt tagcgcctca    8220

aatagatcct gttcaggaac cggatcaaag agttcctccg ccgctggacc taccaaggca    8280

acgctatgtt ctcttgcttt tgtcagcaag atagccagat caatgtcgat cgtggctggc    8340

tcgaagatac ctgcaagaat gtcattgcgc tgccattctc caaattgcag ttcgcgctta    8400

gctggataac gccacggaat gatgtcgtcg tgcacaacaa tggtgacttc tacagcgcgg    8460

agaatctcgc tctctccagg ggaagccgaa gtttccaaaa ggtcgttgat caaagctcgc    8520

cgcgttgttt catcaagcct tacagtcacc gtaaccagca aatcaatatc actgtgtggc    8580

ttcaggccgc catccactgc ggagccgtac aaatgtacgg ccagcaacgt cggttcgaga    8640

tggcgctcga tgacgccaac tacctctgat agttgagtcg atacttcggc gatcaccgct    8700

tccctcatga tgtttaactc ctgaattaag ccgcgccgcg aagcggtgtc ggcttgaatg    8760

aattgttagg cgtcatcctg tgctcccgag aaccagtacc agtacatcgc tgtttcgttc    8820

gagacttgag gtctagtttt atacgtgaac aggtcaatgc cgccgagagt aaagccacat    8880

tttgcgtaca aattgcaggc aggtacattg ttcgtttgtg tctctaatcg tatgccaagg    8940

agctgtctgc ttagtgccca ctttttcgca aattcgatga gactgtgcgc gactcctttg    9000

cctcggtgcg tgtgcgacac aacaatgtgt tcgatagagg ctagatcgtt ccatgttgag    9060

ttgagttcaa tcttcccgac aagctcttgg tcgatgaatg cgccatagca agcagagtct    9120

tcatcagagt catcatccga gatgtaatcc ttccggtagg ggctcacact tctggtagat    9180

agttcaaagc cttggtcgga taggtgcaca tcgaacactt cacgaacaat gaaatggttc    9240

tcagcatcca atgtttccgc cacctgctca gggatcaccg aaatcttcat atgacgccta    9300

acgcctggca cagcggatcg caaacctggc gcggcttttg gcacaaaagg cgtgacaggt    9360

ttgcgaatcc gttgctgcca cttgttaacc cttttgccag atttggtaac tataatttat    9420

gttagaggcg aagtcttggg taaaaactgg cctaaaattg ctggggattt caggaaagta    9480

aacatcacct tccggctcga tgtctattgt agatatatgt agtgtatcta cttgatcggg    9540

ggatctgctg cctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc    9600

cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg    9660

cgtcagcggg tgttggcggg tgtcggggcg cagccatgac ccagtcacgt agcgatagcg    9720

gagtgtatac tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat    9780

gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc    9840

ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca    9900

ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg    9960

agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca    10020

taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa    10080

cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc    10140

tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc    10200

gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct    10260

gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg    10320

tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag    10380

gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta    10440

cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg    10500

aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt    10560

tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt    10620

ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag    10680

attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat    10740

ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc    10800

tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat    10860

aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc    10920

acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag    10980

aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag    11040

agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgctg cagggggggg    11100

gggggggggg gacttccatt gttcattcca cggacaaaaa cagagaaagg aaacgacaga    11160

ggccaaaaag cctcgctttc agcacctgtc gtttcctttc ttttcagagg gtattttaaa    11220

taaaaacatt aagttatgac gaagaagaac ggaaacgcct taaaccggaa aattttcata    11280

aatagcgaaa acccgcgagg tcgccgcccc gtaacctgtc ggatcaccgg aaaggacccg    11340

taaagtgata atgattatca tctacatatc acaacgtgcg tggaggccat caaaccacgt    11400

caaataatca attatgacgc aggtatcgta ttaattgatc tgcatcaact taacgtaaaa  11460

acaacttcag acaatacaaa tcagcgacac tgaatacggg gcaacctcat gtcccccccc  11520

cccccccccc tgcaggcatc gtggtgtcac gctcgtcgtt tggtatggct tcattcagct  11580

ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa aaagcggtta  11640

gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg  11700

ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc ttttctgtga  11760

ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg agttgctctt  11820

gcccggcgtc aacacgggat aataccgcgc cacatagcag aactttaaaa gtgctcatca  11880

ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg agatccagtt  11940

cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc accagcgttt  12000

ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga  12060

aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat cagggttatt  12120

gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata ggggttccgc  12180

gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc atgacattaa  12240

cctataaaaa taggcgtatc acgaggccct ttcgtcttca agaattggtc gacgatcttg  12300

ctgcgttcgg atattttcgt ggagttcccg ccacagaccc ggattgaagg cgagatccag  12360

caactcgcgc cagatcatcc tgtgacggaa ctttggcgcg tgatgactgg ccaggacgtc  12420

ggccgaaaga gcgacaagca gatcacgctt ttcgacagcg tcggatttgc gatcgaggat  12480

ttttcggcgc tgcgctacgt ccgcgaccgc gttgagggat caagccacag cagcccactc  12540

gaccttctag ccgacccaga cgagccaagg gatctttttg gaatgctgct ccgtcgtcag  12600

gctttccgac gtttgggtgg ttgaacagaa gtcattatcg tacggaatgc caagcactcc  12660

cgaggggaac cctgtggttg gcatgcacat acaaatggac gaacggataa accttttcac  12720

gcccttttaa atatccgtta ttctaataaa cgctcttttc tcttaggttt acccgccaat  12780

atatcctgtc aaacactgat agtttaaact gaaggcggga aacgacaatc tgatcatgag  12840

cggagaatta agggagtcac gttatgaccc ccgccgatga cgcgggacaa gccgttttac  12900

gtttggaact gacagaaccg caacgttgaa ggagccactc agcaagctgg tacgattgta  12960

atacgactca ctatagggcg aattgagcgc tgtttaaacg ctcttcaact ggaagagcg   13019

 

<210>9

<211>2991

<212>DNA

<213>人工序列

 

<220>

<223>载体

 

<400>9

ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga  60

taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga  120

gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca  180

cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaata cgcgtaccgc  240

tagccaggaa gagtttgtag aaacgcaaaa aggccatccg tcaggatggc cttctgctta  300

gtttgatgcc tggcagttta tggcgggcgt cctgcccgcc accctccggg ccgttgcttc  360

acaacgttca aatccgctcc cggcggattt gtcctactca ggagagcgtt caccgacaaa  420

caacagataa aacgaaaggc ccagtcttcc gactgagcct ttcgttttat ttgatgcctg  480

gcagttccct actctcgcgt taacgctagc atggatgttt tcccagtcac gacgttgtaa  540

aacgacggcc agtcttaagc tcgggccctg cagctctaga gctcgaattc tacaggtcac  600

taataccatc taagtagttg gttcatagtg actgcatatg ttgtgtttta cagtattatg  660

tagtctgttt tttatgcaaa atctaattta atatattgat atttatatca ttttacgttt  720

ctcgttcaac tttcttgtac aaagtggccg ttaacggatc cagacttgtc catcttctgg  780

attggccaac ttaattaatg tatgaaataa aaggatgcac acatagtgac atgctaatca  840

ctataatgtg ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct gaataaaaga  900

gaaagagatc atccatattt cttatcctaa atgaatgtca cgtgtcttta taattctttg  960

atgaaccaga tgcatttcat taaccaaatc catatacata taaatattaa tcatatataa  1020

ttaatatcaa ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg aattgcggca  1080

agcttgcggc cgccccgggc aactttatta tacaaagttg gcattataaa aaagcattgc  1140

ttatcaattt gttgcaacga acaggtcact atcagtcaaa ataaaatcat tatttggagc  1200

tccatggtag cgttaacgcg gccgcgatat cccctatagt gagtcgtatt acatggtcat  1260

agctgtttcc tggcagctct ggcccgtgtc tcaaaatctc tgatgttaca ttgcacaaga  1320

taaaaatata tcatcatgaa caataaaact gtctgcttac ataaacagta atacaagggg  1380

tgttatgagc catattcaac gggaaacgtc gaggccgcga ttaaattcca acatggatgc  1440

tgatttatat gggtataaat gggctcgcga taatgtcggg caatcaggtg cgacaatcta  1500

tcgcttgtat gggaagcccg atgcgccaga gttgtttctg aaacatggca aaggtagcgt  1560

tgccaatgat gttacagatg agatggtcag actaaactgg ctgacggaat ttatgcctct  1620

tccgaccatc aagcatttta tccgtactcc tgatgatgca tggttactca ccactgcgat  1680

ccccggaaaa acagcattcc aggtattaga agaatatcct gattcaggtg aaaatattgt  1740

tgatgcgctg gcagtgttcc tgcgccggtt gcattcgatt cctgtttgta attgtccttt  1800

taacagcgat cgcgtatttc gtctcgctca ggcgcaatca cgaatgaata acggtttggt  1860

tgatgcgagt gattttgatg acgagcgtaa tggctggcct gttgaacaag tctggaaaga  1920

aatgcataaa cttttgccat tctcaccgga ttcagtcgtc actcatggtg atttctcact  1980

tgataacctt atttttgacg aggggaaatt aataggttgt attgatgttg gacgagtcgg  2040

aatcgcagac cgataccagg atcttgccat cctatggaac tgcctcggtg agttttctcc  2100

ttcattacag aaacggcttt ttcaaaaata tggtattgat aatcctgata tgaataaatt  2160

gcagtttcat ttgatgctcg atgagttttt ctaatcagaa ttggttaatt ggttgtaaca  2220

ctggcagagc attacgctga cttgacggga cggcgcaagc tcatgaccaa aatcccttaa  2280

cgtgagttac gcgtcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc  2340

ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc  2400

agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt  2460

cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt  2520

caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc  2580

tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa  2640

ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac  2700

ctacaccgaa ctgagatacc tacagcgtga gcattgagaa agcgccacgc ttcccgaagg  2760

gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga  2820

gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact  2880

tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa  2940

cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt t           2991

 

<210>10

<211>13807

<212>DNA

<213>人工序列

 

<220>

<223>载体

 

<400>10

aagctggtac gattgtaata cgactcacta tagggcgaat tgagcgctgt ttaaacgctc    60

ttcaactgga agagcggtta ccagagctgg tcacctttgt ccaccaagat ggaactgcgg    120

ccgctcatta attaagtcag gcgcgcctct agttgaagac acgttcatgt cttcatcgta    180

agaagacact cagtagtctt cggccagaat ggccgtaggt gaattaagag gagagaggag    240

gtaaacattt tcttctattt tttcatattt tcaggataaa ttattgtaaa agtttacaag    300

atttccattt gactagtgta aatgaggaat attctctagt aagatcatta tttcatctac    360

ttcttttatc ttctaccagt agaggaataa acaatattta gctcctttgt aaatacaaat    420

taattttcgt tcttgacatc attcaatttt aattttacgt ataaaataaa agatcatacc    480

tattagaacg attaaggaga aatacaattc gaatgagaag gatgtgccgt ttgttataat    540

aaacagccac acgacgtaaa cgtaaaatga ccacatgatg ggccaataga catggaccga    600

ctactaataa tagtaagtta cattttagga tggaataaat atcataccga catcagtttg    660

aaagaaaagg gaaaaaaaga aaaaataaat aaaagatata ctaccgacat gagttccaaa    720

aagcaaaaaa aaagatcaag ccgacacaga cacgcgtaga gagcaaaatg actttgacgt    780

cacaccacga aaacagacgc ttcatacgtg tccctttatc tctctcagtc tctctataaa    840

cttagtgaga ccctcctctg ttttactcag gatccccggg taccgagctc gaattcaccg    900

gtcgccacca tggcccacag caagcacggc ctgaaggagg agatgaccat gaagtaccac    960

atggagggct gcgtgaacgg ccacaagttc gtgatcaccg gcgagggcat cggctacccc    1020

ttcaagggca agcagaccat caacctgtgc gtgatcgagg gcggccccct gcccttcagc    1080

gaggacatcc tgagcgccgg cttcaagtac ggcgaccgga tcttcaccga gtacccccag    1140

gacatcgtgg actacttcaa gaacagctgc cccgccggct acacctgggg ccggagcttc    1200

ctgttcgagg acggcgccgt gtgcatctgt aacgtggaca tcaccgtgag cgtgaaggag    1260

aactgcatct accacaagag catcttcaac ggcgtgaact tccccgccga cggccccgtg    1320

atgaagaaga tgaccaccaa ctgggaggcc agctgcgaga agatcatgcc cgtgcctaag    1380

cagggcatcc tgaagggcga cgtgagcatg tacctgctgc tgaaggacgg cggccggtac    1440

cggtgccagt tcgacaccgt gtacaaggcc aagagcgtgc ccagcaagat gcccgagtgg    1500

cacttcatcc agcacaagct gctgcgggag gaccggagcg acgccaagaa ccagaagtgg    1560

cagctgaccg agcacgccat cgccttcccc agcgccctgg cctgaagcgg cccatggata    1620

ttcgaacgcg taggtaccac atggttaacc tagacttgtc catcttctgg attggccaac    1680

ttaattaatg tatgaaataa aaggatgcac acatagtgac atgctaatca ctataatgtg    1740

ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct gaataaaaga gaaagagatc    1800

atccatattt cttatcctaa atgaatgtca cgtgtcttta taattctttg atgaaccaga    1860

tgcatttcat taaccaaatc catatacata taaatattaa tcatatataa ttaatatcaa    1920

ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg aatgcggcca ttggcctaga    1980

aggccattta aatcctgagg atctggtctt cctaaggacc cgggatatcg ctatcaactt    2040

tgtatagaaa agttgaacga gaaacgtaaa atgatataaa tatcaatata ttaaattaga    2100

ttttgcataa aaaacagact acataatact gtaaaacaca acatatccag tcactatggt    2160

cgacctgcag actggctgtg tataagggag cctgacattt atattcccca gaacatcagg    2220

ttaatggcgt ttttgatgtc attttcgcgg tggctgagat cagccacttc ttccccgata    2280

acggagaccg gcacactggc catatcggtg gtcatcatgc gccagctttc atccccgata    2340

tgcaccaccg ggtaaagttc acgggggact ttatctgaca gcagacgtgc actggccagg    2400

gggatcacca tccgtcgccc gggcgtgtca ataatatcac tctgtacatc cacaaacaga    2460

cgataacggc tctctctttt ataggtgtaa accttaaact gcatttcacc agcccctgtt    2520

ctcgtcggca aaagagccgt tcatttcaat aaaccgggcg acctcagcca tcccttcctg    2580

attttccgct ttccagcgtt cggcacgcag acgacgggct tcattctgca tggttgtgct    2640

taccgaaccg gagatattga catcatatat gccttgagca actgatagct gtcgctgtca    2700

actgtcactg taatacgctg cttcatagca tacctctttt tgacatactt cgggtataca    2760

tatcagtata tattcttata ccgcaaaaat cagcgcgcaa atacgcatac tgttatctgg    2820

cttttagtaa gccggatcct ctagattacg ccccgcctgc cactcatcgc agtactgttg    2880

taattcatta agcattctgc cgacatggaa gccatcacaa acggcatgat gaacctgaat    2940

cgccagcggc atcagcacct tgtcgccttg cgtataatat ttgcccatgg tgaaaacggg    3000

ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa ctggtgaaac tcacccaggg    3060

attggctgag acgaaaaaca tattctcaat aaacccttta gggaaatagg ccaggttttc    3120

accgtaacac gccacatctt gcgaatatat gtgtagaaac tgccggaaat cgtcgtggta    3180

ttcactccag agcgatgaaa acgtttcagt ttgctcatgg aaaacggtgt aacaagggtg    3240

aacactatcc catatcacca gctcaccgtc tttcattgcc atacggaatt ccggatgagc    3300

attcatcagg cgggcaagaa tgtgaataaa ggccggataa aacttgtgct tatttttctt    3360

tacggtcttt aaaaaggccg taatatccag ctgaacggtc tggttatagg tacattgagc    3420

aactgactga aatgcctcaa aatgttcttt acgatgccat tgggatatat caacggtggt    3480

atatccagtg atttttttct ccattttagc ttccttagct cctgaaaatc tcgacggatc    3540

ctaactcaaa atccacacat tatacgagcc ggaagcataa agtgtaaagc ctggggtgcc    3600

ctaatgcggc cgccatagtg actggatatg ttgtgtttta cagtattatg tagtctgttt    3660

tttatgcaaa atctaattta atatattgat atttatatca ttttacgttt ctcgttcaac    3720

tttattatac aaagttgata gatatcggac cgattaaact ttaattcggt ccgaagcttg    3780

catgcctgca gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat    3840

gtctaagtta taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt    3900

atctatcttt atacatatat ttaaacttta ctctacgaat aatataatct atagtactac    3960

aataatatca gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca    4020

attgagtatt ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc    4080

tttttttttg caaatagctt cacctatata atacttcatc cattttatta gtacatccat    4140

ttagggttta gggttaatgg tttttataga ctaatttttt tagtacatct attttattct    4200

attttagcct ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt    4260

agatataaaa tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt    4320

aaaaaaacta aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc    4380

gtcgacgagt ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa    4440

gcagacggca cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc    4500

gttggacttg ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc    4560

ggcacggcag gcggcctcct cctcctctca cggcaccggc agctacgggg gattcctttc    4620

ccaccgctcc ttcgctttcc cttcctcgcc cgccgtaata aatagacacc ccctccacac    4680

cctctttccc caacctcgtg ttgttcggag cgcacacaca cacaaccaga tctcccccaa    4740

atccacccgt cggcacctcc gcttcaaggt acgccgctcg tcctcccccc cccccctctc    4800

taccttctct agatcggcgt tccggtccat gcatggttag ggcccggtag ttctacttct    4860

gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg ttcgtacacg    4920

gatgcgacct gtacgtcaga cacgttctga ttgctaactt gccagtgttt ctctttgggg    4980

aatcctggga tggctctagc cgttccgcag acgggatcga tttcatgatt ttttttgttt    5040

cgttgcatag ggtttggttt gcccttttcc tttatttcaa tatatgccgt gcacttgttt    5100

gtcgggtcat cttttcatgc ttttttttgt cttggttgtg atgatgtggt ctggttgggc    5160

ggtcgttcta gatcggagta gaattctgtt tcaaactacc tggtggattt attaattttg    5220

gatctgtatg tgtgtgccat acatattcat agttacgaat tgaagatgat ggatggaaat    5280

atcgatctag gataggtata catgttgatg cgggttttac tgatgcatat acagagatgc    5340

tttttgttcg cttggttgtg atgatgtggt gtggttgggc ggtcgttcat tcgttctaga    5400

tcggagtaga atactgtttc aaactacctg gtgtatttat taattttgga actgtatgtg    5460

tgtgtcatac atcttcatag ttacgagttt aagatggatg gaaatatcga tctaggatag    5520

gtatacatgt tgatgtgggt tttactgatg catatacatg atggcatatg cagcatctat    5580

tcatatgctc taaccttgag tacctatcta ttataataaa caagtatgtt ttataattat    5640

tttgatcttg atatacttgg atgatggcat atgcagcagc tatatgtgga tttttttagc    5700

cctgccttca tacgctattt atttgcttgg tactgtttct tttgtcgatg ctcaccctgt    5760

tgtttggtgt tacttctgca ggtcgacttt aacttagcct aggatccaca cgacaccatg    5820

tcccccgagc gccgccccgt cgagatccgc ccggccaccg ccgccgacat ggccgccgtg    5880

tgcgacatcg tgaaccacta catcgagacc tccaccgtga acttccgcac cgagccgcag    5940

accccgcagg agtggatcga cgacctggag cgcctccagg accgctaccc gtggctcgtg    6000

gccgaggtgg agggcgtggt ggccggcatc gcctacgccg gcccgtggaa ggcccgcaac    6060

gcctacgact ggaccgtgga gtccaccgtg tacgtgtccc accgccacca gcgcctcggc    6120

ctcggctcca ccctctacac ccacctcctc aagagcatgg aggcccaggg cttcaagtcc    6180

gtggtggccg tgatcggcct cccgaacgac ccgtccgtgc gcctccacga ggccctcggc    6240

tacaccgccc gcggcaccct ccgcgccgcc ggctacaagc acggcggctg gcacgacgtc    6300

ggcttctggc agcgcgactt cgagctgccg gccccgccgc gcccggtgcg cccggtgacg    6360

cagatctccg gtggaggcgg cagcggtggc ggaggctccg gaggcggtgg ctccatggcc    6420

tcctccgagg acgtcatcaa ggagttcatg cgcttcaagg tgcgcatgga gggctccgtg    6480

aacggccacg agttcgagat cgagggcgag ggcgagggcc gcccctacga gggcacccag    6540

accgccaagc tgaaggtgac caagggcggc cccctgccct tcgcctggga catcctgtcc    6600

ccccagttcc agtacggctc caaggtgtac gtgaagcacc ccgccgacat ccccgactac    6660

aagaagctgt ccttccccga gggcttcaag tgggagcgcg tgatgaactt cgaggacggc    6720

ggcgtggtga ccgtgaccca ggactcctcc ctgcaggacg gctccttcat ctacaaggtg    6780

aagttcatcg gcgtgaactt cccctccgac ggccccgtaa tgcagaagaa gactatgggc    6840

tgggaggcct ccaccgagcg cctgtacccc cgcgacggcg tgctgaaggg cgagatccac    6900

aaggccctga agctgaagga cggcggccac tacctggtgg agttcaagtc catctacatg    6960

gccaagaagc ccgtgcagct gcccggctac tactacgtgg actccaagct ggacatcacc    7020

tcccacaacg aggactacac catcgtggag cagtacgagc gcgccgaggg ccgccaccac    7080

ctgttcctgt agtcaggatc tgagtcgaaa cctagacttg tccatcttct ggattggcca    7140

acttaattaa tgtatgaaat aaaaggatgc acacatagtg acatgctaat cactataatg    7200

tgggcatcaa agttgtgtgt tatgtgtaat tactagttat ctgaataaaa gagaaagaga    7260

tcatccatat ttcttatcct aaatgaatgt cacgtgtctt tataattctt tgatgaacca    7320

gatgcatttc attaaccaaa tccatataca tataaatatt aatcatatat aattaatatc    7380

aattgggtta gcaaaacaaa tctagtctag gtgtgttttg cgaatgcggc cgccaccgcg    7440

gtggagctcg aattcattcc gattaatcgt ggcctcttgc tcttcaggat gaagagctat    7500

gtttaaacgt gcaagcgcta ctagacaatt cagtacatta aaaacgtccg caatgtgtta    7560

ttaagttgtc taagcgtcaa tttgtttaca ccacaatata tcctgccacc agccagccaa    7620

cagctccccg accggcagct cggcacaaaa tcaccactcg atacaggcag cccatcagtc    7680

cgggacggcg tcagcgggag agccgttgta aggcggcaga ctttgctcat gttaccgatg    7740

ctattcggaa gaacggcaac taagctgccg ggtttgaaac acggatgatc tcgcggaggg    7800

tagcatgttg attgtaacga tgacagagcg ttgctgcctg tgatcaaata tcatctccct    7860

cgcagagatc cgaattatca gccttcttat tcatttctcg cttaaccgtg acaggctgtc    7920

gatcttgaga actatgccga cataatagga aatcgctgga taaagccgct gaggaagctg    7980

agtggcgcta tttctttaga agtgaacgtt gacgatcgtc gaccgtaccc cgatgaatta    8040

attcggacgt acgttctgaa cacagctgga tacttacttg ggcgattgtc atacatgaca    8100

tcaacaatgt acccgtttgt gtaaccgtct cttggaggtt cgtatgacac tagtggttcc    8160

cctcagcttg cgactagatg ttgaggccta acattttatt agagagcagg ctagttgctt    8220

agatacatga tcttcaggcc gttatctgtc agggcaagcg aaaattggcc atttatgacg    8280

accaatgccc cgcagaagct cccatctttg ccgccataga cgccgcgccc cccttttggg    8340

gtgtagaaca tccttttgcc agatgtggaa aagaagttcg ttgtcccatt gttggcaatg    8400

acgtagtagc cggcgaaagt gcgagaccca tttgcgctat atataagcct acgatttccg    8460

ttgcgactat tgtcgtaatt ggatgaacta ttatcgtagt tgctctcaga gttgtcgtaa    8520

tttgatggac tattgtcgta attgcttatg gagttgtcgt agttgcttgg agaaatgtcg    8580

tagttggatg gggagtagtc atagggaaga cgagcttcat ccactaaaac aattggcagg    8640

tcagcaagtg cctgccccga tgccatcgca agtacgaggc ttagaaccac cttcaacaga    8700

tcgcgcatag tcttccccag ctctctaacg cttgagttaa gccgcgccgc gaagcggcgt    8760

cggcttgaac gaattgttag acattatttg ccgactacct tggtgatctc gcctttcacg    8820

tagtgaacaa attcttccaa ctgatctgcg cgcgaggcca agcgatcttc ttgtccaaga    8880

taagcctgcc tagcttcaag tatgacgggc tgatactggg ccggcaggcg ctccattgcc    8940

cagtcggcag cgacatcctt cggcgcgatt ttgccggtta ctgcgctgta ccaaatgcgg    9000

gacaacgtaa gcactacatt tcgctcatcg ccagcccagt cgggcggcga gttccatagc    9060

gttaaggttt catttagcgc ctcaaataga tcctgttcag gaaccggatc aaagagttcc    9120

tccgccgctg gacctaccaa ggcaacgcta tgttctcttg cttttgtcag caagatagcc    9180

agatcaatgt cgatcgtggc tggctcgaag atacctgcaa gaatgtcatt gcgctgccat    9240

tctccaaatt gcagttcgcg cttagctgga taacgccacg gaatgatgtc gtcgtgcaca    9300

acaatggtga cttctacagc gcggagaatc tcgctctctc caggggaagc cgaagtttcc    9360

aaaaggtcgt tgatcaaagc tcgccgcgtt gtttcatcaa gccttacagt caccgtaacc    9420

agcaaatcaa tatcactgtg tggcttcagg ccgccatcca ctgcggagcc gtacaaatgt    9480

acggccagca acgtcggttc gagatggcgc tcgatgacgc caactacctc tgatagttga    9540

gtcgatactt cggcgatcac cgcttccctc atgatgttta actcctgaat taagccgcgc    9600

cgcgaagcgg tgtcggcttg aatgaattgt taggcgtcat cctgtgctcc cgagaaccag    9660

taccagtaca tcgctgtttc gttcgagact tgaggtctag ttttatacgt gaacaggtca    9720

atgccgccga gagtaaagcc acattttgcg tacaaattgc aggcaggtac attgttcgtt    9780

tgtgtctcta atcgtatgcc aaggagctgt ctgcttagtg cccacttttt cgcaaattcg    9840

atgagactgt gcgcgactcc tttgcctcgg tgcgtgtgcg acacaacaat gtgttcgata    9900

gaggctagat cgttccatgt tgagttgagt tcaatcttcc cgacaagctc ttggtcgatg    9960

aatgcgccat agcaagcaga gtcttcatca gagtcatcat ccgagatgta atccttccgg    10020

taggggctca cacttctggt agatagttca aagccttggt cggataggtg cacatcgaac    10080

acttcacgaa caatgaaatg gttctcagca tccaatgttt ccgccacctg ctcagggatc    10140

accgaaatct tcatatgacg cctaacgcct ggcacagcgg atcgcaaacc tggcgcggct    10200

tttggcacaa aaggcgtgac aggtttgcga atccgttgct gccacttgtt aacccttttg    10260

ccagatttgg taactataat ttatgttaga ggcgaagtct tgggtaaaaa ctggcctaaa    10320

attgctgggg atttcaggaa agtaaacatc accttccggc tcgatgtcta ttgtagatat    10380

atgtagtgta tctacttgat cgggggatct gctgcctcgc gcgtttcggt gatgacggtg    10440

aaaacctctg acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg  10500

ggagcagaca agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggcgcagcca  10560

tgacccagtc acgtagcgat agcggagtgt atactggctt aactatgcgg catcagagca  10620

gattgtactg agagtgcacc atatgcggtg tgaaataccg cacagatgcg taaggagaaa  10680

ataccgcatc aggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg  10740

gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg  10800

ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa  10860

ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg  10920

acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc  10980

tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc  11040

ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc  11100

ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg  11160

ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc  11220

actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga  11280

gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc  11340

tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac  11400

caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg  11460

atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc  11520

acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa  11580

ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta  11640

ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt  11700

tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag  11760

tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca  11820

gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc  11880

tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt  11940

tgttgccatt gctgcagggg gggggggggg gggggacttc cattgttcat tccacggaca  12000

aaaacagaga aaggaaacga cagaggccaa aaagcctcgc tttcagcacc tgtcgtttcc  12060

tttcttttca gagggtattt taaataaaaa cattaagtta tgacgaagaa gaacggaaac  12120

gccttaaacc ggaaaatttt cataaatagc gaaaacccgc gaggtcgccg ccccgtaacc  12180

tgtcggatca ccggaaagga cccgtaaagt gataatgatt atcatctaca tatcacaacg  12240

tgcgtggagg ccatcaaacc acgtcaaata atcaattatg acgcaggtat cgtattaatt  12300

gatctgcatc aacttaacgt aaaaacaact tcagacaata caaatcagcg acactgaata  12360

cggggcaacc tcatgtcccc cccccccccc cccctgcagg catcgtggtg tcacgctcgt  12420

cgtttggtat ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc  12480

ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt  12540

tggccgcagt gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc  12600

catccgtaag atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt  12660

gtatgcggcg accgagttgc tcttgcccgg cgtcaacacg ggataatacc gcgccacata  12720

gcagaacttt aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga  12780

tcttaccgct gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag  12840

catcttttac tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa  12900

aaaagggaat aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt  12960

attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga  13020

aaaataaaca aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag  13080

aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc  13140

ttcaagaatt ggtcgacgat cttgctgcgt tcggatattt tcgtggagtt cccgccacag  13200

acccggattg aaggcgagat ccagcaactc gcgccagatc atcctgtgac ggaactttgg  13260

cgcgtgatga ctggccagga cgtcggccga aagagcgaca agcagatcac gcttttcgac  13320

agcgtcggat ttgcgatcga ggatttttcg gcgctgcgct acgtccgcga ccgcgttgag  13380

ggatcaagcc acagcagccc actcgacctt ctagccgacc cagacgagcc aagggatctt  13440

tttggaatgc tgctccgtcg tcaggctttc cgacgtttgg gtggttgaac agaagtcatt  13500

atcgtacgga atgccaagca ctcccgaggg gaaccctgtg gttggcatgc acatacaaat  13560

ggacgaacgg ataaaccttt tcacgccctt ttaaatatcc gttattctaa taaacgctct  13620

tttctcttag gtttacccgc caatatatcc tgtcaaacac tgatagttta aactgaaggc  13680

gggaaacgac aatctgatca tgagcggaga attaagggag tcacgttatg acccccgccg  13740

atgacgcggg acaagccgtt ttacgtttgg aactgacaga accgcaacgt tgaaggagcc  13800

actcagc                                                            13807

 

<210>11

<211>4678

<212>DNA

<213>人工序列

 

<220>

<223>载体

 

<400>11

gaaaggccca gtcttccgac tgagcctttc gttttatttg atgcctggca gttccctact    60

ctcgcgttaa cgctagcatg gatgttttcc cagtcacgac gttgtaaaac gacggccagt    120

cttaagctcg ggcccgcgtt aacgctacca tggagctcca aataatgatt ttattttgac    180

tgatagtgac ctgttcgttg caacaaattg ataagcaatg cttttttata atgccaactt    240

tgtatagaaa agttgggccg aattcgagct cggtacggcc agaatggccc ggaccgggtt    300

accgaattcg agctcggtac cctgggatcc ctggtaatta ttggctgtag gattctaaac    360

agagcctaaa tagctggaat agctctagcc ctcaatccaa actaatgata tctatactta    420

tgcaactcta aatttttatt ctaaaagtaa tatttcattt ttgtcaacga gattctctac    480

tctattccac aatcttttga agcaatattt accttaaatc tgtactctat accaataatc    540

atatattcta ttatttattt ttatctctct cctaaggagc atccccctat gtctgcatgg    600

cccccgcctc gggtcccaat ctcttgctct gctagtagca cagaagaaaa cactagaaat    660

gacttgcttg acttagagta tcagataaac atcatgttta cttaacttta atttgtatcg    720

gtttctacta tttttataat atttttgtct ctatagatac tacgtgcaac agtataatca    780

acctagttta atccagagcg aaggattttt tactaagtac gtgactccat atgcacagcg    840

ttccttttat ggttcctcac tgggcacagc ataaacgaac cctgtccaat gttttcagcg    900

cgaacaaaca gaaattccat cagcgaacaa acaacataca tgcgagatga aaataaataa    960

taaaaaaagc tccgtctcga taggccggca cgaatcgaga gcctccatag ccagtttttt    1020

ccatcggaac ggcggttcgc gcacctaatt atatgcacca cacgcctata aagccaacca    1080

acccgtcgga ggggcgcaag ccagacagaa gacagcccgt cagcccctct cgtttttcat    1140

ccgccttcgc ctccaaccgc gtgcgctcca cgcctcctcc aggaaagcga ggatctcccc    1200

caaatccacc cgtcggcacc tccgcttcaa ggtacgccgc tcgtcctccc cccccccccc    1260

tctctacctt ctctagatcg gcgttccggt ccatggttag ggcccggtag ttctacttct    1320

gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt gctgctagcg ttcgtacacg    1380

gatgcgacct gtacgtcaga cacgttctga ttgctaactt gccagtgttt ctctttgggg    1440

aatcctggga tggctctagc cgttccgcag acgggatcga tttcatgatt ttttttgttt    1500

cgttgcatag ggtttggttt gcccttttcc tttatttcaa tatatgccgt gcacttgttt    1560

gtcgggtcat cttttcatgc ttttttttgt cttggttgtg atgatgtggt ctggttgggc    1620

ggtcgttcta gatcggagta gaattctgtt tcaaactacc tggtggattt attaattttg    1680

gatctgtatg tgtgtgccat acatattcat agttacgaat tgaagatgat ggatggaaat    1740

atcgatctag gataggtata catgttgatg cgggttttac tgatgcatat acagagatgc    1800

tttttgttcg cttggttgtg atgatgtggt gtggttgggc ggtcgttcat tcgttctaga    1860

tcggagtaga atactgtttc aaactacctg gtgtatttat taattttgga actgtatgtg    1920

tgtgtcatac atcttcatag ttacgagttt aagatggatg gaaatatcga tctaggatag    1980

gtatacatgt tgatgtgggt tttactgatg catatacatg atggcatatg cagcatctat    2040

tcatatgctc taaccttgag tacctatcta ttataataaa caagtatgtt ttataattat    2100

tttgatcttg atatacttgg atgatggcat atgcagcagc tatatgtgga tttttttagc    2160

cctgccttca tacgctattt atttgcttgg tactgtttct tttgtcgatg ctcaccctgt    2220

tgtttggtgt tacttctgca ggtcgactct agaagcttgg tcacccggtc cgggcctaga    2280

aggccagctt caagtttgta caaaaaagtt gaacgagaaa cgtaaaatga tataaatatc    2340

aatatattaa attagatttt gcataaaaaa cagactacat aatactgtaa aacacaacat    2400

atgcagtcac tatgaatcaa ctacttagat ggtattagtg acctgtagaa ttcgagctct    2460

agagctgcag ggcggccgcg atatccccta tagtgagtcg tattacatgg tcatagctgt    2520

ttcctggcag ctctggcccg tgtctcaaaa tctctgatgt tacattgcac aagataaaaa    2580

tatatcatca tgaacaataa aactgtctgc ttacataaac agtaatacaa ggggtgttat    2640

gagccatatt caacgggaaa cgtcgaggcc gcgattaaat tccaacatgg atgctgattt    2700

atatgggtat aaatgggctc gcgataatgt cgggcaatca ggtgcgacaa tctatcgctt    2760

gtatgggaag cccgatgcgc cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa    2820

tgatgttaca gatgagatgg tcagactaaa ctggctgacg gaatttatgc ctcttccgac    2880

catcaagcat tttatccgta ctcctgatga tgcatggtta ctcaccactg cgatccccgg    2940

aaaaacagca ttccaggtat tagaagaata tcctgattca ggtgaaaata ttgttgatgc    3000

gctggcagtg ttcctgcgcc ggttgcattc gattcctgtt tgtaattgtc cttttaacag    3060

cgatcgcgta tttcgtctcg ctcaggcgca atcacgaatg aataacggtt tggttgatgc    3120

gagtgatttt gatgacgagc gtaatggctg gcctgttgaa caagtctgga aagaaatgca    3180

taaacttttg ccattctcac cggattcagt cgtcactcat ggtgatttct cacttgataa    3240

ccttattttt gacgagggga aattaatagg ttgtattgat gttggacgag tcggaatcgc  3300

agaccgatac caggatcttg ccatcctatg gaactgcctc ggtgagtttt ctccttcatt  3360

acagaaacgg ctttttcaaa aatatggtat tgataatcct gatatgaata aattgcagtt  3420

tcatttgatg ctcgatgagt ttttctaatc agaattggtt aattggttgt aacactggca  3480

gagcattacg ctgacttgac gggacggcgc aagctcatga ccaaaatccc ttaacgtgag  3540

ttacgcgtcg ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga  3600

tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt  3660

ggtttgtttg ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag  3720

agcgcagata ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa  3780

ctctgtagca ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag  3840

tggcgataag tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca  3900

gcggtcgggc tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac  3960

cgaactgaga tacctacagc gtgagcattg agaaagcgcc acgcttcccg aagggagaaa  4020

ggcggacagg tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc  4080

agggggaaac gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg  4140

tcgatttttg tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc  4200

ctttttacgg ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc  4260

ccctgattct gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag  4320

ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc caatacgcaa  4380

accgcctctc cccgcgcgtt ggccgattca ttaatgcagc tggcacgaca ggtttcccga  4440

ctggaaagcg ggcagtgagc gcaacgcaat taatacgcgt accgctagcc aggaagagtt  4500

tgtagaaacg caaaaaggcc atccgtcagg atggccttct gcttagtttg atgcctggca  4560

gtttatggcg ggcgtcctgc ccgccaccct ccgggccgtt gcttcacaac gttcaaatcc  4620

gctcccggcg gatttgtcct actcaggaga gcgttcaccg acaaacaaca gataaaac    4678

 

<210>12

<211>3505

<212>DNA

<213>人工序列

 

<220>

<223>载体

 

<400>12

gatccccggg taccgagctc gaattcggcc caagtttgta caaaaaagtt gaacgagaaa    60

cgtaaaatga tataaatatc aatatattaa attagatttt gcataaaaaa cagactacat    120

aatactgtaa aacacaacat atgcagtcac tatgaatcaa ctacttagat ggtattagtg    180

acctgtagaa ttcgagctct agagctgcag ggcggccgcg atatccccta tagtgagtcg    240

tattacatgg tcatagctgt ttcctggcag ctctggcccg tgtctcaaaa tctctgatgt    300

tacattgcac aagataaaaa tatatcatca tgaacaataa aactgtctgc ttacataaac    360

agtaatacaa ggggtgttat gagccatatt caacgggaaa cgtcgaggcc gcgattaaat    420

tccaacatgg atgctgattt atatgggtat aaatgggctc gcgataatgt cgggcaatca    480

ggtgcgacaa tctatcgctt gtatgggaag cccgatgcgc cagagttgtt tctgaaacat    540

ggcaaaggta gcgttgccaa tgatgttaca gatgagatgg tcagactaaa ctggctgacg    600

gaatttatgc ctcttccgac catcaagcat tttatccgta ctcctgatga tgcatggtta    660

ctcaccactg cgatccccgg aaaaacagca ttccaggtat tagaagaata tcctgattca    720

ggtgaaaata ttgttgatgc gctggcagtg ttcctgcgcc ggttgcattc gattcctgtt    780

tgtaattgtc cttttaacag cgatcgcgta tttcgtctcg ctcaggcgca atcacgaatg    840

aataacggtt tggttgatgc gagtgatttt gatgacgagc gtaatggctg gcctgttgaa    900

caagtctgga aagaaatgca taaacttttg ccattctcac cggattcagt cgtcactcat    960

ggtgatttct cacttgataa ccttattttt gacgagggga aattaatagg ttgtattgat    1020

gttggacgag tcggaatcgc agaccgatac caggatcttg ccatcctatg gaactgcctc    1080

ggtgagtttt ctccttcatt acagaaacgg ctttttcaaa aatatggtat tgataatcct    1140

gatatgaata aattgcagtt tcatttgatg ctcgatgagt ttttctaatc agaattggtt    1200

aattggttgt aacactggca gagcattacg ctgacttgac gggacggcgc aagctcatga    1260

ccaaaatccc ttaacgtgag ttacgcgtcg ttccactgag cgtcagaccc cgtagaaaag    1320

atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa    1380

aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg    1440

aaggtaactg gcttcagcag agcgcagata ccaaatactg tccttctagt gtagccgtag    1500

ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg    1560

ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga    1620

tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc    1680

ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagcattg agaaagcgcc    1740

acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga    1800

gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt    1860

cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg    1920

aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac    1980

atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga    2040

gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg    2100

gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca ttaatgcagc    2160

tggcacgaca ggtttcccga ctggaagcgg ggcagtgagc gcaacgaat  taatacgcgt    2220

accgctagcc aggaagagtt tgtagaaacg caaaaaggcc atccgtcagg atggccttct    2280

gcttagtttg atgcctggca gtttatggcg ggcgtcctgc ccgccaccct ccgggccgtt    2340

gcttcacaac gttcaaatcc gctcccggcg gatttgtcct actcaggaga gcgttcaccg    2400

acaaacaaca gataaaacga aaggcccagt cttccgactg agcctttcgt tttatttgat    2460

gcctggcagt tccctactct cgcgttaacg ctagcatgga tgttttccca gtcacgacgt    2520

tgtaaaacga cggccagtct taagctcggg cccgcgttaa cgctaccatg gagctccaaa    2580

taatgatttt attttgactg atagtgacct gttcgttgca acaaattgat aagcaatgct    2640

tttttataat gccaactttg tatagaaaag ttgaagctta aatccttaca gaattgctgt    2700

agtttcatag tgctagatgt ggacagcaaa gcgccgctgt atgcttctgc ttttcttttt    2760

tggtgtgtgt agccacatcc tttgttcctg cccggcgcca tcccacttgg ttgttttttt    2820

ttatgattga aagccttcat gcttcctcgg tcaatcaccg gtgcgcactg ggagcatcgc    2880

cggaaaaaaa attcttcggc taagagtaac ttctttctcc ttttcttctc tgatctcgcg    2940

agcagtgctg ataacgtgtt gtaatctact tagcggtaac gagattgaga gagacaaaat    3000

gacagaacta ttgtctttat tgcagagtgt catgtattta tacaggggat acaaagtctc    3060

ccaaggggtg tgtcccttgg gagtaactgc cagttgatca caggacaata ttttgtaaca    3120

aaacgtacac atcgtcaaaa tagcgaggca tgaaactggc cttggccatg gacgcgtgaa    3180

gcgcgccatg cgttggatat gtggtcaata agtatataca atacaatgtt taacagagct    3240

gatagtactg ctttggcaca tttttgtcca cgcttcatga gagataaaac acctgcacgt    3300

aaattcacat gctgcactga aggcccgatc actgaggagc gaactgccgt aactcccttc    3360

tatatatacc cccagtccct gtttcagttt tcgtcaagct agcagcacca agttgtcgat    3420

cacttgcctg ctcttgagct cgattaagct atcatcagct acagcatccg atcccaaact    3480

gcaactgtag cagcgacaac tgccg                                          3505

 

<210>13

<211>49765

<212>DNA

<213>人工序列

 

<220>

<223>载体

 

<400>13

gggggggggg ggggggggtt ccattgttca ttccacggac aaaaacagag aaaggaaacg    60

acagaggcca aaaagctcgc tttcagcacc tgtcgtttcc tttcttttca gagggtattt    120

taaataaaaa cattaagtta tgacgaagaa gaacggaaac gccttaaacc ggaaaatttt    180

cataaatagc gaaaacccgc gaggtcgccg ccccgtaacc tgtcggatca ccggaaagga    240

cccgtaaagt gataatgatt atcatctaca tatcacaacg tgcgtggagg ccatcaaacc    300

acgtcaaata atcaattatg acgcaggtat cgtattaatt gatctgcatc aacttaacgt    360

aaaaacaact tcagacaata caaatcagcg acactgaata cggggcaacc tcatgtcccc    420

cccccccccc cccctgcagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc    480

agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg    540

gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc    600

atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct    660

gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc    720

tcttgcccgg cgtcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc    780

atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc    840

agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc    900

gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca    960

cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt    1020

tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt    1080

ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca    1140

ttaacctata aaaataggcg tatcacgagg ccctttcgtc ttcaagaatt cggagctttt    1200

gccattctca ccggattcag tcgtcactca tggtgatttc tcacttgata accttatttt    1260

tgacgagggg aaattaatag gttgtattga tgttggacga gtcggaatcg cagaccgata    1320

ccaggatctt gccatcctat ggaactgcct cggtgagttt tctccttcat tacagaaacg    1380

gctttttcaa aaatatggta ttgataatcc tgatatgaat aaattgcagt ttcatttgat    1440

gctcgatgag tttttctaat cagaattggt taattggttg taacactggc agagcattac    1500

gctgacttga cgggacggcg gctttgttga ataaatcgaa cttttgctga gttgaaggat    1560

cagatcacgc atcttcccga caacgcagac cgttccgtgg caaagcaaaa gttcaaaatc    1620

accaactggt ccacctacaa caaagctctc atcaaccgtg gctccctcac tttctggctg    1680

gatgatgggg cgattcaggc ctggtatgag tcagcaacac cttcttcacg aggcagacct    1740

cagcgccaga aggccgccag agaggccgag cgcggccgtg aggcttggac gctagggcag    1800

ggcatgaaaa agcccgtagc gggctgctac gggcgtctga cgcggtggaa agggggaggg    1860

gatgttgtct acatggctct gctgtagtga gtgggttgcg ctccggcagc ggtcctgatc    1920

aatcgtcacc ctttctcggt ccttcaacgt tcctgacaac gagcctcctt ttcgccaatc    1980

catcgacaat caccgcgagt ccctgctcga acgctgcgtc cggaccggct tcgtcgaagg    2040

cgtctatcgc ggcccgcaac agcggcgaga gcggagcctg ttcaacggtg ccgccgcgct    2100

cgccggcatc gctgtcgccg gcctgctcct caagcacggc cccaacagtg aagtagctga    2160

ttgtcatcag cgcattgacg gcgtccccgg ccgaaaaacc cgcctcgcag aggaagcgaa    2220

gctgcgcgtc ggccgtttcc atctgcggtg cgcccggtcg cgtgccggca tggatgcgcg    2280

cgccatcgcg gtaggcgagc agcgcctgcc tgaagctgcg ggcattcccg atcagaaatg    2340

agcgccagtc gtcgtcggct ctcggcaccg aatgcgtatg attctccgcc agcatggctt    2400

cggccagtgc gtcgagcagc gcccgcttgt tcctgaagtg ccagtaaagc gccggctgct    2460

gaacccccaa ccgttccgcc agtttgcgtg tcgtcagacc gtctacgccg acctcgttca    2520

acaggtccag ggcggcacgg atcactgtat tcggctgcaa ctttgtcatg cttgacactt    2580

tatcactgat aaacataata tgtccaccaa cttatcagtg ataaagaatc cgcgcgttca    2640

atcggaccag cggaggctgg tccggaggcc agacgtgaaa cccaacatac ccctgatcgt    2700

aattctgagc actgtcgcgc tcgacgctgt cggcatcggc ctgattatgc cggtgctgcc    2760

gggcctcctg cgcgatctgg ttcactcgaa cgacgtcacc gcccactatg gcattctgct    2820

ggcgctgtat gcgttggtgc aatttgcctg cgcacctgtg ctgggcgcgc tgtcggatcg    2880

tttcgggcgg cggccaatct tgctcgtctc gctggccggc gccactgtcg actacgccat    2940

catggcgaca gcgcctttcc tttgggttct ctatatcggg cggatcgtgg ccggcatcac    3000

cggggcgact ggggcggtag ccggcgctta tattgccgat atcactgatg gcgatgagcg    3060

cgcgcggcac ttcggcttca tgagcgcctg tttcgggttc gggatggtcg cgggacctgt    3120

gctcggtggg ctgatgggcg gtttctcccc ccacgctccg ttcttcgccg cggcagcctt    3180

gaacggcctc aatttcctga cgggctgttt ccttttgccg gagtcgcaca aaggcgaacg    3240

ccggccgtta cgccgggagg ctctcaaccc gctcgcttcg ttccggtggg cccggggcat    3300

gaccgtcgtc gccgccctga tggcggtctt cttcatcatg caacttgtcg gacaggtgcc    3360

ggccgcgctt tgggtcattt tcggcgagga tcgctttcac tgggacgcga ccacgatcgg    3420

catttcgctt gccgcatttg gcattctgca ttcactcgcc caggcaatga tcaccggccc    3480

tgtagccgcc cggctcggcg aaaggcgggc actcatgctc ggaatgattg ccgacggcac    3540

aggctacatc ctgcttgcct tcgcgacacg gggatggatg gcgttcccga tcatggtcct    3600

gcttgcttcg ggtggcatcg gaatgccggc gctgcaagca atgttgtcca ggcaggtgga    3660

tgaggaacgt caggggcagc tgcaaggctc actggcggcg ctcaccagcc tgacctcgat    3720

cgtcggaccc ctcctcttca cggcgatcta tgcggcttct ataacaacgt ggaacgggtg    3780

ggcatggatt gcaggcgctg ccctctactt gctctgcctg ccggcgctgc gtcgcgggct    3840

ttggagcggc gcagggcaac gagccgatcg ctgatcgtgg aaacgatagg cctatgccat    3900

gcgggtcaag gcgacttccg gcaagctata cgcgccctag gagtgcggtt ggaacgttgg    3960

cccagccaga tactcccgat cacgagcagg acgccgatga tttgaagcgc actcagcgtc    4020

tgatccaaga acaaccatcc tagcaacacg gcggtccccg ggctgagaaa gcccagtaag    4080

gaaacaactg taggttcgag tcgcgagatc ccccggaacc aaaggaagta ggttaaaccc    4140

gctccgatca ggccgagcca cgccaggccg agaacattgg ttcctgtagg catcgggatt    4200

ggcggatcaa acactaaagc tactggaacg agcagaagtc ctccggccgc cagttgccag    4260

gcggtaaagg tgagcagagg cacgggaggt tgccacttgc gggtcagcac ggttccgaac    4320

gccatggaaa ccgcccccgc caggcccgct gcgacgccga caggatctag cgctgcgttt    4380

ggtgtcaaca ccaacagcgc cacgcccgca gttccgcaaa tagcccccag gaccgccatc    4440

aatcgtatcg ggctacctag cagagcggca gagatgaaca cgaccatcag cggctgcaca    4500

gcgcctaccg tcgccgcgac cccgcccggc aggcggtaga ccgaaataaa caacaagctc    4560

cagaatagcg aaatattaag tgcgccgagg atgaagatgc gcatccacca gattcccgtt    4620

ggaatctgtc ggacgatcat cacgagcaat aaacccgccg gcaacgcccg cagcagcata    4680

ccggcgaccc ctcggcctcg ctgttcgggc tccacgaaaa cgccggacag atgcgccttg    4740

tgagcgtcct tggggccgtc ctcctgtttg aagaccgaca gcccaatgat ctcgccgtcg    4800

atgtaggcgc cgaatgccac ggcatctcgc aaccgttcag cgaacgcctc catgggcttt    4860

ttctcctcgt gctcgtaaac ggacccgaac atctctggag ctttcttcag ggccgacaat    4920

cggatctcgc ggaaatcctg cacgtcggcc gctccaagcc gtcgaatctg agccttaatc    4980

acaattgtca attttaatcc tctgtttatc ggcagttcgt agagcgcgcc gtgcgtcccg    5040

agcgatactg agcgaagcaa gtgcgtcgag cagtgcccgc ttgttcctga aatgccagta    5100

aagcgctggc tgctgaaccc ccagccggaa ctgaccccac aaggccctag cgtttgcaat    5160

gcaccaggtc atcattgacc caggcgtgtt ccaccaggcc gctgcctcgc aactcttcgc    5220

aggcttcgcc gacctgctcg cgccacttct tcacgcgggt ggaatccgat ccgcacatga    5280

ggcggaaggt ttccagcttg agcgggtacg gctcccggtg cgagctgaaa tagtcgaaca    5340

tccgtcgggc cgtcggcgac agcttgcggt acttctccca tatgaatttc gtgtagtggt    5400

cgccagcaaa cagcacgacg atttcctcgt cgatcaggac ctggcaacgg gacgttttct    5460

tgccacggtc caggacgcgg aagcggtgca gcagcgacac cgattccagg tgcccaacgc    5520

ggtcggacgt gaagcccatc gccgtcgcct gtaggcgcga caggcattcc tcggccttcg    5580

tgtaataccg gccattgatc gaccagccca ggtcctggca aagctcgtag aacgtgaagg    5640

tgatcggctc gccgataggg gtgcgcttcg cgtactccaa cacctgctgc cacaccagtt    5700

cgtcatcgtc ggcccgcagc tcgacgccgg tgtaggtgat cttcacgtcc ttgttgacgt    5760

ggaaaatgac cttgttttgc agcgcctcgc gcgggatttt cttgttgcgc gtggtgaaca    5820

gggcagagcg ggccgtgtcg tttggcatcg ctcgcatcgt gtccggccac ggcgcaatat    5880

cgaacaagga aagctgcatt tccttgatct gctgcttcgt gtgtttcagc aacgcggcct    5940

gcttggcctc gctgacctgt tttgccaggt cctcgccggc ggtttttcgc ttcttggtcg    6000

tcatagttcc tcgcgtgtcg atggtcatcg acttcgccaa acctgccgcc tcctgttcga    6060

gacgacgcga acgctccacg gcggccgatg gcgcgggcag ggcaggggga gccagttgca    6120

cgctgtcgcg ctcgatcttg gccgtagctt gctggaccat cgagccgacg gactggaagg    6180

tttcgcgggg cgcacgcatg acggtgcggc ttgcgatggt ttcggcatcc tcggcggaaa    6240

accccgcgtc gatcagttct tgcctgtatg ccttccggtc aaacgtccga ttcattcacc    6300

ctccttgcgg gattgccccg actcacgccg gggcaatgtg cccttattcc tgatttgacc    6360

cgcctggtgc cttggtgtcc agataatcca ccttatcggc aatgaagtcg gtcccgtaga    6420

ccgtctggcc gtccttctcg tacttggtat tccgaatctt gccctgcacg aataccagcg    6480

accccttgcc caaatacttg ccgtgggcct cggcctgaga gccaaaacac ttgatgcgga    6540

agaagtcggt gcgctcctgc ttgtcgccgg catcgttgcg ccactcttca ttaaccgcta    6600

tatcgaaaat tgcttgcggc ttgttagaat tgccatgacg tacctcggtg tcacgggtaa    6660

gattaccgat aaactggaac tgattatggc tcatatcgaa agtctccttg agaaaggaga    6720

ctctagttta gctaaacatt ggttccgctg tcaagaactt tagcggctaa aattttgcgg    6780

gccgcgacca aaggtgcgag gggcggcttc cgctgtgtac aaccagatat ttttcaccaa    6840

catccttcgt ctgctcgatg agcggggcat gacgaaacat gagctgtcgg agagggcagg    6900

ggtttcaatt tcgtttttat cagacttaac caacggtaag gccaacccct cgttgaaggt    6960

gatggaggcc attgccgacg ccctggaaac tcccctacct cttctcctgg agtccaccga    7020

ccttgaccgc gaggcactcg cggagattgc gggtcatcct ttcaagagca gcgtgccgcc    7080

cggatacgaa cgcatcagtg tggttttgcc gtcacataag gcgtttatcg taaagaaatg    7140

gggcgacgac acccgaaaaa agctgcgtgg aaggctctga cgccaagggt tagggcttgc    7200

acttccttct ttagccgcta aaacggcccc ttctctgcgg gccgtcggct cgcgcatcat    7260

atcgacatcc tcaacggaag ccgtgccgcg aatggcatcg ggcgggtgcg ctttgacagt    7320

tgttttctat cagaacccct acgtcgtgcg gttcgattag ctgtttgtct tgcaggctaa    7380

acactttcgg tatatcgttt gcctgtgcga taatgttgct aatgatttgt tgcgtagggg    7440

ttactgaaaa gtgagcggga aagaagagtt tcagaccatc aaggagcggg ccaagcgcaa    7500

gctggaacgc gacatgggtg cggacctgtt ggccgcgctc aacgacccga aaaccgttga    7560

agtcatgctc aacgcggacg gcaaggtgtg gcacgaacgc cttggcgagc cgatgcggta    7620

catctgcgac atgcggccca gccagtcgca ggcgattata gaaacggtgg ccggattcca    7680

cggcaaagag gtcacgcggc attcgcccat cctggaaggc gagttcccct tggatggcag    7740

ccgctttgcc ggccaattgc cgccggtcgt ggccgcgcca acctttgcga tccgcaagcg    7800

cgcggtcgcc atcttcacgc tggaacagta cgtcgaggcg ggcatcatga cccgcgagca    7860

atacgaggtc attaaaagcg ccgtcgcggc gcatcgaaac atcctcgtca ttggcggtac    7920

tggctcgggc aagaccacgc tcgtcaacgc gatcatcaat gaaatggtcg ccttcaaccc    7980

gtctgagcgc gtcgtcatca tcgaggacac cggcgaaatc cagtgcgccg cagagaacgc    8040

cgtccaatac cacaccagca tcgacgtctc gatgacgctg ctgctcaaga caacgctgcg    8100

tatgcgcccc gaccgcatcc tggtcggtga ggtacgtggc cccgaagccc ttgatctgtt    8160

gatggcctgg aacaccgggc atgaaggagg tgccgccacc ctgcacgcaa acaaccccaa    8220

agcgggcctg agccggctcg ccatgcttat cagcatgcac ccggattcac cgaaacccat    8280

tgagccgctg attggcgagg cggttcatgt ggtcgtccat atcgccagga cccctagcgg    8340

ccgtcgagtg caagaaattc tcgaagttct tggttacgag aacggccagt acatcaccaa    8400

aaccctgtaa ggagtatttc caatgacaac ggctgttccg ttccgtctga ccatgaatcg    8460

cggcattttg ttctaccttg ccgtgttctt cgttctcgct ctcgcgttat ccgcgcatcc    8520

ggcgatggcc tcggaaggca ccggcggcag cttgccatat gagagctggc tgacgaacct    8580

gcgcaactcc gtaaccggcc cggtggcctt cgcgctgtcc atcatcggca tcgtcgtcgc    8640

cggcggcgtg ctgatcttcg gcggcgaact caacgccttc ttccgaaccc tgatcttcct    8700

ggttctggtg atggcgctgc tggtcggcgc gcagaacgtg atgagcacct tcttcggtcg    8760

tggtgccgaa atcgcggcco tcggcaacgg ggcgctgcac caggtgcaag tcgcggcggc    8820

ggatgccgtg cgtgcggtag cggctggacg gctcgcctaa tcatggctct gcgcacgatc    8880

cccatccgtc gcgcaggcaa ccgagaaaac ctgttcatgg gtggtgatcg tgaactggtg    8940

atgttctcgg gcctgatggc gtttgcgctg attttcagcg cccaagagct gcgggccacc    9000

gtggtcggtc tgatcctgtg gttcggggcg ctctatgcgt tccgaatcat ggcgaaggcc    9060

gatccgaaga tgcggttcgt gtacctgcgt caccgccggt acaagccgta ttacccggcc    9120

cgctcgaccc cgttccgcga gaacaccaat agccaaggga agcaataccg atgatccaag    9180

caattgcgat tgcaatcgcg ggcctcggcg cgcttctgtt gttcatcctc tttgcccgca    9240

tccgcgcggt cgatgccgaa ctgaaactga aaaagcatcg ttccaaggac gccggcctgg    9300

ccgatctgct caactacgcc gctgtcgtcg atgacggcgt aatcgtgggc aagaacggca    9360

gctttatggc tgcctggctg tacaagggcg atgacaacgc aagcagcacc gaccagcagc    9420

gcgaagtagt gtccgcccgc atcaaccagg ccctcgcggg cctgggaagt gggtggatga    9480

tccatgtgga cgccgtgcgg cgtcctgctc cgaactacgc ggagcggggc ctgtcggcgt    9540

tccctgaccg tctgacggca gcgattgaag aagagcgctc ggtcttgcct tgctcgtcgg    9600

tgatgtactt caccagctcc gcgaagtcgc tcttcttgat ggagcgcatg gggacgtgct    9660

tggcaatcac gcgcaccccc cggccgtttt agcggctaaa aaagtcatgg ctctgccctc    9720

gggcggacca cgcccatcat gaccttgcca agctcgtcct gcttctcttc gatcttcgcc    9780

agcagggcga ggatcgtggc atcaccgaac cgcgccgtgc gcgggtcgtc ggtgagccag    9840

agtttcagca ggccgcccag gcggcccagg tcgccattga tgcgggccag ctcgcggacg    9900

tgctcatagt ccacgacgcc cgtgattttg tagccctggc cgacggccag caggtaggcc    9960

gacaggctca tgccggccgc cgccgccttt tcctcaatcg ctcttcgttc gtctggaagg    10020

cagtacacct tgataggtgg gctgcccttc ctggttggct tggtttcatc agccatccgc    10080

ttgccctcat ctgttacgcc ggcggtagcc ggccagcctc gcagagcagg attcccgttg  10140

agcaccgcca ggtgcgaata agggacagtg aagaaggaac acccgctcgc gggtgggcct  10200

acttcaccta tcctgcccgg ctgacgccgt tggatacacc aaggaaagtc tacacgaacc  10260

ctttggcaaa atcctgtata tcgtgcgaaa aaggatggat ataccgaaaa aatcgctata  10320

atgaccccga agcagggtta tgcagcggaa aagcgctgct tccctgctgt tttgtggaat  10380

atctaccgac tggaaacagg caaatgcagg aaattactga actgagggga caggcgagag  10440

acgatgccaa agagctacac cgacgagctg gccgagtggg ttgaatcccg cgcggccaag  10500

aagcgccggc gtgatgaggc tgcggttgcg ttcctggcgg tgagggcgga tgtcgaggcg  10560

gcgttagcgt ccggctatgc gctcgtcacc atttgggagc acatgcggga aacggggaag  10620

gtcaagttct cctacgagac gttccgctcg cacgccaggc ggcacatcaa ggccaagccc  10680

gccgatgtgc ccgcaccgca ggccaaggct gcggaacccg cgccggcacc caagacgccg  10740

gagccacggc ggccgaagca ggggggcaag gctgaaaagc cggcccccgc tgcggccccg  10800

accggcttca ccttcaaccc aacaccggac aaaaaggatc tactgtaatg gcgaaaattc  10860

acatggtttt gcagggcaag ggcggggtcg gcaagtcggc catcgccgcg atcattgcgc  10920

agtacaagat ggacaagggg cagacaccct tgtgcatcga caccgacccg gtgaacgcga  10980

cgttcgaggg ctacaaggcc ctgaacgtcc gccggctgaa catcatggcc ggcgacgaaa  11040

ttaactcgcg caacttcgac accctggtcg agctgattgc gccgaccaag gatgacgtgg  11100

tgatcgacaa cggtgccagc tcgttcgtgc ctctgtcgca ttacctcatc agcaaccagg  11160

tgccggctct gctgcaagaa atggggcatg agctggtcat ccataccgtc gtcaccggcg  11220

gccaggctct cctggacacg gtgagcggct tcgcccagct cgccagccag ttcccggccg  11280

aagcgctttt cgtggtctgg ctgaacccgt attgggggcc tatcgagcat gagggcaaga  11340

gctttgagca gatgaaggcg tacacggcca acaaggcccg cgtgtcgtcc atcatccaga  11400

ttccggccct caaggaagaa acctacggcc gcgatttcag cgacatgctg caagagcggc  11460

tgacgttcga ccaggcgctg gccgatgaat cgctcacgat catgacgcgg caacgcctca  11520

agatcgtgcg gcgcggcctg tttgaacagc tcgacgcggc ggccgtgcta tgagcgacca  11580

gattgaagag ctgatccggg agattgcggc caagcacggc atcgccgtcg gccgcgacga  11640

cccggtgctg atcctgcata ccatcaacgc ccggctcatg gccgacagtg cggccaagca  11700

agaggaaatc cttgccgcgt tcaaggaaga gctggaaggg atcgcccatc gttggggcga  11760

ggacgccaag gccaaagcgg agcggatgct gaacgcggccc tggcggcca gcaaggacgc  11820

aatggcgaag gtaatgaagg acagcgccgc gcaggcggcc gaagcgatcc gcagggaaat  11880

cgacgacggc cttggccgcc agctcgcggc caaggtcgcg gacgcgcggc gcgtggcgat  11940

gatgaacatg atcgccggcg gcatggtgtt gttcgcggcc gccctggtgg tgtgggcctc  12000

gttatgaatc gcagaggcgc agatgaaaaa gcccggcgtt gccgggcttt gtttttgcgt  12060

tagctgggct tgtttgacag gcccaagctc tgactgcgcc cgcgctcgcg ctcctgggcc  12120

tgtttcttct cctgctcctg cttgcgcatc agggcctggt gccgtcgggc tgcttcacgc  12180

atcgaatccc agtcgccggc cagctcggga tgctccgcgc gcatcttgcg cgtcgccagt  12240

tcctcgatct tgggcgcgtg aatgcccatg ccttccttga tttcgcgcac catgtccagc  12300

cgcgtgtgca gggtctgcaa gcgggcttgc tgttgggcct gctgctgctg ccaggcggcc  12360

tttgtacgcg gcagggacag caagccgggg gcattggact gtagctgctg caaacgcgcc  12420

tgctgacggt ctacgagctg ttctaggcgg tcctcgatgc gctccacctg gtcatgcttt  12480

gcctgcacgt agagcgcaag ggtctgctgg taggtctgct cgatgggcgc ggattctaag  12540

agggcctgct gttccgtctc ggcctcctgg gccgcctgta gcaaatcctc gccgctgttg  12600

ccgctggact gctttactgc cggggactgc tgttgccctg ctcgcgccgt cgtcgcagtt  12660

cggcttgccc ccactcgatt gactgcttca tttcgagccg cagcgatgcg atctcggatt  12720

gcgtcaacgg acggggcagc gcggaggtgt ccggcttctc cttgggtgag tcggtcgatg  12780

ccatagccaa aggtttcctt ccaaaatgcg tccattgctg gaccgtgttt ctcattgatg  12840

cccgcaagca tcttcggctt gaccgccagg tcaagcgcgc cttcatgggc ggtcatgacg  12900

gacgccgcca tgaccttgcc gccgttgttc tcgatgtagc cgcgtaatga ggcaatggtg  12960

ccgcccatcg tcagcgtgtc atcgacaacg atgtacttct ggccggggat cacctccccc  13020

tcgaaagtcg ggttgaacgc caggcgatga tctgaaccgg ctccggttcg ggcgaccttc  13080

tcccgctgca caatgtccgt ttcgacctca aggccaaggc ggtcggccag aacgaccgcc  13140

atcatggccg gaatcttgtt gttccccgcc gcctcgacgg cgaggactgg aacgatgcgg  13200

ggcttgtcgt cgccgatcag cgtcttgagc tgggcaacag tgtcgtccga aatcaggcgc  13260

tcgaccaaat taagcgccgc ttccgcgtcg ccctgcttcg cagcctggta ttcaggctcg  13320

ttggtcaaag aaccaaggtc gccgttgcga accaccttcg ggaagtctcc ccacggtgcg  13380

cgctcggctc tgctgtagct gctcaagacg cctccctttt tagccgctaa aactctaacg  13440

agtgcgcccg cgactcaact tgacgctttc ggcacttacc tgtgccttgc cacttgcgtc  13500

ataggtgatg cttttcgcac tcccgatttc aggtacttta tcgaaatctg accgggcgtg  13560

cattacaaag ttcttcccca cctgttggta aatgctgccg ctatctgcgt ggacgatgct  13620

gccgtcgtgg cgctgcgact tatcggcctt ttgggccata tagatgttgt aaatgccagg  13680

tttcagggcc ccggctttat ctaccttctg gttcgtccat gcgccttggt tctcggtctg  13740

gacaattctt tgcccattca tgaccaggag gcggtgtttc attgggtgac tcctgacggt  13800

tgcctctggt gttaaacgtg tcctggtcgc ttgccggcta aaaaaaagcc gacctcggca  13860

gttcgaggcc ggctttccct agagccgggc gcgtcaaggt tgttccatct attttagtga  13920

actgcgttcg atttatcagt tactttcctc ccgctttgtg tttcctccca ctcgtttccg  13980

cgtctagccg acccctcaac atagcggcct cttcttgggc tgcctttgcc tcttgccgcg  14040

cttcgtcacg ctcggcttgc accgtcgtaa agcgctcggc ctgcctggcc gcctcttgcg  14100

ccgccaactt cctttgctcc tggtgggcct cggcgtcggc ctgcgccttc gctttcaccg  14160

ctgccaactc cgtgcgcaaa ctctccgctt cgcgcctggt ggcgtcgcgc tcgccgcgaa  14220

gcgcctgcat ttcctggttg gccgcgtcca gggtcttgcg gctctcttct ttgaatgcgc  14280

gggcgtcctg gtgagcgtag tccagctcgg cgcgcagctc ctgcgctcga cgctccacct  14340

cgtcggcccg ctgcgtcgcc agcgcggccc gctgctcggc tcctgccagg gcggtgcgtg  14400

cttcggccag ggcttgccgc tggcgtgcgg ccagctcggc cgcctcggcg gcctgctgct  14460

ctagcaatgt aacgcgcgcc tgggcttctt ccagctcgcg ggcctgcgcc tcgaaggcgt  14520

cggccagctc cccgcgcacg gcttccaact cgttgcgctc acgatcccag ccggcttgcg  14580

ctgcctgcaa cgattcattg gcaagggcct gggcggcttg ccagagggcg gccacggcct  14640

ggttgccggc ctgctgcacc gcgtccggca cctggactgc cagcggggcg gcctgcgccg  14700

tgcgctggcg tcgccattcg cgcatgccgg cgctggcgtc gttcatgttg acgcgggcgg  14760

ccttacgcac tgcatccacg gtcgggaagt tctcccggtc gccttgctcg aacagctcgt  14820

ccgcagccgc aaaaatgcgg tcgcgcgtct ctttgttcag ttccatgttg gctccggtaa  14880

ttggtaagaa taataatact cttacctacc ttatcagcgc aagagtttag ctgaacagtt  14940

ctcgacttaa cggcaggttt tttagcggct gaagggcagg caaaaaaagc cccgcacggt  15000

cggcgggggc aaagggtcag cgggaagggg attagcgggc gtcgggcttc ttcatgcgtc  15060

ggggccgcgc ttcttgggat ggagcacgac gaagcgcgca cgcgcatcgt cctcggccct  15120

atcggcccgc gtcgcggtca ggaacttgtc gcgcgctagg tcctccctgg tgggcaccag  15180

gggcatgaac tcggcctgct cgatgtaggt ccactccatg accgcatcgc agtcgaggcc  15240

gcgttccttc accgtctctt gcaggtcgcg gtacgcccgc tcgttgagcg gctggtaacg  15300

ggccaattgg tcgtaaatgg ctgtcggcca tgagcggcct ttcctgttga gccagcagcc  15360

gacgacgaag ccggcaatgc aggcccctgg cacaaccagg ccgacgccgg gggcagggga  15420

tggcagcagc tcgccaacca ggaaccccgc cgcgatgatg ccgatgccgg tcaaccagcc  15480

cttgaaacta tccggccccg aaacacccct gcgcattgcc tggatgctgc gccggatagc  15540

ttgcaacatc aggagccgtt tcttttgttc gtcagtcatg gtccgccctc accagttgtt  15600

cgtatcggtg tcggacgaac tgaaatcgca agagctgccg gtatcggtcc agccgctgtc  15660

cgtgtcgctg ctgccgaagc acggcgaggg gtccgcgaac gccgcagacg gcgtatccgg  15720

ccgcagcgca tcgcccagca tggccccggt cagcgagccg ccggccaggt agcccagcat  15780

ggtgctgttg gtcgccccgg ccaccagggc cgacgtgacg aaatcgccgt cattccctct  15840

ggattgttcg ctgctcggcg gggcagtgcg ccgcgccggc ggcgtcgtgg atggctcggg  15900

ttggctggcc tgcgacggcc ggcgaaaggt gcgcagcagc tcgttatcga ccggctgcgg  15960

cgtcggggcc gccgccttgc gctgcggtcg gtgttccttc ttcggctcgc gcagcttgaa  16020

cagcatgatc gcggaaacca gcagcaacgc cgcgcctacg cctcccgcga tgtagaacag  16080

catcggattc attcttcggt cctccttgta gcggaaccgt tgtctgtgcg gcgcgggtgg  16140

cccgcgccgc tgtctttggg gatcagccct cgatgagcgc gaccagtttc acgtcggcaa  16200

ggttcgcctc gaactcctgg ccgtcgtcct cgtacttcaa ccaggcatag ccttccgccg  16260

gcggccgacg gttgaggata aggcgggcag ggcgctcgtc gtgctcgacc tggacgatgg  16320

cctttttcag cttgtccggg tccggctcct tcgcgccctt ttccttggcg tccttaccgt  16380

cctggtcgcc gtcctcgccg tcctggccgt cgccggcctc cgcgtcacgc tcggcatcag  16440

tctggccgtt gaaggcatcg acggtgttgg gatcgcggcc cttctcgtcc aggaactcgc  16500

gcagcagctt gaccgtgccg cgcgtgattt cctgggtgtc gtcgtcaagc cacgcctcga  16560

cttcctccgg gcgcttcttg aaggccgtca ccagctcgtt caccacggtc acgtcgcgca  16620

cgcggccggt gttgaacgca tcggcgatct tctccggcag gtccagcagc gtgacgtgct  16680

gggtgatgaa cgccggcgac ttgccgattt ccttggcgat atcgcctttc ttcttgccct  16740

tcgccagctc gcggccaatg aagtcggcaa tttcgcgcgg ggtcagctcg ttgcgttgca  16800

ggttctcgat aacctggtcg gcttcgttgt agtcgttgtc gatgaacgcc gggatggact  16860

tcttgccggc ccacttcgag ccacggtagc ggcgggcgcc gtgattgatg atatagcggc  16920

ccggctgctc ctggttctcg cgcaccgaaa tgggtgactt caccccgcgc tctttgatcg  16980

tggcaccgat ttccgcgatg ctctccgggg aaaagccggg gttgtcggcc gtccgcggct  17040

gatgcggatc ttcgtcgatc aggtccaggt ccagctcgat agggccggaa ccgccctgag  17100

acgccgcagg agcgtccagg aggctcgaca ggtcgccgat gctatccaac cccaggccgg  17160

acggctgcgc cgcgcctgcg gcttcctgag cggccgcagc ggtgtttttc ttggtggtct  17220

tggcttgagc cgcagtcatt gggaaatctc catcttcgtg aacacgtaat cagccagggc  17280

gcgaacctct ttcgatgcct tgcgcgcggc cgttttcttg atcttccaga ccggcacacc  17340

ggatgcgagg gcatcggcga tgctgctgcg caggccaacg gtggccggaa tcatcatctt  17400

ggggtacgcg gccagcagct cggcttggtg gcgcgcgtgg cgcggattcc gcgcatcgac  17460

cttgctgggc accatgccaa ggaattgcag cttggcgttc ttctggcgca cgttcgcaat  17520

ggtcgtgacc atcttcttga tgccctggat gctgtacgcc tcaagctcga tgggggacag  17580

cacatagtcg gccgcgaaga gggcggccgc caggccgacg ccaagggtcg gggccgtgtc  17640

gatcaggcac acgtcgaagc cttggttcgc cagggccttg atgttcgccc cgaacagctc  17700

gcgggcgtcg tccagcgaca gccgttcggc gttcgccagt accgggttgg actcgatgag  17760

ggcgaggcgc gcggcctggc cgtcgccggc tgcgggtgcg gtttcggtcc agccgccggc  17820

agggacagcg ccgaacagct tgcttgcatg caggccggta gcaaagtcct tgagcgtgta  17880

ggacgcattg ccctgggggt ccaggtcgat cacggcaacc cgcaagccgc gctcgaaaaa  17940

gtcgaaggca agatgcacaa gggtcgaagt cttgccgacg ccgcctttct ggttggccgt  18000

gaccaaagtt ttcatcgttt ggtttcctgt tttttcttgg cgtccgcttc ccacttccgg  18060

acgatgtacg cctgatgttc cggcagaacc gccgttaccc gcgcgtaccc ctcgggcaag  18120

ttcttgtcct cgaacgcggc ccacacgcga tgcaccgctt gcgacactgc gcccctggtc  18180

agtcccagcg acgttgcgaa cgtcgcctgt ggcttcccat cgactaagac gccccgcgct  18240

atctcgatgg tctgctgccc cacttccagc ccctggatcg cctcctggaa ctggctttcg  18300

gtaagccgtt tcttcatgga taacacccat aatttgctcc gcgccttggt tgaacatagc  18360

ggtgacagcc gccagcacat gagagaagtt tagctaaaca tttctcgcac gtcaacacct  18420

ttagccgcta aaactcgtcc ttggcgtaac aaaacaaaag cccggaaacc gggctttcgt  18480

ctcttgccgc ttatggctct gcacccggct ccatcaccaa caggtcgcgc acgcgcttca  18540

ctcggttgcg gatcgacact gccagcccaa caaagccggt tgccgccgcc gccaggatcg  18600

cgccgatgat gccggccaca ccggccatcg cccaccaggt cgccgccttc cggttccatt  18660

cctgctggta ctgcttcgca atgctggacc tcggctcacc ataggctgac cgctcgatgg  18720

cgtatgccgc ttctcccctt ggcgtaaaac ccagcgccgc aggcggcatt gccatgctgc  18780

ccgccgcttt cccgaccacg acgcgcgcac caggcttgcg gtccagacct tcggccacgg    18840

cgagctgcgc aaggacataa tcagccgccg acttggctcc acgcgcctcg atcagctctt    18900

gcactcgcgc gaaatccttg gcctccacgg ccgccatgaa tcgcgcacgc ggcgaaggct    18960

ccgcagggcc ggcgtcgtga tcgccgccga gaatgccctt caccaagttc gacgacacga    19020

aaatcatgct gacggctatc accatcatgc agacggatcg cacgaacccg ctgaattgaa    19080

cacgagcacg gcacccgcga ccactatgcc aagaatgccc aaggtaaaaa ttgccggccc    19140

cgccatgaag tccgtgaatg ccccgacggc cgaagtgaag ggcaggccgc cacccaggcc    19200

gccgccctca ctgcccggca cctggtcgct gaatgtcgat gccagcacct gcggcacgtc    19260

aatgcttccg ggcgtcgcgc tcgggctgat cgcccatccc gttactgccc cgatcccggc    19320

aatggcaagg actgccagcg ctgccatttt tggggtgagg ccgttcgcgg ccgaggggcg    19380

cagcccctgg ggggatggga ggcccgcgtt agcgggccgg gagggttcga gaaggggggg    19440

cacccccctt cggcgtgcgc ggtcacgcgc acagggcgca gccctggtta aaaacaaggt    19500

ttataaatat tggtttaaaa gcaggttaaa agacaggtta gcggtggccg aaaaacgggc    19560

ggaaaccctt gcaaatgctg gattttctgc ctgtggacag cccctcaaat gtcaataggt    19620

gcgcccctca tctgtcagca ctctgcccct caagtgtcaa ggatcgcgcc cctcatctgt    19680

cagtagtcgc gcccctcaag tgtcaatacc gcagggcact tatccccagg cttgtccaca    19740

tcatctgtgg gaaactcgcg taaaatcagg cgttttcgcc gatttgcgag gctggccagc    19800

tccacgtcgc cggccgaaat cgagcctgcc cctcatctgt caacgccgcg ccgggtgagt    19860

cggcccctca agtgtcaacg tccgcccctc atctgtcagt gagggccaag ttttccgcga    19920

ggtatccaca acgccggcgg ccgcggtgtc tcgcacacgg cttcgacggc gtttctggcg    19980

cgtttgcagg gccatagacg gccgccagcc cagcggcgag ggcaaccagc ccggtgagcg    20040

tcggaaaggc gctggaagcc ccgtagcgac gcggagaggg gcgagacaag ccaagggcgc    20100

aggctcgatg cgcagcacga catagccggt tctcgcaagg acgagaattt ccctgcggtg    20160

cccctcaagt gtcaatgaaa gtttccaacg cgagccattc gcgagagcct tgagtccacg    20220

ctagatgaga gctttgttgt aggtggacca gttggtgatt ttgaactttt gctttgccac    20280

ggaacggtct gcgttgtcgg gaagatgcgt gatctgatcc ttcaactcag caaaagttcg    20340

atttattcaa caaagccacg ttgtgtctca aaatctctga tgttacattg cacaagataa    20400

aaatatatca tcatgaacaa taaaactgtc tgcttacata aacagtaata caaggggtgt    20460

tatgagccat attcaacggg aaacgtcttg ctcgactcta gagctcgttc ctcgaggcct    20520

cgaggcctcg aggaacggta cctgcgggga agcttacaat aatgtgtgtt gttaagtctt  20580

gttgcctgtc atcgtctgac tgactttcgt cataaatccc ggcctccgta acccagcttt  20640

gggcaagctc acggatttga tccggcggaa cgggaatatc gagatgccgg gctgaacgct  20700

gcagttccag ctttcccttt cgggacaggt actccagctg attgattatc tgctgaaggg  20760

tcttggttcc acctcctggc acaatgcgaa tgattacttg agcgcgatcg ggcatccaat  20820

tttctcccgt caggtgcgtg gtcaagtgct acaaggcacc tttcagtaac gagcgaccgt  20880

cgatccgtcg ccgggatacg gacaaaatgg agcgcagtag tccatcgagg gcggcgaaag  20940

cctcgccaaa agcaatacgt tcatctcgca cagcctccag atccgatcga gggtcttcgg  21000

cgtaggcaga tagaagcatg gatacattgc ttgagagtat tccgatggac tgaagtatgg  21060

cttccatctt ttctcgtgtg tctgcatcta tttcgagaaa gcccccgatg cggcgcaccg  21120

caacgcgaat tgccatacta tccgaaagtc ccagcaggcg cgcttgatag gaaaaggttt  21180

catactcggc cgatcgcaga cgggcactca cgaccttgaa cccttcaact ttcagggatc  21240

gatgctggtt gatggtagtc tcactcgacg tggctctggt gtgttttgac atagcttcct  21300

ccaaagaaag cggaaggtct ggatactcca gcacgaaatg tgcccgggta gacggatgga  21360

agtctagccc tgctcaatat gaaatcaaca gtacatttac agtcaatact gaatatactt  21420

gctacatttg caattgtctt ataacgaatg tgaaataaaa atagtgtaac aacgctttta  21480

ctcatcgata atcacaaaaa catttatacg aacaaaaata caaatgcact ccggtttcac  21540

aggataggcg ggatcagaat atgcaacttt tgacgttttg ttctttcaaa gggggtgctg  21600

gcaaaaccac cgcactcatg ggcctttgcg ctgctttggc aaatgacggt aaacgagtgg  21660

ccctctttga tgccgacgaa aaccggcctc tgacgcgatg gagagaaaac gccttacaaa  21720

gcagtactgg gatcctcgct gtgaagtcta ttccgccgac gaaatgcccc ttcttgaagc  21780

agcctatgaa aatgccgagc tcgaaggatt tgattatgcg ttggccgata cgcgtggcgg  21840

ctcgagcgag ctcaacaaca caatcatcgc tagctcaaac ctgcttctga tccccaccat  21900

gctaacgccg ctcgacatcg atgaggcact atctacctac cgctacgtca tcgagctgct  21960

gttgagtgaa aatttggcaa ttcctacagc tgttttgcgc caacgcgtcc cggtcggccg  22020

attgacaaca tcgcaacgca ggatgtcaga gacgctagag agccttccag ttgtaccgtc  22080

tcccatgcat gaaagagatg catttgccgc gatgaaagaa cgcggcatgt tgcatcttac  22140

attactaaac acgggaactg atccgacgat gcgcctcata gagaggaatc ttcggattgc  22200

gatggaggaa gtcgtggtca tttcgaaact gatcagcaaa atcttggagg cttgaagatg  22260

gcaattcgca agcccgcatt gtcggtcggc gaagcacggc ggcttgctgg tgctcgaccc  22320

gagatccacc atcccaaccc gacacttgtt ccccagaagc tggacctcca gcacttgcct  22380

gaaaaagccg acgagaaaga ccagcaacgt gagcctctcg tcgccgatca catttacagt  22440

cccgatcgac aacttaagct aactgtggat gcccttagtc cacctccgtc cccgaaaaag  22500

ctccaggttt ttctttcagc gcgaccgccc gcgcctcaag tgtcgaaaac atatgacaac  22560

ctcgttcggc aatacagtcc ctcgaagtcg ctacaaatga ttttaaggcg cgcgttggac  22620

gatttcgaaa gcatgctggc agatggatca tttcgcgtgg ccccgaaaag ttatccgatc  22680

ccttcaacta cagaaaaatc cgttctcgtt cagacctcac gcatgttccc ggttgcgttg  22740

ctcgaggtcg ctcgaagtca ttttgatccg ttggggttgg agaccgctcg agctttcggc  22800

cacaagctgg ctaccgccgc gctcgcgtca ttctttgctg gagagaagcc atcgagcaat  22860

tggtgaagag ggacctatcg gaacccctca ccaaatattg agtgtaggtt tgaggccgct  22920

ggccgcgtcc tcagtcacct tttgagccag ataattaaga gccaaatgca attggctcag  22980

gctgccatcg tccccccgtg cgaaacctgc acgtccgcgt caaagaaata accggcacct  23040

cttgctgttt ttatcagttg agggcttgac ggatccgcct caagtttgcg gcgcagccgc  23100

aaaatgagaa catctatact cctgtcgtaa acctcctcgt cgcgtactcg actggcaatg  23160

agaagttgct cgcgcgatag aacgtcgcgg ggtttctcta aaaacgcgag gagaagattg  23220

aactcacctg ccgtaagttt cacctcaccg ccagcttcgg acatcaagcg acgttgcctg  23280

agattaagtg tccagtcagt aaaacaaaaa gaccgtcggt ctttggagcg gacaacgttg  23340

gggcgcacgc gcaaggcaac ccgaatgcgt gcaagaaact ctctcgtact aaacggctta  23400

gcgataaaat cacttgctcc tagctcgagt gcaacaactt tatccgtctc ctcaaggcgg  23460

tcgccactga taattatgat tggaatatca gactttgccg ccagatttcg aacgatctca  23520

agcccatctt cacgacctaa atttagatca acaaccacga catcgaccgt cgcggaagag  23580

agtactctag tgaactgggt gctgtcggct accgcggtca ctttgaaggc gtggatcgta  23640

aggtattcga taataagatg ccgcatagcg acatcgtcat cgataagaag aacgtgtttc  23700

aacggctcac ctttcaatct aaaatctgaa cccttgttca cagcgcttga gaaattttca  23760

cgtgaaggat gtacaatcat ctccagctaa atgggcagtt cgtcagaatt gcggctgacc  23820

gcggatgacg aaaatgcgaa ccaagtattt caattttatg acaaaagttc tcaatcgttg  23880

ttacaagtga aacgcttcga ggttacagct actattgatt aaggagatcg cctatggtct  23940

cgccccggcg tcgtgcgtcc gccgcgagcc agatctcgcc tacttcataa acgtcctcat  24000

aggcacggaa tggaatgatg acatcgatcg ccgtagagag catgtcaatc agtgtgcgat  24060

cttccaagct agcaccttgg gcgctacttt tgacaaggga aaacagtttc ttgaatcctt  24120

ggattggatt cgcgccgtgt attgttgaaa tcgatcccgg atgtcccgag acgacttcac  24180

tcagataagc ccatgctgca tcgtcgcgca tctcgccaag caatatccgg tccggccgca  24240

tacgcagact tgcttggagc aagtgctcgg cgctcacagc acccagccca gcaccgttct  24300

tggagtagag tagtctaaca tgattatcgt gtggaatgac gagttcgagc gtatcttcta  24360

tggtgattag cctttcctgg ggggggatgg cgctgatcaa ggtcttgctc attgttgtct  24420

tgccgcttcc ggtagggcca catagcaaca tcgtcagtcg gctgacgacg catgcgtgca  24480

gaaacgcttc caaatccccg ttgtcaaaat gctgaaggat agcttcatca tcctgatttt  24540

ggcgtttcct tcgtgtctgc cactggttcc acctcgaagc atcataacgg gaggagactt  24600

ctttaagacc agaaacacgc gagcttggcc gtcgaatggt caagctgacg gtgcccgagg  24660

gaacggtcgg cggcagacag atttgtagtc gttcaccacc aggaagttca gtggcgcaga  24720

gggggttacg tggtccgaca tcctgctttc tcagcgcgcc cgctaaaata gcgatatctt  24780

caagatcatc ataagagacg ggcaaaggca tcttggtaaa aatgccggct tggcgcacaa  24840

atgcctctcc aggtcgattg atcgcaattt cttcagtctt cgggtcatcg agccattcca  24900

aaatcggctt cagaagaaag cgtagttgcg gatccacttc catttacaat gtatcctatc  24960

tctaagcgga aatttgaatt cattaagagc ggcggttcct cccccgcgtg gcgccgccag  25020

tcaggcggag ctggtaaaca ccaaagaaat cgaggtcccg tgctacgaaa atggaaacgg  25080

tgtcaccctg attcttcttc agggttggcg gtatgttgat ggttgcctta agggctgtct  25140

cagttgtctg ctcaccgtta ttttgaaagc tgttgaagct catcccgcca cccgagctgc  25200

cggcgtaggt gctagctgcc tggaaggcgc cttgaacaac actcaagagc atagctccgc  25260

taaaacgctg ccagaagtgg ctgtcgaccg agcccggcaa tcctgagcga ccgagttcgt  25320

ccgcgcttgg cgatgttaac gagatcatcg catggtcagg tgtctcggcg cgatcccaca  25380

acacaaaaac gcgcccatct ccctgttgca agccacgctg tatttcgcca acaacggtgg  25440

tgccacgatc aagaagcacg atattgttcg ttgttccacg aatatcctga ggcaagacac  25500

actttacata gcctgccaaa tttgtgtcga ttgcggtttg caagatgcac ggaattattg  25560

tcccttgcgt taccataaaa tcggggtgcg gcaagagcgt ggcgctgctg ggctgcagct  25620

cggtgggttt catacgtatc gacaaatcgt tctcgccgga cacttcgcca ttcggcaagg  25680

agttgtcgtc acgcttgcct tcttgtcttc ggcccgtgtc gccctgaatg gcgcgtttgc  25740

tgaccccttg atcgccgctg ctatatgcaa aaatcggtgt ttcttccggc cgtggctcat  25800

gccgctccgg ttcgcccctc ggcggtagag gagcagcagg ctgaacagcc tcttgaaccg  25860

ctggaggatc cggcggcacc tcaatcggag ctggatgaaa tggcttggtg tttgttgcga  25920

tcaaagttga cggcgatgcg ttctcattca ccttcttttg gcgcccacct agccaaatga  25980

ggcttaatga taacgcgaga acgacacctc cgacgatcaa tttctgagac cccgaaagac  26040

gccggcgatg tttgtcggag accagggatc cagatgcatc aacctcatgt gccgcttgct  26100

gactatcgtt attcatccct tcgccccctt caggacgcgt ttcacatcgg gcctcaccgt  26160

gcccgtttgc ggcctttggc caacgggatc gtaagcggtg ttccagatac atagtactgt  26220

gtggccatcc ctcagacgcc aacctcggga aaccgaagaa atctcgacat cgctcccttt  26280

aactgaatag ttggcaacag cttccttgcc atcaggattg atggtgtaga tggagggtat  26340

gcgtacattg cccggaaagt ggaataccgt cgtaaatcca ttgtcgaaga cttcgagtgg  26400

caacagcgaa cgatcgcctt gggcgacgta gtgccaatta ctgtccgccg caccaagggc  26460

tgtgacaggc tgatccaata aattctcagc tttccgttga tattgtgctt ccgcgtgtag  26520

tctgtccaca acagccttct gttgtgcctc ccttcgccga gccgccgcat cgtcggcggg  26580

gtaggcgaat tggacgctgt aatagagatc gggctgctct ttatcgaggt gggacagagt  26640

cttggaactt atactgaaaa cataacggcg catcccggag tcgcttgcgg ttagcacgat  26700

tactggctga ggcgtgagga cctggcttgc cttgaaaaat agataatttc cccgcggtag  26760

ggctgctaga tctttgctat ttgaaacggc aaccgctgtc accgtttcgt tcgtggcgaa  26820

tgttacgacc aaagtagctc caaccgccgt cgagaggcgc accacttgat cgggattgta  26880

agccaaataa cgcatgcgcg gatctagctt gcccgccatt ggagtgtctt cagcctccgc  26940

accagtcgca gcggcaaata aacatgctaa aatgaaaagt gcttttctga tcatggttcg  27000

ctgtggccta cgtttgaaac ggtatcttcc gatgtctgat aggaggtgac aaccagacct  27060

gccgggttgg ttagtctcaa tctgccgggc aagctggtca ccttttcgta gcgaactgtc  27120

gcggtccacg tactcaccac aggcattttg ccgtcaacga cgagggtcct tttatagcga  27180

atttgctgcg tgcttggagt tacatcattt gaagcgatgt gctcgacctc caccctgccg  27240

cgtttgccaa gaatgacttg aggcgaactg ggattgggat agttgaagaa ttgctggtaa  27300

tcctggcgca ctgttggggc actgaagttc gataccaggt cgtaggcgta ctgagcggtg  27360

tcggcatcat aactctcgcg caggcgaacg tactcccaca atgaggcgtt aacgacggcc  27420

tcctcttgag ttgcaggcaa tcgcgagaca gacacctcgc tgtcaacggt gccgtccggc  27480

cgtatccata gatatacggg cacaagcctg ctcaacggca ccattgtggc tatagcgaac  27540

gcttgagcaa catttcccaa aatcgcgata gctgcgacag ctgcaatgag tttggagaga  27600

cgtcgcgccg atttcgctcg cgcggtttga aaggcttcta cttccttata gtgctcggca  27660

aggctttcgc gcgccactag catggcatat tcaggccccg tcatagcgtc cacccgaatt  27720

gccgagctga agatctgacg gagtaggctg ccatcgcccc acattcagcg ggaagatcgg  27780

gcctttgcag ctcgctaatg tgtcgtttgt ctggcagccg ctcaaagcga caactaggca  27840

cagcaggcaa tacttcatag aattctccat tgaggcgaat ttttgcgcga cctagcctcg  27900

ctcaacctga gcgaagcgac ggtacaagct gctggcagat tgggttgcgc cgctccagta  27960

actgcctcca atgttgccgg cgatcgccgg caaagcgaca atgagcgcat cccctgtcag  28020

aaaaaacata tcgagttcgt aaagaccaat gatcttggcc gcggtcgtac cggcgaaggt  28080

gattacacca agcataaggg tgagcgcagt cgcttcggtt aggatgacga tcgttgccac  28140

gaggtttaag aggagaagca agagaccgta ggtgataagt tgcccgatcc acttagctgc  28200

gatgtcccgc gtgcgatcaa aaatatatcc gacgaggatc agaggcccga tcgcgagaag  28260

cactttcgtg agaattccaa cggcgtcgta aactccgaag gcagaccaga gcgtgccgta  28320

aaggacccac tgtgcccctt ggaaagcaag gatgtcctgg tcgttcatcg gaccgatttc  28380

ggatgcgatt ttctgaaaaa cggcctgggt cacggcgaac attgtatcca actgtgccgg  28440

aacagtctgc agaggcaagc cggttacact aaactgctga acaaagtttg ggaccgtctt  28500

ttcgaagatg gaaaccacat agtcttggta gttagcctgc ccaacaatta gagcaacaac  28560

gatggtgacc gtgatcaccc gagtgatacc gctacgggta tcgacttcgc cgcgtatgac  28620

taaaataccc tgaacaataa tccaaagagt gacacaggcg atcaatggcg cactcaccgc  28680

ctcctggata gtctcaagca tcgagtccaa gcctgtcgtg aaggctacat cgaagatcgt  28740

atgaatggcc gtaaacggcg ccggaatcgt gaaattcatc gattggacct gaacttgact  28800

ggtttgtcgc ataatgttgg ataaaatgag ctcgcattcg gcgaggatgc gggcggatga  28860

acaaatcgcc cagccttagg ggagggcacc aaagatgaca gcggtctttt gatgctcctt  28920

gcgttgagcg gccgcctctt ccgcctcgtg aaggccggcc tgcgcggtag tcatcgttaa  28980

taggcttgtc gcctgtacat tttgaatcat tgcgtcatgg atctgcttga gaagcaaacc  29040

attggtcacg gttgcctgca tgatattgcg agatcgggaa agctgagcag acgtatcagc  29100

attcgccgtc aagcgtttgt ccatcgtttc cagattgtca gccgcaatgc cagcgctgtt  29160

tgcggaaccg gtgatctgcg atcgcaacag gtccgcttca gcatcactac ccacgactgc  29220

acgatctgta tcgctggtga tcgcacgtgc cgtggtcgac attggcattc gcggcgaaaa  29280

catttcattg tctaggtcct tcgtcgaagg atactgattt ttctggttga gcgaagtcag  29340

tagtccagta acgccgtagg ccgacgtcaa catcgtaacc atcgctatag tctgagtgag  29400

attctccgca gtcgcgagcg cagtcgcgag cgtctcagcc tccgttgccg ggtcgctaac  29460

aacaaactgc gcccgcgcgg gctgaatata tagaaagctg caggtcaaaa ctgttgcaat  29520

aagttgcgtc gtcttcatcg tttcctacct tatcaatctt ctgcctcgtg gtgacgggcc  29580

atgaattcgc tgagccagcc agatgagttg ccttcttgtg cctcgcgtag tcgagttgca  29640

aagcgcaccg tgttggcacg ccccgaaagc acggcgacat attcacgcat atcccgcaga  29700

tcaaattcgc agatgacgct tccactttct cgtttaagaa gaaacttacg gctgccgacc  29760

gtcatgtctt cacggatcgc ctgaaattcc ttttcggtac atttcagtcc atcgacataa  29820

gccgatcgat ctgcggttgg tgatggatag aaaatcttcg tcatacattg cgcaaccaag  29880

ctggctccta gcggcgattc cagaacatgc tctggttgct gcgttgccag tattagcatc  29940

ccgttgtttt ttcgaacggt caggaggaat ttgtcgacga cagtcgaaaa tttagggttt  30000

aacaaatagg cgcgaaactc atcgcagctc atcacaaaac ggcggccgtc gatcatggct  30060

ccaatccgat gcaggagata tgctgcagcg ggagcgcata cttcctcgta ttcgagaaga  30120

tgcgtcatgt cgaagccggt aatcgacgga tctaacttta cttcgtcaac ttcgccgtca  30180

aatgcccagc caagcgcatg gccccggcac cagcgttgga gccgcgctcc tgcgccttcg  30240

gcgggcccat gcaacaaaaa ttcacgtaac cccgcgattg aacgcatttg tggatcaaac  30300

gagagctgac gatggatacc acggaccaga cggcggttct cttccggaga aatcccaccc  30360

cgaccatcac tctcgatgag agccacgatc cattcgcgca gaaaatcgtg tgaggctgct  30420

gtgttttcta ggccacgcaa cggcgccaac ccgctgggtg tgcctctgtg aagtgccaaa  30480

tatgttcctc ctgtggcgcg aaccagcaat tcgccacccc ggtccttgtc aaagaacacg  30540

accgtacctg cacggtcgac catgctctgt tcgagcatgg ctagaacaaa catcatgagc  30600

gtcgtcttac ccctcccgat aggcccgaat attgccgtca tgccaacatc gtgctcatgc  30660

gggatatagt cgaaaggcgt tccgccattg gtacgaaatc gggcaatcgc gttgccccag  30720

tggcctgagc tggcgccctc tggaaagttt tcgaaagaga caaaccctgc gaaattgcgt  30780

gaagtgattg cgccagggcg tgtgcgccac ttaaaattcc ccggcaattg ggaccaatag  30840

gccgcttcca taccaatacc ttcttggaca accacggcac ctgcatccgc cattcgtgtc  30900

cgagcccgcg cgcccctgtc cccaagacta ttgagatcgt ctgcatagac gcaaaggctc  30960

aaatgatgtg agcccataac gaattcgttg ctcgcaagtg cgtcctcagc ctcggataat  31020

ttgccgattt gagtcacggc tttatcgccg gaactcagca tctggctcga tttgaggcta  31080

agtttcgcgt gcgcttgcgg gcgagtcagg aacgaaaaac tctgcgtgag aacaagtgga  31140

aaatcgaggg atagcagcgc gttgagcatg cccggccgtg tttttgcagg gtattcgcga  31200

aacgaataga tggatccaac gtaactgtct tttggcgttc tgatctcgag tcctcgcttg  31260

ccgcaaatga ctctgtcggt ataaatcgaa gcgccgagtg agccgctgac gaccggaacc  31320

ggtgtgaacc gaccagtcat gatcaaccgt agcgcttcgc caatttcggt gaagagcaca  31380

ccctgcttct cgcggatgcc aagacgatgc aggccatacg ctttaagaga gccagcgaca  31440

acatgccaaa gatcttccat gttcctgatc tggcccgtga gatcgttttc cctttttccg  31500

cttagcttgg tgaacctcct ctttaccttc cctaaagccg cctgtgggta gacaatcaac  31560

gtaaggaagt gttcattgcg gaggagttgg ccggagagca cgcgctgttc aaaagcttcg  31620

ttcaggctag cggcgaaaac actacggaag tgtcgcggcg ccgatgatgg cacgtcggca  31680

tgacgtacga ggtgagcata tattgacaca tgatcatcag cgatattgcg caacagcgtg  31740

ttgaacgcac gacaacgcgc attgcgcatt tcagtttcct caagctcgaa tgcaacgcca  31800

tcaattctcg caatggtcat gatcgatccg tcttcaagaa ggacgatatg gtcgctgagg  31860

tggccaatat aagggagata gatctcaccg gatctttcgg tcgttccact cgcgccgagc  31920

atcacaccat tcctctccct cgtgggggaa ccctaattgg atttgggcta acagtagcgc  31980

ccccccaaac tgcactatca atgcttcttc ccgcggtccg caaaaatagc aggacgacgc  32040

tcgccgcatt gtagtctcgc tccacgatga gccgggctgc aaaccataac ggcacgagaa  32100

cgacttcgta gagcgggttc tgaacgataa cgatgacaaa gccggcgaac atcatgaata  32160

accctgccaa tgtcagtggc accccaagaa acaatgcggg ccgtgtggct gcgaggtaaa  32220

gggtcgattc ttccaaacga tcagccatca actaccgcca gtgagcgttt ggccgaggaa  32280

gctcgcccca aacatgataa caatgccgcc gacgacgccg gcaaccagcc caagcgaagc  32340

ccgcccgaac atccaggaga tcccgatagc gacaatgccg agaacagcga gtgactggcc  32400

gaacggacca aggataaacg tgcatatatt gttaaccatt gtggcggggt cagtgccgcc  32460

acccgcagat tgcgctgcgg cgggtccgga tgaggaaatg ctccatgcaa ttgcaccgca  32520

caagcttggg gcgcagctcg atatcacgcg catcatcgca ttcgagagcg agaggcgatt  32580

tagatgtaaa cggtatctct caaagcatcg catcaatgcg cacctcctta gtataagtcg  32640

aataagactt gattgtcgtc tgcggatttg ccgttgtcct ggtgtggcgg tggcggagcg  32700

attaaaccgc cagcgccatc ctcctgcgag cggcgctgat atgaccccca aacatcccac  32760

gtctcttcgg attttagcgc ctcgtgatcg tcttttggag gctcgattaa cgcgggcacc  32820

agcgattgag cagctgtttc aacttttcgc acgtagccgt ttgcaaaacc gccgatgaaa  32880

ttaccggtgt tgtaagcgga gatcgcccga cgaagcgcaa attgcttctc gtcaatcgtt  32940

tcgccgcctg cataacgact tttcagcatg tttgcagcgg cagataatga tgtgcacgcc  33000

tggagcgcac cgtcaggtgt cagaccgagc atagaaaaat ttcgagagtt tatttgcatg  33060

aggccaacat ccagcgaatg ccgtgcatcg agacggtgcc tgacgacttg ggttgcttgg  33120

ctgtgatctt gccagtgaag cgtttcgccg gtcgtgttgt catgaatcgc taaaggatca  33180

aagcgactct ccaccttagc tatcgccgca agcgtagatg tcgcaactga tggggcacac  33240

ttgcgagcaa catggtcaaa ctcagcagat gagagtggcg tggcaaggct cgacgaacag  33300

aaggagacca tcaaggcaag agaaagcgac cccgatctct taagcatacc ttatctcctt  33360

agctcgcaac taacaccgcc tctcccgttg gaagaagtgc gttgttttat gttgaagatt  33420

atcgggaggg tcggttactc gaaaattttc aattgcttct ttatgatttc aattgaagcg  33480

agaaacctcg cccggcgtct tggaacgcaa catggaccga gaaccgcgca tccatgacta  33540

agcaaccgga tcgacctatt caggccgcag ttggtcaggt caggctcaga acgaaaatgc  33600

tcggcgaggt tacgctgtct gtaaacccat tcgatgaacg ggaagcttcc ttccgattgc  33660

tcttggcagg aatattggcc catgcctgct tgcgctttgc aaatgctctt atcgcgttgg  33720

tatcatatgc cttgtccgcc agcagaaacg cactctaagc gattatttgt aaaaatgttt  33780

cggtcatgcg gcggtcatgg gcttgacccg ctgtcagcgc aagacggatc ggtcaaccgt  33840

cggcatcgac aacagcgtga atcttggtgg tcaaaccgcc acgggaacgt cccatacagc  33900

catcgtcttg atcccgctgt ttcccgtcgc cgcatgttgg tggacgcgga cacaggaact  33960

gtcaatcatg acgacattct atcgaaagcc ttggaaatca cactcagaat atgatcccag  34020

acgtctgcct cacgccatcg tacaaagcga ttgtagcagg ttgtacagga accgtatcga  34080

tcaggaacgt ctgcccaggg cgggcccgtc cggaagcgcc acaagatgac attgatcacc  34140

cgcgtcaacg cgcggcacgc gacgcggctt atttgggaac aaaggactga acaacagtcc  34200

attcgaaatc ggtgacatca aagcggggac gggttatcag tggcctccaa gtcaagcctc  34260

aatgaatcaa aatcagaccg atttgcaaac ctgatttatg agtgtgcggc ctaaatgatg  34320

aaatcgtcct tctagatcgc ctccgtggtg tagcaacacc tcgcagtatc gccgtgctga  34380

ccttggccag ggaattgact ggcaagggtg ctttcacatg accgctcttt tggccgcgat  34440

agatgatttc gttgctgctt tgggcacgta gaaggagaga agtcatatcg gagaaattcc  34500

tcctggcgcg agagcctgct ctatcgcgac ggcatcccac tgtcgggaac agaccggatc  34560

attcacgagg cgaaagtcgt caacacatgc gttataggca tcttcccttg aaggatgatc  34620

ttgttgctgc caatctggag gtgcggcagc cgcaggcaga tgcgatctca gcgcaacttg  34680

cggcaaaaca tctcactcac ctgaaaacca ctagcgagtc tcgcgatcag acgaaggcct  34740

tttacttaac gacacaatat ccgatgtctg catcacaggc gtcgctatcc cagtcaatac  34800

taaagcggtg caggaactaa agattactga tgacttaggc gtgccacgag gcctgagacg  34860

acgcgcgtag acagtttttt gaaatcatta tcaaagtgat ggcctccgct gaagcctatc  34920

acctctgcgc cggtctgtcg gagagatggg caagcattat tacggtcttc gcgcccgtac  34980

atgcattgga cgattgcagg gtcaatggat ctgagatcat ccagaggatt gccgccctta  35040

ccttccgttt cgagttggag ccagccccta aatgagacga catagtcgac ttgatgtgac  35100

aatgccaaga gagagatttg cttaacccga tttttttgct caagcgtaag cctattgaag  35160

cttgccggca tgacgtccgc gccgaaagaa tatcctacaa gtaaaacatt ctgcacaccg  35220

aaatgcttgg tgtagacatc gattatgtga ccaagatcct tagcagtttc gcttggggac  35280

cgctccgacc agaaataccg aagtgaactg acgccaatga caggaatccc ttccgtctgc  35340

agataggtac catcgataga tctgctgcct cgcgcgtttc ggtgatgacg gtgaaaacct  35400

ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag  35460

acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag ccatgaccca  35520

gtcacgtagc gatagcggag tgtatactgg cttaactatg cggcatcaga gcagattgta  35580

ctgagagtgc accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc  35640

atcaggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg  35700

cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac  35760

gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg  35820

ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca  35880

agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc  35940

tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc  36000

ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag  36060

gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc  36120

ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca  36180

gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg  36240

aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg  36300

aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct  36360

ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa  36420

gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa  36480

gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa  36540

tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc  36600

ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga  36660

ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca  36720

atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc  36780

ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat  36840

tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc  36900

attgctgcag gggggggggg ggggggggac ttccattgtt cattccacgg acaaaaacag  36960

agaaaggaaa cgacagaggc caaaaagcct cgctttcagc acctgtcgtt tcctttcttt  37020

tcagagggta ttttaaataa aaacattaag ttatgacgaa gaagaacgga aacgccttaa  37080

accggaaaat tttcataaat agcgaaaacc cgcgaggtcg ccgccccgta acctgtcgga  37140

tcaccggaaa ggacccgtaa agtgataatg attatcatct acatatcaca acgtgcgtgg  37200

aggccatcaa accacgtcaa ataatcaatt atgacgcagg tatcgtatta attgatctgc  37260

atcaacttaa cgtaaaaaca acttcagaca atacaaatca gcgacactga atacggggca  37320

acctcatgtc cccccccccc ccccccctgc aggcatcgtg gtgtcacgct cgtcgtttgg  37380

tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt  37440

gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc  37500

agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt  37560

aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg  37620

gcgaccgagt tgctcttgcc cggcgtcaac acgggataat accgcgccac atagcagaac  37680

tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc  37740

gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt  37800

tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg  37860

aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag  37920

catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa  37980

acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat  38040

tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc gtcttcaaga  38100

attggtcgac gatcttgctg cgttcggata ttttcgtgga gttcccgcca cagacccgga  38160

ttgaaggcga gatccagcaa ctcgcgccag atcatcctgt gacggaactt tggcgcgtga  38220

tgactggcca ggacgtcggc cgaaagagcg acaagcagat cacgcttttc gacagcgtcg  38280

gatttgcgat cgaggatttt tcggcgctgc gctacgtccg cgaccgcgtt gagggatcaa  38340

gccacagcag cccactcgac cttctagccg acccagacga gccaagggat ctttttggaa  38400

tgctgctccg tcgtcaggct ttccgacgtt tgggtggttg aacagaagtc attatcgtac  38460

ggaatgccaa gcactcccga ggggaaccct gtggttggca tgcacataca aatggacgaa  38520

cggataaacc ttttcacgcc cttttaaata tccgttattc taataaacgc tcttttctct  38580

taggtttacc cgccaatata tcctgtcaaa cactgatagt ttaaactgaa ggcgggaaac  38640

gacaatctga tcatgagcgg agaattaagg gagtcacgtt atgacccccg ccgatgacgc  38700

gggacaagcc gttttacgtt tggaactgac agaaccgcaa cgttgaagga gccactcagc  38760

aagctggtac gattgtaata cgactcacta tagggcgaat tgagcgctgt ttaaacgctc  38820

ttcaactgga agagcggtta cccggaccga agcttgaagt tcctattccg aagttcctat  38880

tctctagaaa gtataggaac ttcagatctc gatgctcacc ctgttgtttg gtgttacttc  38940

tgcaggtcga ctctagagga tccaccatga gcccagaacg acgcccggcc gacatccgcc  39000

gtgccaccga ggcggacatg ccggcggtct gcaccatcgt caaccactac atcgagacaa  39060

gcacggtcaa cttccgtacc gagccgcagg aaccgcagga ctggacggac gacctcgtcc  39120

gtctgcggga gcgctatccc tggctcgtcg ccgaggtgga cggcgaggtc gccggcatcg  39180

cctacgcggg cccctggaag gcacgcaacg cctacgactg gacggccgag tcgaccgtgt  39240

acgtctcccc ccgccaccag cggacgggac tgggctccac gctctacacc cacctgctga  39300

agtccctgga ggcacagggc ttcaagagcg tggtcgctgt catcgggctg cccaacgacc  39360

cgagcgtgcg catgcacgag gcgctcggat atgccccccg cggcatgctg cgggcggccg  39420

gcttcaagca cgggaactgg catgacgtgg gtttctggca gctggacttc agcctgccgg  39480

taccgccccg tccggtcctg cccgtcaccg agatctgatc cgtcgaccaa cctagacttg  39540

tccatcttct ggattggcca acttaattaa tgtatgaaat aaaaggatgc acacatagtg  39600

acatgctaat cactataatg tgggcatcaa agttgtgtgt tatgtgtaat tactagttat  39660

ctgaataaaa gagaaagaga tcatccatat ttcttatcct aaatgaatgt cacgtgtctt  39720

tataattctt tgatgaacca gatgcatttc attaaccaaa tccatataca tataaatatt  39780

aatcatatat aattaatatc aattgggtta gcaaaacaaa tctagtctag gtgtgttttg  39840

cgaattgcgg ccgcgatctg gggaattccc atggacaccg gtaattccca tgatcttctc  39900

tccttcatca atggatgcca tgtttcataa caataacacc aaatgtttga tgagctacca  39960

acaattgcgc aaagactatg gctaagctcg agctcgctcg ctacaagttg ttgactttca  40020

aatacaagtt tgtttttgga acaccaaata ttctacatga tctttcacta agttgcgcac  40080

cactatcaaa agattatcta ggccattatt caatgaaaga tggaacacgt ctaagaccca  40140

caaccacacc aaatagaata cgcatacatg caacatattg tgcaagaagt atccaactgg  40200

actcccatgt attctaaaac tattttcgta gagttaaagt tatgacaaac ttatcaaata  40260

aaaatttgaa cgctggacca aaactttcat ctttcaaatc caccatcgtc tatcctcata  40320

aattgttttg attataacac atctacgtaa atcatttgtt ttgaacaata ctaatttaat  40380

tttattaagt caaataacct gcttagaaaa taatccctcc acctcattta acaatttctt  40440

gtcaaacaca caccaagaaa aaaattaatg aaagagaaaa gaaatgaaaa ggacatggag  40500

ttgaatacta gcaaaattga ttgaaggaag attcacaatt gaaattgaaa ccatttaatt  40560

tattttcggg tccataataa taaattggta agaataaaaa cccgatcaag tccggtacag  40620

tacaattcca ctccaccaac tccttactta aacccctatt tatacccact ctcatcctca  40680

ctcttccttc acctctcaca ctctcttctc tctctcaaaa ccctcacaca aacgctgcgt  40740

ttagtgtaag aaattcaatc cggcgccttg gcgcgccgat catccacaag tttgtacaaa  40800

aaagctgaac gagaaacgta aaatgatata aatatcaata tattaaatta gattttgcat  40860

aaaaaacaga ctacataata ctgtaaaaca caacatatcc agtcactatg gcggccgcat  40920

taggcacccc aggctttaca ctttatgctt ccggctcgta taatgtgtgg attttgagtt  40980

aggatttaaa tacgcgttga tccggcttac taaaagccag ataacagtat gcgtatttgc  41040

gcgctgattt ttgcggtata agaatatata ctgatatgta tacccgaagt atgtcaaaaa  41100

gaggtatgct atgaagcagc gtattacagt gacagttgac agcgacagct atcagttgct  41160

caaggcatat atgatgtcaa tatctccggt ctggtaagca caaccatgca gaatgaagcc  41220

cgtcgtctgc gtgccgaacg ctggaaagcg gaaaatcagg aagggatggc tgaggtcgcc  41280

cggtttattg aaatgaacgg ctcttttgct gacgagaaca ggggctggtg aaatgcagtt  41340

taaggtttac acctataaaa gagagagccg ttatcgtctg tttgtggatg tacagagtga  41400

tatcattgac acgcccggtc gacggatggt gatccccctg gccagtgcac gtctgctgtc  41460

agataaagtc tcccgtgaac tttacccggt ggtgcatatc ggggatgaaa gctggcgcat  41520

gatgaccacc gatatggcca gtgtgccggt ctccgttatc ggggaagaag tggctgatct  41580

cagccaccgc gaaaatgaca tcaaaaacgc cattaacctg atgttctggg gaatataaat  41640

gtcaggctcc cttatacaca gccagtctgc aggtcgacca tagtgactgg atatgttgtg  41700

ttttacagta ttatgtagtc tgttttttat gcaaaatcta atttaatata ttgatattta  41760

tatcatttta cgtttctcgt tcagctttct tgtacaaagt ggtgttaacc tagacttgtc  41820

catcttctgg attggccaac ttaattaatg tatgaaataa aaggatgcac acatagtgac  41880

atgctaatca ctataatgtg ggcatcaaag ttgtgtgtta tgtgtaatta ctagttatct  41940

gaataaaaga gaaagagatc atccatattt cttatcctaa atgaatgtca cgtgtcttta  42000

taattctttg atgaaccaga tgcatttcat taaccaaatc catatacata taaatattaa  42060

tcatatataa ttaatatcaa ttgggttagc aaaacaaatc tagtctaggt gtgttttgcg  42120

aattgcggcc gccaccgcgg tggagctcga attccggtcc gggtcacctt tgtccaccaa  42180

gatggaactg cggccgctca ttaattaagt caggcgcgcc tctagttgaa gacacgttca  42240

tgtcttcatc gtaagaagac actcagtagt cttcggccag aatggccatc tggattcagc  42300

aggcctagaa ggccatttaa atcctgagga tctggtcttc ctaaggaccc gggatatcgg  42360

accgattaaa ctttaattcg gtccgaagct tgaagttcct attccgaagt tcctattctc  42420

cagaaagtat aggaacttcg catgcctgca gtgcagcgtg acccggtcgt gcccctctct  42480

agagataatg agcattgcat gtctaagtta taaaaaatta ccacatattt tttttgtcac  42540

acttgtttga agtgcagttt atctatcttt atacatatat ttaaacttta ctctacgaat  42600

aatataatct atagtactac aataatatca gtgttttaga gaatcatata aatgaacagt  42660

tagacatggt ctaaaggaca attgagtatt ttgacaacag gactctacag ttttatcttt  42720

ttagtgtgca tgtgttctcc tttttttttg caaatagctt cacctatata atacttcatc  42780

cattttatta gtacatccat ttagggttta gggttaatgg tttttataga ctaatttttt  42840

tagtacatct attttattct attttagcct ctaaattaag aaaactaaaa ctctatttta  42900

gtttttttat ttaataattt agatataaaa tagaataaaa taaagtgact aaaaattaaa  42960

caaataccct ttaagaaatt aaaaaaacta aggaaacatt tttcttgttt cgagtagata  43020

atgccagcct gttaaacgcc gtcgacgagt ctaacggaca ccaaccagcg aaccagcagc  43080

gtcgcgtcgg gccaagcgaa gcagacggca cggcatctct gtcgctgcct ctggacccct  43140

ctcgagagtt ccgctccacc gttggacttg ctccgctgtc ggcatccaga aattgcgtgg  43200

cggagcggca gacgtgagcc ggcacggcag gcggcctcct cctcctctca cggcaccggc  43260

agctacgggg gattcctttc ccaccgctcc ttcgctttcc cttcctcgcc cgccgtaata  43320

aatagacacc ccctccacac cctctttccc caacctcgtg ttgttcggag cgcacacaca  43380

cacaaccaga tctcccccaa atccacccgt cggcacctcc gcttcaaggt acgccgctcg  43440

tcctcccccc cccccctctc taccttctct agatcggcgt tccggtccat gcatggttag  43500

ggcccggtag ttctacttct gttcatgttt gtgttagatc cgtgtttgtg ttagatccgt  43560

gctgctagcg ttcgtacacg gatgcgacct gtccgtcaga cacgttctga ttgctaactt  43620

gccagtgttt ctctttgggg aatcctggga tggctctagc cgttccgcag acgggatcga  43680

tttcatgatt ttttttgttt cgttgcatag ggtttggttt gcccttttcc tttatttcaa  43740

tatatgccgt gcacttgttt gtcgggtcat cttttcatgc ttttttttgt cttggttgtg  43800

atgatgtggt ctggttgggc ggtcgttcta gatcggagta gaattctgtt tcaaactacc  43860

tggtggattt attaattttg gatctgtatg tgtgtgccat acatattcat agttacgaat  43920

tgaagatgat ggatggaaat atcgatctag gataggtata catgttgatg cgggttttac  43980

tgatgcatat acagagatgc tttttgttcg cttggttgtg atgatgtggt gtggttgggc  44040

ggtcgttcat tcgttctaga tcggagtaga atactgtttc aaactacctg gtgtatttat  44100

taattttgga actgtatgtg tgtgtcatac atcttcatag ttacgagttt aagatggatg  44160

gaaatatcga tctaggatag gtatacatgt tgatgtgggt tttactgatg catatacatg  44220

atggcatatg cagcatctat tcatatgctc taaccttgag tacctatcta ttataataaa  44280

caagtatgtt ttataattat tttgatcttg atatacttgg atgatggcat atgcagcagc  44340

tatatgtgga tttttttagc cctgccttca tacgctattt atttgcttgg tactgtttct  44400

tttgtcgatg ctcaccctgt tgtttggtgt tacttctgca ggtcgacttt aacttagcct  44460

aggatccaca cgacaccatg atagaggtga aaccgattaa cgcagaggat acctatgaac  44520

taaggcatag aatactcaga ccaaaccagc cgatagaagc gtgtatgttt gaaagcgatt  44580

tacttcgtgg tgcatttcac ttaggcggct attacggggg caaactgatt tccatagctt  44640

cattccacca ggccgagcac tcagaactcc aaggccagaa acagtaccag ctccgaggta  44700

tggctacctt ggaaggttat cgtgagcaga aggcgggatc gagtctaatt aaacacgctg  44760

aagaaattct tcgtaagagg ggggcggact tgctttggtg taatgcgcgg acatccgcct  44820

caggctacta caaaaagtta ggcttcagcg agcagggaga ggtattcgac acgccgccag  44880

taggacctca catcctgatg tataaaagga tcacataact agctagtcag ttaacctaga  44940

cttgtccatc ttctggattg gccaacttaa ttaatgtatg aaataaaagg atgcacacat  45000

agtgacatgc taatcactat aatgtgggca tcaaagttgt gtgttatgtg taattactag  45060

ttatctgaat aaaagagaaa gagatcatcc atatttctta tcctaaatga atgtcacgtg  45120

tctttataat tctttgatga accagatgca tttcattaac caaatccata tacatataaa  45180

tattaatcat atataattaa tatcaattgg gttagcaaaa caaatctagt ctaggtgtgt  45240

tttgcgaatt cagagctcga attcattccg attaatcgtg gcctcttgct cttcaggatg  45300

aagagctatg tttaaacgtg caagcgctac tagacaattc agtacattaa aaacgtccg   45360

aatgtgttat taagttgtct aagcgtcaat ttgtttacac cacaatatat cctgccacca  45420

gccagccaac agctccccga ccggcagctc ggcacaaaat caccactcga tacaggcagc  45480

ccatcagtcc gggacggcgt cagcgggaga gccgttgtaa ggcggcagac tttgctcatg  45540

ttaccgatgc tattcggaag aacggcaact aagctgccgg gtttgaaaca cggatgatct  45600

cgcggagggt agcatgttga ttgtaacgat gacagagcgt tgctgcctgt gatcaaatat  45660

catctccctc gcagagatcc gaattatcag ccttcttatt catttctcgc ttaaccgtga  45720

caggctgtcg atcttgagaa ctatgccgac ataataggaa atcgctggat aaagccgctg  45780

aggaagctga gtggcgctat ttctttagaa gtgaacgttg acgatcgtcg accgtacccc  45840

gatgaattaa ttcggacgta cgttctgaac acagctggat acttacttgg gcgattgtca  45900

tacatgacat caacaatgta cccgtttgtg taaccgtctc ttggaggttc gtatgacact  45960

agtggttccc ctcagcttgc gactagatgt tgaggcctaa cattttatta gagagcaggc  46020

tagttgctta gatacatgat cttcaggccg ttatctgtca gggcaagcga aaattggcca  46080

tttatgacga ccaatgcccc gcagaagctc ccatctttgc cgccatagac gccgcgcccc  46140

ccttttgggg tgtagaacat ccttttgcca gatgtggaaa agaagttcgt tgtcccattg  46200

ttggcaatga cgtagtagcc ggcgaaagtg cgagacccat ttgcgctata tataagccta  46260

cgatttccgt tgcgactatt gtcgtaattg gatgaactat tatcgtagtt gctctcagag  46320

ttgtcgtaat ttgatggact attgtcgtaa ttgcttatgg agttgtcgta gttgcttgga  46380

gaaatgtcgt agttggatgg ggagtagtca tagggaagac gagcttcatc cactaaaaca  46440

attggcaggt cagcaagtgc ctgccccgat gccatcgcaa gtacgaggct tagaaccacc  46500

ttcaacagat cgcgcatagt cttccccagc tctctaacgc ttgagttaag ccgcgccgcg  46560

aagcggcgtc ggcttgaacg aattgttaga cattatttgc cgactacctt ggtgatctcg  46620

cctttcacgt agtgaacaaa ttcttccaac tgatctgcgc gcgaggccaa gcgatcttct  46680

tgtccaagat aagcctgcct agcttcaagt atgacgggct gatactgggc cggcaggcgc  46740

tccattgccc agtcggcagc gacatccttc ggcgcgattt tgccggttac tgcgctgtac  46800

caaatgcggg acaacgtaag cactacattt cgctcatcgc cagcccagtc gggcggcgag  46860

ttccatagcg ttaaggtttc atttagcgcc tcaaatagat cctgttcagg aaccggatca  46920

aagagttcct ccgccgctgg acctaccaag gcaacgctat gttctcttgc ttttgtcagc  46980

aagatagcca gatcaatgtc gatcgtggct ggctcgaaga tacctgcaag aatgtcattg  47040

cgctgccatt ctccaaattg cagttcgcgc ttagctggat aacgccacgg aatgatgtcg  47100

tcgtgcacaa caatggtgac ttctacagcg cggagaatct cgctctctcc aggggaagcc  47160

gaagtttcca aaaggtcgtt gatcaaagct cgccgcgttg tttcatcaag ccttacagtc  47220

accgtaacca gcaaatcaat atcactgtgt ggcttcaggc cgccatccac tgcggagccg  47280

tacaaatgta cggccagcaa cgtcggttcg agatggcgct cgatgacgcc aactacctct  47340

gatagttgag tcgatacttc ggcgatcacc gcttccctca tgatgtttaa ctcctgaatt  47400

aagccgcgcc gcgaagcggt gtcggcttga atgaattgtt aggcgtcatc ctgtgctccc  47460

gagaaccagt accagtacat cgctgtttcg ttcgagactt gaggtctagt tttatacgtg  47520

aacaggtcaa tgccgccgag agtaaagcca cattttgcgt acaaattgca ggcaggtaca  47580

ttgttcgttt gtgtctctaa tcgtatgcca aggagctgtc tgcttagtgc ccactttttc  47640

gcaaattcga tgagactgtg cgcgactcct ttgcctcggt gcgtgtgcga cacaacaatg  47700

tgttcgatag aggctagatc gttccatgtt gagttgagtt caatcttccc gacaagctct  47760

tggtcgatga atgcgccata gcaagcagag tcttcatcag agtcatcatc cgagatgtaa  47820

tccttccggt aggggctcac acttctggta gatagttcaa agccttggtc ggataggtgc  47880

acatcgaaca cttcacgaac aatgaaatgg ttctcagcat ccaatgtttc cgccacctgc  47940

tcagggatca ccgaaatctt catatgacgc ctaacgcctg gcacagcgga tcgcaaacct  48000

ggcgcggctt ttggcacaaa aggcgtgaca ggtttgcgaa tccgttgctg ccacttgtta  48060

acccttttgc cagatttggt aactataatt tatgttagag gcgaagtctt gggtaaaaac  48120

tggcctaaaa ttgctgggga tttcaggaaa gtaaacatca ccttccggct cgatgtctat  48180

tgtagatata tgtagtgtat ctacttgatc gggggatctg ctgcctcgcg cgtttcggtg  48240

atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag  48300

cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg  48360

gcgcagccat gacccagtca cgtagcgata gcggagtgta tactggctta actatgcggc  48420

atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt  48480

aaggagaaaa taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc  48540

ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac  48600

agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa  48660

ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca  48720

caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc  48780

gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata  48840

cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta  48900

tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca  48960

gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga  49020

cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg  49080

tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg  49140

tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg  49200

caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag  49260

aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa  49320

cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat  49380

ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc  49440

tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc  49500

atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc  49560

tggccccagt gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc  49620

aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc  49680

catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt  49740

gcgcaacgtt gttgccattg ctgca                                        49765

 

<210>14

<211>1670

<212>DNA

<213>玉米

 

<220>

<221>misc_feature

<222>(1660)..(1660)

<223>n是a,c,g,或t

 

<400>14

atggcgcccc gcggccgcac cctcctcccg ctcgccgcgg ccaccgtcct cgtcgcttcc    60

accatcttcc tcttcgccgc cgccggtgcg cgctggcggc ccgccgacac cgacctcccc    120

gtcccgccac acgccttccc cacggccgtc cccgcggccg tgaccgcttc ttcttactcc    180

aacgccaccg ccggcaagga gctctccttt ctcgacgaga acggccgccc cgatgacccc    240

tcctccgcct cagcatccag ctccacctcc ggcgccaccc cggccgctgg tgtcgtcaga    300

tgtgaccccc gcgacgccgt cagggtattc atgtacgaca tgccgcccga gttccacttc    360

ggcctcctcg gctggtcgcc gccgtcccct gactccgtct ggccagacgt caccgccgcc    420

tccccgccgc cgcgctaccc cggggggctc aaccagcagc acagcgtgga gtactggctc    480

acgctcgacc tcctctcctc ctcgcccccc tgcggccgtc actccgcagt gcgggtctcc    540

gattcccgcg atgccgacct cgtcttcgtc cccttcttcg cgtccctcag ctacaaycgc    600

cactaccggc ccgtgccgcc cgagaagggc agcagggaca gggccatcca ggagaagctg    660

gtgcgggacc tcgcggcgcg gccggagtgg aggaggtacg gtggtgccga ccacgtcatc    720

gtcgcgcacc accccaacag cttgctgcac gcccgggcgg tgctgcaccc cgccgtgttc    780

gtgctgtcag acttcgggag gtacccaccg agggtggcca gcttggagaa ggatgtcatt    840

gcgccataca agcacatggc caagacgttc gtcaatgact cggccgggtt cgatgaccgg    900

ccgaccctgt tatacttccg gggagcaatt tacaggaagg agggagggag cattcgacag    960

gagctatatt atatgctsaa agaagaaaag gatgtttact tttcctttgg aagtgtccag    1020

gaccatgggg ccagcaaagc tagccaagga atgcactcat caaaattttg cctaaatatt    1080

gctggggaca ccccttcttc caatcgtctg tttgatgcga tagttaccca ctgtgtccct    1140

gttatcatca gtgacgacat tgagctacct tatgaggatg tgttggatta ttcaaaattc    1200

tccatctttg tccgttcgtc tgatgctgtt aagaaaggtt acctgatgag actgctcagt    1260

ggtgtaagca agcaacaatg gacaaagatg tgggataggc tcaaagaggt ggataaacat    1320

tttgagtatc agtatccatc acagaaggat gatgcagtcc agatgatctg gcaagcattg    1380

tctagaaagg tgccatcaat taagctgaag gttcacagat ctaatagatt ttcaagatct    1440

aacagaggaa aataaacaga aaggggtgtg tctatcttgt ctctattggc taatctaatg    1500

taacacattt cactgacaca ggctctcagc ctttcccagt tgcacaaaat agatagattg    1560

taatactcag gttatcttta ggaaaggttt gtaccttaag atttgttggt tcagttgaag    1620

catatactgt caagtcaaag gttgttttgt aaggtatgtn aaatgtaatc               1670

<210>15

<211>484

<212>PRT

<213>玉米

 

<400>15

 

Met Ala Pro Arg Gly Arg Thr Leu Leu Pro Leu Ala Ala Ala Thr Val

1               5                   10                  15

Leu Val Ala Ser Thr Ile Phe Leu Phe Ala Ala Ala Gly Ala Arg Trp

            20                  25                  30

Arg Pro Ala Asp Thr Asp Leu Pro Val Pro Pro His Ala Phe Pro Thr

        35                  40                  45

Ala Val Pro Ala Ala Val Thr Ala Ser Ser Tyr Ser Asn Ala Thr Ala

    50                  55                  60

Gly Lys Glu Leu Ser Phe Leu Asp Glu Asn Gly Arg Pro Asp Asp Pro

65                  70                  75                  80

Ser Ser Ala Ser Ala Ser Ser Ser Thr Ser Gly Ala Thr Pro Ala Ala

                85                  90                  95

Gly Val Val Arg Cys Asp Pro Arg Asp Ala Val Arg Val Phe Met Tyr

            100                 105                 110

Asp Met Pro Pro Glu Phe His Phe Gly Leu Leu Gly Trp Ser Pro Pro

        115                 120                 125

Ser Pro Asp Ser Val Trp Pro Asp Val Thr Ala Ala Ser Pro Pro Pro

    130                 135                 140

Arg Tyr Pro Gly Gly Leu Asn Gln Gln His Ser Val Glu Tyr Trp Leu

145                 150                 155                 160

Thr Leu Asp Leu Leu Ser Ser Ser Pro Pro Cys Gly Arg His Ser Ala

                165                 170                 175

Val Arg Val Ser Asp Ser Arg Asp Ala Asp Leu Val Phe Val Pro Phe

            180                 185                 190

Phe Ala Ser Leu Ser Tyr Asn Arg His Tyr Arg Pro Val Pro Pro Glu

        195                 200                 205

Lys Gly Ser Arg Asp Arg Ala Ile Gln Glu Lys Leu Val Arg Asp Leu

    210                 215                 220

Ala Ala Arg Pro Glu Trp Arg Arg Tyr Gly Gly Ala Asp His Val Ile

225                 230                 235                 240

Val Ala His His Pro Asn Ser Leu Leu His Ala Arg Ala Val Leu His

                245                 250                 255

Pro Ala Val Phe Val Leu Ser Asp Phe Gly Arg Tyr Pro Pro Arg Val

            260                 265                 270

Ala Ser Leu Glu Lys Asp Val Ile Ala Pro Tyr Lys His Met Ala Lys

        275                 280                 285

Thr Phe Val Asn Asp Ser Ala Gly Phe Asp Asp Arg Pro Thr Leu Leu

    290                 295                 300

Tyr Phe Arg Gly Ala Ile Tyr Arg Lys Glu Gly Gly Ser Ile Arg Gln

305                 310                 315                 320

Glu Leu Tyr Tyr Met Leu Lys Glu Glu Lys Asp Val Tyr Phe Ser Phe

                325                 330                 335

Gly Ser Val Gln Asp His Gly Ala Ser Lys Ala Ser Gln Gly Met His

            340                 345                 350

Ser Ser Lys Phe Cys Leu Asn Ile Ala Gly Asp Thr Pro Ser Ser Asn

        355                 360                 365

Arg Leu Phe Asp Ala Ile Val Thr His Cys Val Pro Val Ile Ile Ser

    370                 375                 380

Asp Asp Ile Glu Leu Pro Tyr Glu Asp Val Leu Asp Tyr Ser Lys Phe

385                 390                 395                 400

Ser Ile Phe Val Arg Ser Ser Asp Ala Val Lys Lys Gly Tyr Leu Met

                405                 410                 415

Arg Leu Leu Ser Gly Val Ser Lys Gln Gln Trp Thr Lys Met Trp Asp

            420                 425                 430

Arg Leu Lys Glu Val Asp Lys His Phe Glu Tyr Gln Tyr Pro Ser Gln

        435                 440                 445

Lys Asp Asp Ala Val Gln Met Ile Trp Gln Ala Leu Ser Arg Lys Val

    450                 455                 460

Pro Ser Ile Lys Leu Lys Val His Arg Ser Asn Arg Phe Ser Arg Ser

465                 470                 475                 480

Asn Arg Gly Lys

 

<210>16

<211>1776

<212>DNA

<213>玉米

 

<220>

<221>misc_feature

<222>(764)..(924)

<223>n是a,c,g,或t

 

<400>16

ccccctccca gctagccatg gccgcgcccc gctctggtcg ccgcccgcac tgccactgct    60

agccatggcc gccgccgccg cctgccggag cccgctggtc tggctcttcg cgctcgtcac    120

cgcactcttc ttcttctcct ggtacctcct cctcgactcc gccgcgggtc cagccgccgc    180

ccgccgcccc aaccagtggc tccgcctcgg cggcggcggg cggcgctccg gtcccggtag    240

gaaatgcgac cccgcggagg cgctgctgcg agtgttcatg tacgacctgc cccccgagtt    300

ccacttcgga ctgctcgact ggaagccccc cggcttcggc ggcggcgtgt ggcccgacat    360

cagggacggc gtgcctgact acccgggggg cctcaacctg cagcacagca tcgagtattg    420

gctcaccctc gacctcctgg cctccgagca gggcgcgccc acgccctgcg cagtggcgcg    480

ggtgcgccac gcggcggacg ccgacgtcgt cttcgtgccc ttcttcgcct cgctcagctt    540

caaccgccac tcccgggtgg taccgcccgc gcgggacagc gaggaccgcg cgctgcagcg    600

gaggctcctc gagttcctcg ccgcgcggcc cgagtggcgg aggactggcg ggcgggacca    660

cgtcgtgctc gcgcatcacc ccaacgggat gctcgacgcg cgctacaggt tctggccctg    720

cgtcttcgtg ctctgcgact tcgggaggta cccgcccagc gtcnnnnnnn nnnnnnnnnn    780

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    840

nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn    900

nnnnnnnnnn nnnnnnnnnn nnnngaaaga cgagaaagat gtgcatttct catttggaag  960

cgtagccggt aatgggatcg agcaagcaac acaagggatg cggtcatcca agttctgcct  1020

caacattgca ggtgacactc catcctccaa ccgcctcttt gactccatag tcagtcactg  1080

tgttcccgtc acgatcagcg atgagattga gctcccgttt gaggatgtcc tcgactactc  1140

gaagttcagt gtcatagtac gtggcgcaga cgcagtcaag aaggggtttc taatgaacct  1200

gatcaaaggg atcagccgag aagagtggac acgcatgtgg aacaggctaa aggaagtgga  1260

aaagcacttt gagtaccaat acccatctca gaccgatgat gccgtgcaga tgatatggaa  1320

ggccattgct eggaaggtgc cgtctatccg gctgaagatt aacagactgc aaagattttc  1380

tctgtttgag actaacagga cagatgagac tctaccccca tcttcttctt ggctacagaa  1440

tcaggctcct tgattttgga ctagcaagct caggctttcg ccatgttttc aatctcgtag  1500

aatcaagagt tgatactgaa gaccaaatct taatcgcttg actgggggca gatgttagta  1560

tgttacagct gcagacatta gcggatagta aagttgaaac actttagcat agcagaatta  1620

catatccagt ggcacatcat tttcttcatt tttttttctt ttgcttgcga ttcatccaaa  1680

gtgtcctcgg ctgcagacta aggacaatga attttgtatg tgaagctgta tattctaggc  1740

ggcaatatag ttactgatca gttacagttg ctgggc                            1776

 

<210>17

<211>462

<212>PRT

<213>玉米

 

<220>

<221>misc_feature

<222>(234)..(287)

<223>Xaa可以是任何天然存在的氨基酸

<400>17

 

Met Ala Ala Ala Ala Ala Cys Arg Ser Pro Leu Val Trp Leu Phe Ala

1               5                   10                  15

Leu Val Thr Ala Leu Phe Phe Phe Ser Trp Tyr Leu Leu Leu Asp Ser

            20                  25                  30

Ala Ala Gly Pro Ala Ala Ala Arg Arg Pro Asn Gln Trp Leu Arg Leu

        35                  40                  45

Gly Gly Gly Gly Arg Arg Ser Gly Pro Gly Arg Lys Cys Asp Pro Ala

    50                  55                  60

Glu Ala Leu Leu Arg Val Phe Met Tyr Asp Leu Pro Pro Glu Phe His

65                  70                  75                  80

Phe Gly Leu Leu Asp Trp Lys Pro Pro Gly Phe Gly Gly Gly Val Trp

                85                  90                  95

Pro Asp Ile Arg Asp Gly Val Pro Asp Tyr Pro Gly Gly Leu Asn Leu

            100                 105                 110

Gln His Ser Ile Glu Tyr Trp Leu Thr Leu Asp Leu Leu Ala Ser Glu

        115                 120                 125

Gln Gly Ala Pro Thr Pro Cys Ala Val Ala Arg Val Arg His Ala Ala

    130                 135                 140

Asp Ala Asp Val Val Phe Val Pro Phe Phe Ala Ser Leu Ser Phe Asn

145                 150                 155                 160

Arg His Ser Arg Val Val Pro Pro Ala Arg Asp Ser Glu Asp Arg Ala

                165                 170                 175

Leu Gln Arg Arg Leu Leu Glu Phe Leu Ala Ala Arg Pro Glu Trp Arg

            180                 185                 190

Arg Thr Gly Gly Arg Asp His Val Val Leu Ala His His Pro Asn Gly

        195                 200                 205

Met Leu Asp Ala Arg Tyr Arg Phe Trp Pro Cys Val Phe Val Leu Cys

    210                 215                 220

Asp Phe Gly Arg Tyr Pro Pro Ser Val Xaa Xaa Xaa Xaa Xaa Xaa Xaa

225                 230                 235                 240

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

                245                 250                 255

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

            260                 265                 270

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Lys

        275                 280                 285

Asp Glu Lys Asp Val His Phe Ser Phe Gly Ser Val Ala Gly Asn Gly

    290                 295                 300

Ile Glu Gln Ala Thr Gln Gly Met Arg Ser Ser Lys Phe Cys Leu Asn

305                 310                 315                 320

Ile Ala Gly Asp Thr Pro Ser Ser Asn Arg Leu Phe Asp Ser Ile Val

                325                 330                 335

Ser His Cys Val Pro Val Thr Ile Ser Asp Glu Ile Glu Leu Pro Phe

            340                 345                 350

Glu Asp Val Leu Asp Tyr Ser Lys Phe Ser Val Ile Val Arg Gly Ala

        355                 360                 365

Asp Ala Val Lys Lys Gly Phe Leu Met Asn Leu Ile Lys Gly Ile Ser

    370                 375                 380

Arg Glu Glu Trp Thr Arg Met Trp Asn Arg Leu Lys Glu Val Glu Lys

385                 390                 395                 400

His Phe Glu Tyr Gln Tyr Pro Ser Gln Thr Asp Asp Ala Val Gln Met

                405                 410                 415

Ile Trp Lys Ala Ile Ala Arg Lys Val Pro Ser Ile Arg Leu Lys Ile

            420                 425                 430

Asn Arg Leu Gln Arg Phe Ser Leu Phe Glu Thr Asn Arg Thr Asp Glu

        435                 440                 445

Thr Leu Pro Pro Ser Ser Ser Trp Leu Gln Asn Gln Ala Pro

    450                 455                 460

 

<210>18

<211>1174

<212>DNA

<213>玉米

 

<400>18

gcacgagtct tcgtgccctt cttctcctcg ctcagcttca acgtgcacgg tcgcaacatg  60

accgaccctg acaccgaggc cgaccgcctc ctgcaggttg aacttgtgga tattctctgg  120

aagtctaaat attggcaacg ttctgcgggc cgtgaccatg tcattcctat gcatcaccct  180

aatgctttca gattcctgcg agcaatggtg aatgcatcta ttcttatagt ttcagacttt  240

gggagataca caaaggaact ggcttccctg aggaaagatg ttgtggcacc atatgtgcat    300

gttgtgggtt ccttccttga tgacgatcca cctgatccat ttgaggctcg ccatacactg    360

cttttctttc gaggccgtac tgtcaggaaa gatgaaggga aaatccggtc aaaacttgag    420

aagatattaa aaggcaagga aggggtgcgc tttgaggata gcattgccac gggcgacggc    480

attaacatat ctacagaagg tatgcggtca tcaaagtttt gtctccaccc tgctggggac    540

actccttcct catgccgcct gtttgatgcc atagtcagtc attgtgttcc tgtgatagtc    600

agcagtcgaa tcgagctccc ttttgaagat gagattgatt acagtgagtt ctcccttttc    660

ttctccgttg aagaggctct aagacctgat tacttgctga acgagctcag acaggtcccc    720

aaaaggaagt gggttgatat gtggttgaag cttaagaatg tctcccatca ttatgaattc    780

cagtatcccc ccaggaaggg cgacgcggtg aacatgatat ggaggcaggt gaggcacaag    840

atccccgcag ttaaccttgc tattcacagg aacagaagac tgaaaattcc agactggtgg    900

ggataatgat tggtggtgaa tcgtgtacat attaccatat ccactgttag tcctggttat    960

tttcggtgcg ttatgatgga aacattgctc accgtccttt gtgaaccaaa gtgttcatct    1020

taagatccaa ggaccgagtc cacaactatt tgctgacagg aactgagatt atcacctctt    1080

ttttggtcga tttttgtgac ggcttcctat ttccccccct gatgctacaa aatagagggg    1140

acaaataaac ttacagtaac attatagagg agtc                                1174

 

<210>19

<211>282

<212>PRT

<213>玉米

 

<400>19

Met Thr Asp Pro Asp Thr Glu Ala Asp Arg Leu Leu Gln Val Glu Leu

1               5                   10                  15

Val Asp Ile Leu Trp Lys Ser Lys Tyr Trp Gln Arg Ser Ala Gly Arg

            20                  25                  30

Asp His Val Ile Pro Met His His Pro Asn Ala Phe Arg Phe Leu Arg

        35                  40                  45

Ala Met Val Asn Ala Ser Ile Leu Ile Val Ser Asp Phe Gly Arg Tyr

    50                  55                  60

Thr Lys Glu Leu Ala Ser Leu Arg Lys Asp Val Val Ala Pro Tyr Val

65                  70                  75                  80

His Val Val Gly Ser Phe Leu Asp Asp Asp Pro Pro Asp Pro Phe Glu

                85                  90                  95

Ala Arg His Thr Leu Leu Phe Phe Arg Gly Arg Thr Val Arg Lys Asp

            100                 105                 110

Glu Gly Lys Ile Arg Ser Lys Leu Glu Lys Ile Leu Lys Gly Lys Glu

        115                 120                 125

Gly Val Arg Phe Glu Asp Ser Ile Ala Thr Gly Asp Gly Ile Asn Ile

    130                 135                 140

Ser Thr Glu Gly Met Arg Ser Ser Lys Phe Cys Leu His Pro Ala Gly

145                 150                 155                 160

Asp Thr Pro Ser Ser Cys Arg Leu Phe Asp Ala Ile Val Ser His Cys

                165                 170                 175

Val Pro Val Ile Val Ser Ser Arg Ile Glu Leu Pro Phe Glu Asp Glu

            180                 185                 190

Ile Asp Tyr Ser Glu Phe Ser Leu Phe Phe Ser Val Glu Glu Ala Leu

        195                 200                 205

Arg Pro Asp Tyr Leu Leu Asn Glu Leu Arg Gln Val Pro Lys Arg Lys

    210                 215                 220

Trp Val Asp Met Trp Leu Lys Leu Lys Asn Val Ser His His Tyr Glu

225                 230                 235                 240

Phe Gln Tyr Prc Pro Arg Lys Gly Asp Ala Val Asn Met Ile Trp Arg

                245                 250                 255

Gln Val Arg His Lys Ile Pro Ala Val Asn Leu Ala Ile His Arg Asn

            260                 265                 270

Arg Arg Leu Lys Ile Pro Asp Trp Trp Gly

        275                 280

 

<210>20

<211>1834

<212>DNA

<213>玉米

<400>20

ctccatagcg accaaccggc cgccgcgggt gaccaaccca gccgcgcttt cccccgtcag    60

atcccctcct agccagccat ggccgagccc cgttccgccc tccgcccgca ttgccactgt    120

tagtgccatg gccaccgcct gccggagccc gctcgtctgg ctcttcgcgc tcgccgccgc    180

gctattcttc ctctcctggt acctcctcct caactccgcc gcgggcccaa ccgccgcccg    240

ccgccccaac caggggctcc gcctcggcgg ccccggtagg aaatgcgacc ccgcggaggc    300

gctgctgcga gtgttcatgt acgacctgcc ccccgagttc cacttcggac tgctcgactg    360

gaagcccccg ggcttcggcg tcggcgtgtg gcccgacgtc agggacggcg tgccggacta    420

cccggggggg ctcaaccttc agcacagcat cgagtactgg ctcaccctcg acctcttggc    480

ctccgagcag ggcgcgccca cgccctgcgc agcggcgcgg gtgcgccacg cggcggacgc    540

cgacgtcgtc ttcgtgcctt tcttcgcctc gctcagcttc aaccgccact cccgggtggt    600

gccgcccgcg cggaacagcg aggaccgcgc gctgcaacgg aggctcctcg agttcctcgc    660

cgcgcggcct gagtggcgca ggaccggcgg gcgggaccac gtcgtgctcg cgcatcaccc    720

caacggtatg ctcgacgcgc gctacaggtt ctggccctgc gtcttcgtgc tctgcgactt    780

cgggaggtac ccgcccagcg tcgccaacct cgacaaggac atcatcgcgc cctatcggca    840

cctcgtcgcc aacttcgcta atgacaccgc cggatacgac gaccggccga cgctgctcta    900

cttccaaggc gccatctaca ggaaggatgg tggttccatt cggcaagaac tgtattacct    960

tctgaaagac gagaaagatg tgcatttctc atttggaagt gtagctggta atgggatcga    1020

gcaggcaaca caaggtatgc ggtcatccaa gttctgcctc aacattgcag gtgacactcc    1080

atcctccaac cgcctcttcg actccattgt cagtcactgt gttcccgtca tcatcagcga    1140

tgagattgag ctcccgtttg aggatgtcct cgactattca aagttcagcg tcatagtacg    1200

tggcgcagat gcagtcaaga aggggtttct aaagagcctg atcaaaggga tcagccaaga    1260

agagtggaca cgcatgtgga acaagctaaa ggaagtagaa aagcacttcg agtaccaata    1320

cccatctcag actgatgatg ccgtgcagat gatatggaag gctattgctc ggaaggtgcc    1380

ctctatccgt ctgaagatta acagactacg gagattttct cggtttgata ctaataggac    1440

agatgaaact ctacccagtc cttcttggct acagaatcag gcttcttgat ttttggacta    1500

gcaaactcca gctttcacca tgttttcaat cctgccgaaa caagagttga tactgaagac    1560

caaaccttaa tcgcatgact gggggcagat gttacagctg cagacattaa cggagagtaa    1620

agttgaaaca ctctagcata acagaattac atatccaatg gcacatcatt tttcttcatt    1680

tttcttactt aagattcatc caaaatgtcc ttggctgcag actaaggaca atgaattttg  1740

tatgaaaagc tgtacattct aggcggcaat ataattactg accagttaca gttgctgaaa  1800

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaag                              1834

 

<210>21

<211>453

<212>PRT

<213>玉米

 

<400>21

 

Met Ala Thr Ala Cys Arg Ser Pro Leu Vel Trp Leu Phe Ala Leu Ala

1               5                   10                  15

Ala Ala Leu Phe Phe Leu Ser Trp Tyr Leu Leu Leu Asn Ser Ala Ala

            20                  25                  30

Gly Pro Thr Ala Ala Arg Arg Pro Asn Gln Gly Leu Arg Leu Gly Gly

        35                  40                  45

Pro Gly Arg Lys Cys Asp Pro Ala Glu Ala Leu Leu Arg Val Phe Met

    50                  55                  60

Tyr Asp Leu Pro Pro Glu Phe His Phe Gly Leu Leu Asp Trp Lys Pro

65                  70                  75                  80

Pro Gly Phe Gly Gly Gly Val Trp Pro Asp Val Arg Asp Gly Val Pro

                85                  90                  95

Asp Tyr Pro Gly Gly Leu Asn Leu Gln His Ser Ile Glu Tyr Trp Leu

            100                 105                 110

Thr Leu Asp Leu Leu Ala Ser Glu Gln Gly Ala Pro Thr Pro Cys Ala

        115                 120                 125

Ala Ala Arg Val Arg His Ala Ala Asp Ala Asp Val Val Phe Val Pro

    130                 135                 140

Phe Phe Ala Ser Leu Ser Phe Asn Arg His Ser Arg Val Val Pro Pro

145                 150                 155                 160

Ala Arg Asn Ser Glu Asp Arg Ala Leu Gln Arg Arg Leu Leu Glu Phe

                165                 170                 175

Leu Ala Ala Arg Pro Glu Trp Arg Arg Thr Gly Gly Arg Asp His Val

            180                 185                 190

Val Leu Ala His His Pro Asn Gly Met Leu Asp Ala Arg Tyr Arg Phe

        195                 200                 205

Trp Pro Cys Val Phe Val Leu Cys Asp Phe Gly Arg Tyr Pro Pro Ser

    210                 215                 220

Val Ala Asn Leu Asp Lys Asp Ile Ile Ala Pro Tyr Arg His Leu Val

225                 230                 235                 240

Ala Asn Phe Ala Asn Asp Thr Ala Gly Tyr Asp Asp Arg Pro Thr Leu

                245                 250                 255

Leu Tyr Phe Gln Gly Ala Ile Tyr Arg Lys Asp Gly Gly Ser Ile Arg

            260                 265                 270

Gln Glu Leu Tyr Tyr Leu Leu Lys Asp Glu Lys Asp Val His Phe Ser

        275                 280                 285

Phe Gly Ser Val Ala Gly Asn Gly Ile Glu Gln Ala Thr Gln Gly Met

    290                 295                 300

Arg Ser Ser Lys Phe Cys Leu Asn Ile Ala Gly Asp Thr Pro Ser Ser

305                 310                 315                 320

Asn Arg Leu Phe Asp Ser Ile Val Ser His Cys Val Pro Val Ile Ile

                325                 330                 335

Ser Asp Glu Ile Glu Leu Pro Phe Glu Asp Val Leu Asp Tyr Ser Lys

            340                 345                 350

Phe Ser Val Ile Val Arg Gly Ala Asp Ala Val Lys Lys Gly Phe Leu

        355                 360                 365

Lys Ser Leu Ile Lys Gly Ile Ser Gln Glu Glu Trp Thr Arg Met Trp

    370                 375                 380

Asn Lys Leu Lys Glu Val Glu Lys His Phe Glu Tyr Gln Tyr Pro Ser

385                 390                 395                 400

Gln Thr Asp Asp Ala Val Gln Met Ile Trp Lys Ala Ile Ala Arg Lys

                405                 410                 415

Val Pro Ser Ile Arg Leu Lys Ile Asn Arg Leu Arg Arg Phe Ser Arg

            420                 425                 430

Phe Asp Thr Asn Arg Thr Asp Glu Thr Leu Pro Ser Pro Ser Trp Leu

        435                 440                 445

Gln Asn Gln Ala Ser

    450

 

<210>22

<211>2080

<212>DNA

<213>水稻

 

<400>22

ggcatagcgg catgcatcgc agcataggcc ggtcaagaag acgatggccc tgacgaggcg  60

cctcctcatc gatctctcgt caagacgccg ccttttcaac gccggcaaat tctccaccac  120

gcacaagaag aaaccagtgc tccatgaagg gagggagcag gggtgttgtt gaaatggagc  180

agcagctcgt ttctttgatt tgatctttgg cagtaagtaa ttcggggttt gaatttatta  240

tttttgtttt gggcgaattt cattccagcg gtgagtttgg ctggattctt gcgctgctcg  300

cgcgcgctgg tgtcgtggat ggtggcggag aggaagatgc agccatcgcc ggcggcgccg  360

ccggcggcgg agcaccggag gcgggcgctg ctgcgctacg tggtgttcct cgcggtctcc  420

ctcctcgcct tctcctgctg ggctctcgtc agctcgcgga tcgacggcgc cgtcctcgcg  480

gcgaccgccg gcggcgagca tgacgaccac gatggcatta ttgttagaag cagcacccaa  540

gcggagatgc cagcgagagg cgggaacgcg acgtcgcgcg gcgccgtcga ggtgggtgtg  600

ggtactccgg cggcgatgat cacccggcag ccgtcgtcgg gagagacgac gacgacggcg  660

gcgttggcgg cgacgtgcga cgcggagagc gcgctgctga gggtgtacct ctacgacctc  720

ccgccggagt tccacttcgg catgctgggg tgggacggca aggcggccgg cgcggcgtgg  780

ccggacgtgg ccggcgaccc gcgcgccgtg ccgcgctacc cgggcggcct gaacctgcag  840

cacagcgtcg agtactggct caccctggac atcctctcct ccaccacctc cggcgaccac  900

cgccgccgcc gtccgtgcac cgccgtgagg gtgacgaacg cgagccttgc cgacgtgttc  960

ctggtgccgt tcttcgcgtc gctgagctac aaccggcagt cgaagtcgcc gcacggcggc  1020

catgggagtg gcggccggag cgacaggcag ctgcagggcg agctggtgag gtacctggcg  1080

aggcgggagg agtggcggcg gtggggcggc gcggaccacc tcgtcgtgcc gcaccacccg  1140

aacagcatga tggacgcccg gcggcggctc agcgccgcca tgttcgtcct ctccgacttc  1200

ggcaggtacc cgccggacgt cgccaacctg aggaaggacg tgatcgcgcc gtacaagcac  1260

gtcgtcccct ccctcggcga cggcgactcg ccggggttcg agcagcgccc cgtcctcgct  1320

tacttccagg gcgccattca taggaaaaat ggtggaaggg ttcgtcagag gctgtaccag  1380

ctgatcaagg acgagaagga cgtccacttc acctacggca gcgtccgtca gaacggcatc  1440

aggcgcgcca ccaaggggat ggcctcctcc aagttctgcc tcaacatcgc cggcgacacc  1500

ccctcctcca accgcctctt cgacgccatc gtcagccact gcgtccccgt gatcatcagc  1560

gacgacatcg agctcccctt cgaggacgtc ctcgactact ccgccttctg cgtgttcgtc  1620

cgcgcctccg acgccgtcaa gaggggcttc ctgctgcatc tcctcagggg gatctcccag  1680

gaagaatgga cggcaatgtg gaggaggctg aaggaggttg cacaccactt cgagtaccag  1740

tacccttcgc agcctggtga cgctgttcag atgatctggg gagctgtagc tcggaagatg  1800

catttggtga agctgcaact tcacaagcgt ggtagatatc agaggacatt ttctgaatca  1860

taaaaggtta gggtagcaaa gcatggagga gattcagagc tataggttgc agtttttgat  1920

caataatttt catgtggctg gtaaagttct atggtcattt tgcaatctaa gttgcaagga  1980

ctatgtgcag ccagtctttg tccaagaggt aattattaga cagttagtta taaattatat  2040

tattcttatt aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa                        2080

 

<210>23

<211>514

<212>PRT

<213>水稻

 

<400>23

Met Val Ala Glu Arg Lys Met Gln Pro Ser Pro Ala Ala Pro Pro Ala

1               5                   10                  15

Ala Glu His Arg Arg Arg Ala Leu Leu Arg Tyr Val Val Phe Leu Ala

            20                  25                  30

Val Ser Leu Leu Ala Phe Ser Cys Trp Ala Leu Val Ser Ser Arg Ile

        35                  40                  45

Asp Gly Ala Val Leu Ala Ala Thr Ala Gly Gly Glu His Asp Asp His

    50                  55                  60

Asp Gly Ile Ile Val Arg Ser Ser Thr Gln Ala Glu Met Pro Ala Arg

65                  70                  75                  80

Gly Gly Asn Ala Thr Ser Arg Gly Ala Val Glu Val Gly Val Gly Thr

                85                  90                  95

Pro Ala Ala Met Ile Thr Arg Gln Pro Ser Ser Gly Glu Thr Thr Thr

            100                 105                 110

Thr Ala Ala Leu Ala Ala Thr Cys Asp Ala Glu Ser Ala Leu Leu Arg

        115                 120                 125

Val Tyr Leu Tyr Asp Leu Pre Pre Glu Phe His Phe Gly Met Leu Gly

    130                 135                 140

Trp Asp Gly Lys Ala Ala Gly Ala Ala Trp Pro Asp Val Ala Gly Asp

145                 150                 155                 160

Pro Arg Ala Val Pro Arg Tyr Pro Gly Gly Leu Asn Leu Gln His Ser

                165                 170                 175

Val Glu Tyr Trp Leu Thr Leu Asp Ile Leu Ser Ser Thr Thr Ser Gly

            180                 185                 190

Asp His Arg Arg Arg Arg Pro Cys Thr Ala Val Arg Val Thr Asn Ala

        195                 200                 205

Ser Leu Ala Asp Val Phe Leu Val Pro Phe Phe Ala Ser Leu Ser Tyr

    210                 215                 220

Asn Arg Gln Ser Lys Ser Pro His Gly Gly His Gly Ser Gly Gly Arg

225                 230                 235                 240

Ser Asp Arg Gln Leu Gln Gly Glu Leu Val Arg Tyr Leu Ala Arg Arg

                245                 250                 255

Glu Glu Trp Arg Arg Trp Gly Gly Ala Asp His Leu Val Val Pro His

            260                 265                 270

His Pro Asn Ser Met Met Asp Ala Arg Arg Arg Leu Ser Ala Ala Met

        275                 280                 285

Phe Val Leu Ser Asp Phe Gly Arg Tyr Pro Pro Asp Val Ala Asn Leu

    290                 295                 300

Arg Lys Asp Val Ile Ala Pro Tyr Lys His Val Val Pro Ser Leu Gly

305                 310                 315                 320

Asp Gly Asp Ser Pro Gly Phe Glu Gln Arg Pro Val Leu Ala Tyr Phe

                325                 330                 335

Gln Gly Ala Ile His Arg Lys Asn Gly Gly Arg Val Arg Gln Arg Leu

            340                 345                 350

Tyr Gln Leu Ile Lys Asp Glu Lys Asp Val His Phe Thr Tyr Gly Ser

        355                 360                 365

Val Arg Gln Asn Gly Ile Arg Arg Ala Thr Lys Gly Met Ala Ser Ser

    370                 375                 380

Lys Phe Cys Leu Asn Ile Ala Gly Asp Thr Pro Ser Ser Asn Arg Leu

385                 390                 395                 400

Phe Asp Ala Ile Val Ser His Cys Val Pro Val Ile Ile Ser Asp Asp

                405                 410                 415

Ile Glu Leu Pro Phe Glu Asp Val Leu Asp Tyr Ser Ala Phe Cys Val

            420                 425                 430

Phe Val Arg Ala Ser Asp Ala Val Lys Arg Gly Phe Leu Leu His Leu

        435                 440                 445

Leu Arg Gly Ile Ser Gln Glu Glu Trp Thr Ala Met Trp Arg Arg Leu

    450                 455                 460

Lys Glu Val Ala His His Phe Glu Tyr Gln Tyr Pro Ser Gln Pro Gly

465                 470                 475                 480

Asp Ala Val Gln Met Ile Trp Gly Ala Val Ala Arg Lys Met His Leu

                485                 490                 495

Val Lys Leu Gln Leu His Lys Arg Gly Arg Tyr Gln Arg Thr Phe Ser

            500                 505                 510

Glu Ser

 

<210>24

<211>1802

<212>DNA

<213>玉米

 

<400>24

ccccctccca gctagccatg gccgcgcccc gctctggtcg ccgcccgcac tgccactgct  60

agccatggcc gccgccgccg cctgccggag cccgctggtc tggctcttcg cgctcgtcac  120

cgcactcttc ttcttctcct ggtacctcct cctcgactcc gccgcgggtc cagccgccgc  180

ccgccgcccc aaccagtggc tccgcctcgg cggcggcggg cggcgctccg gtcccggtag  240

gaaatgcgac cccgcggagg cgctgctgcg agtgttcatg tacgacctgc cccccgagtt  300

ccacttcgga ctgctcgact ggaagccccc cggcttcggc ggcggcgtgt ggcccgacat  360

cagggacggc gtgcctgact acccgggggg cctcaacctg cagcacagea tegagtattg  420

gctcaccctc gacctcctgg cctccgagca gggcgcgccc acgccctgcg cagtggcgcg  480

ggtgcgccac gcggcggacg ccgacgtcgt cttcgtgccc ttcttcgcct cgctcagctt  540

caaccgccac tcccgggtgg taccgcccgc gcgggacagc gaggaccgcg cgctgcagcg  600

gaggctcctc gagttcctcg ccgcgcggcc cgagtggcgg aggactggcg ggcgggacca  660

cgtcgtgctc gcgcatcacc ccaacgggat gctcgacgcg cgctacaggt tctggccctg  720

cgtcttcgtg ctctgcgact tcgggaggta cccgcccagc gtcgccaacc tcgacaagga  780

cgtcatcgcg ccctaccggc acctcgtcgc caacttcgct aatgacaccg ccggatacga  840

cgaccggccg acattgctct acttccaagg cgccatctac aggaaggacg gtggtttcat  900

ccggcaagaa ctgtattacc ttctgaaaga cgagaaagat gtgcatttct catttggaag  960

cgtagccggt aatgggatcg agcaagcaac acaagggatg cggtcatcca agttctgcct  1020

caacattgca ggtgacactc catcctccaa ccgcctcttt gactccatag tcagtcactg  1080

tgttcccgtc acgatcagcg atgagattga gctcccgttt gaggatgtcc tcgactactc  1140

gaagttcagt gtcatagtac gtggcgcaga cgcagtcaag aaggggtttc taatgaacct  1200

gatcaaaggg atcagccgag aagagtggac acgcatgtgg aacaggctaa aggaagtgga  1260

aaagcacttt gagtaccaat acccatctca gaccgatgat gccgtgcaga tgatatggaa  1320

ggccattgct cggaaggtgc cgtctatccg gctgaagatt aacagactgc aaagattttc  1380

tctgtttgag actaacagga cagatgagac tctaccccca tcttcttctt ggctacagaa  1440

tcaggctcct tgattttgga ctagcaagct caggctttcg ccatgttttc aatctcgtag  1500

aatcaagagt tgatactgaa gaccaaatct taatcgcttg actgggggca gatgttagta  1560

tgttacagct gcagacatta gcggatagta aagttgaaac actttagcat agcagaatta  1620

catatccagt ggcacatcat tttcttcatt ttttttttct tttgcttgcg attcatccaa  1680

agtgtcctcg gctgcagact aaggacaatg aattttgtat gtgaagctgt atattctagg  1740

cggcaatata gttactgatc agttacagtt gctgagcaaa aaaaaaaaaa aaaaaaaaaa  1800

aa                                                                 1802

 

<210>25

<211>462

<212>PRT

<213>玉米

 

<400>25

 

Met Ala Ala Ala Ala Ala Cys Arg Ser Pro Leu Val Trp Leu Phe Ala

1               5                   10                  15

Leu Val Thr Ala Leu Phe Phe Phe Ser Trp Tyr Leu Leu Leu Asp Ser

            20                  25                  30

Ala Ala Gly Pro Ala Ala Ala Arg Arg Pro Asn Gln Trp Leu Arg Leu

        35                  40                  45

Gly Gly Gly Gly Arg Arg Ser Gly Pro Gly Arg Lys Cys Asp Pro Ala

    50                  55                  60

Glu Ala Leu Leu Arg Val Phe Met Tyr Asp Leu Pro Pro Glu Phe His

65                  70                  75                  80

Phe Gly Leu Leu Asp Trp Lys Pro Pro Gly Phe Gly Gly Gly Val Trp

                85                  90                  95

Pro Asp Ile Arg Asp Gly Val Pro Asp Tyr Pro Gly Gly Leu Asn Leu

            100                 105                 110

Gln His Ser Ile Glu Tyr Trp Leu Thr Leu Asp Leu Leu Ala Ser Glu

        115                 120                 125

Gln Gly Ala Pro Thr Pro Cys Ala Val Ala Arg Val Arg His Ala Ala

    130                 135                 140

Asp Ala Asp Val Val Phe Val Pro Phe Phe Ala Ser Leu Ser Phe Asn

145                 150                 155                 160

Arg His Ser Arg Val Val Pro Pro Ala Arg Asp Ser Glu Asp Arg Ala

                165                 170                 175

Leu Gln Arg Arg Leu Leu Glu Phe Leu Ala Ala Arg Pro Glu Trp Arg

            180                 185                 190

Arg Thr Gly Gly Arg Asp His Val Val Leu Ala His His Pro Asn Gly

        195                 200                 205

Met Leu Asp Ala Arg Tyr Arg Phe Trp Pro Cys Val Phe Val Leu Cys

    210                 215                 220

Asp Phe Gly Arg Tyr Pre Pre Ser Val Ala Asn Leu Asp Lys Asp Val

225                 230                 235                 240

Ile Ala Pro Tyr Arg His Leu Val Ala Asn Phe Ala Asn Asp Thr Ala

                245                 250                 255

Gly Tyr Asp Asp Arg Pro Thr Leu Leu Tyr Phe Gln Gly Ala Ile Tyr

            260                 265                 270

Arg Lys Asp Gly Gly Phe Ile Arg Gln Glu Leu Tyr Tyr Leu Leu Lys

        275                 280                 285

Asp Glu Lys Asp Val His Phe Ser Phe Gly Ser Val Ala Gly Asn Gly

    290                 295                 300

Ile Glu Gln Ala Thr Gln Gly Met Arg Ser Ser Lys Phe Cys Leu Asn

305                 310                 315                 320

Ile Ala Gly Asp Thr Pro Ser Ser Asn Arg Leu Phe Asp Ser Ile Val

                325                 330                 335

Ser His Cys Val Pro Val Thr Ile Ser Asp Glu Ile Glu Leu Pro Phe

            340                 345                 350

Glu Asp Val Leu Asp Tyr Ser Lys Phe Ser Val Ile Val Arg Gly Ala

        355                 360                 365

Asp Ala Val Lys Lys Gly Phe Leu Met Asn Leu Ile Lys Gly Ile Ser

    370                 375                 380

Arg Glu Glu Trp Thr Arg Met Trp Asn Arg Leu Lys Glu Val Glu Lys

385                 390                 395                 400

His Phe Glu Tyr Gln Tyr Pro Ser Gln Thr Asp Asp Ala Val Gln Met

                405                 410                 415

Ile Trp Lys Ala Ile Ala Arg Lys Val Pro Ser Ile Arg Leu Lys Ile

            420                 425                 430

Asn Arg Leu Gln Arg Phe Ser Leu Phe Glu Thr Asn Arg Thr Asp Glu

        435                 440                 445

Thr Leu Pro Pro Ser Ser Ser Trp Leu Gln Asn Gln Ala Pro

    450                 455                 460

 

<210>26

<211>1674

<212>DNA

<213>玉米

 

<400>26

ctagcatctc ttttctcata tgcagtacca catatatttc gttttacctc tattgagtat    60

aaaatcttta aatcgtagag tcttctaccg taactctatt tccctattta ctattgtacg    120

acttttaaca actagcacta catcgtcgac aaaaggtata caccaaggga tttcccctct    180

acgccccctg tgaccttatt catcacaaag gcgaaaaggt aagtgcttaa agttgatctt    240

tgatgtagta ctgtcctaat tgtgaagttg tatatgtcca tattacttgt tcgaacacta    300

gtcacaacat tggtccttag gagtatcttc atgaaggtgc ctcaaaataa tgctcccaaa    360

attaaaatac tacaacataa agtgtttagg gtactaaaaa aacaaatcga actccaccag    420

ttaagcccta tatcatgtat tttagaaaat aaagtatatt attagaaaac aaaaggttca    480

gtatattgta gaaaaaatag gacactaatc tagggtgtag tatatctgga tcactttatt    540

gtctaaccta tgtttttttg ttaaaaaatt tataaaacag gattacctgt ttttatgagt    600

tgaacccaat atcttaaaac aacacaatga ttaaaggctt tattggagat attctaatga    660

gcccaatgta tttcattaaa atttatgttt gtccaaatcc atttcataac attttttggt    720

actttatcat aaaccttaat caaatcaata aaaacatgtg tagatcatcc ttttgttctc    780

tatactggtc tatcacttgt cttattaaaa atgactttca tggttgatct tttaggtatg    840

aaaccgattt ggttagaaga gatcctcgct attccattga gggagggagc attcgacagg    900

agctatatta tatgctcaaa gaagaaaagg atgtttactt ttcctttgga agtgtccagg    960

accatggggc cagcaaagct agccaaggaa tgcactcatc aaaattttgc ctaaatattg    1020

ctggggacac cccttcttcc aatcgtctgt ttgatgcgat agttacccac tgtgtccctg    1080

ttatcatcag tgacgacatt gagctacctt atgaggatgt gttggattat tcaaaattct  1140

ccatctttgt ccgttcgtct gatgctgtta agaaaggtta cctgatgaga ctgctcagtg  1200

gtgtaagcaa gcaacaatgg acaaagatgt gggaraggct caaagaggtg gataaacatt  1260

ttgagtatca gtatccatca cagaaggatg atgcagtcca gatgatctgg caagcattgt  1320

ctagaaaggt gccatcaatt aagctgaagg ttcacagatc taatagattt tcaagatcta  1380

acagaggaaa ataaacagaa aggggtgtgt ctatcttgtc tctattggct aatctaatgt  1440

aacacatttc actgacacag gctctcagcc tttcccagtt gcacaaaata gatagattgt  1500

aatactcagg ttatctttag gaaaggtttg taccttaaga tttgttggtt cagttgaagc  1560

atatactgtc aagtcaaagg ttgttttgta aggtatgtta aatgtaatca tgaaagaaag  1620

acttggtttt gctgtttcaa aaaaaaaaaa aasaaaasaa aaaaaaaaaa aaaa        1674

 

<210>27

<211>1674

<212>PRT

<213>玉米

 

<400>27

 

Cys Thr Ala Gly Cys Ala Thr Cys Thr Cys Thr Thr Thr Thr Cys Thr

1               5                   10                  15

Cys Ala Thr Ala Thr Gly Cys Ala Gly Thr Ala Cys Cys Ala Cys Ala

            20                  25                  30

Thr Ala Thr Ala Thr Thr Thr Cys Gly Thr Thr Thr Thr Ala Cys Cys

        35                  40                  45

Thr Cys Thr Ala Thr Thr Gly Ala Gly Thr Ala Thr Ala Ala Ala Ala

    50                  55                  60

Thr Cys Thr Thr Thr Ala Ala Ala Thr Cys Gly Thr Ala Gly Ala Gly

65                  70                  75                  80

Thr Cys Thr Thr Cys Thr Ala Cys Cys Gly Thr Ala Ala Cys Thr Cys

                85                  90                  95

Thr Ala Thr Thr Thr Cys Cys Cys Thr Ala Thr Thr Thr Ala Cys Thr

            100                 105                 110

Ala Thr Thr Gly Thr Ala Cys Gly Ala Cys Thr Thr Thr Thr Ala Ala

        115                 120                 125

Cys Ala Ala Cys Thr Ala Gly Gys Ala Cys Thr Ala Cys Ala Thr Cys

    130                 135                 140

Gly Thr Cys Gly Ala Cys Ala Ala Ala Ala Gly Gly Thr Ala Thr Ala

145                 150                 155                 160

Cys Ala Cys Cys Ala Ala Gly Gly Gly Ala Thr Thr Thr Cys Cys Cys

                165                 170                 175

Cys Thr Cys Thr Ala Cys Gly Cys Cys Cys Cys Cys Thr Gly Thr Gly

            180                 185                 190

Ala Cys Cys Thr Thr Ala Thr Thr Cys Ala Thr Cys Ala Cys Ala Ala

        195                 200                 205

Ala Gly Gly Cys Gly Ala Ala Ala Ala Gly Gly Thr Ala Ala Gly Thr

    210                 215                 220

Gly Cys Thr Thr Ala Ala Ala Gly Thr Thr Gly Ala Thr Cys Thr Thr

225                 230                 235                 240

Thr Gly Ala Thr Gly Thr Ala Gly Thr Ala Cys Thr Gly Thr Cys Cys

                245                 250                 255

Thr Ala Ala Thr Thr Gly Thr Gly Ala Ala Gly Thr Thr Gly Thr Ala

            260                 265                 270

Thr Ala Thr Gly Thr Cys Cys Ala Thr Ala Thr Thr Ala Cys Thr Thr

        275                 280                 285

Gly Thr Thr Cys Gly Ala Ala Cys Ala Cys Thr Ala Gly Thr Cys Ala

    290                 295                 300

Cys Ala Ala Cys Ala Thr Thr Gly Gly Thr Cys Cys Thr Thr Ala Gly

305                 310                 315                 320

Gly Ala Gly Thr Ala Thr Cys Thr Thr Cys Ala Thr Gly Ala Ala Gly

                325                 330                 335

Gly Thr Gly Cys Cys Thr Cys Ala Ala Ala Ala Thr Ala Ala Thr Gly

            340                 345                 350

Cys Thr Cys Cys Cys Ala Ala Ala Ala Thr Thr Ala Ala Ala Ala Thr

        355                 360                 365

Ala Cys Thr Ala Cys Ala Ala Cys Ala Thr Ala Ala Ala Gly Thr Gly

    370                 375                 380

Thr Thr Thr Ala Gly Gly Gly Thr Ala Cys Thr Ala Ala Ala Ala Ala

385                 390                 395                 400

Ala Ala Cys Ala Ala Ala Thr Cys Gly Ala Ala Cys Thr Cys Cys Ala

                405                 410                 415

Cys Cys Ala Gly Thr Thr Ala Ala Gly Cys Cys Cys Thr Ala Thr Ala

            420                 425                 430

Thr Cys Ala Thr Gly Thr Ala Thr Thr Thr Thr Ala Gly Ala Ala Ala

        435                 440                 445

Ala Thr Ala Ala Ala Gly Thr Ala Thr Ala Thr Thr Ala Thr Thr Ala

    450                 455                 460

Gly Ala Ala Ala Ala Cys Ala Ala Ala Ala Gly Gly Thr Thr Cys Ala

465                 470                 475                 480

Gly Thr Ala Thr Ala Thr Thr Gly Thr Ala Gly Ala Ala Ala Ala Ala

                485                 490                 495

Ala Thr Ala Gly Gly Ala Cys Ala Cys Thr Ala Ala Thr Cys Thr Ala

            500                 505                 510

Gly Gly Gly Thr Gly Thr Ala Gly Thr Ala Thr Ala Thr Cys Thr Gly

        515                 520                 525

Gly Ala Thr Cys Ala Cys Thr Thr Thr Ala Thr Thr Gly Thr Cys Thr

    530                 535                 540

Ala Ala Cys Cys Thr Ala Thr Gly Thr Thr Thr Thr Thr Thr Thr Gly

545                 550                 555                 560

Thr Thr Ala Ala Ala Ala Ala Ala Thr Thr Thr Ala Thr Ala Ala Ala

                565                 570                 575

Ala Cys Ala Gly Gly Ala Thr Thr Ala Cys Cys Thr Gly Thr Thr Thr

            580                 585                 590

Thr Thr Ala Thr Gly Ala Gly Thr Thr Gly Ala Ala Cys Cys Cys Ala

        595                 600                 605

Ala Thr Ala Thr Cys Thr Thr Ala Ala Ala Ala Cys Ala Ala Cys Ala

    610                 615                 620

Cys Ala Ala Thr Gly Ala Thr Thr Ala Ala Ala Gly Gly Cys Thr Thr

625                 630                 635                 640

Thr Ala Thr Thr Gly Gly Ala Gly Ala Thr Ala Thr Thr Cys Thr Ala

                645                 650                 655

Ala Thr Gly Ala Gly Cys Cys Cys Ala Ala Thr Gly Thr Ala Thr Thr

            660                 665                 670

Thr Cys Ala Thr Thr Ala Ala Ala Ala Thr Thr Thr Ala Thr Gly Thr

        675                 680                 685

Thr Thr Gly Thr Cys Cys Ala Ala Ala Thr Cys Cys Ala Thr Thr Thr

    690                 695                 700

Cys Ala Thr Ala Ala Cys Ala Thr Thr Thr Thr Thr Thr Gly Gly Thr

705                 710                 715                 720

Ala Cys Thr Thr Thr Ala Thr Cys Ala Thr Ala Ala Ala Cys Cys Thr

                725                 730                 735

Thr Ala Ala Thr Cys Ala Ala Ala Thr Cys Ala Ala Thr Ala Ala Ala

            740                 745                 750

Ala Ala Cys Ala Thr Gly Thr Gly Thr Ala Gly Ala Thr Cys Ala Thr

        755                 760                 765

Cys Cys Thr Thr Thr Thr Gly Thr Thr Cys Thr Cys Thr Ala Thr Ala

    770                 775                 780

Cys Thr Gly Gly Thr Cys Thr Ala Thr Cys Ala Cys Thr Thr Gly Thr

785                 790                 795                 800

Cys Thr Thr Ala Thr Thr Ala Ala Ala Ala Ala Thr Gly Ala Cys Thr

                805                 810                 815

Thr Thr Cys Ala Thr Gly Gly Thr Thr Gly Ala Thr Cys Thr Thr Thr

            820                 825                 830

Thr Ala Gly Gly Thr Ala Thr Gly Ala Ala Ala Cys Cys Gly Ala Thr

        835                 840                 845

Thr Thr Gly Gly Thr Thr Ala Gly Ala Ala Gly Ala Gly Ala Thr Cys

    850                 855                 860

Cys Thr Cys Gly Cys Thr Ala Thr Thr Cys Cys Ala Thr Thr Gly Ala

865                 870                 875                 880

Gly Gly Gly Ala Gly Gly Gly Ala Gly Cys Ala Thr Thr Cys Gly Ala

                885                 890                 895

Cys Ala Gly Gly Ala Gly Cys Thr Ala Thr Ala Thr Thr Ala Thr Ala

            900                 905                 910

Thr Gly Cys Thr Cys Ala Ala Ala Gly Ala Ala Gly Ala Ala Ala Ala

        915                 920                 925

Gly Gly Ala Thr Gly Thr Thr Thr Ala Cys Thr Thr Thr Thr Cys Cys

    930                 935                 940

Thr Thr Thr Gly Gly Ala Ala Gly Thr Gly Thr Cys Cys Ala Gly Gly

945                 950                 955                 960

Ala Cys Cys Ala Thr Gly Gly Gly Gly Cys Cys Ala Gly Cys Ala Ala

                965                 970                 975

Ala Gly Cys Thr Ala Gly Cys Cys Ala Ala Gly Gly Ala Ala Thr Gly

            980                 985                 990

Cys Ala Cys Thr Cys Ala Thr Cys  Ala Ala Ala Ala Thr  Thr Thr Thr

        995                 1000                 1005

Gly Cys  Cys Thr Ala Ala Ala  Thr Ala Thr Thr Gly  Cys Thr Gly

    1010                 1015                 1020

Gly Gly  Gly Ala Cys Ala Cys  Cys Cys Cys Thr Thr  Cys Thr Thr

    1025                 1030                 1035

Cys Cys  Ala Ala Thr Cys Gly  Thr Cys Thr Gly Thr  Thr Thr Gly

    1040                 1045                 1050

Ala Thr  Gly Cys Gly Ala Thr  Ala Gly Thr Thr Ala  Cys Cys Cys

    1055                 1060                 1065

Ala Cys  Thr Gly Thr Gly Thr  Cys Cys Cys Thr Gly  Thr Thr Ala

    1070                 1075                 1080

Thr Cys  Ala Thr Cys Ala Gly  Thr Gly Ala Cys Gly  Ala Cys Ala

    1085                 1090                 1095

Thr Thr  Gly Ala Gly Cys Thr  Ala Cys Cys Thr Thr  Ala Thr Gly

    1100                 1105                 1110

Ala Gly  Gly Ala Thr Gly Thr  Gly Thr Thr Gly Gly  Ala Thr Thr

    1115                 1120                 1125

Ala Thr  Thr Cys Ala Ala Ala  Ala Thr Thr Cys Thr  Cys Cys Ala

    1130                 1135                 1140

Thr Cys  Thr Thr Thr Gly Thr  Cys Cys Gly Thr Thr  Cys Gly Thr

    1145                 1150                 1155

Cys Thr  Gly Ala Thr Gly Cys  Thr Gly Thr Thr Ala  Ala Gly Ala

    1160                 1165                 1170

Ala Ala  Gly Gly Thr Thr Ala  Cys Cys Thr Gly Ala  Thr Gly Ala

    1175                 1180                 1185

Gly Ala  Cys Thr Gly Cys Thr  Cys Ala Gly Thr Gly  Gly Thr Gly

    1190                 1195                 1200

Thr Ala  Ala Gly Cys Ala Ala  Gly Cys Ala Ala Cys  Ala Ala Thr

    1205                 1210                 1215

Gly Gly  Ala Cys Ala Ala Ala  Gly Ala Thr Gly Thr  Gly Gly Gly

    1220                 1225                 1230

Ala Thr  Ala Gly Gly Cys Thr  Cys Ala Ala Ala Gly  Ala Gly Gly

    1235                 1240                 1245

Thr Gly  Gly Ala Thr Ala Ala  Ala Cys Ala Thr Thr  Thr Thr Gly

    1250                 1255                 1260

Ala Gly  Thr Ala Thr Cys Ala  Gly Thr Ala Thr Cys  Cys Ala Thr

    1265                 1270                 1275

Cys Ala  Cys Ala Gly Ala Ala  Gly Gly Ala Thr Gly  Ala Thr Gly

    1280                 1285                 1290

Cys Ala  Gly Thr Cys Cys Ala  Gly Ala Thr Gly Ala  Thr Cys Thr

    1295                 1300                 1305

Gly Gly  Cys Ala Ala Gly Cys  Ala Thr Thr Gly Thr  Cys Thr Ala

    1310                 1315                 1320

Gly Ala  Ala Ala Gly Gly Thr  Gly Cys Cys Ala Thr  Cys Ala Ala

    1325                 1330                 1335

Thr Thr  Ala Ala Gly Cys Thr  Gly Ala Ala Gly Gly  Thr Thr Cys

    1340                 1345                 1350

Ala Cys  Ala Gly Ala Thr Cys  Thr Ala Ala Thr Ala  Gly Ala Thr

    1355                 1360                 1365

Thr Thr  Thr Cys Ala Ala Gly  Ala Thr Cys Thr Ala  Ala Cys Ala

    1370                 1375                 1380

Gly Ala  Gly Gly Ala Ala Ala  Ala Thr Ala Ala Ala  Cys Ala Gly

    1385                 1390                 1395

Ala Ala  Ala Gly Gly Gly Gly  Thr Gly Thr Gly Thr  Cys Thr Ala

    1400                 1405                 1410

Thr Cys  Thr Thr Gly Thr Cys  Thr Cys Thr Ala Thr  Thr Gly Gly

    1415                 1420                 1425

Cys Thr  Ala Ala Thr Cys Thr  Ala Ala Thr Gly Thr  Ala Ala Cys

    1430                 1435                 1440

Ala Cys  Ala Thr Thr Thr Cys  Ala Cys Thr Gly Ala  Cys Ala Cys

    1445                 1450                 1455

Ala Gly  Gly Cys Thr Cys Thr  Cys Ala Gly Cys Cys  Thr Thr Thr

    1460                 1465                 1470

Cys Cys  Cys Ala Gly Thr Thr  Gly Cys Ala Cys Ala  Ala Ala Ala

    1475                 1480                 1485

Thr Ala Gly Ala Thr Ala Gly Ala Thr Thr Gly Thr Ala Ala Thr

    1490                1495                1500

Ala Cys Thr Cys Ala Gly Gly Thr Thr Ala Thr Cys Thr Thr Thr

    1505                1510                1515

Ala Gly Gly Ala Ala Ala Gly Gly Thr Thr Thr Gly Thr Ala Cys

    1520                1525                1530

Cys Thr Thr Ala Ala Gly Ala Thr Thr Thr Gly Thr Thr Gly Gly

    1535                1540                1545

Thr Thr Cys Ala Gly Thr Thr Gly Ala Ala Gly Cys Ala Thr Ala

    1550                1555                1560

Thr Ala Cys Thr Gly Thr Cys Ala Ala Gly Thr Cys Ala Ala Ala

    1565                1570                1575

Gly Gly Thr Thr Gly Thr Thr Thr Thr Gly Thr Ala Ala Gly Gly

    1580                1585                1590

Thr Ala Thr Gly Thr Thr Ala Ala Ala Thr Gly Thr Ala Ala Thr

    1595                1600                1605

Cys Ala Thr Gly Ala Ala Ala Gly Ala Ala Ala Gly Ala Cys Thr

    1610                1615                1620

Thr Gly Gly Thr Thr Thr Thr Gly Cys Thr Gly Thr Thr Thr Cys

    1625                1630                1635

Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala

    1640                1645                1650

Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala

    1655                1660                1665

Ala Ala Ala Ala Ala Ala

    1670

 

<210>28

<211>1893

<212>DNA

<213>裸麦

<400>28

caccagatcg acgattcgcc atgctccccc gtgcaccact ccggccatga gcctcgcgct    60

ccatggcgcc gccccgtgct cgcgccctac tcctgccgct ggcggcggcc accgtcctag    120

tcgcctccac catcttcctc ttcgccgccg ccggcgccgg ccgctggcgc cccgccgaca    180

ccggcctccc cgtcccggca acccccgccg acttctcggc cgtccctatc ggtgtgagtg    240

taacatccac cgccaagggt aaagagctct cctttcttga tgagaatggc cgccccgacg    300

accccagctc cggctcggcg gcggctgctg aacctgggag atgcgacccc cgcgacgccg    360

ccgtcagggt gttcgtttac gacatgccgc cggagttcca cttcgggctg ctcggctggg    420

cgccacctcc cgggaacggc ggcggcgtct ggcctgacgt caggggcggc acagtcccgc    480

gctaccccgg tgggcttaac cagcagcaca gcgtggagta ctggctcacg ctggacctcc    540

tggcatcctc gtcggcagca ccgtgcggtc cggctgtgag ggttgccgac tctcgtgatg    600

cggacctgat cttcgtcccc ttcttcgcgt ccctcagtta caaccgccac tccaaggccg    660

tgccgccgga gaaggtaagc agagacatgt acctacagga gaagctcgtc aggtatctgg    720

tggcgcaacc ggagtggaag aggtccgggg gtgccgacca tgtcgtcgtc gcgcaccacc    780

ccaacagctt actccacgcc cggtcggcgc tgttcccagc agtgttcgtg ctgtctgact    840

tcgggaggta ccaccccagg gttgccagct tggagaagga tctcattgcg ccataccgac    900

atatggcaaa gacatttgtg aatgacacgg ccgggtttga tgatcggccg acattgttat    960

acttccgggg agccatttac agaaaggagg gaggaaacat tcggcaggaa ctatataata    1020

tgctcaaaga tgagagggat gttttctttt ccttcggaag cgtccaggac catggtgtca    1080

gcaaagccag ccagggaatg cactcatcaa agttttgcct aaacattgct ggggataccc    1140

catcttccaa tcgtctcttt gacgctatag taagccactg tgtccctgtt atcataagtg    1200

acgacattga gctcccttac gaggatatcc tagattattc aaagttctcc atctttgttc    1260

ggtcgtctga tgctattaaa aagggttact tgatgagact gattaaaggc ataaacaagc    1320

atcgatggac aaggatgtgg aagaggctca aagaagtgga taaacatttt gagtaccagt    1380

tcccatctca taaggatgat gcggcccaga tgatctggca agcattggct aggaaggtgc    1440

cttcgatccg actgaaggca cataggttta gaagatcttc aagatctgaa agaggaaaca    1500

aataaacagg aaggaggtgt atgtattgat gatgtgctcc agatgatagg gcaagcagtg    1560

gctaggaaag gtgccttgat tcggatgaag gcacatatgt ttagtggatt ttcaagatct    1620

gaaagaggaa ccaagtaaac aggaaaagtg tgtatgtatc gtgtttctag gctaatctaa    1680

cacagcattc actgacactg gcacgccagt tgcactttcc cttcgaggaa cattgtgaag    1740

tagaagattc aggttgagtg ttggttatac cttggaacaa acacaggttg agtgttgagt    1800

gttgaatgta tgttagcaag gcaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa    1860

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa                                 1893

 

<210>29

<211>480

<212>PRT

<213>裸麦

 

<400>29

 

Met Ala Pro Pro Arg Ala Arg Ala Leu Leu Leu Pro Leu Ala Ala Ala

1               5                   10                  15

Thr Val Leu Val Ala Ser Thr Ile Phe Leu Phe Ala Ala Ala Gly Ala

            20                  25                  30

Gly Arg Trp Arg Pro Ala Asp Thr Gly Leu Pro Val Pro Ala Thr Pro

        35                  40                  45

Ala Asp Phe Ser Ala Val Pro Ile Gly Val Ser Val Thr Ser Thr Ala

    50                  55                  60

Lys Gly Lys Glu Leu Ser Phe Leu Asp Glu Asn Gly Arg Pro Asp Asp

65                  70                  75                  80

Pro Ser Ser Gly Ser Ala Ala Ala Ala Glu Pro Gly Arg Cys Asp Pro

                85                  90                  95

Arg Asp Ala Ala Val Arg Val Phe Val Tyr Asp Met Pro Pro Glu Phe

            100                 105                 110

His Phe Gly Leu Leu Gly Trp Ala Pro Pro Pro Gly Asn Gly Gly Gly

        115                 120                 125

Val Trp Pro Asp Val Arg Gly Gly Thr Val Pro Arg Tyr Pro Gly Gly

    130                 135                 140

Leu Asn Gln Gln His Ser Val Glu Tyr Trp Leu Thr Leu Asp Leu Leu

145                 150                 155                 160

Ala Ser Ser Ser Ala Ala Pro Cys Gly Pro Ala Val Arg Val Ala Asp

                165                 170                 175

Ser Arg Asp Ala Asp Leu Ile Phe Val Pro Phe Phe Ala Ser Leu Ser

            180                 185                 190

Tyr Asn Arg His Ser Lys Ala Val Pro Pro Glu Lys Val Ser Arg Asp

        195                 200                 205

Met Tyr Leu Gln Glu Lys Leu Val Arg Tyr Leu Val Ala Gln Pro Glu

    210                 215                 220

Trp Lys Arg Ser Gly Gly Ala Aap His Val Val Val Ala His His Pro

225                 230                 235                 240

Asn Ser Leu Leu His Ala Arg Ser Ala Leu Phe Pro Ala Val Phe Va1

                245                 250                 255

Leu Ser Asp Phe Gly Arg Tyr His Pro Arg Val Ala Ser Leu Glu Lys

            260                 265                 270

Asp Leu Ile Ala Pro Tyr Arg His Met Ala Lys Thr Phe Val Asn Asp

        275                 280                 285

Thr Ala Gly Phe Asp Asp Arg Pro Thr Leu Leu Tyr Phe Arg Gly Ala

    290                 295                 300

Ile Tyr Arg Lys Glu Gly Gly Asn Ile Arg Gln Glu Leu Tyr Asn Met

305                 310                 315                 320

Leu Lys Asp Glu Arg Asp Val Phe Phe Ser Phe Gly Ser Val Gln Asp

                325                 330                 335

His Gly Val Ser Lys Ala Ser Gln Gly Met His Ser Ser Lys Phe Cys

            340                 345                 350

Leu Asn Ile Ala Gly Asp Thr Pro Ser Ser Asn Arg Leu Phe Asp Ala

        355                 360                 365

Ile Val Ser His Cys Val Pro Val Ile Ile Ser Asp Asp Ile Glu Leu

    370                 375                 380

Pro Tyr Glu Asp Ile Leu Asp Tyr Ser Lys Phe Ser Ile Phe Val Arg

385                 390                 395                 400

Ser Ser Asp Ala Ile Lys Lys Gly Tyr Leu Met Arg Leu Ile Lys Gly

                405                 410                 415

Ile Asn Lys His Arg Trp Thr Arg Met Trp Lys Arg Leu Lys Glu Val

            420                 425                 430

Asp Lys His Phe Glu Tyr Gln Phe Pro Ser His Lys Asp Asp Ala Ala

        435                 440                 445

Gln Met Ile Trp Gln Ala Leu Ala Arg Lys Val Pro Ser Ile Arg Leu

    450                 455                 460

Lys Ala His Arg Phe Arg Arg Ser Ser Arg Ser Glu Arg Gly Asn Lys

465                 470                 475                 480

 

<210>30

<211>1869

<212>DNA

<213>玉米

 

<400>30

agctaccgct ccgttcttgt acgatggttc ctgaggatgc aaaatggtga gttgaatttg  60

attcacctgc gtgctgtttt gctgcatggt ggtggtggag aggaagatgc agccattgcc  120

gccgcctgag cgccggaggg tcgttcgttt cgtggtcttc atggccgtct ccctcctggc  180

cctgttctgc tgggctctcg tcaattccag gatcaacgtc gccatgcctt actctgcttt  240

cgtgatgcgc gatgtcgaca agacgcccgc attcacaggc ctagaagaca ggcagaggca  300

ccccgccggc gacccagcgt ggacctcggc ggcgccgcag gccgtgccgg tgaccagtaa  360

cgtcacggcg ggctcggtga aattgggtga tccggtgctc cgggagccgc tggcaggaga  420

agcggaacgg gaacggagcg agaggtgcga cgcggacagc gcggcgctca gggtgtatat  480

gtacgacctg ccggcggagt tccatttcgg catgctcggg tgggaacgga aggggaagct  540

ggcgtggccc gacgtccgcg acgcccacgc cgcgccgcac taccccggcg ggctcaacct  600

gcagcacagc gtggcgtact ggctcacgct ggacatcctg tcctccgccc tgccgcccgg  660

cagcgacgtg gtcagagaca ggccctgtgt cgccgtcagg gtgacgaacg cgagcctcgc  720

caacgtcttc ttcgtgccgt tcttcgcgtc actgagctac aaccgccact cgaagctccg  780

ccgcggggag agggtgagca ggaacagggt cctgcaggcc gagctggtca agtacctgat  840

gcggaaggag gagtggagga ggtggggcgg caagaaccac ctcatcgtgc cgcaccaccc  900

caacagcttg atggaggcac ggaagaagct cagcgccgcc atgttcgtgt tgtctgactt  960

cgggaggtac tcgccggacg ttgccaacct caagaaggac gtcatcgcac cgtacaagca    1020

cgtcctccgc tccttaggcg atggcgactc gccatcgttc gagcaacgtc ccatcctcgc    1080

atacttccaa ggggccatcc atcggaaagc tggcgggaag gttcgccaga agctgtacca    1140

tctgctcaag gacgagcgcg acgtgcactt cacctacggc agcgtccggc agaacggcat    1200

ccggcgcgcc accgccggga tgtccacgtc gaagttctgc ctcaacatcg ccggcgacac    1260

gccgtcctcg aaccggctct tcgacgccat cgtcagccac tgtgtcccgg tcatcatcag    1320

cgacgacatc gagttgccat ttgaggacat gctcgactac tcggagttct gcgtgttcgt    1380

gcgctccgcc gacgccgcca agaagggatt cctactacgg ctgctacggg gcatatcgcg    1440

cgaggagtgg accaagatgt ggatgagatt gaagaaggtg actcaccatt tcgagtacca    1500

gtacccttca cggtcaggtg atgctgtcca gatgacatgg agcgcagtgg cgcggaagat    1560

gcattcggtg cagctgcagc ttcacaagcg cgctagattc cacaggacgg tttctgtatg    1620

aatatgatca aggccaccga gcgcggaagt ctggatgtgg caagattcgt cagttgcact    1680

gtgcagatga tttttttaga cttaactgac ataaaggtaa taacgggtga ataggtgtca    1740

tttttgtaat gtttacttcc ctaaaagaaa tagagatgtg agacttgaaa gcataaaatg    1800

cactatctta atctagtatt aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa    1860

aaaaaaaaa                                                            1869

 

<210>31

<211>511

<212>PRT

<213>玉米

 

<400>31

Met Val Val Val Glu Arg Lys Met Gln Pro Leu Pro Pro Pro Glu Arg

1               5                   10                  15

Arg Arg Val Val Arg Phe Val Val Phe Met Ala Val Ser Leu Leu Ala

            20                  25                  30

Leu Phe Cys Trp Ala Leu Val Asn Ser Arg Ile Asn Val Ala Met Pro

        35                  40                  45

Tyr Ser Ala Phe Val Met Arg Asp Val Asp Lys Thr Pro Ala Phe Thr

    50                  55                  60

Gly Leu Glu Asp Arg Gln Arg His Pro Ala Gly Asp Pro Ala Trp Thr

65                  70                  75                  80

Ser Ala Ala Pro Gln Ala Val Pro Val Thr Ser Asn Val Thr Ala Gly

                85                  90                  95

Ser Val Lys Leu Gly Asp Pro Val Leu Arg Glu Pro Leu Ala Gly Glu

            100                 105                 110

Ala Glu Arg Glu Arg Ser Glu Arg Cys Asp Ala Asp Ser Ala Ala Leu

        115                 120                 125

Arg Val Tyr Met Tyr Asp Leu Pro Ala Glu Phe His Phe Gly Met Leu

    130                 135                 140

Gly Trp Glu Arg Lys Gly Lys Leu Ala Trp Pro Asp Val Arg Asp Ala

145                 150                 155                 160

His Ala Ala Pro His Tyr Pro Gly Gly Leu Asn Leu Gln His Ser Val

                165                 170                 175

Ala Tyr Trp Leu Thr Leu Asp Ile Leu Ser Ser Ala Leu Pro Pro Gly

            180                 185                 190

Ser Asp Val Val Arg Asp Arg Pro Cys Val Ala Val Arg Val Thr Asn

        195                 200                 205

Ala Ser Leu Ala Asn Val Phe Phe Val Pro Phe Phe Ala Ser Leu Ser

    210                 215                 220

Tyr Asn Arg His Ser Lys Leu Arg Arg Gly Glu Arg Val Ser Arg Asn

225                 230                 235                 240

Arg Val Leu Gln Ala Glu Leu Val Lys Tyr Leu Met Arg Lys Glu Glu

                245                 250                 255

Trp Arg Arg Trp Gly Gly Lys Asn His Leu Ile Val Pro His His Pro

            260                 265                 270

Asn Ser Leu Met Glu Ala Arg Lys Lys Leu Ser Ala Ala Met Phe Val

        275                 280                 285

Leu Ser Asp Phe Gly Arg Tyr Ser Pro Asp Val Ala Asn Leu Lys Lys

    290                 295                 300

Asp Val Ile Ala Pro Tyr Lys His Val Leu Arg Ser Leu Gly Asp Gly

305                 310                 315                 320

Asp Ser Pro Ser Phe Glu Gln Arg Pro Ile Leu Ala Tyr Phe Gln Gly

                325                 330                 335

Ala Ile His Arg Lys Ala Gly Gly Lys Val Arg Gln Lys Leu Tyr His

            340                 345                 350

Leu Leu Lys Asp Glu Arg Asp Val His Phe Thr Tyr Gly Ser Val Arg

        355                 360                 365

Gln Asn Gly Ile Arg Arg Ala Thr Ala Gly Met Ser Thr Ser Lys Phe

    370                 375                 380

Cys Leu Asn Ile Ala Gly Asp Thr Pro Ser Ser Asn Arg Leu Phe Asp

385                 390                 395                 400

Ala Ile Val Ser His Cys Val Pro Val Ile Ile Ser Asp Asp Ile Glu

                405                 410                 415

Leu Pro Phe Glu Asp Met Leu Asp Tyr Ser Glu Phe Cys Val Phe Val

            420                 425                 430

Arg Ser Ala Asp Ala Ala Lys Lys Gly Phe Leu Leu Arg Leu Leu Arg

        435                 440                 445

Gly Ile Ser Arg Glu Glu Trp Thr Lys Met Trp Met Arg Leu Lys Lys

    450                 455                 460

Val Thr His His Phe Glu Tyr Gln Tyr Pro Ser Arg Ser Gly Asp Ala

465                 470                 475                 480

Val Gln Met Thr Trp Ser Ala Val Ala Arg Lys Met His Ser Val Gln

                485                 490                 495

Leu Gln Leu His Lys Arg Ala Arg Phe His Arg Thr Val Ser Val

            500                 505                 510

 

<210>32

<211>1744

<212>DNA

<213>拟南芥属

 

<400>32

cttcggcgtt ttcatcgttt ctcatctacc tcgaaatttt ctcgtcactc taatcaaaaa    60

tctcacttcg ttattttctc gggaaaaatt tcccgatcac taaacctagt ttttagatat    120

tttctctcct ggattctgga tctacacaat ctttcttcct cttcttctat gaatctgttc    180

atcgtaattt cagattcttg atatatgatt ccttttctcc aatctcttct cttagctctc    240

agagatgggt gagaaaacaa actcacgtta tctcggtgta atcatcactc gaaaatctat    300

aattttcttg ttcatatcaa tcatcaccgt cctttcttgg ttttttatct tttcttccac    360

aaaccctaac cgagttctcg atcacatctc agtatcagaa tccacagatg tacctctcat    420

catcatcaag aactcaaaca gttctccaca aaacaacgca ccaaaacccc aaaacagaga    480

aggagcagaa acagaggaac ccattaaaga aaacagagga ggaacaaaaa cagagtcatc    540

catgaatcaa aacagaggcg aaaccctccg gtgtatccaa agggtttctc cttctccaag    600

gccattgaaa gtctacatgt atgatatgag tccagagttt cattttgggt tattgggttg    660

gaaaccagag agaaacggtg tcgtttggcc tgatatcaga gtcaatgttc ctcaccatcc    720

aggtggtctt aacttgcagc acagtgttga gtattggctc acattagatc ttttgttctc    780

tgagcttcca gaagattcta gaagctctcg ggccgcgata cgtgtaaaga actcgagcga    840

agctgatgtc gtgttcgtgc ccttcttctc ttcattgagc tataaccgat tctctaaggt    900

taaccaaaag cagaagaaga gccaggacaa agagttgcag gaaaatgtgg tgaaatacgt    960

aacgtcccaa aaagagtgga agacctcagg agggaaggat catgtgatca tggcgcatca    1020

tccgaatagt atgtcgacgg caaggcataa gctatttccg gcgatgtttg tggtcgctga    1080

ctttggtaga tactcgccac atgttgccaa tgttgacaaa gacattgtgg ctccatacaa    1140

acaccttgtt ccatcgtatg ttaatgacac atcgggcttt gatggccgtc cgatcttgct    1200

ctacttccaa ggagccatct accgcaaagc tggtggattt gtgagacaag agctatataa    1260

tcttctcaaa gaagaaaaag acgtccactt ctctttcgga agcgtaagga accacggcat    1320

atctaaagcc ggcgaaggaa tgagatcgtc caagttctgt ctcaacatag ccggggatac    1380

accatcctcg aatcgcctct tcgacgccat agctagtcac tgtatacccg tgatcattag    1440

cgatgacatc gagttaccat atgaggatgt cctcaactac aatgagttct gtctctttgt    1500

cagatcatca gacgctttaa agaaagggtt tctgatgggt cttgtcagga gtattggcag    1560

agaagagtat aataagatgt ggcttcggtt gaaggaagtg gagaggtatt tcgatttgcg    1620

ttttccggtg aaggatgacg agggagatta tgcagttcag atgatttgga aagctgttgc    1680

caggaaagct cctttggtga agatgaaggt tcacagattt cagaggttta caaggccttt    1740

ttag                                                               1744

 

<210>33

<211>1500

<212>DNA

<213>拟南芥属

 

<400>33

atgggtgaga aaacaaactc acgttatctc ggtgtaatca tcactcgaaa atctataatt  60

ttcttgttca tatcaatcat caccgtcctt tcttggtttt ttatcttttc ttccacaaac  120

cctaaccgag ttctcgatca catctcagta tcagaatcca cagatgtacc tctcatcatc  180

atcaagaact caaacagttc tccacaaaac aacgcaccaa aaccccaaaa cagagaagga  240

gcagaaacag aggaacccat taaagaaaac agaggaggaa caaaaacaga gtcatccatg  300

aatcaaaaca gaggcgaaac cctccggtgt atccaaaggg tttctccttc tccaaggcca  360

ttgaaagtct acatgtatga tatgagtcca gagtttcatt ttgggttatt gggttggaaa  420

ccagagagaa acggtgtcgt ttggcctgat atcagagtca atgttcctca ccatccaggt  480

ggtcttaact tgcagcacag tgttgagtat tggctcacat tagatctttt gttctctgag  540

cttccagaag attctagaag ctctcgggcc gcgatacgtg taaagaactc gagcgaagct  600

gatgtcgtgt tcgtgccctt cttctcttca ttgagctata accgattctc taaggttaac  660

caaaagcaga agaagagcca ggacaaagag ttgcaggaaa atgtggtgaa atacgtaacg  720

tcccaaaaag agtggaagac ctcaggaggg aaggatcatg tgatcatggc gcatcatccg  780

aatagtatgt cgacggcaag gcataagcta tttccggcga tgtttgtggt cgctgacttt  840

ggtagatact cgccacatgt tgccaatgtt gacaaagaca ttgtggctcc atacaaacac  900

cttgttccat cgtatgttaa tgacacatcg ggctttgatg gccgtccgat cttgctctac  960

ttccaaggag ccatctaccg caaagctggt ggatttgtga gacaagagct atataatctt  1020

ctcaaagaag aaaaagacgt ccacttctct ttcggaagcg taaggaacca cggcatatct  1080

aaagccggcg aaggaatgag atcgtccaag ttctgtctca acatagccgg ggatacacca  1140

tcctcgaatc gcctcttcga cgccatagct agtcactgta tacccgtgat cattagcgat  1200

gacatcgagt taccatatga ggatgtcctc aactacaatg agttctgtct ctttgtcaga  1260

tcatcagacg ctttaaagaa agggtttctg atgggtcttg tcaggagtat tggcagagaa  1320

gagtataata agatgtggct tcggttgaag gaagtggaga ggtatttcga tttgcgtttt  1380

ccggtgaagg atgacgaggg agattatgca gttcagatga tttggaaagc tgttgccagg  1440

aaagctcctt tggtgaagat gaaggttcac agatttcaga ggtttacaag gcctttttag  1500

<210>34

<211>499

<212>PRT

<213>拟南芥属

 

<400>34

 

Met Gly Glu Lys Thr Asn Ser Arg Tyr Leu Gly Val Ile Ile Thr Arg

1               5                   10                  15

Lys Ser Ile Ile Phe Leu Phe Ile Ser Ile Ile Thr Val Leu Ser Trp

            20                  25                  30

Phe Phe Ile Phe Ser Ser Thr Asn Pro Asn Arg Val Leu Asp His Ile

        35                  40                  45

Ser Val Ser Glu Ser Thr Asp Val Pro Leu Ile Ile Ile Lys Asn Ser

    50                  55                  60

Asn Ser Ser Pro Gln Asn Asn Ala Pro Lys Pro Gln Asn Arg Glu Gly

65                  70                  75                  80

Ala Glu Thr Glu Glu Pro Ile Lys Glu Asn Arg Gly Gly Thr Lys Thr

                85                  90                  95

Glu Ser Ser Met Asn Gln Asn Arg Gly Glu Thr Leu Arg Cys Ile Gln

            100                 105                 110

Arg Val Ser Pro Ser Pro Arg Pro Leu Lys Val Tyr Met Tyr Asp Met

        115                 120                 125

Ser Pro Glu Phe His Phe Gly Leu Leu Gly Trp Lys Pro Glu Arg Asn

    130                 135                 140

Gly Val Val Trp Pro Asp Ile Arg Val Asn Val Pro His His Pro Gly

145                 150                 155                 160

Gly Leu Asn Leu Gln His Ser Val Glu Tyr Trp Leu Thr Leu Asp Leu

                165                 170                 175

Leu Phe Ser Glu Leu Pro Glu Asp Ser Arg Ser Ser Arg Ala Ala Ile

            180                 185                 190

Arg Val Lys Asn Ser Ser Glu Ala Asp Val Val Phe Val Pro Phe Phe

        195                 200                 205

Ser Ser Leu Ser Tyr Asn Arg Phe Ser Lys Val Asn Gln Lys Gln Lys

    210                 215                 220

Lys Ser Gln Asp Lys Glu Leu Gln Glu Asn Val Val Lys Tyr Val Thr

225                 230                 235                 240

Ser Gln Lys Glu Trp Lys Thr Ser Gly Gly Lys Asp His Val Ile Met

                245                 250                 255

Ala His His Pro Asn Ser Met Ser Thr Ala Arg His Lys Leu Phe Pro

            260                 265                 270

Ala Met Phe Val Val Ala Asp Phe Gly Arg Tyr Ser Pro His Val Ala

        275                 280                 285

Asn Val Asp Lys Asp Ile Val Ala Pro Tyr Lys His Leu Val Pro Ser

    290                 295                 300

Tyr Val Asn Asp Thr Ser Gly Phe Asp Gly Arg Pro Ile Leu Leu Tyr

305                 310                 315                 320

Phe Gln Gly Ala Ile Tyr Arg Lys Ala Gly Gly Phe Val Arg Gln Glu

                325                 330                 335

Leu Tyr Asn Leu Leu Lys Glu Glu Lys Asp Val His Phe Ser Phe Gly

            340                 345                 350

Ser Val Arg Asn His Gly Ile Ser Lys Ala Gly Glu Gly Met Arg Ser

        355                 360                 365

Ser Lys Phe Cys Leu Asn Ile Ala Gly Asp Thr Pro Ser Ser Asn Arg

    370                 375                 380

Leu Phe Asp Ala Ile Ala Ser His Cys Ile Pro Val Ile Ile Ser Asp

385                 390                 395                 400

Asp Ile Glu Leu Pro Tyr Glu Asp Val Leu Asn Tyr Asn Glu Phe Cys

                405                 410                 415

Leu Phe Val Arg Ser Ser Asp Ala Leu Lys Lys Gly Phe Leu Met Gly

            420                 425                 430

Leu Val Arg Ser Ile Gly Arg Glu Glu Tyr Asn Lys Met Trp Leu Arg

        435                 440                 445

Leu Lys Glu Val Glu Arg Tyr Phe Asp Leu Arg Phe Pro Val Lys Asp

    450                 455                 460

Asp Glu Gly Asp Tyr Ala Val Gln Met Ile Trp Lys Ala Val Ala Arg

465                 470                 475                 480

Lys Ala Pro Leu Val Lys Met Lys Val His Arg Phe Gln Arg Phe Thr

                485                 490                 495

Arg Pro Phe

 

<210>35

<211>566

<212>PRT

<213>水稻

 

<400>35

 

Met Ala Leu Thr Arg Arg Leu Leu Ile Asp Leu Ser Ser Arg Arg Arg

1               5                   10                  15

Leu Phe Asn Ala Gly Lys Phe Ser Thr Thr His Lys Lys Lys Pro Val

            20                  25                  30

Leu His Glu Ala Val Ser Leu Ala Gly Phe Leu Arg Cys Ser Arg Ala

        35                  40                  45

Leu Val Ser Trp Met Val Ala Glu Arg Lys Met Gln Pro Ser Pro Ala

    50                  55                  60

Ala Pro Pro Ala Ala Glu His Arg Arg Arg Ala Leu Leu Arg Tyr Val

65                  70                  75                  80

Val Phe Leu Ala Val Ser Leu Leu Ala Phe Ser Cys Trp Ala Leu Val

                85                  90                  95

Ser Ser Arg Ile Asp Gly Ala Val Leu Ala Ala Thr Ala Gly Gly Glu

            100                 105                 110

His Asp Asp His Asp Gly Ile Ile Val Arg Ser Ser Thr Gln Ala Glu

        115                 120                 125

Met Pro Ala Arg Gly Gly Asn Ala Thr Ser Arg Gly Ala Val Glu Val

    130                 135                 140

Gly Val Gly Thr Pro Ala Ala Met Ile Thr Arg Gln Pro Ser Ser Gly

145                 150                 155                 160

Glu Thr Thr Thr Thr Ala Ala Leu Ala Ala Thr Cys Asp Ala Glu Ser

                165                 170                 175

Ale Leu Leu Arg Val Tyr Leu Tyr Aap Leu Pro Pre Glu Phe His Phe

            180                 185                 190

Gly Met Leu Gly Trp Asp Gly Lys Ala Ala Gly Ala Ala Trp Pro Asp

        195                 200                 205

Val Ala Gly Asp Pro Arg Ala Val Pro Arg Tyr Pro Gly Gly Leu Asn

    210                 215                 220

Leu Gln His Ser Val Glu Tyr Trp Leu Thr Leu Asp Ile Leu Ser Ser

225                 230                 235                 240

Thr Thr Ser Gly Asp His Arg Arg Arg Arg Pro Cys Thr Ala Val Arg

                245                 250                 255

Val Thr Asn Ala Ser Leu Ala Asp Val Phe Leu Val Pro Phe Phe Ala

            260                 265                 270

Ser Leu Ser Tyr Asn Arg Gln Ser Lys Ser Pro His Gly Gly His Gly

        275                 280                 285

Ser Gly Gly Arg Ser Asp Arg Gln Leu Gln Gly Glu Leu Val Arg Tyr

    290                 295                 300

Leu Ala Arg Arg Glu Glu Trp Arg Arg Trp Gly Gly Ala Asp His Leu

305                 310                 315                 320

Val Val Pro His His Pro Asn Ser Met Met Asp Ala Arg Arg Arg Leu

                325                 330                 335

Ser Ala Ala Met Phe Val Leu Ser Asp Phe Gly Arg Tyr Pro Pro Asp

            340                 345                 350

Val Ala Asn Leu Arg Lys Asp Val Ile Ala Pro Tyr Lys His Val Val

        355                 360                 365

Pro Ser Leu Gly Asp Gly Asp Ser Pro Gly Phe Glu Gln Arg Pro Val

    370                 375                 380

Leu Ala Tyr Phe Gln Gly Ala Ile His Arg Lys Asn Gly Gly Arg Val

385                 390                 395                 400

Arg Gln Arg Leu Tyr Gln Leu Ile Lys Asp Glu Lys Asp Val His Phe

                405                 410                 415

Thr Tyr Gly Ser Val Arg Gln Asn Gly Ile Arg Arg Ala Thr Lys Gly

            420                 425                 430

Met Ala Ser Ser Lys Phe Cys Leu Asn Ile Ala Gly Asp Thr Pro Ser

        435                 440                 445

Ser Asn Arg Leu Phe Asp Ala Ile Val Ser His Cys Val Pro Val Ile

    450                 455                 460

Ile Ser Asp Asp Ile Glu Leu Pro Phe Glu Asp Val Leu Asp Tyr Ser

465                 470                 475                 480

Ala Phe Cys Val Phe Val Arg Ala Ser Asp Ala Val Lys Arg Gly Phe

                485                 490                 495

Leu Leu His Leu Leu Arg Gly Ile Ser Gln Glu Glu Trp Thr Ala Met

            500                 505                 510

Trp Arg Arg Leu Lys Glu Val Ala His His Phe Glu Tyr Gln Tyr Pro

        515                 520                 525

Ser Gln Pro Gly Asp Ala Val Gln Met Ile Trp Gly Ala Val Ala Arg

    530                 535                 540

Lys Met His Leu Val Lys Leu Gln Leu His Lys Arg Gly Arg Tyr Gln

545                 550                 555                 560

Arg Thr Phe Ser Glu Ser

                565

 

<210>36

<211>475

<212>PRT

<213>水稻

 

<400>36

 

Met Pro Pro Arg Ala Arg Thr Leu Leu Met Pro Leu Ala Ala Ala Thr

1               5                   10                  15

Leu Leu Val Ala Ser Thr Ile Phe Leu Phe Ala Ala Thr Gly Ala Arg

            20                  25                  30

Trp Arg Pro Ala Asp Thr Gly Leu Pro Val Pro Ala Ala Asp Phe Ser

        35                  40                  45

Ala Ala Val Leu Glu Ser Ala Val Thr Asp Thr Thr Ala Ala Ala Lys

    50                  55                  60

Glu Leu Ser Phe Val Asp Glu Asn Gly Arg Pro Asp Asp Pro Ala Ser

65                  70                  75                  80

Ser Ser Ala Ala Ala Ala Arg Cys Asp Pro Thr His Ala Ala Val Arg

                85                  90                  95

Val Phe Met Tyr Asp Leu Pro Pro Glu Phe His Phe Gly Ile Leu Gly

            100                 105                 110

Trp Ser Pro Pro Thr Asp Gly Ala Ala Asp Ala Ala Met Trp Pro Asp

        115                 120                 125

Val Gly Ser Gly Ala Ala Ala Pro Arg Tyr Pro Gly Gly Leu Asn Gln

    130                 135                 140

Gln His Ser Val Glu Tyr Trp Leu Thr Leu Asp Leu Leu Ser Ser Ser

145                 150                 155                 160

Ser Pro Pro Cys Gly Ala Ala Val Arg Val Ala Asp Ser Arg Asp Ala

                165                 170                 175

Asp Val Val Phe Val Pro Phe Phe Ala Ser Leu Ser Tyr Asn Arg His

            180                 185                 190

Ser Arg Val Val Pro Pro Glu Lys Val Ser Arg Asp Lys Glu Leu Gln

        195                 200                 205

Glu Lys Leu Val Arg Tyr Leu Met Ala Gln Pro Glu Trp Lys Arg Ser

    210                 215                 220

Gly Gly Ala Asp His Val Ile Val Ala His His Pro Asn Ser Leu Leu

225                 230                 235                 240

His Ala Arg Ser Val Leu Phe Pro Val Val Phe Val Leu Ser Asp Phe

                245                 250                 255

Gly Arg Tyr His Pro Arg Val Ala Ser Leu Glu Lys Asp Val Ile Ala

            260                 265                 270

Pro Tyr Lys His Met Ala Lys Thr Phe Val Asn Asp Ser Ala Gly Phe

        275                 280                 285

Asp Asp Arg Pro Thr Leu Leu Tyr Phe Arg Gly Ala Ile Phe Arg Lys

    290                 295                 300

Glu Gly Gly Asn Ile Arg Gln Glu Leu Tyr Tyr Met Leu Lys Asp Glu

305                 310                 315                 320

Lys Asp Val Tyr Phe Ala Phe Gly Ser Val Gln Asp His Gly Ala Ser

                325                 330                 335

Lys Ala Ser Lys Gly Met His Ala Ser Lys Phe Cys Leu Asn Ile Ala

            340                 345                 350

Gly Asp Thr Pro Ser Ser Asn Arg Leu Phe Asp Ala Ile Val Ser His

        355                 360                 365

Cys Val Pro Val Ile Ile Ser Asp Asp Ile Glu Leu Pro Tyr Glu Asp

    370                 375                 380

Ala Leu Asp Tyr Ser Lys Phe Ser Ile Phe Val Arg Ser Ser Asp Ala

385                 390                 395                 400

Val Lys Lys Gly Tyr Leu Met Arg Leu Ile Arg Gly Val Ser Lys His

                405                 410                 415

Gln Trp Thr Arg Met Trp Asn Arg Leu Lys Glu Val Asp Lys His Phe

            420                 425                 430

Glu Tyr Gln Tyr Pro Ser Gln Lys Asp Asp Ala Val Gln Met Ile Trp

        435                 440                 445

Gln Ala Leu Ala Arg Lys Val Pro Ala Ile Arg Leu Lys Ser His Arg

    450                 455                 460

Ser Arg Arg Phe Ser Arg Tyr Asp Arg Gly Lys

465                 470                 475

 

<210>37

<211>468

<212>PRT

<213>水稻

 

<400>37

 

Met AIa Ala Ala Ala Ala Ser Ala Ser Ala Ser Cys Arg Arg Arg Pro

1               5                   10                  15

Ile Ala Trp Phe Phe Ala Ile Ala Ala Leu Leu Phe Phe Phe Ser Trp

            20                  25                  30

Tyr Leu Leu Leu Asp Ser Ala Ala Val Thr Pro Glu Pro Leu Leu Ala

        35                  40                  45

Ala Arg Gly Gln Gly Leu Arg Val Gly Ser Ser Gly Arg Lys Cys Asp

    50                  55                  60

Pro Ala Thr Ala Ala Leu Arg Val Phe Met Tyr Asp Leu Pro Ala Glu

65                  70                  75                  80

Phe His Phe Gly Leu Leu Asp Trp Glu Pro Gln Gly Gly Gly Gly Gly

                85                  90                  95

Gly Gly Gly Gly Val Trp Pro Asp Val Arg Gly Gly Gly Val Pro Glu

            100                 105                 110

Tyr Pro Gly Gly Leu Asn Leu Gln His Ser Ile Glu Tyr Trp Leu Thr

        115                 120                 125

Leu Asp Leu Leu Ala Ser Glu Gln Gly Ala Pro Thr Pro Cys Gly Ala

    130                 135                 140

Val Arg Val Arg His Ala Ala Ala Ala Asp Val Val Phe Val Pro Phe

145                 150                 155                 160

Phe Ala Ser Leu Ser Phe Asn Arg His Ser Lys Val Val Pro Pro Ala

                165                 170                 175

Arg Ala Ser Glu Asp Arg Ala Leu Gln Arg Arg Leu Leu Asp Tyr Leu

            180                 185                 190

Ala Ala Arg Pro Glu Trp Arg Arg Ser Gly Gly Arg Asp His Val Val

        195                 200                 205

Leu Ala His His Pro Asn Gly Met Leu Asp Ala Arg Tyr Lys Leu Trp

    210                 215                 220

Pre Cys Val Phe Val Leu Cys Aap Phe Gly Arg Tyr Pro Pro Ser Val

225                 230                 235                 240

Ala Gly Leu Asp Lys Asp Val Ile Ala Pro Tyr Arg His Val Val Pro

                245                 250                 255

Asn Phe Ala Asn Asp Ser Ala Gly Tyr Asp Asp Arg Pro Thr Leu Leu

            260                 265                 270

Tyr Phe Gln Gly Ala Ile Tyr Arg Lys Asp Gly Gly Phe Ile Arg Gln

        275                 280                 285

Glu Leu Tyr Tyr Leu Leu Lys Asp Glu Lys Asp Val His Phe Ser Phe

    290                 295                 300

Gly Ser Val Val Gly Asn Gly Ile Glu Gln Ala Thr Gln Gly Met Arg

305                 310                 315                 320

Ala Ser Lys Phe Cys Leu Asn Ile Ala Gly Asp Thr Pro Ser Ser Asn

                325                 330                 335

Arg Leu Phe Asp Ser Ile Val Ser His Cys Val Pro Ile Ile Ile Ser

            340                 345                 350

Asp Glu Ile Glu Leu Pro Phe Glu Asp Val Leu Asp Tyr Ser Lys Phe

        355                 360                 365

Cys Ile Ile Val Arg Gly Ala Asp Ala Val Lys Lys Gly Phe Leu Met

    370                 375                 380

Asn Leu Ile Asn Gly Ile Ser Arg Glu Asp Trp Thr Arg Met Trp Asn

385                 390                 395                 400

Arg Leu Lys Glu Val Glu Arg His Phe Glu Tyr Gln Tyr Pro Ser Gln

                405                 410                 415

Asn Asp Asp Ala Val Gln Met Ile Trp Lys Ala Ile Ala Arg Lys Ala

            420                 425                 430

Pro Ser Ile Arg Leu Lys Val Asn Arg Leu Arg Arg Phe Ser Arg Phe

        435                 440                 445

Glu Thr Asn Arg Thr Asp Glu Thr Pro Thr Arg Ser Ser Trp Leu Glu

    450                 455                 460

Asn Gln Pro Ser

465

 

<210>38

<211>437

<212>PRT

<213>水稻

 

<400>38

 

Met Ala Ser Pro Ser Ser Arg Ala Val Ala Val Gly Gly Ala Leu Leu

1               5                   10                  15

Leu Leu Leu Val Phe Ala Val Pro Thr Thr Phe Leu Tyr Leu Thr Ser

            20                  25                  30

Ala Pro Ala Ala Ser Ser Pro Ser Leu Leu Leu Asn Leu Lys Pro Phe

        35                  40                  45

Gly Ala Arg Cys Ala Pro Ala Ala Ala Ala Ala Pro Pro Leu Arg Val

    50                  55                  60

Phe Met Tyr Asp Leu Pro Arg Arg Phe His Val Gly Met Met Asp Ala

65                  70                  75                  80

Ser Ala Ser Gly Phe Pro Ala Trp Pro Pro Ser Ala Gly Gly Ile Arg

                85                  90                  95

Arg Gln His Ser Val Glu Tyr Trp Met Met Ala Ser Leu Gln Gly Gly

            100                 105                 110

Gly Gly Gly Gly Asn Gly Ser Ser Ser Glu Glu Gly Arg Glu Ala Val

        115                 120                 125

Arg Val Thr Asp Pro Asp Ala Ala Glu Ala Phe Phe Val Pro Phe Phe

    130                 135                 140

Ser Ser Leu Ser Phe Asn Val His Gly Arg Asn Met Thr Asp Pro Glu

145                 150                 155                 160

Thr Glu Ala Asp Arg Leu Leu Gln Val Glu Leu Met Glu Ile Leu Trp

                165                 170                 175

Lys Ser Lys Tyr Trp Gln Arg Ser Ala Gly Arg Asp His Val Ile Pro

            180                 185                 190

Met His His Pro Asn Ala Phe Arg Phe Leu Arg Asp Met Val Asn Ala

        195                 200                 205

Ser Ile Leu Ile Val Ala Asp Phe Gly Arg Tyr Thr Lys Glu Leu Ala

    210                 215                 220

Ser Leu Arg Lys Asp Val Val Ala Pro Tyr Val His Val Val Asp Ser

225                 230                 235                 240

Phe Leu Asn Asp Asp Pro Pro Asp Pro Phe Asp Asp Arg Pro Thr Leu

                245                 250                 255

Leu Phe Phe Arg Gly Arg Thr Val Arg Lys Asp Glu Gly Lys Ile Arg

            260                 265                 270

Ala Lys Leu Ala Lys Ile Leu Lys Gly Lys Asp Gly Val Arg Phe Glu

        275                 280                 285

Asp Ser Leu Ala Thr Gly Glu Gly Ile Lys Thr Ser Thr Glu Gly Met

    290                 295                 300

Arg Ser Ser Lys Phe Cys Leu His Pro Ala Gly Asp Thr Pro Ser Ser

305                 310                 315                 320

Cys Arg Leu Phe Asp Ala Ile Val Ser His Cys Val Pro Val Ile Val

                325                 330                 335

Ser Ser Arg Ile Glu Leu Pro Phe Glu Asp Glu Ile Asp Tyr Ser Glu

            340                 345                 350

Phe Ser Leu Phe Phe Ser Val Glu Glu Ala Leu Arg Pro Asp Tyr Leu

        355                 360                 365

Leu Asn Gln Leu Arg Gln Ile Gln Lys Thr Lys Trp Val Glu Ile Trp

    370                 375                 380

Ser Lys Leu Lys Asn Val Ser His His Tyr Glu Phe Gln Asn Pro Pro

385                 390                 395                 400

Arg Lys Gly Asp Ala Val Asn Met Ile Trp Arg Gln Val Lys His Lys

                405                 410                 415

Val Pro Ala Val Asn Leu Ala Ile His Arg Asn Arg Arg Leu Lys Ile

            420                 425                 430

Pro Asp Trp Trp Gly

        435

 

<210>39

<211>29

<212>DNA

<213>人工序列

 

<220>

<223>引物

 

<400>39

ggggacaagt ttgtacaaaa aagcaggct    29

 

<210>40

<211>29

<212>DNA

<213>人工序列

 

<220>

<223>引物

 

<400>40

ggggaccact ttgtacaaga aagctgggt    29

 

<210>41

<211>54

<212>DNA

<213>人工序列

 

<220>

<223>引物

 

<400>41

ttaaacaagt ttgtacaaaa aagcaggctg caattaaccc tcactaaagg gaac    54

<210>42

<211>53

<212>DNA

<213>人工序列

 

<220>

<223>引物

 

<400>42

ttaaaccact ttgtacaaga aagctgggtg cgtaatacga ctcactatag ggc    53

 

<210>43

<211>12856

<212>DNA

<213>人工序列

 

<220>

<223>载体

 

<400>43

cgccttggcg cgccgatcat ccacaagttt gtacaaaaaa gctgaacgag aaacgtaaaa  60     

tgatataaat atcaatatat taaattagat tttgcataaa aaacagacta cataatactg  120

taaaacacaa catatccagt cactatggcg gccgcattag gcaccccagg ctttacactt  180

tatgcttccg gctcgtataa tgtgtggatt ttgagttagg atttaaatac gcgttgatcc  240

ggcttactaa aagccagata acagtatgcg tatttgcgcg ctgatttttg cggtataaga  300

atatatactg atatgtatac ccgaagtatg tcaaaaagag gtatgctatg aagcagcgta  360

ttacagtgac agttgacagc gacagctatc agttgctcaa ggcatatatg atgtcaatat  420

ctccggtctg gtaagcacaa ccatgcagaa tgaagcccgt cgtctgcgtg ccgaacgctg  480

gaaagcggaa aatcaggaag ggatggctga ggtcgcccgg tttattgaaa tgaacggctc  540

ttttgctgac gagaacaggg gctggtgaaa tgcagtttaa ggtttacacc tataaaagag  600

agagccgtta tcgtctgttt gtggatgtac agagtgatat cattgacacg cccggtcgac  660

ggatggtgat ccccctggcc agtgcacgtc tgctgtcaga taaagtctcc cgtgaacttt  720

acccggtggt gcatatcggg gatgaaagct ggcgcatgat gaccaccgat atggccagtg  780

tgccggtctc cgttatcggg gaagaagtgg ctgatctcag ccaccgcgaa aatgacatca  840

aaaacgccat taacctgatg ttctggggaa tataaatgtc aggctccctt atacacagcc  900

agtctgcagg tcgaccatag tgactggata tgttgtgttt tacagtatta tgtagtctgt  960

tttttatgca aaatctaatt taatatattg atatttatat cattttacgt ttctcgttca  1020

gctttcttgt acaaagtggt gttaacctag acttgtccat cttctggatt ggccaactta  1080

attaatgtat gaaataaaag gatgcacaca tagtgacatg ctaatcacta taatgtgggc    1140

atcaaagttg tgtgttatgt gtaattacta gttatctgaa taaaagagaa agagatcatc    1200

catatttctt atcctaaatg aatgtcacgt gtctttataa ttctttgatg aaccagatgc    1260

atttcattaa ccaaatccat atacatataa atattaatca tatataatta atatcaattg    1320

ggttagcaaa acaaatctag tctaggtgtg ttttgcgaat tgcggccgcc accgcggtgg    1380

agctcgaatt ccggtccggg tcacctttgt ccaccaagat ggaactgcgg ccgctcatta    1440

attaagtcag gcgcgcctct agttgaagac acgttcatgt cttcatcgta agaagacact    1500

cagtagtctt cggccagcct ggccatatgg attccgcggg cctagaaggc catttaaatc    1560

ctgaggatct ggtcttccta aggacccggg atatcggacc gattaaactt taattcggtc    1620

cgaagcttga agttcctatt ccgaagttcc tattctccag aaagtatagg aacttcgcat    1680

gcctgcagtg cagcgtgacc cggtcgtgcc cctctctaga gataatgagc attgcatgtc    1740

taagttataa aaaattacca catatttttt ttgtcacact tgtttgaagt gcagtttatc    1800

tatctttata catatattta aactttactc tacgaataat ataatctata gtactacaat    1860

aatatcagtg ttttagagaa tcatataaat gaacagttag acatggtcta aaggacaatt    1920

gagtattttg acaacaggac tctacagttt tatcttttta gtgtgcatgt gttctccttt    1980

ttttttgcaa atagcttcac ctatataata cttcatccat tttattagta catccattta    2040

gggtttaggg ttaatggttt ttatagacta atttttttag tacatctatt ttattctatt    2100

ttagcctcta aattaagaaa actaaaactc tattttagtt tttttattta ataatttaga    2160

tataaaatag aataaaataa agtgactaaa aattaaacaa atacccttta agaaattaaa    2220

aaaactaagg aaacattttt cttgtttcga gtagataatg ccagcctgtt aaacgccgtc    2280

gacgagtcta acggacacca accagcgaac cagcagcgtc gcgtcgggcc aagcgaagca    2340

gacggcacgg catctctgtc gctgcctctg gacccctctc gagagttccg ctccaccgtt    2400

ggacttgctc cgctgtcggc atccagaaat tgcgtggcgg agcggcagac gtgagccggc    2460

acggcaggcg gcctcctcct cctctcacgg caccggcagc tacgggggat tcctttccca    2520

ccgctccttc gctttccctt cctcgcccgc cgtaataaat agacaccccc tccacaccct    2580

ctttccccaa cctcgtgttg ttcggagcgc acacacacac aaccagatct cccccaaatc    2640

cacccgtcgg cacctccgct tcaaggtacg ccgctcgtcc tccccccccc ccctctctac    2700

cttctctaga tcggcgttcc ggtccatgca tggttagggc ccggtagttc tacttctgtt    2760

catgtttgtg ttagatccgt gtttgtgtta gatccgtgct gctagcgttc gtacacggat    2820

gcgacctgta cgtcagacac gttctgattg ctaacttgcc agtgtttctc tttggggaat  2880

cctgggatgg ctctagccgt tccgcagacg ggatcgattt catgattttt tttgtttcgt  2940

tgcatagggt ttggtttgcc cttttccttt atttcaatat atgccgtgca cttgtttgtc  3000

gggtcatctt ttcatgcttt tttttgtctt ggttgtgatg atgtggtctg gttgggcggt  3060

cgttctagat cggagtagaa ttctgtttca aactacctgg tggatttatt aattttggat  3120

ctgtatgtgt gtgccataca tattcatagt tacgaattga agatgatgga tggaaatatc  3180

gatctaggat aggtatacat gttgatgcgg gttttactga tgcatataca gagatgcttt  3240

ttgttcgctt ggttgtgatg atgtggtgtg gttgggcggt cgttcattcg ttctcgatcg  3300

gagtagaata ctgtttcaaa ctacctggtg tatttattaa ttttggaact gtatgtgtgt  3360

gtcatacatc ttcatagtta cgagtttaag atggatggaa atatcgatct aggataggta  3420

tacatgttga tgtgggtttt actgatgcat atacatgatg gcatatgcag catctattca  3480

tatgctctaa ccttgagtac ctatctatta taataaacaa gtatgtttta taattatttt  3540

gatcttgata tacttggatg atggcatatg cagcagctat atgtggattt ttttagccct  3600

gccttcatac gctatttatt tgcttggtac tgtttctttt gtcgatgctc accctgttgt  3660

ttggtgttac ttctgcaggt cgactttaac ttagcctagg atccacacga caccatgata  3720

gaggtgaaac cgattaacgc agaggatacc tatgaactaa ggcatagaat actcagacca  3780

aaccagccga tagaagcgtg tatgtttgaa agcgatttac ttcgtggtgc atttcactta  3840

ggcggctatt acgggggcaa actgatttcc atagcttcat tccaccaggc cgagcactca  3900

gaactccaag gccagaaaca gtaccagctc cgaggtatgg ctaccttgga aggttatcgt  3960

gagcagaagg cgggatcgag tctaattaaa cacgctgaag aaattcttcg taagaggggg  4020

gcggacttgc tttggtgtaa tgcgcggaca tccgcctcag gctactacaa aaagttaggc  4080

ttcagcgagc agggagaggt attcgacacg ccgccagtag gacctcacat cctgatgtat  4140

aaaaggatca cataactagc tagtcagtta acctagactt gtccatcttc tggattggcc  4200

aacttaatta atgtatgaaa taaaaggatg cacacatagt gacatgctaa tcactataat  4260

gtgggcatca aagttgtgtg ttatgtgtaa ttactagtta tctgaataaa agagaaagag  4320

atcatccata tttcttatcc taaatgaatg tcacgtgtct ttataattct ttgatgaacc  4380

agatgcattt cattaaccaa atccatatac atataaatat taatcatata taattaatat  4440

caattgggtt agcaaaacaa atctagtcta ggtgtgtttt gcgaattcag agctcgaatt  4500

cattccgatt aatcgtggcc tcttgctctt caggatgaag agctatgttt aaacgtgcaa  4560

gcgctactag acaattcagt acattaaaaa cgtccgcaat gtgttattaa gttgtctaag  4620

cgtcaatttg tttacaccac aatatatcct gccaccagcc agccaacagc tccccgaccg  4680

gcagctcggc acaaaatcac cactcgatac aggcagccca tcagtccggg acggcgtcag  4740

cgggagagcc gttgtaaggc ggcagacttt gctcatgtta ccgatgctat tcggaagaac  4800

ggcaactaag ctgccgggtt tgaaacacgg atgatctcgc ggagggtagc atgttgattg  4860

taacgatgac agagcgttgc tgcctgtgat caaatatcat ctccctcgca gagatccgaa  4920

ttatcagcct tcttattcat ttctcgctta accgtgacag gctgtcgatc ttgagaacta  4980

tgccgacata ataggccate gctggctaaa gccgctgagg aagctgagtg gcgctatttc  5040

tttagaagtg aacgttgacg atcgtcgacc gtaccccgat gaattaattc ggacgtacgt  5100

tctgaacaca gctggatact tacttgggcg attgtcatac atgacatcaa caatgtaccc  5160

gtttgtgtaa ccgtctcttg gaggttcgta tgacactagt ggttcccctc agcttgcgac  5220

tagatgttga ggcctaacat tttattagag agcaggctag ttgcttagat acatgatctt  5280

caggccgtta tctgtcaggg caagcgaaaa ttggccattt atgacgacca atgccccgca  5340

gaagctccca tctttgccgc catagacgcc gcgcccccct tttggggtgt agaacatcct  5400

tttgccagat gtggaaaaga agttcgttgt cccattgttg gcaatgacgt agtagccggc  5460

gaaagtgcga gacccatttg cgctatatat aagcctacga tttccgttgc gactattgtc  5520

gtaattggat gaactattat cgtagttgct ctcagagttg tcgtaatttg atggactatt  5580

gtcgtaattg cttatggagt tgtcgtagtt gcttggagaa atgtcgtagt tggatgggga  5640

gtagtcatag ggaagacgag cttcatccac taaaacaatt ggcaggtcag caagtgcctg  5700

ccccgatgcc atcgcaagta cgaggcttag aaccaccttc aacagatcgc gcatagtctt  5760

ccccagctct ctaacgcttg agttaagccg cgccgcgaag cggcgtcggc ttgaacgaat  5820

tgttagacat tatttgccga ctaccttggt gatctcgcct ttcacgtagt gaacaaattc  5880

ttccaactga tctgcgcgcg aggccaagcg atcttcttgt ccaagataag cctgcctagc  5940

ttcaagtatg acgggctgat actgggccgg caggcgctcc attgcccagt cggcagcgac  6000

atccttcggc gcgattttgc cggttactgc gctgtaccaa atgcgggaca acgtaagcac  6060

tacatttcgc tcatcgccag cccagtcggg cggcgagttc catagcgtta aggtttcatt  6120

tagcgcctca aatagatcct gttcaggaac cggatcaaag agttcctccg ccgctggacc  6180

taccaaggca acgctatgtt ctcttgcttt tgtcagcaag atagccagat caatgtcgat  6240

cgtggctggc tcgaagatac ctgcaagaat gtcattgcgc tgccattctc caaattgcag  6300

ttcgcgctta gctggataac gccacggaat gatgtcgtcg tgcacaacaa tggtgacttc    6360

tacagcgcgg agaatctcgc tctctccagg ggaagccgaa gtttccaaaa ggtcgttgat    6420

caaagctcgc cgcgttgttt catcaagcct tacagtcacc gtaaccagca aatcaatatc    6480

actgtgtggc ttcaggccgc catccactgc ggagccgtac aaatgtacgg ccagcaacgt    6540

cggttcgaga tggcgctcga tgacgccaac tacctctgat agttgagtcg atacttcggc    6600

gatcaccgct tccctcatga tgtttaactc ctgaattaag ccgcgccgcg aagcggtgtc    6660

ggcttgaatg aattgttagg cgtcatcctg tgctcccgag aaccagtacc agtacatcgc    6720

tgtttcgttc gagacttgag gtctagtttt atacgtgaac aggtccatgc cgacgagagt    6780

aaagccacat tttgcgtaca aattgcaggc aggtacattg ttcgtttgtg tctctaatcg    6840

tatgccaagg agctgtctgc ttagtgccca ctttttcgca aattcgatga gactgtgcgc    6900

gactcctttg cctcggtgcg tgtgcgacac aacaatgtgt tcgatagagg ctagatcgtt    6960

ccatgttgag ttgagttcaa tcttcccgac aagctcttgg tcgatgaatg cgccatagca    7020

agcagagtct tcatcagagt catcatccga gatgtaatcc ttccggtagg ggctcacact    7080

tctggtagat agttcaaagc cttggtcgga taggtgcaca tcgaacactt cacgaacaat    7140

gaaatggttc tcagcatcca atgtttccgc cacctgctca gggatcaccg aaatcttcat    7200

atgacgccta acgcctggca cagcggatcg caaacctggc gcggcttttg gcacaaaagg    7260

cgtgacaggt ttgcgaatcc gttgctgcca cttgttaacc cttttgccag atttggtaac    7320

tataatttat gttagaggcg aagtcttggg taaaaactgg cctaaaattg ctggggattt    7380

caggaaagta aacatcacct tccggctcga tgtctattgt agatatatgt agtgtatcta    7440

cttgatcggg ggatctgctg cctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac    7500

atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag cagacaagcc    7560

cgtcagggcg cgtcagcggg tgttggcggg tgtcggggcg cagccatgac ccagtcacgt    7620

agcgatagcg gagtgtatac tggcttaact atgcggcatc agagcagatt gtactgagag    7680

tgcaccatat gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc    7740

gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg    7800

tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa    7860

agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg    7920

cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga    7980

ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg    8040

tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg    8100

gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc    8160

gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg    8220

gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca    8280

ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt    8340

ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag    8400

ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg    8460

gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatet ccagcagatc    8520

ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt    8550

tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt    8640

ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca    8700

gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg    8760

tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac    8820

cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg    8880

ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc    8940

gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgctg    9000

cagggggggg gggggggggg gacttccatt gttcattcca cggacaaaaa cagagaaagg    9060

aaacgacaga ggccaaaaag cctcgctttc agcacctgtc gtttcctttc ttttcagagg    9120

gtattttaaa taaaaacatt aagttatgac gaagaagaac ggaaacgcct taaaccggaa    9180

aattttcata aatagcgaaa acccgcgagg tcgccgcccc gtaacctgtc ggatcaccgg    9240

aaaggacccg taaagtgata atgattatca tctacatatc acaacgtgcg tggaggccat    9300

caaaccacgt caaataatca attatgacgc aggtatcgta ttaattgatc tgcatcaact    9360

taacgtaaaa acaacttcag acaatacaaa tcagcgacac tgaatacggg gcaacctcat    9420

gtcccccccc cccccccccc tgcaggcatc gtggtgtcac gctcgtcgtt tggtatggct    9480

tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa    9540

aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta    9600

tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc    9660

ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg    9720

agttgctctt gcccggcgtc aacacgggat aataccgcgc cacatagcag aactttaaaa    9780

gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg    9840

agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc    9900

accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg    9960

gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat    10020

cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata    10080

ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac cattattatc    10140

atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtcttca agaattggtc    10200

gacgatettg ctgcgttcgg atattttcgt ggagttcccg  ccacgaccc ggattgaagg    10260

cgagatccag caactcgcgc cagatcatcc tgtgacggaa ctttggcgcg tgatgactgg    10320

ccaggacgtc ggccgaaaga gcgacaagca gatcacgctt ttcgacagcg tcggatttgc    10380

gatcgaggat ttttcggcgc tgcgctacgt ccgcgaccgc gttgagggat caagccacag    10440

cagcccactc gaccttctag ccgacccaga cgagccaagg gatctttttg gaatgctgct    10500

ccgtcgtcag gctttccgac gtttgggtgg ttgaacagaa gtcattatcg tacggaatgc    10560

caagcactcc cgaggggaac cctgtggttg gcatgcacat acaaatggac gaacggataa    10620

accttttcac gcccttttaa atatccgtta ttctaataaa cgctcttttc tcttaggttt    10680

acccgccaat atatcctgtc aaacactgat agtttaaact gaaggcggga aacgacaatc    10740

tgatcatgag cggagaatta agggagtcac gttatgaccc ccgccgatga cgcgggacaa    10800

gccgttttac gtttggaact gacagaaccg caacgttgaa ggagccactc agcaagctgg    10860

tacgattgta atacgactca ctatagggcg aattgagcgc tgtttaaacg ctcttcaact    10920

ggaagagcgg ttacccggac cgaagcttga agttcctatt ccgaagttcc tattctctag    10980

aaagtatagg aacttcagat ctcgatgctc accctgttgt ttggtgttac ttctgcaggt    11040

cgactctaga ggatccacca tgagcccaga acgacgcccg gccgacatcc gccgtgccac    11100

cgaggcggac atgccggcgg tctgcaccat cgtcaaccac tacatcgaga caagcacggt    11160

caacttccgt accgagccgc aggaaccgca ggactggacg gacgacctcg tccgtctgcg    11220

ggagcgctat ccctggctcg tcgccgaggt ggacggcgag gtcgccggca tcgcctacgc    11280

gggcccctgg aaggcacgca acgcctacga ctggacggcc gagtcgaccg tgtacgtctc    11340

cccccgccac cagcggacgg gactgggctc cacgctctac acccacctgc tgaagtccct    11400

ggaggcacag ggcttcaaga gcgtggtcgc tgtcatcggg ctgcccaacg acccgagcgt    11460

gcgcatgcac gaggcgctcg gatatgcccc ccgcggcatg ctgcgggcgg ccggcttcaa    11520

gcacgggaac tggcatgacg tgggtttctg gcagctggac ttcagcctgc cggtaccgcc  11580

ccgtccggtc ctgcccgtca ccgagatctg atccgtcgac caacctagac ttgtccatct  11640

tctggattgg ccaacttaat taatgtatga aataaaagga tgcacacata gtgacatgct  11700

aatcactata atgtgggcat caaagttgtg tgttatgtgt aattactagt tatctgaata  11760

aaagagaaag agatcatcca tatttcttat cctaaatgaa tgtcacgtgt ctttataatt  11820

ctttgatgaa ccagatgcat ttcattaacc aaatccatat acatataaat attaatcata  11880

tataattaat atcaattggg ttagcaaaac aaatctagtc taggtgtgtt ttgcgaattg  11940

cggccgcgct ctggggcctt cccatggaca ccggtaattc ccctgatctt ctctccttca  12000

tcaatggatg ccatgtttca taacaataac accaaatgtt tgatgagcta ccaacaattg  12060

cgcaaagact atggctaagc tcgagctcgc tcgctacaag ttgttgactt tcaaatacaa  12120

gtttgttttt ggaacaccaa atattctaca tgatctttca ctaagttgcg caccactatc  12180

aaaagattat ctaggccatt attcaagtaa agagtgaaca cgtctaagac ccacaaccac  12240

accaaataga atacgcatac atgcaacata ttgtgcaaga agtatccaac tggactccca  12300

tgtattctaa aactattttc gtagagttaa agttatgaca aacttatcaa ataaaaattt  12360

gaacgctgga ccaaaacttt catctttcaa atccaccatc gtctatcctc ataaattgtt  12420

ttgattataa cacatctacg taaatcattt gttttgaaca atactaattt aattttatta  12480

agtcaaataa cctgcttaga aaataatccc tccacctcat ttaacaattt cttgtcaaac  12540

acacaccaag aaaaaaatta atgaaagaga aaagaaatga aaaggacatg gagttgaata  12600

ctagcaaaat tgattgaagg aagattcaca attgaaattg aaaccattta atttattttc  12660

gggtccataa taataaattg gtaagaataa aaacccgatc aagtccggta cagtacaatt  12720

ccactccacc aactccttac ttaaacccct atttataccc actctcatcc tcactcttcc  12780

ttcacctctc acactctctt ctctctctca aaaccctcac acaaacgctg cgtttagtgt  12840

aagaaat tca atccgg                                                 12856

 

<210>44

<211>825

<212>DNA

<213>玉米

 

<400>44

aaatccttac agaattgctg tagtttcata gtgctagatg tggacagcaa agcgccgctg    60

tatgcttctg cttttctttt ttggtgtgtg tagccacatc ctttgttcct gcccggcgcc    120

atcccacttg gttgtttttt  tttatgattg aaagccttca tgcttcctcg gtcaatcacc   180

ggtgcgcact gggagcatcg ccggaaaaaa aattcttcgg ctaagagtaa cttctttctc  240

cttttcttct ctgatctcgc gagcagtgct gataacgtgt tgtaatctac ttagcggtaa  300

cgagattgag agagacaaaa tgacagaact attgtcttta ttgcagagtg tcatgtattt  360

atacagggga tacaaagtct cccaaggggt gtgtcccttg ggagtaactg ccagttgatc  420

acaggacaat attttgtaac aaaacgtaca catcgtcaaa atagcgaggc atgaaactgg  480

ccttggccat ggacgcgtga agcgcgccat gcgttggata tgtggtcaat aagtatatac  540

aatacaatgt ttaacagagc tgatagtact gctttggcac atttttgtcc acgcttcatg  600

agagataaaa cacctgcacg taaattcaca tgctgcactg aaggcccgat cactgaggag  660

cgaactgccg taactccctt ctatatatac ccccagtccc tgtttcagtt ttcgtcaagc  720

tagcagcacc aagttgtcga tcacttgcct gctcttgagc tcgattaagc tatcatcagc  780

tacagcatcc gatcccaaac tgcaactgta gcagcgacaa ctgcc                  825

 

<210>45

<211>860

<212>DNA

<213>玉米

 

<400>45

ctggtaatta ttggctgtag gattctaaac agagcctaaa tagctggaat agctctagcc  60

ctcaatccaa actaatgata tctatactta tgcaactcta aatttttatt ctaaaagtaa  120

tatttcattt ttgtcaacga gattctctac tctattccac aatcttttga agcaatattt  180

accttaaatc tgtactctat accaataatc atatattcta ttatttattt ttatctctct  240

cctaaggagc atccccctat gtctgcatgg cccccgcctc gggtcccaat ctcttgctct  300

gctagtagca cagaagaaaa cactagaaat gacttgcttg acttagagta tcagataaac  360

atcatgttta cttaacttta atttgtatcg gtttctacta tttttataat atttttgtct  420

ctatagatac tacgtgcaac agtataatca acctagttta atccagagcg aaggattttt  480

tactaagtac gtgactccat atgcacagcg ttccttttat ggttcctcac tgggcacagc  540

ataaacgaac cctgtccaat gttttcagcg cgaacaaaca gaaattccat cagcgaacaa  600

acaacataca tgcgagatga aaataaataa taaaaaaagc tccgtctcga taggccggca  660

cgaatcgaga gcctccatag ccagtttttt ccatcggaac ggcggttcgc gcacctaatt  720

atatgcacca cacgcctata aagccaacca acccgtcgga ggggcgcaag ccagacagaa  780

gacagcccgt cagcccctct cgtttttcat ccgccttcgc ctccaaccgc gtgcgctcca  840

cgcctcctcc aggaaagcga 860

 

<210>46

<211>899

<212>DNA

<213>玉米

 

<400>46

gtgcagcgtg acccggtcgt gcccctctct agagataatg agcattgcat gtctaagtta  60

taaaaaatta ccacatattt tttttgtcac acttgtttga agtgcagttt atctatcttt  120

atacatatat ttaaacttta ctctacgaat aatataatct atagtactac aataatatca  180

gtgttttaga gaatcatata aatgaacagt tagacatggt ctaaaggaca attgagtatt  240

ttgacaacag gactctacag ttttatcttt ttagtgtgca tgtgttctcc tttttttttg  300

caaatagctt cacctatata atacttcatc cattttatta gtacatccat ttagggttta  360

gggttaatgg tttttataga ctaatttttt tagtacatct attttattct attttagcct  420

ctaaattaag aaaactaaaa ctctatttta gtttttttat ttaataattt agatataaaa  480

tagaataaaa taaagtgact aaaaattaaa caaataccct ttaagaaatt aaaaaaacta  540

aggaaacatt tttcttgttt cgagtagata atgccagcct gttaaacgcc gtcgacgagt  600

ctaacggaca ccaaccagcg aaccagcagc gtcgcgtcgg gccaagcgaa gcagacggca  660

cggcatctct gtcgctgcct ctggacccct ctcgagagtt ccgctccacc gttggacttg  720

ctccgctgtc ggcatccaga aattgcgtgg cggagcggca gacgtgagcc ggcacggcag  780

gcggcctcct cctcctctca cggcacggca gctacggggg attcctttcc caccgctcct  840

tcgctttccc ttcctcgccc gccgtaataa atagacaccc cctccacacc ctctttccc   899

 

<210>47

<211>879

<212>DNA

<213>紫花苜蓿

 

<400>47

aattcccatg atcttctctc cttcatcaat ggatgccatg tttcataaca ataacaccaa    60

atgtttgatg agctaccaac aattgcgcaa agactatggc taagctcgag ctcgctcgct    120

acaagttgtt gactttcaaa tacaagtttg tttttggaac accaaatatt ctacatgatc    180

tttcactaag ttgcgcacca ctatcaaaag attatctagg ccattattca agtaaagagt    240

gaacacgtct aagacccaca accacaccaa atagaatacg catacatgca acatattgtg    300

caagaagtat ccaactggac tcccatgtat tctaaaacta ttttcgtaga gttaaagtta    360

tgacaaactt atcaaataaa aatttgaacg ctggaccaaa actttcatct ttcaaatcca  420

ccatcgtcta tcctcataaa ttgttttgat tataacacat ctacgtaaat catttgtttt  480

gaacaatact aatttaattt tattaagtca aataacctgc ttagaaaata atccctccac  540

ctcatttaac aatttcttgt caaacacaca ccaagaaaaa aattaatgaa agagaaaaga  600

aatgaaaagg acatggagtt gaatactagc aaaattgatt gaaggaagat tcacaattga  660

aattgaaacc atttaattta ttttcgggtc cataataata aattggtaag aataaaaacc  720

cgatcaagtc cggtacagta caattccact ccaccaactc cttacttaaa cccctattta  780

tacccactct catcctcact cttccttcac ctctccccct ctcttctctc tctcaaaacc  840

ctcacacaaa cgctgcgttt agtgtaagaa attcaatcc                         879

 

<210>48

<211>318

<212>DNA

<213>马铃薯

 

<400>48

agacttgtcc atcttctgga ttggccaact taattaatgt atgaaataaa aggatgcaca  60

catagtgaca tgctaatcac tataatgtgg gcatcaaagt tgtgtgttat gtgtaattac  120

tagttatctg aataaaagag aaagagatca tccatatttc ttatcctaaa tgaatgtcac  180

gtgtctttat aattctttga tgaaccagat gcatttcatt aaccaaatcc atatacatat  240

aaatattaat catatataat taatatcaat tgggttagca aaacaaatct agtctaggtg  300

tgttttgcga attgcggc                                                318

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号