首页> 中国专利> 一种利用水稻BT-雄性不育细胞质的育性恢复基因来赋予或控制育性的方法及鉴定育性恢复基因存在的方法

一种利用水稻BT-雄性不育细胞质的育性恢复基因来赋予或控制育性的方法及鉴定育性恢复基因存在的方法

摘要

本发明提供一种利用BT型雄性不育细胞质来使水稻具备育性或控制其育性的方法,以及鉴定恢复基因是否存在的方法。本发明利用了具有SEQ IDNO.27所示碱基序列的核酸或与SEQ ID NO.27所示碱基序列有至少70%同一性的核酸,其具有恢复育性的功能。或者,可以利用具有SEQ ID NO.27的第38538至54123位碱基序列的核酸,或与SEQ ID NO.27的第38538至54123位碱基序列有至少70%同一性的核酸,它们也具有恢复育性的功能。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2014-11-05

    未缴年费专利权终止 IPC(主分类):C12N15/29 授权公告日:20090520 终止日期:20130913 申请日:20020913

    专利权的终止

  • 2009-05-20

    授权

    授权

  • 2008-01-16

    专利申请权、专利权的转移(专利申请权的转移) 变更前: 变更后: 变更前:

    专利申请权、专利权的转移(专利申请权的转移)

  • 2005-05-04

    实质审查的生效

    实质审查的生效

  • 2005-03-02

    公开

    公开

说明书

技术领域

本发明涉及一种利用水稻BT型细胞质雄性不育的恢复基因来获得或抑制水稻育性及其鉴定水稻恢复基因的方法。

本申请要求以2001年9月19日提交的日本专利申请No.2001-285247,2001年10月4日提出的日本专利申请No.2001-309135以及2002年6月26日提出的日本专利申请No.2002-185709的优先权。这三个专利申请的完全公开内容在此并入本文

背景技术

水稻是自花授粉植物,在水稻品种之间进行杂交时,首先必须在水稻开花前将颖花内的全部雄蕊去除以避免自花受粉,然后用来自亲本品种的花粉使欲进行杂交的品种获得育性。然而,这种人工杂交的方法完全不适合商业目的来生产大量的杂交种子。

因此,通常利用细胞质雄性不育的三系法来生产杂交水稻。所述三系法利用了三个品系即细胞质雄性不育的不育系、具有Rf-1基因的恢复系以及与不育系具同样核基因而不具有细胞质雄性不育的保持系。利用这三个品系,(i)用恢复系的花粉对不育系进行授粉而获得杂交种子;而(ii)用保持系的花粉对不育系进行授粉而使不育系得以保存下去。

利用BT型细胞质雄性不育的三系法中,繁殖恢复系水稻是非常重要的,为此,必需在育种的各个阶段中确保水稻中保持有Rf-1基因,并且确保在最后培育阶段中Rf-1基因是纯合的。在三系法中需要核实以确保用于恢复系的品种具有Rf-1基因,或者核实Rf-1基因的存在以确保所得到的杂交种子已恢复了育性。

为了确定植物体中的Rf-1基因基因座的基因型,首先需要将要确定其基因型的植物与标准系杂交产生杂交种子,以获得F1代植株,然后进行自花授粉,继而调查能超过一定水平(如70-80%或更高)的频率产生种子的植株个体的出现机率。所述标准系是指保持系、不育系或这两个品系形成的一套品系,并且应根据待测个体的细胞质是否属于BT型、正常型还是未知的来作出合适的选择。如果标准系为不育系,则杂交时以待测个体作为母本,如果标准系是保持系,则作为父本与待测个体杂交。

但是,实施这些技术需要花费大量的劳动力和时间。进一步的问题是,为生产种子而进行的授粉易受环境因素的影响,当在恶劣的环境下,如低温或日照不足,造成的不育可能与基因型构成无关,导致不能准确地确定Rf-1基因基因座的基因型。

为了解决这些问题,最近有人提出用分子生物学的方法来判断Rf-1基因是否存在。该方法基于检测与Rf-1基因连锁的碱基序列(这些序列以下称作DNA标记)来确定Rf-1基因存在或缺失。值得指出的是目前还没弄清Rf-1基因的DNA序列,所以不可能直接检测Rf-1基因。

例如,已有报道,水稻Rf-1基因位点位于第10号染色体上,并且存在于限制性片段长度多态性(RFLP)的DNA标记(RFLP标记)G291位点和G127位点之间(Fukuta et al.1992,Jpn.Breed.42(supl.1)164-165)。通过研究与Rf-1基因连锁的DNA标记G291位点和G127位点的基因型可推知Rf-1基因位点的基因型,这是一种已知的方法。

但是,以往的常规分子生物学方法存在着以下若干问题。首先,利用RFLP标记需要通过Southern印迹分析来进行检测。为了进行Southern杂交,还必需从待测个体中制备纯化微克级重量的DNA,而且还要进行限制性内切酶处理、电泳、印迹、与探针之间进行杂交以及信号的检测等一系列操作过程;除了需要相当量的劳动外,还需花费约1周的时间才能获得检测结果。

第二个问题是,由于RFLP标记G291位点和G127位点之间的基因图距长约30cM(在水稻DNA中相当于约9000kbp),考虑在该区域中出现双重重组的机率达到百分之几,因而不能完全保证通过这些标记来正确的确定Rf-1基因位点的基因型。

第三个问题是,如果通过检测RFLP标记G291位点和G127位点来推测Rf-1基因是否存在,则不仅Rf-1基因而且还有这些基因座之间的基因区域被引入到筛选出的育性恢复系中。结果是:从RF-1基因供体亲本中引入的DNA序列将含有至少30cM或更长的染色体区,即存在着引入了在该区域的潜在有害基因的风险。

为了解决上述问题,现已研究出与Rf-1基因位点连锁的显性DNA标记(日本专利公开No.222588/1995)和共显性DNA标记(日本专利公开No.313187/1997)。这些标记与Rf-1基因位点连锁,遗传距离分别为1.6±0.7cM(相当于水稻DNA约480kbp)以及3.7±1.1cM(相当于水稻DNA约1110kbp),这些基因位点存在于Rf-1基因位点两侧。因此,通过检测显性PCR标记位点和共显性PCR标记位点的存在来估计Rf-1基因的存在。通过检测共显性PCR标记也可以估计出Rf-1基因位点是纯合还是杂合的。

但是,即使使用这些PCR标记,仍然存在着几个问题。所述共显性标记与Rf-1基因位点具有3.7±1.1cM的遗传距离,所以还没有真正解决与Rf-1基因位点之间重组频率很高的问题。其结果是,就共显性标记本身来说,虽能够准确地检测出是纯合型还是杂合型。但如果共显性标记位点和Rf-1基因位点之间发生了重组,则不能准确地确定Rf-1基因位点的基因型,尤其不能确定其是纯合型还是杂合型。另一方面,当用显性标记确定Rf-1基因位点的基因型时,则不管个体是Rf-1基因纯合体(Rf-1/Rf-1)还是杂合体(Rf-1/rf-1)都能检测到显性标记。因此,即使利用共显性标记和显性标记的结合来确定Rf-1基因位点的基因型,也不能正确地鉴别植株个体是Rf-1基因纯合型还是杂合型。还有,用显性标记进行PCR反应而没有得到PCR产物,也不能排除可能是由于实验程序问题导致的。进一步的,由于这些共显性标记和显性标记之间的遗传距离长达约5.3cM(约1590kbp),由Rf-1基因供体亲本引入的染色体区域的长度不能限定在足够小的数值,还不能排除该区域中可能含有的有害基因被引入。

另外,在日本专利公开No.139465/2000描述了一种共显性标记,其根据位于水稻第10号染色体上Rf-1基因附近的RFLP标记的碱基序列而建立的。然而,这些PCR标记大多数与Rf-1基因之间的遗传距离都大于约1cM。

发明概述

本发明目的之一是提供一种恢复水稻育性的方法。本发明的方法包括将核酸导入到水稻中,所述核酸具有恢复育性的功能,并具有SEQ ID NO.27的碱基序列或与SEQ ID NO.27的碱基序列有至少70%同一性。本发明的另一方法包括将核酸导入到水稻中,所述核酸具有恢复育性的功能,并具有SEQ ID NO.27的第38538至54123位的碱基序列或与SEQ ID NO.27的第38538至54123位的碱基序列有至少70%同一性。本发明的再一方法包括将核酸导入到水稻中,所述核酸具有恢复育性的功能,并具有SEQ ID NO.27的第42357-53743位的碱基序列,更优选的具有第42132-48883位碱基序列,或与SEQ ID NO.27的第42357-53743位的碱基序列,优选的第42132-48883位碱基序列有至少70%的同一性。本发明方法的一个优选实施方式是,具有与SEQ ID NO.27或SEQ ID NO.27的第38538至54123位碱基序列有至少70%同一性的碱基序列至少满足下面两个要求:

1)与SEQ ID NO.27的第45461位碱基相应的碱基是A;和

2)与SEQ ID NO.27的第49609位碱基相应的碱基是A。

本发明的另一个目的是提供一种鉴定被测个体或其种子是否具有Rf-1基因的方法。本发明的鉴定方法利用了可以确定水稻恢复基因(Rf-1基因)功能存在的序列,其位于在水稻第10号染色体上的多态性检测标记P4497MboI和B56691 XabI之间。

在本发明的优选实施方式中,检测水稻个体或其种子是否具有Rf-1基因所用碱基序列具有:与SEQ ID NO.27或SEQ ID NO.27的第38538至54123位碱基序列有至少70%同一性,并且至少满足下面两个要求:

1)与SEQ ID NO.27的第45461位碱基相应的碱基是A;和

2)与SEQ ID NO.27的第49609位碱基相应的碱基是A。

本发明另一个目的是提供一种抑制Rf-1基因的功能以恢复育性的方法。本发明抑制方法的一个实施方式包括:导入如下的反义序列,即其具有序列互补于有恢复育性功能的SEQ ID NO.27或互补于与SEQ ID NO.27的碱基序列有至少70%同一性的碱基序列,其长度至少为100个连续碱基。另一个实施方式,本发明的抑制方法包括:导入的反义序列具有互补于有恢复育性功能的SEQ ID NO.27第38538-54123位或互补于与SEQ ID NO.27第38538-54123位的碱基序列有至少70%同一性的碱基序列,其长度至少100个连续碱基。

本发明另一目的是提供具有恢复育性功能的具有SEQ ID NO.27或与SEQ ID NO.27的碱基序列有至少70%同一性的核酸。本发明也提供一种核酸,其具有恢复育性功能并具有SEQ ID NO.27的第38538-54123位或与SEQID NO.27的第38538-54123位碱基序列有至少70%同一性的碱基序列。本发明也提供一种核酸,具有恢复育性功能并具有SEQ ID NO.27第42357-53743位,更优选SEQ ID NO.27第42132-48883位的碱基序列或者具有与SEQ IDNO.27第42357-53743位,更优选SEQ ID NO.27第42132-48883位的碱基序列有至少70%同一性的碱基序列。

附图说明

图1表示从RFLP标记位点S12564开始的染色体步行实验结果。

图2表示与BAC克隆AC068923相关的lambda克隆重叠区的排列。

图3表示重组体花粉(全部有育性)的Rf-1位点附近的染色体组织结构,是基于在由该在粉产生的10个体(RS1,RS2,RC1-8)标记位点的基因型之最靠近Rf-1位点进行作图的结果。空白条代表粳稻(japonica)区,黑条代表籼稻(indica)区。

图4是基因图谱,用相关的各种标记对水稻第10号染色体上的Rf-1基因位点进行定位;图距值是以1042个F1代个体的分离数据计算出来的。

图5显示用于互补分析检测Rf-1区域的10个基因组克隆的片段。通过染色体步行(细线)获得的Lambda克隆被用于对以粗线表示的染色体区域进行互补分析。XSF18被发现存在缺失,其缺失区用点线表示。

图6表示用XSG16的15.7kb片段(例10)和XSF18的16.2kb片段(例8)进行互补分析的结果。抽穗(ear bowing)结果表明用XSG16的15.7kb片段转化的植株恢复了育性。

本发明的最佳实施方式

我们首先将Rf-1基因位点定位在水稻第10号染色体上极小的区域内。以此为基础,我们建立了位于Rf-1基因位点附近的PCR标记,并找到一种利用与Rf-1基因位点连锁的PCR标记来检测Rf-1基因的方法。具体地说,通过确定与Rf-1位点接近的新PCR标记位点的基因型来检测Rf-1基因的存在和选择Rf-1基因纯合的个体,其中新标记是基于Rf-1位点被定位于水稻第10号染色体上的PCR标记位点S12564 Tsp509I和C1361 MwoI之间而建立的。我们先前于2000年8月17日提出的日本专利申请No.2000-247204描述了一种检测Rf-1基因的方法。该专利申请的全部公开内容在此引入本申请作为参考。

I.日本专利申请No.2000-247204描述的鉴定Rf-1位点的基因型的方法

日本专利申请No.2000-247204描述的方法是:基于Rf-1位点被定位于水稻第10号染色体上的PCR标记位点S12564 Tsp509I和C1361 MwoI之间,进而确定待测水稻个体或其种子是否具有Rf-1基因。

标记

针对Rf-1基因位点附近的特定区域设计用于PCR反应的引物对,其扩增产物用特定的限制性内切酶消化,经电泳,在有些籼稻(indica)系中,呈现可观察条带的大小与粳稻系的不同。在籼稻系中呈现的特有条带在此称为Rf-1连锁带。目前本发明的发明人已证实了Rf-1基因位点位于水稻第10号染色体上的PCR标记位点S12564 Tsp509I和C1361 MwoI之间,因此本领域的普通技术人员可以建立和利用Rf-1基因位点附近的PCR标记。

例如,根据本发明,测定待测水稻个体基因组中是否含有下述PCR标记中的至少一个,进而确定被测个体是否具有与这些PCR标记连锁的Rf-1基因:

(1)标记1即PCR标记R1877 EcoRI:用SEQ ID NO:1和SEQ ID NO:2所示序列的DNA作为引物进行水稻基因组PCR反应,根据扩增产物中是否存在限制酶EcoRI识别位点,来检测粳稻品系和籼稻品系个体之间的多态性;

(2)标记2即PCR标记G4003 HindIII(SEQ ID NO:19):用SEQ ID NO:3和SEQ ID NO:4所示序列的DNA作为引物对进行水稻基因组PCR反应,根据扩增产物中是否存在限制酶HindIII识别位点,来检测粳稻品系和籼稻品系个体之间的多态性;

(3)标记3即PCR标记C1361 MwoI(SEQ ID NO:20):用SEQ ID NO:5和SEQ ID NO:6所示序列的DNA作为引物对进行水稻基因组PCR反应,根据扩增产物中是否存在限制酶MwoI识别位点,来检测粳稻品系和籼稻品系个体之间的多态性;

(4)标记4即PCR标记G2155 MwoI(SEQ ID NO:21):用SEQ ID NO:7和SEQ ID NO:8所示序列的DNA作为引物对进行水稻基因组PCR反应,根据扩增产物中是否存在限制酶MwoI识别位点,来检测粳稻品系和籼稻品系个体之间的多态性;

(5)标记5即PCR标记G291 MspI(SEQ ID NO:22):用SEQ ID NO:9和SEQ ID NO:10所示序列的DNA作为引物对进行水稻基因组PCR反应,根据扩增产物中是否存在限制酶MspI识别位点,来检测粳稻和籼稻品系个体之间的多态性;

(6)标记6即PCR标记R2303 BslI(SEQ ID NO:23):用SEQ ID NO:11和SEQ ID NO:12所示序列的DNA作为引物对进行水稻基因组PCR反应,根据扩增产物中是否存在限制酶BslI识别位点,来检测粳稻品系和籼稻品系个体之间的多态性;

(7)标记7即PCR标记S10019 BstUI(SEQ ID NO:24):用SEQ ID NO:13和SEQ ID NO:14所示序列的DNA作为引物对进行水稻基因组PCR反应,根据扩增产物中是否存在限制酶BstUI识别位点,来检测粳稻品系和籼稻品系个体之间的多态性;

(8)标记8即PCR标记S10602 KpnI(SEQ ID NO:25):用SEQ ID NO:15和SEQ ID NO:16所示序列的DNA作为引物对进行水稻基因组PCR反应,根据扩增产物中是否存在限制酶KpnI识别位点,来检测粳稻品系和籼稻品系个体之间的多态性;和

(9)标记9即PCR标记S12564 Tsp509I(SEQ ID NO:26):用SEQ ID NO:17和SEQ ID NO:18所示序列的DNA作为引物对进行水稻基因组PCR反应,根据扩增产物中是否存在限制酶Tsp509I识别位点,来检测粳稻品系和籼稻品系个体之间的多态性。

Rf-1基因位点最大可能位于水稻第10号染色体上的RFLP标记区R1877、G291、R2303、S12564、C1361、S10019、G4003、S10602以及G2155的附近(请参照Fukuta et al.1992,Jpn.Breed.42(supl.1)164-165的RFLP连锁分析结果以及Harushima et al.1998,Genetics 148 479-494的水稻RFLP连锁图),如下文描述的参考实施例1,本发明人将这些RFLP标记转变为共显性PCR标记如CAPS标记或dCAPS标记(Michaels and Amasino 1998,The PlantJournal 14(3)381-385;Neff et al.1998,The Plant Journal 14(3)387-392)。通过这种转变得到了上述PCR标记。

在这些PCR标记中,由PCR标记R1877 EcoRI、G291 MspI(SEQ IDNO:22)、R2303 BslI(SEQ ID NO:23)以及S12564 Tsp509I(SEQ ID NO:26)形成一组,由C1361 MwoI(SEQ ID NO:20)、S10019 BstUI(SEQ ID NO:24)、G4003 HindIII(SEQ ID NO:19)、S10602 KpnI(SEQ ID NO:25)以及G2155MwoI(SEQ ID NO:21)形成另一组,这两组分别位于第10号染色体上Rf-1基因位点的两侧位置。

因此,作为本发明最佳的实施方式之一,(a)在PCR标记R1877 EcoRI、G291 MspI、R2303 BslI以及S12564 Tsp509I中至少选出一个PCR标记,和(b)在C1361 MwoI、S10019 BstUI、G4003 HindIII、S10602 KpnI以及G2155MwoI中至少选出一个PCR标记以检测出Rf-1连锁带,进而确定Rf-1基因是否存在。在该种情况下,在(a)组中至少优选使用PCR标记S12564 Tsp509I,以及在(b)组中至少优选使用C1361 MwoI作为最接近Rf-1基因的标记。在被测水稻的基因组中,如果用(a)和(b)中的PCR标记检测出Rf-1连锁带,则可以认为该水稻很可能具有Rf-1基因。

在另一个实施方式中,可以通过(a)组中至少2个PCR标记和(b)组中至少2个PCR标记而检测Rf-1连锁带。例如,在(a)和(b)两组标记中,如图1所示的基因图谱,用距离Rf-1基因很近的标记可检测到Rf-1连锁带,而用距离Rf-1基因远一些的标记则不能检测到Rf-1连锁带,通过筛选这样的水稻个体可以选出含有不需要基因区最小的具有Rf-1基因的水稻个体。同样,优选的,(a)组中的至少一个PCR标记是S12564 Tsp509I和(b)组中的至少一个PCR标记是C1361 MwoI。因而,S12564 Tsp509I和C1361 MwoI两个PCR标记位点之间的遗传距离为0.3cM。利用这种特性,可以从Rf-1基因供体亲本引入的染色体区限定至1cM左右区域。这有助于将供体亲本Rf-1基因附近可能存在的有害基因被引入至恢复系中的可能性降至最小。

Rf-1基因的检测

为了检测水稻基因组中的Rf-1基因,利用上述SEQ ID NO:1-18作为引物进行PCR反应可以自水稻基因组扩增出上述任何一个PCR标记,然后用聚合酶链式反应-限制性片段长度多态方法(PCR-RFLP)进行检测。PCR-RFLP是一种适用于下述情形,即PCR扩增DNA片段中的限制性酶的识别位点在不同品种之间存在多态性,并且能从那些限制性的切割模式而方便的鉴定出特异的多态性(D.E.Harry et al.,Theor.Appl.Genet.(1998),97:327-336)。

根据所用引物而在凝胶上观察到的条带所反映出的限制性内切酶切割模式,列于下述表1中。

                           表1

                                            检测条带的大致大小(bp)

由引物对1检测标记1(R1877 EcoRI)

  当待测水稻基因组中纯合的含有Rf-1基因时:  1500及1700

  当待测水稻基因组中杂合的含有Rf-1基因时:  1500、1700及3200

  当待测水稻基因组不含有Rf-1基因的情况下:  3200

由引物对2检测标记2(G4003 HindIII)

  当待测水稻基因组中纯合的含有Rf-1基因时:  362

  当待测水稻基因组中杂合的含有Rf-1基因时:  95、267及362

  当待测水稻基因组不含有Rf-1基因的情况下:  95及267

由引物对3测标记3(C1361 MwoI)

  当待测水稻基因组中纯合的含有Rf-1基因时:  50及107

  当待测水稻基因组中杂合的含有Rf-1基因时:  25、50、79及107

  当待测水稻基因组不含有Rf-1基因的情况下:  25、50及79

由引物对4检测标记4(G2155 MwoI)

  当待测水稻基因组中纯合的含有Rf-1基因时:  25、27及78

  当待测水稻基因组中杂合的含有Rf-1基因时:  25、27、78及105

  当待测水稻基因组不含有Rf-1基因的情况下:  25及105

由引物对5检测标记5(G291 MspI)

  当待测水稻基因组中纯合的含有Rf-1基因时:  25、49及55

  当待测水稻基因组中杂合的含有Rf-1基因时:  25、49、55及104

  当待测水稻基因组不含有Rf-1基因的情况下:  25和104

由引物对6检测标记6(R2303 BslI)

  当待测水稻基因组中纯合的含有Rf-1基因时:  238、655及679

  当待测水稻基因组中杂合的含有Rf-1基因时:  238、655、679及1334

  当待测水稻基因组不含有Rf-1基因的情况下:  238及1334

由引物对检测标记7(S10019 BstUI)

  当待测水稻基因组中纯合的含有Rf-1基因时:  130、218及244

  当待测水稻基因组中杂合的含有Rf-1基因时:  130、218、244及462

  当待测水稻基因组不含有Rf-1基因的情况下:  130及462

由引物对8检测标记8(S10602 KpnI)

  当待测水稻基因组中纯合的含有Rf-1基因时:  724

  当待测水稻基因组中杂合的含有Rf-1基因时:  117、607及724

  当待测水稻基因组不含有Rf-1基因的情况下:  117及607

由引物对9检测标记9(S12564 Tsp509I)

  当待测水稻基因组中纯合的含有Rf-1基因时:  41及117

  当待测水稻基因组中杂合的含有Rf-1基因时:  26、41、91及117

  当待测水稻基因组不含有Rf-1基因的情况下:  26、41及91

II.Rf-1位点的鉴定

如上所述,日本专利申请No.2000-247204所公开RFLP-PCR标记,是基于我们发现Rf-1位点定位于DNA标记位点S12564 Tsp509I和C1361 MwoI之间。通过回交将Rf-1基因引入不含有Rf-1基因的粳稻品系中建立育性恢复品系。如果在这个过程中使用日本专利申请No.2000-247204描述的鉴定Rf-1位点的方法,不仅可以有效的建立恢复系(2-3年内),而且插入的片段长度也能得到控制。

然而,通过杂交不可避免的将Rf-1附近的区域也同时引入受体亲本中。日本专利申请No.2000-247204表明Rf-1位点定位于DNA标记位点S12564Tsp509I和C1361 MwoI之间,但这两个位点的图距约为0.3cM,即约90kbp。如果在Rf-1附近存在有害基因,将不可否认该有害基因也可能与Rf-1基因一起被插入。

因此,基于Rf-1位点和DNA标记位点S12564 Tsp509I有密切的连锁,我们通过染色体步行和遗传分析寻找在DNA标记位点S12564 Tsp509I和C1361 MwoI之间的与Rf-1基因连锁的区域。结果,我们成功的鉴定出了包含Rf-1基因的约76kb的区域,并测定了所述区域的全部碱基序列。根据本发明,通过遗传工程的方法而有可能将育性恢复基因的功能导入到BT型雄性不育细胞质。

具体地说,在日本专利申请No.2000-247204中,用FR Koshihikari(在Rf-1位点是杂合的)对MS Koshihikari进行授粉而获得1042个个体群,进行连锁分析发现1个在Rf-1和S12564 Tsp509I位点之间发生重组的重组体和2个在Rf-1和C1361 MwoI位点之间发生重组的重组体(本申请中为参考实施例1-2)。在本发明中,增加了4103个个体而使群体中分析共有5145个个体。结果,新发现1个在Rf-1和S12564 Tsp509I位点之间发生重组的重组体和6个在Rf-1和C1361 MwoI位点之间发生重组的重组体,总数分别为2和8个重组体。通过本发明的高精度分离分析对这10个个体进行检测以获得在Rf-1位点最近处发生重组的重组体(实施例1)。

在Rf-1和C1361 MwoI位点之间的8个重组体和在Rf-1和S12564Tsp509I位点之间的2个重组体,从其频率比较上看可知S12564 Tsp509I位点比C1361 MwoI位点与Rf-1位点的遗传距离要近。遗传距离(用重组频率表示:cM)和物理距离(用碱基对数量来表示:bp)并不总是成比例的,但通常可认为遗传距离的减少,其物理距离也随着减少。

因此,我们试图从S12564 Tsp509I位点开始进行染色体步行来分离Rf-1位点(实施例2)。利用籼稻品种IR24和粳稻品种Asominori的基因组DNA以λDASH II为载体制备基因组文库以用于染色体步行。IR24是携带Rf-1的品种,而Asominori未携带Rf-1。染色体步行结果,从IR24基因克隆中获得覆盖了约76kp染色体区域的重叠区(在染色体上的重叠克隆按序设定(ordered sets)),进而测定了整个序列(76363bp)。

然后,基于获得的碱基序列信息等而新发现了12个标记,并对上述提到的与Rf-1位点最接近的10个重组体进行高精度分离分析(实施例3)。结果,包含于上述约76kb中的65kb序列被发现包含了可以用于确定Rf-1基因功能存在的序列。这个区域由8个基因组克隆组成的重叠区所覆盖。每一个克隆长约12-22kb并且至少有4.7kb的重叠区域。水稻中不同基因的长度差别跨越非常大(从短到长),但大部分基因的长度为数kb或更短。因此,在这8个基因组克隆中至少有一个被预期包含了全长Rf-1基因。

我们进一步在上述约76kb的染色体区域中的Rf-1基因区域进行定位,以用于进行互补分析以直接阐明是否存在育性恢复能力。

具体而言,通过遗传工程技术将上述76kb区域中的10个部分片段(每一个长10-21kb)分别导入雄性不育系MS Koshihikari的未成熟种子中(图5)。在所利用的10个部分片段中,有8个片段来自于先前通过染色体步行而得到的(图1中的XSE1、XSE7、XSF4、XSF20、XSG22、XSG16、XSG8和XSH18,并描述在实施例3中)。此外,从XSF18和XSX1两个克隆中获得片段也进行了互补分析。XSF18在5′和3′端分别与XSF20的相同(分别是SEQID NO:27中的第20328位和41921位碱基),但缺乏中间的第33947至38591位碱基。这是因为在克隆XSF18最初被分离时就发现在克隆分离后的扩增中包含上述缺失,因此重新进行扩增步骤而得到了完整克隆,称为XSF20(实施例8)。XSX1是从克隆XSG8和XSH18通过限制性内切酶处理并连接以包含足够的重叠区而重新获得的克隆,因为两克隆的重叠区相对比较小(约7kb)(实施例13)。

由于Rf-1是显性基因,如果插入片段完全包含Rf-1基因,则转化个体在当代即显示出恢复育性。在互补分析中,评价了用每一个片段转化的植株种子育性以找到那些用15.6kb片段转化的其种子育性已恢复的植株,其中15.6kb片段包括SEQ ID NO:27的第38538-54123位碱基,它来源于λ噬菌体克隆XSG16(实施例10)。用其它片段转化的植株全都是不育的。这些结果表明上述15.6kb片段完全包含了Rf-1基因。况且,本发明提供了通过遗传工程技术导入Rf-1基因的方法,且证明是有效的。

为了进一步弄清λ噬菌体克隆XSG16中的确含有Rf-1基因的区域,我们通过互补分析,评价了比15.6kb片段(包含SEQ ID NO:27的第38538-54123位碱基)更短片段的种子育性。结果表明,来自XSG16的11.4kb片段(包含SEQ ID NO:27的第42357-53743位碱基)具有恢复种子育性的功能(实施例10(2))。用进一步短的6.8kb片段(包含SEQ ID NO:27的第42132-48883位碱基)进行转化得到的植株也具有恢复的种子育性(实施例10(3))。这些结果表明上述6.8kb片段包含Rf-1基因。

III.包含Rf-1位点的核酸

本发明提供包含育性恢复基因位点(Rf-1)的核酸。本发明所述包含育性恢复基因位点(Rf-1)的核酸包括有恢复育性功能的具有SEQ ID NO.27或与SEQ ID NO.27的碱基序列有至少70%同一性的碱基序列。

如实施例10中所描述的,证实了Rf-1基因尤其完全包含于SEQ IDNO.27的第38538至54123位的碱基序列中。相应的,本发明尤其提供有恢复育性的功能并具有SEQ ID NO.27的第38538至54123位或与SEQ IDNO.27的第38538至54123位的碱基序列有至少70%同一性的碱基序列。在这里,术语“SEQ ID NO.27的碱基序列”是指SEQ ID NO.27的全部碱基序列或其对育性恢复功能起作用的部分序列,特别是第38538至54123位碱基。更优选的,它指第42357至53743位碱基,还优选第42132至48883位碱基。

在下面的实施例中,从携带Rf-1基因的籼稻水稻IR24基因组文库中分离了包含育性恢复基因(Rf-1)的核酸,并且被确定具有SEQ ID NO:27的碱基序列。然而,本发明的包含育性恢复基因(Rf-1)的核酸可以从任何携带RF-1基因的籼稻品种中衍生而来。携带Rf-1基因的籼稻品种包括,但不局限于,例如IR24、IR8、IR36、IR64、Chinsurah和BoroII。已知的不携带Rf-1基因的粳稻品种包括,但不局限于,例如Asominori、Koshihikari、Kirara 397、Akihikari、Akitakomachi、Sasanishiki、Kinuhikari、Nipponbare、Hatsuboshi、Koganebare、Hinohikari、Mineasahi、Aichinokaori、Hatsushimo、Akebono、Fujihikari、Minenoyukimochi、Kokonoemochi、Fukuhibiki、Dontokoi、Gohyakumangoku、Hanaechizen、Todorokiwase、Haenuki、Domannaka、Yamakikari等等。“籼稻”和“粳稻”品种对本领域技术人员而言非常熟知的,并且本发明所包括的水稻品种对本领域技术人员而言也是容易确定的。

本发明的核酸可以是单链和双链形式的DNA,及其相应的互补RNA。DNA包括举例来说如基因组DNA(包括相应的cDNA)、化学合成的DNA、PCR扩增得到的DNA和它们的组合。

本发明的包含Rf-1基因的核酸优选具有SEQ ID NO:27的碱基序列。同一个氨基酸可由不只一个密码子编码,这称为遗传密码的简并性。因此,与SEQ ID NO:27的碱基序列不完全相同的DNA序列可能与SEQ ID NO:27所示碱基序列编码了完全相同的氨基酸序列的蛋白。这种变体DNA序列可能由于沉默突变导致的(例如在PCR扩增过程中产生),或也可能由于天然序列的变异(deliberate mutagenesis)所导致。

本领域技术人员非常熟知,甚至来自不同品种的具有不同氨基酸序列的蛋白质,仍然具有同样的功能。本发明的Rf-1基因包括SEQ ID NO:27所示碱基序列的同系物和变体,只要它们具有恢复育性功能。术语“具有恢复育性功能”意指当这样的DNA片段导入后可使水稻植株个体或其种子获得育性。育性恢复可能由于通过Rf-1基因的蛋白表达或可赋予育性的Rf-1基因核酸(DNA或RNA)本身的功能所导致。

Rf-1基因同系物或变体是否具有育性恢复功能可通过下面列举的方法来检测,但并不局限于这些方法。待测核酸片段根据Hiei等(PlantJournal(1994),6(2),p272-282)的方法导入到用MS-FR Koshihikari对MSKoshihikari(不育系)进行授粉而获得的未成熟种子中。所获得的转化体在正常条件下进行培养,只有被测核酸片段具有育性恢复功能时才能获得成熟的种子。

衍生自不携带Rf-1基因的粳稻Asominori相应区的核酸具有如SEQ IDNO:28所示的碱基序列。SEQ ID NO:28和SEQ ID NO:27的相应部分大体上有约98%的同一性。因此,本发明中包含育性恢复基因(Rf-1)位点的核酸与SEQ ID NO:27有至少70%,优选约80%或更高,更优选约90%或更高,还更优选95%或更高,最优选98%或更高的同一性。

同一性的百分率可通过目测和数学计算来确定。任选地,两个核酸之间的同一性可通过利用GAP计算机程序,version 6.0的序列比较信息来确定。所述程序描述于Devereux等,Nucl.Acids Res.,12:387(1984),并可从theUniversity of Wisconsin Genetics Computer Group(UWGCG)获得。GAP程序优选的默认参数包括:(1)碱基的一元比较矩阵(包含值为1时表示相同,为0时表示不相同),和Gribskov和Burgess,Nucl.Acids Res.,14:6745(1986)的加权比较矩阵,描述于Schwartz和Dayhoff编的Atlas of Protein Sequence andStructure,National Biomedical Research Foundation,pp.353-358;(2)每一个缺口(gap)罚分值3.0,对每一个缺口中的每一个碱基(symbol)额外罚分值0.10;和(3)末端缺口不罚分。也可以采用其它本领域技术人员使用的序列比较程序。

本发明的核酸也包括在中等严谨条件下能与SEQ ID NO:27序列进行杂交并具有育性恢复功能的核酸,以及高度严谨条件下能与SEQ ID NO:27序列进行杂交并具有育性恢复功能的核酸。

在此处,本领域技术人员可根据如DNA的长度来确定所述中等严谨条件。基本条件描述于Sambrook等Molecular Cloning:A Laboratory Manual,2nd,Vo.1,pp.1.101-104,Cold Spring Harbor Laboratory Press,(1989),包括用对硝化纤维膜进行预洗的预洗液即5×SSC,0.5%SDS,1.0mM EDTA(pH8.0),杂交是在约1×SSC至6×SSC于约40到60℃下进行(或其它类似杂交液,如Stark’s溶液,即约50%甲酰胺于约42℃),以及洗涤在约60℃,0.5×SSC,0.1%SDS下进行。在杂交液包含约50%甲酰胺时杂交温度可低约15-20℃。本领域技术人员也可根据如DNA的长度来确定高度严谨条件。通常,高度严谨条件包括相对于上述中等严谨条件而言,其杂交和/或洗涤在更高温度和/或更低盐浓度条件下进行。例如,这些条件包括杂交条件是0.1×SSC到0.2×SSC,在约60-65℃和/或洗涤条件是0.2×SSC,0.1%SDS在约65-68℃。本领域技术人员知晓可根据各种因素如探针长度来对温度和洗液盐浓度进行必要的调整。

本发明的DNA也包括由于缺失、插入或取代一或多个碱基而不同于SEQ ID NO.27所示的序列,但仍然具有育性恢复功能的核酸。只要保持了育性恢复功能,缺失、插入或取代碱基的数目没有特别的限制,但优选为1至数千个,更优选1-1000,更优选1-500,更优选1-200,最优选1-100个碱基。

基于本申请的描述,一旦Rf-1基因得到进一步弄清,本领域技术人员可以在去除例如Rf-1基因之外的区域或其内含子区后而利用Rf-1基因。特定氨基酸的取代可通过例如具有类似理化特性的残基进行取代。这种保守性取代的例子包括用另一个脂肪族氨基酸取代脂肪族氨基酸,例如Ile、Val、Leu或Ala中的一个取代其中的另一个;用极性残基取代极性残基,例如在Lys和Arg、Glu和Asp、或Gln和Asn之间进行改变;或者用芳香族残基之间的取代,例如用Phe、Trp或Tyr中的一个取代其中的另一个。其它熟知的保守性取代包括,例如在具有类似疏水特性的整个区域之间的变化。为了引入合适的缺失、插入或取代时,本领域技术人员可利用熟知的遗传工程技术例如位点特异性突变,其描述于Sambrook等Molecular Cloning:ALaboratoryManual,2nd,Cold Spring Harbor Laboratory Press,(1989)。

我们对携带Rf-1基因(SEQ ID NO:27)的籼稻品种IR24与没有携带的粳稻品种如Asominori(SEQ ID NO:28)和Nipponbare BAC克隆(GanBankAccession No.AC068923)之间进行了比较。结果,我们发现携带Rf-1基因的籼稻品种中Rf-1区域至少具有下述单碱基多态性(SNP)。

1)与SEQ ID NO:27的第1239位碱基对应的碱基是A;

2)与SEQ ID NO:27的第6227位碱基对应的碱基是A;

3)与SEQ ID NO:27的第20680位碱基对应的碱基是G;

4)与SEQ ID NO:27的第45461位碱基对应的碱基是A;

5)与SEQ ID NO:27的第49609位碱基对应的碱基是A;

6)与SEQ ID NO:27的第56368位碱基对应的碱基是T;

7)与SEQ ID NO:27的第57629位碱基对应的碱基是C;和

8)与SEQ ID NO:27的第66267位碱基对应的碱基是G。

因此,本发明包含Rf-1区域的核酸优选地满足上述1)-8)中一个到全部的要求。

在下面的实施例3,对Rf-1区域中与Rf-1基因距离最靠近的重组体(RS1-RS2,Rc1-RC8)的染色体组织结构进行了研究。结果显示可以确定Rf-1基因功能存在的序列包含于SEQ ID NO:27的第1239-66267位碱基,即以最大可能性来估计应包含于位点P4497 MboI和B56691 XbaI位点之间(约65kb)(图3)。然而,存在这样一种可能,即对于Rf-1基因遗传功能的表达非常重要的是,Rf-1基因只是籼稻基因型的一部分,而不管其余区域是粳稻还是籼稻基因型,其遗传功能可能没有明显变化。可能还存在一个极端的例子,在粳稻与籼稻基因型之间,编码区相互之间完全相同而只有启动子区之间存在区别;启动子区和编码区只部分的包含于位点P4497 MboI和B56691 XbaI位点之间(约65kb)区域内。因此,还不能得出结论认为上述的共同籼稻区域(SEQ ID NO:27的第1239-66267位碱基之间)完全包含了完整的Rf-1基因。然而,基于以下考虑,可以确定至少SEQ ID NO:27完全包含了完整的Rf-1基因:

1)基因通常的大小为数kb而很小超过10kb;

2)本发明鉴定出的IR24基因组碱基序列(SEQ ID NO:27)完全包含上述共同籼稻区域;

3)SEQ ID NO:27的5′端位于上述共同籼稻区域的上游1238bp处,且构成另一个基因的一部分(S12564);和

4)SEQ ID NO:27的3′末端位于上述共同籼稻区域3′末端的下游10096bp处。

如此,我们第一次成功的将Rf-1基因的区域限定到76kb范围内。因此,相对于现有技术例如日本专利公开No.2000-139465中描述的与Rf-1基因相距约1cM(约300kb)遗传距离的共显性标记所选择出来的那些核酸,本发明包含Rf-1基因区域的核酸含有与Rf-1基因接近的其它基因的可能性大大减少。而且,相对于我们要求的优先权即日本专利申请No.2000-247204中描述的用DNA标记位点S12564 Tsp509I和C1361 MwoI(之间的遗传距离为0.3cM)所选择出来的核酸,本发明上述核酸含有与Rf-1基因接近的其它基因的可能性也减少。

我们进而对Rf-1基因是否完全包含于尤其SEQ ID NO:27的第38538-54123位碱基序列中作了互补分析。因而,在本发明的一个实施方案中,与SEQ ID NO.27或SEQ ID NO.27第38538至54123位的碱基序列有至少70%同一性的碱基序列至少满足下面两个要求:

1)与SEQ ID NO.27的第45461位碱基相应的碱基是A;

2)与SEQ ID NO.27的第49609位碱基相应的碱基是A。

IV.恢复水稻育性的方法

本发明提供一种恢复水稻育性的方法,包括:将核酸导入到水稻中,所述核酸具有恢复育性的功能,其碱基序列如SEQ ID NO.27所示或与SEQ IDNO.27的碱基序列有至少70%同一性。本发明的方法可能包括:将核酸导入到水稻中,所述核酸具有恢复育性的功能,并具有SEQ ID NO.27的部分序列,尤其是第38538至54123位,优选第42357至53743位碱基序列,更优选42132-48883位碱基序列,或具有与SEQ ID NO.27的第38538至54123位,优选第42357至53743位,更优选42132-48883位的碱基序列有至少70%同一性。

在本发明中,导入到水稻中的包含育性恢复基因(Rf-1)位点的核酸,可以是上述描述于“III.包含Rf-1位点的核酸”中的任何一个核酸。可以用已知的方法来将核酸导入到水稻中,而没有特别的限制。本发明的核酸可通过已知的遗传工程技术或杂交而导入到水稻中。由于可以防止包含其它邻近基因的导入,并能缩短了建立品系的周期,因而遗传工程技术优先选用。

可以使用遗传工程技术中的任何适合于转导的表达系统。重组表达载体包括含有本发明的育性恢复基因(Rf-1)的核酸,其可被导入水稻,可操作连接于合适的转录或翻译调节序列,其中的转录或翻译调节序列可源自例如哺乳动物、微生物、病毒或昆虫基因。

调节序列的例子包括转录启动子、操纵子或增强子、mRNA核糖体结合位点和可以控制转录和翻译起始和终止的合适序列。在调节序列功能性地与DNA序列联系时碱基序列可操作地连接于调控序列。因此,启动子碱基序列可操作连接于DNA序列,是指启动子碱基序列能够控制该DNA的转录。复制起始位点使DNA在水稻中能够复制,和用于鉴定转化体的选择基因通常也整合在表达载体中。可用传统方法的可选择标记基因的例子,如对抗生素如四环素、氨苄青霉素、卡那霉素、新霉素、潮霉素或壮观霉素的抗性基因。

此外,编码合适的信号肽(水稻本身的或异源的)也可以整合到表达载体中。信号肽的DNA序列(分泌肽)以与本发明核酸序列的阅读框适合的方式进行融合,以便DNA经过转录起始和mRNA翻译而得到含有信号肽的融合蛋白。

本发明也提供包含本发明基因的重组载体。将本发明基因的DNA片段整合到载体如质粒中,可用方法描述于Sambrook等Molecular Cloning:ALaboratory Manual,2nd,Cold Spring Harbor Laboratory Press,(1989)。商业化的连接试剂盒(例如从TAKARA获得)使用非常方便。进而将获得的重组载体(如重组质粒)导入到宿主水稻细胞中。

通过标准方法在现有载体(如质粒DNA)中插入目的基因而方便的制备到重组载体。植物转化载体尤其适合于利用本发明的核酸片段来使水稻具备育性。对植物转化载体没有特别的限制,只要它们在植物中能够表达预期基因而产生蛋白质即可,但优选地包括pBI221、pBI121(Clontech)、和它们衍生的载体。尤其是,用于转化属于单子叶植物水稻的载体包括pIG121Hm和pTOK233(Hiei et al.,Plant J.,6,271-282(1994)),和pSB424(Komari et al.,PlantJ.,10,165-174(1996))。

用本发明的核酸片段取代上述载体中β-葡糖苷酸酶(GUS)基因而构建成植物转化载体,对植物进行转染而获得转基因植物。植物转化载体优选包括至少启动子、起始密码子、目的基因(本发明的核酸序列或其一部分)、终止密码子和终止子。根据需要也可以包含编码信号肽的DNA、增强子序列、目的基因的5′和3′非翻译区、选择标记区等。只要能在植物中发挥作用,对启动子和终止子的选择也没有特别的限制,其中包括组成型表达启动子如最初已存在于上述载体中的35S启动子、激动蛋白和泛素(ubiquitin)基因的启动子。

将质粒导入宿主细胞的合适方法包括利用磷酸钙或氧化钙/氯化铷、电激(electroporation)、电注射、用PEG或类似物的化学处理、以及使用基因枪等,这些方法可见于Sambrook等Molecular Cloning:A Laboratory Manual,2nd,Cold Spring Harbor Laboratory Press,(1989)。对植物细胞的转化可用如叶盘法[Science,227,129(1985)]或电激法[Nature,319,791(1986)]。

将基因导入到植物中的方法包括利用农杆菌介导(Horsch et al.,Science,227,129(1985);Hiei et al.,Plant J.,6,271-282(1994))、电激法(Fromm et al.,Nature,319,791(1986))、PEG(Pazkowski et al.,EMBO J.,3,2717(1984))、微注射(Crossway et al.,Mol.Gen.Genet.,202,179(1986))、粒子轰击(McCabe et al.,Bio/Technology,6,923(1988))。对这些方法没有特别的限制,只要它们适合于将核酸导入到靶植物中即可。

通过杂交发生转导可按如下例子进行。首先,Rf-1供体亲本与粳稻品种杂交获得F1,然后与粳稻品种进行回交。从得到的植株个体中选出在位点S12564 Tsp509I是纯合体、在位点P4497 MboI和B53627 BstZ17I是杂合体的个体,进一步用于回交。再从得到的植株个体中选出在位点P4497 MboI和B56691 XbaI是杂合体、而对于粳稻(japonica)在位点B53627 BstZ17I是杂合体的个体,进一步用于回交。如此,对每一次回交后代个体中筛选在位点P4497 MboI和B56691 XbaI属于杂合体的个体以用于进一步的回交,重复进行约10个循环。最终,在位点P4497 MboI和B56691 XbaI为杂合体的个体进行自交,在获得的后代中筛选出在这两个位点都是纯合的个体,这样就获得了含有从Rf-1供体亲本导入的在位点P4497 MboI和B56691 XbaI之间的有限染色体区域的恢复系。

根据本发明,分离了包含育性恢复基因(Rf-1)的核酸,进而Rf-1基因可通过遗传工程方法而被导入到水稻品种中以建立恢复系。本发明成功地将Rf-1区域定位在76kb或更窄的区域内。因此本发明的包含Rf-1位点的核酸,相对现有技术而言,极大的减少了含有与Rf-1基因邻近的其它基因的可能性。而且,在本发明中对包含Rf-1基因区域的整个碱基序列进行了测定。根据本申请的说明书,本领域技术人员可对Rf-1基因本身作进一步的研究。因而,可以只导入Rf-1基因,而没有同时导入其它任何邻近基因。这对于邻近基因有害时是非常重要的。进一步的,建立恢复系可以在更短的时间内完成,如比通过杂交方式缩短了1-2年。

在实施例4-13中描述的互补分析中,通过农杆菌介导法用图5中描述的10个克隆片段转化了MS Koshihikari(具有BT型细胞质且其中的一个核心基因(core gene)在基本上与Koshihikari的相同)。结果表明,用包含SEQ IDNO:27的第38538-54123位,优选第42357-53743位,更优选第42132-48883位碱基序列的核酸转化而能建立育性恢复系。

用于建立水稻恢复系的农杆菌介导法如Hiei et al.,Plant J.,6,271-282(1994)、Komari et al.,Plant J.,10,p.165-174(1996)、Ditta et al.,PNAS77:pp.7347-7351(1980)等描述的方法,但并不局限于这些。

首先,制备要插入目的核酸片段的质粒载体。合适的质粒载体包括如pSB11、pSB22等具有如Komari et al.,Plant J.,10,p.165-174(1996)(同上)所描述质粒图的载体。或者,本领域技术人员自己也可根据诸如上述pSB11、pSB22来构建出适合的载体。在下面的例子中,利用了中间载体pSB200,它是以pSB11为基础而制备的含有潮霉素抗性基因的载体。具体地说,胭脂碱合成酶终止子(Tnos)首先与泛素启动子和泛素内含子进行融合(Pubi-ubiI)。再将潮霉素抗性基因插入到所得Pubi-ubiI-Tnos复合体上的ubiI和Tnos之间得到Pubi-ubiI-HYG(R)-Tnos组装。再将其与pSB11(Komari et al.,如上)的HindIII/EcoRI片段整合得到pKY205。用来添加限制性内切酶位点如NotI、NspV、EcoRV、KpnI、SacI、EcoRI的接头序列插入到该pKY205中Pubi的上游HindIII位点,获得含有潮霉素抗性基因表达盒的pSB200。

然后,用包含了插入核酸的重组载体转化大肠杆菌细胞(如DH5α、JM109、MV1184,均可由商业购买得到如从TAKARA获得)。

进而,转化的大肠杆菌细胞与农杆菌菌株,优选同时与辅助(helper)大肠杆菌(携带帮助质粒)进行三亲杂配,可根据例如Ditta等(1980)的方法进行。合适的农杆菌菌株包括根癌农杆菌菌株如LBA4404/pSB1、LBA4404/pNB1、LBA4404/pSB3等。它们均具有Komari et al.,Plant J.,10,p.165-174(1996)(同上)中描述的质粒图谱,且本领域技术人员也可利用它们来构建载体。合适的辅助大肠杆菌菌株包括但不限于如HB101/pRK2013(可从Clontech获得)。有报道显示携带pRK2073的大肠杆菌有pRK2073也可用作辅助大肠杆菌,虽然它们并不常用(Lemas et al.,Plasmid 1992,27,pp.161-163)。

然后,根据Hiei等(1994)的方法用期望交配的农杆菌细胞对雄性不育水稻进行转化。通过用粳稻品种花粉对雄性不育水稻进行授粉来获得所需用于转化的未成熟种子。

评估转化植物中育性恢复,例如可通过评估直立(standing)植株抽穗(heading)后约1个月的种子育性来进行。对直立植株的评估意指对生长在田间的植株等进行观察。可选方法是对穗的成熟(ripening)种子百分率进行实验室研究来进行。

V.鉴定Rf-1基因存在的方法

根据本发明,表明可以确定Rf-1基因功能存在的序列位于水稻第10号染色体上的多态性检测标记P4497 MboI和B56691 XabI之间。而且,互补分析确证Rf-1基因完全包含于尤其是SEQ ID NO.27的第38538至54123位碱基序列之中。

对携带Rf-1基因(SEQ ID NO:27)的籼稻品种IR24与没有携带所述基因的(Asominori(SEQ ID NO:28)和Nipponbare BAC克隆AC068923)粳稻品种之间进行比较,发现两品种之间存在多态性。那么,基于在Rf-1基因附近区域中碱基序列的多态性,我们可以方便、快速和准确地鉴定待测水稻植株或其种子是否携带Rf-1基因。

因此,本发明也提供一种鉴定被测水稻个体或其种子是否具有水稻Rf-1基因的方法,其中利用了可以确定水稻Rf-1基因功能存在的序列,该序列位于在水稻第10号染色体上的多态性检测标记P4497 MboI和B56691 XabI之间。

可用任何已知的方法来检测多态性。例如,已知方法包括限制性片段长度多态(RFLP)、通过测序直接确定、用识别8个碱基序列的限制性内切酶对基因组DNA进行切割后进行末端放射性标记,进而用识别4或6个碱基序列的限制性内切酶作进一步切割,继而对消化产物进行双向电泳(RLGS,Restriction Landmark Genome Scanning)等。AFLP分析(扩增片段长度多态,P.Vos et al.,Nucleic Acids Res.Vol.23,pp.4407-4414(1995))也已经被开发,其中通过PCR来扩增/检测RFLP。

例如,涉及通过PCR扩增来检测RFLP(将RFLP标记转化成PCR标记)或通过PCR扩增来检测微卫星中的多态性(微卫星标记)的常规方法将在下面阐述。

将RFLP标记转化成PCR标记

A.基于与RFLP探针相应的基因组区域中多态性的PCR标记(D.E.Harry,B.Temesgen,D.B.Neale;Codominant PCR-based markers for Pinus taedadeveloped from mapped cDNA clones,Theor.Appl.Genet.(1998)97:pp.327-336)。“RFLP”是一种用DNA片段作为探针经Southern分析而观察到的多态性。用作探针的DNA片段的碱基序列称为“RFLP标记探针序列”。根据RFLP标记探针序列设计PCR引物,进行基因组PCR反应后,可通过如下两种方式获得PCR标记。第一种方式涉及:用一系列的限制性内切酶处理产物以找到能引起片段长度多态的限制酶,第二种方式涉及找出通过比较品种之间产物的碱基序列得到的多态性,基于该多态性制备PCR标记。

B.基于引起RFLP位点的PCR标记。通过鉴定在PCR探针内或附近(通常在数kb范围内)的引起RFLP位点来获得PCR标记(只在两个比较品种中的一个品种携带该内切酶识别位点)。

微卫星标记

微卫星是在基因组中大量存在的以约2-4个碱基如(CA)n的重复序列。如果品种间多态性是由于重复数(repetition)引起的,则可根据邻近区域中设计引物进行PCR扩增,观察其扩增产物的长度来确定多态性,因而可以检测到这种DNA多态性。利用微卫星检测多态性的标记被称微卫星标记(O.Parnaud,X.Chen,S.R.McCouch,Mol.Gen.Genet.(1996)252:pp.597-607)。

在本发明中使用的检测多态性的方法也没有特别限制。从效率和方便角度考虑,优选PCR-RFLP,它是将PCR和RFLP结合来鉴定限制性内切酶切割模式所造成的多态性,在不同品种间的PCR扩增DNA片段序列中,由于内切酶识别位点的差异形成PCR-RFLP。PCR-RFLP也称为CAPS(切割扩增多态性序列)。如不存在任何适合的限制性内切酶识别位点以体现多态性的区域时,也可利用改进的CAPS称为dCAPS(衍生的切割扩增多态性序列),其中限制性内切酶识别位点通过PCR引入(Michaels,S.D.and Amasino,R.M.(1998),The Plant Journal 14(3)381-385;A.Konieczny et al.,(1993),Plant J.4(2)pp.403-410;Neff,M.M.,Neff,J.D.,Chory,J.and Pepper,A.E.(1998),ThePlant Journal 14(3)387-392)。这些方法在下面还要详细介绍。

CAPS,dCAPS

本发明的鉴定方法包括,但不局限于:

i)制备引物对:其根据在籼稻和粳稻品种之间的在Rf-1位点和其邻近区域的碱基序列中体现多态性位点的碱基序列来设计的,用于扩增所述碱基序列;

ii)进行核酸扩增反应,用被测水稻个体或其种子的基因组DNA作为模板;和

iii)基于在核酸扩增产物中的多态性以鉴定被测水稻(rice)个体或其种子是否具有Rf-1基因。

制备第i)中引物对优选包括下述任何一种方式:

a)在核酸扩增产物的多态性中存在缺失区的变化时,则根据缺失区的侧翼序列来设计核酸扩增的引物对,以形成可检测多态性的标记;

b)在核酸扩增产物的多态性中存在引起限制性内切酶识别差异的碱基变化时,则根据碱基改变位点的侧翼序列来设计核酸扩增的引物对,以形成可检测多态性的标记;或

c)在核酸扩增产物的多态性中存在不引起限制性内切酶识别差异的碱基变化时,制备引物对以引入错配碱基,其中引物对中包含碱基改变位点并且将包含碱基改变位点的区域改变成可导致在核酸扩增产物中限制性内切酶识别差异的碱基序列,以形成可检测多态性的标记。

在本发明中,可合理的选择出鉴定Rf-1基因存在的合适多态性位点,以便多态性检测标记可按下面的描述来制备。即基于携带Rf-1基因籼稻品种(IR24)的碱基序列(SEQ ID NO:27)与不携带Rf-1基因粳稻品种的相应序列(Asominori(SEQ ID NO:28)和Nipponbare BAC克隆AC068923)之间的比较,但可不局限于这两个品种之间的比较。

如果发现多态性导致了限制性内切酶识别的差异,举例而言,制备核酸扩增用的引物对以侧接多态性位点并用于检测该多态性。优选的,引物不针对特异于高度重复序列来设计,以避免产生非预期产物。如果发现多态性没有引起限制性内切酶识别的差异,标记的制备则适用于上面描述的dCAPS方法。针对dCAPS标记的引物优选不针对特异于重复序列来设计,并使产物优选在50-300个碱基,更优选约100个碱基的长度以使多态性检测容易。

如果发现多态性涉及微卫星,核酸扩增引物可按微卫星的侧翼序列来设计以侧接该微卫星,并用于检测该多态性。同样,也不要将引物设计成特异于重复序列。

1)核酸扩增

在本发明中,根据在被测水稻个体或种子中测定的Rf-1位点的碱基序列来制备引物对,优选被设计成可扩增包含多态性的邻近区域。引物对用于核酸扩增反应,以被测水稻个体或种子的基因组DNA为模板。核酸扩增反应优选为聚合酶链式反应(PCR)(Saiki et al.,1985,Science 230,pp.1350-1354)。

用于核酸扩增反应的引物对,其是根据多态性位点和其邻近区域的碱基序列来设计的,可按任何已知的方法制备。具体地说,制备根据多态性位点和其邻近区域的碱基序列来设计的引物对时,通过下面的方式,其包括产生与多态性位点和其邻近区域的碱基序列具有相同序列的单链DNA或与该区域互补的碱基序列,如果需要,制备成包含修饰但不影响对多态性位点和其邻近区域碱基序列特异结合的单链DNA,但满足以下条件:

1)每条引物的长度为15-30个碱基;

2)每条引物的碱基中G+C比率在30-70%;

3)每条引物的碱基序列中的A、T、G和C不存在局部的严重不平衡分布。

4)通过引物对而扩增出的核酸长度约为50-3000个碱基,优选为50-300个碱基;和

5)在每条引物或引物碱基序列之间不存在任何互补序列片段。

在这里,多态性位点的“邻近区域”意指包含多态性位点及其邻近的在核酸扩增,尤其对于PCR,合适范围内的区域。被扩增的邻近区域优选但不局限于具有约50-3000个碱基,更优选约50-约2000个碱基。为了便于鉴定多态性,产物长度优选在50-300个碱基,更优选为约100个碱基。邻近区域在多态性位点的5′和3′侧优选,但不局限于具有约0至约3000个碱基,更优选约0至约2000个碱基,还优选为约0至约1000个碱基。

核酸扩增反应的程序和条件没有特别的限制,对于本领域技术人员而言是非常熟练的。本领域技术人员可根据各种因素如多态性位点及其邻近区域的碱基序列、引物对的碱基序列和长度等来确定合适的条件。通常,当引物越长或G+C含量越高或者A、T、G和C的分布更均匀,则核酸扩增反应可在更严谨的条件下进行(退火和核酸延长反应在更高的温度下进行,并采用较少的循环次数)。采用越严谨的条件可使扩增反应具有更高的特异性。

扩增反应可按照如下条件进行,但不局限于它们:94℃2分钟1个循环,于94℃1分钟、58℃1分钟和72℃2分钟进行30个循环,最后是1个循环72℃2分钟,用50ng基因组DNA作模板,每种dNTP 200μm和ExTaqTM(TAKARA)5U。反应也可用如下条件:94℃2分钟1个循环,于94℃1分钟、58℃1分钟和72℃1分钟进行30个循环,最后是72℃2分钟1个循环。另一个具体例子,反应在如下条件进行:94℃2分钟1个循环,于94℃30秒、58℃30秒和72℃30秒进行35个循环,最后是72℃2分钟1个循环。

作为PCR模板的被测水稻(检测水稻)基因组DNA可以用Edwards等(Nucleic Acids Res.8(6):1349,1991)的方法而容易的从植株个体或种子中提取出来。更优选的,可用标准方法对DNA进行纯化。一个尤其优选的提取方法是CATB法(Murray,M.G.et al.,Nucleic Acids Res.8(19):4321-4325,1980)。用作PCR模板的DNA量优选为最终浓度0.5ng/μL。

2)制备检测多态性的标记

通过用引物对进行核酸扩增反应而获得扩增产物,检测其中是否存在多态性。之后,可以基于发现的多态性来建立检测该多态性的标记。下面提供可检测扩增产物中的多态性的例子,但并不局限于这些例子。

a)在核酸扩增反应产物的多态性中存在包含缺失区的改变(change)。

在这种情况下,制备用于核酸扩增的引物对侧接缺失区以形成检测多态性的标记。如果缺失区达到足够的大小,多态性可通过如琼脂糖或丙烯酰胺凝胶电泳时扩增产物的泳动的差异来检测。举例来说,当碱基对数差别在约5%或更大的情况下,可用琼脂糖凝胶电泳检测多态性,或当长度差别约为1个碱基或更多时,可用测序用的丙烯酰胺凝胶电泳检测多态性。任选地,也可通过用寡核苷酸或DNA片段作为分析探针与核酸扩增产物进行杂交来检测多态性,其中所用的寡核苷酸或DNA片段具有与不包括缺失区的碱基序列互补的序列不包括缺失区。任选地,如果需要,可测定扩增产物的碱基序列来进一步确证多态性。本领域技术人员可采用合适的关于核酸电泳、杂交、测序及相关的已知实验技术。在这种情况下,扩增产物的长度差别直接反应多态性,以此为基础的用于检测多态性的标记被称为ALP(扩增子(amplicon)长度多态)标记。

b)在核酸扩增产物的多态性中存在引起限制性内切酶识别差异的碱基改变。

在这种情况下,根据碱基改变位点的侧翼序列来设计核酸扩增的引物对以形成可检测多态性的标记。此时,在核酸扩增产物的多态性中存在引起限制性内切酶识别差异的碱基改变,即造成一个或多个特定的限制性内切酶可以切割或不能切割核酸扩增产物。因此,扩增产物可用限制性内切酶和在例如琼脂糖凝胶上进行电泳时的泳动的差异来检测多态性。如果需要,测定扩增产物的碱基序列来进一步确证多态性。

在这种情况下,通过PCR等方法的扩增产物的限制性片段的长度差异可反应出多态性,基于此而用于检测多态性的标记被称为CAPS标记或PCR-RFLP标记(A.Konieczny等,如上)。

这种标记的例子如下面实施例1中的引物对P4497 MboI、P23945 MboI、P41030 TaqI、P45177 BstUI、B59066 BsaJI、B56691 XbaI。甚至如果多态性可通过如上面a)描述的通过扩增产物的核酸长度来进行检测,也可通过与限制性内切酶处理相结合而更容易的进行检测。

c)在核酸扩增产物的多态性中存在不引起限制性内切酶识别差异的碱基改变

此时,制备用于引入错配碱基的引物对,其包含碱基改变位点并且将包含碱基改变位点的区域改变成可导致扩增产物中的限制性内切酶识别差异的碱基序列,以形成可检测多态性的标记。

具体的说,基于天然靠近Rf-1基因区域的序列来设计引物对,可在核酸扩增产物中产生多态性但没有导致限制性内切酶识别的差异。因此,在一条或两条引物中引入错配碱基以将包含碱基改变位点(多态性)的区域改变成可导致在扩增产物中的限制性内切酶识别有差异的碱基序列。例如,在Mikaelian等Nucl.Acids.Res.20:376.1992中描述的方法可以作为通过PCR介导的位点特异性突变来对特定碱基进行取代、缺失或增加的标准方法。用错配引入引物得到的扩增产物作为检测多态性的标记可能被一个或多个特定限制性内切酶切割或不被切割,因为在错配引入位点存在限制性内切酶识别差异。因此,扩增产物用这些限制性内切酶处理并在例如琼脂糖凝胶上电泳,通过如上述b)描述的观察泳动差别来检测出多态性。

引入错配碱基既不能影响引物与靶标植物基因组的结合,也不能影响多态性碱基的改变。多态性碱基的改变用于在其附近引入错配,以通过碱基的改变和错配相结合产生限制性内切酶识别的差异。引入这种错配的方法为本领域技术人员所熟知,例如可详见于Michaels,S.D.andAmasino,R.M.(1998),Neff,M.M.,Neff,J.D.,Chory,J.and Pepper,A.E.(1998)。

这种情况下的标记是对上述b)描述的CAPS标记的改进,并称为dCAPS(衍生CAPS)标记。这种标记的例子如下面实施例3中的P9493 BslI。

在上述第b)或c)种情况下,如果存在额外的与品种多态性无关的限制性酶切位点,则很难鉴定基于限制性内切酶识别差异的多态性。在这种情况下,可以引入合适的错配碱基到引物中以消除不必要的限制性酶切位点。例如,在实施例3中引入了合适的错配碱基到R-引物来消除在B60304 MspI中的与多态性无关的MspI位点。

虽然本发明并不局限于任何特定方法,CAPS或dCAPS方法相对于其它RFLP方法具有几个优点。具体的说,例如进行分析时比RFLP需要更小量的样品。另一个优点是大大减小了分析所需要的人力和时间。用PCR标记检测的多态性可通过凝胶电泳来观察,这比用微卫星标记的丙烯酰胺凝胶电泳要容易操作一些。

本发明的鉴定方法的优选实施方式

鉴定被测水稻是否具有Rf-1基因的方法之优选方式通过下面的示例描述来阐明。在此处的例子中,发现籼稻品种IR24所携带的Rf-1基因(SEQ IDNO:27)的碱基序列与粳稻品种的相应区域相比至少具有下述1)-8)的多态性:

1)与SEQ ID NO:27的第1239位碱基对应的碱基是A;

2)与SEQ ID NO:27的第6227位碱基对应的碱基是A;

3)与SEQ ID NO:27的第20680位碱基对应的碱基是G;

4)与SEQ ID NO:27的第45461位碱基对应的碱基是A;

5)与SEQ ID NO:27的第49609位碱基对应的碱基是A;

6)与SEQ ID NO:27的第56368位碱基对应的碱基是T;

7)与SEQ ID NO:27的第57629位碱基对应的碱基是C;和

8)与SEQ ID NO:27的第66267位碱基对应的碱基是G。

因此在本发明的一个优选实施方式中,当被测水稻个体或种子满足一个到全部上述1)-8)的条件时可以判断携带有Rf-1基因。

我们进一步核实了Rf-1基因的功能表达所必需的区域包含于尤其是SEQ ID NO:27的第38538-54123位,优选第42357-53743位,更优选第42132-48883位碱基中。因此在本发明的一个优选实施方式中,当具有与SEQID NO:27或SEQ ID NO:27的第38538-54123位碱基序列有至少70%的同一性,并至少满足下述1)和2)中的一个条件,则被测水稻个体或种子可被鉴定为具有Rf-1基因:

1)与SEQ ID NO.27的第45461位碱基相应的碱基是A;

2)与SEQ ID NO.27的第49609位碱基相应的碱基是A。

利用已知多态性检测方法可以确定是否满足了上述条件。也可以直接测定包含所述序列的邻近区域的碱基序列。然而,上面描述的CAPS或dCAPS方法由于具有快速和方便的特性而优选使用。CAPS或dCAPS方法例如可以通过包括下面步骤来进行:

i)基于包括下述任何一个碱基的邻近区域碱基序列制备引物对;

1)相应于SEQ ID NO:27的第1239位碱基的碱基;

2)相应于SEQ ID NO:27的第6227位碱基的碱基;

3)相应于SEQ ID NO:27的第20680位碱基的碱基;

4)相应于SEQ ID NO:27的第45461位碱基的碱基;

5)相应于SEQ ID NO:27的第49609位碱基的碱基;

6)相应于SEQ ID NO:27的第56368位碱基的碱基;

7)相应于SEQ ID NO:27的第57629位碱基的碱基;和

8)相应于SEQ ID NO:27的第66267位碱基是G。

以扩增出上述碱基及其邻近区域。

ii)利用被测水稻个体或其种子的基因组作为模板进行核酸扩增反应。

iii)根据所得到的核酸扩增产物的多态性来鉴定被测水稻个体或其种子中是否存在Rf-1。

在检测核酸扩增产物的多态性中发现满足,但不局限于,下面一个到全部1)-8)的要求时,可确定被测水稻个体或其种子中存在Rf-1:

1)包括了相应于SEQ ID NO:27的第1239位碱基的区域但不具有任何MboI识别序列;

2)包括了相应于SEQ ID NO:27的第6227位碱基的区域但不具有任何BslI识别序列;

3)包括了相应于SEQ ID NO:27的第20680位碱基的区域但不具有任何MboI识别序列;

4)包括了相应于SEQ ID NO:27的第45461位碱基的区域但不具有任何TaqI识别序列;

5)包括了相应于SEQ ID NO:27的第49609位碱基的区域但不具有任何BstUI识别序列;

6)包括了相应于SEQ ID NO:27的第56368位碱基的区域但不具有任何MspI识别序列;

7)包括了相应于SEQ ID NO:27的第57629位碱基的区域但不具有任何BsaJI识别序列;和

8)包括了相应于SEQ ID NO:27的第66267位碱基的区域但不具有任何XbaI识别序列。

然而,只要能够检测出上述1)-8)的特异区域,则本发明不局限于上述限制性内切酶。

优选地,本发明的鉴定方法包括:

i)以包含下述任何一碱基的邻近区域碱基序列为基础,制备引物对;

1)与第45461位碱基相应的碱基;或

2)与第49609位碱基相应的碱基;

ii)利用被检水稻个体或其种子的基因作为模板进行核酸扩增反应。

iii)根据所述核酸扩增产物中发现的多态性来鉴定被测水稻个体或其种子中Rf-1的存在。在步聚iii)中,当发现满足下述,虽然不局限于,条件1)和2)中的至少一个时,可以确定被测水稻个体或其种子中具有Rf-1基因:

1)包括了相应于SEQ ID NO:27的第45461位碱基但不具有任何TaqI识别序列的区域;

2)包括了相应于SEQ ID NO:27的第49609位碱基但不具有任何BstUI识别序列的区域。

以SEQ ID NO:27的碱基序列为基础,并优选满足上述条件的情况下选择出合适的用于核酸扩增反应的引物对。优选地,使用具有选自SEQ IDNO:39和40、SEQ ID NO:41和42、SEQ ID NO:43和44、SEQ ID NO:45和46、SEQ ID NO:47和48、SEQ ID NO:49和50、SEQ ID NO:51和52、SEQID NO:53和54组成的引物对。更优选地,选择SEQ ID NO:45和46、SEQ IDNO:47和48组成的引物对。如果需要,上述引物对的序列中可包含取代、缺失或插入突变,但仍保持对多态性位点及其邻近区域的碱基序列的特异性结合,其也可以用作引物。

为了检验可产生限制性片段长度多态性的PCR产物,可用与PCR标记中识别位点相应的限制性内切酶进行切割。根据所使用限制性内切酶,可在合适的反应温度下温育数小时到1天来进行切割反应。用限制酶切割后的PCR扩增样品通过在约0.7%-2%琼脂糖凝胶或约3%MetaPhorTM琼脂糖凝胶上电泳来进行分析。进而例如通过溴化乙锭染色后于紫外光下进行观察。

本发明最优选的实施方式中,根据所使用的引物对,在表2中列出了凝胶上带型所反映的限制性内切酶切割模式。

                          表2

被检测出的条带大致大小(bp)

用P4497 MobI扩增(SEQ ID NO:39和40)

限制性酶MboI

被测水稻基因组具有Rf-1基因(纯合):          730

没有                            :          385,345

用P9493 BslI扩增(SEQ ID NO:41和42)

限制性酶BslI

被测水稻基因组具有Rf-1基因(纯合):          126

没有                            :          100,26

用P23945 MobI扩增(SEQ ID NO:43和44)

限制性酶MboI

被测水稻基因组具有Rf-1基因(纯合):          160,100

没有                            :          260

用P41030 TaqI扩增(SEQ ID NO:45和46)

限制性酶TaqI

被测水稻基因组具有Rf-1基因(纯合):          280

没有                            :          90,190

用P45177 BstUI扩增(SEQ ID NO:47和48)

限制性酶BstUI

被测水稻基因组具有Rf-1基因(纯合):          20,65,730

没有                            :          20,65,175,555

用B60304 MspI扩增(SEQ ID NO:49和50)

限制性酶MspI

被测水稻基因组具有Rf-1基因(纯合):          330

没有                            :          220,110

用B59066 BsaJI扩增(SEQ ID NO:51和52)

限制性酶BsaJI

被测水稻基因组具有Rf-1基因(纯合):          420

没有                            :          65,355

用B56691 XbaI扩增(SEQ ID NO:53和54)

限制性酶XbaI

被测水稻基因组具有Rf-1基因(纯合):          670

没有                            :          140,530

在下面的实施例3中,对于具有花粉育性的存在于Rf-1基因附近的重组体(RS1-RS2,RC1-RC8),利用14个多态性标记(包括上面描述的8对引物)检测了它们的Rf-1区域的染色体组织结构。结果,证实这些植株中均携带了来自籼稻品种的P9493 BslI和59066 BsaJI之间的Rf-1基因。这种结果表明具有如图3所示的染色体组织结构的重组体花粉具备育性,即Rf-1基因在这些花粉中发挥了功能作用。这表明在籼稻区域中的可确定Rf-1基因功能存在的序列包括在籼稻区域中,该区域在这些重组体花粉中是共同,即根据最大可能性来估计,包括在位点P4497 MboI和B56691 XbaI之间的区域(约65kb)中。

在本发明中,染色体步行是基于假设位点S12564 Tsp509I应当与Rf-1位点非常靠近,这可通过杂交产生的个体表现型频率来判断。事实上,根据本发明的高精度分离分析结果表明这两个位点的遗传距离约为0.04cM。在日本专利公开No.2000-139465中描述了被认为与Rf-1位点最紧密连锁的标记之一,离Rf-1位点约1cM。考虑到在水稻中,1cM平均相当于约300kb,如果从日本专利公开No.2000-139465中描述的标记开始进行染色体步行还需要相当长的时间来进一步定位Rf-1基因区域。

VI.通过抑制Rf-1基因的功能以恢复育性的方法

根据本发明,分离了具有育性恢复功能的包括了含有育性恢复基因(Rf-1)位点的核酸。测定了该核酸的全部碱基序列,因而可以通过遗传工程方法来控制Rf-1基因的育性恢复功能。因此,本发明进一步提供一种抑制Rf-1基因的功能以恢复育性的方法。

根据本发明的一个具体实施方式,抑制Rf-1基因的功能以恢复育性的方法包括:通过导入长度至少100个连续碱基的反义序列,其序列互补于具有恢复育性功能的SEQ ID NO.27或与SEQ ID NO.27的碱基序列有至少70%同一性。

在一个具体实施例中,根据本发明的抑制Rf-1基因的功能以恢复育性的方法包括:通过导入长度至少100个连续碱基的反义序列,且其序列选自互补于具有恢复育性功能的SEQ ID NO.27第38538-54123位,优选第42357-53743位,更优选第42132-48883位的碱基序列,或互补于与SEQ IDNO.27第38538-54123位,优选第42357-53743位,更优选第42132-48883位的碱基序列有至少70%同一性的碱基序列。

反义序列具有至少100个碱基或更长,更优选为500个碱基或更长,最优选为1000个碱基或更长。从导入方法的技术方便性来考虑,优选具有10000个碱基或更短,更优选为5000个碱基或更短。可用已知方法来合成反义序列。可利用已知的方法将反义序列导入到水稻中,如Terada等(Plant CellPhysical.2000 Jul,41(7),pp.881-888)所描述的方法。

也可以预期,Rf-1断裂(disrupt)系可从包含转座元件(例如,但不局限于,Tos17(Hirochika H.et al.1996,Proc.Natl.Acad.Sci.USA 93,pp.7783-7788))的不同变体系中筛选出在SEQ ID NO:27中具有转座元件的品系来获得。在植物中,对以同源重组来进行基因断裂已有研究。利用具有恢复育性功能的SEQ ID NO.27或与SEQ ID NO.27的碱基序列有至少70%同一性的核酸,可建立用Rf-1基因变体取代了Rf-1基因的品系,这样也可能以达到抑制育性恢复功能的目的。

参考文献

1.Fukuta et al.1992,Jpn J.Breed.42(supl.1)p.164-165.

2.Japanese Patent Public Disclosure No.HEI7(1995)-222588.

3.Japanese Patent Public Disclosure No.HEI9(1997)-313187.

4.Japanese Patent Public Disclosure No.2000-139465.

5.Harushima et al.1998,Genetics 148 p.479-494.

6.Michaels and Amasino 1998,The Plant Journal 14(3)p.381-385.

7.Neff et al.1998,The Plant Journal 14(3)p.387-392.

8.D.E.Harry,et al.,Theor Appl Genet(1998)97:p.327-336.

9.Hiei et al.,Plant Journal(1994),6(2),p.272-282.

10.Komari et al.,(1996)10,p.165-174.

11.Ditta et al.,Proc.Natl.Acad.Sci.USA(1980),77:p.7347-7351.

12.P.Vos et al.,Nucleic Acids Res.Vol.23,p.407-4414(1995).

13.O.Parnaud,X.et al,Mol.Gen.Genet.(1996)252:p.597-607.

14.A.Konieczny et al.,(1993),Plant J.4(2)p.403-410.

15.Edwards et al.,Nucleic Acids Res.8(6):1349,1991.

16.Murray M.G.et al.,Nucleic Acids Res.8(19):4321-4325,1980.

17.Terada et al.,Plant Cell Physiol.2000 Jul,41(7),p.881-888.

18.Hirochika H.et al.1996,Proc.Natl.Acad.Sci.USA,p.7783-7788.

实施例

下面通过实施例来进一步阐明本发明,但并不意欲限定本发明的范围。本领域技术人员可以容易地根据说明书的描述来对本发明进行改变或变化,但仍然包含在本发明技术范围内。

参考实施例

下面的参考实施例是根据我们先前的申请(日本专利申请No.2000-247204)中描述的方法而进行的。

参考实施例1  将Rf-1基因位点附近的RFLP标记转换为PCR标记

在这些参考例中,将Rf-1基因位点附近9个RFLP标记(R1877、G291、R2303、S12564、C1361、S10019、G4003、S10602、G1255)转换成了PCR标记。

(1)材料和方法

Rf-1基因位点附近9个RFLP标记即R1877、G291、R2303、S12564、C1361、S10019、G4003、S10602、G1255,购自于日本农林渔水产省农业生物资源研究所(the National Institute of Agrobiological Sciences,the Ministry ofAgriculture,Forestry and Fisheries of Japan)。确定载体中的插入碱基序列之后,按照以下步骤进行实验。此处所述的水稻品种,其中Asominori为粳稻品种,而IR24为籼稻品种。

(2)Asominori基因组文库的制备

按照CTAB法从Asominori的绿色叶子中提取总DNA。用MboI部分消化后,用NaCl密度梯度离心(6-20%线性梯度、20℃、37000rpm、4小时、总体积为12ml)对DNA进行分级。用每个级分部分(约0.5ml)进行电泳,收集和纯化含有15-20kb DNA的级分。以Lambda DASH II(Stratagene)为载体,按照产品所附方案来制备基因组文库。包装采用Giga Pack IIIGold(Stratagene)。包装后,添加500μl的SM缓冲液和20μl氯仿。离心并在上清液里加入20μl氯仿,作为文库溶液。

用已稀释50倍的文库溶液5μl,感染XL-1 Blue MRA(P2),结果得到83个噬菌斑。这相当于每个文库达到4.15×105pfu,假定平均插入片段的长度为20kb来计算,则这些噬菌斑共覆盖了8.3×109bp。因此可以认为这个文库相对于水稻基因组(4×108bp)而言包含了足够大小的片段。

(3)含有R1877-、C1361-和G4003-标记区的基因组克隆的分离

就C1361及G4003而言,分离含有RFLP标记探针的质粒,进行限制酶处理和电泳,以分离RFLP标记探针的部分;用DNA回收过滤器(TakaraSUPERC-01)回收所述目的DNA。对于R1877,需要设计特异于标记探针两末端的引物,用Asominori总DNA为模板进行PCR反应,电泳并用上述方法回收扩增产物。然后用Rediprime DNA标记系统(Amersham Pharmacia)标记回收的DNA,制备成用于文库筛选的探针。PCR反应可按常规方法进行(这也适合于下面的描述)。

将噬菌斑印迹到Hybond-N+(Amersham Pharmacia)上,再按照常规方法进行文库筛选。初步筛选后,分别挑取各个阳性噬菌斑区,并悬浮于SM缓冲液中,用于第二轮筛选。第二轮筛选后,挑取阳性噬菌斑区,进行第三轮筛选,分离单个噬菌斑。

将分离得到的目标噬菌斑悬浮于SM缓冲液后,噬菌体的初级增殖按照平板裂解法。通过震荡培养法对该噬菌体增殖液进行次级增殖,然后用Lambda starter试剂盒(QIAGEN)纯化噬菌体DNA。

对于每个标记,初筛时用8个平板进行,每个平板使用10μl文库溶液等分。经过初筛、第二次和第三次筛选,分离出与R1877、C1361及G4003相关的基因组克隆,分别得到4、3和3个克隆。

(4)将R1877转化成PCR标记

对分离到的基因组克隆进行分析,以鉴定出引起RFLP的位点,或EcoRI位点,其存在于IR24(籼稻)中而不存在Asominori(粳稻)中。将其转化成PCR标记。

具体来说,对分离到的4个克隆进行如下分析。首先,用T3和T7引物验证每个克隆中的插入片段两末端的碱基序列。接着,设计在标记探针的两末端向外延伸的引物。并与T3和T7引物组合而形成总共为4个引物的组合,以每个克隆为模板进行PCR反应。

作为一个独立的步骤,用NotI和EcoRI消化每个克隆,电泳后判断插入片段的大小和每个克隆中的EcoRI片段长度。

通过这些分析可以揭示每个克隆的相对位置。在RFLP分析中,已报道标记探针R1877在Nipponbare(粳稻)中可检测出20kb的EcoRI片段,在Kasalath(籼稻)中可检测出6.4kb的EcoRI片段(ftp://ftp.staff.or.jp/pub/geneticmap98/parentsouthen/chr10/R1877.JPG)。将该报道与上述分析结果总和起来分析,可以推定EcoRI位点存在于IR24中而不存在于Asominori中。因此,设计一种用以扩增邻近区域的引物组合(SEQ IDNO:1×SEQ ID NO:2),以进行基因组PCR,其参数是:94℃1分钟,58℃1分钟,72℃2分钟为1个循环,共30个循环以上。将所得PCR产物用EcoRI处理,并以0.7%琼脂糖凝胶进行电泳。

结果,在Asominori和IR24之间观察到了预期的多态性。对于IR24品种,用EcoRI处理PCR产物(约3200bp),得到1500bp和1700bp片段,但对于Asominori品种却不存在这种切割模式。利用Asominori-IR24的RIL(重组体近交系(Recombinant inbreed line))进行PCR标记作图,结果表明PCR标记与RFLP标记位点R1877处于相同的区域,因而确认了RFLP标记R1877已被转换成PCR标记,在本发明中称为R1877 EcoRI。

(5)将G4003转化成PCR标记

对分离到的基因组克隆进行分析,以鉴定出引起RFLP的位点,或HindIII位点,其存在于Asominori中而不存在IR24中。以将G4003转化成PCR标记。

与对R1877的分析方法相似,揭示分离到的3个克隆的相对位置。在RFLP分析中,已报道标记探针G4003在Nipponbare(粳稻)中可检测出3kb的HindIII片段,在Kasalath(籼稻水稻)中检测出的片段为10kb(ftp://ftp.staff.or.jp/pub/geneticmap98/parentsouthen/chr10/R1877.JPG)。将该报道与上述分析结果总和起来分析,可以暂时推测,Asominori中存在而IR24中不存在的HindIII位点应位于2个候选位置中的一个。设计一种可扩增邻近区域的引物组合(SEQ ID NO:3×SEQ ID NO:4),以进行基因组PCR,其参数是:94℃30秒,58℃30秒,72℃30秒为1个循环,共35个循环以上。将所得PCR产物用HindIII处理,并以2%琼脂糖凝胶进行电泳。结果发现在标记探针内部的HindIII位点显示出多态性。对于Asominori而言,用HindIII消化PCR产物(362bp)可得到95bp和267bp片段,但对于IR24而言没有这种切割模式。作图结果表明,RFLP标记G4003被转换成了PCR标记,本发明将其命名为G4003 HindIII(SEQ ID NO:19)。

(6)将C1361转化成PCR标记

依据分离到的基因组克隆的碱基序列信息来设计引物。并以Asominori和IR24的总DNA为模板进行PCR反应,电泳后,用已知的方法回收PCR产物。以回收的DNA作模板,用ABI Model 310分析了各个水稻品种的碱基序列,以找出可引起多态性的变异。

与分析R1877一样,建立了分离到的3个克隆大致的相对位置。但发现,很难在C1361标记附近区域进行PCR扩增或确定其碱基序列,因而很难鉴定出引起RFLP的位点。因此,发明人注意到能够产生相对较长的PCR产物(2.7kb)的区域,并尝试创建dCAPS标记。

具体来说,采用Asominori和Koshihikari(都是粳稻水稻)以及Kasalath和IR24(均为籼稻水稻),比较了所述区域的基因组PCR产物的碱基序列,在粳稻品种和籼稻品种之间发现了6个位点显示有多态性。其中的一个位点用于创建dCAPS标记。为此,用SEQ ID NO:5和SEQ ID NO:6作引物进行PCR,即以94℃30秒,58℃30秒,72℃30秒为1个循环,共35个循环以上为参数。将所得PCR产物用MwoI处理,再用3%MetaPhorTM琼脂糖凝胶电泳进行分析。结果发现,对于Asominori而言,在2位点处被切割,得到约25bp、50bp、79bp的三个电泳条带,但对于IR24,只在1位点处进行了切割,得到约50bp、107bp的两个电泳条带。作图分析表明,RFLP标记C1361被转换成了PCR标记,在本发明中命名为C1361 MwoI(SEQ ID NO:20)。

(7)将G2155转化为PCR标记

根据标记探针的两末端设计特异引物,并以Asominori、Koshihikari、IR24或IL216(该品系是通过回交而将Rf-1基因引入到Koshihikari中而建立的;其基因型为Rf-1/Rf-1)的总DNA为模板进行PCR。根据上面已经描述的方法,纯化所得到的PCR产物并找出对于限制性片段长度多态性有用的突变。

具体来说,比较被测品种之间相应区域的碱基序列,在具有Rf-1基因的品种/品系(IR24及IL216)和没有Rf-1基因的品种(Asominori及Koshihikari)之间发现3位点突变。其中的1处突变被用于创建dCAPS标记。为此,用SEQ ID NO:7和SEQ ID NO:8作引物,以94℃30秒,58℃30秒,72℃30秒为1循环,共35个循环以上为参数进行PCR反应。将所得PCR产物用MwoI处理,再用3%MetaPhorTM琼脂糖凝胶电泳进行分析。对于Asominori,有1个切割位点,得到约25bp、105bp的两个观察到电泳条带;对于IR24,有2个切割位点,得到约25bp、27bp、78bp的三个可观察电泳条带。图谱分析表明,RFLP标记G2155被转换成了PCR标记,在本发明中命名为G2155MwoI(SEQ ID NO:21)。

(8)将G291转换成PCR标记

设计特异于标记探针内部序列的引物,并将各种引物组合起来进行PCR反应,以找到一种引物组合而能够产生预期大小的扩增产物。利用该选择出的引物组合,以Asominori、Koshihikari、IR24及IL216的总DNA为模板进行PCR反应。按前面已描述的方法纯化所得到的PCR产物并找出对于限制性片段长度多态性有用的变异。

具体而言,用特异于标记探针序列的引物,本发明人对被测的每一个品种进行了基因组PCR反应,并比较扩增产物的碱基序列。结果发现,具有Rf-1基因的品种/品系(IR24及IL216)和没有Rf-1基因的品种(Asominori及Koshihikari)之间发现4处位点的突变。其中的1处突变被用于创建dCAPS标记。为此,用SEQ ID NO:9和SEQ ID NO:10作引物,以94℃30秒,58℃30秒,72℃30秒为1循环,共35个循环以上为参数进行PCR反应。将所得PCR产物用MspI处理,再以3%MetaPhorTM琼脂糖凝胶电泳进行分析。对于具有Rf-1基因的品种/品系,有2个切割位点,得到约25bp、49bp、55bp的三个可观察的电泳条带;但对于不具有Rf-1基因的品种,只有1个切割位点,得到约25bp、104bp的两个可观察的电泳条带。图谱分析表明,RFLP标记G2155被转换成了PCR标记,在本发明中命名为G291 MspI(SEQ IDNO:22)。

(9)将R2303转化成PCR标记

设计特异于标记探针内部序列的引物,以Asominori(粳稻)、IR24及Kasalath(籼稻)的总DNA为模板进行PCR反应。按前面已描述的方法纯化所得到的PCR产物并找出对于限制性片段长度多态性有用的突变。

比较被测品种之间相应区域的碱基序列,结果发现在粳稻品种和籼稻品种之间存在突变。由于该突变出现在BslI识别位点,因而直接用作产生CAPS标记。为此,用SEQ ID NO:11和SEQ ID NO:12作引物,以94℃1分钟,58℃1分钟,72℃2分钟为1循环,共30个循环以上为参数进行PCR反应。将所得PCR产物用BslI处理,以2%琼脂糖凝胶电泳进行分析。在粳稻品种中有1个切割位点,可观察到约238bp、1334bp的两个电泳条带,而在籼稻品种中有2个切割位点,可观察到约238bp、655bp、679bp的三个电泳条带。图谱分析证明,RFLP标记G2303已被转换成PCR标记,在本发明中命名为G2303 BslI(SEQ ID NO:23)。

(10)将S10019转化成PCR标记

按照第(9)中的将R2302转换成PCR标记的方法来将S10019转化成PCR标记。

比较被测品种之间相应区域的碱基序列,结果发现在粳稻品种和籼稻品种之间存在突变。由于该突变出现在BstUI识别位点,因而直接用作产生CAPS标记。为此,用SEQ ID NO:13和SEQ ID NO:14作引物,以94℃1分钟,58℃1分钟,72℃1分钟为1循环,共30个循环以上为参数进行PCR反应。将所得PCR产物用BstUI处理,以2%琼脂糖凝胶电泳进行分析。在粳稻品种中有1个切割位点,可观察到约130bp、462bp的两个电泳条带,而在籼稻品种中有2个切割位点,可观察到约130bp、218bp、244bp的三个电泳条带。图谱分析证明,RFLP标记S10019已被转换成PCR标记,在本发明中命名为S10019 BstUI(SEQ ID NO:24)。

(11)将S10602转化成为PCR标记

按照第(9)中的将R2302转换成PCR标记的方法来将S10602转换成PCR标记。

比较被测品种之间相应区域的碱基序列,结果发现在粳稻品种和籼稻品种之间存在突变。该突变用作创建CAPS标记。为此,用SEQ ID NO:15和SEQ ID NO:16作引物,以94℃1分钟,58℃1分钟,72℃1分钟为1循环,共33个循环以上为参数进行PCR反应。将所得PCR产物用KpnI处理,以2%琼脂糖凝胶电泳进行分析。在粳稻品种中有1个切割位点,可观察到约117bp、607bp的两个电泳条带,而在籼稻品种中没有切割位点,只可观察到724bp的电泳条带。图谱分析证明,RFLP标记S10602已被转换成PCR标记,在本发明中命名为S10602 KpnI(SEQ ID NO:25)。

(12)将S12564转化成PCR标记

按照第(9)中的将R2302转换成PCR标记的方法来将S12564转换成PCR标记。

具体地,比较被测品种之间相应区域的碱基序列,结果发现在粳稻品种和籼稻品种之间存在突变。由于该突变出现在BstUI识别位点,因而直接用作创建dCAPS标记。为此,用SEQ ID NO:17和SEQ ID NO:18作引物,以94℃30秒,58℃30秒,72℃30秒为1循环,共35个循环以上为参数进行PCR反应。将所得PCR产物用Tsp509I处理,以3%琼脂糖凝胶电泳进行分析。在粳稻品种中有2个切割位点,可观察到约26bp、41bp、91bp的三个电泳条带,而在籼稻品种中有1个切割位点,可观察到约41bp、117bp的两个电泳条带。图谱分析证明,RFLP标记S12564已被转换成PCR标记,在本发明中命名为S12564 Tsp509I(SEQ ID NO:26)。

参考实施例2  Rf-1基因位点的基因图谱

用BT型雄性不育细胞质取代Koshihikari的细胞质而制备得到MSKoshihikari(BC10F1代)。MS-FR Koshihikari是由此而创建的品系,将源于IR8(由National Institute of Agrobiological Sciences提供)的Rf-1基因导入到MS Koshihikari(Rf-1基因位点是杂合的)。用MS-FR Koshihikari的花粉对MS Koshihikari授粉产生的F1代群体,从F1代的1042株幼苗中提取DNA,以供试验分析之用。

首先,分析每一个体中被认为位于参考实施例1中所述2个标记位点即R1877 EcoRI和G2155 MwoI(其推测位于Rf-1基因座的相对侧)之间的Rf-1基因的基因型。在R1877 EcoRI位点或G2155 MwoI位点上,粳稻为纯合体则被认为在这两个标记位点之间是重组体。接着,对每个重组体,研究其在G291 MspI、R2303 BslI、S12564 Tsp509I、C1361 MwoI、S10019 BstUI、G4003HindIII、S10602 KpnI位点的基因型,并鉴定发生重组的位置。

对R1877 EcoRI和G2155 MwoI位点的基因型的研究结果表明,46个个体在Rf-1基因位点附近发生重组。分析在Rf-1基因位点附近的标记基因位点的基因型,结果如表3所示。

表3  Rf-1基因位点附近的重组体个体中的标记位点基因型

基因座          1    2    3    4    5    6    7    8    9    10   11   12   13   14   15   16   17   18   19   20   21   22   23

R1877 EcoRI     J    J    J    J    J    J    J    J    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H

G291 MspI       H    J    J    J    J    J    J    J    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H

R2303 BslI      H    H    J    J    J    J    J    J    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H

S12564 Tsp509I  H    H    H    H    H    H    H    J    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H

C1361 MwoI      H    H    H    H    H    H    H    H    J    J    H    H    H    H    H    H    H    H    H    H    H    H    H

S10019 BstUI    H    H    H    H    H    H    H    H    J    J    J    J    J    J    J    J    H    H    H    H    H    H    H

G4003 HindIII   H    H    H    H    H    H    H    H    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J

S10602 KpnI     H    H    H    H    H    H    H    H    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J

G2155 MwoI      H    H    H    H    H    H    H    H    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J

               24    25   26   27   28   29   30   31   32   33   34   35   36   37   38   39   40   41   42   43   44   45   46

                H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H

                H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H

                H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H

                H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H

                H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H

                H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H    H

                J    J    J    J    J    J    J    J    J    H    H    H    H    H    H    H    H    H    H    H    H    H    H

                J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    H    H

                J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J    J

J:纯合Koshihikari型

H:杂合Koshihikari型/MS-FR Koshihikari型

如表3中所示,获得的重组体8在S12564 Tsp509I标记位点、重组体9和10在C1361 MwoI标记位点对于粳稻是纯合。所有这些重组体均恢复了育性,前者可认为重组位于Rf-1和S12564 Tsp509I位点之间而后者则认为重组是在Rf-1和C1361 MwoI位点之间,这表明Rf-1基因位于S12564Tsp509I和C1361 MwoI之间。有报告指出,在上述杂交中的具有BT型胞质雄性不育的个体中,只有携带了Rf-1基因的花粉是可育的(C.Shinjyo,JAPAN.J.GENETICS Vol.44,No.3:149-156(1969)),根据该报道Rf-1基因位点可在更详细的连锁图谱上进行定位(图4)。

实施例1:获得靠近Rf-1位点的重组体

(材料和方法)

用MS-FR Koshihikari(BC9F1代,在Rf-1基因位点是杂合的)的花粉对MS Koshihikari(BC10F1代)进行授粉产生了由4103个个体组成的BC10F1群体,在S12564 Tsp509I和C1361 MwoI位点的基因型与参考实施例2中描述的相同。其中,在S12564 Tsp509I位点纯合的Koshihikari个体,被认为是由于在Rf-1和S12564 Tsp509I之间发生重组所致,而在C1361 MwoI位点基因纯合的Koshihikari个体,被认为是由于在Rf-1和C1361 MwoI之间发生重组所致。从这4103个个体的每一个体中提取DNA。

(结果和讨论)

在这4103个个体中,发现了1个在Rf-1和S12564 Tsp509I之间发生重组的重组体和6个在Rf-1和C1361 MwoI之间发生重组的重组体。在上述参考实施例2中,如表3所示,已从1042个个体中获得了1个在Rf-1和S12564Tsp509I之间发生重组的重组体和2个在Rf-1和C1361 MwoI之间发生重组的重组个体。

因此从总数为5145个个体中总共获得了2个在Rf-1和S12564 Tsp509I之间发生重组的重组体和8个在Rf-1和C1361 MwoI之间发生重组的重组体。在下面的实施例中对这10个个体进行高精度分离分析。

实施例2染色体步行

(1)第一次染色体步行

(材料和方法)

按照参考实施例1所述方法,用Lambda DASH II载体构建了Asominori粳稻(不携带Rf-1)的基因组DNA的基因组文库,并用染色体步行进行检测。

按常规方法,利用Asominori的总DNA为模板,及下述引物对进行PCR反应:

5′-atcaggagccttcaaattgggaac-3′(SEQ ID NO:29)和

5′-ctcgcaaattgcttaattttgacc-3′(SEQ ID NO:30)

其中这两条引物是按照RFLP探针S12564的部分碱基序列(AccessionNo.D47284)设计的。琼脂糖凝胶电泳显示扩增产物约1200bp,用QIAEXII(QIAGEN)进行纯化。用Rediprime DNA标记系统(Amersham Pharmacia)对纯化DNA进行标记,而形成了文库筛选探针(探针A,图1)。

在噬菌斑印迹到Hybond-M+(Amersham Pharmacia)上之后对文库进行常规筛选。通过平板裂解法用Lambda Midi试剂盒(QIAGEN)纯化噬菌体DNA,分离单个的噬菌斑。

(结果和讨论)

末端碱基序列分析和限制酶片断长度分析结果表明筛选得到的4个克隆中的两个克隆(WSA1和WSA3)具有如图1所示的相对位置关系。通过引物步行(DNA Sequencer377,ABI)测定与WSA1和WSA3相应的Asominori基因组碱基序列。

(2)第二次染色体步行

除了上述的Asominori基因组文库外,还类似地自籼稻品种IR24(携带Rf-1)基因组DNA构建了IR24基因组文库,用染色体步行进行分析。

按常规方法,利用WSA3的DNA为模板,及下述引物对进行PCR反应:

5′-tgaaggagttatgggtgcgtgacg-3′(SEQ ID NO:31)和

5′-ttgccgagcacacttgccatgtgc-3′(SEQ ID NO:32)

其中这两条引物是按照(1)中确定的Asominori基因组碱基序列来设计的。将所得524bp扩增产物进行纯化,并用上面描述的方法对其进行标记,而形成了文库筛选探针(探针E,图1)。

文库筛选和噬菌体DNA的纯化按上面描述的方法进行。

(结果和讨论)

末端碱基序列分析和限制酶片断长度分析结果表明通过筛选Asominori基因组文库而得到的15个克隆中的1个克隆(WSE8)具有如图1所示的相对位置关系。与WSE8相应的Asominori基因组碱基序列通过引物步行进行测定。

末端碱基序列分析和限制酶片断长度分析结果表明通过筛选IR24基因组文库而得到的7个克隆中的2个克隆(XSE1和XSE7)具有如图1所示的相对位置关系。与XSE1和XSE7相应的IR24基因组碱基序列通过引物步行进行测定。

(3)第三次染色体步行

(材料和方法)

上述的Asominori基因组文库和IR24基因组文库用染色体步行进行分析。

按常规方法,利用WSE8的DNA为模板,及下述引物对进行PCR反应:

5′-gcgacgcaatggacatagtgctcc-3′(SEQ ID NO:33)和

5′-ttacctgccaagcaatatccatcg-3′(SEQ ID NO:34)

其中这两条引物是按照(2)中确定的Asominori基因组碱基序列来设计的。纯化获得的扩增产物约1159bp,并用上面描述的方法对其进行标记,而形成了文库筛选探针(探针F,图1)。

文库筛选和噬菌体DNA的纯化按上面描述的方法进行。

(结果和讨论)

末端碱基序列分析和RFLP分析结果表明筛选Asominori基因组文库而得到的8个克隆中的2个克隆(WSF5和WSF7)具有如图1所示的相对位置关系。与WSF5和WSF7相应的Asominori基因组碱基序列通过引物步行进行测定。

末端碱基序列分析和RFLP分析结果表明通过筛选IR24基因组文库而得到的13个克隆中的2个克隆(XSF4和XSF20)具有如图1所示的相对位置关系。与XSF4和XSF20相应的IR24基因组碱基序列通过引物步行进行测定。

(4)第四次染色体步行

上述的Asominori基因组文库和IR24基因组文库用染色体步行进行分析。

按常规方法,利用WSF7的DNA为模板,及下述引物对进行PCR反应:

5′-aaggcatactcagtggagggcaag-3′(SEQ ID NO:35)和

5′-ttaacctgaccgcaagcacctgtc-3′(SEQ ID NO:36)

其中这两条引物是按照(3)中确定的Asominori基因组碱基序列来设计的。纯化获得的扩增产物约456bp,并用上面描述的方法对其进行标记,而形成了文库筛选探针(探针G,图1)。

文库筛选和噬菌体DNA的纯化按上面描述的方法进行。

(结果和讨论)

末端碱基序列分析和RFLP分析结果表明通过筛选Asominori基因组文库而得到的6个克隆中的2个克隆(WSG2和WSG6)具有如图1所示的相对位置关系。与WSG2和WSG6相应的Asominori基因组碱基序列通过引物步行进行测定。

末端碱基序列分析和RFLP分析结果表明通过筛选IR24基因组文库而得到的14个克隆中的3个克隆(XSG8、XSG16和XSG22)具有如图1所示的相对位置关系。与XSG8、XSG16和XSG22相应的IR24基因组碱基序列通过引物步行进行测定。

(5)第五次染色体步行

上述的IR24基因组文库用染色体步行进行分析。

我们详细浏览了TIGR(The Institute for Genomic Research)公共网址,发现在GenBank中已经登记保藏包含RFLP标记S12564的BAC克隆(细菌人工染色体)(Accession NO.AC068923)。该BAC克隆包含Nipponbare粳稻的基因组DNA,经序列比较显示完全包括了在(1)-(4)中制备得到的Asominori和IR24的重叠区域(contig regions)。

因此,按常规方法,利用IR24的总DNA为模板,及下述引物对进行PCR反应:

5′-tggatggactatgtggggtcagtc-3′(SEQ ID NO:37)和

5′-agtggaagtggagagagtagggag-3′(SEQ ID NO:38)

其中这两条引物被设计用于扩增该BAC克隆的部分序列。纯化获得的扩增产物约600bp,并用上面描述的方法对其进行标记,而形成了文库筛选探针(探针H,图1)。

文库筛选和噬菌体DNA的纯化按上面描述的方法进行。

(结果和讨论)

末端碱基序列分析和RFLP分析结果表明在筛选Asominori基因组文库而得到的15个克隆中的1个(XSH18)具有如图1所示的相对位置关系。与XSH18相应的IR24基因组碱基序列通过引物步行进行测定。

实施例3:高精度分离分析

(1)PCR标记P4497 MboI的确立

将实施例2中所确定的IR24重叠区(SEQ ID NO:27)相应的基因组碱基序列与Asominori重叠区(SEQ ID NO:28)相应的基因组碱基序列进行比较,发现SEQ ID NO:27的第1239位碱基是A,而相应该位置的SEQ ID NO:28的第12631位碱基是G。

为了检测该碱基的变化,首先利用下述引物通过PCR反应扩增所述碱基位置的附近区域,得到片段约730bp:

P4497 MboI F:

5′-ccctccaacacataaatggttgag-3′(SEQ ID NO:39)

(相应于SEQ ID NO:27的第853-876位碱基)

(相应于SEQ ID NO:28的第12247-12270位碱基)

P4497 MboI R:

5′-tttctgccaggaaactgttagatg-3′(SEQ ID NO:40)

(相应于SEQ ID NO:27的第1583-1560位碱基)

(相应于SEQ ID NO:28的第12975-12952位碱基)

用MboI处理扩增产物,通过琼脂糖凝胶电泳进行观察。这样,所述变化通过在琼脂糖凝胶电泳中泳动的差别来显示,这是因为从Asominori DNA扩增到的扩增产物中具有MboI识别位点(GATC)而能被MboI所切割,而从IR24 DNA扩增到的产物不具有MboI识别位点而不能被切割,这就导致了用MboI消化后的DNA片段长度存在差异。

(2)PCR标记P9493 BslI的确立

将实施例2中所确定的IR24重叠区(SEQ ID NO:27)相应的基因组碱基序列与Asominori重叠区(SEQ ID NO:28)相应的基因组碱基序列进行比较,发现SEQ ID NO:27的第6227位碱基是A,而相应位置的SEQ ID NO:28的第17627位碱基是C。

为了检测该碱基的变化,首先利用下述引物通过PCR反应扩增所述碱基位置的附近区域,得到片段约126bp:

P9493 BslI F:

5′-gcgatcttatacgcatactatgcg-3′(SEQ ID NO:41)

(相应于SEQ ID NO:27的第6129-6152位碱基)

(相应于SEQ ID NO:28的第17529-17552位碱基)

P9493 BslI R:

5′-aaagtctttgttccttcaccaagg-3′(SEQ ID NO:42)

(相应于SEQ ID NO:27的第6254-6231位碱基)

(相应于SEQ ID NO:28的第17654-17631位碱基)

用BslI处理扩增产物,通过琼脂糖凝胶电泳进行观察。这样,所述变化通过在琼脂糖凝胶电泳中泳动的差别来显示,这是因为从Asominori DNA扩增到的扩增产物中具有BslI识别位点(CCNNNNNNNGG)而能被BslI所切割,而从IR24 DNA扩增到的产物不具有BslI识别位点而不能被切割,这就导致了用BslI消化后的DNA片段长度存在差异。

该标记的建立适用于dCAPS方法(Michaels and Amasino 1998,Neff etal.,1998)。具体地说,通过利用上述P9493 BslI R引物而在SEQ ID NO:27的第6236位和SEQ ID NO:28的第17636位碱基处,用g取代a。因此,Asominori DNA中的片段在SEQ ID NO:28的第17626-17636位碱基序列变成CCtttccttGG,而可以被BslI所切割。

(3)PCR标记P23945 MboI的建立

将实施例2中所确定的IR24重叠区(SEQ ID NO:27)相应的基因组碱基序列与Asominori重叠区(SEQ ID NO:28)相应的基因组碱基序列进行比较,发现SEQ ID NO:27的第20680位碱基是G,而相应位置的SEQ ID NO:28的第32079位碱基是A。

为了检测该碱基的变化,首先利用下述引物通过PCR反应扩增所述碱基位置的附近区域,得到片段约260bp:

P23945 MboI F:

5′-gaggatttatcaaaacaggatggacg-3′(SEQ ID NO:43)

(相应于SEQ ID NO:27的第20519-20544位碱基)

(相应于SEQ ID NO:28的第31918-31943位碱基)

P23945 MboI R:

5′-tgggcggcagcagtggaggataga-3′(SEQ ID NO:44)

(相应于SEQ ID NO:27的第20778-20755位碱基)

(相应于SEQ ID NO:28的第32177-32154位碱基)

用MboI处理扩增产物,通过琼脂糖凝胶电泳进行观察。这样,所述变化通过在琼脂糖凝胶电泳中泳动的差别来显示,这是因为从IR24 DNA扩增到的扩增产物中具有MboI识别位点(GATC)而能被MboI所切割,而从Asominori DNA扩增到的产物不具有MboI识别位点而不能被切割,这就导致了用MboI处理后的DNA片段长度存在差异。

(4)PCR标记P41030 TaqI的确立

将实施例2中所确定的IR24重叠区(SEQ ID NO:27)相应的基因组碱基序列与Asominori重叠区(SEQ ID NO:28)相应的基因组碱基序列进行比较,发现SEQ ID NO:27的第45461位碱基是A,而相应的SEQ ID NO:28的第49164位碱基是G。

为了检测该碱基的变化,首先利用下述引物通过PCR反应扩增所述碱基位置的附近区域,得到片段约280bp:

P41030 TaqI F:

5′-aagaagggagggttatagaatctg-3′(SEQ ID NO:45)

(相应于SEQ ID NO:27的第45369-45392位碱基)

(相应于SEQ ID NO:28的第49072-49095位碱基)

P41030 TaqI R:

5′-atatcaggactaacaccactgctc-3′(SEQ ID NO:46)

(相应于SEQ ID NO:27的第45468-45625位碱基)

(相应于SEQ ID NO:28的第49351-49328位碱基)

用TaqI处理扩增产物,通过琼脂糖凝胶电泳进行观察。这样,所述变化通过在琼脂糖凝胶电泳中泳动的差别来显示,这是因为从Asominori DNA扩增到的扩增产物中具有TaqI识别位点(TCGA)而能被TaqI所切割,而从IR24 DNA扩增到的产物不具有TaqI识别位点而不能被切割,这就导致了用TaqI消化后的DNA片段长度存在差异。

(5)PCR标记P45177 BstUI的建立

将实施例2中所确定的IR24重叠区(SEQ ID NO:27)相应的基因组碱基序列与Asominori重叠区(SEQ ID NO:28)相应的基因组碱基序列进行比较,发现SEQ ID NO:27的第49609位碱基是A,而相应的SEQ ID NO:28的第53311位碱基是G。

为了检测该碱基的变化,首先利用下述引物通过PCR反应扩增所述碱基位置的附近区域,得到片段约812bp:

P45177 BstUI F:

5′-acgagtagtagcgatcttccagcg-3′(SEQ ID NO:47)

(相应于SEQ ID NO:27的第49355-49378位碱基)

(相应于SEQ ID NO:28的第53057-53080位碱基)

P45177 BstUI R:

5′-cagcgtgaaactaaaaacggaggc-3′(SEQ ID NO:48)

(相应于SEQ ID NO:27的第50166-50143位碱基)

(相应于SEQ ID NO:28的第53868-53845位碱基)

用BstUI处理扩增产物,通过琼脂糖凝胶电泳进行观察。这样,所述变化通过在琼脂糖凝胶电泳中泳动的差别来显示,这是因为从IR24 DNA扩增到的扩增产物中具有2个BstUI识别位点(CGCG)而被BstUI切割成3个片段,而从Asominori DNA扩增到的产物具有3个BstUI识别位点而被切割成4个片段,这就导致了用BstUI消化后的DNA片段长度存在差异。

(6)PCR标记B60304 MspI的建立

将实施例2中所确定的IR24重叠区(SEQ ID NO:27)相应的基因组碱基序列与上述的BAC克隆碱基序列(Accession No.AC068923)进行比较,发现SEQ ID NO:27的第56368位碱基是T,而在AC068923中相应位置的碱基是C。

为了检测该碱基的变化,首先利用下述引物通过PCR反应扩增所述碱基位置的附近区域,得到片段约330bp:

B60304 MspI F:

5′-atcccacatcatcataatccgacc-3′(SEQ ID NO:49)

(相应于SEQ ID NO:27的第56149-56172位碱基)

B60304 MspI R:

5′-agcttctcccttggatacggtggcg-3′(SEQ ID NO:50)

(相应于SEQ ID NO:27的第56479-56455位碱基)

用MspI处理扩增产物,通过琼脂糖凝胶电泳进行观察。这样,所述变化通过在琼脂糖凝胶电泳中泳动的差别来显示,这是因为从Nipponbare DNA扩增到的扩增产物中具有MspI识别位点(CCGG)而能被MspI所切割,而从IR24 DNA扩增到的产物不具有MspI识别位点而不能被切割,这就导致了用MspI消化后的DNA片段长度存在差异。

该标记的建立适用于dCAPS方法(Michaels and Amasino 1998,Neff etal.,1998)。具体地说,通过利用上述的B60304 MspI R引物在SEQ ID NO:27的第56460位用t取代g。结果,SEQ ID NO:27的第56460-56463位的MspI识别序列CCGG变成了ccgt,而不能被MspI所切割。这样,由于IR24的片段不具有MspI识别序列,而Nipponbare的DNA中与SEQ IDNO:27的第56367-56370位碱基相应的区域中具有一个MspI识别序列。

(7)PCR标记B59066 BsaJI的建立

将实施例2中所确定的IR24重叠区(SEQ ID NO:27)相应的基因组碱基序列与上述的BAC克隆碱基序列(Accession No.AC068923)进行比较,发现SEQ ID NO:27的第57629位碱基是C,而在AC068923中相应位置的碱基是CC。

为了检测该碱基的变化,首先利用下述引物通过PCR反应扩增所述碱基位置的附近区域,得到片段约420bp:

B59066 BsaJI F:

5′-atttgttggttagttgcggctgag-3′(SEQ ID NO:51)

(相应于SEQ ID NO:27的第57563-57586位碱基)

B59066 BsaJI R:

5′-gcccaaactcaaaaggagagaacc-3′(SEQ ID NO:52)

(相应于SEQ ID NO:27的第57983-57960位碱基)

用BsaJI处理扩增产物,通过琼脂糖凝胶电泳进行观察。这样,所述变化通过在琼脂糖凝胶电泳中泳动的差别来显示,这是因为从Nipponbare DNA扩增到的扩增产物中具有BsaJI识别位点(CCNNGG)而能被BsaJI所切割,而从IR24 DNA扩增到的产物不具有BsaJI识别位点而不能被切割,这就导致了用BsaJI消化后的DNA片段长度存在差异。

(8)PCR标记B56691 XbaI的建立

将实施例2中所确定的IR24重叠区(SEQ ID NO:27)相应的基因组碱基序列与上述的BAC克隆碱基序列(Accession No.AC068923)进行比较,发现SEQ ID NO:27的第66267位碱基是G,而在AC068923中相应位置的碱基是C。

为了检测该碱基的变化,首先利用下述引物通过PCR反应扩增所述碱基位置的附近区域,得到片段约670bp:

B56691 XbaI F:

5′-cctcaagtctcccctaaagccact-3′(SEQ ID NO:53)

(相应于SEQ ID NO:27的第66129-66152位碱基)

B56691 XbaI R:

5′-gctctactgctgataaaccgtgag-3′(SEQ ID NO:54)

(相应于SEQ ID NO:27的第66799-66776位碱基)

用XbaI处理扩增产物,通过琼脂糖凝胶电泳进行观察。这样,所述变化通过在琼脂糖凝胶电泳中泳动的差别来显示,这是因为从Nipponbare DNA扩增到的扩增产物中具有XbaI识别位点(TCTAGA)而能被XbaI所切割,而从IR24 DNA扩增到的产物不具有XbaI识别位点而不能被切割,这就导致了用XbaI消化后的DNA片段长度存在差异。

(9)PCR标记B53627 BstZ17I的建立

将实施例2中所确定的IR24重叠区(SEQ ID NO:27)相应的基因组碱基序列与上述的BAC克隆碱基序列(Accession No.AC068923)进行比较,发现SEQ ID NO:27的第69331位碱基是T,而在AC068923中相应位置的碱基是C。

为了检测该碱基的变化,首先利用下述引物通过PCR反应扩增所述碱基位置的附近区域,得到片段约620bp:

B53627 BstZ17I F:

5′-tggatggactatgtggggtcagtc-3′(SEQ ID NO:55)

(相应于SEQ ID NO:27的第68965-68988位碱基)

B53627 BstZ17I R:

5′-agtggaagtggagagagtagggag-3′(SEQ ID NO:56)

(相应于SEQ ID NO:27的第69582-69559位碱基)

用BstZ17I处理扩增产物,通过琼脂糖凝胶电泳进行观察。这样,所述变化通过在琼脂糖凝胶电泳中泳动的差别来显示,这是因为从IR24 DNA扩增到的扩增产物中具有BstZ17I识别位点(TCTAGA)而能被BstZ17I所切割,而从Nipponbare DNA扩增到的产物不具有BstZ17I识别位点而不能被切割,这就导致了用BstZ17I消化后的DNA片段长度存在差异。

(10)PCR标记B40936 MseI的建立

下述PCR标记(10)-(12)的建立需要分析相应于SEQ ID NO:27 3′末端第76363位碱基的进一步下游区(3′)的碱基序列。

下述引物对是按上述BAC克隆(Accession No.AC068923)的碱基序列来设计的。

5′-tacgacgccatttcactccattgc-3′(SEQ ID NO:57)和

5′-catttctctatgggcgttgctctg-3′(SEQ ID NO:58)

利用这对引物以MS-FR Koshihikari(在Rf-1位点的基因型Rf-1 Rf-1)和Koshihikari的总DNA为模板以常规方法进行PCR反应。所得到的扩增产物经琼脂糖电泳表明大小约1300bp,并用QIAEXII(QIAGEN)进行纯化。用DNA测序仪377(ABI)对纯化DNA的碱基序列进行测序,显示出数个多态性位点。

通过对所述位置周围进行PCR扩增可以检测到其中一个多态性位点,所用引物:

B40936 MseI F:

5′-acctgtaggtatggcaccttcaacac-3′(SEQ ID NO:59)和

B40936 MseI R:

5′-ccaaggaacgaagttcaaatgtatgg-3′(SEQ ID NO:60)

用MseI处理扩增产物,通过琼脂糖凝胶电泳进行观察。这样,所述变化通过在琼脂糖凝胶电泳中泳动距离的差别来显示,这是因为从MS-FRKoshihikari(Rf-1 Rf-1)的DNA扩增到的扩增产物中具有MseI识别位点(TTAA)而能被MseI所切割,而从Koshihikari的DNA扩增到的产物不具有MseI识别位点而不能被切割,这就导致了用MseI消化后的DNA片段长度存在差异。

该标记通过利用dCAPs方法得以确立。

(11)PCR标记B19839 MwoI的建立

下述引物对是按上述BAC克隆(Accession No.AC068923)的碱基序列来设计的。

5′-tgatgtgtttgggcatccctttcg-3′(SEQ ID NO:61)和

5′-gagataggggacgacagacacgac-3′(SEQ ID NO:62)

利用这对引物以MS-FR Koshihikari(在Rf-1位点的基因型:Rf-1 Rf-1)和Koshihikari总DNA为模板以常规方法进行PCR反应。所得到的扩增产物经琼脂糖电泳表明大小约1200bp,并用QIAEXII(QIAGEN)进行纯化。用DNA测序仪377(ABI)对纯化DNA的碱基序列进行测序,显示出数个多态性位点。

通过对所述位置附近进行PCR扩增,可以检测到其中一个多态性位点,所用引物:

B19839 MwoI F:

5′-tcctaggctgtttagaaactgcaca-3′(SEQ ID NO:63)和

B19839 MwoI R:

5′-caagttcaaacataactggcgttg-3′(SEQ ID NO:64)

用MwoI处理扩增产物,通过琼脂糖凝胶电泳进行观察。这样,所述变化通过在琼脂糖凝胶电泳中泳动的差别来显示,这是因为从的KoshihikariDNA扩增到的扩增产物中具有MwoI识别位点(GCNNNNNNNGC)而能被MwoI所切割,而从MS-FR Koshihikari(Rf-1 Rf-1)的DNA扩增到的产物不具有MwoI识别位点而不能被切割,这就导致了用MwoI消化后的DNA片段长度存在差异。

该标记通过dCAPS方法来创建。

(12)PCR标记B2387 BfaI的建立

下述引物对是按上述BAC克隆(Accession No.AC068923)的碱基序列来设计的。

5′-cactgtcctgtaagtgtgctgtgc-3′(SEQ ID NO:65)和

5′-caagcgtgtgataaaatgtgacgc-3′(SEQ ID NO:66)

利用这对引物以MS-FR Koshihikari(在Rf-1位点的基因型:Rf-1 Rf-1)和Koshihikari的总DNA为模板以常规方法进行PCR反应。所得到的扩增产物经琼脂糖电泳表明大小约1300bp,并用QIAEXII(QIAGEN)进行纯化。用DNA测序仪377(ABI)对纯化DNA的碱基序列进行测序,显示出数个多态性位点。

通过对所述位置附近进行PCR扩增,可以检测到其中一个多态性位点,所用引物:

B2387 BfaI F:

5′-tgcctactgccattactatgtgac-3′(SEQ ID NO:67)和

B2387 BfaI R:

5′-acatactaccgtaaatggtctctg-3′(SEQ ID NO:68)

用BfaI处理扩增产物,通过琼脂糖凝胶电泳进行观察。这样,所述变化通过在琼脂糖凝胶电泳中泳动的差别来显示,这是因为从的Koshihikari DNA扩增到的扩增产物中具有BfaI识别位点(CTAG)而能被BfaI所切割,而从MS-FR Koshihikari(Rf-1 Rf-1)的DNA扩增到的产物不具有BfaI识别位点而不能被切割,这就导致了用BfaI消化后的DNA片段长度存在差异。

(13)分离分析

在实施例1中获得了在Rf-1和S12564 Tsp509I位点之间的2个重组体(RS1和RS2)和在Rf-1和C1361 MwoI位点之间的8个重组体(RSC1到RSC8),通过对上述(1)到(12)中创建的12个DNA标记位点的检测来确定这些重组体的基因型。结果列于表4,其中显示了在S12564 Tsp509I和C1361MwoI位点的每一个重组体的基因型。

        表4在Rf-1位点附近的重组体中不同标记位点的基因型

   基因座      RS1  RS2  RC1  RC2  RC3  RC4  RC5  RC6  RC7  RC8

S12564 Tsp509I  J    J    H    H    H    H    H    H    H    H

P4497 MboI      J    J    H    H    H    H    H    H    H    H

P9493 BslI      H    H    H    H    H    H    H    H    H    H

P23945 MboI     H    H    H    H    H    H    H    H    H    H

P41030 TaqI     H    H    H    H    H    H    H    H    H    H

P45177 BstUI    H    H    H    H    H    H    H    H    H    H

B60304 MspI     H    H    H    H    H    H    H    H    H    H

B59066 BsaJI    H    H    H    H    H    H    H    H    H    H

B56691 XbaI     H    H    H    H    H    H    H    J    H    H

B53627 BslZ17I  H    H    H    H    H    H    H    J    H    H

B40936 MseI     H    H    H    H    H    H    H    J    H    H

B19839 MwoI     H    H    H    H    H    J    H    J    H    H

B2387 BfaI      H    H    H    H    H    J    H    J    H    J

C1361 MwoI      H    H    J    J    J    J    J    J    J    J

J:纯合Koshihikari型

H:杂合Koshihikari型/MS-FR Koshihikari型

表4显示所有重组体具有来自籼稻中在P9493 BslI和B59066 BsaJI之间的Rf-1染色体区。结果表明重组体花粉具有如图3所示的染色体组织结构,为可育性花粉,即Rf-1基因的功能在这些花粉中发挥着作用。这意味着可确定Rf-1基因功能存在的序列被包括在这些重组体花粉共同具有的籼稻区域中,即按最大可能性来估计它被包括在位点P4497 MboI和B56691 XbaI之间(约65kb)的区域内。

然而,存在这种可能,即对于Rf-1基因遗传功能的表达非常重要的是,Rf-1基因只是籼稻基因型的一部分,而不管其余区域是粳稻还是籼稻基因型,其遗传功能可能没有明显变化。因此,还不能得出结论认为上述的共同籼稻区域(SEQ ID NO:27的第1239-66267位碱基之间)完全包含了完整的Rf-1基因。然而,基于以下分析,可以确定至少SEQ ID NO:27完全包含了完整的Rf-1基因:

1)基因通常的大小为数kb而很小超过10kb;

2)本发明鉴定的IR24的基因组碱基序列(SEQ ID NO:27)完全包含上述共同籼稻区域;

3)SEQ ID NO:27的5′端位于上述共同籼稻区域的上游1238bp处,且构成另一个基因的一部分(S12564);和

4)SEQ ID NO:27的3′端位于上述共同籼稻区域的下游10096bp处。

实施例4:来自XSE1的9.7kb片段的互补分析

(材料和方法)

用NotI对λ噬菌体克隆XSE1(图1和图5)进行完全消化,以琼脂糖凝胶进行电泳。分离出的9.7kb片段(包括SEQ ID NO:27的第1-9657位碱基)用QIAEXII(QIANGEN)进行纯化。

另一方面,以pSB11(Komari et al.,如上)为基础制备具有潮霉素抗性基因表达盒的中间载体pSB200。具体地说,胭脂碱合酶终止子(Tnos)首先与泛素启动子和泛素内含子(Pubi-ubiI)进行融合。在获得的Pubi-ubiI-Tnos复合体中ubiI和Tnos之间插入潮霉素抗性基因(HGY(R)),而构建成了Pubi-ubiI-HYG(R)-Tnos。再将其与pSB11的HindIII/EcoRI片段进行整合得到pKY205。带有限制性内切酶如NotI、NspV、EcoRV、KpnI、SacI、EcoRI识别位点的接头序列插入到该pKY205中Pubi的上游HindIII位点,获得含有潮霉素抗性基因表达盒的pSB200。

用NotI对质粒载体pSB200进行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)进行去磷酸化。反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上纯化回收载体片段。

用DNA Ligation试剂盒Ver.1(TAKARA)对上述所获得的两个片段即来自XSE1的9.7kb和载体片段进行连接反应。反应后,用乙醇沉淀法回收DNA。回收的DNA溶于纯净水(用Millipore系统制备),然后与E.coli DH5α细胞混合,进行电激。电激后的细胞与LB培养基一起在37℃下温育1hr,涂布于含有壮观霉素(spectinomycin)的LB平板上,并于37℃温育16hr。从获得的24个克隆中分离出质粒。对质粒的限制性内切酶片段的长度模式及其边界碱基序列进行分析,以选择出转化有预期重组质粒的E.coli。

上述选择出的E.coli用于与根癌农杆菌菌株LBA4404/pSB1(Komari etal.,1996)和辅助(helper)E.coli HB101/pRK2013(Ditta et al.,1980)进行三亲杂配。在含有壮观霉素的AB平板上形成6个克隆,从其中分离出质粒,并分析其限制性内切酶片段的长度模式分析以选择出预期的农杆菌细胞。

根据Hiei等(1994)的方法,用上述选择出的农杆菌细胞转化MSKoshihikari(具有BT细胞质且在核心基因上与Koshihikari基本上是相同的)。用Koshihikari对MS Koshihikari进行授粉来获得所需用于转化的未成熟种子。

适应性培养之后,将转化植物转移到长日照条件的温室中。将生长到适合移植的48株个体移植到1/5000a Wagner罐中(4株/罐),并转移到短日照条件的温室中继续生长3-4周。抽穗后约1个月,对直立植株的种子进行育性检测。

(结果和讨论)

所有48个转化植株个体都是不育的。这表明9.7kb插入片段至少没有包含全长的Rf-1基因。

实施例5:对来自XSE7的14.7kb片段的互补分析

(材料和方法)

用EcoRI对λ噬菌体克隆XSE7(图1和图5)进行完全消化,用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用DNA钝化试剂盒(TAKARA)进行钝化。反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收14.7kb片段(SEQ ID NO:27中第2618-17261位碱基)。

另一方面,用SacI对质粒载体pSB200进行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)进行去磷酸化,并用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,用DNA钝化试剂盒(TAKARA)进行钝化。反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收载体片段。

用DNA Ligation试剂盒Ver.1(TAKARA)对上述所获得的两个片段即来自XSE7的14.7kb和载体片段进行连接反应。然后,根据实施例4中描述的方法制备转化植物和进一步的研究。

(结果和讨论)

所有48个转化植株个体都是不育的。这表明14.7kb插入片段至少没有包含全长的Rf-1基因。

实施例6:对来自XSF4的21.3kb片段的互补分析

(材料和方法)

用NotI对λ噬菌体克隆XSF4(图1和图5)进行部分消化,以琼脂糖凝胶进行电泳。分离出的21.3kb片段(包括SEQ ID NO:27的第12478-33750位碱基)用QIAEXII(QIANGEN)进行纯化。

另一方面,用NotI对质粒载体pSB200进行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)进行去磷酸化。反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。

用DNA Ligation试剂盒Ver.1(TAKARA)对上述所获得的两个片段即来自XSF4的21.3kb和载体片段进行连接反应。然后,根据实施例4中描述的方法制备转化植物和进一步的研究。

(结果和讨论)

所有48个转化植株个体都是不育的。这表明21.3kb插入片段至少没有包含全长的Rf-1基因。

实施例7:对来自XSF20的13.2kb片段的互补分析

(材料和方法)

用SalI对λ噬菌体克隆XSF20(图1和图5)进行完全消化,回收的DNA溶于TE溶液中,然后用DNA钝化试剂盒(TAKARA)进行钝化。反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上分离13.2kb片段(包含SEQ ID NO:27中第26809-40055位碱基)

另一方面,用EcoRV对质粒载体pSB200进行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)进行去磷酸化。反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。

用DNA Ligation试剂盒Ver.1(TAKARA)对上述所获得的两个片段即来自XSF20的13.2kb和载体片段进行连接反应。然后,根据实施例4中描述的方法制备转化植物和进一步的研究。

(结果和讨论)

所有44个转化植株个体都是不育的。这表明13.2kb插入片段至少没有包含全长的Rf-1基因。

实施例8:对来自XSF18的16.2kb片段的互补分析

(材料和方法)

λ噬菌体克隆XSF18与λ噬菌体克隆XSF20在5′和3′端(分别是SEQ IDNO:27中第20328和41921位碱基)是相同的,但缺乏内部第33947-38591位碱基。因此,它包含了SEQ ID NO:27中第20328-33946位碱基和第38592-41921位碱基。这是因为XSF18克隆最初被分离时,分离后在扩增期间就发现包含上述缺失,因此重新进行了扩增步骤而克隆到了完整克隆,称为XSF20。

用NotI对λ噬菌体克隆XSF18(图5)进行完全消化。在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收16.2kb片段(包含SEQ IDNO:27中第38592-41921位碱基)

另一方面,用NotI对质粒载体pSB200进行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)进行去磷酸化。反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。

用DNA Ligation试剂盒Ver.1(TAKARA)对上述所获得的两个片段即来自XSF18的16.2kb和载体片段进行连接反应。然后,根据实施例4中描述的方法制备转化植物和进一步的研究。

(结果和讨论)

所有48个转化植株个体都是不育的(图6)。这表明16.2kb插入片段至少没有包含全长的Rf-1基因。

实施例9:对来自XSG22的12.6kb片段的互补分析

(材料和方法)

用NotI对λ噬菌体克隆XSG22(图1和5)进行部分消化。在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收分离12.6kb片段(包含SEQ ID NO:27中第31684-44109位碱基)

另一方面,用NotI对质粒载体pSB200进行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)进行去磷酸化。反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。

用DNA Ligation试剂盒Ver.1(TAKARA)对上述所获得的两个片段即来自XSG22的12.6kb和载体片段进行连接反应。然后,根据实施例4中描述的方法制备转化植物和进一步的研究。

(结果和讨论)

所有48个转化植株个体都是不育的。这表明12.6kb插入片段至少没有包含全长的Rf-1基因。

实施例10:(1)对来自XSG16的15.7kb片段的互补分析

(材料和方法)

用NotI对λ噬菌体克隆XSG16(图1和5)进行部分消化。在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化15.7kb片段(包含SEQ ID NO:27中第38538-54123位碱基)。

另一方面,用NotI对质粒载体pSB200进行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)进行去磷酸化。反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。

用DNA Ligation试剂盒Ver.1(TAKARA)对上述所获得的两个片段即来自XSG16的15.7kb和载体片段进行连接反应。然后,根据实施例4中描述的方法制备转化植物和进一步的研究。

(结果和讨论)

在47个转化植株个体中,至少有37株个体明显的恢复了育性(图6)。这表明在来自水稻(IR24)的15586个碱基(包含SEQ ID NO:27中第38538-54123位碱基)的15.7kb插入片段包括了全长的Rf-1基因。

(2)对来自XSG16的内部序列11.4kb片段的互补分析

(材料和方法)

用AlwNI和BsiWI对λ噬菌体克隆XSG16(图1和5)进行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用DNA钝化试剂剂盒(TAKARA)进行钝化。反应后的溶液在琼脂糖凝胶上进行电泳分离11.4kb片段,用QIAEXII(QIAGEN)进行纯化。

用SmaI对质粒载体pSB11(Komari et al.Plant Journal,1996)进行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)进行去磷酸化。反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。

用DNA Ligation试剂盒Ver.1(TAKARA)对上述所获得的两个片段进行连接反应。回收的DNA溶于纯净水(用Millipore系统制备),然后与E.coliDH5α细胞混合,将混合物进行电激。之后,溶液在LB培养基一起在37℃下振荡培养1hr,涂布于含有壮观霉素的LB平板上,并于37℃温育16hr。从获得的克隆14个中分离质粒。对质粒的限制性内切酶片段的长度模式及其边界碱基序列进行分析,以选择出预期E.coli。

上述选择出的E.coli与根癌农杆菌菌株LBA4404/pSB4U(Takakura et al.,日本专利申请No.2001-269982(WO02/019803))和辅助E.coliHB101/pRK2013(Ditta et al.,1980)进行三亲杂配。在含有壮观霉素的AB平板上形成克隆中的12个,从中分离出质粒,并分析其限制性内切酶片段的长度模式以选择出预期的农杆菌细胞。

根据Hiei等(1994)的方法,用上述选择出的农杆菌细胞转化MSKoshihikari(具有BT细胞质且在核心(nucleus)基因上与Koshihikari基本上是相同的)。用Koshihikari对MS Koshihikari进行授粉来获得所需用于转化的未成熟种子。

适应性培养之后,将转化植物转移到长日照条件的温室中。将生长到适合移植的120株个体移植到1/5000a Wagner罐中(4株/罐),并转移到短日照条件的温室中继续生长约1月。抽穗后约1个月,从每一植株中取一典型穗作为样品用于评价种子育性(可育的谷粒数在总谷粒数中所占的百分比)。

(结果和讨论)

在120个转化植株个体中,有59株个体显示了10%或更高的种子育性,其中有19株个体显示了70%或更高的种子育性。这表明11.4kb插入片段(包含SEQ ID NO:27中第42357-53743位碱基)包含了表达育性恢复功能所必需的Rf-1基因。

(3)对来自XSG16的内部序列6.8kb片段的互补分析

(材料和方法)

用HpaI和AlwNI对λ噬菌体克隆XSG16进行完全消化。用QIAEXII(QIAGEN)纯化分离的6.8kb片段。

后面的步骤包括质粒载体pSB11的制备按在上述第(2)中所描述的方法进行。

(结果和讨论)

在120个转化植株个体中,有67株个体显示了10%或更高的种子育性,其中有26株个体显示了70%或更高的种子育性。这表明在6.8kb插入片段(包含SEQ ID NO:27中第42132-48883位碱基)包含了表达育性恢复功能所必需的Rf-1基因。

实施例11:对来自XSG8的16.9kb片段的互补分析

(材料和方法)

用NotI对λ噬菌体克隆XSG8(图1和5)进行完全消化。在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收16.9kb片段(包含SEQ IDNO:27中第46558-63364位碱基)

另一方面,用NotI对质粒载体pSB200进行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)进行去磷酸化。反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。

用DNA Ligation试剂盒Ver.1(TAKARA)对上述所获得的两个片段即来自XSG8的16.9kb和载体片段进行连接反应。然后,根据实施例4中描述的方法制备转化植物和进一步的研究。

(结果和讨论)

所有48个转化植株个体都是不育的(图6)。这表明16.9kb插入片段至少没有包含全长的Rf-1基因。

实施例12:对来自XSH18的20.0kb片段的互补分析

(材料和方法)

用NotI对λ噬菌体克隆XSH18(图1和5)进行部分消化。在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收20.0kb片段(包含SEQ IDNO:27中第56409-76363位碱基)

另一方面,用NotI对质粒载体pSB200进行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)进行去磷酸化。反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收纯化载体片段。

用DNA Ligation试剂盒Ver.1(TAKARA)对上述所获得的两个片段即来自XSH18的20.0kb和载体片段进行连接反应。然后,根据实施例4中描述的方法制备转化植物,并进行研究。

(结果和讨论)

所有44个转化植株个体都是不育的(图6)。这表明20.0kb插入片段至少没有包含全长的Rf-1基因。

实施例13:对来自XSG8和XSH18重叠区的19.7kb片段的互补分析

(材料和方法)

在实施例11中通过连接获得的质粒(XSG8SB200F),可从预期E.coli中分离该质粒,用SalI和StuI进行完全消化。在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收12.8kb片段(包含SEQ ID NO:27中第50430-63197位碱基)

另一方面,在实施例12中通过连接获得的质粒(XSH18SB200R),可从预期的E.coli中分离该质粒,用SalI、StuI和XhoI进行完全消化。在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶中分离6.9kb片段(包含SEQID NO:27中第63194-70116位碱基)。

进一步,用EcoRV对质粒载体pSB200进行完全消化,再用乙醇沉淀法回收DNA。回收的DNA溶于TE溶液中,然后用CIAP(TAKARA)进行去磷酸化。反应后的溶液在琼脂糖凝胶上进行电泳,再用QIAEXII(QIAGEN)从凝胶上回收载体片段。

用DNA Ligation试剂盒Ver.1(TAKARA)对上述所获得的三个片段即来自XSG8的12.8kb、来自XSH18的6.9kb和载体片段进行连接反应。连接产物包含19.7kb片段,其来自XSG8和XSH18的重叠区(包含SEQ ID NO:27中第50430-70116位碱基)(图5中的XSX1)。然后,根据实施例4中描述的方法制备转化植株个体和进一步的研究。

(结果和讨论)

所有40个转化植株个体都是不育的(图6)。这表明19.7kb插入片段至少没有包含全长的Rf-1基因。

                              序列表

<110>日本烟草产业株式会社(JAPAN TOBACCO INC.)欣根塔有限公司(Syngenta Limited)

<120>一种利用水稻BT-雄性不育细胞质的育性恢复基因来赋予或控制育性的方法及鉴定育性恢复基因存在的方法

<130>YCT739

<150>JP 2001-285247

<151>2001-09-19

<150>JP 2001-309135

<151>2001-10-04

<150>JP 2002-185709

<151>2002-06-26

<160>68

<210>1

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增R1877 EcoRI标记序列的寡核苷酸引物

<400>1

cattcctgct tccatggaaa cgtc    24

<210>2

<211>33

<212>DNA

<213>人工序列

<220>

<223>用于扩增R1877 EcoRI标记序列的寡核苷酸引物

<400>2

ctctttctgt atacttgagc tttgacatct gac  33

<210>3

<211>20

<212>DNA

<213>人工序列

<220>

<223>用于扩增G4003 HindIII标记序列的寡核苷酸引物

<400>3

gatcgacgag tacctgaacg  20

<210>4

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增G4003 HindIII标记序列的寡核苷酸引物

<400>4

aatagttgga ttgtcctcaa aggg  24

<210>5

<211>27

<212>DNA

<213>人工序列

<220>

<223>用于扩增C1361 MwoI标记序列的寡核苷酸引物

<400>5

aaagcaaccg acttcagtgg catcacc  27

<210>6

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增C1361 MwoI标记序列的寡核苷酸引物

<400>6

ctggacttca tttccctgca gagc  24

<210>7

<211>27

<212>DNA

<213>人工序列

<220>

<223>用于扩增G2155 MwoI标记序列的寡核苷酸引物

<400>7

gaccaccaat taactgatta agctggc  27

<210>8

<211>27

<212>DNA

<213>人工序列

<220>

<223>用于扩增G2155 MwoI标记序列的寡核苷酸引物

<400>8

tttctggctc caataatcag ctgtagc  27

<210>9

<211>27

<212>DNA

<213>人工序列

<220>

<223>用于扩增G291 MspI标记序列的寡核苷酸引物

<400>9

ctgctgcagc aagctgcacc gaaccgg  27

<210>10

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增G291 MspI标记序列的寡核苷酸引物

<400>10

acattttttc ttccgaaact tccg  24

<210>11

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增R2303 BslI标记序列的寡核苷酸引物

<400>11

atggaaagat acactagaat gagc  24

<210>12

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增R2303 BslI标记序列的寡核苷酸引物

<400>12

atcttatata gtggcaggaa agcc  24

<210>13

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增S10019 BstUI标记序列的寡核苷酸引物

<400>13

aacaatctta tcctgcacag actg  24

<210>14

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增S10019 BstUI标记序列的寡核苷酸引物

<400>14

gtcacataga agcagatggg ttcc  24

<210>15

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增S10602 KpnI标记序列的寡核苷酸引物

<400>15

agctgttgag agttctatgc cacc  24

<210>16

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增S10602 KpnI标记序列的寡核苷酸引物

<400>16

tagccatgca acaagatgtc atac  24

<210>17

<211>26

<212>DNA

<213>人工序列

<220>

<223>用于扩增S12564 Tsp509I标记序列的寡核苷酸引物

<400>17

ctagttagac cgaataactg aggttc  26

<210>18

<211>27

<212>DNA

<213>人工序列

<220>

<223>用于扩增S12564 Tsp509I标记序列的寡核苷酸引物

<400>18

tttgtgggtt tgtggcattg agaaaat  27

<210>19

<211>2240

<212>DNA

<213>稻(Oryza sativa L.)

<223>PCR标记物G4003 HindIII

<400>19

gcggccgctc cgggaagtcg agcgagtaga cgcccctgac gccgtacgcg tcggcgagcc   60

gcagcggcgt ctctggcggt gtgaaggaca gcccgttcag cgtcgcgcgg cgccgcccgt  120

tgatcgtcac cggcgccgtg ctccgcagca ggtacgcctg cgtcacgttg atcgacgagt  180

acctgaacga tccctgtggg ttcggcctcg ccgctccggc actcaggttc cacctgccca  240

atgcaaaaaa ccaaaaccca aaagcttaat gcgaataata catcattcca cgtatttaaa  300

aaaataattt ataggtaaaa tttttataat gtattttagc gacgtaaatg tcaatgctga  360

gaaataaacg ataatacttt aaatgaagtt ctaaaattta aattttggca tcggttgatg  420

ttggataaag aaaacgatgg aggctagtaa tttttcttct tttttaagta tctagattgt  480

catatattga atttttcagt ttttcatccc tttgaggaca atccaactat tattttcctt  540

ttcttatgta aaaggttgaa caacatattc aaacataaaa aaataaaatt aaatgaaata  600

aatttacaat tcataaaatt tacagaattt atgttaagaa aatattcaaa cttagataat  660

aataaagcaa caaaatcgta ctaaaaagaa gtataattgt acattgtata ctactactcc  720

tacaatttta gacttagaat ttttaatttc ctgaaatcta gtaatgccat ttttttcttt  780

ctagttgaac cagacagtaa gtttaactcg aaacttataa gctaatgagc gaagtcgggc  840

aattcactcg tacctgacgg agcgagcttg gttcatggag aaggacttgt cgaactggtc  900

ctggggaggg tcggggagcg ggccggaggc ccgcccccgg gagttggagt agcggaggac  960

ggcgacgccg gcgacgcggc gccacacggt gtcgttcacc atgcgcgcgc tggcgacgac 1020

gtagtagtcg gagctcgcgt tctggtcggt ggtgacgagg aaggagtagg actggccgac 1080

gtggacgtcc aggttggtgt agttctgctg cgtcgtgtag gagccctccg tctccaccag 1140

caccatgttg tgcccctgga tcctgaagtt gaggctcgtc gacgtcccca cgttgtgcac 1200

tcggatcctg tacgtcttgc ctgtgtcccc acaccgacgt cgccgacaca cgcgcaaaag 1260

ataatagact cattgtaagt aggtagtaac cttctccgtt tcatattata aatcgtttga 1320

ttatattttt gttagttaaa cttctttaag ttttttttct ataaacttaa ttaaatctaa 1380

agaattttaa taaaaaaaat caaacgactt ataatataaa atggatggag tagttgcatc 1440

aatttgtgga tgaagcaaac aagattatat ccttttcatg agggtgaaag tattcagtga 1500

acaattcgtc agtttcaagt ttcatgaaat cggacagggt ctctgaaagt ctgtattttt 1560

ggtactgttg gattgactac tctggcttct gttgtcacat cttttgtatc ctagtttcgg 1620

taaaaaaaat tttggcattt ttactcctat cgttgatctg tttaactgaa accattgcat 1680

gatatactac tagcagacaa aactggtgaa aattcacgag aatgaacttt ttgtcagtta 1740

agcattagcg gacagcttca gtaagcagag caggctgcct taaggcttaa agcactatct 1800

tccacaacac tttgtcctac aatcaaattc caaatttact atcacaaaaa gcgaaggaac 1860

taactaaacc ttactcctac tagtactact gctatgacta tgaaacaaga ttccaatcca 1920

aagaaaacac agtgctcgat cagcatgata aaagcaacga aacctgctca tccagctgcc 1980

aaaatgccac cccactgact ctacgtacgt actacgtatt gacgctgtaa aaaactagcc 2040

gtagtacaga gaagaggacc caaagtttcg tcaaaaattt tattttaccc ggatccacat 2100

tgatggtctc gtactcgatg ccggccggga caaggctgtc gttgtacctg tacgggccct 2160

tgccgttaat cagcacgccg tccggcatcc cgaggtcctt gccactgtcc agcatcttcc 2220

tcagatcctg caacgaattc                                             2240

<210>20

<211>2601

<212>DNA

<213>稻(Oryza sativa L.)

<223>PCR标记物C1361 MwoI

<400>20

tcttgctgag atccaagttg cggtaacttt gcccttttct ttttttcttc tcttctgaat   60

tttttcatgg tttttgggag agattttcgt aacttgatta cagttctagg aaaaggccac  120

cttgttcaaa cagggctttc ttgaaaggga tcaatttgct aggagtacat gattctaaaa  180

gcgatttcga aataaaacac agttctcgat ctcatacctg aaaacaaaag gcccatactg  240

tgtaaactgt gattatgctt ctgttaaatg ggatatttgt acaaaattga cgccaaccac  300

ctataaacag attgtgagct tttatcttag taaaataaaa tgtgacattc tactcagtgt  360

tcagtgatcc gatgtcgtct cttctgcgta caacttctaa cagccgtttt cggtagtaca  420

aactagcgaa acaccaaaaa cgcagcattt gagttctgga atacgctgaa attgttagaa  480

tcaaccacga aaccaaaatc attgttcaga aacgttgcaa cgagataaaa cacaagaact  540

tgttttaaca aagcatacgg acagtacata tacggttaca acacccagtc tttatacagt  600

tctgctggag ttccatctac tggctgtcat tgtatctcag gacagacagg ttaacatagg  660

tacaacacaa ttacaggcta aaccgaagcg aactacactg tcagcatctc taacagtatc  720

gtcaagcaag cttatttaca gctgctctag taaatttaca acgtccctgg cagaatccct  780

ctcgtttctg gcagcgacga ggcacggtcc atggccttag caggacatct cacccgtcag  840

ctgcatagaa agcaaccgac ttcagtggaa tcacctcctg ctcctgcaaa aaagttggtt  900

cgatcaatca cgcgtttaat ccaaaacaaa atgggtatta attatgctag cctatgaagc  960

tacctcagag ttctctattt gctctgcagg gaaatgaagt ccagtggaac agttctcaag 1020

cacctcaggg ctcttcatcc atgctttgtg tgcttcaatg gctttcagct tatagcgaaa 1080

catctgcgat acggatctaa aattaaggat gtcgacaatt acttaacaca acaaataatt 1140

gaagcaggtc cagttaaaga aaagtagcag cgaagaatag cactctgaag tctgaacctc 1200

agataaagaa atggttggtt tttccagttc atctccctca acatggattc cagtaccctg 1260

gcattctggg caaaggatgg atgttatttt cttaggtgca ttttttgcct ttcttcctcg 1320

attgcttttt cccttgcttg caattttgtc tgctagcatc tcatattggc ataaaatagt 1380

ccagtgcaca aggcaagaag tgtgaaacaa atgaaatgcc tgcaaaatta gccgtacaaa 1440

gtcattggag gttgcagcag aatactacaa atttttaaag aagaaactat acactgtcta 1500

tgttttgctt gaaatgaatt caaccacttt gcattatacg gtttggaatc cctggtttgt 1560

gagaactgta attccattac aacagtgaag aagttaccat aactaatgaa tggaaattag 1620

tcaaatgcct aattttttag gtttgcttta atttatttat ctgtgagaaa tgctaagcat 1680

gtcatgcgtt gctatcttca agaaatacta agaaactgca aaggcaaaga atgtttgaaa 1740

taacttaccc cgcttgagtt tctactgctg caggctagat ttcctgtctt gcagttgagc 1800

aaggtagcta catccttttc aagaagcatt ggtcgcccac aaatatcaca agctttctca 1860

gcagcaaggc gcttctgctt acgcaactcc ctcctcatag atttggtgga taagaggcca 1920

acttgaagat tgtgtgaagt acctgtcggg gaacctgtta tgatagcttg gctattgtca 1980

tgggcggagc tgctttgctc attcgactcc tctgaagatg cttcttgatc tgaaaatgac 2040

ttctttcttc tctttccacg gtgtccagca tcatcaatca cgaagaaaga tccagcagag 2100

ataggaaggt cctgatcatc agaagaccac ttcctgccca actcaattgt ataagagaag 2160

ttgacaatgg caaagtcaga ttgctcatag gtgtcacact catccaagcc atgggagcca 2220

tcctgtccta cccaagcaca ccagatcttg ctaatctttt tacttccttt gctagcttcc 2280

cataacctgt atgcaatatt tccatatccc aaaagatgca caggcaaatc cgaaacaaca 2340

tcctttagca atacactagg aataacgaga ggaccgtcag ttccactttg gtttgacagc 2400

acatgatctt cagatacaga agcagttcta ccattaccat gcgcatttgc accacggcgt 2460

gtgccttttg cgccattgcg agagctagaa tcatctctca acctcgaagt cacttcagtg 2520

tcgttcgctg gaaccagagc cagctctctg gtgttctgcg agctcgagtc cagcaagagc 2580

gggtccttct cgcgcgagtt g                                           2601

<210>21

<211>1333

<212>DNA

<213>稻(Oryza sativa L.)

<223>PCR标记物G2155 MwoI

<400>21

ccctctgctt gatccagtgt acatccatgg gttaggacag attagttact cagttaatta   60

agtgtgagac tggaaaaaaa tatctgacgg cagttttata agttgagtga ttgaactagt  120

gaaagttcag ttaactgtca acggctgtag atttgggatg gcagactgtt ctgagtcaaa  180

atgaagcttt tactgtgcgt ggttaccagg tgcagtaaaa taatttcaga tctaatcgca  240

gtaaaaaaat gtagtactat atgttaagac gagattggtc ggtcaaaatc tatctggccc  300

tttacatctc ccaaatgtta cctcagttgc aggtggtaaa aaaaaatcac tcgtttcacg  360

tgatgtcggc agatcatgga ccatgtctca aatgctgaaa ctctgaacaa tcaacaaaaa  420

aatccaacca gatgagctgt gcaactgata attgatcatc acactatttg caactcatct  480

ttcatgtaga tggaacttca atcccgaaga aataatgaca gcaaaatgct gcgatcctga  540

agaaaggatg gcggcaaaat ggcagcgata aaaaaaaaat ggttggttac tgaagaatta  600

tttgtgcagc agttgagaca gtagcaagat aagagctagc taagctagct aggtagagtt  660

ggatggaaga gtagtagtat gagatagagc atggagcgcg acaactcaag tggatgctaa  720

agtaaaaggc attctcttct cttgtttgga atcagaaaag aaaagaaaag acttgagctg  780

cttggctgga atgtttggtt ggatcatgcg cgctctcctt agcttagctc gccaagaaat  840

cctcgcttca tctctctcaa taattcaaag ccacgagctc tctgctcata tccagtgcga  900

cgattcccgt taatgcaaat gcattatatc cagttcgaaa tgttacaatt cttgcgtttg  960

cagcaagcca gcaagtggtg tgaattgttt aatccctcgt gcatttcaac gaaattctct 1020

cacaaattcg cattgacttc tttcttagca caattagtaa gcagtgacaa ataaagaatt 1080

tttgaacagg atgtctttcc aaggaaggtg agatttttta tgtggatagc aaggatcgcc 1140

tttccttagc atgaagagaa tgtgatcaac tttacacctt gcttacgatt atggccttaa 1200

tttttgatac cctaaacagg agcacatcac atgcatgtcg acctgagacc accaattaac 1260

tgattaagtt ggcatttcag atgcatccgt cagttacatg atcaggtgat cgatggatca 1320

actgtaggtt tca                                                    1333

<210>22

<211>863

<212>DNA

<213>稻(Oryza sativa L.)

<223>PCR标记物G291 MspI

<400>22

cgaacaggat caaaagtaga cgacgagggc atttagaagg agaggaattg tatttgttcc   60

cggtatttaa tttttaaatt tgtggtcgga agtttcggaa gaaaaaatgt gctcatgagt  120

gattattggc tctgaacacc aacctctctt ttcgttgatt ccttctgagg tgttgggtgt  180

tgggacacga tgctgccgcc gacacgacac cgggttccac aatacactaa tctactcgcg  240

acaccttcat tgaactgcat ataattattt agaaagtcca ttaacacatc ttataaaacc  300

ttgttgaatc atataatcat tctataaagt ctatttgaac atcttatgaa aaaataagat  360

ctgacctagt cgttacactc tcttacattt tccattagcc taactaattc cgtgcaggaa  420

acgcccaaaa ataatagtac caatagtcca ctaatcccgt gccagaggcc gccaatgatt  480

agtgattaac ccaaaaaaca taatcatcat cacacgccgc taatgaccag ctctcgctta  540

gctcatccca caggcggccc ccacacgcca ctcctgccat gtgggcccac ctttcacacc  600

ccccaccaac cagaaaaaaa actcccccaa aaaaaaaact tttaatgctt atctcgcggc  660

agtataaaag gcgaccccac cacccacaca caatcacagt cagcgaccca acccaacccg  720

agccgaggag tcgagtcgtg tgaaaattac gaaattgccc ttcgactcca ccaccaccac  780

ccaccggcga ggcgaggaga ggagaaaaat tgggaggaaa aaaaaaggga aaaagaaaaa  840

gggtggagga gatttttgcg aag                                          863

<210>23

<211>1510

<212>DNA

<213>稻(Oryza sativa L.)

<223>PCR标记物R2303 BslI

<400>23

tgccatgaag acctatggaa agaatatctt cttctcactc tgtgaatggt gagtttactc   60

tctgtaacat ttagggctag gtcgaaggaa catgaagcat tgctgattca ctccactgtg  120

tttttttttt ctgtataggg ggaaagaaaa tcctgctaca tgggcaggcc gcatgggtaa  180

cagctggaga acaactggcg acatcgccga caactggggc aggttctact catcctctct  240

ttaaccctgt ttacatagtt cttgagtttt tcagtactga tcgtaattgc cctgttattt  300

cagtatgaca tctcgtgcag acgaaaatga ccaatgggct gcctatgctg gacctggtgg  360

atggaatggt aagaacttga gatgtatctg ttcctaggtt gcttaaccat ttgagagctt  420

caaaatgatc aacatatgtt tctgctgtgc aatatcagat cctgacatgc ttgaagtggg  480

aaatggtggg atgtctgaag ctgagtaccg gtcacacttc agtatctggg cactagcaaa  540

ggtaccatag catgttctat gtactaataa ttttgctgca atgttgaact tctttgcatt  600

tcctcactgc aagttttgct tgaattgttc aggctcctct tttgatcgga tgcgatgtgc  660

gctcaatgag ccagcagacg aagaacatac tcagcaactc ggaggtgatc gctgtcaacc  720

aaggcaagcc ttctcagttt cacatgctta gatttagcca tacctcttgg atatttcacc  780

atactcataa tgtaactctc tgaacagata gtctaggtgt ccaaggaaag aaagtacaat  840

ctgacaacgg attggaggta tcccttcaat ggcttccaaa tttgcagttt ctcattgtcc  900

cataagcctt ggcatgatca tgactaactc tgaagctgac aatactttgt gtaaatttgt  960

cggtaggttt gggccgggcc actcagcaac aacaggaagg ctgtggtgct ctggaacagg 1020

cagtcatacc aggcaaccat cactgcacat tggtcgaaca tcgggctcgc tggatcggtc 1080

gcggtcactg ctcgtgatct atgggcggta aagcctttgc tttcttcaga gctcaaagta 1140

gaacatcttc tcttcagaat tcagagttca taacaaattt ctgtcaattg tgcagcactc 1200

ttcgttcgcg gctcagggac agatatcagc atcggtggcg cctcatgact gcaagatgta 1260

tgtcttgaca ccaaactagt cagcaaagaa aagcagcaca ggttagtacg tgtccggcga 1320

atacagctaa attgatcagg attcaggaag aaggtttgca atttgcaagg attggtagag 1380

ctggaaatgg gatgccattt ggttatgtat gtagaaataa gctgtaagcc tgtaagcgta 1440

tatgtaatca gccgtcaaat gctggcgagt gtatttctga agtttgcaac gaaagttgca 1500

gcaataaaaa                                                        1510

<210>24

<211>1016

<212>DNA

<213>稻(Oryza sativa L.)

<223>PCR标记物BstUI

<400>24

tggggattct tttctttaag caatttaaca ttattgtcct aacaatatac acaatattgg   60

tttttctttc agtatcaaat aattctttta cttttgaaaa cacatttgca atgtgttgga  120

aacacaatta tatcttgcac ttccttttgg aaatttaatc atttgaaaac tgattcgcgt  180

ttcatggctg taatcttctc ttgcgaacat cgctctttct ttgatggttc tctgttgaga  240

agaagagcaa ccaagtaaat tttcgaaatg tttttttgtt ctttctattc accattgcag  300

gttgtcaaag ccatcgagaa ggccataccg attccgagag cgcaacccat tgccttggat  360

ggcccagcaa gggaagagct gaaggccatg gaggcgcaga aggtcgagat cgaccgcacc  420

gcggcgctcc aggtgcgccg tgagctttgg ctggggctgg catacctcgt cgtccagact  480

gccggcttca tgaggctcac attctgggag ctctcatggg atgtcatgga acccatctgc  540

ttctatgtga cctccatgta cttcatggcc ggctacacct tcttcctccg gaccaagaag  600

gagccctcct tcgagggctt cttcgagagc cggttcgcgg cgaagcagaa gcggttgatg  660

cacgcccggg atttcgatct ccgccggtat gacgagctcc ggcgagcctg tggcctgccg  720

gtggttcgga ctccgacgag cccctgcaga ccgtcgtcgt cgtcgtcgtc gtcttcgacg  780

caggagagcc attgccattc ttactgccat tgccaatgat ctttgtgctg ttctgttctg  840

ttgtcagaat tttttcatgc ccagtttatg ggggttaagc tagcttctcc attgtaccgt  900

tctgatgtgc ggatgatgcg atgcaaagca tagtttgttg aagagatgac aaggcagatt  960

ttagcttgaa aacctggagg tgagaaaaaa aaatcctgat gtgtttgtgt gtgtga     1016

<210>25

<211>676

<212>DNA

<213>稻(Oryza sativa L.)

<223>PCR标记物S10602 KpnI

<400>25

accaccttca tatgaagaaa ttaacggtgt tttcatgagg aatccaacag tcgctgaatt   60

ggtggaaact gtggaattct tcttggctga ggtaaccaat catcacttca ccacaatgca  120

caagtttgta gcttactact acagtacttc taataagttt tgtctgttga gattttattg  180

ctgatttcta tgcatggtca tctttttgac aggccatcca gtcttatcgt gctgagagtg  240

aaactgagct caacctggca gctggtgact atatagttgt ccggaaggta cggccctatc  300

ttcccattgg acatgtttct aaccataaac atatctttgc tggacttttg tgggcaaagt  360

tggctacact aaacttgtgt tcattaacct gctcaatcag gtgtcaaaca atggatgggc  420

agaaggtgaa tgcagaggga aagctggctg gttcccttac gactacatcg agaaaaggga  480

ccgtgtgctt gcaagtaaag tcgcccaggt cttctaggcg ttcaatgagc catacataca  540

taaccctggt gttgtacact gtattatgat cgttcgtgat cttcaaagac cctctgatca  600

gagaaatcac aaatattctt ttgttctatt attgtcatta tcactacccc ttttgtcaaa  660

accagtgcag cctttt                                                  676

<210>26

<211>1059

<212>DNA

<213>稻(Oryza sativa L.)

<223>PCR标记物Tsp509I

<400>26

gcgagatcat gaacttgatt ttctggttgc catattgggc ttgcttgtta accttgtaga   60

gaaggatagc cttaataggt aagtccctca catgcttcct tccatttgct caattcatat  120

cagtgttact gttctggcag ttccttgggg tcaggactca gaaacatcca attaatgttc  180

atgttctctt aacgactcag aaatacttta taacctctcc acagggtacg gctttcatct  240

gcccgtgttc ctgttgatct atctcagaat ccacagagtg aagagacaca gagagatgtc  300

atagcactcc tctgttctgt attcttagca agtcaaggtg ctagtgaagc ttctggaact  360

atatcaccgg taattcaaaa ttcttcaagt tccttttgta tgtagattat atctttgtaa  420

aactcggcat ttattacctg ctctttgttt caaaaagcag tattttattt tgctccttag  480

cataggtcag cagaacagtt gatcttattc agaaaacaat attttgcatg taacatactg  540

ttatctatga gatgaaaatt aatgcatgtg taataatgtc aatgataaat atttgctatc  600

tgaatccagt ctaccaactc tagttagacc gaattactga ggttctattt caaagaataa  660

tttagtgcac catttgttca actactatga agtaaaatgg tattcccttc tattgacatc  720

gggttagaag tgaaaggcca tcttaatgcg atgttctcaa tgccacaaac ccacaaattt  780

cattaacaca tacagattat tattaacata gctataaatt ggatttccag aagcttgagt  840

tgaatttatt ttgttacaat tgaaagcact gggaacatta gcattttttt ttagttcttg  900

gttattgcaa tttataatgt tatacagaac tgtgtacctc acaatgcatt cattatgaca  960

ttctatgaac catttgattg actgttgctt gtaaacaaca ggatgatgag gagtctttga  1020

tgcaaggagc acgggaagct gaaatgatga tcgtagagg                         1059

<210>27

<211>76363

<212>DNA

<213>稻(Orza sativa)IR24

<400>27

gatcaactaa caacctcttt gcagcaaaaa agcatacaca caagtgtttg tcttggcctg 60

gggctctgca gatggactga tactctgacc tgcagtgggc ttgggagcta acaatggttt 120

cattcttttt ttttttatgt tttcccctgt tgtttttgct catgttttgt gtaatttttt 180

cttctcatct agcgatgtta tttttcttag catgatggga gtagccctcc tttttttttc 240

tctaattaag tgtaaagtag caacagcata gggatgaatg ttcagtgtag tgtgtggtgt 300

ttcagttatt cagagacgtc catacagttt gtaccttgtg accacacgtc ttaatctgat 360

gaagcttaga ataaatcaca tgttagcaat gcaatatcat ctgcgtcttc tctcactttg 420

gtggccatca aattctgtgt agaagtgtat ggttggtgtg ctgttgcaaa tgccgtattc 480

cgctctgttt tgtggaagtt aagaagtccc tagttgaaat accgattttt catgatctcg 540

gagattgatg caactctgat tgcagcattt ctttttatta gaatgtacac tccatgctat 600

catgatgttt attgtttagt actacaagat ttggttaacc attattttaa tatcataata 660

attttataaa atcttggagt aacaagttca taatacatga tagcataact ttttgaggct 720

agtctatgta tattgtctcc tttgttttta aactaagcac tcaataaatt attgatggct 780

gtaattttct gaaggtttca ccggtttcgg cccgtgcttt ataaatagct tcggcacaaa 840

agacaaaacg gtccctccaa cacataaatg gttgagttta cgttttcatt atctttggta 900

aaatcaagtc caccacgtag acactcataa caaaagtttg aatatcctca gaaattttga 960

cttgagtcta tcttaccttt gatatcggac atccaaccct ccctccctcc ctgaacttta 1020

tattattcat attacacctg aactttatat tattcatatt acaccctgaa gtggttttca 1080

tttaattgca tacatgctga aatagtttga caacgtgaga tgcactaaaa atctacacgt 1140

tcgtcttaag ttgcaattca ttttatccct tttctttttc tctcttacat aggaatatca 1200

atagtactaa ttcacattac aatatagtat aaattggtaa tcgattattg gcaatatact 1260

atattaaata ttcaaaacta gtcatttaag ctgccaaata agtaaaccac tatcgaaaac 1320

cacaatataa atggcattac aaaacttagg gggttgaata tccaatttta aagttcatga 1380

tgctagagga atttctatca aaagtttatg ggtacatatg gactttttcc tttttaaaag 1440

aagctattct tgtcgtaaac gttaaatatt ttttgtactt tattttttat gattgaaaaa 1500

aaaacttagt tttcaaaatg attggtctgt atacaagcat caattagact taataaattc 1560

atctaacagt ttcctggcag aaactgtaat ttgtttttgt tattagacta cgtttattat 1620

ttcaaatatg tgtacgtata tctgatgtga caaccaaacc caaaaatttt ccctaactcc 1680

atgaggcctt acagatatat ttgatgggtg taaagttttt taagttcttt gggtgcaaag 1740

tttttaaagt atacggacac acatttgaag tattaaatat agacaaataa caaaacatat 1800

tacatattct gcctgtaaac aacgagacaa atttattaag cctaattaat ctgtcattag 1860

caaacgttta ctgcagcatc acattgtcaa atcatagcgt aattaggctc aaaaatattc 1920

gtctcgtaat ttacatgcaa actgtgtaat tggttttttt ttcgtcaaca tttaatactc 1980

catgcatgtc caaatatttg atgcgatctt tttggccaaa ttttgttgga atctaaacaa 2040

ggatcaaatt tgctgaattt ttccagacgt cacggcttgt tcatccatcg ttcgcatcgc 2100

gattcgccac cgacgccttg gtttccaacg aattttatca tccgcttaaa tacatccaaa 2160

gctctccatc gccatcggcg gccaacggcg accgctccgc tctacccaat ccacccatcc 2220

actcgccgcc gccccctgat ccaaagcctc cgccgcgccg ccgtcgagag gaggaggagg 2280

aggaggagga ggaggcgtga gcccctatgg ggaccctcct ccggccgcgt ccgcttgccc 2340

acgccgccgg cgccggcgac gccacgccgt cgaccgcgca cggtagccac gcgcctctcg 2400

agaggccccc cccccccgcc gctcgctgat ctctcttctc atcctgtttg ggtttgggtt 2460

tgtgatttgg gtgttttttt tttttccgca gcggtggtgg tgagcggtgg ccgcggccgt 2520

ggcgtggagt gccagccgca tcgggtgcgc cgccgcccgg gtccgcaggt tgcggtggcg 2580

acggcgagct ggaggaggcg gagggagacc gtggtgagat cggatttcgc cgctggtggt 2640

gccgctacca tgggggattc gccgcaggcg ctctcaggtt tgcagcctcc tccactctct 2700

tctcgcaaaa tgtgttgcta tgttcctctc gctgggctgg cctcatagcc attaatgtag 2760

tttgctggaa cattacattc ggaacgttgt tggcaattgc ttgacaaaat gtggaattgt 2820

ggaggggaga aaaatcgttt gaacctgcag tgacaaaatt gccatctata attttaaaac 2880

tgaaggtgtg gaaatcaaac ataatcattg ccagcacatc attcttgtta accaccttga 2940

catattgttg gcttataaca gttagctcca caccaacttg gaaggtgtca atggaatgta 3000

agtataaatt gaggataact ggcagttgtt aagactttct acagaacttg tagcagctaa 3060

aactagctat tgtgcattta tgtttcatgg aatttgagcg gcaatggata tttcttacta 3120

agacgtataa tgcaaaaaaa aaaaaaaaac tatgtctatg cagtttacat gtaatgtgcg 3180

gatgcaaata aaatcatgtt catggacaaa ctaatgggat tcataccaaa ttccagaatt 3240

gcatttctta tgtggttact tttgtttgtt gatttggtta ccagacatcg atgtggtttc 3300

aagggtcaga ggggtttgct tctacgcggt gactgcagtt gcagcaatct ttttgtttgt 3360

cgccatggtt gtggttcatc cacttgtgct cctatttgac cgataccgga ggagagctca 3420

gcactacatt gcaaagattt gggcaactct gacaatttcc atgttctaca agcttgacgt 3480

cgagggaatg gagaacctgc caccgaatag tagccctgct gtctatgttg cgaaccatca 3540

gagtttcttg gatatctata cccttctaac tctaggaagg tgtttcaagt ttataagcaa 3600

gacaagtata tttatgttcc caattattgg atgggcaatg tatctcttag gagtaattcc 3660

tttgcggcgt atggacagca ggagccagct ggtatggctg tagtctcatc cctgctttct 3720

taagtagaca tatatacatt tacagtattt ggtaaataaa caagatttta tgaatcatat 3780

atgattttgg ggaaaacaca aaactctctt tgttggctgc cttgaacata gttctgttca 3840

cacagttata gcaccttctt taaaatgaag aactttgttg catacacata aggccaaacc 3900

acataatgaa ttttgtttat ttctatcttt gaatgttagc atcgtttttg tttaatgcat 3960

gatcgccttc ctatatattt gtagtatgtc aacattgtat tccatgctga gcataacaaa 4020

tggtttgtta aaattcagga ctgtcttaaa cggtgtgtgg atttggtgaa aaaaggagca 4080

tctgtatttt tctttccaga ggggactaga agcaaagatg gaaagctagg tgcatttaag 4140

gttcagtaac caaacttagg ttacattaca tctaatgaga tttttatatt cagtatataa 4200

tgttaacctt ctcatggtgt actgacgtgg ttataaatgt ccccagagag gtgcattcag 4260

tgtggctaca aagaccggtg ctcctgtgat acctattact cttctcggga cagggaaact 4320

gatgccttct ggaatggaag gcatccttaa ttcaggttca gtaaagctca ttattcacca 4380

tccaattgaa gggaatgatg ctgagaaatt atgttctgaa gcaaggaagg tgatagctga 4440

cactcttatt ctaaacggtt atggagtgca ctaaagaaag atggtgtttt tttttattat 4500

atggaaccta ttcaaaggca cagacaggct ttcaaggcta agcttgttac aggtactgat 4560

actagttact aattactttc gtaatcagta taaataagct tgtgtagtgt aatggcattg 4620

tacatttctg cacttggtaa atttacagaa gaggcaagta atattttaga ggattgagtt 4680

tattcaccca gtcatatagt tgaagaggca agtaacctgt aagagaggac tgaacattaa 4740

cacctcttgt tcgattaaaa atgaccaaag agcatcaaac atgtattcga ggctgttact 4800

ttagatatgg cccattaatt tgtttagttg tctatgtaca tcctagttgg tgtaaatgcc 4860

agttaccatt tctatgatct aaaacaatca actcttttag tatattttca aaaacgaaat 4920

tcagtacaca tgtatgaatc ttaatattct tctctagctc gttacaaaag caacaaaggc 4980

accgtgtcag ctggttcaca ttagctagtt tgtacttagc attatccact agcaccttat 5040

tttcatgcat atcatgctaa tttgcttgcc cacgttgagt gggaattttt ttcatgtttt 5100

ataatttata tatgttttag acttctagtc cacaatttat gtacttcatg ttcctgagcc 5160

tctagtatgg ctgatagcag actaggtgct gagtgctgtc cttttttgca gactgaagag 5220

agaagaaata caagactgtc cattgttagt cagatttgta aaaatagact ctgatgtagt 5280

ttacttttgc ccctatttta tttttaacaa tacaaatata taacagatcc taagaactta 5340

tcttaattta ggagaagttg ctcgtttcat taaattaaat tgtgaagtaa aaatgtgtgc 5400

tcgagtctgt caatgcaatc ctgtgttctt gtttgaagat atggtgtagg gcaggccagg 5460

attgaacact gaatggtaag actgcttctg ccttcagacg ttattgctaa atttttagct 5520

acttgcagtt agtgctgcca cgccgattaa gcagtagaac aaagtagttt tgtcgtgcac 5580

aaatgagtta tatttcattg gaaatcgaag cgaaaacgaa tcaaaagtta gaagaaaagg 5640

ggaaacttgg taattactcc ataaagagag tgcattttat tggtaagatg gtatccggaa 5700

gctgtgagct ccgggctgta tgtattctgg caaatttgat atgagatgct cgattattgg 5760

cttaagttag cgatatcaaa tttggggaag caccaaagga attattgtga aggagttatg 5820

ggtgcgtgac gttatctgct aggttcaaat ccttgtggct atgaatattt atctgctagg 5880

ttcaaatcct agtgactatg aatattaatg ggtaaggtaa gggatttatt gttaatttta 5940

gtttctttaa gattgtgcca tcggacgcca ttcggtaact gtaataatgc tttgtattgg 6000

attcacttgt gttacatgca cgcactaaac atgtgcttta ccttttcatc tgtttttgcg 6060

ttctgggcta gaaactcaaa cgttgaattt tccatggtct gctcaacttg acaattactg 6120

cgtgtcaagc gatcttatac gcatactatg cgcacaagtg attgtatacg gatatgatga 6180

cagtataacg tgtgatattg atttttttaa taaaaaaatg atgttcattt ccttgatgaa 6240

ggaacaaaga ctttttttaa aagaagggta ttactaaaaa caaaaatgac aaaaacaaaa 6300

tatcagtgca catggcaagt gtgctcggca attttttctc tgtactttaa acaaaaatac 6360

ttctatatgt tcttttttat aagggtggca caaatctttt aaatgagcca aatatctaca 6420

ttggatttat taaaaactgt ataaattata atttatactc tgaaaggttg tgtgcatctc 6480

tcttggagaa aatgtataag ttgcaaacaa acattaatcc acgttatgta actttttttc 6540

gccggaaagg ccgaaggagg cctgacggag cgtggggctc ctcaccggga gaccgcgcag 6600

gccccccttt gccggttcgg ccggggactc agggtgaaat tctaagctct ctgtatgtgg 6660

aaggttcgcg accgtcgaaa gagcataaga cacgggcgat gtatacaggt tcgggccgct 6720

gagaagcgta ataccctact cctgtgtttt gggggatctg tgtatgaagg agctacaaag 6780

tatgagccag cctctccctt gttctgggtt ccgaatctgg aaaagtccag tccagtcccc 6840

ccctctaagt gggcaaggtc ctccttttat atcttaaggg gataccacat gcaccatctc 6900

cctcctttct gtggagactt accctacctt ttcataaatg gacggagatt tgtatagttg 6960

ccgtccgaat gaccttctga taggacggcc catacctacc tccacttccg ccgaaagcag 7020

gtgcgacgtg ggattatggc tgtctgctga cgacatgacc agtgtcagac tggtcacaaa 7080

ttgctcattc ctgtccacca cgcgtcagtt tagcaatcta catgttggcc cttcttcaca 7140

caacatcttg cctgtaatgg ttaggatgaa gcctggcata tatctaacca ggactaacgt 7200

gccatctcta ggaggtaaca cgctagctcc agctggggac gagcgcctag aagccctcgt 7260

cctgacggga tggggcgagg cgtgcgtcag atcgcctgtc gccacctaac ctgcgatctg 7320

accggtctgt gactggtcac agaccggata aacgagtgca ctgcacttcg ttacatgcag 7380

cgtgacacgc tcagccaaac cgcaataaat gtggttaggt gagccccgct gtgctcacct 7440

aacccataca cgcggagcaa aaacccacga ggggtcgggg cgcctcggcc ctcggggccg 7500

aggcgggtgc ggtccgaccc cctcgggggg actaagagga gggcgaacac atcaccctcg 7560

ggcccgacgt cccccgaggg tgccaggcca cgtgggcgat tgtgtctgcc tcaaacctct 7620

agtcatgata ctcctgatcc catgtcaccg acagtagccc ccggcgttat gccagggcga 7680

tcgccctctt taagggaagc ggtcgggcgt gacgccactc ctaaggcctg gtgacaggtg 7740

ggaccggtct ccacaattgg gcagaaaccc aacggtcaca aatcacgcac atcggcaatg 7800

gtaactctac tatcaataat gagcggtctc ttcaagactg ccacattact cgagtagcac 7860

acgaatctgg acatggcgat tcgtttcgtc tggagatatg gtaacgtcgc tttggtcggc 7920

gagcgtaatt aacgcgcgca cgatatgatc tatctcgact gccacaaccg catatccacc 7980

tcatgcgccg caagcgggcg aatgggatta gtggaagcgt gggcgcgaga aacgaggggg 8040

cgaaatagtg ggcgcgagaa gcgaggagcc gggcacagcg ttggcaagag tataaaggca 8100

ctgaggaaag gatctgtttc cttcctttcg ccatcatttc ccttgtcttc gccgcttgcg 8160

ccctaactcc ttctttcctg tgctctactt tcgccacacg cgctcgctct caatcttctc 8220

ttcctccggc gccatggcac ggggctccgc tctgctcgat ggtagcgtgc tgccgccttc 8280

ccgcatcgtg agcgagaggc aggctgggct gccgcgccgc ttcatgccgg aatctgccac 8340

cggccgggag atagtcacgc tgggcgaggg acgcccggcg ccagactacc cggggcggtc 8400

cgtcttcttt ctcccctttg caatggcagg gctggttccg ccattttctt ctttcttcat 8460

ggatgttctg aagttctacg atctccagat ggcgcacctc acccccaacg cggtgatgac 8520

attggccatc ttcgcgcatc tgtgcgagat gttcattggg gtgcgcccat ctcttcggct 8580

gttccggtgg ttcttcaccg tgcagtcggt gtcgccgcca tcggtagttg gtggctgcta 8640

cttccagcca cgggggccgg tgctgaatcg ctacatcccc tgcgccctcc gcaagaagtg 8700

ggacgactgg aagagcgact ggttctacac ccccctcgcc gacgaagcgc gcctccgact 8760

tccgagccag cccccggcgc aggcctccag ctggcgggcg ccggtagatc tgggggatgg 8820

ctatgacgcc gtcctcgacc gcctggcggg cctacgatcc caggggctca cagggaccat 8880

ggtgtacggc gactacctcc gtcgtcggat tgcgccgctc cagcggcgcg ctcggggcgc 8940

ctgggagtac accgggtccg aagactacat gaggacccac cagggagtca gatgggactg 9000

ggctcctgag gatttcaaga tagtggtcca acgggtgctg aatctcaact ccatggaggc 9060

gtccctcatt ccccaaggaa tcctccctct ctgcagcgat ccagaccgcg cctccatcct 9120

gaccattatg acggcggtcg gggcctcaga ggagtgagct ccaaagggcc acgacggcgc 9180

aggcgggagc cgtagggggg atcaatctac ccggggaggg ggtcgtgctt ctgggtctcg 9240

cgacggaggc ccgaggagca gccgccctgc cgacgcccgg gggaagagga agcagggagg 9300

aacacctccc ccatctcctc cccgaggggg cggggcggtg cgtgccagca gcaggcgccc 9360

ggagggggcc gcgccgacat cgcagcccga gggggagcgc aagaagaagc ggctccgcaa 9420

gatgggggag acagaaccat ctcagggaaa ccttatttcc cctctaaagt ggtcgtttaa 9480

ccgaccccct cgcaggttcg tctctcaccc atcgtggctg tattcattct ctcaacgcga 9540

gttttcactc acccatcttg ttcgtcttct ggtcttttct tctgtttcag cgagatcccg 9600

tcgcgtccct cccgccattc caagtccggc cagtctgagg ccgaggatcc ggcggccgca 9660

gaggcccgga ggcgggaatc tgaccggcga gaggccgcgg atcgcctacg ggaagccgag 9720

gaggccgccc aggaggccgc ccgggctcgc caggtcgagg aaaccgctcg ggaggaggcc 9780

gcccgggccc gccaggccga ggaagccgct cgggaggagg ccgcccgagc ccaccaggcc 9840

gaggaagccg ctcgggagaa agccggattt cgccaggacg aggcaatggc gacttccgag 9900

gcagctcgcg atgaggtcgc gggcgcgtcg cttgagccca cttcctcggg cgacgctcag 9960

gcgacaactt ccggggcagc tggcgacgag gctgcgggcg cgtcgcttgg gcccactccc 10020

tcaggcgacg cccaggacca accaggtccg agggacatcc ctgagtccgg cacttccatc 10080

ggcggcccga gccgcgtggc atcctctcca aggcggctct tccccacgcc ttctatcgcc 10140

ccactgagcg cagagcccct tctgcaggcc ttggccgccg caaacaccgc ggtgttggac 10200

gggcttagtg cccaggtgga ggccctgcaa gcagagtggg cggagctcga cgccgcgtgg 10260

gcgcatgtcg aggaggggcg gcgctcagtg gaggccatgg tggaggtggg ccgcaaggca 10320

caccgccggc atgtctcgga gcttgaagcc cgtaagaagg tgttggcgga aatcgccaag 10380

gaagtggagg aggagcgggg ggctgccctc attgccacca gcgtgatgaa cgaggcgcag 10440

gacaccctcc gccttcaata cgggagctgg gaggcggagc tagggaaaaa gctcgacacc 10500

gcccaggggg tgcttgacgc tgccgctgcc cgagaacagc gggcggggga gaccgaagcg 10560

gcgtcccgac ggcgcgaaga gacccttgag gcgcgcgcca tggcgctgga agagcgcgcc 10620

tgcgtcgtgg agagggatct ggcggaccgc gaggccgccg tcactatccg ggaggcaaca 10680

ctggcggcgc acgagtccgc ctgtgccgaa gaggagtccg cactccgcct ccacgaggac 10740

gcgctcaccg agcgggagcg agctctcgag gaggccgagg ccgcggcgca acggctggcg 10800

gacagcctgt ccctccgcga ggcagcgcag gaggagcagg cgcgccgcac tctggaatgt 10860

gtccgcgccg agaggaccgc actgaaccag caggccgctg acctcgaggc gcgggagaag 10920

gagctggacg cgagggcgcg cagcgacggg gcggctgcgg gcgaaaacga cttagccgcc 10980

cgcctcgctg ctgccgaaca taccatcgcc gatctgcagg gcgcgctaaa ctcgtccgcc 11040

ggggaggtcg aggccctccg cttggcaggc gaggtagggc ccggcatgct ttgggacgcc 11100

gtctcccgcc tagatcgcgc cggtcggcag gtgggcctct ggagagggcg gaccgtaaag 11160

tacgccgcca accatggagg cctcgcccag cgcctctcga agatggccag ggctctccaa 11220

cggctccccg aggagctcga gaagacaatt aagtcatcct cgagggacct cgcccaagga 11280

gcggtggagc tcgtactggc gagttaccag gccagggacc ccaatttctc tccatggatg 11340

gcgctggatg agttccctcc tgggaccgag gacagcgcgc gcgcaggtcc gggatgccgc 11400

cgaccatatc gtccacagct tcgagggctc agcccctcgg ctcgcgttcg cccccaactc 11460

cgacgaggag gacaatgccg gtggtgcaga cgacagtgac gatgaggccg gcgacccggg 11520

cgtatcggat tgatccccca agcccccgcc attctttagt tttttcttct tttccttctt 11580

ctaaggcctt cgggcctctt ttttgtatag atcaacttaa tctgtaatca aaaatgaaga 11640

aatttttgtg tcaatttcat cttgctgtgt gtatgagatg aggatgatct gtgacgtggt 11700

ccttttgcgt cttagcttga ttaagggctc gtgcccaggt cccagtcctc aaaaggcgtg 11760

ggtcggggct agtgcctggg gagatccaca tgtcgagact ggccaggccg ggaacgtggt 11820

gaccgagggt tatgggtgac ccgattgtgg gtttttgccg attccccccc ggagttcacc 11880

acgccccggg gcacggctcg gttctgggcc ccgtttggcg attttagccg acccgagccc 11940

ccgagggcag gattgagcac gagtgaccta tttcaagtca agattcttca aaaggaaaaa 12000

aaaacacaga tacagccttt aggaaattga aactgctttt attgaaatac tgaaataaga 12060

gaaataagaa tgtgcatgtg tggcagcccc cggccaacgc tgcacgcccg agggggtgcg 12120

gggttggccc gagcccgaaa cctgacaccc gacccccccc tcaggggtag aagcgacgaa 12180

ggtgttcgat gttccacggg ttaggcagct caatgccgtc gcccgtggcc agccgtatgg 12240

agcccggccg ggggacgccg accactcgat acggaccctc ccacattggt gagagcttgc 12300

tcaatccagc acgcgtttgg acgcggcgta ggacgaggtc gtcgacgcag agtgatcggg 12360

cccggacgtg acgctgatgg tagcgccgca ggctctgctg gtagcgcgcg gctctgaggg 12420

ccgcgcgccg ccttcgctct tccaagtagt cgaggtcatc tctgcgaagt tgatcttgat 12480

cagcctcgca gtacatggtg gcccgaggag acctcagggt gagctcggat gggagaaccg 12540

cttccgcgcc gtagacgagg aagaaaggcg tttccccggt tgctcggctt ggtgtagttc 12600

ggtttgccca gagcaccgct agcaactcct cgatccatga atcgtcgtgc ttcttgagta 12660

tgttgaaggt cttggtttta aggcctttga ggatttctga attggcgcgc tccacttggc 12720

cattgcttct ggggtgggca ggtgaggcga agcagagctt gatgcccatg tcttcgcagt 12780

agtcgccgaa gagttcacta gtgaattggg tgccattatc cgtaataata cggttaggca 12840

ctccaaaccg ggccgtgatg cccttaatga atttaagtgc ggagtgctta tcgatcttga 12900

cgaccggata agcctcgggc cacttagtga acttgtcgat cgcgacatac agatactcaa 12960

acccgcccgg ggcccgccta aacggtccca ggatatcgag cccctagaca gcaaatggcc 13020

acgaaagtgg tatggtctgc agggcctggg ccggctgatg gatttgcttg gcgtggaatt 13080

gacacgctct acatcgccgg accaggtcga ccgcatcatt gagagctgtc ggccaataga 13140

aaccctggcg aaaagcttta ccaaccaagg tgcgcgaggc ggagtgggct ccgcattcgc 13200

cttcatggat atcggcaaga agcacaacgc cttgttcccg aggaatgcac ttcaggagga 13260

ttccattagc cgcgcgccga tagagggtcc cttctaccag cacgtagcgt ttggagatgc 13320

gatggacgcg ttcactccct tcgcggtcct cgggtaaagt cttatctgtg aggtatgctt 13380

ggatctcggc aatccaagca atcaatctaa gggagctggg agcgctcccc tcgggtcccg 13440

aggcctggac ttcgacgggc ctcgggggcc ggtcaggcgc gtccgtctcc cctaaggggt 13500

cgggtcgcgc cgacggctgg gcaagccttt cttcaaaggc gcccggtggg gtctgggctc 13560

gcgtggacgc gagccgtgag agttcgtcgg caatcatgtt atcccgtctg ggcacatgcc 13620

gaagctcaat cccgtcaaaa tggcgctcca tacgccgtac ttggcgcacg taggcgtcca 13680

tctgcgggtc agagcaccgg tactccttac agacttggtt aacgaccagc tgggagtcgc 13740

ctaacaccag gaggcggcgg atccccagtc cagctgccac tctgagtccg gcaaggagtc 13800

cctcgtactc tgccatattg ttagtcgctc gaaagtcgag gcggaccaag tatctgagga 13860

cgtctccgct cggagaggtc aacgtgaccc ccgcaccggc gccctgaaga gacagggagc 13920

cgtcgaactg cattacccag tgggcggtgt gaggcagctg cgaggggtcc gtgctggcct 13980

cggggattga gacgggctcg ggagccgggg tccactctgc cacaaaatcg gcgagagcct 14040

ggctcttgat agcgtgacgt ggttcaaagt gcaaatcgaa ctcagaaagt tcgattgccc 14100

atttcaccac ccgtcctgta ccctctcgat tatgcaagat ttgaccgagg gggtaagacg 14160

taaccacagt gacccgatgc gcctggaaat aatggcgcag tttcctcgag gccatcagaa 14220

tagcgtaaag catcttctgg gcctgagggt atcgggtttt ggcgtcccgg agggcctcac 14280

taacaaagta gacgggccgc tgcacctttc ggtggggccg atcctcttcg ctaggggccg 14340

catccctggg gcactcttcg tccaagcagc ctcgcggggc gcacttgtct tctgtgctga 14400

tgacctcggg gtcggaggat aacaggggcg gccttcccac agtggctttg gggccgtcct 14460

gggggtcagg ggctcctggc gtcgtcggac aagcgggcaa agggccaact ccggtcgtca 14520

ggggccttag gcctccgttc ggctcggggg cctcttctcc ctgctctttc ccgggtcgag 14580

tcagcacagg gttagcctcg gggtcaaagg gcgataggtg cggccttccc acagtggcct 14640

cagggccttc ctgggggtcg ggggctccta gcaccgtctg acaagcgggc agagggccaa 14700

ctccggtcgt cgggggcctc aggccaccgt tcggctcggg ggcctctcct ccctgctctc 14760

tcccgggcca agtcggcaca gggtggggaa gcgcgaaatg agaattatcc tcatcgcgct 14820

ccacaaccaa tgccgcacta actacttgcg gggtcgccgc taagtagagt agcaagggct 14880

cgtctggctc cggggcgacc ataactgggg gagagcttag atacgccttc aactgggtga 14940

gggcattttc agcttccttc gtccaggtaa acggtccgga gcgtttgaga agcttaaata 15000

agggtaacgc cttctctccc agcctcgata tgaaccgact tagggcggcc atgcaaccgg 15060

tgacgtattg cacatcccta agtttgctgg ggggcgcatc cgctctatag cccgtatctt 15120

ctcggggttg gcctcaatgc cccgggcaga gaccaagaac ccgagaagct tgcccgcagg 15180

tacaccgaac acacacttat cggggtttaa ttttatgcgg gcggagcgga gactctcaaa 15240

agtttccgct agatctatga gtaacgtttc ctggttgcgc gtctttacaa ccaagtcatc 15300

gacataagcc tcaatattac gtcctaattg gctaccgaaa gaaattcgag tagtacgttg 15360

aaaagtagga cctgcattct ttaacccgaa gggcattgtc gtataacaat aggttcctat 15420

gggggtaatg aacgcagttt tttcctcatc ctccctagcc atgcgaatct gatggtaacc 15480

agagtatgca tctagaaaac acaaaaggtc gcaccccgca gtggagtcga caatctgatc 15540

tatgcgaggc agggggtaag gatccttagg acatgccttg ttaaggtcgg tgtagtcgat 15600

gcacatccga agcttgccgt tcgccttggg aacgaccacc gggttcgcca gccactcggc 15660

ggggttgacg ctgccatcat atttttcggc gatggtgggc cggaaccttg ggggccaacg 15720

gacattccga agactcgcca caaaggctct acagccgaca ccaccaaccg ggggcacgga 15780

gggctgattc ccgcgtccgt gttgaggtga cactctggac gaggaagcgc cctccgttgc 15840

gtgggcagca cttcggtcat tacgccggcg ctcgatgctg gtgcgggcgt ccggcccccc 15900

acgcagatct ttctgggtcg aaggagtcga cgaaggagtg gcggccgaat ggcgaacagc 15960

ggctgccgct cgtcgtgccc tccgtcttga cgacgcggag ccggtggtag cagcaccaga 16020

ggccttggtg gcggaggacc gcccaccagc atctaggcgc tgccgtgccg tcatgactaa 16080

tttggccacg tcgtccagcc atcgttgggc tggagactcc gggtcaggga cgacaggcgg 16140

gtgacgtaag agcgcgcccg cagcttggag cgcgccctgg ggcgtgctgc cgtcgccgta 16200

gacgaggagg cgacgctccc catctcgccg ttcttctcca tcgcccgcga tcggtgaagt 16260

cgcggatctt tcgaccctct cgagcgcctc cccccgctta ggactttggc atggagggag 16320

cggtggagta cgagctcgac ggcgtgggtt cggctccccg tcgtcgccac tcacactcgg 16380

agagaggtcg tgcgcctttg cttgctcggc catcaggctg aacaggaaaa gcttggcgca 16440

cacggaagag tacgagagct cagaaaaaca cacactgagt cccctacctg gcgcgccaga 16500

tgacggagcg tggggctcct caccgggaga ccgcgcaggc ccccctttgc cggttcggcc 16560

ggggactcaa ggtgaaattc taagctctct gtatgtggaa ggtttgcgac cgtcgaaaga 16620

gcataagaca cgggcgatgt atacaggttc gggccgctga gaagcgtaat accctactcc 16680

tgtgttttgg gggatctgtg tatgaaggag ctacaaagta tgagccagcc tctcccttgt 16740

tctgggttcc gaatctggaa aagtccagtc cagtccagtc cccccctcta agtgggcaag 16800

gtcctccttt tatatcttaa ggggatacca catgcaccat ctccctcctt tctgtggaga 16860

cttaccctat cttttcataa atggacggag atttgtatag ttgccgtccg aatgaccttc 16920

tgataggacg gcccatacct acctccactt ccgccgaaag caggtgcgac gtgggattat 16980

ggctgtctgc tgacgacatg accagtgtca gactggtcac aaattgctca ttcctgtcca 17040

ccacgcgtca gtttagcaat ctacatgttg gcccttcttc acacaacatc ttgcctgtaa 17100

tggttaggat gaagcctggc atatatctaa ccaggactaa cgtgccatct ctaggaggta 17160

acacgctagc tccagctggg gacgagcgcc tagaaaccct cgtcctgacg ggatggggcg 17220

aggcgtgcgt cagatcgcct gtcgccacct aacccgcgat ctgaccggtc tgtgactggt 17280

cacagaccgg ataaacgagt gcactgcact tcgttacatg cggcgtgaca cgctcagcca 17340

aaccacaata aatgtggtta ggtgagcccc gctgtgctca cctaacccat acacgcggag 17400

caaaaaccca cgaggggtcg gggcgcctcg gccctcgggg ccgaggcggg tgcggtccga 17460

ccccctcggg gggactaaga ggagggcgaa cacatcaccc tcgggcccga cgtcccccga 17520

gggtgccagg ccacgtgggc gattgtgtct gcctcaaacc tctagtcatg atactcctga 17580

tcccatgtca ccgacaaggc catccgaatg tattaaggag taaaagttac aagaaaaaac 17640

accataatgc accaatgtgc atgaccacac accatacact acccccaagc acaaaccact 17700

gagggtgaag cctagcacca aacgaccgcc actaagtgtg accaaacgcc gctaggccta 17760

cggcagcaac acatagatga gacttcgaaa acgatgccac caaggtggtc acgacatcta 17820

ggatgctgcc atcgtccatc taaaaagatg tggttttcac ccagagaaac tcatcaagaa 17880

ggggagaggg taacccttga cagcgcccca aggaggttac gacgcccgaa ggcgtagccg 17940

ctgccggtcc ggtgaaccac cggactaggc ttccgcctag gaccctatag ccttgatcgc 18000

agatcaccgt ccaccactca gaaccaccac acagacaaaa ggtagcacgt agcttccacc 18060

acaccgcacc gacgcccctt cgtcggccga ctccatcgaa ccaccatccc tgagagctgg 18120

cccaggaccc ctccgttcca ccacccgccg gccgccttgc cagttttggc caaaggagaa 18180

cccgggactg ggtgacattg cttcggcagc ctgagcttcc cccgctggcg agctgctgtc 18240

tcaatccaac ctagaaactc cccgcaaaag aaggggatga gctctaggaa gggcgagggt 18300

gccgaccggc aacgaggaag acaacccatc gactccagct ccctttgcac taccatctgg 18360

ccctgcgcca atgccggata cgctgtcgct ccggctccgg cgccacccac ctgcaccccc 18420

tttgcctggt ctccgcgccc ctcctggctg cgtcgcgccg cccagctggc cgctaagggc 18480

accgcgacgg ccgcccggct accgaggcct ggccgcgcca tgggacagct cgcgctggca 18540

ccagcgagcc acggccgtcg cgctgttgcc ggcgccagcg agcacaaccg ccagctccaa 18600

gggccgagca tgccactgag ccgccgccgc tgccgcccgg gccggctgca cgtcaccggc 18660

gcacacgacc gcacgccgcc acgctccgcc tccgcgcccg aggcagcccc atgccattgc 18720

cgcgcacctc gcccgcccgc tgccgagccg ccaccgcgca ccttgctgag ccgccaccgc 18780

cgtccctagc cgcctcgtgc cgccgccacg ccagatccag gcgcgggatg gccggatccg 18840

gccttggggg cgccggatcc accgcctccc cacaccgcca cggcgtcacc acctccgacc 18900

gcagtgaggg cttcgtcgtt tgccccatcc tcatcgcgtc gaggaggaag acgccaagaa 18960

aaaagggcct cgccgctgcc ttccttgctc gctgccggct tcgccgccgg cgagctccgg 19020

cggcggcgag gtgggggaga agaagtgggg agtgggcagc tagggttttt tcgcccccca 19080

agccgcccgt gcgagagcga cggtgggggg gggggggact ttccaacctc ttccagtgtt 19140

ctagttctcc acgttatgta actcaatttg tttaaccata gaaagtaaga aacctaccag 19200

cgtgttaagc tctctttcat tccctttctt cttcctggtt ttgcttccat cacatgtcaa 19260

gtgaagggtt cttaactacc attactccta cacatctaat ttttttctca gatctttcgc 19320

aggtatatat tgatgctaca ttttatgatc ttaagataat ctccttcaca ttaccctctg 19380

ctgaaacttt agcttgaacc gtcatcttca ccacaatttg agcccaattt gcacagagca 19440

caacgagcaa tagcttgccc ttacgttcat tatttagcat gaactactac taactaccca 19500

agaatcaata caccggttta ataacgccat tttatcacgt taatatatgt ttcattcaac 19560

acaccggttt tggcacagtt gcaaacttgc aataaattct ttcctacttc tccatcccat 19620

aatataacaa attggtatgt ctcgtctggt actaagttac tatattatga gatggaggga 19680

gcacttcttt tcttccaaaa tataagaata tagtattgga ttagatatta tctagattca 19740

cgaattcgat taggttgtct agatttatag ttgtatgtaa tgtataattc ggtaataggt 19800

tattacctct caggatggag ggagtagttt tgactttttt tttcttataa atcgctttga 19860

tttttatatt agtcaaattt tatcgagttt aactaagttt atagaaaaaa attagcaaca 19920

tttaagcacc acactagttt cattaaattt agcatggaat atattttgat aatatatttg 19980

ttctgtgtta aaaatgctgc tatatttttc tataaacgta gtcaaattta aataagttag 20040

actaaaaaaa atcaaaacga cttataatat gaaatggagg aagtagtaga ctataacaaa 20100

tttaaaccgt gctttgattt tagagcatca ctaatatgtt agcaataatc tatccctaaa 20160

atttattttt tttcctaaac tgaaaatagg aagtggaaat actcctccat ctaagagaga 20220

gcctaaattc aataaaaaac taaaaaacta aaggtggatc cctctattaa actaccgcaa 20280

aaaatttatg ttttttttct cttccacgcg cgcagaacag atatctcgat caagttagca 20340

tgtaaaattt ttaaagagat accttatacg actccttccg tatttccaaa agcaaacgga 20400

tttaaaatct gactcaaata aagatctata tatccaattt acatgacaca tgtttcgccg 20460

aatttttata ttaataataa ttaatatttt taaaattaaa ttattagcaa tttgtttgga 20520

ggatttatca aaacaggatg gacgttgttt ataacagcgt ctagacctag acgcgcttgc 20580

aaactgcggc caccctttta tcacacaaat ttttgacaat ttgacacttt ccaaaaatta 20640

attttataaa ttaaccgtga ccaaaactta tttaaaaatg atctttttgt tgagcgcaaa 20700

atcgtatact tcagcgccaa atagcacggc gccgacctcc cccttcccct cccctctatc 20760

ctccactgct gccgcccacc tctccgtatc agctgcgtcg cgttggtttc cgccggcgct 20820

gctgctgctg caccagtccg ctagggcggg cgggcatggc gcgccgcgcc gcttcccgcg 20880

tccgcgccgg cgctgttggc gcccttcgct cggagggctc gacccaaggg cgagggggcc 20940

gcacgggggg cagtggcgcc gaggacgcac gccacgtgtt cgacgaattg ctccggcgtg 21000

gcaggggcgc ctcgatctac ggcttgaact gcgccctcgc cgacgtcgcg cgtcacagcc 21060

ccgcggccgc cgtgtcccgc tacaaccgca tggcccgagc cggcgccgac gaggtaactc 21120

ccaacttgtg cacctacggc attctcatcg gttcctgctg ctgcgcgggc cgcttggacc 21180

tcggtttcgc ggccttgggc aatgtcatta agaagggatt tagagtggat gccatcgcct 21240

tcactcctct gctcaagggc ctctgtgctg acaagaggac gagcgacgca atggacatag 21300

tgctccgcag aatgacccag cttggctgca taccaaatgt cttctcctac aatattcttc 21360

tcaaggggct gtgtgatgag aacagaagcc aagaagctct cgagctgctc caaatgatgc 21420

ctgatgatgg aggtgactgc ccacctgatg tggtgtcgta taccactgtc atcaatggct 21480

tcttcaagga gggggatctg gacaaagctt acggtacata ccatgaaatg ctggaccggg 21540

ggattttacc aaatgttgtt acctacaact ctattattgc tgcgttatgc aaggctcaag 21600

ctatggacaa agccatggag gtacttacca gcatggttaa gaatggtgtc atgcctaatt 21660

gcaggacgta taatagtatc gtgcatgggt attgctcttc agggcagccg aaagaggcta 21720

ttggatttct caaaaagatg cacagtgatg gtgtcgaacc agatgttgtt acttataact 21780

cgctcatgga ttatctttgc aagaacggaa gatgcacgga agctagaaag atgttcgatt 21840

ctatgaccaa gaggggccta aagcctgaaa ttactaccta tggtaccctg cttcaggggt 21900

atgctaccaa aggagccctt gttgagatgc atggtctctt ggatttgatg gtacgaaacg 21960

gtatccaccc taatcattat gttttcagca ttctaatatg tgcatacgct aaacaaggga 22020

aagtagatca ggcaatgctt gtgttcagca aaatgaggca gcaaggattg aatccggata 22080

cagtgaccta tggaacagtt ataggcatac tttgcaagtc aggcagagta gaagatgcta 22140

tgcgttattt tgagcagatg atcgatgaaa gactaagccc tggcaacatt gtttataact 22200

ccctaattca tagtctctgt atctttgaca aatgggacaa ggctaaagag ttaattcttg 22260

aaatgttgga tcgaggcatc tgtctggaca ctattttctt taattcaata attgacagtc 22320

attgcaaaga agggagggtt atagaatctg aaaaactctt tgacctgatg gtacgtattg 22380

gtgtgaagcc caatatcatt acgtacagta ctctcatcga tggatattgc ttggcaggta 22440

agatggatga agcaacgaag ttacttgcca gcatggtctc agttggaatg aaacctgatt 22500

gtgttacata taatactttg attaatggct actgtaaaat tagcaggatg gaagatgcgt 22560

tagttctttt tagggagatg gagagcagtg gtgttagtcc tgatattatt acgtataata 22620

taattctgca aggtttattt caaaccagaa gaactgctgc tgcaaaagaa ctctatgtcg 22680

ggattaccga aagtggaacg cagcttgaac ttagcacata caacataatc cttcatgggc 22740

tttgcaaaaa caatctcact gacgaggcac ttcgaatgtt tcagaaccta tgtttgacgg 22800

atttacagct ggagactagg acttttaaca ttatgattgg tgcattgctt aaagttggca 22860

gaaatgatga agccaaggat ttgtttgcag ctctctcggc taacggttta gtgccagatg 22920

ttaggaccta cagtttaatg gcagaaaatc ttatagagca ggggttgcta gaagaattgg 22980

atgatctatt tctttcaatg gaggagaatg gctgtactgc caactcccgc atgctaaatt 23040

ccattgttag gaaactgtta cagaggggtg atataaccag ggctggcact tacctgttca 23100

tgattgatga gaagcacttc tccctcgaag catccactgc ttccttgttt ttagatcttt 23160

tgtctggggg aaaatatcaa gaatatcata ggtttctccc tgaaaaatat aagtccttta 23220

tagaatcttt gagctgctga agccttttgc agctttgaaa ttctgtgttg gagttctttt 23280

ctcctacagt cgtattagag gagggatctt ctctttatgt gtaaatagcg aggtatgtat 23340

gtcacctctc cgaattattt ttactctggt tcctagacgg taaacaagca attatgttct 23400

gcctttgatg ccagaaaaaa cacaaaagtt tgtcgttatc tctactaacg gatcataaag 23460

gaatttgtaa ctggagtttc aaacttaatt tgtctaggca gtagttttgg cattagatcc 23520

aacattgtgt aggattcatt tgtgtgtatc aatctatagg gtttcattaa atttcgttta 23580

tgtgtactgt ttaggtgttg aatagtttga cttgtttttt aactgaacaa aagatactga 23640

aatcgttcca ttcaacaaac acatgttccg ttaatgaaat tattgtacgt taccttttgt 23700

tttcttactc acaagtgtcc tcttttctta tatcctatag attggtacaa caaattattg 23760

attcaatttt ggttttgaac attgatgatc ctccctgcac tattggtgca gctgctcttc 23820

tattcatttt gtgaagtgat gtgagtacct ctcaatccca tccttatgct tctgtgcatg 23880

cttcattcca attttttacg catatcgatt gttttctttt atataacagt ccataaagat 23940

aatcacatca tgacaaagtt atttatttct acagtatagt tatataagta ttcaccagtt 24000

ttccatgaat attttggcat gtgattacaa agaagattat ttgagaaaat ccatgctttt 24060

atttcatcat tttgtttgaa gttgaacttt aatttatggt gtaaatttca gttattattg 24120

ctagcagctc gtactcttta atggtataac ttcacttgtg cttattctcc aatatctccc 24180

ttcttgttgt tcaggttcaa gaaaatcatt tgttggattc agaatctggt gtccattttc 24240

ttcttaaatt attaaatcct ccagtgaatc ttgttgattc caaagcacca tcgataggtt 24300

ccaaacttct tggaatcagt aaagttcaaa tgcttaatgg atcaaataag gattctgact 24360

gcatttcaga ggaaatcctt tcaaaagttg aagagattct cttaagctgt caagtgatca 24420

agtcgctcga caaagatgac aagaaaacaa caaggccaga actgtgtcca aagtggcttg 24480

ctttgttgac aatggaaaat gcatgcttgt ctgctgtttc agtagagggt aagttttaat 24540

caaatttctt ggtcatgatt tccctttatg accattatat ttatttatat gagccaaata 24600

agcagttgtc aacttgtcat aagttacata gcacctattt gcaatattca tgggtggttt 24660

gcttagccct tttcttcacc tgcttttgat tgatgacttc catctgtgtt gcagaattga 24720

attggagtag tggactgcac tagaagcacc tatggccatt gtcatactag gaaggttttc 24780

ccttatcaaa tatttgattg ttacagagac ttctgacaca gtgtccagag ttggaggaaa 24840

ttttaaagag acattaaggg agatgggagg tcttgatagt atttttgacg ttatggtgga 24900

ttttcattca acattggaga tgagatctcg ctaacatcgc atattttaca tttcctttgt 24960

tcaactctaa tagattgtgc aggcttgttc cttttcgcca ttttagcttt aatgcgcttg 25020

aagccacatg aaagtaatgc ttgtccagat acatagccaa aggttgttat attttggggc 25080

atggaaaatg cttgaggtag taactatttt catcaggaca tggaaaattg gctgcaacac 25140

aaattatgtt gttttatgtt gcaaaaatag ttttttaata cttttttatt ctgcatgtgg 25200

tgttagtatc ttacagttcc tctgatgatt atatccccca cgataataac acttgaaacg 25260

ataataacac ttgacatatc tacaccaagt gaacattatt catttggatg ttacttttcc 25320

agctatactt gctgttcttg catgtgtaag caagtttgga gtaaattgcg cattaattta 25380

aatgcttggt gttcctatct gtgtactttt tattccccaa ctaataatgc aatcatatta 25440

cgctgataaa ctgaataaat aaattaacaa tatacttctg gtggcaaacc ttgtgtatca 25500

gaatctcata aaggatacat ccacttcagc tttggaccga aatgaaggaa catctttgca 25560

aagtgctgct ctcctcttga aatgtttgaa aatattggaa aatgccatat ttctaagcga 25620

tgataacaag gtaatgctcc ttatatgttc tgtttcagtt tagtacccat ttccttcttc 25680

tgtactatct tctctcctga tttgttctgt gcaaaatgtg caaacagtgc gactttgtat 25740

gtctgcttaa caattttctt ttcttcctga aaaagcaata tgaactctta cattcatttt 25800

gcttcttgca gacccatttg cttaatatga gtagaaaatt gaacccgaaa cgctccttgc 25860

tttcttttgt tggtgtcatt atcaatacta ttgagttatt atcaggtatt tttcttaata 25920

atacaatgtg ttcgctaaca caataaaatg ttttaaacat ccagtatgtt aaagttgcag 25980

tctgacgcct attttgtttt gctgcagctc tttcaatact tcagaattct tctgttgttt 26040

ccagctctac atatccgaaa tcgtctaaag tctctcaaca gagttactct ggtaataaca 26100

aacaccaatt ttgtttgatc agttgatctc gttggctttt ctatgcactg tctcaatata 26160

gtttggtcgc cattcaagtc tcactacaga tgttgaactt ggcctgacac caaatattta 26220

taaaatgcta cctgatattt ttaatatttc atgtttcctg acccagatta tcttgttggt 26280

tcctcgtata agtttaatta gtgacattct tgaagctttg ttatgcagca gatgtcatgg 26340

ggggaacttc atttaatgat ggaaagagca agaactcgaa aaaaaaaaac ttttgtcgaa 26400

ccagacacgt cattgttgct tatcttcaaa atcagaagtt tctcatatta ctatatcttc 26460

tggtagtgat gctggtctgt cacagaaggc attcaattgt tctccattta tatcaagcaa 26520

tggggcatca agtggttcat taggcgagag gcacagcaat ggtagtggtt tgaagttgaa 26580

tataaaaaag gatcgtggca atgcaaatcc aattagaggc tcaactggat ggatttcaat 26640

aagagcgcac agttctgatg ggaactccag agaaatggca aaaagactcc gtctatctta 26700

aaatgtaatc accgacagtg gtggtggtga tgaccctttt gcatttgacc gccgcgtcgg 26760

cgtcgccacc acgtaatcgc ccacgtcgct gcccccgctg ccacgtcgtc gaccgcgcac 26820

ggtaatcaca cgcatctcga ggccgccgct agctgatatc ttctcatccg gttgatttgt 26880

gattttggcg tttttgcagt ggtgatggcg gggggcgacc gtggccgagg cgtggagtgc 26940

catccgcatc agggtgtatc ggccgcgctg ctccgccctg gtccgcaggc tttggcggcg 27000

agctggcggc ggagggagac tgtggtgaga tcggatttcg ccgctggtgg tgtcgctacc 27060

atgggggatt cgccgcaggc gctctcaggt ttgcagcctc ctccactctc ttcccttttt 27120

tatttttttt tctcgcaaaa tgtgttgtga tgttcgtctc gctgggctgg cctcatagcc 27180

attaatgtag tttgctggaa catttacatt tggaacgttg ttggcaattg ctttacaaaa 27240

tgtggaattg tggaggggag aaaaatcatt tgaacctgca gtgacaaaat tgccatctct 27300

aattttaaaa ctgaaggtgt ggaaatcaaa cataatcatt gccagcgcat cattcttgtt 27360

aaccaccatg atatattgtt ggttataaca gttagctcca caccaacctt gaaggtgtca 27420

atagaatgtt tagtataaat tgaggagaac aggcagttgt taagactttc taaagaactt 27480

gtagcagcta atactagcta ttgtgcattt gtgtttcatg gaatttgagc agcaatggat 27540

atttcttact aagatgtatg atgcaaaaca aaaaactatg tctatacagt ttacatgtaa 27600

tgtgcggatg caaataaaat catgtacatg gacaaactca tgggattcat accgaattcc 27660

agaattgcat ttcttatgtg gttacttttg ttgttgattt ggttaccaga catcgatgtg 27720

atttcaaggg tcagaggggt ttgcttctac gcggtggctg cagttgcagc aatctttttg 27780

tttgtcgcca tggttgtggt tcatccactt gtgctcctat ttgaccgata ccggaggaga 27840

gttcaggaaa aaaatttgaa aatacccatt ttttgaaaaa gatttacgtt tatatacact 27900

agtatgaaga atttgcgaaa atataactaa tccgcagatc ggttatgcgg gagcgcaaca 27960

aaagtatggc gtggcggcgc ggagtggacg gccgaggcgt tcgcgcggaa tggggctgcg 28020

ggaccgagcc agtctcgctt gccggtaacg cggaaccggt acgctcccgc agcgccagtg 28080

tgcggaaccg cggcgccaac atttttttac tgcatggcac tgtgtttaat actgtttgac 28140

actgtttctg gtactgtttt acacagttcc cgggtcagtt ccgcacaatg gaggcgcggc 28200

accgaccatg aacaatgtgt gaacagtgct gcacagggtt aaaacagtgt ataaactgcg 28260

ctgcacagtg ctggagtcgc tggccactgc ggttccgcgt tttggaaccg cgggaccgtc 28320

gcgattccgc gttttggagc tgccggacca tgacggttcc gcgcaggatc gtcggtcccg 28380

tattttgaat ctgcggaacc gtcgctgtcc cgcgtttcca tttcgcggga tgcgtatatt 28440

tttataaaac ctctccatgc atgtatataa acataaatta ttgaaaaaat aagtatattt 28500

gcaaattttt ttcgagagct cagcactaca ttgcaaagat ttgggcaact ctgacaattt 28560

ccatgttcta caagcttgac gtcgagggaa tggagaacct gccaccgaat agtagccctg 28620

ctatctatgt tgcgaaccat cagagttttt tggatatcta tacccttcta actctaggaa 28680

ggtgtttcaa gtttataagc aagacaagta tatttatgtt ccgaattatt tgatgggcaa 28740

tgtatctctt aggagtaatt cctttgcggc gtatggacag caggagccag ctggtatggc 28800

tgtagtctca tccctgcttt cttaagtaga catatatgca attacagaat ttggtaaaca 28860

aacaagattt tatgaatcat atatgatttt ggggaaaaca ccaaactctc tttggtggct 28920

gccttgaaca tagttctatt cacacagtta tagcaccttc tttaaaatga agaactttgt 28980

tgcatacaca tatggccaaa ccacataatg aattttgttt atttctatct ttgaatgtta 29040

gcaccttatt ttcatgcata tcatgctaat ttgcttgccc acgttgagtg ggaatttttt 29100

tccatgtttt ataatttata tatgttctag acttctagtc cacaatttat ctacttcatg 29160

ttcctgagcc tctagtatgg ctggtagcag actaggtgct gagtgctgtc catttttgca 29220

gactgaagag aggagaaata caggactgtc cgttgttagt cagatttgta aaaatagact 29280

ctgatgtagt ttattttagc ccctatttta tatttaacaa tacaaatata taacgtatcc 29340

taagaactta tcgtaattta ggagaagttg ctcgtttcat taaattaaac tgtgaagtaa 29400

aaatgtgtgc tcgagtctgt caatgcaatc ctgtgttctt gtttgaagat atggtgtagg 29460

gcaggctagg atcgaacact gaatggtaag actgcttctg ccttcatttg tgcacttggt 29520

gctgccacgc cgattaagca gtagaacaaa gtaattttgt cgtgcacaaa tgagttatat 29580

ttcattgaaa atcgaagtga aaatgaacca aaagatagaa gaaaagggga aacttggtaa 29640

ttatatactc cacaaattta ttggtaagat ttgatattag acgctcgatt acttggctta 29700

agttaaggat atcaaatttg gggaagcacc aaaggaatta ttgtgaagga gttgtgggtg 29760

cataacgtta tctactagtt caaatcctag tgactatgaa tattaatgag taaggtaagg 29820

gatttattgt taattttagt ttctttaaga ttgtgtccga gtacaccatt cggtaagtgt 29880

aataatgttt tgtattggat tcacttgtgt tacgtgcatg tgcttttacc ttttcatttg 29940

tttctgcgtt ctgggtatga atttgacgag attccatggt cagctcaaca tatcagttac 30000

tgcgtgtcaa gcgatcttat atggtatgcg cacaagcgat tgtatacgga tatgacagta 30060

taatgtgtga tattgatacg atgttccttt cctttataaa ggaacaaaga ctttttttaa 30120

aaaaagaagg ggtattacta aaaaccaaaa tgtcaaaaac aaaatatcag tgcacatggc 30180

aagtgtgcac gagcaatagc ttgcccttac gttcattatt tagcatgtac tactactaac 30240

tacgcaaaaa tcaattcacc gattattaaa ctgttaacat cattttagca cgttaacata 30300

tgtttcattc aacacaccgg ttttggcaca tttacaaact tgcaaagttg caatactccc 30360

ttcgttacat agcataagag attttaggtg aatgtgacac atctatccaa attcattata 30420

ctagaatgta tcaccgcctc cacgccggga gggagagcgc cgccggtgga gaaaggggga 30480

gggagtggtc gaggggaacc agtagggtgc cctccccgtc gccgcctccc cgtggccgcg 30540

ccggcgagac aggaggaaga gggggagatg gagcggcgcc gccggtgagg gcgcgcgtgc 30600

gcgggggggg ggggggggga gcggcgacgc cggtgaggaa gggaagggga gtggtggctt 30660

tgagagagat aggggagagg gaaaatgatt ttagagttag ggtttgggct gctgagtttt 30720

tatatagatc gggatcaatc aggaccgtcc atcagatcgg acaactacgg tttctcccgc 30780

gttgggccgg gtgccactcc taggttgccc acactattgg gccacatgta cgctccgcgt 30840

gaaataagtt cactttaggt cctttaagtt gcctctgaat tgttcccagg ccggccgcac 30900

tattgggcca ccccataggc catgtgtacg ctccgcacag aataatttcg ctttagctcc 30960

cttaatttgt cccctcaaac ttctaaaacc agtgcaaatc tttaattttt agttcaccca 31020

ttgcaactca cgggcatatt tgctagtgac atataatatg aaacgaagga tgtagcagac 31080

tatagaattt aaactgtgct ttcattttag agcatcacta actgttattt agatttttat 31140

ttaaataaat gcagaaatga tgtttttatt atgaaaatta gcaataaagc tcccaaaatt 31200

tcaaaaaaaa attaaaagag atttattaat catggttaat ttaattaaaa attaaatcta 31260

accatatcat attatttcac ggtccgtgat gaggaaatgg cagctgctat cacttatggt 31320

gggagagaag gggcattgtt tatttttata actatctctt ataactccca tgaaactata 31380

aaataaatat aatcattatc ataacattag tttttttcca ttgcaacgca agggtaattt 31440

ttcagtacaa taaaaaaata aaagtgggcc attctgaacg gaaatttctg gttttttttc 31500

ccaagagcgc cgcacacaac tgcgcaagag atcgatcgcg atcaccctgc tcgtcgccga 31560

tctcctacac catccctgcc atctccttcc cctccactgg ctgctgctgc acctgtcagc 31620

tagggcgggc atggcgcgcc gcgccgcttc ccgcgctgct ggcgcccttc gctcggaggg 31680

ctcgatccaa gggcgagggg gccgcgcggg gggcagtggc ggtggcgcgg aggacgcacg 31740

ccacgtgttc gacgaattgc tccgtcgtgg cataccagat gtcttctcct acaatattct 31800

tctcaacggg ctgtgtgatg agaacagaag ccaagaagct ctcgagctac tgcacataat 31860

ggctgatgat ggaggtgact gcccacctga tgtggtgtcg tacagcaccg tcatcaatgg 31920

cttcttcaag gagggggatc tggacaaaac ttacagtaca tacaatgaaa tgcttgacca 31980

gaggatttcg ccaaatgttg tgacctacaa ctctattatt gctgcgctat gcaaggctca 32040

aactgtggac aaggccatgg aggtacttac caccatggtt aagagtggtg tcatgcctga 32100

ttgcatgaca tataatagta ttgtgcatgg gttttgctct tcagggcagc cgaaagaggc 32160

tattgtattt ctcaaaaaga tgcgcagtga tggtgtcgaa ccagatgttg ttacttataa 32220

ctcgctcatg gattatcttt gcaagaacgg aagatgcacg gaagcaagaa agatttttga 32280

ttctatgacc aagaggggcc taaagcctga aattactacc tatggtaccc tgcttcaggg 32340

gtatgctacc aaaggagccc ttgttgagat gcatggtctc ttggatttga tggtacgaaa 32400

cggtatccac cctaatcatt atgttttcag cattctagta tgtgcatacg ctaaacaaga 32460

gaaagtagaa gaggcaatgc ttgtgttcag caaaatgagg cagcaaggat tgaatccgaa 32520

tgcagtgacg tatggagcag ttataggcat actttgcaag tcaggcagag tagaagatgc 32580

tatgctttat tttgagcaga tgatcgatga aggactaagc cctggcaaca ttgtttataa 32640

ctccctaatt catggtttgt gcacctgtaa caaatgggag agagctgaag agttaattct 32700

tgaaatgttg gatcgaggca tctgtctgaa cactattttc tttaattcaa taattgacag 32760

tcattgcaaa gaagggaggg ttatagaatc tgaaaaactc tttgacctga tggtacgtat 32820

tggtgtgaag cccgatatca ttacgtacag tactctcatc gatggatatt gcttggcagg 32880

taagatggat gaagcaacga agttacttgc cagcatggtc tcagttggaa tgaaacctga 32940

ttgtgttaca tatagtactt tgattaatgg ctactgtaaa attagcagga tgaaagatgc 33000

gttagttctt tttagggaga tggagagcag tggtgttagt cctgatatta ttacgtataa 33060

tataattctg caaggtttat ttcaaaccag aagaactgct gctgcaaaag aactctatgt 33120

cgggattacc aaaagtggaa ggcagcttga acttagcaca tacaacataa tccttcatgg 33180

actttgcaaa aacaaactca ctgatgatgc acttcggatg tttcagaacc tatgtttgat 33240

ggatttgaag cttgaggcta ggactttcaa cattatgatt gatgcattgc ttaaagttgg 33300

cagaaatgat gaagccaagg atttgtttgt tgctttctcg tctaacggtt tagtgccgaa 33360

ttattggacg tacaggttga tggctgaaaa tattatagga caggggttgc tagaagaatt 33420

ggatcaactc tttctttcaa tggaggacaa tggctgtact gttgactctg gcatgctaaa 33480

tttcattgtt agggaactgt tgcagagagg tgagataacc agggctggca cttacctttc 33540

catgattgat gagaagcact tttccctcga agcatccact gcttccttgt ttatagatct 33600

tttgtctggg ggaaaatatc aagaatatca tagatttctc cctgaaaaat acaagtcctt 33660

tatagaatct ttgagctgct gaagcatttt gcagctttga aattctgtgt tggaattctt 33720

ttctcctaca gtccgattag aggagggatc ttctctgtat gtgtaaatag cgaggtatgt 33780

atgtcacctc tccgaattat tttgactgtg gttcctggac tgtaaacaag ctattatctt 33840

ctggtgttga tgccagaaaa aacacaaaag tttgtcgtta tctctactaa cggatcataa 33900

aggggtttgt aactggagtt tcaaacttaa ggtatctagg cagtaggtat atattgatcc 33960

tacatcttat gatcttaaga tgatatcctt ctcattatcc tctgctgaaa ctttagcttg 34020

aaccgtcatc tacaccacaa tttgagcccc ttagcacaga gcacaacgag caatagcttg 34080

cccttacgtt cattatttag catgcactac tactaactac ccaataatca atacatcggt 34140

tattaaactg tttgtacagt ttaataatgt cattttatca cgttaacata tgtttcattc 34200

aacaccacac cggttttggc acagttgcaa acttgcaata acatttttac tacttctccg 34260

ccccataata taacaatctc gttccatact atattgctat attacaggat ggatgaagta 34320

cttcttttct tccaaaatat aagaatctag tactagatta gatattattt ggattcacga 34380

atttgattag gctgtctaga tttgtagtcg tatgtaatgt ctaattcggt aataggttat 34440

tacctctttg gatggaggga gtagttttta tttcgtactc cctccgtttc atattataag 34500

ttgttttgac ttttttctta gtcaaatttt attgagtttg attaaattta tagaaaaaaa 34560

ttagcaacat ttaagcacca cattagtttc attaaatgta gcatggaata tatttttata 34620

atatgtttgt tttttattaa aatgctacta tatttttcta taaatgtagt caaatttaaa 34680

gaagtttgat tatgaaaaaa tcaaaatgac atataatatg aaactgagga tgtagcagac 34740

tatagcaaat ttaaactatg cttttatttt agagcatcac caaaagatta gcaataattt 34800

atccctaaaa ttcaagtttt gggtttctta aactgaaaat aggaagtgaa aaatcttttc 34860

cgtccaagag atagcctaaa tcttatctta actaattaaa atattcataa ttttcctttc 34920

gtcacattaa attttcgtcc gtaaatctga ttgaaatcca attggacaat ccaaaaaata 34980

gagaaaaaga acagaaaaaa taataaaaag cacacaaatc ttatctcaat cccgcgggaa 35040

gctgccgacg ccgccgaatc cgctcgagcg ccgccgccgc cgctcacggg gaacgatgtc 35100

gctgctgtcg cacgcggtat gggagggcgc cgctgccact gcttgggaga taggatatgg 35160

agagagaagg aaatgtgagg gttagggtta ggtttttccc cgtccgtatc ttcagcgaca 35220

cggaggcgat ccaagctgtc catcagatcg gacggctcag aatgcctcca tcgtcgggcc 35280

gcgcatgctt gatgggccga gggaaggccg gagggtcgaa caaacgcaat caaaggagga 35340

gttggaggag gtaaattaga atttatttgc gggctgagat agtaaatgga ctgaaaatgg 35400

cccatagaga aattgggaat tttatttaaa taaatgttga aaaggtgttt atattatcaa 35460

aattaaaaat taagctccga aaattctaaa aaatattcaa agagcattat taatcatggt 35520

taatttaata aaaattaaat ccaaccatat catattattt cacggcgcgc ggtaggaaaa 35580

tgcgcagctg ttgtcgttta cggtgggaga gaagggacat tgtttatttc cagaactatc 35640

ttttataact cccatggaac tttaaaataa atataatcat tattatagca ttagtttttt 35700

tctgtctttt ttttccccaa gagcgccgcg cagaagagat cgatcgcgat ctccctgccc 35760

cgacgtcgcc ggccgatctc tcattctctc cacgccctgc tcgtcgccga tctcctacac 35820

catccctgcc atctcctcct tcccctcccc tctatcctcc actggtgccg cccacctctc 35880

cgtataagac aaactgcgtt gcggcgttgg tttccgccgg cgctgctgct gcacctgtca 35940

gctagggcag gcatggcgcg ccgcgccgct tcccgcgctg ttggcgccct tcgctcggac 36000

ggctcgatcc aagggcgagg aggccgcgcg gggggcagtg gcgccgagga cgcacgccac 36060

gtgttcgagg aattgctccg gcgtggcagg ggcgcctcga tctacggctt gaaccgcgcc 36120

ctcgccgacg tcgcgcgtca cagccccgcg gccgccgtgt cccgctacaa ccgcatggcc 36180

cgagccggcg ccggcaaggt aactcccacc gtgcacacct atggcattct catcggttgc 36240

tgctgccgcg cgggccgctt ggacctcggt ttcgcggcct tgggcaatgt cgtcaagaag 36300

ggatttagag tggaagccat caccttcact cctctgctca agggcctctg tgccgacaag 36360

aggacgagcg acgcaatgga catagtgctc cgcagaatga ccgagctcag ctgcatgcca 36420

gatgttttct cctgcaccat tcttctcaag ggtctgtgtg atgagaacag aagccaagaa 36480

gctctcgagc tgctgcacat gatggctgat gatcgaggag gaggtagcgc acctgatgtg 36540

gtgtcgtata ccactgtcat caatggcttc ttcaaagagg gggattcaga caaagcttac 36600

agtacatacc atgaaatgct tgatcggagg atttcaccag atgttgtgac ttacagctct 36660

attattgctg cgttatgcaa gggtcaagct atggacaaag ccatggaggt acttaccacg 36720

atggttaaga atggtgtcat gcctaattgc atgacatata atagtattct gcatggatat 36780

tgctcttcag agcagccgaa agaggctatt ggatttctca aaaagatgcg cagtgatggt 36840

gtcgaaccag atgttgttac ttataactcg ctcatggatt atctttgcaa gaacggaaga 36900

tccaccgaag ctagaaagat ttttgattct atgaccaaga ggggcctaga gcctgatatt 36960

gctacctatt gtaccctgct tcaggggtat gctaccaaag gagcccttgt tgagatgcat 37020

gctctcttgg atttgatggt acgaaacggc atccaccctg atcatcatgt attcaacatt 37080

ctaatatgtg catacgctaa acaagagaaa gtagatgagg caatgcttgt attcagcaaa 37140

atgaggcagc atggattgaa tccgaatgta gtgacgtatg gagcagttat aggcatactt 37200

tgcaagtcag gcagtgtaga cgatgctatg ctttattttg agcagatgat cgatgaagga 37260

ctaaccccta acattattgt gtatacctcc ctaattcata gtctctgtat ctttgacaaa 37320

tgggacaagg ctgaagagtt aattcttgaa atgttggatc gaggcatctg tctgaacact 37380

attttcttta attcaataat tcacagtcat tgcaaagaag ggagggttat agaatctgaa 37440

aaactctttg acctgatggt acgtattggt gtgaagccca atgtcattac gtacagtact 37500

ctcatcgatg gatattgctt ggcaggtaag atggatgaag caacgaagtt actctccagc 37560

atgttctcag ttggaatgaa acctgattgt gttacatata atactttgat taatggctac 37620

tgtagagtta gcaggatgga tgacgcatta gctcttttca aagagatggt gagcagtggt 37680

gttagtccta atattattac gtataacata attctgcaag gtttatttca taccagaaga 37740

actgctgctg caaaagaact ctatgtcggg attaccaaaa gtggaacgca gcttgaactt 37800

agcacataca acataatcct tcatgggctt tgcaaaaaca atctcactga cgaggcactt 37860

cgaatgtttc agaacctatg tttgacggat ttacagctgg agactaggac ttttaacatt 37920

atgattggtg cattgcttaa agttggcaga aatgatgaag ccaaggattt gtttgcagct 37980

ctctcggcta acggtttagt gccagatgtt aggacctaca gtttaatggc agaaaatctt 38040

atagagcagg ggttgctaga agaattggat gatctatttc tttcaatgga ggagaatggc 38100

tgtactgcca actcccgcat gctaaattcc attgttagga aactgttaca gaggggtgat 38160

ataaccaggg ctggcactta cctttccatg attgatgaga agcacttttc cctcgaagca 38220

tccactgctt ccttgttata gatcttttgt ctgggggaaa atatcaagaa tatcatagat 38280

ttctccctga aaaatacaag tcctttatag aatctttgag ctgctgaagc attttgcagc 38340

tttgaaattc tgtgttggaa ttcttttctc ctacagtccg attagaggag ggatcttctc 38400

tgtatgtgta aatagcgagg tatgtatgtc acctctccga attattttga ctgtggttcc 38460

tggactgtaa acaagctatt atcttctggt gttgatgcca gaaaaaacac aaaagtttgt 38520

cgttatctct actaacggat cataaagggg tttgtaactg gagtttcaaa cttaaggtat 38580

ctaggcagta gttttgacat tagatccaac attgtgtagt attcatttgt gtgtatcaat 38640

ctatagggtt tcattaaatt tcatttgtgt actgtttagg tgttgaatat attgttttac 38700

ttgtttttta actgaacaaa agatagctga agctttgttc tttaccaaat gcagtagtga 38760

tcatcacaat atattttttt acggaacagg agattgtata aaatggtttc catcggcggc 38820

caacggcgac cgctctgctc tgacccacca cccaatccat ccatccactc gccgccgccc 38880

ctgatccaag cctccgccgc gcgacagcga cgcaccgccg tcgagaggag gaggcgtgag 38940

ccccatgggg accctcctcc ggccgcgtaa tgccgctgca cggtaaccac gcgcctctcg 39000

aggcctccgc cgctagctga tctcttctca tcctgtttgg gtttgggttt gtgatttggg 39060

tgttttttcc gcagcggtgg tggtggtggt ggttgcggcg ggagggggcg gtggccgcgg 39120

ccgtggcgtg gagtgccagc tgcatcgggt gcaccgccgc cggggtccgc aggttgtggt 39180

ggcgacggcg agctgaggag gcggagggag actggtgagg gacacaggca ggcaggctct 39240

caaggctaag cttgttacag gtactgagac tagttactaa ttactttgat aatcagtata 39300

aataagcttg tgtagtgtaa tggcattgtg catttctgca cttgtaaatt ttacagaaga 39360

tggtcattca atttgaacct gcatctaata ttttagtggt ttgagtttat tctcccagtc 39420

acagagttga agaggcaagt aacctgtaag agaggactga acattaacac ctcttgttcg 39480

attaaaaatg accaaagagc atcaaacatg tattcgaggc tgttacttta atatggccca 39540

ttaatttgtt tagttggcta tgtacatcct agttggtgca gtgttgtgga aaacggaata 39600

cgggtgtcgg atggacgagg tgccgtcaag cgattaatcg taatacggat gattaaacgg 39660

aattatatgg atttttggcg ttcgcactaa gatgtacata attgatgtta atggcaatgg 39720

tggagacaaa atgcatcatc ttaataaaaa atatttgtat aaatctctaa ctatattatg 39780

aaaatgccat ttattagttc aatagatatc aacactgatg gttagtagcg caatagcatt 39840

gggcttgtta gtcaaaatag tgcagctggg ctgcaagttg caagtttatg ttagtttcat 39900

aaacagacat ctgatttgtc gataaataac cgactaatcg tgccatacaa ctgtataatt 39960

actctgaaat agtaatgttg ctccgacttg atgatacggt acggtctggc taccgtttcc 40020

gttttgacag acgattaaac ggctgtgccg gtcgacttcc acaacactga gttggtgtaa 40080

atgccagtta ccatttctat gatctaaaat aatcaactct tttagtatat tttcaaaaac 40140

gaaaattcag tacacatgca tgaatcttaa tcttcatatc tagctcgtta caaaatcaac 40200

aaaggcaccg tgtcagctgg tgcacattag ctagttcgta cttagcatta tccactagca 40260

ccttattttc atgcatatca tgctaatttg cttgcccacg ttgagtggga atttttttcc 40320

atgttttata atttatatat gttctagact tctacttcat gttcctgagc ctctagtatg 40380

gctggtagca gactaggtgc tgaatgctgt ccttttttgc agactgaaga gaggagaaat 40440

acaagactgt ccgttgttag tcagatttgt aaaaatagac actgatgtag tttatttttg 40500

cccctatttt atatttaaca atacaaatat ataacgtatc ctaagaattt atcgtaattt 40560

aggagaagtt gctcgtttca ttaaattaaa ttgggaagta aaaatgtgtg ctcgagtatg 40620

tcaatgcaat cctgtgttct tgtttgaaga tatggtgtag ggcaggccag gattgaacac 40680

tgaatggtaa gactgcttct gctttcagac gttattgcta aatttttagc tagttgcaat 40740

tagtgctgtc acgccgatta agcagtagaa caaagtaatt ttgtcgtgac aaatgagtta 40800

tatttctttg aaaatcgaag cgaaaacgaa ccaaaagata gaagaaaagg gaaacttggt 40860

aattactcca caaagagaac aaatttattg gtaagatttg atatgagatg ctcgattact 40920

tggcttaagt taacaatatc aaatttgggg aagcaccaaa agaattattg tgacttaagt 40980

taaagatatc aaatttgggg aagcaccaaa ggaattattg tgatggagtt gtgggtgcat 41040

aacgttattt gctttgttca aatcctagtg actatgaata tgaatattaa tgcgtaaggt 41100

aaggaattta ttgttaattt taggttcttt acgattgtgt ccggggacgc cattcggtaa 41160

ctgtaataat gttttgtatt ggattcactt gtgttacatg cacgcactaa acatgtgctt 41220

taccttttca tttgtttgtg cgttctgcgt ttgaatttga cgagattcca tggtcagctc 41280

aacatgtcag ttactgcgtg tcaagcagtt actgcgtgtc aagcgatctt atatggtatg 41340

cgcacaagcg attgtatacg gatatgacag tataacgtgt gatattgatt tttttatata 41400

aaaaaatacg atgttacttt ccttcataaa ggaacaaaga cttttttttt aaaaaaaaga 41460

aggggtatta ctaaaaacaa aaatgtcaaa aacaaaatat cagtgcacat ggcaagtgtg 41520

ctcggcaatt ttttgtctgt actttaaaca aaaatatttc tatatggtat tttttacaag 41580

ggtgtcacaa atattttaaa ttagccaaac atctgcattt tattaaaaac tgtataaatt 41640

ataatttata ctctaaaagg ttgtgtacat ctctcttgga gaaaatgtat aagttgcgaa 41700

caaacattaa tccacgttat ataagtcaat ctgttattta accatagaaa gtaagaaacc 41760

tactagcgtg ttaagctaag ctctctttca ttctctttct tcttcctggt tttgcttcaa 41820

tcacttgtca agtgaagggt tcttaactac cattactcct actcaccaaa tttttttctc 41880

agatctttcg taggtatata ttgatcctac atcttatgat cttaagatga tatccttctc 41940

attatcctct gctgaaactt tagcttgaac cgtcatctac accacaattt gagcccctta 42000

gcacagagca caacgagcaa tagcttgccc ttacgttcat tatttagcat gcactactac 42060

taactaccca ataatcaata catcggttat taaactgttt gtacagttta ataatgtcat 42120

tttatcacgt taacatatgt ttcattcaac accacaccgg ttttggcaca gttgcaaact 42180

tgcaataaca tttttactac ttctccaccc cataatataa caatctcgtt ccatactaga 42240

ttgctatatt acgggacgga tgaagtactt ctttccttcc aaaatataag aatatagtac 42300

tagattagat attatttgga ttcacgaatt tgattaggct atctagattt gtagtcgtac 42360

gtaatgtcta attcggtaat aggttattac ctctttggat ggagggagta gtttttattt 42420

cgtactccct ccgtttcata ttataagttg ttttgacttt tttcttagtc aaattttatt 42480

gagtttgact aaatttatag aaaaaaatta gcaacattta agcaccacat tagtttcatt 42540

aaatgtagca tggaatatat ttttataata tgtttgtttt tttattaaaa tgctactata 42600

tttttctata aatgtagcca aatttaaaga agtttgatta cgaaaaaaaa tcaaaatgac 42660

atataatatg aaactgagga tgtagcagac tatagcaaat ttaaactatg cttttatttt 42720

agagcatcac caaaagatta gcaataattt atccctaaaa ttcaagtttt gggtttctta 42780

aactgaaaat aggaagtgaa aaatcttttc cgtccaagag atagcctaaa tcttatctta 42840

actaattaaa atattcataa ttttcctttc gtcacattaa attttcgtcc gtaaatccga 42900

ttgaaatcca attggacaat ccaaaaaata gagaaaaaga acagaaaaaa taataaaaag 42960

cacacaaatc ttatctcaat cccgcgggaa gctgccgacg ccgccgaatc cgctcgagcg 43020

ccgccgccgc cgccgccgct cacggggaac gatgtcgctg ctgtcgcacg cggtatggga 43080

gggcgccgcc gccgctgctt gggagatagg atatggagag agaaggaaat gtgagggagg 43140

gttaggtttt tccccatccg tatcttcagc gacacggagg cgatccaagc tgtccatcag 43200

atcggacggc tcagaacgcc tccatcgtca ggccgcgcat gcttgatggg ccgagggaag 43260

gccggagggt cgaacaaacg cagtcagagg aggagttgga ggaggtaaag tagaatttat 43320

ttgcgggctg agatagtaaa tggactgaaa atggcccata gagaaattgg gaattttatt 43380

taaataaatg ttgaaaaggt gtttatatta tcaaaattag aaattaagct ccgaaaattt 43440

taaaaaatat tcaaagagca ttattaatca tgattaattt aataaaaatt aaatccaacc 43500

atatcatatt atttcacggc gcacggtagg aaaatgcgca gctgttgtcg ctgacggtgg 43560

gagagaaggg acattgttta tttccagaac tatcttttat aactcccatg gaactttaaa 43620

ataaatataa tcattattat agcattagtt tttttctgtc ttttttttcc ccaagagcgc 43680

cgcgcagaag agatcgatcg cgatctccct gccccgacgt cgccggccga tctctcattc 43740

tctccacgcc ctgctcgtcg ccgatctcct acaccatccc tgccatctcc tccttcccct 43800

cccctctatc ctccactggt gccgcccacc tctccgtata agacaaactg cgttgcggcg 43860

ttggtttccg ccggcgctgc tgctgcacct gtcagctagg gcgggcatgg cgcgccgcgc 43920

cgcttcccgc gctgttggcg cccttcgctc ggacggctcg atccaagggc gaggaggccg 43980

cgcggggggc agtggcgccg aggacgcacg ccacgtgttc gacgaattgc tccgccgtgg 44040

caggggcgcc tcgatctacg gcttgaaccg cgccctcgcc gacgtcgcgc gtgacagccc 44100

cgcggccgcc gtgtcccgct acaaccgcat ggcccgagcc ggcgccgacg aggtaactcc 44160

cgacttgtgc acctacggca ttctcatcgg ttgctgctgc cgcgcgggcc gcttggacct 44220

cggtttcgcg gccttgggca atgtcattaa gaagggattt agagtggacg ccatcgcctt 44280

cactcctctg ctcaagggcc tctgtgccga caagaggacg agcgacgcaa tggacatagt 44340

gctccgcaga atgaccgagc tcggctgcat accaaatgtc ttctcctaca atattcttct 44400

caaggggctg tgtgatgaga acagaagcca agaagctctc gagctgctgc acatgatggc 44460

tgatgatcga ggaggaggta gcccacctga tgtggtgtcg tataccactg tcatcaatgg 44520

cttcttcaaa gagggggatt cagacaaagc ttacagtaca taccatgaaa tgctggaccg 44580

ggggatttta cctgatgttg tgacctacaa ctctattatt gctgcgttat gcaaggctca 44640

agctatggac aaagccatgg aggtacttaa caccatggtt aagaatggtg tcatgcctga 44700

ttgcatgaca tataatagta ttctgcatgg atattgctct tcagggcagc cgaaagaggc 44760

tattggattt ctcaaaaaga tgcgcagtga tggtgtcgaa ccagatgttg ttacttatag 44820

cttgctcatg gattatcttt gcaagaacgg aagatgcatg gaagctagaa agattttcga 44880

ttctatgacc aagaggggcc taaagcctga aattactacc tatggtaccc tgcttcaggg 44940

gtatgctacc aaaggagccc ttgttgagat gcatggtctc ttggatttga tggtacgaaa 45000

cggtatccac cctgatcatt atgttttcag cattctaata tgtgcatacg ctaaacaagg 45060

gaaagtagat caggcaatgc ttgtgttcag caaaatgagg cagcaaggat tgaatccgaa 45120

tgcagtgacg tatggagcag ttataggcat actttgcaag tcaggcagag tagaagatgc 45180

tatgctttat tttgagcaga tgatcgatga aggactaagc cctggcaaca ttgtttataa 45240

ctccctaatt catggtttgt gcacctgtaa caaatgggag agggctgaag agttaattct 45300

tgaaatgttg gatcgaggca tctgtctgaa cactattttc tttaattcaa taattgacag 45360

tcattgcaaa gaagggaggg ttatagaatc tgaaaaactc tttgagctga tggtacgtat 45420

tggtgtgaag cccaatgtca ttacctacaa tactcttatc aatggatatt gcttggcagg 45480

taagatggat gaagcaatga agttactttc tggcatggtc tcagttgggt tgaaacctaa 45540

tactgttact tatagcactt tgattaatgg ctactgcaaa attagtagga tggaagacgc 45600

gttagttctt tttaaggaga tggagagcag tggtgttagt cctgatatta ttacgtataa 45660

cataattctg caaggtttat ttcaaaccag aagaactgct gctgcaaaag aactctatgt 45720

taggattacc gaaagtggaa cgcagattga acttagcaca tacaacataa tccttcatgg 45780

actttgcaaa aacaaactca ctgatgatgc acttcagatg tttcagaacc tatgtttgat 45840

ggatttgaag cttgaggcta ggactttcaa cattatgatt gatgcattgc ttaaagttgg 45900

cagaaatgat gaagccaagg atttgtttgt tgctttctcg tctaacggtt tagtgccgaa 45960

ttattggacg tacaggttga tggctgaaaa tattatagga caggggttgc tagaagaatt 46020

ggatcaactc tttctttcaa tggaggacaa tggctgtact gttgactctg gcatgctaaa 46080

tttcattgtt agggaactgt tgcagagagg tgagataacc agggctggca cttacctttc 46140

catgattgat gagaagcact tttccctcga agcatccact gcttccttgt ttatagatct 46200

tttgtctggg ggaaaatatc aagaatatta taggtttctc cctgaaaaat acaagtcctt 46260

tatagaatct ttgagctgct gaagcatttt gcagctttga aattctgtgt tggaattctt 46320

ttctcctaca gtcctattag aggagggatc ttctctgtat gtgtaaatag cgaggtatgt 46380

atgccacctc tccgaattat ttttactgtg gttcctagac tgtaaacaag caattatgtt 46440

atgctgttga tgccagaaaa aacataaaag tttgtcgtta tctctactaa cggatcataa 46500

agggatttgt gactggagtt tcaaacttaa tgtgtctagg cagtaatttt gacattagat 46560

ccaaaacaat ttatagggtt tcattaaatt tcatctatgt gtactgttta ggtgttgaat 46620

agtttgactt gttttttaac tgaacaaaag atatgtctga agctttgttc tttaccaaat 46680

gcagtactga tcatcacaat atatttttta tggaacaaga ttggattgta tagaatggtt 46740

tctgatctga ttatcttatc tcaacgtatt attatgcaca tgtactaatc atgaaatatc 46800

tgatggaatg atgtttctat ttacctgtgt gaggcagcaa ggagtgagat ggataacacc 46860

acatactccc tctgtcccag aatataagaa gttttagagt tggacacgat tattaagaaa 46920

gtaggtagaa gtgagtagtg gagggttgtg attgcatgag tagtggaggt aggtgggaaa 46980

agtgaatggt ggagggttgt gattggttgg gaagagaatg ttggtagaga agttgttata 47040

ttttggggag tacattatta ttctagaaca atactgttgt gctcaagaag cgttccaaag 47100

atgtttcaca acctgtgctc gatgggtttt gagcttaatc ctgggacatt cagtatcatg 47160

atctgtctca ttcttaaaca tggaataaag gatgacagca tgatttcttt gtctctataa 47220

tcttttggct acccacagat aatagctgta aatctatact actttaaaag gagtagtggt 47280

ggtggtgagt ggtgaatctg ccaccacccc accaccaact ctcaaaattc tgacatgtgg 47340

gatcactgtc aatcccttct ccaagacatg tgggatcact gtcaatccct tctccaaacc 47400

aattgtatga tagaacagtg gaaatcacgg acagaccatg gagctctcaa ccataatcat 47460

ccttgcgagt taataacaaa tggagcgtaa acttggcaag caaaaaactc aaattaattc 47520

taaaattaag ctctaggatt caaaatagat ttcctctctg cattgtgctg ttatgatttt 47580

taattccgta acaacgcaaa tgcattttgc tagtcttata aagaagggtt aatgcaaata 47640

ttctgattaa atgattgtat ctatgaagtt tgaatgctag tggaagctcc tttgaccatg 47700

ttttgttgtg cgagcattta agagagtgaa gagaatgctt ctttggtgct gttctggtat 47760

ggaaggatcc acagataaaa ttcaggttct actgcttctc tgcttgtaat tttcatgaag 47820

ctgcagtgaa taccttgttg accacttgat ctgttgcttt gaaggagaat atagtagtgg 47880

ccaaggttgg tgacggtgat ggtggcatgt gatcccccag atcttcagtg acccagagag 47940

gaggggacgg cgcgtggtga gctacaaggc atactcagtg gagggcaaga tcaaggcctc 48000

ccgtccgtag gggactccgc tgcatcaagg ccaactgctc cgaactgatc aatttctggt 48060

acggatcact tctcctttcc tttttttttt caccttaagc actctcttga ttcttcgctg 48120

ctacctccct taatttcttt caatatattg tggcacttga tcatggcgga gacccacctt 48180

ccagtgtgaa tggattttgt caaagaacta aatttattcc attagcttat tttccgatta 48240

catggaagac attcttttct ggaataaata cagaactaaa tcctgtttcc tgaataaaag 48300

ttgttagtgt gtggcatggt gcatttccgc gcttctaaat tttataaaac ctgttcattc 48360

aatttgaacc tgcatccaat ccaatatttt aggtgcagac aggtgcttgc ggtcaggtta 48420

aagaagttgg caaaaatgct tctgaagaaa ggttaattgt tgtttcatct caggaggtaa 48480

tatgcagatg attattccaa ttggcattgc cttgccattt ttatcacgag tctttacaat 48540

tttatatcct cctacatatt ctttccagat tccagatgat ccagtgtctc caacaattga 48600

ggcgcttatt ttgctccata gtaaagtaag tacacttgct gagaaccacc agttgacaac 48660

acggcttgtt gtaccatcaa acaaagttgg ttgtattctt ggggaaggtg gaaaggtaat 48720

tactgaaatg agaagacgga ctggggctga aatccgagtc tactcaaaag cagataaacc 48780

taagtacctg tcttttgatg aggagcttgt gcaggtaatt tatttggcca tacctacacc 48840

agagatccat atattacttt tataactgca gtttttactt gttaacattt cattgtgctt 48900

ttacatttgt tccaagcttt caggttgctg ggcttccagc tattgaaaga ggagccctga 48960

cagagattgc ttcgaggctt tgaactagga cactcagaga tggaagttct tccaataatc 49020

cgacaccttt tgcccctgtt gatggtcctc ctgttgatat cttgcctaac aaggaattca 49080

tgctatatgg acgatctgct aatagtcccc catatggagg gcctgctaat gatccaccat 49140

atggaagacc tgccattgat ccaccatatg gaagaccaat atccacaata tggaagacct 49200

gccaatgatc caccatatag aagacctgtc aatgatacat catattgagg gttgaacaat 49260

gatgggcctc gtgatcaggc ccggtcctga ggggggtcga atggggcgat cgctccgggc 49320

cccccgattc ccagggcccc cacctatctg tgcaacgagt agtagcgatc ttccagcgcg 49380

caacgtgagg cgatgtttct ccgtgatttc gccggcctgc aactgcgaga tcgcgagtat 49440

aacgatcagc cgatcgatct catctgccga ctgccatgct gatgccacac gcaagcgcag 49500

catatcagcc ttatcttggt tgatcggcat gctggacgag cacatctgtt gtcgcatcaa 49560

ctgctgactg ctatatatgt gctggtgctg aatcgatcga ttgtcgtcac ggaagtgaag 49620

aacaaccacg gcactgctgc ctgctgggct ctagccgcca tcagtaagta cgctatactg 49680

cctatctaga tctagatcga gattacatag tggaattatc tgtttataac aaaattacaa 49740

ggtatcaatt gataatttaa ggttataacc gtacaaactt cagtgatttg ctggtttcac 49800

attggttaga tttgtttcaa ctaatttggt acttctgtag ccttgtaatt tacgaatcta 49860

gtattaatat tttcttaagt attagcctgt tccttgatat tatgctgttg agaaagtatg 49920

caatagataa caaaaacaag taggtgtgtt gaggatgctc aagagtaata caggcacttc 49980

aataattctg atattatcag gacatcatca ataattctgc gcctacaaat cttcaaagaa 50040

aattttaata taatgcgtat gattttttaa atacgaatat tgattgctat ttaaagatat 50100

ttatattata tggtaattat tatttgaagg tttataataa aggcctccgt ttttagtttc 50160

acgctgggcc ttcagaatct caggaccggc cctgctcatg atccttacac cgtgtatcct 50220

gtagagtact tctctaaaag agagtaccct agtggaagta gcaaagttgc accatctgct 50280

tcatacgaaa gatatgcagc aactactcgc ttgcctaata gagaactgcc ctcatctatt 50340

agtcctggtg ccgattatat gtcctgccgt tcttatcttg accaagtacc tactgatagg 50400

tactctaata gggttacact acaattaggc ctcttgagag ccgggaatag taatgtgcaa 50460

caattaggaa tcaccagagc tggaaattcc aatgcttatg attatactga ggtacatttc 50520

caatgcgtta gcttgcctct tctttgcaaa tggccctcgc ctgatatgtt tccattagaa 50580

acatgaaacc atatatttga ctgttgcatt atgtctattt tcttccatga tggttcagac 50640

gtctgaaaaa aggacaaaaa tattctagaa tatgtcatgg tgatccaaat atatccttct 50700

gtcttgtgcc cactctaata tctatcgttg gtaacactat tcaattgtta ccatgttgtt 50760

gcaaacccta gattcagtta ttcagctgtt ctctgctgct gttgcttacc agttttctta 50820

gttgggtgtt gatcttttct cattttttat ttccttgttt cctggttcac ctgctgcctc 50880

tctgatgcat ctgaatgtat atttttgttc tcttcagtgc ttaatagatt taaatttcat 50940

tcttttcagg ctgcggagct gatccatgga cgtgaggatt accgaagact gtcaggtctc 51000

actgggtatg gcttacgcag actgaatttt tacaggacac aaacatgaat tttgtcctca 51060

taatcattga gtgatgatct ctttgcaggt atccaggtgg ctctgtcgaa ttgtggattc 51120

caaatagtta actggagtct gtcattggtg ttggtggtgt caatctagct gagatccgtc 51180

tggtatagcg taagagaaac atcatgcact atccccagtc ataaccatgc cccaatggcc 51240

accaatagtt ttcctcgtga aaatctcccc ttgatcccag atctctggtg cgagagtgaa 51300

gttgcacgaa gcccatcctg gttcttccga gtccattgtg gagatccagg gcattccgga 51360

tcaagtgaaa gccgcacaga gccttctgca aggcttcatc ggcgcaagca gcaacagcag 51420

gcaggcgccc cagtcctctc gcatggccca ttatttttag taagctggag gacattcgca 51480

acaggggggt cagtggtcac tgcaaagctg agtttgttct tcagttcaac tgcagaaaat 51540

tgcagatcgg ttgccgtagt tgctagaacg gtacatagtt gccacctaac tgtagcgagt 51600

ggcataactt attgtgtgtt actgcccaat gttgtctctc cttgtgttca tggattcaga 51660

cttgtgattg tagtatttct ggatcagact ggagtaaaag aaaaaaaaaa aggaagacat 51720

gggtttaaca gtaagctcaa aacgttgaca gtagtaaaat aaaaggggtt tgttcacttt 51780

atttccaata tcaaccttac caacatttgg cgttgaatca tttataccac atcgcttgtg 51840

cagctgaatt tggggctgtt taaaagatgg tctcttggat tgctaattgc ctcgcggcaa 51900

gcgtggtacc ttgtacaata taaatataat tataactatt taatttcata attaaacatg 51960

ttgttacaaa tctctactat tataaaaatt gaagatgttt tttgccggta ttttggtacg 52020

tcatctgtgt atgaatccgt ttttaagttc gtttgctttt ggaaatacat atctgtattt 52080

gattcagttt ataagatcgt tcacttttgg taatacagaa ggaatcatat aagaattctg 52140

tttaaaaaca ctcgtatagt aacttgagac gatcagacgc ctaactacag ctcatgattt 52200

tctaaatata tatatatata tatatatata tactagaaaa aatatatgtg tgttaaaagc 52260

tatcttaatc ttattattgt tatatatttt agttaacaag aaatctattg tgggaacttg 52320

tttggatata tattttttta aaaaaaatca tgagctgcaa ttaggaatcc aatcgtctca 52380

agttagcagg agggcgagtt tttttaaaga gatttcttat acgatttctt ctatatttct 52440

aaaagcaaac gaacttaaaa accgactcaa acatggatct gtatttccaa aaacgaataa 52500

acttaaaaac cgactcatgc acagatgatt aatttttata atagtagaga taaacgaact 52560

cccacagtga attttatttt aactgaacca tataacaata ataagattaa aatagacttc 52620

acccgttgca atgcacgggc attttttcta gttaaagaag aaataaaaaa acacaaaaat 52680

ttataaaatg taaaaaagaa aaatattata attttgttag aattattatt ataatataga 52740

aaaatagttg ccaaaatttc tcaacgaatg tcgaataaac tcagcaatgt catatattta 52800

aatatgatgg taatatttgt tcgcaaaact ttaatcttca atccttcaac aacatagata 52860

tacaacgtcg taatcgccaa caagcccgag tgaccataca ggatagccga gcggtggatc 52920

tgtactgttc ttgggtgaaa taaatctagt acattgtata tcttatctta atatctacta 52980

ttataaaaat tgaagatatt tcttcaaaga tttccatacg ttctctactc cgttacaata 53040

tcggttctac tccgttacaa tatcggtttt gtacaccccg cgcacgcgtt gtgtgttctc 53100

ccgttccaat acatgaagct agagtcttgc ttctccctgg tctggcaggc cctttttcca 53160

ccatccccac cagggccagc gggttacatt gaccgatcac ggcccacatt agtggatgca 53220

gccagccacg ctcttcacaa atcatgtgat gaacattagc tgagttaaaa tttatccttt 53280

gatgattgtt agaaatgttt ttttctccac atcttctctt tcaattttgg aaaaatagat 53340

ttcttgattt ttgtgctcgt acatcactaa taaatcagtt gttacccttc cacacattgt 53400

caatttacca tgtctatttc agctcttacc ttgtatagtc ttgactcttg agtcctcgct 53460

attgactaag ttgctacatg cctcctacaa atcaatagac tgccataaca atattttcta 53520

cgacatgatc catattagtc catgcaatgc aagtacacac acactactgc acgaaaaaac 53580

tatgcaccat aacttcaaaa ctaacatgtt agaatgacgt taatttttca ttacaattat 53640

attcatcgac cgttaattta ctaggcatcc tgtttaaaaa aaatattcac cgaccatacc 53700

cacatgttcc gtagttcatt aggtgatgga tcggtagtta cagcagctgg atttttatat 53760

tttggtcatt ttgaaaaatt tatttcgcaa atagactcct gaaaaaactt atcccagaaa 53820

tagtcccttt tggagcgtca gagtggctgg cgccgtggtc caacgggaca gcgccaacct 53880

ctctggcgcc gccccccgcc tctattcttg tttctctata tagagttgca aactttttat 53940

ttttgtttta tttttttgga tgttttttca ctcttagaat cacgatacaa ccaactacaa 54000

aaaaaattaa actcgaacgg aatatatcac ttagctagaa gtctgaaaat atagcatacc 54060

acttatctac tttgcacctt caccaaaatt agaccataac ttctttagta aaatcctttg 54120

atcagcatat taaacataat gcactctatc actaggtgaa attacttaat ctaattcaaa 54180

atataactac atgtagcctt gaaaaattct acatgccaca tatttcgtcc gtttgagttt 54240

attattttta tggttcgttc atgtgagttc ccaagtgtga aaaaaaaata aaataaaaat 54300

aaaaaagttg cacatcctct cctctgcatt agagaggaga ggagaggaaa aattctacag 54360

gtcacatatt tcgtccattt gagttcattt tttctatggt tggttcttgt gtgttcctaa 54420

gcgtgaaaaa aatatcaaaa aaataataat aaataaaaaa attcgggggg ggggggcgcc 54480

agccactctt aggggtgaaa acgatcggat aatatccgat ccaatctgct ccgaatccat 54540

ccgaaataag gatatggtat gggtttttag aaatctggcg gatatggatg cggatgagga 54600

tatggtatct ccgaaatacg acggattatc cgacattttt gtcggattat ccgataggcc 54660

ctttaccgga taatccgaaa ttatgaacac atgtaaccac tctatctatt gcatataaca 54720

taagttggtc catccaatga cctaattcat caattaccct agatttctta ctatgtggtt 54780

ttcaccattt catgtcacac ttgcgtagct gtatttttat aaaatggaca tcatgtattt 54840

atgttgttta gcacttaagc acataattat tacaatgggt cgtttattga cattgtgtta 54900

tttttacttg cattgctaac tcaatgttgt attgattgca tacacacgta acatctgata 54960

aaatttaatc cgtttctgaa ccgattccgc accatttccg acatctgcat ccgtacacta 55020

tccacaccca ctccgaatcc gcttaaaaat atggtttagg atatggtatg accactatcc 55080

gtccgaatcc gctttatttt cacccctagc cactctggcg cgcttcccct gccacctcag 55140

catcgtccca ccacgtcggc agaaggacgg cggctccagc cactctggcg ccacaaaaaa 55200

ggaccatttc tagcataagt ttttttaggg gtctatttac gaaataagtt tttaaaagga 55260

ccaaaatgtg aaaaatccag gttacagcag actgtgataa gcaatagcta tattgcctat 55320

atatacacgt atatgcattg ctaatccttc aattttgtcc aattctttta aattgtcttc 55380

acctgttgca acgcatgatt ttttttctag tcttaacctt aactaatctt aataactaac 55440

taaaagattc gtatctttcc gatcgtcacc ttgtccatac gctaattttt cgtccgtccc 55500

ccctccccct caaaaaaaaa gggaaaaatc cattttacac cctcgaactc ttatgcttgt 55560

ctaaaataca cccccgaact ataaaaccgg gtataataca ccctcgagct atcaataccg 55620

gacagttcaa gggtgtatta tacctggttt tgtagtttgg gggtgtattt tagataagca 55680

taagagttca agggcgtaaa tggacttttc cccaaaaaaa atcccagtcg ttactttcca 55740

tcctgagaat cggagacagg gaaaactgaa gcatacacgc aaatagaatc aaagataggg 55800

aaaactaagc atatacacac aaatatatcc aaaaattccc atgcagctag atcgggtgcc 55860

accgttgttg ccaaaccacc acattgcaat gtaaatctaa gactaaagcc taaatcctat 55920

gctaagtcat caaattagac tcggttctac caatttggta atatatcaaa ttagacttga 55980

tttttactga tttgaggttc tcgaggtgtc acactatgaa acggaagttt ttcccgttgc 56040

aacgcacggg cactatgcaa tatcttaact aattaaaaga ttcatatttt tcctttcgtc 56100

acaccgatct ttcgtccgtc tgtaacatca cgtgcacctc ctctccaaat cccacatcat 56160

cataatccga cccaaaaaca aaatctcaat ctcaatccaa tcagaatcat cacaaaatca 56220

tccaaaatat caagagatga ttataggaga tggaggggtg agcaggagca acatcatcat 56280

cgcataaaaa ccccaaaatc aatcacaaca acgacatcat tatcacataa gaaaaacaat 56340

acaaacaaca tacacaatca acaacactgg cggatccagc cgaggggaca acggcgtggc 56400

agcgggcaga tcctctcggt cagatccgcc cacgggtgcc actgacgtcg ccgccgccac 56460

cggatccaag ggagaagctt cggacagagg gagagggggg tagaggaccg ctaaatccgc 56520

ccaccggaaa tgccgccgcc accacctccg tcggatttgc ccgagggagc gccgatgccg 56580

ccaccgccat cgcgggagaa gcttgggcac ggagggtgag gaggaggggg ggtagagaat 56640

cgccggatcc atccgctgga aaagcctccg ccggatccgc ctgccggaaa caccggtgtc 56700

gccgcctccg ccggattcgg tagcgggagc cgccgatgcc accaccgccg ccggatccgg 56760

tcggtgggag ccactgacac catcgccgcc gcctcctctg ctaccgacaa gggagagacg 56820

agaggggcgg gggcgagggc gggggacgag agggttagag ggagggaccg agtgggagag 56880

agagggacga gtgagaggag ggggacgagt gaataaggat gcgtgacctt atccactcgc 56940

gcggtcgcac cccggctctt tctctcgctc agctgttgcg cttgtggaga ggatgcgaga 57000

tttttttttg agtaaaatgc acgggcggtc cttaaacttg tagcggtctg tcatctaggt 57060

tcccaaactc tcaaaatgca tatccaggtc ctagaatttg tcaaagtgta tcatctagat 57120

cccaaaccga cacatcctct cttggatcct acatggcgct aatgtgactt gtcacatgga 57180

cgtgacacgt cttttttttt cttcttttct ttttcttttc cgttttcttc tcattcttct 57240

ttttttccat cttctgctcg ggtcacatag aaaggaaaag aaaggaaaat acaagagaag 57300

aaaaaaagaa aaaagaaaat ttttaaatgg gtctcattcg tcagtcaaaa ttatgccaca 57360

tcatgtccct gcgacatgcc acatcagcac cacgtagcat cctgaagggg ttgtggcgat 57420

ttgggaccta aatgacacac tatgacaagt tctaggactt ggatatgtat tttgagagtt 57480

taaggattta tatgacacac tactataagt ttaaggaccg cccatgccct ttactttttt 57540

tttttacacg gagagaatgc gaatttgttg gttagttgcg gctgagggtt tctcgcacgg 57600

agaaatttgc ggtgggagaa ttttttttcg aggttctttc tattgggaga agacgggatt 57660

atagggatta ttactggtgt ggtggcccct gttttctttc tttttcgagc ttctttccgt 57720

taaattcact tttctctctt caaggagcgt aggacatgac tgaatgcagc tgctgtaaat 57780

tagaaataaa aaagaaacat attctgtttt tcattttttt caataggtaa atataaagat 57840

ttttaagtaa tatttaaaaa tatatagtgc tgatcaacga cattgttaag tgagattttg 57900

ctgttactat cacttttttt tccattgggc tcacgtacgg cattaaaagt tttagttttg 57960

gttctctcct tttgagtttg ggcatatacc aatattgaga taggtatact aaagttcatt 58020

tggattttat tcgattcaac ttttttgggt tttgttcagt tcttttttac atgtttctca 58080

tctgaaatta ggaaattagg tttggtaaag tcttgaatag ataacgctgt tgacgtttga 58140

acatatattt atctatttat ttatttaaaa atatatgaat aatttttatt ttgttatgac 58200

ttttgtcggt gacatgggac cgggagtatc atgactagag gcttgggcag gagcgatcac 58260

ccacgtggcc tgatgtaaca tcctgaaaat tcccaacaat aaaaatcact aaaattttga 58320

actttttaaa acttttgcat catgctggtt gttatgattg ctattgcttg ccaaaccgta 58380

aatgatcaca aagaaagtaa agtaaggatc taaaatttaa gtaatagata aatttacgag 58440

aatataatat ttaattgcta accctacaaa taattacgca caagaaaaca aagccagaca 58500

aacggaaggt taattactaa tttaaattat ggattaatta ttaaatactt gaaccatgtg 58560

ttgcgtgcca tggcatctaa atacacatga aataatggtc atataattaa attaagcttt 58620

ataaaattat gtgaggtttt aattaagcaa ttagcttaat gttgtaccga gtcttaatat 58680

actatttata gaataaataa attcaaccta tccgtgtaaa atatattgct ataagttcat 58740

tcaatgtact attgtaataa taatggccac attaggatat tttaattaat tttggaaccc 58800

tcaaagcctc caaaattatc taggttaatt ttgaaattat acctcattta agtaatgcaa 58860

tagaaaaata tacataaaaa taaaatatgg gtaatattag aaattgagta aattttcatc 58920

taaattaaaa catatattgg gtaaacctcc tttatgtaaa aattaagatt tatagaatga 58980

aatttgtaca agggataaac taaaatcggg ttaaatagaa aatggcactg ttcattgcac 59040

tctaggtgct cgacgtggtc cctggcccta ttttccccct cagccgcgcg cgcctggctg 59100

cctcgcgccc cgcgccacgc cacccgcgtc gcgtcgccgc tgccgcgccg tcgccgtcgg 59160

ccgttccgcg ccgctcgtcc gtcgctccgc cgcctcgcgc cccgcgccgc gtcgtcatcg 59220

cgtcgccgtc gccatcaccg cgcctggccg cccctgaccc cgcgccgcgc cgcgccgtcc 59280

cgtagccgcg tgcgcgttcc atcgccgctg ccgcgccgcg cgccgtcacc gcgcgccgct 59340

cgtccgccgc gcatagcccc gcgccgccgc gccatcgtgt cgccgcgccg tcgcgtcgct 59400

ctcgagcccc gcatccctct cgagccccgc acgtcgcgtc ttgtcgccgt tgctgccgcg 59460

tcgtcgtcgc cgatgctgtc gcgtcgccgc tgccgcccgt cgcgtcgcct tgcgccccgt 59520

gccgccgctg ccgcgttgtc gctgtcacct tcgcgtcccg cctcgtgccg cgcgccaccg 59580

ctgccgcccc gtcatcgccc gctcgtcgcg cgcgccgccg ccgctgccgc gccgtcaccg 59640

tcgtgtcgcc gtcggcctcg cgccttgagc cgccgcgcgc ccgtcccctc gcgcctgcgc 59700

cccgccgcac ggccgtcccc tcgccgtcgc cctgcgccac tgccgcgccg cccgtcccat 59760

cgcgccgagc cccgtgccgc cgcgcgcgtc gcgtcgcccc gcctgtcacg ccgctcgccg 59820

cctcgagcca cacgcgtcgc gccgtcgcgt cgccattagg gccggccacc cctttccccg 59880

cgccctataa aaccccccgg ccacccccct ttcaccccac accatcccca cccattcccc 59940

tcttcctctc ctccttcccc tcttcgtccc ctccaccgcg ccgcgccgcc gccttcgtgc 60000

cgccgcgccg tgcgccgtcg tcgcgccgcc ctcgcgccgc cgcaccgccg ccttcgtgcc 60060

gccgcgccgt gcgccgacgt cgtgccgccg tcgccgtcgc cgtcgtcgtg ccgccgtcgc 60120

cgtcgccgtc gtcggtaagc cgccgtccct tccctcgttc cgacgccgtc gccgcccggg 60180

tgggaaggag ccgagagaga gagggaggaa ggagccggga gtaggaagaa agaaaagaaa 60240

agagagagag agaaaagaaa agagaagaaa agagaaaaga gagaaaagaa aagaaaagag 60300

attagagaag ggagggaaga gtgggcccca cctgtcatta gccccatcca attcccctta 60360

gaaaaataat tctgtagaaa agaaaatcaa gatcttgacc ccacctgtca gtcactatag 60420

cgtgtggata aggttgtatt aaaaataaat gaattaggaa cagtactatt tcgcaactat 60480

tagaattaat tcaaatttga atctttacac tagcataact aattcatttt agctccgatt 60540

tgagtggaac ttgaacctaa attcatctaa attcataagc tttccaatgg tatataattt 60600

actattaaat aaaatatatt tataattatt aagtaattaa tatcatatga ttaggttatg 60660

gtcaacttaa aaatatgcta ataaataaaa ttagtattgt ggatgtaata atatttgtct 60720

ctaacatgtc ttgccactgt aacaaccaca caaactaata ttaagtgatg tctgaaatga 60780

atgaatgaat aggaaaatac tagtacttgt ttaatattcg atagccatat aattaaaccc 60840

atggcttata ggttatttaa atcaaatgta gccttgtgat tatgcaacta aaatataaac 60900

acatatagat gaatctttag cttgattagg aggaataata acagagctag tgtgactagt 60960

tatgatatag cttgttgtcg gttgcctata tttagtaaat ggttcaatgt taatacactg 61020

atgcacacac ataccctttt tgataaccta ctagttgcat atattaaact tggtaataaa 61080

tgaagaacca atatattagc taaatactgg tgctagttat aaatcttgac cacacataat 61140

tttagttcaa accacacctg aggattgttc gttataaagt tataaagtta taaagttata 61200

caaaagataa tatgtaacta taatagtatt aaaccacaaa tctaaaatac agggcgcata 61260

attgtcaacc ttttatgcaa acggataata tccatatata tacatcatgt ggataattcg 61320

aataatagct ccattggtaa aataataatg taggcgaatc atggtgatga gatggtttat 61380

cctaaacctc cccatcgaca tagccatgct atagggacct gaccatttta ccttcataac 61440

agatctcttc cataagccaa tagctagact aaaccacaga ttagcaaatg tgtacatcat 61500

atattgtgct agttagtacc aatagaacca tcaggacaat ataaatacta aggaatctta 61560

gctcttagct tgattagaat ccaatagcaa acacgagtag tatgagcagc cttaggttcg 61620

acctcaataa ttatattttg cttgtgcata attgcttctt gttgaatatt ggtttttctc 61680

gcatattata gaaattgtat atcggttagt cgtgaggcaa cgtatgcagc tttcaggagg 61740

tgaaggttga tcaagattgt atcaagaata atgactattc taagcaggca agtcatcact 61800

attccttgaa catgttgatc ctaattgcga aattattttg tttacaaata aaattgcatg 61860

caatgatgaa catcctactt gtgattatgc catgccttga ttattgttta cccttaaaat 61920

ccttgtaacc atgattacgt atgagtccct agtcaattat gacaattgct tagagatgct 61980

attctagaat catgcatact catatttatc aaatgctata tgcttgggca attacctttg 62040

ggaaggtaat tgagatgcgg catgtggaga catgaacgcc acattgccat gatattaatg 62100

acatgatttg tgaaaggaga aataaaatta aacaactgtt ttcgactggg gcggacggag 62160

gatttgggtg gtatctggaa aaggctagta ccgtccccgg tcaattaagg accgagccat 62220

gaagttaagc atgaaacgac ccccgtacaa ccgcacttct cgtatgggta tagacctagc 62280

ggagtagata gctgagcgga ggcagtatcc atgcatagtg gtttcttgat gtgtgaggca 62340

ggggctctac ggtggggcag ccattggtag gaccgcaagg cgggtatcta cagtggtgtc 62400

gccatcggta ggactgccat gtgagaatct aaaacataat tataacttaa tgcatgtgtg 62460

agtcttccct tcccgggtgc gccagaactc ctctcactgc tagaaaccgt gtacgcctag 62520

agtgcatgag gatgaaaagt tcatggagcg ggtactgcca atgcgaggtt atcgaaaagc 62580

tctgccgtga cgcatctcat gtgttgggac gaggctcatg tgttgggcag tcgcggagtg 62640

cgggtaaagt gtacatccac tgcagtgtga gtaaaccaaa tctattcgaa tagccgtgct 62700

cgcggttatt gagcaccggg acatgtatta cacttggcta gactctaaat tcttaacttg 62760

tggggaatgg gatattgcat gatgaatttt atgctgatgg agccacatcc cgagaggagg 62820

gaaggtggac atcctcagaa aaccatgacg attcaatggc gggaagctat ccttgggatc 62880

acaatggatg gtggacagaa ccgtcgttgt ttaaagtgaa cactggtact aaaatttgat 62940

cgatctatgc taggttttag gcttgtgaaa agaattgtaa aattagcttt atgcaaaagg 63000

acctgaagcc attccttgaa ataccctcta tcatatgcat tgttattatg gtggcttgct 63060

gagtacggtt ggtactcacc cttgctattt atatatcttt taggagagtg ttgaagagaa 63120

gcccttgtcg gtacgcttgc gtatcccaca agatgatcgg agtgcggtct tgttctaggt 63180

ctcgtttccc cagtcgactg cctgtggcat gttaaccggg cccttatatt attttgtctt 63240

tcgctgttgt tctctgatag ttgttggcct acctggccct aatgtaagta tttaactctt 63300

ttagcctaaa ttcattcgtg atatgttgtg atccaactat gtatgtgtgt accaactact 63360

gatccaggga ttggtacgga taaacacaga agatttccga tttccaaaat cgggggtcta 63420

cacctgaccc cctcaggggg ggggggtcgg gcccgagggt gatgtggccg cccccctctt 63480

tgtctccccg aggggtcgga ccgctcccgt ttctgccccg agggctgagg cgccccgacc 63540

ccttgtgggt tttgcgccgc gtgtatgggt taggtgagca caacggggct cacctaaccg 63600

tatttattgt ggtttggacg agcgcgtcac gccgcatgta gcgcagtgca gcgcgctcgt 63660

ttatccggtc tgtgaccagt cacagaccgg tcagatcgtg ggttaggtgg caacaggcgg 63720

tctgacacac gcctcgcccc atcccgtcag gataagagcc tccaggcact tgtccctagc 63780

ccggagccag catgctaact cctggagatg acacgttggt cccggtcaga tatatgccag 63840

gcttcatccc aaccattaca agcaagatat tgtatgaaga agggcgaaca tgcagattgc 63900

tggactgaca cgtggtggac aagaatgacc gatttgtgac cggtctgaca ctggtcatgt 63960

cgtcggcaga caaccatgtt cccacgttgc acctgctttc ggcggagtgg aggtaggtat 64020

gggccatccc atcagaaggt cgttcggaca gcagccattg caagtctccg cccatttatg 64080

aagagatgac agggtgatcc cctggagaga aaaaaaggag gaccttgccc acttaggagg 64140

tgaggacgac tggaagggga gaggatctgg agagtagatc ccacgagagg aaaaaaggga 64200

gaagagggtt tctagagtaa gagctctctg actctccagc tctttgtagc ttcttcgtac 64260

acagatccac cagaaaatag gagtagggta ttacgcttct cagcggcccg aacctgtata 64320

catcgcccgt gtcttgtgct tttttcattc tcgcgaactt tccacagact aggagcttag 64380

aatctcgccc agggcccccg gccgaaccgg caaagggggg cctgcgcggt ctcccggtga 64440

ggagccccac gctccgtcaa ctttggctta taattaaaaa tactctaagg atattttttt 64500

atattttatt ttcttatgtc tatatgaaat tttaaataag atagatggtt aaacatatat 64560

tggaaaaaca tatatccaaa agtccactat cacaagcgta gcatagatac gattacaata 64620

cgtttccgcg aagactgttt atacctactc tattccctgt tccttgtgcg gttgtgccat 64680

ttggggctgt tttttcatct cggattaact cgcgtggaaa ccgcgagacg aatgttttga 64740

gcctaattaa tccgtcatta gcatatatgg gttattatag cacttatggc taatcatggc 64800

ctaattagac ttaaaagatt cgtctcatga tttacatgca aactatgcaa ttagtttttc 64860

tttttatcta tatttaatgc ttcatatatg tgtccaaaga tttgatgcga tgttctggga 64920

aaatcttttt ttaactaaac atgcccaagg tgtttctcca attaagttga cccaaaatca 64980

ttcggcgtca cctttgtctt tcactttcct tccactacaa ggtgatgaca ctgacaaaag 65040

gtccaaaagc tacaggatct gatttttgtt catccatctg tgatgtgtcg gcaagccatc 65100

catggagttc atccactcaa ctcctctctc tcagagagag agagagagag agagacagac 65160

agacacatgc atgatagatt gtgctagtac ggtagtaaca ttttattgcc tccttttcta 65220

aaattctagg ttgtttggaa aacaaaaatt ctagattgtt caataaatta ataatattag 65280

gtatttattt taagtcactt taggtgttaa tttttgaatt ttaaactgct taaactctct 65340

ttcgacgcat ctgagagcag gtacaatagc agactataag ccagctataa atatatttta 65400

agtagataaa agaggaaaaa taagagtagc gggctataga tttgtagaca gctgcagcgc 65460

gagctccaag atacatatgt gtatgacatg tgagaccaaa cattaattat gtagtatatg 65520

tttatatgta tctattgtat gaattggcta ttaaattgac tatgggtgtg ttcggaggtg 65580

ggtgttggga accatctccc aagcacggaa aacggagcgg tccattatgg cgtgattaat 65640

taagtattag ctatttttta aaaaaataaa tcaatatgat ttttttaaac aacttttgta 65700

tagaaacttt ttgcaaaaac tcaccgttta gtagtttgaa aagcgtgcgc gcggaatatg 65760

agggagaggg gttgggaacc tcctcatccg aacgcagcct atacatgatt tggagccaat 65820

agttggctat aatattaaac ttgctctgag tggctcttga atcatcgaag tgatagaaat 65880

catatgcaga aatgtttata tttgtgatgt aaaatttgaa tctaaaatta tttatatttt 65940

gaaatggagg aagtactacc taaaacaagt atgagaaaga gacatgaaaa acacaaaatc 66000

tagacttaaa aataattgga attactagca ggaggtcgaa gtcaatcaag acggcgaaga 66060

aaagcacagg ggacagcaga cacgttaaca cgtaagtaaa caaacaagtg gttaattaat 66120

tagggggccc tcaagtctcc cctaaagcca ctaaacatga caggtttgtg taccatggaa 66180

aaaagggtga agcaaaactt tattctctct ctcattagat taccagttgg aaagcaatcc 66240

tgggacctct agctaatctc attattgtag aacaacgttt tcttagagag agagagagag 66300

agaaataagt caataaaaat tactactaat ccacttgaac cagttctgtc ggtgtcggat 66360

gatttaccac atttgacgaa acggactatt tattcgacgt ttcgaaaaac acactttttt 66420

agaaaaaaaa aactttcctc tattagccac tcgttttagt tatataccta tccgagtatc 66480

tgttaagttt atttatcaaa atatttaatt tatctctata attaaatata caatccgtaa 66540

aaacaatcac gcagtaattc gtttcaaact gagcctcagc tagaaaatca aaatggaaat 66600

gaataacaat agcaacagta gagttagttt ttcggcttat catccgcaac ccaaatgcga 66660

attttaaact tagccttaga gttaattttt aaggcttgtt taccatactt cattttccca 66720

gcattagttt cttttgtcac taaaaattgt ttttttaagt tgtttcgttc attttctcac 66780

ggtttatcag cagtagagcg aagccattct tggagcctgt ttggcacagc tctagctcca 66840

gctctagctc cactctttct ggagctggag ctcagcccaa cagttttagg tgcaccaaaa 66900

ttaggagtgt agttgggtgg aactctctca caaaaaattg tggagctgga tttagacagc 66960

tccacaactt cactccaaac ccaactcctg aagttaaatt gataagttga agctctatct 67020

atcaagccct ttttcttgat catgcttcta cctactccat ttttgtttct tggccctcac 67080

aggaattgga aaggaaaggc gtatatgcat caatgcatgc atgcgcacat caacctcgtc 67140

catcaaccat cataatcatc atcatctcgc cagctgacga aaatgacctg catccatcca 67200

tcacggacaa tccaagcgaa caccgctacc aacatcacag ccaacctgtt tatcactagc 67260

tcttgatacc actcctacat aaacactacg cgcaggttaa ttaattaagc gtgattactg 67320

aagtaacatc taatcacgtc ctggttagcc tttaataaga caacagttag agcaggtaca 67380

atagcagcag gatataagcc agctataaaa aaagagagaa aagagcaacg ggctacagat 67440

ctatagccag ctgtagcatg gacttcaaga cacaacgtgt gtataacagg tgggaccaga 67500

taataatagt gtagtatagt aagtaactat tatatatatt gactatagat gatttggagc 67560

tattagtgtg ctatagtatt aaacttgctc atagagcagg tacaatagta ggatattagc 67620

cagctataaa catattataa tgagataaac attgatagag aagagcagcg ggctacagat 67680

ctgtagccag ctacaacacg gactccaaga cacaacgagt gtatgacaga tgggaccaga 67740

tattagtagt atagtaagca actattatat aaattaacta ttacattggc tatagatgat 67800

ttggagttag tagtgggcta tactattaaa ctttttctct tagcaaaaat caagcgccta 67860

atcacattag aggagtagct ttgagacaaa ccaattagcg gcgaatcaag cgatctgcgt 67920

ggtcgtacag tgatgggccg ggccgggccc acagcccgac agtgacaggg ggcctgacgc 67980

atgtcagcct cagccctgga cgggagctag ccgttgtgtc cccgggggag gggagggggg 68040

cattcccatc atttcgcccc tcctccgggc ccacatctca gtgggggtaa aggtgtaaat 68100

tactgcgacc gcgagtccag cgagcctaga tttggacctt gtgtccgttt gactgaaccg 68160

gagctactcc ccaatacggg gggattgcgt tgtgtgcatg ccatgtgggc ccgagcgccc 68220

tttgttcgtg gctttgggtt ggaaaggtga ccgtgtgagc tgtgcggtgt tgtactacgt 68280

attagtataa atcatttttg ggtactactc cctccgtcca aagcttattt ataatttgtt 68340

gtactccaac cgtccgtctt atttaaaaaa aatataaaaa aaattaaaaa aataagtcac 68400

acataaaata ttaatcatgt tttatcatct aacaataaaa aatactaatt ataaaaaaat 68460

ttcatataaa acggacagtc aaacattgtc acgaaaatct aatgtttgcc ttttttttta 68520

agaccaaggg agtatctacg aacaaagata atacatgtta taatcatgaa gcccatgatg 68580

tgattagccc ggccgtttga ctaacctcac gagctacgtg gctgacaagt ttaacttgtt 68640

aactccatca tttcggatac ttagagcatg tacaatagca gactattagc cagctataaa 68700

catattttaa tgggataaaa gatgagagag aagagcagcg ggctacagat ttatagccag 68760

ctgcagcacg gactccaaga cgcaatatgt gtatgacagg taagaccata tgttaatagt 68820

atagtaagca actattttat aaactggcta ttagatcggc tatagataaa ttggagctag 68880

tagtggacta tactattcaa cttgctctta tatgatataa atattgatat aactatatga 68940

ttttgttaat gacatgtttg tttatggatg gactatgtgg ggtcggtcgc ctccgtagct 69000

gaccaaaata caaacttaaa acccctatct ataaaaatct aacttttgtt tataaatata 69060

gatataaaag ttcataatta gagcctcatc ttttaaacga aaagagtact atgaaaacaa 69120

ctcgtaatac aaagactaat tacgacgaaa agaaaatagt actgacaaga ggaaagcagt 69180

gaacttgcat actccctccg taaaaaaaac caacctagac acggatataa cactatatat 69240

ctagattcgt tcgttgtaat gaagtgtcac ctccgtatct aggttggttt tttcgtacga 69300

aagaagtatg agtaaatcta aagctatgta tacccttcgt caaaaaaaaa aagtaaacct 69360

tgtactggtg cgtgtcacat cctaatataa tattgttttt tatggagggt gtacagttga 69420

aaaaaattga tgtgttttaa ggatgaaaaa tattggtaat gttggctatg taactctaga 69480

aaaaaaaatg cagtaataat aaaatgctaa tttgctggag tactagatta tagacaatcc 69540

agtccaggac acgacaccct ccctactctc tccacttcca ctctcaccgg ccaccgcgcg 69600

ctctctctct ctctctcccc cttctcccgc aagattcttc ccccaaatcc cacccgatcc 69660

accgccgccg cccgctcgcc ggagtcccat cgctgccacc gccgccggag ccgcggcccg 69720

acgcccgccg ggcctgcttg ctgtgtgtgt gaggaggtgg agttgctcgc gctcgttccc 69780

gcggccacct ccgcctgctg ctgcttctgc ttccgctggc attgcgggga ggtcgtgtgc 69840

cgggggacgt gggggctcgt gttggagcgc ggctgccggt gaggtggggg gtgcggcgcg 69900

gcgcggctcg cgctcgtgcg ccggtggcgc gggcgcgggg ggaagcgtac gggggagggg 69960

gagtgtggcg gcggcggcgc gcggggtagg gacgggcgcc gccaccacca ccggctcgtt 70020

cgctggcagg cgctacgcgt ccagatccgt acgccggtat gcttcgtctc gccgcaactc 70080

tctccatttg attagtatcc cctcgccgaa acgaggcctg tgaggcgccc gctttctggc 70140

tggcttccct gtactcgctg cttgctcctg cctgttgggt taacccgttt ccatcgaatt 70200

tgggtaagcg aaacatcgcc tcatatgggc atttggggtt ctggcagcct taggctcgcc 70260

atccgtcgcc gagcttccaa gtgaccggcg cttgttggta tatttgcttg cttgttcctg 70320

tttggtggct gcgctaaatc ttttgtgctg cattgaattt atgccaccca tatacagcaa 70380

attactgagc tgaaataatt cggctaatta ggtccagcaa tatgacatct cgtggattga 70440

atgctaagct gacattgtat cactgatgct ggcttatata taggttgttg agaagtgaag 70500

atgtcgacag gtgaaaccct gcgtgcagag ctatcatcca ggacgccgcc tttcggtttg 70560

aggctatgga ttgtgattgg aatcagtatt tgggtggtga tcttctttat actaggtttc 70620

atgtgcctct ggtccatata ccgaaggaag ccgaagaagt cctttgataa gattccagta 70680

tctcaaatcc cggatgtttc caaggagatt gcagtagatg aagttcgtga gcatgctgtt 70740

gtcgaaaact tccgtgtgca agaaagccac gcgatatcgg tgcaggagaa acattacgag 70800

aaagattcag ggaaaatgct ggcacacttg gttaggagta aatcgagtga tgccgataat 70860

ttgagccaat gcagctcggt gtaccaatgt gatagggctg gtagctcgta ttctggtgat 70920

gaaggcagct cgggcaatgc taggaggcac ttttctcaat atgcaactgt ctcagcatcc 70980

cctctggttg gtctcccaga attctctcat ctgggctggg gtcattggtt tactctgaga 71040

gatttggagc atgcaacaaa tcggttttcc aaggagaatg tcattggaga gggtggatat 71100

ggggtagttt accgtggtcg actcataaat ggaactgacg tcgcaataaa gaagcttctt 71160

aataatatgt aagagatcct gaaatctatt ctgcgtttta cagaacttgt gactccttct 71220

gatgccatca tattaatttt cttttgatat ggtgctgcag gggccaggca gaaaaggagt 71280

tcagggttga agttgaggct attggccacg tcaggcataa gaatcttgtc cgccttctag 71340

gatattgtgt tgagggaatc cacaggtaaa gctatttatc aatcaccttt gctgatggat 71400

ggctagcttt tgtttctact ggcacattat ttacttgcat agggatgtag gattgctctt 71460

ggtctatgtc cacctactca ccagattatc tcaagggata ggttattcct gactgcactc 71520

cttatgctat cgattttttc ccttccaaat ctgatggtgg gattcagcat gcccagtgac 71580

agattatgct cagtccacag aaaccttctt tggaccacca ttcttttacc atgaaaatgt 71640

ggccatagct ccgaaagcta ggattcacta gaagcgcaca actgcttatt ggtttgttag 71700

ttggctataa caaggtctta ctgaaatgta cttccatagt tcattacttt gtgaatgcct 71760

gttcttgttc ttcacgtttc ttctcatgca tgttcaattc taaatttgta ttcatgatat 71820

gtccaagcta ctgtattctc caaagaaaat cagaagtcca ttcacctatg tattttccag 71880

ttttccgcca ttttggatac tgctctagaa acaagttaat aatatagata tttatatggt 71940

ttggccagtg ctgcttaagt gaccatcgag atagaaattg cttaagaaat atactaagat 72000

gttgagtgtc aggtgttttc ggataatctt gttaccaaca aataggtcct atgaatataa 72060

tggtgtctgc ttcacgtaat tcaaaatcca cactcagcca aaataatctg caatagggtg 72120

ttgaaaatat gattatgttt ctcccttgtt ttcatcatga ctacagaaat gaacaatgtt 72180

gctacatctt gtaataattt gtggttttca attgaacaaa acatccatca aatgatatct 72240

acagcaatat attttgcact tctgagcaca caataggttt gagtgtattc gagtcatggt 72300

cattgattta agctttttat ttcactacat aaccattgat ttgagtgtat ctaaggagtt 72360

ctgtttccac aagtacttta tgttaatggt gtctccttat gctttggcca tccaaactca 72420

ttactgttgt ttaatatttt tagtggttag tggtgtccaa atctttcttt gtgtacatca 72480

tactatgttt ttgtagtcta ttaaacttcc atcctatcat ctgacttgtt atattccagg 72540

atgcttgtat acgaatatgt gaataacggg aacttagaac agtggcttca tggtgccatg 72600

cgccaacatg gtgttcttac ctgggaagcc cgaatgaaag ttgttcttgg aattgctaaa 72660

gcgtaagaaa caaaccatcg tccccgtcaa aaagaaaaga attgttcttc actttagctc 72720

ttttatatgt atatgtttag ttgcataacc cattttccat aactgaattg gtatacaggc 72780

ttgcttattt acatgaagca atagagccaa aagttgtaca ccgggatatc aaatcaagca 72840

acatactaat cgatgaagaa ttcaatggca aactttctga ttttggcttg gctaagatgc 72900

tgggtgcagg gaagagccat atcacaactc gagttatggg aacttttggg tatgttgata 72960

tttttttgga gttagtatta atctttccta tgcttagctt ttactgttgg aatgtgcagt 73020

acttcgctta ttcatacagt ataaaatttt acatgctgcg aactttgtcc ttcgtatatt 73080

ataacaggta gctttctcat tgctatcatt gattcatttc aggtatgtgg cccctgagta 73140

tgccaacaca ggtctgttaa acgagaagag tgatgtctac agttttggtg tgctattact 73200

ggaagcagtg actggtagag atccagttga ttatggccgg cctgctaatg aggtgagcat 73260

atatcctaca atctcatgcg tattatgtat gttacaaaag tccgtactat tggaaattat 73320

tttacggcaa aataacgtct atactaggag agacgaattt gcttcaggtg tatggctgtc 73380

tggcagttgt ctactgtcta gttacccttg tctcactttt acagtctatt gttttatttt 73440

tcaggagctg actagctgta taccttgtca tatataacaa cactgtaacg tggatgcctt 73500

gcaggtgcat ctagtggagt ggctcaaaat gatggttggc acaagaagag ctgaagaggt 73560

agttgaccct gacatggagg tcaaaccgac cattcgggct cttaagcgtg ctctcctagt 73620

ggcactgagg tgcgtcgacc cagactctga gaaaagacct actatgggtc atgttgttcg 73680

gatgctcgag gcagaagatg tcccatcccg tgaggtggta acgctttctc ctttcctgca 73740

ataacattca tcatattata tcattgcaat aaatctgaag cttttgctgt aatcctactg 73800

aaggaccgga ggagccggag gggcaacact gccaatgcag ataccgagtc caagacaagc 73860

tcaagcgaat tcgagataag tggcgataga agggactcag ggccatcagc aaggtttcaa 73920

ctctaagaag acggtgatca tagtcaagaa caatggcttc aaaactctat gcagtaacat 73980

ggtggttggc agagaaaaag gggtatttct ggagggcatt gcattttgta ttgtaggtct 74040

gcatggcggt agagactgga gagagcacag tgtctgatga tggatacccg gagacctgta 74100

attcccattc agtattctgt ttgttagtca agcagcttgt acagatcgtt gtctgttcca 74160

ttttttcatt cttctggttt ttttgtttag gaggctcttg gattaccagt acgaaccgct 74220

gtctcttttc tagaatcacc aacatggaac ctatcaatat ttactactag tactacgact 74280

tgctttcttc ttgctgagat ctatcatgta ctgtacataa ctgacgtgtt cagctgcact 74340

tggacaagta gatgctcgtt ctgtatgtcg aatttacttg atgaggtcga gcattaagta 74400

ccatggctgc agccggcttc tgtttagttg tgctgacatg cggcggcgac ctcacgctgt 74460

gtggcccatt cttgatcttg ggccgaaact gtagcaacgg gcgtacggcc catctatatc 74520

gggattgttc ggcccgttgt agatgggccg gatcgggatt gcgacttacg tgcgacccat 74580

ttcggttggg ccggtggtcc gctacttcat ctagcagtgg tcggcggcag ggttcacaat 74640

tccaatagaa tccaaacatt attggattga gttaaaaaca caaaccaatc ggctttttgt 74700

caggttcaga aaattttaaa ctgaatttta attttttgac aaaaatctat ttagatttcg 74760

tctgtttttt taggtttgtc aacggattca gcgaaatccg atgatatcgc tcgtgagtgg 74820

atttttgatc cggtatcgag attgtgaacc cttgtcgcgc attgcctgac aaagacaacc 74880

agtgaagcgc cgtgcgcgcc gcgtgcgcgc cgcgtgacgc gaagatgcgc aggaaggaac 74940

aagctggcaa gcggcgcgcc catgacggcg gcggcgacga cgacccgcgc gcgtgcgtgc 75000

gtcaacgcac gcgaccggcc gagatccgtc agtggccgcg gctatatata atacatcgtc 75060

gcctcacacc ccccacacac cgagtcatcg ctcgccggag ttagagttcg tagcggcgaa 75120

ggatatagcc atatattata gatggcgatt ggtgttggtg gctgctgcgc cgtgctgctc 75180

gcggcggcgc tgctcttctc ctctccggcc accacatgta agcacgccca tcttcttctt 75240

cttcttcttt ttttctttct tttttttttt tttttggaaa tgagccgcag ctgacaaaaa 75300

gatcactcac acatggatac actgtcgtga cactaaccaa tgcctaagcc attttgtttt 75360

cttgttttgg atttttcttt ttatgtgtat cacttttgct tgttgctctt gcagatgctt 75420

atgattccct ggatccaaac ggcaacatca cgataaaatg ggatgtgatg caatggactc 75480

ctgatggcta tgctgtaagt agcggtggca gtacaccaac atctctacct ttattttcgt 75540

ctcaacctgt acatttacac tatcttgttc tactacctct aataaaaaaa tatatttgat 75600

gttttaaaat ctattaagtt ctagagatta ggaaagctac acatggtttt atgttttgat 75660

actattaagt agtatatttt ataagttata ttgaaggctg gggtttcaaa agtttgacta 75720

cactagatct tattcaaagc gtctaatgat tactgaacgg aggaagtatg aacttataga 75780

cttgaagtta aacagcatag ccacatctct tcatgtatac ttcatccgtt tcatattata 75840

agattttcta gcattatcca tattcatata tgtgcgtcta gattcattaa tatctatatg 75900

aattgggcaa tgctataaaa tcttataacc tgagaaacgg agggagtatg tcgcaaacaa 75960

caacaacaat aacaacgagc aaaatctgta tcgaatccgg tttccctctt gtaactgtat 76020

caaagatctg tcctctgaaa cgtcccctgt tcatcaggcc gttgtcacac tgtccaacta 76080

ccagcaattc cggcacatcc agccaccggg gtggcagctg gggtggacat ggcagcagaa 76140

ggaggtgatc tggtccatgt acggcgcgca ggccatcgag cagggcgact gctccatgtc 76200

caaggagggc agcaatgtcc cccacagctg caagaagcat cccaccgtcg tcgacctcct 76260

cccgggcacc ccaatcgacc tgcagatcgc caactgctgc aaggctggat cactgagcgc 76320

attcagccag gacccggcaa attctgccgc gtcgtttcag atc                   76363

<210>28

<211>53905

<212>DNA

<213>稻(Orza sativa)Asominori

<400>28

gatcagtgag tgagagtgat gtgctattga ttttcgtcta ggattttgct gtgctcttct 60

tcttcttctc ctctctacca agaaagatcg atggaggaga atttgtagga cgcgtttctc 120

acgaattact tagctgttaa tgatcagctt gatgtgtacg atatgatggt gcagagtgaa 180

agttgtgttg ttcactggtg gatcatggga tgggaatatg ggattgttgt aagatgtaac 240

tcaagtgttt tcttttttgg gattactttt ggtaataaga gcttgggtga tcgaaaacta 300

cagatggttt ttcttttaag ttgtatgatc tctgtagagt ttttgagtaa tttgtagttt 360

tgtaccctat caaagatcat ctctagctgc ctctgagctc tccaactcta tatgtccatc 420

tctagtatat atgtcccata tttctgactg aaaattttca agtcggttgg ttccctccgc 480

ctggatattc tttcagctaa ttagattttt tttaaatgat aaatttgcta aaagcttgtt 540

caaattcagc taagatctat tcaaacttca atttctctat cgaaattccc ggaaatttca 600

attcaatcat tccccaatac atgccgattt ccgtaatatt gaaccatgac atgtaaacaa 660

cgaaggaatc aagggcatat ttagtttcat ctcacatcga atatacggac acacatttga 720

agtattaaat gcactctaat aacaaaacaa attacagatt ccgccagaaa actacgagac 780

gaatctatta agcctaatta atacatcatt agcaaatgtt tactatagca ccacattgtc 840

aactcatgac gcaattaggc ttaaaagatt cgtctcgcag tttcctgacg aaccgtgtaa 900

ttattatttt ttctacgttt aatactttat gtatgtgccc aaatattcaa tgtgacaacg 960

tgaaaatttt tatttggaac taaataggcc ctaatattct ttcaagatat tagaatagtt 1020

atccctctcc acctccctgc acaaacagtg aacttctttc tccttgggca caggagtagt 1080

agcagctccc ggaaacagaa agcaatcaag caaagtcctg aacctgaagc atcctgaaac 1140

cagcagacgg cagaaaccag tgggcgcagg cgatagcagt ttttcgtggt ccggcgtaca 1200

gccaaaatac tggccatcgg gtgcctacat agaatgagtc cactggacgc agctaccacc 1260

gtgtgtgcta cactgaccgc cgctgctcgt cgaccagttg tacggggctg acttattctg 1320

aatttctaat ggtttatttg ggggtttaga acactgaggg gtgctttaga tccaaagatg 1380

tgaagtttgg gcgtgtcaca tcgggtatta tatatagtgt cgcacagggt gtttgggcac 1440

taataaaaat actaattatt gatcctatac gataagctat ataatactcg atgtgacacg 1500

ccaaaacttt acatccctga atctaaacac ccttttaaat agagtatttg gtgtgaaata 1560

taattttgat ttgggaagaa ggtgagtgag atttggaaaa aaaaagcatt tcaattaaaa 1620

aatttgccag cagtaaataa agaaactact cggttttgta attaaagtga ggttttggca 1680

cttctttgcc ctaaactggc ctccatttta taaagtgaga accgtgcagc aaaagcctga 1740

aaaggcaaaa agaaagaaat tgtagaggtt tttcaggagg atacaactag gtgggtctct 1800

aactctctat gcagctgtgg tctgtggagc aaaacgatga aatggaagac gggacgttga 1860

cgagggtgaa gaaaacgagc gtttgaccag cgtcaaccat ggcgtgaaca gtagcaccac 1920

taacctgacc gagaggttga agaagatgca atcaacgggg tactatagtt cccacgaatt 1980

tcccagcaac aacgggttgg ttctcactac tcacgaattc cctgtggctc aacaactact 2040

agtacatcct tttgtccatt atgataaaag ttctatctta atttttattt acacgttttt 2100

caaactgttt tttaattttc tatataaaaa atacttaaaa tatcaaataa aatctatttt 2160

tggagtttta aaaaactcaa ttaatcatat atattattga cttattttat tttacgtgga 2220

ctaaaatatc ttcatcttca tttaggttat gttcttttct catcaagata catgatacat 2280

tagcatgttt ttcaaactgt tttttaattt tgtatataaa cttactctaa aatatcaaat 2340

aaaatttact tttagggttt ataaaagtaa aactcaatta atcattacta acttgtttca 2400

ttttacgtgg actaaaatat cttcatcttc atctaaggtg gtgtttggat ccaaggacta 2460

aattttaatc cctatcacat cggatatttg acactaatta gaagtattaa acatagatta 2520

atgatgaaac ccattccata accctggact aattcgcgag acgaatatat tgagcataat 2580

taatccatga ttagcctatg tgatgctgta gtaaacatgt actaattacg gattaattaa 2640

gcttaaaaaa tttatcttac gaattagctc tcatttatac aattaatttt attgttagtt 2700

tacgtttaat acttttaatt agtatacatc cgacgtaaca ctgatcgata caaacaccaa 2760

ctaaatcgaa aatcaccgaa tggctcgtca tcctcccaca tgagatgcca agatggaaca 2820

ccaacaatcc aacggctagg aagcgcccca tcccacccac cgcctaaccg ccttcctatg 2880

caagtgggtc ccaccccttc cttccttttt tttttctttt tacaaatccc cttccctttc 2940

ttggctagct agctagcttg gcccaacgcc acgagccgag ccgagcacat ccggagccaa 3000

gccgagctca gcgcctcagc tccccctcct cctcgtccca ttcccggttt cctcctccga 3060

tttcccccaa atccgcacgc ctctcccctc cgcctccatt tttcccgatt cccaattccc 3120

aaatccggat cagccgcagc cgcagcagca aaaaatttcg aaatccaaat ccaaacccat 3180

cccccccacg acgacgtcac ccacatcccc acccccgcga gacgagacga gacgactccc 3240

aaatctctct ctcctctctc ctatgcgcgc cgccgccgcc gccgcagcag cagcagctag 3300

gaggcggagc agcagcagca gcagcagctg agatgatcgt gcgcacctac ggccgcagat 3360

cccgctcctt ctccgacggg ggaggagggg agcgcggcgg cggcggtggg ttctcgtcgt 3420

cgcaagacgc gttcgaattc gacggggagg aggaggacga cctcgtcctg ctggggtcgt 3480

cgtcgcagtc gtcgcacccg cccgcgccgt cgcaggagtc gtcgtcgatg tgggacttcg 3540

acgaggaccc gccgccgccg ccccggcggc ggcgggggag gggtgggggt ggggactacg 3600

cggagcccgc cacggcggcg gcggcggcgg cggcggccac ctcgctcatg gaggcggagg 3660

agtacggcga gatgatggag agcgtggacg aggcgaactt cgcgctcgac gggctgcgcg 3720

ccaccgcgcc gaggcgggtg cgccgggcca gcttcctcgc gctgctcggg atctgcgcct 3780

ccgcgccgcg ccgccgcgtc ctccgggccc aggggtcggt acaccaaaga accctccttt 3840

tttttttctt acttgtctgc gctgtaagta aagaataaca attcgcgttc ttgctcttgc 3900

ttcgcgggca atcttggtga ggaatcttgt tagggttatg aaattgggca gccagttctt 3960

gtttcttctg cgtaatcttg gcggaaacag tgggattttg tacgattatg gctccgtaat 4020

cggcatttct gtgggaaatg aaccaccttt agggcatttg accttcgaac agcatgcttg 4080

gtgttgcaat ccgtagctat tgccttcatc ttaggcacaa gaacttgttc tgaattatga 4140

tttaccaact tgtgtttgtt ttcttgttct gagttttctt gcttggttag ggttagggtt 4200

atcaccgtgg tggtgcagaa ttagatgttc gctacttgtc ttaacctctg ccttgcccaa 4260

tttggtaccg agtgttacag ctgggtttag gaagtgtgat ctttgagcat ttctagcatg 4320

ttggtctctt tattttgcta atctcacatg gttgtagagg aaggaagcat agtgactgat 4380

gatgaatgcc tagatactag aaatacatct ttattaactg aattaggatt gcttgggtat 4440

ctatgtagat atgactgtag aatgttactg ctggaaatgc tatccaatat ccattgatct 4500

ctagcctaat atatctctcg aggccaagag atcagtcaat tttgaacttt caggagagtt 4560

tctatttggt acttaatctc ttttatttgt tacttttggt gcctggctct cttttcatga 4620

ttgctaagta gacaggtaaa gttctaccta aaattattct taaaagttca aaatcgcttt 4680

agattaagga gtgccagcca gagccttagg cagagtctta taaaccaaaa gcacaatgct 4740

acaatgttca caaaactttt gtggaatttc cacttgagct gtataaacat cgcaatctac 4800

tgtgaataaa agaagcactt gatggaagtt catgttagca aatgacatgt tttctgtgag 4860

gaggttgatt gcttgaactg ttatggactc ttgcaacttt ttattttact tcgtacccat 4920

ttatgctaat gtgcacaaat aaaattgctg agagtaaaaa tgtacaactt gttacgcacc 4980

agcacacttc ctatttgtat ccattttcct gttgaatttc aaatgtattc aattgctgaa 5040

attgttccat tcaacaaaca catattccgt taatgaaatt attatacatt gcgttttgtt 5100

ttcttactca caagtgtcct cttttcttat atcctataga ttggtgcaac aaattattga 5160

tgcaattttg gttttgaaca ttgatgatcc tccctgcact attggtgcag ctgctcttct 5220

attcgttttg gcaagtgatg tgagtacctc tcaatcccat ccttgtgctt ctgtgcatgc 5280

ttcattctat tttttacgca tatcgattgt tttcttttat ataacagccc ataaaaataa 5340

tcacatcatg gcaaagttat ttatttctcc agtacagtta tataagtatt caccactttt 5400

ccatgaatat cttggcatgt gattacaaag aagattattt aagaaagtcc atgcttttat 5460

ttcatcattt tgtttgaagt tgaactttaa tttatggtgt aaatttcagt taatattgct 5520

agcagctcgt attctttaat ggcataactt cacttgtgct tattctccaa tatctccctt 5580

cttgttgttc aggttcaaga aaatcatttg ttggattcag aatcttgtgt ccattttctt 5640

cttaaattat taaatcctcc agtgaatctt gttgattcca aagcaccatc gataggttcc 5700

aaacttcttg gaatcagtaa agttcaaatg cttaatggat caaataagga ttctgactgc 5760

atttcagagg aaatcctttc aaaagttgaa gagattctct taagctgtca agagatcaag 5820

tcgctcgaca aagatgacaa gaaaacaaca aggccagaac tgtgtccaaa gtggcttgct 5880

ttgttgacaa tggaaaaggc atgcttgtct gctgtttcag tggagggtaa gttttaatca 5940

aatttcttgg tcatgatttc cctttatgac cattataatt atttttatga gccaaataag 6000

cagttgccat aagttacata gcacctgttt acaatattca tgggtggttt gcttagccct 6060

ttgcttcacc tgcctttgat tgatgacttc catccgtgtt gcacaactga attggagtaa 6120

ttgactgcac tagaagcacc tatggccatt gtcatactag gaaggttttc ccttatcaaa 6180

tatttgattg ttacagagac ttctgacact gtgtccagag tcggaggaaa ttttaaagag 6240

acattaaggg agttgggcgg tcttgatagt atttttgacg ttatgatgga ttgccattca 6300

acattggagg tgagatctcg ctaacatcgc atattttaca cttcctttgt tcaactctaa 6360

aggatggtgc aagttttgtt cctttttgcc attttagctt taatgtgctt gaagccacat 6420

gaaagcaatg cttgtccaga tacatagcca aaggttgtta tattttggga catggaaaat 6480

gcttgaggta gtaactattt tcatcaggac atggaaaatt ggctgcatca caaattatgt 6540

tgtttcatgt tgcaaaatag ttttttaata cttttttatt ctgcatgtgg tgttagtgtc 6600

ttacagtgat tcctctgatg attatatccc ccacgataat aatacttgac atatctacac 6660

caagtggaca ttattcattt ggatgttact tttccagcta tacttgctgt tcttgcataa 6720

actttggagt aaattgcgta tccctttaag agataaactg cttggtgctc ctatctgtgt 6780

actttttatg cccccaacta ataatgcaat catattacgc tgataaactg aataaataaa 6840

ttaacaatat acttctggtg gaaaccttgt gtatcagaat ctcataaagg atacctcaac 6900

ttcagctttg gacctaaatg aaggaacatc tttgcaaagt gccgctctcc tcttgaaatg 6960

tttgaaaata ttggaaaatg ccacatttct aagcgatgat aacaaggtaa tgttccttat 7020

atattctgtt tcagtttagt acccattttc ttcttctgta ccatcttctc ccctcatttg 7080

ttctgtgcaa aatgtgcaaa cagtgtgact ttgtatttct gcttaacatt tttctttttt 7140

tcctgaaaag cagtataaac tcttacactc attttgcttc ttgcagaccc atttgcttaa 7200

tatgagtaga aaattgtacc cgaaacgctc ctcgctttct tttgttggtg tcattatcag 7260

tattattgag ttattatcag gtatttttct taataataca atatgtccgc taacacaata 7320

aaatgtttta aacatccagt atgttaaagt tgcagtctga cgcctatttt gttttgctgc 7380

agctctttca atactgcaga attcttctgt tgtttccagc tctacatatc cgaaatcgtc 7440

taaagtctct caacagagtt gctctggtaa taacaaacac caaatttgtt tgatcaactc 7500

gttggctttt ctgtgcactg tttcaatata gtttggtcgc cattcaagtc tcactacaga 7560

tgttgaactt gacctgacac ggtggcacca atatttataa aacgctacct gatattttta 7620

atatttcatg tttcctgacc cagattatct tgttggttcc tcatataagt ttaattagtg 7680

tcgttcttga aactttgtta tgcagcagat gtcatggggg gaacttcatt taatgatgga 7740

aagcgcaaga actcgaagaa aaaaaacctt ttgtcgaacc agacacgcca tagttgctta 7800

tcttcaaaat cagaagtttc tcatattact atatcttctg gtagtgatgc tggtctgtca 7860

cagaaggcat tcaattgttc tccatctata tcaagcaatg gggcatcaag tggttcatta 7920

ggcgagagac atagcaatgg tggtgctttg aagttgaata taaaaaagga tcgtggcaat 7980

gcaaatccaa ttagaggctc aagtgggtgg atttcaataa gagcgcacag ttctgatggg 8040

aactccagag aaatggcaaa aagacgccgt ctatctgaaa atgtaatcac cgacagtggt 8100

ggcggtgatg acccttttgc ttttgatgat gttgatcagg agccttcaaa ttgggaactg 8160

cttggtccaa aaaagaaatc gcctcagaaa catcaagaca aatcaggaaa tggagtgcta 8220

gttgcaagtc atgaaccaga ccaacctgaa gatcttaatc agtcgggtac aacatctctt 8280

tttagtgcta aagatgaatc cagtcttttg gaagactgcc tcttggcatc agttaaggta 8340

attaaatatg tttccttctg atctttcttg tttcttcttc aagagaatat acattcttgg 8400

gtcacagttt ctcggtttgt ctttgtgact ttgttgagtg acatattttg aattcacaaa 8460

atttcctttt caatatggct cctcaatcta tagcatctgt cgtgtatgta ttctgtacaa 8520

aatagtattg taacatctcc tagaagaaat tggcaccatc catatcatac agtagcaatt 8580

tatgagacgt gatcctgatt ggaggtttag gacagagcct cgagctaaat tgctattgta 8640

ttgtatctac tatcttttag tacatgatat gtgctgggca ctctgtgtct gagtgtagtg 8700

agtgcttaag tttacatagt tcagctaaca tgcatatgta agacagttta tgattaaatt 8760

taagtgtaga aagaaggtac tttcaaaaga tttttaagga caatataatt gtttcaccgg 8820

gactcatgct tgttctgact gtgagcctaa tgttaccttt acatgccctt acattgtcta 8880

ttttttatcg ttttatgaga tcttccaaac aacttgatct gtcttaatgt ttttttgcta 8940

gctcctttct tggatatctg gtaaatggtt aggccgaagt atgaactttg ccttattgtt 9000

tcaaagaaaa tgtaacaact cctggaaaag tctaattttg gttgcccttt attttgctga 9060

ccgtattggc acacatctaa ttctgctgtt cctttctggc aggttcttat gaacttagca 9120

aatgacaacc catctggttg tgaattgatt gcgtcatgtg gtggacttaa caccatggcc 9180

tccttgatca tgaagcattt cccctcattt tgttttgtcg tggacaacaa ctataacacg 9240

agagatgtca atcttgatca tgagttatca tcttctcaaa acagcaaggc acaccaggtc 9300

aaaattaagc aattgcgaga tcatgaactt gattttctgg ttgccatatt gggcttgctt 9360

gttaaccttg tagagaagga tagccttaat aggtaagtcc ctcacatgct tccttccatt 9420

tgctcaattc atatcagtgt tactgttctg gcagttcctt ggggtcagga ctcagaaaca 9480

tccaattaat gttcatgttc tcttaacgac tcagaaatac tttataacct ctccacaggg 9540

tacggctttc atctgcccgt gttcctgttg atctatctca gaatccacag agtgaagaga 9600

cacagagaga tgtcatagca ctcctctgtt ctgtattctt agcaagtcaa ggtgctagtg 9660

aagcttctgg aactatatca ccggtaattc aaaattcttc aagttccttt tgtatgtaga 9720

ttatatcttt gtaaaactcg gcatttatta cctgctcttt gtttcaaaaa gcagtatttt 9780

attttgctcc ttagcatagg tcagcagaac agttgatctt attcagaaaa caatattttg 9840

catgtaacat actgttatct atgagatgaa aattaatgca tgtgtaataa tgtcaatgat 9900

aaatatttgc tatctgaatc cagtctacca actctagtta gaccgaaatt actgaggttc 9960

tatttcaaag aataatttag tgcaccattt gttcaactac tatgaagtaa aatggtattc 10020

ccttctattg acatcgggtt agaagtgaaa ggccatctta atgcaatgtt ctcaatgcca 10080

caaacccaca aatttcatta acacatacag attattatta acatagctat aaattggatt 10140

tccagaagct tgagttgaat ttattttgtt acaattgaaa gcactgggaa cattagcatt 10200

tttttttagt tcttggttat tgcaatttat aatgttatac agaactgtgt acctcacaat 10260

gcattcatta tgacattcta tgaaccattt gattgactgt tgcttgtaaa caacaggatg 10320

atgaggagtc tttgatgcaa ggagcacggg aagctgaaat gatgatcgta gaggcctatg 10380

cagcccttct tcttgcgttt ctttcaactg aaaggtttgc aatctgtagt tgatggattg 10440

ttttattaat gtctaactac ttgcataatg tcagcactat ggcatttaac ttatactgtc 10500

tgttaactgc aacagcatga aggttcgtgg agccatttcc agctgccttc caaataacag 10560

cttaaaaatc cttgtgcctg cgctagagaa atttgtggta tgtctccata attcttgaac 10620

tactgtttgt ataaaaaagt atggatgatc tttgaattta ctccattttg gaaatcatta 10680

atttttcatg tctgaggtgt gaggtgtcac cataattgta cttcccatcc aggaagcctg 10740

tttgcaaaat ttcacataaa taaggaaaat ttgaacttgt ttcaagtttg aatagtaaca 10800

ggatgtttta tttctcaact ggagaaaaca ttccggctgg gacttttaac ccttaaaatg 10860

ctagtgtgct cccactgtaa gattgtctgc tgtcacattt gaaactttgt gtaatacctt 10920

tatcactacc cttgagatga gagacacaat ctggtaccga gttaagttat tgataactcc 10980

cagttgaagt acagcaccaa atcaagccaa catgttggct acgtaattaa atgttctctt 11040

acaacagata gaggtaaaaa gggagtttct aagtatctaa cctcttaccc tcttggctta 11100

gcactccagg cacaactctt tcttaacttg cgatttagga cttgactctg agaatattgt 11160

gtgcccacac tggttgagtg catgcctatc taagctgcta gtttttgttc attttgatta 11220

actctgaagc tgcctgagct tattctgctt ccatcattta ttaatccatc atgtttctct 11280

ttcagtcgtt ccatctgcag ctcaatatga tcacagagga aacgcactca gctgtcacag 11340

aagttatcga gaaatgcaaa ctttcataga aagagtgaag aggggcctgt acagatcaac 11400

taacaacctc tttgcagcaa aaaagcatac acacaagtgt ttgtcttggc ctggggctct 11460

gcagatggac tgatactctg acctgcagtg ggcttgggag ctaacaatgg tttcattctt 11520

ttttttttta tgttttcccc tgttgttttt gctcatgttt tgtgtaattt tttcttctca 11580

tctagcgatg ttatttttct tagcatgatg ggagtagccc tccttttttt tttctctaat 11640

taagtgtaaa gtagcaacag catagggatg aatgttcagt gtagtgtgtg gtgtttcagt 11700

tattcagaga cgtccataca gtttgtacct tgtgaccaca cgtcttaatc tgatgaagct 11760

tagaataaat cacatgttag caatgcaata tcatctgcgt cttctctcac tttggtggcc 11820

atcaaattct gtgtagaagt gtatggttgg tgtgctgttg caaatgccgt attccgctct 11880

gttttgtgga agttaagaag tccctagttg aaataccgat ttttcatgat ctcggagatt 11940

gatgcaactc tgattgcagc atttcttttt attagaatgt acactccatg ctatcatgat 12000

gtttattgtt tagtactaca agatttggtt aaccattatt ttaatatcat aataatttta 12060

taaaatcttg gagtaacaag ttcataatac atgatagcat aactttttga ggctagtcta 12120

tgtatattgt ctcctttgtt tttaaactaa gcactcaata aattattgat ggctgtaatt 12180

ttctgaaggt ttcaccggtt tcggcccgtg ctttataaat agcttcggca caaaagacaa 12240

aacggtccct ccaacacata aatggttgag tttacgtttt cattatcttt ggtaaaatca 12300

agtccaccac gtagacactc ataacaaaag tttgaatatc ctcagaaatt ttgacttgag 12360

tctatcttac ctttgatatc ggacatccaa ccctccctcc ctccctgaac tttatattat 12420

tcatattaca cctgaacttt atattattca tattacaccc tgaagtggtt ttcatttaat 12480

tgcatacatg ctgaaatagt ttgacaacgt gagatgcaca aaatctacac gttcgtctta 12540

agttgcaatt cattttatcc cttttctttt tctctcttac ataggaatat caatagtact 12600

aattcacatt acaatatagt ataaattggt gatcgattat tggcaatata ctatattaaa 12660

tattcaaaac tagtcattta agctgccaaa taagtaaacc actatcgaaa accacaatat 12720

aaatggcatt acaaaactta gggggttgaa tatccaattt taaagttcat gatgctagag 12780

gaatttctat caaaagttta tgggtacata tggacttttt cctttttaaa agaagctatt 12840

cttatcgtaa acgttaaata ttttttgtac tttatttttt atgattgaaa aaaaaactta 12900

gttttcaaaa tgattggtct gtatacaagc atcaattaga cttaataaat tcatctaaca 12960

gtttcctggc agaaactgta atttgttttt gttattagac tacgtttatt atttcaaatg 13020

tgtgtacgta tatccgatgt gacaaccaaa cccaaaaatt ttccctaact ccatgaggcc 13080

ttacagatat atttgatggg tgtaaagttt tttaagttct ttgggtgcaa agtttttaaa 13140

gtatacggac acacatttga agtattaaat atagacaaat aacaaaacat attacatatt 13200

ctgcctgtaa acaacgagac aaatttatta agcctaatta atctgtcatt agcaaacgtt 13260

tactgcagca tcacattgtc aaatcatagc gtaattaggc tcaaaaatat tcgtctcgta 13320

atttacatgc aaactgtgta attggttttt tttttcgtca acatttaata ctccatgcat 13380

gtccaaatat ttgatgcgat ctttttggcc aaattttgtt ggaatctaaa caaggatcaa 13440

atttgctgaa tttttccaga cgtcacggct tgttcatcca tcgttcgcat cgcgattcgc 13500

caccgacgcc ttggtttcca acgaatttta tcatccgctt aaatacatcc aaagctctcc 13560

atcgccatcg gcggccaacg gcgaccgctc cgctctaccc aatccaccca tccactcgcc 13620

gccgccccct gatccaaagc ctccgccgcg ccgccgtcga gaggaggagg aggaggagga 13680

ggaggaggag gaggcgtgag cccctatggg gaccctcctc cggccgcgtc cgctcgccca 13740

cgccgccggc gccggcgacg ccacgccgtc gaccgcgcac ggtagccacg cgcctctcga 13800

gaggcccccc ccccgccgct cgctgatctc tcttctcatc ctgtttgggt ttgggtttgt 13860

gatttgggtg tttttttttt tccgcagcgg tggtggtgag cggtggccgc ggccgtggcg 13920

tggagtgcca gccgcatcgg gtgcgccgcc gcccgggtcc gcaggttgcg gtggcgacgg 13980

cgagctggag gaggcggagg gagaccgtgg tgagatcgga tttcgccgct ggtggtgccg 14040

ctaccatggg ggattcgccg caggcgctct caggtttgca gcctcctcca ctctcttctc 14100

gcaaaatgtg ttgctatgtt cctctcgctg ggctggcctc atagccatta atgtagtttg 14160

ctggaacatt acattcggaa cgttgttggc aattgcttga caaaatgtgg aattgtggag 14220

gggagaaaaa tcgtttgaac ctgcagtgac aaaattgcca tctataattt taaaactgaa 14280

ggtgtggaaa tcaaacataa tcattgccag cacatcattc ttgttaacca ccttgacata 14340

ttgttggctt ataacagtta gctccacacc aacttggaag gtgtcaatgg aatgtaagta 14400

taaattgagg ataactggca gttgttaaga ctttctacag aacttgtagc agctaaaact 14460

agctattgtg catttatgtt tcatggaatt tgagcggcaa tggatatttc ttactaagac 14520

gtataatgca aaacaaaaaa aaaaaaaact atgtctatgc agtttacatg taatgtgcgg 14580

atgcaaataa aatcatgttc atggacaaac taatgggatt cataccaaat tccagaattg 14640

catttcttat gtggttactt ttgtttgttg atttggttac cagacatcga tgtggtttca 14700

agggtcagag gggtttgctt ctacgcggtg actgcagttg cagcaatctt tttgtttgtc 14760

gccatggttg tggttcatcc acttgtgctc ctatttgacc gataccggag gagagctcag 14820

cactacattg caaagatttg ggcaactctg acaatttcca tgttctacaa gcttgacgtc 14880

gagggaatgg agaacctgcc accgaatagt agccctgctg tctatgttgc gaaccatcag 14940

agtttcttgg atatctatac ccttctaact ctaggaaggt gtttcaagtt tataagcaag 15000

acaagtatat ttatgttccc aattattgga tgggcaatgt atctcttagg agtaattcct 15060

ttgcggcgta tggacagcag gagccagctg gtatggctgt agtctcatcc ctgctttctt 15120

aagtagacat atatacattt acagtatttg gtaaataaac aagattttat gaatcatata 15180

tgattttggg gaaaacacaa aactctcttt gttggctgcc ttgaacatag ttctgttcac 15240

acagttatag caccttcttt aaaatgaaga actttgttgc atacacataa ggccaaacca 15300

cataatgaat tttgtttatt tctatctttg aatgttagca tcgtttttgt ttaatgcatg 15360

atcgccttcc tatatatttg tagtatgtca acattgtatt ccatgctgag cataacaaat 15420

ggtttgttaa aattcaggac tgtcttaaac ggtgtgtgga tttggtgaaa aaaggagcat 15480

ctgtattttt ctttccagag gggactagaa gcaaagatgg aaagctaggt gcatttaagg 15540

ttcagtaacc aaacttaggt tacattacat ctaatgagat ttttatattc agtatataat 15600

gttaaccttc tcatggtgta ctgacgtggt tataaatgtc cccagagagg tgcattcagt 15660

gtggctacaa agaccggtgc tcctgtgata cctattactc ttctcgggac agggaaactg 15720

atgccttctg gaatggaagg catccttaat tcaggttcag taaagctcat tattcaccat 15780

ccaattgaag ggaatgatgc tgagaaatta tgttctgaag caaggaaggt gatagctgac 15840

actcttattc taaacggtta tggagtgcac taaagaaaga tggtgttttt ttttattata 15900

tggaacctat tcaaaggcac agacaggctt tcaaggctaa gcttgttaca ggtactgata 15960

ctagttacta attactttcg taatcagtat aaataagctt gtgtagtgta atggcattgt 16020

acatttctgc acttggtaaa tttacagaag aggcaagtaa tattttagag gattgagttt 16080

attcacccag tcatatagtt gaagaggcaa gtaacctgta agagaggact gaacattaac 16140

acctcttgtt cgattaaaaa tgaccaaaga gcatcaaaca tgtattcgag gctgttactt 16200

tagatatggc ccattaattt gtttagttgt ctatgtacat cctagttggt gtaaatgcca 16260

gttaccattt ctatgatcta aaacaatcaa ctcttttagt atattttcaa aaacgaaaat 16320

tcagtacaca tgtatgaatc ttaatattct tctctagctc gttacaaaag caacaaaggc 16380

accgtgtcag ctggttcaca ttagctagtt tgtacttagc attatccact agcaccttat 16440

tttcatgcat atcatgctaa tttgcttgcc cacgttgagt gggaattttt ttcatgtttt 16500

ataatttata tatgttttag acttctagtc cacaatttat gtacttcatg ttcctgagcc 16560

tctagtatgg ctgatagcag actaggtgct gagtgctgtc cttttttgca gactgaagag 16620

agaagaaata caagactgtc cattgttagt cagatttgta aaaatagact ctgatgtagt 16680

ttacttttgc ccctatttta tttttaacaa tacaaatata taacagatcc taagaactta 16740

tcttaattta ggagaagttg ctcgtttcat taaattaaat tgtgaagtaa aaatgtgtgc 16800

tcgagtctgt caatgcaatc ctgtgttctt gtttgaagat atggtgtagg gcaggccagg 16860

attgaacact gaatggtaag actgcttctg ccttcagacg ttattgctaa atttttagct 16920

acttgcagtt agtgctgcca cgccgattaa gcagtagaac aaagtagttt tgtcgtgcac 16980

aaatgagtta tatttcattg gaaatcgaag cgaaaacgaa tcaaaagtta gaagaaaagg 17040

ggaaacttgg taattactcc ataaagagag tgcattttat tggtaagatg gtatccggaa 17100

gctgtgagct ccgggctgta tgtattctgg caaatttgat atgagatgct cgattattgg 17160

cttaagttag cgatatcaaa tttggggaag caccaaagga attattgtga aggagttatg 17220

ggtgcgtgac gttatctgct aggttcaaat ccttgtggct atgaatattt atctgctagg 17280

ttcaaatcct agtgactatg aatattaatg ggtaaggtaa gggatttatt gttaatttta 17340

gtttctttaa gattgtgcca tcggacgcca ttcggtaact gtaataatgc tttgtattgg 17400

attcacttgt gttacatgca cgcactaaac atgtgcttta ccttttcatc tgtttttgcg 17460

ttctgggcta gaaactcaaa cgttgaattt tccatggtct gctcaacttg acaattactg 17520

cgtgtcaagc gatcttatac gcatactatg cgcacaagtg attgtatacg gatatgatga 17580

cagtataacg tgtgatattg atttttttaa taaaaaaatg atgttccttt ccttgatgaa 17640

ggaacaaaga ctttttttaa aagaagggta ttactaaaaa caaaaatgac aaaaacaaaa 17700

tatcagtgca catggcaagt gtgctcggca attttttctc tgtactttaa acaaaaatac 17760

ttctatatgt tcttttttat aagggtggca caaatctttt aaatgagcca aatatctaca 17820

ttggatttat taaaaactgt ataaattata atttatactc tgaaaggttg tgtgcatctc 17880

tcttggagaa aatgtataag ttgcaaacaa acattaatcc acgttatgta actttttttc 17940

gccggaaagg ccgaaggagg cctgacggag cgtggggctc ctcaccggga gaccgcgcag 18000

gccccccttt gccggttcgg ccggggactc agggtgaaat tctaagctct ctgtatgtgg 18060

aaggttcgcg accgtcgaaa gagcataaga cacgggcgat gtatacaggt tcgggccgct 18120

gagaagcgta ataccctact cctgtgtttt ggggggatct gtgtatgaag gagctacaaa 18180

gtatgagcca gcctctccct tgttctgggt tccgaatctg gaaaagtcca gtccagtccc 18240

cccctctaag tgggcaaggt cctcctttta tatcttaagg ggataccaca tgcaccatct 18300

ccctcctttc tgtggggact taccctacct tttcataaat ggacggagat ttgtatagtt 18360

gccgtccgaa tgaccttctg ataggacggc ccatacctac ctccacttcc gccgaaagca 18420

ggtgcgacgt gggattatgg ctgtctgctg acgacatgac cagtgtcaga ctggtcacaa 18480

attgctcatt cctgtccacc acgcgtcagt ttagcaatct acatgttggc ccttcttcac 18540

acaacatctt gcctgtaatg gttaggatga agcctggcat atatctaacc aggactaacg 18600

tgccatctct aggaggtaac acgctagctc cagctgggga cgagcgccta gaagccctcg 18660

tcctgacggg atggggcgag gcgtgcgtca gatcgcctgt cgccacctaa cccgcgatct 18720

gaccggtctg tgactggtca cagaccggat aaacgagtgc actgcacttc gttacatgcc 18780

gcgtgacacg ctcagccaaa ccgcaataaa tgtggttagg tgagccccgc tgtgctcacc 18840

taacccatac acgcggagca aaaacccacg aggggtcggg gcgcctcggc cctcggggcc 18900

gaggcgggtg cggtccgacc ccctcggggg gactaagagg agggcgaaca catcaccctc 18960

gggcccgacg tcccccgagg gtgccaggcc acgtgggcga ttgtgtctgc ctcaaacctc 19020

tagtcatgat actcctgatc ccatgtcacc gacagtagcc cccggcgtta tgccagggcg 19080

atcgccctct ttaagggaag cggtcgggcg tgacgccact cctaaggcct ggtgacaggt 19140

gggaccggtc tccacaattg ggcagaaacc caacggtcac aaatcacgca catcggcaat 19200

ggtaactcta ctatcaataa tgagcggtct cttcaagact gccacattac tcgagtagca 19260

cacgaatctg gacatggcga ttcgtttcgt ctggagatat ggtaacgtcg ctttggtcgg 19320

cgagcgtaat taacgcgcgc acgatatgat ctatctcgac tgccacaacc gcatatccac 19380

ctcatgcgcc gcaagcgggc gaatgggatt agtggaagcg tgggcgcgag aaacgagggg 19440

gcgaaatagt gggcgcgaga agcgaggagc cgggcacagc gttggcaaga gtataaaggc 19500

actgaggaaa ggatctgttt ccttcctttc gccatcattt cccttgtctt cgccgcttgc 19560

gccctaactc cttctttcct gtgctctact ttcgccacac gcgctcgctc tcaatcttct 19620

cttcctccgg cgccatggca cggggctccg ctctgctcga tggtagcgtg ctgccgcctt 19680

cccgcatcgt gagcgagagg caggctgggc tgccgcgccg cttcatgccg gaatctgcca 19740

ccggccggga gatagtcacg ctgggtgagg gacgcccggc gccagactac ccggggcggt 19800

ccgtcttctt tctccccttt gcaatggcag ggctggttcc gccattttct tctttcttca 19860

tggatgttct gaagttctac gatctccaga tggcgcacct cacccccaac gcggtgatga 19920

cattggccat cttcgcgcat ctgtgcgaga tgttcattgg ggtgcgccca tctcttcggc 19980

tgttccggtg gttcttcacc gtgcagtcgg tgtcgccgcc atcggtagtt ggtggctgct 20040

acttccagcc atgggggccg gtgctgaatc gctacatccc ctgcgccctc cgcaagaagt 20100

gggacgactg gaagagcgac tggttctaca cccccctcgc cgacgaagcg cgcctctgac 20160

ttccgagcca gcccccggcg caggcctcca gctggcgggc gccggtagat ctgggggatg 20220

gctatgacgc cgtcctcgac cgcctggcgg gcctacgatc ccaggggctc acaggggcca 20280

tggtgtacgg cgactacctc cgtcgtcgga ttgcgccgct ccagcggcgc gctcggggcg 20340

cctgggagta caccgggtcc gaagactaca tgaggaccca ccagggagtc agatgggact 20400

gggctcctga ggatttcaag atagtggtcc aacgggtgct gaatctcaac tccatggagg 20460

cgtccctcat tccccaagga atcctccctc tctgcagcga tccagaccgc gcctccatcc 20520

tgaccattat gacggcggtc ggggcctcag aggagtgagc tccaaagggc cacgacggcg 20580

caggcgggag ccgtaggggg gatcaatcta ccccgggagg gggtcgtgct tctgggtctc 20640

gcgacggagg cccgaggagc agccgccctg ccgacgcccg ggggaagagg aagcagggag 20700

gaacacctcc cccatctcct ccccgagggg gcggggcggt gcgtgccaac agcaggcgcc 20760

cggagggggc cgcgccgaca tcgcagcccg agggggagcg caagaagaag cggctccgca 20820

agatggggga gacagaacca tctcggggaa accttatttc ccctccaaag tggtcgttta 20880

accgaccccc tcgcaggttc gtctctcacc catcgtggct gtattcattc tctcaacgcg 20940

agttttcact cacccatctt gttcgtcttc tggtcttttc ttctgtttca gcgagatccc 21000

gtcgcgtccc tcccgccatt ccaagtccgg ccagtctgag gccgaggatc cggcggccgc 21060

agaggcccgg aggcgggaat ctgaccggcg agaggccgcg gatcgcctac gggaagccga 21120

ggaggccgcc caggaggccg cccgggctcg ccagggcgag gaaaccgctc gggaggaggc 21180

cgcccgggcc cgccaggccg aggaagccgc tcgggaggag gccgcccgag cccaccaggc 21240

cgaggaagcc gctcgggaga aagccggatt tcgccaggac gaggcaatgg cgacttccga 21300

ggcagctcgc gatgaggtcg cgggcgcgtc gcttgagccc gcttcctcgg gcgacgctca 21360

ggcgacaact tccggggcag ctggcgacga ggctgcgggc gcgtcgcttg ggcccactcc 21420

ctcaggcgac gcccaggacc aaccaggtct gagggacatc cccgagtccg gcacttccat 21480

cggcggcccg agccgcgtgg catcctctcc aaggcggctc ttccccacgc cttctatcgc 21540

cccgctgagc gcagagcccc ttctgcaggc cttggccgcc gcaaacatcg cggtgttgga 21600

cgggcttagt gcccaggtgg aggccctgca agcagagtgg gcggagctcg acgccgcgtg 21660

ggcgcgtgtc gaggaggggc ggcgctcagt ggaggccatg gtggaggtgg gccgcaaggc 21720

acaccgccgg catgtctcgg agcttgaagc ccgtaagaag gtgttggcgg aaatcgccaa 21780

ggaagtggag gaggagcggg gggctgccct cattgccacc agcgtgatga acgaggcgca 21840

ggacaccctc cgccttcaat acgggagctg ggaggcggag ctagggaaaa agctcgacgc 21900

cgcccagggg gtgcttgacg ttgccgctgc ccgagaacag cgggcggggg agaccgaagc 21960

ggcgtcccga cggcgcgaag agacccttga ggcgcgcgcc atggcgctgg aagagcgcgc 22020

ctgcgtcgtg gagagggatc tggcggaccg cgaggccgcc gtcactatcc gggaggcaac 22080

actggcggcg cacgagtccg cctgtgccga agaggagtcc gcactccgcc tccacgagga 22140

cgcgctcacc gagcgggagc gagctctcga ggaggccgag gccgcggcgc aacggctggc 22200

ggacagcctg tccctccgcg aggcagcgca ggaggagcag gcgcgccgca ctctggaatg 22260

tgtccgcgcc gagaggaccg cactaaacca gcgggccgct gacctcgagg cgcgggagaa 22320

ggagctggac gcgagggcgc gcagcggcgg ggcggctgcg ggcgaaaacg acttagccgc 22380

ccgcctcgct gctgccgaac ataccatcgc cgatctgcag ggcacgctaa actcgtccgc 22440

cggggaggtc gaggccctcc gcttggcagg cgaggtaggg cccggcatgc tttgggacgc 22500

cgtctcccgc ctagatcgcg ccggtcggca ggtgggcctc tggagagggc ggaccgtaaa 22560

gtacgccgcc aaccatggag gcctcgccca gcgcctctcg aagatggccg gggctctcca 22620

acggctcccc gaggagctcg agaagacaat taagtcatcc tcgagggacc tcgcccaagg 22680

agcggtggag ctcgtactgg cgagttacca ggccagggac cccaatttct ctccatggat 22740

ggcgctggat gagttccctc ctgggaccga ggacagcgcg cgcgcaggtc cgggatgccg 22800

ccgaccatat cgtccacagc ttcgagggct cagcccctcg gctcgcgttc gcccccaact 22860

ccgacgagga ggacaatgcc ggtggtgcag acgacagtga cgatgaggcc ggcgacccgg 22920

gcgtatcgga ttgatccccc aagcccccgc cattcttcag ttttttcttc ttttccttct 22980

tctaaggcct tcgggcctct tttttgtata gatcaactta atctgtaatc aaaaatgaag 23040

aaatttttgt gtcaatttca tcttgctgtg tgtatgagat gaggatgatc tgtgacgtgg 23100

tccttttgcg tcttagcttg attaagggct cgtgcccagg tcccagtcct caaaaggcgt 23160

gggtcggggc tagtgcctgg ggagatccac atgtcgagac tggccaggcc gggaacgtgg 23220

tgaccgaggg ttatgggtga cccgattgtg ggtttttgcc gattcccccc cggagttcac 23280

cacgccccgg ggcacggctc ggttctgggc cccgtttggc gattttagcc gacccgagcc 23340

cccgagggca ggattgagca cgagtgacct atttcaagtc aagattcttc aaaaggaaaa 23400

aaaaacacag atacagcctt taggaaattg aaactgcttt tattgaaata ctgaaataag 23460

agaaataaga atgtgcatgt gtggcagccc ccggccaacc ctgcacgccc gagggggtgc 23520

ggggttggcc cgagcccgaa acctgacacc cgaccccccc cctcaggggt agaagcgacg 23580

aaggtgttcg atgttccacg ggttaggcag ctcaatgccg tcgcccgtgg ccagccgtat 23640

ggagcccggc cgggggacgc cgaccactcg atacggaccc tcccacattg gtgagagctt 23700

gctcaatcca gcacgcgttt ggacgcggcg taggacgagg tcgtcgacgc agagtgatcg 23760

ggcccggacg tgacgctgat ggtagcgccg caggctctgc tggtagcgcg cggctctgag 23820

ggccgcgcgt cgccttcgct cttccaagta gtcgaggtca tctctgcgaa gctgatcttg 23880

atcagcctcg cagtacatgg tggcccgagg agacctcagg gtgagctcgg atgggagaac 23940

cgcttccgcg ccgtagacga ggaagaaagg cgtttccccg gttgctcggc ttggtgtagt 24000

tcggtttgcc cagagcaccg ctggcaactc ctcgatccat gaatcgccgt gcttcttgag 24060

tatgttgaag gtcttggttt taaggccttt gaggatttct gaattggcgc gctccacttg 24120

gccattgctt ctggggtggg caggtgaggc gaagcagagc ttgatgccca tgtcttcgca 24180

gtagtcgccg aagagttcac tagtgaattg ggtgccatta tccgtaataa tacggttagg 24240

cactccaaac cgggccgtga tgcccttaat gaatttaagt gcggagtgct tatcgatctt 24300

gacgaccgga taagcctcgg gccacttagt gaacttgtcg atcgcgacat acagatactc 24360

aaacccgccc ggggcccgcc taaacggtcc caggatatcg agcccccaga cagcaaatgg 24420

ccacgaaagt ggtatggtct gcagggcctg ggccggctga tggatttgct tggcgtggaa 24480

ttgacacgct ctacatcgcc ggaccaggtc gaccgcatca ttgagagctg tcggccaata 24540

gaaaccctgg cgaaaagctt taccaaccaa ggtgcgcgag gcggagtggg ctccgcattc 24600

gccttcatgg atatcggcaa gaagcacaac gccttgttcc cgaggaatgc acttcaggag 24660

gattccatta gccgcgcgcc gatagagggt cccttctacc agcacgtagc gtttggagat 24720

gcgatggacg cgttcactcc cttcgcggtc ctcgggtaaa gtcttatctg tgaggtatgc 24780

ttggatctcg gcaatccaag caatcaatct aagggagctg ggagcgctcc cctcgggtcc 24840

cgaggcctgg acttcaacgg gcctcggggg ccggtcaggc gcgtccgtct cccctaaggg 24900

gtcgggtcgc gccgacggct gggcaagcct ttcttcaaag gcgcccggtg gggtctgggc 24960

tcgcgtggac gcgagccgtg agagttcgtc ggcaatcatg ttatcccgtc tgggcacatg 25020

ccgaagctca atcccgtcaa aatggcgctc catacgccgt acttggcgca cgtaggcgtc 25080

catctgcggg tcagagcacc ggtactcctt acagacttgg ttaacgacca gctgggagtc 25140

gcctaacacc aggaggcggc ggatccccag tccagctgcc actctgagtc cggcaaggag 25200

tccctcgtac tctgccatat tgttggtcgc tcgaaagtcg aggcggacca agtatctgag 25260

gacgtctccg ctcggagagg tcaacgtgac ccccgcaccg gcgccctgaa gagacaggga 25320

gccgtcgaac tgcattaccc agtgggcggt gtgaggcagc tgcgaggggt ccgtgctggc 25380

ctcggggatt gagacgggct cgggagccgg ggtccactct gccacaaaat cggcgagagc 25440

ctggctcttg atagcgtggc gtggttcaaa gtgcaaatcg aactcagaaa gttcgattgc 25500

ccatttcacc acccgtcctg taccgtctcg attatgcaag atttgaccga gggggtaaga 25560

cgtaaccaca gtgacccgat gcgcctggaa ataatggcgc agtttcctcg aggccatcag 25620

aatagcgtaa agcatcttct gggcctgagg gtatcgggtt ttggcgtccc ggagggcctc 25680

actaacaaag tagacgggcc gctgcacctt tcggtggggc cgatcctctt cgctaggggc 25740

cgcatccctg gggcactctt cgtccaagca gcctcgcggg gcgcacttgt cttctgtgct 25800

gatgacctcg gggtcggagg ataacagggg cggccttccc acagtggctt tggggccgtc 25860

ctgggggtca ggggctcctg gcgtcgtcgg acaagcgggc aaagggccaa ctccggtcgt 25920

caggggcctt aggcctccgt tcggctcggg ggcctcttct ccctgctctt tcccgggtcg 25980

agtcagcaca gggttagcct cggggtcaaa gggcgatagg tgcggccttc ccacagtggc 26040

ctcagggcct tcctgggggt cgggggctcc tagcaccgtc tgacaagcgg gcagagggcc 26100

aactccggtc gtcgggggcc tcgggccacc gttcggctcg ggggcctctc ctccctgctc 26160

tctcccgggc caagtcggca cagggtgggg aagcgcgaaa tgagaattgt cctcatcgcg 26220

ctccacaacc aatgccgcac taactacttg cggggtcgcc gctaagtaga gtagcaaggg 26280

ctcgtctggc tccggggcga ccagaactgg gggagagctt agatacgcct tcaactgggt 26340

gagggcattt tcagcttcct tcgtccaggt aaacggtccg gagcgtttga gaagcttaaa 26400

taagggtaac gccttctctc ccagcctcga tatgaaccga cttagggcgg ccatgcaacc 26460

ggtgacgtat tgcacatccc taagtttgct gggggggcgc atccgctcta tagcccgtat 26520

cttctcgggg ttggcctcaa tgccccgggc agagaccaag aacccgagaa gcttgcccgc 26580

aggtacaccg aacacacact tatcggggtt taattttatg cgggcggagc ggagactctc 26640

aaaagtttcc gctagatcta tgagtaacgt ttcctggttg cgcgtcttta caaccaagtc 26700

atcgacataa gcttcaatat tacgtcctaa ttggctaccc aaagaaattc gagtagtacg 26760

ttgaaaagta ggacctgcat tctttaaccc gaagggcatt gtcgtataac aataggttcc 26820

tatgggggta atgaacgcag ttttttcctc atcctcccta gccatgcgaa tctgatggta 26880

accagagtat gcatctagaa aacacaaaag gtcgcacccc gcagtggagt cgacaatctg 26940

atctatgcga ggcagggggt aaggatcctt aggacatgcc ttgttaaggt cggtgtagtc 27000

gatgcacatc cgaagcttgc cgttcgcctt gggaacgacc accgggttcg ctagccactc 27060

ggcggggttg acgctgccat catatttttc ggcgatggtg ggccggaacc ttgggggcca 27120

acggacattc cgaagactcg ccacaaaggc tctacagccg acaccaccaa ccgggggcac 27180

ggagggctga ttcccgcgtc cgtgttgagg tgacactctg gacgaggaag cgccctccgt 27240

tgcgtgggca gcacttcggt cattacgccg gcgctcgatg ctggtgcggg cgtccggccc 27300

cccacgcaga tctttctggg tcgaaggagt cgacgaagga gtggcggccg aatggcgaac 27360

agcggctgcc gctcgtcgtg ccctccgtct tgacgacgcg gagccggtgg tagcagcacc 27420

agaggccttg gtggcggagg accgcccacc agcatctagg cgctgccgta ccgtcatgac 27480

taatttggcc acgtcgtcca gccatcgttg ggctggagac tccgggtcag ggacgacagg 27540

cgggtgacgt aagagcgcgc ccgcagcttg gagcgcgccc tggggcgtgc tgccgtcgcc 27600

gtagacgagg aggcgacgct ccccatctcg ccgttcttct ccatcgcccg cgatcggtga 27660

agtcgcggat ctttcgaccc tctcgagcgc ctccccccgc ttaggacttt ggcgtggagg 27720

gagcggtgga gtacgagctc gacggcgtgg gttcggctcc ccgtcgtcgc cactcacact 27780

cggagagagg tcgtgcgcct ttgcttgctc ggccatcagg ctgaacagga aaagcttggc 27840

gcacacggaa gagtacgaga gctcagaaaa acacacactg agtcccctac ctggcgcgcc 27900

agatgacgga gcgtggggct cctcaccggg agaccgcgca ggcccccctt tgccggttcg 27960

gccggggact cagggtgaaa ttctaagctc tctgtatgtg gaaggttcgc gaccgtcgaa 28020

agagcataag acacgggcga tgtatacagg ttcgggccgc tgagaagcgt aataccctac 28080

tcctgtgttt tggggggatc tgtgtatgaa ggagctacaa agtatgagcc agcctctccc 28140

ttgttctggg ttccgaatct ggaaaagtcc agtccagtcc ccccctctaa gtgggcaagg 28200

tcctcctttt atatcttaag gggataccac atgcaccatc tccctccttt ctgtggggac 28260

ttaccctacc ttttcataaa tggacggaga tttgtatagt tgccgtccga atgaccttct 28320

gataggacgg cccataccta cctccacttc cgccgaaagc aggtgcgacg tgggattatg 28380

gctgtctgct gacgacatga ccagtgtcag actggtcaca aattgctcat tcctgtccac 28440

cacgcgtcag tttagcaatc tacatgttgg cccttcttca cacaacatct tgcctgtaat 28500

ggttaggatg aagcctggca tatatctaac caggactaac gtgccatctc taggaggtaa 28560

cacgctagct ccagctgggg acgagcgcct agaagccctc gtcctgacgg gatggggcga 28620

ggcgtgcgtc agatcgcctg tcgccaccta acccgcgatc tgaccggtct gtgactggtc 28680

acagaccgga taaacgagtg cactgcactt cgttacatgc ggcgtgacac gctcagccaa 28740

accgcaataa atgtggttag gtgagccccg ctgtgctcac ctaacccata cacgcggagc 28800

aaaaacccac gaggggtcgg ggcgcctcgg ccctcggggc cgaggcgggt gcggtccgac 28860

cccctcgggg ggactaagag gagggcgaac acatcaccct cgggcccgac gtcccccgag 28920

ggtgccaggc cacgtgggcg attgtgtctg cctcaaacct ctagtcatga tactcctgat 28980

cccatgtcat cgacaaggcc atccgaatgt attaaggagt aaaagttaca agaaaaaaca 29040

ccacaatgca ccaaggtgca tgaccacaca ccatacacta cccccaagca caaaccactg 29100

agggtgaagc ctagcaccaa acgaccgcca ctaagtgtga ccaaacgccg ctaggcctac 29160

ggcagcaaca catagatgag acttcgaaaa cgatgccacc aaggtggtca cgacatgtag 29220

gatgctgcca tcgtccatct aaaaagatgt ggttttcacc cagagaaact catcaagaag 29280

gggagagggt aacccttgac agcgccccaa ggaggttacg acgcccgaag gcgtagccgc 29340

tgccggtccg gtgaaccacc ggactaggct tccgcctagg accctatagc cttgatcgca 29400

gatcaccgtc caccactcag aaccaccaca cagacaaaag gtagcacgta gcttccaccg 29460

caccgcaccg acgccccttc gtcggccgac tccatcgaac caccatccct gagagctggc 29520

ccaggacccc tccgttccac cacccgccgg ccgccttgcc agttttggcc aaaggagaac 29580

ccgggactgg gtgacattgc ttcggcagcc tgagcttccc ccgctggcga gctgctgtct 29640

caatccaacc tagaaactcc ccgcaaaaga aggggatgag ctctaggaag ggcgagggtg 29700

ccgaccggca acgaggaaga caacccatcg actccagctc cctttgcact accatctggg 29760

cctgcgccaa tgccggatac gctgtcgctc cggctccggc gccacccacc tgcaccccct 29820

ttgcctggtc tccgcgcccc tcctggctgc gtcgcgccgc ccagctggcc gctaagggca 29880

ccacgacggc cgcccggcta ccgaggcctg gccgcgccat gggacagctc gcgctggcac 29940

cagcgagcca cggccgtcgc gctgttgccg gcgccagcga gcacaaccgc cagctccaag 30000

ggccgagcat gccactgagc cgccgccgct gccgcccggg ccggctgcac gtcaccggcg 30060

cacacgaccg cacgccgcca cgctccgcct ccgcgcccga ggcagcccca tgccattgcc 30120

gcgcacctcg cccgcccgct gccgagccgc caccgcgcac cttgctgagc cgccaccgcc 30180

gtccctagcc gcctcgtgcc gccgccacgc cagatccagg cgcgggatgg ccggatccgg 30240

ccttgggggc gccggatccg ccgcctcccc acaccgccac ggcgtcacca cctccgaccg 30300

cagtgagggc ttcgtcgttt gccccatcct catcgcgtcg aggaggaaga cgccaagaaa 30360

aaagggcctc gccgctgcct tccttgctcg ctgccggctt cgccgccggc gagctccggc 30420

ggcggcgagg tgggggagaa gaagtgggga gtgggcagct agggtttttt cgccccccaa 30480

gccgcccgtg cgagagcgac ggtggggggg gggggacttt ccaacctctt ccagtgttct 30540

agttctccac gttatgtaac tcaatttgtt taaccataga aagtaagaaa cctaccagcg 30600

tgttaagctc tctttcattc cctttcttct tcctggtttt gcttccatca catgtcaagt 30660

gaagggttct taactaccat tactcctaca catctaattt ttttctcaga tctttcgcag 30720

gtatatattg atgctacatt ttatgatctt aagataatct ccttcacatt accctctgct 30780

gaaactttag cttgaaccgt catcttcacc acaatttgag cccaatttgc acagagcaca 30840

acgagcaata gcttgccctt acgttcatta tttagcatga actactacta actacccaag 30900

aatcaataca ccggtttaat aacgccattt tatcacgtta atatatgttt cattcaacac 30960

accggttttg gcacagttgc aaacttgcaa taaattcttt cctacttctc catcccataa 31020

tataacaaat tggtatgtct cgtctggtac taagttgcta tattatgaga tggagggagc 31080

acttcttttc ttccaaaata taagaatata gtattggatt agatattatc tagattcacg 31140

aattcgatta ggttgtctag atttatagtt gtatgtaatg tataattcgg taataggtta 31200

ttacctctcg ggatggaggg agtagttttg actttttttt ttcttataaa tcgctttgat 31260

ttttatatta gtcaaatttt atcgagttta actaagttta tagaaaaaaa ttagcaacat 31320

ttaagcacca cactagtttc attaaattta gcatggaata tattttgata atatatttgt 31380

tctgtgttaa aaatgctgct atatttttct ataaacgtag tcaaatttaa ataagttaga 31440

ctaaaaaaaa tcaaaacgac ttataatatg aaatggagga agtagtagac tataacaaat 31500

ttaaaccgtg ctttgatttt agagcatcac taatatgtta gcaataatct atccctaaaa 31560

tttatttttt ttcctaaact gaaaatagga agtggaaata ctcctccatc taagagagag 31620

cctaaattca ataaaaaact aaaaaactaa aggtggatcc ctctattaaa ctaccgcaaa 31680

aaatttatgt tttttttctc ttccacgcgc gcagaacaga tatctcgatc aagttagcat 31740

gtaaaatttt taaagagata ccttatacga ctccttccgt atttccaaaa gcaaacggat 31800

ttaaaatctg actcaaataa agatctatat atccaattta catgacacat gtttcgccga 31860

atttttatat taataataat taatattttt aaaattaaat tattagcaat ttgtttggag 31920

gatttatcaa aacaggatgg acgttgttta taacagcgtc tagacctaga cgcgcttgca 31980

aactgcggcc acccttttat cacacaaatt tttgacaatt tgacactttc caaaaattaa 32040

ttttataaat taaccgtgac caaaacttat ttaaaaataa tctttttgtt gagcgcaaaa 32100

tcgtatactt cagcgccaaa tagcacggcg ccgacctccc ccttcccctc ccctctatcc 32160

tccactgctg ccgcccacct ctccgtatca gctgcgtcgc gttggtttcc gccggcgctg 32220

ctgctgctgc accagtccgc tagggcgggc gggcatggcg cgccgcgccg cttcccgcgt 32280

ccgcgccggc gctgttggcg cccttcgctc ggagggctcg acccaagggc gagggggccg 32340

cacggggggc agtggcgccg aggacgcacg ccacgtgttc gacgaattgc tccggcgtgg 32400

caggggcgcc tcgatctacg gcttgaactg cgccctcgcc gacgtcgcgc gtcacagccc 32460

cgcggccgcc gtgtcccgct acaaccgcat ggcccgagcc ggcgccgacg aggtaactcc 32520

caacttgtgc acctacggca ttctcatcgg ttcctgctgc tgcgcgggcc gcttggacct 32580

cggtttcgcg gccttgggca atgtcattaa gaagggattt agagtggacg ccatcgcctt 32640

cactcctctg ctcaagggcc tctgtgctga caagaggacg agcgacgcaa tggacatagt 32700

gctccgcaga atgacccagc ttggctgcat accaaatgtc ttctcctaca atattcttct 32760

caaggggctg tgtgatgaga acagaagcca agaagctctc gagctgctcc aaatgatgcc 32820

tgatgatgga ggtgactgcc cacctgatgt ggtgtcgtat accactgtca tcaatggctt 32880

cttcaaggag ggggatctgg acaaagctta cggtacatac catgaaatgc tggaccgggg 32940

gattttacca aatgttgtta cctacagctc tattattgct gcgttatgca aggctcaagc 33000

tatggacaaa gccatggagg tacttaccag catggttaag aatggtgtca tgcctaattg 33060

caggacgtat aatagtatcg tgcatgggta ttgctcttca gggcagccga aagaggctat 33120

tggatttctc aaaaagatgc acagtgatgg tgtcgaacca gatgttgtta cttataactc 33180

gctcatggat tatctttgca agaacggaag atgcacggaa gctagaaaga tgttcgattc 33240

tatgaccaag aggggcctaa agcctgaaat tactacctat ggtaccctgc ttcaggggta 33300

tgctaccaaa ggagcccttg ttgagatgca tggtctcttg gatttgatgg tacgaaacgg 33360

tatccaccct aatcattatg ttttcagcat tctaatatgt gcatacgcta aacaagggaa 33420

agtagatcag gcaatgcttg tgttcagcaa aatgaggcag caaggattga atccggatac 33480

agtgacctat ggaacagtta taggcatact ttgcaagtca ggcagagtag aagatgctat 33540

gcgttatttt gagcagatga tcgatgaaag actaagccct ggcaacattg tttataactc 33600

cctaattcat agtctctgta tctttgacaa atgggacaag gctaaagagt taattcttga 33660

aatgttggat cgaggcatct gtctggacac tattttcttt aattcaataa ttgacagtca 33720

ttgcaaagaa gggagggtta tagaatctga aaaactcttt gacctgatgg tacgtattgg 33780

tgtgaagccc gatatcatta cgtacagtac tctcatcgat ggatattgct tggcaggtaa 33840

gatggatgaa gcaacgaagt tacttgccag catggtctca gttggaatga aacctgattg 33900

tgttacatat aatactttga ttaatggcta ctgtaaaatt agcaggatgg aagatgcgtt 33960

agttcttttt agggagatgg agagcagtgg tgttagtcct gatattatta cgtataatat 34020

aattctgcaa ggtttatttc aaaccagaag aactgctgct gcaaaagaac tctatgtcgg 34080

gattaccgaa agtggaacgc agcttgaact tagcacatac aacataatcc ttcatgggct 34140

ttgcaaaaac aatctcactg acgaggcact tcgaatgttt cagaacctat gtttgacgga 34200

tttacagctg gagactagga cttttaacat tatgattggt gcattgctta aagttggcag 34260

aaatgatgaa gccaaggatt tgtttgcagc tctctcggct aacggtttag tgccagatgt 34320

taggacctac agtttaatgg cagaaaatct tatagagcag gggttgctag aagaattgga 34380

tgatctattt ctttcaatgg aggagaatgg ctgtactgcc aactcccgca tgctaaattc 34440

cattgttagg aaactgttac agaggggtga tataaccagg gctggcactt acctgttcat 34500

gattgatgag aagcacttct ccctcgaagc atccactgct tccttgtttt tagatctttt 34560

gtctggggga aaatatcaag aatatcatag gtttctccct gaaaaatata agtcctttat 34620

agaatctttg agctgctgaa gccttttgca gctttgaaat tctgtgttgg agttcttttc 34680

tcctacagtt gtattagagg agggatcttc tctttatgtg taaatagcga ggtatgtatg 34740

tcacctctcc gaattatttt tactctggtt cctagacggt aaacaagcaa ttatgttctg 34800

cctttgatgc cagaaaaaac acaaaagttt gtcgttatct ctactaacgg atcataaagg 34860

aatttgtaac tggagtttca aacttaattt gtctaggcag tagttttggc attagatcca 34920

acattgtgta ggattcattt gtgtgtatca atctataggg tttcattaaa tttcgttaat 34980

gtgtactgtt taggtgttga atagtttgac ttgtttttta actgaacaaa agatactgaa 35040

atcgttccat tcaacaaaca catgttccgt taatgaaatt attgtacgtt accttttgtt 35100

ttcttactca caagtgtcct cttttcttat atcctataga ttggtacaac aaattattga 35160

ttcaattttg gttttgaaca ttgatgatcc tccctgcact attggtgcag ctgctcttct 35220

attcattttg tgaagtgatg tgagtacctc tcaatcccat ccttatgctt ctgtgcatgc 35280

ttcattccaa ttttttacgc atatcgattg ttttctttta tataacagtc cataaagata 35340

atcacatcat gacaaagtta tttatttcta cagtatagtt atataagtat tcaccagttt 35400

tccatgaata ttttggcatg tgattacaaa gaagattatt tgagaaaatc catgctttta 35460

tttcatcttt ttgtttgaag ttgaacttta atttatggtg taaatttcag ttattattgc 35520

tagcagctcg tactctttaa tggtataact tcacttgtgc ttattctcca atatctccct 35580

tcttgttgtt caggttcaag aaaatcattt gttggattca gaatctggtg tccattttct 35640

tcttaaatta ttaaatcctc cagtgaatct tgttgattcc aaagcaccat cgataggttc 35700

caaacttctt ggaatcagta aagttcaaat gcttaatgga tcaaataagg attctgactg 35760

catttcagag gaaatccttt caaaagttga agagattctc ttaagctgtc aagtgatcaa 35820

gtcgctcgac aaagatgaca agaaaacaac aaggccagaa ctgtgtccaa agtggcttgc 35880

tttgttgaca atggaaaatg catgcttgtc tgctgtttca gtagagggta agttttaatc 35940

aaatttcttg gtcatgattt ccctttatga ccattatatt tatttatatg agccaaataa 36000

gcagttgtca acttgtcata agttacatag cacctatttg caatattcat gggtggtttg 36060

cttagccctt ttcttcacct gcttttgatt gatgacttcc atctgtgttg cagaattgaa 36120

ttggagtagt ggactgcact agaagcacct atggccattg tcatactagg aaggttttcc 36180

cttatcaaat atttgattgt tacagagact tctgacacag tgtccagagt tggaggaaat 36240

tttaaagaga cattaaggga gatgggaggt cttgatagta tttttgacgt tatggtggat 36300

tttcattcaa cattggaggt gagatctcgc taacatcgca tattttacat ttcctttgtt 36360

caactctaat ggattgtgca ggcttgttcc ttttcgccat tttagcttta atgtgcttga 36420

agccacatga aagtaatgct tgtccagata catagccaaa ggttgttata ttttggggca 36480

tggaaaatgc ttgaggtagt aactattttc atcaggacat ggaaaattgg ctgcaacaca 36540

aattatgttg ttttatgttg caaaaatagt tttttaatac ttttttattc tgcatgtggt 36600

gttagtatct tacagttcct ctgatgatta tatcccccac gataataaca cttgaaacga 36660

taataacact tgacatatct acaccaagtg aacattattc atttggatgt tacttttcca 36720

gctatacttg ctgttcttgc atgtgtaagc aagtttggag taaattgcgc attaatttaa 36780

atgcttggtg ttcctatctg tgtacttttt attccccaac taataatgca atcatattac 36840

gctgataaac tgaataaata aattaacaat atacttctgg tggcaaacct tgtgtatcag 36900

aatctcataa aggatacatc cacttcagct ttggaccgaa atgaaggaac atctttgcaa 36960

agtgctgctc tcctcttgaa atgtttgaaa atattggaaa atgccatatt tctaagcgat 37020

gataacaagg taatgctcct tatatgttct gtttcagttt agtacccatt tccttcttct 37080

gtactatctt ctctcctgat ttgttctgtg caaaatgtgc aaacagtgcg actttgtatg 37140

tctgcttaac aattttcttt tcttcctgaa aaagcaatat gaactcttac attcattttg 37200

cttcttgcag acccatttgc ttaatatgag tagaaaattg aacccgaaac gctccttgct 37260

ttcttttgtt ggtgtcatta tcaatactat tgagttatta tcaggtattt ttcttaataa 37320

tacaatgtgt tcgctaacac aataaaatgt tttaaacatc cagtatgtta aagttgcagt 37380

ctgacgccta ttttgttttg ctgcagctct ttcaatactt cagaattctt ctgttgtttc 37440

cagctctaca tatccgaaat cgtctaaagt ctctcaacag agttactctg gtaataacaa 37500

acaccaattt tgtttgatca gttgatctcg ttggcttttc tatgcactgt ctcaatatag 37560

tttggtcgcc attcaagtct cactacagat gttgaacttg gcctgacacc aaatatttat 37620

aaaatgctac ctgatatttt taatatttca tgtttcctga cccagattat cttgttggtt 37680

cctcgtataa gtttaattag tgacattctt gaagctttgt tatgcagcag atgtcatggg 37740

gggaacttca tttaatgatg gaaagagcaa gaactcgaaa aaaaaaaact tttgtcgaac 37800

cagacacgtc attgttgctt atcttcaaaa tcagaagttt ctcatattac tatatcttct 37860

ggtagtgatg ctggtctgtc acagaaggca ttcaattgtt ctccatttat atcaagcaat 37920

ggggcatcaa gtggttcatt aggcgagagg cacagcaatg gtagtggttt gaagttgaat 37980

ataaaaaagg atcgtggcaa tgcaaatcca attagaggct caactggatg gatttcaata 38040

agagcgcaca gttctgatgg gaactccaga gaaatggcaa aaagactccg tctatcttaa 38100

aatgtaatca ccgacagtgg tggtggtgat gacccttttg catttgaccg ccgcgtcggc 38160

gtcgccacca cgtaatcgcc cacgtcgctg cccccgctgc cacgtcgtcg accgcgcacg 38220

gtaatcacac gcatctcgag gccgccgcta gctgatatct tctcatccgg ttgatttgtg 38280

attttggcgt ttttgcagtg gtgatggcgg ggggcgaccg tggccgaggc gtggagtgcc 38340

atccgcatca gggtgtatcg gccgcgctgc tccgccctgg tccgcaggct ttggcggcga 38400

gctggcggcg gagggagact gtggtgagat cggatttcgc cgctggtggt gtcgctacca 38460

tgggggattc gccgcaggcg ctctcaggtt tgcagcctcc tccactctct tccctttttt 38520

attttttttt ctcgcaaaat gtgttgtgat gttcgtctcg ctgggcaggc ctcatagcca 38580

ttaatgtagt ttgctggaac atttacattt ggaacgttgt tggcaattgc ttgacaaaat 38640

gtggaattgt ggaggggaga aaaatcattt gaacctgcag tgacaaaatt gccatctcta 38700

attttaaaac tgaaggtgtg gaaatcaaac ataatcattg ccagcgcatc attcttgtta 38760

accaccatga tatattgttg gttataacag ttagctccac accaaccttg aaggtgtcaa 38820

tagaatgttt agtataaatt gaggagaaca ggcagttgtt aagactttct aaagaacttg 38880

tagcagctaa tactagctat tgtgcatttg tgtttcatgg aatttgagca gcaatggata 38940

tttcttacta agatgtatga tgcaaaacaa aaaactatgt ctatacagtt tacatgtaat 39000

gtgcggatgc aaataaaatc atgtacatgg acaaactcat gggattcata ccgaattcca 39060

gaattgcatt tcttatgtgg ttacttttgt tgttgatttg gttaccagac atcgatgtga 39120

tttcaagggt cagaggggtt tgcttctacg cggtggctgc agttgcagca atctttttgt 39180

ttgtcgccat ggttgtggtt catccacttg tgctcctatt tgaccgatac cggaggagag 39240

ttcaggaaaa aaatttgaaa atacccattt tttgaaaaag atttacgttt atatacacta 39300

gtatgaagaa tttgcgaaaa tataactaat ccgcagatcg gttatgcggg agcgcaacaa 39360

aagtatggcg tggcggcgcg gagtggacgg ccgaggcgtt cgcgcggaat ggggctgcgg 39420

gaccgagcca gtctcgcttg ccggtaacgc ggaaccggta cgctcccgca gcgccagtgt 39480

gcggaaccgc ggcgccaaca tttttttact gcatggcact gtgtttaata ctgtttgaca 39540

ctgtttctgg tactgtttta cacagttccc gggtcagttc cgcacaatgg aggcgcggca 39600

ccgaccatga acaatgtgtg aacagtgctg cacagggtta aaacagtgta taaactgcgc 39660

tgcacagtgc tggagtcgct ggccactgcg gttccgcgtt ttggaaccgc gggaccgtcg 39720

cgattccgcg ttttggagct gccggaccat gacggttccg cgcaggatcg tcggtcccgt 39780

attttgaatc tgcggaaccg tcgctgtccc gcgtttccgt ttcgcgggat gcgtatattt 39840

ttataaaacc tctccatgca tgtatataaa cataaattat tgaaaaaata agtatatttg 39900

caaatttttt tcgagagctc agcactacat tgcaaagatt tgggcaactc tgacaatttc 39960

catgttctac aagcttgacg tcgagggaat ggagaacctg ccaccgaata gtagccctgc 40020

tatctatgtt gcgaaccatc agagtttttt ggatatctat acccttctaa ctctaggaag 40080

gtgtttcaag tttataagca agacaagtat atttatgttc cgaattattt gatgggcaat 40140

gtatctctta ggagtaattc ctttgcggcg tatggacagc aggagccagc tggtatggct 40200

gtagtctcat ccctgctttc ttaagtagac atatatgcaa ttacagaatt tggtaaacaa 40260

acaagatttt atgaatcata tatgattttg gggaaaacac caaactctct ttggtggctg 40320

ccttgaacat agttctattc acacagttat agcaccttct ttaaaatgaa gaactttgtt 40380

gcatacacat atggccaaac cacataatga attttgttta tttctatctt tgaatgttag 40440

caccttattt tcatgcatat catgctaatt tgcttgccca cgttgagtgg gaattttttt 40500

ccatgtttta taatttatat atgttctaga cttctagtcc acaatttatc tacttcatgt 40560

tcctgagcct ctagtatggc tggtagcaga ctaggtgctg agtgctgtcc atttttgcag 40620

actgaagaga ggagaaatac aggactgtcc gttgttagtc agatttgtaa aaatagactc 40680

tgatgtagtt tattttagcc cctattttat atttaacaat acaaatatat aacgtatcct 40740

aagaacttat cgtaatttag gagaagttgc tcgtttcatt aaattaaact gtgaagtaaa 40800

aatgtgtgct cgagtctgtc aatgcaatcc tgtgttcttg tttgaagata tggtgtaggg 40860

caggctagga tcgaacactg aatggtaaga ctgcttctgc cttcatttgt gcacttggtg 40920

ctgccacgcc gattaagcag tagaacaaag taattttgtc gtgcacaaat gagttatatt 40980

tcattgaaaa tcgaagtgaa aatgaaccaa aagatagaag aaaaggggaa acttggtaat 41040

tatatactcc acaaatttat tggtaagatt tgatattaga cgctcgatta cttggcttaa 41100

gttaaggata tcaaatttgg ggaagcacca aaggaattat tgtgaaggag ttgtgggtgc 41160

ataacgttat ctactaggtt caaatcctag tgactatgaa tattaatgag taaggtaagg 41220

gatttattgt taattttagt ttctttaaga ttgtgtccgg gtacaccatt cggtaagtgt 41280

aataatgttt tgtattggat tcacttgtgt tacgtgcatg tgatttacct tttcatttgt 41340

ttctgcgttc tgggtatgaa tttgacgaga ttccatggtc agctcaacat atcagttact 41400

gcgtgtcaag cgatcttata tggtatgcgc acaagcgatt gtatacggat atgacagtat 41460

aacgtgtgat attgatacga tgttcctttc ctttataaag gaacaaagac ttttttaaaa 41520

aaaagaaggg gtattactaa aaaccaaaat gtcaaaaaca aaatatcagt gcacatggca 41580

agtgtgcacg agcaatagct tgcccttacg ttcattattt agcatgtact actactaact 41640

acgcaaaaat caattcaccg attattaaac tgttaacatc attttagcac gttaacatat 41700

gtttcattca acacaccggt tttggcacat ttacaaactt gcaaagttgc aatactccct 41760

tcgttacata gcataagaga ttttaggtga atgtgacaca tctatccaaa ttcattatac 41820

tagaatgtat caccgcctcc acgccgggag ggagagcgcc gccggtggag aaagggggag 41880

ggagtggtcg aggggaacca gtagggtgcc ctccccgtcg ccgcctcccc gtggccgcgc 41940

cggcgagaca ggaggaagag ggggatatgg agcggcgccg ccggtgaggg cgcgcgcgcg 42000

ggggggagcg gcgacgccgg tgaggaaggg aaggggagtg gtggctttga gagagatagg 42060

ggggaggaaa aatgatttta gagttagggt ttgggctgct gagtttttat atagatcggg 42120

atcaatcagg accgtccatc agatcggaca actacggctt ctcccgcgtt gggccgggtg 42180

ccactcctag gttgcccaca ctattgggcc acatgtacgc tccgcgtgaa ataagttcac 42240

tttaggtcct ttaagttgcc tctgaattgt tcccaggccg gccgcactat tgggccaccc 42300

cataggccat gtgtacgctc cgcacagaat aatttcgctt tagctccctt aatttgtccc 42360

ctcaaactcc taaaaccagt gcaaatcttt aatttttagt tcacccattg caactcacgg 42420

gcatatttgc tagtgacata taatatgaaa cgaaggatgt agcagactat agaatttaaa 42480

ctgtgctttc attttagagc atcactaact gttatttaga tttttattta aataaatgct 42540

gaaatgatgt ttttattatg aaaattagca ataaagctcc caaaatttca aaaaaaaatt 42600

aaaagagatt tattaatcat ggttaattta attaaaaatt aaatctaacc atatcatatt 42660

atttcacggt ccgtgatgag gaaatggcag ctgctatcac ttacggtggg agagaagggg 42720

cattgtttat ttttataact atctcttata actcccatga aactataaaa taaatataat 42780

cattatcata acattagttt tttttccatt gcaacgcaag ggtaattttt cagtacaata 42840

aaaaaaataa aagtgggcca ttctgaacgg aaatttctgg ttttttttcc caagagcgcc 42900

gcacacaact gcgcaagaga tcgatcgcga tcaccctgct cgtcgccgat ctcctacacc 42960

atccctgcca tctccttccc ctccactggc tgctgctgca cctgtcagct agggcgggca 43020

tggcgcgccg cgccgcttcc cgcgctgctg gcgcccttcg ctcggagggc tcgatccaag 43080

ggcgaggggg ccgcgcgggg ggcagtggcg gtggcgcgga ggacgcacgc cacgtgttcg 43140

acgaattgct ccgtcgtggc ataccagatg tcttctccta caatattctt ctcaacgggc 43200

tgtgtgatga gaacagaagc caagaagctc tcgagttact gcacataatg gctgatgatg 43260

gaggtgactg cccacctgat gtggtgtcgt acagcaccgt catcaatggc ttcttcaagg 43320

agggggatct ggacaaaatg cttgaccaga ggatttcgcc aaatgttgtg acctacaact 43380

ctattattgc tgcgctatgc aaggctcaaa ctgtggacaa ggccatggag gtacttacca 43440

ccatggttaa gagtggtgtc atgcctgatt gcatgacata taatagtatt gtgcatgggt 43500

tttgctcttc agggcagccg aaagaggcta ttgtatttct caaaaagatg cgcagtgatg 43560

gtgtcgaacc agatgttgtt acttataact cgctcatgga ttatctttgc aagaacggaa 43620

gatgcacgga agcaagaaag atttttgatt ctatgaccaa gaggggccta aagcctgata 43680

ttactaccta tggtaccctg cttcaggggt atgctaccaa aggagccctt gttgagatgc 43740

atggtctctt ggatttgatg gtacgaaacg gtatccaccc taatcattat gttttcagca 43800

ttctagtatg tgcatacgct aaacaagaga aagtagaaga ggcaatgctt gtattcagca 43860

aaatgaggca gcaaggattg aatccgaatg cagtgaccta tggaacagtt atagatgtac 43920

tttgcaagtc aggtagagta gaagatgcta tgctttattt tgagcagatg atcgatgaag 43980

gactaagacc tgacagcatt gtttataact ccctaattca tagtctctgt atctttgaca 44040

aatgggagaa ggctgaagag ttatttcttg aaatgttgga tcgaggcatc tgtcttagca 44100

ctattttctt taattcaata attgacagtc attgcaaaga agggagggtt atagaatctg 44160

gaaaactctt tgacttgatg gtacgaattg gtgtgaagcc cgatatcatt acccttggca 44220

ggtaagatgg atgaagcaat gaagttactt tctggcatgg tctcagttgg gttgaaacct 44280

aatactgtta cttatagcac tttgattaat ggctactgca aaattagtag gatggaagac 44340

gcgttagttc tttttaagga gatggagagc agtggtgtta gtcctgatat tattacgtat 44400

aacataattc tgcaaggttt atttcaaacc agaagaactg ctgctgcaaa agaactctat 44460

gtcaggatta ccgaaagtgg aatgcagatt gaactttgtt agatttaatt ggataattaa 44520

tccatttaaa tcaattaaat caaataaatt ccaaggctca ttatgctagg aattcatgtg 44580

aattcattct tctatgggat atcaatggga tgaagagttt tgagaattaa tccatttgat 44640

taaggaattg gtaacttata tcaattaatc ctaattgatg gatggttgat ggttgtgtag 44700

tggaggatgg ttcatggcta gttgatgaca attagttgct ctattcctct tcctattcca 44760

ttggtaactt acatcaatta ctcttaattg attgttggtt gatggttgtg tagtggagga 44820

tggttcatgg ctagttgatg acaattagtt gctccattcc tcttcctatt ccatgactct 44880

tactcttcat cttccattcc tcttataaaa tgagaatgga tttgatctcc cgcgagaaga 44940

agaagacaca ctttcatcca ttttcaaaag ctgttgctgc tacggtaatc ccatcccgac 45000

gagtgtgtgc acacgcgttg ggagagtagg cctccgaaac cacgcgttgc tgcgacgttt 45060

gcacagacgg gcgggcgatc aggtttttgg ggagcgcaag gcgcgactac tcactgttcg 45120

tcaacatcta cttcatcttc accaacatgt cgaacactgg agacaaggag aaggagactc 45180

ccgtcaacac caacggaggc aatactgcct caaactccag cggaggacca ttcttggggt 45240

ataaccttat tacattattt caattagaag ttttactgtt aatgttcatc gcaatgtcaa 45300

cattgtgtca ttatgtgatt gttgatgctt attcaacgtt aagcatgctc atgttgatta 45360

cattcaccac tatcactgga tcaaatccta ttgtaaatat catgtttatt atcttgttat 45420

tttggattaa aatatgccga attatgacca aatttccaac aaacttagca catacaacat 45480

aatccttcat ggactttgca aaaacaaact cactgatgat gcacttcgaa tgtttcagaa 45540

cctatgtttg atggatttga agcttgaggc taggactttc aacattatga ttgatgcatt 45600

gcttaaagtt ggcagaaatg atgaagccaa ggatttgttt gttgctttct cgtctaacgg 45660

tttagtgccg aattattgga cgtacagatt gatggctgaa aatattatag gacaggggtt 45720

gctagaagaa ttggatcaac tctttctttc aatggaggac aatggctgta ctgttgactc 45780

tggcatgcta aatttcattg ttagggaact gttgcagaga ggtgagataa ccagggctgg 45840

cacttacctt tccatgattg atgagaagca cttttccctc gaagcatcca ctgcttcctt 45900

gtttatagat cttttgtctg ggggaaaata tcaagaatat catatatttc tccctgaaaa 45960

atacaagtcc tttatagaat ctttgagctg ctgaagcatt ttgcagcttt gaaattctgt 46020

gttggaattc ttttctccta cagtccgatt agaggaggga tcttctctgt atgtgtaaat 46080

agcgaggtat gtatgtcacc tctccgaatt attttgactg tggttcctgg actgtaaaca 46140

agctattatc ttctggtgtt gatgccagaa aaaacacaaa agtttgtcgt tatctctact 46200

aacggatcat aaaggggttt gtaactggag tttcaaactt aaggtatcta ggcagtaggt 46260

atatattgat cctacatctt atgatcttaa gatgatatcc ttctcattat cctctgctga 46320

aactttagct tgaaccgtca tctacaccac aatttgagcc ccttagcaca gagcacaacg 46380

agcaatagct tgcccttacg ttcattattt agcatgcact actactaact acccaataat 46440

caatacatcg gttattaaac tgtttgtaca gtttaataat gtcattttat cacgttaaca 46500

tatgtttcat tcaacaccac accggttttg gcacagttgc aaacttgcaa taacattttt 46560

actacttctc cgccccataa tataacaatc tcgttccata ctatattgct atattacggg 46620

acggatgaag tacttctttc cttccaaaat ataagaatct agtcctagat tagatattat 46680

ttggattcac gaatttgatt aggctatcta gatttgtagt cgtatgtaat gtctaattcg 46740

gtaataggtt attacctctt tggatggagg gagtagtttt tatttcgtac tccctctgtt 46800

tcatattata agttgttttg acttttttct tagtcaaatt ttattgagtt tgactaaatt 46860

tatagaaaaa aaattagcaa catttaagca ccacattagt ttcattaaat gtagcatgga 46920

atatattttt ataatatgtt tgttttttta ttaaaatgct actatatttt tctataaatg 46980

tagccaaatt taaagaagtt tgattacgaa aaaaaatcaa aatgacatat aatatgaaac 47040

tgaggatgta gcagactata gcaaatttaa actatgcttt tattttagag catcaccaaa 47100

agagatagcc taaatcttat cttaactaat taaaatattc ataattttcc tttcgtcaca 47160

ttaaattttc gtccgtaaat ccgattgaaa tccaactaga caatccaaaa aatagagaaa 47220

aagaacagaa aaaataataa aaagcacaca aatcttatct caatcccgcg ggaagctgcc 47280

gatgccgccg aatccgctcg agcgccgccg ccgccgctca cggggaacga tgtcgctgct 47340

atcgcacgtg gtatgggagg gcgccgccgc cgctgcttgg gagataggat atggagagag 47400

aaggaaatgt gagggagggt taggtttttc cccattcgta tcttcagcga cacggaggcg 47460

atccaagctg tccatcagat cagacggctc agaacgcctc catcttcagg ccgcgcatgc 47520

ttgatgggcc gagggaaggc cggagggtcg aacaaacgta gtcagaggag gagttggagg 47580

aggtaaagta gaatttattt gcgggctgag atagtaaatg gactgaaaat ggcccataga 47640

gaaattggga attttattta aataaatgtt gaaaaggtgt ttatattatc aaaattagaa 47700

attaagctcc gaaaatttta aaaaatattc aaagagcatt attaatcatg attaatttaa 47760

taaaaattaa atccaaccat atcatattat ttcacggcgc gcagtaggaa aatgcgcagc 47820

tgttgtcgct tacggtggga gagaagggac attgtttatt ttcagaacta tcttttataa 47880

ctcccatgga actttaaaat aaatataatc attattatag cattagtttt tttctgtctt 47940

ttttttcccc aagagcgccg cgcagaagag atcgatcgcg atctccctgc cccgacgtcg 48000

ccggccgatc tctcattctc tccacgccct gctcgtcgcc gatctcctac accatccctg 48060

ccatctcctc cttcccctcc cctctatcct ccactggtgc cgcccacctc tccgtataag 48120

acaaactgcg ttgcggcgtt ggtttccgcc ggcgctgctg ctgcacctgt cagctagggc 48180

gggcatggcg cgccgcgccg cttcccgcgc tgttggcgcc cttcgctcgg acggctcgat 48240

ccaagggcga ggaggccgcg cggggggcag tggcgccgag gacgcacgcc acgtgttcga 48300

cgaattgctc cggcgtggca ggggcgcctc gatctacggc ttgaaccgcg ccctcgccga 48360

cgtcgcgcgt cacagccccg cggccgccgt gtcccgctac aaccgcatgg cccgagctgg 48420

cgccgacgag gtaactcccg acttgtgcac ctacggcatt ctcatcggtt gctgctgccg 48480

cgcgggccgc ttggacctcg gtttcgcggc cttgggcaat gtcattaaga agggatttag 48540

agtggaagcc atcaccttca ctcctctgct caagggcctc tgtgccgaca agaggacgag 48600

cgacgcaatg gacatagtgc tccgcagaat gaccgagctc ggttgcatac caaatgtctt 48660

ctcctacaat aatcttctca acgggctgtg tgatgagaac agaagccaag aagctctcga 48720

gttgctgcac atgatggctg atgatcgagg aggaggtagc ccacctgatg tggtgtcgta 48780

taccactgtc atcaatggct tcttcaaaga gggggattca gacaaagctt acagtacata 48840

ccatgaaatg ctggaccggg ggattttacc tgatgttgtg acctacagct ctattattgc 48900

tgcgttatgc aagggtcaag ctatggacaa gccatggagg tacttaccac gatggttaag 48960

aatggtgtca tgcctgattg catgacatat aatagttatt tcttgaaatg ttggatcgag 49020

gcatttgtct ggacactatt ttctttaatt caataattga cagtcattgc aaagaaggga 49080

gggttataga atctgaaaaa ctctttgacc tgatggtacg tattggtgtg aagcctgata 49140

tcattacata cagtacactc atcgatggat attgcttggc aggtaagatg gatgaagcaa 49200

tgaagttact ttctggcatg gtctcagttg ggttgaaacc taatactgtt acttatagca 49260

ctttgattaa tggctactgc aaaattagta ggatggaaga cgcgttagtt ctttttaagg 49320

agatggagag cagtggtgtt agtcctgata ttattacgta taacataatt ctgcaaggtt 49380

tatttcaaac cagaagaact gctgctgcaa aagaactcta tgtcaggatt accgaaagtg 49440

gaacgcagat tgaacttagc acatacaaca taatccttca tggactttgc aaaaacaaac 49500

tcactgatga tgcacttcag atgtttcaga acctatgttt gatggatttg aagcttgagg 49560

ctaggacttt caacattatg attgatgcat tgcttaaagt tggcagaaat gatgaagcca 49620

aggatttgtt tgttgctttc tcgtctaacg gtttagtgcc gaattattgg acgtacaggt 49680

tgatggctga aaatattata ggacaggggt tgctagaaga attggatcaa ctctttcttt 49740

caatggagga caatggctgt actgttgact ctggcatgct aaatttcatt gttagggaac 49800

tgttgcagag aggtgagata accagggctg gcacttacct ttccatgatt gatgagaagc 49860

acttttccct cgaagcatcc actgcttcct tgtttataga tcttttgtct gggggaaaat 49920

atcaagaata ttataggttt ctccctgaaa aatacaagtc ctttatagaa tctttgagct 49980

gctgaagcat tttgcagctt tgaaattctg tgttggaatt cttttctcct acagtcctat 50040

tagaggaggg atcttctctg tatgtgtaaa tagcgaggta tgtatgccac ctctccgaat 50100

tatttttact gtggttccta gactgtaaac aagcaattat gttatgctgt tgatgccaga 50160

aaaaacataa aagtttgtcg ttatctctac taacggatca taaagggatt tgtgactgga 50220

gtttcaaact taatgtgtct aggcagtaat tttgacatta gatccaaaac aatttatagg 50280

gtttcattaa atttcatcta tgtgtactgt ttaggtgttg aatagtttga cttgtttttt 50340

aactgaacaa aagatatgtc tgaagctttg ttctttacca aatgcagtac tgatcatcac 50400

aatatatttt ttatggaaca agattggatt gtatagaatg gtttccgatc tgattatctt 50460

atctcaacgt attattatgc acatgtacta atcatgaaat atctgatgga atgatgtttc 50520

tatttacctg tgtgaggcag caaggagtga gatggataac accacatact ccctctatcc 50580

cagaatataa gaagttttag agttggacac gattattaag aaagtaggta gaagtgagta 50640

gtggagggtt gtgattgcat gagtagtgga ggtaggtggg aaaagtgaat ggtggagggt 50700

tgtgattggt tgggaagaga atgttggtag agaagttgtt atattttggg gagtacatta 50760

ttattctaga acaatactgt tgtgctcaag aagcgttcca aagatgtttc acaacctgtg 50820

ctcgatgggt tttgagctta atcctgggac attcagtatc atgatctgtc tcattcttaa 50880

acatggaata aaggatgaca gcatgatttc tttgtctcta taatcttttg gctacccaca 50940

gataatagct gtaaatctat actactttaa aaggagtagt ggtggtggtg agtggtgaat 51000

ctgccaccac cccaccacca actctcaaaa ttctgacatg tgggatcact gtcaatccct 51060

tctccaagac atgtgggatc actgtcaatc ccttctccaa accaattgta tgatagaaca 51120

gtggaaatca cggacagacc atggagctct caaccataat catccttgcg agttaataac 51180

aaatggagcg taaacttggc aagcaaaaaa ctcaaattaa ttctaaaatt aagctctagg 51240

attcaaaata gatttcctct ctgcattgtg ctgttatgat ttttaattcc gtaacaacgc 51300

aaatgcattt tgctagtctt ataaagaagg gttaatgcaa atattctgat taaatgattg 51360

tatctatgaa gtttgaatgc tagtggaagc tcctttgacc atgttttgtt gtgcgagcat 51420

ttaagagagt gaagagaatg cttctttggt gctgttctgg tatggaagga tccacagata 51480

aaattcaggt tctactgctt ctctgcttgt aattttcatg aagctgcagt gaataccttg 51540

ttgaccactt gatctgttgc tttgaaggag aatatagtag tggccaaggt tggtgacggt 51600

gatggtggca tgtgatcccc cagatcttca gtgacccaga gaggagggga cggcgcgtgg 51660

tgagctacaa ggcatactca gtggagggca agatcaaggc ctcccgtccg taggggactc 51720

cgctgcatca aggccaactg ctccgaactg atcaatttct ggtacggatc acttctcctt 51780

tccttttttt tttcacctta agcactctct tgattcttcg ctgctacctc ccttaatttc 51840

tttcaatata ttgtggcact tgatcatggc ggagacccac cttccagtgt gaatggattt 51900

tgtcaaagaa ctaaatttat tccattagct tattttctga ttacatggaa gacattcttt 51960

tctggaataa atacagaact aaatcctgtt tcctgaataa aagttgttag tgtgtggcat 52020

ggtgcatttc cgcgcttcta aattttataa aacctgttca ttcaatttga acctgcatcc 52080

aatccaatat tttaggtgca gacaggtgct tgcggtcagg ttaaagaagt tggcaaaaat 52140

gcttctgaag aaaggttaat tgttgtttca tctcaggagg taatatgcag atgattattc 52200

caattggcat tgccttgcca tttttatcac gagtctttac aattttatat cctcctacat 52260

attctttcca gattccagat gatccagtgt ctccaacaat tgaggcgctt attttgctcc 52320

atagtaaagc aagtacactt gctgagaacc accagttgac aacacggctt gttgtaccat 52380

caaacaaagt tggttgtatt cttggggaag gtggaaaggt aattactgaa atgagaagac 52440

ggactggggc tgaaatccga gtctactcaa aagcagataa acctaagtac ctgtcttttg 52500

atgaggagct tgtgcaggta atttatttgg ccatacctac accagagatc catatattac 52560

ttttataact gcagttttta cttgttaaca tttcattgtg cttttacatt tgttccaagc 52620

tttcaggttg ctgggcttcc agctattgaa agaggagccc tgacagagat tgcttcgagg 52680

ctttgaacta ggacactcag agatggaagt tcttccaata atccgacacc ttttgcccct 52740

gttgatggtc ctcctgttga tatcttgcct aacaaggaat tcatgctata tggacgatct 52800

gctaatagtc ccccatatgg agggcctgct aatgatccac catatggaag acctgccatt 52860

gatccaccat atggaagacc aatatccaca atatggaaga cctgccaatg atccaccata 52920

tagaagacct gtcaatgata catcatattg agggttggac aatgatgggc ctcgtgatca 52980

ggcccggtcc tgaggggggt cgaatggggc gatcgctccg ggcccccgat tcccagggcc 53040

cccacctatc tgtgcaacga gtagtagcga tcttccagcg cgcaacgtga ggcgatgttt 53100

ctccgtgatt tcgccggcct gcaactgcga gatcgcgagt ataacgatca gccgatcgat 53160

ctcatctgcc gactgccatg ctgatgccac acgcaagcgc agcatatcag ccttatcttg 53220

gttgatcggc atgctggacg agcacatctg ttgtcgcatc aactgctgac tgctatatat 53280

gtgctggtgc tgaatcgatc gattgtcgtc gcggaagtga agaacaacca cggcactgct 53340

gcctgctggg ctctagccgc catcagtaag tacgctatac tgcctatcta gatctagatc 53400

gagattacat agtggaatta tctgtttata acaaaattac aaggtatcaa ttgataattt 53460

aaggttataa ccgtacaaac ttcagtgatt tgctggtttc acattggtta gatttgtttc 53520

aactaatttg gtacttctgt agccttgtaa tttacgaatc tagtattaat attttcttaa 53580

gtattagcct gttccttgat attatgctgt tgagaaagta tgcaatagat aacaaaaaca 53640

agtaggtgtg ttgaggatgc tcaagagtaa tacagccact tcaataattc tgatattatc 53700

aggacatcat caataattct gcgcctacaa atcttcaaag aaaattttaa tataatgcgt 53760

atgatttttt aaatacgaat attgattgct atttaaagat atttatatta tatggtaatt 53820

attatttgaa ggtttataat aaaggcctcc gtttttagtt tcacgctggg ccttcagaat 53880

ctcaggaccg gccctgctca tgatc                                       53905

<210>29

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>29

atcaggagcc ttcaaattgg gaac     24

<210>30

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>30

ctcgcaaatt gcttaatttt gacc     24

<210>31

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>31

tgaaggagtt atgggtgcgt gacg     24

<210>32

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>32

ttgccgagca cacttgccat gtgc     24

<210>33

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>33

gcgacgcaat ggacatagtg ctcc     24

<210>34

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>34

ttacctgcca agcaatatcc atcg     24

<210>35

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>35

aaggcatact cagtggaggg caag     24

<210>36

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>36

ttaacctgac cgcaagcacc tgtc     24

<210>37

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>37

tggatggact atgtggggtc agtc     24

<210>38

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>38

agtggaagtg gagagagtag ggag     24

<210>39

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>39

ccctccaaca cataaatggt tgag     24

<210>40

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>40

tttctgccag gaaactgtta gatg     24

<210>41

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>41

gcgatcttat acgcatacta tgcg        24

<210>42

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>42

aaagtctttg ttccttcacc aagg        24

<210>43

<211>26

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>43

gaggatt tat caaaacagga tggacg     26

<210>44

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>44

tgggcggcag cagtggagga taga     24

<210>45

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>45

aagaagggag ggttatagaa tctg     24

<210>46

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>46

atatcaggac taacaccact gctc     24

<210>47

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>47

acgagtagta gcgatcttcc agcg     24

<210>48

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>48

cagcgtgaaa ctaaaaacgg aggc      24

<210>49

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>49

atcccacatc atcataatcc gacc      24

<210>50

<211>25

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>50

agcttctccc ttggatacgg tggcg     25

<210>51

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>51

atttgttggt tagttgcggc tgag     24

<210>52

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>52

gcccaaactc aaaaggagag aacc     24

<210>53

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>53

cctcaagtct cccctaaagc cact     24

<210>54

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>54

gctctactgc tgataaaccg tgag     24

<210>55

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>55

tggatggact atgtggggtc agtc     24

<210>56

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>56

agtggaagtg gagagagtag ggag     24

<210>57

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>57

tacgacgcca tttcactcca ttgc       24

<210>58

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>58

catttctcta tgggcgttgc tctg       24

<210>59

<211>26

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>59

acctgtaggt atggcacctt caacac     26

<210>60

<211>26

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>60

ccaaggaacg aagttcaaat gtatgg      26

<210>61

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>61

tgatgtgttt gggcatccct ttcg        24

<210>62

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>62

gagatagggg acgacagaca cgac        24

<210>63

<211>26

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>63

tcctatggct gtttagaaac tgcaca      26

<210>64

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>64

caagttcaaa cataactggc gttg     24

<210>65

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>65

cactgtcctg taagtgtgct gtgc     24

<210>66

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>66

caagcgtgtg ataaaatgtg acgc     24

<210>67

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>67

tgcctactgc cattactatg tgac     24

<210>68

<211>24

<212>DNA

<213>人工序列

<220>

<223>用于扩增的寡核苷酸引物

<400>68

acatactacc gtaaatggtc tctg     24

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号