首页> 中国专利> 用固醇调节元件结合蛋白切割激活蛋白(SCAP)抑制剂治疗脂质水平升高

用固醇调节元件结合蛋白切割激活蛋白(SCAP)抑制剂治疗脂质水平升高

摘要

本公开提供了治疗患有脂质水平升高和/或甘油三酯水平升高的受试者的方法、鉴定具有增加的罹患脂质水平升高和/或甘油三酯水平升高的风险的受试者的方法、检测人固醇调节元件结合蛋白切割激活蛋白(SCAP)变体核酸分子和变体多肽的方法,以及SCAP变体核酸分子和变体多肽。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-02-08

    实质审查的生效 IPC(主分类):C12N15/113 专利申请号:2020800365428 申请日:20200319

    实质审查的生效

说明书

序列表的引用

本申请包括以电子方式提交的序列表,其为命名为18923802202SEQ的文本文件,创建于2020年3月7日,大小为216千字节。所述序列表以引用的方式并入本文。

技术领域

本公开总体上涉及用固醇调节元件结合蛋白切割激活蛋白(SCAP)抑制剂对脂质水平升高和/或甘油三酯水平升高的受试者进行的治疗、鉴定具有增加的罹患脂质水平升高和/或甘油三酯水平升高的风险的受试者的方法、检测SCAP变体核酸分子和变体多肽的方法,以及SCAP变体核酸分子和SCAP变体多肽。

背景技术

脂质水平升高是众所周知的肥胖症并发症。脂质水平升高通常特征在于高胰岛素血症、升高的载脂蛋白B水平、高低密度脂蛋白(LDL)胆固醇浓度和低高密度脂蛋白(HDL)胆固醇浓度。

固醇调节元件结合蛋白(SREBP)是控制动物细胞中脂质合成速率的膜结合转录因子。SREBP的蛋白水解加工受固醇负调节。固醇调节的一个方面是SREBP切割激活蛋白(SCAP),即一种与内质网(ER)中的SREBP形成复合物的多胞膜蛋白。在培养的成纤维细胞中,SCAP使SREBP稳定并将其转运至高尔基体(Golgi apparatus)。一旦固醇水平降低,SCAP与胰岛素诱导的基因(Insig)蛋白解离并将SREBP护送至高尔基体,在高尔基体中它们依次被位点-1和位点-2蛋白酶(S1P和S2P)切割,从而使N端释放出来,N端然后进入到细胞核中以转录脂肪生成基因和低密度脂蛋白受体(LDLR)。缺乏SCAP的突变细胞具有低水平的SREBP前体,可能是因为这些蛋白质在缺乏SCAP时不稳定。由于这些异常,缺乏SCAP的CHO细胞不能合成胆固醇,并且它们的生长需要外部胆固醇来源。当固醇在细胞中增加时,SCAP不再转运SREBP,并且蛋白水解加工被取消。

发明内容

本公开提供了治疗患有总胆固醇升高的受试者的方法,所述方法包括向所述受试者施用SCAP抑制剂。

本公开还提供了治疗患有LDL升高的受试者的方法,所述方法包括向所述受试者施用SCAP抑制剂。

本公开还提供了治疗患有血脂升高的受试者的方法,所述方法包括向所述受试者施用SCAP抑制剂。

本公开还提供了治疗患有甘油三酯升高的受试者的方法,所述方法包括向所述受试者施用SCAP抑制剂。

本公开还提供了用治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂治疗受试者的方法,其中所述受试者患有脂质水平升高和/或甘油三酯水平升高,所述方法包括以下步骤:通过如下方式确定受试者是否具有编码人SCAP多肽的SCAP变体核酸分子:从受试者获得或已经获得生物样品;以及对生物样品进行或已经进行基因分型测定以确定受试者是否具有包含SCAP变体核酸分子的基因型;以及当受试者是SCAP参考时,那么以标准剂量量向受试者施用或继续施用治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂,并且向受试者施用SCAP抑制剂;以及当受试者对于SCAP变体核酸分子是杂合的时,那么以与标准剂量量相同或低于标准剂量量的量向受试者施用或继续施用治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂,并且向受试者施用SCAP抑制剂;其中具有编码人SCAP多肽的SCAP变体核酸分子的基因型的存在指示受试者具有降低的罹患脂质水平升高和/或甘油三酯水平升高的风险;其中脂质水平升高是血脂水平升高、总胆固醇升高或LDL升高;并且其中SCAP变体核酸分子是:i)具有包含位于对应于根据SEQ ID NO:2的第61,695至62,267位的位置处的根据SEQ ID NO:12的核苷酸序列的核苷酸序列的基因组核酸分子,或其互补物,ii)具有包含位于对应于根据SEQ ID NO:4的第4,116至4,417位的位置处的根据SEQ ID NO:14的核苷酸序列的核苷酸序列的mRNA分子,或其互补物,或iii)具有包含位于对应于根据SEQ ID NO:6的第4,116至4,417位的位置处的根据SEQ ID NO:16的核苷酸序列的核苷酸序列的cDNA分子,或其互补物。

本公开还提供了鉴定具有增加的罹患脂质水平升高和/或甘油三酯水平升高的风险的人受试者的方法,其中所述方法包括确定或已经确定从所述受试者获得的生物样品中编码人SCAP多肽的SCAP变体核酸分子的存在或不存在;其中:当所述人受试者是SCAP参考时,那么所述人受试者具有增加的罹患所述脂质水平升高和/或甘油三酯水平升高的风险;并且当所述人受试者对于SCAP变体核酸分子是杂合的或对于SCAP变体核酸分子是纯合的时,那么所述人受试者具有降低的罹患脂质水平升高和/或甘油三酯水平升高的风险;其中所述SCAP变体核酸分子是:i)具有包含位于对应于根据SEQ ID NO:2的第61,695至62,267位的位置处的根据SEQ ID NO:12的核苷酸序列的核苷酸序列的基因组核酸分子,或其互补物,ii)具有包含位于对应于根据SEQ ID NO:4的第4,116至4,417位的位置处的根据SEQ IDNO:14的核苷酸序列的核苷酸序列的mRNA分子,或其互补物,或iii)具有包含位于对应于根据SEQ ID NO:6的第4,116至4,417位的位置处的根据SEQ ID NO:16的核苷酸序列的核苷酸序列的cDNA分子,或其互补物。

本公开还提供了检测人受试者中的人SCAP变体核酸分子的方法,其包括测定从所述人受试者获得的样品以确定所述样品中的核酸分子是否包含这样的核苷酸序列,所述核苷酸序列包含:i)位于对应于根据SEQ ID NO:2的第61,695至62,267位的位置处的根据SEQID NO:12的核苷酸序列,或其互补物;ii)位于对应于根据SEQ ID NO:4的第4,116至4,417位的位置处的根据SEQ ID NO:14的核苷酸序列,或其互补物;或iii)位于对应于根据SEQID NO:6的第4,116至4,417位的位置处的根据SEQ ID NO:16的核苷酸序列,或其互补物。

本公开还提供了分离的改变特异性探针或改变特异性引物,其包含至少约15个核苷酸,其中所述改变特异性探针或改变特异性引物包含与编码人SCAP多肽的核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下的位置:根据SEQ ID NO:2的第61,694至61,695位,或其互补物;根据SEQ ID NO:4的第4,115至4,116位,或其互补物;或根据SEQ ID NO:6的第4,115至4,116位,或其互补物。

本公开还提供了分离的核酸分子,其包含编码人SCAP多肽的核苷酸序列,其中所述多肽包含位于对应于根据SEQ ID NO:8的第1,235至1,335位的位置处的根据SEQ ID NO:10的氨基酸序列。

本公开还提供了分离的核酸分子,其包含编码人SCAP多肽的核苷酸序列,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:2的第61,695至62,267位的位置处的根据SEQ ID NO:12的核苷酸序列,或其互补物。

本公开还提供了分离的mRNA分子,其包含编码人SCAP多肽的核苷酸序列,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:4的第4,116至4,417位的位置处的根据SEQID NO:14的核苷酸序列,或其互补物。

本公开还提供了cDNA分子,其包含编码人SCAP多肽的核苷酸序列,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:6的第4,116至4,417位的位置处的根据SEQ ID NO:16的核苷酸序列,或其互补物。

本公开还提供分离的人SCAP多肽,其具有与SEQ ID NO:8至少约90%同一的氨基酸序列,其中所述多肽包含位于对应于根据SEQ ID NO:8的第1,235至1,335位的位置处的根据SEQ ID NO:10的氨基酸序列。

本公开还提供了用于治疗人受试者的脂质水平升高和/或甘油三酯水平升高的治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂,其具有:具有编码人SCAP多肽的核苷酸序列的基因组核酸分子,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:2的第61,695至62,267位的位置处的根据SEQ ID NO:12的核苷酸序列,或其互补物;具有编码人SCAP多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含位于对应于根据SEQ IDNO:4的第4,116至4,417位的位置处的根据SEQ ID NO:14的核苷酸序列,或其互补物;具有编码人SCAP多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含位于对应于根据SEQID NO:6的第4,116至4,417位的位置处的根据SEQ ID NO:16的核苷酸序列,或其互补物;和/或SCAP多肽,其包含位于对应于根据SEQ ID NO:8的第1,235至1,335位的位置处的根据SEQ ID NO:10的氨基酸序列。

本公开还提供了用于治疗人受试者的脂质水平升高和/或甘油三酯水平升高的SCAP抑制剂,其具有:具有编码人SCAP多肽的核苷酸序列的基因组核酸分子,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:2的第61,695至62,267位的位置处的根据SEQ IDNO:12的核苷酸序列,或其互补物;具有编码人SCAP多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:4的第4,116至4,417位的位置处的根据SEQID NO:14的核苷酸序列,或其互补物;具有编码人SCAP多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:6的第4,116至4,417位的位置处的根据SEQ ID NO:16的核苷酸序列,或其互补物;和/或SCAP多肽,其包含位于对应于根据SEQ IDNO:8的第1,235至1,335位的位置处的根据SEQ ID NO:10的氨基酸序列。

本公开还提供了分子复合物,其包含与以下杂交的改变特异性引物或改变特异性探针:包含编码人SCAP多肽的核苷酸序列的基因组核酸分子,其中所述改变特异性引物或所述改变特异性探针与位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT二核苷酸或其互补物杂交;包含编码人SCAP多肽的核苷酸序列的mRNA分子,其中所述改变特异性引物或所述改变特异性探针与位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的GU二核苷酸或其互补物杂交;包含编码人SCAP多肽的核苷酸序列的cDNA分子,其中所述改变特异性引物或所述改变特异性探针与位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT二核苷酸或其互补物杂交。

附图说明

并入本专利说明书中且构成其一部分的附图示出若干个方面,并连同说明书一起用于解释本公开的原理。

图1显示SCAP变体与天冬氨酸转氨酶降低的关联(图A)、SCAP变体与LDL-C降低的关联(图B),以及SCAP变体与总胆固醇降低的关联(图C)。

具体实施方式

与本公开的各方面相关的各种术语在整个说明书和权利要求书中使用。除非另外指明,否则此类术语将被赋予其在本领域中的普通含义。其他具体定义的术语将以与本文提供的定义一致的方式来解读。

除非另外明确陈述,否则决不意图将本文阐述的任何方法或方面理解为要求按特定顺序执行其步骤。因此,在权利要求书或说明书中,当方法权利要求没有确切地说明步骤是限于特定顺序时,在任何方面决非意图推断顺序。这适用于任何可能的非表达解释基础,包括相对于步骤排列或操作流程的逻辑事项、从语法组织或标点中得到的明显含义或者在说明书中所描述的方面的数字或类型。

除非上下文另外明确指出,否则如本文所用,单数形式“一个(种)(a/an)”和“所述(the)”包括复数对象。

如本文所用,术语“受试者”包括任何动物,包括哺乳动物。哺乳动物包括但不限于农场动物(诸如,例如马、牛、猪)、伴侣动物(诸如,例如狗、猫)、实验室动物(诸如,例如小鼠、大鼠、兔)和非人灵长类动物。在一些实施方案中,受试者为人。

如本文所用,“核酸”、“核酸分子”、“核酸序列”、“多核苷酸”或“寡核苷酸”可以包括任何长度的核苷酸的聚合物形式,可以包括DNA和/或RNA,并且可以是单链的、双链的或多链的。核酸的一条链还指其互补序列。

如本文所用,在特定实施方案中,根据需要,术语“包含”可替换为“由……组成”或“基本上由……组成”。

“分离的”核酸分子是处于不同于其天然环境(诸如除血液和动物组织之外)的条件下的多核苷酸。在优选的形式中,分离的核酸分子基本上不含其他多核苷酸,特别是动物来源的其他多肽。优选以高度纯化的形式(即纯度大于95%,更优选纯度大于99%)提供核酸分子。当在此语境中使用时,术语“分离的”不排除存在呈替代物理形式(诸如二聚体或可替代地磷酸化或衍生化形式)的相同核酸分子。

根据本公开已经观察到,SCAP的特定变化可能与LDL降低、总胆固醇降低、天冬氨酸转氨酶升高和甘油三酯水平降低相关。据认为,SCAP基因或蛋白的人遗传变体与LDL降低、总胆固醇降低、天冬氨酸转氨酶升高和甘油三酯水平降低没有任何已知的关联。

根据本公开已经鉴定了与LDL降低、总胆固醇降低、天冬氨酸转氨酶升高和甘油三酯水平降低分离的SCAP基因中的罕见变体。例如,已经观察到导致对应于人野生型SCAP基因(SEQ ID NO:1)中第61,695至61,698位的四个核苷酸(ACAG)缺失的遗传改变指示具有此种改变的人可能具有降低的LDL、降低的总胆固醇和降低的甘油三酯水平。总之,本文所述的遗传分析表明,SCAP基因(并且特别是SCAP基因的变体)可能与LDL胆固醇降低、总胆固醇和甘油三酯水平降低相关。因此,可以治疗作为具有增加的罹患脂质水平升高和/或甘油三酯水平升高的风险的SCAP参考的人受试者,从而抑制脂质水平升高和/或甘油三酯水平升高,减轻其症状,和/或抑制症状的发展。因此,本公开提供了利用受试者中此类变体的鉴定来对此类受试者罹患脂质水平升高和/或甘油三酯水平升高的风险进行鉴定或分级,使得处于风险中的受试者或患有活动性疾病的受试者可被相应地治疗的方法。另外,本公开提供了分离的SCAP变体基因组核酸分子、变体mRNA分子和变体cDNA分子。因此,本文提供了被发现可能与LDL降低、总胆固醇降低和甘油三酯水平降低相关的SCAP变体核酸分子。

出于本公开的目的,可以将任何特定的人归类为具有以下三种SCAP基因型中的一种:i)SCAP参考;ii)对于SCAP变体(诸如预测功能丧失(loss-of-function)变体)是杂合的,和iii)对于SCAP变体(诸如预测功能丧失变体)是纯合的。SCAP参考类别中的人不具有SCAP变体核酸分子(诸如预测功能丧失变体核酸分子)的拷贝。对于SCAP变体核酸分子(诸如预测功能丧失变体核酸分子)是杂合的人具有SCAP变体核酸分子(诸如预测功能丧失变体核酸分子)的单一拷贝。对于SCAP变体核酸分子(诸如预测功能丧失变体核酸分子)是纯合的人具有SCAP变体核酸分子(诸如预测功能丧失变体核酸分子)的两个拷贝。SCAP预测功能丧失变体核酸分子是编码具有部分功能丧失、完全功能丧失、预测的部分功能丧失或预测的完全功能丧失的SCAP多肽的任何SCAP核酸分子(诸如基因组核酸分子、mRNA分子或cDNA分子)。具有具部分功能丧失(或预测的部分功能丧失)的SCAP多肽的人对于SCAP是亚型的。SCAP变体核酸分子可以是编码SCAP Thr1235fs的任何核酸分子。据信,本文所述的编码SCAP Thr1235fs的SCAP变体核酸分子是SCAP预测功能丧失变体核酸分子。

对于被基因分型或确定为SCAP参考的人受试者,此类人受试者具有增加的罹患脂质水平升高(诸如LDL升高和总胆固醇升高)和/或甘油三酯水平升高的风险。对于被基因分型或确定为SCAP参考或对于SCAP变体核酸分子(诸如预测功能丧失变体)是杂合的人受试者,可以用SCAP抑制剂治疗此类人受试者。

本公开提供了治疗患有血脂水平升高的受试者的方法,所述方法包括向所述受试者施用SCAP抑制剂。

本公开还提供了治疗患有总胆固醇升高的受试者的方法,所述方法包括向所述受试者施用SCAP抑制剂。

本公开还提供了治疗患有LDL升高的受试者的方法,所述方法包括向所述受试者施用SCAP抑制剂。

本公开还提供了治疗患有甘油三酯水平升高的受试者的方法,所述方法包括向所述受试者施用SCAP抑制剂。

在本文所述的实施方案中的任一个中,脂质水平升高是血脂水平升高、总胆固醇升高或LDL升高。在一些实施方案中,脂质水平升高是血脂水平升高。在一些实施方案中,脂质水平升高是总胆固醇升高。在一些实施方案中,脂质水平升高是血清胆固醇升高。在一些实施方案中,脂质水平升高是LDL升高。在一些实施方案中,脂质水平升高是血清胆固醇升高。

在一些实施方案中,SCAP抑制剂包含反义分子。反义分子的实例包括但不限于反义核酸分子、小干扰RNA(siRNA)和短发夹RNA(shRNA)。此类反义分子可以被设计成靶向SCAP mRNA的任何区域。在一些实施方案中,反义RNA、siRNA或shRNA与SCAP基因组核酸分子或mRNA分子内的序列杂交,并且降低受试者的细胞中SCAP多肽的表达。在一些实施方案中,SCAP抑制剂包含与SCAP基因组核酸分子或mRNA分子杂交并降低受试者的细胞中SCAP多肽的表达的反义RNA。在一些实施方案中,SCAP抑制剂包含与SCAP基因组核酸分子或mRNA分子杂交并降低受试者的细胞中SCAP多肽的表达的siRNA。在一些实施方案中,SCAP抑制剂包含与SCAP基因组核酸分子或mRNA分子杂交并降低受试者的细胞中SCAP多肽的表达的shRNA。

在一些实施方案中,SCAP抑制剂包含在一个或多个识别序列处诱导一个或多个切口或双链断裂的核酸酶剂或与SCAP基因组核酸分子内的识别序列结合的DNA结合蛋白。识别序列可以位于SCAP基因的编码区内,或位于影响基因表达的调节区内。DNA结合蛋白或核酸酶剂的识别序列可位于内含子、外显子、启动子、增强子、调节区或任何非蛋白质编码区中。识别序列可以包括或接近SCAP基因的起始密码子。例如,识别序列可位于起始密码子的约10个、20个、30个、40个、50个、100个、200个、300个、400个、500个或1,000个核苷酸处。作为另一个实例,可使用两种或更多种核酸酶剂,每种核酸酶剂均靶向包含或接近起始密码子的核酸酶识别序列。作为另一个实例,可以使用两种核酸酶剂,一种靶向包括或接近起始密码子的核酸酶识别序列,以及一种靶向包括或接近终止密码子的核酸酶识别序列,其中核酸酶剂的切割可以导致两个核酸酶识别序列之间的编码区的缺失。在本文公开的方法和组合物中可以使用诱导切口或双链断裂成所需识别序列的任何核酸酶剂。在本文公开的方法和组合物中可以使用与所需识别序列结合的任何DNA结合蛋白。

用于本文的合适核酸酶剂和DNA结合蛋白包括但不限于锌指蛋白或锌指核酸酶(ZFN)对、转录激活因子样效应物(TALE)蛋白或转录激活因子样效应物核酸酶(TALEN),或成簇的规则散布的短回文重复(CRISPR)/CRISPR相关(Cas)系统。识别序列的长度可变化,并且包括例如对于锌指蛋白或ZFN对为约30-36bp(即,对于每个ZFN为约15-18bp)、对于TALE蛋白或TALEN为约36bp以及对于CRISPR/Cas指导RNA为约20bp的识别序列。

在一些实施方案中,CRISPR/Cas系统可用于修饰细胞内的SCAP基因组核酸分子。本文公开的方法和组合物可以通过利用CRISPR复合物(包含与Cas蛋白复合的指导RNA(gRNA))对SCAP核酸分子进行定点切割来使用CRISPR-Cas系统。

Cas蛋白一般包含至少一个可与gRNA相互作用的RNA识别或结合结构域。Cas蛋白还可以包含核酸酶结构域(诸如,例如DNase或RNase结构域)、DNA结合结构域、解旋酶结构域、蛋白质-蛋白质相互作用结构域、二聚化结构域和其他结构域。合适的Cas蛋白包括例如,野生型Cas9蛋白和野生型Cpf1蛋白(诸如,例如FnCpf1)。Cas蛋白可以具有完全切割活性以在SCAP基因组核酸分子中创建双链断裂,或者它可以是在SCAP基因组核酸分子中创建单链断裂的切口酶。另外的Cas蛋白实例包括但不限于Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5e(CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9(Csn1 orCsx12)、Cas10、Casl0d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(CasA)、Cse2(CasB)、Cse3(CasE)、Cse4(CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cu1966以及其同源物或修饰型式。Cas蛋白也可以作为融合蛋白与异源多肽可操作地连接。例如,Cas蛋白可以融合到切割结构域、表观遗传修饰结构域、转录激活结构域或转录抑制结构域。Cas蛋白可以任何形式提供。例如,Cas蛋白可以蛋白质,诸如与gRNA复合的Cas蛋白的形式提供。可替代地,Cas蛋白可以编码Cas蛋白的核酸分子,诸如RNA或DNA的形式提供。

在一些实施方案中,SCAP基因组核酸分子的靶向基因修饰可以通过使细胞与Cas蛋白和一种或多种gRNA接触来产生,所述一种或多种gRNA与位于SCAP基因组核酸分子中的靶基因组基因座内的一种或多种gRNA识别序列杂交。例如,gRNA识别序列可以位于SEQ IDNO:1的区域内。作为另一个实例,gRNA识别序列还可以包括或接近对应于根据SEQ ID NO:1的第61,695位的位置。例如,gRNA识别序列可以位于对应于根据SEQ ID NO:1的第61,695位的位置的约1000个、500个、400个、300个、200个、100个、50个、45个、40个、35个、30个、25个、20个、15个、10个或5个核苷酸处。作为又一个实例,gRNA识别序列可以包括或接近SCAP基因组核酸分子的起始密码子或SCAP基因组核酸分子的终止密码子。例如,gRNA识别序列可位于起始密码子或终止密码子的约10个、20个、30个、40个、50个、100个、200个、300个、400个、500个或1,000个核苷酸处。

位于SCAP基因组核酸分子中的靶基因组基因座内的gRNA识别序列位于前间区序列邻近基序(PAM)序列附近,所述前间区序列邻近基序(PAM)序列是紧跟在Cas9核酸酶靶向的DNA序列之后的2-6碱基对DNA序列。经典的PAM是序列5'-NGG-3',其中“N”是后跟两个鸟嘌呤(“G”)核碱基的任何核碱基。gRNA可以将Cas9运输到基因组中的任何位置进行基因编辑,但在除了Cas9识别PAM的位点外的任何站点都不能进行编辑。此外,5'-NGA-3'对于人细胞可以是高效的非经典PAM。一般地,PAM在gRNA靶向的DNA序列下游约2-6个核苷酸处。PAM可以侧接gRNA识别序列。在一些实施方案中,gRNA识别序列可以在3'端上由PAM侧接。在一些实施方案中,gRNA识别序列可以在5'端上由PAM侧接。例如,Cas蛋白的切割位点可以在PAM序列上游或下游约1个至约10个、约2个至约5个碱基对,或3个碱基对处。在一些实施方案中(诸如当使用来自酿脓链球菌(S.pyogenes)的Cas9或密切相关的Cas9时),非互补链的PAM序列可以是5'-NGG-3',其中N是任何DNA核苷酸并紧邻靶DNA的非互补链的gRNA识别序列的3'。因而,互补链的PAM序列将是5'-CCN-3',其中N是任何DNA核苷酸并紧邻靶DNA的互补链的gRNA识别序列的5'。

gRNA是与Cas蛋白结合并使Cas蛋白靶向SCAP基因组核酸分子内的特定位置的RNA分子。示例性gRNA是有效指导Cas酶结合或切割SCAP基因组核酸分子的gRNA,其中所述gRNA包含与位于SCAP基因组核酸分子内的gRNA识别序列杂交的DNA靶向区段,所述gRNA识别序列包括或接近对应于根据SEQ ID NO:1的第61,695位的位置。例如,可以选择gRNA以使得其与位于对应于根据SEQ ID NO:1的第61,695位的位置的约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个、300个、400个、500或1,000个核苷酸处的gRNA识别序列杂交。其他示例性gRNA包含与位于SEQ ID NO:1的区域内的SCAP基因组核酸分子内的gRNA识别序列杂交的DNA靶向区段。其他示例性gRNA包含与位于SCAP基因组核酸分子内的gRNA识别序列杂交的DNA靶向区段,所述gRNA识别序列包括或接近起始密码子或终止密码子。例如,可选择gRNA以使其与位于起始密码子的约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个、300个、400个、500个或1,000个核苷酸处或位于起始密码子或终止密码子的约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个、300个、400个、500个或1,000个核苷酸处的gRNA识别序列杂交。gRNA的设计和合成描述于例如Mali等人,Science,2013,339,823-826;Jinek等人,Science,2012,337,816-821;Hwang等人,Nat.Biotechnol.,2013,31,227-229;Jiang等人,Nat.Biotechnol.,2013,31,233-239;和Cong等人,Science,2013,339,819-823中。合适的gRNA可包含约17个至约23个核苷酸、约18个至约22个核苷酸或约19个至约21个核苷酸。在一些实施方案中,gRNA可包含20个核苷酸。

位于人野生型SCAP基因内的合适gRNA识别序列的实例示于SEQ ID NO:17-53中。

SCAP变异附近的指导RNA识别序列

Cas蛋白和gRNA形成复合物,并且Cas蛋白切割靶SCAP基因组核酸分子。Cas蛋白可以在靶SCAP基因组核酸分子中存在的将与gRNA的DNA靶向区段结合的核酸序列之内或之外的位点处切割核酸分子。例如,CRISPR复合物(包含与gRNA识别序列杂交并与Cas蛋白复合的gRNA)的形成可以导致一条或两条链在SCAP基因组核酸分子中存在的将与gRNA的DNA靶向区段结合的核酸序列中或附近(诸如,例如在来自所述核酸序列的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、50个或更多个碱基对内)被切割。

此类方法可产生,例如,其中SEQ ID NO:1的区域被破坏、起始密码子被破坏、终止密码子被破坏或编码序列被删除的SCAP基因组核酸分子。任选地,可以进一步使所述细胞与一种或多种与SCAP基因组核酸分子中的靶基因组基因座内的另外的gRNA识别序列杂交的另外的gRNA接触。通过使细胞与一种或多种另外的gRNA(诸如,例如与第二gRNA识别序列杂交的第二gRNA)接触,Cas蛋白的切割可创建两个或更多个双链断裂或两个或更多个单链断裂。

在一些实施方案中,SCAP抑制剂包含小分子。在一些实施方案中,SCAP抑制剂是法托司他汀A(Fatostatin A)或PF-429242。

在一些实施方案中,所述方法进一步包括检测来自受试者的生物样品中编码人SCAP多肽的SCAP预测功能丧失变体核酸分子的存在或不存在。在一些实施方案中,所述方法进一步包括检测来自受试者的生物样品中SCAP预测功能丧失变体多肽的存在或不存在。如本公开通篇所用,“SCAP预测功能丧失变体核酸分子”是编码具有部分功能丧失、完全功能丧失、预测的部分功能丧失或预测的完全功能丧失的SCAP多肽的任何SCAP核酸分子(诸如,例如基因组核酸分子、mRNA分子或cDNA分子)。例如,SCAP预测功能丧失变体核酸分子可以是编码SCAP Thr1235fs(SEQ ID NO:8)的任何核酸分子。

在一些实施方案中,SCAP预测功能丧失变体核酸分子是:i)具有包含位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶的核苷酸序列的基因组核酸分子;ii)具有包含位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶的核苷酸序列的mRNA分子;或iii)由mRNA分子产生的cDNA分子,其中所述cDNA分子具有包含位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶的核苷酸序列。

在一些实施方案中,当受试者是SCAP参考时,还以标准剂量量向受试者施用治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂。在一些实施方案中,当受试者对于SCAP预测功能丧失变体是杂合的时,还以与标准剂量量相同或低于标准剂量量的剂量量向受试者施用治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂。

本公开还提供了用治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂治疗受试者的方法,其中所述受试者患有脂质水平升高和/或甘油三酯水平升高,所述方法包括以下步骤:通过如下方式确定受试者是否具有编码人SCAP多肽的SCAP预测功能丧失变体核酸分子:从受试者获得或已经获得生物样品;以及对生物样品进行或已经进行基因分型测定以确定受试者是否具有包含SCAP预测功能丧失变体核酸分子的基因型;以及当受试者是SCAP参考时,那么以标准剂量量向受试者施用或继续施用治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂,并且向受试者施用SCAP抑制剂;以及当受试者对于SCAP预测功能丧失变体是杂合的时,那么以与标准剂量量相同或低于标准剂量量的量向受试者施用或继续施用治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂,并且向受试者施用SCAP抑制剂;其中具有编码人SCAP多肽的SCAP预测功能丧失变体核酸分子的基因型的存在指示受试者具有降低的罹患脂质水平升高和/或甘油三酯水平升高的风险。在一些实施方案中,受试者是SCAP参考。在一些实施方案中,受试者对于SCAP预测功能丧失变体是杂合的。

SCAP预测功能丧失变体核酸分子可以是编码具有部分功能丧失、完全功能丧失、预测的部分功能丧失或预测的完全功能丧失的SCAP多肽的任何SCAP核酸分子(诸如,例如基因组核酸分子、mRNA分子或cDNA分子)。例如,SCAP预测功能丧失变体核酸分子可以是编码SCAP Thr1235fs(SEQ ID NO:8)的任何核酸分子。

在一些实施方案中,SCAP预测功能丧失变体核酸分子是:i)具有包含位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶的核苷酸序列的基因组核酸分子;ii)具有包含位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶的核苷酸序列的mRNA分子;和/或iii)由mRNA分子产生的cDNA分子,其中所述cDNA分子具有包含位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶的核苷酸序列。在一些实施方案中,受试者是SCAP参考。在一些实施方案中,受试者对于SCAP预测功能丧失变体是杂合的。

检测来自受试者的生物样品中SCAP预测功能丧失变体核酸分子(诸如,例如编码SCAP Thr1235fs的核酸分子)的存在或不存在以及/或者确定受试者是否具有SCAP预测功能丧失变体核酸分子(诸如,例如编码SCAP Thr1235fs的核酸分子)可以通过本文所述的方法中的任一种进行。在一些实施方案中,这些方法可以在体外进行。在一些实施方案中,这些方法可以原位进行。在一些实施方案中,这些方法可以在体内进行。

在一些实施方案中,所述检测步骤(detection step/detecting step)或基因分型测定包括对生物样品中的SCAP基因组核酸分子、SCAP mRNA分子或SCAP cDNA分子的核苷酸序列的至少一部分进行测序,其中被测序的部分包含导致功能丧失(部分或完全)或预测会导致功能丧失(部分或完全)的一个或多个变异。例如,在一些实施方案中,检测步骤或基因分型测定包括对以下的至少一部分进行测序:i)编码SCAP多肽的基因组核酸分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:2的第61,695位的位置或其互补物;ii)编码SCAP多肽的mRNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ IDNO:4的第4,116位的位置或其互补物;或iii)编码SCAP多肽的cDNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:6的第4,116位的位置或其互补物。当生物样品中的SCAP基因组核酸分子的被序部分包含:位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶;位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶;或位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶,那么生物样品中的SCAP cDNA分子是SCAP预测功能丧失变体cDNA分子。

在一些实施方案中,所述检测步骤或基因分型测定包括:a)使生物样品同与以下杂交的引物接触:i)SCAP基因组核酸分子的核苷酸序列的一部分,其接近对应于根据SEQID NO:2的第61,695位的位置;ii)SCAP mRNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:4的第4,116位的位置;和/或iii)SCAP cDNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:6的第4,116位的位置;b)使引物延伸至少通过:i)对应于根据SEQ ID NO:2的第61,695位的SCAP基因组核酸分子的核苷酸序列的位置;ii)对应于根据SEQ ID NO:4的第4,116位的SCAP mRNA分子的核苷酸序列的位置;和/或iii)对应于根据SEQ ID NO:6的第4,116位的SCAP cDNA分子的核苷酸序列的位置;以及c)确定引物的延伸产物是否包含:i)位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶;ii)位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶;和/或iii)位于对应于根据SEQID NO:6的第4,116位的位置处的胸腺嘧啶。在一些实施方案中,所述确定步骤包括对整个核酸分子进行测序。

在一些实施方案中,所述检测步骤或基因分型测定包括:a)扩增编码人SCAP多肽的核酸分子的至少一部分,其中所述部分包含:i)位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶,或其互补物;ii)位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶,或其互补物;和/或iii)位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶,或其互补物;b)用可检测标记对扩增的核酸分子进行标记;c)使标记的核酸分子与包含改变特异性探针的支持物接触,其中所述改变特异性探针包含在严格条件下与以下杂交的核苷酸序列:i)包含位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列,或其互补物;ii)包含位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列,或其互补物;和/或iii)包含位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列,或其互补物;以及d)对可检测标记进行检测。在一些实施方案中,所述核酸分子是mRNA,并且所述确定步骤进一步包括在扩增步骤之前将mRNA逆转录成cDNA。

在一些实施方案中,所述检测步骤或基因分型测定包括:使生物样品中的核酸分子与包含可检测标记的改变特异性探针接触,其中所述改变特异性探针包含在严格条件下与以下杂交的核苷酸序列:i)包含位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列,或其互补物;ii)包含位于对应于根据SEQ IDNO:4的第4,116位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列,或其互补物;或iii)包含位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列,或其互补物;以及对可检测标记进行检测。

在一些实施方案中,SCAP预测功能丧失变体核酸分子是:i)具有缺少位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸的核苷酸序列的基因组核酸分子;ii)具有缺少位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的核苷酸的核苷酸序列的mRNA分子;和/或iii)由mRNA分子产生的cDNA分子,其中所述cDNA分子具有缺少位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的核苷酸的核苷酸序列。

在一些实施例中,所述确定步骤或检测步骤包括:a)使样品同与以下杂交的引物或改变特异性引物接触:i)SCAP基因组核酸分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:1的第61,695至61,698位或根据SEQ ID NO:2的第61,694至61,695位的位置;ii)SCAP mRNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:3的第4,116至4,119位的位置或对应于根据SEQ ID NO:4的第4,115至4,116位的位置;或iii)SCAP cDNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:5的第4,116至4,119位的位置或对应于根据SEQ ID NO:6的第4,115至4,116位的位置;b)使引物或改变特异性引物延伸至少通过:i)对应于根据SEQ ID NO:1的第61,695至61,698位或根据SEQ ID No:2的第61,694至61,695位的位置;ii)对应于根据SEQ ID NO:3的第4,116至4,119位的位置或对应于根据SEQ ID NO:4的第4,115至4,116位的位置;或iii)对应于根据SEQ ID NO:5的第4,116至4,119位的位置或对应于根据SEQ ID NO:6的第4,115至4,116位的位置;以及c)确定引物或改变特异性引物的延伸产物是否缺少:i)位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸;ii)位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的核苷酸;或iii)位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的核苷酸。

在一些实施方案中,所述确定步骤或检测步骤包括:a)扩增编码人SCAP多肽的核酸分子的至少一部分,其中所述部分包含:i)在根据SEQ ID NO:1的第61,695至61,698位处的核苷酸,或在根据SEQ ID NO:2的第61,694至61,695位处的核苷酸,或其互补物;ii)在根据SEQ ID NO:3的第4,116至4,119位处的核苷酸,或根据SEQ ID NO:4的第4,115至4,116位处的核苷酸,或其互补物;和/或iii)在根据SEQ ID NO:5的第4,116至4,119位处的核苷酸,或根据SEQ ID NO:6的第4,115至4,116位处的核苷酸,或其互补物;b)用可检测标记标记扩增的核酸分子;c)使标记的核酸分子与包含探针或改变特异性探针的支持物接触,其中所述探针或改变特异性探针包含这样的核苷酸序列,其在严格条件下:i)只与包含在根据SEQID NO:1的第61,695至61,698位处的核苷酸的扩增的核酸分子的核苷酸序列杂交,或只与包含在根据SEQ ID NO:2的第61,694至61,695位处的核苷酸的扩增的核酸分子的核苷酸序列,或其互补物杂交;ii)只与包含在根据SEQ ID NO:3的第4,116至4,119位处的核苷酸的扩增的核酸分子的核苷酸序列杂交,或只与包含在根据SEQ ID NO:4的第4,115至4,116位处的核苷酸的扩增的核酸分子的核苷酸序列,或其互补物杂交;或iii)只与包含在根据SEQID NO:5的第4,116至4,119位处的核苷酸的扩增的核酸分子的核苷酸序列杂交,或只与包含在根据SEQ ID NO:6的第4,115至4,116位处的核苷酸的扩增的核酸分子的核苷酸序列,或其互补物杂交;以及d)检测可检测标记。在一些实施方案中,核酸分子是mRNA,并且所述确定步骤进一步包括在扩增步骤之前将mRNA逆转录成cDNA。

在一些实施方案中,所述确定步骤或检测步骤包括:使SCAP核酸分子与包含可检测标记的探针接触,其中所述探针包含在严格条件下与以下杂交的核苷酸序列:i)缺少位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸的扩增的核酸分子的核苷酸序列,或其互补物;ii)缺少位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的核苷酸的扩增的核酸分子的核苷酸序列;或iii)缺少位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的核苷酸的扩增的核酸分子的核苷酸序列,或其互补物;以及检测可检测标记。

在一些实施方案中,所述测定包括:对样品中的SCAP基因组核酸分子的核苷酸序列的一部分进行测序,其中被测序的部分包含对应于根据SEQ ID NO:1的第61,695至61,698位或根据SEQ ID NO:2的第61,694至61,695位的位置;对应于根据SEQ ID NO:3的第4,116至4,119位的位置或对应于根据SEQ ID NO:4的第4,115至4,116位的位置;或对应于根据SEQ ID NO:5的第4,116至4,119位的位置或对应于根据SEQ ID NO:6的第4,115至4,116位的位置。

在一些实施方案中,所述测定包括:a)使样品同与以下杂交的引物或改变特异性引物接触:i)SCAP基因组序列的一部分,其在对应于根据SEQ ID NO:1的第61,695至61,698位或根据SEQ ID NO:2的第61,694至61,695位的SCAP基因组序列的位置的50个核苷酸内;ii)SCAP mRNA序列的一部分,其在对应于根据SEQ ID NO:3的第4,116至4,119位的SCAPmRNA的位置或对应于根据SEQ ID NO:4的第4,115至4,116位的位置的50个核苷酸内;或iii)SCAP cDNA序列的一部分,其在对应于根据SEQ ID NO:5的第4,116至4,119位的SCAPcDNA的位置或对应于根据SEQ ID NO:6的第4,115至4,116位的位置的50个核苷酸内;b)使引物或改变特异性引物延伸至少通过:i)对应于根据SEQ ID NO:1的第61,695至61,698位或根据SEQ ID NO:2的第61,694至61,695位的SCAP基因组序列的位置;ii)对应于根据SEQID NO:3的第4,116至4,119位的SCAP mRNA的位置,或对应于根据SEQ ID NO:4的第4,115至4,116位的位置;或iii)对应于根据SEQ ID NO:5的第4,116至4,119位的SCAP cDNA的位置,或对应于根据SEQ ID NO:6的第4,115至4,116位的位置;以及c)确定引物的延伸产物是否包含在以下位置处的ACAG序列:i)对应于根据SEQ ID NO:1的第61,695至61,698位的位置;ii)对应于根据SEQ ID NO:3的第4,116至4,119位的位置;iii)对应于根据SEQ ID NO:5的第4,116至4,119位的位置,或者确定改变特异性引物的延伸产物是否包含:i)位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT序列;ii)位于对应于根据SEQ IDNO:4的第4,115至4,116位的位置处的GU序列;或iii)位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT序列。

在这些实施方案中的任一个中,核酸分子可以存在于从人受试者获得的细胞内。

本公开还提供了用治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂治疗受试者的方法,其中所述受试者患有脂质水平升高和/或甘油三酯水平升高,所述方法包括以下步骤:确定受试者是否具有缺少位于对应于根据SEQ ID NO:7的第1,235至1,279位的位置处的根据SEQ ID NO:9的氨基酸序列的变体SCAP多肽;其通过如下方式来确定:从受试者获得或已经获得生物样品;以及对生物样品进行或已经进行测定以确定受试者是否具有变体SCAP多肽;以及当受试者不具有变体SCAP多肽时,那么以标准剂量量向受试者施用或继续施用治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂,并且向受试者施用SCAP抑制剂;以及当受试者具有变体SCAP多肽时,那么以与标准剂量量相同或低于标准剂量量的量向受试者施用或继续施用治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂,并且向受试者施用SCAP抑制剂;其中变体SCAP多肽的存在指示受试者具有降低的罹患脂质水平升高和/或甘油三酯水平升高的风险。

在本文所述的实施方案中的任一个中,脂质水平升高是血脂水平升高、总胆固醇升高或LDL升高。在一些实施方案中,脂质水平升高是血脂水平升高。在一些实施方案中,脂质水平升高是总胆固醇升高。在一些实施方案中,脂质水平升高是血清胆固醇升高。在一些实施方案中,脂质水平升高是LDL升高。在一些实施方案中,脂质水平升高是血清胆固醇升高。

在一些实施方案中,脂质水平升高包括高脂血症,诸如高胆固醇血症(胆固醇升高)。脂质水平升高还包括高脂蛋白血症,其是指存在升高的脂蛋白(通常为LDL)。在一些实施方案中,人受试者可能患有组合的高脂血症,其是胆固醇和甘油三酯两者的升高;或者可能患有混合的高脂血症,其是甘油三酯和LDL的升高。在一些实施方案中,人受试者可能患有高甘油三酯血症,其中甘油三酯水平相对于通常具有相同种族背景、年龄和性别的相应参考受试者中的甘油三酯的正常平均水平升高。通常,甘油三酯测试是测量血液中甘油三酯总量的血液测试。

对于被基因分型或确定为SCAP参考或对于SCAP预测功能丧失变体是杂合的人受试者,可以用如本文所述的SCAP抑制剂治疗此类人受试者。

治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂的实例包括但不限于:螺环氮杂环丁酮衍生物、斯达汀(statin)、PPAR激动剂、烟酸(nicotinic acid)、尼克酸(niacin)、依泽替米贝(ezetimibe)、PCSK9抑制剂、RXR激动剂、激素、基于磺酰脲的药物、双胍、α-葡萄糖苷酶抑制剂、GLP-1激动剂和PPARα/δ双重激动剂,或它们的任意组合。

螺环氮杂环丁酮衍生物包括但不限于在例如美国RE 37,721;美国专利号5,631,356;5,767,115;5,846,966;5,698,548;5,633,246;5,656,624;5,624,920;5,688,787;和5,756,470;美国公开No.2002/0137689;和PCT公开号WO02/066464、WO 95/08522和WO96/19450中公开的那些。

斯达汀包括但不限于阿托伐他汀(atorvastatin)、氟伐他汀(fluvastatin)、洛伐他汀(lovastatin)、匹伐他汀(pitavastatin)、普伐他汀(pravastatin)、瑞舒伐他汀(rosuvastatin)、西立伐他汀(cerivastatin)和辛伐他汀(simvastatin)。

PPAR激动剂包括但不限于噻唑烷二酮或贝特(fibrate)。噻唑烷二酮包括但不限于5-((4-(2-(甲基-2-吡啶基氨基)乙氧基)苯基)甲基)-2,4-噻唑烷二酮、曲格列酮(troglitazone)、吡格列酮(pioglitazone)、环格列酮(ciglitazone)、WAY-120,744、恩格列酮(englitazone)、AD 5075、达格列酮(darglitazone)和罗格列酮(rosiglitazone)。贝特类包括但不限于吉非贝齐(gemfibrozil)、非诺贝特(fenofibrate)、氯贝丁酯(clofibrate)和环丙贝特(ciprofibrate)。PPARα/δ双重激动剂包括但不限于埃拉菲诺(Elafibranor)。

RXR激动剂包括但不限于LG 100268、LGD 1069、9-顺式视黄酸、2-(1-(3,5,5,8,8-五甲基-5,6,7,8-四氢-2-萘基)-环丙基)-吡啶-5-羧酸和4-((3,5,5,8,8-五甲基-5,6,7,8-四氢-2-萘基)2-羰基)-苯甲酸。

激素包括但不限于甲状腺激素、雌激素和胰岛素。合适的胰岛素包括但不限于可注射胰岛素、经皮胰岛素和吸入胰岛素或其任何组合。作为胰岛素的替代物,可以使用胰岛素衍生物、促分泌素、敏化剂或模拟物。胰岛素促分泌素包括但不限于毛喉素(forskolin)、二丁酰cAMP和异丁基甲基黄嘌呤(IBMX)。

基于磺酰脲的药物包括但不限于格列派特(glisoxepid)、格列本脲(glyburide)、醋磺己脲(acetohexamide)、氯磺丙脲(chlorpropamide)、格列波脲(glibornuride)、甲苯磺丁脲(tolbutamide)、妥拉磺脲(tolazamide)、格列吡嗪(glipizide)、格列齐特(gliclazide)、格列喹酮(gliquidone)、格列己脲(glyhexamide)、苯磺丁脲(phenbutamide)和甲磺环己脲(tolcyclamide)。

双胍包括但不限于二甲双胍(metformin)、苯乙双胍(phenformin)和丁福明(buformin)。

α-葡萄糖苷酶抑制剂包括但不限于阿卡波糖(acarbose)和米格列醇(miglitol)。

GLP-1激动剂包括但不限于

治疗或抑制甘油三酯水平升高的治疗剂的另外的实例包括但不限于:纤维酸衍生物,例如吉非贝齐(gemfibrozil)

对于被基因分型或确定为SCAP参考或对于SCAP预测功能丧失变体是杂合的人受试者,也可以用本文所述的任何一种或多种SCAP预测功能丧失多肽治疗来此类人受试者。

在一些实施方案中,与作为SCAP参考的受试者(其可接受标准剂量量)相比,对于SCAP预测功能丧失变体是杂合的受试者,治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂的剂量可以减少约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%或约90%(即,低于标准剂量量)。在一些实施方案中,治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂的剂量可以减少约10%、约20%、约30%、约40%或约50%。此外,与作为SCAP参考的受试者相比,在对于SCAP预测功能丧失变体是杂合的受试者中,治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂的剂量可以更低频率施用。

治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂和/或SCAP抑制剂的施用可以例如在一天、两天、三天、五天、一周、两周、三周、一个月、五周、六周、七周、八周、两个月或三个月之后重复。重复施用可以是相同剂量或不同剂量。施用可以重复一次、两次、三次、四次、五次、六次、七次、八次、九次、十次或更多次。例如,根据某些剂量方案,受试者可接受较长时间段,诸如,例如6个月、1年或更长时间的疗法。

治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂和/或SCAP抑制剂的施用可以通过任何合适的途径进行,所述途径包括但不限于肠胃外、静脉内、口服、皮下、动脉内、颅内、鞘内、腹膜内、局部、鼻内或肌内。用于施用的药物组合物理想地是无菌的且基本上等渗的,并且是在GMP条件下制造的。药物组合物可以单位剂型(即,单次施用的剂量)提供。药物组合物可以使用一种或多种生理上且药学上可接受的载剂、稀释剂、赋形剂或辅助剂来配制。制剂取决于所选的施用途径。术语“药学上可接受的”意指载剂、稀释剂、赋形剂或辅助剂与制剂的其他成分相容,并且对其接受者基本上无害。

如本文所用,术语“治疗(treat)”、“治疗(treating)”和“治疗(treatment)”以及“预防(prevent)”、“预防(preventing)”和“预防(prevention)”分别是指引发期望的生物反应,诸如治疗性和预防性作用。在一些实施方案中,治疗作用包括以下中的一种或多种:在所述剂或包含所述剂的组合物被施用后,脂质水平升高/或甘油三酯水平升高减少/降低,脂质水平升高/或甘油三酯水平升高严重程度减少/降低(诸如,例如脂质水平升高/或甘油三酯水平升高降低或脂质水平升高/或甘油三酯水平升高的形成受到抑制),症状和脂质水平升高/或甘油三酯水平升高相关影响的增加减少/降低,延迟症状和脂质水平升高/或甘油三酯水平升高相关影响的发作,降低脂质水平升高/或甘油三酯水平升高相关影响的症状的严重程度,降低急性发作的严重程度,降低症状和脂质水平升高/或甘油三酯水平升高相关影响的数量,降低症状和脂质水平升高/或甘油三酯水平升高相关影响的潜伏期,改善症状和脂质水平升高/或甘油三酯水平升高相关影响,降低继发症状,降低继发感染,预防脂质水平升高/或甘油三酯水平升高复发,减少复发发作的次数或频率,增加症状性发作之间的潜伏期,增加达到持续进展的时间,加快缓解、诱导缓解、增强缓解、加速恢复,或增加替代治疗剂的功效或减少对替代治疗的抗性,和/或增加受影响宿主动物的存活时间。预防性作用可包括,在治疗方案被施用后完全或部分避免/抑制或延迟了脂质水平升高/或甘油三酯水平升高的发展/进展(诸如,例如完全或部分的避免/抑制或延迟),以及使受影响宿主动物的存活时间增加。对脂质水平升高/或甘油三酯水平升高的治疗涵盖对已被诊断为处于任何临床阶段或表现的任何形式的脂质水平升高/或甘油三酯水平升高的受试者的治疗,对脂质水平升高/或甘油三酯水平升高的症状或体征的发作或演变或加重或恶化的延迟,和/或预防和/或降低脂质水平升高/或甘油三酯水平升高的严重程度。

在一些实施方案中,所述方法进一步包括检测来自受试者的生物样品中SCAP多肽的存在或不存在,其中所述SCAP多肽包含位于对应于根据SEQ ID NO:8的第1,235至1,335位的位置处的氨基酸的氨基酸序列,其中:当人受试者不具有SCAP多肽时,那么人受试者具有增加的罹患脂质水平升高和/或甘油三酯水平升高的风险;并且当人受试者具有SCAP多肽时,那么人受试者具有降低的罹患脂质水平升高和/或甘油三酯水平升高的风险。

在一些实施方案中,所述检测步骤包括对包含含有位于对应于根据SEQ ID NO:8的第1,235至1,335位的位置处的氨基酸的氨基酸序列的SCAP多肽的至少一部分进行测序。在一些实施方案中,所述检测步骤包括对整个多肽进行测序。在一些实施方案中,所述检测步骤包括用于检测包含含有位于对应于根据SEQ ID NO:8的第1,235至1,335位的位置处的氨基酸的氨基酸序列的多肽的存在的免疫测定。

本公开还提供了鉴定具有增加的罹患脂质水平升高和/或甘油三酯水平升高的风险的人受试者的方法,其中所述方法包括用于检测本文所述的任何SCAP预测功能丧失变体核酸分子(诸如,例如基因组核酸分子、mRNA分子和/或cDNA分子)的存在或不存在的本文所述的方法中的任一种。当人受试者缺乏SCAP预测功能丧失变体核酸分子(即,人受试者在基因型上被归类为SCAP参考)时,那么人受试者具有增加的罹患脂质水平升高和/或甘油三酯水平升高的风险。当人受试者具有SCAP预测功能丧失变体核酸分子(即,人受试者被归类为对于SCAP预测功能丧失变体是杂合的或对于SCAP预测功能丧失变体是纯合的)时,那么人受试者具有降低的罹患脂质水平升高和/或甘油三酯水平升高的风险。与不具有SCAP预测功能丧失变体核酸分子的拷贝相比,具有SCAP预测功能丧失变体核酸分子的单一拷贝更能保护人受试者免于罹患脂质水平升高和/或甘油三酯水平升高。

无意受限于任何特定的理论或作用机制,据信SCAP预测功能丧失变体核酸分子的单一拷贝(即,对于SCAP预测功能丧失变体是杂合的)能保护人受试者免于罹患脂质水平升高和/或甘油三酯水平升高,并且还据信具有SCAP预测功能丧失变体核酸分子的两个拷贝(即,对于SCAP预测功能丧失变体是纯合的)相对于具有单一拷贝的人受试者,可能更能保护人受试者免于罹患脂质水平升高和/或甘油三酯水平升高。因此,在一些实施方案中,SCAP预测功能丧失变体核酸分子的单一拷贝可能不能完全保护人受试者免于罹患脂质水平升高和/或甘油三酯水平升高,而是可能部分或不完全地保护人受试者免于罹患脂质水平升高和/或甘油三酯水平升高。虽然不希望受任何特定理论的约束,但可能存在与罹患脂质水平升高和/或甘油三酯水平升高相关的另外的因素或分子,这些因素或分子在具有SCAP预测功能丧失变体核酸分子的单一拷贝的人受试者中仍然存在,从而导致不能完全防止脂质水平升高和/或甘油三酯水平升高的罹患。

本公开还提供了鉴定具有增加的罹患脂质水平升高和/或甘油三酯水平升高的风险的人受试者的方法,其中所述方法包括:检测来自受试者的生物样品中SCAP预测功能丧失多肽的存在或不存在,其中所述SCAP预测功能丧失多肽包含含有位于对应于根据SEQ IDNO:8的第1,235至1,335位的位置处的氨基酸的氨基酸序列;其中:当人受试者不具有SCAP预测功能丧失多肽时,那么人受试者具有增加的罹患脂质水平升高和/或甘油三酯水平升高的风险;并且当人受试者具有SCAP预测功能丧失多肽时,那么人受试者具有降低的罹患脂质水平升高和/或甘油三酯水平升高的风险。

在一些实施方案中,所述确定步骤包括对包含含有位于对应于根据SEQ ID NO:8的第1,235至1,335位的位置处的氨基酸的氨基酸序列的SCAP多肽的至少一部分进行测序。在一些实施方案中,所述确定步骤包括对整个多肽进行测序。在一些实施方案中,所述确定步骤包括免疫测定。

在一些实施方案中,对人受试者进一步用治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂和/或如本文所述的SCAP抑制剂进行治疗。例如,当人受试者是SCAP参考并因此具有增加的罹患脂质水平升高和/或甘油三酯水平升高的风险时,向人受试者施用SCAP抑制剂。在一些实施方案中,还向这样的受试者施用治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂。在一些实施方案中,当受试者对于SCAP预测功能丧失变体是杂合的时,以与标准剂量量相同或低于标准剂量量的剂量量向受试者施用治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂,并且还向所述受试者施用SCAP抑制剂。在一些实施方案中,受试者是SCAP参考。在一些实施方案中,受试者对于SCAP预测功能丧失变体是杂合的。

本公开还提供了检测来自人受试者的生物样品中SCAP预测功能丧失变体基因组核酸分子、SCAP预测功能丧失变体mRNA分子和/或SCAP预测功能丧失变体cDNA分子的存在的方法。应理解,群体内的基因序列和由此类基因编码的mRNA分子可以因多态性(诸如单核苷酸多态性)而变化。本文提供的SCAP变体基因组核酸分子、SCAP变体mRNA分子和SCAP变体cDNA分子的序列仅是示例性序列。SCAP变体基因组核酸分子、变体mRNA分子和变体cDNA分子的其他序列也是可能的。

所述生物样品可以来源于受试者的任何细胞、组织或生物流体。所述样品可以包括任何临床上相关的组织诸如骨髓样品、肿瘤活检物、细针抽吸物,或体液的样品(诸如血液、龈沟液、血浆、血清、淋巴、腹水液、囊液或尿液)。在一些情况下,所述样品包括口腔拭子。本文公开的方法中使用的样品将根据测定形式、检测方法的性质以及用作样品的组织、细胞或提取物而变化。生物样品可以根据所采用的测定进行不同处理。例如,当检测任何SCAP变体核酸分子时,可以采用被设计为针对基因组DNA来分离或富集样品的初步处理。各种已知的技术可用于此目的。当检测任何SCAP变体mRNA的水平时,不同的技术可以用于使生物样品富集mRNA。可以使用检测mRNA的存在或水平或者特定变体基因组DNA基因座的存在的各种方法。

在一些实施方案中,检测人受试者中的人SCAP预测功能丧失变体核酸分子的方法包括测定从受试者获得的样品以确定样品中的核酸分子是否包含这样的核苷酸序列,所述核苷酸序列包含:i)位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶,或其互补物,ii)位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶,或其互补物,或iii)位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶,或其互补物。在一些实施方案中,所述方法是体外方法。

在一些实施方案中,检测受试者中SCAP预测功能丧失变体核酸分子(诸如,例如基因组核酸分子、mRNA分子和/或cDNA分子)的存在或不存在的方法包括:对从受试者获得的生物样品进行测定,所述测定确定所述生物样品中的核酸分子是否包含这样的核苷酸序列,所述核苷酸序列编码:位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶,或其互补物,ii)位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶,或其互补物,或iii)位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶,或其互补物。在一些实施方案中,生物样品包括细胞或细胞裂解物。此类方法可以进一步包括,例如,从受试者获得包含SCAP基因组核酸分子或mRNA分子的生物样品,并且如果是mRNA,则任选地将mRNA逆转录成cDNA;以及对生物样品进行测定,所述测定确定了SCAP基因组核酸分子、mRNA或cDNA中的位置编码以下:位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶,或其互补物,ii)位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶,或其互补物,或iii)位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶,或其互补物。此类测定可以包括例如确定特定SCAP核酸分子的这些位置的身份。在一些实施方案中,受试者为人。在一些实施方案中,所述方法是体外方法。

在一些实施方案中,所述测定包括对生物样品中的SCAP基因组核酸分子、SCAPmRNA分子或SCAP cDNA分子的核苷酸序列的至少一部分进行测序,其中被测序的部分包含一种或多种导致功能丧失(部分或完全)的变异。例如,在一些实施方案中,所述测定包括对以下的至少一部分进行测序:i)生物样品中的SCAP基因组核酸分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:2的第61,695位的位置,或其互补物;ii)生物样品中的SCAP mRNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:4的第4,116位的位置,或其互补物;或iii)生物样品中的SCAP cDNA分子的核苷酸序列,其中被测序的部分包含对应于根据SEQ ID NO:6的第4,116位的位置,或其互补物。当生物样品中的SCAP基因组核酸分子的被测序部分包含:位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶;位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶;或位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶时,那么生物样品中的SCAP cDNA分子是SCAP预测功能丧失变体cDNA分子。

在一些实施方案中,所述测定包括:a)使所述样品同与以下杂交的引物接触:i)SCAP基因组核酸分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:2的第61,695位的位置;ii)SCAP mRNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:4的第4,116位的位置;或iii)SCAP cDNA分子的核苷酸序列的一部分,其接近对应于根据SEQ IDNO:6的第4,116位的位置;b)使引物延伸至少通过:i)对应于根据SEQ ID NO:2的第61,695位的SCAP基因组核酸分子的核苷酸序列的位置;ii)对应于根据SEQ ID NO:4的第4,116位的SCAP mRNA分子的核苷酸序列的位置;或iii)对应于根据SEQ ID NO:6的第4,116位的SCAP cDNA分子的核苷酸序列的位置;以及c)确定引物的延伸产物是否包含:i)位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶;ii)位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶;或iii)位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶。在一些实施方案中,所述测定包括对整个核酸分子进行测序。在一些实施方案中,仅分析SCAP基因组核酸分子。在一些实施方案中,仅分析SCAP mRNA。在一些实施方案中,仅分析从SCAP mRNA获得的SCAP cDNA。

在一些实施方案中,所述测定包括:a)扩增编码人SCAP多肽的核酸分子的至少一部分,其中所述部分包含:i)位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶,或其互补物;ii)位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶,或其互补物;或iii)位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶,或其互补物;b)用可检测标记标记扩增的核酸分子;c)使标记的核酸分子与包含改变特异性探针的支持物接触,其中所述改变特异性探针包含在严格条件下与以下杂交的核苷酸序列:i)包含位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶的扩增的核酸分子的核酸序列,或其互补物;ii)包含位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶的扩增的核酸分子的核酸序列,或其互补物;或iii)包含位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶的扩增的核酸分子的核酸序列,或其互补物;以及d)检测可检测标记。在一些实施方案中,核酸分子是mRNA,并且所述确定步骤进一步包括在扩增步骤之前将mRNA逆转录成cDNA。

在一些实施方案中,所述测定包括:使核酸分子与包含可检测标记的改变特异性探针接触,其中所述改变特异性探针包含在严格条件下与以下杂交的核苷酸序列:i)包含位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列,或其互补物;ii)包含位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶的扩增的核酸分子的核苷酸序列,或其互补物;或iii)包含位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶的扩增的核酸分子的核苷酸序列,或其互补物;以及检测可检测标记。改变特异性聚合酶链反应技术可以用于检测核酸序列中的突变,诸如SNP。因为当与模板存在失配时,DNA聚合酶将不延伸,所以可以使用改变特异性引物。

在一些实施方案中,样品中的核酸分子是mRNA并且在扩增步骤之前将mRNA逆转录成cDNA。在一些实施方案中,核酸分子存在于从人受试者获得的细胞内。

SCAP预测功能丧失变体核酸分子可以是编码具有部分功能丧失、完全功能丧失、预测的部分功能丧失或预测的完全功能丧失的SCAP多肽的任何SCAP核酸分子(诸如,例如基因组核酸分子、mRNA分子或cDNA分子)。例如,SCAP预测功能丧失变体核酸分子可以是编码SCAP Thr1235fs(SEQ ID NO:8)的任何核酸分子。

在一些实施方案中,所述测定包括使生物样品与引物或探针(诸如改变特异性引物或改变特异性探针)接触,所述引物或探针在严格条件下与SCAP变体基因组序列、变体mRNA序列或变体cDNA序列而不与对应的野生型SCAP参考序列特异性杂交;以及确定杂交是否已经发生。

在一些实施方案中,所述测定包括RNA测序(RNA-Seq)。在一些实施方案中,所述测定还包括,诸如通过逆转录酶聚合酶链反应(RT-PCR),将mRNA逆转录成cDNA。

在一些实施方案中,所述方法利用具有足够核苷酸长度的探针和引物来结合到靶核酸序列并特异性地检测和/或鉴定包含SCAP变体基因组核酸分子、变体mRNA分子或变体cDNA分子的多核苷酸。杂交条件或反应条件可以由操作员决定以实现此结果。此核苷酸长度可以是足以用于所选择的检测方法(包括本文描述或例示的任何测定)的任何长度。此类探针和引物可以在高严格杂交条件下与靶核苷酸序列特异性地杂交。探针和引物可以具有与靶核苷酸序列内连续核苷酸的完全核苷酸序列同一性,但可以通过常规方法设计不同于靶核苷酸序列并保留特异性地检测和/或鉴定靶核苷酸序列的能力的探针。因此,探针和引物可以与靶核酸分子的核苷酸序列共享约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或100%序列同一性或互补性。

在一些实施方案中,为了确定生物样品中的SCAP核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补物是否包含编码以下的核苷酸序列:位于对应于根据SEQ IDNO:2的第61,695位的位置处的胸腺嘧啶、位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶,或位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶,可使用引物对来对生物样品执行扩增方法(所述引物对包括衍生自与以下相邻的5'侧翼序列的第一引物:位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶、位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶,或位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶;以及衍生自与以下相邻的3'侧翼序列的第二引物:位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶、位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶,或位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶),以产生指示以下的存在的扩增子:位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶、位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶,或位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶。在一些实施方案中,扩增子的长度范围可从引物对加上一个核苷酸碱基对的组合长度至任何可通过DNA扩增方案产生的扩增子的长度。此距离的范围可以是一个核苷酸碱基对至扩增反应的极限值或约两万个核苷酸碱基对。任选地,所述引物对侧接包含编码以下的位置的区域:位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶、位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶,或位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶;以及在编码以下的位置的每一侧上的至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个核苷酸:位于对应于根据SEQ ID No:2的第61,695位的位置处的胸腺嘧啶、位于对应于根据SEQ IDNO:4的第4,116位的位置处的尿嘧啶,或位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶。可以从mRNA和/或cDNA序列产生相似的扩增子。可以例如通过使用意图用于此目的的计算机程序从已知的序列获得PCR引物对,所述计算机程序诸如Vector NTI版本10中的PCR引物分析工具(Informax公司,Bethesda Md.);PrimerSelect(DNASTAR公司,Madison,Wis.);以及Primer3(版本0.4.0.COPYRGT.,1991,Whitehead Institute forBiomedical Research,Cambridge,Mass.)。此外,可以目视扫描所述序列并使用已知指南手动识别引物。

在一些实施方案中,检测受试者中SCAP变体核酸分子(诸如,例如基因组核酸分子、mRNA分子和/或cDNA分子)的存在或不存在的方法包括:对从受试者获得的生物样品进行测定,所述测定确定所述生物样品中的核酸分子是否包含位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT序列;位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的GU序列;或位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT序列。此类方法可以进一步包括,例如,从受试者获得包含SCAP基因组核酸分子或mRNA分子的生物样品,并且如果是mRNA,则任选地将mRNA逆转录成cDNA;以及对生物样品进行测定,所述测定确定了SCAP基因组核酸分子中的位置编码位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT序列;或SCAP mRNA中的位置编码位于对应于根据SEQ IDNO:4的第4,115至4,116位的位置处的GU序列;或SCAP cDNA中的位置编码位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT序列。此类测定可以包括例如确定特定SCAP核酸分子的这些位置的身份。在一些实施方案中,受试者为人。在某些实施方案中,所述方法是体外方法。生物样品中包含位于所指示位置处的GT或GU的核酸分子的存在意味着样品中存在变体SCAP核酸分子。

在一些实施方案中,所述测定包括对核酸分子的至少一部分进行测序,其中被测序的部分包含:位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT序列,或其互补物;位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的GU序列,或其互补物;或位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT序列,或其互补物。生物样品中包含位于所指示位置处的GT或GU的核酸分子的存在意味着样品中存在变体SCAP核酸分子。

在一些实施方案中,为了确定生物样品的核酸分子互补物是否包含编码以下的核苷酸序列:位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT序列,或其互补物;位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的GU序列,或其互补物;或位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT序列,可以使用引物对对生物样品执行扩增方法(所述引物对包括衍生自与以下相邻的5'侧翼序列的第一引物:位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT序列,或其互补物;位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的GU序列,或其互补物;或位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT序列;以及衍生自与以下相邻的3'侧翼序列的第二引物:位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT序列,或其互补物;位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的GU序列,或其互补物;或位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT序列),以产生指示以下的存在的扩增子:位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT序列,或其互补物;位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的GU序列,或其互补物;或位于对应于根据SEQ ID NO:65的第4,115至4,116位的位置处的GT序列。在一些实施方案中,扩增子的长度范围可从引物对加上一个核苷酸碱基对的组合长度至任何可通过DNA扩增方案产生的扩增子的长度。此距离的范围可以是一个核苷酸碱基对至扩增反应的极限值或约两万个核苷酸碱基对。

任选地,所述引物对侧接包括编码以下的位置的区域:位于对应于根据SEQ IDNO:2的第61,694至61,695位的位置处的GT序列;位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的GU序列;或位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT序列;以及在编码以下的位置的每一侧上的至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个核苷酸:位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT序列;位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的GU序列;或位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT序列。可以从mRNA和/或cDNA序列产生相似的扩增子。

在一些实施方案中,检测受试者中SCAP变体核酸分子(诸如,例如基因组核酸分子、mRNA分子和/或cDNA分子)的存在或不存在的方法包括:对从受试者获得的生物样品进行测定,所述测定确定生物样品中的核酸分子是否包含缺少以下的核苷酸序列:i)位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸,或其互补物,ii)位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的核苷酸,或其互补物,或iii)位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的核苷酸,或其互补物。

在一些实施方案中,检测受试者中SCAP变体核酸分子(诸如,例如基因组核酸分子、mRNA分子和/或cDNA分子)的存在或不存在的方法包括:对从受试者获得的生物样品进行测定,所述测定确定生物样品中的核酸分子是否包含在以下位置处的ACAG:对应于根据SEQ ID NO:1的第61,695至61,698位的位置;对应于根据SEQ ID NO:3或SEQ ID NO:5的第4,116至4,119位的位置。在一些实施方案中,生物样品包括细胞或细胞裂解物。此类方法可以进一步包括,例如,从受试者获得包含SCAP基因组核酸分子或mRNA分子的生物样品,并且如果是mRNA,任选地将mRNA逆转录成cDNA;以及对生物样品进行测定,所述测定确定了SCAP基因组核酸分子中的位置编码位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的ACAG序列;或者mRNA编码位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的ACAG序列;或者SCAP cDNA的位置编码位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的ACAG序列。生物样品中包含位于所指示位置处的ACAG的核酸分子的存在意味着样品中存在野生型SCAP核酸分子。

在一些实施方案中,所述测定包括对核酸分子的至少一部分进行测序,其中被测序的部分包含:位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的ACAG序列,或其互补物;位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的ACAG序列,或其互补物;或位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的ACAG序列。生物样品中包含位于所指示位置处的ACAG的核酸分子的存在意味着样品中存在野生型SCAP核酸分子。

在一些实施方案中,所述测定包括:a)扩增核酸分子的至少一部分;b)用可检测标记标记扩增的核酸分子;c)使标记的核酸分子与包含改变特异性探针的支持物接触,其中所述改变特异性探针包含在严格条件下与以下杂交的核苷酸序列:i)缺少位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸的扩增的核酸分子的核苷酸序列,或其互补物;ii)缺少位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的核苷酸的扩增的核酸分子的核苷酸序列;或iii)缺少位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的核苷酸的扩增的核酸分子的核苷酸序列,或其互补物;以及d)检测可检测标记。

在一些实施方案中,所述测定包括:使核酸分子与包含可检测标记的改变特异性探针接触,其中所述改变特异性探针包含在严格条件下与以下杂交的核苷酸序列:i)缺少位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸的扩增的核酸分子的核苷酸序列,或其互补物;ii)缺少位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的核苷酸的扩增的核酸分子的核苷酸序列;或iii)缺少位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的核苷酸的扩增的核酸分子的核苷酸序列,或其互补物;以及检测可检测标记。

在一些实施方案中,为了确定生物样品的核酸分子互补物是否包含编码以下的核苷酸序列:位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的ACAG序列,或其互补物;位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的ACAG序列,或其互补物;或位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的ACAG序列,可以使用引物对对生物样品执行扩增方法(所述引物对包括衍生自与以下相邻的5'侧翼序列的第一引物:位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的ACAG序列,或其互补物;位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的ACAG序列,或其互补物;或位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的ACAG序列;以及衍生自与以下相邻的3'侧翼序列的第二引物:位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的ACAG序列,或其互补物;位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的ACAG序列,或其互补物;或位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的ACAG序列),以产生指示以下的存在的扩增子:位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的ACAG序列,或其互补物;位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的ACAG序列,或其互补物;或位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的ACAG序列。

任选地,所述引物对侧接包括编码以下的位置的区域:位于对应于根据SEQ IDNO:1的第61,695至61,698位的位置处的ACAG序列,或其互补物;位于对应于根据SEQ IDNO:3的第4,116至4,119位的位置处的ACAG序列,或其互补物;或位于对应于根据SEQ IDNO:5的第4,116至4,119位的位置处的ACAG序列;以及在编码以下的位置的每一侧上的至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个核苷酸:位于对应于根据SEQ IDNO:1的第61,695至61,698位的位置处的ACAG序列,或其互补物;位于对应于根据SEQ IDNO:3的第4,116至4,119位的位置处的ACAG序列,或其互补物;或位于对应于根据SEQ IDNO:5的第4,116至4,119位的位置处的ACAG序列。可以从mRNA和/或cDNA序列产生相似的扩增子。

在一些实施方案中,所述测定包括:a)使样品同与以下杂交的引物接触:i)SCAP基因组核酸分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:1的第61,695至61,698位或根据SEQ ID NO:2的第61,694至61,695位的位置;ii)SCAP mRNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:3的第4,116至4,119位的位置或对应于根据SEQID NO:4的第4,115至4,116位的位置;iii)SCAP cDNA分子的核苷酸序列的一部分,其接近对应于根据SEQ ID NO:5的第4,116至4,119位的位置或对应于根据SEQ ID NO:6的第4,115至4,116位的位置;b)使引物延伸至少通过:i)对应于根据SEQ ID NO:1的第61,695至61,698位或根据SEQ ID No:2的第61,694至61,695位的位置;ii)对应于根据SEQ ID NO:3的第4,116至4,119位的位置或对应于根据SEQ ID NO:4的第4,115至4,116位的位置;或iii)对应于根据SEQ ID NO:5的第4,116至4,119位的位置或对应于根据SEQ ID NO:6的第4,115至4,116位的位置;以及c)确定引物的延伸产物是否缺少:i)位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸;ii)位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的核苷酸;或iii)位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的核苷酸。

在一些实施方案中,所述测定包括:对样品中的核酸分子的SCAP基因组序列的一部分进行测序,其中被测序的部分包括对应于根据SEQ ID NO:1的第61,695至61,698位或根据SEQ ID NO:2的第61,694至61,695位的位置;对应于根据SEQ ID NO:3的第4,116至4,119位的位置或对应于根据SEQ ID NO:4的第4,115至4,116位的位置;或对应于根据SEQ IDNO:5的第4,116至4,119位的位置或对应于根据SEQ ID NO:6的第4,115至4,116位的位置。

在一些实施方案中,所述测定包括:a)使所述样品同与以下杂交的引物接触:在一些实施方案中,所述测定包括:a)使所述样品同与以下杂交的引物接触:i)SCAP基因组序列的一部分,其在对应于根据SEQ ID NO:1的第61,695至61,698位或根据SEQ ID NO:2的第61,694至61,695位的SCAP基因组序列的位置的50个核苷酸内;ii)SCAP mRNA序列的一部分,其在对应于根据SEQ ID NO:3的第4,116至4,119位的SCAP mRNA的位置或对应于根据SEQ ID NO:4的第4,115至4,116位的位置的50个核苷酸内;或iii)SCAP cDNA序列的一部分,其在对应于根据SEQ ID NO:5的第4,116至4,119位的SCAP cDNA的位置或对应于根据SEQ ID NO:6的第4,115至4,116位的位置的50个核苷酸内;b)使引物延伸至少通过:i)对应于根据SEQ ID NO:1的第61,695至61,698位或根据SEQ ID NO:2的第61,694至61,695位的SCAP基因组序列的位置;ii)对应于根据SEQ ID NO:3的第4,116至4,119位的SCAP mRNA的位置,或对应于根据SEQ ID NO:4的第4,115至4,116位的位置;或iii)对应于根据SEQ IDNO:5的第4,116至4,119位的SCAP cDNA的位置,或对应于根据SEQ ID NO:6的第4,115至4,116位的位置;以及c)确定引物的延伸产物是否包含在以下位置处的ACAG序列:i)对应于根据SEQ ID NO:1的第61,695至61,698位的位置;ii)对应于根据SEQ ID NO:3的第4,116至4,119位的位置;或iii)对应于根据SEQ ID NO:5的第4,116至4,119位的位置,或者确定引物的延伸产物是否包含:i)位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT序列;ii)位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的GU序列;或iii)位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT序列。

多种技术包括例如核酸测序、核酸杂交和核酸扩增。核酸测序技术的例示性实例包括但不限于链终止子(Sanger)测序和染料终止子测序。

其他方法涉及除了测序以外的核酸杂交方法,其包括使用针对纯化的DNA、扩增的DNA和固定细胞制品的标记的引物或探针(荧光原位杂交(FISH))。在一些方法中,可以在检测之前或在检测的同时对靶核酸分子进行扩增。核酸扩增技术的例示性实例包括但不限于聚合酶链反应(PCR)、连接酶链反应(LCR)、链置换扩增反应(SDA)以及基于核酸序列的扩增反应(NASBA)。其他方法包括但不限于连接酶链反应、链置换扩增反应和嗜热SDA(tSDA)。

在杂交技术中,可以采用严格条件,使得探针或引物将特异性地与其靶标杂交。在一些实施方案中,多核苷酸引物或探针在严格条件下与其靶序列杂交的程度可检测地高于所述多核苷酸引物或探针与其他非靶序列杂交的程度,诸如比背景高出至少2倍、至少3倍、至少4倍或更多,包括比背景高出超过10倍。在一些实施方案中,多核苷酸引物或探针在严格条件下与其靶核苷酸序列杂交的程度将比所述多核苷酸引物或探针与其他核苷酸序列杂交的程度可检测地高出至少2倍。在一些实施方案中,多核苷酸引物或探针在严格条件下与其靶核苷酸序列杂交的程度将比所述多核苷酸引物或探针与其他核苷酸序列杂交的程度可检测地高出至少3倍。在一些实施方案中,多核苷酸引物或探针在严格条件下与其靶核苷酸序列杂交的程度将比所述多核苷酸引物或探针与其他核苷酸序列杂交的程度可检测地高出至少4倍。在一些实施方案中,多核苷酸引物或探针在严格条件下与其靶核苷酸序列杂交的程度将可检测地高于所述多核苷酸引物或探针与其他核苷酸序列杂交的程度,比背景高出超过10倍。严格条件是序列依赖性的并且在不同环境中将不同。

促进DNA杂交的适当严格性条件(例如,在约45℃下6X氯化钠/柠檬酸钠(SSC)下,接着在50℃下用2X SSC洗涤)是已知的,或者可在Current Protocols in MolecularBiology,John Wiley和Sons,N.Y.(1989),6.3.1-6.3.6中找到。通常,用于杂交和检测的严格条件将是其中盐浓度在pH 7.0至8.3下低于约1.5M Na+离子、通常约0.01至1.0M Na+离子浓度(或其他盐),并且温度对于短探针(诸如,例如10至50个核苷酸)而言是至少约30℃,而对于较长探针(诸如,例如大于50个核苷酸)是至少约60℃的那些。还可以通过添加去稳定剂诸如甲酰胺来实现严格条件。任选地,洗涤缓冲液可以包含约0.1%至约1%SDS。杂交的持续时间一般少于约24小时,通常约4至约12小时。洗涤时间的持续时间将至少是足以达到平衡的时间长度。

本公开还提供了检测人SCAP预测功能丧失变体多肽的存在的方法,其包括对从人受试者获得的样品进行测定以确定受试者中的SCAP多肽是否含有导致该多肽具有功能丧失(部分或完全)的一种或多种变异。在一些实施方案中,所述方法检测人SCAP预测功能丧失多肽的存在,并且包括对从人受试者获得的样品进行测定以确定样品中的SCAP多肽是否包含位于对应于根据SEQ ID NO:8的第1,235至1,335位的位置处的根据SEQ ID NO:10的氨基酸序列。在一些实施方案中,对从人受试者获得的样品进行测定以确定样品中的SCAP多肽是否包含根据SEQ ID NO:8的氨基酸序列。在一些实施方案中,所述检测步骤包括对包含位于对应于根据SEQ ID NO:8的第1,235至1,335位的位置处的多肽的至少一部分进行测序。在一些实施方案中,所述检测步骤包括对整个多肽进行测序。在一些实施方案中,所述检测步骤包括免疫测定。

本公开还提供了与SCAP变体基因组核酸分子(诸如SEQ ID NO:2)、SCAP变体mRNA分子(诸如SEQ ID NO:4)和/或SCAP变体cDNA分子(诸如SEQ ID NO:6)杂交的分离的核酸分子。在一些实施方案中,分离的核酸分子与SCAP核酸分子的这样的部分杂交,所述部分包括:对应于根据SEQ ID NO:2的第61,694至61,695位或第61,695至61,698位的位置;对应于根据SEQ ID NO:4的第4,115至4,116位或第4,116至4,119位的位置;或对应于根据SEQ IDNO:6的第4,115至4,116位或第4,116至4,119位的位置。

本公开还提供了与SCAP参考基因组核酸分子(诸如SEQ ID NO:1)、SCAP参考mRNA分子(诸如SEQ ID NO:3)和/或SCAP参考cDNA分子(诸如SEQ ID NO:5)杂交的分离的核酸分子。在一些实施方案中,分离的核酸分子与SCAP核酸分子的这样的部分杂交,所述部分包括:对应于根据SEQ ID NO:1的第61,694至61,695位或第61,695至61,698位的位置;对应于根据SEQ ID NO:3的第4,115至4,116位或第4,116至4,119位的位置;或对应于根据SEQ IDNO:5的第4,115至4,116位或第4,116至4,119位的位置。

在一些实施方案中,此类分离的核酸分子包含至少约5个、至少约8个、至少约10个、至少约11个、至少约12个、至少约13个、至少约14个、至少约15个、至少约16个、至少约17个、至少约18个、至少约19个、至少约20个、至少约21个、至少约22个、至少约23个、至少约24个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约55个、至少约60个、至少约65个、至少约70个、至少约75个、至少约80个、至少约85个、至少约90个、至少约95个、至少约100个、至少约200个、至少约300个、至少约400个、至少约500个、至少约600个、至少约700个、至少约800个、至少约900个、至少约1000个、至少约2000个、至少约3000个、至少约4000个、至少约5000个、至少约6000个、至少约7000个、至少约8000个、至少约9000个、至少约10000个、至少约11000个、至少约12000个、至少约13000个、至少约14000个、至少约15000个、至少约16000个、至少约17000个、至少约18000个、至少约19000个或至少约20000个核苷酸或者由其组成。在一些实施方案中,此类分离的核酸分子包含至少约5个、至少约8个、至少约10个、至少约11个、至少约12个、至少约13个、至少约14个、至少约15个、至少约16个、至少约17个、至少约18个、至少约19个、至少约20个、至少约21个、至少约22个、至少约23个、至少约24个或至少约25个核苷酸或者由其组成。在优选的实施方案中,所述分离的核酸分子包含至少约18个核苷酸或者由其组成。在一些实施方案中,所述分离的核酸分子包含至少约15个核苷酸或者由其组成。在一些实施方案中,所述分离的核酸分子包含约10个至约35个、约10个至约30个、约10个至约25个、约12个至约30个、约12个至约28个、约12个至约24个、约15个至约30个、约15个至约25个、约18个至约30个、约18个至约25个、约18个至约24个,或约18个至约22个核苷酸或者由其组成。在优选的实施方案中,所述分离的核酸分子包含约18个至约30个核苷酸或者由其组成。在一些实施方案中,所述分离的核酸分子包含至少约15个核苷酸到至少约35个核苷酸或者由其组成。

在一些实施方案中,此类分离的核酸分子在严格条件下与SCAP变体基因组核酸分子(诸如SEQ ID NO:2)、SCAP变体mRNA分子(诸如SEQ ID NO:4)和/或SCAP变体cDNA分子(诸如SEQ ID NO:6)杂交。在一些实施方案中,此类分离的核酸分子在严格条件下与SCAP参考基因组核酸分子(诸如SEQ ID NO:1)、SCAP参考mRNA分子(诸如SEQ ID NO:3)和/或SCAP参考cDNA分子(诸如SEQ ID NO:5)杂交。此类核酸分子可用作,例如如本文所述或例示的探针、引物、改变特异性探针或改变特异性引物,并且包括但不限于引物、探针、反义RNA、shRNA和siRNA,其中每一个都在本文别处被更详细地描述,并且可以在本文描述的任何方法中使用。

在一些实施方案中,所述分离的核酸分子与同SCAP变体基因组核酸分子(诸如SEQID NO:2)、SCAP变体mRNA分子(诸如SEQ ID NO:4)和/或SCAP变体cDNA分子(诸如SEQ IDNO:6)具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一性的核酸分子的至少约15个连续核苷酸杂交。在一些实施方案中,所述分离的核酸分子包含约15个至约100个核苷酸或约15个至约35个核苷酸或者由其组成。在一些实施方案中,所述分离的核酸分子包含约15个至约100个核苷酸或者由其组成。在一些实施方案中,所述分离的核酸分子包含约15个至约35个核苷酸或者由其组成。

在一些实施方案中,所述分离的改变特异性探针或改变特异性引物包含至少约15个核苷酸,其中所述改变特异性探针或改变特异性引物包含与编码人SCAP多肽的核苷酸序列的一部分互补的核苷酸序列,其中所述部分包含对应于以下的位置:根据SEQ ID NO:2的第61,694至61,695位或第61,695至61,698位,或其互补物;根据SEQ ID NO:4的第4,115至4,116位或第4,116至4,119位,或其互补物;或根据SEQ ID NO:6的第4,115至4,116位或第4,116至4,119位,或其互补物。

在一些实施方案中,改变特异性探针或改变特异性引物包含与包含对应于根据SEQ ID NO:2的第61,694至61,695位或第61,695至61,698位的位置的核苷酸序列的部分互补的核苷酸序列,或其互补物。

在一些实施方案中,改变特异性探针或改变特异性引物包含与包含对应于根据SEQ ID NO:4的第4,115至4,116位或第4,116至4,119位的位置的核苷酸序列的部分互补的核苷酸序列,或其互补物。

在一些实施方案中,改变特异性探针或改变特异性引物包含与包含对应于根据SEQ ID NO:6的第4,115至4,116位或第4,116至4,119位的位置的核苷酸序列的部分互补的核苷酸序列,或其互补物。

在一些实施方案中,改变特异性探针或改变特异性引物包含DNA。在一些实施方案中,改变特异性探针和改变特异性引物包含RNA。

在一些实施方案中,本文所述的探针和引物(包括改变特异性探针和改变特异性引物)具有与本文公开的核酸分子中的任一种特异性地杂交的核苷酸序列,或其互补物。在一些实施方案中,所述探针或引物在严格条件下与本文公开的核酸分子中的任一种特异性地杂交。

在一些实施方案中,包括改变特异性引物在内的引物可以用于第二代测序或高通量测序中。在一些情况下,包括改变特异性引物在内的引物可以被修饰。具体地,引物可以包含在例如大规模平行签名测序(Massive Parallel Signature Sequencing,MPSS)、聚合酶克隆测序(Polony sequencing)和454焦磷酸测序(454Pyrosequencing)的不同步骤中使用的各种修饰。在所述过程的几个步骤中可以使用修饰的引物,包括在克隆步骤中使用的生物素化的引物以及在珠粒装载步骤和检测步骤中使用的荧光标记的引物。一般使用双端(paired-end)标签文库进行聚合酶克隆测序,其中每个DNA模板分子的长度约为135bp。在珠粒装载步骤和乳液PCR中使用生物素化的引物。在检测步骤中使用荧光标记的简并九聚物寡核苷酸。衔接子可以包含用于将DNA文库固定到链酶亲和素包被的珠粒上的5'-生物素标签。

本文所述的探针和引物也可用于检测SCAP变体基因组核酸分子(诸如SEQ ID NO:2)内的位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸缺失,或SCAP变体mRNA分子(诸如SEQ ID NO:4)内的位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的核苷酸缺失,或SCAP变体cDNA分子(诸如SEQ ID NO:6)内的位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的核苷酸缺失。例如,所述引物可用于扩增包含位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸缺失的SCAP变体基因组核酸分子或其片段。所述引物也可用于扩增包含根据SEQ ID NO:3的第4,116至4,119位的SCAP变体mRNA或其片段。所述引物也可用于扩增包含根据SEQ ID NO:5的第4,116至4,119位的SCAP变体cDNA或其片段。

本文所述的探针和引物可用于检测SCAP变体基因组核酸分子(诸如SEQ ID NO:2)内的移码变异、SCAP变体mRNA分子(诸如SEQ ID NO:4)内的移码变异,或SCAP变体cDNA分子(诸如SEQ ID NO:6)内的移码变异。例如,所述引物可用于扩增包含移码变异的SCAP变体基因组核酸分子或其片段。所述引物也可用于扩增包含移码变异的SCAP变体mRNA或其片段。所述引物也可用于扩增包含移码变异的SCAP变体cDNA或其片段。

本公开还提供了包含上述引物中的任一种的引物对。例如,一对引物可用于区分编码SCAP参考基因组核酸分子的核酸分子与包含SEQ ID NO:2的SCAP变体基因组核酸分子。如果引物'3'端中的一个与特定SCAP核酸分子中第61,695位处的腺嘌呤(而不是胸腺嘧啶)杂交,那么扩增片段的存在将指示SCAP参考基因组核酸分子的存在。相反,如果引物'3'端中的一个与特定SCAP核酸分子中第61,695位处的胸腺嘧啶(而不是腺嘌呤)杂交,那么扩增片段的存在将指示SCAP变体基因组核酸分子的存在。在一些实施方案中,与位于对应于SEQ ID NO:2中第61,695位的位置处的胸腺嘧啶互补的引物的核苷酸可以在引物的3'端处。

所述引物对可用于区分编码SCAP参考基因组核酸分子(诸如SEQ ID NO:1)的核酸分子与具有位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸缺失(导致SEQ ID NO:2)的SCAP变体基因组核酸分子。如果引物'3'端中的一个与特定SCAP核酸分子中的位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的ACAG序列(而不是位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT序列)杂交,那么扩增片段的存在将指示SCAP参考基因组核酸分子的存在。相反,如果引物'3'端中的一个与特定SCAP核酸分子中的位于对应于根据SSEQ ID NO:2的第61,694至61,695位的位置处的GT序列(而不是位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的ACAG序列)杂交,那么扩增片段的存在将指示SCAP变体基因组核酸分子的存在。在一些实施方案中,与位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的ACAG序列或者与位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT序列互补的引物的核苷酸可在引物的3'端处。

所述引物对也可用于区分编码SCAP参考mRNA分子(诸如SEQ ID NO:3)的核酸分子与SCAP变体mRNA分子(诸如SEQ ID NO:4)。如果引物'3'端中的一个与特定SCAP核酸分子中第4,116位处的腺嘌呤(而不是尿嘧啶)杂交,那么扩增片段的存在将指示SCAP参考mRNA分子的存在。相反,如果引物'3'端中的一个与特定SCAP mRNA分子中第4,116位处的尿嘧啶(而不是腺嘌呤)杂交,那么扩增片段的存在将指示SCAP变体mRNA分子的存在。在一些实施方案中,与位于对应于SEQ ID NO:4中第4,116位的位置处的尿嘧啶互补的引物的核苷酸可以在引物的3'端处。

所述引物对可用于区分编码SCAP参考mRNA(诸如SEQ ID NO:3)的核酸分子与具有位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的核苷酸缺失(导致SEQ IDNO:4)的SCAP变体mRNA。如果引物'3'端中的一个与特定SCAP核酸分子中的位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的ACAG序列(而不是位于对应于根据SEQ IDNO:4的第4,115至4,116位的位置处的GU序列)杂交,那么扩增片段的存在将指示SCAP参考mRNA分子的存在。相反,如果引物'3'端中的一个与特定SCAP核酸分子中的位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的GU序列(而不是位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的ACAG序列)杂交,那么扩增片段的存在将指示SCAP变体mRNA分子的存在。在一些实施方案中,与位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的ACAG序列或者与位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的GU序列互补的引物的核苷酸可在引物的3'端处。

所述引物对也可用于区分编码SCAP参考cDNA分子(诸如SEQ ID NO:5)的核酸分子与SCAP变体cDNA分子(诸如SEQ ID NO:6.)。如果引物'3'端中的一个与特定SCAP核酸分子中第4,116位处的腺嘌呤(而不是胸腺嘧啶)杂交,那么扩增片段的存在将指示SCAP参考cDNA分子的存在。相反,如果引物'3'端中的一个与特定SCAP cDNA分子中第4,116位处的胸腺嘧啶(而不是腺嘌呤)杂交,那么扩增片段的存在将指示SCAP变体cDNA分子的存在。在一些实施方案中,与位于对应于SEQ ID NO:6中第4,116位的位置处的胸腺嘧啶互补的引物的核苷酸可以在引物的3'端处。

所述引物对可用于区分编码SCAP参考cDNA(诸如SEQ ID NO:5)的核酸分子与具有位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的核苷酸缺失(导致SEQ IDNO:6)的SCAP变体cDNA。如果引物'3'端中的一个与特定SCAP核酸分子中的位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的ACAG序列(而不是位于对应于根据SEQ IDNO:6的第4,115至4,116位的位置处的GT序列)杂交,那么扩增片段的存在将指示SCAP参考cDNA分子的存在。相反,如果引物'3'端中的一个与特定SCAP核酸分子中的位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT序列(而不是位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的ACAG序列)杂交,那么扩增片段的存在将指示SCAP变体cDNA分子的存在。在一些实施方案中,与位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的ACAG序列或者与位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT序列互补的引物的核苷酸可在引物的3'端处。

在一些实施方案中,所述探针或引物包含与SCAP基因组核酸分子的一部分杂交或与此核酸分子的互补物杂交的核苷酸序列,其中所述部分包含位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸缺失。在一些实施方案中,所述探针或引物包含与包含SEQ ID NO:2的SCAP基因组核酸分子在包含位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT序列的部分处杂交,或与此核酸分子的互补物杂交的核苷酸序列。

在一些实施方案中,所述探针或引物包含与SCAP mRNA分子的一部分杂交或与此核酸分子的互补物杂交的核苷酸序列,其中所述部分包含位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的核苷酸缺失。在一些实施方案中,所述探针或引物包含与包含SEQ ID NO:4的SCAP mRNA分子在包含位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的GU序列的部分处杂交,或者与此核酸分子的互补物杂交的核苷酸序列。

在一些实施方案中,所述探针或引物包含与SCAP cDNA分子的一部分杂交或与此核酸分子的互补物杂交的核苷酸序列,其中所述部分包含位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的核苷酸缺失。在一些实施方案中,所述探针或引物包含与包含SEQ ID NO:6的SCAP cDNA分子在包含位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT序列的部分处杂交,或者与此核酸分子的互补物杂交的核苷酸序列。

在本公开的上下文中,“特异性杂交”意味着探针或引物(诸如,例如改变特异性探针或改变特异性引物)不与编码SCAP参考基因组核酸分子、SCAP参考mRNA分子和/或SCAP参考cDNA分子的核酸序列杂交。

在一些实施方案中,所述探针(诸如,例如改变特异性探针)包含标记。在一些实施方案中,所述标记是荧光标记、放射性标记或生物素。

本公开还提供了包含本文公开的探针中的任一种或多种所附接的衬底的支持物。固体支持物是分子(诸如本文公开的探针中的任一种)可以与之缔合的固态衬底或支持物。固体支持物的一种形式是阵列。固体支持物的另一种形式是阵列检测器。阵列检测器是多个不同的探针以阵列、网格或其他组织化模式与之耦接的固体支持物。固态衬底的一种形式是微量滴定皿,诸如标准96孔型。在一些实施方案中,可以采用通常每孔含有一个阵列的多孔玻璃载片。

本公开还提供了分子复合物,其包含本文所述的SCAP核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补物中的任一种以及本文所述的改变特异性引物或改变特异性探针中的任一种,或者由其组成。在一些实施方案中,分子复合物中的SCAP核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补物是单链的。在一些实施方案中,所述SCAP核酸分子是本文所述的基因组核酸分子中的任一种。在一些实施方案中,所述SCAP核酸分子是本文所述的mRNA分子中的任一种。在一些实施方案中,所述SCAP核酸分子是本文所述的cDNA分子中的任一种。在一些实施方案中,所述分子复合物包含本文所述的SCAP核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补物中的任一种以及本文所述的改变特异性引物中的任一种,或者由其组成。在一些实施方案中,所述分子复合物包含本文所述的SCAP核酸分子(基因组核酸分子、mRNA分子或cDNA分子)或其互补物中的任一种以及本文所述的改变特异性探针中的任一种,或者由其组成。

在一些实施方案中,所述分子复合物包含与包含编码人SCAP多肽的核苷酸序列的基因组核酸分子杂交的改变特异性引物或改变特异性探针或由其组成,其中所述改变特异性引物或改变特异性探针与以下杂交:位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的GT二核苷酸,或其互补物。在一些实施方案中,分子复合物包含包含SEQ IDNO:2的基因组核酸分子或由其组成。

在一些实施方案中,所述分子复合物包含与包含编码人SCAP多肽的核苷酸序列的mRNA分子杂交的改变特异性引物或改变特异性探针或由其组成,其中所述改变特异性引物或改变特异性探针与以下杂交:位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的GU二核苷酸,或其互补物。在一些实施方案中,分子复合物包含包含SEQ ID NO:4的mRNA分子或由其组成。

在一些实施方案中,所述分子复合物包含与包含编码人SCAP多肽的核苷酸序列的cDNA分子杂交的改变特异性引物或改变特异性探针或由其组成,其中所述改变特异性引物或改变特异性探针与以下杂交:位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的GT二核苷酸,或其互补物。在一些实施方案中,分子复合物包含包含SEQ ID NO:6的cDNA分子或由其组成。

在一些实施方案中,所述分子复合物包含含有标记的改变特异性探针或改变特异性引物。在一些实施方案中,所述标记是荧光标记、放射性标记或生物素。在一些实施方案中,所述分子复合物进一步包含非人类聚合酶。

本公开提供了包含编码人SCAP多肽的核苷酸序列的分离的核酸分子,其中所述多肽包含位于对应于根据SEQ ID NO:8.的第1,235至1,335位的位置处的根据SEQ ID NO:10的氨基酸序列。本公开还提供了包含编码人SCAP多肽的核苷酸序列的分离的核酸分子,其中所述多肽不包含位于对应于根据SEQ ID NO:7的第1,235至1,279位的位置处的根据SEQID NO:9的氨基酸序列。

在一些实施方案中,分离的核酸分子编码具有与SEQ ID NO:8具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列的SCAP多肽,并且包含位于对应于根据SEQ ID NO:8的第1,235至1,335位的位置处的根据SEQ ID NO:10的氨基酸序列。

在一些实施方案中,分离的核酸分子编码具有与SEQ ID NO:8具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列的SCAP多肽,并且不包含位于对应于根据SEQ ID NO:7的第1,235至1,279位的位置处的根据SEQ ID NO:9的氨基酸序列。

在一些实施方案中,核酸分子编码包含SEQ ID NO:8的SCAP多肽。在一些实施方案中,核酸分子编码由SEQ ID NO:8组成的SCAP多肽。

SCAP参考基因组核酸分子的核苷酸序列示于SEQ ID NO:1中。参考SEQ ID NO:1,SCAP参考基因组核酸分子的第61,695至61,698位是ACAG。参考SEQ ID NO:1,SCAP参考基因组核酸分子的第61,694至61,695位是GA。参考SEQ ID NO:1,SCAP参考基因组核酸分子的第61,695至62,271位包含SEQ ID NO:11的核苷酸序列。

存在SCAP的变体基因组核酸分子,其中SCAP参考基因组核酸分子(参见SEQ IDNO:1)的第61,695至61,698位处的核苷酸ACAG被省略。这种SCAP预测功能丧失变体基因组核酸分子的核苷酸序列示于SEQ ID NO:2中。参考SEQ ID NO:2,变体SCAP基因组核酸分子的第61,695至61,698位是TCTA。参考SEQ ID NO:2,变体SCAP基因组核酸分子的第61,694至61,695位是GT。参考SEQ ID NO:2,变体SCAP基因组核酸分子的第61,695至62,267位包含SEQ ID NO:12的核苷酸序列。

本公开提供了分离的基因组核酸分子,其包含编码人SCAP多肽的核苷酸序列或由其组成,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:2的第61,695至62,267位的位置处的根据SEQ ID NO:12的核苷酸序列,或其互补物。这些基因组核酸分子缺少位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸ACAG。

在一些实施方案中,分离的基因组核酸分子包含编码人SCAP多肽的核苷酸序列或由其组成,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:2的第61,695至61,698位的位置处的核苷酸TCTA。这些基因组核酸分子缺少位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸。

在一些实施方案中,分离的基因组核酸分子包含编码人SCAP多肽的核苷酸序列或由其组成,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的核苷酸GT。这些基因组核酸分子缺少位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸。

本公开提供了分离的基因组核酸分子,其包含编码人SCAP多肽的核苷酸序列或由其组成,其中所述核苷酸序列缺少位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸,或其互补物。

在一些实施方案中,分离的基因组核酸分子包含与SEQ ID NO:2具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列或由其组成,并且包含位于对应于根据SEQ ID NO:2的第61,695至62,267位的位置处的根据SEQ ID NO:12的核苷酸序列,或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

在一些实施方案中,分离的SCAP基因组核酸分子包含与SEQ ID NO:2具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列或由其组成,并且缺少位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸,或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

在一些实施方案中,分离的SCAP基因组核酸分子包含与SEQ ID NO:2具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列或由其组成,并且包含位于对应于根据SEQ ID NO:2的第61,695至61,698位的位置处的核苷酸TCTA,或其互补物。这些基因组核酸分子缺少位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

在一些实施方案中,分离的SCAP基因组核酸分子包含与SEQ ID NO:2具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列或由其组成,并且包含位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的核苷酸GT,或其互补物。这些基因组核酸分子缺少位于对应于根据SEQ ID NO:1的第61,695至61,698位的位置处的核苷酸。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

在一些实施方案中,分离的SCAP基因组核酸分子包含SEQ ID NO:2。在一些实施方案中,分离的SCAP基因组核酸分子由SEQ ID NO:2组成。

在一些实施方案中,分离的SCAP基因组核酸分子包含少于完整的基因组DNA序列。在一些实施方案中,分离的基因组核酸分子包含以下或由以下组成:SEQ ID NO:2的至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约60个、至少约70个、至少约80个、至少约90个、至少约100个、至少约200个、至少约300个、至少约400个、至少约500个、至少约600个、至少约700个、至少约800个、至少约900个、至少约1000个、至少约2000个、至少约3000个、至少约4000个、至少约5000个、至少约6000个、至少约7000、至少约8000个、至少约9000个、至少约10000个、至少约11000个、至少约12000个、至少约13000个、至少约14000个、至少约15000个、至少约16000个、至少约17000个、至少约18000个、至少约20000个、至少约22000个、至少约24000个、至少约26000个、至少约28000个、至少约30000个、至少约32000个、至少约34000个、至少约36000个、至少约38000个、至少约40000个、至少约42000个、至少约44000个、至少约46000个、至少约48000个、至少约50000个、至少约52000个、至少约54000个、至少约56000个、至少约58000个、至少约60000个或至少约62000个连续核苷酸。在一些实施方案中,分离的基因组核酸分子包含以下或由以下组成:SEQ ID NO:2的至少约1000个至至少约2000个连续核苷酸。在一些实施方案中,这些分离的基因组核酸分子包含位于对应于根据SEQ ID NO:2的第61,695至62,267位的位置处的根据SEQ ID NO:12的核苷酸序列,或者包含位于对应于根据SEQ ID NO:2的第61,695至61,698位的位置处的核苷酸TCTA,或者包含位于对应于根据SEQ ID NO:2的第61,694至61,695位的位置处的核苷酸GT。

SCAP参考mRNA分子的核苷酸序列示于SEQ ID NO:3中。参考SEQ ID NO:3,SCAP参考mRNA分子的第4,116至4,119位是ACAG。参考SEQ ID NO:3,SCAP参考mRNA分子的第4,115至4,116位是GA。参考SEQ ID NO:3,SCAP参考mRNA分子的第4,116至4,421位包含SEQ IDNO:13的核苷酸序列。

存在SCAP的变体mRNA分子,其中SCAP参考mRNA分子(参见SEQ ID NO:3)的第4,116至4,119位处的核苷酸ACAG被省略。这种SCAP预测功能丧失变体mRNA分子的核苷酸序列示于SEQ ID NO:4中。参考SEQ ID NO:4,变体SCAP mRNA分子的第4,116至4,119位是UCUA。参考SEQ ID NO:4,变体SCAP mRNA分子的第4,115至4,116位是GU。参考SEQ ID NO:4,变体SCAP mRNA分子的第4,116至4,417位包含SEQ ID NO:14的核苷酸序列。

本公开提供了分离的SCAP mRNA分子,其包含编码人SCAP多肽的核苷酸序列或由其组成,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:4的第4,116至4,417位的位置处的根据SEQ ID NO:14的核苷酸序列,或其互补物。这些mRNA分子缺少位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的核苷酸。

在一些实施方案中,分离的SCAP mRNA分子包含编码人SCAP多肽的核苷酸序列或由其组成,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:4的第4,116至4,119位的位置处的核苷酸UCUA。这些mRNA分子缺少位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的核苷酸。

在一些实施方案中,分离的SCAP mRNA分子包含编码人SCAP多肽的核苷酸序列或由其组成,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的核苷酸GU。这些mRNA分子缺少位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的核苷酸。

本公开提供了分离的SCAP mRNA分子,其包含编码人SCAP多肽的核苷酸序列或由其组成,其中所述核苷酸序列缺少位于对应于根据SEQ ID NO:3,的第4,116至4,119位的位置处的核苷酸,或其互补物。

在一些实施方案中,分离的SCAP mRNA分子包含与SEQ ID NO:4具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列或由其组成,并且包含位于对应于根据SEQ ID NO:4的第4,116至4,417位的位置处的根据SEQ ID NO:14的核苷酸序列,或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

在一些实施方案中,分离的SCAP mRNA分子包含与SEQ ID NO:4具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列或由其组成,并且包含位于对应于根据SEQ ID NO:4的第4,116至4,119位的位置处的核苷酸UCUA,或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

在一些实施方案中,分离的SCAP mRNA分子包含与SEQ ID NO:4具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列或由其组成,并且包含位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的核苷酸GU,或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

在一些实施方案中,分离的SCAP mRNA分子包含与SEQ ID NO:4具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列或由其组成,并且缺少位于对应于根据SEQ ID NO:3的第4,116至4,119位的位置处的核苷酸,或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

在一些实施方案中,分离的SCAP mRNA分子包含SEQ ID NO:4。在一些实施方案中,分离的SCAP mRNA分子由SEQ ID NO:4组成。

SCAP参考cDNA分子的核苷酸序列示于SEQ ID NO:5中。参考SEQ ID NO:5,SCAP参考cDNA分子的第4,116至4,119位是ACAG。参考SEQ ID NO:5,SCAP参考cDNA分子的第4,115至4,116位是GA。参考SEQ ID NO:5,SCAP参考cDNA分子的第4,116至4,421位包含SEQ IDNO:15的核苷酸序列。

存在SCAP的变体cDNA分子,其中SCAP参考cDNA分子(参见SEQ ID NO:5)的第4,116至4,119位处的核苷酸ACAG被省略。这种SCAP预测功能丧失变体cDNA分子的核苷酸序列示于SEQ ID NO:6中。参考SEQ ID NO:6,变体SCAP cDNA分子的第4,116至4,119位是TCTA。参考SEQ ID NO:6,变体SCAP cDNA分子的第4,115至4,116位是GT。参考SEQ ID NO:6,变体SCAP cDNA分子的第4,116至4,417位包含SEQ ID NO:16的核苷酸序列。

本公开提供了分离的SCAP cDNA分子,其包含编码人SCAP多肽的核苷酸序列或由其组成,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:6的第4,116至4,417位的位置处的根据SEQ ID NO:16的核苷酸序列,或其互补物。这些cDNA分子缺少位于对应于根据SEQ ID NO:5的第4,116至4,119位处的核苷酸。

在一些实施方案中,分离的SCAP cDNA分子包含编码人SCAP多肽的核苷酸序列或由其组成,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:6的第4,116至4,119位的位置处的核苷酸TCTA。这些cDNA分子缺少位于对应于根据SEQ ID NO:5的第4,116至4,119位处的核苷酸。

在一些实施方案中,分离的SCAP cDNA分子包含编码人SCAP多肽的核苷酸序列或由其组成,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的核苷酸GT。这些cDNA分子缺少位于对应于根据SEQ ID NO:5的第4,116至4,119位处的核苷酸。

本公开提供了分离的SCAP cDNA分子,其包含编码人SCAP多肽的核苷酸序列或由其组成,其中所述核苷酸序列缺少位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的核苷酸,或其互补物。

在一些实施方案中,分离的SCAP cDNA分子包含与SEQ ID NO:6具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列或由其组成,并且包含位于对应于根据SEQ ID NO:6的第4,116至4,417位的位置处的根据SEQ ID NO:16的核苷酸序列,或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

在一些实施方案中,分离的SCAP cDNA分子包含与SEQ ID NO:6具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列或由其组成,并且包含位于对应于根据SEQ ID NO:6的第4,116至4,119位的位置处的核苷酸TCTA,或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

在一些实施方案中,分离的SCAP cDNA分子包含与SEQ ID NO:6具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列或由其组成,并且包含位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的核苷酸GT,或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

在一些实施方案中,分离的SCAP cDNA分子包含与SEQ ID NO:6具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的核苷酸序列或由其组成,并且缺少位于对应于根据SEQ ID NO:5的第4,116至4,119位的位置处的核苷酸,或其互补物。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

在一些实施方案中,分离的SCAP cDNA分子包含SEQ ID NO:6。在一些实施方案中,分离的SCAP cDNA分子由SEQ ID NO:6组成。

基因组核酸分子、mRNA分子和cDNA分子可以来自任何生物体。例如,所述基因组核酸分子、mRNA分子和cDNA分子可以是人的或者是来自另一生物体(诸如非人哺乳动物、啮齿动物、小鼠或大鼠)的直向同源物的。应理解,群体内的基因组核酸分子、mRNA分子和cDNA序列可因多态性诸如单核苷酸多态性而变化。本文提供的实例仅为示例性序列。其他序列也是可能的。

在一些实施方案中,分离的SCAP mRNA分子或cDNA分子包含少于完整的mRNA或cDNA序列。在一些实施方案中,分离的cDNA分子包含以下或由以下组成:SEQ ID NO:6的至少约5个、至少约8个、至少约10个、至少约12个、至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约60个、至少约70个、至少约80个、至少约90个、至少约100个、至少约200个、至少约300个、至少约400个、至少约500个、至少约600个、至少约700个、至少约800个、至少约900个、至少约1000个、至少约1100个、至少约1200个、至少约1300个、至少约1400个、至少约1500个、至少约1600个、至少约1700个、至少约1800个、至少约1900个、至少约2000个、至少约2100个、至少约2200个、至少约2300个、至少约2400个、至少约2500个、至少约2600个、至少约2700个、至少约2800个、至少约2900个、至少约3000个、至少约3100个、至少约3200个、至少约3300个、至少约3400个、至少约3500个、至少约3600个、至少约3700个、至少约3800个、至少约3900个、至少约4000个、至少约4100个、至少约4200个、至少约4300个或至少约4400个连续核苷酸。在一些实施方案中,分离的cDNA分子包含以下或由以下组成:SEQ ID NO:4(对于mRNA)或SEQ ID NO:6(对于cDNA)的至少约400个至至少约500个连续核苷酸。在一些实施方案中,分离的cDNA分子包含以下或由以下组成:SEQ ID NO:4(对于mRNA)或SEQ ID NO:6(对于cDNA)的至少约1000个至至少约2000个连续核苷酸。在一些实施方案中,这些分离的mRNA分子包含位于对应于根据SEQ ID NO:4的第4,116至4,417位的位置处的根据SEQ ID NO:14的核苷酸序列,或者包含位于对应于根据SEQ ID NO:4的第4,116至4,119位的位置处的核苷酸UCUA,或者包含位于对应于根据SEQ ID NO:4的第4,115至4,116位的位置处的核苷酸GU。在一些实施方案中,这些分离的cDNA分子包含位于对应于根据SEQ ID NO:6的第4,116至4,417位的位置处的根据SEQ ID NO:16的核苷酸序列,或者包含位于对应于根据SEQ ID NO:6的第4,116至4,119位的位置处的核苷酸TCTA,或者包含位于对应于根据SEQ ID NO:6的第4,115至4,116位的位置处的核苷酸GT。

本文还提供了可以与公开的核酸分子相互作用的功能性多核苷酸。功能性多核苷酸是具有特定功能(诸如结合靶分子或催化特定反应)的核酸分子。功能性多核苷酸的实例包括但不限于反义分子、适体、核酶、三链体形成分子以及外部引导序列。功能性多核苷酸可以充当靶分子所具有的特定活性的效应子(effector)、抑制剂、调节剂和刺激剂,或者功能性多核苷酸可以具有独立于任何其他分子的从头(de novo)活性。

本文公开的分离的核酸分子可以包括RNA、DNA,或者RNA和DNA两者。所述分离的核酸分子还可以连接或融合到异源标记上。此类标记包括例如化学发光剂、金属、标签、酶、放射性标记、颜料、染料、色原、自旋标记和荧光标记。标记还包括例如颗粒,荧光团,半抗原,酶以及其量热、荧光和化学发光底物和其他标记。

所公开的核酸分子可以包括例如核苷酸或非天然或修饰的核苷酸,诸如核苷酸类似物或核苷酸替代物。此类核苷酸包括含有修饰的碱基、修饰的糖或修饰的磷酸酯基团的核苷酸,或者在其结构中掺入有非天然部分的核苷酸。

本公开还提供了包含本文公开的核酸分子中的任一种或多种的载体。在一些实施方案中,所述载体包含本文公开的核酸分子中的任一种或多种和异源核酸。所述载体可以是能够转运核酸分子的病毒或非病毒载体。在一些实施方案中,所述载体是质粒或粘粒。

核酸分子内的核苷酸序列或多肽内的氨基酸序列的特定伸长段之间的同一性百分比(或互补性百分比)可以使用BLAST程序(基本局部比对搜索工具)和PowerBLAST程序(Altschul等人,J.Mol.Biol.,1990,215,403-410;Zhang和Madden,Genome Res.,1997,7,649-656)或通过使用Gap程序(Wisconsin序列分析包,用于Unix的版本8,GeneticsComputer Group,University Research Park,Madison Wis.)使用默认设置(其使用Smith和Waterman的算法(Adv.Appl.Math.,1981,2,482-489)来确定。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

本公开还提供了包含本文公开的分离的核酸分子、基因组核酸分子、mRNA分子和/或cDNA分子中的任一种或多种的组合物。在一些实施方案中,所述组合物是药物组合物。在一些实施方案中,所述组合物包含载剂和/或赋形剂。

SCAP参考多肽的氨基酸序列示于SEQ ID NO:7中。参考SEQ ID NO:7,SCAP参考多肽的第1,235至1,279位包含根据SEQ ID NO:9的氨基酸序列。

存在SCAP的变体多肽,其中SCAP参考基因组核酸分子(参见SEQ ID NO:1)的第61,695至61,698位处的核苷酸ACAG缺失被省略,从而产生导致形成变体SCAP多肽的变体C末端的移码。这种SCAP预测功能丧失变体多肽的氨基酸序列示于SEQ ID NO:8中。参考SEQ IDNO:8,SCAP变体多肽的第1,235至1,335位包含根据SEQ ID NO:10的氨基酸序列。

本公开还提供了分离的人SCAP多肽,其具有与SEQ ID NO:8至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一的氨基酸序列,其中所述多肽包含位于对应于根据SEQ ID NO:8的第1,235至1,335位的位置处的根据SEQ ID NO:10的氨基酸序列。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

本公开还提供了分离的人SCAP多肽,其具有与SEQ ID NO:8至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%同一的氨基酸序列,其中所述多肽缺少位于对应于根据SEQ ID NO:7的第1,235至1,279位的位置处的氨基酸。在本文中,如果参考序列同一性百分比,则较高的序列同一性百分比相对于较低的序列同一性百分比是优选的。

在一些实施方案中,分离的人SCAP多肽的氨基酸序列包含SEQ ID NO:8或由其组成。

在一些实施方案中,分离的SCAP多肽包含以下或由以下组成:与SEQ ID NO:8的至少约8个、至少约10个、至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约60个、至少约70个、至少约80个、至少约90个、至少约100个、至少约150个、至少约200个、至少约250个、至少约300个、至少约350个、至少约400个、至少约450个、至少约500个、至少约550个、至少约600个、至少约650个、至少约700个、至少约750个、至少约800个、至少约850个、至少约900个、至少约950个、至少约1000个、至少约1050个或至少约1100个连续氨基酸至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%同一的氨基酸序列。在一些实施方案中,分离的多肽还包含位于对应于根据SEQ ID NO:8的第1,235至1,335位的位置处的根据SEQ ID NO:10的氨基酸序列。在一些实施方案中,分离的多肽还缺少位于对应于根据SEQ ID NO:7的第1,235至1,279位的位置处的氨基酸。在这方面,较长的片段优于较短的片段。

本文公开的分离的SCAP多肽可以包含天然存在的SCAP多肽的氨基酸序列,或者可以包含非天然存在的序列。在一些实施方案中,由于保守氨基酸取代,天然存在的序列可以不同于非天然存在的序列。

在一些实施方案中,所述分离的多肽包含非天然或修饰的氨基酸或肽类似物。例如,存在许多具有与天然存在的氨基酸不同的官能取代基的D-氨基酸或氨基酸。

SCAP参考多肽可以用于例如筛选充当拮抗剂的化合物,这些化合物可以用于治疗作为SCAP参考或对于SCAP预测功能丧失核酸分子是杂合的受试者。变体SCAP多肽(诸如本文所述的SCAP预测功能丧失多肽)可以用于例如筛选充当激动剂的化合物,这些化合物可以用于治疗作为SCAP参考或对于SCAP预测功能丧失核酸分子是杂合的受试者。

本公开还提供了编码本文公开的多肽中的任一种的核酸分子。这包括与特定多肽序列相关的所有简并序列。因此,虽然每个特定核酸序列可能未在本文中写出,但是实际上每一个序列均通过公开的多肽序列在本文中公开并描述。

本公开还提供了包含本文公开的核酸分子中的任一种或多种和/或多肽中的任一种或多种的组合物。在一些实施方案中,所述组合物包含载剂。

本公开还提供了产生本文公开的SCAP多肽或其片段中的任一种的方法。此类SCAP多肽或其片段可以通过任何合适的方法产生。

本公开还提供了包含本文公开的核酸分子中的任一种或多种和/或多肽中的任一种或多种的细胞。所述细胞可以是体外的、离体的或体内的。核酸分子可以连接到启动子和其他调控序列,所以它们被表达从而产生编码的蛋白质。

所附序列表中列出的核苷酸序列和氨基酸序列是使用核苷酸碱基的标准字母缩写和氨基酸的三字母代码示出的。所述核苷酸序列遵循从序列的5'端开始并向前行进(即在每一行中从左到右)到3'端的标准惯例。仅示出了每个核苷酸序列的一条链,但是互补链应被理解为通过对所示链的任何参考而被包括在内。所述氨基酸序列遵循从序列的氨基末端开始并向前行进(即在每一行中从左到右)到羧基末端的标准惯例。

如本文所用,当在特定核苷酸或核苷酸序列或位置的编号的上下文中使用时,短语"对应于"或其语法变型是指当将特定核苷酸或核苷酸序列与参考序列比较时对指定参考序列的编号。换句话讲,特定聚合物的残基(诸如,例如核苷酸或氨基酸)编号或残基(诸如,例如核苷酸或氨基酸)位置是相对于参考序列来指定,而不是根据残基在特定核苷酸或核苷酸序列内的实际数值位置来指定。例如,可以通过引入缺口以优化特定核苷酸序列与参考序列之间的残基匹配来使这两个序列对齐。在这些情况下,虽然存在缺口,但是对特定核苷酸或核苷酸序列中的残基的编号是相对于与它对齐的参考序列来进行的。

例如,包含编码人SCAP多肽的核苷酸序列的核酸分子,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶意味着如果SCAP基因组核酸分子的核苷酸序列与SEQ ID NO:2的序列比对,那么SCAP序列具有位于对应于SEQ IDNO:2的第61,695位的位置处的胸腺嘧啶残基。这同样适用于包含编码人SCAP多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶。这同样适用于包含编码人SCAP多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶。换句话说,这些短语是指编码SCAP多肽的核酸分子,其中基因组核酸分子具有包含与SEQ ID NO:2的第61,695位处的胸腺嘧啶残基同源的胸腺嘧啶残基的核苷酸序列(或者其中mRNA分子具有包含与SEQ ID NO:4的第4,116位处的尿嘧啶残基同源的尿嘧啶残基的核苷酸序列;或者其中cDNA分子具有包含与SEQ ID NO:6的第4,116位处的胸腺嘧啶残基同源的胸腺嘧啶残基的核苷酸序列)。

如本文所述,通过在特定SCAP核酸分子的核苷酸序列和SEQ ID NO:2的核苷酸序列之间进行序列比对,可以鉴定出SCAP基因组核酸分子内对应于根据SEQ ID NO:2的第61,695位的位置。存在多种可用于进行序列比对以鉴定出对应于例如SEQ ID NO:2中第17,922位的核苷酸位置的计算算法。例如,通过使用NCBI BLAST算法(Altschul等人,NucleicAcids Res.,1997,25,3389-3402)或CLUSTALW软件(Sievers和Higgins,MethodsMol.Biol.,2014,1079,105-116),可以进行序列比对。然而,还可以手动地对序列进行比对。

本公开还提供了治疗或抑制脂质水平升高和/或甘油三酯水平升高的治疗剂,其用于治疗人受试者中脂质水平升高和/或甘油三酯水平升高(用于制备用于治疗脂质水平升高和/或甘油三酯水平升高的药物),其中所述人受试者具有:具有编码人SCAP多肽的核苷酸序列的基因组核酸分子,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶,或其互补物;具有编码人SCAP多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶,或其互补物;具有编码人SCAP多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶,或其互补物;和/或SCAP多肽,其包含位于对应于根据SEQ ID NO:8的第1,235至1,335位的位置处的根据SEQ ID NO:10的氨基酸序列。抗脂质水平升高剂可以是本文所述的抗脂质水平升高剂中的任一种。

本公开还提供了SCAP抑制剂,其用于治疗人受试者中的脂质水平升高和/或甘油三酯水平升高(用于制备用于治疗脂质水平升高和/或甘油三酯水平升高的药物),其中所述人受试者具有:具有编码人SCAP多肽的核苷酸序列的基因组核酸分子,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:2的第61,695位的位置处的胸腺嘧啶,或其互补物;具有编码人SCAP多肽的核苷酸序列的mRNA分子,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:4的第4,116位的位置处的尿嘧啶,或其互补物;具有编码人SCAP多肽的核苷酸序列的cDNA分子,其中所述核苷酸序列包含位于对应于根据SEQ ID NO:6的第4,116位的位置处的胸腺嘧啶,或其互补物;和/或SCAP多肽,其包含位于对应于根据SEQ ID NO:8的第1,235至1,335位的位置处的根据SEQ ID NO:10的氨基酸序列。SCAP抑制剂可以是本文所述的SCAP抑制剂中的任一种。

以上或以下所引用的所有专利文献、网站、其他出版物、登录号等出于所有目的以引用的方式整体并入,引用程度如同每个单独项均被具体地且单独地指出如此以引用的方式并入。如果序列的不同版本与不同时间的登录号相关,那么意指与在本申请的有效申请日时的登录号相关的版本。如果适用的话,提及登录号时,有效申请日意指实际申请日或优先权申请的申请日中较早者。同样,如果出版物、网站等的不同版本在不同的时间公布,那么除非另外指明,否则意指在本申请的有效申请日时最新公布的版本。除非另外具体指明,否则本公开的任何特征、步骤、元件、实施方案或方面均可以与任何其他特征、步骤、元件、实施方案或方面组合使用。尽管出于清楚和理解的目的已通过说明和实例详细描述本公开,但将显而易见的是,可以在所附权利要求的范围内进行某些变化和修改。

提供以下实施例来更详细地描述实施方案。它们意图说明但不限制所要求保护的实施方案。以下实施例为本领域普通技术人员提供了如何制造和评价本文所述的化合物、组合物、制品、装置和/或方法的公开和描述,并且意图仅仅是示例性的,而不意图限制任何权利要求的范围。已努力确保关于所用数值(诸如,例如量、温度等)的准确性,但可以考虑一些误差和偏差。除非另外指明,否则份数是重量份,温度是以℃计或处于环境温度,并且压力处于或接近大气压。

实施例

实例1:在老派阿曼派(Old Order Amish)中SCAP中的移码变体可能与LDL水平降低相关

分析了从老派阿曼派组获得的pLOF多态性和错义变体。结果(参见表1和图1,图A-C)显示位于SCAP基因中的rs746678809与天冬氨酸转氨酶水平升高、LDL-C降低和甘油三酯水平降低显著相关。

表1:SCAP rs746678809变体与天冬氨酸转氨酶水平降低、LDL-C降低和甘油三酯降低的关联

除本文所述的那些修改之外,所描述主题的各种修改也将为本领域的技术人员根据以上描述所显而易知。此类修改也旨在落在所附权利要求书的范围内。本申请中引用的每篇参考文献(包括但不限于期刊文章、美国和非美国专利、专利申请公布、国际专利申请公布、基因库登录号等)均以其整体和出于所有目的以引用的方式并入本文。

序列表

<110> 雷杰纳荣制药公司(Regeneron Pharmaceuticals, Inc.)

马里兰大学巴尔的摩分校(University of Maryland, Baltimore)

<120> 用固醇调节元件结合蛋白切割激活蛋白(SCAP)抑制剂治疗脂质水平升高

<130> 189238.02202 (3203) (10537WO01)

<150> 62/820,895

<151> 2019-03-20

<160> 53

<170> PatentIn version 3.5

<210> 1

<211> 62271

<212> DNA

<213> 智人(homo sapien)

<400> 1

agaggtgaag gggcgggcac ccggcggcca ggagagagag ggagggcgcc acgcaccgga 60

ctgcgggccg agagcgcgca cgccgcgctc cgcccctgct gccgcccccg tcgccgccgc 120

cgccgccgcc gcagcttggg aggtgctgcc accacaggta ccgtcacgcg ggtgctcagg 180

gcgcctgccc gcgggcccca gctcgacccc agccgcgtgg agctgggagt tccggaatgg 240

gggccgctag gttcgggggt gcgtgggcat ggcgctgtcc agcagccgtg cgggccggcc 300

ctggagaccg caggccggca aggaggcagg gccgcgcgtc cccaccccca acccggccgt 360

gtccctgcac cggccggccc ctggagctcc gcgtccccac cagacctccg cgggcccctg 420

gtgtgacggg gggagatgcg cggcgtcgca tcccctggcc tagttgctcc gggaagctgt 480

tgtagaacct gctttggtgc tgtttgggtt ttccggagtg cgggggagag caggttctcc 540

actttgcctc ttttggaaga tcttattgag agacaacgct agttgctttg ctggttttgc 600

ttggtttcta gttttccgta ttgcttaaac ctcaactttg ctcactaatg ttgcttctgt 660

ttacttctga gtgggtttat gacctcagta tttaaccggc ttataatgtc acgatagcgt 720

tagttgcagg gagccctggc tccggactgt ttgaatcaca gaaagttgtg cagatgggaa 780

tgcggagggg ggggcagtga gtcgctgtgg gggctctggc aggggtcagc ccctggttcg 840

ggtcactcac tgctccacct tgtatggcga cagtcggagc taggtgaata aactctttct 900

ggggattttg taatacttat cgtgaagcgg ccatagaaaa ggtttaatgt tagcgttgcg 960

tgtgtttctt ttatttggcc aaaaatttgt ggagtttggt tatgccgtgt ctttattggt 1020

ttgctgtcag gtcaggatat tgagcaaaag actgacgctt ttattaggga gtcagggtcg 1080

agggtgtcta gttagtgctg tatccatttt aggtgttcct cagtgatgcc taaagacttg 1140

ttttttgttt gtttgtttgg agacagggtc tcactctgtc tcccaggctg gagtgcagtg 1200

gcgcgatctc ggctcactgc agccttgatt tcctgggctc aggtgatcct cccacctcag 1260

cctccccagt agctgggaca gcaggtgtgt gccaccacgc ccggctaatt tttgtatttt 1320

tttgtagaga tgggggtctt gctgtgttgc ccaggctggt ctttaactcc tgggctcaag 1380

cattatacaa gccttggcct cccaaagtgt tggtattaca ggcgtgaacc accgtgcccg 1440

gccaagacct gtatctttta aaatgtgtgt taatatagtt tacattttag gtgttttaca 1500

catttgcagt attcccactg agcacatgat gtaaaaaaca ctatataaat atatttaaca 1560

ctgtataaat atatttccat atttattctt ttggtcataa attgaaatgg aaagaattag 1620

gctttttaaa tttattatga actgatctga tgtttgaatg ctctctcttt tctttctttc 1680

tttttttttt tgagatggag tctcgctctg tcgcccaggc tggagtgcag tggcgccatc 1740

tcggctcact gcaccctccg cctgccgggt tcaagcgatt ctcctgcctc agcctcccaa 1800

gtagctggga ctacaggcgc ccgccaccat gcccggctac ttttttgtat ttttagtaga 1860

gacggggttt caccgtgtta gccaggatcg tctctatctc ctgacctcat gatccgtccg 1920

cttcggcctc ccaaagtgct gggattacag gcgtgagcca ccgcgcctgg cttgaatgct 1980

ctctcttttc ttttgctgtt gcggcaaaaa cgccccctct ctagagatct ccgtggactt 2040

tataatcact ggtttggggc ccttcccccg ttccctcagt cactgtcatt aggtgggtaa 2100

aaagtttact acaagtttat tactagaaaa atggaggcat atgcgattca ggaattaaat 2160

aaactaaaaa aggaaagaaa aagtgtgcct gtgggcttca ctgcaggtat gtatattaac 2220

atttggtggt agactttagg gatgttttct ctctcagaat ctagccatgc atgtgaatgt 2280

gcctcaggga tcctggaatg acaggttcat gtgctgtttg cttactctca ccattggtgg 2340

ttgccagtgt tttaccggct ctgacaggta cttcatatac agtttgtgtc atcacccccg 2400

ttgaacagat gagaggactc ctcatagaga agctgggttc ttacaaggtc acccagcttg 2460

tcaagggtgg atcatccttc aaaccaggtc tgccacacct ctgccacctg agctccttcc 2520

gttagaactt gctaccttac tgagttggct aaagaaacaa ggttcaggtg tcgtcttttg 2580

ccactcagag taataattct gggtgatatc gagcacttgt gctgtttagg cagtgtccta 2640

ggtactgtaa tattagctta tctcacttag ttttcataat aaccaggtga gataacactg 2700

ttatcacccc ctttacggag agttttagaa aagttatttg actggccctg ggtcacctag 2760

cgaatttgag acggagtgtg ttgtgtgcaa actgagattt ggctgacaaa agagtccatc 2820

cttttatgct gttcttgtac ctgcttccac agtctgtttt tttttttttt tttttgagat 2880

ggagtttcgc tcttcttgcc caggctggag tgcaatggcg tgatctcagc tcactgcaac 2940

ctccgcctcc caggttcaag cgattctcct gcctcagcct cctgagtagc tgggattaca 3000

ggcatgcact accacgcctg gctaattttg tatttttagt agaggcgagg tttctcccta 3060

ttggtcaggc tggtctcaga ctcccgatct caggtgatcc gcccgcctcg gcctcccaaa 3120

gtgctgggat tacaggcgtg agccactgca cgcagcccac agtcttttct gttgctcatt 3180

ggcaggtaag ggtagtggaa gaaggtggta ggggtggtgg gaggaagcca gcgtcactga 3240

ctctagtgtg gggatggtgg aactcagcaa gaaggtgaca gcaatttgac cactgccatt 3300

tgacagtttc tgcttaagca gtcaagggca ctaacctaga atggttgcag ggatgctaaa 3360

tcataaggaa gctttgcagt ggggtccaaa gttggtatgt aagcataaag atgcacgtgg 3420

atctcaggaa aaaaataaaa ctaattttcc tgtttatttc agcttcattt aattattatt 3480

attattatta ttattttatt ttattttttt tttttgagac ggagtctcgc tctgtcgccc 3540

aggccggact gcggactgca gtggcgcaat ctcggctcac tgcaagctcc gcttcccggg 3600

tttacgccat tctcctgcct cagcctcccg agtagctggg actacaggcg cccgccaccg 3660

cgcccggcta atttttttgt atttttagta gagacggggt ttcaccttgt tagccaggat 3720

ggtctcgatc tcctgacctc atgatccact cgcctcggcc tcccaaagtg ctgggattac 3780

aggcgtgagc caccgcgccc ggccccattt aattattatt attatttttt tgagatggag 3840

tctcactcaa tctgttgccc aggctggagt gcattgatgc tatcttggtt tactgcaatc 3900

ttggtctcct gcctcagcct cccgagtagc tgggattaca gctgtgcacc accacacctg 3960

gctaattttg tatttttagt agagatgggg tttcaccata ttggttaggc tggtctcaaa 4020

ctcctggcct caagtgatcc acccacctta acctcccaaa gtgctgggat tacaggcatg 4080

aaccaccata ataattttta ttatgtactt tataatgtac actgtattat cactgtagta 4140

catatataat ttatatgtaa gtgtacatgt attgggagca tatacttgaa tttttgttgt 4200

tgggcattca tgatcaaaac atttgggaac cagtggctta tttgatattt agcattttca 4260

gaaagcataa aatatacaag gtgttggcca ggcacagtgg ctcatgcctg taatctcagc 4320

actttgggag gctgaggagg gtggatcacc tgaggtcagg agttcgagac cagcctgacc 4380

aacatgtgtg aaaccccgtc tccactataa atacaaaagt tagccaggtg tggtggcatg 4440

cgcctgtagt atacctctaa gtatactaga actatgttga tgttttcctc tctctgcctt 4500

ggccactagg aagctcagag tcaagtttgt atccagggtc ttccagcttg tgcttaagtg 4560

ttttaatcgt ctagattgtt tttaatggtt tctgctcttt gtctcaggtt ttactataaa 4620

atacataaca catttccttc ccgttctaaa tattactgtg attgtattct tatagccaaa 4680

tctttgttct tattcttatt ttattttatt ttttatactg ttgaatccct ctgagccttg 4740

cctttccctg cctcctcttc tgtactcatt tttgctaaaa tttgtaaggg gataaattct 4800

tgaaaagctt tgcacatttt gaagacttgt ttgtttttta atatttatta tagtaaaact 4860

caaatataca tccaaataga gagcaataag cccttgtgta cctatcactc agttatgtct 4920

gtcacttagt cattaacttg gggacactct tgtttcatct atatccttta atcctcatta 4980

tacttttttt tggggggaga agtttattaa ttgataggtg ttactttggg gtaaatgagg 5040

agggagccca ctagtatgct ggggaactgg taaggttttt ttgttttttt cttgaaacag 5100

agtcttgctc ttgtcgccca ggctggagtg cagtggtgcg atctcggctc actgcaacct 5160

tcgcccccct gggttcaagc gactctcctg cctcagcctc ccaagtagct gggattacag 5220

gcacctgcca ccacacctgg ctagtttttg tacttttagt agatgggatt tcaccatgtt 5280

ggccaggcta gtcttgaact cctgacctcc ggtgatctgc ctgcctcggc ctcccaaagt 5340

gttgggatta taggcgtgag ccactgcgcc ccgcaaaggt tcttttcttt gggatccttt 5400

cctgtcctta gagaagaccc tttagctttc tgcctgagga gctgatgcct agttgtcagg 5460

ctttcttctt gcccagataa gggtgttaac tcctgtgtac agatgttcac ttaatccttt 5520

ttaccagtcc cacatctcac tatagcccta tgctacacct gggtttctcc atcccaagcc 5580

cctttagggt ctctagtgcc agtcttcttc ctcattggct atgtccccta ggttcttttt 5640

tatttttccc aacggtgatg cacttactga gcagatgcag taatcttctt acctgagcct 5700

acatataacc attggcctaa atgtatgatg gtttgccagc atcagcaata agactggtaa 5760

tggggtaaaa aacaagttct cttaaggcta gctcttgatc ccctgttgta agctgaccaa 5820

cttaatctga aaataatttg cagcatgtaa atattttagg attagagcca tctgtataca 5880

cacttaaaag tagttttgct accattacat tagtctaaaa gagttaccta agaatgccaa 5940

acgatatttt gttcgaatgc cttggttatt ttaatttaaa agcatttctt tcaaaaccgc 6000

ttctctcttc acaatagtag agctgtggca gtgaactaag aggtcaagga ttcagtgaat 6060

ctgtggctaa tttcttgttc caatctgaga gctctctttg cactatgatc aaaatggagt 6120

cttgccaact gcccagggta atagccttgc aagtctcttc cttgttgagc aatgaatata 6180

agttccacat ggctggggag gcctcacaat catggcagaa ggtgaaagag gagcaaaggc 6240

atgtcttaca tggtggcagg caagcctctt ctcattatac ttttaaaatt atttggtggc 6300

tgggtgcagt ggctcatgcc tgtaatccca gcactttggg aggccaaggt gggtggatca 6360

cttgaggtca gaagttcaag accagcttgg ccaacatggt gaaaccttgc ctgtactaaa 6420

aatacaaaaa ttagcagggt catggtggca cgcacctgta attctagcta cttgggaagc 6480

tgaggaagaa ttgtttggac ccagaggtaa aggttgcagt gagccaggat cgtgtcacag 6540

cactccagcc tgggtgaccg aacaagactc tcaaaacaaa caaacaaaaa ttatttggtg 6600

attttttttt tgagacggag tctccttgtc actcaagctg gaatgcaacg gcgtggtctc 6660

tgctcaccgc aacctttgcc tcccggttca agcgattctt ctgtctcagc ttaccaagta 6720

gctgggacta caggcatgtg ccaccacacc cggctaattt ttgtattttt tgtagagata 6780

gggtttcacc atgttggcca ggctggtctt gaactcctga cctcaagtga tctgcccacc 6840

ttggcatccc caagtgctgg gattgcaggt gtgagccaac gtgcctggcc cattttaacc 6900

atttttaagt gtactattta gtgacattaa atgtattcac attgttatgc aaccatcatc 6960

actatccatt tccagaatgt tttcattatt ctacatagaa actatcgatc caggagccat 7020

atgtagaaag ctgaaactgg atcccttcct tacaccttat acaaaaatca attcaagatg 7080

gattaaagac ttaaatgtta gacctaaaac cataaaaacc ctagaagaaa acctaggcaa 7140

taccattcag gccataggca tgggcaagga cttcatgact aaaacaccaa aagcaatggc 7200

aacaaaagcc aaaattgaca aatgggatct aattaaacta aagagcttct acacagcaaa 7260

agaaactacc atcagactga acaggcaacc tacagagtgg gagaaaattt ttacaatcta 7320

cccatctgac aaagggctaa tatccagaat ctacaaagaa cttaaacaga tttacaagaa 7380

aaaaatcaaa caaccctatc aaaaagtggg tgaagcatat gaacagacac ttctcaaaag 7440

aagacattta tgcagccaac agacacatga aaaaatgctt gtcgtcactg gccatcagag 7500

aaatgcaaat caaaaccaca atgagatacc ctcacaccag ttagaatggg gatcattaaa 7560

aagtcaggaa acaacaggtg ctggagagga tgtggagaaa taggaaccct tttacactgt 7620

tggtgggact gtaaactagt tcaaccattg tggaagacag tgtggcgatt cctcaaggat 7680

ctagaactag aaataccatt tgacccagcc atcccattac tgggcatata cccaaaggat 7740

tataaatcat gctgctataa aggcacatgc acacgtatgt ttattacggc actattcaca 7800

atagcaaaga cttggaacca acccaaatgt ccatcaatga tagactggat taagaaaatg 7860

tggcacatat acaccatgga atactatgca gccataaaaa aaggtgagtt catgtccttt 7920

ataggtacat ggatgaagct ggaaaccatc attctgagca aactatcgca aggacagaaa 7980

accaaacacc gcatgttctc actcataggt gggaattgaa caatgagaac acctggacat 8040

gggaacatca ctcaccaggg cctgccgggg gatgggggga ggggggaggg atagcattag 8100

gagataaacc taatgtaaat gacgagttaa cgggtgcagc acaccaacat ggcacatgta 8160

tgcatatgta acaaacctgt atgttgtgca catgtaccca agggccagtg ggtgggaatt 8220

ggtatctcat tgtgatttca atttgtattt tctaaggaat attgatgttg agcaattttt 8280

catatgttga ttggccattt gtatatcttc ttttttgttg ttgtttgggt ttttttttct 8340

ttttcttttt cttgagacgg ggtcttcttg ctctgttgcc cagactgcag tggcgcaatc 8400

acagttgact gcagcctcaa gcctctggtc ccaagtgatc ctcccacctc agtcttccaa 8460

gtagctggga ctgcaggcat gtgcccccat gcctggctta tattcatatt ttttgtggag 8520

atggggtttc accatgttgc ctaggctggc cttgaactcc tgagctcaag tgacccatcc 8580

acctcagcct tccaaagtgg tgggattaca ggcatgagcc accccaccga gcctgtatat 8640

cttctttaga gaaatgttca ttcaagtcct tttctcactt tgagttatta attgttattt 8700

tgttgttatt gttgagttgt aggaattctt tacaaattct ggatattaaa cccttgttag 8760

atatatgatt tgtgaatagt ttctcccatt ctgttggtta gcatttcact ctctttattg 8820

tgtgatttgc acaattttta actttttttt ttttttcttt tttaagacag agtctccctc 8880

agtcacccag ggtggagtgc agtgctacag tgttggctca ttgcagcctc cacttcctgg 8940

actcaagcag tcctcccacc tcagcctctc aagtagctga aactacaggt gcacaccacc 9000

atgcctggct aatttttttt gtatttattt ttttttaaga tatggggtct tgccatgttg 9060

tccaggctgg tctcaaactt ctgagctcaa gcagtccgct tgccttggct tcccaaagtg 9120

ctaggattaa ggcgtgagcc accacgcccg gccaaaagtt tttaattttt atgaattcca 9180

gtttatcaat ttttttcttt tgttgcctat acttttcaat ccttgctaaa ctcagcatca 9240

tgaagatctt tttcttatat tttcttctaa gggctttaca gttttagctc ttcttttttc 9300

atttatttga tctattttga gttaattttt gtgtataaga gtccaacttc acttttgcgt 9360

gtaactatcc agttttccca gtagcatttg ttgaagagac tgtcctttcc ccagtgactg 9420

gtcatggcat ctttgtcaaa aatcagttga ttatatttgt gagagtttat ttttgggttc 9480

ttttttcttc ttcttttctt tttttcaggt tagatgggta gtgctgacat cataacaagg 9540

ttcaagaatg actcatctca catgtgtgtg aaacacccag gtatcatact gatgaactac 9600

agaagatctg ggctctctat tgttttatat gtctgacctt atgccagtac cacattgttc 9660

tgcttactgt agctttatag taagttttga aatcaggaag tgtgagtcct caacttagtt 9720

cttgtttttc aagtttgttt tggctattca gggttcccac ttttttcttt ggacaaagta 9780

atggggagaa tttctttctt tttttttttt tttttttttg gtttttaaga cagtctcact 9840

ctgttgtcag gctggagtgc agtgacgcaa tcttggctca ctgcaaactc cacctcctgg 9900

gttcaagcga ttctcctgcc tcagcctcct gagtagttga tattacaggc acctgccacc 9960

acgcccagct aatttttgta tttttagtag agacggggtt tcaccatgtt ggccaagatg 10020

gtctcgatct cttgacctca tgacccacct gccttggcct cccaaagtgg tgggattaca 10080

ggcgtgggcc actgcaccca gctttttttt ttttgttttt ttaaacaagt aaatggaaag 10140

aaatcccacg ttcatggatt ggaagacaat attctttttt tttttttgag acggagtctt 10200

gctctgtcac ctaggctgga atgcattggc gcagtcactg ctcactacag ccttgagctc 10260

ccaggctcaa gtgatcctcc cacctcagcc tgctaagtag gtgggactac aggaatgtac 10320

tactgtgcct ggctaattaa aaaatttttt gtagagatgg agtctcactg tgttgcccag 10380

gctggtcttg aggactccag ggctcaagca gtcctcccca cttgacctcc caaagtgctg 10440

ggtttacagg catgggccac cgtgcctggc cagctgttag aattttgata gggattgcat 10500

tgcattttga tatggattgc gtttgtagat agctttggat aacgttgtca tttaaagaat 10560

attgtcttcc cagcctggcc aacatggtga aaccctgtct ctactaacaa tacaaaaatt 10620

atccaggtgt ggtggcatac acctgtaatc ccagttactc aggaggctga tacaggagaa 10680

tcgcttgaac ctgggaggcg gagattgcag tgaaccgaga ttgtgccact gcactccagc 10740

ctgggtgaca gagcaagact ctgtctaaaa aaaagaaaaa aaaaaaagaa tatcatcttc 10800

caatccatga aagtgggaaa gtgggatttc tttcccttta ttttacgtct ttaatttgtt 10860

tcagcaatgt ttcagtttat gtcttttgtc tcccttgctt aaatttattc ctaagtattt 10920

tattcttttt gatgctatta taaatggaat gttttcctaa ttttgttttt agattgttca 10980

ctgtcagtga acaatagaaa tgcaactgat ttttgcatgt tcattttgca tcctacaact 11040

ttgttgaatt catttattag ctgtgtgtgt gtgtaatctt tagggttttc tacatgtaag 11100

atcatgtcat ctaggaacgg aaataatttt actacttcct gtccagttga gatgcctgga 11160

gagaaagggt aaatgaggca gtgagaaggt tcttgcttaa tttctctggc taaaactttt 11220

cagtactgga ttaaatagaa gtggcatcct tgtcttgttc ctgattttag gggaaaagct 11280

tttagtcttt caccatcaag tgtgatgtaa gctgtgagat tttcatatat acccctttat 11340

tatgttgagg atattgcctt ctattcctat ttcattgagt attttttaat caaaaagtta 11400

tcttgaattt tgttaaatgc tttttctgca tcagttggga tgatcattgt ttttctcctt 11460

cattctagta atgtggcata ttaccttaat tgatttttgt taaaccatcc ttgcactttg 11520

ggaataaatt ccacttgtca tctgagatgt atgtttaata tctactttaa aaaaaaaaac 11580

acaaatcagt cccagcctgg gcaacatagt gagaccctca tctctacaaa aaataaaaaa 11640

agcctggtgc agtggctcac gcctgtaatc ccagcacttt gagaggccga ggcaggcgga 11700

tcacctgaga tcaggagttc aagaccagcc tgactaacat ggtgaaaccc cgtctctact 11760

aaaaatagaa aaattagcca ggcttagtgg gaagcgcctg taatcccagc tactcaggag 11820

gctaaggcag gagaattgct tgaacctggg aggcggaggt tgcagtgagc tgagatcatg 11880

ccactgtact ccagcctggg tgacagagcg agactctgtc tcaaataaat aaatattaaa 11940

aaataaaata aaataaatta gccagatgtg gtggctcatg cctgtagtcc cagcagtgtg 12000

agaggctgag atgggaggat cacttgggag gttgagaccg cagtgagcca cgattgtaca 12060

actgtatcca gcctgggtga cagagcaaga ccctatctca aaaataaaac aaaaaaccaa 12120

aaaacttaga agtcaacaga tgcttattga attcttccta ggtgtcagac actgttaaag 12180

ttctggggat tcagcagtga acaaggctaa gcccctgttt tcttttaatt tttaatttta 12240

gttttttttt tagggacagt ctcactttgt cacttaggct gccaggctcg agtgcagtca 12300

tgcattctca gctcactgca acctctgact cctgggttca agttattctc gtgcctcagt 12360

ttcccatgta gctgggatta caggcactac cacacccagc taatttttgt atttttagta 12420

gacacaaggt ttcactatgt tggccaggct ggtctcaaac tcctgacctc aagtgatccg 12480

cctgcctctg cctcccaaag tgctgggatt acaggcacga gccaccgcac cccggcccac 12540

tggagtgttt tgagcagggt agtgacatta gtgatttgtg ctttagaaag atttatcgag 12600

gatggaatga ggcaggaatg aatagaggca ttcctgctgt ccccatggtc agtgatggga 12660

gagtagccag ggagatgatg attgttggtc aggttgggga tctgacttgg aggtaaaact 12720

gttgtaacca gctgtttcag atgtgggctt gttgtaggat gtttcctaaa ctttccgccg 12780

gaggaataaa cagggtagct agtggtataa ttaactgaga tggctgggaa agaacagcta 12840

ctgtggggaa atcaagaatt ctgtttttgg tcttgttaga tttgaagtgc ttattaggca 12900

tttgagtgga gataccaagt ggaaatagtg taaataagga gcttagggga gaggcttgag 12960

aggtgtgtat gtaagagaca tcagcaaaca gatgagaatt ggagccagga gtcaggctga 13020

gaagccctgg ggagaaaggg tagatgagga aagcaggcca ggaacaaagc ctatggggaa 13080

gcaggaaggg aggctgagaa gcacaacctt ctaggacatc agtagggaca tgatgtcact 13140

cacaactagg aaataagtag gtgttttcct ttctttcttt cttttttttt tttttttttt 13200

ttgagacgga gtttcgctct tattgcccag tctggggtgc aatggcgcga tcttggctca 13260

ctgcaacctc cgcctctcag gttcaagcga ttctcctgcc tcagcctcct gagtagctgg 13320

gattacaggc atgtgccacc acgcccggct aattttttgt atttttagta gagacggggt 13380

ttcaccgtgt tagccaggat ggttgtaggc gtttctcatt tcagcatagt gtctttatgg 13440

tcagcccttt cagtggctgc ctctgatggt gtttgatcat aagtcataac tcatccatga 13500

aggtgtttta cagtctgtct tcaagcaggc aggtccttag attgaaagaa tggaggcttc 13560

actgcgtgtg cctttactac acagatagcc gatggggcag aggttgtata gctgatgggg 13620

cagaggctgt cagatgactg ttttacagaa aaacctttga caagttatat agtaaacttg 13680

ttaaaagaaa aagttgatct cctagctaag acaaaaggtt tcagtttagg aagataaaaa 13740

agatggatgg tggtgatggc tgcacaacaa tatgaatgta cttaatacca ctgaactgta 13800

cacttaaaag gggttaaaat gatgtttatg ttaataattt ttttttacca caaaacgaag 13860

tagaatactt tgtcactgat tatagtaaac atttaaatct gaatgctaga ttgctttttt 13920

ttgagatgga gtctcactct gtcgcccagg ctggagtaca gcagtgtgat ctcagctcac 13980

tgcaaccttt gcctcctggg tttaagtgat tctcctgtct cagcctccca agtagctggg 14040

attataggtg cctgtcacca tgctcggcta atttttgtat ttttagtaga gatagggttt 14100

caccgtgttg ctcacgctgg tctcaaactc ctgacctgaa gtgatctgtt tgcctcggcc 14160

tccgagagtc ctaggattat aagagtgagc caccgtgccc ggcctagact gctcttacat 14220

aggttaaaac acattatttt gttgggaggt gctggggaat caactctgtc atggaaatgt 14280

tccccgggct gggagttgga accagagtgt tgattgttgt catttgctac atgacctggg 14340

tcatctggca tgaccttccc taagcctcag tttcttcctt accaatagga tattgtgctg 14400

gaggatccca tctctcctag ctctgaaatc tggtagcttt ctgttccttt gtctctataa 14460

atgtctggaa ggcaagcaag ttccagtctg agaagtgact gtgaacattt ggaagaattg 14520

tgtggtccca gtgcatatca cagtccacag ttgtcctgtt agctggaaag ttttacttag 14580

taccagatta tagatatgaa aaagaagcaa ttaaaactta cagcaggcct tacaatttga 14640

gacagaaaca aaatctttgt tttttagact ttgaccaaat atttgggaat gagcaccatg 14700

tagatgtgat ttgtttatct gtgaggcttc acacattgtg acttgacaag aacccatagc 14760

acttaggttt gtgagcccag agtaccaccc tttgccttga agagtgtgga gggagtctta 14820

gggccagcgg tgagcaggat gaaaggttct tagaagctgg tgggcatgga gggggtacag 14880

aggggaggct ctcctgggag ataaggtggt ggaaggggcc ggtgaagtct ggtgtgctgg 14940

agagagctct aggggctcct ggaccctcac cccaaggaaa aggggcccag gtgagcctca 15000

tctcttggct ttcttctttg ccacatttct cctcacaaac tcctcccctc tttgcactgt 15060

ttggaaccct cttccatgca acgtttatat taagagttct tgctgggcgc agtggctcac 15120

gcctgtaatc ccagcacttt gggaggtcga ggcgggtgga tcacgaggtc aggagttcaa 15180

gaccagcctg gccaggatgg tgaaacccca tatctactaa aaataagaaa attagctggg 15240

cacagtggca ggcacctgta atcccagcta cttgggaggc tgaggcagga gaatcgcttg 15300

aacctggggg cgggggcaga ggttgcagtg agccgagatt gtgccactgc acttcagcct 15360

gggggacaga gtgagactct gtctcaaaaa gacaacaaca acaaaaaacc aaaaaacagt 15420

tcttgaagtg ttgtgggaag tcagggaccc cgaacggagg gactggctgg agccgcggca 15480

gaggaacata aatggtgaag atttcatttt aatatggaca tatatcagtt cccaaaatta 15540

atacttttat aatttcttac acctgtcttt acttcaatct ctgaacataa atcgttaata 15600

tttcctttta atatggacat ttatcagttc ccaaaattaa tactttataa tttcttatgc 15660

ttgtcttact ttaatctctt aatcctgtta tcttcgtaag ctgaggatgt acgtcacctc 15720

aggaccacta ttgtgttagc tgtacaaatt gattgtaaaa cgtgtgtttg aacaatatga 15780

aatcagtgca tcttgaaaac agaataacag ctattttagg gaacaaggga agacaaccat 15840

aaggtctgac tgcctgtggg gtctggcaga atagagccat atttttcttc ttgcagagag 15900

cctataaatg gacatgcaag tagggaagat atcgctaaat tcttttccta gcaaggaata 15960

ttaataatta agaccctggg aaaggaatgc attcctggtg ggaggtctat aaatggccgc 16020

tctgggagtg tctgtcttat gcggttgaga taaggactga aatacgccct ggtctcctgc 16080

agtaccctca ggcttactag gattgggaaa ctccgccctg gtaaatttga ggtcagaccg 16140

gttctctgct cttgaaccct attttctgtt gtttaagatg tttatcaaga caatacgtgc 16200

acagctgaac atagaccctt atcagtagtt ctgaatttgc ctttgtcctg tttcctcaga 16260

agcatgtgat ctttgttctc ctttttgccc tttgaagcat gtgatcttgt gacctactcc 16320

ctgttcttgc accccctccc cttttgaaat ccttaataaa acttgctggt tttgcagctc 16380

gggtgggtat cacggtccta ctcatatgtg atgtcacccc tggaggccca gctgtaaaat 16440

tcctctcttt gtactgtttc tctttatttc tcagccggcc gacacttacg gaaaatagaa 16500

agaacctatg ttgaaatatt gggggtgggt tcccctaata ttgaagtagt aacgcaacga 16560

gactcgtcac atctcccatt ttgggatttg attgtataaa actgtcaaga gctttgatgc 16620

cctccagcaa agcacgcttc ttgcaggaaa tcaggcaaag ggtgtttagc ctgtgtggcc 16680

tgatatgctc atgtgtagct ggtggcagga ggctggtcct ggctgtgctc ctacaagtac 16740

ctgctggagt ggaggctgag gacactctgt ccatgggcca agacattgtg tgaaatgaca 16800

aggctgcccc catgggctct caagttgttt ctagctttaa aacagattct tggctgggta 16860

cggtggctca cacctgtaat cccagtactt tgggaggcca aggcgggcag atcacctgag 16920

gtcaggagtt tgaaaccagc ctgaccaaca tggtgaaacc ccatctctac tgaaaataaa 16980

aaattagcca ggcatggtgg cacatacctg taatcccagc tacttgcgag gctgaggcaa 17040

gagaatcgct tgaacccagg aggctgaggt tgcagtgagc cgagatcacg ccgttgcacg 17100

tcagcctggg caacaagagc aaaactctgt ctcaaataaa gaaataaata aaaataaaac 17160

tgattcttag cagcagcagt tcagtccctt tgttagtcat tcctgaccag gtcaagaggg 17220

agtaagaatg taggtaactg gcattgtgga agaaaatctt taataggttt gttggtgttc 17280

tattgtaaag agggttgaca ttatgcacgt ggttatttgt gacaaccatt acaaccaact 17340

aatataattt ggtcttactt caatttgggt gttgctgtgc catcccaaca gttactctaa 17400

aatgtgccag tactcatctt cttgaatatg tgtgttttta ggctttaaat tctctgaaat 17460

cagctttcgt tcattaactg aaattccttt attttttcaa tactatttaa ttattattat 17520

ttttttgaga cagagttttg cccctgttgc ccaggctgga gtgcagtggt gcaatctcag 17580

ctcactgcaa cctctgcctc cagggttcaa gcgattctcc tgcctcagcc tcctgagtag 17640

ctggaattac agacgcatgc caccacaccc agctaatttt tgtttttgag tagagacggg 17700

gtttcactgt gttggccagc tggtcttgaa ctcctgacct cgtgatccac ccgccttggc 17760

ctcccaaagt gctgggatta caggcatgag ccactgcgcc tggccacgcc ctgctaattt 17820

ttgtattttt agtagagacg gggtttcacc atgttgccca ggctggtctt gaactccaga 17880

cctcaggtga tctgcccacc tcagcctccc aaagttctgg gattacaggc gtgagccacc 17940

gtgcccgacc ttttttcaat actattaact tgatctgctg aaaattctcc caggttactg 18000

gctaattttg aagcttagag aagcaatttt ctttttattt atttattttg agacggagtc 18060

tcgctccatt gcccaggctg gagtgcagtg gcgccatctc agctcactgc aagctccgcc 18120

tcccgggttc atgccattct cctgcctcag cctcctgagt agctgggact acaggcaccc 18180

gccaccaggc ccagctaatt ttttgtattt ttagtagaga cggggtttca ctatgttagc 18240

caggatggtc tcgatctcct gacctcgtga cccacccacc tcggcctccc aaagtgctgg 18300

gattatagac gtgagccacc gtgcccggcc cagagaagta attttctgcc cttagcattg 18360

gtccgcttga caactttcag aaaaacatta tcccaaaggg atgaattgtt tgcaccagtg 18420

gactagttta gctcagtgag cagacctata gtgactttct gctcagcacc aggtgaggtg 18480

ctgggtgctc tagggaacac aaggtgattc agttattccc ttctcctgaa ggggaacgca 18540

gtcaatccag gaggctgaga gagtcagaat gagcaaggtg gaagttcaca gttagagaag 18600

ctcagagaag agggctgctg cttccacagg aaactttgct cattattttt taatttcagc 18660

ttttcaatgt agaaatacat ttacatgaca caaaattgga aaggtaaact acatgggaaa 18720

gtttcccttc catcttgcac ctggctacca gatcctctcc ccagaggctg ctggtgctgc 18780

cacttctcat gtgtccattc ccaggtgttt tgtgcattta tagacaaata agcagagact 18840

tctgttctct tacatgaaag taggacactg ctcccttgct tttttctctg aatgtttctt 18900

tatgatagtt tatcattaat ttttgtattt ttagtagaga cagggtttca ccatgttggc 18960

caggctggtc tgaactcctg acctcaggtg atccacccgc ctcagcctcc caaagtgctg 19020

ggattgtagg tgtgagccat tgtgcctagc tgggctttgg tatttttaaa ttgattttgt 19080

caaaattgct tatatacgcg ggaatttagc accttgtcag cgatatgaat tgcagttgta 19140

tttttccaga tcttatttat cttttttttt tgagacggag tctcgctttg ttgcccagac 19200

tagagtacag tggcacgatc tcacacgatc tcggatgatc tcggctcact gcaacctccg 19260

cctcccaggt tcaagtgatt ctcctgtctc agcctcctga gtagctgaga ctacaggcgt 19320

gtaccaccac actggctaat ttttgtattt ttagtagaga cagggttttg ccatattggt 19380

cagactggtc tcaaactcct gacctcaggt gatccacctg tctcggcctc ccaaagtgct 19440

gggattacag gcatgagcca ctgcacctgg cctaaagtaa tttttatatt tcatatttta 19500

cctttaaatc ttttctctat ttggaattta tttttatttt ttatttttat gttgaggcag 19560

ggtcttattc tgttgcccat actggagcac agtagtgtga tcatggctca ctacagcctg 19620

gaccttgcca ggctcaggta atccacccgc ttcagcctcc tgaatagctg ggactacagg 19680

tgtgcatcac catgcccagc taatttttgt acttttggta gagaagggtt ttgccatgtt 19740

gcccaggctg gtcttgaact cctgggttca agtgatctgt ctgccttgac ttcccaaagt 19800

gctgggattg taggcctgag ccactgtgct ttttggaatt tattttgatg tgaagtgtta 19860

gatccagctt aatttttttc cgtggctacc catttgttgc aacacctttt gttgcgcaat 19920

taatctttct cctacttgtt tatcatttac tgtatatagt atactttgcc atatgtgtac 19980

attttggtct attcctggac attctgttct gttacattaa tctgtgtatt tatgtgttag 20040

gaccacactg ttttaattac tctagcatgt tttgttattt ggtgaagtta gttccctttc 20100

atcatcttta ttttccagaa ctttcttggt tatatttgtt tttctgtata aacttgaagt 20160

ttgtttagtt aaagaagtcc tgtttttatt gggactgtta catttctaga tgaatgtagg 20220

aagagtgaca ctttggttac gttatattga cttttcctca ttaagaatgt ggcatgtttt 20280

tctttttgtt gaagtcatct tttctgtctt tcggagtttc agagatttct tttggtttct 20340

tttttttttt tttttttttt tgaggtggag tcttgctctg tcacccaggc tggagtgcag 20400

tggtgcaatc ccggctcact gcaacctcca cctcccaggt tcaagtgatt ctcctgcctc 20460

agtttcctga gtagctagga ttacaggaac gtgccacaat gcccagctaa tttttgtatt 20520

tttagtagag acggggtttc accatgttgg ctaggctggt ctttaactcc tgacttcagg 20580

tgatctgccc atctcggcct cccaagttgc tgagattaca ggcgtgagcc actgtgtcct 20640

gctgggagtt tcagagattt cttacatttc tttttaagtt tattttcaag tttttggttt 20700

tgttatttat tttagtgtta atgaatcatt attataatca atattatcat tattttactt 20760

ctgcctgctt gttgttgatg tatgtgaagg cattgatata tattagtttt cactacctta 20820

tggtgattct tttatcaact gtaaaaggtt ttcagttgat tatatatata tatatatata 20880

tatatatata tatgtaattt ttttgtatat atatttggat tttgtacata atatcatttg 20940

caaataatga taatttaact ttttcctttc cagttgtata cctatgtttt ctttgtcttg 21000

actgattgtg ataactagta gttccacaat agtaataaat aatgatggtt aaatgcatag 21060

cctgtatggc ccctgacgtt agtgagaaca cttctagtgt gttcccattg ggcttgattt 21120

tagctttgag attgagaaag atgtaaacat ttagttgaag tctgtattta ttttttatat 21180

atatatgtgt atttttttta ttattatttt ttgagacaga gtctctgtca tctgggctgg 21240

agtgcagtgg cacaatcttg gctcactgta acttctgcct cctgggttca agcgattctc 21300

ctgcgttcaa gcgattctcc tgcctcagcc acccaaatag ttgggattac aggtgcccgc 21360

caccatgcct gactaatttt tgtatttttt agtggagacg ggggtttcac cttgttggcc 21420

aggctggtct cgaactcctg acctcaaacg atccaccagc cttggtctcc caaagtgcta 21480

ggattacagg tgtgagccac cgtgcctggc ctaatatgta tgtatttatg tatgtatgta 21540

aatcaacgta cacatatcta ctaagcatct gtctattctt ttttttttgt gacggagtct 21600

cactctttcg cccagatggg agtgcagtgg cgtgatctct gctcactgca ggctccgtcc 21660

cccggggttc acaccattct cctgcctcag cctcccgagt agctgggact acaggtgccc 21720

gccacctcgc ccggctaatt ttttgtattt ttagtagaga cagggtttca ctgtgttagc 21780

caggatggtc tcaatctcct gaccttgtga tccgcccgcc tcggccaccc aaagtgctgg 21840

gattacaggc atgagccacc gcacccggcc tgtctattct tatcttaaaa ggatgagggt 21900

tgaattttat cagatgtctt cagcattggc agagatgatc tctgttaata tgttgaacat 21960

aacattgttt taacattagt acttacatgt ttctggtaca aaatgaatag gatgatgttt 22020

agagaaggct tatggaggaa atagcatttt atctagtgcc tgaaggctga atggagaaaa 22080

ttagaggtgg gaaattagag tgggaagata ggaaaagggc attcagtaaa gagagagcct 22140

tgactgcaaa ggtgtggaaa gtgggaatgt aggttatttt ggggaagaat gccagcatcc 22200

caacattact gtgatattca tgagggcctt ctagatgggt aacatggggg cgtattacac 22260

ctctggactt cagattcttc ctttgtggaa ctgaaatagt aaaagtagtt attagtttaa 22320

gggttgttac aaggattcag gagataatgt aggcaaaagt cttaggccag aggctgacac 22380

atggtttata aatactagtt atttttattt gacaagagaa taaagctgga aagaggtttc 22440

agtatatttt gagtgtacct gtataataag caaagaagta tggcctcaga tatgcaggca 22500

ctggagagcc attcagaact tttgtgcaag gggtgacata agcaggtctt ttttttttcc 22560

attaaaaatt ttttttaaag agatggggtc tcactatgtt gcccagactg gtctcgaact 22620

tctgggctca agcaatcctc ccatctcagc ctcccaaagt gccgggatta caggtgtgag 22680

ccactgtgcc tggccataag caggtcttta ttttaggaag ctgtccatgc tgaccatgtg 22740

ggaagacaaa ccagaagtga agtgcaaatg caggtagcaa aatcaggtag gagactatta 22800

gaatttttca ggctggtggt tttggatatc tatcactagt ccagttcatt ttttattttt 22860

tgagataggc cttgctcttc tgcccaggct agagtgcagt ggcggaatca cagcttactg 22920

tagccttgac ctcctgggct caagcagtcc ttcccactca ggcttccaag tagccaggac 22980

tacagtcatg agccaccaca attggctaat ttaaattttt tttttttttg tagagacagg 23040

atctctgtat gttgcccagg ctggtcttga actttcctgg cctcaagcag tcttcctgcc 23100

tcagtgtccc aaactgctgg gattacagac attagttagc tacgatgcct gccctgctcg 23160

tccagtttag acatatgttc aagatgtggg caccatagag ttgacttagg caactcttgg 23220

gctccaggtt tggtagggca gtgtttctca aatttgagca tatcactgtc agctggaggg 23280

tgtgttaaat agagatttct gggcctcacc gccagatttt ctgattcacc aggtctggga 23340

taggcccaat aatttgcatt tctaacaagg atttagattg ggacatttgt gaagaacagg 23400

atggatgaag tgttccttgt ttatgatttc attcagagag aggggattat tagctctctt 23460

tcttccagaa tgcctgaggt gctttgtatc acagttagaa gttgagaaga tatgtactga 23520

gcactgtcct aataatatct gatcctggtt gggttggttg gtttgttcat cacttattca 23580

acaagtggtt tgttttcaga gacagggtct cactgtgttg cccaggctgg catcaaactc 23640

ctgggctcaa gggattgtcc cacctcagtc tcctgagtag ccgggattat aggtgcattt 23700

aataaaaatt taacatgcca agtgctatta aagaccctga agaacagaca gggagtttat 23760

ttatagtctt gacagaggac agatagtaaa ccagggaata agtcatttgt acaattacag 23820

agttttaaat gcactgaaaa agaagaaata ggctctgtaa ggaacaataa agagaactac 23880

tggaaaatat atggtcaagg gaggtctttt tgtagaagtg atatttcagc tgagacttga 23940

agaatgaaaa ggaaccagcc tataaagaga agagggaata gaggatggaa cagtatgtgc 24000

caggcccctg agatgggaat gaggttggca cacataaggc attggaagaa accagaacag 24060

ggagaggtga cacgaagtga agttgcagag gaccggggtg ggttgtgcag agccctgaga 24120

gctaggggga ggcatttggg ctttgttcta agtgcagaag ggtatccagc tcacagcatt 24180

agtagaatct gtgtccactc tgacctctga gataaagtga attgtaaagg gataggtagg 24240

aaggggtcta tgagggccag gcatggtggg tggctcagcc tgtaatccca actctttggg 24300

aggctgaggc aggaggattg ctggagtcta agagtttaag accagcctgg gcaacatggt 24360

aaaaccccat ctctattaaa aatacaaaca tttcgttggg tgtggtggtg cacgcctata 24420

gtcctagcta cttgggaggc tgaagtggga gaattgattg agcctgggag gtggaggctg 24480

cagtgagcca tgatcgtgcc actgcactcc agcctgggtg acagagtgag accctgtctc 24540

aaaaaaaaaa aaaaaaaaaa aggcattcca ggactgtttg aatatttgaa tataaacatg 24600

tatattttta cttttataat tgaaaaatag tcagcattgg ggctcataaa ggggaccttt 24660

ggggtaatgt tctgtttctt gatggaatgg tgtttaggtt acatggcttt gtttacttgg 24720

tggtaattca tggagctgtg tgcttataat ttgtgtgctt ttctgtgata tgttatacta 24780

aacttcaaaa gtttatttaa aatagtcttg cacggtggct catgtctgta atcccaacac 24840

tttgggaggc tgaggcagga ggattgcttg aaaccaggag ttcaagacca acctgggcaa 24900

catattgaga ccctgtctcc ccacaacatt tttttttttt aattagctgg ccatggtggc 24960

acatgcctgt aatcctagct acacgggaag ctgagctggg aggactgcgt ccaggaattc 25020

aaggctacag taagacatga tagtgccact gtaccccagc ctgggtgaca gagtgagacc 25080

ccatctctaa aaaaagaaaa ataaataaat gcttatagtg aaaaatgtaa agatactgag 25140

atttgagttt aaaaatttct ctgctgggtg tggtggctca cacctataat cagtttggga 25200

aattgaggca ggaggattgc ttgagcccag gagtttgaga ccagcctggg caacgtggca 25260

aaaccctgtc tctactaaaa ttaccaaaaa ttatctctca tggtggtacg tgcctatagg 25320

caggctaaag tgggaggatc acctgagcct gggagattga ggctgcagtg agctgtgatc 25380

ctgccactgc attccagcct gggtgacaga gtgagactct gtctcaagga aaaaaaaaaa 25440

aaaaccctgc atataatcac attacacaaa gacaagcaac cactactaac gtttccctct 25500

attctccttt tgtgcacttt ttgtatataa tttttatttt ttcaaattgt aaaagtaatg 25560

tgtgcttttt gtagaaaact ttactacatg cttctcacaa tgaaatgatg tgattgacag 25620

aaaaatgcca gtaggcgtag tgtgaaaagt ttccttaggg ccaggagcag tggctcacac 25680

ctgtaatccc agcactttgg gaggctgagg caggcagatt cattgaggtc aggaattgga 25740

gaccagcctg gccaacatgg tgaaaccccg tttctaccaa aaatataaaa attagctggg 25800

tggggtggcg cacgcctgta actccagcta cttgggaggc tgaggcacaa gaattgcttg 25860

agcccaggag gcggaggttg cggtgagccg agatcacgcc actgcactcc agcctgggtg 25920

acagagcaag actccatctc aaaaaaagaa aaaaaagttt ctttgaaggc aaagaatcct 25980

gaaatgtagg aagattatca cattaaaaaa atttaagagt tctgatgtga taaagatgga 26040

gtaaacatac tccacccttt atgtctgaag agagcaactg aaatccctgg acagaatgca 26100

tggatcagtg gagtaacccc agaaagataa atgttagcat gcgaattgga gaaggaaacc 26160

agaactccaa ataccagtga actggtagtg agtttcccat aatttttttt cctccataca 26220

atattttcca gcctgcactt aaagtcagcc ccaaacctgg aaatgtgtgc tggatgtgca 26280

cagaaagagg tctaacagaa gccatctttc tagtttgagg agcaggaaag gggatcctca 26340

tgggtcagga atggggatgg aggaagaaat ctcgtgtgtt gtttgctttg tcttttctcc 26400

ttttctcttg ctctggccct ccacgtaatt gtgtagtggt ggagacagca gtgacattgg 26460

caaatggata ggagaggaag tcttctattt aaagggactg tggtcccagg agcatggagg 26520

gaatccttga ttttgttctt tcctttctct cattgctttt ccttggaggt agtcacagtt 26580

gtgggaggta ctcagcaggt tagggaaatt aaacccctga cttttagcca gaagaccagg 26640

aaaggggccc ttgggatctg gaaagtgtta ggaagattgt gtagaggaag gagctcaaca 26700

aattgaactc ataaagttgc atatgaactc ttgggctgtt cctcagaact aacatacgtg 26760

catctgaccc taaacagcat accaaaggct ttgaggacca aactgtggag tacattactg 26820

ctcaagtagt tctgcactgg cccctggacg gtatgcttgg gaaaaatcaa aataatactt 26880

aaaaggcttt gaaaactgat atcatattgg taccacagcc cacagaaggt gggtaggaac 26940

ttgtggactg gacctaatta ggttgattgc tgcaaagaca aattcaaaat tttacgtggg 27000

acttaaacaa gagctagagt cacatagcat aatattcaaa atgtccagta attcagaatt 27060

acttcagcta tgaaaaatca ggaaaatcat aaggggaaaa gacagccaac agatggcaac 27120

cacaacatga cacagatgtt gaaattatca aaaaattaaa agccaaagta taattaaagt 27180

attaattaaa accttgctat aacaagtaag ggtgaatgct cttgaaatga acagaaaatc 27240

agaaatttat ttactgcaaa atatgacaac ctaaatgaaa aattaattgg gtgggctcaa 27300

tagcagaatg gagaagacag aagagtcagt gaacatgaag gtagaataat agaaattatc 27360

cagtctgacc aacagagatc gaaataaaat gaaaaaaaaa aatgaacaga gcttcaggga 27420

cccatgggac aataacagaa agtttatctt ttatgttttt gaagtctcaa aaagagagga 27480

gaaagagtgg tgcagaaaaa aatttgaaga aattatggaa aggaataaat atgtttctgt 27540

tcacagataa catgataagt ctacgtagaa atttccaaag aatccacaca cacacacaca 27600

tgcagaaaga ctctggcact aataagtgat ttcaggacag ttgcaggata aaagattaac 27660

ataaaaaaat caatgtacta gcaatgaaca tgtgaaaatc aaaattgaaa acatagttgc 27720

taaaaagtga aatggtaggt ataaatctaa caaaacatgt acagtcatgt atgctgaaaa 27780

ctatacaatg ctgatgaaag aaatcaaaga tctaagtaga tggaaaaata taccatgttc 27840

atggattgga agactcaaca tgccagttct ttgcaaattt gataaacagg tttaatgcag 27900

tttctatcaa aattctatca agtttttttt tttttttttt tttttttttt tttgagacgg 27960

agtctccctc ttgcccaggc tggagtgcag tggcactatc tcagcttact gcaacctctg 28020

cctcctgggt tcaagcgatt ctcctgcctc agcctccaga atagctggga ttacaggcac 28080

acgccaccat gcccggctat tttgtatttt tcatagagac ggggtttcac tgtgttggcc 28140

aggctggtct tgaactcctg acctcaggag atctgcctgc cctggcctcc caaagtgctg 28200

ggattacagg catgaaccac cacacctggc ctttttttct tttttctttt cttttctttt 28260

tttttttgag tcagagtctc gctgtattgc ccaggctgga gtgcaatggc acagtctttg 28320

gctcactgtg gcctccgcct cccgggttta agcaattctc ctgtctccgc ctcccaagta 28380

gctggtatta caggcactcg ccaccacacc cagccaattt tggtattttt agtagagaag 28440

aggtttcacc atattggcta ggctggtctt gaacttctga ccttgtaatc cgcccacctt 28500

tgcctcacca agttctagga ttacaggcgt gagccaccgc gcctggcctt tttctccttt 28560

tttgagacgg agtcacagtc tgtcacctag gctggagtgc agtggcgtga tcttggcttg 28620

ctcaacctct gctttctggg ttcaggtgat tctcagcgta ccaagtagct gggattacaa 28680

gtgtgtgcca ccacacccag ctaatttttt ctgtttttag tagagaaggg gcttcactgt 28740

gttagccagg tctcacactc ctggcctcaa gcgatccgcc cacctcggtc tcccaaagtg 28800

ctgggactat aggcgtgagc cactgtgcct ggtccagaca actgcttttt gacaaagatg 28860

ccaagcaatt caatggagga aggatagtct tttcaccaaa tggtgctgga acaattggct 28920

atctttagac caaaggggaa aaaaaggaat ttatatctca caccttatct aaaaattaac 28980

tcaaatggat cacagatttt tatttttatt ttttgacaca gtctcgctct gttgcccagg 29040

ctagagtgca atggtgtggt catagctcat tgcagcctca aactctttgg ctcaagtgat 29100

cctcccactt cagcctccca agtagctagg actacaggca tgtgccaccc tgccctgcta 29160

attgttaatg tttttttttt tgtaaagaca cggtctcaca gtgtccaggc tggtctcaaa 29220

ctcctggttt caagtgattt cccacctcag cctcccaaag tgttgggatt acaggcatga 29280

gtcactgcac ccagctggat tacagactta aacaaatgtg aaactacaaa tttttaggag 29340

aagacattgg ggaaaattac cttatgacca agcaattcca ctcctaagaa tgaatatact 29400

caaaagaaaa caaaaagaaa aaaaatacaa aaaccccaac tgaagaacaa caacaacaaa 29460

aaaagtaaac ataagaattg aggggggcca ggcacggtgg ctcacgcctg taatcccagc 29520

cctttgggag gcgaaggagg gcagatcatg aggtcagtag ttcaagacaa gcctggccaa 29580

catagtgaaa cttcgtctct actaaaaata aaaaattagc cgggtgtggt ggtgagtgcc 29640

tgtagtccca gctacttggt aggctgaggc aggagaatca cttgaaccca ggaggtggag 29700

gttgcagtaa gctgagactg tgccactgca ctccagcctg ggcgacagag cgagactcca 29760

tctcaaaaaa aaaaaaaaag gttggccagg tgcagtggcc atgcctgtaa tctcagcact 29820

ttgggaggct gaggcggtca gatcacgagg tcaagagatt gagaccatcc tggccaagat 29880

ggtgaaaccc catctcttct aagaatgcaa aaattagctg ggcgtggtgg cgcgcatctg 29940

taattccagc tactcaggag gctgagacag gttaattgct tgaacccagg aggtggaggt 30000

tgcagtgagc tgagatcgca ccaccgcact ccagcctggt gacagagcaa gactctgtct 30060

caaaaaaaaa aaaaaaaaaa attgagacag ggtgtggtgg ctcacacctg taatcccagc 30120

actttgggag gccaggctgg caaatcatct aaggtcagga gttctagacc agtctggcca 30180

acatggtgaa accccatctc tactaaaaat acaaaaatta gccaagtgtg gtggtgtgca 30240

cctgtgctcc cagctacaag ggaggctgag gcacgaattg tttgaaccac cggaaggcgg 30300

agtttacagt gagctgagat cgcgctgctg cactccagcc tgggcgacaa agcaagattc 30360

cgtttcaaaa aaaaaagttg gagttcgaga ccaagtaaac aagaataatg tggcctggcg 30420

tggtggctca tgcctgtaat cccagcactt tgggaggccg aggcggtgga tcacctggtt 30480

aggagttcga gagcagcctg gccaacatga tgaaatccca tttctactaa aaatacgaaa 30540

aaatagctgg gcgtagtggc gggcacttgt aatcccagct actcaggaag ctgaggcaag 30600

agaatcgctt gaatctggga ggcagaggtt gcattgagtg gagattgtgc cacagcactc 30660

cagcctgggc aacaagagca aaactttatc tcaaaaaaaa aaaaaaaaaa aagaattgaa 30720

aacaggtatt caaacaaata caggaatgtt agaatgttca tcacagcact attcacaata 30780

ggcaaaacat agaaactgcc caaatgttta tcaactgatg aatggacaaa caaaatgtgg 30840

catacccatt tgatgaaata ttcagccata aaaagtaatg aagtggctgg gctcggtgcc 30900

tcatgcctgt aatcccagca ctttgggagg ctgaggctgg cggatcactt gaggtcagga 30960

gtttgagacc agcctggcca acatggtgaa acttggtctc tatcaaaaat acaaaaatta 31020

gccaggtgtg gtggcgggca cctgtaatcc cagctacttg ggaggctgag tcaggagaat 31080

agcttaaacc caggagacag agatttcatt gagccaagat tgtgccactg cactccagcc 31140

tgggcaaccc catctcaaaa aaaaaaaagt aatgaagtac tggccgggtg tggtggttcg 31200

tgcctgtaat cccagcactt tgagaggctg aggcagctgg atcatttgag cccaggagtt 31260

tgagaccagc ctggaaaaca taatgagaac ctgtctctac aaaaaaatac aaaaattagc 31320

agggcatggt ggtgcacacc tgtaatccca gctacttgga aaactaggtg ggagaatcac 31380

ttgaacctgg gaggcagagg ttgcagtgag ccaagagagt gcccactgca ctccagcctg 31440

gtcgatagag tgagattcta tgtcaaaaaa aataaagggt tcctggattg gaaacttgca 31500

tgtgcgctta acgcttctgc tttcggaaag gtagaacgag caataggcat tccttttggc 31560

ttttgagttg gctgtggtgt gactcctttt gcttcttgtt tctgatcttg acacttatga 31620

ggagtcatct ttgagtctgg gttttcatca gtgagtacag tcaagccaag aaatgtgtct 31680

gggcaggttc cctctagcac agaccgaaga aaacagcaac atggaacaag agaagtaggt 31740

ttaaacttgg attccatcag agggctcagt agggaagata attctagatc cctgggcctc 31800

ctagagtttt ctattctgat tttattggtt taatgttatt tgtttgaaag caccagaaat 31860

taactttggc caacataagc aaaaagataa tttattagaa gggtatagaa tagcttacaa 31920

aacggaaaaa aaagttgatg agccagtcct cagaaaggat gggagccaga acagcctggg 31980

gatcttggga gcaggaacct ctgtgggatg aataaacatc atgaatatcc aagttcctgt 32040

ttgtttgtgt ttagaagtca aagtccaggg agagaggccc aatttgtgta gcttgggtcg 32100

gcacggggca ccttgactca tagttaatcc aggttaaatc ctgtggagcg aggtggttcc 32160

cctgagccat accaggctgc tgttaactta tggaagggga cgggtactgg gcaggcagga 32220

acaggagctg ctctctgcct ttgcactccc aggaacaact ataggaccaa gagcagagag 32280

ttctaccaga gtgaattttg cttggtgacc attatgtcag agacctaagc tttttagcgt 32340

ttttatgttg agggctgacc tcgctagacc ttcttcacga gtgaatcact atttgtacaa 32400

cagtgtgttt tgaggaggcc atccctatgt aaagggtttc tctgtatccc tatgtaaagg 32460

acttttctca gtgggatttg tgcatagagg agggggggga agaatgcctg tttgacagag 32520

agcagctgaa ggtgacgtct gttacacagg catggtttcg tgtgccacac atgagaaaaa 32580

tgccctttgg ggagtggcct tttagcattg cctaatatag gagggaggga gttgggcggg 32640

gagggagaga gagagagaga gagagagaga gagagagagt gtgtgtgtgt gtgtgtgtgt 32700

gtgtgtgtgt gtgtgtgtgt gtattttggg attgaggtca ctagaccttg catataggca 32760

ttctgaaacc attccccagc cacataacta tcgcctccct ccagcagccc tagtgtgcag 32820

agccaagtac tctttgttaa ctggcttttc tcccttctta ccaggtacct gcacatgttg 32880

ttctttgtca gtgctgtcaa gtgtgtgcca gggtgatcca tggtcacttt ccgggatggc 32940

agcaaggtga cttcggctga ggatgaccct gactgaaagg ctgcgtgaga agatatctcg 33000

ggccttctac aaccatgggc tcctctgtgc atcctatccc atccccatca tcctcttcac 33060

agggttctgc atcttagcct gctggtatgt ttttgggttg ccttggatat ggtgggccag 33120

tgtcttagga cagtaggttt tctaacccta accactatgg agcccttggc ctctgtatgc 33180

tttttacaca atgggagctt gggctcctta taactgtgag tggagaactc tagtcctggc 33240

ctggttagct aatataataa aatagtcctg gctggccctg acctactgat tcaccagatt 33300

tattcatatc actggtactc tatctcaaaa taatgtttag atacttctaa gacactgaaa 33360

taattgaaag atatgatact tcagttttct ttctcaatag tagtggtttc gttttagtac 33420

ctggttaagt gcaagagcct tttttgtgtg ttgcgaggca aagtccatta gaacagtatc 33480

ttggacaacc tgtggcaggc taacctcaga gacttgcttc tttgctctct agtcattttc 33540

ttgtgttcac atggagcttg cttcagactt cttgttgatt cttgtggcca gctgcacttg 33600

ccaaggacag ttgtgagagc tgtagctgcc cttgttcctg tctgtctttc tcaaggcctc 33660

atagaagcct gaaggctatg gctgacaatg acgtcgtaaa ggaggagttt gatatgagat 33720

gacatctgat gaccctttta actctaaaat gctgacagct gtgaaaagag cccatcttat 33780

tcttttctct ggaaagaatt ctgttcttca gattcattgt ctaaaacatt tatagatgtt 33840

ttcagtgcta tgctgaaggg aggatgagaa gtcaggaggg aactccctgt tcagttcagt 33900

tgctaatgat ctcaagctct tccctgatta tcagtaagaa agatgaactt tggccaggtg 33960

cagtgctcat acctgtaatt ccaacactgg gaggctgagg tgagagaatc acttgaggcc 34020

aggagttcag gatcagcctg ggcaacatag caagaccaaa aaaaaaaaaa aaaaaaaaaa 34080

agaaagatga acatcactga gagtttcttg ctgggtgctg tgttgatgct tcaggtataa 34140

cattaggaag tggtccagtt atgtttccat ttaacaaaga ggggtaggga cttagagatt 34200

tgtctggtcc acataactaa taattaggga aactggggtt caaattcaaa tccaagccat 34260

agggactctg gtgcccgcct gcacctgtgt tactgtcacc tggtttcact ctggctcagt 34320

atgtttgtat tggtgtttaa actgctaaat tgtgttgtac aagataaaat acttatagct 34380

gtgtcccata agtgatgaat ttggagtgct ctaagaactc agctcttggg tttttttttc 34440

ctttaagtta attgaccttt cttttttctt ctttaaaata agttttttga gacatggtct 34500

cactctgtca gccaggctgg aatgtagtgg cacaatcaca gctcacctca gcctcaacct 34560

cctaggctca agcgaccctc ccatctcagc ctcctaagaa gccacaacca caggtgtgcg 34620

ccaccacact tggctgtttt tcgtcttttg tagagatggg gtctcattat gttgccctcc 34680

tttggtttta ctctctgatg gtactatggt ttcctctttt gtagtcaccc tgtttttctt 34740

ttaagaggaa agacctggcc gggcgtggtg gctcacggct gtaatcccag cactttggga 34800

ggccgaggcg ggcagatcac gaggtcaggc gatcgagacc atcctggcca acatggtgaa 34860

acctcgtctc tactaaaaat gcaaaaatta gctaggtgtg gtggcctgca cctgtagtcc 34920

ccgccactcg ggaggctgag gcaggagaat cacttgaacc cgggagacgg agattgcagt 34980

gagctgagat cgcgccactg cactctagcc tggcgaaaga gtgagactcc atctcaaaaa 35040

aaaaaaagag gaggaaagac ccttctgtat tatcccattc ttttttttct tccttgagac 35100

agggtctcgc ttccgttgct caggctggag tgcagtggtg caatcactgc taattgcagt 35160

ctcgacttca tgggctcaag tgattctcct acctcagccc tctgagtagt tgggactata 35220

ggcgtgcacc actaattttt tgtattttta gtagagctgg ggtttcgcca tgttgcccag 35280

gctggtctca aactcctgag ctcgtgatcc cctcgccttg gcttcccaaa gtgtcgggat 35340

tacaggtgtg agccaccaaa cctggccttg tactgtcaca ttcttagtgc tgtgtactta 35400

ttttcccaaa tgagtatctt tgtcatgtga tcttaaagtt ttttttttaa ttttgttttt 35460

ttcttaaaac ctgattgact tgagaaaatt tttccaaggc tgggtgaagt ctctcagcct 35520

ccaaagacta ataaaaggtt gtataagaga atccatagat tctgggactt ggccagaaaa 35580

ccagagatca tggacccagg gacacaagcc tcaccattgt cttcaaccca ctgaagcttt 35640

tctgtccaga gcagcagagc agtgccccct tcttccagag cctgggattg cctgcagaaa 35700

ataaagtatg gatatagact gcttctagta gttttgctag acattcagtt tccatttaat 35760

tgcttacctt ttattgttcc tgggatgaaa gacttgtaca gccaaaccca aaggactgct 35820

gcacttaatt tccctattca gatctaacag ccacctgagc tgcagaaata ctttttgcac 35880

accactggct caccaccact gggtcacccc agggaaagta cagagcagta ctggggggat 35940

ggtgatcaat gacagcttgg gaatgtgcct gtctccatca ggcagaagaa tccagggagt 36000

gagagagggc atctgtatat gcatcaggct caccccaaac agcactgagg atgtgtgact 36060

ttcttctctg agctgctgtt gaggctgcag gtttcagtga ctgagagcca aggacactac 36120

ttcaaatgaa cccagtgctg agccttgcag gtgagctaga gttagctgtt cttcctgcct 36180

ggcccctggg tgcagtgact gttctttcct ctgggaaaat ctgatgaaat gtgtagcaaa 36240

taggcattat ggcaagaggt gtctgtttat aactcttgga ggttagacca ctgggcccag 36300

gatatgtccc agcagcagcc cagcaagaca gagggtactg ttaatctgaa cctgccctgg 36360

taagcagtgg gtgcgccatg ggataaaaag agcacccaga tgccatgtta gttggactgc 36420

cctatgtgca ggtcagagag tgatgtgaat cattgagaca tttgattcaa caagctgctg 36480

ctcatggtga gaggtggatt ttaatttgga gaggaaattg gaatcacatt gtgttgtttt 36540

tgattttgag acggggtctc actctgtcgc ccaggctgga gtgcaatggc acaatcatgg 36600

cttactgcaa cctctgcctc ccaggttcaa gtgattctct tgcctcagcc tcccgagtag 36660

ctgggattac aggtgtgagc caccacgtcc ggctattttt tgtattttta gtagagacgg 36720

ggtttcacca tgttggccag actggtgtca aactcctgac ctcaagtaac ctgcccactt 36780

cagcctccca aagtcctggg attataggca taagccacct tgctcagcct agtcatgcat 36840

ttttgactta ggatattttc aatttacgac agcgttatca ggacataacc ccatcgtaag 36900

tcaagatgta tctgtacata tcaagtgctt agaatagtgc ctggcacata ttaaatatca 36960

tgtatgagtt tttcattgtt attattcact gtcttcctag tcttctacct tcacagccag 37020

aaagcacaag cagaatccaa aaacatgtat agtctaaaca tagaacaaaa actgactata 37080

ctctgtgatt actatgcaaa cgctgtagcc acagcctaaa attttttttt tttttttgag 37140

acagggtctc cctctgttgc ccaggctaga gtgcactggc atggcatgat cttggctcac 37200

tgcaacctcc acctcccggg ttcaagcgat tctcctgcct cagctgcccg agtagctagg 37260

attacaggcg tgtgccaccg cgtccggcca atttttgttt ttttagtaaa gacggggttt 37320

caccatgttg gccaggctgg tcttgaactc ctgacctcac gtgacccacc cacctcggcc 37380

tcccaaagtg ctgggattac aggcgtgagc caccgtgccc agcctaaatt aacttttttt 37440

taagtgaaag caagtttatt agaaaagtaa aggaataaag aatggctgct ccataggcag 37500

agcagcccta aatgaattct gatcacttgt agtcgtttct ctcttcctac ttagagcatc 37560

ttggaggcag accgtagtat tatcttttgt attctcagtt cccagcatat aatacatact 37620

taataaatgg tttttgagtg taggtaaaga tggaaaagcc agagaaaagt aaaaattgat 37680

ttttgtgaag gtaaggagat tgtgtaattg ttttctgtaa ttaacataat aaatgtattt 37740

aaaatattca aaacatggta ttgtcaaaag acttgaagag gcgtttcaca aaagttgcta 37800

tatccaagtg gccagtagta agtaaatgaa ataatttttt taattgtttc ttatcaggaa 37860

aatgtacatt aaaaccatgc tgagatacca ctgtctcttc ctctaaatgg ttaacattaa 37920

ttggactgac agtatcaaga ggtgacaagg atttggagaa actggaactc ctattacact 37980

ggtgatagtg ggaacataaa tttgtacaac cgctatggaa aactgtttgg tatcatctac 38040

taagctcaat gtgcatataa ctccataccc agccatttca tcctaggaat atacccgaca 38100

gaaataagtg cttatgaggc caccaaaaac caataaagga taatagtttt attctttttt 38160

tttctttttt ttaattaaaa acaattatcc agcccaaaat gttttgtttt tttgagacgg 38220

gggtctcact ctgtcaccta ggctggaatg cagtggcatg atcatggctt attgcagcct 38280

cagcctcccg gctcaagcga tcctcccact taagcctccc gagctgggac tacaggtgtg 38340

caccagcatg cctggctaac ttttgtattt tttttttttt agggatggcg tttcaccatg 38400

ttgcccaggc tggtctcaaa ctcctgggct caagaaatcc ttctgccttg gcctcccaaa 38460

gtgctgggat tacaggcatg agccacctca cctggccaac tttattctcc tttttttttt 38520

tttttttttt tttgagattg agtttcactc ttgttgccca ggctagagtg cagtggcgcc 38580

atctcagctc accggttcaa gtgattttcc tgcctcagcc ttctgagtag ctgggattac 38640

aggcatacgc caccacgccc ggctaatttt gaatttttag tagagacagg gtttctccct 38700

gttggtcagg ctggtctcga tctcccgatc tcaggtgatc cacctgcctc agcctcccaa 38760

agtgctggga ttacaggcgt gagccactgt gcctggccca actttattct taatagctca 38820

aaccagaaac agccaaatgt tcctcaacca gtggaataca caaatgcact atactttatt 38880

cattagtgga ctagtatgta tccaaaaagc aatgatctgc tatgtgcgcc agtgtggaga 38940

atctagcaga tagaatttga gtgaaagcag ccagtcacaa aagagtatat aagtagaatg 39000

aatggtttca tttatatgac attcaaaaat aggtaaaact aatttatggt gatagagatt 39060

ctaacagtta cctttggtgg tggggagtgg tatgctgttg actgggagtg ggcacaaggc 39120

tgccttctga ggctctggaa atattctata gcttgatcta gatagtagtt acacagatat 39180

acacatgtaa aaacttactg cactttatac ttaagatctg tgcattgtac tatatagaag 39240

ttatttctaa attttaagaa agtgagatct gaaacaaaat gtacatctat ttgccaactt 39300

tttctttttt ttcttttttt ttcacttgag atggggtctc actgtgttgc ctaggctgga 39360

gtacagtggc atgatctcag ctcactgcag cctctacctc ccagggttag atgatcctcc 39420

tgcctcagcc agtagctggg accacaggtg cacaccacca tgcccagcta attttttgta 39480

tttttggtag agatggggtt tcactgtgtt gctcagtctg gtctcaaact cctgagctca 39540

aatgatccgc ccgcttggcc tctcccaaag tgttgggatt acaggcttga gccaccgcac 39600

ccagcttatt tgccaacttt ttgatgaaag gtcagggctt ttccttgcgt atatcgggtc 39660

cattaactta actttcctca tgatcctagt ataaaccaca tccttagtta attatacata 39720

attttcatgg tctgtccctt taagtggaat agttgcttag ctatctgaat tggaatcctt 39780

ctggattttt aaaggtaccc ccacttttgt tttttattgt tcccttatat ctaatttggc 39840

aaggtgattt ttttttgttt gtttttagca tcttgctttt attaagtctc tgaaaacttt 39900

tttctttcag agacaggggt cttatgttgc ccaggctgga gtgcagtggt ataatcatgg 39960

ctcactgcag cctctacctc taggcttaag cagtcctccc acctaagcct cctgagtagc 40020

tgggaccaca ggttcacatg gccatgcctg gctaattttt ttgattttct gtagagatga 40080

ggtctcacta tgttgtccag gctggtctca aacttctggg ctcaagcagc cctccagcct 40140

gggcctccca aagtgctggg gttacaggca taacccactg cgcccagcct gaaaatatta 40200

atataatgtt atatattata acatgttggt gtttcctttc agtaaaagtt actcattaaa 40260

tgtataaact agccaggcac ggttgcttac gcctgtaatc tcagcacttt gggaggctga 40320

ggtgggtgga tcacctgagg tcaggagttt taagaccagc ctggtcaaca tgatgaaacc 40380

ccgtctccac taaaaataca aaaattacct ggatgtagtg gcaggcgcct atctatctgt 40440

gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtatgt ttatattata 40500

tatgttaatg ttatatataa tgttataact aagtatattt atacatactt agcttataca 40560

gcctgaaaac atttaacaga acagtctatt ttaccagttg ggcttcttcg taaggtttat 40620

gtgactaaaa taagtttgaa aaattctaat ctagatgact tctgagtttc agctttgcaa 40680

ttttgtgatt ctaatatttt gcacatttgt acagtcctga cagaatttag ttattaactc 40740

cagtggctcc tgtgtcagtg ctgagagagg actgcctctc atagtgtcta attcttatct 40800

cctttttgta catcccagct acccactgct gaaactcccc ttgccaggaa caggacctgt 40860

ggaattcacc acccctgtga aggattactc gcccccacct gtggactctg accgcaaaca 40920

aggagagcct actgagcagc ctgagtgggt gggtactcgt catgttcctg aggccagcac 40980

agagcgttgg gtggagactg gctgaggcag gggtctgcca gtgagattga ggttggtcag 41040

cttctgattt gtgaattcat gtactttaac agctttatca gtgtaccata tagatactta 41100

gtttatacat ttttttttga gatggagttt tgctcctgtt gtccaggctg gagtgcaatg 41160

gcacaatctc ggctcactgc aacctccgcc tcccgggttc aagtgattct cctgcctcag 41220

cctcccgatt agctgggact gtaggtgtgc gccaccacgc ccaactaatt ttgtattttt 41280

attagagatg gagtttcact atgttggcca agctggtctc gaactcctga ccttgggtga 41340

tctacccgcc ttggcctccc aaagtgctgg gattacaggc gtgagccacc gcacctggcc 41400

agttatttag tttggaactc taggtctcct gaccccagcc cactcctcct tctggactgt 41460

actgttttca gttgactgtc tctgggccga acactgatat aaatgagaaa aaaggtcttc 41520

agttgagggg ctcagtcaag ggacctaact caccatcaca ccgcactcat tatttggagc 41580

tcattgaagc ttgactagct catctgtgta ccttttgcct gtcaggtgtg gacaaagtgc 41640

cctttcttct gtgttgttct gtggtccctg gattcgtgct ggacttgctg aatctgttgt 41700

tgaggaaaac caaagctcag cgaacagagc tctcctcccc cttctctctg acagtcatag 41760

catattccca tttccttttt ggttaacgta gtagtcaggt aacttgttat gaacttgact 41820

ctgcggctga aatagaggca tatctggcaa gataggtctg tggcacaact atacatggtg 41880

tcagtgggga gtgcaccacc ctggcttcat gaggctctgc ctatgaaggt caaaggatgc 41940

atggtctgat gctggctgaa accagttttg tggtgaaacc agttttgtgg ctttatgtcc 42000

caggttggcc attggctcac tggctcattg tgggaccttc ttgcttaaac cttttacctt 42060

cattaaccat ttttttttta ttgttttgag atggagtctc actctgttgc ccagggtgga 42120

gtacagtggc gtgatctcag ctcattgcaa cctctgtctc ctgggttgaa agcgattctc 42180

ctgcctcagc ctcctgagta cctgggacta caggcatgtt gccaccacac ccggctaatt 42240

tttgtatttt tagtaggggt ggggtttcac catgttggcc aggctggtct caaactcctg 42300

acctcaggtg atccacctgc ctcagcctcc caaagtgctg ggattacagg cgtgagccat 42360

tgtgtccgga cttcattaac cttttaatgc aatgttagca cataagggaa tatttgtgtt 42420

tcctgactag gagagttcat ttggcccatt ggtgtggaat agatgtttaa tgatgaggcc 42480

gtaaggggtg tgatgtgttt gtgagctctt tgaatgatgg gatgatgata gaaagtgttg 42540

gtgcagaata actagagggc tcgggaatca ggagcattgt ccatttcctc tctctctgat 42600

tggagcgctc atcccctgca ggattgagaa ggagatgggc ccagggcagt cacctggtgt 42660

cacacagctc agtggtcagt tatctcacct ccattggctg tccttgataa agatacaggc 42720

cagcgatact gaagtgggtg gtaaggactg ttttagttat gaagaacagg aaattcaacc 42780

caaatcagag taagtgaaag ggaatttttg gttcatataa ctcagccagg tgcagggctg 42840

acttaagcac gatatagttt gagcctcaaa aggagtccat ctcttgactt tgtcctctct 42900

gggtcagctt cacttttggt cttcccaaca gtggccctag cagcttcagc cccatgtttt 42960

tgcatcatcc aatccagtgg aggataaaag ggagcccagt tggctatgaa tagggttacc 43020

tgcctgtccc cttcccaagc cctatggcta aaggcaggta tttcattgtt gttgtcagca 43080

ccttgctggg aatgagagag gatggtttcc aaagggacaa tagggccggg tgcagtggtg 43140

catacctgta atcccagtac tgaggcagga ggatcgcttg agcccaggag tttaaggctg 43200

cagtgagcca tgatcacacc attgcagtcc agctggggca atagagtgag accttgtctc 43260

taaaaaaata aaaaataaat aaattttaaa aaagggaaaa taggagactc gggcagtaga 43320

cagtacattg caggcatctg ctgcctatac gaaggagcca aaacttcctt ccctactcga 43380

ctcactgctg agttcagcac tcgtttattg catacgcgtg gtgtgggatg atgtggggga 43440

cagatagagg ctcactgtcc ttgaggagat cctatactgt ttggaaagag aagacaaaga 43500

tttttcaaag tttaaagtaa atatagtgta tgtcaaagag acataggggg gcaatcgaaa 43560

gagctcccca gtggtcagtg ctagagcaat ttttttttct tttttttttt cctttttctt 43620

ttcttttttt tttttttttt tcaagacgga gtcttgcttt cgctaggctg gagtgcagtg 43680

gcgcgatctc agctcactgg aacctccgcc tcccgggttc aagtgattcc cctgcctcag 43740

cctcccgagt agctgggact acaggcacgc accaccacgc ctggctaatt ttttgtattt 43800

tagtagagac ggggtttcac catgttggcc aggatggtct tgatctcctg atcttgtgat 43860

tgatccatcc gcctcggcct cccaaagtgc tgggattaca ggcgtgagcc accatgcctg 43920

gcctagagca atttttgcaa caaaataaac tggtattgaa ttaagaccca aaatataaaa 43980

taattctctg tgagtccatt cctgagtcca tatgcttgaa taaatataaa taaatgaatg 44040

gatgacaata gacaaatctc ctgggcaaaa aaattctaag taatgtatcc taaagtgtgg 44100

actatgcatg atgactttct tccaaagagg acagtgtgac tgtgggaaaa agtaacttta 44160

cagtgaagaa gcctgacaga cacctcctac agtaagtgat tggggttaaa gcagcagtga 44220

taaatcacat tgattgattg tgcccttgat atgtgaggag gaggaggaca ttttaccgct 44280

gatcttcctc tcccaaaccc ataaccgcag tataattaga agtaaaacat cagacaaatc 44340

ctagttgagg aacaccctac aaaatgcctg accagtaccc cttgaagctg ccaagatcat 44400

caaaagcaag ggaagtctga gaaactgtca caagctacaa gaagcctcag acactacagc 44460

taaacgtaac gtggtttcct ggatgggatc ctggaaaaga aaaaggacat taggcaaaaa 44520

cttagaaaac ctgaatatac tttggacttt ggttaagaat ttcactgtgg actttggttt 44580

tcagaaggag gactacagag atgaaatgtc cttcttttta tatacctcag cctcctaaat 44640

tatttaaaaa ttcacgtaca ttaagattca gtctttgtgc tgtaaagtag ggattgtggg 44700

agttcactca gcacagtgag tgtgggccct gcccacatct tccttaccag gttagtgctc 44760

ctttcctgct cagacctgtg tgagcttctg ttctggtcat agcctgtggc agccagctcc 44820

atccaggtgc ctctgtgcct cccagcagct tctagtggct gagcgtgata cagaagacaa 44880

agtggatgag gccttctgtc cccagagccc tcactaaggc acagccacat aaagttcaca 44940

aaggctcaga cggttgcctc tggttgttcc tttgtgccca gggtcccagg aggcattaac 45000

ttgctgtgct tggtcagcat cttggccctt gcctatgctg taacctggag tactgcattg 45060

gtgagtggct ccatggcctc cctttcatcc acacgcatgc cccttggagt tcccgactgc 45120

agcccaggcg tggagacagc ccctcatccc tcagctgggc tgggccctgc ccccttcagt 45180

ccacacctcg cagtacaccg ctgtctaggg ccatgtttcc ttgtctccag ttgtcaccaa 45240

ctcccgggga gtctttacag agcactgctt tcatcaggtt gccccttcac ctcagagaca 45300

ctgggctttg ctttgtcaac tgattaaaat cctgacagct cagtcaggct tcagtctaag 45360

cctgcttgtc atcttcctcg taatttctgt tatcccctga caggtttcct tggtgcagat 45420

gtccaggcct tctgtgctct cagcatccct tgcaactcac attccctcct gctcctctcc 45480

tacctgttct tttctaacct tatggctcta ctcagcttct cctgggccat aactctgctg 45540

tggctgaccc agcatgtttt ggggtgctcc gcgacatgcc tgttactgag ggttgcatat 45600

gtgaacactc ttgtcattta catccctgtt aagctcttga aaggtagatg gcagattcta 45660

gtgagaaaag tatgtgatat ttagtgagga gaccttggtt tgagtcctta caccaccctg 45720

cctggagtgt gaagctctag gcaggcacaa tgcctgagcc tctccttgct tctcatcagg 45780

ctgttgtgag ggtcagatga agtgaaatgc ctgattgttc attgttaata tttctgctaa 45840

tctttcagac actgtttgta tgcgtgtgtg gtgtgtgcat acatcttgat gctgcagggt 45900

gaatgtcgtt attcctgttt cacaatgagg aaattgaaat ccagagatgt caaaagtgtt 45960

ttcaaggcca tatgtttgga aagctgtgat ttaaaattgg gtcctttgat cttcaaaacc 46020

cgctactctg ctgcaagtga caaaacctga atcagtaaga caggttacat gctttgggga 46080

gtgtagagtc tatagtgcgg tcagcagaca tgttccataa agggctagat agtaaacatt 46140

taggctttgc gggccagacg gcctctgttg cagccatttg accctgctgt tgtagagtga 46200

aagcagccat agacaatagt aatggtaggg gtgtggctgt gcttcagtaa aaattggaag 46260

tggaaaaaca ggcactaacc agcctgggca acatagtgag accccatctc tacagaaaat 46320

aaagaagtta gccaggtgtg gcacttcggg aggccaaaat gggaggatca cttgagccca 46380

ggagttcgag accagcctgg caacatagtg ataccctgtc cctacaaaac atttttgaaa 46440

attaggcgtg gtggtggtgc acacacctct agtctcagct acttggtggg tgggggtgct 46500

gaggtgggag gatctcttga gcctgggaga ttgaggtttc agtgagccat gattgggcaa 46560

tagagcaaga ccctgtctca aaaagaaaaa caggcatggg ccctgatttg gcctacaggc 46620

catcgtttgc ctacacctgg tcccacagtg ctttgcccat agtagatgtg ttattgagca 46680

aaagaggctc gctgcccaat gtgctagaag ccaatactgt gacaccagga tttggggaaa 46740

agaaaagctt tatattgaag gttgactccc taggagaccg gagtccagct caaatctgtc 46800

tccctgtgct ggctttaagg cagtaatttt attaggaaag gtttagaggg tggatactag 46860

gattagcaga tgattgatgg aaggaagggt gatttctggg aagtctttga gcatgcccag 46920

ttatctcttg atgccacctc acaggtccca tgtgcaaatt ccggggggag ttagtatgaa 46980

acatggcagt ggaaattcag gctgtgacat cggcaagctc attctgcaca actccagtcg 47040

gccatcttgg ttccagctta tttcagccag ttcttttatc tcataagcgg agggagtttc 47100

tgggtttcag caaattgttt cttttcttat ctgccatcct gcaaactcaa gaacttgtat 47160

tagtcattgg tttctttaac tctgtggggc acggtttcca atgcccatta aatcccttga 47220

attggaccgt ctttcttctt cctgtgctca gctgcccttt ctgccctccc tcatttcttc 47280

tgcagtatgt gggtgccccg gtggcttatg tccagcagat atttgtgaag tcctcagtgt 47340

ttccctggca caagaacctc ctggcagtag atgtatttcg ttcacctttg tcccgggcat 47400

tccaactggt ggaggagatc cggaaccacg tgctgagaga caggtacccc tctcagggac 47460

cctggcctcc ctgaatccca ttctgtactg aagggagagt tacagtcctc agtgtaactg 47520

cagtgagcca gtcagctctg cagagataga acaagcaaga aggatggagg gtgagctagc 47580

cttgaatttc tcagcatcct tgtgggtcta cggtggctgc attccgcttg gacctatgca 47640

gatggcacac acatagcctt gagtctcatc cttacatctc agatggagtc agtgtccact 47700

gtgctaactc atgacccaca tggcttcctg cctgtgggtt atggtgtgaa tgtaatggtg 47760

gtgtctctgc cgacgagaag caagctctac ctgggggtac cttctgaagc cccagcccaa 47820

gtcgtgctcc cctgcctatc agtgggtccc tgggttatgc tggcttggca tacaatgtgt 47880

gtaattggca agctgcatca ctgccaggtt ttagttagct agtggcgttg acagatattt 47940

tggtgaacta aatgaagccc ctaatttacc ccggtccctg ctcatccact gaactggcca 48000

gggtgtttta gtgggtgggg ttgtgcatgc tcttatagta cacttgcccg tcctcagagc 48060

tgatgggctt ttgggcttca gatgcacttt gaaagtcaga cagccacatg tttaggttat 48120

tggccacctg gaagtacttc cccctgctgc cctagtggtc aggctctttg gcgataccag 48180

agagcaaata tggggcattg aagaacagac agaggatgtc ccctaagtac agcaggtctg 48240

ccctgtggtg gcagacacag caggtgcctt gtcctgtctc ctgtgcagct ctgggatcag 48300

gagcttggag gagttgtgtc tgcaagtgac cgacctgctg ccaggcctta ggaagctcag 48360

gaacctactc cctgagcatg gatgcctgct gctgtcccct gggaacttct ggcagaatga 48420

ctgggaacgc ttccatgctg atcctgacat cattgggacc atccaccagc acgagcctaa 48480

aaccctgcag acttcagcca cactcaaagg tagccccagt acaagttccc ttcagacctg 48540

taaaggtgcc cattggtcac cgtctttttg atgtgtgctt aggcagatca gggtttaccc 48600

tttgtttccc agggtggggg tgagaaaggg gtccttggtg gctctgcagt agctgtcatt 48660

tctgtgtcag tacctgctgg tttctgcttg cagacttgtt atttggtgtt cctgggaagt 48720

acagcggggt gagcctctac accaggaaga ggatggtctc ctacaccatc accctggtct 48780

tccagcacta ccatgccaag taagattgac agtaccctgg gctcttgact ggtctgctgg 48840

gtgacatgag gctttgagta gtccctcttc tggttagagt gttctgaatg ccccctggaa 48900

acttgggaga gtttccaggc ctcctgttga atgtttacat ccctcagact agatgatgct 48960

gtctaccaca ttttaatggg gatgacctga cagctggtta agcatagggg actaaggtag 49020

ggctggcggt ctcagtgtcc tggtgcctcc tctggtctct cttgagccta gggcaggcat 49080

ccccagctgg ttactactga gcaccctata tggcctgtgt ccttcccagt ggggcactgc 49140

aggcagctcc ccaattggca agggcactcg aggtgcttct gatcggctct cctaggcctc 49200

tggcaatcaa gagtgttgga ggccgggcgc ggtggctcac gcctgtaatc ccagactttg 49260

ggaggccgag gcaggcggat catgaggtca ggagatcgag accatcctgg ctaacacggt 49320

gaaaccccgt ctctactaaa aatacaaaaa attagccggg cgtggtggtg ggcacctgta 49380

gtcccagcta ctcgggaggc tgaggcagga ggatggtgtg aacccaggag gcggagcttg 49440

cagtgagccc agatggcgcc actgcactcc agcctgggcg acagcgagac tcttgtctca 49500

aaaaataaaa aataaaataa ataaataaat aaaaaagaga gtgttggagt aggtccggaa 49560

agggagacaa agaaaggagc agggggagct cctgagaaaa ctttgtcccc tttgtgattt 49620

tcccagtgcc cctggagact atagagaagc tcaggcacca tagagaagtt ccctttcaac 49680

acaggggcag gagggaggtc ctgatggacc ctctgtccgg ggattgtctt tgtccccaga 49740

accaagagca acacttccat ttacccccac cctgctcctt gaccaggttc ctgggcagcc 49800

tgcgtgcccg cctgatgctt ctgcacccca gccccaactg cagccttcgg gcggagagcc 49860

tggtccacgt gcacttcaag gaggagattg gtgtcgctga gctcatcccc cttgtgacca 49920

cctacatcat cttgtttgcc tacatctact tctccacgcg taggttcatg gcagggaggc 49980

tgagggcttt ctccaagcta aacgggcatt tccatgtcac ctgcttccct ggctctggag 50040

gtggcttggg gtagagagat agaacacacc tggtggtcat cagagctagg gctttgtccc 50100

ccagcagggt cttaggagct tgggtggggc cggggctctt cccactttca gccccttcct 50160

gggttagggt tcctaaaagg tgtactgtgt ccatgacact gggaagtgct tgtgcctgtc 50220

cctttccttt ggtgaaacca ggagttttcc cttcctcgac tgtcagggca acctactccc 50280

gggagcccca gtgggccggg ggctggggga ggggccgccc tgatacgccc tctctgccct 50340

ccagggaaga tcgacatggt caagtccaag tgggggctgg ccctggctgc cgtggtcaca 50400

gtgctcagct cgctgctcat gtctgtggga ctctgcacac tcttcggcct gacgcccacc 50460

ctcaatggcg ggtaggtccc tagcaggctc cactgggcca cagggtgggc tcaggccaga 50520

gagccttgca cttctgggtt cttggccttc cctggacttt gctgtgacct cacgtcttca 50580

cattgttgtt tttgacattt aagaggtaca ttttcttcct cttctttgtc tggcttgtat 50640

tcatacttgt gtttgtatat agcatatcta gctatagtga gtgtccatat gtacaaaagt 50700

gcatatttgt gggctgggtg tgtatataag gggtgtgtgt tggtatgttt gtgtatacat 50760

gagtatgtat tgcatgtgtg tagtcggatt tgtgtgtctg tgtttatgta ttctatatac 50820

acacaccaca cacacactgc agcttgatgg cttaagccac tggaggtgtg agatagagaa 50880

gagaacattt tttttttcat gattagaaca tttaaatgcc taatgaaata ggtcatttta 50940

gaggaagctc tttggaagat atgagcacac tgtaatttgt cgcctttttc actgatgttt 51000

actttcccct tgccactcct ctctgaacct tagtctggaa gcccttccct cggcttgtcc 51060

tcaggctttg atcttggctc tggctaggcc cgcctgcctg tctattaatg gttattaatg 51120

gattatggat tggcctgtcc accactttgg cccatcaggc tggtcgtatg aaaagcgacg 51180

tcgtattttg tttctggtag tttcgttgct cttagatacc tgctcccttt cctgagcttg 51240

acactgttaa acaccaccct cccccatacc gtctgccata cccttcacag ggccctccct 51300

tccttcggct ccaaagcaga ggtcctgcaa ggtataactt ggctggcgtt cctcgcacat 51360

agactttctt agggtttgct gcggggagtg tgggacagtg ggctcagata gctggtagag 51420

ctttgtgtag gaacagtcgt tcttctccac acacagcttc tcaacaaagg tgagtgggcc 51480

ttcaggatgg tttcatctcc ttgcatttag ctgtgatggg tccacccaga gttactggtg 51540

tgggtcttgg cagcagtcat tgtctttagc cagcagtctt ctcctgggaa gggccagcag 51600

aagtgtggtc tagcagtggc gctgcacagc tctccctgag gggcctcttc cagccctcct 51660

gtgctggatg gctagagaca ggatggctgc tggcccctct gcaaggctct ggagcctgcc 51720

tgaaagctga gtgctgtgta gatgcaggtc ttgttgggtg aggtggacaa gggagggttt 51780

ctgcccagca cctgtgggag tcactcagca gcccccatga caggctggaa accccacagc 51840

cttcctgagg gccccagtct gttgggaacc accacaacac tgtcctcacc ttctccttct 51900

ctgtccccag cgagattttc ccctaccttg tggtggttat tgggttagag aatgtgttgg 51960

tgctcaccaa gtctgtggtc tcaaccccgg tagacctgga ggtgaagctg cggatcgccc 52020

aaggtaacgc agtgggagag ttgggcagag ggctgcagga ggggctggaa tggggcctgt 52080

tcctcttgct gttaacgctc tgtgagcaaa cagagccctt gaaatgtccc ttgctcttgc 52140

ctccggcata atatgcagtg ggccactggg ccctggcagc tcttgagtgt gtgccctggg 52200

gagccatggg gccattggac tgtacttcgt cctggttcat gtgtcagtaa gaaagtaaac 52260

caggctgggt gccatggctc acacctgtaa tcccagcact ttgggaggct gaggcaggtg 52320

gatcacttga gcccaggagt tcaagaccag cctgggcaac atggtgaaac cccatgtcta 52380

caaaagatag aaaaattagc agggcatatt ggcatgcacc tgtggtccca cctactcaag 52440

aggctgaggt gggaggattg cttgagcctg ggaggtcaaa gctgcagtga gccgtgatca 52500

caccactgca cttcagtgtg ggtggggctt gtgtttggtg gtggctttct gtctggggag 52560

tttagcgcct agtattttct cttactgcct cactccagca cactaggccc aagccccggg 52620

ggctggccat ttcagagacg ctgccttcac ggctgccaga aaagctccct ctggccctgc 52680

tggtagaaac tggggatctg gggttctagg gaaaatgaga aaagggagag cctggccttg 52740

gaggcctggt cacttgagcc tcttcttcct cgtcacccca tgtctgtgag gaatggggct 52800

gtaggcagcc gtccattcat ccagacctct gtgagcctct gtgataagcc aggccctgtg 52860

ctggatatgg agttaggaag agatggggcg aaattgtcct tacccagtaa gagcacagag 52920

ccttagacat gcgacagtgt gatagcgtgg gatcagggct cactacagga aggggcttga 52980

ggaagaacgc agccaggtcc tctacccgcc gagtgcttct gccatgtggt tgatgggcac 53040

actgtcatgc tggcccgtgc agaccagaca agaaccacat gcggaggttg gatgtggttg 53100

ttgtgggtgg cacttggctt tccttgtgga ttttctcatc tccacactct gcttcttccc 53160

tcttttgatg attatagctc tcctctgcac cctccaggct gtgaacaccc gttccccgta 53220

gcagctgtgt ggtggtgatg gccccttaaa gtctgggcat tagcaggacc ctgagggttg 53280

gggtgctttg gtggaatggc tccttcaaag ggctgggggg ccttgccatg cctctgccac 53340

tccgaggccc atgaggttgt gtgagtcatg tcgcagagtg gccatgtgtt gccctgtgcc 53400

ctgttgctgc cctctgcagg cctaagcagc gagagctggt ccatcatgaa gaacatggcc 53460

acggagctgg gcatcatcct catcggctac ttcaccctag tgcccgccat ccaggtaagg 53520

ccccaaggcc tgccacctgg atgagcatgg aagcaactgc tgtgctcccc agctgtgcag 53580

ccatgggcag ggtgctcccc tcttcagcac aggcatcctt gcttctgagg tgggacctct 53640

ttgcctggca agcagatcac tacagcaccc agatggcccc tggcatgcct ggctcagaag 53700

tgctcagcaa accctggctg ggttcccaga ttgagcacct agccaggcag actctgccct 53760

tgaccctgtc ttcctacccc tccctgcctg cttccctttc agccaagtgg caggaggagg 53820

ctgcaagggc atggcaggag ctggggactg gctgtgcagt ttgtcacacc tgtttcccat 53880

ttttgaggga gaagcaccgt ggggttccta gacccttcct ccggtctcct cccttggccc 53940

tggcctgtgc cgcagtcgcc agacgcatgg ccttgcctgg cctgaccagt gggagggcca 54000

ccacccattg cccagagtga ccctgctctt ggcaaagtgc cctcactcag ctgtgggctg 54060

tgagcagagg tggaggtggc cctgcactga gctggaaccc cagactgatg ccagccattc 54120

cagaaggagt tgcaggaagg ggaggatgcc atcttttctc gcccgtcttt cccccagggc 54180

tggcaggcca gctgagggat gggggtgagc agagaacaga tgggctgtgg gctgcttctc 54240

ctggaaaaac agtagtatct gcaggatagg gtacagtctt gggacgttag agctgagaca 54300

accactgtgc cactatctgc actccatggt cttaccccag atcggagtag cactgtggtg 54360

atgtgctaga ggtctcaaca ccgacatctc agaaaatttt gtctgctgac agagcttggg 54420

gagcagagag ctcacccttt ttcagtttta gagaattaat ccctctctct ctctcttcat 54480

tgttccgggg cagttgctgg ctgggaacct ttctgagagc ccctgaatca ggcctgggct 54540

ctagctgggt tggtgatgca tgagcagggc gggggctcag tggggaagga ctttttgggg 54600

agcaggctgg tggggcttag aggtttccgg gttggatcag gccttcagtc ccctctagag 54660

ggaccggaag attcagggaa ggtacttccc cttccctttc agccctttct gaagaaagtg 54720

tgagggtttc ttctgccccc tggtggagac ggggtgagct gctgctggta tgtgagctga 54780

ggaccaacca gcatctctca tctctgctgt gccctgcctg ctgctgccct gccggttatg 54840

aggtggctgc agtccgggta ctgctcctct tgggctggga cagtgaggtc acggcacccc 54900

cccatcccca tgtgctctga ttccaggagt tctgtctctt tgctgtcgtg gggctggtgt 54960

ctgacttctt ccttcagatg ctgtttttca ccactgtcct gtccattgac attcgccgga 55020

tggaggtagg agtgggctga gccctgccct gcccgcctcc tcagccctgg ctgtactgag 55080

ggagtcctgg gtgagaaggg tgtagacctc gggcaggaca gcggtcctgt gcgagcagcc 55140

tctggatggt ggactcaggc cctgaccact gtgcccccaa cagctagcag acctgaacaa 55200

gcgactgccc cctgaggcct gcctgccctc agccaagcca gtgggacagc caacgcgcta 55260

cgagcggcag ctggctgtga ggccgtccac accccacacc atcacgttgc agccgtcttc 55320

cttccgaaac ctgcggctcc ccaagaggct gcgtgttgtc tacttcctgg cccgcacccg 55380

cctggcacag cgcctcatca tggtacctgc cacccctgcc ctgccctgcc ctcttctgga 55440

gggccggtgc tccaggcccc ttgtggtgct gcacttggcc ttagagtggc aaagggtatt 55500

cctcaggccc tggtggcccc tggaagcctg gctctgggga gttgcccgtt gtgtcctccc 55560

tgcccagacc ctagtggctt ctgaggagat aagcctgtgg gagaagcagc tccagggttc 55620

tcaggtacag gagccatcct ctccccagag tggcccagga caggagcctg ttagttgagt 55680

gctctgggat ggacccactt gtggccacca cattgccctg ggtcgggttc atcggccgct 55740

gcatggtgtg cagacactgg aaagtgctgg gcaaaatcat tcaccagccg ggctgggctg 55800

gccttggggc agcagtgcct cttccaggga gctgaactga gatgggagga aggctgaggc 55860

cccctgggac taggacctct gggggactct ggagcaggtc aggttgctgg ccctctgacc 55920

gtaggaatgg tagcagcttt ctggctccag ctgaggtgga gcttaggggt ggggacattc 55980

tgtgtcaaac ctcagggtgc ttcagtgtat ttccaggcca agaaactcag cccctaactg 56040

tggaaaggca agcaggcccc tccagcagca agtgttggca ggtgttagca ggaggacttg 56100

gagaggcagg agaaaaggac gcagtggggc ctgtgtcctc tctccatccc caggcctgag 56160

gtccctgtgc tgcttcctct cagcatgagg gctgaagctg ctgggggttg gggcccattc 56220

ctcccactga gtaccccctg ccccactgca ggctggcacc gttgtctgga ttggcatcct 56280

ggtatacaca gacccagcag ggctgcgcaa ctacctcgct gcccaggtga cggaacagag 56340

cccattgggt gagggagccc tggctcccat gcccgtgcct agtggcatgc tgccccccag 56400

ccacccggac cctgccttct ccatcttccc acctgatgcc cctaagctac ctgagaacca 56460

gacgtcgcca ggcgagtcac ctgagcgtgg aggtccagca gaggttgtcc atgacagccc 56520

agtcccagag gtaacctggg ggcctgagga tgaggaactt tggaggaaat tgtccttccg 56580

ccactggccg acgctcttca gctattacaa catcacactg gccaagaggt gagctgggcc 56640

gtgccaggtg ccacctcact cgatggtgtc aactcaccat cccctttccc caatgcagga 56700

ggcccacagg tttgaattat gcaaataatt aaaacagttc ataaggttgt gaggtgggaa 56760

ctggtggttt aggcagctat aacccaagag aggagtccca ggttgctctg aggagtcact 56820

ggtggctgcc agccctcacc agaatgagac ccacccacct gtgccaggag tggggaggga 56880

gataccccac acggccacca gggctgtttg ggtgctggta tctgggacag caagttggct 56940

gctaagctgg gctggggagg gacctacctc tgtccccaac cccccatgct gggagagtct 57000

ggccggtgga gctgaggcct gcctggggag gagggagagg actggctggc gagcacagca 57060

ggaggaagcc ctgggaggcc ccccgctgag gctgcccact gtccgaatcc aggtacatca 57120

gcctgctgcc cgtcatccca gtcacgctcc gcctgaaccc gagggaggct ctggagggcc 57180

ggcaccctca ggacggccgc agtgcctggc ccccaccggg gcccatacct gctgggcact 57240

gggaagcagg acccaagggc ccaggtgggg tgcaggccca tggagacgtc acgctgtaca 57300

agtaaggctg ctgggtgggg tggggtggga aagagtgcgg ggagggggac gggtaggcaa 57360

gagtagggga gagggaggag gggaggggac aggctgtgag gtgtgtctca cagcagtccg 57420

ccctcccgtg cagggtggcg gcgctgggcc tggccaccgg catcgtcttg gtgctgctgc 57480

tgctctgcct ctaccgcgtg ctatgcccgc gcaactacgg gcagctgggt ggtgggcccg 57540

ggcggcggag gcgcggggag ctgccctgcg acgactacgg ctatgcgcca cccgagacgg 57600

agatcgtgcc gcttgtgctg cgcggccacc tcatggtgag caggggcaca gtggccgggt 57660

aggggagggc cggagcctgg cccataccaa caccgggctt ctgcaggaca tcgagtgcct 57720

ggccagcgac ggcatgctgc tggtgagctg ctgcctggca ggccacgtct gcgtgtggga 57780

cgcgcagacc ggggattgcc taacgcgcat tccgcgccca gggtaggtgc ggctgccctt 57840

tcctcctttg tgcccccaca acccccctca ccccaccccc cgccgccacg tatctcccct 57900

cctttcttcc tccgaggtat cccccaaccc ctccaggccc cctctccccc cacccccgca 57960

ccccctccca ccaccccgta cccccctctc cccaccccgc accaccctct ccccccaccc 58020

ccttttccct tgccccttct cactcccacg ccccctctca cccccgtccc ccgccccctc 58080

tcacccccct cccccgtgcc ccctctcact ccgccctcct ggcccccagc aggcagcgcc 58140

gggacagtgg cgtgggcagc gggcttgagg ctcaggagag ctgggaacga ctttcagatg 58200

gtgggaaggc tggtccagag gagcctgggg acagccctcc cctgagacac cgcccccggg 58260

gccctccgcc gccttccctc ttcggggacc agcctgacct cacctgctta attgacacca 58320

acttttcagc gcagcctcgg tcctcacagc ccactcagcc cgagccccgg caccgggcgg 58380

tctgtggccg ctctcgggac tccccaggct atgacttcag ctgcctggtg cagcgggtgt 58440

accaggagga ggggctggcg gccgtctgca caccagccct gcgcccaccc tcgcctgggc 58500

cggtgctgtc ccaggcccct gaggacgagg gtggctcccc cgagaaaggc tccccttccc 58560

tcgcctgggc ccccagtgcc gagggttcca tctggagctt ggagctgcag ggcaacctca 58620

tcgtggtggg gcggagcagc ggccggctgg aggtgggcag aggggctaaa ggtgggcaga 58680

gcggctgtcc gccccgggga ttgtgggcct ttctggctgg caggtgctca cagcctctgg 58740

actcgtaggt gtgggacgcc attgaagggg tgctgtgctg cagcagcgag gaggtctcct 58800

caggcattac cgctctggtg ttcttggaca aaaggtgagc gtggcctgcc tcagccccag 58860

atgtccccag cctttgttgg ctaggccata ctctcttgag tcttgagttc tggttctctt 58920

caactgctgt actgtatgat tcgattgacc ttcttggtgc ccagctccac acctgtgagc 58980

agagggcagt ccacttggat gggaaggtaa caattaaaag cgttaggggt ggccgggcgc 59040

ggtggctcac gcctgtaatc ccagcacttt gggaggccga ggcgggcgga tcacgaggtc 59100

aggagatcga gaccatcccg gctaaaacgg tgaaaccccg tctctactaa aaatacaaaa 59160

aattagccgg gcgtagtggc gggcgcctgt agtcccagct acttgggagg ctgaggcagg 59220

agaatggcgt gaacccggga ggcggagctt gcagtgagcc gagatcccgc cactgcactc 59280

cagcctgggc gacagagcga gactccgtct caaaaaaaaa aaaaaaaaaa aaaaaaaaaa 59340

gcgttagggg tgtgacgtgc ttggaatagg gcatggcaca tggtgacctc ccagggcctt 59400

aagcagtgac agtggggagt gatatactcc tatcctttct cgcccttctc aatgaagcca 59460

gtttctctga ttagcttgtc aatattgagc ctttggggta tcttggttgc atttttagtt 59520

acagagtgcg cttgcagaac cctctcttct ccttggccgc tggcagctgt tctctgctct 59580

ccctgcctct gtcgtgcttg gcctcctcag caagcctgtt ggctgtgggc gtccccagta 59640

ctccgtctgc atgcacactc cttggggagt ctcagccacc tgggttctgg ccccacctcc 59700

aagctggtga acctgggtct ccacccagtg gccaggtgcc ttctgccgga cgcctttgcc 59760

tgcctgtccc acactggctc ctcctccaag gctccttgac tgttggtggc agcaccatct 59820

gacctagagc tggagtcttt ttccttgggg agggggcgtc ccttgccctt agtgatgttg 59880

atttctgcca gtgggctgct gccgtcattc ctgtcaccac aggttctgca tgggctttgg 59940

ctgacatcct cccctccagc ctggccaatt tcaccaggcc cctccatgct tcttggaaat 60000

tctcctttgc tgcttgtttt agctttaagg aaagccccga tgtctcaacc tgaccatcag 60060

ggttcctggt gactgtggtc tctccttgtc cacccacttc caatcataaa actggcttcc 60120

ccagctctgg tgcaggccct tcaaattcat gggcagaggt tgtaggcaga catgcattgc 60180

ctttccctgc agtaagattt tgaaccccat ctgctttgag gctttggggt tactgggcaa 60240

atatacccat ccctgcctgt cagactgtac ctaggaattt tggagagcaa agaaaatcct 60300

tgtttcttta tggaaaaagg aattgatgtg agctgtgctt gggttgaagc tgcttttatg 60360

tggagaatgc aggcttccgc aacacccaac atagcccacc ctgcatcctg tttcccctca 60420

gcagccctcc cttcagctcc aggctacatg gagccctctg cttgttttta atttacaaac 60480

ttacgtgata ttcaccaggt accaccttac acgttagctc acttgattct catgaccacc 60540

ctgtgaggtg ggtactctta tccccatttt acggatgaag aaactgaggc acaaggtggt 60600

taatatttgg agttgccctc tggctccagc atctgttctg gcaccatgtg ctttcctctt 60660

ggccatgtcc ctcctgtgcc ttcttgaact ggcccttaac tctcatgtcc acatgctcag 60720

ccccagggct ggggctctaa gggagaggcc cctggcagct gttcttctct tccaggattg 60780

tggctgcacg gctcaacggt tcccttgatt tcttctcctt ggagacccac actgccctca 60840

gccccctgca gtttagaggt cggagggcct ggggtgggca ggtgttcaca cttggtggga 60900

cgggcagggg ccgtctaccc attgctttct cagagattct tcacttggcc ttttgtcctc 60960

agggacccca gggcggggca gttcccctgc ctctccagtg tacagcagca gcgacacagt 61020

ggcctgtcac ctgacccaca cagtgccctg tgcacaccaa aaacccatca cagccctgaa 61080

agccgctgct gggcgcttgg tgactgggag ccaagaccac acactgagag tgagtattgt 61140

cttgtctctt gggtgctgga gtggcccggc acggggtggg agcctgatgc attcgtcagg 61200

gagaggctgg aagagtcctg atgaagaaca gagggcattt cccagccaaa gtataacttg 61260

gaaaatccca gagaccagaa cctgaggccc atccctgtcc caggtgttcc gtctggagga 61320

ctcgtgctgc ctcttcaccc ttcagggcca ctcaggggcc atcacgaccg tgtacattga 61380

ccaggtaagc ggcctgcagg tggggtaggg ggtacagagt ctgtggccca tgtttgctga 61440

ctcctgggag ctggtcccca ggggccttcc aggaagcagt cagggcccca cccactgggg 61500

cacagggaca ccactgttga cagaggtatt acaccatggt gaccccactc ccctggcctg 61560

tttccccaga ccatggtgct ggccagtgga ggacaagatg gggccatctg cctgtgggat 61620

gtactgactg gcagccgggt cagccatgtg tttgctcacc gtggggatgt cacctccctt 61680

acctgtacca cctcctgtgt catcagcagt ggcctggatg acctcatcag catctgggac 61740

cgcagcacag gcatcaagtt ctactccatt cagcaggtag aggggatggg gatcatagga 61800

ttcttgggat tttagggaag gactcaggac tgagcttgtc atgtccttgc ctccaggacc 61860

tgggctgtgg tgcaagcttg ggtgtcatct cagacaacct gctggtgact ggcggccagg 61920

gctgtgtctc cttttgggac ctaaactacg gggacctgtt acagacagtc tacctgggga 61980

agaacagtga ggcccagcct gcccgccaga tcctggtgct ggacaacgct gccattgtct 62040

gcaactttgg cagtgagctc agcctggtgt atgtgccctc tgtgctggag aagctggact 62100

gagcgcaggg cctccttgcc caggcaggag gctggggtgc tgtgtggggg ccaatgcact 62160

gaacctggac ttgggggaaa gagccgagta tcttccagcc gctgcctcct gactgtaata 62220

atattaaact tttttaaaaa accatatcat catctgtcag gcactttggg a 62271

<210> 2

<211> 62267

<212> DNA

<213> 智人(homo sapien)

<400> 2

agaggtgaag gggcgggcac ccggcggcca ggagagagag ggagggcgcc acgcaccgga 60

ctgcgggccg agagcgcgca cgccgcgctc cgcccctgct gccgcccccg tcgccgccgc 120

cgccgccgcc gcagcttggg aggtgctgcc accacaggta ccgtcacgcg ggtgctcagg 180

gcgcctgccc gcgggcccca gctcgacccc agccgcgtgg agctgggagt tccggaatgg 240

gggccgctag gttcgggggt gcgtgggcat ggcgctgtcc agcagccgtg cgggccggcc 300

ctggagaccg caggccggca aggaggcagg gccgcgcgtc cccaccccca acccggccgt 360

gtccctgcac cggccggccc ctggagctcc gcgtccccac cagacctccg cgggcccctg 420

gtgtgacggg gggagatgcg cggcgtcgca tcccctggcc tagttgctcc gggaagctgt 480

tgtagaacct gctttggtgc tgtttgggtt ttccggagtg cgggggagag caggttctcc 540

actttgcctc ttttggaaga tcttattgag agacaacgct agttgctttg ctggttttgc 600

ttggtttcta gttttccgta ttgcttaaac ctcaactttg ctcactaatg ttgcttctgt 660

ttacttctga gtgggtttat gacctcagta tttaaccggc ttataatgtc acgatagcgt 720

tagttgcagg gagccctggc tccggactgt ttgaatcaca gaaagttgtg cagatgggaa 780

tgcggagggg ggggcagtga gtcgctgtgg gggctctggc aggggtcagc ccctggttcg 840

ggtcactcac tgctccacct tgtatggcga cagtcggagc taggtgaata aactctttct 900

ggggattttg taatacttat cgtgaagcgg ccatagaaaa ggtttaatgt tagcgttgcg 960

tgtgtttctt ttatttggcc aaaaatttgt ggagtttggt tatgccgtgt ctttattggt 1020

ttgctgtcag gtcaggatat tgagcaaaag actgacgctt ttattaggga gtcagggtcg 1080

agggtgtcta gttagtgctg tatccatttt aggtgttcct cagtgatgcc taaagacttg 1140

ttttttgttt gtttgtttgg agacagggtc tcactctgtc tcccaggctg gagtgcagtg 1200

gcgcgatctc ggctcactgc agccttgatt tcctgggctc aggtgatcct cccacctcag 1260

cctccccagt agctgggaca gcaggtgtgt gccaccacgc ccggctaatt tttgtatttt 1320

tttgtagaga tgggggtctt gctgtgttgc ccaggctggt ctttaactcc tgggctcaag 1380

cattatacaa gccttggcct cccaaagtgt tggtattaca ggcgtgaacc accgtgcccg 1440

gccaagacct gtatctttta aaatgtgtgt taatatagtt tacattttag gtgttttaca 1500

catttgcagt attcccactg agcacatgat gtaaaaaaca ctatataaat atatttaaca 1560

ctgtataaat atatttccat atttattctt ttggtcataa attgaaatgg aaagaattag 1620

gctttttaaa tttattatga actgatctga tgtttgaatg ctctctcttt tctttctttc 1680

tttttttttt tgagatggag tctcgctctg tcgcccaggc tggagtgcag tggcgccatc 1740

tcggctcact gcaccctccg cctgccgggt tcaagcgatt ctcctgcctc agcctcccaa 1800

gtagctggga ctacaggcgc ccgccaccat gcccggctac ttttttgtat ttttagtaga 1860

gacggggttt caccgtgtta gccaggatcg tctctatctc ctgacctcat gatccgtccg 1920

cttcggcctc ccaaagtgct gggattacag gcgtgagcca ccgcgcctgg cttgaatgct 1980

ctctcttttc ttttgctgtt gcggcaaaaa cgccccctct ctagagatct ccgtggactt 2040

tataatcact ggtttggggc ccttcccccg ttccctcagt cactgtcatt aggtgggtaa 2100

aaagtttact acaagtttat tactagaaaa atggaggcat atgcgattca ggaattaaat 2160

aaactaaaaa aggaaagaaa aagtgtgcct gtgggcttca ctgcaggtat gtatattaac 2220

atttggtggt agactttagg gatgttttct ctctcagaat ctagccatgc atgtgaatgt 2280

gcctcaggga tcctggaatg acaggttcat gtgctgtttg cttactctca ccattggtgg 2340

ttgccagtgt tttaccggct ctgacaggta cttcatatac agtttgtgtc atcacccccg 2400

ttgaacagat gagaggactc ctcatagaga agctgggttc ttacaaggtc acccagcttg 2460

tcaagggtgg atcatccttc aaaccaggtc tgccacacct ctgccacctg agctccttcc 2520

gttagaactt gctaccttac tgagttggct aaagaaacaa ggttcaggtg tcgtcttttg 2580

ccactcagag taataattct gggtgatatc gagcacttgt gctgtttagg cagtgtccta 2640

ggtactgtaa tattagctta tctcacttag ttttcataat aaccaggtga gataacactg 2700

ttatcacccc ctttacggag agttttagaa aagttatttg actggccctg ggtcacctag 2760

cgaatttgag acggagtgtg ttgtgtgcaa actgagattt ggctgacaaa agagtccatc 2820

cttttatgct gttcttgtac ctgcttccac agtctgtttt tttttttttt tttttgagat 2880

ggagtttcgc tcttcttgcc caggctggag tgcaatggcg tgatctcagc tcactgcaac 2940

ctccgcctcc caggttcaag cgattctcct gcctcagcct cctgagtagc tgggattaca 3000

ggcatgcact accacgcctg gctaattttg tatttttagt agaggcgagg tttctcccta 3060

ttggtcaggc tggtctcaga ctcccgatct caggtgatcc gcccgcctcg gcctcccaaa 3120

gtgctgggat tacaggcgtg agccactgca cgcagcccac agtcttttct gttgctcatt 3180

ggcaggtaag ggtagtggaa gaaggtggta ggggtggtgg gaggaagcca gcgtcactga 3240

ctctagtgtg gggatggtgg aactcagcaa gaaggtgaca gcaatttgac cactgccatt 3300

tgacagtttc tgcttaagca gtcaagggca ctaacctaga atggttgcag ggatgctaaa 3360

tcataaggaa gctttgcagt ggggtccaaa gttggtatgt aagcataaag atgcacgtgg 3420

atctcaggaa aaaaataaaa ctaattttcc tgtttatttc agcttcattt aattattatt 3480

attattatta ttattttatt ttattttttt tttttgagac ggagtctcgc tctgtcgccc 3540

aggccggact gcggactgca gtggcgcaat ctcggctcac tgcaagctcc gcttcccggg 3600

tttacgccat tctcctgcct cagcctcccg agtagctggg actacaggcg cccgccaccg 3660

cgcccggcta atttttttgt atttttagta gagacggggt ttcaccttgt tagccaggat 3720

ggtctcgatc tcctgacctc atgatccact cgcctcggcc tcccaaagtg ctgggattac 3780

aggcgtgagc caccgcgccc ggccccattt aattattatt attatttttt tgagatggag 3840

tctcactcaa tctgttgccc aggctggagt gcattgatgc tatcttggtt tactgcaatc 3900

ttggtctcct gcctcagcct cccgagtagc tgggattaca gctgtgcacc accacacctg 3960

gctaattttg tatttttagt agagatgggg tttcaccata ttggttaggc tggtctcaaa 4020

ctcctggcct caagtgatcc acccacctta acctcccaaa gtgctgggat tacaggcatg 4080

aaccaccata ataattttta ttatgtactt tataatgtac actgtattat cactgtagta 4140

catatataat ttatatgtaa gtgtacatgt attgggagca tatacttgaa tttttgttgt 4200

tgggcattca tgatcaaaac atttgggaac cagtggctta tttgatattt agcattttca 4260

gaaagcataa aatatacaag gtgttggcca ggcacagtgg ctcatgcctg taatctcagc 4320

actttgggag gctgaggagg gtggatcacc tgaggtcagg agttcgagac cagcctgacc 4380

aacatgtgtg aaaccccgtc tccactataa atacaaaagt tagccaggtg tggtggcatg 4440

cgcctgtagt atacctctaa gtatactaga actatgttga tgttttcctc tctctgcctt 4500

ggccactagg aagctcagag tcaagtttgt atccagggtc ttccagcttg tgcttaagtg 4560

ttttaatcgt ctagattgtt tttaatggtt tctgctcttt gtctcaggtt ttactataaa 4620

atacataaca catttccttc ccgttctaaa tattactgtg attgtattct tatagccaaa 4680

tctttgttct tattcttatt ttattttatt ttttatactg ttgaatccct ctgagccttg 4740

cctttccctg cctcctcttc tgtactcatt tttgctaaaa tttgtaaggg gataaattct 4800

tgaaaagctt tgcacatttt gaagacttgt ttgtttttta atatttatta tagtaaaact 4860

caaatataca tccaaataga gagcaataag cccttgtgta cctatcactc agttatgtct 4920

gtcacttagt cattaacttg gggacactct tgtttcatct atatccttta atcctcatta 4980

tacttttttt tggggggaga agtttattaa ttgataggtg ttactttggg gtaaatgagg 5040

agggagccca ctagtatgct ggggaactgg taaggttttt ttgttttttt cttgaaacag 5100

agtcttgctc ttgtcgccca ggctggagtg cagtggtgcg atctcggctc actgcaacct 5160

tcgcccccct gggttcaagc gactctcctg cctcagcctc ccaagtagct gggattacag 5220

gcacctgcca ccacacctgg ctagtttttg tacttttagt agatgggatt tcaccatgtt 5280

ggccaggcta gtcttgaact cctgacctcc ggtgatctgc ctgcctcggc ctcccaaagt 5340

gttgggatta taggcgtgag ccactgcgcc ccgcaaaggt tcttttcttt gggatccttt 5400

cctgtcctta gagaagaccc tttagctttc tgcctgagga gctgatgcct agttgtcagg 5460

ctttcttctt gcccagataa gggtgttaac tcctgtgtac agatgttcac ttaatccttt 5520

ttaccagtcc cacatctcac tatagcccta tgctacacct gggtttctcc atcccaagcc 5580

cctttagggt ctctagtgcc agtcttcttc ctcattggct atgtccccta ggttcttttt 5640

tatttttccc aacggtgatg cacttactga gcagatgcag taatcttctt acctgagcct 5700

acatataacc attggcctaa atgtatgatg gtttgccagc atcagcaata agactggtaa 5760

tggggtaaaa aacaagttct cttaaggcta gctcttgatc ccctgttgta agctgaccaa 5820

cttaatctga aaataatttg cagcatgtaa atattttagg attagagcca tctgtataca 5880

cacttaaaag tagttttgct accattacat tagtctaaaa gagttaccta agaatgccaa 5940

acgatatttt gttcgaatgc cttggttatt ttaatttaaa agcatttctt tcaaaaccgc 6000

ttctctcttc acaatagtag agctgtggca gtgaactaag aggtcaagga ttcagtgaat 6060

ctgtggctaa tttcttgttc caatctgaga gctctctttg cactatgatc aaaatggagt 6120

cttgccaact gcccagggta atagccttgc aagtctcttc cttgttgagc aatgaatata 6180

agttccacat ggctggggag gcctcacaat catggcagaa ggtgaaagag gagcaaaggc 6240

atgtcttaca tggtggcagg caagcctctt ctcattatac ttttaaaatt atttggtggc 6300

tgggtgcagt ggctcatgcc tgtaatccca gcactttggg aggccaaggt gggtggatca 6360

cttgaggtca gaagttcaag accagcttgg ccaacatggt gaaaccttgc ctgtactaaa 6420

aatacaaaaa ttagcagggt catggtggca cgcacctgta attctagcta cttgggaagc 6480

tgaggaagaa ttgtttggac ccagaggtaa aggttgcagt gagccaggat cgtgtcacag 6540

cactccagcc tgggtgaccg aacaagactc tcaaaacaaa caaacaaaaa ttatttggtg 6600

attttttttt tgagacggag tctccttgtc actcaagctg gaatgcaacg gcgtggtctc 6660

tgctcaccgc aacctttgcc tcccggttca agcgattctt ctgtctcagc ttaccaagta 6720

gctgggacta caggcatgtg ccaccacacc cggctaattt ttgtattttt tgtagagata 6780

gggtttcacc atgttggcca ggctggtctt gaactcctga cctcaagtga tctgcccacc 6840

ttggcatccc caagtgctgg gattgcaggt gtgagccaac gtgcctggcc cattttaacc 6900

atttttaagt gtactattta gtgacattaa atgtattcac attgttatgc aaccatcatc 6960

actatccatt tccagaatgt tttcattatt ctacatagaa actatcgatc caggagccat 7020

atgtagaaag ctgaaactgg atcccttcct tacaccttat acaaaaatca attcaagatg 7080

gattaaagac ttaaatgtta gacctaaaac cataaaaacc ctagaagaaa acctaggcaa 7140

taccattcag gccataggca tgggcaagga cttcatgact aaaacaccaa aagcaatggc 7200

aacaaaagcc aaaattgaca aatgggatct aattaaacta aagagcttct acacagcaaa 7260

agaaactacc atcagactga acaggcaacc tacagagtgg gagaaaattt ttacaatcta 7320

cccatctgac aaagggctaa tatccagaat ctacaaagaa cttaaacaga tttacaagaa 7380

aaaaatcaaa caaccctatc aaaaagtggg tgaagcatat gaacagacac ttctcaaaag 7440

aagacattta tgcagccaac agacacatga aaaaatgctt gtcgtcactg gccatcagag 7500

aaatgcaaat caaaaccaca atgagatacc ctcacaccag ttagaatggg gatcattaaa 7560

aagtcaggaa acaacaggtg ctggagagga tgtggagaaa taggaaccct tttacactgt 7620

tggtgggact gtaaactagt tcaaccattg tggaagacag tgtggcgatt cctcaaggat 7680

ctagaactag aaataccatt tgacccagcc atcccattac tgggcatata cccaaaggat 7740

tataaatcat gctgctataa aggcacatgc acacgtatgt ttattacggc actattcaca 7800

atagcaaaga cttggaacca acccaaatgt ccatcaatga tagactggat taagaaaatg 7860

tggcacatat acaccatgga atactatgca gccataaaaa aaggtgagtt catgtccttt 7920

ataggtacat ggatgaagct ggaaaccatc attctgagca aactatcgca aggacagaaa 7980

accaaacacc gcatgttctc actcataggt gggaattgaa caatgagaac acctggacat 8040

gggaacatca ctcaccaggg cctgccgggg gatgggggga ggggggaggg atagcattag 8100

gagataaacc taatgtaaat gacgagttaa cgggtgcagc acaccaacat ggcacatgta 8160

tgcatatgta acaaacctgt atgttgtgca catgtaccca agggccagtg ggtgggaatt 8220

ggtatctcat tgtgatttca atttgtattt tctaaggaat attgatgttg agcaattttt 8280

catatgttga ttggccattt gtatatcttc ttttttgttg ttgtttgggt ttttttttct 8340

ttttcttttt cttgagacgg ggtcttcttg ctctgttgcc cagactgcag tggcgcaatc 8400

acagttgact gcagcctcaa gcctctggtc ccaagtgatc ctcccacctc agtcttccaa 8460

gtagctggga ctgcaggcat gtgcccccat gcctggctta tattcatatt ttttgtggag 8520

atggggtttc accatgttgc ctaggctggc cttgaactcc tgagctcaag tgacccatcc 8580

acctcagcct tccaaagtgg tgggattaca ggcatgagcc accccaccga gcctgtatat 8640

cttctttaga gaaatgttca ttcaagtcct tttctcactt tgagttatta attgttattt 8700

tgttgttatt gttgagttgt aggaattctt tacaaattct ggatattaaa cccttgttag 8760

atatatgatt tgtgaatagt ttctcccatt ctgttggtta gcatttcact ctctttattg 8820

tgtgatttgc acaattttta actttttttt ttttttcttt tttaagacag agtctccctc 8880

agtcacccag ggtggagtgc agtgctacag tgttggctca ttgcagcctc cacttcctgg 8940

actcaagcag tcctcccacc tcagcctctc aagtagctga aactacaggt gcacaccacc 9000

atgcctggct aatttttttt gtatttattt ttttttaaga tatggggtct tgccatgttg 9060

tccaggctgg tctcaaactt ctgagctcaa gcagtccgct tgccttggct tcccaaagtg 9120

ctaggattaa ggcgtgagcc accacgcccg gccaaaagtt tttaattttt atgaattcca 9180

gtttatcaat ttttttcttt tgttgcctat acttttcaat ccttgctaaa ctcagcatca 9240

tgaagatctt tttcttatat tttcttctaa gggctttaca gttttagctc ttcttttttc 9300

atttatttga tctattttga gttaattttt gtgtataaga gtccaacttc acttttgcgt 9360

gtaactatcc agttttccca gtagcatttg ttgaagagac tgtcctttcc ccagtgactg 9420

gtcatggcat ctttgtcaaa aatcagttga ttatatttgt gagagtttat ttttgggttc 9480

ttttttcttc ttcttttctt tttttcaggt tagatgggta gtgctgacat cataacaagg 9540

ttcaagaatg actcatctca catgtgtgtg aaacacccag gtatcatact gatgaactac 9600

agaagatctg ggctctctat tgttttatat gtctgacctt atgccagtac cacattgttc 9660

tgcttactgt agctttatag taagttttga aatcaggaag tgtgagtcct caacttagtt 9720

cttgtttttc aagtttgttt tggctattca gggttcccac ttttttcttt ggacaaagta 9780

atggggagaa tttctttctt tttttttttt tttttttttg gtttttaaga cagtctcact 9840

ctgttgtcag gctggagtgc agtgacgcaa tcttggctca ctgcaaactc cacctcctgg 9900

gttcaagcga ttctcctgcc tcagcctcct gagtagttga tattacaggc acctgccacc 9960

acgcccagct aatttttgta tttttagtag agacggggtt tcaccatgtt ggccaagatg 10020

gtctcgatct cttgacctca tgacccacct gccttggcct cccaaagtgg tgggattaca 10080

ggcgtgggcc actgcaccca gctttttttt ttttgttttt ttaaacaagt aaatggaaag 10140

aaatcccacg ttcatggatt ggaagacaat attctttttt tttttttgag acggagtctt 10200

gctctgtcac ctaggctgga atgcattggc gcagtcactg ctcactacag ccttgagctc 10260

ccaggctcaa gtgatcctcc cacctcagcc tgctaagtag gtgggactac aggaatgtac 10320

tactgtgcct ggctaattaa aaaatttttt gtagagatgg agtctcactg tgttgcccag 10380

gctggtcttg aggactccag ggctcaagca gtcctcccca cttgacctcc caaagtgctg 10440

ggtttacagg catgggccac cgtgcctggc cagctgttag aattttgata gggattgcat 10500

tgcattttga tatggattgc gtttgtagat agctttggat aacgttgtca tttaaagaat 10560

attgtcttcc cagcctggcc aacatggtga aaccctgtct ctactaacaa tacaaaaatt 10620

atccaggtgt ggtggcatac acctgtaatc ccagttactc aggaggctga tacaggagaa 10680

tcgcttgaac ctgggaggcg gagattgcag tgaaccgaga ttgtgccact gcactccagc 10740

ctgggtgaca gagcaagact ctgtctaaaa aaaagaaaaa aaaaaaagaa tatcatcttc 10800

caatccatga aagtgggaaa gtgggatttc tttcccttta ttttacgtct ttaatttgtt 10860

tcagcaatgt ttcagtttat gtcttttgtc tcccttgctt aaatttattc ctaagtattt 10920

tattcttttt gatgctatta taaatggaat gttttcctaa ttttgttttt agattgttca 10980

ctgtcagtga acaatagaaa tgcaactgat ttttgcatgt tcattttgca tcctacaact 11040

ttgttgaatt catttattag ctgtgtgtgt gtgtaatctt tagggttttc tacatgtaag 11100

atcatgtcat ctaggaacgg aaataatttt actacttcct gtccagttga gatgcctgga 11160

gagaaagggt aaatgaggca gtgagaaggt tcttgcttaa tttctctggc taaaactttt 11220

cagtactgga ttaaatagaa gtggcatcct tgtcttgttc ctgattttag gggaaaagct 11280

tttagtcttt caccatcaag tgtgatgtaa gctgtgagat tttcatatat acccctttat 11340

tatgttgagg atattgcctt ctattcctat ttcattgagt attttttaat caaaaagtta 11400

tcttgaattt tgttaaatgc tttttctgca tcagttggga tgatcattgt ttttctcctt 11460

cattctagta atgtggcata ttaccttaat tgatttttgt taaaccatcc ttgcactttg 11520

ggaataaatt ccacttgtca tctgagatgt atgtttaata tctactttaa aaaaaaaaac 11580

acaaatcagt cccagcctgg gcaacatagt gagaccctca tctctacaaa aaataaaaaa 11640

agcctggtgc agtggctcac gcctgtaatc ccagcacttt gagaggccga ggcaggcgga 11700

tcacctgaga tcaggagttc aagaccagcc tgactaacat ggtgaaaccc cgtctctact 11760

aaaaatagaa aaattagcca ggcttagtgg gaagcgcctg taatcccagc tactcaggag 11820

gctaaggcag gagaattgct tgaacctggg aggcggaggt tgcagtgagc tgagatcatg 11880

ccactgtact ccagcctggg tgacagagcg agactctgtc tcaaataaat aaatattaaa 11940

aaataaaata aaataaatta gccagatgtg gtggctcatg cctgtagtcc cagcagtgtg 12000

agaggctgag atgggaggat cacttgggag gttgagaccg cagtgagcca cgattgtaca 12060

actgtatcca gcctgggtga cagagcaaga ccctatctca aaaataaaac aaaaaaccaa 12120

aaaacttaga agtcaacaga tgcttattga attcttccta ggtgtcagac actgttaaag 12180

ttctggggat tcagcagtga acaaggctaa gcccctgttt tcttttaatt tttaatttta 12240

gttttttttt tagggacagt ctcactttgt cacttaggct gccaggctcg agtgcagtca 12300

tgcattctca gctcactgca acctctgact cctgggttca agttattctc gtgcctcagt 12360

ttcccatgta gctgggatta caggcactac cacacccagc taatttttgt atttttagta 12420

gacacaaggt ttcactatgt tggccaggct ggtctcaaac tcctgacctc aagtgatccg 12480

cctgcctctg cctcccaaag tgctgggatt acaggcacga gccaccgcac cccggcccac 12540

tggagtgttt tgagcagggt agtgacatta gtgatttgtg ctttagaaag atttatcgag 12600

gatggaatga ggcaggaatg aatagaggca ttcctgctgt ccccatggtc agtgatggga 12660

gagtagccag ggagatgatg attgttggtc aggttgggga tctgacttgg aggtaaaact 12720

gttgtaacca gctgtttcag atgtgggctt gttgtaggat gtttcctaaa ctttccgccg 12780

gaggaataaa cagggtagct agtggtataa ttaactgaga tggctgggaa agaacagcta 12840

ctgtggggaa atcaagaatt ctgtttttgg tcttgttaga tttgaagtgc ttattaggca 12900

tttgagtgga gataccaagt ggaaatagtg taaataagga gcttagggga gaggcttgag 12960

aggtgtgtat gtaagagaca tcagcaaaca gatgagaatt ggagccagga gtcaggctga 13020

gaagccctgg ggagaaaggg tagatgagga aagcaggcca ggaacaaagc ctatggggaa 13080

gcaggaaggg aggctgagaa gcacaacctt ctaggacatc agtagggaca tgatgtcact 13140

cacaactagg aaataagtag gtgttttcct ttctttcttt cttttttttt tttttttttt 13200

ttgagacgga gtttcgctct tattgcccag tctggggtgc aatggcgcga tcttggctca 13260

ctgcaacctc cgcctctcag gttcaagcga ttctcctgcc tcagcctcct gagtagctgg 13320

gattacaggc atgtgccacc acgcccggct aattttttgt atttttagta gagacggggt 13380

ttcaccgtgt tagccaggat ggttgtaggc gtttctcatt tcagcatagt gtctttatgg 13440

tcagcccttt cagtggctgc ctctgatggt gtttgatcat aagtcataac tcatccatga 13500

aggtgtttta cagtctgtct tcaagcaggc aggtccttag attgaaagaa tggaggcttc 13560

actgcgtgtg cctttactac acagatagcc gatggggcag aggttgtata gctgatgggg 13620

cagaggctgt cagatgactg ttttacagaa aaacctttga caagttatat agtaaacttg 13680

ttaaaagaaa aagttgatct cctagctaag acaaaaggtt tcagtttagg aagataaaaa 13740

agatggatgg tggtgatggc tgcacaacaa tatgaatgta cttaatacca ctgaactgta 13800

cacttaaaag gggttaaaat gatgtttatg ttaataattt ttttttacca caaaacgaag 13860

tagaatactt tgtcactgat tatagtaaac atttaaatct gaatgctaga ttgctttttt 13920

ttgagatgga gtctcactct gtcgcccagg ctggagtaca gcagtgtgat ctcagctcac 13980

tgcaaccttt gcctcctggg tttaagtgat tctcctgtct cagcctccca agtagctggg 14040

attataggtg cctgtcacca tgctcggcta atttttgtat ttttagtaga gatagggttt 14100

caccgtgttg ctcacgctgg tctcaaactc ctgacctgaa gtgatctgtt tgcctcggcc 14160

tccgagagtc ctaggattat aagagtgagc caccgtgccc ggcctagact gctcttacat 14220

aggttaaaac acattatttt gttgggaggt gctggggaat caactctgtc atggaaatgt 14280

tccccgggct gggagttgga accagagtgt tgattgttgt catttgctac atgacctggg 14340

tcatctggca tgaccttccc taagcctcag tttcttcctt accaatagga tattgtgctg 14400

gaggatccca tctctcctag ctctgaaatc tggtagcttt ctgttccttt gtctctataa 14460

atgtctggaa ggcaagcaag ttccagtctg agaagtgact gtgaacattt ggaagaattg 14520

tgtggtccca gtgcatatca cagtccacag ttgtcctgtt agctggaaag ttttacttag 14580

taccagatta tagatatgaa aaagaagcaa ttaaaactta cagcaggcct tacaatttga 14640

gacagaaaca aaatctttgt tttttagact ttgaccaaat atttgggaat gagcaccatg 14700

tagatgtgat ttgtttatct gtgaggcttc acacattgtg acttgacaag aacccatagc 14760

acttaggttt gtgagcccag agtaccaccc tttgccttga agagtgtgga gggagtctta 14820

gggccagcgg tgagcaggat gaaaggttct tagaagctgg tgggcatgga gggggtacag 14880

aggggaggct ctcctgggag ataaggtggt ggaaggggcc ggtgaagtct ggtgtgctgg 14940

agagagctct aggggctcct ggaccctcac cccaaggaaa aggggcccag gtgagcctca 15000

tctcttggct ttcttctttg ccacatttct cctcacaaac tcctcccctc tttgcactgt 15060

ttggaaccct cttccatgca acgtttatat taagagttct tgctgggcgc agtggctcac 15120

gcctgtaatc ccagcacttt gggaggtcga ggcgggtgga tcacgaggtc aggagttcaa 15180

gaccagcctg gccaggatgg tgaaacccca tatctactaa aaataagaaa attagctggg 15240

cacagtggca ggcacctgta atcccagcta cttgggaggc tgaggcagga gaatcgcttg 15300

aacctggggg cgggggcaga ggttgcagtg agccgagatt gtgccactgc acttcagcct 15360

gggggacaga gtgagactct gtctcaaaaa gacaacaaca acaaaaaacc aaaaaacagt 15420

tcttgaagtg ttgtgggaag tcagggaccc cgaacggagg gactggctgg agccgcggca 15480

gaggaacata aatggtgaag atttcatttt aatatggaca tatatcagtt cccaaaatta 15540

atacttttat aatttcttac acctgtcttt acttcaatct ctgaacataa atcgttaata 15600

tttcctttta atatggacat ttatcagttc ccaaaattaa tactttataa tttcttatgc 15660

ttgtcttact ttaatctctt aatcctgtta tcttcgtaag ctgaggatgt acgtcacctc 15720

aggaccacta ttgtgttagc tgtacaaatt gattgtaaaa cgtgtgtttg aacaatatga 15780

aatcagtgca tcttgaaaac agaataacag ctattttagg gaacaaggga agacaaccat 15840

aaggtctgac tgcctgtggg gtctggcaga atagagccat atttttcttc ttgcagagag 15900

cctataaatg gacatgcaag tagggaagat atcgctaaat tcttttccta gcaaggaata 15960

ttaataatta agaccctggg aaaggaatgc attcctggtg ggaggtctat aaatggccgc 16020

tctgggagtg tctgtcttat gcggttgaga taaggactga aatacgccct ggtctcctgc 16080

agtaccctca ggcttactag gattgggaaa ctccgccctg gtaaatttga ggtcagaccg 16140

gttctctgct cttgaaccct attttctgtt gtttaagatg tttatcaaga caatacgtgc 16200

acagctgaac atagaccctt atcagtagtt ctgaatttgc ctttgtcctg tttcctcaga 16260

agcatgtgat ctttgttctc ctttttgccc tttgaagcat gtgatcttgt gacctactcc 16320

ctgttcttgc accccctccc cttttgaaat ccttaataaa acttgctggt tttgcagctc 16380

gggtgggtat cacggtccta ctcatatgtg atgtcacccc tggaggccca gctgtaaaat 16440

tcctctcttt gtactgtttc tctttatttc tcagccggcc gacacttacg gaaaatagaa 16500

agaacctatg ttgaaatatt gggggtgggt tcccctaata ttgaagtagt aacgcaacga 16560

gactcgtcac atctcccatt ttgggatttg attgtataaa actgtcaaga gctttgatgc 16620

cctccagcaa agcacgcttc ttgcaggaaa tcaggcaaag ggtgtttagc ctgtgtggcc 16680

tgatatgctc atgtgtagct ggtggcagga ggctggtcct ggctgtgctc ctacaagtac 16740

ctgctggagt ggaggctgag gacactctgt ccatgggcca agacattgtg tgaaatgaca 16800

aggctgcccc catgggctct caagttgttt ctagctttaa aacagattct tggctgggta 16860

cggtggctca cacctgtaat cccagtactt tgggaggcca aggcgggcag atcacctgag 16920

gtcaggagtt tgaaaccagc ctgaccaaca tggtgaaacc ccatctctac tgaaaataaa 16980

aaattagcca ggcatggtgg cacatacctg taatcccagc tacttgcgag gctgaggcaa 17040

gagaatcgct tgaacccagg aggctgaggt tgcagtgagc cgagatcacg ccgttgcacg 17100

tcagcctggg caacaagagc aaaactctgt ctcaaataaa gaaataaata aaaataaaac 17160

tgattcttag cagcagcagt tcagtccctt tgttagtcat tcctgaccag gtcaagaggg 17220

agtaagaatg taggtaactg gcattgtgga agaaaatctt taataggttt gttggtgttc 17280

tattgtaaag agggttgaca ttatgcacgt ggttatttgt gacaaccatt acaaccaact 17340

aatataattt ggtcttactt caatttgggt gttgctgtgc catcccaaca gttactctaa 17400

aatgtgccag tactcatctt cttgaatatg tgtgttttta ggctttaaat tctctgaaat 17460

cagctttcgt tcattaactg aaattccttt attttttcaa tactatttaa ttattattat 17520

ttttttgaga cagagttttg cccctgttgc ccaggctgga gtgcagtggt gcaatctcag 17580

ctcactgcaa cctctgcctc cagggttcaa gcgattctcc tgcctcagcc tcctgagtag 17640

ctggaattac agacgcatgc caccacaccc agctaatttt tgtttttgag tagagacggg 17700

gtttcactgt gttggccagc tggtcttgaa ctcctgacct cgtgatccac ccgccttggc 17760

ctcccaaagt gctgggatta caggcatgag ccactgcgcc tggccacgcc ctgctaattt 17820

ttgtattttt agtagagacg gggtttcacc atgttgccca ggctggtctt gaactccaga 17880

cctcaggtga tctgcccacc tcagcctccc aaagttctgg gattacaggc gtgagccacc 17940

gtgcccgacc ttttttcaat actattaact tgatctgctg aaaattctcc caggttactg 18000

gctaattttg aagcttagag aagcaatttt ctttttattt atttattttg agacggagtc 18060

tcgctccatt gcccaggctg gagtgcagtg gcgccatctc agctcactgc aagctccgcc 18120

tcccgggttc atgccattct cctgcctcag cctcctgagt agctgggact acaggcaccc 18180

gccaccaggc ccagctaatt ttttgtattt ttagtagaga cggggtttca ctatgttagc 18240

caggatggtc tcgatctcct gacctcgtga cccacccacc tcggcctccc aaagtgctgg 18300

gattatagac gtgagccacc gtgcccggcc cagagaagta attttctgcc cttagcattg 18360

gtccgcttga caactttcag aaaaacatta tcccaaaggg atgaattgtt tgcaccagtg 18420

gactagttta gctcagtgag cagacctata gtgactttct gctcagcacc aggtgaggtg 18480

ctgggtgctc tagggaacac aaggtgattc agttattccc ttctcctgaa ggggaacgca 18540

gtcaatccag gaggctgaga gagtcagaat gagcaaggtg gaagttcaca gttagagaag 18600

ctcagagaag agggctgctg cttccacagg aaactttgct cattattttt taatttcagc 18660

ttttcaatgt agaaatacat ttacatgaca caaaattgga aaggtaaact acatgggaaa 18720

gtttcccttc catcttgcac ctggctacca gatcctctcc ccagaggctg ctggtgctgc 18780

cacttctcat gtgtccattc ccaggtgttt tgtgcattta tagacaaata agcagagact 18840

tctgttctct tacatgaaag taggacactg ctcccttgct tttttctctg aatgtttctt 18900

tatgatagtt tatcattaat ttttgtattt ttagtagaga cagggtttca ccatgttggc 18960

caggctggtc tgaactcctg acctcaggtg atccacccgc ctcagcctcc caaagtgctg 19020

ggattgtagg tgtgagccat tgtgcctagc tgggctttgg tatttttaaa ttgattttgt 19080

caaaattgct tatatacgcg ggaatttagc accttgtcag cgatatgaat tgcagttgta 19140

tttttccaga tcttatttat cttttttttt tgagacggag tctcgctttg ttgcccagac 19200

tagagtacag tggcacgatc tcacacgatc tcggatgatc tcggctcact gcaacctccg 19260

cctcccaggt tcaagtgatt ctcctgtctc agcctcctga gtagctgaga ctacaggcgt 19320

gtaccaccac actggctaat ttttgtattt ttagtagaga cagggttttg ccatattggt 19380

cagactggtc tcaaactcct gacctcaggt gatccacctg tctcggcctc ccaaagtgct 19440

gggattacag gcatgagcca ctgcacctgg cctaaagtaa tttttatatt tcatatttta 19500

cctttaaatc ttttctctat ttggaattta tttttatttt ttatttttat gttgaggcag 19560

ggtcttattc tgttgcccat actggagcac agtagtgtga tcatggctca ctacagcctg 19620

gaccttgcca ggctcaggta atccacccgc ttcagcctcc tgaatagctg ggactacagg 19680

tgtgcatcac catgcccagc taatttttgt acttttggta gagaagggtt ttgccatgtt 19740

gcccaggctg gtcttgaact cctgggttca agtgatctgt ctgccttgac ttcccaaagt 19800

gctgggattg taggcctgag ccactgtgct ttttggaatt tattttgatg tgaagtgtta 19860

gatccagctt aatttttttc cgtggctacc catttgttgc aacacctttt gttgcgcaat 19920

taatctttct cctacttgtt tatcatttac tgtatatagt atactttgcc atatgtgtac 19980

attttggtct attcctggac attctgttct gttacattaa tctgtgtatt tatgtgttag 20040

gaccacactg ttttaattac tctagcatgt tttgttattt ggtgaagtta gttccctttc 20100

atcatcttta ttttccagaa ctttcttggt tatatttgtt tttctgtata aacttgaagt 20160

ttgtttagtt aaagaagtcc tgtttttatt gggactgtta catttctaga tgaatgtagg 20220

aagagtgaca ctttggttac gttatattga cttttcctca ttaagaatgt ggcatgtttt 20280

tctttttgtt gaagtcatct tttctgtctt tcggagtttc agagatttct tttggtttct 20340

tttttttttt tttttttttt tgaggtggag tcttgctctg tcacccaggc tggagtgcag 20400

tggtgcaatc ccggctcact gcaacctcca cctcccaggt tcaagtgatt ctcctgcctc 20460

agtttcctga gtagctagga ttacaggaac gtgccacaat gcccagctaa tttttgtatt 20520

tttagtagag acggggtttc accatgttgg ctaggctggt ctttaactcc tgacttcagg 20580

tgatctgccc atctcggcct cccaagttgc tgagattaca ggcgtgagcc actgtgtcct 20640

gctgggagtt tcagagattt cttacatttc tttttaagtt tattttcaag tttttggttt 20700

tgttatttat tttagtgtta atgaatcatt attataatca atattatcat tattttactt 20760

ctgcctgctt gttgttgatg tatgtgaagg cattgatata tattagtttt cactacctta 20820

tggtgattct tttatcaact gtaaaaggtt ttcagttgat tatatatata tatatatata 20880

tatatatata tatgtaattt ttttgtatat atatttggat tttgtacata atatcatttg 20940

caaataatga taatttaact ttttcctttc cagttgtata cctatgtttt ctttgtcttg 21000

actgattgtg ataactagta gttccacaat agtaataaat aatgatggtt aaatgcatag 21060

cctgtatggc ccctgacgtt agtgagaaca cttctagtgt gttcccattg ggcttgattt 21120

tagctttgag attgagaaag atgtaaacat ttagttgaag tctgtattta ttttttatat 21180

atatatgtgt atttttttta ttattatttt ttgagacaga gtctctgtca tctgggctgg 21240

agtgcagtgg cacaatcttg gctcactgta acttctgcct cctgggttca agcgattctc 21300

ctgcgttcaa gcgattctcc tgcctcagcc acccaaatag ttgggattac aggtgcccgc 21360

caccatgcct gactaatttt tgtatttttt agtggagacg ggggtttcac cttgttggcc 21420

aggctggtct cgaactcctg acctcaaacg atccaccagc cttggtctcc caaagtgcta 21480

ggattacagg tgtgagccac cgtgcctggc ctaatatgta tgtatttatg tatgtatgta 21540

aatcaacgta cacatatcta ctaagcatct gtctattctt ttttttttgt gacggagtct 21600

cactctttcg cccagatggg agtgcagtgg cgtgatctct gctcactgca ggctccgtcc 21660

cccggggttc acaccattct cctgcctcag cctcccgagt agctgggact acaggtgccc 21720

gccacctcgc ccggctaatt ttttgtattt ttagtagaga cagggtttca ctgtgttagc 21780

caggatggtc tcaatctcct gaccttgtga tccgcccgcc tcggccaccc aaagtgctgg 21840

gattacaggc atgagccacc gcacccggcc tgtctattct tatcttaaaa ggatgagggt 21900

tgaattttat cagatgtctt cagcattggc agagatgatc tctgttaata tgttgaacat 21960

aacattgttt taacattagt acttacatgt ttctggtaca aaatgaatag gatgatgttt 22020

agagaaggct tatggaggaa atagcatttt atctagtgcc tgaaggctga atggagaaaa 22080

ttagaggtgg gaaattagag tgggaagata ggaaaagggc attcagtaaa gagagagcct 22140

tgactgcaaa ggtgtggaaa gtgggaatgt aggttatttt ggggaagaat gccagcatcc 22200

caacattact gtgatattca tgagggcctt ctagatgggt aacatggggg cgtattacac 22260

ctctggactt cagattcttc ctttgtggaa ctgaaatagt aaaagtagtt attagtttaa 22320

gggttgttac aaggattcag gagataatgt aggcaaaagt cttaggccag aggctgacac 22380

atggtttata aatactagtt atttttattt gacaagagaa taaagctgga aagaggtttc 22440

agtatatttt gagtgtacct gtataataag caaagaagta tggcctcaga tatgcaggca 22500

ctggagagcc attcagaact tttgtgcaag gggtgacata agcaggtctt ttttttttcc 22560

attaaaaatt ttttttaaag agatggggtc tcactatgtt gcccagactg gtctcgaact 22620

tctgggctca agcaatcctc ccatctcagc ctcccaaagt gccgggatta caggtgtgag 22680

ccactgtgcc tggccataag caggtcttta ttttaggaag ctgtccatgc tgaccatgtg 22740

ggaagacaaa ccagaagtga agtgcaaatg caggtagcaa aatcaggtag gagactatta 22800

gaatttttca ggctggtggt tttggatatc tatcactagt ccagttcatt ttttattttt 22860

tgagataggc cttgctcttc tgcccaggct agagtgcagt ggcggaatca cagcttactg 22920

tagccttgac ctcctgggct caagcagtcc ttcccactca ggcttccaag tagccaggac 22980

tacagtcatg agccaccaca attggctaat ttaaattttt tttttttttg tagagacagg 23040

atctctgtat gttgcccagg ctggtcttga actttcctgg cctcaagcag tcttcctgcc 23100

tcagtgtccc aaactgctgg gattacagac attagttagc tacgatgcct gccctgctcg 23160

tccagtttag acatatgttc aagatgtggg caccatagag ttgacttagg caactcttgg 23220

gctccaggtt tggtagggca gtgtttctca aatttgagca tatcactgtc agctggaggg 23280

tgtgttaaat agagatttct gggcctcacc gccagatttt ctgattcacc aggtctggga 23340

taggcccaat aatttgcatt tctaacaagg atttagattg ggacatttgt gaagaacagg 23400

atggatgaag tgttccttgt ttatgatttc attcagagag aggggattat tagctctctt 23460

tcttccagaa tgcctgaggt gctttgtatc acagttagaa gttgagaaga tatgtactga 23520

gcactgtcct aataatatct gatcctggtt gggttggttg gtttgttcat cacttattca 23580

acaagtggtt tgttttcaga gacagggtct cactgtgttg cccaggctgg catcaaactc 23640

ctgggctcaa gggattgtcc cacctcagtc tcctgagtag ccgggattat aggtgcattt 23700

aataaaaatt taacatgcca agtgctatta aagaccctga agaacagaca gggagtttat 23760

ttatagtctt gacagaggac agatagtaaa ccagggaata agtcatttgt acaattacag 23820

agttttaaat gcactgaaaa agaagaaata ggctctgtaa ggaacaataa agagaactac 23880

tggaaaatat atggtcaagg gaggtctttt tgtagaagtg atatttcagc tgagacttga 23940

agaatgaaaa ggaaccagcc tataaagaga agagggaata gaggatggaa cagtatgtgc 24000

caggcccctg agatgggaat gaggttggca cacataaggc attggaagaa accagaacag 24060

ggagaggtga cacgaagtga agttgcagag gaccggggtg ggttgtgcag agccctgaga 24120

gctaggggga ggcatttggg ctttgttcta agtgcagaag ggtatccagc tcacagcatt 24180

agtagaatct gtgtccactc tgacctctga gataaagtga attgtaaagg gataggtagg 24240

aaggggtcta tgagggccag gcatggtggg tggctcagcc tgtaatccca actctttggg 24300

aggctgaggc aggaggattg ctggagtcta agagtttaag accagcctgg gcaacatggt 24360

aaaaccccat ctctattaaa aatacaaaca tttcgttggg tgtggtggtg cacgcctata 24420

gtcctagcta cttgggaggc tgaagtggga gaattgattg agcctgggag gtggaggctg 24480

cagtgagcca tgatcgtgcc actgcactcc agcctgggtg acagagtgag accctgtctc 24540

aaaaaaaaaa aaaaaaaaaa aggcattcca ggactgtttg aatatttgaa tataaacatg 24600

tatattttta cttttataat tgaaaaatag tcagcattgg ggctcataaa ggggaccttt 24660

ggggtaatgt tctgtttctt gatggaatgg tgtttaggtt acatggcttt gtttacttgg 24720

tggtaattca tggagctgtg tgcttataat ttgtgtgctt ttctgtgata tgttatacta 24780

aacttcaaaa gtttatttaa aatagtcttg cacggtggct catgtctgta atcccaacac 24840

tttgggaggc tgaggcagga ggattgcttg aaaccaggag ttcaagacca acctgggcaa 24900

catattgaga ccctgtctcc ccacaacatt tttttttttt aattagctgg ccatggtggc 24960

acatgcctgt aatcctagct acacgggaag ctgagctggg aggactgcgt ccaggaattc 25020

aaggctacag taagacatga tagtgccact gtaccccagc ctgggtgaca gagtgagacc 25080

ccatctctaa aaaaagaaaa ataaataaat gcttatagtg aaaaatgtaa agatactgag 25140

atttgagttt aaaaatttct ctgctgggtg tggtggctca cacctataat cagtttggga 25200

aattgaggca ggaggattgc ttgagcccag gagtttgaga ccagcctggg caacgtggca 25260

aaaccctgtc tctactaaaa ttaccaaaaa ttatctctca tggtggtacg tgcctatagg 25320

caggctaaag tgggaggatc acctgagcct gggagattga ggctgcagtg agctgtgatc 25380

ctgccactgc attccagcct gggtgacaga gtgagactct gtctcaagga aaaaaaaaaa 25440

aaaaccctgc atataatcac attacacaaa gacaagcaac cactactaac gtttccctct 25500

attctccttt tgtgcacttt ttgtatataa tttttatttt ttcaaattgt aaaagtaatg 25560

tgtgcttttt gtagaaaact ttactacatg cttctcacaa tgaaatgatg tgattgacag 25620

aaaaatgcca gtaggcgtag tgtgaaaagt ttccttaggg ccaggagcag tggctcacac 25680

ctgtaatccc agcactttgg gaggctgagg caggcagatt cattgaggtc aggaattgga 25740

gaccagcctg gccaacatgg tgaaaccccg tttctaccaa aaatataaaa attagctggg 25800

tggggtggcg cacgcctgta actccagcta cttgggaggc tgaggcacaa gaattgcttg 25860

agcccaggag gcggaggttg cggtgagccg agatcacgcc actgcactcc agcctgggtg 25920

acagagcaag actccatctc aaaaaaagaa aaaaaagttt ctttgaaggc aaagaatcct 25980

gaaatgtagg aagattatca cattaaaaaa atttaagagt tctgatgtga taaagatgga 26040

gtaaacatac tccacccttt atgtctgaag agagcaactg aaatccctgg acagaatgca 26100

tggatcagtg gagtaacccc agaaagataa atgttagcat gcgaattgga gaaggaaacc 26160

agaactccaa ataccagtga actggtagtg agtttcccat aatttttttt cctccataca 26220

atattttcca gcctgcactt aaagtcagcc ccaaacctgg aaatgtgtgc tggatgtgca 26280

cagaaagagg tctaacagaa gccatctttc tagtttgagg agcaggaaag gggatcctca 26340

tgggtcagga atggggatgg aggaagaaat ctcgtgtgtt gtttgctttg tcttttctcc 26400

ttttctcttg ctctggccct ccacgtaatt gtgtagtggt ggagacagca gtgacattgg 26460

caaatggata ggagaggaag tcttctattt aaagggactg tggtcccagg agcatggagg 26520

gaatccttga ttttgttctt tcctttctct cattgctttt ccttggaggt agtcacagtt 26580

gtgggaggta ctcagcaggt tagggaaatt aaacccctga cttttagcca gaagaccagg 26640

aaaggggccc ttgggatctg gaaagtgtta ggaagattgt gtagaggaag gagctcaaca 26700

aattgaactc ataaagttgc atatgaactc ttgggctgtt cctcagaact aacatacgtg 26760

catctgaccc taaacagcat accaaaggct ttgaggacca aactgtggag tacattactg 26820

ctcaagtagt tctgcactgg cccctggacg gtatgcttgg gaaaaatcaa aataatactt 26880

aaaaggcttt gaaaactgat atcatattgg taccacagcc cacagaaggt gggtaggaac 26940

ttgtggactg gacctaatta ggttgattgc tgcaaagaca aattcaaaat tttacgtggg 27000

acttaaacaa gagctagagt cacatagcat aatattcaaa atgtccagta attcagaatt 27060

acttcagcta tgaaaaatca ggaaaatcat aaggggaaaa gacagccaac agatggcaac 27120

cacaacatga cacagatgtt gaaattatca aaaaattaaa agccaaagta taattaaagt 27180

attaattaaa accttgctat aacaagtaag ggtgaatgct cttgaaatga acagaaaatc 27240

agaaatttat ttactgcaaa atatgacaac ctaaatgaaa aattaattgg gtgggctcaa 27300

tagcagaatg gagaagacag aagagtcagt gaacatgaag gtagaataat agaaattatc 27360

cagtctgacc aacagagatc gaaataaaat gaaaaaaaaa aatgaacaga gcttcaggga 27420

cccatgggac aataacagaa agtttatctt ttatgttttt gaagtctcaa aaagagagga 27480

gaaagagtgg tgcagaaaaa aatttgaaga aattatggaa aggaataaat atgtttctgt 27540

tcacagataa catgataagt ctacgtagaa atttccaaag aatccacaca cacacacaca 27600

tgcagaaaga ctctggcact aataagtgat ttcaggacag ttgcaggata aaagattaac 27660

ataaaaaaat caatgtacta gcaatgaaca tgtgaaaatc aaaattgaaa acatagttgc 27720

taaaaagtga aatggtaggt ataaatctaa caaaacatgt acagtcatgt atgctgaaaa 27780

ctatacaatg ctgatgaaag aaatcaaaga tctaagtaga tggaaaaata taccatgttc 27840

atggattgga agactcaaca tgccagttct ttgcaaattt gataaacagg tttaatgcag 27900

tttctatcaa aattctatca agtttttttt tttttttttt tttttttttt tttgagacgg 27960

agtctccctc ttgcccaggc tggagtgcag tggcactatc tcagcttact gcaacctctg 28020

cctcctgggt tcaagcgatt ctcctgcctc agcctccaga atagctggga ttacaggcac 28080

acgccaccat gcccggctat tttgtatttt tcatagagac ggggtttcac tgtgttggcc 28140

aggctggtct tgaactcctg acctcaggag atctgcctgc cctggcctcc caaagtgctg 28200

ggattacagg catgaaccac cacacctggc ctttttttct tttttctttt cttttctttt 28260

tttttttgag tcagagtctc gctgtattgc ccaggctgga gtgcaatggc acagtctttg 28320

gctcactgtg gcctccgcct cccgggttta agcaattctc ctgtctccgc ctcccaagta 28380

gctggtatta caggcactcg ccaccacacc cagccaattt tggtattttt agtagagaag 28440

aggtttcacc atattggcta ggctggtctt gaacttctga ccttgtaatc cgcccacctt 28500

tgcctcacca agttctagga ttacaggcgt gagccaccgc gcctggcctt tttctccttt 28560

tttgagacgg agtcacagtc tgtcacctag gctggagtgc agtggcgtga tcttggcttg 28620

ctcaacctct gctttctggg ttcaggtgat tctcagcgta ccaagtagct gggattacaa 28680

gtgtgtgcca ccacacccag ctaatttttt ctgtttttag tagagaaggg gcttcactgt 28740

gttagccagg tctcacactc ctggcctcaa gcgatccgcc cacctcggtc tcccaaagtg 28800

ctgggactat aggcgtgagc cactgtgcct ggtccagaca actgcttttt gacaaagatg 28860

ccaagcaatt caatggagga aggatagtct tttcaccaaa tggtgctgga acaattggct 28920

atctttagac caaaggggaa aaaaaggaat ttatatctca caccttatct aaaaattaac 28980

tcaaatggat cacagatttt tatttttatt ttttgacaca gtctcgctct gttgcccagg 29040

ctagagtgca atggtgtggt catagctcat tgcagcctca aactctttgg ctcaagtgat 29100

cctcccactt cagcctccca agtagctagg actacaggca tgtgccaccc tgccctgcta 29160

attgttaatg tttttttttt tgtaaagaca cggtctcaca gtgtccaggc tggtctcaaa 29220

ctcctggttt caagtgattt cccacctcag cctcccaaag tgttgggatt acaggcatga 29280

gtcactgcac ccagctggat tacagactta aacaaatgtg aaactacaaa tttttaggag 29340

aagacattgg ggaaaattac cttatgacca agcaattcca ctcctaagaa tgaatatact 29400

caaaagaaaa caaaaagaaa aaaaatacaa aaaccccaac tgaagaacaa caacaacaaa 29460

aaaagtaaac ataagaattg aggggggcca ggcacggtgg ctcacgcctg taatcccagc 29520

cctttgggag gcgaaggagg gcagatcatg aggtcagtag ttcaagacaa gcctggccaa 29580

catagtgaaa cttcgtctct actaaaaata aaaaattagc cgggtgtggt ggtgagtgcc 29640

tgtagtccca gctacttggt aggctgaggc aggagaatca cttgaaccca ggaggtggag 29700

gttgcagtaa gctgagactg tgccactgca ctccagcctg ggcgacagag cgagactcca 29760

tctcaaaaaa aaaaaaaaag gttggccagg tgcagtggcc atgcctgtaa tctcagcact 29820

ttgggaggct gaggcggtca gatcacgagg tcaagagatt gagaccatcc tggccaagat 29880

ggtgaaaccc catctcttct aagaatgcaa aaattagctg ggcgtggtgg cgcgcatctg 29940

taattccagc tactcaggag gctgagacag gttaattgct tgaacccagg aggtggaggt 30000

tgcagtgagc tgagatcgca ccaccgcact ccagcctggt gacagagcaa gactctgtct 30060

caaaaaaaaa aaaaaaaaaa attgagacag ggtgtggtgg ctcacacctg taatcccagc 30120

actttgggag gccaggctgg caaatcatct aaggtcagga gttctagacc agtctggcca 30180

acatggtgaa accccatctc tactaaaaat acaaaaatta gccaagtgtg gtggtgtgca 30240

cctgtgctcc cagctacaag ggaggctgag gcacgaattg tttgaaccac cggaaggcgg 30300

agtttacagt gagctgagat cgcgctgctg cactccagcc tgggcgacaa agcaagattc 30360

cgtttcaaaa aaaaaagttg gagttcgaga ccaagtaaac aagaataatg tggcctggcg 30420

tggtggctca tgcctgtaat cccagcactt tgggaggccg aggcggtgga tcacctggtt 30480

aggagttcga gagcagcctg gccaacatga tgaaatccca tttctactaa aaatacgaaa 30540

aaatagctgg gcgtagtggc gggcacttgt aatcccagct actcaggaag ctgaggcaag 30600

agaatcgctt gaatctggga ggcagaggtt gcattgagtg gagattgtgc cacagcactc 30660

cagcctgggc aacaagagca aaactttatc tcaaaaaaaa aaaaaaaaaa aagaattgaa 30720

aacaggtatt caaacaaata caggaatgtt agaatgttca tcacagcact attcacaata 30780

ggcaaaacat agaaactgcc caaatgttta tcaactgatg aatggacaaa caaaatgtgg 30840

catacccatt tgatgaaata ttcagccata aaaagtaatg aagtggctgg gctcggtgcc 30900

tcatgcctgt aatcccagca ctttgggagg ctgaggctgg cggatcactt gaggtcagga 30960

gtttgagacc agcctggcca acatggtgaa acttggtctc tatcaaaaat acaaaaatta 31020

gccaggtgtg gtggcgggca cctgtaatcc cagctacttg ggaggctgag tcaggagaat 31080

agcttaaacc caggagacag agatttcatt gagccaagat tgtgccactg cactccagcc 31140

tgggcaaccc catctcaaaa aaaaaaaagt aatgaagtac tggccgggtg tggtggttcg 31200

tgcctgtaat cccagcactt tgagaggctg aggcagctgg atcatttgag cccaggagtt 31260

tgagaccagc ctggaaaaca taatgagaac ctgtctctac aaaaaaatac aaaaattagc 31320

agggcatggt ggtgcacacc tgtaatccca gctacttgga aaactaggtg ggagaatcac 31380

ttgaacctgg gaggcagagg ttgcagtgag ccaagagagt gcccactgca ctccagcctg 31440

gtcgatagag tgagattcta tgtcaaaaaa aataaagggt tcctggattg gaaacttgca 31500

tgtgcgctta acgcttctgc tttcggaaag gtagaacgag caataggcat tccttttggc 31560

ttttgagttg gctgtggtgt gactcctttt gcttcttgtt tctgatcttg acacttatga 31620

ggagtcatct ttgagtctgg gttttcatca gtgagtacag tcaagccaag aaatgtgtct 31680

gggcaggttc cctctagcac agaccgaaga aaacagcaac atggaacaag agaagtaggt 31740

ttaaacttgg attccatcag agggctcagt agggaagata attctagatc cctgggcctc 31800

ctagagtttt ctattctgat tttattggtt taatgttatt tgtttgaaag caccagaaat 31860

taactttggc caacataagc aaaaagataa tttattagaa gggtatagaa tagcttacaa 31920

aacggaaaaa aaagttgatg agccagtcct cagaaaggat gggagccaga acagcctggg 31980

gatcttggga gcaggaacct ctgtgggatg aataaacatc atgaatatcc aagttcctgt 32040

ttgtttgtgt ttagaagtca aagtccaggg agagaggccc aatttgtgta gcttgggtcg 32100

gcacggggca ccttgactca tagttaatcc aggttaaatc ctgtggagcg aggtggttcc 32160

cctgagccat accaggctgc tgttaactta tggaagggga cgggtactgg gcaggcagga 32220

acaggagctg ctctctgcct ttgcactccc aggaacaact ataggaccaa gagcagagag 32280

ttctaccaga gtgaattttg cttggtgacc attatgtcag agacctaagc tttttagcgt 32340

ttttatgttg agggctgacc tcgctagacc ttcttcacga gtgaatcact atttgtacaa 32400

cagtgtgttt tgaggaggcc atccctatgt aaagggtttc tctgtatccc tatgtaaagg 32460

acttttctca gtgggatttg tgcatagagg agggggggga agaatgcctg tttgacagag 32520

agcagctgaa ggtgacgtct gttacacagg catggtttcg tgtgccacac atgagaaaaa 32580

tgccctttgg ggagtggcct tttagcattg cctaatatag gagggaggga gttgggcggg 32640

gagggagaga gagagagaga gagagagaga gagagagagt gtgtgtgtgt gtgtgtgtgt 32700

gtgtgtgtgt gtgtgtgtgt gtattttggg attgaggtca ctagaccttg catataggca 32760

ttctgaaacc attccccagc cacataacta tcgcctccct ccagcagccc tagtgtgcag 32820

agccaagtac tctttgttaa ctggcttttc tcccttctta ccaggtacct gcacatgttg 32880

ttctttgtca gtgctgtcaa gtgtgtgcca gggtgatcca tggtcacttt ccgggatggc 32940

agcaaggtga cttcggctga ggatgaccct gactgaaagg ctgcgtgaga agatatctcg 33000

ggccttctac aaccatgggc tcctctgtgc atcctatccc atccccatca tcctcttcac 33060

agggttctgc atcttagcct gctggtatgt ttttgggttg ccttggatat ggtgggccag 33120

tgtcttagga cagtaggttt tctaacccta accactatgg agcccttggc ctctgtatgc 33180

tttttacaca atgggagctt gggctcctta taactgtgag tggagaactc tagtcctggc 33240

ctggttagct aatataataa aatagtcctg gctggccctg acctactgat tcaccagatt 33300

tattcatatc actggtactc tatctcaaaa taatgtttag atacttctaa gacactgaaa 33360

taattgaaag atatgatact tcagttttct ttctcaatag tagtggtttc gttttagtac 33420

ctggttaagt gcaagagcct tttttgtgtg ttgcgaggca aagtccatta gaacagtatc 33480

ttggacaacc tgtggcaggc taacctcaga gacttgcttc tttgctctct agtcattttc 33540

ttgtgttcac atggagcttg cttcagactt cttgttgatt cttgtggcca gctgcacttg 33600

ccaaggacag ttgtgagagc tgtagctgcc cttgttcctg tctgtctttc tcaaggcctc 33660

atagaagcct gaaggctatg gctgacaatg acgtcgtaaa ggaggagttt gatatgagat 33720

gacatctgat gaccctttta actctaaaat gctgacagct gtgaaaagag cccatcttat 33780

tcttttctct ggaaagaatt ctgttcttca gattcattgt ctaaaacatt tatagatgtt 33840

ttcagtgcta tgctgaaggg aggatgagaa gtcaggaggg aactccctgt tcagttcagt 33900

tgctaatgat ctcaagctct tccctgatta tcagtaagaa agatgaactt tggccaggtg 33960

cagtgctcat acctgtaatt ccaacactgg gaggctgagg tgagagaatc acttgaggcc 34020

aggagttcag gatcagcctg ggcaacatag caagaccaaa aaaaaaaaaa aaaaaaaaaa 34080

agaaagatga acatcactga gagtttcttg ctgggtgctg tgttgatgct tcaggtataa 34140

cattaggaag tggtccagtt atgtttccat ttaacaaaga ggggtaggga cttagagatt 34200

tgtctggtcc acataactaa taattaggga aactggggtt caaattcaaa tccaagccat 34260

agggactctg gtgcccgcct gcacctgtgt tactgtcacc tggtttcact ctggctcagt 34320

atgtttgtat tggtgtttaa actgctaaat tgtgttgtac aagataaaat acttatagct 34380

gtgtcccata agtgatgaat ttggagtgct ctaagaactc agctcttggg tttttttttc 34440

ctttaagtta attgaccttt cttttttctt ctttaaaata agttttttga gacatggtct 34500

cactctgtca gccaggctgg aatgtagtgg cacaatcaca gctcacctca gcctcaacct 34560

cctaggctca agcgaccctc ccatctcagc ctcctaagaa gccacaacca caggtgtgcg 34620

ccaccacact tggctgtttt tcgtcttttg tagagatggg gtctcattat gttgccctcc 34680

tttggtttta ctctctgatg gtactatggt ttcctctttt gtagtcaccc tgtttttctt 34740

ttaagaggaa agacctggcc gggcgtggtg gctcacggct gtaatcccag cactttggga 34800

ggccgaggcg ggcagatcac gaggtcaggc gatcgagacc atcctggcca acatggtgaa 34860

acctcgtctc tactaaaaat gcaaaaatta gctaggtgtg gtggcctgca cctgtagtcc 34920

ccgccactcg ggaggctgag gcaggagaat cacttgaacc cgggagacgg agattgcagt 34980

gagctgagat cgcgccactg cactctagcc tggcgaaaga gtgagactcc atctcaaaaa 35040

aaaaaaagag gaggaaagac ccttctgtat tatcccattc ttttttttct tccttgagac 35100

agggtctcgc ttccgttgct caggctggag tgcagtggtg caatcactgc taattgcagt 35160

ctcgacttca tgggctcaag tgattctcct acctcagccc tctgagtagt tgggactata 35220

ggcgtgcacc actaattttt tgtattttta gtagagctgg ggtttcgcca tgttgcccag 35280

gctggtctca aactcctgag ctcgtgatcc cctcgccttg gcttcccaaa gtgtcgggat 35340

tacaggtgtg agccaccaaa cctggccttg tactgtcaca ttcttagtgc tgtgtactta 35400

ttttcccaaa tgagtatctt tgtcatgtga tcttaaagtt ttttttttaa ttttgttttt 35460

ttcttaaaac ctgattgact tgagaaaatt tttccaaggc tgggtgaagt ctctcagcct 35520

ccaaagacta ataaaaggtt gtataagaga atccatagat tctgggactt ggccagaaaa 35580

ccagagatca tggacccagg gacacaagcc tcaccattgt cttcaaccca ctgaagcttt 35640

tctgtccaga gcagcagagc agtgccccct tcttccagag cctgggattg cctgcagaaa 35700

ataaagtatg gatatagact gcttctagta gttttgctag acattcagtt tccatttaat 35760

tgcttacctt ttattgttcc tgggatgaaa gacttgtaca gccaaaccca aaggactgct 35820

gcacttaatt tccctattca gatctaacag ccacctgagc tgcagaaata ctttttgcac 35880

accactggct caccaccact gggtcacccc agggaaagta cagagcagta ctggggggat 35940

ggtgatcaat gacagcttgg gaatgtgcct gtctccatca ggcagaagaa tccagggagt 36000

gagagagggc atctgtatat gcatcaggct caccccaaac agcactgagg atgtgtgact 36060

ttcttctctg agctgctgtt gaggctgcag gtttcagtga ctgagagcca aggacactac 36120

ttcaaatgaa cccagtgctg agccttgcag gtgagctaga gttagctgtt cttcctgcct 36180

ggcccctggg tgcagtgact gttctttcct ctgggaaaat ctgatgaaat gtgtagcaaa 36240

taggcattat ggcaagaggt gtctgtttat aactcttgga ggttagacca ctgggcccag 36300

gatatgtccc agcagcagcc cagcaagaca gagggtactg ttaatctgaa cctgccctgg 36360

taagcagtgg gtgcgccatg ggataaaaag agcacccaga tgccatgtta gttggactgc 36420

cctatgtgca ggtcagagag tgatgtgaat cattgagaca tttgattcaa caagctgctg 36480

ctcatggtga gaggtggatt ttaatttgga gaggaaattg gaatcacatt gtgttgtttt 36540

tgattttgag acggggtctc actctgtcgc ccaggctgga gtgcaatggc acaatcatgg 36600

cttactgcaa cctctgcctc ccaggttcaa gtgattctct tgcctcagcc tcccgagtag 36660

ctgggattac aggtgtgagc caccacgtcc ggctattttt tgtattttta gtagagacgg 36720

ggtttcacca tgttggccag actggtgtca aactcctgac ctcaagtaac ctgcccactt 36780

cagcctccca aagtcctggg attataggca taagccacct tgctcagcct agtcatgcat 36840

ttttgactta ggatattttc aatttacgac agcgttatca ggacataacc ccatcgtaag 36900

tcaagatgta tctgtacata tcaagtgctt agaatagtgc ctggcacata ttaaatatca 36960

tgtatgagtt tttcattgtt attattcact gtcttcctag tcttctacct tcacagccag 37020

aaagcacaag cagaatccaa aaacatgtat agtctaaaca tagaacaaaa actgactata 37080

ctctgtgatt actatgcaaa cgctgtagcc acagcctaaa attttttttt tttttttgag 37140

acagggtctc cctctgttgc ccaggctaga gtgcactggc atggcatgat cttggctcac 37200

tgcaacctcc acctcccggg ttcaagcgat tctcctgcct cagctgcccg agtagctagg 37260

attacaggcg tgtgccaccg cgtccggcca atttttgttt ttttagtaaa gacggggttt 37320

caccatgttg gccaggctgg tcttgaactc ctgacctcac gtgacccacc cacctcggcc 37380

tcccaaagtg ctgggattac aggcgtgagc caccgtgccc agcctaaatt aacttttttt 37440

taagtgaaag caagtttatt agaaaagtaa aggaataaag aatggctgct ccataggcag 37500

agcagcccta aatgaattct gatcacttgt agtcgtttct ctcttcctac ttagagcatc 37560

ttggaggcag accgtagtat tatcttttgt attctcagtt cccagcatat aatacatact 37620

taataaatgg tttttgagtg taggtaaaga tggaaaagcc agagaaaagt aaaaattgat 37680

ttttgtgaag gtaaggagat tgtgtaattg ttttctgtaa ttaacataat aaatgtattt 37740

aaaatattca aaacatggta ttgtcaaaag acttgaagag gcgtttcaca aaagttgcta 37800

tatccaagtg gccagtagta agtaaatgaa ataatttttt taattgtttc ttatcaggaa 37860

aatgtacatt aaaaccatgc tgagatacca ctgtctcttc ctctaaatgg ttaacattaa 37920

ttggactgac agtatcaaga ggtgacaagg atttggagaa actggaactc ctattacact 37980

ggtgatagtg ggaacataaa tttgtacaac cgctatggaa aactgtttgg tatcatctac 38040

taagctcaat gtgcatataa ctccataccc agccatttca tcctaggaat atacccgaca 38100

gaaataagtg cttatgaggc caccaaaaac caataaagga taatagtttt attctttttt 38160

tttctttttt ttaattaaaa acaattatcc agcccaaaat gttttgtttt tttgagacgg 38220

gggtctcact ctgtcaccta ggctggaatg cagtggcatg atcatggctt attgcagcct 38280

cagcctcccg gctcaagcga tcctcccact taagcctccc gagctgggac tacaggtgtg 38340

caccagcatg cctggctaac ttttgtattt tttttttttt agggatggcg tttcaccatg 38400

ttgcccaggc tggtctcaaa ctcctgggct caagaaatcc ttctgccttg gcctcccaaa 38460

gtgctgggat tacaggcatg agccacctca cctggccaac tttattctcc tttttttttt 38520

tttttttttt tttgagattg agtttcactc ttgttgccca ggctagagtg cagtggcgcc 38580

atctcagctc accggttcaa gtgattttcc tgcctcagcc ttctgagtag ctgggattac 38640

aggcatacgc caccacgccc ggctaatttt gaatttttag tagagacagg gtttctccct 38700

gttggtcagg ctggtctcga tctcccgatc tcaggtgatc cacctgcctc agcctcccaa 38760

agtgctggga ttacaggcgt gagccactgt gcctggccca actttattct taatagctca 38820

aaccagaaac agccaaatgt tcctcaacca gtggaataca caaatgcact atactttatt 38880

cattagtgga ctagtatgta tccaaaaagc aatgatctgc tatgtgcgcc agtgtggaga 38940

atctagcaga tagaatttga gtgaaagcag ccagtcacaa aagagtatat aagtagaatg 39000

aatggtttca tttatatgac attcaaaaat aggtaaaact aatttatggt gatagagatt 39060

ctaacagtta cctttggtgg tggggagtgg tatgctgttg actgggagtg ggcacaaggc 39120

tgccttctga ggctctggaa atattctata gcttgatcta gatagtagtt acacagatat 39180

acacatgtaa aaacttactg cactttatac ttaagatctg tgcattgtac tatatagaag 39240

ttatttctaa attttaagaa agtgagatct gaaacaaaat gtacatctat ttgccaactt 39300

tttctttttt ttcttttttt ttcacttgag atggggtctc actgtgttgc ctaggctgga 39360

gtacagtggc atgatctcag ctcactgcag cctctacctc ccagggttag atgatcctcc 39420

tgcctcagcc agtagctggg accacaggtg cacaccacca tgcccagcta attttttgta 39480

tttttggtag agatggggtt tcactgtgtt gctcagtctg gtctcaaact cctgagctca 39540

aatgatccgc ccgcttggcc tctcccaaag tgttgggatt acaggcttga gccaccgcac 39600

ccagcttatt tgccaacttt ttgatgaaag gtcagggctt ttccttgcgt atatcgggtc 39660

cattaactta actttcctca tgatcctagt ataaaccaca tccttagtta attatacata 39720

attttcatgg tctgtccctt taagtggaat agttgcttag ctatctgaat tggaatcctt 39780

ctggattttt aaaggtaccc ccacttttgt tttttattgt tcccttatat ctaatttggc 39840

aaggtgattt ttttttgttt gtttttagca tcttgctttt attaagtctc tgaaaacttt 39900

tttctttcag agacaggggt cttatgttgc ccaggctgga gtgcagtggt ataatcatgg 39960

ctcactgcag cctctacctc taggcttaag cagtcctccc acctaagcct cctgagtagc 40020

tgggaccaca ggttcacatg gccatgcctg gctaattttt ttgattttct gtagagatga 40080

ggtctcacta tgttgtccag gctggtctca aacttctggg ctcaagcagc cctccagcct 40140

gggcctccca aagtgctggg gttacaggca taacccactg cgcccagcct gaaaatatta 40200

atataatgtt atatattata acatgttggt gtttcctttc agtaaaagtt actcattaaa 40260

tgtataaact agccaggcac ggttgcttac gcctgtaatc tcagcacttt gggaggctga 40320

ggtgggtgga tcacctgagg tcaggagttt taagaccagc ctggtcaaca tgatgaaacc 40380

ccgtctccac taaaaataca aaaattacct ggatgtagtg gcaggcgcct atctatctgt 40440

gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtatgt ttatattata 40500

tatgttaatg ttatatataa tgttataact aagtatattt atacatactt agcttataca 40560

gcctgaaaac atttaacaga acagtctatt ttaccagttg ggcttcttcg taaggtttat 40620

gtgactaaaa taagtttgaa aaattctaat ctagatgact tctgagtttc agctttgcaa 40680

ttttgtgatt ctaatatttt gcacatttgt acagtcctga cagaatttag ttattaactc 40740

cagtggctcc tgtgtcagtg ctgagagagg actgcctctc atagtgtcta attcttatct 40800

cctttttgta catcccagct acccactgct gaaactcccc ttgccaggaa caggacctgt 40860

ggaattcacc acccctgtga aggattactc gcccccacct gtggactctg accgcaaaca 40920

aggagagcct actgagcagc ctgagtgggt gggtactcgt catgttcctg aggccagcac 40980

agagcgttgg gtggagactg gctgaggcag gggtctgcca gtgagattga ggttggtcag 41040

cttctgattt gtgaattcat gtactttaac agctttatca gtgtaccata tagatactta 41100

gtttatacat ttttttttga gatggagttt tgctcctgtt gtccaggctg gagtgcaatg 41160

gcacaatctc ggctcactgc aacctccgcc tcccgggttc aagtgattct cctgcctcag 41220

cctcccgatt agctgggact gtaggtgtgc gccaccacgc ccaactaatt ttgtattttt 41280

attagagatg gagtttcact atgttggcca agctggtctc gaactcctga ccttgggtga 41340

tctacccgcc ttggcctccc aaagtgctgg gattacaggc gtgagccacc gcacctggcc 41400

agttatttag tttggaactc taggtctcct gaccccagcc cactcctcct tctggactgt 41460

actgttttca gttgactgtc tctgggccga acactgatat aaatgagaaa aaaggtcttc 41520

agttgagggg ctcagtcaag ggacctaact caccatcaca ccgcactcat tatttggagc 41580

tcattgaagc ttgactagct catctgtgta ccttttgcct gtcaggtgtg gacaaagtgc 41640

cctttcttct gtgttgttct gtggtccctg gattcgtgct ggacttgctg aatctgttgt 41700

tgaggaaaac caaagctcag cgaacagagc tctcctcccc cttctctctg acagtcatag 41760

catattccca tttccttttt ggttaacgta gtagtcaggt aacttgttat gaacttgact 41820

ctgcggctga aatagaggca tatctggcaa gataggtctg tggcacaact atacatggtg 41880

tcagtgggga gtgcaccacc ctggcttcat gaggctctgc ctatgaaggt caaaggatgc 41940

atggtctgat gctggctgaa accagttttg tggtgaaacc agttttgtgg ctttatgtcc 42000

caggttggcc attggctcac tggctcattg tgggaccttc ttgcttaaac cttttacctt 42060

cattaaccat ttttttttta ttgttttgag atggagtctc actctgttgc ccagggtgga 42120

gtacagtggc gtgatctcag ctcattgcaa cctctgtctc ctgggttgaa agcgattctc 42180

ctgcctcagc ctcctgagta cctgggacta caggcatgtt gccaccacac ccggctaatt 42240

tttgtatttt tagtaggggt ggggtttcac catgttggcc aggctggtct caaactcctg 42300

acctcaggtg atccacctgc ctcagcctcc caaagtgctg ggattacagg cgtgagccat 42360

tgtgtccgga cttcattaac cttttaatgc aatgttagca cataagggaa tatttgtgtt 42420

tcctgactag gagagttcat ttggcccatt ggtgtggaat agatgtttaa tgatgaggcc 42480

gtaaggggtg tgatgtgttt gtgagctctt tgaatgatgg gatgatgata gaaagtgttg 42540

gtgcagaata actagagggc tcgggaatca ggagcattgt ccatttcctc tctctctgat 42600

tggagcgctc atcccctgca ggattgagaa ggagatgggc ccagggcagt cacctggtgt 42660

cacacagctc agtggtcagt tatctcacct ccattggctg tccttgataa agatacaggc 42720

cagcgatact gaagtgggtg gtaaggactg ttttagttat gaagaacagg aaattcaacc 42780

caaatcagag taagtgaaag ggaatttttg gttcatataa ctcagccagg tgcagggctg 42840

acttaagcac gatatagttt gagcctcaaa aggagtccat ctcttgactt tgtcctctct 42900

gggtcagctt cacttttggt cttcccaaca gtggccctag cagcttcagc cccatgtttt 42960

tgcatcatcc aatccagtgg aggataaaag ggagcccagt tggctatgaa tagggttacc 43020

tgcctgtccc cttcccaagc cctatggcta aaggcaggta tttcattgtt gttgtcagca 43080

ccttgctggg aatgagagag gatggtttcc aaagggacaa tagggccggg tgcagtggtg 43140

catacctgta atcccagtac tgaggcagga ggatcgcttg agcccaggag tttaaggctg 43200

cagtgagcca tgatcacacc attgcagtcc agctggggca atagagtgag accttgtctc 43260

taaaaaaata aaaaataaat aaattttaaa aaagggaaaa taggagactc gggcagtaga 43320

cagtacattg caggcatctg ctgcctatac gaaggagcca aaacttcctt ccctactcga 43380

ctcactgctg agttcagcac tcgtttattg catacgcgtg gtgtgggatg atgtggggga 43440

cagatagagg ctcactgtcc ttgaggagat cctatactgt ttggaaagag aagacaaaga 43500

tttttcaaag tttaaagtaa atatagtgta tgtcaaagag acataggggg gcaatcgaaa 43560

gagctcccca gtggtcagtg ctagagcaat ttttttttct tttttttttt cctttttctt 43620

ttcttttttt tttttttttt tcaagacgga gtcttgcttt cgctaggctg gagtgcagtg 43680

gcgcgatctc agctcactgg aacctccgcc tcccgggttc aagtgattcc cctgcctcag 43740

cctcccgagt agctgggact acaggcacgc accaccacgc ctggctaatt ttttgtattt 43800

tagtagagac ggggtttcac catgttggcc aggatggtct tgatctcctg atcttgtgat 43860

tgatccatcc gcctcggcct cccaaagtgc tgggattaca ggcgtgagcc accatgcctg 43920

gcctagagca atttttgcaa caaaataaac tggtattgaa ttaagaccca aaatataaaa 43980

taattctctg tgagtccatt cctgagtcca tatgcttgaa taaatataaa taaatgaatg 44040

gatgacaata gacaaatctc ctgggcaaaa aaattctaag taatgtatcc taaagtgtgg 44100

actatgcatg atgactttct tccaaagagg acagtgtgac tgtgggaaaa agtaacttta 44160

cagtgaagaa gcctgacaga cacctcctac agtaagtgat tggggttaaa gcagcagtga 44220

taaatcacat tgattgattg tgcccttgat atgtgaggag gaggaggaca ttttaccgct 44280

gatcttcctc tcccaaaccc ataaccgcag tataattaga agtaaaacat cagacaaatc 44340

ctagttgagg aacaccctac aaaatgcctg accagtaccc cttgaagctg ccaagatcat 44400

caaaagcaag ggaagtctga gaaactgtca caagctacaa gaagcctcag acactacagc 44460

taaacgtaac gtggtttcct ggatgggatc ctggaaaaga aaaaggacat taggcaaaaa 44520

cttagaaaac ctgaatatac tttggacttt ggttaagaat ttcactgtgg actttggttt 44580

tcagaaggag gactacagag atgaaatgtc cttcttttta tatacctcag cctcctaaat 44640

tatttaaaaa ttcacgtaca ttaagattca gtctttgtgc tgtaaagtag ggattgtggg 44700

agttcactca gcacagtgag tgtgggccct gcccacatct tccttaccag gttagtgctc 44760

ctttcctgct cagacctgtg tgagcttctg ttctggtcat agcctgtggc agccagctcc 44820

atccaggtgc ctctgtgcct cccagcagct tctagtggct gagcgtgata cagaagacaa 44880

agtggatgag gccttctgtc cccagagccc tcactaaggc acagccacat aaagttcaca 44940

aaggctcaga cggttgcctc tggttgttcc tttgtgccca gggtcccagg aggcattaac 45000

ttgctgtgct tggtcagcat cttggccctt gcctatgctg taacctggag tactgcattg 45060

gtgagtggct ccatggcctc cctttcatcc acacgcatgc cccttggagt tcccgactgc 45120

agcccaggcg tggagacagc ccctcatccc tcagctgggc tgggccctgc ccccttcagt 45180

ccacacctcg cagtacaccg ctgtctaggg ccatgtttcc ttgtctccag ttgtcaccaa 45240

ctcccgggga gtctttacag agcactgctt tcatcaggtt gccccttcac ctcagagaca 45300

ctgggctttg ctttgtcaac tgattaaaat cctgacagct cagtcaggct tcagtctaag 45360

cctgcttgtc atcttcctcg taatttctgt tatcccctga caggtttcct tggtgcagat 45420

gtccaggcct tctgtgctct cagcatccct tgcaactcac attccctcct gctcctctcc 45480

tacctgttct tttctaacct tatggctcta ctcagcttct cctgggccat aactctgctg 45540

tggctgaccc agcatgtttt ggggtgctcc gcgacatgcc tgttactgag ggttgcatat 45600

gtgaacactc ttgtcattta catccctgtt aagctcttga aaggtagatg gcagattcta 45660

gtgagaaaag tatgtgatat ttagtgagga gaccttggtt tgagtcctta caccaccctg 45720

cctggagtgt gaagctctag gcaggcacaa tgcctgagcc tctccttgct tctcatcagg 45780

ctgttgtgag ggtcagatga agtgaaatgc ctgattgttc attgttaata tttctgctaa 45840

tctttcagac actgtttgta tgcgtgtgtg gtgtgtgcat acatcttgat gctgcagggt 45900

gaatgtcgtt attcctgttt cacaatgagg aaattgaaat ccagagatgt caaaagtgtt 45960

ttcaaggcca tatgtttgga aagctgtgat ttaaaattgg gtcctttgat cttcaaaacc 46020

cgctactctg ctgcaagtga caaaacctga atcagtaaga caggttacat gctttgggga 46080

gtgtagagtc tatagtgcgg tcagcagaca tgttccataa agggctagat agtaaacatt 46140

taggctttgc gggccagacg gcctctgttg cagccatttg accctgctgt tgtagagtga 46200

aagcagccat agacaatagt aatggtaggg gtgtggctgt gcttcagtaa aaattggaag 46260

tggaaaaaca ggcactaacc agcctgggca acatagtgag accccatctc tacagaaaat 46320

aaagaagtta gccaggtgtg gcacttcggg aggccaaaat gggaggatca cttgagccca 46380

ggagttcgag accagcctgg caacatagtg ataccctgtc cctacaaaac atttttgaaa 46440

attaggcgtg gtggtggtgc acacacctct agtctcagct acttggtggg tgggggtgct 46500

gaggtgggag gatctcttga gcctgggaga ttgaggtttc agtgagccat gattgggcaa 46560

tagagcaaga ccctgtctca aaaagaaaaa caggcatggg ccctgatttg gcctacaggc 46620

catcgtttgc ctacacctgg tcccacagtg ctttgcccat agtagatgtg ttattgagca 46680

aaagaggctc gctgcccaat gtgctagaag ccaatactgt gacaccagga tttggggaaa 46740

agaaaagctt tatattgaag gttgactccc taggagaccg gagtccagct caaatctgtc 46800

tccctgtgct ggctttaagg cagtaatttt attaggaaag gtttagaggg tggatactag 46860

gattagcaga tgattgatgg aaggaagggt gatttctggg aagtctttga gcatgcccag 46920

ttatctcttg atgccacctc acaggtccca tgtgcaaatt ccggggggag ttagtatgaa 46980

acatggcagt ggaaattcag gctgtgacat cggcaagctc attctgcaca actccagtcg 47040

gccatcttgg ttccagctta tttcagccag ttcttttatc tcataagcgg agggagtttc 47100

tgggtttcag caaattgttt cttttcttat ctgccatcct gcaaactcaa gaacttgtat 47160

tagtcattgg tttctttaac tctgtggggc acggtttcca atgcccatta aatcccttga 47220

attggaccgt ctttcttctt cctgtgctca gctgcccttt ctgccctccc tcatttcttc 47280

tgcagtatgt gggtgccccg gtggcttatg tccagcagat atttgtgaag tcctcagtgt 47340

ttccctggca caagaacctc ctggcagtag atgtatttcg ttcacctttg tcccgggcat 47400

tccaactggt ggaggagatc cggaaccacg tgctgagaga caggtacccc tctcagggac 47460

cctggcctcc ctgaatccca ttctgtactg aagggagagt tacagtcctc agtgtaactg 47520

cagtgagcca gtcagctctg cagagataga acaagcaaga aggatggagg gtgagctagc 47580

cttgaatttc tcagcatcct tgtgggtcta cggtggctgc attccgcttg gacctatgca 47640

gatggcacac acatagcctt gagtctcatc cttacatctc agatggagtc agtgtccact 47700

gtgctaactc atgacccaca tggcttcctg cctgtgggtt atggtgtgaa tgtaatggtg 47760

gtgtctctgc cgacgagaag caagctctac ctgggggtac cttctgaagc cccagcccaa 47820

gtcgtgctcc cctgcctatc agtgggtccc tgggttatgc tggcttggca tacaatgtgt 47880

gtaattggca agctgcatca ctgccaggtt ttagttagct agtggcgttg acagatattt 47940

tggtgaacta aatgaagccc ctaatttacc ccggtccctg ctcatccact gaactggcca 48000

gggtgtttta gtgggtgggg ttgtgcatgc tcttatagta cacttgcccg tcctcagagc 48060

tgatgggctt ttgggcttca gatgcacttt gaaagtcaga cagccacatg tttaggttat 48120

tggccacctg gaagtacttc cccctgctgc cctagtggtc aggctctttg gcgataccag 48180

agagcaaata tggggcattg aagaacagac agaggatgtc ccctaagtac agcaggtctg 48240

ccctgtggtg gcagacacag caggtgcctt gtcctgtctc ctgtgcagct ctgggatcag 48300

gagcttggag gagttgtgtc tgcaagtgac cgacctgctg ccaggcctta ggaagctcag 48360

gaacctactc cctgagcatg gatgcctgct gctgtcccct gggaacttct ggcagaatga 48420

ctgggaacgc ttccatgctg atcctgacat cattgggacc atccaccagc acgagcctaa 48480

aaccctgcag acttcagcca cactcaaagg tagccccagt acaagttccc ttcagacctg 48540

taaaggtgcc cattggtcac cgtctttttg atgtgtgctt aggcagatca gggtttaccc 48600

tttgtttccc agggtggggg tgagaaaggg gtccttggtg gctctgcagt agctgtcatt 48660

tctgtgtcag tacctgctgg tttctgcttg cagacttgtt atttggtgtt cctgggaagt 48720

acagcggggt gagcctctac accaggaaga ggatggtctc ctacaccatc accctggtct 48780

tccagcacta ccatgccaag taagattgac agtaccctgg gctcttgact ggtctgctgg 48840

gtgacatgag gctttgagta gtccctcttc tggttagagt gttctgaatg ccccctggaa 48900

acttgggaga gtttccaggc ctcctgttga atgtttacat ccctcagact agatgatgct 48960

gtctaccaca ttttaatggg gatgacctga cagctggtta agcatagggg actaaggtag 49020

ggctggcggt ctcagtgtcc tggtgcctcc tctggtctct cttgagccta gggcaggcat 49080

ccccagctgg ttactactga gcaccctata tggcctgtgt ccttcccagt ggggcactgc 49140

aggcagctcc ccaattggca agggcactcg aggtgcttct gatcggctct cctaggcctc 49200

tggcaatcaa gagtgttgga ggccgggcgc ggtggctcac gcctgtaatc ccagactttg 49260

ggaggccgag gcaggcggat catgaggtca ggagatcgag accatcctgg ctaacacggt 49320

gaaaccccgt ctctactaaa aatacaaaaa attagccggg cgtggtggtg ggcacctgta 49380

gtcccagcta ctcgggaggc tgaggcagga ggatggtgtg aacccaggag gcggagcttg 49440

cagtgagccc agatggcgcc actgcactcc agcctgggcg acagcgagac tcttgtctca 49500

aaaaataaaa aataaaataa ataaataaat aaaaaagaga gtgttggagt aggtccggaa 49560

agggagacaa agaaaggagc agggggagct cctgagaaaa ctttgtcccc tttgtgattt 49620

tcccagtgcc cctggagact atagagaagc tcaggcacca tagagaagtt ccctttcaac 49680

acaggggcag gagggaggtc ctgatggacc ctctgtccgg ggattgtctt tgtccccaga 49740

accaagagca acacttccat ttacccccac cctgctcctt gaccaggttc ctgggcagcc 49800

tgcgtgcccg cctgatgctt ctgcacccca gccccaactg cagccttcgg gcggagagcc 49860

tggtccacgt gcacttcaag gaggagattg gtgtcgctga gctcatcccc cttgtgacca 49920

cctacatcat cttgtttgcc tacatctact tctccacgcg taggttcatg gcagggaggc 49980

tgagggcttt ctccaagcta aacgggcatt tccatgtcac ctgcttccct ggctctggag 50040

gtggcttggg gtagagagat agaacacacc tggtggtcat cagagctagg gctttgtccc 50100

ccagcagggt cttaggagct tgggtggggc cggggctctt cccactttca gccccttcct 50160

gggttagggt tcctaaaagg tgtactgtgt ccatgacact gggaagtgct tgtgcctgtc 50220

cctttccttt ggtgaaacca ggagttttcc cttcctcgac tgtcagggca acctactccc 50280

gggagcccca gtgggccggg ggctggggga ggggccgccc tgatacgccc tctctgccct 50340

ccagggaaga tcgacatggt caagtccaag tgggggctgg ccctggctgc cgtggtcaca 50400

gtgctcagct cgctgctcat gtctgtggga ctctgcacac tcttcggcct gacgcccacc 50460

ctcaatggcg ggtaggtccc tagcaggctc cactgggcca cagggtgggc tcaggccaga 50520

gagccttgca cttctgggtt cttggccttc cctggacttt gctgtgacct cacgtcttca 50580

cattgttgtt tttgacattt aagaggtaca ttttcttcct cttctttgtc tggcttgtat 50640

tcatacttgt gtttgtatat agcatatcta gctatagtga gtgtccatat gtacaaaagt 50700

gcatatttgt gggctgggtg tgtatataag gggtgtgtgt tggtatgttt gtgtatacat 50760

gagtatgtat tgcatgtgtg tagtcggatt tgtgtgtctg tgtttatgta ttctatatac 50820

acacaccaca cacacactgc agcttgatgg cttaagccac tggaggtgtg agatagagaa 50880

gagaacattt tttttttcat gattagaaca tttaaatgcc taatgaaata ggtcatttta 50940

gaggaagctc tttggaagat atgagcacac tgtaatttgt cgcctttttc actgatgttt 51000

actttcccct tgccactcct ctctgaacct tagtctggaa gcccttccct cggcttgtcc 51060

tcaggctttg atcttggctc tggctaggcc cgcctgcctg tctattaatg gttattaatg 51120

gattatggat tggcctgtcc accactttgg cccatcaggc tggtcgtatg aaaagcgacg 51180

tcgtattttg tttctggtag tttcgttgct cttagatacc tgctcccttt cctgagcttg 51240

acactgttaa acaccaccct cccccatacc gtctgccata cccttcacag ggccctccct 51300

tccttcggct ccaaagcaga ggtcctgcaa ggtataactt ggctggcgtt cctcgcacat 51360

agactttctt agggtttgct gcggggagtg tgggacagtg ggctcagata gctggtagag 51420

ctttgtgtag gaacagtcgt tcttctccac acacagcttc tcaacaaagg tgagtgggcc 51480

ttcaggatgg tttcatctcc ttgcatttag ctgtgatggg tccacccaga gttactggtg 51540

tgggtcttgg cagcagtcat tgtctttagc cagcagtctt ctcctgggaa gggccagcag 51600

aagtgtggtc tagcagtggc gctgcacagc tctccctgag gggcctcttc cagccctcct 51660

gtgctggatg gctagagaca ggatggctgc tggcccctct gcaaggctct ggagcctgcc 51720

tgaaagctga gtgctgtgta gatgcaggtc ttgttgggtg aggtggacaa gggagggttt 51780

ctgcccagca cctgtgggag tcactcagca gcccccatga caggctggaa accccacagc 51840

cttcctgagg gccccagtct gttgggaacc accacaacac tgtcctcacc ttctccttct 51900

ctgtccccag cgagattttc ccctaccttg tggtggttat tgggttagag aatgtgttgg 51960

tgctcaccaa gtctgtggtc tcaaccccgg tagacctgga ggtgaagctg cggatcgccc 52020

aaggtaacgc agtgggagag ttgggcagag ggctgcagga ggggctggaa tggggcctgt 52080

tcctcttgct gttaacgctc tgtgagcaaa cagagccctt gaaatgtccc ttgctcttgc 52140

ctccggcata atatgcagtg ggccactggg ccctggcagc tcttgagtgt gtgccctggg 52200

gagccatggg gccattggac tgtacttcgt cctggttcat gtgtcagtaa gaaagtaaac 52260

caggctgggt gccatggctc acacctgtaa tcccagcact ttgggaggct gaggcaggtg 52320

gatcacttga gcccaggagt tcaagaccag cctgggcaac atggtgaaac cccatgtcta 52380

caaaagatag aaaaattagc agggcatatt ggcatgcacc tgtggtccca cctactcaag 52440

aggctgaggt gggaggattg cttgagcctg ggaggtcaaa gctgcagtga gccgtgatca 52500

caccactgca cttcagtgtg ggtggggctt gtgtttggtg gtggctttct gtctggggag 52560

tttagcgcct agtattttct cttactgcct cactccagca cactaggccc aagccccggg 52620

ggctggccat ttcagagacg ctgccttcac ggctgccaga aaagctccct ctggccctgc 52680

tggtagaaac tggggatctg gggttctagg gaaaatgaga aaagggagag cctggccttg 52740

gaggcctggt cacttgagcc tcttcttcct cgtcacccca tgtctgtgag gaatggggct 52800

gtaggcagcc gtccattcat ccagacctct gtgagcctct gtgataagcc aggccctgtg 52860

ctggatatgg agttaggaag agatggggcg aaattgtcct tacccagtaa gagcacagag 52920

ccttagacat gcgacagtgt gatagcgtgg gatcagggct cactacagga aggggcttga 52980

ggaagaacgc agccaggtcc tctacccgcc gagtgcttct gccatgtggt tgatgggcac 53040

actgtcatgc tggcccgtgc agaccagaca agaaccacat gcggaggttg gatgtggttg 53100

ttgtgggtgg cacttggctt tccttgtgga ttttctcatc tccacactct gcttcttccc 53160

tcttttgatg attatagctc tcctctgcac cctccaggct gtgaacaccc gttccccgta 53220

gcagctgtgt ggtggtgatg gccccttaaa gtctgggcat tagcaggacc ctgagggttg 53280

gggtgctttg gtggaatggc tccttcaaag ggctgggggg ccttgccatg cctctgccac 53340

tccgaggccc atgaggttgt gtgagtcatg tcgcagagtg gccatgtgtt gccctgtgcc 53400

ctgttgctgc cctctgcagg cctaagcagc gagagctggt ccatcatgaa gaacatggcc 53460

acggagctgg gcatcatcct catcggctac ttcaccctag tgcccgccat ccaggtaagg 53520

ccccaaggcc tgccacctgg atgagcatgg aagcaactgc tgtgctcccc agctgtgcag 53580

ccatgggcag ggtgctcccc tcttcagcac aggcatcctt gcttctgagg tgggacctct 53640

ttgcctggca agcagatcac tacagcaccc agatggcccc tggcatgcct ggctcagaag 53700

tgctcagcaa accctggctg ggttcccaga ttgagcacct agccaggcag actctgccct 53760

tgaccctgtc ttcctacccc tccctgcctg cttccctttc agccaagtgg caggaggagg 53820

ctgcaagggc atggcaggag ctggggactg gctgtgcagt ttgtcacacc tgtttcccat 53880

ttttgaggga gaagcaccgt ggggttccta gacccttcct ccggtctcct cccttggccc 53940

tggcctgtgc cgcagtcgcc agacgcatgg ccttgcctgg cctgaccagt gggagggcca 54000

ccacccattg cccagagtga ccctgctctt ggcaaagtgc cctcactcag ctgtgggctg 54060

tgagcagagg tggaggtggc cctgcactga gctggaaccc cagactgatg ccagccattc 54120

cagaaggagt tgcaggaagg ggaggatgcc atcttttctc gcccgtcttt cccccagggc 54180

tggcaggcca gctgagggat gggggtgagc agagaacaga tgggctgtgg gctgcttctc 54240

ctggaaaaac agtagtatct gcaggatagg gtacagtctt gggacgttag agctgagaca 54300

accactgtgc cactatctgc actccatggt cttaccccag atcggagtag cactgtggtg 54360

atgtgctaga ggtctcaaca ccgacatctc agaaaatttt gtctgctgac agagcttggg 54420

gagcagagag ctcacccttt ttcagtttta gagaattaat ccctctctct ctctcttcat 54480

tgttccgggg cagttgctgg ctgggaacct ttctgagagc ccctgaatca ggcctgggct 54540

ctagctgggt tggtgatgca tgagcagggc gggggctcag tggggaagga ctttttgggg 54600

agcaggctgg tggggcttag aggtttccgg gttggatcag gccttcagtc ccctctagag 54660

ggaccggaag attcagggaa ggtacttccc cttccctttc agccctttct gaagaaagtg 54720

tgagggtttc ttctgccccc tggtggagac ggggtgagct gctgctggta tgtgagctga 54780

ggaccaacca gcatctctca tctctgctgt gccctgcctg ctgctgccct gccggttatg 54840

aggtggctgc agtccgggta ctgctcctct tgggctggga cagtgaggtc acggcacccc 54900

cccatcccca tgtgctctga ttccaggagt tctgtctctt tgctgtcgtg gggctggtgt 54960

ctgacttctt ccttcagatg ctgtttttca ccactgtcct gtccattgac attcgccgga 55020

tggaggtagg agtgggctga gccctgccct gcccgcctcc tcagccctgg ctgtactgag 55080

ggagtcctgg gtgagaaggg tgtagacctc gggcaggaca gcggtcctgt gcgagcagcc 55140

tctggatggt ggactcaggc cctgaccact gtgcccccaa cagctagcag acctgaacaa 55200

gcgactgccc cctgaggcct gcctgccctc agccaagcca gtgggacagc caacgcgcta 55260

cgagcggcag ctggctgtga ggccgtccac accccacacc atcacgttgc agccgtcttc 55320

cttccgaaac ctgcggctcc ccaagaggct gcgtgttgtc tacttcctgg cccgcacccg 55380

cctggcacag cgcctcatca tggtacctgc cacccctgcc ctgccctgcc ctcttctgga 55440

gggccggtgc tccaggcccc ttgtggtgct gcacttggcc ttagagtggc aaagggtatt 55500

cctcaggccc tggtggcccc tggaagcctg gctctgggga gttgcccgtt gtgtcctccc 55560

tgcccagacc ctagtggctt ctgaggagat aagcctgtgg gagaagcagc tccagggttc 55620

tcaggtacag gagccatcct ctccccagag tggcccagga caggagcctg ttagttgagt 55680

gctctgggat ggacccactt gtggccacca cattgccctg ggtcgggttc atcggccgct 55740

gcatggtgtg cagacactgg aaagtgctgg gcaaaatcat tcaccagccg ggctgggctg 55800

gccttggggc agcagtgcct cttccaggga gctgaactga gatgggagga aggctgaggc 55860

cccctgggac taggacctct gggggactct ggagcaggtc aggttgctgg ccctctgacc 55920

gtaggaatgg tagcagcttt ctggctccag ctgaggtgga gcttaggggt ggggacattc 55980

tgtgtcaaac ctcagggtgc ttcagtgtat ttccaggcca agaaactcag cccctaactg 56040

tggaaaggca agcaggcccc tccagcagca agtgttggca ggtgttagca ggaggacttg 56100

gagaggcagg agaaaaggac gcagtggggc ctgtgtcctc tctccatccc caggcctgag 56160

gtccctgtgc tgcttcctct cagcatgagg gctgaagctg ctgggggttg gggcccattc 56220

ctcccactga gtaccccctg ccccactgca ggctggcacc gttgtctgga ttggcatcct 56280

ggtatacaca gacccagcag ggctgcgcaa ctacctcgct gcccaggtga cggaacagag 56340

cccattgggt gagggagccc tggctcccat gcccgtgcct agtggcatgc tgccccccag 56400

ccacccggac cctgccttct ccatcttccc acctgatgcc cctaagctac ctgagaacca 56460

gacgtcgcca ggcgagtcac ctgagcgtgg aggtccagca gaggttgtcc atgacagccc 56520

agtcccagag gtaacctggg ggcctgagga tgaggaactt tggaggaaat tgtccttccg 56580

ccactggccg acgctcttca gctattacaa catcacactg gccaagaggt gagctgggcc 56640

gtgccaggtg ccacctcact cgatggtgtc aactcaccat cccctttccc caatgcagga 56700

ggcccacagg tttgaattat gcaaataatt aaaacagttc ataaggttgt gaggtgggaa 56760

ctggtggttt aggcagctat aacccaagag aggagtccca ggttgctctg aggagtcact 56820

ggtggctgcc agccctcacc agaatgagac ccacccacct gtgccaggag tggggaggga 56880

gataccccac acggccacca gggctgtttg ggtgctggta tctgggacag caagttggct 56940

gctaagctgg gctggggagg gacctacctc tgtccccaac cccccatgct gggagagtct 57000

ggccggtgga gctgaggcct gcctggggag gagggagagg actggctggc gagcacagca 57060

ggaggaagcc ctgggaggcc ccccgctgag gctgcccact gtccgaatcc aggtacatca 57120

gcctgctgcc cgtcatccca gtcacgctcc gcctgaaccc gagggaggct ctggagggcc 57180

ggcaccctca ggacggccgc agtgcctggc ccccaccggg gcccatacct gctgggcact 57240

gggaagcagg acccaagggc ccaggtgggg tgcaggccca tggagacgtc acgctgtaca 57300

agtaaggctg ctgggtgggg tggggtggga aagagtgcgg ggagggggac gggtaggcaa 57360

gagtagggga gagggaggag gggaggggac aggctgtgag gtgtgtctca cagcagtccg 57420

ccctcccgtg cagggtggcg gcgctgggcc tggccaccgg catcgtcttg gtgctgctgc 57480

tgctctgcct ctaccgcgtg ctatgcccgc gcaactacgg gcagctgggt ggtgggcccg 57540

ggcggcggag gcgcggggag ctgccctgcg acgactacgg ctatgcgcca cccgagacgg 57600

agatcgtgcc gcttgtgctg cgcggccacc tcatggtgag caggggcaca gtggccgggt 57660

aggggagggc cggagcctgg cccataccaa caccgggctt ctgcaggaca tcgagtgcct 57720

ggccagcgac ggcatgctgc tggtgagctg ctgcctggca ggccacgtct gcgtgtggga 57780

cgcgcagacc ggggattgcc taacgcgcat tccgcgccca gggtaggtgc ggctgccctt 57840

tcctcctttg tgcccccaca acccccctca ccccaccccc cgccgccacg tatctcccct 57900

cctttcttcc tccgaggtat cccccaaccc ctccaggccc cctctccccc cacccccgca 57960

ccccctccca ccaccccgta cccccctctc cccaccccgc accaccctct ccccccaccc 58020

ccttttccct tgccccttct cactcccacg ccccctctca cccccgtccc ccgccccctc 58080

tcacccccct cccccgtgcc ccctctcact ccgccctcct ggcccccagc aggcagcgcc 58140

gggacagtgg cgtgggcagc gggcttgagg ctcaggagag ctgggaacga ctttcagatg 58200

gtgggaaggc tggtccagag gagcctgggg acagccctcc cctgagacac cgcccccggg 58260

gccctccgcc gccttccctc ttcggggacc agcctgacct cacctgctta attgacacca 58320

acttttcagc gcagcctcgg tcctcacagc ccactcagcc cgagccccgg caccgggcgg 58380

tctgtggccg ctctcgggac tccccaggct atgacttcag ctgcctggtg cagcgggtgt 58440

accaggagga ggggctggcg gccgtctgca caccagccct gcgcccaccc tcgcctgggc 58500

cggtgctgtc ccaggcccct gaggacgagg gtggctcccc cgagaaaggc tccccttccc 58560

tcgcctgggc ccccagtgcc gagggttcca tctggagctt ggagctgcag ggcaacctca 58620

tcgtggtggg gcggagcagc ggccggctgg aggtgggcag aggggctaaa ggtgggcaga 58680

gcggctgtcc gccccgggga ttgtgggcct ttctggctgg caggtgctca cagcctctgg 58740

actcgtaggt gtgggacgcc attgaagggg tgctgtgctg cagcagcgag gaggtctcct 58800

caggcattac cgctctggtg ttcttggaca aaaggtgagc gtggcctgcc tcagccccag 58860

atgtccccag cctttgttgg ctaggccata ctctcttgag tcttgagttc tggttctctt 58920

caactgctgt actgtatgat tcgattgacc ttcttggtgc ccagctccac acctgtgagc 58980

agagggcagt ccacttggat gggaaggtaa caattaaaag cgttaggggt ggccgggcgc 59040

ggtggctcac gcctgtaatc ccagcacttt gggaggccga ggcgggcgga tcacgaggtc 59100

aggagatcga gaccatcccg gctaaaacgg tgaaaccccg tctctactaa aaatacaaaa 59160

aattagccgg gcgtagtggc gggcgcctgt agtcccagct acttgggagg ctgaggcagg 59220

agaatggcgt gaacccggga ggcggagctt gcagtgagcc gagatcccgc cactgcactc 59280

cagcctgggc gacagagcga gactccgtct caaaaaaaaa aaaaaaaaaa aaaaaaaaaa 59340

gcgttagggg tgtgacgtgc ttggaatagg gcatggcaca tggtgacctc ccagggcctt 59400

aagcagtgac agtggggagt gatatactcc tatcctttct cgcccttctc aatgaagcca 59460

gtttctctga ttagcttgtc aatattgagc ctttggggta tcttggttgc atttttagtt 59520

acagagtgcg cttgcagaac cctctcttct ccttggccgc tggcagctgt tctctgctct 59580

ccctgcctct gtcgtgcttg gcctcctcag caagcctgtt ggctgtgggc gtccccagta 59640

ctccgtctgc atgcacactc cttggggagt ctcagccacc tgggttctgg ccccacctcc 59700

aagctggtga acctgggtct ccacccagtg gccaggtgcc ttctgccgga cgcctttgcc 59760

tgcctgtccc acactggctc ctcctccaag gctccttgac tgttggtggc agcaccatct 59820

gacctagagc tggagtcttt ttccttgggg agggggcgtc ccttgccctt agtgatgttg 59880

atttctgcca gtgggctgct gccgtcattc ctgtcaccac aggttctgca tgggctttgg 59940

ctgacatcct cccctccagc ctggccaatt tcaccaggcc cctccatgct tcttggaaat 60000

tctcctttgc tgcttgtttt agctttaagg aaagccccga tgtctcaacc tgaccatcag 60060

ggttcctggt gactgtggtc tctccttgtc cacccacttc caatcataaa actggcttcc 60120

ccagctctgg tgcaggccct tcaaattcat gggcagaggt tgtaggcaga catgcattgc 60180

ctttccctgc agtaagattt tgaaccccat ctgctttgag gctttggggt tactgggcaa 60240

atatacccat ccctgcctgt cagactgtac ctaggaattt tggagagcaa agaaaatcct 60300

tgtttcttta tggaaaaagg aattgatgtg agctgtgctt gggttgaagc tgcttttatg 60360

tggagaatgc aggcttccgc aacacccaac atagcccacc ctgcatcctg tttcccctca 60420

gcagccctcc cttcagctcc aggctacatg gagccctctg cttgttttta atttacaaac 60480

ttacgtgata ttcaccaggt accaccttac acgttagctc acttgattct catgaccacc 60540

ctgtgaggtg ggtactctta tccccatttt acggatgaag aaactgaggc acaaggtggt 60600

taatatttgg agttgccctc tggctccagc atctgttctg gcaccatgtg ctttcctctt 60660

ggccatgtcc ctcctgtgcc ttcttgaact ggcccttaac tctcatgtcc acatgctcag 60720

ccccagggct ggggctctaa gggagaggcc cctggcagct gttcttctct tccaggattg 60780

tggctgcacg gctcaacggt tcccttgatt tcttctcctt ggagacccac actgccctca 60840

gccccctgca gtttagaggt cggagggcct ggggtgggca ggtgttcaca cttggtggga 60900

cgggcagggg ccgtctaccc attgctttct cagagattct tcacttggcc ttttgtcctc 60960

agggacccca gggcggggca gttcccctgc ctctccagtg tacagcagca gcgacacagt 61020

ggcctgtcac ctgacccaca cagtgccctg tgcacaccaa aaacccatca cagccctgaa 61080

agccgctgct gggcgcttgg tgactgggag ccaagaccac acactgagag tgagtattgt 61140

cttgtctctt gggtgctgga gtggcccggc acggggtggg agcctgatgc attcgtcagg 61200

gagaggctgg aagagtcctg atgaagaaca gagggcattt cccagccaaa gtataacttg 61260

gaaaatccca gagaccagaa cctgaggccc atccctgtcc caggtgttcc gtctggagga 61320

ctcgtgctgc ctcttcaccc ttcagggcca ctcaggggcc atcacgaccg tgtacattga 61380

ccaggtaagc ggcctgcagg tggggtaggg ggtacagagt ctgtggccca tgtttgctga 61440

ctcctgggag ctggtcccca ggggccttcc aggaagcagt cagggcccca cccactgggg 61500

cacagggaca ccactgttga cagaggtatt acaccatggt gaccccactc ccctggcctg 61560

tttccccaga ccatggtgct ggccagtgga ggacaagatg gggccatctg cctgtgggat 61620

gtactgactg gcagccgggt cagccatgtg tttgctcacc gtggggatgt cacctccctt 61680

acctgtacca cctcctgtgt catcagcagt ggcctggatg acctcatcag catctgggac 61740

cgcagcacag gcatcaagtt ctactccatt cagcaggtag aggggatggg gatcatagga 61800

ttcttgggat tttagggaag gactcaggac tgagcttgtc atgtccttgc ctccaggacc 61860

tgggctgtgg tgcaagcttg ggtgtcatct cagacaacct gctggtgact ggcggccagg 61920

gctgtgtctc cttttgggac ctaaactacg gggacctgtt acagtctacc tggggaagaa 61980

cagtgaggcc cagcctgccc gccagatcct ggtgctggac aacgctgcca ttgtctgcaa 62040

ctttggcagt gagctcagcc tggtgtatgt gccctctgtg ctggagaagc tggactgagc 62100

gcagggcctc cttgcccagg caggaggctg gggtgctgtg tgggggccaa tgcactgaac 62160

ctggacttgg gggaaagagc cgagtatctt ccagccgctg cctcctgact gtaataatat 62220

taaacttttt taaaaaacca tatcatcatc tgtcaggcac tttggga 62267

<210> 3

<211> 4421

<212> DNA

<213> 智人(homo sapien)

<400> 3

acgcuccgcc cggcccggcc cggcccggcc guccauacuu cccuccggug uccaccagag 60

ggcgaacggg agacgcgaau gugguucgac uacgcaugcg cacgccgcug ggcgcacgug 120

cggagggcgg cggggcggga ggguaaaggu aggaggugag aggugaaggg gcgggcaccc 180

ggcggccagg agagagaggg agggcgccac gcaccggacu gcgggccgag agcgcgcacg 240

ccgcgcuccg ccccugcugc cgcccccguc gccgccgccg ccgccgccgc agcuugggag 300

gugcugccac cacagguacc ugcacauguu guucuuuguc agugcuguca agugugugcc 360

agggugaucc auggucacuu uccgggaugg cagcaaggug acuucggcug aggaugaccc 420

ugacugaaag gcugcgugag aagauaucuc gggccuucua caaccauggg cuccucugug 480

cauccuaucc cauccccauc auccucuuca caggguucug caucuuagcc ugcugcuacc 540

cacugcugaa acuccccuug ccaggaacag gaccugugga auucaccacc ccugugaagg 600

auuacucgcc cccaccugug gacucugacc gcaaacaagg agagccuacu gagcagccug 660

agugguaugu gggugccccg guggcuuaug uccagcagau auuugugaag uccucagugu 720

uucccuggca caagaaccuc cuggcaguag auguauuucg uucaccuuug ucccgggcau 780

uccaacuggu ggaggagauc cggaaccacg ugcugagaga cagcucuggg aucaggagcu 840

uggaggaguu gugucugcaa gugaccgacc ugcugccagg ccuuaggaag cucaggaacc 900

uacucccuga gcauggaugc cugcugcugu ccccugggaa cuucuggcag aaugacuggg 960

aacgcuucca ugcugauccu gacaucauug ggaccaucca ccagcacgag ccuaaaaccc 1020

ugcagacuuc agccacacuc aaagacuugu uauuuggugu uccugggaag uacagcgggg 1080

ugagccucua caccaggaag aggauggucu ccuacaccau cacccugguc uuccagcacu 1140

accaugccaa guuccugggc agccugcgug cccgccugau gcuucugcac cccagcccca 1200

acugcagccu ucgggcggag agccuggucc acgugcacuu caaggaggag auuggugucg 1260

cugagcucau cccccuugug accaccuaca ucaucuuguu ugccuacauc uacuucucca 1320

cgcggaagau cgacaugguc aaguccaagu gggggcuggc ccuggcugcc guggucacag 1380

ugcucagcuc gcugcucaug ucugugggac ucugcacacu cuucggccug acgcccaccc 1440

ucaauggcgg cgagauuuuc cccuaccuug uggugguuau uggguuagag aauguguugg 1500

ugcucaccaa gucugugguc ucaaccccgg uagaccugga ggugaagcug cggaucgccc 1560

aaggccuaag cagcgagagc ugguccauca ugaagaacau ggccacggag cugggcauca 1620

uccucaucgg cuacuucacc cuagugcccg ccauccagga guucugucuc uuugcugucg 1680

uggggcuggu gucugacuuc uuccuucaga ugcuguuuuu caccacuguc cuguccauug 1740

acauucgccg gauggagcua gcagaccuga acaagcgacu gcccccugag gccugccugc 1800

ccucagccaa gccaguggga cagccaacgc gcuacgagcg gcagcuggcu gugaggccgu 1860

ccacacccca caccaucacg uugcagccgu cuuccuuccg aaaccugcgg cuccccaaga 1920

ggcugcgugu ugucuacuuc cuggcccgca cccgccuggc acagcgccuc aucauggcug 1980

gcaccguugu cuggauuggc auccugguau acacagaccc agcagggcug cgcaacuacc 2040

ucgcugccca ggugacggaa cagagcccau ugggugaggg agcccuggcu cccaugcccg 2100

ugccuagugg caugcugccc cccagccacc cggacccugc cuucuccauc uucccaccug 2160

augccccuaa gcuaccugag aaccagacgu cgccaggcga gucaccugag cguggagguc 2220

cagcagaggu uguccaugac agcccagucc cagagguaac cugggggccu gaggaugagg 2280

aacuuuggag gaaauugucc uuccgccacu ggccgacgcu cuucagcuau uacaacauca 2340

cacuggccaa gagguacauc agccugcugc ccgucauccc agucacgcuc cgccugaacc 2400

cgagggaggc ucuggagggc cggcacccuc aggacggccg cagugccugg cccccaccgg 2460

ggcccauacc ugcugggcac ugggaagcag gacccaaggg cccagguggg gugcaggccc 2520

auggagacgu cacgcuguac aagguggcgg cgcugggccu ggccaccggc aucgucuugg 2580

ugcugcugcu gcucugccuc uaccgcgugc uaugcccgcg caacuacggg cagcugggug 2640

gugggcccgg gcggcggagg cgcggggagc ugcccugcga cgacuacggc uaugcgccac 2700

ccgagacgga gaucgugccg cuugugcugc gcggccaccu cauggacauc gagugccugg 2760

ccagcgacgg caugcugcug gugagcugcu gccuggcagg ccacgucugc gugugggacg 2820

cgcagaccgg ggauugccua acgcgcauuc cgcgcccagg caggcagcgc cgggacagug 2880

gcgugggcag cgggcuugag gcucaggaga gcugggaacg acuuucagau ggugggaagg 2940

cugguccaga ggagccuggg gacagcccuc cccugagaca ccgcccccgg ggcccuccgc 3000

cgccuucccu cuucggggac cagccugacc ucaccugcuu aauugacacc aacuuuucag 3060

cgcagccucg guccucacag cccacucagc ccgagccccg gcaccgggcg gucuguggcc 3120

gcucucggga cuccccaggc uaugacuuca gcugccuggu gcagcgggug uaccaggagg 3180

aggggcuggc ggccgucugc acaccagccc ugcgcccacc cucgccuggg ccggugcugu 3240

cccaggcccc ugaggacgag gguggcuccc ccgagaaagg cuccccuucc cucgccuggg 3300

cccccagugc cgaggguucc aucuggagcu uggagcugca gggcaaccuc aucguggugg 3360

ggcggagcag cggccggcug gagguguggg acgccauuga aggggugcug ugcugcagca 3420

gcgaggaggu cuccucaggc auuaccgcuc ugguguucuu ggacaaaagg auuguggcug 3480

cacggcucaa cgguucccuu gauuucuucu ccuuggagac ccacacugcc cucagccccc 3540

ugcaguuuag agggacccca gggcggggca guuccccugc cucuccagug uacagcagca 3600

gcgacacagu ggccugucac cugacccaca cagugcccug ugcacaccaa aaacccauca 3660

cagcccugaa agccgcugcu gggcgcuugg ugacugggag ccaagaccac acacugagag 3720

uguuccgucu ggaggacucg ugcugccucu ucacccuuca gggccacuca ggggccauca 3780

cgaccgugua cauugaccag accauggugc uggccagugg aggacaagau ggggccaucu 3840

gccuguggga uguacugacu ggcagccggg ucagccaugu guuugcucac cguggggaug 3900

ucaccucccu uaccuguacc accuccugug ucaucagcag uggccuggau gaccucauca 3960

gcaucuggga ccgcagcaca ggcaucaagu ucuacuccau ucagcaggac cugggcugug 4020

gugcaagcuu gggugucauc ucagacaacc ugcuggugac uggcggccag ggcugugucu 4080

ccuuuuggga ccuaaacuac ggggaccugu uacagacagu cuaccugggg aagaacagug 4140

aggcccagcc ugcccgccag auccuggugc uggacaacgc ugccauuguc ugcaacuuug 4200

gcagugagcu cagccuggug uaugugcccu cugugcugga gaagcuggac ugagcgcagg 4260

gccuccuugc ccaggcagga ggcuggggug cugugugggg gccaaugcac ugaaccugga 4320

cuugggggaa agagccgagu aucuuccagc cgcugccucc ugacuguaau aauauuaaac 4380

uuuuuuaaaa aacctaucau caucugucag gcacuuuggg a 4421

<210> 4

<211> 4417

<212> DNA

<213> 智人(homo sapien)

<400> 4

acgcuccgcc cggcccggcc cggcccggcc guccauacuu cccuccggug uccaccagag 60

ggcgaacggg agacgcgaau gugguucgac uacgcaugcg cacgccgcug ggcgcacgug 120

cggagggcgg cggggcggga ggguaaaggu aggaggugag aggugaaggg gcgggcaccc 180

ggcggccagg agagagaggg agggcgccac gcaccggacu gcgggccgag agcgcgcacg 240

ccgcgcuccg ccccugcugc cgcccccguc gccgccgccg ccgccgccgc agcuugggag 300

gugcugccac cacagguacc ugcacauguu guucuuuguc agugcuguca agugugugcc 360

agggugaucc auggucacuu uccgggaugg cagcaaggug acuucggcug aggaugaccc 420

ugacugaaag gcugcgugag aagauaucuc gggccuucua caaccauggg cuccucugug 480

cauccuaucc cauccccauc auccucuuca caggguucug caucuuagcc ugcugcuacc 540

cacugcugaa acuccccuug ccaggaacag gaccugugga auucaccacc ccugugaagg 600

auuacucgcc cccaccugug gacucugacc gcaaacaagg agagccuacu gagcagccug 660

agugguaugu gggugccccg guggcuuaug uccagcagau auuugugaag uccucagugu 720

uucccuggca caagaaccuc cuggcaguag auguauuucg uucaccuuug ucccgggcau 780

uccaacuggu ggaggagauc cggaaccacg ugcugagaga cagcucuggg aucaggagcu 840

uggaggaguu gugucugcaa gugaccgacc ugcugccagg ccuuaggaag cucaggaacc 900

uacucccuga gcauggaugc cugcugcugu ccccugggaa cuucuggcag aaugacuggg 960

aacgcuucca ugcugauccu gacaucauug ggaccaucca ccagcacgag ccuaaaaccc 1020

ugcagacuuc agccacacuc aaagacuugu uauuuggugu uccugggaag uacagcgggg 1080

ugagccucua caccaggaag aggauggucu ccuacaccau cacccugguc uuccagcacu 1140

accaugccaa guuccugggc agccugcgug cccgccugau gcuucugcac cccagcccca 1200

acugcagccu ucgggcggag agccuggucc acgugcacuu caaggaggag auuggugucg 1260

cugagcucau cccccuugug accaccuaca ucaucuuguu ugccuacauc uacuucucca 1320

cgcggaagau cgacaugguc aaguccaagu gggggcuggc ccuggcugcc guggucacag 1380

ugcucagcuc gcugcucaug ucugugggac ucugcacacu cuucggccug acgcccaccc 1440

ucaauggcgg cgagauuuuc cccuaccuug uggugguuau uggguuagag aauguguugg 1500

ugcucaccaa gucugugguc ucaaccccgg uagaccugga ggugaagcug cggaucgccc 1560

aaggccuaag cagcgagagc ugguccauca ugaagaacau ggccacggag cugggcauca 1620

uccucaucgg cuacuucacc cuagugcccg ccauccagga guucugucuc uuugcugucg 1680

uggggcuggu gucugacuuc uuccuucaga ugcuguuuuu caccacuguc cuguccauug 1740

acauucgccg gauggagcua gcagaccuga acaagcgacu gcccccugag gccugccugc 1800

ccucagccaa gccaguggga cagccaacgc gcuacgagcg gcagcuggcu gugaggccgu 1860

ccacacccca caccaucacg uugcagccgu cuuccuuccg aaaccugcgg cuccccaaga 1920

ggcugcgugu ugucuacuuc cuggcccgca cccgccuggc acagcgccuc aucauggcug 1980

gcaccguugu cuggauuggc auccugguau acacagaccc agcagggcug cgcaacuacc 2040

ucgcugccca ggugacggaa cagagcccau ugggugaggg agcccuggcu cccaugcccg 2100

ugccuagugg caugcugccc cccagccacc cggacccugc cuucuccauc uucccaccug 2160

augccccuaa gcuaccugag aaccagacgu cgccaggcga gucaccugag cguggagguc 2220

cagcagaggu uguccaugac agcccagucc cagagguaac cugggggccu gaggaugagg 2280

aacuuuggag gaaauugucc uuccgccacu ggccgacgcu cuucagcuau uacaacauca 2340

cacuggccaa gagguacauc agccugcugc ccgucauccc agucacgcuc cgccugaacc 2400

cgagggaggc ucuggagggc cggcacccuc aggacggccg cagugccugg cccccaccgg 2460

ggcccauacc ugcugggcac ugggaagcag gacccaaggg cccagguggg gugcaggccc 2520

auggagacgu cacgcuguac aagguggcgg cgcugggccu ggccaccggc aucgucuugg 2580

ugcugcugcu gcucugccuc uaccgcgugc uaugcccgcg caacuacggg cagcugggug 2640

gugggcccgg gcggcggagg cgcggggagc ugcccugcga cgacuacggc uaugcgccac 2700

ccgagacgga gaucgugccg cuugugcugc gcggccaccu cauggacauc gagugccugg 2760

ccagcgacgg caugcugcug gugagcugcu gccuggcagg ccacgucugc gugugggacg 2820

cgcagaccgg ggauugccua acgcgcauuc cgcgcccagg caggcagcgc cgggacagug 2880

gcgugggcag cgggcuugag gcucaggaga gcugggaacg acuuucagau ggugggaagg 2940

cugguccaga ggagccuggg gacagcccuc cccugagaca ccgcccccgg ggcccuccgc 3000

cgccuucccu cuucggggac cagccugacc ucaccugcuu aauugacacc aacuuuucag 3060

cgcagccucg guccucacag cccacucagc ccgagccccg gcaccgggcg gucuguggcc 3120

gcucucggga cuccccaggc uaugacuuca gcugccuggu gcagcgggug uaccaggagg 3180

aggggcuggc ggccgucugc acaccagccc ugcgcccacc cucgccuggg ccggugcugu 3240

cccaggcccc ugaggacgag gguggcuccc ccgagaaagg cuccccuucc cucgccuggg 3300

cccccagugc cgaggguucc aucuggagcu uggagcugca gggcaaccuc aucguggugg 3360

ggcggagcag cggccggcug gagguguggg acgccauuga aggggugcug ugcugcagca 3420

gcgaggaggu cuccucaggc auuaccgcuc ugguguucuu ggacaaaagg auuguggcug 3480

cacggcucaa cgguucccuu gauuucuucu ccuuggagac ccacacugcc cucagccccc 3540

ugcaguuuag agggacccca gggcggggca guuccccugc cucuccagug uacagcagca 3600

gcgacacagu ggccugucac cugacccaca cagugcccug ugcacaccaa aaacccauca 3660

cagcccugaa agccgcugcu gggcgcuugg ugacugggag ccaagaccac acacugagag 3720

uguuccgucu ggaggacucg ugcugccucu ucacccuuca gggccacuca ggggccauca 3780

cgaccgugua cauugaccag accauggugc uggccagugg aggacaagau ggggccaucu 3840

gccuguggga uguacugacu ggcagccggg ucagccaugu guuugcucac cguggggaug 3900

ucaccucccu uaccuguacc accuccugug ucaucagcag uggccuggau gaccucauca 3960

gcaucuggga ccgcagcaca ggcaucaagu ucuacuccau ucagcaggac cugggcugug 4020

gugcaagcuu gggugucauc ucagacaacc ugcuggugac uggcggccag ggcugugucu 4080

ccuuuuggga ccuaaacuac ggggaccugu uacagucuac cuggggaaga acagugaggc 4140

ccagccugcc cgccagaucc uggugcugga caacgcugcc auugucugca acuuuggcag 4200

ugagcucagc cugguguaug ugcccucugu gcuggagaag cuggacugag cgcagggccu 4260

ccuugcccag gcaggaggcu ggggugcugu gugggggcca augcacugaa ccuggacuug 4320

ggggaaagag ccgaguaucu uccagccgcu gccuccugac uguaauaaua uuaaacuuuu 4380

uuaaaaaacc taucaucauc ugucaggcac uuuggga 4417

<210> 5

<211> 4422

<212> DNA

<213> 智人(homo sapien)

<400> 5

acgctccgcc cggcccggcc cggcccggcc gtccatactt ccctccggtg tccaccagag 60

ggcgaacggg agacgcgaat gtggttcgac tacgcatgcg cacgccgctg ggcgcacgtg 120

cggagggcgg cggggcggga gggtaaaggt aggaggtgag aggtgaaggg gcgggcaccc 180

ggcggccagg agagagaggg agggcgccac gcaccggact gcgggccgag agcgcgcacg 240

ccgcgctccg cccctgctgc cgcccccgtc gccgccgccg ccgccgccgc agcttgggag 300

gtgctgccac cacaggtacc tgcacatgtt gttctttgtc agtgctgtca agtgtgtgcc 360

agggtgatcc atggtcactt tccgggatgg cagcaaggtg acttcggctg aggatgaccc 420

tgactgaaag gctgcgtgag aagatatctc gggccttcta caaccatggg ctcctctgtg 480

catcctatcc catccccatc atcctcttca cagggttctg catcttagcc tgctgctacc 540

cactgctgaa actccccttg ccaggaacag gacctgtgga attcaccacc cctgtgaagg 600

attactcgcc cccacctgtg gactctgacc gcaaacaagg agagcctact gagcagcctg 660

agtggtatgt gggtgccccg gtggcttatg tccagcagat atttgtgaag tcctcagtgt 720

ttccctggca caagaacctc ctggcagtag atgtatttcg ttcacctttg tcccgggcat 780

tccaactggt ggaggagatc cggaaccacg tgctgagaga cagctctggg atcaggagct 840

tggaggagtt gtgtctgcaa gtgaccgacc tgctgccagg ccttaggaag ctcaggaacc 900

tactccctga gcatggatgc ctgctgctgt cccctgggaa cttctggcag aatgactggg 960

aacgcttcca tgctgatcct gacatcattg ggaccatcca ccagcacgag cctaaaaccc 1020

tgcagacttc agccacactc aaagacttgt tatttggtgt tcctgggaag tacagcgggg 1080

tgagcctcta caccaggaag aggatggtct cctacaccat caccctggtc ttccagcact 1140

accatgccaa gttcctgggc agcctgcgtg cccgcctgat gcttctgcac cccagcccca 1200

actgcagcct tcgggcggag agcctggtcc acgtgcactt caaggaggag attggtgtcg 1260

ctgagctcat cccccttgtg accacctaca tcatcttgtt tgcctacatc tacttctcca 1320

cgcggaagat cgacatggtc aagtccaagt gggggctggc cctggctgcc gtggtcacag 1380

tgctcagctc gctgctcatg tctgtgggac tctgcacact cttcggcctg acgcccaccc 1440

tcaatggcgg cgagattttc ccctaccttg tggtggttat tgggttagag aatgtgttgg 1500

tgctcaccaa gtctgtggtc tcaaccccgg tagacctgga ggtgaagctg cggatcgccc 1560

aaggcctaag cagcgagagc tggtccatca tgaagaacat ggccacggag ctgggcatca 1620

tcctcatcgg ctacttcacc ctagtgcccg ccatccagga gttctgtctc tttgctgtcg 1680

tggggctggt gtctgacttc ttccttcaga tgctgttttt caccactgtc ctgtccattg 1740

acattcgccg gatggagcta gcagacctga acaagcgact gccccctgag gcctgcctgc 1800

cctcagccaa gccagtggga cagccaacgc gctacgagcg gcagctggct gtgaggccgt 1860

ccacacccca caccatcacg ttgcagccgt cttccttccg aaacctgcgg ctccccaaga 1920

ggctgcgtgt tgtctacttc ctggcccgca cccgcctggc acagcgcctc atcatggctg 1980

gcaccgttgt ctggattggc atcctggtat acacagaccc agcagggctg cgcaactacc 2040

tcgctgccca ggtgacggaa cagagcccat tgggtgaggg agccctggct cccatgcccg 2100

tgcctagtgg catgctgccc cccagccacc cggaccctgc cttctccatc ttcccacctg 2160

atgcccctaa gctacctgag aaccagacgt cgccaggcga gtcacctgag cgtggaggtc 2220

cagcagaggt tgtccatgac agcccagtcc cagaggtaac ctgggggcct gaggatgagg 2280

aactttggag gaaattgtcc ttccgccact ggccgacgct cttcagctat tacaacatca 2340

cactggccaa gaggtacatc agcctgctgc ccgtcatccc agtcacgctc cgcctgaacc 2400

cgagggaggc tctggagggc cggcaccctc aggacggccg cagtgcctgg cccccaccgg 2460

ggcccatacc tgctgggcac tgggaagcag gacccaaggg cccaggtggg gtgcaggccc 2520

atggagacgt cacgctgtac aaggtggcgg cgctgggcct ggccaccggc atcgtcttgg 2580

tgctgctgct gctctgcctc taccgcgtgc tatgcccgcg caactacggg cagctgggtg 2640

gtgggcccgg gcggcggagg cgcggggagc tgccctgcga cgactacggc tatgcgccac 2700

ccgagacgga gatcgtgccg cttgtgctgc gcggccacct catggacatc gagtgcctgg 2760

ccagcgacgg catgctgctg gtgagctgct gcctggcagg ccacgtctgc gtgtgggacg 2820

cgcagaccgg ggattgccta acgcgcattc cgcgcccagg caggcagcgc cgggacagtg 2880

gcgtgggcag cgggcttgag gctcaggaga gctgggaacg actttcagat ggtgggaagg 2940

ctggtccaga ggagcctggg gacagccctc ccctgagaca ccgcccccgg ggccctccgc 3000

cgccttccct cttcggggac cagcctgacc tcacctgctt aattgacacc aacttttcag 3060

cgcagcctcg gtcctcacag cccactcagc ccgagccccg gcaccgggcg gtctgtggcc 3120

gctctcggga ctccccaggc tatgacttca gctgcctggt gcagcgggtg taccaggagg 3180

aggggctggc ggccgtctgc acaccagccc tgcgcccacc ctcgcctggg ccggtgctgt 3240

cccaggcccc tgaggacgag ggtggctccc ccgagaaagg ctccccttcc ctcgcctggg 3300

cccccagtgc cgagggttcc atctggagct tggagctgca gggcaacctc atcgtggtgg 3360

ggcggagcag cggccggctg gaggtgtggg acgccattga aggggtgctg tgctgcagca 3420

gcgaggaggt ctcctcaggc attaccgctc tggtgttctt ggacaaaagg attgtggctg 3480

cacggctcaa cggttccctt gatttcttct ccttggagac ccacactgcc ctcagccccc 3540

tgcagtttag agggacccca gggcggggca gttcccctgc ctctccagtg tacagcagca 3600

gcgacacagt ggcctgtcac ctgacccaca cagtgccctg tgcacaccaa aaacccatca 3660

cagccctgaa agccgctgct gggcgcttgg tgactgggag ccaagaccac acactgagag 3720

tgttccgtct ggaggactcg tgctgcctct tcacccttca gggccactca ggggccatca 3780

cgaccgtgta cattgaccag accatggtgc tggccagtgg aggacaagat ggggccatct 3840

gcctgtggga tgtactgact ggcagccggg tcagccatgt gtttgctcac cgtggggatg 3900

tcacctccct tacctgtacc acctcctgtg tcatcagcag tggcctggat gacctcatca 3960

gcatctggga ccgcagcaca ggcatcaagt tctactccat tcagcaggac ctgggctgtg 4020

gtgcaagctt gggtgtcatc tcagacaacc tgctggtgac tggcggccag ggctgtgtct 4080

ccttttggga cctaaactac ggggacctgt tacagacagt ctacctgggg aagaacagtg 4140

aggcccagcc tgcccgccag atcctggtgc tggacaacgc tgccattgtc tgcaactttg 4200

gcagtgagct cagcctggtg tatgtgccct ctgtgctgga gaagctggac tgagcgcagg 4260

gcctccttgc ccaggcagga ggctggggtg ctgtgtgggg gccaatgcac tgaacctgga 4320

cttgggggaa agagccgagt atcttccagc cgctgcctcc tgactgtaat aatattaaac 4380

ttttttaaaa aaccatatca tcatctgtca ggcactttgg ga 4422

<210> 6

<211> 4418

<212> DNA

<213> 智人(homo sapien)

<400> 6

acgctccgcc cggcccggcc cggcccggcc gtccatactt ccctccggtg tccaccagag 60

ggcgaacggg agacgcgaat gtggttcgac tacgcatgcg cacgccgctg ggcgcacgtg 120

cggagggcgg cggggcggga gggtaaaggt aggaggtgag aggtgaaggg gcgggcaccc 180

ggcggccagg agagagaggg agggcgccac gcaccggact gcgggccgag agcgcgcacg 240

ccgcgctccg cccctgctgc cgcccccgtc gccgccgccg ccgccgccgc agcttgggag 300

gtgctgccac cacaggtacc tgcacatgtt gttctttgtc agtgctgtca agtgtgtgcc 360

agggtgatcc atggtcactt tccgggatgg cagcaaggtg acttcggctg aggatgaccc 420

tgactgaaag gctgcgtgag aagatatctc gggccttcta caaccatggg ctcctctgtg 480

catcctatcc catccccatc atcctcttca cagggttctg catcttagcc tgctgctacc 540

cactgctgaa actccccttg ccaggaacag gacctgtgga attcaccacc cctgtgaagg 600

attactcgcc cccacctgtg gactctgacc gcaaacaagg agagcctact gagcagcctg 660

agtggtatgt gggtgccccg gtggcttatg tccagcagat atttgtgaag tcctcagtgt 720

ttccctggca caagaacctc ctggcagtag atgtatttcg ttcacctttg tcccgggcat 780

tccaactggt ggaggagatc cggaaccacg tgctgagaga cagctctggg atcaggagct 840

tggaggagtt gtgtctgcaa gtgaccgacc tgctgccagg ccttaggaag ctcaggaacc 900

tactccctga gcatggatgc ctgctgctgt cccctgggaa cttctggcag aatgactggg 960

aacgcttcca tgctgatcct gacatcattg ggaccatcca ccagcacgag cctaaaaccc 1020

tgcagacttc agccacactc aaagacttgt tatttggtgt tcctgggaag tacagcgggg 1080

tgagcctcta caccaggaag aggatggtct cctacaccat caccctggtc ttccagcact 1140

accatgccaa gttcctgggc agcctgcgtg cccgcctgat gcttctgcac cccagcccca 1200

actgcagcct tcgggcggag agcctggtcc acgtgcactt caaggaggag attggtgtcg 1260

ctgagctcat cccccttgtg accacctaca tcatcttgtt tgcctacatc tacttctcca 1320

cgcggaagat cgacatggtc aagtccaagt gggggctggc cctggctgcc gtggtcacag 1380

tgctcagctc gctgctcatg tctgtgggac tctgcacact cttcggcctg acgcccaccc 1440

tcaatggcgg cgagattttc ccctaccttg tggtggttat tgggttagag aatgtgttgg 1500

tgctcaccaa gtctgtggtc tcaaccccgg tagacctgga ggtgaagctg cggatcgccc 1560

aaggcctaag cagcgagagc tggtccatca tgaagaacat ggccacggag ctgggcatca 1620

tcctcatcgg ctacttcacc ctagtgcccg ccatccagga gttctgtctc tttgctgtcg 1680

tggggctggt gtctgacttc ttccttcaga tgctgttttt caccactgtc ctgtccattg 1740

acattcgccg gatggagcta gcagacctga acaagcgact gccccctgag gcctgcctgc 1800

cctcagccaa gccagtggga cagccaacgc gctacgagcg gcagctggct gtgaggccgt 1860

ccacacccca caccatcacg ttgcagccgt cttccttccg aaacctgcgg ctccccaaga 1920

ggctgcgtgt tgtctacttc ctggcccgca cccgcctggc acagcgcctc atcatggctg 1980

gcaccgttgt ctggattggc atcctggtat acacagaccc agcagggctg cgcaactacc 2040

tcgctgccca ggtgacggaa cagagcccat tgggtgaggg agccctggct cccatgcccg 2100

tgcctagtgg catgctgccc cccagccacc cggaccctgc cttctccatc ttcccacctg 2160

atgcccctaa gctacctgag aaccagacgt cgccaggcga gtcacctgag cgtggaggtc 2220

cagcagaggt tgtccatgac agcccagtcc cagaggtaac ctgggggcct gaggatgagg 2280

aactttggag gaaattgtcc ttccgccact ggccgacgct cttcagctat tacaacatca 2340

cactggccaa gaggtacatc agcctgctgc ccgtcatccc agtcacgctc cgcctgaacc 2400

cgagggaggc tctggagggc cggcaccctc aggacggccg cagtgcctgg cccccaccgg 2460

ggcccatacc tgctgggcac tgggaagcag gacccaaggg cccaggtggg gtgcaggccc 2520

atggagacgt cacgctgtac aaggtggcgg cgctgggcct ggccaccggc atcgtcttgg 2580

tgctgctgct gctctgcctc taccgcgtgc tatgcccgcg caactacggg cagctgggtg 2640

gtgggcccgg gcggcggagg cgcggggagc tgccctgcga cgactacggc tatgcgccac 2700

ccgagacgga gatcgtgccg cttgtgctgc gcggccacct catggacatc gagtgcctgg 2760

ccagcgacgg catgctgctg gtgagctgct gcctggcagg ccacgtctgc gtgtgggacg 2820

cgcagaccgg ggattgccta acgcgcattc cgcgcccagg caggcagcgc cgggacagtg 2880

gcgtgggcag cgggcttgag gctcaggaga gctgggaacg actttcagat ggtgggaagg 2940

ctggtccaga ggagcctggg gacagccctc ccctgagaca ccgcccccgg ggccctccgc 3000

cgccttccct cttcggggac cagcctgacc tcacctgctt aattgacacc aacttttcag 3060

cgcagcctcg gtcctcacag cccactcagc ccgagccccg gcaccgggcg gtctgtggcc 3120

gctctcggga ctccccaggc tatgacttca gctgcctggt gcagcgggtg taccaggagg 3180

aggggctggc ggccgtctgc acaccagccc tgcgcccacc ctcgcctggg ccggtgctgt 3240

cccaggcccc tgaggacgag ggtggctccc ccgagaaagg ctccccttcc ctcgcctggg 3300

cccccagtgc cgagggttcc atctggagct tggagctgca gggcaacctc atcgtggtgg 3360

ggcggagcag cggccggctg gaggtgtggg acgccattga aggggtgctg tgctgcagca 3420

gcgaggaggt ctcctcaggc attaccgctc tggtgttctt ggacaaaagg attgtggctg 3480

cacggctcaa cggttccctt gatttcttct ccttggagac ccacactgcc ctcagccccc 3540

tgcagtttag agggacccca gggcggggca gttcccctgc ctctccagtg tacagcagca 3600

gcgacacagt ggcctgtcac ctgacccaca cagtgccctg tgcacaccaa aaacccatca 3660

cagccctgaa agccgctgct gggcgcttgg tgactgggag ccaagaccac acactgagag 3720

tgttccgtct ggaggactcg tgctgcctct tcacccttca gggccactca ggggccatca 3780

cgaccgtgta cattgaccag accatggtgc tggccagtgg aggacaagat ggggccatct 3840

gcctgtggga tgtactgact ggcagccggg tcagccatgt gtttgctcac cgtggggatg 3900

tcacctccct tacctgtacc acctcctgtg tcatcagcag tggcctggat gacctcatca 3960

gcatctggga ccgcagcaca ggcatcaagt tctactccat tcagcaggac ctgggctgtg 4020

gtgcaagctt gggtgtcatc tcagacaacc tgctggtgac tggcggccag ggctgtgtct 4080

ccttttggga cctaaactac ggggacctgt tacagtctac ctggggaaga acagtgaggc 4140

ccagcctgcc cgccagatcc tggtgctgga caacgctgcc attgtctgca actttggcag 4200

tgagctcagc ctggtgtatg tgccctctgt gctggagaag ctggactgag cgcagggcct 4260

ccttgcccag gcaggaggct ggggtgctgt gtgggggcca atgcactgaa cctggacttg 4320

ggggaaagag ccgagtatct tccagccgct gcctcctgac tgtaataata ttaaactttt 4380

ttaaaaaacc atatcatcat ctgtcaggca ctttggga 4418

<210> 7

<211> 1279

<212> PRT

<213> 智人(homo sapien)

<400> 7

Met Thr Leu Thr Glu Arg Leu Arg Glu Lys Ile Ser Arg Ala Phe Tyr

1 5 10 15

Asn His Gly Leu Leu Cys Ala Ser Tyr Pro Ile Pro Ile Ile Leu Phe

20 25 30

Thr Gly Phe Cys Ile Leu Ala Cys Cys Tyr Pro Leu Leu Lys Leu Pro

35 40 45

Leu Pro Gly Thr Gly Pro Val Glu Phe Thr Thr Pro Val Lys Asp Tyr

50 55 60

Ser Pro Pro Pro Val Asp Ser Asp Arg Lys Gln Gly Glu Pro Thr Glu

65 70 75 80

Gln Pro Glu Trp Tyr Val Gly Ala Pro Val Ala Tyr Val Gln Gln Ile

85 90 95

Phe Val Lys Ser Ser Val Phe Pro Trp His Lys Asn Leu Leu Ala Val

100 105 110

Asp Val Phe Arg Ser Pro Leu Ser Arg Ala Phe Gln Leu Val Glu Glu

115 120 125

Ile Arg Asn His Val Leu Arg Asp Ser Ser Gly Ile Arg Ser Leu Glu

130 135 140

Glu Leu Cys Leu Gln Val Thr Asp Leu Leu Pro Gly Leu Arg Lys Leu

145 150 155 160

Arg Asn Leu Leu Pro Glu His Gly Cys Leu Leu Leu Ser Pro Gly Asn

165 170 175

Phe Trp Gln Asn Asp Trp Glu Arg Phe His Ala Asp Pro Asp Ile Ile

180 185 190

Gly Thr Ile His Gln His Glu Pro Lys Thr Leu Gln Thr Ser Ala Thr

195 200 205

Leu Lys Asp Leu Leu Phe Gly Val Pro Gly Lys Tyr Ser Gly Val Ser

210 215 220

Leu Tyr Thr Arg Lys Arg Met Val Ser Tyr Thr Ile Thr Leu Val Phe

225 230 235 240

Gln His Tyr His Ala Lys Phe Leu Gly Ser Leu Arg Ala Arg Leu Met

245 250 255

Leu Leu His Pro Ser Pro Asn Cys Ser Leu Arg Ala Glu Ser Leu Val

260 265 270

His Val His Phe Lys Glu Glu Ile Gly Val Ala Glu Leu Ile Pro Leu

275 280 285

Val Thr Thr Tyr Ile Ile Leu Phe Ala Tyr Ile Tyr Phe Ser Thr Arg

290 295 300

Lys Ile Asp Met Val Lys Ser Lys Trp Gly Leu Ala Leu Ala Ala Val

305 310 315 320

Val Thr Val Leu Ser Ser Leu Leu Met Ser Val Gly Leu Cys Thr Leu

325 330 335

Phe Gly Leu Thr Pro Thr Leu Asn Gly Gly Glu Ile Phe Pro Tyr Leu

340 345 350

Val Val Val Ile Gly Leu Glu Asn Val Leu Val Leu Thr Lys Ser Val

355 360 365

Val Ser Thr Pro Val Asp Leu Glu Val Lys Leu Arg Ile Ala Gln Gly

370 375 380

Leu Ser Ser Glu Ser Trp Ser Ile Met Lys Asn Met Ala Thr Glu Leu

385 390 395 400

Gly Ile Ile Leu Ile Gly Tyr Phe Thr Leu Val Pro Ala Ile Gln Glu

405 410 415

Phe Cys Leu Phe Ala Val Val Gly Leu Val Ser Asp Phe Phe Leu Gln

420 425 430

Met Leu Phe Phe Thr Thr Val Leu Ser Ile Asp Ile Arg Arg Met Glu

435 440 445

Leu Ala Asp Leu Asn Lys Arg Leu Pro Pro Glu Ala Cys Leu Pro Ser

450 455 460

Ala Lys Pro Val Gly Gln Pro Thr Arg Tyr Glu Arg Gln Leu Ala Val

465 470 475 480

Arg Pro Ser Thr Pro His Thr Ile Thr Leu Gln Pro Ser Ser Phe Arg

485 490 495

Asn Leu Arg Leu Pro Lys Arg Leu Arg Val Val Tyr Phe Leu Ala Arg

500 505 510

Thr Arg Leu Ala Gln Arg Leu Ile Met Ala Gly Thr Val Val Trp Ile

515 520 525

Gly Ile Leu Val Tyr Thr Asp Pro Ala Gly Leu Arg Asn Tyr Leu Ala

530 535 540

Ala Gln Val Thr Glu Gln Ser Pro Leu Gly Glu Gly Ala Leu Ala Pro

545 550 555 560

Met Pro Val Pro Ser Gly Met Leu Pro Pro Ser His Pro Asp Pro Ala

565 570 575

Phe Ser Ile Phe Pro Pro Asp Ala Pro Lys Leu Pro Glu Asn Gln Thr

580 585 590

Ser Pro Gly Glu Ser Pro Glu Arg Gly Gly Pro Ala Glu Val Val His

595 600 605

Asp Ser Pro Val Pro Glu Val Thr Trp Gly Pro Glu Asp Glu Glu Leu

610 615 620

Trp Arg Lys Leu Ser Phe Arg His Trp Pro Thr Leu Phe Ser Tyr Tyr

625 630 635 640

Asn Ile Thr Leu Ala Lys Arg Tyr Ile Ser Leu Leu Pro Val Ile Pro

645 650 655

Val Thr Leu Arg Leu Asn Pro Arg Glu Ala Leu Glu Gly Arg His Pro

660 665 670

Gln Asp Gly Arg Ser Ala Trp Pro Pro Pro Gly Pro Ile Pro Ala Gly

675 680 685

His Trp Glu Ala Gly Pro Lys Gly Pro Gly Gly Val Gln Ala His Gly

690 695 700

Asp Val Thr Leu Tyr Lys Val Ala Ala Leu Gly Leu Ala Thr Gly Ile

705 710 715 720

Val Leu Val Leu Leu Leu Leu Cys Leu Tyr Arg Val Leu Cys Pro Arg

725 730 735

Asn Tyr Gly Gln Leu Gly Gly Gly Pro Gly Arg Arg Arg Arg Gly Glu

740 745 750

Leu Pro Cys Asp Asp Tyr Gly Tyr Ala Pro Pro Glu Thr Glu Ile Val

755 760 765

Pro Leu Val Leu Arg Gly His Leu Met Asp Ile Glu Cys Leu Ala Ser

770 775 780

Asp Gly Met Leu Leu Val Ser Cys Cys Leu Ala Gly His Val Cys Val

785 790 795 800

Trp Asp Ala Gln Thr Gly Asp Cys Leu Thr Arg Ile Pro Arg Pro Gly

805 810 815

Arg Gln Arg Arg Asp Ser Gly Val Gly Ser Gly Leu Glu Ala Gln Glu

820 825 830

Ser Trp Glu Arg Leu Ser Asp Gly Gly Lys Ala Gly Pro Glu Glu Pro

835 840 845

Gly Asp Ser Pro Pro Leu Arg His Arg Pro Arg Gly Pro Pro Pro Pro

850 855 860

Ser Leu Phe Gly Asp Gln Pro Asp Leu Thr Cys Leu Ile Asp Thr Asn

865 870 875 880

Phe Ser Ala Gln Pro Arg Ser Ser Gln Pro Thr Gln Pro Glu Pro Arg

885 890 895

His Arg Ala Val Cys Gly Arg Ser Arg Asp Ser Pro Gly Tyr Asp Phe

900 905 910

Ser Cys Leu Val Gln Arg Val Tyr Gln Glu Glu Gly Leu Ala Ala Val

915 920 925

Cys Thr Pro Ala Leu Arg Pro Pro Ser Pro Gly Pro Val Leu Ser Gln

930 935 940

Ala Pro Glu Asp Glu Gly Gly Ser Pro Glu Lys Gly Ser Pro Ser Leu

945 950 955 960

Ala Trp Ala Pro Ser Ala Glu Gly Ser Ile Trp Ser Leu Glu Leu Gln

965 970 975

Gly Asn Leu Ile Val Val Gly Arg Ser Ser Gly Arg Leu Glu Val Trp

980 985 990

Asp Ala Ile Glu Gly Val Leu Cys Cys Ser Ser Glu Glu Val Ser Ser

995 1000 1005

Gly Ile Thr Ala Leu Val Phe Leu Asp Lys Arg Ile Val Ala Ala

1010 1015 1020

Arg Leu Asn Gly Ser Leu Asp Phe Phe Ser Leu Glu Thr His Thr

1025 1030 1035

Ala Leu Ser Pro Leu Gln Phe Arg Gly Thr Pro Gly Arg Gly Ser

1040 1045 1050

Ser Pro Ala Ser Pro Val Tyr Ser Ser Ser Asp Thr Val Ala Cys

1055 1060 1065

His Leu Thr His Thr Val Pro Cys Ala His Gln Lys Pro Ile Thr

1070 1075 1080

Ala Leu Lys Ala Ala Ala Gly Arg Leu Val Thr Gly Ser Gln Asp

1085 1090 1095

His Thr Leu Arg Val Phe Arg Leu Glu Asp Ser Cys Cys Leu Phe

1100 1105 1110

Thr Leu Gln Gly His Ser Gly Ala Ile Thr Thr Val Tyr Ile Asp

1115 1120 1125

Gln Thr Met Val Leu Ala Ser Gly Gly Gln Asp Gly Ala Ile Cys

1130 1135 1140

Leu Trp Asp Val Leu Thr Gly Ser Arg Val Ser His Val Phe Ala

1145 1150 1155

His Arg Gly Asp Val Thr Ser Leu Thr Cys Thr Thr Ser Cys Val

1160 1165 1170

Ile Ser Ser Gly Leu Asp Asp Leu Ile Ser Ile Trp Asp Arg Ser

1175 1180 1185

Thr Gly Ile Lys Phe Tyr Ser Ile Gln Gln Asp Leu Gly Cys Gly

1190 1195 1200

Ala Ser Leu Gly Val Ile Ser Asp Asn Leu Leu Val Thr Gly Gly

1205 1210 1215

Gln Gly Cys Val Ser Phe Trp Asp Leu Asn Tyr Gly Asp Leu Leu

1220 1225 1230

Gln Thr Val Tyr Leu Gly Lys Asn Ser Glu Ala Gln Pro Ala Arg

1235 1240 1245

Gln Ile Leu Val Leu Asp Asn Ala Ala Ile Val Cys Asn Phe Gly

1250 1255 1260

Ser Glu Leu Ser Leu Val Tyr Val Pro Ser Val Leu Glu Lys Leu

1265 1270 1275

Asp

<210> 8

<211> 1335

<212> PRT

<213> 智人(homo sapien)

<400> 8

Met Thr Leu Thr Glu Arg Leu Arg Glu Lys Ile Ser Arg Ala Phe Tyr

1 5 10 15

Asn His Gly Leu Leu Cys Ala Ser Tyr Pro Ile Pro Ile Ile Leu Phe

20 25 30

Thr Gly Phe Cys Ile Leu Ala Cys Cys Tyr Pro Leu Leu Lys Leu Pro

35 40 45

Leu Pro Gly Thr Gly Pro Val Glu Phe Thr Thr Pro Val Lys Asp Tyr

50 55 60

Ser Pro Pro Pro Val Asp Ser Asp Arg Lys Gln Gly Glu Pro Thr Glu

65 70 75 80

Gln Pro Glu Trp Tyr Val Gly Ala Pro Val Ala Tyr Val Gln Gln Ile

85 90 95

Phe Val Lys Ser Ser Val Phe Pro Trp His Lys Asn Leu Leu Ala Val

100 105 110

Asp Val Phe Arg Ser Pro Leu Ser Arg Ala Phe Gln Leu Val Glu Glu

115 120 125

Ile Arg Asn His Val Leu Arg Asp Ser Ser Gly Ile Arg Ser Leu Glu

130 135 140

Glu Leu Cys Leu Gln Val Thr Asp Leu Leu Pro Gly Leu Arg Lys Leu

145 150 155 160

Arg Asn Leu Leu Pro Glu His Gly Cys Leu Leu Leu Ser Pro Gly Asn

165 170 175

Phe Trp Gln Asn Asp Trp Glu Arg Phe His Ala Asp Pro Asp Ile Ile

180 185 190

Gly Thr Ile His Gln His Glu Pro Lys Thr Leu Gln Thr Ser Ala Thr

195 200 205

Leu Lys Asp Leu Leu Phe Gly Val Pro Gly Lys Tyr Ser Gly Val Ser

210 215 220

Leu Tyr Thr Arg Lys Arg Met Val Ser Tyr Thr Ile Thr Leu Val Phe

225 230 235 240

Gln His Tyr His Ala Lys Phe Leu Gly Ser Leu Arg Ala Arg Leu Met

245 250 255

Leu Leu His Pro Ser Pro Asn Cys Ser Leu Arg Ala Glu Ser Leu Val

260 265 270

His Val His Phe Lys Glu Glu Ile Gly Val Ala Glu Leu Ile Pro Leu

275 280 285

Val Thr Thr Tyr Ile Ile Leu Phe Ala Tyr Ile Tyr Phe Ser Thr Arg

290 295 300

Lys Ile Asp Met Val Lys Ser Lys Trp Gly Leu Ala Leu Ala Ala Val

305 310 315 320

Val Thr Val Leu Ser Ser Leu Leu Met Ser Val Gly Leu Cys Thr Leu

325 330 335

Phe Gly Leu Thr Pro Thr Leu Asn Gly Gly Glu Ile Phe Pro Tyr Leu

340 345 350

Val Val Val Ile Gly Leu Glu Asn Val Leu Val Leu Thr Lys Ser Val

355 360 365

Val Ser Thr Pro Val Asp Leu Glu Val Lys Leu Arg Ile Ala Gln Gly

370 375 380

Leu Ser Ser Glu Ser Trp Ser Ile Met Lys Asn Met Ala Thr Glu Leu

385 390 395 400

Gly Ile Ile Leu Ile Gly Tyr Phe Thr Leu Val Pro Ala Ile Gln Glu

405 410 415

Phe Cys Leu Phe Ala Val Val Gly Leu Val Ser Asp Phe Phe Leu Gln

420 425 430

Met Leu Phe Phe Thr Thr Val Leu Ser Ile Asp Ile Arg Arg Met Glu

435 440 445

Leu Ala Asp Leu Asn Lys Arg Leu Pro Pro Glu Ala Cys Leu Pro Ser

450 455 460

Ala Lys Pro Val Gly Gln Pro Thr Arg Tyr Glu Arg Gln Leu Ala Val

465 470 475 480

Arg Pro Ser Thr Pro His Thr Ile Thr Leu Gln Pro Ser Ser Phe Arg

485 490 495

Asn Leu Arg Leu Pro Lys Arg Leu Arg Val Val Tyr Phe Leu Ala Arg

500 505 510

Thr Arg Leu Ala Gln Arg Leu Ile Met Ala Gly Thr Val Val Trp Ile

515 520 525

Gly Ile Leu Val Tyr Thr Asp Pro Ala Gly Leu Arg Asn Tyr Leu Ala

530 535 540

Ala Gln Val Thr Glu Gln Ser Pro Leu Gly Glu Gly Ala Leu Ala Pro

545 550 555 560

Met Pro Val Pro Ser Gly Met Leu Pro Pro Ser His Pro Asp Pro Ala

565 570 575

Phe Ser Ile Phe Pro Pro Asp Ala Pro Lys Leu Pro Glu Asn Gln Thr

580 585 590

Ser Pro Gly Glu Ser Pro Glu Arg Gly Gly Pro Ala Glu Val Val His

595 600 605

Asp Ser Pro Val Pro Glu Val Thr Trp Gly Pro Glu Asp Glu Glu Leu

610 615 620

Trp Arg Lys Leu Ser Phe Arg His Trp Pro Thr Leu Phe Ser Tyr Tyr

625 630 635 640

Asn Ile Thr Leu Ala Lys Arg Tyr Ile Ser Leu Leu Pro Val Ile Pro

645 650 655

Val Thr Leu Arg Leu Asn Pro Arg Glu Ala Leu Glu Gly Arg His Pro

660 665 670

Gln Asp Gly Arg Ser Ala Trp Pro Pro Pro Gly Pro Ile Pro Ala Gly

675 680 685

His Trp Glu Ala Gly Pro Lys Gly Pro Gly Gly Val Gln Ala His Gly

690 695 700

Asp Val Thr Leu Tyr Lys Val Ala Ala Leu Gly Leu Ala Thr Gly Ile

705 710 715 720

Val Leu Val Leu Leu Leu Leu Cys Leu Tyr Arg Val Leu Cys Pro Arg

725 730 735

Asn Tyr Gly Gln Leu Gly Gly Gly Pro Gly Arg Arg Arg Arg Gly Glu

740 745 750

Leu Pro Cys Asp Asp Tyr Gly Tyr Ala Pro Pro Glu Thr Glu Ile Val

755 760 765

Pro Leu Val Leu Arg Gly His Leu Met Asp Ile Glu Cys Leu Ala Ser

770 775 780

Asp Gly Met Leu Leu Val Ser Cys Cys Leu Ala Gly His Val Cys Val

785 790 795 800

Trp Asp Ala Gln Thr Gly Asp Cys Leu Thr Arg Ile Pro Arg Pro Gly

805 810 815

Arg Gln Arg Arg Asp Ser Gly Val Gly Ser Gly Leu Glu Ala Gln Glu

820 825 830

Ser Trp Glu Arg Leu Ser Asp Gly Gly Lys Ala Gly Pro Glu Glu Pro

835 840 845

Gly Asp Ser Pro Pro Leu Arg His Arg Pro Arg Gly Pro Pro Pro Pro

850 855 860

Ser Leu Phe Gly Asp Gln Pro Asp Leu Thr Cys Leu Ile Asp Thr Asn

865 870 875 880

Phe Ser Ala Gln Pro Arg Ser Ser Gln Pro Thr Gln Pro Glu Pro Arg

885 890 895

His Arg Ala Val Cys Gly Arg Ser Arg Asp Ser Pro Gly Tyr Asp Phe

900 905 910

Ser Cys Leu Val Gln Arg Val Tyr Gln Glu Glu Gly Leu Ala Ala Val

915 920 925

Cys Thr Pro Ala Leu Arg Pro Pro Ser Pro Gly Pro Val Leu Ser Gln

930 935 940

Ala Pro Glu Asp Glu Gly Gly Ser Pro Glu Lys Gly Ser Pro Ser Leu

945 950 955 960

Ala Trp Ala Pro Ser Ala Glu Gly Ser Ile Trp Ser Leu Glu Leu Gln

965 970 975

Gly Asn Leu Ile Val Val Gly Arg Ser Ser Gly Arg Leu Glu Val Trp

980 985 990

Asp Ala Ile Glu Gly Val Leu Cys Cys Ser Ser Glu Glu Val Ser Ser

995 1000 1005

Gly Ile Thr Ala Leu Val Phe Leu Asp Lys Arg Ile Val Ala Ala

1010 1015 1020

Arg Leu Asn Gly Ser Leu Asp Phe Phe Ser Leu Glu Thr His Thr

1025 1030 1035

Ala Leu Ser Pro Leu Gln Phe Arg Gly Thr Pro Gly Arg Gly Ser

1040 1045 1050

Ser Pro Ala Ser Pro Val Tyr Ser Ser Ser Asp Thr Val Ala Cys

1055 1060 1065

His Leu Thr His Thr Val Pro Cys Ala His Gln Lys Pro Ile Thr

1070 1075 1080

Ala Leu Lys Ala Ala Ala Gly Arg Leu Val Thr Gly Ser Gln Asp

1085 1090 1095

His Thr Leu Arg Val Phe Arg Leu Glu Asp Ser Cys Cys Leu Phe

1100 1105 1110

Thr Leu Gln Gly His Ser Gly Ala Ile Thr Thr Val Tyr Ile Asp

1115 1120 1125

Gln Thr Met Val Leu Ala Ser Gly Gly Gln Asp Gly Ala Ile Cys

1130 1135 1140

Leu Trp Asp Val Leu Thr Gly Ser Arg Val Ser His Val Phe Ala

1145 1150 1155

His Arg Gly Asp Val Thr Ser Leu Thr Cys Thr Thr Ser Cys Val

1160 1165 1170

Ile Ser Ser Gly Leu Asp Asp Leu Ile Ser Ile Trp Asp Arg Ser

1175 1180 1185

Thr Gly Ile Lys Phe Tyr Ser Ile Gln Gln Asp Leu Gly Cys Gly

1190 1195 1200

Ala Ser Leu Gly Val Ile Ser Asp Asn Leu Leu Val Thr Gly Gly

1205 1210 1215

Gln Gly Cys Val Ser Phe Trp Asp Leu Asn Tyr Gly Asp Leu Leu

1220 1225 1230

Gln Ser Thr Trp Gly Arg Thr Val Arg Pro Ser Leu Pro Ala Arg

1235 1240 1245

Ser Trp Cys Trp Thr Thr Leu Pro Leu Ser Ala Thr Leu Ala Val

1250 1255 1260

Ser Ser Ala Trp Cys Met Cys Pro Leu Cys Trp Arg Ser Trp Thr

1265 1270 1275

Glu Arg Arg Ala Ser Leu Pro Arg Gln Glu Ala Gly Val Leu Cys

1280 1285 1290

Gly Gly Gln Cys Thr Glu Pro Gly Leu Gly Gly Lys Ser Arg Val

1295 1300 1305

Ser Ser Ser Arg Cys Leu Leu Thr Val Ile Ile Leu Asn Phe Phe

1310 1315 1320

Lys Lys Pro Tyr His His Leu Ser Gly Thr Leu Gly

1325 1330 1335

<210> 9

<211> 45

<212> PRT

<213> 智人(homo sapien)

<400> 9

Thr Val Tyr Leu Gly Lys Asn Ser Glu Ala Gln Pro Ala Arg Gln Ile

1 5 10 15

Leu Val Leu Asp Asn Ala Ala Ile Val Cys Asn Phe Gly Ser Glu Leu

20 25 30

Ser Leu Val Tyr Val Pro Ser Val Leu Glu Lys Leu Asp

35 40 45

<210> 10

<211> 101

<212> PRT

<213> 智人(homo sapien)

<400> 10

Ser Thr Trp Gly Arg Thr Val Arg Pro Ser Leu Pro Ala Arg Ser Trp

1 5 10 15

Cys Trp Thr Thr Leu Pro Leu Ser Ala Thr Leu Ala Val Ser Ser Ala

20 25 30

Trp Cys Met Cys Pro Leu Cys Trp Arg Ser Trp Thr Glu Arg Arg Ala

35 40 45

Ser Leu Pro Arg Gln Glu Ala Gly Val Leu Cys Gly Gly Gln Cys Thr

50 55 60

Glu Pro Gly Leu Gly Gly Lys Ser Arg Val Ser Ser Ser Arg Cys Leu

65 70 75 80

Leu Thr Val Ile Ile Leu Asn Phe Phe Lys Lys Pro Tyr His His Leu

85 90 95

Ser Gly Thr Leu Gly

100

<210> 11

<211> 307

<212> DNA

<213> 智人(homo sapien)

<400> 11

acagtctacc tggggaagaa cagtgaggcc cagcctgccc gccagatcct ggtgctggac 60

aacgctgcca ttgtctgcaa ctttggcagt gagctcagcc tggtgtatgt gccctctgtg 120

ctggagaagc tggactgagc gcagggcctc cttgcccagg caggaggctg gggtgctgtg 180

tgggggccaa tgcactgaac ctggacttgg gggaaagagc cgagtatctt ccagccgctg 240

cctcctgact gtaataatat taaacttttt taaaaaacca tatcatcatc tgtcaggcac 300

tttggga 307

<210> 12

<211> 303

<212> DNA

<213> 智人(homo sapien)

<400> 12

tctacctggg gaagaacagt gaggcccagc ctgcccgcca gatcctggtg ctggacaacg 60

ctgccattgt ctgcaacttt ggcagtgagc tcagcctggt gtatgtgccc tctgtgctgg 120

agaagctgga ctgagcgcag ggcctccttg cccaggcagg aggctggggt gctgtgtggg 180

ggccaatgca ctgaacctgg acttggggga aagagccgag tatcttccag ccgctgcctc 240

ctgactgtaa taatattaaa cttttttaaa aaaccatatc atcatctgtc aggcactttg 300

gga 303

<210> 13

<211> 306

<212> DNA

<213> 智人(homo sapien)

<400> 13

acagucuacc uggggaagaa cagugaggcc cagccugccc gccagauccu ggugcuggac 60

aacgcugcca uugucugcaa cuuuggcagu gagcucagcc ugguguaugu gcccucugug 120

cuggagaagc uggacugagc gcagggccuc cuugcccagg caggaggcug gggugcugug 180

ugggggccaa ugcacugaac cuggacuugg gggaaagagc cgaguaucuu ccagccgcug 240

ccuccugacu guaauaauau uaaacuuuuu uaaaaaacct aucaucaucu gucaggcacu 300

uuggga 306

<210> 14

<211> 302

<212> DNA

<213> 智人(homo sapien)

<400> 14

ucuaccuggg gaagaacagu gaggcccagc cugcccgcca gauccuggug cuggacaacg 60

cugccauugu cugcaacuuu ggcagugagc ucagccuggu guaugugccc ucugugcugg 120

agaagcugga cugagcgcag ggccuccuug cccaggcagg aggcuggggu gcuguguggg 180

ggccaaugca cugaaccugg acuuggggga aagagccgag uaucuuccag ccgcugccuc 240

cugacuguaa uaauauuaaa cuuuuuuaaa aaacctauca ucaucuguca ggcacuuugg 300

ga 302

<210> 15

<211> 307

<212> DNA

<213> 智人(homo sapien)

<400> 15

acagtctacc tggggaagaa cagtgaggcc cagcctgccc gccagatcct ggtgctggac 60

aacgctgcca ttgtctgcaa ctttggcagt gagctcagcc tggtgtatgt gccctctgtg 120

ctggagaagc tggactgagc gcagggcctc cttgcccagg caggaggctg gggtgctgtg 180

tgggggccaa tgcactgaac ctggacttgg gggaaagagc cgagtatctt ccagccgctg 240

cctcctgact gtaataatat taaacttttt taaaaaacca tatcatcatc tgtcaggcac 300

tttggga 307

<210> 16

<211> 303

<212> DNA

<213> 智人(homo sapien)

<400> 16

tctacctggg gaagaacagt gaggcccagc ctgcccgcca gatcctggtg ctggacaacg 60

ctgccattgt ctgcaacttt ggcagtgagc tcagcctggt gtatgtgccc tctgtgctgg 120

agaagctgga ctgagcgcag ggcctccttg cccaggcagg aggctggggt gctgtgtggg 180

ggccaatgca ctgaacctgg acttggggga aagagccgag tatcttccag ccgctgcctc 240

ctgactgtaa taatattaaa cttttttaaa aaaccatatc atcatctgtc aggcactttg 300

gga 303

<210> 17

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 17

gtaacaggtc cccgtagttt agg 23

<210> 18

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 18

cttttgggac ctaaactacg ggg 23

<210> 19

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 19

cccgtagttt aggtcccaaa agg 23

<210> 20

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 20

ccttttggga cctaaactac ggg 23

<210> 21

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 21

ccaggtagac tgtctgtaac agg 23

<210> 22

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 22

tggcagcgtt gtccagcacc agg 23

<210> 23

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 23

cgttgtccag caccaggatc tgg 23

<210> 24

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 24

tgttacagac agtctacctg ggg 23

<210> 25

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 25

cctgttacag acagtctacc tgg 23

<210> 26

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 26

tccttttggg acctaaacta cgg 23

<210> 27

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 27

ctgttacaga cagtctacct ggg 23

<210> 28

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 28

tgcccgccag atcctggtgc tgg 23

<210> 29

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 29

gcacagaggg cacatacacc agg 23

<210> 30

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 30

ctgggctgtg gtgcaagctt ggg 23

<210> 31

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 31

tgtcatctca gacaacctgc tgg 23

<210> 32

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 32

agcaccagga tctggcgggc agg 23

<210> 33

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 33

ggtgtatgtg ccctctgtgc tgg 23

<210> 34

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 34

tcagacaacc tgctggtgac tgg 23

<210> 35

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 35

gctgccattg tctgcaactt tgg 23

<210> 36

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 36

gtccagcacc aggatctggc ggg 23

<210> 37

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 37

cctgctggtg actggcggcc agg 23

<210> 38

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 38

gacaacctgc tggtgactgg cgg 23

<210> 39

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 39

ctgctggtga ctggcggcca ggg 23

<210> 40

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 40

actgccaaag ttgcagacaa tgg 23

<210> 41

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 41

cctgggctgt ggtgcaagct tgg 23

<210> 42

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 42

ctttggcagt gagctcagcc tgg 23

<210> 43

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 43

tgtccagcac caggatctgg cgg 23

<210> 44

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 44

ccaagcttgc accacagccc agg 23

<210> 45

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 45

cctggccgcc agtcaccagc agg 23

<210> 46

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 46

ccagcctgcc cgccagatcc tgg 23

<210> 47

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 47

atgtccttgc ctccaggacc tgg 23

<210> 48

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 48

ccagggctgt gtctcctttt ggg 23

<210> 49

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 49

caggatctgg cgggcaggct ggg 23

<210> 50

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 50

ctacctgggg aagaacagtg agg 23

<210> 51

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 51

gccagggctg tgtctccttt tgg 23

<210> 52

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 52

gccagggctg tgtctccttt tgg 23

<210> 53

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> SCAP变异附近的指导RNA识别序列

<400> 53

ttgcaccaca gcccaggtcc tgg 23

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号